飛凌課堂丨OK1046A-C內(nèi)存交互測試,小白也能看懂

原創(chuàng) 2020-03-04 16:34:00 LS1046A 內(nèi)存交互測試

筆者最近需要進行OK1046A-C內(nèi)存部分的測試,linux相關的資料和方法紛雜繁多,但如鼠飲河,自得其量,還是找了如下軟件進行測試,也分享給大家。

01、工具簡介

 Bandwitdh工具簡介  

Bandwidth是一款內(nèi)存帶寬基準測試程序,通過順序讀寫與隨機讀寫不同大小的數(shù)據(jù)塊,測試系統(tǒng)的內(nèi)存帶寬性能。

它提供了一套匯編語言實現(xiàn)的支持庫,用來完成體系結(jié)構相關的特定操作,可以測量每個內(nèi)存系統(tǒng)的最大內(nèi)存帶寬,包括主內(nèi)存,L1和L2緩存,framebuffer內(nèi)存和寄存器的快速,連續(xù)的內(nèi)存訪問。

Bandwidth也包括自動制圖的結(jié)果,存儲到一個BMP圖像文件。

 Mbw工具簡介  

Mbw是一個內(nèi)存帶寬測試工具可以測試在字節(jié)拷貝,塊拷貝,整體拷貝三種不同方式下的內(nèi)存拷貝速度,程序源碼比較簡單,便于理解。

? 獲取方式:git clone http://github.com/raas/mbw 

Memtester工具簡介  

Memtester是一款進行內(nèi)存壓力測試的工具,通過對兩塊內(nèi)存里的數(shù)據(jù)進行一系列的加減乘除亦或位與之類的算法后進行對比,用于檢查是否存在內(nèi)存移位之類的問題出現(xiàn)

? 獲取方式:wget 點此處獲取>>

memtester的使用很簡單./memtester <memory> [runs]其中<memory>:內(nèi)存大小,單位M,[runs]:運行次數(shù)。

02、編譯方法

 bandwidth來源   

? 下載并解壓bandwidth

源碼路徑:https://zsmith.co/archives/bandwidth-1.5.1.tar.gz

解壓并進入源碼目錄:

tar xvf bandwidth-1.5.1.tar.gz

cd bandwidth-1.5.1/

?  修改makefile文件并進行編譯

Vim Makefile

修改如下:

CC=arm-xxx-gcc -Wall

LD=arm-xxx-gcc

ARM_AS=arm-xxx-as

ARM_CC=arm-xxx-gcc

退出并make bandwidth-rpi32即可得到二進制程序(arm-xxx-gcc為交叉編譯工具)。

 Mbw   

? 下載并進入源碼目錄編譯

git clone 

https://github.com/raas/mbw.git

cd mbw

arm-xxx-gcc mbw.c –o mbw

? 在源碼目錄下得到mbw應用程序。

 Memteser   

? 下載并解壓源碼

wget 點此處獲取>>

tar xvf memtester-4.3.0.tar.gz

cd memtester-4.3.0/

? 修改配置文件:

分別把conf-ld和conf-cc文件中的"cc"(一般在文件首行)替換為“arm-xxx-gcc”

在conf-ld的第一行后面加上 -static

修改文件Makefile,更改 INSTALLPATH = `pwd`/INSTALL

執(zhí)行make即可編譯成功,在源碼目錄下得到應用程序。

03使用方法和示例

 bandwidth工具的使用   

我們將bandwidth移植到開發(fā)板上運行(因OK1046A-C gcc版本過高存在兼容性問題未能編譯成功,此處以其它板卡數(shù)據(jù)結(jié)果做工具介紹,數(shù)據(jù)不做 OK1046A-C 的參考)./bandwidth –fastest 得出如下圖表:


這部分圖表我們可以得到一些cpu與內(nèi)存之間互相訪問的數(shù)據(jù)傳輸和命令交互的性能,以及framebuffer的讀寫速度。

clip_image002.png

上表可見,內(nèi)存的讀寫速度和順序還是隨機還是有很大關系的,在寫數(shù)據(jù)時尤為明顯。

其次我們可以觀察到,寫的數(shù)據(jù)塊的大小會影響讀寫速度,在兩個關鍵點會產(chǎn)生突變(32kb/256kb),這是由于各級cache的不同,進行內(nèi)存讀寫時,較小的數(shù)據(jù)塊會存放在cache中,較大的數(shù)據(jù)塊則會經(jīng)過cache存放在主存中。

突變的原因就是達到了cache的上限,而轉(zhuǎn)向了下層存儲。

 mbw工具的使用   

將mbw工具移植到開發(fā)板上,并執(zhí)行./mbw -q -n 3 320

-q 隱藏日志,3 測試次數(shù),64 內(nèi)存大小(單位是M)結(jié)果如下:

我們只需要關注AVG平均值即可。

三種不同的測試方法分別對應的是memcpy(內(nèi)存拷貝),dump(字符串拷貝),mcblock(內(nèi)存塊拷貝)。

https://mmbiz.qpic.cn/mmbiz_png/6aVaON9Kibf6rNNoOpEpu2UHw2b0pqkRCGXtHycozFJMElusia6Giar9taX7nGbWwE4kEHM5wsfVKBibxm70xygicPw/640

我們可以看到,OK1046A-C的ddr4d的內(nèi)存的運行速度是非常快的,再內(nèi)存拷貝的速度達到了2GiB/s,甚至于接近我們的服務器的讀寫速度。

 memtester的使用   

? 先運行free –h 得出剩余內(nèi)存:

https://mmbiz.qpic.cn/mmbiz_png/US10Gcd0tQEwx2fRgwiaw8fia8icdOibMck2hCaiaCkNwGteFjxb2EHvewkgzfEAB9yz6vkbz2AwF6LxyZVdvLsounA/640

? 可以看到,該開發(fā)板剩余1.2G可用內(nèi)存,所以我使用1G內(nèi)存大小運行內(nèi)存檢錯程序memtester。

? ./me mtester 1G 3 截圖如下:

https://mmbiz.qpic.cn/mmbiz_png/TN05MmJLxMqhbWI0PTR7PVp5VGQZcyomQGqm9NOibAvmwWicWBCib5zPvibLjtoKNkxEkk7wcLmtG20phiaTvckRVBg/640

如此便是內(nèi)存運行正常,筆者重復了三天,利用腳本反復調(diào)用memtester程序,最終均未發(fā)現(xiàn)內(nèi)存報錯和移位的問題,可見內(nèi)存穩(wěn)定性基本達標。

 


 

結(jié)語

綜上我們可以看到,OK1046A-C板卡的ddr4內(nèi)存讀寫速度非常快,內(nèi)存使用也非常穩(wěn)定,可惜因為版本原因未能測得CPU內(nèi)存交互的實際速度以及CPU一級二級緩存的使用速度,在后期經(jīng)過修改后再進行追加。

下一期筆者將針對于OK1046A-C的萬兆網(wǎng)測試和網(wǎng)絡轉(zhuǎn)換方面,請各位保持關注。

 

相關產(chǎn)品 >

  • FET1046A-C核心板

    4核1.8GHz,原生8網(wǎng)口靈活擴展|LS1046A 系列ARM工控核心板基于 NXP公司的LS1046A高性能64位ARM四核處理器。LS1046A處理器將四個64位ARM Cortex-A72內(nèi)核與數(shù)據(jù)包處理加速和高速外設相集成,CoreMark跑分高達45000,LS1046A強大的網(wǎng)絡處理能力和豐富的高速接口,適用于工業(yè)路由、邊緣計算網(wǎng)關、IP-PBX等產(chǎn)品,以及邊緣計算、 能源物聯(lián)網(wǎng)、智慧城市、工業(yè)自動化、視頻監(jiān)控等應用領域。

    了解詳情
    FET1046A-C核心板
  • OK1046A-C2開發(fā)板

    4核1.8GHz,原生8網(wǎng)口,支持萬兆網(wǎng)絡|
    飛凌嵌入式LS1046a ARM工控主板系列LS1046開發(fā)板 基于 NXP LS1046A 四核Cortex A72 CPU,強大的萬兆網(wǎng)絡處理能力和豐富的高速接口,CoreMark跑分高達45000。飛凌不僅僅提供了LS1046A開發(fā)板套件,還提供了調(diào)試心得、LS1046A硬件數(shù)據(jù)手冊,并根據(jù)應用情況發(fā)布了 LS1046A 5G CPE 工業(yè)網(wǎng)關方案、邊緣計算網(wǎng)關方案,降低了客戶二次開發(fā)的難度。更多關于LS1046A的解決方案,產(chǎn)品詳情,您可以登入飛凌嵌入式官網(wǎng)了解。

    了解詳情
    OK1046A-C2開發(fā)板

推薦閱讀 換一批 換一批