新聞中心

EEPW首頁 > EDA/PCB > 設計應用 > 一種FPGA高速訪問USB設備的設計方案

一種FPGA高速訪問USB設備的設計方案

作者: 時間:2016-10-18 來源:網(wǎng)絡 收藏

摘要:針對訪問存在傳輸速率低、資源消耗大、開發(fā)復雜的缺點,提出了一種將ARM處理器與相結合實現(xiàn)高速訪問的方案。該方案利用ARM處理器的USB Host讀取數(shù)據(jù)井緩存于高速內存,采用乒乓機制通過SRAM接口將數(shù)據(jù)傳給。經(jīng)測試,數(shù)據(jù)傳輸速率可以達到48 Mbps。該方案具有開發(fā)難度小,資源占用率低和傳輸速率高的特點,適合于FPGA高速讀取大量外部數(shù)據(jù)。

本文引用地址:http://2s4d.com/article/201610/308455.htm

引言

目前FPGA通過USB接口獲取USB設備中數(shù)據(jù)的方案大致分為兩大類,一類為在FPGA內部實現(xiàn)USB設備控制,另一類為在FPGA外部實現(xiàn)USB設備控制。在FPGA內部實現(xiàn)的方案需要在FPGA內部實現(xiàn)USB控制器,在內部實現(xiàn)或者外接USB收發(fā)器。該方案的實現(xiàn)具有較大難度,同時由于USB協(xié)議和文件系統(tǒng)都相當復雜,需要使用相當多的FPGA資源,因此完全不能滿足快速開發(fā)和低FPGA資源占用率的要求。在FPGA外部實現(xiàn)的方案通常使用單芯片的USB解決方案,典型的方案有兩種:一種是集成了USB控制器和USB收發(fā)器,但需自行實現(xiàn)文件系統(tǒng),如美國Cypress公司的CY7C67300;另一種是實現(xiàn)了包括文件系統(tǒng)在內的所有USB讀取U盤所需的軟硬件,只需要FPGA發(fā)送命令進行控制即可實現(xiàn)讀取U盤,如南京沁恒電子的CH376。在這兩類方案中,CY7C67300集成度高,但其只支持USB 1.1,傳輸速率較低;同時需要FPGA對其進行配置和控制及實現(xiàn)文件系統(tǒng),F(xiàn)PGA端的開發(fā)量較大。CH376支持USB2.0接口,是一個真正的單芯片解決方案;但CH376只支持FAT16/32文件系統(tǒng),不支持NTFS文件系統(tǒng),無法讀取大于4 GB的大文件。另外,CH376需要FPGA進行配置和控制,因此需要實現(xiàn)CH376的控制邏輯并占用一定的FPGA資源。

由于現(xiàn)有方案均存在數(shù)據(jù)傳輸速率低、FPGA開發(fā)量大的缺點,本文提出了一種使用ARM+FPGA的方案,通過ARM處理器讀取USB設備數(shù)據(jù)并傳輸給FPGA,從而實現(xiàn)FPGA從USB設備獲取數(shù)據(jù)。該方案既能達到較高的數(shù)據(jù)傳輸速率,又能降低FPGA開發(fā)量,同時還具有很高的靈活性。

1 系統(tǒng)設計

本方案的系統(tǒng)設計如圖1所示。該系統(tǒng)由ARM處理器、FPGA和USB設備構成,F(xiàn)PGA通過內部開辟的異步RAM空間接收數(shù)據(jù),ARM處理器負責將USB設備中數(shù)據(jù)通過并行總線轉發(fā)給FPGA,USB設備支持常見的U盤、照相機、移動硬盤等支持USB接口的從設備。本設計還將ARM處理器的兩個引腳與FPGA的通信。指令線用于ARM向FPGA發(fā)送準備進行數(shù)據(jù)傳輸?shù)闹噶?響應線用于FPGA在接收到ARM的通知并準備好后響應ARM。與FPGA相連的DDR存儲器用于高速緩存大量圖像數(shù)據(jù),支持常見的DDR、DDR2和DDR3等類型。

一種FPGA高速訪問USB設備的設計方案

1.1 ARM處理器選擇

本方案選用的ARM處理器為韓國三星公司的S5PV210。S5PV210是一款基于ARM Cortex—A8內核的RSIC處理器,該芯片擁有強大的計算能力、豐富的內部資源和外部接口,主頻高達1 GHz,同時它還擁有優(yōu)化的外部存儲器接口。外部存儲器接口為異步接口,時鐘頻率為133MHz,位寬為16位,具有完善且可調的時序控制功能,可用于連接ROM、SRAM、oneNAND、NAND Flash等多種存儲器,能滿足在高端通信服務中的數(shù)據(jù)帶寬要求。本方案使用這個接口完成數(shù)據(jù)從ARM處理器到FPGA的高速傳輸。

1.2 ARM與FPGA接口設計

本方案將FPGA異步RAM連接在ARM處理器的XM0內存總線上,作為一個位寬為16位的SRAM使用,其對應的硬件地址為0x10000000到0x1000 1002,共4 098字節(jié)。由于異步RAM的位寬為16位,故只需使用地址線ADDR 1~ADDR 13。指令線連接ARM處理器的GPIO引腳,方向為輸出,高電平有效。響應線連接ARM處理器的中斷引腳,方向為輸入,上升沿有效。

1.3 軟件設計

在本方案中,ARM處理器以幀為單位向FPGA傳輸數(shù)據(jù)。每幀長度為4 098字節(jié),其中,幀頭長度為2字節(jié),數(shù)據(jù)長度為4 096字節(jié)。幀格式如圖2所示。

一種FPGA高速訪問USB設備的設計方案

幀類型的取值為:此幀不是最后幀為00,此幀是最后幀則為11。幀長度為幀數(shù)據(jù)的長度,以字節(jié)為單位。

本方案所設計的軟件分為兩個部分一一驅動程序和應用程序,軟件總體框圖如圖3所示。驅動程序在Linux系統(tǒng)中注冊硬件并提供控制硬件的功能函數(shù),以供應用程序調用。應用程序使用驅動程序提供的功能函數(shù)控制硬件,完成整個傳輸過程。軟件總體流程圖如圖4所示。

一種FPGA高速訪問USB設備的設計方案

1.3.1 驅動程序設計

本方案涉及3種驅動程序:USB驅動程序、文件系統(tǒng)驅動程序和FPGA驅動程序。

Linux系統(tǒng)有豐富完善的USB設備和文件系統(tǒng)支持。本方案使用Linux系統(tǒng)中自帶的USB Mass Storage驅動程序和文件系統(tǒng)驅動程序,自行編寫FPGA驅動程序。FPGA驅動程序基于Linux系統(tǒng)字符設備驅動程序模型進行編寫。FPGA驅動程序的主要函數(shù)有初始化函數(shù)init()、寫入中斷服務函數(shù)write_int()、寫入函數(shù)write()。

初始化函數(shù)init()首先將FPGA異步RAM對應的硬件地址0x10000000~0x10001002映射為Linux系統(tǒng)中的內存虛擬地址A到A+4098(設映射的內存虛擬地址起始為A),實現(xiàn)在Linux系統(tǒng)中直接向異步RAM寫入數(shù)據(jù)。然后,設置指令線、響應線所對應的寄存器。將指令線的方向設置為輸出,并輸出低電平;響應線的方向設置為中斷輸入。最后,函數(shù)將響應線中斷服務函數(shù)設置為write_int()。

寫入函數(shù)write()與寫入中斷服務函數(shù)write_int()配合,完成一次數(shù)據(jù)傳輸:

①當應用程序調用寫入函數(shù)后,函數(shù)首先設置指令線為高電平指示FPGA準備傳輸數(shù)據(jù),然后將驅動程序置于休眠狀態(tài),等待喚醒。

②FPGA收到指令后判斷現(xiàn)在能否傳輸數(shù)據(jù),如果能,則在中斷線上發(fā)送一個上升沿。ARM處理器捕捉到該上升沿后,調用write_int(),喚醒驅動程序。

③驅動程序被喚醒后,繼續(xù)執(zhí)行write()。write()函數(shù)首先根據(jù)應用程序提供的參數(shù)生成幀頭,并將幀頭寫入地址ADDR和ADDR+1,完成幀頭的傳輸。隨后將數(shù)據(jù)寫入地址ADDR+2及其后的地址,完成數(shù)據(jù)的傳輸。

1.3.2 應用程序設計

本方案通過Linux系統(tǒng)的熱插拔機制自動啟動應用程序。在U盤插入USB接口后,Linux系統(tǒng)自動加載USB驅動和FPGA驅動并啟動應用程序。應用程序流程如圖5所示。

一種FPGA高速訪問USB設備的設計方案

運行應用程序時,通過設置參數(shù)能使應用程序讀取U盤、移動硬盤甚至網(wǎng)絡上的文件,使方案具有很高的靈活性。應用程序使用了多線程技術來充分利用系統(tǒng)資源,使用兩個線程分別實現(xiàn)從U盤讀取數(shù)據(jù)存入緩沖區(qū)的過程和將緩沖區(qū)內的數(shù)據(jù)傳輸至FPGA的過程。在讀取線程或寫入線程中,可以加入數(shù)據(jù)處理代碼實現(xiàn)數(shù)據(jù)的預處理,減少FPGA工作量。應用程序分配了多個緩沖區(qū)提高性能,并使用了互斥鎖實現(xiàn)讀取線程與傳輸線程間的線程同步,確保數(shù)據(jù)正確傳輸。

1.4 ARM向FPGA傳輸數(shù)據(jù)設計

本方案在FPGA中實現(xiàn)一個異步RAM,其使用乒乓機制接收來自ARM處理器的數(shù)據(jù),同時需要將異步RAM中的數(shù)據(jù)寫入DDR 2存儲器。異步RAM內部有兩個數(shù)據(jù)緩沖模塊。在乒乓機制中,兩個模塊分別執(zhí)行不同的任務,當模塊1接收數(shù)據(jù)來自ARM處理器的數(shù)據(jù)時,模塊2將數(shù)據(jù)寫入DDR 2存儲器。當兩個模塊的任務都完成后,交換模塊1和模塊2的任務。與現(xiàn)有方案相比,本方案FPGA無需配置外部芯片,所需開發(fā)量較小。

2 測試與分析

2.1 傳輸速率測試

此測試傳輸3個不同大小的文件,記錄數(shù)據(jù)傳輸時間,從而獲得數(shù)據(jù)傳輸速率。

測試結果如表1所列。

一種FPGA高速訪問USB設備的設計方案

由表1可知,在傳輸速率測試中,測得的最高數(shù)據(jù)傳輸速率為47.6 Mbps,比現(xiàn)有方案如CY7C67300、CH376的數(shù)據(jù)傳輸速率高。在傳輸速率測試中,傳輸100 KB文件的傳輸速率與傳輸1 MB和1 GB文件的傳輸速率相比偏低,而傳輸1 MB和1 GB文件的傳輸速率則相差不大。原因為:

①測試為先進行計時后開始傳輸,存在一段時間未傳輸數(shù)據(jù)。

②應用程序在傳輸開始前需要一段時間進行初始化,存在一段時間未傳輸數(shù)據(jù)。

在后兩種測試中,以上兩種未傳輸數(shù)據(jù)的時間占總時間的比重較低,因此數(shù)據(jù)傳輸速率較高。

2.2 傳輸準確率測試

此測試在FPGA內實現(xiàn)一個比較器,比較異步RAM接收到的數(shù)據(jù)與比較器內置數(shù)據(jù)是否一致,從而測試傳輸是否正確并確定正確率。經(jīng)測試,此方案在傳輸過程中無差錯發(fā)生,傳輸正確率為100%。

結語

FPGA與ARM處理器相配合實現(xiàn)FPGA高速獲取U盤數(shù)據(jù)的方案,可以滿足FPGA高速讀取U盤數(shù)據(jù)的需求。在傳輸過程中無差錯,且具有良好的靈活性。本方案具有很高的實用價值。



評論


相關推薦

技術專區(qū)

關閉