FPGA在PCI Express總線(xiàn)接口中的應(yīng)用
0 引言
PCIE(PCI express)是用來(lái)互聯(lián)諸如計(jì)算機(jī)和通信平臺(tái)應(yīng)用中外圍設(shè)備的第三代高性能I/0總線(xiàn)。PCIE體系結(jié)構(gòu)繼承了第二代總線(xiàn)體系結(jié)構(gòu)最有用的特點(diǎn),采用與PCI相同的使用模型和讀/寫(xiě)通信模型,支持各種常見(jiàn)的事務(wù)。其存儲(chǔ)器、I/0和配置地址空間與PCI的地址空間相同。由于地址空間模型沒(méi)有變化,所以現(xiàn)有的OS和驅(qū)動(dòng)軟件無(wú)需進(jìn)行修改就可以在PCIE系統(tǒng)上運(yùn)行。
PCIE是串行協(xié)議,與原有的PCI并行總線(xiàn)相比,它沒(méi)有大量的數(shù)據(jù)和控制線(xiàn),對(duì)于硬件電路設(shè)計(jì)者來(lái)說(shuō),省去了很多硬件設(shè)計(jì)工作。PCIE的傳輸速度遠(yuǎn)遠(yuǎn)大于PCI總線(xiàn),PCIE1.1版本單個(gè)鏈路的單向吞吐量能達(dá)到250 MB/s。對(duì)于需要與主機(jī)進(jìn)行大容量傳輸?shù)南到y(tǒng)來(lái)說(shuō),該總線(xiàn)標(biāo)準(zhǔn)的優(yōu)勢(shì)是非常明顯的。
由于PCIE總線(xiàn)硬件設(shè)計(jì)簡(jiǎn)單,吞吐量大,軟件向下兼容,只要找到合適的總線(xiàn)接口芯片,很容易將現(xiàn)有的PCI總線(xiàn)設(shè)備升級(jí)為PCIExpress設(shè)備。Altera公司最新推出的EP2SGX90系列的芯片,給用戶(hù)提供了PCIE接口IP核。本文將結(jié)合實(shí)際的應(yīng)用,詳細(xì)介紹該IP核的使用情況,包括寄存器設(shè)置,DMA操作等。
1 功能描述及參數(shù)設(shè)置
按照PCIE協(xié)議的要求,該FPGA的IP核也采用三層體系結(jié)構(gòu),即傳輸層、數(shù)據(jù)鏈路層和物理層。這三層功能模塊完成了PCIE的協(xié)議轉(zhuǎn)換,在傳輸層上給開(kāi)發(fā)人員提供了非常豐富的接口。開(kāi)發(fā)人員的所有開(kāi)發(fā),包括DMA傳輸?shù)榷际窃趥鬏攲右陨线M(jìn)行的。
傳輸層(transaction layer):完成TLP(數(shù)據(jù)傳輸包)的收發(fā),含有虛擬信道(VC)緩沖區(qū),具有端口仲裁、VC仲裁、流控制、數(shù)據(jù)重新排序和數(shù)據(jù)校驗(yàn)等功能。
數(shù)據(jù)鏈路層(data link layer):數(shù)據(jù)鏈路層的主要功能是保證在各鏈路上發(fā)送和接收數(shù)據(jù)包時(shí)數(shù)據(jù)的完整性。在接收端,對(duì)數(shù)據(jù)進(jìn)行嚴(yán)格的CRC校驗(yàn),如果有錯(cuò)誤,會(huì)給發(fā)送方返回1個(gè)NAK信號(hào)。發(fā)送端具有重傳緩沖區(qū),如果收到NAK信號(hào),則把數(shù)據(jù)重新發(fā)送1次。
物理層(physical layer):對(duì)于發(fā)送端,接收數(shù)據(jù)鏈路層的數(shù)據(jù)包,把這些數(shù)據(jù)進(jìn)行8 b/10 b編碼,送到串行發(fā)送器上;對(duì)于接收端則剛好相反,收到串行碼后,先解碼,然后送給數(shù)據(jù)鏈路層。
在生成PCIE的IP核時(shí),至少選擇2個(gè)存儲(chǔ)區(qū),一個(gè)是BAR[1:O],用作用戶(hù)開(kāi)發(fā)板的擴(kuò)展存儲(chǔ)區(qū)用;還有一個(gè)是BAR2,下面所有的寄存器操作都是基于該地址的。新生成的IP核不帶有DMA功能,但是在工程文件夾下面有一個(gè)xxxx_examples(xxx代表工程名稱(chēng))的文件夾,文件夾里有簡(jiǎn)單DMA和鏈?zhǔn)紻MA的例子代碼,開(kāi)發(fā)者只需要對(duì)這些代碼進(jìn)行修改,就能開(kāi)發(fā)出適合自己的DMA功能模塊。
2 簡(jiǎn)單DMA
該DMA傳輸模式相對(duì)比較簡(jiǎn)單,只需要對(duì)相應(yīng)的寄存器進(jìn)行設(shè)置即可完成,DMA傳輸步驟如下所示,每進(jìn)行1次DMA傳輸,都需要按照下面的步驟進(jìn)行1次設(shè)置。下面所述的偏移量都是相對(duì)于BAR2地址。
(1)設(shè)置偏移量為0x00和0x04的寄存器,寫(xiě)入DMA傳輸?shù)闹鳈C(jī)端地址;
(2)設(shè)置偏移量為0x14的寄存器,寫(xiě)入DMA傳輸?shù)腜CIE端點(diǎn)地址;
(3)在偏移量為0x08的寄存器中寫(xiě)入本次DMA傳輸?shù)拈L(zhǎng)度,以字節(jié)為單位;
(4)設(shè)置偏移量為0x0C的寄存器,設(shè)置DMA傳輸?shù)膶傩?,?duì)該寄存器的寫(xiě)操作將啟動(dòng)本次DMA傳輸;
(5)讀取0x0C的寄存器DMA傳輸狀態(tài)位,察看本次DMA是否完成。
3 鏈?zhǔn)紻MA
鏈?zhǔn)紻MA是一種效率遠(yuǎn)遠(yuǎn)高于簡(jiǎn)單DMA的傳輸方式,它只需要1次啟動(dòng)操作,就可以完成多次DMA傳輸。這里將結(jié)合實(shí)際使用情況,詳細(xì)介紹鏈?zhǔn)紻MA的傳輸過(guò)程。
3.1 描述符表
實(shí)現(xiàn)鏈?zhǔn)紻MA傳輸時(shí),需要開(kāi)發(fā)人員在主機(jī)內(nèi)存中開(kāi)辟一塊空間,用來(lái)存儲(chǔ)描述符表,它由一個(gè)表頭和多個(gè)描述符組成,其中每一個(gè)描述符對(duì)應(yīng)一次DMA操作。用戶(hù)根據(jù)自己的需求填寫(xiě)該描述符表,關(guān)于該描述符表的詳細(xì)說(shuō)明如表1和表2所示。
控制區(qū)域中含有一些控制信息,其中第16位用來(lái)控制傳輸方向,為O是DMA寫(xiě),為1是DMA讀,這里的讀/寫(xiě)是以主機(jī)端為參考的,如果以PCIE核為參考,方向剛好相反。第18位用來(lái)使能DMA傳輸計(jì)數(shù),如果該位使能為1,那么在DMA傳輸過(guò)程中,PCIE核每完成1次DMA操作,都會(huì)進(jìn)行1次計(jì)數(shù)操作,然后把這個(gè)計(jì)數(shù)結(jié)果傳送給主機(jī),主機(jī)把這個(gè)結(jié)果填寫(xiě)到描述符表的RCLAST字段中。
表大小是指本次鏈?zhǔn)紻MA操作對(duì)應(yīng)的描述符個(gè)數(shù),每個(gè)描述符對(duì)應(yīng)一次DMA操作。
RCLAST是一個(gè)計(jì)數(shù)單元,它有兩個(gè)作用,在鏈?zhǔn)紻MA傳輸前,表示還有多少個(gè)DMA操作等待傳輸,由于它是從0開(kāi)始計(jì)數(shù)的,所以這個(gè)值等于表大小減1。還有一個(gè)重要作用是在鏈?zhǔn)紻MA傳輸過(guò)程中,用來(lái)表示鏈?zhǔn)紻MA傳輸?shù)臓顟B(tài)。如上所述,如果控制區(qū)域的第18位設(shè)置為1,那么每完成1次DMA操作,主機(jī)都會(huì)更新這個(gè)計(jì)數(shù)器。當(dāng)計(jì)數(shù)器的數(shù)值(也是從O開(kāi)始計(jì)數(shù)的)等于前面設(shè)置的期望傳輸?shù)腄MA次數(shù),就表示鏈?zhǔn)紻MA傳輸操作結(jié)束。開(kāi)發(fā)人員可以用這個(gè)狀態(tài)單元來(lái)察看本次傳輸是否結(jié)束,從而開(kāi)始一個(gè)新的傳輸周期。
DMA長(zhǎng)度用來(lái)設(shè)置本描述符對(duì)應(yīng)的DMA傳輸?shù)拈L(zhǎng)度,是以32位為單位的。主機(jī)端地址用來(lái)指示數(shù)據(jù)存放存放的位置。
評(píng)論