博客專欄

EEPW首頁 > 博客 > PCIe接口驅動 中斷寄存器被覆蓋問題的發(fā)現(xiàn)與解決

PCIe接口驅動 中斷寄存器被覆蓋問題的發(fā)現(xiàn)與解決

發(fā)布人:FPGA小師兄 時間:2023-01-16 來源:工程師 發(fā)布文章

最近調試Windows平臺下的PCIe網(wǎng)絡驅動程序時,發(fā)現(xiàn)了中斷不被處理的情況,懷疑中斷丟失。隨后在調試過程中將問題定位在如下兩個方面。

DMA寫重復啟動

我們在Windows下使用WDF框架開發(fā)PCIe驅動的DMA讀寫功能。驅動要啟動一次DMA傳輸包括兩個步驟

  • 初始化DMA傳輸對象

  • 執(zhí)行DMA傳輸

初始化DMA傳輸對象時,應將本次DMA要傳輸?shù)臄?shù)據(jù)緩沖區(qū)的地址和長度寫入該對象,并向其注冊用于配置并啟動DMA傳輸?shù)幕卣{函數(shù)PCIeEvtProgramWriteDma。該回調函數(shù)會獲取緩沖區(qū)地址和長度,通過PIO方式配置PCIe Bar空間上的寄存器,以通知硬件啟動DMA傳輸。

執(zhí)行DMA傳輸時,驅動僅需調用WDF框架的WdfDmaTransactionExecute函數(shù),操作系統(tǒng)就會調用上一步注冊的回調函數(shù)對硬件進行配置并啟動DMA傳輸。

正常來講,驅動調用一次WdfDmaTransactionExecute函數(shù),相應地操作系統(tǒng)應調用一次回調函數(shù)進行硬件配置。但我們更換硬件平臺(CPU+FPGA)后,DMA寫流程出現(xiàn)了嚴重問題,具體表現(xiàn)為:前者的一次調用可能會對應著后者的多次調用,且每次回調函數(shù)都會完整執(zhí)行并觸發(fā)DMA寫完成中斷,從而造成了驅動的中斷狀態(tài)機被打亂,直接表現(xiàn)是后續(xù)的DMA寫開始中斷丟失,無法正常啟動DMA寫。

如下,圖1是驅動調用WdfDmaTransactionExecute函數(shù)的次數(shù)與操作系統(tǒng)調用回調函數(shù)的次數(shù)不一致的截圖。

圖1 DebugMonito監(jiān)測

其中,5658(5576+82+0)為驅動調用WdfDmaTransactionExecute函數(shù)的次數(shù),5664為操作系統(tǒng)調用回調函數(shù)的次數(shù)。二者之間差6就是操作系統(tǒng)重復調用的次數(shù)。

我們嘗試將操作系統(tǒng)多出來的調用回調函數(shù)的次數(shù)跳過,即僅保留第一次調用。硬件側可以正常完成這次DMA傳輸,并觸發(fā)DMA寫完成中斷。但驅動去查詢DMA傳輸對象時,發(fā)現(xiàn)此次DMA傳輸并未處于完成狀態(tài),即無法正常接收數(shù)據(jù)。至此,我們猜測,操作系統(tǒng)多次調用回調函數(shù)的原因是其認為配置過程出錯才重新進行配置,直至最后一次成功。而硬件側并不會感知到這種錯誤,每次都正常啟動DMA寫并觸發(fā)DMA寫完成中斷,導致驅動的中斷狀態(tài)機跑飛。

問題排查到這里,我們無法深入到閉源的Windows操作系統(tǒng)內部去探究錯誤原因了。所以思路一轉,我們嘗試能否為中斷狀態(tài)機提供一些保障機制。

驅動的中斷狀態(tài)機

為了方便調試,我們在中斷處理程序中添加了許多關鍵的調試日志信息,結果在其中發(fā)現(xiàn)了端倪。

圖2 日志打印記錄

觀察圖2中的日志,發(fā)現(xiàn)兩個中斷延遲處理函數(shù)MPHandleInterrupt在并行執(zhí)行。在這個過程中,用于臨時拷貝中斷寄存的變量Adapter->IsrCode_dpc被覆蓋重寫。覆蓋的直接后果是,前者已讀取到的寄存的中斷,后者覆蓋后就無法由中斷延遲處理程序進行處理。

這種現(xiàn)象顯然是不合理的。為了解決這個問題,我們?yōu)镸PHandleInterrupt函數(shù)內部加鎖,防止MPHandleInterrupt并行執(zhí)行。通過這種方式,中斷寄存被覆蓋的現(xiàn)象不再發(fā)生。

全文完。


*博客內容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。

高通濾波器相關文章:高通濾波器原理



技術專區(qū)

關閉