系統(tǒng)設(shè)計(jì)工程師不可不知的DRAM控制器核心結(jié)論(一)
DRAM控制器能否正常工作會(huì)使得系統(tǒng)有很大的不同,有的系統(tǒng)能夠滿足其設(shè)計(jì)要求,而有的系統(tǒng)則運(yùn)行緩慢,過熱,甚至失敗。不論哪種情況,最終是由系統(tǒng)設(shè)計(jì)團(tuán)隊(duì)承擔(dān)責(zé)任,他們一般很少掌握控制器的信息。
成功還是失敗都源自我們要求DRAM控制器所做的工作。模塊不僅僅是一個(gè)接口。在高級系統(tǒng)設(shè)計(jì)中,DRAM控制器必須很好的處理SoC體系結(jié)構(gòu)復(fù)雜而又難以預(yù)測的存儲(chǔ)器申請,以及一側(cè)的系統(tǒng)軟件申請,還有另一側(cè)DRAM芯片設(shè)計(jì)復(fù)雜的時(shí)序和約束要求。能否處理好這些關(guān)系會(huì)在多個(gè)方面影響DRAM吞吐量:這很容易在系統(tǒng)性能上體現(xiàn)出來。
為解釋這些問題,以及系統(tǒng)設(shè)計(jì)人員能夠?qū)Υ俗鍪裁?,我們需要回答三個(gè)主要問題。首先,我們應(yīng)檢查DRAM芯片提出的要求。然后,需要討論SoC體系結(jié)構(gòu)對存儲(chǔ)器訪問模式的影響,第三,研究一個(gè)高級DRAM控制器的結(jié)構(gòu)和功能。通過這三部分,我們得出系統(tǒng)設(shè)計(jì)的一些結(jié)論。
DRAM需要什么
系統(tǒng)規(guī)劃對外部存儲(chǔ)器的要求是確定性隨機(jī)訪問:任何時(shí)候來自任何位置的任意字,具有固定延時(shí)。但是,確定性隨機(jī)訪問恰恰是現(xiàn)代DDR3 DRAM所不能提供的。
相反,DRAM提供任何您需要的字,但是具有復(fù)雜的時(shí)序約束,因此,很難知道數(shù)據(jù)究竟什么時(shí)候出現(xiàn)。 圖1 中“簡化的”狀態(tài)轉(zhuǎn)換圖簡單解釋了為什么會(huì)這么復(fù)雜。這種復(fù)雜度也意味著,命令到達(dá)DRAM芯片的順序會(huì)對時(shí)序以及帶寬有很大的影響。要理解這一點(diǎn),我們需要深入了解DDR3 DRAM。
圖1.DDR DRAM芯片“簡化的”狀態(tài)圖顯示了控制器設(shè)計(jì)人員所面臨的復(fù)雜問題
DRAM芯片將數(shù)據(jù)存儲(chǔ)在電容陣列中。當(dāng)您讀寫數(shù)據(jù)時(shí),您并不會(huì)直接訪問陣列。而是在讀寫之前,您激活陣列中的某一行。激活命令使得DRAM讀取該行中的所有列的所有比特,將其送入傳感放大器塊,它實(shí)際上用作該行的本地寄存器文件。然后,您可以對傳感放大器上的數(shù)據(jù)發(fā)出讀寫命令。通過這種方式,能夠非常快的讀寫已經(jīng)激活的行:一般是三到五個(gè)時(shí)鐘來開始一次突發(fā)傳送,然后,在突發(fā)期間傳送每個(gè)字節(jié)需要一個(gè)時(shí)鐘。例如,這種時(shí)序安排使得DDR3 DRAM非常適合L2高速緩存數(shù)據(jù)交換。
但是,如果您不使用已經(jīng)激活的行,那么會(huì)非常復(fù)雜。改變行時(shí),即使是一個(gè)字節(jié),您也必須對當(dāng)前行去激活,然后激活一個(gè)新行。這一過程需要確定已經(jīng)在一段時(shí)間內(nèi)激活了當(dāng)前行。由于讀取DRAM單元是破壞性的,因此需要最小延時(shí):您激活了一行后,DRAM實(shí)際上是將最新到達(dá)傳感放大器上的數(shù)據(jù)復(fù)制回比特單元陣列中,然后刷新行。您可以在此期間讀寫當(dāng)前行,但是,要確定在您改變行之前完成了這一過程。
即使?jié)M足了這一要求,也還有其他問題。您必須對陣列預(yù)充電。預(yù)充電命令使得傳感放大器中的數(shù)據(jù)無效,提升陣列和傳感放大器輸入之間導(dǎo)線上的電壓,使得電壓值位于邏輯0和邏輯1電平之間。這種準(zhǔn)備是必要的,比特單元電容上很小的電荷都會(huì)傳送到導(dǎo)線上,以某種方式提示傳感放大器。
對導(dǎo)線進(jìn)行預(yù)充電之后,您必須向新行發(fā)送一個(gè)激活命令,等待操作完成,然后,您最終可以發(fā)送一個(gè)讀操作新命令。加上所有涉及到的延時(shí)后,即,讀取字節(jié)序列的最差情況,每一字節(jié)都來自不同的行,這要比讀取來自一個(gè)新行連續(xù)位置相同數(shù)量字節(jié)的時(shí)間慢十倍。
這種不同還只是部分問題。如圖2 所示,DDR DRAM有多個(gè)塊:與比特單元無關(guān)的陣列。DDR3 DRAM中有八個(gè)塊,每一塊都有自己排列成行的傳感放大器。因此,原理上,您可以通過激活每一個(gè)塊中的一行,讀寫較長的突發(fā),然后,對每一激活后的行進(jìn)行讀寫操作——實(shí)際上是對塊進(jìn)行間插操作。唯一增加的延時(shí)是連接每一塊的傳感放大器和芯片內(nèi)部總線的緩沖的切換時(shí)間。這一延時(shí)要比對相同塊中一個(gè)新行進(jìn)行預(yù)充電和激活的時(shí)間短得多。
圖2.一個(gè)典型的DDR DRAM結(jié)構(gòu)圖。一個(gè)DDR3器件會(huì)有8個(gè)塊,而不是4個(gè)
這就是原理。實(shí)際中,您可以對塊進(jìn)行間插處理,但是有一個(gè)限制,不是基于DRAM邏輯,而是芯片能夠承受的熱量。這種限制可以通過著名的“滾動(dòng)四塊訪問窗口”,即,tRAW來表達(dá):您一次能夠有四個(gè)激活塊的最長時(shí)間。這一規(guī)則實(shí)際上有例外,只要您從一個(gè)塊轉(zhuǎn)向下一塊之前,在一個(gè)塊上保持一定的時(shí)間,那么,您可以有連續(xù)激活的8個(gè)塊。但是您應(yīng)該知道:這比較復(fù)雜。
評論