KeyStone存儲(chǔ)器架構(gòu)
序言
隨著全球范圍內(nèi)的海量數(shù)據(jù)對(duì)無(wú)線和有線網(wǎng)絡(luò)的強(qiáng)大沖擊,運(yùn)營(yíng)商面臨著嚴(yán)峻的挑戰(zhàn),他們需要不斷推出既能滿足當(dāng)前需求也能滿足未來(lái)需求的網(wǎng)絡(luò)。因此,通信基礎(chǔ)局端設(shè)備制造商在致力于降低每比特成本和功耗的同時(shí),也在不斷尋求能夠滿足當(dāng)前及至未來(lái)需求的核心技術(shù)。TI最新推出的新型 KeyStone 多內(nèi)核 SoC 架構(gòu)能夠游刃有余地滿足這些挑戰(zhàn)。
基于新型 KeyStone 多內(nèi)核 SoC 架構(gòu)的器件集成了多達(dá) 8 個(gè)TMS320C66x DSP CorePac,能夠?qū)崿F(xiàn)無(wú)與倫比的定點(diǎn)與浮點(diǎn)處理能力。KeyStone 架構(gòu)經(jīng)精心設(shè)計(jì),是一款效率極高的多內(nèi)核存儲(chǔ)器架構(gòu),允許并行執(zhí)行任務(wù)的同時(shí),還能使所有的 CorePac實(shí)現(xiàn)全速處理。本文探討了 KeyStone 存儲(chǔ)器的層級(jí)結(jié)構(gòu),及其將如何與 SoC架構(gòu)的其他組件進(jìn)行連接以實(shí)現(xiàn)多內(nèi)核全速處理。
德州儀器 (TI) 積極創(chuàng)新,努力迎接多內(nèi)核 SoC 技術(shù)帶來(lái)的挑戰(zhàn)。TI KeyStone 架構(gòu)擁有眾多組件,其中包含全新的 C66x 定點(diǎn)和浮點(diǎn) DSP 內(nèi)核、可實(shí)現(xiàn)基于標(biāo)準(zhǔn)的優(yōu)化功能和接口的可配置協(xié)處理器、層級(jí)存儲(chǔ)器架構(gòu)、TeraNet 交換結(jié)構(gòu)以及可將上述各組件連結(jié)在一起的多內(nèi)核導(dǎo)航器。KeyStone 架構(gòu)具備三個(gè)存儲(chǔ)等級(jí)。每個(gè) C66xCorePac 均擁有自己的一級(jí)程序 (L1P) 和一級(jí)數(shù)據(jù) (L1D) 存儲(chǔ)器。另外,每個(gè) CorePac 還擁有局域的二級(jí)統(tǒng)一存儲(chǔ)器。每個(gè)局域存儲(chǔ)器均能獨(dú)立配置成存儲(chǔ)器映射的SRAM、高速緩存,或是兩者的組合。
KeyStone 架構(gòu)包含共享的存儲(chǔ)器子系統(tǒng),其由通過(guò)多內(nèi)核共享存儲(chǔ)器控制器 (MSMC) 連接的內(nèi)部和外部存儲(chǔ)器組成。MSMC 允許CorePac動(dòng)態(tài)地分享程序和數(shù)據(jù)的內(nèi)外部存儲(chǔ)器。
圖 1 - KeyStone 器件方框圖 - TMS320TCI6616
2
MSMC 的內(nèi)部 RAM 允許各部分被配置成共享的二級(jí) RAM 或者共享三級(jí) (SL3) RAM,從而可為程序員提供高度的靈活性。SL2 RAM 僅能夠在局域 L1P 和 L1D 高速緩存中緩存,而 SL3另外還可在局域 L2 高速緩存中進(jìn)行緩存。
為向軟件執(zhí)行提供快速通道,外部存儲(chǔ)器同內(nèi)部共享存儲(chǔ)器一樣,通過(guò)同一存儲(chǔ)器控制器進(jìn)行連接,而并非像在嵌入式處理器架構(gòu)上所進(jìn)行的傳統(tǒng)做法那樣,與芯片系統(tǒng)實(shí)現(xiàn)互通互連。外部存儲(chǔ)器始終被看作是 SL3 存儲(chǔ)器,并可在 L1 和 L2 中緩存。接下來(lái)的我們將探討在KeyStone 架構(gòu)中實(shí)現(xiàn)的各種性能增強(qiáng)。
存儲(chǔ)性能增強(qiáng)C66x CorePac 的內(nèi)部存儲(chǔ)器架構(gòu)與此前 C6000™ DSP 系列產(chǎn)品相比,主要在四個(gè)方面實(shí)現(xiàn)了增強(qiáng),而這突出體現(xiàn)在性能指標(biāo)和實(shí)用性方面。這些改進(jìn)旨在實(shí)現(xiàn)如下優(yōu)勢(shì):1) 無(wú)論多個(gè)內(nèi)核和數(shù)據(jù) I/O 是否處于高度繁忙狀態(tài),都能提高存儲(chǔ)器各級(jí)的執(zhí)行效率;2) 更輕松便捷地管理多個(gè)內(nèi)核和數(shù)據(jù) I/O 之間的緩存一致性;3) 存儲(chǔ)器的保護(hù)與地址擴(kuò)展,以及;4) 將對(duì)軟錯(cuò)誤的保護(hù)進(jìn)一步擴(kuò)展至較高級(jí)別的存儲(chǔ)器。
執(zhí)行效率 —— C66x CorePac 的存儲(chǔ)器子系統(tǒng)在功能上與最新的 C64x+™ 和C67x™ 系列 DSP 系列 C64x+™ 和 C67x™ 的相當(dāng)。每個(gè)局域 L1存儲(chǔ)器均為 32KB,并能夠配置成全速緩存(默認(rèn))、全存儲(chǔ)器映射 SRAM,或是 4、8 或 16KB 高速緩存選項(xiàng)的組合。L1P 始終為直接映射,而 L1D 則始終為雙向集關(guān)聯(lián) (two-way set-associative)。
圖2 – CorePac 存儲(chǔ)器增強(qiáng)
評(píng)論