新聞中心

EEPW首頁(yè) > 嵌入式系統(tǒng) > 業(yè)界動(dòng)態(tài) > AMD資助:新法讓CPU+GPU融合處理器性能暴增113%

AMD資助:新法讓CPU+GPU融合處理器性能暴增113%

—— 為研究提供資助的是美國(guó)國(guó)家科學(xué)基金會(huì)和AMD公司
作者: 時(shí)間:2012-02-10 來(lái)源:cnbeta 收藏

  北卡羅萊納州大學(xué)和公司的研究人員們最近找到了一種新方法,能夠讓 APU、Intel Sandy Bridge這種集CPU、GPU于一體的融合型獲得平均20%以上的性能提升,最多可翻一番還多。工程師們主要是利用了x86的一些獨(dú)特性質(zhì),比如說數(shù)據(jù)預(yù)取和大容量緩存,從而在GPU上加速并行任務(wù)的執(zhí)行。

本文引用地址:http://2s4d.com/article/128792.htm

  研究論文作者之一、電子與計(jì)算機(jī)工程副教授周惠陽(yáng)博士(Dr. Huiyang Zhou)認(rèn)為:“芯片廠商開發(fā)了 ‘融合架構(gòu)’的,將CPU、GPU整合在單獨(dú)一顆芯片上。這種方法降低了制造成本,讓計(jì)算機(jī)更加高效,但是CPU核心、GPU核心仍然都幾乎完全在 執(zhí)行各自不同的功能,很少能夠合作執(zhí)行任何程序,因此沒有預(yù)想得那么高效。這就是我們要爭(zhēng)取解決的問題。”

  他進(jìn)一步解釋說:“我們的方法是讓GPU核心去執(zhí)行計(jì)算型功能,同時(shí)讓CPU從片外主內(nèi)存中預(yù)取GPU所需要的數(shù)據(jù)。這樣做的效率更高,因?yàn)樗茏孋PU、GPU去做各自擅長(zhǎng)的事情:GPU的長(zhǎng)項(xiàng)是進(jìn)行計(jì)算,CPU則適合做出決定、彈性獲取數(shù)據(jù)。”

  其實(shí)CPU、GPU從主內(nèi)存中獲取數(shù)據(jù)的速度是差不多的,但如果能讓CPU來(lái)提前判斷GPU所需數(shù)據(jù),并拿來(lái)做好準(zhǔn)備,GPU就可以減輕負(fù)擔(dān),全身心投入到執(zhí)行和計(jì)算中去了,效率自然可以得到提升。

  在一個(gè)由CPU輔助進(jìn)行的GPGPU處理器中,CPU啟動(dòng)一個(gè)GPU程序后,會(huì)創(chuàng)建一個(gè)預(yù)執(zhí)行程序。該程序使用編譯器算法從GPU內(nèi)核中自動(dòng)生成,包含 GPU內(nèi)核多個(gè)線程塊的內(nèi)存訪問指令。CPU預(yù)執(zhí)行程序會(huì)在GPU內(nèi)核之前運(yùn)行,這是因?yàn)椋旱谝?,CPU預(yù)執(zhí)行線程僅包含來(lái)自GPU內(nèi)核的內(nèi)存拾取指令, 沒有浮點(diǎn)計(jì)算;第二,相比于GPU標(biāo)量核心,CPU的運(yùn)行頻率更高,指令級(jí)的并行度也更高。

  研究人員們還利用了CPU二級(jí)緩存的預(yù)取能力,來(lái)提高CPU的內(nèi)存帶寬,因此GPU線程訪問內(nèi)存對(duì)三級(jí)緩存的依賴及其延遲都大為降低。

  此外,因?yàn)轭A(yù)執(zhí)行程序是直接由用戶級(jí)的應(yīng)用程序控制的,精度和彈性都非常高。

  工程師們通過對(duì)一系列基準(zhǔn)測(cè)試進(jìn)行試驗(yàn),最后得出結(jié)論稱這種方法可將處理器性能平均提升21.4%,最多可達(dá)驚人的113%。

  這篇名為《CPU-GPU融合架構(gòu)上的CPU輔助GPGPU》(CPU-Assisted GPGPU on Fused CPU-GPU Architectures)的論文將于二月底在新奧爾良舉行的第18屆國(guó)際高性能計(jì)算機(jī)架構(gòu)研討會(huì)上公布。該論文的作者還有北卡羅來(lái)納州大學(xué)的在校學(xué)生Yi Yang、Ping Xiang(看來(lái)都是華裔人士),以及來(lái)自公司的Mike Mantor,而為研究提供資助的是美國(guó)國(guó)家科學(xué)基金會(huì)和AMD公司。

  很顯然,AMD未來(lái)的Fusion APU非常有希望用到這些技術(shù)。



關(guān)鍵詞: AMD 處理器

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉