Kalray MPPA解決方案實(shí)現(xiàn)無(wú)處不在的低功耗、實(shí)時(shí)單芯片超算
超級(jí)計(jì)算,對(duì)很多人來(lái)說(shuō)并不陌生但仿佛又離得很遠(yuǎn),或許大家對(duì)它的了解也僅僅限于“天河”超級(jí)計(jì)算機(jī)。其實(shí),隨著越來(lái)越多的應(yīng)用對(duì)實(shí)時(shí)數(shù)值計(jì)算和數(shù)據(jù)處理提出極高的要求,超級(jí)計(jì)算正在越來(lái)越多地出現(xiàn)在與人類(lèi)生活息息相關(guān)的領(lǐng)域。尤其是近些年來(lái),隨著云計(jì)算、大數(shù)據(jù)等IT新概念和新技術(shù)的出現(xiàn),以及先進(jìn)無(wú)損音視頻處理和自動(dòng)駕駛設(shè)備等嵌入式高性能計(jì)算的興起,使很多原有應(yīng)用迎來(lái)了突破性進(jìn)展,并促使很多新的IT應(yīng)用模式出現(xiàn)。而在這些應(yīng)用背后,許多廠(chǎng)商正在全力實(shí)現(xiàn)的“嵌入式”實(shí)時(shí)超級(jí)計(jì)算解決方案,可以提供芯片級(jí)的高性能數(shù)據(jù)運(yùn)算和處理能力。為此,北京華興萬(wàn)邦管理咨詢(xún)有限公司走訪(fǎng)了業(yè)內(nèi)率先實(shí)現(xiàn)單芯片超算(Supercomputing on a Chip)商用的法國(guó)Kalray公司,為大家一探“片上超算”給行業(yè)帶來(lái)的新機(jī)會(huì)。
本文引用地址:http://2s4d.com/article/281003.htm面向超級(jí)計(jì)算的多核處理器
為了完成普通PC或服務(wù)器無(wú)法完成的大量、復(fù)雜的計(jì)算任務(wù),超級(jí)計(jì)算機(jī)要求擁有為數(shù)眾多的處理器。然而,隨著對(duì)運(yùn)算速度越來(lái)越高的追求,單核處理器已經(jīng)無(wú)法滿(mǎn)足超級(jí)計(jì)算的要求,因?yàn)闊o(wú)休止地增加單核處理器的數(shù)量不但會(huì)造成成本和功耗的大量增加,而且性能也無(wú)法呈現(xiàn)幾何級(jí)數(shù)的增長(zhǎng)。于是,多核技術(shù)開(kāi)始被大量應(yīng)用于超級(jí)計(jì)算當(dāng)中。以中國(guó)的“天河二號(hào)”超級(jí)計(jì)算機(jī)為例,其使用的主處理器和協(xié)處理器目前均為Intel公司的多核處理器。
目前,市場(chǎng)上研發(fā)并供應(yīng)多核處理器芯片的廠(chǎng)商為數(shù)眾多,以Intel和AMD兩大處理器廠(chǎng)商為首,不同的多核處理器所面向的應(yīng)用領(lǐng)域也不盡相同。除了面向PC應(yīng)用的2核、4核處理器和面向手機(jī)和平板電腦的4核、8核處理器外,一些供應(yīng)商推出的8核、16核處理器也已實(shí)現(xiàn)全面的商用,例如XMOS公司的xCORE系列多核處理器已被高解析度音頻、千兆網(wǎng)速物聯(lián)網(wǎng)等領(lǐng)域中的產(chǎn)品、解決方案所采用,該公司全新的xCORE-200多核微控制器通過(guò)在單一器件上集成16個(gè)或更多高性能32位RISC處理器內(nèi)核,成為了高性能用戶(hù)、專(zhuān)業(yè)音頻與新興千兆網(wǎng)速物聯(lián)網(wǎng)(IoT)應(yīng)用的完美可編程平臺(tái)。
在眾多的多核處理器供應(yīng)商中,有一家面向超級(jí)計(jì)算相關(guān)應(yīng)用的廠(chǎng)商正在越來(lái)越多地引起業(yè)界的關(guān)注,這就是全球首家可以提供256核以上處理器芯片的廠(chǎng)商——法國(guó)公司Kalray。Kalray公司是在單芯片上實(shí)現(xiàn)超級(jí)計(jì)算(Supercomputing on a Chip™)的發(fā)明者,其大規(guī)模并行處理器陣列芯片MPPA®(Massively Parallel Processor Array)處理器采用臺(tái)積電(TSMC)的28nm工藝制程,擁有超過(guò)256個(gè)可以進(jìn)行C/C++編程的內(nèi)核。該公司的單芯片超算解決方案可以為兩大類(lèi)應(yīng)用提供高性能、低功耗和實(shí)時(shí)等特性,一類(lèi)是在數(shù)據(jù)中心、視頻處理等應(yīng)用中卸載主處理器的任務(wù),另一類(lèi)是需要較大量數(shù)據(jù)處理、高實(shí)時(shí)性和低功耗的嵌入式應(yīng)用。下面為您具體介紹該公司的解決方案及其商業(yè)應(yīng)用。
Kalray公司的256核MPPA處理器芯片
低功耗256核處理器芯片和標(biāo)準(zhǔn)C/C++編程環(huán)境
Kalray公司是一家成立于2008年的無(wú)晶圓廠(chǎng)半導(dǎo)體公司,它是開(kāi)發(fā)多核處理器解決方案的先鋒廠(chǎng)商。該公司創(chuàng)新的MPPA架構(gòu)獨(dú)一無(wú)二地提供單芯片超算解決方案,其可以為視頻、網(wǎng)絡(luò)、電信、大數(shù)據(jù)等領(lǐng)域的云計(jì)算應(yīng)用實(shí)現(xiàn)實(shí)時(shí)加速,還可以為航空航天、國(guó)防、汽車(chē)等領(lǐng)域的嵌入式應(yīng)用提供嵌入式高性能運(yùn)算能力。Kalray公司的總部位于法國(guó),包括位于巴黎和歐洲硅谷格勒諾布爾市(Grenoble)兩個(gè)地點(diǎn)的辦公室,此外,其在美國(guó)加州和日本東京還設(shè)有分公司。
Kalray公司的完整解決方案包括MPPA系列多核處理器、PCIe Gen3加速卡、提供網(wǎng)絡(luò)加速支持的開(kāi)源網(wǎng)絡(luò)接口卡(Open NIC),以及軟件開(kāi)發(fā)工具包。該解決方案可以提供行業(yè)領(lǐng)先的低計(jì)算功耗,具有時(shí)間可預(yù)測(cè)性和低延遲性,以及獨(dú)一無(wú)二的處理擴(kuò)展性和系統(tǒng)密度,可以在同一塊片芯上實(shí)現(xiàn)多種異構(gòu)的應(yīng)用,同時(shí)擁有很好的可編程性(包括標(biāo)準(zhǔn)C/C++和OpenCL)。
MPPA多核處理器包括Andey MPPA和Bostan MPPA兩款產(chǎn)品。其中Andey為第一代MPPA處理器,已于2013年第1季度開(kāi)始供貨。它擁有超過(guò)256個(gè)可以進(jìn)行32位超長(zhǎng)指令字C/C++編程的內(nèi)核,單精度浮點(diǎn)運(yùn)算速度可以達(dá)到210 GFLOPS(每秒十億次浮點(diǎn)運(yùn)算),雙精度浮點(diǎn)運(yùn)算速度可達(dá)70 GFLOPS,運(yùn)算速度可達(dá)0.7 TOPS(每秒萬(wàn)億次運(yùn)算)。該處理器擁有兩塊帶寬為12.8GB/s的64位DDR3內(nèi)存,以及兩個(gè)由DMA支持的PCIe Gen3×8接口。Bostan為該公司即將推出的第二代MPPA處理器,目前已完成流片及樣片的封裝,將于2015年第4季度向先期客戶(hù)供貨。它的單精度浮點(diǎn)運(yùn)算速度可以達(dá)到840 GFLOPS,雙精度浮點(diǎn)運(yùn)算速度可達(dá)420 GFLOPS,運(yùn)算速度可達(dá)1.4 TOPS,其他性能相比Andey MPPA有較大幅度的提升。
MPPA多核處理器采用Kalray獨(dú)一無(wú)二的架構(gòu)設(shè)計(jì)。每個(gè)處理器芯片擁有4個(gè)四核主CPU和 16個(gè)計(jì)算集群,每個(gè)計(jì)算集群中又包括16個(gè)用戶(hù)核和1個(gè)系統(tǒng)核,每個(gè)用戶(hù)核則采用Kalray擁有專(zhuān)利的超長(zhǎng)指令字架構(gòu)進(jìn)行設(shè)計(jì)。同時(shí),其片上的DDR存儲(chǔ)器和以太網(wǎng)及PCIe接口模塊支持了數(shù)據(jù)的低延遲處理,并使芯片的整體功耗遠(yuǎn)遠(yuǎn)低于通用的多芯片組功耗,Andey MPPA處理器的典型功耗為12W,Bostan MPPA處理器的功耗為11W-30W。
Kalray公司獨(dú)一無(wú)二的處理器架構(gòu)
為了驗(yàn)證其MPPA處理器的高性能、低功耗特性,并推動(dòng)其芯片產(chǎn)品的商用化,Kalray推出了采用MPPA處理器的系列網(wǎng)絡(luò)卡。Kalray的PCIe Gen3加速卡包括TurboCard2和TurboCard3兩款產(chǎn)品。TurboCard2加載了4塊Andey MPPA芯片,浮點(diǎn)運(yùn)算速度可以達(dá)到0.9 TFLOPS(每秒萬(wàn)億次浮點(diǎn)運(yùn)算),存儲(chǔ)容量高達(dá)32GB,擁有8塊DDR3內(nèi)存(總帶寬達(dá)80GB/s),并配有C/C++ GNU編譯器環(huán)境。TurboCard3是TurboCard2的下一代產(chǎn)品,將于2015年底供貨,其加載了4塊Bostan MPPA芯片,浮點(diǎn)運(yùn)算速度可以達(dá)到3.4 TFLOPS。Kalray的開(kāi)源網(wǎng)絡(luò)接口卡ONIC80也將于2015年底開(kāi)始供貨,它是完全可編程的網(wǎng)卡,運(yùn)行Bostan MPPA芯片,擁有PCIe Gen3×16接口和8GB存儲(chǔ)容量,其大小與普通圖形加速單元類(lèi)似,功耗為40W,可以使數(shù)據(jù)中心變得更加緊湊和冷靜。
Kalray公司的PCIe Gen3加速卡TurboCard2
開(kāi)發(fā)工具體系是處理器生態(tài)體系中另一項(xiàng)非常重要的指標(biāo)。為了便于工程師針對(duì)不同的應(yīng)用開(kāi)發(fā)自己的超算解決方案,Kalray提供了方便易用、內(nèi)容豐富的軟件開(kāi)發(fā)工具包,包括標(biāo)準(zhǔn)C/C++編程環(huán)境,模擬器、編譯器、調(diào)試器和系統(tǒng)跟蹤,第三方實(shí)時(shí)操作系統(tǒng)(如Linux、風(fēng)河)和設(shè)備驅(qū)動(dòng)程序,面向CPU的基礎(chǔ)C編程和Lib編程,面向DSP的POSIX多線(xiàn)程編程,以及面向GPU的OpenCL編程??梢哉f(shuō),該軟件開(kāi)發(fā)工具包提供了眾多高性能應(yīng)用所需求的軟件,工程師不需要針對(duì)該系列處理器進(jìn)行大量重新學(xué)習(xí)就可以上手,并力求最大限度地發(fā)揮MPPA多核處理器的全部性能。
Kalray公司的軟件開(kāi)發(fā)工具包
目標(biāo)市場(chǎng):數(shù)據(jù)中心和關(guān)鍵任務(wù)型嵌入式應(yīng)用
通過(guò)上述對(duì)Kalray公司各種硬件產(chǎn)品性能的描述可以看出,它們能夠在很多對(duì)數(shù)據(jù)運(yùn)算和處理有高要求的應(yīng)用領(lǐng)域發(fā)揮重要作用,加上軟件開(kāi)發(fā)工具包提供的強(qiáng)力支持,其整體解決方案擁有非常廣闊的應(yīng)用空間。該公司的銷(xiāo)售和營(yíng)銷(xiāo)副總裁Jean-Pierre Demange向分析師介紹:“在數(shù)據(jù)中心的工作過(guò)程中,隨著大量應(yīng)用轉(zhuǎn)向云端,數(shù)據(jù)通信量的激增,以及新數(shù)據(jù)中心體系的進(jìn)一步虛擬化需求,開(kāi)始出現(xiàn)一種逐漸增長(zhǎng)的需求,即從主流處理器(x86)向高性能、低功耗、低延遲、完全可編程的協(xié)處理器進(jìn)行集中、實(shí)時(shí)卸載處理的需求。Kalray的處理器和PCI卡可以提供獨(dú)一無(wú)二的解決方案來(lái)幫助數(shù)據(jù)中心實(shí)現(xiàn)這一功能,主要應(yīng)用范圍包括智能網(wǎng)卡、智能存儲(chǔ)、運(yùn)算加速、視頻編碼等。”
“除數(shù)據(jù)中心外,我們的解決方案還有一個(gè)重要的目標(biāo)應(yīng)用市場(chǎng),那就是關(guān)鍵任務(wù)型嵌入式應(yīng)用。”Kalray公司的銷(xiāo)售和營(yíng)銷(xiāo)副總裁Jean-Pierre Demange繼續(xù)說(shuō)道。“關(guān)鍵任務(wù)型嵌入式應(yīng)用市場(chǎng)要求在固定的占板面積上提供越來(lái)越高的計(jì)算能力,以及在同一塊片芯上擁有越來(lái)越高的功能集成度,同時(shí)還要保留實(shí)時(shí)性支持和安全規(guī)范,而目前其他現(xiàn)有的多核架構(gòu)尚無(wú)法滿(mǎn)足這些規(guī)范和要求的認(rèn)證。Kalray是全球首家可以為關(guān)鍵任務(wù)型嵌入式應(yīng)用提供全認(rèn)證多核解決方案的公司,我們可以為航空航天、國(guó)防、自動(dòng)汽車(chē)、機(jī)器人和多軸飛行器等應(yīng)用領(lǐng)域提供支持。”
Kalray公司的銷(xiāo)售與營(yíng)銷(xiāo)副總裁Jean-Pierre Demange、首席執(zhí)行官Eric Baissus和商務(wù)總監(jiān)Stephane Cordova(從左至右)向華興萬(wàn)邦分析師展示其產(chǎn)品
目前,Kalray公司已對(duì)其后續(xù)產(chǎn)品進(jìn)行了合理的規(guī)劃,該公司的首席執(zhí)行官Eric Baissus介紹道:“我們正在對(duì)第三代MPPA多核處理器Coolidge制定技術(shù)規(guī)范,這款芯片的單精度浮點(diǎn)運(yùn)算速度預(yù)計(jì)將高于1200 GFLOPS,雙精度浮點(diǎn)運(yùn)算速度預(yù)計(jì)將高于600 GFLOPS,計(jì)劃2017年初生產(chǎn)樣片,2017年年內(nèi)實(shí)現(xiàn)量產(chǎn)。”此外,關(guān)于未來(lái)對(duì)中國(guó)市場(chǎng)的開(kāi)發(fā),Eric Baissus先生也表達(dá)了自己的觀點(diǎn):“目前,我們與中國(guó)企業(yè)的合作還較少,我們希望下一步能夠加強(qiáng)與中國(guó)市場(chǎng)的聯(lián)系,并愿意為中國(guó)的超算中心和高性能嵌入式應(yīng)用提供支持。”
c++相關(guān)文章:c++教程
評(píng)論