熱門芯片亮點
別讓芯片過熱
8月14~16日,在Stanford大學召開的為期三天的第17屆熱門芯片展(Hot Chips 17)落下了帷幕?;仡櫛緦谜褂[,展品范圍廣泛,從科研前沿到流行商用芯片應有盡有,本文很難面面俱到(可瀏覽www. hotchips.org/hc17),僅就當前的亮點作一概覽。
今年的熱門芯片展上展出了IBM的游戲機控制臺,并進一步披露Cell處理器的結構,微軟談了Xbox360系統(tǒng)的某些的細節(jié),Toshiba介紹了為PlayStation 3配套的超級I/O芯片,還有IBM關于其寄存器的數(shù)據(jù)操作細節(jié)、器件連接總線和編程模塊等展項。
會展程序的安排反映了當前研發(fā)的主體,正轉向可配置邏輯和渾然不于傳統(tǒng)馮尼曼主流結構的處理器。Telairity, Philips, Cradle和Tensilica (軟核IP)等公司研制出各有自己獨特解決方法的媒體處理器。
在前沿技術方面,Luxtera令聽眾第一次窺見用調(diào)制激光所生產(chǎn)的硅片結構。環(huán)形調(diào)制器生成的半徑為30_m的硅結構準備用于生產(chǎn)可微調(diào)的光學濾波器。
另一個非??岬男录夹g是用超導和Josephson結研制的40GHz的高頻邏輯開關,用于控制無損耗超導中傳送的量子脈沖信號。其極終目標是要制造超帶寬的微型控制器件。雖然這項技術今天還正在開發(fā)之中,但是感到美中不足的是,為保持超導所需的7K低溫,所需制冷設備太過笨重。
離不開摩爾定律
Intel技術與生產(chǎn)部總經(jīng)理Bill Holt回顧Intel半導體技術發(fā)展的歷程時說,Intel持續(xù)地保持著大約每兩年微電子技術前進一個階梯的速度,印證了摩爾定律的正確。而且預計最近若干年內(nèi)還會出現(xiàn)幾次這種微電子技術的階躍。
Holt指出當前微電子的生產(chǎn)技術向多核結構轉移,其背后的秘密與降低硅片的功耗密度有關。雙核處理器使每個核的工作電壓與頻率降低,而管芯面積翻番。于是,原來集中在單核管芯的功耗不僅得以降低并且還被分散于倍增的面積之上。
改變特定電路的設計也能降低局部的熱力集中。將電路分成兩個半速的功能塊,可以降低每個功能塊的峰值功率,且將功耗分散于較大面積的管芯之上。代價是需用雙倍的晶體管和較大的管芯面積。如果使用90nm或更先進的工藝,將大量的晶體管集成于相對較小硅面積的余地越大。
Intel沒有走大力降低功能塊功率的道路,而是繞過去對時鐘電路加以控制??墒菍r鐘電路的控制并不能改變晶體管的靜態(tài)漏電流。為切斷漏電流需增加“睡眠”晶體管,像高速緩存器那樣集中地切斷大型晶體管的電源線和底線。但是它們的再次上電,需要增加一個以上的額外時鐘周期。Holt說,這項技術已用于整塊的高速緩存。那里需要更多的時鐘周期,然而切斷電源的時間往往是數(shù)倍于此時間的。
增加額外時鐘周期的主要原因是因連線的RC延遲。改進連線結構使電路靠得更近,改進管芯集成策略將硅層3維疊置。這種將同樣的管芯上下疊置,可能是制造多核處理器和相應SoC的更好更快的途徑。這種想法與Sun公司的臨近連接的研究課題有些相近。
Xbox360結構設計
微軟對即將面世的Xbox360游戲控制臺系統(tǒng)作了進一步介紹,并在一臺Xbox360的開發(fā)系統(tǒng)上進行演示。微軟是在多核策略的基礎上構建Xbox360的。微軟表示其設計目標:旨在向游戲程序的開發(fā)者提供一個強大而價格又是可接受的平臺。功能強大的3核處理器是一個便于開發(fā)的對稱多處理器方案,微軟使用OpenMP實現(xiàn)線程API。3核處理器附有1MB的 L2 高速緩存和總數(shù)為1.65億只晶體管。
Xbox360 有512MB統(tǒng)一的DDR3 DRAM 存儲器,連接到圖形處理單元(GPU) (見圖1)。它不同于Sony的PlayStation 3 游戲站的設計。Sony的設計中,存儲器是分散于多核處理器和GPU之間的。分散存儲器的好處是各有自己專用帶寬的存儲器,但缺點是封裝的引腳多、硅片集成度低、存儲器劃分固定和高價位。而統(tǒng)一存儲器的好處是,可以按需要在處理器之間重新劃分,但是,在設計Xbox360時必須考慮到處理器與主存儲器之間的較長延時,應采取措施進行補償。
Xbox360使用了一種技術使每個CPU核的數(shù)據(jù)流只進入自己的數(shù)據(jù)緩沖L1,避免多次出入高速緩存L2,攪亂那里的正常數(shù)據(jù)流 (見圖2)。每個CPU核處理結束后的流才送到3核共用的L2 。GPU使用IBM設計的高速點-點連接,直接從3核共用的L2取到正確的數(shù)據(jù)流。采用這樣的流數(shù)據(jù)編程模式,使程序員能以最少的讀和寫數(shù)來節(jié)約存儲器的帶寬。
每個CPU核模塊將圖形/文字的數(shù)據(jù)流送到L1 數(shù)據(jù)高速緩存,經(jīng)整理后再送入共用的1MB L2高速緩存。 GPU 直接從L2 獲得數(shù)據(jù)流,免除多余的對DRAM主存的讀/寫
所有CPU核所用的高速緩存的位寬為128b。 L2高速緩存具有靈活的指令集能對確定的指令與數(shù)據(jù)加鎖,如微軟設計的VMX SIMD單元有專門擴展的指令。它包括有點積和支持同GPU相共享的Direct3D API 數(shù)據(jù)格式。今年10月由In-Stat《微處理器報告》主辦的“秋季處理器論壇”上,對于Xbox360 還會有進一步的介紹。
ATI所設計的GPU (見圖3)具有48個并行的工作于500MHz的統(tǒng)一分色器核。每個核均支持32位的IEEE浮點運算。它是對每條指令都能進行向量、標量、和紋理運算的超標量結構,每秒鐘能執(zhí)行240億次分色器指令。其他可列出的峰值技術規(guī)范還有:全速時的每秒40億次的像素運算、每秒80億次的雙向線性采樣率、以及每秒5億次的有關于三角形的幾何運算。
著眼于效率,CPU核可以工作于GPU的從機模式。為了及時提交3D圖像,必須使圖像跟上視頻刷新的時間要求,經(jīng)常需運行于最高優(yōu)先級,各CPU核應竭盡全力保證所提供的流水線能夠避免出現(xiàn)不自然的人為痕跡(如不完整的紋理組織)和屏幕更新的呆滯,總之,不允許干擾畫面的真實感和游戲的沉迷感。
Xbox360芯片要在不同的90nm工廠生產(chǎn)。微軟希望以后能把管芯的尺寸縮小,并移植到下一代生產(chǎn)工藝的流水線上去生產(chǎn),從而降低游戲機控制臺的價格。
并非事必“多核”
盡管Intel對于多核處理器和Xbox360作過許多正面的宣傳,外界也有許多將多核處理器用于家用PC、游戲控制臺、和其它消費設備的多種設想,然而,也有一種聲音在說:皇帝沒穿衣服!對熱點芯片發(fā)表這樣基調(diào)的,有Nvidia公司的主要科學家David Kirk,他指出,今天尚缺乏能有效使用多核處理器的內(nèi)容(如游戲的節(jié)目)!幾乎同時,John Carmack——Id軟件公司的合伙創(chuàng)立人、技術主任和編程老鳥,在一次有關計算機游戲的聚會時談到,用現(xiàn)行的軟件方法和工具要想使多線程游戲程序正確地工作是很困難的。還指出,對于PC,除去應用代碼問題之外,驅(qū)動程序也得改進。一般來說,編寫常規(guī)的串序執(zhí)行程序,游戲程序的編程人員需要花費多年時間才能對一種處理器體現(xiàn)出優(yōu)化。將代碼拆分成多核執(zhí)行的形式,又得重新進行優(yōu)化,它們都需要時間和重新加以研究和探討。
多線程編碼的部分問題還在于,現(xiàn)在最常用的語言對于揭示出并行性的能力很弱。Kirk也相信,對此問題,目前還沒有足夠的主流研究和教育部門的關注。超級計算機界的研究者和專業(yè)軟件界的編程者可能都不會同意這種多核的主張,因為尚無多線程方面的擴展研究;再者,多線程也未形成主流研究課題。誠然,多核PC和游戲控制臺將來會促使多線程編碼成為一個主流研究課題。
上述問題會獲得解決的一個信號,是Intel, Microsoft, 和Cell計算機的伙伴(IBM/Sony) 提供了多核處理器的改良軟件工具。當程序人員學會如何有效使用多核技巧的時候,相信抱怨定會減少。(摘自美國Microprocessor Report,梁合慶譯)
評論