英特爾披露5nm“中國特供版”AI 芯片,性能或暴降92%,最快6月推出
關(guān)于英特爾Gaudi 3的“中國特供版” AI 芯片有了新進(jìn)展。
本文引用地址:http://2s4d.com/article/202404/457599.htm4月15日消息,芯片巨頭英特爾(Intel)日前在官網(wǎng)發(fā)布一份24頁的“Gaudi 3 AI加速器白皮書”中披露,英特爾將推出Gaudi 3在中國發(fā)售的兩款“特供版”AI 芯片產(chǎn)品。
英特爾Gaudi 3 AI芯片(圖片來源:Intel官網(wǎng))
具體包括兩種硬件形態(tài)加速卡:一款型號為HL-328的OAM兼容夾層卡(Mezzanine Card),預(yù)計將于今年6月24日推出;另一款是型號為HL-388的PCle加速卡,預(yù)計將于今年9月24日推出。而基于內(nèi)核數(shù)量、工作頻率、TDP等參數(shù)估算,相比Gaudi 3國際版,“中國特供版”HL-328芯片性能或降低約92%左右。
早前4月9日舉行的美國Intel Vision 2024會議上,英特爾發(fā)布新一代Gaudi 3 AI 加速芯片,采用臺積電5nm工藝,帶來4倍(400%)的BF16 AI計算能力提升。同時,相比英偉達(dá)H100 GPU,英特爾Gaudi 3 AI芯片的模型訓(xùn)練速度提升40%,推理速度提升50%,平均性能提高 50%,能效平均提高40%,但成本卻僅為H100的一小部分。
對于Gaudi 3中國特供版消息,鈦媒體App已向英特爾美國總部發(fā)送郵件詢問更多詳細(xì)信息,但截至發(fā)稿前,英特爾方面并未回復(fù)。
據(jù)悉,過去一段時間,美國政府不斷升級對華半導(dǎo)體、AI 芯片等領(lǐng)域的出口管制。
2022年8月9日,美國總統(tǒng)拜登簽署總額高達(dá)2800億美元的《芯片和科學(xué)法案》(以下簡稱“芯片法案”),通過527億美元的巨額產(chǎn)業(yè)補(bǔ)貼和遏制競爭的條款,推動芯片制造“回流”美國本土。該法案禁止獲得補(bǔ)貼的美國及其盟友伙伴的企業(yè)10年內(nèi)在中國和其他關(guān)切的國家新建或擴(kuò)大先進(jìn)制程芯片廠。
2022年10月7日、2023年10月17日,美國商務(wù)部工業(yè)和安全局(BIS)連續(xù)兩次發(fā)布對中國的先進(jìn)半導(dǎo)體和計算設(shè)備的出口管制,旨在阻止中國進(jìn)口 AI 半導(dǎo)體產(chǎn)品。同時,英偉達(dá)、AMD、英特爾的多款GPU和 AI 芯片產(chǎn)品已不能再出口到中國,就連高端游戲顯卡RTX 4090都受到了限制。
2023年12月,美國商務(wù)部BIS宣布啟動對成熟制程節(jié)點(diǎn)的半導(dǎo)體供應(yīng)鏈展開調(diào)查,劍指中國芯片半導(dǎo)體產(chǎn)業(yè)。
2024年3月29日,BIS更新出口限制措施,其中包括美國對中國出口的 AI 半導(dǎo)體產(chǎn)品將采取“逐案審查”(case-by-case review)政策規(guī)則,包括技術(shù)級別、客戶身份、合規(guī)計劃等信息全面查驗,以及部分 AI PC 芯片或納入到出口管制措施當(dāng)中,更大范圍限制英偉達(dá)、AMD等先進(jìn) AI 芯片和半導(dǎo)體設(shè)備向中國銷售,4月4日全面生效。
4月11日,美國商務(wù)部在“聯(lián)合公報”(Federal Register)上更新了最新的實體清單(Entity List),將6家中國企業(yè)列入“實體清單”,其中包括英偉達(dá)在中國的最大 AI 芯片經(jīng)銷商思騰合力(天津)科技有限公司(SITONHOLY (Tianjin) Co., Ltd.)。
事實上,在美國BIS第一輪出口管制下,早在2023年7月,英特爾就曾發(fā)布基于7nm制程的“中國特供版”AI芯片Gaudi2。相比國際版Gaudi2,面向中國市場推出的加速卡在性能上差別不大,而集成以太網(wǎng)RDMA端口數(shù)量從24個端口減到21個,以符合美國芯片出口管制規(guī)定。(詳見鈦媒體App前文:《英特爾發(fā)布中國特供版7nm AI芯片Gaudi2,減少RDMA接口以符合出口管制規(guī)定》)
然而,鈦媒體App了解到,英特爾Gaudi 2中國特供版僅銷售幾十張OAM產(chǎn)品。自去年BIS 1017新規(guī)更新后,由于英特爾Gaudi 2“中國特供版”產(chǎn)品性能高于出口管制措施,最終導(dǎo)致其產(chǎn)品再也沒能繼續(xù)銷往中國市場。
基于此,去年12月前后,英特爾曾嘗試研發(fā)Gaudi 2 HL-225B變體,內(nèi)部稱Gaudi 2C AI芯片,希望重新獲得銷往中國大陸的許可,但最后卻等到今年3月BIS公布更新出口限制措施。
4月10日發(fā)布Gaudi 3之后,英特爾重新研發(fā)特供版產(chǎn)品,希望讓5nm Gaudi 3 AI芯片未來全力爭奪中國市場,旨在為 AI 和云客戶提供英偉達(dá)產(chǎn)品的“替代選擇”。
具體硬件規(guī)格方面,中國特供版的Gaudi 3 與原版相比,具有相同的96MB SRAM片上內(nèi)存, 128GB HBM2e高帶寬內(nèi)存,帶寬為 3.7TB/s,擁有PCIe 5.0 x16 接口和解碼標(biāo)準(zhǔn)。但是,由于美國對于AI芯片的出口管制規(guī)則限制,使得這類高性能AI的綜合運(yùn)算性能(TPP)需要低于4800才能出口到中國, 這意味中國特供版的Gaudi 3 的16bit性能不能超過150 TFLOPS。
相比Gaudi 3 國際版達(dá)到的1835 TFLOPS(FP16/BF16),中國特供版Gaudi 3 需要大幅削減內(nèi)核數(shù)量和工作頻率,最終可能需要其AI性能降低約92%,才能符合美國的出口管制要求。
同時,由于中國特供版Gaudi 3產(chǎn)品的AI性能降低,這也將使得其TDP(熱設(shè)計功耗)大幅降低,預(yù)計OAM卡和PCIe卡的TDP均為450瓦,而原版PCIe卡(HL-338)的TDP高達(dá)600瓦,原版OAM卡(HL-325L、HL-335)的TDP更是高達(dá)900瓦。
整體來說,英特爾專為中國市場推出的“特供版”Gaudi 3兩款產(chǎn)品的 AI 性能,或?qū)⑴c英偉達(dá)“中國特供版”AI 加速卡H20水平相當(dāng),后者比H100的整體性能降低80%左右,達(dá)148 TFLOPS的FP16/BF16性能,略低于出口管制的150 TFLOPS的限制。
目前,英偉達(dá)H20 AI芯片已經(jīng)向中國大陸客戶送樣,但國內(nèi)百度、阿里等 AI 龍頭對其反響平平。有行業(yè)人士對鈦媒體App表示,主要原因是H20性能太低、價格太高,企業(yè)購買意愿降低了。
美國商務(wù)部長雷蒙多(Gina Raimondo)早前在一場公開論壇中表示,美國絕不能讓中國得到這些最尖端的芯片,絕不能讓中國芯片技術(shù)趕超美國。美國政府不允許英偉達(dá)向中國出售“最復(fù)雜、處理能力最高”的 AI 芯片,以防中國有能力訓(xùn)練前沿 AI 模型。
此外,有消息稱,美國政府還正在制定一份禁止接收關(guān)鍵工具的中國先進(jìn)芯片制造工廠名單,以便美國企業(yè)更容易阻止技術(shù)流入中國,這份名單可能會在未來幾個月內(nèi)公布。同時,美國正向包括荷蘭、日本、德國和韓國在內(nèi)的盟友施壓加碼,要求它們進(jìn)一步收緊對中國獲得半導(dǎo)體技術(shù)的限制措施。
針對于美方行動,外交部發(fā)言人毛寧在4月11日表示,“我們堅決反對美方濫用實體清單等出口管制工具遏制打壓中國企業(yè),敦促美方停止將經(jīng)貿(mào)科技問題政治化、工具化、武器化。中方將采取必要措施堅決維護(hù)中國企業(yè)的合法權(quán)益?!?/p>
評論