新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 美媒:拜登制裁反促中企不靠先進芯片推進AI

美媒:拜登制裁反促中企不靠先進芯片推進AI

作者: 時間:2023-05-10 來源:EEPW 收藏

美國迫使中國的科技業(yè)者研究變通辦法,在拿不到最新型美國芯片下繼續(xù)研發(fā)人工智能。使用軟件補強較低階芯片或?qū)⒍喾N低階芯片并聯(lián)的研究在中國越來越多。

本文引用地址:http://2s4d.com/article/202305/446378.htm

「華爾街日報」檢視論文和訪談相關企業(yè)人員發(fā)現(xiàn),包括華為、百度及阿里巴巴集團在內(nèi)的中企,正研究如何靠用較低階芯片或少用高階芯片下,仍能研發(fā)最先進人工智能的技術,也在研究如何整并不同類型芯片以免依賴任何單一硬件。

研究人員與分析師認為,靠這類變通辦法想追上美國領先群難度不低,然而一些研究顯示這種變通措施并非白工,若進展順利也許真能讓中國科技企業(yè)既挺過美方制裁,又增加對日后美方更多設限的免疫。

隨商業(yè)化ChatGPT這類的競賽加溫,全球各地的業(yè)者都需要功能更強大的芯片并盡量將功能發(fā)揮到極致,好降低AI研發(fā)的成本。

AI研究人員與產(chǎn)業(yè)分析師指出,對中國企業(yè)而言相關課題更為關鍵,因為美方制裁讓他們拿不到諸如(Nvidia)等公司所制的最,且在研發(fā)比肩ChatGPT這類AI時又快速消耗手上的美國芯片庫存。

繼美國商業(yè)部去年10月向中國供應芯片實施全面限制后,拜登政府已表明還會祭出進一步制裁。

中國業(yè)者已無法再取得業(yè)界研發(fā)AI時最愛用的A100芯片,以及今年3月發(fā)表的下一代、有更強運算能力的H100;為符合美國政府政策,提供中國的是降級版A800、H800,這兩種都削弱芯片本身與其他芯片的聯(lián)通能力。

雖然A800、H800對研發(fā)規(guī)模較小AI諸如TikTok短影音app的推薦演算是不錯的替代選項,卻扼殺規(guī)模較大型AI的研發(fā)。

瑞士銀行集團(UBS AG)分析部門估計,必須用上5000到1萬片A100芯片,才能鍛煉ChatGPT這種規(guī)模與等級的AI。據(jù)一個與中國政府關系密切的半導體產(chǎn)業(yè)協(xié)會近日于一場業(yè)界閉門會議公布的調(diào)查,中國只有區(qū)區(qū)4萬到5萬片A100。

經(jīng)營AI基礎設備公司的新加坡國立大學教授尤洋表示,許多中國企業(yè)現(xiàn)嘗試合并3或4片較低階芯片(含A800與H800),模擬1片最高階輝達芯片的效能。騰訊今年4月就公布一套新的運算集群:用一套H800并聯(lián)芯片組,進行大型AI模型訓練。

尤洋說變通方式代價不斐,因為若美企訓練大型語言運算模式需用1000片H100,中國企業(yè)就需3000片以上的H800達成類似效果。

尤洋指出,為此部分中企加速開發(fā)跨型號芯片訓練大型AI模型的技術。有論文顯示阿里巴巴、百度、華為都在研究整并英偉達的A100、上一代的V100與P100,以及華為的Ascends系列。

與此同時,中企也在尋求透過各種軟件技術來幫助訓練大型AI模型的運算強度,這種方法美國企業(yè)也有在做,然而中國業(yè)者在整合多種軟件技術方面更積極。

中國研究人員已取得進展。今年3月一篇論文顯示,華為研究人員展現(xiàn)如何用這類技術訓練自有的新一代大型語言模型,且只用自家Ascends芯片。盡管仍有一些瑕疵,華為的PanGu-Σ大模型在一些華語任務里已達成最高端性能表現(xiàn),包括閱讀理解和文法問題。

半導體研究與顧問公司SemiAnalysis首席分析師巴特爾(Dylan Patel)表示,在拿不到最新輝達H100芯片的情況下,中國研究人員的難關只會更高。H100含有額外的性能提升功能,尤其有助訓練類似ChatGPT的模型。

但去年百度公司與深圳鵬城實驗室一份論文顯示,研究人員正以無需H100額外提升功能的方式訓練大型語言模型。巴特爾說盡管研究還在初階,但看來有效。

巴特爾說:「若應證確有效果,他們就能有效躲過制裁?!?/p>



評論


相關推薦

技術專區(qū)

關閉