新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 編輯觀點(diǎn) > OpenAI裝都不裝了,提案要求禁用DeepSeek

OpenAI裝都不裝了,提案要求禁用DeepSeek

作者:陳玲麗 時(shí)間:2025-03-20 來(lái)源:電子產(chǎn)品世界 收藏

中國(guó)大模型公司杭州深度求索(DeepSeek)發(fā)布的開(kāi)源模型DeepSeek-R1如同一股颶風(fēng),在市場(chǎng)掀起巨浪。DeepSeek之所以火爆科技圈,關(guān)鍵在于其只需要使用比-o1低90%至95%的API調(diào)用成本,就可以在數(shù)學(xué)、編程和推理等關(guān)鍵領(lǐng)域達(dá)到與-o1相媲美的表現(xiàn)。

本文引用地址:http://2s4d.com/article/202503/468386.htm

640.jpeg

彭博社這樣描述DeepSeek-R1模型引起的轟動(dòng)效應(yīng):“這一潛在威脅動(dòng)搖了美國(guó)科技公司的行業(yè)領(lǐng)先地位,導(dǎo)致與相關(guān)的科技股大跌,包括微軟、英偉達(dá)、甲骨文以及谷歌母公司Alphabet?!苯刂?月27日,這些公司的市值合計(jì)蒸發(fā)近1萬(wàn)億美元。

DeepSeek打破刻板印象

2024年12月26日,DeepSeek-V3首個(gè)版本上線并同步開(kāi)源,總參數(shù)達(dá)6710億,采用創(chuàng)新的MoE(Mixture of Experts,混合專家)架構(gòu)和FP8混合精度訓(xùn)練,公布了長(zhǎng)達(dá)53頁(yè)的訓(xùn)練和技術(shù)細(xì)節(jié);2025年1月20日,新一代推理模型型DeepSeek-R1發(fā)布,部分性能與的GPT-4o正式版持平。近期,DeepSeek也發(fā)布了圖像模型Janus pro,但是效果一般,在多模態(tài)的領(lǐng)域,開(kāi)源還有更長(zhǎng)的路要走。

DeepSeek-R1的開(kāi)源及其后續(xù)的商業(yè)化部署,引起了全球用戶和開(kāi)發(fā)者的廣泛關(guān)注,尤其是在資本市場(chǎng)上的影響力不容小覷。從技術(shù)路徑來(lái)看,DeepSeek最大的優(yōu)勢(shì)在于,通過(guò)算法優(yōu)化和資源調(diào)配,減少了大語(yǔ)言模型(LLM)預(yù)訓(xùn)練的時(shí)間。作為一個(gè)預(yù)訓(xùn)練模型,它在某些重要任務(wù)上的表現(xiàn)已經(jīng)接近美國(guó)最先進(jìn)的模型,同時(shí)顯著降低了訓(xùn)練成本。

DeepSeek團(tuán)隊(duì)通過(guò)一系列令人印象深刻的創(chuàng)新實(shí)現(xiàn)了這一突破,主要集中在提升工程效率方面 —— 在「鍵值緩存」(Key-Value cache)管理方面做出了特別創(chuàng)新的改進(jìn),并且將MoE方法推進(jìn)到了前所未有的水平。

在DeepSeek發(fā)表的原始報(bào)告中有詳細(xì)解釋這筆成本的計(jì)算:在預(yù)訓(xùn)練階段,每兆個(gè)token上訓(xùn)練DeepSeek-V3僅需要180K H800 GPU小時(shí),也就是說(shuō)在擁有2048個(gè)H800 GPU的叢集上需要3.7天。因此,預(yù)訓(xùn)練階段在不到兩個(gè)月的時(shí)間內(nèi)完成,耗費(fèi)2664K GPU小時(shí)。加上上下文長(zhǎng)度擴(kuò)充所需的119K GPU小時(shí)和后制訓(xùn)練所需的5K GPU小時(shí),DeepSeek-V3的完整訓(xùn)練僅需2.788M GPU小時(shí)。假設(shè)H800 GPU的租賃價(jià)格為每GPU小時(shí)2美元,總訓(xùn)練成本僅為557.6萬(wàn)美元。而GPT-4o的約為1億美元,使用25000個(gè)GPU芯片。

推理成本上,OpenAI o1每百萬(wàn)輸入和百萬(wàn)輸出token分別收取15美元和60美元,而DeepSeek R1同樣輸入與輸出的價(jià)格分別只要0.55美元和2.19美元,差不多只是前者的3%。

640-2.jpeg

不論是OpenAI還是其他頭部AI廠商都走的是“大力出奇跡”路線,即通過(guò)堆大量來(lái)訓(xùn)練大模型推理能力,但DeepSeek用有限的資源走了一條適合國(guó)內(nèi)的路。與其討論DeepSeek能否成為“中國(guó)版”的OpenAI,不如說(shuō)DeepSeek其實(shí)挑戰(zhàn)了OpenAI的模式,畢竟OpenAI也并不一定是大模型的終局。

國(guó)外獨(dú)立評(píng)測(cè)機(jī)構(gòu)Artificial Analysis測(cè)試了DeepSeek-V3后得出的結(jié)論:DeepSeek-V3超越了迄今為止所有開(kāi)源模型。需要注意的是,對(duì)比Android與iOS的生態(tài)隔離,開(kāi)源與閉源大模型均基于Transformer架構(gòu),差異是在數(shù)據(jù)、算法運(yùn)用、工程等維度,并非是截然不同的技術(shù)路線。

DeepSeek不僅提升了國(guó)內(nèi)AI技術(shù)的整體水平,還幫助開(kāi)發(fā)者和中小型大模型創(chuàng)業(yè)公司完成了AI市場(chǎng)教育。目前,DeepSeek-R1、V3、Coder等系列模型已正式上線國(guó)家超算互聯(lián)網(wǎng)平臺(tái),這標(biāo)志著DeepSeek正式進(jìn)入“國(guó)家隊(duì)”,同時(shí)也代表著一個(gè)基于國(guó)產(chǎn)深算智能加速卡的普惠、可靠AI大模型時(shí)代的到來(lái)。

OpenAI提案要求禁用DeepSeek

OpenAI首席執(zhí)行官Sam Altman在社交平臺(tái)X上表示,“DeepSeek的R1是一款令人印象深刻的模型,尤其是考慮到它們能夠以這個(gè)價(jià)格提供的功能”。OpenAI在DeepSeek-R1模型發(fā)布后,為了維持其在AI領(lǐng)域的領(lǐng)先地位,迅速發(fā)布了推理模型o3-mini,支持low、medium和high三種推理難度。另外,DeepSeek的崛起迫使OpenAI加速推出免費(fèi)的搜索引擎功能以應(yīng)對(duì)競(jìng)爭(zhēng),2025年2月6日,OpenAI宣布向所有用戶開(kāi)放ChatGPT搜索功能,并且無(wú)需注冊(cè)即可使用。

而隨后2025年3月13日,OpenAI全球事務(wù)副總裁Christopher Lehane向白宮科學(xué)技術(shù)政策辦公室(OSTP)提交了一份長(zhǎng)達(dá)15頁(yè)的政策建議報(bào)告,DeepSeek在報(bào)告中被點(diǎn)名15次。Christopher Lehane表示”盡管美國(guó)目前在人工智能領(lǐng)域保持領(lǐng)先,但DeepSeek表明我們的領(lǐng)先優(yōu)勢(shì)并不大,而且正在縮小”,同時(shí),聲稱在關(guān)鍵基礎(chǔ)設(shè)施和其他高風(fēng)險(xiǎn)應(yīng)用中使用DeepSeek會(huì)「帶來(lái)重大風(fēng)險(xiǎn)」,要求美國(guó)政府采取行動(dòng)。

640-3.jpeg

OpenAI指控DeepSeek存在技術(shù)安全缺陷,R1模型架構(gòu)“可能導(dǎo)致敏感任務(wù)失控”,威脅美國(guó)關(guān)鍵基礎(chǔ)設(shè)施。報(bào)告特別提及歐洲金融機(jī)構(gòu)(如匯豐銀行)測(cè)試DeepSeek模型,警示盟友技術(shù)依賴轉(zhuǎn)移風(fēng)險(xiǎn),呼吁加強(qiáng)「民主AI供應(yīng)鏈」審查。

提案中,強(qiáng)調(diào)當(dāng)前美國(guó)面臨來(lái)自中國(guó)AI技術(shù)的“系統(tǒng)性挑戰(zhàn)”,建議參考拜登政府的出口規(guī)則,采取分級(jí)制度:第一級(jí)(Tier I)是“致力于民主人工智能原則的國(guó)家”,包括美國(guó)盟友,完全遵循美國(guó)技術(shù)標(biāo)準(zhǔn),可以享受補(bǔ)貼與市場(chǎng)準(zhǔn)入,但不能使用中國(guó)生產(chǎn)的設(shè)備以及“侵犯用戶隱私并存在知識(shí)產(chǎn)權(quán)盜竊等安全風(fēng)險(xiǎn)的人工智能模型”;第二級(jí)(Tier II)是沒(méi)能阻止受出口管制的芯片被轉(zhuǎn)移到“第三級(jí)國(guó)家”的國(guó)家,需承諾安全審查后可升級(jí)至Tier I;第三級(jí)(Tier III)則是中國(guó)等國(guó)家,嚴(yán)格限制AI技術(shù)出口。

OpenAI這封信函實(shí)際上是響應(yīng)《人工智能行動(dòng)計(jì)劃》的一份提案,今年2月美國(guó)政府為制定新的AI政策向外界公開(kāi)征求意見(jiàn)。今年1月,特朗普政府直接撤銷(xiāo)了先前美國(guó)的AI行政命令《安全、可靠和值得信賴的人工智能開(kāi)發(fā)與使用》,轉(zhuǎn)而迅速簽署了一項(xiàng)全新《人工智能行動(dòng)計(jì)劃》,要求在短短180天內(nèi)提交一份AI行動(dòng)計(jì)劃,直言“美國(guó)矢志維持并鞏固其在全球人工智能領(lǐng)域的霸主地位”。

美國(guó)國(guó)會(huì)、海軍、五角大樓、NASA等政府機(jī)構(gòu)和部門(mén)已經(jīng)紛紛對(duì)DeepSeek下達(dá)了禁令,甚至在今年1月29日發(fā)布《2025年美國(guó)人工智能能力與中國(guó)脫鉤法案》(Decoupling America’s Artificial Intelligence Capabilities from China Act of 2025)禁止美國(guó)人協(xié)助中國(guó)推動(dòng)AI,并禁止美國(guó)人下載或使用DeepSeek,否則將被定性為犯罪,最高可判處20年監(jiān)禁及處以100萬(wàn)美元的罰款。彭博報(bào)道,已有數(shù)百家美國(guó)公司,尤其是與政府相關(guān)的企業(yè),都已經(jīng)屏蔽了DeepSeek。

曾幾何時(shí),OpenAI堪稱開(kāi)源界的先鋒,從GPT-3開(kāi)始,畫(huà)風(fēng)突變,毅然筑起閉源的高墻,通過(guò)API訂閱制賺得是盆滿缽滿,全然不顧曾經(jīng)的開(kāi)源初心。

OpenAI裝都不裝了

OpenAI提案中同時(shí)還呼吁美國(guó)聯(lián)邦政府應(yīng)該幫助AI公司免受日益嚴(yán)苛的州級(jí)AI法規(guī)的影響,借機(jī)提出了真正的核心議題 —— 聯(lián)邦與州法規(guī)的博弈、版權(quán)數(shù)據(jù)使用的合法性爭(zhēng)議。

想要獲得州級(jí)法規(guī)豁免權(quán)

OpenAI建議建立一個(gè)范圍明確的框架,促成聯(lián)邦政府與私營(yíng)公司之間的自愿合作,在適當(dāng)?shù)那闆r下政府能夠從企業(yè)獲得經(jīng)驗(yàn)和資源,而作為交換,私營(yíng)公司則能免受今年美國(guó)各州已經(jīng)提出的781項(xiàng)與AI相關(guān)提案的影響。美國(guó)人工智能安全研究院(US AI Safety Institute)可以充當(dāng)聯(lián)邦政府與私營(yíng)公司之間的主要政府機(jī)構(gòu),“企業(yè)不必受到各州法規(guī)的約束,因?yàn)楹笳唢@然遠(yuǎn)不及聯(lián)邦層面的監(jiān)管完善”。如果企業(yè)自愿與該機(jī)構(gòu)合作,允許其對(duì)自家模型進(jìn)行審查,政府就應(yīng)該向它們提供“包括免除州級(jí)法規(guī)在內(nèi)的責(zé)任保護(hù)”,尤其是在涉及前沿模型安全法規(guī)上。

OpenAI警告若美國(guó)不豁免AI公司州級(jí)法規(guī)束縛,否則在數(shù)據(jù)獲取受限下,美國(guó)技術(shù)優(yōu)勢(shì)將迅速消失,中國(guó)將贏得AI競(jìng)賽。政府應(yīng)鼓勵(lì)公私合作,加速AI在政府機(jī)構(gòu)中的應(yīng)用,并消除已知的障礙,包括過(guò)時(shí)且冗長(zhǎng)的認(rèn)證流程、限制性測(cè)試權(quán)限、缺乏靈活性的采購(gòu)渠道。

想要進(jìn)行版權(quán)改革

已經(jīng)有包括OpenAI在內(nèi)的多家公司,因訓(xùn)練模型的數(shù)據(jù)而面臨多起版權(quán)起訴。對(duì)于此前引起巨大爭(zhēng)議的版權(quán)問(wèn)題,OpenAI也強(qiáng)調(diào)應(yīng)該對(duì)此進(jìn)行版權(quán)改革 —— 這是因?yàn)椤负侠硎褂迷瓌t」(fair use doctrine)對(duì)維持AI領(lǐng)域的領(lǐng)先地位至關(guān)重要。

版權(quán)法在美國(guó)早期技術(shù)進(jìn)步的階段發(fā)揮了重要作用。美國(guó)擁有眾多AI初創(chuàng)公司,吸引大量投資,并在研究方面取得諸多突破,主要也是得益于合理使用原則。OpenAI主張強(qiáng)化合理使用原則,允許被允許自由使用版權(quán)材料訓(xùn)練模型,同時(shí)推動(dòng)國(guó)際版權(quán)規(guī)則改革,防止中國(guó)通過(guò)“寬松監(jiān)管”獲取數(shù)據(jù)優(yōu)勢(shì)。針對(duì)創(chuàng)作者群體的抗議,OpenAI反擊稱,歐盟的嚴(yán)格版權(quán)法已壓制了AI創(chuàng)新。報(bào)告同時(shí)建議美國(guó)政府向企業(yè)開(kāi)放醫(yī)療等敏感數(shù)據(jù),以加速AI研發(fā)。

硅谷風(fēng)險(xiǎn)投資機(jī)構(gòu)Andreessen Horowitz認(rèn)為,聯(lián)邦豁免權(quán)可釋放企業(yè)創(chuàng)新潛力,避免“監(jiān)管碎片化”拖累競(jìng)爭(zhēng)。而MIT技術(shù)政策教授Daron Acemoglu批評(píng)OpenAI試圖“用政治手段掩蓋技術(shù)焦慮”,其出口管制將分裂全球科技共同體。

科技霸權(quán)or科技平權(quán)

其實(shí),OpenAI早就盯上了DeepSeek。今年1月,OpenAI就曾公開(kāi)指控DeepSeek通過(guò)「模型蒸餾」(Model Distillation)技術(shù)“違規(guī)復(fù)制”其產(chǎn)品功能,然而,OpenAI卻拒絕透露具體技術(shù)細(xì)節(jié)或法律依據(jù)。模型蒸餾是一種通過(guò)訓(xùn)練小型模型模仿大型模型行為的技術(shù),廣泛應(yīng)用于提高AI效率與降低成本,模型蒸餾本身是公開(kāi)技術(shù),但若涉及直接復(fù)制專有模型的輸出結(jié)構(gòu)或參數(shù),可能構(gòu)成侵權(quán),但是模型輸出的“功能相似性”難以直接構(gòu)成侵權(quán)。

除非能證明DeepSeek直接竊取了OpenAI的訓(xùn)練數(shù)據(jù)或代碼架構(gòu),否則訴訟可能無(wú)果而終,若指控屬實(shí),OpenAI應(yīng)公開(kāi)技術(shù)比對(duì)報(bào)告;若僅是戰(zhàn)略打壓,則可能損害行業(yè)創(chuàng)新生態(tài)。OpenAI與DeepSeek的爭(zhēng)端,折射出全球AI產(chǎn)業(yè)從技術(shù)競(jìng)爭(zhēng)向規(guī)則競(jìng)爭(zhēng)演變的趨勢(shì)。無(wú)論是模型蒸餾的法律定性,還是數(shù)據(jù)隱私的合規(guī)要求,都可能成為影響市場(chǎng)格局的關(guān)鍵變量。

640-4.jpeg

即便美國(guó)可以封殺掉DeepSeek的手機(jī)、網(wǎng)頁(yè)端的應(yīng)用,但DeepSeek的大模型、思路和代碼都已經(jīng)融入了全世界的人工智能社區(qū),被包括美國(guó)在內(nèi)的程序人員廣泛使用。Meta首席科學(xué)家楊立昆(Yann LeCun)則直指,硅谷部分人擁有一種“錯(cuò)位的優(yōu)越感”。OpenAI現(xiàn)在應(yīng)該做的是調(diào)整自己的產(chǎn)品而不是攻擊中國(guó)AI,進(jìn)行毫無(wú)依據(jù)的污蔑和無(wú)理打壓。

由于DeepSeek這次的開(kāi)源,讓行業(yè)最領(lǐng)先的水平平權(quán)了,寡頭所謂的“AI霸權(quán)”開(kāi)始動(dòng)搖,AI競(jìng)賽的勝利者,不只能是擁有最多芯片的一方。這讓OpenAI重新思考,需要“弄清楚另一種開(kāi)源戰(zhàn)略”,也是AI普惠的開(kāi)端,會(huì)加速推動(dòng)AI進(jìn)化的速度,進(jìn)而推動(dòng)必要條件的成熟,帶來(lái)新的應(yīng)用機(jī)會(huì)。

DeepSeek以較低的成本開(kāi)發(fā)出了一個(gè)性能接近美國(guó)模型水平的產(chǎn)品,這次的特殊之處在于,首先展示預(yù)期成本降低的是一家中國(guó)公司。這種情況前所未有,具有重要的地緣政治意義。需要注意的是,中國(guó)AI的崛起在基礎(chǔ)層仍需突破芯片、算法等瓶頸的現(xiàn)狀下,通過(guò)系統(tǒng)工程優(yōu)化實(shí)現(xiàn)"換道超車(chē)"不僅可能,更是必然選擇。

實(shí)際上,這是一場(chǎng)關(guān)于技術(shù)霸權(quán)爭(zhēng)奪、地緣政治博弈與全球AI產(chǎn)業(yè)格局重塑的縮影。在DeepSeek之前,曾經(jīng)AI技術(shù)被認(rèn)為是高不可攀的“貴族科技”,只有少數(shù)巨頭才能玩得起,OpenAI、微軟、谷歌、Meta就像矗立在AI領(lǐng)域的高山。但這一次,DeepSeek把AI從壟斷中解放出來(lái),重構(gòu)了全球AI競(jìng)爭(zhēng)的邏輯:從依賴資本與硬件的“軍備競(jìng)賽”,轉(zhuǎn)向算法優(yōu)化與生態(tài)協(xié)作的“效率革命”。

DeepSeek-V3極低的訓(xùn)練成本預(yù)示著AI大模型對(duì)算力投入的需求將大幅下降,但由經(jīng)濟(jì)學(xué)家威廉·斯坦利·杰文斯提出的杰文斯悖論:當(dāng)某種資源的使用效率提高、獲取變得更容易時(shí),其總體使用量往往不減反增。DeepSeek的發(fā)展也呈現(xiàn)出類(lèi)似的趨勢(shì):算力效率的提升并未減少對(duì)算力的需求,反而推動(dòng)了更多高算力應(yīng)用的落地,使得行業(yè)對(duì)算力的需求持續(xù)增長(zhǎng)。

報(bào)告顯示,2025年微軟、亞馬遜以及Meta等“超大規(guī)模企業(yè)”在人工智能數(shù)據(jù)中心和算力資源方面的投資將達(dá)到3710億美元,較上年增長(zhǎng)44%。這一數(shù)字將在2032年攀升至5250億美元,增速超過(guò)DeepSeek這一現(xiàn)象級(jí)產(chǎn)品爆火之前的研究預(yù)期。

此前,人工智能方面的投資主要流向用于訓(xùn)練或開(kāi)發(fā)大規(guī)模新AI模型的數(shù)據(jù)中心和芯片。如今,科技巨頭將投資重點(diǎn)轉(zhuǎn)向“推理”環(huán)節(jié),也就是模型訓(xùn)練完成后運(yùn)行并產(chǎn)出結(jié)果的過(guò)程。彭博行業(yè)研究分析師Mandeep Singh在報(bào)告中稱,對(duì)DeepSeek的空前關(guān)注很可能會(huì)促使科技公司“追加投資推理環(huán)節(jié)”,使其成為生成式人工智能市場(chǎng)上增長(zhǎng)最快的板塊。



關(guān)鍵詞: OpenAI Deepseek 算力 AI

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉