OpenAI裝都不裝了，提案要求禁用DeepSeek

作者：陳玲麗時間：2025-03-20 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

中國大模型公司杭州深度求索（DeepSeek）發(fā)布的開源模型DeepSeek-R1如同一股颶風(fēng)，在市場掀起巨浪。DeepSeek之所以火爆科技圈，關(guān)鍵在于其只需要使用比OpenAI-o1低90%至95%的API調(diào)用成本，就可以在數(shù)學(xué)、編程和推理等關(guān)鍵領(lǐng)域達(dá)到與OpenAI-o1相媲美的表現(xiàn)。

本文引用地址：http://2s4d.com/article/202503/468386.htm

彭博社這樣描述DeepSeek-R1模型引起的轟動效應(yīng)：“這一潛在威脅動搖了美國科技公司的行業(yè)領(lǐng)先地位，導(dǎo)致與AI相關(guān)的科技股大跌，包括微軟、英偉達(dá)、甲骨文以及谷歌母公司Alphabet?！苯刂?月27日，這些公司的市值合計蒸發(fā)近1萬億美元。

DeepSeek打破刻板印象

2024年12月26日，DeepSeek-V3首個版本上線并同步開源，總參數(shù)達(dá)6710億，采用創(chuàng)新的MoE（Mixture of Experts，混合專家）架構(gòu)和FP8混合精度訓(xùn)練，公布了長達(dá)53頁的訓(xùn)練和技術(shù)細(xì)節(jié)；2025年1月20日，新一代推理模型型DeepSeek-R1發(fā)布，部分性能與OpenAI的GPT-4o正式版持平。近期，DeepSeek也發(fā)布了圖像模型Janus pro，但是效果一般，在多模態(tài)的領(lǐng)域，開源還有更長的路要走。

DeepSeek-R1的開源及其后續(xù)的商業(yè)化部署，引起了全球用戶和開發(fā)者的廣泛關(guān)注，尤其是在資本市場上的影響力不容小覷。從技術(shù)路徑來看，DeepSeek最大的優(yōu)勢在于，通過算法優(yōu)化和資源調(diào)配，減少了大語言模型（LLM）預(yù)訓(xùn)練的時間。作為一個預(yù)訓(xùn)練模型，它在某些重要任務(wù)上的表現(xiàn)已經(jīng)接近美國最先進的模型，同時顯著降低了訓(xùn)練成本。

DeepSeek團隊通過一系列令人印象深刻的創(chuàng)新實現(xiàn)了這一突破，主要集中在提升工程效率方面 —— 在「鍵值緩存」（Key-Value cache）管理方面做出了特別創(chuàng)新的改進，并且將MoE方法推進到了前所未有的水平。

在DeepSeek發(fā)表的原始報告中有詳細(xì)解釋這筆成本的計算：在預(yù)訓(xùn)練階段，每兆個token上訓(xùn)練DeepSeek-V3僅需要180K H800 GPU小時，也就是說在擁有2048個H800 GPU的叢集上需要3.7天。因此，預(yù)訓(xùn)練階段在不到兩個月的時間內(nèi)完成，耗費2664K GPU小時。加上上下文長度擴充所需的119K GPU小時和后制訓(xùn)練所需的5K GPU小時，DeepSeek-V3的完整訓(xùn)練僅需2.788M GPU小時。假設(shè)H800 GPU的租賃價格為每GPU小時2美元，總訓(xùn)練成本僅為557.6萬美元。而GPT-4o的約為1億美元，使用25000個GPU芯片。

推理成本上，OpenAI o1每百萬輸入和百萬輸出token分別收取15美元和60美元，而DeepSeek R1同樣輸入與輸出的價格分別只要0.55美元和2.19美元，差不多只是前者的3%。

不論是OpenAI還是其他頭部AI廠商都走的是“大力出奇跡”路線，即通過堆大量算力來訓(xùn)練大模型推理能力，但DeepSeek用有限的資源走了一條適合國內(nèi)的路。與其討論DeepSeek能否成為“中國版”的OpenAI，不如說DeepSeek其實挑戰(zhàn)了OpenAI的模式，畢竟OpenAI也并不一定是大模型的終局。

國外獨立評測機構(gòu)Artificial Analysis測試了DeepSeek-V3后得出的結(jié)論：DeepSeek-V3超越了迄今為止所有開源模型。需要注意的是，對比Android與iOS的生態(tài)隔離，開源與閉源大模型均基于Transformer架構(gòu)，差異是在數(shù)據(jù)、算法運用、工程等維度，并非是截然不同的技術(shù)路線。

DeepSeek不僅提升了國內(nèi)AI技術(shù)的整體水平，還幫助開發(fā)者和中小型大模型創(chuàng)業(yè)公司完成了AI市場教育。目前，DeepSeek-R1、V3、Coder等系列模型已正式上線國家超算互聯(lián)網(wǎng)平臺，這標(biāo)志著DeepSeek正式進入“國家隊”，同時也代表著一個基于國產(chǎn)深算智能加速卡的普惠、可靠AI大模型時代的到來。

OpenAI提案要求禁用DeepSeek

OpenAI首席執(zhí)行官Sam Altman在社交平臺X上表示，“DeepSeek的R1是一款令人印象深刻的模型，尤其是考慮到它們能夠以這個價格提供的功能”。OpenAI在DeepSeek-R1模型發(fā)布后，為了維持其在AI領(lǐng)域的領(lǐng)先地位，迅速發(fā)布了推理模型o3-mini，支持low、medium和high三種推理難度。另外，DeepSeek的崛起迫使OpenAI加速推出免費的搜索引擎功能以應(yīng)對競爭，2025年2月6日，OpenAI宣布向所有用戶開放ChatGPT搜索功能，并且無需注冊即可使用。

而隨后2025年3月13日，OpenAI全球事務(wù)副總裁Christopher Lehane向白宮科學(xué)技術(shù)政策辦公室（OSTP）提交了一份長達(dá)15頁的政策建議報告，DeepSeek在報告中被點名15次。Christopher Lehane表示”盡管美國目前在人工智能領(lǐng)域保持領(lǐng)先，但DeepSeek表明我們的領(lǐng)先優(yōu)勢并不大，而且正在縮小”，同時，聲稱在關(guān)鍵基礎(chǔ)設(shè)施和其他高風(fēng)險應(yīng)用中使用DeepSeek會「帶來重大風(fēng)險」，要求美國政府采取行動。

OpenAI指控DeepSeek存在技術(shù)安全缺陷，R1模型架構(gòu)“可能導(dǎo)致敏感任務(wù)失控”，威脅美國關(guān)鍵基礎(chǔ)設(shè)施。報告特別提及歐洲金融機構(gòu)（如匯豐銀行）測試DeepSeek模型，警示盟友技術(shù)依賴轉(zhuǎn)移風(fēng)險，呼吁加強「民主AI供應(yīng)鏈」審查。

提案中，強調(diào)當(dāng)前美國面臨來自中國AI技術(shù)的“系統(tǒng)性挑戰(zhàn)”，建議參考拜登政府的出口規(guī)則，采取分級制度：第一級（Tier I）是“致力于民主人工智能原則的國家”，包括美國盟友，完全遵循美國技術(shù)標(biāo)準(zhǔn)，可以享受算力補貼與市場準(zhǔn)入，但不能使用中國生產(chǎn)的設(shè)備以及“侵犯用戶隱私并存在知識產(chǎn)權(quán)盜竊等安全風(fēng)險的人工智能模型”；第二級（Tier II）是沒能阻止受出口管制的芯片被轉(zhuǎn)移到“第三級國家”的國家，需承諾安全審查后可升級至Tier I；第三級（Tier III）則是中國等國家，嚴(yán)格限制AI技術(shù)出口。

OpenAI這封信函實際上是響應(yīng)《人工智能行動計劃》的一份提案，今年2月美國政府為制定新的AI政策向外界公開征求意見。今年1月，特朗普政府直接撤銷了先前美國的AI行政命令《安全、可靠和值得信賴的人工智能開發(fā)與使用》，轉(zhuǎn)而迅速簽署了一項全新《人工智能行動計劃》，要求在短短180天內(nèi)提交一份AI行動計劃，直言“美國矢志維持并鞏固其在全球人工智能領(lǐng)域的霸主地位”。

美國國會、海軍、五角大樓、NASA等政府機構(gòu)和部門已經(jīng)紛紛對DeepSeek下達(dá)了禁令，甚至在今年1月29日發(fā)布《2025年美國人工智能能力與中國脫鉤法案》（Decoupling America’s Artificial Intelligence Capabilities from China Act of 2025）禁止美國人協(xié)助中國推動AI，并禁止美國人下載或使用DeepSeek，否則將被定性為犯罪，最高可判處20年監(jiān)禁及處以100萬美元的罰款。彭博報道，已有數(shù)百家美國公司，尤其是與政府相關(guān)的企業(yè)，都已經(jīng)屏蔽了DeepSeek。

曾幾何時，OpenAI堪稱開源界的先鋒，從GPT-3開始，畫風(fēng)突變，毅然筑起閉源的高墻，通過API訂閱制賺得是盆滿缽滿，全然不顧曾經(jīng)的開源初心。

OpenAI裝都不裝了

OpenAI提案中同時還呼吁美國聯(lián)邦政府應(yīng)該幫助AI公司免受日益嚴(yán)苛的州級AI法規(guī)的影響，借機提出了真正的核心議題 —— 聯(lián)邦與州法規(guī)的博弈、版權(quán)數(shù)據(jù)使用的合法性爭議。

想要獲得州級法規(guī)豁免權(quán)

OpenAI建議建立一個范圍明確的框架，促成聯(lián)邦政府與私營公司之間的自愿合作，在適當(dāng)?shù)那闆r下政府能夠從企業(yè)獲得經(jīng)驗和資源，而作為交換，私營公司則能免受今年美國各州已經(jīng)提出的781項與AI相關(guān)提案的影響。美國人工智能安全研究院（US AI Safety Institute）可以充當(dāng)聯(lián)邦政府與私營公司之間的主要政府機構(gòu)，“企業(yè)不必受到各州法規(guī)的約束，因為后者顯然遠(yuǎn)不及聯(lián)邦層面的監(jiān)管完善”。如果企業(yè)自愿與該機構(gòu)合作，允許其對自家模型進行審查，政府就應(yīng)該向它們提供“包括免除州級法規(guī)在內(nèi)的責(zé)任保護”，尤其是在涉及前沿模型安全法規(guī)上。

OpenAI警告若美國不豁免AI公司州級法規(guī)束縛，否則在數(shù)據(jù)獲取受限下，美國技術(shù)優(yōu)勢將迅速消失，中國將贏得AI競賽。政府應(yīng)鼓勵公私合作，加速AI在政府機構(gòu)中的應(yīng)用，并消除已知的障礙，包括過時且冗長的認(rèn)證流程、限制性測試權(quán)限、缺乏靈活性的采購渠道。

想要進行版權(quán)改革

已經(jīng)有包括OpenAI在內(nèi)的多家公司，因訓(xùn)練模型的數(shù)據(jù)而面臨多起版權(quán)起訴。對于此前引起巨大爭議的版權(quán)問題，OpenAI也強調(diào)應(yīng)該對此進行版權(quán)改革 —— 這是因為「合理使用原則」（fair use doctrine）對維持AI領(lǐng)域的領(lǐng)先地位至關(guān)重要。

版權(quán)法在美國早期技術(shù)進步的階段發(fā)揮了重要作用。美國擁有眾多AI初創(chuàng)公司，吸引大量投資，并在研究方面取得諸多突破，主要也是得益于合理使用原則。OpenAI主張強化合理使用原則，允許被允許自由使用版權(quán)材料訓(xùn)練模型，同時推動國際版權(quán)規(guī)則改革，防止中國通過“寬松監(jiān)管”獲取數(shù)據(jù)優(yōu)勢。針對創(chuàng)作者群體的抗議，OpenAI反擊稱，歐盟的嚴(yán)格版權(quán)法已壓制了AI創(chuàng)新。報告同時建議美國政府向企業(yè)開放醫(yī)療等敏感數(shù)據(jù)，以加速AI研發(fā)。

硅谷風(fēng)險投資機構(gòu)Andreessen Horowitz認(rèn)為，聯(lián)邦豁免權(quán)可釋放企業(yè)創(chuàng)新潛力，避免“監(jiān)管碎片化”拖累競爭。而MIT技術(shù)政策教授Daron Acemoglu批評OpenAI試圖“用政治手段掩蓋技術(shù)焦慮”，其出口管制將分裂全球科技共同體。

科技霸權(quán)or科技平權(quán)

其實，OpenAI早就盯上了DeepSeek。今年1月，OpenAI就曾公開指控DeepSeek通過「模型蒸餾」（Model Distillation）技術(shù)“違規(guī)復(fù)制”其產(chǎn)品功能，然而，OpenAI卻拒絕透露具體技術(shù)細(xì)節(jié)或法律依據(jù)。模型蒸餾是一種通過訓(xùn)練小型模型模仿大型模型行為的技術(shù)，廣泛應(yīng)用于提高AI效率與降低成本，模型蒸餾本身是公開技術(shù)，但若涉及直接復(fù)制專有模型的輸出結(jié)構(gòu)或參數(shù)，可能構(gòu)成侵權(quán)，但是模型輸出的“功能相似性”難以直接構(gòu)成侵權(quán)。

除非能證明DeepSeek直接竊取了OpenAI的訓(xùn)練數(shù)據(jù)或代碼架構(gòu)，否則訴訟可能無果而終，若指控屬實，OpenAI應(yīng)公開技術(shù)比對報告；若僅是戰(zhàn)略打壓，則可能損害行業(yè)創(chuàng)新生態(tài)。OpenAI與DeepSeek的爭端，折射出全球AI產(chǎn)業(yè)從技術(shù)競爭向規(guī)則競爭演變的趨勢。無論是模型蒸餾的法律定性，還是數(shù)據(jù)隱私的合規(guī)要求，都可能成為影響市場格局的關(guān)鍵變量。

即便美國可以封殺掉DeepSeek的手機、網(wǎng)頁端的應(yīng)用，但DeepSeek的大模型、思路和代碼都已經(jīng)融入了全世界的人工智能社區(qū)，被包括美國在內(nèi)的程序人員廣泛使用。Meta首席科學(xué)家楊立昆（Yann LeCun）則直指，硅谷部分人擁有一種“錯位的優(yōu)越感”。OpenAI現(xiàn)在應(yīng)該做的是調(diào)整自己的產(chǎn)品而不是攻擊中國AI，進行毫無依據(jù)的污蔑和無理打壓。

由于DeepSeek這次的開源，讓行業(yè)最領(lǐng)先的水平平權(quán)了，寡頭所謂的“AI霸權(quán)”開始動搖，AI競賽的勝利者，不只能是擁有最多芯片的一方。這讓OpenAI重新思考，需要“弄清楚另一種開源戰(zhàn)略”，也是AI普惠的開端，會加速推動AI進化的速度，進而推動必要條件的成熟，帶來新的應(yīng)用機會。

DeepSeek以較低的成本開發(fā)出了一個性能接近美國模型水平的產(chǎn)品，這次的特殊之處在于，首先展示預(yù)期成本降低的是一家中國公司。這種情況前所未有，具有重要的地緣政治意義。需要注意的是，中國AI的崛起在基礎(chǔ)層仍需突破芯片、算法等瓶頸的現(xiàn)狀下，通過系統(tǒng)工程優(yōu)化實現(xiàn)"換道超車"不僅可能，更是必然選擇。

實際上，這是一場關(guān)于技術(shù)霸權(quán)爭奪、地緣政治博弈與全球AI產(chǎn)業(yè)格局重塑的縮影。在DeepSeek之前，曾經(jīng)AI技術(shù)被認(rèn)為是高不可攀的“貴族科技”，只有少數(shù)巨頭才能玩得起，OpenAI、微軟、谷歌、Meta就像矗立在AI領(lǐng)域的高山。但這一次，DeepSeek把AI從算力壟斷中解放出來，重構(gòu)了全球AI競爭的邏輯：從依賴資本與硬件的“軍備競賽”，轉(zhuǎn)向算法優(yōu)化與生態(tài)協(xié)作的“效率革命”。

DeepSeek-V3極低的訓(xùn)練成本預(yù)示著AI大模型對算力投入的需求將大幅下降，但由經(jīng)濟學(xué)家威廉·斯坦利·杰文斯提出的杰文斯悖論：當(dāng)某種資源的使用效率提高、獲取變得更容易時，其總體使用量往往不減反增。DeepSeek的發(fā)展也呈現(xiàn)出類似的趨勢：算力效率的提升并未減少對算力的需求，反而推動了更多高算力應(yīng)用的落地，使得行業(yè)對算力的需求持續(xù)增長。

報告顯示，2025年微軟、亞馬遜以及Meta等“超大規(guī)模企業(yè)”在人工智能數(shù)據(jù)中心和算力資源方面的投資將達(dá)到3710億美元，較上年增長44%。這一數(shù)字將在2032年攀升至5250億美元，增速超過DeepSeek這一現(xiàn)象級產(chǎn)品爆火之前的研究預(yù)期。

此前，人工智能方面的投資主要流向用于訓(xùn)練或開發(fā)大規(guī)模新AI模型的數(shù)據(jù)中心和芯片。如今，科技巨頭將投資重點轉(zhuǎn)向“推理”環(huán)節(jié)，也就是模型訓(xùn)練完成后運行并產(chǎn)出結(jié)果的過程。彭博行業(yè)研究分析師Mandeep Singh在報告中稱，對DeepSeek的空前關(guān)注很可能會促使科技公司“追加投資推理環(huán)節(jié)”，使其成為生成式人工智能市場上增長最快的板塊。

新聞中心

OpenAI裝都不裝了，提案要求禁用DeepSeek

評論

相關(guān)推薦

技術(shù)專區(qū)

新聞中心

OpenAI裝都不裝了，提案要求禁用DeepSeek

評論

相關(guān)推薦

技術(shù)專區(qū)

OpenAI裝都不裝了，提案要求禁用DeepSeek