新聞中心

EEPW首頁 > 業(yè)界動態(tài) > OpenAI將重新開源?

OpenAI將重新開源?

作者:陳玲麗 時間:2025-02-20 來源:電子產(chǎn)品世界 收藏

首席執(zhí)行官Sam Altman在社交平臺上發(fā)文,對下一個項目的方向征詢公眾意見:一種是“相當小但仍需在GPU上運行的o3-mini級模型”,另一種則是“盡可能優(yōu)化的手機大小模型”。這或許意味著即將新的。

本文引用地址:http://2s4d.com/article/202502/467127.htm

640.png

上一次大語言模型,已經(jīng)是2019年的事情了:11月6日,OpenAI正式發(fā)布了GPT-2最后一個部分的完整代碼,其中包括含有15億參數(shù)的最大版本。然而,自O(shè)penAI于2022年年底推出ChatGPT以來,從GPT-3再到最新的OpenAI o3-mini都再也沒有開源過。但OpenAI成立時表示是為了推動AI的安全性和有益發(fā)展,確保AI的發(fā)展能夠被廣泛共享,并且對全人類都是有益的。因此很多人調(diào)侃讓OpenAI改名為“CloseAI”。

橫空出世后,Sam Altman在被問及OpenAI是否會公開部分AI模型技術(shù)并展示更多系統(tǒng)工作原理的研究時,他表示公司內(nèi)部正在討論這種可能性,承認OpenAI此前在開源策略上可能“站在了歷史的錯誤一邊”,稱正在討論公開AI模型權(quán)重。不過他也指出,公司內(nèi)部并非所有人都認同這一觀點,而且這也不是當前的首要任務(wù),最重要的是繼續(xù)按研究規(guī)劃推進工作。

為何能成為爆款?

日前發(fā)布的DeepSeek-R1,各項性能與OpenAI的GPT-4o持平?,僅用時兩個月就完成了訓練,同時過程中僅用了2000個英偉達H800 GPU,其他主流AI實驗室通常需要部署的芯片數(shù)量估計超過10000個 —— 展現(xiàn)出算法創(chuàng)新和架構(gòu)優(yōu)化可能比算力更重要,對建立在海量計算資源獨占之上的整體商業(yè)模式形成了威脅。值得注意的是,其大幅降低了AI計算成本,約為550萬美元左右,相比之下OpenAI等公司的同類項目成本要高出非常多。暫且不論DeepSeek的說法是否準確,其取得的突破都突顯了AI開發(fā)領(lǐng)域的動態(tài)變化。

DeepSeek-R1最大的優(yōu)勢還在于它是開源模型,其開源倉庫采用標準化、寬松的MIT License,完全開源、不限制商用、無需申請。因此,理論上所有的小參數(shù)模型均能夠直接利用R1蒸餾出的標簽數(shù)據(jù),來增強推理性能,通過更改底層代碼來改變其工作方式。

DeepSeek最新發(fā)布的一篇技術(shù)論文,主要內(nèi)容是提出一種名為NSA(Natively Sparse Attention,原生稀疏注意力)的新型注意力機制,核心是通過對硬件的友好與端到端訓練,取得推理、訓練速度和任務(wù)表現(xiàn)的綜合平衡:讓在長上下文中兼具高效與高保真度。用DeepSeek-R1徹底揭開了OpenAI無論如何都想藏起來的算法秘密,使讓所有開發(fā)者都能看到推理是如何發(fā)生的,讓AI的“思考過程”成為透明,給出更多復制和超越o1的可能。

此外,DeepSeek-R1有望提振整個開源社區(qū)的共建氛圍,使得更多開源模型能夠“站在巨人肩膀上”加速迭代,促進AI技術(shù)在各個領(lǐng)域的應(yīng)用和普及,這就是開源的力量。

再次擁抱開源生態(tài)

反觀OpenAI在ChatGPT問世后,則選擇使用閉源模型的基礎(chǔ)上通過「API+訂閱制」構(gòu)建起強大的商業(yè)護城河,通過API形式提供AI服務(wù),而不開放底層權(quán)重,防止競品復制其技術(shù)。更重要的是OpenAI能夠掌控用戶交互數(shù)據(jù),持續(xù)迭代GPT模型和ChatGPT,并維持市場領(lǐng)先地位。

就在短短幾個月前,企業(yè)幾乎只能依賴GPT(OpenAI)、Claude(Anthropic)和 Gemini(Google)等大模型廠商提供的封閉API,現(xiàn)在,DeepSeek幾乎以一舉之力扭轉(zhuǎn)了市場的注意力。隨著高效的開源技術(shù)興起,部分開發(fā)者和客戶可能會轉(zhuǎn)向更具性價比的開源解決方案。面對這一挑戰(zhàn),OpenAI的戰(zhàn)略可能會發(fā)生重大轉(zhuǎn)變,反映了AI領(lǐng)導者如何在日益多極化的AI世界中平衡創(chuàng)新、安全和商業(yè)化之間的關(guān)系。

不僅僅是OpenAI,整個AI生態(tài)都在擁抱開源:百度宣布下一代文心大模型4.5系列將在六月底開源;昆侖萬維宣布開源中國首個面向AI短劇創(chuàng)作的視頻生成模型SkyReels-V1,以及基于視頻基座模型的表情動作可控算法SkyReels-A1;剛剛發(fā)布Grok 3系列模型的馬斯克旗下xAI也宣布上一代大模型Grok 2將照例在幾個月后開源。

雖然閉源AI依然能賺到錢,但隨著DeepSeek帶來的沖擊,市場已經(jīng)開始傾向于開源大模型的路線。開源不僅讓整個行業(yè)面臨的壁壘大幅削減,也給所有開發(fā)者和企業(yè)帶來了更多自由度 —— API 接入、云端調(diào)用、本地部署,甚至是基于不同需求和數(shù)據(jù)進行重新訓練。這也是為什么我們會看到,所有廠商似乎都在接入DeepSeek。當然,出于營銷目的的接入以及簡單粗暴的接入方式,也是這種變化中不可避免的一個過程。

這場AI競賽,已經(jīng)遠遠超出了最初的語言模型之爭,開源路徑帶來的變化正在撬動整個AI生態(tài),在一定程度上意味著大模型迭代的范式轉(zhuǎn)變,而一場AI產(chǎn)業(yè)的「開源革命」也已然開始。在封閉體系下,企業(yè)只能被動接受巨頭定價,這種邏輯一度被認為是不可逆的,畢竟打造大模型的成本極高,只有確保收益最大化才能維持技術(shù)優(yōu)勢。但DeepSeek徹底改變了這種假設(shè),未來的AI可能也不會是少數(shù)巨頭的壟斷,而是由大量參與者共同推進的技術(shù)體系。



關(guān)鍵詞: OpenAI 開源 大模型 DeepSeek

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉