OpenAI將重新開源？

作者：陳玲麗時(shí)間：2025-02-20 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

OpenAI首席執(zhí)行官Sam Altman在社交平臺(tái)上發(fā)文，對(duì)下一個(gè)開源項(xiàng)目的方向征詢公眾意見：一種是“相當(dāng)小但仍需在GPU上運(yùn)行的o3-mini級(jí)模型”，另一種則是“盡可能優(yōu)化的手機(jī)大小模型”。這或許意味著OpenAI即將開源新的大模型。

本文引用地址：http://2s4d.com/article/202502/467127.htm

OpenAI上一次開源大語言模型，已經(jīng)是2019年的事情了：11月6日，OpenAI正式發(fā)布了GPT-2最后一個(gè)部分的完整代碼，其中包括含有15億參數(shù)的最大版本。然而，自O(shè)penAI于2022年年底推出ChatGPT以來，從GPT-3再到最新的OpenAI o3-mini都再也沒有開源過。但OpenAI成立時(shí)表示是為了推動(dòng)AI的安全性和有益發(fā)展，確保AI的發(fā)展能夠被廣泛共享，并且對(duì)全人類都是有益的。因此很多人調(diào)侃讓OpenAI改名為“CloseAI”。

DeepSeek橫空出世后，Sam Altman在被問及OpenAI是否會(huì)公開部分AI模型技術(shù)并展示更多系統(tǒng)工作原理的研究時(shí)，他表示公司內(nèi)部正在討論這種可能性，承認(rèn)OpenAI此前在開源策略上可能“站在了歷史的錯(cuò)誤一邊”，稱正在討論公開AI模型權(quán)重。不過他也指出，公司內(nèi)部并非所有人都認(rèn)同這一觀點(diǎn)，而且這也不是當(dāng)前的首要任務(wù)，最重要的是繼續(xù)按研究規(guī)劃推進(jìn)工作。

DeepSeek為何能成為爆款？

DeepSeek日前發(fā)布的大模型DeepSeek-R1，各項(xiàng)性能與OpenAI的GPT-4o持平?，僅用時(shí)兩個(gè)月就完成了訓(xùn)練，同時(shí)過程中僅用了2000個(gè)英偉達(dá)H800 GPU，其他主流AI實(shí)驗(yàn)室通常需要部署的芯片數(shù)量估計(jì)超過10000個(gè) —— 展現(xiàn)出算法創(chuàng)新和架構(gòu)優(yōu)化可能比算力更重要，對(duì)建立在海量計(jì)算資源獨(dú)占之上的整體商業(yè)模式形成了威脅。值得注意的是，其大幅降低了AI計(jì)算成本，約為550萬美元左右，相比之下OpenAI等公司的同類項(xiàng)目成本要高出非常多。暫且不論DeepSeek的說法是否準(zhǔn)確，其取得的突破都突顯了AI開發(fā)領(lǐng)域的動(dòng)態(tài)變化。

DeepSeek-R1最大的優(yōu)勢(shì)還在于它是開源模型，其開源倉庫采用標(biāo)準(zhǔn)化、寬松的MIT License，完全開源、不限制商用、無需申請(qǐng)。因此，理論上所有的小參數(shù)模型均能夠直接利用R1蒸餾出的標(biāo)簽數(shù)據(jù)，來增強(qiáng)推理性能，通過更改底層代碼來改變其工作方式。

DeepSeek最新發(fā)布的一篇技術(shù)論文，主要內(nèi)容是提出一種名為NSA（Natively Sparse Attention，原生稀疏注意力）的新型注意力機(jī)制，核心是通過對(duì)硬件的友好與端到端訓(xùn)練，取得推理、訓(xùn)練速度和任務(wù)表現(xiàn)的綜合平衡：讓大模型在長(zhǎng)上下文中兼具高效與高保真度。用DeepSeek-R1徹底揭開了OpenAI無論如何都想藏起來的算法秘密，使讓所有開發(fā)者都能看到推理是如何發(fā)生的，讓AI的“思考過程”成為透明，給出更多復(fù)制和超越o1的可能。

此外，DeepSeek-R1有望提振整個(gè)開源社區(qū)的共建氛圍，使得更多開源模型能夠“站在巨人肩膀上”加速迭代，促進(jìn)AI技術(shù)在各個(gè)領(lǐng)域的應(yīng)用和普及，這就是開源的力量。

再次擁抱開源生態(tài)

反觀OpenAI在ChatGPT問世后，則選擇使用閉源模型的基礎(chǔ)上通過「API+訂閱制」構(gòu)建起強(qiáng)大的商業(yè)護(hù)城河，通過API形式提供AI服務(wù)，而不開放底層權(quán)重，防止競(jìng)品復(fù)制其技術(shù)。更重要的是OpenAI能夠掌控用戶交互數(shù)據(jù)，持續(xù)迭代GPT模型和ChatGPT，并維持市場(chǎng)領(lǐng)先地位。

就在短短幾個(gè)月前，企業(yè)幾乎只能依賴GPT（OpenAI）、Claude（Anthropic）和 Gemini（Google）等大模型廠商提供的封閉API，現(xiàn)在，DeepSeek幾乎以一舉之力扭轉(zhuǎn)了市場(chǎng)的注意力。隨著高效的開源技術(shù)興起，部分開發(fā)者和客戶可能會(huì)轉(zhuǎn)向更具性價(jià)比的開源解決方案。面對(duì)這一挑戰(zhàn)，OpenAI的戰(zhàn)略可能會(huì)發(fā)生重大轉(zhuǎn)變，反映了AI領(lǐng)導(dǎo)者如何在日益多極化的AI世界中平衡創(chuàng)新、安全和商業(yè)化之間的關(guān)系。

不僅僅是OpenAI，整個(gè)AI生態(tài)都在擁抱開源：百度宣布下一代文心大模型4.5系列將在六月底開源；昆侖萬維宣布開源中國首個(gè)面向AI短劇創(chuàng)作的視頻生成模型SkyReels-V1，以及基于視頻基座模型的表情動(dòng)作可控算法SkyReels-A1；剛剛發(fā)布Grok 3系列模型的馬斯克旗下xAI也宣布上一代大模型Grok 2將照例在幾個(gè)月后開源。

雖然閉源AI依然能賺到錢，但隨著DeepSeek帶來的沖擊，市場(chǎng)已經(jīng)開始傾向于開源大模型的路線。開源不僅讓整個(gè)行業(yè)面臨的壁壘大幅削減，也給所有開發(fā)者和企業(yè)帶來了更多自由度 —— API 接入、云端調(diào)用、本地部署，甚至是基于不同需求和數(shù)據(jù)進(jìn)行重新訓(xùn)練。這也是為什么我們會(huì)看到，所有廠商似乎都在接入DeepSeek。當(dāng)然，出于營銷目的的接入以及簡(jiǎn)單粗暴的接入方式，也是這種變化中不可避免的一個(gè)過程。

這場(chǎng)AI競(jìng)賽，已經(jīng)遠(yuǎn)遠(yuǎn)超出了最初的語言模型之爭(zhēng)，開源路徑帶來的變化正在撬動(dòng)整個(gè)AI生態(tài)，在一定程度上意味著大模型迭代的范式轉(zhuǎn)變，而一場(chǎng)AI產(chǎn)業(yè)的「開源革命」也已然開始。在封閉體系下，企業(yè)只能被動(dòng)接受巨頭定價(jià)，這種邏輯一度被認(rèn)為是不可逆的，畢竟打造大模型的成本極高，只有確保收益最大化才能維持技術(shù)優(yōu)勢(shì)。但DeepSeek徹底改變了這種假設(shè)，未來的AI可能也不會(huì)是少數(shù)巨頭的壟斷，而是由大量參與者共同推進(jìn)的技術(shù)體系。

新聞中心

OpenAI將重新開源？

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)