OpenAI破天荒決策！CEO親證今夏將開放模型權(quán)重

作者：時間：2025-04-01 來源：網(wǎng)易科技

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

4月1日消息，OpenAI首席執(zhí)行官薩姆·奧特曼（Sam Altman）本周一透露，OpenAI將在今夏發(fā)布一款“開放權(quán)重”的人工智能模型。

本文引用地址：http://2s4d.com/article/202504/468864.htm

奧特曼在社交媒體平臺X上寫道，“我們未來幾個月內(nèi)將推出一款具有推理能力的全新開放權(quán)重語言模型，對此倍感振奮?！?/p>

此舉既是對中國DeepSeek R1模型迅猛成功的回應(yīng)，也因應(yīng)Meta的Llama系列模型日益流行的壓力。

今年1月份DeepSeek發(fā)布R1模型后不久，奧特曼曾公開反思，OpenAI在開放模型的問題上“站在歷史錯誤的一邊”，暗示戰(zhàn)略調(diào)整勢在必行。本周一，他表示公司醞釀開放權(quán)重模型已有時日，“現(xiàn)在已到了必須行動的時刻”。

鑒于DeepSeek宣稱其模型訓(xùn)練成本僅為主流大模型的零頭，OpenAI或許需要證明其新模型的低成本訓(xùn)練能力。

HuggingFace主營業(yè)務(wù)是托管開放模型。公司聯(lián)合創(chuàng)始人兼首席執(zhí)行官克萊門特·德朗格（Clement Delangue）稱，“這無疑是振奮人心的消息。隨著DeepSeek的出現(xiàn)，整個行業(yè)正在認(rèn)識到開放權(quán)重的力量”

當(dāng)前，OpenAI主要通過聊天機(jī)器人和云端服務(wù)提供其人工智能技術(shù)。而R1、Llama等開源權(quán)重模型不僅可以免費下載，還允許進(jìn)行修改。所謂模型權(quán)重，指的是大型神經(jīng)網(wǎng)絡(luò)內(nèi)部的參數(shù)值——這些參數(shù)在模型訓(xùn)練過程中確定。相較于閉源模型，開源權(quán)重模型使用成本更低，且能夠針對敏感場景進(jìn)行定制，例如處理需要高度保密的信息。

OpenAI技術(shù)團(tuán)隊成員史蒂文·海德爾（Steven Heidel）在轉(zhuǎn)發(fā)奧特曼的公告時補(bǔ)充說，“我們今年將發(fā)布一款可在自有硬件上運(yùn)行的新模型?！?/p>

OpenAI負(fù)責(zé)人工智能安全研究的研究員約翰內(nèi)斯·海德克（Johannes Heidecke）也通過社交媒體平臺X強(qiáng)調(diào)，公司將實施嚴(yán)格測試，確保開放權(quán)重模型不被濫用。一些人工智能研究人員擔(dān)心，開放權(quán)重模型可能助長網(wǎng)絡(luò)攻擊乃至生化武器研發(fā)的可能。對此海德克明確表示，“雖然開放模式帶來了獨特挑戰(zhàn)，但會遵循我們的預(yù)備框架，確保開放權(quán)重模型不易被濫用?！?/p>

周一OpenAI還在官網(wǎng)發(fā)布信息，邀請開發(fā)者申請內(nèi)測即將發(fā)布的新模型。奧特曼透露，未來幾周公司將舉辦多場活動，向開發(fā)者展示新模型原型。

作為人工智能領(lǐng)域首個推行開放策略的頭部企業(yè)，Meta于2023年7月發(fā)布Llama初代模型，此后開放權(quán)重模型（參數(shù)可公開）數(shù)量激增。然而研究人員指出，Llama等模型的透明度仍存爭議：其訓(xùn)練數(shù)據(jù)與核心技術(shù)細(xì)節(jié)始終未公開。此外，Meta的許可協(xié)議明確限制第三方通過Llama衍生工具獲利，形成“技術(shù)開源、商業(yè)設(shè)限”的獨特模式。