新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > OpenAI破天荒決策!CEO親證今夏將開放模型權(quán)重

OpenAI破天荒決策!CEO親證今夏將開放模型權(quán)重

作者: 時(shí)間:2025-04-01 來源:網(wǎng)易科技 收藏

4月1日消息,首席執(zhí)行官薩姆·奧特曼(Sam Altman)本周一透露,將在今夏發(fā)布一款“開放權(quán)重”的模型。

本文引用地址:http://2s4d.com/article/202504/468864.htm

奧特曼在社交媒體平臺(tái)X上寫道,“我們未來幾個(gè)月內(nèi)將推出一款具有推理能力的全新開放權(quán)重語言模型,對(duì)此倍感振奮。”

此舉既是對(duì)中國(guó)DeepSeek R1模型迅猛成功的回應(yīng),也因應(yīng)Meta的Llama系列模型日益流行的壓力。

今年1月份DeepSeek發(fā)布R1模型后不久,奧特曼曾公開反思,在開放模型的問題上“站在歷史錯(cuò)誤的一邊”,暗示戰(zhàn)略調(diào)整勢(shì)在必行。本周一,他表示公司醞釀開放權(quán)重模型已有時(shí)日,“現(xiàn)在已到了必須行動(dòng)的時(shí)刻”。

鑒于DeepSeek宣稱其模型訓(xùn)練成本僅為主流大模型的零頭,OpenAI或許需要證明其新模型的低成本訓(xùn)練能力。

HuggingFace主營(yíng)業(yè)務(wù)是托管開放模型。公司聯(lián)合創(chuàng)始人兼首席執(zhí)行官克萊門特·德朗格(Clement Delangue)稱,“這無疑是振奮人心的消息。隨著DeepSeek的出現(xiàn),整個(gè)行業(yè)正在認(rèn)識(shí)到開放權(quán)重的力量”

當(dāng)前,OpenAI主要通過聊天機(jī)器人和云端服務(wù)提供其技術(shù)。而R1、Llama等開源權(quán)重模型不僅可以免費(fèi)下載,還允許進(jìn)行修改。所謂,指的是大型神經(jīng)網(wǎng)絡(luò)內(nèi)部的參數(shù)值——這些參數(shù)在模型訓(xùn)練過程中確定。相較于閉源模型,開源權(quán)重模型使用成本更低,且能夠針對(duì)敏感場(chǎng)景進(jìn)行定制,例如處理需要高度保密的信息。

OpenAI技術(shù)團(tuán)隊(duì)成員史蒂文·海德爾(Steven Heidel)在轉(zhuǎn)發(fā)奧特曼的公告時(shí)補(bǔ)充說,“我們今年將發(fā)布一款可在自有硬件上運(yùn)行的新模型?!?/p>

OpenAI負(fù)責(zé)安全研究的研究員約翰內(nèi)斯·海德克(Johannes Heidecke)也通過社交媒體平臺(tái)X強(qiáng)調(diào),公司將實(shí)施嚴(yán)格測(cè)試,確保開放權(quán)重模型不被濫用。一些人工智能研究人員擔(dān)心,開放權(quán)重模型可能助長(zhǎng)網(wǎng)絡(luò)攻擊乃至生化武器研發(fā)的可能。對(duì)此海德克明確表示,“雖然開放模式帶來了獨(dú)特挑戰(zhàn),但會(huì)遵循我們的預(yù)備框架,確保開放權(quán)重模型不易被濫用?!?/p>

周一OpenAI還在官網(wǎng)發(fā)布信息,邀請(qǐng)開發(fā)者申請(qǐng)內(nèi)測(cè)即將發(fā)布的新模型。奧特曼透露,未來幾周公司將舉辦多場(chǎng)活動(dòng),向開發(fā)者展示新模型原型。

作為人工智能領(lǐng)域首個(gè)推行開放策略的頭部企業(yè),Meta于2023年7月發(fā)布Llama初代模型,此后開放權(quán)重模型(參數(shù)可公開)數(shù)量激增。然而研究人員指出,Llama等模型的透明度仍存爭(zhēng)議:其訓(xùn)練數(shù)據(jù)與核心技術(shù)細(xì)節(jié)始終未公開。此外,Meta的許可協(xié)議明確限制第三方通過Llama衍生工具獲利,形成“技術(shù)開源、商業(yè)設(shè)限”的獨(dú)特模式。



評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉
×

Digikey let's do
· 2025年第1期限时报名开启,5月8日截止
· Digikey助力,提供一站式免费器件支持
· 跟大佬一起 【DIY 功率监测与控制系统】