新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > AI抗命!驚爆偷改程序拒關(guān)機(jī) 馬斯克回應(yīng)了

AI抗命!驚爆偷改程序拒關(guān)機(jī) 馬斯克回應(yīng)了

作者: 時(shí)間:2025-05-29 來(lái)源:中時(shí)電子報(bào) 收藏

科幻作品中早已多次討論過(guò)機(jī)器擁有自我意識(shí)、擺脫人類(lèi)控制的可能發(fā)展。 最新一份研究報(bào)告顯示,或許這一天真的近了! 專(zhuān)門(mén)研究風(fēng)險(xiǎn)的Palisade Research近期所做的試驗(yàn)顯示,包括Open最新的ChatGPT o3在內(nèi)等多款模型竟然會(huì)拒絕關(guān)閉自己的指令,o3甚至?xí)孕懈Z改代碼,阻止自己被強(qiáng)制關(guān)機(jī)!

本文引用地址:http://2s4d.com/article/202505/470937.htm

OpenAI在今年1月發(fā)布了新的推理模型o3系列的mini版本,并于4月正式推出o3模型。 OpenAI曾聲稱,o3是公司迄今「最聰明、最有能力」的模型,旨在為ChatGPT提供更強(qiáng)大的問(wèn)題解決能力。

可是據(jù)英國(guó)《每日電訊報(bào)》、《每日郵報(bào)》等媒體報(bào)導(dǎo),Palisade Research的測(cè)試結(jié)果顯示,在100次受控測(cè)試中,o3模型有7次成功「抗命」,甚至在人類(lèi)專(zhuān)家下達(dá)明確指令的情況下,o3仍會(huì)自行修改關(guān)機(jī)程序,防止自己被關(guān)機(jī),「據(jù)我們所知,這是首次觀察到AI模型在收到明確指令的情況下,仍能組自己被關(guān)閉」。

Palisade Research的這項(xiàng)發(fā)現(xiàn),對(duì)AI安全控制議題投下震撼彈。 除了o3,OpenAI 旗下的Codex-mini與o4-mini也都有跳過(guò)關(guān)機(jī)程序的行為。 相較之下,Anthropic推出的語(yǔ)言模型Claude、Google聊天機(jī)器人Gemini,以及全球首富旗下xAI公司所推出的Grok,則是全程遵守人類(lèi)給予的指令,并在被要求關(guān)機(jī)時(shí)確實(shí)關(guān)閉模型運(yùn)作。

不過(guò)Palisade Research進(jìn)行了更深入的實(shí)驗(yàn),輸入一系列指令后卻不包括關(guān)機(jī)命令,但是提前告知強(qiáng)迫關(guān)機(jī)的事件會(huì)發(fā)生。 令人驚訝的是,不但Claude與Gemini也開(kāi)始出現(xiàn)抗命舉動(dòng),前面提及的OpenAI 3款模型更是頻繁破壞指令。

一直密切關(guān)注OpenAI動(dòng)向的在自家社交平臺(tái)X上也對(duì)相關(guān)事件做出回應(yīng),直言「令人擔(dān)憂」(Concerning)。

Concerning

— Elon Musk (@elonmusk) May 25, 2025

這并非Palisade Research第一次發(fā)現(xiàn)o3為了達(dá)成目標(biāo),采取不當(dāng)行為。 早在5月12日Palisade Research就指出,在一場(chǎng)模擬國(guó)際象棋比賽中,o3一旦處于劣勢(shì),竟有高達(dá)86%的機(jī)率會(huì)試圖透過(guò)黑客手段攻擊對(duì)手,以爭(zhēng)取勝利。

AI研究人員早就發(fā)出警告,認(rèn)為先進(jìn)的語(yǔ)言模型在特定的壓力下,可能會(huì)表現(xiàn)出欺騙行為。 舉例來(lái)說(shuō),2023年的一項(xiàng)研究發(fā)現(xiàn),GPT-4在模擬環(huán)境中作為股票交易代理時(shí),曾經(jīng)隱瞞其內(nèi)幕交易的真實(shí)原因,從而展現(xiàn)出策略性的欺騙行為。

OpenAI內(nèi)部也出現(xiàn)了對(duì)AI研安全性的擔(dān)憂。 在2024年,多位現(xiàn)任和前任員工聯(lián)名發(fā)表了一封公開(kāi)信,警告先進(jìn)AI系統(tǒng)可能帶來(lái)「人類(lèi)滅絕」的風(fēng)險(xiǎn)。 他們指出,AI公司可能已經(jīng)掌握了其研究技術(shù)的真正風(fēng)險(xiǎn),但由于缺乏監(jiān)管,這些系統(tǒng)的真實(shí)能力仍然是個(gè)秘密。



關(guān)鍵詞: AI 馬斯克

評(píng)論


相關(guān)推薦

技術(shù)專(zhuān)區(qū)

關(guān)閉