新聞中心

EEPW首頁 > 智能計算 > 市場分析 > 分析發(fā)現(xiàn),“推理”人工智能模型的改進(jìn)可能會很快放緩

分析發(fā)現(xiàn),“推理”人工智能模型的改進(jìn)可能會很快放緩

作者: 時間:2025-05-13 來源:Techcrunch 收藏

非營利性人工智能研究機(jī)構(gòu)Epoch 的一項(xiàng)分析表明,人工智能行業(yè)可能無法通過推理人工智能模型獲得巨大的性能提升。根據(jù)報告的調(diào)查結(jié)果,在一年內(nèi),推理模型的進(jìn)展可能會放緩。

本文引用地址:http://2s4d.com/article/202505/470376.htm

近幾個月來,Open的o3等推理模型在人工智能基準(zhǔn)上取得了重大收益,特別是衡量數(shù)學(xué)和編程技能的基準(zhǔn)。這些模型可以將更多的計算應(yīng)用于問題,這可以提高其性能,但缺點(diǎn)是它們比傳統(tǒng)模型需要更長的時間來完成任務(wù)。

推理模型是通過首先在大量數(shù)據(jù)上訓(xùn)練常規(guī)模型,然后應(yīng)用一種稱為強(qiáng)化學(xué)習(xí)的技術(shù)來開發(fā)的,這有效地為模型提供了對其難題解決方案的“反饋”。

據(jù)Epoch稱,到目前為止,像Open這樣的前沿人工智能實(shí)驗(yàn)室還沒有將大量的計算能力應(yīng)用于推理模型培訓(xùn)的強(qiáng)化學(xué)習(xí)階段。

那正在改變。OpenAI表示,它應(yīng)用的計算比其前身o1多10倍左右來訓(xùn)練o3,Epoch推測,這些計算大部分都用于強(qiáng)化學(xué)習(xí)。OpenAI研究員Dan Roberts最近透露,該公司的未來計劃要求優(yōu)先使用強(qiáng)化學(xué)習(xí),以使用更多的計算能力,甚至比初始模型培訓(xùn)還要多。

但每個紀(jì)元,有多少計算可以應(yīng)用于強(qiáng)化學(xué)習(xí)仍然有一個上限。

image.png

Epoch的分析師、分析的作者Josh You解釋說,標(biāo)準(zhǔn)人工智能模型培訓(xùn)的績效收益目前每年翻兩番,而強(qiáng)化學(xué)習(xí)的績效收益每3-5個月增長十倍。他繼續(xù)說,推理訓(xùn)練的進(jìn)展“到2026年可能與整體前沿相融合”。


Epoch的分析提出了一些假設(shè),并部分借鑒了人工智能公司高管的公開評論。但它也證明,由于計算以外的原因,包括高昂的研究間接費(fèi)用,擴(kuò)展推理模型可能被證明具有挑戰(zhàn)性。

“如果研究需要持續(xù)的間接費(fèi)用,推理模型可能不會像預(yù)期的那樣擴(kuò)展,”你寫道?!翱焖儆嬎憧s放可能是推理模型進(jìn)展中非常重要的因素,因此值得密切跟蹤這一點(diǎn)?!?/p>

任何表明推理模型在不久的將來可能會達(dá)到某種限制,這可能會讓人工智能行業(yè)擔(dān)心,因?yàn)槿斯ぶ悄苄袠I(yè)投入了大量資源來開發(fā)這些類型的模型。研究表明,推理模型的運(yùn)行成本可能非常昂貴,但存在嚴(yán)重的缺陷,例如比某些傳統(tǒng)模型更傾向于產(chǎn)生幻覺。




關(guān)鍵詞: AI 智能計算 大語言模型

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉