分析發(fā)現(xiàn)，“推理”人工智能模型的改進(jìn)可能會很快放緩

作者：時間：2025-05-13 來源：Techcrunch

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

非營利性人工智能研究機(jī)構(gòu)Epoch AI的一項(xiàng)分析表明，人工智能行業(yè)可能無法通過推理人工智能模型獲得巨大的性能提升。根據(jù)報告的調(diào)查結(jié)果，在一年內(nèi)，推理模型的進(jìn)展可能會放緩。

本文引用地址：http://2s4d.com/article/202505/470376.htm

近幾個月來，OpenAI的o3等推理模型在人工智能基準(zhǔn)上取得了重大收益，特別是衡量數(shù)學(xué)和編程技能的基準(zhǔn)。這些模型可以將更多的計算應(yīng)用于問題，這可以提高其性能，但缺點(diǎn)是它們比傳統(tǒng)模型需要更長的時間來完成任務(wù)。

推理模型是通過首先在大量數(shù)據(jù)上訓(xùn)練常規(guī)模型，然后應(yīng)用一種稱為強(qiáng)化學(xué)習(xí)的技術(shù)來開發(fā)的，這有效地為模型提供了對其難題解決方案的“反饋”。

據(jù)Epoch稱，到目前為止，像OpenAI這樣的前沿人工智能實(shí)驗(yàn)室還沒有將大量的計算能力應(yīng)用于推理模型培訓(xùn)的強(qiáng)化學(xué)習(xí)階段。

那正在改變。OpenAI表示，它應(yīng)用的計算比其前身o1多10倍左右來訓(xùn)練o3，Epoch推測，這些計算大部分都用于強(qiáng)化學(xué)習(xí)。OpenAI研究員Dan Roberts最近透露，該公司的未來計劃要求優(yōu)先使用強(qiáng)化學(xué)習(xí)，以使用更多的計算能力，甚至比初始模型培訓(xùn)還要多。

但每個紀(jì)元，有多少計算可以應(yīng)用于強(qiáng)化學(xué)習(xí)仍然有一個上限。

Epoch的分析師、分析的作者Josh You解釋說，標(biāo)準(zhǔn)人工智能模型培訓(xùn)的績效收益目前每年翻兩番，而強(qiáng)化學(xué)習(xí)的績效收益每3-5個月增長十倍。他繼續(xù)說，推理訓(xùn)練的進(jìn)展“到2026年可能與整體前沿相融合”。

Epoch的分析提出了一些假設(shè)，并部分借鑒了人工智能公司高管的公開評論。但它也證明，由于計算以外的原因，包括高昂的研究間接費(fèi)用，擴(kuò)展推理模型可能被證明具有挑戰(zhàn)性。

“如果研究需要持續(xù)的間接費(fèi)用，推理模型可能不會像預(yù)期的那樣擴(kuò)展，”你寫道?！翱焖儆嬎憧s放可能是推理模型進(jìn)展中非常重要的因素，因此值得密切跟蹤這一點(diǎn)?！?/p>

任何表明推理模型在不久的將來可能會達(dá)到某種限制，這可能會讓人工智能行業(yè)擔(dān)心，因?yàn)槿斯ぶ悄苄袠I(yè)投入了大量資源來開發(fā)這些類型的模型。研究表明，推理模型的運(yùn)行成本可能非常昂貴，但存在嚴(yán)重的缺陷，例如比某些傳統(tǒng)模型更傾向于產(chǎn)生幻覺。

新聞中心

分析發(fā)現(xiàn)，“推理”人工智能模型的改進(jìn)可能會很快放緩

評論

相關(guān)推薦

技術(shù)專區(qū)

新聞中心

分析發(fā)現(xiàn)，“推理”人工智能模型的改進(jìn)可能會很快放緩

評論

相關(guān)推薦

技術(shù)專區(qū)

分析發(fā)現(xiàn)，“推理”人工智能模型的改進(jìn)可能會很快放緩