剛剛,OpenAI放出Operator,能模擬人類上網(wǎng),智能體之戰(zhàn)打響
1月24日消息,今日凌晨,OpenAI 發(fā)布了首款智能體產(chǎn)品“Operator”。這一功能是一款能夠模擬人類操作網(wǎng)頁(yè)瀏覽器的AI助手,支持自動(dòng)完成旅行住宿預(yù)訂、餐廳預(yù)約和在線購(gòu)物等復(fù)雜任務(wù)。
本文引用地址:http://2s4d.com/article/202501/466616.htmOperator 目前以研究預(yù)覽(Research Preview)版本發(fā)布,能夠通過(guò)互聯(lián)網(wǎng)自動(dòng)為用戶執(zhí)行多種任務(wù)。
OpenAI 表示,計(jì)劃很快將其集成到ChatGPT中。目前,該功能僅面向美國(guó)的 Pro 用戶開(kāi)放。
Operator 的底層技術(shù)采用了一種全新的模型——Computer-Using-Agent(CUA)。
CUA 結(jié)合了 GPT-4o 的視覺(jué)能力和強(qiáng)化學(xué)習(xí)的高級(jí)推理能力,使其能夠與 GUI 界面交互。
Operator 可以識(shí)別網(wǎng)頁(yè)界面內(nèi)容,并通過(guò)鼠標(biāo)、鍵盤(pán)完成所有允許的操作,從而實(shí)現(xiàn)自動(dòng)化操作,無(wú)需定制化的 API 集成。
當(dāng)遇到問(wèn)題或出錯(cuò)時(shí),Operator 能利用自身的推理能力進(jìn)行自我糾錯(cuò)。如果無(wú)法解決問(wèn)題,它會(huì)將控制權(quán)交回用戶。
OpenAI 總裁 Greg Brockman 在 X 平臺(tái)發(fā)文稱:“Operator 是一種可以通過(guò)內(nèi)置瀏覽器為用戶執(zhí)行任務(wù)的智能體。2025年將成為智能體之年?!?/p>
評(píng)論