OpenAI放大招!GPT-4.1上線,編程戰(zhàn)力全開
4月15日消息,美國人工智能公司OpenAI本周一宣布推出一系列全新的人工智能模型,這些模型專為編程任務優(yōu)化,旨在應對來自谷歌、Anthropic等公司日益激烈的競爭。開發(fā)者現(xiàn)已可通過OpenAI的應用程序編程接口(API)使用這些模型。
本文引用地址:http://2s4d.com/article/202504/469391.htmOpenAI此次發(fā)布三個版本模型:GPT-4.1、GPT-4.1 Mini和GPT-4.1 Nano。公司首席產(chǎn)品官凱文·韋爾(Kevin Weil)在直播活動中表示,新模型在多方面超越當前主流產(chǎn)品GPT-4o,在某些性能指標上甚至優(yōu)于最強大的旗艦模型GPT-4.5。
在權(quán)威的SWE-Bench編程基準測試中,GPT-4.1獲得55%的得分,較其他OpenAI模型高出幾個百分點。韋爾稱:"這些新模型不僅擅長編程,更能精準執(zhí)行復雜指令,是開發(fā)'智能體'的絕佳選擇。"
近幾個月來,人工智能模型的代碼生成能力顯著提升,推動軟件原型開發(fā)自動化與"智能體"能力升級。競爭對手Anthropic和谷歌均已推出擅長代碼生成的模型。此前業(yè)內(nèi)盛傳OpenAI將發(fā)布GPT-4.1,知情人士透露該公司曾以"Alpha Quasar"為代號在多個評測平臺進行匿名測試。有Reddit用戶反饋該"匿名"模型"修復了其他大語言模型生成的所有不完整代碼"。
新模型能同時分析的代碼量是前代產(chǎn)品的八倍,代碼優(yōu)化與漏洞修復能力顯著提升。其遵循指令能力也大幅改進,用戶無需反復調(diào)整指令即可獲得預期結(jié)果。演示中,GPT-4.1僅憑自然語言提示便快速構(gòu)建出語言學習閃卡應用等程序。
“開發(fā)者非??粗鼐幊棠芰?,我們重點提升了模型生成可執(zhí)行代碼的水平,”O(jiān)penAI后續(xù)訓練團隊負責人米歇爾·波克拉絲(Michelle Pokrass)透露?!拔覀兂掷m(xù)改進模型遵循多種編程格式的能力,使其能更深入地探索代碼庫、可靠運行單元測試,并編寫可直接編譯的代碼?!?/p>
OpenAI表示,GPT-4.1較開發(fā)者最常用的GPT-4o提速40%,查詢輸入成本降低80%。
人工智能編程工具Windsurf的首席執(zhí)行官瓦倫·莫漢(Varun Mohan)在直播中表示,他們在對GPT-4.1進行內(nèi)部基準測試時發(fā)現(xiàn),新模型性能較GPT-4o提高60%。他透露,新模型錯誤行為明顯減少,新模型錯誤讀取和編輯無關文件所耗費的時間顯著減少。
過去幾年中,OpenAI憑借2022年底推出的卓越聊天機器人ChatGPT引發(fā)的狂熱關注,將公眾興趣轉(zhuǎn)化為不斷擴大的業(yè)務,逐步構(gòu)建起包含多款先進模型的商業(yè)版圖。上周,公司首席執(zhí)行官薩姆·奧特曼(Sam Altman)在TED訪談中透露,OpenAI每周活躍用戶已超過5億且持續(xù)快速增長。
如今,OpenAI上線了種類繁多、功能各異、定價各不相同的模型。今年2月份公司發(fā)布最強大的旗艦模型GPT-4.5,不過目前仍處于“研究預覽”階段。
此外,OpenAI還上線了具備模擬推理能力的o1和o3模型。這些模型能夠?qū)栴}分解為多個部分解決,響應用戶的耗時較長,且使用成本較高。
ChatGPT的成功使得競爭對手近年來紛紛加大研發(fā)投入,力圖趕超OpenAI。據(jù)斯坦福大學本月發(fā)布的一份報告,谷歌、DeepSeek等公司開發(fā)的模型性能已經(jīng)比肩OpenAI。報告還指出,Anthropic、Meta以及法國創(chuàng)企Mistral等公司亦緊隨其后。
華盛頓大學名譽教授奧倫·埃齊奧尼(Oren Etzioni)表示,未來不太可能由單一模型或一家公司壟斷市場?!半S著成本下降、開源普及以及生物、芯片設計等專業(yè)領域的專用模型崛起,未來將呈現(xiàn)多元發(fā)展格局。”曾任艾倫人工智能研究所(AI2)負責人的埃齊奧尼呼吁行業(yè)著眼大模型訓練成本與環(huán)境影響。
面對盈利壓力,OpenAI正加速商業(yè)化步伐。今年2月份公司首席運營官布拉德·萊特卡普(Brad Lightcap)接受采訪時表示,每周活躍用戶雖已經(jīng)超過4億,較2024年12月份增長30%,但由于持續(xù)重金投資研發(fā)和基礎設施建設,OpenAI仍虧損數(shù)十億美元。今年1月份,OpenAI宣布將與軟銀、Oracle和MGX合作推進“星際之門”計劃,承諾斥資5000億美元建設人工智能數(shù)據(jù)中心。
近期OpenAI持續(xù)推出新功能。上周,奧特曼宣布ChatGPT將升級“記憶”功能,使聊天機器人能更好地記住并調(diào)用此前的對話內(nèi)容;3月底,奧特曼宣布計劃今年夏季將推出一款開源權(quán)重模型,允許開發(fā)者免費下載并修改,公司將在未來幾周內(nèi)開始測試。由于開放權(quán)重模型能夠根據(jù)不同用途進行定制且使用成本更低,它們已受到研究人員、開發(fā)者和初創(chuàng)企業(yè)的廣泛歡迎。
評論