新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > OpenAI放大招!GPT-4.1上線,編程戰(zhàn)力全開

OpenAI放大招!GPT-4.1上線,編程戰(zhàn)力全開

作者: 時間:2025-04-15 來源:網(wǎng)易科技 收藏

4月15日消息,美國公司本周一宣布推出一系列全新的模型,這些模型專為任務優(yōu)化,旨在應對來自谷歌、Anthropic等公司日益激烈的競爭。開發(fā)者現(xiàn)已可通過的應用程序接口(API)使用這些模型。

本文引用地址:http://2s4d.com/article/202504/469391.htm

此次發(fā)布三個版本模型:、 Mini和 Nano。公司首席產(chǎn)品官凱文·韋爾(Kevin Weil)在直播活動中表示,新模型在多方面超越當前主流產(chǎn)品GPT-4o,在某些性能指標上甚至優(yōu)于最強大的旗艦模型GPT-4.5。

無標題.jpg

在權(quán)威的SWE-Bench基準測試中,GPT-4.1獲得55%的得分,較其他OpenAI模型高出幾個百分點。韋爾稱:"這些新模型不僅擅長編程,更能精準執(zhí)行復雜指令,是開發(fā)'智能體'的絕佳選擇。"

近幾個月來,模型的代碼生成能力顯著提升,推動軟件原型開發(fā)自動化與"智能體"能力升級。競爭對手Anthropic和谷歌均已推出擅長代碼生成的模型。此前業(yè)內(nèi)盛傳OpenAI將發(fā)布GPT-4.1,知情人士透露該公司曾以"Alpha Quasar"為代號在多個評測平臺進行匿名測試。有Reddit用戶反饋該"匿名"模型"修復了其他大語言模型生成的所有不完整代碼"。

新模型能同時分析的代碼量是前代產(chǎn)品的八倍,代碼優(yōu)化與漏洞修復能力顯著提升。其遵循指令能力也大幅改進,用戶無需反復調(diào)整指令即可獲得預期結(jié)果。演示中,GPT-4.1僅憑自然語言提示便快速構(gòu)建出語言學習閃卡應用等程序。

“開發(fā)者非??粗鼐幊棠芰?,我們重點提升了模型生成可執(zhí)行代碼的水平,”O(jiān)penAI后續(xù)訓練團隊負責人米歇爾·波克拉絲(Michelle Pokrass)透露?!拔覀兂掷m(xù)改進模型遵循多種編程格式的能力,使其能更深入地探索代碼庫、可靠運行單元測試,并編寫可直接編譯的代碼?!?/p>

OpenAI表示,GPT-4.1較開發(fā)者最常用的GPT-4o提速40%,查詢輸入成本降低80%。

人工智能編程工具Windsurf的首席執(zhí)行官瓦倫·莫漢(Varun Mohan)在直播中表示,他們在對GPT-4.1進行內(nèi)部基準測試時發(fā)現(xiàn),新模型性能較GPT-4o提高60%。他透露,新模型錯誤行為明顯減少,新模型錯誤讀取和編輯無關文件所耗費的時間顯著減少。

過去幾年中,OpenAI憑借2022年底推出的卓越聊天機器人ChatGPT引發(fā)的狂熱關注,將公眾興趣轉(zhuǎn)化為不斷擴大的業(yè)務,逐步構(gòu)建起包含多款先進模型的商業(yè)版圖。上周,公司首席執(zhí)行官薩姆·奧特曼(Sam Altman)在TED訪談中透露,OpenAI每周活躍用戶已超過5億且持續(xù)快速增長。

如今,OpenAI上線了種類繁多、功能各異、定價各不相同的模型。今年2月份公司發(fā)布最強大的旗艦模型GPT-4.5,不過目前仍處于“研究預覽”階段。

此外,OpenAI還上線了具備模擬推理能力的o1和o3模型。這些模型能夠?qū)栴}分解為多個部分解決,響應用戶的耗時較長,且使用成本較高。

ChatGPT的成功使得競爭對手近年來紛紛加大研發(fā)投入,力圖趕超OpenAI。據(jù)斯坦福大學本月發(fā)布的一份報告,谷歌、DeepSeek等公司開發(fā)的模型性能已經(jīng)比肩OpenAI。報告還指出,Anthropic、Meta以及法國創(chuàng)企Mistral等公司亦緊隨其后。

華盛頓大學名譽教授奧倫·埃齊奧尼(Oren Etzioni)表示,未來不太可能由單一模型或一家公司壟斷市場?!半S著成本下降、開源普及以及生物、芯片設計等專業(yè)領域的專用模型崛起,未來將呈現(xiàn)多元發(fā)展格局。”曾任艾倫人工智能研究所(AI2)負責人的埃齊奧尼呼吁行業(yè)著眼大模型訓練成本與環(huán)境影響。

面對盈利壓力,OpenAI正加速商業(yè)化步伐。今年2月份公司首席運營官布拉德·萊特卡普(Brad Lightcap)接受采訪時表示,每周活躍用戶雖已經(jīng)超過4億,較2024年12月份增長30%,但由于持續(xù)重金投資研發(fā)和基礎設施建設,OpenAI仍虧損數(shù)十億美元。今年1月份,OpenAI宣布將與軟銀、Oracle和MGX合作推進“星際之門”計劃,承諾斥資5000億美元建設人工智能數(shù)據(jù)中心。

近期OpenAI持續(xù)推出新功能。上周,奧特曼宣布ChatGPT將升級“記憶”功能,使聊天機器人能更好地記住并調(diào)用此前的對話內(nèi)容;3月底,奧特曼宣布計劃今年夏季將推出一款開源權(quán)重模型,允許開發(fā)者免費下載并修改,公司將在未來幾周內(nèi)開始測試。由于開放權(quán)重模型能夠根據(jù)不同用途進行定制且使用成本更低,它們已受到研究人員、開發(fā)者和初創(chuàng)企業(yè)的廣泛歡迎。



評論


相關推薦

技術(shù)專區(qū)

關閉