在LLM方面Google取得成功,而Meta和OpenAI則跌跌撞撞
大型語(yǔ)言模型 (LLM) 的早期歷史由 OpenAI 主導(dǎo),在較小程度上由 Meta 主導(dǎo)。OpenAI 的早期 GPT 模型確立了 LLM 性能的前沿,而 Meta 則通過(guò)提供強(qiáng)大性能的開(kāi)放權(quán)重模型開(kāi)辟了一個(gè)健康的利基市場(chǎng)。開(kāi)放權(quán)重模型具有可公開(kāi)訪(fǎng)問(wèn)的代碼,任何人都可以自由使用、修改和部署這些代碼。
本文引用地址:http://2s4d.com/article/202504/469838.htm這使得包括谷歌在內(nèi)的一些科技巨頭落后了。2017 年,谷歌發(fā)表了一篇關(guān)于支撐大型語(yǔ)言模型的 transformer 架構(gòu)的突破性研究論文,但該公司往往因其在 2023 年推出的拙劣產(chǎn)品而被人們記住,而不是其創(chuàng)新的人工智能研究。
但 Google 強(qiáng)大的新 LLM,以及 Meta 和 OpenAI 的失誤,正在改變這種氛圍。
Llama 4 Herd 走錯(cuò)了蹄子
4 月 5 日星期六,Meta 出人意料地傳出了 Llama 4 發(fā)布的消息。
如果在周末發(fā)布主要型號(hào)的決定讓您感到奇怪,那么您并不孤單。這個(gè)時(shí)機(jī)讓每個(gè)人都措手不及,并在一定程度上掩蓋了接下來(lái)一周的新聞周期中的公告。
Meta 的新型開(kāi)放重量級(jí) LLM 確實(shí)有其優(yōu)勢(shì)。Llama 4 是多模態(tài)的,這意味著它可以處理圖像、音頻和其他模態(tài)。它有三種口味,Llama 4 Behemoth、Maverick 和 Scout,它們有不同的大小和強(qiáng)度。Llama 4 Scout 還擁有高達(dá) 1000 萬(wàn)個(gè)代幣的巨大上下文窗口。標(biāo)記是 LLM 處理和生成的小文本單元,上下文窗口是模型一次可以處理的標(biāo)記數(shù)。更大的上下文窗口有助于模型 “記住” 并在單個(gè)會(huì)話(huà)中處理大量文本。大多數(shù)模型的上下文窗口為 100 萬(wàn)個(gè)或更少。
但是,當(dāng)批評(píng)者注意到 Meta 在 LMArena 上狡猾地進(jìn)行排名時(shí),接受度變得更糟,LMArena 是一個(gè)根據(jù)用戶(hù)投票對(duì) LLM 進(jìn)行排名的網(wǎng)站。Meta 用于排名的特定 Llama 4 模型與其通用版本的一部分提供的模型不同。 LMArena 在一份聲明中表示,Meta 提供了“一個(gè)定制的模型來(lái)優(yōu)化人類(lèi)偏好”。
Meta 還因吹噓 Llama 4 Scout 的 1000 萬(wàn)代幣上下文窗口而受到抨擊。雖然這個(gè)數(shù)字在技術(shù)上似乎是準(zhǔn)確的,但長(zhǎng)期上下文性能的基準(zhǔn)發(fā)現(xiàn) Llama 4 落后于競(jìng)爭(zhēng)模型。
Meta 也沒(méi)有發(fā)布 Llama 4 的“推理”或“思考”模型,并保留了較小的變體,盡管 Meta 表示將提供推理模型。
“他們偏離了更系統(tǒng)地發(fā)布的規(guī)范,在這種版本中,他們把所有的鴨子都排成一排,”AI 咨詢(xún)公司 Gradient Flow 的創(chuàng)始人 Ben Lorika 說(shuō)?!斑@似乎是想讓人們放心,他們有一個(gè)新模型,即使他們沒(méi)有所有組件,比如推理模型和更小的版本。”
GPT-4.5 被迫撤退
近幾個(gè)月來(lái),OpenAI 也遇到了困難。
GPT-4.5 于 2 月 27 日作為研究預(yù)覽版發(fā)布,被吹捧為該公司“迄今為止最大和最好的聊天模型”。OpenAI 發(fā)現(xiàn),事實(shí)上,它在基準(zhǔn)測(cè)試中的表現(xiàn)通常優(yōu)于之前的模型 GPT-4o。
然而,該模型的成本招致了批評(píng)。OpenAI 將模型的 API 訪(fǎng)問(wèn)定價(jià)為每百萬(wàn)個(gè)輸出令牌 150 美元。這比 GPT-15o 高出驚人的 4 倍,后者的價(jià)格僅為每百萬(wàn)個(gè)代幣 10 美元。API 是 OpenAI 為希望在其應(yīng)用程序和服務(wù)中使用 OpenAI 模型的開(kāi)發(fā)人員提供的方法。
“GPT-4.5 可能是 2025 年第一季度發(fā)布的最大的傳統(tǒng) LLM。我估計(jì)它是一個(gè)包含 5.4 萬(wàn)億個(gè)參數(shù)的專(zhuān)家混合模型,“Life Architect 的 AI 顧問(wèn)兼分析師 Alan D. Thompson 說(shuō)?!斑@種原始規(guī)模很難用我們當(dāng)前的硬件限制來(lái)證明是合理的,現(xiàn)在要為龐大的用戶(hù)群提供服務(wù)更具挑戰(zhàn)性?!?/p>
4 月 14 日,OpenAI 宣布將在不到三個(gè)月的時(shí)間內(nèi)逐步減少通過(guò) API 的 GPT-4.5 訪(fǎng)問(wèn)。GPT 4.5 仍然可用,但只能通過(guò) ChatGPT 界面提供給 ChatGPT 用戶(hù)。
OpenAI 在發(fā)布 GPT-4.1 的同時(shí)宣布了這一消息,GPT-4.1 是一種更經(jīng)濟(jì)的模型,價(jià)格為每百萬(wàn)個(gè)代幣 8 美元。OpenAI 的基準(zhǔn)測(cè)試表明,GPT-4.1 總體上不如 GPT 4.5 強(qiáng)大,盡管它在某些編碼基準(zhǔn)測(cè)試中確實(shí)表現(xiàn)得更好。
OpenAI 上周還發(fā)布了新的推理模型:o3 和 o4-mini。o3 模型在基準(zhǔn)測(cè)試中的得分特別高。然而,成本再次成為一個(gè)問(wèn)題,因?yàn)橥ㄟ^(guò) API 訪(fǎng)問(wèn) o3 的價(jià)格為每百萬(wàn)個(gè)輸出代幣 40 美元。
在競(jìng)爭(zhēng)對(duì)手苦苦掙扎時(shí),Google 崛起
Llama 4 和 ChatGPT-4.5 的中等接受度為競(jìng)爭(zhēng)對(duì)手留下了機(jī)會(huì)——他們已經(jīng)擴(kuò)大了自己的優(yōu)勢(shì)。
Meta 艱難地推出 Llama 4 不太可能讓開(kāi)發(fā)人員遠(yuǎn)離 DeepSeek-V3、谷歌的 Gemma 和阿里巴巴的 Qwen2.5。這些 LLM 于 2024 年底問(wèn)世,現(xiàn)在是 LMArena 和 HuggingFace 排行榜上的首選開(kāi)放重量級(jí)模型。在流行的基準(zhǔn)測(cè)試中,它們與 Llama 4 競(jìng)爭(zhēng)或優(yōu)于 Llama 4,通過(guò) API 訪(fǎng)問(wèn)成本低廉,并且在某些情況下可以在消費(fèi)級(jí)計(jì)算機(jī)硬件上下載和使用。
但真正引起人們眼球的是 Google 新的領(lǐng)先 LLM Gemini 2.5 Pro。
3 月 25 日發(fā)布的 Google Gemini 2.5 Pro 是一個(gè)“思維模型”,類(lèi)似于 GPT-o1 和 DeepSeek-R1,它使用自我提示來(lái)推理任務(wù)。Gemini 2.5 Pro 是多模態(tài)的,具有 100 萬(wàn)個(gè)代幣的上下文窗口,并支持深度研究。
Gemini 2.5 很快就贏得了基準(zhǔn)測(cè)試的勝利,包括 SimpleBench 的頭把交椅(盡管它在 4 月 16 日輸給了 OpenAI 的 o3)和 Artificial Analysis 的綜合 AI 智能指數(shù)。Gemini 2.5 Pro 目前也位于 LMArena 的頂部。截至 4 月 14 日,谷歌型號(hào)已經(jīng)占據(jù)了 LMArena 前 10 名中的 5 個(gè)(這包括 Gemini 2.5 Pro、Gemini 2.0 的三個(gè)變體和 Gemma 3-27B)。
強(qiáng)勁的表現(xiàn)足以吸引注意力,但谷歌也是價(jià)格領(lǐng)導(dǎo)者。Google Gemini 2.5 目前可通過(guò) Google 的 Gemini 應(yīng)用程序和 Google 的 AI Studio 網(wǎng)站免費(fèi)使用。Google 的 API 定價(jià)也很有競(jìng)爭(zhēng)力;Gemini 2.5 Pro 的定價(jià)為每 100 萬(wàn)個(gè)輸出代幣 10 美元,而 Gemini 2.0 Flash 的定價(jià)僅為每 100 萬(wàn)個(gè)代幣 40 美分。
“老實(shí)說(shuō),當(dāng)談到高容量時(shí),我可能最終會(huì)使用 DeepSeek-R1 或 Google Gemini 進(jìn)行推理。我會(huì)使用 OpenAI,但我覺(jué)得我必須更加注意價(jià)格,“Lolica 說(shuō)。
當(dāng)然,這并不是說(shuō) Meta 和 OpenAI 沉沒(méi)了。由于 ChatGPT 的流行,OpenAI 尤其有回旋余地,據(jù)報(bào)道,ChatGPT 現(xiàn)在擁有 10 億用戶(hù)。盡管如此,Gemini 的強(qiáng)勁排名和基準(zhǔn)表現(xiàn)表明,LLM 領(lǐng)域正在吹動(dòng)變革之風(fēng)——他們目前更青睞 Google。
評(píng)論