新聞中心

EEPW首頁 > 業(yè)界動態(tài) > Meta推出開源AI模型Llama 4

Meta推出開源AI模型Llama 4

作者: 時間:2025-04-08 來源:電子產(chǎn)品世界 收藏

由于DeepSeek等競品引發(fā)壓力,推出新一代集合 4。目前, 4擁有Scout和Maverick兩個版本,均以形式發(fā)布。在聲明中表示, 4是一個多模態(tài)系統(tǒng),能夠處理和整合文本、視頻、圖像、音頻等多種數(shù)據(jù)類型,并能在不同格式之間實(shí)現(xiàn)內(nèi)容轉(zhuǎn)換。

本文引用地址:http://2s4d.com/article/202504/469153.htm

Llama 4系列是首款采用混合專家架構(gòu)(MoE)的,這一架構(gòu)在訓(xùn)練及用戶查詢回答過程中展現(xiàn)出更高效率,通過將模型劃分為多個專注于特定任務(wù)的“專家”子模型,實(shí)現(xiàn)精準(zhǔn)而高效的處理。中國實(shí)驗(yàn)室DeepSeek模型的成功(其性能與Meta之前的旗艦Llama模型相當(dāng)甚至更優(yōu))促使Llama開發(fā)進(jìn)入加速模式,據(jù)說Meta組建了緊急工作組,以破解DeepSeek如何降低R1和V3等模型的運(yùn)行和部署成本。

640-4.png

Scout版本配備170億活躍參數(shù)、16個“專家”模型及1090億總參數(shù);而Maverick版本同樣擁有170億活躍參數(shù),但“專家”模型數(shù)量增加至128個,總參數(shù)量飆升至4000億。此外,Meta還預(yù)告了Llama 4 Behemoth,稱其為“全球最聰明的語言模型之一,將作為未來模型訓(xùn)練的教師模型”。

Scout和Maverick已在Llama.com和Meta合作伙伴(包括AI開發(fā)平臺Hugging Face)上公開提供,而Behemoth仍在訓(xùn)練中。Meta表示,其AI助手Meta AI已在40個國家的WhatsApp、Messenger和Instagram等應(yīng)用中更新為使用Llama 4。多模態(tài)功能目前僅限美國地區(qū)使用英語。

Meta尚未發(fā)布的Behemoth將需要更強(qiáng)大的硬件,擁有2880億活躍參數(shù)、16位專家和近2萬億總參數(shù)。Meta的內(nèi)部基準(zhǔn)測試顯示,Behemoth在衡量數(shù)學(xué)問題解決等STEM技能的多項評估中優(yōu)于GPT-4.5、Claude 3.7 Sonnet和Gemini 2.0 Pro(但不及2.5 Pro)。

Llama 4模型系列中沒有一個是類似OpenAI的o1和o3-mini那樣的真正"推理"模型,推理模型會對其回答進(jìn)行事實(shí)檢查,通常對問題的回應(yīng)更可靠,但因此比傳統(tǒng)的"非推理"模型需要更長時間來提供答案。另外,Meta表示它調(diào)整了所有Llama 4模型,使其拒絕回答"有爭議"問題的頻率降低,表示Llama 4在處理它完全不會回應(yīng)的提示方面"平衡性大大提高"。

但是值得注意的是,Llama 4在內(nèi)部基準(zhǔn)測試中“表現(xiàn)不佳”,尤其是在數(shù)學(xué)處理能力和推理能力方面。雖然目前Llama 4仍需更多時間優(yōu)化,據(jù)稱扎克伯格此前給全員下了死命令,4月底是Llama 4交付最后期限。



關(guān)鍵詞: Meta 開源 AI 模型 Llama

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉