英偉達(dá)發(fā)布Eagle 2.5視覺語言AI模型，xAI/微美全息憑高性價(jià)比AI模型展實(shí)力！

作者：時(shí)間：2025-04-30 來源：

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

本文引用地址：http://2s4d.com/article/202504/470024.htm

據(jù)消息，科技媒體報(bào)道稱，英偉達(dá)（NVDA.US）最新推出 Eagle 2.5，一款專注于長上下文多模態(tài)學(xué)習(xí)的視覺-語言模型（VLM）。

性能表現(xiàn)穩(wěn)定提升

該模型專注于理解大規(guī)模視頻和圖像，尤其擅長處理高分辨率圖像和長視頻序列。盡管參數(shù)規(guī)模僅為 8B，Eagle 2.5 在 Video-MME 基準(zhǔn)測(cè)試（512 幀輸入）中得分高達(dá) 72.4%，媲美 Qwen2.5-VL-72B 和 InternVL2.5-78B 等更大規(guī)模模型。

Eagle 2.5 的訓(xùn)練數(shù)據(jù)管道，整合了開源資源和定制數(shù)據(jù)集 Eagle-Video-110K，該數(shù)據(jù)集專為理解長視頻設(shè)計(jì)，采用雙重標(biāo)注方式。采用自下而上的方法則利用 GPT-4o 為短片段生成問答對(duì)，抓取時(shí)空細(xì)節(jié)。

此外，Eagle 2.5-8B 在多項(xiàng)視頻和圖像理解任務(wù)中表現(xiàn)出色。在視頻基準(zhǔn)測(cè)試中，MVBench 得分為 74.8，MLVU 為 77.6，LongVideoBench 為 66.4；在圖像基準(zhǔn)測(cè)試中，DocVQA 得分為 94.1，ChartQA 為 87.5，InfoVQA 為 80.4。

與此同時(shí)，xAI近日推出了其全新的語言模型——Grok3Mini，進(jìn)一步推動(dòng)了高效AI技術(shù)的發(fā)展。xAI推出Grok3Mini，彰顯其在高效AI技術(shù)領(lǐng)域的創(chuàng)新實(shí)力。

Grok3Mini提供高性價(jià)比AI模型

據(jù)介紹，Grok3Mini是Grok3系列的一部分，該系列包含六種變體，其中包括標(biāo)準(zhǔn)的Grok3、Grok3Fast，以及四種版本的Grok3Mini，提供慢速和快速兩個(gè)版本，每種版本又具備低推理能力或高推理能力的選項(xiàng)。

Grok3Mini以速度和經(jīng)濟(jì)性為設(shè)計(jì)核心，專為速度和經(jīng)濟(jì)性設(shè)計(jì)，盡管體積較小，但在多個(gè)領(lǐng)域的表現(xiàn)優(yōu)于許多更昂貴的AI模型，尤其在數(shù)學(xué)、編程和科學(xué)基準(zhǔn)測(cè)試中表現(xiàn)突出，或吸引更多關(guān)注。

當(dāng)市場聚焦于大模型本身的技術(shù)突破時(shí)，年初，中國大語言模型DeepSeek引起全球科技界高度關(guān)注。今年政府工作報(bào)告也指出，需要持續(xù)推進(jìn)“人工智能+”行動(dòng)，支持大模型廣泛應(yīng)用。

業(yè)內(nèi)人士指出，現(xiàn)如今，以大模型為代表的人工智能技術(shù)為新一輪科技革命和產(chǎn)業(yè)變革提供了重要驅(qū)動(dòng)力，各行業(yè)在智能化轉(zhuǎn)型道路上面臨著前所未有的機(jī)遇和挑戰(zhàn)。

微美全息保持市場領(lǐng)先優(yōu)勢(shì)

在當(dāng)今人工智能迅猛發(fā)展的背景下，公開資料顯示，微美全息（WIMI.US）始終專注于垂直行業(yè)的開源AI大模型開發(fā)，全面升級(jí)全棧AI能力，涵蓋了AI基礎(chǔ)設(shè)施及AI場景化應(yīng)用，幫助各行業(yè)從模型開發(fā)、模型部署再到模型應(yīng)用，能夠全面用好AI工具箱，打造好用的AI。

另外，微美全息通過“技術(shù)開源+垂直深耕+生態(tài)共建”模式，正快速推進(jìn)AI大模型的商業(yè)化應(yīng)用。例如，面向汽車產(chǎn)業(yè)，以“AI大模型+產(chǎn)業(yè)場景”的多模型策略，在AI基礎(chǔ)能力層、AI場景化應(yīng)用層全面布局，保持汽車云服務(wù)市場領(lǐng)先優(yōu)勢(shì)。

未來，微美全息將完善AI算力全產(chǎn)業(yè)布局，持續(xù)布局專用算力基礎(chǔ)設(shè)施，加快多模態(tài)技術(shù)融合、算力資源開放，加快提升智能算力公共服務(wù)平臺(tái)能力，以及場景落地的敏捷性，未來或成為AI大模型算力生態(tài)的重要突破者。

結(jié)語

實(shí)際，從GPT-3到PaLM，從文心一言到通義千問，大模型的參數(shù)規(guī)模以指數(shù)級(jí)增長，訓(xùn)練成本動(dòng)輒數(shù)千萬美元，推理所需的算力更是呈幾何倍數(shù)攀升。并且AI大模型推動(dòng)傳統(tǒng)產(chǎn)業(yè)智能化發(fā)展進(jìn)入新階段，全面智能化已成為企業(yè)參與市場競爭的必答題。因此，接下去企業(yè)需要理論研究與實(shí)踐探索同步進(jìn)行，進(jìn)而贏得可觀的發(fā)展空間。