新聞中心

EEPW首頁 > 新聞縱覽 > 英偉達(dá)發(fā)布Eagle 2.5視覺語言AI模型,xAI/微美全息憑高性價(jià)比AI模型展實(shí)力!

英偉達(dá)發(fā)布Eagle 2.5視覺語言AI模型,xAI/微美全息憑高性價(jià)比AI模型展實(shí)力!

作者: 時(shí)間:2025-04-30 來源: 收藏


本文引用地址:http://2s4d.com/article/202504/470024.htm

據(jù)消息,科技媒體報(bào)道稱,英偉達(dá)(NVDA.US)最新推出 Eagle 2.5,一款專注于長上下文多模態(tài)學(xué)習(xí)的視覺-語言模型(VLM)。

性能表現(xiàn)穩(wěn)定提升

該模型專注于理解大規(guī)模視頻和圖像,尤其擅長處理高分辨率圖像和長視頻序列。盡管參數(shù)規(guī)模僅為 8B,Eagle 2.5 在 Video-MME 基準(zhǔn)測試(512 幀輸入)中得分高達(dá) 72.4%,媲美 Qwen2.5-VL-72B 和 InternVL2.5-78B 等更大規(guī)模模型。

Eagle 2.5 的訓(xùn)練數(shù)據(jù)管道,整合了開源資源和定制數(shù)據(jù)集 Eagle-Video-110K,該數(shù)據(jù)集專為理解長視頻設(shè)計(jì),采用雙重標(biāo)注方式。采用自下而上的方法則利用 GPT-4o 為短片段生成問答對,抓取時(shí)空細(xì)節(jié)。

此外,Eagle 2.5-8B 在多項(xiàng)視頻和圖像理解任務(wù)中表現(xiàn)出色。在視頻基準(zhǔn)測試中,MVBench 得分為 74.8,MLVU 為 77.6,LongVideoBench 為 66.4;在圖像基準(zhǔn)測試中,DocVQA 得分為 94.1,ChartQA 為 87.5,InfoVQA 為 80.4。

與此同時(shí),xAI近日推出了其全新的語言模型——Grok3Mini,進(jìn)一步推動(dòng)了高效AI技術(shù)的發(fā)展。xAI推出Grok3Mini,彰顯其在高效AI技術(shù)領(lǐng)域的創(chuàng)新實(shí)力。

Grok3Mini提供高性價(jià)比AI模型

據(jù)介紹,Grok3Mini是Grok3系列的一部分,該系列包含六種變體,其中包括標(biāo)準(zhǔn)的Grok3、Grok3Fast,以及四種版本的Grok3Mini,提供慢速和快速兩個(gè)版本,每種版本又具備低推理能力或高推理能力的選項(xiàng)。

Grok3Mini以速度和經(jīng)濟(jì)性為設(shè)計(jì)核心,專為速度和經(jīng)濟(jì)性設(shè)計(jì),盡管體積較小,但在多個(gè)領(lǐng)域的表現(xiàn)優(yōu)于許多更昂貴的AI模型,尤其在數(shù)學(xué)、編程和科學(xué)基準(zhǔn)測試中表現(xiàn)突出,或吸引更多關(guān)注。

當(dāng)市場聚焦于大模型本身的技術(shù)突破時(shí),年初,中國大語言模型DeepSeek引起全球科技界高度關(guān)注。今年政府工作報(bào)告也指出,需要持續(xù)推進(jìn)“人工智能+”行動(dòng),支持大模型廣泛應(yīng)用。

業(yè)內(nèi)人士指出,現(xiàn)如今,以大模型為代表的人工智能技術(shù)為新一輪科技革命和產(chǎn)業(yè)變革提供了重要驅(qū)動(dòng)力,各行業(yè)在智能化轉(zhuǎn)型道路上面臨著前所未有的機(jī)遇和挑戰(zhàn)。

微美全息保持市場領(lǐng)先優(yōu)勢

在當(dāng)今人工智能迅猛發(fā)展的背景下,公開資料顯示,微美全息(WIMI.US)始終專注于垂直行業(yè)的開源AI大模型開發(fā),全面升級(jí)全棧AI能力,涵蓋了AI基礎(chǔ)設(shè)施及AI場景化應(yīng)用,幫助各行業(yè)從模型開發(fā)、模型部署再到模型應(yīng)用,能夠全面用好AI工具箱,打造好用的AI。

另外,微美全息通過“技術(shù)開源+垂直深耕+生態(tài)共建”模式,正快速推進(jìn)AI大模型的商業(yè)化應(yīng)用。例如,面向汽車產(chǎn)業(yè),以“AI大模型+產(chǎn)業(yè)場景”的多模型策略,在AI基礎(chǔ)能力層、AI場景化應(yīng)用層全面布局,保持汽車云服務(wù)市場領(lǐng)先優(yōu)勢。

未來,微美全息將完善AI算力全產(chǎn)業(yè)布局,持續(xù)布局專用算力基礎(chǔ)設(shè)施,加快多模態(tài)技術(shù)融合、算力資源開放,加快提升智能算力公共服務(wù)平臺(tái)能力,以及場景落地的敏捷性,未來或成為AI大模型算力生態(tài)的重要突破者。

結(jié)語

實(shí)際,從GPT-3到PaLM,從文心一言到通義千問,大模型的參數(shù)規(guī)模以指數(shù)級(jí)增長,訓(xùn)練成本動(dòng)輒數(shù)千萬美元,推理所需的算力更是呈幾何倍數(shù)攀升。并且AI大模型推動(dòng)傳統(tǒng)產(chǎn)業(yè)智能化發(fā)展進(jìn)入新階段,全面智能化已成為企業(yè)參與市場競爭的必答題。因此,接下去企業(yè)需要理論研究與實(shí)踐探索同步進(jìn)行,進(jìn)而贏得可觀的發(fā)展空間。



關(guān)鍵詞:

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉