新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 阿里凌晨三點發(fā)布新的視覺推理模型QVQ-Max

阿里凌晨三點發(fā)布新的視覺推理模型QVQ-Max

作者: 時間:2025-03-28 來源:網(wǎng)易科技 收藏

3月28日消息,凌晨三點,在X上發(fā)布。

本文引用地址:http://2s4d.com/article/202503/468767.htm

無標(biāo)題.jpg

作為QVQ-72B-Preview的升級版,官方表示,新模型針對傳統(tǒng)AI在視覺信息處理上的不足進(jìn)行了優(yōu)化,增強(qiáng)了從視覺感知到認(rèn)知推理的能力。

支持圖像、視頻與文本的聯(lián)合推理。在MathVision benchmark測試中,表現(xiàn)出“thinking長度”與準(zhǔn)確率正相關(guān)的特性,驗證了模型在復(fù)雜多模態(tài)任務(wù)中的潛力。

官方表示,QVQ-Max在三方面表現(xiàn)突出:一是細(xì)致觀察,能夠精準(zhǔn)識別圖像中的細(xì)節(jié)和文字標(biāo)識;二是深入推理,結(jié)合背景知識進(jìn)行分析和推理;三是靈活應(yīng)用,支持創(chuàng)意生成和內(nèi)容創(chuàng)作。



關(guān)鍵詞: 阿里 視覺推理模型 QVQ-Max

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉