新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 便宜大碗,阿里云開源Qwen3系列大模型

便宜大碗,阿里云開源Qwen3系列大模型

作者: 時(shí)間:2025-04-29 來源:網(wǎng)易科技 收藏

4月29日凌晨,正式系列大模型,包括2個(gè)MoE模型和6個(gè)稠密模型。發(fā)布僅2小時(shí),已在GitHub收獲超16.9k顆Star。

本文引用地址:http://2s4d.com/article/202504/469961.htm

據(jù)介紹,旗艦?zāi)P?a class="contentlabel" href="http://2s4d.com/news/listbylabel/label/Qwen3">Qwen3-235B-A22B在編程、數(shù)學(xué)、通用能力等基準(zhǔn)測試中登頂全球,超越、等主流模型。

無標(biāo)題.jpg

Qwen3系列是全球首個(gè)的混合推理(混合思考模式)大模型。也就是說它可根據(jù)任務(wù)自由切換“思考模式”和“非思考模式”,在不同推理深度下優(yōu)化輸出效果和效率。

新一代Qwen3提供8個(gè)不同尺寸的模型,覆蓋0.6B到235B參數(shù)規(guī)模,幾乎適配從輕量端到旗艦部署的各類應(yīng)用場景。旗艦?zāi)P蚎wen3-235B-A22B在推理成本上也顯著優(yōu)化,部署成本僅為DeepSeek R1的三分之一。

此外,在功能擴(kuò)展上,Qwen3全面支持MCP(模型上下文協(xié)議),使大模型能夠與外部數(shù)據(jù)源、工具系統(tǒng)深度集成,提升Agent復(fù)雜任務(wù)處理能力。

同時(shí),Qwen3模型支持119種語言和方言,進(jìn)一步強(qiáng)化了全球適配性。

目前,Qwen3系列已在Hugging Face、ModelScope和Kaggle等平臺(tái),遵循Apache 2.0協(xié)議。



評(píng)論


相關(guān)推薦

流程圖:

技術(shù)專區(qū)

關(guān)閉