首頁  資訊  商機   下載  拆解   高校  招聘   雜志  會展  EETV  百科   問答  電路圖  工程師手冊   Datasheet  100例   活動中心  E周刊閱讀   樣片申請
EEPW首頁 >> 主題列表 >> videoworld

讓AI用視覺認識世界,豆包發(fā)布并開源VideoWorld視頻生成模型

  • 2月10日,豆包大模型團隊聯(lián)合北京交通大學、中國科學技術大學,發(fā)布了視頻生成模型——VideoWorld,并且已開源代碼與模型。與Sora、DALL-E等主流多模態(tài)模型不同,VideoWorld開辟了新的路徑,打破對語言模型的依賴,實現(xiàn)僅靠“視覺信息”認知世界。就像幼兒能在不依賴語言的情況下理解真實世界一樣,VideoWorld通過瀏覽視頻數(shù)據(jù),讓機器掌握推理、規(guī)劃和決策等復雜能力。在僅有300M參數(shù)量時,它就已展現(xiàn)出可觀的性能,達到專業(yè)5段9x9圍棋水平,還能在多種環(huán)境中執(zhí)行機器人任務。在模型構建方面,
  • 關鍵字: VideoWorld  模型  機器視覺  
共1條 1/1 1

videoworld介紹

您好,目前還沒有人創(chuàng)建詞條videoworld!
歡迎您創(chuàng)建該詞條,闡述對videoworld的理解,并與今后在此搜索videoworld的朋友們分享。    創(chuàng)建詞條

熱門主題

樹莓派    linux   
關于我們 - 廣告服務 - 企業(yè)會員服務 - 網站地圖 - 聯(lián)系我們 - 征稿 - 友情鏈接 - 手機EEPW
Copyright ?2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
《電子產品世界》雜志社 版權所有 北京東曉國際技術信息咨詢有限公司
備案 京ICP備12027778號-2 北京市公安局備案:1101082052    京公網安備11010802012473