全球最小AI「桌面超算」發(fā)布,英偉達B端C端兩手抓
每年在美國拉斯維加斯舉辦的國際消費電子展(CES)是科技圈最重要的盛會。今年,英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛發(fā)表開幕主題演講,推出了多款新品 —— GeForce RTX 50系列GPU、支持機器人開發(fā)的世界模型Cosmos,以及一臺被他稱作“世界上最小的個人超級計算機”Project Digits。
本文引用地址:http://2s4d.com/article/202501/466169.htm1993年,英偉達創(chuàng)立后經(jīng)歷了多個重要時間節(jié)點:1999年,發(fā)布世界首款GPU產(chǎn)品;2006年,推出GeForce 8800 Ultra顯卡,并提出CUDA(統(tǒng)一計算架構(gòu))這一概念,引領(lǐng)了后續(xù)的GPU算力發(fā)展。在AI領(lǐng)域,英偉達在十多年前就已經(jīng)洞察到AI的影響力,并一路伴隨著AI行業(yè)的發(fā)展。
亮相即“王炸”
GeForce RTX 50系列GPU中最受矚目的GeForce RTX 5090,是英偉達目前最強大的顯卡,其速度是其前身RTX 4090的兩倍。新一代基于Blackwell架構(gòu)的RTX 5090晶體管數(shù)量從上一代的763億(Ada Lovelace架構(gòu))提升至920億,可提供3400 TOPS算力,具備4000 AI TOPS(每秒萬億次操作)的性能。
此次英偉達公布了RTX 5090、RTX 5080、RTX 5070 Ti、RTX 5070四款桌面平臺GPU和對應(yīng)的四款移動平臺GPU。RTX 5070、RTX 5070 Ti、RTX 5080和RTX 5090的售價分別為:549美元、749美元、999美元和1999美元;而搭載RTX 5090、RTX 5080、5070 Ti和5070的筆記本售價分別為2899、2199、1599和1299美元,預(yù)計將于三月份上市。
黃仁勛特別提到,售價僅549美元的RTX 5070顯卡的性能將足以媲美去年推出的RTX 4090 GPU,而后者的售價高達1600美元。黃仁勛直言:“沒有人工智能,這是不可能實現(xiàn)的”。到了AI時代,傳統(tǒng)基于CPU的說明式硬編碼開發(fā)模式,也應(yīng)該轉(zhuǎn)型為基于GPU、機器學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)的AI模式。而強大的GPU,正是這一轉(zhuǎn)變的起點。
值得注意的是,由于美國出口管制,英偉達無法在中國市場銷售RTX 5090,取而代之是RTX 5090D,定價16499元。和RTX 5090相比,RTX 5090D擁有2375AI TOPS算力,是RTX 5090的70%,是RTX 4090D的200%。
在RTX 50系顯卡上,英偉達同步推出了最新一代的DLSS 4。簡單來說,DLSS 4改用了由英偉達超級計算機訓(xùn)練的全新Transformer AI模型,提升了DLSS 4的渲染精度和穩(wěn)定性,從而為用戶提供更好的畫面和更高的分辨率。另外,基于第五代Tensor Core的能力,RTX 50系列的DLSS多幀生成技術(shù)取代了RTX 40系列的DLSS幀生成,可以為每一個實際渲染幀額外生成最多3幀畫面,這對游戲平均幀率有相當顯著的提升。
全新物理AI模型Cosmos
此外,英偉達還宣布推出Cosmos平臺,集成了先進的生成式世界基礎(chǔ)模型(WFM)、高級分詞器、護欄系統(tǒng)和加速的視頻處理管道,這個平臺被稱為加速「物理AI」發(fā)展的關(guān)鍵一步,將極大地推動自動駕駛和機器人等對物理場景要求較高的領(lǐng)域邁向更高水平。
物理AI(也稱為生成式物理AI)是一種使自主機器能夠在真實物理世界中感知、理解和執(zhí)行復(fù)雜交互操作的技術(shù)。它擴展了傳統(tǒng)的生成式AI,使其能夠理解3D世界的空間關(guān)系和物理行為,通俗地理解就是人工智能反饋的內(nèi)容要符合物理規(guī)律。例如,傳統(tǒng)的機器人只能按照預(yù)設(shè)程序執(zhí)行任務(wù),而搭載物理AI的機器人則能夠更好地識別物體、預(yù)測運動軌跡、并根據(jù)物理規(guī)律做出相應(yīng)的反應(yīng)。
“物理AI將徹底改變價值50萬億美元的制造業(yè)和物流業(yè),”黃仁勛在本次CES國際消費電子展上表示,從汽車、卡車到工廠、倉庫,所有移動的事物都將實現(xiàn)機器人化并由AI驅(qū)動,強調(diào)AI的新一波浪潮是物理AI。
物理AI的開發(fā)極為復(fù)雜,需要海量的真實世界數(shù)據(jù)和長時間的測試,開發(fā)成本高昂。而英偉達的Cosmos平臺使用了NeMo Curator框架以及CUDA加速數(shù)據(jù)處理流水線,在14天內(nèi)即可完成對2000萬小時視頻的處理工作,而這一任務(wù)在傳統(tǒng)CPU環(huán)境下需要3.4年。
英偉達構(gòu)建了一個完整的物理AI生態(tài)系統(tǒng),包含以O(shè)mniverse、Cosmos、Isaac Sim等關(guān)鍵組成部分。開發(fā)者可以利用Omniverse創(chuàng)建虛擬的三維場景,再由Cosmo生成如同高度擬真的訓(xùn)練場景,其中Cosmos WFMs能夠快速生成基于真實物理規(guī)律的高仿真數(shù)據(jù),降低依賴昂貴現(xiàn)實數(shù)據(jù)的需求。這些模型通過將文本、圖像、視頻以及機器人傳感器數(shù)據(jù)結(jié)合,生成多樣化的物理環(huán)境場景,比如雪地駕駛、擁擠倉庫等。
Cosmos模型將有三種尺寸:Nano、Super和Ultra。英偉達表示Cosmos模型會以開放模型許可的方式發(fā)布,開發(fā)者可以通過NVIDIA API目錄預(yù)覽首批模型,或從NVIDIA NG目錄或Hugging Face下載完整的模型家族和微調(diào)框架。目前,多家領(lǐng)先的機器人和汽車公司,包括1X、Agile Robots、以及汽車共享巨頭Uber,已成為首批采用Cosmos平臺的企業(yè),或許機器人也即將迎來“ChatGPT時刻”。
可以說Cosmos的發(fā)布,補全了英偉達物理AI體系中“理解世界”的重要一環(huán)。從此次發(fā)布的產(chǎn)品來看,英偉達在AI領(lǐng)域的進度已經(jīng)甩掉同行一大截,而在CUDA、Tensor的“封鎖下”,英偉達還將繼續(xù)引領(lǐng)高算力AI平臺,乃至整個AI行業(yè)的發(fā)展,成為AI產(chǎn)業(yè)名副其實的“柱石”。
全球最小的個人AI超算
2025年,AI已經(jīng)成為了科技發(fā)展的主戰(zhàn)場,昂貴、龐大的AI超算,從某種程度上其實也阻礙了AI的進步。對此,黃仁勛帶來了英偉達的「One More Thing」 —— Project Digits桌面AI超級計算機。
核心方面,Project Digits搭載的GB10超級芯片由Blackwell CPU和Grace CPU組成,其中Grace CPU包含20個ARM核心。同時,Project Digits也配備了128GB LPDDR5X內(nèi)存和4TB SSD。另外,Project Digits除了可以單獨使用,還可以兩個單元疊加使用,疊加狀態(tài)下甚至可以運行超過4000億參的模型。
其實,市場一直關(guān)注英偉達在PC領(lǐng)域的動作。早在2023年年底,路透社就曝光過英偉達正在秘密研發(fā)一款基于ARM架構(gòu)的PC CPU,支持Windows操作系統(tǒng),進軍個人電腦領(lǐng)域與英特爾、AMD的“x86聯(lián)盟”競爭;2024年10月,臺灣經(jīng)濟時報又爆出來自中國臺灣供應(yīng)鏈方面的消息,表示英偉達將與聯(lián)發(fā)科合作設(shè)計一款基于3nm的PC CPU,2025年進軍PC CPU領(lǐng)域。
但是Project Digits與先前爆料的PC CPU并非同一款產(chǎn)品。無論是功能還是目標用戶,Project Digits定位上更接近于蘋果Mac和微軟Surface旗下的工作站計算機,而非一般意義上的個人電腦。黃仁勛表示:“我們將AI超級計算機放在每個數(shù)據(jù)科學(xué)家、AI研究人員和學(xué)生的辦公桌上,使他們能夠參與和塑造AI時代?!?/strong>
這個產(chǎn)品本身尺寸類似Mac Mini,可以放在桌子上并使用標準電源插座供電,既能夠用作小型工作站,也可以與現(xiàn)有PC配合使用。根據(jù)英偉達介紹,Project Digits定價3000美元,最快5月上市。但值得關(guān)注的是,英偉達在官方聲明中提到了與聯(lián)發(fā)科的合作,稱聯(lián)發(fā)科參與了GB10的設(shè)計,“在能效、性能和互連上做出了貢獻”。
期待更高的重磅產(chǎn)品“缺席”?
英偉達通常會在CES展會上發(fā)布重要的產(chǎn)品公告,許多投資者希望獲得Blackwell更具體的進展信息,以及對下一代數(shù)據(jù)中心GPU架構(gòu)Rubin的更多介紹。但CES是消費電子產(chǎn)品的主場,黃仁勛在演進中并未透露更多數(shù)據(jù)中心產(chǎn)品業(yè)務(wù)線的信息,只提到“Blackwell已全面投入生產(chǎn)”。
此前,英偉達在2024年11月的財報電話會議中確認,Blackwell芯片的生產(chǎn)已在本季度加速,預(yù)計將提前向客戶發(fā)貨。市場預(yù)期,這些芯片將推動英偉達產(chǎn)品需求進入一個新的增長周期。2024年8月,其首款產(chǎn)品B200 GPU被曝存在設(shè)計缺陷,遇到了散熱、封裝緊缺等一系列工程難題,市場當時緊張猜測英偉達是否會延遲交貨。
雖然在這次CES上沒有等到更多相關(guān)的爆料,但根據(jù)英偉達的規(guī)劃,本月月底即將發(fā)布的第四財季財報與3月要舉辦的GTC大會,才是英偉達回到主場的重頭戲。
近年來,摩爾定律的發(fā)展速度有所放緩。然而,黃仁勛聲稱,英偉達的AI芯片正以自身的加速節(jié)奏發(fā)展,“我們可以同時構(gòu)建架構(gòu)、芯片、系統(tǒng)、庫和算法,如果這樣做,我們就能比摩爾定律更快地發(fā)展,因為我們可以在整個技術(shù)棧中進行創(chuàng)新”,性能提升速度已遠超數(shù)十年來推動計算機技術(shù)進步的摩爾定律設(shè)定的標準,AI世界正以「超摩爾定律」的速度發(fā)展。
黃仁勛還強調(diào),隨著計算能力的提升,AI推理成本將逐步降低,類似于摩爾定律推動計算成本下降的歷史進程。英偉達最新的數(shù)據(jù)中心超級芯片GB200 NVL72,在運行AI推理工作負載方面的速度比H100快30-40倍,成本將隨著時間的推移而降低,預(yù)計這種趨勢將隨著AI推理模型的發(fā)展而繼續(xù)下去。
評論