從軟硬件到生態(tài)加速AI PC革命,英偉達(dá)憑實(shí)力證明RTX就是AI
發(fā)布人:芯東西
時(shí)間:2023-12-17
來(lái)源:工程師
發(fā)布文章
加入技術(shù)交流群
掃碼加入
和技術(shù)大咖面對(duì)面交流
海量資料庫(kù)查詢
一個(gè)插件讓顯卡速度翻3倍?解密英偉達(dá)AIGC時(shí)代的最新王牌。作者 | 云鵬
編輯 | 漠影
最近的AIGC圈著實(shí)迎來(lái)了一波新品發(fā)布小高潮!先是谷歌Gemini突然深夜炸場(chǎng),硬剛OpenAI的GPT-4,然后是斯坦??茖W(xué)家李飛飛團(tuán)隊(duì)亮出AI視頻生成模型W.A.L.T,拳打Pika腳踢Gen-2,最近微軟又發(fā)布了手機(jī)端側(cè)都能跑的小語(yǔ)言模型Phi-2,平均性能甚至超過(guò)Llama 2。
01.從通用計(jì)算到加速計(jì)算,從數(shù)據(jù)中心到PC,英偉達(dá)CUDA生態(tài)占C位
02.兼容性架構(gòu)鋪路,TensorRT-LLM讓推理性能翻倍,AI繪圖進(jìn)入“秒速時(shí)代”
03.DLSS用AI改寫(xiě)游戲產(chǎn)業(yè),英偉達(dá)為開(kāi)發(fā)者武裝到牙齒,RTX就是AI
04.結(jié)語(yǔ):AIGC時(shí)代要想玩轉(zhuǎn)AI,英偉達(dá)是徹底繞不開(kāi)了
編輯 | 漠影
最近的AIGC圈著實(shí)迎來(lái)了一波新品發(fā)布小高潮!先是谷歌Gemini突然深夜炸場(chǎng),硬剛OpenAI的GPT-4,然后是斯坦??茖W(xué)家李飛飛團(tuán)隊(duì)亮出AI視頻生成模型W.A.L.T,拳打Pika腳踢Gen-2,最近微軟又發(fā)布了手機(jī)端側(cè)都能跑的小語(yǔ)言模型Phi-2,平均性能甚至超過(guò)Llama 2。
▲W.A.L.T文生視頻案例片段
AI大模型火爆之下,各路科技巨頭幾乎都在“All in AI”,而AI軍備競(jìng)賽已經(jīng)很快從云端卷到了端側(cè),從智能手機(jī)到PC,我們身邊各類熟悉的智能硬件都已被卷入這場(chǎng)大模型浪潮。各類智能助手、各類AIGC相關(guān)應(yīng)用如雨后春筍般涌現(xiàn),各類“GPTs”已經(jīng)逐漸進(jìn)入大眾視野。熱況之下,AI大模型在端側(cè)的落地離不開(kāi)底層硬件的支持,英偉達(dá)、英特爾、AMD等大廠也不斷亮出各種應(yīng)對(duì)AI新時(shí)代的軟硬件新品,加速著AI PC時(shí)代的到來(lái)。PC作為算力最強(qiáng)的消費(fèi)級(jí)產(chǎn)品,成為AI大模型在端側(cè)應(yīng)用的最理想平臺(tái)之一。毫無(wú)疑問(wèn),AI將成為PC產(chǎn)業(yè)發(fā)展的一個(gè)關(guān)鍵拐點(diǎn),AI也會(huì)徹底改變玩家、創(chuàng)作者、上班族、學(xué)生乃至每一個(gè)普通PC用戶的體驗(yàn)。▲圖片由Bing創(chuàng)作,來(lái)源:PCWorld
目前全球搭載英偉達(dá)RTX GPU的Windows PC和工作站已經(jīng)超過(guò)了1億臺(tái),英偉達(dá)作為AI大模型時(shí)代最核心的全棧玩家,正通過(guò)全棧生態(tài)的賦能讓這些“RTX PC”的AI性能有翻倍式暴漲。在我們熟悉的文生圖應(yīng)用Stable Diffusion中,基于英偉達(dá)的RTX專用加速插件,一張RTX 4090僅用49秒就可以生成100張高質(zhì)量圖像,速度翻了3倍,而這樣的升級(jí)甚至不需要改變其他硬件配置。英偉達(dá)RTX相關(guān)技術(shù)在AI領(lǐng)域的應(yīng)用,讓全球無(wú)數(shù)開(kāi)發(fā)者可以更輕松、高效地創(chuàng)建AI應(yīng)用,人們使用PC的方式,也在潛移默化中改變著。英偉達(dá)如何為AI PC時(shí)代的底層筑基?英偉達(dá)在AIGC時(shí)代藏得最深的王牌又是什么?今天,從硬件、軟件到生態(tài),英偉達(dá)似乎已經(jīng)和AI畫(huà)上了等號(hào)。01.從通用計(jì)算到加速計(jì)算,從數(shù)據(jù)中心到PC,英偉達(dá)CUDA生態(tài)占C位
02.兼容性架構(gòu)鋪路,TensorRT-LLM讓推理性能翻倍,AI繪圖進(jìn)入“秒速時(shí)代”
▲TensorRT-LLM v0.6.0可以帶來(lái)最高5倍推理性能提升
實(shí)際上,TensorRT-LLM有著這樣的表現(xiàn),與CUDA的特性是密不可分的。英偉達(dá)CFO在財(cái)報(bào)電話會(huì)中特別提到,他們之所以能夠創(chuàng)建TensorRT-LLM,正是因?yàn)镃UDA是可編程的,如果CUDA和其對(duì)應(yīng)的GPU不是可編程的,以如今這樣快的速度迭代改進(jìn)軟件棧是很難實(shí)現(xiàn)的。經(jīng)過(guò)20多年的深耕,每一個(gè)英偉達(dá)GPU的背后,都是不斷迭代更新的軟件棧在做堅(jiān)實(shí)支撐,而CUDA的靈活性和兼容性無(wú)一不是這一生態(tài)的突出優(yōu)勢(shì)。英偉達(dá)有著規(guī)模龐大的生態(tài)系統(tǒng)軟件開(kāi)發(fā)人員、系統(tǒng)制造商生態(tài)系統(tǒng)和分銷合作網(wǎng)絡(luò),而將這些真正連結(jié)在一起形成一個(gè)高效生態(tài)系統(tǒng)的,正是英偉達(dá)CUDA軟件生態(tài)和架構(gòu)層面的兼容性。▲TensorRT擴(kuò)展的配置需求,由Bilibili UP主Nenly同學(xué)制作
根據(jù)Bilibili平臺(tái)上一位專業(yè)設(shè)計(jì)師UP主Nenly同學(xué)的測(cè)試,在Tensor RT的加持下,Stable Diffusion這一熱門(mén)文生圖應(yīng)用基于RTX GPU生成的模型推理速度直接提升了2倍甚至3倍以上,AI繪畫(huà)進(jìn)入了“秒速時(shí)代”。▲標(biāo)準(zhǔn)StableDiffusion與TensorRT引擎優(yōu)化后相比,每分鐘繪制圖片數(shù)的差異,由Bilibili UP主Nenly同學(xué)制作
根據(jù)Nenly同學(xué)發(fā)布視頻,在GeForce RTX 4090上,Stable Diffusion的運(yùn)行速度是使用蘋(píng)果M2 Ultra的Mac頂配版的7倍。甚至4060Ti在TensorRT擴(kuò)展的支持下,生成圖片的速度已經(jīng)超過(guò)了加速前的4090。對(duì)于一些需要大量出具草圖的創(chuàng)意工作者們來(lái)說(shuō),這樣的加速能力所帶來(lái)的收益是極為明顯的。面對(duì)數(shù)千張圖片吞吐量的工作,節(jié)省下來(lái)的時(shí)間可能是以天計(jì)算的。比如被譽(yù)為“插畫(huà)領(lǐng)域的劉慈欣”、“國(guó)內(nèi)科幻繪畫(huà)第一人”,也是首位獲得全球雨果獎(jiǎng)的華人藝術(shù)家趙恩哲,在工作中就使用了全流程經(jīng)GeForce RTX GPU加速的Stable Diffusion進(jìn)行創(chuàng)作,AI輔助創(chuàng)作工具可以省掉細(xì)化時(shí)間,同時(shí)給他很多意向不到的創(chuàng)作設(shè)計(jì)可能。▲《虛空之舟》——使用SD創(chuàng)作,全流程經(jīng)GeForce RTX GPU加速
趙恩哲特別說(shuō)道,其實(shí)每位創(chuàng)作者都渴望將腦海中的世界完美呈現(xiàn),但由于技術(shù)門(mén)檻和工業(yè)化流程等方面的限制,他們過(guò)去只能在概念設(shè)計(jì)與最終呈現(xiàn)之間做出妥協(xié)。但如今,借助英偉達(dá)GeForce RTX顯卡的強(qiáng)大算力以及SD、RUNWAY等AI創(chuàng)意工具,概念設(shè)計(jì)師可以突破限制,在短短幾秒內(nèi)嘗試所有想法,相信今后有了更強(qiáng)大的算力加持,每位藝術(shù)家都可以實(shí)現(xiàn)無(wú)限創(chuàng)造!▲趙恩哲
當(dāng)然,基于RTX GPU這些能力,相關(guān)公司也可以基于自己的模型構(gòu)建具有最有效果的加速引擎,讓算力的效益最大化,從而實(shí)現(xiàn)顯著的降本增效。可以說(shuō),從企業(yè)到個(gè)人,從數(shù)據(jù)中心到PC,基于數(shù)十年建立的堅(jiān)實(shí)生態(tài),英偉達(dá)正通過(guò)技術(shù)創(chuàng)新拉近每一個(gè)人與AI大模型的距離。03.DLSS用AI改寫(xiě)游戲產(chǎn)業(yè),英偉達(dá)為開(kāi)發(fā)者武裝到牙齒,RTX就是AI
04.結(jié)語(yǔ):AIGC時(shí)代要想玩轉(zhuǎn)AI,英偉達(dá)是徹底繞不開(kāi)了
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。
