Meta首款A(yù)I推理芯片2025年推出,還有視頻處理AI芯片MSVP
5月19日消息,據(jù)外媒Techcrunch報道,在19日上午的一場線上活動中,F(xiàn)acebook 母公司Meta首度公開了其自研 AI 芯片的進展,可以支持其最近推出的廣告設(shè)計和創(chuàng)作工具的生成式 AI技術(shù)。
△Meta CEO扎克伯格展示首款自研AI芯片MTIA
Meta基礎(chǔ)設(shè)施副總裁 Alexis Bjorlin表示:“構(gòu)建我們自己的 [硬件] 功能使我們能夠控制堆棧的每一層,從數(shù)據(jù)中心設(shè)計到培訓(xùn)框架。需要這種水平的垂直整合才能大規(guī)模突破人工智能研究的界限?!?/p>
首款自研AI芯片MTIA
在過去十年左右的時間里,Meta 花費了數(shù)十億美元來招募頂級數(shù)據(jù)科學(xué)家并構(gòu)建新型人工智能,包括現(xiàn)在為發(fā)現(xiàn)引擎、審核過濾器和遍布其應(yīng)用程序和服務(wù)的廣告推薦器提供支持的人工智能。但該公司一直在努力將其許多雄心勃勃的 AI 研究創(chuàng)新轉(zhuǎn)化為產(chǎn)品,尤其是在生成式 AI 方面。
自 2016 年以來,頭部的互聯(lián)網(wǎng)廠商都在積極的自研云端AI芯片。Google 一直在設(shè)計和部署稱為 Tensor Processing Units(TPU)的自研AI芯片,用于訓(xùn)練生成式 AI 系統(tǒng)如 PaLM-2、Imagen 等;亞馬遜則向 AWS 客戶提供 AWS Trainium、AWS Inferentia 兩款自研芯片進行應(yīng)用。傳聞微軟也傳出正與 AMD 合作開發(fā)一款名為 Athena 的 AI芯片。
此前,Meta 主要使用第三方的 CPU 和專為加速 AI 算法而設(shè)計的定制芯片的組合來運行其 AI 工作負載——CPU 在處理這類任務(wù)時的效率往往低于 GPU。為了扭轉(zhuǎn)局面,Meta 在2020年開發(fā)了其第一代基于7nm工藝的自研AI芯片 MTIA(MTIA v1)。
Meta 將該AI芯片稱為 Meta Training and Inference Accelerator,簡稱 MTIA,并將其描述為加速 AI 訓(xùn)練和推理工作負載的AI芯片“家族”的一部分。MTIA 是一種 ASIC,一種將不同電路組合在一塊基板上的芯片,允許對其進行編程以并行執(zhí)行一項或多項任務(wù)。
“為了在我們的重要工作負載中獲得更高水平的效率和性能,我們需要一個與模型、軟件堆棧和系統(tǒng)硬件協(xié)同設(shè)計的定制解決方案,以使得各種服務(wù)為我們的用戶提供更好的體驗?!盉jorlin解釋說道。
據(jù)介紹,MTIA v1基于 7 納米工藝,可以從其內(nèi)部 128 MB 內(nèi)存擴展到高達 128 GB。Meta表示,MTIA可以專門用于處理與 AI 推薦系統(tǒng)相關(guān)的工作,幫助用戶找出最佳貼文內(nèi)容并更快呈現(xiàn)在用戶眼前,其計算性能和處理效率都勝過 CPU。另外,在 Meta 設(shè)計的基準測試中,MTIA處理“低復(fù)雜性” ”和“中等復(fù)雜度”的 AI 模型也比 GPU 更高效。
Meta 表示,MTIA芯片的內(nèi)存和網(wǎng)絡(luò)領(lǐng)域仍有一些工作要做,隨著 AI 模型規(guī)模的增長,這會出現(xiàn)瓶頸,需要將工作負載分配到多個芯片上。(為此,Meta 最近收購了位于奧斯陸的英國芯片獨角獸 Graphcore 的 AI 網(wǎng)絡(luò)技術(shù)團隊。)目前,MTIA 的重點完全放在 Meta 應(yīng)用程序系列“推薦工作負載”的推理上,而不是訓(xùn)練上。
Meta 強調(diào),它將繼續(xù)改進的MTIA ,在運行推薦工作負載時“大大”提高了公司在每瓦性能方面的效率——反過來允許 Meta 運行“更加增強”和“尖端”人工智能工作負載。
根據(jù)計劃,Meta 將在 2025 年正式推出自研的MTIA芯片。
Meta的AI超級計算機RSC
報道稱,Meta原本計劃在2022 年大規(guī)模推出其自研的定制AI芯片,但最終卻推遲了,轉(zhuǎn)而為其超級計算機 Research SuperCluster (RSC) 訂購了價值數(shù)十億美元的 Nvidia GPU,這需要對其多個數(shù)據(jù)中心進行重大重新設(shè)計。
據(jù)介紹,RSC 于 2022 年 1 月首次亮相,與 Penguin Computing、Nvidia 和 Pure Storage 合作組裝而成,已經(jīng)完成了第二階段的擴建。Meta 表示,它現(xiàn)在包含總共 2,000 個 Nvidia DGX A100 系統(tǒng),配備 16,000 個 Nvidia A100 GPU。
雖然,目前RSC的算力已經(jīng)落后于微軟和谷歌的AI超級計算機。比如,谷歌宣稱其專注于人工智能的超級計算機擁有 26,000 個 Nvidia H100 GPU。但是,Meta 表示 ,RSC 的優(yōu)勢是允許其研究人員使用 Meta 生產(chǎn)系統(tǒng)中的真實示例來訓(xùn)練模型。這與該公司之前的 AI 基礎(chǔ)設(shè)施不同,之前僅利用開源和公開可用的數(shù)據(jù)集。
“RSC AI 超級計算機用于在多個領(lǐng)域推動 AI 研究的邊界,包括生成式 AI。”Meta 發(fā)言人稱:“這真的關(guān)系到人工智能研究的生產(chǎn)力。我們希望為 AI 研究人員提供最先進的基礎(chǔ)設(shè)施,使他們能夠開發(fā)模型并為他們提供培訓(xùn)平臺以推進 AI 發(fā)展?!?/p>
Meta稱,在其巔峰時期,RSC 可以達到近 5 exaflops 的計算能力,這使其成為世界上最快的計算能力之一。
Meta使用 RSC 來訓(xùn)練 LLaMA,這是“大型語言模型Meta人工智能”的首字母縮寫詞。Meta 表示,最大的 LLaMA 模型在 2,048 個 A100 GPU 上進行了訓(xùn)練,耗時 21 天。
“構(gòu)建我們自己的超級計算能力使我們能夠控制堆棧的每一層;從數(shù)據(jù)中心設(shè)計到培訓(xùn)框架,”Meta發(fā)言人補充道:“RSC 將幫助 Meta 的 AI 研究人員構(gòu)建新的更好的 AI 模型,這些模型可以從數(shù)萬億個示例中學(xué)習(xí);跨數(shù)百種不同的語言工作;一起無縫分析文本、圖像和視頻;開發(fā)新的增強現(xiàn)實工具;以及更多?!?/p>
未來,Meta或?qū)⒆匝械腁I芯片MTIA導(dǎo)入RSC當中,以進一步提升其AI性能。
面向視頻處理的AI芯片MSVP
除了 MTIA之外,Meta還在自研另一款被稱為 Meta Scalable Video Processor(MSVP)的 AI芯片,主要面向持續(xù)成長的滿足視頻點播和直播流媒體的數(shù)據(jù)處理需求,Meta最終希望將大部分成熟且穩(wěn)定的影音內(nèi)容處理工作交由 MSVP 執(zhí)行。
其實,Meta 多年前就開始構(gòu)思定制服務(wù)器端視頻處理芯片,并宣布在 2019 年推出用于視頻轉(zhuǎn)碼和推理工作的 ASIC。這是其中一些努力的成果,也是對競爭優(yōu)勢的新推動。特別是視頻直播領(lǐng)域。
“僅在 Facebook 上,人們就將 50% 的時間花在觀看視頻上,”Meta 技術(shù)主管 Harikrishna Reddy 和 Yunqing Chen 在19日上午發(fā)表的一篇博客文章中寫道:“為了服務(wù)于世界各地的各種設(shè)備(移動設(shè)備、筆記本電腦、電視等),上傳到 Facebook 或 Instagram 的視頻被轉(zhuǎn)碼為多個比特流,具有不同的編碼格式、分辨率和質(zhì)量……MSVP是可編程和可擴展的,并且可以配置為有效地支持 VOD 所需的高質(zhì)量轉(zhuǎn)碼以及實時流媒體所需的低延遲和更快的處理時間。”
△MSVP
Meta 表示,它的計劃是最終將大部分“穩(wěn)定和成熟”的視頻處理工作負載卸載到 MSVP,并僅對需要特定定制和“顯著”更高質(zhì)量的工作負載使用軟件視頻編碼。Meta 說,使用智能降噪和圖像增強等預(yù)處理方法以及偽影去除和超分辨率等后處理方法,我們將繼續(xù)使用 MSVP 提高視頻質(zhì)量。
“在未來,MSVP 將使我們能夠支持更多 Meta 最重要的用例和需求,包括短視頻——實現(xiàn)生成式 AI、AR/VR 和其他元宇宙內(nèi)容的高效交付?!盧eddy 和 Chen 說。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。