誰在挑戰(zhàn)英偉達(dá)的 AI 芯片霸主地位？

發(fā)布人：深科技時(shí)間：2024-02-27 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

日前，英偉達(dá)的股價(jià)再次迎來上漲，總市值超過 2 萬億美元，成為繼蘋果（2.83 萬億美元）和微軟（3.06 萬億美元）之后第三家估值超過 2 萬億美元的美國公司[1]。

該公司之所以在過去一年里取得如此迅猛的市值增長，主要是因?yàn)槠湓?AI 芯片市場發(fā)揮的領(lǐng)先作用。

顯而易見，隨著以 ChatGPT 為代表的大語言模型的陸續(xù)出現(xiàn)，引發(fā)了全世界生成式 AI 市場的蓬勃發(fā)展。

根據(jù)數(shù)據(jù)統(tǒng)計(jì)公司 Statista 提供的數(shù)據(jù)，預(yù)計(jì)到 2024 年，生成式 AI 的市場規(guī)模將達(dá)到 666.2 億美元，到 2030 年市場規(guī)模有望達(dá)到 2070 億美元[2]。

要想構(gòu)建對于發(fā)展大語言模型來說至關(guān)重要，并且用于深度學(xué)習(xí)、大規(guī)模模擬和并行處理的應(yīng)用程序，少不了使用由英偉達(dá)開發(fā)的 GPU 芯片。

圖丨英偉達(dá)發(fā)布的 H100 芯片（來源：英偉達(dá)官網(wǎng)）

不過，由于種種原因，自 2018 年以來全球芯片一直存在短缺的現(xiàn)象，這給 AI、電子、汽車、醫(yī)療等行業(yè)的正常生產(chǎn)帶來沉重打擊。

一面是 GPU 短缺，一面是對生成式 AI 服務(wù)需求的持續(xù)增長，這種供不應(yīng)求的態(tài)勢也讓英偉達(dá)于 2022 年發(fā)布的 H100 芯片極其昂貴，并且，為打造最好的生成式 AI 產(chǎn)品，包括騰訊、微軟、Meta 等在內(nèi)的中美科技公司都在追捧這款 AI 芯片。

圖丨預(yù)計(jì) H100 已于 2023 年交付給部分買家（來源：CB Insights）

其中，需要說明的是，H100 是英偉達(dá)繼 A100 之后推出的最新旗艦 AI 芯片，它作為 AI 基礎(chǔ)設(shè)施的核心，具有強(qiáng)大的計(jì)算能力，能夠幫助訓(xùn)練和部署可以生成文本、圖像和音頻的大語言模型。

另外，根據(jù) CB Insights 發(fā)布的 2024 年生成式 AI 預(yù)測報(bào)告，一顆 H100 的制造成本大約為 3320 美元，但平均售價(jià)已經(jīng)達(dá)到 3 萬美元，最高售價(jià)甚至一度達(dá)到將近 10 萬美元[3]。

圖丨H100 售價(jià)大幅上漲（來源：CB Insights）

從另一視角來看，這種囤積芯片的行為，也體現(xiàn)出大型科技公司對英偉達(dá)的過度依賴。

在意識到這一點(diǎn)以后，亞馬遜、谷歌、微軟和 Meta 等科技巨頭紛紛構(gòu)建自己的 AI 芯片，以及通過投資 AI 初創(chuàng)企業(yè)等舉措，試圖擺脫上述依賴，并開始試圖搶占芯片市場份額。

具體來說，谷歌部署 TPU（Tensor Processing Units，張量處理器）已經(jīng)有 8 年時(shí)間。

2017 年，該公司發(fā)布一款新的專用集成電路產(chǎn)品 TPU，能夠支持 AI 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練以及訓(xùn)練后的推理。

基于數(shù)以萬計(jì)的 TPU，谷歌成功地構(gòu)建了自己的 AI 產(chǎn)品，其中就有聊天機(jī)器人工具 Bard。

并且，包括 Cohere 在內(nèi)的其他 AI 公司也在通過谷歌的云服務(wù)使用這些芯片，并構(gòu)建類似的技術(shù)。

緊隨谷歌之后的亞馬遜，分別于 2019 年和 2021 年發(fā)布了 Inferentia 和 Trainium 兩款芯片。

前者可提供低成本、高通量的機(jī)器學(xué)習(xí)推理，后者旨在訓(xùn)練機(jī)器學(xué)習(xí)模型，包括用于生成式 AI 的模型。

另外，該公司還于 2023 年 9 月給 Anthropic 這家 AI 公司注入 40 億美元的資金，后者將使用亞馬遜的定制芯片來構(gòu)建 AI 模型。

亞馬遜 CEO 安迪·賈西（Andy Jassy）曾在該公司 2023 年第 4 季度財(cái)報(bào)電話會議中表示：“要獲得每個(gè)人都想要的 GPU 數(shù)量確實(shí)很困難。

因此，這也是亞馬遜的 Inferentia 和 Trainium 芯片對人們?nèi)绱司哂形Φ囊粋€(gè)重要原因?！?/span>

2023 年 5 月和 11 月，Meta 和微軟兩家公司分別發(fā)布了定制 AI 芯片 MTIA 和 Maia 100。

前者是針對 Meta 內(nèi)部推理工作負(fù)載定制的，在性能、延遲和效率方面都具有良好的表現(xiàn)，后者使用 5 納米工藝制造，能很好地應(yīng)用于大語言模型的訓(xùn)練和推理。

據(jù)了解，在開發(fā)和測試 Maia 100 的過程中，微軟不僅和 OpenAI 開展了廣泛合作，還將基于該產(chǎn)品為后者的 AI 模型提供優(yōu)化和改進(jìn)。

事實(shí)上，上述公司開發(fā)與 AI 有關(guān)的定制芯片的行為，有助于它們控制成本、消除芯片短缺，并最終向使用其云服務(wù)的企業(yè)出售芯片。

正如 AI 初創(chuàng)公司 Nervana 的 CEO 兼聯(lián)合創(chuàng)始人納文·拉奧（Naveen Rao）所言：“理論上，如果它們能夠達(dá)到足夠高的產(chǎn)量并降低成本，這些公司應(yīng)該能夠提供比英偉達(dá)更好的產(chǎn)品。”

不過，從目前來看，它們在短期之內(nèi)很難超越英偉達(dá)，即便后者開發(fā)的芯片價(jià)格昂貴，但卻是市場上性能最高、能與更多軟件完美配合的芯片之一。

亞馬遜 AWS 計(jì)算和網(wǎng)絡(luò)副總裁大衛(wèi)·布朗（David Brown）對媒體表示：“我們還有許多年的艱苦創(chuàng)新要做。”

我們看到各科技公司競相開發(fā)定制芯片，但明顯的是，英偉達(dá)也不會停滯不前。

參考資料：1.https://www.theverge.com/2024/2/1/24058186/ai-chips-meta-microsoft-google-nvidia2.https://www.statista.com/outlook/tmo/artificial-intelligence/generative-ai/worldwide3.https://www.cbinsights.com/research/report/generative-ai-predictions-2024/https://www.linkedin.com/pulse/amazons-strategic-move-custom-chips-excel-generative-ai-race-greyb-nrblfhttps://tickernerd.com/earnings-call/amazon/https://www.forbes.com/sites/moorinsights/2017/05/22/google-cloud-tpu-strategic-implications-for-google-nvidia-and-the-machine-learning-industry/?sh=1fc67e963af7https://www.zdnet.com/article/microsoft-unveils-first-ai-chip-maia-100-and-cobalt-cpu/https://about.fb.com/news/2023/05/metas-infrastructure-for-ai/https://medium.com/@theeyessource/unveiling-microsofts-groundbreaking-chips-the-maia-100-ai-accelerator-and-cobalt-100-cpu-a00e8ab195echttps://www.theverge.com/2023/11/15/23960345/microsoft-cpu-gpu-ai-chips-azure-maia-cobalt-specifications-cloud-infrastructurehttps://unu.edu/article/when-chips-are-down-increasingly-cutthroat-political-economy-computer-chipshttps://www.cnbc.com/2023/04/14/nvidias-h100-ai-chips-selling-for-more-than-40000-on-ebay.htmlhttps://www.businessinsider.com/meta-zuckerberg-stockpile-tech-hottest-commodity-nvidia-chips-semiconductors-2024-1https://www.nytimes.com/2024/01/29/technology/ai-chips-nvidia-amazon-google-microsoft-meta.htmlhttps://www.businesstimes.com.sg/companies-markets/telcos-media-tech/nvidia-market-cap-threatens-alphabet-after-overtaking-amazonhttps://dig.watch/updates/amazon-introduces-its-next-gen-ai-chip-intensifying-rivalry-with-microsoft-and-google
運(yùn)營/排版：何晨龍

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請聯(lián)系工作人員刪除。

博客專欄

誰在挑戰(zhàn)英偉達(dá)的 AI 芯片霸主地位？

相關(guān)推薦

技術(shù)專區(qū)

博客專欄

誰在挑戰(zhàn)英偉達(dá)的 AI 芯片霸主地位？

相關(guān)推薦

技術(shù)專區(qū)

誰在挑戰(zhàn)英偉達(dá)的 AI 芯片霸主地位？