生成式人工智能:半導(dǎo)體行業(yè)的下一個S曲線?
隨著ChatGPT和Sora等生成式人工智能(gen AI)應(yīng)用席卷全球,對計算能力的需求正在飆升。半導(dǎo)體行業(yè)發(fā)現(xiàn)自己正接近一個新的S曲線——對于高管來說,一個迫切的問題是該行業(yè)是否能跟得上。
領(lǐng)導(dǎo)者們正在通過承諾大量的資本支出來擴(kuò)大數(shù)據(jù)中心和半導(dǎo)體制造工廠(晶圓廠),同時探索芯片設(shè)計、材料和架構(gòu)的創(chuàng)新,以滿足不斷發(fā)展的gen AI驅(qū)動的商業(yè)格局的需求。
為了指導(dǎo)半導(dǎo)體行業(yè)領(lǐng)導(dǎo)者度過這一轉(zhuǎn)型階段,我們制定了幾種gen AI對B2B和B2C市場影響的情景。每個情景都涉及對計算和因此晶圓的巨大需求增長。這些情景聚焦于數(shù)據(jù)中心,同時承認(rèn)智能手機(jī)等邊緣設(shè)備的影響,但規(guī)模要小得多。
需求情景,來自麥肯錫的AI分析,是根據(jù)半導(dǎo)體行業(yè)可能提供的晶圓產(chǎn)量進(jìn)行的,考慮到資本和設(shè)備等約束因素。即使更加雄心勃勃的情景也是有可能的,但是對數(shù)據(jù)中心所需的晶圓數(shù)量以及數(shù)據(jù)中心所需的能源供應(yīng)的影響將使它們不太可能出現(xiàn)。
本文將討論高性能組件的預(yù)計晶圓需求,包括邏輯、內(nèi)存、數(shù)據(jù)存儲芯片,以及為它們提供支持所需的晶圓廠的數(shù)量。擁有這些信息,行業(yè)利益相關(guān)者可以戰(zhàn)略性地規(guī)劃和分配資源,以滿足不斷增長的計算能力需求,確保未來幾年其運營的可伸縮性和可持續(xù)性。
生成式人工智能計算需求的組成部分對于人工智能和生成式人工智能應(yīng)用需求的激增伴隨著與之成比例的計算需求增長至關(guān)重要。然而,對于半導(dǎo)體行業(yè)領(lǐng)導(dǎo)者來說,理解這種需求的起源以及生成式人工智能將如何應(yīng)用是至關(guān)重要的。我們預(yù)計將會看到兩種不同類型的生成式人工智能應(yīng)用:B2C和B2B用例。在B2C和B2B市場上,對于生成式人工智能的需求可以分為兩個主要階段:訓(xùn)練和推斷。訓(xùn)練通常需要大量的數(shù)據(jù)和計算資源。相比之下,推斷通常對于每個用例的運行需要更低的計算資源。
為了使半導(dǎo)體行業(yè)領(lǐng)導(dǎo)者能夠更好地應(yīng)對這些市場的復(fù)雜性和需求,我們概述了B2B計算需求的六種用例原型及其相應(yīng)的計算成本和同時生成的gen AI價值創(chuàng)造。
麥肯錫的分析估計,B2C應(yīng)用將占大約70%的生成式人工智能計算需求,因為它們包括基本消費者互動(例如起草電子郵件)和高級用戶互動(例如從文本創(chuàng)建可視化內(nèi)容)的工作量。預(yù)計B2B用例將占大約30%的需求。這些包括業(yè)務(wù)的高級內(nèi)容創(chuàng)建(例如,生成市場材料)、解決客戶查詢或生成標(biāo)準(zhǔn)財務(wù)報告等用例。
跨行業(yè)垂直領(lǐng)域和功能的B2B應(yīng)用可分為六種用例原型:
編碼和軟件開發(fā)應(yīng)用程序,解釋和生成代碼 創(chuàng)意內(nèi)容生成應(yīng)用程序,編寫文檔和通信(例如生成營銷材料) 客戶互動應(yīng)用程序,涵蓋自動化客戶服務(wù)的外展、查詢和數(shù)據(jù)收集(例如通過聊天機(jī)器人處理客戶查詢) 創(chuàng)新應(yīng)用程序,為研發(fā)過程生成產(chǎn)品和材料(例如設(shè)計候選藥物分子) 簡化的摘要應(yīng)用程序,使用結(jié)構(gòu)化數(shù)據(jù)集總結(jié)和提取見解(例如生成標(biāo)準(zhǔn)財務(wù)報告) 復(fù)雜的摘要應(yīng)用程序,使用非結(jié)構(gòu)化或大型數(shù)據(jù)集總結(jié)和提取見解(例如在臨床圖像中合成MRI或CT掃描結(jié)果)
麥肯錫根據(jù)其價值創(chuàng)造和服務(wù)成本來定義這六個不同和復(fù)雜的B2B用例原型。通過定義服務(wù)成本和價值創(chuàng)造,決策者可以更熟練地了解B2B用例的具體情況,并在采用它們時做出明智的選擇。在核心,服務(wù)成本的分析包括訓(xùn)練、微調(diào)和推斷成本。該分析還包括超大規(guī)模的基礎(chǔ)設(shè)施即服務(wù)(IaaS)邊際成本,其中包括計算硬件、服務(wù)器組件、IT基礎(chǔ)設(shè)施、能源消耗和估計的人才成本。通過諸如生產(chǎn)率改進(jìn)和勞動力成本節(jié)約等指標(biāo),對生成式人工智能價值創(chuàng)造的評估。
生成式人工智能需求情景隨著組織應(yīng)對采用生成式人工智能的復(fù)雜性,這些原型的戰(zhàn)略利用變得至關(guān)重要。gen AI采用的經(jīng)濟(jì)模型、算法效率以及組件和系統(tǒng)級別的持續(xù)硬件進(jìn)步等因素進(jìn)一步影響了gen AI的采用和技術(shù)進(jìn)步。三種需求情景——基礎(chǔ)、保守和加速——代表了對B2B和B2C應(yīng)用的生成式人工智能需求可能的結(jié)果。基礎(chǔ)情景是根據(jù)一系列必要假設(shè)進(jìn)行的,例如持續(xù)的技術(shù)進(jìn)步和快速采用,由能夠覆蓋gen AI訓(xùn)練和推斷的資本和運營成本的商業(yè)模式支持。保守和加速采用情景代表了采用的上升和下降余地,分別。
麥肯錫的分析估計,到2030年,在基礎(chǔ)情景下,生成式人工智能的總計算需求可能達(dá)到25x1030 FLOPs(浮點運算),其中大約70%來自B2C應(yīng)用,30%來自B2B應(yīng)用。
B2C計算需求情景B2C計算需求受到與gen AI互動的消費者數(shù)量、他們的互動水平以及其計算含義的影響。具體來說,B2C推斷工作負(fù)載取決于每個用戶的gen AI互動次數(shù)、gen AI用戶的數(shù)量以及每個基本和高級用戶互動的FLOP。訓(xùn)練工作負(fù)載取決于每年的訓(xùn)練次數(shù)、gen AI模型提供者的數(shù)量以及不同gen AI模型的每次訓(xùn)練運行的FLOP(例如2023年的最新模型,例如GPT-4,以及較小或較早的模型)。對于所有情景,公司能夠開發(fā)可持續(xù)的商業(yè)模型至關(guān)重要。
對于所有情景,公司能夠開發(fā)可持續(xù)的商業(yè)模型至關(guān)重要。
基礎(chǔ)采用。到2030年,預(yù)期的每日智能手機(jī)用戶的平均每天互動次數(shù)(每次互動是一系列提示)為基本消費者應(yīng)用,例如起草電子郵件。另一個預(yù)期的平均數(shù)是高級消費者應(yīng)用,例如創(chuàng)建更長的文本或綜合復(fù)雜的輸入文檔。通過使用當(dāng)前的在線和基于應(yīng)用程序的搜索查詢的數(shù)字,麥肯錫的分析估計互動次數(shù)約為預(yù)計的每日在線搜索查詢次數(shù)的兩倍(約280億)2030年。支持基本B2C情景的基本假設(shè)是穩(wěn)定的技術(shù)進(jìn)步、有利的監(jiān)管發(fā)展以及不斷增長的用戶接受程度。
保守采用。此情景可能涉及消費者對數(shù)據(jù)隱私、監(jiān)管發(fā)展的持續(xù)關(guān)注以及技術(shù)僅有漸進(jìn)性改進(jìn),導(dǎo)致基本情況的互動次數(shù)減少一半。
加速采用。此情景表明對技術(shù)的高度信任和廣泛的用戶接受度。此情景的驅(qū)動因素可能是具有吸引力的新商業(yè)模式、快速的技術(shù)進(jìn)步或有利的監(jiān)管。例如,顛覆性的硬件架構(gòu)將大大降低服務(wù)成本。此外,對軟件驗證過程的改進(jìn)可能會顯著提高生成式人工智能解決方案的效率。諸如此類的因素可能會加速采用曲線,并導(dǎo)致2030年之前半導(dǎo)體行業(yè)中生成式人工智能實施的顯著增長。
生成式人工智能B2B需求情景生成式人工智能用例在B2B部門的采用受到半導(dǎo)體芯片供應(yīng)的充分性和成本的顯著影響。企業(yè)必須能夠合理化其對計算基礎(chǔ)設(shè)施的投資,確保服務(wù)成本低于公司的支付意愿。對于這些B2B需求情景,麥肯錫的分析假設(shè)支付意愿對應(yīng)于總價值創(chuàng)造的約20%。
在B2B用例的背景下,麥肯錫的分析表明,六種用例原型中只有五種對廣泛采用是經(jīng)濟(jì)可行的。第六個原型,復(fù)雜摘要,預(yù)計由于與其成本相比的有限價值創(chuàng)造以及在分析復(fù)雜和非結(jié)構(gòu)化數(shù)據(jù)輸入方面消耗大量計算資源,不會被廣泛采用。
評論