揭秘AI芯片創(chuàng)新風(fēng)向！清華北大中科院專家同臺論道，如何突破性能瓶頸？

發(fā)布人：芯東西時間：2022-06-10 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

從存算一體到跨層優(yōu)化，把脈AI芯片創(chuàng)新風(fēng)向與瓶頸。

作者 | ZeR0
編輯 | 漠影
芯東西6月7日報道，在上周舉行的2022北京智源大會芯片前沿技術(shù)論壇上，來自清華、北大、中科院等科研院所的多位專家學(xué)者分享了AI芯片在存算一體、跨層優(yōu)化、軟硬件協(xié)同設(shè)計等方面的前沿技術(shù)創(chuàng)新思路。清華大學(xué)教授、清華大學(xué)集成電路學(xué)院院長吳華強解讀了憶阻器存算一體芯片所面臨的挑戰(zhàn)；北京大學(xué)信息科學(xué)技術(shù)學(xué)院長聘副教授、博雅青年學(xué)者梁云分享了可用于降低軟硬件開發(fā)門檻的智能芯片設(shè)計工具；清華大學(xué)電子系長聘教授劉勇攀從“算法-架構(gòu)-器件”協(xié)同優(yōu)化的角度探討“分久必合”的芯片設(shè)計如何提升性能；中國科學(xué)院計算技術(shù)研究所副研究員、智源青年科學(xué)家杜子?xùn)|聚焦AI訓(xùn)練，提出支持高效量化訓(xùn)練、精度損失可忽略不計的架構(gòu)。面向產(chǎn)業(yè)落地，AI芯片公司昆侖芯科技的芯片研發(fā)總監(jiān)漆維亦分享了其團隊在十年耕耘期間所觀察和總結(jié)的AI芯片大規(guī)模落地的4個挑戰(zhàn)。芯東西對論壇中的干貨內(nèi)容加以梳理，與讀者共饗。
01.清華吳華強：憶阻器存算一體芯片興起，三大挑戰(zhàn)解析

清華大學(xué)教授、清華大學(xué)集成電路學(xué)院院長吳華強長期從事新型存儲器和存算一體技術(shù)的研究，他著重分享了基于憶阻器的存算一體技術(shù)。

▲吳華強

對于AI算法而言，“存儲墻”正成為主要的計算瓶頸，數(shù)據(jù)搬運會消耗大量功耗和時間。目前AI算法在一部分云計算里算子比較集中，因此與憶阻器陣列有很好的契合度。基于憶阻器等類腦計算器件的存算一體架構(gòu)，學(xué)習(xí)了大腦工作機制，通過模擬一些突觸乃至神經(jīng)元的功能，成為突破“馮·諾伊曼”瓶頸的最有潛力的技術(shù)路線之一，有望大幅提升算力和能效。憶阻器具有電阻可調(diào)特性，也可以解決很多傳統(tǒng)模擬計算的參數(shù)難以配置的問題，它的出現(xiàn)，使得“存算一體+模擬計算”的新計算范式興起。吳華強教授重點解讀了憶阻器存算一體芯片面臨的三個挑戰(zhàn)：1、如何真正克服比特誤差對系統(tǒng)誤差的影響？過去數(shù)字計算首先是比特精確，比特精確至少要保證系統(tǒng)精確。在基于憶阻器的模擬計算里，每個比特相對來說有一個range，個別比特可能完全不準(zhǔn)。如需將每個比特都做得很精準(zhǔn)，則能耗變高，能效會受影響。對此，解決思路一方面是從數(shù)學(xué)模型去驗證它們的誤差關(guān)系，另一方面從算法上進行挑戰(zhàn)，根據(jù)實踐，如果直接復(fù)制數(shù)字計算的算法，往往得到的效果較差，而在這之中進行微調(diào)，尤其對底層設(shè)備、對分布規(guī)律的理解會有很大的幫助。吳華強團隊提出由片外壓力訓(xùn)練和片上自適應(yīng)訓(xùn)練組成的混合訓(xùn)練框架，在片外壓力訓(xùn)練中引入系統(tǒng)誤差模型，構(gòu)建具有誤差耐受性的網(wǎng)絡(luò)模型，提升實際硬件系統(tǒng)的精度。在權(quán)重映射到芯片后，通過原位更新關(guān)鍵層權(quán)重進行自適應(yīng)訓(xùn)練，進一步提升精度。2、如何高效、低成本的設(shè)計并制造出憶阻器存算一體芯片？吳華強給出的解法是：CMOS嵌入式集成+EDA工具鏈。芯片走向更大規(guī)模，需要器件進一步優(yōu)化結(jié)構(gòu)。從2010年至今，其團隊制作憶阻器件的過程分了幾個階段：第一階段，用2μm工藝在實驗室中篩選CMOS兼容材料，制備單器件；第二階段，130nm工藝，打通后端集成工藝，發(fā)展了Foundry+Lab模式，最多集成到64M的憶阻器；第三階段，與聯(lián)電新加坡廠、廈門聯(lián)芯、中芯國際等大的代工廠合作，從40nm到28nm、22nm，可完成整個工藝的加工。其團隊還研發(fā)了從器件仿真、電路模塊設(shè)計到系統(tǒng)架構(gòu)設(shè)計的EDA工具鏈，目前已將EDA工具鏈跟兩款工業(yè)芯片進行適配。此外吳華強透露，他們有計劃將EDA工具鏈開源。3、如何提升存算一體架構(gòu)的通用性，使其適配更多的神經(jīng)網(wǎng)絡(luò)算法？吳華強團隊研發(fā)的軟件工具鏈包括編譯器、軟件模擬、硬件模擬器等，通過軟件工具鏈實現(xiàn)算法和芯片硬件的解耦，可支持各種神經(jīng)網(wǎng)絡(luò)算法。其中，編譯器對接算法層，可實現(xiàn)存算一體計算單元上高效部署神經(jīng)網(wǎng)絡(luò)算法及生成可執(zhí)行程序的功能；軟件模擬對接著編譯器和算法層，結(jié)合底層硬件模型，考慮真實器件的非理想因素，實現(xiàn)對真實硬件功能與性能的評估與探索；硬件模擬器對接編譯器，功能完整的計算單元模塊，模擬存算一體SoC工作過程中的數(shù)據(jù)信號與控制信號變化情況。在芯片方面，吳華強團隊在研制一款采用28nm制程工藝的集成憶阻器存算一體芯片，集成規(guī)模達到64Mb，數(shù)模轉(zhuǎn)換精度達8bit，預(yù)期算力超過100TOPS，預(yù)期能效超過10TOPS/W，具備一定通用計算能力，功能可重構(gòu)、參數(shù)可配置，并有配套軟件工具鏈。

“我們現(xiàn)在還需要更大規(guī)模的芯片，被運算之后或者在解決一些復(fù)雜問題之后，才能證明存量一體的計算有很強的生命力，我們在不斷地推進中。”吳華強說。他希望通過這種底層器件到編譯器的改變實現(xiàn)新的計算系統(tǒng)，用戶無需改變現(xiàn)有編程語言，便可同時提升算力和能效。經(jīng)過優(yōu)化，未來其單芯片算力有希望達到1000TOPS，在邊緣計算和云計算中擁有廣泛的應(yīng)用前景。
02.北大梁云：軟硬協(xié)同設(shè)計工具，降低智能芯片開發(fā)門檻

北京大學(xué)信息科學(xué)技術(shù)學(xué)院長聘副教授、博雅青年學(xué)者，北大-商湯智能計算聯(lián)合實驗室主任梁云的研究領(lǐng)域是芯片設(shè)計自動化EDA和計算機體系結(jié)構(gòu)，其研究曾獲兩項國際會議最佳論文獎和六項國際會議最佳論文提名。

▲梁云

在他看來，摩爾定律停滯不前以及功耗限制，需要架構(gòu)方面的創(chuàng)新，領(lǐng)域?qū)Ｓ锰幚砥鳎―SA）是一種可能的解決方案。DSA有多種優(yōu)勢，從硬件角度，可以做更高效的并行設(shè)計、內(nèi)存架構(gòu)、數(shù)據(jù)表示形式；從軟件角度，可將復(fù)雜的編譯器變簡單。最近幾年，梁云主要關(guān)注的是張量（Tensor）計算。由于張量計算的重要性，許多廠商設(shè)計了采用Spatial空間架構(gòu)的AI加速器，這種架構(gòu)并行性和數(shù)據(jù)復(fù)用率很高，但也存在一些挑戰(zhàn)：一是如何做軟硬件協(xié)同設(shè)計，二是決定了硬件架構(gòu)后如何實現(xiàn)？總結(jié)下來，整個軟硬件設(shè)計流程都需要非常底層的編程，而且很難優(yōu)化，開發(fā)周期漫長。梁云所在課題組提出了一種軟硬一體的智能芯片設(shè)計與優(yōu)化框架AHS，希望借助高層次的抽象、自動化工具和高效的算法，自動生成芯片的硬件架構(gòu)和軟件算子庫，降低芯片軟硬件開發(fā)門檻。具體來說，其課題組通過設(shè)計領(lǐng)域?qū)Ｓ谜Z言和中間的表示形成降低編程門檻，借助機器學(xué)習(xí)算法讓優(yōu)化更容易，設(shè)計這種自動化的工序來解決人工設(shè)計的問題。其工作包括硬件綜合、軟件編譯及軟硬件協(xié)同設(shè)計，每個組件均已開源。硬件綜合方面，其TENET框架可使用基于關(guān)系的表示形式，涵蓋硬件數(shù)據(jù)流的設(shè)計空間，能夠進行一系列的數(shù)學(xué)分析，分析出重用、延遲等跟性能相關(guān)的各種指標(biāo)，從而幫助用戶在某些限制條件下找到更好的芯片設(shè)計。同時，該團隊提出了可在性能、生產(chǎn)力和支持的數(shù)據(jù)流上都取得最優(yōu)的工具TensorLib，并為實現(xiàn)自動生成硬件構(gòu)建了相應(yīng)的EDA工具。軟件編譯方面，團隊提出了針對不同硬件的統(tǒng)一抽象，核心想法是將形式多樣的intrinsic在語義上降低到一個scalar program上，接下來把它形式化一個基于布爾矩陣的映射過程，在這里面通過檢查布爾矩陣來檢查映射方案的合理性。經(jīng)實驗，其在單個算子和整個網(wǎng)絡(luò)上均實現(xiàn)大幅度性能提升。軟硬件協(xié)同設(shè)計方面，該團隊提出一種敏捷的協(xié)同設(shè)計方法HASCO，它基于新的數(shù)據(jù)結(jié)構(gòu)張量語法樹做軟硬件的劃分。在硬件方面，其借助貝葉斯的優(yōu)化做硬件優(yōu)化和設(shè)計空間的探索；在軟件方面，引入強化學(xué)習(xí)，能快速找到所需軟件設(shè)計的參數(shù)。與非軟硬件協(xié)同設(shè)計的工作相比，其在邊緣場景和云計算場景的實驗結(jié)果在能效、性能方面均有一定的提升。
03.清華劉勇攀：高能效AI芯片設(shè)計“分久必合”

清華大學(xué)電子系長聘教授劉勇攀從傳統(tǒng)芯片體系架構(gòu)分層次設(shè)計的問題出發(fā)，解讀了高能效AI芯片的發(fā)展思路，并從“算法-架構(gòu)-器件”協(xié)同優(yōu)化層面探討設(shè)計層次重組如何帶來的性能提升。

▲劉勇攀

隨著摩爾定律的放緩，“通用計算架構(gòu)”+“工藝器件進步”相結(jié)合的性能提升之路，面臨日益嚴(yán)重的挑戰(zhàn)。制程工藝演進到28nm后，如果在傳統(tǒng)小容量的芯片市場，其容量沒有增加，專門為它做一個芯片，實際成本并未下降，這打破了摩爾定律以更便宜價格來提供更高算力的假設(shè)。過去“分而治之”的芯片傳統(tǒng)設(shè)計分層架構(gòu)，好處在于有一個系統(tǒng)觀的架構(gòu)師將要做的事拆分成若干層，大家各做各的，高效協(xié)同，從而提供更低的設(shè)計復(fù)雜度和更高靈活性。但隨著這個組織發(fā)展到一定程度，其代價是整個頂層執(zhí)行效率的下降，此前的架構(gòu)反而成為算力、能效提升的瓶頸，這就需要重新打通邏輯、重新定義層次，這對我們來講是很好的機會。劉勇攀認(rèn)為，未來，在底層器件發(fā)展變慢的情況下，我們可能需要使用“分久必合”的跨層次協(xié)同模式，發(fā)揮一些從應(yīng)用層面的新設(shè)計融合邏輯，不但要做算法和架構(gòu)，還要做電路與器件的協(xié)同，來研發(fā)出高能效、高性價比的AI芯片。一個算法級稀疏可獲得10到30倍的理論加速，而真正到了通用的GPU、CPU層面，可能只有9到25倍的加速，如果做一個稀疏架構(gòu)，就能很好發(fā)揮出稀疏算法的架構(gòu)優(yōu)勢，這便是典型的算法架構(gòu)融合邏輯。器件方面，稀疏也好，低比特推理和訓(xùn)練也好，都是從算法和架構(gòu)上的優(yōu)化。自下而上也有器件和電路的融合，包括先進工藝的DTCO（設(shè)計工藝協(xié)同優(yōu)化）。現(xiàn)在有一些SRAM面積提升，并不是通過把某個管子做小，而是垂直堆疊起來，密度可能提升了幾倍、百分之幾十，這就是典型的先進工藝的DTCO。還有HBM、3D堆疊，這都是從存儲層面，未來可能會有更大容量、更高速的訪存、更低成本的片上存儲，以及更接近計算的HBM內(nèi)存，這些內(nèi)存將很大程度上解決未來計算中部分存儲帶寬的問題。另一個層面，這些器件電路不但可以做存儲，還能提升計算密度，可以做存算一體，甚至可以用光互聯(lián)，NVM（非易失存儲器）的計算堆疊實現(xiàn)更高性能、低功耗、低成本的計算?？梢钥吹?，設(shè)備和電路的協(xié)同設(shè)計前景巨大。最后，劉勇攀總結(jié)了對該領(lǐng)域的3點觀察：其一，做AI計算，可將原始算法變成硬件高效的AI算法，從而使能效和算力得到顯著的提升。其二，芯片或系統(tǒng)有按比例縮?。╯caling down）和異構(gòu)集成兩條路線，異構(gòu)集成使我們能將更多DSA融合做一個整體解決方案。由于是芯片級集成，它不會受限于SoC要求的大的市場容量成本的問題。隨著一些新型封裝技術(shù)成熟，業(yè)界現(xiàn)已出現(xiàn)芯粒異構(gòu)集成的方式，通過靈活互聯(lián)，打破過去單一器件和同構(gòu)計算架構(gòu)的帶來的局限。這些芯?？梢圆捎貌煌墓に嚬?jié)點，從而繼續(xù)提升性價比，并一定程度上縮短設(shè)計周期，這為新型器件和領(lǐng)域定制化異構(gòu)架構(gòu)創(chuàng)新開辟了廣闊空間。其三是新器件?，F(xiàn)在還處在相對萌芽期的光通信和光計算，未來有可能被集成到大算力AI芯片中，甚至是更遙遠的量子技術(shù)里。
04.中科院杜子?xùn)|：定制架構(gòu)支持高效量化訓(xùn)練，精度損失可忽略不計

中國科學(xué)院計算技術(shù)研究所副研究員、智源青年科學(xué)家杜子?xùn)|長期從事AI體系結(jié)構(gòu)研究，在深度學(xué)習(xí)處理器方向做出了一系列開創(chuàng)性的工作，并曾以第一作者身份發(fā)表了多篇國際頂級學(xué)術(shù)會議的論文和期刊論文。

▲杜子?xùn)|

量化被認(rèn)為是有望降低帶寬/存儲要求、提升效率、降低計算成本的有效手段。過去采用低比特或量化推理方面的應(yīng)用很多，但在開銷巨大的深度學(xué)習(xí)訓(xùn)練中，量化應(yīng)用相對較少。現(xiàn)有的量化訓(xùn)練算法相關(guān)文章常常采用16bit，少部分可做到8bit，其量化效果通常只有部分?jǐn)?shù)據(jù)能做到8bit，大部分?jǐn)?shù)據(jù)還需16bit、32bit，對于像CPU/GPU等平臺沒有加速效果。杜子?xùn)|團隊也在GPU上實現(xiàn)了一個量化訓(xùn)練，相比32bit，直接在CPU+GPU平臺做量化訓(xùn)練，會比平常慢1.09倍~1.8倍。在訓(xùn)練中，GPU并不能給予很好的硬件和軟件的支持，也沒有特別好的低位寬的高效深度學(xué)習(xí)算法，這是現(xiàn)在阻礙量化訓(xùn)練的兩大因素。量化算法需對大量數(shù)據(jù)進行基于動態(tài)統(tǒng)計的量化和高精度的權(quán)重更新，這使得這些量化訓(xùn)練算法不能有效地部署在當(dāng)前的深度學(xué)習(xí)處理器上。對此，杜子?xùn)|團隊提出了第一個用于高效量化訓(xùn)練的定制神經(jīng)網(wǎng)絡(luò)處理器架構(gòu)，其訓(xùn)練精度損失可忽略不計。其團隊提出了3個策略來解決上述問題，一是局部量化，二是基于誤差估計的多路量化，三是原位權(quán)值更新。通過將這三點應(yīng)用于AI加速器上，在硬件中做針對性地支持，使之能做在線量化訓(xùn)練，并避免了多變的數(shù)據(jù)訪問，相對同規(guī)格TPU實驗，其性能提升1.7倍，能效提升1.62倍。
05.昆侖芯科技漆維：AI芯片大規(guī)模落地，直面哪些挑戰(zhàn)？

AI芯片公司昆侖芯科技脫胎于原百度智能芯片及架構(gòu)部，是國內(nèi)最早布局AI加速領(lǐng)域的團隊，在去年4月完成獨立融資，首輪估值約130億元，擁有國內(nèi)外350余項發(fā)明專利申請和多項軟件著作權(quán)。昆侖芯科技芯片研發(fā)總監(jiān)漆維畢業(yè)于清華大學(xué)，曾是百度高級技術(shù)經(jīng)理，擁有十年的行業(yè)研發(fā)與管理經(jīng)驗，主導(dǎo)研發(fā)了FPGA AI集群國內(nèi)互聯(lián)網(wǎng)最大規(guī)模的部署。目前昆侖芯科技自研云端AI芯片昆侖芯1代和昆侖芯2代均已實現(xiàn)大規(guī)模量產(chǎn)，相關(guān)工作多次發(fā)表在國際學(xué)術(shù)頂會上。

▲漆維

昆侖芯1代采用14nm制程，在百度搜索引擎、小度等業(yè)務(wù)中部署超過2萬片，經(jīng)歷過互聯(lián)網(wǎng)大規(guī)模核心算法考驗的產(chǎn)品。昆侖芯2代采用7nm制程，于2021年8月量產(chǎn)。其4nm昆侖芯3代已啟動研發(fā)，昆侖芯4代也在規(guī)劃中。在演講中，漆維分享了AI芯片在走向產(chǎn)業(yè)大規(guī)模落地過程中所面臨的挑戰(zhàn)：首先是算法的多樣化。不同業(yè)務(wù)場景有不同的算法模型，即便是同一個業(yè)務(wù)線，其算法也在持續(xù)優(yōu)化和突破。如谷歌曾在TPU論文中提到等芯片研發(fā)完成、要推到業(yè)務(wù)端落地部署時，才發(fā)現(xiàn)業(yè)務(wù)團隊兩年前所提的模型和精度需求已被推翻。第二，這個賽道并不是一個藍海，因為有行業(yè)巨頭NVIDIA在前面。NVIDIA已有10多年的積累，構(gòu)建了非常強大的護城河，并敢于對自家架構(gòu)做持續(xù)創(chuàng)新，其GPU已跟所有的主流框架做了適配。這種情況下，客戶對于為什么要選到你的AI芯片是有心理防線的，因此不僅要做到有一個非?？捎^的實際性能收益，也需要整個軟件棧做到非常靈活，實現(xiàn)盡量小的成本。第三，客戶的需求并非一成不變，且非常嚴(yán)苛。以互聯(lián)網(wǎng)為例，他們并不會關(guān)心一個單一指標(biāo)，他們關(guān)心延時、吞吐、TCU，這些指標(biāo)很多時候是糅合在一起的。例如，客戶可能關(guān)心其業(yè)務(wù)在滿足一定延時條件下，到底單卡能給他帶來的吞吐是多少，甚至有時還會加一些限制，如要求其CPU或者整個AI芯片、GPU限制在一定程度的利用率，去確保整個業(yè)務(wù)系統(tǒng)的魯棒性。最后，能夠在真正場景中做到業(yè)務(wù)規(guī)模的量化，整個軟硬件系統(tǒng)都將面臨非常大的工程挑戰(zhàn)。硬件產(chǎn)品做到萬級、十萬級甚至更高時，穩(wěn)定性怎么樣，成本對業(yè)務(wù)來說是不是可接受的；整個軟件棧要適配不同的深度學(xué)習(xí)框架、處理器、操作系統(tǒng)以及不同OEM的不同機型等等。到業(yè)務(wù)實際部署環(huán)節(jié)，有時不是單行程的業(yè)務(wù)在跑，而會為了把利潤率做高，可能會做多行程的混部。在這種場景下，整個AI卡實際性能能否做到很穩(wěn)定，都是走向芯片量產(chǎn)后要面臨的工程化挑戰(zhàn)。針對上述挑戰(zhàn)，昆侖芯的發(fā)展分成了兩個階段：第一個階段是2011~2017年，主要基于FPGA開發(fā)集群，隨后因底層硬件存在種種限制，F(xiàn)PGA在業(yè)務(wù)形態(tài)及架構(gòu)上遇到瓶頸，致使相應(yīng)性能和功耗等指標(biāo)很難達到最優(yōu)，因此大概在2017到2018年，也就是AI發(fā)展相對成熟之際，昆侖芯團隊開始轉(zhuǎn)型，并于2018年正式啟動昆侖芯的研發(fā)。從FPGA到昆侖，昆侖芯團隊對整個芯片的架構(gòu)做了抽象，從早期一些偏靜止的優(yōu)化做成一個通用的設(shè)計。之所以要做通用的AI處理器，一則為靈活支持更廣泛的應(yīng)用場景，二則需要靈活可編程以適應(yīng)各種業(yè)務(wù)的需求，三則盡可能降低芯片、軟件以及對業(yè)務(wù)牽引的成本。在漆維看來，現(xiàn)在是一個很好的時代，信創(chuàng)國產(chǎn)化等趨勢給了AI芯片一個良機，有一批早期用戶愿意接納和嘗試你的產(chǎn)品，而從早期客戶到主流客戶中間有一條鴻溝，什么時候真正邁過這個鴻溝，AI芯片產(chǎn)品才真正在市場上站住了腳。
06.結(jié)語：砸錢堆算力，堆不出AI芯片的未來

不久前，谷歌公布其擁有5400億個參數(shù)的新語言模型PaLM，其在CIFAR-10創(chuàng)下的99.43突破性指標(biāo)，僅比此前SOTA的99.40多出了0.03。而在其論文末附上的一張圖表顯示，這個訓(xùn)練方案所用到的TPU算力，成本大約超過57000美元，這在學(xué)術(shù)界引發(fā)爭議——大公司利用超大規(guī)模算力，結(jié)果較現(xiàn)有成果提升非常小，這樣的工作是否有意義？堆算力是不是AI芯片或者AI領(lǐng)域的未來發(fā)展方向？“真正有影響力的技術(shù)，一定是所有的人都用得起的，有高性價比的技術(shù)，才是對整個社會有重大貢獻的技術(shù)。”在劉勇攀看來，谷歌這個案例不太符合經(jīng)濟學(xué)規(guī)律，像這樣的技術(shù)只能是屬于少數(shù)“貴族人”專享，沒有很大的市場，“所有技術(shù)發(fā)展的過程中，對產(chǎn)業(yè)界要檢驗要符合社會經(jīng)濟規(guī)律，如果不符合社會經(jīng)濟規(guī)律強行去推，也會是一地雞毛，被歷史的車輪給碾碎?！?/span>從做硬件或系統(tǒng)的角度，梁云同樣認(rèn)可這是不符合經(jīng)濟學(xué)規(guī)律的做法。他也承認(rèn)這種“大力出奇跡”的做法確實在某些場景下有用，只是不適合學(xué)?；蛐〉膯挝谎芯咳藛T去復(fù)制，而不能復(fù)制，對學(xué)術(shù)的影響力就會比較有限。不過他相信，兩者是可以兼具的，如高性能計算領(lǐng)域最高獎項ACM戈登貝爾獎便鼓勵實現(xiàn)綠色計算，以及在一定功耗下解決一定規(guī)模的問題。

*博客內(nèi)容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點，如有侵權(quán)請聯(lián)系工作人員刪除。

伺服電機相關(guān)文章:伺服電機工作原理

博客專欄

揭秘AI芯片創(chuàng)新風(fēng)向！清華北大中科院專家同臺論道，如何突破性能瓶頸？

相關(guān)推薦

技術(shù)專區(qū)

博客專欄

揭秘AI芯片創(chuàng)新風(fēng)向！清華北大中科院專家同臺論道，如何突破性能瓶頸？

相關(guān)推薦

技術(shù)專區(qū)

揭秘AI芯片創(chuàng)新風(fēng)向！清華北大中科院專家同臺論道，如何突破性能瓶頸？