“卷”起來的自動駕駛高算力賽道

發(fā)布人：傳感器技術(shù) 時間：2022-01-25 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

實現(xiàn)L4級自動駕駛究竟需要多少算力？目前并沒有一個明確的答案，車企不輕易下結(jié)論，似乎算力越高越有安全感；芯片廠商們的口徑一直在變，從幾百TOPS上漲到幾千TOPS……

對于未來智能汽車的想象，業(yè)內(nèi)有一種說法是“A Data Center on Wheels”，即“輪子上的數(shù)據(jù)中心”，在可預(yù)見的將來，一輛汽車甚至可以相當(dāng)于現(xiàn)在數(shù)據(jù)中心的算力級別。整個自動駕駛芯片領(lǐng)域的廠商們，都在向算力指數(shù)級翻倍和更先進芯片制程的道路上策馬揚鞭。這個高度“內(nèi)卷”的賽道，是什么在背后推動？算力的無限膨脹和制程的持續(xù)提升，什么時候才能“卷”到盡頭？

自動駕駛系統(tǒng)之重

AI域控制器

自動駕駛域控制器是自動駕駛系統(tǒng)的中央計算單元，它需要高算力來實現(xiàn)感知、規(guī)劃和決策等關(guān)鍵任務(wù)，是未來智能汽車的“大腦”。受益于汽車的智能化發(fā)展，以及汽車電子電氣架構(gòu)由分布走向集中的趨勢，域控制器市場正在快速增長。

同時，自動駕駛域控制器之所以越來越重要，主要原因是全車算力向駕駛域集中。駕駛域算力追加的主要驅(qū)動因素，則是傳感器輸入信號的復(fù)雜程度逐步提升，使底層 SoC 需要同步提升自身的計算能力、傳輸帶寬、存儲能力。

例如，L2 級別側(cè)視攝像頭的加入，導(dǎo)致需要預(yù)處理的視頻數(shù)據(jù)成倍增加，L3+級別激光雷達的加入又不斷地生成千萬級的待處理點云信息……這都使得自動駕駛域控制器成為車上算力需求最高的計算中心。同時，出于安全性要求，自動駕駛域還需要布設(shè)冗余，甚至駕駛域未來還將逐步整合座艙域、車身域等功能域。

那么，在人工智能發(fā)展下所催生的AI域控制器，和傳統(tǒng)意義上的控制器有什么差別？

傳統(tǒng)控制器稱作ECU，每一輛車包括多個ECU，每個ECU負(fù)責(zé)固定的功能。AI域控制器通過AI算法做傳感器感知，對物體、路徑進行識別判斷。相對于傳統(tǒng)控制器，。AI域控制器一是減少了ECU的數(shù)量，二是大幅優(yōu)化了傳統(tǒng)車輛的線束問題。

目前，AI域控制器功能主要由主控芯片、系統(tǒng)軟件（操作系統(tǒng)、中間件）和應(yīng)用算法協(xié)同實現(xiàn)。從目前車企的做法來看，業(yè)內(nèi)普遍認(rèn)為以主控芯片為代表的高性能硬件會率先上車，而操作系統(tǒng)及應(yīng)用軟件等則會隨著算法模型不斷迭代持續(xù)更新，逐步釋放預(yù)埋硬件的利用率，保證汽車功能的迭代升級。

蔚然成風(fēng)的“硬件預(yù)埋”趨勢

在探討自動駕駛域控制器的芯片升級之前，要先談?wù)劕F(xiàn)在流行的“硬件預(yù)埋”。正如本文開頭所說，L4級自動駕駛究竟需要多少算力，沒有一個唯一的答案。事實上，這個“多少才算夠用”的標(biāo)準(zhǔn)，正在持續(xù)升級。

主機廠紛紛推動“硬件預(yù)埋”概念，也就是說，雖然目前可能用不到這么高算力的芯片，但是超前地先把硬件做足，將來通過OTA升級，一步步在該硬件平臺上疊加更多的算法，實現(xiàn)新的功能。

當(dāng)然，這和智能手機的堆料、比拼硬件配置還有本質(zhì)的不同，因為汽車壽命更長，而芯片的迭代周期遠(yuǎn)遠(yuǎn)短于汽車的壽命周期，因此通過“硬件預(yù)埋”的方式為下一步的升級做好前瞻規(guī)劃，也是一種合理的路徑。同時，如果預(yù)埋的硬件不能滿足更高等級自動駕駛功能對數(shù)據(jù)處理的需求時，就需要對硬件升級，這需要車輛設(shè)計之初便預(yù)留好相應(yīng)的硬件接口。

當(dāng)前在國內(nèi)市場，很多公司基本都是這樣的思路，硬件在能力范圍內(nèi)做到最高端，能對標(biāo)L4更好，然后軟件和算法再慢慢迭代，在L2+、L3慢慢突破，未來通過OTA達到L4。

快速變化的AI域控制器市場格局

在這些趨勢下，自動駕駛域控制器芯片開始高度“內(nèi)卷”，不論是算力、功耗還是制程。隨著AI域控制器時代的到來，SoC 需要的芯片復(fù)雜度更高，在高算力SoC芯片競爭中，市場格局迅速變化。

在剛剛結(jié)束的CES上，英偉達推出第八代 DRIVE Hyperion 平臺，該平臺由兩顆NVIDIA DRIVE Orin芯片構(gòu)成，每顆算力達254TOPS; Mobileye發(fā)布了專為L4自動駕駛打造的新一代EyeQ Ultra芯片，算力達176TOPS，性能為上一代 Eye Q5 的 10 倍以上；安霸則推出AI域控制器芯片CV3系列SoC，算力達500 eTOPS，比上一代芯片CV2足足提高了42倍……

從當(dāng)前域控制器芯片玩家中不難發(fā)現(xiàn)，在自動駕駛的算力軍備賽中，選手類型越來越豐富，既有NXP、英飛凌、TI這樣的資深玩家，也有英偉達、高通、華為這樣的實力型選手，還有年輕的AI芯片企業(yè)，以及像安霸這樣，在視覺圖像處理領(lǐng)域扎根多年的后來者。

從AI視覺感知到AI域控制器

安霸憑什么？

提起安霸，最廣為人知的一個標(biāo)簽是它在安防監(jiān)控市場的地位，憑借低功耗、超高清視頻解壓縮、機器視覺圖像處理SoC芯片等，其安防監(jiān)控芯片被全球前二十名的安防攝像機品牌采用，并成為市場主流。

但事實上，安霸在2015年就進軍智能汽車領(lǐng)域，目前已經(jīng)量產(chǎn)了10nm制程CV2x的六大芯片系列，帶有安霸獨有的AI加速引擎設(shè)計，應(yīng)用場景覆蓋ADAS、智能電子后視鏡、智能座艙駕駛員的監(jiān)測以及艙內(nèi)的感知，以及行泊一體的方案。

可以看到，從早期不帶AI硬件加速的芯片，到10nm的 CV2x系列，再到5nm的CV5，安霸已經(jīng)在智能汽車領(lǐng)域跋涉了相當(dāng)長的一段路。

在今年的CES上，安霸最新推出了基于CVflow架構(gòu)的AI域控制器CV3系列SoC，采用5nm超低功耗制程，單芯片AI算力達到500 eTOPS，預(yù)計將在今年上半年提供首批樣品。該系列算力比上一代CV2提高了42倍，同時支持高分辨率攝像頭、毫米波雷達、激光雷達和超聲波雷達，據(jù)稱單芯片即可實現(xiàn)ADAS及L4級自動駕駛。

CV3搭載了16個Arm Cortex-A78AE CPU內(nèi)核，在支持自動駕駛系統(tǒng)的軟件應(yīng)用所需的CPU性能上，比上一代芯片CV2提高了30倍。通過單一芯片集成多傳感器，CV3可進行集中化AI感知處理（包括高像素視覺處理、毫米波雷達、激光雷達和超聲波雷達）、多傳感器深度融合以及自動駕駛車的路徑規(guī)劃，從而打造ADAS系統(tǒng)和L2+至L4級自動駕駛系統(tǒng)。

CV3的升級，可以說將自動駕駛賽道的高算力“內(nèi)卷”推向了高潮。安霸為什么選擇在這個時候推出一款旗艦版的AI域控制器芯片，從而在自動駕駛高算力SoC賽道上進行角逐？

安霸中國區(qū)總經(jīng)理馮羽濤表示，相比上一代CV2系列，CV3在純粹神經(jīng)網(wǎng)絡(luò)人工智能算力上提升了40多倍，這是一個較大的跳躍。此外，之前包括CV5在內(nèi)的所有芯片，主要還是用于視覺感知，主要的應(yīng)用場景是帶一個或多個攝像頭，做一定的智能處理。從算力的角度、以及對多傳感器的連接和處理角度來看，離真正的中央域控制器還是有一定的差距。

視覺處理技術(shù)是安霸從成立之初就專注的領(lǐng)域，近年來也大力投入AI視覺芯片，這被認(rèn)為是其核心競爭力。馮羽濤表示，自動駕駛分析雖然需要多傳感器融合感知，但視覺是最重要的感知系統(tǒng)，是人類現(xiàn)階段駕駛汽車最重要的感知能力；另一方面，來自于視覺系統(tǒng)的信息量最密集。

“之所以決定進入這個賽道，是基于對市場發(fā)展趨勢的判斷以及對神經(jīng)網(wǎng)絡(luò)、人工智能算法的研究”，馮羽濤表示，“我們希望結(jié)合在視覺感知處理方面積累的包括ISP、低功耗SoC芯片的積累，加入高算力的基于CVflow架構(gòu)的全新設(shè)計，能在智能駕駛汽車未來高速發(fā)展的5-10年間，給汽車行業(yè)提供好的選擇。

算法優(yōu)先

芯片為算法服務(wù)

在安霸的設(shè)計策略中，“算法優(yōu)先”是一個核心要素，主要體現(xiàn)在四方面：

通過其17年的圖像處理和視頻壓縮經(jīng)驗，能夠以低功耗實現(xiàn)高分辨率的視頻處理；

收購VisLab，這是一家在自動駕駛領(lǐng)域有25年經(jīng)驗積累的公司，通過收購，使得安霸進一步從自動駕駛算法對芯片的需求出發(fā)，有了更深刻地理解；

收購4D成像雷達算法公司傲酷，通過將其算法與原有的視覺技術(shù)進行融合，能夠占用較少的硬件資源實現(xiàn)非常清晰的雷達成像，實現(xiàn)更有效率的視覺和雷達感知的融合；

CVflow——這是安霸CV系列芯片的核心，是一套自研的AI算法加速引擎的芯片架構(gòu)，它并非通用的計算平臺，而是專門為視覺感知以及其它感知算法設(shè)計的，但同時具備一定的通用性，在功耗和運算效率方面實現(xiàn)了較好的平衡。

也正是因為采用了特殊的芯片架構(gòu)，而非通用的GPU等架構(gòu)，安霸用eTOPS來度量自身芯片的算力情況。這個eTOPS中的“e”有何涵義？與TOPS有何不同？馮羽濤介紹，“e”指的是Equivalent，意思是等價的、等效的TOPS。安霸一貫的設(shè)計思路就是在通用編程適應(yīng)性和提升功耗、成本的比例之間取得一個平衡點，CVflow就是采用特殊的架構(gòu)專門針對卷積神經(jīng)網(wǎng)絡(luò)和常見的神經(jīng)網(wǎng)絡(luò)運算進行了優(yōu)化。他指出，GPU采用標(biāo)準(zhǔn)的TOPS計量，如果運行同樣的算法實現(xiàn)等效的性能，就可以說是Equivalent TOPS（ETOPS）。

寫在最后

在自動駕駛比拼高算力的發(fā)展背景之下，芯片廠商所面臨的機遇和挑戰(zhàn)都在相應(yīng)增長。隨著AI域控制器時代的到來，SoC 芯片復(fù)雜度更高，需要支持多任務(wù)的復(fù)雜操作系統(tǒng)和應(yīng)用，芯片廠商與域控制器企業(yè)合作，是加快研發(fā)、實現(xiàn)快速落地的重要保證。此外，在汽車芯片供應(yīng)鏈危機的映照下，芯片廠商穩(wěn)定的供貨能力也愈發(fā)關(guān)鍵。

除此之外，要打造一個高算力平臺適應(yīng)現(xiàn)在和未來諸多的算法需求，同時又要兼顧功耗和成本，本身就不是一件易事。因為真正進入應(yīng)用中，可能還會遇到新的瓶頸，所以設(shè)計之初就需要同時兼顧性能、成本、功耗等，做出適合落地的綜合權(quán)衡的SoC設(shè)計，這對芯片廠商的設(shè)計能力、量產(chǎn)能力都是較大的挑戰(zhàn)。

歸根結(jié)底，一輛汽車最終還是要考慮成本、功耗等問題。算力的飆升，什么時候是最好的平衡點？也許現(xiàn)在暫時沒有答案，但總不會無限地擴張下去。采訪中，馮羽濤談到，“在可預(yù)見的未來五到十年，汽車自動駕駛算力的競爭不至于再以翻N倍的方式發(fā)展，芯片的算力能效比將成為很重要的度量指標(biāo)，一款芯片的算力、制程、功耗會是最核心的三個指標(biāo)，代表著更好的算力平衡點?！?/p>

*博客內(nèi)容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點，如有侵權(quán)請聯(lián)系工作人員刪除。

博客專欄

“卷”起來的自動駕駛高算力賽道

相關(guān)推薦

技術(shù)專區(qū)