“卷”起來的自動駕駛高算力賽道
實現(xiàn)L4級自動駕駛究竟需要多少算力?目前并沒有一個明確的答案,車企不輕易下結(jié)論,似乎算力越高越有安全感;芯片廠商們的口徑一直在變,從幾百TOPS上漲到幾千TOPS……
對于未來智能汽車的想象,業(yè)內(nèi)有一種說法是“A Data Center on Wheels”,即“輪子上的數(shù)據(jù)中心”,在可預見的將來,一輛汽車甚至可以相當于現(xiàn)在數(shù)據(jù)中心的算力級別。整個自動駕駛芯片領(lǐng)域的廠商們,都在向算力指數(shù)級翻倍和更先進芯片制程的道路上策馬揚鞭。這個高度“內(nèi)卷”的賽道,是什么在背后推動?算力的無限膨脹和制程的持續(xù)提升,什么時候才能“卷”到盡頭?
自動駕駛系統(tǒng)之重
AI域控制器
自動駕駛域控制器是自動駕駛系統(tǒng)的中央計算單元,它需要高算力來實現(xiàn)感知、規(guī)劃和決策等關(guān)鍵任務,是未來智能汽車的“大腦”。受益于汽車的智能化發(fā)展,以及汽車電子電氣架構(gòu)由分布走向集中的趨勢,域控制器市場正在快速增長。
同時,自動駕駛域控制器之所以越來越重要,主要原因是全車算力向駕駛域集中。駕駛域算力追加的主要驅(qū)動因素,則是傳感器輸入信號的復雜程度逐步提升,使底層 SoC 需要同步提升自身的計算能力、傳輸帶寬、存儲能力。
例如,L2 級別側(cè)視攝像頭的加入,導致需要預處理的視頻數(shù)據(jù)成倍增加,L3+級別激光雷達的加入又不斷地生成千萬級的待處理點云信息……這都使得自動駕駛域控制器成為車上算力需求最高的計算中心。同時,出于安全性要求,自動駕駛域還需要布設冗余,甚至駕駛域未來還將逐步整合座艙域、車身域等功能域。
那么,在人工智能發(fā)展下所催生的AI域控制器,和傳統(tǒng)意義上的控制器有什么差別?
傳統(tǒng)控制器稱作ECU,每一輛車包括多個ECU,每個ECU負責固定的功能。AI域控制器通過AI算法做傳感器感知,對物體、路徑進行識別判斷。相對于傳統(tǒng)控制器,。AI域控制器一是減少了ECU的數(shù)量,二是大幅優(yōu)化了傳統(tǒng)車輛的線束問題。
目前,AI域控制器功能主要由主控芯片、系統(tǒng)軟件(操作系統(tǒng)、中間件)和應用算法協(xié)同實現(xiàn)。從目前車企的做法來看,業(yè)內(nèi)普遍認為以主控芯片為代表的高性能硬件會率先上車,而操作系統(tǒng)及應用軟件等則會隨著算法模型不斷迭代持續(xù)更新,逐步釋放預埋硬件的利用率,保證汽車功能的迭代升級。
蔚然成風的“硬件預埋”趨勢
在探討自動駕駛域控制器的芯片升級之前,要先談談現(xiàn)在流行的“硬件預埋”。正如本文開頭所說,L4級自動駕駛究竟需要多少算力,沒有一個唯一的答案。事實上,這個“多少才算夠用”的標準,正在持續(xù)升級。
主機廠紛紛推動“硬件預埋”概念,也就是說,雖然目前可能用不到這么高算力的芯片,但是超前地先把硬件做足,將來通過OTA升級,一步步在該硬件平臺上疊加更多的算法,實現(xiàn)新的功能。
當然,這和智能手機的堆料、比拼硬件配置還有本質(zhì)的不同, 因為汽車壽命更長,而芯片的迭代周期遠遠短于汽車的壽命周期,因此通過“硬件預埋”的方式為下一步的升級做好前瞻規(guī)劃,也是一種合理的路徑。同時,如果預埋的硬件不能滿足更高等級自動駕駛功能對數(shù)據(jù)處理的需求時,就需要對硬件升級,這需要車輛設計之初便預留好相應的硬件接口。
當前在國內(nèi)市場,很多公司基本都是這樣的思路,硬件在能力范圍內(nèi)做到最高端,能對標L4更好,然后軟件和算法再慢慢迭代,在L2+、L3慢慢突破,未來通過OTA達到L4。
快速變化的AI域控制器市場格局
在這些趨勢下,自動駕駛域控制器芯片開始高度“內(nèi)卷”,不論是算力、功耗還是制程。隨著AI域控制器時代的到來,SoC 需要的芯片復雜度更高,在高算力SoC芯片競爭中,市場格局迅速變化。
在剛剛結(jié)束的CES上,英偉達推出第八代 DRIVE Hyperion 平臺,該平臺由兩顆NVIDIA DRIVE Orin芯片構(gòu)成,每顆算力達254TOPS; Mobileye發(fā)布了專為L4自動駕駛打造的新一代EyeQ Ultra芯片,算力達176TOPS,性能為上一代 Eye Q5 的 10 倍以上;安霸則推出AI域控制器芯片CV3系列SoC,算力達500 eTOPS,比上一代芯片CV2足足提高了42倍……
從當前域控制器芯片玩家中不難發(fā)現(xiàn),在自動駕駛的算力軍備賽中,選手類型越來越豐富,既有NXP、英飛凌、TI這樣的資深玩家,也有英偉達、高通、華為這樣的實力型選手,還有年輕的AI芯片企業(yè),以及像安霸這樣,在視覺圖像處理領(lǐng)域扎根多年的后來者。
從AI視覺感知到AI域控制器
安霸憑什么?
提起安霸,最廣為人知的一個標簽是它在安防監(jiān)控市場的地位,憑借低功耗、超高清視頻解壓縮、機器視覺圖像處理SoC芯片等,其安防監(jiān)控芯片被全球前二十名的安防攝像機品牌采用,并成為市場主流。
但事實上,安霸在2015年就進軍智能汽車領(lǐng)域,目前已經(jīng)量產(chǎn)了10nm制程CV2x的六大芯片系列,帶有安霸獨有的AI加速引擎設計,應用場景覆蓋ADAS、智能電子后視鏡、智能座艙駕駛員的監(jiān)測以及艙內(nèi)的感知,以及行泊一體的方案。
可以看到,從早期不帶AI硬件加速的芯片,到10nm的 CV2x系列,再到5nm的CV5,安霸已經(jīng)在智能汽車領(lǐng)域跋涉了相當長的一段路。
在今年的CES上,安霸最新推出了基于CVflow架構(gòu)的AI域控制器CV3系列SoC,采用5nm超低功耗制程,單芯片AI算力達到500 eTOPS,預計將在今年上半年提供首批樣品。該系列算力比上一代CV2提高了42倍,同時支持高分辨率攝像頭、毫米波雷達、激光雷達和超聲波雷達,據(jù)稱單芯片即可實現(xiàn)ADAS及L4級自動駕駛。
CV3搭載了16個Arm Cortex-A78AE CPU內(nèi)核,在支持自動駕駛系統(tǒng)的軟件應用所需的CPU性能上,比上一代芯片CV2提高了30倍。通過單一芯片集成多傳感器,CV3可進行集中化AI感知處理(包括高像素視覺處理、毫米波雷達、激光雷達和超聲波雷達)、多傳感器深度融合以及自動駕駛車的路徑規(guī)劃,從而打造ADAS系統(tǒng)和L2+至L4級自動駕駛系統(tǒng)。
CV3的升級,可以說將自動駕駛賽道的高算力“內(nèi)卷”推向了高潮。安霸為什么選擇在這個時候推出一款旗艦版的AI域控制器芯片,從而在自動駕駛高算力SoC賽道上進行角逐?
安霸中國區(qū)總經(jīng)理馮羽濤表示,相比上一代CV2系列,CV3在純粹神經(jīng)網(wǎng)絡人工智能算力上提升了40多倍,這是一個較大的跳躍。此外,之前包括CV5在內(nèi)的所有芯片,主要還是用于視覺感知,主要的應用場景是帶一個或多個攝像頭,做一定的智能處理。從算力的角度、以及對多傳感器的連接和處理角度來看,離真正的中央域控制器還是有一定的差距。
視覺處理技術(shù)是安霸從成立之初就專注的領(lǐng)域,近年來也大力投入AI視覺芯片,這被認為是其核心競爭力。馮羽濤表示,自動駕駛分析雖然需要多傳感器融合感知,但視覺是最重要的感知系統(tǒng),是人類現(xiàn)階段駕駛汽車最重要的感知能力;另一方面,來自于視覺系統(tǒng)的信息量最密集。
“之所以決定進入這個賽道,是基于對市場發(fā)展趨勢的判斷以及對神經(jīng)網(wǎng)絡、人工智能算法的研究”,馮羽濤表示,“我們希望結(jié)合在視覺感知處理方面積累的包括ISP、低功耗SoC芯片的積累,加入高算力的基于CVflow架構(gòu)的全新設計,能在智能駕駛汽車未來高速發(fā)展的5-10年間,給汽車行業(yè)提供好的選擇。
算法優(yōu)先
芯片為算法服務
在安霸的設計策略中,“算法優(yōu)先”是一個核心要素,主要體現(xiàn)在四方面:
通過其17年的圖像處理和視頻壓縮經(jīng)驗,能夠以低功耗實現(xiàn)高分辨率的視頻處理;
收購VisLab,這是一家在自動駕駛領(lǐng)域有25年經(jīng)驗積累的公司,通過收購,使得安霸進一步從自動駕駛算法對芯片的需求出發(fā),有了更深刻地理解;
收購4D成像雷達算法公司傲酷,通過將其算法與原有的視覺技術(shù)進行融合,能夠占用較少的硬件資源實現(xiàn)非常清晰的雷達成像,實現(xiàn)更有效率的視覺和雷達感知的融合;
CVflow——這是安霸CV系列芯片的核心,是一套自研的AI算法加速引擎的芯片架構(gòu),它并非通用的計算平臺,而是專門為視覺感知以及其它感知算法設計的,但同時具備一定的通用性,在功耗和運算效率方面實現(xiàn)了較好的平衡。
也正是因為采用了特殊的芯片架構(gòu),而非通用的GPU等架構(gòu),安霸用eTOPS來度量自身芯片的算力情況。這個eTOPS中的“e”有何涵義?與TOPS有何不同?馮羽濤介紹,“e”指的是Equivalent,意思是等價的、等效的TOPS。安霸一貫的設計思路就是在通用編程適應性和提升功耗、成本的比例之間取得一個平衡點,CVflow就是采用特殊的架構(gòu)專門針對卷積神經(jīng)網(wǎng)絡和常見的神經(jīng)網(wǎng)絡運算進行了優(yōu)化。他指出,GPU采用標準的TOPS計量,如果運行同樣的算法實現(xiàn)等效的性能,就可以說是Equivalent TOPS(ETOPS)。
寫在最后
在自動駕駛比拼高算力的發(fā)展背景之下,芯片廠商所面臨的機遇和挑戰(zhàn)都在相應增長。隨著AI域控制器時代的到來,SoC 芯片復雜度更高,需要支持多任務的復雜操作系統(tǒng)和應用,芯片廠商與域控制器企業(yè)合作,是加快研發(fā)、實現(xiàn)快速落地的重要保證。此外,在汽車芯片供應鏈危機的映照下,芯片廠商穩(wěn)定的供貨能力也愈發(fā)關(guān)鍵。
除此之外,要打造一個高算力平臺適應現(xiàn)在和未來諸多的算法需求,同時又要兼顧功耗和成本,本身就不是一件易事。因為真正進入應用中,可能還會遇到新的瓶頸,所以設計之初就需要同時兼顧性能、成本、功耗等,做出適合落地的綜合權(quán)衡的SoC設計,這對芯片廠商的設計能力、量產(chǎn)能力都是較大的挑戰(zhàn)。
歸根結(jié)底,一輛汽車最終還是要考慮成本、功耗等問題。算力的飆升,什么時候是最好的平衡點?也許現(xiàn)在暫時沒有答案,但總不會無限地擴張下去。采訪中,馮羽濤談到,“在可預見的未來五到十年,汽車自動駕駛算力的競爭不至于再以翻N倍的方式發(fā)展,芯片的算力能效比將成為很重要的度量指標,一款芯片的算力、制程、功耗會是最核心的三個指標,代表著更好的算力平衡點。”
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。