英飛凌AURIX? TC4x最詳技術(shù)解讀

作者：紓為時間：2025-04-10 來源：汽車電子與軟件

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

本文引用地址：http://2s4d.com/article/202504/469290.htm

在 6 月 28 日的第二屆英飛凌汽車創(chuàng)新峰會上，英飛凌科技正式發(fā)布了采用28 納米工藝技術(shù)生產(chǎn)的 AURIX? TC4x 系列微控制器（MCU），進一步增強其 AURIX? 微控制器家族的產(chǎn)品陣容。

圖1

#01

產(chǎn)品 Overview

1.1 AURIX? TC4x 產(chǎn)品總覽

2014 年，英飛凌推出了第一代 AURIX? TC2x 系列，首次在單片機中集成多達三個 TriCore? 內(nèi)核，為汽車電子帶來了前所未有的多核處理能力。

2018 年，第二代 AURIX? TC3x 系列推出，進一步將多核處理能力提升到新高度，集成多達六個 TriCore? 內(nèi)核。該系列在實時性能、功能安全（最高等級 ASIL-D）、信息安全等方面表現(xiàn)卓越，特別適用于各種汽車應(yīng)用，也在市場上或得了巨大的成功。

如今，英飛凌推出了新一代 AURIX? TC4x 系列。該系列采用新一代 TriCore? 1.8 內(nèi)核，并引入了增強性能的加速器套件，包括并行處理單元（PPU），為人工智能和實時控制應(yīng)用提供強大支持。主要面向電氣化領(lǐng)域（BMS、逆變器等）、區(qū)域控制、ADAS、底盤和車身控制領(lǐng)域，如下圖所示：

圖2

1.2 AURIX? TC4x功能概述

針對上述場景，TC4x 從功能安全、信息安全、高速內(nèi)部通信路由、內(nèi)核等方面做了進一步提升，整體架構(gòu)如下圖所示：

圖3

與 TC3x 相比，TC4x 系列各方面進一步升級：

1.CPU升級

● TriCore?從 v1.6.2 升級到 v1.8，頻率從 300MHz 提升到 500MHz，最高支持 6 對鎖步核同時運行，算力已逼近低端 SoC，例如 TC4Dx 系列算力可達 8000 DMIPS（雙核 A53 算力 7360 DMIPS）；

● 新增兩級 MPU，引入虛擬化功能；

● 新增雙精度浮點運算，滿足 IEEE754-2019；

● 新增 128bit loadstore 指令以提升效率。

2.NvM升級

● 容量上最高支持 25MB NVM，基于 TC3xx 的 AB SWAP 機制進行迭代優(yōu)化，真正實現(xiàn)了零停機升級；

● 在后續(xù)產(chǎn)品中引入 RRAM 技術(shù)，該技術(shù)與臺積電共同研發(fā)已久，這對汽車 OTA 格局是不小的沖擊。

3.新增加速引擎

● PPU（Parallel Processing Unit) ：并行處理單元，旨在替 CPU 完成復(fù)雜信號處理和數(shù)學(xué)運算，助力 AI 功能在 MCU 中的安全實現(xiàn)；

● CSRM（Cyber Security Real-time Module）CSS（Cyber Security Satellite）：硬件密碼加速器；與 TC3x HSM 相比，TC4x 提供兩個不同的硬件加密模塊，支持的加密算法和加密性能得到進一步提升，在后量子密碼時代獨樹一幟；

● CRE（CAN Routing Engine）DRE（ Data Routing Engine) ：數(shù)據(jù)路由引擎；硬件層面實現(xiàn) CAN-CAN 、CAN-ETH 、CAN-MEM 數(shù)據(jù)的路由和轉(zhuǎn)發(fā)。

4.新增可擴展高速通信接口

● PCIe

● CAN XL

● 5Gbps Ethernet

上述接口在區(qū)域控制器中以以太網(wǎng)環(huán)形網(wǎng)絡(luò)架構(gòu)中實現(xiàn)了高帶寬、低延遲的效果。

接下來，我們就詳細解讀其關(guān)鍵技術(shù)。

#02

關(guān)鍵技術(shù)解讀

2.1 NvM

2.1.1 NvM容量

NvM 容量和 RWW（Read-while-Write）特性向來是 Tier 1 、OEM 在產(chǎn)品芯片選型時最關(guān)心的 Feature 之一。

為適應(yīng)新的區(qū)域控制器架構(gòu)要求，支持多應(yīng)用融合，TC4x 延續(xù)了 TC3x 的 NvM 設(shè)計精髓并做出優(yōu)化，每個內(nèi)核可通過獨立接口快速訪問 2 個 PFlash Bank，實現(xiàn)真正零待機 SOTA；設(shè)計出獨立 Security PDFlash ，保證 Host 與 HSM 之間物理隔離，具體示意如下：

圖4

CPU 通過 PFI 接口可以獨立訪問與之關(guān)聯(lián)的 PFlash Bank，實現(xiàn)快速指令訪問，并且由于 CPU 關(guān)聯(lián)兩塊 PFlash ，實現(xiàn)了 RWW，對 SOTA 非常友好。

通過 DMU 訪問 DFlash ；通過 DMU 、FSI 對 PD Flash 進行操作；

Host 每個 PFlash Bank 容量為 2MB，最高支持 24MB(6 CPU*2 Bank*2 MB) ，Security PFlash 為 1MB，總計 25MB；

DFlash0 最高 1MB，DFlash1 為 128KB，均用于 EEPROM。

從地址映射上，仍然延續(xù) TC3x 的 Cacheable 地址 8H，Non-Cacheable 地址 AH，這在使用習(xí)慣上是非常好的繼承。

然而隨著 MCU 算力要求不斷提高，倒逼工藝制造向先進制程進發(fā)，28nm、22nm 甚至 16nm 已經(jīng)被提上日程，但 eFlash 微縮化困難嚴重阻礙了進程，該瓶頸亟待解決。

2.1.2 RRAM開辟NvM新道路

據(jù)臺積電官網(wǎng)介紹，英飛凌與臺積電早已聯(lián)合研發(fā) RRAM(Resistive RAM) ，致力打破 22nm、 28nm 車規(guī) MCU 的 NvM 瓶頸。

RRAM 相比于 eFlash ，具有更高的擴展性、更低的成本和更低的功耗。

作為結(jié)構(gòu)最簡單的存儲技術(shù)，它看上去像一個三明治，絕緣介質(zhì)層（阻變層）被夾在兩層金屬之間，形成由上、下電極和阻變層構(gòu)成金屬-介質(zhì)層-金屬（ metal-insulator-metal ，簡稱 MIM）三層結(jié)構(gòu)。

圖5

RRam 利用阻變原理實現(xiàn)存儲等功能，基于阻變層中導(dǎo)電通路（一般稱為 conductive filament, 導(dǎo)電細絲）實現(xiàn)，通過在上、下電極施加不同的脈沖電壓激勵，使介質(zhì)層發(fā)生阻變，產(chǎn)生物理性變化。

導(dǎo)電細絲會在阻變層中呈現(xiàn)導(dǎo)通或斷開兩種狀態(tài)：非易失性的低阻態(tài)（Low Resistance State， LRS）或高阻態(tài)（ High Resistance State， HRS），從而實現(xiàn)了“0”，“ 1”狀態(tài)的區(qū)分和存儲。

了解其原理后，作為軟件工程師最關(guān)心的還是怎么用，如果能做到軟件移植平滑，指令操作上比TC3xx更簡單，這將在OEM/Tier1做區(qū)域控制器產(chǎn)品選型時是一個非常棒的加分項。

英飛凌與臺積電聯(lián)合開發(fā) RRAM 已有十余年，技術(shù)上是否有更進一步的創(chuàng)新？未來會用在 TC4x 哪些產(chǎn)品型號，我們拭目以待。

2.2 SOTA

之前我們描述了 TC4x 關(guān)于 NvM 的排布，很明顯一顆 CPU 關(guān)聯(lián) 2 塊 PFlash Bank 是非常有利于 SOTA 實現(xiàn)。

在 TC3x 上面我們基于硬件做 AB SWAP，特別是 TC39x 系列，雖然說存在異步域的情況，但在邏輯地址和物理 bank 的映射上還是存在讓人困惑的地方，如下圖：

圖6

可以看到，雖然邏輯地址沒有改變，但在不同地址映射模式下 PF01 與 PF23 切換，PF4 與 PF5 切換，最容易讓人迷糊的就是邏輯地址與物理 Bank 的映射問題，鎖板子的事情常常發(fā)生。

這個問題在 TC4x 系列有所緩解，在不使用硬件 SOTA 機制的情況下(這里暫時不聊 HSM PFlash)，最高可支持 6 核 24MB 線性地址訪問(0x8000 0000-0x817F FFFF) ，如下圖：

圖7

那當我們使用了SOTA機制，好玩的來了，如下圖：

圖8

地址做成了連續(xù)，該模式下 Host 最高支持 12MB，同時，為了不混淆，還特意將 Inactive Back 的地址往后挪了一點(0x8200 0000) ，這樣咱們在使用上就明晰了很多。

TC4x 的 SOTA 支持兩種地址映射，上圖為 A 模式， B 模式下灰色和橙色 Bank 對調(diào)即可。

當然 HSM 同理，雖然它只有一個 1MB 的 PFlash，仍然支持 AB SOTA，看來這個 Flash IP 還重新規(guī)劃了 Bank 容量的。

在 SOTA 使能和配置方面，繼續(xù)使用 UCB 進行 SOTA 的使能和 Bank 切換，經(jīng)典的 55h 對應(yīng) A 地址映射，AA 對應(yīng) B 地址映射。

總結(jié)下來，TC4x 應(yīng)該是總結(jié)了 TC3x 用戶反饋，并且基于區(qū)域控制器做了場景分析，從使用上來看更為方便，也更容易理解。

那么聊到了區(qū)域控制，就不可避免地要談多功能融合，而對于一顆 MCU 來說芯片資源是有限的，因此資源競爭資源隔離成為了區(qū)域控制器實現(xiàn)的關(guān)鍵技術(shù)路徑。

一般來講，應(yīng)基于硬件資源隔離是最可靠的方式，但是不能資源共享給應(yīng)用；于是虛擬化隔離出現(xiàn)了，接下來我們從虛擬化技術(shù)分類開始，掌握 TC4x 虛擬化的基本概念。

2.3 虛擬化

2.3.2 虛擬化技術(shù)

虛擬化技術(shù)按照虛擬化層次通?？梢苑譃橛布摂M化和操作系統(tǒng)虛擬化兩類。

2.3.2.1 硬件虛擬化

硬件虛擬化依賴 Hypervisor（虛擬機監(jiān)視器）和 CPU 的虛擬化擴展，根據(jù) Hypervisor 部署方式，可進一步細分為 Type1和 Type2兩類；

● Type1類型的虛擬化

Hypervisor 直接運行在裸硬件上，也叫作裸機虛擬化，如下圖，

圖9

該類型的 Hypervisor 能夠直接操作控制硬件并管理多個虛擬機（ Guest VM）。每個虛擬機都有自己的操作系統(tǒng)和應(yīng)用程序，可以完全獨立運行。

● Tpye2類型的虛擬化

與Type1類型的虛擬機不一樣，Type2類型虛擬化是指在已經(jīng)裝載好OS的硬件上運行Hypervisor，這個軟件作為應(yīng)用程序管理多個Guest VM。

圖10

可以看到，Type 1 和 Type2 的虛擬化最大區(qū)別在于 Type 1 的 Hypervisor 可以直接操作硬件，沒有多余的開銷，性能相對較高；Type2 的 Hypervisor 訪問硬件資源，還必須經(jīng)過 Host OS。

因此在汽車領(lǐng)域，由于對功能安全等級、實時性有較高要求，一般均使用 Type1 的 Hypervisor，Hypervisor 之上直接運行多個客戶操作系統(tǒng) (GuestOS)；

那么 Hypervisor 是如何來管理和隔離硬件資源，保證各個不同功能的應(yīng)用程序的資源使用安全和資源調(diào)度？

個人理解，資源安全需要從 vCPU 調(diào)度隔離、內(nèi)存隔離、存儲隔離、中斷虛擬化及隔離、網(wǎng)絡(luò)隔離等方面來保證安全，如下圖：

圖11

在 vCPU 的調(diào)度中，常見的Armv8-R 架構(gòu)提供了 EL0-EL2的等級，每個等級可運行的指令不一樣，通常EL0 運行 APP，EL1 運行 GuestOS，EL2 運行Hypervisor（負責(zé) vCPU的上下文切換），實現(xiàn) GuestOS 和Hypervisor的隔離。

2.3.2.2 操作系統(tǒng)虛擬化

操作系統(tǒng)虛擬化一般就是指容器技術(shù)，由操作系統(tǒng)內(nèi)核提供的資源隔離和控制功能，創(chuàng)建出多個相互隔離但共享系統(tǒng)內(nèi)核的用戶空間實例，從而實現(xiàn)對多系統(tǒng)運行能力的支持。

進一步講，容器技術(shù)就是將操作系統(tǒng)所管理的計算機資源，包括進程、文件、設(shè)備、網(wǎng)絡(luò)等分組，然后交給不同的容器使用。

容器中運行的進程只能看到分配給該容器的資源。從而達到隔離與虛擬化的目的。實現(xiàn)容器技術(shù)需要用到 Namespace 及 cgroups 技術(shù)。

典型代表就是 Docker 公司在 2013 推出的輕量級虛擬化技術(shù)--Docker 。結(jié)構(gòu)如下圖：

圖12

在這種虛擬化機制下，操作系統(tǒng)內(nèi)核被每個容器共享，每個容器使用相同的 OS，由 OS 來分配資源，不過正是因為這種多個 App 共享內(nèi)核的機制，可能存在漏洞或攻擊風(fēng)險。因此目前容器化場景在汽車中還沒看到實際應(yīng)用。

2.3.2 MCU 為什么要提虛擬化

在汽車行業(yè)里，虛擬化的概念最先由座艙域引入，目的是在同一顆 SoC 上實現(xiàn)儀表和中控兩個系統(tǒng)的功能，在 Hypervisor 的管理下基本可以不修改舊代碼就可移植到最新的硬件上，如下圖：

圖13

隨著區(qū)域控制器概念的提出，以前底盤、車身域控下掛節(jié)點的功能有可能會被整合或者直接移植到高性能的區(qū)域控制器 MCU 中，這種集成難度和整合工作難度不??；

試想，BCM、PowerControl、BMS 等功能即使在 OEM 里也是不同部門進行開發(fā)，在操作系統(tǒng)、硬件資源上差異可能很大，要想減輕集成難度，充分利用 MCU 資源，在沒有虛擬化的情況下勢必需要重新規(guī)劃軟硬件架構(gòu)；

再惡劣的情況，如果下掛子節(jié)點是由供應(yīng)商黑盒交付，OEM 想要完成集成工作，引入虛擬化是最省錢省事的方案，如下圖：

圖14

在上述示意中，我們通過 VM(Virtual Machine，虛擬機)來實現(xiàn)上述集成工作。虛擬機模擬了一個完整的計算機系統(tǒng)，包括處理器、內(nèi)存、存儲設(shè)備和其他硬件，這就意味著在同一臺物理計算機上可以同時運行多個操作系統(tǒng)和應(yīng)用程序。

其中，VM0 用于運行 Hypervisor，用于創(chuàng)建和管理虛擬化環(huán)境，例如 VM1-4，同時還負責(zé) VM1-4 的時間調(diào)度、資源管理、數(shù)據(jù)通信等；VM1 用于電池管理系統(tǒng)、VM2 涵蓋了 DC/DC 和充電功能、VM3 集成了 Inverter 和 PDC，VM4 可以運行車身控制，每個 VM 都可以使用獨立的操作系統(tǒng)（ RTOS、AUTOSAR OS 等等），從某種意義上講，VM1-4 甚至都認為自己獨占了整個 MCU 資源。而從硬件角度，CPU0 里既包含了 VM1 還包含了 VM2，CPU1 里包含了 VM2 和 VM3，依次類推。

2.3.3 TC4x 的虛擬化

由于 VMn 是基于時間片分時復(fù)用芯片資源，因此對于算力和硬件虛擬化特性都提出來以前 MCU 沒有的新需求。

TC4x 設(shè)計了 TC1.8 ，最高主頻可達 500MHz，算力上得到巨大增加。

同時支持虛擬化輔助功能，該功能可以根據(jù)需要進行使能；

針對虛擬化，每個核有三套獨立硬件資源 HRHV 、HRA 、HRB，可支持最大 8 個 VM，其中 VM0 運行 hypervisor，VM1 運行實時虛擬機，VM2-7 運行其他 VM，如下圖所示：

圖15

● HRVH–Hypervisor hardware resource（VM0）；

● HRA–Real time virtual machine hardware resource (VM1)；

● HRB–Other virtual machine hardware resource (VM2-7)。

MCU上電后，如果內(nèi)核支持虛擬化，那么所有 HRHV 里的資源均可以被訪問了，這個時候啟動代碼就可以開始設(shè)置 Hypervisor 需要的狀態(tài)，這里面包含了虛擬化功能的使能、關(guān)于 NMI 處理層級的配置(Hypervisor 或者普通 VM 處理) 、目標 VM 的序號等等，如下圖：

圖16

既然每個核支持最大8個VM，那么針對中斷的處理也有對應(yīng) 8 套資源，那么就引發(fā)了幾個問題：

● 假設(shè)被分配到的VM此時還沒有運行怎么辦？

● 假設(shè)被分配到的VM此時正在處理中斷怎么辦？

我們按照正常物理中斷處理流程做出假設(shè)，VM之間也可以進行搶占，得到如下：

正常時間片為 2000us，VM1 占用 500us，VM2 占用 1000us，VM3 占用 500us；

當 VM2 正在運行時，此時來了一個 VM1 的中斷，該中斷可以搶占 VM2 的時間，所以此時 Hyperviosr 需要將 VM2 的上下文保存，并切換到 VM1，讓其完成 ISR 處理，然后恢復(fù)現(xiàn)場 VM2 繼續(xù)運行；

當 VM3 正在運行時，此時來了一個 VM2 的中斷，但它不可搶占 VM3 的時間，所以需要 VM3 運行完畢后切換到 VM2 的 ISR 進行處理，當然這里也擠壓了 VM1 的時間。

TC4x是如何實現(xiàn)上述功能的呢？

在他們的設(shè)計中，每個中斷 SRN 都可以被拓展分配給 1 個 VM；每個 VM 都有自己獨立的中斷狀態(tài)控制寄存器，包括當前 VM 中斷系統(tǒng)是否使能(簡稱 VMIE) 、當前 VM 的優(yōu)先級(簡稱 VMCP) 、Pending 中斷優(yōu)先級(簡稱 VMPIP)；

為了實現(xiàn)運行 VM 在收到其他 VM 中斷時可被搶占，新增了搶占閾值寄存器，簡稱 THR，好玩的就來了。

假設(shè)當前正在運行 VM1，此時來了一個 VM0 的中斷，如果此時進來的 Pending 中斷優(yōu)先級高于 VM0 配置的搶占閾值，同時高于 VM0 的當前優(yōu)先級，那么 Hypervisor 就需要進行上下文切換，返回到VM0 處理中斷，偽代碼如下：

if (INT.VM_coming == current VM){        if ((VMPIP > VM_coming.VMCP) && (VM_coming.IE )        {               isr_routine();          }        else        {                Keep INT Pending          }}else (INT.vm_coming == VM0 ){        if ((VMPIP > VM0.VMCP) && (VMPIP > VM0.THR)
        {            Switch to HRHV                isr_routine();        }        else        {            Keep INT Pending        }}

同理，如果當前 VM0、VM1、VM2 同時運行，也需要執(zhí)行上述步驟。如 VM2 要搶占 VM1 時，由于 VM1 獨享 HRA，因此可直接切換到 HRB 讓 VM2 進行中斷處理。

本質(zhì)上，這樣的機制和透傳很像，只是我們可以通過 Hypervisor 配置每個 VM 的中斷狀態(tài)控制器寄存器、搶占閾值寄存器來實現(xiàn)中斷實時性的控制，例如：

當我們把閾值配置為最大時，此時誰也無法進行搶占(Trap 除外)，只能得到時間片走完；如果閾值配置為最小，那就是直接透傳，這時候性能最優(yōu)。

2.3.4 基于TC4x的Hypervisor

通過 2.3.3 小結(jié)，我們對 TC4xx 的虛擬化有了一定的了解，也不難看出，其中最關(guān)鍵的還是運行在裸板上的 Hypervisor 軟件。

目前已知的關(guān)于MCU Hypervisor 軟件主要由基礎(chǔ)軟件供應(yīng)商提供，例如Vector 的 veHypervisor，基于 Type1Hypervisor 架構(gòu)實現(xiàn)，滿足 ASIL-D 要求，如下圖：

圖17

EB 與英飛凌聯(lián)合開發(fā)基于 AURIX TC4x 的 AutoCore OS 和 EB tresos Embedded Hypervisor，支持 OEM 和 Tier 1 更輕松地開發(fā)和部署基于 AUTOSAR Classic 標準的汽車 E/E 架構(gòu)，助力下一代車輛的加速開發(fā)：

圖18

ETAS RTA Lightweight Hypervisor

圖19

不管上述各家對于 Hypervisor 的描述如何變化，本質(zhì)上還是在強調(diào)在一顆 MCU 里多 VM 場景的并行運行和資源隔離，不僅要支持不同操作系統(tǒng)，還要需要穩(wěn)定安全高效的時間調(diào)度機制來支持多 VM。

2.4 加速器

2.4.1 PPU

在 ADAS 領(lǐng)域里，大家很有默契地幾乎都用 TC39x 系列作為功能安全島，除此之外 MCU 還承接車內(nèi) CAN 報文收發(fā)，雷達數(shù)據(jù)等輔助處理，常見架構(gòu)如下：

圖20

根據(jù)雷達在汽車布局位置分為前雷達(Front Central Radar) 、側(cè)后雷達(Side-Rear Radar)以及泊車系統(tǒng)使用的超聲波雷達(Ultra Sonic Sensor)；

根據(jù)測距不同分為 24GHz 和 77GHz 雷達，可見信號處理上的復(fù)雜性；而在雷達數(shù)據(jù)的處理上通常都會用到快速傅里葉變換(FFT)用于頻率分析、波束形成等等，在數(shù)據(jù)處理上針對單個數(shù)據(jù)點使用標量算法，針對多個數(shù)據(jù)點組合進行向量運算等，在波束形成時進行矩陣運算，在 TC3x 系列中，我們使用 RIF 和 SPU 來完成上述計算，如下圖：

圖21

而隨著智能駕駛邁向新的階段，復(fù)雜應(yīng)用模型需要更強大的計算能力，為此，TC4x 產(chǎn)品里設(shè)計出并行處理單元 PPU( Parallel Processing Unit) ，用于實現(xiàn)數(shù)據(jù)處理需求大或執(zhí)行時間要求快的模型，例如信號濾波、算法處理、模型預(yù)測控制等。

PPU其結(jié)構(gòu)如下：

圖22

● 標量處理單元里包含了一顆 32bit 標量核，它支持雙精度浮點運算，用于執(zhí)行大量標量運算；

● 向量 DSP 處理單元，位寬 128~256bit ，支持 SIMD(單指令多數(shù)據(jù))指令，支持浮點向量運算、專用信號處理，提高計算效率；

● DMA、Memory：分別用于數(shù)據(jù)搬運，輸入和輸出臨時存儲等。

除了智駕方面應(yīng)用，PPU 也可應(yīng)用在電機矢量控制上，在算法上坐標變換使用三角函數(shù)、觀測器迭代、鎖相環(huán)鑒相等等操作是非常消耗 MCU 的計算資源，PPU 中的 Vector DSP 單元可以有效加速實時觀測計算，從而幫助 Tricore 提高運行效率。

PPU 還可用于基于 AI 的電池診斷，包括鍍鋰層檢測，電池健康狀態(tài)(SoH)和老化軌跡預(yù)測，剩余使用壽命（RUL）預(yù)測等等。

在開發(fā) PPU 時，我們可以結(jié)合相關(guān)應(yīng)用模型和 PPU 對應(yīng)軟件庫。

Mathworks 在官方提供了基于 TC4x 的 Tricore 與 PPU 通信的模型、基于 PPU 的電機矢量控制模型等；

新思科技為 TC4x 的 PPU 提供了豐富的軟硬件支持，在向量 DSP、神經(jīng)網(wǎng)絡(luò)處理、AUTOSAR 適配等提供了豐富的資源，例如 MetaWare Development Toolkit、MetaWare Neural Network SDK 用于基于 PPU 優(yōu)化的模型變異等等；

圖23

總體而言，PPU 主要是為了 Tricore 承接了 A I 、電機控制、區(qū)域控制等復(fù)雜的信號處理和數(shù)學(xué)運算；由于 PPU 本身特性，在計算效率上更快，Tricore 則主要用于控制，這與現(xiàn)有異構(gòu) SoC 的設(shè)計理念已經(jīng)非常相似了；我想這也是未來 MCU 的發(fā)展趨勢之一。

2.4.2 數(shù)據(jù)路由加速器

在整車中央計算平臺等架構(gòu)里的網(wǎng)絡(luò)通信概念通常以以太網(wǎng)為主干，它連接了中央計算平臺、各區(qū)域控制器；在區(qū)域控制器里使用其他通信網(wǎng)絡(luò)連接下掛節(jié)點。

架構(gòu)概念如下：

圖24

目前主流的車內(nèi)通信手段是以 CAN CANFD 和車載以太網(wǎng)為主，區(qū)域控制器間通過以太網(wǎng)為通信，在區(qū)域內(nèi)仍以 CAN、CANFD 為主。因此，不同域之間的 ECU 節(jié)點進行通信，就必須要經(jīng)由 CAN->ETH->CAN 的通信路徑，所以這中間就存在如下問題：

● 以太網(wǎng)應(yīng)該使用什么傳輸協(xié)議保證 CAN 的有效 paly load 不丟失；

● CAN 是周期廣播形式，以太網(wǎng)多是點對點事件觸發(fā)，這需要做什么樣的優(yōu)化？

● 區(qū)域控制器承接部分網(wǎng)關(guān)作用，在數(shù)據(jù)路由上需要達到什么樣的性能？

對于網(wǎng)關(guān)來說，最重要的就是路由數(shù)據(jù)一致性和時效性。在 AUTOSAR 技術(shù)視角里，報文的路由基本都會放在PduR層級進行處理。以CANFD路由到CAN 為例，通常會經(jīng)過 CAN0->CanIf->PduR->CanIf->CAN1 這樣一個路徑，其路由表在PduR 定義，顯而易見，這在數(shù)據(jù)延遲方面做不到性能最優(yōu)，我曾經(jīng)為了百 us 級的路由在 CanIf 層手擼了一套定制化的PduR，頭大不已。因此一直在想如果在硬件設(shè)計這樣一套路由機制，將PduR中的路由表承接下來，那這數(shù)據(jù)路由的延遲將會大大降低，概念如下圖所示：

圖25

為此，英飛凌 TC4x 提出了 DRE、CRE 等等用于 CAN2ETH 、CAN2CAN 等數(shù)據(jù)路由硬件加速功能。

TC4x 芯片所有加速硬件的總體結(jié)構(gòu)如下：

圖26

我們主要介紹 CRE 和 DRE 兩個模塊。

● CRE：位于 CAN 模塊內(nèi)部，可用于路由 CAN 消息到模塊內(nèi)部其他節(jié)點。

TC4x 支持 5 個 CAN 模塊，每個 CAN 支持 4 個節(jié)點，總計 20 個 CAN Channel。在每個 CAN 模塊內(nèi)部有一個 CRE(CAN Routing Engine) ，用戶只需要配置相應(yīng)的路由表（寄存器），即可實現(xiàn)模塊內(nèi)部節(jié)點間的 CAN 路由，如下：

圖27

● DRE：用于 CAN 和 Ethernet 的相互路由，和 CRE 完成 CAN 幀到不同 CAN 模塊的路由。DRE 最重要功能就是把 CAN 幀路由給 Ethernet 幀，這就涉及到我們前面提到的問題：這種 CAN->ETH 應(yīng)該以什么樣的格式對數(shù)據(jù)進行封裝？

在 DRE 里采用的是 ACF 格式對 CAN 進行封裝。ACF 全稱 AVTP Control Format，它是 AVTP 協(xié)議的子集，AVTP（Audio/Video Transport Protocol）里定義了 CANCANFD ACF message 數(shù)據(jù)格式，如下圖：