邊緣視覺 AI 的理想平臺

—— Kria K26 SOM

作者：時(shí)間：2021-06-18 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

Kria K26 SOM 旨在讓數(shù)百萬開發(fā)者在他們最擅長的環(huán)境下，用開箱即用的低成本開發(fā)套件入門，以更快的速度部署他們的智能視覺應(yīng)用。

本文引用地址：http://2s4d.com/article/202106/426416.htm

概要

隨著人工智能 (AI) 和機(jī)器學(xué)習(xí) (ML) 算法取得一系列新的進(jìn)展，眾多高計(jì)算強(qiáng)度的應(yīng)用現(xiàn)在正在被部署到邊緣設(shè)備上。因此我們需要一種高效率的硬件，既能高效率地執(zhí)行復(fù)雜算法，又能適應(yīng)這種技術(shù)的快速演進(jìn)。賽靈思 Kria? K26 SOM 的設(shè)計(jì)初衷，是用于滿足在邊緣設(shè)備上高效率執(zhí)行 ML 應(yīng)用的需求。本白皮書對各種 ML 模型和實(shí)時(shí)應(yīng)用的性能開展研究并與英偉達(dá) Jetson Nano 和英偉達(dá) Jetson TX2 進(jìn)行對比。賽靈思的研究結(jié)果表明，K26 SOM 提供了比英偉達(dá) Jetson Nano高出大約 3 倍的性能。此外，它的單位功耗性能比英偉達(dá) Jetson TX2 提升 2 倍。對于 SSD MobileNet-v1 這樣的網(wǎng)絡(luò)，K26 SOM 的低時(shí)延高性能深度學(xué)習(xí)處理單元 (DPU)提供了比 Nano 高出 4 倍，甚至更高的性能，這使得 Kria SOM 成為ML 邊緣應(yīng)用開發(fā)的理想選擇。

計(jì)算視覺的發(fā)展

在過去十年，人工智能和機(jī)器學(xué)習(xí)算法有了長足發(fā)展。這些發(fā)展主要體現(xiàn)在視覺相關(guān)的應(yīng)用上。2012 年，AlexNet（Krizhevsky 等[參考資料 1]）從 ImageNet 大規(guī)模視覺識別挑戰(zhàn)賽勝出 (ILSVRC)，成為首個使用反向傳播算法完成訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)。與傳統(tǒng)的淺網(wǎng)絡(luò)相比，性能發(fā)生了前所未有的近 10% 的飛躍，預(yù)測精度躋身前 5 位。這個重大發(fā)展是一個轉(zhuǎn)折點(diǎn)。從那時(shí)起，深度神經(jīng)網(wǎng)絡(luò)在性能和精度兩個方面不斷迎來巨大進(jìn)展。2015 年 ResNet（Kaiming 等[參考資料 2]）超越了單個人類的分類能力。參見圖1。就各種目的和用途而言，今天的神經(jīng)網(wǎng)絡(luò)的錯誤率已經(jīng)可以與貝葉斯錯誤率相媲美，可以視為已經(jīng)解決了計(jì)算機(jī)視覺應(yīng)用中的圖像分類問題。

圖1 前5位預(yù)測精度

鑒于如此令人振奮的結(jié)果，半導(dǎo)體制造商爭相開發(fā)器件，支持深度學(xué)習(xí)部署的高度復(fù)雜的計(jì)算需求。在未來十年，推斷功能的商業(yè)化，特別是用深度學(xué)習(xí)實(shí)現(xiàn)的計(jì)算機(jī)視覺的商業(yè)化，將繼續(xù)高速增長。計(jì)算機(jī)視覺市場規(guī)模預(yù)計(jì)將以 30% 的年均復(fù)合增長率 (CAGR) 增長，到 2025 年將達(dá)到 262 億美元 [參考資料 3]。用深度學(xué)習(xí)實(shí)現(xiàn)的計(jì)算機(jī)視覺可以廣泛地應(yīng)用到各類行業(yè)市場，包括零售分析、智慧城市、執(zhí)法、邊境安全、機(jī)器人、醫(yī)療成像、作物收獲優(yōu)化、符號語言識別等。在不遠(yuǎn)的未來，AI 將成為日常生活的內(nèi)在組成部分。而且有部分人認(rèn)為如今這樣的未來近在咫尺。

隨著新穎的網(wǎng)絡(luò)、層和量化技術(shù)被開發(fā)出來，采用固定存儲器架構(gòu)的硬化Tensor 加速器，不再能夠滿足未來的需求。這種狀況已經(jīng)在 MobileNets（Howard 等）的發(fā)展中表露無遺[參考資料 4]。在 MobileNet 骨干網(wǎng)絡(luò)中使用深度卷積能大幅降低計(jì)算-存儲器比。這對于通用 CPU 這樣的器件來說非常理想。CPU 一般受計(jì)算約束，但在若因架構(gòu)受存儲器所限而導(dǎo)致效率有限，在某種程度上等于浪費(fèi)了寶貴的計(jì)算周期，

就像數(shù)據(jù)中心中的空閑服務(wù)器消耗能量一樣。這種計(jì)算-存儲器比影響著部署網(wǎng)絡(luò)[參考資料 5]時(shí)具體 Tensor 加速器架構(gòu)的總效率。不幸的是，ASIC 和 ASSP Tensor 加速器架構(gòu)一般在器件流片前至少一年就已凍結(jié)。但在使用賽靈思推斷技術(shù)時(shí)則不會發(fā)生這種情況。賽靈思技術(shù)能隨時(shí)間推移進(jìn)行調(diào)整和優(yōu)化，以支持神經(jīng)網(wǎng)絡(luò)架構(gòu)的快速演進(jìn)發(fā)展，從而確保低功耗、高效率。

本白皮書介紹了賽靈思產(chǎn)品組合中的最新成員 Kria? K26 SOM，及其在嵌入式視覺應(yīng)用中的的主要優(yōu)勢。

新聞中心

邊緣視覺 AI 的理想平臺

評論

相關(guān)推薦

技術(shù)專區(qū)