FPGA技術(shù)協(xié)助嵌入式系統(tǒng)競逐于機器學(xué)習(xí)之路
機器學(xué)習(xí)技術(shù)是人工智能的一個重要科學(xué)發(fā)展,透過在經(jīng)驗學(xué)習(xí)中改善具體算法的效能,而且用來訓(xùn)練的數(shù)據(jù)越多,所學(xué)習(xí)出來的結(jié)果越好,為了處理分析大量圖像或是語音等辨識的機器學(xué)習(xí)算法數(shù)據(jù),需要采用GPU芯片所打造的高速平行運算處理的類神經(jīng)網(wǎng)絡(luò)超級計算機,利用諸如Tensorflow、Caffe等深度學(xué)習(xí)框架(Framework)等工具,來發(fā)展有效的算法。
本文引用地址:http://2s4d.com/article/201710/365483.htm一旦得到算法之后,對嵌入式系統(tǒng)的設(shè)計而言,迅速將算法應(yīng)用到云端數(shù)據(jù)中心,或是直接到終端的邊緣運算(Edge CompuTIng)裝置上,就是目前人工智能應(yīng)用成果發(fā)揮的展示場。由于嵌入式系統(tǒng)本身的運算效能與低功率消耗的功能不斷提升,所構(gòu)建的智能功能、軟硬件解決方案,非常有助于開創(chuàng)前所未有的人工智能的應(yīng)用。
機器學(xué)習(xí)的技術(shù)已廣泛應(yīng)用于數(shù)據(jù)探勘、計算機視覺、自然語言處理、生物特征識別、搜索引擎、醫(yī)學(xué)診斷、檢測信用卡欺詐、證券市場分析、語音和手寫識別、戰(zhàn)略游戲與機器人等應(yīng)用領(lǐng)域。
可程序設(shè)計門陣列(FPGA)的解決方案,利用其可程序設(shè)計性的優(yōu)勢,已經(jīng)廣為業(yè)界所認(rèn)知,賽靈思(Xilinx)做為FPGA解決方案的主要供貨商而言,密切關(guān)注機器學(xué)習(xí)所帶領(lǐng)的產(chǎn)業(yè)趨勢,以及重要的應(yīng)用范例。賽靈思亞太區(qū)工業(yè)及醫(yī)療市場的高級經(jīng)理羅霖(Andy Luo)先生接受專訪時,針對Xilinx產(chǎn)品進入機器學(xué)習(xí)的領(lǐng)域,提綱契領(lǐng)直指兩個主要的應(yīng)用領(lǐng)域。
賽靈思亞太區(qū)工業(yè)及醫(yī)療市場的高級經(jīng)理羅霖(Andy Luo)
首先,在云端機房與數(shù)據(jù)中心的應(yīng)用領(lǐng)域,透過跨國性大型搜索引擎與社群媒體巨擘的緊密合作,以大陸市場為例,Xilinx與百度(Baidu)的搜索引擎加速器合作,具有重要的指標(biāo)性,由于機器學(xué)習(xí)在高效能運算(HPC)平臺上,使用的類神經(jīng)網(wǎng)絡(luò)模型與多層次架構(gòu)(Training Framework)來訓(xùn)練算法,一旦將結(jié)果應(yīng)用于數(shù)據(jù)中心的加速卡設(shè)計時,往往需要進行細部的調(diào)整與開發(fā),所以彈性變更邏輯線路的設(shè)計要求下,FPGA的可程序化(Programmable)的能力就益行重要。
Xilinx的解決方案之所以迅速攫取多數(shù)大廠用戶的目光,端賴兩項重要的誘因,也就是低功率消耗與高度靈活的硬件平臺,提供數(shù)據(jù)中心專用加速器性能上的優(yōu)勢,并支持?jǐn)?shù)據(jù)中心業(yè)者,打造更快速的創(chuàng)新應(yīng)用與技術(shù)。
Xilinx推出可重組加速堆棧(Reconfigurable AcceleraTIon Stack)技術(shù),針對機器學(xué)習(xí)、大數(shù)據(jù)分析和視頻串流直播(Video Streaming)等三大新興計算密集型應(yīng)用,借助所提供各種應(yīng)用鏈接庫、開發(fā)工具和參考設(shè)計,有效的降低設(shè)計工程師開發(fā)FPGA通用的程序設(shè)計門坎,迅速解決數(shù)據(jù)中心中工作負載快速增長的挑戰(zhàn),并加速云端服務(wù)產(chǎn)品上市進程。
第二個重要的應(yīng)用領(lǐng)域,就是在邊緣運算裝置的部署,因為大量的視訊鏡頭的使用,使得嵌入式視覺(Embedded Vision)技術(shù)可以因為采用機器學(xué)習(xí)的算法,而帶來更多智能型的應(yīng)用。
但是嵌入式系統(tǒng)考慮功率消耗需求,無法企求使用32或64位的高效能處理器,因此開發(fā)出一種技術(shù),讓多半使用32-bit或16-bit的浮點運算(FloaTIng Point)所設(shè)計的算法,可以放在8位整數(shù)運算處理器的智能終端裝置上,Xilinx的解決方案在這類的應(yīng)用上,保持算法在嵌入式系統(tǒng)上有效的準(zhǔn)確度,所以使用機器學(xué)習(xí)所訓(xùn)練而獲得的算法,當(dāng)部署到低耗電與低運算密度的系統(tǒng)時,仍能完成人工智能的應(yīng)用。
智能終端運算應(yīng)用隨著空拍機與自動駕駛汽車的發(fā)展,尤其是先進駕駛輔助系統(tǒng)(ADAS)中的自動識別、路線規(guī)劃,以及無人機上自動避開空中障礙,或是視訊監(jiān)控與辨識分析等新興功能,帶領(lǐng)令人高度期待的應(yīng)用,也推增FPGA的市場占有率。
另一個重點就是工業(yè)4.0的應(yīng)用,這利用傳感器融合(Sensor Fusion)的裝置,將工業(yè)場域所收集的控制數(shù)據(jù),做線性規(guī)劃與數(shù)據(jù)分類,以掌握工業(yè)設(shè)備目前的狀態(tài)。選擇Xilinx的FPGA組件能在單一芯片上提供廣泛的高速界面,能以低成本獲得更高效能,并因為各種開發(fā)環(huán)境整合到同一平臺上而節(jié)省開發(fā)資源,讓客戶得以專注于開發(fā)差異化功能的產(chǎn)品,取得市場先機。
低功率消耗與快速反應(yīng)速度 FPGA獨擅勝場
和GPU為主的解決方案相比,羅霖分析FPGA的主要優(yōu)勢,首推低功耗的設(shè)計,通常3瓦的功耗的設(shè)計足以支撐整個加速卡的效能,第二個重要的優(yōu)勢,是反應(yīng)速度快速,以微秒等級的反應(yīng)速度,特別適合在空拍機或是自駕車應(yīng)用的領(lǐng)域,因為反應(yīng)速度決定人身安全的重要訴求。
但是FPGA也有弱點,羅霖持平而論,也就是工程師的開發(fā)FPGA的時間較長,因為需要熟悉使用邏輯線路分析、布局布線等EDA工具才能設(shè)計FPGA線路,雖然FPGA現(xiàn)在也可以利用OpenCL和C 語言以類似軟件的流程來程序設(shè)計,但是不可諱言的,其工程設(shè)計門坎還是比GPU的使用設(shè)計要高,羅霖強調(diào)Xilinx對于FPGA在機器學(xué)習(xí)方面組成開發(fā)者社群,并開發(fā)豐富的工具和鏈接庫的,已經(jīng)可以大大提升設(shè)計效率。
羅霖指出Xilinx的FPGA解決方案,在全球主要通信系統(tǒng)機房中,一直是用來做為主要通訊系統(tǒng)的設(shè)計,利用密集型計算應(yīng)用,做為處理通信標(biāo)準(zhǔn)中信號處理與應(yīng)用,幾乎占了Xilinx的50%的主要收入來源,但是配合機器學(xué)習(xí)所帶領(lǐng)的數(shù)據(jù)中心加速卡與邊緣運算終端的應(yīng)用,涵蓋更多的無人空拍機、智能型視訊影像監(jiān)控系統(tǒng)、自駕車的應(yīng)用,目前已經(jīng)貢獻Xilinx另外的40%的營業(yè)收入來源,前景非常具有爆發(fā)式成長動能。
展望2017的目標(biāo),第一,Xilinx設(shè)定工業(yè)物聯(lián)網(wǎng)(IIoT)的應(yīng)用,從工業(yè)設(shè)備常用的PLC應(yīng)用,以及透過IEEE TSN、OPC-UA的工業(yè)通訊協(xié)議的整合,以掌握實時性的信息,開發(fā)工業(yè)應(yīng)用,第二,面對機器學(xué)習(xí)的算法與相關(guān)的FPGA設(shè)計工具的加強,加快協(xié)助客戶做到人工智能功能的快速部署,以達到更卓越的效能需求,并能同時降低開發(fā)成本。
評論