新聞中心

EEPW首頁 > 業(yè)界動態(tài) > 同樣是做AI芯片,走的路又有什么不同?

同樣是做AI芯片,走的路又有什么不同?

作者: 時間:2017-02-15 來源:財經(jīng)網(wǎng) 收藏
編者按:在芯片這個地方,它是每隔一段就會換一個應用方向,90年代時候最火的是多媒體電腦,也就是PC端,后來就變到了移動端,最近則是人工智能,核心專用芯片是人工智能時代的戰(zhàn)略制高點,在這個領(lǐng)域NV/Google/Intel/AMD在AI芯片的都有不同戰(zhàn)略,誰能笑到最后?出現(xiàn)黑馬的幾率有多大?

  一、行業(yè)的演進路線

本文引用地址:http://2s4d.com/article/201702/344005.htm

  行業(yè)的整體發(fā)展始自上世紀60年代,一開始是指數(shù)型發(fā)展,所以有了每18個月集成度翻一番的摩爾定律,可以說當時的發(fā)展是非??斓摹D柖杀澈蟮倪壿嬍钦f,隨著工藝制程的進化,同一款的制造成本會更低,單位面積晶體管數(shù)量提升導致相同的芯片所需要的面積縮小;而如果工藝制程發(fā)展速度過慢,則意味著芯片制作成本居高不下,導致利潤無法擴大。但是,如果孤注一擲把所有的資本都用來發(fā)展新制程,則風險太大,一旦研發(fā)失敗公司就完蛋了。

  摩爾發(fā)現(xiàn)當時市場上成功的半導體廠商的制程進化速度大約是每年半導體芯片上集成的晶體管數(shù)量翻倍,于是寫了著名的論文告訴大家這個發(fā)展速度是成本與風險之間一個良好的折中,半導體業(yè)以后發(fā)展可以按照這個速度來。

  可以說,摩爾定律背后的終極推動力其實是經(jīng)濟因素,它給市場帶來的積極影響是,隨著半導體工藝制程的進化,芯片的性能以指數(shù)級增長,從而帶動了電子產(chǎn)品性能大躍進式發(fā)展,電子市場一片生機勃勃。在摩爾定律提出的前三十年,新工藝制程的研發(fā)并不困難,但隨著晶體管越來越小,越來越接近宏觀物理和量子物理的邊界,高級工藝制程的研發(fā)越來越困難,研發(fā)成本也越來越高。如果工藝制程繼續(xù)按照摩爾定律所說的以指數(shù)級的速度縮小特征尺寸,會遇到兩個阻礙,一個是經(jīng)濟學阻礙,另一個是物理學阻礙。

  經(jīng)濟學阻礙是,隨著特征尺寸的縮小,芯片的成本上升很快。這個成本包括NRE成本(Non-Recurring Engineering,指芯片設(shè)計和掩膜制作成本,對于一塊芯片而言這些成本是一次性的)和制造成本(即每塊芯片制造的成本)。有人計算過,以現(xiàn)在的最新工藝,一塊芯片的NRE要到1000萬美元以上。如此高昂的NRE意味著需要非常非常高的芯片生產(chǎn)量才能去攤薄這個成本。換句話說,如果芯片的產(chǎn)量不到,那么你就沒有能力去使用最新的工藝,只能沿用較舊的工藝。這就部分打破了摩爾定律 “投資發(fā)展制程-芯片生產(chǎn)成本降低-用部分利潤繼續(xù)投資發(fā)展制程”的邏輯。

  而物理學的障礙主要來源于量子效應和光刻精度。晶體管太小就會碰到各種各樣的問題,比如當特征尺寸縮小到10nm的時候,柵氧化層的厚度僅僅只有十個原子那么厚,這時便會產(chǎn)生諸多量子效應,導致晶體管的特性難以控制。

  我認為,現(xiàn)在芯片行業(yè)的發(fā)展已經(jīng)到了瓶頸期,接下來的發(fā)展策略有三種,分別是More Moore, More than Moore和Beyond Moore。第一種More Moore,意思是繼續(xù)按照摩爾定律的老路走下去,繼續(xù)縮小晶體管尺寸;第二種More than Moore,意思是首先芯片系統(tǒng)性能的提升不再單純地靠晶體管的縮小,而是更多地靠電路設(shè)計以及系統(tǒng)算法優(yōu)化。其次集成度的提高不一定要靠把更多模塊放到同一塊芯片上,而是可以靠封裝技術(shù)來實現(xiàn),例如Intel的EMIB,TSMC的InFO等等(蘋果的處理器就用了InFO技術(shù));第三種Beyond Moore,意思是干脆不用CMOS器件而是去研發(fā)一些新的器件,不過這個目前看起來還比較遙遠。未來估計是會More Moore結(jié)合More than Moore,隨著時間推移More than Moore比重越來越大。

  其實我對未來還是蠻悲觀的,這個瓶頸期如果沒有新器件誕生的話,應該會持續(xù)5年10年甚至更長一段時間。就像鋼鐵行業(yè),它早已進入平緩期,也沒什么特別新的技術(shù),如果這個行業(yè)想要有比較大的發(fā)展,那除非是發(fā)現(xiàn)新的材料可以替代鋼。半導體行業(yè)也一樣,什么時候出來新器件結(jié)束這個瓶頸期我也不知道,有的時候科學上的事情就是很偶然,可能突然就發(fā)現(xiàn)某種材料可以用了,但如果你找不到新材料,就是沒辦法有很大突破。

  二、NV/Google/Intel/AMD在芯片的不同戰(zhàn)略

  其實人工智能計算還是分很多領(lǐng)域,芯片應用大概有兩個極端:一個是用于云端服務器的高功耗高計算能力的芯片,走的是高性能超級計算機(HPC)的路子;另一個是用于終端(比如手機)的人工智能芯片,這個就特別注重低功耗,對計算能力的要求不是特別高。

  在云端服務器這個領(lǐng)域,因為要處理海量的數(shù)據(jù),Nvidia的GPU已經(jīng)成為服務器不可或缺的一部分,但Nvidia自己目前還沒有打算大規(guī)模自己做服務器,因此在人工智能的云端市場,Nvidia提供的是硬件而非平臺。而在終端這個領(lǐng)域,Nvidia基于GPU的人工智能平臺一方面功耗太大,另一方面過高的計算能力反而導致成本過高,因此無法與定制芯片抗衡。其實,Nvidia的人工智能平臺最具優(yōu)勢的應用場景是上面兩種情況的中間,即數(shù)據(jù)量中等、對計算能力要求還比較高、對功耗有一定要求但是并不苛刻的地方,比如ADAS市場。Nvidia人工智能平臺無論計算能力(10-100TOPS)還是功耗(10-100W)都能完美地符合要求,因此它主打自動駕駛市場并不奇怪,它在2017年1月份舉辦的CES上也主要發(fā)布了自動駕駛相關(guān)的產(chǎn)品。

  Intel的話,從三個方面來說吧。第一,在云端市場,它是最大的玩家,并且正在積極準備與Nvidia抗衡,因為Intel在HPC方面的業(yè)務本來就是駕輕就熟,而Nvidia進入HPC還沒有幾年,只能算這個市場的new player。大概是在2013年的時候,人們才發(fā)現(xiàn)原來GPU可以用于深度學習,之前根本不知道這個事情。說回Intel,它在收購Altera之后推出了基于FPGA的專用深度學習加速卡,可以在云端使用。另外Intel收購Nervana后正在積極推廣結(jié)合其技術(shù)為優(yōu)化的Knight Mill至強處理器,目標也是在云端。第二,在車載端,Intel與Mobileye和BMW結(jié)成了自動駕駛聯(lián)盟,Mobileye提供傳感器芯片和算法,Intel提供云端計算平臺,BMW提供汽車。第三,在移動端,Intel收購了Movidius,但是尚未看到大的動作。所以我預期,移動端的人工智能芯片,如果有的話還是高通之類的廠商會比較有優(yōu)勢。

  再說Google,它推出來的芯片TPU主要是自用的。這個有點像IBM,IBM最早出的Power PC系列芯片也是為了給自己的server用。所以Google也是類似的思路,它的芯片就沒有打算給別人用,換句話說它沒有真的打算進入芯片這個市場,和別人競爭。

  最后說AMD,它在GPU和CPU的技術(shù)都處于追趕者的位置,在方面比較低調(diào),在CES上公布新產(chǎn)品的時候也都沒有主動去提人工智能的事情。最近的新聞大概是和阿里巴巴合作云端服務作為試水。AMD的總體思路還是求穩(wěn),不刻意去跟Nvidia爭誰先誰后,它就等你們把這些東西先做出來再說,自己就很踏實地把顯卡技術(shù)做好。其實GPU天生就符合深度學習的要求,只要AMD把自己芯片的運算能力做上去,它很快就可以殺入人工智能這個領(lǐng)域中來。

 三、Nvidia面臨的機遇和挑戰(zhàn)

  2016年是人工智能爆發(fā)的一年,借著這股東風,Nvidia的股價在去年飛升三倍有余,令人驚嘆。目前看來,Nvidia的技術(shù)成長空間還有很多,因為Nvidia正在轉(zhuǎn)型成為平臺公司而不是硬件公司,GPU會是它的核心但是不是全部,它要做的是圍繞GPU的一個平臺、一個生態(tài)。與GPU配套的各種設(shè)施,例如開發(fā)平臺、開發(fā)者社區(qū)和包絡編程語言在內(nèi)的開發(fā)工具也非常重要。舉例來說,在筆記本PC市場,其實ARM的處理器性能完全可以和Intel相抗衡,但是為什么基本沒有筆記本電腦用ARM的處理器?就是因為ARM在筆記本PC上沒有任何生態(tài)。一旦平臺和生態(tài)做起來,即使它的技術(shù)發(fā)展不像原來那么生猛,我相信Nvidia的商業(yè)價值仍然可以得到保證。假如明天AMD做出來一個和Nvidia性能一模一樣的GPU,它一時半會兒也還是無法取代Nvidia,因為Nvidia有自己的CUDA、CUDNN等配套的開發(fā)工具。

  而Nvidia可能會面臨的最大風險在于,它現(xiàn)在的股價完全由人工智能來支撐,但人工智能的應用會不會像投資者想象中發(fā)展的那么快是存疑的。其實非常明顯現(xiàn)在人工智能的應用有很大的泡沫,大家預期它在一兩年之內(nèi)會起來。但是如果它在一兩年之內(nèi)沒有起來或者說某些應用沒有能真的落地,那時候投資者可能會有些反沖。現(xiàn)在是一個overshoot,發(fā)現(xiàn)沒有達到預期之后就會有一個undershoot,幾次震蕩之后慢慢回到理性估值。

  四、FPGA的玩家和留給創(chuàng)業(yè)公司的機會

  FPGA全稱“可編輯門陣列”(Field Programmable Gate Array),其基本原理是在FPGA芯片內(nèi)集成大量的數(shù)字電路基本門電路以及存儲器,而用戶可以通過燒入FPGA配置文件來來定義這些門電路以及存儲器之間的連線。這種燒入不是一次性的,即用戶今天可以把FPGA配置成一個微控制器MCU,明天可以編輯配置文件把同一個FPGA配置成一個音頻編解碼器?,F(xiàn)在FPGA和人工智能相關(guān)的主要機會是云端服務器的可配置運算 ,目前這個領(lǐng)域的玩家主要是兩個,Xilinx和Altera,后者已經(jīng)被Intel收購。

  當下FPGA遇到的一個最關(guān)鍵的問題就是開發(fā)者生態(tài)。傳統(tǒng)CPU也好GPU也好,編程是比較容易的,使用的是語言是C++、Java,大家都很熟悉,而且已經(jīng)形成了成熟的體系,開發(fā)環(huán)境、生態(tài)系統(tǒng)還有開發(fā)者的社區(qū)這些都很好。但是FPGA開發(fā)通常需要使用硬件描述語言,如Verilog、VHDL等等,這些對于程序員來說需要大量的時間才能掌握。這樣的話FPGA的生態(tài)就無法發(fā)展,因為門檻高意味著做的人少,做的人少意味著知名度低,相關(guān)項目數(shù)量少,這又導致了無法吸引到開發(fā)者參與項目,如此便形成了惡性循環(huán)。

  針對這種情況,Xilinx就發(fā)布了一個比較能改善生態(tài)的東西,叫做可重配置加速棧,這些用于云端的FPGA將會使用部分重配置方案。什么意思呢?通常FPGA配置過程包括硬件描述語言的綜合、布局布線、最后產(chǎn)生比特流文件并寫入以完成配置。在這個過程中,綜合以及布局布線花費的時間非常長,可達數(shù)小時,而最后比特流文件寫入以及配置可以在一秒內(nèi)完成。用于云端的FPGA方案為了實現(xiàn)快速應用切換,預計將會使用硬IP(即針對某應用硬件加速的比特流),并在需要使用該應用時快速寫入該比特流。在未來,云端FPGA的生態(tài)預計將不止包括Xilinx,還會包括許多第三方IP提供商,最后形成類似App Store的形式讓使用者方便地選購對應的硬件加速方案并實時加載/切換。

  目前國內(nèi)FPGA水平較弱,而且FPGA需要一整套從軟件到硬件的流程,需要深刻的積累,對于創(chuàng)業(yè)公司并不是一個最好的方向,更適合國家科研項目。但是創(chuàng)業(yè)公司使用FPGA,做FPGA的解決方案,基于FPGA開發(fā)或者做FPGA上的IP,是個不錯的機會。換句話說就是你不去手機,而是做APP。其實這個方向國內(nèi)也已經(jīng)有不少公司在做了,我知道的比較出名的有深鑒科技。

  五、玩人工智能軟件的正確姿勢

  目前人工智能軟件最大問題是如何把技術(shù)真正落實到解決消費者的需求,一些算法非常有技術(shù)含量,但是落地并不容易,例如圖像分類等等。我覺得現(xiàn)在做的比較好的軟件是語音識別/交互類,比較典型的是訊飛輸入法,前陣子在錘子手機的發(fā)布會上被秀了一把。

  圖像類的人工智能算法目前是最火的方向,比語音類要火很多,但是目前看來圖像算法大多數(shù)只能作為一個大系統(tǒng)的一部分。比如一個安防系統(tǒng),圖像算法可以用來檢測一個人是否帶刀,但是把這個軟件單獨拉出來賣就不一定能成立了。當然也有單獨做軟件的,例如Prisma,這個之前在Instagram很火的軟件就是利用深度學習來做圖像風格變換。總結(jié)一句話就是,人工智能相關(guān)的軟件當然是一個非常好的創(chuàng)業(yè)方向,只是要找準這個創(chuàng)新的賣點,光有好的技術(shù)其實是沒什么大用的。

  在人工智能領(lǐng)域,國內(nèi)也出現(xiàn)了一批還不錯的公司,我有在關(guān)注。在圖像檢測/人臉識別領(lǐng)域,有依圖科技、Face++、商湯科技三只領(lǐng)頭羊,它們主要為銀行和一些安防系統(tǒng)提供人臉識別的解決方案。在醫(yī)療領(lǐng)域,就是用人工智能幫忙人類判定疾病也有很多公司在做,一圖正在進軍這個領(lǐng)域。在自動駕駛領(lǐng)域,軟件方面做的比較有名的是圖森、地平線。其實地平線攤子鋪得比較大,硬件軟件都做,除了輔助駕駛外,還跟美的合作在做智能家居。還有一些比較小眾的領(lǐng)域,比如鑒黃,就是圖譜在做。硬件的話,比較有名的是寒武紀。

  六、芯片行業(yè)的未來除了人工智能,還有……

  最后再說回到整個芯片行業(yè)的發(fā)展上來。有人問,芯片行業(yè)是不是有一個強者恒強的規(guī)律,出現(xiàn)黑馬的幾率有多大。我認為是這樣的:在芯片這個地方,它是每隔一段就會換一個應用方向,90年代時候最火的是多媒體電腦,也就是PC端,后來就變到了移動端,最近則是人工智能。眾所周知,Intel是PC時代永遠的老大,在那25年的時間里基本碾壓所有競爭對手,但移動設(shè)備這個方向它就完全錯過了。所以說,在同一個領(lǐng)域里基本上是強者恒強,很難有超越,但是在這個領(lǐng)域強,不代表在下一個領(lǐng)域也會強,在“時代”交替的時候是最容易出黑馬的。我們在評判企業(yè)價值的時候,要對芯片的技術(shù)應用有一個判斷,要非常清楚下一個所謂的風口在哪里。

  現(xiàn)在芯片應用最火的方向毫無疑問是人工智能了,我還同時看好另外一個方向,就是醫(yī)療。我相信在醫(yī)療電子領(lǐng)域還有很多可以做的事情,當然這個方向的發(fā)展還要倚賴一些基礎(chǔ)設(shè)施的建設(shè),比如在線的云平臺和大數(shù)據(jù)庫等等,這個部分在這里就不詳細展開了。

  討論區(qū):以下為參與live的人提問,作者回答

  問:萊迪思半導體(LSCC),大疆無人機供應商FPGA未來有潛力,期待分析。

  答:目前中國FPGA進口第一是華為,第二就是大疆。大疆使用FPGA量很大,然而未來從成本考慮很大可能會用ASIC代替。

  問:目前國內(nèi)的人工智能相關(guān)芯片的發(fā)展情況如何,主要有哪些公司在做?離國際先進水平有多大的差距?

  答:國內(nèi)人工智能芯片有寒武紀,深鑒等初創(chuàng)公司,也有華為等大公司在布局,與國外差距不大,尤其是寒武紀已經(jīng)走在世界前列。

  問:AI芯片目前主要的幾種商業(yè)模式有哪些?

  答:一般有兩種,一種是直接賣芯片,還有是賣IP,IP的話是芯片里的一部分,可以集成在其他公司的芯片里。

  問:圖像分類可否用在發(fā)票圖像處理?比如發(fā)票、車票這些,拍照后,經(jīng)過處理,變成會計分錄。這個市場無限大。

  答:圖像分類當然可以用在發(fā)票分類上,實現(xiàn)手寫和數(shù)字識別。關(guān)于票據(jù)問題,是的,市場是很大,目前美國支票存取已經(jīng)是自動識別了,用手機app拍照就行。

  問:Nvidia一半以上的收入還在傳統(tǒng)游戲顯卡市場吧,云計算和人工智能短期增速如果不盡如人意的話,股價回調(diào)就不可避免了。

  答:關(guān)于NV的股價,我認為這位朋友的分析很有道理。

  問:想請教一下,F(xiàn)PGA在用電量是不是一般ASIC的3X,晶片大小是不是為ASIC的2X?

  答:FPGA的用電量在ASIC的十倍以上,造價也在十倍以上。

  問:您知道做鑒黃的除了圖譜科技,還沒有其他的團隊?

  答:鑒黃的技術(shù)壁壘不高,關(guān)鍵是渠道要搞定。

  問:我這收集了2個觀點,能不能幫我評價一下呢?第一個:Nvidia在人工智能芯片市場的真實統(tǒng)治力,可能比股票市場上的亮眼成績更為顯著。盡管市場上也存在其他深度學習訓練(training)和預測(Inference)的解決方案,但試問各家AI企業(yè),無論其內(nèi)部的模型訓練,還是銷售給最終客戶的智能產(chǎn)品,絕大多數(shù)還是采用了Nvidia的GPU方案。第二,值得關(guān)注的是,就異構(gòu)計算的主要應用機器學習來看,分為訓練和推斷兩個部分。其中,訓練市場占整個機器學習市場的5%,其余95%都是推斷市場。Steve Glaser認為,GPU僅僅是關(guān)注機器學習的訓練市場,而推斷市場才是FPGA關(guān)注的領(lǐng)域,這恰恰是機器學習未來發(fā)展的重要組成部分。

  答:第一個判斷是對的,第二個判斷的話,F(xiàn)PGA在云端會用得比較多,inference在終端還是要靠ASIC。

  問:李博士,AI芯片對人工智能應用的影響是什么?AI芯片離大規(guī)模商用還有多遠?

  答:AI芯片技術(shù)上離大規(guī)模商用不遠了,但是使用專用AI的ASIC市場還沒完全起來,很多公司在觀望,Intel等公司在慢慢布局,新推出的Xeon Phi服務器CPU里面加入了部分的AI加速。

  問:能否比較一下寒武紀和Nvidia的ai芯片的差別?

  答:寒武紀是專用ai加速芯片,nvidia的gpu是通用計算單元只是比較適合計算深度學習。

  問:IBM的沃森在醫(yī)療上的運用效果如何?

  答:IBM Watson在醫(yī)療上的應用已經(jīng)有不少報道,大數(shù)據(jù)和AI在醫(yī)療上得到應用一定會成為現(xiàn)實。目前醫(yī)學的研究都是基于數(shù)據(jù)的研究,之前的研究樣本量都不大,使用了大數(shù)據(jù)加人工智能后醫(yī)學的發(fā)展一定會大大加速。

  問:再問一個:如果谷歌最終選擇了使用TPU,會不會對英特爾和英偉達這些芯片制造商構(gòu)成巨大的威脅?因為他們的在線業(yè)務是如此巨大。他們比地球上任何其它公司購買或運營的計算機硬件都要多,而且隨著云計算的重要性持續(xù)增加,這個差距也只會越來越大。

  答:會有一些,但不會是最大的影響,因為google的服務器在整個服務器市場占比例不大。

  問:高通在CES展上推出驍龍835,適合深度學習,這款芯片和高通在人工智能方面能不能解讀一下?

  答:snapdragon 835對于ai的支持主要在于dsp對于深度學習算法支持的design kit。

  問:感謝分享,我的問題是目前人工智能變?yōu)閷嶋H應用,變成類似移動互聯(lián)網(wǎng)這樣的產(chǎn)業(yè)最大的難點是什么?目前看到的一些應用主要在智能客服等,還有c端的應用主要是類似echo等的家庭智能音箱,未來可以預見的最大應用是自動駕駛和醫(yī)療領(lǐng)域的應用,其他呢,其他通過人工智能更深度的改變會在哪里?

  答:人工智能變?yōu)楝F(xiàn)實的難度在于如何落地。人工駕駛和醫(yī)療是兩個重要的點,然而人工駕駛必須能通過各種極端情況下的驗證才能上馬。輔助駕駛離現(xiàn)實比較接近。醫(yī)學使用目前看起來比較接近實用,因為AI比人做得好不難,主要障礙在于基礎(chǔ)設(shè)施不好大數(shù)據(jù)很難獲得,例如病歷如何聯(lián)網(wǎng)。AI離使用最接近的是金融領(lǐng)域,目前高頻交易,詐騙檢測等已經(jīng)用上了AI。



關(guān)鍵詞: AI 芯片

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉