夢回2012 華為的海思麒麟成長記
2016:選擇16nm好節(jié)點(diǎn) 獲先發(fā)優(yōu)勢
本文引用地址:http://2s4d.com/article/201808/390141.htm關(guān)鍵詞:全面 里程碑
選擇合適的制程,這不但對于產(chǎn)品產(chǎn)生積極推進(jìn)的因素,同時也是能順利保證量產(chǎn)的關(guān)鍵。你有更好的技術(shù),但是市場不等人,沒有產(chǎn)品就沒有話語權(quán)。
華為芯片于2016年10月推出了麒麟960芯片,它被稱為華為芯片又一次里程碑。麒麟960首次配備ARM Cortex-A73 CPU核心,小核心為A53,組成四大四小的big.LITTLE組合,GPU為Mali G71 MP8。與上一代相比,CPU能效提升15%,同時,圖形處理性能提升180%,GPU能效提升20%,存儲方面支持LPDDR4和UFS2.1,號稱DDR性能提升90%,文件加密讀寫性能提升150%。
可以看到麒麟960相比麒麟950,在CPU部分并不能說有大的提升,配備的A73要比A72性能強(qiáng)上一點(diǎn),可是在GPU部分的性能和能效的提升是非??捎^的,同時諸如LPDDR4和UFS 2..1的存儲規(guī)格都支持上了。
最重要的一環(huán)便是麒麟960在IP選擇和制程選擇上并沒有過于激進(jìn),依然采用ARM最新優(yōu)化的A73架構(gòu),還有臺積電的16nm FinFET Plus制程,能夠保證處理器的性能和功耗,同時有不會擔(dān)心有量產(chǎn)的問題。
先于驍龍835推出,依然能獲得先發(fā)的優(yōu)勢,而驍龍835是在2017年年初發(fā)布,但是礙于三星10nm工藝的問題而導(dǎo)致量產(chǎn)延遲。
為什么說麒麟960是華為海思的里程碑產(chǎn)品?因?yàn)樗扔惺袌錾享敿獾牡母黜?xiàng)配置,又是能獲得市場充分驗(yàn)證認(rèn)可的產(chǎn)品。麒麟960的升級是全面的,其彌補(bǔ)了麒麟950基帶上的遺憾,直接繼承Balong 750基帶,支持四載波聚合(4CC CA),峰值下載速率高達(dá)600Mbps,達(dá)到了LTE Cat.12;同時支持2G/3G/4G多頻段雙卡漫游,無需更換手機(jī)便可在世界更多地方實(shí)現(xiàn)流暢通訊。
最重要的一點(diǎn),華為首次將CDMA作為模塊集成麒麟芯片里,自此擁有了全網(wǎng)通能力。這也讓華為全網(wǎng)通手機(jī)從此擺脫了所謂的“電信魔咒”,因?yàn)槿A為實(shí)際并不是沒有CDMA的技術(shù),只不過在以往CDMA上的專利和技術(shù)儲備尚不足。Balong增加CDMA不是難事,難就難在背后復(fù)雜的知識產(chǎn)權(quán)交叉協(xié)議,當(dāng)然這些華為在麒麟960身上已經(jīng)很好地解決了。
麒麟960獲得了不俗的成績,它被當(dāng)時美國科技媒體Android Authority評選為“2016最佳安卓手機(jī)處理器”。2017世界智能手機(jī)大會及移動終端產(chǎn)業(yè)大會上,華為麒麟960榮獲產(chǎn)品技術(shù)進(jìn)步獎,同時搭載麒麟960處理器的華為旗艦P10也榮獲智能手機(jī)行業(yè)突出貢獻(xiàn)獎。而在2016年世界互聯(lián)網(wǎng)大會上,麒麟960被大會推薦為“世界互聯(lián)網(wǎng)領(lǐng)先科技成果”。
華為麒麟960把華為海思推進(jìn)到一個新高度,從產(chǎn)品體驗(yàn)來說,華為Mate 9,華為P10也獲得熱烈的市場反應(yīng),而我記得便是從華為P9開始,真正去體驗(yàn)Mate系列和P系列,也把其作為自己的主力機(jī)器去使用。
你要知道,對于長期從事媒體行業(yè)的人員來說,有時候能把廠商的一部手機(jī)終端作為日常主力機(jī)使用,這已經(jīng)是足現(xiàn)這部手機(jī)的實(shí)力,因?yàn)橥襟w人對于產(chǎn)品的體驗(yàn)是苛求的。
麒麟960很好地回應(yīng)了當(dāng)時外界的一些質(zhì)疑,其進(jìn)化和升級是全方位的,它無疑已經(jīng)處于行業(yè)的頭部位置了。
2017:人工智能橫空出世
關(guān)鍵詞:NPU AI 三攝
來到2017年,AI成為了全行業(yè)的熱話。近年來,人們逐漸認(rèn)識到計(jì)算芯片對于人工智能的重要性,圍繞 AI 任務(wù)進(jìn)行專有加速的芯片越來越多,但無論是 AlphaGo 背后的谷歌 TPU 還是加入了全新 Tensor Core 結(jié)構(gòu)的英偉達(dá) Tesla V100,這些芯片都是為服務(wù)器端進(jìn)行設(shè)計(jì)的。實(shí)際在移動端,對于機(jī)器加速學(xué)習(xí)的SoC一直在探索階段,而華為海思麒麟970則是對于AI芯片在移動端側(cè)的首次嘗試。
如果要用一句話來評價(jià)一下麒麟970,我們可能會說:“業(yè)界第一個真正意義上的手機(jī)AI處理器。”。沒錯,麒麟970就是這樣一款具有前瞻性的芯片,它在2017年9月的IFA展會上正式發(fā)布。
麒麟前兩代產(chǎn)品和競爭對手相比,在各方面都互有勝負(fù),而到了這一代,麒麟970不但繼承了前作的所有領(lǐng)先技術(shù),同時開啟了屬于自己的一個AI時代。麒麟970采用了業(yè)界最先進(jìn)的工藝,內(nèi)置 4 個用于處理重負(fù)載任務(wù)的 Cortex A73 核心,4 個 Cortex A53 核心,同樣是big.LITTLE架構(gòu),采用了最新的臺積電10nm的制造工藝。GPU 則為全新一代具有 12 個核心的 Mali-G72 MP12,所有參數(shù)都達(dá)到了旗艦產(chǎn)品的級別。
通信方面,麒麟 970 集成了自家基帶支持全球最高的通信規(guī)格 LTE Cat.18/Cat.13,實(shí)現(xiàn)了業(yè)界最高的 1.2Gbps 峰值下載速率。
各項(xiàng)參數(shù)都有一定的提高,同時最重要的一部分是升級了制程,能在一定面積上容納更多的晶體管,這給予加入AI模塊NPU提供了可能。
當(dāng)然麒麟970最引人注目的還是那個全新設(shè)計(jì)的 HiAI 移動計(jì)算架構(gòu)了,他是第一次在移動設(shè)備層面上把神經(jīng)網(wǎng)絡(luò)模型的硬件計(jì)算加速能力融合進(jìn)芯片中去。這也是業(yè)內(nèi)第一次在手機(jī)芯片中出現(xiàn)了專門用于進(jìn)行人工智能方面計(jì)算的處理單元。
華為方面表示,新的計(jì)算架構(gòu)以及計(jì)算單元對于機(jī)器學(xué)習(xí)任務(wù)處理性能(相對于手機(jī) CPU)提升了數(shù)十倍,最高可達(dá)到傳統(tǒng)處理器 25 倍速度,50 倍能效。這種性能提升可以讓此前很多無法在移動端使用的機(jī)器學(xué)習(xí)應(yīng)用走向工程化和實(shí)用化。
值得留意的是,華為在麒麟970加入AI運(yùn)算模塊NPU,并不是其自己一個開發(fā)的,而是與寒武紀(jì)聯(lián)合深度合作的。雙方團(tuán)隊(duì)在AI計(jì)算處理方面進(jìn)行了聯(lián)合開發(fā)與優(yōu)化,通過高效靈活的異構(gòu)計(jì)算來最大化發(fā)揮 CPU/GPU/ISP/DSP/NPU 的性能,同時首次集成專門用于神經(jīng)網(wǎng)絡(luò)任務(wù)處理的 NPU(Neural Network Processing Unit)計(jì)算單元,其加速性能和能效比大幅優(yōu)于CPU和GPU。
實(shí)際要加入這個NPU,要克服的困難還不少。要在移動端芯片加入AI處理的NPU單元,并不像在桌面和服務(wù)器芯片加入那么簡單,它需要考量芯片SoC的面積還有移動端的功耗。
通過臺積電10nm的工藝,其讓同樣面積(10×10 毫米)下晶體管數(shù)量提升到了 55 億個,為 AI 計(jì)算單元讓出了空間,同時在很小的面積下提升了芯片的計(jì)算性能。
當(dāng)然只有硬件模塊還不足夠,在應(yīng)用層面,為了讓NPU真正做到商用還需要做大量研究和測試,同時在結(jié)構(gòu)上也要協(xié)調(diào)好NPU與其他芯片內(nèi)的單元的協(xié)作,所以當(dāng)中的挑戰(zhàn)有多大是不言而喻。
幸好華為海思在AI應(yīng)用上已經(jīng)提早了布局,開放端口給開發(fā)者來匹配調(diào)用麒麟 970 的AI接口,目前麒麟 970 的AI慧眼拍照、AI語音、AI隨行翻譯已經(jīng)能夠在手機(jī)上體驗(yàn)到,而且還在進(jìn)一步增長中。同時又有著自有手機(jī)品牌的優(yōu)勢,對于AI性能的運(yùn)用也將更加靈活。華為在技術(shù)創(chuàng)新中和行業(yè)資源整合中走在了前面。
除了AI方面,麒麟970在ISP拍照方面也是值得一提。在麒麟970上,自研雙攝ISP技術(shù)已經(jīng)升級到第三代。集微網(wǎng)了解到,在麒麟970的研發(fā)過程中,包括拍照處理響應(yīng)時間、對焦、運(yùn)動檢測、曝光策略等全流程進(jìn)行了深入優(yōu)化。新一代的ISP性能得到了顯著改善,吞吐量提升25%,使得整個拍照的綜合響應(yīng)時間縮短了30%,用戶從按下快門到最終成像的時間大大縮短。
我們在華為Mate 10上已經(jīng)能看見其拍照能力的進(jìn)一步提升,而在年初發(fā)布的P20系列上,更是首次出現(xiàn)三攝像頭的配置,同時還有特別定制的CMOS。擁有了好的拍照硬件,在算法處理的芯片層面上,這就需要麒麟970團(tuán)隊(duì)去攻克難題和提升性能。
據(jù)記者了解,麒麟970團(tuán)隊(duì)在拍攝功能方面于三年前便開始著手進(jìn)行研發(fā)規(guī)劃,期間收集了大量用戶反饋,并進(jìn)行深入細(xì)致的研判,ISP、算法、Camera方案等。
有著良好的硬件,也有不俗的算法,此時候如果再有AI的賦能,那便是絕佳的組合。AI的引入,也使得麒麟970具備了“慧眼”功能,AI可以使得相機(jī)從識別場景,到理解場景。
有人說華為P20從你按下快門拍照的適合,它已經(jīng)完成了從前期的場景識別到后期圖像處理的所有過程。如果說場景拍攝方案是基于算法的集成,那么具備了更強(qiáng)大計(jì)算能力的NPU,將會使得在同樣的功耗下,可以集成的方案越來越多,同時NPU還具備自我學(xué)習(xí)能力,可以根據(jù)積累的數(shù)據(jù)進(jìn)行最優(yōu)算法運(yùn)行。AI會遍布手機(jī)的各個體驗(yàn),無處不是AI。
麒麟970毋庸置疑是向前了一大步,是這個手機(jī)AI芯片的領(lǐng)導(dǎo)者。雖然AI之路還有很長,當(dāng)中需要披荊斬棘,但是麒麟970必然是這條路上開拓者和創(chuàng)新者。
2018:首發(fā)7nm?二代AI NPU駕臨
關(guān)鍵詞:7nm 自研GPU
評論