半導(dǎo)體產(chǎn)業(yè)應(yīng)如何在大數(shù)據(jù)中淘金?
根據(jù)思科的數(shù)據(jù),全球互聯(lián)網(wǎng)吞吐量在2016年為1.2ZB(1ZB相當(dāng)于10億TB或1萬(wàn)億GB),預(yù)計(jì)到2021年將增長(zhǎng)到3.3ZB每年。洶涌上漲的數(shù)據(jù)洪流,波峰越來(lái)越高,在2016年,每天數(shù)據(jù)流量同比增長(zhǎng)了32%,而流量最高的1小時(shí)數(shù)據(jù)吞吐量同比增長(zhǎng)了51%。
當(dāng)上述統(tǒng)計(jì)也不完整,實(shí)際上沒(méi)有人知道全球每天產(chǎn)生多少數(shù)據(jù),因?yàn)椴⒉皇撬性O(shè)備的數(shù)據(jù)都會(huì)連入互聯(lián)網(wǎng)。
數(shù)據(jù)量本身意義不大,如何量化數(shù)據(jù)的價(jià)值才是關(guān)鍵所在,但在如何應(yīng)用數(shù)據(jù),以實(shí)現(xiàn)其價(jià)值方面,當(dāng)前還沒(méi)有行之有效的方法。
想挖掘數(shù)據(jù)的真正價(jià)值,就要對(duì)天量數(shù)字與模擬數(shù)據(jù)進(jìn)行過(guò)濾,并充分考慮應(yīng)用場(chǎng)景,這就像沙里淘金,大多數(shù)可能無(wú)功而返。不過(guò),隨著計(jì)算力的提高以及大規(guī)模并行計(jì)算工具的成熟,數(shù)據(jù)過(guò)濾分析--即找到更好的應(yīng)用數(shù)據(jù)方法--已經(jīng)能夠創(chuàng)造出頗具市場(chǎng)前景的商業(yè)模式。
“眾多行業(yè)人士指出,不同數(shù)據(jù)應(yīng)用方法與其器件和商業(yè)模式相互關(guān)聯(lián),并對(duì)其商業(yè)、市場(chǎng)以及商業(yè)模式產(chǎn)生影響,”Synopsys董事長(zhǎng)兼共同CEO Aart de Geus說(shuō)道,“如果你能夠從中找到捷徑,提升效率,或者全新的商業(yè)模式,那就會(huì)是非常大的影響。 ”這也意味著高利潤(rùn)的可能,“你會(huì)看到,所有從事數(shù)據(jù)處理的人都在仔細(xì)聆聽,以解碼市場(chǎng)未來(lái)需求,或者自行判斷當(dāng)前市場(chǎng)需求,”de Geus繼續(xù)說(shuō)道,“或者更進(jìn)一步,他們準(zhǔn)備置身于數(shù)據(jù)通路之中,從而最靠近數(shù)據(jù)商業(yè)化的中心?!?/p>
這正是資本瘋狂涌入的原因,從數(shù)據(jù)挖掘到云端服務(wù),從機(jī)器學(xué)習(xí)到工業(yè)物聯(lián)網(wǎng),每一個(gè)數(shù)據(jù)應(yīng)用場(chǎng)景都戰(zhàn)況激烈。
“誰(shuí)擁有數(shù)據(jù),具備數(shù)據(jù)分析及處理能力,誰(shuí)就能把所有錢都賺走,”西門子Mentor事業(yè)部總裁兼CEO Wally Rhines這樣表示。
現(xiàn)在還難說(shuō)數(shù)據(jù)應(yīng)用是一個(gè)勝者通吃的游戲,不過(guò)確實(shí)有不少科技巨頭在這個(gè)領(lǐng)域跑馬圈地,奮勇爭(zhēng)先,例如亞馬遜、谷歌、微軟、Facebook和IBM等掰著手指頭就可以輸出來(lái)的大家伙。
“收集上來(lái)的物聯(lián)網(wǎng)數(shù)據(jù)中,包含了設(shè)備大量的性能、行為及應(yīng)用數(shù)據(jù),”IBM美洲區(qū)銷售主管Christophe Begue說(shuō)道,“我們接下來(lái)會(huì)把收集到的數(shù)據(jù)丟給Watson(IBM人工智能平臺(tái))去分析?!?/p>
現(xiàn)在的大問(wèn)題是如何將這些數(shù)據(jù)變現(xiàn),有哪些人愿意為數(shù)據(jù)付費(fèi)。要將數(shù)據(jù)變現(xiàn),首先要做到如下幾點(diǎn):第一,行業(yè)里的公司要真正懂?dāng)?shù)據(jù)的價(jià)值;其次,公司要能夠快速應(yīng)對(duì)數(shù)據(jù)變化,只要比別人快百分之一秒,券商就能夠以此牟利,但現(xiàn)在大公司應(yīng)對(duì)數(shù)據(jù)變化的反應(yīng)時(shí)間通常是幾天甚至幾周;第三,變現(xiàn)數(shù)據(jù)的價(jià)格要有競(jìng)爭(zhēng)力,不能波動(dòng)太大。
IBM正準(zhǔn)備將全球供應(yīng)鏈的數(shù)據(jù)商業(yè)化?!肮?yīng)鏈數(shù)據(jù)分為兩層,”Begue說(shuō)道,“第一層是零售與快速消費(fèi)品(CPG)等數(shù)據(jù),就是那些可能會(huì)影響到食品與飲料等銷售的數(shù)據(jù)。你可以在附近的一個(gè)商店收集天氣、交通或運(yùn)動(dòng)賽事等相關(guān)信息,并通過(guò)交通模式追蹤它。我們用Metro Pulse平臺(tái)來(lái)做數(shù)據(jù)分析,該平臺(tái)會(huì)覆蓋500個(gè)數(shù)據(jù)元素,用戶既可以購(gòu)買數(shù)據(jù)用于深度學(xué)習(xí)或機(jī)器學(xué)習(xí)分析,也可以全部委托IBM來(lái)做分析。第二層即我們正在導(dǎo)入市場(chǎng)的概念:供應(yīng)商風(fēng)險(xiǎn)。IBM將天氣與政局變化等諸多因素納入考慮,從數(shù)據(jù)中分析供應(yīng)鏈的安全程度,并根據(jù)分析結(jié)果來(lái)提升供應(yīng)鏈的安全。如果注意到15個(gè)因素有風(fēng)險(xiǎn),那么你就會(huì)對(duì)這15個(gè)因素嚴(yán)密監(jiān)控。”
IBM的服務(wù)并不是值分析已有數(shù)據(jù),還會(huì)給出建議,洞見未來(lái)。“我們收集公開與半公開數(shù)據(jù),有些數(shù)據(jù)只在IBM內(nèi)部使用,我們建立預(yù)測(cè)模型。當(dāng)然,我們也意識(shí)到,在計(jì)劃和反應(yīng)之間,仍然存在差距,‘決策室’概念有助于縮小計(jì)劃和行動(dòng)之間的鴻溝?!?/p>
智能制造
并不只外部收集的數(shù)據(jù)才有用,工業(yè)生產(chǎn)中,內(nèi)部產(chǎn)生的數(shù)據(jù)就很有價(jià)值。事實(shí)上,整個(gè)智能制造的概念(德國(guó)稱為工業(yè)4.0,也有人稱之為工業(yè)互聯(lián)網(wǎng))就是如何把內(nèi)部數(shù)據(jù)利用好。
“一言以蔽之,工業(yè)物聯(lián)網(wǎng)是為了提升生產(chǎn)效率,”O(jiān)ptimal+市場(chǎng)副總裁David Park說(shuō),“現(xiàn)在這些公司都偏愛流程分析和無(wú)庫(kù)存生產(chǎn),但它們真正需要的是預(yù)測(cè)性分析。預(yù)測(cè)性分析可以讓工廠受益,不過(guò)受益最多的是品牌商,品牌商和工廠可不一定是一回事?!?/p>
風(fēng)險(xiǎn)在于,數(shù)據(jù)不一定都是正確的。基于錯(cuò)誤數(shù)據(jù)而做出的決定,將導(dǎo)致結(jié)果難以預(yù)期。
“如果數(shù)據(jù)沒(méi)問(wèn)題,那么可以把良率提高2%到3%,非常顯著的提高,”Park說(shuō)道,“供應(yīng)鏈上通過(guò)檢測(cè)的任何元器件的所有時(shí)間段數(shù)據(jù)都會(huì)被收集。當(dāng)你拿到一些有劃痕的晶圓,根據(jù)數(shù)據(jù)就能查出在哪一個(gè)環(huán)節(jié)晶圓被劃破,你也可以查看元器件在現(xiàn)場(chǎng)的老化過(guò)程。如果汽車配備了預(yù)測(cè)性維護(hù)服務(wù),那么你就能看到汽車在路上的相關(guān)數(shù)據(jù)。金融業(yè)同樣會(huì)受益,如果你手上有數(shù)十萬(wàn)張發(fā)票,靠人工是捋不清發(fā)票之間的相互關(guān)系的?!?/p>
這種數(shù)據(jù)分析對(duì)于復(fù)雜供應(yīng)鏈特別重要,半導(dǎo)體制造本身在數(shù)據(jù)分析與應(yīng)用上先進(jìn),但整個(gè)半導(dǎo)體供應(yīng)鏈對(duì)數(shù)據(jù)的應(yīng)用,并不都能達(dá)到制造環(huán)節(jié)的水平。
“有效利用數(shù)據(jù)是智能制造顧問(wèn)委員會(huì)(隸屬于SEMI)的一大主題,”SEMI協(xié)作技術(shù)平臺(tái)副總裁Tom Salmon說(shuō)道,“獲取數(shù)據(jù)很重要,但現(xiàn)在問(wèn)題不是我們獲取的數(shù)據(jù)量不夠,而是因?yàn)閿?shù)據(jù)利用率只有10%左右。真正的挑戰(zhàn)在于我們應(yīng)該問(wèn)什么樣的問(wèn)題,如何把數(shù)據(jù)應(yīng)用于制造。所以可能會(huì)有可靠性問(wèn)題,但不會(huì)有制程問(wèn)題?!?/p>
找到關(guān)鍵數(shù)據(jù),在預(yù)設(shè)參數(shù)下利用機(jī)器對(duì)數(shù)據(jù)規(guī)律進(jìn)行外推,這就是機(jī)器學(xué)習(xí)的基礎(chǔ)。這種方法已經(jīng)應(yīng)用于汽車自動(dòng)駕駛領(lǐng)域,機(jī)器學(xué)習(xí)系統(tǒng)將輔助并最終取代人類去駕駛汽車,自動(dòng)駕駛系統(tǒng)做決策時(shí),需要根據(jù)行駛場(chǎng)景給出多種預(yù)案。
在半導(dǎo)體設(shè)計(jì)與制造中,也會(huì)利用機(jī)器學(xué)習(xí)來(lái)提高質(zhì)量、可靠性及良率。
“采用合適的比例來(lái)抽取數(shù)據(jù)做分析,就能應(yīng)用于未來(lái)的設(shè)計(jì),”eSilicon市場(chǎng)副總裁Mike Gianfagna說(shuō)道,“如何將機(jī)器學(xué)習(xí)算法應(yīng)用于新領(lǐng)域是關(guān)鍵,在過(guò)去7年中,我們?cè)谶@方面積累了很多經(jīng)驗(yàn),我們知道如何挖掘開發(fā)數(shù)據(jù)的價(jià)值。當(dāng)你擁有大量數(shù)據(jù)時(shí),怎么去抽取分析這些數(shù)據(jù)?如果抽取數(shù)據(jù)比例太高,你會(huì)迷失在大量數(shù)據(jù)中,如果抽取數(shù)據(jù)比例過(guò)低,又可能得不出結(jié)論。”
Gianfagna表示,在降低風(fēng)險(xiǎn)與增加效率的基礎(chǔ)上,實(shí)現(xiàn)數(shù)據(jù)變現(xiàn)是機(jī)器學(xué)習(xí)的目標(biāo)?!耙龅竭@一點(diǎn),你需要從全局上來(lái)看待大數(shù)據(jù)分析。”
與很多由大云端服務(wù)商提供服務(wù)的大數(shù)據(jù)分析相比,半導(dǎo)體設(shè)計(jì)和測(cè)試行業(yè)產(chǎn)生的數(shù)據(jù)量很少,不過(guò)半導(dǎo)體設(shè)計(jì)與測(cè)試數(shù)據(jù)可能更復(fù)雜。
“當(dāng)前主要任務(wù)是收集數(shù)據(jù),”NI解決方案市場(chǎng)總監(jiān)George Zafiropoulos說(shuō)道,“下一階段的目標(biāo)是通過(guò)數(shù)據(jù)分析來(lái)給出改進(jìn)方法。無(wú)須刻意尋找,你就能發(fā)現(xiàn)數(shù)據(jù)中的價(jià)值嗎?你要找的,是數(shù)據(jù)的趨勢(shì)和相關(guān)性,可以將機(jī)器學(xué)習(xí)應(yīng)用于任何環(huán)節(jié)。如果軟件提示,本周四產(chǎn)線產(chǎn)出較低,為什么會(huì)產(chǎn)出低?或者特定溫度與特定電壓對(duì)產(chǎn)品性能的影響。(這些都可以用數(shù)據(jù)分析來(lái)指導(dǎo))”
Zafiropoulos指出,可以將更好的芯片設(shè)計(jì)作為目標(biāo)?!白鳛楣こ處?,我們圍繞設(shè)計(jì)來(lái)制定規(guī)則,但如果你想面面俱到,那么效率就不會(huì)高。如果在保證可靠性與性能基礎(chǔ)上,可以減少保護(hù)規(guī)則,那將會(huì)有很大價(jià)值。很多大數(shù)據(jù)分析都是針對(duì)多個(gè)數(shù)據(jù)采集點(diǎn),一座城市可能有一萬(wàn)個(gè)傳感器,每天產(chǎn)生大量數(shù)據(jù),而亞馬遜的訂單更是數(shù)不勝數(shù)。半導(dǎo)體數(shù)據(jù)比個(gè)人能處理的數(shù)據(jù)顯然要多,但也遠(yuǎn)達(dá)不到亞馬遜交易數(shù)據(jù)這個(gè)量級(jí)?!?/p>
然而,系統(tǒng)數(shù)據(jù)可能就比設(shè)計(jì)數(shù)據(jù)高幾個(gè)數(shù)量級(jí)了,特別是涉及多物理層仿真時(shí)?!拔覀冋J(rèn)為,7納米將是首次導(dǎo)入機(jī)器學(xué)習(xí)和大數(shù)據(jù)分析的節(jié)點(diǎn),數(shù)據(jù)量將會(huì)膨脹,處理速度也需要增加?!?ANSYS總經(jīng)理兼副總裁John Lee說(shuō)道,“你需要做同步熱分析。熱效應(yīng)影響系統(tǒng)的可靠性,但如果數(shù)據(jù)量增大到當(dāng)前技術(shù)無(wú)法解決,那么就要引入新的方法,所以我們需要大數(shù)據(jù)技術(shù)。最新的GPU有210億個(gè)晶體管,而且可應(yīng)用于汽車,但這種規(guī)模的芯片發(fā)熱量巨大,(如果散熱設(shè)計(jì)不好),發(fā)熱時(shí)會(huì)增加對(duì)電路板的壓力,并可能導(dǎo)致板子彎曲,但要知道,車用芯片使用壽命長(zhǎng)達(dá)十年。”
總結(jié)
大數(shù)據(jù)分析在半導(dǎo)體產(chǎn)業(yè)應(yīng)用還處于中段(發(fā)展期)。一方面,為提高芯片的性能、效率和可靠性,半導(dǎo)體產(chǎn)業(yè)的數(shù)據(jù)量在增長(zhǎng),數(shù)據(jù)分析任務(wù)在增加;另一方面,半導(dǎo)體產(chǎn)業(yè)也在發(fā)展各種技術(shù),以充分挖掘數(shù)據(jù)用途。
這為產(chǎn)業(yè)帶來(lái)了新的增長(zhǎng)機(jī)會(huì)。Cadence 總裁兼CEO 陳立武表示,2015年全球聯(lián)網(wǎng)汽車市場(chǎng)規(guī)模為240億美元,到2020年,將發(fā)展到370億美元,與之相應(yīng),深度學(xué)習(xí)市場(chǎng)規(guī)模2020年將達(dá)100億美元(2015年為6億美元),云和數(shù)據(jù)中心市場(chǎng)規(guī)模將達(dá)800億美元(2015年650億美元)?!斑@將給半導(dǎo)體產(chǎn)業(yè)帶來(lái)機(jī)會(huì),”他說(shuō)道,“從優(yōu)化物聯(lián)網(wǎng)到云端,都將給半導(dǎo)體帶來(lái)很大的機(jī)會(huì)。”
現(xiàn)在的問(wèn)題是,圍繞這些數(shù)據(jù)還能做些什么,以及到底如何去實(shí)現(xiàn)。這將是半導(dǎo)體產(chǎn)業(yè)的一個(gè)全新機(jī)會(huì),也許會(huì)推動(dòng)半導(dǎo)體產(chǎn)業(yè)發(fā)展登上一個(gè)新臺(tái)階。
評(píng)論