IBM:傳統(tǒng)企業(yè)如何快速應用AI技術
隨著人工智能(AI)相關技術不斷加強和深入,智能語音助手、智能音箱,甚至掃地機器人這類簡單的消費類AI產(chǎn)品已經(jīng)逐漸融入到我們的生活。與以消費者為主導的市場不同,醫(yī)療、工業(yè)等以企業(yè)為主導的市場發(fā)展AI面臨著更多難題。近日,《電子產(chǎn)品世界》編輯在“AI時代的移動技術革新”大會上采訪了IBM全球技術研究院院士林詠華女士,就AI在醫(yī)療、工業(yè)等企業(yè)為主導的市場推廣及應用中存在的問題及相關突破點作了深入的探討。
本文引用地址:http://2s4d.com/article/201801/374219.htm消費市場與企業(yè)市場需求決定者不同
我們現(xiàn)在接觸的大部分比較成熟的AI產(chǎn)品都是消費類產(chǎn)品,而以消費者為主導的市場,需求實際上是由互聯(lián)網(wǎng)公司決定的,互聯(lián)網(wǎng)公司在AI上考慮創(chuàng)新的時候,更多的是要考慮消費者需要有什么樣AI的能力,而在推出相關產(chǎn)品后,消費者則會去學習怎樣使用。相較而言,企業(yè)市場的需求是由企業(yè)來定的,因此,怎樣把AI技術應用到不同的企業(yè)中則是IBM等直接面對企業(yè)客戶的公司所面臨的挑戰(zhàn)。
企業(yè)市場AI創(chuàng)新面臨的三大問題
當下想要用AI來提升企業(yè)業(yè)務價值主要面臨人才、數(shù)據(jù)和經(jīng)濟性三方面問題。
人才問題
像BAT等互聯(lián)網(wǎng)企業(yè)已有自己的AI團隊,相較而言,今天很多工業(yè)界在生產(chǎn)制造、能源、交通等領域的企業(yè),他們有專注自己業(yè)務的人才,但是并沒有AI方面人才。
數(shù)據(jù)問題
AI之所以在最近幾年發(fā)展得很火,深度學習在其中起到的作用是不可忽視的。2012年深度學習開始進入AI的算法領域,而深度學習的應用需要海量數(shù)據(jù),像谷歌、Facebook、BAT等互聯(lián)網(wǎng)公司,正因為手中有大量的互聯(lián)網(wǎng)上的數(shù)據(jù),因而得以在AI方面有相對較快的發(fā)展。但是這些數(shù)據(jù)與企業(yè)今天要解決問題的數(shù)據(jù)是完全不同的,包括醫(yī)療、生產(chǎn)制造等領域中的數(shù)據(jù)對于企業(yè)來說都是小數(shù)據(jù)級,不是海量數(shù)據(jù)。
經(jīng)濟性問題
對于企業(yè)而言,經(jīng)濟性問題也是必須考慮的。如果要擁有AI的能力意味著把成本提高十倍,企業(yè)自然是很難接受的。而這其中需要考慮的不僅是算法上的創(chuàng)新,而且要通盤考慮系統(tǒng)的優(yōu)化、系統(tǒng)的創(chuàng)新,如何使在加入AI能力的同時,成本可以沒有太大的浮動。
IBM的破局之力
人才問題
提供配備AI能力的硬件平臺需要有深度學習的開發(fā)團隊,而提供公有云的模式又只能提供一些固定的模型,這些固定的模型提供的API內容與今天很多企業(yè)數(shù)據(jù)不相關,難以匹配企業(yè)實際需求。
針對此,IBM開拓出第三種業(yè)務能力——構建一個“AI大腦”,這個大腦既可以部署在企業(yè)內部,也可以部署在云端,同時,它面對的開發(fā)者并不是需要具備豐富深度學習開發(fā)經(jīng)驗的開發(fā)者,而是企業(yè)中大量的應用開發(fā)者,以此來解決企業(yè)人才問題。
應用開發(fā)者可以利用“AI大腦”,不需要做任何深度學習的開發(fā),就可以在上面用機器針對企業(yè)的數(shù)據(jù)去訓練應用到企業(yè)里的數(shù)據(jù)模型,并且通過“AI大腦”可以自動的提供很好的、很高的精度,這是我們希望能夠達到的,林詠華女士介紹道。
IBM推“AI大腦”其實是事后的人才培育,事前的方法是要加大深度學習的教育,尤其是在本科領域。現(xiàn)在很多高校的電氣、能源等學科,應該將深度學習作為其必修的基礎學科來教學。從而使得這批人才在走上工作崗位時,至少懂得怎樣應用深度學習,從而可以更好地結合到產(chǎn)業(yè)中。
數(shù)據(jù)問題
在企業(yè)市場中,很多時候相對較少的不正常的數(shù)據(jù)更有價值。以醫(yī)療圖片為例,針對某一疾病,一萬個病人中有九千九百多個病人的數(shù)據(jù)是正常數(shù)據(jù),相對于這些正常數(shù)據(jù),那一小部分不正常的數(shù)據(jù)更為關鍵。無論是在醫(yī)療,還是智能制造,這樣的不正常的數(shù)據(jù)會更少。
針對此,IBM新推出計算機視覺領域的Power AI Vision平臺,該平臺在解決“小數(shù)據(jù)”問題上有以下兩種不同的方法:
數(shù)據(jù)增強,即通過正常數(shù)據(jù)模擬故障數(shù)據(jù)來訓練數(shù)據(jù)集。某些特殊數(shù)據(jù)需要在特定條件下才能采集到,Power AI Vision平臺中有加噪、旋轉、對稱等模擬選項,從而滿足未來遇到不同非正常場景。例如自動駕駛做模擬測試時,無法測得惡劣天氣下的行駛數(shù)據(jù),這就可以通過加噪來模擬惡劣環(huán)境測試拿到數(shù)據(jù);醫(yī)療方面,很多時候會檢測細胞,其實細胞可以是多方位不同角度,因此數(shù)據(jù)增強可以做隨機旋轉;攝像頭在拍攝公路上汽車時可能無法看到各個方位,由于車是對稱的,可以通過鏡像功能拿到完整汽車行駛數(shù)據(jù)。因而數(shù)據(jù)增強可以提供倍增的不同情況的數(shù)據(jù)。
遷移學習。遷移學習的前提是企業(yè)已經(jīng)有一個較好的基礎模型,將這個基礎模型放到遷移學習框架中,輸入的數(shù)據(jù)可以是少量的數(shù)據(jù),輸出的會是很好的結構。而企業(yè)可以通過網(wǎng)上公開數(shù)據(jù)集訓練的數(shù)據(jù)或是其他企業(yè)已經(jīng)訓練好的數(shù)據(jù)模型經(jīng)測試沒問題后,拿來作為企業(yè)的基礎模型。
AI產(chǎn)業(yè)鏈上下游配合
AI整個產(chǎn)業(yè)鏈大致分成三部分:1.下游硬件廠商;2.中游的AI芯片軟件及平臺廠商,需要調用下面的硬件,然后賣給上游;3.上游是行業(yè)企業(yè),需要為AI技術付費,也是用AI產(chǎn)品去賺錢的企業(yè)。
如果對產(chǎn)品的性能或復雜性要求不高,現(xiàn)在的整個產(chǎn)業(yè)鏈還是可以實現(xiàn)的,例如一些玩具類AI產(chǎn)品。但是如果對性能和復雜性要求較高的話,就需要整個產(chǎn)業(yè)鏈的深度融合和各方面大規(guī)模的優(yōu)化。例如GPU是否是最好的硬件,我們用一個經(jīng)典的算法做一個模型的話,英偉達最新的V100 GPU也只能同時支持四路視頻的實時性,這導致分攤到每一個攝像頭上的成本達一兩千美元,而每個攝像頭的成本也就是一兩百美元,如果考慮大規(guī)模應用的話,這樣的方案則無法實施。
另外,如果上游市場不能達到足夠大,下游廠商是無法為這一領域進行相關定制化配置的。例如,現(xiàn)在有很多為自動駕駛提供的專用芯片,這是因為現(xiàn)在自動駕駛領域已經(jīng)足夠大。國內很多中小企業(yè)很難出現(xiàn)單個中小企業(yè)就有下游公司幫助定制這樣的硬件,這時候就要去看是否有多個中小企業(yè)有這樣的需求,從而驅動下游企業(yè)做集中定制化,這也同時要求下游廠商對市場有比較深入的了解。
初創(chuàng)公司如何進入AI市場
AI要想大規(guī)模應用,就要求其有高可靠性,同時能力要比人強。大公司會兼顧不同的產(chǎn)品方向和領域,卻很難在每一個領域達到100%的精準,這就為初創(chuàng)公司留出了機遇,而這些機遇又可以分為技術創(chuàng)新和技術配套兩類:
在技術創(chuàng)新方面,初創(chuàng)公司要進入AI市場,需要考量兩方面因素:一旦做了會有比較大的市場價值,而且這個領域不是已經(jīng)被做熟的市場。例如現(xiàn)在在Face++出來之后,仍然有人在進入人臉識別的市場,初創(chuàng)公司選擇這樣的領域,好處是市場需求已經(jīng)被拉動起來,但是也很難在其中取得一席之地。
在技術配套方面,AI在不同的行業(yè)相關配套算法及方案需要做很多配套的技術,初創(chuàng)公司也可以選準一個方向,成為這其中的專才。
AI領域難以實現(xiàn)數(shù)據(jù)共享
目前來看,企業(yè)做AI的話,數(shù)據(jù)本身就是區(qū)別于競爭對手的壁壘。現(xiàn)在互聯(lián)網(wǎng)上有很多的公開數(shù)據(jù)集,例如用來做圖片分類、自然語言處理、計算機視覺,但是這些數(shù)據(jù)集并非來源于企業(yè),而是來源于網(wǎng)絡。企業(yè)中的實際數(shù)據(jù)與這些數(shù)據(jù)集是完全不同的。如果你有高價值的數(shù)據(jù),而別人沒有的話,這就意味著你在AI領域比競爭對手要走得更快。對于想要做AI的企業(yè),實際上是不愿意將數(shù)據(jù)共享的,因為一旦共享,這樣的優(yōu)勢就不再存在,除非你能夠保證一定比同領域企業(yè)能夠在技術上領先一到兩年,否則就是在培育你的競爭對手。
以生產(chǎn)制造為例,有些企業(yè)希望用AI做質檢,用AI提高產(chǎn)品的良品率,如果將瑕疵數(shù)據(jù)進行分類公開,競爭對手也會利用這些數(shù)據(jù),無形中就無法形成領先的市場地位。
深度學習并非萬能
如今,很多人已經(jīng)意識到深度學習要學一個簡單的東西仍然需要海量數(shù)據(jù),效率太低。深度學習不是萬能的,不是最好或最適合的,之后一定會有更好的技術,但是現(xiàn)在還遠未到新技術聚合出來的時間。
評論