當人工智能遇上MATLAB 模型訓練簡單化
人工智能在過去兩年被谷歌引爆,于是該領域的創(chuàng)業(yè)公司如雨后春筍般生長起來,有的做專用芯片,有的做算法,有的做機器人…人工智能到底是什么?是讓機器代替人類完成重復的生產(chǎn)線勞動嗎?這樣理解為免太簡單。人工智能絕對不只是讓機器完成模仿,從而替代重復性工作,真正的人工智能需要機器經(jīng)過訓練和學習,接近或者超越人類的智能行為。
本文引用地址:http://2s4d.com/article/201805/380716.htm人工智能訓練模型的時候,數(shù)據(jù)是最重要的因素,只有通過大數(shù)據(jù)訓練,才能讓訓練的模型更接近于實際需求。比如,自動駕駛的模型訓練,現(xiàn)在基本是靠自動駕駛汽車上路測試收集數(shù)據(jù)訓練模型,路上的汽車只有采集到更多可能的場景,才能確保訓練出的模型更接近實際路況。在人工智能訓練中一般會遇到兩個問題:第一,數(shù)據(jù)量不夠如何訓練模型?第二,數(shù)據(jù)量太大如何快速進行標注?

MathWorks產(chǎn)品市場經(jīng)理趙志宏
遷移學習:通過模型產(chǎn)生數(shù)據(jù)訓練神經(jīng)網(wǎng)絡
如果沒有數(shù)據(jù)能做人工智能嗎?這是很多初創(chuàng)公司的困惑。在筆者的概念里,正常的AI開發(fā)流程是,先采集數(shù)據(jù),再訓練模型。在最近的Matlab大會上,MathWorks產(chǎn)品市場經(jīng)理趙志宏先生給出了一個不一樣的答案,他表示,“數(shù)據(jù)、輸出和模型是整個AI開發(fā)流程的一個步驟。如果開發(fā)者想做人工智能,又沒有太多的數(shù)據(jù),可以采用遷移學習的方法?!?遷移學習又是什么概念?不防從實際例子來理解。比如:通過人工智能的方式來預測風力發(fā)電機的故障,用戶不能等到采集到大量故障數(shù)據(jù)以后再預測,這樣不符合設備維護的目標,而是先用Simulink模型建立一個風里發(fā)電機的模型,通過校正讓這個模型非常接近風力發(fā)電機,然后通過該模型產(chǎn)生故障數(shù)據(jù),進而訓練機器學習或者深度學習的神經(jīng)網(wǎng)絡。
趙志宏先生表示,“基于模型設計的優(yōu)勢是,它是在真正做出產(chǎn)品之前建好一個模型,這個模型與實際產(chǎn)品非常的接近,不管是從數(shù)字計算、行為計算產(chǎn)生的結果與真正的結果都非常接近。很多工程師在設計產(chǎn)品的時候已經(jīng)把這個模型建好了,在這個模型上加入故障情況就很容易產(chǎn)生故障數(shù)據(jù),這比在實際設備上產(chǎn)生的故障要容易很多。因此,可以進行故障預測和維護?!?/p>
通過深度學習對大數(shù)據(jù)進行標注
隨著傳感器的大量采用,數(shù)據(jù)量進入洪荒時代,給人工智能進行特征標記帶來困難,這時候可以采用深度學習進行標記。趙志宏先生解釋,“深度學習的特點是不需要人工手動找出特征值,系統(tǒng)可以自動從數(shù)據(jù)里提取特征值。MATLAB里面有很多自動標記的工具和功能。LiDAR三維點云技術可以對每一點進行標注,把這個點聚類在一起聚成一個目標模型,然后再把目標具體代表的實物辨別出來。有些用戶已經(jīng)采用MATLAB的工具進行了開發(fā),著名的汽車配件公司AUTOLIV就在用這種方式進行自動數(shù)據(jù)標注?!?/p>
以膨化食品智能檢測為例,研究人員可以在用戶咬食品的時候提取特征,用咬合聲音和咬合力度衡量食品的松脆度,有了這兩個特征,還需要開發(fā)一個機器學習的分類器,而MATLAB提供了分類學習器。開發(fā)者通過這個工具不需要一個一個去試各種分類器的算法,使用MATLAB提供的APP去一次性嘗試所有算法。開始運行APP后,用戶選好數(shù)據(jù)和需要訓練的分類器,然后進行訓練。在訓練過程中,用戶可以看到每個分類器的整體結果,選擇精確度最高的一個,然后進行更多的調查和研究。如果用戶沒有研究過AI,可以用MATLAB提供的APP進行學習,去嘗試所有機器學習的算法。
在MATLAB里面做深度學習難嗎?用趙志宏先生的話說,只需要寫5行的MATLAB代碼,用戶就可以建出一個能夠識別食品的網(wǎng)絡。筆者已經(jīng)多年沒接觸過MATLAB了,所以無從考證,工程師朋友們如果需要可以進行嘗試。
和開源代碼如何協(xié)作?
現(xiàn)在市面上的開源非常熱,工程師們可以在開源社區(qū)快速獲得需要的代碼,在人工智能領域也有很多開源資源,作為封閉資源的MATLAB和開源代碼相比更新速度可能會較慢,而且加上是收費模式,工程師們也擔心兩者的融合問題。當筆者問到這個問題的時候,趙志宏先生解釋,“開源代碼背后有很多的開發(fā)團隊,他們自愿進行開發(fā),我們也有自己的開發(fā)團隊。我們并不把開源代碼和MATLAB定義為競爭關系,實際上我們各有特點和長處,有時候我們是可以與開源代碼共用。有一些開源代碼可以在MATLAB里面運行或者直接調用,我們在共同為科技進步做貢獻。我們雖然是付費軟件,但是提供的不僅是工具,還有很多的服務?!?/p>
“當用戶使用MATLAB時遇到問題,我們后面有很強的技術支持團隊幫用戶解決這些問題。另外,我們的工具不僅是針對某一功能產(chǎn)生正確的結果,我們還考慮把這個功能做得非常的容易使用。比如針對AI應用,我們把界面做得非常適合該專業(yè)領域,而且兼顧讓用戶感覺在使用熟悉的MATLAB或者Simulink的界面。這是我們的優(yōu)勢,如果用戶在MATLAB或者Simulink中增加新功能,學習門檻不會很高,容易上手設計。除了提供工具,我們還給用戶提供了很多便利,這是從開源工具中所得不到的東西?!壁w志宏先生補充。
評論