關(guān) 閉

新聞中心

EEPW首頁 > 工控自動化 > 業(yè)界動態(tài) > 機器人是如何使用數(shù)據(jù)來進行訓練的

機器人是如何使用數(shù)據(jù)來進行訓練的

作者: 時間:2016-10-27 來源:1號機器人網(wǎng) 收藏

  布朗大學計算機科學助理教授斯特弗尼?特里克斯正在解決一個棘手的問題:的抓握能力。她建立了一個機器學習模型,使能夠自動學習操縱對象,并且能夠從中產(chǎn)生許多樣本數(shù)據(jù),有了這些數(shù)據(jù),其他研究人員可以用它來訓練的抓握能力。

本文引用地址:http://2s4d.com/article/201610/311951.htm

  一開始,特里克斯言語之間就充滿著活力與激情,她慢慢陳述著在抓捏物體上,機器人所面臨的普遍問題。

  “大多數(shù)的機器人在大部分時間能夠抓取物體,但是這也是有一定前提條件的。如果你去到機器人實驗室,并把一個陌生的從沒看到過的物體放在機器人面前,該機器人基本上是無法抓起這個東西的,因為它的‘思維’里沒有這個物體的信息,也沒有針對該物體做過訓練。”

  這真的是一個實際問題,因為機器人要抓起這些物體,它們就必須明白具體的任務,以及從傳感器信息庫中知道關(guān)于該物體的相關(guān)信息。例如它的形狀,它所在的位置等等。而這些問題也是機器人手臂必須被解答的問題,通常還包括,要想抓起這些物體,那么機器人手臂應該調(diào)整到什么位置才能夠準確地抓起該物體呢?

  

 

  研究人員對機器人進行編程之后,它可以拿起特定的物體,這其中都是有一部分規(guī)律可循的,但是這些編程好的程序通常只能幫助機器人抓捏起一小部分的物體。目前,要想使得機器人能夠自主地抓起某些不熟悉的物體或者移動它們,還是有很大難度的,有類似能力的機器人還在開發(fā)當中。

  而特里克斯所構(gòu)建的機器學習模型可以讓她的實驗室機器人在錯誤中進行學習,經(jīng)過反復試驗,直到它能成功地抓起物體。在嘗試和錯誤的交替過程中,可以產(chǎn)生一系列的關(guān)于該物體的圖片信息庫,以及夾持器與物體之間也可以在磨合中更加熨帖。

  機器人不斷練習所產(chǎn)生的附屬產(chǎn)品就是數(shù)據(jù)庫,它可以成為機器學習的樣本數(shù)據(jù),用來訓練其他機器人來抓捏同樣的物體。但在特里克斯實驗室中,她的巴克斯特機器人卻不能夠產(chǎn)生足夠多的樣本數(shù)據(jù)。

  為了解決這個問題,特里克斯推出了一個“百萬挑戰(zhàn)計劃”,她想要招募全世界的實驗室,針對400臺巴克斯特機器人來進行研究,讓這些閑置的機器人可以根據(jù)她所研發(fā)的機器學習模型來運行,讓它們對上百萬個物體進行抓取實驗,最終得到一份詳細的數(shù)據(jù)。

  為什么樣本訓練數(shù)據(jù)很重要

  近年來,機器學習的應用技術(shù)如自動駕駛汽車以及圖像識別的應用技術(shù)都得到了迅猛的發(fā)展,都是因為在這些領(lǐng)域有大量的樣本數(shù)據(jù)可以用來訓練這些機器學習模型。而機器人抓取能力的滯后,最主要原因在于樣本數(shù)據(jù)的缺少,從而無法訓練神經(jīng)網(wǎng)絡。

  使用標記的數(shù)據(jù)來訓練機器學習模型最便于理解的例子就是圖像識別。圖像識別的精度已經(jīng)提高了90%。如此進步可以歸因于機器學習的應用以及龐大的樣本數(shù)據(jù)庫。數(shù)以百萬計的標記圖片集已經(jīng)在學術(shù)研究中被廣泛使用了,如谷歌,F(xiàn)acebook和其他在線圖像存儲器。

  神經(jīng)網(wǎng)絡是如何工作的

  神經(jīng)網(wǎng)絡是一個由幾個簡單高度互連的處理元件組成的計算機系統(tǒng),可以通過對外部輸入的動態(tài)回應來處理信息。它主要是通過處理大量的被標記的數(shù)據(jù),從而來獲得理解不同情形的能力。

  一張鳥的圖像中,鳥是特定的鳥,在一張汽車圖像中,汽車也是特定的汽車。大量的圖像樣本可通過機器學習軟件來進行處理,如Torch和Tensorflow,然后讓它在神經(jīng)網(wǎng)絡上運行,就能夠?qū)ζ溥M行訓練來識別照片中的物體了。

  在這種情況下,輸入的信息主要就是大量的被標記的圖像,緊接著系統(tǒng)就能輸出關(guān)于該圖片的許多識別標簽,例如所輸入的圖片到底有沒有汽車。而還有一個隱藏的部分就是整個處理過程,通常包含神經(jīng)元,以及根據(jù)算法而來的機器學習軟件處理程序,也可被稱為該圖像的中間值。

  緊接著系統(tǒng)會對這些樣本數(shù)據(jù)進行重新處理,從而可以測試出該模型在推測圖片標簽上的準確性。然后再對結(jié)果進行比對,如果有錯誤就更正過來,并將其反饋到神經(jīng)網(wǎng)絡中,算法程序就可以根據(jù)所反饋的內(nèi)容做出相關(guān)判斷。這樣的糾錯過程會如此往復直到出現(xiàn)正確的預測。

  自動駕駛汽車也是以同樣的方式來學習駕駛的。當有人在駕駛某一輛特定的汽車時,可以將路面的情況,以及各個轉(zhuǎn)彎的角度用3D視頻的方式記錄下來,形成樣本數(shù)據(jù)庫。

  該日志可以輸入到機器學習系統(tǒng)當中,從而可以訓練算法正確地將相關(guān)信息輸入到視頻中去。這個過程會重復進行,直到調(diào)整到一個適用于車輛操作的駕駛模式。

  用來訓練圖像識別系統(tǒng)的樣本信息量是很巨大的。而自動駕駛汽車有大量的數(shù)據(jù)集。谷歌研發(fā)的自動駕駛汽車已經(jīng)行駛了一百萬英里,特斯拉也行駛了近10億英里,有了這些數(shù)據(jù),可以提供更全的駕駛經(jīng)驗。而訓練機器人的抓握能力時,卻沒有這些數(shù)據(jù)的支持。

  “百萬挑戰(zhàn)計劃”

  如果特里克斯的“百萬挑戰(zhàn)計劃”可以成功,將會獲得大量的數(shù)據(jù),終將有一天可以讓機器人有更準確的抓握能力。



關(guān)鍵詞: 機器人

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉