谷歌做了個(gè)機(jī)器人,扔?xùn)|西比人準(zhǔn)多了
看到地上的東西撿起來(lái),再把它扔進(jìn)箱子里,這樣簡(jiǎn)單的動(dòng)作想必連三四歲的小孩也能很快掌握??赡阒绬?,對(duì)于機(jī)器人來(lái)說(shuō),為了達(dá)到如此完整而連貫的動(dòng)作,科學(xué)家們耗費(fèi)了數(shù)十年的時(shí)間,至今仍在繼續(xù)努力。
本文引用地址:http://2s4d.com/article/201905/400222.htm最近,由 Google AI 團(tuán)隊(duì)、哥倫比亞大學(xué)、麻省理工學(xué)院、普林斯頓大學(xué)研究人員聯(lián)手宣布制作出了一臺(tái)投擲機(jī)器人 TossingBot,它嘗試再現(xiàn)的就是前面說(shuō)到的如此「簡(jiǎn)單」的動(dòng)作,它究竟有哪些特別的地方,今天極客之選(公眾號(hào) GeekChoice)就來(lái)給大家介紹一下。
機(jī)器人能拾取物體現(xiàn)在看來(lái)并不稀奇,在工業(yè)機(jī)器人領(lǐng)域,很多工廠的自動(dòng)化操作都由能拾取物體的機(jī)器人來(lái)完成,一些動(dòng)作精巧的機(jī)器人甚至能夠?yàn)槟愦蜷_瓶子,舉杯倒酒,也許你也曾在抖音、微博這樣的平臺(tái)看到過(guò)它們。
抓取+放置并不罕見,但要說(shuō)抓取+拋擲的動(dòng)作,對(duì)于機(jī)器人來(lái)說(shuō)難度就大得多。原因很好理解,和抓取東西并放置這種穩(wěn)妥的動(dòng)作不同,抓取物體然后以拋物線的方式扔出需要提前做出預(yù)測(cè),人的大腦往往會(huì)對(duì)不同物體做出提前感知,通過(guò)不同的力度、拋擲角度來(lái)達(dá)到把物體扔進(jìn)指定位置的目標(biāo),但這種「物理直覺」對(duì)于機(jī)器人來(lái)說(shuō)卻很難。
為了訓(xùn)練這種全新的動(dòng)作形式,谷歌以及眾多大學(xué)科學(xué)家一起,嘗試讓 TossingBot 通過(guò)自我監(jiān)督機(jī)制不斷調(diào)整自身抓取、投擲方式。TossingBot 本身配備了能夠感知環(huán)境的攝像頭,因此會(huì)確定物體和目標(biāo)點(diǎn)之間的位置,而作為核心的拋擲動(dòng)作,則通過(guò)機(jī)器學(xué)習(xí)的方式進(jìn)行訓(xùn)練。
TossingBot 是通過(guò)端到端神經(jīng)網(wǎng)絡(luò)聯(lián)合學(xué)習(xí)方式來(lái)掌握投擲技巧,這個(gè)神經(jīng)網(wǎng)絡(luò)會(huì)通過(guò)不斷抓取物體來(lái)估測(cè)在拋擲時(shí)的具體情況,從而不斷矯正拋擲精度,所以從起初只能偶爾投進(jìn),到最后達(dá)到 85% 的投擲精準(zhǔn)度,全程抓取訓(xùn)練了 10000 次,耗時(shí)只用了 14 小時(shí)時(shí)間,相比人類來(lái)說(shuō)效率高了不少。
當(dāng)然,只讓它拋擲倒準(zhǔn)確位置還不夠,科學(xué)家們還嘗試在物品欄中加入各種不規(guī)則物體,考慮到實(shí)際生活當(dāng)中不規(guī)則物體很多,讓機(jī)器人掌握這種技巧自然會(huì)在未來(lái)更具使用價(jià)值。通過(guò)放置諸如假香蕉、乒乓球、馬克筆這樣的物品,TossingBot 逐漸掌握到這些物品的深層特征,由此判斷采用何種角度以及力度來(lái)拋擲物品。
通過(guò)加入不同環(huán)境和物品條件,TossingBot 才有了如今這樣比我們?nèi)祟愡€要準(zhǔn)確的投擲率,這讓我想起了前一段時(shí)間極客之選曾介紹過(guò)的豐田開發(fā)的投籃機(jī)器人,在拋擲得分這個(gè)環(huán)節(jié),這兩個(gè)機(jī)器人似乎有著異曲同工之處。
不過(guò)就目前來(lái)說(shuō),TossingBot 依然有自己的缺陷,比如它不能像人一樣感知不同物體的軟硬程度,所以容易捏碎一些易碎品,科學(xué)家們也在嘗試讓其擁有更智能的物體識(shí)別和抓取,從而提升投擲精確度,但也許有一天,這種機(jī)器人會(huì)出現(xiàn)在垃圾分類整理或者工廠生產(chǎn)車間也說(shuō)不定呢。
評(píng)論