獨(dú)家 | 忘記波士頓動力公司。這個機(jī)器人可以自學(xué)走路
作者:Will Douglas Heavenarchive page
翻譯:陳超
校對:車前子
本文介紹了波士頓動力公司發(fā)布的機(jī)器人Cassie如何實(shí)現(xiàn)自學(xué)走路的虛擬視頻,以及該方法在現(xiàn)實(shí)生活中的困難及應(yīng)用。
波士頓動力公司發(fā)布的虛擬視頻讓人印象深刻但是教機(jī)器人自己走路卻有點(diǎn)兒難。
混合機(jī)器人
一雙叫做Cassie的機(jī)器腿已經(jīng)通過強(qiáng)化學(xué)習(xí)的方法被教會了走路,強(qiáng)化學(xué)習(xí)是一種通過試錯來教AI復(fù)雜行為的訓(xùn)練技術(shù)。兩條腿的機(jī)器人從零開始學(xué)會了一系列運(yùn)動,包括蹲著行走以及攜帶意料之外的負(fù)重時行走。
視頻****:https://youtu.be/goxCjGPQH7U
但是機(jī)器人可以隨音樂跳舞嗎?由于波士頓動力公司(Boston Dynamics)發(fā)布的熱門視頻,人們對機(jī)器人可以做什么的期待越來越高,視頻展示了人形機(jī)器人Atlas單腿站立,跳過盒子,并且跳舞。這些視頻累計(jì)達(dá)到了上百萬的瀏覽量,甚至也有很多模仿視頻。Atlas對運(yùn)動的控制讓人印象深刻,但是編舞的序列可能涉及到大量手動調(diào)參。(波士頓動力公司并未披露細(xì)節(jié),所以很難說清楚手動調(diào)參的量級)。
“這些視頻可能會讓一些人相信這是一個已經(jīng)解決了的、很簡單的問題”,加州大學(xué)伯克利分校的Zhongyu Li這樣說道,Zhongyu Li與同事們是Cassie的研發(fā)者。“但是想實(shí)現(xiàn)機(jī)器人可靠地操作并在人類環(huán)境中生活,我們?nèi)匀挥泻荛L的路要走?!盋assie現(xiàn)在還不能跳舞,但是教這個真人大小的機(jī)器人自己學(xué)習(xí)走路,這已經(jīng)讓它更接近于能夠處理大部分地形,并在絆倒或受損時恢復(fù)。
虛擬的局限性:強(qiáng)化學(xué)習(xí)已經(jīng)被用于訓(xùn)練機(jī)器人在虛擬環(huán)境中走路,但是將該能力移植到現(xiàn)實(shí)世界是很困難的?!澳憧吹降脑S多虛擬代理的視頻根本不是真實(shí)的,”Chelsea Finn說道,他是斯坦福大學(xué)的AI和機(jī)器人研究專家,但他并沒有加入這項(xiàng)工作。虛擬環(huán)境中模擬的物理定律和現(xiàn)實(shí)生活中的物理定律有細(xì)微的差異——例如機(jī)器人的腳和地面的摩擦——可能會導(dǎo)致機(jī)器人無法應(yīng)用它所學(xué)到的內(nèi)容。對一個重量大的兩腿機(jī)器人來說,即使它的移動只有小小的一步,都可能失去平衡并且跌倒。
雙重模擬:但是通過在現(xiàn)實(shí)世界試錯的方法來訓(xùn)練一個大型機(jī)器人可能是很危險的事。為了解決這些問題,伯克利團(tuán)隊(duì)使用了兩層的虛擬環(huán)境。首先,虛擬版本的Cassie通過在一個大的現(xiàn)存機(jī)器人運(yùn)動數(shù)據(jù)庫畫出軌跡來學(xué)習(xí)走路。這種模擬之后會被移植到第二層叫做SimMechanics虛擬環(huán)境,這個環(huán)境高度準(zhǔn)確地復(fù)刻了現(xiàn)實(shí)世界的物理規(guī)律——以運(yùn)行速度為代價。只有Cassie走得比較好的時候,機(jī)器人習(xí)得的步行模型才會加載到真實(shí)的機(jī)器人當(dāng)中。
真實(shí)的Cassie能夠使用在仿真過程中習(xí)得的模型走路,不需要額外調(diào)整。它可以通過粗糙和光滑的區(qū)域,攜帶意外的負(fù)重,并且在被推之后自我恢復(fù)過來。在測試階段,Cassie也會損壞它右腿位置的兩個發(fā)動機(jī),但是它能夠調(diào)整自己的運(yùn)動來進(jìn)行補(bǔ)償。Finn認(rèn)為這是令人激動的工作。帝國理工學(xué)院機(jī)器人學(xué)習(xí)實(shí)驗(yàn)室的負(fù)責(zé)人Edward Johns也同意這種觀點(diǎn),他說:“這是我見過的最成功的案例了,”
伯克利團(tuán)隊(duì)希望使用他們的方法來增加Cassie的運(yùn)動技能。但是并不期待很快它就能學(xué)會跳舞。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。