MIT 的 3 合一訓練工具簡化了機器人的學習
教會機器人新技能過去需要編碼專業(yè)知識。但新一代的機器人可能只需要任何人就能學習。
工程師們正在設計能夠“通過示范學習”的機器人助手。這種更自然的訓練策略使人們能夠引導機器人完成一項任務,通常有三種方式:通過遙控,例如操作操縱桿遠程控制機器人;通過物理移動機器人來完成動作;或者自己執(zhí)行任務,同時機器人觀看并模仿。
通過實踐學習的機器人通常只采用這三種演示方法中的一種進行訓練。但麻省理工學院(MIT)的工程師們現在開發(fā)了一種三合一訓練界面,允許機器人通過這三種訓練方法中的任何一種來學習任務。該界面是一種手持的、配備傳感器的工具,可以連接到許多常見的協(xié)作機械臂 。人們可以使用該附件通過遠程控制機器人、物理操作機器人或親自演示任務來教機器人執(zhí)行任務——無論他們更喜歡哪種方式或哪種方式最適合手頭的任務。
MIT 團隊在標準的協(xié)作機械臂上測試了他們稱之為“多功能演示界面”的新工具。具有制造專業(yè)知識的志愿者使用該界面執(zhí)行了在工廠地面上常見的兩項手動任務。
研究人員表示,新的界面提供了更高的訓練靈活性,這可能擴大與機器人互動的用戶和“教師”類型。它還可能使機器人能夠學習更廣泛的技能。例如,一個人可以遠程訓練機器人處理有毒物質,而在生產線的下一階段,另一個人可以物理地移動機器人,模擬打包產品的動作,在生產線末端,另一個人可以使用附件在機器人觀看的同時繪制公司標志,機器人通過學習也能做到同樣的事情。
“我們正試圖創(chuàng)造高度智能和技能的隊友,他們能夠與人類有效合作,完成復雜的工作,”麻省理工學院航空航天系的研究生 Mike Hagenow 說?!拔覀兿嘈澎`活的演示工具將遠遠超出制造車間,在其他領域也能幫助機器人得到更廣泛的應用,例如家庭或護理環(huán)境?!?/p>
Hagenow 將在 10 月的 IEEE 智能機器人與系統(tǒng) (IROS) 會議上展示一篇詳細介紹新界面的論文 。該論文的 MIT 合著者包括 Dimosthenis Kontogiorgos,他是麻省理工學院計算機科學與人工智能實驗室 (CSAIL) 的一名博士后;Yanwei Wang 博士 ’25,他最近獲得了電氣工程與計算機科學博士學位;以及麻省理工學院教授、航空航天系主任 Julie Shah。
由 MIT 開發(fā)的便攜式設備,可用于教機器人新技能。 | 來源:MIT
一起訓練
馬斯在 MIT 的團隊設計可以在工作場所、醫(yī)院和家庭中與人類一起工作的機器人。她研究的主要重點是開發(fā)能夠讓人們“在職”教機器人新任務或技能的系統(tǒng)。例如,這樣的系統(tǒng)將幫助工廠車間工人快速自然地調整機器人的動作以改善其任務,而不是停下來從頭開始重新編程機器人的軟件——而工人可能并不一定具備這種技能。
該團隊的新工作建立在機器人學習中的一個新興策略之上,該策略稱為“從演示中學習”,或 LfD,其中機器人被設計為以更自然、直觀的方式進行訓練。在查閱 LfD 文獻時,Hagenow 和 Shah 發(fā)現迄今為止開發(fā)的 LfD 訓練方法通常分為三大類:遠程操作、運動覺訓練和自然教學。
一種訓練方法可能比其他兩種對特定的人或任務更有效。沙赫和哈根諾瓦想知道他們是否可以設計一個工具,將三種方法結合起來,使機器人能夠從更多的人那里學習更多的任務。
“如果我們能把這三種不同的人想要與機器人互動的方式結合起來,它可能為不同的任務和不同的人帶來好處,”Hagenow 說。
麻省理工學院開發(fā)了一種手持界面,使您能夠使用三種訓練方法中的任何一種來教機器人新技能:自然教學(左上角)、運動教學(中間)和遠程操作。 | 來源:麻省理工學院
手頭的任務
針對這一目標,團隊設計了一種新的多功能演示界面(VDI)。該界面是一個手持式附件,可以安裝在典型的協(xié)作機器人手臂上。該附件配備了一個攝像頭和標記器,用于跟蹤工具的位置和隨時間推移的運動,以及力傳感器來測量執(zhí)行特定任務時施加的壓力。
當該界面安裝到機器人上時,整個機器人可以遠程控制,界面的攝像頭會記錄機器人的運動,機器人可以利用這些數據自行學習任務。類似地,當界面連接時,人們可以手動移動機器人完成一個任務。VDI 也可以拆卸并由人手持以執(zhí)行所需任務。攝像頭會記錄 VDI 的運動,當重新安裝到機器人上時,機器人也可以用來模仿該任務。
為測試附件的可用性,團隊將界面和協(xié)作機械臂帶到當地創(chuàng)新中心,制造專家在那里學習和測試可以改進工廠流程的技術。研究人員設置了一個實驗,要求中心的志愿者使用機器人和界面的三種培訓方法完成兩項常見的制造任務:壓配合和成型。在壓配合中,用戶訓練機器人將銷釘壓入孔中,類似于許多緊固任務。對于成型,一名志愿者訓練機器人將一種橡膠狀、面團狀的物質均勻地推滾在中心桿的表面,類似于某些熱成型任務。
對于這兩個任務,志愿者們被要求使用每種訓練方法,首先使用操縱桿遠程操作機器人,然后進行運動學操作,最后,拆卸機器人的附件,并讓機器人“自然地”執(zhí)行任務,同時記錄附件的力和運動。
研究人員發(fā)現,志愿者們通常更喜歡自然方法而不是遠程操作和運動學訓練。這些用戶都是制造領域的專家,他們提出了每種方法可能在其他方法上有優(yōu)勢的場景。例如,遠程操作可能更適合訓練機器人處理危險或有毒物質。運動學訓練可以幫助工人調整負責搬運重包裝的機器人的位置。自然教學可以在演示涉及精細和精確操作的任務時帶來好處。
“我們設想在柔性制造環(huán)境中使用我們的演示界面,其中一個機器人可能協(xié)助執(zhí)行一系列從特定類型的演示中受益的任務,”Hagenow 表示,他計劃根據用戶反饋改進附件的設計,并將使用新設計來測試機器人學習?!拔覀儗⑦@項研究視為展示如何通過擴展終端用戶在教學中與機器人互動的方式來實現協(xié)作機器人的更大靈活性。”
評論