新聞中心

EEPW首頁(yè) > 機(jī)器人 > 設(shè)計(jì)應(yīng)用 > 人形機(jī)器人技術(shù)的進(jìn)展、實(shí)踐與挑戰(zhàn)

人形機(jī)器人技術(shù)的進(jìn)展、實(shí)踐與挑戰(zhàn)

—— 根據(jù)浙大教授熊蓉的報(bào)告整理
作者:迎九 時(shí)間:2025-04-07 來(lái)源:EEPW 收藏

2024 年4 月,由中國(guó)機(jī)器人網(wǎng)、智能谷產(chǎn)業(yè)園主辦的“2024 中國(guó)生態(tài)大會(huì)”在上海舉行。會(huì)上,褚君浩院士[1]和孫立寧院士[2]對(duì)的傳感和控制技術(shù)做了介紹,隨后,浙江大學(xué)的熊蓉教授分享了其觀察和實(shí)踐。

本文引用地址:http://2s4d.com/article/202504/469078.htm

本文主要介紹了熊蓉教授多年來(lái)的科研成果,包括三部分:①的發(fā)展背景與意義,②核心關(guān)鍵技術(shù)研究進(jìn)展,③發(fā)展趨勢(shì)與挑戰(zhàn)。

熊蓉教授是浙江大學(xué)控制科學(xué)與工程學(xué)院教授、博士生導(dǎo)師,浙江大學(xué)智能系統(tǒng)與控制研究所機(jī)器人實(shí)驗(yàn)室主任。

1   人形機(jī)器人的發(fā)展背景與意義

人形機(jī)器人原來(lái)有很多的稱呼,過(guò)去習(xí)慣于稱為“仿人機(jī)器人”,但是這兩年明確定義為是“人形機(jī)器人”。

1.1 人形機(jī)器人的特點(diǎn)

常規(guī)的機(jī)器人是模仿人的部分或全部功能和智能;但是人形機(jī)器人更強(qiáng)調(diào)類人的形態(tài),這種類人的形態(tài)使它能夠適應(yīng)人類為自己建造的環(huán)境,使用人類為自己設(shè)計(jì)制作的工具,并且能夠有更好的人機(jī)交互。所以它具有更強(qiáng)的通用性。這種通用性使它能夠無(wú)縫地轉(zhuǎn)換人類現(xiàn)在所從事的一些工作,所以它是一個(gè)未來(lái)的重大的產(chǎn)業(yè)。

人形機(jī)器人屬于專用型的機(jī)器人,能力是超越人類的:會(huì)有更強(qiáng)的負(fù)載,更快的工作的節(jié)拍,更高的精度,更強(qiáng)的一致性。

但是現(xiàn)在這種專用的人形機(jī)器人還是無(wú)法實(shí)現(xiàn)的——還需要給它們布置專屬的環(huán)境,但是未來(lái)有望融入到人類生活的方方面面。這種類人的形態(tài)可以直接實(shí)現(xiàn)與人的無(wú)縫替換,所以具有更加廣闊的市場(chǎng)。

1.2 市場(chǎng)預(yù)測(cè)與布局

國(guó)內(nèi)外做了非常樂(lè)觀的市場(chǎng)預(yù)測(cè),例如高盛近期的市場(chǎng)預(yù)測(cè)樂(lè)觀度進(jìn)一步提高了,認(rèn)為如果能夠克服產(chǎn)品設(shè)計(jì)、用例、技術(shù)、成本及廣泛公眾接受度等障礙,到2035年人形機(jī)器人市場(chǎng)規(guī)模將達(dá)1,520億美元,與電動(dòng)汽車市場(chǎng)旗鼓相當(dāng)。馬斯克預(yù)測(cè)智能人形機(jī)器人將超越人類數(shù)量,市場(chǎng)規(guī)模將達(dá)萬(wàn)億級(jí)。

這兩年一些國(guó)內(nèi)外的產(chǎn)業(yè)界巨頭開(kāi)始布局人形機(jī)器人的賽道,從整機(jī)到核心零部件,從里面的智能控制器到智能計(jì)算等。

總體來(lái)看,人形機(jī)器人已進(jìn)入了一個(gè)新的突破窗口期:從實(shí)驗(yàn)室的樣機(jī)研發(fā),進(jìn)入到了產(chǎn)品的樣機(jī)以及未來(lái)產(chǎn)業(yè)化發(fā)展的早期階段。

我國(guó)也非常重視人形機(jī)器人的發(fā)展,已經(jīng)上升為國(guó)家戰(zhàn)略性新興技術(shù)和產(chǎn)業(yè)方向。我國(guó)從2022 年就開(kāi)始了相關(guān)的發(fā)展論證,2023 年工信部先后出臺(tái)了揭榜掛帥的項(xiàng)目[3],以及《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見(jiàn)》。在今年1 月,工信部等7 部門(mén)發(fā)布了《關(guān)于推動(dòng)未來(lái)產(chǎn)業(yè)創(chuàng)新發(fā)展的實(shí)施意見(jiàn)》里,“創(chuàng)新標(biāo)志性產(chǎn)品”的第一個(gè)就是人形機(jī)器人。

2   浙大的研發(fā)實(shí)踐

2.1   人形機(jī)器人的關(guān)鍵技術(shù)

人形機(jī)器人并不是今天才有的系統(tǒng),早在上個(gè)世紀(jì)六十年代就推出了第一臺(tái)雙足行走機(jī)器人。

人形機(jī)器人一直以來(lái)都被認(rèn)為是機(jī)器人領(lǐng)域中的一個(gè)技術(shù)競(jìng)爭(zhēng)制高點(diǎn),是國(guó)與國(guó)之間競(jìng)爭(zhēng)的科技的顯示點(diǎn)。其主要難點(diǎn)在于三方面(如表1)。

1743995161865666.png

表1 人形機(jī)器人的主要挑戰(zhàn)

首先,它幾乎是機(jī)器人和人工智能(AI)技術(shù)的集大成者,涉及了機(jī)器人技術(shù)的方方面面,并且整個(gè)系統(tǒng)的復(fù)雜性也導(dǎo)致了整機(jī)系統(tǒng)的研制是一個(gè)具有很高挑戰(zhàn)性的問(wèn)題。

除了整機(jī),還需要融合各個(gè)部件的功能、性能、材料等,同時(shí)也對(duì)這些部件提出了高要求,例如關(guān)節(jié)要求力矩大、速度快、體積小、重量輕、高功率密度等。

第二,這個(gè)系統(tǒng)是本質(zhì)不穩(wěn)定的系統(tǒng)。例如人有時(shí)單腳支撐,如果跑步可能雙腳騰空,可見(jiàn)人的足和地面接觸的空間和時(shí)間有時(shí)候非常少,人的穩(wěn)定控制會(huì)發(fā)生在這樣的一個(gè)小空間和時(shí)間段里,但對(duì)于人形機(jī)器人來(lái)說(shuō),這種穩(wěn)定控制很難。因此,盡管現(xiàn)在很多機(jī)器人實(shí)現(xiàn)了穩(wěn)定的行走,但是不能到一個(gè)真實(shí)的環(huán)境里去適應(yīng)各種環(huán)境的擾動(dòng),例如去適應(yīng)在作業(yè)過(guò)程中,由于手臂的用力而帶來(lái)的擾動(dòng),同時(shí)能夠去保證它的穩(wěn)定性以及作業(yè)的準(zhǔn)確性。

第三,作為一種通用的形態(tài),它必須能在各種環(huán)境里去執(zhí)行各種任務(wù),這就對(duì)它的智能性提出了高要求,這也是AI 領(lǐng)域中的一個(gè)重要的發(fā)展目標(biāo)——能夠向通用AI 發(fā)展。

在工信部的《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見(jiàn)》里明確的一個(gè)思想是以應(yīng)用來(lái)牽引,然后通過(guò)整機(jī)來(lái)帶動(dòng)整個(gè)生態(tài)的發(fā)展。其中有幾個(gè)核心,一是包括整機(jī)和部件,還有小腦、大腦,以及要去支持其開(kāi)發(fā)的供應(yīng)鏈和工具鏈,由此來(lái)形成整個(gè)的行業(yè)應(yīng)用和生態(tài)建設(shè)(如圖1)。

1743995774668053.png

圖1 對(duì)《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見(jiàn)》的部分解讀圖

2.2 研發(fā)歷程

熊蓉教授團(tuán)隊(duì)是從2000年開(kāi)始進(jìn)行機(jī)器人研究的,關(guān)注的是機(jī)器人的智能性,包括智能移動(dòng)和操作。2006年時(shí)看到了人形機(jī)器人是技術(shù)的集大成者和其挑戰(zhàn)性,開(kāi)始了對(duì)人形機(jī)器人的研發(fā)。

2006 年后主要以參加RoboCup 比賽的機(jī)器人為平臺(tái)進(jìn)行技術(shù)積累,包括了機(jī)器人的設(shè)計(jì)制作,涵蓋運(yùn)動(dòng)控制、平衡控制以及集成了單目視覺(jué)來(lái)進(jìn)行實(shí)時(shí)的定位、規(guī)劃、各種運(yùn)動(dòng)的實(shí)時(shí)生成。該平臺(tái)在國(guó)際比賽上獲得了4 次亞軍,在國(guó)內(nèi)獲得了多次冠軍。

1)打兵乓球機(jī)器人

2008—2011 年,熊蓉教授團(tuán)隊(duì)在國(guó)家863 項(xiàng)目的支持下,研制了兩個(gè)能夠跟人或者是雙機(jī)器人進(jìn)行乒乓球?qū)Υ虻娜诵螜C(jī)器人(圖2)。這里除了選擇合適的形態(tài)及部件集成,更主要的還解決了智能的視圖控制。這堪稱國(guó)際上第一個(gè)能夠在線動(dòng)態(tài)視圖控制快速飛行的球并擊打的人形機(jī)器人,包括能夠基于視覺(jué)對(duì)球進(jìn)行準(zhǔn)確的檢測(cè)、定位以及對(duì)整條軌跡的預(yù)測(cè)。其用5 幀的數(shù)據(jù)來(lái)實(shí)現(xiàn)小于4 ms 的時(shí)間誤差和小于1 cm 位置誤差的整條軌跡的預(yù)測(cè),然后在線做全身的運(yùn)動(dòng)規(guī)劃——這是一個(gè)冗余自由度的在線規(guī)劃,并且去解決在手臂擊球的加速度下會(huì)造成身體的不穩(wěn)定,如何進(jìn)行平衡控制來(lái)保持穩(wěn)定,以及它的準(zhǔn)確擊球。

image.png

圖2 打乒乓球的人形機(jī)器人

2011 年10 月成果發(fā)布后,它得到了國(guó)內(nèi)外的廣泛關(guān)注。但是該系統(tǒng)還有一些問(wèn)題尚待解決,例如行走速度和穩(wěn)定性還有問(wèn)題——它只能實(shí)現(xiàn)1.2 km/h 的行走,并且只能在平整地面上行走;在打球時(shí),因?yàn)樾凶叩乃俣雀簧?,主要是站立打球,用下肢?lái)做平衡控制。

2)快速穩(wěn)定行走的人形機(jī)器人

所以從2012 年起,熊蓉教授團(tuán)隊(duì)主要研究在室內(nèi)外能夠快速穩(wěn)定行走的人形機(jī)器人,包括能夠立位混合控制的關(guān)節(jié)、腿,以及全身協(xié)調(diào)的立位混合控制。2022年時(shí),新的人形機(jī)器人能夠?qū)崿F(xiàn)在室內(nèi)外快速穩(wěn)定地行走,包括適應(yīng)各種地形。

●   部件/ 關(guān)節(jié)的研制。涵蓋高功率密度的電機(jī),更大減速比的行星減速器,以及做成高集成性的一體化關(guān)節(jié)。

●   運(yùn)動(dòng)建模和控制。目前國(guó)際上對(duì)人形機(jī)器人行走的運(yùn)動(dòng)控制有三條技術(shù)路線(圖3)。一種是從機(jī)理出發(fā)的,對(duì)整機(jī)進(jìn)行運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)的建模,然后設(shè)計(jì)其穩(wěn)定規(guī)則,來(lái)進(jìn)行它的規(guī)劃控制。第二種是像特斯拉所展示的,把人的運(yùn)動(dòng)如何直接映射到機(jī)器人上面,使它能夠產(chǎn)生更加擬人化的動(dòng)作。第三種是針對(duì)機(jī)理模型控制,這需要大量的挑戰(zhàn),非常依賴于模型的準(zhǔn)確性,對(duì)于復(fù)雜環(huán)境的適應(yīng)性需要人工的介入——如何去提高它的魯棒性,而研究強(qiáng)化學(xué)習(xí)的方法。

熊蓉教授團(tuán)隊(duì)在這三個(gè)方面都開(kāi)展了一些工作。

例如,在“強(qiáng)化學(xué)習(xí)”方面,2020 年時(shí),他們?cè)谒淖銠C(jī)器人上首先做了一項(xiàng)工作,通過(guò)強(qiáng)化學(xué)習(xí)去生成各種動(dòng)作,例如生成各種基本步態(tài),然后再把基本步態(tài)融合,形成對(duì)于陌生環(huán)境的適應(yīng)性,能夠自動(dòng)選擇步態(tài)的組合。今年年初,他們又把這種方法延伸到了人形機(jī)器人上,以實(shí)現(xiàn)對(duì)不同地面的適應(yīng)。

1743995912192849.png

圖3 行走運(yùn)動(dòng)控制的技術(shù)路線

在模型學(xué)習(xí)“人機(jī)映射”學(xué)習(xí)方面,如何把人的復(fù)雜動(dòng)作快速映射到機(jī)器人上?最初是把人的手與上肢的動(dòng)作映射到一臺(tái)機(jī)器人上。

這里主要解決了兩點(diǎn)。傳統(tǒng)的最優(yōu)化的映射比較依賴初值(需要人工給較好的初值),而且只能實(shí)現(xiàn)一些簡(jiǎn)單的動(dòng)作,需要的優(yōu)化時(shí)間較長(zhǎng)。他們把最優(yōu)化和目前火熱的深度學(xué)習(xí)結(jié)合后,提出了圖形神經(jīng)網(wǎng)絡(luò)下的最優(yōu)化的學(xué)習(xí)方法,其優(yōu)勢(shì)是:①大幅提升了動(dòng)作的相似性,而且可以保證可執(zhí)行性和安全性;②最主要的是實(shí)現(xiàn)了時(shí)間上的大幅提升,能夠快速地把人的各種運(yùn)動(dòng)映射到機(jī)器人上。

3)語(yǔ)義保持

在利用最新AI技術(shù)方面,他們利用語(yǔ)言和視覺(jué)大模型去進(jìn)一步提升動(dòng)作的語(yǔ)義保持。例如讓它指胸口,不能映射以后指到脖子或腹部;讓它指鼻尖,就必須是鼻尖。所以通過(guò)這種跟新的AI 技術(shù)的結(jié)合,可以實(shí)現(xiàn)語(yǔ)義保持,并且能夠快速遷移到新的架構(gòu)上。

4)關(guān)節(jié)壞了仍能行走

另外,足式機(jī)器人不可避免地會(huì)有一些關(guān)節(jié)出現(xiàn)故障。能否讓它有一定的自適應(yīng)性,依然保持一定的作業(yè)能力?熊蓉教授團(tuán)隊(duì)的成果是:假定在四足機(jī)器人上面任意一個(gè)關(guān)節(jié)壞了,給它一個(gè)鎖定,四足機(jī)器人依然能保持直線行走。

5)機(jī)器人智能

熊蓉教授團(tuán)隊(duì)的工作更多地還是放在了機(jī)器人智能上,從2000年開(kāi)始在這方面去做了大量的工作。

6)總體設(shè)計(jì)思想

總體思想是:如何從傳統(tǒng)的封閉、靜態(tài)的環(huán)境里,走向具有一定未知性和動(dòng)態(tài)開(kāi)放的環(huán)境里,讓它能夠長(zhǎng)期自主魯棒地工作;以及從依賴人工離線編寫(xiě)的程序,到具有自適應(yīng)、自學(xué)習(xí)、自進(jìn)化、自發(fā)育的能力,以逐步適應(yīng)更加豐富的環(huán)境和更加多樣化的作業(yè)(圖4)。

1743996047178909.png

圖4 機(jī)器人的技術(shù)發(fā)展目標(biāo)

在這些方面,熊蓉教授團(tuán)隊(duì)也發(fā)表了一系列的論文。

7)智能移動(dòng)技術(shù)。

對(duì)機(jī)器人的長(zhǎng)期準(zhǔn)確的定位和導(dǎo)航方面做了一些工作,也得到了專家院士的認(rèn)可,現(xiàn)在一些技術(shù)已經(jīng)在多個(gè)領(lǐng)域里有應(yīng)用驗(yàn)證,例如變電站的巡檢機(jī)器人,制造業(yè)里的新型AMR(自主移動(dòng)機(jī)器人),四足機(jī)器人在復(fù)雜地形下對(duì)人的跟隨等。熊蓉教授團(tuán)隊(duì)的成果也實(shí)現(xiàn)了產(chǎn)業(yè)的轉(zhuǎn)化落地,孵化了“迦智科技”去做新型的物流機(jī)器人,目前已經(jīng)在制造業(yè)里大規(guī)模應(yīng)用。

8)智能操作技術(shù)

開(kāi)放場(chǎng)景高效行為的決策

* 有參照人的裝配工作

自從2012 年完成了打乒乓球的機(jī)器人之后,熊蓉教授團(tuán)隊(duì)又面向如何能夠去操作更多的對(duì)象研究。其中一項(xiàng)工作是對(duì)于序列性的作業(yè),能否讓人能夠去展示,然后直接來(lái)生成機(jī)器人的程序。

即機(jī)器人首先對(duì)人的動(dòng)作進(jìn)行理解,解析出用什么樣的動(dòng)作,操作了什么樣的物體,達(dá)到了什么樣的效果,并且要去解決從感知誤差到執(zhí)行精度要求之間的差距。人類的感知誤差往往是毫米級(jí)的;而熊蓉教授團(tuán)隊(duì)的機(jī)器人的執(zhí)行精度在0.1 毫米級(jí)量級(jí)。這需要能夠?qū)崿F(xiàn)準(zhǔn)確的對(duì)未知的推理,然后實(shí)現(xiàn)程序的自動(dòng)生成。熊蓉教授團(tuán)隊(duì)實(shí)現(xiàn)了不同的動(dòng)作,例如手電筒的開(kāi)關(guān),包括機(jī)器人關(guān)節(jié)對(duì)人的行為學(xué)習(xí)以后,用幾分鐘的時(shí)間來(lái)生成動(dòng)作。

* 在開(kāi)放性的環(huán)境里

實(shí)際上很難有人的這種參照,需要機(jī)器人能夠去自主決策。

在這里,當(dāng)有一個(gè)長(zhǎng)序列的行為,例如要抓藍(lán)色的木塊,但是它有堆疊時(shí)抓不到,需要通過(guò)推、挪等動(dòng)作快速地抓到。

再例如很多時(shí)候?qū)δ繕?biāo)位置是有放置要求的,但是來(lái)料往往是隨機(jī)的,怎樣去調(diào)整它的中間狀態(tài)?原來(lái)我們都是要依靠人來(lái)編程序,把它做一個(gè)指定的位置調(diào)整,來(lái)保證它最后的實(shí)現(xiàn)。但在開(kāi)放場(chǎng)景里,如何讓機(jī)器人能夠自動(dòng)地生成中間的行為和中間的狀態(tài)?

從學(xué)習(xí)的角度來(lái)看,最終目標(biāo)是明確的,但是中間的目標(biāo)不明確,因此它也很難來(lái)得到數(shù)據(jù)的正確反饋,即正確的數(shù)據(jù)是稀疏的。熊蓉教授團(tuán)隊(duì)在這方面解決了中間的評(píng)價(jià)器,以及能夠去快速學(xué)習(xí)的問(wèn)題。進(jìn)一步地,對(duì)于一些開(kāi)放混雜的場(chǎng)景,需要更多地去適應(yīng)各種各樣的物體,為此,熊蓉教授團(tuán)隊(duì)也引入了語(yǔ)言大模型和視覺(jué)大模型。

但是大模型是通過(guò)大量數(shù)據(jù)訓(xùn)練形成的,雖然包含了各種各樣的物體,但是還有可能檢測(cè)不了一些物體,也會(huì)存在當(dāng)物體堆疊在一起的時(shí)候,檢測(cè)和定位的準(zhǔn)確性可能較低,導(dǎo)致機(jī)器人執(zhí)行的失敗。

在此情況下,怎樣讓機(jī)器人通過(guò)它的行為逐步收斂到一個(gè)正確的結(jié)果里?熊蓉教授團(tuán)隊(duì)就提出了把語(yǔ)言大模型、視覺(jué)大模型和機(jī)器人操作的模型去融合學(xué)習(xí),實(shí)現(xiàn)了在這種混合場(chǎng)景下的操作,最后來(lái)完成工作。

通過(guò)這樣一系列的從強(qiáng)化學(xué)習(xí),從語(yǔ)言視覺(jué)大模型以及與模仿學(xué)習(xí)的結(jié)合,可以讓機(jī)器人來(lái)完成桌面的整理。初始它可能是非?;祀s的,告訴機(jī)器人目標(biāo)要求后,機(jī)器人會(huì)進(jìn)行長(zhǎng)序列的規(guī)劃生成,最后來(lái)達(dá)到指定的要求。

9)伺服控制

與此同時(shí),熊蓉教授團(tuán)隊(duì)在機(jī)器人的伺服控制里也做了一系列工作。因?yàn)閭鹘y(tǒng)的方式是先人為編好一個(gè)最優(yōu)化的目標(biāo)約束,然后去進(jìn)行伺服的求解控制。但是這種傳統(tǒng)方法對(duì)于場(chǎng)景變化還是有一定的局限性。而熊蓉教授團(tuán)隊(duì)采用學(xué)習(xí)的方法會(huì)發(fā)現(xiàn),它其實(shí)也是非常依賴于數(shù)據(jù)的,如何去讓它真正地具有泛化性?為此,熊蓉教授團(tuán)隊(duì)提出了一種無(wú)模型的方法,能夠?qū)崿F(xiàn)它的端到端的伺服控制,包括能夠去適應(yīng)姿態(tài)的變化、背景的變化,以及能夠去適應(yīng)這種場(chǎng)景的傳感器(例如在應(yīng)用的過(guò)程中不小心把傳感器碰動(dòng)了——它的外參變化了,在這樣的擾動(dòng)下,它是不是依然能夠去適應(yīng)?),以及如何去讓它適應(yīng)各種場(chǎng)景里的紋理。

●   力控插拔

熊蓉教授團(tuán)隊(duì)也做了力控方面的工作,目前實(shí)現(xiàn)了一個(gè)軸孔配合容差小于0.1 mm 的高精度的插拔,用1 h的訓(xùn)練、通過(guò)2 萬(wàn)次測(cè)試后達(dá)到了99.99% 的成功率。相比之下,DeepMind 用8 h,成功率99.98%。而且它具有泛化性,能夠去適應(yīng)不同的接口,包括光模塊、新能源車的充電口以及IT 設(shè)備的USB 口等。對(duì)于這些復(fù)雜的形狀,人的操作也要花很多時(shí)間,而這種機(jī)器人的執(zhí)行速度能夠高于人的速度。

另外,熊蓉教授團(tuán)隊(duì)對(duì)人形機(jī)器人的移動(dòng)和操作的協(xié)作,以及人- 機(jī)的協(xié)作開(kāi)展了一系列的研究。

●   手腿協(xié)調(diào)

今年3 月,在浙江省寧波市政府的支持下,“浙江人形機(jī)器人創(chuàng)新中心”正式啟動(dòng)了,也推出了首代產(chǎn)品——領(lǐng)航者1 號(hào),這是在他們前面的基礎(chǔ)上進(jìn)一步做了一些優(yōu)化改進(jìn)。同時(shí)也更強(qiáng)調(diào)賦予它“類人學(xué)習(xí)”和“操作”能力。

目前行走已完成了在室內(nèi)平整地面的測(cè)試,也會(huì)進(jìn)一步去驗(yàn)證之前在“悟空4”上面所實(shí)現(xiàn)的對(duì)各種地形的適應(yīng)。但是這一代會(huì)更去強(qiáng)調(diào)動(dòng)作的擬人性,例如能否讓它站起來(lái)一點(diǎn)兒,不要老是彎著腿。另外,因?yàn)樵O(shè)計(jì)時(shí)沒(méi)有考慮手會(huì)和腿碰觸,所以在走路的時(shí)候還是把兩個(gè)手舉在那里,來(lái)保證它不會(huì)產(chǎn)生干擾。所以這些都是下一代產(chǎn)品需要去進(jìn)一步優(yōu)化改進(jìn)的地方。

在前面的基礎(chǔ)上,正在思考把熊蓉教授團(tuán)隊(duì)的這種機(jī)理模型和模仿學(xué)習(xí)怎么去結(jié)合起來(lái),能夠快速地實(shí)現(xiàn)。他們過(guò)去還是做的仿真,現(xiàn)在打通了仿真到實(shí)物的這條通路,實(shí)現(xiàn)了從人到仿真到實(shí)物的回路,以期實(shí)現(xiàn)把人的動(dòng)作快速映射到機(jī)器人上面。

另外,現(xiàn)在也正在結(jié)合強(qiáng)化學(xué)習(xí),讓它適應(yīng)各種場(chǎng)景——在執(zhí)行各種動(dòng)作的過(guò)程中,依然能夠保持平衡控制——這還是屬于概念性的,是正在做的研發(fā)。

10)倒水添茶和插插頭

熊蓉教授團(tuán)隊(duì)在前面對(duì)于環(huán)境物體的檢測(cè)識(shí)別以及行為決策規(guī)劃基礎(chǔ)上,做了一個(gè)集成的demo(圖5),它能夠去倒水添茶,包括人喝完以后它能夠自動(dòng)地檢測(cè)到,然后完成添茶的工作。人放回去的茶杯也是可以任意放置的,機(jī)器人會(huì)有算法對(duì)物體進(jìn)行檢測(cè)以后進(jìn)行一個(gè)精確的定位,然后來(lái)進(jìn)行它的行為的決策和規(guī)劃控制。

1743997446416528.png

圖5 端到端的自動(dòng)加水

熊蓉教授團(tuán)隊(duì)也把前述的對(duì)各種動(dòng)態(tài)的適應(yīng)性做了一個(gè)演示,例如機(jī)器人可以去抓插頭,并插到插座上。

插座可以任意地放置,機(jī)器人會(huì)實(shí)現(xiàn)動(dòng)態(tài)的跟蹤。

關(guān)于速度,考慮到定位的精確性,整個(gè)速度還是比較慢的。下一步將會(huì)提高它的節(jié)拍,以滿足生產(chǎn)上的高節(jié)拍要求。

同時(shí),也把作業(yè)的能力通過(guò)跟持續(xù)進(jìn)化結(jié)合起來(lái),從原來(lái)的0.1 mm 的精準(zhǔn)對(duì)接,現(xiàn)在能夠?qū)崿F(xiàn)0.03 mm的對(duì)接(USB 的定位精度在0.1 mm 左右)。這也是通過(guò)自主學(xué)習(xí)的方式來(lái)實(shí)現(xiàn)的。

熊蓉教授團(tuán)隊(duì)也研發(fā)了一個(gè)“靈巧手”,能夠?qū)崿F(xiàn)更快速度的操作,下一步希望能夠去提升其魯棒性。

3   發(fā)展趨勢(shì)與挑戰(zhàn)

真正的人形機(jī)器人要用到實(shí)際的場(chǎng)景里,形成一個(gè)產(chǎn)品,還有很多挑戰(zhàn)。

作為一個(gè)產(chǎn)品,要實(shí)現(xiàn)高可靠、高性能、低成本。

1)亟需高性能、高可靠、低成本的核心零部件

整機(jī)的可靠性需要進(jìn)一步提升,成本要降低,這依賴于核心零部件。核心零部件雖然現(xiàn)在很多,但是還有發(fā)展空間。例如動(dòng)力部件的功率密度與人形機(jī)器人真正實(shí)現(xiàn)靈巧運(yùn)動(dòng)還有一定差距。也許力矩、速度足夠了,但是體積、重量太大,使人形機(jī)器人比較笨重、有一定的威脅感。傳感器也一樣,如何在小體積下做到高精度和高動(dòng)態(tài)響應(yīng),也是面臨的問(wèn)題。

除了產(chǎn)業(yè)界在做,學(xué)術(shù)界也在探索一些新的驅(qū)動(dòng)機(jī)理方法,有可能會(huì)形成下一代變革性的方法。

2)運(yùn)動(dòng)控制

人形機(jī)器人要實(shí)現(xiàn)各種靈巧的運(yùn)動(dòng)作業(yè),運(yùn)動(dòng)控制是一個(gè)非常重要的基礎(chǔ)。

現(xiàn)在已經(jīng)有了很好的基礎(chǔ),各種技術(shù)路線也有突破,能夠去展示一定的能力。但是它對(duì)作業(yè)對(duì)象的適應(yīng)性、環(huán)境的適應(yīng)性還是非常有限的。如何去把機(jī)器人、環(huán)境、任務(wù)融合起來(lái),如何把現(xiàn)在的三條技術(shù)路線真正地去打通和推動(dòng),也依然是需要探索的。

3)人工智能

目前大模型非常熱,但是如果真正把大模型部署到機(jī)器人/ 某一環(huán)境里,會(huì)發(fā)現(xiàn)還有很多局限性。例如端茶倒水的,熊蓉教授團(tuán)隊(duì)也想到用大模型去做,結(jié)果發(fā)現(xiàn)放一套茶具上去,有可能檢測(cè)不出來(lái),哪怕把茶具分開(kāi)了,也檢測(cè)不出來(lái)。

可見(jiàn),現(xiàn)在的大模型依然依靠“見(jiàn)過(guò)”的數(shù)據(jù),有一定的泛化能力,但是距離真正的泛化能力還是有一定的距離。

大模型是人的多元智能里的“基礎(chǔ)知識(shí)”的一部分,它賦予了語(yǔ)言智能、空間智能、邏輯推理的智能。但是機(jī)器人是在一定環(huán)境里去工作的,也是現(xiàn)在AI 提的具身智能(圖6)。

1743997527550876.png

圖6 人的多元智能

實(shí)際上,機(jī)器人專家一直在做具身智能的研究,讓機(jī)器人能夠去適應(yīng)各種環(huán)境條件,自我監(jiān)測(cè),人- 機(jī)自然友好地交互協(xié)作。

之前沒(méi)有大模型時(shí),機(jī)器人專家往往也在把一些AI技術(shù)結(jié)合進(jìn)來(lái),人為定義一些知識(shí)庫(kù)、規(guī)則等?,F(xiàn)在有了大模型,相當(dāng)于給機(jī)器人的專家提供了一個(gè)更好的基礎(chǔ)模型支持。但是這個(gè)模型里還有很多不足,甚至有錯(cuò)誤,如何融合到機(jī)器人里,實(shí)現(xiàn)它真正能夠作業(yè)的具身智能,也是現(xiàn)在要去研究探索的。

同時(shí),相信具身智能的研究也會(huì)反過(guò)來(lái)去推動(dòng)大模型,使其更加準(zhǔn)確。

參考文獻(xiàn):

[1] 迎九.褚君浩院士:人形機(jī)器人的感知發(fā)展與探索.EEPW,2024(6):1-5.

[2] “人形機(jī)器人”的智能感知與控制技術(shù).EEPW,2024(7):22-25.

[3] 工信部.關(guān)于組織開(kāi)展2023年未來(lái)產(chǎn)業(yè)創(chuàng)新任務(wù)揭榜掛帥申報(bào)工作的通知.(2023-9-13).

(本文來(lái)源于《EEPW》



關(guān)鍵詞: 202408 人形機(jī)器人

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉