褚君浩院士:人形機器人的感知發(fā)展與探索
感知能力是機器人智能的一個重要前提。2024 年4月初,“2024 中國人形機器人生態(tài)大會”在上海舉行。大會由中國機器人網(wǎng)和上海智能谷主辦。會上,中國科學院院士褚君浩首先做了“人形機器人感知技術(shù)的發(fā)展與探索”的報告,主要涉及三個方面:①智能時代與機器人,②部分傳感器的研究進展,③人形機器人的感知功能。
本文引用地址:http://2s4d.com/article/202406/459713.htm1 智能時代與機器人
現(xiàn)在人工智能(AI)大模型發(fā)展很快,通過輸入一段文字,就能自動生成相應的視頻。那么反過來行不行?一段視頻能否變成文字,并且由語音播報出來?可能也行。這樣對盲人就很有用處,盲人帶上這種設備,把視頻拍下來并解說出來,盲人就知道周圍的情況了。
最近還出現(xiàn)了腦機接口,這意味著什么?會帶來什么樣的影響?可能帶來很多影響,例如:
1)醫(yī)療能力爆炸。腦機接口技術(shù)有助于精準地調(diào)節(jié)大腦的化學物質(zhì),治療抑郁癥、焦慮癥等心理疾病,甚至在更高級別上控制和優(yōu)化人類的情感。
2)超感官體驗大爆發(fā),人類的感官和認知能力可以得到增強,例如可以直接從大腦接收和傳遞信息,提高記憶力。
AI與動作結(jié)合方面的發(fā)展很快,例如Figure AI公司的機器人,行動可以結(jié)合與人的對話。
可見,現(xiàn)在我們正從信息化時代向智能化時代邁進。智能時代的技術(shù)趨勢有5 個:
1)智能化分布式能源系統(tǒng)、低碳技術(shù)、能源互聯(lián)網(wǎng);
2)智能化復雜體系、AI、智慧城市、ChatGPT、Sora;
3)智能化制造技術(shù)、先進材料、智能化升級傳統(tǒng)工業(yè);
4)智能化診斷、修復技術(shù)、智慧醫(yī)療;
5)腦機接口科學、AI for Science、AI融入物理世界。這5個方面將來有很多工作將由機器人/ 人形機器人取代。
智能化系統(tǒng)涉及多學科,向多領域應用、多方向延展,是科學與技術(shù)交叉推動的。例如同濟大學TJArk( 同濟方舟) 團隊的足球機器人(注:2014-2023年蟬聯(lián)RoboCup中國賽冠軍)“看”得見球,因為有動態(tài)感知的五官;“大腦”能分析球從哪里過來;能采取措施處理球,所以是一種典型的智能化的人形機器人。一些聊天機器人也是如此:可以得到信息,經(jīng)過分析再跟人對話。所以智能化的系統(tǒng),諸如AI賦能的工業(yè)機器人、服務機器人、下棋機器人、手術(shù)機器人、ChatGPT、Sora等都屬于智能機器人。
2 部分傳感器的研究進展
傳感器有很多種,諸如光、聲、電、磁、熱、機械、化學傳感器,將來這些傳感器有望安裝到人形機器人上。因為人形機器人和機器人一樣,要有信息感知,此外,還有大腦分析,最后還要有控制。
現(xiàn)代信息傳感器很豐富, 例如紅外、紫外、x 光、γ射線、壓力、振動、聲響、電磁、化學、生物、單光子等,同時還有多頻譜范圍的傳感技術(shù)。還要發(fā)展單細胞、單分子、單原子、單光子信息傳感技術(shù)。
有了傳感器以后就得到了大數(shù)據(jù)。大數(shù)據(jù)是做分析的基礎。AI的三個核心要素是數(shù)據(jù)、算力、算法,可見首先要有數(shù)據(jù)。而數(shù)據(jù)是靠傳感器得到的,不是文本大數(shù)據(jù),而是傳感器實時采集的數(shù)據(jù),可見傳感器至關重要。
2.1 慧眼—光學傳感器
從光學/ 紅外的角度來看,要做慧眼——能夠全天候拍照,非接觸測溫,通過光譜設備,最終希望能有孫悟空、二郎神那樣的慧眼。
以電磁波家族的重要一員——紅外線為例,紅外傳感器有兩種形式:光熱型,光子型。這兩種形式有三大功能,圖像(空間分布),熱像(溫度分布),譜像(光譜分布)。
1)圖像。特點是可以在黑暗背景中識別圖像,因此可以全天候拍照。在安檢時,可以穿過人體,看人身上是否攜帶違禁物品——盡管x 光也可以做這件事,但是紅外線對人體沒影響。最近發(fā)生的俄烏戰(zhàn)爭,也用到了紅外制導。
如果紅外傳感器放在氣象衛(wèi)星上,就可以白天和夜晚“看”到風云變化,使氣象預報/ 臺風預報很準確。例如我國的“風云4 號”氣象衛(wèi)星具有寬光譜探測分析系統(tǒng),可在3 萬6 千公里外對大氣層實現(xiàn)高精度溫度、濕度參數(shù)的垂直結(jié)構(gòu)觀測,相當于對大氣層進行CT掃描。
2)熱成像。因為對溫度測得非常準確,而且是非接觸式的,可以穿過煙霧,探測火焰溫度分布。還可以發(fā)現(xiàn)夜里哪里有排污泄漏,哪里有電路短路,哪里的電子元器件失效了。
例如2019年巴黎圣母院失火,我國大疆公司制造的兩架無人機進行了輔助觀測,由于上面有紅外相機,精準地“看”到哪里著火,從而幫助高效地把火苗滅掉。
3)譜像。光譜特征像指紋特征一樣——每個人的指紋不一樣,不同的材料/ 物質(zhì)的光譜也是不同的,因此可以識別很多材料。
就像我們采集指紋一樣,首先要做好數(shù)據(jù)庫,然后就可以分析了。例如稻田的畝產(chǎn)可以達多少斤,通過光譜收集后,跟數(shù)據(jù)庫一比對就可以預判。找礦也可以采用同樣的方法,例如找鈾礦,首先讓無人機飛過,采集的光譜與鈾礦的數(shù)據(jù)庫進行對比就可以了。這種探測方法還可以用在月球和火星的勘探上——月球車和火星車上放了紅外探測器,能采集光譜,就可分析星球表面的成分。
在生活中,這種“慧眼”的應用場景很多,例如“看”衣服的材質(zhì),知道衣服的棉、麻、滌綸等的比例。如果把目標對象改成人體,可以看到人體器官的結(jié)節(jié),用于病理診斷。
機器人上也可以裝上各種傳感器,來獲得人行動的一些信息,例如對抑郁癥的診斷,通過瞳孔、腦電、表情、行為等影像來判定抑郁癥的嚴重程度。例如北京理工大學醫(yī)學技術(shù)學院的胡斌教授團隊做了一種小設備“精神狀態(tài)評估與干預系統(tǒng)設備”,如果這種小設備放在人形機器人上,可以邊走邊看周圍的人是否患有抑郁癥,如果有,嚴重程度如何。
2.2 狗鼻子—化學傳感器
現(xiàn)在還有氣體傳感設備,例如氣體分子傳感器可探測沙林毒氣與炸藥。通過熒光猝滅效應,正常時可發(fā)出熒光,但是如果有TNT,熒光就猝滅了,用這個原理可以做成TNT 報警器。有 時狗不能發(fā)現(xiàn)炸藥,但是用“狗鼻子”產(chǎn)品來一照就能發(fā)現(xiàn),這種“狗鼻子”可做得很小。這種嗅覺也是非常重要的。如果人形機器人能夠有嗅覺,將非常有用。所以嗅覺現(xiàn)在也是一個研究的熱點。
3 傳感器賦能機器人/人形機器人
智能時代的機器人要有4 種模塊:環(huán)境感知模塊,智能芯片模塊,運動控制模塊,操作系統(tǒng)模塊。
環(huán)境感知就是靠傳感器。所以真正的人形機器人應該能夠具有人的五官的特點,能夠感受圖像、壓力、聲音等。例如機器人被人推一下,能馬上站穩(wěn),說明上面有傳感器。如果觸碰它的手,它應該有觸覺反應。
傳感器有很多種。
1)力矩傳感器。
2)觸覺/ 壓力傳感器,其中有壓阻型、壓電型、壓容型的、摩擦電型。MEMS 壓力傳感陣列已成熟,柔彈性的電子皮膚正在新興發(fā)展。
所以人形機器人中,非常重要的是要研究它的元部件及功能,每個元部件都要研究的水平很高,再集成起來功能就強大了。例如上海大學自主設計并異質(zhì)集成出首款基于氧化物TFT 的64 通道肌電傳感器陣列,實現(xiàn)了高信噪比(37.5 dB),多通道手勢識別率高達97.4%,可以用在假肢上。
3)視覺傳感器。可以有激光雷達、深度相機、雙目視覺,研究的熱點有感算一體、仿生感光、低功耗芯片,市場規(guī)模非??捎^,預計國內(nèi)2025 年有347 億元,在國外有1276 億元的市場規(guī)模。
4)慣性傳感器:加速計+ 陀螺儀是測量加速度、角速度、傾斜角度的重要方法??梢赃M行姿態(tài)控制,是雙足行走的關鍵部件。集成磁傳感器進行定位,發(fā)展了慣導傳感器。機器人中需要多個這類傳感器,但產(chǎn)品主要被國際寡頭壟斷,我國頭部企業(yè)在全球市場的份額不足2%。
人形機器人里需要大量的傳感器,需要產(chǎn)學研結(jié)合,把每個部件都能研究好,而且做出來。
進博會有很多機器人的應用案例,例如2022 年美敦力做的機器人輔助手術(shù)系統(tǒng),波士頓科學做的植入式腦神經(jīng)刺激系統(tǒng),愛靈必的仿生手,還有歐姆龍第七代乒乓球教練機器人等。在AI 方面,2019 年英飛凌推出了Roboy機器人,具有聽視覺和感知的神經(jīng)網(wǎng)絡系統(tǒng),德國卡赫的AI智能清潔機器人,還有蔡司的數(shù)字導航手術(shù)顯微鏡ARTEVO 800,2021 年強生推出的數(shù)字化手術(shù)平臺等很多數(shù)字化手術(shù)平臺。
機器人/人形機器人的發(fā)展方向是要有一定的場景應用,把核心、基礎的元器件要做好,然后進行集成。場景可以是“服務機器人+ChatGPT”的方式。例如“掃地機器人+ChatGPT”對話,也許很受歡迎,因為我國是老年社會,年紀大的人養(yǎng)條狗很麻煩,買個機器人,只要價格在1 萬~10 萬,生意可能很好。
醫(yī)療機器人的用途更多,可以是手術(shù)機器人、康復機器人等。
教育機器人:家長買回來以后,小孩不用去培訓班了,它跟小孩說話,幫助小孩學習,一道題做錯了,知道小孩哪些知識點沒掌握好。
所以產(chǎn)品一定要和場景結(jié)合。再例如,消防員的工作很危險,汽車制造廠的噴漆工作辛苦,希望由機器人替代。消防員機器人的“衣服”不怕火燒,眼睛是紅外的,在煙霧里能知道火源在哪里,而且在煙霧里也能看見人。
人形機器人有三大支柱:感官- 識別,大腦- 分析,四肢- 行動。需要把這三大方面的元部件做好,然后把感知、分析、行動融合,集成到人形機器人里。但是不可能做成一個完人——像我們?nèi)艘粯樱芟孪笃?,回到家里還能燒飯燒菜——這是完整的智能。人形機器人希望先做成部分智能,能做好一兩件事。
1) 程序化人形機器人,從單一的功能擴展到多功能。
2)智能化人形機器人,從單一智能發(fā)展到多智能。要發(fā)展場景牽引的動作與對話相結(jié)合的智能化人形機器人,例如家務機器人、教學機器人、消防員、交通警、士兵、值班員、駕駛員、操作員、乒乓球教練等。如果針對某一場景,只具有一種功能,就會帶來可觀的市場需求。所以機器人行業(yè)在未來的智能時代里將是非常主流的行業(yè),會有許多商業(yè)發(fā)展的可能性。
4 結(jié)束語
我國非常重視機器人/ 人形機器人的發(fā)展,舉辦生態(tài)大會可以促進元部件/ 硬件、軟件和集成的參與者交流。期望在未來幾年里,通過“政產(chǎn)學研用”五個方面的結(jié)合,把機器人/ 人形機器人這個巨大的產(chǎn)業(yè)機會/市場做得非常好。
(本文來源于《EEPW》2024.6)
評論