本土人形機器人企業(yè)如何熬到爆發(fā)的那一天?
2024 年4 月初,“2024 中國人形機器人生態(tài)大會“在上海舉行,主辦單位是中國機器人網和上海智能谷。會議期間舉辦了一場圓桌論壇,來自業(yè)內的學者和企業(yè)家共同探討了人形機器人的動向、定義與應用等熱點話題。
本文引用地址:http://2s4d.com/article/202405/458684.htm圓桌參與者(從左到右)如下。
主持人:科大訊飛人形機器人首席科學家 季超
嘉賓:哈工大機器人研究所所長 趙杰
宇樹科技聯合創(chuàng)始合伙人 陳立
帕西尼感知創(chuàng)始人 許晉誠
樂聚機器人創(chuàng)始人 冷曉琨
錢江機器人首席科學家、副總經理 孔民秀
主持人:
季超(科大訊飛):在最近不到一年的時間里,人形機器人發(fā)展火爆,各類樣機橫空出世,連帶各種核心器件的上下游產業(yè)鏈急速升溫,整個產業(yè)鏈和資本都沸騰了。
面對人手一臺機器人的宏大愿景,讓機器人最終走進每個家庭,機會在哪?誰來買單?如何落地?這是今年業(yè)界最關注的事,即:如何熬到爆發(fā)的那一天?本次圓桌論壇邀請了行業(yè)大咖來談一談。
1 今年的市場變化
主持人:請各位結合自身的實踐,分享一下今年機器人領域的一些市場狀況和變化。
陳立(宇樹):可以從兩方面來探討。
● 產品層面。人形機器人從以前到現在,產品已經逐步成熟,現在又有大模型的加持,未來能夠去做的事情會越來越多。因此可以預期未來的市場足夠大,天花板足夠高。
人形機器人的市場是動態(tài)發(fā)展的,從原來的偏研究型,到現在逐步去做一些行業(yè)應用。一開始肯定是在工業(yè)場景/ 能源行業(yè)等相對固定的場景中去做一些應用的落地,未來人們非常向往的是進入千家萬戶的場景。相信未來將是千億級甚至萬億級的市場。
● 現在身體跟不上大腦的發(fā)展
許晉誠(帕西尼):無論是去年還是今年,我們的身體已經跟不上腦子了。目前做硬件的,或者是我們這種做機器人本體或做核心零部件的企業(yè),需要更加把勁地把集成化做得更好。
因為目前大語言模型的發(fā)展速度十分迅猛,可能今年底或明年,GPT 第六代(GPT-6)又該推出了。現在這種模型套用起來,可以很接近具身智能的使用邊界了。
因為身體跟不上腦子的發(fā)展,所以我們一定要更大力地去發(fā)展硬件設備。相信這也是我國政府看到的情況。作為工業(yè)強國,先進制造強國的中國,我們一定要把握住這個機會。
● 客戶認知的變化:從為什么需要,到怎樣應用落地
冷曉琨(樂聚):談到人形機器產業(yè)化或者社會熱度這個問題,樂聚團隊有一個比較切身的感受。樂聚是2016 年由10 位哈工大師兄弟成立的公司,當時的目標很簡單,就是做雙足人形機器人。所以當時從30、70cm做起,到2018年做1.6m機器人時,一直堅持做雙足人形機器人。但是在2023年之前的6年時間內,人形機器人在社會上是一個極冷門的賽道,產業(yè)化融資很少,并且每次向人們講解人形機器人的時候,需要論證為什么人形機器人可以。而從2022 年10 月到現在火爆之后,樂聚更多的是論證人形機器人接下來怎么做才可以。這個變化就代表了人形機器人在社會上的認知的變化。
并且以前做報告的時候,要不斷地向人們科普人形機器人的核心是兩條腿走路,拋開這個就不是人形機器人;并且不要總是關注讓機器人去跳舞這件事。但現在大家都關注具身智能的產業(yè)鏈,人形機器人的場景布局。從這一系列變化,就能感覺到從2016 年到2023 年這7 年時間,人形機器人產業(yè)的一個質的變化。
● 關注智能廚房應用
孔民秀(錢江):錢江剛開始時做工業(yè)機器人,后來又往人形機器人方向發(fā)展。
因為愛仕達(錢江的母公司)是做餐飲廚具的,未來將向智能廚房方向發(fā)展,因此錢江認為人形機器人在此有很大的市場前景。
錢江考慮的人形機器人是結合了工業(yè)機器人和半人形機器人的特點,不一定是全人形的,可能是用于廚房里的,像英國做過用雙手炒菜、洗碗或進行局部活動的機器人。
2 發(fā)展中遇到的問題
主持人:中國發(fā)展人形機器人產業(yè)有哪些重要的機遇?
● 應多關注上半身的發(fā)展
趙杰(哈工大):人形機器人現在很火,社會各階層期待很高,但是這種技術的突破難度也很大,真正的場景落地還看不見邊兒。
建議我們應多關注上半身的發(fā)展。
我們過多地關注了機器人“人形“這兩個字,即過多關注了腰下面的兩條腿了。恰恰相反,我們真正關注的應該是什么?是上半身,包括腦袋、兩個臂和手。為什么?有個形象的例子,來看看肢體殘疾人,霍金從脖子往下全癱了,有再好的大腦也沒什么用(注:全球可能唯一沒有廢掉的人就是霍金了);而兩條腿走得再好,沒有雙臂,是不是也殘廢了?但下肢不能走、上肢健全的,基本可以生活自理,甚至還可以服務社會。這個簡單的例子說明了什么?機器人的核心是6 個字:提質、增效、代人,代人是第三位的。如果這個人形機器人走得再好,但做不了一些技能性的工作/ 代替人的工作,是沒有市場的。
所以我們要關注上身,下身/ 腿只是運動的一種方式。不同的場合應該有不同的運動方式。我們總認為應該像人一樣:人已經進化得很好了,為什么還有自行車、汽車、飛機?用途是不一樣的。所以我們更應關注雙手。
● 如何定義“人形機器人”
主持人:機器人標準組最近在定義國標的人形機器人,趙杰老師(哈工大)也參與其中。那么,什么叫真正意義上的人形機器人?這個標準如何跟其他機器人做區(qū)分?是否可以理解成把“操作”這種帶有人類特殊屬性的特點放在里面?
趙杰(哈工大):我也在標準委員會里。你說的我很贊成。但是我有一點自己的看法,不一定對:“人形”這個詞起得挺好的,但是如果把“人形”作為一種仿生的概念來看,就像人幻想著要飛起來,從古代就有很多人有這樣的想法,但是最后哪個人是帶著翅膀飛的?往往是采用固定翼、旋翼方式飛。所以仿生不代表原原本本地去模仿,因為有時它不具有實用性。
所以我向標準委員會的建議是:先不要談標準是什么,先把人形機器人定義好。不能把人形機器人定得很狹義。狹義了以后,帶來整個導向性的事情會把整個產業(yè)帶偏了。
冷曉琨(樂聚):我很贊同趙老師的意見。因為2023 年年初時,科技部委托機械總院請孫立寧老師(俄羅斯工程院院士)寫人形機器人的白皮書,當時白皮書中有一個很爭議的點,就是到底叫人形機器人還是仿人機器人。我個人傾向于仿人,因為并不是外觀像人就行了,很多行為特征,例如外貌,甚至皮膚、經驗、數據等,都要像人。其實人形只是一個外觀。但是那時媒體、社會都叫“人形機器人”。如果我們硬叫“仿人機器人”,會產生誤解。所以后來定義人形機器人或仿人機器人時,就沒法單獨從外觀上去給它一個定義,要從工作經驗、各種行為綜合地去討論。
許晉誠(帕西尼):我是從日本留學回來的,對日文是很熟悉的,日本也是一個用漢字的國家。在上世紀五六十年代,在日本就有“人形機器人”這個詞了,所以很有可能后來國內套用這個日本漢字了。因為我國的一些專業(yè)人員十分關注日本機器人的研究論、方法論。
● 是顛覆性的技術嗎?
趙杰(哈工大):有人稱人形機器人是個顛覆性的技術,我并不這樣認為。人形機器人可能是整個機器人行業(yè)中的一個新增長點,但它絕不是顛覆性的。即人形機器人干得再好,工業(yè)機器人還會存在的。因為人形機器人的工作性質已經決定了:對于那種大批量、需要高效生產的作業(yè),還得是工業(yè)機器人。這是回避不掉的。
● 本體廠商的突破點
主持人:目前人形機器人在發(fā)展過程中有哪些需要突破的?
陳立(宇樹):宇樹、樂聚等是本體廠商。本體廠商現在也面臨了一些問題,例如人形機器人的自由度非常多,整機的可靠性和穩(wěn)定性是急需解決的第一個問題。
第二個問題是成本。如何把成本降下來?因為人形機器人最終要有手機、白色家電等產品類似的價位,才能進入千家萬戶,即要買得起。
第三就是智能化。因為人們經常會把機器人公司和人工智能公司兩個概念放在一起,但實際是有區(qū)別的,是兩個完全不同的發(fā)展方向:機器人公司更多的還是做本體,即小腦/ 運動控制的相關研究和生產。而人工智能公司主要還是做大腦層面的感知和決策,包括語義、場景的識別和認知,以及難度很大的對于任務的拆解。但今后的突破點是二者的融合,即機器人公司和人工智能公司的技術產品怎么去融合?怎么實際用起來?這是未來最難的一件事情。
● 正在形成國產化產業(yè)鏈
冷曉琨(樂聚):2018 年樂聚第一臺諧波的大原型出來后一周多,總理來公司考察,他的一個問題是:這里面哪些是國產化的?我回答說,除了鈑金件外,其余全部是進口的,例如來自以色列、德國、日本、美國的。但是到現在,即“夸父”出來之后,去年11 月到現在賣的這幾十臺,除了主控之外,全部已經實現了國產化,甚至我們自主研發(fā)了。
這其中的核心不是某家公司有多強,而是因為中國整個產業(yè)鏈足夠成熟。整個社會重視了,就好解決產業(yè)鏈問題了。中國產業(yè)鏈也是人形機器人發(fā)展的一個足夠優(yōu)勢。
第二,關于數據集,剛才趙杰老師(哈工大)說得很對,最終的核心是兩只手介入物理世界去完成任務,而按照現在的這種大模型/ 智能范式,數據驅動各種數據集需要以場景來引導獲得這些數據,而中國目前是機器人使用場景最齊全的國家,這對于我國在做人形機器人獲取數據方面是最方便的。所以無論是從上游的產業(yè)鏈,還是下游的使用場景的數據獲取來看,相信我國做人形有很大的優(yōu)勢。
孔民秀(錢江):我國在做人形機器人、工業(yè)機器人的時候經歷了幾個階段,從工業(yè)機器人、醫(yī)療機器人、協作機器人,現在又跳到了人形機器人,這幾類產品的背后是有深層次的邏輯關系的。
第一,樂聚、宇樹等一直在做人形機器人,錢江原來是做工業(yè)機器人的。實際上,在以前是完全不同的技術層面。從發(fā)展階段來看,中間有一個階段大家沒有提到,就是復合機器人,是由機械臂進行局部運動,現在加上輪式或者是腿,可以讓機器人從小范圍變到較大范圍的移動,擴大了機器人的運動范圍。
第二,現在業(yè)界熱衷做人形機器人,可能是源于馬斯克提出的人形機器人將來要做到2 萬美元以下刺激的。人形機器人有幾個特點,第一個特點是源于需求,現在工業(yè)機器人和其他移動機器人在幾個方面不盡人意:①智能,現在很多產品設備需要智能,但智能不太令人滿意。不過,隨著ChatGPT或者生成式人工智能的爆發(fā),智能進程大大提前了,是人形機器人發(fā)展的基礎。②原有機器人的動作/ 操作比較僵化,不夠靈活,尤其是現在,例如拋光、打磨、裝配等應用,采用機械臂加上復雜的手法現在還不能滿足需求,所以人形機器人可能是一種解決方案。馬斯克也提到把機器人用在汽車制造方面的構想,而且做的也讓人們看到了希望。③應用的場景。從馬斯克規(guī)劃來看,其應用場景是比較完善的,首先,可能為了星際探索/ 往火星上去的時候,用人還是很危險的,就用人形機器人去代替,執(zhí)行很多動作或任務。其次,源于一些瑣碎復雜的工作。所以有些日常生活,人們對人形機器人可能有需求。這幾點驅使人們向人形機器人方面去做。
3 哪些場景會率先落地
主持人:我們要讓機器人用起來,例如按照1~3 年或更長期的維度來劃分,人形機器人有望在國內的哪些場景率先實現商業(yè)化落地?
趙杰(哈工大):目前能夠看到的,最早能夠突破的還是一些工業(yè)場景,不會是家庭。別看很多人希望能用于家庭場景,實際上很難。
人形機器人能夠率先能在工業(yè)場景上用,主要有兩點,第一,我們人在工業(yè)場景中應用,90% 甚至更多是靠工具,靠人用工具來完成任務。那么在靠工具的時候,我們希望 “快換”。機器人不一定是五指手,就可以通過快換工具勝任很多的作業(yè)。但是要在家庭場景或者這種服務場景就麻煩了。例如在家里疊衣服,有專用的工具嗎?第二,還是強調這句話:千萬不要小看人的雙手。如果要做到實用,雙手比兩條腿難得多。至少目前市場上所做的仿人的靈巧手,成本先不考慮,僅從實用性來看,真正能去做非常靈活精細的工作還很難。第三,越是需要手的時候,越需要智能。技能型作業(yè)是需要智能的。人形機器人為什么能在工業(yè)場景上快速應用?因為在工業(yè)場景,有一些只是場景上的識別,做的還是工業(yè)機器人可能做到的事情,因此在工業(yè)場景能率先突破。在服務家庭業(yè)服務業(yè),可能還有一段路要走。
陳立(宇樹):能源行業(yè)的巡檢操作也是最近幾年人形機器人能夠落地的一個場景。因為能源行業(yè),例如電廠、變電站,包括煤炭、石油、化工相關的工廠,場景相對比較單一,因此干擾因素較少,任務也相對比較固定,例如查看儀表、按按鈕/ 開關等。在這種相對固化的場景中,人形機器人可以在未來幾年逐步落地,這里還是強調逐步地去做探索和落地,不是一蹴而就的。家庭場景可能要一分為二地去看。因為家庭涉及的任務實在是太多了,而且盡管是同一個任務,今天疊被子和明天疊被子,可能面臨著不同的場景。另外,在不同的床上去疊,或者不同的房間里的衣服以及衣服堆放的方式不同,以及衣服或被子的厚度等不同……它們的環(huán)境不確定性是非常之高的,所以難度非常大。當然,預計未來人形機器人會進入千家萬戶,但是這個過程是非常漫長的。
對于宇樹公司,從2016 年宇樹成立之后,會有不同的工業(yè)場景的需求找過來,每次有場景找過來之后,關于移動,宇樹就要問客戶:為啥不用輪式的、履帶的、四足的狗、無人機?這一系列都不用的時候,才有可能是雙足/ 兩條腿可能要用到的時候,才是人形機器人在工業(yè)場景里需求的落地點。
在手臂方面,在常規(guī)的工業(yè)場景里,2 個自由度的機械臂就可以抓一瓶水,因為這是往復性工作,沒必要上一個30 自由度的,效率、成本全部都會上來。但是我們一直在工業(yè)里探討到底哪些是人形機器人的應用場景,探討下來還真有不少,包括核電站等特種應用,包括最近在提的汽車組裝廠,確實有很多場景目前只能是人形機器人。
關于體量,雖然相對于整個工業(yè),人形機器人的體量還很小,但是對于整個人形機器人市場來說已足夠,甚至足夠支撐這么多人形機器人公司上市,它的體量還是很大的。所以我們現在也在布局。這也是人形機器人近期來進入產業(yè)最快的一個路徑。但是從國家戰(zhàn)略來看,人形機器人這一波好像不是為了進工業(yè),然后挑了這么大的一個熱鬧場子來做這件事情。
關于這一波人形機器人的熱潮,就回到一個最初的問題:這一波為什么爆發(fā)的是人形機器人?
從國家層面來看,引子是馬斯克做人形機器人這件事情。為什么之前的Atlas(波士頓動力公司的人形機器人)那時候沒火起來?一個核心原因是馬斯克講的故事很誘人:最終人形機器人進入到家庭。如果這個故事一旦成真的話,它就是手機、智能汽車的下一代,代表了下一代的智能產業(yè),
但是關于進入家庭這件事情,雖然現在有了大模型,有了具身智能,讓人們看到曙光,覺得這件事情肯定能成,只是時間的問題。但這時間是3 年? 5 年?人們沒有一個共識。
宇樹現在開始與一些家電公司合作探索進入家庭的產品,但是當前階段真正讓人形機器人能夠進入到實際場景中的應該是一些特殊的工業(yè)場景。
許晉誠(帕西尼):應用場景方面,主要會在工廠里,因為目前在工廠里,最終還是由人來組裝產品。人形機器人要去取代人,就要干跟人很像的工作。在工廠里,人干的事情基本上是按照SOP (standard operation procedure,標準操作規(guī)程)。這可以讓機器人非??焖俚厝ミm應,因為SOP 是按照步驟來進行的。
所以像趙杰老師(哈工大)說的,在工廠里肯定是第一步,而且可以非??焖俚厝崿F。陳立(宇樹)提到在家庭里,因為是開環(huán)的——所有的環(huán)境都是不可預測的,有時你的小狗可能在無意間移動了某些物品,建模的環(huán)境就變了,等等,非常具有挑戰(zhàn)性,所以并不是在家庭里的任務有多難(注:當然對柔性物體的把持還是很有難度的),而是對于復雜環(huán)境而言太難了。工廠里大部分擺放是固定的,在家庭里面就不太一樣。
所以總的來講,還是贊成二位的一個看法,第一步肯定是工業(yè),之后逐步地走到家庭。但是希望陳立(宇樹)可以樂觀一點,不用三五年,能不能今年或者明年?
4 本土企業(yè)的優(yōu)勢?
陳立(宇樹):中國企業(yè)的優(yōu)勢非常大。從產業(yè)鏈來看,我國把人形機器人的產業(yè)都囊括在內了——我們自己可以生產核心零部件,自己做整機。從整體應用來看,我國的應用場景的寬度和縱向深度遠遠大于海外其他國家和地區(qū)的。
5 人形機器人的售價?
主持人:未來人形機器人如果能夠進入到工廠/ 能源行業(yè),它的硬件售價大概是多少會比較合適?
陳立(宇樹):這是人們比較關心的問題,因為最終決定了能否大批量推廣。
可以一分為二地去看。首先,這個機器人產品所對應的場景的解決方案是什么?機器人的市場價應該要跟一名工人1~2 年的工資齊平,即機器人本體的價格要控制在20 萬甚至10 萬元人民幣以內,最好是在10 萬元人民幣以內。
同時,針對一家工廠,例如電力、石油、煤炭、化工等某個場景,再定制一套相應的解決方案,即增值服務,價格可以控制在小幾萬~10 萬。所以整體打包的方案控制在20~30 萬元以內。簡單地概括,還是算人工成本,相當于2~3 年一名工人的工資,才可以去覆蓋掉人形機器人的采購成本。
許晉誠(帕西尼):假設這種機器人已經大量生產了幾千萬臺,它最終會論斤賣。
冷曉琨(樂聚):人形機器人的定價本質上和新能源車前幾年的爆發(fā)性質一樣,就是讓工廠算得過來賬。這時就需要一個就跟新能源汽車早期類似的推廣模式,新能源汽車早期用戶算得過來賬的原因并不是車廠把價降下來了,是因為國家補貼引導進去的??赡苋诵螜C器人早期如果進工業(yè)、進產業(yè)的話,依然也是需要國家的政策/ 單臺的成本補貼才能起來的。
6 技術突破點
孔民秀(錢江):這一波的人形機器人熱潮,更主要的是要解決技術突破的問題。剛才大家都說了,一個是機構要解決,例如手爪怎么靈活,手爪如何用最少的自由度,以及控制精度和材料等,因為不像工業(yè)機器人,我們做一個工業(yè)機器人提一個6 公斤的東西,本體最輕也要將近100 公斤——這是不能做人形機器人的。但是現在人形機器人的協作臂(有一段時間此話題特別火熱)輕,動作太慢太柔,精度又差。所以現在技術的突破還是很重要的?,F在技術、材料、機構、驅動,以及整個自由度的配置、整個結構設計機構學方面的技術,還是要去做的。
這波熱潮可能主要是要解決這些核心的問題。這只是機構上的。但是,還有一些算法、頂層的控制,以及智能方面也是需要突破的。
前期要突破上述這些。突破了之后,才能談到走向應用和市場。
后來者怎么做?因為前面的產品就放在那兒,就跟蘋果手機已在那似的,你跟蘋果對比,你要有競爭力。
7 結束語
主持人:盡管新技術進展相對比較樂觀,包括現在國內在面向一些應用場景,但沒有一款機器人可以實現真正的量產,包括目前國外最熱捧的特斯拉、Figure 01等,還是在探索階段、實驗室階段,真正走向商用還需要更長的時間,可能還需要國家出臺政策支持。
現在的機器人可能還無法具有像人一樣的核心能力,例如自主感知、決策行動的能力。
過去機器人其實都是從小腦往下做,但是大模型的突破在某種意義上給機器人裝上了一個大腦。所以工信部去年發(fā)布的《人形機器人創(chuàng)新發(fā)展指導意見》,也是從大腦、小腦、本體這三維度來規(guī)劃發(fā)展國內人形機器人產業(yè)方向的。
人形機器人最終還是會用起來。首先,我們要定義好人形機器人的范圍,不能過于狹隘。它一定要有應用落地場景。
技術挑戰(zhàn)方面,智能化的水平,算法的能力,數據目前還不太夠。機構設計需要提升,包括整體的本體、關鍵器件等。
此外,成本也依然是一個挑戰(zhàn)。我也傾向于跟許總(帕西尼許晉誠)一樣的觀點,可能不用3~5 年,可能今年就可以商業(yè)落地。
(本文來源于《EEPW》2024.5)
評論