博客專欄

EEPW首頁 > 博客 > 開門、拉閘一氣呵成,這只AI機器狗「有點東西」

開門、拉閘一氣呵成,這只AI機器狗「有點東西」

發(fā)布人:機器之心 時間:2022-08-14 來源:工程師 發(fā)布文章
多虧昇騰 AI 的助力,我們才能看到這么穩(wěn)的「機器狗巡檢員」。

自上世紀「機器人」概念被提出以來,人們就對各種形態(tài)的機器人產(chǎn)品寄予厚望。在普通人最初的想象中,機器人能和我們聊天,幫我們打掃房間、端茶遞水,甚至能幫我們駕駛車輛……
直到近年來大數(shù)據(jù)技術(shù)、人工智能專用芯片、人工智能算法突飛猛進,智能機器人才真正進入增長爆發(fā)期,讓我們有了「夢想照進現(xiàn)實」的感覺。
從爆火的四足機器狗,到初具雛形的人形機器人,眾多先進的機器人產(chǎn)品開始走進人類社會生活的方方面面。當然,除了生活服務(wù)之外,機器人也正在積極打入廣闊的產(chǎn)業(yè)場景:物流分揀、農(nóng)業(yè)上的噴灑采摘、巡檢救援,都是機器人可以貢獻價值的空間。
在近日的 2022 昇騰 AI 開發(fā)者創(chuàng)享日 · 南京站活動中,我們見到了這樣一只超級靠譜的「機器狗巡檢員」。熟悉機器狗產(chǎn)品的朋友會發(fā)現(xiàn),它就是當年央視春晚后臺拉盒飯的「網(wǎng)紅打工機器狗」。來自宇樹科技 Unitree,在華為昇騰 AI 加持下,現(xiàn)在的它變成了「機器狗巡檢員」。
當無人值守的電站發(fā)出警報,是它熟練地捏住把手,并且果斷打開了門:

圖片


接下來,它一頓操作,邁過地面的臺階障礙,精準地拉下了電閘。至此,警報解除:

圖片


這位「機器狗巡檢員」來自昇騰 AI。你可能已經(jīng)發(fā)現(xiàn)了一些特別之處——它有一支威風(fēng)凜凜的「機械臂」。
那么,這只機器狗究竟是如何打造的呢?它的機械臂又有什么妙用呢?
走近這位「機器狗巡檢員」
一般來說,要想讓機器狗在真實世界中圓滿地完成任務(wù),主要挑戰(zhàn)就在于運動控制。眾所周知,人類的運動是由中樞神經(jīng)系統(tǒng)控制的。其中大腦的運動皮質(zhì)和運動前皮質(zhì)負責自主運動的計劃和執(zhí)行,基底神經(jīng)節(jié)和小腦負責調(diào)節(jié)運動皮層神經(jīng)元的反應(yīng),幫助協(xié)調(diào)、運動和平衡。
對于機器狗的運動控制來說,AI 處理器就相當于「大腦」,負責任務(wù)決策、感知識別、導(dǎo)航規(guī)劃等功能的實現(xiàn)。
傳統(tǒng)機器狗運動控制算法存在建模復(fù)雜、開發(fā)耗時長、高度依賴經(jīng)驗等局限性,近年來,很多研究者開始將強化學(xué)習(xí)應(yīng)用到實體機器人上,增強機器狗的環(huán)境適應(yīng)能力。比如這一次,華為就使用了「Teacher-student」策略進行機器狗運動控制算法訓(xùn)練。

圖片

使用「Teacher-student Policy」完成機器狗運動控制算法訓(xùn)練
具體而言,Teacher 部分通過強化學(xué)習(xí)訓(xùn)練一個最優(yōu)的參考控制策略,它能獲取完美的特權(quán)信息(如地面摩擦系數(shù)),讓機器狗能在隨機生成的地形上遵循期望的速度指令行走;Student 部分通過監(jiān)督學(xué)習(xí)把 Teacher policy 蒸餾成一個 Student policy,它在帶傳感噪聲的環(huán)境中訓(xùn)練,且只能獲取真實機器人能得到的傳感器信息。最終,團隊將訓(xùn)練好的 Student policy 部署在真實機器狗上。
為了讓機器狗在更多的應(yīng)用場景中「發(fā)光發(fā)熱」,華為還給機器狗加了一條「AI 機械臂」。有了這條機械臂之后,它 的動作技能直線飛升,不僅可以輕松開門,還能平穩(wěn)地跨越地面障礙:

圖片

開門

圖片

跨越地面障礙
可以想象,打造這樣一只機器狗所需的工作量是巨大的。在 8 月 11 日的 CANN 訓(xùn)練營直播中,華為對這款復(fù)合型機器狗背后的研發(fā)進行了解密。
在解密過程中,團隊特別提到了華為自研的神器:CANN。
昇騰 AI 是以昇騰 AI 基礎(chǔ)軟硬件平臺為基礎(chǔ)構(gòu)建的人工智能計算產(chǎn)業(yè),昇騰 AI 基礎(chǔ)軟硬件平臺包括 Atlas 系列硬件及伙伴硬件、異構(gòu)計算架構(gòu) CANN(Compute Architecture for Neural Networks)、全場景 AI 框架昇思 MindSpore、昇騰應(yīng)用使能 MindX 等。CANN 是華為針對 AI 場景推出的異構(gòu)計算架構(gòu),旨在通過提供多層次的編程接口,支持用戶快速構(gòu)建基于昇騰 AI 平臺的應(yīng)用和業(yè)務(wù)。
作為昇騰 AI 全棧的核心,CANN 對上支持多種 AI 框架,對下服務(wù) AI 處理器與編程,承擔著承上啟下的關(guān)鍵作用。
經(jīng)過 3 年多的優(yōu)化,CANN 已經(jīng)迭代到 5.0 版本,實現(xiàn)了性能的大幅提升。目前,CANN 全面支持業(yè)界主流框架,Model zoo 已經(jīng)包含超過 500 個經(jīng)過調(diào)優(yōu)的模型,以及 1400 多個高性能算子。
在本次機器狗的打造過程中,CANN 正是關(guān)鍵的「AI 秘密武器」。團隊基于昇騰 AI 處理器和異構(gòu)計算架構(gòu) CANN,以及宇樹機器狗本體的卓越運動性能,同時實現(xiàn)了基于 model free 的強化學(xué)習(xí)和傳統(tǒng) model base 的機器狗運動控制算法,以及儀器儀表讀數(shù)識別等視覺感知功能。當然,在訓(xùn)練它使用機械臂開門、拉閘這些事情上,CANN 也助力了不少。
此外,團隊基于 CANN 設(shè)計了一個智能復(fù)合機器人巡檢方案,涉及機器人定位導(dǎo)航、路徑規(guī)劃、運動控制、視覺感知、機械臂軌跡規(guī)劃和抓取等功能模塊,并使用華為自研昇騰處理器完成這些功能。
智能復(fù)合型機器人的廣闊天地
如果回到幾年前,人們也許很難想象,四足機器狗會成為新的風(fēng)口。但在今天,它已經(jīng)成為競爭最激烈的賽道之一。
這樣一只「進化版」機器狗,在真正的產(chǎn)業(yè)應(yīng)用場景中到底有哪些優(yōu)勢呢?
這就要從智能巡檢場景的難點說起,在昇騰 AI 去年推出的智能巡檢方案 1.0 版本中,一輛巡檢小車只能在平整地面依靠車輪完成巡查及突發(fā)情況告警,無法在高低起伏的環(huán)境下自由移動,更無法處理巡檢現(xiàn)場的突發(fā)情況。
今年,這一巡檢方案正式升級為「機器狗 + AI 機械臂」的 2.0 版本。相比之下,「機器狗 + AI 機械臂」的組合就靈活得多了:不僅能夠更好地穿越復(fù)雜地形,比如自由上下樓梯臺階、陡坡、石子路、梅花樁、草地等,還可以及時應(yīng)對突發(fā)情況,完成拉電閘、開門、觸碰按鈕等操作。
CANN 首席科學(xué)家杜鵬指出,當前智能機器人發(fā)展趨勢呈現(xiàn)模塊化、智能化和自然交互三個特點。多場景復(fù)合機器人發(fā)展加速,腦、眼、手、腳的協(xié)同是關(guān)鍵,復(fù)合機器人的「手」至關(guān)重要。

圖片

杜鵬分享昇騰 AI 技術(shù)應(yīng)用
也正因此,在下一代機器人的眾多形態(tài)中,「機器狗 + 機械臂」的組合在華為和宇樹科技的聯(lián)合研發(fā)中被寄予厚望。
當然,在這條賽道上,還有一些尚待解決的挑戰(zhàn),其中之一就是如何突破工業(yè)應(yīng)用的成本紅線。例如,智能復(fù)合型機器人涵蓋運動控制、定位導(dǎo)航、路徑規(guī)劃、視覺感知、位姿估計等多種算法,對算法、算力都提出了更高的需求,而昇騰的 CANN 為該問題提供了一種可能的解決方案。
隨著相關(guān)硬件及軟件系統(tǒng)等模塊化開發(fā)工具的開源,智能復(fù)合型機器人的研發(fā)門檻正在顯著降低,更多的實驗室構(gòu)想都將迅速成為具備廣泛行業(yè)應(yīng)用價值的機器人產(chǎn)品。
未來,智能復(fù)合型機器人的想象空間遠不止于此。與此同時,昇騰 AI 將持續(xù)分享更多基于 CANN 智能復(fù)合機器人的技術(shù)案例,并從「新技術(shù)、新體驗、新機會」三個維度不斷為開發(fā)者創(chuàng)造新價值。

*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉