開門、拉閘一氣呵成，這只AI機(jī)器狗「有點(diǎn)東西」

發(fā)布人：機(jī)器之心時(shí)間：2022-08-14 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

多虧昇騰 AI 的助力，我們才能看到這么穩(wěn)的「機(jī)器狗巡檢員」。

自上世紀(jì)「機(jī)器人」概念被提出以來，人們就對各種形態(tài)的機(jī)器人產(chǎn)品寄予厚望。在普通人最初的想象中，機(jī)器人能和我們聊天，幫我們打掃房間、端茶遞水，甚至能幫我們駕駛車輛……
直到近年來大數(shù)據(jù)技術(shù)、人工智能專用芯片、人工智能算法突飛猛進(jìn)，智能機(jī)器人才真正進(jìn)入增長爆發(fā)期，讓我們有了「夢想照進(jìn)現(xiàn)實(shí)」的感覺。
從爆火的四足機(jī)器狗，到初具雛形的人形機(jī)器人，眾多先進(jìn)的機(jī)器人產(chǎn)品開始走進(jìn)人類社會生活的方方面面。當(dāng)然，除了生活服務(wù)之外，機(jī)器人也正在積極打入廣闊的產(chǎn)業(yè)場景：物流分揀、農(nóng)業(yè)上的噴灑采摘、巡檢救援，都是機(jī)器人可以貢獻(xiàn)價(jià)值的空間。
在近日的 2022 昇騰 AI 開發(fā)者創(chuàng)享日 · 南京站活動(dòng)中，我們見到了這樣一只超級靠譜的「機(jī)器狗巡檢員」。熟悉機(jī)器狗產(chǎn)品的朋友會發(fā)現(xiàn)，它就是當(dāng)年央視春晚后臺拉盒飯的「網(wǎng)紅打工機(jī)器狗」。來自宇樹科技 Unitree，在華為昇騰 AI 加持下，現(xiàn)在的它變成了「機(jī)器狗巡檢員」。
當(dāng)無人值守的電站發(fā)出警報(bào)，是它熟練地捏住把手，并且果斷打開了門：

接下來，它一頓操作，邁過地面的臺階障礙，精準(zhǔn)地拉下了電閘。至此，警報(bào)解除：

這位「機(jī)器狗巡檢員」來自昇騰 AI。你可能已經(jīng)發(fā)現(xiàn)了一些特別之處——它有一支威風(fēng)凜凜的「機(jī)械臂」。
那么，這只機(jī)器狗究竟是如何打造的呢？它的機(jī)械臂又有什么妙用呢？
走近這位「機(jī)器狗巡檢員」
一般來說，要想讓機(jī)器狗在真實(shí)世界中圓滿地完成任務(wù)，主要挑戰(zhàn)就在于運(yùn)動(dòng)控制。眾所周知，人類的運(yùn)動(dòng)是由中樞神經(jīng)系統(tǒng)控制的。其中大腦的運(yùn)動(dòng)皮質(zhì)和運(yùn)動(dòng)前皮質(zhì)負(fù)責(zé)自主運(yùn)動(dòng)的計(jì)劃和執(zhí)行，基底神經(jīng)節(jié)和小腦負(fù)責(zé)調(diào)節(jié)運(yùn)動(dòng)皮層神經(jīng)元的反應(yīng)，幫助協(xié)調(diào)、運(yùn)動(dòng)和平衡。
對于機(jī)器狗的運(yùn)動(dòng)控制來說，AI 處理器就相當(dāng)于「大腦」，負(fù)責(zé)任務(wù)決策、感知識別、導(dǎo)航規(guī)劃等功能的實(shí)現(xiàn)。
傳統(tǒng)機(jī)器狗運(yùn)動(dòng)控制算法存在建模復(fù)雜、開發(fā)耗時(shí)長、高度依賴經(jīng)驗(yàn)等局限性，近年來，很多研究者開始將強(qiáng)化學(xué)習(xí)應(yīng)用到實(shí)體機(jī)器人上，增強(qiáng)機(jī)器狗的環(huán)境適應(yīng)能力。比如這一次，華為就使用了「Teacher-student」策略進(jìn)行機(jī)器狗運(yùn)動(dòng)控制算法訓(xùn)練。

使用「Teacher-student Policy」完成機(jī)器狗運(yùn)動(dòng)控制算法訓(xùn)練
具體而言，Teacher 部分通過強(qiáng)化學(xué)習(xí)訓(xùn)練一個(gè)最優(yōu)的參考控制策略，它能獲取完美的特權(quán)信息（如地面摩擦系數(shù)），讓機(jī)器狗能在隨機(jī)生成的地形上遵循期望的速度指令行走；Student 部分通過監(jiān)督學(xué)習(xí)把 Teacher policy 蒸餾成一個(gè) Student policy，它在帶傳感噪聲的環(huán)境中訓(xùn)練，且只能獲取真實(shí)機(jī)器人能得到的傳感器信息。最終，團(tuán)隊(duì)將訓(xùn)練好的 Student policy 部署在真實(shí)機(jī)器狗上。
為了讓機(jī)器狗在更多的應(yīng)用場景中「發(fā)光發(fā)熱」，華為還給機(jī)器狗加了一條「AI 機(jī)械臂」。有了這條機(jī)械臂之后，它的動(dòng)作技能直線飛升，不僅可以輕松開門，還能平穩(wěn)地跨越地面障礙：

開門

跨越地面障礙
可以想象，打造這樣一只機(jī)器狗所需的工作量是巨大的。在 8 月 11 日的 CANN 訓(xùn)練營直播中，華為對這款復(fù)合型機(jī)器狗背后的研發(fā)進(jìn)行了解密。
在解密過程中，團(tuán)隊(duì)特別提到了華為自研的神器：CANN。
昇騰 AI 是以昇騰 AI 基礎(chǔ)軟硬件平臺為基礎(chǔ)構(gòu)建的人工智能計(jì)算產(chǎn)業(yè)，昇騰 AI 基礎(chǔ)軟硬件平臺包括 Atlas 系列硬件及伙伴硬件、異構(gòu)計(jì)算架構(gòu) CANN（Compute Architecture for Neural Networks）、全場景 AI 框架昇思 MindSpore、昇騰應(yīng)用使能 MindX 等。CANN 是華為針對 AI 場景推出的異構(gòu)計(jì)算架構(gòu)，旨在通過提供多層次的編程接口，支持用戶快速構(gòu)建基于昇騰 AI 平臺的應(yīng)用和業(yè)務(wù)。
作為昇騰 AI 全棧的核心，CANN 對上支持多種 AI 框架，對下服務(wù) AI 處理器與編程，承擔(dān)著承上啟下的關(guān)鍵作用。
經(jīng)過 3 年多的優(yōu)化，CANN 已經(jīng)迭代到 5.0 版本，實(shí)現(xiàn)了性能的大幅提升。目前，CANN 全面支持業(yè)界主流框架，Model zoo 已經(jīng)包含超過 500 個(gè)經(jīng)過調(diào)優(yōu)的模型，以及 1400 多個(gè)高性能算子。
在本次機(jī)器狗的打造過程中，CANN 正是關(guān)鍵的「AI 秘密武器」。團(tuán)隊(duì)基于昇騰 AI 處理器和異構(gòu)計(jì)算架構(gòu) CANN，以及宇樹機(jī)器狗本體的卓越運(yùn)動(dòng)性能，同時(shí)實(shí)現(xiàn)了基于 model free 的強(qiáng)化學(xué)習(xí)和傳統(tǒng) model base 的機(jī)器狗運(yùn)動(dòng)控制算法，以及儀器儀表讀數(shù)識別等視覺感知功能。當(dāng)然，在訓(xùn)練它使用機(jī)械臂開門、拉閘這些事情上，CANN 也助力了不少。
此外，團(tuán)隊(duì)基于 CANN 設(shè)計(jì)了一個(gè)智能復(fù)合機(jī)器人巡檢方案，涉及機(jī)器人定位導(dǎo)航、路徑規(guī)劃、運(yùn)動(dòng)控制、視覺感知、機(jī)械臂軌跡規(guī)劃和抓取等功能模塊，并使用華為自研昇騰處理器完成這些功能。
智能復(fù)合型機(jī)器人的廣闊天地
如果回到幾年前，人們也許很難想象，四足機(jī)器狗會成為新的風(fēng)口。但在今天，它已經(jīng)成為競爭最激烈的賽道之一。
這樣一只「進(jìn)化版」機(jī)器狗，在真正的產(chǎn)業(yè)應(yīng)用場景中到底有哪些優(yōu)勢呢？
這就要從智能巡檢場景的難點(diǎn)說起，在昇騰 AI 去年推出的智能巡檢方案 1.0 版本中，一輛巡檢小車只能在平整地面依靠車輪完成巡查及突發(fā)情況告警，無法在高低起伏的環(huán)境下自由移動(dòng)，更無法處理巡檢現(xiàn)場的突發(fā)情況。
今年，這一巡檢方案正式升級為「機(jī)器狗 + AI 機(jī)械臂」的 2.0 版本。相比之下，「機(jī)器狗 + AI 機(jī)械臂」的組合就靈活得多了：不僅能夠更好地穿越復(fù)雜地形，比如自由上下樓梯臺階、陡坡、石子路、梅花樁、草地等，還可以及時(shí)應(yīng)對突發(fā)情況，完成拉電閘、開門、觸碰按鈕等操作。
CANN 首席科學(xué)家杜鵬指出，當(dāng)前智能機(jī)器人發(fā)展趨勢呈現(xiàn)模塊化、智能化和自然交互三個(gè)特點(diǎn)。多場景復(fù)合機(jī)器人發(fā)展加速，腦、眼、手、腳的協(xié)同是關(guān)鍵，復(fù)合機(jī)器人的「手」至關(guān)重要。

杜鵬分享昇騰 AI 技術(shù)應(yīng)用
也正因此，在下一代機(jī)器人的眾多形態(tài)中，「機(jī)器狗 + 機(jī)械臂」的組合在華為和宇樹科技的聯(lián)合研發(fā)中被寄予厚望。
當(dāng)然，在這條賽道上，還有一些尚待解決的挑戰(zhàn)，其中之一就是如何突破工業(yè)應(yīng)用的成本紅線。例如，智能復(fù)合型機(jī)器人涵蓋運(yùn)動(dòng)控制、定位導(dǎo)航、路徑規(guī)劃、視覺感知、位姿估計(jì)等多種算法，對算法、算力都提出了更高的需求，而昇騰的 CANN 為該問題提供了一種可能的解決方案。
隨著相關(guān)硬件及軟件系統(tǒng)等模塊化開發(fā)工具的開源，智能復(fù)合型機(jī)器人的研發(fā)門檻正在顯著降低，更多的實(shí)驗(yàn)室構(gòu)想都將迅速成為具備廣泛行業(yè)應(yīng)用價(jià)值的機(jī)器人產(chǎn)品。
未來，智能復(fù)合型機(jī)器人的想象空間遠(yuǎn)不止于此。與此同時(shí)，昇騰 AI 將持續(xù)分享更多基于 CANN 智能復(fù)合機(jī)器人的技術(shù)案例，并從「新技術(shù)、新體驗(yàn)、新機(jī)會」三個(gè)維度不斷為開發(fā)者創(chuàng)造新價(jià)值。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請聯(lián)系工作人員刪除。

博客專欄

開門、拉閘一氣呵成，這只AI機(jī)器狗「有點(diǎn)東西」

相關(guān)推薦

技術(shù)專區(qū)

博客專欄

開門、拉閘一氣呵成，這只AI機(jī)器狗「有點(diǎn)東西」

相關(guān)推薦

技術(shù)專區(qū)

開門、拉閘一氣呵成，這只AI機(jī)器狗「有點(diǎn)東西」