王馥芳:面向機(jī)器人的大規(guī)模知識(shí)引擎
近年來,隨著計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的快速發(fā)展,諸多大規(guī)模知識(shí)引擎的創(chuàng)建在很大程度上改變了人類的知識(shí)共享和表征生態(tài)。受此啟發(fā),美國康奈爾大學(xué)和斯坦福大學(xué)的一些學(xué)者通過多模態(tài)大數(shù)據(jù)挖掘,創(chuàng)建了一種新的、主要面向機(jī)器人的、同時(shí)能供任何要執(zhí)行任務(wù)的設(shè)備自由訪問的大規(guī)模知識(shí)引擎:機(jī)器人大腦(RoboBrain)。
機(jī)器人大腦:面向機(jī)器人的大規(guī)模知識(shí)引擎
在面向人類的知識(shí)數(shù)據(jù)庫中,信息搜索是一件簡(jiǎn)單的事情,我們只需在電腦或移動(dòng)終端上輸入幾個(gè)字就可以得到答案,在很多情況下,模糊和缺省檢索也能解決問題。但是,對(duì)于機(jī)器人來說事情就沒有這么簡(jiǎn)單。即便要完成最簡(jiǎn)單的任務(wù),機(jī)器人都需要詳盡甚而完備的操作細(xì)節(jié)?;诿嫦蛉祟惖乃阉饕嫠贸龅乃阉鹘Y(jié)果,機(jī)器人難以讀懂。比如,要使機(jī)器人讀懂“如何烘焙蛋糕”的搜索結(jié)果,除了指出常規(guī)的烘焙過程和步驟之外,還需要提供各種各樣詳盡的相關(guān)附帶信息,如雞蛋可以打破;打破雞蛋流出的液體必須裝在器皿如杯子里;杯子只有在杯口朝上的情況下才可以盛裝液體;水來自水龍頭,能夠在壺或者微波爐里加熱,且能夠和蛋液混合等等。因此,要?jiǎng)?chuàng)建一個(gè)面向機(jī)器人的大規(guī)模知識(shí)引擎不是一件簡(jiǎn)單的事情。
在人工智能產(chǎn)業(yè)發(fā)展前景被普遍看好的當(dāng)下,康奈爾大學(xué)和斯坦福大學(xué)聯(lián)合創(chuàng)建了一個(gè)面向機(jī)器人的大規(guī)模知識(shí)引擎——機(jī)器人大腦,并為此創(chuàng)建了一個(gè)網(wǎng)站。這主要是一個(gè)供機(jī)器人學(xué)習(xí)和共享知識(shí)表征并執(zhí)行多種任務(wù)的大規(guī)模知識(shí)引擎。
“機(jī)器人大腦”網(wǎng)站的首頁顯示,該知識(shí)引擎主要通過搜索互聯(lián)網(wǎng)及其他一些數(shù)據(jù)來源學(xué)習(xí)各種概念:“它能解釋自然語言文本,意象和錄像;能運(yùn)用其傳感器來觀察人類;且能通過與它們互動(dòng)的方式來學(xué)習(xí)事物?!眲?chuàng)建者相信,通過學(xué)習(xí)和共享大規(guī)模知識(shí),不同的機(jī)器人能夠在各種新情境下更快速敏捷地完成各種任務(wù)?!皺C(jī)器人大腦”的創(chuàng)建改變了機(jī)器人的深度學(xué)習(xí)方式。傳統(tǒng)上,機(jī)器人學(xué)習(xí)的重心是規(guī)則學(xué)習(xí)。隨著大數(shù)據(jù)時(shí)代的到來,機(jī)器人開始從規(guī)則學(xué)習(xí)轉(zhuǎn)向多模態(tài)數(shù)據(jù)學(xué)習(xí)。
機(jī)器人大腦:使機(jī)器人深度學(xué)習(xí)成為可能
“機(jī)器人大腦”本質(zhì)上是一個(gè)大規(guī)模眾源(crowd-sourcing)大數(shù)據(jù)庫,它所存儲(chǔ)的知識(shí)來源多樣,包括機(jī)器人在完成各種任務(wù)(如感知、計(jì)劃和控制等)時(shí)所關(guān)涉的物理互動(dòng)、萬維網(wǎng)知識(shí)基礎(chǔ)以及領(lǐng)先的機(jī)器人研究小組所創(chuàng)建的各種可學(xué)習(xí)性知識(shí)表征。
“機(jī)器人大腦”的創(chuàng)建在很大程度上改變了大數(shù)據(jù)挖掘過度依賴單一文本數(shù)據(jù)模態(tài)來源的現(xiàn)狀。受制于技術(shù)局限性,面向人類的大規(guī)模知識(shí)引擎的數(shù)據(jù)來源主要是萬維網(wǎng)中“結(jié)構(gòu)化”的文本模態(tài)數(shù)據(jù),而無法有效挖掘其他一些“非結(jié)構(gòu)化”的數(shù)據(jù)模態(tài)如符號(hào)、圖片、視頻、音頻等。“結(jié)構(gòu)化數(shù)據(jù)”主要指能被數(shù)據(jù)庫所理解的、可以被邏輯表征的數(shù)據(jù),而“非結(jié)構(gòu)化數(shù)據(jù)”主要指無法被邏輯表征的數(shù)據(jù),主要包括多種數(shù)據(jù)模態(tài):文本、圖片或圖像、觸感、XML、HTML、各類圖表或報(bào)表、音頻和視頻信息等等。
據(jù)資料統(tǒng)計(jì),在大數(shù)據(jù)變革風(fēng)起云涌的今天,世界約80%的數(shù)據(jù)都是“非結(jié)構(gòu)化數(shù)據(jù)”。在云計(jì)算出現(xiàn)之前,傳統(tǒng)計(jì)算機(jī)無法處理這些巨量數(shù)據(jù)。借助于以云計(jì)算為基礎(chǔ)的信息挖掘、存儲(chǔ)、處理和展示技術(shù),我們可以在某種程度上有效地對(duì)其進(jìn)行分析和計(jì)算。如此一來,“非結(jié)構(gòu)化數(shù)據(jù)”的價(jià)值得到極大凸顯。由于面向機(jī)器人的知識(shí)引擎在很大程度上是由“非結(jié)構(gòu)化數(shù)據(jù)”組成的,而其本質(zhì)上又是眾源數(shù)據(jù),因此,如何有效編碼多種不同的數(shù)據(jù)模態(tài)并構(gòu)建一個(gè)能與多種數(shù)據(jù)來源兼容的知識(shí)表征構(gòu)架是“機(jī)器人大腦”面臨的最大挑戰(zhàn)。為此,“機(jī)器人大腦”訴諸于圖表構(gòu)架以解決不同數(shù)據(jù)模態(tài)之間的沖突和不一致問題。
研究小組將“機(jī)器人大腦”知識(shí)表征構(gòu)架的創(chuàng)建看作是網(wǎng)絡(luò)理論問題。他們把知識(shí)表征為定向圖表,其中的節(jié)點(diǎn)以各種各樣的數(shù)據(jù)模態(tài)體現(xiàn),如圖像、文本、視頻、觸覺數(shù)據(jù)或者學(xué)術(shù)概念等?!皺C(jī)器人大腦”是一個(gè)“無止境學(xué)習(xí)”的知識(shí)引擎,它不間斷地實(shí)時(shí)獲取以邊集形式呈現(xiàn)的新信息,這些新信息通過和節(jié)點(diǎn)子集鏈接的方式得到表征。例如,“坐著的人可以使用杯子”這一常識(shí)概念可能會(huì)鏈接“杯子”、“坐著的人”和“能夠使用”等節(jié)點(diǎn)概念(即檢索的中心概念,以檢索與該概念直接相關(guān)的概念)。任何在“機(jī)器人大腦”中搜索節(jié)點(diǎn)概念的機(jī)器人,都可以通過下載相關(guān)邊集和它們所代表的節(jié)點(diǎn)概念來進(jìn)行深度學(xué)習(xí)。
“機(jī)器人大腦”的核心是,不但讓機(jī)器人通過搜索大規(guī)模知識(shí)引擎自我深度學(xué)習(xí),而且意圖使其將一個(gè)情境中學(xué)到的知識(shí)應(yīng)用于其他新情境。例如,將“倒水到杯子里”的能力擴(kuò)展到倒水到其他容器里,如倒洗澡水到澡盆里等?!皺C(jī)器人大腦”團(tuán)隊(duì)對(duì)于未來有著宏大的計(jì)劃:讓該知識(shí)引擎納入更加多樣的知識(shí)來源,如在線視頻,并設(shè)想讓機(jī)器人通過查詢?cè)诰€指引視頻學(xué)會(huì)如何做各種各樣的家務(wù)。
此外,“機(jī)器人大腦”著力于解決不同領(lǐng)域的研究挑戰(zhàn):機(jī)器學(xué)習(xí)、大規(guī)模資料處理、語言和對(duì)話、感知、人工智能和推理系統(tǒng)、體驗(yàn)和機(jī)器人學(xué)以及自動(dòng)化。該知識(shí)引擎的創(chuàng)建有助于三個(gè)重要研究領(lǐng)域的工作:基礎(chǔ)自然語言、感知和計(jì)劃。這三項(xiàng)工作是很多機(jī)器人完成任務(wù)的關(guān)鍵要素。
機(jī)器人大腦:將進(jìn)一步拓展人工智能產(chǎn)業(yè)前景
“機(jī)器人大腦”的創(chuàng)立,標(biāo)志著人類在人工智能產(chǎn)業(yè)化的道路上又邁出了實(shí)質(zhì)性的一步。雖然其在目前初創(chuàng)階段,還面臨諸多技術(shù)難題和構(gòu)架創(chuàng)建挑戰(zhàn),但是,其在諸多方面的技術(shù)潛力無疑將進(jìn)一步助推人工智能產(chǎn)業(yè)的發(fā)展。
其一,“機(jī)器人大腦”試圖對(duì)不同數(shù)據(jù)模態(tài)進(jìn)行有效編碼和表征,此舉意在試圖實(shí)現(xiàn)“非結(jié)構(gòu)化數(shù)據(jù)”向“結(jié)構(gòu)化數(shù)據(jù)”的轉(zhuǎn)換,以使之能被機(jī)器人學(xué)習(xí)、理解,進(jìn)而運(yùn)用其完成各種任務(wù)。此舉不但極大地拓展了機(jī)器人學(xué)習(xí)的內(nèi)容、深度以及學(xué)習(xí)的復(fù)雜性,而且革新了機(jī)器人的學(xué)習(xí)方式。經(jīng)過多模態(tài)數(shù)據(jù)學(xué)習(xí)訓(xùn)練的機(jī)器人有望在智能化方面更加“類人化”,從而進(jìn)一步加快人工智能產(chǎn)業(yè)化的發(fā)展步伐。
其二,“機(jī)器人大腦”試圖在一定程度上消除機(jī)器人和人類使用者在信息共享中的障礙,此舉有助于進(jìn)一步增強(qiáng)人機(jī)互動(dòng)的質(zhì)和量,并加快人工智能和人類智能的進(jìn)一步融合。
其三,“機(jī)器人大腦”試圖把各種機(jī)器人任務(wù)公式化為各種問題,從而為各種人機(jī)交互任務(wù)的完成提供一個(gè)問題驅(qū)動(dòng)的知識(shí)學(xué)習(xí)和任務(wù)訓(xùn)練數(shù)據(jù)庫。此舉有助于進(jìn)一步提高機(jī)器人完成任務(wù)的概率,并可能催生出新的智能化產(chǎn)品。
其四,由于“機(jī)器人大腦”的數(shù)據(jù)來源多樣,因此,其團(tuán)隊(duì)致力于構(gòu)建一種能和多種數(shù)據(jù)來源兼容的圖表表征構(gòu)架。這個(gè)目標(biāo)的最終達(dá)成將在很大程度上解決因多種信息源之間的沖突或不一致而導(dǎo)致的“數(shù)據(jù)不可讀”問題,并將極大地便利人工智能大數(shù)據(jù)的挖掘、生成、存儲(chǔ)、管理、查詢、提取、處理以及展示等,從而拓展其產(chǎn)業(yè)化前景。
在“人工智能”已發(fā)展成一個(gè)商業(yè)前景廣闊的產(chǎn)業(yè)的背景下,“機(jī)器人大腦”的創(chuàng)建無疑為其注入了一針強(qiáng)心劑。
評(píng)論