讓 AI “讀懂”人類價(jià)值觀！朱松純團(tuán)隊(duì)工作登上 Science 頭條

發(fā)布人：傳感器技術(shù) 時(shí)間：2023-05-10 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

國(guó)際頂級(jí)學(xué)術(shù)期刊發(fā)表了朱松純團(tuán)隊(duì)（UCLA袁路遙、高曉豐、北京通用人工智能研究院鄭子隆、北京大學(xué)人工智能研究院朱毅鑫等作者）的最新研究成果——實(shí)時(shí)雙向人機(jī)價(jià)值對(duì)齊 In-situ bidirectional human-robotvalue alignment。論文同時(shí)被Science官網(wǎng)和Science Robotics官網(wǎng)頭條刊登。

論文地址：https://www.science.org/doi/10.1126/scirobotics.abm4183

本論文提出了一個(gè)可解釋的人工智能（XAI）系統(tǒng)，闡述了一種機(jī)器實(shí)時(shí)理解人類價(jià)值觀的計(jì)算框架，并展示了機(jī)器人如何與人類用戶通過實(shí)時(shí)溝通完成一系列復(fù)雜人機(jī)協(xié)作任務(wù)。朱松純團(tuán)隊(duì)長(zhǎng)期從事可解釋人工智能相關(guān)工作。此文是團(tuán)隊(duì)第二篇發(fā)表在 Science Robotics 的關(guān)于可解釋人工智能的論文。這項(xiàng)研究涵蓋了認(rèn)知推理、自然語言處理、機(jī)器學(xué)習(xí)、機(jī)器人學(xué)等多學(xué)科領(lǐng)域，是朱松純教授團(tuán)隊(duì)交叉研究成果的集中體現(xiàn)。

在這個(gè)人機(jī)共存的時(shí)代，為了讓機(jī)器更好地服務(wù)于人類，理想的人機(jī)協(xié)作應(yīng)該是什么樣的？我們不妨借鑒一下人類社會(huì)的協(xié)作，在人類團(tuán)隊(duì)合作過程中，共同的價(jià)值觀和目標(biāo)是保證團(tuán)隊(duì)之間齊心協(xié)力、高效合作的基礎(chǔ)。當(dāng)前機(jī)器智能大多數(shù)基于數(shù)據(jù)驅(qū)動(dòng)（且很多情況下獲取不了數(shù)據(jù)）、且是單方面接受人類指令（一種是人類觀測(cè)受限的情況下是沒法給到指令的）

為了解決上述問題，以及為了讓機(jī)器能夠進(jìn)行更好地“自主”探索，我們要讓機(jī)器學(xué)會(huì)“讀懂”人類價(jià)值觀，因此我們提出“實(shí)時(shí)雙向價(jià)值對(duì)齊”。這就要求人類要想辦法一次次地給到AI反饋，逐漸地教會(huì)AI“讀懂”人類的價(jià)值觀，也就是讓機(jī)器和人類的“價(jià)值觀”保持一致。

這個(gè)問題也被稱為價(jià)值對(duì)齊（value alignment），即如何保證人工智能在執(zhí)行任務(wù)過程中所實(shí)現(xiàn)的價(jià)值和用戶所在意的價(jià)值是一致的？

可以說，價(jià)值對(duì)齊是人機(jī)協(xié)作過程中達(dá)成共識(shí)（common ground）的基礎(chǔ)，具有非常重要的研究?jī)r(jià)值。價(jià)值對(duì)齊也是未來的一個(gè)重要發(fā)展方向，是讓機(jī)器實(shí)現(xiàn)“自主智能”的關(guān)鍵所在，也是實(shí)現(xiàn)通用人工智能的必經(jīng)之路。鑒于此，北京通用人工智能研究院院長(zhǎng)朱松純團(tuán)隊(duì)一直在致力于此方向的研究。

理想的人機(jī)協(xié)作應(yīng)該是什么樣的？在人工智能發(fā)展方興未艾之時(shí)，控制論之父諾伯特-維納（Norbert Wiener）就提出了人機(jī)協(xié)作的基礎(chǔ)：

“如果我們使用一個(gè)機(jī)器來實(shí)現(xiàn)我們的目標(biāo)，但又不能有效地干預(yù)其運(yùn)作方式...那么我們最好能篤定，輸入給機(jī)器的目標(biāo)是我們真正所預(yù)期的?！?/span>

近幾年來，一系列研究進(jìn)展都表明：高效的人機(jī)協(xié)作依賴于團(tuán)隊(duì)之間擁有一致的價(jià)值觀、目標(biāo)，以及對(duì)任務(wù)現(xiàn)狀的理解。這就要求人類通過與機(jī)器的溝通來高效地建立整個(gè)團(tuán)隊(duì)對(duì)任務(wù)的共識(shí)，每個(gè)團(tuán)隊(duì)成員都采取其他伙伴更容易理解的行為決策來完成協(xié)作。在大多數(shù)情況下，隊(duì)友之間的溝通過程都是雙向的，即每個(gè)成員都要扮演著傾聽者和表達(dá)者兩種角色。這樣的雙向價(jià)值對(duì)齊決定了人機(jī)協(xié)作中的溝通是否能夠成功，即機(jī)器人是否能準(zhǔn)確地推斷出用戶的價(jià)值目標(biāo)，并有效地解釋自己的行為。如果這兩個(gè)條件沒有得到滿足，隊(duì)友間彼此的不理解和誤判很可能會(huì)導(dǎo)致協(xié)作失敗。因此，想要使人工智能更好地服務(wù)于人類社會(huì)，必須讓它們?cè)谂c人類互動(dòng)時(shí)扮演好這兩種角色。

從傾聽者的角度來看，傳統(tǒng)人工智能算法（如逆強(qiáng)化學(xué)習(xí)（IRL）等）能夠?qū)⒔换?shù)據(jù)與機(jī)器學(xué)習(xí)算法相結(jié)合，以學(xué)習(xí)特定任務(wù)中用戶的價(jià)值目標(biāo)，即通過輸入用戶在特定任務(wù)中的行為方式，來恢復(fù)行為背后的獎(jiǎng)勵(lì)函數(shù)。然而，在眾多實(shí)際且重要（如軍事和醫(yī)療領(lǐng)域）的應(yīng)用中，數(shù)據(jù)的獲取經(jīng)常十分昂貴。這些機(jī)器學(xué)習(xí)方法對(duì)大型數(shù)據(jù)集的依賴是無法應(yīng)對(duì)即時(shí)互動(dòng)的人機(jī)協(xié)作場(chǎng)景的。

從表達(dá)者的角度來看，可解釋人工智能（XAI）的引入是為了促進(jìn)人機(jī)之間達(dá)成共識(shí)。當(dāng)前的XAI系統(tǒng)通常強(qiáng)調(diào)的是對(duì)“模型如何產(chǎn)生決策過程”的解釋。然而，不管用戶有多少主動(dòng)的輸入或互動(dòng)，都只能影響機(jī)器“生成解釋”的過程，而不影響機(jī)器“做出決策”的過程。這是一種單向的價(jià)值目標(biāo)對(duì)齊，我們稱之為靜態(tài)機(jī)器-動(dòng)態(tài)用戶的交流，即在這種協(xié)作過程中只有用戶對(duì)機(jī)器或任務(wù)的理解發(fā)生了變化。

為了完成人與機(jī)器之間價(jià)值目標(biāo)的雙向?qū)R，需要一種人類價(jià)值主導(dǎo)的、動(dòng)態(tài)機(jī)器-動(dòng)態(tài)用戶的交流模式。在這樣一種新的模式中，機(jī)器人除了揭示其決策過程外，還將根據(jù)用戶的價(jià)值目標(biāo)即時(shí)調(diào)整行為，從而使機(jī)器和人類用戶能夠合作實(shí)現(xiàn)一系列的共同目標(biāo)。為了即時(shí)掌握用戶信息，我們采用通訊學(xué)習(xí)取代了傳統(tǒng)數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法，機(jī)器將根據(jù)所推斷出的用戶的價(jià)值目標(biāo)進(jìn)行合理解釋。這種合作導(dǎo)向的人機(jī)協(xié)作要求機(jī)器具有心智理論（ToM），即理解他人的心理狀態(tài)（包括情緒、信仰、意圖、欲望、假裝與知識(shí)等）的能力。心智理論最早在心理學(xué)和認(rèn)知科學(xué)中被研究，現(xiàn)已泛化到人工智能領(lǐng)域。心智理論在多智能體和人機(jī)交互環(huán)境中尤為重要，因?yàn)槊總€(gè)智能體都要理解其他智能體（包括人）的狀態(tài)和意圖才能更好地執(zhí)行任務(wù)，其決策行為又會(huì)影響其他智能體做出判斷。設(shè)計(jì)擁有心智理論的系統(tǒng)不僅在于解釋其決策過程，還旨在理解人類的合作需求，以此形成一個(gè)以人類為中心、人機(jī)兼容的協(xié)作過程。

為了建立一個(gè)具有上述能力的AI系統(tǒng)，本文設(shè)計(jì)了一個(gè)"人機(jī)協(xié)作探索"游戲。在這個(gè)游戲中，用戶需要與三個(gè)偵察機(jī)器人合作完成探索任務(wù)并最大化團(tuán)隊(duì)收益。本游戲設(shè)定：1、只有偵察機(jī)器人能直接與游戲世界互動(dòng)，用戶不能直接控制機(jī)器人的行為；2、用戶將在游戲初始階段選擇自己的價(jià)值目標(biāo)（例如：最小化探索時(shí)間，收集更多的資源，探索更大的區(qū)域等），機(jī)器人團(tuán)隊(duì)必須通過人機(jī)互動(dòng)來推斷這個(gè)價(jià)值目標(biāo)。這樣的設(shè)置真實(shí)地模仿了現(xiàn)實(shí)世界中的人機(jī)合作任務(wù)，因?yàn)樵S多AI系統(tǒng)都需要在人類用戶的監(jiān)督下，自主地在危險(xiǎn)的環(huán)境中運(yùn)行（如在核電站有核泄漏的情況下）。

要成功地完成游戲，機(jī)器人需要同時(shí)掌握“聽”和“說”的能力來實(shí)現(xiàn)價(jià)值雙向?qū)R。首先，機(jī)器人需要從人類的反饋中提取有用的信息，推斷出用戶的價(jià)值函數(shù)（描述目標(biāo)的函數(shù)）并相應(yīng)地調(diào)整它們的策略。其次，機(jī)器人需要根據(jù)它們當(dāng)前的價(jià)值推斷，有效地解釋它們"已經(jīng)做了什么"和"計(jì)劃做什么"，讓用戶知道機(jī)器人是否和人類有相同的的價(jià)值函數(shù)。同時(shí)，用戶的任務(wù)是指揮偵查機(jī)器人到達(dá)目的地，并且使團(tuán)隊(duì)的收益最大化。因此，用戶對(duì)機(jī)器人的評(píng)價(jià)也是一個(gè)雙向的過程，即用戶必須即時(shí)推斷偵察機(jī)器人的價(jià)值函數(shù)，檢查其是否與人類的價(jià)值函數(shù)相一致。如果不一致，則選擇適當(dāng)?shù)闹噶顏碚{(diào)整他們的目標(biāo)。最終，如果系統(tǒng)運(yùn)行良好，偵察機(jī)器人的價(jià)值函數(shù)應(yīng)該與人類用戶的價(jià)值函數(shù)保持一致，并且用戶應(yīng)該高度信任機(jī)器人系統(tǒng)自主運(yùn)行。

圖1. 人機(jī)價(jià)值對(duì)齊過程總覽。

圖1介紹了游戲中的雙向價(jià)值調(diào)整過程。在游戲互動(dòng)過程中，存在著三個(gè)價(jià)值目標(biāo)，分別是：用戶的真實(shí)價(jià)值；：機(jī)器人對(duì)用戶價(jià)值的估計(jì)（在游戲中，偵察機(jī)器人沒有自己的價(jià)值，所以他們以人類用戶價(jià)值的估計(jì)為依據(jù)采取行動(dòng)）；：用戶對(duì)機(jī)器人價(jià)值的估計(jì)?；谶@三個(gè)價(jià)值目標(biāo)產(chǎn)生了兩種價(jià)值對(duì)齊—— ：機(jī)器人從用戶給出的反饋中學(xué)習(xí)用戶的價(jià)值；: 用戶從機(jī)器人給出的解釋和互動(dòng)中了解機(jī)器人的價(jià)值。最終，三種價(jià)值目標(biāo)將匯聚于，人-機(jī)團(tuán)隊(duì)將形成相互信任和高效的協(xié)作。

本文提出的XAI系統(tǒng)旨在共同解決以下兩個(gè)問題：

在即時(shí)互動(dòng)和反饋過程中，機(jī)器如何準(zhǔn)確估計(jì)人類用戶的意圖？
機(jī)器如何解釋自己，以便人類用戶能夠理解機(jī)器的行為，并提供有用的反饋來幫助機(jī)器做出價(jià)值調(diào)整？

在本文提出的系統(tǒng)中，機(jī)器人提出任務(wù)計(jì)劃的建議，并要求人類用戶給出反饋（接受或拒絕建議），從人類反饋中推斷出任務(wù)目標(biāo)背后人類真實(shí)的價(jià)值意圖。在協(xié)作游戲中，如果用戶知道機(jī)器人正在積極學(xué)習(xí)他的價(jià)值目標(biāo)，那么用戶就會(huì)傾向于提供更加有用的反饋，以促進(jìn)價(jià)值保持對(duì)齊。特別地，每條信息都傳達(dá)了兩方面的意義，包括（1）基于價(jià)值目標(biāo)的語義信息和（2）基于不同解釋方式之間區(qū)別的語用信息。利用這兩方面的含義，XAI系統(tǒng)以一種多輪的、即時(shí)的方式展示了價(jià)值的一致性，在一個(gè)問題搜索空間大的團(tuán)隊(duì)合作任務(wù)中實(shí)現(xiàn)了高效的人機(jī)互動(dòng)交流。為了使機(jī)器人的價(jià)值目標(biāo)與用戶保持一致，XAI系統(tǒng)生成解釋、揭示機(jī)器人對(duì)人類價(jià)值的當(dāng)前估計(jì)、并證明提出規(guī)劃的合理性。在每一步的互動(dòng)中，為了避免解釋內(nèi)容過于冗長(zhǎng)，機(jī)器人會(huì)提供定制化的解釋，比如省略重復(fù)的已知信息并強(qiáng)調(diào)重要的更新。在收到機(jī)器人的解釋并向它們發(fā)送反饋后，用戶向機(jī)器人提供提示，說明他們對(duì)最新建議和解釋的滿意程度。利用這些反饋，機(jī)器人會(huì)不斷地更新解釋的形式和內(nèi)容。

為了評(píng)估本文XAI系統(tǒng)的性能，我們邀請(qǐng)了人類用戶進(jìn)行了一系列實(shí)驗(yàn)，以此考察人類-機(jī)器雙向價(jià)值協(xié)調(diào)是否成功。我們采用了三種類型的解釋，并將用戶隨機(jī)分配到三組中的一組。實(shí)驗(yàn)結(jié)果表明，我們所提出的XAI系統(tǒng)能夠以有效地實(shí)現(xiàn)即時(shí)雙向的價(jià)值對(duì)齊，并用于協(xié)作任務(wù)；機(jī)器人能夠推斷出人類用戶的價(jià)值，并調(diào)整其價(jià)值估計(jì)被用戶所理解。此外，有必要進(jìn)行多樣化的解釋，以提高機(jī)器的決策性能和它們的社會(huì)智能。合作式的人工智能的目標(biāo)是減少人類的認(rèn)知負(fù)擔(dān)，并協(xié)助完成任務(wù)，我們相信，主動(dòng)即時(shí)推斷人類的價(jià)值目標(biāo)，并促進(jìn)人類對(duì)系統(tǒng)的理解，將會(huì)為通用智能體的人機(jī)合作鋪平道路。

如圖2所示，在我們?cè)O(shè)計(jì)的合作游戲中，包含一個(gè)人類指揮官和三個(gè)偵察機(jī)器人。游戲的目標(biāo)是需要在一張未知的地圖上找到一條從基地（位于地圖的右下角）到目的地（位于地圖的左上角）的安全路徑。該地圖被表示為一個(gè)部分可見的20×20網(wǎng)格圖，每個(gè)格子都可能有一個(gè)不同的裝置，只有在偵察機(jī)器人靠近它之后才可見。

在游戲中，人類指揮官和偵察機(jī)器人具有結(jié)構(gòu)性的相互依賴關(guān)系，一方面人類指揮官需要依靠偵察機(jī)器人探索危險(xiǎn)區(qū)域并排除爆炸物，另一方面，偵察機(jī)器人需要依賴人類指揮官提供的反饋更好地理解當(dāng)前任務(wù)的目標(biāo)。

圖 2：偵察探索游戲的用戶界面。從左到右，圖例面板顯示游戲地圖中的圖例。價(jià)值函數(shù)面板顯示這局游戲的價(jià)值函數(shù)，偵察機(jī)器人不知道這個(gè)函數(shù)，用戶也不能修改。中心地圖顯示當(dāng)前地圖上的信息。分?jǐn)?shù)面板顯示了用戶的當(dāng)前分?jǐn)?shù)。總分的計(jì)算方法是將各個(gè)目標(biāo)的分?jǐn)?shù)用價(jià)值函數(shù)加權(quán)后的總和。狀態(tài)面板顯示系統(tǒng)的當(dāng)前狀態(tài)。提議面板顯示偵察機(jī)器人當(dāng)前的任務(wù)計(jì)劃提議，用戶可以接受/拒絕每個(gè)建議。解釋面板顯示偵察機(jī)器人提供的解釋。

我們?yōu)閭刹鞕C(jī)器人制定了在尋找到路徑時(shí)額外的一系列目標(biāo)，包括1）盡快到達(dá)目的地，2）調(diào)查地圖上的可疑裝置，3）探索更大的區(qū)域，以及4）收集資源。游戲的表現(xiàn)是由偵察機(jī)器人完成這些目標(biāo)的情況和它們的相對(duì)重要性（權(quán)重）來衡量的，其中的權(quán)重就是人類用戶的價(jià)值函數(shù)。例如，如果人類指揮官更注重時(shí)效而不是獲取更多的資源，那么偵察機(jī)器人則應(yīng)該忽略沿途上的部分資源以保證盡快到達(dá)目的地。（注，這個(gè)價(jià)值函數(shù)只在游戲開始時(shí)向人類用戶透露，而不對(duì)偵察機(jī)器人透露。圖 3總結(jié)了人機(jī)互動(dòng)的流程。）

在不清楚人類指揮官價(jià)值取向的情況下，機(jī)器人偵察兵小隊(duì)必須快速推斷出人類的價(jià)值判斷，在每一步行動(dòng)中，機(jī)器人偵察小隊(duì)每一個(gè)成員都要給出下一步行動(dòng)方案，由人類指揮官選擇。為了幫助指揮官進(jìn)行決策，偵察機(jī)器人小隊(duì)將解釋行動(dòng)方案的依據(jù)。結(jié)合指揮官的反饋，以往的互動(dòng)歷史和當(dāng)前的地圖情況，偵察機(jī)器人小隊(duì)將調(diào)整其對(duì)指揮官當(dāng)前價(jià)值觀的判斷，并采取相應(yīng)的行動(dòng)。

圖3：偵查探索游戲的設(shè)計(jì)。時(shí)間線（A）表示在一輪游戲中發(fā)生的事件，從機(jī)器人收到環(huán)境信號(hào)開始，到它們的下一步動(dòng)作結(jié)束。時(shí)間線（B）和（C）分別描述了機(jī)器人和用戶的心智變化過程。

為了估計(jì)人類指揮官在通信過程中的價(jià)值函數(shù)，我們將兩個(gè)層次的心智理論整合到我們的計(jì)算模型中。第1層心智理論考慮合作性假設(shè)。也就是說，給定一個(gè)合作的人類指揮官，被他接受的來自機(jī)器人的提議，更有可能與正確的價(jià)值函數(shù)相一致。第2層心智理論進(jìn)一步將用戶的教育方法納入模型，使機(jī)器人更接近人類指揮官真實(shí)價(jià)值的反饋比其他反饋更容易被人類指揮官選擇。建模人類指揮官的教育傾向（pedagogical inclination）需要更高一層的心智理論。結(jié)合這兩個(gè)層次的心智理論，我們將人類指揮官的決策函數(shù)寫成一個(gè)由價(jià)值函數(shù)參數(shù)化的分布，并開發(fā)出一種新的學(xué)習(xí)算法。

值得注意的是，與我們的人機(jī)合作框架有可比性但不同的方法是逆強(qiáng)化學(xué)習(xí)。逆強(qiáng)化學(xué)習(xí)的目的是在一個(gè)被動(dòng)的學(xué)習(xí)環(huán)境中，根據(jù)預(yù)先錄制的、來自專家的演示（demonstration）來恢復(fù)底層的獎(jiǎng)勵(lì)函數(shù)（reward function）。與之不同的是，在我們的環(huán)境中，偵察機(jī)器人被設(shè)計(jì)為從人類指揮官給出的稀缺監(jiān)督中進(jìn)行交互學(xué)習(xí)。更重要的是，我們的設(shè)計(jì)要求機(jī)器人在任務(wù)進(jìn)行的過程中即時(shí)地、主動(dòng)地推斷人類指揮官的價(jià)值。此外，為了完成合作，偵察機(jī)器人不僅必須迅速理解人類指揮官的意圖，還要闡明自己的決策依據(jù)，以確保在整個(gè)游戲過程中與人類指揮官順利溝通?？傮w來看，機(jī)器人的任務(wù)是通過推斷人類用戶的心智模型，積極提出建議，并評(píng)估人類用戶的反饋來進(jìn)行價(jià)值調(diào)整。這些都需要機(jī)器對(duì)人類用戶進(jìn)行復(fù)雜的心智建模，并具有即時(shí)更新模型的能力。

總結(jié)

本文提出的XAI系統(tǒng)成功地證明了雙向人機(jī)價(jià)值對(duì)齊框架的可行性。從傾聽者的角度來看，所有三個(gè)解釋組中的機(jī)器人都可以在游戲進(jìn)度達(dá)到25%時(shí)，通過對(duì)至少60%的目標(biāo)重要性進(jìn)行正確排序，快速與用戶的價(jià)值進(jìn)行對(duì)齊。從表達(dá)者的角度來看，通過提供適當(dāng)?shù)慕忉?，機(jī)器人可以向用戶說明其意圖，并幫助人類更好的感知機(jī)器人的價(jià)值，當(dāng)給機(jī)器提供”完整解釋“時(shí)，只需在游戲進(jìn)度達(dá)到50%時(shí)即可實(shí)現(xiàn)人類用戶價(jià)值與機(jī)器人價(jià)值的統(tǒng)一，而當(dāng)只提供”簡(jiǎn)要解釋“時(shí)，游戲進(jìn)度需要達(dá)到75%時(shí)才能完成價(jià)值的統(tǒng)一。

我們從上述兩個(gè)角度得到了令人信服的證據(jù)，實(shí)現(xiàn)了雙向價(jià)值對(duì)齊的過程，具體來說：

通過接收人類的反饋，機(jī)器人逐漸更新其價(jià)值函數(shù)來與人類的價(jià)值保持一致；
通過不斷地與機(jī)器人交互，人類用戶逐漸形成對(duì)系統(tǒng)能力和意圖的感知。

雖然機(jī)器人系統(tǒng)的價(jià)值在游戲的上半場(chǎng)沒有與人類用戶實(shí)現(xiàn)統(tǒng)一，但用戶對(duì)機(jī)器人價(jià)值評(píng)估能力的感知仍然可以提高。

最終，當(dāng)機(jī)器人的價(jià)值變得穩(wěn)定時(shí)，用戶對(duì)機(jī)器人的評(píng)估也變得穩(wěn)定。從機(jī)器人對(duì)用戶價(jià)值的評(píng)估到用戶價(jià)值的真實(shí)值，以及從用戶對(duì)機(jī)器人價(jià)值的評(píng)估到機(jī)器人當(dāng)前價(jià)值的收斂配對(duì)，形成了由用戶真實(shí)價(jià)值錨定的雙向價(jià)值對(duì)齊。

總的來說，我們提出了一個(gè)雙向人機(jī)價(jià)值對(duì)齊框架，并使用XAI系統(tǒng)驗(yàn)證其可行性。我們提出的XAI系統(tǒng)表明，當(dāng)把心智理論集成到機(jī)器的學(xué)習(xí)模塊中，并向用戶提供適當(dāng)?shù)慕忉寱r(shí)，人類和機(jī)器人能夠通過即時(shí)交互的方式實(shí)現(xiàn)心智模型的對(duì)齊。我們提出的計(jì)算框架通過促進(jìn)人和機(jī)器之間共享心智模型的形成，為解決本文的核心問題"理想的人機(jī)協(xié)作應(yīng)該是什么樣的？"提供了全新的解答。

在這個(gè)游戲任務(wù)中，我們的工作側(cè)重于以價(jià)值和意圖為核心對(duì)心智進(jìn)行建模，對(duì)齊這些價(jià)值可以極大地幫助人類和機(jī)器為面向任務(wù)的協(xié)作建立共同基礎(chǔ)，使其可以勝任更加復(fù)雜的場(chǎng)景何任務(wù)。因此，我們的工作是在人機(jī)協(xié)作中朝著更通用的心智模型對(duì)齊邁出的第一步。在未來的工作中，我們計(jì)劃探索哪些因素能夠進(jìn)一步增強(qiáng)人類用戶信任（例如，允許對(duì)機(jī)器人進(jìn)行反事實(shí)查詢），驗(yàn)證"對(duì)齊"對(duì)任務(wù)性能的影響，并將我們的系統(tǒng)應(yīng)用于涉及更復(fù)雜環(huán)境和價(jià)值函數(shù)的任務(wù)。

未來暢想：打造“AI大白”

在科幻電影《超能陸戰(zhàn)隊(duì)》中，有一個(gè)“大白”智能陪伴機(jī)器人，“大白”可以陪電影男主角一起學(xué)習(xí)、玩耍、做游戲，具有很高的實(shí)時(shí)互動(dòng)性。而當(dāng)電影男主角情緒失落時(shí)，“大白”還能“讀懂”他的情感價(jià)值需求，主動(dòng)安慰，給一個(gè)大大的擁抱。

“大白”其實(shí)是一個(gè)很智能的通用智能體。朱松純團(tuán)隊(duì)所在的北京通用人工智能研究院，聯(lián)合北京大學(xué)人工智能研究院等單位，致力追尋人工智能的統(tǒng)一理論與認(rèn)知架構(gòu)，實(shí)現(xiàn)具有自主的感知、認(rèn)知、決策、學(xué)習(xí)、執(zhí)行和社會(huì)協(xié)作能力，符合人類情感、倫理與道德觀念的通用智能體。本研究從傳統(tǒng)AI的“數(shù)據(jù)驅(qū)動(dòng)”轉(zhuǎn)變?yōu)椤皟r(jià)值驅(qū)動(dòng)”，讓XAI系統(tǒng)理解了人類價(jià)值觀，朝著通用人工智能邁出了一大步。

來源：圖靈人工智能作者：東周

參考：AI智勝未來

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

博客專欄

讓 AI “讀懂”人類價(jià)值觀！朱松純團(tuán)隊(duì)工作登上 Science 頭條

相關(guān)推薦

技術(shù)專區(qū)

博客專欄

讓 AI “讀懂”人類價(jià)值觀！朱松純團(tuán)隊(duì)工作登上 Science 頭條

相關(guān)推薦

技術(shù)專區(qū)

讓 AI “讀懂”人類價(jià)值觀！朱松純團(tuán)隊(duì)工作登上 Science 頭條