新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 人工智能在游戲領(lǐng)域再進(jìn)一步

人工智能在游戲領(lǐng)域再進(jìn)一步

作者: 時間:2019-11-25 來源:新華社 收藏

美國麻省理工學(xué)院科研團(tuán)隊(duì)日前宣布,其開發(fā)的程序(DeepRole)在一個玩家角色和動機(jī)不明的在線中勝過人類,成為首個在敵友不明的多玩家中戰(zhàn)勝人類玩家的程序。

本文引用地址:http://2s4d.com/article/201911/407438.htm

研究顯示,通過在算法中使用“演繹推理”,根據(jù)觀察到的部分行為,推斷某一玩家是敵是友,快速學(xué)習(xí)應(yīng)該與誰結(jié)盟從而獲得勝利。

今年7月,美國卡內(nèi)基-梅隆大學(xué)宣布,Pluribus在六人桌德州撲克比賽中擊敗多名世界頂尖選手,突破了人工智能僅能在國際象棋和圍棋等二人中戰(zhàn)勝人類的局限。但在這些游戲中,人工智能從一開始就知道“誰是敵人、誰是朋友”。

研究人員讓參與了超過4000輪在線桌游“抵抗組織:阿瓦隆”?!鞍⑼呗 鳖愃朴凇皻⑷擞螒颉被颉袄侨藲ⅰ?,玩家通過游戲進(jìn)程推測出其他玩家的身份,同時掩藏自己的身份。結(jié)果顯示,不論作為“好人”還是“壞人”,“深度角色”都比人類玩家表現(xiàn)更加出色。

“深度角色”采取了一種被稱為“反事實(shí)遺憾最小化”的博弈算法,利用“博弈樹”預(yù)測每個玩家的行為,并推斷出玩家角色的最大可能性。這種人工智能程序在游戲中進(jìn)行自我對抗,逐步接近最佳策略,實(shí)現(xiàn)“至少與對手打平”的納什均衡。

“阿瓦隆”的人類玩家通常要在游戲過程中通過對話為決策提供部分依據(jù),而“深度角色”只觀察玩家行為,無需參與交流。研究人員未來計劃讓機(jī)器表達(dá)簡單的信息,如玩家是敵是友等。

語言是人工智能的下一個前沿,因?yàn)槿祟愅婕視f謊,需要更復(fù)雜的交流技巧。只有掌握表達(dá)技巧后,人工智能才能參與那些需要對其他玩家進(jìn)行勸說的復(fù)雜社交推理游戲。

研究人員說,這項(xiàng)工作可以更好模擬人類是如何做出社會決策的,從而幫助人工智能更好理解人類、向人類學(xué)習(xí)并與人類共事。



評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉