博客專欄

EEPW首頁(yè) > 博客 > Science論文:諾獎(jiǎng)經(jīng)濟(jì)學(xué)家的經(jīng)典決策模型,被AI挑戰(zhàn)

Science論文:諾獎(jiǎng)經(jīng)濟(jì)學(xué)家的經(jīng)典決策模型,被AI挑戰(zhàn)

發(fā)布人:數(shù)據(jù)派THU 時(shí)間:2021-08-07 來(lái)源:工程師 發(fā)布文章

以下文章來(lái)源于數(shù)據(jù)實(shí)戰(zhàn)派 ,作者林檎

在經(jīng)濟(jì)學(xué)領(lǐng)域,這個(gè)問(wèn)題與一個(gè)著名的理論息息相關(guān)。那便是諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者卡尼曼在 1979 年提出的前景理論(Prospect Theory)。

這個(gè)理論指出,在權(quán)衡 “獲得” 的時(shí)候,人們普遍希望更有把握的選擇,而不想有風(fēng)險(xiǎn)。即面臨獲得時(shí)往往小心翼翼、規(guī)避風(fēng)險(xiǎn);面對(duì)失去時(shí)反而因?yàn)椴桓市亩菀酌半U(xiǎn)。這揭示了,人在損失時(shí)的痛苦感與獲得時(shí)的快樂(lè)感并不對(duì)等,前者的程度更強(qiáng)烈。

盡管前景理論隸屬于經(jīng)濟(jì)學(xué)范疇,另一方面,這個(gè)理論也反映了智能體在決策認(rèn)知上存在的誤區(qū)。

決策是很重要的,因?yàn)樗罱K決定了某些生活和社會(huì)結(jié)果,并且是相當(dāng)多的經(jīng)濟(jì)行為的基礎(chǔ)。但實(shí)際情況是,人類做出決定的過(guò)程有時(shí)既復(fù)雜又看似隨意。

這也導(dǎo)致了大量理論和決策模型的出現(xiàn),其中的不少理論,要不相互矛盾,要不就是新穎性不足、難以和其他理論相區(qū)分。更致命的是,大多數(shù)這些理論在現(xiàn)實(shí)世界中都不是很有用,很少有想法能對(duì)人類行為提供充分的見(jiàn)解,每個(gè)理論往往只能從不斷增加的清單中解釋少數(shù)現(xiàn)象。因此,即便雖然前景理論為人是如何進(jìn)行決策提供了一種方法論,但用這個(gè)理論來(lái)模擬選擇行為并非沒(méi)有缺點(diǎn)。

而在普林斯頓大學(xué)的研究人員 Joshua Peterson 看來(lái),造成這種情況的原因并不是缺乏獨(dú)創(chuàng)性,而是該領(lǐng)域已經(jīng)形成了這樣的一個(gè)傳統(tǒng):新進(jìn)展取決于理論和實(shí)驗(yàn)之間的迭代循環(huán),但一個(gè)理論家能夠投入的時(shí)間畢竟有限,加上該領(lǐng)域缺乏像其他科學(xué)中出現(xiàn)的新工具,使得理論發(fā)展的速度很難在過(guò)去幾十年得到實(shí)質(zhì)上的突破。

我們能加快這一進(jìn)程嗎?

Joshua Peterson 選中了一個(gè)新的工具,你不會(huì)陌生,它就是深度神經(jīng)網(wǎng)絡(luò)。正如 “數(shù)據(jù)實(shí)戰(zhàn)派” 所多次報(bào)道過(guò),深度神經(jīng)網(wǎng)絡(luò)已經(jīng)對(duì)自然科學(xué)產(chǎn)生了很大的影響,但在行為科學(xué)上的作用卻不如前者那么大,而 Joshua Peterson 所在的團(tuán)隊(duì)發(fā)表于 Science 的研究,便論證了機(jī)器學(xué)習(xí)為行為科學(xué)領(lǐng)域帶來(lái)新的可能性。論文題為 Machine-generated theories of human decision-making。

首先,他們通過(guò)亞馬遜的 Mechanical Turk 眾包服務(wù),開(kāi)發(fā)了一個(gè)大型的風(fēng)險(xiǎn)決策數(shù)據(jù)集,收集了人類對(duì)近 10000 個(gè) 風(fēng)險(xiǎn)選擇問(wèn)題的決定(例如文章開(kāi)頭的 “20% 的機(jī)會(huì)獲得 100 美元,80% 的機(jī)會(huì)獲得 50 美元” 這樣的問(wèn)題),用于測(cè)試和開(kāi)發(fā)圍繞人類風(fēng)險(xiǎn)決策的新理論。

據(jù)了解,這也是迄今為止最大規(guī)模的風(fēng)險(xiǎn)選擇實(shí)驗(yàn)產(chǎn)物。由于依賴大量初始假設(shè),先前在制定決策理論方面的努力通常涉及使用非常小的數(shù)據(jù)集,每次只關(guān)注少數(shù)幾個(gè)選擇問(wèn)題。過(guò)去,利用現(xiàn)代數(shù)據(jù)驅(qū)動(dòng)技術(shù)發(fā)現(xiàn)和評(píng)估人類判斷的新模型也時(shí)有出現(xiàn),但它們往往受限于小數(shù)據(jù)集,因而無(wú)法真正發(fā)揮其解釋行為的能力。

然后,他們利用這個(gè)數(shù)據(jù)集來(lái)訓(xùn)練了一個(gè)深度神經(jīng)網(wǎng)絡(luò),用以來(lái)預(yù)測(cè)人類行為,并系統(tǒng)地比較了這大模型與此前的小模型(如前景理論)對(duì)風(fēng)險(xiǎn)決策行為的預(yù)測(cè)能力。

結(jié)果發(fā)現(xiàn),由這個(gè)數(shù)據(jù)集驅(qū)動(dòng)的深度神經(jīng)網(wǎng)絡(luò)可以模仿人類的決定,其準(zhǔn)確度令人驚訝,已大大超過(guò)了現(xiàn)有的、由人類產(chǎn)生的風(fēng)險(xiǎn)選擇模型,深度神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)能力比前景理論高出幾個(gè)能級(jí)(當(dāng)模型在特定場(chǎng)景下預(yù)測(cè)出的選擇,和人類的預(yù)測(cè)重合 50% 以上,則該模型能夠預(yù)測(cè)該場(chǎng)景 )。

在他們的實(shí)驗(yàn)中,這個(gè)神經(jīng)網(wǎng)絡(luò)勝過(guò)了所提出的 50 多種風(fēng)險(xiǎn)決策理論,這表明目前的理論仍存在著差距。

4.png

基于神經(jīng)網(wǎng)絡(luò)的模型,以及傳統(tǒng)模型對(duì)風(fēng)險(xiǎn)決策預(yù)測(cè)誤差的對(duì)比

但是,這個(gè)模型所產(chǎn)生的理論見(jiàn)解是什么?

風(fēng)險(xiǎn)決策本身已經(jīng)是經(jīng)典決策理論中最基本和最廣泛研究的問(wèn)題之一。Reichman 指出,風(fēng)險(xiǎn)決策模型本來(lái)就只是人們?cè)谌粘I钪薪?jīng)常做出的決定的巨大復(fù)雜性的一個(gè)抽象。

為了分析這一點(diǎn),他們將傳統(tǒng)的風(fēng)險(xiǎn)選擇理論按照層次結(jié)構(gòu)進(jìn)行分類,然后不依靠具體的理論,訓(xùn)練神經(jīng)網(wǎng)絡(luò)來(lái)尋找最佳預(yù)期效用理論模型、最佳前景理論模型等。即判斷每一類理論的預(yù)測(cè)性如何,在它們之間進(jìn)行比較,便可以確定哪些理論是具有先鋒性的。

總之,論文作者相信,使用大型數(shù)據(jù)集加上機(jī)器學(xué)習(xí)算法,為發(fā)現(xiàn)新的認(rèn)知和行為現(xiàn)象提供了巨大的潛力,如果沒(méi)有這些工具,這些現(xiàn)象甚至將很難識(shí)別。

" 我認(rèn)為我們的研究提供了一個(gè)真正令人興奮的新例子,說(shuō)明行為科學(xué)有望在未來(lái)加速發(fā)展?!?這種方法有可能在發(fā)現(xiàn)和完善決策理論方面幫助節(jié)省幾年、甚至幾十年的時(shí)間。

References:

1、Joshua C. Peterson et al, Using large-scale experiments and machine learning to discover theories of human decision-making, Science (2021). DOI: 10.1126/science.abe2629/

2、Sudeep Bhatia et al, Machine-generated theories of human decision-making, Science (2021). DOI: 10.1126/science.abi7668

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉