10億美元還是蝸牛追殺?上海大學副教授發(fā)Science 讓機器幫你決策
做選擇對于一個人來說有多難又多有趣?
再來看看知乎上問題,10億美元和會追殺人的蝸牛?

這個看似荒誕的問題恰恰來自諾貝爾經(jīng)濟學獎獲得者卡尼曼等人于1979年提出的前景理論(Prospect Theory)。
以20%的概率得到100美元,或以80%的概率得到50美元。如果面臨這樣的選擇,你會選擇哪個?
前景理論認為人們在面臨獲得時往往小心翼翼,不愿冒風險;在失去時會很不甘心,更容易冒險。人們對損失的痛苦感要大大超過獲得時的快樂感。
選擇是每個人無數(shù)次要面臨的問題,從個人衣食住行到國際間邦交誓盟,選擇或決策無處不在。.很多時候,選擇或決策是困難的。人們不但會面臨諸多兩難選擇,還經(jīng)常受到情緒、偏好、認知水平等因素的影響。
如果讓AI替你決策,你會聽他的嗎?
《科學》(Science)雜志最近刊登了一篇文章,通過大數(shù)據(jù)的方式來為人類做決策。

本文的兩個作者為上海大學悉尼工商學院擬聘的副教授何黎勝博士和美國賓夕法尼亞大學Sudeep Bhatia。
何黎勝博士于2020年加入上海外國語大學國際工商管理學院, 擔任工商管理系助理教授。2017年畢業(yè)于英國華威大學商學院(Warwick Business School)行為科學系,獲管理學博士學位,美國賓夕法尼亞大學(University of Pennsylvania)博士后研究員(2017-2020)。主要研究方向是行為經(jīng)濟學和決策神經(jīng)科學,研究課程包括決策行為與心理、人類學習行為、以及風險決策、跨期決策、社會決策的心理與認知神經(jīng)機制。他的研究文論發(fā)表于Psychological Review和Cognitive Psychology等國際頂尖心理學期刊,并擔任Psychological Review,Decision, Journal of Experimental Psychology: General, Cognitive Psychology, Journal of Mathematical Psychology等國際著名期刊的審稿人。
文章的第一作者Sudeep Bhatia認為,這些理論本身只在小數(shù)據(jù)集的選擇上進行測試,很少與大數(shù)據(jù)集模型進行比較。考慮到?jīng)Q策研究的跨學科歷史和風險選擇的復(fù)雜性,這是不可避免的:決策者很容易憑直覺對預(yù)期效用的偏差作出心理解釋。而且,很多新理論模型通常類似于先前發(fā)布的模型,許多理論在基準數(shù)據(jù)集上高度模仿彼此的預(yù)測。
何黎勝認為,盡管新理論模型產(chǎn)生的速度正在加快,但在過去20年中,這些數(shù)據(jù)集的預(yù)測精度幾乎沒有提高。其根本原因是我們的認知系統(tǒng)具有高度復(fù)雜性。風險決策看似簡單。如果問大學生或高中生如何做風險決策,他們中的大多數(shù)人可能會說我們先算出每個選項的期望價值,然后選擇期望價值最高的選項。
但風險決策比這復(fù)雜得多,受到多種認知和情感因素影響。以往研究者通過考慮這些影響因素,對風險決策行為提出了多種理論解釋模型。
在何黎勝與南丹麥大學教授Pantelis Analytis和賓夕法尼亞大學教授Sudeep Bhatia共同完成的另一項研究中,通過群體智慧算法整合不同的認知與情感因素,我們發(fā)現(xiàn)這樣的集成模型能顯著地提高對決策行為的預(yù)測能力。這里的集成模型也是一種大模,它的預(yù)測精度也超過了前景理論。
經(jīng)過學習和訓(xùn)練,深度神經(jīng)網(wǎng)絡(luò)能夠模仿人類的行為,它甚至可以像人類在做選擇時會有不理性的行為那樣,表現(xiàn)出非理性。因此,用它來預(yù)測人類決策行為會大大提高預(yù)測精度。
人工智能、認知神經(jīng)科學的發(fā)展,將為心理學、決策科學的發(fā)展提供有力的研究手段。得益于學術(shù)界和工業(yè)界的大模型投入,近年來人工智能和認知神經(jīng)科學發(fā)展迅速,涌現(xiàn)出大量的開創(chuàng)性研究,也為其他學科提供了成熟的研究工具。
在決策研究中,研究人員會研究不同類型的決策,像風險決策、跨期決策、社會決策、博弈決策等。目前,對這些不同決策類型的研究和建模工作通常相互獨立。然而,從認知的角度,不同的決策類型必然有互聞共通的認知與情感機制。而不同決策類型之間互聞共通的建模研究還非常稀缺,未來完全有可能通過與人工智能、認知神經(jīng)科學融合,實現(xiàn)不同決策類型的互聞建模。
目前,管理科學越來越趨向于數(shù)據(jù)驅(qū)動的決策。在工業(yè)界和公共政策等領(lǐng)域,越來越多的公司和組織實驗方法(如A/B 測試)獲得實證數(shù)據(jù),通過分析實證數(shù)據(jù)達到?jīng)Q策優(yōu)化的目的。

然而,目前這種數(shù)據(jù)驅(qū)動的決策有不小的局限性。其中一個重要原因是管理者很多時候面臨的是一個復(fù)雜的動態(tài)系統(tǒng),是由多種因素交織而成的綜合體。但A/B測試等方法收集到的數(shù)據(jù)往往是針對某個特定的小點,對復(fù)雜決策中多因素之間的交錯互動缺乏全局把握,限制了A/B測試實驗數(shù)據(jù)的適用性。
機器生成理論可以更大程度地利用A/B測試等方法收集到的數(shù)據(jù)。更為重要的是,機器生成理論足夠靈活,我們可以用真實的數(shù)據(jù)去訓(xùn)練這個系統(tǒng),讓它不斷地逼近真實的管理場景。
未來,訓(xùn)練好的機器生成理論模型可以自動地對復(fù)雜管理場景中的事件作出反應(yīng)。也就是說,機器生成理論有能力將分散的實驗數(shù)據(jù)升華成具有邏輯一致性的體系,實現(xiàn)復(fù)雜管理決策的自動化、智能化。





















