從風險決策中的多次博弈到單次博弈——量變還是質變_第1頁
已閱讀1頁,還剩19頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、<p>  從風險決策中的多次博弈到單次博弈——量變還是質變?</p><p>  【內容提要】諾貝爾經(jīng)濟學獎獲得者Samuelson于1963年發(fā)現(xiàn)人們在單次和多次博弈條件下決策行為不一致。文章綜述了兩種博弈條件下人們決策行為的差異并質疑了這種差異的傳統(tǒng)理論解釋機制。描述或預測決策行為的風險決策理論其實只采用了一種評價法則——</p><p>  期望法則,始終沒有跳出“最大化

2、”的窠臼?;趯嶒炞C據(jù),我們推測,多次博弈時人們遵守了期望法則,而單次博弈時人們所遵循的是非補償性法則。從多次博弈到單次博弈,不單單是一種博弈次數(shù)上的變化(量變),而是代表了從期望法則(補償性法則)到非補償性法則兩種策略之間的轉變(質變)。最后,文章介紹了單次、多次博弈問題在醫(yī)療、應急管理以及投資領域的體現(xiàn),并呼吁更多的研究者關注單次、多次博弈問題。</p><p>  【關 鍵 詞】多次博弈/單次博弈/風險決策

3、/期望法則</p><p><b>  1、引言</b></p><p>  我們生活在一個充滿不確定性的社會,常常面臨和概率有關的風險決策。有時</p><p>  我們面臨的是只發(fā)生一次的風險事件,有時我們面臨的是重復多次的風險事件</p><p>  。例如,去二手市場買車,假設買到的車性能不好的概率是1/5,當我

4、們決定是</p><p>  否為自己買1輛車和是否為公司買100輛車時,可能會做出不同的決定。因為如果買1輛車,那么不管買到的車性能不好的概率是多少,我們都只能得到兩種結果,一種是買到好車,另一種是買到性能不好的車。而如果買100輛車,1/5則意味著100輛車里有20輛是性能不好的車。再如,假設某種藥物治療有1%的可能產(chǎn)生副作用,當醫(yī)生決定是否將這種藥物治療實施于1個病人還是100個病人時,可能做出不同的決策。

5、如果此藥物治療只在1個病人身上實施,就會有兩種結果,一種是沒有出現(xiàn)副作用,一種是出現(xiàn)副作用。如果此藥物治療在100個病人身上實施,1%則意味著100個病人里有1個病人將遭受到副作用的傷害。生活中這樣的例子屢見不鮮,那么只發(fā)生一次的風險事件和重復多次的風險事件究竟會對我們的決策產(chǎn)生怎樣不同的影響呢?本文嘗試就這個問題進行比較全面的述評。</p><p>  2、規(guī)范性理論學家眼中的問題</p><

6、;p>  在風險決策領域,規(guī)范性決策理論(normativedecision</p><p>  theory)假定,人們會按照補償性法則(compensatory</p><p>  rule)作決策,即根據(jù)一個風險選項的總價值或總效用(概率和可能結果的乘積</p><p>  之和)做出決策(Kahneman & Tversky, 1984)。其

7、中,最有具有代表性和影響力的規(guī)范性決策理論是期望效用理論(exp</p><p>  ected utility theory)。該理論認為,當面對概率性事件時,人們應該選擇具有最大期望效用 (expected utility,簡稱EU,指結果的效用和概率的乘積)的一項(von Neuman &</p><p>  Morgenstern,1947)。因為期望效用是基于對總體結果的

8、分析而來,所以期望</p><p>  效用理論所采用的是一種長遠(long-</p><p>  run)的策略。研究發(fā)現(xiàn),當風險事件只發(fā)生一次(single-</p><p>  play,譯為單次博弈)時,人們并不會使用這個策略,當同一風險事件重復多次(</p><p>  multiple-play,譯為多次博弈)時,人們卻能很好地遵

9、循這個策略。</p><p>  諾貝爾經(jīng)濟學獎獲得者Samuelson于1963年首次考察了人們在單次和多次博弈條件下的決策行為。一次午餐時,他向同事們提供了一個看似很有吸引力的擲硬幣游戲,如果正面朝上,擲幣者將獲得$200,如果反面朝上,擲幣者將損失$10</p><p>  0。即,50%的概率獲得$200,50%的概率損失$100。其中一個同事拒絕玩這個游戲,并表示如果讓他玩100

10、次的話,他才愿意接受這個游戲。這種貌似很合理的回答引起了Samuelson的關注,他認為這種拒絕一次而接受多次博弈的行為違背了期望效用理論。Samuelson在隨后撰寫的一篇專門論述這一現(xiàn)象的文章中,將這種偏愛重復多次博弈的行為稱為“大數(shù)謬論”(a fallacy of large numbers)(Samuelson,</p><p>  1963)。他證明,如果一個效用函數(shù)U(x),拒絕了在任何原有財產(chǎn)水平上

11、進行的</p><p>  博弈X,那么這個函數(shù)也將拒絕將此博弈重復任意次數(shù)后的總博弈S[,n](S[,n</p><p>  ]=∑[n][,i=1]X[,i])。即,假定其同事是按照期望效用最大化原則進行決策</p><p>  的人,既然他拒絕了只進行一次時的博弈,那么無論這個博弈重復多少次,他</p><p>  也不應該接受。Sam

12、uelson對于其同事在單次及多次博弈條件下的不一致決策現(xiàn)</p><p>  象,實際上并沒有做出非常系統(tǒng)的論證。Tversky和Bar-</p><p>  Hillel(1983)運用更規(guī)范的公理分析法(axiomatic analysis)推出,Samuelson</p><p>  同事(Samuelson's</p><p&g

13、t;  colleague,以下簡稱SC)的行為模式明顯違背了期望效用理論的傳遞性(transi</p><p>  tivity)原則和優(yōu)勢(dominance)原則。既然SC</p><p>  拒絕了只進行一次時的博弈,那么根據(jù)傳遞性原則和優(yōu)勢原則可以推導出,只進行一次時的博弈的效用大于重復任何次數(shù)的博弈的效用,所以他不應該接受重復100次的博弈。但隨后有一些研究者認為,這種行為模式

14、是符合期望效用理論的,并嘗試通過變換效用函數(shù),來使這種行為模式合理化(Lippman & Mamer,</p><p>  1988; Ross, 1999)。無論這些爭論孰是孰非,以上學者對這個問題的關注引發(fā)了更多的研究者開始探尋多次博弈與單次博弈之間的差異。</p><p>  3、多次博弈與單次博弈差異的實驗證據(jù)</p><p>  之后的大量實驗研究

15、表明,人們在進行風險決策時,博弈次數(shù)的不同確實會導致人們做出不一樣的決策,說明Samuelson同事的行為模式具有一定的普遍性。</p><p>  3.1 多次博弈比單次博弈更遵循期望價值理論</p><p>  最早關于風險決策的理論,是17世紀兩位法國數(shù)學家Pascal和Fermat所提出的</p><p>  期望價值理論(expectedvalue<

16、;/p><p>  theory),包括期望效用理論在內的規(guī)范性決策模型都是在其基礎上發(fā)展而來。</p><p>  該理論認為,一種結果為(x[,1],…,x[,n])和出現(xiàn)相應結果的可能性為(p[</p><p>  ,1],…,p[,n])的風險選項的吸引力是由其期望價值(expected</p><p>  value,簡稱EV)EV=∑

17、x[,i]p[,i]決定的(Machina,1987)。研究表明,人們</p><p>  在多次博弈時比單次博弈時更遵循補償性法則,簡單的期望價值理論就能夠很</p><p>  好的預測人們的行為。</p><p>  在多次博弈條件下,人們偏愛具有較大期望價值的混合博弈(既包含風險收益也包含風險損失的博弈)(DeKay & Kim, 2005; Ker

18、en, 1991; Klos. Weber, & Weber, 2005; Langer & Weber, 2001; Li, 2003; Montgomery & Adelbratt, 1982; Redelmeier & Tversky, 1992; Wedell & Bckenholt, 1994)。Li(2003)給被試提供一種抽球游戲:一個罐子里裝有100個球,其中88個是紅色的,12個

19、是黃色的。每一次將有一個球被隨機地抽出。有兩種玩法可供被試選擇:一種是不論什么顏色的球被抽出,被試都將獲得77元,即確定獲得77元(EV=77元);另一種是如果紅色的球被抽出,被試將獲得100元,如果黃色的球被抽出,被試將獲得0元,即88%的概率獲得100元,12%的概率獲得0元(E V=88元)。結果發(fā)現(xiàn),只允許抽球1次時,有51.5%的被試選擇了EV較大的第二種玩法;允許抽球100次時,有75.8%的被試選擇了第二種玩法。Montg

20、omery和Ade lb</p><p>  Tversky, 1992)。Redelmeier和Tversky(1992)給被試呈現(xiàn)博弈—— 50%的概率獲得$2000,50%的概率損失$500,只有43%的被試愿意接受這個博弈;當告訴被試這個博弈可以重復5次時,有63%的被試接受這個博弈;當給被試呈現(xiàn)5次博弈實際的結果分布時,83%的被試愿意接受這個博弈。上述研究大多基于選擇(choice)任務,另有學者對單

21、次、多次博弈條件下的判斷(judgment)任務也進行了探討。Colbert,Murry和Nieschwietz(2009)沿用Li(2003)的任務情境對單次、多次博弈條件下的判斷行為(問被試愿意花多少錢玩以上提到的抽</p><p>  球游戲)進行了研究,發(fā)現(xiàn)在多次博弈條件下,人們的對抽球游戲的出價(判斷)比在單次博弈條件下的出價更加符合EV,這與人們在完成選擇任務時采取的策略相同。</p>

22、<p>  3.2 單次博弈中的非理性現(xiàn)象在多次博弈中消失</p><p>  在風險決策領域,自期望效用理論提出后,研究者先后發(fā)現(xiàn)了一系列違背一般性決策公理或原則的現(xiàn)象,如確定性效應(certainty</p><p>  effect)、偏愛反轉(preference reversal)、框架效應(framing effect)現(xiàn)象等。但在多次博弈條件下,這些非理性現(xiàn)象減弱甚

23、至消失了。</p><p>  3.2.1 獨立性原則</p><p>  期望效用理論的一個基本假設是概率是線性的,因此獨立性原則(independence )被研究者普遍認為是風險決策的重要成分。然而,確定性效應的出現(xiàn)違背了獨立性原則。確定性效應指相對于可能的結果,人們會高估確定的結果(Kahneman</p><p>  & Tversky, 1979

24、)。在典型的確定性效應任務中,先給被試呈現(xiàn)一個確定的選項A和一個風險選項B(如選項A:確定獲得3元;選項B:80%的概率獲得4元,20%的概率獲得0元)。之后再給被試呈現(xiàn)風險選項A'和風險選項B’,這兩個風險選項是由選項A和選項B的概率都除以一個常數(shù)后得到的(如將選項A和選項B的概率同時都除以4后得到,選項A':25%的概率獲得3元;選項B’:20%的概率獲得4元)。結果發(fā)現(xiàn),在前一對選項中,大多數(shù)被試選擇選項A,而在后

25、一對選項中,大多數(shù)被試選擇選項B’,這稱為確定性效應。Keren和Wagenaar(1987)采用上述相同形式的實驗材料,讓被試分別在選項實施1次、10次和100次時做出選擇,結果表明,在單次博弈條件下出現(xiàn)了經(jīng)典的確定性效應,而在多次博弈條件下這種效應消失了。Barron和Erev(2003)的研究得到了同樣的結果。</p><p>  3.2.2 可傳遞性原則</p><p>  偏愛反

26、轉問題證明人們的行為或違背了期望效用理論的傳遞性原則或違背了過</p><p>  程不變性(procedure</p><p>  invariance)原則。在典型的偏愛反轉任務中,被試分別做一個選擇任務和一個</p><p>  出價任務。選擇任務要求被試在兩個風險選項中選擇一個所偏愛的選項(如A彩</p><p>  票:9/12的機

27、會贏得110元及3/12的機會失去10元;B彩票:3/12的機會贏得920</p><p>  元及9/12的機會失去200元);在出價任務中,要求被試對每個風險選項的價值</p><p>  進行評估(如上題中,要求被試給出愿意買A彩票和B彩票的價錢)。結果發(fā)現(xiàn),</p><p>  在選擇任務中,大多數(shù)人選擇大概率的彩票A,而在出價任務中,大多數(shù)人愿意</

28、p><p>  出更高的價錢購買小概率的彩票B。這就出現(xiàn)了偏愛反轉現(xiàn)象。Wedell和Bocken</p><p>  holt(1990)發(fā)現(xiàn),當告知被試風險選項可以重復實施10次和100次時,人們在選</p><p>  擇及出價這兩種任務下的偏愛一致性會比只實施1次時增強,偏愛反轉現(xiàn)象隨之</p><p><b>  減弱。<

29、;/b></p><p>  3.2.3 不變性原則</p><p>  1972年度諾貝爾經(jīng)濟學獎得主Arrow(1982)認為,成為規(guī)范抉擇理論所具備的基本條件之一是不變性(invariance)原則,即對一抉擇問題所作相等的闡述應該引出相同的偏愛順序。然而,框架效應的出現(xiàn)表明,對于同一個風險方案的二擇一決策會因為言語表述的改變而改變,具體表現(xiàn)為在收益框架下選擇確定選</p

30、><p>  項,在損失框架下選擇風險選項(Kahneman & Tversky,1979)。孫紅月、饒儷琳、周坤和李紓(2009)在關于應急預案的研究中,讓被試分別在收益和損失兩種條件下選擇應急預案(一個預案的結果估算是確定的,另一個預案的結果估算是風險的),當預案只實施1次時,被試表現(xiàn)出框架效應,而當預案被實施100次時,這種非理性效應亦消失了。此外,在多次博弈條件下,人們的模糊規(guī)避(ambiguity

31、aversion)傾向也都會有所減弱(Liu & Colman, 2009)。</p><p>  4、多次博弈和單次博弈差異的理論解釋機制</p><p>  4.1 以損失規(guī)避為主的解釋</p><p>  簡單地從心理學角度來看,重復100次的博弈確實比只進行一次的博弈更具有吸</p><p>  引力,因為它的期望收益為$50

32、00,并且損失的可能性非常小(小于1%)。Lopes(</p><p>  1981,1996)認為,對于單次博弈,不應該考慮規(guī)范性決策模型所倡導的長遠的</p><p>  期望值,規(guī)范性決策模型是違背常識的。因此他呼吁,應該對規(guī)范性決策模型</p><p>  進行修正。在風險決策領域,由于規(guī)范性決策模型不能很好地解釋和預測人們</p><p

33、>  的決策行為,出現(xiàn)了側重解釋和預測決策者實際決策行為的各種描述性決策模</p><p>  型。其中,最具代表性的模型之一是Kahneman和Tversky于1979年提出的預期理</p><p>  論(prospect</p><p>  theory)。該理論通過引入一個非線性的權重函數(shù)對期望效用理論做了修正,決</p><p&g

34、t;  策時人們用該函數(shù)值與結果的效用相乘,選取乘積值較大的方案。損失規(guī)避(lo</p><p><b>  ss</b></p><p>  aversion),來源于預期理論的價值函數(shù),指損失和獲益的心理效用并不等價,</p><p>  損失產(chǎn)生的負效用比客觀上等量獲益產(chǎn)生的正效用更大(Kahneman& Tversky,&l

35、t;/p><p>  1979)。SC最初就是用損失規(guī)避來解釋自己的行為。他認為損失$100和獲得$200</p><p>  相比較,感覺損失的會比較多(Samuelson,1963)。Aloysius(2007)用損失規(guī)避</p><p>  的概念來解釋SC的行為并從根本上質疑了Samuelson以及Tversky和Bar-</p><p>

36、;  Hillel的分析方法。他認為,以上學者在進行分析時,將重復100次的博弈等同</p><p>  于100次先后進行的單次博弈,這和SC對問題的架構是不同的,他將100次博弈</p><p>  看成是一個整體,由于損失規(guī)避心理的存在,重復100次的博弈確實比只進行一</p><p>  次時具有更大的吸引力。因為對于單次博弈來說,有50%的可能性遭受損失,

37、而</p><p>  對于100次博弈來說,有不到百分之一的可能性遭受損失。</p><p>  進而有學者認為,SC在面對單次博弈時所表現(xiàn)出的損失規(guī)避是一種短視性損失</p><p>  規(guī)避(myopiclossaversion)(Benartzi&Thaler,</p><p>  1999),即只看到眼前的博弈而忽略

38、以后遇到相同或者類似博弈的可能性,最后</p><p>  由于短視而表現(xiàn)出損失規(guī)避的傾向。類似地,Kahneman和Lovallo(1993)指出,</p><p>  Samuelson同事的決策框架是狹窄的(narrow</p><p>  framing),如果偏愛多次博弈,就應該先接受單次博弈,因為很可能在以后遇</p><p> 

39、 到其余的博弈。同理,Samuelson提供的博弈是單個博弈還是作為一系列博弈當</p><p>  中的一個博弈,可能會使SC做出不同的決策(Moher & Koehler, 2010)。研究者進一步發(fā)現(xiàn),即使當人們面對的博弈是多次博弈時,也容易由于短視的存在,傾向于只估計一次博弈的結果,而不會將多個單次博弈的結果整</p><p>  合在一起分析,最終因為損失規(guī)避使得多次博弈

40、的吸引力有所減弱(Benartzi & Thaler, 1999)。</p><p>  另外,還有一些解釋側重于將單次博弈和多次博弈的決策過程分為定性和定量</p><p>  兩個階段,如來自期望水平(aspiration</p><p>  level)的解釋,即在系統(tǒng)地對博弈進行定量評價之前,先將博弈與期望水平進</p><p&g

41、t;  行定性比較(Wedell & Bckenholt, 1990)。如果真的存在這樣一個階段的話,那么多次博弈將更可能超過期望水平從而進入下一個整合的定量評價階段,導致多次博弈和單次博弈出現(xiàn)不同。</p><p>  4.2 從多次博弈到單次博弈:量變?質變?</p><p>  仔細分析以上關于單次博弈和多次博弈之間差異的解釋,我們可以看出,無論是來自期望效用理論的觀點還是來

42、自預期理論的觀點,這些解釋均假定人們在單次博弈和多次博弈兩種條件下都遵循期望法則(補償性法則)做決策。從這個</p><p>  意義上講,這些解釋并沒有本質上的不同。然而,現(xiàn)有的實驗證據(jù)(DeKay & Kim, 2005; Keren, 1991; Klos, Weber, & Weber, 2005; Langer & Weber, 2001; Li, 2003; Montgomer

43、y & Adelbratt, 1982; Redelmeier & Tversky,</p><p>  1992; Wedell & Bckenholt, 1994)提示我們:期望法則也許只適用于多次博弈,而不適用于單次博弈。如果事實確實如此,那么對這個問題的解釋會不會發(fā)生本質的變化呢?</p><p>  應用于風險狀態(tài)下的第一個規(guī)范性決策理論是期望價值理論。此

44、后,迫于該理論不能預測及解釋行為,人們不斷地對風險狀態(tài)下的決策模式進行修訂。圣彼</p><p>  得堡悖論(St.Petersburg</p><p>  paradox)證明,如果人們的風險決策是某種期望值的最大化,那么這個期望值</p><p>  絕不是EV。而艾勒悖論(Allais</p><p>  paradox)又證明,如

45、果人們的風險決策還是某種期望值的最大化,那么這個期</p><p>  望值既不是EV也不是EU。然而,盡管在該領域的理論發(fā)展過程中,涌現(xiàn)了許多</p><p>  自認為不同的規(guī)范性或描述性決策模型,但是這些主流的決策模型實際上都只</p><p>  研究及采用了一種評價法則——期望法則(expectation</p><p>  rul

46、e)(李紓,2001;李紓等,2009)。他們預先假定被人們選中的方案一定是具備了某種“最大值”的方案,如果被選中的方案被證明不具備客觀上的“最大值”,他們就通過對客觀風險結果或者對結果的客觀概率做適當?shù)刂饔^轉化,繼而證明被選中的方案是具備了主觀上的“最大值”。所以,雖然這些主流的決策模型不斷地被質疑,之后又不斷地被修訂,但卻始終沒有跳出“最大化”的窠臼。這些模型的真正分歧并不在于人們是否遵循了期望法則,而是具體遵循了哪個最大化規(guī)則(L

47、i,1996)。在這一框架下,所有明顯不合邏輯的非理性行為,也最終被解釋為某種理性決策過程的結果。</p><p>  實驗證據(jù)表明,人們在單次和多次博弈條件下的決策行為表現(xiàn)出了本質的不同</p><p>  。在多次博弈時,人們更遵循期望法則作決策,簡單的期望價值理論就足以預</p><p>  測被試的決策行為。而單次博弈時,人們的決策行為并沒有和期望法則保持一

48、</p><p>  致。Li(2003)發(fā)現(xiàn),被試在單次博弈時并不遵循期望價值理論,而是遵循“齊</p><p>  當別”法則做決策。孫悅和李紓(2005)對澳門人風險知覺與賭博行為的研究表</p><p>  明,正確認識期望價值理論是一回事,而實際參與賭博又是另外一回事,期望</p><p>  價值理論并不會很好地指導人們的實踐活動

49、。汪祚軍、歐創(chuàng)巍和李紓(2010)通</p><p>  過對決策過程反應時的考察證明,基于期望法則的整合模型不能滿意地描述和</p><p>  解釋人們的實際決策過程,而基于非期望法則的齊當別模型則能解釋大部分實</p><p>  驗結果。Rao等人(2011)運用神經(jīng)影像學的手段探索了決策過程中的內在沖突。</p><p>  這項研

50、究表明,風險決策并不像補償性法則所描述的那樣,是一個通過加權求</p><p>  和的方式給選項賦值的過程,而是一個伴隨強烈沖突的非補償決策過程。汪祚</p><p>  軍和李紓(2012)采用眼動技術從決策過程視角對風險決策是否遵循補償性法則</p><p>  進行了檢驗。結果表明,自主決策任務條件下的決策過程反應時及信息搜索模</p><

51、;p>  式均不同于期望價值迫選任務條件下的決策過程反應時及信息搜索模式,從而</p><p>  說明風險決策并不遵循補償性法則。蘇寅和李紓(2010)也采用眼動技術從信息</p><p>  加工過程的角度考察了人們在風險決策過程中的決策特征,發(fā)現(xiàn)在單次博弈條</p><p>  件下時,更多地出現(xiàn)了基于特征(attribute-</p>&

52、lt;p>  based)的眼動軌跡,提供了風險決策使用非補償性法則的證據(jù),在多次博弈條</p><p>  件下,更多地出現(xiàn)了基于選項(option-</p><p>  based)的眼動軌跡,說明人們使用了補償性法則做決策。</p><p>  所有這些證據(jù)都表明,期望法則只適用于多次博弈,而單次博弈所遵循的是非補償性法則,如滿意(satisficing

53、)法則或齊當別(equate-to-differentiate)法則。從多次博弈到單次博弈,不單單是一種博弈次數(shù)上的變化(量變),而是代表了兩種策略之間的轉變(質變)。也許我們不應該再局限于在期望法則這個框架下研究多次博弈與單次博弈的差異。</p><p>  5、單次、多次博弈問題在現(xiàn)實生活中的體現(xiàn)</p><p><b>  5.1 醫(yī)療領域</b></p&

54、gt;<p>  20世紀90年代以來,一些研究者嘗試將多次博弈的研究應用到醫(yī)療領域,因為醫(yī)療工作者不僅要為單個病人選擇醫(yī)療方案,有時也要為患者群體選擇醫(yī)療方案,那么為患者群體選擇醫(yī)療方案則是一種多次博弈的形式。Redelmeier和Tve rsky(1990)發(fā)現(xiàn),當分別為個人和群體選擇醫(yī)療方案時,醫(yī)療工作者和學生被試都會做出不一致的決策。當醫(yī)生決定是否為患者實施一項額外的血液檢測時(該血液檢測可能會檢測出特殊病因,但要

55、花費被試$20),相比較于患者群體,醫(yī)生更傾向于為單個患者實施該血液檢測。同樣,學生被試推測,醫(yī)生更可能為單個有血液問題的患者使用一種有副作用的藥物(該藥物有85%的可能性將患者的壽命延長兩年,有15%的可能性將患者的生命減少兩年)。然而,隨后的研究者都沒有驗證Redelmeier和Tversky(1990)的結果,而是發(fā)現(xiàn)個體和群體的醫(yī)療決策之間不存在差異,為群體選擇治療方案時,和為個體選擇治療方案的情況是一樣的(DeKay, Her

56、shey, Spranca, Ubel, & Asch, 2006; DeKay & Kim 2005; DeKay, et al. 2000; Hux</p><p>  Minsk, & Baron, 1991)。所以,在以金錢為對象的博弈中人們所表現(xiàn)出的由于博弈次數(shù)不同導致的決策行為差異,并沒有擴展到包含個體和群體決策的醫(yī)療領域。其中最廣泛的解釋認為,不同病人采取同一治療方案而遭受的

57、病痛或者生死不能相互抵消( fungibility),而金錢的得失可以相互抵消,正是這種差異導致單次、多次博弈的研究結果在兩個領域出現(xiàn)了不同(DeKay, 2010; DeKay, et al., 2006; DeKay & Kim, 2005)。</p><p><b>  5.2 投資領域</b></p><p>  投資行為是現(xiàn)實生活中的一種博弈形式,和

58、多次博弈有著相似之處(Benartzi & Thaler,</p><p>  1999)。研究者將多次博弈的研究滲透到投資領域,相關的研究主要集中在幾個</p><p>  方面:一是投資期限(Investment</p><p>  horizon)是否會影響人們的投資組合(investment</p><p>  portfol

59、io)。一般而言,投資的時間越長,人們越愿意選擇風險大但回報也大</p><p>  的投資方案(Dierkes, Erner, & Zeisberger, 2010)。二是評估期(evaluation</p><p>  period)是否會影響人們的風險投資。近年來的相關研究表明,投資者的評估期</p><p>  越長,即越傾向于評估整體結果而不是頻繁

60、地對投資績效進行評估,他們會更</p><p>  愿意承擔風險(Bellemare,Krause, Kroger, & Zhang, 2005; Benartzi &</p><p>  Thaler,1999;Thaler,Tversky,Kahneman,&Schwartz,</p><p>  1997)。T

61、haler等人(1997)首次對此現(xiàn)象提供了直接的實驗證據(jù)。實驗中要求被</p><p>  試假想自己是一名投資經(jīng)理,現(xiàn)有兩種期望價值為正的基金可供投資,一個是</p><p>  低風險基金,另一個是高風險股票。被試需要通過經(jīng)驗來了解這兩種投資方式</p><p>  的風險和回報分布。結果發(fā)現(xiàn),當向被試提供1個月、1年以及5年評估期的投資</p>

62、<p>  回報時,得到5年評估期投資回報信息的被試愿意將更多的錢用于高風險高回報</p><p>  的股票投資。在群體投資決策的研究中同樣發(fā)現(xiàn)了評估期對投資決策的影響(Su</p><p>  tter,2007);這種現(xiàn)象在專業(yè)的交易人員中也有所表現(xiàn),甚至程度更大(Haigh</p><p>  & List, 2005)。</p&g

63、t;<p><b>  5.3 管理領域</b></p><p>  在醫(yī)療管理中,醫(yī)療政策的制定是基于整體效果的分析,依賴一些規(guī)范的決策分析方法,通過將不同個體由于采取醫(yī)療干預措施所得到的收益和損失加合在一起而制定出來的。而醫(yī)療政策的實施往往針對的是單個病人,政策在實施中的風險并不像理論預期的那么??;醫(yī)療政策的制定者更關注的是患者群體的利益,從而制定一個“最大化”的方案,但是

64、這對于患者本人或許并不是最優(yōu)的方案(Asch & Hershey, 1995; Zikmund-Fisher, Sarr, & Fagerlin, Ubel, 2006)。由此學者指出,醫(yī)療政策的制定和臨床實施之間存在差異,并質疑了一</p><p>  些影響甚廣的決策分析方法,如成本效益分析法(cost-effectiveness analysis)以及作為決策分析基礎的期望效用理論對于醫(yī)療政

65、策制定的指導性(A</p><p>  sch & Hershey, 1995; Cohen, 1996)。類似地,在應急管理領域,預先制定的應急預案是統(tǒng)計意義上的最優(yōu)方案,但在危機來臨時,應急管理者所做出的決策則屬于單次博弈?;诖耍瑢O紅月等人(2009)通過考察被試在正負兩種框架下對6對應急預案的選擇偏好,研究了應急預案制定和實施之間的行為差異。結果發(fā)現(xiàn),人們可以根據(jù)多次博弈的結果制定出基于期望價值原

66、則的最優(yōu)預案,但并不會切實地將其應用于單一的突發(fā)事件。在現(xiàn)實生活中,為了盡可能地減少由于政策不能很好地指導實踐所產(chǎn)生的不良后果,政策制定和實施之間的差距應該引起相關部門的關注,這也將成為今后心理學以及管理等相關學科的一個重要研究方向。</p><p><b>  6、研究展望</b></p><p>  在風險決策的理論研究中,20世紀以來的主流經(jīng)濟學始終堅持“理性人

67、”假設,認為人類具有穩(wěn)定而持續(xù)的偏好,人們據(jù)此做出各種理性的行為決策。但從上述關于多次博弈的研究推論,從多次博弈到單次博弈,不單單是一種博弈次數(shù)上的變化(量變),而是代表了從期望法則到非補償性法則這兩種策略之間的轉變(質變)。在以后的研究中,研究者不應再將兩種博弈形式都放在規(guī)范性決策理論的框架下,用期望法則去判定人們的行為是否合理,而是應從不同的角度來看待這兩種博弈形式。若能認識到這點,將會更有助于我們對單次、多次博弈問題的理解。<

68、;/p><p>  近年來一些學者在決策與推理的研究中提出雙系統(tǒng)(dual-</p><p>  process)作用模型,這或許能為解釋單次和多次博弈的差異提供一個很好的視</p><p>  角。雙系統(tǒng)作用模型,即基于直覺的啟發(fā)式系統(tǒng)(heuristic</p><p>  system)和基于理性的分析系統(tǒng)(analytic system)

69、(孫彥,李紓,殷曉莉,2007;Smith & DeCoster, 2000; Trimmer, et al., 2008; Frankish, 2010)。啟發(fā)式系統(tǒng)更多地依賴于直覺,并行加工且加工速度較快;分析系統(tǒng)更多地依賴于理性,串行加工且加工速度慢,主要基于規(guī)則進行。由此我們是否可以推測,人們在單次博弈時是在啟發(fā)式系統(tǒng)的指導下進行的,而多次博弈時人們更多地使用了分析式系統(tǒng)?當前,腦成像技術的出現(xiàn),為風險決策研究提<

70、/p><p>  供了新的研究視角和工具,有助于進一步探索人類決策行為背后的心理機制。研究者可以借助神經(jīng)科學手段,從神經(jīng)生理層面揭示導致單次、多次博弈行為差異的原因及作用機制,例如對雙系統(tǒng)作用模型能否解釋單次、多次博弈差異的檢驗。同時,由于單次博弈和多次博弈之間存在差異,在現(xiàn)實生活中我們應該盡量避免由于這種差異所帶來的損失和失誤,如以上提到的政策制定和實施之間的差距,希望更多的研究者將多次博弈問題應用于現(xiàn)實生活,發(fā)現(xiàn)

71、并解決實際問題。</p><p>  Samuelson為后人留下的這個極具挑戰(zhàn)性的問題引發(fā)了學者將近半個世紀的爭論。但近年來,這方面研究有些階段性停滯,希望借此機會呼吁國內更多的研究者關注單次、多次博弈問題。以上心理學類學術論文由才子城網(wǎng)上傳,如有侵權請及時通知,我們會及時刪除。</p><p><b>  【參考文獻】</b></p><p&g

72、t;  [1]李紓.(2001).艾勒悖論(Allais Paradox)另釋.心理學報,33(2),176~181.</p><p>  [2]李紓,畢研玲,梁竹苑,孫彥,汪祚軍,鄭蕊.(2009).無限理性還是有限理性?——齊當別抉擇模型在經(jīng)濟行為中的應用.管理評論,21(5),103~114.</p><p>  [3]蘇寅,李紓.(2010,10).從一次到多次,風險決策的眼動研究

73、,第十三屆全國心理學學術大會分組報告論文,上海.</p><p>  [4]孫紅月,饒儷琳,周坤,李紓(2009,11).最優(yōu)應急預案:制定和實施的本質差異.第十二屆全國心理學學術大會分組報告論文,濟南.</p><p>  [5]孫彥,李紓,殷曉莉.(2007).決策與推理的雙系統(tǒng)——</p><p>  啟發(fā)式系統(tǒng)和分析系統(tǒng).心理科學進展,15(5),721~8

74、45.</p><p>  [6]孫悅,李紓.(2005).澳門人的風險知覺與賭博行為.心理學報,37,260~26 7.</p><p>  [7]汪祚軍,李紓.(2012).對整合模型和占優(yōu)啟發(fā)式模型的檢驗:基于信息加工過程的眼動研究證據(jù),心理學報,印刷中.</p><p>  [8]汪祚軍,歐創(chuàng)巍,李紓.(2010).整合模型還是占優(yōu)啟發(fā)式模型?從齊當別模型視

75、角進行的檢驗.心理學報,42(8),821~833.</p><p>  [9]Aloysius, J. A.(2007). Decision making in the short and long</p><p>  run:Repeatedgamblesandrationality.BritishJournalof</p><p>  Mathe

76、matical and Statistical Psychology, 60(1),61~69.</p><p>  [10]Arrow, K. J.(1982). Risk perception in psychology and economics. Economic Inquiry, 20(1), 1~9.</p><p>  [11]Asch, D. A., & Hersh

77、ey, J. C.(1995). Why some health policies don't make sense at the bedside. Annals of Internal Medicine, 122, 846~850.</p><p>  [12]Barron, G., & Erev, I.(2003). Small feedback-based decisions and the

78、ir limited correspondence to description-based decisions. Journal of Behavioral Decision Making, 16, 215~233.</p><p>  [13]Bellemare, C., Krause, M., Kroger, S., & Zhang, C.(2005). Myopic loss aversion:

79、Information feedback vs. investment flexibility. Economics Letters, 87(3), 319~324.</p><p>  [14]Benartzi, S., & Thaler, R. H.(1999). Risk aversion or myopia? Choices in repeated gambles and retirement i

80、nvestments. Management Science, 45, 364~381.</p><p>  [15]Cohen, B. J.(1996). Is expected utility theory normative for medical decision making. Medical Decision Making, 16,1~6.</p><p>  [16]Colb

81、ert,G., Murray D., & Nieschwietz R.(2009). The use of expected value in pricing judgments. Journal of Risk Research, 12, 199~208.</p><p>  [17]DeKay, M. L.(2010)Are medical outcomes fungible? A survey of

82、 voters, medical administrators, and Physicians. Medical Decision Making(online), DOI:10.1177/0272989X10373146</p><p>  [18]DeKay, M. L., Hershey, J. C., Spranca, M. D., Ubel, P. A., & Asch, D. A.(2006).

83、 Are medical treatments for individuals and groups like single-play and multiple-play gambles? Judgment and Decision Making, 1(2), 134~145.</p><p>  [19]DeKay, M. L., & Kim, T. G.(2005). When things don&

84、#39;t add up.</p><p>  Psychological Science, 16, 667~672.</p><p>  [20]DeKay, M. L., Nickerson, C. A. E., Ubel, P. A., Hershey, J. C., Spranca, M. D., & Asch, D. A.(2000). Further explorati

85、ons of medical decisions for individuals and for groups. Medical Decision Making, 20, 39~44.</p><p>  [21]Dierkes, M., Erner, C., & Zeisberger, S.(2010). Investment horizon and the attractiveness of inve

86、stment strategies: A behavioral approach. Journal of Banking & Finance, 34(5),1032~1046.</p><p>  [22]Frankish, K.(2010). Dual-process and dual-system theories of</p><p>  reasoning. Philoso

87、phy Compass, 5, 914~926.</p><p>  [23]Haigh, M. S., & List, J. A.(2005). Do professional traders exhibit myopic loss aversion? An experimental analysis. Journal of Finance, 60, 523~534.</p><p&

88、gt;  [24]Hux, J. E., Levinton, C. M., & Naylor, C. D.(1994).Prescribing propensity: Influence of life-expectancy gains and drug costs. Journal of General Internal Medicine, 9,195~201.</p><p>  [25]Kahnem

89、an, D., & Lovallo, D.(1993). Timid choices and bold forecasts: A cognitive perspective on risk taking. Management Science, 39, 17~31.</p><p>  [26]Kahneman, D., & Tversky, A.(1979). Prospect theory:

90、An analysis of decision under risk. Econometrica, 47,263~291.</p><p>  [27]Kahneman, D., & Tversky, A.(1984). Choice, values, and frames. American Psychologist, 39(4), 341~350.</p><p>  [28]

91、Keren, G.(1991). Additional tests of utility theory in unique and repeated gambles. Journal of Behavioral Decision Making, 4, 297~304.</p><p>  [29]Keren, G., & Wagenaar, W. A.(1987). Violation of utilit

92、y theory in unique and repeated gambles. Journal of Experimental Psychology: Learning, Memory and Cognition, 13, 387~391.</p><p>  [30]Klos, A., Weber, E. U., & Weber, M.(2005). Investment decisions and

93、time horizon: Risk perception and risk behavior in repeated gambles. Management Science, 51,1777~1790.</p><p>  [31]Langer,T.,&Weber,M.(2001).Prospecttheory,mental</p><p>  accounting

94、, and differences in aggregated and segregated evaluation of lottery portfolios. Management Science, 47,716~733.</p><p>  [32]Li, S.(1996). What is the price for utilizing deductive reasoning? A reply to gen

95、eralized expectation maximizers. Journal of Economic Behavior and Organization, 29(2),355~358.</p><p>  [33]Li, S.(2003). The role of expected value illustrated in decision-making under risk: Single-play vs.

96、 multiple-play, Journal of Risk Research, 6(2), 113~124.</p><p>  [34]Lippman, S. A., & Mamer, J. W.(1988). When many wrongs make a right. Probability in the Engineering and Information Sciences, 2, 115~

97、127.</p><p>  [35]Liu, H. H., & Colman, A. M.(2009). Ambiguity aversion in the long run: Repeated decisions under risk and uncertainty. Journal of Economic Psychology, 30, 277~284.</p><p>  

98、[36]Lopes, L. L.(1981). Decision making in the short run. Journal of Experimental Psychology: Human Learning and Memory, 7(5), 377~385.</p><p>  [37]Lopes, L. L.(1996). When time is of the essence: Averaging

99、, aspiration, and the short run. Organizational Behavior and Human Decision Processes, 65, 179~189.</p><p>  [38]Machina, M. J.(1987). Choice under uncertainty: Problems solved and unsolved. The Journal of E

100、conomic Perspectives, 1(1), 121~154.</p><p>  [39]Moher, E., & Koehler, D. J.(2010). Bracketing effects on risk tolerance: Generalizability and underlying mechanisms. Judgment and</p><p>  D

101、ecision Making, 5(5),339~346.</p><p>  [40]Montgomery, H., & Adelbratt, T.(1982). Gambling decisions and information about expected value. Organizational Behavior and Human Performance, 29,39~57.</p&g

102、t;<p>  [41]Rao, L.-L., Zhou, Y., Xu, L.-J., Liang, Z.-Y., Jiang, T.-Z.,& Li, S.(2011). Are risky choices actually guided by a compensatory process? New insights from fMRI. PLoS One, 6(3), e14756.</p>&

103、lt;p>  [42]Redelmeier, D. A., & Tversky, A.(1990). Discrepancy between medical decisions for individual patients and for groups. New England Journal of Medicine, 322,1162~1164.</p><p>  [43]Redelmeier

104、, D. A., & Tversky, A.(1992). On the framing of multiple prospects. Psychological Science, 3, 191~193.</p><p>  [44]Ross, S. A.(1999). Adding risks: Samuelson's fallacy of large numbers revisited. Jo

105、urnal of Financial and Quantitative Analysis, 34(3), 323~339.</p><p>  [45]Samuelson, P. A.(1963). Risk and uncertainty: A fallacy of large numbers. Scientia, 98, 108~113.</p><p>  [46]Smith, E.

106、 R., & DeCoster, J.(2000). Dual-process models in social and cognitive psychology: Conceptual integration and links to underlying memory systems. Personality and Social Psychology Review, 4, 108~131.</p><p

107、>  [47]Spranca, M., Minsk, E., & Baron, J.(1991). Omission and commission in judgment and choice. Journal of Experimental Social Psychology, 27, 76~105.</p><p>  [48]Sutter, M.(2007). Are teams prone

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論