公共品博弈的空間效應(yīng)研究【開(kāi)題報(bào)告+文獻(xiàn)綜述+畢業(yè)論文】_第1頁(yè)
已閱讀1頁(yè),還剩26頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、<p><b>  畢業(yè)論文開(kāi)題報(bào)告</b></p><p><b>  理論物理</b></p><p>  公共品博弈的空間效應(yīng)研究</p><p><b>  選題的背景與意義</b></p><p>  無(wú)論對(duì)于生物界種群的進(jìn)化還是人類社會(huì)的發(fā)展,合作都扮演著

2、至關(guān)重要的角色。然而,自私個(gè)體之間的無(wú)私利他行為與達(dá)爾文的物競(jìng)天擇理論是相互抵觸的。在尋求這一問(wèn)題的答案的過(guò)程中,博弈論以及演化博弈論扮演了重要角色并提供了強(qiáng)有力的理論框架。</p><p>  社會(huì)和自然界中復(fù)雜系統(tǒng)的結(jié)構(gòu)形態(tài)和系統(tǒng)結(jié)構(gòu)可以從網(wǎng)絡(luò)的角度進(jìn)行描述。近年來(lái),復(fù)雜網(wǎng)絡(luò)研究的興起與發(fā)展,使得人們對(duì)各種現(xiàn)實(shí)網(wǎng)絡(luò)的結(jié)構(gòu)演化、復(fù)雜性有了比較清晰的認(rèn)識(shí)。而復(fù)雜網(wǎng)絡(luò)理論為描述博弈個(gè)體之間的博弈關(guān)系提供了方便的系統(tǒng)

3、框架。網(wǎng)絡(luò)上的節(jié)點(diǎn)表示博弈個(gè)體,邊代表與其鄰居的博弈關(guān)系。這樣一來(lái),就可以利用復(fù)雜網(wǎng)絡(luò)拓?fù)潢P(guān)系,來(lái)研究一些復(fù)雜的博弈關(guān)系下的博弈。由于真實(shí)系統(tǒng)中的個(gè)體或要素之間存在策略依賴關(guān)系,所以可在復(fù)雜網(wǎng)絡(luò)上建立空間博弈模型。在復(fù)雜網(wǎng)絡(luò)上建立的空間博弈模型更加客觀真實(shí),更加符合實(shí)際的演化規(guī)則,更加貼切生活,使得復(fù)雜網(wǎng)絡(luò)的演化博弈方興未艾。隨著演化博弈動(dòng)力學(xué)行為與復(fù)雜網(wǎng)絡(luò)之間的關(guān)系逐漸清晰,空間博弈必定會(huì)推動(dòng)復(fù)雜網(wǎng)絡(luò)中其他領(lǐng)域的發(fā)展。而本文將在了解公

4、共品模型的研究現(xiàn)狀和數(shù)值方法基礎(chǔ)上,通過(guò)數(shù)值方法研究個(gè)體的各類空間效應(yīng),探索各類空間效應(yīng)對(duì)公共品博弈中合作行為的影響,從而得到相應(yīng)的研究成果。</p><p>  二、研究的基本內(nèi)容與擬解決的主要問(wèn)題</p><p>  1、對(duì)公共品模型的研究現(xiàn)狀和數(shù)值方法進(jìn)行文獻(xiàn)調(diào)研</p><p>  2、 在了解前人的模型工作的基礎(chǔ)上,獨(dú)立進(jìn)行模型建立</p>

5、<p>  3、對(duì)所建立的模型進(jìn)行計(jì)算分析,得到研究結(jié)果</p><p>  4、對(duì)研究結(jié)果進(jìn)行總結(jié)分析,撰寫(xiě)出實(shí)驗(yàn)論文</p><p>  三、研究的方法與技術(shù)路線</p><p>  1、在公共品模型框架下,分析各種可能的空間行為,基于相關(guān)文獻(xiàn)及前人模型工</p><p>  作之上獨(dú)立建立模型 </p>&l

6、t;p>  2、對(duì)所建立模型通過(guò)數(shù)值方法研究個(gè)體的各類空間效應(yīng)從而得到研究結(jié)果</p><p>  四、研究的總體安排與進(jìn)度</p><p>  2010.12.15 完成基本文獻(xiàn)的閱讀,了解基本原理和研究背景</p><p>  2010.12.16-2011.1.15 熟悉基本數(shù)值方法,并提出自己新的模型</p>&

7、lt;p>  2011.2.-2011.3 進(jìn)行模型計(jì)算和分析</p><p>  2011.4 進(jìn)行總結(jié)并撰寫(xiě)論文,準(zhǔn)備答辯</p><p><b>  五、主要參考文獻(xiàn)</b></p><p>  Nowak M A and Sigmund K, 2004 Science 303, 793&

8、lt;/p><p>  2、Szabo G and Fath G, 2007 Phys. Rep. 446, 97</p><p>  3、Doebeli M, Hauert C and Killingback T, 2004 Science 306, 859</p><p>  4、Nowak M A and May R M, 1992 Nature 359, 826

9、</p><p>  5、Hauert C and Doebeli M, 2004 Nature 428, 643</p><p>  6、Santos F C and Pacheco J M, 2005 Phys. Rev. Lett. 95, 098104</p><p>  7、復(fù)雜網(wǎng)絡(luò)上的演化博弈 智能系統(tǒng)學(xué)報(bào)167324785 (2007) 0

10、220001210</p><p>  8、復(fù)雜網(wǎng)絡(luò)上博弈行為的研究進(jìn)展 電子測(cè)量技術(shù)第30卷第4期 TP39</p><p>  9、復(fù)雜網(wǎng)絡(luò)演化博弈理論研究綜述 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué)第5卷第4期</p><p>  10、博弈[M] 白波,郭興文 哈爾濱出版社 2005.</p><p><b>  畢業(yè)論文文獻(xiàn)綜述

11、</b></p><p><b>  物理學(xué)</b></p><p>  公共品博弈的空間效應(yīng)研究</p><p>  摘要:博弈理論在社會(huì)、經(jīng)濟(jì)、生物以及生態(tài)等系統(tǒng)中存在著廣泛的應(yīng)用, 復(fù)雜網(wǎng)絡(luò)理論則是研究復(fù)雜系統(tǒng)全新而有力的工具, 因此將博弈理論與復(fù)雜網(wǎng)絡(luò)理論相結(jié)合成為研究復(fù)雜系統(tǒng)一個(gè)新的熱點(diǎn)概述國(guó)內(nèi)外當(dāng)前關(guān)

12、于復(fù)雜網(wǎng)絡(luò)上博弈動(dòng)力學(xué)的研究情況和發(fā)展動(dòng)態(tài), 包括基本的博弈模型、主要關(guān)注的問(wèn)題、以及網(wǎng)絡(luò)結(jié)構(gòu)和博弈動(dòng)力學(xué)的相互作用等, 最后探討進(jìn)一步的研究課題。</p><p>  關(guān)鍵詞:復(fù)雜網(wǎng)絡(luò) 演化博弈 合作行為</p><p><b>  正文:</b></p><p>  我閱覽了大量關(guān)于復(fù)雜網(wǎng)絡(luò)和博弈的相關(guān)文獻(xiàn)資料。不管是書(shū)

13、目、期刊、論文,在這兩方面的研究都始終是蓬勃發(fā)展碩果累累的。然而關(guān)于博弈的問(wèn)題最終都要?dú)w結(jié)到對(duì)于合作的探究。根據(jù)博弈論,合作能給種群內(nèi)的其他成員帶來(lái)好處,卻常常會(huì)損害個(gè)體自身的利益。根據(jù)達(dá)爾文進(jìn)化論最適者生存的自然法則,有益于種群內(nèi)所有成員的合作行為應(yīng)該滅絕。然而,事實(shí)并非如此。在真實(shí)的生物、社會(huì)等復(fù)雜系統(tǒng)中在生物和社會(huì)等科學(xué)領(lǐng)域,合作是一種普遍存在的現(xiàn)象。從單細(xì)胞的微生物到高級(jí)哺乳動(dòng)物,從社會(huì)性昆蟲(chóng)到人類社會(huì)。生物個(gè)體之間的合作,增加

14、了整個(gè)種群的生存機(jī)會(huì)。那么自私個(gè)體間合作是如何產(chǎn)生和維持的,成為人們討論的熱點(diǎn)問(wèn)題。為了理解合作行為是如何從自私的個(gè)體之間演化產(chǎn)生的,近年來(lái),一些可能的合作機(jī)理。如群體選擇、親緣選擇、直接(間接)互惠、空間互惠、聲望與懲罰等得到一定的探討。自從Alelrod利用迭代囚徒困境博弈研究合作的演化以來(lái),演化博弈論為研究合作演化提供了方便的數(shù)學(xué)框架,受到越來(lái)越多的關(guān)注,囚徒困境博弈和雪堆博弈是被研究者廣泛采用的研究合作行為的兩個(gè)范例。</

15、p><p>  在經(jīng)典博弈論中,個(gè)體被假定是超理性的(所有個(gè)體都知道其他個(gè)體也是理性的,并且會(huì)按照理性行事),且個(gè)體對(duì)收益矩陣元的信息完全了解。在這種機(jī)制下,所有個(gè)體最終都會(huì)采取納什平衡策略。但是這種個(gè)體的超理性會(huì)導(dǎo)致機(jī)體的非理性(因?yàn)橄嗷ズ献鲿r(shí)集體的收益最大)。一般而言,在復(fù)雜的環(huán)境中個(gè)體沒(méi)有充分的能力去選擇最佳策略以最大化收益。此時(shí),個(gè)體通常根據(jù)其所掌握的局部信息采取啟發(fā)式的方法,做出令其“滿意”的決策,這種選擇

16、過(guò)程表明個(gè)體是有限理性的。演化博弈理論著重研究有限性的個(gè)體如何在重復(fù)博弈過(guò)程中,通過(guò)自適應(yīng)學(xué)習(xí)來(lái)實(shí)現(xiàn)自身收益的最大化問(wèn)題。</p><p>  復(fù)雜網(wǎng)絡(luò)理論為描述博弈個(gè)體之間的博弈關(guān)系提供給了方便的框架。由于真實(shí)系統(tǒng)中的個(gè)體或要素之間存在策略依賴關(guān)系,所以可在復(fù)雜網(wǎng)絡(luò)上建立空間博弈模型。這樣就可以利用復(fù)雜網(wǎng)絡(luò)拓?fù)潢P(guān)系來(lái)研究一些復(fù)雜博弈關(guān)系下的博弈。由于真實(shí)的社會(huì)網(wǎng)絡(luò)比一些模型網(wǎng)絡(luò)復(fù)雜,而后者通常只是前者的一個(gè)特性

17、或某些特性的反映,因此研究真實(shí)社會(huì)網(wǎng)絡(luò)上的演化博弈對(duì)揭示合作的演化具有重要意義。而小世界效應(yīng)、無(wú)標(biāo)度性質(zhì)等對(duì)網(wǎng)絡(luò)上演化博弈的影響自然受到了研究者的關(guān)注,成為了有意義的課題。</p><p>  公共品博弈是以公共品為博弈對(duì)象的博弈,這種博弈廣泛存在于發(fā)雜網(wǎng)絡(luò)之中。一般來(lái)說(shuō),公共品是指在消費(fèi)過(guò)程中具有非競(jìng)爭(zhēng)性和非排他性的物品。因?yàn)楣财肪哂羞@樣的性質(zhì),所以集體中的每個(gè)人都會(huì)希望由其他人來(lái)提供,而自己坐享其成,這種行

18、為被稱為搭便車。搭便車問(wèn)題使集體行動(dòng)變得難以實(shí)現(xiàn)——每個(gè)人都想搭便車的結(jié)果,就是沒(méi)有便車可搭。 搭便車問(wèn)題的存在,解釋了很多社會(huì)困境。例如,惡劣的環(huán)境無(wú)人清理,不合理的制度人人抱怨卻無(wú)人抵制。 </p><p>  公共品博弈的理論結(jié)果和現(xiàn)實(shí)的差異是巨大的。大量的實(shí)驗(yàn)研究表明,集體成員的搭便車動(dòng)機(jī)是有限的,合作能夠達(dá)到一個(gè)客觀且穩(wěn)定的水平。這就表明,在重復(fù)公共品博弈過(guò)程中,個(gè)體不僅要考慮自身收益,還受到很多外在因

19、素的影響,如激勵(lì)與懲罰,而且社會(huì)系統(tǒng)中的個(gè)體還具有某種異質(zhì)性——稱為社會(huì)偏好,這種社會(huì)偏好使得個(gè)體會(huì)考慮他人的選擇,具體表現(xiàn)為互惠、不平等厭惡、學(xué)習(xí)和遷移等。很顯然,這些外在因素的存在會(huì)降低個(gè)體搭便車的動(dòng)機(jī),并提高合作水平。</p><p>  關(guān)于公共品博弈的研究貫穿各個(gè)方面,在生物與科學(xué)領(lǐng)域的研究尤為顯著。我主要列舉了一下三種說(shuō)法:</p><p>  群體選擇學(xué)說(shuō):群體選擇學(xué)說(shuō)將種群

20、看作一個(gè)進(jìn)化的單位,在群體層次上考慮公共品博弈。在群體中,那些對(duì)種群有利的特征之所以能夠保存下來(lái),是因?yàn)樵谶M(jìn)化過(guò)程中,雖然群選擇與個(gè)體選擇的方向是相反的,但是個(gè)體的選擇可能導(dǎo)致種群的滅亡,這種來(lái)自于外部的壓力促使個(gè)體間相互合作。</p><p>  互惠和強(qiáng)互惠效應(yīng):互惠機(jī)制包括直接互惠和間接互惠。直接互惠中的個(gè)體之所以冒著可能會(huì)被背叛的風(fēng)險(xiǎn)去跟其他個(gè)體合作是因?yàn)橄M谌蘸笈c該個(gè)體再次進(jìn)行博弈時(shí)能夠取得更大的收益

21、,所以回報(bào)才是互惠利他主義者的真正目的。間接互惠的基礎(chǔ)是“聲譽(yù)”。個(gè)體選擇跟其他個(gè)體進(jìn)行合作是期望提高自己的聲譽(yù),得到更多個(gè)體的合作,但是這種合作是不穩(wěn)定的。直接互惠和間接互惠都無(wú)法很好的解決公共品博弈中的合作現(xiàn)象,這種情況下,強(qiáng)互惠理論應(yīng)運(yùn)而生。</p><p>  強(qiáng)互惠理論認(rèn)為,人類之所以能維持比其他物種更高度的合作關(guān)系,在于許多人都具有這樣一種行為傾向:在團(tuán)體中與別人合作,并不惜花費(fèi)個(gè)人成本去懲罰那些破壞

22、群體規(guī)范的人,即使這些成本并不能被預(yù)期得到補(bǔ)償。強(qiáng)互惠能夠有效的抑制團(tuán)體中的背叛、逃避責(zé)任和搭便車行為,提高合作水平。但實(shí)施這種行為需要個(gè)人承擔(dān)成本,這樣就帶來(lái)一個(gè)新的問(wèn)題,成本由誰(shuí)來(lái)負(fù)擔(dān)?每一個(gè)合作者都會(huì)寄希望于其它合作者承擔(dān)這個(gè)成本,即所謂“二階搭便車問(wèn)題”。解決這個(gè)問(wèn)題又產(chǎn)生了許多討論,包括合作懲罰以及制度的制定等。</p><p>  空間效應(yīng): 由于真實(shí)系統(tǒng)中的個(gè)體或要素之間存在策略依賴關(guān)系,我們可以

23、在各種網(wǎng)絡(luò)上建立空間博弈模型,這樣又發(fā)現(xiàn)了許多空間因素的影響。比如說(shuō)公共品博弈中獨(dú)立者的引入——獨(dú)立者是在公共品博弈模型中引入不參與博弈,但會(huì)每局收到少而固定的收益的獨(dú)立者。這樣,在一定r下,就會(huì)出現(xiàn)一種動(dòng)態(tài)平衡。除此之外還有很多各種各樣的影響,如網(wǎng)絡(luò)的影響(不同的網(wǎng)絡(luò)對(duì)于合作的促進(jìn)作用也是不同的)、策略的改變(在博弈中引入學(xué)習(xí)和遷移的策略,個(gè)體在博弈中有一定的幾率改變策略和交換位置)等等,也會(huì)明顯影響博弈的結(jié)果。</p>

24、<p>  復(fù)雜網(wǎng)絡(luò)上的演化博弈研究是近年來(lái)隨著復(fù)雜網(wǎng)絡(luò)研究興起而逐漸引起關(guān)注的一個(gè)重要研究領(lǐng)域。目前大部分工作都集中在囚徒困境博弈或雪堆博弈研究上,其他類型的博弈還缺乏系統(tǒng)的研究。因此有必要進(jìn)一步考慮多人博弈的情形,如公用品博弈——本文所主要研究的課題,或多策略的博弈等。如石頭- 剪刀- 布( rock-scissors-paper) 博弈. 近來(lái)一些學(xué)者開(kāi)始關(guān)注這些問(wèn)題,也得到了一些有趣的結(jié)果。</p>&

25、lt;p>  對(duì)于自然界中廣泛存在的合作行為的理解,以及如何又到自私個(gè)體之間產(chǎn)生合作一直是數(shù)學(xué)、物理、生物、管理乃至工程學(xué)科的學(xué)者關(guān)注的話題。隨著復(fù)雜網(wǎng)絡(luò)的興起,人們對(duì)于字兒按揭中復(fù)雜系統(tǒng)的組織結(jié)構(gòu)有了新的認(rèn)識(shí)。從網(wǎng)絡(luò)結(jié)構(gòu)的角度研究演化博弈行為是一個(gè)既具有理論意義又有工程實(shí)踐價(jià)值的課題。</p><p>  目前很多工作只是一些數(shù)值仿真結(jié)果,由于數(shù)學(xué)工具的不足,對(duì)復(fù)雜網(wǎng)絡(luò)上的博弈動(dòng)力學(xué)進(jìn)行解析分析是非常困難

26、的,目前的一些近似方法,如平均場(chǎng)方法、對(duì)估計(jì)方法在異質(zhì)程度很大的網(wǎng)絡(luò)很有可能失效. 因此尋求有效的數(shù)學(xué)工具,探求更好的理論結(jié)果,將一些數(shù)值結(jié)果命題化、嚴(yán)格化,將是十分有意義的。</p><p>  該課題將在了解公共品模型的研究現(xiàn)狀和數(shù)值方法基礎(chǔ)之上,通過(guò)數(shù)值方法研究個(gè)體的各類空間效應(yīng),探索各類空間效應(yīng)對(duì)公共品博弈中合作行為的影響,從而得出在各種因素之間多人博弈情況下的合作行為的發(fā)生情況?,F(xiàn)實(shí)中,公共品博弈普遍存

27、在,當(dāng)然也存在很多社會(huì)困境。考慮到影響公共品博弈的各種因素,如何更有效的促進(jìn)合作行為的產(chǎn)生成為我們現(xiàn)在研究的主要方向。希望該項(xiàng)研究不僅能在理論方面,更能對(duì)真實(shí)系統(tǒng)中公共品博弈提供建設(shè)性的意見(jiàn)和建議。</p><p><b>  參考文獻(xiàn)</b></p><p>  1、Nowak M A and Sigmund K,&

28、#160;2004  Science 303, 793    2、Szabo G and Fath G, 2007 Phys. Rep. 446, 97    3、Doebeli M, Hauert

29、0;C and Killingback T, 2004 Science 306, 859    4、Nowak M A and May R M, 1992 Nature 359, 826   &#

30、160;5、Hauert C and Doebeli M, 2004 Nature 428, 643    6、Santos F C and Pacheco J M, 2005 Phys. Rev. Lett.

31、0;95, 098104    7、復(fù)雜網(wǎng)絡(luò)上的演化博弈    智能系統(tǒng)學(xué)報(bào)167324785 (2007)    0220001210    8、復(fù)雜網(wǎng)絡(luò)上博弈行為的研究進(jìn)展  電子測(cè)量技術(shù)第30卷第4期 TP39

32、0;   9、復(fù)雜網(wǎng)絡(luò)演化博弈理論研究綜述  復(fù)雜系統(tǒng)與復(fù)雜性科學(xué)第5卷第4期  10、博弈[M]   白波,郭興文   哈爾濱出版社</p><p><b>  本科畢業(yè)設(shè)計(jì)</b></p><p><b>  (20 屆)

33、</b></p><p>  公共品博弈的空間效應(yīng)研究</p><p><b>  摘 要</b></p><p>  【摘要】 本文基于復(fù)雜網(wǎng)絡(luò)下的公共品博弈演化模型,研究各類空間效應(yīng)對(duì)合作演化動(dòng)態(tài)的影響以及引入獎(jiǎng)勵(lì)機(jī)制后合作行為演化的方向。通過(guò)允許對(duì)合作個(gè)體的獎(jiǎng)勵(lì)作為一種積極因素促進(jìn)合作的產(chǎn)生,結(jié)果表明獎(jiǎng)勵(lì)可以通過(guò)提供一個(gè)避免相

34、互背叛情況出現(xiàn)的方式促進(jìn)合作的產(chǎn)生。然而與懲罰相比,獎(jiǎng)勵(lì)無(wú)法使合作穩(wěn)定下來(lái),卻提高了穩(wěn)定的合作者的數(shù)目。最后分析了復(fù)雜網(wǎng)絡(luò)上公共品演化博弈論的未來(lái)發(fā)展方向與應(yīng)用前景。</p><p>  【關(guān)鍵詞】公共品;復(fù)雜網(wǎng)絡(luò);演化博弈;獎(jiǎng)勵(lì)機(jī)制</p><p><b>  Abstract</b></p><p>  【ABSTRACT】Based on

35、 the public goods game, this thesis presents a model in which individuals are rewarded who contribute to the public goods. It is shown that reward is capable of promoting cooperation by providing an escape hatch out of s

36、tates that we defect each other mutually. Reward, contrast with punishment, is unable to stabilize cooperation although it gives rise to a persistent minority of cooperators. Finally unresolved open problems and future r

37、esearch directions and possible applicatio</p><p>  【KEYWORDS】public goods;complex networks ;evolutionary games ;incentive system</p><p><b>  目 錄</b></p><p><b>  摘

38、 要8</b></p><p>  Abstract8</p><p><b>  目 錄8</b></p><p><b>  1 研究背景10</b></p><p>  1.1 博弈論10</p><p>  1.1.1 經(jīng)典博弈論、博弈模型與納什

39、均衡10</p><p>  1.1.2 從經(jīng)典博弈到演化博弈12</p><p>  1.2 復(fù)雜網(wǎng)絡(luò)13</p><p>  1.2.1 復(fù)雜網(wǎng)絡(luò)的特征度量14</p><p>  1.2.2 復(fù)雜網(wǎng)絡(luò)的分類14</p><p>  1.2.3 復(fù)雜網(wǎng)絡(luò)上的演化博弈15</p><p

40、>  2 公共品博弈背景簡(jiǎn)介....................................................................................................................................6</p><p>  2.1 背景簡(jiǎn)介17</p><p>  2.2 群選擇學(xué)說(shuō)17&

41、lt;/p><p>  2.3 互惠與強(qiáng)互惠效應(yīng)18</p><p>  2.4 空間效應(yīng)19</p><p><b>  3 模型建立21</b></p><p>  3.1 模型介紹21</p><p>  3.2 現(xiàn)象及描述22</p><p><b&g

42、t;  3.3 結(jié)語(yǔ)24</b></p><p>  4 結(jié)論與展望24</p><p><b>  參考文獻(xiàn)6</b></p><p>  致謝錯(cuò)誤!未定義書(shū)簽。</p><p>  附錄:錯(cuò)誤!未定義書(shū)簽。</p><p><b>  研究背景</b&g

43、t;</p><p>  無(wú)論對(duì)于生物界種群的進(jìn)化還是人類社會(huì)的發(fā)展,合作都扮演著至關(guān)重要的角色。自私個(gè)體之間是如何產(chǎn)生合作的一直是物理、生物、數(shù)學(xué)乃至工程科學(xué)的學(xué)者關(guān)注的話題。然而,依據(jù)達(dá)爾文主義,自然選擇是基于競(jìng)爭(zhēng)的,個(gè)體將自私的最大化自身的利益,這顯然不能解釋處處可見(jiàn)的合作行為。為了理解合作行為是如何從自私的個(gè)體之間演化產(chǎn)生的,近年來(lái),一些可能的合作機(jī)理,如群體選擇(group selection)、親緣選

44、擇(kin selection)、直接(間接)互惠(direct/indirectreciprocity)、空間互惠(spatial reciprocity)、聲望與懲罰(reputation and punishment)等得到了一定的探討。而博弈論在尋求這一問(wèn)題答案的過(guò)程中扮演了重要角色并提供了強(qiáng)有力的理論框架。隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,對(duì)復(fù)雜網(wǎng)絡(luò)的研究也不斷深入,人們對(duì)現(xiàn)實(shí)世界中復(fù)雜系統(tǒng)的組織結(jié)構(gòu)有了新的認(rèn)識(shí)。在復(fù)雜網(wǎng)絡(luò)的基礎(chǔ)上研

45、究博弈行為成為一個(gè)既具有理論意義又有現(xiàn)實(shí)價(jià)值的話題,受到人們?cè)絹?lái)越多的關(guān)注。</p><p><b>  博弈論</b></p><p>  經(jīng)典博弈論、博弈模型與納什均衡</p><p>  博弈論,又稱對(duì)策論,主要是研究依據(jù)參與博弈的其他個(gè)體的策略情況,理性個(gè)體所采取的策略之間交互作用下的個(gè)體的行為演化。在交互作用中,個(gè)體所獲得的收益不是純

46、粹由其自身所采取的策略決定,而是受到很多其他方面的影響,如其他個(gè)體的策略、博弈規(guī)則等等。博弈論主要是由匈牙利數(shù)學(xué)家馮-諾依曼所創(chuàng)立的,在20世紀(jì)40年代作為一門正式的學(xué)科發(fā)展起來(lái)。1944年馮-諾依曼和摩根斯坦出版的著作《博弈論和經(jīng)濟(jì)行為》,標(biāo)志著現(xiàn)代系統(tǒng)博弈論的初步形成。早期的博弈論過(guò)于抽象,實(shí)用性不強(qiáng),而且人們對(duì)博弈論的研究知之甚少,影響力有限。隨著現(xiàn)代博弈論的不斷研究發(fā)展,它作為一種數(shù)學(xué)理論被廣泛應(yīng)用于經(jīng)濟(jì)、政治、生物、信息等許多

47、領(lǐng)域,日漸成為非常重要且有用的分析工具,為解決不同實(shí)體的沖突和合作提供了一種有效的方法。近十多年來(lái),諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)先后授予研究博弈論的科學(xué)家Nash、Selten等人也說(shuō)明,博弈論越來(lái)越受到更多人的重視,也得到了越來(lái)越廣泛的承認(rèn)。</p><p>  通常一個(gè)博弈由以下5個(gè)部分所組成:(1)博弈主體,即博弈過(guò)程中進(jìn)行獨(dú)立決策的個(gè)體,在一輪博弈中至少要有兩位決策者參與博弈(2)博弈信息,博弈個(gè)體所掌握的有利于策略選

48、擇的各方面信息,在博弈中占重要地位,根據(jù)博弈個(gè)體對(duì)參與博弈所有個(gè)體收益信息的掌握程度可將博弈分為完全信息博弈與非完全信息博弈(3)策略集,參與博弈的個(gè)體可選擇的所有可能策略的集合,根據(jù)該集合是有限還是無(wú)限,可分為有限博弈和無(wú)限博弈,其中無(wú)限博弈又表現(xiàn)為連續(xù)對(duì)策、重復(fù)博弈和微分對(duì)策等(4)收益矩陣,策略選定后,博弈個(gè)體所獲得的收益是由相應(yīng)的收益函數(shù)或收益矩陣來(lái)確定的,根據(jù)博弈個(gè)體的不同收益情況可以分為零和博弈與變和博弈(5)策略演化,在重

49、復(fù)博弈過(guò)程中,博弈個(gè)體以自身收益最大化為目標(biāo)進(jìn)行策略調(diào)整。就某一輪博弈而言,當(dāng)所有個(gè)體的策略選定以后,我們可以用集合的形式來(lái)描述,S=(S1,S2,...),其中每一項(xiàng)代表了所對(duì)應(yīng)個(gè)體采取的策略,進(jìn)而得到某種策略概況下個(gè)體所獲得的收益U。經(jīng)典博弈論中的一個(gè)重要概念納什均衡(Nash equilibrium),是美國(guó)科學(xué)家約翰-納什在二十世紀(jì)提出來(lái)的,從實(shí)質(zhì)上說(shuō)是一種非合作博弈狀態(tài)。所謂納什均衡</p><p> 

50、 囚徒困境博弈(Prisoner's dilemma Game):小偷甲和乙合伙作案,被捕后,警方將兩人分別置于兩個(gè)房間內(nèi)進(jìn)行審訊。警方給出的政策是:如果雙方都拒絕坦白同伴的罪行,兩人將會(huì)被輕判1年徒刑;如果甲(乙)坦白(背叛)罪行,而乙(甲)拒不供認(rèn)(合作)罪行,則甲(乙)將無(wú)罪釋放,而乙(甲)將被重判5年徒刑;如果甲、乙互相揭發(fā)對(duì)方罪行,則雙方均被判刑3年。該博弈的收益矩陣可列表如下:</p><p>

51、;  從上表我們可以看出,如果甲選擇坦白,即選擇“背叛”(defect-D)乙,則乙也應(yīng)該選擇坦白——因?yàn)槿绻藭r(shí)乙選擇合作,甲將被無(wú)罪釋放,而乙會(huì)被重判5年,而如果此時(shí)乙也選擇背叛,則將會(huì)跟甲均判3年,顯然,對(duì)乙來(lái)說(shuō),背叛總是最佳策略。反之,對(duì)甲來(lái)說(shuō)也是如此。但是整體來(lái)看,甲乙的最優(yōu)策略應(yīng)該是選擇跟對(duì)方合作,此時(shí)兩人均被判1年。這樣就陷入了兩難困境,那么這種情況下,甲乙兩個(gè)體應(yīng)如何做出抉擇?從理性個(gè)體自身利益最大化為目標(biāo)來(lái)看,相互合作

52、的情況不會(huì)發(fā)生,對(duì)甲乙來(lái)說(shuō),因?yàn)椴徽搶?duì)方采取哪種策略,背叛始終是自身的最佳策略(注意到此時(shí)集體的收益最低)。所以當(dāng)雙方都選擇背叛時(shí),沒(méi)有個(gè)體會(huì)主動(dòng)選擇改變策略(因?yàn)閱畏矫娓淖儾呗允棺陨硎找娼档停藭r(shí)這種相互背叛的狀態(tài)就是該系統(tǒng)的納什均衡狀態(tài)?,F(xiàn)實(shí)生活中,類似囚徒困境的例子很多,也揭示出各種社會(huì)困境。上面所述的是單次發(fā)生的囚徒困境,但是在重復(fù)囚徒困境中,參與博弈的個(gè)體可以通過(guò)記憶或?qū)W習(xí)、或者采取某種報(bào)復(fù)措施對(duì)背叛者進(jìn)行懲罰,那么在合適的

53、機(jī)制下,合作將會(huì)作為均衡的結(jié)果出現(xiàn)并逐漸占據(jù)優(yōu)勢(shì),從而有利于合作策略的涌現(xiàn)與維持。在接近無(wú)限次的博弈中,納什均衡會(huì)趨向于帕累托</p><p>  從經(jīng)典博弈到演化博弈</p><p>  經(jīng)典博弈論中,個(gè)體被假定是超理性的——完全信息博弈,而且所有個(gè)體都知道其他個(gè)體也是理性的,并且會(huì)按照理性行事。這種機(jī)制下,博弈最終會(huì)達(dá)到納什均衡狀態(tài),即所有的個(gè)體最終都會(huì)采取納什均衡策略。從囚徒困境的例

54、子可以看出,這種個(gè)體的超理性會(huì)導(dǎo)致集體的非理性(因?yàn)橄嗷ズ献鲿r(shí)集體的收益最大)。但是,在真實(shí)的復(fù)雜社會(huì)系統(tǒng)中,個(gè)體沒(méi)有充分的能力去選擇能最大化其收益的最佳策略。此時(shí),個(gè)體通常根據(jù)其掌握的局部信息來(lái)做出其相對(duì)滿意的策略——非完全信息博弈,這種選擇過(guò)程表明個(gè)體是有限理性(bounded rationality)的。演化博弈理論(evolutionary game theory)著重研究重復(fù)博弈過(guò)程中有限理性的博弈個(gè)體之間怎樣涌現(xiàn)出合作行為以

55、及博弈個(gè)體如何通過(guò)自適應(yīng)學(xué)來(lái)實(shí)現(xiàn)自身收益最大化的問(wèn)題。</p><p>  演化博弈論(evolutionary game theory)以達(dá)爾文的進(jìn)化論和拉馬克的遺傳基因理論為思想基礎(chǔ),將博弈理論與動(dòng)態(tài)演化過(guò)程分析結(jié)合起來(lái),分析從個(gè)體到群體行為的行為機(jī)制,研究種群的進(jìn)化趨勢(shì)及穩(wěn)定性,為描述個(gè)體之間的相互作用提供了一種通用數(shù)學(xué)框架。參與博弈的個(gè)體采取一定的策略,獲得一定的收益(該收益依賴于個(gè)體本身的策略跟參與博弈

56、的其他個(gè)體的策略)。在每一輪博弈中,博弈個(gè)體以某種策略更新規(guī)則更新自己的策略,最終達(dá)到一種演化穩(wěn)定策略(Evolutionarily stable strategy,ESS)——所有參與博弈的個(gè)體在重復(fù)博弈中選擇的某個(gè)最優(yōu)的、穩(wěn)定的策略,即演化博弈中的均衡點(diǎn)。與經(jīng)典博弈中所討論的納什均衡不同,演化穩(wěn)定策略是一種更加嚴(yán)格的均衡,該策略所對(duì)應(yīng)的收益相對(duì)變異者來(lái)說(shuō)是占優(yōu)勢(shì)的,而且演化穩(wěn)定策略只是一種初始狀態(tài)的優(yōu)勢(shì)策略,并不是演化的結(jié)果狀態(tài)。演

57、化穩(wěn)定策略最大的不足之處就在于它把影響系統(tǒng)的因素都看成是一個(gè)個(gè)的孤立事件,而在現(xiàn)實(shí)中系統(tǒng)常常會(huì)受到各種沖擊。復(fù)雜網(wǎng)絡(luò)上的演化博弈研究主要是在結(jié)構(gòu)化的群體結(jié)構(gòu)上,考慮復(fù)雜網(wǎng)絡(luò)上所刻畫(huà)的博弈者之間的相互作用關(guān)系。正是由于這種</p><p>  博弈論最早體現(xiàn)在真實(shí)的生物學(xué)領(lǐng)域中,也最早的應(yīng)用來(lái)解釋生物科學(xué)中的問(wèn)題。1973年Smith 和Price發(fā)表的動(dòng)物沖突的邏輯,是博弈論第一次被正式的應(yīng)用于生物學(xué)中,也是演化

58、穩(wěn)定策略的來(lái)源。該文運(yùn)用博弈論的思想從個(gè)體選擇的角度解釋了動(dòng)物間的爭(zhēng)斗為什么從來(lái)都是有限且非惡性的。從經(jīng)典博弈論發(fā)展到演化博弈論,其中有3個(gè)關(guān)鍵性的內(nèi)涵發(fā)生了轉(zhuǎn)變。</p><p>  第一個(gè)是策略內(nèi)涵的轉(zhuǎn)變。經(jīng)典博弈論中,博弈個(gè)體被假定是超理性的,所有可能選擇的不同策略構(gòu)成策略集。在演化博弈論中個(gè)體的超理性被達(dá)爾文的“適者生存”規(guī)則所代替。那些不采取“理性”策略的個(gè)體會(huì)在漫長(zhǎng)的演化過(guò)程中趨于滅絕。</p&

59、gt;<p>  第二個(gè)是均衡意義的轉(zhuǎn)變。在演化博弈論中,經(jīng)典博弈論中的納什均衡被演化穩(wěn)定策略所代替。演化穩(wěn)定策略可以是純策略,也可以是混合策略。與納什均衡相比,演化穩(wěn)定策略是一種更嚴(yán)格的均衡。</p><p>  第三個(gè)是個(gè)體交互作用內(nèi)涵的轉(zhuǎn)變。經(jīng)典博弈論中,博弈個(gè)體只進(jìn)行一次博弈,或者與相同的個(gè)體進(jìn)行多次博弈。而在演化博弈論中,博弈個(gè)體隨機(jī)選配成對(duì)進(jìn)行多次博弈,且假定再次遇到相同對(duì)手的概率很小。

60、</p><p>  上述3個(gè)重要概念的內(nèi)涵轉(zhuǎn)變,使得演化博弈理論從一個(gè)靜態(tài)的過(guò)程成為一個(gè)動(dòng)態(tài)演變的理論,更著重于對(duì)演化穩(wěn)定策略的研究,能夠描述動(dòng)態(tài)系統(tǒng)的局部動(dòng)態(tài)性質(zhì),預(yù)測(cè)個(gè)體行為。</p><p><b>  復(fù)雜網(wǎng)絡(luò)</b></p><p>  最近二十多年來(lái),網(wǎng)絡(luò)的研究有了突飛猛進(jìn)的進(jìn)展。這主要得益于計(jì)算機(jī)和通信網(wǎng)絡(luò)技術(shù)的巨大進(jìn)步。借助于

61、它們,我們可以收集和分析以往難以想象的海量的網(wǎng)絡(luò)數(shù)據(jù),并可以研究數(shù)以百萬(wàn)計(jì)甚至數(shù)以億計(jì)大小的網(wǎng)絡(luò)。通過(guò)對(duì)真實(shí)世界大量復(fù)雜系統(tǒng)的研究,人們發(fā)現(xiàn)它們的結(jié)構(gòu)不能簡(jiǎn)單的用規(guī)則圖或完全隨機(jī)圖來(lái)描述。但另一方面,這些復(fù)雜的結(jié)構(gòu)有很多共性,比如小的平均距離,高成團(tuán)系數(shù)以及連接度為冪律分布等拓?fù)湫再|(zhì)。人們把這類介于規(guī)則圖和完全隨機(jī)圖之間的網(wǎng)絡(luò)稱之為復(fù)雜網(wǎng)絡(luò)(complex networks)。復(fù)雜網(wǎng)絡(luò)是研究復(fù)雜系統(tǒng)的一門新興學(xué)科,近幾年受到研究學(xué)者的廣

62、泛關(guān)注。自然界中的任何復(fù)雜系統(tǒng)都可以抽象成為由相互作用的個(gè)體組成的網(wǎng)絡(luò),如互聯(lián)網(wǎng)、萬(wàn)維網(wǎng)、航空網(wǎng)、電力網(wǎng)、蛋白質(zhì)相互作用網(wǎng)以及各種合作網(wǎng)絡(luò)等。對(duì)于復(fù)雜網(wǎng)絡(luò)的研究極大的改變了人們對(duì)復(fù)雜外部世界的認(rèn)識(shí),讓人們認(rèn)識(shí)到了以前的理論尚未涉及到的問(wèn)題,也迅速引起了諸多領(lǐng)域中科研工作者的興趣,特別是物理學(xué)界、生物學(xué)界,復(fù)雜網(wǎng)絡(luò)理論得到了充分的探索和發(fā)展。研究這些網(wǎng)絡(luò)不僅對(duì)于人們的工作和生活至關(guān)重要,而且對(duì)于揭示自然界特別是生物系統(tǒng)的奧秘也至關(guān)重要。&

63、lt;/p><p><b>  復(fù)雜網(wǎng)絡(luò)的特征度量</b></p><p>  隨著對(duì)復(fù)雜網(wǎng)絡(luò)研究的不斷深入,人們提出了許多概念和度量方法來(lái)表示復(fù)雜網(wǎng)絡(luò),這里主要主要介紹節(jié)點(diǎn)的度、簇系數(shù)和平均路徑長(zhǎng)度。</p><p>  1、節(jié)點(diǎn)的度 度是描述網(wǎng)絡(luò)局部特性的基本參數(shù),指的是與該節(jié)點(diǎn)連接的其他節(jié)點(diǎn)的數(shù)量。度分布 (degree distribu

64、tion),則表示節(jié)點(diǎn)度的概率分布。如果某一節(jié)點(diǎn)的度分布函數(shù)為P(k),表示該節(jié)點(diǎn)恰好有k條邊的概率。目前度分布較為常見(jiàn)的有兩種,一種是指數(shù)分布,另一種是冪律分布。度分布函數(shù)反應(yīng)了網(wǎng)絡(luò)系統(tǒng)的宏觀統(tǒng)計(jì)特征。</p><p>  2、簇系數(shù) (clustering coefficient),又稱為集聚系數(shù),指與同一個(gè)節(jié)點(diǎn)相連接的一對(duì)節(jié)點(diǎn)相連接的概率,衡量網(wǎng)絡(luò)的集團(tuán)化程度。全連通的網(wǎng)絡(luò)中,簇系數(shù)為1,一般均小于1。&

65、lt;/p><p>  3、平均路徑長(zhǎng)度(average path length,APL),指網(wǎng)絡(luò)中所有節(jié)點(diǎn)與節(jié)點(diǎn)之間平均的最短距離。節(jié)點(diǎn)間的距離是通過(guò)從一個(gè)節(jié)點(diǎn)到另一個(gè)節(jié)點(diǎn)所經(jīng)歷的邊的最小數(shù)目來(lái)計(jì)算的。復(fù)雜網(wǎng)絡(luò)研究中一個(gè)重要發(fā)現(xiàn)就是大部分真實(shí)系統(tǒng)中的平均路徑程度都遠(yuǎn)比想象中小,我們稱之為小世界效應(yīng)。</p><p>  除上述度分布、簇系數(shù)和平均路徑長(zhǎng)度三個(gè)最基本的結(jié)構(gòu)特性外,復(fù)雜網(wǎng)絡(luò)還有其

66、他許多度量特征,如介數(shù)(反映了相應(yīng)的節(jié)點(diǎn)或邊在整個(gè)網(wǎng)絡(luò)中的作用和影響力,具有很強(qiáng)的現(xiàn)實(shí)意義)、網(wǎng)絡(luò)彈性(指網(wǎng)絡(luò)節(jié)點(diǎn)的刪除對(duì)連通度的影響)等。</p><p>  不同類型復(fù)雜網(wǎng)絡(luò)簡(jiǎn)介</p><p>  根據(jù)復(fù)雜網(wǎng)絡(luò)的特性不同,衍生出很多不同的類型,由于真實(shí)社會(huì)網(wǎng)絡(luò)具有小世界和無(wú)標(biāo)度等特性,所以這里我們也主要介紹這兩種網(wǎng)絡(luò)。</p><p>  隨機(jī)網(wǎng)絡(luò)是最簡(jiǎn)單的復(fù)

67、雜網(wǎng)絡(luò),在20世紀(jì)50年代由匈牙利的兩位數(shù)學(xué)家提出的。在ER隨機(jī)網(wǎng)絡(luò)模型中,首先給定網(wǎng)絡(luò)中的節(jié)點(diǎn)數(shù)目,然后讓任意兩節(jié)點(diǎn)之間以相同的概率連接在一起完全隨機(jī)地構(gòu)成網(wǎng)絡(luò)。該模型自提出后被廣泛應(yīng)用于社會(huì)與生態(tài)學(xué)的研究。</p><p>  小世界網(wǎng)絡(luò)模型,由Watts和Strogatz提出的,這個(gè)模型構(gòu)建在一維格子基礎(chǔ)上,是對(duì)一個(gè)臨近節(jié)點(diǎn)耦合的規(guī)則網(wǎng)絡(luò)進(jìn)行隨機(jī)化重連之后所能生成的網(wǎng)絡(luò)模型。與隨機(jī)網(wǎng)絡(luò)相比,其顯著特性是簇系

68、數(shù)大、平均路徑長(zhǎng)度小。小世界網(wǎng)絡(luò)上的空間純策略主要分為兩類:一類是基于環(huán)的小世界網(wǎng)絡(luò),另一類是基于方格的小世界網(wǎng)絡(luò)。根據(jù)網(wǎng)絡(luò)中度的變化特性又可將小世界網(wǎng)絡(luò)分為同質(zhì)與異質(zhì)。</p><p>  1.2.3 復(fù)雜網(wǎng)絡(luò)上的演化博弈</p><p>  人們對(duì)網(wǎng)絡(luò)的研究由來(lái)已久,圖論是最早涉足網(wǎng)絡(luò)研究的數(shù)學(xué)理論。圖論中網(wǎng)絡(luò)被稱為圖,圖是網(wǎng)絡(luò)的數(shù)學(xué)表達(dá)形式,它由頂點(diǎn)和邊構(gòu)成。圖論的起源很早,瑞士數(shù)

69、學(xué)家Eul目在1736年解決了著名的哥尼斯城堡七橋問(wèn)題,從而使他成為圖論和拓?fù)鋵W(xué)的創(chuàng)始人。此后開(kāi)展的研究工作大多基于網(wǎng)格等規(guī)則網(wǎng)絡(luò),直到上世紀(jì)五十年代,匈牙利數(shù)學(xué)家Efdos和R∞yi創(chuàng)造性的將概率論引入圖論并成功地提出了第一個(gè)隨機(jī)圖模型一ER模型。在過(guò)去幾十年中,ER模型已成為隨機(jī)圖論的研究基礎(chǔ)并一直占據(jù)著復(fù)雜網(wǎng)絡(luò)研究的主導(dǎo)地位。近年來(lái),以還原論和整體論相結(jié)合為重要特色的復(fù)雜性科學(xué)的興起,促使人們開(kāi)始關(guān)注復(fù)雜網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)及其產(chǎn)生機(jī)理

70、:諸如因特網(wǎng)等大量新型網(wǎng)絡(luò)的相繼出現(xiàn)使得人們對(duì)復(fù)雜網(wǎng)絡(luò)性質(zhì)的了解變得越來(lái)越迫切;計(jì)算機(jī)技術(shù)的飛速發(fā)展為大規(guī)模復(fù)雜網(wǎng)絡(luò)的研究提供了有效的工具,使得人們可以對(duì)那些包含上百萬(wàn)乃至于上千萬(wàn)個(gè)頂點(diǎn)的網(wǎng)絡(luò)進(jìn)行分析,而這在若干年前還是不可想象的事情;不同領(lǐng)域中反映復(fù)雜網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的數(shù)據(jù)庫(kù)相繼出現(xiàn)為復(fù)雜網(wǎng)絡(luò)的研究提供了可靠的實(shí)驗(yàn)數(shù)據(jù),使得研究者能夠?qū)Σ煌愋偷臄?shù)據(jù)進(jìn)行分析進(jìn)而發(fā)現(xiàn)復(fù)雜網(wǎng)絡(luò)所具有的共同特征;上述因素加之各學(xué)科間的相</p>

71、<p>  模仿最優(yōu)秀者(best-takes-over):每一輪博弈過(guò)后,個(gè)體采取與其博弈的個(gè)體中最大收益的個(gè)體的策略進(jìn)行下一輪博弈;</p><p>  模仿優(yōu)勝者(proportional updating):個(gè)體在進(jìn)行策略更新時(shí),與跟其進(jìn)行博弈的其他個(gè)體比較,并以某種正比于收益的概率采取收益比自身高的個(gè)體的策略進(jìn)行下一輪博弈;</p><p>  配對(duì)比較(match-p

72、airing comparision):個(gè)體隨機(jī)選擇參與博弈的其他個(gè)體進(jìn)行收益比較,并以某種概率(通常是兩個(gè)體收益差的函數(shù))轉(zhuǎn)變?yōu)閷?duì)方的策略。</p><p>  以上三種是復(fù)雜系統(tǒng)中比較常用的策略更新方法?,F(xiàn)在大部分研究中采用的更科學(xué)的策略更新規(guī)則是:</p><p>  式中:等號(hào)左邊表示的是節(jié)點(diǎn)x模仿鄰居節(jié)點(diǎn)y策略的概率,M代表節(jié)點(diǎn)的累計(jì)收益,T表示節(jié)點(diǎn)的理性程度。當(dāng)T=0時(shí),表示節(jié)

73、點(diǎn)完全理性;當(dāng)T趨向于無(wú)窮時(shí),表示節(jié)點(diǎn)毫無(wú)理性,隨機(jī)選擇;易知,存在一個(gè)適當(dāng)?shù)腡使得合作達(dá)到最高水平。</p><p>  網(wǎng)絡(luò)中參與博弈的個(gè)體比較多時(shí),策略的更新又受到一個(gè)先后秩序的影響,我們稱之為同步更新與隨機(jī)更新。同步更新是指所有參與博弈的個(gè)體同時(shí)進(jìn)行策略的更新,通常應(yīng)用在生物模型中;隨機(jī)更新也叫非同步更新,是指在網(wǎng)絡(luò)中隨機(jī)選擇參與博弈的個(gè)體進(jìn)行策略的更新,這種更新規(guī)則很好的反應(yīng)了真實(shí)社會(huì)系統(tǒng),因而受到了更

74、多的關(guān)注。但在很多情況下,這兩種更新方式對(duì)博弈的結(jié)果并沒(méi)有明顯的影響。</p><p>  2 公共品博弈背景簡(jiǎn)介</p><p><b>  2.1 背景簡(jiǎn)介</b></p><p>  由于現(xiàn)實(shí)生活中往往不只是兩個(gè)個(gè)體間的博弈,而是多人之間的博弈,因此有必要將囚徒困境模型擴(kuò)展為一個(gè)多人博弈的模型,這就是本文研究的新的網(wǎng)絡(luò)模型之一——公共品

75、博弈模型。</p><p>  公共品博弈是以公共品為博弈對(duì)象的博弈,這種博弈廣泛存在于復(fù)雜網(wǎng)絡(luò)之中。一般來(lái)說(shuō),公共品是指在消費(fèi)過(guò)程中具有非競(jìng)爭(zhēng)性和非排他性的物品。因?yàn)楣财肪哂羞@樣的性質(zhì),所以集體中的每個(gè)人都會(huì)希望由其他人來(lái)提供,而自己坐享其成,這種行為被稱為搭便車。搭便車問(wèn)題使集體行動(dòng)變得難以實(shí)現(xiàn)——集體成員存在搭便車的動(dòng)機(jī),隨著集體中社會(huì)成員數(shù)量的增加,這種動(dòng)機(jī)會(huì)更強(qiáng)烈,導(dǎo)致合作水平降低。搭便車問(wèn)題的存在,

76、解釋了很多社會(huì)困境。例如,惡劣的環(huán)境無(wú)人清理,不合理的制度人人抱怨卻無(wú)人抵制。在公共品博弈中,合作者C的貢獻(xiàn)a經(jīng)過(guò)一個(gè)r倍的放大后在全體參與者N中平均分配,如果N=Nc,這所有參與者的收益都將提高r倍。但如果N中出現(xiàn)了背叛者D,不貢獻(xiàn)a而同樣軒參與分配(搭便車),則可獲得比合作者更高的凈收益Pd=a·r·Nc/N。從納什均衡的角度看,公共品博弈中,背叛將始終是最佳策略。從演化均衡的角度看,D將侵入C所組成的團(tuán)體,并最

77、終取代C。</p><p>  然而,公共品博弈的理論結(jié)果與現(xiàn)實(shí)的差異很大。大量的實(shí)驗(yàn)研究表明,集體成員的搭便車動(dòng)機(jī)是有限的,合作能夠達(dá)到一個(gè)客觀且穩(wěn)定的水平。這就表明,在重復(fù)公共品博弈過(guò)程中,個(gè)體不僅要考慮自身收益,還受到很多外在因素的影響,如激勵(lì)與懲罰(本文通過(guò)引入一個(gè)積極因素——獎(jiǎng)勵(lì),來(lái)研究其對(duì)合作演化的影響),而且社會(huì)系統(tǒng)中的個(gè)體還具有某種異質(zhì)性——稱為社會(huì)偏好,這種社會(huì)偏好使得個(gè)體會(huì)考慮他人的選擇,具體

78、表現(xiàn)為互惠、不平等厭惡、學(xué)習(xí)和遷移等。很顯然,這些外在因素的存在會(huì)降低個(gè)體搭便車的動(dòng)機(jī),并提高合作水平。</p><p><b>  2.2 群選擇學(xué)說(shuō)</b></p><p>  在群選擇學(xué)說(shuō)中,把種群看做一個(gè)進(jìn)化的單位在群體層次上起作用。那些對(duì)種群有利但對(duì)個(gè)體不利的特征之所以能夠保存下來(lái),是因?yàn)榉N群的選擇會(huì)使這一特征出現(xiàn)的頻率增加,而個(gè)體選擇服從群體的利益,是為避

79、免群體被淘汰。公共品博弈與此相似,搭便車行為雖然使個(gè)體的收益提高了,但是卻損害了集體的利益,導(dǎo)致集體被淘汰,于是,在外界壓力下,個(gè)體選擇合作來(lái)避免此情況的發(fā)生。 </p><p>  2.3 互惠與強(qiáng)互惠效應(yīng)</p><p>  互惠機(jī)制包括直接互惠和間接互惠。</p><p>  直接互惠中的個(gè)體之所以冒著被背叛的風(fēng)險(xiǎn)去與其他個(gè)體合作是因?yàn)橄M谌蘸笈c受惠者再次相

80、遇時(shí)有可能得到回報(bào),以便獲益更大?;貓?bào)才是互惠利他主義者的真正目的,這次利他是想在下次更有益于自己。直接互惠雖然有利于合作的而建立,但也可能陷入相互背叛的困境。</p><p>  間接互惠的基礎(chǔ)是“聲譽(yù)”。B幫助A是為了提高聲譽(yù),以期待第三方C的幫助。在這種情況下,由于報(bào)復(fù)策略的制約,合作可能因?yàn)橐粋€(gè)背信行為而導(dǎo)致合作的失敗。因?yàn)榈谝粋€(gè)受背叛者的報(bào)復(fù)行為要經(jīng)過(guò)許多回合之后才會(huì)打擊到始作傭者,這樣許多無(wú)辜者會(huì)受到

81、懲罰,合作是不穩(wěn)定的。</p><p>  直接互惠和間接互惠都無(wú)法很好的解決公共品博弈中的合作現(xiàn)象,這種情況下,強(qiáng)互惠理論應(yīng)運(yùn)而生。</p><p>  強(qiáng)互惠理論認(rèn)為,人類之所以能維持比其他物種更高度的合作關(guān)系,在于許多人都具有這樣一種行為傾向:在團(tuán)體中與別人合作,并不惜花費(fèi)個(gè)人成本去懲罰那些破壞群體規(guī)范的人,即使這些成本并不能被預(yù)期得到補(bǔ)償。強(qiáng)互惠能抑制團(tuán)體中的背叛、逃避責(zé)任和搭便車

82、行為,從而有效提高團(tuán)體成員的福利水平,但實(shí)施這種行為需要個(gè)人承擔(dān)成本。這樣就帶來(lái)一個(gè)新的問(wèn)題,既然這種強(qiáng)互惠行為所提高的是團(tuán)隊(duì)的收益,那么這個(gè)成本由誰(shuí)來(lái)負(fù)擔(dān)?每一個(gè)合作者都會(huì)寄希望于其它合作者承擔(dān)這個(gè)成本,這就是所謂的“二階搭便車問(wèn)題”。解決這個(gè)問(wèn)題又產(chǎn)生了許多討論,包括合作懲罰以及制度的制定等。</p><p><b>  2.4 空間效應(yīng)</b></p><p>

83、;  由于真實(shí)系統(tǒng)中的個(gè)體或要素之間存在策略依賴關(guān)系,我們可以在各種網(wǎng)絡(luò)上建立空間博弈模型,這樣又發(fā)現(xiàn)了許多空間因素的影響。</p><p>  a) 獨(dú)立者的引入:在公共品博弈模型中引入不參與博弈,但會(huì)每局收到少而固定的收益的獨(dú)立者。這樣,在一定r下,就會(huì)出現(xiàn)一種動(dòng)態(tài)平衡。當(dāng)群體較小時(shí),合作者占優(yōu)勢(shì)地位;群體較大時(shí),背叛者占優(yōu)勢(shì)地位。</p><p>  b)網(wǎng)絡(luò)的影響:不同的網(wǎng)絡(luò)(規(guī)則

84、網(wǎng)絡(luò),無(wú)標(biāo)度網(wǎng)絡(luò),小世界網(wǎng)絡(luò))對(duì)于合作的促進(jìn)作用是不同的。</p><p>  c)策略的改變:在博弈中引入學(xué)習(xí)和遷移的策略。使個(gè)體在博弈中有一定幾率交換位置會(huì)明顯影響博弈的結(jié)果。</p><p><b>  3 模型建立</b></p><p><b>  3.1 模型介紹</b></p><p>

85、;  本文所建立的模型是基于復(fù)雜網(wǎng)絡(luò)的公共品演化博弈模型。模型中只考慮個(gè)體與其最近鄰的博弈。</p><p>  模型大小為的網(wǎng)絡(luò),節(jié)點(diǎn)數(shù)N=10000,其中每個(gè)節(jié)點(diǎn)分別與其最近鄰的8個(gè)節(jié)點(diǎn)(稱為節(jié)點(diǎn)的度,即博弈半徑R<2)發(fā)生博弈,包括節(jié)點(diǎn)本身在內(nèi)的九個(gè)節(jié)點(diǎn)之間的博弈稱為節(jié)點(diǎn)的博弈環(huán)境。初始時(shí)刻網(wǎng)絡(luò)中的節(jié)點(diǎn)等概率的隨機(jī)選擇策略C和D,在博弈的過(guò)程中我們采取同步升級(jí)的博弈策略,即所有節(jié)點(diǎn)的新策略在下一時(shí)刻同

86、時(shí)影響其他節(jié)點(diǎn)。我們模擬時(shí)選擇的蒙特卡羅步數(shù)為20000,并選擇最后500步的平均作為輸出結(jié)果。每個(gè)節(jié)點(diǎn)都有兩種選擇,合作(cooperation)或者背叛(defection),博弈環(huán)境中選擇C策略的節(jié)點(diǎn)數(shù)占總的節(jié)點(diǎn)數(shù)記為,每個(gè)節(jié)點(diǎn)周圍包括該節(jié)點(diǎn)本身在內(nèi)選擇C策略的節(jié)點(diǎn)數(shù)記為。一輪博弈之后,每個(gè)節(jié)點(diǎn)在其博弈環(huán)境內(nèi)可以等概率選擇進(jìn)行策略學(xué)習(xí)或遷移,其中,本文所采用的策略更新規(guī)則是模仿最優(yōu)秀者(best-takes-over),即在每一輪

87、博弈過(guò)后,個(gè)體采取其博弈環(huán)境中獲得最高收益?zhèn)€體的策略進(jìn)行下一輪博弈;遷移策略則是在博弈環(huán)境內(nèi)選擇最大收益的個(gè)體進(jìn)行強(qiáng)制性換位(被選定的個(gè)體具有優(yōu)先權(quán))。節(jié)點(diǎn)(i,j),在博弈過(guò)程中的收益P(i,j)定義為</p><p>  其中,pc是選擇C策略所獲得收益,pd為選擇D策略所獲得的收益;t為引入的獎(jiǎng)勵(lì)因子,是與總收益有關(guān)的一個(gè)量,令</p><p><b>  獎(jiǎng)勵(lì)收益=<

88、;/b></p><p>  獎(jiǎng)勵(lì)收益是總收益的一部分,用來(lái)獎(jiǎng)勵(lì)合作者,獎(jiǎng)勵(lì)收益占總收益的比例即是我們引入的獎(jiǎng)勵(lì)因子t。</p><p>  為了保證選擇合作的收益大于選擇背叛的收益,我們規(guī)定r>1.下面我們討論l取不同值時(shí)對(duì)合作演化的動(dòng)態(tài)影響。</p><p><b>  3.2 現(xiàn)象及描述</b></p><

89、p>  我們?nèi)=4.0時(shí)為例:</p><p>  (a)取t=0.1時(shí),概率的演化情況如下圖(1)所示:</p><p><b> ?。▓D 1)</b></p><p>  圖(1)表明,合作者概率隨局?jǐn)?shù)m(時(shí)間)的演化狀況,開(kāi)始時(shí)呈現(xiàn)震蕩變化,隨著局?jǐn)?shù)的增加,概率逐漸穩(wěn)定在確定的數(shù)值不再變化。</p><p&g

90、t; ?。╞)下圖(2)表示的是合作者概率隨隨t占總收益的不同比例(t=0.1~0.9)的變化情況:</p><p><b> ?。▓D 2)</b></p><p>  圖(2)表明,隨t的單位變化,pc在0~1之間震蕩。</p><p>  (c)當(dāng)增益系數(shù)r(r=2.0~10.0)變化時(shí),對(duì)應(yīng)的合作者概率隨t的變化情況如下:</p&

91、gt;<p><b>  i</b></p><p><b> ?。?圖 3)</b></p><p><b>  3.3 結(jié)語(yǔ)</b></p><p>  有關(guān)模型結(jié)果的理論分析及解釋需等待后續(xù)工作的完成,在此不再詳述。</p><p><b>  4

92、 結(jié)論與展望</b></p><p>  復(fù)雜網(wǎng)絡(luò)上的演化博弈研究是近年來(lái)隨著復(fù)雜網(wǎng)絡(luò)研究興起而逐漸引起關(guān)注的一個(gè)研究領(lǐng)域。關(guān)于公共品博弈還缺乏系統(tǒng)的研究,大多數(shù)的工作只是一些數(shù)值仿真結(jié)果。由于數(shù)學(xué)工具的不足,對(duì)復(fù)雜網(wǎng)絡(luò)上的博弈動(dòng)力學(xué)進(jìn)行解析是非常困難的。目前的一些近似方法,如平均場(chǎng)方法、對(duì)估計(jì)方法對(duì)異質(zhì)程度很大的網(wǎng)絡(luò)很有可能失效。因此,尋求有效的數(shù)學(xué)工具,探求更好的理論結(jié)果,將一些數(shù)值結(jié)果命題化、

93、嚴(yán)格化、一般化,將是十分有意義的。</p><p>  在演化博弈上的博弈動(dòng)力學(xué)還沒(méi)有得到充分的研究,因此研究網(wǎng)絡(luò)拓?fù)浜筒┺膭?dòng)力學(xué)的共同演化將是一個(gè)非常有前景的方向。另外,還可以對(duì)個(gè)體的異質(zhì)性進(jìn)行進(jìn)一步的探究,使得模型更合理的描述、反映現(xiàn)實(shí),解決一些社會(huì)、經(jīng)濟(jì)中的公開(kāi)問(wèn)題。對(duì)合作機(jī)制的研究,目前還沒(méi)有統(tǒng)一的認(rèn)識(shí),依然是演化博弈中最重要的方向,也是當(dāng)前演化博弈的焦點(diǎn)問(wèn)題,除了要考慮可能的內(nèi)在機(jī)制外,我們還應(yīng)考慮下復(fù)

94、雜網(wǎng)絡(luò)上的其他動(dòng)力學(xué)行為,應(yīng)用演化博弈的思想解決一些實(shí)際問(wèn)題,如“傳染病傳播問(wèn)題”、“生物進(jìn)化”、“市場(chǎng)經(jīng)濟(jì)行為規(guī)律”等等。</p><p>  目前關(guān)于博弈模型的研究大多集中在囚徒困境模型、雪堆博弈模型等,應(yīng)拓展我們的研究范圍,研究不同類型下的博弈模型,例如本文的公共品博弈模型等。</p><p>  關(guān)于公共品博弈的研究,現(xiàn)在大部分集中在經(jīng)濟(jì)學(xué)領(lǐng)域,對(duì)公共品博弈的未來(lái)發(fā)展,應(yīng)對(duì)復(fù)雜網(wǎng)絡(luò)

95、的異質(zhì)性進(jìn)一步研究,將現(xiàn)實(shí)社會(huì)中個(gè)體之間的差異、各種社會(huì)影響因素等考慮在內(nèi),使得模型更加系統(tǒng)完善,更好的反映現(xiàn)實(shí),進(jìn)而解決現(xiàn)實(shí)社會(huì)中的社會(huì)困境。</p><p><b>  參考文獻(xiàn)</b></p><p>  Public goods games with reward in finite populations,J.Marh.biol.DOI 10.1007/s0

96、0285-010-0363-7</p><p>  [2]Neumann JV,Morgenstern O.Theory of Games and Economic Behavior.Princeton:Princeton University Press,1953</p><p>  [3]Nash J F.Equilibrium points in n-person games.Pro

97、natl Acad Sci USA,1950,36:48</p><p>  [4]Alvard MS, Nolin DA (2002) Rousseau’s whale hunt? Coordination among big-game hunters. Curr Anthro 43(4):533–559</p><p>  [5]Antal T, Scheuring I (200

98、6) Fixation of strategies for an evolutionary game in finite populations. BullMath</p><p>  Biol 68:1923–1944</p><p>  [6]Antal T, Scheuring I (2006) Fixation of strategies for an evolutionary g

99、ame in finite populations. BullMath</p><p>  Biol 68:1923–1944</p><p>  [7]Berg J, Dickhaut J, McCabe K (1995) Trust, reciprocity, and social history. Games Econ Behav 10:122–142</p><

100、p>  [8]Boyd R, Richerson PJ (1988) The evolution of reciprocity in sizeable groups. J Theor Biol 132:337–356</p><p>  Brandt H, Hauert C, Sigmund K (2006) Punishing and abstaining for public goods. Proc N

101、atl Acad Sci</p><p>  USA 103(2):495–497</p><p>  [9]Clutton-Brock TH, O’Riain MJ, Brotherton PNM, Gaynor D, Kansky R, Griffin AS, Manser M (1999)</p><p>  [10]Selfish sentinels in

102、cooperative mammals. Science 284:1640–1644</p><p>  [11]Colman A (2006) The puzzle of cooperation. Nature 440:744–745</p><p>  [12]Dawes RM (1980) Social dilemmas. Annu Rev Psychol 31:169–193<

103、;/p><p>  [13]De Silva H, Sigmund K (2009) In games, groups and the global good. In: Levin SA (ed) Game theory.</p><p>  [14]Springer, Berlin pp 85–114</p><p>  [15]Fehr E, Gächte

104、r S (2000) Fairness and retaliation: the economics of reciprocity. J Econ Perspect 14(3):159–181</p><p>  [16]Fehr E, Gächter S (2002) Altruistic punishment in humans. Nature 415:137–140</p><

105、p>  of costly punishment. Science 316:1905–1907</p><p>  [17]Henrich J, Boyd R, Bowles S, Camerer C, Fehr E, Gintis H, McElreath R (2001) Cooperation, reciprocity</p><p>  and punishment in f

106、ifteen small scale societies. Am Econ Rev 91:73–78</p><p>  [18]Hilbe C, Sigmund K (2010) Incentives and opportunism: from the carrot to the stick. Proc R Soc Lond B</p><p><b>  (online)&l

107、t;/b></p><p>  [19]陳亮、朱士群;小世界網(wǎng)絡(luò)中的公共品博弈[M],蘇州大學(xué)學(xué)報(bào)(自然科學(xué)版),第24卷第3期</p><p>  [20]王龍、伏鋒、陳小杰、王靖、李卓政、楚天廣;復(fù)雜網(wǎng)絡(luò)上的演化博弈[M],智能系統(tǒng)學(xué)報(bào),第2卷第2期</p><p>  [21]鄭金連、狄增如;復(fù)雜網(wǎng)絡(luò)研究與復(fù)雜現(xiàn)象[M],系統(tǒng)辯證學(xué)學(xué)報(bào),第13卷第4期&

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論