在多Agent環(huán)境中求帕累托效率解的方法研究.pdf

上傳人：奔*** IP屬地：河北更新時間：2024-03-13 格式：pdf 頁數(shù)：54 大?。?.72MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

已閱讀1頁，還剩53頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、多Agent系統(tǒng)（MAS）及其相關(guān)技術(shù)近年來受到越來越多的研究者的關(guān)注。它不僅已經(jīng)被廣泛運(yùn)用到了Internet、辦公自動化、沖突協(xié)調(diào)、決策支持、開放式信息系統(tǒng)等眾多領(lǐng)域。并且它還是博弈論和人工智能交叉領(lǐng)域研究的熱門問題之一。
　　在一個競爭的環(huán)境中，一個令人滿意的多Agent學(xué)習(xí)算法應(yīng)該至少是理性的，它應(yīng)該能保證自己的安全收益。在一個可合作的環(huán)境中，一個令人滿意的多Agent學(xué)習(xí)算法應(yīng)該是滿足合作性的，在與公正對手博弈時，應(yīng)

2、盡可能的達(dá)到雙贏的局面。目前，有很多算法都可以滿足理性，而另一些算法能夠在與公正對手的博弈中取得高額回報(bào)，但是卻不能二者兼得。
　　在本文中，我們詳細(xì)分析了MAS中的學(xué)習(xí)環(huán)境理論模型，簡要介紹了多Agent環(huán)境中學(xué)習(xí)算法應(yīng)具備的屬性，并分析了當(dāng)前一些學(xué)者提出的算法。然后分析了Q-學(xué)習(xí)算法，WoLF原理，并介紹了Roben Axelrod實(shí)驗(yàn)。根據(jù)以上三個方面，我們分析了一個優(yōu)秀的算法應(yīng)能從歷史博弈中進(jìn)行學(xué)習(xí)，并且應(yīng)該兼顧理性與

3、合作性。在此基礎(chǔ)上我們提出了PESCO算法，它能從以往的收益和對手的動作中學(xué)習(xí)到對手的特點(diǎn)，并且具備善意的、寬容的、強(qiáng)硬的特點(diǎn)。它在自博弈時滿足自兼容性，它對非合作對手滿足理性，保證安全收益，對合作對手，尋求帕累托效率解，達(dá)到雙贏局面。
　　我們以可合作的供零博弈、Stackelberg博弈和非合作的猜硬幣博弈為背景，通過一系列的實(shí)驗(yàn)來驗(yàn)證PESCO算法的有效性，詳細(xì)描述了實(shí)驗(yàn)過程的每一個細(xì)節(jié)，說明了該算法無論在可合作的博弈中

眾賞文庫> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

在多Agent環(huán)境中求帕累托效率解的方法研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

在多Agent環(huán)境中求帕累托效率解的方法研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

免費(fèi)下載