基于學(xué)習(xí)的多Agent協(xié)商研究.pdf_第1頁
已閱讀1頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、Agent和多Agent系統(tǒng)(Multi-AgentSystems,簡稱MAS)正在成為人工智能研究實用化和在分布計算環(huán)境下的軟件智能化的重要技術(shù)。MAS技術(shù)的研究主要集中在三個方面:Agent行為理論、Agent體系結(jié)構(gòu)和多Agent協(xié)作。其中,多Agent協(xié)作主要是研究自動Agent系統(tǒng)如何能夠更有效的交互。近年來,協(xié)商作為MAS中矛盾處理和沖突消解的一種重要的方法,已經(jīng)成為MAS系統(tǒng)協(xié)作研究中的一個重要的分支。 在MAS的

2、研究中,研究者使用很多方法提高協(xié)商模型的適應(yīng)能力和決策能力,其中很重要的一個方法就是在協(xié)商模型中加入學(xué)習(xí)機制,使得系統(tǒng)的性能得到改善。然而,目前的Agent協(xié)商學(xué)習(xí)算法多存在于協(xié)商過程中,在協(xié)商前,Agent個體自身信念中對于交互對手的私有信息認(rèn)知程度還不高。 本文詳細分析了MAS中多議題協(xié)商過程,簡要介紹了協(xié)商的概念,對協(xié)商各個不同的類型進行了詳細地介紹。針對多Agent多議題協(xié)商模型內(nèi)部的學(xué)習(xí)、決策機制能力的提高問題,對比了

3、多種已經(jīng)存在的協(xié)商Agent學(xué)習(xí)算法和決策模型。Agent個體在協(xié)商開始前對交互對手信息的認(rèn)知程度在一定程度上影響了Agent自身的決策效率和最終收益。本文參考Zeng等人[42]提出的協(xié)商Agent學(xué)習(xí)方案,以貝葉斯理論為基礎(chǔ),使用Agent協(xié)商系統(tǒng)中在中間平臺上存儲的對手Agent的協(xié)商歷史信息,對協(xié)商對手的各個議題保留值等私有信念進行預(yù)測。并在此基礎(chǔ)上,對已有的Agent協(xié)商交互機制進行優(yōu)化,提高Agent個體在協(xié)商中的最終收益。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論