基于Agent圖的聯(lián)盟形成算法研究.pdf

上傳人：奔*** IP屬地：河北更新時間：2024-03-10 格式：pdf 頁數(shù)：149 大?。?3.56MB 人氣指數(shù)：12 舉報 版權(quán)申訴

已閱讀1頁，還剩148頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、眾所周知，智能體或稱為Agent可以通過相互協(xié)作來實(shí)現(xiàn)他們的共同目標(biāo)，以提高其整體的性能。在多Agent系統(tǒng)中，這種相互協(xié)作通常采用Agent聯(lián)盟的形式來完成。所謂聯(lián)盟就是多個同意協(xié)作的Agents在一起解決某個共同的問題，這些問題可能是單個Agent很難完成的或者完成的效率沒有Agent組合的高。當(dāng)多個Agent作為Agent聯(lián)盟形式時，每個Agent都能從聯(lián)盟獲得額外的收益。因此可以看出，聯(lián)盟形成(CF)是一種將分布的自治的多個Ag

2、ents聯(lián)合起來共同解決某個問題有效機(jī)制，在這個聯(lián)盟中，每個Agent個體都有它們自身的能力，當(dāng)Agents作為聯(lián)盟工作時，每個Agent在聯(lián)盟中都有實(shí)現(xiàn)了自己的功能價值。由此，在多Agent系統(tǒng)(MAS)中，聯(lián)盟形成(CF)是十分必要及有用的交互協(xié)作形式，它能夠以一種有效的方式提高Agent完成任務(wù)和實(shí)現(xiàn)目標(biāo)的能力。已經(jīng)證實(shí)，多Agent聯(lián)盟已經(jīng)被運(yùn)用到很多領(lǐng)域，比如:資源分配，合作問題求解，商業(yè)交易等多個領(lǐng)域。在資源分配問題中，資源

3、Agents組成聯(lián)盟來完成服務(wù)任務(wù)，能完成單個資源Agent不能完成或不能高效完成的服務(wù)任務(wù)。在合作問題求解時，多個Agents組成聯(lián)盟共同完成任務(wù)，使完成任務(wù)的同時能爭取整體利益最大化。在商業(yè)交易中，Agent與其他個體相互合作，形成聯(lián)盟，可獲得批量折扣，增加自身收益。然而，在實(shí)際的應(yīng)用中面臨的主要問題是，怎樣在單個Agent的能力有限不能單獨(dú)完成任務(wù)時，通過相互合作的Agent形成聯(lián)盟的合作形式，從而使Agent更好的實(shí)現(xiàn)目標(biāo)，并實(shí)

4、現(xiàn)整體利益的最大化。
　　聯(lián)盟形成問題是MAS研究領(lǐng)域中挑戰(zhàn)性問題之一。這個問題的關(guān)鍵是，如何高效的在多Agents之間構(gòu)建聯(lián)盟，這也是本論文著力研究的主要內(nèi)容。對聯(lián)盟形成的研究主要從兩個方面進(jìn)行，一個是聯(lián)盟如何形成，它的形成過程，形成方法，形成的模型等，另一個是聯(lián)盟評估。其中，前者涉及到的是聯(lián)盟形成方面的（如聯(lián)盟的結(jié)構(gòu)，聯(lián)盟值），后者提到的是聯(lián)盟形成的結(jié)果（如收益分配等）。當(dāng)前大多數(shù)研究工作將聯(lián)盟形成看成一個優(yōu)化問題，主要是尋找

5、擁有最大效用值的最優(yōu)聯(lián)盟，而不是關(guān)注聯(lián)盟的形成問題以及通過哪些有效的方法獲得那些合適的聯(lián)盟結(jié)構(gòu)。毋庸置疑，采用窮盡搜索方式可以找到使Agent組合的全局效用值（比如社會福利）最大化的Agent聯(lián)盟結(jié)構(gòu)，然而，實(shí)際情況是，多Agent系統(tǒng)中的這些Agent都是以分散的形式存在。
　　為了某個特定的目標(biāo)，需要將這些分散的Agent形成聯(lián)盟來解決問題時，當(dāng)每個agent都只有其鄰居的局部信息時，形成聯(lián)盟時很難通過窮盡搜索方式找到全局的最

6、優(yōu)聯(lián)盟結(jié)構(gòu)。在這些情況下，我們無法找到或者及時的找到全局的最優(yōu)解，我們不得不考慮次最優(yōu)解，這些次最優(yōu)解雖然不能達(dá)到聯(lián)盟的最高性能，但是能滿足形成聯(lián)盟的最低要求。因此，本文致力于提高這類多Agent聯(lián)盟形成的質(zhì)量的研究。
　　本文的主要貢獻(xiàn)也都集中于此，本文主要呈現(xiàn)了多Agent系統(tǒng)中基于Agent圖的聯(lián)盟形成算法。該算法是在分布式多Agent系統(tǒng)中，對來自一個Agent圖中的智能體構(gòu)建聯(lián)盟。其中，所謂Agent圖是指Agent互相

7、關(guān)聯(lián)的拓?fù)浣Y(jié)構(gòu)圖。這種系統(tǒng)是由一些自治Agent構(gòu)成，這些Agent可以在沒有控制中心的情況下自發(fā)的與其他Agent對話以及實(shí)現(xiàn)它們的功能。因?yàn)?，真?shí)世界環(huán)境中，Agent都是只有局部的不完全信息，在這種情況下要為某個特定的目標(biāo)形成聯(lián)盟，我們必須提出并實(shí)現(xiàn)一些可行的高效的算法形成聯(lián)盟。基于上述的分析，它可以通過搜索agent圖中的聯(lián)盟伙伴來實(shí)現(xiàn)，這不僅可以提高聯(lián)盟形成的質(zhì)量也可以提高聯(lián)盟形成的效率。
　　據(jù)此，本文從四個方面進(jìn)行闡

8、述上述的聯(lián)盟形成算法研究。第一，提出了一種新型的聯(lián)盟形成機(jī)制，這種聯(lián)盟機(jī)制從一種新的角度考慮了Agent之間的聯(lián)盟，同時對價值不斷變化的Agent之間如何形成聯(lián)盟也進(jìn)行考慮。它的優(yōu)點(diǎn)不在于形成一個最優(yōu)聯(lián)盟，而是通過Agent與它的鄰居們的協(xié)商過程，從協(xié)商的Agent集中獲得一個有效的聯(lián)盟集，這些鄰居是從Agent圖中的鄰接點(diǎn)（如，直接相鄰的）獲取的。在有些情況下，Agent具有完成任務(wù)所需的所有功能，因而它可以完全靠自己來完成自己的目標(biāo)

9、。然而，有些時候Agent的功能有限，不能單個的完成某個任務(wù)，或者對某些任務(wù)它就無法像其他Agent那樣有效的完成。這種情況下，Agent可以通過交流將任務(wù)分配給它的鄰居。這種分配就可以通過Agent之間的協(xié)商來完成，通過協(xié)商分配任務(wù)給他的鄰居以致使任務(wù)的完成質(zhì)量更高。第二，本論文擴(kuò)展了Agents之間的協(xié)作關(guān)系，除了Agent圖中直接相連的Agents的協(xié)作，還包括了間接相連的Agents之間的協(xié)作。該協(xié)作關(guān)系是通過搜索帶有權(quán)值函數(shù)的

10、Agent圖實(shí)現(xiàn)的。所謂的帶有權(quán)值函數(shù)的圖是用來標(biāo)記聯(lián)盟的，這種聯(lián)盟是為了實(shí)現(xiàn)特定的目標(biāo)而存在的。當(dāng)Agent并沒有實(shí)現(xiàn)目標(biāo)所需要的所有能力時，Agent需要和那些能夠?qū)崿F(xiàn)一些子任務(wù)的Agents形成聯(lián)盟，進(jìn)而完成整個任務(wù)。否則，Agent將無法完成整個任務(wù)。第三，論文研究自治的Agent如何獲得批量的折扣。作為聯(lián)盟的成員，Agents可以以折扣價的成本實(shí)現(xiàn)部分或者全部的目標(biāo)，從而使Agent獲得收益。這表明Agent聯(lián)盟是根據(jù)聯(lián)盟價值

11、的特定約束形成的。第四，是第三方面的擴(kuò)張，討論了如何獲得穩(wěn)定的聯(lián)盟。本文假設(shè)agent是同構(gòu)的，共享相同的目標(biāo)，它們可以形成穩(wěn)定的聯(lián)盟通過在核中心的收益回報分布。它的穩(wěn)定性指的是Agent滿足一定穩(wěn)定性條件的花銷分擔(dān)規(guī)則。綜上，本文重點(diǎn)在于找到實(shí)用的解決算法，在現(xiàn)實(shí)環(huán)境中，通過搜索Agent圖中的聯(lián)盟伙伴形成聯(lián)盟，以改善聯(lián)盟的形成過程和聯(lián)盟形成的質(zhì)量，這就是本文的主要的研究內(nèi)容。
　　根據(jù)前段的闡述，本文首先在Agent和它的鄰居

12、之間提出了一種新穎實(shí)用的基于模糊邏輯的決策理論的分布式協(xié)商模型。運(yùn)用這種模型可以自動克服復(fù)雜的談判過程，并且可以在Agent擁有鄰居的不完全信息的情況下，幫助Agent形成聯(lián)盟。這種談判模型是形成有效聯(lián)盟的基礎(chǔ)。該模型包括三個主要的內(nèi)容:(1)分布式協(xié)商模型形成聯(lián)盟;(2)基于模糊邏輯的評價模型和(3)一組最佳的有效聯(lián)盟集。
　　其中，分布式協(xié)商模型采用基于交替提議協(xié)商協(xié)議，Agent和它們的直接鄰居之間可以協(xié)商多個議題（如，價格

13、和質(zhì)量等）。每一方在此過程中都是通過提供建議和反建議進(jìn)行協(xié)商，最終都想達(dá)到對自己是最低價格的協(xié)議（比如，一個聯(lián)盟伙伴）。依賴于推理組件模型的模糊評價方式，該部分主要是專注于評估Agent所提的建議，從而決定接受還是拒絕對方的提議，并生成提議，/反提議。它利用一個集合的模糊隸屬函數(shù)（即低或高）來推理相關(guān)數(shù)據(jù)以及If-Then決策規(guī)則來支持靈活的協(xié)商過程。用模糊模型做出的決策是依賴于一系列的提議接收的程度，這使得決策更能貼近現(xiàn)實(shí)的真實(shí)世界，

14、并且擁有更好的靈活性?；谀：碚摰脑u估包含三個步驟（即模糊化步驟、推理步驟和去模糊化步驟），它能夠決定提議是否接收和接受的程度。在模糊化步驟中，定義輸入變量的隸屬函數(shù)應(yīng)用它們的實(shí)際價值來決定真實(shí)的程度。在推理步驟中，每個規(guī)則的真實(shí)值會被計算出來，然后應(yīng)用到每個規(guī)則的結(jié)論部分。在一個模糊子集中的結(jié)果將會被分配給每個規(guī)則的輸出變量中，在去模糊化的步驟中，模糊輸出結(jié)果將會被去模糊化變成一個清晰的數(shù)。然后根據(jù)每個協(xié)商Agent的行為制定相應(yīng)的

15、協(xié)商策略，決定每次提議是接受或拒絕還是重來。比如，Agent利用時間依賴策略與其他Agent協(xié)商，當(dāng)一個協(xié)商發(fā)生是，Agent都會有一個時間期限。應(yīng)用時間限制策略的重點(diǎn)在于保證Agent的協(xié)商不能是無限期的，相反的，要讓協(xié)商在一個合理的時間范圍（或者是最大回合數(shù)）內(nèi)完成。因此，當(dāng)一些Agent經(jīng)過成功的協(xié)商完成某個目標(biāo)后，最有效的聯(lián)盟集能夠在這些Agents中形成。
　　利用基于模糊邏輯的方法的原因在于，需要處理關(guān)于對手的有限的信

16、息和談判對手的不同偏好，而模糊邏輯能夠很好的解決利用不完整的信息進(jìn)行推理的問題。采用傳統(tǒng)的模型來評估一個多議題的協(xié)商提議，太過復(fù)雜。而基于模糊邏輯的方法在克服評估提議復(fù)雜性上有更突出的實(shí)際意義。因此，在本文所提出的這個基于模糊邏輯的模型中，我們應(yīng)用模糊邏輯建立議題之間的關(guān)系（比如價格，交貨期限等），并且允許Agent表達(dá)它們的偏好，評估系統(tǒng)也是充分考慮Agent的需求（即Agent的效用最大化）。協(xié)商的核心是用一個最低價格達(dá)成協(xié)議并幫助

17、形成一個有效的聯(lián)盟。我們要考慮的問題在于，協(xié)商模型的有效性、實(shí)用性，以及如何在Agent圖中，以一種分散的形式找到潛在的聯(lián)盟伙伴。
　　本文提出的基于模糊邏輯的協(xié)商模型的性能評估通過與其他的傳統(tǒng)模型的對比來進(jìn)行。文章中提到的傳統(tǒng)模型包括:1）戰(zhàn)術(shù)策略模型和2）得分函數(shù)模型。在戰(zhàn)術(shù)模型中，該模型是根據(jù)Agent自身的標(biāo)準(zhǔn)來評估和決策提議的接受與否，但這個并不能保證最佳的交易結(jié)果，因?yàn)樗鼪]有考慮Agent在協(xié)商過程中的偏好，而且還允許

18、Agent快速讓步到它們的保留值以達(dá)成協(xié)議。雖然在得分函數(shù)模型中，Agent在計算提議評估的得分函數(shù)時考慮了每個議題的權(quán)重，但是它沒有考慮在協(xié)商過程中所有提出的議題和推理之間的關(guān)系。
　　仿真實(shí)驗(yàn)表明，本文提出的基于模糊邏輯的協(xié)商模型，可以在協(xié)商Agent中獲得更好的協(xié)商結(jié)果。實(shí)驗(yàn)證明基于模糊理論協(xié)商模型的協(xié)商成功率比戰(zhàn)術(shù)模型的高了12％，比得分模型的成功率高了34％到48％。并且，它動態(tài)的提高了獲得有效聯(lián)盟集的機(jī)會，它的最高效率

19、比戰(zhàn)術(shù)模型提高了27％到70％。在有大量的Agent參入的情況下，與得分模型相比效率高出98％以上。在一個合理分配的時間范圍內(nèi)，模糊理論的決策者協(xié)商模型獲得的最高效率比得分模型的最高效用值高了44％到86％，通過設(shè)置談判進(jìn)程的最后期限，以避免無休止的協(xié)商，模糊理論的決策者協(xié)商模型節(jié)省的協(xié)商時間與戰(zhàn)術(shù)模型相比高了35％到65％。在社會福利方面，在大量有Agents參入的情況下，基于模糊理論的模型獲得社會福利比戰(zhàn)術(shù)協(xié)商模型高出至少70％在比

20、小數(shù)量Agents的情況下，比得分模型高出至少29％的。綜上，可以得出結(jié)論，本文提出的分布式基于模糊邏輯協(xié)商模型比其他模型在提高聯(lián)盟的形成質(zhì)量上更加的有實(shí)用和高效。
　　某些時候聯(lián)盟伙伴是可以擴(kuò)展的，也就是聯(lián)盟的伙伴可以從Agent的直接相鄰鄰居擴(kuò)展到它的間接相鄰鄰居，這樣可以為Agent提供更多的機(jī)會來實(shí)現(xiàn)它們的任務(wù)或者求得子任務(wù)的解。參入考慮的Agents的數(shù)量越多，所組成的聯(lián)盟的可能性就越多，還有就是每個Agent都有自己的

21、功能，這樣整個聯(lián)盟的功能集就會相應(yīng)增強(qiáng)了。尤其是當(dāng)在解決一個任務(wù)或者理解為一個實(shí)現(xiàn)某個功能時，如果它的直接鄰居的資源或能力有限，不通過擴(kuò)展可能會導(dǎo)致任務(wù)的失敗，因?yàn)樵谶@個集合中沒有Agent有能力解決問題。因此，構(gòu)建一個可行的聯(lián)盟的聯(lián)盟伙伴不僅可以從直接鄰居獲得也可以從有用的間接鄰居中獲得。我們知道可以從帶有加權(quán)值的Agent圖中可以得到這些鄰居，其中有些Agent扮演經(jīng)紀(jì)人的角色，推薦相關(guān)Agent，并且獲得了一些獎勵。如何構(gòu)建支持間

22、接鄰居的多Agent聯(lián)盟算法，將是本文呢闡述的第二個內(nèi)容。
　　基于上述想法，本文提出的算法是找到次最優(yōu)可行解算法來實(shí)現(xiàn)某個特定的目標(biāo)，這種次最優(yōu)可行解它是接近最優(yōu)最小成本的解，這時Agent不得不找到合適的聯(lián)盟伙伴來共同完成任務(wù)，并形成可行的聯(lián)盟(FC)。這個可行聯(lián)盟指的是，為了實(shí)現(xiàn)某個特定的任務(wù)或目標(biāo)，聯(lián)盟中所有的成員可以是間接關(guān)聯(lián)的。在加權(quán)Agent圖中進(jìn)行搜索聯(lián)盟伙伴，形成可行聯(lián)盟獲得最好的或者次最優(yōu)的解取決與這個搜索過程

23、。求最優(yōu)最小成本解，搜索過程需要完成對整個圖的搜索——完全搜索。雖然，這個最優(yōu)解保證了全局最小值（即最小成本），但是這是一種不考慮時間和空間復(fù)雜度的窮盡搜索方法。市級存在這樣的環(huán)境因素（比如在有大量的agent和大量的任務(wù)的情況下）制約這種最優(yōu)聯(lián)盟形成。但是這些因素會促進(jìn)所有參與聯(lián)盟的Agent，通過搜尋臨近最優(yōu)可行解來構(gòu)建協(xié)作聯(lián)盟。這種臨近最優(yōu)可行方案，通過使用一個貪婪算法，在每個搜索階段，試圖從下一個的搜索階段放棄不良的Agent，

24、從而保證達(dá)到在計算復(fù)雜度上局部的最小值（相對于它的鄰居成本來說是最小的）。
　　文章中提到的最優(yōu)最小成本算法是基于廣度優(yōu)先搜索的(BFS)，通過完全搜索層次化的Agent權(quán)重圖能夠找到全局最優(yōu)解。其算法的核心思想是:首先，是給出一個Agent的請求，訪問與請求動作相關(guān)的第一層Agents;然后一層層的檢查所有的于此相鄰的Agent，這些Agents都是遠(yuǎn)離訪問Agent的;最后將這些訪問過的遠(yuǎn)距離Agents分配到一個新的層。然后

25、繼續(xù)以相同的方式搜索，檢查那些與請求的Agent相鄰的Agents，對于那些先前分配到一個層的Agents不做動作。當(dāng)Agent圖中的所有的Agents都被遍歷到了，這個過程將會終止，這時用最低成本實(shí)現(xiàn)任務(wù)的聯(lián)盟伙伴就已經(jīng)被找到了。
　　本文提出的臨近最優(yōu)可行解算法同樣也是基于廣度優(yōu)先搜索方法的，通過擴(kuò)展那些最接近目標(biāo)的結(jié)點(diǎn)來實(shí)現(xiàn)局部最優(yōu)。在這種方法中，搜索的深度是根據(jù)最有可能的結(jié)點(diǎn)的深度來的決定的。首先，它有一個提出請求的Age

26、nt，作為訪問點(diǎn)在第一層訪問與請求動作相關(guān)的Agent，然后檢查那些遠(yuǎn)離訪問Agent的邊緣有效Agents（即可以承擔(dān)請求動作的Agent）。從檢查過的Agents中選擇出最有前途的Agent（即可以提供最低成本的Agent），進(jìn)而擴(kuò)展它的分支作為下個搜索區(qū)域，忽略其他的分支Agents。一直重復(fù)這個過程，當(dāng)沒有有效的Agent或者沒有遺留下需要檢查的Agent時，我們將停止搜索，這時，可以為請求動作提供最小成本的可行聯(lián)盟伙伴已經(jīng)被找

27、到。臨近最優(yōu)方案算法通過采用子圖的形式，在搜索的每一步中，及時在每個子圖中（即以最少的成本，提供動作）消除沒有用Agents（頂點(diǎn)）?？梢缘贸?，臨近最優(yōu)解算法在降低計算復(fù)雜度方面比最優(yōu)最低開銷的算法更加實(shí)用。通過最可行的Agent鄰居進(jìn)行搜索，集中根據(jù)這個目標(biāo)，可以通過臨近最優(yōu)解決方案實(shí)現(xiàn)局部最優(yōu)解。這種解相對于全局最優(yōu)解具有較低的平均處理時間和較小的區(qū)域復(fù)雜性，它更適用于現(xiàn)實(shí)世界中構(gòu)建協(xié)作聯(lián)盟。
　　通過實(shí)驗(yàn)的仿真和驗(yàn)證，本文提

28、出的臨近最優(yōu)可行解算法獲得的平均效用值為最優(yōu)最小成本解算法得到平均效用值的91％至97％之間。根據(jù)性能比，臨近最優(yōu)的可行解，可以保證解的質(zhì)量不遜于最優(yōu)解的91％。雖然，最優(yōu)最小成本的解能夠得到全局最優(yōu)效用值，但臨近最優(yōu)可行算法解決方案在實(shí)現(xiàn)局部最優(yōu)上是非常有效和實(shí)用的。隨著Agents數(shù)目增加，臨近最優(yōu)可行算法具有較低的處理時間形成可行的聯(lián)盟，其時間復(fù)雜性是最優(yōu)最低成本算法的42％到57％，之間下降到32％。這些結(jié)果表明，本文的第二個研

29、究內(nèi)容已經(jīng)完成，并且證明了所提出的臨近最優(yōu)可行解方案的有效性。
　　通過考慮與聯(lián)盟形成相關(guān)的搜索成本，我們提出了一個稱為次優(yōu)折扣聯(lián)盟形成（次優(yōu)DGF）的算法。該算法允許Agent以一個折扣價獲取它們部分或者全部的目標(biāo)（例如，請求操作）。在這種情況下，聯(lián)盟成員通過Agents之間的合作取得折扣價可以增加Agents的效益。這種合作從直接的Agent鄰居擴(kuò)展到間接Agent鄰居，其中可以通過在對Agent圖中的Agents分布式搜索來

30、發(fā)現(xiàn)潛在的合作機(jī)會?？紤]到搜索成本，Agent的目標(biāo)是找到潛在的機(jī)會的最佳集合，該集合在形成的聯(lián)盟的最大整體功用上以分散的方式用滿足聯(lián)盟請求。這正是本文第三個研究工作的主要內(nèi)容。
　　具體來說，在次優(yōu)DGF算法中的每一個Agent將每個提供的操作都與一個價格計劃相關(guān)聯(lián)，并通過搜索有價值的聯(lián)盟來提供基于請求的操作數(shù)目（即數(shù)量）的折扣價。Agent使用一個聯(lián)盟價值約束條件(CVC)在繼續(xù)搜索（可能會由于擴(kuò)展聯(lián)盟而導(dǎo)致更好的機(jī)會）與接受

31、當(dāng)前聯(lián)盟的形成（從當(dāng)前有價值的聯(lián)盟之中獲得即時收益）之間進(jìn)行權(quán)衡。它尋求一個合作機(jī)會通過分派來自Agent圖中的請求Agent子集來給所有的聯(lián)盟成員產(chǎn)生最大效用，該子集在可能的聯(lián)盟中擁有最大的聯(lián)盟價值。DGF的次優(yōu)解決方案算法應(yīng)該保證在與其他的解決方案相比時獲得更好的結(jié)果，包括:1）單獨(dú)的Agent搜索，其中的每個Agent都比在團(tuán)體中更高的成本獲得其目標(biāo)（即不享受團(tuán)體折扣）;2）優(yōu)化算法是在效用的基礎(chǔ)上計算最優(yōu)聯(lián)盟;3）通過考慮搜索成

32、本作為一個參數(shù)來影響一個最優(yōu)解的形成。
　　第三個研究工作的主要成就之一是從團(tuán)隊(duì)中搜索得到收益。這種搜索可以利用被單獨(dú)Agent拋棄的搜索機(jī)會。通過這樣的收益，少量Agent實(shí)現(xiàn)目標(biāo)的失敗率能夠從24％減少到4％，如果有大量Agents參入，則失敗率幾乎為零。同時，次優(yōu)DGF算法也表現(xiàn)出其高效性，在實(shí)現(xiàn)一個目標(biāo)的平均處理時間上它比單獨(dú)Agent搜索快了15％到34％。通過不同數(shù)量的agent形成的聯(lián)盟的實(shí)驗(yàn)分析，提出的解決方案獲得

33、了在時間上比其他優(yōu)化模型快5％到24％。隨著Agents數(shù)量的增長，次優(yōu)DGF算法的平均效用以98％的比率接近最優(yōu)效用，并且在考慮搜索成本作為一個影響最優(yōu)聯(lián)盟的搜索的參數(shù)時高于平均聯(lián)盟價值6％。因此，DGF的次優(yōu)解決方案算法在與搜索成本相關(guān)的真實(shí)世界的環(huán)境中有它的優(yōu)勢。Agent更傾向于通過合作搜索折扣價朝向特定的目標(biāo)形成聯(lián)盟而不是通過單獨(dú)搜索的方式。
　　最后，我們進(jìn)一步的擴(kuò)展上述的研究內(nèi)容，即不僅要獲得一組聯(lián)盟的形成，還要根據(jù)

34、收益分配的核心值來獲得穩(wěn)定的聯(lián)盟形成(SCF)。一個聯(lián)盟的穩(wěn)定要求根據(jù)成本分?jǐn)傇瓌t在聯(lián)盟成員之間進(jìn)行收益分配，要對拒絕參與并形成自己的聯(lián)盟的Agent團(tuán)體不予分配收益。該核心值是用來描述這個屬性的最常用概念。當(dāng)形成聯(lián)盟時，Agents由于實(shí)現(xiàn)一個目標(biāo)而收到獎勵或者回報，并且要決定如何以一個穩(wěn)定的方式在成員Agents中劃分獎勵。我們考慮的情況是，Agents在一定意義上是同質(zhì)的，每個Agent都有相同的目標(biāo)（以折扣價—最低價獲得操作動作

35、）。形成這樣的穩(wěn)定聯(lián)盟時與搜索成本有關(guān)的。這個搜索成本反映了在搜索活動中需要投入的資源，例如尋找其他Agents以及確定最有價值的穩(wěn)定聯(lián)盟。因此，一個基于聯(lián)盟價值的策略(CVS)以及成本分?jǐn)傄?guī)則用于在對SCF進(jìn)行搜索的過程中評估不同的形成聯(lián)盟的機(jī)會。為了這個目的，我們?yōu)镾CF提出了一個半最優(yōu)解決方案算法。該解決方案應(yīng)該保證通過尋找可行的聯(lián)盟伙伴集合來達(dá)成一個穩(wěn)定的聯(lián)盟（即核心值在聯(lián)盟內(nèi)的收益分配是穩(wěn)定的）。這些聯(lián)盟伙伴可以在Agent圖

36、中從直接鄰居（Agent的鄰居）擴(kuò)展到間接鄰居（臨近Agent鄰居的Agent）來獲得批量折扣。聯(lián)盟形成與成本分?jǐn)傄?guī)則應(yīng)該給在聯(lián)盟中的Agent提供激勵使其不是被強(qiáng)迫使其留在聯(lián)盟中，這是作為個人理性(IR)與預(yù)算平衡(BB)的合理結(jié)果。根據(jù)IR，聯(lián)盟成員的所有個人花費(fèi)都不大于相應(yīng)底價。與此同時在BB中，聯(lián)盟掌管在聯(lián)盟中產(chǎn)生的花費(fèi)。因此，agent的花費(fèi)是其底價的非減函數(shù)。
　　SCF的半最優(yōu)解決方案算法應(yīng)根據(jù)其核心保證一個高效的收

37、益分配結(jié)果相對于其他解決方案，包括:1）導(dǎo)致最佳收益的最優(yōu)算法;2）通過考慮搜索成本作為一個參數(shù)來影響穩(wěn)定最優(yōu)聯(lián)盟的搜索方法。另外，在核心中形成穩(wěn)定聯(lián)盟依賴于聯(lián)盟內(nèi)的成本分?jǐn)傄?guī)則。根據(jù)提出的成本分?jǐn)傄?guī)則，本文通過實(shí)驗(yàn)證明SCF能夠獲得以95％到99.98％的比率接近最佳收益的平均收益。同時在考慮搜索成本作為一個參數(shù)影響最有價值穩(wěn)定聯(lián)盟的決定時，它比平均的聯(lián)盟價值高了9％。在考慮搜索成本時，本文提出的SCF算法依據(jù)Agents數(shù)量的不同也

38、相應(yīng)減少了15％至24％的平均處理時間，并且以比最優(yōu)時間快不少于75％的時間證明該方法形成穩(wěn)定聯(lián)盟的效率。這樣的解決方案的實(shí)驗(yàn)結(jié)果表明，Agent更傾向于把它們的決策建立在價格優(yōu)勢、能夠達(dá)到的折扣數(shù)以及它們之中公平的收益分配上，由此，本文提出的半最優(yōu)解決方案通過最大化可行聯(lián)盟的價值來搜索最有價值穩(wěn)定聯(lián)盟，該方案在核心也應(yīng)該是穩(wěn)定的。
　　綜上所述，本文為多Agent系統(tǒng)中聯(lián)盟形成提出了一系列新型的算法，它們一個共同的特點(diǎn)是有效且快

眾賞文庫> 全部分類> 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

基于Agent圖的聯(lián)盟形成算法研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

基于Agent圖的聯(lián)盟形成算法研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

免費(fèi)下載