基于Agent圖的聯(lián)盟形成算法研究.pdf_第1頁
已閱讀1頁,還剩148頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、眾所周知,智能體或稱為Agent可以通過相互協(xié)作來實現(xiàn)他們的共同目標,以提高其整體的性能。在多Agent系統(tǒng)中,這種相互協(xié)作通常采用Agent聯(lián)盟的形式來完成。所謂聯(lián)盟就是多個同意協(xié)作的Agents在一起解決某個共同的問題,這些問題可能是單個Agent很難完成的或者完成的效率沒有Agent組合的高。當多個Agent作為Agent聯(lián)盟形式時,每個Agent都能從聯(lián)盟獲得額外的收益。因此可以看出,聯(lián)盟形成(CF)是一種將分布的自治的多個Ag

2、ents聯(lián)合起來共同解決某個問題有效機制,在這個聯(lián)盟中,每個Agent個體都有它們自身的能力,當Agents作為聯(lián)盟工作時,每個Agent在聯(lián)盟中都有實現(xiàn)了自己的功能價值。由此,在多Agent系統(tǒng)(MAS)中,聯(lián)盟形成(CF)是十分必要及有用的交互協(xié)作形式,它能夠以一種有效的方式提高Agent完成任務(wù)和實現(xiàn)目標的能力。已經(jīng)證實,多Agent聯(lián)盟已經(jīng)被運用到很多領(lǐng)域,比如:資源分配,合作問題求解,商業(yè)交易等多個領(lǐng)域。在資源分配問題中,資源

3、Agents組成聯(lián)盟來完成服務(wù)任務(wù),能完成單個資源Agent不能完成或不能高效完成的服務(wù)任務(wù)。在合作問題求解時,多個Agents組成聯(lián)盟共同完成任務(wù),使完成任務(wù)的同時能爭取整體利益最大化。在商業(yè)交易中,Agent與其他個體相互合作,形成聯(lián)盟,可獲得批量折扣,增加自身收益。然而,在實際的應(yīng)用中面臨的主要問題是,怎樣在單個Agent的能力有限不能單獨完成任務(wù)時,通過相互合作的Agent形成聯(lián)盟的合作形式,從而使Agent更好的實現(xiàn)目標,并實

4、現(xiàn)整體利益的最大化。
  聯(lián)盟形成問題是MAS研究領(lǐng)域中挑戰(zhàn)性問題之一。這個問題的關(guān)鍵是,如何高效的在多Agents之間構(gòu)建聯(lián)盟,這也是本論文著力研究的主要內(nèi)容。對聯(lián)盟形成的研究主要從兩個方面進行,一個是聯(lián)盟如何形成,它的形成過程,形成方法,形成的模型等,另一個是聯(lián)盟評估。其中,前者涉及到的是聯(lián)盟形成方面的(如聯(lián)盟的結(jié)構(gòu),聯(lián)盟值),后者提到的是聯(lián)盟形成的結(jié)果(如收益分配等)。當前大多數(shù)研究工作將聯(lián)盟形成看成一個優(yōu)化問題,主要是尋找

5、擁有最大效用值的最優(yōu)聯(lián)盟,而不是關(guān)注聯(lián)盟的形成問題以及通過哪些有效的方法獲得那些合適的聯(lián)盟結(jié)構(gòu)。毋庸置疑,采用窮盡搜索方式可以找到使Agent組合的全局效用值(比如社會福利)最大化的Agent聯(lián)盟結(jié)構(gòu),然而,實際情況是,多Agent系統(tǒng)中的這些Agent都是以分散的形式存在。
  為了某個特定的目標,需要將這些分散的Agent形成聯(lián)盟來解決問題時,當每個agent都只有其鄰居的局部信息時,形成聯(lián)盟時很難通過窮盡搜索方式找到全局的最

6、優(yōu)聯(lián)盟結(jié)構(gòu)。在這些情況下,我們無法找到或者及時的找到全局的最優(yōu)解,我們不得不考慮次最優(yōu)解,這些次最優(yōu)解雖然不能達到聯(lián)盟的最高性能,但是能滿足形成聯(lián)盟的最低要求。因此,本文致力于提高這類多Agent聯(lián)盟形成的質(zhì)量的研究。
  本文的主要貢獻也都集中于此,本文主要呈現(xiàn)了多Agent系統(tǒng)中基于Agent圖的聯(lián)盟形成算法。該算法是在分布式多Agent系統(tǒng)中,對來自一個Agent圖中的智能體構(gòu)建聯(lián)盟。其中,所謂Agent圖是指Agent互相

7、關(guān)聯(lián)的拓撲結(jié)構(gòu)圖。這種系統(tǒng)是由一些自治Agent構(gòu)成,這些Agent可以在沒有控制中心的情況下自發(fā)的與其他Agent對話以及實現(xiàn)它們的功能。因為,真實世界環(huán)境中,Agent都是只有局部的不完全信息,在這種情況下要為某個特定的目標形成聯(lián)盟,我們必須提出并實現(xiàn)一些可行的高效的算法形成聯(lián)盟。基于上述的分析,它可以通過搜索agent圖中的聯(lián)盟伙伴來實現(xiàn),這不僅可以提高聯(lián)盟形成的質(zhì)量也可以提高聯(lián)盟形成的效率。
  據(jù)此,本文從四個方面進行闡

8、述上述的聯(lián)盟形成算法研究。第一,提出了一種新型的聯(lián)盟形成機制,這種聯(lián)盟機制從一種新的角度考慮了Agent之間的聯(lián)盟,同時對價值不斷變化的Agent之間如何形成聯(lián)盟也進行考慮。它的優(yōu)點不在于形成一個最優(yōu)聯(lián)盟,而是通過Agent與它的鄰居們的協(xié)商過程,從協(xié)商的Agent集中獲得一個有效的聯(lián)盟集,這些鄰居是從Agent圖中的鄰接點(如,直接相鄰的)獲取的。在有些情況下,Agent具有完成任務(wù)所需的所有功能,因而它可以完全靠自己來完成自己的目標

9、。然而,有些時候Agent的功能有限,不能單個的完成某個任務(wù),或者對某些任務(wù)它就無法像其他Agent那樣有效的完成。這種情況下,Agent可以通過交流將任務(wù)分配給它的鄰居。這種分配就可以通過Agent之間的協(xié)商來完成,通過協(xié)商分配任務(wù)給他的鄰居以致使任務(wù)的完成質(zhì)量更高。第二,本論文擴展了Agents之間的協(xié)作關(guān)系,除了Agent圖中直接相連的Agents的協(xié)作,還包括了間接相連的Agents之間的協(xié)作。該協(xié)作關(guān)系是通過搜索帶有權(quán)值函數(shù)的

10、Agent圖實現(xiàn)的。所謂的帶有權(quán)值函數(shù)的圖是用來標記聯(lián)盟的,這種聯(lián)盟是為了實現(xiàn)特定的目標而存在的。當Agent并沒有實現(xiàn)目標所需要的所有能力時,Agent需要和那些能夠?qū)崿F(xiàn)一些子任務(wù)的Agents形成聯(lián)盟,進而完成整個任務(wù)。否則,Agent將無法完成整個任務(wù)。第三,論文研究自治的Agent如何獲得批量的折扣。作為聯(lián)盟的成員,Agents可以以折扣價的成本實現(xiàn)部分或者全部的目標,從而使Agent獲得收益。這表明Agent聯(lián)盟是根據(jù)聯(lián)盟價值

11、的特定約束形成的。第四,是第三方面的擴張,討論了如何獲得穩(wěn)定的聯(lián)盟。本文假設(shè)agent是同構(gòu)的,共享相同的目標,它們可以形成穩(wěn)定的聯(lián)盟通過在核中心的收益回報分布。它的穩(wěn)定性指的是Agent滿足一定穩(wěn)定性條件的花銷分擔規(guī)則。綜上,本文重點在于找到實用的解決算法,在現(xiàn)實環(huán)境中,通過搜索Agent圖中的聯(lián)盟伙伴形成聯(lián)盟,以改善聯(lián)盟的形成過程和聯(lián)盟形成的質(zhì)量,這就是本文的主要的研究內(nèi)容。
  根據(jù)前段的闡述,本文首先在Agent和它的鄰居

12、之間提出了一種新穎實用的基于模糊邏輯的決策理論的分布式協(xié)商模型。運用這種模型可以自動克服復(fù)雜的談判過程,并且可以在Agent擁有鄰居的不完全信息的情況下,幫助Agent形成聯(lián)盟。這種談判模型是形成有效聯(lián)盟的基礎(chǔ)。該模型包括三個主要的內(nèi)容:(1)分布式協(xié)商模型形成聯(lián)盟;(2)基于模糊邏輯的評價模型和(3)一組最佳的有效聯(lián)盟集。
  其中,分布式協(xié)商模型采用基于交替提議協(xié)商協(xié)議,Agent和它們的直接鄰居之間可以協(xié)商多個議題(如,價格

13、和質(zhì)量等)。每一方在此過程中都是通過提供建議和反建議進行協(xié)商,最終都想達到對自己是最低價格的協(xié)議(比如,一個聯(lián)盟伙伴)。依賴于推理組件模型的模糊評價方式,該部分主要是專注于評估Agent所提的建議,從而決定接受還是拒絕對方的提議,并生成提議,/反提議。它利用一個集合的模糊隸屬函數(shù)(即低或高)來推理相關(guān)數(shù)據(jù)以及If-Then決策規(guī)則來支持靈活的協(xié)商過程。用模糊模型做出的決策是依賴于一系列的提議接收的程度,這使得決策更能貼近現(xiàn)實的真實世界,

14、并且擁有更好的靈活性?;谀:碚摰脑u估包含三個步驟(即模糊化步驟、推理步驟和去模糊化步驟),它能夠決定提議是否接收和接受的程度。在模糊化步驟中,定義輸入變量的隸屬函數(shù)應(yīng)用它們的實際價值來決定真實的程度。在推理步驟中,每個規(guī)則的真實值會被計算出來,然后應(yīng)用到每個規(guī)則的結(jié)論部分。在一個模糊子集中的結(jié)果將會被分配給每個規(guī)則的輸出變量中,在去模糊化的步驟中,模糊輸出結(jié)果將會被去模糊化變成一個清晰的數(shù)。然后根據(jù)每個協(xié)商Agent的行為制定相應(yīng)的

15、協(xié)商策略,決定每次提議是接受或拒絕還是重來。比如,Agent利用時間依賴策略與其他Agent協(xié)商,當一個協(xié)商發(fā)生是,Agent都會有一個時間期限。應(yīng)用時間限制策略的重點在于保證Agent的協(xié)商不能是無限期的,相反的,要讓協(xié)商在一個合理的時間范圍(或者是最大回合數(shù))內(nèi)完成。因此,當一些Agent經(jīng)過成功的協(xié)商完成某個目標后,最有效的聯(lián)盟集能夠在這些Agents中形成。
  利用基于模糊邏輯的方法的原因在于,需要處理關(guān)于對手的有限的信

16、息和談判對手的不同偏好,而模糊邏輯能夠很好的解決利用不完整的信息進行推理的問題。采用傳統(tǒng)的模型來評估一個多議題的協(xié)商提議,太過復(fù)雜。而基于模糊邏輯的方法在克服評估提議復(fù)雜性上有更突出的實際意義。因此,在本文所提出的這個基于模糊邏輯的模型中,我們應(yīng)用模糊邏輯建立議題之間的關(guān)系(比如價格,交貨期限等),并且允許Agent表達它們的偏好,評估系統(tǒng)也是充分考慮Agent的需求(即Agent的效用最大化)。協(xié)商的核心是用一個最低價格達成協(xié)議并幫助

17、形成一個有效的聯(lián)盟。我們要考慮的問題在于,協(xié)商模型的有效性、實用性,以及如何在Agent圖中,以一種分散的形式找到潛在的聯(lián)盟伙伴。
  本文提出的基于模糊邏輯的協(xié)商模型的性能評估通過與其他的傳統(tǒng)模型的對比來進行。文章中提到的傳統(tǒng)模型包括:1)戰(zhàn)術(shù)策略模型和2)得分函數(shù)模型。在戰(zhàn)術(shù)模型中,該模型是根據(jù)Agent自身的標準來評估和決策提議的接受與否,但這個并不能保證最佳的交易結(jié)果,因為它沒有考慮Agent在協(xié)商過程中的偏好,而且還允許

18、Agent快速讓步到它們的保留值以達成協(xié)議。雖然在得分函數(shù)模型中,Agent在計算提議評估的得分函數(shù)時考慮了每個議題的權(quán)重,但是它沒有考慮在協(xié)商過程中所有提出的議題和推理之間的關(guān)系。
  仿真實驗表明,本文提出的基于模糊邏輯的協(xié)商模型,可以在協(xié)商Agent中獲得更好的協(xié)商結(jié)果。實驗證明基于模糊理論協(xié)商模型的協(xié)商成功率比戰(zhàn)術(shù)模型的高了12%,比得分模型的成功率高了34%到48%。并且,它動態(tài)的提高了獲得有效聯(lián)盟集的機會,它的最高效率

19、比戰(zhàn)術(shù)模型提高了27%到70%。在有大量的Agent參入的情況下,與得分模型相比效率高出98%以上。在一個合理分配的時間范圍內(nèi),模糊理論的決策者協(xié)商模型獲得的最高效率比得分模型的最高效用值高了44%到86%,通過設(shè)置談判進程的最后期限,以避免無休止的協(xié)商,模糊理論的決策者協(xié)商模型節(jié)省的協(xié)商時間與戰(zhàn)術(shù)模型相比高了35%到65%。在社會福利方面,在大量有Agents參入的情況下,基于模糊理論的模型獲得社會福利比戰(zhàn)術(shù)協(xié)商模型高出至少70%在比

20、小數(shù)量Agents的情況下,比得分模型高出至少29%的。綜上,可以得出結(jié)論,本文提出的分布式基于模糊邏輯協(xié)商模型比其他模型在提高聯(lián)盟的形成質(zhì)量上更加的有實用和高效。
  某些時候聯(lián)盟伙伴是可以擴展的,也就是聯(lián)盟的伙伴可以從Agent的直接相鄰鄰居擴展到它的間接相鄰鄰居,這樣可以為Agent提供更多的機會來實現(xiàn)它們的任務(wù)或者求得子任務(wù)的解。參入考慮的Agents的數(shù)量越多,所組成的聯(lián)盟的可能性就越多,還有就是每個Agent都有自己的

21、功能,這樣整個聯(lián)盟的功能集就會相應(yīng)增強了。尤其是當在解決一個任務(wù)或者理解為一個實現(xiàn)某個功能時,如果它的直接鄰居的資源或能力有限,不通過擴展可能會導(dǎo)致任務(wù)的失敗,因為在這個集合中沒有Agent有能力解決問題。因此,構(gòu)建一個可行的聯(lián)盟的聯(lián)盟伙伴不僅可以從直接鄰居獲得也可以從有用的間接鄰居中獲得。我們知道可以從帶有加權(quán)值的Agent圖中可以得到這些鄰居,其中有些Agent扮演經(jīng)紀人的角色,推薦相關(guān)Agent,并且獲得了一些獎勵。如何構(gòu)建支持間

22、接鄰居的多Agent聯(lián)盟算法,將是本文呢闡述的第二個內(nèi)容。
  基于上述想法,本文提出的算法是找到次最優(yōu)可行解算法來實現(xiàn)某個特定的目標,這種次最優(yōu)可行解它是接近最優(yōu)最小成本的解,這時Agent不得不找到合適的聯(lián)盟伙伴來共同完成任務(wù),并形成可行的聯(lián)盟(FC)。這個可行聯(lián)盟指的是,為了實現(xiàn)某個特定的任務(wù)或目標,聯(lián)盟中所有的成員可以是間接關(guān)聯(lián)的。在加權(quán)Agent圖中進行搜索聯(lián)盟伙伴,形成可行聯(lián)盟獲得最好的或者次最優(yōu)的解取決與這個搜索過程

23、。求最優(yōu)最小成本解,搜索過程需要完成對整個圖的搜索——完全搜索。雖然,這個最優(yōu)解保證了全局最小值(即最小成本),但是這是一種不考慮時間和空間復(fù)雜度的窮盡搜索方法。市級存在這樣的環(huán)境因素(比如在有大量的agent和大量的任務(wù)的情況下)制約這種最優(yōu)聯(lián)盟形成。但是這些因素會促進所有參與聯(lián)盟的Agent,通過搜尋臨近最優(yōu)可行解來構(gòu)建協(xié)作聯(lián)盟。這種臨近最優(yōu)可行方案,通過使用一個貪婪算法,在每個搜索階段,試圖從下一個的搜索階段放棄不良的Agent,

24、從而保證達到在計算復(fù)雜度上局部的最小值(相對于它的鄰居成本來說是最小的)。
  文章中提到的最優(yōu)最小成本算法是基于廣度優(yōu)先搜索的(BFS),通過完全搜索層次化的Agent權(quán)重圖能夠找到全局最優(yōu)解。其算法的核心思想是:首先,是給出一個Agent的請求,訪問與請求動作相關(guān)的第一層Agents;然后一層層的檢查所有的于此相鄰的Agent,這些Agents都是遠離訪問Agent的;最后將這些訪問過的遠距離Agents分配到一個新的層。然后

25、繼續(xù)以相同的方式搜索,檢查那些與請求的Agent相鄰的Agents,對于那些先前分配到一個層的Agents不做動作。當Agent圖中的所有的Agents都被遍歷到了,這個過程將會終止,這時用最低成本實現(xiàn)任務(wù)的聯(lián)盟伙伴就已經(jīng)被找到了。
  本文提出的臨近最優(yōu)可行解算法同樣也是基于廣度優(yōu)先搜索方法的,通過擴展那些最接近目標的結(jié)點來實現(xiàn)局部最優(yōu)。在這種方法中,搜索的深度是根據(jù)最有可能的結(jié)點的深度來的決定的。首先,它有一個提出請求的Age

26、nt,作為訪問點在第一層訪問與請求動作相關(guān)的Agent,然后檢查那些遠離訪問Agent的邊緣有效Agents(即可以承擔請求動作的Agent)。從檢查過的Agents中選擇出最有前途的Agent(即可以提供最低成本的Agent),進而擴展它的分支作為下個搜索區(qū)域,忽略其他的分支Agents。一直重復(fù)這個過程,當沒有有效的Agent或者沒有遺留下需要檢查的Agent時,我們將停止搜索,這時,可以為請求動作提供最小成本的可行聯(lián)盟伙伴已經(jīng)被找

27、到。臨近最優(yōu)方案算法通過采用子圖的形式,在搜索的每一步中,及時在每個子圖中(即以最少的成本,提供動作)消除沒有用Agents(頂點)。可以得出,臨近最優(yōu)解算法在降低計算復(fù)雜度方面比最優(yōu)最低開銷的算法更加實用。通過最可行的Agent鄰居進行搜索,集中根據(jù)這個目標,可以通過臨近最優(yōu)解決方案實現(xiàn)局部最優(yōu)解。這種解相對于全局最優(yōu)解具有較低的平均處理時間和較小的區(qū)域復(fù)雜性,它更適用于現(xiàn)實世界中構(gòu)建協(xié)作聯(lián)盟。
  通過實驗的仿真和驗證,本文提

28、出的臨近最優(yōu)可行解算法獲得的平均效用值為最優(yōu)最小成本解算法得到平均效用值的91%至97%之間。根據(jù)性能比,臨近最優(yōu)的可行解,可以保證解的質(zhì)量不遜于最優(yōu)解的91%。雖然,最優(yōu)最小成本的解能夠得到全局最優(yōu)效用值,但臨近最優(yōu)可行算法解決方案在實現(xiàn)局部最優(yōu)上是非常有效和實用的。隨著Agents數(shù)目增加,臨近最優(yōu)可行算法具有較低的處理時間形成可行的聯(lián)盟,其時間復(fù)雜性是最優(yōu)最低成本算法的42%到57%,之間下降到32%。這些結(jié)果表明,本文的第二個研

29、究內(nèi)容已經(jīng)完成,并且證明了所提出的臨近最優(yōu)可行解方案的有效性。
  通過考慮與聯(lián)盟形成相關(guān)的搜索成本,我們提出了一個稱為次優(yōu)折扣聯(lián)盟形成(次優(yōu)DGF)的算法。該算法允許Agent以一個折扣價獲取它們部分或者全部的目標(例如,請求操作)。在這種情況下,聯(lián)盟成員通過Agents之間的合作取得折扣價可以增加Agents的效益。這種合作從直接的Agent鄰居擴展到間接Agent鄰居,其中可以通過在對Agent圖中的Agents分布式搜索來

30、發(fā)現(xiàn)潛在的合作機會??紤]到搜索成本,Agent的目標是找到潛在的機會的最佳集合,該集合在形成的聯(lián)盟的最大整體功用上以分散的方式用滿足聯(lián)盟請求。這正是本文第三個研究工作的主要內(nèi)容。
  具體來說,在次優(yōu)DGF算法中的每一個Agent將每個提供的操作都與一個價格計劃相關(guān)聯(lián),并通過搜索有價值的聯(lián)盟來提供基于請求的操作數(shù)目(即數(shù)量)的折扣價。Agent使用一個聯(lián)盟價值約束條件(CVC)在繼續(xù)搜索(可能會由于擴展聯(lián)盟而導(dǎo)致更好的機會)與接受

31、當前聯(lián)盟的形成(從當前有價值的聯(lián)盟之中獲得即時收益)之間進行權(quán)衡。它尋求一個合作機會通過分派來自Agent圖中的請求Agent子集來給所有的聯(lián)盟成員產(chǎn)生最大效用,該子集在可能的聯(lián)盟中擁有最大的聯(lián)盟價值。DGF的次優(yōu)解決方案算法應(yīng)該保證在與其他的解決方案相比時獲得更好的結(jié)果,包括:1)單獨的Agent搜索,其中的每個Agent都比在團體中更高的成本獲得其目標(即不享受團體折扣);2)優(yōu)化算法是在效用的基礎(chǔ)上計算最優(yōu)聯(lián)盟;3)通過考慮搜索成

32、本作為一個參數(shù)來影響一個最優(yōu)解的形成。
  第三個研究工作的主要成就之一是從團隊中搜索得到收益。這種搜索可以利用被單獨Agent拋棄的搜索機會。通過這樣的收益,少量Agent實現(xiàn)目標的失敗率能夠從24%減少到4%,如果有大量Agents參入,則失敗率幾乎為零。同時,次優(yōu)DGF算法也表現(xiàn)出其高效性,在實現(xiàn)一個目標的平均處理時間上它比單獨Agent搜索快了15%到34%。通過不同數(shù)量的agent形成的聯(lián)盟的實驗分析,提出的解決方案獲得

33、了在時間上比其他優(yōu)化模型快5%到24%。隨著Agents數(shù)量的增長,次優(yōu)DGF算法的平均效用以98%的比率接近最優(yōu)效用,并且在考慮搜索成本作為一個影響最優(yōu)聯(lián)盟的搜索的參數(shù)時高于平均聯(lián)盟價值6%。因此,DGF的次優(yōu)解決方案算法在與搜索成本相關(guān)的真實世界的環(huán)境中有它的優(yōu)勢。Agent更傾向于通過合作搜索折扣價朝向特定的目標形成聯(lián)盟而不是通過單獨搜索的方式。
  最后,我們進一步的擴展上述的研究內(nèi)容,即不僅要獲得一組聯(lián)盟的形成,還要根據(jù)

34、收益分配的核心值來獲得穩(wěn)定的聯(lián)盟形成(SCF)。一個聯(lián)盟的穩(wěn)定要求根據(jù)成本分攤原則在聯(lián)盟成員之間進行收益分配,要對拒絕參與并形成自己的聯(lián)盟的Agent團體不予分配收益。該核心值是用來描述這個屬性的最常用概念。當形成聯(lián)盟時,Agents由于實現(xiàn)一個目標而收到獎勵或者回報,并且要決定如何以一個穩(wěn)定的方式在成員Agents中劃分獎勵。我們考慮的情況是,Agents在一定意義上是同質(zhì)的,每個Agent都有相同的目標(以折扣價—最低價獲得操作動作

35、)。形成這樣的穩(wěn)定聯(lián)盟時與搜索成本有關(guān)的。這個搜索成本反映了在搜索活動中需要投入的資源,例如尋找其他Agents以及確定最有價值的穩(wěn)定聯(lián)盟。因此,一個基于聯(lián)盟價值的策略(CVS)以及成本分攤規(guī)則用于在對SCF進行搜索的過程中評估不同的形成聯(lián)盟的機會。為了這個目的,我們?yōu)镾CF提出了一個半最優(yōu)解決方案算法。該解決方案應(yīng)該保證通過尋找可行的聯(lián)盟伙伴集合來達成一個穩(wěn)定的聯(lián)盟(即核心值在聯(lián)盟內(nèi)的收益分配是穩(wěn)定的)。這些聯(lián)盟伙伴可以在Agent圖

36、中從直接鄰居(Agent的鄰居)擴展到間接鄰居(臨近Agent鄰居的Agent)來獲得批量折扣。聯(lián)盟形成與成本分攤規(guī)則應(yīng)該給在聯(lián)盟中的Agent提供激勵使其不是被強迫使其留在聯(lián)盟中,這是作為個人理性(IR)與預(yù)算平衡(BB)的合理結(jié)果。根據(jù)IR,聯(lián)盟成員的所有個人花費都不大于相應(yīng)底價。與此同時在BB中,聯(lián)盟掌管在聯(lián)盟中產(chǎn)生的花費。因此,agent的花費是其底價的非減函數(shù)。
  SCF的半最優(yōu)解決方案算法應(yīng)根據(jù)其核心保證一個高效的收

37、益分配結(jié)果相對于其他解決方案,包括:1)導(dǎo)致最佳收益的最優(yōu)算法;2)通過考慮搜索成本作為一個參數(shù)來影響穩(wěn)定最優(yōu)聯(lián)盟的搜索方法。另外,在核心中形成穩(wěn)定聯(lián)盟依賴于聯(lián)盟內(nèi)的成本分攤規(guī)則。根據(jù)提出的成本分攤規(guī)則,本文通過實驗證明SCF能夠獲得以95%到99.98%的比率接近最佳收益的平均收益。同時在考慮搜索成本作為一個參數(shù)影響最有價值穩(wěn)定聯(lián)盟的決定時,它比平均的聯(lián)盟價值高了9%。在考慮搜索成本時,本文提出的SCF算法依據(jù)Agents數(shù)量的不同也

38、相應(yīng)減少了15%至24%的平均處理時間,并且以比最優(yōu)時間快不少于75%的時間證明該方法形成穩(wěn)定聯(lián)盟的效率。這樣的解決方案的實驗結(jié)果表明,Agent更傾向于把它們的決策建立在價格優(yōu)勢、能夠達到的折扣數(shù)以及它們之中公平的收益分配上,由此,本文提出的半最優(yōu)解決方案通過最大化可行聯(lián)盟的價值來搜索最有價值穩(wěn)定聯(lián)盟,該方案在核心也應(yīng)該是穩(wěn)定的。
  綜上所述,本文為多Agent系統(tǒng)中聯(lián)盟形成提出了一系列新型的算法,它們一個共同的特點是有效且快

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論