基于圖模型的分布式協(xié)同學習.pdf

上傳人：奔*** IP屬地：河北更新時間：2024-03-05 格式：pdf 頁數(shù)：60 大小：2.41MB 人氣指數(shù)：12 舉報 版權申訴

已閱讀1頁，還剩59頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

1、多智能體系統(tǒng)（Multi-Agent System，MAS）是分布式人工智能（Distributed Artificial Intelligence，DAI）的一個重要分支。多智能體系統(tǒng)是多個智能體組成的集合，它的目標是將大而復雜的系統(tǒng)建設成小的、彼此互相通信和協(xié)調的，易于管理的系統(tǒng)，從而實現(xiàn)個體之間的沖突消解與協(xié)同合作。分布式控制方法具有個體局部交互、成本低、魯棒性強的優(yōu)點，因而多智能體系統(tǒng)通常采用分布式控制的方式來實現(xiàn)系統(tǒng)協(xié)同功能。

2、另一方面，圖模型可以簡潔有效地表示多智能體系統(tǒng)中復雜的依賴關系。將每個節(jié)點代表多智能體系統(tǒng)中的個體，圖模型可以有效地表征局部狀態(tài)觀察、行為選擇與獎賞接收（系統(tǒng)的目標是最大化所有節(jié)點的獎賞之和），因此基于圖模型的分布式控制對于多智能體系統(tǒng)研究具有重要的意義。
　　基于試錯的學習行為是智能體與環(huán)境進行交互的主要方式之一，本文主要研究基于圖模型的分布式協(xié)同學習，將圖模型的關系表征能力與個體的局部學習交互有效的結合起來，從而以最小的計算代

3、價實現(xiàn)最優(yōu)或者近似最優(yōu)的系統(tǒng)功能。本文主要包括以下兩個研究內容：
　　本文首先研究了基于分布式值函數(shù)（Distributed Value Function，DVF）的多智能體協(xié)同學習方法。該方法允許每個智能體將自己的值函數(shù)（所有節(jié)點未來獎賞的權重和的預估）發(fā)送給其鄰居節(jié)點，這樣不僅考慮了直接鄰居節(jié)點對智能體行為選擇的影響，同時還考慮了其他節(jié)點對智能體的間接影響；由于每個節(jié)點在系統(tǒng)中的位置重要性不同以及在學習過程中表現(xiàn)的好壞都會對其

4、鄰居節(jié)點產(chǎn)生不同的影響。本文提出了自適應權重函數(shù)的DVF，并將此方法與現(xiàn)有的分布式強化學習方法在電力系統(tǒng)電壓分配問題中進行比較，驗證了該方法的有效性。
　　本文的第二個工作是研究了基于回報傳播的分布式協(xié)同學習方法。該方法將稀疏協(xié)同學習方法與協(xié)同圖中的消息傳遞算法相結合，利用相應的協(xié)同圖將全局值函數(shù)分解為局部值函數(shù)的線性結合，并通過變量消除算法或者Max-Plus算法來計算最優(yōu)聯(lián)合行為，從而快速地找到使系統(tǒng)整體獎賞最高的最優(yōu)策略或近

眾賞文庫> 全部分類> 畢業(yè)設計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

基于圖模型的分布式協(xié)同學習.pdf

文檔簡介

溫馨提示

最新文檔

評論

基于圖模型的分布式協(xié)同學習.pdf

文檔簡介

溫馨提示

最新文檔

評論

免費下載