2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩156頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、現(xiàn)實(shí)世界中大多問題的求解都可通過(guò)一系列復(fù)雜目標(biāo)的優(yōu)化過(guò)程來(lái)實(shí)現(xiàn)。目前,大規(guī)模和動(dòng)態(tài)交互網(wǎng)絡(luò)下的分布式優(yōu)化問題,由于其求解機(jī)制中不需要集中式的全局信息,而是通過(guò)局部信息下多個(gè)求解單元的分布式自主決策,實(shí)現(xiàn)對(duì)復(fù)雜優(yōu)化問題的有效求解,正吸引著越來(lái)越多研究者的關(guān)注。
  在動(dòng)態(tài)交互網(wǎng)絡(luò)中,為了實(shí)現(xiàn)分布式優(yōu)化問題的有效求解,需要對(duì)大量分布式求解單元之間交互行為的復(fù)雜性進(jìn)行分析,需要在局部不完全信息下建立分布式求解單元的決策結(jié)構(gòu)模型,同時(shí)還需

2、考慮時(shí)變交互網(wǎng)絡(luò)的動(dòng)態(tài)演化對(duì)分布式優(yōu)化算法設(shè)計(jì)上的影響。為此,本文提出了基于非合作博弈的分布式優(yōu)化問題研究框架。在不同的信息交互條件下,通過(guò)建立相應(yīng)的博弈研究框架,將優(yōu)化問題中存在交互行為的決策個(gè)體建模為博弈中的參與者,通過(guò)為參與者建立相應(yīng)的博弈模型保證決策的有效性,配合博弈中的策略學(xué)習(xí)算法,實(shí)現(xiàn)參與者決策行為的動(dòng)態(tài)演化,并在博弈的均衡處實(shí)現(xiàn)對(duì)分布式優(yōu)化問題的最優(yōu)求解。本文的主要工作包括:
  (1)分析和總結(jié)了分布式優(yōu)化理論的研

3、究現(xiàn)狀和存在的問題,建立了分布式優(yōu)化問題與基于非合作博弈研究框架之間的一般性聯(lián)系,提出了利用博弈參與者決策的動(dòng)態(tài)演化過(guò)程模擬優(yōu)化問題求解過(guò)程的模擬分析方法。
  (2)針對(duì)雙向時(shí)變信息交互下的分布式優(yōu)化問題,建立了基于狀態(tài)量序數(shù)勢(shì)博弈的研究框架,實(shí)現(xiàn)對(duì)分布式優(yōu)化問題的有效求解。在該框架下,通過(guò)將分布式優(yōu)化問題映射建模為基于狀態(tài)量序數(shù)勢(shì)博弈模型,提高了優(yōu)化問題模型設(shè)計(jì)上的自由度,保證了博弈模型對(duì)雙向時(shí)變信息交互網(wǎng)絡(luò)的適應(yīng)性,在局部信

4、息條件下通過(guò)為博弈參與者建立相應(yīng)的收益函數(shù),確保了博弈均衡與優(yōu)化問題全局最優(yōu)解的一致性。
  (3)針對(duì)基于狀態(tài)量序數(shù)勢(shì)博弈模型,提出了基于收益的基準(zhǔn)策略學(xué)習(xí)算法。在雙向時(shí)變信息交互下,通過(guò)利用參與者自身的決策信息和收益信息,實(shí)現(xiàn)其決策行為的動(dòng)態(tài)更新,并驗(yàn)證了更新過(guò)程收斂到博弈模型的均衡處。
  (4)針對(duì)單向時(shí)變信息交互下的分布式優(yōu)化問題,構(gòu)建了基于狀態(tài)量弱非循環(huán)博弈的研究框架。在該框架下,建立了基于狀態(tài)量弱非循環(huán)博弈模型

5、,實(shí)現(xiàn)了對(duì)決策個(gè)體之間單向時(shí)變交互行為的分析和刻畫,揭示了單向時(shí)變信息交互網(wǎng)絡(luò)對(duì)博弈最終結(jié)果的影響,實(shí)現(xiàn)了收益函數(shù)對(duì)局部、時(shí)變和單向信息的適應(yīng)性,并驗(yàn)證了在博弈均衡處個(gè)體決策行為最優(yōu)與全體決策行為最優(yōu)的一致性,實(shí)現(xiàn)了對(duì)分布式優(yōu)化問題的有效求解。
  (5)針對(duì)基于狀態(tài)量弱非循環(huán)博弈模型,設(shè)計(jì)了基于博弈參與者慣性的策略學(xué)習(xí)算法。在單向時(shí)變信息交互下,實(shí)現(xiàn)了博弈參與者決策行為的動(dòng)態(tài)更新,并驗(yàn)證了博弈演進(jìn)過(guò)程中的決策行為收斂到博弈的均衡

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論