基于改進強化學習算法的神經模糊控制器的設計與實現.pdf_第1頁
已閱讀1頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、模糊控制和神經網絡技術是人工智能系統中兩種重要的理論,雖然它們從屬于兩個截然不同的學科領域,其基礎理論也相差較遠,但是它們都能模擬人的智能行為,從而解決不確定、非線性、復雜的自動化問題。神經網絡與模糊推理的融合可以解決各自在信息處理與控制中存在的不足,并通過互補構造出功能更加完善、更加智能化的系統。 神經模糊控制系統就是兩個學科相互融合的產物,神經網絡的并行處理能力和學習能力為智能控制領域注入了新的活力,同時也提出了新的問題。

2、 一方面,在引入了模糊量之后,節(jié)點需要進行精確數值計算和模糊計算的轉化,使得神經元在輸入量和輸出量之間的傳遞函數變得更加復雜,對神經模糊控制系統的硬件實現提出了極大的挑戰(zhàn)。針對這個問題,本文中提出了一種新型的單向線性響應(Unidirectional IAnear Response)神經元,通過ULR單元可將神經模糊網絡中各層神經元的不同的傳遞函數進行轉化,從而將神經模糊控制器中的神經元全部轉變?yōu)橥环N神經元,這樣使神經模糊控制器

3、的節(jié)點類型變得單一化,硬件實現變得相對簡單。 另一方面,在神經模糊控制中應該選用什么樣的學習算法呢?傳統反向傳播(Back—propagation)算法適用于各種多層神經網絡的學習,但是在神經模糊控制系統中,由于隸屬函數中往往存在一些尖點,導致算法中的微分運算無法進行,只能采用近似計算的方法;并且BP算法存在會使系統陷入局部極小值的問題。遺傳算法是一種很好的全局優(yōu)化算法,但是它對不同的問題需要使用相適應的變量編碼方案,尤其在參

4、數較多的情況下,對參數進行有效的編碼變得極其復雜。為此,本文提出了一種基于線性搜索LS(Linear Search)的強化學習算法,強化學習(Reinforcement Learning)是一種無監(jiān)督學習方法,而線性搜索算法是參數優(yōu)化中常用的一類算法,其中的多種方法都是采用類似于遺傳算法中跳躍式選點的方式,能夠在一定程度上避免陷入局部極小值,并且算法簡易可行,不需要遺傳算法中那樣復雜的編碼和規(guī)則。我們將這二者結合起來,得到一種復合的模糊

5、神經網絡學習算法。 本文將前述單向線性響應神經元(ULR)和基于線性搜索 (LineaLr Search)算法的強化學習算法引入到神經模糊控制系統中,設計了一個用于非線性系統的自適應多層神經模糊控制系統,給出了用ULR單元實現的該神經模糊控制系統的詳細結構,介紹了基于線性搜索的強化學習算法在本系統中的應用方法。并通過將該神經模糊控制系統應用到倒立振子平衡控制系統中,驗證了這種新的復合學習算法的可行性。我們將仿真實驗得到的數據,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論