課程名最優(yōu)化算法理論與應(yīng)用_第1頁(yè)
已閱讀1頁(yè),還剩14頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、課程名:最優(yōu)化算法理論與應(yīng)用,單位:清華大學(xué)自動(dòng)化系,電子信箱:swang@mail.tsinghua.edu.cn,教師:王書(shū)寧,電話(huà):62783371,講課時(shí)間:2008年10月15日起每周三下午2點(diǎn)開(kāi)始,講課地點(diǎn):自動(dòng)化所自動(dòng)化大廈十三層第二會(huì)議室,電子信箱: huangxl06@mails.tsinghua.edu.cn,助教:黃曉霖,優(yōu)化方法基本分類(lèi),本門(mén)課程有關(guān)事宜,優(yōu)化問(wèn)題基本分類(lèi),優(yōu)化問(wèn)題基本分類(lèi),例、和優(yōu)化聯(lián)系非常密切

2、的一類(lèi)問(wèn)題(回歸、辨識(shí)、估計(jì)、訓(xùn)練、學(xué)習(xí)、擬合、逼近…),已知某個(gè)標(biāo)量 和某個(gè)向量 之間若干一一對(duì)應(yīng)的樣本數(shù)據(jù),要確定一個(gè)函數(shù) ,使在包含所有樣本數(shù)據(jù)的某個(gè)集合 里能夠用 描述 和 之間的對(duì)應(yīng)關(guān)系,即使誤差 對(duì)任意的 都盡量小,基本方法:選

3、擇含有待定參數(shù)的函數(shù) ,通過(guò)極小 化某種樣本誤差確定待定參數(shù)得到所需函數(shù),常用 范數(shù)的樣本誤差,于是,最終要解決的是下述優(yōu)化問(wèn)題,這是連續(xù)變量無(wú)約束優(yōu)化問(wèn)題,對(duì)于采用 范數(shù)形成的優(yōu)化問(wèn)題,為克服目標(biāo)函數(shù)不可導(dǎo)的困難,可以等價(jià)轉(zhuǎn)換成下面的連續(xù)變量約束優(yōu)化問(wèn)題,特別是,當(dāng) 是 的線(xiàn)性函數(shù)時(shí),即,上面的優(yōu)化問(wèn)題

4、是線(xiàn)性規(guī)劃問(wèn)題,一般選擇足夠多的基函數(shù) 使優(yōu)化問(wèn)題,的樣本誤差任意小,這樣得到的模型在樣本集以外通常會(huì)產(chǎn)生很大的預(yù)報(bào)誤差,這就是所謂過(guò)度擬合或過(guò)度訓(xùn)練問(wèn)題。解決該問(wèn)題的根本途經(jīng)是同時(shí)極小化基函數(shù)的個(gè)數(shù),理論上要解決連續(xù)和離散變量混合的優(yōu)化問(wèn)題,其中 是設(shè)定的正的權(quán)值,前面的例子包含了優(yōu)化問(wèn)題最基本的類(lèi)型,線(xiàn)性 與 非線(xiàn)性,無(wú)約束 與 有約束,連續(xù)變量 與 離散變量,后者相對(duì)于前

5、者在難度上均有質(zhì)的改變,具有不確定性和動(dòng)態(tài)特性的問(wèn)題,轉(zhuǎn)換成上述問(wèn)題,優(yōu)化方法基本分類(lèi),,,例,基本方法:從 之間的任一點(diǎn)出發(fā),朝著能夠改進(jìn)目標(biāo)函數(shù)的方向搜索前進(jìn),直至目標(biāo)函數(shù)不能改進(jìn),肯定能夠收斂到一個(gè)局部最優(yōu)解,不能保證全局最優(yōu),,,,,跳出局部陷阱的唯一途經(jīng)是在搜索過(guò)程中允許前進(jìn)到目標(biāo)函數(shù)值變差的點(diǎn),如在 之間容許目標(biāo)函數(shù)下降才有可能找到全局最優(yōu)解,由此產(chǎn)生新問(wèn)題,無(wú)法保證算法收斂,為了使算法收斂

6、,只能引入不確定性,讓算法在任何一點(diǎn)以一定的概率前進(jìn)到鄰近的某點(diǎn),移動(dòng)概率和相應(yīng)點(diǎn)的目標(biāo)函數(shù)值正相關(guān),所以,由此產(chǎn)生的算法是結(jié)果不確定的算法,,,前面的例子包含了優(yōu)化方法最基本的類(lèi)型,確定型搜索 與 不確定型搜索,前者是經(jīng)典的優(yōu)化教材介紹的主要內(nèi)容,后者包括模擬退火、禁忌搜索、遺傳算法、免疫算法、螞蟻算法等方法,一般統(tǒng)稱(chēng)為智能算法,本課程主要討論基于確定性搜索的優(yōu)化方法,本門(mén)課程有關(guān)事宜,教材:運(yùn)籌學(xué)(第二

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論