支持向量機及其學習算法_第1頁
已閱讀1頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、支持向量機及其學習算法,主講:趙姝zhaoshuzs@163.com安徽大學計算機科學與技術學院,主要內容,支持向量機支持向量機的分類學習算法 用于函數(shù)擬合的支持向量機 支持向量機算法的研究與應用仿真實例,傳統(tǒng)統(tǒng)計學是一種漸進理論,研究的是樣本數(shù)目趨于無窮大時的極限特性?,F(xiàn)有的學習方法多基于傳統(tǒng)統(tǒng)計學理論,但在實際應用中,樣本往往是有限的,因此一些理論上很優(yōu)秀的學習方法在實際中的表現(xiàn)卻不盡人意,存在著一些難以克服的問題,比

2、如說如何確定網(wǎng)絡結構的問題、過學習問題、局部極小值問題等,從本質上來說就是因為理論上需要無窮樣本與實際中樣本有限的矛盾造成的。,與傳統(tǒng)統(tǒng)計學的方向不同,Vapnik等人提出了一個較完善的基于有限樣本的理論體系--統(tǒng)計學習理論。統(tǒng)計學習理論是又一種通用的前饋神經(jīng)網(wǎng)絡,同樣可用于解決模式分類和非線性映射問題。支持向量機方法是在統(tǒng)計學習理論基礎上發(fā)展起來的通用學習方法,它具有全局優(yōu)化、適應性強、理論完備、泛化性能好等優(yōu)點 。,支持向量機

3、(Support Vector Machine,SVM),90年代中期,在統(tǒng)計學習理論的基礎上發(fā)展出了一種通用的學習方法--支持向量機。它根據(jù)有限的樣本信息在模型的復雜性和學習能力之間尋求最佳折衷,以獲得最好的泛化能力。支持向量機在很多機器學習問題的應用中已初步表現(xiàn)出很多優(yōu)于已有方法的性能。,支持向量機的理論最初來自于對數(shù)據(jù)分類問題的處理。對于線性可分數(shù)據(jù)的二值分類,如果采用多層前向網(wǎng)絡來實現(xiàn),其機理可以簡單描述為:系統(tǒng)隨機的產(chǎn)生一個

4、超平面并移動它,直到訓練集合中屬于不同類別的點正好位于該超平面的不同側面,就完成了對網(wǎng)絡的設計要求。但是這種機理決定了不能保證最終所獲得的分割平面位于兩個類別的中心,這對于分類問題的容錯性是不利的。,保證最終所獲得的分割平面位于兩個類別的中心對于分類問題的實際應用是很重要的。支持向量機方法很巧妙地解決了這一問題。該方法的機理可以簡單描述為:尋找一個滿足分類要求的最優(yōu)分類超平面,使得該超平面在保證分類精度的同時,能夠使超平面兩側的空白區(qū)

5、域最大化;從理論上來說,支持向量機能夠實現(xiàn)對線性可分數(shù)據(jù)的最優(yōu)分類。為了進一步解決非線性問題,Vapnik等人通過引入核映射方法轉化為高維空間的線性可分問題來解決。,最優(yōu)分類超平面(Optimal Hyperplane ),對于兩類線性可分的情形,可以直接構造最優(yōu)超平面,使得樣本集中的所有樣本滿足如下條件:(1)能被某一超平面正確劃分;(2)距該超平面最近的異類向量與超平面之間的距離最大,即分類間隔(margin )最大。,設訓練

6、樣本輸入為 , , 對應的期望輸出為 如果訓練集中的所有向量均能被某超平面正確劃分,并且距離平面最近的異類向量之間的距離最大(即邊緣margin最大化),則該超平面為最優(yōu)超平面(Optimal Hyperplane ) 。,最優(yōu)分類面示意圖,支持向量Support Vector,其中距離超平面最近的異類向量

7、被稱為支持向量(Support Vector),一組支持向量可以唯一確定一個超平面。SVM是從線性可分情況下的最優(yōu)分類面發(fā)展而來,其超平面記為:為使分類面對所有樣本正確分類并且具備分類間隔,就要求它滿足如下約束:,,,可以計算出分類間隔為 ,因此構造最優(yōu)超平面的問題就轉化為在約束式下求: 為了解決這個約束最優(yōu)化問題,引入下式所示的Lagrange函數(shù): 其中 為Lagrange乘數(shù)。約

8、束最優(yōu)化問題的解由Lagrange函數(shù)的鞍點決定。,,利用Lagrange優(yōu)化方法可以將上述二次規(guī)劃問題轉化為其對偶問題,即在約束條件: 下對 求解下列函數(shù)的最大值: 如果 為最優(yōu)解,那么:,以上是在不等式約束下求二次函數(shù)極值問題,是一個二次規(guī)劃問題(Quadratic Programming,QP),存在唯一解。根據(jù)最優(yōu)性條件--Karush-Kühn-Tucker條件(KKT條件),這

9、個優(yōu)化問題的解必須滿足:對多數(shù)樣本 將為零,取值不為零的 所對應的樣本即為支持向量,它們通常只是全體樣本中很少的一部分。,,求解上述問題后得到的最優(yōu)分類函數(shù)是:在通過訓練得到最優(yōu)超平面后,對于給定的未知樣本x,只需計算f (x)即可判斷x所屬的分類。,,若訓練樣本集是線性不可分的,或事先不知道它是否線性可分,將允許存在一些誤分類的點,此時引入一個非負松弛變量 ,約束條件變?yōu)?目標函數(shù)改為在以上約束條件下求

10、: 即折衷考慮最小錯分樣本和最大分類間隔。其中,C>0 為懲罰因子 ,控制對錯分樣本的懲罰程度 。,,,線性不可分情況和線性可分情況的差別就在于可分模式中的約束條件中的 在不可分模式中換為了更嚴格的條件 。除了這一修正,線性不可分情況的約束最優(yōu)化問題中權值和閾值的最優(yōu)值的計算都和線性可分情況中的過程是相同的。,支持向量機 (Support Vector Machine, SVM),在現(xiàn)實世界中

11、,很多分類問題都是線性不可分的,即在原來的樣本空間中無法找到一個最優(yōu)的線性分類函數(shù),這就使得支持向量機的應用具有很大的局限性。但是可以設法通過非線性變換將原樣本空間的非線性問題轉化為另一個空間中的線性問題。SVM就是基于這一思想的。首先將輸入向量通過非線性映射變換到一個高維的特征向量空間,在該特征空間中構造最優(yōu)分類超平面。,由于在上面的二次規(guī)劃(QP)問題中,無論是目標函數(shù)還是分類函數(shù)都只涉及內積運算,如果采用核函數(shù)(Kernel Fu

12、nction)就可以避免在高維空間進行復雜運算,而通過原空間的函數(shù)來實現(xiàn)內積運算。因此,選擇合適的內積核函數(shù) 就可以實現(xiàn)某一非線性變換后的線性分類,而計算復雜度卻沒有增加多少 ,從而巧妙地解決了高維空間中計算帶來的“維數(shù)災難”問題。,此時,相應的決策函數(shù)化為:支持向量機求得的決策函數(shù)形式上類似于一個神經(jīng)網(wǎng)絡,其輸出是若干中間層節(jié)點的線性組合,而

13、每一個中間層節(jié)點對應于輸入樣本與一個支持向量的內積,因此也被稱作是支持向量網(wǎng)絡。,,支持向量機示意圖,選擇不同的核函數(shù) 可以生成不同的支持向量機,常有以下幾種:(1)線性核函數(shù): (2)多項式核函數(shù):(3)Gauss核函數(shù):(4)Sigmoid核函數(shù):,一個具體核函數(shù)的例子,假設數(shù)據(jù)是位于 中的向量,選擇: 然后尋找滿足下述條件的空間H:使映射 從 映射到H且滿足: 可以選

14、擇H=R3以及:,,,,用圖來表示該變換:,SVM用于二維樣本分類,,支持向量機與多層前向網(wǎng)絡的比較,與徑向基函數(shù)網(wǎng)絡和多層感知器相比,支持向量機避免了在前者的設計中經(jīng)常使用的啟發(fā)式結構,它不依賴于設計者的經(jīng)驗知識;而且支持向量機的理論基礎決定了它最終求得的是全局最優(yōu)值而不是局部極小值,也保證了它對于未知樣本的良好泛化能力而不會出現(xiàn)過學習現(xiàn)象。,支持向量機的分類學習算法,對于分類問題,用支持向量機方法進行求解的學習算法過程為:第一步

15、 給定一組輸入樣本 , 及其對應的期望輸出 ; 第二步 選擇合適的核函數(shù) 及相關參數(shù);第三步 在約束條件 和 下求解 得到最優(yōu)權值 ;,,,,,,,,第四步 計算: ;第五步 對于待分類向量x ,計算: 為+1或-1,決定x屬于哪一類。,,用于函數(shù)擬合的支持向量機,假定數(shù)據(jù)集

16、 。首先考慮用線性回歸函數(shù) 擬合數(shù)據(jù)集X的問題。所有訓練數(shù)據(jù)在精度 下無誤差地用線性函數(shù)擬合,即:考慮到允許擬合誤差存在的情況:,,,,,優(yōu)化目標函數(shù)為:對偶問題為:在約束條件 下求下式的最大值?;貧w函數(shù)為:,,,,,用不同的支持向量機對人工數(shù)據(jù)進行分類,(a )線性可分對下面二維待分類人工數(shù)據(jù)P進行分類:X = [2 7; 3 6; 2 2; 8 1

17、; 6 4; 4 8; 9 5; 9 9; 9 4; 6 9; 7 4];Y = [ +1; +1; +1; +1; +1; -1; -1; -1; -1; -1; -1];,(b )線性不可分對下面二維待分類人工數(shù)據(jù)P進行分類:X = [2 7; 3 6; 2 2; 8 1; 6 4; 4 8; 9 5; 9 9; 9 4; 6 9; 7 4;4 4];Y = [ +1; +1; +1; +1; +

18、1; -1; -1; -1; -1; -1; -1; -1];,(1)、實驗環(huán)境 Matlab 7.0(2)、界面設計,(3)、具體實現(xiàn)a) 對于線性可分的人工樣本數(shù)據(jù)P。其中共有11個待分類樣本。使用最簡單的支持向量機,即以線性核函數(shù)K(x,xi)=(x. xi)作為內積函數(shù)的支持向量機來訓練該數(shù)據(jù)集合。懲罰因子C取10。,,黑色線為數(shù)據(jù)集合的兩類分類線,可以看出它能將兩類準確無誤的分開,錯誤率為0。

19、藍線和綠線為兩類樣本的最大間隔邊界。5,11,6三點為支持向量。,樣本點,分類結果,對于線性不可分的人工樣本數(shù)據(jù)P。其中共有12個待分類樣本。1)用線性核函數(shù)SVM進行訓練。仍采用最簡單的支持向量機,即以線性核函數(shù)K(x,xi)=(x. xi)作為內積函數(shù)的支持向量機來訓練該數(shù)據(jù)集合。懲罰因子C取10。,,顯然黑色線為數(shù)據(jù)集合的兩類分類線,不能將兩類準確無誤的分開,點12是錯分的樣本點,而5和點11落在了分類間隔內。此時正確率為91.

20、67%。,樣本點,分類結果,2)利用較為復雜的RBF核函數(shù)支持向量機進行分類。RBF核函數(shù)中的核寬度這個參數(shù)是由用戶決定的。因此下面采用三個不同的RBF核寬度來對該函數(shù)集合進行分類。懲罰因子C取100。①選擇RBF核寬度為8,其結果如圖所示。,,從圖中可以看出,此時SVM以點12作為類別-1的一個聚類中心,在其周圍形成了一個類似“小島”的區(qū)域。并且,點2,3,4,5,6,11和12是支持向量,錯分樣本數(shù)為0。,②使用一個較小的值

21、1作為RBF核寬度,其結果如圖所示。,,黑線為分類邊界,藍線和綠線為兩類的最大間隔邊界。由于較小的核寬度允許了分類邊界的分割,因此圖中的分類邊界有很多條。由此造成了每個樣本點都是支持向量,所以錯分樣本數(shù)為0。,③使用一個較大的值36作為RBF核寬度,其結果如圖所示。,,黑線為分類邊界,藍線和綠線為兩類的最大間隔邊界。使用較大的核寬度時分類邊界比較簡化,但是出現(xiàn)了錯分樣本,即點5和12,此時的分類正確率為83.33%。,實驗小結:

22、 從實驗可以看出,針對同一問題,也即同一組數(shù)據(jù)來說,用不同核函數(shù)的支持向量機的分類結果是不同的。而且可以看到針對不同的問題,對同一種核函數(shù)支持向量機來說,選擇合適的參數(shù)也是很關鍵的,不同的參數(shù)的選擇就對應著不同的分類結果。,支持向量機算法的研究與應用,支持向量機算法改進 核函數(shù)的改進 錯誤懲罰參數(shù)的選擇 不敏感參數(shù)的選擇 支持向量機解決多類劃分問題 支持向量機的應用,支持向量機算法改進,傳統(tǒng)的利用標準二次型優(yōu)化技術解決對偶問題

23、的方法是訓練算法慢的主要原因。 (1) SVM方法需要計算和存儲核函數(shù)矩陣,當樣本點數(shù)目較大時,需要很大的內存,例如,當樣本點數(shù)目超過4000時,存儲核函數(shù)矩陣需要多達128MB內存; (2) SVM在二次型尋優(yōu)過程中要進行大量的矩陣運算,多數(shù)情況下,尋優(yōu)算法是占用算法時間的主要部分。,近年來人們針對方法本身的特點提出了許多算法來解決對偶尋優(yōu)問題。這些算法的一個共同的思想就是采用分而治之的原則將原始QP問題分解為規(guī)模較小的子問題

24、,通過循環(huán)解決一系列子問題來求得原問題的解?,F(xiàn)有的訓練算法分為三類: “塊算法”(chunking algorithm) “Osuna 分解算法” “SMO算法”,核函數(shù)的改進,核函數(shù)的形式及其參數(shù)決定了分類器的類型和復雜程度。在不同的問題領域,核函數(shù)應當具有不同的形式和參數(shù),應將領域知識引入進來,從數(shù)據(jù)依賴的角度選擇核函數(shù)。初步嘗試的方法有: Amari--利用黎曼幾何結構方法來修改核函數(shù) ;

25、 Barzilay--通過改進鄰近核來改進核函數(shù); Brailovsky--局部核函數(shù)方法; G. F. Smits --多個核函數(shù)組合起來使用;,錯誤懲罰參數(shù)的選擇,錯分樣本懲罰參數(shù)C實現(xiàn)在錯分樣本的比例和算法復雜度之間的折衷。C值的確定一般是用戶根據(jù)經(jīng)驗給定的,隨意性很大,也很難知道所取C值的好壞性。如何消除C值選取的隨意性,而采用某種方法自動地選擇一個最佳的C值,這個問題目前尚未解決。,不敏感參數(shù) 的選擇,SVM通過參

26、數(shù) 控制回歸估計的精度,但 取多少才能達到所期望的估計精度是不明確的,為此出現(xiàn)了許多新的SVM方法。 Schölkoph和Smola-- -SVM方法 Lin C-F --加權支持向量機,通過對每個樣本數(shù)據(jù)點采用不同的 ,來獲得更準確的回歸估計。,,支持向量機解決多類劃分問題,“多類支持向量機”(Multi-category Support Vector Machines,M-SVMs)。它們可以大致分為兩大類

27、:(1)通過某種方式構造一系列的兩類分類器并將它們組合在一起來實現(xiàn)多類分類;(2)直接在目標函數(shù)上進行改進,建立K分類支持向量機。,一對多方法( l - against - rest ,1-a-r),此算法是對于K類問題構造K個兩類分類器。第i個SVM用第i類中的訓練樣本作為正的訓練樣本,而將其它的樣本作為負的訓練樣本,即每個SVM分別將某一類的數(shù)據(jù)從其他類別中分離出來。測試時將未知樣本劃分到具有最大分類函數(shù)值的那類。缺點:泛化

28、能力較差,且訓練樣本數(shù)目大,訓練困難。此外,該方法還有可能存在測試樣本同時屬于多類或不屬于任何一類的情況。,一對一方法( l - against - 1,1-a-1),該算法在K類訓練樣本中構造所有可能的兩類分類器,每類僅僅在K類中的兩類訓練樣本之間訓練,結果共構造K(K-1)/2個分類器。組合這些兩類分類器很自然地用到了投票法,得票最多( Max Wins )的類為新點所屬的類。 缺點:推廣誤差無界,分類器的數(shù)目K(K-1)/2隨

29、類數(shù)K的增加急劇增加,導致在決策時速度很慢。此外,還可能存在一個樣本同時屬于多個類的情況。,決策導向非循環(huán)圖SVM方法 (Decision Directed Acyclic Graph,DDAG),在訓練階段,其與1-a-1方法相同,對于K類問題,DDAG含有K(K-1)/2個兩類分類器。然而在決策階段,使用從根節(jié)點開始的導向非循環(huán)圖(DAG),具有K(K-1)/2個內部節(jié)點以及K個葉子節(jié)點,每個內部節(jié)點都是一個兩類分類器,葉子

30、節(jié)點為最終的類值。缺點:根節(jié)點的選擇直接影響著分類的結果,不同的分類器作為根節(jié)點,其分類結果可能會不同,從而產(chǎn)生分類結果的不確定性。,基于二叉樹的多類SVM分類方法,對于K類的訓練樣本,訓練K-1個支持向量機。第1個支持向量機以第1類樣本為正的訓練樣本,將第2,3,…,K類訓練樣本作為負的訓練樣本訓練SVM1,第i個支持向量機以第i類樣本為正的訓練樣本,將第i + l,i + 2,…,K類訓練樣本作為負的訓練樣本訓練SVMi,直到第K

31、-1個支持向量機將以第K-1類樣本作為正樣本,以第K類樣本為負樣本訓練SVM(K-1)。,優(yōu)點:所需要訓練的兩類支持向量機的數(shù)量少 ;消除了決策時存在同時屬于多類或不屬于任何一類的情況 ;總共需要訓練的樣本和前兩種方法相比減少了許多。 缺點:若在某個節(jié)點上發(fā)生分類錯誤,將會把錯誤延續(xù)下去,該節(jié)點后續(xù)下一級節(jié)點上的分類就失去意義。,最小最大模塊化支持向量機 (Min-Max-Modular -SVM, M3-SVM ),該方法充分利用

32、分布式并行計算系統(tǒng),將一個K類問題分解成K(K-1)/2個二類問題,然后把一個二類問題分解成一系列指定規(guī)模的小的二類子問題。優(yōu)點:這些二類子問題的特點是在訓練過程中完全相互獨立,因此可以容易地在集群計算機和網(wǎng)格上實現(xiàn)超并行學習。在保證推廣能力的前提下,能夠明顯提高訓練速度,是一種解決大規(guī)模模式分類問題的有效方法。,支持向量機的應用,隨著對SVM研究的進展和深入,其應用也越來越廣泛,基于SVM思想的一些模型和方法被廣泛應用于各個領域,包

33、括模式識別,如人臉識別、字符識別、筆跡鑒別、文本分類、語音鑒別、圖像識別、圖像分類、圖像檢索等等;回歸估計,如非線性系統(tǒng)估計、預測預報、建模與控制等等;以及網(wǎng)絡入侵檢測、郵件分類、數(shù)據(jù)挖掘和知識發(fā)現(xiàn)、信號處理、金融預測、生物信息等新領域。,Libsvm的使用,安裝python,下載解壓libsvm,gnuplotSvmtoy.exe 圖像顯示,可修改參數(shù)Svmtrain.exe tdata 生成一個modelPython.grid

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論