基于支持向量機(jī)的P2P流量識(shí)別關(guān)鍵技術(shù)研究.pdf_第1頁
已閱讀1頁,還剩110頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和成熟,大量的P2P應(yīng)用開始出現(xiàn),這無論是對(duì)網(wǎng)絡(luò)流量管理還是帶寬控制,都給各級(jí)網(wǎng)絡(luò)管理員以及網(wǎng)絡(luò)服務(wù)提供商帶來了很大困難,因此,如何對(duì)網(wǎng)絡(luò)中的P2P流量準(zhǔn)確識(shí)別成為當(dāng)下研究的熱點(diǎn)。本文通過對(duì)現(xiàn)階段P2P流量識(shí)別技術(shù)的研究,對(duì)現(xiàn)有的P2P流量識(shí)別文獻(xiàn)進(jìn)行歸類總結(jié),將其分為四大類:端口識(shí)別法、應(yīng)用層特征識(shí)別法、基于流量特征的識(shí)別法和基于機(jī)器學(xué)習(xí)識(shí)別法。通過對(duì)已有技術(shù)進(jìn)行論述,本文提出可以用基于支持向量機(jī)的分類算法對(duì)P2P

2、流量進(jìn)行識(shí)別。
  為了提高支持向量機(jī)的分類算法在識(shí)別P2P流量時(shí)的準(zhǔn)確率和效率,并使得該識(shí)別算法能夠適合在真實(shí)的網(wǎng)絡(luò)環(huán)境中應(yīng)用,本文在支持向量機(jī)的核函數(shù)的參數(shù)優(yōu)化方面、分類結(jié)構(gòu)、增量學(xué)習(xí)算法以及P2P流量識(shí)別模型構(gòu)建方面所取得的創(chuàng)新性成果有:
 ?。?)針對(duì)支持向量機(jī)中核函數(shù)中的參數(shù)尋優(yōu)問題,提出了一種基于區(qū)間估計(jì)的懲罰因子優(yōu)化法。由于懲罰因子是確定的數(shù)據(jù)子空間中調(diào)節(jié)學(xué)習(xí)機(jī)器置信區(qū)間范圍,本文提出首先使用區(qū)間估計(jì)法,初步確

3、定一個(gè)最優(yōu)參數(shù)區(qū)間,之后在此區(qū)間內(nèi)根據(jù)置信度和類二分法進(jìn)行小步距精搜,從而確定懲罰因子C的取值。這樣可以大幅度地減少了對(duì)懲罰因子C的尋優(yōu)時(shí)間,從而使得基于支持向量機(jī)的分類算法在識(shí)別網(wǎng)絡(luò)中的P2P流量時(shí),能夠更好地滿足實(shí)時(shí)性的要求。
  (2)針對(duì)高斯核函數(shù)中的兩個(gè)參數(shù)如何協(xié)同尋優(yōu)的問題,提出了一種基于黃金分割的參數(shù)協(xié)同尋優(yōu)法。該方法在第三章提出的懲罰函數(shù)C的基礎(chǔ)上,為了減少原始學(xué)習(xí)數(shù)據(jù)對(duì)結(jié)果的影響,提出快速高效的尋找最優(yōu)參數(shù)Υ的方

4、法。根據(jù)好區(qū)中的直線logγ logC log附近的就是最優(yōu)的參數(shù)組合(C,γ)的原則,提出用黃金分割法進(jìn)行迭代,通過將區(qū)間分段,分別求出各段的極大值,并選取多條平行的直線來增加好區(qū)中的覆蓋廣度,從而得到所需的最優(yōu)參數(shù)組合(C,γ)。優(yōu)化后的分類算法在對(duì)P2P流量識(shí)別時(shí),提高了準(zhǔn)確率和分類時(shí)間。
 ?。?)針對(duì)P2P流量中往往有異常數(shù)據(jù),當(dāng)這些異常的樣本出現(xiàn)在訓(xùn)練樣本中,會(huì)使得訓(xùn)練樣本集變大,這樣分類算法會(huì)因?yàn)檫M(jìn)行重新計(jì)算而使得分

5、類效率降低。因此,第五章結(jié)合基于支持向量機(jī)的增量算法的基本理論,提出了一種改進(jìn)的有向無環(huán)圖的分類結(jié)構(gòu),在建立多分類圖的基礎(chǔ)上以是否違背KKT條件作為判斷依據(jù),對(duì)分類器中的訓(xùn)練數(shù)據(jù)進(jìn)行迭代處理,使用優(yōu)化的增量學(xué)習(xí)方法解決了當(dāng)訓(xùn)練樣本增大時(shí)會(huì)造成的重新訓(xùn)練問題,使得訓(xùn)練學(xué)習(xí)過程更為有效。該方法對(duì)于P2P流量中應(yīng)用類型多,流量突變狀況多的特點(diǎn),具有較好的處理效果。
 ?。?)針對(duì)P2P流量的特點(diǎn),提出適合用于支持向量機(jī)進(jìn)行分類訓(xùn)練的流量

6、特征,并建立一個(gè)優(yōu)化的基于支持向量機(jī)的P2P流量識(shí)別模型??紤]到網(wǎng)絡(luò)流量是在線樣本數(shù)據(jù),其分布一般不穩(wěn)定,樣本數(shù)據(jù)分布會(huì)隨著時(shí)間變化而變化。因此,在本章中所建立的基于支持向量機(jī)的識(shí)別模型依據(jù)反饋的概念,對(duì)于分類結(jié)果與實(shí)際偏離不大的,予以正面反饋信息,對(duì)于分類偏離較大的,予以負(fù)面反饋,從而達(dá)到整個(gè)系統(tǒng)不僅有學(xué)習(xí)的能力,并在學(xué)習(xí)的過程中用增量學(xué)習(xí)方式及時(shí)調(diào)整和更新規(guī)則庫,以求達(dá)到最好的學(xué)習(xí)分類效果。
  本文通過對(duì)支持向量機(jī)的分類算法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論