基于數據挖掘與機器學習的惡意代碼檢測技術研究.pdf_第1頁
已閱讀1頁,還剩80頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基于數據挖掘與機器學習的惡意代碼檢測技術具有自動化、智能化、對未知惡意代碼檢測率高的優(yōu)點,是當前惡意代碼檢測領域研究的熱點,針對當前基于數據挖掘與機器學習的惡意代碼檢測技術特征描述方法單一、分類器泛化能力弱的問題,提出了一種基于多維特征與選擇性集成學習的惡意代碼檢測技術,其主要的研究內容與創(chuàng)新點如下:
  首先,總結了惡意代碼的定義和分類以及各種分析與檢測技術的優(yōu)勢與不足。重點研究了基于數據挖掘與機器學習的檢測技術并對檢測的框架及

2、原理進行了詳細的分析與描述。
  其次,利用多維靜態(tài)特征對惡意代碼的信息特征進行描述。從惡意代碼的文件結構層提取19維的靜態(tài)結構特征,再從字節(jié)層、指令層、語義層分別提取不同n-gram長度的對應序列特征,相互結合組成初始特征集。為控制序列特征的規(guī)模,采用了三種行之有效的處理方法:①限制字節(jié)序列特征的搜索范圍;②只關注常用指令與關鍵API調用所構成的序列;③結合信息增益與粗糙集理論對序列特征進行降維與約簡。然后,對經過降維處理后的初

3、始特征集,利用不同的分類算法對其中的不同長度的序列進行評估,保留對分類貢獻大的特征,從而獲得最優(yōu)的特征子集。
  最后,利用已獲得的特征子集,按照特征類型分別訓練15個不同類型的基分類器,再依據精度值、AUC值和基于錯分樣本得到的差異度值選擇出每個特征對應的最優(yōu)基分類器子集,并采用相對多數投票的方式組合成集成分類器,然后對各特征對應的集成分類結果采用加權多數投票的方式進行決策融合并給出最終的類別判定信息。
  實驗結果表明了

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論