版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、區(qū)別于傳統(tǒng)監(jiān)督學習中每個對象只隸屬于一個概念標記的學習框架,多標記學習中一個對象同時對應于多個概念標記的學習框架能夠更加有效地對現(xiàn)實世界中所存在的問題進行分析:例如,一幅圖像可能同時具有“沙漠”、“仙人掌”、“太陽”等標記;一篇文檔也可同時標記為“諾貝爾獎”、“屠呦呦”、“醫(yī)學”等。近十幾年以來,在眾多領域的成功應用使得多標記學習的研究一直炙手可熱,而標記相關性的挖掘與利用這一核心研究內容更是倍受關注。學者們已經(jīng)提出了一系列利用標記相關
2、性的多標記分類算法,然而高維數(shù)據(jù)中大量冗余特征、不相關特征的存在仍然導致了分類器性能的降低。因此,特征選擇在高維數(shù)據(jù)的多標記分類中發(fā)揮著至關重要的作用,但在現(xiàn)有的多標記特征選擇算法中,有效利用標記相關性的并不多見。為此,本文圍繞如何挖掘與利用標記相關性以提高多標記特征選擇并輔助多標記分類這一目標,提出了三種結合標記相關性的多標記特征選擇及分類算法。主要研究工作如下:
1.提出了一種結合標記相關性的多標記ReliefF特征選擇算
3、法(ML-ReliefF:Multi-label ReliefF Feature Selection Algorithm)。該算法以經(jīng)典的ReliefF特征選擇算法為基礎,在同類近鄰與異類近鄰的劃分中將樣本所隸屬的標記集之間的相關程度作為衡量標準來取代原先簡單的距離度量,有效結合了多個標記之間的相關性。與此同時,改進后的權值更新公式也更加適用于多標記學習框架。在多標記數(shù)據(jù)集上的實驗結果表明,ML-ReliefF算法能夠有效選擇出最優(yōu)特征
4、子集,顯著提高了多標記學習的分類效果。
2.提出了一種結合標記相關性的半監(jiān)督多標記特征選擇及分類算法(LCCSFS: Label Correlation joined Convex Semi-supervised Feature Selection forMulti-label Classificaition)。該算法針對樣本標記難以獲取這一問題,改進了半監(jiān)督學習框架下的多標記特征選擇及分類算法CSFS。LCCSFS算法通過構
5、建標記協(xié)方差矩陣自動學習了成對且對稱的標記相關性,并有效利用了未知標記數(shù)據(jù)的信息以幫助標記協(xié)方差的估計,從而將標記相關性的自動學習與利用,多標記特征選擇和多標記分類統(tǒng)一在同一個模型框架中。實驗結果表明,標記相關性的加入有效提高了半監(jiān)督多標記特征選擇及分類算法的效果。
3.提出了一種結合局部標記相關性的多標記特征選擇算法(Loc-MLFS:Multi-label Feature Selection by exploiting L
6、abel Correlation Locally)。該算法以標記相關性的局部性質(學習過程中并非所有樣本利用的標記相關性都相同,即標記相關性并非全局共享)為立足點,有效地將局部標記相關性利用到多標記特征選擇算法中。Loc-MLFS算法通過對標記空間進行屬性聚類將樣本劃分為組,再分別對每組數(shù)據(jù)進行多標記特征選擇,從而實現(xiàn)局部標記相關性的利用。與此同時,該算法可以推廣為一個統(tǒng)一架構。多個數(shù)據(jù)集上的實驗結果表明,局部相關性的利用顯著提高了多標
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 結合標記相關性的多標記分類算法研究.pdf
- 基于標記間相關性的多標記分類算法.pdf
- 基于樣例及標記相關性的多標記學習算法研究.pdf
- 基于相關性的癌癥特征選擇及分類算法研究.pdf
- 多標記學習分類算法研究.pdf
- 基于最大間隔的多標記特征選擇算法.pdf
- 基于樣例及屬性特征分析的多標記分類算法研究.pdf
- 基于數(shù)據(jù)及標記關聯(lián)的多標記學習算法研究.pdf
- 多標記維度約減和分類算法研究.pdf
- 基于標記依賴關系的多標記學習算法研究.pdf
- 胃癌相關性分子標記物的研究.pdf
- 文本分類的屬性選擇與多標記轉換方法研究.pdf
- 基于標簽相關性的多標簽分類算法研究.pdf
- 基于代價敏感的快速多標記文本分類算法研究.pdf
- 多標簽分類中特征選擇算法研究.pdf
- 基于相關性和冗余性分析的特征選擇算法研究.pdf
- 針對弱標記和穩(wěn)定算法的多標記集成學習.pdf
- 基于多特征標記的分水嶺分割算法的研究.pdf
- 多標簽分類中的特征選擇算法研究.pdf
- 基于特征選擇的多標簽分類算法研究.pdf
評論
0/150
提交評論