2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩78頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、非負矩陣分解(NMF)是一種處理大規(guī)模高維數據的矩陣分解方法,它以非負約束和局部表示等獨特的優(yōu)勢吸引了眾多研究者的關注,并被廣泛地應用于數據挖掘、計算機視覺和模式識別等領域。此外,實際的分類問題中存在很多非均衡數據,包括密度不均衡、類別不均衡和常見的樣本數目不均衡等情況?;诖?,本文重點研究了基于數據結構信息的非負矩陣分解算法和面向非均衡數據分類的非負矩陣分解算法。
  首先,概述了非負矩陣分解及非均衡數據分類的基礎理論。給出了N

2、MF基本算法、數學求解方法,以及經典的衍生算法;并總結了數目不均衡數據的分類難點及常用的抽樣處理方法。
  其次,針對基于圖信息的非負矩陣分解僅用歐式距離來衡量樣本鄰域結構的局限性,將鄰域樣本相似度引入非負矩陣分解,提出一種基于鄰域樣本相似度的非負矩陣分解算法(NSS-NMF)。該方法通過引入鄰域協(xié)方差矩陣來計算鄰域樣本相似度,對于鄰域結構相似的樣本點,其分解所得的系數矩陣的約束項被賦予較高的權值,以適應于樣本密度不均衡的情況;進

3、一步,引入鄰域類標相似度,并考慮基向量的正交性,提出一種基于鄰域相似度的非負矩陣分解算法(NS-NMF)。該方法在考慮鄰域樣本相似度的基礎上,根據鄰域樣本的已知類標信息構建鄰域類標分布矩陣,這樣組合得到的鄰域相似度有效地兼顧到數據類別分布不均衡的情況。實驗結果表明,上述基于數據結構信息的非負矩陣分解算法可以獲得比傳統(tǒng)方法更好的聚類分類性能。
  最后,針對常見的非均衡數據問題(即樣本數目不均衡),提出一種新的加權非負矩陣分解算法(

4、WNMF)。該方法通過計算每類樣本數在總樣本數中的比例,求其倒數作為訓練樣本的權值引入非負矩陣分解,因此在保持了多數類分類準確性的同時,有效地提升了少數類樣本的分類性能。此外,結合NS-NMF算法考慮了鄰域結構信息的優(yōu)點,提出一種基于非負矩陣分解的混合重采樣算法(HS-NMF)。該方法先通過NS-NMF將數據集映射到更加可分的子空間,再通過經典的過采樣、欠采樣技術改善數據的不均衡程度。實驗結果表明,將非負矩陣分解應用于非均衡數據分類中,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論