基于樣例及標(biāo)記相關(guān)性的多標(biāo)記學(xué)習(xí)算法研究.pdf_第1頁
已閱讀1頁,還剩44頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、多標(biāo)記學(xué)習(xí)作為一種解決多義性對(duì)象學(xué)習(xí)建模的框架,其研究成果已經(jīng)廣泛應(yīng)用到諸如文本分類、網(wǎng)頁分類、場(chǎng)景分類等分類問題中,已然成為了機(jī)器學(xué)習(xí)研究領(lǐng)域的一個(gè)熱點(diǎn)問題。針對(duì)多標(biāo)記分類問題,目前已經(jīng)涌現(xiàn)出了大量的學(xué)習(xí)算法,不管是基于k近鄰的方法,還是應(yīng)用支持向量機(jī)的方法,以及運(yùn)用決策樹的方法等,都可以將其歸為兩大類:算法適應(yīng)法(algorithm adaptation methods,簡(jiǎn)稱AAM)和問題轉(zhuǎn)換法(problem transforma

2、tion methods,簡(jiǎn)稱PTM)。顧名思義,算法擴(kuò)展法即在算法層面上解決多標(biāo)記分類問題。同樣地,問題轉(zhuǎn)換法則是從問題本身出發(fā),把復(fù)雜的多標(biāo)記問題轉(zhuǎn)化成“二類分類”問題,繼而運(yùn)用簡(jiǎn)單易實(shí)現(xiàn)的單標(biāo)記學(xué)習(xí)算法去處理多標(biāo)記分類問題。
  本文的緒論中簡(jiǎn)述了多標(biāo)記學(xué)習(xí)的研究背景及意義,然后對(duì)多標(biāo)記學(xué)習(xí)在國(guó)內(nèi)外的研究現(xiàn)狀進(jìn)行了詳細(xì)介紹;簡(jiǎn)要介紹了多標(biāo)記學(xué)習(xí)的理論基礎(chǔ),包括多標(biāo)記學(xué)習(xí)問題定義,多標(biāo)記學(xué)習(xí)策略簡(jiǎn)介,以及多標(biāo)記學(xué)習(xí)中常用的評(píng)估

3、標(biāo)準(zhǔn)、多標(biāo)記學(xué)習(xí)中的典型算法、數(shù)據(jù)集等理論知識(shí)。多標(biāo)記分類問題的研究關(guān)鍵是如何有效利用訓(xùn)練好的分類器,將待分類樣例劃分到預(yù)先定義好的類別中,本文重點(diǎn)考察了多標(biāo)記分類過程中標(biāo)記相關(guān)性和屬性特征選擇這兩個(gè)方面,主要研究成果有:
 ?。?)基于多標(biāo)記學(xué)習(xí)中存在的標(biāo)記相關(guān)性問題,提出一種基于鄰域粗糙集的多標(biāo)記分類改進(jìn)算法。研究者在多標(biāo)記學(xué)習(xí)中引入鄰域粗糙集模型,構(gòu)造了一個(gè)新的學(xué)習(xí)框架MLRS,運(yùn)用鄰域粗糙集找出給定示例的所有可能相關(guān)的標(biāo)簽

4、和排除所有不相關(guān)的標(biāo)簽,根據(jù)鄰域和不同標(biāo)記間的關(guān)系為樣例預(yù)測(cè)正確標(biāo)記范圍。但是,要是一個(gè)類在邊界區(qū)域中因?yàn)檎^少,導(dǎo)致該類在通過計(jì)算得到的近鄰中占據(jù)很小的比例,此時(shí)如果只看數(shù)量很容易造成錯(cuò)分。針對(duì)這個(gè)問題,本文對(duì)MLRS算法做了相應(yīng)的改進(jìn),在邊界區(qū)域,除了考慮在訓(xùn)練樣例和各個(gè)不同類別的近鄰樣例之間計(jì)算歐式距離這個(gè)因素,還要考慮個(gè)數(shù)的問題,這兩者之間可以建立起一個(gè)映射關(guān)系,然后用該映射關(guān)系預(yù)測(cè)測(cè)試樣例類別標(biāo)記,實(shí)驗(yàn)表明,本文提出的方法能

5、較好地提高算法的分類性能。
 ?。?)基于多標(biāo)記學(xué)習(xí)中存在的屬性特征選擇的問題,提出一種基于類屬屬性的多標(biāo)記局部加權(quán)分類算法。一個(gè)對(duì)象具有多種語義信息,是因?yàn)樵搶?duì)象同時(shí)含有描述這些語義的屬性。因此,對(duì)刻畫示例與標(biāo)記間關(guān)系的屬性進(jìn)行有效的轉(zhuǎn)換,將使多標(biāo)記學(xué)習(xí)過程更加可靠。LIFT算法是基于類屬屬性的多標(biāo)記學(xué)習(xí)方法,本文針對(duì)其不足提出了一種新的基于類屬屬性的多標(biāo)記局部加權(quán)分類算法 LIFT-LOCW,該算法通過加權(quán)的方法提高了原算法的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論