基于超球覆蓋仿生模式識別的文本分類算法研究.pdf_第1頁
已閱讀1頁,還剩55頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、2006年Google首席執(zhí)行官Eric Schmidt首次提出了“云計算”的概念,現(xiàn)在它已成為國際IT業(yè)中的重要增長點。云計算時代的到來,使得各種類型的互聯(lián)網(wǎng)應(yīng)用層出不窮,各類數(shù)據(jù)呈爆炸式的增長,對于存儲在云數(shù)據(jù)庫中的海量文本數(shù)據(jù)而言,用戶如何快速有效地獲取、管理和使用這些文本數(shù)據(jù),已經(jīng)成為信息科學(xué)迫切需要解決的問題,其中使用文本分類是有效的文本數(shù)據(jù)處理方法。
   在文本分類系統(tǒng)中分類器的構(gòu)造是極其重要的,傳統(tǒng)的文本分類算法

2、或傳統(tǒng)的模式識別都是基于最佳劃分的,而仿生模式識別(Bionic Pattern Recognition,BPR)強(qiáng)調(diào)的是對事物的“認(rèn)識”而非“區(qū)分”,更符合人類認(rèn)識世界的本質(zhì)。中科院王守覺院士提出了的仿生模式識別的數(shù)學(xué)實現(xiàn)方法,即通過對特征空間中的樣本采用高維空間復(fù)雜幾何形體進(jìn)行覆蓋,實現(xiàn)模式識別。仿生模式識別在語音識別、人臉識別、地面實物識別方面都得到了很好的識別效果。實踐表明仿生模式識別方法有許多優(yōu)點,能夠有效地降低識別的錯誤率,

3、識別效率優(yōu)于傳統(tǒng)的模式識別方法。
   本文以此為出發(fā)點,首先介紹了文本分類的基本概念和關(guān)鍵技術(shù),然后研究了仿生模式識別的理論基礎(chǔ)及其神經(jīng)網(wǎng)絡(luò)算法實現(xiàn),又從幾何理論的角度提出了本實驗室的一種用超橢球作為高維空間同源類模板的仿生模式識別算法。接著又在此基礎(chǔ)上,針對文本特征空間的高維性和表示向量的稀疏性提出了一種改進(jìn)的基于超球覆蓋的仿生模式識別新算法。該算法能靈活地覆蓋特征空間中的樣本點,有效地克服了文本特征的稀疏性。實驗結(jié)果表明,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論