面向機(jī)器理解的文本內(nèi)容表示與復(fù)雜度度量研究.pdf_第1頁
已閱讀1頁,還剩92頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、文本內(nèi)容的表示與復(fù)雜度的度量是文本機(jī)器理解與網(wǎng)絡(luò)服務(wù)的核心問題,也是一項(xiàng)涉及到語言學(xué)、計(jì)算機(jī)科學(xué)、心理學(xué)、邏輯學(xué)、認(rèn)知學(xué)等多門學(xué)科的難度較大而又極富挑戰(zhàn)性的研究課題。目前的文本知識(shí)表示模型普遍缺少認(rèn)知機(jī)理的支持,不符合人腦思維實(shí)際的認(rèn)知模式;同時(shí),缺少有效的與人類認(rèn)知過程中的主觀感受相結(jié)合的文本內(nèi)容復(fù)雜度的度量方法。為了解決上述問題,本論文借鑒人類概念學(xué)習(xí)的最新成果,并結(jié)合認(rèn)知心理學(xué)對人類文本理解的研究成果,建立了一種面向機(jī)器理解的文本

2、內(nèi)容的表示方法;并且基于該方法,提出了一種文本內(nèi)容復(fù)雜度的度量方法來為用戶提供更好的知識(shí)服務(wù)。本文具體內(nèi)容與貢獻(xiàn)如下: 1.為了研究基于概念代數(shù)表示的文本內(nèi)容的冪級(jí)數(shù)表示方法,本論文重點(diǎn)解決了三個(gè)基本問題,即:文本底層知識(shí)的快速機(jī)器自動(dòng)獲取方法;文本關(guān)聯(lián)規(guī)則中噪音和冗余知識(shí)的消除方法和文本內(nèi)容冪級(jí)數(shù)的表示與簡化。 1)本論文采用TF-IDF公式提取文本領(lǐng)域關(guān)鍵詞,然后選取文本中屬于領(lǐng)域 關(guān)鍵詞且出現(xiàn)頻率最高的前N

3、個(gè)單詞或詞組作為文本關(guān)鍵詞;結(jié)合經(jīng)典的Apriori算法和滑動(dòng)窗口的方法,獲取文本關(guān)聯(lián)規(guī)則。 2)以實(shí)驗(yàn)的方法,選取合適的滑動(dòng)窗口大小、滑動(dòng)距離、關(guān)聯(lián)規(guī)則的置信度與支持度,以提高關(guān)聯(lián)規(guī)則提取的質(zhì)量;結(jié)合現(xiàn)有的關(guān)聯(lián)規(guī)則去除冗余的方法,提出了文本關(guān)聯(lián)規(guī)則的冗余消除方法。 3)基于人類概念學(xué)習(xí)的代數(shù)表示,提出了文本內(nèi)容的冪級(jí)數(shù)表示方法;根據(jù)文本中關(guān)聯(lián)規(guī)則的分布和人類概念學(xué)習(xí)的線性假設(shè)定理,提出了機(jī)器文本理解的二階假設(shè)。

4、 2.為了研究基于文本內(nèi)容冪級(jí)數(shù)表示的文本復(fù)雜度度量方法, 1)基于人類概念學(xué)習(xí)的代數(shù)復(fù)雜度計(jì)算,提出了文本復(fù)雜度的度量方法。 2)基于人類文本理解過程中對背景知識(shí)的加入和認(rèn)知心理學(xué)中關(guān)于增加記憶的“交互作用表象”(interacting images)技術(shù),提出了文本復(fù)雜度度量的改進(jìn)算法。 基于冪級(jí)數(shù)表示的文本內(nèi)容復(fù)雜度度量在文本知識(shí)流的評價(jià)與度量,網(wǎng)絡(luò)資源的個(gè)性化推薦、在線問答系統(tǒng)、e-Business中的商

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論