版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、文本內(nèi)容的表示與復(fù)雜度的度量是文本機(jī)器理解與網(wǎng)絡(luò)服務(wù)的核心問題,也是一項(xiàng)涉及到語言學(xué)、計(jì)算機(jī)科學(xué)、心理學(xué)、邏輯學(xué)、認(rèn)知學(xué)等多門學(xué)科的難度較大而又極富挑戰(zhàn)性的研究課題。目前的文本知識(shí)表示模型普遍缺少認(rèn)知機(jī)理的支持,不符合人腦思維實(shí)際的認(rèn)知模式;同時(shí),缺少有效的與人類認(rèn)知過程中的主觀感受相結(jié)合的文本內(nèi)容復(fù)雜度的度量方法。為了解決上述問題,本論文借鑒人類概念學(xué)習(xí)的最新成果,并結(jié)合認(rèn)知心理學(xué)對人類文本理解的研究成果,建立了一種面向機(jī)器理解的文本
2、內(nèi)容的表示方法;并且基于該方法,提出了一種文本內(nèi)容復(fù)雜度的度量方法來為用戶提供更好的知識(shí)服務(wù)。本文具體內(nèi)容與貢獻(xiàn)如下: 1.為了研究基于概念代數(shù)表示的文本內(nèi)容的冪級(jí)數(shù)表示方法,本論文重點(diǎn)解決了三個(gè)基本問題,即:文本底層知識(shí)的快速機(jī)器自動(dòng)獲取方法;文本關(guān)聯(lián)規(guī)則中噪音和冗余知識(shí)的消除方法和文本內(nèi)容冪級(jí)數(shù)的表示與簡化。 1)本論文采用TF-IDF公式提取文本領(lǐng)域關(guān)鍵詞,然后選取文本中屬于領(lǐng)域 關(guān)鍵詞且出現(xiàn)頻率最高的前N
3、個(gè)單詞或詞組作為文本關(guān)鍵詞;結(jié)合經(jīng)典的Apriori算法和滑動(dòng)窗口的方法,獲取文本關(guān)聯(lián)規(guī)則。 2)以實(shí)驗(yàn)的方法,選取合適的滑動(dòng)窗口大小、滑動(dòng)距離、關(guān)聯(lián)規(guī)則的置信度與支持度,以提高關(guān)聯(lián)規(guī)則提取的質(zhì)量;結(jié)合現(xiàn)有的關(guān)聯(lián)規(guī)則去除冗余的方法,提出了文本關(guān)聯(lián)規(guī)則的冗余消除方法。 3)基于人類概念學(xué)習(xí)的代數(shù)表示,提出了文本內(nèi)容的冪級(jí)數(shù)表示方法;根據(jù)文本中關(guān)聯(lián)規(guī)則的分布和人類概念學(xué)習(xí)的線性假設(shè)定理,提出了機(jī)器文本理解的二階假設(shè)。
4、 2.為了研究基于文本內(nèi)容冪級(jí)數(shù)表示的文本復(fù)雜度度量方法, 1)基于人類概念學(xué)習(xí)的代數(shù)復(fù)雜度計(jì)算,提出了文本復(fù)雜度的度量方法。 2)基于人類文本理解過程中對背景知識(shí)的加入和認(rèn)知心理學(xué)中關(guān)于增加記憶的“交互作用表象”(interacting images)技術(shù),提出了文本復(fù)雜度度量的改進(jìn)算法。 基于冪級(jí)數(shù)表示的文本內(nèi)容復(fù)雜度度量在文本知識(shí)流的評價(jià)與度量,網(wǎng)絡(luò)資源的個(gè)性化推薦、在線問答系統(tǒng)、e-Business中的商
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 復(fù)雜電磁環(huán)境復(fù)雜度度量.pdf
- 基于可重入概率模型的RTOS系統(tǒng)調(diào)用復(fù)雜度度量方法研究.pdf
- 大學(xué)英語教材閱讀文本復(fù)雜度量化研究.pdf
- 代碼復(fù)雜度度量與質(zhì)量控制在日立項(xiàng)目中的應(yīng)用.pdf
- 面向大數(shù)據(jù)的相似度度量的加速研究.pdf
- 20790.地形復(fù)雜度量化研究
- 有關(guān)復(fù)雜度和表示維數(shù)的研究.pdf
- 句子難度度量研究.pdf
- 面向感知的視頻內(nèi)容表示研究.pdf
- 面向偽碼的算法能耗復(fù)雜度的研究.pdf
- 面向?qū)ο筌浖?fù)雜性度量研究.pdf
- 一種面向概率工作流的相似度度量方法.pdf
- 在線品牌忠誠度度量模型理論與方法研究——應(yīng)用機(jī)器學(xué)習(xí)方法.pdf
- 類內(nèi)聚度度量技術(shù)研究.pdf
- 仿真置信度度量方法研究.pdf
- 程序代碼相似度度量研究.pdf
- 面向?qū)ο筌浖?fù)雜性度量方法的研究.pdf
- 面向復(fù)雜背景的視頻文本定位研究.pdf
- 語義增強(qiáng)的關(guān)系相似度度量算法研究.pdf
- 周期序列線性復(fù)雜度與K-錯(cuò)線性復(fù)雜度研究.pdf
評論
0/150
提交評論