2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、伴隨著因特網上電子文檔信息的持續(xù)增長,人們迫切的需要一個工具去發(fā)現(xiàn)、過濾以及管理好這些資源,文本挖掘技術可以解決這個問題,它是以文本為對象進行的數(shù)據(jù)挖掘,可以應用于信息的檢索、過濾等領域,具有很高的研究價值。而文本分類作為文本挖掘的關鍵技術,近年來也引起了眾多學者的關注。
  文本分類即根據(jù)文本的內容,將未知類別的文本歸類到一個或者多個預先定義好的類別中。本文結合云模型理論在處理不確定性問題上的表現(xiàn),將云模型理論的相關方法應用到文

2、本分類中,提出了一種結合云模型的文本分類方法。為了驗證該方法的有效性,本文采用與傳統(tǒng)的文本分類方法進行對比實驗。結果表明,本文提出的算法在準確率等分類性能方面更優(yōu)。對本文的工作以及研究成果如下:
 ?、傺芯苛嗽颇P偷南嚓P理論
  對不確定性人工智能作了介紹,闡述了自然語言和知識的不確定性以及不確定性中模糊性和隨機性之間的關系,并引入了云模型的相關概念、數(shù)字特征等,探討了云模型的正向云發(fā)生器和逆向云發(fā)生器。
 ?、趯⒃颇?/p>

3、型理論應用到文本分類系統(tǒng)中
  自然語言中的概念是定性的,但其本身存在著不確定性,即對自然語言概念的理解具有不確定性,為了降低這種不確定性對分類效果的影響,本文提出一種結合云模型的文本分類方法,該方法分別定義文本和類別的云模型,通過計算測試文本和每個類別的云相似度,根據(jù)最大相似度原則確定測試文本所屬的類別。
  為了驗證本文理論的可行性,將基于云模型的文本分類方法與KNN分類方法作對比,通過多項實驗評估指標檢測,該方法相比傳

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論