網(wǎng)絡評論觀點的傾向性分析.pdf_第1頁
已閱讀1頁,還剩66頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、網(wǎng)絡已被公認為是繼報紙、廣播、電視之后的“第四媒體”,成為反映人們情感的主要載體之一。用戶在網(wǎng)絡上發(fā)表自己對于某種產(chǎn)品的評價,對于廠家和潛在購買者來說,都是很有研究價值的。廠家希望從中了解到自己的產(chǎn)品性能評價,也掌握競爭對手的產(chǎn)品性能;潛在購買者希望從別人的評價中獲得參考和建議。但是Web上的信息是海量的,僅依靠人工進行網(wǎng)頁瀏覽、觀點分析將是一項費時而又低效的工作。因此,觀點抽取技術(shù)具有非常大的研究價值。 語義極性分析和觀點抽取

2、是指利用計算機技術(shù)自動分析句子或文檔,從中提取出用戶感興趣的主題或特征,并分析其語義極性傾向(褒義、貶義或中性)和強度。傳統(tǒng)的信息抽取和信息檢索研究的重點是針對客觀表達的事實信息,不適用于網(wǎng)絡評論觀點抽取。觀點是主觀性的,這需要能夠自動抽取主觀性觀點的技術(shù),從用戶評論中自動抽取出產(chǎn)品特征的極性傾向。 目前,許多研究機構(gòu)已經(jīng)運用自然語言處理技術(shù)對網(wǎng)絡評論進行觀點抽取,取得了一定的成就。本文嘗試利用自然語言處理方法,對中文句子的語義

3、極性傾向進行進一步研究,提出了一些看法,并對一些算法作了改進。 本文根據(jù)一些詞語的上下文極性的特征,分析名詞的特點,通過給這些名詞賦予極性的方法,解決動態(tài)極性問題;在觀點抽取方面,為了較好的處理主題詞和極性成分的匹配問題,判斷句子中每個主題的極性傾向,本文吸取語義塊和依存關(guān)系的思想,提出了極性收縮傳遞算法,最終確立主題觀點。并對感嘆句和問句進行研究,取得了一定的成果。最后,本文通過測試,將自動抽取的觀點與手工標注結(jié)果進行比較,得

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論