版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、隨著Internet在全球范圍內(nèi)的廣泛普及,互聯(lián)網(wǎng)已經(jīng)成為社會輿論的放大器和思想文化信息的集散地。輿情信息反映了民眾思想狀況,在Web2.0的強大傳播力之下,對輿情信息的研究顯得極其重要。面對每天更新的海量的信息,高效準確的挖掘出熱點新聞和輿論走勢已經(jīng)成為亟待解決的問題。一般情況下,事件的發(fā)生和發(fā)展都與人物有關,很多熱點事件都是圍繞著人在進行。在這種背景下,本文以分析熱點人物為切入點,找到并分析發(fā)生在他們身上的事件,進而把握網(wǎng)絡輿情。圍
2、繞著熱點人物及事件分析技術,本文的研究主要涉及以下幾個方面:
(1)提出了融合多種詞法分析工具識別人名的方法和基于 Lingo聚類策略的人名消歧方法。首先利用現(xiàn)有的分詞及標注工具中人名標注功能初步識別人名,并根據(jù)最長原則融合幾種人名識別方法的結果。同時,嘗試了幾種噪聲人名的去除方法,并基于 Lingo聚類算法進行人名消歧。實驗表明,融合策略在不降低人名識別正確率的前提下提高了人名識別的召回率,人名去噪及消歧方法能夠很好的滿足應
3、用需求。
(2)研究了有監(jiān)督的人物分類技術,提出一種基于 SVM的人物分類方法。首先從包含人物的文本中抽取能夠描述人物的一定長度的文本片段,然后利用信息增益提取出代表人物的有用屬性特征,最后用 SVM算法對人物進行分類。實驗表明,這種方式能有效的預測人物的所屬領域。
(3)研究了基于信息熵和情感詞典相結合的特征提取技術,并用其進行熱點人物事件的傾向性分析。信息熵計算特征的區(qū)分能力,而情感詞典解決覆蓋率問題。本文提取的
4、特征分為從訓練集中提取的特征和從情感詞典中提取的特征。訓練集中提取的特征是與語料相關的,或者說與領域相關的。而情感詞典具有通用性,其中含有訓練集提取的特征集中沒有的特征。實驗結果顯示,將兩種特征融合到一起能夠有效地提高事件傾向性分析的性能。同時,本文嘗試了用同義詞詞林將候選特征集合進行聚合,即將同義的兩個特征映射到一個特征上,這樣做既降低了空間向量的維數(shù),又不丟失語義信息,達到了兩者兼顧的效果,而且提高了語義相似度計算的精度。在特征聚類
5、過程中將特征的同義詞也加入,從而達到擴展重要特征的效果,提高了事件傾向性分析過程的特征識別能力。
(4)提出了一種面向輿情監(jiān)控的熱點人物排序模型。該模型綜合考慮人物的曝光率、熱度趨勢變化和所屬領域的權重這些因素來計算分數(shù),然后根據(jù)分數(shù)生成熱點人物排行榜。其中人物曝光率就是人物一天內(nèi)在新聞和評論中出現(xiàn)的次數(shù);熱度趨勢變化程度由KL距離的變形來衡量;人物所屬領域的權重根據(jù)該領域人物信息在輿情監(jiān)控中的重要程度來設置,而人物的所屬領域
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 網(wǎng)絡輿情熱點事件的熱源研究.pdf
- 輿情熱點事件的正確“打開姿勢”
- 輿情熱點事件的正確“打開姿勢”
- 面向網(wǎng)絡輿情分析的社會熱點話題技術研究.pdf
- 網(wǎng)絡輿情熱點發(fā)現(xiàn)與事件跟蹤技術研究.pdf
- 網(wǎng)絡輿情監(jiān)控的熱點發(fā)現(xiàn)算法研究.pdf
- 網(wǎng)絡輿情熱點事件的情感傾向分析與演變過程研究.pdf
- 面向監(jiān)控視頻應用的事件檢測技術.pdf
- 網(wǎng)絡輿情熱點事件中的話語激活研究.pdf
- 面向突發(fā)事件的微博輿情監(jiān)測與分析平臺.pdf
- 2014年內(nèi)蒙古地區(qū)熱點輿情事件分析.pdf
- 校園安全類熱點事件網(wǎng)絡輿情應對研究.pdf
- 網(wǎng)絡輿情中熱點挖掘及文本傾向性分析技術的研究.pdf
- 校園安全類熱點事件網(wǎng)絡輿情應對研究
- 面向話題型微博的熱點事件情感分析研究.pdf
- 面向網(wǎng)絡輿情的哈薩克文熱點詞提取方法研究.pdf
- 熱點網(wǎng)絡輿情生成及傳播模式分析研究.pdf
- 輿情熱點信息挖掘技術的研究與應用.pdf
- 面向智能視頻監(jiān)控的事件檢測建模及優(yōu)化.pdf
- 突發(fā)事件中網(wǎng)絡輿情監(jiān)控預警研究.pdf
評論
0/150
提交評論