基于數(shù)據(jù)挖掘的微博用戶興趣群體發(fā)現(xiàn)與分類——以新浪微博為例.pdf_第1頁
已閱讀1頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、微博即微型博客,是一種以關(guān)注分享為模式的新興社交媒體,其內(nèi)容少、發(fā)布快、形式多樣正好迎合了人們對信息實時的、準確的、多樣的分享交流需求,因此受到廣大用戶的歡迎與喜愛,而微博本身一躍成為當代互聯(lián)網(wǎng)領(lǐng)域新興、火熱的明星。人們熱衷在微博上獲取最新資訊,表達自己觀點,分享喜愛的事物。用戶在使用微博的時候,瀏覽什么樣的內(nèi)容,關(guān)注什么樣的好友是根據(jù)其興趣、偏好、習慣來確定的,所以了解用戶本身的興趣就能夠了解到用戶大概的關(guān)注范圍與愛好內(nèi)容,而“物以類

2、聚,人以群分”,對于擁有相同愛好的用戶群體的發(fā)現(xiàn)有助于為微博推廣、微博營銷、好友推薦等提供新的切入點與研究思路。但微博用戶數(shù)量龐大,每個用戶都是一個獨立的個體,確定什么樣的標準,使用什么樣的方法,借助什么樣的工具去發(fā)現(xiàn)用戶興趣群是本文所要解決的問題。
  數(shù)據(jù)挖掘方法能夠找到海量數(shù)據(jù)中有潛在價值的知識與模式,所用到的數(shù)學算法在經(jīng)過多年完善修正已經(jīng)日趨穩(wěn)定,在金融、電信等領(lǐng)域的應(yīng)用也有很多的成功案例,而在微博用戶興趣群發(fā)現(xiàn)上的應(yīng)用還

3、沒有成熟,本文嘗試使用數(shù)據(jù)分析的方法、借助數(shù)據(jù)挖掘工具去探索微博用戶的習慣、興趣與偏好,同時也希望拓展數(shù)據(jù)挖掘應(yīng)用于微博范圍上的研究,以提供新的思路與借鑒。
  本文以五章的內(nèi)容嘗試探索微博用戶興趣群發(fā)現(xiàn)。首先在緒論中闡述了研究微博用戶興趣的重要意義、國內(nèi)外有關(guān)數(shù)據(jù)挖掘與微博用戶興趣的研究現(xiàn)狀與本文的主要內(nèi)容、研究方法和論文創(chuàng)新點,然后對于數(shù)據(jù)挖掘概念、流程、方法、算法進行了梳理與探討,之后提出了基于數(shù)據(jù)挖掘的微博用戶興趣群體發(fā)現(xiàn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論