版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、計(jì)算機(jī)研究與發(fā)展DOI:10.7544issn10001239.2016.JournalofComputerResearchDevelopment卷(期):起止頁(yè)年收稿日期收稿日期:20160316;修回日期修回日期:20160426六號(hào)基金項(xiàng)目基金項(xiàng)目:國(guó)家自然科學(xué)基金項(xiàng)目(60903098);吉林省工業(yè)技術(shù)研究和開(kāi)發(fā)項(xiàng)目(JF2012c0162);吉林大學(xué)研究生創(chuàng)新基金項(xiàng)目(2015040)ThiswkissupptedbytheN
2、ationalNaturalScienceFoundationofChina(60903098)theProjectofJilinProvincialIndustrialTechnologyResearchDevelopment(JF2012c0162)theGraduateInnovationFundofJilinUniversity(2015040).六號(hào),核實(shí)準(zhǔn)確完整的基金名稱和英文翻譯通信作者通信作者:彭濤(tpeng@jlu.
3、)(注:此模板非完整論文,已做刪減。只看格式,勿參考內(nèi)容)(注:此模板非完整論文,已做刪減。只看格式,勿參考內(nèi)容)異質(zhì)網(wǎng)中基于張量表示的動(dòng)態(tài)離群點(diǎn)檢測(cè)方法異質(zhì)網(wǎng)中基于張量表示的動(dòng)態(tài)離群點(diǎn)檢測(cè)方法題目三號(hào)劉露1左萬(wàn)利12彭濤12作者四號(hào)宋體,作者和單位的對(duì)應(yīng)關(guān)系標(biāo)注在作者姓名的右上角1(吉林大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院長(zhǎng)春130012)單位小五號(hào)2(符號(hào)計(jì)算與知識(shí)工程教育部重點(diǎn)實(shí)驗(yàn)室(吉林大學(xué))長(zhǎng)春130012)1(.)小五號(hào)TensRepr
4、esentationBasedDynamicOutlierDetectionMethodinHeterogeneouswkTitle四號(hào)四號(hào)LiuLu1ZuoWanli12PengTao12Name五號(hào)1(CollegeofComputerScienceTechnologyJilinUniversityChangchun130012)Depart.Crespond小五號(hào)2(KeyLabatyofSymbolComputationKnow
5、ledgeEngineering(JilinUniversity)MinistryofEducationChangchun130012)AbstractMiningrichsemanticinfmationhiddeninheterogeneousinfmationwkisanimptanttaskindatamining.Thevaluedatadistributiongenerationmechanismofoutliersarea
6、lldifferentfromthatofnmaldata.Itisofgreatsignificanceofanalyzingitsgenerationmechanismeveneliminatingoutliers.Outlierdetectioninhomogeneousinfmationwkhasbeenstudiedexpledfalongtime.Howeverfewofthemareaimingatdynamicoutli
7、erdetectioninheterogeneouswks.Manyissuesneedtobesettled.Duetothedynamicsoftheheterogeneousinfmationwknmaldatamaybecomeoutliersovertime.ThispaperproposesadynamicTensRepresentationBasedOutlierdetectionmethodcalledTRBOutlie
8、r.Itconstructstensindextreeaccdingtothehighderdatarepresentedbytens.Thefeaturesareaddedtodirectitemsetindirectitemsetrespectivelywhensearchingthetensindextree.Meanwhilewedescribeaclusteringmethodbasedonthecrelationofshtt
9、extstojudgewhethertheobjectsindatasetschangetheiriginalclustersthendetectoutliersdynamically.Thismodelcankeepthesemanticrelationshipinheterogeneouswksasmuchaspossibleinthecaseoffullyreducingthetimespacecomplexity.Theexpe
10、rimentalresultsshowthatourproposedmethodcandetectoutliersdynamicallyinheterogeneousinfmationwkeffectivelyefficiently.Abstract五號(hào),至少200字,影響EI索引Keywdsdynamicoutlierdetectionheterogeneousinfmationwktensrepresentationtensinde
11、xtreeclusteringKeywds五號(hào)摘要挖掘隱藏在異質(zhì)信息網(wǎng)絡(luò)中豐富的語(yǔ)義信息是數(shù)據(jù)挖掘的重要任務(wù)之一離群點(diǎn)在值、數(shù)據(jù)分布、和產(chǎn)生機(jī)制上都明顯不同于正常數(shù)據(jù)對(duì)象檢測(cè)離群點(diǎn)并分析其不同的產(chǎn)生機(jī)制,最終消除離群點(diǎn)具有重要的現(xiàn)實(shí)意義目前,針對(duì)異質(zhì)信息網(wǎng)絡(luò)動(dòng)態(tài)離群點(diǎn)檢測(cè)的研究工作相對(duì)較少,還有很多問(wèn)題有待解決由于異質(zhì)信息網(wǎng)絡(luò)的動(dòng)態(tài)性,隨著時(shí)間的變化,正常數(shù)據(jù)對(duì)象也可能轉(zhuǎn)變?yōu)殡x群點(diǎn)針對(duì)異質(zhì)網(wǎng)絡(luò)提出一種基于張量表示的動(dòng)態(tài)離群點(diǎn)檢測(cè)方法,并
12、根據(jù)張量表示的高階數(shù)據(jù)構(gòu)建張量索引樹(shù)通過(guò)搜索張量索引樹(shù),將特征加入到直接3計(jì)算機(jī)研究與發(fā)展2016年定的關(guān)系類當(dāng)節(jié)點(diǎn)類型數(shù)量∣A∣1或邊的類型數(shù)量∣R∣1時(shí),這樣的信息網(wǎng)絡(luò)被稱為異質(zhì)信息網(wǎng)絡(luò)反之為同質(zhì)信息網(wǎng)絡(luò)定義2異質(zhì)信息網(wǎng)絡(luò)中的N階張量我們將異質(zhì)信息網(wǎng)絡(luò)中的N階張量表示為X∈?其中,N為張量的階數(shù)(也可稱模NtypeNltypeltypelIII?2211數(shù))第1階張量的長(zhǎng)度記為l1,其對(duì)應(yīng)的實(shí)體類型為type1第N階張量的長(zhǎng)度記為l
13、N,其對(duì)應(yīng)的實(shí)體類型為typeNtypei∈A,1≤i≤N?公式用office2003編輯器或者mathtype,普通變量用斜體,向量、矢量、張量用黑斜體例如,文獻(xiàn)網(wǎng)絡(luò)可以被表示成1個(gè)4階張量,X∈?電影網(wǎng)絡(luò)可以被表示為1TermVenuePaperAuth4321llllIIII個(gè)4階張量X∈?或一個(gè)3階張LanguageGenreMovieAct4321llllIIII量X∈?GenreMovieAct321lllIII定義3張量索
14、引樹(shù)張量索引樹(shù)是包含n(n≥1)個(gè)節(jié)點(diǎn)且滿足下列條件的有限集合:1)張量索引樹(shù)中的每一個(gè)節(jié)點(diǎn)都由1個(gè)N(N≥1)維向量組成2)存在唯一一個(gè)向量節(jié)點(diǎn)X0,它是由一系列時(shí)序數(shù)據(jù)組成的向量,稱為張量索引樹(shù)的根節(jié)點(diǎn)3)張量索引樹(shù)同一層的節(jié)點(diǎn)可以包含不同類型的數(shù)據(jù)但同一類型的數(shù)據(jù)都處于張量索引樹(shù)的同一層中…………2.2張量索引樹(shù)的構(gòu)建我們之前提到過(guò),張量矢量化可能破壞各階中數(shù)據(jù)之間的關(guān)系在大數(shù)據(jù)環(huán)境下,不可避免地會(huì)引起維數(shù)災(zāi)難而對(duì)于異質(zhì)網(wǎng)絡(luò)中的數(shù)
15、據(jù),如何進(jìn)行高階統(tǒng)計(jì)也是我們需要考慮的問(wèn)題應(yīng)用張量分解方法,例如構(gòu)建鄰接矩陣,處理數(shù)據(jù)集中的樣本會(huì)出現(xiàn)嚴(yán)重的數(shù)據(jù)稀疏性問(wèn)題在本節(jié)中,我們提出了一種構(gòu)建張量索引樹(shù)的方法來(lái)處理異質(zhì)信息網(wǎng)絡(luò)中用張量表示的數(shù)據(jù),進(jìn)而動(dòng)態(tài)發(fā)現(xiàn)網(wǎng)絡(luò)中存在的離群點(diǎn)我們首先描述張量索引樹(shù)的構(gòu)建過(guò)程由于本文主要解決動(dòng)態(tài)離群點(diǎn)發(fā)現(xiàn)的問(wèn)題,因此,張量索引樹(shù)的根節(jié)點(diǎn)為時(shí)序數(shù)據(jù)組成的向量X=(X1,X2,…,Xn),如圖1中Layer1所示在本節(jié)中,我們使用文獻(xiàn)網(wǎng)絡(luò)中的3階張量
16、模型來(lái)說(shuō)明構(gòu)建過(guò)程在時(shí)間點(diǎn)X1中,順序遍歷N(N=3)階張量中的第1階張量將屬于type1類型的實(shí)體(作者名)加入第2層向量節(jié)點(diǎn)中同時(shí),將該作者發(fā)表的論文依次加入第3層向量節(jié)點(diǎn)中第3層向量節(jié)點(diǎn)中的論文題目作為第2層向量節(jié)點(diǎn)中作者名的后繼節(jié)點(diǎn)……張量索引樹(shù)的構(gòu)建不僅可以加快離群點(diǎn)檢測(cè)的速度,而且可以有效解決在使用鄰接矩陣進(jìn)行計(jì)算時(shí)出現(xiàn)的數(shù)據(jù)稀疏性問(wèn)題X1X2XiXn1Xn...A11A12A1n1Length=n1A21A22A2n2Le
17、ngth=n2An1An2AnnmLength=nmP11P12P1u1P21P22P2u2Pn1Pn2PnumT11T12T1v1T21T22T2v2Tn1Tn2T2v...mLayer1:TimestampLayer2:AuthLayer3:PaperLayer4:TermLength=u1Length=u2Length=umLength=v1Length=v2Length=vm...........................
18、.........Fig.1Thetensindextreeconstructedbyathirddertensinbibliographicwk.圖1文獻(xiàn)網(wǎng)絡(luò)中由3階張量所構(gòu)建的張量索引樹(shù)中英文圖題用小五號(hào),圖內(nèi)的字用英文六號(hào)3基于張量表示的聚類過(guò)程在本節(jié)中,我們?cè)敿?xì)介紹如何根據(jù)給定的入口entry(source,target)搜索張量索引樹(shù),進(jìn)而使用聚類方法發(fā)現(xiàn)異質(zhì)網(wǎng)絡(luò)中存在的離群點(diǎn)(即源節(jié)點(diǎn)相對(duì)于目標(biāo)類別是否離群)張量索引樹(shù)可以根
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 一種新的圖像置亂算法-歡迎訪問(wèn)計(jì)算機(jī)研究與發(fā)展
- 一種基于小波變換和騎士巡游的圖像置亂算法題目三號(hào)
- 圖像的混沌置亂算法研究.pdf
- 基于混沌置亂和Radon變換置亂的圖像加密算法.pdf
- 數(shù)字圖像置亂算法的研究.pdf
- 基于分區(qū)圖像置亂算法的研究.pdf
- 圖像置亂算法及其評(píng)估研究.pdf
- 一種基于線性同余的空間變換圖像置亂加密新算法.pdf
- 彩色數(shù)字圖像的置亂算法研究.pdf
- 基于改進(jìn)的zigzag置亂的dwt圖像水印算法
- 一種基于BRISK的快速圖像拼接新算法.pdf
- 一種新的圖像分割算法—一種基于免疫遺傳算法和粗糙集的改進(jìn)圖像分割算法.pdf
- 基于混沌映射的數(shù)字圖像置亂算法.pdf
- 一種新的顏色量化算法
- 基于混沌映射與排序變換的圖像置亂算法.pdf
- 基于最佳置亂的自適應(yīng)圖像數(shù)字水印算法.pdf
- 一種新的基于區(qū)域生長(zhǎng)的彩色圖像分割算法.pdf
- 基于置亂的DWT域數(shù)字圖像水印算法研究.pdf
- 一種圖像拼接算法的研究.pdf
- 基于騎士巡游變換的圖像置亂算法及評(píng)價(jià)方法.pdf
評(píng)論
0/150
提交評(píng)論