版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、<p> 開(kāi)題題目:基于關(guān)鍵字的交換內(nèi)容過(guò)濾技術(shù)的研究與實(shí)現(xiàn)</p><p> 1、選題描述:包括選題的背景、依據(jù)和意義、研究目標(biāo)、研究?jī)?nèi)容以及對(duì)國(guó)內(nèi)外相關(guān)領(lǐng)域研究現(xiàn)狀的分析(可附頁(yè))選題背景、依據(jù)和意義:進(jìn)入21世紀(jì)以來(lái),計(jì)算機(jī)在我國(guó)開(kāi)始普及并迅速發(fā)展,在國(guó)家有關(guān)政策的積極鼓勵(lì)推進(jìn)下,我國(guó)的信息化建設(shè)獲得了巨大的成就。隨著互聯(lián)網(wǎng)的不斷快速發(fā)展,信息個(gè)體之間的互聯(lián)互通和信息共享已經(jīng)成為人們迫切需要解決的
2、問(wèn)題,企事業(yè)單位、政府和軍隊(duì)等部門(mén)內(nèi)部積累了大量的基礎(chǔ)數(shù)據(jù)。但是,出于內(nèi)外網(wǎng)和不對(duì)等區(qū)域之間數(shù)據(jù)交換安全性問(wèn)題的考慮,這些部門(mén)無(wú)法實(shí)時(shí)和充分地利用這些基礎(chǔ)數(shù)據(jù)作為信息化建設(shè)應(yīng)用擴(kuò)展,因而只能相互獨(dú)立、數(shù)據(jù)分散地形成一個(gè)個(gè)“信息孤島”、“數(shù)據(jù)孤島”,嚴(yán)重影響了其信息化建設(shè)的進(jìn)一步發(fā)展,也為信息化工作的開(kāi)展帶來(lái)了不便。此外,因病毒的瘋狂肆虐、黑客日益猖獗、軟件本身漏洞和設(shè)計(jì)缺陷而導(dǎo)致的泄密事件也越來(lái)越多,對(duì)黨政機(jī)關(guān)、軍隊(duì)等單位的信息安全構(gòu)成
3、了極大的威脅。然而,傳統(tǒng)的技術(shù)手段很難兼顧安全隔離和信息交換兩者的需求,更缺乏對(duì)信息安全的嚴(yán)格審查,極易導(dǎo)致攻擊代碼的流入和重要信息的泄漏。簡(jiǎn)單的物理隔離、網(wǎng)閘技術(shù)等都不能從根本上解決問(wèn)題,并且缺少對(duì)進(jìn)程的交換數(shù)據(jù)中敏感的、涉密的信息</p><p> 2、擬解決的關(guān)鍵問(wèn)題和擬采取的研究方案(可附頁(yè))關(guān)鍵問(wèn)題及解決方案:由于文件安全交換系統(tǒng)中傳輸?shù)奈募赡馨舾行畔⒒蛘呱婷苄畔?,因此,在文件發(fā)送之前在發(fā)送方進(jìn)行
4、文件內(nèi)容的敏感、涉密信息檢測(cè)過(guò)濾是十分必要的。敏感信息過(guò)濾主要針對(duì)文本類(lèi)文件(.txt/.doc/.docx/.rtf等)攜帶的內(nèi)容進(jìn)行掃描過(guò)濾。保證交換的內(nèi)容符合文件安全交換系統(tǒng)中的定制策略。研究一,信息過(guò)濾的幾種方法,主要有:1)基于黑白名單的過(guò)濾。 所謂白名單,有時(shí)候也被稱(chēng)為安全名單。例如對(duì)服務(wù)器管理員、網(wǎng)絡(luò)服務(wù)商或公司來(lái)說(shuō),都會(huì)有一系列對(duì)自己來(lái)說(shuō)是安全的網(wǎng)絡(luò)服務(wù)器域名或IP地址列表,從這些網(wǎng)絡(luò)服務(wù)器獲取的信息通常被認(rèn)為是安全的。
5、這樣,如果網(wǎng)絡(luò)信息對(duì)應(yīng)地址處在這個(gè)安全名單中,系統(tǒng)就會(huì)讓這些信息不經(jīng)過(guò)過(guò)濾器就直接到達(dá)客戶(hù)端。所謂黑名單技術(shù),即利用國(guó)內(nèi)外很多組織提供的不良信息制造者或策源地的“黑名單”,過(guò)濾器得到信息請(qǐng)求后,先到“黑名單”上去查找。如果對(duì)應(yīng)地址在名單中,就拒絕連接。白名單和黑名單通常是結(jié)合起來(lái)使用的。這種技術(shù)的優(yōu)點(diǎn)是速度快,并可以動(dòng)態(tài)更新;缺點(diǎn)是,會(huì)拒絕指向同一個(gè)黑名單的所有信息,誤判率高。2)基于規(guī)則的過(guò)濾</p><p>
6、 PaodingPaoding(庖丁解牛分詞)基于Java的開(kāi)源中文分詞組件,提供lucene和solr接口,具有極 高效率和 高擴(kuò)展性。引入隱喻,采用完全的面向?qū)ο笤O(shè)計(jì),構(gòu)思先進(jìn)。高效率:在PIII 1G內(nèi)存?zhèn)€人機(jī)器上,1秒可準(zhǔn)確分詞 100萬(wàn)漢字。采用基于不限制個(gè)數(shù)的詞典文件對(duì)文章進(jìn)行有效切分,使能夠?qū)?duì)詞匯分類(lèi)定義。能夠?qū)ξ粗脑~匯進(jìn)行合理解析MMSEG4JMMSEG4J基于Java的開(kāi)源中文分詞組件
7、,提供lucene和solr 接口1.mmseg4j 用 Chih-Hao Tsai 的 MMSeg 算法實(shí)現(xiàn)的中文分詞器,并實(shí)現(xiàn) lucene 的 analyzer 和 solr 的TokenizerFactory 以方便在Lucene和Solr中使用。2.MMSeg 算法有兩種分詞方法:Simple和Complex,都是基于正向最大匹配。Complex 加了四個(gè)規(guī)則過(guò)慮。官方說(shuō):詞語(yǔ)的正確識(shí)別率達(dá)到了 98.41%。mmseg4j
8、已經(jīng)實(shí)現(xiàn)了這兩種分詞算法。由于文件安全交換系統(tǒng)初始默認(rèn)過(guò)濾詞匯較少,我準(zhǔn)備采用的基于文本內(nèi)容分詞的敏感信息過(guò)濾方式,即采用分詞結(jié)合關(guān)鍵字過(guò)濾方式對(duì)安全交</p><p> 3、時(shí)間進(jìn)度安排(可附頁(yè))</p><p> 4、參考文獻(xiàn)(可附頁(yè))[1]李松林,陳華清,任鑫. Eclipse寶典.電子工業(yè)出版社,2007年6月[2]張紅旗,王魯. 信息安全技術(shù).高等教育出版社,2008年[3]Br
9、uce Eckel. Java 編程思想.機(jī)械工業(yè)出版社,2007年6月[4]皮德常,張鳳林. Java2簡(jiǎn)明教程(第二版).清華大學(xué)出版社,2006年7月[5]林鴻飛. 基于混合模式的文本過(guò)濾模型.計(jì)算機(jī)研究與發(fā)展.2001年09月[6]曲德祥,基于分詞的關(guān)鍵詞過(guò)濾技術(shù)研究.山東師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2010年09月[7]劉紅芝,中文分詞技術(shù)的研究. 電腦開(kāi)發(fā)與應(yīng)用,2010年[8]蔡曉妍,戴冠中,楊黎斌, 改進(jìn)的多模式字符串匹
10、配算法.計(jì)算機(jī)應(yīng)用,2010年06月[9]張家勇,劉建輝,基于中文分詞技術(shù)的信息智能過(guò)濾系統(tǒng).信息技術(shù),2006年12月[10]劉楊,陳暉,陳遠(yuǎn)江,中文文本信息過(guò)濾技術(shù)研究 .船電技術(shù),2010年07月[11]姚磊岳,熊建英, 一種基于中文分詞算法的信息過(guò)濾技術(shù).科技廣場(chǎng),2007年07月[12]段立娟,Web挖掘的敏感信息過(guò)濾模型.前沿技術(shù),2007年[13]程妮,崔建海,王軍(編</p><p> 5、導(dǎo)師意
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- XML關(guān)鍵字過(guò)濾技術(shù).pdf
- 基于linux操作系統(tǒng)的關(guān)鍵字過(guò)濾防火墻研究與實(shí)現(xiàn).pdf
- 基于內(nèi)容和結(jié)構(gòu)的關(guān)鍵字圖查詢(xún)研究.pdf
- 網(wǎng)頁(yè)關(guān)鍵字過(guò)濾研究及改進(jìn).pdf
- 垃圾郵件關(guān)鍵字過(guò)濾算法
- 基于關(guān)鍵字的模糊查詢(xún)技術(shù)的研究.pdf
- kFilter-基于關(guān)鍵字查詢(xún)的XML流過(guò)濾系統(tǒng).pdf
- 基于關(guān)鍵字的P2P流量識(shí)別技術(shù)的研究與實(shí)現(xiàn).pdf
- 基于布魯姆過(guò)濾器的P2P多關(guān)鍵字搜索技術(shù)研究.pdf
- 基于SLCA的XML關(guān)鍵字查詢(xún)技術(shù)研究.pdf
- 基于DHT的多關(guān)鍵字檢索系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 基于語(yǔ)義相關(guān)性的XML關(guān)鍵字查詢(xún)的研究與實(shí)現(xiàn).pdf
- 關(guān)鍵字
- 基于時(shí)態(tài)關(guān)鍵字的倒排索引技術(shù)問(wèn)題研究與應(yīng)用.pdf
- 模糊關(guān)鍵字可搜索加密算法的研究與實(shí)現(xiàn)
- 基于關(guān)鍵字的XML查詢(xún).pdf
- 基于XML的關(guān)鍵字查詢(xún)算法研究.pdf
- XML關(guān)鍵字查詢(xún)中包含關(guān)鍵字的最小片段問(wèn)題的研究.pdf
- 文本內(nèi)容過(guò)濾的關(guān)鍵技術(shù)研究及實(shí)現(xiàn).pdf
- 網(wǎng)頁(yè)內(nèi)容過(guò)濾的關(guān)鍵技術(shù)研究及實(shí)現(xiàn).pdf
評(píng)論
0/150
提交評(píng)論