-
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 82
大?。?4.66(MB)
子文件數(shù):
-
簡介:華東師范大學(xué)碩士學(xué)位論文OFFICE文檔對象分析與自動閱卷系統(tǒng)研究姓名吳宏良申請學(xué)位級別碩士專業(yè)軟件工程指導(dǎo)教師金炳堯20091101ABSTRACTWITHTHEDEGREEOFINFORMATIONBASEDSOCIETYCONSTANTLYIMPROVE,THECOMPUTERAPPLICATIONABILITY‘SPOPULARIZATIONTRAINEDANDINSPECTSHADALREADYBECOMEAILINDUSTRYINTHEINSPECTION,THETRADITIONMANUALMARKINGISSUBSTITUTEDFORTHEAUTOMATICMARKINGGRADUALLYATPRESENTTHEAUTOMATICMARKINGSYSTEMISCOMPETENTINMARKINGTHEOBJECTIVETESTQUESTION,BUTNOTINMARKINGTHEPRACTICETHEREFORE,HOWTOUTILIZESOMENEWSTRATEGIESTOREFLECTREALLY,ACCURATELY,OBJECTIVELYTHELEVELOFTHEAPPRAISEDPERSON’SKNOWLEDGEANDABILITY,HASBECOMETHEHOTRESEARCHTOPICAUTOMATICMARKINGSOFOFFICEDOCUMENTSWERESTUDIEDINTHISPAPERTHEINFORMATIONCONTENTOFTHEOFFICEDOCUMENTSISHUGE,ANDTHEINTERNALSTRUCTUREOFTHEMISCOMPLEXTHEREFORE,ITISVERYDIFFICULTTOMARKTHESEPRACTICETESTQUESTIONDOCUMENTSWITHTHEORDINARYDOCUMENTSCORRELATIONMETHODNOMATTERMACROORVBA,OPERATESTHEOFFICEDOCUMENTS,OROBTAINSTHEIRATTRIBUTEINFORMATIONBYUSINGONEOFTHEVISUALBASIC’SSUBSETSTHEDEPTHMETICULOUSRESEARCHNEEDSTOBECARRIEDOUTONSEVERALASPECTPROBLEMSINMARKINGAUTOMATICLYTHEOFFICEDOCUMENTSFROMTHETHEORYANGLE,WHICHOPERATIONSINTHEOFFICEDOCUMENTSAREJUDGED,CANBEMARKEDAUTOMATICALLY;FROMTHEPRACTICEANGLE,HOWTOWITHDRAWTHEOFFICEDOCUMENTSATTRIBUTES,USEDFORTHEJUDGMENTINOPERATIONACCURACYONTHEEXAMINEE’SOFFICEDOCUMENTS;HOWTOGRASPTHEMETHODOFGAININGTHEOBJECTPROPERTIESINFORMATION,TOKNOWITSDATACONSTRUCTIONORITSDATATYPE,TOUNDERSTANDTHECONNECTIONWITHTHISOBJECTANDOTHERRELATEDOBJECT,TOUNDERSTANDSOMESPECIALREQUESTSOFVISITINGTHISOBJECT,ANDSOON;HOWTOFORMULATETHEREASONABLESTANDARDANDSTRATEGYUSEDFORMARKINGTESTPAPERS,WHICHCANCAUSETHEAUTOMATICMARKINGSYSTEMTOBEMOREOBJECTIVEBECAUSEEACHOFFICEDOCUMENTSARECOMPOSEDOFMANYOBJECTS,THESEOBJECTSANDTHEIRATTRIBUTEVALUEHAVEDECIDEDTHESTRUCTUREANDFORMOFTHEOFFICEDOCUMENTSTHISARTICLEPROVIDESAFEASIBLEPLANWHICHUSEDFORTHEDEVELOPMENTOF
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 78
大?。?2.99(MB)
子文件數(shù):
-
簡介:飛行試驗是發(fā)展航空科學(xué)技術(shù)的關(guān)鍵環(huán)節(jié)之一,貫穿于飛行研究、新機(jī)設(shè)計、研制定型、生產(chǎn)和復(fù)議使用的全過程,試飛已不再是簡單地驗證設(shè)計,而是衡量飛機(jī)設(shè)計優(yōu)劣程度的標(biāo)準(zhǔn)和進(jìn)一步修改設(shè)計的依據(jù)。中航工業(yè)哈爾濱飛機(jī)工業(yè)集團(tuán)有限責(zé)任公司試飛站在飛行試驗過程中發(fā)現(xiàn),試驗所獲取的數(shù)據(jù)量極為龐大復(fù)雜,且報告文檔種類名目繁多,針對目前數(shù)據(jù)和文檔管理分散,集中性和共享性不大的現(xiàn)狀,試飛站要求按單一數(shù)據(jù)源管理建立數(shù)據(jù)和文檔管理系統(tǒng)。根據(jù)哈飛集團(tuán)試飛站的需求,本文在VISUALC60集成開發(fā)環(huán)境下設(shè)計并編碼實現(xiàn)了飛行試驗數(shù)據(jù)和文檔管理系統(tǒng),基于SOLSERVER2000建立了其數(shù)據(jù)庫系統(tǒng)。所開發(fā)的軟件系統(tǒng)實現(xiàn)了飛行試驗數(shù)據(jù)的儲存、轉(zhuǎn)換與檢索、保存以及文檔的登記、編寫、信息統(tǒng)計和歸檔管理等功能。提高了試飛站內(nèi)試飛數(shù)據(jù)和文檔管理的集中性和共享性,加快了處理速度,減輕了試飛站人員的工作量,提高了工作效率。在試飛站數(shù)據(jù)和文檔管理中發(fā)揮了重要作用,成為了試飛站的一個快捷有力的工具。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 77
大?。?20.38(MB)
子文件數(shù):
-
簡介:傳統(tǒng)的信息特別是書籍、報紙等出版印刷領(lǐng)域的信息存儲形式一般是把版式信息和信息本身給混合在一起這樣就導(dǎo)致很難重復(fù)利用信息本身。因此需要有一種有效的方式來存儲信息這種信息存儲方式能夠使存儲格式跨平臺內(nèi)容和版式要分離存儲形式要滿足可重用的要求。基于片段化XML文檔結(jié)構(gòu)的內(nèi)容重組模型的研究目標(biāo)是尋找準(zhǔn)確、高效、能重復(fù)利用文本內(nèi)容的方法。XML是理想的文檔編寫格式對于信息開發(fā)有以下優(yōu)勢它強(qiáng)調(diào)的是內(nèi)容的結(jié)構(gòu)而不是形式可以更好地保持內(nèi)容的一致性并更好地保證內(nèi)容的表現(xiàn)形式對各種不同輸出設(shè)備和格式的一致性。通過對國內(nèi)外內(nèi)容重組技術(shù)的研究充分地分析了圖書、期刊、報紙、標(biāo)準(zhǔn)等各種出版物的結(jié)構(gòu)設(shè)計出了基于片段化XML文檔結(jié)構(gòu)的內(nèi)容重組模型。并對模型的思想模型的詳細(xì)描述模型的實現(xiàn)進(jìn)行了詳細(xì)地介紹。基于片段化XML文檔結(jié)構(gòu)的內(nèi)容重組模型通過內(nèi)容對象的基礎(chǔ)模型到復(fù)合文檔結(jié)構(gòu)的映射表將基于片段化XML文檔結(jié)構(gòu)的內(nèi)容對象通過映射重組為具備層級結(jié)構(gòu)的復(fù)合文檔。在映射重組過程中根據(jù)最終交付文檔的語義表現(xiàn)形式生成面向不同主題的交付文檔?;谄位疿ML文檔結(jié)構(gòu)的內(nèi)容重組模型將劃分成適當(dāng)顆粒度的內(nèi)容模塊也就是主題存放在主題庫中通過映射將與創(chuàng)作有關(guān)的主題組織和連接在一起。按照所需交付出版物設(shè)定相應(yīng)的樣式模板選擇相應(yīng)的輸出類型通過XSLT技術(shù)轉(zhuǎn)換得到最終交付出版物?;赬ML文檔結(jié)構(gòu)的內(nèi)容重組模型能夠很好地支撐不同XML文檔結(jié)構(gòu)間轉(zhuǎn)換和組合關(guān)系。但是其XML結(jié)構(gòu)文檔需要合理化片段化的內(nèi)容要能很好地獨立描述完整的意思這樣重組映射出來的文檔才能不利用上下文的關(guān)系而很好地重組為最終交付物。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 64
大小: 1.95(MB)
子文件數(shù):
-
簡介:關(guān)鍵詞自動抽取是依靠計算機(jī)從文檔中選擇出反映主題內(nèi)容的詞,也稱作關(guān)鍵詞自動標(biāo)引,可以為用戶提供一個簡潔的內(nèi)容摘要,使信息定位更加簡單。本文研究從同主題的文檔集中抽取關(guān)鍵詞來發(fā)現(xiàn)主題的算法,主要研究成果如下1提出了計算多文檔詞語權(quán)重的ATFPDF方法。在文檔集中包含某個詞語的文檔數(shù)越多,該詞語越可能是表達(dá)文檔集主題的重要成分,ATFPDF方法中詞語權(quán)重和詞語出現(xiàn)的文檔頻率成指數(shù)級,比成線性關(guān)系時有更好的關(guān)鍵詞抽取效果。另外,該方法還考慮了文檔集中單個文檔大小對詞語權(quán)重的影響。2提出了基于聯(lián)合權(quán)重的關(guān)鍵詞抽取方法,并改進(jìn)TEXTRANK方法用于抽取多文檔生成關(guān)鍵詞時,考慮到候選關(guān)鍵詞中可能存在冗余現(xiàn)象,本文使用“聯(lián)合權(quán)重方法”聯(lián)合那些相互之間語義相似度較大的詞語的權(quán)重,從而調(diào)整候選關(guān)鍵詞的排序來選擇關(guān)鍵詞;另外,考慮到表達(dá)同一主題的詞語之間存在較強(qiáng)的語義關(guān)系,本文改進(jìn)TEXTRANK方法來使相互之間語義關(guān)系較強(qiáng)的詞語互相加強(qiáng)重要性,重新計算候選關(guān)鍵詞在TEXTRANK模型中的權(quán)重。實驗證明,和基于聚類的關(guān)鍵詞標(biāo)記方法相比,本文提出的兩種方法在關(guān)鍵詞抽取效果上均有一定的提高。本文將聚類技術(shù)與多文檔關(guān)鍵詞抽取技術(shù)相結(jié)合來構(gòu)建新型的聚類搜索引擎,并和商業(yè)聚類搜索引擎ⅥVISIMO進(jìn)行了對比,闡述了各自的優(yōu)缺點。最后對本文工作進(jìn)行了總結(jié)并給出了多文檔關(guān)鍵詞抽取技術(shù)的下一步研究目標(biāo)。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 71
大小: 7.31(MB)
子文件數(shù):
-
簡介:多文檔自動摘要是數(shù)據(jù)挖掘、信息檢索等領(lǐng)域非常亟需解決的問題之一。目前,學(xué)術(shù)界對于多文檔自動摘要的研究已經(jīng)取得了顯著的成果,提出了很多多文檔自動摘要的算法。但是由于應(yīng)用的領(lǐng)域的不同,處理的數(shù)據(jù)的不同以及多文檔自動摘要任務(wù)本身的復(fù)雜性,多文檔自動摘要任務(wù)還存在著許多問題,需要研究和解決。本文面向科技領(lǐng)域,首先基于本文提出的改進(jìn)的基于凝聚的層次聚類算法進(jìn)行多文檔自動摘要,然后利用本文提出的改進(jìn)的信息抽取算法對聚類結(jié)果進(jìn)行了信息抽取,并依據(jù)結(jié)果自動生成綜述報告。利用改進(jìn)的基于凝聚的層次聚類的算法進(jìn)行多文檔自動摘要,將多文檔摘要的任務(wù)轉(zhuǎn)化為文檔聚類的任務(wù),傳統(tǒng)的特征選取方法并不對詞區(qū)別對待,本文對特征選取方法進(jìn)行改進(jìn)提出了基于實體詞和專有名詞的特征選取方法,針對不同的特征選取方法進(jìn)行對比實驗。由于基于傳統(tǒng)聚類方法進(jìn)行多文檔摘要,通常采用余弦相似度,并沒有對學(xué)術(shù)文獻(xiàn)各部分區(qū)別對待,本文提出了基于多維度的相似度計算方法,對學(xué)術(shù)文獻(xiàn)各部分分別計算相似度并線性加權(quán),并且將相似度賦予不同的權(quán)值進(jìn)行累加整合作為文獻(xiàn)相似度,得到了更好的性能。在本文的聚類過程中,提出一種改進(jìn)的基于凝聚的層次聚類方法,較之于傳統(tǒng)的基于凝聚的層次聚類方法,此算法要求簇之間距離更緊密,對于科技領(lǐng)域達(dá)到了更好的效果。顯然,研究人員不滿足于了解學(xué)術(shù)文獻(xiàn)的聚類劃分,更希望知道學(xué)術(shù)文獻(xiàn)的研究類別,研究方法等信息?;谶@個需求,本文首先采用改進(jìn)的基于統(tǒng)計的信息抽取方法對研究類別進(jìn)行信息抽取,并針對學(xué)術(shù)文獻(xiàn)各部分的重要程度不同,提出了改進(jìn)的詞頻的權(quán)重計算方法,提高的信息抽取效果。然后,本文針對科技領(lǐng)域的特殊性,提出了基于規(guī)則與統(tǒng)計相結(jié)合的信息抽取方法,相比較傳統(tǒng)的基于規(guī)則的信息抽取算法,本文將規(guī)則與淺層句法分析相結(jié)合,使信息的抽取性能得到提升。最后本文依據(jù)上述聚類以及信息抽取結(jié)果,并對研究的時間段,作者分布,研究方向,研究方法等進(jìn)行統(tǒng)計,最后對研究方向做出預(yù)測,自動生成綜述報告供研究人員閱讀。
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 70
大?。?3.4(MB)
子文件數(shù):
-
簡介:在計算機(jī)網(wǎng)絡(luò)技術(shù)飛速發(fā)展的背景下,互聯(lián)網(wǎng)環(huán)境下的軟件形態(tài)和功能正發(fā)生著深刻的變化,這給國產(chǎn)辦公軟件的發(fā)展帶來了機(jī)遇,網(wǎng)絡(luò)集成化辦公已成為趨勢。在該領(lǐng)域中,SAAS(SOFTWAREASASERVICE,軟件即服務(wù))模式逐漸被接受,而國際傳統(tǒng)辦公軟件巨頭所熟悉和擅長的套裝軟件商業(yè)模式正在發(fā)生變化。更為重要的是,辦公文檔數(shù)據(jù)的形態(tài)和存儲載體也發(fā)生了改變,90%以上的數(shù)據(jù)來源于并儲存于互聯(lián)網(wǎng)。由于網(wǎng)絡(luò)集成化辦公所帶來的辦公環(huán)境的復(fù)雜性,使得文檔安全面臨著重大的挑戰(zhàn),一些涉及機(jī)密的辦公文檔的外泄會給政府部門或者企業(yè)造成不可估量的損失,因此需要對辦公文檔進(jìn)行有效的安全管理。本論文在實驗室與無錫永中軟件有限公司合作承擔(dān)的國家核高基重大專項“網(wǎng)絡(luò)集成辦公軟件研發(fā)及產(chǎn)業(yè)化”的項目背景下,針對網(wǎng)絡(luò)集成化辦公所帶來的文檔安全問題,研究辦公文檔的安全管理機(jī)制,設(shè)計文檔透明加密技術(shù)、訪問控制技術(shù)和數(shù)字簽名技術(shù),實現(xiàn)了對永中OFFICE辦公文檔的安全管理。論文的研究工作主要包括以下四個方面1研究基于文件過濾驅(qū)動的文檔透明加密技術(shù),設(shè)計基于MINIFILTER過濾驅(qū)動框架的文件過濾驅(qū)動,實現(xiàn)了對永中OFFICE辦公文檔的透明加解密2研究用戶管理和RBAC訪問控制技術(shù),設(shè)計并實現(xiàn)了對永中OFFICE二進(jìn)制辦公文檔的訪問控制和基于XML格式的UOF新型辦公文檔的細(xì)粒度訪問控制3研究XML文檔數(shù)字簽名技術(shù),依據(jù)XPATH文檔劃分規(guī)則設(shè)計并實現(xiàn)了基于XML格式的UOF新型辦公文檔的多重簽名機(jī)制4基于上述技術(shù),完成了辦公文檔安全管理系統(tǒng)的整體和功能模塊設(shè)計,實現(xiàn)了針對永中OFFICE辦公文檔的安全管理系統(tǒng)。綜上所述,論文在研究現(xiàn)有的文檔加密、訪問控制和數(shù)字簽名技術(shù)的基礎(chǔ)上,提出基于MINIFILTER過濾驅(qū)動框架的文檔透明加密和訪問控制機(jī)制,并設(shè)計了基于XML格式的UOF新型辦公文檔的細(xì)粒度訪問控制和多重簽名機(jī)制,最后設(shè)計并實現(xiàn)了對永中OFFICE辦公文檔的安全管理系統(tǒng)。系統(tǒng)功能和性能測試表明,該安全管理系統(tǒng)滿足設(shè)計需求,能夠有效保障辦公文檔的安全。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 91
大小: 16.74(MB)
子文件數(shù):
-
簡介:文檔管理是當(dāng)前各政府部門、企事業(yè)單位行政管理中的一個重要部分。越來越多的機(jī)構(gòu)將文檔管理作為提升管理效率的一個突破口。很多企業(yè)采用了專業(yè)化的文檔管理系統(tǒng),并分派專職人員對所有文檔進(jìn)行歸納、整理。工商局作為政府的行政部門,除了常規(guī)的一些企業(yè)資料外,還要管理領(lǐng)導(dǎo)講話、上級部門傳達(dá)精神、會議記錄、人事任免公告、問題整改紀(jì)要等一些重要或涉密的內(nèi)容,因此文檔管理系統(tǒng)成為了一個必要選擇。本文在分析了目前國內(nèi)外文檔管理系統(tǒng)的發(fā)展情況的基礎(chǔ)上,按照德陽市工商局工作開展的實際需要,使用了角色訪問控制模型(RBAC)的基本原理分配各角色權(quán)限,最后采用改進(jìn)的RBAC模型RDPU訪問控制模型建立系統(tǒng)管理的安全機(jī)制,提出了基于RDPU模型的文檔管理系統(tǒng)。RDPU模型與RBAC模型的區(qū)別在于,從訪問權(quán)限的設(shè)置上,權(quán)限的分配不僅僅通過角色(ROLE),還可以通過以下幾種方式分配用戶(USERS)、科室(DEPARTMENT)、職位(POSITION)。這種分配方式能有效地降低系統(tǒng)授權(quán)的復(fù)雜度,細(xì)化了各個職責(zé)的分工,RDPU模型名稱也由此得來(ROLE,DEPARTMENT,POSITION,USERS)。在系統(tǒng)的開發(fā)過程中,本文還采用了一些常規(guī)技術(shù)手段,如面向?qū)ο蟮姆椒?、UML用例分析、數(shù)據(jù)庫關(guān)聯(lián)下的存儲等來完善系統(tǒng)。系統(tǒng)采用框架體系、BS三層邏輯結(jié)構(gòu)、SQL2000數(shù)據(jù)庫、C#語言為具體實現(xiàn)手段,同時充分運用了WEB服務(wù)來開發(fā)文檔中的各種重要功能,包括身份認(rèn)證、權(quán)限控制、文檔管理等。存儲方式上同時采用了文件系統(tǒng)與關(guān)系型數(shù)據(jù)庫,保證各類文檔能進(jìn)行合理存儲多媒體文檔存儲于關(guān)系型數(shù)據(jù)庫中,存儲時將文檔正文和文檔相關(guān)信息分開;普通辦公文檔則存于文件系統(tǒng)中,保證空間利用的高效性。文檔系統(tǒng)開發(fā)完成后,可以基本滿足工商局員工的辦公要求。在保證具有良好的操作界面的情況下,系統(tǒng)還要具有較好的跨平臺性、安全性、可擴(kuò)展性,同時能方便的與現(xiàn)有系統(tǒng)相結(jié)合。特別是文件系統(tǒng)與關(guān)系型數(shù)據(jù)庫聯(lián)合存儲的方式,大大提高了系統(tǒng)的存儲效率和訪問速度。WEB服務(wù)的身份認(rèn)證方式也使系統(tǒng)開發(fā)更為簡單,安全性能更高。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 76
大?。?2.63(MB)
子文件數(shù):
-
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 64
大?。?16.26(MB)
子文件數(shù):
-
簡介:學(xué)號學(xué)號20070211282007021128姓名趙姓名趙娜聯(lián)系電話聯(lián)系電話1360531524713605315247EMAILEMAILZHAONA_07GJ126COMZHAONA_07GJ126COM所在學(xué)院管理與經(jīng)濟(jì)學(xué)院所在學(xué)院管理與經(jīng)濟(jì)學(xué)院
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 60
大?。?1.49(MB)
子文件數(shù):
-
簡介:華北電力大學(xué)(保定)博士學(xué)位論文基于XML文檔結(jié)構(gòu)語義的信息檢索方法與應(yīng)用研究姓名李新葉申請學(xué)位級別博士專業(yè)電工理論與新技術(shù)指導(dǎo)教師苑津莎20081201聲明尸明本人鄭重聲明此處所提交的博士學(xué)位論文基于XML文檔結(jié)構(gòu)語義的信息檢索方法與應(yīng)用研究,是本人在華北電力大學(xué)攻讀博士學(xué)位期間,在導(dǎo)師指導(dǎo)下,獨立進(jìn)行研究工作所取得的成果。盡我所知,除文中已經(jīng)注明引用的內(nèi)容外,本學(xué)位論文的研究成果不包含任何他人享有著作權(quán)的內(nèi)容。對本論文所涉及的研究工作做出貢獻(xiàn)的其他個人和集體,均己在文中以明確方式標(biāo)明。簽名壟盤士日期盟。ZZ塹關(guān)于學(xué)位論文使用授權(quán)的說明本人完全了解華北電力大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定,即①學(xué)校有權(quán)保管、并向有關(guān)部門送交學(xué)位論文的原件與復(fù)印件;②學(xué)??梢圆捎糜坝?、縮印或其它復(fù)制手段復(fù)制并保存學(xué)位論文;③學(xué)校可允許學(xué)位論文被查閱或借閱④學(xué)??梢詫W(xué)術(shù)交流為目的,復(fù)制贈送和交換學(xué)位論文;⑤同意學(xué)??梢杂貌煌绞皆诓煌襟w上發(fā)表、傳播學(xué)位論文的全部或部分內(nèi)容。涉密的學(xué)位論文在解密后遵守此規(guī)定作者簽名趔日期盟F≤導(dǎo)師簽名日期
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 96
大?。?3.87(MB)
子文件數(shù):
-
簡介:隨著計算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,INTER上的信息呈指數(shù)級增長。文本信息是其中最重要的組成部分之一。如何從這些海量的文本信息中獲取有用信息,一直以來都是信息處理中重要問題。文本分類技術(shù)是信息檢索和文本挖掘的重要基礎(chǔ),它是在預(yù)先給定的類別標(biāo)簽集合下,根據(jù)文本的內(nèi)容判定文本的類別。文本分類已成為一項具有較大實用價值的關(guān)鍵技術(shù),是組織和管理數(shù)據(jù)的有效手段。本體作為一種知識表示的模型,能夠提供豐富的語義知識,其內(nèi)部的概念與概念之間的關(guān)系可以支持推理機(jī)制。同時,本體作為領(lǐng)域內(nèi)的概念體系,能夠提供很好的類別標(biāo)簽,這樣就解決類別標(biāo)簽過多,訓(xùn)練集不好收集的問題。本文在食品領(lǐng)域?qū)<业膸椭?,通過市場調(diào)研,利用斯坦福大學(xué)開發(fā)的本體構(gòu)建工具PROTéGé342手動構(gòu)建一個奶制品本體。同時,本文通過反復(fù)實驗提出一種改進(jìn)的核心窗口模型相似度計算方法,即增量窗口相似度計算方法,該方法對于采用窗口形式進(jìn)行相似度計算時,有效避免了窗口長度對相似度值的影響。本文將增量窗口相似度計算方法與領(lǐng)域本體結(jié)合,采用技術(shù)手段對領(lǐng)域本體進(jìn)行解析,得到領(lǐng)域本體提供的類別標(biāo)簽,通過動態(tài)的改變窗口的寬度,同時消除窗口寬度對相似度值的影響,進(jìn)而實現(xiàn)分類。本文通過一系列實驗,證明該增量窗口相似度計算方法優(yōu)于其它幾種消除窗口長度影響的方法該方法及傳統(tǒng)的TFIDF、核心窗口模型相似度計算方法,分別與領(lǐng)域本體結(jié)合構(gòu)成分類器,其在分類精準(zhǔn)率、召回率及F1值均有明顯提高。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 36
大?。?3.06(MB)
子文件數(shù):
-
簡介:隨著數(shù)字圖像處理技術(shù)的飛速發(fā)展數(shù)字圖像得到了越來越廣泛的應(yīng)用由于自動化、數(shù)字化辦公需求的增長逐步形成了由紙質(zhì)文檔資料的手工處理轉(zhuǎn)化成數(shù)字文檔圖像自動處理的趨勢研究文檔圖像的智能處理技術(shù)以及對其中特定信息對象的識別提取技術(shù)有著重要的現(xiàn)實意義討論了文檔圖像處理的應(yīng)用現(xiàn)狀及發(fā)展方向通過對典型的文檔圖像識別系統(tǒng)組成結(jié)構(gòu)的描述闡述了預(yù)處理在文檔圖像處理系統(tǒng)中的重要地位歸納了幾何變換、圖像增強(qiáng)、圖像復(fù)原等常用的文檔圖像預(yù)處理方法圍繞傳統(tǒng)的圖像預(yù)處理方法無法針對不同識別對象的特點進(jìn)行特殊處理對特定的應(yīng)用難以達(dá)到很好的效果等問題給出了一種針對光學(xué)標(biāo)記識別的信息卡文檔圖像預(yù)處理方法預(yù)處理過程包括四個階段灰度圖像平滑處理、圖像二值化處理、圖像的偏斜糾正、二值圖像平滑處理灰度圖像平滑處理采用鄰域平均方法可以弱化加性噪聲、乘性噪聲、量化噪聲和椒鹽噪聲等圖像二值化處理采用全局閾值方法圖像的偏斜糾正采用一種基于水平投影直方圖和WIGNERVILLE分布的算法能夠在偏斜角度檢測的精確度和計算開銷之間取得較好的平衡二值圖像平滑處理采用了可明顯消除斑點、缺隙及毛刺噪聲的模式化方法最后給出了系統(tǒng)的實現(xiàn)效果及結(jié)果分析實驗結(jié)果表明信息卡文檔圖像經(jīng)過預(yù)處理后不僅圖像質(zhì)量有較大改善并且圖像識別率有較大的提高
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 58
大?。?1.45(MB)
子文件數(shù):
-
簡介:文檔自動分類作為信息處理技術(shù)的關(guān)鍵技術(shù)之一,具有重要的理論和應(yīng)用價值。目前文檔自動分類在信息處理方面的應(yīng)用大致有搜索引擎技術(shù)、郵件分類、電子會議、信息過濾等很多方面。現(xiàn)有文檔自動分類技術(shù)的特征提取環(huán)節(jié),在文檔不規(guī)范性、算法的局限性等諸多原因的制約下,特征向量中沒有體現(xiàn)文檔的語義信息。為了降低這種現(xiàn)象對文卡當(dāng)自動分類準(zhǔn)確度的影響,提高文檔自動分類的召回率和準(zhǔn)確率,很多的研究人員在這個方面做了大量工作,取得了很多的成果。本論文主要研究了文檔自動分類各個環(huán)節(jié)的算法原理,簡要的闡述了文檔自動分類的發(fā)展、應(yīng)用和現(xiàn)狀,詳細(xì)地描述了空間向量模型的原理與實現(xiàn)方法,重點地論述了改進(jìn)后的空間向量模型在文檔自動分類系統(tǒng)中的應(yīng)用,將段落向量、詞距向量與傳統(tǒng)的空間向量模型相結(jié)合應(yīng)用到文檔的特征提取當(dāng)中。另外,重點論述了一種改進(jìn)的中文分詞算法在文檔自動分類系統(tǒng)中的應(yīng)用,將概率統(tǒng)計模型和詞語查找樹模型應(yīng)用到中文分詞中。試驗結(jié)果表明,改進(jìn)后的向量空間模型顯著的提高了文檔自動分類的準(zhǔn)確率和召回率,既能完整的體現(xiàn)文檔含義,又能加入文檔的語義信息,有利于分類的進(jìn)一步處理。改進(jìn)后中文分詞算法效果明顯,進(jìn)一步提高了向量空間模型表示文檔的質(zhì)量。
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 67
大?。?3.02(MB)
子文件數(shù):
-
簡介:使用美國微軟公司的WD文檔編輯軟件進(jìn)行文字錄入和編輯排版在現(xiàn)今的同常工作中已經(jīng)成為一種十分普遍的現(xiàn)象用WD文檔取代紙質(zhì)文檔進(jìn)行文件的下發(fā)、傳遞也成為了一種必然的趨勢。然而WD本身提供的安全機(jī)制卻不足以強(qiáng)大到對所編輯文檔進(jìn)行全面保護(hù)的地步這就直接導(dǎo)致了一些文檔安全方面的問題不能得到完善的解決。而現(xiàn)有的安全系統(tǒng)產(chǎn)品又存在著成本較高、使用較復(fù)雜、不便于維護(hù)等缺點。本文針對以上這些現(xiàn)存的問題結(jié)合密碼學(xué)、數(shù)字簽名以及數(shù)字圖像水印等信息安全學(xué)方面的理論提出了一種離線的WD文檔保護(hù)平臺設(shè)計方案該方案在不使用基于網(wǎng)絡(luò)的公鑰基礎(chǔ)設(shè)施PUBLICKEYINFRASTRUCTUREPKI和證書中心CERTIFICATEAUTHITYCA進(jìn)行在線安全認(rèn)證的情況下可以保證保密文檔在傳播過程中的保密性提供了對于文檔來源真實性和文檔內(nèi)容完整性的認(rèn)證并通過對用戶身份和相應(yīng)權(quán)限的管理來控制文檔散發(fā)范圍進(jìn)一步提高了WD的安全性能。本軟件通過對WD對象模型的二次開發(fā)實現(xiàn)使用VISUALBASIC和VISUALC進(jìn)行混合編碼利用COM技術(shù)將其嵌入到WD程序中達(dá)到了增強(qiáng)WD的安全功能的目的。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 75
大小: 2.28(MB)
子文件數(shù):