-
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 46
大小: 1.19(MB)
子文件數(shù):
-
簡介:在漢語中,句子由連續(xù)的漢字組成,中文分詞完成句子從有字的序列轉化為詞的序列的任務。傳統(tǒng)的機械分詞方法基于人工維護的辭典,需要大量的維護成本。本文提出一種基于統(tǒng)計學習的分詞方法,以期在最小人工干預的條件下達到盡可能高的分詞性能。本文首先對中文分詞技術做了概述。指出了當前中文分詞領域中存在的一些難點問題,并對常見的分詞理論和技術進行了回顧,為論文的研究奠定了理論基礎。第三章詳細描述了本文提出的基于統(tǒng)計學習的分詞方法。該方法在傳統(tǒng)的統(tǒng)計方法基礎上做了亮點改進1、引入了基于對數(shù)似然比的漢字間關聯(lián)度描述,并與逐點互信息和信息熵相結合,提出了一種混合漢字間關聯(lián)度度量方法2、將常用的二元語法擴展為三元語法,提出了一種性能優(yōu)化的三元語法獲取和使用方法。根據(jù)不同自然語言處理應用對分詞的需求并不相同這一基本事實,本文第四章中提出了一種面向應用的分詞架構,將基于統(tǒng)計學習的分詞方法用于未登錄詞識別和分詞粒度調(diào)整。面向應用的分詞方法有效彌補了未登錄詞造成的損失,還可以根據(jù)不同應用的需求,切分出不同粒度的分詞結果。最后對系統(tǒng)進行了實驗及結果分析。最后對本文的工作做了分析總結,分析了系統(tǒng)的優(yōu)勢和不足,提出了下一步工作的方向。
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 66
大?。?3.11(MB)
子文件數(shù):
-
簡介:生物醫(yī)學文本信息抽取是生物醫(yī)學研究中不可缺少的環(huán)節(jié),有關生物醫(yī)學的最新信息大部分以文獻的形式存在,隨著統(tǒng)計學習技術和自然語言處理技術的發(fā)展,采用歸納統(tǒng)計的方法從文本中發(fā)現(xiàn)知識已經(jīng)成為可能。因此采用信息抽取技術從生物醫(yī)學文獻發(fā)現(xiàn)生物醫(yī)學知識是急需和有效的方法。近年來生物醫(yī)學文本信息抽取已經(jīng)取得了一定的成果,但是與新聞領域同類工作相比,平均性能相差近20個百分點。生物醫(yī)學領域的文本信息抽取任務很富有挑戰(zhàn)性,主要是由生物醫(yī)學領域文本的特點決定的。目前現(xiàn)有成果距離真正實用還有一定距離,其中最主要的問題就是識別的精確率和召回率還有待提高,尚不能滿足實用化的要求。本文以提高生物醫(yī)學文本信息抽取的性能作為目標,尋求新的識別策略,為推進生物醫(yī)學文本信息抽取的實用化做出貢獻。本文研究從如下幾個方面展開1研究了基于單分類器的生物醫(yī)學命名實體識別方法。該方法針對生物醫(yī)學命名實體特點選擇了豐富有效的特征集合,包括局部特征、全文特征和外部資源特征,提高了學習模型的學習性能。為了進一步提高系統(tǒng)的性能,本文還引入了縮寫詞識別、嵌套識別、邊界擴展和過濾器等后處理過程,從多方面結合多個策略來提高生物醫(yī)學命名實體的識別性能。2提出了基于元學習策略的多分類器融合模型,包括同態(tài)元學習模型和異態(tài)元學習模型識別生物醫(yī)學命名實體。同態(tài)元學習模型采用了BAGSTACKING模型并提出了將基分類器輸出的分類的置信度作為元分類器的輸入的一項特征來提高系統(tǒng)的性能。異態(tài)元學習模型使用兩種元學習策略包括疊加歸納法和級聯(lián)歸納法融合了四種不同的學習模型。實驗結果表明該模型能夠充分利用不同分類器識別能力之間的互補性和相關性以及多個層次的特征來提高整體識別性能。同時,打破了單一學習模型不能覆蓋生物醫(yī)學命名實體的所有特點,只能借助豐富的特征選擇和有效的后處理過程來提高系統(tǒng)性能的局限性,取得了比單分類器更好的識別結果。3提出了基于多AGENT系統(tǒng)學習的生物醫(yī)學命名實體識別方法。探索了將多AGENT系統(tǒng)學習方法引入到生物醫(yī)學命名實體識別中,以提高生物醫(yī)學命名實體的識別性能,包括基于多AGENT元學習框架和基于決策共現(xiàn)矩陣的多AGENT融合策略,實驗結果證明多AGENT系統(tǒng)學習是一種有效的生物醫(yī)學命名實體的識別方法,其中面向生物醫(yī)學命名實體識別的多AGENT元學習框架解決了語料分配不平衡的問題,提高了小類別和難識別類別的性能。4研究了基于元學習策略的分類器融合方法在蛋白質(zhì)相互作用關系識別中的應用。該研究的主要目的是通過分析蛋白質(zhì)相互作用關系的特點,選擇有效的特征集合,包括淺層語言學特征和深層句法特征,并選擇合適的學習模型來提高蛋白質(zhì)相互作用關系識別的性能;并在此基礎上提出了基于元學習策略的分類器融合方法,將基于淺層語言學特征模型和基于深層句法特征模型融合在一起,充分利用了基于不同特征模型學習結果之間的互補性和相關性,進一步提高了蛋白質(zhì)相互作用關系識別的性能。本文主要貢獻在于將多種統(tǒng)計學習方法應用于生物醫(yī)學信息抽取領域,對該領域中命名實體識別任務作了深入探索。提出了結合豐富領域特征、融合多個后處理模塊的基于統(tǒng)計學習的生物醫(yī)學命名實體識別方法;將基于元學習的多分類器融合策略引入生物醫(yī)學命名實體識別研究;將多AGENT系統(tǒng)學習引入到生物醫(yī)學命名實體識別研究;提出了一種融合生物醫(yī)學文本淺層語言學特征和深層句法特征的蛋白質(zhì)相互作用關系識別方法??傮w來說,本文在應用統(tǒng)計學習方法進行生物醫(yī)學文本信息抽取方法作了廣泛深入的探索,取得了較好的結果。這些研究對于文本信息處理領域的同類研究具有參考價值。同時,將有助于醫(yī)學研究人員對生命的探索、疑難病理的研究、有效藥物的開發(fā)等。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 149
大?。?1.11(MB)
子文件數(shù):
-
簡介:隨著我國經(jīng)濟的快速發(fā)展和人民生活水平的提高,住宅建筑節(jié)能已成為可持續(xù)發(fā)展的必然要求。如何通過科學的統(tǒng)計方法,全面分析住宅建筑能耗特征及其影響因素,并科學評價各城市住宅能耗現(xiàn)狀及相關因素對其的作用,對了解住宅建筑能源消耗的本質(zhì)特點、科學管理其發(fā)展變化、以及合理引導各城市住宅建筑節(jié)能有著重要意義。因此,本文根據(jù)統(tǒng)計學的相關理論,建立了住宅建筑能耗統(tǒng)計調(diào)查方法,根據(jù)該方法對五大建筑氣候區(qū)劃下典型城市的住宅建筑能耗進行了調(diào)查;并根據(jù)調(diào)查數(shù)據(jù),對各城市住宅建筑能耗特征和影響因素進行了較為深入的統(tǒng)計分析;建立了住宅住宅建筑能量信息系統(tǒng)評價模型對各城市進行了評價。文章首先定義了“住宅建筑能量信息系統(tǒng)”,該定義從住戶能耗量、住宅建筑概況、住戶基本資料、住戶能耗設備信息、運行狀態(tài)信息、以及建筑物外部條件等六個方面,全面反映了住宅建筑能耗特征和復雜的影響因素,以及各因素和能耗量之間的關系。根據(jù)“住宅建筑能量信息系統(tǒng)”的定義,結合我國五大建筑氣候區(qū)劃下的住宅建筑能耗、社會、技術等各自特點,提出了全國住宅建筑能耗統(tǒng)計調(diào)查方法。該方法包括調(diào)查指標、調(diào)查表格以及調(diào)查組織方式。調(diào)查指標全面反映了不同建筑氣候區(qū)劃下住戶能耗設備及能耗結構的特點,并將各指標科學地設計在調(diào)查表格之中。調(diào)查組織方式的確定有利于實際調(diào)查的開展。按照上述統(tǒng)計調(diào)查方法,對嚴寒地區(qū)的哈爾濱、烏魯木齊,寒冷地區(qū)的西安、北京,夏熱冬冷地區(qū)的上海、長沙、重慶,溫暖地區(qū)的昆明以及夏熱冬暖地區(qū)的香港等城市進行了冬夏兩季住宅建筑能耗調(diào)查。文章分析了各城市調(diào)查住戶的建筑概況、住戶基本資料、能耗設備信息及運行狀況等特征,以及冬夏兩季各城市住戶能耗量,并對各城市住宅建筑總體的冬夏兩季戶均能耗量進行了區(qū)間估計。此外,選取了長沙和邵陽兩城市進行了住宅建筑全年能耗調(diào)查及能耗特征分析,并利用分項能耗估算法對全年采暖空調(diào)、炊事熱水等分項能耗值進行了估算。在實測調(diào)查的基礎上,利用數(shù)量化理論I,從“住宅建筑能量信息系統(tǒng)”的建筑物內(nèi)部因素即建筑概況、住宅基本資料、住戶能耗設備基本信息、運行狀態(tài)信息等四方面,找出了各城市住宅建筑冬夏兩季能耗影響因素以及長沙、邵陽兩城市住宅建筑全年能耗影響因素,討論了各城市住宅建筑節(jié)能的有效途徑。數(shù)量化理論I的應用,不僅可以分析各定量、定性的影響因素,還可以分析各定性因素中不同類目的各自影響程度,從而克服了傳統(tǒng)多元統(tǒng)計分析方法的不足。對各城市影響因素的分析發(fā)現(xiàn),建筑概況、采暖空調(diào)設備及熱水器的使用、住戶人口、年收入、氣候等因素都能影響住宅建筑能耗。氣候相似的各城市的影響因素具有某些共性,但不同城市又有其自身特點,如影響因素有所差別,各因素的影響程度也不相同等。因此,必須根據(jù)該城市的實際分析結果,采取相應節(jié)能措施。為深入分析不同能耗量大小的各住戶能耗特點,文章進一步從住宅建筑能源消費的“基本單位”住戶的角度出發(fā),利用對應分析的方法,對各氣候區(qū)劃下的城市住戶按能耗量大小進行了聚類評價,找出了導致不同能耗量等級的對應原因,并為同一城市不同能耗量等級的住戶節(jié)能提出合理化建議。綜合評價住宅能量系統(tǒng)的優(yōu)劣需考慮多方面的因素。文章最后從住戶能耗量、建筑室內(nèi)熱環(huán)境、建筑內(nèi)部其他因素、建筑外部條件、生態(tài)環(huán)境效益和社會經(jīng)濟效益等六個方面系統(tǒng)的確定了城市住宅建筑能量信息系統(tǒng)的評價指標,根據(jù)數(shù)量化理論Ⅲ建立了城市住宅建筑能量信息系統(tǒng)綜合評價的數(shù)學模型,并對五大建筑氣候區(qū)劃下各城市住宅建筑能量信息系統(tǒng)進行了綜合評價。數(shù)量化理論Ⅲ的優(yōu)點在于,利用定性因素進行評價時,能根據(jù)實際情況,用0和1標記反應值,運用多元分析的原理和方法通過計算將定性數(shù)據(jù)量化,從而不需要專家主觀打分來量化定性數(shù)據(jù),克服了評分法或指數(shù)法的不足。本文的主要創(chuàng)新點在于1提出了住宅建筑能耗指標體系,從住戶能耗量、住宅建筑概況、住戶基本資料、住戶能耗設備信息、運行狀態(tài)信息、以及建筑物外部條件等六個方面全面定義了住宅建筑能耗特征以及影響因素;2在住宅建筑能耗指標的基礎上,建立了我國住宅建筑能耗統(tǒng)計調(diào)查方法。實施該方法能全面反映不同建筑氣候區(qū)劃下住戶能耗設備及能耗結構的特點。3對五大建筑氣候區(qū)劃下的各典型城市住宅建筑能耗進行了統(tǒng)一調(diào)查。該調(diào)查內(nèi)容全面,調(diào)查組織形式科學;各城市的調(diào)查方法和指標統(tǒng)一,便于各城市之間的對比;反映了我國五大建筑氣候區(qū)劃下城市住宅建筑能耗的各自特點。4將能耗統(tǒng)計調(diào)查方法的設計、統(tǒng)計調(diào)查、統(tǒng)計分析、節(jié)能評價四個連續(xù)的環(huán)節(jié)作為一個完整的研究體系,而將統(tǒng)計學理論作為貫穿每個環(huán)節(jié)的理論基礎。課題研究按照該研究思想展開,從而使得整個住宅建筑能耗研究工作有了理論指導。其中,利用數(shù)量化理論,找出了五大建筑氣候區(qū)劃下各城市住宅建能耗的影響因素;通過對應分析,在同一張主因子平面點聚圖中將各能耗量等級的住戶與該能耗量等級的影響因子進行了“可視化對應”。
下載積分: 5 賞幣
上傳時間:2024-03-11
頁數(shù): 178
大?。?12.11(MB)
子文件數(shù):
-
簡介:隨著社會和科技的發(fā)展,模式識別和計算機視覺在當前社會中的應用越來越廣泛,尤其是自美國911事件后,個人身份確認不僅僅使用于銀行金融、電子商務、公司考勤和家庭安全等領域,更多地提升到了一個國家的安全角度。在當前,應用于身份確認的生物特征主要有指紋、虹膜,人臉,掌紋等。人臉作為一種生物特征,由于其具有直觀簡單、信息量大和采集方便等優(yōu)點,越來越多的引起了廣大研究者的關注。在當前,基于人臉生物特征的應用領域包括自動人臉識別、視頻監(jiān)控、人臉表情分析、視頻會議和人機交互系統(tǒng)等,而在上述應用中,首先要解決的一個問題就是人臉檢測,其檢測效果直接影響到整個系統(tǒng)的性能。近幾年來,正是由于人臉檢測在現(xiàn)實應用中的廣泛性,已經(jīng)引起了越來越多的科研工作者的注意,已經(jīng)發(fā)展成為了一個獨立的研究方向。隨著人們對人臉檢測的不斷深入研究,出現(xiàn)了多種實用的人臉檢測算法。在本文中,我們針對現(xiàn)有算法各自優(yōu)缺點,結合考慮到現(xiàn)實中彩色圖像普及的事實,實現(xiàn)了膚色分割和基于統(tǒng)計學的分類器相結合的人臉檢測技術。首先通過膚色分割技術將可能的人臉區(qū)域從圖像中分割出來,形成人臉候選區(qū)域,然后使用基于統(tǒng)計學的分類器對所有的侯選區(qū)域進行確認,通過驗證的區(qū)域為人臉,從而實現(xiàn)了人臉檢測。具體的內(nèi)容包括1、對現(xiàn)有的膚色分割技術做了詳細的介紹,并且對常用的膚色模型在不同的膚色空間下的分割性能做了詳細的比較,通過對高斯膚色模型和簡單膚色模型各自的優(yōu)缺點比較,提出了結合兩者進行分割的模型,從而兼顧了效率和精度。2、實現(xiàn)了當前人臉檢測中應用最廣泛的兩種方法支持向量機SVM和ADABOOST算法,并將其和膚色分割算法相結合來實現(xiàn)彩色人臉檢測。對SVM使用不同的特征像素特征和PCA特征情況下的分類能力做了比較。3、提出了一種新的基于統(tǒng)計學中的分類器最小最大概率機和最小錯誤最小最大概率機的人臉檢測算法,通過結合膚色分割技術實現(xiàn)了對彩色人臉的檢測。同樣地類似于SVM對其在不同的特征情況下的分類能力做了比較。
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 82
大?。?16.6(MB)
子文件數(shù):
-
簡介:本文的工作是基于統(tǒng)計學習理論的虹膜識別研究。虹膜識別屬于生物識別技術的一種,是一項根據(jù)人眼睛中瞳孔之外鞏膜之內(nèi)的一個圓環(huán)內(nèi)部復雜的紋理特征來鑒別身份的技術。我們在詳細研究統(tǒng)計學習理論的最新進展和虹膜識別的主要特點的基礎上,圍繞虹膜特征提取、虹膜特征融合約減、分類器設計、虹膜識別系統(tǒng)原型設計等四個方面進行了較為深入的研究。本文對現(xiàn)行的虹膜識別已有方法進行了綜述,指出了現(xiàn)有虹膜識別研究的不足之處。并在此基礎上做出了以下貢獻第一項工作是在虹膜特征提取方面,提出并實現(xiàn)了基于分形幾何的自相似特征提取;并針對虹膜紋理分布的特殊性,研究了這種紋理變化的細節(jié)特征,發(fā)現(xiàn)了它的自相似性,提出了一種新的分形維數(shù)變化分數(shù)維,并給出了它的計算方法。變化分數(shù)維是在傳統(tǒng)分形幾何的基礎上,針對圖像內(nèi)部的豐富變化細節(jié)具有一定的自相似性而提出的,對瞳孔和眼睫毛的影響具有較好的抗干擾能力。實驗結果表明該特征比傳統(tǒng)的分形維數(shù)能夠更好地表征虹膜的紋理特征。除了虹膜識別之外,變化分數(shù)維也適用于其它的圖像分析場合;第二項工作是提出了虹膜特征融合約減機制。過去的虹膜識別方法一般都只有一種特征,主要是小波變換和GAB變換。而虹膜這么復雜的識別對象在有些情況下不能被一種特征值準確刻畫。為了獲取虹膜圖像紋理分布的方向性信息,引入了多尺度可變方向金字塔模型作為虹膜紋理方向性特征的分析工具,對各個方向進行濾波,分別求出每個子帶的特征,作為變化分數(shù)維的補充,從而得到虹膜的融合特征。為了獲得更精簡的特征序列,去除冗余特征,在特征約減方面,提出了基于多目標遺傳算法的虹膜融合特征約減方法;第三項工作是在構造虹膜分類器方面,過去的虹膜識別方法一般采用距離的方法包括歐幾里得距離和漢明距離來分類,或對碼本進行異或操作,這些都是簡單的計算方法。為了得到更高的識別率,我們將學習機制引入虹膜識別。同時考慮到在生物認證領域,錯誤接受和錯誤拒絕的代價是不一樣的,需要在訓練中進行區(qū)別對待。在安全性要求較高的應用中,對于錯誤接受的樣本應該比錯誤拒絕的樣本施以更大懲罰。因此為了適應虹膜識別等生物特征識別在不同安全等級中的應用,提出并實現(xiàn)了非對稱支持向量機NONSYMMETRICALSUPPTVECTMACHINE,NSVM作為虹膜樣本的分類器,以適應安全性要求不同的應用場合;第四項工作是基于所提出的算法與理論,實現(xiàn)了一個新的虹膜識別系統(tǒng)原型并命名為IRISPASSPT,在CASIA虹膜公開數(shù)據(jù)庫上做了測試,并與現(xiàn)有算法與理論進行了對比。在本文的第六章介紹了IRISPASSPT系統(tǒng)結構及其特性;我們的這些工作是提高虹膜識別系統(tǒng)性能的有益嘗試,實驗結果表明IRISPASSPT的性能基本上達到了實際應用的要求。最后對全文進行了概括性總結,并指出了理論和應用上有待進一步研究的方向。
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 111
大小: 3.76(MB)
子文件數(shù):
-
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 78
大?。?14.07(MB)
子文件數(shù):
-
簡介:該文主要目的是研究語音魯棒處理技術提高噪聲環(huán)境中語音切分的魯棒性然后在此基礎上具體實現(xiàn)語音庫建設輔助工具該文首先基于人類的聽視感知模型研究了語音信號的時頻分析方法構造了滿足聽覺感知模型的非均勻完全重構濾波器組完成了基于最大似然估計的子帶語音去噪算法實現(xiàn)了基于MDL最小描述長度的自適應平滑子帶語音魯棒端點檢測算法其次討論了基于隱馬爾可夫模型語音切的缺陷指出了韻律因素對語音切分的影響提出了語音魯棒切分的貝葉斯框架最后描述了標注圖的主要思想提出院了基于XML的語音標注體系結構并利用可擴展標注語音XML、VISUALBASIC和SQL實現(xiàn)了語音庫建設輔助工具的原形系統(tǒng)具體標注了孤立數(shù)字語音庫、邊疆數(shù)字串語音庫和用于說話人識別的特殊語音庫
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 115
大?。?1.64(MB)
子文件數(shù):
-
簡介:近年來隨著人類對海洋認識和探索的進一步深入加大對海洋信息的掌控在現(xiàn)實生活中顯得愈發(fā)重要其中對水面目標的自動識別就是最重要的課題之一。由于水面情況復雜不可預測的因素較多這給實現(xiàn)水面目標的自動識別帶來了相當大的困難。在基于目標輪廓特征提取與識別方面兩種傳統(tǒng)方法基于不變矩和基于PCA主分量分析是針對全局特征進行自動目標識別的由于是在模擬條件下進行的估計又由于ROI感興趣區(qū)域算法的定位不夠準確因此這兩種方法在識別時有很大的局限性。本文中我們首先對圖像模式識別的基本理論、方法及應用現(xiàn)狀進行了分析結合水面目標識別的要求對圖像預處理相關的內(nèi)容進行了研究主要針對脈沖噪聲的濾除和圖像分割兩方面進行探討并根據(jù)實驗結果的比對確定了圖像濾波和分割的方法。其次通過對基于不變矩和主分量分析的目標識別方法的研究及結果分析我們提出了一種基于目標局部特征的由逐塊的二維HADAMARD變換和高斯混合模型分類器組成的方法。實驗表明這種方法對目標超出視野范圍的情況有很好的魯棒性對由于深度的影響而產(chǎn)生的比例變化也有一定的魯棒性。傳統(tǒng)方法在進行目標自動識別時不變矩方法即使在較好的環(huán)境中識別效果也很差并且當目標超出視野范圍或被遮擋時影響更為明顯。PCA方法受比例變化和超出視野范圍的影響也很大而對噪聲和被遮擋有相對較好的魯棒性。最后本文針對目標識別過程中訓練和測試的輪廓角度由平面外的旋轉引起的不相符的情況通過使用幾個空間相距很遠的角度來實現(xiàn)訓練集合的擴展從而完成對目標的識別。
下載積分: 5 賞幣
上傳時間:2024-03-11
頁數(shù): 68
大?。?2.2(MB)
子文件數(shù):
-
簡介:隨著因特網(wǎng)的蓬勃發(fā)展、社會的數(shù)字化變革以及經(jīng)濟的快速發(fā)展,數(shù)據(jù)的規(guī)模正在以驚人的速度不斷增長。如何從大量數(shù)據(jù)中提取所蘊藏著的有價值信息變得越來越重要,由此,數(shù)據(jù)挖掘技術應運而生。數(shù)據(jù)挖掘算法也越來越受到人們的重視,其中許多算法和模型都建立在理想的數(shù)據(jù)集上,而現(xiàn)實中的數(shù)據(jù)集通常存在著數(shù)據(jù)不完整的情況,即數(shù)據(jù)記錄中含有缺失值的情況。對于缺失數(shù)據(jù),通常采用某種清洗方法對其進行處理,然后在處理后生成的完整數(shù)據(jù)集上進行數(shù)據(jù)挖掘。目前應用在缺失值插補上的方法有很多,它們各有其優(yōu)缺點。本文在對缺失值插補方法進行了大量研究和分析后,針對具有聚類特征的數(shù)據(jù)集提出了一種變量選擇、回歸預插補、聚類分析、回歸插補的缺失值清洗框架,該框架構成了基于統(tǒng)計學習的缺失值清洗方法。此外,針對本文提出的缺失值插補方法,在深入研究KMEANS算法的優(yōu)缺點后,提出一種改進的聚類算法。并在實現(xiàn)過程中提出了整個缺失值清洗過程的流程。最后分別在聚類數(shù)據(jù)集上、隨機數(shù)據(jù)集和真實數(shù)據(jù)集上進行了實驗。通過與其他缺失值插補方法在插補效果上的比較,實驗驗證了本文提出的方法的有效性。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 61
大小: 5.37(MB)
子文件數(shù):
-
簡介:布匹瑕疵檢測作為一種質(zhì)量保證手段目前主要通過人工來完成,工作強度大且效率低下,采用自動化的機器檢測成為一種合理的選擇。本文研究了布匹瑕疵自動檢測與分類的算法,主要工作如下奇異值分解SVD是一種有效的代數(shù)特征提取方法,本文首先研究了基于SVD理論的瑕疵檢測與分類算法。瑕疵檢測階段,充分利用奇異值分解所生成的奇異值和奇異值特征向量信息,實現(xiàn)瑕疵分割;提取瑕疵區(qū)域基于奇異值的特征,應用BP神經(jīng)網(wǎng)絡分類器實現(xiàn)瑕疵分類。針對布匹瑕疵的不規(guī)則形狀和紋理特征,本文研究了一種基于GAB小波網(wǎng)絡GWN和支持向量機SVM的瑕疵檢測與分類算法。應用GWN模擬逼近布匹圖像的背景紋理,構造最優(yōu)GAB濾波器,實現(xiàn)瑕疵分割;提取基于灰度共生矩陣的瑕疵特征,應用SVM實現(xiàn)了瑕疵分類,取得較好的檢測和分類效果。針對較難檢測的輕微瑕疵,本文又單獨研究了一種基于平穩(wěn)小波變換SWT和非下采樣方向濾波器組NSDFB的瑕疵檢測算法,將多尺度分解和多方向分解在兩個步驟中獨立的進行,允許在不同的尺度上選擇分解不同的方向數(shù),提供了一種靈活的多尺度和多方向展開,應用SVM構建二分類模型,實現(xiàn)瑕疵分割。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 76
大?。?3.11(MB)
子文件數(shù):
-
簡介:文化經(jīng)濟一體化已成為當代社會經(jīng)濟活動的顯著特征。隨著文化地理學的“經(jīng)濟轉向”,文化區(qū)及文化區(qū)劃研究逐步與經(jīng)濟發(fā)展相結合,文化區(qū)的功能性特征日趨明顯。文化區(qū)研究有助于從空間角度梳理地區(qū)文化脈絡,為地區(qū)政治決策、文化建設的空間布局規(guī)劃提供參考依據(jù),并有助于服務于其他專項文化研究。本文以浙江省為研究對象,通過總結歸納文化區(qū)劃理論方法,嘗試對浙江文化區(qū)空間特征進行研究,以期在一定程度上充實和拓展文化區(qū)、文化地理學領域的研究內(nèi)容。本文首先闡述了論文的研究背景及意義,對國內(nèi)外研究現(xiàn)狀進行了總括性述評,并對文化區(qū)空間結構、文化區(qū)劃方法、文化景觀概念進行了理性探討。然后選取浙江省國家級和省級文物保護單位和非物質(zhì)文化遺產(chǎn)為典型文化景觀,以傳統(tǒng)民居、傳統(tǒng)橋梁、民間信仰和歲時節(jié)慶為主導指標,通過對文化景觀的詳細分析和空間定位,得出四類專項文化區(qū)劃在此基礎上結合浙江自然地理和方言格局,采用圖形疊加方法,得出均質(zhì)結構下的浙江綜合文化區(qū)劃。同時以浙江文化景觀密度為數(shù)據(jù)基礎,運用地統(tǒng)計學方法生成浙江文化景觀密度分布圖,以此為基礎分析浙江文化空間的功能格局并將浙江綜合文化區(qū)劃與功能文化區(qū)進行比較,分析文化區(qū)之間的功能關系。最后從區(qū)域經(jīng)濟發(fā)展、旅游開發(fā)、文化資源開發(fā)、城市建設等角度出發(fā),提出浙江區(qū)域文化協(xié)調(diào)發(fā)展的空間格局。根據(jù)上述分析,本文得出以下結論1浙江可以劃分為浙北、浙東、浙中和浙南四個文化區(qū),其中浙北文化區(qū)以“水”文化為特色浙東文化區(qū)以“?!蔽幕癁樘厣隳衔幕瘏^(qū)以“山?!蔽幕癁樘厣?,并帶有閩文化的烙印浙中文化區(qū)面積最為廣闊,以過渡性文化為特色,帶有徽文化烙印。2浙江可劃分為分別以環(huán)杭州灣地區(qū)、寧波、金衢地區(qū)和溫州為核心的浙北、浙東、浙中和浙南四個文化功能區(qū),且文化功能區(qū)呈核心外圍過渡結構,外圍地區(qū)對文化中心有強烈的依賴性,存在文化過渡性特征明顯的邊緣區(qū)域。浙北、浙東、浙中文化區(qū)功能聯(lián)系緊密,形成一個文化功能整體,其中浙中深處環(huán)杭州灣地區(qū)腹地,實則是最具文化原生特征的地區(qū),浙南文化區(qū)則自成體系。3浙江均質(zhì)文化區(qū)與功能文化區(qū)格局大致重合。浙北文化區(qū)的功能與均質(zhì)結構高度重合浙中功能文化區(qū)相比均質(zhì)結構范圍縮小,說明金衢地區(qū)的文化中心作用并不顯著浙南功能文化區(qū)相比均質(zhì)結構明顯縮小,說明浙南文化功能區(qū)在全省呈收縮趨勢,文化功能作用弱化,以環(huán)杭州灣地區(qū)為核心的浙北、浙東和浙中文化功能區(qū)有擴張趨勢。4自然地理是浙江文化區(qū)形態(tài)的重要影響因素,其中地貌是浙江文化空間功能結構的主控制因子,水系是浙江文化空間功能結構形成的副控制因子。浙江歷史文化名城、浙江城鎮(zhèn)體系規(guī)劃、浙江產(chǎn)業(yè)體系規(guī)劃等浙江區(qū)域發(fā)展的空間布局成果,與浙江文化區(qū)在空間上大致對應,說明現(xiàn)代經(jīng)濟活動也對文化區(qū)形態(tài)產(chǎn)生影響,文化傳承與現(xiàn)代經(jīng)濟活動相輔相成、相互促進。5提出以環(huán)杭州灣地區(qū)、溫州為兩個文化主中心,以寧波和金衢地區(qū)為兩個文化副中心,以浙北、浙東、浙中和浙南文化區(qū)為四類文化發(fā)展區(qū)域的浙江區(qū)域文化發(fā)展的空間結構體系。論文還提出一些不足之處,主要包括由文化景觀范疇寬泛、界定模糊、分布不均帶來的文化區(qū)劃研究的偏差問題。最后提出文化區(qū)劃與城鎮(zhèn)體系、產(chǎn)業(yè)布局、文化產(chǎn)業(yè)、遺產(chǎn)保護等不同領域的規(guī)劃實踐相結合還值得進一步探索的未來展望。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 91
大小: 10.88(MB)
子文件數(shù):
-
簡介:20世紀90年代以來,信息科學的發(fā)展面臨著種種新的難題,主要包括知識表示、信息組織、軟件利用等。特別是由于因特網(wǎng)的快速發(fā)展,如何組織、管理和維護大量信息并為用戶提供有效的服務也就成為一項重要而迫切的研究任務。為適應這些要求,哲學領域的本體被引入信息科學領域,由于國內(nèi)外眾多學者的研究,已經(jīng)發(fā)展成為能在語義和知識層次上描述信息系統(tǒng)的概念模型建模工具,并在信息檢索、信息抽取、異構信息系統(tǒng)的互操作和集成、語義WEB等領域得到了廣泛應用。本文主要圍繞本體生成技術及本體的優(yōu)化方法進行展開。論文在分析當前經(jīng)典本體生成方法的基礎上,提出了基于FCA與統(tǒng)計學習相結合的本體生成算法,提出了在應用FCA相關理論生成概念格時的四個統(tǒng)計量,構造了基于FCA與統(tǒng)計學習相結合生成的概念格到本體的映射過程;基于FCA中概念格的現(xiàn)有理論,特別是繼承概念格理論,得出有關冗余概念的推論和優(yōu)化概念格的定義,從而形成了本體優(yōu)化算法的基礎;論文還對本體遷移學習進行了研究。通過以上本體生成及優(yōu)化過程,能夠得到比較理想的本體結構。最后本文給出了本體生成的框架模型和可視化本體生成平臺。通過本文提出的本體生成技術與方法,能夠準確地提取領域知識,建立結構清晰、重點突出的領域知識本體,對于有效組織、管理和維護大量信息,有效地從大量信息中提取關鍵知識具有重要意義。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 60
大?。?2.68(MB)
子文件數(shù):
-
簡介:數(shù)據(jù)挖掘是近幾年隨著數(shù)據(jù)庫和人工智能發(fā)展起來的一門新興技術,它從大量原始數(shù)據(jù)中發(fā)掘出隱含的、有用的信息和知識,幫助決策者尋找數(shù)據(jù)間潛在的關聯(lián),發(fā)現(xiàn)被忽略的因素。數(shù)據(jù)挖掘因其巨大的商業(yè)前景,現(xiàn)已成為國際上數(shù)據(jù)庫和信息決策領域最前沿的研究方向之一,并引起了學術界和工業(yè)界的廣泛關注。面對海量數(shù)據(jù),首要的任務就是對其進行歸類,聚類分析就是對原始數(shù)據(jù)進行合理歸類的一種方法。作為數(shù)據(jù)挖掘的一項重要功能,聚類分析能作為一個獨立的工具來獲得數(shù)據(jù)的分布情況,觀察每個類的特點,集中對特定的某些類做進一步的分析。此外,聚類分析也可以作為其它算法的預處理步驟。因此,聚類分析已經(jīng)成為數(shù)據(jù)挖掘領域中一個非?;钴S的研究課題。數(shù)據(jù)挖掘的相關文獻中已經(jīng)存在大量的聚類方法。然而,從目前來看,對數(shù)據(jù)挖掘中聚類方法的研究大都集中于計算機科學領域,更多注重聚類算法的研究,或者對現(xiàn)有聚類方法進行算法上的改進,而很少真正從統(tǒng)計學角度出發(fā)對數(shù)據(jù)挖掘中的聚類問題進行深入分析。本文嘗試從統(tǒng)計學視角出發(fā),以統(tǒng)計理論為基礎,以統(tǒng)計方法與算法的結合為基本思路,將一些現(xiàn)有的優(yōu)秀統(tǒng)計方法,如因子分析、對應分析、函數(shù)型數(shù)據(jù)分析等引入數(shù)據(jù)挖掘領域,使其能夠應用于海量數(shù)據(jù)的聚類分析。本文共分為六章,各章的內(nèi)容安排如下第1章介紹了本文的選題背景、研究內(nèi)容以及本文的主要創(chuàng)新之處。第2章首先簡單闡述了數(shù)據(jù)挖掘的定義、功能和常用技術,然后對當前數(shù)據(jù)挖掘中主要的聚類方法及其研究進展進行了綜述,并從聚類標準、類的標識、聚類算法框架三個角度對各種聚類方法進行了全面而深入的對比與總結。第3章通過對經(jīng)典Q型因子模型進行改進,克服了其算法效率上的困難,提出了一種新的海量數(shù)據(jù)聚類方法Q型因子聚類法,并將其成功應用于上市公司板塊分析,為投資決策提供幫助。第4章基于BENZéCRI對應分析的基本思路,結合Q型因子分析的思想,提出了數(shù)據(jù)挖掘中的對應分析聚類法。利用對應分析聚類法對移動通訊月度消費大型數(shù)據(jù)庫進行聚類分析,實現(xiàn)了移動通訊消費市場的細分。第5章借助函數(shù)型數(shù)據(jù)分析的基本思想和方法,建立了一個時序數(shù)據(jù)庫聚類分析的一般框架,并將這一方法擴展到多變量的情形,解決了多變量時序數(shù)據(jù)的聚類問題。將該方法應用到投資組合風險管理中,利用聚類結果進行資產(chǎn)選擇,有效地降低了組合投資風險。第6章對全文的主要工作進行了總結,并指出了本文的不足之處以及進一步研究的方向。本文嘗試在以下幾個方面有所創(chuàng)新1通過對經(jīng)典Q型因子模型進行改進,克服了其算法效率上的困難,提出了一種新的海量數(shù)據(jù)聚類方法“Q型因子聚類法”。2提出了數(shù)據(jù)挖掘中的“對應分析聚類法”。該方法既解決了Q型因子分析算法效率方面的問題,也解決了傳統(tǒng)對應分析法中缺乏客觀分類標準、信息損失嚴重等多種缺陷。3在對應分析聚類法的提出過程中,構造了對應分析中的標準化因子載荷陣,給出了對應分析中因子得分的求解方法,并首次將因子旋轉引入對應分析中,在一定程度上擴展了對應分析的方法和理論體系。4借助函數(shù)型數(shù)據(jù)分析的基本思想和方法,建立了一個時序數(shù)據(jù)庫聚類分析的一般框架,在這個框架之下,大量傳統(tǒng)的靜態(tài)聚類方法都可以被應用到時序數(shù)據(jù)聚類當中。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 115
大?。?5.24(MB)
子文件數(shù):
-
簡介:碩士學位論文碩士學位論文巖體裂隙分組的拓撲學及數(shù)理統(tǒng)計分析巖體裂隙分組的拓撲學及數(shù)理統(tǒng)計分析TOPOLOGICALSTATISTICALSTUDYONGROUPINGOFFRACTURESFJOINTEDROCKMASS韓小良韓小良2010年12月CLASSIFIEDINDEXTU44135UDC624DISSERTATIONFTHEMASTERDEGREEINENGINEERINGTOPOLOGICALSTATISTICALSTUDYONGROUPINGOFFRACTURESFJOINTEDROCKMASSCIDATEHANXIAOLIANGSUPERVISASSOCIATEPROFLEIWEIDONGACADEMICDEGREEAPPLIEDFMASTEROFENGINEERINGSPECIALITYCIVILENGINEERINGAFFILIATIONSHENZHENGRADUATESCHOOLDATEOFDEFENCEDECEMBER2010DEGREECONFERRINGINSTITUTIONHARBININSTITUTEOFTECHNOLOGY
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 79
大?。?1.84(MB)
子文件數(shù):