-
簡介:以VISUALFOXPRO60為開發(fā)平臺編制計算機軟件錄入古代醫(yī)案建立數(shù)據(jù)庫采用非條件LOGISTIC多元逐步回歸、偏斜主成分聚類和Φ相關(guān)分析使五臟疾病的辨證用藥統(tǒng)計規(guī)范化并發(fā)現(xiàn)腎在五臟關(guān)系中的重要調(diào)節(jié)作用還基于統(tǒng)計結(jié)果總結(jié)了五臟的發(fā)病規(guī)律、生理功能和解剖學基礎(chǔ)依據(jù)傳統(tǒng)中醫(yī)論述的精、氣、血、津、液的基本特征將陰精和陽氣分別定義為供能物質(zhì)和能流并基于陰陽五行關(guān)系建立五臟精氣生理模型和脾、肺疾病病理模型計算機數(shù)值仿真顯示五臟精氣的季節(jié)性周期變化與中國氣候變化的時空規(guī)律完全一致并獲得了區(qū)別虛實寒熱證候的不同頻譜從理論上證明了借助供能物質(zhì)和能流的檢測直接辨識五臟證候的可行性
下載積分: 5 賞幣
上傳時間:2024-03-12
頁數(shù): 176
大?。?4.44(MB)
子文件數(shù):
-
簡介:統(tǒng)計學習理論作為一種專門的小樣本學習理論針對模式識別和機器學習的實際問題在解決小樣本、非線性及高維模式識別等問題中表現(xiàn)出了許多特有的優(yōu)勢使模式識別、機器學習的理論向前邁進了一大步同時在其理論基礎(chǔ)上發(fā)展出了很多實際的學習方法支持向量機SVM就是最具代表性的一個它專門針對有限樣本情況得到現(xiàn)有信息下的最優(yōu)解很大程度上解決了模型選擇、過學習、非線性、維數(shù)災(zāi)難等問題目前已經(jīng)成為模式識別領(lǐng)域研究和應(yīng)用的熱點該文圍繞著支持向量機分類器的算法及應(yīng)用進行了一些探索性的研究該文重點針對支持向量機分類器算法中待解決的核函數(shù)問題、算法速度問題和多類支持向量機的設(shè)計問題以及支持向量機的一個重要的應(yīng)用領(lǐng)域人臉檢測問題提出了新的核函數(shù)、新的快速算法和多類支持向量機分類樹使SVM分類器在分類性能、推廣性和運算速度上都得到了提高并設(shè)計了一種結(jié)合膚色模型的兩層支持向量機人臉檢測系統(tǒng)使復(fù)雜背景下的多人臉檢測更準確和魯棒具有理論意義和實際應(yīng)用價值該文的主要工作與創(chuàng)新之處包括1提出了一種新的基于空間距離的支持向量機核函數(shù)MDGK核函數(shù)MODERATEDECREASINGGAUSSKERNEL2針對支持向量機分類器中兩類核函數(shù)即全局核函數(shù)和局部核函數(shù)進行研究和分析根據(jù)局部核函數(shù)的學習能力優(yōu)于全局核函數(shù)而推廣能力則劣于全局核函數(shù)的特點將兩者通過一定的系數(shù)結(jié)合成組合核函數(shù)從而使兩者在學習和推廣能力兩方面的優(yōu)點得以結(jié)合3提出了一種新的支持向量機快速算法基于殼向量的支持向量機算法HVSVM4提出了一種新的基于聚類的支持向量機迭代算法5提出了一種新的基于核聚類方法的多層次支持向量機分類樹6設(shè)計了一種結(jié)合膚色模型的兩層支持向量機人臉檢測系統(tǒng)統(tǒng)計學習理論和支持向量機在模式識別領(lǐng)域中已經(jīng)取得了很多成果建立了一系列較完善的理論體系和方法但也存在很多的尚未解決的理論和實際問題作為模式識別中十分值得進一步深入研究的領(lǐng)域它吸引著人們不斷地進行探索做出有益的嘗試使其在理論和應(yīng)用的道路上都得到持續(xù)的發(fā)展
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 125
大?。?4.13(MB)
子文件數(shù):
-
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 26
大?。?0.65(MB)
子文件數(shù):
-
簡介:電網(wǎng)是電力系統(tǒng)的物質(zhì)技術(shù)基礎(chǔ)、電力市場的物質(zhì)載體,地區(qū)電網(wǎng)是電網(wǎng)的重要組成部分。因受地區(qū)經(jīng)濟、政治等多種影響,地區(qū)電網(wǎng)建設(shè)的總體規(guī)模難以把握。如何科學評價地區(qū)電網(wǎng)建設(shè)的總體規(guī)模,指導(dǎo)資金合理部署,促使地區(qū)電網(wǎng)科學、合理、有序地發(fā)展,發(fā)揮地區(qū)電網(wǎng)建設(shè)的最大綜合投資效益,是電力市場環(huán)境下地區(qū)電網(wǎng)建設(shè)對電力規(guī)劃管理部門和電力研究人員提出的重要課題。本文提出以變電總?cè)萘?、變電站座?shù)和線路總長度、條數(shù)等為地區(qū)電網(wǎng)建設(shè)規(guī)模定量評估的評價因子下文簡稱“規(guī)模因子”;運用偏相關(guān)分析和灰色關(guān)聯(lián)度分析原理,確定對上述規(guī)模因子的主要影響因素包括全社會用電量及其用電構(gòu)成、最高負荷、人口、城鎮(zhèn)化率、GDP及其產(chǎn)業(yè)構(gòu)成、人均可支配收入等,明確各影響因素對規(guī)模因子影響程度及其規(guī)律;提出以影響因素對規(guī)模因子的灰色關(guān)聯(lián)度作為其相對影響程度的測度指標,以地區(qū)間在上述測度指標下的相似程度作為特征向量,運用模糊聚類原理進行地區(qū)分類;在此基礎(chǔ)上最終以層次分析法構(gòu)建出既具有明確針對性,又具有普遍適應(yīng)性的地區(qū)電網(wǎng)建設(shè)規(guī)模評價指標體系以及綜合評估模型。最后以統(tǒng)計年鑒數(shù)據(jù)為基本依據(jù),將文中所提出的評估指標體系及綜合評估模型應(yīng)用于湖南14個地市電網(wǎng)“九五”建設(shè)規(guī)模的量化評估。結(jié)果表明,本文所提出的地區(qū)電網(wǎng)建設(shè)規(guī)模評價指標科學、合理、客觀,可操作性強。其評價結(jié)論對電力市場環(huán)境下評估和指導(dǎo)電網(wǎng)建設(shè)各個方面協(xié)調(diào)建設(shè)以及合理規(guī)劃總體規(guī)模及其投資具有實際借鑒意義;同時,本文工作為地區(qū)電網(wǎng)建設(shè)規(guī)模的科學評價提出了一種有實際指導(dǎo)和借鑒意義的系統(tǒng)分析方法。
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 55
大小: 1.56(MB)
子文件數(shù):
-
簡介:背景非酒精性脂肪性肝炎NONALCOHOLICSTEATOHEPATITIS,NASH,是在本世界70年代由PETERS等首次提出。在臨床上,LUDWIG等將NASH分為原發(fā)性和繼發(fā)性。近年來,隨著人們膳食結(jié)構(gòu)的改變及生活水平的提高,糖尿病、肥胖的發(fā)病率在逐年增加,非酒精性脂肪性肝病NONALCOHOLICFATTYLIVERDISEASE,NAFLD的發(fā)病率也呈上升趨勢,并逐漸成為危害人類健康的三大肝病之一。而NASH作為NAFLD的中間演化階段,越來越引起人們的關(guān)注。隨著NAFLD的病程進展,當肝組織出現(xiàn)氣球樣變性、腺泡點灶狀壞死、門管區(qū)炎癥或(伴)門管區(qū)周圍炎癥時,提示病變已由單純性脂肪肝進展至NASH。當腺泡3帶出現(xiàn)細胞周圍竇周纖維化,擴展到門管區(qū)及周圍,出現(xiàn)局灶性或廣泛的橋接纖維化時,提示NASH患者發(fā)生不同程度的肝纖維化,并且可進展至肝硬化,甚至有少數(shù)患者發(fā)生肝功能衰竭和肝細胞癌HEPATOCELLULARCARCINOMA,HCC。目前認為NAFLDNASH可能已成為繼慢性病毒性肝炎乙型(HBV)、慢性病毒性肝炎丙型HCV后引起原發(fā)性肝癌的另一個重要危險因素。目前在肝硬化基礎(chǔ)上由NASH進展至肝癌人們已達成共識,而NASH,不經(jīng)過肝硬化而誘發(fā)肝癌目前國際上有少量文獻報道,NASH與肝細胞癌的關(guān)系,目前尚無明確結(jié)論。目的通過綜合分析現(xiàn)有文獻,證明NASH是否為HCC的危險因素。方法分別“NONALCOHOLICSTEATOHEPATITIS、FATTYLIVER、LIVERCANCER、NASH、HEPATOCELLULARCARCINOMA、NASHHCC、HCC、LIVERNEOPLASMAS、NONALCOHOLICSTEATOHEPATITISHEPATOCELLULARCARCINOMA、HEPATOM”為檢索詞,通過計算機檢索MEDLINE、OVID及PUBMED數(shù)據(jù)庫得到的1990至2013年發(fā)表的33篇文獻中共416例NASH基礎(chǔ)上發(fā)生肝癌患者的臨床資料進行匯總分析。采用SPSS170統(tǒng)計軟件對數(shù)據(jù)進行分析,對隨訪NASH患者中肝癌發(fā)生率與病毒性肝炎乙型患者5年肝癌發(fā)生率進行卡方檢驗。結(jié)果1本研究納入的416例NASH基礎(chǔ)上發(fā)生HCC病例中不經(jīng)過肝硬化而發(fā)生肝癌的占1779%,經(jīng)過肝硬化發(fā)生肝癌的占8221%,提示不經(jīng)過肝硬化NASH有發(fā)生HCC的可能2隨訪研究中NASH患者肝癌發(fā)生率高達167%,甚至高于乙肝人群中肝癌發(fā)生率44%,卡方檢驗二者比較有統(tǒng)計學意義P0000。3NASH基礎(chǔ)上發(fā)生HCC的病例,診斷HCC的平均年齡為6697歲,男性患者占5943%,男女患者之比為146∶1提示NASH中老年男性為高危人群4納入的416例NASH基礎(chǔ)上發(fā)生HCC患者中,伴有血脂異常的患者占2776%,伴有肥胖的患者占6761%,伴有高血壓的患者占383%,伴有糖尿病的患者占5913%,其中697%患者未列出上述情況,提示肥胖及糖尿病為主要的危險因素5本研究收入不分病因的3409例肝癌患者中,在NASH基礎(chǔ)上發(fā)生肝癌的占537%,是第3位致病因素6多數(shù)患者在常規(guī)體檢時發(fā)現(xiàn)HCC,可無任何癥狀。結(jié)論NASH可能為HCC的危險因素。
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 35
大?。?1.14(MB)
子文件數(shù):
-
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 46
大?。?1.48(MB)
子文件數(shù):
-
簡介:隨著網(wǎng)絡(luò)時代的來臨和自然語言處理技術(shù)在處理大量網(wǎng)絡(luò)信息文本中的廣泛應(yīng)用,自動、高效的中文組塊分析技術(shù)作為淺層句法分析的代表,成為了對信息進行處理與理解的關(guān)鍵技術(shù),對于語言信息處理領(lǐng)域及其相關(guān)應(yīng)用領(lǐng)域的研究具有重要的理論意義和應(yīng)用價值。大規(guī)模自然語言文本的獲取技術(shù)、機器學習方法和模型、以及語料庫語言學的逐漸發(fā)展和成熟,使得人們可以獲得大量的帶標記的文本和數(shù)據(jù),并能夠利用機器學習方法建立分析模型,對文本進行自動化的處理和標注。本文采用基于統(tǒng)計的機器學習方法,在建立中文組塊語料庫的基礎(chǔ)上,研究了統(tǒng)計機器學習方法在組塊分析中的應(yīng)用,提出了可以幫助模型進行有效識別的新特征,并將其融合到分析模型中,提升了中文組塊分析的性能,最終建立了具有詞法分析和組塊分析功能的一體化分析模型。本文研究的主要內(nèi)容包含以下四個部分第一,對于中文組塊的定義和語料庫建設(shè)方法進行研究,建立了三種基于不同要求和構(gòu)建方法的中文組塊分析語料庫。第一種語料庫構(gòu)建方法抽取了句法樹庫中的最底層非終結(jié)節(jié)點作為組塊,其可以作為完全句法分析的第一步分析使用;第二種語料庫構(gòu)建方法采用對于中文句法樹庫進行抽取和轉(zhuǎn)化的方法,設(shè)計和確定了組塊抽取規(guī)則、轉(zhuǎn)化規(guī)則和剪枝規(guī)則,并建立了中文CHUNKLINK語料生成算法,從賓州大學中文句法樹庫中抽取中文組塊分析語料;第三種語料庫構(gòu)建方法采用人工標注的方式,建立了中文組塊標注體系,在語言學家的指導(dǎo)下人工標注了專用于組塊分析任務(wù)的語料庫。采用不同方式進行組塊語料庫建設(shè),可以使得模型針對于不同的需求應(yīng)用合適的組塊分析語料庫。第二,對于組塊分析模型方法進行研究。利用組塊的邊界標記和類型標記將組塊分析問題轉(zhuǎn)化成為序列化標注問題,提出了基于統(tǒng)計規(guī)則和產(chǎn)生式模型的組塊分析方法;對最大熵馬爾科夫模型進行了改進,使其適合組塊分析任務(wù),并提出了基于判別式模型的組塊分析方法。在上述模型基礎(chǔ)上提出了基于條件隨機域模型的組塊分析方法,克服了產(chǎn)生式模型和判別式模型的不足。重點研究了條件隨機域模型訓練方法,構(gòu)建了模型的特征模板和系統(tǒng)框架,并分析了條件隨機域模型在解決組塊分析問題中體現(xiàn)出的融合不同類型的特征進行序列化標注的優(yōu)勢。引入錯誤驅(qū)動的NFOLD模板糾正后處理算法進行后處理,進一步提升分析模型的性能。第三,對于組塊分析模型中的特征選取問題進行研究。對于判別式模型中應(yīng)用的特征類型及特征抽取方法進行分析,并從特征的不同應(yīng)用效果中,研究了一般常用特征對于組塊分析的影響。重點研究了將新的分析特征融入到分析模型中以提升組塊分析性能。針對模型性能提升的瓶頸,設(shè)計了基于最小描述長度原則結(jié)合概念相似度計算的語義類自動抽取算法,將基于語義詞典生成的語義類特征引入分析模型,證明了語義類特征能夠有效地提升分析性能。針對自動詞性標注的錯誤對組塊分析帶來的級聯(lián)錯誤影響,設(shè)計了基于信息熵理論和層次聚類算法生成的詞類特征,和基于先驗類劃分算法生成的詞類特征,并將它們?nèi)谌氲椒治瞿P椭?。兩種組塊分析任務(wù)驅(qū)動的詞類特征是從語料庫中直接生成,其對于組塊標記具有更強的預(yù)測能力,而且能夠有效地避免自動詞性標注帶來的不良影響。第四,對于組塊分析的一體化模型建立問題進行研究。在建立組塊分析語料庫、分析模型的基礎(chǔ)上,提出了雙層條件隨機域模型的組塊分析一體化模型,模型將自動詞性標注的N個最佳的結(jié)果輸入到組塊分析模型中,在一定程度上抑制了自動詞性標注錯誤在組塊分析中的傳播和不良影響,提升了模型的性能。重點研究了利用任務(wù)驅(qū)動的新詞類特征代替原有的自動詞性標記特征,并在名實體識別和仿詞識別的基礎(chǔ)上,構(gòu)建新的組塊分析一體化模型,避免了自動詞性標注帶來的級聯(lián)錯誤,提升了模型的分析性能,也減少了模型的處理流程和分析時間,為組塊分析引入了一種新的處理模式和方法。利用受限向前向后算法引入可信度估計方法,對模型的輸出結(jié)果進行評價。
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 129
大?。?1.35(MB)
子文件數(shù):
-
簡介:概率推理與統(tǒng)計學習是從數(shù)據(jù)中發(fā)掘客觀事物之間關(guān)聯(lián)和內(nèi)在聯(lián)系的重要工具,是一個具有挑戰(zhàn)性與諸多困難的研究領(lǐng)域。本文對概率推理和統(tǒng)計學習的關(guān)鍵技術(shù)進行了深入探討,以幾何方法描述數(shù)據(jù)的幾何特性并與概率推理和統(tǒng)計學習方法相結(jié)合為主線和特色,研究了利用數(shù)據(jù)間幾何關(guān)聯(lián)性的線性和支持向量回歸方法、基于檢測時間序列幾何結(jié)構(gòu)的變結(jié)構(gòu)動態(tài)貝葉斯網(wǎng)絡(luò)自適應(yīng)學習、基于幾何模式相關(guān)的動態(tài)貝葉斯網(wǎng)絡(luò)、以及基于兩聚類幾何模型的聚類數(shù)目估計問題。主要研究工作總結(jié)如下1針對目前線性回歸和支持向量回歸方法尚未關(guān)注挖掘和利用單個變量的數(shù)據(jù)關(guān)聯(lián)性的問題,提出了幾何關(guān)聯(lián)學習方法GCLEAM以利用這種關(guān)聯(lián)性提高回歸模型的預(yù)測性能。幾何關(guān)聯(lián)學習方法預(yù)測性能的理論分析表明,該方法具有比傳統(tǒng)的線性回歸和支持向量回歸方法更好的預(yù)測性能,并給出了該方法的適用條件和判別準則。實驗結(jié)果也驗證了幾何關(guān)聯(lián)學習方法的有效性。該方法主要的創(chuàng)新點包括提出挖掘單個變量的數(shù)據(jù)之間幾何關(guān)聯(lián)的方法、在曲線水平的幾何回歸方法和利用幾何關(guān)聯(lián)的回歸模型預(yù)測方法。2提出了通過檢測時間序列的幾何結(jié)構(gòu)來自適應(yīng)學習變結(jié)構(gòu)動態(tài)貝葉斯網(wǎng)絡(luò)的方法AUTODBN,較好解決了從多變量時間序列數(shù)據(jù)中尋找較準確的模型區(qū)域和學習較準確的變結(jié)構(gòu)動態(tài)貝葉斯網(wǎng)絡(luò)的問題,并且求得的一系列模型自適應(yīng)于多變量時間序列之間的變化依賴關(guān)系。該方法克服了現(xiàn)有方法無專門機制尋找模型區(qū)域和盲目搜索的弱點,實驗結(jié)果表明其性能明顯優(yōu)于現(xiàn)有方法。具體的創(chuàng)新點包括設(shè)計了時間序列轉(zhuǎn)換為曲線流形的方法,提出了描述和檢測時間序列幾何結(jié)構(gòu)的方法來分割時間序列;進而設(shè)計了確定合理模型區(qū)域的尋找策略;最后,提出了基于競爭F檢驗的模型回訪機制修正求得的一系列模型區(qū)域和動態(tài)貝葉斯網(wǎng)絡(luò)模型的可能錯誤。3為了發(fā)現(xiàn)不同基因的表達水平在變化趨勢上相關(guān)的基因調(diào)控關(guān)系,提出了基于幾何模式相關(guān)的動態(tài)貝葉斯網(wǎng)絡(luò)方法GPDBN。該方法較好地解決了基于趨勢相關(guān)的基因調(diào)控關(guān)系的發(fā)現(xiàn)問題。真實基因表達數(shù)據(jù)的實驗結(jié)果驗證了該方法的有效性。該方法主要的創(chuàng)新點包括提出的將基因表達的時間序列轉(zhuǎn)換為幾何模式的方法可以描述基因表達水平隨時間上升與下降的變化趨勢,用幾何模式上的切向量表示幾何模式特征的方法來有效地獲取幾何模式的離散特征量、確定調(diào)控子和估計調(diào)控時滯。4針對在使用PAM聚類算法的基因表達數(shù)據(jù)聚類分析中現(xiàn)有估計類數(shù)方法在聚類結(jié)構(gòu)比較復(fù)雜的情況例如小聚類靠近大聚類和聚類間有輕微重疊下效果不佳的問題,提出了基于兩聚類幾何模型的系統(tǒng)演化方法這一類數(shù)估計方法。系統(tǒng)演化方法較好地解決了在基因表達數(shù)據(jù)的聚類分析中當小聚類靠近大聚類和聚類間有輕微重疊情況時的類數(shù)估計問題。實驗結(jié)果表明,系統(tǒng)演化方法在估計聚類數(shù)目的準確性上明顯優(yōu)于現(xiàn)有方法。系統(tǒng)演化方法通過分析所有潛在聚類中最靠近的兩個聚類孿生聚類是否可分來完成對整個聚類結(jié)構(gòu)的分析,并提出了兩聚類的幾何模型用于分析孿生聚類的可分性。同時,該方法將一個數(shù)據(jù)集視為偽熱力學系統(tǒng),提出了依據(jù)孿生聚類之間能量關(guān)系的系統(tǒng)演化規(guī)則確定最優(yōu)聚類數(shù)目。
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 110
大小: 5.43(MB)
子文件數(shù):
-
簡介:進入信息化時代,科技的發(fā)展以及人類生產(chǎn)、生活方式的改變,一方面極大地提高了信息傳播的時效性,另一方面也使“信息焦慮”現(xiàn)象充斥著社會的每個角落。基于統(tǒng)計學原理下的信息設(shè)計研究主要依據(jù)統(tǒng)計學的基本原理以及學科的交叉與融合,將由于信息源多元化而產(chǎn)生的分散、凌亂的信息進行邏輯化、層次化的處理,賦予了信息統(tǒng)計學的特性,這種信息設(shè)計的新方法協(xié)調(diào)了科學與藝術(shù)之間的關(guān)系,為信息的有效傳播起到了關(guān)鍵作用。本研究主要內(nèi)容包括⑴通過文獻綜述,對數(shù)據(jù)可視化和信息圖表設(shè)計的相關(guān)知識進行歸納分析,提取出信息設(shè)計有關(guān)的學科原理,為系統(tǒng)的建立統(tǒng)計性信息的研究框架奠定基礎(chǔ),確立信息設(shè)計與統(tǒng)計學之間的關(guān)聯(lián)性。⑵分析信息設(shè)計與視覺傳達之間的關(guān)系,并結(jié)合統(tǒng)計學的基本原理,對統(tǒng)計性信息的概念進行界定,依據(jù)統(tǒng)計學中秩序的限定和邏輯的分級原理總結(jié)出統(tǒng)計性信息具有三個主要特征邏輯思維形象化、信息結(jié)構(gòu)秩序化和時空展示全景化。⑶依據(jù)統(tǒng)計學的原理,對統(tǒng)計性信息進行科學的分類,功能的不同可分為描述類和推斷類,傳播媒介的不同可分為靜態(tài)類和動態(tài)類。兩種分類方法多角度、多層次的將研究對象進行劃分,明晰了統(tǒng)計性信息設(shè)計的研究領(lǐng)域,構(gòu)建起較為完備的信息設(shè)計結(jié)構(gòu)體系,并形成一種新的信息資源觀。⑷對統(tǒng)計性信息的設(shè)計流程進行探討,總結(jié)出信息的挖掘、統(tǒng)計學原理分析以及視覺呈現(xiàn)三大步驟,將信息進行視覺化的表現(xiàn),從方法論的角度總結(jié)出統(tǒng)計性信息設(shè)計的一般方法。此外,依據(jù)研究的系統(tǒng)分析,嘗試性的提出信息設(shè)計的發(fā)展趨勢為形象思維與邏輯思維的互動,從信息設(shè)計發(fā)展到知識設(shè)計。
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 62
大小: 7.88(MB)
子文件數(shù):
-
簡介:圖像挖掘是應(yīng)用數(shù)據(jù)挖掘技術(shù)實現(xiàn)圖像理解的多學科交叉研究課題,它融合了數(shù)據(jù)挖掘、圖像處理、計算機視覺、圖像檢索、機器學習、模式識別、數(shù)據(jù)庫與人工智能等研究領(lǐng)域。圖像挖掘的核心任務(wù)是從圖像底層特征中,高效的獲取高層圖像空間對象及其關(guān)系,提取出圖像序列中隱含的、先前未知的、潛在有用的知識、圖像關(guān)系或其它隱含的圖像模式。本文針對圖像的“語義鴻溝”問題,提出了圖像語義挖掘框架,分別研究了圖像語義層式統(tǒng)計模型、圖像語義對象獲取、圖像語義相似測度等內(nèi)容。并將以上研究成果應(yīng)用于圖像檢索,設(shè)計了XML驅(qū)動的圖像語義檢索系統(tǒng)原型。本課題是國家973項目“語義網(wǎng)格的基礎(chǔ)理論、模型與方法研究”子項目“基于AGENT的網(wǎng)格化服務(wù)組織與管理”的研究內(nèi)容之一,是該框架下“語義驅(qū)動的應(yīng)用服務(wù)”在圖像挖掘與檢索服務(wù)中的研究案例。本論文的主要研究結(jié)果與創(chuàng)新點包括1探討了用于縮小圖像“語義鴻溝”的語義層式統(tǒng)計模型根據(jù)圖像內(nèi)容不同的語義粒度,定義了四個層次的內(nèi)容描述機制圖像子塊層、元語義層、高級語義層和語義類別層。采用有限混合模型FMMS建立各語義層次之間的統(tǒng)計映射關(guān)系,利用優(yōu)化的EM算法自動返回FMMS的最優(yōu)模型結(jié)構(gòu),實現(xiàn)模型參數(shù)估計。層式語義分類實驗證明,該模型具有良好的圖像內(nèi)容描述性能,能有效的縮小圖像內(nèi)容的“語義鴻溝”。2設(shè)計了具有良好訓練性能的優(yōu)化算法HAB通過定義更為周全的評估函數(shù),獲取最優(yōu)化的權(quán)重更新值,使每一次迭代訓練都集中在最需要學習的樣本上,提高了訓練的效率,降低了訓練誤差;同時通過對已經(jīng)被正確分類的訓練樣本的性能評估,控制其權(quán)重在一個合理的范圍之內(nèi),避免了過擬合現(xiàn)象的出現(xiàn),提高了訓練的魯棒性能。通過與ADABOOST的比較性實驗,HAB算法在訓練誤差與抗干擾能力方面具有更好的性能。3給出了應(yīng)用HAB算法的圖像語義對象獲取方法,提高了圖像語義對象的識別性能。引入“特征致密區(qū)”與“特征稀疏區(qū)”的概念,通過圖像子塊采樣的方式描述訓練圖像的底層特征。對訓練圖像特征進行“兩級處理”,獲取用于訓練的“特征池”。利用HAB算法所具有的良好訓練效果,迭代訓練特定語義對象的識別器。通過實驗,訓練之后的識別器具有良好的語義對象獲取性能,識別精確度和返回率有了很大的提高。4研究了基于語義相似測度的圖像語義類別統(tǒng)計描述將圖像特征分為“核心特征集”與“輔助特征集”,基于以核心特征為主,其他特征為輔的模式,提出并定義了綜合度量圖像相似程度的“語義相似測度”準則。通過與底層相似度量方法的比較實驗,該度量方法提高了相似圖像的語義相關(guān)性。作為研究實例,為風景圖像定義了6個語義類別和9個核心元語義,通過“語義相似測度”,度量圖像與圖像、圖像與語義類別、語義類別與語義類別之間的相似程度,獲取了圖像語義類別的統(tǒng)計描述。5應(yīng)用圖像語義挖掘的方法,設(shè)計了XML驅(qū)動的圖像語義檢索原型將圖像內(nèi)容的層式描述、語義對象的自動獲取、語義相似測度等研究成果通過XML技術(shù)融入到圖像檢索系統(tǒng)中,增強了檢索系統(tǒng)的語義可拓展性,提高了圖像檢索精度,并為不同語義層次的檢索服務(wù)提供了條件。通過檢索實驗證明,系統(tǒng)具有很好的檢索精度與語義可解釋性。
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 120
大?。?4.17(MB)
子文件數(shù):
-
簡介:河北大學碩士學位論文基于模糊復(fù)隨機樣本的統(tǒng)計學習理論基礎(chǔ)姓名鄭莉芳申請學位級別碩士專業(yè)基礎(chǔ)數(shù)學指導(dǎo)教師哈明虎田大增20080501ABSTRACTABSTRACTSTATISTICALLEANLINGTHEORYHASBEENREGARDEDASOILEOFMEBESTMEORIESFORSMALLS鋤PLESSTATISTICALESTIMATIONA11DLEANLINGHOWEVER,ITISDIFFICULTTODEALWITLLTLLEPROBLEMSWHENSU岱玎FBM如ZZRCOMPLEXR觚DOMS鋤PLESFORITISBASEDONREALVALUEDRALLDOMS鋤PLESONTHEPROBABIL時SPACEIILTHISP印ER’STATISTICALLEANLINGT11EORYBASEDONMZ巧COMPLEX姍DOMSAHLPLESISDISCUSSEDFIRSTLY’TLLEDEFIILITIONOF舭碭,COMPLEXNUMBERSISINTRODUCEDAILDTHE如Z巧COMPLEX瑚IILDOMVARIABLESALONG瀝THTHEIRNUMERICCHARACTERISTICAREINVESTIGATEDSECONDLY,REC切NGULAR缸乙玀CORNPLEXM1IL】BERSAREMNHERRESEARCHEDA11DSOMEPROPERTIESANDIMPORTANTTHEOREMSAREESTABLISHEDME砒ILE,TLLESTRONGLAWOFLARGENUI】曲ERSBASEDON覦Z,COMPLEXMDOMVARIABLESISPR0VEDTILIRDLY,TLLEDEFILLITIOILSOFTLLE如ZZRCOMPLEXEXPECTEDRISK向NCTIONAL,也E缸巧C0MPLEXEMPIRICALRISKMNCTIOI謝,TLLE如ZZYCOMPLEXEMPIRICMRISKMIILIMIZATIONPRIILCIPLEANDTHESTRICTINCONSISTEMCONVE唱ENCEAREPROVIDEDANDDISCUSSEDFINALLY,THEKEYTLLEOREINOFSTATISTICALLEANLINGTHEOR,AILDTHEBOUND,WHENME向NCTIONALSETSARELIMITED,OFTLLERATEOFUILIFOMCONVERGENCEOFLE刪NGPROCESSBASEDON如ZZRCOMPLEXMDOMS鋤PLESISDISCUSSEDKEYWORDSREC切NGULAR如ZZ,COMPLEXMLILLBERS;如ZZRCOMPLEXRANDOMVARIABLES;如Z巧COMPLEXEMPIRICALRISKMINIMIZATIONPRINCIPLE;KEYTLLEOREM;BOUNDOFTHERATEOFULLIFORMCONVERGENCEII
下載積分: 5 賞幣
上傳時間:2024-03-11
頁數(shù): 34
大?。?0.86(MB)
子文件數(shù):
-
簡介:2010年度高校教師在職攻讀碩士學位論文1S工5154學校代碼10269學號91061201110葶震即筇天擎基于BAYES統(tǒng)計學習的語義圖像檢索研究院系值墾堂院讓簋扭型堂撞苤丕專業(yè)讓篡扭廑旦撞盔研究方向圖像處理指導(dǎo)教師王塹焦量4數(shù)援申請人割豎紅2010年10月DISSERTATIONOFUNIVERSITYTEACHERONJOBFORMASTER’SDEGREE2010STUDENTNO91061201110EASTCHINANORMALUNIVERSITYSTUDIESONTHESEMANTICIMAGERETRIEVALBASEDONSTATISTICALLEARNINGBAYESTHEORYVDEPARTMENTCOMPUTERSCIENCEANDTECHNOLOGYDEPARTMENTMAJORCOMPUTERAPPLICATIONTECHNOLOGYRESEARCHAREA堡壘G星£Q£曼墨墨I衛(wèi)GSUPERVISOR塹堡星£Q£壘衛(wèi)GKI塾型曼ISTUDENTNAMELIUYIHONGOCTOBER,2010要
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 78
大?。?2.16(MB)
子文件數(shù):
-
簡介:在醫(yī)學研究中經(jīng)常遇到零頻數(shù)過多的計數(shù)資料如亞健康癥狀數(shù)。此種數(shù)據(jù)表現(xiàn)為離散型資料其觀察值為零或正整數(shù)但是近半數(shù)甚至于大多數(shù)觀察值為零過多零頻數(shù)的存在使得數(shù)據(jù)過度離散。傳統(tǒng)的負二項回歸和POISSON回歸模型的擬合效果將受到影響在模型擬合過程中如果忽略這些零的存在對參數(shù)的估計就會產(chǎn)生偏差。在這種情況下可把原始數(shù)據(jù)集看成是由一個全零數(shù)據(jù)集和一個服從POISSON分布或負二項分布的數(shù)據(jù)集混合而成這就是零頻數(shù)過多的回歸模型簡稱ZI模型。已報道的關(guān)于ZI模型應(yīng)用的研究都是通過一個實際樣本探討ZI模型的應(yīng)用效果并與傳統(tǒng)的POISSON回歸和負二項回歸模型進行比較沒有一項研究能夠在各種零頻數(shù)比例下驗證ZI模型的擬合優(yōu)度探討零頻數(shù)比例多大時則過多及在何種零頻數(shù)比例下數(shù)據(jù)分布將不滿足傳統(tǒng)的POISSON回歸或負二項回歸模型的要求。本研究利用BOOTSTRAP方法在實例樣本中通過隨機模擬獲取各種比例零頻數(shù)的模擬樣本得到各種零頻數(shù)比例的隨機樣本探討各種比例零頻數(shù)時的最優(yōu)擬合模型解決零頻數(shù)比例何時過大而必須采用ZI模型的問題;同時研究ZI模型在亞健康癥狀數(shù)資料中的適用性。研究方法ZI模型產(chǎn)生的前提正是可以同時解決資料的過度離散和零頻數(shù)過多的問題。ZI模型可在醫(yī)學領(lǐng)域中用于估計一個兩階段的疾病進程其基本思想是把零事件的發(fā)生看做兩部分模型也包括兩部分第一部分來源于那些從未可能發(fā)生事件的個體或處于低風險個體模型參數(shù)的解釋和一般的LOGISTIC回歸相似說明協(xié)變量是否影響事件發(fā)生;第二部分來源于在POISSON分布或負二項分布條件下沒有發(fā)生事件的個體或處于高風險個體模型參數(shù)的解釋與傳統(tǒng)的POISSON回歸或負二項回歸一樣說明協(xié)變量影響事件發(fā)生多少的問題。本研究以亞健康癥狀數(shù)為響應(yīng)變量以性別、年齡、婚姻狀況、民族、職業(yè)、吸煙、飲酒、血壓高和肥胖為解釋變量用SAS92軟件分別對各種零頻數(shù)比例的BOOTSTRAP樣本擬合POISSON回歸、負二項回歸、ZI模型和序數(shù)回歸模型。用Α系數(shù)、O檢驗和VUONG檢驗等進行數(shù)據(jù)的過度離散性和零頻數(shù)是否過多的判斷并用回歸模型對各種計數(shù)值的預(yù)測概率及似然比、AIC、BIC等指標對各種模型的擬合優(yōu)度進行判定以選擇最優(yōu)的模型。研究結(jié)果在樣本量為11227的實際樣本中433%的受試者沒有陽性的亞健康癥狀離散系數(shù)Α為101395%CI為09651063可以認為Α顯著大于0對亞健康癥狀數(shù)進行過度離散性檢驗X290S385離散統(tǒng)計量O308011P在ZINB模型中從LOGIT部分可見年齡越高Β0436P各種零頻數(shù)比例的BOOTSTRAP抽樣模擬樣本中當零頻數(shù)比例小于15%時ZINB模型的擬合效果與傳統(tǒng)的負二項回歸模型相當ZINB模型未體現(xiàn)出擬合效果和結(jié)果解釋上的優(yōu)勢;而當零頻數(shù)比例在20%以上時ZINB模型的擬合效果明顯優(yōu)于傳統(tǒng)的負二項回歸模型此時綜合考慮擬合優(yōu)度、預(yù)測概率、結(jié)果解釋的合理性方面ZINB模型是最佳模型特別是當零頻數(shù)比例達到70%以上時ZINB模型對響應(yīng)變量的各觀察值的預(yù)測概率與實際頻率幾乎完全一致。當零頻數(shù)比例達到或超過85%時序數(shù)回歸模型的似然比和AIC等指標也較為理想但從模型對各種頻數(shù)的預(yù)測效果而言不管零頻數(shù)的比例大小如何序數(shù)回歸模型的預(yù)測效果與實測頻率均相差較大序數(shù)模型不是進行此類計數(shù)資料分析的最佳選擇。在任何零頻數(shù)比例時由于本樣本數(shù)據(jù)過度離散POISSON回歸的擬合效果都是最差的ZIP模型的擬合效果也不好。結(jié)論當零頻數(shù)的比例達到20%以上時各種模型預(yù)測概率、擬合優(yōu)度檢驗、過度離散性檢驗和零頻數(shù)過多檢驗結(jié)果均顯示ZINB模型是研究亞健康癥狀數(shù)資料的最優(yōu)模型為ZINB模型在零頻數(shù)過多的計數(shù)資料中的應(yīng)用提供了理論上的依據(jù)。
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 118
大小: 5.32(MB)
子文件數(shù):
-
簡介:一直以來電力系統(tǒng)負荷建模的研究者都希望建立既能充分反映負荷物理特性又便于工程應(yīng)用的負荷模型隨著負荷特性記錄和測辨儀器的推廣應(yīng)用大量現(xiàn)場實測數(shù)據(jù)被記錄用于負荷動特性的研究為建立準確的負荷模型提供了充足的動態(tài)數(shù)據(jù)為了挖掘?qū)崪y數(shù)據(jù)的未知信息本文利用綜合優(yōu)化算法程序?qū)C合負荷模型進行辨識然后分析了負荷動態(tài)綜合模型參數(shù)的統(tǒng)計學特性一方面利用經(jīng)典統(tǒng)計學在模型參數(shù)空間從數(shù)據(jù)挖掘角度來研究負荷的統(tǒng)計規(guī)律另一方面利用統(tǒng)計學習理論對能代表負荷特性的支持向量進行分析建立了其與負荷物理屬性的聯(lián)系揭示了支持向量能有效表征負荷樣本空間的原因本文還提出了一種基于模式識別、數(shù)據(jù)過濾的建模方法由于此法在建模過程中充分考慮了模型在不同電壓擾動下的結(jié)果因而所建模型具有良好的泛化能力
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 47
大小: 1.43(MB)
子文件數(shù):
-
簡介:中國海洋大學博士學位論文基于貝葉斯統(tǒng)計學習理論的高維空間模式識別研究姓名年睿申請學位級別博士專業(yè)海洋信息探測與處理指導(dǎo)教師姬光榮20070601思路。高維空間統(tǒng)計學習模式識別的研究,以高維空間幾何形體覆蓋思想為指導(dǎo),由模式選擇和參數(shù)學習兩個階段的學習任務(wù)組成,二者的共性在于都涉及到了多類別多維聯(lián)合概率密度函數(shù)模型的估計問題。模式選擇中,以高斯混合學習方式為基礎(chǔ),建立貝葉斯表示模型,針對具體問題求解自適應(yīng)學習算法和實現(xiàn)過程,確定目標標注,求解相關(guān)系數(shù),獲取更新方式以及停止條件等迭代學習方法的要素,得到高維空間數(shù)據(jù)在競爭學習下獲勝的具有相似性特征的類別標記信息。參數(shù)學習中,通過對高維空間幾何形體體積差異特性的分析,以高維空間局部點覆蓋思想為指導(dǎo),以同源同類樣本全體連續(xù)性規(guī)律為理論基點,以所設(shè)計的一種偶極子核函數(shù)作為多維聯(lián)合概率密度函數(shù)的表示模型,建立高維空間幾何形體覆蓋構(gòu)造方案,經(jīng)過完全數(shù)據(jù)的多目標多樣本多維聯(lián)合概率密度函數(shù)、似然函數(shù)及其數(shù)學期望函數(shù)的推導(dǎo),求解混合比例和協(xié)方差矩陣等參數(shù)的估計公式。通過神經(jīng)網(wǎng)絡(luò)的高維空間幾何分析,本文提出了基于貝葉斯統(tǒng)計學習理論的高維空間模式識別和姿態(tài)估計的神經(jīng)網(wǎng)絡(luò)實現(xiàn)方案。神經(jīng)網(wǎng)絡(luò)分層次混合集成模型實現(xiàn)對高維數(shù)據(jù)分布的精細覆蓋,獲取類別的最優(yōu)空間覆蓋認知,高維空間數(shù)據(jù)經(jīng)歷了從目標類別節(jié)點、典型樣本節(jié)點最終到內(nèi)部位置關(guān)系節(jié)點的一系列逐步求精的運動流向,最終獲得較為精細的認知結(jié)果。從應(yīng)用領(lǐng)域來講,本文在國家自然科學基金項目60572064的資助下主要進行了多類別多視點目標識別的工作。本文為探討基于貝葉斯統(tǒng)計學習理論模式識別方法在更多更廣范圍內(nèi)的普適性理論嘗試進行了部分基礎(chǔ)性的研究。關(guān)鍵詞模式識別;高維空間分析;貝葉斯理論;統(tǒng)計學J理I論;多維聯(lián)合概率密度函數(shù)
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 117
大?。?3.18(MB)
子文件數(shù):