2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩122頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、研究背景: 經(jīng)驗似然是近幾年興起的一種非參數(shù)統(tǒng)計推斷方法,由于其對模型假設(shè)條件較少,而且在許多方面有著參數(shù)似然的性質(zhì),因而在統(tǒng)計學(xué)的各個領(lǐng)域得到了廣泛的應(yīng)用。然而,該方法在數(shù)據(jù)分布擬合效果并不明確,而且計算過程尚有不足之處,我們在這方面進行了探討。此外,我們研究發(fā)現(xiàn)對于重復(fù)測量數(shù)據(jù)的核平滑半?yún)?shù)模型,當(dāng)固定設(shè)計矩陣維數(shù)超過2時會出現(xiàn)不可逆的情況,這會導(dǎo)致估計的不唯一,而經(jīng)驗似然對回歸模型的誤差變異的適應(yīng)性提示我們可以引入經(jīng)驗似然

2、估計來規(guī)避該問題。 隨著Bayesian方法的計算技術(shù)的不斷改進,其應(yīng)用日益廣泛,從經(jīng)驗似然多方面與參數(shù)似然相似的性質(zhì)促使我們將經(jīng)驗似然納入Bayesian分析框架中,這方面的研究可以擴展經(jīng)驗似然進一步的應(yīng)用。 作為生物信息學(xué)一個重要研究方向--基因表達調(diào)控網(wǎng)絡(luò),已有眾多的模型描述其過程,特別是結(jié)構(gòu)方程的引入對參數(shù)的性質(zhì)、結(jié)果的解釋都提供了一個新的框架。然而,傳統(tǒng)的結(jié)構(gòu)方程對于誤差項的限制較為嚴(yán)格,而且如何利用已有的生物

3、學(xué)知識作為先驗的擴展性還不夠,而引入經(jīng)驗似然估計模型有可能解決這些問題。 方法:研究分三部分: ①對weibull分布的擬合,本文采用遺傳算法與經(jīng)驗似然結(jié)合的方法,應(yīng)用于不同參數(shù)和不同樣本量的模擬數(shù)據(jù),并比較最大似然和分位數(shù)估計:對于核平滑的半?yún)?shù)模型,我們結(jié)合嶺方法與經(jīng)驗似然方法來估計其參數(shù),并比較加入限制條件的最小二乘估計和經(jīng)驗似然估計的結(jié)果。 ②首先引入Bayesian分析的“合適似然”概念,并驗證在不同條

4、件下,經(jīng)驗似然能夠作為Bayesian分析的“合適似然”的把握程度;接著,提出隨機游走Metropolis算法計算經(jīng)驗似然后驗分布,并考察其性質(zhì),主要對最大估計似然進行了討論。進一步,我們采用經(jīng)驗似然的Bayesian分析方法研究線性回歸模型參數(shù)的估計,提出了與Metropolis結(jié)合的Gibbs算法估計后驗分布的參數(shù),分別對同方差和變方差的模擬數(shù)據(jù)進行了計算。 ③利用7個時期人胎兒發(fā)育的中樞神經(jīng)系統(tǒng)的10080個基因的芯片表達

5、數(shù)據(jù)進行了結(jié)構(gòu)方程模型的構(gòu)建。首先篩選大腦皮質(zhì)表達信息量最大的基因投射GO數(shù)據(jù)庫,最終確定與發(fā)育功能相關(guān)的候選基因集。接著,我們采用線性回歸模型的經(jīng)驗似然方法對參數(shù)進行估計,而模型結(jié)構(gòu)的確定則采用遺傳隨機算法進行,并應(yīng)用經(jīng)驗似然相關(guān)的AIC準(zhǔn)則作為判斷標(biāo)準(zhǔn)進行。此外,針對發(fā)育數(shù)據(jù)集我們先將基因表達分為平穩(wěn)表達和突然表達兩種模式,分別采用Lotka-Volterra方程和脈沖函數(shù)分別描述其相關(guān)基因的調(diào)控形式。 結(jié)果: ①對

6、于Weibull分布的數(shù)據(jù)擬合,對于大樣本模擬數(shù)據(jù)而言遺傳算法+經(jīng)驗似然估計效果與最大似然估計相當(dāng),但與序列二次規(guī)劃法的經(jīng)驗似然相比對初始值要求不高;而小樣本估計效果兩方法均不算好。關(guān)于重復(fù)測量的半?yún)?shù)模型,嶺方法+經(jīng)驗似然估計可以解決估計矩陣不可逆的問題,其殘差平方和比其他方法小,并且非參數(shù)項的估計優(yōu)于其他方法。 ②經(jīng)驗似然函數(shù)能作為Bayesian分析的似然部分與樣本量和估計參數(shù)有關(guān)系,在均數(shù)估計的情況下,樣本量越大其作為“

7、合適似然”函數(shù)的把握越大。利用這一結(jié)論,隨機游走的Metropolis算法能夠較好的模擬經(jīng)驗似然的后驗分布,其模擬分布的正態(tài)性得到驗證,所得到的后驗分布的樣本自相關(guān)性不高,并且后驗分布的均值與最大經(jīng)驗似然估計相當(dāng)。采用經(jīng)驗似然的Bayesian模型的線性回歸模型參數(shù)的估計,對于同方差模擬數(shù)據(jù)Gibbs算法結(jié)果與最小二乘估計相當(dāng),而對于變方差模擬數(shù)據(jù)經(jīng)驗似然方法的表現(xiàn)更好些。 ③整理人胎兒發(fā)育的中樞神經(jīng)系統(tǒng)基因芯片表達數(shù)據(jù),通過G

8、O數(shù)據(jù)庫最終篩選出30個候選基因,經(jīng)過500次循環(huán)的遺傳算法計算,獲得由9個基因組成的結(jié)構(gòu)方程調(diào)控網(wǎng)絡(luò),其中基因ACTG1作為外源性變量對其他基因的表達起到了抑制作用。利用相同的候選基因集,我們構(gòu)建了Lotka-Volterra方程調(diào)控網(wǎng)絡(luò),結(jié)果提示W(wǎng)ASF1和DCX對NOS2的表達表現(xiàn)為抑制作用,DCX和PRKCB1對FHL1的表達有促進作用。最后,我們利用聚類方法從10080個基因中篩選出2302個可能“突然表達”基因,通過脈沖函數(shù)

9、篩選出最有意義的四個基因:KIAA0332、PEG10、MYH11和FRAP1。 結(jié)論: 通過本文的研究結(jié)果,可得到如下結(jié)論: ①對于大樣本的參數(shù)模型經(jīng)驗似然擬合效果同最大似然估計相似,而利用遺傳算法可以解決初始值的選擇問題。而結(jié)合嶺方法的經(jīng)驗似然方法可以能夠解決估計矩陣不可逆的問題,并能作為核平滑半?yún)?shù)模型有效估計的方法。 ②在一定條件下,經(jīng)驗似然可作為Bayesian分析的似然部分,而隨機游走的Met

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論