復雜性狀與基因組多位點的關(guān)聯(lián)分析方法研究.pdf_第1頁
已閱讀1頁,還剩131頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、影響復雜性狀的遺傳結(jié)構(gòu)包括很多基因,這些基因的順式及反式作用位置中的多個突變位點能夠相互互作共同影響復雜性狀。因此,多個位點的聯(lián)合分析比單個位點的分析能獲得更多的信息。單倍體型,即位于一條染色體上或某一區(qū)域內(nèi)的一組相關(guān)聯(lián)的SNP位點。顯然,對單倍體型進行分析為運用SNP信息探究遺傳性狀尤其是復雜性狀的遺傳機制提供了一條更加便捷、更加有效的途徑。因此本文研究單個基因的SNP互作的同時,利用單倍體型從基因組水平考慮非連鎖區(qū)域基因與基因的共同

2、作用。主要研究內(nèi)容及其結(jié)果如下:
   第一,基于半?yún)?shù)回歸模型的單區(qū)域多位點與復雜性狀關(guān)聯(lián)分析探討復雜性狀與某一區(qū)域功能位點的關(guān)聯(lián)定位備受關(guān)注。目前通常用的方法是單獨分析每一個區(qū)域的單個SNP,但這樣可能會由于位點SNP與性狀標記之間存在不完全的連鎖不平衡而導致分析結(jié)果效力降低。也有通過單倍體型等方法聯(lián)合分析這些位點,但如果有許多單倍體型時,可能會使單倍體型的分析方法的效能減弱。因此,我們基于Kwee等針對數(shù)量性狀基因座的半?yún)?/p>

3、數(shù)回歸模型,其模型能夠同時利用多個SNPs的信息且能考慮位點之間的連鎖不平衡,但相比現(xiàn)有多個位點聯(lián)合分析方法,維度能更低。針對Kwee等的模型缺陷,我們引入對缺失數(shù)據(jù)的處理。另外,通過逐步向下P值法篩選與數(shù)量性狀關(guān)聯(lián)的多個聯(lián)合SNP標記。人的前列腺癌是個普發(fā)的疾病,威脅著很多人的生命,備受世界關(guān)注。本節(jié)我們利用HapMap的公共數(shù)據(jù),對人前列腺癌通路上具有淋巴細胞表達數(shù)據(jù)的67個基因與339個候選基因進行順式與反式調(diào)控的分析,找出影響人

4、前列腺癌通路上基因表達的順式和反式作用因子,并進行通路分析。
   第二,基于參數(shù)回歸模型的多區(qū)域單倍體型與復雜性狀關(guān)聯(lián)分析復雜性狀的遺傳基礎(chǔ)包括很多基因,這些基因的聯(lián)合作用是很普遍的。因此同時考慮多個基因、多個區(qū)域是比較可取的。我們提出基于廣義線性回歸模型復雜性狀跟多個非連鎖區(qū)域的單倍體型聯(lián)合的關(guān)聯(lián)分析,通過打分統(tǒng)計來檢驗單倍體型效應的零假設(shè)。另外,通過多重檢驗最小尸值法獲得最好非連鎖區(qū)域多個位點的聯(lián)合。通過模擬研究檢驗我們提

5、出的方法的準確性和檢出效能,證實模型的有效性和對單倍體型互作的關(guān)聯(lián)分析的檢出率。對于沒有考慮其他協(xié)變量的數(shù)據(jù),通過跟軟件FAMHAP的htr和hapec模型比較得出,我們的方法在準確性和有效檢出率能與htr和hapee相當,甚至超過它們。另外,我們模型能考慮更多的性狀類型以及允許加入其他協(xié)變量。為了驗證我們方法的有效性,我們應用在有4個非連鎖侯選基因與豬肉質(zhì)的關(guān)聯(lián)分析中。
   第三,基于半?yún)?shù)回歸模型的多區(qū)域單倍體型與復雜性狀

6、關(guān)聯(lián)分析一般復雜性狀的遺傳模式都包括多個基因及它們之間的相互作用。我們提出一種新的統(tǒng)計方法即基于單倍體型水平找出影響某一連續(xù)性狀變化的基因組多個區(qū)域。我們提出的方法是使用具有核函數(shù)的半?yún)?shù)回歸模型,能夠同時考慮大量基因。此種方法比現(xiàn)有的方法能夠有效地達到降維的作用。對于參數(shù)的估計和非參數(shù)函數(shù)檢驗我們參照Liu等和Kwee等,即通過最小乘方核機器(LSKM)進行參數(shù)估計和通過打分統(tǒng)計進行非參數(shù)函數(shù)檢驗。為了獲得最好的基因或區(qū)域組合,通過逐

7、步向下P值法篩選。模擬研究證明這種方法的準確性以及檢驗多個基因的檢出效能。我們把這種方法應用到人前列腺癌通路的KLK3表達與339個候選基因的關(guān)聯(lián)分析中,找到影響KLK3表達的基因群,比上節(jié)單個基因的分析獲得更多的信息。另外,我們應用這種方法研究豬肉質(zhì)的遺傳機制。
   第四,基于半?yún)?shù)邏輯斯蒂核模型的多區(qū)域單倍體型與二類性狀關(guān)聯(lián)分析尋找新的統(tǒng)計方法來檢驗疾病的遺傳通路越來越受到關(guān)注。因為是一個通路中的基因傾向于彼此相互作用,如

8、果使用傳統(tǒng)的參數(shù)估計由于維數(shù)太大而不可行,使得用非參數(shù)方法更可取。通過核機器函數(shù)對高維基因組單倍體型信息擬合,我們提出了高效靈活的分析和檢驗基因組基因與疾病關(guān)聯(lián)的遺傳通路的半?yún)?shù)邏輯斯蒂模型。按照Liu等,我們把我們半?yún)?shù)模型轉(zhuǎn)化成邏輯斯蒂混合模型來表達,利用現(xiàn)有的統(tǒng)計軟件進行參數(shù)估計,對非參數(shù)函數(shù)檢驗采用打分統(tǒng)計。通過模擬研究證明這種方法準確性以及檢驗疾病遺傳通路的效能。這個方法應用在磷酸鹽治療下的多種骨髓瘤下巴骨壞死病人數(shù)據(jù)的通路分

9、析中。
   第五,基于半?yún)?shù)回歸模型的多區(qū)域單倍體型與縱向性狀關(guān)聯(lián)分析對于具有多次記錄的縱向數(shù)據(jù)研究中,能夠同時考慮影響性狀的時間及其他協(xié)變量是很重要的?;赯hang等研究縱向數(shù)據(jù)的半?yún)?shù)模型,我們把模型的參數(shù)固定效應用來擬合單倍體型和其他固定協(xié)變量效應,參數(shù)的估計按照Zhang等的方法,采用似然比檢驗來檢驗單倍體型效應。通過對我們改進的方法與一般的混合模型Haplo.stats和FAMHAP的htr模型進行模擬比較,證實對

10、動態(tài)性狀通過考慮多次采樣數(shù)據(jù)的時間效應比對單次采樣更能提高單倍體型效應的檢出率。我們通過這種半?yún)?shù)回歸模型研究豬具有多胎的繁殖記錄與MMP1和MMP10基因的單倍體型分析中。
   綜上所述,本論文針對基因組研究中存在的問題,建立了基于廣義線性模型研究復雜性狀與多個非連鎖區(qū)域單倍體型聯(lián)合的關(guān)聯(lián)分析、基于核函數(shù)的半?yún)?shù)回歸模型分析靜態(tài)與動態(tài)數(shù)據(jù)的遺傳模式。通過模擬研究證實了模型的可靠性,并將我們的模型系統(tǒng)應用到多個實際的例子中。本

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論