版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、背景與研究目的 遺傳流行病學(xué)(genetic epidemiology)是近年來發(fā)展起來的一門邊緣熱門學(xué)科。主要是研究不同人群中影響疾病分布的遺傳因素和環(huán)境因素,并提出合理預(yù)防措施的學(xué)科。它的理論基礎(chǔ)是群體遺傳學(xué)和流行病學(xué),主要是應(yīng)用流行病學(xué)群體資料收集和處理的方法,以及分子遺傳學(xué)的實驗手段,借助生物統(tǒng)計學(xué)的有關(guān)原理和方法來研究和探索遺傳因素和環(huán)境因素對疾病的單獨作用以及他們對疾病的聯(lián)合作用。隨著國際人類基因組測序聯(lián)合體對人類基
2、因組DNA完成序列的分析,在人類基因組測序過程中隨著多態(tài)性序列標(biāo)志越來越被人們所發(fā)現(xiàn),尋找疾病基因的進度日益加快。對多基因疾病的研究已成為當(dāng)前和今后一段相當(dāng)長時間內(nèi)倍受關(guān)注的焦點。 迄今為止,對符合孟德爾遺傳規(guī)律的單基因遺傳病已經(jīng)建立了一套行之有效的研究體系并定位克隆了近千個致病基因。但對于多基因疾病由于其復(fù)雜的表型性狀,這些復(fù)雜的性狀雖然表現(xiàn)出一定的家族聚集傾向性,但并不完全符合孟德爾遺傳規(guī)律,所以在其易感基因的定位和遺傳分析
3、中仍存在很多問題,并成為近年來醫(yī)學(xué)遺傳學(xué)和基因研究的難點和熱點。而在研究人類遺傳相關(guān)疾病的研究過程中,利用家系結(jié)構(gòu)和群體調(diào)查資料進行連鎖分析、關(guān)聯(lián)分析或連鎖不平衡分析已成為基因定位的重要方法。但是由于遺傳學(xué)數(shù)據(jù)龐大,分析繁瑣,結(jié)構(gòu)復(fù)雜,用一般的統(tǒng)計學(xué)方法及軟件往往難以充分利用資料的信息。需要專門的遺傳統(tǒng)計軟件進行分析,目前遺傳流行病學(xué)統(tǒng)計分析軟件雖然較多,但是其綜合分析能力不強。 如對于參數(shù)連鎖分析可供選擇的軟件有FASTLIN
4、K,LINKAGE,VITESSE等,對于非參數(shù)連鎖分析可供選擇的軟件有GENEHUNTER,MERLIN,MELINK等。目前國內(nèi)遺傳流行病學(xué)研究正處于發(fā)展階段,在研究中大部分使用的是國外的遺傳統(tǒng)計軟件如LINKAGE,GENEHUNTER等,國內(nèi)已有的遺傳統(tǒng)計軟件為DOS系統(tǒng)的PPAP,但使用人的不多。由于我國人口龐大,人口學(xué)資料豐富,是一個研究人類遺傳信息很好的資源寶庫。目前國內(nèi)的情況是統(tǒng)計學(xué)與遺傳學(xué)沒有很好的結(jié)合,使得遺傳學(xué)者在
5、信息收集及資料分析時存在不少問題,如對于具體收集哪方面的資料,樣本量大小及使用何種遺傳統(tǒng)計方法等。使得資料信息不能得到充分利用,造成信息巨大的浪費,實在是一件令人遺憾的事。 由于多基因疾病其表型與基因型非嚴(yán)格一一對應(yīng)關(guān)系,因此在分析資料時,需用到多種分析方法,這也使得目前一些專門用于分析某種遺傳分析的軟件越來越暴露其應(yīng)用的局限性,且國外軟件一般為英文軟件,這使得遺傳學(xué)者要浪費大量的人力和物力去學(xué)習(xí)這些軟件,因此急需一個功能強大的
6、綜合性遺傳統(tǒng)計軟件。而遺傳流行病學(xué)統(tǒng)計分析軟件包SAGE<'[1]>(Statistical Analysis for GeneticEpidemiology)恰好滿足我們的需求。它是一個功能強大,能進行各類遺傳統(tǒng)計分析的綜合性軟件,由美國人類遺傳分析資源(Human Genetic Analysis Resource,HGAR)所創(chuàng)編。HGAR成立于美國Cleveland市Case Western ReserveUniversity(
7、CWRU)流行病學(xué)和統(tǒng)計系,由美國公共衛(wèi)生服務(wù)部門、NIH國立研究資源中心資助,該軟件由著名的統(tǒng)計遺傳學(xué)家R.C.Elston及其工作小組于1987研發(fā)而成的,該軟件隨著時間一直不斷更新版本,由剛開始的1.0版本到目前的5.3.0版本,其功能也在不斷增強之中,其在遺傳流行病學(xué)分析中的地位越來越受到重視。 研究方法 通過SAGE軟件自帶的5個example文件作為原始家系數(shù)據(jù)文件,導(dǎo)入各個功能模塊進行詳細(xì)分析,該SAGE共
8、有1個自定義模塊及18個功能模塊,共分為18個章節(jié)進行分別講述。其中18個功能模塊分別以以下4項內(nèi)容進行表述: 第1章:SAGE概述。給出了SAGE軟件的基本功能模塊的輸入輸出文件、運行環(huán)境和特點等信息。用戶安裝此軟件時需注意其對系統(tǒng)的要求。 第2章:SAGE數(shù)據(jù)文件的建立、編輯與整理。主要介紹了數(shù)據(jù)文件的3種建立方式,及項目的導(dǎo)入、導(dǎo)出和重命名等內(nèi)容。重點是數(shù)據(jù)文件的建立及導(dǎo)入。第3章:用戶自定義功能模塊。主要介紹了如
9、何創(chuàng)建基因組數(shù)據(jù)文件和建立新變量。重點內(nèi)容是建立新的變量。 第4章:SAGE的一般統(tǒng)計分析(PEDINFO)。主要介紹了PEDINFO的功能、原理及如何操作及對結(jié)果的解釋。重點內(nèi)容是對結(jié)果的解釋。以下的14個章節(jié)均是從模塊的功能、原理、操作過程及主要輸出結(jié)果等4個方面進行闡述。 第5章:非孟德爾遺傳統(tǒng)計分析(MARKERINFO)。主要用于檢測家系數(shù)據(jù)中的非孟德爾遺傳信息,幫助用戶對非一致性數(shù)據(jù)的檢測。前提是對孟德爾遺傳
10、定律有所了解。 第6章:親屬對的重新分類(RELTEST)。通過基因組多位點掃描數(shù)據(jù)對原有的親屬對進行重新歸類,主要是基于染色體血緣一致(IBD)等位共享原理。重點是對IBD及IBS有所了解,及對結(jié)果的解釋。 第7章:等位基因頻率估計(FREQ)。估計已知家系結(jié)構(gòu)的個體等位基因頻率及產(chǎn)生標(biāo)記位點描述文件。產(chǎn)生的位點文件可以用于GENIBD,MLOD及其他SAGE程序。該模塊的最主要作用在于輸出位點文件及可輸出近親系數(shù)。
11、 第8章:等位基因關(guān)聯(lián)或者數(shù)據(jù)性狀傳遞不平衡檢驗(ASSOC)。主要用于估計家系數(shù)據(jù)文件中性狀與協(xié)變量,此協(xié)變量可通過標(biāo)記表型轉(zhuǎn)換而來,估計家庭殘差相關(guān)系數(shù)或者遺傳度估計。需要注意的是對數(shù)據(jù)的兩種轉(zhuǎn)化的選擇。 第9章:家庭相關(guān)性分析(FCOR)。主要用于估計家系中所有相關(guān)對的多變量相關(guān)關(guān)系及他們的漸進標(biāo)準(zhǔn)誤。重點是對家庭內(nèi)相關(guān)對相關(guān)關(guān)系的結(jié)果的解釋。 第10章:混合分離分析與復(fù)雜分離分析(SEGREG)。主要用于在
12、所提供的家庭相關(guān)關(guān)系基礎(chǔ)上檢測和選定分離分析模型。其特性可為連續(xù)性,二分類特性或者年齡相關(guān)的二分類特性,產(chǎn)生可用于基于模型的連鎖分析的外顯率文件。重點是對不同特性所適合的模型的選擇的設(shè)定。 第11章:血緣同一等位基因概率產(chǎn)生模塊(GENIBD)。此功能模塊主要用于通過多種算法協(xié)調(diào)計算各種家系數(shù)據(jù)文件中不同相關(guān)對來產(chǎn)生單位點和多位點的血緣一致等位基因分布。重點是不同資料需選用不同的模型。 第12章:年齡相關(guān)發(fā)作分析(AGE
13、ON):適用于同時比較受累相關(guān)對與非受累相關(guān)對的年齡發(fā)作相關(guān)分布資料,允許通過協(xié)變量調(diào)整均值,方差或者偏度分布。需要注意的是如何合并資料。第13章:單體型分析(DECIPHER):主要是用于對于人群中常染色體或者X性染色體的單體型頻率的最大似然估計。前提是對單體型有所了解。 第14章:基于模型的單位點連鎖分析(LODLINK)。主要用于計算基于模型的主要特性與各個位點間的兩位點間的LOD值,主要特性可以是任何符合孟德爾傳遞的標(biāo)記
14、或者其他特性。重點是對主要特性及從SEGERG程序所產(chǎn)生的外顯率文件的命名。 第15章:基于模型的多位點連鎖分析(MLOD)。主要用于計算基于模型的小家系或者大家系的多位點間的連鎖分析。重點是基因組數(shù)據(jù)文件的產(chǎn)生及認(rèn)定主要特性。 第16章:患病同胞對連鎖分析方法(SIBPAL)??梢允菃挝稽c或者多位點的共享血緣一致等位基因信息,并且根據(jù)多位點基因同時使用二分類變量和連續(xù)性變量,同時包括上位交互效應(yīng)和協(xié)變量效應(yīng)。重點是不同
15、特性需進行相應(yīng)的設(shè)定。 第17章:受累同胞對的Lods連鎖分析(LODPAL)。程序進行連鎖分析是基于受累同胞對的Lods記分值,目前執(zhí)行一般條件logistic回歸模型。需注意對效能的設(shè)定。 第18章:傳遞不平衡檢驗(TDT)。程序中的TDT則是基于傳遞不平衡的基礎(chǔ)模型基礎(chǔ)上建立的用于分析前提是已知連鎖不平衡的情況下的標(biāo)記位點與疾病位點的連鎖關(guān)系,其疾病特性為二分類變量。前提是對TDT的原理的掌握。 結(jié)果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 流行病學(xué)數(shù)據(jù)統(tǒng)計分析策略講義
- 多元統(tǒng)計分析方法在流行病學(xué)調(diào)查中的應(yīng)用.pdf
- 流行病學(xué)標(biāo)點地圖統(tǒng)計分析方法體系的研究.pdf
- 醫(yī)學(xué)營養(yǎng)學(xué)統(tǒng)計分析軟件的開發(fā)及應(yīng)用
- spss統(tǒng)計分析軟件
- 基于時空掃描統(tǒng)計分析的心腦血管疾病流行病學(xué)研究.pdf
- 統(tǒng)計分析軟件sas應(yīng)用課程學(xué)習(xí)
- 統(tǒng)計分析軟件應(yīng)用題庫
- 應(yīng)用統(tǒng)計分析
- 統(tǒng)計分析與spss的應(yīng)用
- spss統(tǒng)計分析軟件簡介
- sas統(tǒng)計分析軟件簡介
- [教育]應(yīng)用統(tǒng)計分析實驗r軟件new
- 醫(yī)藥統(tǒng)計分析與軟件應(yīng)用教學(xué)大綱
- 統(tǒng)計分析與spss應(yīng)用論文
- 地質(zhì)統(tǒng)計分析系統(tǒng)的設(shè)計與開發(fā).pdf
- 統(tǒng)計分析與spss應(yīng)用論文
- 林業(yè)統(tǒng)計分析軟件的開發(fā)及其在林冠截留研究中的應(yīng)用.pdf
- 統(tǒng)計分析
- 統(tǒng)計分析
評論
0/150
提交評論