負(fù)相關(guān)的基因表達模式及其保守性研究.pdf_第1頁
已閱讀1頁,還剩133頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、基因表達數(shù)據(jù)提供了大量基因表達的信息,這些為理解生命的本質(zhì)起著重要作用?;虮磉_數(shù)據(jù)常見的處理方法包括識別差異表達的基因,聚類,雙向聚類和構(gòu)建基因調(diào)控網(wǎng)絡(luò)等等。盡管用這些方法也能夠挖掘出隱藏在基因表達數(shù)據(jù)里面的部分信息,但所獲得的信息相對而言還是較少,例如在癌癥的研究中,雖然使用了許多先進的方法,數(shù)據(jù)和手段來研究這些疾病,如癌癥和腫瘤基因圖譜(TCGA)數(shù)據(jù)庫等等,但是當(dāng)前對付癌癥依舊沒有較好的策略,這表明研究者對相關(guān)疾病還沒有獲得全部

2、的生物信息,需要反思當(dāng)前這些方法存在的問題。在基因表達數(shù)據(jù)中,絕大部分基因的表達是沒有明顯變化的,只有很少的一部分基因是差異表達的。在這些差異表達的基因中,有一部分基因的表達是上調(diào)的,另外一部分基因是下調(diào)的,這些上調(diào)基因與下調(diào)基因是否存在關(guān)聯(lián)?如果基因集V的兩個子集V1和V2在部分實驗條件或時間點中具有相反的表達趨勢,而且每個子集之內(nèi)的基因都具有相似的表達趨勢,那么就說子集V1和子集V2是一個負(fù)相關(guān)表達模式,簡稱負(fù)相關(guān)模式,如果這個負(fù)相

3、關(guān)模式在其他多個數(shù)據(jù)集中也存在,那么就說這個負(fù)相關(guān)模式是保守的(不變的)?;虮磉_譜中的負(fù)相關(guān)模式很少有學(xué)者進行深入系統(tǒng)探索。針對這些問題,本論文嘗試從負(fù)相關(guān)的思路出發(fā),對基因表達數(shù)據(jù)中上調(diào)和下調(diào)基因之間的這種相反變化趨勢,結(jié)合生物信息學(xué)的方法和生物學(xué)的理論,從以下幾個不同方面進行深入系統(tǒng)的探討。其主要研究內(nèi)容和結(jié)果如下:
 ?。?)設(shè)計識別負(fù)相關(guān)模式的算法:
 ?、僭O(shè)計了基于形式概念分析技術(shù)的負(fù)相關(guān)雙向聚類算法(NCFCA

4、算法),通過與其他算法比較表明,NCFCA算法在平均平衡率,平均皮爾森相關(guān)系數(shù)和聚類得分方面均優(yōu)于其他算法,能更多地識別出數(shù)目平衡的負(fù)相關(guān)模式。
 ?、跒榱四芴幚磔^大的基因表達數(shù)據(jù),本文利用CPU的多核并行技術(shù),設(shè)計了基于形式概念分析技術(shù)的并行負(fù)相關(guān)雙向聚類算法(NCFCA2算法),與NCFCA算法比較,NCFCA2算法在運行時間方面均大大優(yōu)于以前的NCFCA算法。
 ?。?)三個不同數(shù)據(jù)集中負(fù)相關(guān)模式及其保守性(不變性)研

5、究:
 ?、賹CFCA算法應(yīng)用于酵母菌細胞周期的alpha26,alpha30和alpha38三個時間過程的數(shù)據(jù)集,選取這三個數(shù)據(jù)集中的800個細胞周期調(diào)控基因通過分析處理之后發(fā)現(xiàn):微小染色體維持蛋白基因與核心組蛋白基因會形成負(fù)相關(guān)模式,而且這個負(fù)相關(guān)模式均發(fā)現(xiàn)于alpha26,alpha30和alpha38三個數(shù)據(jù)集。傳統(tǒng)的觀點認(rèn)為,負(fù)相關(guān)的兩組基因一般來說沒有功能上的相似性,然而將這兩組基因一起做基因集富集分析之后發(fā)現(xiàn),它們

6、表達相反的基因之間也具有顯著的功能相似性,這就表明參與同一生物學(xué)過程的兩組基因也可能具有相反的表達趨勢。將NCFCA算法應(yīng)用于酵母菌10個其它細胞周期過程的表達數(shù)據(jù)之后發(fā)現(xiàn),在這10個數(shù)據(jù)集中也發(fā)現(xiàn)微小染色體維持蛋白基因與核心組蛋白基因也能形成負(fù)相關(guān)模式。同時在最近出版的兩個高精度瓦片測序的基因數(shù)據(jù)集中也證實了這一觀點。這些發(fā)現(xiàn)表明這兩組基因形成的負(fù)相關(guān)模式可能是保守的。進一步分析它們的調(diào)控關(guān)系表明:這兩組基因形成保守的負(fù)相關(guān)模式的主要

7、原因很可能是由Clb-CDK1激酶是通過一個共調(diào)控和一個負(fù)調(diào)控來實現(xiàn)的,Clb-CDK1是在細胞周期過程的不同時期上調(diào)或下調(diào)這兩組基因的表達。
 ?、趯CFCA2算法應(yīng)用于酵母菌的2010.Shapira04和GSE26169這兩個氧化應(yīng)激響應(yīng)數(shù)據(jù)集,從這兩個數(shù)據(jù)集中各自選取所有通路基因的表達數(shù)據(jù)進行分析之后發(fā)現(xiàn):淀粉和蔗糖代謝通路中的部分基因和嘌呤代謝通路中的部分基因的表達曲線也是負(fù)相關(guān)的。也就是說,在環(huán)境應(yīng)激響應(yīng)數(shù)據(jù)中兩組通

8、路的基因也會形成負(fù)相關(guān)模式。將NCFCA2算法應(yīng)用于酵母菌10個其它環(huán)境應(yīng)激響應(yīng)數(shù)據(jù)集中分析之后發(fā)現(xiàn),這兩條通路中的部分基因也會形成負(fù)相關(guān)模式。這些發(fā)現(xiàn)表明這兩條通路基因之間的負(fù)相關(guān)模式可能是保守的。通過研究它們的生物學(xué)調(diào)控關(guān)系表明,這兩條通路形成保守的負(fù)相關(guān)模式的原因很可能是由雷帕霉素受體復(fù)合物1(TORC1)在蛋白酶體的輔助下是通過一個共調(diào)控和一個負(fù)調(diào)控來實現(xiàn)的。
  ③將NCFCA2算法應(yīng)用于酵母菌的熱休克響應(yīng)和氧化應(yīng)激響應(yīng)

9、的表達數(shù)據(jù)集,將這兩個數(shù)據(jù)集中基因的表達值按照方差由大到小排序,通過分別選取這兩個數(shù)據(jù)集中排名前1000的基因進行分析之后,發(fā)現(xiàn)核糖體蛋白基因與熱休克響應(yīng)基因;核糖體蛋白基因與氧化應(yīng)激響應(yīng)基因的表達曲線均是負(fù)相關(guān)的。將NCFCA2算法應(yīng)用于酵母菌其它的環(huán)境應(yīng)激響應(yīng)數(shù)據(jù)集中分析之后發(fā)現(xiàn),在這些數(shù)據(jù)集中核糖體蛋白基因和其它環(huán)境應(yīng)激響應(yīng)的基因也能形成負(fù)相關(guān)模式。這些發(fā)現(xiàn)表明這個負(fù)相關(guān)模式可能是保守的。進一步研究它們的生物學(xué)調(diào)控關(guān)系表明,核糖體

10、蛋白基因與不同環(huán)境應(yīng)激響應(yīng)基因形成的負(fù)相關(guān)模式,很可能也是由雷帕霉素受體復(fù)合物1(TORC1)在蛋白酶體的輔助下也是通過一個共調(diào)控和一個負(fù)調(diào)控共同作用,調(diào)控核糖體蛋白基因與環(huán)境應(yīng)激響應(yīng)基因的表達來實現(xiàn)的。
  綜合以上研究結(jié)果,表明NCFCA算法和NCFCA2算法能用較少的時間和空間花費,有效地識別基因表達數(shù)據(jù)中的負(fù)相關(guān)模式,特別是識別數(shù)目平衡的負(fù)相關(guān)模式。這些負(fù)相關(guān)模式經(jīng)過信息冗余過濾和基因集富集分析之后,發(fā)現(xiàn)只有少量負(fù)相關(guān)模式

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論