版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著人類基因組計(jì)劃的發(fā)展,DNA微陣列技術(shù)作為一項(xiàng)革命性的技術(shù)應(yīng)運(yùn)而生。它可以自動(dòng)、快速、高效的檢測(cè)成千上萬(wàn)個(gè)基因的表達(dá)情況,通過(guò)分析所產(chǎn)生的基因表達(dá)數(shù)據(jù),可以在分子層面了解細(xì)胞的生理狀態(tài),如生存、增殖、分化、凋亡、癌變和應(yīng)激等等。這些問(wèn)題對(duì)于醫(yī)學(xué)臨床診斷、藥物療效判斷、解釋疾病發(fā)生機(jī)制等方面有重要的作用。 基因表達(dá)數(shù)據(jù)數(shù)目巨大且極其復(fù)雜,人們通過(guò)醫(yī)學(xué)影像學(xué)的方法很難直接對(duì)其做出解釋。因此,基因表達(dá)數(shù)據(jù)分類成為了生物信息學(xué)領(lǐng)域中
2、一個(gè)十分困難的問(wèn)題。早期,人們常常使用模式識(shí)別的方法,借助計(jì)算機(jī)的強(qiáng)大計(jì)算能力對(duì)其進(jìn)行分類,取得了一些成果。最近幾年,隨著機(jī)器學(xué)習(xí)算法在生物信息學(xué)領(lǐng)域的應(yīng)用日益廣泛,機(jī)器學(xué)習(xí)的算法作為一種新興的解決問(wèn)題的方法被不少學(xué)者提出,用于基因表達(dá)數(shù)據(jù)分類。但遺憾的是,由于基因表達(dá)數(shù)據(jù)特有的樣本少、特征多、非線性的特點(diǎn),直接使用機(jī)器學(xué)習(xí)的方法還存在著一定的困難。這主要是因?yàn)?1.過(guò)多的特征使得重要特征被眾多無(wú)關(guān)特征掩蓋,使得分類器難以學(xué)習(xí)。2.樣本
3、數(shù)目過(guò)少,使得大部分分類器出現(xiàn)過(guò)擬合現(xiàn)象。為了解決特征眾多的問(wèn)題,往往通過(guò)對(duì)原始數(shù)據(jù)進(jìn)行特征基因抽取以達(dá)到降維的目的;對(duì)于樣本少的問(wèn)題,常常采用分類器集成的方法來(lái)增強(qiáng)單個(gè)分類器的學(xué)習(xí)能力,從而提高分類的準(zhǔn)確率。 對(duì)于一個(gè)優(yōu)秀的基因表達(dá)數(shù)據(jù)分類系統(tǒng)而言,特征基因的選擇和分類器的集成是必不可少的兩個(gè)步驟。然而,這兩個(gè)步驟在實(shí)際應(yīng)用往往是孤立進(jìn)行的,前一個(gè)步驟并不能很好的為下一步奠定一個(gè)良好的基礎(chǔ),甚至有可能降低整體系統(tǒng)的分類準(zhǔn)確率。
4、 本文通過(guò)總結(jié)前人常用方法的優(yōu)缺點(diǎn),將特征基因的選擇與分類器的集成有機(jī)的結(jié)合起來(lái),提出了基于多特征的集成分類器方法。其算法思想如下:該方法首先使用不同的特征基因提取算法如相關(guān)性分析,Golub方法,t檢驗(yàn)方法等對(duì)數(shù)據(jù)進(jìn)行特征提取,得到樣本的多個(gè)特征子集。然后通過(guò)可重復(fù)采樣技術(shù),在不同的特征子集中抽取樣本形成訓(xùn)練子集。由于訓(xùn)練子集是在不同的特征子集中抽取的,所以具有更大的差異性。而后使用一組神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)這組特定的訓(xùn)練子集,為了保證
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- AdaBoost在基因表達(dá)數(shù)據(jù)分類中的應(yīng)用.pdf
- 基于集成分類器的數(shù)據(jù)流分類算法研究.pdf
- 分類器選擇集成及在基因數(shù)據(jù)分析中的應(yīng)用.pdf
- 基因表達(dá)數(shù)據(jù)的并行聚類及其集成分類研究.pdf
- 多分類器集成系統(tǒng)在基因微陣列數(shù)據(jù)分析中的應(yīng)用.pdf
- 基于分類器多樣性的集成分類器構(gòu)建算法及其在腦電信號(hào)分類應(yīng)用中的研究.pdf
- 基于多特征集成分類器的人臉表情識(shí)別研究.pdf
- 基于UFFT的數(shù)據(jù)流集成分類器研究.pdf
- 基于近鄰的多分類器選擇集成分類方法及在號(hào)牌識(shí)別上應(yīng)用的研究.pdf
- 特征分類器研究及其在圖像分類中的應(yīng)用.pdf
- 基于屬性選擇的集成分類方法在信貸評(píng)估中的應(yīng)用.pdf
- 多特征結(jié)合與支持向量機(jī)集成在圖像分類中的應(yīng)用.pdf
- 集成分類器模型的研究.pdf
- 集成分類器及其在個(gè)人信用評(píng)估的應(yīng)用.pdf
- 基于Bagging的兩階段特征選擇集成分類器研究.pdf
- 數(shù)據(jù)流集成分類器算法研究.pdf
- 基于粒子群優(yōu)化的集成學(xué)習(xí)方法在基因微陣列數(shù)據(jù)分類中的應(yīng)用.pdf
- 基于非平衡數(shù)據(jù)的適應(yīng)性采樣集成分類器的研究.pdf
- 基因表達(dá)數(shù)據(jù)的特征選擇及其分類算法研究.pdf
- 基于基因表達(dá)數(shù)據(jù)的腫瘤亞型多類別分類與分析.pdf
評(píng)論
0/150
提交評(píng)論