版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、選擇性剪接是真核生物基因表達(dá)調(diào)控的重要方法,剪接位點(diǎn)的準(zhǔn)確識(shí)別是基因識(shí)別的關(guān)鍵問題,本論文圍繞選擇性剪接位點(diǎn)的識(shí)別這一重要問題展開研究。
首先,建立了選擇性剪接位點(diǎn)序列的正負(fù)樣本數(shù)據(jù)集。并通過分析數(shù)據(jù)集中相鄰選擇性剪接位點(diǎn)之間的距離,發(fā)現(xiàn)相鄰選擇性剪接位點(diǎn)之間的距離大多小于200堿基對(duì)(Base pair,bp),5’選擇性剪接位點(diǎn)之間的距離84%小于200bp,3’選擇性剪接位點(diǎn)之間的距離71%小于200bp。這表明選擇
2、性剪接位點(diǎn)兩側(cè)200bp范圍內(nèi)的序列對(duì)選擇性剪接事件的發(fā)生有重要的影響,選擇性剪接的保守信息就在此范圍之內(nèi)。
其次,統(tǒng)計(jì)了剪接位點(diǎn)序列的核苷酸分布情況、雙核苷酸出現(xiàn)頻率、剪接位點(diǎn)信號(hào)強(qiáng)度、GC含量等特征,發(fā)現(xiàn)真實(shí)的剪接位點(diǎn)序列存在著較強(qiáng)的保守性,而虛假剪接位點(diǎn)序列則接近于隨機(jī)序列。進(jìn)一步計(jì)算序列的信息熵,發(fā)現(xiàn)這種保守性在供體位點(diǎn)-5~+10范Ⅲ內(nèi)和受體位點(diǎn)-20~+5范圍內(nèi)表現(xiàn)的最為明顯,這可為以后的剪接位點(diǎn)識(shí)別工作提供指
3、導(dǎo)。
然后采用了經(jīng)典支持向量機(jī)(CSVM)和模糊支持向量機(jī)(FSVM)作為剪接位點(diǎn)識(shí)別算法。FSVM在一定程度解決了CSVM對(duì)噪聲樣本敏感的問題,但是常用的模糊隸屬度設(shè)計(jì)方法都賦予離類中心較遠(yuǎn)的樣本較低的權(quán)重,同時(shí)也降低了支持向量的權(quán)重,因此本文提出了一種新的模糊隸屬度設(shè)計(jì)方法,綜合考慮樣本到兩類的距離及樣本之間的關(guān)系,最終將噪聲樣本和支持向量顯著的區(qū)分開來。
最后確定了在剪接位點(diǎn)識(shí)別問題中表現(xiàn)最好的多項(xiàng)式核
4、函數(shù)作為非線性支持向量機(jī)的核函數(shù),并通過Voss方法將剪接位點(diǎn)序列映射成叫條二進(jìn)制序列。多項(xiàng)式核函數(shù)CSVM對(duì)人類供體和受體位點(diǎn)的識(shí)別精度分別為:82.86%和66.34%;對(duì)小鼠供體和受體位點(diǎn)的識(shí)別精度分別為:77.52%和76.46%。基于本文提出的模糊隸屬度發(fā)計(jì)方法的FSVM識(shí)別粘度有了大幅度的提升:對(duì)人類供體和受體位點(diǎn)的識(shí)別精度分別為:93.75%和84.64%;對(duì)小鼠供體和受體位點(diǎn)的識(shí)別精度分別為:90.33%和78.13%。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于支持向量機(jī)的基因剪接位點(diǎn)研究.pdf
- 基于支持向量機(jī)和極限學(xué)習(xí)機(jī)的功能位點(diǎn)識(shí)別.pdf
- 基于HOG特征和支持向量機(jī)的靜態(tài)手勢(shì)識(shí)別.pdf
- 基于特征融合和支持向量機(jī)的步態(tài)識(shí)別算法研究.pdf
- 基于NSCT和支持向量機(jī)的紋理特征識(shí)別方法研究.pdf
- 基于支持向量機(jī)的冷酸蝕圖像特征識(shí)別.pdf
- 基于情感幾何特征和支持向量機(jī)的人臉表情識(shí)別研究.pdf
- 基于支持向量機(jī)的表情識(shí)別.pdf
- 基于粗糙模糊和模糊粗糙聚類的支持向量機(jī).pdf
- 模糊支持向量機(jī).pdf
- 基于模糊支持向量機(jī)的森林火災(zāi)識(shí)別方法研究.pdf
- 基于模糊支持向量機(jī)和FCM的數(shù)字水印技術(shù).pdf
- 基于支持向量機(jī)的人臉特征選擇及識(shí)別研究.pdf
- 基于支持向量機(jī)的車型識(shí)別.pdf
- 模糊支持向量機(jī)在人臉識(shí)別中的應(yīng)用.pdf
- 基于支持向量機(jī)的步態(tài)識(shí)別.pdf
- 基于梯形模糊數(shù)的支持向量機(jī).pdf
- Ⅱ-型模糊支持向量機(jī).pdf
- 基于支持向量機(jī)的語音識(shí)別技術(shù).pdf
- 基于支持向量機(jī)的紙幣號(hào)碼識(shí)別.pdf
評(píng)論
0/150
提交評(píng)論