版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、生物信息學在分子診斷中的應(yīng)用,,,,第一節(jié) 生物信息學概論,生物信息學的定義 生物信息學研究的范疇,第一節(jié) 生物信息學概論一、生物信息學的定義,生物信息學是結(jié)合了生物學和信息技術(shù),利用計算機和互聯(lián)網(wǎng)技術(shù),分析海量的并且還在快速積累的生物數(shù)據(jù),從中獲取生物科學新知識的一門新的交叉科學。,人類基因組計劃的意義,人類基因研究的意義在于它可以支持和推動生命科學中一系列重要的基礎(chǔ)性研究。如基因組遺傳語言的破譯,基因的結(jié)構(gòu)與功能關(guān)系
2、,生命的起源和進化,細胞發(fā)育、生產(chǎn)、分化的分子機理,疾病發(fā)生的機理等。為推動醫(yī)學長足進步帶來前所未有的機遇,基因診斷、基因療法和基因藥物的開發(fā),有可能成為未來醫(yī)學發(fā)展的重要分支。人類基因組計劃的進一步成功將促進生命科學與信息科學、材料科學的融合,從而帶動一批高技術(shù)產(chǎn)業(yè)的發(fā)展,第一節(jié) 生物信息學概論,第一節(jié) 生物信息學概論二、生物信息學研究的范疇,第一、各種生物數(shù)據(jù)庫的建立和管理; 第二、研究高效率的統(tǒng)計工具,分析算法,
3、 發(fā)展方便、快捷的分析程序; 第三、從海量的原始生物數(shù)據(jù)中發(fā)掘新知識。,第二節(jié) 計算機和互聯(lián)網(wǎng),計算機常識和互聯(lián)網(wǎng)常用搜索引擎文件的壓縮和解壓文件和數(shù)據(jù)的傳送編程和語言,第二節(jié) 計算機和互聯(lián)網(wǎng)一、計算機常識:硬件和軟件,計算機的主要硬件由中央處理器(CPU)、存儲器、輸入設(shè)備和輸出設(shè)備組成。 常用的操作系統(tǒng):windows 、UNIX 、Linux,第二節(jié) 計算機和互聯(lián)網(wǎng)二、互聯(lián)網(wǎng)和常用搜索引擎,WWW
4、是World Wide Web的縮寫,即通常我們所說的國際互聯(lián)網(wǎng),它的每個節(jié)點在邏輯上都與任何其他節(jié)點保持聯(lián)系,可以相互交換信息。,第二節(jié) 計算機和互聯(lián)網(wǎng)二、互聯(lián)網(wǎng)和常用搜索引擎,第二節(jié) 計算機和互聯(lián)網(wǎng)三、文件的壓縮和解壓,傳輸或保存較大的數(shù)據(jù)時,常對文件進行壓縮,以減少數(shù)據(jù)量。特別是對于圖形文件,壓縮尤其重要。在UNIX或Linux系統(tǒng)中,壓縮命令是compress myfile,壓縮后的文件自動加上后綴.Z。解壓
5、縮命令是uncompress myfile.Z。 PC機上的Windows操作系統(tǒng)沒有標準的壓縮和解壓軟件,但網(wǎng)上有許多針對Windows的免費或代免費試用期的壓縮軟件,如FreeZip、WinZip等,第二節(jié) 計算機和互聯(lián)網(wǎng)四、文件和數(shù)據(jù)的傳送,用戶需要遞交一條或多條核酸或蛋白質(zhì)序列去做數(shù)據(jù)庫查詢或比對。這時常用的方法有:使用視窗系統(tǒng)的剪切、復制和粘貼的功能.對于不太長的序列,這 種方法比較方便;網(wǎng)頁的輸入
6、窗口旁常有一個“瀏覽目錄”按鈕,點擊該按鈕,會彈 出一個對話框,找到需要上傳的序列文件,再按“提交”鈕完成遞 交。用這種方法可以一次遞交較長的序列;有些大型信息中心和研究單位還有遠程文件傳送服務(wù),即遵從文件 傳輸協(xié)議 (file transfer protocol,ftp)的服務(wù)器地址,用戶可以無記 名的方式訪問公用的目錄,讀取文件,下載軟件或數(shù)據(jù)。,第二節(jié) 計算機和互聯(lián)網(wǎng)五、編程和
7、語言,在眾多的計算機語言中,C語言無疑是最常用的,它具有 代碼精煉,執(zhí)行效率高的特點,網(wǎng)上還有大量的現(xiàn)成模塊 供免費使用。 對于非計算機專業(yè)人員,還可以選擇Visual BASIC(VB) 語言。VB語言具備了高級語言的特點,語句結(jié)構(gòu)類似自然 語言,對于生物背景的專業(yè)人員可能較容易掌握。 如果在研究中大量使用網(wǎng)絡(luò)資源,則需要掌握一定的網(wǎng)絡(luò) 編程語言,例如:Perl語言、PHP語言和JAVA語言等,第三節(jié)
8、 數(shù)據(jù)的獲得,DNA、RNA、蛋白質(zhì)的測序 蛋白質(zhì)結(jié)構(gòu)的分析 基因和蛋白質(zhì)的表達數(shù)據(jù) 蛋白質(zhì)相互作用,第三節(jié) 數(shù)據(jù)的獲得一、DNA、RNA和蛋白質(zhì)的測序,基因組DNA直接來源于細胞核基因組,它的組成包括 基因和基因間區(qū)域,基因序列中還包括內(nèi)含子和外顯子。cDNA是由mRNA逆轉(zhuǎn)錄而來,全長cDNA應(yīng)該包括5’端 非編碼區(qū),3 ’端的多聚腺苷酸序列和編碼序列。重組DNA序列是基因重組到質(zhì)粒、病毒和cosmid等載體
9、 后經(jīng)測序得到的DNA序列。,2009-4-28,2009-4-28,第三節(jié) 數(shù)據(jù)的獲得一、DNA、RNA和蛋白質(zhì)的測序,2009-4-28,第三節(jié) 數(shù)據(jù)的獲得一、DNA、RNA和蛋白質(zhì)的測序,2009-4-28,第三節(jié) 數(shù)據(jù)的獲得一、DNA、RNA和蛋白質(zhì)的測序,RNA的序列可以從基因組序列或cDNA序列推導出來;直接 的RNA測序涉及修飾核苷酸的識別,可通過質(zhì)譜分析獲得。 蛋白質(zhì)的序列可以通過DNA序列推導而
10、來,但從DNA序列 推導的蛋白質(zhì)序列不能反應(yīng)真實的蛋白質(zhì)序列情況,蛋白質(zhì) 測序主要依靠質(zhì)譜分析(mass spectrometry, MS)技術(shù),基本原 理是通過準確測定真空中的離子質(zhì)量或電荷量來測算出分 子組成。,2009-4-28,第三節(jié) 數(shù)據(jù)的獲得二、蛋白結(jié)構(gòu)的分析,X射線晶體學技術(shù):通過研究X射線對蛋白質(zhì)晶體的掃描后產(chǎn)生的衍射模式來測定蛋白質(zhì)的結(jié)構(gòu); 核磁共振譜法(NMR) spectroscopy):
11、該方法常用于較?。?lt;25kDa)的,可溶性蛋白質(zhì)結(jié)構(gòu)的測定; 有些蛋白質(zhì)很難結(jié)晶,不能用X射線晶體學技術(shù)測定,又太大而不能用核磁共振譜技術(shù)測定,其它技術(shù)方法:X射線纖維衍射技術(shù);電子顯微鏡(electron microscopy);環(huán)形雙色色譜技術(shù)(circular dichroism (CD) spectroscopy),2009-4-28,第三節(jié) 數(shù)據(jù)的獲得三、基因和蛋白質(zhì)表達數(shù)據(jù),表達文庫的測序 基因表達
12、連續(xù)分析技術(shù)(serial analysis of gene expression, SAGE) DNA芯片 雙向電泳分析技術(shù)(2D gel electrophoresis),2009-4-28,基因表達連續(xù)分析技術(shù)原理,第三節(jié) 數(shù)據(jù)的獲得三、基因和蛋白質(zhì)表達數(shù)據(jù),雙向電泳分析技術(shù)原理: 1個方向是SDS-聚丙烯酰胺凝膠 主要是把蛋白質(zhì)按照 分子量分開 ; 1個方向是等點聚焦 把蛋白質(zhì)按照等電點的不同分開 ,這樣
13、就可以把不同的蛋白質(zhì)盡可能的分開 。,2009-4-28,第三節(jié) 數(shù)據(jù)的獲得四、蛋白質(zhì)相互作用,1、遺傳學方法: 2、親和性方法: 親和色譜法(Affinity chromatography) 免疫共沉淀法(coimmunoprecipitation) 免疫共沉淀基本原理: 細胞裂解液中加入抗體,與抗原形成特異免疫復合物, 經(jīng)過洗脫,收集免疫復合物,然后進行
14、SDS-PAGE及 Western blotting分析。,2009-4-28,3、分子和原子法:X射線晶體法和核磁共振法 4、基于文庫法: 酵母雙雜交系統(tǒng)(yeast two-hybrid (Y2H)system),第三節(jié) 數(shù)據(jù)的獲得四、蛋白質(zhì)相互作用,酵母雙雜交系統(tǒng)的建立得力于對真核細胞調(diào)控轉(zhuǎn)錄起始過程的認識。研究發(fā)現(xiàn),許多真核生物的轉(zhuǎn)錄激活因子都是由兩個可以分開的、功能上相互獨立的結(jié)構(gòu)域(d
15、omain)組成的。例如,酵母的轉(zhuǎn)錄激活因子GAL4,在N端有一個由147個氨基酸組成的DNA結(jié)合域(DNA binding domain,BD),C端有一個由113個氨基酸組成的轉(zhuǎn)錄激活域(transcription activation domain,AD)。當GAL4分子的DNA結(jié)合域和上游激活序列(upstream activating sequence,UAS)結(jié)合,轉(zhuǎn)錄激活域則能激活UAS下游的基因進行轉(zhuǎn)錄。但是,
16、單獨的DNA結(jié)合域不能激活基因轉(zhuǎn)錄,單獨的轉(zhuǎn)錄激活域也不能激活UAS的下游基因,它們之間只有通過某種方式結(jié)合在一起才具有完整的轉(zhuǎn)錄激活因子的功能。,2009-4-28,,,轉(zhuǎn)化到,文庫中,重要生物信息中心 數(shù)據(jù)庫檢索工具,第四節(jié) 生物信息數(shù)據(jù)庫,2009-4-28,第四節(jié) 生物信息數(shù)據(jù)庫一、重要生物信息中心,美國國家信息中心 (National Center of Biotechnology Information,
17、NCBI)的GenBank (http:/ / www.nchi.nlm.nih.gov/web/GenBank/index.html); 歐洲分子生物學室驗室(European Molecular Biology Laboratory-European Bioinformatics Institute, EMBL-EBI) 的EMBL (http:// www.ebi.ac.uk/databases/index.h
18、tml); 日本 DNA數(shù)據(jù)庫 (DNA Data Bank of Japan, DDBJ) (http:/ / www.ddbj.nig.ac.jp/ ),2009-4-28,第四節(jié) 生物信息數(shù)據(jù)庫一、重要生物信息中心,最重要的蛋白質(zhì)氨基酸序列數(shù)據(jù)庫是瑞士的SWISS- PROT (http://au.expasy.org/sprot/); 蛋白質(zhì)數(shù)據(jù)庫PIR(Protein Informatio
19、n Resource),包含 所有序列已知的自然界中野生型蛋 白質(zhì)的信息 (http://pir.georgetown.edu); PDB蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫:收集由X射線衍射和核磁共振 技術(shù)測定的蛋白質(zhì)大分子三維結(jié)構(gòu)(http://www.rcsb.org/pdb)。,第四節(jié) 生物信息數(shù)據(jù)庫二、數(shù)據(jù)庫檢索工具,Entrez檢索工具:Entrez是美國國家生物技術(shù)信息中心(NCBI)提供的集成檢索工具
20、 http://www.ncbi.nlm.nih.gov/Entrez/ SRS(Sequence Retrieval System)檢索工具:是歐洲 分子生物學網(wǎng)EMBnet的主要數(shù)據(jù)庫檢索工具,可以從 EMBnet的主頁進入。 DBGET/LinkDB檢索工具:是日本京都工具大學建立的 GenomeNet數(shù)據(jù)庫,該數(shù)據(jù)庫主要針對代謝途徑。 http://www.genome.ad.jp/dbget/dbget_
21、manual.html。,第四節(jié) 生物信息數(shù)據(jù)庫二、數(shù)據(jù)庫檢索工具,圖16-1: NCBI網(wǎng)頁的Entrez界面,第五節(jié) 核酸序列分析,核酸序列的基本分析 核酸序列的比對分析和功能預測 開放閱讀框的分析 引物設(shè)計 向數(shù)據(jù)庫提交序列,第五節(jié) 核酸序列分析一、核酸序列的基本分析,核酸序列的分子量、堿基組成、堿基分布等基本分析: BioEdit (http://www.mbio.ncsu.edu/BioEdit/bioedi
22、t.html) ★DNAMAN (http://www.lynnon.com/) 限制性酶切分析 :限制性酶數(shù)據(jù)庫(Restriction Enzyme DataBase,REBASE) (http://rebase.neb.com ; ★ http://www.neb.com/rebase) 測序峰圖的查看、核實與修改 :Chromas,BioEdit,DNAMAN 測序結(jié)果需要識別與去除測序時使用的載體序
23、列 : VecScreen ( http://www.ncbi.nlm.nih.gov/VecScreen.html),第五節(jié) 核酸序列分析一、核酸序列的基本分析,EST序列進行電子延伸 : 將待分析的核酸序列(稱為種子序列)采用Blast軟件 搜索GenBank的EST數(shù)據(jù)庫,獲得與種子序列有較高 同源性的EST序列,一般要求在重疊40個堿基范圍內(nèi) 有95%以上的同源性,稱匹配序列; 將匹配序列與種子序列裝配成新
24、序列,即片段重疊 群分析(contig analysis); 再以新產(chǎn)生的序列為種子序列,重復上述過程,直 至沒有新的匹配序列為止。,,,,,,,,,,EST序列進行電子延伸,種子序列,第五節(jié) 核酸序列分析一、核酸序列的基本分析,對核酸序列進行電子基因定位 :利用序列標簽位點(Sequence Tagged Site, STS); 利用UniGene數(shù)據(jù)庫進行基因電子定位; 直接利用基因組序列進行基因電子定位。,★ N
25、CBI網(wǎng)頁的Map Viewer界面,第五節(jié) 核酸序列分析二、核酸序列的比對分析和功能預測,BLAST (Basic Local Alignment Search Tool)是基本局域聯(lián)配搜索工具;Blast 功能有:,NCBI網(wǎng)頁的BLAST界面,NCBI網(wǎng)頁的BLAST2 SEQUENCES界面,,,,第五節(jié) 核酸序列分析二、核酸序列的比對分析和功能預測,FASTA:根據(jù)用戶提交的單個序列進行
26、 數(shù)據(jù)庫搜索比對的程序。 網(wǎng)上服務(wù)器和電子郵件服務(wù): http://www.ebi.ac.uk/ mailto: fasta@ebi.ac.uk http://www.fasta.genome.ad.jp mailto: fasta@nig.ac.jp,第五節(jié) 核酸序列分析二、核酸序列的比對分析和功能預測,進行多序列聯(lián)配 :ClustalW: http://www.ebi.ac.uk/clustalw/index
27、.html, http://iubio.bio.indiana.edu/soft/molbio/align/clustal/, ftp://ftp.ebi.ac.uk/pub/software/dos/clustalw。ClustalX: CluastalW程序的UNIX版本,它使用X窗口圖形界面, ftp://ftp.ebi.a
28、c.uk/pub/software ftp://ftp-igbmc.u-strassbg.fr/pub/clustalX。對聯(lián)配結(jié)果進一步編輯,形成適于發(fā)表的形式,可用的軟件有:SeaView: ftp://biom3.univ-lyon1.frBOXSHADE: http://www.ch.embnet.org/software/box_form.html)CINEMA: http://ww
29、w.bioinf.man.ac.uk/dbbrowser/cinema2.1/cinema2hdr.html,第五節(jié) 核酸序列分析三、開讀框的分析,GT-AG法則:外顯子與內(nèi)含子之間的連接區(qū)序列高度保守,如大部分內(nèi)含子5’端起始的兩個堿基是GT,3’端最后兩個堿基是AG。 基因識別軟件,常用的有:★ORF Finder (http://ncbi.nlm.nih.gov/gorf/gorf.html )GRAIL (http:
30、//avalon.epm.ornl.gov/grainbin/ )GeneFinder (http://genomic.sanger.ac.uk )Glimmer (http://www.cs.jhu.edu/labs/compbio/glimmer.html/ )GenScan (http://genes.mit.edu/genscan.html )GeneLang (http://www.cbil.upenn.edu/gen
31、lang/),用GeneFinde進行開放閱讀框分析,用GeneFinde進行開放閱讀框分析,第五節(jié) 核酸序列分析四、引物設(shè)計,Primer Premier軟件:http://www.premierbiosoft.com Primer3軟件:http://www.genome.wi.mit.edu/cgi-bin/primer/primer3Oligo、Vector NT、Omiga等,第五節(jié) 核酸序列分析五、向數(shù)據(jù)庫提
32、交核酸序列,向EMBL提交數(shù)據(jù)的網(wǎng)絡(luò)表格可參見: http://www.ebi.ac.uk/subs/emblsubs.tml 向GenBank數(shù)據(jù)庫提交核酸序列可聯(lián)網(wǎng)進行 http://www.ncbi.nlm.nih.gov/GenBank/index.html 也可用Sequin軟件制作好序列提交文件,向NCBI 發(fā)送E-mail(gb-sub@ncbi.nlm.nih.gov)提交,,第六節(jié) 蛋白質(zhì)序列分析★
33、,蛋白質(zhì)基本性質(zhì)分析 蛋白質(zhì)功能預測 蛋白質(zhì)結(jié)構(gòu)預測 蛋白質(zhì)分子進化分析,第六節(jié) 蛋白質(zhì)序列分析一、蛋白質(zhì)基本性質(zhì)分析,蛋白質(zhì)的氨基酸組成、分子量、等電點等方面的分析 : OMIGA、DNAMAN、BioEdit、MacVector等 蛋白質(zhì)疏水性分析 :ProtScale, http://www.expasy.org/cgi-bin/protscale.pl 預測跨膜區(qū) : http://genome.c
34、bs.dtu.dk/services/TMHMM-2.0/ http://www.ch.embnet.org/software/TMPRED_form.html http://www.emblheidelberg.de/services/sander/predictprotein ftp://ftp.biochem.ucl.ac.uk。,用TMHMM 軟件預測的SARS-CoV 的E蛋白的跨膜區(qū),第六節(jié) 蛋白質(zhì)序列分析一
35、、蛋白質(zhì)基本性質(zhì)分析,預測信號肽:http://genome.cbs.dtu.dk/services/SignalP/ 蛋白質(zhì)亞細胞定位 :http://predict.sanger.ac.uk/nnpsl/,預測信號肽,預測信號肽,蛋白質(zhì)亞細胞定位,蛋白質(zhì)亞細胞定位,,第六節(jié) 蛋白質(zhì)序列分析二、蛋白質(zhì)功能預測,蛋白質(zhì)序列分析和功能預測的一般流程,,第六節(jié) 蛋白質(zhì)序列分析二、蛋白質(zhì)功能預測,磷酸化位點、糖基化位點,特殊的結(jié)
36、構(gòu)區(qū)(motif)的分析:PROSITE: http://www.expasy.org/prosite/BLOCKS: http://www.blocks.fhcrc.org/blocks/PFAM: http://www.sanger.ac.uk/software/pfam/PESCAN: http://www.isrec.isb-sib.ch/software/pfscanInterProScan: http://www
37、.ebi.ac.uk/interpro/scan.htmlSMART: http://smart.embl-heidberg.de/,第六節(jié) 蛋白質(zhì)序列分析三、蛋白質(zhì)結(jié)構(gòu)預測,蛋白質(zhì)的立體結(jié)構(gòu)數(shù)據(jù)庫PDB(Protein Data Bank): (http://www.umass.edu/microbio/rasmol) PDBFinder (http://www.sander.embl-heideberg.de
38、/pdbfinder) 蛋白質(zhì)分子模型數(shù)據(jù)庫(Molecular Modeling Database); 三維結(jié)構(gòu)顯示程序Cn3D (http://www.ncbi.nlm.nih.gov/structure),同源建模(Homology modeling)分析服務(wù) (http://www.expasy.ch/swissmod/sm_toppage.html) 常用的有以下幾個工具: TOPITS:
39、http://www.embl-heidelberg.de/predictprotein frsvr: http://www.mbi.ucla.edu/people/frsvr/frsvr.html THREADER: http://globin.warwick.ac.uk/~jones/,第六節(jié) 蛋白質(zhì)序列分析三、蛋白質(zhì)結(jié)構(gòu)預測,第六節(jié) 蛋白質(zhì)序列分析四、蛋白質(zhì)分子進化分析,DNAMAN ClustalW P
40、HYLIP(http://evolution.genetics.washington.edu/) PAUP MrBayes(http://morphbank.ebc.uu.se/mrbayes/ ) 親緣樹顯示程序: TreeView (http://taxonomy.zoology.gla.ac.uk/rod/treeview) Phylodraw(http://iubio.bio.indiana.edu/treea
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 生物信息學在分子進化中的研究.pdf
- 生物信息學在創(chuàng)新藥物研究中的應(yīng)用
- 生物信息學
- 生物信息學課件
- 生物信息學導論
- 生物信息學教案
- 生物信息學課程信息
- 生物信息學中的算法問題
- 生物信息學概論
- HMM及其在生物信息學中的應(yīng)用.pdf
- 56941.生物信息學在基因組學研究中的應(yīng)用
- 生物信息學 分子系統(tǒng)發(fā)育分析
- 生物信息學序列分析
- 基于生物信息學方法的系統(tǒng)異常診斷.pdf
- 計算智能方法在生物信息學中的應(yīng)用.pdf
- 生物信息學 期末復習
- 生物信息學考試大綱
- 生物信息學作業(yè)實驗
- 移動教學在生物信息學課程改革中的應(yīng)用
- 支持向量機在生物信息學中的應(yīng)用.pdf
評論
0/150
提交評論