genbank數(shù)據(jù)庫檢索及其應用(2017)ppt_第1頁
已閱讀1頁,還剩106頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、,GenBank(Nucleotide)數(shù)據(jù)庫檢索及其應用,重慶醫(yī)科大學圖書館 李 軼,NCBI網(wǎng)站簡介,內 容,NCBI網(wǎng)站簡介,http://www.ncbi.nlm.nih.gov,,NCBI網(wǎng)站簡介,NCBI的任務,1,為儲存和分析分子生物學、生物化學、遺傳學知識創(chuàng)建自動化系統(tǒng) ;從事研究基于計算機的信息處理過程的高級方法,用于分析生物學上重要的分子和化合物的結構與功能; 促進生物技術研究者和醫(yī)藥治療人員對數(shù)據(jù)庫和軟

2、件的使用;促進全世界范圍內的生物技術信息收集的合作。,生物信息學網(wǎng)站,NCBI網(wǎng)站簡介,NCBI的任務,NCBI的資源與工具,1,2,,,,,數(shù)據(jù)庫,工具,數(shù)據(jù)提交,培訓,NCBI的資源與工具,,數(shù)據(jù)庫,NCBI的資源與工具,,,,分子數(shù)據(jù)庫,基因組數(shù)據(jù)庫,NCBI的資源與工具,文獻數(shù)據(jù)庫,,工具,NCBI的資源與工具,,,,檢索工具,數(shù)據(jù)分析工具,下載工具,程序軟件,,NCBI的資源與工具,,數(shù)據(jù)提交,NCBI的資源與工具,,,NC

3、BI的資源與工具,,培訓,NCBI網(wǎng)站簡介,GenBank數(shù)據(jù)庫檢索方法,內 容,GenBank數(shù)據(jù)庫,1,簡 介,GenBank數(shù)據(jù)庫是由美國國立生物技術信息中心(NCBI)維護的一級核酸序列數(shù)據(jù)庫。,GenBank數(shù)據(jù)庫的數(shù)據(jù)來源有三種:1. 直接來源于測序工作者提交的序列;2. 與其它數(shù)據(jù)機構協(xié)作交換的數(shù)據(jù);3. 美國專利局提供的專利數(shù)據(jù)。,GenBank數(shù)據(jù)庫,1,2,簡 介,Entrez檢索功能,1. 檢索

4、界面,Entrez檢索界面,基本檢索界面,,,Entrez基本檢索界面,,Entrez基本檢索界面,,,,,Entrez基本檢索界面,,,Entrez基本檢索界面,Nucleotide數(shù)據(jù)庫分為三個子數(shù)據(jù)庫:,EST :表達序列標記數(shù)據(jù)庫GSS :基因組測序序列數(shù)據(jù)庫CoreNucleotide :包含所有未被以上兩個子數(shù)據(jù)庫收錄的核苷酸序列,Entrez檢索界面,跨庫檢索界面,,Entrez跨庫檢索界面,,,Entrez跨庫檢

5、索界面,GenBank數(shù)據(jù)庫,1,2,簡 介,Entrez檢索功能,1. 檢索界面2. 基本檢索功能,Entrez基本檢索功能,字段限制檢索,,“ras”,Entrez基本檢索功能,,Entrez基本檢索功能,“ras”,檢索限定詞:,1. 基因名稱的檢索限定詞: [GENE] or [GENE NAME]2. 生物體名稱的檢索限定詞:[ORGN] or [ORGANISM]3. 作者姓名的檢索限定詞: [

6、AUTH] or [AUTHOR]4. 序列接受號的檢索限定詞:[ACCN]or [ACCESSION],,“ras”[GENE],Entrez基本檢索功能,,Entrez基本檢索功能,“ras”[GENE],Entrez基本檢索功能,特殊標志符檢索,特殊標志符的格式(核酸序列):,1. 序列辨認號(GI):一串阿拉伯數(shù)字 e.g.:77682378,,GI:77682378,Entrez基本檢索功能,特殊標志符的格式

7、(核酸序列):,1. 序列辨認號(GI):一串阿拉伯數(shù)字 e.g.:77682378,2. GenBank/EMBL/DDBJ序列接受號: (1)1個字母+5個阿拉伯數(shù)字 e.g.:U12345 (2)2個字母+6個阿拉伯數(shù)字 e.g.:AY123456,Af123456,,AE014298.5,Entrez基本檢索功能,特殊標志符的格式(核酸序列):,

8、3. RefSeq(Reference Sequence)序列接受號:,(1)mRNA 記錄(NM_*): e.g.:NM_000492(2)基因組的DNA重疊群(NT_*): e.g.:NT_000347(3)完整的基因組或染色體(NC_*): e.g.:NC_000907(4)基因組的局部區(qū)域(NG_*): e.g.:NG_000019(5)從人類基因組注釋、加工得到的序列模型(XM

9、,XP,or XR_*): e.g.:XM_000483,NM_001017003.2,,Entrez基本檢索功能,特殊標志符的格式(核酸序列):,4. PDB序列接受號:1個阿拉伯數(shù)字+3個字母 e.g.:1TUP,序列接受號的檢索限定詞為[ACCN]or[ACCESSION],Entrez基本檢索功能,序列長度檢索,,1510[SLEN],Entrez基本檢索功能,,Entrez基本檢索功能,Entrez基本

10、檢索功能,范圍檢索,范圍檢索:中間用冒號連接,1. 序列接受號范圍檢索: AF114696:AF114714[ACCN] 2. 序列長度范圍檢索: 3000:4000[SLEN] 3. 日期范圍檢索: 2005/01:2006/09/26[MDAT]or[PDAT],GenBank數(shù)據(jù)庫,1,2,簡 介,Entrez檢索功能,1. 檢索界面

11、基本檢索功能高級檢索功能,,Entrez高級檢索功能,,,,限制檢索及索引檢索框,檢索歷史,Entrez高級檢索功能,檢索框,限制檢索,Entrez高級檢索功能,,限制檢索及索引檢索框,Entrez高級檢索功能:限制檢索,,Entrez高級檢索功能:限制檢索,,Entrez高級檢索功能:限制檢索,“ras”,Entrez高級檢索功能:限制檢索,,Entrez高級檢索功能:限制檢索,“ras”[Gene Name],,,Entrez高級

12、檢索功能:限制檢索,索引檢索,Entrez高級檢索功能,,限制檢索及索引檢索框,Entrez高級檢索功能:索引檢索,hepatitis b,,Entrez高級檢索功能:索引檢索,,乙型肝炎索引,Entrez高級檢索功能:索引檢索,,Entrez高級檢索功能:索引檢索,,,Entrez高級檢索功能:索引檢索,,序列特性關鍵詞索引,Entrez高級檢索功能:索引檢索,序列特性關鍵詞索引,,Entrez高級檢索功能:索引檢索,,Entrez高

13、級檢索功能:索引檢索,,Entrez高級檢索功能:索引檢索,“ras”,Entrez高級檢索功能:索引檢索,,“ras”,Entrez高級檢索功能:索引檢索,(“promoter”[Feature key])AND “ras”[Gene Name],,(“promoter”[Feature key])AND “ras”[Gene Name],Entrez高級檢索功能:索引檢索,GenBank數(shù)據(jù)庫,1,2,簡 介,Entrez檢索功能

14、,1. 檢索界面基本檢索功能高級檢索功能檢索結果的顯示,,,,檢索結果的顯示,,,檢索結果的顯示,,,,,序列特性表,檢索結果的顯示,GenBank記錄中特性表中的主要關鍵詞:,GenBank記錄中特性表中的主要關鍵詞:,GenBank記錄中特性表中的主要關鍵詞:,GenBank記錄中特性表中的限定詞:,GenBank記錄中特性表中的限定詞:,GenBank記錄中特性表中的限定詞:,GenBank記錄中特性表中的限定詞:,,序

15、 列,檢索結果的顯示,,下載序列,,序 列,下載序列,,下載序列,,下載序列,GenBank數(shù)據(jù)庫,1,2,3,簡 介,Entrez檢索功能,BLAST檢索功能,blastn (nucleotide blast)是核酸序列到核酸庫中的一種查詢。庫中存在的每條已知序列都將同所查序列作一對一地核酸序列比對。blastp (protein blast)是蛋白序列到蛋白庫中的一種查詢。庫中存在的每條已知序列將逐一地同每條所查序列作一對一的

16、序列比對。blastx是核酸序列到蛋白庫中的一種查詢。先將核酸序列翻譯成蛋白序列(一條核酸序列會被翻譯成可能的六條蛋白),再對每一條作一對一的蛋白序列比對。tblastn是蛋白序列到核酸庫中的一種查詢。與blastx相反,它是將庫中的核酸序列翻譯成蛋白序列,再同所查序列作蛋白與蛋白的比對。tblastx是核酸序列到核酸庫中的一種查詢。此種查詢將庫中的核酸序列和所查的核酸序列都翻譯成蛋白(每條核酸序列會產生6條可能的蛋白序列),這樣

17、每次比對會產生36種比對陣列。,BLAST,BLAST,,BLAST,,,,,,BLAST,NCBI網(wǎng)站簡介,GenBank數(shù)據(jù)庫檢索方法,如何檢索基因或基因編碼產物的功能,內 容,如何檢索基因或基因編碼產物的功能:,1,基因名稱,,,通過基因名稱檢索基因或基因編碼產物的功能,,通過基因名稱檢索基因或基因編碼產物的功能,,“ras”[GENE],通過基因名稱檢索基因或基因編碼產物的功能,,通過基因名稱檢索基因或基因編碼產物的功能,如何

18、檢索基因或基因編碼產物的功能:,1,2,基因名稱,序列接受號,,,NM_001126,通過序列接受號檢索基因或基因編碼產物的功能,,,通過序列接受號檢索基因或基因編碼產物的功能,,,通過序列接受號檢索基因或基因編碼產物的功能,,序列接受號為NM_001126的核酸序列的GenBank格式,通過序列接受號檢索基因或基因編碼產物的功能,,,通過序列接受號檢索基因或基因編碼產物的功能,,通過序列接受號檢索基因或基因編碼產物的功能,如何檢索基因

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論