版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、名詞解釋名詞解釋1..生物信息學(xué)生物信息學(xué):是研究生物信息的采集、處理、存儲(chǔ)、傳播,分析和解釋等各方面的學(xué)科,也是隨著生命科學(xué)和計(jì)算機(jī)科學(xué)的迅猛發(fā)展,生命科學(xué)和計(jì)算機(jī)科學(xué)相結(jié)合形成的一門新學(xué)科。2.2.二級(jí)數(shù)據(jù)庫二級(jí)數(shù)據(jù)庫:在一級(jí)數(shù)據(jù)庫、實(shí)驗(yàn)數(shù)據(jù)和理論分析的基礎(chǔ)上針對(duì)特定目標(biāo)衍生而來,是對(duì)生物學(xué)知識(shí)和信息的進(jìn)一步的整理。3.FASTAFASTA序列格式序列格式:是將DNA或者蛋白質(zhì)序列表示為一個(gè)帶有一些標(biāo)記的核苷酸或者氨基酸字符串,大于
2、號(hào)()表示一個(gè)新文件的開始,其他無特殊要求。4.genbankgenbank序列格式序列格式:是GenBank數(shù)據(jù)庫的基本信息單位,是最為廣泛的生物信息學(xué)序列格式之一。該文件格式按域劃分為4個(gè)部分:第一部分包含整個(gè)記錄的信息(描述符);第二部分包含注釋;第三部分是引文區(qū),提供了這個(gè)記錄的科學(xué)依據(jù);第四部分是核苷酸序列本身,以“”結(jié)尾。5.EntrezEntrez檢索系統(tǒng)檢索系統(tǒng):是NCBI開發(fā)的核心檢索系統(tǒng),集成了NCBI的各種數(shù)據(jù)庫,
3、具有鏈接的數(shù)據(jù)庫多,使用方便,能夠進(jìn)行交叉索引等特點(diǎn)。6.BLASTBLAST:基本局部比對(duì)搜索工具,用于相似性搜索的工具,對(duì)需要進(jìn)行檢索的序列與數(shù)據(jù)庫中的每個(gè)序列做相似性比較。P947.查詢序列(查詢序列(queryquerysequencesequence):也稱被檢索序列,用來在數(shù)據(jù)庫中檢索并進(jìn)行相似性比較的序列。P988.打分矩陣(打分矩陣(scingscingmatrixmatrix):在相似性檢索中對(duì)序列兩兩比對(duì)的質(zhì)量評(píng)估方
4、法。包括基于理論(如考慮核酸和氨基酸之間的類似性)和實(shí)際進(jìn)化距離(如PAM)兩類方法。P299.空位(空位(gapgap):在序列比對(duì)時(shí),由于序列長度不同,需要插入一個(gè)或幾個(gè)位點(diǎn)以取得最佳比對(duì)結(jié)果,這樣在其中一序列上產(chǎn)生中斷現(xiàn)象,這些中斷的位點(diǎn)稱為空位。P2910.空位罰分空位罰分:空位罰分是為了補(bǔ)償插入和缺失對(duì)序列相似性的影響,序列中的空位的引入不代表真正的進(jìn)化事件,所以要對(duì)其進(jìn)行罰分,空位罰分的多少直接影響對(duì)比的結(jié)果。P3711.E
5、.E值:衡量序列之間相似性是否顯著的期望值。12.低復(fù)雜度區(qū)域低復(fù)雜度區(qū)域:BLAST搜索的過濾選項(xiàng)。指序列中包含的重復(fù)度高的區(qū)域,如poly(A)。13.點(diǎn)矩陣(點(diǎn)矩陣(dotdotmatrixmatrix):構(gòu)建一個(gè)二維矩陣,其X軸是一條序列,Y軸是另一個(gè)序列,然后在2個(gè)序列相同堿基的對(duì)應(yīng)位置(x,y)加點(diǎn),如果兩條序列完全相同則會(huì)形成一條主對(duì)角線,如果兩條序列相似則會(huì)出現(xiàn)一條或者幾條直線;如果完全沒有相似性則不能連成直線。14.多
6、序列比對(duì)多序列比對(duì):通過序列的相似性檢索得到許多相似性序列,將這些序列做一個(gè)總體的比對(duì),以觀察它們在結(jié)構(gòu)上的異同,來回答大量的生物學(xué)問題。15.分子鐘分子鐘:認(rèn)為分子進(jìn)化速率是恒定的或者幾乎恒定的假說,從而可以通過分子進(jìn)化推斷出物種起源的時(shí)間。16.系統(tǒng)發(fā)育分析系統(tǒng)發(fā)育分析:通過一組相關(guān)的基因或者蛋白質(zhì)的多序列比對(duì)或其他性狀,可以研究推斷不同物種或基因之間的進(jìn)化關(guān)系。17.進(jìn)化樹的二歧分叉結(jié)構(gòu)進(jìn)化樹的二歧分叉結(jié)構(gòu):指在進(jìn)化樹上任何一個(gè)分
7、支節(jié)點(diǎn),一個(gè)父分支都只能被分成兩個(gè)子分支。系統(tǒng)發(fā)育圖:用枝長表示進(jìn)化時(shí)間的系統(tǒng)樹稱為系統(tǒng)發(fā)育圖,是引入時(shí)間概念的支序圖。18.直系同源直系同源:指由于物種形成事件來自一個(gè)共同祖先的不同物種中的同源序列,具有相似或不同的功能。(書:在缺乏任何基因復(fù)制證據(jù)的情況下,具有共同祖先和相同功能的同源39.PDB(ProteinDataBank):PDB中收錄了大量通過實(shí)驗(yàn)(X射線晶體衍射,核磁共振NMR)測定的生物大分子的三維結(jié)構(gòu),記錄有原子坐標(biāo)
8、、配基的化學(xué)結(jié)構(gòu)和晶體結(jié)構(gòu)的描述等。PDB數(shù)據(jù)庫的訪問號(hào)由一個(gè)數(shù)字和三個(gè)字母組成(如,4HHB),同時(shí)支持關(guān)鍵詞搜索,還可以FASTA程序進(jìn)行搜索。40.GenPept:是由GenBank中的DNA序列翻譯得到的蛋白質(zhì)序列。數(shù)據(jù)量很大,且隨核酸序列數(shù)據(jù)庫的更新而更新,但它們均是由核酸序列翻譯得到的序列,未經(jīng)試驗(yàn)證實(shí),也沒有詳細(xì)的注釋。41.折疊子(折疊子(Fold):在兩個(gè)或更多的蛋白質(zhì)中具有相似二級(jí)結(jié)構(gòu)的大區(qū)域,這些大區(qū)域具有特定的空
9、間取向。42.TrEMBL:是與SWISSPROT相關(guān)的一個(gè)數(shù)據(jù)庫。包含從EMBL核酸數(shù)據(jù)庫中根據(jù)編碼序列(CDS)翻譯而得到的蛋白質(zhì)序列,并且這些序列尚未集成到SWISSPROT數(shù)據(jù)庫中。43.MMDB(MolecularModelingDatabase):是(NCBI)所開發(fā)的生物信息數(shù)據(jù)庫集成系統(tǒng)Entrez的一個(gè)部分,數(shù)據(jù)庫的內(nèi)容包括來自于實(shí)驗(yàn)的生物大分子結(jié)構(gòu)數(shù)據(jù)。與PDB相比,對(duì)于數(shù)據(jù)庫中的每一個(gè)生物大分子結(jié)構(gòu),MMDB具有許
10、多附加的信息,如分子的生物學(xué)功能、產(chǎn)生功能的機(jī)制、分子的進(jìn)化歷史等,還提供生物大分子三維結(jié)構(gòu)模型顯示、結(jié)構(gòu)分析和結(jié)構(gòu)比較工具。44.SCOP數(shù)據(jù)數(shù)據(jù)庫:提供關(guān)于已知結(jié)構(gòu)的蛋白質(zhì)之間結(jié)構(gòu)和進(jìn)化關(guān)系的詳細(xì)描述,包括蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫PDB中的所有條目。SCOP數(shù)據(jù)庫除了提供蛋白質(zhì)結(jié)構(gòu)和進(jìn)化關(guān)系信息外,對(duì)于每一個(gè)蛋白質(zhì)還包括下述信息:到PDB的連接,序列,參考文獻(xiàn),結(jié)構(gòu)的圖像等??梢园唇Y(jié)構(gòu)和進(jìn)化關(guān)系對(duì)蛋白質(zhì)分類,分類結(jié)果是一個(gè)具有層次結(jié)構(gòu)的樹,
11、其主要的層次依次是類(class)、折疊子(fold)、超家族(superfamily)、家族(family)、單個(gè)PDB蛋白結(jié)構(gòu)記錄。45.PROSITE:是蛋白質(zhì)家族和結(jié)構(gòu)域數(shù)據(jù)庫,包含具有生物學(xué)意義的位點(diǎn)、模式、可幫助識(shí)別蛋白質(zhì)家族的統(tǒng)計(jì)特征。PROSITE中涉及的序列模式包括酶的催化位點(diǎn)、配體結(jié)合位點(diǎn)、與金屬離子結(jié)合的殘基、二硫鍵的半胱氨酸、與小分子或其它蛋白質(zhì)結(jié)合的區(qū)域等;PROSITE還包括根據(jù)多序列比對(duì)而構(gòu)建的序列統(tǒng)計(jì)特征
12、,能更敏感地發(fā)現(xiàn)一個(gè)序列是否具有相應(yīng)的特征。46.GeneOntology協(xié)會(huì):編輯一組動(dòng)態(tài)的、可控的基因產(chǎn)物不同方面性質(zhì)的字匯的協(xié)會(huì)。從3個(gè)方面描述基因產(chǎn)物的性質(zhì),即,分子功能,生物過程,細(xì)胞區(qū)室。47.表譜(PSSM):指一張基于多序列比對(duì)的打分表,表示一個(gè)蛋白質(zhì)家族,可以用來搜索序列數(shù)據(jù)庫。48.蛋白質(zhì)組蛋白質(zhì)組p179:是指一個(gè)基因組中各個(gè)基因編碼產(chǎn)生的蛋白質(zhì)的總體,即一個(gè)基因組的全部蛋白產(chǎn)物及其表達(dá)情況。49.中心法則中心法則
13、是指遺傳信息從DNA傳遞給RNA,再從RNA傳遞給蛋白質(zhì),即完成遺傳信息的轉(zhuǎn)錄和翻譯的過程。也可以從DNA傳遞給DNA,即完成DNA的復(fù)制過程。這是所有有細(xì)胞結(jié)構(gòu)的生物所遵循的法則。50.一級(jí)數(shù)據(jù)庫一級(jí)數(shù)據(jù)庫:數(shù)據(jù)庫中的數(shù)據(jù)直接來源于實(shí)驗(yàn)獲得的原始數(shù)據(jù),只經(jīng)過簡單的歸類整理和注釋51.基因芯片基因芯片(genechip),又稱DNA微陣列(microarray),是由大量cDNA或寡核苷酸探針密集排列所形成的探針陣列,其工作的基本原理是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 生物信息學(xué) 復(fù)習(xí)題
- 翠花生物信息學(xué)復(fù)習(xí)題
- 生物信息學(xué)復(fù)習(xí)題及答案打印
- 生物信息學(xué)復(fù)習(xí)題及答案西農(nóng)
- 生物信息學(xué)復(fù)習(xí)題及答案(陶士珩)
- 生物信息學(xué)復(fù)習(xí)題及答案陶士珩
- 生物信息學(xué) 期末復(fù)習(xí)
- 中國藥科大學(xué)《藥物生物信息學(xué)》復(fù)習(xí)題庫
- 生物信息學(xué)
- 農(nóng)業(yè)信息學(xué)復(fù)習(xí)題
- 生物信息學(xué)課件
- 生物信息學(xué)導(dǎo)論
- 生物信息學(xué)教案
- 生物信息學(xué)課程信息
- 醫(yī)學(xué)信息學(xué)復(fù)習(xí)題資料
- 生物信息學(xué)概論
- 生物信息學(xué)序列分析
- 生物信息學(xué)考試大綱
- 生物信息學(xué)作業(yè)實(shí)驗(yàn)
- 生物信息學(xué)選擇題
評(píng)論
0/150
提交評(píng)論