版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、1.研究背景及目的:鼠疫耶爾森氏菌(以下稱鼠疫菌)是鼠疫的病原菌,在歷史上曾引起過三次大流行。二戰(zhàn)期間,日本侵略者展開慘絕人寰的細菌戰(zhàn),鼠疫菌曾被并用作生物戰(zhàn)劑對我國實施攻擊目前,鼠疫在世界各地時有病例發(fā)生,是影響全世界的公共衛(wèi)生問題。我國現(xiàn)仍有12塊鼠疫自然疫源地,分布在19個省(區(qū)),占國土面積的15%左右。加強鼠疫菌研究對鼠疫的控制與防治以及應對生物恐怖威脅具有重大現(xiàn)實意義。
隨著生物學技術的發(fā)展,圍繞鼠疫菌所開展的基礎
2、科學和應用研究越來越多。這些研究工作產(chǎn)生了大量實驗數(shù)據(jù)和文獻資料,散落存放在世界各地的信息數(shù)據(jù)庫中。通過中國知網(wǎng)及維普等中文文獻查閱網(wǎng)站進行“鼠疫耶爾森氏菌數(shù)據(jù)庫”及“鼠疫菌知識庫”等關鍵詞的檢索,雖然與該菌有關的研究文獻已有數(shù)千篇,但未發(fā)現(xiàn)該菌綜合知識信息整合工作的文章發(fā)表。通過PubMed數(shù)據(jù)庫進行文獻回溯和Google scholar檢索網(wǎng)等進行檢索,發(fā)現(xiàn)國際上有多個鼠疫耶爾森氏菌相關的數(shù)據(jù)庫,如GenBank數(shù)據(jù)庫,存儲了鼠疫菌
3、的全基因組序列和注釋信息以及原始測序數(shù)據(jù);MLVA數(shù)據(jù)庫,收錄了鼠疫菌的可變數(shù)目串聯(lián)重復序列位點信息及菌株背景信息;CRISPR數(shù)據(jù)庫,可檢索到鼠疫菌的成簇規(guī)律間隔短回文重復序列位點序列信息;其它大型公開數(shù)據(jù)庫,如 BioGRID、DDBJ和EMBL等存儲了鼠疫菌蛋白質(zhì)—蛋白質(zhì)及基因相互作用等相關信息。這些數(shù)據(jù)庫功能主要集中于鼠疫菌分子及遺傳多樣性數(shù)據(jù)的收集和管理,而并沒有將鼠疫菌相關文獻知識進行組織、整合,并有序儲存于一個獨立的數(shù)據(jù)庫
4、平臺上。
本研究擬收集整理關于該菌的學術論文、論著、新聞及疫情信息等相關知識,加以整合,建立便捷的鼠疫菌知識庫系統(tǒng),為用戶提供查詢、瀏覽和下載服務,以達到以下研究目的:①實現(xiàn)已有鼠疫菌相關知識和數(shù)據(jù)的集中存儲管理;②查詢便捷,提高現(xiàn)有文獻信息的使用效率;③自動更新,實時獲取鼠疫菌研究相關資訊。最終為鼠疫菌相關科研提供更為完整方便的知識和數(shù)據(jù)支撐,也為其他病原的知識庫建立工作提供可參考的范例。
2.研究方法
5、2.1.數(shù)據(jù)收集與整合:通過對EndNote、Reference Manager、Biblioscape及NoteExpress等文獻管理軟件功能的調(diào)研,根據(jù)本課題擬收集中外文文獻進行整理并篩選導出的需求,最終選擇EndNote X5文獻管理軟件進行文獻的收集整理工作。在該軟件中設置檢索關鍵詞為“Black death”、“Yesinia”、“Plague”及“Yesinia pestis”,通過對PubMed數(shù)據(jù)庫在線檢索,收集篩選出
6、相關外文文獻題錄。通過Find full text功能項自動獲取到部分文獻全文并鏈接至原文,其余外文文獻的全文通過訪問Sci-Hub網(wǎng)站手動檢索收集。因EndNote無中文搜索功能,中文文獻題錄則主要通過中國知網(wǎng)檢索“黑死病”、“鼠疫”及“鼠疫耶爾森菌”等關鍵詞獲取,并進行人工篩選后將相關文獻導入EndNote文獻管理軟件,中文文獻全文通過中國知網(wǎng)和萬方數(shù)據(jù)收集。所有PDF全文文檔通過Reference→File Attachment功
7、能人工導入EndNote文獻庫與原文相關聯(lián)。收集工作結束后,使用Find Duplicates功能對全部文獻收集結果進行查重和去冗余整理,最終以Show All Fields的格式導出,將所有文獻信息存儲于一個獨立的TXT文件。全文PDF文檔儲存在EndNote自定義的原文件夾,路徑不變。
2.2.知識庫系統(tǒng)的構建:本研究通過Perl及PHP等計算機語言規(guī)范數(shù)據(jù)格式、構建實體關系模型、搭建系統(tǒng)和開發(fā)網(wǎng)頁;選擇中小型網(wǎng)站開發(fā)中常
8、用的Apache+PHP+MySQL優(yōu)勢組合進行網(wǎng)站的動態(tài)開發(fā),逐步完成知識庫系統(tǒng)的構建。
為了使各部分數(shù)據(jù)順利架構在服務器上,通過編寫 Perl腳本對存儲文獻信息的 TXT文本進行解析,生成一個可用 Excel程序打開的文本列表,該列表以制表符分隔每個字段并為每行文獻分配一個唯一的整數(shù)型標識符。同時編寫Perl腳本,將PDF文件按照整數(shù)型標識符重新命名后,轉(zhuǎn)移到另外統(tǒng)一存放PDF的文件夾中。經(jīng)過數(shù)據(jù)的規(guī)范化處理,論文和著作被
9、分割成實體(Entity)并分配屬性(Attribute)。根據(jù)實體與實體及實體與屬性之間的對應關系,構建實體關系模型(entity-relationship model),轉(zhuǎn)化成表格并對應建立在配置好的MySQL5.7數(shù)據(jù)庫中,通過phpMyAdmin工具,將文獻數(shù)據(jù)導入到MySQL數(shù)據(jù)庫并與全文PDF文件建立一一對應關系。
數(shù)據(jù)庫搭建完成后,在Apache網(wǎng)頁服務器上開發(fā)基于web接口的動態(tài)網(wǎng)頁,形成數(shù)據(jù)庫網(wǎng)站系統(tǒng)。通過
10、JavaScript和 Ajax快速處理服務器端與客戶端的交互,運用 Perl語言處理在知識庫網(wǎng)頁上返回到后臺的各種數(shù)據(jù)。系統(tǒng)搭建完成后進行試運行與調(diào)試排錯,保證系統(tǒng)運行順暢。
3.研究結果:本研究架構的鼠疫菌知識庫由文獻信息模塊、檢索模塊和新聞模塊構成。用戶可通過瀏覽器從Web端訪問本庫,訪問網(wǎng)址為:http://101.201.51.148/ypkd/。知識庫主頁分上下兩部分排版,由上方的標題欄、導航欄、簡介、數(shù)據(jù)概覽、快
11、捷搜索入口及下方的新聞展示版塊構成。信息搜索截止到2016年10月30日,文獻信息模塊收錄鼠疫菌相關文獻7183篇,書籍23部,均提供了URL鏈接;其中4620篇論文收集到PDF全文。用戶進行普通檢索或高級檢索時,可通過設置標題、摘要、關鍵詞、期刊、作者、時間等數(shù)據(jù)項獲取相關信息,并可將所得文獻按出版日期、作者及雜志名稱進行排序瀏覽。標題下方將列出該論著的簡要信息供用戶初步瀏覽,繼續(xù)點擊標題即可閱讀此文獻的詳細信息,包括文獻的標題、作者
12、、摘要、關鍵詞、PMID號、全文以及PubMed鏈接等,點擊本庫提供的PDF鏈接可在線瀏覽或下載全文。新聞版塊中通過編制好的網(wǎng)絡爬蟲,自動實時抓取互聯(lián)網(wǎng)最新的鼠疫菌相關信息,并按序展示;用戶可通過超鏈接獲取網(wǎng)絡信息全文,保證了知識庫的前沿性和完整性。
4.結論:本研究建立的知識庫系統(tǒng),內(nèi)容豐富完整,界面簡潔合理,使用快捷方便。該庫將PubMed和知網(wǎng)等網(wǎng)站的鼠疫菌相關信息全面整合起來,收錄了已發(fā)表的幾乎全部鼠疫菌相關文獻信息資
13、源,有利于知識的整體保存和利用。用戶通過輸入關鍵詞等進行常規(guī)或組合檢索,準確地在頁面上獲取相關文獻列表并可按需排序;提供的文獻全文,為研究者節(jié)省了多方查找資源、調(diào)研文獻的時間。本網(wǎng)站通過網(wǎng)絡爬蟲,將最新鼠疫菌相關網(wǎng)絡信息進行自動實時更新,排序展示在新聞版塊,保證了網(wǎng)站的及時性和時效性。用戶通過提供的超鏈接,可快速瀏覽全文,掌握信息詳情。本知識庫的建立,為科研工作者提供了可靠的鼠疫菌知識共享平臺,為鼠疫疫情的相關信息提供了及時的動態(tài)來源,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鼠疫耶爾森菌課件
- 鼠疫耶爾森氏菌與假結核耶爾森氏菌比較基因組學研究.pdf
- 鼠疫耶爾森氏菌密度感應系統(tǒng)研究.pdf
- 鼠疫耶爾森氏菌基因表達譜技術平臺的建立與應用.pdf
- 鼠疫耶爾森氏菌Pla蛋白的提取與純化.pdf
- cAMP受體蛋白調(diào)控鼠疫耶爾森氏菌毒力的研究.pdf
- 鼠疫耶爾森氏菌降解其分泌的鼠毒素研究.pdf
- 鼠疫耶爾森氏菌LcrV突變體的初步研究.pdf
- 肽核酸(PNA)探針檢測鼠疫耶爾森氏菌的研究.pdf
- 鼠疫耶爾森氏菌密度感應系統(tǒng)與毒力關系研究.pdf
- 鼠疫耶爾森氏菌pYC質(zhì)粒的全基因組初步分析.pdf
- 免疫滲濾實驗法快速檢測鼠疫耶爾森氏菌抗體.pdf
- 調(diào)控子Fur直接調(diào)控鼠疫耶爾森氏菌鐵代謝功能的研究.pdf
- 鼠疫耶爾森氏菌新型候選DNA疫苗的構建及其免疫效果鑒定.pdf
- 鼠疫耶爾森氏菌基因組多態(tài)性研究及快速鑒定溯源系統(tǒng)的建立.pdf
- 內(nèi)蒙古鼠疫耶爾森菌遺傳特征分析.pdf
- 鼠疫耶爾森氏菌布氏田鼠疫源地菌株91001全基因組序列測定及初步分析.pdf
- 基于cDNA文庫方法的鼠疫耶爾森氏菌sRNAs的篩選與鑒定研究.pdf
- 鼠疫耶爾森氏菌多重PCR-微孔板雜交-EIA檢測技術的研究.pdf
- 環(huán)境因素調(diào)控鼠疫耶爾森氏菌基因表達的比較轉(zhuǎn)錄譜學研究.pdf
評論
0/150
提交評論