醫(yī)學影像云服務(wù)平臺基礎(chǔ)架構(gòu)研究與實踐.pdf_第1頁
已閱讀1頁,還剩130頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、醫(yī)學影像技術(shù)在近十多年來取得了突飛猛進的發(fā)展。新技術(shù)、新設(shè)備不斷涌現(xiàn)。320排螺旋CT、超高場強磁共振、分子影像、功能影像、多模態(tài)融合成像等技術(shù)大大豐富了醫(yī)生的診斷手段,提高了疾病的診斷效果,但是同時也帶來了一定的問題:1)高端影像設(shè)備價格昂貴,動輒數(shù)百萬到數(shù)千萬元,很多醫(yī)院簡單地將設(shè)備檔次作為體現(xiàn)醫(yī)療水平的標準,競相引進高端設(shè)備,導致醫(yī)療成本居高不下;2)醫(yī)學影像設(shè)備一次掃描能產(chǎn)生數(shù)百至數(shù)千幅圖像,病人帶走的膠片只包含其中極少一部分圖

2、像,且無法進行參數(shù)調(diào)節(jié)和三維、動態(tài)顯示,診斷價值大打折扣。病人轉(zhuǎn)院時,醫(yī)生多會以此為由要求病人重新檢查,不必要的重復檢查進一步加重了居民的醫(yī)療負擔;3)X線機、超聲等影像設(shè)備在小醫(yī)院已有很高的普及率,沿海發(fā)達地區(qū)部分鄉(xiāng)鎮(zhèn)醫(yī)院甚至引進了64排CT以上的先進影像設(shè)備,但是卻缺乏優(yōu)秀的影像診斷醫(yī)生,設(shè)備的利用率低;4)基層醫(yī)療機構(gòu)嚴重缺乏資金、設(shè)備、技術(shù)和人才。人們有病都往大醫(yī)院擠,導致了大醫(yī)院“人滿為患”、基層醫(yī)院“門可羅雀”。這種醫(yī)療資源

3、不均衡的現(xiàn)狀是造成“看病難、看病貴”的重要原因。5)影像診斷難度大,需要診斷醫(yī)生有雄厚的基礎(chǔ)知識和豐富的閱片經(jīng)驗,不斷涌現(xiàn)的新技術(shù)新設(shè)備對影像診斷教學提出了更高的要求。醫(yī)學院校傳統(tǒng)的教學手段和教學設(shè)備遠遠滿足不了不斷擴大的招生規(guī)模的需求;6)影像設(shè)備產(chǎn)生的海量圖像資料需要長期保存,國內(nèi)醫(yī)院普遍缺乏遠程容災(zāi)和備份的措施,一旦發(fā)生火災(zāi)、地震、海嘯等自然災(zāi)害,可能導致資料完全丟失,造成不可彌補的損失。
   通過網(wǎng)絡(luò)技術(shù)實現(xiàn)區(qū)域內(nèi)醫(yī)療

4、資源的共享與醫(yī)療過程的協(xié)同,是均衡醫(yī)療資源、解決“看病難、看病貴”問題的重要手段。遠程影像協(xié)作診斷具有臨床價值高、診斷難度大、基層醫(yī)院迫切需要、DICOM標準穩(wěn)定成熟、通過共享與協(xié)作可大幅度降低醫(yī)療費用等特點,是區(qū)域醫(yī)療協(xié)作中最具臨床價值的應(yīng)用。因此,構(gòu)建區(qū)域化的醫(yī)學影像服務(wù)平臺,開展醫(yī)學影像遠程會診、影像轉(zhuǎn)診、虛擬影像???、遠程教學、遠程災(zāi)備、影像代存、典型病例查詢、圖像內(nèi)容檢索等服務(wù),實現(xiàn)區(qū)域內(nèi)影像設(shè)備及影像診斷專家的充分共享和高效

5、協(xié)作,對于均衡醫(yī)療資源、提高基層醫(yī)院診療水平、提高影像設(shè)備的使用效率、提高醫(yī)療服務(wù)質(zhì)量、降低醫(yī)療費用具有重要的意義。
   構(gòu)建區(qū)域醫(yī)學影像服務(wù)平臺,開展遠程影像協(xié)作應(yīng)用是一項龐大的系統(tǒng)工程,采用傳統(tǒng)建設(shè)全院PACS的技術(shù)手段構(gòu)建大規(guī)模的區(qū)域醫(yī)學影像服務(wù)平臺面臨著巨大挑戰(zhàn):
   1)建設(shè)費用高。PACS醫(yī)學影像的數(shù)據(jù)量遠遠大于HIS、LIS等其它醫(yī)療系統(tǒng)的數(shù)據(jù)量,一個大型三甲醫(yī)院每年P(guān)ACS圖片數(shù)據(jù)量高達數(shù)TB到數(shù)十T

6、B。區(qū)域內(nèi)的醫(yī)學影像數(shù)據(jù)量將達到PB(1024TB)以上級別。區(qū)域醫(yī)學影像服務(wù)平臺需要提供遠程災(zāi)備和影像代存等服務(wù),因此需要考慮區(qū)域內(nèi)的全部影像數(shù)據(jù)量。采用傳統(tǒng)FC SAN(光纖存儲區(qū)域網(wǎng)絡(luò))構(gòu)建PB級容量的存儲系統(tǒng),建設(shè)費用極高;
   2)性能和擴展能力不足。即便是性能和穩(wěn)定性最好的FC SAN,其傳輸帶寬和處理能力也難以滿足PB級海量數(shù)據(jù)的處理和傳輸要求。同時,增加存儲設(shè)備時,整個應(yīng)用系統(tǒng)的目錄結(jié)構(gòu)一致性難以保證。目前市場

7、上雖然已出現(xiàn)存儲虛擬化產(chǎn)品,可以將多臺存儲設(shè)備虛擬化成一個統(tǒng)一的存儲池,解決存儲架構(gòu)的一致性和動態(tài)擴展問題,但是出于市場考慮和技術(shù)限制,廠商一般都只支持自有存儲產(chǎn)品的虛擬化,難以實現(xiàn)不同廠商設(shè)備的兼容;
   3)可用性受限。全院PACS常用“在線—近線-離線”三級存儲模式。最近的在線圖像數(shù)據(jù)存放在性能高的FC SAN中,稍久一點的近線圖像存放在性能稍差的IP SAN或NAS存儲設(shè)備中,超過一定時限的圖像則離線存儲到光盤庫或磁帶

8、庫中。這種方式的好處是可以節(jié)省成本,保證醫(yī)療診斷應(yīng)用的性能,但是整個系統(tǒng)的可用性受到限制,離線圖像數(shù)據(jù)難以實時獲取;
   4)缺乏一體化的應(yīng)用軟件。目前構(gòu)建區(qū)域PACS系統(tǒng)在技術(shù)上大多是采用全院PACS系統(tǒng)的架構(gòu),但是這種架構(gòu)只適合高速、穩(wěn)定、安全的園區(qū)網(wǎng)絡(luò)環(huán)境。在帶寬受限、穩(wěn)定性差、受防火墻阻斷的公網(wǎng)環(huán)境下,難以滿足應(yīng)用需求。另外,區(qū)域醫(yī)學影像協(xié)作中最重要的應(yīng)用——醫(yī)學影像遠程會診,目前還基本采用“點對點”的模式,缺乏一體化

9、、跨平臺、高可用的醫(yī)學影像管理與協(xié)作應(yīng)用軟件。
   隨著云計算技術(shù)和應(yīng)用模式的快速興起,為構(gòu)建低成本、高可用、高性能、易擴展的區(qū)域醫(yī)學影像服務(wù)平臺提供了一條有效的途徑。我們承擔的課題就是研究通過高速城域網(wǎng)、醫(yī)保專網(wǎng)、電子政務(wù)外網(wǎng)、互聯(lián)網(wǎng)等傳輸介質(zhì),采用云計算技術(shù)構(gòu)建區(qū)域醫(yī)學影像云服務(wù)平臺,為區(qū)域內(nèi)的各類醫(yī)療機構(gòu)和人員提供SaaS模式的醫(yī)學影像遠程應(yīng)用服務(wù)。而高性能、高可靠、易擴展的海量醫(yī)學圖像分布式存儲架構(gòu)和并行處理技術(shù)將是醫(yī)

10、學影像云服務(wù)平臺的基礎(chǔ)和關(guān)鍵,也是本論文的研究重點。
   Google作為全球最大的搜索引擎和云計算服務(wù)商,率先遇到了PB級海量數(shù)據(jù)的處理問題。她沒有采用傳統(tǒng)的存儲和高性能計算技術(shù),而是獨辟蹊徑地創(chuàng)造了GFS分布式文件系統(tǒng)和MapReduce分布式計算技術(shù),通過聚合數(shù)以萬計普通服務(wù)器的存儲和計算資源,實現(xiàn)了超大規(guī)模數(shù)據(jù)集的高效處理,取得了巨大的成功。Apache Hadoop項目則是GFS和MapReduce的開源實現(xiàn),目前已

11、成為世界上最有影響力的開源云計算平臺,取得了廣泛的應(yīng)用。針對Hadoop平臺的特點和醫(yī)學影像云服務(wù)平臺的需求,我們設(shè)計了一種HDFS和FC SAN相結(jié)合的“在線-歸檔”二級存儲架構(gòu)HMISA(Hybrid Medical Image StorageArchitecture),取代區(qū)域PACS系統(tǒng)常見的“在線—近線-離線”三級存儲架構(gòu)。并在其基礎(chǔ)上開展了基于MapReduce框架的醫(yī)學影像后處理等分布式計算應(yīng)用。
   HDFS分

12、布式文件系統(tǒng)具有如下特點:1)專門針對PB級以上海量數(shù)據(jù)的快速存儲和處理而設(shè)計,已在Yahoo、FaceBook、亞馬遜、百度、淘寶等海量數(shù)據(jù)處理應(yīng)用平臺上得到了廣泛驗證;2)系統(tǒng)可擴展性高,只需簡單添加服務(wù)器數(shù)量,即可實現(xiàn)存儲容量、磁盤IO吞吐率、傳輸帶寬和計算能力的線性增長,并保持一致的文件目錄結(jié)構(gòu);3)數(shù)據(jù)冗余度高,缺省每份數(shù)據(jù)在3個不同的節(jié)點上保留副本;4)適合“流式”訪問(Streaming access),即一次寫入,多次讀

13、取,數(shù)據(jù)寫入后極少修改,適合醫(yī)學影像文件的訪問特點;5)除了數(shù)據(jù)存儲能力外,與HDFS共生的MapReduce分布式計算框架還可充分利用各服務(wù)器CPU的計算資源,便于后期開展基于海量醫(yī)學影像數(shù)據(jù)的圖像預(yù)處理、格式轉(zhuǎn)換、圖像融合、內(nèi)容檢索、三維重建等數(shù)據(jù)密集型應(yīng)用。
   但是,Hadoop在構(gòu)建醫(yī)學影像存儲系統(tǒng)時還存在以下問題:1)Hadoop的設(shè)計理念是針對大文件進行優(yōu)化的,其默認的數(shù)據(jù)塊大小為64 MB,而醫(yī)學影像資料中常見

14、的CT、MRI的圖像大小大多為512 KB左右,一次拍攝產(chǎn)生的圖像數(shù)量大約為100~200幅,如果直接將大量的小文件存儲在HDFS文件系統(tǒng)中,過多的元數(shù)據(jù)將導致HDFS主節(jié)點NameNode的內(nèi)存消耗過大,降低集群的性能。2)HDFS的設(shè)計理念不適合需要低時延的實時應(yīng)用,其寫入性能大大低于讀取性能,不太適合需要快速獲取圖像資料并撰寫診斷報告的PACS實時應(yīng)用。
   針對Hadoop平臺不適合存儲醫(yī)學影像小文件的問題,我們采用H

15、adoop的SequenceFile文件格式,設(shè)計了一種適合HDFS特點的S-DICOM序列化醫(yī)學影像文件格式,通過Key/Value鍵值對的形式,將一個病人一次檢查產(chǎn)生的所有圖像合并成一個序列化文件。這樣可以大大提高HDFS處理的性能,防止元數(shù)據(jù)服務(wù)器(NameNode)內(nèi)存消耗過大的問題。同時,Key/Value形式的數(shù)據(jù)也是MapReduce分布式計算平臺的最佳輸入數(shù)據(jù)結(jié)構(gòu),便于后期開展基于醫(yī)學影像文件的數(shù)據(jù)密集型應(yīng)用。
 

16、  單純的HDFS分布式文件系統(tǒng)不適合實時應(yīng)用,但是具備低成本、易擴展、高性能、高可靠的特點。傳統(tǒng)的集中存儲(FC SAN)則非常適合小文件的快速讀寫。因此,結(jié)合兩者的優(yōu)點我們設(shè)計了一套FC SAN和HDFS結(jié)合的混合式存儲架構(gòu)HMISA,將常見的PACS“在線—近線-離線”三級存儲簡化為“在線-歸檔”兩級存儲架構(gòu)。一年以內(nèi)的醫(yī)學影像資料以DICOM原始格式保存在FC SAN一級“在線庫”中,可滿足PACS閱片和撰寫診斷報告等實時應(yīng)用

17、的低時延要求。超過一年的圖像則轉(zhuǎn)換成S-DICOM格式保存到HDFS二級“歸檔庫”中,通過SDFO(S—DICOM File Operator)文件訪問組件,屏蔽底層圖像讀寫操作的細節(jié),為上層的SaaS模式醫(yī)學影像應(yīng)用系統(tǒng)和DICOM應(yīng)用組件提供統(tǒng)一的圖像查詢、讀取和寫入接口。
   Hadoop內(nèi)置的MapReduce分布式計算框架為開發(fā)人員屏蔽了任務(wù)調(diào)度、節(jié)點容錯、節(jié)點通訊、負載均衡等并行計算中難以處理的細節(jié),大大降低了分布

18、式計算系統(tǒng)的開發(fā)難度。同時,MapReduce采用了“將計算移動到數(shù)據(jù)所在位置”的設(shè)計理念,特別適合海量醫(yī)學影像的數(shù)據(jù)密集型分布式處理。我們在分布式存儲架構(gòu)的基礎(chǔ)上編寫了基于MapReduce框架的醫(yī)學影像分布式處理程序,包括DICOM圖像批量轉(zhuǎn)換為JPEG格式、病人隱私信息批量清除、批量生成縮略圖、網(wǎng)絡(luò)訪問日志的分布式導入和查詢等。并在測試集群中驗證了分布式計算的性能及部分參數(shù)對性能的影響。測試結(jié)果表明Hadoop集群可以有效利用各存

19、儲節(jié)點的計算能力,集群的性能遠遠高于單機處理的能力,并且通過水平擴展(Scale-out)的方式可以快速實現(xiàn)存儲容量和處理速度的線性增長。
   綜上所述,本論文的特色和創(chuàng)新主要包括:
   1)分析了區(qū)域醫(yī)學影像共享與協(xié)作的需求、技術(shù)進展及面臨的主要問題,設(shè)計了區(qū)域醫(yī)學影像云服務(wù)平臺的整體技術(shù)架構(gòu),包括邏輯架構(gòu)、網(wǎng)絡(luò)架構(gòu)、存儲架構(gòu)和軟件架構(gòu)等。
   2)設(shè)計了一種FC SAN和HDFS相結(jié)合的醫(yī)學影像“在線-

20、歸檔”二級存儲架構(gòu)HMISA(Hybrid Medical Image Storage Architecture),解決區(qū)域PACS常見的“在線—近線-離線”三級存儲架構(gòu)的性能、可擴展性和可用性等問題。設(shè)計了S-DICOM醫(yī)學影像歸檔文件格式,解決HDFS不適合存儲和處理大量小文件的問題。開發(fā)了一套SDFO文件訪問組件,屏蔽HMISA存儲架構(gòu)底層圖像讀寫操作的細節(jié),為上層的SaaS模式醫(yī)學影像應(yīng)用系統(tǒng)和DICOM應(yīng)用組件提供統(tǒng)一的圖像查

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論