一種基于Hadoop的區域醫學影像存儲系統的制作方法
【技術領域】
[0001]本發明屬于數字化醫療信息技術領域,具體的講,涉及一種基于Hadoop的分布式區域醫學影像存儲系統及醫學影像存儲格式。
【背景技術】
[0002]近年來,隨著社會經濟的不斷發展,醫療影像信息化技術在各級、各類醫院得到廣泛應用,參考醫學圖像早已成為醫生診斷的重要手段;隨之而來的是每天產生大量的醫學影像數據,并且還有不斷增加的趨勢,目前一所普通三甲醫院每年處理的PACS影像規模已經達到TB到數十TB級別,因此如何更加有效地管理這些龐大的醫學數據是醫學工作者面對的難題。
[0003]就目前來講,各大醫院主要使用PACS (Picture Archiving and Communicat1nSystems)系統來管理各種醫學影像,區域PACS和大型醫院的PACS通常采用集中式存儲,存儲架構大多采用“在線-近線-離線”三級存儲模式,這種模式下,存儲設備直接與主機相連,容量擴充不方便,維護升級困難,另外,區域PACS數據是PB級的,要保證所有數據的存儲被高速實時訪問,目前技術下,直連式存儲顯然滿足不了這要求,即使是SAN(存儲區域網絡)和NAS(網絡連接式存儲)也難以實現。目前的架構下,遠期影像數據一般是以離線方式,通過光盤庫或磁帶庫的方式保存,實時訪問困難,系統可用性差,而且安全性不高,存儲數據的備份不足,很容易因硬盤故障或者其他不可抗力災害等原因導致影像數據的大量丟失,造成不可恢復的損失。
[0004]PACS主要專注于應用層面,存儲層面的專業性不夠,此為現有技術的不足之處。而基于Hadoop的分布式文件系統HDFS可有效解決以上問題;
HDFS系統的優點:
1.適合處理PB量級的數據;
2.數據有極高的安全性:因為在默認情況下HDFS系統對每個數據塊都建立了三個備份;
3.系統極易擴展:要想提升HDFS分布式系統的存儲容量和計算能力只需增加服務器數量即可;
4.數據寫入后很少修改,適合需要長時間保存的數據;
除了數據存儲能力外,與HDFS同時存在的MapReduce可以對分布式文件系統中的數據塊進行并行處理,從而在大大提升了系統的計算能力的同時也降低了算法的時間復雜度。
[0005]雖然Hadoop系統的以上特性可以支持海量數據的管理,但結合醫院的臨床實際得知Hadoop在構建醫學圖像存儲系統以及在管理海量醫學圖像數據方面仍然存在以下問題:
1.在醫學上常見的圖像大小約為512KB左右,比如像CT、X光片等等,一般情況下一次拍攝的圖像數量約為5MB左右,這比Hadoop當中默認的64MB數據塊空間要小許多,HDFS文件系統中一旦存儲了大量這樣的小文件,勢必會因為元數據過多而給HDFS中的NameNode節點帶來極大的負擔,從而導致整個集群的性能下降。
[0006]2.在臨床醫學當中對醫學圖像數據的實時性要求很高,而在HDFS系統當中寫入數據時,要為每個數據塊建立三份的數據拷貝,導致其寫入能力較差,因此Hadoop的讀寫性能不太適合對實時性要求較高的臨床應用。
[0007]鑒于上述Hadoop的特點,雖然在存儲和計算方面有優勢,但數據的實時性為其不足之處。
【發明內容】
[0008]本發明的目的在于針對現有技術的不足,提供了一種區域性醫療影像信息存儲系統。
[0009]本發明所涉及的系統包括:
管理系統,包括用戶管理和數據管理兩大主要部分,用戶管理主要是管理員用來管理系統的用戶,嚴格管理用戶對數據的進行操作的權限,保護數據安全及病人隱私;數據管理主要用來管理云存儲系統中的數據。
[0010]商業云存儲系統,由Hadoop的HDFS分布文件系統構建,用于存儲醫院不經常使用,但需要長期存儲的大量影像數據,由區域影像數據中心存儲。
[0011]私有云存儲系統,由各個科室的高性能PC組成,通過光纖進行數據交互,該系統主要用于存儲醫院需要經常使用的數據,一般三個月內的影像存儲在本地醫院的私有云中,可以快速訪問;私有云系統下包括各科室的圖像采集工作站、診斷服務器以及打印服務器。
[0012]所述圖像采集工作站有四個,分別為放射采集工作站,超聲采集工作站、內科鏡采集工作站和眼科采集工作站等。
[0013]所述診斷服務器為各科室醫生進行診斷時所使用的計算機。
[0014]所述采集工作站采集到的圖像格式均為無損DICM格式。
[0015]所述商業云存儲系統和私有云存儲系統通過光纖進行數據交互,每個私有云與多個下屬服務器、工作站等通過光纖進行數據交互;
本發明的有益效果:
1.節約資源:使用本系統不再需要大量的膠片,而是直接使用數字化成像技術將醫生和病人所需的圖像資料展現出來;而且整個存儲過程自動化成度高,可以極大的減少對人員的需要,由于采用了 HDFS存儲系統,擁有了無限大的網絡存儲空間,空間擴展也極為容易,只需增加廉價的PC客戶端即可,從而又可以大幅度節省醫院開銷。
[0016]2.醫院與社會效益:本系統一旦投入使用會給醫療機構的工作方式帶來重大變革,醫生可以通過Hadoop集群全面應用各種圖像信息,更快地獲取各個方面的有關病人的醫療信息和檢查結果,因此可以提高醫療診斷效率。
[0017]3.通過構建基于云計算的區域醫學影像存儲中心,為后期開展醫學影像遠程會診、影像轉診、虛擬影像專科、遠程教學、圖像內容檢索服務,實現區域內影像設備及影像診斷技術的充分共享和高效協作,對于均衡醫療資源、提高基層醫院的診療水平、提高影像設備的使用效率、提高醫療服務質量、降低醫療費用等方面具有重要的意義。
【附圖說明】
[0018]圖1.Hdp-DICOM 文件格式。
[0019]圖2a.為商業云存儲系統總體框架結構圖。
[0020]圖2b.為私有云存儲系統總體框架結構圖。
[0021]圖3.為系統的工作流程圖。
【具體實施方式】
[0022]以下結合附圖對本發明作進一步說明。
[0023]I醫學圖像存儲格式,
根據Hadoop平臺的優缺點,結合醫學影像文件的特點和數據量,設計一種基于Hadoop的序列化醫學圖像存儲格式一 “Hdp-DICOM格式”,它主要以Key/Value鍵值對的形式將醫學圖像進行存儲,非常適合HDFS系統,它主要的工作就是將病人檢查時所形成的大量的較小的醫學圖像進行合并,形成一個適合HDFS系統存儲的大文件,從而在提高Hadoop處理能力的同時又有效防止了 NameNode節點因為元數據過多而降低系統的能力。
[0024]—般情況下,病人在做醫學圖像檢查時,都會產生數量不等的醫療圖片,比如像CT,每張圖片的大小一般情況下約為512KB,前面我們也分析過,如果將這些小的圖片直接存儲到HDFS當中顯然是不合適的,但我們發現,如果將這些小圖合并到一起,那么其數據量非常接近HDFS數據塊的默認大小64MB,因此將一個病人檢查所形成的圖像合并在一起,然后再將其存儲到HDFS當中是非常適合的。所以我們采用Hdp-DICOM文件格式,就是將每個病人所檢查的圖像文件轉化成鍵值(Key