專利名稱::一種醫(yī)學圖像識別的方法
技術領域:
:本發(fā)明屬于醫(yī)學圖像的計算機分析技術的應用領域,具體涉及一種醫(yī)學圖像識別的方法。
背景技術:
:自20世紀70年代以來,隨著計算機斷層掃描CT、核磁共振成像MRI、超聲US等醫(yī)學成像技術的產(chǎn)生和飛速發(fā)展,醫(yī)院中產(chǎn)生并存儲了大量的可供臨床診斷和分析的醫(yī)學圖像。近年來,隨著計算機及其相關技術的迅速發(fā)展以及圖形圖像技術的日趨成熟,人們可以對醫(yī)學圖像進行任意放大、縮小、旋轉、對比調整、分割、配準、三維重建等處理,醫(yī)務工作者可以從多方位、多層次、多角度對醫(yī)學圖像進行觀察,從而輔助醫(yī)生對病變體及其他感興趣區(qū)域進行重點分析,提高了臨床診斷的準確性,開創(chuàng)了數(shù)字醫(yī)療的新時代。但是,目前圖像診斷方法絕大部分仍是通過肉眼觀察圖像中的病變區(qū)域,依靠醫(yī)生個人的臨床經(jīng)驗和主觀判斷來進行診斷。該方法存在如下不足①信息利用率不高,由于醫(yī)學圖像一般具有很高的分辨率(如CT圖像灰度級高達4096級),那些人眼無法分辨的圖像信息和圖像特征就得不到充分應用,從而會影響病情的早期判斷;②醫(yī)生帶有個人的主觀性,診斷結果很大程度上依賴于醫(yī)生個人的臨床經(jīng)驗,對于那些臨床經(jīng)驗較少的醫(yī)生來說,要做出正確的診斷是非常困難的。另外,同一張醫(yī)學圖像,不同的醫(yī)生也有可能得出不同的診斷結果,相互之間的差別可能很大,發(fā)生誤診或漏診現(xiàn)象是不可避免的;③人工觀察耗時多,對于單個病人的診斷,醫(yī)生直接觀察患者的病變區(qū)域所耗時間和精力是可以接受,但若對大量臨床圖像進行病理研究時,仍然采取人工讀圖的方式就讓人難以接受了。因此,如何充分利用計算機圖像處理技術快速、準確地將醫(yī)學圖像中的病變區(qū)域識別出來,即確定醫(yī)學圖像中各組織器官所屬的類別(正?;虍惓?,確保臨床診斷更客觀、準確和科學,己成為醫(yī)學圖像診斷中的一個關鍵技術。另外,醫(yī)學圖像識別也是可視人計劃(VHP)、醫(yī)學圖像指導治療技術、醫(yī)學圖像后處理及其治療方法、手術計劃與導航和醫(yī)學虛擬現(xiàn)實及其相關技術等實現(xiàn)中的一項重要工作。目前國內外在這方面的研究很活躍。例如,Maria-Luiza.A(ApplicationofTataMiningTechniquesforMeTicalImage)等人用圖像挖掘方法對胸部圖像進行了較為深入的研究,所提出的方法首先是對胸部圖像進行預處理,然后將圖像分成四個規(guī)則區(qū)域,提取每個區(qū)域的紋理特征,最后用兩種算法(關聯(lián)規(guī)則和神經(jīng)網(wǎng)絡)對它進行數(shù)據(jù)挖掘。該方法通過圖像數(shù)據(jù)挖掘,將圖像分成正常和異常兩類,實現(xiàn)了胸部圖像乳腺癌的自動診斷。VasileiosMegalooikonomou(MiningLesion-TeficitAssociationsinABrainImageTatabase)等人利用數(shù)據(jù)挖掘技術對腦部圖像進行了研究,發(fā)現(xiàn)了人腦的結構與功能的聯(lián)系,大大方便了醫(yī)生對人腦疾病的診斷。PetmPerner(MiningKnowleTgeforHEp-2CellImageClassification)提出基于診斷的圖像挖掘系統(tǒng),首先提取圖像的顏色、紋理、形狀等低層物理特征和專家對圖像的診斷信息,然后用決策樹挖掘圖像特征和診斷的關聯(lián),輔助醫(yī)生進行臨床診斷。對上述這些研究進行分析可以發(fā)現(xiàn),目前這些醫(yī)學圖像分類研究所采用的方法一般是通過提取描述圖像的特征集,使原始圖像數(shù)據(jù)變成適合于傳統(tǒng)數(shù)據(jù)挖掘技術的數(shù)據(jù)形式,然后進行圖像分類研究;還有的是通過特征集的關聯(lián)規(guī)則進行臨床自動診斷研究。這些方法或多或少存在以下幾個問題①僅限于對整幅圖像的特征進行挖掘研究,而臨床診斷中人體圖像的局部區(qū)域特征更具有臨床意義。日前絕大多數(shù)的特征提取都是建立在整幅圖像基礎之上,或者簡單地把圖像分成規(guī)則的幾部分,分別提取每部分的特征,這些特征不能真正表示圖像中的真實信息,而識別效果的好壞很大程度上取決于所提取的特征;②用于醫(yī)學圖像分類的方法還停留在關聯(lián)規(guī)則等傳統(tǒng)的數(shù)據(jù)挖掘算法的直接使用上,醫(yī)學圖像數(shù)據(jù)是復雜和高維的,需要研究適合其特點的分類算法;③對于醫(yī)學圖像的識別僅局限于個別特定的組織器官,比如乳房,顱腦等,所取得的研究成果并不具有對其它器官知識挖掘應用的普遍適應性;方法所取特征僅僅是一些基本的顏色、紋理、形狀等特征,還沒有充分考慮醫(yī)學圖像本身的特點;⑤分類方法訓練時間長、準確率低,不具有實用性。因此,尋找更加高效和準確的醫(yī)學圖像識別方法是計算機和醫(yī)學研究工作者們所追求的。四
發(fā)明內容本發(fā)明的目的在于針對現(xiàn)有方法的不足,提出一種醫(yī)學圖像識別的方法,該方法能更加準確地識別出新醫(yī)學圖像的類別(正常與異常)。本發(fā)明的進一步目的還在于能夠對醫(yī)學圖像庫內的圖像進行快速分類。本發(fā)明的再一個發(fā)明目的是醫(yī)學圖像快速并準確地進行類別識別。實現(xiàn)本發(fā)明目的的技術方案是一種醫(yī)學圖像識別的方法,包括關聯(lián)規(guī)則分類庫的構造及其更新和醫(yī)學圖像識別步驟,其特征在于,所述關聯(lián)規(guī)則分類庫的構造及其6更新步驟中包括下列步驟(1)醫(yī)學圖像樣本數(shù)據(jù)的準備及預處理,包括醫(yī)學圖像的格式轉換、尺度歸一化以及去噪與增強;(2)采用基于密度聚類的醫(yī)學圖像分割方法分別識別出每幅樣本醫(yī)學圖像中待分析的局部區(qū)域;(3)分別提取出每幅樣本醫(yī)學圖像中局部區(qū)域的特征,構造醫(yī)學圖像樣本數(shù)據(jù)庫T,這些特征包括means(均值,它反映的是一副醫(yī)學圖像的平均灰度值)、variance(方差,它反映的是一副醫(yī)學圖像灰度在數(shù)值上的離散分布情況)、skewness(傾斜度,它反映的是醫(yī)學圖像直方圖分布的不對稱程度)、kurtosis(峰態(tài),它反映的是醫(yī)學圖像灰度分布在接近均值時的大致狀態(tài))、energy(能量,它反映的是灰度分布的均勻程度)、entropy(熵,它反映的是直方圖灰度分布的均勻性)和JF(聚類特征);(4)特征值離散化;(5)挖掘醫(yī)學圖像樣本數(shù)據(jù)庫中的頻繁項目集;(6)根據(jù)頻繁項目集構造關聯(lián)規(guī)則分類庫。上述技術方案的有益效果如下醫(yī)學圖像是表達人體組織、器官等解剖結構的信息集合,其信息很難用人類語言唯一描述,通常用如顏色、紋理、形狀、空間關系、圓形、方形、聚類等特征來表示或描述。本發(fā)明從醫(yī)學圖像的成像機制、醫(yī)學圖像數(shù)據(jù)的特性等方面入手,研究了醫(yī)學圖像的灰度及其密度與人體組織器官的解剖語義,給出了一種基于核密度估計聚類的醫(yī)學圖像定性特征表達方式,即本發(fā)明所述的聚類特征,聚類特征能夠很好地表達醫(yī)學圖像的語義內容,與傳統(tǒng)的定量特性相比具有更好的可區(qū)分性。一般情況下,一幅醫(yī)學圖像包含許多豐富的組織,局部組織的病灶有時會與周圍正常組織在灰度、形狀上十分相似,整幅醫(yī)學圖像的特征可能無法反映出某一局部組織器官的微小病變,僅取圖像的全局特征顯然是不準確的。本發(fā)明以醫(yī)學圖像底層次的可視特征為標準,給出了一種醫(yī)學圖像的自動分割方法,將圖像中具有特殊含義的不同區(qū)域或組織區(qū)分開來,實現(xiàn)醫(yī)學圖像中人體組織器官的自動分割。本發(fā)明通過步驟(2)和步驟(3)的技術特征,建立起更科學合理的醫(yī)學圖像樣本數(shù)據(jù)庫,使得新圖像的類別識別更加準確,達到本發(fā)明的發(fā)明目的。作為本發(fā)明的進一步改進,所述步驟(5)中進一步包括下列步驟①將醫(yī)學圖像樣本數(shù)據(jù)庫T分類,分為正常類Ti和異常T2;②分別構造T!、T2的類別屬性除外的頻繁模式樹FPrt、FP2-t;③由FP!-t、FP2-t確定各自的頻繁項目集FI卜FI2。作為本發(fā)明的進一步改進,所述步驟(6)中進一步包括下列步驟分別計算頻繁項目集Fh、Fl2在T2和I^中的支持數(shù);⑤根據(jù)閾值確定關聯(lián)規(guī)則分類規(guī)則;⑥存入關聯(lián)規(guī)則分類庫。上述改進是針對現(xiàn)有關聯(lián)分類規(guī)則挖掘方法中內存要求高、類別屬性處理難、1/0訪問次數(shù)多等問題提出了相應的解決方案,本發(fā)明所提出的關聯(lián)分類規(guī)則挖掘方法同時考慮所有屬性,取得比同樣基于規(guī)則的決策樹分類算法C4.5更好的分類效果。作為本發(fā)明的進一步改進,所述頻繁項目集更新步驟中進一步包括下列步驟⑦候選新頻繁項目集的生成a處理新增醫(yī)學圖像,包括醫(yī)學圖像的格式轉換、尺度歸一化和去噪與增強;b采用基于密度聚類的醫(yī)學圖像分割方法分別識別出每幅樣本醫(yī)學圖像中待分析的局部區(qū)域;c分別提取出每幅樣本醫(yī)學圖像中局部區(qū)域的特征,形成新增醫(yī)學圖像樣本數(shù)據(jù)t,這些特征包括means(均值,它反映的是一副醫(yī)學圖像的平均灰度值)、variance(方差,它反映的是一副醫(yī)學圖像灰度在數(shù)值上的離散分布情況)、skewness(傾斜度,它反映的是醫(yī)學圖像直方圖分布的不對稱程度)、kurtosis(峰態(tài),它反映的是醫(yī)學圖像灰度分布在接近均值時的大致狀態(tài))、energy(能量,它反映的是灰度分布的均勻程度)、entropy(熵,它反映的是直方圖灰度分布的均勻性)和JF(聚類特征);d特征值離散化;e掃描t求得n(FI=FI1UFI2)中各項目集在t中的支持數(shù);f掃描t一次,確定T中的強頻繁項目集LT;g確定t中的候選強頻繁項目集C汰,k=l,2,...n;i.求t中的候選強頻繁項目集,所謂t中的強頻繁項目集是在指在t和tuT中均為頻繁的項目集;ii.使用函數(shù)Apriori-gen生成t中的候選新頻繁項目集,其參數(shù)為Ctk。本發(fā)明將新頻繁項目集的生成分為兩部分,一是T中新頻繁項目集的生成,二是t中新頻繁項目集的生成。對于前者,只需掃描t一次即可完成,其運算量是很少的。對于后者,本發(fā)明采用了一種新的方法,具體是①求t中的候選強頻繁項目集,所謂t中的強頻繁項目集是在指在t和tuT中均為頻繁的項目集;②使用函數(shù)Apriori-gen生成t中的候選新頻繁項目集,其參數(shù)為t中的候選強頻繁項目集,可以證明此方法可以生成t中所有的新頻繁項目集,且其規(guī)模將遠遠低于現(xiàn)有更新方法。⑧候選新頻繁項目集的修剪iii.確認新增醫(yī)學圖像樣本數(shù)據(jù)庫t的Qk是否為空,如果為空執(zhí)行步驟xW;iv.掃描t計算Qk中各項目集在t中的支持數(shù);V.刪除Qk中t的非頻繁k-項目集;vi.刪除Ctk中T的頻繁k-項目集;vii.確定最小候選項目數(shù)閾值mc,mc=max{10,|Lk|*10%},|Lk|AT中頻繁k-項目集的個數(shù);viii.確認ICtkpmc,如果成立,執(zhí)行步驟x;ix.掃描T計算Qk中各項目集在T中的支持數(shù);X.生成t中的強頻繁k-項目集Ltk';Xi.生成t中的候選強頻繁(k+l)-項目集Ct(k+1);xii.使k:k+l;xiii.重復執(zhí)行步驟iii;xiv.產(chǎn)生最新樣本數(shù)據(jù)庫中的頻繁項目集FIw、FIn2。本發(fā)明除使用常用的修剪方法外,還采用了一種新的修剪方法,艮P:刪除準則1:項目集XeCnk,minXT=min{CountT(Y)|YcX,|Y|=pC|-l}。如果Countt(X)+minXT<|Tut|xminSup,那么有XgLk,XgSFIt。其中,minSup表示最小支持度閾值,CountT(Y)表示項目集Y在T中的支持數(shù),Countt(X)表示項目集X在t中的支持數(shù),U為T中的頻繁k-項目集,SFIt為t中強頻繁項目集的集合。刪除準則2:對于項目集X,如果Supt(X)2minSup,且X為T中的非頻繁項目集,那么有XgLk,XgSFIt成立。其中,Supt(X)表示項目集X在t中的支持度。一般情況下,t的規(guī)模要遠遠低于T的規(guī)模,相對于原頻繁項目集規(guī)模而言,新增頻繁項目集的規(guī)??偸呛苄〉?,為此本發(fā)明設置了一個最小候選項目數(shù)閾值mc,并給出了閾值mc的確定方法,mc的值可以取10和|1^|*10%中的最大值,當候選新頻繁項目集的個數(shù)低于mc時,暫不計算其支持數(shù),其支持數(shù)在下次掃描T時一起計算,從而不必為了求少數(shù)個項目集的支持數(shù)而需掃描T一次。⑨關聯(lián)分類規(guī)則的構造及更新根據(jù)頻繁項目集構造關聯(lián)分類規(guī)則庫,關聯(lián)分類規(guī)則的形式為A^c,minsup,minconf。其中,c為類別屬性(在本發(fā)明中,c有兩類,即正常與異常),A為醫(yī)學圖像的特征及其范圍的集合,minsup、minconf分別表示關聯(lián)分類規(guī)則的支持度和置信度。如關聯(lián)分類規(guī)則variances(0.15,0.20)andJFe(0.90,0.95)-normal,minsupport=0.460,minconf=0.719。該規(guī)則表示若方差(variance)在0.15與0.20之間,聚類特征(JF)在0.90與0.95之間時,該醫(yī)學圖像為正常(normal)的概率為0.719,此規(guī)則的置信度為0.46。本發(fā)明在頻繁項目集的挖掘和更新中,主要在以下兩方面進行了改進1.在對現(xiàn)有頻繁項目集更新方法中所存在不足提出了如下的解決方案(1)候選項目集的規(guī)模。主要表現(xiàn)在以下兩個方面①在現(xiàn)有更新方法中,掃描t的候選項目集C=Apriori-gen(L'(k-d),在本發(fā)明中,掃描1的候選項目集0=Apriori-gen(L't(k-d)。由于LVd^L,t(^),因此在掃描t時,本發(fā)明將有更小的候選頻繁項目集;②在本發(fā)明中,一方面t中較小的候選頻繁項目集將導致較小的候選新頻繁項目集;另一方面,刪除準則1和2的使用進一步減少了候選新頻繁項目集的數(shù)目,因此,在掃描T時,本發(fā)明將具有更小的候選頻繁項目集。(2)掃描事務數(shù)據(jù)庫的次數(shù)。主要表現(xiàn)在以下兩個方面①一方面,T中更小的候選頻繁項目集將導致掃描T次數(shù)的減少。另一方面,步驟⑧中最小候選項目數(shù)閾值mc的設置可以進一步減少掃描T的次數(shù),因此,本發(fā)明中更新醫(yī)學圖像樣本數(shù)據(jù)庫時,掃描數(shù)據(jù)庫T的次數(shù)更少。②在現(xiàn)有更新方法中,掃描t的結束條件是Ctk=-,而在本發(fā)明中,掃描t的結束條件是<:,.汰=-。由于C汰2C,tk,因此本發(fā)明在掃描t的次數(shù)上較小??傊景l(fā)明在掃描醫(yī)學圖像樣本數(shù)據(jù)庫T的次數(shù)、掃描新增醫(yī)學圖像樣本數(shù)據(jù)庫t的次數(shù)以及候選項目集規(guī)模上均占較大的優(yōu)勢。作為本發(fā)明的進一步改進,所述醫(yī)學圖像的識別步驟進一步包括下列步驟①「待處理醫(yī)學圖像數(shù)據(jù)的準備及預處理,包括醫(yī)學圖像的格式轉換、尺度歸一化以及去噪與增強;②「采用基于密度聚類的醫(yī)學圖像分割方法識別出該幅醫(yī)學圖像中待分析的局部區(qū)域;③「提取出該幅醫(yī)學圖像中局部區(qū)域的特征,這些特征包括means(均值,它反映的是一副醫(yī)學圖像的平均灰度值)、variance(方差,它反映的是一副醫(yī)學圖像灰度在數(shù)值上的離散分布情況)、skewness(傾斜度,它反映的是醫(yī)學圖像直方圖分布的不對稱程度)、kurtosis(峰態(tài),它反映的是醫(yī)學圖像灰度分布在接近均值時的大致狀態(tài))、energy(能量,它反映的是灰度分布的均勻程度)、entropy(熵,它反映的是直方圖灰度分布的均勻性)和JF(聚類特征);④「特征值離散化;(D「根據(jù)關聯(lián)規(guī)則分類庫中的規(guī)則確定該醫(yī)學圖像的類別(正?;虍惓?。如給定一張醫(yī)學圖像,其類別屬性是未知的,經(jīng)預處理及特征提取后的特征值為VarianCe=0.17、JF=0.92,則根據(jù)關聯(lián)分類規(guī)則庫中已有的分類規(guī)則可以確定該醫(yī)學圖像為正常的概率為0.719,相應的置信度為0.46。圖1是本發(fā)明實施例的結構框圖圖2是本發(fā)明實施例中頻繁項目集挖掘流程圖圖3是本發(fā)明實施例中關聯(lián)分類規(guī)則庫構造流程圖4是本發(fā)明實施例中候選項目閾值與時間關系圖圖5是本發(fā)明實施例中頻繁項目集更新流程圖結構圖圖6是本發(fā)明實施例中的頻繁模式樹FPH結構圖具體實施例方式下面以肝臟CT醫(yī)學圖像為例,簡單地說明本發(fā)明的執(zhí)行過程。本實例共選擇了120幅肝臟CT圖像,其中正常圖像80幅,異常圖像40幅,具體執(zhí)行步驟如下如圖1所示,一種醫(yī)學圖像識別的方法,包括關聯(lián)規(guī)則分類庫的構造及其更新和醫(yī)學圖像識別步驟,其特征在于,所述關聯(lián)規(guī)則分類庫的構造及其更新步驟中包括下列步驟(1)分別對這120幅肝臟CT圖像進行格式轉換以及醫(yī)學圖像去噪和增強處理等。(2)分別提取每張圖像的相關特征并進行歸一化處理,結果如表1所示。本發(fā)明提取的特征包括均值、方差、傾斜度、峰態(tài)、能量、熵和聚類特征。在這120幅圖像中,前面100幅作為原樣本數(shù)據(jù),后20幅作為增量樣本數(shù)據(jù)。表l肝臟CT醫(yī)學圖像特征表<table>tableseeoriginaldocumentpage11</column></row><table><table>tableseeoriginaldocumentpage12</column></row><table><table>tableseeoriginaldocumentpage13</column></row><table><table>tableseeoriginaldocumentpage14</column></row><table><table>tableseeoriginaldocumentpage15</column></row><table>其中node-name記錄結點所表示的項目名,node-count記錄能到達該結點的醫(yī)學圖像數(shù),node-link為指向頻繁模式樹中具有相同的node-name值的下一結點,即通過node-link將頻繁模式樹中具有相同node-name值的結點鏈接起來,node-parent為指向父結點的指針。另外,為了方便樹遍歷,創(chuàng)建一個頻繁項目頭表,它由兩個域組成項目名稱item-name以及結點鏈頭node-head,其中node-head為指向頻繁模式樹中具有相同node-name值的首結點的指針。類別屬性為正常的前五條記錄所形成的頻繁模式樹如圖6所示,圖中結點形式已略做簡化。其余記錄可用同樣的方法插入樹FP"中。同樣可以構造頻繁模式樹FP2-t。(6)在FPrt、FP2-t上挖掘出頻繁項目集,得到頻繁項目集和FI2。設最小支持度為0.4,則FI產(chǎn)U聚類特征48》,{傾斜度=01},{聚類特征=18,傾斜度=01},{聚類特征=18,傾斜度=01,均值=20,熵=11,峰態(tài)=05},......},?12={{聚類特征=04},{聚類特征=04,方差=11,傾斜度=10,能量=04},......}。(7)使用FIi和Fl2構造關聯(lián)分類規(guī)則,如FIi中的頻繁項目集(聚類特征48,傾斜度=01,均值=20,熵=11,峰態(tài)=05}所構造的分類規(guī)則為{聚類特征=18,傾斜度=01,均值=20,熵-11,峰態(tài)=05}=*正常,F(xiàn)l2中的頻繁項目集(聚類特征-04,方差=11,傾斜度=10,能量=04}所構造的分類規(guī)則為{聚類特征=04,方差=11,傾斜度=10,能量^4)^異常。在實際使用時,應分別將數(shù)字屬性轉換成相應的區(qū)間,即將i,2,3,...,20分別轉換成(0.00,0.05],(0.05,0.10],...,(0.95,1.00]。關聯(lián)分類規(guī)則庫構造流程如圖3所示,具體包括①分別計算頻繁項目集FI,、Fl2在T2和T,中的支持數(shù);②根據(jù)閾值確定關聯(lián)規(guī)則分類規(guī)則;③存入關聯(lián)規(guī)則分類庫。(8)使用表1中的后20條記錄更新頻繁項目集FL和Fh。如FI!中的頻繁項目集{聚類特征=18,傾斜度=01,均值=20,熵=11,峰態(tài)=05}將變?yōu)閧聚類特征=18,傾斜度=01,均值=20,熵=11,峰態(tài)=04}等等。頻繁項目集FI,和Fl2更新過程如圖5所示。具體如下④候選新頻繁項目集的生成a處理新增醫(yī)學圖像,包括醫(yī)學圖像的格式轉換、尺度歸一化和去噪與增強;b采用基于密度聚類的醫(yī)學圖像分割方法分別識別出每幅樣本醫(yī)學圖像中待分析的局部區(qū)域;c分別提取出每幅樣本醫(yī)學圖像中局部區(qū)域的特征,這些特征包括means(均值,它反映的是一副醫(yī)學圖像的平均灰度值)、variance(方差,它反映的是一副醫(yī)學圖像灰度在數(shù)值上的離散分布情況)、skewness(傾斜度,它反映的是醫(yī)學圖像直方圖分布的不對稱程度)、kurtosis(峰態(tài),它反映的是醫(yī)學圖像灰度分布在接近均值時的大致狀態(tài))、energy(能量,它反映的是灰度分布的均勻程度)、entropy(熵,它反映的是直方圖灰度分布的均勻性)和JF(聚類特征);d特征值離散化,形成新增醫(yī)學圖像樣本數(shù)據(jù)庫t;e掃描t求得FI(FbFIi^Fl2)中各項目集在t中的支持數(shù);f掃描t一次,確定T中的強頻繁項目集LT;g確定t中的候選強頻繁項目集C汰,k=l,2,...n;i.求t中的候選強頻繁項目集,所謂t中的強頻繁項目集是在指在t和tuT中均為頻繁的項目集;ii.使用函數(shù)Apriori-gen生成t中的候選新頻繁項目集,其參數(shù)為Ctk。⑤候選新頻繁項目集的修剪iii.確認新增醫(yī)學圖像樣本數(shù)據(jù)庫t的Qk是否為空,如果為空執(zhí)行步驟xiv;iv.掃描t計算Qk中各項目集在t中的支持數(shù);V.刪除Qk中t的非頻繁k-項目集;Vi.刪除C汰中T的頻繁k-項目集;vii.確定最小候選項目數(shù)閾值mc,mc=max{10,|Lk|*10%},|Lk|AT中頻繁k-項目集的個數(shù);viii.確認ICtkpmc,如果成立,執(zhí)行步驟x;ix.掃描T計算Qk中各項目集在T中的支持數(shù);x.生成t中的強頻繁k-項目集Ltk,;xi.生成t中的候選強頻繁(k+l)-項目集Ct(k+1);xii.使k二k+l;xiii.重復執(zhí)行步驟iii;xiv.產(chǎn)生最新樣本數(shù)據(jù)庫中的頻繁項目集F^、FIn2。如圖1所示,肝臟CT醫(yī)學圖像類別識別流程如下⑥「待處理醫(yī)學圖像數(shù)據(jù)的準備及預處理,包括醫(yī)學圖像的格式轉換、尺度歸一化以及去噪與增強;⑦「采用基于密度聚類的醫(yī)學圖像分割方法識別出該幅醫(yī)學圖像中待分析的局部區(qū)域;⑧「提取出該幅醫(yī)學圖像中局部區(qū)域的特征,這些特征包括means(均值,它反映的是一副醫(yī)學圖像的平均灰度值)、variance(方差,它反映的是一副醫(yī)學圖像灰度在數(shù)值上的離散分布情況)、skewness(傾斜度,它反映的是醫(yī)學圖像直方圖分布的不對稱程度)、kurtosis(峰態(tài),它反映的是醫(yī)學圖像灰度分布在接近均值時的大致狀態(tài))、energy(能量,它反映的是灰度分布的均勻程度)、entropy(熵,它反映的是直方圖灰度分布的均勻性)和JF(聚類特征);⑨rf寺征值離散化;⑩「根據(jù)關聯(lián)規(guī)則分類庫中的規(guī)則確定該醫(yī)學圖像的類別(正?;虍惓?。權利要求1.一種醫(yī)學圖像識別的方法,包括關聯(lián)規(guī)則分類庫的構造及其更新和醫(yī)學圖像識別步驟,其特征在于,所述關聯(lián)規(guī)則分類庫的構造及其更新步驟中包括下列步驟(1)醫(yī)學圖像樣本數(shù)據(jù)的準備及預處理,包括醫(yī)學圖像的格式轉換、尺度歸一化以及去噪與增強;(2)采用基于密度聚類的醫(yī)學圖像分割方法分別識別出每幅樣本醫(yī)學圖像中待分析的局部區(qū)域;(3)分別提取出每幅樣本醫(yī)學圖像中局部區(qū)域的特征,構造醫(yī)學圖像樣本數(shù)據(jù)庫T,這些特征包括均值、方差、傾斜度、峰態(tài)、能量、熵和聚類特征;(4)特征值離散化;(5)挖掘醫(yī)學圖像樣本數(shù)據(jù)庫中的頻繁項目集;根據(jù)頻繁項目集構造關聯(lián)規(guī)則分類庫。2、根據(jù)權利要求1所述的方法,其特征在于,所述步驟(5)中進一步包括下列步驟①將醫(yī)學圖像樣本數(shù)據(jù)庫T分類,分為正常類T,和異常T2;②分別構造Ti、T2的類別屬性除外的頻繁模式樹FPH、FP2-t;③由FP廣t、FP2-t確定各自的頻繁項目集FI"FI2。3、根據(jù)權利要求1所述的方法,其特征在于,所述步驟(6)中進一步包括下列步驟④分別計算頻繁項目集FI卜Fb在丁2和1中的支持數(shù);⑤根據(jù)閾值確定關聯(lián)規(guī)則分類規(guī)則;⑥存入關聯(lián)規(guī)則分類庫。4、根據(jù)權利要求1所述的識別方法,其特征在于,頻繁項目集更新步驟中進一步包括下列步驟⑦候選新頻繁項目集的生成a處理新增醫(yī)學圖像,包括醫(yī)學圖像的格式轉換、尺度歸一化和去噪與增強;b采用基于密度聚類的醫(yī)學圖像分割方法分別識別出每幅樣本醫(yī)學圖像中待分析的局部區(qū)域;c分別提取出每幅樣本醫(yī)學圖像中局部區(qū)域的特征,形成新增醫(yī)學圖像樣本數(shù)據(jù)t,這些特征包括means(均值,它反映的是一副醫(yī)學圖像的平均灰度值)、variance(方差,它反映的是一副醫(yī)學圖像灰度在數(shù)值上的離散分布情況)、skewness(傾斜度,它反映的是醫(yī)學圖像直方圖分布的不對稱程度)、kurtosis(峰態(tài),它反映的是醫(yī)學圖像灰度分布在接近均值時的大致狀態(tài))、energy(能量,它反映的是灰度分布的均勻程度)、entropy(熵,它反映的是直方圖灰度分布的均勻性)和JF(聚類特征);d特征值離散化;e掃描t求得FI(FI=FIiUFI2)中各項目集在t中的支持數(shù);f掃描t一次,確定T中的強頻繁項目集LT;g確定t中的候選強頻繁項目集Qk,k=l,2,...n;i.求t中的候選強頻繁項目集,所謂t中的強頻繁項目集是在指在t和tuT中均為頻繁的項目集;ii.使用函數(shù)Apriori-gen生成t中的候選新頻繁項目集,其參數(shù)為Qk。①候選新頻繁項目集的修剪;②關聯(lián)分類規(guī)則的構造及更新。5、根據(jù)權利要求1所述的識別方法,其特征在于,所述醫(yī)學圖像的識別步驟進一步包括下列步驟③待處理醫(yī)學圖像數(shù)據(jù)的準備及預處理,包括醫(yī)學圖像的格式轉換、尺度歸一化以及去噪與增強;采用基于密度聚類的醫(yī)學圖像分割方法識別出該幅醫(yī)學圖像中待分析的局部區(qū)域;◎提取出該幅醫(yī)學圖像中局部區(qū)域的特征,這些特征包括均值、方差,、傾斜度,它反映的是醫(yī)學圖像直方圖分布的不對稱程度、峰態(tài)、能量和熵;⑥特征值離散化;⑦根據(jù)關聯(lián)規(guī)則分類庫中的規(guī)則確定該醫(yī)學圖像的類別。6、根據(jù)權利要求4所述的方法,其特征在于,所述步驟⑧具體包括下列步驟iii.確認新增醫(yī)學圖像樣本數(shù)據(jù)庫t的Ctk是否為空,如果為空執(zhí)行步驟xiv;iv.掃描t計算Qk中各項目集在t中的支持數(shù);V.刪除Qk中t的非頻繁k-項目集;Vi.刪除Qk中T的頻繁k-項目集;vii.確定最小候選項目數(shù)閾值mc,mc=max{10,|Lk|*10%},|Lk^T中頻繁k-項目集的個數(shù);viii.確認ICtkpmc,如果成立,執(zhí)行步驟x;ix.掃描T計算Qk中各項目集在T中的支持數(shù);X.生成t中的強頻繁k-項目集Ltk';Xi.生成t中的候選強頻繁(k+l)-項目集Q(k+1);xii.使k-k+l;xiii.重復執(zhí)行步驟iii;xiv.產(chǎn)生最新樣本數(shù)據(jù)庫中的頻繁項目集F^、FIn2。7、根據(jù)權利要求4所述的方法,其特征在于,所述步驟⑨具體包括下列步驟根據(jù)頻繁項目集構造關聯(lián)分類規(guī)則庫,關聯(lián)分類規(guī)則的形式為A^C,minsup,minconf;其中,c為類別屬性,包括正常類與異常類,A為醫(yī)學圖像的特征及其范圍的集合,minsup、minconf分別表示關聯(lián)分類規(guī)則的支持度和置信度。全文摘要本發(fā)明涉及一種醫(yī)學圖像識別的方法,目的在于提供一種能更準確地識別出新醫(yī)學圖像的類別的方法。該方法包括關聯(lián)規(guī)則分類庫的構造及其更新和醫(yī)學圖像識別步驟,所述關聯(lián)規(guī)則分類庫的構造及其更新步驟中包括下列步驟醫(yī)學圖像樣本數(shù)據(jù)的準備及預處理;采用基于密度聚類的醫(yī)學圖像分割方法分別識別出每幅樣本醫(yī)學圖像中待分析的局部區(qū)域;分別提取出每幅樣本醫(yī)學圖像中局部區(qū)域的特征,構造醫(yī)學圖像樣本數(shù)據(jù)庫T,這些特征包括均值、方差、傾斜度、峰態(tài)、能量、熵和聚類特征;特征值離散化;特征值離散化;挖掘醫(yī)學圖像樣本數(shù)據(jù)庫中的頻繁項目集;根據(jù)頻繁項目集構造關聯(lián)規(guī)則分類庫。文檔編號G06F19/00GK101295309SQ200810024999公開日2008年10月29日申請日期2008年5月22日優(yōu)先權日2008年5月22日發(fā)明者蕾孫,宋余慶,峰朱,朱玉全,謝從華,耿陳申請人:江蘇大學