專利名稱:基于支持向量機的尿沉渣有形成分自動識別系統的制作方法
技術領域:
本發明技術涉及一種基于支持向量機的尿沉渣有形成分自動識別系統,屬于醫療 器械技術領域。
背景技術:
尿沉渣有形成分分析是臨床常規檢驗工作中比較重要的一項,也是當前醫生判斷 泌尿系統疾病的重要手段之一,對腎臟和尿路疾患的診斷具有極為重要的價值。常規尿沉渣有形成分檢測方法是通過在顯微鏡下觀察或通過攝像裝置攝像后對 圖片進行觀察并進行人工識別。該方法具有一定的主觀性和隨意性,工作量大且定量結論 不十分可靠。隨著計算機技術的應用和發展,人們逐步開發了基于計算機圖像處理和模式 識別方法的尿沉渣有形成分自動識別和分析方法,與傳統的人工鏡檢方法比較起來,自動 分析方法具有很多優點,比如試驗步驟統一,可擴展性好,便于醫院的信息管理,通過計算 機自動處理不會疲勞等,可大大減輕醫務工作者的勞動強度,有效避免漏檢或重復計數并 提高計數的準確度。考慮到尿沉渣有形成分自動分析技術的先進性及其廣泛的臨床應用前景,如何將 統計學習理論中先進的支持向量機方法和構建尿沉渣有形成分自動識別系統兩者相結合, 以便快速有效地識別尿液中的有形成分,實已成為本領域技術人員亟待解決的技術課題。
發明內容
本發明的目的在于提供一種基于支持向量機的尿沉渣有形成分自動識別系統,以 實現對尿樣的自動識別。為達上述目的及其他目的,本發明的基于支持向量機的尿沉渣有形成分自動識別 系統,包括用于采集顯微鏡下的多份尿樣本圖像和待識別的尿樣圖像的圖像采集模塊; 用于存儲所采集的尿樣本圖像和待識別的尿樣圖像的圖像數據庫;用于提供初次標注界 面,以便專家在所述初次標注界面中將所采集的各尿樣本圖像標注為已知分類結果的圖像 的初次標注模塊;用于按照預設的算法對各已知分類結果的圖像和待識別的尿樣圖像分別 進行包含預處理、圖像分割、粘連區域處理在內的處理后,將每一份圖像分割為一個個獨立 的子區域的圖像處理模塊;用于提供再次標注界面,以便專家在所述再次標注界面中將每 一已知分類結果的圖像的各子區域的圖像所對應的尿沉渣有形成分予以標注的再次標注 模塊;用于按照預設的特征提取法自各具有相同尿沉渣有形成分的子區域圖像中提取圖像 像素特征,以形成包含尿沉渣有形成分與相應圖像像素特征的對應關系的多個支持向量機 分類器的支持向量機形成模塊;以及用于根據多個支持向量機分類器,按照預設的特征提 取法自經過圖像處理模塊所處理過的待識別的尿樣圖像的各子區域中提取圖像像素特征, 以便識別出尿樣包含的尿沉渣有形成分的尿沉渣有形成分識別模塊。綜上所述,本發明的基于支持向量機的尿沉渣有形成分自動識別系統通過將圖像 分割與處理、支持向量機訓練和尿沉渣有形成分識別三大環節有機融合在一起,可有效識
3別出尿液中的有形成分。
圖1是本發明的基于支持向量機的尿沉渣有形成分自動識別系統基本架構示意 圖。圖2是本發明的基于支持向量機的尿沉渣有形成分自動識別系統的采集的尿沉 渣圖像示例圖。圖3是本發明的基于支持向量機的尿沉渣有形成分自動識別系統的工作過程示 意圖。
具體實施例方式請參閱圖1,本發明的基于支持向量機的尿沉渣有形成分自動識別系統至少可包 括圖像采集模塊、圖像數據庫、初次標注模塊、圖像處理模塊、再次標注模塊、支持向量機 形成模塊、以及尿沉渣有形成分識別模塊等。所述圖像采集模塊用于采集顯微鏡下的多份尿樣本圖像和待識別的尿樣圖像。通 常作為尿樣本圖像數目盡可能多一些,以便能包含正常尿液和各種常見異常尿液的情形。所述圖像數據庫用于存儲所采集的尿樣本圖像和待識別的尿樣圖像。所述初次標注模塊用于提供初次標注界面,以便專家在所述初次標注界面中將所 采集的各尿樣本圖像標注為已知分類結果的圖像。所述圖像處理模塊用于按照預設的算法對各已知分類結果的圖像和待識別的尿 樣圖像分別進行包含預處理、圖像分割、粘連區域處理在內的處理后,將每一份圖像分割為 一個個獨立的子區域,其中,所述預設的算法包括區域生長法、邊緣分割法、小波分析法以 及閾值法等,可以采用其中一種算法來處理圖像,也可采用多種算法結合的方式來處理圖 像,通常可以針對具體的尿沉渣圖像采集模塊的特點選擇合適的圖像分割算法。比如在圖 2中,考慮到所采集的尿沉渣圖像整體對比度不是很高,而且存在因為刻度對焦不準造成的 低對比、高寬度黑線狀圖像元素干擾,比較適合用邊緣檢測法進行處理,而運用其他方法的 處理效果則不甚理想。所述再次標注模塊用于提供再次標注界面,以便專家在所述再次標注界面中將每 一已知分類結果的圖像的各子區域的圖像所對應的尿沉渣有形成分予以標注。所述支持向量機形成模塊用于將具有相同尿沉渣有形成分的子區域綜合,以形 成包含尿沉渣有形成分與相應圖像像素特征的對應關系的多個支持向量機分類器(即 Support VectorMachin^SVM)。其中,常用的圖像像素特征包括(1)利用圖像的灰度信息 獲取的特征如當前像素點的灰度值,當前像素點鄰域的灰度均值、中值,方差等。(2)從圖 像灰度共生矩陣中導出的特征如比對度、相關性、熵、角二階矩、反差矩、方差、和均值、 和熵、和方差,差熵、差方差等。(3)從圖像灰度梯度共生矩陣中導出的特征如能量、灰度 平均、梯度平均、焜合熵、慣性逆差矩、小梯度優勢、大梯度優勢、灰度分布不均勻性、梯度分 類不均勻性、灰度均方差、梯度均方差、相關、灰度熵、梯度熵等。通過專家已標注好的各有 形成分的子區域作為標準,通過特征選擇、計算和優化過程,即可選取多個切實合適的特征 構成SVM訓練的特征集合,并進一步在經過優化選擇的特征集合基礎上訓練與特定有形成分識別相對應的分類器,常用的SVM有三類即上皮和結晶分類器;管型和結晶分類器;以 及紅白細胞、結晶和細菌分類器。由于每一分類器包含的圖像像素特征較多,比如,有前述 的利用圖像的灰度信息獲取的特征、從圖像灰度共生矩陣中導出的特征、和從圖像灰度梯 度共生矩陣中導出的特征,這樣可以將每一分類器按照圖像像素特征的不同分為多個子分 類器。一般說來,需要對每一種尿沉渣有形成分都要形成一個分類器,但不同有形成分訓 練時所選取的特征集合可以不同。不同特征集合下,SVM分類器形成的基本原理是一致的。 對同一特征集合下具有η個類別的情況(η > 2),則以第i(i = 1,…,η)類的樣本作為正 類,其它類樣本作為反例進行訓練,得到識別第i類的一個二元分類器,依次訓練η次得到 η個二元分類器,再由η個二元分類器組成一個η元分類器,最終形成一個多元分類器。所述尿沉渣有形成分識別模塊用于根據多個SVM分類器,自經過圖像處理模塊所 處理過的待識別的尿樣圖像的各子區域中提取圖像像素特征,以便識別出尿樣包含的尿沉 渣有形成分。上述基于支持向量機的尿沉渣有形成分自動識別系統的工作流程如圖3所示, 即(需要說明的是,圖中虛線表示訓練過程,實線表示實際識別過程)1)圖像數據庫的建立和樣本的標注為了解決尿沉渣有形成分分類問題,首先要建立圖像數據庫,即對大量典型的尿 沉渣樣本圖像由專家或專科醫生進行半自動或手動標記,使其成為已知分類結果的圖像。 將所有專家標注過的樣本圖像加入訓練樣本集合中,而未標注過的或待識別的尿沉渣圖像 樣本構成測試樣本集合。現將訓練樣本的標注方法簡介如下對于訓練樣本集合中的樣本,首先請醫院醫 生或專家在初次標注模塊所提供的初次標注界面中對圖像中有各種有形成分的圖像標注。 例如,標注為紅細胞樣本、白細胞樣本、管形樣本、結晶樣本、其他有形成分樣本等等。然后 將專家標注過的樣本圖像經圖像處理模塊的圖像預處理、圖像分割、粘連區域處理等過程 后,分割為與特定尿沉渣有形成分對應的一個個獨立的待分類子區域,將這些分割出的子 區域結合專家標注信息進一步予以甄別,在再次標注模塊所提供的再次標注界面中進行 “再次標注”,即標注出有形成分,以便為計算機自動進行進一步的特征選擇和訓練步驟做 好準備。2)圖像分割與處理圖像分割與處理過程主要由圖像處理模塊完成,其包含圖像預處理、圖像分割和 粘連圖像處理三個基本步驟和問題。比如對圖2采用邊緣檢測法進行處理。3)支持向量機訓練支持向量機訓練的目的主要是通過專家已標注好的各有形成分的圖像作為標準, 通過特征選擇、計算和優化過程,選取多個切實合適的特征構成SVM訓練的特征集合,并進 一步在經過優化選擇的特征集合基礎上訓練與特定有形成分識別相對應的分類器。一般情 況下,只有在尿沉渣有形成分細分類的過程中才需要SVM分類器,而需要訓練的分類器有 三類上皮和結晶;管型和結晶;紅白細胞、結晶和細菌。每一類都對應特定的特征集合。每一類SVM分類器操作的具體步驟為對于特征選擇和優化所獲得的相應的特征 集合,對訓練樣本集中每一幅圖像獲得的相應標注成分分別計算各特征,形成特征向量,將 各特征向量作為相應成分按類別選擇對應的特征集合輸入SVM進行訓練,最終獲得各自對
5應的SVM分類器。需要特別說明的是,SVM分類器的類別對應于不同的特征集合,而在同一特征集合 下分類器訓練所得參數的不同又可形成多個分類器。因此對上述三類SVM分類器而言,每 一類又包括兩個或多個分類器。一般說來,需要對每一種尿沉渣有形成分都要訓練一個分 類器,但不同有形成分訓練時所選取的特征集合可以不同。不同特征集合下,SVM分類器訓 練的基本原理是一致的。對同一特征集合下具有η個類別的情況(η > 2),則以第i(i = 1,…,η)類的樣本作為正類,其它類樣本作為反例進行訓練,得到識別第i類的一個二元 分類器,依次訓練η次得到η個二元分類器,再由η個二元分類器組成一個η元分類器,最 終形成多元分類器。需要指出的是尿沉渣有形成分自動識別系統中,特征選擇和優化也是系統成敗的 關鍵問題之一。關于尿沉渣有形成分自動識別過程中,可用于支撐向量機訓練的特征很多,如前 所述,一般說來,良好的特征應具有如下特點①可區別性。對于屬于不同類別的圖像,它們的特征值應具有明顯的差異。②可靠性。對于同類的圖像,它們的特征值應比較相近。③獨立性。所使用的各特征之間應彼此不相關。④數量盡可能少。圖像識別系統的復雜度隨著特征數量的增多迅速變大,為減少 訓練分類器和尿沉渣有形成分識別所消耗的時間,提高系統效率,這也是必須要注意的問題。立足于如上要求,尿沉渣有形成分特征選擇和優化的方法很多,包含人工選取方 法和遺傳算法、蟻群算法、聚類算法等計算機輔助選擇方法,使用者可以根據各自方便程度 和實際需要加以選擇。在實驗所獲得特征數據量不是很大的情況下,也可采用人工選擇的 方法。4)尿沉渣有形成分的識別尿沉渣有形成分的識別是由尿沉渣有形成分識別模塊完成的,主要基于所選擇的 測試樣本或新采集的圖像樣展開的,主要分為基于子區域面積、緊湊度等特征開展的粗分 類和基于所訓練的SVM分類器所進行的細分類兩個過程。需要指出的是,在細分類步驟中, 結晶、管型等還可存在進一步劃分,這要具體看所設計的尿沉渣系統的性能要求和實際臨 床需要。當需要細分類時其處理依然可以基于圖3所示的基本框圖展開,只不過需要增加 額外數目的SVM分類器。此外,需要說明的是,經過識別后的尿樣圖像也可以加入到訓練樣本集合中,進而 可其進行訓練,由此可根據實際出現的各種尿樣圖像不斷更新SVM分類器,使各種異常的 尿液樣本也能被識別。綜上所述,本發明的基于支持向量機的尿沉渣有形成分自動識別系統將圖像分割 與處理、支持向量機訓練和尿沉渣有形成分識別三大環節有機融合在一起,構成一個系統 而完整的基于SVM方法進行尿沉渣有形成分訓練和自動識別的技術框架。可用于顯微鏡視 野中的尿沉渣有形成分的分割、訓練和自動識別過程,為基于顯微鏡進行尿常規計算機輔 助檢測系統的實現提供基本解決方案。上述實施例僅列示性說明本發明的原理及功效,而非用于限制本發明。任何熟悉此項技術的人員均可在不違背本發明的精神及范圍下,對上述實施例進行修改。因此,本發 明的權利保護范圍,應如權利要求書所列。
權利要求
一種基于支持向量機的尿沉渣有形成分自動識別系統,其特征在于包括圖像采集模塊,用于采集顯微鏡下的多份尿樣本圖像和待識別的尿樣圖像;圖像數據庫,用于存儲所采集的尿樣本圖像和待識別的尿樣圖像;初次標注模塊,用于提供初次標注界面,以便專家在所述初次標注界面中將所采集的各尿樣本圖像標注為已知分類結果的圖像;圖像處理模塊,用于按照預設的算法對各已知分類結果的圖像和待識別的尿樣圖像分別進行包含預處理、圖像分割、粘連區域處理在內的處理后,將每一份圖像分割為一個個獨立的子區域;再次標注模塊,用于提供再次標注界面,以便專家在所述再次標注界面中將每一已知分類結果的圖像的各子區域的圖像所對應的尿沉渣有形成分予以標注;支持向量機形成模塊,用于按照預設的特征提取法自各具有相同尿沉渣有形成分的子區域圖像中提取圖像像素特征,以形成包含尿沉渣有形成分與相應圖像像素特征的對應關系的多個支持向量機分類器;尿沉渣有形成分識別模塊,用于根據多個支持向量機分類器,按照預設的特征提取法自經過圖像處理模塊所處理過的待識別的尿樣圖像的各子區域中提取圖像像素特征,以便識別出尿樣包含的尿沉渣有形成分。
2.如權利要求1所述的基于支持向量機的尿沉渣有形成分自動識別系統,其特征在 于圖像像素特征為來自圖像的灰度信息,其包括圖像的灰度均值、中值、和方差。
3.如權利要求1所述的基于支持向量機的尿沉渣有形成分自動識別系統,其特征在 于圖像像素特征為來自圖像灰度共生矩陣中導出的特征,其包括比對度、相關性、熵、角 二階矩、反差矩、方差、和均值、和熵、和方差,差熵、以及差方差。
4.如權利要求1所述的基于支持向量機的尿沉渣有形成分自動識別系統,其特征在 于圖像像素特征來自圖像灰度梯度共生矩陣中導出的特征,其包括能量、灰度平均、梯 度平均、焜合熵、慣性逆差矩、小梯度優勢、大梯度優勢、灰度分布不均勻性、梯度分類不均 勻性、灰度均方差、梯度均方差、相關、灰度熵、以及梯度熵。
5.如權利要求1所述的基于支持向量機的尿沉渣有形成分自動識別系統,其特征在 于所形成的支持向量機分類器有上皮和結晶分類器;管型和結晶分類器;以及紅白細 胞、結晶和細菌分類器。
6.如權利要求8所述的基于支持向量機的尿沉渣有形成分自動識別系統,其特征在 于所形成的每一分類器各自根據圖像像素特征的不同又分為多個子分類器。
7.如權利要求1所述的基于支持向量機的尿沉渣有形成分自動識別系統,其特征在 于所述預設的算法包括區域生長法、邊緣分割法、小波分析法以及閾值法。
8.如權利要求1所述的基于支持向量機的尿沉渣有形成分自動識別系統,其特征在 于所述預設的特征提取法包括人工選取方法、遺傳算法、蟻群算法、聚類算法。
全文摘要
本發明提供一種基于支持向量機的尿沉渣有形成分自動識別系統,其包括圖像采集模塊、圖像數據庫、初次標注模塊、圖像處理模塊、再次標注模塊、支持向量機形成模塊、以及尿沉渣有形成分識別模塊等,通過將圖像分割與處理、支持向量機訓練和尿沉渣有形成分識別三大環節有機融合在一起,構成一個系統而完整的基于SVM方法進行尿沉渣有形成分訓練和自動識別的技術框架。可用于顯微鏡視野中的尿沉渣有形成分的分割、訓練和自動識別過程,為基于顯微鏡進行尿常規計算機輔助檢測系統的實現提供基本解決方案。
文檔編號G06K9/60GK101900737SQ201010197330
公開日2010年12月1日 申請日期2010年6月10日 優先權日2010年6月10日
發明者樊曉燕, 鄭建立, 陳兆學 申請人:上海理工大學