一種腫瘤病理圖像自動快速分割方法
【技術領域】
[0001] 本發明屬于圖像處理技術領域,特別涉及一種腫瘤病理圖像自動快速分割方法。
【背景技術】
[0002] 癌癥在發達國家已經成為主要死亡原因之一,以結直腸癌為例,是目前世界第三 大惡性腫瘤。目前的病理切片診斷由于具有全彩色、圖像分辨率高的特點,已經成為腫瘤檢 測的重要手段之一。但是目前腫瘤診斷完全依靠病理學醫生的人工操作,不但效率慢,而且 準確性受醫生主觀判斷影響大。因此,基于病理的計算機輔助診斷系統具有很大的意義,有 研宄表明,病理計算機輔助診斷系統的輸出結果可以為醫生在腫瘤檢測、定征和診斷決策 時提供一種參考。
[0003]圖像分割是腫瘤病理計算機輔助系統的重要環節。近十幾年來,國內外在醫學圖 像分割方面已經提出了很多算法,包括閾值分割、區域生長、基于模型的方法(包括活動輪 廓模型,水平集,馬爾科夫隨機場等)、基于圖論的方法(包括圖割,歸一化割等)、基于機 器學習的方法、基于聚類的方法(包括K均值,模糊C均值等)。這些方法存在一些主要缺 點:(1)多數方法需要手工交互;(2)多數方法對噪聲敏感,且由于超聲圖像對比度低,具有 與組織相關的紋理,故準確分割較為困難;(3)多數方法算法復雜度高,處理時間長,難以 滿足臨床要求。
[0004] 準確、快速、自動化分割是圖像分割的目標。但分割的準確性、效率以及自動化水 平也是相互矛盾的。近些年來,也有一些多分辨率自動分割方法相繼被提出,這些方法的一 般思路為:(1)在低分辨率下,通過某種全局特征自動找到能夠將腫瘤涵括在內的感興趣 區域;(2)在高分辨率下,通過某種局部特征進行進一步優化分割。但是這些方法存在以下 問題:(1)多分辨率的值是固定的,往往魯棒性不高,僅對部分圖像有效,影響了自動分割 的準確性;(2)目前自動分割的技術路線和病理學醫生的人工思路有較大分歧,帶來的結 果有兩種,一是算法不適應病理學圖像,分割精度不高;二是算法復雜程度非常高,處理時 間非常長,難以達到臨床上對自動分割的速度要求。
【發明內容】
[0005]發明目的:針對現有技術中存在的不足,本發明的目的在于提供一種腫瘤病理圖 像自動快速分割方法,具有準確、快速、自動化等特點。
[0006] 技術方案:為了實現上述發明目的,本發明采用的技術方案如下:
[0007] -種腫瘤病理圖像自動快速分割方法,其特征在于:首先采用高斯金字塔算法對 腫瘤原始病理圖像進行濾波,分別得到從1倍、2倍、4倍、8倍、16倍的病理學圖像,通過RGB 顏色模型和形態學"閉操作"在1倍分辨率圖像上確定包含腫瘤的初始感興趣區域;同時應 用巴式距離從1倍分辨率到4倍分辨率進行初始腫瘤感興趣區域的迭代優化,當巴式距離 達到設定閾值,判斷RGB顏色模型對腫瘤感興趣區域貢獻已經降低到0 ;再使用收斂指數濾 波算法進行深度精確分割的自適應高分辨率選擇,從而在最適合的高分辨率下進行進一步 分割;最后使用基于隨機投影的詞袋模型將腫瘤感興趣區域中的正常組織和腫瘤組織分割 出來,實現最終腫瘤分割。
[0008] 所述的腫瘤病理圖像自動快速分割方法,包括如下步驟:
[0009] 1)建立基于詞袋BoW模型的腫瘤分類訓練、測試數據庫,構建texton字
[0010] 典,并訓練出線性支持向量機LinearSVM模型(LinearSVM模型參考論文 "LIBLINEAR:Alibraryforlargelinearclassification" 的方法);
[0011] 2)將待分割的腫瘤病理圖像,分別生成從1倍、2倍、4倍、8倍、16倍分辨率的病理 圖像;
[0012] 3)從1倍分辨率圖像開始使用RGB顏色直方圖模型和形態學閉操作得到包含腫瘤 的初始感興趣區域;
[0013] 4)在得到的初步分割結果基礎上,重復步驟3),得到更新后的感興趣區域,并通 過巴式距離計算2個感興趣區域的差異,如果差異大于閾值,繼續重復步驟(3),直到差異 小于閾值跳轉到高一倍分辨率圖像,終止條件達到閾值或者達到4倍分辨率,得到優化后 的感興趣區域;
[0014] 5)在優化后感興趣區域中,在中心區域選擇200X200像素框的圖像;
[0015] 6)用收斂指數濾波算法對步驟5)所選的區域進行細胞檢測,如果細胞數量小于 閾值,則跳轉到高一層分辨率,繼續重復步驟5)、6);終止條件達到閾值,得到BoW分類最佳 分辨率;
[0016] 7)在步驟6)確定的最佳分辨率所映射的優化后感興趣區域中,按照長寬 200X200像素分割成若干塊圖片,用MR8濾波器對每一個塊圖片進行濾波,得到MR8特征;
[0017] 8)在步驟7)基礎上,用隨機投影算法對圖像進行降維,得到稀疏化的MR8特征;
[0018] 9)用稀疏化后的MR8特征和步驟1)所得到的texton詞典進行數據編碼得到新的 直方圖特征;
[0019] 10)用步驟1)得到的LinearSVM模型對所得到的直方圖特征進行分類,篩選出在 優化后的感興趣區域中的腫瘤部分,最終分割出腫瘤。
[0020] 步驟1)具體操作如下:
[0021] 首先由臨床醫生對腫瘤病理學圖像進行人工分割,確定哪些區域是腫瘤組織,哪 些區域是正常組織,形成分類好的groundtruth數據庫;基于groundtruth數據庫,分別 對從8倍和16倍分辨率,按照200X200像素對數據庫進行分割;并按照50/50形成訓練數 據集和測試數據集;用MR8濾波器對每一個塊圖片進行濾波,得到40000維的MR8特征;用 隨機投影算法對MR8特征降維,得到稀疏化的MR8特征;用Ll-norm范數對訓練數據集進行 texton詞典聚類;Texton聚類模型公式表示如下
[0024]式中,A= [a"a2,…,aN]GRlxn 是編碼矩陣,X=[X"x2,? ? ?,xN]GRmx% 原始圖像矩陣,D=[屯,d2, . . .djGRM>a是Texton聚類模型,ai,i= 1,2. . .,N是義4的 L維編碼向量
i是a均值;參數A和y是正標量,用來控制texton的子 詞典dj是一個正交矩陣。
[0025] 本模型較傳統Ll-norm范數模型增加了
一項和=1的約束條 件,目的是考慮到每個分類中的訓練樣本Xi相似性較大,所以xi對應的編碼向量也基本上 相似,因此在公式中強制編碼向量a,接近其均值y。也就是求解
本質 上增加這一項可以減少內部分類變化,提高最終的分類精確性。
[0026] 每個子分類含texton數量為40個;用texton詞典對稀疏化后的MR8特征進行編 碼得到新的直方圖特征;用SVM針對訓練集和測試集進行SVM建模,得到針對腫瘤的SVM模 型。
[0027] 步驟2)中,1倍到16倍分辨率通過高斯金字塔濾波算法獲得,具體包括:對原始 32倍分辨率圖像分別進行高斯模糊和偶數行采樣,分別得到16倍、8倍、4倍、2倍、1倍圖 像;公式表示如下:
[0029] 式中,i是金字塔級數,a,b分別是圖像長和寬;W(m,n) =W(m)XW(n)是長度為5 的高斯卷積核。
[0030] 步驟3)中,初始R0I區域獲得,具體為:對1倍圖像分別采樣R,B通道的顏色直方 圖信息,記作hisK,hisB;分別對hisK,hisB進行平滑處理,并用均值算法獲得hisK,hisd9 均值;以均值為中心點分別上下浮動15個單位,作為R通道和B通道的顏色分割閾值;對圖 像進行第一次處理;用形態學閉操作算法,閉操作參數選擇為11 ;將圖像中所有的點進行 融合,并形成1個閉合模板;將圖像映射到1倍圖像中得到初始感興趣區域。
[0031] 步驟4)中,優化R0I區域獲得,具體包括:在初始感興趣區域循環執行步驟3),每 次得到新的感興趣區域和