本發明涉及模擬腫瘤擴散的研究領域,特別涉及一種基于互關聯規則的鼻咽癌原發病灶臨床靶區自動勾畫方法。
背景技術:
調強放射治療(IntensityModulatedRadiationTherapy,IMRT)是目前治療鼻咽癌的主流放療技術,精確的靶區勾畫是臨床放療計劃成功的前提,對鼻咽癌的治療、治療方案各項參數的統計學評估以及病人治療后的生活質量,都有著極為關鍵的影響。目前,靶區勾畫主要依賴醫生的手動勾畫。現醫院使用的ABAS靶區勾畫系統實現了在三維方向上,硬性擴展醫生指定的數值范圍作為預防照射靶區,之后,再根據醫生的臨床經驗,結合ICRU(InternationalCommissionRadiologicalUnits,83report,2010)給出的大概勾畫標準,對結果進行修改。
手動勾畫的靶區,由于觀察者之間存在的主觀勾畫差異,導致靶區的勾畫結果出現很大的差別。這樣的差異,給后續的治療、治療方案效果及參數的統一評估造成了影響。同時,醫生針對一個病人的靶區勾畫,通常需要至少2-3個小時。現存的ABAS靶區勾畫系統只能實現在三維方向上,硬性擴展用戶指定的數值范圍作為預防照射靶區。
技術實現要素:
本發明的主要目的在于克服現有技術的缺點與不足,提供一種基于互關聯規則的鼻咽癌原發病灶臨床靶區自動勾畫方法,方法首次被應用于腫瘤擴散模型模擬,不僅提高了醫生的工作效率,同時能夠給后續放療計劃提供精確的預測區域,并對后續治療方案、劑量體積參數的評估和晚期損傷的相關性研究提供一個條件一致的評估基礎平臺。
為了達到上述目的,本發明采用以下技術方案:
本發明的一種基于互關聯規則的鼻咽癌原發病灶臨床靶區自動勾畫方法,包括下述步驟:
S1、生成鼻咽原發腫瘤區域的二值圖像,所述二值圖像為:讀入醫生勾畫好的腫瘤輪廓文件,對應腫瘤區域的圖像像素格點置1,不含腫瘤區域的像素格點置0;
S2、去掉二值圖像中腫瘤表面的不穩定數據,所述的不穩定數據是指:腫瘤表面的數據,由于拍片時間不同,會導致腫瘤表面最外層體素聯合出現的頻數計算出現誤差;
S3、對模板CT的圖像序列進行數據離散操作,將圖像序列劃分并生成對應三維網格;
S4、在三維的腫瘤區域內,對體素聯合出現的頻數進行統計,建立關聯規則的數據庫;
S5、讀入需要勾畫臨床靶區的新病人大體腫瘤數據,使用胡關聯規則,模擬腫瘤生長,自動勾畫出臨床放療靶區,具體為:以腫瘤邊界處的三個相鄰體素為索引,在頻繁項集合數據庫中,找出與該索引相關聯的候選體素,再根據互關聯規則,判斷腫瘤下一步將侵犯的體素位置。
作為優選的技術方案,步驟S1中,所述腫瘤區域采用判斷像素點是否在多邊形內的方法InPolygon,分開非腫瘤與腫瘤區域。
作為優選的技術方案,步驟S2中,去掉二值圖像中腫瘤表面的不穩定數據的方法為:
對N例病人在模板CT圖像上的腫瘤區域運用腐蝕算法imageerosion,去掉最外層的會對頻數統計造成影響的不穩定數據,具體的,腫瘤區域erosion的計算公式為:
式中B(x)是結構元素,對空間E中的每一點,結構元素B(x)平移之后,X為使B包含于E的點構成的集合。
作為優選的技術方案,步驟S3具體為:
S301、將模板CT的圖像序列進行網格化,將CT圖像序列劃分為width×height×zLen的三維網格,其中,width和height分別是一個CT切片橫向和縱向上的格點數目,zLen為模板CT的層數,讀取N例病人的GTV數據文件在模板CT上占位的網格號并存儲。
作為優選的技術方案,步驟S4中,還包括下述步驟:S401、遍歷生成的占位三維網格,生成頻繁項集合,所述頻繁項集,分為頻繁一項集、頻繁二項集、頻繁三項集和頻繁四項集,具體的生成方式如下:
遍歷之前步驟中生成的占位三維網格,統計每個屬于GTV區域內部的體素格點在N例病人中出現的頻數,記為頻繁一項集;再依次統計空間上連續的兩個體素格點,在所有病例中,同時出現的頻數,記為頻繁二項集;同理,再依次生成頻繁三項集和頻繁四項集,具體的判定連續的判斷條件為:空間距離小于的格點被認為連續。
作為優選的技術方案,步驟S5具體為:
S501、讀入需要勾畫臨床靶區的新病人大體腫瘤數據,對新病人的腫瘤區域進行網格化處理,生成新病人的頻繁三項集;
S502、以腫瘤邊界處的三個相鄰體素組成的頻繁三項集為索引,在頻繁項集合數據庫中,找出與該索引相關聯的候選體素,并找出對應頻繁四項集的頻數,依據互關聯規則,判斷腫瘤下一步將侵犯的體素位置。
作為優選的技術方案,步驟S501具體為:
計算該病人腫瘤區域的表面格點坐標,遍歷所有邊緣格點,以每一個格點為中心,在其周圍x×y×z=5×5×3的立方體網格區內找尋空間位置連續的格點三項集{i,j,k},在此三項集的基礎上,找尋一個位于腫瘤區外部并與該三項集在空間上連續的節點l,組成四項集{i,j,k,l}。
作為優選的技術方案,步驟S502中,腫瘤是否會擴散到l號格點的計算公式為:
式中P(l)是需要考慮的是否新增的潛在腫瘤擴散點,l,i,j,k為中離散化的網格序號,Freset3和Freset4的值分別表示{i,j,k}和ascent{l,i,j,k}頻繁項點集在N例GTV中出現的頻數,ascent{l,i,j,k}表示對集合{l,i,j,k}進行升序排列;其中,三項集由腫瘤區域內部的體素格點組成,且至少包含一個以上腫瘤邊緣格點,四項集中的新增點為空間上與三項集相鄰的腫瘤區域外的點;T表示一個頻繁度閾值,多次試驗之后,由臨床醫生根據經驗選擇0.5作為判斷是否擴散的標準閾值;Freset4/Freset3的計算依據為概率統計中的P(B|A)=P(AB)/P(A),即:在A發生的條件下,同時發生B的概率,因此,Freset4(ascent{l,i,j,k})/Freset3(i,j,k)可理解為,在(i,j,k)這三個相鄰體素點已被腫瘤侵犯時,與之相鄰的體素點l,被包括在腫瘤擴散危險區域的概率,P(l)=1時,表示l體素點屬于危險區域,需要被預防照射;反之,則不需要將l體素點勾畫進預防照射區域。
本發明與現有技術相比,具有如下優點和有益效果:
1、與現有方法相比,本發明基于大量的訓練集,能夠自動精確地勾畫出預防照射靶區,在現存的ABAS靶區勾畫系統只能實現在三維方向上,硬性擴展用戶指定的數值范圍作為預防照射靶區。
2、與目前人工勾畫相比,本系統實現了勾畫自動化,提高了醫生的工作效率,勾畫結果達到醫生要求的勾畫標準,局部的調整將作為后處理,提供給醫生選擇。
3、本發基于大量的經臨床驗證治療有效的訓練集,創新性的提出使用互關聯規則算法Apriori,用來模擬腫瘤生長的模型。通過Apriori算法猜測顧客的消費習慣的模式,將NPC腫瘤在局部位置之間的擴散行為看作是有互關聯性,通過統計找出這一規律,統計頻繁的同時出現腫瘤的圖像子區域,并挖掘這些子區域之間互現關聯的規律,生成頻繁項集和互關聯關系的數據庫;進而,在已知新病人GTV的情況下,預測GTV擴散的行為,最終實現CTV的自動勾畫。
附圖說明
圖1是本發明方法的二值圖像生成示意圖。
圖2是本發明方法中的頻繁項數據集生成示意圖。
圖3是本發明方法中,基于互關聯規則的CTV預測過程示意圖。
圖4是本發明方法的一個實施例的程序流程圖。
具體實施方式
下面結合實施例及附圖對本發明作進一步詳細的描述,但本發明的實施方式不限于此。
本發明中的相關術語如下所示:
鼻咽癌(Nasopharyngeal Carclnoma,NPC):是指發生于鼻咽腔頂部和側壁的惡性腫瘤,也被稱為“廣東瘤”,根據世界衛生組織調查報告,全球有80%的鼻咽癌患者在中國。
腫瘤區(grosstumorvolume,GTV):指臨床可見、可通過診療檢查手段(包括CT和MRI)證實的腫瘤范圍。
鼻咽癌原發病灶臨床靶區(clinicaltargetvolume,CTV):除包含GTV外,還包括顯微鏡下可見的、亞臨床灶以及腫瘤可能侵犯的范圍。
Apriori互關聯算法:是一種挖掘關聯規則的頻繁項集算法,主要包括候選集生成和情節的向下封閉檢測兩個階段。
計算機斷層掃描(ComputedTomography,CT):利用精確準直的X線束、γ射線、超聲波等,與靈敏度極高的探測器一同圍繞人體的某一部位作一個接一個的斷面掃描,具有掃描時間快,圖像清晰等特點,可用于多種疾病的檢查。
像素(pixel):圖像元素的簡稱。像素是構成數碼影像的基本單元,是二維空間的最小單位。
體素(voxel):三維圖像體積元素的簡稱。數字數據于三維空間分割上的最小單位,用于三維成像、醫學影像等領域。概念類似于二維空間的最小單位——像素。
實施例
本實施例一種基于互關聯規則的鼻咽癌原發病灶臨床靶區自動勾畫方法,包括下述步驟:
S1、生成鼻咽原發腫瘤區域的二值圖像,如圖1所示,二值圖像生成的具體步驟為:
S101、讀入醫生勾畫好的腫瘤輪廓文件,對應腫瘤區域的圖像像素格點置1,不含腫瘤區域的像素格點置0。
所述腫瘤區域將運用判斷像素點是否在多邊形內的方法(InPolygon),分開非腫瘤區域與腫瘤區域。具體的InPolygon的計算公式為:
IN=InPolygon(x,y,xv,yv)
式中IN為輸出的二值圖像,其尺寸與原始輸入CT圖像I(x,y)相同,(x,y)為像素點的坐標,(xv,yv)為GTV輪廓上的點坐標。
S2、去掉腫瘤外層不穩定數據;
所述的不穩定數據,是指腫瘤表面的數據,由于拍片時間不同,會導致腫瘤表面最外層體素聯合出現的頻數計算出現誤差。因此,首先要對N例病人在模板CT圖上的腫瘤區域運用腐蝕算法。具體的,腫瘤區域erosion的計算公式為:
式中B(x)是結構元素,對空間E中的每一點,結構元素B(x)平移之后,X為使B包含于E的點構成的集合。我們所選的結構元素是一個3×3的結構,由此,最外層的數據將會被移除。
S3、生成基于互關聯規則的頻繁項集,如圖2所示,具體包括:
S301、生成三維網格;
把二值圖像序列按照其所在不同的CT層面,生成三維網格。具體的生成方式為:按照每個格子表示2×0.9765625mm物理距離,將圖像序列劃分為格點數目為width×height×zLen的三維網格。width和height的值,由N例病人中腫瘤所侵犯的區域決定,zLen為模板CT的層數。
S4、在三維的腫瘤區域內,對體素聯合出現的頻數進行統計,建立關聯規則的數據庫。
S401、基于上述步驟生成的二值圖像組成的三維網格,統計頻繁項集。
具體分為:遍歷整個三維網格,統計在N例病人中,單個體素出現的頻數(稱為頻繁一項集),空間上相鄰兩個體素同時被腫瘤侵犯的頻數集合(頻繁二項集)、相鄰三個體素同時被腫瘤侵犯的頻數集合(頻繁三項集)及相鄰四個體素同時被腫瘤侵犯的頻數集合(頻繁四項集)。頻繁項集保存為:
式中m的具體計算公式為:
m=z×(width×height)+(x-1)×(height)+y
(x,y)為像素點在CT切片中的坐標位置,z為像素點所在的CT層面。num的數值則表示當前頻繁項在N例病例中出現的頻數。頻繁項集合中的具體每一個頻繁項存儲滿足數值升序排列及在空間上相鄰。
S5、讀入需要勾畫臨床靶區的新病人大體腫瘤數據,如圖3所示,使用互關聯規則,模擬腫瘤生長,勾畫CTV,具體包括:
S501、讀入需要勾畫臨床靶區的新病人大體腫瘤數據,對新病人的腫瘤區域進行網格化處理,生成新病人的頻繁三項集。
具體分為,計算該病人腫瘤區域的表面格點坐標(三維層面),遍歷所有邊緣格點,以每一個格點為中心,在其周圍x×y×z=5×5×3的立方體網格區內找尋空間位置連續的格點三項集{i,j,k}。在此三項集的基礎上,找尋一個位于腫瘤區外部并與該三項集在空間上連續的節點l,組成四項集{i,j,k,l}。
S502、以腫瘤邊界處的三個相鄰體素組成的三項集為索引,在頻繁項集數據庫中,找出與該索引相關聯的候選體素,并找出對應頻繁四項集的頻數。依據互關聯規則,判斷腫瘤下一步將侵犯的體素位置。
具體的腫瘤是否會擴散到l號格點的計算公式為:
式中P(l)是需要考慮的是否新增的潛在腫瘤擴散點,l,i,j,k為步驟S501中離散化的網格序號。Freset3和Freset4的值,分別表示{i,j,k}和ascent{l,i,j,k}頻繁項點集在N例GTV中出現的頻數,ascent{l,i,j,k}表示對集合{l,i,j,k}進行升序排列。其中,三項集由腫瘤區域內部的體素格點組成,且至少包含一個以上腫瘤邊緣格點,四項集中的新增點為空間上與三項集相鄰的腫瘤區域外的點。T表示一個頻繁度閾值,多次試驗之后,由臨床醫生根據經驗選擇0.5作為判斷是否擴散的標準閾值。Freset4/Freset3的計算依據為概率統計中的P(B|A)=P(AB)/P(A),即:在A發生的條件下,同時發生B的概率。因此,Freset4(ascent{l,i,j,k})/Freset3(i,j,k)可理解為,在(i,j,k)這三個相鄰體素點已被腫瘤侵犯時,與之相鄰的體素點l,被包括在腫瘤擴散危險區域的概率。P(l)=1時,表示l體素點屬于危險區域,需要被預防照射。反之,則不需要將l體素點勾畫進預防照射區域。優選的,步驟S5中,循環上限的次數為m次,如圖4所示。
第一種情況:
即在頻繁項集中,當前頻繁四項集ascent{l,i,j,k}在M例病人中出現的頻數,與腫瘤邊界處的空間上相鄰的三項集{i,j,k}在M例病人中出現的頻數的比例大于0.5;比如說,我們認為在1000例病人中,假設{i,j,k}的頻數為900,那么只有當ascent{l,i,j,k}在1000例病人數據中,同時出現的頻數大于450例時,我們才會認為腫瘤邊界外的體素點l屬于會被腫瘤擴散的風險區域。
第二種情況:
與第一種情況類似。
本發明實施方式提供的一種基于互關聯規則的自動勾畫鼻咽癌放射治療臨床靶區的方法,提供一種基于模擬腫瘤生長模型的全自動計算機勾畫方法。該方法首次被應用于腫瘤擴散模型模擬,不僅提高了醫生的工作效率,同時能夠給后續放療計劃提供精確的預測區域,并對后續治療方案、劑量體積參數的評估和晚期損傷的相關性研究提供了一個條件一致的評估基礎平臺。
上述實施例為本發明較佳的實施方式,但本發明的實施方式并不受上述實施例的限制,其他的任何未背離本發明的精神實質與原理下所作的改變、修飾、替代、組合、簡化,均應為等效的置換方式,都包含在本發明的保護范圍之內。