半監督的高光譜遙感圖像分類標注方法
【專利摘要】針對高光譜遙感圖像分類標注問題,本發明公開了一種半監督的高光譜遙感圖像分類標注方法,該方法包括:通過人工樣本采集獲得少量已標注訓練樣本(含類別標注真值)、大量未標注訓練樣本和測試樣本;通過直推式支持向量機構造條件隨機場的關聯勢函數;通過改進的Potts模型構造條件隨機場的交互勢函數;通過遺傳算法對條件隨機場模型進行訓練;通過訓練得到的條件隨機場模型對測試樣本進行推斷,獲得其分類標注結果。本發明所得到的高光譜遙感圖像分類標注結果相比于單獨使用條件隨機場算法或直推式支持向量機的分類標注結果,去掉了大量的孤立噪聲點,具有較好的區域連續性且精度較高。
【專利說明】
半監督的高光譜遙感圖像分類標注方法
技術領域
[0001] 本發明屬于圖像處理和模式識別技術領域,尤其涉及一種半監督的高光譜遙感圖 像分類標注方法。
【背景技術】
[0002] 隨著遙感成像傳感器的快速發展,高光譜遙感成像已經逐步成為人類探索地球的 一種重要手段。大量高光譜遙感圖像的有效獲取,展示了人類獲取遙感數據的能力,為科學 研究的發展提供了完備的信息資源,同時也為高光譜遙感圖像處理技術提出了更高的要 求。
[0003] 在遙感領域中,高光譜圖像分類標注是遙感圖像處理技術中最基本的問題之一, 也是圖像分析和解譯的基礎。分類標注結果應用到后續的遙感圖像處理技術中,其好壞會 對分析結果產生根本的影響。另外,高光譜遙感圖像分類標注技術已經廣泛滲入到各個地 區和各種業務部門,應用研究領域涉及的領域廣、類型多且作用大。例如,在測繪方面,高光 譜遙感圖像分類可應用于專業地圖的制作、城市規劃以及交通規劃等;在農業方面,可應用 于自然災害預報和大氣氣象預測等;在資源方面,可應用于自然資源調查、土地和森林覆蓋 調查等;在軍事方面,可以用于典型背景的確定,作為目標檢測、識別的先驗條件。不斷高漲 的應用需求正推動著高光譜遙感圖像分類標注技術向高性能、高精度的方向發展。因此,高 光譜遙感圖像分類標注已經成為遙感領域中的研究熱點。
[0004] 高光譜遙感圖像分類標注是將高光譜遙感圖像中的所有像素按照某種屬性分為 若干類別的過程,其結果受到諸多因素影響,其中設計合適的分類算法尤為重要。通常情況 下,監督算法在解決高光譜遙感圖像分類標注問題時表現優異,例如支持向量機、條件隨機 場等。其中,條件隨機場在近幾年的高光譜遙感圖像分類標注中備受關注。它是一種判別式 的概率無向圖模型,由關聯勢函數和交互勢函數構成,并易于通過交互勢函數引入空間信 息,因此能夠較好地解決遙感圖像分類標注問題。但作為監督模型,條件隨機場的性能需要 大量的標注訓練樣本作為保障,然而樣本的標注工作需要消耗大量人力,大多數情況下需 要專業研究人員的工作。但是,如果已標注樣本數量不足,則無法有效估計條件隨機場模型 參數,這使得條件隨機場在少量標注訓練樣本條件下的遙感圖像分類標注的應用受到限 制。
【發明內容】
[0005] (1)發明目的:有鑒于此,本發明期望提供一種半監督的高光譜遙感圖像分類標注 方法,以解決在少量標注訓練樣本條件下的高光譜遙感圖像分類標注等技術問題。
[0006] (2)技術方案:本發明實施例提供了一種半監督的高光譜遙感圖像分類標注方法, 應用于包含兩種及以上地物類別的高光譜遙感圖像,所述方法包括:
[0007] 通過直推式支持向量機構造條件隨機場的關聯勢函數;
[0008] 通過改進的Potts模型構造條件隨機場的交互勢函數;
[0009] 通過遺傳算法對條件隨機場模型進行訓練;
[0010] 通過訓練得到的條件隨機場模型對測試樣本進行推斷,獲得分類標注結果。
[0011] 上述方案中,所述通過直推式支持向量機構造條件隨機場的關聯勢函數的步驟包 括:
[0012] 根據預設已標注樣本懲罰因子C、未標注樣本懲罰因子C',及訓練樣本,采用一對 一策略,訓練多組不同類別對對應的兩類直推式支持向量機,所述訓練樣本包含已標注訓 練樣本集1/ = 及其類別標注集巧={〇未標注訓練樣本集尤,公式為:
[0014] 其中,y ' j為未標注樣本X ' j對應的待估計標簽,在模型訓練中獲得;K(Xi,X) = [K (^41),一,1((^,&)]7為樣本^對應的核函數矩陣3=01311}為全部樣本集;1(為核函數;1( (x'j,X) = [K(x'j,xi),···,K(x'j,xn)]T為樣本X'j對應的核函數矩陣;θ = { ω,b, ε,ε '}為待 求解的模型參數,且有ω =[ ω1; ω2,··_,ωη],ε= , ε'= ?χ,;θ* = {co'bW,為待求解的模型參數θ的最優解;當類別數為L時,共需訓練LX(L_l)/2 個兩類直推式支持向量機,m表示已標注訓練樣本數量,nu表示未標注訓練樣本數量,總樣 本數量n = m+nu;
[0015] 根據訓練得到的LX (L_l)/2個兩類直推式支持向量機模型計算已標注訓練樣本 的不同類別對對應的兩類類別概率,公式為:
[0017] 其中,和分別為由類別對k和1對應的兩類直推式支持向量機得到的樣本Xl 的兩類類別概率,且有1?,1ε{1,2,···,?};
[0018] 根據所述已標注訓練樣本的不同類別對對應的兩類類別概率計算已標注訓練樣 本多類別概率,公式為
[0020]其中,Pi=(Pil,Pi2,···,PiL)為樣本Xi對應的多類別概率;[0021]根據所述已標注訓練樣本多類別概率定義關聯勢函數,公式為:
[0023]其中,1( ·)為指示函數。
[0024]上述方案中,所述通過改進的Potts模型構造條件隨機場的交互勢函數的步驟包 括:
[0025] 使用公式(2),根據所述訓練得到的LX(L_l)/2個兩類直推式支持向量機模型計 算已標注訓練樣本h的空間8領域樣本集合E (xi)中所包含的未標注樣本的不同類別對對應 的兩類類別概率;
[0026] 使用公式(3),根據所述已標注訓練樣本Xl的空間8領域樣本集合E(Xl)中所包含的 未標注樣本的不同類別對對應的兩類類別概率計算其多類別概率;
[0027]構建改進的Potts模型,并將其定義為條件隨機場模型中的交互勢函數,公式為:
[0029] 其中,pii=max(pii,pi2,…,piL)和pji=max(pji,pj2,…,pjL)分別為樣本Xi和Xj的多 類別概率的最大分量;y'j為最大分量對應的類別標簽;μ為交互勢函數中的待優化參數。
[0030] 上述方案中,所述通過遺傳算法對條件隨機場模型進行訓練的步驟包括:
[0031] 根據所述關聯勢函數和交互勢函數構建條件隨機場模型,公式為: 「00321
[0033] 其中,供D和Φ( ·)分別為由公式⑷定義的關聯勢函數和由公式(5)定義的交 互勢函數,Ζ(Χ〇為拆分函數,λ為預設折衷系數,為LX(L_l)/2個兩類直推式支持向量機 模型的最優參數;
[0034] 根據所述條件隨機場模型,計算偽對數似然函數,其公式如下:
[0035]
[0036] 根據預設折衷參數λ,定義所述偽對數似然函數為適應度函數,采用遺傳算法進行 優化,獲得交互勢函數最優參數f。
[0037] 上述方案中,所述通過訓練得到的條件隨機場模型對測試樣本進行推斷,獲得分 類標注結果包括:
[0038] 使用公式(2),根據訓練得到的LX(L_l)/2個兩類直推式支持向量機模型計算測 試樣本集Χτ中每個樣本xtex T及其空間8領域樣本集合E(xt)中所包含樣本的不同類別對對 應的兩類類別概率;
[0039] 使用公式(3),根據所述測試樣本XteXT及其空間8領域樣本集合E(Xt)所包含樣本 的不同類別對對應的兩類類別概率計算它們對應的多類別概率;
[0040] 根據所述公式(4)定義的關聯勢函數和公式(5)定義的交互勢函數,以及最優參數 θ'μL十算測試樣本XtexT對應的最終多類別概率仍=(_,仍2,…, PtL)及類別標簽yt,其中 各分量Ptl公式為:
[0042] 其中,yt為多類別概率?*=(陽,陽,"^)最大分量對應的類別標簽,即最終類別 標注結果。
[0043] 通過以上步驟,本發明實現了一種半監督的高光譜遙感圖像分類標注方法。(3)優 點:本發明所提供半監督的高光譜遙感圖像分類標注方法。該算法在條件隨機場框架的基 礎上,利用直推式支持向量機構建條件隨機場的關聯勢函數,采用改進的Potts模型構建條 件隨機場的交互勢函數,使得條件隨機場模型既能夠利用大量未標注樣本的信息,同時也 能夠在標注訓練樣本較少的情況下充分融合空間信息,有效地解決高光譜遙感圖像分類標 注問題。本發明所得到的高光譜遙感圖像分類標注結果相比于單獨使用條件隨機場算法或 直推式支持向量機的分類標注結果,去掉了大量的孤立噪聲點,具有較好的區域連續性且 精度較高。
【附圖說明】
[0044] 圖1為本發明實施例提供的半監督的高光譜遙感圖像分類標注方法流程圖;
[0045] 圖2為高光譜遙感圖像分類效果圖。其中,(a)為R0SIS傳感器拍攝的真實多光譜圖 像;(b)為類別真值圖;(c)為類別-顏色對照表;(d)為傳統條件隨機場的分類標注結果,(e) 為直推式支持向量機的分類標注結果;(f)本發明的分類標注結果。
[0046]為了能明確實現本發明實施例的結構,在圖中標注了特定的樣本數量和空間領域 范圍等,但這僅為示意需要,并非意圖將本發明限定在該特定的樣本數量和空間領域范圍 中。
【具體實施方式】
[0047] 在以下的描述中,將描述本發明的多個不同方面。然而,對于本領域內的專業技術 人員而言,可以僅僅利用本發明的一些或者全部結構或者流程來實施本發明。為了解釋的 明確性,闡述了特定樣本數量和空間領域范圍,但是很明顯,在沒有這些特定細節的情況下 也可以實施本發明。在其他情況下,為了不混淆本發明,對于一些眾所周知的特征將不再進 行詳細闡述。
[0048] 本發明提供了一種半監督的高光譜遙感圖像分類標注方法。該方法在條件隨機場 框架的基礎上,利用直推式支持向量機構建條件隨機場的關聯勢函數,采用改進的Potts模 型構建條件隨機場的交互勢函數,使得條件隨機場模型既能夠利用大量未標注樣本的信 息,同時也能夠在標注訓練樣本較少的情況下充分融合空間信息,有效地解決高光譜遙感 圖像分類標注問題。
[0049] 為了更好地理解本發明的技術方案,下面結合真實拍攝的高光譜遙感圖像詳細介 紹本發明。如圖1所示,所述方法包含以下步驟:
[0050] 步驟S101:通過人工樣本采集獲得少量已標注訓練樣本(含類別標注真值)、大量 未標注訓練樣本和測試樣本。
[0051 ]本實施例所述的高光譜遙感圖像由R0SIS傳感器拍攝的意大利Pavia大學的地表 覆蓋圖像,該高光譜圖像擁有103個波段,空間分辨率為1.3米,其顯示效果圖見圖2(a)。為 了方便研究,專家學者將該圖像分為9個類別,其類別真值圖及類別-顏色對照表分別見圖2 (b)和(c)〇
[0052]本實施例首先將高光譜遙感圖像的光譜特征進行歸一化處理,結合真值圖隨機提 取已標注訓練樣本集不=( n:表示已標注訓練樣本數量)、對應的類別標簽集 巧={乃^、未標注訓練樣本集表示未標注訓練樣本數量)和測試樣本集 表示測試樣本數量),并記總樣本數量為n = m+nu。其中,已標注訓練樣本為 每類圖像隨機選擇50個,因此m = 450,未標注訓練樣本數量為nu = 1000,剩下的樣本構成測 試樣本集。
[0053]步驟S102:通過直推式支持向量機構造條件隨機場的關聯勢函數。該步驟包含以 下四個子步驟,分別為:
[0054] 子步驟S1021:根據預設已標注樣本懲罰因子C、未標注樣本懲罰因子C',及訓練樣 本(包含已標注訓練樣本集不={七及其類別標簽集$ =丨只丨^和未標注訓練樣本集 采用一對一策略,訓練多組不同類別對對應的兩類直推式支持向量機,其公 式為
[0056]其中,y ' j為未標注樣本x ' j對應的待估計標簽,在模型訓練中獲得;K(Xi,X) = [K (^41),一,1((^,&)]7為樣本^對應的核函數矩陣3=01311}為全部樣本集;1(為核函數;1( (x'j,X) = [K(x'j,xi),···,K(x'j,xn)]T為樣本x'j對應的核函數矩陣;θ = { ω,b, ε,ε '}為待 求解的模型參數,且有 ω =[ ω1; ω2,··_,ωη],ε= ^ ; θ* = {co'bW,為待求解的模型參數θ的最優解;當類別數為L時,共需訓練LX(L_l)/2 個兩類直推式支持向量機;
[0057]子步驟S1022:根據訓練得到的LX(L_l)/2個兩類直推式支持向量機模型計算已 標注訓練樣本的不同類別對對應的兩類類別概率,其公式為:
[0059] 其中,和分別為由類別對k和1對應的兩類直推式支持向量機得到的樣本Xi 的兩類類別概率,且有1?,1ε{?,2,···,?};
[0060] 子步驟S1023:根據所述已標注訓練樣本的不同類別對對應的兩類類別概率計算 已標注訓練樣本多類別概率,其公式為
[0062]其中,Pi=(Pil,Pi2,···,PiL)為樣本Xi對應的多類別概率[0063]子步驟S1024:根據所述已標注訓練樣本多類別概率定義關聯勢函數,其公式為:
[0065]其中,1( ·)為指示函數。
[0066]步驟S103:通過改進的Potts模型構造條件隨機場的交互勢函數。該步驟包含以下 三個子步驟,分別為:
[0067]子步驟S1031:根據所述步驟S102中訓練得到的LX(L-l)/2個兩類直推式支持向 量機模型計算已標注訓練樣本^的空間8領域樣本集合E(Xl)中所包含的未標注樣本的不同 類別對對應的兩類類別概率,其公式同步驟S102中的公式(2);
[0068]子步驟S1032:根據所述已標注訓練樣本Xl的空間8領域樣本集合E(Xl)中所包含的 未標注樣本的不同類別對對應的兩類類別概率計算其多類別概率,其公式同步驟S102中的 公式(3);
[0069]子步驟S1033:構建改進的Potts模型,并將其定義為條件隨機場模型中的交互勢 函數,其公式為:
[0071]其中,pii=max(pii,pi2,…,piL)和pji=max(pji,pj2,…,pjL)分別為樣本Xi和Xj的多 類別概率的最大分量;y'j為最大分量對應的類別標簽;μ為交互勢函數中的待優化參數。 [0072]步驟S104:通過遺傳算法對條件隨機場模型進行訓練。該步驟包含以下三個子步 驟,分別為:
[0073] 子步驟S1041:根據所述關聯勢函數和交互勢函數構建條件隨機場模型,其公式 為:
[0074]
[0075] 其中,和Φ( ·)分別為所述步驟S102和步驟S103中所定義的關聯勢函數(公 式(4))和交互勢函數(公式(5)),Ζ(Χ〇為拆分函數,λ為預設折衷系數。在該公式中,為所 述步驟S102中對應的LX(L-l)/2個兩類直推式支持向量機模型的最優參數,因此該公式的 待優化參數僅為μ;
[0076] 子步驟S1042:根據所述條件隨機場模型,計算偽對數似然函數,其公式如下:
[0077]
[0078]子步驟S1043:根據預設折衷系數λ,定義所述偽對數似然函數為適應度函數,采用 遺傳算法進行優化,獲得交互勢函數最優參數μ'
[0079] 步驟S105:通過訓練得到的條件隨機場模型對測試樣本進行推斷,獲得其分類標 注結果。該步驟包含以下三個子步驟,分別為:
[0080] 子步驟S1051:根據所述步驟S102中所述訓練得到的LX(L-l)/2個兩類直推式支 持向量機模型計算測試樣本集Χτ中每個樣本XteXT及其空間8領域樣本集合E(xt)中所包含 樣本的不同類別對對應的兩類類別概率,其計算方法同步驟S102中所述公式(2);
[0081]子步驟S1052:根據所述測試樣本XteXT及其空間8領域樣本集合E( Xt)所包含樣本 的不同類別對對應的兩類類別概率計算它們對應的多類別概率,其計算方法同步驟S102中 所述公式(3);
[0082]子步驟S1053:根據所述公式(4)定義的關聯勢函數和公式(5)定義的交互勢函數, 以及最優參數計算測試樣本XtexT對應的最終多類別概,…,PtL)及類別 標簽yt,其中各分量pti公式為:
[0084] 其中,yt為多類別概率pt = (Pti,pt2,…,ptL)最大分量對應的類別標簽,即最終類別 標注結果。
[0085] 本發明以條件隨機場模型為基礎,通過定義直推式支持向量機作為條件隨機場模 型的關聯勢函數,從而嵌入大量未標注樣本信息,實現半監督分類,同時定義改進的Potts 模型為交互勢函數,使其在已標注樣本較少的情況下能夠充分融合空間信息。經過本發明 得到的高光譜遙感圖像分類標注結果精度較高,具有實際的應用效果,具有廣闊的應用價 值和市場前景。
【主權項】
1. 一種半監督的高光譜遙感圖像分類標注方法,應用于高光譜遙感圖像中地物類別的 分類標注,其特征在于,所述方法包括W下步驟: 通過直推式支持向量機構造條件隨機場的關聯勢函數; 通過改進的化tts模型構造條件隨機場的交互勢函數; 通過遺傳算法對條件隨機場模型進行訓練; 通過訓練得到的條件隨機場模型對測試樣本進行推斷,獲得分類標注結果。2. 根據權利要求1所述的方法,其特征在于,所述通過直推式支持向量機構造條件隨機 場的關聯勢函數的步驟包括: 根據預設已標注樣本懲罰因子C、未標注樣本懲罰因子C',及訓練樣本,采用一對一策 略,訓練多組不同類別對對應的兩類直推式支持向量機,所述訓練樣本包含已標注訓練樣 本集Λ,=樹;:1及其類別標注集};=從松和未標注訓練樣本集義={x也,公式為:其中,y/j為未標注樣本χ/苗?應的待估計標簽,在模型訓練中獲得;Κ(χι,Χ) = [Κ(χι, 又1),-',1(^1,加)^為樣本義1對應的核函數矩陣;《=^1,《。}為全部樣本集;1(為核函數;1( (X'j,x) = [K(x'j,xi),···,Κ(χ'j,Xn)]T為樣本X'j對應的核函數矩陣;θ = { ω,b, ε , ε '}為待 求解的模型參數,且有《=[?1,《2,...,《。],怎二巧:,備2,...公巧7,£二在4,...苗"了;白* = {〇AbW"}為待求解的模型參數喻最優解;當類別數為L時,共需訓練LXa-l)/2 個兩類直推式支持向量機,ni表示已標注訓練樣本數量,加表示未標注訓練樣本數量,總樣 本數量n = ni+nu; 根據訓練得到的LX化-1V2個兩類直推式支持向量機模型計算已標注訓練樣本的不 同類別對對應的兩類類別概率,公式為:其中,/7,W和pf分別為由類別對k和1對應的兩類直推式支持向量機得到的樣本XI的兩 類類別概率,且有1?,1ε{?,2,···,υ; 根據所述已標注訓練樣本的不同類別對對應的兩類類別概率計算已標注訓練樣本多 類別概率,公式為其中,Pi = (Pil,Pi2,· · ·,PiL )為樣本Xi對應的多類別概率; 根據所述已標注訓練樣本多類別概率定義關聯勢函數,公式為: 其中,1( ·)為指示巧數。3. 根據權利要求2所述的方法,其特征在于,所述通過改進的Potts模型構造條件隨機 場的交互勢函數的步驟包括: 使用公式(2),根據所述訓練得到的LX化-1V2個兩類直推式支持向量機模型計算已 標注訓練樣本XI的空間8領域樣本集合E(xi)中所包含的未標注樣本的不同類別對對應的兩 類類別概率; 使用公式(3),根據所述已標注訓練樣本XI的空間8領域樣本集合E(xi)中所包含的未標 注樣本的不同類別對對應的兩類類別概率計算其多類別概率. 構建改進的化tts模型,并將其定義為條件隨機場模型中的交互勢函數,公式為:其中,Pii=max(pii,pi2,…,piL)和pw = max(pji,pj2,…,pjL)分別為樣本xi和xj的多類別 概率的最大分量;為最大分量PW對應的類別標簽;μ為交互勢函數中的待優化參數。4. 根據權利要求3所述的方法,其特征在于,所述通過遺傳算法對條件隨機場模型進行 訓練的步驟包括: 根據所述關聯勢函數和交互勢函數構建條件隨機場模型,公式為:其中,Η ·)和Φ (·)分別為由公式(4)定義的關聯勢函數和由公式巧)定義的交互勢函 數,Ζ(Χι)為拆分函數,λ為預設折衷系數,化-1V2個兩類直推式支持向量機模型的 最優參數; 根據所述條件隨機場模型,計算偽對數似然函數,其公式如下:根據預設折衷參數λ,定義所述偽對數似然函數為適應度函數,采用遺傳算法進行優 化,獲得交互勢函數最優參數5.根據權利要求4所述的方法,其特征在于,所述通過訓練得到的條件隨機場模型對測 試樣本進行推斷,獲得分類標注結果包括: 使用公式(2),根據訓練得到的LX化-1)/2個兩類直推式支持向量機模型計算測試樣 本集Χτ中每個樣本xteXT及其空間8領域樣本集合E(xt)中所包含樣本的不同類別對對應的 兩類類別概率; 使用公式(3),根據所述測試樣本xteXT及其空間8領域樣本集合E(xt)所包含樣本的不 同類別對對應的兩類類別概率計算它們對應的多類別概率; 根據所述公式(4)定義的關聯勢函數和公式巧)定義的交互勢函數,W及最優參數 計算測試樣本xt eΧτ對應的最終多類別概率pt = (pti,pt2,···,ptL)及類別標簽yt,其中各分 量Pti公式為:其中,yt為多類別概率pt= (ptl,pt2,…,ptL)最大分量對應的類別標簽,即最終類別標注 結果。
【文檔編號】G06K9/62GK106096622SQ201610265798
【公開日】2016年11月9日
【申請日】2016年4月26日 公開號201610265798.1, CN 106096622 A, CN 106096622A, CN 201610265798, CN-A-106096622, CN106096622 A, CN106096622A, CN201610265798, CN201610265798.1
【發明人】姜志國, 張浩鵬, 吳俊峰, 史振威, 尹繼豪, 謝鳳英, 羅曉燕, 趙丹培
【申請人】北京航空航天大學