基于半監督稀疏鑒別嵌入的高光譜遙感影像分類方法
【專利摘要】本發明提供一種基于半監督稀疏鑒別嵌入的高光譜遙感影像分類方法,其采用半監督稀疏鑒別嵌入算法對高光譜遙感影像進行維數簡約,結合了近鄰流形結構及稀疏性的優點,不僅保留樣本間的稀疏重構關系,而且利用稀疏表示的自然判別能力,無需人為地選擇近鄰參數值,一定程度上緩解了近鄰參數選擇的困難,同時利用少量有標記訓練樣本以及部分無標記訓練樣本來發現蘊藏在高維數據的內在屬性以及低維流形結構,能夠提高對高光譜遙感影像中地物類別的分類精度;同時,本發明方法通過有區別的對待已標注數據與無標注數據,最大程度的增加相同地物類別的數據點之間的可聚性,從而在另一方面幫助提高對高光譜遙感影像中地物類別的分類精度。
【專利說明】基于半監督稀疏鑒別嵌入的高光譜遙感影像分類方法
【技術領域】
[0001]本發明涉及高光譜數據處理方法與應用【技術領域】,具體涉及一種基于半監督稀疏鑒別嵌入的高光譜遙感影像分類方法。
【背景技術】
[0002]高光譜遙感技術自20世紀80年代以來快速發展,其影像記錄了地物目標的連續光譜,包含的信息更豐富,具備了識別更多種類的地物目標以及更高精度進行目標分類的能力。但由于高光譜數據由大量波段構成高維特征空間,大多數算法的復雜度隨維數呈指數關系增長,對其處理需要更大的計算量,且其波段間具有高度相關性和冗余性,同時存在維數很高,分類時易因Hughes現象而無法獲得理想結果等問題。科學家通過研究發現:高光譜數據可被描述為在低維嵌入空間上的流形(Manifold),即:高維空間的點是在少數獨立變量的共同作用下在觀測空間張成一個流形,如果能有效的發現其內在的主要變量,便能更好地了解高維數據的本質屬性和特點。維數約減是解決以上問題的有效辦法,能夠降低數據的維數,得到高維數據有意義的低維表示,以便理解其內在的結構及后續處理。
[0003]迄今為止,在高維數據處理的研究領域中,國內外學者已經提出了一系列經典算法,其中應用較廣泛的降維算法主要包括:主成分分析(Principal Component Analysis,PCA)和線性判別分析(Linear Discriminant Analysis, LDA)等子空間學習方法。而PCA和LDA基于的假設是高維數據空間的嵌入子空間是線性的,隱藏在高維數據中的內在屬性較難被發現,因此無法揭示高光譜數據的低維流形結構。局部保持投影(Local PreservingProjrction, LPP)及鄰域保持嵌入算法(Neighborhood Preserving Embedding, NPE)等局部方法通過近鄰圖保留樣本的局部近鄰結構,在一定程度上保持了原始數據的非線性流形,但是這兩種算法依賴于人工預定義的近鄰圖,要獲得好的性能往往需要更多的訓練樣本,存在如近鄰參數選擇困難(如近鄰數k、核寬σ )、噪聲敏感等問題,分類效果受到限制。
[0004]稀疏保持投影(Sparsity Preserving Projections, SPP)是最近提出的一種基于稀疏表示理論的無監督降維算法。該算法不同于傳統方法的圖構建方式(如K-近鄰),其利用樣本間的稀疏重構關系建圖,是全局性的稀疏構圖算法,并歸結為LI范數最小化問題。SPP算法不僅利用稀疏表示的自然判別能力,而且無需人為地選擇近鄰參數值,一定程度上緩解了近鄰參數選擇的困難。在高光譜圖像分類中,常面對的是大量的未標記數據以及相對較少的有標記數據。雖然SPP算法無需對訓練樣本進行標記,但是沒有有效利用標記樣本中所提供的鑒別信息。因此,如何從標記數據以及未標記數據中提取出有用的知識來改善學習性能、提高分類精度,在高光譜圖像分類領域中尤為重要。
【發明內容】
[0005]針對現有技術存在的上述不足,本發明的目的在于提供一種基于半監督稀疏鑒別嵌入的高光譜遙感影像分類方法,其通過半監督稀疏鑒別嵌入算法對高光譜遙感影像進行維數簡約,利用少量有標記訓練樣本以及部分無標記訓練樣本來發現蘊藏在高維數據的內在屬性以及低維流形結構,以提高對高光譜遙感影像中地物類別的分類精度。
[0006]為了實現上述目的,本發明采用了如下的技術手段:
[0007]基于半監督稀疏鑒別嵌入的高光譜遙感影像分類方法,包括如下步驟:
[0008]I)讀入高光譜遙感影像數據;[0009]2)將高光譜遙感影像中每一個數據點根據其光譜波段生成一個光譜數據向量,從而由各個數據點的光譜數據向量組成整幅高光譜遙感影像的光譜數據矩陣;
[0010]3)從高光譜遙感影像中選取部分數據點作為樣本數據點,由各個樣本數據點的光譜數據向量組成樣本數據矩陣,并根據先驗知識從樣本數據矩陣中選取部分樣本數據點的光譜數據向量進行已知地物類別的標注,生成相應的樣本類別標簽;
[0011]4)將樣本數據矩陣中的每個光譜數據向量進行稀疏表示,求得各個光譜數據向量的最優稀疏系數向量,從而得到樣本數據矩陣對應的稀疏系數矩陣;
[0012]5)借助樣本數據矩陣中標注有向量類別標簽的樣本數據點的光譜數據向量,構建用于度量樣本數據矩陣中光譜數據向量之間相似性的近鄰圖;
[0013]6)根據近鄰圖計算樣本數據矩陣對應的近鄰權重矩陣;
[0014]7)根據目標優化函數,利用樣本數據矩陣對應的稀疏系數矩陣和近鄰權重矩陣計算高光譜遙感影像的投影矩陣;
[0015]8)通過投影矩陣將高光譜遙感影像投影到低維嵌入空間,得到高光譜遙感影像的嵌入特征矩陣;
[0016]9)以嵌入特征矩陣作為高光譜遙感影像中地物類別的分類識別特征,利用K-近鄰分類算法對高光譜遙感影像進行地物類別的分類,得出地物類別的分類結果。
[0017]上述基于半監督稀疏鑒別嵌入的高光譜遙感影像分類方法中,作為進一步改進方案,所述步驟2)具體為:
[0018]根據不同光譜波段對地物的光譜反射特性,將高光譜遙感影像轉換為Q行B列的光譜數據矩陣Xq=Ix1, x2, *.., xq,…^(^,其中,Q表示高光譜遙感影像的數據點空間尺寸且Q=MXN, B表示高光譜遙感影像的光譜波段數;光譜數據矩陣Xq中的每一行表示高光譜遙感影像中的一個數據點在各個光譜波段上的光譜數據值,每一列表示高光譜遙感影像中各個數據點在一個光譜波段的光譜數據值表示高光譜遙感影像中一個數據點在各個光譜波段上的光譜數據值所構成的光譜數據向量,q e {I, 2,-,Q} ;T為矩陣轉置符號。
[0019]上述基于半監督稀疏鑒別嵌入的高光譜遙感影像分類方法中,作為進一步改進方案,所述步驟3)得到的樣本數據矩陣具體為:
【權利要求】
1.基于半監督稀疏鑒別嵌入的高光譜遙感影像分類方法,其特征在于,包括如下步驟: 1)讀入高光譜遙感影像數據; 2)將高光譜遙感影像中每一個數據點根據其光譜波段生成一個光譜數據向量,從而由各個數據點的光譜數據向量組成整幅高光譜遙感影像的光譜數據矩陣; 3)從高光譜遙感影像中選取部分數據點作為樣本數據點,由各個樣本數據點的光譜數據向量組成樣本數據矩陣,并根據先驗知識從樣本數據矩陣中選取部分樣本數據點的光譜數據向量進行已知地物類別的標注,生成相應的樣本類別標簽; 4 )將樣本數據矩陣中的每個光譜數據向量進行稀疏表示,求得各個光譜數據向量的最優稀疏系數向量,從而得到樣本數據矩陣對應的稀疏系數矩陣; 5)借助樣本數據矩陣中標注有向量類別標簽的樣本數據點的光譜數據向量,構建用于度量樣本數據矩陣中光譜數據向量之間相似性的近鄰圖; 6)根據近鄰圖計算樣本數據矩陣對應的近鄰權重矩陣; 7)根據目標優化函數,利用樣本數據矩陣對應的稀疏系數矩陣和近鄰權重矩陣計算高光譜遙感影像的投影矩陣; 8)通過投影矩陣將高光譜遙感影像投影到低維嵌入空間,得到高光譜遙感影像的嵌入特征矩陣; 9)以嵌入特征矩陣作為高光譜遙感影像中地物類別的分類識別特征,利用K-近鄰分類算法對高光譜遙感影像進行地物類別的分類,得出地物類別的分類結果。
2.根據權利要求1所述的基于半監督稀疏鑒別嵌入的高光譜遙感影像分類方法,其特征在于,所述步驟2)具體為: 根據不同光譜波段對地物的光譜反射特性,將高光譜遙感影像轉換為Q行B列的光譜數據矩陣Xq=Ix1, X2,..., Xq, ".,XqIt,其中,Q表示高光譜遙感影像的數據點空間尺寸且Q=MXN, B表示高光譜遙感影像的光譜波段數;光譜數據矩陣Xq中的每一行表示高光譜遙感影像中的一個數據點在各個光譜波段上的光譜數據值,每一列表示高光譜遙感影像中各個數據點在一個光譜波段的光譜數據值表示高光譜遙感影像中一個數據點在各個光譜波段上的光譜數據值所構成的光譜數據向量,qe {1,2,-,Q} ;T為矩陣轉置符號。
3.根據權利要求1所述的基于半監督稀疏鑒別嵌入的高光譜遙感影像分類方法,其特征在于,所述步驟3)得到的樣本數據矩陣具體為:
X- { (Xl,li),(^2)工2),...,(Xi,Ii),...,(Xe,I。),Xc+1,-^C+2)...,XrJ ; 其中,X表示樣本數據矩陣,Xi表示從高光譜遙感影像中選取的一個樣本數據點的光譜數據向量,Ii表示對光譜數據向量Xi標注的樣本類別標簽,i e {1,2,…,η} ,η表示從高光譜遙感影像中選取作為樣本數據點的數量,樣本數據矩陣X中前C個光譜數據向量具有樣本類別標簽,其余的n-C個光譜數據向量無樣本類別標簽。
4.根據權利要求1所述的基于半監督稀疏鑒別嵌入的高光譜遙感影像分類方法,其特征在于,所述步驟4)具體為: 41)對樣本數據矩陣 X中的任一個光譜數據向量Xi,i e {1,2,...,!!},η表示從高光譜遙感影像中選取作為樣本數據點的數量,利用樣本數據矩陣X中的其它各個光譜數據向量建立Xi的稀疏線性方程:i+1Xi+1+* * *+Si; nXn ; 其中,XjSi表示光譜數據向量Xi的稀疏表示向量,Xj表示樣本數據矩陣X中除Xi以外的光譜數據向量集,Si表示光譜數據向量Xi的稀疏系數向量,即:
Q...Q...QQ...Q \ ,
l^i, 1> ^i, 2> > ^i, j> > ^i, 1-l> ^i, i+l> > ^i, nJ , Si,j表示Xi的稀疏線性方程中對應于光譜數據向量&的稀疏系數,j e {1,2,...,η}且j關i ; 42)根據稀疏表示約束條件minis!和松弛約束條件|| X1-X si | | ^ ε對Xi的稀疏線性
siJ方程進行求解,得到Xi的同時滿足稀疏表示約束條件和松弛約束條件的最優稀疏系數向量S1-1i為LI范數運算符;M.I I為歐氏距離運算符;ε為松弛變量值,且0〈 ε <10 ; 43)重復今驟41)~42),求得樣本數據矩陣X中的每一個光譜數據向量Xi的最優稀疏系數向量s構成樣本數據矩陣對應的稀疏系數矩陣S:
S = {sl5i2,...,*,-,...,sj。
5.根據權利要求1所述的基于半監督稀疏鑒別嵌入的高光譜遙感影像分類方法,其特征在于,所述步驟5)中,近鄰圖構建方法具體為: 51)對于樣本數據矩陣X中任一個標注有向量類別標簽的光譜數據向量Xi對應的數據點,利用該數據點的k個近鄰數據點構建的近鄰數據集Mnixi) =xf表示光譜數據向量Xi所對應數據點的k個近鄰數據點之中任一個近鄰數據點的光譜數據向量,d e {1,2,...,k}; 52)將近鄰數據集knn(Xi)為兩部分: —D(X,) = Uf如果xf和Xi標注有不同的樣本類別標簽}; knns (Xi) =knn (Xi) _knnD (Xi); 其中,knnD(Xi)表示光譜數據向量Xi的1^個近鄰數據點中來自于不同地物類別的數據點組成的相異近鄰數據子集,knns(Xi)則為近鄰數據集knn(Xi)中除相異近鄰數據子集knnD(Xi)以外的部分組成的相似近鄰數據子集; 53)重復步驟51)~52),對樣本數據矩陣X中每一個標注有向量類別標簽的光譜數據向量構建對應的相似近鄰數據子集; 53)構建近鄰圖Gw:對于樣本數據矩陣X中每一個標注有向量類別標簽的光譜數據向量Xi,考慮樣本數據矩陣X中每一個其它的光譜數據向量\ e X,i,若滿足Xj e knns (Xi),則在近鄰圖Gs中用一條邊連接Xi和\所對應的兩個數據點,由此遍歷完成近鄰圖Gs的構建。
6.根據權利要求1所述的基于半監督稀疏鑒別嵌入的高光譜遙感影像分類方法,其特征在于,所述步驟6)中的近鄰權重矩陣Ww按如下公式計算:
7.根據權利要求1所述的基于半監督稀疏鑒別嵌入的高光譜遙感影像分類方法,其特征在于,所述步驟7)具體為:目標函數J(V)為:
8.根據權利要求1所述的基于半監督稀疏鑒別嵌入的高光譜遙感影像分類方法,其特征在于,所述步驟8)中,高光譜遙感影像的嵌入特征矩陣通過下式進行投影得到:Y=VtXq,其中,Y表示高光譜遙感影像的光譜數據矩陣Xq通過投影矩陣V投影到低維嵌入空間的嵌入特征矩陣,T為矩陣轉置符號。
【文檔編號】G06K9/62GK103593676SQ201310635210
【公開日】2014年2月19日 申請日期:2013年11月29日 優先權日:2013年11月29日
【發明者】黃鴻, 曲煥鵬 申請人:重慶大學