一種高光譜數據處理方法
【技術領域】
[0001] 本發明涉及一種高光譜數據處理方法,屬于高光譜數據信息提取領域。
【背景技術】
[0002] 高光譜數據光譜分辨率較高,可以發現許多視覺和先驗信息無法確定的未知信號 特征。但與此同時,空間分辨率相對較低,影像中普遍存在混合像元現象,線性光譜解混模 型在高光譜數據分析中能夠給出令人滿意的結果。光譜解混精度主要取決于端元提取精 度,根據假定影像數據中是否存在純凈像元可將端元提取算法分為兩類:端元識別算法和 端元生成算法。基于線性混合模型的端元識別算法有效利用了線性混合模型和凸體幾何理 論的強對應關系,將端元提取巧妙地轉化為尋找高光譜數據空間體積最大的單形體頂點問 題。但此類算法假定所用端元都存在于場景中這一假設并不可靠,尤其在異質性較高的影 像場景中。
[0003] 端元生成算法在一定程度上克服了端元識別算法在假設前提上的不足,可以提取 出存在于混合像元中的端元。該類算法主要從端元的幾何特征和光譜解混誤差這兩個角度 出發,分為三類:一是基于端元的幾何特性,即混合像元位于以端元為頂點的單形體中,但 該方法是非凸規劃問題,容易陷入局部最優,對初值依賴很大。二是利用解混誤差來進行約 束,需要預先設置端元數目或誤差閾值,不同的參數設置對結果影響很大。三是通過解混誤 差和端元的幾何特性共同約束進行的,約束條件下的非負矩陣分解在物理意義上和光譜解 混模型比較吻合,在光譜解混中獲得了一定的研宄與應用,但對初值的依賴性很大,需要通 過其他端元提取算法進行初始化,而且對端元數目的估計不足,容易導致偏差。近年來新提 出的顧及空間信息的端元提取方法在一定程度上消除了噪聲的影響,但在某些情景下可能 會影響端元提取結果,尤其是端元光譜特征接近的地物。
[0004] 已有端元提取算法對端元數目的研宄處于空白狀態,常常借助于特征降維或虛擬 維度來估計,而這些算法都是借助波段間的統計特性實施的,沒有考慮到影像地物的光譜 特征,理論性有待加強。已有高光譜數據分析方法都是在假定端元數目已知或通過其他方 法估計的,然后借助端元的幾何特征或解混誤差作為先驗信息提取端元,最后通過混合模 型來計算端元組分豐度,各個步驟之間缺少理論上的聯系。
【發明內容】
[0005] 為了解決現有技術的不足,本發明提供了一種高光譜數據處理方法,通過對約束 線性模型進行簡化,借助矩陣滿秩分解理論嚴密推導了端元數目的確定方法,然后根據端 元的線性無關性提出了 MLIG端元識別算法,最后構建了 MVC-MRF算法對提取的端元進行優 化和光譜解混。
[0006] 本發明為解決其技術問題所采用的技術方案是:提供了一種高光譜數據處理方 法,包括以下過程:
[0007] (1)端元數目的確定:
[0008] 已知高光譜影像P的波段和像元數目分別為1和n,設影像中有r個端元,光譜特 征向量表示為 M = [11^,m2, ? ? ?,mr],其中,11^= [m u,…,niji, ? ? ?,n^]1,1 < i < r,M 即端元 光譜矩陣,維度為IX r,根據線性混合模型有:
[0009] P = Ma + e (1)
[0010] 其中e表示噪聲或者模型誤差,a表示端元豐度矩陣,維度為rXn,其約束條件 為:
[0011] I1Xn= I 1XrX a rXn(〇 f a ki 蘭 1) (2)
[0012] 其中a ^是a中的元素;
[0013] 對于高光譜影像P的波段i中的第j個像元Pij,在理想線性光譜混合模型下誤差 項 e ij= 〇,則
[0014]卩。.=m n* a u+n^* a 2j+......+mir* arj(3)
[0015] a kj = 1- ( a 丄』+ a 2j+......+ ak-ij+ a k+u+......+ arj)⑷
[0016] 根據式⑶和式⑷得到:
[0017] Pij-mik= (m u-mik) * a " +......+ * a (mik+1-mik) a k+ij+......+ (mimr-mir) * a rJ (5)
[0018] 令 a。: p ij-niik,當 s〈k 時,令 gis*fsj= (m is_mik)*a sj;當 s>k 時,令 gis*fsj = (mis+l _mik)*as+1J,則
[0019] aij= g il*f1J+gi2*f2J+......+g is*fsJ+......+gir-l*fr-lj (6)
[0020] 已知基準端元為IV約束條件下的光譜線性混合方程為:
[0021] A1Xn= G (7)
[0022]其中,A1Xn - Pixn_m〇IlXn,M1Xr - G lx(r-i)[I(r-i)x(r-i),0(^-0 xl]+m〇I1Xr,I(r-i)x(r-i)表 示(r-1) X (r-1)單位矩陣,0fr_1)xl表示所有元素為0的列向量,[I 0fr_1)xl]表示 (r-l) Xr的矩陣;
[0023] 已知線性混合分解模型的端元光譜是相互獨立的,且1彡r,則R( P )= r,維度為 lX(r-l)的矩陣G的秩R(G) =r_l ;根據式⑵得到矩陣a的秩R(a) =r-l,則矩陣F 的秩R(F) = r-l ;根據矩陣滿秩分解,維度為lXn的矩陣A的秩R(A) = r-l ;在已知1條 端元%的條件下,求解轉換矩陣A的秩r-l以求得影像端元數目r ;
[0024] 至此得到高光譜影像P中的端元數目r ;
[0025] (2)影像端元提取:
[0026] 對高光譜影像P去相關性,提取最大無關組,最大無關組對應的像元光譜作為初 始端元集;
[0027] 至此得到光譜特征向量MQ= [m u m2, . . .,mj,即影像端元光譜向量組;
[0028] (3)端元優化和光譜解混:
[0029] 根據最大體積約束下矩陣滿秩分解的目標函數進行端元優化和光譜解混:
[0031] 其中,由r個相互獨立的端元點集叫,…,構成的r-l個向量集為gl,…,grt,G = [gl,…,grt],A為正則化系數,根據解混誤差和端元體積進行設置;F表示端元 豐度,通過影像端元矩陣凡借助線性解混模型進行初始化。
[0032] 步驟(1)進行端元數目的確定以前,利用MNF正反變換對原始高光譜影像進行噪 聲白化處理,取前15個波段進行反變換,獲得噪聲白化影像,作為高光譜影像P。
[0033] 步驟(1)求解轉換矩陣A的秩r-1以求得影像端元數目r時,根據數據量度設置 計算精度為0.0001。
[0034] 本發明基于其技術方案所具有的有益效果在于:本發明通過對約束線性模型進行 簡化,端元數目的確定是通過數學公式嚴格推導的,理論嚴謹;然后根據端元的線性無關性 提出了 MLIG端元識別算法,端元提取算法計算簡單,效率高,可以滿足大數據集應用;最后 構建了 MVC-MRF算法對提取的端元進行優化和光譜解混,可以提取出所有線性無關的影像 端元,而且具有代表性,解混誤差基本為0,分類精度高。
【附圖說明】
[0035] 圖1是本發明實施例的流程示意圖。
[0036] 圖2是原始高光譜數據立方體Cuprite數據。
[0037] 圖3是光譜曲線,其中圖3(a)是MLIG端元識別算法提取的端元光譜曲線,圖3(b) 是MVC-MRF算法優化后的端元光譜曲線,圖3 (c)是標準實驗室光譜曲線。
[0038] 圖4是光譜線性解混后的端元豐度圖。
[0039] 圖5是解混的均方根誤差分布圖。
【具體實施方式】
[0040] 下面結合附圖和實施例對本發明作進一步說明。
[0041] 本發明采用美國內華達州Cuprite礦區1995年獲取的AVIRIS示例數據,共50個 波段,波長范圍為1. 99一 2. 48um,空間分辨率為20m,尺寸大小400X350,波長2. 1010 ym 處的影像如圖2所示。該地區主要由裸露的礦物組成,各種礦物之間的混合現象比較明顯, 而且該數據在端元提取中得到了大量的研宄,已經成為一個驗證端元提取和光譜解混算法 的標準測試數據。其中所有感興趣的端元光譜都包含在USGS光譜庫中,便于進行驗證和分 析,適合用來檢測該算法在高混合數據中的端元提取能力。
[0042] 為了全面評價提取端元的光譜特征,采用三種光譜分析方法(spectral angle distance,SAD,spectral feature fitting, SFF ;binary encoding,BE)分別對端元光譜 進行分析,最后取三者的加權組合作為最后匹配結果,計算公式如下:
[0043] SAS = p^SAD+p^SFE+p^BE (12)
[0044] 式中SAS表不光譜分析得分,pi、p2、p3分別表不權重,本發明設置為0. 3、0. 4、 0? 3〇
[0045] 利用光譜解混的均方根誤差(root mean square error, RMSE)衡量端元在影像中 的代表性和光譜解混精度,計算公式如下:
[0047] 式中n表示影像像元數目,為和Xi分別表示第i個像元豐度的參考值和解混結果。
[0048] 參照圖1,本發明的高光譜數據處理方法具體包括以下過程:
[0049] 首先進行數據預處理。采用MNF正反變換對高光譜影像進行噪聲白化處理,根據 MNF評估噪聲原則,第15個MNF波段以后的影像為噪聲,基本上不包含有用信息,因此使用 MNF正變換的前15個波段進行反變換,獲得噪聲白化影像。
[0050] (1)端元數目的確定:
[0051] 已知高光譜影像P的波段和像元數目分別為1和n,設影像中有r個端元,光譜特 征向量表示為M= [11^,m2, ? ? ?,mr],其中,11^=[mu,…,niji, ? ? ?,n^]1,1 <i<r,M即端元 光譜矩陣,維度為IXr,根據線性混合模型有:
[0052] P=Ma+e(1)
[0053] 其中e表示噪聲或者模型誤差,a表示端元豐度矩陣,維度為rXn,其約束條件 為:
[0054] I1Xn=I1XrXarXn(〇 蘭aki 蘭1) (2)
[0055] 其中a^是a中的元素;
[0056]對于高光譜影像P的波段i中的第j個像元Pij,在理想線性光譜混合模型下誤差 項eij= 〇,則
[0057] Pij=mn*aa2J+......+mir*arj (3)
[0058] akj=1-(a".+a2j+......+ak-ij+ak+u+......+arJ) ⑷
[0059] 根據式⑶和式⑷得到:
[0060] Pij-mik=(mu-mik) *au +......+ *ak_u+(mik+1-mik) ak+ij+......+ (mimr-mir) *arJ (5)
[0061] 令a。:pij-niik,當s〈k時,令gis*fsj=(mis_mik)*asj;當s>k時,令gis*fsj = (mis+1_mik)*as+1J,則
[0062] ai