專利名稱:基于線性最小二乘支持向量機的高光譜圖像端元選擇方法
技術領域:
本發明涉及一種高光譜圖像的端元選擇方法,特別是一種基于支持向量機(SVM) 的端元選擇方法,屬于遙感信息處理技術領域。
背景技術:
高光譜圖像的空間分辨率一般較低,這種情況導致了混合像元的廣泛存在,即一 個像元可能是幾種類別的混合。分析各類別成分在混合像元內所占的比例的技術稱為光譜 解混,是高光譜數據分析的最基本、最重要內容之一。光譜解混實施的必要前提是要知道高 光譜數據中包含哪些地物類別,在此需求下提取各類別代表性純光譜的技術稱為光譜端元 選擇,簡稱端元選擇。在近十多年里,多種高光譜圖像端元選擇方法相繼發展起來。N-FINDR 是基于N維空間譜凸多面體的搜索光譜端元的經典例子,因其具有全自動、無參數、選擇效 果較好等優點而受到廣泛歡迎。但該方法需要進行數據降維預處理,且包含大量的體積計 算,這也是它最為耗時的部分。并且,體積計算(即主要為行列式的計算)的復雜度將隨著 所選擇的光譜端元數目增大而呈現立方增長,從而導致算法運算速度大大降低。
目前已有一些典型文獻提出了對N-FINDR算法的改進方案。WUCHA0-CHENG等采用 像元預選的方式來降低后續搜索的復雜性,是從側面來降低算法計算量。CHOWDHURYA.等 利用順次選擇的方式來代替聯合選擇的方式,這種順次選取的方式遠離了 N-FINDR算法的 基本特征,像元一經選定便無法更新,光譜端元之間的相互依賴關系也無法得到最大滿足。 TA0 XUETA0等提出的方法可以直接在原始數據空間上進行而免于降維預處理,因此選出的 光譜端元更具合理性,在理論上突破了 N-FINDR算法需要降維處理的傳統模式,但該方法 也屬于順次選取。 另一方面,基于凸幾何分析的端元選擇方法容易受到野值點的影B向,而野值點在 高光譜圖像中大量存在,現有文獻對此并未提出相應的解決方案。
發明內容
本發明的目的在于提供一種一種無需降維預處理、低復雜度的基于線性最小二乘
支持向量機的高光譜圖像端元選擇方法。 本發明的目的是這樣實現的 步驟1.選取前N個像素點作為初始端元; 步驟2.令目前所選端元中的第i個為"1"類,其余N-l個為"0"類,首次執行i =l,建立相應的LLSSVM判別函數即距離測算函數
f i (s) = 〈w*, s》b* ; 步驟3.依次計算每個像素的距離,如果某個像素的絕對距離大于l,則將該像素 替換第i個端元,置i二l,步驟2; 步驟4. l,若i 〉N,轉入步驟5,否則轉入步驟2; 步驟5.當前端元即為最終選擇端元,結束。
本發明還可以包括 1、在步驟1之前加入根據局域像元密度對野值點進行檢測和去除過程,包括以每 個像元點為中心建立固定尺寸的鄰域窗,計算方鄰域窗內所包含的像元點數作為中心點的 孤立程度度量指標,孤立程度度量指標越大的點作為野值點被去除。 2、在步驟1之前加入利用光譜分量值直按進行像元預排序過程,包括a)由原始 數據空間的第一維到最后一維依次選出和排列對應于極大值和極小值坐標的點對;b)從 余下的數據空間中進行第一步操作;c)繼續進行這樣的過程,直至所有的數據點都被選 出、排列;待全部數據點排序完畢之后,排在最前面的若干特征數據點被選作初始端元,其 迭代更新過程也將按照排序結果依次進行。 3、在步驟1之前加入根據局域像元密度對野值點進行檢測和去除過程和加入利 用光譜分量值直接進行像元預排序過程;所述根據局域像元密度對野值點進行檢測和去除 過程包括以每個像元點為中心建立固定尺寸的鄰域窗,計算方鄰域窗內所包含的像元點 數作為中心點的孤立程度度量指標,孤立程度度量指標越大的點作為野值點被去除;所述 利用光譜分量值直接進行像元預排序過程包括a)由原始數據空間的第一維到最后一維 依次選出和排列對應于極大值和極小值坐標的點對;b)從余下的數據空間中進行第一步 操作;c)繼續進行這樣的過程,直至所有的數據點都被選出、排列;待全部數據點排序完畢 之后,排在最前面的若干特征數據點被選作初始端元,其迭代更新過程也將按照排序結果 依次進行。 4、在步驟1之前加入去除過程和加入利用光譜分量值直接進行像元預排序過程 和根據局域像元密度對野值點進行檢測;所述利用光譜分量值直接進行像元預排序過程包 括a)由原始數據空間的第一維到最后一維依次選出和排列對應于極大值和極小值坐標 的點對;b)從余下的數據空間中進行第一步操作;c)繼續進行這樣的過程,直至所有的數 據點都被選出、排列;待全部數據點排序完畢之后,排在最前面的若干特征數據點被選作初 始端元,其迭代更新過程也將按照排序結果依次進行;所述根據局域像元密度對野值點進 行檢測和去除過程包括以每個像元點為中心建立固定尺寸的鄰域窗,計算方鄰域窗內所 包含的像元點數作為中心點的孤立程度度量指標,孤立程度度量指標越大的點作為野值點 被去除。 本發明為一種高光譜圖像端元選擇方法,采用LLSVM作為主要工具來完成。本發 明在深入分析線性最小二乘支持向量機(LINEAR LEAST SQUARESUPPORT VECTOR MACHINE, 簡記為LLSSVM)模型的基礎上,提出建立免于降維預處理、免于體積計算、并對野值點干擾 具有魯棒性的端元提取方法。無需降維預處理、復雜度低。 野值點預刪除和像元預排序可以與基于LLSSVM進行端元選擇算法結合使用,也 可以單獨或聯合用于其它端元選擇算法中來提高其效果、效率。利用LLSSVM進行端元選擇 過程可以推廣到其他有關空間距離計算方面的應用。
圖1為利用距離尺度替換體積尺度的原理圖。
圖2為2維合成數據及端元選擇結果。 圖3為真實高光譜圖像在不同方法下的端元選擇結果對比。其中圖3a)為真實光譜,圖3b)是未經野值點去除的端元選擇結果,圖3c)是經過野值點去除的端元選擇結果。
圖4的表1為1000點2維合成數據端元選擇的運行時間/迭代次數比較。
圖5的表2為10000點9維真實高光譜數據端元選擇的運行時間/迭代次數比較。
具體實施例方式
下面結合附圖舉例對本發明做更詳細地描述 本發明為一種高光譜圖像端元選擇方法,采用LLSVM作為主要理論工具來完成。 對野值點進行檢測和去除基本過程如下以每個像元點為中心建立固定尺寸的鄰域窗,通 過計算鄰域窗內所包含的像元點數作為中心點的孤立程度度量指標來剔出野值點。像元預 排序基本過程如下利用投影統計的方法進行像元預排序,投影落在每個方向最遠端次數 越多的點越被排在前面。端元選擇基本過程如下根據LLSSVM具有相對距離測試功能,而 相對距離的比較和相應的體積比較具有一致性,建立基于LLSSVM的最大體積尋優迭代方 法。下面給出本發明的詳細說明 1)根據局域像元密度對野值點進行檢測和去除實施步驟如下采用鄰域分析的 方法來確認并去除野值點。野值點通常以更加孤立的方式存在。這樣,以每個像元點為中 心建立固定尺寸的鄰域窗,通過計算鄰域窗內所包含的像元點數作為中心點的孤立程度度 量指標。孤立程度度量指標越大的點作為野值點的可能性就越大而被去除。這里采用方鄰 域(高維盒子)替換常用的圓鄰域以降低計算量。 2)利用光譜分量值直接進行像元預排序實施步驟如下為了能夠獲得快速收斂 的重要端元迭代搜索,將每個像元點根據其潛在的純度進行預先評價和排序。根據光譜端 元一般分布在相應的高維幾何空間角端的特性,利用投影統計的方法進行像元預排序。具 體地說,當將每個數據光譜投影于眾多的具有隨機方向的測試向量時,重要特征將以較大 的概率落在測試向量投影終端。折衷考慮計算的復雜性和選擇的準確性,我們只將光譜空 間的各維坐標選作測試向量,這樣所有的投影結果可以免除任何計算直接由數據的坐標值 得出。因此,我們按照下面的方式進行排序 a)由特征空間的第一維到最后一維依次選出和排列對應于極大值和極小值坐標 的點對; b)從余下的數據空間中進行第一步操作; c)繼續進行這樣的過程,直至所有的數據點都被選出、排列。 待全部數據點排序完畢之后,排在最前面的若干特征數據點被選作初始端元,其 迭代更新過程也將按照排序結果依次進行。 3)利用LLSSVM進行端元選擇實施步驟如下原理上講,方法首先選擇N個像元作 為初始的光譜端元,并相應地計算由它們所張成的凸多面體的體積。然后,用每個像元依次 替換每個當前選擇的光譜端元,如果某個替換能夠得到具有更大體積的凸多面體,那么這 樣的替換就作為有效替換得以保留,否則作為無效替換而被淘汰。重復這樣的基本過程,直 到沒有任何替換能夠引起凸多面體的體積增大為止。此時,當前選擇的結果將作為最終光 譜端元而被選擇出來。然而,直接進行體積計算不僅計算量太大(主要為行列式的計算,其 復雜度將隨著所選擇的光譜端元數目增大而呈現立方增長),而且需要將原始數據空間降 至N-1維。為此,下面應用LLSSVM實現距離比較來獲得體積比較信息,建立免于降維預處理的端元選擇方法。
步驟1.選取前N個像素點作為初始端元;
步驟2.令目前所選端元中的第i(首次執行i "0"類。利用如下方程求解支持參數a = [Ql, a2,…:<formula>formula see original document page 6</formula>=1)個為"1"類,其余N-1個為 (1)
S,lv= [l,l,…,1]t, K為訓練 -個NXN的單位矩陣,y是常值
(2) 其中,y為第i個元素為0其他元素為1的列向 樣本的NXN核函數矩陣,Ki,j = K(Si,Sj) = 〈Si,Sj),I是-參數。進而通過下式求解超平面方程最優參數及b* : m/ = g", .s',乂 ,y = —5(max乂o(〈M/A〉) + min,,)=+1 步驟3.禾lj用式(2)獲得的參數建立當前的距離測算函數
fjs) = 〈w*, s》b*(3) 步驟4.依次計算每個像素的距離,如果某個像素的絕對距離大于l,則將該像素 替換第i個端元,置i = 1,算法轉入步驟2 ; 步驟5. / 1 ,若i > N,算法轉入步驟6,否則算法轉入步驟2 ;
步驟6.當前端元即為最終選擇端元,算法結束。
權利要求
一種基于線性最小二乘支持向量機的高光譜圖像端元選擇方法,其特征是步驟1.選取前N個像素點作為初始端元;步驟2.令目前所選端元中的第i個為“1”類,其余N-1個為“0”類,首次執行i=1,建立相應的LLSSVM判別函數即距離測算函數fi(s)=<w*,s>+b*;步驟3.依次計算每個像素的距離,如果某個像素的絕對距離大于1,則將該像素替換第i個端元,置i=1,轉入步驟2;步驟4.1,若i>N,轉入步驟5,否則轉入步驟2;步驟5.當前端元即為最終選擇端元,結束。FSA00000017106400011.tif
2. 根據權利要求1所述的基于線性最小二乘支持向量機的高光譜圖像端元選擇方法,其特征是在步驟1之前加入根據局域像元密度對野值點進行檢測和去除過程,包括以每個像元點為中心建立固定尺寸的鄰域窗,計算方鄰域窗內所包含的像元點數作為中心點的 孤立程度度量指標,孤立程度度量指標越大的點作為野值點被去除。
3. 根據權利要求1所述的基于線性最小二乘支持向量機的高光譜圖像端元選擇方法,其特征是在步驟l之前加入利用光譜分量值直接進行像元預排序過程,包括a)由原始數 據空間的第一維到最后一維依次選出和排列對應于極大值和極小值坐標的點對;b)從余下的數據空間中進行第一步操作;c)繼續進行這樣的過程,直至所有的數據點都被選出、排列;待全部數據點排序完畢之后,排在最前面的若干特征數據點被選作初始端元,其迭代 更新過程也將按照排序結果依次進行。
4. 根據權利要求1所述的基于線性最小二乘支持向量機的高光譜圖像端元選擇方法, 其特征是在步驟1之前加入根據局域像元密度對野值點進行檢測和去除過程和加入利用 光譜分量值直接進行像元預排序過程;所述根據局域像元密度對野值點進行檢測和去除過 程包括以每個像元點為中心建立固定尺寸的鄰域窗,計算方鄰域窗內所包含的像元點數 作為中心點的孤立程度度量指標,孤立程度度量指標越大的點作為野值點被去除;所述利 用光譜分量值直接進行像元預排序過程包括a)由原始數據空間的第一維到最后一維依 次選出和排列對應于極大值和極小值坐標的點對;b)從余下的數據空間中進行第一步操 作;c)繼續進行這樣的過程,直至所有的數據點都被選出、排列;待全部數據點排序完畢之 后,排在最前面的若干特征數據點被選作初始端元,其迭代更新過程也將按照排序結果依 次進行。
5. 根據權利要求1所述的基于線性最小二乘支持向量機的高光譜圖像端元選擇方法, 其特征是在步驟1之前加入去除過程和加入利用光譜分量值直接進行像元預排序過程和 根據局域像元密度對野值點進行檢測;所述利用光譜分量值直接進行像元預排序過程包 括a)由原始數據空間的第一維到最后一維依次選出和排列對應于極大值和極小值坐標 的點對;b)從余下的數據空間中進行第一步操作;C)繼續進行這樣的過程,直至所有的數 據點都被選出、排列;待全部數據點排序完畢之后,排在最前面的若干特征數據點被選作初 始端元,其迭代更新過程也將按照排序結果依次進行;所述根據局域像元密度對野值點進 行檢測和去除過程包括以每個像元點為中心建立固定尺寸的鄰域窗,計算方鄰域窗內所 包含的像元點數作為中心點的孤立程度度量指標,孤立程度度量指標越大的點作為野值點 被去除。
全文摘要
本發明提供的是一種基于線性最小二乘支持向量機的高光譜圖像端元選擇方法。步驟1.選取前N個像素點作為初始端元;步驟2.令目前所選端元中的第i個為“1”類,其余N-1個為“0”類,首次執行i=1,建立相應的LLSSVM判別函數即距離測算函數;步驟3.依次計算每個像素的距離,如果某個像素的絕對距離大于1,則將該像素替換第i個端元,置i=1,轉入步驟2;步驟4.i=i+1,若i>N,轉入步驟5,否則轉入步驟2;步驟5.當前端元即為最終選擇端元,結束。本發明為一種高光譜圖像端元選擇方法,采用LLSVM作為主要工具來完成。無需降維預處理、復雜度低。
文檔編號G06T7/00GK101794443SQ20101010180
公開日2010年8月4日 申請日期2010年1月28日 優先權日2010年1月28日
發明者喬玉龍, 張晶, 王立國, 趙春暉, 鄧祿群 申請人:哈爾濱工程大學