基于增量支持向量機的sar圖像多類標場景分類方法
【技術領域】
[0001] 本發明屬于圖像處理技術領域,特別涉及一種圖像場景分類方法,可快速準確地 處理海量多類標SAR圖像。
【背景技術】
[0002] 在機器學習領域中,針對多類標學習的研宄對于多義性對象學習建模具有十分 重要的意義,現在已經逐漸成為國際機器學習界一個新的研宄熱點。由于客觀事物本身的 復雜性,一個事物對象可以用單個實例來表示,并且該實例屬于多個類別標簽,即單實例 多類標。單實例多標簽的學習方法對圖像分類的問題具有重要的意義,但是該方法卻很少 被應用到SAR圖像的場景分類當中。
[0003] 隨著合成孔徑雷達SAR技術的發展,SAR圖像在分辨率、圖像內容和數量上都達到 了一定的高度,其應用也越來越廣泛。SAR圖像的場景分類不同于傳統的SAR圖像分類技 術,場景分類中并不嚴格追求同類圖像間的內容相似性,而是關注于通過某種學習方法挖 掘圖像內在的語義信息。近年來,學者們針對該問題也做出了一些研宄。
[0004] 武漢大學的殷慧在其博士學位論文"基于局部特征表達的高分辮率SAR圖像城區 場景分類方法"中研宄了高分辨率SAR圖像的城區場景解譯應用。該論文涉及到局部特征表 達和分類技術,中間表達和主題提取技術。主要提出了兩種分類算法,分別是:1.基于多維 金字塔表達算法和AdaBoost的高分辨率SAR圖像的城區場景分類算法;2.基于多維金字 塔匹配核和支持向量機的高分辨率SAR圖像城區場景分類算法。還提出了兩種分類框架, 分別是:1.基于兩級地物語義的高分辨率SAR圖像的城區場景分類框架;2.基于中間表達 式和線性判別分析法的高分辨率SAR圖像城區場景分類框架。從分類結果看,其研宄結果 存在的不足是各算法的分類準確率較低,分類時間較長。
【發明內容】
[0005] 本發明的目的是針對上述已有技術的不足,提出一種基于增量支持向量機的SAR 圖像多類標場景分類方法以縮短分類時間,提高分類精度。
[0006] 實現本發明目的的技術方案是:采用多標簽的標記方式,使單幅圖像描述內容更 加豐富具體,能夠通過學習挖掘出圖像內部語義信息,提高分類精度,采用增量支持向量機 作為分類器,縮短分類時間。其實現步驟包括如下:
[0007] (1)將四幅給定的SAR圖像分別切割成無重疊的小圖像塊,每個小圖像塊的大小 均為256*256像素,從這些小圖像塊形成的圖像庫中選取肉眼能夠清晰識別且信息完整的 圖像塊組成一個數據庫,該數據庫包括山脈,水域,城市,建筑,池塘和平原這六個類別;
[0008] (2)在上述數據庫中提取每一幅圖像基于contourlet變換的紋理特征和形狀特 征作為一個特征集,并將該特征集當中的每一個特征向量歸一化到0-1之間;
[0009] (3)將上述特征集中圖像的地物標簽矩陣表示為y,當第i幅圖像屬于第j個類別 時,則地物標簽矩陣y中的元素y(i,j) = 1,否則,y(i,j) = -1,并規定特征集中任意一 幅圖像至少屬于一個類別,其中i = 1,???,]!,n表示特征集中圖像張數,j = 1,…,6,表示 一共有6個類別;
[0010] ⑷將上述地物標簽矩陣y中的每一列向量作為一個類別的地物標簽,得到六組 地物標簽y w,j = 1,6 ;
[0011] (5)從步驟⑵的特征集中隨機選取訓練樣本和測試樣本,構成訓練樣本集 {xk,#丨^和測試樣本集{txk,# ,其中,xk是第k個訓練特征樣本,用一個行向量表示, yf是與Xk相對應的第j個類別的地物標簽,n是訓練樣本個數,tx k是第k個測試特征樣 本,用一個行向量表示,tyf是與txk相對應的第j個類別的地物標簽,tn是測試樣本個數;
[0012] (6)對訓練樣本集采用增量學習的方法進行迭代訓練,得到支持向量集合 慫={ps,yp s}=,以及該集合中所有支持向量所對應的拉格朗日乘子向量《={〇^}二和偏 斜量b,其中Ps為當前支持向量集合中第s個支持向量,y Ps為當前支持向量集合中第s個 支持向量所對應的類別標簽,a Ps是當前支持向量集合中第s個支持向量所對應的拉格朗 日乘子,b是一個標量;
[0013] (7)根據上述訓練得到的支持向量集合Pm、拉格朗日乘子向量a和偏斜量b,用分 類決策函數對測試樣本進行識別,得到測試樣本的輸出矩陣T,其中第k個測試樣本對應的 輸出向量T k是輸出矩陣T中第k個行向量;
[0014] (8)判斷測試樣本的標簽:
【主權項】
1. 一種基于增量支持向量機的SAR圖像多類標場景分類方法,包括如下步驟: (1) 將四幅給定的SAR圖像分別切割成無重疊的小圖像塊,每個小圖像塊的大小均為 256*256像素,從這些小圖像塊形成的圖像庫中選取肉眼能夠清晰識別且信息完整的圖像 塊組成一個數據庫,該數據庫包括山脈,水域,城市,建筑,池塘和平原這六個類別; (2) 在上述數據庫中提取每一幅圖像基于contourlet變換的紋理特征和形狀特征作 為一個特征集,并將該特征集當中的每一個特征向量歸一化到0-1之間; (3) 將上述特征集中圖像的地物標簽矩陣表示為y,當第i幅圖像屬于第j個類別時, 則地物標簽矩陣y中的元素 y (i,j) = 1,否則,y (i,j) = -1,并規定特征集中任意一幅圖 像至少屬于一個類別,其中i = 1,···,]!,η表示特征集中圖像張數,j = 1,…,6,表示一共 有6個類別; (4) 將上述地物標簽矩陣y中的每一列向量作為一個類別的地物標簽,得到六組地物 標簽 y(j),j = 1,2···6 ; (5) 從步驟(2)的特征集中隨機選取訓練樣本和測試樣本,構成訓練樣本集 Κ,yf1 L和測試樣本集UxkWt1,其中,xk是第k個訓練特征樣本,用一個行向量表示, 是與Xk相對應的第j個類別的地物標簽,η是訓練樣本個數,tx k是第k個測試特征樣 本,用一個行向量表示,tyf1是與txk相對應的第j個類別的地物標簽,tn是測試樣本個數; (6) 對訓練樣本集采用增量支持向量機的學習方法進行迭代訓練,得到支持向量集合 尺={PS,,以及該集合中所有支持向量所對應的拉格朗日乘子向量和偏 斜量b,其中ps為當前支持向量集合中第s個支持向量,y Ps為當前支持向量集合中第S個 支持向量所對應的類別標簽,a ps是當前支持向量集合中第s個支持向量所對應的拉格朗 日乘子,b是一個標量; (7) 根據上述訓練得到的支持向量集合Pm、拉格朗日乘子向量α和偏斜量b,用分類決 策函數對測試樣本進行識別,得到測試樣本的輸出矩陣T,其中第k個測試樣本對應的輸出 向量T k是輸出矩陣T中第k個行向量; (8) 判斷測試樣本的標簽: 8a)當測試樣本的輸出向量Tk中每一個值都小于0時,則第k個測試樣本的類別向量 為:
8b)當測試樣本的輸出向量Tk中至少有一個值大于0時,則第k個測試樣本的類別向 量為:
其中j = 1,2…6, j表示類別數,k = 1,2··· tn, tn表示測試樣本數; 8c)根據步驟8a)-Sb)的判別結果得到測試樣本的標簽向量tyk,再由向量tyk構成測 試樣本的標簽矩陣{ty,H1,該矩陣{對應測試樣本的類別,即分類結果。
2. 根據權利要求1所述的方法,其中步驟6所述的采用增量學習的方法進行迭代訓練, 按如下步驟進行: 2a)選擇第一個訓練樣本X1作為支持向量,得到一個初始的向量集Pm= {x p yj,,其中 m = 1,71是X i對應的地物標簽;通過最小二乘支持向量機的求解線性方程組的方法得到該 支持向量集相應的拉格朗日乘子向量°^和偏斜量b m,由Pm、aPm和bm構成一個初始的分類 器
2b)用初始的分類器對剩下的訓練樣本進行分類,即每次從錯分的樣本和離類邊 界比較近的樣本中選擇一個樣本作為新的支持向量,把這個樣本和其相對應的標簽加 到支持向量所對應的拉格朗日乘子向量%^和偏斜量b m+1中,得到一個新的分類器:
2c)更新變量m = m+1 ; 2d)重復過程2b)和2c)共L次,其中L多30,得到一次更新后的分類器:
2e)找出拉個朗日乘子向量中絕對值最小的拉格朗日乘子,并刪除掉其所對應的那 個支持向量,通過最小二乘支持向量機求解線性方程組的方法得到該支持向量集相應的拉 格朗日乘子向量<"_,和偏斜量b' μ,得到一個新的分類器:
2f)更新變量m = m-Ι ; 2g)循環步驟2b)到2f)直到滿足停止的條件,得到支持向量集合P" m,并通過最小二 乘支持向量機的求解線性方程組的方法計算得到更新后的支持向量集合的拉格朗日乘子 向量和偏斜量b" m,其中α" &是更新后的支持向量集合中第s個支持向量所 對應的拉格朗日乘子,b" m是一個標量。
3. 根據權利要求1所述的方法,其中所述步驟(7)中的分類決策函數,表示如下:
其中tx是測試樣本,a Ps是支持向量集合中第s個支持向量所對應的拉格朗日乘子, Ps是支持向量集合中第s個支持向量,y Ps是支持向量集合中第s個支持向量所對應的類 別標簽,b是支持向量集合中第s個支持向量所對應的偏移量,K是一個核函數,其表示為:
X,y是兩個不同的樣本向量,σ 2是和核函數的寬度,通過網格搜 索法求出。
【專利摘要】本發明公開了一種基于增量支持向量機的SAR圖像多類標場景分類方法,主要解決如何更加準確高速的處理多標簽SAR圖像的場景分類問題。其實現步驟為:首先,將SAR大圖切割為大小相同的小圖像塊,選出信息清晰完整的圖像塊進行多標簽標記;然后提取基于contourlet的形狀、紋理特征,再隨機選取訓練樣本和測試樣本;而后,將多類標分解成多個單類標,依次采用增量學習的方法訓練支持向量機的模型;最后,根據學到的模型計算測試樣本輸出值,進而預測出標簽,得到分類結果,本發明具有分類精度更高,分類時間更短的優點,可用于快速準確地處理海量多類標SAR圖像。
【IPC分類】G06K9-62
【公開號】CN104751175
【申請號】CN201510109062
【發明人】焦李成, 馬文萍, 張曼, 屈嶸, 劉紅英, 楊淑媛, 侯彪, 王爽, 馬晶晶
【申請人】西安電子科技大學
【公開日】2015年7月1日
【申請日】2015年3月12日