一種基于視覺詞匯的遙感圖像地物分類方法
【技術領域】
[0001]本發明屬于遙感圖像處理技術領域,涉及一種基于高分辨率遙感圖像的地物分類方法。
【背景技術】
[0002]隨著遙感衛星的迅速發展,獲得的遙感衛星影像的分辨率也越來越高,由此引發的對于遙感圖像的處理要求也越來越高,其中,對于高分辨率遙感衛星的目標物分類識別是一個重要的研究方向,尤其是城市配置科學性,農業種植分布規劃以及軍事敏感目標分類提取均有重要意義。同時高分辨率遙感衛星的高分辨率也意味著細節更豐富,背景對目標的影響也越大,這就為圖像的分類帶來了挑戰。
[0003]在遙感圖像分類領域里,主要包括兩類分類方法:一類是非監督的方法,通過使用聚類的思想來實現,包括k-means,isodata等方法。但是隨著遙感圖像分辨率越來越高會有類間方差減少,類內方差增大,從而導致類間重疊,出現同物異譜以及同譜異物的現象,導致分類錯誤;另一類是有監督方法,也是現在普遍使用的分類方法,采用學習與訓練的思想,包括BP神經網絡模型,遺傳模型及支持向量機等,監督的方法具備一定的增量調整性,但是當遙感圖像分辨率不斷增高時,對于訓練樣本的選擇以及對于每類樣本的訓練速度都是一個挑戰,尤其是訓練樣本的選擇是一個人工選擇的過程,帶來更大的時間成本。
[0004]同時高分辨率遙感圖像的發展意味著特征選擇的種類增多,以顏色、紋理、形狀等底層特征為基礎建立起來的與樣本高層信息的關系,會出現泛化性差,適用度不高的缺點。為了克服底層特征與樣本高層次語義信息的鴻溝,由此誕生了以樣本中間特征為基礎的與樣本高層次語義信息之間的推導模型。BOV(視覺詞袋)模型作為中間特征的代表,在OBIA(object-based remote-sensing image analysis)方面已經有了一些進展。但是傳統的BOV模型方法自身有缺陷,不能夠良好的利用圖像的全部信息,例如空間層次信息等,并且BOV模型分類主要應用在自然物體的分類識別,對于遙感圖像地物分類沒有很好利用。
[0005]如何運用詞袋的思想來解決遙感圖像地物分類已經成了遙感圖像領域重要的研究方向之一。但是由于遙感圖像地物種類多種多樣,單一的特征詞袋方法和單一的遙感單詞頻率直方圖很難代表所有的遙感圖像種類。
【發明內容】
[0006]有鑒于此,本發明提供了一種基于視覺詞匯的遙感圖像地物分類方法,解決了遙感圖像地物分類準確率不足的問題。
[0007]為了達到上述目的,本發明的技術方案包括如下步驟:
[0008]步驟一、將所有的遙感圖像分為訓練集和測試集,對于每幅遙感圖像,以固定的大小對其裁剪獲得初步切片圖,提取包含目標的初步切片圖。
[0009]步驟二、針對步驟一中提取的包含目標的初步切片圖通過高斯模糊與抽樣生成多層高斯空間金字塔。
[0010]步驟三、對高斯空間金字塔中的每一層的圖像均進行特征提取,特征提取包括局部特征即SIFT特征提取與圖像紋理特征即LBP特征提取。
[0011]在進行SIFT特征提取時,只進行一層高斯濾波,然后通過滑窗的方式將圖像分為16X16的細分切片圖,根據每一個細分切片圖的梯度變化進行SIFT特診向量提取得到關于該細分切片圖的128維的SIFT特征向量;在每個細分切片圖中根據設定的半徑和采樣點數確定關于該細分切片圖的LBP特征向量。
[0012]則每個細分切片圖對應的SIFT特征向量和LBP特征向量組合形成一個遙感單詞;由此生成關于該遙感圖像的遙感單詞。
[0013]其中最高層的高斯空間金字塔滿足其初步切片圖中對應得到遙感單詞個數至少為遙感詞典的數量的1/2。
[0014]針對每一層高斯金字塔中的初步切片圖采取如下步驟四?五的方式進行處理:
[0015]步驟四、對訓練集和測試集中所有遙感圖像的遙感單詞進行聚類,得到多個聚類中心,所有的聚類中心組成遙感詞典。
[0016]在聚類過程中,對遙感單詞采用PCA主成分分析法進行降維,保留對協方差貢獻最大的維度,并設定數據丟失率閾值disrat1,使得數據丟失率不超過disrat1。
[0017]步驟五、設定不同半徑值,對每個初步切片圖不同半徑值內的遙感單詞均建立頻率直方圖:
[0018]該直方圖的橫坐標為每個遙感單詞,縱坐標為遙感單詞在當前半徑值內的初步切片圖中出現的頻率,該頻率的計算方法為:頻率值初始為0,計算當前半徑值內的初步切片圖中兩兩遙感單詞之間的歐氏距離,若當前遙感單詞A到另一遙感單詞B之間的歐式距離為其他所有遙感單詞到B的歐式距離的最小值,則A的頻率值增加I。
[0019]步驟六、針對訓練集中遙感單詞的頻率直方圖使用支持向量機RBF-SVM進行訓練,然后使用訓練后的RBF-SVM對測試集中遙感圖像進行地物分類。
[0020]若遙感單詞所屬的高斯金字塔的層數在最底層,則分配其對應的支持向量機中分類器的權值最大,層數越往上,對應的分類器的權值越小。
[0021]進一步地,通過滑窗的方式將圖像分為16*16的細分切片圖時,滑窗的步長設置為I到8之間。
[0022]進一步地,RBF-SVM支持向量機中的核函數選擇histogram intersect1nkernel ο
[0023]進一步地,步驟二中,聚類時采用K-means聚類方法。
[0024]有益效果:
[0025]1、該方法首先將遙感圖像集分為測試集合訓練集兩部分,然后對所有的遙感圖像切片進行特征點提取,得到每幅切片圖的單詞,之后針對訓練集的特征點進行聚類得到詞典,最后針對于詞典和測試集的單詞構建頻率直方圖進行訓練,使用測試集的單詞直方圖進行測試,能夠更加準確的對遙感圖片地物進行分類,分類結果更加準確。
[0026]2、本方法中在對切片圖進行高斯模糊和抽樣時采用多層高斯金字塔的方法,因此能夠更好地利用遙感圖像的空間信息,從而使得分類更加準確。
[0027]3、本方法在傳統的由于SIFT特征向量只包含16*16切片圖中的方向和梯度信息,即切片圖中穩定點的信息,不具備整個切片圖的紋理特征信息,因此在SIFT特征的基礎上加入旋轉不變均勻LBP特征,彌補了 SIFT特征中不具備的紋理特征信息,能夠全方位地表達遙感圖像中的所有信息。
[0028]4、本方法中在生成頻率直方圖時,選取多個不同的半徑,同時保證所選的半徑應當使得內部包含足夠的遙感單詞數量,對金字塔內每一層切片圖不同半徑內的遙感單詞與遙感詞典生成頻率直方圖,這樣能夠在滿足生成遙感單詞頻率直方圖的需求的基礎上,同時利用遙感圖像中從中心處到周圍的空間信息,從而能夠更好地表達遙感圖像中的目標,提高分類準確度。
[0029]5、本方法最終使用多分類器加決策器得到決策結果,針對高斯空金字塔中每一層的遙感單詞頻率直方圖進行分類,對不同的分類器分配權值,我們認為高斯金字塔底層的信息權值最大,越往上信息權值越小,經過決策得到遙感切片圖的類屬,通過給每一次高斯金字塔分類結果分配權值,不單純信任某一層圖像的分類結果,通過不同層次高斯金字塔的分類結果共同確定遙感圖像中的目標,提高分類準確度。
【附圖說明】
[0030]圖1為本發明的實施流程圖。
[0031]圖2為本發明遙感單詞的生成流程圖。
[0032]圖3為本發明遙感單詞頻率直方圖的生成流程圖。
[0033]圖4為本發明分類器的設計。
【具體實施方式】
[0034]下面結合附圖并舉實施例,對本發明進行詳細描述。
[0035]步驟一、將所有的遙感圖像分為訓練集和測試集,對于每幅遙感圖像,以固定的大小對其裁剪獲得初步切片圖,提取包含目標的初步切片圖;
[0036]步驟二、針對步驟一種提取的包含目標的初步切片圖通過高斯模糊與抽樣生成多層高斯空間金字塔,高斯空間金字塔的層數依據初步切片圖的尺寸確定;
[0037]附圖2為遙感單詞的生成流程圖,包含高斯空間金字塔生成及多特征提取兩部分。
[0038]首先針對遙感切片圖通過高斯模糊與抽樣生成多層高斯空間金字塔,針對于不同尺寸的切片圖,可以生成不同層數的高斯空間金字塔,最高層的金字塔要求能夠滿足至少得到遙感詞典數量的1/2以構成之后的遙感單詞頻率直方圖,本實施例中為16組特征值,這樣能夠保證所生成的頻率直方圖