有意義。
[0039]多層的高斯空間金字塔能夠更好地利用遙感圖像的空間信息,從而使得分類更加準確。
[0040]其次,針對高斯空間金字塔中的每一幅圖像進行多特征(SIFT特征與LBP特征)提取。為了保持每幅圖像頻率直方圖數量的一致性,對SIFT特征進行改變,只進行一層高斯濾波,通過滑窗的方式將圖像分為細分切片圖,本實施例中為16*16的切片圖,滑窗的步長可以根據實際需要設置為I到8,根據每一個16*16的細分切片圖的梯度變化得到128維的SIFT特征向量。這樣針對于每一副圖像的SIFT特征點數一致,便于之后的直方圖統計。
[0041]由于SIFT特征向量只包含16*16切片圖中的方向和梯度信息,即切片圖中穩定點的信息,不具備整個切片圖的紋理特征信息,因此在SIFT特征的基礎上加入旋轉不變均勻LBP特征以彌補對于圖像的表征,能夠全方位地表達遙感圖像中的所有信息。在每個16*16的切片圖中根據半徑和采樣點數(人為設定)確定LBP特征,由于采用了旋轉不變的LBP特征,使得代表圖像紋理特征的維數較少。
[0042]將每幅圖像的SIFT特征與旋轉均勻不變LBP特征結合起來就是代表這幅圖像的遙感單詞(每個16*16的切片圖對應一個遙感單詞),從每幅切片圖生成的遙感單詞數量是一致的。
[0043]步驟二、基于訓練集和測試集中所有的遙感單詞進行聚類,得到多個聚類中心,所有的聚類中心就組成了遙感詞典。
[0044]由于聚類是一個離線的過程,隨著聚類數據的增多,通常意義的整體劃分聚類方法會產生幾何倍數的運算代價。因此降維聚類的思想來處理大規模以及超大規模的遙感詞典數據。
[0045]在這里,對遙感單詞采用PCA主成分分析法進行降維,保留對協方差貢獻最大的維度,但是需要注意的是,降維個數需要保證不大量丟失有用數據,因此,定義數據丟失率d i sr at i ο,保證余下數據保留大部分有用信息。
[0046]聚類的方法采用時間效率和空間效率均衡的K-means聚類方法,K-means聚類可以直接得到聚類中心,并且聚類中心是類內所有屬性的平均值,可以很好的代表類內中心。聚類中心的個數需要根據分類的個數確定,需要分類的類別個數越多,需要的聚類中心就越多,也就意味著遙感詞典中的單詞數越多,才能滿足多類目標分類準確率的需求。
[0047]步驟三、設定不同半徑值,對每個初步切片圖不同半徑值內的遙感單詞均建立頻率直方圖:
[0048]該直方圖的橫坐標為每個遙感單詞,縱坐標為遙感單詞在當前半徑值內的初步切片圖中出現的頻率,該頻率的計算方法為:頻率值初始為0,計算當前半徑值內的初步切片圖中兩兩遙感單詞之間的歐氏距離,若當前遙感單詞A到另一遙感單詞B之間的歐式距離為其他所有遙感單詞到B的歐式距離的最小值,則A的頻率值增加I。
[0049]附圖3為本發明遙感單詞頻率直方圖的生成流程圖,在這里為了有效利用圖片中的空間位置信息,針對于不同層次的空間金字塔,選取合適的半徑,對金字塔內每一層切片圖不同半徑內的遙感單詞與遙感詞典生成頻率直方圖,將關于這一切片圖所有的遙感單詞頻率直方圖組合,作為代表這一初步切片圖的遙感單詞頻率直方圖。
[0050]選取合適的半徑時,應當滿足其內部包含足夠的遙感單詞數量,從而滿足生成遙感單詞頻率直方圖的需求。選擇多個半徑的好處是利用遙感圖像中從中心處到周圍的空間信息,從而能夠更好地表達遙感圖像中的目標,提高分類準確度。
[0051]步驟四、針對訓練集的遙感單詞頻率直方圖和測試集的遙感頻率直方圖使用RBF-SVM支持向量機進行訓練,核函數選擇在統計領域有良好表現的histogramintersect1n kernel0
[0052]附圖4為分類器的構成,使用多分類器加決策器得到決策結果,針對高斯空金字塔中每一層的遙感單詞頻率直方圖進行分類,對不同的分類器分配權值,我們認為高斯金字塔底層的信息權值最大,越往上信息權值越小,經過決策得到遙感切片圖的類屬。通過給每一次高斯金字塔分類結果分配權值,不單純信任某一層圖像的分類結果,通過不同層次高斯金字塔的分類結果共同確定遙感圖像中的目標,提高分類準確度。
[0053]自此,就完成了遙感圖像的地物分類。
[0054]綜上,以上僅為本發明的較佳實施例而已,并非用于限定本發明的保護范圍。凡在本發明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發明的保護范圍之內。
【主權項】
1.一種基于視覺詞匯的遙感圖像地物分類方法,其特征在于,包括如下步驟: 步驟一、將所有的遙感圖像分為訓練集和測試集,對于每幅遙感圖像,以固定的大小對其裁剪獲得初步切片圖,提取包含目標的初步切片圖; 步驟二、針對步驟一中提取的包含目標的初步切片圖通過高斯模糊與抽樣生成多層高斯空間金字塔; 步驟三、對所述高斯空間金字塔中的每一層的圖像均進行特征提取,所述特征提取包括局部特征即SIFT特征提取與圖像紋理特征即LBP特征提取; 在進行SIFT特征提取時,只進行一層高斯濾波,然后通過滑窗的方式將圖像分為16X16的細分切片圖,根據每一個細分切片圖的梯度變化進行SIFT特診向量提取得到關于該細分切片圖的128維的SIFT特征向量;在每個細分切片圖中根據設定的半徑和采樣點數確定關于該細分切片圖的LBP特征向量; 則每個細分切片圖對應的SIFT特征向量和LBP特征向量組合形成一個遙感單詞;由此生成關于該遙感圖像的遙感單詞; 其中最高層的高斯空間金字塔滿足其初步切片圖中對應得到遙感單詞個數至少為遙感詞典的數量的1/2 ; 針對每一層高斯金字塔中的初步切片圖采取如下步驟四?五的方式進行處理: 步驟四、對訓練集和測試集中所有遙感圖像的遙感單詞進行聚類,得到多個聚類中心,所有的聚類中心組成遙感詞典; 在聚類過程中,對遙感單詞采用PCA主成分分析法進行降維,保留對協方差貢獻最大的維度,并設定數據丟失率閾值disrat1,使得數據丟失率不超過disrat1 ; 步驟五、設定不同半徑值,對每個初步切片圖不同半徑值內的遙感單詞均建立頻率直方圖: 該直方圖的橫坐標為每個遙感單詞,縱坐標為遙感單詞在當前半徑值內的初步切片圖中出現的頻率,該頻率的計算方法為:頻率值初始為0,計算當前半徑值內的初步切片圖中兩兩遙感單詞之間的歐氏距離,若當前遙感單詞A到另一遙感單詞B之間的歐式距離為其他所有遙感單詞到B的歐式距離的最小值,則A的頻率值增加I ; 步驟六、針對訓練集中遙感單詞的頻率直方圖使用支持向量機RBF-SVM進行訓練,然后使用訓練后的RBF-SVM對測試集中遙感圖像進行地物分類; 若遙感單詞所屬的高斯金字塔的層數在最底層,則分配其對應的支持向量機中分類器的權值最大,層數越往上,對應的分類器的權值越小。2.如權利要求1所述的一種基于視覺詞匯的遙感圖像地物分類方法,其特征在于,所述通過滑窗的方式將圖像分為16*16的細分切片圖時,滑窗的步長設置為I到8之間。3.如權利要求1所述的一種基于視覺詞匯的遙感圖像地物分類方法,其特征在于,所述RBF-SVM支持向量機中的核函數選擇histogram intersect1n kernel ο4.如權利要求1所述的一種基于視覺詞匯的遙感圖像地物分類方法,其特征在于,步驟二中,聚類時采用K-means聚類方法。
【專利摘要】本發明公開了一種基于視覺詞匯的遙感圖像地物分類方法,包括如下步驟:首先將所有的遙感圖像分為訓練集和測試集,以固定的大小對每幅遙感圖像裁剪獲得初步切片圖,提取包含目標的初步切片圖;針對包含目標的初步切片圖通過高斯模糊與抽樣生成多層高斯空間金字塔;對每一層的圖像均進行SIFT特征提取與LBP特征提取;對訓練集和測試集中所有遙感圖像的遙感單詞進行聚類,得到多個聚類中心,所有的聚類中心組成遙感詞典;設定不同半徑值,對每個初步切片圖不同半徑值內的遙感單詞均建立頻率直方圖:針對訓練集中遙感單詞的頻率直方圖使用支持向量機RBF-SVM進行訓練,然后使用訓練后的RBF-SVM對測試集中遙感圖像進行地物分類。
【IPC分類】G06K9/62
【公開號】CN105005789
【申請號】CN201510379234
【發明人】陳亮, 師皓, 趙博雅, 陳禾, 龍騰
【申請人】北京理工大學
【公開日】2015年10月28日
【申請日】2015年7月1日