本發明屬于模式識別領域,涉及多核學習模型求解。
背景技術:
:現有的多核學習方法可以歸納為三類。第一類是基于固定準則的多核學習方法,該類方法在多核學習過程中利用加、乘等固定準則對基核進行組合,沒有考慮各個基核自身相似性度量特性和沒有利用任何優化準則,因此分類性能較低。第二類是單步優化多核學習方法,該類方法將多核模型中的基核權重參數和分類器中參數同時求解,因此計算量非常大,學習效率非常低,其分類性能相對較強。第三類是兩步優化多核學習方法,該類方法將多核模型中的基核權重與分類器參數分開獨立求解,因此相對第二類方法往往能提高計算效率。通常在基核規模較小情況下,第二類多核學習方法分類性能優于第三類多核學習方法;但在基核規模較大情況下,第三類多核學習方法分類性能優于第二類多核學習方法?,F有的多核學習方法在模型求解過程中沒有考慮后續應用(如分類,目標檢測、識別等)自身特點;同時現有的多核學習方法通常將優化問題轉化為半定規劃問題來求解,由于在參數求解過程中涉及多核矩陣的快速求解、高維核矩陣分解、迭代次數高等問題使得多核學習效率非常低。目前已有的多核學習方法存在,多核模型求解沒有與后續應用相結合,以及優化問題復雜,求解效率低的問題。技術實現要素:本發明為解決現有應用于高光譜圖像分類的多核學習方法中,存在沒有考慮將多核模型求解與后續分類應用相結合以及求解效率低的問題,而提出一種基于最大化類別可分性準則的多核學習方法。一種基于最大化類別可分性準則的多核學習方法,按以下步驟進行:步驟一、從給定的輸入高光譜圖像數據集中獲取訓練樣本和測試樣本;步驟二、利用訓練樣本集構造多核學習模型中的基核矩陣Km,得到基核矩陣集合步驟三、利用基核矩陣集合在希爾伯特核空間度量高光譜圖像數據集類內離散度和類間離散度;步驟四、在類內離散度和類間離散度基礎上以最大類別間隔準則度量類別可分性,以類別可分性最大為多核學習模型求解準則,求解基核權重。本發明包括以下有益效果:本發明將多核學習模型求解與后續分類應用相結合,因此能改善分類性能,同時由于獲得閉合解,不需要進行迭代求解,因此算法效率高。1、由于是以后續分類應用為目的對多核學習模型進行求解,即在多核學習模型求解過程中以最大類別可分為準則,因此能改善分類性能,比單核方法分類精度提高2%左右,比主流的多核學習方法分類精度提高1%左右;2、由于可以直接獲得多核學習模型的閉合解,不需要對多核模型進行迭代求解,因此能提高算法運算效率。附圖說明圖1為本發明所述方法流程示意圖;圖2a為UniversityofHouston高光譜圖像數據集RGB假彩色合成圖;圖2b為UniversityofHouston高光譜圖像數據集地物分布真實圖。具體實施方式具體實施方式一、結合圖1說明本實施方式,本實施方式所述的一種基于最大化類別可分性準則的多核學習方法,按以下步驟進行:步驟一、從給定的輸入高光譜圖像數據集中獲取訓練樣本和測試樣本;步驟二、利用訓練樣本集構造多核學習模型中的基核矩陣Km,得到基核矩陣集步驟三、利用基核矩陣集在希爾伯特核空間度量高光譜圖像數據集類內離散度和類間離散度;步驟四、在類內離散度和類間離散度基礎上以最大類別間隔準則度量類別可分性,以類別可分性最大為多核學習模型求解準則,求解基核權重。本實施方式包括以下有益效果:1、由于是以后續分類應用為目的對多核學習模型進行求解,即在多核學習模型求解過程中以最大類別可分為準則,因此能改善分類性能,比單核方法分類精度提高2%左右,比主流的多核學習方法分類精度提高1%左右;2、由于可以直接獲得多核學習模型的閉合解,不需要對多核模型進行迭代求解,因此能提高算法運算效率。具體實施方式二:本實施方式與具體實施方式一不同的是:所述步驟一中從給定的輸入高光譜圖像數據集中獲取訓練樣本和測試樣本;具體過程為:步驟一一、給定的輸入高光譜圖像數據集為:xi∈RF其中,T代表輸入高光譜圖像數據集中的樣本總數,輸入高光譜圖像數據集Xinput中包含C類樣本,第l類樣本數為Nl;1≤l≤C;xi為輸入高光譜圖像數據集中第i個樣本,RF為代表維數為F的空間,F為輸入高光譜圖像數據集的特征維數,i為正整數;步驟一二、從輸入高光譜圖像數據集Xinput中按每類p%隨機選取出樣本組成訓練樣本集:其中,p由輸入數據復雜度和后續應用要求共同決定,p為0.5-10,N為訓練樣本總數,用余下1-p%樣本組成測試樣本集測試樣本總數為T-N,T、N、C、F為正整數。其它步驟及參數與具體實施方式一相同。具體實施方式三:本實施方式與具體實施方式一或二不同的是:所述步驟二中利用訓練樣本集構造多核學習模型中的基核矩陣Km,得到基核矩陣集合基核矩陣構造方式如下:將訓練樣本集中樣本依次成對輸入到高斯核函數計算基核矩陣其中σm是高斯核尺度參數,xj為訓練樣本集中第j個樣本,i、j為正整數。其它步驟及參數與具體實施方式一或二相同。具體實施方式四:本實施方式與具體實施方式一至三之一不同的是:所述步驟二中多核學習模型為如下線性模型:s.t.dm≥0,and||d||p=c,其中,dm是第m個基核矩陣Km的權重系數,1≤m≤M,M是基核矩陣總數,M為正整數,||·||p是向量或矩陣的p范數,K(xi,xj)為經過多核學習得到的組合核矩陣,d為多核學習模型中的基核權重向量,c為權重向量d的約束值,Km(xi,xj)為第m個基核矩陣。其它步驟及參數與具體實施方式一至三之一相同。具體實施方式五:本實施方式與具體實施方式一至四之一不同的是:所述高斯核尺度參數σm為[0.05:0.05:2],M=40。其它步驟及參數與具體實施方式一至四之一相同。具體實施方式六:本實施方式與具體實施方式一至五之一不同的是:所述步驟三中利用基核矩陣集合在希爾伯特核空間度量高光譜圖像數據集類內離散度和類間離散度;具體過程為:希爾伯特核空間中高光譜圖像數據集類內離散度和類間離散度分別用類內離散度矩陣的跡和類間離散度矩陣的跡來量化;類內離散度矩陣的跡Tr(Sw)計算公式為:其中,Kjk為經過多核學習得到的組合核矩陣中第j行第k列元素,為訓練樣本集,為希爾伯特核空間中訓練樣本集,為第i類訓練樣本在核空間中的平均向量,表示基核矩陣Km中第i行第j列元素,ei表示單位矩陣的第i列,δj,k為克羅內克符號,N為訓練樣本總數,C為數據集中樣本類別數,Km為第m個基核矩陣;ni為第i類訓練樣本數,yj為第j個訓練樣本的類別標簽,為第i類訓練樣本集標簽,dm為第m個基核矩陣Km的權重;φ(xj)為希爾伯特核空間中第j個訓練樣本,ek為表示單位矩陣的第k列,K為經過多核學習得到的組合核矩陣,ej表示單位矩陣的第j列,sm、S為中間變量;i、k、j為正整數;T為轉置;S=diag(s1,s2,...sm,...,sM),類間離散度矩陣的跡Tr(Sb)計算公式為:Tr(Sb)用來量化數據集類間離散度;其中是所有訓練樣本的平均向量,B=diag(b1,b2,...bm,...,bM),bm、B為中間變量。其它步驟及參數與具體實施方式一至五之一相同。具體實施方式七、本實施方式與具體實施方式一至六之一不同的是:所述步驟四中在類內離散度和類間離散度基礎上以最大類別間隔準則度量類別可分性,以類別可分性最大為多核學習模型求解準則,求解基核權重;具體過程為:所述的最大類別間隔準則為:其中,λ>0是一個平衡參數;利用1/2范數對基核權重向量d進行約束,即最大化上述類別間隔準則,得如下優化問題:dm是d中第m個元素;利用拉格朗日乘子法對上訴最大值問題進行求解,得如下解:其它步驟及參數與具體實施方式一至六之一相同。具體實施方式八、本實施方式與具體實施方式一至七之一不同的是:所述通過經驗確定,λ=0.5。其它步驟及參數與具體實施方式一至七之一相同。采用以下實施例驗證本發明的有益效果:實施例一:本實施例一種最大化類別可分性的高光譜圖像分類多核學習方法具體是按照以下步驟制備的:1、實驗數據UniversityofHouston高光譜圖像數據集,該數據集場景來源于美國休斯頓大學,于2012年6月23日17:37:10到17:39:50間收集。傳感器平臺距地面平均高度為5500英尺,具有2.5米空間分辨率。包含144個波段,光譜范圍從380nm到1050nm,包括可見光和近紅外波段。觀測場景內地物被劃分為15類,分別是:健康的草、衰敗的草、人工草、樹、裸地、水、居民樓、商業樓、道路、高速公路、鐵路、停車場1、停車場2、網球場和跑道。RGB假彩色合成圖和地物分布真實圖如圖2a、圖2b所示。對原始高光譜圖像進行主成分分析,保留累計方差為99.78%的主成分。再在主成分基礎上利用尺度為[3,5,7,9,11,13,15,17,18,21]的菱形結構元素進行形態學特征提取。最終利用所提取的形態學特征進行分類實驗。2、實驗內容在實驗中,采用本發明和已有四種方法對以上數據集進行分類。已有四種方法包括單核方法(SK)、簡單多核學習(SimpleMKL)、代表性多核學習(RMKL)和平均多核學習(MeanMKL)。所有多核學習算法的核尺度范圍設置為[0.05:0.05:2]。使用支持向量機分類器,懲罰系數C和松弛變量ξ由交叉驗證得到。選擇每類訓練樣本數分別按10、30、50進行分類實驗。記錄十次運行結果均值作為最終結果,并統計十次運行結果方差。使用總體精度評估分類結果。表1為不同方法在不同訓練樣本下的總體分類精度及其方差。表1不同方法在不同訓練樣本下的總體分類精度及其方差分類方法103050SK83.80±1.8789.08±0.6689.36±0.36SimpleMKL79.47±1.3883.97±0.6084.52±0.28MeanMKL84.52±1.5289.94±0.7390.81±0.41RMKL84.59±1.6790.37±0.5691.19±0.39本發明方法85.15±1.5191.61±0.5792.40±0.31從實驗結果可以看出本發明能明顯提高分類精度,改善分類性能。本發明還可有其它多種實施例,在不背離本發明精神及其實質的情況下,本領域技術人員當可根據本發明作出各種相應的改變和變形,但這些相應的改變和變形都應屬于本發明所附的權利要求的保護范圍。當前第1頁1 2 3