本發明屬于屬于模式識別中的圖像識別領域,尤其涉及一種基于核統計不相關的多視圖的圖像分類方法。
背景技術:
:近年來在模式識別領域,對于多視圖的學習研究引起了眾多學者的廣泛關注。在許多計算機視覺應用中,同一物體可以從不同的角度來觀察,甚至可以通過使用不同的傳感器來連接。從而產生多個不同的樣本,甚至完全互異的都有可能。例如,給定一張臉,照片可以從不同的視角拍,會得到多種姿態的人臉圖像;一張臉也可以通過可見光或近紅外照明分別來捕捉視覺圖像或近紅外圖像。最近,越來越多的應用需要同時從視圖間和視圖內來進行分類。然而,來自不同視圖的樣本,很顯然,必定會依附于完全互異的空間。在此基礎上,這些來自不同視圖的樣本是不能直接相互比較的。所以視圖間和視圖內的共同分類基本上是不能直接進行的。因此,之前大多數處理這個問題的方法都嘗試去學習到一個多視圖能夠共享的公共空間。在獲得這個公共空間之后,在這里,上述來自多個視圖的樣本不可以直接相互比較的問題都能解決了。(1)現有多視圖圖像分類方法——多視圖典型相關分析方法(mcca)和多視圖鑒別分析方法(mvda)。mcca方法用來獲得多個視圖的公共空間。在這個方法中,通過最大化任意兩個視圖之間的總體相關性來獲得多個特定視圖的變換。其中,每個特定的視圖都對應一個特征變換。其目的是找到一個線性變換的集合該線性變換的集合能夠將v個視圖{x1,...,xν}的樣本投影到一個公共空間,并且最大化任意兩個視圖的低維嵌入的總體相關性。其中,是第i個視圖里包含的數據矩陣,包括n個樣本,維度是pi。這個問題可以通過使用拉格朗日乘子轉化為廣義多變量特征值問題。其中是的對偶形式,ki是核矩陣,并且這個問題可以通過數值方面的交替方法解決[54]。和典型相關分析一樣,每個視圖樣本的數量應該是一致的。mvda方法試圖去尋找ν個線性變換w1,w2...,wν,能夠將ν個視圖中的樣本分別投影到一個公共鑒別空間。其中,需要在最小化類內變化量的同時,使類間變化量達到最大化。為了達到以上這個極值化的目的。在形式上,我們先將第j個視圖的樣本定義為χ(j)={xijk|i=1,...,c;k=1,...,nij},其中,xijk是第i類第j個視圖的第k個樣本。維度為dj,即c是類別數,nij是第i類第j個視圖的樣本擁有的數目。通過使用ν個線性變換能夠將ν個視圖中的樣本投影到公共空間,記為在上述獲得的這個公共空間中,所有視圖的類間變化量按照預期可以被最大化。與此同時,類內變化量被最小化。我們把這個目標表示成廣義rayleigh商式:(2)現有方法的不足首先,已有的很多多視圖圖像分類方法,并不能夠很好得將多視圖之間的全局信息充分利用。技術實現要素:本發明所要解決的技術問題是針對
背景技術:
的不足,提供用于圖像分類的基于核統計不相關的多視圖算法。該方法基于加入的統計不相關約束獲得投影變換矩陣,并利用核方法,將上述計算擴展到非線性空間。所以不僅在數據的利用性上提高了,還有效得去除了冗余信息,從而提高分類算法的效果,并且降低了計算復雜度。本發明為解決上述技術問題采用以下技術方案一種基于核統計不相關的多視圖的圖像分類方法,具體包含如下步驟:步驟1:根據帶有加權統計不相關約束條件的目標函數,利用核方法,得到在高維特征空間中的特征方程最大特征值對應的特征向量ω作為投影向量;步驟2:通過依次迭代的方法,求解出所有的剩余投影向量;步驟3:將解出的所有剩余投影向量組合起來,構成投影矩陣;步驟4:通過對原始樣本進行投影,將其投影到高維空間,進而獲取新的高維空間中存在的樣本特征集合;步驟5:使用最近鄰分類器分類,獲得多視圖圖像分類的結果。作為本發明一種基于核統計不相關的多視圖的圖像分類方法的進一步優選方案,在步驟1中,帶有加權的統計不相關約束條件具體表示為:式中,st表示總體散度矩陣,v代表視圖個數,c是樣本類別數,nt表示視圖第i類樣本總數,xijk表示第j個視圖第i類的第k個樣本,表示第i類樣本的均值,t為轉置符號。作為本發明一種基于核統計不相關的多視圖的圖像分類方法的進一步優選方案,在步驟1中,目標函數為:minjss(β,ρ,σ)=βtnβ-cρ+μr(β),s.t.βt(mq+1-mq)≥ρ其中,β代表樣本x對投影矩陣w的貢獻,ρ代表約束閾值,n代表樣本的近鄰表示,c代表懲罰系數,μ表示模型中無標簽數據對樣本特征提取貢獻大小相關的參數,r代表包含內積的矩陣,mq代表q個樣本核化之后的平均值,q為正整數。作為本發明一種基于核統計不相關的多視圖的圖像分類方法的進一步優選方案,在步驟2中,剩余投影向量的具體計算公式如下:其中,目標函數中的ρj和ωj用u和d向量形式表示,i表示單位矩陣,st表示樣本總體散度矩陣,sw表示樣本類內散度矩陣,sb表示樣本類間散度矩陣,d=[ω1,...,ωj]t表示投影向量的集合,ωi表示每個視圖分別對應的投影向量,參數λ表示拉格朗日乘子。作為本發明一種基于核統計不相關的多視圖的圖像分類方法的進一步優選方案,在步驟3中,所述投影矩陣具體如下:其中,v≥1本發明采用以上技術方案與現有技術相比,具有以下技術效果:1、本發明對樣本經過訓練獲得的投影變換矩陣加入統計不相關約束,以獲得新的滿足統計不相關約束的投影矩陣,并利用核方法,將上述計算擴展到非線性空間;2、本發明加上約束能夠使得數據的利用性提高,去除冗余信息;3、本發明加入應用于多視圖學習中的核技巧,將樣本從低維線性不可分映射至高維的線性可分,得到加入核方法的高維特征投影空間;4、本發明在multi-pie人臉數據庫上的實驗驗證了所提方法的高效性:在提高分類算法的效果的同時,降低了計算復雜度,除此之外,還可以將該方法應用到其他圖像數據庫上。附圖說明圖1是本發明所提出的用于圖像分類的基于核統計不相關的多視圖算法的流程示意圖。具體實施方式下面結合附圖對本發明的技術方案做進一步的詳細說明:如圖1所示,本發明所述的用于圖像分類的基于核統計不相關的多視圖算法,包括以下步驟:(1)根據加權統計不相關約束的目標函數,利用核方法,得到在高維特征空間中的特征方程最大特征值對應的特征向量ω作為投影向量。帶有加權的統計不相關約束條件表示為:式中,α是加權系數矩陣,可以衡量整體樣本關系。本發明將其定義成式中的σ表示總體樣本方差。(2)通過依次迭代的方法,求解出所有的剩余投影向量。將目標函數中的ρj和ωj用u和d向量形式表示,其中u=[ρ1,...,ρj]t,d=[ω1,...,ωj]t。則有:2sbωi-2λswωi-stdtu=0。將之前的條件代入其中,得到下式:移項化簡之后,得到:式中,i表示單位矩陣。這樣,接下來要考慮的是第i個投影向量ωi的求解。轉化為特征方程問題的求解,psbωi=λswωi。其中,有d=[ω1,ω2,...,ωk]t,i=diag(1,1,...,1)。(3)將解出的所有剩余特征向量組合起來,構成投影矩陣。表示為假設一個理想的核矩陣k*和給定的真實核矩陣k。核目標對齊(kta)的基本思想,在本文中選擇作為內核學習的策略,是選擇最接近理想的核矩陣k*的內核矩陣k(在一個不同矩陣的集合中)。兩個內核矩陣k和k*之間的kta定義為:其中<·,·>f表示frobenius內積。當內核函數能夠反映用于定義理想的核矩陣的訓練數據集屬性的時候,該內積數量得到最大化。(4)將原始樣本利用上面求出的投影矩陣進行投影,將其投影到高維空間,這樣能夠得到新的高維空間中存在的樣本特征集合。當計算核目標對齊的時候,要考慮到代價矩陣,用于對非對齊錯誤進行相對程度不同的懲罰。也就是說,在這種情況下定義加權矩陣w,以如下方式,使得對不同的相似性或不相似性錯誤施加加權承諾,其中表示在矩陣a和b之間的入門內積。對于順序分類中,常見代價矩陣的選擇就是使用絕對誤差,即:其中,r(yj)表示目標yj和模式xj有關的排序,也就是說r(cq)=q,q∈1,...,q,其中,cq表示樣本特征的排序,其結構為c1<c2<...<cq,表示其順序信息。(5)最后使用最近鄰分類器分類,獲得多視圖圖像最終分類的結果。以下將詳細地說明本發明的原理:1.加入統計不相關約束設多視圖原始數據樣本集樣本為x。經過ωi和ωj投影后,特征用yi和yj來表示。yi和yj之間的協方差矩陣表示為:cov(yi,yj)=e[(yi-e(yi))(yj-e(yj))](4)代入投影向量,可得到:要使得求得的鑒別特征滿足統計不相關,需要協方差矩陣為0,即cov(yi,yj)=0,則上式就等價于如下的約束條件:上式中的總體協方差散度矩陣st定義如下:其中,nt表示總體的樣本數量。重新構建整體的樣本信息,改寫上式中樣本的總體散布矩陣,讓它滿足帶有加權的統計不相關約束條件:式中,α是加權系數矩陣,可以衡量整體樣本關系。為:式中的σ表示總體樣本方差。將公式結合起來,可以得到最終的基于加權統計不相關約束的特征提取算法目標函數。對該目標函數利用拉格朗日乘子法進行求解,構造如下:其中,c表示拉格朗日的懲罰因子。2.核化過程2.1前者是與內核矩陣kl相關聯的標記模式,并與其對應的理想核對齊的。這一步是用于將我們的算法初始化為對于已知信息可行的解決方案。在這種情況下,可行的解決方案將是一組適合訓練有標簽數據的內核參數。這個對齊步驟是用al來表示的。2.2后者是基于使用有標簽和無標簽數據兩者的內核參數的調整。此步驟稱為au,并開始使用上一步的解決方案。在這種情況下,理想內核使用不同的方法構造:其中,slu是在有標簽和無標簽模式之間的相似度矩陣,使用下式計算,圖形模型用s來表示。其元素sij反映第i個樣本和第j個樣本之間的相似性。為了簡單,表示如下:其中,nk(xi)表示xi的k最近鄰集合。suu是在無標簽模式之間的相似度矩陣。在這種情況下,我們設置關聯到最近鄰數目的參數k為因為它在實驗中會產生相對較好的性能,其中,nq表示樣本的近鄰矩陣。將本發明所述的多視圖分類方法在multi-pie人臉數據庫上進行實驗,并將實驗結果和相關多視圖分類方法mvfs、mcca和mvda進行對比分析。multi-pie人臉數據庫中人臉圖像的像素是640×486。選出一個包含231個人的大約14,450個圖像的子集,包括7個不同姿勢(-45度,-30度,-15度,0度,15度,30度,45度),3個不同表情(中立,微笑,反感),來自4個不同區間的不完全照明,每個人最少被拍攝了26張照片。實驗中選擇每類訓練樣本數從5到13,則剩余作為測試樣本為21到13。表1為核統計不相關方法和相關比較方法的識別率(%)。表1方法mvfsmcca平均識別率(%)91.2291.80方法mvdamvkua平均識別率(%)92.3793.12由表1可以看出:本發明提出的核統計不相關方法在多視圖圖像分類方面優于現有的幾種典型方法,在平均識別率的結果中一目了然。本發明的方法mvkua在識別率上比對比方法識別率最高的提高了1.90%(=93.12-91.22%)。實驗結果表明,本申請所述的方法識別率更高,提高了分類算法的效果。該方法是一種更加有效的用于多視圖圖像分類的分析方法,在multi-pie人臉數據庫上得到了有力的證明。本發明不只應用于人臉識別領域。除了人臉圖像之外,對于其他維數較高的多視圖圖像樣本,例如多光譜掌紋圖像等,本方法同樣適用。當前第1頁12