一種基于非負字典對學習的魯棒多視角聚類方法
【專利摘要】本發明公開一種基于非負字典對學習的魯棒多視角聚類方法,通過提取包含若干子空間的數據集不同視角下的特征;然后將特征學習嵌入字典學習,聯合學習語義投影矩陣和非負特征投影;加入一致性約束和局部幾何保持約束學習多視角所共享的公共聚類標簽,在多個約束下學習各視角的語義投影矩陣、參數表示矩陣及多視角共享的語義投影矩陣,完成多視角聚類。該方法可以挖掘出多視角所共享的公共語義標簽,并且加入一致性約束,減少單獨的聚類標簽與公共語義標簽之間的差異性,同時加入局部幾何保持約束,使得具有相似結構的數據更大概率分到相同的類。
【專利說明】
-種基于非負字典對學習的魯棒多視角聚類方法
技術領域
[0001] 本發明設及模式識別技術領域,尤其是一種基于非負字典對學習的魯棒多視角聚 類方法。
【背景技術】
[0002] 在現實中,很多數據都有多個模態,例如,文章可W被翻譯成多種語言、新聞可W 從多個視角報道、圖片可W由多種描述子描述。一般而言,多視角數據可W提供互補和兼容 的信息。多視角聚類是一種無監督的多視角學習方法,已經引起了人們的關注。過去的工作 主要分為兩類:基于回歸的方法和基于子空間的方法。雖然運些方法都取得了顯著的提高, 但是它們是有局限性的。因為運些方法都假設所給的特征是無噪聲的,運些數據可W掲示 潛在的聚類結構。但不幸的是,現實生活中的特征常常是冗余的且含有噪聲,運極大地降低 了上述方法的性能。因此亟需一種高效魯棒的多視角聚類方法。
【發明內容】
[0003] 鑒于W往方法不能有效的滿足魯棒多視角聚類的需要,本發明提出了一種基于非 負字典對學習的魯棒多視角聚類方法。該方法用特征投影學習聚類標簽,使用語義投影探 索潛在語義信息,同時加入一致性約束和局部幾何保持約束W生成一個多視角共享的公共 聚類標簽,從而實現多視角聚類。
[0004] 本發明是運樣實現的,一種基于非負字典對學習的魯棒多視角聚類方法,包括W 下步驟:
[0005] SI,提取多模態數據庫中的多模態特征;
[0006] S2,基于所述多模態數據庫中的特征向量,通過字典學習得到語義投影矩陣和參 數表示矩陣;
[0007] S3,向所述多模態數據庫嵌入非負特征投影W處理噪聲特征;
[000引S4,根據所述參數表示矩陣,創建一致性約束,用于描述多視角下各個樣本聚類標 簽與多視角所共享的公共標簽之間的一致性;
[0009] S5,根據所述多模態數據庫中各個模態的特征,創建局部幾何保持約束,用于描述 每個視角下樣本間結構的相似性;
[0010] S6,根據所述語義投影矩陣、非負特征投影、一致性約束和局部幾何保持約束,得 到統一的目標函數;
[0011] S7,求解所述目標函數得到公共語義標簽,根據所述公共語義標簽,得到公共的聚 類結果,完成多視角聚類。
[0012] 本發明方法假設數據是冗余的且有噪聲,通過學習非負特征投影處理噪聲特征, 利用一致性約束最小化單獨聚類標簽與共享標簽之間的差異,利用局部幾何保持約束保持 數據的局部一致性,使得相似數據具有較大概率,具有相同的語義標簽;同時考慮特征投 影、一致性約束和局部幾何保持約束,將其納入到統一的子空間聚類框架,采用近端交替線 性最小化算法優化目標函數,得到公共語義標簽,完成多視角聚類。
[0013] 根據本發明的方法,可挖掘出多視角所共享的公共語義標簽,并且加入一致性約 束,減少單獨的聚類標簽與公共語義標簽之間的差異性,同時加入局部幾何保持約束,使得 具有相似結構的數據更大概率分到相同的類。
【附圖說明】
[0014] 圖1是基于非負字典對學習的魯棒多視角聚類方法流程圖。
【具體實施方式】
[0015] 為使本發明的目的、技術方案和優點更加清楚明白,W下結合具體實施例,并參照 附圖,對本發明進一步詳細說明。
[0016] 如圖1所示,本發明的基于非負字典對學習的魯棒多視角聚類方法包括W下步驟:
[0017] 步驟SI,提取包含若干子空間的多模態數據庫中的多模態特征;
[0018] 多模態數據即同一數據有不同的表現形式,如視頻數據可由音頻和圖像流組成, 圖片數據可由圖像本身視覺信息和標記單詞信息組成。對不同模態的數據分別提取特征, 如提取圖片視覺信息的GIST特征,標記單詞的詞頻特征等。
[0019] 多模態特征是包括含有圖片和標記單詞一一對應的圖像標記對。
[0020] 步驟S2,基于所述多模態數據庫中的特征向量,通過字典學習得到語義投影矩陣 和參數表示矩陣;
[0021] 在該步驟中,采用字典學習方法來學習多模態數據庫中的特征向量的語義投影矩 陣和參數表示矩陣。語義投影矩陣是探索模態特征的語義信息,在字典學習中是字典;參數 表示矩陣是模態特征在所學字典上的表達。
[0022] 所述字典學習的目標函數為:
[0023]
>
[0024] 其中,義=扣..一,,]居0<''^"為始隹的非負訓練數據,11為樣本數目,[/扣&'為語義投 影矩陣,r為聚類標簽個數,Fe日""為參數表示矩陣,I I ? Mf為求取F-范數操作,Q {U,V} 代表約束項。
[0025] 步驟S3,向所述多模態數據庫嵌入非負特征投影;
[0026] 所述的非負特征投影是原始噪聲數據到所述參數表達的線性投影V = WTx, W為線 性投影矩陣,WT為矩陣W的轉置,可有效處理含有噪聲的數據。
[0027] 步驟S4,根據所述參數表示矩陣,創建一致性約束,用于描述多視角下各個樣本聚 類標簽與多視角所共享的公共標簽之間的一致性;
[0028] 該步驟中,一致性約束是描述多視角下各個樣本聚類標簽與多視角所共享的公共 標簽之間的一致性,因為多個視角隱含地表達相同的對象。所述一致性約束公式如下:
[0029]
[0030] 其中,C為模態序號,Wc為第C個模態的特征投影矩陣,Wj為矩陣Wc的轉置,Xc為第C 個模態的特征,公共語義標簽。
[0031 ]步驟S5,根據所述多模態數據庫中各個模態的特征,創建局部幾何保持約束,用于 描述每個視角下樣本間結構的相似性。
[0032] 在該步驟中,局部幾何保持約束描述每個視角下樣本間結構的相似性,假設具有 相似結構的樣本具有相似的語義,因此,具有相似結構的樣本更大概率屬于同一聚類標簽。
[0033]
[0034] 其中m是模態數目,i J為樣本序號,n為樣本數目,A。為第C個模態的權重系數,V* (:,i)表示矩陣八的第i列,V"是矩陣轉置,Lc = Dc-Sc是親和矩陣Sc的拉普拉斯矩陣,D。 為第C個模態的對角矩陣,Dc(U) = EAQJ),第C個模態的親和矩陣Sc如下定義:
[0035]
','
[0036] 其中,Nk(X)為樣本X的k近鄰。
[0037] 步驟S6,根據所述語義投影矩陣、非負特征投影、一致性約束和局部幾何保持約 束,得到統一的目標函數。
[003引所述目標函數為:
[0039]
,
[0040] 其中,Uc為第C個模態的語義投影矩陣,Wc是第C個模態特征的線性投影矩陣,a, 0為 權重參數,〇,0£[10^,104],瓜為第(3個模態的特征,¥^3公共語義標簽,||.1|2,1為求取矩 陣的2,1范數操作,L是每個模態拉普拉斯矩陣的加權和,I為單位矩陣。
[0041] 所述統一的目標函數放縮處理后如下:
[00491
,.
[004引其中,J為目標函數,V。為第C個模態的輔助變量。
[0044] 步驟S7,求解所述目標函數得到公共語義標簽,根據所述公共語義標簽,得到公共 的聚類結果,完成多視角聚類。
[0045] 該步驟中,求解所述統一的目標函數方法可W是采用近端交替線性最小化算法, 具體步驟如下:
[0046] S71,初始化W,取V咚,F*。,e = 1,...,m,和迭代次數N,上標0表示第0次迭代;
[0047] S72,求解第t+1次迭代第C個模態的投影矩陣t/.'+i:
[004引
[0049] 其中,叫>1是常數
曼目標函數J關于Uc的偏導數,巧『是矩陣 巧的轉置,巧為第t次迭代的第C個模態的投影矩陣,巧是第t次迭代的第C個模態的輔助變 量,利普席茨模量 [0化0] S73,求解 W/";
[0化1 ]
,
[0化2]其中,Wc'+I為第t+1次迭代的第C個模態的投影矩陣,Qw是常數,取值范圍是Qw>l, 目標函數J關于W。的偏導數J和利普席茨模量與計算如下:
[0化3]
[0化4]
[005引其中,a,e為權重參數,X。為第C個模態的特征向量,Oft為對角矩陣
'其中!^'(人:)為矩陣形的第j行,I I . Ih為求取矩陣的2范數,W/為 第t次迭代的第C個模態的投影矩陣。[0化6] S74,求解巧+1:
[0化7]
[0化引
[0化9]其中,Qv>l是常數,1%是Vc的利普席茨模量,Vg J是目標函數相對于Vc的偏導數, 是第t+1次迭代的第C個模態的中間變量,FTi是第t+1次迭代的第C個模態的輔助變量。
[0060] S75,求解
[0061]
[0062]
[006;3]其中,(V節"是第t+1次迭代的公共語義標簽,是常數,取值范圍心/ >1,與?是公 共語義標簽V巧勺利普席茨模量,Vj是目標函數J相對于公共語義標簽勺偏導數。
[0064] S76,轉 S72,直至t = N,N為迭代次數,N=30。
[0065] 通過W上目標函數的求解得到公共語義標簽后,根據所述公共語義標簽,得到公 共的聚類結果,即可完成多視角聚類。
[0066] 為了驗證本發明的實施效果,接下來W化seal V0C2007數據庫為例說明。該數據 庫包含9963個圖像-文本對,共計20類,即對應20個語義標簽。具體步驟如下:
[0067] SI,將訓練集中多類別的圖片W及沒有標記詞對應的圖片去除,得到5649圖像和 標記詞對。提取圖片的GIST特征W及標記詞的詞頻特征。
[006引S2,給定參數日,0,丫,、W及聚類數目m,k = l,. . .,m)。
[0069] S3,初始化戶。,仁= :1,...,機,和迭代次數N=30。
[0070] S4,迭代執行步驟S72-S75,得出公共語義標簽。
[0071] S5,根據公共語義標簽完成多視角聚類。
[0072] W上所述的具體實施例,對本發明的目的、技術方案和效果進行了進一步詳細說 明,所應理解的是,W上所述僅為本發明的具體實施例而已,并不用于限制本發明,凡在本 發明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本發明的保護范 圍之內。
【主權項】
1. 一種基于非負字典對學習的魯棒多視角聚類方法,包括步驟: Sl,提取多模態數據庫中的多模態特征; 52, 基于所述多模態數據庫中的特征向量,通過字典學習得到語義投影矩陣和參數表 示矩陣; 53, 向所述多模態數據庫嵌入非負特征投影以處理噪聲特征; S4,根據所述參數表示矩陣,創建一致性約束,用于描述多視角下各個樣本聚類標簽與 多視角所共享的公共標簽之間的一致性; 55, 根據所述多模態數據庫中各個模態的特征,創建局部幾何保持約束,用于描述每個 視角下樣本間結構的相似性; 56, 根據所述語義投影矩陣、非負特征投影、一致性約束和局部幾何保持約束,得到統 一的目標函數; S7,采用近端交替線性最小化算法求解優化所述目標函數,得到公共語義標簽,根據所 述公共語義標簽,得到公共的聚類結果,完成多視角聚類。2. 根據權利要求1所述方法,其特征在于,所述字典學習的目標函數為: mm\\X-UV\fF + a{U,V\ , \j .V 其中,工二匕…七:^口^為狀隹的非負訓練數據^為樣本數目"如~為語義投影矩 陣,r為聚類標簽個數,FeD yxn為參數表示矩陣,I I · I |F為求取F-范數操作,Ω{υ,ν}代表 約束項。3. 根據權利要求2所述的方法,其特征在于,步驟S3中所述非負特征投影是非負線性投 影V=WtX,W為線性投影矩陣,W t為矩陣W的轉置。4. 根據權利要求3所述的方法,其特征在于,步驟S4中,所述一致性約束公式如下:其中,c為模態序號,W。為第c個模態的特征投影矩陣,Wct為矩陣W。的轉置,X。為第c個模 態的特征,f為公共語義標簽。5. 根據權利要求4所述方法,其特征在于,步驟S5中所述局部幾何保持約束如下:其中m是模態數目,i,j為樣本序號,η為樣本數目,λ。為第c個模態的權重系數,:,i) 表示矩陣f的第i列,V#是矩陣f的轉置,U = DrSc^是親和矩陣S。的拉普拉斯矩陣,D。為第c 個模態的對角矩陣,DJ i,i) = Σ $。( i,j),第c個模態的親和矩陣S。如下定義: 其中,Nk(X)為樣本X的k近鄰。6. 根據權利要求5所述方法,其特征在于,步驟S6中,所述統一的目標函數如下表示:其中,U。為第c個模態的語義投影矩陣,W。是第c個模態特征的線性投影矩陣,α,β為權重 參數,〇#^[1〇4,1〇4],1為第(3個模態的特征,,為公共語義標簽,||叫| 2,1為求取矩陣的 2,1范數操作,L是每個模態拉普拉斯矩陣的加權和,I為單位矩陣; 所述統一的目標函數放縮處理后如下:其中,J為目標函數,V。為第c個模態的輔助變量。7.根據權利要求6所述方法,其特征在于,所述近端交替線性最小化算法采用如下求 解: S71,初始化W,= ...,m,和迭代次數N,上標O表示第O次迭代; 572, 求解第t+Ι次迭代第c個模態的投影矩陣CC1:其中,au>l是常數是目標函數J關于U。的偏導數,是矩陣E的 轉置,£/:為第t次迭代的第c個模態的投影矩陣,K是第t次迭代的第c個模態的輔助變量, 利普席茨模I573, 求解 fF/+1 :其中,廣為第t+1次迭代的第c個模態的投影矩陣,aw是常數,取值范圍是aw>1,目標 函數J關于W。的偏導數和利普席茨模量計算如下:其中,a,β為權重參數,X。為第c個模態的特征向量,為對角矩陣!其中<(./,:)為矩陣醉的第j行,U · I h為求取矩陣的2范數,<為 第t次迭代的第c個模態的投影矩陣; 574, 求解 Ff1i其中,αν>ι是常數,&是V。的利普席茨模量,'Jr是目標函數相對于V。的偏導數,if 1 是第t+1次迭代的第C個模態的中間變量,Jf1是第t+1次迭代的第C個模態的輔助變量; 375,求解(〇*+1:其中,)t+1是第t+Ι次迭代的公共語義標簽,%是常數,取值范圍《V >1,卜是公共語 義標簽f的利普席茨模量,是目標函數J相對于語義標簽f的偏導數。 S76,轉S72,直至t = N,N為迭代次數,N=30。
【文檔編號】G06K9/62GK106022351SQ201610270303
【公開日】2016年10月12日
【申請日】2016年4月27日
【發明人】譚鐵牛, 曹冬, 赫然, 孫哲南, 李志航
【申請人】天津中科智能識別產業技術研究院有限公司