一種基于稀疏保持距離度量的人臉識別方法
【技術領域】
[0001] 本發明屬于數據挖掘與人工智能技術領域,具體涉及一種基于稀疏保持距離度量 的人臉識別方法。
【背景技術】
[0002] 傳統的身份驗證方式一鑰匙、口令等,存在繁瑣、容易被盜取等缺點。隨著多媒體 時代的發展,這些傳統的身份驗證方式已經被逐漸取代。人臉識別技術就是當前應用極為 廣泛的身份驗證方式之一。簡單的說,人臉識別技術即是將待分類人臉數據進行處理,與數 據庫中人臉數據進行相關性比對,對捕捉的人臉進行識別。近些年,研究人員提出了很多人 臉識別的方法,基于人臉模板匹配、維數約簡、神經網絡、SVM分類器等方法均在一定程度上 取得了不錯的人臉識別效果。
[0003] 然而,為了獲得更好的人臉識別系統,使用一個恰當的距離度量來衡量人臉圖像 間的相似性是至關重要的。現有技術中很多距離度量算法(ITML,LMNN等)未充分利用所有 無標簽樣本數據,并且大多數算法考慮了樣本的類別標簽而忽略樣本間的空間位置信息, 使得距離度量算法在很多應用中很難進一步提高識別精度。因此,使用一個恰當的距離度 量算法對于很多應用(如人臉識別)具有至關重要的影響。
【發明內容】
[0004] 本發明的目的在于針對現有技術中的不足,提供一種基于稀疏保持距離度量的人 臉識別方法,充分利用所有樣本數據(標簽樣本與無標簽樣本),并充分保持樣本數據的稀 疏結構化?目息,以提尚人臉識別的精度。
[0005] 本發明的目的通過下述技術方案實現:一種基于稀疏保持距離度量的人臉識別方 法,具體實現方法如下:
[0006] 步驟1,從所有已存儲人臉數據中提取帶標簽信息的人臉數據,基于人臉數據,使 用最大邊界理論構建距離度量算法的框架;
[0007] 步驟2,使用稀疏表示理論,挖掘樣本間的稀疏結構化信息,構建稀疏權值矩陣;
[0008] 步驟3,構建稀疏保持優化函數,使得在新構建的距離度量空間中,樣本的稀疏結 構化信息得以最大化的保存;
[0009] 步驟4,利用正則化框架,將最大邊界理論與稀疏保持優化函數結合,得到稀疏保 持距1?度
[0010] 步驟5,使用特征描述子,提取待識別人臉的圖像特征,并在稀疏保持距離度量下, 進行人臉識別實驗,對測試人臉數據進行分類。
[0011] 進一步,步驟1具體包括:
[0012] 根據樣本的標簽信息,計算在使用距離度量矩陣A的情況下,不同類樣本間距離平 方和,計算公式為:
[0013]
[0014] 其中,(Xl,Xj)eD表示樣本x^x諫自不同類,dA(Xl, Xj)表示在使用距離度量矩陣 A的情況下,樣本^與幻之間的距離,T表示矩陣的轉置;
[0015] 根據樣本的標簽信息,計算在使用距離度量矩陣A的情況下,相同類樣本間距離平 方和,計算公式為:
[0016]
[0017] 其中,(xk,xi) ES表示樣本xk與XI來自同一類,dA(xk,xi)表示在使用距離度量矩陣 A的情況下,樣本X1J^X1之間的距離,T表示矩陣的轉置;使用最大邊界理論,構建距離度量框 架,使得在距離度量矩陣A下,不同類樣本間距離之和最大的同時同類樣本間距離之和最 小,距離度量框架如下:
[0018]
[0019] 其4
(Xi,Xj) GD表示樣本Xi與Xj來自不同類, (Xk,XI) E s表示樣本Xk與XI來自同一類,Nd為集合D中約束對的個數,Ns為集合S中約束對的 個數,α為正則化參數,權衡不同類樣本間距離之和與同類樣本間距離之和的比例;
[0020] 將4=117帶入公式(3)進行求解,通過矩陣的特征分解,求得最優投影矩陣W,進而 得到距離度量矩陣A;其中WT*W的轉置矩陣。
[0021] 進一步,步驟3具體包括:
[0022] 通過保持稀疏表不構成樣本間稀疏權值關系,構建稀疏保持優化函數如下:
[0023] (10)
[0024] 式中,Sl是除Xl以外所有樣本線性組成^的稀疏系數,其表*Xl與其他所有樣本的 稀疏相關性;乂二匕^^…^一是由所有樣本組成的字典矩陣^為正整數;
[0025]對公式(10)進行等價變換如下:
[0026] (II)
[0027]式中,5=[81,82,'",811]是稀疏權值矩陣;[0028] 將公式(11)轉化為最大化問題并加入約束條件如下:
[0029] (12)
[0030] 式中,S是稀疏權值矩陣,X為字典矩陣,W為投影矩陣。
[0031]進一步,步驟4具體包括:
[0033]
[0032] 將權利要求1步驟3中稀疏保持優化函數通過正則化結構加入距離度量框架中,得 到稀疏保持距離度量的目標函數如下:
[0034] +ST_STS)XT,a與β均是正則化參數,用于均衡各部分的比重,以得到最優的度量子空間。
[0035] 與現有技術相比本發明的有益效果是:該方法恰當地保持了人臉數據樣本間的稀 疏結構化信息,并充分使用了大量的無標簽人臉數據,使得距離度量算法對樣本流形結構 有更深入的理解,最終使得人臉識別系統的識別精度得到進一步提高。
【附圖說明】
[0036]圖1是本發明的流程圖。
[0037]圖2是本發明不同類樣本分散開且同類樣本聚集的示意圖;
[0038]圖3是不同距離度量方法在0RL人臉數據上的識別精度比較圖;
[0039]圖4是不同距離度量方法在AR人臉數據上的識別精度比較圖。
【具體實施方式】
[0040] 下面結合附圖所示的各實施方式對本發明進行詳細說明,但應當說明的是,這些 實施方式并非對本發明的限制,本領域普通技術人員根據這些實施方式所作的功能、方法、 或者結構上的等效變換或替代,均屬于本發明的保護范圍之內。
[0041] 參圖1所示,本實施例提供了一種基于稀疏保持距離度量的人臉識別方法,具體 實現方法如下:
[0042]步驟S1,從所有已存儲人臉數據中(標簽數據與無標簽數據)提取帶標簽信息的人 臉數據,基于人臉數據,使用最大邊界理論構建距離度量算法的框架。
[0043]具體包括以下步驟:
[0044]步驟①.最大邊界理論利用了所有的標簽數據,使得在新的距離度量下,不同類樣 本間距離之和最大的同時,同類樣本間距離之和最小。首先定義不同類間距離之和如下:
[0045] t ' ⑴
[0046] 其中,(Xl,Xj)eD表示樣本x々x諫自不同類,集合D中包含了所有來自不同類的 成對樣本,最大化公式(1)使得不同類樣本間的距離之和最大。
[0047]步驟②.根據樣本的標簽信息,定義在距離度量矩陣Α下,同類樣本間距離之和如 下: _] (2)
[0049]其中,(xk,xi)es表示樣本xk與XI來自同一類,集合S中包含了所有來自相同類的 成對樣本,最大化公式(2)使得同類樣本間的距離之和最小。
[0050] 步驟③.使用最大邊界理論,即求得最優距離度量矩陣A,使得不同類樣本盡可能 的分散開的同時,同類樣本盡可能聚集(如圖2所示),從而構建距離度量框架如下:
[0051] ⑶
[0052] 其中,其中
且(Xi,Xj) eD表示樣本Xi與Xj來自不 同類,(xk,XI) e S表示樣本xk與XI來自同一類,Nd為集合D中約束對的個數,Ns為集合S中約 束對的個數,α權衡兩項的比例,以獲得最優的距離度量矩陣A。
[0053] 步驟④.為了便捷的得到度量矩陣Α,將A=ffffTS入公式(3)可得:
[0054] 、 ' (4)
[0055]這里tr( ·)代表矩陣的跡,為了以更緊湊的形式表示公式(4),我們定義了以下兩 個等式-
[0056] (5)
[0057] (6)
[0058]因此,最大邊界理論可以構建距離度量框架如下:
[0059] ff=arg max2tr(ffT(MD-aMs)ff)
[0060] s.t.ffTff=I (7)
[0061 ]其中公式(7)中約束條件為了防止退化解。W= [wi,W2,…,wd],其中wi,W2,…,wd是 MD-aMs大于0的d個特征值對應的特征向量。
[0062]通過最大邊界理論初步得到的距離度量矩陣即為A = ffffT。最大邊界理論充分利用 了樣本的標簽信息,在其構建的度量空間中,不同類樣本間距離之和盡可能大的同時,同類 樣本間距離盡可能的小。因此,最大邊界理論能進一步的提高人臉識別系統的準確性。
[0063] 步驟S2,使用稀疏表示理論,充分挖掘樣本間的稀疏結構化信息,構建稀疏權值矩 陣。
[0064] 由于最大邊界理論僅利用了標簽樣本,浪費了大量無標簽樣本的同時,忽略了數 據集中樣本間的空間結構。本發明利用稀疏表示理論,充分挖掘并保持了數據集的稀疏結 構化信息。具體包括以下步驟:
[0065] 步驟①.利用稀疏表示,使用數據集中除樣本Χι&外所有樣本來構建對xi的最稀 疏的表示如下:
[0066] (8