一種結合降維和認知引力模型的人臉表情識別方法
【技術領域】
[0001] 本發明涉及一種圖像處理、維數約減、情感計算和模式識別技術,特別涉及一種結 合降維和認知引力模型的人臉表情識別方法。
【背景技術】
[0002] 隨著信息技術的不斷發展,社會發展對情感計算提出了更高的要求,有廣泛的應 用價值。例如在人機交互方面,一個擁有情感能力的計算機能夠對人類情感進行獲取、分 類、識別和響應,進而幫助使用者獲得高效而又親切的感覺,采用情感計算技術探測駕駛司 機的精力是否集中,感受到的壓力水平等,并做出相對反應。此外,情感計算還能應用在機 器人、智能玩具、游戲、電子商務等相關產業中,以構筑更加擬人化的風格和更加逼真的場 景。情感也反映了人類的心理健康情況,情感計算的應用可以有效地幫助人們避免不良情 緒,保持樂觀健康的心理。
[0003] 人的面部表情,語音,生理指標等都能在一定程度上反映人類的情感。本發明涉及 人臉表情識別中的維數約減和分類。目前使用到人臉表情識別中的維數約減方法有很多, 如主成分分析方法(PrincipalComponentAnalysisPCA)正交局部投影保持(Orthogonal LocalityPreservingProjections0LPP),以及偶子空間非負矩陣分解等。但是這些方法 不能同時最小化類內距離,最大化類間距離,以及在低維空間中保持高維空間中的流形結 構。近年來提出了較多的能同時實現上述3個目標的維數約減算法,其中一種稱為長程相 關反饋的維數約減算法RF(Long-termRelevanceFeedback)對多媒體數據有較好的效果。 但是該方法不能直接應用于人臉表情識別,因為抽取的特征不僅包括用于人臉識別的特征 也包括表情識別的特征,而人臉差別很大的人卻可能有相同的表情,這使得同一表情的人 臉樣本之間的距離較大,這樣的距離對目標函數用于表情識別造成負面影響。為此本發明 對最小化離得較遠但屬于同一類別的樣本之間的距離進行一定的懲罰,并據此提出一種能 克服上述缺點的維數約減方法,稱之為增強型長程相關反饋ERF維數約減算法(Enhanced Long-termRelevanceFeedback)〇
[0004]ERF除了能克服RF的缺點外,還能從訓練數據中提取到樣本的密度信息,而這個 信息有利于分類。傳統的分類器如支持向量機(SupportVectorMachineSVM),稀疏表示 分類(SparseRepresentation-basedClassifierSRC),K_ 近鄰分類(KNN)等都不能很好 的使用樣本的密度信息。而一種基于認知引力模型的分類器能夠利用樣本的密度信息,但 是該方法使用自信息估算引力模型的質量,而自信息既隨著樣本密度的變化而變化,又隨 著訓練樣本個數的變化而變化,使得樣本之間的引力估算不準確。
【發明內容】
[0005] 本發明的目的在于克服現有技術的缺點與不足,提供一種結合降維和認知引力模 型的人臉表情識別方法,該人臉表情識別方法簡單,易于實現,是一種認知引力模型提出了 一種新的質量計算方法和認知引力計算方法。
[0006] 本發明的目的通過下述技術方案實現:一種結合降維和認知引力模型的人臉表情 識別方法,包括以下步驟:
[0007] (1)使用基于金字塔的方向梯度直方圖(PyramidofHistogramofOriented GradientsPHOG)提取測試樣本x的特征,稱為PHOG特征;
[0008] (2)采用增強型長程相關反饋維數約減算法ERF(EnhancedLong-termRelevance Feedback)的投影映射W,對提取的PHOG特征降維,將測試樣本映射到低維空間y=WTx,其 中y是樣本x映射到低維空間之后的結果;
[0009] (3)計算測試樣本的質量m(y);
[0010] (4)根據測試樣本和訓練樣本的質量,按如下公式計算每個訓練樣本j= 1,2,…,n對測試樣本Xi的引力,其中n是訓練樣本的個數;
[0011]
(10)
[0012] (5)從每個表情類別中,分別選出對測試樣本引力最大的k個訓練樣本,并將每個 類的這些引力求和,對測試樣本引力最大的那個類別即為訓練樣本的表情類別。
[0013] 在使用所述結合降維和認知引力模型的人臉表情識別方法之前,還需要訓練,訓 練的過程包括如下步驟:
[0014] (1)提取每個訓練樣本的PHOG特征;
[0015] (2)使用訓練數據訓練維數約減方法ERF,獲得投影映射W,將訓練數據從高維空 間轉換到低維空間;
[0016](3)計算每個訓練樣本的質量。
[0017] 所述增強型長程相關反饋維數約減算法ER的包括如下步驟:
[0018] (1)定義增強長期相關反饋的維數約減方法的目標函數如下:
[0019]
(1)
[0020] 其中WTXLbXW,WTXLfXW,WTXLwXW,WTXLmXW是 4 個優化目標,a1和a2為平衡參數。
[0021] WTXLbXW的目標是最大化類間距離,定義如Eq. 2,式中於表示不屬于第c類的訓練 樣本個數,C表示總類別個數,li,^表示第i、第j個樣本的類別標簽。
[0022]
(2)
[0023] WTXLwXW的目的是最小化類內距離,定義如Eq. 3,式中Nc表示屬于第c類的訓練樣 本個數。
[0024] 7 (3)
[0025] WTXLfXW的目的是對最小化離得較遠但屬于同一類別的樣本之間的距離進行一定 的懲罰,定義如Eq. 4,式中Nf表示與xi屬于同一類并且互相不為k鄰域的樣本的個數, Nk(Xj)表示Xj的k鄰域。
[0026]
(4)
[0027]WTXLmXW的目的是在低維空間中保持高維空間中的流形結構,其中的L-定 義如Eq. 5,式中lk+1G Rk+1為元素全為1的列向量,S#RnX(k+1),Si=1當x5為 = ,撒(X/)}的第p個元素,(Si)pq= 0其它情況。 (5) "
,
[0031] (2)將Eq. 1所示的優化問題轉化為Eq. 6所示的求廣義特征值的問題,其中W由最 大的q個廣義特征值對應的廣義特征向量組成,q為維數約簡之后的維度。
[0032]X(Lb+aiLf)XTff=AX(Lw+a2Lf)XTff, (6)
[0033] (3)獲得投影映射W,將訓練數據從高維空間轉換到低維空間Y=WTX
[0034] -種結合降維和認知引力模型的人臉表情識別方法中的質量計算方法的步驟如 下:
[0035] (1)計算樣本y的密度,其中>^是71的第K近鄰。
[0036]
(7)
[0037] (2)計算樣本的自信息I (y): 「00381
(8)
[0039] (3)通過歸一化自信息,計算樣本的質量m(y):
[0040]
[0041] (9)
[0043] 其中,m(y)為樣本的質量。
[0044] 本發明相對于現有技術具有如下的優點及效果:
[0045] 1、本發明提出的ERF相對于RF在目標方程中增加了 一項優化目標,該優化目標能 對最小化距離較遠屬于同一類的樣本之間的距離進行懲罰,能夠避免最小化這些距離時對 目標函數影響過大,導致其它的優化目標不能很好的實現。
[0046] 2、本發明提出的ERF相對于RF對優化目標中的各項使用了更好的歸一化方法,該 歸一化目標能夠使得各優化目標的數量級在不同訓練樣本個數的情況下相對恒定,從而使 得ERF中的平衡參數能夠在較小的范圍內選擇。
[0047] 3、本發明提出的ERF能夠從訓練樣本中提取到樣本的分布密度信息,該信息有利 于分類。
[0048] 4、本發明使用一種新的方法計算認知引力模型的質量,使得樣本的質量幾乎只與 樣本的分布密度相關,能夠更好的利用樣本的分布密度信息,從而使得新的認知引力模型 更有利于分類。
[0049] 5、本發明將一種新的基于認知引力模型的分類器用于人臉表情識別,相對支持向 量機,K-近鄰分類,稀疏表示分類,該分類能夠更好的利用樣本的分布密度信息。
【附圖說明】
[0050] 圖1是一種結合降維和認知引力模型的人臉表情識別方法的流程圖。
【具體實施方式】
[0051] 下面結合實施例及附圖對本發明作進一步詳細的描述,但本發明的實施方式不限 于此。
[0052] 實施例
[0053] 如圖1所示,本實施例