專利名稱:一種用于人臉識別的高效提升訓練方法
技術領域:
本發(fā)明屬于模式識別技術領域,同時涉及到圖像處理和統(tǒng)計學習等技術,特別是涉及用于人臉識別的高效提升(Boosting)訓練方法背景技術如何高效的訓練出具有良好推廣能力的分類器一直是模式識別和統(tǒng)計學習領域關注的問題。Boosting作為一種優(yōu)秀的統(tǒng)計學習算法近年來在人臉識別領域得到了廣泛的應用。但是,由于Boosting算法自身的特點,在人臉識別領域的應用中,它存在著訓練時間過長并且無法實現分布或并行式計算的不足。
目前,公知的Boosting算法都是在特征空間中依次學習出一系列弱分類器,然后用投票法將這些弱分類器組合成強分類器。在人臉識別領域,由于人臉模式具有高度的復雜性,通常抽取的特征數目非常巨大。一些和Boosting算法搭配使用的局部特征,如Haar-like特征、(LocalBinary Pattern局部二值模式)LBP特征和Gabor特征等,構成的特征空間的維數往往達到幾萬、十幾萬,甚至更高。以最常用的Gabor特征為例,如果采用50×60像素的人臉圖像和5個尺度、8個方向的Gabor濾波器,得到的特征空間維數(特征數)是120,000。對于Boosting算法,高維的特征空間意味著大的計算量和大內存空間的需要。如果用和FERET人臉庫中的訓練集(314人的736張人臉圖像)相當規(guī)模的數據作為訓練樣本的話,全部特征計算出來將需要4G左右的內存。由于一般的計算機內存配置小于4G,這使得訓練時間劇增。上述的情況在一臺配置為2G物理內存、P4 3.6G CPU的Dell服務器上訓練,時間會長達一個多月。這對于使用Boosting進行工程開發(fā)或算法研究的人員來說是個極為不方便的地方。因此,在人臉識別領域,Boosting算法存在效率低下的問題。
相關的技術文獻主要有以下幾篇。其中文獻[1]提出了一種基于Boosting和Haar特征的人臉檢測算法。文獻[2][3][4]分別提出了基于Boosting和Haar特征、Boosting和Gabor特征以及Boosting和LBP特征的人臉識別算法。文獻[5]是關于FERET人臉庫和測試的重要論文。文獻[1][2][3][4]的檢測和識別算法都是建立在公知的Boosting算法基礎之上,存在分類器訓練效率低下的問題。
P.Viola and M.Jones,“Rapid Object Detection using a BoostedCascade of Simple Features”,CVPR,2001. M.Jones and P.Viola,“Face Recognition Using Boosted LocalFeatures”,MERL Technical Reports.TR2003-25,April 2003. P.Yang,S.Shan,W.Gao,S.Z.Li,D.Zhang,“Face RecognitionUsing Ada-Boosted Gabor Features”,FGR2004. Stan Z.Li and His Face Team,“AuthenMetric F1A HighlyAccurate and Fast Face Recognition System”,ICCV2005 Deom. P.Phillips,H.Moon,S.Rizvi and P.Rauss,“The FERET EvaluationMethodology for Face-Recognition Algorithms”,IEEE TPAMI,Vol 22,No.10,2000.
發(fā)明內容
為了克服在人臉識別領域Boosting算法訓練需要大內存、訓練時間過長、效率低的不足,本發(fā)明的目的是要提供減少計算量、減少訓練時間和內存、提高效率、提高分類器的分類精度,為此,本發(fā)明提供一種用于人臉識別的高效提升Boosting訓練方法。
本發(fā)明的一種用于人臉識別的高效提升Boosting訓練方法,訓練步驟如下獲取訓練數據步驟利用人臉數據庫,得到人臉訓練數據;構建原始特征空間步驟選擇或構造適用于人臉識別的特征,構建人臉原始特征空間;生成隨機子空間步驟利用構建的人臉原始特征空間產生多個隨機子空間;
生成隨機子空間分類器步驟在所述隨機子空間中,訓練生成若干個隨機子空間分類器;隨機子空間分類器組合和人臉識別步驟用融合技術將所述若干個隨機子空間分類器組合成最終的分類器,用于人臉識別。
本發(fā)明采用在多個特征隨機子空間(Random Subspace)中進行Boosting訓練,然后將訓練所得到的隨機子空間分類器進行融合的技術方案來回避高維特征空間所帶來的一系列問題。每個特征隨機子空間從原始的高維特征空間中采用隨機的方式產生,其維數遠遠小于原始的特征空間維數。在特征隨機子空間中進行Boosting訓練,計算量和訓練的時間將大為減少。對于原始維數特別高的特征空間來說,如Gabor等,能夠達到多個隨機子空間訓練時間的總和也遠遠比在原始的特征空間訓練的時間要少得多的效果。多個隨機子空間之間相互獨立,因此訓練可以分布式的進行,這將使訓練時間進一步縮短。
為保證每個隨機特征子空間的分類能力和訓練出來的隨機子空間分類器的魯棒性,對于局部特征,隨機子空間產生時從人臉各個區(qū)域的特征中同時隨機選擇,使每個隨機子空間包含的位置信息分布于整個人臉。
由于隨機子空間是原始的特征空間的子空間,隨機子空間的表達能力不超過原始的特征空間,在隨機子空間中訓練所得到的分類器的表達能力不超過在原始的特征空間中所得到的分類器的表達能力。因此,在訓練誤差相同的情況下,隨機子空間中訓練出來的分類器不會比在原始的特征空間中訓練出來的分類器的推廣性能差,即本發(fā)明中隨機子空間訓練出的分類器的推廣能力與原始特征空間訓練出的分類器相等或比后者更好。同時,由于各個隨機子空間是隨機產生,因此必定存在差異,訓練出的分類器也具有不同的屬性,最后用融合的方法將各個隨機子空間訓練出的分類器組合可以進一步提高分類精度。
本發(fā)明的訓練方法大大減少了訓練的時間和內存需要,并且最終訓練得到的分類器比目前公知的Boosting算法得到的分類器具有更好的分類精度??傮w的效果是,在降低Boosting訓練所需空間和時間復雜度的同時,提高了最終分類器的分類精度,達到了大幅度提高Boosting算法效率的目的。
通過以下結合附圖的詳細描述,本發(fā)明的上述和其它方面、特征和優(yōu)點將變得更加顯而易見。附圖中圖1是本發(fā)明的在多個隨機子空間進行Boosting訓練,并融合得到最終分類器的示意2是本發(fā)明的局部特征的隨機子空間構造產生圖具體實施方式
下面結合附圖對本發(fā)明作具體說明。應該指出,所描述的實施例僅僅是為說明的目的,而不是對本發(fā)明的限制。
根據本發(fā)明圖1,在多個隨機子空間進行Boosting訓練,并融合得到最終分類器的示意圖所示本發(fā)明的方法是利用人臉數據庫,得到人臉訓練數據;選擇或構造適用于人臉識別的多種特征,構建原始特征空間;利用構建的人臉原始特征空間產生多個隨機子空間;在隨機子空間中,獨立的訓練生成若干個分類器;然后,用融合技術將所述若干個在隨機子空間中訓練得到分類器組合成最終的分類器,用于人臉識別。
本發(fā)明提出的用于人臉識別的高效提升Boosting訓練方法如圖1所示,具體實施方法如下1.所述獲取訓練數據步驟利用人臉圖像,得到人臉訓練數據。對于每一張人臉圖像,根據雙眼的中心位置,旋轉圖像,使所有圖像中人的雙眼處于水平位置;縮放圖像,使所有圖像中人臉的雙眼間距相同;最后將臉部區(qū)域按一定參數切割出來??s放和切割人臉區(qū)域時,可采用如下參數雙眼間距為65像素,雙眼的豎直方向位置為43像素,人臉區(qū)域高為142像素,寬為120像素。
由于通常的圖像采集設備得到的圖像具有噪聲,并且不同光照環(huán)境下人臉圖像會有很大差別,因此要對切割下來的標準尺寸人臉圖像進行去噪和去光照處理。這里去噪使用3×3的高斯濾波器進行低通濾波。去光照可以使用一般的灰度直方圖均衡或者計算量大一些的商圖像算法。
最終,得到大小相同,并且所有人臉的眼睛都在同一位置,經過了去噪和去光照處理的人臉訓練數據。
2.所述構建適用于人臉識別的原始特征空間步驟利用人臉訓練數據,構建人臉原始特征空間,人臉圖像的主要特征包括如Haar、Gabor或(Local Binary Pattern局部二值模式)LBP特征等。
人臉特征空間是原始人臉圖像空間的高維線性或非線性映射以Haar特征為例,每一個人臉特征由一個Haar算子φ(m,s,x,y)和圖像做卷積得到,其中m是Haar算子的類型;s是Haar算子的尺度,對同一類型的Haar算子進行縮放,縮放程度由s控制;x,y是空間位置,取值范圍受人臉區(qū)域限制,即算子可以位于人臉圖像的任何位置,進行卷積,抽取該位置的特征。假設使用5種類型的Haar算子,每種算子有10種縮放級別,切割下來人臉圖像高142像素,寬120像素,那么可以抽取的特征數目大約為5×10×142×120=852,000,也就是說,原始特征空間的維數高達852,000。如果使用公知的Boosting算法,訓練時間會非常的長,內存的需要量也非常之大。Gabor特征和LBP特征空間的構建與此類似。當然,也可以使用自己構造新的特征。
在文獻[1][2][3][4]中作者都只使用到一種特征,再用Boosting算法在特征空間中訓練分類器來完成人臉檢測或識別任務。而且,為了避免特征空間維數過高,采取了諸如使用小的人臉圖像,有空間間隔的特征抽取等一些小措施。由于本發(fā)明提出的Boosting訓練方法可以很好的解決特征空間維數過高的問題,特征空間的構建上不再受其維數的限制。因此,在使用特征上有更大的自由度可以同時用到不同種類的特征,如同時使用Haar和Gabor特征,或加入根據特定識別任務構造的特征,構成維數更高但判別能力更強的混合特征空間;可以使用更大尺寸的人臉圖像,以抽取更多的具有判別能力的反映人臉細微差別的特征(這對一些困難的識別任務,如雙胞胎的識別極為有利)。
3.所述生成隨機子空間步驟利用構建的人臉原始特征空間產生多個隨機子空間,是在兼顧訓練數據的可分性,各隨機子空間訓練出來的分類器之間的融合性和計算量的基礎上確定隨機子空間的維數和個數,進而產生相應數目具有相應維數的隨機子空間。
所述從原始特征空間中產生多個特征隨機子空間,Boosting訓練在隨機子空間中進行;隨機子空間的表達能力不超過原始特征空間,隨機子空間訓練出分類器的推廣能力與原始特征空間訓練出的分類器相等或超過后者。
所述從構造的特征空間生成多個維數適中的隨機子空間S1,S2……SL,為了保證每個特征隨機子空間的分類能力和訓練出來的分類器的魯棒性,對于像Haar、Gabor或LBP等這樣的一些局部特征,隨機子空間產生時可以從人臉各個區(qū)域的特征中隨機選擇局部特征,以保證每個隨機子空間包含的位置信息分布于整個人臉,如圖2本發(fā)明的局部特征的隨機子空間構造產生圖所示。
隨機子空間的維數和隨機子空間的個數是本發(fā)明中的兩個重要參數,下面分別加以說明1)隨機子空間維數的確定選擇隨機子空間的維數時,首先要確保訓練出的分類器達到預期的訓練誤差指標,也就是要保證在隨機子空間中人臉數據是可分的。因此,隨機子空間維數不能任意小。同時,也不能太大。太大會增加隨機子空間中Boosting訓練的時間和空間復雜度。并且,將增加隨機子空間之間的相關度,降低隨后融合的效果。一般維數可取原始特征空間維數的1/8或1/10或1/12或1/15。
2)隨機子空間個數的確定。隨機子空間越多,融合后的分類器精度越高,并且越穩(wěn)定。但是子空個數的太多同樣會增加總的計算量。一般3個或5個或10個或12個隨機子空間就可以達到非常好的效果。
確定好隨機子空間的個數和每個隨機子空間的維數后,就可以進行隨機子空間的產生。設確定的隨機子空間的個數為L,每個隨機子空間的維數為M。根據圖2本發(fā)明的局部特征的隨機子空間構造產生圖所示,其中隨機子空間構造是由隨機子空間S1、隨機子空間S2……隨機子空間SL組成。
按圖2所示,將人臉分為6個區(qū)域。對應的,將原始特征空間的特征按這6個區(qū)域進行分組,即每一組特征對應的位置屬于同一個區(qū)域。然后進行下列操作for i=1,2,…,L從每個區(qū)域的特征中,隨機的選擇M/6個特征;將這6個區(qū)域隨機選擇的特征組成一個維數為M的隨機子空間;end就可以得到L個維數為M的隨機子空間。
關于從每個區(qū)域中隨機選擇特征進一步說明如下在很多編程語言中都有隨機數產生函數可以直接調用,以C語言為例,調用rand函數可以返回一個0到32767之間的偽隨機數r。將每個區(qū)域里的特征從0起依次編號。設每個區(qū)域特征的特征數目為Na,將產生的隨機數r用表達式index=r/32768*Na映射到0-Na之間。每調用一次rand函數,得到一個隨機數r,按映射表達式計算出index,選取一個編號等于index的特征。重復上述步驟M/6次,就可以在一個區(qū)域的特征中隨機的選取出M/6個特征。
4.所述Boosting訓練和生成隨機子空間分類器步驟在所述各個隨機子空間中利用Boosting進行訓練,生成若干個分類器;由于各隨機子空間Boosting訓練相互獨立,因此可以在多臺計算機上同時進行,這將進一步減少訓練時間。所述訓練生成若干個隨機子空間分類器,是在在多個隨機子空間中獨立訓練的分類器C1,C2……CL。
人臉識別是一個多類問題(一個人作為一個類別),而一般的Boosting算法解決的是兩類問題。為了避免復雜的多類Boosting算法,本發(fā)明采用類內差和類間差來將人臉識別這個多類分類問題轉化為兩類問題。在訓練時,將類內差作為正樣本,類間差作為負樣本。識別的時候,對于任意一幅新人臉照片,把它同所有注冊的照片相比較,通過判斷它們的差是類內差還是類間差來實現人臉的多類分類。關于類內和類間差進一步解釋如對于同一個人兩幅人臉圖像I1,I2,特征提取之后表示為F(I1),F(I2),它們的距離|F(I1)-F(I2)|就是類內差。對于來自不同人的兩幅人臉圖像I,J,特征提取之后表示為F(I),F(J),它們的距離|F(I)-F(J)|就是類間差。計算類內和類間差用到的距離測度可以是街區(qū)距離(City Block Distance)、歐氏距離或χ2距離等。設我們的訓練數據有P個人,每個人有K張圖像,這樣可以得到的類內差樣本數為 類間差的樣本數為 在隨機子空間中進行Boosting訓練的另一個問題是類內差和類間差樣本數量的不平衡。比如有200個人,每人2幅圖像的400張訓練人臉圖像。可以產生的類內差樣本數為20022=200,]]>類間差樣本數量為4002-200=79,600.]]>兩類樣本數量的不平衡會影響到Boosting訓練效果,并且類間差樣本往往數量過大,包含很多的冗余信息。因此,在隨機子空間進行Boosting訓練時,所有的類內差樣本都使用。而對于類間差樣本由于其數量通常遠大于類內差樣本,我們只隨機的抽取和類內差樣本數量相當的一部分用于訓練。隨機抽取類間差樣本的方法和前面所述從區(qū)域的特征中隨機的選擇特征相同,這里不再重復。
5.所述隨機子空間訓練出來的分類器的融合并用于人臉識別的步驟用融合技術將所述若干個在隨機子空間中訓練出來的分類器C1,C2,…,CL組合生成最終的分類器C,用于人臉識別。C1,C2,…,CL是在多個隨機子空間中獨立訓練得到的分類器。
這里,我們推薦使用直接求和,加權求和兩種簡單有效的融合技術。
在進行融合之前需要對隨機子空間分類器C1,C2,…,CL輸出分數進行歸一化。盡管這些分類器是都是由AdaBoost訓練出來同一類型分類器,但它們是在不同的隨機子空間訓練出來的,因此它們是有差別的。這些差別的表現之一,就是分類器輸出的分數值的范圍是不一樣的。
為了提高后端的融合性能,必須對這些分類器的輸出分數進行歸一化。設某個隨機子空間分類器輸出的分數最大值為fmax,最小值為fmin,可以用公式fn=f-fminfmax-fmin]]>將其輸出分數f歸一化為fn。
設fn1,fn2,…,fnL分別表示L個在隨機子空間中訓練出來的分類器C1,C2,…,CL的歸一化分數。
求和的融合方法得到的最終總分類器C的輸出可以由公式f=Σi=1Lfni]]>計算得到,這種融合方法的優(yōu)點是簡單,方便,計算速度快。
加權求和方法得到的最終總分類器C的輸出可以有公式f=Σi=1Lwifni]]>計算得到。其中,wi是第i個隨機子空間分類器的權重,可以用交叉驗證的方法加以確定。具體來說,就是單獨的建立一用于人臉識別測試的驗證集,測試并記錄L個分類器的正確識別率r1,r2,…,rL,則第i個分類器的權重由公式wi=riΣi=1Lri]]>計算得到。這種融合方法操作起來比直接求和法要復雜一些,但是效果比直接求和法要好。
識別時,首先要對圖像采集設備獲得的新的(未知身份)人臉圖像進行切割和預處理,這一步和獲取訓練數據步驟中的切割和預處理完全相同;然后,將處理后的人臉圖像和注冊的(已知身份的)人臉圖像組成圖像對,分別抽取它們的特征和計算它們的差。具體的計算法也和所述Boosting訓練和生成隨機子空間分類器步驟中計算類內差和類間差完全相同;最后將每對人臉圖像(其中一幅是待識別,未知身份的人臉圖像,另一幅是已知身份的人臉圖像)的特征差值作為分類器的輸入,由分類器的輸出分數判斷是類內差還是類間差,即是同一個人的兩幅圖像還是不同人的兩幅圖像。分類器的分數表明圖像對屬于同一人的可信度,或者說,分數越高,該人臉圖像對越有可能來自于同一人,分數越低,則這幅圖像極有可能屬于不同的兩個人。
實際操作時,可以設置一個閾值,大于該閾值的就認為是同一個人的兩幅圖像。如果未知人臉圖像和多個注冊的人圖像的得分大于閾值,我們就選取分數最大的,以此確定未知人臉的身份。
上面描述是用于實現本發(fā)明及其實施例,本發(fā)明的范圍不應由該描述來限定。本領域的技術人員應該理解,在不脫離本發(fā)明的范圍的任何修改或局部替換,均屬于本發(fā)明權利要求來限定的范圍。
權利要求
1.一種用于人臉識別的高效提升的訓練方法,其特征在于,訓練步驟如下獲取訓練數據步驟利用人臉數據庫,得到人臉訓練數據;構建原始特征空間步驟選擇或構造適用于人臉識別的多種特征,構建原始特征空間;生成隨機子空間步驟利用構建的人臉原始特征空間產生多個隨機子空間;生成隨機子空間分類器步驟在所述隨機子空間中,訓練生成若干個隨機子空間分類器;隨機子空間分類器的融合并用于人臉識別步驟用融合技術將所述若干個隨機子空間分類器組合,用于人臉識別。
2.根據權利要求1所述的用于人臉識別的高效提升的訓練方法,其特征是,所述獲取訓練數據步驟包括利用人臉圖像,得到人臉訓練數據,對于每一張人臉圖像,根據雙眼的中心位置,旋轉圖像,使所有圖像中人的雙眼處于水平位置;縮放圖像,使所有圖像中人臉的雙眼間距相同;最后將臉部區(qū)域按一定參數切割出來;對切割下來的標準尺寸人臉圖像進行去噪和去光照處理得到大小相同、并且所有人臉的眼睛都在同一位置的人臉訓練數據。
3.根據權利要求1所述的用于人臉識別的高效提升的訓練方法,其特征是,所述構建原始特征空間步驟包括原始人臉圖像空間的高維線性或非線性映射,人臉圖像的主要特征包括Haar、Gabor或LBP特征,每一個人臉特征由一個算子φ(m,s,x,y)和圖像做卷積得到,其中m是算子的類型;s是算子的尺度,對同一類型的算子進行縮放,算子縮放程度由s控制;x,y是空間位置,取值范圍受人臉區(qū)域限制,即算子位于人臉圖像的任何位置進行卷積,抽取該位置的特征,則完成原始特征空間構建。
4.根據權利要求1所述的用于人臉識別的高效提升的訓練方法,其特征是,所述生成隨機子空間步驟利用構建的人臉原始特征空間產生多個隨機子空間,從人臉原始特征空間中產生多個特征隨機子空間,在隨機子空間中進行Boosting訓練;隨機子空間的表達能力不超過原始特征空間,隨機子空間訓練出分類器的推廣能力與原始特征空間訓練出的分類器相等或超過后者;基于訓練數據的可分性,各隨機子空間中訓練出的分類器之間的融合性和計算量的基礎上確定隨機子空間的維數和個數,進而產生相應數目具有相應維數的隨機子空間。
5.根據權利要求1或4所述的用于人臉識別的高效提升的訓練方法,其特征在于,所述生成隨機子空間步驟從構造原始特征空間生成多個維數適中的隨機子空間,隨機子空間產生時從人臉各個區(qū)域的特征中隨機選擇局部特征,使每個隨機子空間包含的位置信息分布于整個人臉。
6.根據權利要求4所述的用于人臉識別的高效提升的訓練方法,其特征在于所述隨機子空間的維數和個數確定隨機子空間的維數可取原始特征空間維數的1/8-1/15;隨機子空間的個數一般選擇為3-12個。
7.根據權利要求1所述的用于人臉識別的高效提升的訓練方法,其特征還在于,所述生成隨機子空間分類器步驟在多個隨機子空間中訓練,采用類內差和類間差來將人臉識別由多類轉化為兩類,以類內差作為正樣本,類間差作為負樣本,通過訓練得到的若干個隨機子空間分類器C1,C2,...,CL。
8.根據權利要求1所述的用于人臉識別的高效提升的訓練方法,其特征還在于,所述人臉識別步驟包括需要對隨機子空間分類器C1,C2,...,CL的輸出分數f進行歸一化處理得到fn=f-fminfmax-fmin;]]>采用融合技術,將若干個隨機子空間分類器C1,C2,...,CL組合生成最終分類器C;利用最終分類器C的輸出分數判斷類內差或類間差,即判斷是同一個人的兩幅圖像還是不同人的兩幅圖像,則完成人臉識別。
9.根據權利要求8所述的用于人臉識別的高效提升的訓練方法,其特征還在于,所述融合技術,利用加權求和的融合方法得到的最終分類器C的輸出分數為f=Σi=1Lwifni]]>,wi是第i個隨機子空間分類器的權重;或利用求和的融合方法得到的最終分類器C的輸出分數為f=Σi=1Lfni.]]>
10.根據權利要求8所述的用于人臉識別的高效提升的訓練方法,其特征還在于,所述人臉識別步驟包括識別時,首先要對圖像采集設備獲得的未知身份人臉圖像進行切割和預處理,然后,將處理后的人臉圖像和注冊的已知身份的人臉圖像組成圖像對,分別抽取它們的特征和計算它們的差;最后將每對人臉圖像,其中一幅是待識別,未知身份的人臉圖像,另一幅是已知身份的人臉圖像的特征差值作為分類器的輸入,由分類器的輸出分數判斷是類內差還是類間差,即是同一個人的兩幅圖像還是不同人的兩幅圖像。
11.根據權利要求10所述的用于人臉識別的高效提升的訓練方法,其特征還在于,人臉識別步驟,所述輸出分數判斷實際操作時,設置一個閾值,大于該閾值的為同一個人的兩幅圖像;如果未知人臉圖像和多個注冊的人圖像的得分大于閾值,則選取分數最大的,以此確定未知人臉的身份。
全文摘要
本發(fā)明公開一種用于人臉識別的高效提升算法的訓練方法,利用人臉數據庫,得到人臉訓練數據;選擇或構造適用于人臉識別的多種特征,構建原始特征空間;利用構建的人臉原始特征空間產生多個隨機子空間;在隨機子空間中,訓練生成若干個分類器;用融合技術將所述若干個在隨機子空間中訓練得到分類器組合成最終的分類器,用于人臉識別。本發(fā)明的Boosting訓練方法大為減少了訓練時間和空間復雜度,最終得到分類器的精度也優(yōu)于目前公知的Boosting訓練方法得到的分類器。
文檔編號G06K9/66GK101075291SQ200610011930
公開日2007年11月21日 申請日期2006年5月18日 優(yōu)先權日2006年5月18日
發(fā)明者高勇, 王陽生 申請人:中國科學院自動化研究所