專利名稱:一種應(yīng)用于人臉識別的活體檢測方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及生物模式識別領(lǐng)域中的人臉識別子領(lǐng)域,具體地,涉及在人臉識別系 統(tǒng)中如何區(qū)分真實的人臉與照片的方法技術(shù);本發(fā)明在具體實施方式
中還涉及到機器學(xué)習(xí) 領(lǐng)域及圖像處理領(lǐng)域。
背景技術(shù):
生物特征識別系統(tǒng)的使用安全性是人們普遍關(guān)注的問題,人們對生物特征識別系 統(tǒng)的信心和接受很大程度上取決于系統(tǒng)的魯棒性、低錯誤率和抗欺騙能力。生物特征識別 系統(tǒng)中,最常見的欺騙方式是發(fā)生在用戶界面上。冒名頂替者使用某種具有相同表現(xiàn)形式 的假冒特征來入侵系統(tǒng)。在各種基于生物特征的應(yīng)用中,人臉識別由于其符合人類自身區(qū)分不同人的方 式,且對用戶友好(即不需要刻意或令使用者反感的配合等),受到了廣泛的歡迎。在人臉 識別應(yīng)用中,合法用戶的人臉圖片、視頻以及三維模型等常被用于身份偽造,而其中照片是 最常見的欺騙方式。解決這一問題的方法,通常稱為活體檢測(liveness detection或者 liveness testing),其目的是判斷獲取到的生物特征是否來自一個已授權(quán)的、有生命的、 在現(xiàn)場的、真實的人。活體檢測是生物特征識別系統(tǒng)中檢測和拒絕仿冒身份特征的一項重要功能,而照 片欺騙是人臉識別中一種最常見的入侵方式,對基于人臉識別的安全系統(tǒng)構(gòu)成很大的威 脅。現(xiàn)有的應(yīng)用于人臉識別的活體檢測方法及其缺點主要包括1、分析真實人臉與照片人臉的圖片信息差異,如根據(jù)頭部的三維深度信息去判 斷是否是一個真人,這種方法存在活體檢測所需的特征不易于捕獲,計算時間代價高等缺點。2、分析真實人臉的非剛性運動變化,如采用線性光學(xué)流的方法捕捉三維人臉細微 的運動信息,發(fā)聲時嘴唇部位的動作分析,眼睛區(qū)域的變化,頭部運動變化等,這些方法需 要用戶的主動配合或者需要較大的計算時間、空間的開銷;3、采用多模式判別的方法,如分析人臉的紅外圖像,聯(lián)合聲音識別的方法等,這些 方法需要額外的設(shè)備。此外,以上的方法中,還存在不能作為獨立的模塊,需要改變其他模塊才能加入已 有的人臉識別系統(tǒng)的問題。為解決存在的問題,本發(fā)明提出了一種可用于基于人臉識別的身份認(rèn)證應(yīng)用的反 照片欺騙活體檢測方法。該方法首先通過中頻濾波獲取受檢圖像中的中頻帶信息,然后通 過頻域變換抽取所得中頻帶信息中的特征信息,最后通過分類器辨析受檢圖像為真實人臉 還是照片人臉。具體地,該方法可通過首先對圖像進行DoG(difference of Gaussian)濾 波的預(yù)處理,從預(yù)處理過的二維圖像中提取出傅立葉變換特征,再采用稀疏logistic回歸 模型來判斷身份認(rèn)證中采集到的圖像是真實人臉還是照片人臉。實驗結(jié)果表明,本發(fā)明提出的方法在不添加額外的輔助設(shè)備、不需要用戶的主動配合、實現(xiàn)簡單、計算量小且功能獨 立的情況下,能夠很好的解決基于人臉識別的身份認(rèn)證中照片欺騙的問題。
發(fā)明內(nèi)容
本發(fā)明涉及一種應(yīng)用于人臉識別領(lǐng)域的反照片欺騙的方法和系統(tǒng),結(jié)合至少一幅 附圖對所述方法和系統(tǒng)進行了充分的展現(xiàn)和描述,并在具體實施方式
部分結(jié)合具體實施例 對權(quán)利要求書中所述各項內(nèi)容進行了更加完整的闡述。本發(fā)明所述系統(tǒng)由如圖1所示的三個主要模塊構(gòu)成,其中中頻濾波器用于獲取受 檢照片或人臉圖像信息中的中頻帶信息,頻域變換器用于對獲取到的中頻帶信息做頻域變 換以便提取關(guān)鍵特征信息進一步處理,分類器用于對處理過的特征信息進行分類判斷,得 到受檢者為照片及真實人臉的概率。具體地,該系統(tǒng)中中頻濾波器可采用DoG濾波器,頻域 變換器可采用傅立葉變換器,分類器可采用logistic回歸分類器,如圖2所示。該系統(tǒng)既 可以獨立地處理規(guī)整化后的圖像信息,也可以作為一個模塊直接嵌入到如圖3所示的具體 應(yīng)用當(dāng)中。在典型的基于人臉識別的身份認(rèn)證中,人臉圖像的成像結(jié)果往往受到三方面的影 響1、人臉的內(nèi)部特征(如人臉皮膚的反射屬性、3D結(jié)構(gòu)屬性,人臉表情等);2、外部的成像條件(如所處的環(huán)境內(nèi)的光照情況,人臉部存在的飾物、毛發(fā)的遮 擋等);3、圖像采集設(shè)備的屬性(如照相機的焦距、光圈、分辨率等因素)。如果將采集人臉圖像所處環(huán)境的光源想象成是理想的點光源,則按照Lambertian 模型,人臉的生成圖像表示成(Ix, y) = fc(p (x,y,z)hT(x,y,z)s(x,y,z))其中,ρ (x,y,z)是三維空間中人臉表面一點的坐標(biāo),hT(x,y,z)是人臉表面一點所在平 面的法向量,s(x,y,z)是點光源在人臉表面一點的方向和強度,fc是攝像頭的成像函數(shù),I (χ, y)是三維空間中一點(χ,ι, ζ)對應(yīng)的映射到成像平面的圖像點。注意到如果人臉識別中 采集到的人臉圖像是由照片成像的,則成像前的物體是一個平面的物體,照片中的每一點 所處平面的法向量可近似為一個固定的常數(shù)。即使是照片存在一定程度的向內(nèi)、向外彎曲 和水平方向、垂直方向向內(nèi)、向外的旋轉(zhuǎn),其各點所在平面的法向量hT(x,y,z)也不符合真實人 臉面部的凹凸情況。因此從理論上說,我們可以利用照片成像的這個特點來區(qū)分照片和真 人圖像。但在實踐中,由于人臉表面各點所在平面的法向量不易直接計算,但該量實際反 映的是對象表面紋理分布,不同的對象表面紋理對光照反射程度的不同,從而造成不同的 成像結(jié)果。我們可以利用這一特點來區(qū)分照片和真實人臉真人人臉與照片人臉由于紋理 不同而往往在光照反射程度會有很大的不同,進而造成成像差異。在實踐中我們可以方便 地對采集得到的二維圖像進行傅立葉變換來捕捉這種差異。照片人臉、真實人臉及其在頻 域內(nèi)的對比示例如圖4所示。其中圖(a)為照片人臉成像,圖(b)為真實人臉成像。從該 圖中我們可以看出,由于經(jīng)照片得到的人臉圖像是由平面物體成像,因此由照片得到的人 臉圖像比真實人臉得到的人臉圖像含有更少的高頻部分信息。
進一步地,考慮到在現(xiàn)實應(yīng)用場景中,即使照片也可能存在大量高頻信息(臉部 的痣、眼鏡、胡須等遮擋以及照片反光等光照情況而帶來的高頻噪聲等),極大降低了高頻 信息的區(qū)分能力。但是考慮到照片(或視頻)圖像在攝像頭中的圖像實際上是一種二次成 像,而現(xiàn)代CXD感光器的主要噪聲來源為與光強平方根成比例的短噪聲(short noise),從 直觀上說,照片二次成像相當(dāng)于對圖像造成更大的模糊效果,即增強了低頻信息分布,而損 失大量的中頻細節(jié)信息。換言之,真人圖像由于是一次成像因而比照片包含更多的中頻細 節(jié)信息。本發(fā)明所述的方法就是基于根據(jù)上述事實而得到一個合理的假定中頻帶信息可 能對照片人臉和真實人臉具有更大的區(qū)分能力。根據(jù)上述假定,進一步地,首先需要提取這一部分中頻帶信息,在本發(fā)明所給出的 實施例中是利用DoG(difference of Gaussian)濾波器來提取取這部分信息,但并不限于 此。進一步地,對于抽取到的上述信息通過傅立葉變換進行頻域變換提取關(guān)鍵特征以 便做進一步處理。進一步地,該方法將反照片欺騙問題視為一個兩類分類問題,在本發(fā)明所給出的 實施例中使用logistic回歸作為分類器,但并不限于此。進一步地,由于在研究活體檢測問題中經(jīng)常會遇到訓(xùn)練集存在嚴(yán)重的類不平衡情 況,即往往反例樣本(照片人臉)的規(guī)模遠遠大于正例樣本(真實人臉)的規(guī)模,如此訓(xùn)練 的logistic回歸器將對反例有極大的偏置。在本發(fā)明所給出的實施例中采取了在訓(xùn)練中 “提前終止”的技術(shù),即在logistic回歸訓(xùn)練收斂之前結(jié)束訓(xùn)練的方法,以及調(diào)整logistic 回歸器中的I1范數(shù)正則化球半徑的方法來解決這一問題,但并不限于此。本發(fā)明所述方法的流程如圖5所示。
本發(fā)明說明書部分所引用的所有附圖具體說明如下,如無特別申明則對該附圖均 已在其被引用部分做了必要的進一步說明圖1活體檢測系統(tǒng)基本構(gòu)成圖2活體檢測系統(tǒng)具體構(gòu)成。圖3活體檢測模塊在具體應(yīng)用中的嵌入。圖4照片人臉及真實人臉傅立葉頻譜的對比,其中(a)為照片人臉及其傅立葉頻 譜,(b)為真實人臉及其傅立葉頻譜。圖5活體檢測流程。圖6經(jīng)過DoG濾波后照片人臉與真實人臉傅立葉頻譜的對比,其中(a)為經(jīng)過DoG 濾波后照片人臉的傅立葉頻譜,(b)為經(jīng)過DoG濾波后真實人臉的傅立葉頻譜。圖7反例樣本采集方式(從左至右分別為靜止、上下旋轉(zhuǎn)、左右旋轉(zhuǎn)、上下彎曲、 左右彎曲等五種不同的照片姿態(tài)情況)。圖8部分規(guī)整化后正、反例樣本,其中(a)為規(guī)整化后的真實人臉圖片序列,(b)為 規(guī)整化后的照片人臉圖片序列。圖9不同I1范數(shù)正則化的球半徑對分類器性能的影響。圖IOl1范數(shù)正則化的球半徑設(shè)為4000時,不同的最大迭代次數(shù)對分類器性能的影響。
具體實施例方式在本發(fā)明所給出的實施例中,活體檢測整個流程如圖5所示,其具體步驟描述如 下1、對輸入的圖片進行人臉檢測,截出人臉區(qū)域。2、在截出的人臉區(qū)域內(nèi)進行眼睛定位,即得到雙眼在人臉區(qū)域中的位置。3、根據(jù)定位得到的眼睛坐標(biāo),將人臉圖片規(guī)整化到64像素X64像素。4、將經(jīng)過規(guī)整化的灰度人臉區(qū)域進行DoG濾波,并在濾波處理后對這些圖像采用 二維離散傅立葉變換。在本發(fā)明所述實施例中,首先利用DoG (difference of Gaussian)濾波器來對規(guī) 整化得到的圖像進行預(yù)處理。DoG濾波器是一種差分高斯濾波器,高斯濾波器是指脈沖響應(yīng) 為高斯函數(shù)的一類線性平滑濾波器。在計算機視覺領(lǐng)域中,高斯平滑用來做圖像預(yù)處理,用 于抑制服從正態(tài)分布的噪聲,也可在不同的尺寸下增強圖像的結(jié)構(gòu)。DoG濾波是一種利用差分高斯濾波獲取結(jié)果帶通的方法,即,在輸入圖像上采用兩 種對應(yīng)不同方差的高斯模糊(Gaussian blur)操作,并求兩者相減的差而得到結(jié)果,該方法 廣泛應(yīng)用于機器視覺領(lǐng)域中。DoG中涉及到的兩個主要參數(shù)是內(nèi)外高斯濾波器的方差,分 別記為Qci和O10 一般內(nèi)高斯取值較窄(。^」、于等于1個像素),而外高斯01取2_4個 像素,取決于實際空間域內(nèi)的頻率信息分布。在本發(fā)明的實施例中這兩個參數(shù)的取值為Otl =0. 5和0工=1,但并不限于此。其處理效果如圖6所示。在對規(guī)整化后的圖像進行進行了 DoG濾波之后,再對其進行二維離散傅立葉變換 以獲取關(guān)鍵特征值。5、為了更好的刻畫真實人臉與照片人臉在頻率域的統(tǒng)計差異,對經(jīng)過上述二維離 散傅立葉變換的信息再用logistic回歸分類器判斷是否是真實人臉。Logistic回歸屬于一類判別型模型,通過直接最大化類標(biāo)號的后驗概率來學(xué)習(xí)一 個線性分類函數(shù),該分類器性能與線性SVM相當(dāng),但與其他線性分類器如SVM不同的是,該 方法無需保存任何訓(xùn)練樣本,在檢測時的效率大大提高。為了得到反照片欺騙活體檢測中的logistic回歸分類器,在本發(fā)明的實施例中 需要收集一組正、反例樣本正例樣本是使用網(wǎng)絡(luò)攝像頭收集的若干個真人人臉的圖像序 列;反例樣本是用相應(yīng)的真人照片采集得到的圖像。采樣的基本原則是,盡量減少真人人臉 所含的動態(tài)信息,而增加照片人臉?biāo)械膭討B(tài)信息。具體要求如下1)正例樣本中的真人人臉圖像應(yīng)盡可能多地涵蓋有無眼鏡遮擋以及性別、年齡等 變化因素。在采集圖像時,每個人都被要求正視網(wǎng)絡(luò)攝像頭,自如眨眼,表情自然,無明顯的 動作和表情變化。2)采集反例樣本所使用的照片包括多種不同的大小以及打印機打印和傳統(tǒng)沖洗 等多種不同質(zhì)地的照片。在所使用的照片中,人臉部區(qū)域占整個照片區(qū)域的大小應(yīng)盡可能 的大,至少要超過2/3。反例樣本應(yīng)盡可能地涵蓋人臉識別中照片欺騙的各種方式在網(wǎng)絡(luò) 攝像頭前,照片保持正對、沿水平軸旋轉(zhuǎn)、沿垂直軸旋轉(zhuǎn)、上下方向的向內(nèi)向外彎曲、左右方 向的向內(nèi)向外彎曲等等,一些常見的情況如圖7所示。在每種情況下,照片還存在上下左右前后的空間位置移動。3)正、反例樣本可使用不同的網(wǎng)絡(luò)攝像頭在不同的地點和不同的時間段內(nèi)采集, 所處環(huán)境的光照條件可涵蓋不同的情況。正、反例樣本的圖片采集速度、采集規(guī)模以及圖像 的分辨率等參數(shù)可按實際情況設(shè)置。一種可行的參數(shù)設(shè)置如下正、反例樣本的圖片序列采 集速度為20fps,每組圖片采集500張。圖片的分辨率為640像素X480像素。在本發(fā)明的實施例中,依照上述要求收集了如下一組正、反例樣本正例樣本是 使用網(wǎng)絡(luò)攝像頭收集的9個真人人臉的圖像序列。反例樣本是用這9個人的照片采集得 到的圖像序列。采集反例樣本所使用的照片包括四寸照片(6. ScmX 10. 2cm)和五寸照片 (8. 9cmX 12. 7cm)兩種大小以及打印機打印和傳統(tǒng)沖洗兩種質(zhì)地的照片。經(jīng)過人臉檢測、眼 睛定位后,得到的正例樣本為9組真人人臉圖片序列,共計3548張真實人臉圖片,反例樣本 為45組照片人臉圖片序列,共計21910張照片人臉圖片。部分正、反例樣本示例如圖8所示。從9組真人圖片中隨機選取4組,共計1700張圖片作為正例訓(xùn)練樣本,從45組照 片人臉圖片中隨機選取15組照片人臉圖片,共計7243張圖片作為反例訓(xùn)練樣本。將剩余 的、未參加過訓(xùn)練的樣本全部作為測試集。進一步地,稀疏logistic回歸中的稀疏度,即不同I1范數(shù)正則化的球半徑 (radius of I1 ball)對于正反例樣本的檢測性能有很大的影響,應(yīng)用于人臉識別中的反 照片活體檢測的目的是希望在保證真實人臉的正確檢測率的前提下,盡可能的提高照片人 臉的正確檢測率;而在研究活體檢測問題中經(jīng)常會遇到訓(xùn)練集存在嚴(yán)重的類不平衡情況, 即往往反例樣本(照片人臉)的規(guī)模遠遠大于正例樣本(真實人臉)的規(guī)模,如此訓(xùn)練的 logistic回歸器將對反例有極大的偏置。為了解決這個問題,本發(fā)明的實施例中在訓(xùn)練時 采用了 “提前終止”的技術(shù),即在logistic回歸訓(xùn)練收斂之前結(jié)束訓(xùn)練。在本發(fā)明的實施例中,我們基于訓(xùn)練數(shù)據(jù)構(gòu)建了一個稀疏logistic模型,該模 型在傳統(tǒng)logistic回歸的似然函數(shù)函數(shù)上增加了一個基于I1范數(shù)的正則化項,以防止模 型陷入過擬合。在研究了稀疏logistic回歸中的稀疏度,即不同I1范數(shù)正則化的球半徑 (radius of I1 ball)對檢測性能的影響,實驗結(jié)果如圖9所示。從該圖可以看出,I1范數(shù)正則化強度對于正反例測試樣本的檢測性能的確有很大 的影響,考慮到應(yīng)用于人臉識別中的反照片活體檢測的目的是希望在保證真實人臉的正確 檢測率的前提下,盡可能的提高照片人臉的正確檢測率,在本發(fā)明實施例的后續(xù)實驗中選 擇I1范數(shù)正則化強度4000,此時照片人臉圖片的拒絕率提高到足夠的高,接近100% (誤 接受率低于干分之一),而真實人臉圖片的通過率穩(wěn)定在> 98 %。由于訓(xùn)練集存在嚴(yán)重的類不平衡問題(正例樣本1700,反例樣本7243),如此訓(xùn)練 的logistic回歸器將對反例有極大的偏置。為了解決這個問題,在本發(fā)明的實施例中在訓(xùn) 練時采用了“提前終止”技術(shù),即在logistic回歸訓(xùn)練收斂之前結(jié)束訓(xùn)練。圖10中給出了 不同的最大迭代次數(shù)對分類器性能的影響。從該圖可以看出,當(dāng)?shù)?0次時結(jié)束訓(xùn)練可以得到較好的泛化能力。而繼續(xù)訓(xùn)練 則將導(dǎo)致true positiverate (即輸入真人圖片且判斷是真人圖片的概率)的下降,表明發(fā) 生了對照片圖像的偏置。為了檢驗所述方法的效果,本發(fā)明的實施例在訓(xùn)練集上訓(xùn)練了 logistic模型,然后用1848張真實人臉圖片和14667張照片人臉圖片進行測試。實驗結(jié)果如表1所示。表1活體檢測實驗結(jié)果
權(quán)利要求
1.一種應(yīng)用于人臉識別領(lǐng)域的反照片欺騙方法,其特征在于該方法通過對受檢圖像進行濾波處理獲取其中的中頻帶信息,并進行頻域變換抽取其 中的特征信息,之后通過分類模型辨析受檢圖像為真實人臉還是照片人臉。進一步地,該方法可采用基于DoG濾波、二維離散傅立葉分析和稀疏logistic回歸分 類的算法進行反照片欺騙處理。具體地,該方法可首先通過對圖像進行DoG(difference of Gaussian)濾波的預(yù)處理, 留下具有更大的區(qū)分能力的中頻帶信息;然后,可采用離散傅立葉變換提取特征,最后可使 用稀疏logistic回歸模型快速、有效地來判斷人臉識別系統(tǒng)中采集到的圖像是真實人臉 還是照片人臉。
2.根據(jù)權(quán)利要求1所述方法的一種活體檢測系統(tǒng),其特征在于該活體檢測系統(tǒng)由中頻濾波器、頻域變換器及分類器三個主要模塊構(gòu)成。 具體地,該活體檢測系統(tǒng)可用DoG濾波器作為中頻濾波器、傅立葉變換器作為頻域變 換器以及用logistic回歸分類器作為分類器。該活體檢測系統(tǒng)可以作為一個獨立的系統(tǒng)使用,也可以作為一個模塊嵌入到具體的人 臉識別應(yīng)用中去。進一步地,該系統(tǒng)可通過DoG濾波器獲取圖像信息中的中頻帶信息,之后通過傅立葉 變換器提取關(guān)鍵特征,最后通過logistic回歸分類器對提取和處理后的特征信息辨析和 分類,以達到有效判別所識別的圖像為真實人臉還是照片人臉的目的。
全文摘要
本發(fā)明涉及一種可用于基于人臉識別的身份認(rèn)證應(yīng)用的反照片欺騙活體檢測方法和系統(tǒng)。所述系統(tǒng)包含中頻濾波器、頻域變換器和分類器三個部分;其中中頻濾波器可采用DoG(difference of Gaussian)濾波器,用于對圖像進行濾波預(yù)處理獲取其中的中頻帶信息;頻域變換器可采用傅立葉變換器,用于從預(yù)處理過的二維圖像中提取出傅立葉變換特征;分類器可采用logistic回歸分類器,用于判斷身份認(rèn)證中采集到的圖像是真實人臉還是照片人臉。實驗結(jié)果表明,所述方法及系統(tǒng)在不添加額外的輔助設(shè)備、不需要用戶的主動配合、實現(xiàn)簡單、計算量小且功能獨立的情況下,能夠很好的解決基于人臉識別的身份認(rèn)證中照片欺騙的問題。
文檔編號A61B5/117GK101999900SQ20091018454
公開日2011年4月6日 申請日期2009年8月28日 優(yōu)先權(quán)日2009年8月28日
發(fā)明者李翼, 石燕, 譚曉陽 申請人:南京壹進制信息技術(shù)有限公司