專利名稱::一種基于最大穩定極值區域的人臉識別方法
技術領域:
:本發明涉及模式識別與圖像處理
技術領域:
,尤其涉及一種基于最大穩定極值區域的人臉識別方法。
背景技術:
:當前的生物特征識別技術主要包括有指紋識別、視網膜識別、虹膜識別、手形識另O、掌紋識別、人臉識別等。與其他識別方法相比,人臉識別具有自然,直觀,成本較低等特點,使用簡單,易于操作,穩定性高,從而獲得了廣泛的研究與應用。從古到今,人類在確認一個人的身份時,一般都是通過人臉來判斷,這一事實為人臉識別概念的出現提供了理論基礎和實踐依據。自2001年美國“9.11”恐怖襲擊事件發生以來,世界各國普遍就打擊恐怖主義,防范恐怖襲擊,保護公眾安全等問題展開研究與措施。其中,利用高科技技術對機場、碼頭、地鐵車站等易受恐怖襲擊的公共場所進行安全防范,并及時、迅速而準確地發現并確認可疑分子是目前各國高度關注的熱點問題。而基于視頻的人臉識別技術則是目前一種可行的方案。運用自動人臉識別技術,可將安檢時所獲取的人臉圖片與恐怖份子照片數據庫進行對比搜索,確定面部特征相似的嫌疑犯以供警務人員調查。在某些特定場合,如海關、出入境、公司部門、考試場等,可通過自動人臉識別技術驗證被測人的相關證件,如身份證、護照、駕駛證、職員證、準考證等均附有個人照片的證件,來快速地完成驗證識別工作,從而實現這些繁瑣事務的自動化智能管理。在各行業重點部門或重要場所,如自動柜員機、銀行柜臺、金器銀器店、公共場所等處都設有二十四小時的視頻監控。當出現突發性異常事件或暴力入侵時,可通過實時監控、跟蹤獲得有效數據、圖像或聲音信息,對事件過程進行及時監控和記錄,對采集到的圖像進行具體分析,進行人臉的檢測、跟蹤和識別,用以提供高效、及時地指揮和調度、布置警力、處理案件等。大型體育賽事、通商口岸、旅游景區、大型會議出入、樓宇住宅、教育考試、政府機構和企業的出入口控制等以及智能型住宅、智能車庫等,都可以嘗試應用人臉識別來為用戶提供安全、便利。人臉識別應其所特有的技術優勢和其較多的應用環境,獲得了人們的廣泛接受,在取得了很大成果的同時,人們也對這項技術提出了更高的要求。人們希望計算機能夠像人一樣區分和識別人臉,然而由于所有的人臉看上去結構相同、紋理相近、局部器官之間亦十分相似,要判斷和區分人臉,需要對人臉之間的細微差別進行精確的識別。并且由于人臉的彈性特點使其具有一個不穩定外形,與剛體物體相比,人臉是彈性形變的。人臉是有表情的,人的喜怒哀樂都伴隨著表情的變化從而引起人臉的形狀變化和特征變化,從不同的角度、不同姿勢所觀測到的人臉圖像差異也很大。另外,在實際生活中,人臉常常佩戴各種裝飾物,如眼鏡、口罩、圍巾、帽子;或者改變發型、蓄留胡須、化妝打扮;或是隨著年齡的增長,頭發花白、皮膚松弛、眉眼深陷等;這些隨機的、彈性的人臉變化勢必會給人臉識別的準確性帶來很大的干擾。人們希望計算機也能和人眼一樣,區分出這些表情并將同一個體在不同表情下的人臉關聯和識別出來,這就需要魯棒性更強的人臉識別算法來完成更高級的識別任務。隨著人臉識別越來越高的實際需求,基于計算機系統的全自動人臉識別依然面臨著許多困難,多姿態、跨年齡、抗遮擋的人臉識別技術,在不同光照、復雜背景條件下的精確的人臉識別,實時便捷地使用要求等,這都是人臉識別算法需要解決的核心問題。
發明內容本發明針對現有技術的不足,提出了一種簡單而行之有效的基于最大穩定極值區域的人臉識別方法。為了達到上述目的,本發明采用下述技術方案。一種基于最大穩定極值區域的人臉識別方法,包括以下步驟步驟101、基于MSER原理對人臉圖像進行特征區域檢測;步驟102、采用GLOH特征描述算子對檢測到人臉特征區域進行描述,生成描述特征區域的特征向量;步驟103、采用PCA算法對得到的特征向量進行降維,生成維數更低的描述特征區域的特征向量;步驟104、依據特征區域的位置和特征向量對特征區域進行分類;步驟105、針對待比對的兩幅人臉圖像,依據各自特征區域所屬的類別和其相應的特征向量對特征區域進行相似性判定,得到各特征區域的相似度;步驟106、依據特征區域的相似性判定結果得到人臉圖像的總的相似度,根據總的相似度判定對待比對的兩幅人臉圖像是否匹配,進而達到人臉識別的目的。所述的步驟101中,在人臉圖像的不同轉換空間進行,所述的不同轉換空間是指圖像的多種表達方式,圖像彩色空間可以用RGB,HIS等顏色空間表示,這里的不同轉換空間也包括圖像的灰度空間。所述的步驟104中,特征區域的分類是依據特征區域所在位置和其自身的特征向量進行劃分的,劃分的方法可以有多種選擇,如可采用神經網絡聚類算法或SVM聚類算法坐寸ο通過步驟101步驟104完成對待比對的兩幅人臉圖像的處理,而后對兩幅人臉的識別與配準問題則轉變為對相應的特征向量間的相似度匹配問題,所述的步驟105中,各特征區域的相似度判定方法是依據特征區域所屬的類別和其自身的特征向量與同類別的特征區域進行特征向量間的匹配,根據匹配結果判定其相似度。所述的步驟105中,特征區域的特征向量的匹配可采用計算向量間的歐式距離或者工程數學領域中度量向量相似性的余弦計算方法。所述的步驟106中,是依據人臉圖像間的各特征區域的相似度來判定兩幅人臉圖像的總的相似度,總的相似度達到一定程度的兩幅人臉圖像才被認為是匹配的,從而達到人臉識別的目的。所述的步驟106中,兩幅人臉圖像的總的相似度是由各特征區域的相似度加權得到的,各特征區域的權重系數由特征區域匹配的準確性決定。所述的步驟106中,各特征區域的匹配的準確性可通過多次實驗驗證得到,通過正確匹配的次數和總的實驗次數的比值確定各特征區域的匹配的準確性,并對準確性低于一定閾值的特征區域的權重賦零。本發明的有益效果在于1、基于MSER原理進行的特征區域的人臉識別不但具有良好的仿射不變性,而且在畫面選擇、尺度縮放、視角變動、光照差異、遮擋、噪聲方面都具有良好的適應能力。2、本發明中,基于特征的人臉識別方法,實現簡單、運行快速,功能實用。圖1是本發明一種基于最大穩定極值區域的人臉識別方法的流程圖;圖2是GLOH算子極坐標空間的示意圖;圖3是GLOH算子興趣區域劃分方式示意圖。具體實施例方式下面結合附圖對本發明進行詳細描述。近年來,計算機視覺領域在圖像局部不變特征的研究方面取得了顯著的進展,其成果極大地推動了圖像配準相關技術的發展。2002年Matas等人提出了一種利用類似分水嶺算法的分割算法來提取圖像中有良好仿射不變性的最大穩定極值區域MSER(MaximallyStableExtremalregions)。MSER特征區域具有良好的仿射不變性,其穩定性好、重現性高,對光照、視角和局部遮擋等情況也具有良好的魯棒性,由于其特殊的提取過程,MSER對尺度變化也具有一定的適應性。為了實現特征的匹配,需要對檢測到的特征進行描述。在2005年,KrystianMikolajczyk提出了一種尺度和仿射不變量的興趣點檢測算法-GLOH(GradientLocationandOrientationHistogram),即“梯度定位方向直方圖”。此描述子具有較好的分辨能力且其性能不依賴于具體的特征檢測算法,采用GLOH特征描述法在此基礎上更增強其魯棒性和獨特性,因而我們采用此方法進行特征描述。本實施例采用如下技術方案。如圖1所示,一種基于最大穩定極值區域的人臉識別方法,包括步驟101,基于MSER原理對人臉圖像進行特征區域檢測;步驟102、采用GLOH特征描述算子對檢測到人臉特征區域進行描述,生成描述特征區域的特征向量;步驟103、采用PCA算法對得到的特征向量進行降維,生成維數更低的描述特征區域的特征向量;步驟104、依據特征區域的位置和特征向量對特征區域進行分類;步驟105、依據特征區域所屬的類別和其相應的特征向量對分類區域進行相似性判定,得到各分類區域的相似度;步驟106、依據特征區域的相似性判定結果得到人臉圖像的總的相似度,根據總的相似度判定人臉圖像是否匹配,進而達到人臉識別的目的。步驟101,基于MSER原理對人臉圖像進行特征區域檢測。MSER檢測子的基本原理是對一幅灰度圖像,從O255分別取閾值,將大于閾值的點設為1,小于閾值的點設為0,從而得到256幅閾值分割的二值圖像,通過前后相鄰閾值圖像間區域比較,得出區域面積關于閾值變化的關系。最后選取當區域面積的變化相對于閾值的變化小于某個值時所檢測出的區域即為最大穩定極值區域。由于閾值可以向兩個相反的方向變化,所以會產生兩種不同的極值區域,因此,最大穩定極值區域包括最大穩定極大值區域(較亮的極值區域)與最大穩定極小值區域(較暗的極值區域)兩種。步驟102,采用GLOH特征描述算子對檢測到人臉特征區域進行描述,生成描述特征區域的特征向量。GLOH算子的具體構造如下在對數極坐標中半徑方向建立三個半徑從小到大的位置帶(r=6,r=11,r=15)和8個角度方向,如圖2所示。其中,極坐標的空間可定義為(Γ,θ,φ),分別代表極坐標的半徑、方向和像素梯度方向。采用仿射狀的同心圓的17個方向柱劃分特征區域,并計算其中的梯度方向直方圖,梯度方向分為16種,因此共16X17=272維。步驟103,采用PCA算法對得到的特征向量進行降維,生成維數更低的描述特征區域的特征向量。在具有272維的GLOH算子空間中,為了優化維度而進行降維時,需要舍棄一些信息,即舍棄一些我們認為是“最不好”的信息。在這里我們使用的是PCA(PrincipalComponentAnalysis)方法,即主成分分析法。主成分分析是一種掌握事物主要矛盾的統計分析方法,它可以從多元事物中解析出主要影響因素,揭示事物的本質,簡化復雜的問題。計算主成分的目的是將高維數據投影到較低維空間,達到數據降維的目的。使用PCA將其降為128維,并進行歸一化。GLOH特征描述子相比于典型的SIFT描述子具有更好的特征描述能力,SIFT特征描述子的特征向量是128維,特征向量的維數直接影響了后面計算特征匹配的時間,將272維的GLOH特征向量選擇降為128維是為了在后面計算特征匹配時間相等的情況比較GLOH特征描述子和SIFT特征描述子的特征描述能力,以表現GLOH更好的效果。步驟104,依據特征區域的位置和特征向量對特征區域進行分類。聚類算法就是一個將數據集劃分為若干組或類的過程,通過聚類使得同一組內的數據對象具有較高的相似度,而不同組中的數據對象則是不相似的。聚類的方法有很多,在本實施例中采用支持向量機SVM(SupportVectorMachine)來實現人臉特征的分類。由于SVM在訓練樣本較少的情況下就可獲得較高識別率,因此被公認為最成熟、應用最廣的機器學習方法之一。我們將各個特征區域與整個人臉圖像中心的距離做為SVM分類器方法的輸入,以各特征區域所在位置如額頭區域、眼部區域、鼻子區域,臉部區域,嘴部區域作為輸出,對分類器進行訓練,得到訓練器之后可以實現對待識別的人臉圖像的MSER區域的分類。在經過了分類處理后的人臉圖像中,其特征向量已被“歸類”為5個不同的集合之中。步驟105,依據特征區域所屬的類別和其相應的特征向量對分類區域進行相似性判定,得到各分類區域的相似度;經過MSER特征提取及分類,對兩幅人臉的識別與配準問題則轉變為對相應的特征向量間的相似度匹配問題,可通過計算向量之間的相似性來度量人臉圖像間的相似性。在得到描述特征區域的特征向量后可采用128維的特征向量的歐氏距離作為兩幅圖像特征區域的相似性度量。基于歐氏空間距離的測度,設X,Y分別是兩個128維特征矢量,代表進行匹配的兩個特征區域,則權利要求1.一種基于最大穩定極值區域的人臉識別方法,其特征在于,包括以下步驟步驟101、基于MSER原理對人臉圖像進行特征區域檢測;步驟102、采用GLOH特征描述算子對檢測到人臉特征區域進行描述,生成描述特征區域的特征向量;步驟103、采用PCA算法對得到的特征向量進行降維,生成維數更低的描述特征區域的特征向量;步驟104、依據特征區域的位置和特征向量對特征區域進行分類;步驟105、針對待比對的兩幅人臉圖像,依據各自特征區域所屬的類別和其相應的特征向量對特征區域進行相似性判定,得到各特征區域的相似度;步驟106、依據特征區域的相似性判定結果得到人臉圖像的總的相似度,根據總的相似度判定對待比對的兩幅人臉圖像是否匹配。2.如權利要求1所述的基于最大穩定極值區域的人臉識別方法,其特征在于,步驟104中,對特征區域進行分類時,采用神經網絡聚類算法或SVM聚類算法。3.如權利要求2所述的基于最大穩定極值區域的人臉識別方法,其特征在于,步驟105中,對特征區域進行相似性判定時,依據特征區域所屬的類別和其自身的特征向量與同類別的特征區域進行特征向量間的匹配,根據匹配結果判定其相似度。4.如權利要求3所述的基于最大穩定極值區域的人臉識別方法,其特征在于,步驟105中,特征區域的特征向量的匹配可采用計算向量間的歐式距離或者度量向量相似性的余弦計算方法。5.如權利要求4所述的基于最大穩定極值區域的人臉識別方法,其特征在于,步驟106中,總的相似度達到一定程度的兩幅人臉圖像才被認為是匹配的。6.如權利要求5所述的基于最大穩定極值區域的人臉識別方法,其特征在于,步驟106中,兩幅人臉圖像的總的相似度是由各特征區域的相似度加權得到的,各特征區域的權重系數由特征區域匹配的準確性決定。7.如權利要求6所述的基于最大穩定極值區域的人臉識別方法,其特征在于,步驟106中,通過正確匹配的次數和總的實驗次數的比值確定各特征區域的匹配的準確性,并對準確性低于一定閾值的特征區域的權重賦零。全文摘要本發明公開了一種基于最大穩定極值區域的人臉識別方法。本發明提供了一種基于最大穩定極值區域的人臉識別方法,該方法通過獲取人臉的最大穩定極值區域作為人臉識別的關鍵特征,提取表征關鍵特征的屬性,并對關鍵特征進行分類,依據人臉圖像的關鍵特征的屬性及其類型對人臉圖像的相似性進行判斷,從而達到人臉識別的目的。本發明的人臉識別方法對尺度、仿射變化、光照變化、旋轉、人臉表情變化、噪聲等因素具有很好的魯棒性,并對復雜背景下的人臉和遮擋的人臉具有一定的識別能力。文檔編號G06K9/62GK103049736SQ20111031507公開日2013年4月17日申請日期2011年10月17日優先權日2011年10月17日發明者張藻,張羽申請人:天津市亞安科技股份有限公司