專利名稱:基于多類別的人臉分類識別方法
技術領域:
本發明屬于圖像處理、計算機視覺、模式識別技術領域,特別涉及一種人臉識別方法。
背景技術:
隨著各種信息技術的發展,如何有效地利用電子、信息處理、計算機、網絡通訊、人工智能等技術,便捷、準確、可靠地識別人員身份,保障社會成員的合法權益和社會公共安全,維護世界和平,已成為世界各國政府、企業界、國家及國際社會共同需要解決的重要的課題。
借助于計算機技術的人體生物特征識別技術(Biometrics)是基于人體自身具有的可區別于其他任何人的特征來進行身份識別的,因此完全不同于依靠證件、密碼、磁卡、IC卡、照片、鑰匙等本質上仍是“認物不認人”的身份驗證識別技術。該技術的核心在于如何有效地獲取人體生物特征并將其轉換為數字信息存儲于計算機中,再利用相應的可靠算法來完成驗證與識別個人身份以達到身份驗證和安全檢查的目的。
與其它生物識別技術相比,人臉識別具有兩點獨一無二的特性適合要求隱蔽實行的場合。其它生物識別方法一般需要人的某些自愿動作,如按指紋、簽字等,而人臉識別對此要求較低,使它更易于使用,特別適合要求隱蔽實行的場合。當要通過生物記錄來核查一個人的身份時,只有人臉最直觀、最方便。管理員僅憑雙眼無法判斷一個人的指紋是否與相同ID號用戶所登記的指紋一致,但卻可以通過比較面像來判斷。
目前面部識別技術最大的問題是很容易受到整容、化妝等因素的影響,不同年齡段也在一定的程度上會發生面部的特征變化。諸多的因素使得人臉識別成為一項棘手而富挑戰性的課題,也因此在近年成為生物特征研究的熱點。
發明內容
本發明的目的是為了克服一些已有技術的不足目前有不少人臉識別方法之所以不能達到很高的效率,是因為用于識別的人臉圖像庫太大,使得在進行人臉識別時,需要大量的時間來進行搜索匹配,從而使得整體的識別時間過長,不能滿足識別的實用性要求。試圖從一個嶄新的視角出發,提出的一種基于多類別的人臉識別分析方法,該方法集中針對大容量的人臉圖像數據庫,將其按某一標準進行分類,目的是減少各類的人臉圖像數目。這樣,在進行人臉的識別分析時,首先使用本發明所提供的方法進行分類識別,當判定了該人臉所屬類別時,再在該類人臉圖像庫中進行識別分析,從而提高人臉的識別效率。
本發明提出的一種基于多類別的人臉分類識別方法,包括以下步驟1)利用三維攝像系統攝取各區人臉圖像,用于建立人臉圖像數據庫;2)根據一定的分類準則,將人臉按特征分為多個類別,對于已建立的大容量的人臉圖像數據庫,應按特征分解成多個較小容量的數據庫;3)根據各類別人臉幾何和結構的自然特征,定義人臉的23個幾何特征點和16個特征向量;4)利用分類器對人臉幾何特征進行分類識別;5)結合常規的基于代數特征的方法完成人臉的最終識別。
本發明的特點及效果通過對大容量人臉圖像數據庫,首先應用本發明所提供的方法完成人臉識別的初分類,然后再進行人臉的識別分析。實驗證明,該方法的分類結果非常可靠,其平均分類識別率達到90%以上,而且能大幅度提高大容量人臉圖像數據庫的人臉識別效率,對越大的人臉圖像數據庫,效果越明顯。
圖1本發明方法的步驟框圖。
圖2本發明的三維攝像系統示意圖。
圖3本發明方法人臉的特征點選取示意圖。
圖4本發明方法以中國人為例的中國行政區劃示意圖。
圖5本發明方法以中國人為例所選取的不同區域的典型人臉。
具體實施例方式
本發明提出一種基于多類別的人臉分類識別方法,現結合各附圖,以中國的行政區劃分為例,詳細說明其實施方式本方法的總體步驟如圖1所示,首先對各類別的人臉樣本進行幾何特征提取,形成人臉幾何特征庫,利用待識別的人臉特征向量與各類別人臉特征矩陣計算馬氏距離,通過比較,即可完成人臉的分類識別過程。具體實施如下1.建立三維攝像系統,用于攝取人臉圖像。
如圖2所示,用于正面Z方向的面部攝像頭,采用高于40萬像素的彩色CCD數字圖像傳感件,用于側面X方向和頂部Y方向的攝像頭采用不低于30萬像素的CCD數字黑白圖像傳感件。主要采用市場上的CCD數字圖像傳感件單元產品來研制和集成用于人體攝像的三維CCD數字攝像系統。通過圖2所示的三維CCD數字攝像系統對人臉進行攝像(其中Z方向的CCD數字攝像機拍下對象人體的面部圖像和前部輪廓,X和Y方向的CCD數字攝像系統分別拍下動態側面輪廓和頂部輪廓),同時計算機將采樣得到的三面輪廓圖像實時組合起來形成數值圖像存入中國人臉圖像數據庫。
2.根據分類準則,將中國人人臉按特征分為多個類別,對于已建立的大容量的人臉數據庫,將其按類別分解成多個較小容量的數據庫。
如圖4所示,中國從行政區的劃分來看,分為華北區、東北區、西南區、華東區、華中區、華南區和西北區共七大區域。考慮到對于同一個行政區而言,人們的飲食、生活習慣及周圍環境的氣候都比較相近,從某種程度上來說對人的成長應該具有一定的影響作用。如果能從某種角度提取出每個區的人臉特征,對于進一步的中國人臉識別將起到舉足輕重的作用,因此我們在采集人臉圖像數據時,就有意識地按區域進行劃分,建立了基于中國行政區劃的人臉圖像數據庫。
通過前面的分析,經過前后5次拍攝,我們已建立了一個典型的區域性人臉圖像數據庫。該數據庫總共選用186張圖片,其中西南區42張,西北區20張,華北區30張,華東區19張,華中區30張,東北區29張,華南區16張。
3.定義人臉的23個幾何特征點和16個特征向量(如圖3所示)。
23個幾何特征點主要集中在眉毛、眼睛、鼻子和嘴巴,具體描述如下●B1、B2、B3、B4分別為兩條眉毛的端點,B為B2和B3的中點;●E1、E2、E3、E4分別為兩只眼睛的內外眼角,E為E2和E3的中點;●N2、N3分別是兩個鼻孔的底部內邊緣點,N為N2和N3的中點,N1N4是N2N3延長線與臉頰輪廓線的交點;●M2、M3分別是兩個鼻孔的底部內邊緣點,M為EN和M2M3的連線交點,M1M4是M2M3延長線與臉頰輪廓線的交點;●W1W2是EN連線的中點與臉頰輪廓線的交點;●C是EN連線與下巴的交點。
對應的16個特征向量主要包括高度方向、寬度方向、角度以及長寬比,具體描述如下●高度EB/EN;EM/EN;EC/EN●寬度B1B2或B3B4/E2E3;B2B3/E2E3;E1E2或E3E4/E2E3;W1W2/E2E3;N2N3/E2E3;M2M3/E2E3;N1N4/E2E3;M1M4/E2E3●長寬比E2E3/EN●角度∠B2NB3;∠E1NE4;∠E2NE3;∠M2NM34.進行人臉的分類識別。
為了完成七大行政區之間的人臉幾何特征分類識別,就有必要在這些區的樣本數據之間建立特定的判決函數,當特征的類型超過兩個時,也把該判決函數稱為多類分類器。建立多類分類器時常常遵循“物以類聚,人以群分”的原則,要盡可能地體現每個類型樣本的相似性。對于一個樣本而言,在它的特征空間就是一個點。如果分類器選擇適當,那么同一類的樣本就密集地分布在一個區域里,不同類的樣本就會遠離。因此,點間距離遠近反映了相應樣本所屬類型有無差異,可以作為樣本相似性度量。
對于許多實際的數據集,正態分布通常是合理的近似。如果在特征空間中的某一樣本,較多地分布在這一類均值附近,遠離均值點的樣本比較少,一般來說,用正態分布作為這一類的概率模型是合理的。由于馬氏距離遵循正態分布的性質,這里我們采用了馬氏距離作為分類器,具有計算簡單,容易實現的特點,能夠取得較好的識別率。
對每張人臉圖像,首先通過自動識別方法獲得16個特征,形成一個特征向量Xi,假設某區有n張人臉,那么X=(x1,x2,…,xn)T就是該區人臉的特征矩陣,計算該矩陣的均值向量μ和協方差矩陣∑,然后對每張待識別人臉特征向量x,并計算它與每個區特征矩陣之間的馬氏距離γ=(x-μ)TΣ-1(x-μ)]]>選擇這些距離的最小值,即可判斷該人臉所屬區域。
由以上方法組成的人臉識別系統通過實際運行的測試,效果非常明顯,舉例說明如下實際運行中,分別在東北區取29個樣本、華南區取16個樣本、華北區取30個樣本、華東區取19個樣本、華中區取30個樣本、西北區取20個樣本、西南區取42個樣本,能夠正確識別的樣本數為東北區27個、華南區15個、華北區29個、華東區17個、華中區27個、西北區19個、西南區36個,因此各區的識別率分別為東北區93.1%、華南區93.75%、華北區96.67%、華東區89.47%、華中區90%、西北區95%、西南區85.71%。
5.結合常規的基于代數特征的方法完成人臉的最終識別。
這里,我們選擇基于奇異值分解的方法來進行人臉的最終識別。奇異值分解的基本原理是將每一張人臉圖像看成一個數字矩陣,然后把該矩陣分解成一個對角矩陣和兩個酉矩陣,并利用每張人臉在這兩個矩陣上的差異進行人臉的識別。
本發明為了驗證在人臉識別過程中加入了分類識別這一步后是否有效,我們采取了如下兩個方案一、從186張人臉中任意抽出一張人臉作為待識別人臉,直接用基于奇異值分解的方法來進行識別,識別時間大約要2秒鐘。二、首先應用基于馬氏距離的多類分類器方法進行分類,需要花費約0.7秒;接著再應用基于奇異值分解的方法來進行識別,費時0.3秒左右。也就是說,針對我們所建立的擁有186張人臉的數據庫,利用方案二來進行識別,基本上能節約一半的時間。而且在實驗的過程中,我們還發現,對于特別大的人臉數據庫,可能進行多次分類,而且能夠取得更高的效率。
綜上所述,采用本發明所提供的基于多類別的人臉分類識別方法,可以極大地提高中國人人臉識別效率,從而推進人臉識別系統的實用化。
權利要求
1.一種基于多類別的人臉分類識別方法,其特征在于包括以下步驟(1)建立一個三維攝像系統,用于攝取人臉圖像;(2)根據一定的劃分標準建立分類準則,將人臉按特征分為多個類別;(3)根據人臉幾何和結構的自然特征,在每張人臉圖像上提取23個幾何特征點并得到16個特征向量①每張人臉圖像上提取的23個幾何特征點包括●B1、B2、B3、B4分別為兩條眉毛的端點,B為B2和B3的中點;●E1、E2、E3、E4分別為兩只眼睛的內外眼角,E為E2和E3的中點;●N2、N3分別是兩個鼻孔的底部內邊緣點,N為N2和N3的中點,N1N4是N2N3延長線與臉頰輪廓線的交點;●M2、M3分別是兩個鼻孔的底部內邊緣點,M為EN和M2M3的連線交點,M1M4是M2M3延長線與臉頰輪廓線的交點;●W1W2是EN連線的中點與臉頰輪廓線的交點;●C是EN連線與下巴的交點;②16個特征向量包括高度方向、寬度方向、角度以及長寬比●高度EB/EN;EM/EN;EC/EN●寬度B1B2或B3B4/E2E3;B2B3/E2E3;E1E2或E3E4/E2E3;W1W2/E2E3;N2N3/E2E3;M2M3/E2E3;N1N4/E2E3;M1M4/E2E3●長寬比E2E3/EN●角度∠B2NB3;∠E1NE4;∠E2NE3;∠M2NM3(4)對每類人臉的16個幾何特征向量所構成的特征矩陣,計算其均值向量μ和協方差矩陣∑,假定其特征向量為x,并對每張待識別人臉,計算它與各類特征矩陣之間的馬氏距離γ=(x-μ)TΣ-1(x-μ),]]>選擇這些距離中的最小值,即可判斷該人臉所屬類別;(5)結合常規的代數特征識別方法完成人臉的最終識別。
2.根據權利要求1所述的基于多類別的人臉分類識別方法,其特征在于用三維攝像系統攝取人臉圖像是對人臉進行多角度的攝像,其中Z方向的攝像機拍下對象人體的面部圖像和前部輪廓,X和Y方向的攝像系統分別拍下動態側面輪廓和頂部輪廓。
3.根據權利要求1所述的基于多類別的人臉分類識別方法,其特征在于在對人臉進行分類時的分類準則分類時要盡可能使每個類別中的所有人臉樣本具有最大的相似性;而類別之間則應具有最大的差異性;人臉樣本之間的差異主要從幾何特征上來分析。
全文摘要
本發明是一種基于多類別的人臉分類識別方法,包括以下步驟利用三維攝像系統攝取各區人臉圖像,建立人臉圖像數據庫;根據一定的分類準則,將人臉按特征分為多個類別;根據各類別人臉幾何和結構的自然特征,定義人臉的23個幾何特征點和16個特征向量;利用分類器對人臉幾何特征進行分類識別;最后結合常規的基于代數特征的方法完成人臉的最終識別。本發明在進行人臉的識別分析時,首先使用本發明所提供的方法進行分類識別,當判定了該人臉所屬類別時,再在該類人臉圖像庫中進行識別分析,從而提高人臉的識別效率,減少各類的人臉圖像數目,能大幅度提高大容量人臉圖像數據庫的人臉識別效率,對越大的人臉圖像數據庫,效果越明顯。
文檔編號G06T15/00GK1529278SQ200310110720
公開日2004年9月15日 申請日期2003年10月9日 優先權日2003年10月9日
發明者龔衛國, 劉嘉敏, 李偉紅, 張紅梅, 粱毅雄 申請人:重慶大學