專利名稱::基于hmm-svm混合模型的人臉識(shí)別方法
技術(shù)領(lǐng)域:
:本發(fā)明屬于模式識(shí)別領(lǐng)域,具體涉及一種人臉識(shí)別方法,是生物特征識(shí)別領(lǐng)域關(guān)于人臉特征提取與識(shí)別的一種方法。
背景技術(shù):
:入臉在人們的交流中有著重要的作用和意義,在日常生活中,人們識(shí)別周圍的人用的最多的也是人臉。由于人臉識(shí)別的非侵犯性,具有直接、友好、方便的特點(diǎn),是人們最容易接受的身份鑒別方式。而隨著網(wǎng)絡(luò)技術(shù)和桌上視頻的廣泛采用,圖像捕捉設(shè)備正在成為個(gè)人計(jì)算機(jī)的標(biāo)準(zhǔn)外設(shè),同時(shí)電子商務(wù)等網(wǎng)絡(luò)資源的利用對(duì)身份驗(yàn)證提出了新的要求,人臉識(shí)^j已經(jīng)成為最有潛力的生物身份驗(yàn)證手段之一。在人體的各種生物特征中,人臉的獲取具有直接、方便、主動(dòng)等特點(diǎn)。它無須特殊的采集設(shè)備,系統(tǒng)的成本低,而且自動(dòng)人臉識(shí)別的使用非常自然,可以在被識(shí)別對(duì)象毫無察覺的情況下進(jìn)行,是一種非常受使用者歡迎的方式。與其他生物識(shí)別技術(shù),諸如指紋識(shí)別,拿形識(shí)別,眼虹膜識(shí)別和聲音識(shí)別相比較,人臉識(shí)別具有以下兩點(diǎn)獨(dú)一無一的特性,1)人臉識(shí)別不需要人的配合動(dòng)作,使它更易于使用,特別適合要求隱蔽實(shí)行的場合'2)人臉作為一種高普遍性、可以非接觸式采集的重要生物特征,能更直觀,更方便的核査一個(gè)人的身份。計(jì)算機(jī)人臉識(shí)別技術(shù)就是利用計(jì)算機(jī)分析人臉圖像,從中提取有效的識(shí)別信息,用來辨認(rèn)身份的一門技術(shù),由于其廣泛的應(yīng)用領(lǐng)域,在近三十年里得到了廣泛的關(guān)注和研究。依托于圖像理解、模式識(shí)別、計(jì)算機(jī)視覺和神經(jīng)網(wǎng)絡(luò)等技術(shù),人臉識(shí)別技術(shù)在一定應(yīng)用范圍內(nèi)獲得了成功,并且正在被推向應(yīng)用領(lǐng)域。比如證件(如駕駛執(zhí)照、護(hù)照)中的身份認(rèn)證;樓宇進(jìn)出的安全控制;重要場所中的安全檢測(cè)和監(jiān)控;智能卡中的身份認(rèn)證等。而隨著網(wǎng)絡(luò)技術(shù)日益走進(jìn)人們的日常生活,網(wǎng)絡(luò)的安全控制成為一個(gè)日益迫切的重要問題。利用人臉識(shí)別技術(shù),可以進(jìn)行計(jì)算機(jī)的登錄控制,可以進(jìn)行應(yīng)用程序安全使用、數(shù)據(jù)庫安全訪問和文件加密,可以實(shí)現(xiàn)局域網(wǎng)和廣域網(wǎng)的安全控制,可以保護(hù)電子商務(wù)的安全性。另外,人臉識(shí)別技術(shù)還被用在圖像庫檢索技術(shù),在大型人臉庫中檢索出與索引人臉相同或相近的臉像。然而,雖然人類可以毫不困難地由人臉辨別一個(gè)人,但利用計(jì)算機(jī)進(jìn)行完全自動(dòng)的人臉識(shí)別還存在著許多困難。主要表現(xiàn)在人臉是非剛體,存在表情變化;人臉隨年齡增長發(fā)生變化;發(fā)型、眼鏡等裝飾對(duì)人臉造成遮擋;人臉圖像受光照、成像角度、成像距離等的影響,所以很難從有限張人臉圖像中提取出反映人臉內(nèi)在的、本質(zhì)的特征。此外人臉識(shí)別技術(shù)研究還涉及到模式識(shí)別、圖像處理、計(jì)算機(jī)視覺、生理學(xué)、心理學(xué)及認(rèn)知學(xué)等學(xué)科的發(fā)展,這諸多因素使得人臉識(shí)別研究成為一項(xiàng)極富挑戰(zhàn)性的課題,同時(shí)一個(gè)成功的、具有商用價(jià)值的快速的人臉識(shí)別系統(tǒng)將會(huì)給社會(huì)帶來極大的影響。
發(fā)明內(nèi)容本發(fā)明的目的在于有效的融合了HMM模型良好的時(shí)間序列建模能力和支持向量機(jī)對(duì)于有限樣本分類的優(yōu)良性能,以DCT和SVD融合特征為觀察向量,提出了一種基于HMM-SVM混合模型的人臉識(shí)別方法。本發(fā)明的技術(shù)方案是提出了一種基于H羅-SVM混合模型的人臉識(shí)別方法,該方法首先將人臉圖像以采樣窗從土到下進(jìn)行采樣,分別采用DCT和SVD提取各個(gè)采樣窗圖像的特征參數(shù)并串接成一維觀察向量,然后將每個(gè)人的訓(xùn)練圖像的觀察向量用于訓(xùn)練每個(gè)人的H薩模型,將所有圖像的觀察向量采用Viterbi算法求出其對(duì)應(yīng)于每個(gè)HMM模型的輸出概率,并用于支持向量機(jī)的分類訓(xùn)練及識(shí)別測(cè)試,其具體實(shí)現(xiàn)步驟如下步驟l、圖像預(yù)處理;對(duì)人臉圖像/(大小為wxZO進(jìn)行一定的預(yù)處理,主要包括圖像平滑以及圖像灰度和方差的歸一化處理。步驟2、確定人臉圖像采樣窗;人臉圖像采樣窗的確定方法如圖1所示。人臉圖像的寬度為『,高度為H,我們用采樣窗從上到下進(jìn)行采樣,采樣窗的高度為i:,兩個(gè)相鄰采樣窗之間的重疊部分為尸。采樣數(shù)也即序列的時(shí)間長度r由下式給出<formula>formulaseeoriginaldocumentpage4</formula>步驟3、提取采樣窗圖像的DCT系數(shù);對(duì)大多數(shù)圖像來說,DCT有著很好的信息壓縮性,這里大多數(shù)能量都集中在少數(shù)幾個(gè)系數(shù)中,該變換是對(duì)隨機(jī)信號(hào)的K-L變換的一種近似方法,是一階馬爾可夫過程,它能提供一系列真實(shí)圖像的逼近模型。同時(shí),由于DCT的容易實(shí)現(xiàn)及計(jì)算上的優(yōu)勢(shì)使得它在人臉識(shí)別方面比K-L變換更具優(yōu)越性,也是一種有效的全局特征提取方法。給定一個(gè)長度為7V的序列w("),其離散余弦變換定義為-<formula>formulaseeoriginaldocumentpage4</formula>(2)其中<formula>formulaseeoriginaldocumentpage4</formula>,從定義中可以看出,對(duì)一個(gè)輸入序列進(jìn)行離散余弦變換,就是將序列分解成一組基本余弦序列基的線性疊加。圖像是一個(gè)二維信號(hào),對(duì)于一幅MxiV的圖像A,y,其離散余弦變換為w—iw—iv)-a(")"(v)HAjeos[、-~~〗cos['…~](3)其中w=0圖像的二維DCT系數(shù)構(gòu)成一個(gè)與原圖像大小相同的矩陣,其低頻系數(shù)集中在矩陣的左上角,是圖像中變化較慢的成分,高頻系數(shù)集中在矩陣的右下角,是圖像的細(xì)節(jié)和邊緣成分。經(jīng)過DCT變換之后,圖像的主要信息集中在低頻部分,因此,我們通過提取DCT系數(shù)的左上角矩陣,取其低頻分量并將之轉(zhuǎn)化成一維的向量作為識(shí)別的特征向量。步驟4、按從上到下的順序,提取人臉圖像所有采樣窗圖像的DCT系數(shù),并將其列成兩維矩陣;步驟5、提取采樣窗圖像的SVD特征;由于SVD具有良好的穩(wěn)定'fe、比例不變性和旋轉(zhuǎn)不變性,能有效的反映矩陣的特征,在人臉識(shí)別中,將圖像矩陣的奇異值作為識(shí)別特征是一種常用的特征提取方法。設(shè)一個(gè)人臉圖像矩陣」的秩為h通過SVD此矩陣可被分解為-<formula>formulaseeoriginaldocumentpage5</formula>(4)其中A^是以VI為元素的A:x;i對(duì)角矩陣,而;i是矩陣^^的非零特征值。o表示了一個(gè)零元素矩陣,即存在單位矩陣f/和F,使得變換后的矩陣S是對(duì)角的。由公式(3.1)可得腿(5)<formula>formulaseeoriginaldocumentpage5</formula>其中說和仏分別是f/和r的前/fc列。更精確的,",和v,分別是A4"和,^的特征向量。特征值;i,看作是J的奇異值,式(3.2)的展開式即為^的奇異值分解。步驟6、按從上到下的順序,提取人臉圖像所有采樣窗圖像的SVD特征,并將其列成兩維矩陣;步驟7、將采樣窗圖像的DCT系數(shù)矩陣和SVD特征矩陣按行串接成一個(gè)兩維矩陣,并按行以公式&=&/2>^(&)將每一行觀察向量進(jìn)行歸一化,獲得整個(gè)人臉圖像的觀察向量;步驟8、同樣,重復(fù)步驟2-7獲取所有人臉圖像的觀察向量;步驟9、確定H醒人臉模型;對(duì)正面端正的人臉圖像,從上到下按人臉特征的順序?qū)⑶邦~、眼睛、鼻子、嘴巴和下顎分為狀態(tài)l、2、3、4和5,然后依此順序建立一個(gè)如圖2所示的Markov鏈模型。該模型的特點(diǎn)是一定是從狀態(tài)1(前額)出發(fā),然后沿狀態(tài)序號(hào)增加的方向轉(zhuǎn)移,最終停在狀態(tài)5(下顎)。人臉HMM由一組狀態(tài)序列組成,每個(gè)對(duì)象的人臉用一個(gè)HMM的參數(shù)來表示,人臉的差異就是通過模型參數(shù)的不同表現(xiàn)出來的。人臉圖像的H醒由以下參數(shù)表示iV為垂直方向狀態(tài)數(shù);A為狀態(tài)轉(zhuǎn)移概率矩陣,A={fly,l《;,_7、iV},在人臉識(shí)別的應(yīng)用中,假定狀態(tài)只能轉(zhuǎn)移到本身或者是下一個(gè)狀態(tài)(垂直方向上),這樣可以減少系統(tǒng)的復(fù)雜性;B為狀態(tài)的觀察值概率密度函數(shù),B={6>,),l《^AU^^r},其中o,表示f時(shí)刻的觀察向量;冗是狀態(tài)的初始概率分布,7i二(7r"lS/SiV〉。步驟IO、訓(xùn)練H畫-SVM混合模型,如圖4所示;1、將每個(gè)人的訓(xùn)練圖像的觀察向量用于訓(xùn)練其個(gè)人HMM模型,在人臉識(shí)別系統(tǒng)中,將每個(gè)人的圖像采樣窗觀察向量用于H,模型的訓(xùn)練,分別為每個(gè)人臉進(jìn)行建模,如圖3所示。建模的關(guān)鍵問題是如何確定H醒參數(shù),這是HMM三個(gè)問題中的學(xué)習(xí)問題,采用Ba咖-Welch算法,具體步驟如下(1)適當(dāng)?shù)倪x擇模型的初始函數(shù);i-(;r,A,B)。由于采用從左到右的拓?fù)浣Y(jié)構(gòu),初始狀態(tài)概率冗,可設(shè)定為巧=1,;r,=0(>=2,…,A0。B的初值選擇對(duì)HMM參數(shù)收斂影響較大,采用分段X均值算法(Seg腿ntalK-MeansProcedure)選取初值。'(2)定義《(/,力為給定訓(xùn)練序列o和模型;i時(shí),時(shí)亥^時(shí)馬爾可夫鏈處于狀態(tài)/和時(shí)刻"l為狀態(tài)乂的概率,即《(/,力=尸"=^+1=乂|0,;1)=-那么時(shí)刻/馬爾可夫鏈處于狀態(tài)z'的概率為<formula>formulaseeoriginaldocumentpage6</formula>導(dǎo)出重估公式<formula>formulaseeoriginaldocumentpage6</formula>給定一個(gè)訓(xùn)練符號(hào)序列0-q"2,…,^,由初始模型計(jì)算《(/,/),根據(jù)上述重估公式計(jì)算^和^,得到新的模型參數(shù);,可以證明尸(0|;)>尸(0|;1);再給定一個(gè)訓(xùn)練符號(hào)序列0:Q,02,…,A,由新的模型參數(shù)義作為初始模型重新估計(jì)。(3)如此反復(fù)直至P(OlA)收斂,不再增大,此時(shí)的i即為所求的HMM模型參數(shù)。2、將訓(xùn)練圖像的觀察向量采用Viterbi算法求出其對(duì)應(yīng)于每個(gè)H薩模型的輸出概率,然后將其串接成一維向量并做歸一化處理;3、將訓(xùn)練圖像的輸出概率向量用于訓(xùn)練支持向量機(jī)分類器;步驟11、將測(cè)試圖像的觀察向量作為混合模型的測(cè)試向量,采用Viterbi算法求出其對(duì)應(yīng)于每個(gè)HMM模型的輸出概率,然后將其串接成一維向量并做歸一化處理;步驟12、將測(cè)試圖像對(duì)應(yīng)于H國模型的輸出概率向量用于支持向量機(jī)分類器的分類測(cè)試,獲得人臉識(shí)別結(jié)果。本發(fā)明與現(xiàn)有技術(shù)相比具f以下優(yōu)點(diǎn)1、由于H畫利用上下文關(guān)系進(jìn)行模式識(shí)別,更多的表達(dá)了類別內(nèi)的相似性,而SVM適合于處理分類問題,更大程度上反映了類別間的差異,它們各自的優(yōu)勢(shì)正好彌補(bǔ)了彼此的不足。針對(duì)H廳只以最大概率判斷的不足,可以利用SVM的分類上的優(yōu)勢(shì)彌補(bǔ),同時(shí)利用H顧處理連續(xù)動(dòng)態(tài)信號(hào)問題的特點(diǎn),計(jì)算各HMM模型與待辨識(shí)人臉圖像的匹配程度,形成特征值,提供給SVM進(jìn)行識(shí)別,減少SVM由于忽略人臉各器宮的內(nèi)在聯(lián)系而導(dǎo)致的識(shí)別錯(cuò)誤。2、以往的H醒人臉識(shí)別方法大多采用單一的特征方式來提取觀察向量,沒有充分考慮到人臉不同特征之間的互補(bǔ)性。鑒于此,我們采用每一個(gè)采樣窗圖像的DCT系數(shù)和SVD向量作為訓(xùn)練HMM的人臉圖像觀察向量。由于DCT系數(shù)對(duì)光照、表情、姿態(tài)具有一定的不敏感性,以及SVD方法對(duì)圖像所具有的穩(wěn)定性、比例不變性和旋轉(zhuǎn)不變性,因此將其作為觀察向量要優(yōu)于直接采用人臉灰度值或其它單一的特征向量。另外,由于這兩種變換所具有的良好的數(shù)據(jù)壓縮性,能有效的實(shí)現(xiàn)數(shù)據(jù)降維,降低人臉識(shí)別過程中計(jì)算的復(fù)雜度。圖l是本發(fā)明的人臉圖像采樣窗圖圖2是本發(fā)明的一維H顧人臉模型結(jié)構(gòu)圖3是本發(fā)明的HMM訓(xùn)練模型圖4是本發(fā)明的HMM-SVM混合模型流程圖圖5是本發(fā)明的基于HMM-SVM混合模型的人臉識(shí)別系統(tǒng)流程圖具體實(shí)施例方式參考圖5,它是本發(fā)明實(shí)現(xiàn)步驟的流程圖,結(jié)合該圖對(duì)本發(fā)明的實(shí)施過程作詳細(xì)的說明。本發(fā)明的實(shí)施例是在以本發(fā)明技術(shù)方案為前提下進(jìn)行實(shí)施的,給出了詳細(xì)的實(shí)施方式和具體的操作過程,但本發(fā)明的保護(hù)范圍不限于下述實(shí)施例。實(shí)施例采用了一個(gè)公用的人臉數(shù)據(jù)庫,英國劍橋大學(xué)的ORL人臉數(shù)據(jù)庫。0RL庫包含40個(gè)人的400幅112x92大小的人臉圖像,每人10幅。這些圖像是在不同時(shí)間拍攝的,有姿態(tài)、角度、尺度、表情和眼鏡等變化。具體的人臉識(shí)別過程如下-1、圖像預(yù)處理對(duì)112x92大小的人臉圖像進(jìn)行預(yù)處理,主要包括圖像平滑和對(duì)比度校正等圖像增強(qiáng)以及圖像灰度及方差的歸一化處理。經(jīng)過預(yù)處理之后,所有圖像的灰度統(tǒng)一到標(biāo)準(zhǔn)水平,且灰度層次比較分明,同時(shí),為了節(jié)省運(yùn)算的時(shí)間及存儲(chǔ)量,我們采用雙線性插值法將圖像壓縮至24x24大小。另外,由于基于圖像重構(gòu)的人臉識(shí)別方法是基于單個(gè)人的人臉樣本進(jìn)行特征臉提取的,實(shí)驗(yàn)樣本數(shù)較少,為了更為有效的提取人臉特征子空間,我們將人臉庫中所有圖像進(jìn)行了左右的鏡像,擴(kuò)大了訓(xùn)練及測(cè)試樣本的數(shù)2、特征提取(1)確定人臉圖像采樣窗;人臉圖像采樣窗的確定方法如圖l所示,其中參數(shù)^和^的選擇在很大程度上影響著識(shí)別率。一般情況下,重疊部分越大,識(shí)別率也越高,因?yàn)檫@樣可以得到更長的觀察序列。如果圖像采樣塊間沒有重疊,當(dāng)采樣高度Z過小時(shí),采樣的塊不一定與重要的人臉特征相聯(lián)系,并且增加系統(tǒng)的復(fù)雜度;而當(dāng)采樣高度Z過大時(shí),又會(huì)增加在采樣時(shí)切割人臉特征的概率。一般來說,Za/z/io,p《i:-i,在戶足夠大的情況下(尸S丄-1),系統(tǒng)的識(shí)別率不敏感于丄,在本文的實(shí)驗(yàn)中,我們?nèi)∈?7,£=8;(2)提取圖像采樣窗的DCT系數(shù)和SVD特征;采樣窗圖像大小為24x8,經(jīng)過DCT變.換之后,圖像的二維DCT系數(shù)構(gòu)成一個(gè)與原圖像大小相同的矩陣,其低頻系數(shù)集中在矩陣的左上角,而圖像的主要信息都集中在低頻部分。因此,我們以按Zig-Zag順序提取DCT系數(shù)左上角7x3大小的矩陣的低頻系數(shù)作為圖像的DCT特征。同樣,將采樣窗圖像以SVD變換,提取其SVD特征,本實(shí)驗(yàn)取的SVD特征維數(shù)為8。(3)從上往下提取人臉ti像的各采樣窗的DCT系數(shù)和SVD特征,并將各采樣窗圖像的DCT系數(shù)矩陣和SVD特征矩陣按行串接成一個(gè)向量,以e,-s,/2^fc(&)將每個(gè)采樣窗獲得的觀察向量進(jìn)行歸一化,最終獲得一個(gè)人臉圖像的觀察值序列;(4)重復(fù)以上步驟獲取所有人臉圖像的觀察向量。3、訓(xùn)練及識(shí)別(1)對(duì)正面端正的人臉圖像,從上到卞按人臉特征的順序?qū)⑶邦~、眼睛、鼻子、嘴巴和下顎分為狀態(tài)l、2、3、4和5,然后依此順序建立一個(gè)如圖2所示的H醒人臉模型結(jié)構(gòu);(2)以每個(gè)人的人臉圖像觀察向量作為訓(xùn)練向量,釆用BaiM-Welch算法,訓(xùn)練得出其HMM模型;(3)將所有圖像的觀察尚量采用Viterbi算法求出其對(duì)應(yīng)于每個(gè)H麗模型的輸出概率,然后將其串接成一維向量并做歸一化處理;(4)將訓(xùn)練圖像的輸出概率向量用于訓(xùn)練支持向量機(jī)分類器;(5)將測(cè)試圖像的輸出概率向量用于支持向量機(jī)分類器的分類測(cè)試,獲得人臉識(shí)別結(jié)果。為了更好的說明算法的有效性,我們采用隨機(jī)抽取數(shù)據(jù)庫中一半圖像用于訓(xùn)練,另一半用于識(shí)別的做法,即每入的5個(gè)樣本及其鏡像(共10個(gè)訓(xùn)練樣本)進(jìn)行訓(xùn)練,相應(yīng)剩余的樣本及其鏡像(IO個(gè)測(cè)試樣本)進(jìn)行測(cè)試,并將此實(shí)驗(yàn)重復(fù)50次,取這50次識(shí)別率的平均值作為最終的實(shí)驗(yàn)結(jié)果,實(shí)驗(yàn)結(jié)果如表1所示。<table>tableseeoriginaldocumentpage9</column></row><table>從表l可以看出,在基于ORL的人臉識(shí)別實(shí)驗(yàn)中,基于HMM-SVM混合模型的人臉識(shí)別方法得到的正確識(shí)別率為94.5%,相比于其它的典型的HMM人臉識(shí)別方法在識(shí)別率上有了較大的提高。實(shí)驗(yàn)結(jié)果說明了該方法能有效的結(jié)合H醒和SVM各自的優(yōu)勢(shì),提高人臉識(shí)別的準(zhǔn)確率。權(quán)利要求1、一種基于HMM-SVM混合模型的人臉識(shí)別方法,其特征在于,包括人臉圖像預(yù)處理、人臉圖像的DCT和SVD特征提取,HMM-SVM混合模型的訓(xùn)練和識(shí)別,其主要的識(shí)別步驟如下(1)圖像平滑以及圖像灰度和方差的歸一化處理;(2)確定人臉圖像采樣窗;(3)提取采樣窗圖像的DCT系數(shù),并將其按行堆疊成一維向量,并從上到下依次提取出人臉圖像所有的采樣窗圖像DCT系數(shù);(4)同上,從上到下提取人臉圖像中采樣窗圖像的SVD特征;(5)將采樣窗圖像的DCT系數(shù)和SVD特征串接成一維觀察向量,然后將其歸一化,獲得人臉圖像的觀察向量;(6)重復(fù)步驟3-5獲取所有圖像的觀察向量;(7)將每個(gè)人的訓(xùn)練圖像的觀察向量用于訓(xùn)練其個(gè)人HMM模型;(8)將所有圖像的觀察向量采用Viterbi算法求出其對(duì)應(yīng)于每個(gè)HMM模型的輸出概率,然后將其串接成一維向量并做歸一化處理;(8)將訓(xùn)練圖像的輸出概率向量用于訓(xùn)練支持向量機(jī)分類器;(9)將測(cè)試圖像的輸出概率向量用于支持向量機(jī)分類器的分類測(cè)試,獲得人臉識(shí)別結(jié)果。全文摘要本發(fā)明公開了一種基于HMM-SVM混合模型的人臉識(shí)別方法,該方法首先將人臉圖像以采樣窗從上到下進(jìn)行采樣,分別采用離散余弦變換(DCT)和奇異值分解(SVD)提取各個(gè)采樣窗圖像的特征參數(shù)并串接成一維觀察向量,然后將每個(gè)人的訓(xùn)練圖像的觀察向量用于訓(xùn)練每個(gè)人的HMM模型,將所有圖像的觀察向量采用Viterbi算法求出其對(duì)應(yīng)于每個(gè)HMM模型的輸出概率,并用于支持向量機(jī)的分類訓(xùn)練及識(shí)別測(cè)試。由于HMM模型具有良好的時(shí)間序列建模能力,能有效地將人臉的各個(gè)器官的數(shù)值特征以一個(gè)狀態(tài)轉(zhuǎn)移模型聯(lián)系起來,對(duì)人臉進(jìn)行更為完整的描述,以及支持向量機(jī)在有限樣本的分類方面的優(yōu)良性能。文檔編號(hào)G06K9/00GK101604376SQ20081022806公開日2009年12月16日申請(qǐng)日期2008年10月11日優(yōu)先權(quán)日2008年10月11日發(fā)明者周昌軍,強(qiáng)張,魏小鵬申請(qǐng)人:大連大學(xué)