面部快速識別系統和方法
【技術領域】
[0001] 本發明涉及圖像處理技術領域,尤其涉及一種快速、高效的面部識別系統及方法。
【背景技術】
[0002] 隨著計算機及圖像處理技術的發展,面部識別技術越來越多的應用于安防系統, 視頻交互應用,圖像編輯及歸檔應用,計算機視頻應用等方面。
[0003] 通過給定的圖像推導出某一人物的身份是面部識別的一個挑戰性難題。目前,在 處理非可控制環境下大規模的面部識別系統上已經有一些研究成果。近來,基于稀疏表示 的分類識別(SRC)的臉部識別技術及其擴展提高了面部識別的性能。
[0004] SRC的主要思想在于:一個目標面部圖像都可以由相同目標在不同情況下(例如, 姿勢,光照條件等等)獲取的可使用的圖像的稀疏線性組合表示。上述思想也可以應用于 一個面部圖像本身是在較低維度空間中描述的,重要且容易的可識別特征所表示的情況 中。為加強稀疏性,可采用^優化算法,然后,選擇產生最小重建誤差的面部類別用于目標 物的歸類或確認。
[0005] 但是,基于稀疏表示的面部識別通常是假設訓練圖像是處于嚴格控制下,并且每 一類的樣本數目非常龐大。為了克服每一類樣本數需求量大的局限性,本發明采用稀疏性 與附加的信息量大的最小二乘法相結合的方法達到顯著的性能改進,并且額外成本小。
【發明內容】
[0006] 本發明一方面公開了一種面部識別方法,其采用了應用于計算系統中的基于稀疏 表示及正則化的最小二乘法歸類方法。所述面部識別方法包括:獲取一個圖像作為一個測 試樣本y,將某一特定物體的一組訓練圖像集合作為訓練樣本矩陣T,獲取包含稀疏向量a 初始估值的訓練樣本和測試樣本的稀疏表示;構建一個新面部字典,其包含一個帶非零相 關系數的稀疏向量a的訓練樣本。該面部識別方法也公開了通過求解正則化的最小二乘法 問題獲得新系數,確定基于通過新系數計算的最低類殘余的測試樣本的面部特征。
[0007] 本發明的另一方面公開了一種面部識別系統,其用于在計算系統中運行使用基于 稀疏表示及正則化的最小二乘法歸類的面部識別方法。所述面部識別方法包括:獲取一個 圖像作為一個測試樣本y,將某一特定物體的一組訓練圖像集合作為訓練樣本矩陣T,獲取 包含稀疏向量a初始估值的訓練樣本和測試樣本的稀疏表示;構建一個新面部字典,其包 含一個帶非零相關系數的稀疏向量a的訓練樣本。該面部識別方法也公開了通過求解正則 化的最小二乘法問題獲得新系數,確定基于通過新系數計算的最低類殘余的測試樣本的面 部特征。
[0008] 本發明的其他方面,所屬技術領域技術人員能夠依據本發明的說明書,權利要求 書,以及附圖有效實施并充分公開。
【附圖說明】
[0009] 圖1為本發明【具體實施方式】中的一個具體工作系統的示意圖。
[0010] 圖2為本發明具體實施例的計算系統的結構框圖。
[0011] 圖3為本發明具體實施例的視頻結構的示意圖。
[0012] 圖4為本發明具體實施例的面部識別過程的示意圖。
【具體實施方式】
[0013] 附圖中展示的部分將被引以具體說明闡述本發明具體技術實施方案。說明書中引 用的數字代表附圖的相應部分。
[0014] 圖1展示了本發明【具體實施方式】中的一個工作系統100。如圖1所示,所述工作系 統100可包括:計算系統102,通信網絡110,攝像機112,便攜式存儲設備114以及數據存 儲設備116。當然可以減省一些設備,還可以添加其他合適的設備。
[0015] 計算系統102可以是任何具有計算能力的電子設備,例如電視機(TV),機頂盒,移 動手機,智能手機,平板電腦,個人電腦(PC),服務器類計算機,手提電腦,掌上電腦(PDA) 等。
[0016] 所述通信網絡110可包括任何數量的通信網絡和服務器,提供給計算系統102不 同類型的媒體,例如視頻流,照片和圖像等。攝像機112可以是計算系統102的內置攝像機, 或者是與計算系統102通過網絡連接的外置攝像機。攝像機112可以向計算系統102提供 圖像以及視頻。
[0017] 便攜式存儲設備114可包括任何合適的便攜式存儲裝置,例如記憶卡,閃存或者 其他類型的可移動存儲媒介,用于存儲計算系統102的圖像或者視頻。進一步的,數據存儲 設備116可以是內置或者外置的數據存儲裝置,例如用于為計算系統102存儲圖像或者是 視頻的硬盤或者數據庫。
[0018] 在操作過程中,計算系統102可從攝像機112,便攜式存儲設備114,數據存儲設備 116,和/或通信網絡110獲取圖像和/或視頻,還可對圖像和/或視頻進行進行圖像處理, 例如面部識別。圖2為計算系統102的具體結構框圖。
[0019] 如圖2所示,所述計算系統102可包括一個處理器202,隨機存儲器(RAM) 204,只 讀存儲器(ROM) 206,存儲單元208,顯示器210,輸入/輸出接口 212,數據庫214,通信接口 216以及圖像單元220。在不違背本實施方式原則的情況下,可以減省某些設備,也可以添 加一些其他類型的設備。
[0020] 所述處理器202可以是任何通用的微處理器,數位信號處理器或微控制器或者專 用集成電路(ASIC)。處理器202可執行一序列的計算機程序指令來完成與計算系統102相 關的各種處理。處理器202執行的計算機程序指令可由只讀存儲器206,或存儲單元208存 入隨機存儲器204。存儲單元208可包含任何合適類型的大容量存儲器,用來存儲處理器 202執行時所需的任意類型信息。例如,存儲單元208可包括可提供存儲空間的一個或多個 硬盤裝置,光盤裝置,閃存或其他存儲裝置。
[0021] 顯示器210可向使用計算系統102的用戶提供信息。顯示器210可以是任何計算 機顯示器或電子顯示器(例如CRT或者IXD電子裝置)。用戶可通過輸入/輸出接口 212 向計算系統102輸入信息或者接收信息。例如,輸入/輸出接口 212可以是任意輸入裝置, 如鍵盤,鼠標,電子輸入板,語音裝置,或者其他光纖或無線輸入裝置。輸入/輸出接口 212 可接收來自圖像單元220的數據,和/或向圖像單元220發送數據。
[0022] 進一步的,數據庫214可包括任何類型的商業或者自定義數據庫,也可包括用于 分析數據庫信息的分析工具。數據庫214可用于存儲圖像和圖形信息以及其他相關信息。 通信接口 216可提供通信連接功能,這樣計算系統102可經由不同的通信協議,如傳輸控制 協議/網間協議(TCP/IP),超文本傳輸協議(HTTP)等,通過電腦網絡和通信網絡被遠距離 訪問,和/或與其他系統溝通。圖像單元可以包括任何與處理器202相結合或匹配的圖像 采集,存儲,和/或處理元件。
[0023] 在操作過程中,所述計算系統102,尤其是處理器202和/或圖像單元220可執行 某特定程序來處理不同來源的圖像以識別相關的物體,和提供更進一步的處理和應用。例 如,計算系統102可回放視頻,并對視頻流中的圖像進行面部識別。
[0024] -個視頻流可以分成多段不同的視頻片段,如圖3所示,一個視頻流可以分成許 多不同的場景,一個場景又可以進一步細分為許多不同的鏡頭,一個鏡頭可以分為多個視 頻幀。每個視頻幀可以進一步分為不同的物體,并且將視頻幀中的特征提取出來作進一步 處理。所述面部識別可在物體層面運行從而識別一個或者多個預設物體,如,人。
[0025] 所述面部識別可利用基于稀疏表示(SR)和正則化的最小二乘法(RLS)的分類算 法實現。基于稀疏表示和正則化的最小二乘法的分類算法中,應用了多種符號及計算方法。
[0026] 設表示面部測試樣本,其中,d表示所選面部特征的維度。令 P=[私…,3?e 表示項目c的樣本的集合堆疊為列的矩陣(字典)。pi表示第ith 個項目的樣本的第叫個集合,S卩E辦=11。
[0027] 在基于稀疏表示的分類識別(SRC)中,測試樣本y用如下算式表示:
[0028] y=Ta+e(1)
[0029] 其中,ee艫表示密集噪聲,aeP11表示一個非零元素的稀疏向量,其與一些T中的 樣本對應。因此測試樣本可通過T中的樣本的稀疏線性組合所表示。通過求解下述最優解 問題可以獲得a的系數:
[0031] 在基于擴展稀疏表示的分類識別(ESRC)中,測試樣本y用如下算式表示:
[0032] y=Ta+Vb+e(3)
[0033] 其中,reKdxi1表示可變字典,為每個目標i表征,如同在SRC中,aeir?表示稀疏 向量。所述可變詞典即以類內變化的基礎為模型,例如光照改變,夸張的表情或遮擋。
[0034] V不能識別的不同類型的變量可由密集噪聲項6£鱸表示。向量6e麼也可考慮為 稀疏的,并且其系數在最終圖像不受控制的可視條件下,即識別目標不具有多信息時,能有 效識別。
[0035] 因此,測試樣本可以表示為識別物體身份Ta和識別稀疏噪音Vb的線性組合。可 變矩陣V可由每個樣本的不同之處和與其相對應的類別矩心構成,如下列算式所示:
[0038]進一步,在ESRC中,可通過求解下述最優解問題獲得稀疏向量a和b:
[0040] 類似于SRC,分類識別(或其他物體識別)通過選擇具有最小殘余的類別i進行。 不同的是在計算每一類別的殘余時,項目Vb要從測試樣本中剔除。
[0041] 進一步的,在基于正則化的最小二乘法的分類表示(CR-RLS)中,正則化的最小二 乘法在對未知變量a沒有施加稀疏性限制的情況下用于表示測試樣本,分類則通過對每個 類別減少重建來實現。每個有效方法的最優解問題可在相近形式中很容易的獲得,算式如 下:
[0043] 圖4是基于稀疏表示和正則化的最小二乘法(SR+RLS)的面部識別的具體實例。圖 4所示,首先,獲取測試樣本和訓練矩陣T(S402)。所述測試樣本和訓練矩陣T可通過以預 設物體為基礎的不同來源的視頻獲取。
[0044] 例如,對于一個特定的物體,該物體的不同圖像可以在不同的燈光條件,例如遮 擋,視角,環境,色彩,圖像尺寸等條件下獲取作為訓練樣本。測試樣本可以是被識別的圖 像。所獲取的測試樣本和訓練矩陣T可存儲在計算系統102 (例如,存儲器208)。
[0045]測試樣本,也就是向量y,可以從視頻幀或其他被識別的圖像中獲取,訓練樣本,也 就是矩陣T,可以從相對應的來源獲取。將向量y和矩陣T輸入面部識別算式中。
[0046] 更進一步的,對訓練樣本T展開主成分分析(PCA),從而將T映射到d維空間,即, 所選的面部特征維數。另外,可以對T的列進行標準化處理以獲取I2-標準。
[0047] 進一步的,可以獲取稀疏表示(SR) (S404)。也就是說,可獲取稀疏向量