一種非相鄰的圖結構稀疏人臉識別方法
【技術領域】
[0001] 本發明涉及一種非相鄰的圖結構稀疏人臉識別方法,屬稀疏表示人臉識別技術領 域。
【背景技術】
[0002] 壓縮感知(Compressed sensing, C巧針對具有稀疏性或在特定域上具有稀疏性的 信號,通過實施遠低于奈奎斯特采樣率的隨機采樣,利用信號的稀疏性和測量矩陣與測量 基之間的非相干性,可高概率地精確重構原始信號。在壓縮感知理論的推動下,近幾年,稀 疏編碼和稀疏表示技術得到了飛速發展。稀疏表示的思想是假設觀測數據y e RD可表示 成數據字典D G RDXP的稀疏線性組合,即巧=D a,式中a G RP是y在字典D下的表示系 數。基于稀疏表示的人臉識別方法是在已知y和D的條件下,通過壓縮感知重構算法求解 稀疏表示系數a,再通過分析稀疏表示系數對樣本進行判別歸類。
[0003] 稀疏表示的人臉識別技術可W分為傳統的稀疏表示人臉識別、非重疊的組結構稀 疏人臉識別和可重疊的圖結構稀疏人臉識別H個階段。
[0004] 傳統的稀疏表示分類模型(Sparse Representation-based Classification, SRC)是將一個人臉識別問題轉變為一個稀疏表示問題,即將測試數據表 示成數據字典的稀疏線性組合,如圖1所示。SRC的數據字典是由已知分類的所有類別的訓 練樣本構成,若訓練樣本有m個類別,每類別有q個訓練數據,每個圖像被堆疊為一維向量, 則數據字典可表示為 D = [dll. . . di。,......,d。. . . di。,......,dmi. . . dm。],式中[d。,...中。] 是第i類的訓練樣本。如果y是第i類的測試數據,則在理想的情況下,通過稀疏重構所獲 得的表示系數中,字典原子[中1,...中。]所對應的系數項為非零,而其他項為零,即表示 系數可表示為;5 = [D,…,G,%,…,聽,0,…,0],它是稀疏的,平均只有1/m個非零項,測試數據可 表示為y = [d。,. . .,di。] [ a 11,. . .,a JT。但由于人臉圖像都具有類似的特征,使得其他 類別所對應的表示系數并不一定為零,因而存在著挑戰的問題。
[0005] 在SRC的基礎上,有關文獻提出了魯棒的SRC模型(R-SRC),將噪聲的影響考慮 進來,則測試數據y = y〇+e,y。可表示為訓練字典D的稀疏線性組合,噪聲e G RD可表示 為單位矩陣A G RDXn的稀疏線性組合,將訓練字典和單位矩陣合并可構成新的過完備字 典基巧A],y可表示為新基下的稀疏線性組合,R-SRC模型對噪聲和偽裝具有很強的魯 棒性。有文獻綜合了此類稀疏分類模型,將各種保真函數與懲罰函數相結合,得到適合不 同條件的人臉識別模型,統稱為競爭表示模型(coll油orative r巧resentation based classification, CRC)。有的文獻提出了擴展的SRC模型巧SRC),ESRC模型假設各類別共 享相同的環境條件,其字典不僅包含訓練樣本,還包括各類別的類內差異,ESRC模型可W應 用于單個訓練樣本的場合。
[0006] 傳統的SRC模型將每個字典原子分隔開來,獨立處理,沒有考慮各原子之間 的關系,所產生的稀疏是非結構的。近年來,研究人員根據SRC模型中數據字典的組 塊結構,提出了組結構的稀疏表示分類模型(Group Sparse Representation-based Classification, GSRC),此模型利用了數據字典的組塊特性,限制了搜索空間,從而提高了 人臉識別的性能。但人們也發現如果組塊內的成員能互相補充,互相促進,則能增強數據的 表示能力;但如果組塊內成員的作用互相抵消,則組結構會起到相反的作用。為此人們采用 聚類方法或非線性流行學習的方法,將相似的樣本進行聚類,然后根據聚類結果將類內樣 本進一步劃分為多個小組,此方法一定程序上可W降低組塊劃分不當造成的影響。但并不 是相似樣本構成的組塊其表示能力就能增強,組塊內成員相似,意味著其產生的作用重復, 因此相似樣本所起到的作用較小;反而是一些差異較大的樣本,由于他們互相補充,其數據 表示能力增強較大。另外,如果組塊內成員差異較大,也有可能其成員的作用互相抵消,貝U 會降低組塊的作用。因此對數據字典進行聚類處理,其作用有限。
[0007] 圖結構是比組結構更一般的數據結構,其組劃分是動態的、可重疊的,其組劃分預 先是不可知的。為了尋找到最佳的組劃分,需要通過搜索的方式分析所有可能的組合,該種 搜索如果不加限制,則很可能產生組合爆炸,為此一般的圖稀疏方法都是限制組成員由相 鄰元素構成,其組劃分的方法就好像是用一個滑動窗口在數據上截取組塊,所截取的組塊, 其成員是由相鄰元素構成。一般圖結構稀疏方法比較適合自然數據,因為自然數據都具有 一定的連續性,由相鄰元素構成的組塊可W表示具有連續特性的自然數據。然而SRC模型 其數據字典并沒有該樣的連續性,因而一般的圖結構稀疏也不適合SRC模型。
【發明內容】
[0008] 本發明需要解決的問題包括;如何表示非相鄰的圖結構?如何搜索表示能力最 強的組塊?為了避免搜索過程中的組合爆炸,采取什么樣的限制策略?使算法既具有可行 性,又能尋找到所需要的組塊。在算法實現過程中,如何衡量結構稀疏度?并進行量化實 現。最后選擇哪種壓縮感知重構算法?
[0009] 本發明的技術方案是,本發明一種非相鄰的圖結構稀疏人臉識別方法包括非相鄰 的圖結構稀疏、分塊組合搜索方法、結構稀疏度的衡量方法及實現結構稀疏重構的算法。
[0010] 本發明方法根據稀疏表示分類模型數據字典的結構特點,通過非相鄰的圖結構稀 疏來增強系統的性能,非相鄰圖結構的組塊是動態的,可重疊的,預先不可知的,組成員可 W是不相鄰的;為了實現非相鄰圖結構稀疏,所述方法采用組合搜索的方法獲得所有可能 的組塊,包括相鄰或不相鄰的組塊,從中尋找表示能力最強的組塊;為了避免在搜索中產生 組合爆炸,所述方法提出分塊組合搜索的方法用于限制搜索空間;此外,所述方法還提出W 編碼復雜度來衡量結構稀疏度,采用結構貪婪算法來實現結構稀疏重構。
[0011] 本發明是在SRC模型的基礎上,利用數據字典中的結構先驗知識,通過非相鄰的 圖結構稀疏來提高人臉識別的性能。現有的結構稀疏方案,無論是非重疊的組稀疏,還是可 重疊的圖稀疏,其組成員都要求是相鄰的,該種限制能縮小搜索范圍,比較適合具有連續性 的自然數據的處理。非相鄰的圖結構,其與一般的圖結構的最大區別在于其組成員可W是 不相鄰的;一般的圖結構稀疏方法為了縮小搜索范圍,都要求組塊成員是相鄰的,該種限制 符合一般自然數據的特征,因為自然數據都具有連續性,其組塊由相鄰元素構成,因此該種 限制并不會丟失所需要的組塊。但SRC數據字典的排列沒有連續的特性,系統所需要的組 塊很可能是不相鄰的,因此該種相鄰的組結構或圖結構并不適合SRC模型的結構特征。為 此本發明提出非相鄰的圖結構,其組塊是動態的,可重疊的,預先不可知的,組成員可W是 不相鄰的。
[0012] 為了實現非相鄰的圖結構稀疏,需要搜索所有可能的組塊,包括相鄰或非相鄰,為 此,本發明設計使用組合搜索的方式來搜索所有可能組合。顯而易見,如果不加限制,該種 組合搜索很容易產生組合爆炸,造成不可行計算。
[0013] 為了避免搜索過程中的組合爆炸,設計了相應限制策略W縮小搜索范圍;首先可 W僅搜索固定長度的小組塊,把該些小組塊作為基塊,由基塊的聯合構成其他形式的組塊; 若b是基塊的索引,B是所有基塊的索引集合,稱為基子集,則任何一個組塊的索引F都能 表示為基子集的并集,F = U b€cb。因此僅需要搜索基子集空間,就能搜索到所有需要的組 塊。
[0014] 但是通過W上方法所得到的基子集空間仍然是非常鹿大的,例如,如果表示系數 的維數為300,設置基塊大小為3,則其組合數將達到ci。4 J X ,如此大的基子 集空間將產生非常大的計算負擔,因此需要進一步縮小基子集空間。在數據維數較大時,組 合搜索基本是不可行的,但數據維數不高時,組合搜索是可行的。為此可W采用將數據進行 分塊,再在數據塊內進行組合搜索,最后將各數據塊的搜索結果合并的方法解決。由于SRC 模型的數據字典是按類排列,對應的表示系數可W按類別自然分塊,在每個類別的訓練樣 本數不多的情況下,可W對類內系數進行組合搜索,獲得所有組合的基塊,再將各類別的基 塊合并成基子集空間。
[0015] 本發明分塊組合搜索方法將數據字典按類別自然分塊,再在數據塊內進行組合搜 索,最后將各數據塊的搜索結果合并的方法;該種分塊組合搜索所產生的空間是較小的,若 表示系數的維數是300,共60個類別,每類別5個樣本,每類別長度為3的基塊組合共10個, 則基子集空間的大小為60*C^二600《4.5xl06,分塊組合搜索的基子集空間遠小于不 分塊的組合搜索。通過W上方法可W極大地縮減搜索空間,將一個NP的組合搜索問題變為 一個可行計算。
[0016] 分塊組合搜索的基子集空間雖然減小了,但它并沒有丟失SRC模型需要的組塊, 因為SRC模型所需要的組塊,其成員都是由同類的樣本構成,分塊組合搜索是在同類別的 樣本中進行組合,因而不會丟失所有可能入選的組塊。再者分塊組合搜索的基子空間包括 不相鄰元素構成的基塊,因此不管數據字典如何排列,其組塊成員都會進入搜索空間,因此 數據字典的排列順序不會影響系統的性能。
[0017] 為了實現非相鄰的圖結構稀疏,結構稀疏度的衡量也是一個關鍵的問題。本發明 不是采用常規的復