專利名稱:基于老齡用戶多方式隱式語義分析處理方法
技術領域:
本發明涉及生物識別技術領域,尤其是基于老齡用戶多方式隱式語義分析處理方法。
背景技術:
目前,我國60歲以上人口達1.8億人,約占總人口 13.8%,按國際標準衡量,我國已進入了老年型社會,隨著國家大力加快建立和完善覆蓋城鄉居民的社會保障體系,如社會養老保險金的發放、企業年金、醫療保險等,老齡用戶將成為未來社會公共服務的主要群體,社會養老保險金、企業年金等發放過程中存在欺騙、冒領現象成為現今社會普遍關注的問題,信息化、數字化、網絡技術為解決老齡用戶身份認證困局提供了幫助。目前,生物特征識別技術、遠程視頻認證已經被成功應用到核實社會養老金冒領現象中老齡用戶的身份。生物特征識別技術通過利用人體固有的生理特征和行為動作來進行身份識別和驗證。根據使用生物特征的種類和數目,生物特征識別可以分為單生物特征識別和多生物特征識別,作為使用最廣的單生物識別身份認證技術,指紋識別在解決老齡用戶社會養老金發放時身份認證的問題已受到廣泛關注。早在1901年,英國已開始應用指紋識別來避免鐵路工人冒領、多領薪金。目前,相關公司如IBM、MiCr0S0ft、HP、C0mpaq、長春鴻達、杭州中正等公司的產品已經進入社會服務領域。我國勞動和社會保障部社會保險事業管理中心發布的《支付養老金指紋身份認證系統技術規范(試行)》也將基于細節點(minutiae)的指紋識別方法作為社會公共服務標準予以頒布,但是,對老齡用戶來說,由于久經風霜,模糊手指很常見,傳統的基于細節點的指紋識別系統往往會因為提取細節點不理想而導致系統誤識率增加甚至認證失效。此外,基于單生物特征的識別技術存在著不普遍性某些生物特征缺失(如斷手指)、損傷(如受損手指)、病變(如白內障)或特征采集質量較差(如人臉光線變化)都會導致識別系統的魯棒性、可靠性差,防欺騙性弱,難以滿足不同場合的實際要求。圖像隱式語義特征(Image Latent Semantic Features, ILSF)由底層特征-圖像矩陣獲得,具有比傳統意義上的圖像語義更加豐富的信息,但是相對與底層特征來說,這些特征具有更強的表達和分類能力。因此,利用TLSA提取的特征可以作為一種“獨特”的特征,并被證明能運用在生物特征身份認證領域。同時,相比傳統的底層特征,由于間接用來描述圖像,圖像隱式語義特征對于采集圖像的質量要求并不是很高,可以更好的克服某些不利因素帶來的影響,比如指紋的圖像紋線模糊,以及人臉光照變化的影響。
發明內容
本發明要解決的技術問題是為了克服上述中存在的問題,提供一種對提取特征進行處理的基于老齡用戶多方式隱式語義分析處理方法。本發明解決其技術問題所采用的技術方案是一種基于老齡用戶多方式隱式語義分析處理方法,其具體步驟如下
a.底層特征的圖像矩陣構建采用多種底層特征,構建每個用戶的底層特征的圖像矩陣;b.并行二維非負矩陣分解算法先對底層特征的圖像矩陣進行對角化處理,再對對角化矩陣進行矩陣行方向分解,然后再對原對角化矩陣進行轉置處理來得到列方向信息,對得到的基矩陣進行基矩陣正交化;c.模糊C均值聚類利用編程工具箱中的模糊C均值聚類方法來進行聚類。本發明的基于老齡用戶多方式隱式語義分析處理方法的有益效果是利用多方式隱式語義分析算法從底層特征-圖像矩陣構建、二維矩陣分解以及聚類算法三方面,能夠對提取的特征進行處理,此方法采集質量好和可靠性強,能夠滿足不同場合的實際要求。
下面結合附圖和實施例對本發明進一步說明。圖1是本發明的二維矩陣對角化(a)行組合(b)列組合的示意圖;圖2是本發明的FCM聚類示意圖。
具體實施例方式現在結合附圖對本發明作進一步詳細的說明。這些附圖均為簡化的示意圖,僅以示意方式說明本發明的基本結構,因此其僅顯示與本發明有關的構成。如圖1和圖2所示的基于老齡用戶多方式隱式語義分析處理方法,其具體步驟如下a.底層特征的圖像矩陣構建采用多種底層特征,構建每個用戶的底層特征-圖像矩陣(共q個生物特征融合),其具體步驟如下步驟1 對各生物特征的ROI圖像統一分塊成ρ個大小為nXn的小圖像,q個生物特征圖像共PXq個局部小圖像;步驟2 對每個局部小圖像分別進行包括不變矩特征(hu不變矩和zernike正交不變矩)、Garbor filter特征、方向均衡化特征、灰度信息熵特征等分析,并將這些特征作為每個用戶的底層特征-圖像矩陣的列向量;步驟3:將每個分塊后的局部小圖像(q個生物特征)作為每個用戶的底層特征-圖像矩陣的行向量,統計上一步得到的每個底層特征對其出現的概率,構建每個用戶的底層特征和圖像之間的特征-圖像矩陣,其大小為PXq ;b.并行二維非負矩陣分解算法首先,對底層特征-圖像矩陣進行對角化處理,然后,在對對角化矩陣進行矩陣行方向分解后,直接對原對角化矩陣進行轉置處理來得到列方向信息,最后,對得到的基矩陣進行基矩陣正交化如圖2所示的其主要步驟如下步驟1 矩陣對角化將大小為pXq的m個底層特征-圖像矩陣集合用Ipxtl= [S1, S2,...,Sm]來表示代表每個用戶的底層特征-圖像矩陣,m是用戶的數量。1)如果長度 P不大于寬度q,那么將矩陣進行行組合,并采用圖2 (a)的方式行組合圖像,并從圖像矩陣得到對角化矩陣\(陰影所示區域)。2)如果長度ρ大于寬度q,那么將矩陣進行列組合, 并采用圖2(b)的方式列組合圖像,并從組合后的圖像矩陣得到對角化矩陣An(陰影所示區域)。并且,得到對角化矩陣的大小將和原矩陣一樣,仍為PX q ;
步驟2 圖像矩陣行方向分解將大小為pXq的m個對角化矩陣集合用Xpxq = [A1, A2, ... , AJ來表示,An代表每個用戶對角化后的底層特征-圖像矩陣,m是用戶的數量,首先利用ID-NMF分解成為大小為pXd的矩陣L和一個大小為dXq的矩陣H之積,使得:XpXq ^ LpXdHdX(1。這里d是參考維數,L是矩陣X在圖像行方向分解得到的基矩陣,H為系數矩陣;步驟3 圖像矩陣列方向分解將大小為qXp的m個對角化矩陣集合用YqXp = [B1, B2, ... , BJ來表示,其中^ =4,是將原對角化矩陣進行轉置處理。類似上述算法, 利用ID-NMF找到一個大小為qXr的非負矩陣R和一個大小為r Xp的非負矩陣H,使得 Yqxp - RqXrHrXp。這里,r是參考維數,R是矩陣Y在圖像列方向上的分解得到的基矩陣,H 為系數矩陣;步驟4 矩陣X和Y分別是根據訓練樣本的原圖矩陣及其轉置圖矩陣構成的,因此對它們的分解可以同時進行。并且,對任意一個用戶的對角化底層特征-圖像矩陣An,它在行和列基矩陣上的系數Cn = LTAnR,大小為dXr,顯然,向量維數大大減小。利用行基L和列基R重構底層特征-圖像矩陣可以表示為:K ^ LCnRT,η = 1,2,. . . m,則二維基矩陣為E =L □ Rt ;步驟5 基矩陣正交化對并行2D-NMF方法得到的基矩陣E = L □ Rt中的L和 R矩陣分別正交化L' =Orth(L)和R' =orth(R)。這樣正交化后的二維基矩陣E'= L' □ (R' )τ構成了原始圖像矩陣An的一個隱式語義空間,每列向量對應子空間內的一項語義。將圖像投影到該語義空間內,即得到由語義特征組合的系數Cn所表示的圖像隱式語義特征;c.模糊C均值聚類利用編程工具箱中的模糊C均值聚類方法來進行聚類。以上述依據本發明的理想實施例為啟示,通過上述的說明內容,相關工作人員完全可以在不偏離本項發明技術思想的范圍內,進行多樣的變更以及修改。本項發明的技術性范圍并不局限于說明書上的內容,必須要根據權利要求范圍來確定其技術性范圍。
權利要求
1. 一種基于老齡用戶多方式隱式語義分析處理方法,其特征是其具體步驟如下a.底層特征的圖像矩陣構建采用多種底層特征,構建每個用戶的底層特征的圖像矩陣;b.并行二維非負矩陣分解算法先對底層特征的圖像矩陣進行對角化處理,再對對角化矩陣進行矩陣行方向分解,然后再對原對角化矩陣進行轉置處理來得到列方向信息,對得到的基矩陣進行基矩陣正交化;c.模糊C均值聚類利用編程工具箱中的模糊C均值聚類方法來進行聚類。
全文摘要
本發明涉及生物識別技術領域,尤其是基于老齡用戶多方式隱式語義分析處理方法,其具體步驟如下a.底層特征的圖像矩陣構建;b.并行二維非負矩陣分解算法;c.模糊C均值聚類。本發明的基于老齡用戶多方式隱式語義分析處理方法,利用多方式隱式語義分析算法從底層特征-圖像矩陣構建、二維矩陣分解以及聚類算法三方面,能夠對提取的特征進行處理,此方法采集質量好和可靠性強,能夠滿足不同場合的實際要求。
文檔編號G06T5/50GK102368334SQ20111026473
公開日2012年3月7日 申請日期2011年9月7日 優先權日2011年9月7日
發明者余人強, 劉華平, 吳軍, 吳智君 申請人:常州藍城信息科技有限公司