一種基于魯棒度量的手寫體識別方法與系統的制作方法
【技術領域】
[0001] 本發明涉及計算機視覺和圖像識別技術領域,特別是涉及一種基于魯棒度量的手 寫體體識別方法與系統。
【背景技術】
[0002] 如今是一個信息爆炸的時代,在我們日常生活中存在大量的、有價值的多媒體高 維信息。離線手寫體識別即是對其中某種高維信息進行特征提取并利用的一個實例。它通 過計算機將紙質圖像電子化,得到計算機存儲的字符圖像,之后通過一系列機器學習的方 法提取圖像特征、分類等操作最終識別字符。一旦得出高效準確識別字符的方法,可應用到 辦公自動化、機器翻譯等領域,即可帶來巨大的社會和經濟效益。但是由于有效地抽取手寫 體圖像特征的過程具有一定難度,導致到目前為止,離線手寫體(本發明中簡稱手寫體)字 符識別距離實用要求還有一定距離。目前的大部分研宄工作都集中在處理手寫體圖像特征 提取問題,且也已取得一定的成果。但是從真實世界中采集的手寫體圖像通常存在包含噪 聲、異類數據或數據缺失等問題,手寫體圖像存在因書寫習慣等原因造成的不規范筆劃等 問題,因此需要更魯棒的算法來進行特征提取。
[0003] 近年來,一些基于1-范數的魯棒模型被提出,例如基于1-范數的主成分分析算法 (PCA-L1)、基于1-范數的判別性局部保持投影算法(DLPP-L1)等。這些魯棒算法提出的思 想是:傳統的基于2-范數距離度量的算法對于數據中的噪聲或異類數據比較敏感,而基于 1-范數的距離度量則能克服這個缺點,提升模型的魯棒性。這些算法確實使得結果更加魯 棒,但由于目前只存在無監督與全監督的算法,無法充分利用有標簽數據和無標簽數據信 息,因此結果的準確度還有很大的提升空間。另外,算法中的一些經驗參數也非常難以最優 確定。
[0004] 因此,提供一種基于魯棒度量的手寫體識別方法及系統,實現手寫體字符圖像特 征的魯棒提取,同時提高手寫體字符圖像表征能力與識別的準確度,是本領域技術人員亟 待解決的問題。
【發明內容】
[0005] 有鑒于此,本發明提供了一種基于魯棒度量的手寫體識別方法與系統,實現手寫 體字符圖像特征的魯棒提取,同時提高手寫體字符圖像表征能力與識別的準確度,以克服 現有技術中僅使用有標簽或無標簽數據,而沒有充分考慮現實中數據信息的特點。
[0006] 為解決上述技術問題,本發明提供一種基于魯棒度量的手寫體識別方法,基于有 標簽數據的判別性與所有樣本局部保持的1-范數投影的思想,該方法包括:
[0007] 對手寫體訓練樣本進行相似性學習,構造加權相似圖,在緊湊局部類內散度和分 離局部類間散度的同時保持所有訓練樣本的局部特性;構建基于1-范數度量的魯棒半監 督手寫體字符圖像特征學習模型,所述模型優化輸出一個可用于樣本內和樣本外圖像特征 提取的投影矩陣P;同時,通過建立比率模型,減少模型參數,且優化輸出的投影矩陣P滿足 正交特性;
[0008] 利用所述投影矩陣P對手寫體測試樣本進行特征提取,樣本外圖像的歸納主要通 過將所述測試樣本向投影矩陣P進行映射;
[0009] 利用標簽傳播分類器,對降維后的測試樣本特征完成測試,輸出所述測試樣本的 類別軟標簽,取對應所述類別軟標簽中概率的最大值的位置,用于判定所述測試樣本的類 另IJ,得到字符識別結果;
[0010] 其中,所述類別軟標簽中的數值代表所述測試樣本屬于各個類別的概率。
[0011] 上述方法中,可選的,所述構建基于1-范數度量的魯棒半監督手寫體字符圖像特 征學習模型,所述模型優化輸出一個可用于樣本內和樣本外圖像特征提取的投影矩陣P,包 括:
[0012] 給定的一個存在噪聲的原始訓練樣本集X= [xpx2,…,其中,n是訓練 樣本集的維度,N是訓練樣本集的數量,訓練樣本集中包含有類別標簽(共c個類別,c>2) 的樣本集x£ =[Xl,X2,...,X/]eirx/和無任何標簽的樣本集=[x/+1,x/+2,…,X/+I,]eirxis且滿 足樣本數量1+11 = 1設¥ = [);1,3;2,...,3;/]£? 1>^為1個有標簽樣本的標簽,且樣本\的標簽 為y"i彡1);
[0013] 根據所述原始訓練樣本集計算得到一個具有判別性特征與局部保持特征的投影 矩陣:PeirxdW?n),包括通過解決以下優化方程輸出得到可提取樣本外手寫體字符圖像 特征的投影矩陣P:
[0014]
[0015]其中,|卜||1為1-范數,定義為||3||1=乙。炚」,5^表示3矩陣的第(1,」) 號元素,你~和W為權重系數矩陣。
[0016] 上述方法中,可選的,所述利用所述投影矩陣P對手寫體測試樣本圖像進行特征 提取,樣本外圖像的歸納主要通過將所述測試樣本圖像向投影矩陣P進行映射,包括:
[0017] 使用所述投影矩陣P對訓練樣本和測試樣本進行投影,完成手寫體字符圖像特征 提取。
[0018] 本發明還提供了一種基于魯棒度量的手寫體識別系統,包括:
[0019] 訓練模塊,用于對手寫體訓練樣本進行相似性學習,構造得到加權相似圖,在緊湊 局部類內散度和分離局部類間散度的同時保持所有訓練樣本的局部特性;構建基于1-范 數度量的魯棒半監督手寫體字符圖像特征學習模型,所述模型優化輸出一個可用于樣本內 和樣本外圖像特征提取的投影矩陣P;同時,通過建立比率模型,減少模型參數,且優化輸 出的投影矩陣P滿足正交特性;
[0020] 測試預處理模塊,用于利用所述投影矩陣P對手寫體測試樣本進行特征提取,樣 本外圖像的歸納主要通過將所述測試樣本向投影矩陣P進行映射;
[0021] 測試模塊,用于利用標簽傳播分類器,對降維后的測試樣本特征完成測試,輸出所 述測試樣本的類別軟標簽,取對應所述類別軟標簽中概率的最大值的位置,用于判定所述 測試樣本的類別,得到字符識別結果;
[0022] 其中,所述類別軟標簽中的數值代表所述測試樣本屬于各個類別的概率。
[0023] 經由上述的技術方案可知,與現有技術相比,本發明公開了一種基于魯棒度量的 手寫體識別方法與系統,通過對手寫體訓練樣本進行相似性學習,構造得到加權相似圖,在 緊湊局部類內散度和分離局部類間散度的同時保持所有訓練樣本的局部特性;為了提升手 寫體描述的魯棒性,構建基于1-范數度量的魯棒半監督手寫體字符圖像特征學習模型,所 述模型優化輸出一個可用于樣本內和樣本外圖像特征提取的投影矩陣P;樣本外圖像的歸 納通過將測試樣本向投影矩陣P進行投影,進而將提取的特征輸入高效的標簽傳播分類器 進行歸類,取對應類別軟標簽中概率的最大值的位置,用于判定測試樣本的類別,得到最準 確的字符識別結果。同時,通過建立比率模型,減少了模型參數,且投影矩陣P滿足正交特 性。
【附圖說明】
[0024] 為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現 有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發明的實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據 提供的附圖獲得其他的附圖。
[0025] 圖1為本發明實施例提供的一種基于魯棒度量的手寫體識別方法的流程圖;
[0026] 圖2為本發明實施例提供的一種基于魯棒度量的手寫體識別系統的結構框圖示 意圖;
[0027] 圖3為本發明實施例提供的一種基于魯棒度量的手寫體識別方法的識別示意圖。
【具體實施方式】
[0028] 下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基于 本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他 實施例,都屬于本發明保護的范圍。
[0029] 本發明的核心是提供一種基于魯棒度量的手寫體識別方法與系統,實現手寫體字 符圖像特征的魯棒提取,同時提高手寫體字符圖像表征能力與識別的準確度,以克服現有 技術中僅使用有標簽或無標簽數據,而沒有充分考慮現實中數據信息的特點。
[0030] 本發明公開了一種基于魯棒度量的手寫體識別方法與系統,通過對手寫體訓練樣 本進行相似性學習,構造得到加權相似圖,在緊湊局部類內散度和分離局部類間散度的同 時保持所有訓練樣本的局部特性;為了提升手寫體描述的魯棒性,構建基于1-范數度量的 魯棒半監督手寫體字符圖像特征學習模型,所述模型優化輸出一個可用于樣本內和樣本外 圖像特征提取的投影矩陣P;樣本外圖像的歸納通過將測試樣本向投影矩陣P進行投影,進 而將提取的特征輸入高效的標簽傳播分類器進行歸類,取對應類別軟標簽中概率的最大值 的位置,用于判