專利名稱:一種漢字圖片的部件識別方法
技術領域:
本發明屬于計算機虛擬現實技術領域,特別是漢字圖片的骨架提取、筆段生成的圖像處理領域以及基于語義知識的部件識別的模式識別領域。
背景技術:
作為表意文字的典型代表,中文書寫和語音文字書寫有較大的差別。象形文集結構研究表示,組成漢字的有著明確含義的各個部分被定義為部件,而漢字可以看成是由各個部件通過不同的組合方式組合而成。利用,像“桃”和“李”兩個字,他們之中都有一個“木”的部件,實際上代表著有樹的意思。因此,如何將一個漢字拆分成各個具有具體語義信息的部件的組合成為漢字學習中一個比較重要的部分。目前,漢字圖片的識別大致可以分為兩類,基于統計方法和基于結構方法兩種。基 于統計的方法傾向于利用圖片的圖像特征,如像素布局等,將漢字的識別轉換成目標圖片與標準庫圖片的相似度計算。而結構識別方法傾向于描述漢字的結構關系和漢字的筆畫特征,如利用筆畫間的夾角、相對位置關系來描述結構,最后通過總體結構的相似度計算完成識別。利用統計方法解決漢字識別問題,當前已經有了許多的研究工作。例如,k近鄰分類器、k均值聚類、高斯分布、非線性形狀模型以及上下文向量法。基于統計特征的方法是速度較快,且對噪聲的抵抗能力較強,但對于像“王”和“玉”這樣結構相近的兩個字容易造成識別上的錯誤。而結構方法傾向于將漢字分解為各個部分,通過對拆分出的部分的分析,進而得到識別的結果。可以用來表征漢字結構的常用的特征有輪廓、筆畫等。事實上,對于結構識別而言,其實質實際上就是一個筆畫匹配的過程。結構方法的特點就是可以區分細小的差另IJ,從而識別出結構相似的不同漢字,但識別速度會有所限制。
發明內容
本發明的技術解決問題克服現有技術的不足,提供一種漢字圖片的部件識別方法,能夠有效的提聞識別率。本發明技術解決方案一種漢字圖片的部件識別方法,實現步驟如下步驟(I)、漢字部件的筆畫與結構關系描述對已經有的標準的漢字514個部件圖片進行骨架提取處理,并檢測特征點,這里描述的特征點為筆畫的端點和筆畫之間的交叉點,這樣可以通過這些特征點之間的連線來檢測初始筆段;從一個特征點通過骨架上的其他點找到另外一個特征點的路徑,將這個路徑記錄稱之為初始筆段,所述特征點定義為交叉點或者是端點;然后通過人為的交互將所述初始筆段進行合并,得到標記好的漢字部件的筆畫;對得到的部件筆畫進行Gabor特征的提取,描述漢字部件筆畫的方向特征,將每一個筆畫描述為一個4維向量和一個4*4協方差矩陣的高斯分布,完成筆畫的統計建模;通過最大熵原理,鄰居筆畫的選取可以讓近似結構關系,即將部件中一個筆畫與其他所有筆畫的結構關系近似為相對于自己鄰居的結構關系,這里的結構關系可以用條件概率描述,即在某個筆畫鄰居被匹配后,該筆畫匹配時需要采用條件概率計算,所述鄰居筆畫是指除了本身以外,漢字部件中其他筆畫中對該筆畫影響值最大的一個筆畫,這個影響值通過兩個協方差矩陣的差的模取對數描述;然后提取互為鄰居的兩個筆畫局部特征,所述局部特征為兩個互為鄰居的筆畫的中心相對位置、長度比例和角度差,將這些計算好的局部特征的信息進行存儲,這里所做的部件筆畫標注和特征提取可以用來幫助識別輸入漢字中的部件;步驟(2)、部件候選筆畫生成對輸入的漢字圖片進行圖像細化和骨架提取之后,檢測細化和骨架提取之后的圖片中的端點和交叉點作為特征點,通過尋找特征點間通過骨架的連線來尋找初始筆段,檢測出初始筆段后,針對待匹配的部件的某個筆畫,概率組合這些初始筆段,形成可能匹配對應部件這個筆畫的一組筆畫,稱之為候選筆畫(由初始筆段針對待匹配部件的對應筆畫組合而成),之后便可以利用這些候選筆畫去和目標部件的合并好的筆畫進行匹配;步驟(3)、基于目標部件生成可能解重復的利用步驟2的方法,對步驟I中初始 筆段合并為筆畫做匹配,對于庫中每一個部件,都得到一個可能的部件匹配的解,即針對各個部件生成可能解,這個匹配過程描述為一個矩陣,每一列表示目標部件中的各個筆畫,某一列的每一行都存儲著依據步驟(2)中方法得到的目標部件筆畫的候選筆畫,整個匹配過程就是尋找一個從第一列找到最后一列,每一列都找到一個可行節點的解中相似度最大的值,從而將得到輸入漢字圖片,對于庫中所有部件生成的最可能匹配的結果;所述相似度描述為每一個筆畫匹配時的由高斯函數計算出的概率值的累積。利用上述的方法,對于輸入漢字的提取出的所有初始筆段,可以尋找到針對部件庫中每一個部件的最可能的匹配解,為后續的步驟4的算法提供數據;步驟(4)、基于部件最優組合原理得到識別結果在得到步驟3生成的針對各個部件的可能解之后,利用最優選取的策略,將部件識別的問題轉化為一個背包問題,即認為如果可以找到一組由步驟3中得到的各個部件的可能解,且互相之間沒有在初始筆段的占用上存在沖突,且最大程度的占用了初始筆段,這樣的一組部件解即為識別的最優解,輸入漢字的初始筆段相當于是一個背包,背包的大小為檢測出的初始筆段數目,而在步驟3中尋找部件匹配的可能的解時,標記該部件識別的可能解占用了哪些輸入漢字的初始筆段,這樣就可以完成整個識別的過程。進一步的,所述步驟(I)中對漢字部件的筆畫與結構關系描述的具體內容如下步驟(Al)、將部件圖片進行圖像細化和骨架提取,檢測特征點,如筆畫之間的交叉點和筆畫端點,通過尋找特征點之間的路徑提取出初始筆段。通過適當的人為交互,合并一些初始筆段,形成比較標準的筆畫。步驟(A2 )、對已經合并好的筆畫,對其進行Gabor濾波,得到每個點4個方向(0°,45°,90° ,135° )的響應值,這樣將每個筆畫描述為一個具有4維向量和4*4協方差矩陣的高斯函數。隨后利用最大熵的原理,計算每個筆畫的鄰居,這里的鄰居定義為除了自身其他筆畫對該筆畫影響最大的筆畫,影響值由兩個協方差矩陣的差的模取對數描述,隨后提取局部特征,將互為鄰居的筆畫的相對長度比例、中心相對位置等計算并存儲。進一步的,所述步驟(2)部件候選筆畫生成的步驟具體如下
步驟(BI)、將部件圖片進行圖像細化和骨架提取,檢測特征點,如筆畫之間的交叉點和筆畫端點,通過尋找特征點之間的路徑提取出初始筆段。步驟(B2)、對某個目標部件進行識別時,目的是要將對應的部件的各個筆畫得到,進而需要尋找的就是針對部件的每一個筆畫,都會自動生成一組可能的解,這些解有可能是初始筆段,也有可能是一些初始筆段的組合結果。所以定義組合規則為兩個筆段首尾相連且方向差不超過15°,或者其中一個筆段足夠短小,這樣就可以將兩個筆段合成作為可能的筆畫匹配解加入到候選筆畫隊列中。進一步的,所述步驟(3)中基于目標部件生成可能解的步驟如下
步驟(Cl)、構建搜索圖,這張圖的描述如下,每一列表示待匹配的部件的各個標注好的筆畫,而某一列中的每一行都表示著對于這個部件的筆畫的由輸入漢字的初始筆段生成的候選筆畫,這樣就將匹配問題轉化成了一個圖的搜索過程,目標變為要找一個每一列都找到一個點,從第一列找到最后一列的所有可行解中相似度最大的解。步驟(C2)、圖的搜索過程規則如下第一,在匹配某一個筆畫時,如果待匹配的候選筆畫在對輸入漢字的初始筆段占用上與前面已經選取的候選筆畫相沖突,那么該候選筆畫不能被選取。第二,在匹配某一個筆畫時,如果作為這個筆畫的鄰居的筆畫已經在前面的路徑中被選取了,那么要采用條件概率計算,并引入之前存儲的局部特征信息,計算這個待匹配的候選筆畫和前面已經匹配的候選筆畫的中心相對位置關系、筆畫長度比例等。進一步的,所述步驟(4)中基于部件最優組合原理得到識別結果的步驟如下步驟(D1)、利用步驟(3)中得到的對于各個部件生成的可能解,尋找最優的組合作為輸入漢字的部件識別結果。這里將問題描述為尋找一組最優的組合,使得組合中這些部件可能解在對輸入漢字的初始筆段的占用上不沖突,且最大程度上的消耗掉輸入漢字的初始筆段。定義這樣的組合為輸入漢字的最優的部件識別的結果。利用動態規劃思想,將上述問題轉化為一個背包問題,背包的容量為輸入漢字的初始筆段數目,每一個可能的部件識別解都有一個標記數組來標記這個可能解對輸入漢字的初始筆段的占用情況,這樣相當于選取不沖突的幾件物品放入背包中,使得背包盡可能的放滿。本發明與現有技術相比的優點在于(I)本發明考慮到在輸出漢字中識別部件是一個更趨向于局部識別的過程,加入條件概率的基礎上,加入局部特征描述,例如互為鄰居的兩個筆畫之間的中心相對位置、長度比例和角度差等,實驗證明,本發明中局部特征的加入可以有效的提高識別率。(2)本發明通過最優組合的策略選擇結果,是為了避免在識別過程中不同的部件閾值不好統一的問題,可以得到一個最優的部件識別結果,提高的識別的準確率。
圖I為本發明的一種漢字圖片的部件識別方法的整體過程示意圖;圖2為本發明的部件候選筆畫生成的結果圖;圖3為本發明的基于部件最優組合原理得到識別結果的示意圖;圖4為本發明的部分漢字部件識別的結果圖。
具體實施方式
下面結合附圖與實例對本發明作進一步詳細描述本發明實施過程包括四個主要步驟漢字部件的筆畫與結構關系描述,部件候選筆畫生成,基于目標部件生成可能解,基于部件最優組合原理得到識別結果。如圖I所示,本發明具體實現如下步驟一漢字部件的筆畫與結構關系描述利用統計結構建模方法,將部件和輸入漢字都表示成一組筆畫的集合。對于部件庫中的部件,將由圖像細化和筆畫提取后得到的細碎筆段進行人為的符合語義的合并,這樣做的目的一方面是為了符合漢字學筆畫的規范要求,另一方面在后續的匹配過程中會大幅度的減少搜索次數,提高識別的效率。這里認為組成部件和漢字的筆畫都服從一個4維的高斯分布,即X Ν( μ,Σ )。這個4維向量是由筆畫上的每一個點的4維向量值加權得至IJ,本發明采用Gabor濾波檢測每個點在4個方向上(0°,45° ,90°和135° )的響應值。在如此定義之后,可以看到對于一副輸入的漢字圖片S和一個待匹配的部件C,他們之間的相似度可以用公式(I)中表示的聯合概率進行計算,這里A和Si分別代表部件中的筆畫和輸入漢字中的筆畫。Pr (S = C)= Pr (S1 = T1, S2 = r2, . . . , sn = rn)(I)進而,公式(I)中的聯合概率分布可以通過條件概率計算,如公式(2)所示
權利要求
1.一種漢字圖片的部件識別方法,其特征在于該方法步驟如下 步驟(I)、對漢字部件中的筆畫和結構關系描述,標注構造統計結構模型所需要的信息; 步驟(2)、根據步驟(I)的漢字部件的標注結果,對輸入的漢字圖片中檢測出的筆段進行有選擇性的概率合并,生成可能匹配部件中標注筆畫的可能筆畫,稱為候選筆畫生成; 步驟(3)、根據步驟(2)中得到的可能匹配部件中標注好的筆畫的候選筆畫,尋找一組最優的候選筆畫,基于目標部件生成可能的解; 步驟(4)、根據步驟(3)中得到的針對各個目標部件的可能解,利用動態規劃思想,尋找可能部件的最優組合結果,作為漢字部件識別的結果。
2.根據權利要求I所述一種漢字圖片的部件識別方法,其特征在于所述步驟(I)中對漢字部件中的筆畫和結構關系描述的具體內容如下 步驟(Al)、對已經有的標準部件庫中的514個漢字部件圖片進行骨架提取處理,并檢測特征點,所述特征點為筆畫的端點和筆畫之間的交叉點;通過這些特征點之間的連線得到初始筆段,從一個特征點通過骨架上的其他點找到另外一個特征點的路徑,將這個路徑記錄稱之為初始筆段; 步驟(A2)、通過人為的交互將所述初始筆段進行合并,得到標記好的漢字部件的筆畫;對得到的漢字部件筆畫進行Gabor特征的提取,描述漢字部件筆畫的方向特征,將每一個筆畫描述為一個4維向量和一個4*4協方差矩陣的高斯分布,完成漢字部件筆畫的統計建模; 步驟(A3)、通過最大熵原理,利用近似結構關系進行鄰居筆畫的選取,近似結構關系即將漢字部件中一個筆畫與其他所有筆畫的結構關系近似為相對于自己鄰居的結構關系,結構關系采用條件概率描述,即在某個筆畫鄰居被匹配后,該筆畫匹配時需要采用條件概率計算,所述鄰居筆畫是指除了本身以外,漢字部件中其他筆畫中對該筆畫影響值最大的一個筆畫,這個影響值通過兩個協方差矩陣的差的模取對數描述; 步驟(A4)、計算互為鄰居的兩個鄰居筆畫局部特征,局部特征包括中心相對位置、長度比例和角度差,將這些計算好的局部特征的信息進行存儲,以用來幫助識別輸入的漢字部件。
3.根據權利要求I所述一種漢字圖片的部件識別方法,其特征在于所述步驟(2)部件候選筆畫生成的步驟具體如下 步驟(BI)、將輸入漢字圖片進行圖像細化和骨架提取,檢測特征點,如筆畫之間的交叉點和筆畫端點,通過尋找特征點之間的路徑提取出初始筆段; 步驟(B2)、對某個目標部件進行識別時,將對應的部件的各個筆畫得到,要計算的就是針對部件的每一個筆畫,都會生成一組可能的解,這些解有可能是初始筆段,也有可能是一些初始筆段的組合結果,定義組合規則為兩個筆段首尾相連且方向差不超過15°,或者其中一個筆段足夠短小,這樣就將兩個筆段合成作為可能的筆畫匹配解加入到候選筆畫隊列中。
4.根據權利要求I所述一種漢字圖片的部件識別方法,其特征在于所述步驟(3)中基于目標部件生成可能解的步驟如下 步驟(Cl)、構建搜索圖,這張圖的描述如下,每一列表示待匹配的部件的各個標注好的筆畫,而某一列中的每一行都表示著對于這個部件的筆畫的由輸入漢字的初始筆段生成的候選筆畫,這樣將匹配問題轉化成了一個圖的搜索過程,要找一個每一列都找到一個點,從第一列找到最后一列的所有可行解中相似度最大的解。
步驟(C2)、圖的搜索過程規則如下第一,在匹配某一個筆畫時,如果待匹配的候選筆畫在對輸入漢字的初始筆段占用上與前面已經選取的候選筆畫相沖突,那么該候選筆畫不能被選取;第二,在匹配某一個筆畫時,如果作為這個筆畫的鄰居的筆畫已經在前面的路徑中被選取了,則要采用條件概率計算,并引入之前存儲的局部特征信息,計算這個待匹配的候選筆畫和前面已經匹配的候選筆畫的中心相對位置關系、筆畫長度比例,并和存儲的局部特征信息相比較,描述局部特征的相似度。
5.根據權利要求I所述一種漢字圖片的部件識別方法,其特征在于所述步驟(4)中基于部件最優組合原理得到識別結果的步驟如下 步驟(D1)、利用步驟(3)中得到的對于各個漢字部件生成的可能解,尋找最優的組合作為輸入漢字部件識別結果;這樣將部件識別問題描述為尋找一組最優的組合,使得組合中這些部件可能解在對輸入漢字的初始筆段的占用上不沖突,且最大程度上的消耗掉輸入 漢字的初始筆段;定義這樣的組合為輸入漢字的最優的部件識別的結果;利用動態規劃思想,將上述問題轉化為一個背包問題,背包的容量為輸入漢字的初始筆段數目,每一個可能的部件識別解都有一個標記數組來標記這個可能解對輸入漢字的初始筆段的占用情況,這樣相當于選取不沖突的幾件物品放入背包中,使得背包盡可能的放滿。
全文摘要
一種漢字圖片的部件識別方法,屬于圖像處理與模式識別的領域,首先對特定字體的漢字部件圖片進行預處理,對其進行骨架提取之后,依據檢測出的端點和交叉點形成初始的筆段,人為交互的將某些筆段合并;其次,對標記好的筆段進行統計建模,利用4維向量描述筆段方向信息;然后根據最大生成樹原則構建筆段鄰居關系,完成部件建模過程。對于輸入漢字,首先,將其分解為各個筆段;隨后,對照庫中每個部件生成一組相似性最大的筆段集合;最后通過最優選取策略,即解決變種的背包問題得到最優解,得到輸入漢字的部件識別結果。本發明引入局部特征,并采取最優組合策略,形成一套完整的針對漢字圖片的部件識別方法,能夠有效的提高識別率。
文檔編號G06K9/62GK102968619SQ20121045493
公開日2013年3月13日 申請日期2012年11月13日 優先權日2012年11月13日
發明者梁曉輝, 于博文, 孫林嘉 申請人:北京航空航天大學