專利名稱:連筆手寫字符的識別方法
技術領域:
本發明涉及一種連筆手寫字符的識別方法。
背景技術:
隨著信息技術和計算機技術的日益普及,人類社會已進入信息時代,把各類載體上的原始信息轉化為計算機可處理和傳輸的電子比特信息已成為要解決的重要問題。光學字符識別(OCR)技術成為有效解決手工輸入文字信息的重要工具,在各領域被廣泛應用,并產生了巨大的社會效益和經濟效益。一個OCR識別系統,其目的很簡單,是要把影像作一個轉換,使影像內的圖形繼續保存,有表格則表格內資料及影像內的文字一律變成計算機文字,使能達到影像資料的儲存量減少、識別出的文字可再使用及分析,當然也可節省因鍵盤輸入的人力與時間。從影像到結果輸出,須經過影像輸入、影像前處理、文字特征抽取、比對識別、最后經人工校正將認錯的文字更正,將結果輸出。識別結果決定因素1.圖片的質量;2.顏色,一般對彩色識別很差,黑白的圖片較高;3.最重要的就是字體,如果是手寫體,那么識別率就很低。中國專利CN1652138A公開了一種基于脫機識別方法和聯機識別方法集成的手寫文字的識別方法,其脫機識別方法主要包括對漢字筆畫輪廓方向角特征的彈性網格特征提取技術以及線性判別分析(LDA)對高維特征降維;聯機識別方法主要包括對漢字筆畫方向特征進行模糊提取以及一種可變性較強的筆畫模板彈性匹配方法;本發明大大提高了對連筆草書漢字的識別效果,不僅能識別規范書寫的漢字,也能夠對連筆草書漢字進行識別,故而可以讓用戶無限制地自由書寫漢字,還可以提高手寫輸入時用戶書寫漢字的速度。中國專利101160592A公開了一種手寫字符識別方法,按每個筆畫用參數表現來捕獲輸入的手寫字符,并按每個筆畫進行折線近似,將該折線近似的各折線作為從始點起到終點的向量求出,將成為基準的軸與各折線所成的角度作為折線角序列求出,并求出所得到的折線角的頂點的外角序列,將外角序列的正或負的相同符號連續的同符號的外角之和作為渦旋夾角序列,分層且分割地提取該求出的各序列的全局特征、及根據渦旋夾角序列進行了分割的各曲線部分中的局部特征、次局部特征,通過將該提取結果與預先準備的識別對象字符的模板進行比較,進行字符識別。目前,OCR技術在手寫體自動識別能力上不斷提升,但大多數OCR是基于對單個字符的逐個識別,連筆手寫字符的切分是影響OCR系統識別的關鍵因素之一,它直接影響到識別的正確率。
發明內容
本發明所要解決的技術問題是提供一種對連筆手寫字符的正確切分率和識別率高的識別方法。本發明提供的技術方案是一種連筆手寫字符的識別方法,包括下述步驟(1)對輸入圖像進行降噪處理,消除數字噪聲;
(2)通過基于邊緣的字數估計算法計算字數;
(3)通過最小代價切分算法計算最佳字符分割方案;
(4)通過基于筆畫的筆跡跟蹤算法確定是否存在需要再切分的塊,如果存在需要再切分的塊,則返回步驟(2)重新計算、分割;如果不存在,則進行下一步驟;
(5)對分割后的字符圖像進行OCR識別,轉化為計算機文字。優選地,所述的步驟(I)包括將彩色圖像灰度化,再對灰度圖像二值化,然后對二值化圖像進行去孤立點操作,最后去除圖像四個邊緣的空白區域,留下中間包含黑色點部分的方塊區域。 優選地,所述步驟(I)中采用加權平均法進行彩色圖像灰度化,按下式對RGB三分 量進行加權平均得到灰度圖像
f(i, j)=0. 30R(i, j)+0. 50G(i, j)+0. 20B(i, j))(I)
設w為圖像的寬度像素數,h為圖像的高度像素數,整數i取值為I w,整數j取值為I h0優選地,所述步驟(I)中根據一個特定的閾值Cl,整數Cl取值為0 255,對每個點進行二值化;當某個點的灰度值大于Cl時,將該點設為白色,否則設為黑色。優選地,所述步驟(I)中采用八鄰域清除孤立點法去除孤立點在3*3的圖像塊中,如果當前處理像素f (i,j)為黑色,而其相鄰的像素f (i,j+l),f(i, j_l),f (i-1,j),f(i+1, j),f (i-1, j-1),f (i+1, j-1),f (i-1, j+1),f (i+1, j+1)均為白色時,當前處理像素f(i, j)設為白色。優選地,所述的步驟(2)按下述方法進行
按行掃描,記錄每一列的底部到這一列最近的黑點的高度,得到一個個數為w的數組Heights [w],w為圖片寬度像素數;
從左向右掃描數組Heights [w],計算得到底部峰谷趨勢數組HeightTendency [w]右邊高度大于當前點高度,標記為向上趨勢I ;右邊高度小于當前點高度,標記為向下趨勢-I ;否則標記為0 ;
然后從左到右掃描底部峰谷趨勢數組HeightTendency [w],得到字數估計趨勢數組HeightTendency中,當前點為向上趨勢I并且下一個點的值為0時,標記為一個底部切分點,底部切分點的數目即為字數估計值。優選地,所述的步驟(3)按下述方法進行
從底部的每個切分點,向上遍歷查找每兩個字符之間的最小f (x,y)路線 f (X,y) =a*p+b*c,其中,a=0. 45, b=0. 5 ;(2)
P為路徑代價,p=abs(x-OrigX) * d + y, OrigX表示底部切分點的橫坐標;x表示像素點橫坐標,I表示像素點縱坐標,X取值范圍為I w, y取值范圍為I Heights [OrigX];d = 3 ;
c = abs(x-0rigX2),當x < OrigX時,0rigX2表示當前切分點左邊最鄰近的底部切分點的橫坐標;當X > OrigX時,0rigX2表示當前切分點右邊最鄰近的底部切分點的橫坐標;當X = OrigX或者當前切分點為最左邊或最右邊切分點時,0rigX2=0o優選地,所述的步驟(4)按下述方法進行從左到右掃描橫向筆跡,并把橫向筆跡的縱向點也根據步驟(3)中的公式(2),加入到廣度優先搜索算法中進行最小代價切分的計算,根據計算結果來決定是否再分割。步驟(5)可采用本領域技術人員熟知的OCR認別方法。優選地,所述的步驟(5)中,對分割后的字符圖像采用通用的神經網絡識別算法進行識別。本發明采用基于邊緣的字數估計算法、最小代價切分算法和基于筆畫的筆跡跟蹤算法,連筆手寫字符圖像通過三個算法的循環處理,確定最佳切分方案,實現連筆字符的精準分割,從而提高了識別的正確率。
圖I是本發明連筆手寫字符的識別方法的流程圖。圖2是實施例中待識別的原始圖片。 圖3是實施例中灰度化和二值化后的圖片。圖4是實施例中去孤立點后的圖片。圖5是實施例中計算得到的底部高度曲線。圖6是實施例中底部切分點示意圖。圖7是實施例中最終確定分割方案后的字符圖。
具體實施例方式下面結合實施例和附圖對本發明做進一步的詳細描述,但是本發明的保護范圍并不限于此。參見圖1,一種連筆手寫字符的識別方法,包括下述步驟
(I)將彩色圖像灰度化,再對灰度圖像二值化,然后對二值化圖像進行去孤立點操作,最后去除圖像四個邊緣的空白區域,留下中間包含黑色點部分的方塊區域。圖2的原始圖片,經灰度化和二值化后得到圖3,再經去孤立點后得到圖4。所述步驟(I)中采用加權平均法進行彩色圖像灰度化,按下式對RGB三分量進行加權平均得到灰度圖像
f(i, j)=0. 30R(i, j)+0. 50G(i, j)+0. 20B(i, j))(I)
設w為圖像的寬度像素數,h為圖像的高度像素數,整數i取值為I w,整數j取值為I h0所述步驟(I)中根據一個特定的閾值Cl,整數Cl取值為0 255,如Cl設有150,對每個點進行二值化;當某個點的灰度值大于Cl時,將該點設為白色,否則設為黑色。所述步驟(I)中采用八鄰域清除孤立點法去除孤立點在3*3的圖像塊中,如果當前處理像素 f (i, j)為黑色,而其相鄰的像素 f (i, j+1),f (i, j-1),f (i-1, j),f (i+1, j),f (i-I, j-1), f (i+1, j-1), f (i-1, j+1), f (i+1, j+1)均為白色時,當前處理像素 f(i, j)設為白色。(2)按行掃描,記錄每一列的底部到這一列最近的黑點的高度,得到一個個數為w的數組Heights[w],w為圖片寬度像素數;該數組構成的底部高度曲線如圖5所示。從左向右掃描數組Heights [w],計算得到底部峰谷趨勢數組HeightTendency [w]右邊高度大于當前點高度,標記為向上趨勢I ;右邊高度小于當前點高度,標記為向下趨勢-I ;否則標記為O ;
然后從左到右掃描底部峰谷趨勢數組HeightTendency [w],得到字數估計趨勢數組HeightTendency中,當前點為向上趨勢I并且下一個點的值為O時,標記為一個底部切分點,底部切分點的數目即為字數估計值。經計算后的底部切分點示意圖如圖6所示。(3)從底部的每個切分點,向上遍歷查找每兩個字符之間的最小f (x,y)路線 f (X,y) =a*p+b*c,其中,a=0. 45, b=0. 5 ;(2)
P為路徑代價,p=abs(x-OrigX) * d + y, OrigX表示底部切分點的橫坐標;x表示像素點橫坐標,I表示像素點縱坐標,X取值范圍為I w, y取值范圍為I Heights [OrigX];d = 3 ;
c = abs(x-0rigX2),當x < OrigX時,0rigX2表示當前切分點左邊最鄰近的底部切分
點的橫坐標;當X > OrigX時,0rigX2表示當前切分點右邊最鄰近的底部切分點的橫坐標;當X = OrigX或者當前切分點為最左邊或最右邊切分點時,0rigX2=0o最終確定的字符分割方案如圖7所示。(4)從左到右掃描橫向筆跡,并把橫向筆跡的縱向點也根據步驟(3)中的公式
(2),加入到廣度優先搜索算法中進行最小代價切分的計算,根據計算結果來決定是否再分割;如果存在需要再切分的塊,則返回步驟(2)重新計算、分割;如果不存在,則進行下一步驟;
本實施例中提供的圖片經計算后不需要再分割,故直接進行下一步。(5)對分割后的字符圖像采用通用的神經網絡識別算法進行識別,轉化為計算機文字。
權利要求
1.一種連筆手寫字符的識別方法,其特征在于包括下述步驟 (1)對輸入圖像進行降噪處理,消除數字噪聲; (2)通過基于邊緣的字數估計算法計算字數; (3)通過最小代價切分算法計算最佳字符分割方案; (4)通過基于筆畫的筆跡跟蹤算法確定是否存在需要再切分的塊,如果存在需要再切分的塊,則返回步驟(2)重新計算、分割;如果不存在,則進行下一步驟; (5)對分割后的字符圖像進行OCR識別,轉化為計算機文字。
2.根據權利要求I所述的連筆手寫字符的識別方法,其特征在于所述的步驟(I)包括將彩色圖像灰度化,再對灰度圖像二值化,然后對二值化圖像進行去孤立點操作,最后去除圖像四個邊緣的空白區域,留下中間包含黑色點部分的方塊區域。
3.根據權利要求2所述的連筆手寫字符的識別方法,其特征在于所述步驟(I)中采用加權平均法進行彩色圖像灰度化,按下式對RGB三分量進行加權平均得到灰度圖像f(i, j)=0. 30R(i, j)+0. 50G(i, j)+0. 20B(i, j))(I) 設w為圖像的寬度像素數,h為圖像的高度像素數,整數i取值為I w,整數j取值為I h0
4.根據權利要求2所述的連筆手寫字符的識別方法,其特征在于所述步驟(I)中根據一個特定的閾值Cl,整數Cl取值為O 255,對每個點進行二值化;當某個點的灰度值大于Cl時,將該點設為白色,否則設為黑色。
5.根據權利要求2所述的連筆手寫字符的識別方法,其特征在于所述步驟(I)中采用八鄰域清除孤立點法去除孤立點在3*3的圖像塊中,如果當前處理像素f(i,j)為黑色,而其相鄰的像素 f (i, j+1),f (i, j-1),f (i-1, j),f (i+1, j),f (i_l,j_l),f (i+1, j_l),f (i_l,j+l),f(i+l,j+1)均為白色時,當前處理像素f(i,j)設為白色。
6.根據權利要求I所述的連筆手寫字符的識別方法,其特征在于所述的步驟(2)按下述方法進行 按行掃描,記錄每一列的底部到這一列最近的黑點的高度,得到一個個數為w的數組Heights [w],w為圖片寬度像素數; 從左向右掃描數組Heights[w],計算得到底部峰谷趨勢數組HeightTendency[w]右邊高度大于當前點高度,標記為向上趨勢I ;右邊高度小于當前點高度,標記為向下趨勢-I ;否則標記為O ; 然后從左到右掃描底部峰谷趨勢數組HeightTendency [w],得到字數估計趨勢數組HeightTendency中,當前點為向上趨勢I并且下一個點的值為O時,標記為一個底部切分點,底部切分點的數目即為字數估計值。
7.根據權利要求I所述的連筆手寫字符的識別方法,其特征在于所述的步驟(3)按下述方法進行 從底部的每個切分點,向上遍歷查找每兩個字符之間的最小f (X,y)路線f (X,y) =a*p+b*c,其中,a=0. 45, b=0. 5 ;(2) P為路徑代價,p=abs(x-OrigX) * d + y, OrigX表示底部切分點的橫坐標;x表示像素點橫坐標,I表示像素點縱坐標,X取值范圍為I w, y取值范圍為I Heights [OrigX];d = 3 ;C = abs (x-0rigX2),當x < OrigX時,0rigX2表示當前切分點左邊最鄰近的底部切分點的橫坐標;當X > OrigX時,0rigX2表示當前切分點右邊最鄰近的底部切分點的橫坐標;當X = OrigX或者當前切分點為最左邊或最右邊切分點時,0rigX2=0o
8.根據權利要求7所述的連筆手寫字符的識別方法,其特征在于所述的步驟(4)按下述方法進行從左到右掃描橫向筆跡,并把橫向筆跡的縱向點也根據步驟(3)中的公式(2),加入到廣度優先搜索算法中進行最小代價切分的計算,根據計算結果來決定是否再分割。
9.根據權利要求I所述的連筆手寫字符的識別方法,其特征在于所述的步驟(5)中,對分割后的字符圖像采用通用的神經網絡識別算法進行識別。
全文摘要
本發明涉及一種連筆手寫字符的識別方法,包括下述步驟(1)對輸入圖像進行降噪處理,消除數字噪聲;(2)通過基于邊緣的字數估計算法計算字數;(3)通過最小代價切分算法計算最佳字符分割方案;(4)通過基于筆畫的筆跡跟蹤算法確定是否存在需要再切分的塊,如果存在需要再切分的塊,則返回步驟(2)重新計算、分割;如果不存在,則進行下一步驟;(5)對分割后的字符圖像進行OCR識別,轉化為計算機文字。本發明采用基于邊緣的字數估計算法、最小代價切分算法和基于筆畫的筆跡跟蹤算法,連筆手寫字符圖像通過三個算法的循環處理,確定最佳切分方案,實現連筆字符的精準分割,從而提高了識別的正確率。
文檔編號G06K9/20GK102663378SQ20121007695
公開日2012年9月12日 申請日期2012年3月22日 優先權日2012年3月22日
發明者區嘉亮, 蔣樹峰, 金炎軍 申請人:杭州新銳信息技術有限公司