一種基于骨架的抗噪聲漢字特征提取方法
【專利摘要】本發明公開了一種基于骨架的抗噪聲漢字特征提取方法,對文本灰度圖像進行平滑、圖像去噪處理,并進行二值化。對二值化圖像進行下采樣,轉化為點云模型。在原二值化圖像上進行腐蝕操作得到粗中軸。基于該中軸進行PCA分析,得到分裂結果。對分裂結果進行合并,并對合并后點云類型進行后處理。對分類后的點云進行B樣條曲線擬合,得到骨架。將漢字圖像信息轉化為點云模型,降低了噪聲等因素對漢字骨架提取的影響;使用B樣條曲線擬合骨架,可以較好的保持原始漢字的特征;直接對原始漢字圖像進行處理,不需要進行歸一化預處理,降低了漢字骨架提取的難度,提高了效率。
【專利說明】一種基于骨架的抗噪聲漢字特征提取方法
【技術領域】
[0001] 本發明涉及圖像處理與模式識別【技術領域】,具體為一種魯棒的基于骨架的漢字特 征自動提取的方法。
【背景技術】
[0002] 漢字的識別是文字識別的一個領域。由于漢字字庫龐大,且漢字字形較多,無法像 英文等字母型文字一樣具有較簡單的識別算法,因此對漢字的識別一直是比較困難的應用 研究領域。漢字的識別一般分為印刷體漢字識別和手寫體漢字識別,對于印刷體的識別研 究較多,但是手寫體由于具有差異性,因此識別率較低。
[0003] 對于漢字的識別,特征提取是識別系統中最重要的環節之一。能夠提取不同形態、 不同風格情況下的良好的特征是當前漢字識別中的研究重點之一。傳統的研究范圍里,方 向特征被廣泛的用來提取漢字的特征,但是方向特征需要對漢字進行方向的規范化并建立 彈性網格,而且對不同形態的手寫漢字識別較為困難,單純的基于方向特征的漢字特征提 取無法滿足實際使用的需求。
[0004] 另一種特征提取的方向是基于漢字骨架的方法。漢字的骨架能夠較強的表征出 漢字的形狀拓撲結構,并且能夠較好的保持幾何性質,同時還能夠顯著的降低計算和匹配 字庫的難度。雖然漢字骨架的提取可以用來表現漢字特征,但是由于漢字尤其是手寫漢字 具有較強的差異性和低質性,因此對漢字的骨架進行較高質量的提取依然是當前的一個難 題。較多的方法將關注點放在漢字輪廓的提取和處理上,另外一些方法使用形態學中的腐 蝕法,不能較好的處理噪聲、稀疏、斷裂等低質量的漢字情形。
【發明內容】
[0005] 為解決現有技術存在的不足,本發明公開了一種基于骨架的抗噪聲漢字特征提取 方法,針對漢字尤其是低質漢字的差異性等特點,使用點云模型來覆蓋漢字,點云模型具有 稀疏性、不連通性,并且能夠較好的降低噪聲對特征骨架提取的影響。通過轉化為點云模型 進行骨架的提取,使用主成分分析法進行"分裂-合并"分類處理,最后使用最小平方距離 方法擬合曲線。降低了噪聲等因素對漢字骨架提取的影響,并合理的對漢字筆畫進行分類 和曲線擬合,最后得出較為光順的骨架特征。
[0006] 為實現上述目的,本發明的具體方案如下:
[0007] -種基于骨架的抗噪聲漢字特征提取方法,包括以下步驟:
[0008] 步驟一:將需要處理的文本的灰度圖像進行預處理,包括對灰度圖像進行平滑處 理,并將灰度圖像進行二值化處理;
[0009] 步驟二:對二值化處理后的灰度圖像進行下采樣,生成點云模型數據;
[0010] 步驟三:對二值化處理后的灰度圖像進行腐蝕操作得到粗中軸點集;
[0011] 步驟四:基于該中軸點集依據分裂條件進行PCA分析分裂,得到分裂結果;
[0012] 步驟五:對分裂結果進行合并,并對合并后交叉點處的點進行后處理;
[0013] 步驟六:對步驟五處理后的點云數據進行B樣條曲線擬合,得到作為漢字特征的 骨架。
[0014] 所述步驟一中具體包括:
[0015] 對掃描獲取到的文本的灰度圖像進行平滑處理,然后對平滑處理之后的圖像進行 二值化操作轉化為只有黑色和白色的二值圖像,其中白色像素為背景顏色,黑色像素為前 景漢字顏色,平滑處理的處理方法為使用OpenCV的cvSmooth方法對鄰域進行高斯平滑。 [0016] 所述步驟二中具體包括:
[0017] 對二值化處理后的圖像進行下采樣,采樣僅僅在黑色像素上進行,選取設定的采 樣比例將圖像轉化為點云模型數據,每一個被采樣的像素點的橫向和堅向坐標組成點云數 據的一個點坐標。
[0018] 所述步驟三中具體包括:
[0019] 使用腐蝕核對二值化處理后的灰度圖像的像素點進行腐蝕集合操作,直到達到終 止腐蝕的條件,得到最終的粗中軸點集;
[0020] 所述終止腐蝕的條件為:二值化處理后的圖像中當前點周圍有八個鄰接點,判斷 當前點的任意兩個鄰接黑色點互相之間是否連通,如果不連通,則表示是中軸點,否則不是 中軸點。
[0021] 所述步驟四中分裂條件為:
[0022] 利用對局部相鄰的兩個圓內的點云子集點進行PCA分析得到的兩個局部主方向 的夾角α來設置分裂條件。
[0023] 所述步驟四中PCA分析分裂,具體包括:
[0024] 從粗中軸點集中任意選取一個未處理的點,計算局部主方向(Main Local Direction,MLD),如果當前局部主方向Vi與下一點局部主方向Vj的處理結果為-1 (當Vi 與Vj的夾角大于θ (Θ為預先定義的轉折角度)),則是轉折點,否則不是,繼續沿中軸點搜 尋下一個PCA中心點進行處理,如果搜索不到中軸點,則當前點為轉折點,最后將任意一種 類型i的第一個PCA中心點和最后一個PCA中心點標記為起點x(i)和終點y (i),并把這 之間的點設為i類型,把這兩端點之間的PCA中心點Center (i)、半徑R(i)以及局部主方 向Vi記錄下來作合并以及擬合之用,然后從粗中軸點集中再任意選一個點進行PCA分析分 裂,直到所有的點都已經被處理完畢,經過有限次迭代,最終將粗中軸點集中所有點都處理 完畢,得到最終的分裂集合。
[0025] 所述步驟五具體包括:
[0026] 記PCA分析過程中的最大PCA半徑為MaxRadius,記某一分類i的端點x(i)和 y (i),兩端點對應的PCA半徑為Rx⑴和Ry (i),dist (X⑴,y (j))返回任意兩端點的距離, 合并操作只發生在任意分類的端點處,通過判斷端點處是否符合其中的任一合并條件,當 符合時,完成最后的合并操作。
[0027] 所述合并條件包括:
[0028] 條件一:對于分類i的兩個端點X (i)和y (i),如果dist (X⑴,y⑴)〈= Rx (i) +Ry (i),且分類i的全部PCA中心點只有兩端點,即中心點個數為2 (其他分類至少有 3個中心點),且有與兩特征圓相交的第二種分類j的端點x(j)或y (j),則分類i和分類j 符合合并條件;
[0029] 條件二:對于任意分類i和分類j,如果兩類中任意的兩端點,假設為分類i的x 端點和j類的y端點,滿足x(i)與y(j)的連線形成的向量Vij與端點X的向量Vx夾角 小于θ (Θ為預先定義的轉折角度)且分類i和分類j端點處的任意兩點存在最大步長 不大于RectSize/16(R ectSize為點云中距離最遠兩點的歐式距離)的最小生成樹,并且 (V(x(i)),V(y(j))的夾角屬于[0, Θ]或屬于[180- Θ,180],則表示分類i和分類j符合 合并條件,其中Θ為預先定義的轉折角度;
[0030] 條件三:于任意分類i和分類j,如果兩類中任意兩端點,假設為i類的X端點和j 類的y端點,dist (X⑴,y (j))〈 = Rx(i)+Ry (j),且兩個端點中y (j)不和自身X端點相交、 X (i)不和自身y端點相交,同時兩端點也不和第三種分類的PCA單位特征圓相交,且分類i 和分類j端點處的任意兩點存在最大步長不大于RectSize/16的最小生成樹,則分類i和 分類j符合合并條件。
[0031] 所述步驟六具體包括:
[0032] 采用最小平方擬合(SDM)方法,首先將PCA分析過程中產生的中心點集SeentOT(i) (該中心點集為PCA中心點周圍半徑覆蓋到的點云中的其他點)作為初始的B樣條控制點, 對控制點的數量以及位置進行調整,并用SDM方法迭代擬合B樣條曲線,最終得到的B樣條 曲線作為漢字的骨架特征。相對于其他迭代擬合B樣條曲線方法,SDM擁有更快的迭代速 度,更穩定的收斂性。利用該B樣條曲線作為最后的漢字骨架特征。
[0033] 對二值化處理后的灰度圖像進行腐蝕操作得到粗中軸點集;使用形態學二值圖像 的變換對二值圖像進行腐蝕操作是對像素點的集合操作。使用特定的腐蝕核(或稱為模 板)對像素點進行集合操作,就可以使邊界向內部收縮,通過有限次腐蝕操作,最終得到中 軸。腐蝕的集合定義如下所示:
【權利要求】
1. 一種基于骨架的抗噪聲漢字特征提取方法,包括以下步驟: 步驟一:將需要處理的文本的灰度圖像進行預處理,包括對灰度圖像進行平滑處理,并 將灰度圖像進行二值化處理; 步驟二:對二值化處理后的灰度圖像進行下采樣,生成點云模型數據; 步驟三:對二值化處理后的灰度圖像進行腐蝕操作得到粗中軸點集; 步驟四:基于該中軸點云依據分裂條件進行PCA分析分裂,得到分裂結果; 步驟五:對分裂結果進行合并,并對合并后交叉點處的點進行后處理; 步驟六:對步驟五處理后的點云進行B樣條曲線擬合,得到作為漢字特征的骨架。
2. 如權利要求1所述的一種基于骨架的抗噪聲漢字特征提取方法,其特征是,所述步 驟一中具體包括: 對掃描獲取到的文本的灰度圖像進行平滑處理,然后對平滑處理之后的圖像進行二值 化操作轉化為只有黑色和白色的二值圖像,其中白色像素為背景顏色,黑色像素為前景漢 字顏色,平滑處理的處理方法為使用OpenCV的cvSmooth方法對鄰域進行高斯平滑。
3. 如權利要求1所述的一種基于骨架的抗噪聲漢字特征提取方法,其特征是,所述步 驟二中具體包括: 對二值化處理后的圖像進行下采樣,采樣僅僅在黑色像素上進行,選取設定的采樣比 例將圖像轉化為點云模型數據,每一個被采樣的像素點的橫向和堅向坐標組成點云數據的 一個點坐標。
4. 如權利要求1所述的一種基于骨架的抗噪聲漢字特征提取方法,其特征是,所述步 驟三中具體包括: 使用腐蝕核對二值化處理后的灰度圖像的像素點云進行腐蝕集合操作,直到達到終止 腐蝕的條件,得到最終的粗中軸點集。
5. 如權利要求4所述的一種基于骨架的抗噪聲漢字特征提取方法,其特征是,所述終 止腐蝕的條件為:二值化處理后的圖像中當前點周圍有八個鄰接點,判斷當前點的任意兩 個鄰接黑色點互相之間是否連通,如果不連通,則表示是中軸點,否則不是中軸點。
6. 如權利要求1所述的一種基于骨架的抗噪聲漢字特征提取方法,其特征是,所述步 驟四中分裂條件為: 利用對局部相鄰的兩個圓內的點云進行PCA分析得到的兩個局部主方向的夾角α來 設置分裂條件。
7. 如權利要求1所述的一種基于骨架的抗噪聲漢字特征提取方法,其特征是,所述步 驟四中PCA分析分裂,具體包括: 從粗中軸點集中任意選取一個未處理的點,計算局部主方向,如果當前局部主方向Vi 與下一點局部主方向Vj的處理結果為-1,則是轉折點,否則不是,繼續沿中軸點搜尋下一 個PCA中心點進行處理,如果搜索不到中軸點,則當前點為轉折點,最后將任意一種類型i 的第一個PCA中心點和最后一個PCA中心點標記為起點X (i)和終點y (i),并把這之間的點 設為i類型,把這兩端點之間的PCA中心點Center (i)、半徑R(i)以及局部主方向Vi記錄 下來作合并以及擬合之用,然后從粗中軸點集中再任意選一個點進行PCA分析分裂,直到 所有的點都已經被處理完畢,經過有限次迭代,最終將粗中軸點集中所有點都處理完畢,得 到最終的分裂集合。
8. 如權利要求1所述的一種基于骨架的抗噪聲漢字特征提取方法,其特征是,所述步 驟五具體包括: 記PCA分析過程中的最大PCA半徑為MaxRadius,記某一分類i的端點X (i)和y (i),兩 端點對應的PCA半徑為Rx(i)和Ry(i),dist(X(i),y(j))返回任意兩端點的距離,合并操 作只發生在任意分類的端點處,通過判斷端點處是否符合其中的任一合并條件,當符合時, 完成最后的合并操作。
9. 如權利要求8所述的一種基于骨架的抗噪聲漢字特征提取方法,其特征是,所述合 并條件包括: 條件一:對于分類i的兩個端點x(i)和y (i),如果dist (x(i), y (i))〈 = Rx(i)+Ry (i), 且分類i的全部PCA中心點只有兩端點,即中心點個數為2,且有與兩特征圓相交的第二種 分類j的端點X (j)或y (j),則分類i和分類j符合合并條件; 條件二:對于任意分類i和分類j,如果兩類中任意的兩端點,假設為分類i的X端點 和j類的y端點,滿足x(i)與y(j)的連線形成的向量Vij與端點X的向量Vx夾角小于 θ (θ為預先定義的轉折角度)且分類i和分類j端點處的任意兩點存在最大步長不大于 RectSize/16的最小生成樹,并且(V(x(i)),V(y(j))的夾角屬于[0, Θ]或屬于[180 - Θ, 180],則表示分類i和分類j符合合并條件,其中Θ為前面定義的轉折角度; 條件三:于任意分類i和分類j,如果兩類中任意兩端點,假設為i類的X端點和j類的 y端點,dist(x⑴,y(j))〈 = Rx(i)+Ry(j),且兩個端點中y(j)不和自身X端點相交、x(i) 不和自身y端點相交,同時兩端點也不和第三種分類的PCA單位特征圓相交,且分類i和分 類j端點處的任意兩點存在最大步長不大于avgRectSize的最小生成樹,則分類i和分類 j符合合并條件。
10. 如權利要求1所述的一種基于骨架的抗噪聲漢字特征提取方法,其特征是,所述步 驟六具體包括: 采用最小平方距離擬合方法,首先將PCA分析過程中產生的中心點集SemtOT(i)作為初始 的B樣條控制點,對控制點的數量以及位置進行調整,并用SDM方法迭代擬合B樣條曲線, 最終得到的B樣條曲線作為漢字的骨架特征。
【文檔編號】G06K9/62GK104156730SQ201410360498
【公開日】2014年11月19日 申請日期:2014年7月25日 優先權日:2014年7月25日
【發明者】周元峰, 朱東方 申請人:山東大學