文字識別方法和裝置的制造方法
【技術領域】
[0001] 本申請涉及數據處理技術領域,尤其涉及一種文字識別方法和裝置。
【背景技術】
[0002] 文字識別領域中,文字的描述特征在很大程度上決定了識別的準確率和識別速 度。一般的文字識別中,基于二值圖像的文字識別方法受前期預處理的影響較大,適合拍照 質量很好的應用場合。但對于打印的小票或其他印刷品,常常存在打印字不清晰,或印墨不 均勻的情況,適合采用灰度圖像的識別方法。
[0003] 基于灰度圖像的識別方法中,主流的化g特征法適用于數字的識別,G油or特征法 適用于中文的識別。G油or特征識別法是通過不同尺度和方向的G油or核對圖像進行卷積 運算,然后抽取卷積圖像后的像素點作為文字的描述特征。該方法具有較高的識別率,但運 算量比較大,對識別速度有較大的影響。
【發明內容】
[0004] 本申請旨在至少在一定程度上解決相關技術中的技術問題之一。
[0005] 為此,本申請的一個目的在于提出一種文字識別方法,該方法可W準確高效地識 別圖像中的文字。
[0006] 本申請的另一個目的在于提出一種文字識別裝置。
[0007] 為達到上述目的,本申請實施例提出的文字識別方法,包括:根據預設的特征算 子,獲取待識別的圖像的特征向量,所述特征算子用于根據當前處理的像素點的不同方向 上的相鄰的局部像素點進行運算;將所述待識別的圖像的特征向量與預先獲取的文字樣本 的特征向量進行比對,獲取所述待識別的圖像的文字識別結果,其中,所述文字樣本的特征 向量是根據所述特征算子對所述文字樣本進行運算后得到的。
[0008] 本申請實施例提出的文字識別方法,通過根據預設的特征算子,獲取待識別的圖 像的特征向量并與預先獲取的文字樣本的特征向量進行比對,獲取待識別的圖像的文字識 別結果,由于特征向量是根據預設的特征算子對當前處理的像素點的不同方向上的相鄰的 局部像素點進行運算得到的,對文字的特征表述更加準確,提高了識別準確率,且計算簡 單,提高了識別速度。
[0009] 為達到上述目的,本申請實施例提出的文字識別裝置,包括:獲取模塊,用于根據 預設的特征算子,獲取待識別的圖像的特征向量,所述特征算子用于根據當前處理的像素 點的不同方向上的相鄰的局部像素點進行運算;識別模塊,用于將所述待識別的圖像的特 征向量與預先獲取的文字樣本的特征向量進行比對,獲取所述待識別的圖像的文字識別結 果,其中,所述文字樣本的特征向量是根據所述特征算子對所述文字樣本進行運算后得到 的。
[0010] 本申請實施例提出的文字識別裝置,通過根據預設的特征算子,獲取待識別的圖 像的特征向量并與預先獲取的文字樣本的特征向量進行比對,獲取待識別的圖像的文字識 別結果,由于特征向量是根據預設的特征算子對當前處理的像素點的不同方向上的相鄰的 局部像素點進行運算得到的,對文字的特征表述更加準確,提高了識別準確率,且計算簡 單,提高了識別速度。
[0011] 本申請附加的方面和優點將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本申請的實踐了解到。
【附圖說明】
[0012] 本申請上述的和/或附加的方面和優點從下面結合附圖對實施例的描述中將變 得明顯和容易理解,其中:
[0013] 圖1是本申請一個實施例提出的文字識別方法的流程示意圖;
[0014] 圖2是本申請一個實施例中的特征算子的示意圖;
[0015] 圖3是本申請一個實施例中的分別采用每種特征算子,對所述待識別的圖像進行 運算,得到與所述特征算子數量相同的至少一組的特征向量的流程示意圖;
[0016] 圖4是本申請一個實施例中采用特征算子a對待識別的圖像進行運算,得到第一 圖像和第二圖像的示意圖;
[0017] 圖5是本申請一個實施例中根據所述第一圖像得到第一組一維向量并根據所述 第二圖像得到第二組一維向量的示意圖;
[0018] 圖6是本申請另一實施例提出的文字識別方法的流程示意圖;
[0019] 圖7是本申請另一實施例的文字識別裝置的結構示意圖;
[0020] 圖8是本申請另一實施例的文字識別裝置的結構示意圖。
【具體實施方式】
[0021] 下面詳細描述本申請的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考 附圖描述的實施例是示例性的,僅用于解釋本申請,而不能理解為對本申請的限制。相反, 本申請的實施例包括落入所附加權利要求書的精神和內涵范圍內的所有變化、修改和等同 物。
[0022] 下面參考附圖描述根據本申請實施例的文字識別方法和裝置。
[0023] 圖1是本申請一實施例提出的文字識別方法的流程示意圖,該方法包括:
[0024] SlOl ;根據預設的特征算子,獲取待識別的圖像的特征向量,所述特征算子用于根 據當前處理的像素點的不同方向上的相鄰的局部像素點進行運算。
[00巧]其中,預設的特征算子包括至少一種。在本申請的一個實施例中,如圖2所示,特 征算子可W是如下算子中的至少一項:
[0026] 第一種特征算子(圖2中的算子a),所述第一種特征算子用于根據當前處理的像 素點的相鄰行的局部像素點進行運算;
[0027] 第二種特征算子(圖2中的算子b),所述第二種特征算子用于根據當前處理的像 素點的相鄰列的局部像素點進行運算;
[0028] 第H種特征算子(圖2中的算子C),所述第H種特征算子用于根據當前處理的像 素點的一種相鄰對角線的局部像素點進行運算;
[0029] 第四種特征算子(圖2中的算子d),所述第四種特征算子用于根據當前處理的像 素點的另一種相鄰對角線的局部像素點進行運算。
[0030] 具體地,可W分別采用每種特征算子,對所述待識別的圖像進行運算,得到與所述 特征算子數量相同的至少一組的特征向量,對所述至少一組的特征向量進行組合,獲取待 識別的圖像的特征向量。
[0031] 進一步地,參見圖3,分別采用每種特征算子,對所述待識別的圖像進行運算,得到 與所述特征算子數量相同的至少一組的特征向量,可W通過W下步驟實現:
[0032] S301 ;分別采用每種特征算子,對待識別的圖像進行運算,得到第一圖像和第二圖 像。
[0033] 下面將W算子a為例對至少一組的特征向量的計算方法進行說明。
[0034] 具體地,參見圖4,對于輸入的待識別的圖像Img,其經過算子a進行局部運算后會 得到兩張同樣大小的圖像ImgO和Imgl。對圖中的每個非邊緣像素點PO,可W采用如下方 式確定所述像素點對應的第一圖像和第二圖像中的像素點的值:
[0035] 獲取所述每種特征算子描述的方向上與所述像素點相鄰的第一組像素點的灰度 值和第二組像素點的灰度值;獲取所述第一組像素點的灰度值之和與所述第二組像素點的 灰度值之和之間的差值。具體地,在利用算子a進行計算時,則為計算PO上下相鄰行局部 像素點的灰度值之和的差值V ;v= (pl+p2+p3)-(p4+p5+p6);其中,局部像素點是指左右和 /或上下相鄰的像素點。送一步驟與現有的邊緣計算算子的方法相近,但在本方案中,為了 去除因光照或打印不均勻造成的局部差值波動較大、便于向量歸一化,還需要根據預先設 置的闊值和比較方向,對所述差值V進行二值化處理,得到第一圖像中的像素點的值,W及 第二圖像中的像素點的值: ,[I^V > B "[切< -6
[0036] 鐘二1。、交; 0,[0,!?>-5
[0037] 其中,PO'是第一圖像中的像素點的值,PO"是第二圖像中的像素點的值,V是差 值,5是預先設置的闊值。
[003引經過二值化處理后,PO'和PO"的輸出值變得比較穩定,受光照打印質量的影響很 小。5的取值,在具體實施例中可W取3*10,即默認像素間最小有10個灰度級的差別。
[0039] 上式中第一圖像與第二圖像中的差值V的比較方向不同,是由于圖像中的字,局 部存在從黑到白、從白到黑的跳變,通過送兩種不同的比較可W判斷跳變的方式,或者是平 坦的區域,從而達到對局部像素紋理較準確的表示。
[0040] S302;根據所述第一圖像得到第一組一維向量,根據所述第二圖像得到第二組一 維向量。
[0041] 通常在文字識別中,圖像大小為64*64或40*40,如果利用算子a計算后直接將 圖像ImgO、Imgl中的像素點的值排成一維向量,則特征向量的維數將很大(2*64*64