專利名稱:文字辨識方法
技術領域:
本發明是有關于一種文字辨識方法,且特別是有關于一種利用印刷線將 文字分群辨識的方法。
背景技術:
在資訊爆炸的時代, 一般人時常會需要閱讀大量的書籍或報章雜志,若 看到值得保存的文章段落或是重點時,通常是采用影印或剪輯的方式存檔 或是直接用筆標記。而對于文字工作者來說,在閱讀完一篇文章后,若需
要使用里面的資料,就必需借由重新鍵入(Key-in)的方式輸入到電腦中,才 能夠對此資料進行編輯或存檔的動作,不僅費力且耗時。
為了解決這個問題,目前有業者研發了光學辨識技術,使用者只需借 由一般的掃描器設備,將所欲保存的文件掃描成圖檔,再利用文字辨識的 軟件,將此圖檔中的文字部份擷取出來,并轉換成對應的數字字元,借以 提供使用者迅速取得文件的電子檔,方便地編輯或處理文件。目前的光學 辨識技術所運用的領域十分廣泛,舉凡圖書館文獻資料存檔、企業內部文 件管理,甚至證照、票據的辨識,都可利用此光學辨識技術輕易達成,不 僅能精準地辨識資料,更能夠省下大量資料比對與查核的人力與時間。
光學文字辨識通常簡稱為OCR (Optical Character Recognition),其主 要用途是針對既有的書面文件進行文字識別的動作。首先文件需先通過平 臺型或掌上型掃描器,將^&夂辨識的文件先行掃描成圖檔。由于在掃描文件 時可能會因為文件本身不千凈、字元模糊,或是掃描器解析度的問題,使 得輸入的影像可能存在著一些雜訊,這些雜訊都會影響到后續文字辨識的準 確率。因此,光學文字辨識軟件會先針對掃描的文件圖檔進行傾斜校正、雜 訊移除、影像邊緣銳利化等處理。接著,光學文字辨識軟件會對處理后的 圖檔進行圖文分離的動作,將文件中所有的文字、圖形和表格分離,并且 針對部份文字筆劃不連接的情形,正確地切割或合并文字。然后,光學文
字辨識軟件將進行文件辨識的動作,利用將文字圖像拿來與文字資料庫比 對,并同時通過中文校正的功能,進行詞庫、前后文相關字詞的確認后,最 后輸出精準的辨識結果。而辨識出來的文字可直接存成Word、 PDF、純文 字等格式的檔案,如此不但可減輕資料輸入的負擔,同時也可增加資料輸 入的速度及正確性。
然而,在上述辨識文字的過程中,必須逐一將文件中的每個字元與文字資料庫中的所有字元進行比對,此舉將會耗費大量的運算資源,且增加文 字辨識的處理時間。此外,上述這種無差別式的比對方式,極有可能因為 雜訊的千擾而造成文字的誤判,并無法針對各個文字之間或文字與印刷線 之間的相對位置,有效地改善文字的辨識率及辨識速度。
發明內容
本發明提供一種文字辨識方法,借由印刷文字與印刷線之間的相對位 置將印刷文字分類,而僅取文字資料庫中對應字元類別的字元與此印刷文 字進行比對,因此能夠提高文字辨識的正確率及速度。
本發明提出一種文字辨識方法,包括下列步驟:a.掃描一行印刷文字,其 中此行印刷文宇包括多個第一字元;b.利用這些第一字元,產生多條印刷 線;c.依據各個第一字元在這些印刷線中的一相對位置,判斷各個第一字元 所屬的字元類別;以及d.將各個第一字元與一資料庫中屬于此字元類別的 多個第二字元比對,找出各個第一字元所對應的第二字元,而辨識出第一 字元,其中此資料庫包括記錄多種字元類別及各種字元類別所屬的第二字 元。
在本發明的一實施例中,上述的印刷線包括頂線(top line)、上層線 (upper line )、基線(base line )及底線(bottom line ),而頂線與上層線之間 為上層區(upper zone )、上層線與基線之間為中間區(central zone )、基線 及底線之間為下層區(downer zone )。
在本發明的一實施例中,上述的步驟c.包括cl.判斷各個第一字元是 否屬于小字元;c2.若屬于小字元,則進行小字元分類;c3.若不屬于小字元,則 進行非小字元分類。
在本發明的一實施例中,上述的步驟cl.包括cl-l.分別計算各個第一 字元的字元高度;cl-2.將各個第一字元的字元高度與一預設高度值比較,而 將字元高度小于此預設高度值的第一字元歸類為小字元。
在本發明的一實施例中,其中在步驟cl-2.之后更包括cl-3.分別擷取 剩余的各個第一字元中心的中心參考點;cl-4.利用最小平方法,求取這些 中心參考點所趨近的一條中心線;cl-5.判斷各個第一字元的下緣是否位于 此中心線的上方,而將下緣位于中心線的上方的第一字元歸類為小字元;以 及cl-6.判斷各個第一字元的上緣是否位于中心線的下方,而將上緣位于中 心線的下方的第一字元歸類為小字元。
在本發明的一實施例中,上述的步驟c.更包括依據所產生的印刷線的 數目及種類,將這些印刷線歸類為多個狀態其中之一,而這些狀態包括第 一狀態、第二狀態、第三狀態及第四狀態。其中,第一狀態代表這些印刷 線包括上述的頂線、上層線、基線及底線。第二狀態代表這些印刷線包括上述的基線、底線,以及由頂線與上層線合并的印刷線。第三狀態代表這 些印刷線包括上述的頂線、上層線,以及由基線與底線合并的印刷線。而 第四狀態則代表這些印刷線包括由頂線及上層線合并的印刷線,以及由基 線與底線合并的印刷線。
在本發明的一實施例中,上述的步驟d.包括dl.計算各個第一字元的 第一特征值;以及d2.針對各個第一字元,將其第一特征值與前述資料庫中 屬于其字元類別的各個第二字元的第二特征值比較,找出特征值最相近的 第二字元做為此第一字元的辨識字元。此外,更包括使用各個第一字元所 對應的預測模型,來辨識第一字元。
本發明因采用將印刷文字分群比對的結構,利用印刷文字位于印刷線 上的相對位置資訊,將印刷文字分類,同時也在進行文字辨識時,僅取文 字資料庫中對應其字元類別的字元來進行比對,因此可減少文字比對的范 圍及數目,而能夠提高文字辨識的正確率及速度。
為讓本發明的上述特征和優點能更明顯易懂,下文特舉較佳實施例,并 配合所附圖式,作詳細說明如下。
圖1是依照本發明較佳實施例所繪示的印刷線示意圖。 圖2是依照本發明較佳實施例所繪示的文字辨識方法的流程圖。 圖3是依照本發明較佳實施例所繪示的字元分類圖。 圖4是依照本發明較佳實施例所繪示的特征值計算方法的流程圖。 圖5則是依照本發明較佳實施例所繪示的特征值計算方法的一范例。 圖6是依照本發明較佳實施例所繪示的小字元判斷方法流程圖。 圖7A及圖7B是依照本發明較佳實施例所繪示的小字元分類方法的流 程圖。
圖8是依照本發明較佳實施例所繪示的非小字元分類方法的流程圖。 S201 S204:本發明較佳實施例的文字辨識方法的各步驟 S401 S406:本發明較佳實施例的特征值計算方法的各步驟 S601 S607:本發明較佳實施例的小字元判斷方法的各步驟 S701 S720:本發明較佳實施例的小字元分類方法的各步驟 S801 S811:本發明較佳實施例的非小字元分類方法的各步驟
具體實施例方式
通常在撰寫英文語系的文字時,依照其字型的特性,都會依循著一定 的軌跡調整或排列書寫文字的大小及位置,這些隱藏的"參考線"就類似 當初在學習書寫這些文字時,寫字本上所打印的四條直線,使用者只要依照這些直線書寫文字,就能夠寫出整齊、清楚的文章。同樣地,這些英文 語系的文字在打印時也會遵循著這些參考線,這些參考線也就是本文所謂 的印刷線。
圖l是依照本發明較佳實施例所繪示的印刷線示意圖。請參照圖1,本
實施例是依照印刷文字"typeface analysis"中各個印刷字元的字型,定義出 四條印刷線,這些印刷線依其所在位置可區分為頂線(top line)、上層線 (upper line )、基線(base line )及底線(bottom line ),而這些印刷線之間的 區域則可分為上層區(upper zone )、中間區(central zone )及下層區(lower zone)。值得注意的是,圖1中每個印刷字元都可視為是由多個互相連接的 區塊(connect-component, CC )所構成,而這些連接在一起的區塊則稱為 CC群。
由上述可知,依照英文語系文字的特性,其印刷時的位置均會落在這 四條印刷線之間,且不同特性的字元(例如小寫字母、大寫字母、上標字 元、下標字元)也會占據這些印刷線之間的不同區域。本發明即利用此特 點,將文字資料庫中的所有的字元分門別類,而在實際進行文字辨識時,先 找出所欲辨識文字的字元類別,再取文字資料庫中對應的此字元類別的字 元來做比對,而能夠得到較準確的比對結果。為了使本發明的內容更為明 了 ,以下特舉實施例作為本發明確實能夠據以實施的范例。
圖2是依照本發明較佳實施例所繪示的文字辨識方法的流程圖。請參 照圖2,本實施例是用以辨識一行印刷文字,借由將此行印刷文字中的每個 印刷字元與資料庫中某一字元類別的字元進行比對,而辨識出各個印刷字 元。
首先,掃描此行印刷文字,其中此行印刷文字中包括多個第一字元(步驟 S201 )。此處所指的印刷文字可以是自 一份文件中擷取的任何一行文字,本發 明并不限定其范圍,以下僅就單一行印刷文字的辨識進行說明。
接著即可利用這些第一字元,產生多條印刷線(步驟S202),所產生的 印刷線的種類如圖1所示,包括頂線、上層線、基線及底線,而這些印刷 線之間的區域則可分為上層區、中間區及下層區。然而,隨著印刷字元種 類的不同,也有可能會產生二至四條不等的印刷線。
然后,依據各個第一字元在印刷線中的相對位置,判斷各個第一字元所 屬的字元類別(步驟S203 )。舉例來說,圖3是依照本發明較佳實施例所繪 示的字元分類圖。請參照圖3,本實施例是將資料庫中的英文字元依其在印 刷線中所占的區域位置分為八類。其中,第一分類(FULL)占了上層區、中 間區及下層區。第二分類(HIGH)占了上層區及中間區。第三分類(DEEP) 占了下層區。第四分類(SHORT)占了中間區。第五分類(SUPER)為小 字元,且位于中心線附近。第六分類(SUBSCRIPT)占了中心線與上層線之間。第七分類(CENTER)占了中心線與基線之間。第八分類(UNKNOWN) 為剩余無法按照印刷線分類者。當然,在本發明的其它實施例中,也可以 將英文字元分類成其它不同種類,而不限制其范圍。
在決定了各個第一字元的字元類別后,即可將這些第一字元分別與資 料庫中字元類別相同的第二字元進行比對,找出各個第 一字元所對應的第 二字元,而辨識出這些第一字元(步驟S204)。舉例來說,若欲辨識印刷字 元"N",則可將其歸類為圖3中的第二類。而實際在進行文字辨識時,也 是只取第二類所包含的字集,逐一與印刷字元"N"進行比對。據此,即可 大幅減少所需比對的字元數目,同時也因為在同一個字元類別中,每一個 字元在印刷線中的相對位置均相同或相似,因此也較不會有辨識錯誤的情 況發生,而能夠提高辨識率。
值得一提的是,上述辨識第一字元的方式例如是先計算第一字元的第 一特征值,再將此第一特征值與資料庫中同一個字元類別中的第二字元的 第二特征值比較,而找出特征值最相近的第二字元做為第一字元的辨識字 元。
舉例來說,圖4是依照本發明較佳實施例所繪示的特征值計算方法的 流程圖,圖5則是依照本發明較佳實施例所繪示的特征值計算方法的一范 例。請參照圖4,本實施例是將一個字元(或者說是一個CC群)分成數個 等份,并計算各個部份所涵括的區塊(CC)個數,而求得一個能夠代表此 字元的特征值矩陣。
首先,找出一條通過此字元中心參考點的中央垂直線,并計算位于此 中央垂直線上1/3及2/3位置的參考點(如圖5所示的A點及B點)的座 標(步驟S401 )。接著則取一個參考半徑(步驟S402 ),此參考半徑R例如
是此字元對角線長度的一半,即^ =在2+『2/2,其中L為字元長度、『 為字元寬度。
此時若以A點為圓心,R為半徑畫圓,并將360度劃分為18個方向, 則這18個方向及此圓的圓周將會把字元切分為36個區域。因此,下一步 則是分別計算這36個區域所包括的區塊(CC)個數,并記錄于A矩陣中 (步驟S403 )。同理,若以B點為圓心,R為半徑畫圓,也會把字元切分為36 個區域。因此,可再分別計算此36個區域中所包括的區塊(CC)個數,并記 錄于B矩陣中(步驟S404)。
然后再將這兩個矩陣分別予以正規化(步驟S405 ),此即分別將這兩個 矩陣中各個元素除以該矩陣中所有元素的和,借此消除因字元的字型大小
不同所可能造成的影響。最后則將這兩個矩陣合并為一個一維矩陣,而做 為此字元的特征值矩陣(步驟S406)。
以圖5所繪示的字元"N"為例,其A點及B點的座標分別是(5,4)及(5,8),而其參考半徑11=7.5。因此,若以(5,4)為圓心,7.5為半徑畫圓,并以l8 個方向切分區域以計算區塊數目,則可獲得矩陣A:
A[2] [ 18]=436432732541000132 000404000000000000
其中,矩陣A的第一列為圓內18個區域的區塊數目;而第二列則為圓 外18個區域的區塊數目。同理,若以(5,8)為圓心,7.5為半徑畫圓,并以 18個方向切分區域以計算區塊數目,則可獲得矩陣B:
B[2][18]=436100332436511362 000000000000202000
其中,矩陣B的第一列為圓內18個區域的區塊數目;而第二列則為圓 外18個區域的區塊數目。最后則可將這兩個陣列進行正規化后,再合并為 一個一維矩陣,而獲得所需的特征值矩陣。
除了上述特征值比對的方法外,本發明亦包括使用各個第一字元所對 應的預測模型,來辨識第一字元。然而,上述這些字元比對的方式僅為舉 例說明,熟知本領域技術者當可視實際需要,采用其它種類的字元比對方 式。
由上述的內容可知,本發明的重點在于依據一個字元在印刷線中的相 對位置,來判斷該字元所屬的字元類別。其中,本發明是將資料庫中的所 有字元分成小字元及非小字元兩部份,而針對這兩個種類的字元則個別制 定一套字元類別的判斷方法,茲分述如下
首先必需判定一個字元是否屬于小字元,請參照圖6,本實施例是在掃 描完一行印刷文字后,會找出其中較小或位置較偏的印刷字元,而將其歸 類為小字元。
首先,掃描影像中的每個印刷字元會先被標記一個外框,此外框包括 印刷字元的上、下、左、右等四個邊緣,此時就可根據這些標記的外框,計 算出每個印刷字元的字元高度(步驟S601)。
這些印刷字元的字元高度則接著拿來和一個預設高度值比較,而判斷 出各個印刷字元的字元高度是否小于此預設高度值(步驟S602 )。此預設高 度值例如是所有印刷字元的字元高度平均值的 一半,在此不限定其范圍。
其中,若印刷字元的字元高度小于預設高度值,則可將此印刷字元歸類 為小字元(步驟S607)。在剔除字元高度較小的印刷字元后,下一步則分別 擷取剩余的各個印刷字元的一個中心參考點(步驟S603 ),并利用最小平方 法(least square),求取這些中心參考點所趨近的一條中心線(步驟S604),而 使各個印刷字元的中心參考點距離此中心線的總和為最小。
在中心線定義出來后,即可用來判斷剩余的印刷字元中是否還存在著 小字元。其中例如先判斷印刷字元的下緣是否位于中心線的上方(步驟S605 ),若為真則將此印刷字元歸類為小字元(步驟S607);否則就繼續判 斷印刷字元的上緣是否位于中心線的下方(步驟S606),若為真則將此印刷 字元歸類為小字元(步驟S607)。簡單來說,本實施例的目的就是要找出不 會通過中心線的印刷字元,這些印刷字元可能是雜訊或是標點符號,其外 型往往比實際的字母小,也通常不會印在中心線上。
借由上述方法即可判定出印刷文字中的小字元,接著就可進行小字元 的分類步驟。圖7A及圖7B是依照本發明較佳實施例所繪示的小字元分類 方法的流程圖。請先參照圖7A,本實施例是根據上述產生的印刷線的數目 及種類,歸類出印刷線的狀態(步驟S701),并依照此印刷線的狀態,針對一 個小字元進行分類。其中,上述這些狀態例如包括第一狀態、第二狀態、第 三狀態及第四狀態。其中,第一狀態代表這些印刷線包括上述的頂線、上 層線、基線及底線。第二狀態代表這些印刷線包括上述的基線、底線,以 及由頂線與上層線合并的印刷線。第三狀態代表這些印刷線包括上述的頂 線、上層線,以及由基線與底'線合并的印刷線。而第四狀態則代表這些印 刷線包括由頂線及上層線合并的印刷線,以及由基線與底線合并的印刷線。
首先,找出頂線與上層線之間的一條中心線,并分別計算小字元的中 心參考點至頂線、上層線、基線、中心線的第一距離、第二距離、第三距 離、第四距離及第五距離(步驟S702)。在一實施例中,上述中心線的y 截距例如是頂線與上層線的y截距的平均,而其斜率則等于上層線的斜率,然 而本發明并不限制其范圍,使用者可依其需要,取用頂線與上層線之間的 任一條直線做為中心線。
接著,則可計算此小字元的高度與寬度的比值(步驟S703 ),此比值則 接著被拿來和一個第一臨界值做比較,以判斷其是否大于此第一臨界值(步 驟S704)。其中此第一臨界值例如為整數4,而不限制其范圍。
在步驟S704中,若此小字元的比值大于第一臨界值,則可繼續判斷印 刷線的分類是否屬于第一狀態或第二狀態(步驟S705 )。若否,則可將小字 元歸類為第八分類(步驟S706);若是,則可計算此小字元的下緣與頂線及 上層線的距離,而判斷出其下緣是否與上層線的距離較近(步驟S707)。若 是,則將小字元歸類為第四分類(步驟S708);反之則將其歸類為第二分類 (步驟S709 )。
另一方面,請繼續參照圖7B,在步驟S704中,若小字元的比值不大 于第 一 臨界值,則會繼續判斷是否第五距離小于第二臨界值,或者是第五距 離小于第二距離及第三距離(步驟S710)。若符合上述條件其中之一者,則 繼續判斷是否第三距離小于第五距離及第二距離(步驟S711)。若是,則將 小字元歸類為第六分類(步驟S712);反之則繼續判斷是否第二距離小于第 五距離及第三距離(步驟S713)。若是,則將小字元歸類為第五分類(步驟S714);否則就歸類為第七分類(步驟S715)。
再者,若在步驟S710中沒有任何一個條件相符,則會判斷是否小字元 的中心參考點落在中心線上(步驟S716)。若否,則將小字元歸類為第六分 類(步驟S717);若是,則分別計算小字元的下緣與上層線及基線的距離,并 判斷其下緣是否與上層線的距離較近(步驟S718)。若是,則將小字元歸類 為第五分類(步驟S719);否則歸類為第四分類(步驟S720)。
在以上小字元的分類方法中,所分類而得的第一至第八分類例如是圖3 所列示的分類,然不限定其范圍。而圖3的分類亦延用至非小字元的分類 方法中,以下即介紹非小字元的分類方法的詳細步驟
圖8是依照本發明較佳實施例所繪示的非小字元分類方法的流程圖。請 參照圖8,如同前個實施例的做法,本實施例一開始亦根據印刷線的數目及 種類,判斷印刷線的狀態(步驟S801),并依照此印刷線的狀態,針對一個 非屬于小字元的字元進行分類。其中,這些狀態例如包括第一狀態、第二 狀態、第三狀態及第四狀態,而其定義均與前個實施例相同,故在此不再 贅述。
若印刷線的分類屬于第一狀態時,則會判斷字元的上緣是否位于頂線 的上方(步驟S802)。若是,則繼續判斷此字元的下緣是否位于底線的上方 (步驟S803 )。若是,則可將此字元歸類為第一分類(步驟S804);反之則 將此字元歸類為第二分類(步驟S805 )。
其中,在步驟S802中,若判斷字元的上緣不是位于頂線的上方時,則 會繼續判斷此字元的下緣是否位于底線的上方(步驟S806)。若是,則將此 字元歸類為第三分類(步驟S807);反之則將此字元歸類為第四分類(步驟 S808 )。
另一方面,若印刷線的分類屬于第二狀態時,則會判斷此字元的上緣 是否位于頂線的上方(步驟S809),若是,則將此字元歸類為第二分類(步 驟S810);反之則將其歸類為第四分類(步驟S811)。
最后,若印刷線的分類屬于第三狀態或第四狀態時,則是將第一字元 歸類為第八分類(步驟S812),意即歸類為無法按照印刷線分類的類別。
在以上非小字元的分類方法中,判斷所得的第一至第八分類同樣是采 用如圖3所列示的分類,然不限定其范圍。而結合上述小字元及非小字元 的分類方法即能夠針對所有類型的字元,篩選合適的光學文字辨識(Optical Character Recognition, OCR)資料來做辨識,而能夠有效提高辨識率。
綜上所述,本發明的文字辨識方法至少具有下列優點
1. 在進行文字辨識前先針對所有要辨識的文字,按照可能在印刷線的位 置做分類,個別產生特征值等光學文字辨識資料。
2. 使用已知字元與印刷線之間的相對位置資訊來評估字元屬于哪一個分類,并用此分類對應的OCR資料來進行辨識,因此能夠提高辨識速度。
雖然本發明已以較佳實施例揭露如上,然其并非用以限定本發明,任 何所屬技術領域中具有通常知識者,在不脫離本發明的精神和范圍內,當 可作些許的更動與潤飾,因此本發明的保護范圍當視所附的權利要求所界 定者為準。
權利要求
1. 一種文字辨識方法,其特征在于其包括下列步驟a. 掃描一行印刷文字,其中該行印刷文字包括多個第一字元;b. 利用該些第一字元,產生多條印刷線;c. 依據各該些第一字元在該些印刷線中的一相對位置,判斷各該些第一 字元所屬的一字元類別;以及d. 將各該些第一字元與一資料庫中屬于該字元類別的多個第二字元比 對,找出各該些第一字元所對應的該第二字元,而辨識出該些第一字元,其 中該資料庫包括記錄多種字元類別及各該些字元類別所屬的該些第二字 元。
2. 根據權利要求1所述的文字辨識方法,其特征在于該些印刷線包括一 頂線、 一上層線、 一基線及一底線,而該頂線與該上層線之間為一上層 區、該上層線與該基線之間為一中間區、該基線及該底線之間為一下層區。
3. 根據權利要求2所述的文字辨識方法,其特征在于該步驟c.包括 cl.判斷各該些第一字元是否屬于一小字元; c2.若屬于該小字元,則進行一小字元分類;以及 c3.若不屬于該小字元,則進行一非小字元分類。
4. 根據權利要求3所述的文字辨識方法,其特征在于該步驟cl,包括 cl-l.分別計算各該些第一字元的一字元高度;以及 cl-2.將各該些第一字元的該字元高度與一預設高度值比較,而將該字元高度小于該預設高度值的該些第一字元歸類為該些小字元。
5. 根據權利要求4所述的印刷線生成方法,其特征在于在步驟cl-2. 之后更包括c 1 -3 .分別擷取剩余的各該些第 一 字元中心的 一 中心參考點; cl-4.利用一最小平方法,求取該些中心參考點所趨近的一中心線; cl-5.判斷各該些第一字元的一下緣是否位于該中心線的上方,而將該下緣位于該中心線的上方的該些第一字元歸類為該些小字元;以及cl-6.判斷各該些第一字元的一上緣是否位于該中心線的下方,而將該上緣位于該中心線的下方的該些第一字元歸類為該些小字元。
6. 根據權利要求3所述的文字辨識方法,其特征在于該步驟c.更包括 依據所產生的該些印刷線的數目及種類,將該些印刷線歸類為多個狀態其中之一。
7. 根據權利要求6所述的文字辨識方法,其特征在于該些狀態包括 一第一狀態,該第一狀態代表該些印刷線包括上述的該頂線、該上層線、該基線及該底線;一第二狀態,該第二狀態代表該些印刷線包括上述的該基線、該底線,以及由該頂線與該上層線合并的該印刷線;一第三狀態,該第三狀態代表該些印刷線包括上述的該頂線、該上層 線,以及由該基線與該底線合并的該印刷線;以及一第四狀態,該第四狀態代表該些印刷線包括由該頂線及該上層線合 并的該印刷線,以及由該基線與該底線合并的該印刷線。
8. 根據權利要求7所述的文字辨識方法,其特征在于每一該小字元的分 類步驟包括c2-l.找出該頂線與該上層線之間的一中心線,并計算該小字元的一中 心參考點至該頂線、該上層線、該基線、該中心線的一第一距離、 一第二 距離、 一第三距離、 一第四距離及一第五距離;c2-2 .計算該小字元的 一 高度與 一 寬度的 一 比值;c2-3 .判斷該比值是否大于 一 第 一 臨界值;c2-4.若是,則判斷該些印刷線的分類是否屬于該第一狀態或該第二狀態; c2-4-l.若是,則計算該小字元的下緣與該頂線及該上層線的距離,并 判斷是否與該上層線的距離較近;c2-4-l-l.若是,則將該小字元歸類為一第四分類; c2-4-1 -2.若否,則將該小字元歸類為 一第二分類; c2-4-2.若否,則將該小字元歸類為一第八分類; c2-5.若否,則判斷是否該第五距離小于一第二臨界值,或者是該第五距 離小于該第二距離及該第三距離;c2-5-l.若是,則判斷是否該第三距離小于該第五距離及該第二距離;c2-5-l-l.若是,則將該小字元歸類為一第六分類; c2-5-l-2.若否,則判斷是否該第二距離小于該第五距離及該第三距離;c2-5-l-2-l.若是,則將該小字元歸類為一第五分類; c2-5-l-2-2.若否,則將該小字元歸類為一第七分類; c2-5-2.若否,則判斷是否該中心參考點落在該中心線上;c2-5-2-l.若是,則計算該小字元的下緣與該上層線及該基線的 距離,并判斷是否與該上層線的距離較近;c2-5-2-l-l.若是,則將該小字元歸類為該第五分類; c2-5-2-l-2.若否,則將該小字元歸類為該第四分類;以及 c2-5-2-2.若否,則將該小字元歸類為該第六分類。
9. 根據權利要求8所述的文字辨識方法,其特征在于該非小字元分類的 步驟包括c3-l.若該些印刷線的分類屬于該第一狀態時,判斷該第一字元的上緣是 否位于該頂線的上方;c3-l-l.若是,則判斷該第一字元的下緣是否位于該底線的上方; c3-l-l-l.若是,則將該第一字元歸類為該第一分類; c3-l-l-2.若否,則將該第一字元歸類為一第二分類;c3-l-2.若否,則判斷該第一字元的下緣是否位于該底線的上方; c3-l-2-l.若是,則將該第一字元歸類為該第三分類;以及 c3-l-2-2.若否,則將該第一字元歸類為該第四分類。
10. 根據權利要求9所述的文字辨識方法,其特征在于該非小字元分類 的步驟更包括c3-2.若該些印刷線的分類屬于該第二狀態時,判斷該第一字元的上緣是 否位于該頂線的上方;c3-2-l.若是,則將該第一字元歸類為該第二分類;以及 c3-2-2.若否,則將該第一字元歸類為該第四分類。
11. 根據權利要求IO所述的文字辨識方法,其特征在于該非小字元分類 的步驟更包括c3-3.若該些印刷線的分類屬于該第三狀態或該第四狀態時,則將該第一 字元歸類為該第八分類。
12. 根據權利要求11所述的文字辨識方法,其特征在于上述該些字元類 別包括該第一分類占了該上層區、該中間區及該下層區; 該第二分類占了該上層區及該中間區; 該第三分類占了該下層區; 該第四分類占了該中間區; 該第五分類為該小字元,且位于該中心線附近; 該第六分類占了該中心線與該上層線之間; 該第七分類占了該中心線與該基線之間;以及 該第八分類為剩余無法按m該些印刷線分類者。
13. 根據權利要求1所述的文字辨識方法,其特征在于該步驟d.包括 dl.計算各該些第一字元的一第一特征值;以及d2.針對各該些第一字元,將該第一特征值與該資料庫中屬于該字元類 別的各該些第二字元的一第二特征值比較,找出特征值最相近的該第二字 元做為該第一字元的辨識字元。
14. 根據權利要求13所述的文字辨識方法,其特征在于該步驟d2.更包括使用各該些第一字元對應的一預測模型,以辨識該第一字元。
全文摘要
一種文字辨識方法,此方法是在進行文字辨識前先針對所有要辨識的字元,按照其與印刷線之間的相對位置做分類,而在實際進行文字辨識時,僅取用文字資料庫中對應其字元類別的字元來進行比對,因此可減少文字比對的范圍及數目,而能夠提高文字辨識的正確率及速度。
文檔編號G06K9/20GK101311946SQ20071010730
公開日2008年11月26日 申請日期2007年5月25日 優先權日2007年5月25日
發明者范圣恩, 蔡文瀚 申請人:仁寶電腦工業股份有限公司