字符識別系統、字符識別程序以及字符識別方法
【技術領域】
[0001 ] 本發明涉及字符識別系統。
【背景技術】
[0002]以往,提供了用于光學讀取被打印在紙上的字符而進行識別的光學字符識別系統,例如,在下述專利文獻1、2中作了公開。
[0003]另一方面,如下述專利文獻3所公開的那樣,為了在系統之間或應用程序之間進行數據的交接,需要借助通過畫面捕捉得到的圖像數據,識別計算機的顯示器上顯示的字符。
[0004]現有技術文獻
[0005]專利文獻
[0006]專利文獻1:日本特開2008-305126號公報
[0007]專利文獻2:日本特開2010-26805號公報
[0008]專利文獻3:日本特開2011-81537號公報
【發明內容】
[0009]發明所要解決的課題
[0010]但是,顯示器上的顯示字符與被打印在紙上的字符相比,點的分辨率粗,所以即使采用現有的光學字符識別的手法,有時候識別率也會大幅下降。尤其是對于為了增大顯示數據量而使用的小字符尺寸的字符而言,識別率極端地降低。
[0011]本發明就是鑒于上述課題而完成的,其目的在于提供一種字符識別系統,其能夠以高的準確率識別顯示在計算機的顯示器上的字符。
[0012]用于解決課題的手段
[0013]為了解決上述課題,本發明的字符識別系統用于識別計算機的顯示器上顯示的字符,其特征在于,所述字符識別系統具有:存儲裝置,其針對規定的顯示字體和字符尺寸的組合,記錄有識別辭典,所述識別辭典具有關于具備該顯示字體和字符尺寸的各字符的構成點的配置的信息;以及字符識別部,其參照所述識別辭典,提取與關于所述顯示器上顯示的識別對象字符的構成點的配置的信息完全一致的字符,由此確定所述識別對象字符。
[0014]此外,本發明的字符識別程序用于使計算機識別顯示器上顯示的字符,其特征在于,所述字符識別程序使所述計算機執行以下步驟:識別辭典生成步驟,針對規定的顯示字體和字符尺寸的組合,生成識別辭典,所述識別辭典具有關于具備該顯示字體和字符尺寸的各字符的構成點的配置的信息;以及字符識別步驟,參照所述識別辭典,提取與關于所述顯示器上顯示的識別對象字符的構成點的配置的信息完全一致的字符,由此確定所述識別對象字符。
[0015]此外,本發明的字符識別方法用于識別計算機的顯示器上顯示的字符,其特征在于,所述字符識別方法具有以下步驟:識別辭典生成步驟,針對規定的顯示字體和字符尺寸的組合,生成識別辭典,所述識別辭典具有關于具備該顯示字體和字符尺寸的各字符的構成點的配置的信息;以及字符識別步驟,參照所述識別辭典,提取與關于所述顯示器上顯示的識別對象字符的構成點的配置的信息完全一致的字符,由此確定所述識別對象字符。
[0016]發明效果
[0017]根據本發明,即使是顯示在計算機的顯示器上的分辨率低的字符,也能夠高精度地進行字符識別。
【附圖說明】
[0018]圖1是概略地示出本發明的實施方式的字符識別系統的結構的示意圖。
[0019]圖2是示出本發明的實施方式的識別辭典的內容的圖。
[0020]圖3是概略地示出本發明的實施方式的字符識別系統的功能的框圖。
[0021]圖4是示出本發明的實施方式的識別辭典的生成處理的流程的流程圖。
[0022]圖5是示出本發明的實施方式的字符識別的處理的流程的流程圖。
[0023]圖6是用于說明本發明的實施方式的字符識別的處理的圖。
【具體實施方式】
[0024]下面,參照附圖詳細說明本發明的實施方式的字符識別系統。圖1是概略地示出本實施方式的字符識別系統的結構的示意圖。圖2是示出本實施方式的識別辭典的內容的圖。圖3是概略地示出本實施方式的字符識別系統的功能的框圖。
[0025]如圖1所示,字符識別系統I具有:計算機主體10 ;顯示器30,其是顯示來自計算機主體10的輸出信息的顯示裝置;以及鍵盤和鼠標等輸入裝置32,其用于將信息輸入到計算機主體10。
[0026]本實施方式的字符識別系統I是用于識別顯示器30上顯示的字符的系統,其特征在于,在進行字符識別時,不是利用光學字符識別,而是根據關于構成字符的構成點的配置的信息是否完全一致,來進行字符的確定。在本實施方式中,以識別應用程序A在顯示器30上的顯示窗口內的規定的識別對象區域中顯示的顯示字符的情況為例進行說明。
[0027]計算機主體10具有:用于進行各種運算的CPU(Central Processing Unit,中央處理單元)等運算裝置11 ;以及用于存儲各種信息的HDD (Hard Disc Drive,硬盤驅動器)和作為運算處理的工作區進行使用的RAM (Random Access Memory,隨機存取存儲器)等存儲裝置12。
[0028]存儲裝置12具有:程序保存部121,其保存有安裝于計算機主體10的OS (Operating System:操作系統)、字符識別程序、識別辭典生成程序、字體檢查程序、應用程序A等各種程序;識別辭典DB (數據庫)122,其保存有在進行字符識別時使用的識別辭典;用于字體檢查的字體檢查用辭典DB 123 ;以及視頻存儲器125,其臨時保持顯示器30上顯示的畫面內容。
[0029]關于程序保存部121,字符識別程序是用于執行后述的字符識別處理的程序,識別辭典生成程序是用于執行后述的識別辭典的生成處理的程序。此外,字體檢查程序是用于在進行識別辭典的生成和字符識別時,取得識別對象字符的顯示字體和字符尺寸的信息的程序。
[0030]在識別辭典DB 122中,按照顯示字體和字符尺寸的每種組合,生成識別辭典并進行記錄。參照圖2來說明識別辭典的識別辭典記錄的內容。識別辭典DB 122內的各記錄具有“辭典ID”、“顯示字體”、“字符尺寸”、“字符代碼”、“外框內點配置”、“外框尺寸”、“外框位置”的項目。
[0031]“辭典ID”是各識別辭典的識別符,如果是相同顯示字體和字符尺寸的組合,則為相同的識別符,如果顯示字體和字符尺寸的至少一個不同,則為不同的識別符。“顯示字體”、“字符尺寸”和“字符代碼”是作為該記錄的生成源的字符的字體、尺寸、字符代碼。
[0032]“外框內點配置”是包含構成辭典生成源的字符的全部構成點的最小矩形外框內的點配置位置的信息。例如,將配置有黑色點的位置設為“ I ”,將沒有配置的空白位置設為“0”,從矩形外框內的左上朝向右下,按照每行以“00110101110000”的形式進行記錄。
[0033]“外框尺寸”是上述最小矩形外框的縱橫的尺寸信息(點的個數)。“外框位置”是從基線(標準底線)到上述最小矩形外框的下邊的距離。在本實施方式中,“外框內點配置”、“外框尺寸”、“外框位置”的項目相當于關于字符的構成點的配置的信息。
[0034]字體檢查用辭典DB 123內記錄的字體檢查用辭典是用于在進行識別辭典的生成和字符識別時,取得識別對象字符的顯示字體和字符尺寸的信息的辭典。字體檢查用辭典僅針對例如“務U 3尤朽”等規定的檢查用的多種字符,具有與關于計算機主體10中安裝的全部字體的全部尺寸的上述識別辭典相同的信息。
[0035]接著,參照圖3來說明字符識別系統I的功能。如該圖所示,字符識別系統I具有:字體檢查部20,其具有識別顯示器30上顯示的顯示字符的顯示字體和字符尺寸的功能;辭典生成部21,其具有預先生成上述識別辭典的功能;以及字符識別部25,其具有進行字符識別的功能。
[0036]這各個部分的功能是使運算裝置11執行程序保存部121中保存的字體檢查程序、識別辭典生成程序、字符識別程序來實現的。
[0037]接著,進一步參照圖4來說明識別辭典DB 122中記錄的識別辭典的生成處理的流程。圖4是示出本實施方式的識別辭典的生成處理的流程的流程圖。
[0038]識別辭典的生成是在后述的字符識別處理之前進行的,辭典生成部21生成針對之后待識別的識別對象字符的顯示字體和字符尺寸的組合的識別辭典。當然,在已經針對相同顯示字體和字符尺寸的組合生成了識別辭典的情況下,無需再次進行辭典的生成,只要使用已經登記的識別辭典即可。
[0039]在識別辭典的生成時,在計算機主體10中執行識別辭典生成程序。首先,在Sll中,進行生成識別辭典所需的顯示字體和字符尺寸的取得。該字符尺寸等的取得是啟動字體檢查程序而進行的。
[0040]這里生成的識別辭典是應用程序A在顯示窗口內的規定的識別對象區域內顯示的識別對象字符的顯示字體和字符尺寸的組合的識別辭典,所以字體檢查程序參照記錄在字體檢查用辭典DB 123內的字體檢查用辭典,自動確定該識別對象字符的顯示字體和字符尺寸。
[0041]具體而言,字體檢查部20通過畫面捕捉從視頻存儲器125取得識別對象字符的圖像數據,一邊參照字體檢查用辭典DB 123,一邊提取與構成識別對象字符的點的配置信息完全一致的字符。由此,確定與識別對象字符相同字體和相同尺寸的字符,能夠取得識別對象區域中顯示的字符的顯示字體和字符尺寸的信息。
[0042]另外,參照該字體檢查用辭典DB 123提取字符的處理與后述的字符識別的處理相同,所以省略詳細的說明。此外,字體檢查用辭典是僅針對檢查用的多種字符的辭典,所以在進行字體檢查時,操作員需要預先進行字符的輸入等作業,以使該檢查用的字符作為識別對象字符顯示在識別對象區域內。
[0043]與現有的光學字符識別不同,在本實施方式中,根據字符的構成點的配置位置是否相同,進行字符的識別,如果顯示字體或字符尺寸不同,則會被識