專利名稱:具有字符識別功能的便攜式蜂窩電話、方法及程序的制作方法
技術領域:
本發明涉及一種針對沒被正確識別的(錯讀)字符的具有字符識別功能的便攜式蜂窩電話的方法和程序,更具體地說,涉及一種在具有光學字符識別功能的便攜式蜂窩電話中,對判斷為識別錯誤或者識別失敗的字符進行校正的改進方法。
背景技術:
在傳統的光學字符識別設備中,由視頻捕獲部分(掃描儀)來讀取介質上的字符,然后將正在讀取的圖像數據傳輸到字符識別部分,并且在這里逐個地對字符的圖像進行識別。而且,將正在識別的結果輸出到顯示設備。當進行如上所述的工作時,當將由字符識別部分識別的結果判斷為識別錯誤或者識別失敗時,操作人員必須通過鍵盤來刪除錯讀的字符或者不可讀的字符,并且輸入新的字符。作為校正方法,一種方法是由鍵盤輸入假名—日本漢字的轉換,另一方法是通過顯示候選字符或者候選字來進行輸入。然而,使用傳統的字符識別技術,仍然會存在許多錯讀或者不可讀的字符,因此,每一次操作人員都必須刪除并且重新輸入錯讀的字符或者不可讀的字符。
另一方面,在日本專利待審公開No.Hei05-250515(此后被稱為專利參考文件No.1)、以及日本專利待審公開No.Hei09-0166872(此后被稱為專利參考文件No.2)中已經公開了對識別的數據進行校正的技術的實例。
在專利參考文件1中公開的技術涉及通過核對等方式來識別文本的條碼字符,即,通過使用字符形狀信息(模板圖案(template pattern))來識別條碼字符。
在專利參考文件2中公開的技術涉及對形式數據(form data)進行校正,即通過應用與形式數據對應的校正過程圖案來對形式數據進行校正。
在前面提到的傳統光學字符識別設備中,當將由字符識別部分識別的結果判斷為識別錯誤或者識別失敗時,操作人員必須每次提供鍵盤刪除錯讀的字符或者不可讀的字符,并且重新輸入校正的字符。即,會存在字符校正需要時間的問題。
發明內容
考慮到上述問題,本發明的目的是提出一種針對沒被正確識別的(錯讀)字符的具有光學字符識別部分的便攜式蜂窩電話、方法及程序,由此,在讀取字符串的情況下,能夠降低字符識別錯誤或者字符識別失敗的比率。
依據本發明的第一方面,提出了一種具有字符識別功能的便攜式蜂窩電話,包括圖像捕獲裝置,用于至少捕獲字符串;字符識別裝置,用于識別由圖像捕獲裝置捕獲的字符串;以及字符串存儲裝置,用于存儲與特征字符串有關的信息,以及其中,當還沒有正確地識別捕獲的字符串時,字符串識別裝置依據與從字符串存儲裝置中讀取的與特征字符串有關的信息,對沒被正確識別的字符串進行校正。
在前面的描述中,優選的方式是在捕獲的字符串中包括至少一個錯誤或者不可讀的字符時,字符識別裝置依據從字符串存儲裝置中讀取的關于特征字符串的信息,對沒被正確識別的字符串進行校正。
另一優選的方式是所述的字符識別裝置包括字符識別裝置,用于對組成由圖像捕獲裝置捕獲的字符串的每一個字符進行識別,數據參考部分(data referencing section),用于將在字符識別部分沒有正確地識別的字符串的一部分作為整體,與在字符串存儲裝置中存儲的與特征字符串有關的信息進行比較,其中,所述的字符串中包括至少一個錯讀或者不可讀的字符,以及數據校正部分,用于依據由數據參考部分的處理獲得的比較結果,對錯讀或者不可讀的字符進行校正,從而使其與特征字符串中的任一個匹配。
另一優選方式是與特征字符串有關的信息包括與URL(統一(uniform)資源定位器)、電話號碼、郵件地址有關的信息中的至少一個。
依據本發明的第二方面,提出了一種在具有字符識別部分的便攜式蜂窩電話中使用的對不正確地識別的字符串進行校正的方法,所述的方法包括圖像捕獲步驟,用于至少由圖像捕獲裝置來捕獲字符串;以及數據識別/校正步驟,對由所述的圖像捕獲裝置捕獲的字符串進行識別,并且當已經被不正確地識別了捕獲的字符串時,依據與特征字符串有關的信息,對不正確識別的字符串進行校正。
按照以上的配置,通過包括依據將捕獲的字符串的信息與關于特征字符串的信息進行比較,對捕獲的字符串進行校正的步驟,可以在讀取字符串的情況下,降低字符識別錯誤率和字符識別失敗率。
在專利參考文件No.1和No.2所公開的技術中,沒有將特征字符串信息用作專利參考文件No.1(見圖1)中公開的模板圖案、或者專利參考文件No.2(見圖1)中公開的校正過程圖案,因此,在參考文件No.1和No.2中公開的技術的結構,操作、以及效果與本發明都具有極大的不同。
從結合附圖所采用的以下描述中,本發明的上述和其他目的、優點及特征將變得更加顯而易見,圖1是依據本發明的第一實施例的具有光學字符識別功能的便攜式蜂窩電話的配置的框圖;圖2是示出依據第一實施例的字符識別和字符校正的過程的流程的示意圖;圖3是示出依據本發明在存儲器中存儲的信息的圖;圖4是示出依據本發明,具有光學字符識別功能的便攜式蜂窩電話的操作的流程圖。
具體實施例方式
下面將參考附圖,通過使用各種實施例對執行本發明的最佳方式進行更詳細地描述。
第一實施例圖1是示出依據本發明的第一實施例的具有光學字符識別功能的便攜式蜂窩電話的電學配置的方框圖。如圖所示,本實施例的便攜式蜂窩電話主要包括操作部分11、顯示部分12、顯示控制部分13、控制部分(CPU中央處理單元)14、攝像(camera)部分15、無線通信部分16、字符識別部分17、字符串信息存儲器18、圖片資料(picture memo)存儲器19、相冊(album)存儲器20、待機用存儲器21、工作用存儲器22、ROM(只讀存儲器)23、以及總線24。
操作部分11由配置有各種鍵的輸入裝置組成。由諸如LCD(液晶顯示器)來提供顯示部分12,并且顯示控制部分13對顯示部分12進行控制。控制部分14由CPU組成,并且通過總線24對每一個部分進行控制。攝像部分15拍下外部對象的圖片,特別是作為本發明的主題,拍下包括與字符串有關的信息的圖片。無線通信部分16通過基站,與另一用戶設備進行無線通信。
字符識別部分17識別由攝像部分15所拍下的圖片中的字符。字符串信息存儲器18存儲字符串信息,這在稍后還將提到。圖片資料存儲器19是將所拍下的圖像作為資料登記的存儲器,相冊存儲器20是為了形成相冊而存儲由攝像部分15所拍下的圖像的存儲器,待機用存儲器21是用于存儲待機屏幕的存儲器,工作用存儲器22是在CPU14的處理中所使用的工作存儲器,以及ROM23是存儲用于執行CPU14以便進行識別的程序的存儲器。這些部分中的每一個(除了顯示部分21之外)通過總線24相互連接。
如上所述,本發明的便攜式蜂窩電話配備有攝像部分15,并且具有通過攝像部分15來拍下或者存儲外部視頻的功能。但是本發明的特征在于通過攝像部分拍下字符串的圖片,并且對該字符串進行識別的功能、以及對數據進行校正的功能。
此外,在第一實施例的情況下,攝像部分15用來捕獲視頻信號,還可以依據與字符串有關的捕獲信息,分別配備諸如OCR(光學字符讀取器)等捕獲設備。
圖2是示出依據第一實施例的字符識別和字符校正過程的流程的示意圖。在圖2中,字符串1表示作為要被讀取的對象的圖片。
參考圖2,視頻捕獲部分2對字符串1進行數字化,并且將其作為圖像數據發送到字符識別部分3。字符識別部分3識別該圖像數據內的字符,并且將字符碼輸入到數據參考部分4。數據參考部分4將發送的字符碼與存儲器7中存儲的信息進行比較。數據校正部分5依據來自數據參考部分4的信息,對數據進行校正。顯示部分6顯示從數據校正部分5中發出的信息。控制部分8控制視頻捕獲部分2、字符識別部分3、數據參考部分4、數據校正部分5、以及顯示部分6。輸入部分9以鍵盤或者按鈕的形式存在,并且通過手動操作進行校正和選擇。稍后將描述在存儲介質10中存儲的程序。
此外,圖2中的字符識別部分3、數據參考部分4、以及數據校正部分5構成了圖1中的字符識別部分17、在圖2中,視頻捕獲部分2、顯示部分6、存儲器7、控制部分8、輸入部分9、以及存儲介質10分別對應于圖1所示的攝像部分15、顯示部分12、字符串信息存儲器18、控制部分14、操作部分11、以及ROM23。
下面將對存儲部分7中存儲的信息進行描述。圖3是示出依據本發明,在存儲器7中存儲的信息的一個實例的圖。如圖3所示,在存儲部分7中存儲有與特征字符串有關的信息。
例如,在將URL(統一資源定位器)看作特征字符串的情況下,將作為一個實例的“http//aaa.bbb.ccc.dd.jp/”作為與特征字符串有關的信息存儲在存儲部分7中。
在將電話號碼看作特征字符串的情況下,將作為一個實例的“aaa(bbb)cccc”或者“ddd-eeee-ffff”作為特征字符串信息存儲在存儲部分7中。
此外,在將電子郵件地址看作特征字符串的情況下,將作為一個實例的aaaaaaa@bbbbb.ccc.dd.jp作為特征字符串信息存儲在存儲部分7中。
這里,與特征字符串有關的信息不局限于以上所提到的信息,也可以使用諸如信用卡號、車牌(car plate)號、車輛執照號、護照號等私人信息作為特征字符串。
即,當數據參考部分4已經斷定將從字符識別部分3輸入的非法/錯讀字符碼應用到任何一個特征字符串時,數據校正部分5對非法/錯讀的字符碼進行校正,從而使非法/錯讀字符碼的形式可以與應用的特征字符串的形式匹配。
此外,字符識別部分3、數據參考部分4、以及數據校正部分5中的每一個由軟件構成。
第二實施例下面將對本發明的第二實施例進行描述。第二實施例涉及對識別的字符進行校正的方法。圖4是示出依據本發明的具有光學字符識別功能的便攜式蜂窩電話的操作的一個實例的流程圖。此外,所述的具有光學字符識別功能的便攜式蜂窩電話的組成與圖1和2所示的組成相同。
如圖4所示,首先,在視頻捕獲部分2中捕獲字符串1(S1),并且對捕獲的字符串1進行數字化(S2)。然后,將數字化后的字符串1輸入到字符識別部分3,并且對在該數字化后的字符串1中所包括的字符進行識別處理(S3)。當字符識別部分3已經在S3的處理中,斷定對象字符是可識別的(在S4中“是”的情況),將已識別的字符碼輸入到顯示部分6中,然后顯示部分6依據輸入的字符碼,將已識別的字符作為結果來顯示(S7)。
另一方面,當字符識別部分3已經在S3的處理中,斷定對象字符是不可識別的(即,當字符識別部分3已經斷定對象字符為錯讀的或者不可讀的)(在S4中的“否”的情況),將與不被正確地識別的字符串的一部分對應的字符碼整個地傳送到字符參考部分4。數據參考部分4讀取在存儲器7中所存儲的與特征字符串有關的信息,并且參考讀取的特征字符串,判斷所述的不正確的字符碼是否與特征字符串中的任一個對應(S5)。
下面將描述對不正確的字符碼是否與特征字符串的任一個的形式匹配進行判斷的方法。例如,當字符識別部分3已經從捕獲的字符串1中讀取了字符串[http]或者[//],字符識別部分3斷定捕獲的字符串1為任意的URL。在另一實例中,字符識別部分3已經從捕獲的字符串1中讀取了10位數字字符串、或者11位數字字符串,則字符識別部分3斷定捕獲的字符串1為任意的電話號碼。此外,當字符識別部分3已經從數字字符串中讀取了()(括號)或者—(連字符),則字符識別部分3斷定捕獲的字符串1為任意的電話號碼。在另一實施例中,當字符識別部分3已經從捕獲的字符串1中讀取了@、或者以[.jp]結束的字符串,則字符識別部分3斷定所捕獲的字符串1為任意的郵件地址。
回到圖4所示的流程圖,當數據參考部分4在S5的過程中,斷定由不可識別字符所產生的不正確的字符碼對應于特征字符串中的任何一個時(在S5中的[是]的情況),數據校正部分5按照使不正確的字符碼的形式與特征字符串的形式匹配的方式對不正確的字符碼進行校正(S6)。
例如,當斷定捕獲的字符串1為任意的URL時,可以認為錯讀或者不可讀的字符是字母,而不是數字、日本漢字、以及假名。由此,將錯讀或者不可讀的字符改變為在字母表中最適當的候選字母。在另一實例中,當斷定捕獲的字符串1為任意的電話號碼時,可以認為錯讀或者不可讀的字符是數字,而不是字母、日本漢字、以及假名。由此,將錯讀或者不可讀的字符改變為最適合的數字。
顯示部分6顯示與校正后的字符碼對應的字符串(S7)。
另一方面,當數據參考部分4在S5的處理中,斷定不正確的字符碼與特征字符串中的任一個都不對應時(在S5中[否]的情況),則數據校正部分5照原樣輸出不正確的(非法的)字符而不對其進行校正,或者通過在識別錯誤或者識別失敗之前和之后加上特定的標記(符號)來輸出(S8)。在顯示部分6上顯示此沒有校正的字符碼(S7)。在識別錯誤或者識別失敗之前和之后加上特定的標記(符號),這可以使操作人員容易發現識別錯誤或者識別失敗,以便對字符進行校正。
第三實施例下面將描述本發明的第三實施例。第三實施例涉及對識別的字符進行校正的程序。如上所述,本發明的具有光學字符識別功能的便攜式蜂窩電話包括存儲介質10(如圖2所示)。存儲介質10存儲圖4的流程圖中所示的對識別的字符進行校正的方法的程序。控制部分8從存儲器10中讀取該程序,并且依據該程序,對視頻捕獲部分2、字符識別部分3、數據參考部分4、數據校正部分5、以及顯示部分6進行控制。在第二實施例的情況下,已經對控制的內容進行了描述,因此,在此省略關于第三實施例的描述。
權利要求
1.一種具有字符識別功能的便攜式蜂窩電話,包括圖像捕獲裝置,用于捕獲字符串;字符識別裝置,用于對由所述的圖像捕獲裝置捕獲的字符串進行識別;以及字符串存儲裝置,用于存儲與特征字符串有關的信息,以及其中,當已經不正確地識別了所捕獲的字符串時,所述的字符串識別裝置依據從所述的字符串存儲裝置中讀取的所述與特征字符串有關的信息,對不正確識別的字符串進行校正。
2.根據權利要求1所述的具有字符識別功能的便攜式蜂窩電話,其特征在于當在所捕獲的字符串中包括至少一個錯讀或者不可讀的字符時,所述的字符識別裝置依據從所述的字符串存儲裝置中讀取的所述與特征字符串有關的信息,對該不正確識別的字符串進行校正。
3.根據權利要求2所述的具有字符識別功能的便攜式蜂窩電話,其特征在于所述的字符識別裝置包括字符識別部分,用于識別構成由所述的圖像捕獲裝置所捕獲的字符串的每一個字符;數據參考部分,用于將在所述的字符識別部分中不正確識別的字符串的一部分作為整體,與在所述的字符串存儲裝置中存儲的與特征字符串有關的所述信息進行比較,其中,在所述的字符串中包括至少一個錯讀或者不可讀的字符;以及數據校正裝置,用于依據由所述數據參考部分的處理獲得的比較結果,對錯讀或者不可讀的字符進行校正,從而使其與所述特征字符串中的任一個的形式匹配。
4.根據權利要求1到3任意之一所述的具有字符識別功能的便攜式蜂窩電話,其特征在于所述的與特征字符串有關的信息包括與URL(統一資源定位器)、電話號碼、以及郵件地址有關的信息的至少任意之一。
5.一種在具有字符識別功能的便攜式蜂窩電話中使用的對不正確識別的字符串進行校正的方法,所述的方法包括圖像捕獲步驟,用于由圖像捕獲裝置來捕獲字符串;以及數據識別/校正步驟,對由所述的圖像捕獲裝置捕獲的字符串進行識別,并且當已經不正確地識別了捕獲的字符串時,依據與特征字符串有關的信息,對不正確識別的字符串進行校正。
6.根據權利要求5所述的用于對已識別的字符進行校正的方法,其特征在于在所述的數據識別/校正步驟中,當在已識別的字符串中包括至少一個錯讀或者不可讀的字符時,依據與特征字符串有關的信息,對不正確識別的字符串進行校正。
7.根據權利要求6所述的用于對已不正確識別的字符進行校正的方法,其特征在于所述的數據識別/校正步驟包括以下步驟第一步驟,對構成由所述的圖像捕獲裝置捕獲的字符串的每一個字符進行識別;第二步驟,將在所述的第一步驟中不正確地識別的字符串的一部分作為整體與關于所述的特征字符串的所述信息進行比較,其中,所述的字符串包括至少一個錯讀或者不可讀的字符。第三步驟,依據在所述的第二步驟中所獲得的比較結果,對錯讀或者不可讀的字符進行校正,從而使其與所述的特征字符串中的任一個的形式匹配。第四步驟,顯示在所述的第三步驟中校正的字符。
8.根據權利要求5到8任意之一所述的用于對已不正確識別的字符進行校正的方法,其特征在于所述的與特征字符串有關的信息包括與URL(統一資源定位器)、電話號碼、以及郵件地址有關的信息中的至少一個。
全文摘要
提出了一種在讀取字符串的情況下能夠降低字符識別錯誤率或者字符識別失敗率的具有字符識別功能的光學便攜式蜂窩電話。當字符識別部分斷定捕獲的字符不可識別(錯讀或者不可讀)時,數據參考部分參考在存儲器中存儲的與特征字符串有關的信息,判斷由不可識別字符形成的不正確的字符碼是否對應于特征字符串的其中之一。當斷定不正確的字符碼對應于特征字符串的其中之一時,數據校正部分按照使不正確的字符碼的形式與特征字符串的形式匹配的方式來進行校正。
文檔編號H04M1/274GK1499865SQ200310113830
公開日2004年5月26日 申請日期2003年10月31日 優先權日2002年10月31日
發明者久保田昭仁 申請人:日本電氣株式會社