信息處理裝置及信息處理方法
【專利說明】信息處理裝置及信息處理方法
[0001]本申請享受2014年9月29日在先提出的日本專利申請2014-198825的優先權,其全部內容援引于此。
技術領域
[0002]實施方式涉及信息處理裝置及信息處理方法。
【背景技術】
[0003]以往,已知通過計算機等將使用票單的業務自動化的技術。作為這樣的技術的實例,已知利用了票單中包含的文字及圖形等的圖案識別處理的票單鑒別技術。在利用票單鑒別技術的多數票單鑒別系統中,存儲表示構成票單的格線的位置等票單形式的空票單,通過將輸入的票單和空票單進行比較,來鑒別票單的種類。
[0004]在現有技術中,在無法通過票單的形式來鑒別票單的種類的情況下,無法從多個票單的種類中確定一個票單的種類。
【發明內容】
[0005]實施方式的信息處理裝置具備:存儲部、受理部、識別部、確定部。存儲部存儲將多種票單的填寫信息按照所述票單的每個種類及填寫區域來蓄積的蓄積信息。受理部受理所述票單。識別部識別由所述受理部受理的所述票單中包含的所述填寫信息。確定部通過將所述蓄積信息和由所述識別部識別的所述填寫信息進行比較,確定由所述受理部受理的所述票單的種類。
【附圖說明】
[0006]圖1是識別實施方式的信息處理裝置的構成例的圖。
[0007]圖2是表示票單的例子的圖。
[0008]圖3A是表示實施方式的空票單的例子的圖。
[0009]圖3B是表示實施方式的填寫區域形式信息的例子的圖。
[0010]圖4是表示無法通過票單的形式信息來鑒別票單的種類的情況的例子的圖。
[0011]圖5是表示實施方式的信息處理方法的例子的流程圖。
[0012]圖6是識別實施方式的信息處理裝置的硬件構成的例子的圖。
【具體實施方式】
[0013]以下,參照附圖詳細說明信息處理裝置、信息處理方法及程序的實施方式。
[0014]圖1是表示實施方式的信息處理裝置100的構成例的圖。實施方式的信息處理裝置100具備:存儲部1、受理部2、識別部3、鑒別部4、確定部5、顯示控制部6、顯示部7及輸入部8。
[0015]存儲部I存儲信息。存儲部I存儲例如票單模型11、識別詞典12及蓄積信息13。票單模型11、識別詞典12及蓄積信息13的說明留待后述。
[0016]受理部2受理票單。受理部2將票單輸入到識別部3。
[0017]另外,受理部2受理票單的方法是任意的。受理部2受理例如表示票單的圖像。圖像例如可以是通過將票單掃描而讀取來制作的圖像文件,也可以是通過攝像機拍攝票單而制作的圖像文件。
[0018]圖2是表示票單的例子的圖。圖2表示在汽車銷售公司的業務中使用的票單的例子。例如,在商品名中記載著轎車A。以下,將票單中填寫的信息稱為填寫信息,將填寫了填寫信息的部位稱為填寫區域。例如圖2的票單的填寫區域是姓名、性別、住址、商品名、單價、個數及合計金額的欄。
[0019]回到圖1,識別部3從受理部2受理票單。識別部3識別票單的形式信息和票單中包含的填寫信息。
[0020]填寫信息包含表示填寫內容(文字串、記號及數字等)的信息和表示填寫內容的票單上的位置的信息。
[0021]形式信息是表示票單的形式的信息。形式信息例如包括表示構成票單的格線的位置的格線信息、表示預印文字串(輸入欄的說明等)的位置和內容的預印文字串信息、以及填寫區域形式信息。關于填寫區域信息的說明,參照圖3B留待后述。
[0022]具體地說,識別部3利用識別詞典12來識別形式信息及填寫信息。識別詞典12是用于識別文字及圖形等的圖案的詞典,將從圖案得到的特征信息和與其對應的文字種類或圖形圖案種類建立關聯地存儲。識別部3根據通過進行圖案識別處理而得到的圖案識別結果信息,使用識別詞典12來識別票單的形式信息及填寫信息。
[0023]識別部3將形式信息輸入到鑒別部4。此外,識別部3將填寫信息輸入到確定部5。
[0024]鑒別部4從識別部3受理形式信息。鑒別部4通過將形式信息和票單模型11進行比較,鑒別票單的種類。此外,鑒別部4通過將形式信息和票單模型11進行比較,判定是否能夠鑒別票單的種類。
[0025]在此,說明票單模型11。票單模型11按照每個票單的種類存儲空票單及填寫區域形式信息。
[0026]圖3A是表示空票單的例子的圖。如圖3A所示,空票單是填寫信息尚未填寫的狀態的票單。空票單表示構成票單的格線的位置和預印文字串(輸入欄的說明等)的位置和內容。在圖3A的例子中,預印文字串(輸入欄的說明等)是姓名、性別、男?女、住址、商品名、單價、個數及合計金額。
[0027]圖3B是表示填寫區域形式信息的例子的圖。填寫區域形式信息按照每個填寫區域表示在填寫區域填寫的填寫信息的輸入形式。在圖3B的填寫區域形式信息的例子中,例如姓名的填寫區域的輸入形式表示填寫了名字的名字區域。此外,在例如單價的填寫區域和合計金額的填寫區域填寫的填寫信息的輸入形式表示填寫金額的金額區域。另外,數字區域及金額區域也可以與位數等的信息建立關聯。
[0028]回到圖1,具體地說,鑒別部4將形式信息中包含的格線信息及預印文字串信息與票單模型11的空票單進行比較,將形式信息中包含的填寫區域形式信息與票單模型11的填寫區域形式信息進行比較。
[0029]鑒別部4能夠鑒別票單的種類的情況下,將表示一個票單的種類的信息輸入到確定部5。鑒別部4無法鑒別票單的種類的情況下,將表示通過鑒別部4的處理而確認的多個票單的種類的信息輸入到確定部5。
[0030]另外,鑒別部4的具體的鑒別處理可以使用任意的方法。例如可以使用專利文獻I公開的方法。
[0031]在此,說明鑒別部4無法通過形式信息來鑒別票單的種類的情況。
[0032]圖4是表示無法通過形式信息來鑒別票單的種類的情況的例子的圖。圖4表示票單A(九州汽車訂貨單)、票單B (東北化妝品訂貨單)及票單C(關東報申請單)的空票單的例子。票單A和票單C、以及票單B和票單C能夠通過形式信息區分,但是票單A和票單B無法通過形式信息來區分。因此,由受理部2受理的票單為票單A的情況下,鑒別部4將形式信息中包含的格線信息及預印文字串信息和票單模型11的空票單進行比較時,由于票單A及票單B —致,因此無法鑒別票單的種類。
[0033]參照填寫區域形式信息的情況也同樣,鑒別部4將形式信息中包含的填寫區域形式信息和票單模型11的填寫區域形式信息進行比較時,票單A及票單B—致,因此無法鑒別票單的種類。
[0034]回到圖1,確定部5從識別部3受理填寫信息,從鑒別部4受理表示票單的種類的信息。在從鑒別部4受理的表示票單的種類的信息為多個的情況下,確定部5按照每個票單的種類將填寫信息和蓄積信息13進行比較,從而確定票單的種類。
[0035]在此,說明蓄積信息13。蓄積信息13將多種票單的填寫信息按照票單的每個種類及填寫區域蓄積。例如,蓄積信息13按照票單的每個種類及填寫區域表示由識別部3在過去識別的多個填寫信息。這種情況下,存儲過去識別的填寫信息本身、或者在識別后人工修改的填寫信息。存儲的填寫信息可以將識別到的多個填寫信息全部存儲,也可以存儲過去的一定期間的填寫信息。
[0036]此外,蓄積信息13也可以存儲加工或統計的填寫信息。即,蓄積信息13的存儲形式可以是任意的。例如,與圖2例示的票單的商品名的欄對應的填寫區域的情況下,可以像轎車A、轎車B、卡車C、旅行車A、轎車B、..?那樣單純地作為時間序列的填寫履歷來存儲蓄積信息13。此外,例如可以像轎車A:100、轎車B:50、轎車C:70、..?那樣將名稱和名稱的出現次數作為組來存儲蓄積信息13。
[0037]此外,蓄積信息13將表示填寫信息的類別的類別信息與填寫信息建立關聯地存儲。類別是根據填寫信息的填寫內容來分類的信息。例如,填寫內容為轎車A的情況下,類別為汽車。此外,例如填寫內容為口紅A的情況下,類別為化妝品。
[0038]表示從鑒別部4受理的票單的種類的信息為多個的情況下,具體地說,確定部5基于規定的算式來計算票單的種類的可靠度P,按照可靠度P從高到低的順序將多個票單的種類排序。在此,說明計算可靠度P的規定的算式。確定部5例如通過下述式(I)來計算可靠度P。
[0039]P = wl XA+w2XB+w3XC...(I)
[0040]在此,wl、w2及w3是表不規定的權重的常數。此外,A是表不填與彳目息是否包含在蓄積信息13中的變量。例如,填寫信息包含在蓄積信息13中的情況下,設為A = 1,填寫信息不包含在蓄積信息13中的情況下,設為A = O0此外,B是表示填寫信息在蓄積信息中包含的比例)的變量。例如,B取O?I的值。此外,C是表示與填寫信息同一類別的填寫信息在蓄積信息中包含的比例)的變量。例如C取O?I的值。
[0041]具體說明式(I)的計算結果。在此,說明使用圖4的票單A(九州汽車訂貨票)及票單B (東北化妝品訂貨票)的商品名的欄(商品名區域)來計算可靠度P的情況。另外,為了簡單起見,設為wl = w2 = w3 = I ο具體說明填寫信息的填寫內容為轎車A的情況。在蓄積信息13的票單A的商品名區域包含轎車A,轎車A的比例為50%,在與轎車A相同的類別即汽車中包含的填寫信息的比例為80%。此外,在蓄積信息13的票單B的商品名區域包含轎車A,轎車A的比例為1%,在與轎車A相同的類別即汽車中包含的填寫信息的比例為2%。
[0042]這時,票單的種類為票單A的情況下的可靠度P為P = 1+0.5+0.8 = 2.3。此外,票單的種類為票單B的情況下的可靠度P為P = 1+0.01+0.02 = 1.03。由此,確定部5在受理部2受理了票單A時,即使在鑒別部3無法通過形式信息來鑒別票單的種類的情況下,也能夠確定出可靠度P高的票單為票單A。
[0043]另外,確定部5可以按照每個票單來任意地決定計算可靠度P時使用的填寫區域。此外,確定部5也可以基于多個填寫區域的可靠度P來確定票單。此外,確定部5