一種基于清分機的多國紙幣序列號字符識別方法
【技術領域】
[0001] 本發明屬于自動識別技術領域,特別地設及一種基于清分機的多國紙幣序列號字 符識別方法,在模板訓練部分中設及了邏輯回歸模型。
【背景技術】
[0002] 字符模板生成是紙幣序列號字符識別的重要步驟。紙幣序列號識別首先用預訓練 的方式產生字符模板,然后通過將輸入的字符圖像與字符模板進行匹配而得到識別結果。 因此字符模板生成該個步驟對后續識別結果影響較大。
[0003] W往的字符模板生成往往是通過手工調試產生的,調試的方法是首先獲得每個字 符的統計矩巧
【主權項】
1. 一種基于清分機的多國紙幣序列號字符識別方法,其特征在于,該方法為:首先對 序列號圖像I進行分割,獲得多個字符的圖像,將每個字符的圖像的大小歸一化為mXn,即 歸一化后的字符圖像X e Rmx",IT…表示m行η列的實數矩陣;在此基礎上,歸一化后的字 符圖像X按以下步驟進行處理: 步驟1 :首先對此字符圖像X進行二值化處理,獲得該字符圖像X的二值化矩陣 X'e股_,然后將此二值化矩陣V轉換為二值化向量i e ITm。其中,二值化處理所使用的 閾值通過雙峰法計算得到。 步驟2 :將二值化向量i與模板集W中的各個子模板進行匹配。匹配的方法是將 二值化向量分分別與各個子模板進行點乘,并對點乘獲得乘積矩陣的各個元素求和, 得到元素總和r,若i與字符k的匹配子模板W k點乘時,元素總和r取得最大值,即
2' = 1,2,···,_,則k即為識別結果。
2. 根據權利要求1所述的方法,其特征在于,所述步驟2中的模板集W中的各個子模板 通過以下方法得到: (2. 1)輸入N個字符圖像,獲得各個圖像的二值化向量。所述二值化向量通過以下 方式得到:首先對輸入的每個字符圖像進行二值化處理,獲得該字符圖像的二值化矩陣 之,戶H·!,然后將此二值化矩陣X'』轉換為二值化向量七eE?。其中,二值 化處理所使用的閾值通過雙峰法計算得到。將這N個字符圖像的二值化向量作為訓練集X 中的元素,組成訓練集X,即1 = _丨無,毛,…,4}。 (2. 2)根據訓練集X,得到任一字符c的預匹配模板W。為:W。= argmaxl ( Θ ) 其中:
,Yj為真實標記值,為〇或1,字符 C的標記值為1,其它字符的標記值為O ;Xj為訓練集X中的第j個元素,即Z7 =七,函數
應用梯度下降法進行迭代即可求解出最優參數W。,每次迭代中,參數Θ根據下式進行 更新直至收斂:
(3)對字符C的預匹配模板W。進行定點化操作,得到字符C的預匹配模板W /,具體方 式如下: ffcF= (ff c-min (Wc)). / (max (Wc) -min (Wc)) * (2P-1) 其中./是點除操作,P是定點化時模板w。中每個元素所需轉化成的整數位數。
【專利摘要】本發明實施例公開了一種基于清分機的多國紙幣序列號字符識別方法,對序列號圖像進行分割,獲得多個字符的圖像,將每個字符的圖像的大小歸一化,在此基礎上,對歸一化后的字符圖像x按以下步驟處理:對x進行二值化處理,獲得字符圖像的二值化矩陣x′,并將其轉換為二值化向量其中,二值化處理所使用的閾值通過雙峰法計算得到。然后通過對訓練集X訓練,產生模板集W各個子模板的結果。最后將此模板W與字符圖像進行匹配,獲得識別結果。
【IPC分類】G06K9-62
【公開號】CN104866867
【申請號】CN201510253055
【發明人】于慧敏, 施成燕, 李天豪
【申請人】浙江大學
【公開日】2015年8月26日
【申請日】2015年5月15日