本公開屬于圖像處理領域,特別涉及一種對電子憑證圖像中的條碼進行定位的檢測裝置。
背景技術:
現有的條碼定位方法主要有基于紋理特征、使用離散余弦變換(DCT)、利用JPEG2000圖像、采用EPS格式圖像、多通道Gabor濾波技術等。但是以上各種方法都不同程度的存在準確度低、速度慢、魯棒性差、適應范圍有限等問題。
技術實現要素:
基于此,本公開揭示了一種對電子憑證圖像中的條碼進行定位的檢測系統,所述系統包括:adaboost分類器和條碼識別定位裝置;
所述adaboost分類器,用于將正樣本和負樣本分別生成正樣本描述文件和負樣本描述文件,并提取正樣本和負樣本的haar特征進行分類器訓練;
所述條碼識別定位裝置,用于根據所述分類器訓練的結果對各種電子憑證圖像中的條碼進行定位。
本公開所述的系統能夠通過對正負樣本集當中的電子憑證圖像中的條碼提取haar特征,并應用adaboost分類器進行訓練。根據訓練結果對各種電子憑證圖像中的條碼進行定位。實現了條碼定位速度快、準確率高、適應范圍廣、魯棒性好的效果。
附圖說明
圖1為本公開一個實施例中adaboost分類器訓練的流程圖;
圖2(a1)-(a8)為本公開一個實施例中haar特征中的邊緣特征示意圖;
圖2(b1)-(b4)為本公開一個實施例中haar特征中的線型特征示意圖;
圖2(c1)-(c2)為本公開一個實施例中haar特征中的中心特征示意圖;
圖2(d)為本公開一個實施例中haar特征中的對角線特征示意圖;
圖3(a)和圖3(b)為本公開一個實施例中正樣本的示意圖;
圖4(a)和圖4(b)為本公開一個實施例中負樣本的示意圖。
具體實施方式
下面結合附圖和具體的實施例對本公開進行進一步的說明;
在一個實施例中,本公開揭示了一種對電子憑證圖像中的條碼進行定位的檢測系統,所述系統包括:adaboost分類器和條碼識別定位裝置;
所述adaboost分類器,用于將正樣本和負樣本分別生成正樣本描述文件和負樣本描述文件,并提取正樣本和負樣本的haar特征進行分類器訓練;
所述條碼識別定位裝置,用于根據所述分類器訓練的結果對各種電子憑證圖像中的條碼進行定位。
在本實施例中,所述adaboost分類器訓練的流程如圖1所示;所述haar特征如圖2(a1)-(a8)、圖2(b1)-(b4)、圖2(c1)-(c2)、圖2(d)所示,分為:邊緣特征、線型特征、中心特征和對角線特征;這些特征組合成特征模板庫,特征模板內有白色和黑色兩種區域,并定義該模板的特征值為白色區域像素和,減去黑色區域像素和。本公開所述的系統能夠通過對正負樣本集當中的電子憑證圖像中的條碼提取haar特征,并應用adaboost分類器進行訓練。根據訓練結果對各種電子憑證圖像中的條碼進行定位。實現了條碼定位速度快、準確率高、適應范圍廣、魯棒性好的效果。
在一個實施例中,所述正樣本包括多個含有條碼的圖像;
所述正樣本具有相同的尺寸;
所述負樣本包括多個不含條碼的圖像;
所述多個負樣本的尺寸不小于正樣本的尺寸。
在本實施例中,將所有正樣本制作成相同的尺寸,是因為統一的尺寸是正樣本的特征要素之一,在進行分類器訓練時,當送入的樣本尺寸跟正樣本的尺寸不一致時,即判定為負樣本。
在一個實施例中,所述正樣本描述文件包括:存放正樣本的文件名、正樣本數目、各個正樣本在圖像中的位置和各個正樣本的大小。
在本實施例中,制作正樣本的過程為:將所有條碼正樣本裁切好,并對尺寸做規整(即縮放至指定統一大小),保存成灰度圖。制作一個正樣本描述文件,用于描述正樣本文件名(包括絕對路徑或相對路徑),正樣本數目以及各正樣本在圖像中的位置和大小,正樣本如圖3(a)和圖3(b)所示。
在一個實施例中,所述負樣本描述文件包括:存放負樣本文件名及存放負樣本的絕對或相對路徑名。
在本實施例中,制作負樣本,負樣本圖像是不含有條形碼的各種票據。制作一個負樣本描述文件,該文件包含所有負樣本的文件名及絕對(或相對)路徑名。負樣本圖像不需要歸一化到正樣本尺寸,大小只要不小于正樣本就可以,負樣本如圖4(a)和圖4(b)所示。
在一個實施例中,所述adaboost分類器還用于提取所有正樣本和負樣本的邊緣特征、線型特征、中心特征和對角線特征,并針對每種特征,將所有正樣本和負樣本按照特征值的升序或者降序進行排列。
在本實施例中,將所有樣本分為正樣本和負樣本,并將正樣本和負樣本分別按照特征值的升序進行排列,也可以按照特征值的降序進行排列。
在一個實施例中,所述adaboost分類器還用于將所有正樣本和負樣本分別按照邊緣特征、線型特征、中心特征和對角線特征進行分類,組成邊緣弱分類器、線型弱分類器、中心弱分類器和對角線弱分類器,并將該些弱分類器中的每個弱分類器信息保存到臨時文件中;
所述每個弱分類器信息是指將樣本送入某個弱分類器進行訓練后生成的訓練結果信息。
更優的,所述邊緣弱分類器、線型弱分類器、中心弱分類器和對角線弱分類器信息共同組成了adaboost級聯強分類器信息。
更優的,所述訓練結果信息包括:弱分類器所在路徑、正樣本文件名、訓練弱分類器的正負樣本數量、預計可用的內存大小、該弱分類器的最小命中率、該弱分類器的最大錯誤報警率、haar特征種類。
在一個實施例中,將所述adaboost級聯強分類器信息寫入一個XML文件中。
在本實施例中,所述XML文件為adaboost級聯強分類器生成的文件,通過適當的傳參方式可供后續的功能模塊解析,如有特殊要求也可使用其他格式的文件,如TXT格式等。
在一個實施例中,所述條碼識別定位裝置將待識別定位的電子憑證圖像加載到adaboost級聯強分類器中,利用XML文件中的adaboost級聯強分類器信息在該圖像中定位條碼。
在本實施例中,所述之前的分類結果是指存放在XML文件中所述adaboost級聯強分類器信息。
在一個實施例中本公開揭示了一種對電子憑證圖像中的條碼進行定位的檢測系統。該系統主要包括adaboost分類器訓練和電子憑證圖像條碼識別定位兩個部分。
其中adaboost分類器訓練,將準備好的正負樣本分別放入兩個文件夾中,生成正負樣本描述文件,提取樣本的haar特征進行分類器訓練。
haar特征分為這幾類:邊緣特征、線型特征、中心特征和對角線特征;組合成特征模板庫,特征模板內有白色和黑色兩種區域,并定義該模板的特征值為白色區域像素和,減去黑色區域像素和。
adaboost分類器的基本方法就是通過訓練大量的訓練集形成不同的弱分類器,再將它們按照既定方法聯合起來,這樣就形成了一個本身功能相對更為強大的級聯強分類器。
經過adaboost分類器的訓練過程,得到一個根據haar特征構造成的弱分類器級聯而成的強分類器。將待定位條碼的電子憑證圖像送入該分類器,可以快速準確的得到條碼定位的結果。
盡管以上結合附圖對本公開的實施方案進行了描述,但本公開并不局限于上述的具體實施方案和應用領域,上述的具體實施方案僅僅是示意性的、指導性的,而不是限制性的。本領域的普通技術人員在本說明書的啟示下和在不脫離本公開權利要求所保護的范圍的情況下,還可以做出很多種的形式,這些均屬于本公開保護之列。