專利名稱:一種郵政信封自動識別系統的制作方法
技術領域:
本實用新型屬于模式識別與人工智能技術領域,特別是涉及一種高速郵政 信封自動識別系統。
背景技術:
郵政信封自動識別技術是指通過計算機等設備將信封中的郵政編碼和地址 內容提取和識別出來,它是實現郵政系統自動化的關鍵技術之一。傳統的郵政 信封自動識別系統一般包括信封圖像的獲取、信封圖像的處理與識別等模塊。 圖像獲取模塊一般通過昂貴的高速掃描儀等設備采集信封圖像,還沒有使用攝 像頭在高速條件下采集到清晰的信封圖像的郵政信封識別系統。這是因為,一 般情況下用攝像頭抓拍信封圖像,往往會出現模糊或者拖尾等現象,使得圖像 處理與識別模塊很難達到較好的性能。而采用高速掃描儀采用信封圖像的不足 之處是,系統的成本很高(目前,高速掃描儀價格的價格在一百萬元人民幣左 右)。傳統的郵政信封自動識別系統的圖像處理與識別模塊僅對信封圖像中的郵 政編碼進行分割和識別(例如目前的郵政信封分揀系統),不能識別處理信封中 的郵政地址,無法滿足現代郵政系統急需的信封檢索、跟蹤等信函管理的霈要。 要適應現代郵政系統海量信封的高速實時處理,現有的圖像處理與識別技術也 無法滿足需要。現有的系統為了提高圖像處理質量和識別精度,往往在圖像處 理模塊采用復雜的圖像局部二值化方法和字符分割算法,在識別模塊釆用高維 的字符特征與復雜的分類算法,這些算法的處理速度難以滿足高速實時的郵政
系統的需要,因此需要研制適應高速信封處理的快速算法。另外,現有的郵政 處理系統也不具有高速實時地信封圖像數據庫壓縮存儲和檢索功能,無法實現 信封圖像的存檔和檢索,以及識別錯誤的后期校驗。隨著經濟的發展,越來越 多的企業、機關使用印刷體公函。郵政部門對海量的統一規范的信封處理提出
了各種新的業務需求,目前,還沒有能適應這些業務需求的、能夠處理10000 個信封以JL/小時的高速郵政信封自動識別方面的專利和系統,無法滿足現代郵
政系統自動化的實際需要。
實用新型內容
本實用新型的目的在于克服現有技術的不足,提供一種高速實時的郵政信 封自動識別系統,實現高速實時地提取和識別郵政信封中的郵政編碼和地址內 容,并可以高速實時地完成信封圖像的壓縮保存和檢索,以及條形碼的自動生 成和實時打印。
為了實現實用新型目的,采用的技術方案如下-
—種郵政信封自動識別系統,包括信封傳輸裝置,信封圖像獲取裝置,以 及信封圖像識別裝置,所述信封圖像獲取裝置獲取處于信封傳輸裝置上的信封 的圖像信息,并將信封圖像信息傳送至信封圖像識別裝置進行識別,所述信封 圖像識別裝置通過信封的圖像信息識別信封的特征信息,所述信封圖像獲取裝 置采用頻閃光源和與頻閃光源配合的高速攝像機。
所述信封傳輸裝置包括傳送帶及由激光傳感器和觸發電路組成的定位裝 置,所述定位裝置設置于傳送帶上方,通過激光傳感器在處于傳送帶上的信封
經過時所造成的反射光變化,作為觸發電路啟動一個使信封圖像獲取裝置拍攝
所經過的信封的圖像的觸發信號的要件。
所述系統還設置有條形碼打印機。
所述的信封圖像識別裝置所識別的信封的特征信息包括郵政編碼和地址。 所述的信封圖像識別裝置采用安裝有信封圖像識別軟件的計算機,所述信 封圖像識別軟件包括高速圖像采集模塊、圖像處理與識別模塊、條碼生成和打 印模塊、信封數據的壓縮保存和檢索模塊。
本實用新型的工作過程,包括信封的傳輸過程、信封圖像的獲取過程、以 及信封圖像的識別過程,所述信封的傳輸過程由信封傳輸裝置的傳送帶實現信 封的傳送,并通過定位裝置觸發信封圖像的獲取過程;所述信封圖像的獲取過 程通過頻閃光源配合高速攝像機抓拍處于傳送帶上的信封的圖像,并將所抓拍 的信封圖像傳送至作為信封圖像識別裝置的計算機;所述信封圖像的識別過程 通過高速圖像采集模塊接收高速攝像機抓取的信封圖像,再通過圖像處理和識 別模塊識別信封圖像中的郵政編碼、關鍵地址信息,并將識別結果發送到計算 機所設置的數據庫,同時通過條碼生成和打印模塊自動生成信封條形碼,并將 條形碼與該信封數據進行關聯,隨后通過信封數據的壓縮保存和檢索模塊將識
別結果連同條形碼進行壓縮保存,且具有信封圖像檢索信息。
所述信封圖像的識別過程的圖像處理和識別模塊的識別過程為依次對圖像 進行快速字符區域定位處理、基于全局和局部方法融合的快速二值化處理、快 速圖像傾斜檢測和校正處理、基于投影分析的字符粗分割處理、基于幾何特征 和識別可信度的字符精確分割處理,從而得到郵政編碼和地址內容的識別結果。 所述快速字符區域定位處理首先計算各像素點的水平梯度值和垂直梯度 值,在對字符區域的上下左右邊緣進行定位;
所述基于全局和局部方法融合的快速二值化處理對定位的字符區域采用全
局和局部融合的方法進行二值化,首先將待處理區域分割為NXN個子區域,然 后在每個子區域內以像素灰度值中值為閾值進行全局二值化;
所述快速圖像1i斜檢測和校正處理過程采用基于投影分析的傾斜角度檢測 方法對二值化圖像進行傾斜檢測和校正,首先在較大傾斜角度范圍內進行低分 辨率的的傾斜角度粗檢測,然后對粗檢測結果,在小傾斜角度范圍內進行精確 檢測,并據此進行圖像傾斜校正
所述基于投影分析的字符粗分割處理過程裉據投影分析對傾斜校正后的二 值化圖像進行行分割和字符分割,并利用郵政信封的布局模式去除噪聲分割塊, 得到字符粗分割結果;
所述基于幾何特征和識別可信度的字符精確分割處理利用粗分割結果建立 候選分割網絡,并根據字符的高度和寬度幾何信息和分類器給出的可信度,利 用動態規劃尋找最優分割路徑,從而得到識別結果。
所述基于幾何特征和識別可信度的字符精確分割處理的分類器采用基于 Gabor特征和LDA降維的字符識別模塊,該模塊提取待識別字符的Gaboi:特征, 并進行LDA降維,其分類方法首先利用LDA降維后的低維特征矢量進行識別, 選出字符的候選集合,然后再利用高維特征矢量在候選集合中確定字符的類別 以及可信度。
本實用新型還采用郵政編碼和關鍵地址的校正和提取模塊對基于幾何特 征和識別可信度的字符精確分割處理后的識別結果進行郵政編碼和關鍵地址的 校正和提取,首先建立中國所有的關鍵地址庫以及相應的郵政編碼庫,并根據 郵政信封的布局模式初步確定可能的郵政編碼行和地址行,然后,從初步確定 的地址行首開始,依次在關鍵地址庫的省名庫中搜索最佳匹配的省名,在關鍵
地址庫的市名庫中搜索最佳匹配的市名,在關鍵地址庫的縣名庫中搜索最佳匹 配的縣名,并計算相應郵政編碼與識別結果中的郵政編碼的匹配度。
本實用新型的郵政信封識別系統包括硬件系統和軟件系統。軟件系統與硬 件系統相互配合,完成信封圖像的采集、圖像處理與字符分割、識別處理和郵 政編碼與關鍵地址提取、圖像與識別結果的壓縮保存、以及條形碼生成和打印, 從而使本系統具有了如下功能-
(a) 高速郵政信封圖像的采集;
(b) 郵政信封中地址的高速精確識別和郵政編碼與關鍵地址的提取;
(C)包括信封圖像、郵政地址、郵政編碼與關鍵地址在內信封數據的壓縮 保存和檢索
(d)郵政信封的條形碼自動生成和實時打印。
本實用新型的識別系統對郵政信封圖像的采集運用頻閃光源配合高速攝像 機抓拍高速運動的信封。由于印刷體上的字體屬于較小的目標,且處于高速運 動狀態,如果快門速度太大,感光將不充分,從而造成成像模糊,快門速度太 小感光太久也會產生運動模糊和拖尾現象。 一般相機很難清楚地拍到清晰的字
體圖像,本實用新型由于采用高速攝像機,快門速度為100us,配合頻閃光源, 在信封到達的瞬間觸發頻閃光源,使之成像,然后頻閃光源在極短的時間消失, 有效地去除了所拍攝字符的運動模糊現象。
而且通過軟件系統的相互結合,使得本實用新型不僅可以完成高速郵政信 封的圖像采集、壓縮保存和檢索,還可以完成高速郵政信封的郵政編碼和地址 的高精度識別和關鍵地址提取,以及條碼生成和打印。該系統成本較低,魯棒 性好,自動化程度高,在高速郵政信封的處理系統中具有良好的應用前景。
本實用新型與現有的郵政信封自動處理系統相比,具有如下的優點-
(1) 利用髙速抓拍攝像頭代替高速掃描儀采集圖像,使得本實用新型的造 價低廉,高速掃描儀的價格在一百萬元人民幣左右,而本實用新型所搭建的攝 像頭系統的成本不足三萬元人民幣。
(2) 由于采用了高速攝像機和頻閃光源,本系統可以高速實時地采集到髙 清晰度的信封圖像,并進行壓縮保存到數據庫,從而較好地解決了信封圖像的 歸檔問題,并為后續的圖像處理和識別提供了良好條件。
(3) 由于采用了快速圖像處理算法和快速識別算法,配合本系統的高速圖 像采集模塊,本系統可以在無人干預的情況下,高速度高精確度地識別和提取 信封中的郵政編碼和地址內容。對于50個字符左右的信封,處理速度可以達到 18000個信封/小時,從而較好地解決了高速郵政信封的自動識別問題。
(4) 本系統不僅可以高速實時地打印條形碼,還可以實現所提取郵政編碼 和地址與條形碼的關聯,方便了郵政系統的條形碼管理工作。
(5) 由于采用的高速網卡和快速圖像壓縮存儲方法,本系統可以高速實時 地保存信封圖像,一個100G的普通硬盤一般可以保存3個月的信封數據。所 保存的數據不僅包括信封圖像,還包括郵政編碼和地址內容,以及所打印的條 形碼。相對于只處理郵政編碼信息的傳統郵政系統,本系統能滿足客戶多方面 的需求,具有明顯的優越性。
(6) 本系統所提取的郵政編碼和地址內容,以及與之關聯的信封圖像和條 形碼,可以用于郵政系統的信函跟追、檢索等管理工作,從而較好地解決了現 代郵政系統對高速郵政信封的自動化識別處理的需要。
圖1是本實用新型高速郵政信封自動識別系統的整體結構示意圖2是本實用新型的信封處理流程框圖3是本實用新型的圖像處理與識別模塊的流程圖。
具體實施方式
以下結合附圖對本實用新型作進一步具體的描述。
附圖l為本實用新型的整體結構示意圖,由圖l可見,本實用新型包括硬 件系統和軟件系統,二者相互配合共同完成本系統的功能。
所述硬件系統包括信封傳輸帶1、信封定位裝置3、頻閃光源4、高速攝像 機和支架5、高性能電腦6、高速打印機7。所述軟件系統安裝于電腦6中,軟 件系統包括高速圖像采集模塊a、快速字符區域定位模塊l3、基于全局和局部 方法融合的快速二值化模塊c、基于2級檢測的快速圖像傾斜檢測和校正模塊d、 基于投影分析的字符粗分割模塊e、基于幾何特征和識別可信度的字符精確分 割模塊f、基于Gabor特征和LDA降維的字符識別模塊g、郵政編碼和關鍵地 址的校正和提取模塊h、信封圖像的快速壓縮保存模塊i、信封圖像數據庫的檢 索模塊j、條形碼自動生成和打印模塊k。
所述信封傳輸帶1由傳輸帶和真空汞以及速度調整機械裝置組成,用戶只 要將疊好的信封2放在傳輸帶上設定好速度后,就能自動地傳輸信封。信封定 位裝置3由激光傳感器和單片機控制電路組成,信封2經過傳感器的時候造成 傳感器反射光的變化,單片機控制電路根據傳輸帶1的速度和傳感器與攝像頭 5的距離計算出信封2到達攝像頭5拍攝點的時間,并通過電路觸發高速攝像 頭5和頻閃光源4抓拍信封圖像。
所述攝像機5和頻閃光源4接受來自外部的信封到達觸發信號,實現高速
信封圖像拍攝,并發送信號給所述軟件系統的采集模塊a,采集模塊a將圖像 從攝像機內部緩存讀取到計算機6中開辟的圖像緩存。
附圖2示出了本實用新型的信封處理流程框圖,其處理流程為系統首先 初始化,其中包括字符集(簡體、繁體)選擇、信封布局模式選擇(郵政編碼 與郵政地址的相對位置)等。完成初始化以后,本系統處于等待狀態,每當接 到信封定位裝置3的"信封到達"觸發信號后,在高性能電腦6的控制下,自 動地向高速攝像機5和頻閃光源4發出控制信號,實時抓拍髙速運動信封2的 圖像,同時將信封圖像傳回本系統的圖像處理和識別模塊進行快速處理。圖像 處理和識別模塊給出信封中地址的識別結果,并提取出信封郵政編碼、關鍵地 址。然后,系統通過高速網卡將傾斜校正后的二值化信封圖像,以及信封中地 址識別結果和所提取的郵編、關鍵地址等數據發送到數據庫。本系統的數據庫 接到信封數據后,自動生成信封條形碼,并將條形碼與該信封數據進行關聯。 隨后本系統一方面將條形碼發送給信封傳輸裝置配備的高速打印機7,在相應 信封上打印條形碼,另一方面將信封數據(包括條形碼、地址識別結果和所提 取的郵編、關鍵地址等)進行壓縮保存,并具有信封圖像檢索功能。
附圖3示出了本實用新型的圖像處理與識別模塊的流程圖,圖像處理與識 別模塊的流程圖為本系統的圖像處理模塊接收到信封圖像后,將依次對圖像 進行快速字符區域定位處理、基于全局和局部方法融合的快速二值化處理、快 速圖像傾斜檢測和校正處理、基于投影分析的字符粗分割處理、基于幾何特征 和識別可信度的字符精確分割處理,并得到郵政編碼和地址內容的識別結果。 然后,系統根據郵政信封中郵政編碼和地址的布局模式,對上述識別結果中的 郵政編碼和關鍵地址進行校正,并提取出郵政編碼和關鍵地址。
所述快速字符區域定位模塊b首先計算各像素點的水平梯度值和垂直梯度 值。字符區域的上下邊緣定位過程為在水平方向上,若某像素點的水平梯度 值大于設定閾值,則標記該點為筆畫邊緣點,并統計各水平線上的筆畫邊緣點 數。若筆畫邊緣點數大于設定閾值,則標記該水平線為字符線。然后,從圖像 的水平筆畫穿越數最大的水平線分別向上下掃描,若存在連續T條水平線為非 字符線(T為設定閾值),則當前字符線為所定位字符區域的上(下)邊緣。字 符區域的左右邊緣定位過程類似。
所述基于全局和局部方法融合的快速二值化模塊C對快速字符區域定位模 塊b中定位的字符區域進行二值化。這里將全局和局部方法進行融合,首先將 待處理區域分割為NXN個子區域,然后在每個子區域內以像素灰度值中值為閾 值進行全局二值化。這里N為常數,其數值由現有實驗確定。
所述基于2級檢測的快速圖像傾斜檢測和校正模塊d對基于全局和局部方 法融合的快速二值化模塊c中的二值化圖像進行傾斜檢測和校正。這里基本算 法采用基于投影分析的傾斜角度檢測方法。為了加快檢測速度,首先在較大傾 斜角度范圍內進行低分辨率的的傾斜角度粗檢測,檢測精度較低而時間復雜度 小。然后對粗檢測結果,在小傾斜角度范圍內進行精確檢測,并據此進行圖像 傾斜校正。這樣既能具有較大的傾斜角度檢測范圍,又能得到較高檢測精度和 較小的檢測時間。
所述基于投影分析的字符粗分割模塊e根據投影分析對傾斜校正后的二值 化圖像進行行分割和字符分割,并利用郵政信封的布局模式去除噪聲分割塊, 得到字符粗分割結果。
所述基于幾何特征和識別可信度的字符精確分割模塊f利用粗分割結果建
立候選分割網絡,并根據字符的高度和寬度等幾何信息和分類器給出的可信度, 利用動態規劃尋找最優分割路徑,從而得到識別結果。
所述基于Gabor特征和LDA降維的字符識別模塊g為基于幾何特征和識 別可信度的字符精確分割模塊f提供分類器。該模塊提取待識別字符的Gabor 特征,并進行LDA降維。這里的分類方法首先利用IJ)A降維后的低維特征矢 量進行識別,選出字符的候選集合,然后再利用高維特征矢量在候選集合中確 定字符的類別以及可信度。這樣該識別方法既可以獲得較高的識別精度,又具 有較快的識別速度。
所述郵政編碼和關鍵地址的校正和提取模塊h根據基于幾何特征和識別可 信度的字符精確分割模塊f的識別結果進行郵政編碼和關鍵地址的校正和提 取。這里的關鍵地址是指地址中的省(或自治區)市縣(或盟、自治州)名稱 等。本模塊首先建立中國所有的關鍵地址庫以及相應的郵政編碼庫,并根據郵
政信封的布局模式(如郵政編碼位于地址行的上方還是最下方)初步確定可能 的郵政編碼行和地址行。然后,從初步確定的地址行首開始,依次在關鍵地址 庫的省(或自治區)名庫中搜索最佳匹配的省名,在關鍵地址庫的市名庫中搜 索最佳匹配的市名,在關鍵地址庫的縣(或盟、自治州)名庫中搜索最佳匹配 的縣(或盟、自治州)名,并計算相應郵政編碼與識別結果中的郵政編碼的匹 配度。這里字符串的匹配度量采用編輯距離(Edit Distance)。最后應用如F規 則進行郵政編碼和關鍵地址的校正,并提取相應的關鍵地址
(1) 若省名完全匹配且市或縣名完全匹配,則校正郵政編碼;
(2) 若省名完全匹配,市或縣名部分匹配且郵政編碼完全匹配,則校正市 或縣名(3) 若省名部分匹配,市或縣名完全匹配,則校正省名及郵政編碼;
(4) 若省名部分匹配,市或縣名部分匹配且郵政編碼完全匹配,則校正省 和市或縣名;
(5) 若規則(1) ~ (4)均不滿足,而市名完全匹配,則校正郵政編碼;
(6) 若規則(1) ~ (4)均不滿足,而市名部分匹配且郵政編碼完全匹配, 則校正市名。
所述信封圖像的快速壓縮保存模塊i通過高速網卡將基于2級檢測的快速 圖像傾斜檢測和校正模塊d中傾斜校正后的二值化圖像傳輸到數據庫,并進行 快速壓縮保存,并與該信封圖像對應的條形碼進行關聯。
所述信封圖像數據庫的檢索模塊j完成信封圖像數據庫中的歸檔圖像的檢 索,檢索內容包括信封圖像及其生成日期、對應的郵政編碼和地址、條形碼等。
所述條形碼自動生成和打印模塊fc自動生成條形碼,并利用外部系統提供 的高速打印機在對應信封上實時打印條形碼。
權利要求1、一種郵政信封自動識別系統,包括信封傳輸裝置,信封圖像獲取裝置,以及信封圖像識別裝置,所述信封圖像獲取裝置獲取處于信封傳輸裝置上的信封的圖像信息,并將信封圖像信息傳送至信封圖像識別裝置進行識別,所述信封圖像識別裝置通過信封的圖像信息識別信封的特征信息,其特征在于所述信封圖像獲取裝置采用頻閃光源和與頻閃光源配合的高速攝像機。
2、 根據權利要求1所述的郵政信封自動識別系統,其特征在于所述信封 傳輸裝置包括傳送帶及由激光傳感器和觸發電路組成的定位裝置,所述定位裝 置設置于傳送帶上方,通過激光傳感器在處于傳送帶上的信封經過時所造成的 反射光變化,作為觸發電路啟動一個使信封圖像獲取裝置拍攝所經過的信封的 圖像的觸發信號的要件。
3、 根據權利要求1或2所述的郵政信封自動識別系統,其特征在于所述 系統還設置有條形碼打印機。
4、 根據權利要求3所述的郵政信封自動識別系統,其特征在于所述的信 封圖像識別裝置采用安裝有信封圖像識別軟件的計算機,所述信封圖像識別軟 件包括高速圖像采,塊、圖像處理與識別模塊、條碼生成和打印模塊、信封 數據的壓縮保存和檢索模塊。
專利摘要本實用新型提供一種郵政信封自動識別系統,包括硬件系統和軟件系統,硬件系統包括信封傳輸裝置,信封圖像獲取裝置,以及信封圖像識別裝置,所述信封圖像獲取裝置采用頻閃光源和與頻閃光源配合的高速攝像機。所述圖像識別裝置包括高速圖像采集模塊、圖像處理與識別模塊、條碼生成和打印模塊、信封數據的壓縮保存和檢索模塊。本實用新型不僅可以完成高速郵政信封的圖像采集、壓縮保存和檢索,還可以完成高速郵政信封的郵政編碼和地址的高精度識別和關鍵地址提取,以及條碼生成和打印。成本低,魯棒性好,自動化程度高,在高速郵政信封的處理系統中具有良好的應用前景。
文檔編號G06K17/00GK201054150SQ20062015480
公開日2008年4月30日 申請日期2006年12月15日 優先權日2006年12月15日
發明者何智杰, 彬 張, 金連文, 學 高 申請人:華南理工大學