一種高像素文檔拍攝方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及文檔拍攝識別領(lǐng)域,具體涉及一種高像素文檔拍攝方法,及實施該方 法的裝置。
【背景技術(shù)】
[0002] 目前,市場上主要以USB2.0接口 500萬及以下像素攝像頭做為精拍儀(高拍儀) 產(chǎn)品的拍攝部,在拍攝證件時,往往不能得到高分辨率、較高DPI (每英寸的像素)的拍攝圖 像,一些較小的字體,例如6、7號字,就不能清晰的拍攝并顯示出來,使與產(chǎn)品配合使用的 OCR識別軟件計算速度變慢、識別準(zhǔn)確率下降。
[0003] 如果僅僅采用提供攝像頭像素的辦法對6、7號字拍照,能夠達(dá)到較好清晰度、分 辨率的照片,使與產(chǎn)品配合使用的OCR識別軟件識別準(zhǔn)確率達(dá)到95%以上,則需要使照片 的分辨率高出500萬像素的2-3倍,照片的文件大小也會增加2-3倍,要求產(chǎn)品提供的照片 存儲空間快速增大、OCR處理速度顯著變慢,導(dǎo)致產(chǎn)品整體的運(yùn)行效率大幅降低、耗時大幅 提升,影響了產(chǎn)品整體的使用便捷性。
[0004] 因此,僅更換高像素的攝像頭,由于像素的提高,文件大小也隨之增大,從而降低 了圖像處理速度,使文檔獲取、處理、識別速度均顯著變慢,不能滿足使用者的要求,必須考 慮多方面的改進(jìn)。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的是針對現(xiàn)有技術(shù)的不足,提供一種高像素文檔拍攝方法,可以在增 加拍攝圖像的清晰度、分辨率、提高OCR識別率的同事,基本上不增加圖像的存儲空間需 求,也不增加 OCR的運(yùn)行處理負(fù)擔(dān),整體拍攝、處理、識別速度快,整體使用便捷性好。
[0006] 本發(fā)明還提供了一種實施該方法的裝置。
[0007] 本發(fā)明為實現(xiàn)上述目的所采用的技術(shù)方案是:
[0008] -種高像素文檔拍攝方法,其包括以下步驟:
[0009] (1)設(shè)置一文檔拍攝裝置,并于該文檔拍攝裝置上設(shè)置一高像素拍攝部;
[0010] ⑵設(shè)置一與所述高像素拍攝部電連接的圖像處理模塊,且該圖像處理模塊內(nèi)設(shè) 有圖像處理算法,對高像素拍攝部拍攝的文檔圖像進(jìn)行處理;
[0011] (3)工作時,所述高像素拍攝部獲取文檔原始圖像,并將文檔原始圖像信號轉(zhuǎn)換成 數(shù)字信號,傳輸至圖像處理模塊;
[0012] (4)圖像處理模塊首先對文檔背景部分顏色進(jìn)行識別,并計算出文檔背景顏色 值;
[0013] (5)獲取與背景顏色值有色差的圖像部分,提取該部分的像素點(diǎn),并將背景部分像 素點(diǎn)去除,得到文檔有效內(nèi)容圖像;
[0014] (6)對提取的文檔有效內(nèi)容圖像像素點(diǎn)進(jìn)行處理,并根據(jù)原始圖像,對受損的像素 點(diǎn)進(jìn)行補(bǔ)償;
[0015] (7)將步驟(6)獲得的圖像進(jìn)行縮小化處理后,通過傳輸接口,將得到的文檔有效 內(nèi)容圖像信息輸出、存儲,完成拍攝。
[0016] 所述高像素拍攝部為500萬像素以上的攝像模組。
[0017] 所述步驟(4)還包括:
[0018] (4. 1)在對文檔有效內(nèi)容圖像進(jìn)行獲取前,圖像處理模塊獲取圖像中比周圍像素 點(diǎn)暗的像素點(diǎn)的位置;
[0019] (4. 2)根據(jù)每個暗像素點(diǎn)在像素陣列中所處的位置,計算出亮度補(bǔ)償增益值;
[0020] (4. 3)圖像處理模塊通過高像素拍攝部,獲取周圍環(huán)境的色溫和明暗度,自動調(diào)整 補(bǔ)償增益值;
[0021] (4. 4)圖像處理模塊根據(jù)計算得出的補(bǔ)償增益值,對圖像的暗像素點(diǎn)進(jìn)行補(bǔ)償,獲 得亮度均勻的圖像。
[0022] 所述步驟(5)還包括:
[0023] (5. 1)通過高像素拍攝部輸出4~16行黑行;
[0024] (5. 2)圖像處理模塊統(tǒng)計高像素拍攝部輸入的黑行,得到RGB各個類型像素的黑 電平統(tǒng)計平均值;
[0025] (5. 2)根據(jù)統(tǒng)計的黑電平平均值,對提取文檔部分的像素點(diǎn)數(shù)據(jù)進(jìn)行矯正,獲得清 晰圖像。
[0026] 所述步驟(6)具體包括:
[0027] (6. 1)對獲取的文檔有效內(nèi)容圖像像素點(diǎn)進(jìn)行平滑處理;
[0028] (6. 2)對進(jìn)行平滑處理后的文檔有效內(nèi)容圖像像素點(diǎn),進(jìn)行降噪處理,獲取清晰的 文檔有效內(nèi)容圖像,并對比原始圖像,判斷獲取的文檔部分圖像是否完整;
[0029] (6. 3)如果獲取的文檔有效內(nèi)容圖像存在損傷,則通過像素點(diǎn)修復(fù)算法,對受到損 傷的圖像進(jìn)行像素補(bǔ)償。
[0030] 所述步驟(6)還包括:對文檔有效內(nèi)容圖像的像素點(diǎn)進(jìn)行整理,對于不連續(xù)的像 素點(diǎn)、像素點(diǎn)連續(xù)但有部分像素點(diǎn)與其他像素點(diǎn)色差較大、及不能形成字符或圖形輪廓的 部分,進(jìn)行去除,從而去除臟污對文檔有效內(nèi)容圖像的影響。
[0031] 通過自動對焦統(tǒng)計,對圖像的文字及圖形部分的輪廓進(jìn)行獲取,從實現(xiàn)文檔有效 內(nèi)容圖像的去雜和補(bǔ)償。
[0032] 對圖像進(jìn)行去雜和補(bǔ)償后,采用不變特征圖像識別算法,首先提取目標(biāo)的SIFT特 征向量,并建立Kd-Tree特征結(jié)構(gòu),使用BBF搜索策略完成特征點(diǎn)的匹配,接著建立目標(biāo)的 姿態(tài)變換空間對匹配點(diǎn)進(jìn)行HOUGH聚類,去除錯誤的匹配點(diǎn),最后對匹配點(diǎn)按照最小二乘 法擬合出目標(biāo)的姿態(tài)參數(shù),從而完成目標(biāo)的定位,并進(jìn)行圖像最后識別處理;
[0033] 邊緣算法為:
[0034]
[0035] 在某一方向η上是G(X,y)的一階方向?qū)?shù)為:
[0036]
[0037]
[0038] 式中:η式方向矢量,▽ G是梯度矢量。
[0039] 將圖像f (X,y)與Gn作卷積,同時改變η的方向,G n*f (X,y)取得最大值時的η就 是正交于檢測邊緣的方向。
[0040]
[0041 ]
[0042] A(x,y)反映了圖像(X,y)點(diǎn)處的邊緣強(qiáng)度,Θ是圖像(X,y)點(diǎn)處的法向矢量。
[0043] 凡是邊緣強(qiáng)度大于高閾值的一定是邊緣點(diǎn);凡是邊緣強(qiáng)度小于低閾值的一定不是 邊緣點(diǎn);如果邊緣強(qiáng)度大于低閾值又小于高閾值,則看這個像素的鄰接像素中有沒有超過 高閾值的邊緣點(diǎn),如果有,它就是邊緣點(diǎn),如果沒有,它就不是邊緣點(diǎn)。
[0044] 對非極大值抑制圖像作用兩個閾值τ?和τ 2,且2τ1~τ 2,從而可以得到兩個 閾值邊緣圖像Gl(x,y)和G2(x,y)。由于G2(x,y)使用高閾值得到,因而含有很少的假邊 緣,但有間斷(不閉合)。雙閾值法要在G2 (X,y)中把邊緣連接成輪廓,當(dāng)?shù)竭_(dá)輪廓的端點(diǎn) 時,該算法就在Gl(x,y)的8鄰點(diǎn)位置尋找可以連接到輪廓上的邊緣,這樣,算法不斷地在 Gl (X,y)中收集邊緣,直到將Gl (X,y)連接起來為止。
[0045] 所述步驟(7)具體包括:
[0046] (7· 1)于圖像處理模塊內(nèi)設(shè)置寄存器;
[0047] (7.2)通過寄存器對圖像大小進(jìn)行配置,將步驟(6)獲取的圖像縮小至原圖的 1/8~1/32,且最大輸入水平方向像素點(diǎn)為4416 ;
[0048] (7. 3)將縮小后的文檔圖像,通過USB3. 0或USB2. 0接口進(jìn)行輸出,完成拍攝。
[0049] 拍攝完成后,文檔有效內(nèi)容圖像傳輸至圖像顯示端,通過Depixelizing算法,對 圖像進(jìn)行處理后,顯示于顯示端。
[0050] 一種實施所述高像素文檔拍攝方法的裝置,其包括一文檔拍攝裝置,并于該文檔 拍攝裝置上設(shè)有一高像素拍攝部;一與所述高像素拍攝部電連接的圖像處理模塊,且該圖 像處理模塊內(nèi)設(shè)有圖像處理算法,對高像素拍攝部拍攝的文檔圖像進(jìn)行處理;工作時,所述 高像素拍攝部獲取文檔原始圖像,并將文檔原始圖像信號轉(zhuǎn)換成數(shù)字信號,傳輸至圖像處 理模塊;圖像處理模塊首先對文檔背景部分顏色進(jìn)行識別,并計算出文檔背景顏色值;獲 取與背景顏色值具有色差的圖像部分,提取該部分的像素點(diǎn),并將背景部分像素點(diǎn)去除,得 到文檔有效內(nèi)容圖像;對提取的文檔有效內(nèi)容圖像像素點(diǎn)進(jìn)行處理,并根據(jù)原始圖像,對受 損的像素點(diǎn)進(jìn)行補(bǔ)償;將獲得的圖像進(jìn)行縮小處理后,通過傳輸接口,將得到的文檔有效內(nèi) 容圖像信息輸出,完成拍攝。
[0051] 所述圖像處理模塊內(nèi)設(shè)有ISP數(shù)字圖像處理器,且于ISP數(shù)字圖像處理器中,集成 有高速圖像數(shù)據(jù)傳輸接口。
[0052] 所述ISP數(shù)字圖像處理器在對文檔有效內(nèi)容圖像進(jìn)行獲取前,獲取圖像中比周圍 像素點(diǎn)暗的像素點(diǎn)的位置;根據(jù)每個暗像素點(diǎn)在像素陣列中所處的位置,計算出亮度補(bǔ)償 增益值;通過高像素拍攝部,獲取周圍環(huán)境的色溫和明暗度,自動調(diào)整補(bǔ)償增益值;根據(jù)計 算得出的補(bǔ)償增益值,對圖像的暗像素點(diǎn)進(jìn)行補(bǔ)償,獲得亮度均勻的圖像。
[0053] 所述ISP數(shù)字圖像處理器,通過高像素拍攝部輸出4~16行黑行;統(tǒng)計高像素拍 攝部輸入的黑行,得到RGB各個類型像素的黑電平統(tǒng)計平均值;根據(jù)統(tǒng)計的黑電平平均值, 對提取文檔部分的像素點(diǎn)數(shù)據(jù)進(jìn)行矯正,獲得清晰圖像。
[0054] 所述ISP數(shù)字圖像處理器,對獲取的文檔有效內(nèi)容圖像像素點(diǎn)進(jìn)行平滑處理;并 進(jìn)行降噪處理,獲取清晰的文檔有效內(nèi)容圖像,對比原始圖像,判斷獲取的文檔部分圖像是 否完整;如果獲取的文檔有效內(nèi)容圖像存在損傷,則通過像素點(diǎn)修復(fù)算法,對受到損傷的圖 像進(jìn)行像素補(bǔ)償。
[0055] 本發(fā)明的有益效果是,通過采用高像素拍攝部、獲取高分辨率圖像的同事,采用獨(dú) 特算法,先行將文檔背景部分去除,通過區(qū)分圖像背景與圖像有效部分的色差,將背景像素 點(diǎn)去除,僅獲取圖像有效部分的像素點(diǎn),然后再進(jìn)行保存和后續(xù)處理,從而大大降低圖像大 小,同時采用高速ISP數(shù)字圖像處理器,及圖像縮小化算法,從而減少圖像文件大小、加快 圖像處理及后續(xù)OCR處理速度;使獲得的圖像具有足夠的分辨率和清晰度,滿足6、7號字的 準(zhǔn)確識別,OCR的識別準(zhǔn)確率可以達(dá)到98%以上,產(chǎn)品整體處理效率高、處理時間少、使用 便捷性好。
【具體實施方式】
[0056] 實施例:本實施例提供的一種高像素文檔拍攝方法,其包括以下步驟:
[0057] (1)設(shè)置一文檔拍攝裝置,并于該文檔拍攝裝置上設(shè)置一 500萬及以上的高像素 拍攝部;
[0058] (2)設(shè)置一與所述高像素拍攝部電連接的圖像處理模塊,且該圖像處理模塊內(nèi)設(shè) 有圖像處理算法,對高像素拍攝部拍攝的文檔圖像進(jìn)行處理;
[0059] (3)工作時,所述高像素拍攝部獲取文檔原始圖像,并將文檔原始圖像信號轉(zhuǎn)換成 數(shù)字信號,傳輸至圖像處理模塊;
[0060] (4)圖像處理模塊首先對文檔背景部分顏色進(jìn)行識別,并計算出文檔背景顏色 值;