專利名稱:文本圖像的桶形畸變校正方法
技術領域:
本發明涉及一種在文本圖像的文件識別中對發生桶形畸變的文本圖像進行校正的數字圖像處理方法,屬于圖像處理技術領域。
背景技術:
隨著科學技術的迅猛發展,成像技術已經廣泛應用于軍事、醫療、媒體、安全管理等各個領域,這項技術的關鍵之處在于采集到的圖像是否能夠還原出實際圖像以準確的反應客觀信息。事實上,由于圖像采集系統硬件的固有特征、軟件算法的局限性以及各種系統外的因素都會對采集到的圖像造成不同程度的失真。雖然硬件工藝和軟件算法設計上都在不斷的改進和完善,但這些客觀因素對于成像的失真影響也僅能降低而無法從根本上消除。比如廣角鏡頭的大視角會對成像帶來不可避免的幾何畸變,如
圖1A至IC所示,標準柵格可能會畸變成枕形柵格和桶形柵格等,而在這些幾何畸變中,最主要的當屬桶形畸變。目前學術界普遍存在兩大類方法對圖像的桶形畸變進行抑制:一種是利用光學成像方法對圖像的桶形畸變進行抑制,另一種是利用數字圖像處理方法減小畸變。其中第一種方法是在成像前,對將要產生的畸變運用光學方法進行抑制,簡單的說就是在成像過程中利用鏡片通過光線折射等方法迫使拍攝的圖像直接逼近實物,但實現此方法的光學成像系統設計既復雜難度又大,而且制造工藝較困難也會增加光學系統的制造成本,因此目前的畸變校正一般不采用此方法。第二種方法是在成像后,利用數字圖像處理技術實現圖像的畸變校正,使校正處理后的圖像逼近實物。相對于光學處理方式,這種方法不需要嚴格的光學工藝,成本較低,而且可根據使用的環境和實際需要對算法進行改進,因此現在國內外多采用第二種方法進行校正圖像桶形畸變的研究。而當前運用數字圖像處理技術進行畸變校正的一般方法是:先選定一個特定的參數,然后針對某一固定鏡頭在一固定的拍攝參數(如焦距)下拍攝到的產生桶形畸變的圖像進行處理,處理后得到一個畸變像素點與其正確位置的映射關系模板,隨后只要是在這些特定參數下同樣產生桶形畸變的圖像,即在該相同的特定參數、相同的鏡頭及相同的拍攝參數下所獲得的圖像,都可直接調用此映射關系模板進行校正,校正效果良好。但是,由于這種校正方法要求參數固定,因而具有較大的局限性,使用者一旦更換了鏡頭或是調整了焦距等相關硬件參數,校正結果便無法再達到預期的效果。
發明內容
鑒于上述原因,本發明的目的在于提供一種無需考慮硬件參數,即可大幅地降低桶形畸變文本圖像的失真度的自適應文本圖像校正方法。為實現上述目的,本發明采用以下技術方案:一種文本圖像的桶形畸變校正方法,包括以下步驟:I)首先將待處理的文本圖像進行圖像的預處理,得到預處理后的文本圖像;2)對該預處理后的文本圖像進行膨脹處理,得到膨脹處理后的文本圖像;
3)將該膨脹處理后的文本圖像中的每行文本圖像分別獨立出來,且該每行文本圖像均具有一連通域;4)對該獨立出來的每行文本圖像分別進行坐標調整,得到校正后的每行文本圖像;5)將該校正后的每行文本圖像重新合并成完整的文本圖像。所述步驟4)包括以下步驟:41)對所述獨立出來的每行文本圖像分別進行水平投影,得到所述每行文本圖像的最聞點縱坐標和最低點縱坐標;42)對所述每行文本圖像中的連通域進行從上到下、從左到右的遍歷以得到一坐標映射關系表;43)根據該坐標映射關系表,對所述每行文本圖像進行轉換調整,得到所述校正后的每行文本圖像。所述步驟I)圖像的預處理指按照圖像的灰度化、二值化、去噪濾波的步驟對圖像進行處理。所述步驟2)對預處理后的文本圖像進行膨脹處理的具體方法是:使用結構元素B來遍歷原始二值化圖像X圖像區域中的每個像素點,設X圖像中和結構元素B中心點重合的像素點坐標為(X,y),如果結構元素B和X圖像中目標區域的交集非空,就將坐標(X,y)設置成目標像素點,以此實現目標區域的向外擴張;膨脹處理的公式為:
權利要求
1.一種文本圖像的桶形畸變校正方法,其特征在于:它包括以下步驟: 1)首先將待處理的文本圖像進行圖像的預處理,得到預處理后的文本圖像; 2)對該預處理后的文本圖像進行膨脹處理,得到膨脹處理后的文本圖像; 3)將該膨脹處理后的文本圖像中的每行文本圖像分別獨立出來,且該每行文本圖像均具有一連通域; 4)對該獨立出來的每行文本圖像分別進行坐標調整,得到校正后的每行文本圖像; 5)將該校正后的每行文本圖像重新合并成完整的文本圖像。
2.根據權利要求1所述的文本圖像的桶形畸變校正方法,其特征在于: 所述步驟4)進一步包括以下步驟: 41)對所述獨立出來的每行文本圖像分別進行水平投影,得到所述每行文本圖像的最高點縱坐標和最低點縱坐標; 42)對所述每行文本圖像中的連通域進行從上到下、從左到右的遍歷以得到一坐標映射關系表; 43)根據該坐標映射關系表,對所述每行文本圖像進行轉換調整,得到所述校正后的每行文本圖像。
3.根據權利要求2所述的文本圖像的桶形畸變校正方法,其特征在于: 所述步驟I)圖像的預處理指按照圖像的灰度化、二值化、去噪濾波的步驟對圖像進行處理。
4.根據權利要求3所述的文本圖像的桶形畸變校正方法,其特征在于: 所述步驟2)對預處理后的文本圖像進行膨脹處理的具體方法是:使用結構元素B來遍歷原始二值化圖像X圖像區域中的每個像素點,設X圖像中和結構元素B中心點重合的像素點坐標為(x,y),如果結構元素B和X圖像中目標區域的交集非空,就將坐標(x,y)設置成目標像素點,以此實現目標區域的向外擴張; 膨脹處理的公式為: 8 = Χ Β = {χ,γ\ΒχγΓΛΧΦψ} 式中,S表示膨脹后的二值圖像像素點集合,X表示原始二值化圖像像素點集合,B表示用于膨脹的結構元素,Ψ表示空集;其中,結構元素B中的每一個像素點可以是O或1,其可組成任意形狀的圖形,且該圖形中需要有一中心點用于表示待判斷的像素點。
5.根據權利要求4所述的文本圖像的桶形畸變校正方法,其特征在于: 針對文本圖像的特征,將結構元素中的擴充元素點設計為水平方向較寬,豎直方向較窄的圖形。
6.根據權利要求4所述的文本圖像的桶形畸變校正方法,其特征在于: 所述膨脹處理后的文本圖像還需要進行孔洞填充處理,具體步驟為:先通過連通域標記方法搜索出背景像素并加以標示,然后以集合的膨脹、求補和交集運算為基礎對孔洞進行填充,數學公式如下:A = (Xk_, B)nAc其中,k = 1,2,3,...式中的Xtl為搜索到的第一個目標像素點,B為十字對稱結構元素,Ac為原始圖像的補集;當Xk = Xk-1時,算法在迭代的第K步結束。
7.根據權利要求6所述的文本圖像的桶形畸變校正方法,其特征在于: 所述將每行文本圖像分別獨立出來通過連通域算法實現,即遍歷該文本圖像中每個像素點,將該每個像素點周圍一定區域內的像素點歸為一個集合,通過連通域算法處理后的每行文本圖像均具有一連通域。
全文摘要
本發明公開了一種文本圖像的桶形畸變校正方法,該方法包括先將待處理的文本圖像進行圖像的預處理,然后對預處理后的文本圖像進行膨脹處理,之后,將膨脹處理后的文本圖像中的每行文本圖像分別獨立出來,并對獨立出來的每行文本圖像分別進行坐標調整,最后將調整后的每行文本圖像合并成完整的文本圖像。本發明的文本圖像的桶形畸變校正方法無需考慮任何硬件參數的影響,可根據實際需要進行自適應校正,且校正效果良好,能夠大大地降低圖像的失真率,提高文本圖像的質量,具有很高的實用性。
文檔編號G06K9/32GK103186784SQ201110460648
公開日2013年7月3日 申請日期2011年12月31日 優先權日2011年12月31日
發明者董經, 姜曉偉 申請人:北京大唐高鴻軟件技術有限公司