專利名稱:文稿傾斜角度檢測的方法和裝置的制作方法
技術領域:
本發明涉及圖像處理領域,具體而言,涉及一種文稿傾斜角度檢測的方法和裝置。
背景技術:
現有技術中,文稿傾斜角度檢測最常見的方法為直線擬合方法和哈夫(Hough)變 換方法。直線擬合方法是通過找到一系列的點對(X,y)來擬合出一條直線,通過該直線的 斜率就可以得到傾斜角度。Hough變換方法是指檢測圖像中最長的直線,然后根據直線的斜 率得出傾斜角度,該方法應用的前提是圖像中有較長的直線,并且直線斜率和文稿傾斜角 度是一致的。現有技術往往是針對軟件實現,對于硬件實現來說,算法復雜性較高且硬件成本 較大。同時需要依賴一些特殊條件,比如Hough變換檢測傾斜角度,該方法需要得到整個 文稿的邊框信息,從邊框中檢測出直線,然后得出傾斜角度;如果文稿沒有邊框信息,Hough 變換檢測的結果將難以保證。而直線擬合的方法則要依賴同行檢測的結果,也就是必須是 同一行的字符計算出來的結果才有可能準確。現有技術中也提出了其它文稿傾斜角度檢測的方法,如依據部分圖像的傾斜角度 確定文稿圖像的傾斜角度,而這種方法由于缺乏對整個圖像的分析,因此難以保證精度。在實現本發明過程中,發明人發現現有技術中依據部分圖像的傾斜角度確定文稿 圖像的傾斜角度的方法需要對圖像掃描兩次,導致緩沖數據量較大,速度較慢。
發明內容
本發明旨在提供一種文稿傾斜角度檢測的方法和裝置,能夠解決現有技術中依據 部分圖像的傾斜角度確定文稿圖像的傾斜角度的方法需要對圖像掃描兩次,導致緩沖數據 量較大,速度較慢的問題。在本發明的實施例中,提供了一種文稿傾斜角度檢測的方法,包括以下步驟掃描文稿得到當前連通域,更新緩沖區;根據更新后的緩沖區內連通域計算斜率,更新斜率數組;判斷文稿是否掃描結束;當文稿掃描結束時,依據斜率數組中貢獻度最大的斜率,計算得到文稿的傾斜角度,否則,繼續掃描文稿。在本發明的實施例中,還提供了一種文稿傾斜角度檢測的裝置,包括掃描模塊,用于掃描文稿得到當前連通域(block),更新緩沖區;計算模塊,用于根據掃描模塊得到的緩沖區內的所有連通域計算斜率,更新斜率 數組;判斷模塊,用于判斷掃描模塊掃描文稿是否結束;濾波模塊,用于當文稿掃描結束時,依據斜率數組中貢獻度最大的斜率,計算得到文稿的傾斜角度。上述實施例通過掃描一次文稿,將按照掃描方向掃描文稿得到當前連通域,更新 到緩沖區后計算得到連通域的斜率數組,最后依據斜率數組中貢獻度最大的斜率,計算得 到文稿的傾斜角度,降低了緩沖數據量,從而加快了檢測文稿傾斜角度的速度,提高了文稿 傾斜角度檢測的精度,克服了現有技術中依據部分圖像的傾斜角度確定文稿圖像的傾斜角 度的方法需要對圖像掃描兩次,導致緩沖數據量較大,速度較慢的問題。
此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,本發 明的示意性實施例及其說明用于解釋本發明,并不構成對本發明的不當限定。在附圖中圖1示出了根據本發明一個實施例的文稿傾斜角度檢測的方法流程圖;圖2示出了根據本發明的一個實施例的連通域示意圖;圖3示出了根據本發明的一個優選實施例的計算兩個連通域之間斜率的示意圖;圖4示出了根據本發明的一個實施例的當緩沖區已滿時計算斜率的示意圖;圖5示出了根據本發明的一個實施例的當緩沖區未滿時計算斜率的示意圖;圖6示出了根據本發明的一個優選實施例的文稿傾斜角度檢測的方法流程圖;圖7示出了根據本發明一個實施例的文稿傾斜角度檢測的裝置示意圖。
具體實施例方式下面將參考附圖并結合實施例,來詳細說明本發明。圖1示出了根據本發明一個實施例的文稿傾斜角度檢測的方法流程圖,包括以下 步驟S102,掃描文稿得到當前連通域,更新緩沖區的尺寸;S104,根據更新后緩沖區內的連通域計算斜率,更新斜率數組;S106,判斷文稿是否掃描結束,當文稿掃描結束時,執行步驟S108,否則,重新執行 步驟S102 ;S108,依據斜率數組中貢獻度最大的斜率,計算得到文稿的傾斜角度。上述實施例通過掃描一次文稿,將按照掃描方向掃描文稿得到當前連通域,更新 到緩沖區后計算得到連通域的斜率數組,最后依據斜率數組中貢獻度最大的斜率,計算得 到文稿的傾斜角度,降低了緩沖數據量,從而加快了檢測文稿傾斜角度的速度,提高了文稿 傾斜角度檢測的精度,克服了現有技術中依據部分圖像的傾斜角度確定文稿圖像的傾斜角 度的方法需要對圖像掃描兩次,導致緩沖數據量較大,速度較慢的問題。優選地,上述貢獻度最大的斜率是調用高斯濾波算法對斜率數組進行處理,得到 的出現次數最多的斜率,高斯濾波算法具有較好的去噪性能,較適合本實施例。優選地,上述連通域block是指連續的黑色像素點構成的連通區域,圖2示出了根 據本發明的一個實施例的連通域示意圖,如圖2所示,英文字母“ABC”包含三個連通域,其 連通域的最小外接矩形分別為21、22和23 ;中文“好的”包含四個連通域,其連通域的最小 外接矩形分別為24、25、26和27。每個連通域包含如下信息連通域的最小外接矩形左上角點坐標以及最小外接矩形的高度、寬度和中心點坐標。優選地,上述文稿傾斜角度檢測的方法中,更新緩沖區包括如果當前連通域的尺寸正常,將其存儲到緩沖區,重新確定緩沖區的尺寸。優選地,上述文稿傾斜角度檢測的方法中,當緩沖區未滿時,連通域的正常尺寸是 指預先設置的參考尺寸;當緩沖區已滿時,連通域的正常尺寸是指對緩沖區的連通域進行 小尺寸濾波處理后的連通域尺寸。整個文稿可能存在多欄的情況,不同欄內的字符尺寸有可能不一致,因此需要動 態計算連通域正常尺寸。在上述實施例中,當緩沖區已滿時通過對緩沖區內的連通域的尺 寸進行小尺寸濾波處理,得到正常的尺寸信息。優選地,上述小尺寸濾波是一維高斯濾波器濾波,對字符寬度直方圖及字符高度 直方圖分別做濾波處理,去除噪聲的干擾。優選地,上述一維高斯濾波器是5 X 1的一維高斯濾波器,采用5 X 1的一維高斯濾 波器較適合本實施例。優選地,上述將所述當前連通域存儲到緩沖區,重新確定所述緩沖區的尺寸包 括當緩沖區未滿時,將當前連通域放入緩沖區中,同時依據緩沖區內所有連通域的 位置信息,確定緩沖區內包含所有連通域的最小外接矩形;當緩沖區已滿時,將緩沖區內最先放入的連通域移出,并將當前連通域放入緩沖 區中,同時依據緩沖區內所有連通域的位置信息,確定緩沖區內包含所有連通域的最小外 接矩形。優選地,上述文稿傾斜角度檢測的方法中,根據緩沖區的連通域計算斜率,更新斜 率數組包括計算目標連通域與其周圍的連通域之間的斜率;當斜率在預先設定的斜率范圍內并且其對應的連通域與目標連通域的距離小于 距離閾值時,將上述斜率記錄在斜率數組中。圖3示出了根據本發明的一個優選實施例的計算兩個連通域之間斜率的示意圖。 兩個連通域之間的斜率是依據兩個連通域的中心點坐標計算的。如圖3所示,中文“十天” 包含兩個連通域,連通域31與連通域32之間的斜率為通過連通域31的中心點33與連通 域32的中心點34的直線斜率。優選地,上述預先設定的斜率范圍為(-tan α , tan α ),其中斜率閾值tan α的取 值范圍為(0,tan6° );上述距離閾值是通過目標連通域且斜率為斜率閾值的直線與緩沖 區的最小外接矩形上下邊界水平線的兩個交點到目標連通域距離的最大值。優選地,當緩沖區未滿時,目標連通域是當前連通域;當緩沖區已滿時,目標連通 域是位于緩沖區中間的連通域。圖4示出了根據本發明的一個實施例的當緩沖區已滿時計算斜率的示意圖,如圖 4所示,當前緩沖區內首次放入的連通域block 1被移出,連通域block 2是放入緩沖區的 當前連通域。緩沖區的原始尺寸為虛線部分的矩形Li,由于新的block加入,更新后的緩沖 區范圍是矩形L2,而位于中間的連通域block 3則是需要計算斜率的目標連通域。依次計 算目標連通域block 3與緩沖區內L2的其它block之間的斜率,當斜率處于預先設定的斜率范圍(-tana,tana)內且block到目標連通域block 3的距離小于距離閾值R時,則將 斜率被記錄在斜率數組中。其中,斜率閾值tana的取值范圍為(0,tan6° ),R為通過目 標連通域block 3且斜率為tan α的直線與緩沖區的最小外接矩形L2上下邊界水平線的 兩個交點到目標連通域block 3距離的最大值。最終,扇形區域L3內連通域的斜率被記錄 在斜率數組中,而處在扇形區域L3之外的block的斜率是不需要記錄的。圖5示出了根據本發明的一個實施例的當緩沖區未滿時計算斜率的示意圖,如圖 5所示,緩沖區的原始尺寸為虛線部分的矩形Li,由于新的block加入,更新后的緩沖區范 圍是矩形L2,放入緩沖區的當前連通域block 2是目標block。依次計算目標連通域block2 與緩沖區內L2的其它block之間的斜率,當斜率處于預先設定的斜率范圍(-tana ,tana) 內且block到目標連通域block 2的距離小于距離閾值R時,則將斜率被記錄在斜率數組 中。其中,斜率閾值tana的取值范圍為(0,tan6° ),R為通過目標連通域block 2且斜 率為tan α的直線與緩沖區的最小外接矩形L2上下邊界水平線的兩個交點到目標連通域 block 2距離的最大值。最終,扇形區域L3內連通域的斜率被記錄在斜率數組中,而處在扇 形區域L3之外的block的斜率是不需要記錄的。優選地,上述文稿傾斜角度檢測的方法中,調用高斯濾波算法對斜率數組進行處 理得到文稿的傾斜角度具體包括根據精度要求,確定高斯濾波的尺寸,并生成相應的高斯濾波器;通過高斯濾波器,對上述斜率數組進行兩次高斯濾波,得到出現次數最多的斜 率;
根據上述次數出現最多的斜率計算文稿的傾斜角度。在本實施例中,設定的斜率范圍為(-tan5.5°,tan5.5° ),計算出的文稿的傾斜 角度為3. 5°。圖6示出了根據本發明的一個優選實施例的文稿傾斜角度檢測的方法流程圖,包 括以下步驟S202 掃描文稿,獲得新的連通域block ;S204 判斷緩沖區是否已滿,若緩沖區已滿,則執行S206,若緩沖區未滿,則執行 S208 ;S206 計算連通域block的正常尺寸;S208 判斷當前連通域block尺寸是否正常,若尺寸正常,則執行S210,若尺寸不 正常,則執行S202;S210 更新緩沖區;S212 根據緩沖區內連通域計算斜率,更新斜率數組;S214 判斷文稿掃描是否結束,若掃描結束,則執行S216,若掃描未結束,則執行 S202 ;S216 高斯濾波得到最終的文稿傾斜角度;上述實施例中根據精度要求,確定高斯濾波尺寸,并生成高斯濾波器。通過對步驟 S212得到的斜率數組進行兩次高斯濾波后,得到出現次數最多的斜率,進而求得最終的文 稿傾斜角度。圖7示出了根據本發明一個實施例的文稿傾斜角度檢測的裝置示意圖,包括
掃描模塊10,用于掃描文稿得到當前連通域,更新緩沖區;計算模塊20,用于根據掃描模塊10得到的緩沖區內的所有連通域計算斜率,更新 斜率數組;判斷模塊30,用于判斷掃描模塊10掃描文稿是否結束;濾波模塊40,用于當文稿掃描結束時,依據斜率數組中貢獻度最大的斜率,計算得 到文稿的傾斜角度。上述實施例通過掃描一次文稿,將按照掃描方向掃描文稿得到的連通域更新到緩 沖區后計算得到斜率數組,最后依據斜率數組中貢獻度最大的斜率,計算得到文稿的傾斜 角度,降低了緩沖數據量,從而加快了檢測文稿傾斜角度的速度,提高了文稿傾斜角度檢測 的精度,克服了現有技術中依據部分圖像的傾斜角度確定文稿圖像的傾斜角度的方法需要 對圖像掃描兩次,導致緩沖數據量較大,速度較慢的問題。優選地,上述貢獻度最大的斜率是調用高斯濾波算法對斜率數組進行處理,得到 的出現次數最多的斜率,高斯濾波算法具有較好的去噪性能,較適合本實施例。每個外接矩形包含如下信息左上角點位置、高度、寬度及質心點位置。優選地,上述掃描模塊包括第一判斷單元,用于判斷連通域的尺寸是否正常。優選地,上述掃描模塊還包括第二判斷單元,用于判斷緩沖區是否已滿。優選地,上述文稿傾斜角度檢測的裝置中,當緩沖區未滿時,連通域的正常尺寸是 指預先設置的參考尺寸;當緩沖區已滿時,連通域的正常尺寸是指對緩沖區的連通域進行 小尺寸濾波處理后的連通域尺寸。整個文稿可能存在多欄的情況,不同欄內的字符尺寸有可能不一致,因此需要動 態計算連通域block正常尺寸。在上述實施例中,當緩沖區已滿時通過對緩沖區內的連通 域block的尺寸進行小尺寸濾波處理,得到正常的尺寸信息。優選地,上述小尺寸濾波是一維高斯濾波,對字符寬度直方圖及字符高度直方圖 分別做濾波處理,去除噪聲的干擾。優選地,上述一維高斯濾波是5 X 1的一維高斯濾波,采用5 X 1的一維高斯濾波較 適合本實施例。優選地,上述計算模塊包括第一計算單元,用于計算緩沖區中目標連通域與其周圍的連通域之間的斜率,當 斜率在預先設定的斜率范圍內并且其對應的連通域與目標連通域的距離小于距離閾值時, 將斜率記錄在斜率數組中。優選地,在上述實施例中,當緩沖區未滿時,目標連通域是當前連通域;當緩沖區 已滿時,目標連通域是位于緩沖區中間的連通域。優選地,濾波模塊包括生成單元,用于根據精度要求,確定高斯濾波的尺寸,并生成相應的高斯濾波器;第二計算單元,用于根據生成單元生成的高斯濾波器,對由計算模塊得到的斜率 數組進行兩次高斯濾波,得到出現次數最多的斜率;第三計算單元,用于根據第二計算單元得到的斜率計算文稿的傾斜角度。
顯然,本領域的技術人員應該明白,上述的本發明的各模塊或各步驟可以用通用 的計算裝置來實現,它們可以集中在單個的計算裝置上,或者分布在多個計算裝置所組成 的網絡上,可選地,它們可以用計算裝置可執行的程序代碼來實現,從而,可以將它們存儲 在存儲裝置中由計算裝置來執行,或者將它們分別制作成各個集成電路模塊,或者將它們 中的多個模塊或步驟制作成單個集成電路模塊來實現。這樣,本發明不限制于任何特定的 硬件和軟件結合。以上所述僅為本發明的優選實施例而已,并不用于限制本發明,對于本領域的技 術人員來說,本發明可以有各種更改和變化。凡在本發明的精神和原則之內,所作的任何修 改、等同替換、改進等,均應包含在本發明的保護范圍之內。
權利要求
一種文稿傾斜角度檢測的方法,其特征在于,包括以下步驟掃描文稿得到當前連通域,更新緩沖區;根據更新后所述緩沖區內的連通域計算斜率,更新斜率數組;判斷所述文稿是否掃描結束;當所述文稿掃描結束時,依據所述斜率數組中貢獻度最大的斜率,計算得到所述文稿的傾斜角度。否則,繼續掃描所述文稿。
2.根據權利要求1所述的文稿傾斜角度檢測的方法,其特征在于,所述貢獻度最大的 斜率是調用高斯濾波算法對所述斜率數組進行處理,得到的出現次數最多的斜率。
3.根據權利要求2所述的文稿傾斜角度檢測的方法,其特征在于,更新緩沖區包括 當所述當前連通域的尺寸正常時,將其存儲到緩沖區,重新確定所述緩沖區的尺寸。
4.根據權利要求3所述的文稿傾斜角度檢測的方法,其特征在于當所述緩沖區未滿時,所述連通域的正常尺寸是指預先設置的參考尺寸; 當所述緩沖區已滿時,所述連通域的正常尺寸是指對緩沖區的連通域進行小尺寸濾波 處理后的連通域尺寸。
5.根據權利要求4所述的文稿傾斜角度檢測的方法,其特征在于,所述小尺寸濾波是 一維高斯濾波器濾波。
6.根據權利要求5所述的文稿傾斜角度檢測的方法,其特征在于,所述一維高斯濾波 器是5X1的一維高斯濾波器。
7.根據權利要求3所述的文稿傾斜角度檢測的方法,其特征在于,將所述當前連通域 存儲到緩沖區,重新確定所述緩沖區的尺寸包括當所述緩沖區未滿時,將所述當前連通域放入所述緩沖區中,同時依據所述緩沖區內 所有連通域的位置信息,確定所述緩沖區的包含所有連通域的最小外接矩形;當所述緩沖區已滿時,將緩沖區內最先放入的連通域移出,并將所述當前連通域放入 所述緩沖區中,同時依據所述緩沖區內所有連通域的位置信息,確定所述緩沖區的包含所 有連通域的最小外接矩形。
8.根據權利要求7所述的文稿傾斜角度檢測的方法,其特征在于,根據所述緩沖區的 連通域計算斜率,更新斜率數組包括計算目標連通域與其周圍的連通域之間的斜率;當所述斜率在預先設定的斜率范圍內并且其對應的連通域與所述目標連通域的距離 小于距離閾值時,將所述斜率記錄在斜率數組中。
9.根據權利要求8所述的文稿傾斜角度檢測的方法,其特征在于,所述斜率范圍為(-tana,tana),其中斜率閾值tana的取值范圍為(0,tan6° ); 所述距離閾值是通過所述目標連通域且斜率為所述斜率閾值的直線與所述緩沖區的 最小外接矩形上下邊界水平線的兩個交點到所述目標連通域距離的最大值。
10.根據權利要求8所述的文稿傾斜角度檢測的方法,其特征在于, 當所述緩沖區未滿時,所述目標連通域是所述當前連通域;當所述緩沖區已滿時,所述目標連通域是位于所述緩沖區中間的連通域。
11.根據權利要求8所述的文稿傾斜角度檢測的方法,其特征在于,依據所述斜率數組 中貢獻度最大的斜率,計算得到所述文稿的傾斜角度具體包括根據精度要求,確定高斯濾波的尺寸,并生成相應的高斯濾波器; 通過所述高斯濾波器對所述斜率數組進行兩次高斯濾波,得到出現次數最多的斜率; 根據所述斜率計算所述文稿的傾斜角度。
12.—種文稿傾斜角度檢測的裝置,其特征在于,包括 掃描模塊,用于掃描文稿得到當前連通域,更新緩沖區;計算模塊,用于根據所述緩沖區內的所有連通域計算斜率,更新斜率數組; 判斷模塊,用于判斷所述掃描模塊掃描文稿是否結束;濾波模塊,用于當所述文稿掃描結束時,依據所述斜率數組中貢獻度最大的斜率,計算 得到所述文稿的傾斜角度。
13.根據權利要求12所述的文稿傾斜角度檢測的裝置,其特征在于,所述貢獻度最大 的斜率是調用高斯濾波算法對所述斜率數組進行處理,得到的出現次數最多的斜率。
14.根據權利要求12所述的文稿傾斜角度檢測的裝置,其特征在于,所述掃描模塊包括第一判斷單元,用于判斷所述連通域的尺寸是否正常。
15.根據權利要求14所述的文稿傾斜角度檢測的裝置,其特征在于,所述掃描模塊還 包括第二判斷單元,用于判斷所述緩沖區是否已滿。
16.根據權利要求15所述的文稿傾斜角度檢測的裝置,其特征在于,當所述緩沖區未滿時,所述連通域的正常尺寸是指預先設置的參考尺寸; 當所述緩沖區已滿時,所述連通域的正常尺寸是指對緩沖區的連通域進行小尺寸濾波 處理后的連通域尺寸。
17.根據權利要求16所述的文稿傾斜角度檢測的裝置,其特征在于,所述計算模塊包括第一計算單元,用于計算緩沖區中目標連通域與其周圍的連通域之間的斜率,當所述 斜率在預先設定的斜率范圍內并且其對應的連通域與所述目標連通域的距離小于距離閾 值時,將所述斜率記錄在斜率數組中。
18.根據權利要求17所述的文稿傾斜角度檢測的裝置,其特征在于, 當所述緩沖區未滿時,所述目標連通域是所述當前連通域;當所述緩沖區已滿時,所述目標連通域是位于所述緩沖區中間的連通域。
19.根據權利要求13所述的文稿傾斜角度檢測的裝置,其特征在于,所述濾波模塊包括生成單元,用于根據精度要求,確定高斯濾波的尺寸,并生成相應的高斯濾波器; 第二計算單元,用于根據所述生成單元生成的所述高斯濾波器,對由所述計算模塊得 到的斜率數組進行兩次高斯濾波,得到出現次數最多的斜率;第三計算單元,用于根據所述第二計算單元得到的斜率計算所述文稿的傾斜角度。
全文摘要
本發明提供了一種文稿傾斜角度檢測的方法,包括以下步驟掃描文稿得到當前連通域,更新緩沖區;根據更新后的緩沖區內的連通域計算斜率,更新斜率數組;判斷文稿是否掃描結束;當文稿掃描結束時,依據斜率數組中貢獻度最大的斜率,計算得到文稿的傾斜角度,否則,繼續掃描文稿。本發明克服了現有技術中依據部分圖像的傾斜角度確定文稿圖像的傾斜角度的方法需要對圖像掃描兩次,導致緩沖數據量較大,速度較慢的問題。此外,本發明還提供了一種文稿傾斜角度檢測的裝置。
文檔編號H04N1/10GK101924856SQ20091008666
公開日2010年12月22日 申請日期2009年6月17日 優先權日2009年6月17日
發明者六尾敏明, 李平立, 紀延瑤, 袁夢尤 申請人:北京大學;方正國際軟件(北京)有限公司;京瓷美達株式會社