專利名稱:非均勻光照的文本圖像的亮度補償分割方法
技術領域:
本發明涉及一種對非均勻光照文本圖像進行分割的亮度補償算法,屬于計算機圖像處理 技術領域。 背暈技術
圖像分割的目的是把團像中的物體從背景中區分出來,對于文本圑像就是使灰度團像或 彩色圖像中的字符和線條從背景中分離出來。圖像分割是文本衝像自動識別的一個基本的預 處理技術,分割質量的好壞直接決定了后續的圖像或文字識別的,果。
數碼照相機、數碼攝像機和帶攝像功能的手機等電子設備的出現,實現了以自然光為光 源的圖像攝入技術,大大方便了圖像的獲取。但是這些設備獲得的是非均勻光照圖像,對于 圖像分割則帶來了負面的影響。對于均勻光照的文本圖像,幾乎所有的整體閾值方法都能對 文本圖像進行自動的分割,并得到清晰的文本二值圖[1-9]。非均勻光照的文本圖像,情況則 完全不同。二十多年來作為文本圖像的分析和識別的一個基本問題,已經從多個方面對之進 行了研究,提出了分區分割,自適應窗口分割,基于邊界點的分割曲面等方銜1(M3。但是 目前非均勻光照文本圖像的分割技術生成的二值圖像基本上不能滿足光學字符識別約需要。 對于非均勻光照的文本圖像,全局閾值會使低照度的區域大片變黑,或使高照度的區域大片 變白。基于窗口的分割技術的一個主要缺陷則是會把較大的背景區 域錯分為前景區域,產生 所謂的"幽靈斑點"[13〗。
發明內容
本發明提出了一種用于處理非均勻光照文本圖像的分割技術。我們采用照度補償的方法把非均勻光照 文本圖像轉換成等效的均勻光照圖像,然后用全域自動閾值方法(如大津展之方法2,Kapur方法[5〗,
Kittler方法7]等)對生成的均勻光照圖像進行分割,可以克服非均勻光照引起的困難,獲得可供后續的 文本分析和光學字符識別利用的二值圖像。1、圖像灰度值與照度
光照補償方法的基礎是Stockhan [14-15]的物體照度理論。Stockhan [14的理論認為,圖像 中物體的亮度(由對應于物體的位置處的像素灰度值表示)由該物體表面的照度(illumination) 及其反射率(reflectance)共同作用的結果。以",^和^c,^分別表示j,^點處的照度和反 射率,則圖像上與該點對應的像素灰度值為-
&j,_y』/j,_yJ>j,>^。 (1)
當照度Lx,^是坐標的函數時,生成的是非均勻光照的圖像。
我們可以根據Stockhan的照度理論,來推算在均勻照度z。的作用下,由文本rj,j^生成的 文本圖像的灰度函數
/z。j,y』z'o (2)
運用公式(l),有
"y』^_l,>u。 (3) 因此如果能獲得生成圖像時的照度分布函數,我們就可以得到均勻光照下文本的灰度圖像。
2、照度分布函數的估算
盡管我們不能得到圖像上每一位置處的照度值,但是對于文本圖像我們可以對照度分布
函數作一估算。對于文本圖像,物體表面反射率r^o是個二值函數,字符和紙面分別有接 近o和i的兩種反射率。
設原圖是寬為l,高為々的灰度圖像(以像素為長度單位)。如原圖像是彩色圖像,可以 用通常的平均法把彩色圖像轉換為灰度圖。我們把原圖像分成邊長為/,的正方形子圖像,每 個子圖像有乂0//個像素。如C和/a能整除/,,那么可以把原圖分為&口&個子圖像,并以 j,A記子圖像的位置。其中、[][t//,[, 符號^/6[表示"除以6的整數部分。。
用/wn,i表示原圖像第w行第w列上像素的灰度值。對每個子圖像計算平均灰度。用 ^^',A表示J,A位置處的子圖像的平均灰度,則有(4)
假定子圖像中背景像素和前景像素之比大致相等,那么就可以用^J,A作為第J,A個子圖像 中心位置像素的相對照度。
3、光度補償的插值方法
對于子圖像中心以外位置處的照度,我們可以用插值的方法進行計算。對于第j》、個子圖像, 我們用其最近鄰的四個子圖像的照度,即用2",a, ^j口1,a, 0"口1,a, ^j,/口L和 ^J,y口L進行插值計算。插值函數取二次函數
F。J,乂.』a" J,/JH "" j,/眉口《2 J,/^w2 □《j,/^w"口 < j,/^w口 J,/*/ 2 。 (5)
很容易得到插值函數中的系數的計算公式-
g。J》'" (6a) 《,j, _;』j, □ l』e", / □ l工, (6b)
2/'
《力』會fc。』U.』0。』w工'
j2 j,yj3日丄&0 jjn u] 0。 j,7'd iih《o
/乂,
"20,。 j》』|Q2。』i,_/』g。Jo i,_/Ib《。j,》/iv,。 于是如^,^位于第乂a個子圖像內,則其灰度值為
(6c) (6d) (6e)
(7)
4、均勻照度下文本的灰度圖像
公式(3)中的/。表示均勻照度,是個待設定的量。由于數值圖像中的灰度值的取值范圍在 0~255之間,對于灰度值大于255的像素,只能以255作為近似,于是會引起信息損失。新 圖像的灰度值^^M正比于/。。于是如/。^max^"J—,則/^JM,"-就可能大于255。選擇 /。 <3max^°J,_/—,可以避免把高亮度像素強制設定為255灰度引起的信息損失,但是新圖像的灰度值將0 255q:之間,其中/cD/。/maxs^j》V^1,于是使有效灰度區間縮小,也會導 致分割質量下降。根據以上的分析,我們把均勻照度z。設定為/。口gl^maxug",^。 于是用公式
^j,"』^鵬(8)
生成的灰度圖像就是文本/^c,少^在均勻光照下生成的灰度圖像。
5、全局閾值方法
由節3得到的^^,i是一均勻光照的文本圖像,可以運用全局閾值分割方法進行二值化。 我們的試驗表明對于均勻光照的文本圖像,現有的全局閾值分割方法都能應用[1-9],而且分 割質量沒有本質的區別,因此我們采用大津展之方法,原因是最為節省計算時間,而且質量 也好。以下是我們采用的大津展之全局閾值方法[2]。
計算圖像W^,i的直方圖。設該圖像中灰度值為y的像素數目為 ,圖像像素總數為
Am/wD^。于是得到各個灰度值的幾率分布
255
w;/tv, □ /7;[]1。 (9)
扁
設用灰度《把圖像^^,i中的像素分為前景和背景兩類。在兩類中分別計算前景和背景
像素的出現概率
_00昍* AH (10)
疆 255
"0[] □ ; 'o圓一oj:一。 (11) 計算前景和背景像素的灰度平均值
《口d W"0[]"丄。丄, (12) 'no
255 門;c0 j6>
W^^:, (13)
,簡1 n Ja
其中, '<formula>formula see original document page 8</formula>
分別計算圖像的類間方差<formula>formula see original document page 8</formula>
選擇使圖像的類間方差為最大的灰度值作為分割閾值,即最優閾值為
<formula>formula see original document page 8</formula>根據對圖像進行分割,得到原文本的二值圖a 。
6、 圖像邊界區域的處理 對于左右邊沿的子圖像,即/口i, /口&的子圖像,我們取^jo,y』^AA,和
^a口i,/』^a口i,A。對于上下邊沿的子圖像,艮卩/口i, /口&的子圖像,則取 2°j,oj 0°j,2"和2"a□ i』□ i-。對圖像邊界區域的子圖像作了這樣的處理后, 就可以直接利用節3中給出的插值公式作照度計算。
如原圖像的寬(zw)或高(")不能為/,整除。我們還是處理&[]4個子圖像。對于剩余
的像素,我們用與之相鄰的子圖像的亮度插值公式進行計算。
7、 照度函數的迭代與逼近
如果各個子圖像中前景像素和背景像素之比相等,那么^j,A就是子圖像j,A的平均相
對照度。但是實際上各個子圖像中前景像素和背景像素之比不會相等,于是由節3得到的照 度估計將偏離實際的照度分布。利用節4中得到的二值圖像,我們可以修正這種偏離。根據
二值圖d",A我們可以區分前景像素和背景像素,并用前景像素的平均灰度值作為子圖像的 照度估計。現在可以用以下公式計算平均照度 .<formula>formula see original document page 8</formula>
其中iV。',A是第J,A個子圖像中的背景像素數。^J,A的值將更接近于實際的照度值。然后
用節3中描述的插值方法計算插值函數的系數,<formula>formula see original document page 8</formula>《。J, A,.即得到新的照度分布函數F1 J,A。 計算0LxDmax^、,y—后,就可以用公式
,max D^ffl,"" (19) F J,A
進行照度補償,并用全局閾值方法對圖像w^M進行分割,得到新的二值圖像"ua。基于 分割圖像進行照度補償,由于考慮了子圖像中前景和背景像素的分布,獲得的照度分布函數 會更逼近于實際的照度分布,因此在此基礎上得到的二值圖像的分割質量將得到提高。二值
圖像i ua的質量要優于iyuA。
zyj,A中對前景像素和背景像素定位的準確度優于z)",A。因此利用i)'j,A和作同樣的 處理,可以獲得更好的照度分布函數/^^,^,依此能得到更好的二值圖像"UA。而且一
般地可以由二值圖像d",A,改進對光照函數的估計,得到W^W,^,并得到質量改進的分
割圖像ZF口。',A。代價是計算時間。實際上最初的迭代計算對于分割質量的改進效果最為顯 著,因此我們建議可以只計算d2j,a或"3j,a 。
8、后續處理
利用全局閾值的優點是能節省時間,但是單個閾值通常不能使得每個字符都能分割得很理 想。尤其當圖像中存在大面積的背景區域時,這一缺憾顯得尤為突出。用子窗口對圖像進行
分割可以提高字符的分割質量,但是問題是會出現"幽靈圖斑"[13]。通過節1到7的處理
已經給出了一個均勻光照的圖像,利用我們設計的后續處理就可以既保證不出現"幽靈圖斑", 又提高字符細節的分割質量。 設由前述方法已得到了均勻光照圖像V^M。
1. 用/,對圖像/^jw,"^進行分塊,得到&,D 子圖像。其中、,口^〃,D, 口A〃,0。 /,可以
不等于/,,而且一般取/,D/,。計算F^n,"一的全局閾值《
2. 把每個子圖像作為一個像素,以」",/4示記像素的位置,并計算每個子圖像的信息量。我 們以類間方差_|作為信息量的度量(計算方法見節5),好處是可以提高計算速度。于是 我們得到圖像—w,/一稱為準圖像。3. 用大津展之方法計算準圖像J」",A的閾值,得到《。
4. 根據《把準圖像,!J',A分為兩類—口',/》《的是信息量大的子圖像,以該子圖像的 局域閾值進行分割,《的為信息量小的子圖像,以^JM,"^的全局閾值《進行分割。
9、實驗結果 '
我們用0++語言實現了以上的算法,并進行了實驗比較。
圖1是用數碼相機在自然光下 攝入的一頁文獻。圖2是用本專利提出的算法分割后得到的二值文本圖像。圖2中的二值文 本圖像中,字符輪廓清晰,線條圖光滑連續,可供文本分析和字符識別用。圖3是用全局閾 值(大津展之方法[2])分割得到的文本圖像。由于非均勻光照的緣故,低照度的部分(圖像 的上部)全部變黑。圖4也是用全局閾值(Kapur方法[5p分割得到的文本圖像。用Kapur 方法算出的閾值小于大津展之方法算得的閾值,消除了圖3中的大片變黑,但是光照高的部 分變德模糊不清,線條圖則變得斷斷續續。圖5是用Huang, Q.等人的自適應子窗口方法得到的 二值圖。采用自適應子窗口方法的目的就是為了消除分區閾值方法帶來的"幽靈圖斑"的負 面影響。但'是從圖5 (右上方的黑色圖斑)可見自適應方法也無法根絕"幽靈圖斑",在線條 圖的大片背景上,由于信息量低,還是有一些"幽靈圖斑"。
參考文獻 Otsu, N., 1979. A threshold selection method from gray level histograms. IEEE Tr咖.Systems
Man Cybernet. 9, 6246. Ridler, T.W., Calvard, S., 1978. Picture thresholding using an iterative selection method. IEEE
Trans. System Man Cybernet. SMC-8,630-632. [4] Pun, T., 1980. A new method for gray-level picture threshold using the entropy of the histogram.
Signal Process. 2 (3), 223—237. [5] Kapur, J,N., Sahoo, P,K., Wong, A.K.C" 1985. A new method for gray-level picture
thresholding using the entropy of the histogram. Graphical Models Image Process. 29,273-285. [6] Tsai, W.H., 1985. Moment-preserving thresholding: A new approach. Graphical Models Image
Process. 19, 377—393. Li, C.H., Lee, C.K., 1993. Minimum cross-entropy thresholding. Pattern Recognition 26, 617~625.[9] Abutaleb, A.S" 1989. Automatic thresholding of gray-level pictures using two-dimensional
entropy. Comput. Vision Graphics Image Process. 47, 22—32, [10〗Niblack, W., 1986. An Introduction to Image Processing. Prentice-HalI, pp. 115—116. [ll]Gorman, L.O,., 1994. Binarization and multi-thresholding of document images using
connectivity. Graphical Models Image Process. 56, 494-506. [12]Trier, O,D" Tax^ T" 1995, Evaluation of binarization methods for document images. IEEE
Trans, Pattern Anal. Machine Intell. PAMI, 312—315. [13〗Huang, Q., Gai, W,, Cai, W,, 2005. Thresholding technique with adaptive window selection for
uneven lighting image. Pattern Recognition Lett. 26, 801~808. [14] T. G Dtockham, Image processing in the context of a visual model, Proc.正EE, vol.to, pp. 828-842, 1972. [15〗Arnulfo Perez,肌Rafael C. Gonzakz, An iterative thresholding algorithm for image
segmentation ,IEEE PAMI-9 (1987) 742-75權利要求
1.非均勻光照文本圖像的照度補償分割算法。具體步驟為(1)把原圖像分成邊長ls□ls的子圖像,共有sw□sh個子圖像,計算每個子圖像的平均灰度 id="icf0001" file="A2008101090000002C1.tif" wi="14" he="4" top= "49" left = "48" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/>(2)在計算子圖像平均灰度 id="icf0002" file="A2008101090000002C2.tif" wi="12" he="4" top= "60" left = "82" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/>的同時,也獲得最大平均灰度 id="icf0003" file="A2008101090000002C3.tif" wi="35" he="5" top= "59" left = "150" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/>并把它作為待設定的均勻照度,即有i0□Qmax0。(3)用子像素本身及其上下左右5個子圖像的平均灰度, id="icf0004" file="A2008101090000002C4.tif" wi="38" he="4" top= "81" left = "147" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/> id="icf0005" file="A2008101090000002C5.tif" wi="58" he="4" top= "92" left = "39" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/>進行照度插值,該子圖像中各像素的照度用以下插值公式計算(4)圖像邊界區域的處理對于左右邊沿的子圖像,即i□1,i□sw的子圖像,取 id="icf0007" file="A2008101090000002C7.tif" wi="32" he="4" top= "133" left = "39" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/>和 id="icf0008" file="A2008101090000002C8.tif" wi="46" he="4" top= "133" left = "78" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/>對于上下邊沿的子圖像,即j□1,j□sh的子圖像,則取 id="icf0009" file="A2008101090000002C9.tif" wi="29" he="4" top= "144" left = "79" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/>和 id="icf0010" file="A2008101090000002C10.tif" wi="44" he="4" top= "144" left = "116" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/>如原圖像的寬(lw)或高(lh)不能為ls整除。我們還是處理有sw□sh個子圖像,對于剩余的像素,用相鄰子圖像的照度插值公式進行計算。(5)由公式 id="icf0011" file="A2008101090000002C11.tif" wi="44" he="10" top= "174" left = "51" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/>生成灰度圖像,此即為文本在均勻光照下的灰度圖像。(6)采用全局閾值分割方法計算灰度圖像 id="icf0012" file="A2008101090000002C12.tif" wi="13" he="4" top= "199" left = "107" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/>的最佳閾值k0*,對圖像 id="icf0013" file="A2008101090000002C13.tif" wi="14" he="4" top= "199" left = "166" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/>進行二值化得到二值圖像 id="icf0014" file="A2008101090000002C14.tif" wi="14" he="4" top= "210" left = "77" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/>
2. 照度函數的迭代逼近方法。具體步驟為 .(1)由得到的二值圖D",A可以區分前景像素和背景像素,用前景像素的平均灰度值作為子圖像的照度估計。平均照度計算公式為2^,^口_^ □ /^ ,^,并J,乂^,力l/^j,乂XI:255hs生成灰度圖,,臓D^,"",尸j, A(2 )利用全局閾值分割/ '辜"4尋到二值圖DU a 。(3)這是個迭代方案,即可由ZFj,A,生成灰度圖V^M,和用全局閾值得到二值
3. 對生成的均勻光照文本圖像^JW,l的分割算法。具體步驟為(1) 用^對圖像^j,"選行分塊,得到&,口 個子圖像。其中&口o^/,aA.口A〃,口。/,可以不等于/"而且一般取7,D/,。計算V^M的全局閾值《。(2) 把每個子圖像作為一個像素,以類間方差—-作為信息量的度量,得到灰度值為 —W,A的準圖像。(3) 用大津展之方法計算準圖像—^y',/^的閾值,得到《。(4) 根據《把準圖像_"',/^分為兩類—J',/》《是信息量大的子圖像,以該子圖 像的局域閾值進行分割;—"',A口g是信息量小的子圖像,以V^n,"-的全局閾 值《進行分割。
4. 權利要求1采用的插值方法,包括U3)中的二次近鄰插值方法,也包括高次多項插值方 法和樣條函數插值方法。
5. 權利要求1的邊界區域處理方法,也包括其他的邊界處理方法,如使用零邊界條件或周期 邊界條件。
6. 權利要求l中的全局閾值方法中最簡單的是大津展之方法,也包括其他整體閾值方法。
7. 權利要求2是提高照度計算準確性的迭代運算,根據精度要求和實際的計算資源可以取舍 和選擇迭代次數。
8. 權利要求3是后續處理方法,可以根據精度要求和實際的計算資源作取舍。
全文摘要
本發明涉及一種對非均勻光照文本圖像進行分割的照度補償算法,屬于計算機圖像處理技術領域。文本分割是文本圖像自動識別的一個基本的預處理技術,分割質量的好壞對文字識別的效果具有顯著的影響。數碼照相機的出現實現了以自然光為光源的圖像攝入技術,極大地方便了圖像的獲取,但是生成的非均勻光照圖像,很難進行分割。本發明提出了一種用于處理非均勻光照文本圖像的分割技術。我們采用照度補償的方法把非均勻光照文本圖像轉換成等效的均勻光照圖像,然后用全域自動閾值方法對生成的均勻光照圖像進行分割,可以克服非均勻光照引起的困難。實驗結果表明由照度補償方法生成的二值文本圖像質量優于包括自適應子窗口等傳統的圖像分割方法。
文檔編號G06T7/00GK101599172SQ200810109000
公開日2009年12月9日 申請日期2008年6月6日 優先權日2008年6月6日
發明者巨志勇, 葛偉華, 顧國慶 申請人:上海吉量軟件科技有限公司