專利名稱::一種自適應圖像文本信息提取方法
技術領域:
:本發(fā)明涉及模式識別與機器視覺領域中的文本信息提取
技術領域:
,具體地是一種自適應圖像文本信息提取方法。
背景技術:
:隨著數(shù)碼相機、攝像頭、超高速掃描儀等圖像獲取設備的廣泛應用,圖像中信息越來越引起人們的關注,然而計算機理解圖像的內(nèi)容,目前還很困難。圖像中嵌入的文字能夠提供一些人們所要的重要信息,如書的封面、視頻、自然風景圖片WWW網(wǎng)頁的彩圖等等,它對理解圖像中的內(nèi)容有著重要的幫助。讓計算機像人類一樣識別圖像中的文字,即文字的自動檢測系統(tǒng),近年來越來越引起了人們的關注,它對于圖像的存儲、分類和檢索等來說具有極其重要的意義,有著廣泛的應用前景和商業(yè)價值。在許多情況下,圖像中的場景文字甚至成為圖像最主要、最關鍵的信息,例如對于車牌的識別,對于路牌的識別和翻譯等。這些場景文字被抽取后,送入0CR模塊,轉(zhuǎn)換成計算機可理解的內(nèi)碼,可以方便的進行后續(xù)的各種處理。國內(nèi)外的研究人員是在近幾年內(nèi)才開始對圖像中的文本信息提取技術進行研究的,由于文本信息提取受到語種、文字分辨率、文字間距、分布情況、文字的背景、光照、顏色之類因素的影響,并且某些圖案、紋理的背景很難與文字區(qū)分開來,因此圖像中的文本信息提取技術目前還沒有一個很好的解決辦法。目前對這個問題提出一些解決的方法,大致可以分為四類基于邊緣的方法,基于紋理的方法,基于顏色的方法和基于連通區(qū)域的方法?;谶吘壍姆椒ㄖ饕抢脠D像中文字和背景通常存在較大的顏色差,因而在文字和背景存在明顯的邊緣?;谶吘壍姆椒ň褪峭ㄟ^尋找排列規(guī)則的邊緣,從而尋找文字區(qū)域;基于紋理的方法是把文字當成一種特殊的紋理,根據(jù)文字紋理具有的某種特定頻率和方向信息來確定圖像中可能的文字區(qū)域;基于顏色的文本信息提取方法利用了大多數(shù)圖像文字具有均勻顏色這一事實,通過顏色約減的方法可以將原圖分解成屬于若干個不同顏色的子圖,然后在各個子圖上獨立進行文字提取工作;基于連通區(qū)域的方法主要是在圖像上通過尋找一致性區(qū)域來尋找文字區(qū)域,基于連通域的方法利用了文字的排列特性,即絕大多數(shù)情況下文字是成組出現(xiàn)的,例如多個字母組成一個單詞,或者多個漢字組成一個句子。屬于同一組的文字會具有比較統(tǒng)一的幾何尺寸和排列規(guī)則。上述現(xiàn)有的研究方法,基于邊緣的文本提取方法計算簡單,但由于采用單一的邊緣檢測方法,當文字和背景對比度相差不大的情況下檢測效果并不理想;而且,倘若背景輪廓和字符粘連,也容易得到錯誤結(jié)果。這就需要結(jié)合其它的信息來擴大檢測范圍;基于紋理的文本提取方法需要抽取有效的紋理特征,雖然可有效地檢測出文字所在區(qū)域,但是也會提取出具有類似紋理的背景區(qū)域,需要結(jié)合其它特征;基于顏色聚類方法的主要難點在于無法預知文字和背景的顏色,因而也就難以確定顏色子圖的個數(shù),聚類數(shù)過多或者過少都會影響提取性能,而且計算量很大;基于連通區(qū)域的方法大多數(shù)情況下不能單獨使用,一般用在邊緣、紋理和顏色等方法之后。上述各種方法進行文字信息提取時,都沒有考慮到圖像背景的復雜度和文字、背景的對比度情況,對不同背景復雜度的圖像,都采用單一的提取方法,容易漏掉一些對比度弱的文本區(qū)域或者將似文本區(qū)域錯誤提取出來,造成整體提取效果不好。
發(fā)明內(nèi)容本發(fā)明的目的是提供一種自適應圖像文本信息提取方法,根據(jù)圖像背景復雜程度,采用不同的圖像文本檢測技術,快捷、準確、有效的檢測出不同背景復雜度圖像中的文字信息,而且檢測出的文本信息不受字體,字體大小及語言的影響,具有很強的通用性。為達到上述目的,本發(fā)明的技術解決方案如下一種自適應圖像文本信息提取方法,其包括步驟1)圖像預處理;2)圖像背景復雜度分析;3)文本初檢測;4)文本驗證;5)文本抽?。?)文本信息輸出或顯示;其具體步驟為A)首先,從選定的路徑中讀取圖像,并將彩色圖像轉(zhuǎn)換為灰色圖像;B)根據(jù)灰色圖像所有象素點的灰度變化密度,計算出整幅圖像的背景復雜度,計算方法為某一象素點P。的灰度強度s'按照下式計算S'二廚(…-尸8|,|尸2HA(1)2450,S2TOtherwise則圖像的背景復雜度為:(3)其中,s'為圖像中像素點尸。的灰度強度,s按照(2)式將s'歸一化為(0,l)范圍內(nèi)的數(shù),T為歸一化的閾值,D為圖像的背景復雜度值,w為圖像中的像素數(shù)目,AA為P。的八鄰域;按照計算的D值對圖像背景復雜度進行分級;C)根據(jù)圖像復雜度級別決定采用何種文字邊緣檢測方法,對于復雜度較低的圖像,采用較簡單的邊緣文本檢測方法,對于復雜度較高的圖像,采用較復雜的邊緣文本檢測方法;D)根據(jù)采用的文本檢測方法,找出圖像中的候選文本區(qū)域,對文本信息區(qū)域進行初始定位;E)對從圖像中找到的候選文本區(qū)域,抽取相關特征進行文本區(qū)域驗證,通過驗證的候選文本區(qū)域,即判定為文本塊,將在后續(xù)的步驟中抽取文本信息,未通過驗證的候選文本區(qū)域,即判定為非文本區(qū)域,將其從候選文本中去除;F)對確定的文本塊,去除文本塊中的背景,將所有文本信息抽取出來;G)將圖像中抽取出來的所有文本信息輸出給下一級處理,或在計算機上顯示出來。所述的方法,其所述B)步中,對圖像背景復雜度進行分級,是分為低、中、高三級如果0SDS0.15,則圖像背景復雜度為低級;如果0.15<1)^0.3,則圖像背景復雜度為中級;如果0.3<1)^1則圖像背景復雜度為高級。所述的方法,其所述C)步中,對于復雜度較低的圖像,采用較簡單的邊緣檢測方法,對于復雜度較高的圖像,釆用較復雜的邊緣檢測方法,是:如果圖像背景復雜度判定為低,則采用邊緣特征抽取方法l:在灰度圖像上用Sobel四方向算子求取邊緣并抽取特征;如果圖像背景復雜度判定為中,則采用邊緣特征抽取方法2:基于形態(tài)學的方法在灰度圖象上求取形態(tài)邊緣并抽取特征;如果圖像背景復雜度判定為高,則采用邊緣特征抽取方法3:用基于形態(tài)學的彩色邊緣抽取方法,分別對三個顏色通道提取形態(tài)梯度,然后將三個顏色通道合并得到邊緣并抽取特征。所述的方法,其所述D)步中,找出圖像中的候選文本區(qū)域,是a)提取圖像的邊緣并抽取特征后,在邊緣圖像上進行連通域分析,獲得圖像上所有的連通元;b)利用邊緣特征和幾何特征對連通元進行篩選,剔除非文本連通元;c)對每個文本連通元的位置和尺寸進行分析,將在同一行或同一列的文本連通元組合,形成候選文本區(qū)域。所述的方法,其所述E)步中的相關特征,為文本區(qū)域中字符寬度的均值和方差,通過將文本行或文本列的二值圖像向水平方向和豎直方向投影,投影曲線上有明顯的波峰和波谷,通過統(tǒng)計相鄰波谷之間的距離,計算字符的平均寬度和方差。所述的方法,其所述F)步中,將所有文本信息抽取出來,是采用二值化的方法、顏色聚類的方法或統(tǒng)計模型的方法抽取所有文本信息。所述的方法,其所述b)步中的邊緣特征和幾何特征,其中,邊緣特征是邊緣密度特征和邊緣方向特征,幾何特征是連通以元的長,寬,寬高比,占空比。本發(fā)明,通過計算圖像背景復雜度,對不同復雜度背景的圖像采用不同的邊緣檢測方法,減少了采用單一邊緣檢測方法中的漏檢,誤檢現(xiàn)象,提高了文本提取系統(tǒng)的整體性能。該發(fā)明中圖像背景復雜度的計算方法簡單,有效,不僅能夠檢測出不同背景復雜度圖像中的文本信息,而且當圖像中文本和背景對比度不同時,同樣有效。檢測出的文本信息不受圖象字體,大小,及語言的影響,具有很強的通用性。圖1是本發(fā)明一種自適應圖像文本信息提取方法的示意圖2是本發(fā)明一種自適應圖像文本信息提取方法的實施例流程圖3是本發(fā)明實例結(jié)果示意圖。參照圖1、圖2和圖3,為本發(fā)明的一種自適應圖像文本信息提取方法,其包括步驟1)圖像預處理;2)圖像背景復雜度分析;3)文本初檢測;4)文本驗證;5)文本抽??;6)文本信息輸出或顯示;其具體步驟為a)首先,從選定的路徑中讀取圖像,并將彩色圖像轉(zhuǎn)換為灰色圖像;B)根據(jù)灰色圖像所有象素點的灰度變化密度,計算出整幅圖像的背景復雜度,對圖像背景復雜度進行分級。圖像背景復雜度計算方法如下某一像素點P。的灰度強度S'按照下式計算:s'=羅{ip,-p81,ip2-尸71,ip3-41a-ai}(i)S》T2450,Otherwise則圖像的灰度變化密度為d=-~~(3)其中,s'為圖像中像素點尸。的灰度強度,s按照(2)式將s'歸一化為(0,l)范圍內(nèi)的數(shù),T為歸一化的閾值。D為圖像的背景復雜度值,w為圖像中的像素數(shù)目,p,a為尸。的八鄰域,如表l所示-尸'尸2尸3尸4尸0尸8表1A的八鄰域通過計算圖像的灰度變化密度值,將圖像背景復雜度分為不同的等級,本發(fā)明中,將圖像背景復雜度分為低,中,高3級;C)根據(jù)圖像復雜度級別決定采用何種文字邊緣檢測方法,對于復雜度較低的圖像,采用較簡單的邊緣文本檢測方法,對于復雜度較高的圖像,采用較復雜的邊緣文本檢測方法;D)根據(jù)采用的文本檢測方法,找出圖像中的候選文本區(qū)域,對文本信息區(qū)域進行初始定位;E)對從圖像中找到的候選文本區(qū)域,抽取相關特征進行文本區(qū)域驗證,通過驗證的候選文本區(qū)域,即判定為文本塊,將在后續(xù)的步驟中抽取文本信息,未通過驗證的候選文本區(qū)域,即判定為非文本區(qū)域,將其從候選文本中去除。用到的特征為文本區(qū)域中字符寬度的均值和方差。該特征的抽取方法為,分別將文本行或文本列的二值圖像向水平方向和豎直方向投影,文本行或文本列中字符與字符之間存在一定的間隔,反映在投影曲線上有明顯的波峰和波谷,波峰對應字符的筆畫,波谷對應字符間隙,而非文本行或文本列的投影曲線相對平滑,沒有明顯的波峰或波谷。通過統(tǒng)計相鄰波谷之間的距離,可以統(tǒng)計出文本行或文本列中字符的平均寬度和方差。F)對確定的文本塊,去除文本塊中的背景,將所有文本信息抽取出來;G)將圖像中抽取出來的所有文本信息輸出給下一級處理,或在計算機上顯示出來。在B)步中,對圖像背景復雜度進行分級,是分為低、中、高三級,圖像的背景復雜度值作為分級的依據(jù),如果0SDS0.15,則圖像背景復雜度為低級;如果0.15<DS0.3,則圖像背景復雜度為中級;如果0.3<D《1則圖像背景復雜度為高級。在C)步中,對于復雜度較低的圖像,采用較簡單的邊緣檢測方法,對于復雜度較高的圖像,采用較復雜的邊緣檢測方法,是如果圖像背景復雜度判定為低,則按照邊緣特征抽取方法1,在灰度圖像上采用Sobel算子求取邊緣并抽取特征;具體方法為采用表2所示的,0°,45°,90°,135°四個方向的梯度算子,然后按照公式(4)計算圖像的邊緣。。(義,>0=11^{(70。(^,力,(^45。0,力,(790。(義,>0,(7135。0,力}(4)其中,G。。(u),cvoc,力,s。(;c,力,^。(x,力分別為圖像在0。,45°,90°,135°方向上的梯度圖像,G(:c,力為求得的邊緣圖像。<table>tableseeoriginaldocumentpage13</column></row><table>表2Sobel0,45,90,135四個方向梯度算子如果圖像背景復雜度判定為中等,則按照邊緣特征抽取方法2,采用基于形態(tài)學的方法在灰度圖像上求取邊緣并抽取特征,具體方法為首先選用3*3的結(jié)構(gòu)算子,按照公式(5)對灰度圖像進行膨脹運算得到膨脹圖像,然后按照公式(6)對灰度圖像進行腐蝕運算得到腐蝕圖像,最后按照公式(7)對膨脹圖像和腐蝕圖像求差分得到邊緣圖像?!渡?釘,"=maxA""氛,U(5)卩—m/2'|*"/27(x,y)s,,=min/"—/j—",力(6)來/2)=/(x,一;,-/(x,一、,"(7)其中^,,0^)為進行形態(tài)學的結(jié)構(gòu)元素,/(x-,》力)為與結(jié)構(gòu)元素對應的圖像中的點。;如果圖像背景復雜度判定為高等,則按照邊緣特征抽取方法3,采用彩色形態(tài)學邊緣檢測方法求取邊緣并抽取特征,具體的求取方法為首先按照公式7,分別對彩色圖像的i,G,S三個顏色通道求取梯度圖像,然后按照公式(8)求取邊緣圖像。五",少)二5]"jGj(x,少)卜7,G,S(8)j=i其中,Gj(;c,y)為在第j通道求得的梯度圖象,為第j通道對應的權重,£(^)為最后求得的邊緣圖象。在D)步中,找出圖像中的候選文本區(qū)域,是a)提取圖像的邊緣并抽取特征后,在邊緣圖像上進行連通域分析,獲得圖像上所有的連通元;b)利用邊緣特征和幾何特征對連通元進行篩選,所述的邊緣特征主要是邊緣密度特征和邊緣方向特征,幾何特征主要為連通以元的長,寬,寬高比,占空比;C)對每個文本連通元的位置和尺寸進行分析,將在同一行或同一列的文本連通元組合,形成候選文本區(qū)域。在E)步中的相關特征,為文本區(qū)域中字符寬度的均值和方差,通過將文本行或文本列的二值圖像向水平方向和豎直方向投影,投影曲線上有明顯的波峰和波谷,通過統(tǒng)計相鄰波谷之間的距離,計算字符的平均寬度和方差。在F)步中,將所有文本信息抽取出來,是采用二值化的方法、顏色聚類的方法或統(tǒng)計模型的方法抽取所有文本信息。下面結(jié)合附圖詳細說明本發(fā)明技術方案中所涉及的各個細節(jié)問題。應指出的是,所描述的實施例僅旨在便于對本發(fā)明的理解,而對其不起任何限定作用。圖2是本發(fā)明所述方法的實施例流程圖。下面以圖2和圖3中的三幅圖像l,2,3,為例來說明本發(fā)明中一些具體的實現(xiàn)流程。按照圖2,首先在步驟l啟動系統(tǒng),從指定路徑中讀取要處理的3幅圖像,并在計算機上進行顯示;步驟2,分別將3幅圖像轉(zhuǎn)換為灰度圖像,并在計算機上顯示;步驟3,在灰度圖像上按照圖像背景復雜度計算公式l,2,3分別計算出圖像背景復雜度值。本實施例中,計算出的圖1的背景復雜度為0.04,圖2的背景復雜度為0.18,圖3的背景復雜度為0.35;步驟4,根據(jù)圖像背景復雜度的計算值,將圖像背景復雜度等級判定為低、中、高三級,按照
發(fā)明內(nèi)容中的復雜度等級標準,圖1的背景復雜度應為低,圖2的背景復雜度應為中,圖3的背景復雜度應為高。圖像l背景復雜度判定為低則進入步驟5;圖2像背景復雜度判定為中則進入步驟6;圖像3背景復雜度判定為高則進入步驟7;步驟5,圖像l背景復雜度為低,則按照基于Sobel算子的邊緣抽取方法提取邊緣圖像4,并抽取邊緣密度特征和邊緣方向分布特征,然后進入步驟8;步驟6,圖像2背景復雜度為中,則按照基于數(shù)學形態(tài)學的邊緣抽取方法,在灰度圖像上提取邊緣圖象5,并抽取邊緣密度特征和邊緣方向分布特征,然后進入步驟8;步驟7,圖像3背景復雜度為高,則在彩色圖像上按照基于形態(tài)學的的彩色邊緣抽取方法對圖像提取邊緣圖象6,并抽取邊緣密度特征和邊緣方向分布特征,然后進入步驟8;步驟8,得到圖像的邊緣圖象并抽取特征后,分別在邊緣圖像4,5和6上進行8方向連通區(qū)域標定,找出圖像上所有的連通元;步驟9,對邊緣圖像4,5,6上對所有的連通元進行分析,將所有連通元分為文本連通元和非文本連通元,主要按照連通元的幾何特征和邊緣特征采用級聯(lián)分類器分別對單個連通元進行篩選,對于不滿足規(guī)則的連通元,確定為非文本連通元,滿足規(guī)則的連通元為文本連通元;步驟IO,對所有的文本連通元的位置和尺寸進行分析,將在同一行或同一列的尺寸大小相似的文本連通元組合,形成候選文本行或文本列;步驟ll,對所有候選文本行或文本列,進行水平方向或豎直方向投影,抽取字符寬度特征進行驗證,如果文本行(列)未通過驗證,則進入步驟12,如果文本行(列)通過驗證,則進入步驟13;步驟12,對于未通過文本塊驗證的候選文本塊,將其從候選文本行或列中去除,不再進行后續(xù)操作;步驟13,如果候選文本行(列)通過驗證,則確定該候選文本行(列)為文本信息行(列),并根據(jù)文本行或文本列的投影信息確定該文本行(列)的準確位置信息,在原圖上用方框標定出來,標定圖象為7,8,9,然后進入步驟14;步驟14,抽取文本行(列)中的文本信息,對于每一個文本行(列),采用Ostu二值化方法將其中的背景去除,以白色像素顯示,抽取相應的文本信息以黑色像素顯示;步驟15,抽取出的圖像中所有的文本信息以白底黑字的形式在計算機上進行顯示,進行文本塊抽取后的圖象為10,11,12,文本信息提取結(jié)束。總之,本發(fā)明充分考慮圖像背景的復雜度,能夠根據(jù)圖像背景的復雜度采用不同的邊緣檢測方法對圖像中的文本信息進行準確定位和抽取。該發(fā)明中圖像背景復雜度的計算方法簡單,有效,不僅能夠提取出不同背景復雜度圖像中的文本信息,而且提取出的文本信息不受字體,大小及語言的影響,具有很強的通用性。提高了文本提取系統(tǒng)的總體性能,為圖像的分類、檢索提供了有利的支持工具。以上所述,僅為本發(fā)明中的具體實施方式,但本發(fā)明的保護范圍并不局限于此,任何熟悉該技術的人在本發(fā)明所揭露的技術范圍內(nèi),可理解想到的變換或替換,都應涵蓋在本發(fā)明的包含范圍之內(nèi),因此,本發(fā)明的保護范圍應該以權利要求書的保護范圍為準。權利要求1、一種自適應圖像文本信息提取方法,其特征在于,包括步驟1)圖像預處理;2)圖像背景復雜度分析;3)文本初檢測;4)文本驗證;5)文本抽??;6)文本信息輸出或顯示;其具體步驟為A)首先,從選定的路徑中讀取圖像,并將彩色圖像轉(zhuǎn)換為灰色圖像;B)根據(jù)灰色圖像所有像素點的灰度變化密度,計算出整幅圖像的背景復雜度,計算方法為某一像素點P0的灰度強度S′按照下式計算S′=MAX{|P1-P8|,|P2-P7|,|P3-P6|,|P4-P5|}(1)<mathsid="math0001"num="0001"><math><![CDATA[<mrow><mi>S</mi><mo>=</mo><mfencedopen='{'close=''><mtable><mtr><mtd><mfrac><msup><mi>S</mi><mo>′</mo></msup><mn>255</mn></mfrac><mo>,</mo></mtd><mtd><mi>S</mi><mo>≥</mo><mi>T</mi></mtd></mtr><mtr><mtd><mn>0</mn><mo>,</mo></mtd><mtd><mi>Otherwise</mi></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math></maths>則圖像的背景復雜度為<mathsid="math0002"num="0002"><math><![CDATA[<mrow><mi>D</mi><mo>=</mo><mfrac><mrow><munder><mi>Σ</mi><mrow><mi>i</mi><mo>,</mo><mi>j</mi></mrow></munder><mi>S</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow></mrow><mi>n</mi></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math></maths>其中,S′為圖像中像素點P0的灰度強度,S按照(2)式將S′歸一化為(0,1)范圍內(nèi)的數(shù),T為歸一化的閾值,D為圖像的背景復雜度值,n為圖像中的像素數(shù)目,P1~P8為P0的八鄰域;按照計算的D值對圖像背景復雜度進行分級;C)根據(jù)圖像復雜度級別決定采用何種文字邊緣檢測方法,對于復雜度較低的圖像,采用較簡單的邊緣文本檢測方法,對于復雜度較高的圖像,采用較復雜的邊緣文本檢測方法;D)根據(jù)采用的文本檢測方法,找出圖像中的候選文本區(qū)域,對文本信息區(qū)域進行初始定位;E)對從圖像中找到的候選文本區(qū)域,抽取相關特征進行文本區(qū)域驗證,通過驗證的候選文本區(qū)域,即判定為文本塊,將在后續(xù)的步驟中抽取文本信息,未通過驗證的候選文本區(qū)域,即判定為非文本區(qū)域,將其從候選文本中去除;F)對確定的文本塊,去除文本塊中的背景,將所有文本信息抽取出來;G)將圖像中抽取出來的所有文本信息輸出給下一級處理,或在計算機上顯示出來。2、如權利要求l所述的方法,其特征在于,所述B)步中,對圖像背景復雜度進行分級,是分為低、中、高三級丄如果0《DS0.15,則圖像背景復雜度為低級;如果0.15<D《0.3,則圖像背景復雜度為中級;如果0.3<ZX1則圖像背景復雜度為高級。3、如權利要求1或2所述的方法,其特征在于,所述C)步中,對于復雜度較低的圖像,采用較簡單的邊緣檢測方法,對于復雜度較高的圖像,采用較復雜的邊緣檢測方法,是如果圖像背景復雜度判定為低,則采用邊緣特征抽取方法l:在灰度圖像上用Sobel四方向算子求取邊緣并抽取特征;如果圖像背景復雜度判定為中,則采用邊緣特征抽取方法2:基于形態(tài)學的方法在灰度圖像上求取形態(tài)邊緣并抽取特征;如果圖像背景復雜度判定為高,則采用邊緣特征抽取方法3:用基于形態(tài)學的彩色邊緣抽取方法,分別對三個顏色通道提取形態(tài)梯度,然后將三個顏色通道合并得到邊緣并抽取特征。4、如權利要求l所述的方法,其特征在于,所述D)步中,找出圖像中的候選文本區(qū)域,是a)提取圖像的邊緣并抽取特征后,在邊緣圖像上進行連通域分析,獲得圖像上所有的連通元;b)利用邊緣特征和幾何特征對連通元進行篩選,剔除非文本連通元;c)對每個文本連通元的位置和尺寸進行分析,將在同一行或同一列的文本連通元組合,形成候選文本區(qū)域。5、如權利要求l所述的方法,其特征在于,所述E)步中的相關特征,為文本區(qū)域中字符寬度的均值和方差,通過將文本行或文本列的二值圖像向水平方向和豎直方向投影,投影曲線上有明顯的波峰和波谷,通過統(tǒng)計相鄰波谷之間的距離,計算字符的平均寬度和方差。6、如權利要求l所述的方法,其特征在于,所述F)步中,將所有文本信息抽取出來,是采用二值化的方法、顏色聚類的方法或統(tǒng)計模型的方法抽取所有文本信息。7、如權利要求4所述的方法,其特征在于,所述b)步中的邊緣特征和幾何特征,其中,邊緣特征是邊緣密度特征和邊緣方向特征,幾何特征是連通以元的長,寬,寬高比,占空比。全文摘要本發(fā)明一種自適應圖像文本信息提取方法,涉及圖像中的文本信息提取技術,其包括步驟1)圖像預處理;2)圖像背景復雜度分析;3)文本初檢測;4)文本驗證;5)文本抽??;6)文本信息輸出或顯示。本發(fā)明方法,通過計算圖像背景復雜度,對不同復雜度背景的圖像采用不同的文本檢測方法,減少了采用單一文本檢測方法中的漏檢,誤檢現(xiàn)象,提高了文本提取系統(tǒng)的整體性能。本發(fā)明方法中圖像背景復雜度的計算方法簡單,有效,不僅能夠檢測出不同背景復雜度的圖像中的文字信息,而且檢測出的文本信息不受字體,大小及語言的影響,具有很強的通用性。文檔編號G06K9/20GK101615252SQ20081011561公開日2009年12月30日申請日期2008年6月25日優(yōu)先權日2008年6月25日發(fā)明者戴汝為,李敏花,王春恒,肖柏華申請人:中國科學院自動化研究所