次選取預(yù)設(shè)大小的候選區(qū)域;類型判別子單元,用于通過所述區(qū)域分類器判別每個(gè)所述候選區(qū)域的類型;區(qū)域處理子單元,用于將判別結(jié)果為數(shù)字區(qū)域類型的候選區(qū)域進(jìn)行合并。
[0033]在該技術(shù)方案中,通過依次選取候選區(qū)域并識(shí)別其類型,從而將判別為數(shù)字區(qū)域類型的候選區(qū)域合并,以得到最終的數(shù)字區(qū)域。其中,候選區(qū)域的大小可以根據(jù)實(shí)際需求進(jìn)行預(yù)先設(shè)置,當(dāng)候選區(qū)域較大時(shí)有助于提升識(shí)別效率,而當(dāng)候選區(qū)域較小時(shí)則有助于提升識(shí)別精準(zhǔn)度。
[0034]在一示例性實(shí)施例中,所述區(qū)域處理子單元用于:根據(jù)數(shù)字區(qū)域的形狀特征和/或數(shù)字區(qū)域在所述對(duì)象中的分布特征,篩除被判定為數(shù)字區(qū)域類型的候選區(qū)域中與數(shù)字區(qū)域無(wú)關(guān)的候選區(qū)域,并對(duì)剩余的數(shù)字類型的候選區(qū)域進(jìn)行合并。
[0035]在該技術(shù)方案中,數(shù)字區(qū)域的形狀特征包括:數(shù)字區(qū)域呈矩形、與對(duì)象的邊沿平行、數(shù)字區(qū)域內(nèi)的數(shù)字字符排列為一排或多排、數(shù)字區(qū)域?yàn)轭A(yù)設(shè)長(zhǎng)度等;而數(shù)字區(qū)域在對(duì)象中的分布特征包括:數(shù)字區(qū)域在對(duì)象上的相對(duì)設(shè)置位置、數(shù)字區(qū)域與對(duì)象之間的相對(duì)顯示比例等?;跀?shù)字區(qū)域的形狀特征和/或分布特征,即可篩除不符合要求的候選區(qū)域,消除誤判斷的影響;同時(shí),通過合并符合要求的數(shù)字區(qū)域類型的候選區(qū)域,從整體上得到組成待識(shí)別圖像上的數(shù)字區(qū)域。
[0036]在一示例性實(shí)施例中,還包括:圖像縮放單元,用于按照預(yù)設(shè)比例對(duì)所述待識(shí)別圖像進(jìn)行縮放操作,以得到多個(gè)顯示比例的待識(shí)別圖像;其中,所述區(qū)域識(shí)別單元根據(jù)所述區(qū)域分類器識(shí)別每個(gè)顯示比例的待識(shí)別圖像中的數(shù)字區(qū)域;區(qū)域合并單元,用于根據(jù)識(shí)別出的每個(gè)數(shù)字區(qū)域在相應(yīng)的待識(shí)別圖像中的相對(duì)位置,合并所有顯示比例的待識(shí)別圖像中識(shí)別出的數(shù)字區(qū)域,以作為所述待識(shí)別圖像中的數(shù)字區(qū)域。
[0037]在該技術(shù)方案中,通過基于圖像縮放操作的金字塔掃描,使得在不同顯示比例的待識(shí)別圖像上分別實(shí)現(xiàn)區(qū)域特征識(shí)別,有助于消除顯示比例的差異而導(dǎo)致的識(shí)別誤差。
[0038]在一示例性實(shí)施例中,還包括:字符切分單元,用于所述區(qū)域識(shí)別單元在根據(jù)所述區(qū)域分類器識(shí)別出所述待識(shí)別圖像中的數(shù)字區(qū)域之后,將所述區(qū)域分類器識(shí)別出的數(shù)字區(qū)域作為候選數(shù)字區(qū)域,并對(duì)每個(gè)候選數(shù)字區(qū)域中的字符進(jìn)行切分操作;字符識(shí)別單元,用于調(diào)用預(yù)配置的數(shù)字判別器,并根據(jù)所述數(shù)字判別器識(shí)別切分得到的每個(gè)字符;字符篩除單元,用于篩除所述候選數(shù)字區(qū)域中的非數(shù)字字符,并將剩余字符對(duì)應(yīng)的區(qū)域作為所述待識(shí)別圖像中的數(shù)字區(qū)域。
[0039]在該技術(shù)方案中,當(dāng)區(qū)域分類器對(duì)應(yīng)的區(qū)域訓(xùn)練樣本中包含至少兩個(gè)數(shù)字字符時(shí),其更傾向于整體區(qū)域特征的識(shí)別,從而導(dǎo)致識(shí)別出的數(shù)字區(qū)域中可能包含有非數(shù)字字符。因此,將區(qū)域分類器得到的數(shù)字區(qū)域重新作為候選數(shù)字區(qū)域,并實(shí)現(xiàn)基于數(shù)字判別器的字符類型識(shí)別,能夠有效消除候選數(shù)字區(qū)域中包含的非數(shù)字字符,避免影響后續(xù)的OCR處理等。
[0040]在一示例性實(shí)施例中,所述數(shù)字判別器由對(duì)應(yīng)于所述對(duì)象中的數(shù)字區(qū)域內(nèi)的數(shù)字字符和非數(shù)字區(qū)域內(nèi)的非數(shù)字字符的字符訓(xùn)練樣本生成,且所述字符訓(xùn)練樣本來(lái)自所述對(duì)象的樣本圖像。在該技術(shù)方案中,由于數(shù)字判別器是預(yù)先基于對(duì)象的樣本圖像的樣本訓(xùn)練而得到,使得在利用該數(shù)字判別器對(duì)字符類型進(jìn)行識(shí)別時(shí),其分類依據(jù)實(shí)際上來(lái)源于對(duì)象自身的字符特點(diǎn),從而不僅能夠適用于多種環(huán)境條件(每個(gè)樣本圖像均可以認(rèn)為對(duì)應(yīng)于一種環(huán)境條件),而且具有更強(qiáng)的識(shí)別能力和更好的識(shí)別效果,從而準(zhǔn)確識(shí)別出非數(shù)字字符,使最終得到的數(shù)字區(qū)域更加準(zhǔn)確。
[0041]在一示例性實(shí)施例中,所述數(shù)字判別器是由相應(yīng)訓(xùn)練樣本的方向梯度直方圖特征經(jīng)過支持向量機(jī)的訓(xùn)練而得到。
[0042]根據(jù)本公開實(shí)施例的第三方面,提供一種移動(dòng)終端,包括如上述技術(shù)方案中任一項(xiàng)所述的數(shù)字區(qū)域的識(shí)別裝置。
[0043]由以上技術(shù)方案可見,本公開通過預(yù)先基于對(duì)象的樣本圖像的樣本訓(xùn)練,有助于提升對(duì)數(shù)字區(qū)域的識(shí)別準(zhǔn)確度,避免非數(shù)字區(qū)域、尤其是數(shù)字區(qū)域周圍的非數(shù)字字符等對(duì)數(shù)字區(qū)域的影響,便于執(zhí)行后續(xù)的OCR處理。
[0044]應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開。
【附圖說明】
[0045]此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本公開的實(shí)施例,并與說明書一起用于解釋本公開的原理。
[0046]圖1是根據(jù)一示例性實(shí)施例示出的一種數(shù)字區(qū)域的識(shí)別方法的流程示意圖;
[0047]圖2是根據(jù)一示例性實(shí)施例示出的對(duì)象的樣本圖像的示意圖;
[0048]圖3A-3C是根據(jù)一示例性實(shí)施例示出的區(qū)域訓(xùn)練樣本的示意圖;
[0049]圖4是根據(jù)一示例性實(shí)施例示出的利用區(qū)域分類器進(jìn)行區(qū)域識(shí)別的示意流程圖;
[0050]圖5A-5C是根據(jù)一示例性實(shí)施例示出的利用區(qū)域分類器進(jìn)行區(qū)域識(shí)別的示意流程圖;
[0051]圖6是根據(jù)一示例性實(shí)施例示出的基于金字塔掃描的方式實(shí)現(xiàn)區(qū)域識(shí)別的示意圖;
[0052]圖7A-7B是根據(jù)一示例性實(shí)施例示出的數(shù)字訓(xùn)練樣本的示意圖;
[0053]圖8A-8B是根據(jù)一示例性實(shí)施例示出的利用數(shù)字判別器進(jìn)行數(shù)字識(shí)別的示意圖;
[0054]圖9是根據(jù)一示例性實(shí)施例示出的一種數(shù)字區(qū)域的識(shí)別裝置的示意框圖;
[0055]圖10是根據(jù)一示例性實(shí)施例示出的一種移動(dòng)終端的示意框圖;
[0056]圖11是根據(jù)一示例性實(shí)施例示出的一種用于識(shí)別對(duì)象中的數(shù)字區(qū)域的裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0057]這里將詳細(xì)地對(duì)示例性實(shí)施例進(jìn)行說明,其示例表示在附圖中。下面的描述涉及附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本公開相一致的所有實(shí)施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本公開的一些方面相一致的裝置和方法的例子。
[0058]圖1是根據(jù)一示例性實(shí)施例示出的一種數(shù)字區(qū)域的識(shí)別方法的流程示意圖。
[0059]如圖1所示,根據(jù)一示例性實(shí)施例示出的一種數(shù)字區(qū)域的識(shí)別方法,包括:
[0060]在步驟102中,獲取對(duì)象的待識(shí)別圖像。
[0061]在步驟104中,調(diào)用預(yù)配置的對(duì)應(yīng)于所述對(duì)象的區(qū)域分類器。其中,所述區(qū)域分類器由對(duì)應(yīng)于所述對(duì)象中的數(shù)字區(qū)域和非數(shù)字區(qū)域的區(qū)域訓(xùn)練樣本生成,且所述區(qū)域訓(xùn)練樣本來(lái)自所述對(duì)象的樣本圖像。
[0062]在步驟106中,根據(jù)所述區(qū)域分類器識(shí)別出所述待識(shí)別圖像中的數(shù)字區(qū)域,以供對(duì)所述數(shù)字區(qū)域進(jìn)行光學(xué)字符識(shí)別。
[0063]在該技術(shù)方案中,由于區(qū)域分類器是預(yù)先基于對(duì)象的樣本圖像的樣本訓(xùn)練而得至IJ,使得在利用該區(qū)域分類器對(duì)對(duì)象進(jìn)行分類識(shí)別時(shí),其分類依據(jù)實(shí)際上來(lái)源于對(duì)象自身的區(qū)域設(shè)置特點(diǎn),不僅能夠適應(yīng)于多種環(huán)境條件(每個(gè)樣本圖像均可以認(rèn)為對(duì)應(yīng)于一種環(huán)境條件),而且具有更強(qiáng)的識(shí)別能力和更好的識(shí)別效果,從而準(zhǔn)確識(shí)別出待識(shí)別圖像中的數(shù)字區(qū)域,便于執(zhí)行后續(xù)的OCR處理。
[0064]1、區(qū)域分類器
[0065]在訓(xùn)練區(qū)域分類器時(shí),首先需要獲取對(duì)象的樣本圖像。假定對(duì)象為手機(jī)充值卡,則圖2示出了相應(yīng)的示意圖。在如圖2所示的手機(jī)充值卡上,包括數(shù)字區(qū)域202和其他的非數(shù)字區(qū)域(未具體標(biāo)示)。在使用時(shí),需要將數(shù)字區(qū)域202內(nèi)的密碼(需要事先刮開涂層,圖2所示為刮開后的場(chǎng)景)反饋至服務(wù)器,從而完成充值過程。
[0066]在獲取了如圖2所示的樣本圖像后,需要通過圖像切割來(lái)進(jìn)一步得到區(qū)域訓(xùn)練樣本,包括正樣本(對(duì)應(yīng)于數(shù)字區(qū)域202)和負(fù)樣本(對(duì)應(yīng)于非數(shù)字區(qū)域)。
[0067]I)正樣本:
[0068]圖3A-3C是根據(jù)一示例性實(shí)施例示出的區(qū)域訓(xùn)練樣本的示意圖。
[0069]如圖3A所示,為一示例性實(shí)施例的樣本圖像上的數(shù)字區(qū)域,可以將一定的字符數(shù)量作為切割單位,實(shí)現(xiàn)對(duì)一串密碼的切割操作。比如將“013413460720662020”切割為“ OI ”、“ 34 ”、“ 13 ”、“ 46 ”、“07 ”、“ 20 ”、“ 66 ”、“ 20 ”和“ 20 ”等。通過對(duì)不同的樣本圖像進(jìn)行切割(比如圖3B示出了另一樣本圖像的數(shù)字區(qū)域),就能夠得到很多對(duì)應(yīng)于數(shù)字區(qū)域的正樣本。正樣本總數(shù)可以根據(jù)實(shí)際情況確定,比如可以選擇為5-10萬(wàn)個(gè),或者當(dāng)正樣本數(shù)量更多時(shí),顯然有助于提高區(qū)域分類器在訓(xùn)練后的識(shí)別準(zhǔn)確度。
[0070]需要說明的是:一方面,正樣本中可以包含重復(fù)的數(shù)字組合,比如圖3A示出的樣本圖像中,切割得到了三個(gè)包含“20”的正樣本,但由于光線、清晰度等外界條件的不同,使得重復(fù)樣本的存在,有助于在各種環(huán)境條件下均保持較高的識(shí)別準(zhǔn)確度。
[0071]另一方面,雖然圖3A和圖3B中的每個(gè)正樣本均包含兩個(gè)字符,但在對(duì)樣本圖像的數(shù)字區(qū)域進(jìn)行切割時(shí),切割長(zhǎng)度只需要確保包含多個(gè)字符即可,從而確保每個(gè)正樣本都能夠體現(xiàn)出整體結(jié)構(gòu)上的特征,以區(qū)別于單個(gè)數(shù)字字符;比如圖3C示出了包含三個(gè)字符的正樣本的情況。但由于字符數(shù)量的增多,也導(dǎo)致字符之間的組合數(shù)量的增加(比如兩個(gè)字符時(shí)的組合數(shù)量為100個(gè),而三個(gè)字符時(shí)的組合數(shù)量為1000個(gè)),很可能使得某種組合的遺漏,從而影響到對(duì)相應(yīng)情況的訓(xùn)練。
[0072]此外,為了確保各個(gè)正樣本之間的一致性,可以對(duì)切割得到的所有正樣本的圖像規(guī)格進(jìn)行歸一化,比如歸一化為40 X 20 (單位為像素)。
[0073]2)負(fù)樣本:
[0074]負(fù)樣本取自樣本圖像上的