學(xué)字符識(shí)別。
[0145]可選地,所述區(qū)域分類(lèi)器是由每個(gè)區(qū)域訓(xùn)練樣本對(duì)應(yīng)的第一分類(lèi)器級(jí)聯(lián)得到的第二分類(lèi)器。
[0146]可選地,每個(gè)所述第一分類(lèi)器是由相應(yīng)區(qū)域訓(xùn)練樣本的方向梯度直方圖特征經(jīng)過(guò)線(xiàn)性判別分析投影后得到。
[0147]可選地,對(duì)應(yīng)于數(shù)字區(qū)域的每個(gè)區(qū)域訓(xùn)練樣本包括至少兩個(gè)數(shù)字字符。
[0148]可選地,根據(jù)所述區(qū)域分類(lèi)器識(shí)別所述待識(shí)別圖像中的數(shù)字區(qū)域包括:
[0149]在所述待識(shí)別圖像上依次選取預(yù)設(shè)大小的候選區(qū)域;
[0150]通過(guò)所述區(qū)域分類(lèi)器判別每個(gè)所述候選區(qū)域的類(lèi)型;
[0151]將判別結(jié)果為數(shù)字區(qū)域類(lèi)型的候選區(qū)域進(jìn)行合并。
[0152]可選地,將判別結(jié)果為數(shù)字類(lèi)型的候選區(qū)域進(jìn)行合并包括:根據(jù)數(shù)字區(qū)域的形狀特征和/或數(shù)字區(qū)域在所述對(duì)象中的分布特征,即僅根據(jù)數(shù)字區(qū)域的形狀特征、或僅根據(jù)數(shù)字區(qū)域在所述對(duì)象中的分布特征、或同時(shí)根據(jù)數(shù)字區(qū)域的形狀特征和數(shù)字區(qū)域在所述對(duì)象中的分布特征,從而篩除被判定為數(shù)字區(qū)域類(lèi)型的候選區(qū)域中與數(shù)字區(qū)域無(wú)關(guān)的候選區(qū)域,并對(duì)剩余的數(shù)字類(lèi)型的候選區(qū)域進(jìn)行合并。
[0153]可選地,還包括:
[0154]按照預(yù)設(shè)比例對(duì)所述待識(shí)別圖像進(jìn)行縮放操作,以得到多個(gè)顯示比例的待識(shí)別圖像;
[0155]根據(jù)所述區(qū)域分類(lèi)器識(shí)別每個(gè)顯示比例的待識(shí)別圖像中的數(shù)字區(qū)域;以及
[0156]根據(jù)識(shí)別出的每個(gè)數(shù)字區(qū)域在相應(yīng)的待識(shí)別圖像中的相對(duì)位置,合并所有顯示比例的待識(shí)別圖像中識(shí)別出的數(shù)字區(qū)域,以作為所述待識(shí)別圖像中的數(shù)字區(qū)域。
[0157]可選地,在根據(jù)所述區(qū)域分類(lèi)器識(shí)別出所述待識(shí)別圖像中的數(shù)字區(qū)域之后,還包括:
[0158]將所述區(qū)域分類(lèi)器識(shí)別出的數(shù)字區(qū)域作為候選數(shù)字區(qū)域,并對(duì)每個(gè)候選數(shù)字區(qū)域中的字符進(jìn)行切分操作;
[0159]調(diào)用預(yù)配置的數(shù)字判別器,并根據(jù)所述數(shù)字判別器識(shí)別切分得到的每個(gè)字符;
[0160]篩除所述候選數(shù)字區(qū)域中的非數(shù)字字符,并將剩余字符對(duì)應(yīng)的區(qū)域作為所述待識(shí)別圖像中的數(shù)字區(qū)域。
[0161]可選地,所述數(shù)字判別器由對(duì)應(yīng)于所述對(duì)象中的數(shù)字區(qū)域內(nèi)的數(shù)字字符和非數(shù)字區(qū)域內(nèi)的非數(shù)字字符的字符訓(xùn)練樣本生成,且所述字符訓(xùn)練樣本來(lái)自所述對(duì)象的樣本圖像。
[0162]可選地,所述數(shù)字判別器是由相應(yīng)訓(xùn)練樣本的方向梯度直方圖特征經(jīng)過(guò)支持向量機(jī)的訓(xùn)練而得到。
[0163]因此,本公開(kāi)通過(guò)預(yù)先基于對(duì)象的樣本圖像的樣本訓(xùn)練,有助于提升對(duì)數(shù)字區(qū)域的識(shí)別準(zhǔn)確度,避免非數(shù)字區(qū)域、尤其是數(shù)字區(qū)域周?chē)姆菙?shù)字字符等對(duì)數(shù)字區(qū)域的影響,便于執(zhí)行后續(xù)的OCR處理。
[0164]以上所述僅為本公開(kāi)的較佳實(shí)施例而已,并不用以限制本公開(kāi),凡在本公開(kāi)的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本公開(kāi)保護(hù)的范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.一種數(shù)字區(qū)域的識(shí)別方法,其特征在于,包括: 獲取對(duì)象的待識(shí)別圖像; 調(diào)用預(yù)配置的對(duì)應(yīng)于所述對(duì)象的區(qū)域分類(lèi)器,所述區(qū)域分類(lèi)器由對(duì)應(yīng)于所述對(duì)象中的數(shù)字區(qū)域和非數(shù)字區(qū)域的區(qū)域訓(xùn)練樣本生成,且所述區(qū)域訓(xùn)練樣本來(lái)自所述對(duì)象的樣本圖像; 根據(jù)所述區(qū)域分類(lèi)器識(shí)別出所述待識(shí)別圖像中的數(shù)字區(qū)域,以供對(duì)所述數(shù)字區(qū)域進(jìn)行光學(xué)字符識(shí)別。2.根據(jù)權(quán)利要求1所述的識(shí)別方法,其特征在于,所述區(qū)域分類(lèi)器是由每個(gè)區(qū)域訓(xùn)練樣本對(duì)應(yīng)的第一分類(lèi)器級(jí)聯(lián)得到的第二分類(lèi)器。3.根據(jù)權(quán)利要求2所述的識(shí)別方法,其特征在于,每個(gè)所述第一分類(lèi)器是由相應(yīng)區(qū)域訓(xùn)練樣本的方向梯度直方圖特征經(jīng)過(guò)線(xiàn)性判別分析投影后得到。4.根據(jù)權(quán)利要求1所述的識(shí)別方法,其特征在于,對(duì)應(yīng)于數(shù)字區(qū)域的每個(gè)區(qū)域訓(xùn)練樣本包括至少兩個(gè)數(shù)字字符。5.根據(jù)權(quán)利要求1所述的識(shí)別方法,其特征在于,根據(jù)所述區(qū)域分類(lèi)器識(shí)別所述待識(shí)別圖像中的數(shù)字區(qū)域包括: 在所述待識(shí)別圖像上依次選取預(yù)設(shè)大小的候選區(qū)域; 通過(guò)所述區(qū)域分類(lèi)器判別每個(gè)所述候選區(qū)域的類(lèi)型; 將判別結(jié)果為數(shù)字區(qū)域類(lèi)型的候選區(qū)域進(jìn)行合并。6.根據(jù)權(quán)利要求5所述的識(shí)別方法,其特征在于,將判別結(jié)果為數(shù)字類(lèi)型的候選區(qū)域進(jìn)行合并包括: 根據(jù)數(shù)字區(qū)域的形狀特征和/或數(shù)字區(qū)域在所述對(duì)象中的分布特征,篩除被判定為數(shù)字區(qū)域類(lèi)型的候選區(qū)域中與數(shù)字區(qū)域無(wú)關(guān)的候選區(qū)域,并對(duì)剩余的數(shù)字類(lèi)型的候選區(qū)域進(jìn)行合并。7.根據(jù)權(quán)利要求1所述的識(shí)別方法,其特征在于,還包括: 按照預(yù)設(shè)比例對(duì)所述待識(shí)別圖像進(jìn)行縮放操作,以得到多個(gè)顯示比例的待識(shí)別圖像;根據(jù)所述區(qū)域分類(lèi)器識(shí)別每個(gè)顯示比例的待識(shí)別圖像中的數(shù)字區(qū)域;以及根據(jù)識(shí)別出的每個(gè)數(shù)字區(qū)域在相應(yīng)的待識(shí)別圖像中的相對(duì)位置,合并所有顯示比例的待識(shí)別圖像中識(shí)別出的數(shù)字區(qū)域,以作為所述待識(shí)別圖像中的數(shù)字區(qū)域。8.根據(jù)權(quán)利要求1所述的識(shí)別方法,其特征在于,在根據(jù)所述區(qū)域分類(lèi)器識(shí)別出所述待識(shí)別圖像中的數(shù)字區(qū)域之后,還包括: 將所述區(qū)域分類(lèi)器識(shí)別出的數(shù)字區(qū)域作為候選數(shù)字區(qū)域,并對(duì)每個(gè)候選數(shù)字區(qū)域中的字符進(jìn)行切分操作; 調(diào)用預(yù)配置的數(shù)字判別器,并根據(jù)所述數(shù)字判別器識(shí)別切分得到的每個(gè)字符; 篩除所述候選數(shù)字區(qū)域中的非數(shù)字字符,并將剩余字符對(duì)應(yīng)的區(qū)域作為所述待識(shí)別圖像中的數(shù)字區(qū)域。9.根據(jù)權(quán)利要求8所述的識(shí)別方法,其特征在于,所述數(shù)字判別器由對(duì)應(yīng)于所述對(duì)象中的數(shù)字區(qū)域內(nèi)的數(shù)字字符和非數(shù)字區(qū)域內(nèi)的非數(shù)字字符的字符訓(xùn)練樣本生成,且所述字符訓(xùn)練樣本來(lái)自所述對(duì)象的樣本圖像。10.根據(jù)權(quán)利要求9所述的識(shí)別方法,其特征在于,所述數(shù)字判別器是由相應(yīng)訓(xùn)練樣本的方向梯度直方圖特征經(jīng)過(guò)支持向量機(jī)的訓(xùn)練而得到。11.一種數(shù)字區(qū)域的識(shí)別裝置,其特征在于,包括: 圖像獲取單元,用于獲取對(duì)象的待識(shí)別圖像; 分類(lèi)器調(diào)用單元,用于調(diào)用預(yù)配置的對(duì)應(yīng)于所述對(duì)象的區(qū)域分類(lèi)器,所述區(qū)域分類(lèi)器由對(duì)應(yīng)于所述對(duì)象中的數(shù)字區(qū)域和非數(shù)字區(qū)域的區(qū)域訓(xùn)練樣本生成,且所述區(qū)域訓(xùn)練樣本來(lái)自所述對(duì)象的樣本圖像; 區(qū)域識(shí)別單元,用于根據(jù)所述區(qū)域分類(lèi)器識(shí)別出所述待識(shí)別圖像中的數(shù)字區(qū)域,以供對(duì)所述數(shù)字區(qū)域進(jìn)行光學(xué)字符識(shí)別。12.根據(jù)權(quán)利要求11所述的識(shí)別裝置,其特征在于,所述區(qū)域分類(lèi)器是由每個(gè)區(qū)域訓(xùn)練樣本對(duì)應(yīng)的第一分類(lèi)器級(jí)聯(lián)得到的第二分類(lèi)器。13.根據(jù)權(quán)利要求12所述的識(shí)別裝置,其特征在于,每個(gè)所述第一分類(lèi)器是由相應(yīng)區(qū)域訓(xùn)練樣本的方向梯度直方圖特征經(jīng)過(guò)線(xiàn)性判別分析投影后得到。14.根據(jù)權(quán)利要求11所述的識(shí)別裝置,其特征在于,對(duì)應(yīng)于數(shù)字區(qū)域的每個(gè)區(qū)域訓(xùn)練樣本包括至少兩個(gè)數(shù)字字符。15.根據(jù)權(quán)利要求11所述的識(shí)別裝置,其特征在于,所述區(qū)域識(shí)別單元包括: 區(qū)域選取子單元,用于在所述待識(shí)別圖像上依次選取預(yù)設(shè)大小的候選區(qū)域; 類(lèi)型判別子單元,用于通過(guò)所述區(qū)域分類(lèi)器判別每個(gè)所述候選區(qū)域的類(lèi)型; 區(qū)域處理子單元,用于將判別結(jié)果為數(shù)字區(qū)域類(lèi)型的候選區(qū)域進(jìn)行合并。16.根據(jù)權(quán)利要求15所述的識(shí)別裝置,其特征在于,所述區(qū)域處理子單元用于: 根據(jù)數(shù)字區(qū)域的形狀特征和/或數(shù)字區(qū)域在所述對(duì)象中的分布特征,篩除被判定為數(shù)字區(qū)域類(lèi)型的候選區(qū)域中與數(shù)字區(qū)域無(wú)關(guān)的候選區(qū)域,并對(duì)剩余的數(shù)字類(lèi)型的候選區(qū)域進(jìn)行合并。17.根據(jù)權(quán)利要求11所述的識(shí)別裝置,其特征在于,還包括: 圖像縮放單元,用于按照預(yù)設(shè)比例對(duì)所述待識(shí)別圖像進(jìn)行縮放操作,以得到多個(gè)顯示比例的待識(shí)別圖像;其中,所述區(qū)域識(shí)別單元根據(jù)所述區(qū)域分類(lèi)器識(shí)別每個(gè)顯示比例的待識(shí)別圖像中的數(shù)字區(qū)域; 區(qū)域合并單元,用于根據(jù)識(shí)別出的每個(gè)數(shù)字區(qū)域在相應(yīng)的待識(shí)別圖像中的相對(duì)位置,合并所有顯示比例的待識(shí)別圖像中識(shí)別出的數(shù)字區(qū)域,以作為所述待識(shí)別圖像中的數(shù)字區(qū)域。18.根據(jù)權(quán)利要求11所述的識(shí)別裝置,其特征在于,還包括: 字符切分單元,用于所述區(qū)域識(shí)別單元在根據(jù)所述區(qū)域分類(lèi)器識(shí)別出所述待識(shí)別圖像中的數(shù)字區(qū)域之后,將所述區(qū)域分類(lèi)器識(shí)別出的數(shù)字區(qū)域作為候選數(shù)字區(qū)域,并對(duì)每個(gè)候選數(shù)字區(qū)域中的字符進(jìn)行切分操作; 字符識(shí)別單元,用于調(diào)用預(yù)配置的數(shù)字判別器,并根據(jù)所述數(shù)字判別器識(shí)別切分得到的每個(gè)字符; 字符篩除單元,用于篩除所述候選數(shù)字區(qū)域中的非數(shù)字字符,并將剩余字符對(duì)應(yīng)的區(qū)域作為所述待識(shí)別圖像中的數(shù)字區(qū)域。19.根據(jù)權(quán)利要求18所述的識(shí)別裝置,其特征在于,所述數(shù)字判別器由對(duì)應(yīng)于所述對(duì)象中的數(shù)字區(qū)域內(nèi)的數(shù)字字符和非數(shù)字區(qū)域內(nèi)的非數(shù)字字符的字符訓(xùn)練樣本生成,且所述字符訓(xùn)練樣本來(lái)自所述對(duì)象的樣本圖像。20.根據(jù)權(quán)利要求19所述的識(shí)別裝置,其特征在于,所述數(shù)字判別器是由相應(yīng)訓(xùn)練樣本的方向梯度直方圖特征經(jīng)過(guò)支持向量機(jī)的訓(xùn)練而得到。21.—種移動(dòng)終端,其特征在于,包括如權(quán)利要求11至20中任一項(xiàng)所述的數(shù)字區(qū)域的識(shí)別裝置。
【專(zhuān)利摘要】本公開(kāi)提供一種數(shù)字區(qū)域的識(shí)別方法和識(shí)別裝置、移動(dòng)終端,該識(shí)別方法包括:獲取對(duì)象的待識(shí)別圖像;調(diào)用預(yù)配置的對(duì)應(yīng)于所述對(duì)象的區(qū)域分類(lèi)器,所述區(qū)域分類(lèi)器由對(duì)應(yīng)于所述對(duì)象中的數(shù)字區(qū)域和非數(shù)字區(qū)域的區(qū)域訓(xùn)練樣本生成,且所述區(qū)域訓(xùn)練樣本來(lái)自所述對(duì)象的樣本圖像;根據(jù)所述區(qū)域分類(lèi)器識(shí)別出所述待識(shí)別圖像中的數(shù)字區(qū)域,以供對(duì)所述數(shù)字區(qū)域進(jìn)行光學(xué)字符識(shí)別。通過(guò)本公開(kāi)的技術(shù)方案,可以對(duì)對(duì)象的待識(shí)別圖像進(jìn)行預(yù)處理,準(zhǔn)確識(shí)別出其中包含的數(shù)字區(qū)域,從而有助于后續(xù)的光學(xué)字符識(shí)別等操作,避免發(fā)生誤識(shí)別。
【IPC分類(lèi)】G06K9/46, G06K9/20
【公開(kāi)號(hào)】CN105224939
【申請(qǐng)?zhí)枴緾N201410234320
【發(fā)明人】張濤, 陳志軍, 張祺深
【申請(qǐng)人】小米科技有限責(zé)任公司
【公開(kāi)日】2016年1月6日
【申請(qǐng)日】2014年5月29日