文字識別方法及裝置的制造方法
【技術領域】
[0001]本公開涉及模式識別技術領域,尤其涉及一種文字識別方法及裝置。
【背景技術】
[0002]模式識別技術的研究目的是根據人的大腦的識別機理,通過計算機模擬,構造出能代替人完成分類和辨識的任務,進而進行自動信息處理的機器系統。漢字識別在模式識別中的發展有一定的歷史,對于傳統的漢字識別,如果噪聲干擾不大,識別率能達到95%以上。最典型的應用就是身份證識別以及名片識別。
[0003]傳統的漢字識別方法基于傳統的特征抽取,然后再采用改進的二次分類函數(Modified Quadratic Discriminant Funct1n, MQDF)分類器來進行漢字識別。
[0004]但是,傳統的漢字識別通常基于人工經驗提取特征,不具備一定的噪聲抗干擾能力。因此,當噪聲干擾較大時,會導致漢字的識別率較低。
【發明內容】
[0005]為克服相關技術中存在的問題,本公開提供一種文字識別方法及裝置。
[0006]根據本公開實施例的第一方面,提供一種文字識別方法,包括:
[0007]采用卷積神經網絡對待識別文字圖像提取特征,得到文字特征值;
[0008]采用MQDF分類器對所述文字特征值進行分類處理,得到所述待識別文字圖像對應的文字。
[0009]在一實施例中,所述方法還包括:
[0010]對所述卷積神經網絡進行模型訓練。
[0011]在一實施例中,所述對所述卷積神經網絡進行模型訓練,包括:
[0012]將待識別文字圖像樣本和標簽輸入到所述卷積神經網絡的卷積層進行處理,得到卷積特征值;
[0013]將所述卷積特征值輸入到所述卷積神經網絡的全連接層進行處理,得到全連接特征值;
[0014]將所述全連接特征值輸入到所述卷積神經網絡的損失函數層進行反向傳播處理,來調整卷積層中卷積核的參數,直至所述損失函數層中的損失函數收斂到收斂閾值,否則重復對所述卷積神經網絡進行模型訓練。
[0015]在一實施例中,所述將所述待識別文字圖像樣本和標簽輸入到所述卷積神經網絡的卷積層進行處理,得到卷積特征值,包括:
[0016]將所述待識別文字圖像樣本和所述標簽作為第零卷積特征值輸入到所述卷積神經網絡的第一卷積層中進行處理,得到第一卷積特征值;
[0017]將所述第η-1卷積特征值輸入到所述卷積神經網絡的第η卷積層中進行處理,得到第η卷積特征值,η為大于或者等于2的整數,所述第η卷積特征值為所述卷積神經網絡的卷積層輸出的所述卷積特征值。
[0018]在一實施例中,所述將所述第η-1卷積特征值輸入到所述卷積神經網絡的第η卷積層中進行處理,得到第η卷積特征值,包括:
[0019]將所述第η-1卷積特征值輸入到所述第η卷積層的第η真實卷積層,所述第η真實卷積層中的多個卷積核對所述第η-1卷積特征值進行卷積,得到第η-1真實卷積特征值;
[0020]將所述第η-1真實卷積特征值輸入到第η池化層中進行池化處理,得到第η卷積特征值。
[0021 ] 在一實施例中,所述將所述全連接特征值輸入到所述卷積神經網絡的損失函數層進行反向傳播處理,來調整卷積層中卷積核的參數,直至所述損失函數層中的損失函數收斂到收斂閾值,否則重復對所述卷積神經網絡進行模型訓練,包括:
[0022]將所述全連接特征值輸入到所述卷積神經網絡的損失函數層進行損失函數計算,得到損失函數值,所述損失函數為分類值與標簽的差值函數;
[0023]當所述損失函數值小于上一次訓練得到的所述損失函數值時,對所述卷積神經網絡進行反向傳播來調整所述卷積層中卷積核的參數,并且重復對所述卷積神經網絡進行模型訓練,直到得到的所述損失函數值小于損失函數閾值并且收斂。
[0024]在一實施例中,所述采用卷積神經網絡對待識別文字圖像提取特征,得到文字特征值,包括:
[0025]將所述待識別文字圖像輸入到所述卷積神經網絡的卷積層進行處理,得到卷積特征值;
[0026]將所述卷積特征值輸入到所述卷積神經網絡的全連接層進行處理,得到全連接特征值;
[0027]將所述全連接特征值輸入到所述卷積神經網絡的函數層進行函數處理,得到所述文字特征值。
[0028]在一實施例中,所述將所述待識別文字圖像輸入到所述卷積神經網絡的卷積層進行處理,得到卷積特征值,包括:
[0029]將所述待識別文字圖像作為第零卷積特征值輸入到所述卷積神經網絡的第一卷積層中進行處理,得到第一卷積特征值;
[0030]將所述第η-1卷積特征值輸入到所述卷積神經網絡的第η卷積層中進行處理,得到第η卷積特征值,η為大于或者等于2的整數,所述第η卷積特征值為所述卷積神經網絡的卷積層輸出的所述卷積特征值。
[0031 ] 在一實施例中,所述方法還包括:
[0032]對所述待識別文字圖像進行歸一化的操作,或者對所述待識別文字圖像樣本進行歸一化的操作。
[0033]根據本公開實施例的第二方面,提供一種文字識別裝置,包括:
[0034]提取模塊,被配置為采用卷積神經網絡對待識別文字圖像提取特征,得到文字特征值;
[0035]分類模塊,被配置為采用MQDF分類器對所述提取模塊得到的所述文字特征值進行分類處理,得到所述待識別文字圖像對應的文字。
[0036]在一實施例中,所述裝置還包括:
[0037]訓練模塊,被配置為對所述卷積神經網絡進行模型訓練。
[0038]在一實施例中,所述訓練模塊包括:
[0039]第一處理子模塊,被配置為將待識別文字圖像樣本和標簽輸入到所述卷積神經網絡的卷積層進行處理,得到卷積特征值;
[0040]第二處理子模塊,被配置為將所述第一處理子模塊得到的所述卷積特征值輸入到所述卷積神經網絡的全連接層進行處理,得到全連接特征值;
[0041]第三處理子模塊,被配置為將所述第二處理子模塊得到的所述全連接特征值輸入到所述卷積神經網絡的損失函數層進行反向傳播處理,來調整卷積層中卷積核的參數,直至所述損失函數層中的損失函數收斂到收斂閾值,否則重復對所述卷積神經網絡進行模型訓練。
[0042]在一實施例中,所述第一處理子模塊包括:
[0043]第一處理單元,被配置為將所述待識別文字圖像樣本和所述標簽作為第零卷積特征值輸入到所述卷積神經網絡的第一卷積層中進行處理,得到第一卷積特征值;
[0044]第η處理單元,被配置為將所述第η-1卷積特征值輸入到所述卷積神經網絡的第η卷積層中進行處理,得到第η卷積特征值,η為大于或者等于2的整數,所述第η卷積特征值為所述卷積神經網絡的卷積層輸出的所述卷積特征值。
[0045]在一實施例中,所述第η處理單元包括:
[0046]卷積處理子單元,被配置為將所述第η-1卷積特征值輸入到所述第η卷積層的第η真實卷積層,所述第η真實卷積層中的多個卷積核對所述第η-1卷積特征值進行卷積,得到第η-1真實卷積特征值;
[0047]池化處理子單元,被配置為將所述卷積處理子單元得到的所述第η-1真實卷積特征值輸入到第η池化層中進行池化處理,得到第η卷積特征值。
[0048]在一實施例中,所述第三處理子模塊包括:
[0049]計算單元,被配置為將所述全連接特征值輸入到所述卷積神經網絡的損失函數層進行損失函數計算,得到損失函數值,所述損失函數為分類值與標簽的差值函數;
[0050]調整單元,被配置為當所述計算單元計算的所述損失函數值小于上一次訓練得到的所述損失函數值時,對所述卷積神經網絡進行反向傳播來調整所述卷積層中卷積核的參數,并且重復對所述卷積神經網絡進行模型訓練,直到得到的所述損失函數值小于損失函數閾值并且收斂。
[0051 ] 在一實施例中,所述提取模塊包括:
[0052]卷積處理子模塊,被配置為將所述待識別文字圖像輸入到所述卷積神經網絡的卷積層進行處理,得到卷積特征值;
[0053]全連接處理子模塊,被配置為將所述卷積處理子模塊得到的所述卷積特征值輸入到所述卷積神經網絡的全連接層進行處理,得到全連接特征值;
[0054]函數處理子模塊,被配置為將所述全連接處理子模塊得到的所述全連接特征值輸入到所述卷積神經網絡的函數層進行函數處理,得到所述文字特征值。
[0055]在一實施例中,所述卷積處理子模塊包括:
[0056]第一處理單元,被配置為將所述待識別文字圖像作為第零卷積特征值輸入到所述卷積神經網絡的第一卷積層中進行處理,得到第一卷積特征值;
[0057]第η處理單元,被配置為將所述第η-1卷積特征值輸入到所述卷積神經網絡的第η卷積層中進行處理,得到第η卷積特征值,η為大于或者等于2的整數,所述第η卷積特征值為所述卷積神經網絡的卷積層輸出的所述卷積特征值。
[0058]在一實施例中,所述裝置還包括:
[0059]歸一化模塊,被配置為對所述待識別文字圖像進行歸一化的操作,或者對所述待識別文字圖像樣本進行歸一化的操作。
[0060]根據本公開實施例的第三方面,提供一種文字識別裝置,包括:
[0061]處理器;
[0062]用于存儲處理器可執行指令的存儲器;
[0063]其中,處理器被配置為:
[0064]采用卷積神經網絡對待識別文字圖像提取特征,得到文字特征值;
[0065]采用MQDF分類器對所述文字特征值進行分類處理,得到所述待識別文字圖像對應的文字。
[0066]本公開的實施例提供的技術方案可以包括以下有益效果:采用卷積神經網絡對待識別文字圖像提取特征,使得得到的文字特征值更精確,具有較好的噪聲抗干擾能力,從而使得采用MQDF分類器根據該文字特征值識別出的文字準確率較高。
[0067]通過對卷積神經網絡進行模型訓練,使得該卷積神經網絡具有合適的模型參數,從而為后續得到豐富的文字特征值提供條件。
[0068]通過對卷積神經網絡進行模型訓練,可以獲得較好的模型參數,從而為后續采用該卷積神經網絡獲得文字特征值提供條件。
[0069]通過多個卷積層得到第η卷積特征值,