本申請屬于圖像識別,尤其涉及一種字符識別方法、裝置、設備及計算機可讀存儲介質。
背景技術:
1、手寫字符的識別技術在處理數據信息的方面一直發揮著關鍵性作用。
2、相關技術中,常采用基于結構或統計的特征提取方式對字符進行識別。但是,基于結構的特征提取方式不但在提取字符特征時較為困難,且該方式對圖像噪聲敏感;基于統計的特征提取方式無法適應不同書寫風格的字符識別。
技術實現思路
1、本申請實施例提供一種字符識別方法、裝置、設備及計算機可讀存儲介質,能夠提高字符的識別率及識別速率。
2、第一方面,本申請實施例提供了一種字符識別方法,字符識別方法包括:將數據集中的圖像劃分為訓練集和測試集兩部分;基于二維主成成分分析算法,計算訓練集中各圖像的特征值,得到訓練集中各圖像的識別結果;確定訓練集中與測試集對應的目標圖像;使用分類器分類,將目標圖像字符識別結果作為測試集對應圖像的字符識別結果。
3、根據本申請第一方面的實施方式,基于二維主成成分分析算法,計算訓練集中各圖像的特征值,包括:將訓練集中的圖像轉化為第一灰度圖;將第一灰度圖轉化為目標寬度與目標高度的第一原始圖像;使用二維主成成分分析算法,計算第一原始圖像的特征值;并將第一原始圖像的特征值投影到特征空間,第一原始圖像的特征值為訓練集中各圖像的特征值;確定訓練集中與測試集對應的目標圖像,包括:根據特征空間,確定訓練集中與測試集對應的目標圖像。
4、根據本申請第一方面前述任一實施方式,根據特征空間,確定訓練集中與測試集對應的目標圖像,包括:將測試集中的圖像生成列向量集合;計算列向量集合中任一參數與特征空間多個預設方向的特征點的歐氏距離;選擇歐氏距離最小的特征點作為測試集中相應圖像的目標特征點;將訓練集中與目標特征點對應的圖像作為測試集中相應圖像的目標圖像。
5、根據本申請第一方面前述任一實施方式,數據集包括手寫數字數據庫。
6、根據本申請第一方面前述任一實施方式,分類器包括最鄰近規則分類模型,使用分類器分類,將目標圖像字符識別結果作為測試集對應圖像的字符識別結果,包括:使用最鄰近規則分類模型分類,將目標圖像字符識別結果作為測試集對應圖像的字符識別結果。
7、根據本申請第一方面前述任一實施方式,二維主成成分分析算法包括目標特征提取算法,使用二維主成成分分析算法,計算第一原始圖像的特征值,包括:使用目標特征提取算法,計算第一原始圖像的特征值。
8、根據本申請第一方面前述任一實施方式,使用目標特征提取算法,計算第一原始圖像的特征值,包括:使用目標特征提取算法計算第一原始圖像中同一特征值為0至100的字符圖像。
9、第二方面,本申請實施例提供了一種字符識別裝置,裝置包括:劃分模塊,用于將數據集中的圖像劃分為訓練集和測試集兩部分;計算模塊,用于基于二維主成成分分析算法,計算訓練集中各圖像的特征值,得到訓練集中各圖像的識別結果;確定模塊,用于確定訓練集中與測試集對應的目標圖像;分類模塊,用于使用分類器分類,將目標圖像字符識別結果作為測試集對應圖像的字符識別結果。
10、第三方面,本申請實施例提供了一種電子設備,電子設備包括:處理器以及存儲有計算機程序指令的存儲器;處理器執行計算機程序指令時實現如第一方面所述的字符識別方法。
11、第四方面,本申請實施例提供了一種計算機可讀存儲介質,計算機可讀存儲介質上存儲有計算機程序指令,計算機程序指令被處理器執行時實現如第一方面的字符識別方法。
12、本申請實施例的字符識別方法、裝置、設備及計算機可讀存儲介質,能夠完成字符的識別,通過將圖像劃分為訓練集和測試集兩部分,利用二維主成成分分析計算訓練集中各圖像的特征值,從訓練集中確定與測試集中圖像相對應的目標圖像,最終將目標圖像的識別結果作為最終的識別結果。由于采用二維主成成分分析算法,該算法是基于二維圖像數據,不需要將圖像降至一維,而是直接在二維空間上直接計算協方差。所以為特征提取節省了計算時間,提高了字符的識別速率。且由于不需要將二維圖像降至一維,所以保留了原圖像更多的結構信息,提高了字符的識別率,使結果更加準確。
1.一種字符識別方法,其特征在于,包括:
2.根據權利要求1所述的字符識別方法,其特征在于,所述基于二維主成成分分析算法,計算所述訓練集中各圖像的特征值,包括:
3.根據權利要求2所述的字符識別方法,其特征在于,所述根據所述特征空間,確定所述訓練集中與所述測試集對應的目標圖像,包括:
4.根據權利要求1所述的字符識別方法,其特征在于,所述數據集包括手寫數字數據庫。
5.根據權利要求1所述的字符識別方法,其特征在于,所述分類器包括最鄰近規則分類模型,所述使用分類器分類,將所述目標圖像字符識別結果作為所述測試集對應圖像的字符識別結果,包括:使用所述最鄰近規則分類模型分類,將所述目標圖像字符識別結果作為所述測試集對應圖像的字符識別結果。
6.根據權利要求2所述的字符識別方法,其特征在于,所述二維主成成分分析算法包括目標特征提取算法,所述使用所述二維主成成分分析算法,計算所述第一原始圖像的特征值,包括:
7.根據權利要求6所述的字符識別方法,其特征在于,所述使用目標特征提取算法,計算所述第一原始圖像的特征值,包括:
8.一種字符識別裝置,其特征在于,所述裝置包括:
9.一種電子設備,其特征在于,所述電子設備包括:處理器以及存儲有計算機程序指令的存儲器;
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機程序指令,所述計算機程序指令被處理器執行時實現如權利要求1-7任意一項所述的字符識別方法。