專利名稱:一種書寫漢字規范性評判的方法和裝置的制作方法
技術領域:
本發明涉及書寫漢字規范性評判的技術領域,尤其涉及一種書寫漢字規范性評判的方法和裝置。
背景技術:
在漢字應用水平測試和漢字應用教學等領域,如何有效的評判書寫漢字(測試人員手寫的漢字)的規范性是一個比較新穎的課題。目前所采用的方法主要是由人(教師) 來評判,這種方法一方面帶有很大的主觀性,同樣的書寫漢字不同的人可能給出差別較大的評判;另一方面,這一枯燥重復性的工作容易使人疲勞,同樣的漢字由同樣的人在不同的時間段進行評判,都有可能給出不同的評判結果。公開號為CN101630362A、名稱為“一種基于置信度的漢字書寫質量評價方法”的中國專利文獻,公開了一種基于置信度的漢字書寫質量評價方法,該方法采用修正二次判決函數計算候選字的距離,然后根據候選字的距離大小計算置信度并進行漢字書寫質量的評價,由于該方案的評價標準依賴于訓練樣本(即書寫漢字)的選取,如果訓練樣本書寫工整,則對書寫工整的漢字具有較好的評價,反之,評價較差;現有技術的基于訓練樣本的書寫漢字評判方法效果不好。
發明內容
本發明提供一種有效的、客觀的書寫漢字規范性評判的方法和裝置,其利用投影特征向量的距離之和與筆畫交接的面積之和對書寫漢字進行規范性評判,具有良好的評判效果。一種書寫漢字規范性評判的方法,包括以下步驟A獲取書寫漢字的筆畫,設共有η筆筆畫;采用道格拉斯-普克算法對每筆筆畫進行矢量數據壓縮,得到每筆筆畫的軌跡關鍵點 ’設第i筆筆畫共有P個軌跡關鍵點,將第i 筆筆畫的第t個軌跡關鍵點表示為S,相鄰的兩個軌跡關鍵點構成一個筆畫段,第i筆筆畫共有P-I個筆畫段,將第i筆筆畫的第d個筆畫段表示為Vd,其中,i = 1,2,...,n,t = 1, 2,...,p,d = 1,2,...,p—l ;B獲取投影特征向量的距離之和Dist_total,包括以下步驟獲取書寫漢字的第i筆筆畫的投影特征向量(PjctXPi, PjctXNi, PjctYPi, PjctYNi)
權利要求
1. 一種書寫漢字規范性評判的方法,其特征在于,包括A獲取書寫漢字的筆畫,設共有η筆筆畫;采用道格拉斯-普克算法對每筆筆畫進行矢量數據壓縮,得到每筆筆畫的軌跡關鍵點;設第i筆筆畫共有P個軌跡關鍵點,將第i筆筆畫的第t個軌跡關鍵點表示為s,相鄰的兩個軌跡關鍵點構成一個筆畫段,第i筆筆畫共有P-I個筆畫段,將第i筆筆畫的第d個筆畫段表示為vd,其中,i = 1,2,...,n,t = 1, 2,...,p,d = 1,2,...,p—l ;B獲取投影特征向量的距離之和Dist_total,包括獲取書寫漢字的第i筆筆畫的投影特征向量
2.根據權利要求1所述的一種書寫漢字規范性評判的方法,其特征在于,在步驟A之后,進一步包括Al 獲取模板漢字的筆畫數量;如果書寫漢字的筆畫數量與模板漢字的筆畫數量不相等, 判斷出該書寫漢字為不規范的書寫漢字。
3.根據權利要求2所述的一種書寫漢字規范性評判的方法,其特征在于,在步驟Al之后,進一步包括A2 A21 設 i = 1 ;A22獲取書寫漢字的第i筆筆畫的筆畫段Vd與模板漢字的第i筆筆畫的筆畫段U。的交點數量m,判斷交點數量m是否不大于預置閥值,如果是,繼續步驟A23,否則,判斷出該書寫漢字為不規范的書寫漢字;A23判斷書寫漢字的第i筆筆畫的兩個不相鄰的筆畫段^是否有交點,如果是,判斷出該書寫漢字為不規范的書寫漢字,否則,繼續步驟A24 ;A24判斷步驟A22獲取的交點數量m是否小于2個,如果是,繼續步驟A25,否則,判斷筆畫段Vd是否按筆畫段11。的先后順序與筆畫段11。相交,如果是,繼續步驟A25,否則,判斷出該書寫漢字為不規范的書寫漢字;A25判斷i是否等于n,如果是,步驟A2結束,否則,i = i+Ι,返回步驟A22。
4.根據權利要求3所述的一種書寫漢字規范性評判的方法,其特征在于,所述預置閥值為3、4或5。
5.根據權利要求1至4任意一項所述的一種書寫漢字規范性評判的方法,其特征在于, 所述機器學習方法為貝葉斯分類器方法、支持向量機方法、直接閾值法或AdaBoost方法。
6. 一種書寫漢字規范性評判的裝置,其特征在于,包括書寫漢字軌跡識別裝置,用于獲取書寫漢字的筆畫,設共有η筆筆畫;采用道格拉斯-普克算法對每筆筆畫進行矢量數據壓縮,得到每筆筆畫的軌跡關鍵點;設第i筆筆畫共有P個軌跡關鍵點,將第i筆筆畫的第t個軌跡關鍵點表示為\,相鄰的兩個軌跡關鍵點構成一個筆畫段,第i筆筆畫共有P-I個筆畫段,將第i筆筆畫的第d個筆畫段表示為vd,其中,i = l,2,...,n,t = l,2,...,p,d = 1,2,...,p-1 ;筆畫投影特征相似性獲取裝置,用于獲取投影特征向量的距離之和Dist_total,包括以下步驟獲取書寫漢字的第i筆筆畫的投影特征向量(PjctXPi, PjctXNi, PjctYPi, PjctYNi)
7.根據權利要求6所述的一種書寫漢字規范性評判的裝置,其特征在于進一步包括筆畫數量比較裝置,用于獲取模板漢字的筆畫數量,如果書寫漢字的筆畫數量與模板漢字的筆畫數量不相等,判斷出該書寫漢字為不規范的書寫漢字。
8.根據權利要求7所述的一種書寫漢字規范性評判的裝置,其特征在于進一步包括筆畫規范性判斷裝置,用于判斷每筆筆畫的規范性,判斷步驟包括A21 設 i = 1 ;A22獲取書寫漢字的第i筆筆畫的筆畫段Vd與模板漢字的第i筆筆畫的筆畫段U。的交點數量m,判斷交點數量m是否不大于預置閥值,如果是,繼續步驟A23,否則,判斷出該書寫漢字為不規范的書寫漢字;A23判斷書寫漢字的第i筆筆畫的兩個不相鄰的筆畫段^是否有交點,如果是,判斷出該書寫漢字為不規范的書寫漢字,否則,繼續步驟A24 ;A24判斷步驟A22獲取的交點數量m是否小于2個,如果是,繼續步驟A25,否則,判斷筆畫段Vd是否按筆畫段11。的先后順序與筆畫段11。相交,如果是,繼續步驟A25,否則,判斷出該書寫漢字為不規范的書寫漢字;A25判斷i是否等于n,如果是,步驟A2結束,否則,i = i+Ι,返回步驟A22。
9.根據權利要求8所述的一種書寫漢字規范性評判的裝置,其特征在于,所述預置閥值為3、4或5。
10.根據權利要求6至9任意一項所述的一種書寫漢字規范性評判的裝置,其特征在于,所述機器學習方法為貝葉斯分類器方法、支持向量機方法、直接閾值法或AdaBoost方法。
全文摘要
本發明公開了一種書寫漢字規范性評判的方法和裝置;書寫漢字規范性評判的方法包括獲取書寫漢字的筆畫,用道格拉斯-普克算法對每筆筆畫進行矢量數據壓縮,得到每筆筆畫的軌跡關鍵點,獲取投影特征向量的距離之和,獲取筆畫交接的面積之和,根據機器學習方法,利用投影特征向量的距離之和與筆畫交接的面積之和,對書寫漢字進行規范性評判;本技術方案可以有效、客觀對書寫漢字進行規范性評判,具有良好的評判效果。
文檔編號G06T7/00GK102339392SQ20101023107
公開日2012年2月1日 申請日期2010年7月20日 優先權日2010年7月20日
發明者朱軍民, 祝豪, 鄧超 申請人:廣東開心信息技術有限公司