專利名稱:一種手寫識別方法、系統及手寫識別終端的制作方法
技術領域:
本發明涉及模式識別技術,特別是涉及一種基于最大熵模型的手寫識別方法、系統及手寫識別終端。
背景技術:
手寫識別(Handwriting Recognize),是指將在手寫設備上書寫時產生的有序軌跡信息轉化為漢字內碼的過程,實際上是手寫軌跡的坐標序列到漢字內碼的一個映射過程,是人機交互最自然、最方便的手段之一。目前用于手寫輸入的設備有許多種,比如電磁感應手寫板、壓感式手寫板、觸摸 屏、觸控板、超聲波筆等。用戶在手寫輸入設備上書寫的筆畫以類似于矢量圖的形式被計算機存儲下來,通過對文字圖像的抬筆、落筆、筆跡上各像素的空間位置等信息進行處理與對 照,系統將數據轉化為計算機所使用的文字編碼進行輸出。隨著智能手機、掌上電腦等移動 信息工具的普及,手寫識別技術也進入了規模應用時代,可廣泛應用于各種桌面操作系統、嵌入式操作系統中。手輸入的模式也從單字手寫識別發展到了多字手寫識別,多字字符的切割是影響手寫識別準確性和用戶體驗性的關鍵技術,目前采用的字符切割算法大部分是基于規則來完成切割點的判斷,且無法給出判斷為切割點的概率,因此切割后的字符識別結果經常出現錯誤,從而導致識別率的下降,影響多字輸入的手寫體驗。
發明內容
本發明提供一種手寫識別方法、系統及字符識別終端,以解決現有的字符識別結果經常出現錯誤,導致識別率下降,進而影響多字輸入的手寫體驗的問題。為了解決上述問題,本發明公開了一種手寫識別方法,包括采集連續輸入的筆跡;提取筆跡特征;將筆跡特征輸入到最大熵模型中,最大熵模型判斷當前的筆畫是否為切割點;如果是,則對字符進行切割,得到最終識別結果。優選的,最大熵模型判斷當前的筆畫是否為切割點包括最大熵模型利用筆跡特征給出當前筆畫為切割點的概率;如果得到的概率大于預設概率則當前筆畫為切割點。優選的,還包括確定預設概率的步驟,確定預設概率包括對所述字符筆跡進行切害I],得到至少一條切分路徑;對各切分路徑進行單字識別,針對每一個切分路徑得到候選識別結果及得到該候選識別結果的第一概率值;利用語言模型對各候選識別結果進行打分,得出針對每個候選識別結果的表示字符間關聯信息的第二概率值;根據各候選識別結果的第一概率值和第二概率值得到各候選識別結果的綜合概率值;選擇最大綜合概率值為預設概率。優選的,采集連續輸入的筆跡包括采集以疊字連續輸入的字符筆跡或以行或以列連續輸入的字符筆跡。優選的,還包括建立最大熵模型,所述建立最大熵模型包括選擇最大熵模型特征,準備訓練數據,訓練最大熵模型。優選的,選擇的最大熵模型特征包括選擇以疊字連續輸入的字符筆跡的筆跡特征;即選擇筆畫間的相對位置、筆畫位于書寫區域的位置、筆畫落筆點所在的區域位置、抬筆點所在的區域位置、增加筆畫的大小比例、筆畫高度占書寫區域高度的比例或筆畫寬度占書寫區域寬度的比例中至少一個特征作為最大熵模型的特征。優選的,選擇的最大熵模型特征包括選擇以行連續輸入的字符筆跡的筆跡特征,即選擇當前字符前面空隙的寬度、后面空隙的寬度和當前字符的寬高比中至少一個特征作為最大熵模型的特征;選擇以列連續輸入的字符筆跡的筆跡特征,即選擇當前字符上面空隙的寬度、下面空隙的寬度和當前字符的寬高比中至少一個特征作為最大 熵模型的特征。本發明還公開了一種手寫識別系統,包括采集模塊,用于采集連續輸入的筆跡;特征提取模塊用于提取筆跡特征;切割模塊,用于將筆跡特征輸入到最大熵模型中,最大熵模型判斷當前的筆畫是否為切割點;識別模塊,用于當當前的筆畫為切割點時,對字符進行切割,得到最終識別結果。優選的,手寫識別系統還包括確定模塊,用于確定預設概率;所述確定模塊包括切割子模塊;用于對所述字符筆跡進行切割,得到至少一條切分路徑;單字識別子模塊;用于對各切分路徑進行單字識別,針對每一個切分路徑得到候選識別結果及得到該候選識別結果的第一概率值;語言模型識別子模塊;用于利用語言模型對各候選識別結果進行打分,得出針對每個候選識別結果的表示字符間關聯信息的第二概率值;綜合判斷子模塊;用于根據各候選識別結果的第一概率值和第二概率值得到各候選識別結果的綜合概率值;選擇子模塊;用于選擇最大綜合概率值為預設概率。本發明還公開了一種手寫識別終端,包括本發明公開的一種手寫識別系統。與現有技術相比,本發明具有以下優點本發明給出的基于最大熵的字符切割方法,是基于統計的預測模型,可以對字符筆畫與筆畫之間的關系進行更加準確的判斷,從而確認是否為切割點,并給出判斷為切割點的概率,更加綜合且全面的判斷字符間的切割,提高識別結果的準確性。
圖I是本發明實施例所述一種手寫識別方法流程圖;圖2是本發明實施例所述一種手寫識別系統的結構圖。
具體實施例方式為使本發明的上述目的、特征和優點能夠更加明顯易懂,下面結合附圖和具體實施方式
對本發明作進一步詳細的說明。本發明提出一種手寫識別方法、系統及終端,該方法可以提取用戶連續書寫的筆跡特征輸入到最大熵模型中進行是否為切割點的判斷,可以對字符筆畫與筆畫之間的關系進行更加準確的判斷,提高識別結果的準確性。
下面通過實施例進行詳細說明。參照圖1,是本發明實施例所述一種手寫識別方法流程圖。步驟11,采集連續輸入的筆跡;步驟12,提取筆跡特征;用戶在同一塊手寫區域中可以重復連續輸入多個字符,所述字符包含中文文字、標點符號、英文字母等形式。采集用戶連續輸入的字符筆跡,所述字符筆跡是指以筆畫形式輸入的信息。采集 手寫輸入的設備有多種,如電磁感應手寫板、壓感式手寫板、觸摸屏、觸控板、超聲波筆等,不同設備在采集時都是利用設備上安裝的感應裝置記錄下用戶書寫的坐標,即筆跡點。通常將落筆的位置記為一個筆畫的起始位置,將抬筆的位置記為一個筆畫的終止位置,落筆位置和抬筆位置之間的一系列筆跡點構成一個輸入筆畫。步驟13,將筆跡特征輸入到最大熵模型中,最大熵模型判斷當前的筆畫是否為切割點;本實施例所述的手寫識別方法中,采集到的是用戶連續輸入的多個字符筆跡,實際應用中可以是采集以疊字連續輸入的字符筆跡的筆跡點;或者采集以行連續輸入的字符筆跡的筆跡點;或者采集以列連續輸入的字符筆跡的筆跡點。在進行判斷是否為切割點之前還需要建立最大熵模型,具體的建立最大熵模型可以包括選擇最大熵模型特征,準備訓練數據,訓練最大熵模型。下面舉個具體的例子詳細說明( I)選擇最大熵模型特征選擇與字符筆畫位置有關的特征作為最大熵模型的特征。在選擇時根據不同的輸入情況選擇不同的筆跡特征,例如在疊字連續輸入的情況下,選擇的筆跡特征可以包括筆畫間的相對位置、筆畫位于書寫區域的位置、筆畫落筆點所在的區域位置、抬筆點所在的區域位置、增加筆畫的大小比例、筆畫高度占書寫區域高度的比例或筆畫寬度占書寫區域寬度的比例等特征中的至少一個等特征作為最大熵模型的特征。所選取的特征包括但不局限于上述羅列的特征,可以根據實際應用的需用而選取所需筆跡特征。在以行連續輸入的情況下,選擇的筆跡特征可以包括當前字符前面空隙的寬度、后面空隙的寬度、當前字符的寬高比等特征中的至少一個特征作為最大熵模型的特征;以列連續輸入的字符筆跡的筆跡特征,即選擇當前字符上面空隙的寬度、下面空隙的寬度和當前字符的寬高比中至少一個特征作為最大熵模型的特征。下面以疊字輸入舉例說明。(2)準備訓練數據在選擇最大熵模型的特征之后,進行訓練數據的準備,需要確定模型中字符筆畫位置的特征。如筆畫間的相對位置、筆畫位于書寫區域的位置等等,即上述模型中的X。然后進行數據準備,準備一些疊字字符筆畫,并根據確定的特征進行標注。考慮一個隨機過程p (y I x),它根據能觀測到的向量x,以一定的概率輸出某個y,y屬于一個有限集合Y。在字符切割的判斷中,Y={1,0},分別表示切割點和非切割點。X代表與字符筆畫位置有關的特征,即待判決的疊字字符筆畫,包括筆畫間的相對位置、筆畫位于書寫區域的位置等等。為了重建隨機過程P (y I x),我們對其輸出進行采樣,得到N個訓練樣例(Xpy1), (x2, y2),……,(xN,yN)。由于這些訓練樣例由此隨機過程產生,所以我們假設某個事件在訓練樣例中的經驗概率,等于該事件在已知P(y|x)時的期望概率。(3)訓練最大熵模型在準備好訓練數據后,利用準備好的訓練數據來訓練最大熵模型。將上一步標注了筆畫間的相對位置、筆畫位于書寫區域位置的字符筆畫位置后的數據送入最大熵模型訓練,數據格式為是否切割,特征1,特征2……某個事件可以用一個表征函數&(1,y)來表示。如果樣例(Xj,Yj)中發生了此事件,則fi(Xi,Yi) =1;否則為O。例如如果X滿足前一個字符書寫完成,且y為切割點,則fi (x, y)=l ;其他情況,則fi(x, y)=0。該事件在訓練樣例中的經驗概率表示為
權利要求
1.一種手寫識別方法,其特征在于,包括 采集連續輸入的筆跡; 提取筆跡特征; 將筆跡特征輸入到最大熵模型中,最大熵模型判斷當前的筆畫是否為切割點; 如果是,則對字符進行切割,得到最終識別結果。
2.根據權利要求I所述的方法,其特征在于,所述最大熵模型判斷當前的筆畫是否為切割點包括 最大熵模型利用筆跡特征給出當前筆畫為切割點的概率; 如果得到的概率大于預設概率則當前筆畫為切割點。
3.根據權利要求2所述的方法,其特征在于,還包括確定預設概率,所述確定預設概率包括 對所述字符筆跡進行切割,得到至少一條切分路徑; 對各切分路徑進行單字識別,針對每一個切分路徑得到候選識別結果及得到該候選識別結果的第一概率值; 利用語言模型對各候選識別結果進行打分,得出針對每個候選識別結果的表示字符間關聯信息的第二概率值; 根據各候選識別結果的第一概率值和第二概率值得到各候選識別結果的綜合概率值; 選擇最大綜合概率值為預設概率。
4.根據權利要求I所述的方法,其特征在于,所述采集連續輸入的筆跡包括采集以疊字連續輸入的字符筆跡或以行或以列連續輸入的字符筆跡。
5.根據權利要求I所述的方法,其特征在于,還包括建立最大熵模型,所述建立最大熵模型包括選擇最大熵模型特征,準備訓練數據,訓練最大熵模型。
6.根據權利要求5所述的方法,其特征在于,所述選擇的最大熵模型特征包括 選擇以疊字連續輸入的字符筆跡的筆跡特征; 即選擇筆畫間的相對位置、筆畫位于書寫區域的位置、筆畫落筆點所在的區域位置、抬筆點所在的區域位置、增加筆畫的大小比例、筆畫高度占書寫區域高度的比例或筆畫寬度占書寫區域寬度的比例中至少一個特征作為最大熵模型的特征。
7.根據權利要求5所述的方法,其特征在于,所述選擇的最大熵模型特征包括 選擇以行連續輸入的字符筆跡的筆跡特征,即選擇當前字符前面空隙的寬度、后面空隙的寬度和當前字符的寬高比中至少一個特征作為最大熵模型的特征; 選擇以列連續輸入的字符筆跡的筆跡特征,即選擇當前字符上面空隙的寬度、下面空隙的寬度和當前字符的寬高比中至少一個特征作為最大熵模型的特征。
8.一種手寫識別系統,其特征在于,包括 采集模塊,用于采集連續輸入的筆跡; 特征提取模塊用于提取筆跡特征; 切割模塊,用于將筆跡特征輸入到最大熵模型中,最大熵模型判斷當前的筆畫是否為切割點; 識別模塊,用于當當前的筆畫為切割點時,對字符進行切割,得到最終識別結果。
9.根據權利要求8所述系統,其特征在于,還包括 確定模塊,用于確定預設概率; 所述確定模塊包括 切割子模塊;用于對所述字符筆跡進行切割,得到至少一條切分路徑; 單字識別子模塊;用于對各切分路徑進行單字識別,針對每一個切分路徑得到候選識別結果及得到該候選識別結果的第一概率值; 語言模型識別子模塊;用于利用語言模型對各候選識別結果進行打分,得出針對每個候選識別結果的表示字符間關聯信息的第二概率值; 綜合判斷子模塊;用于根據各候選識別結果的第一概率值和第二概率值得到各候選識別結果的綜合概率值; 選擇子模塊;用于選擇最大綜合概率值為預設概率。
10.一種手寫識別終端,其特征在于,包括權利要求8-9任一所述的手寫識別系統。
全文摘要
本發明提供一種手寫識別方法、系統及字符識別終端,以解決現有的字符識別結果經常出現錯誤,導致識別率下降,進而影響多字輸入的手寫體驗的問題。本發明公開的一種手寫識別方法,包括采集連續輸入的筆跡;提取筆跡特征;將筆跡特征輸入到最大熵模型中,最大熵模型判斷當前的筆畫是否為切割點;如果是,則對字符進行切割,得到最終識別結果。本發明給出的基于最大熵的字符切割方法,是基于統計的預測模型,可以對字符筆畫與筆畫之間的關系進行更加準確的判斷,從而確認是否為切割點,并給出判斷為切割點的概率,更加綜合且全面的判斷字符間的切割,提高識別結果的準確性。
文檔編號G06K9/46GK102750552SQ20121020591
公開日2012年10月24日 申請日期2012年6月18日 優先權日2012年6月18日
發明者張連毅, 李健, 武衛東, 鄭曉明 申請人:北京捷通華聲語音技術有限公司