專利名稱:一種字符切分方法
技術領域:
本發明涉及一種字符切分方法,尤其涉及一種計算機文字識別過 程中對輸入字符的切分方法,屬于計算機模式識別技術領域。
背景技術:
手寫板、帶手寫功能的鼠標及平板電腦的出現,提高了普通計算 機的智能化程度。在利用這些手寫輸入設備進行計算機文字輸入時,
通常有以下3種字符切分方法,其表現形式是-
1、 雙框書寫一利用位置改變進行字符切分
通常情況下,人為規定2個特定的輸入區域,用方框顯示,使用 者依次在方框內輸入字符,當從第一個方框區域輸入完成后轉移到第 二個方框區域輸入時,計算機程序根據輸入區域的位置改變從而完成 字符切分,啟動識別程序進行字符識別。
2、 全屏幕單字書寫一利用輸入產生的延時進行字符切分 使用者可以在輸入區域內任意位置進行書寫,當書寫結束時,使
用者需要暫停書寫,并保持一段時間間隔,此時,計算機程序根據延 時的產生從而完成字符切分,啟動識別程序進行字符識別。
3、 全屏幕多字書寫一利用輸入產生的延時進行字符行切分,利 用字符各筆劃間的相對位置、距離進行各字符切分
使用者可以在輸入區域內任意位置進行書寫,按照從上到下或者
從左到右的順序連續輸入多個字符,當書寫結束時,使用者需要暫停 書寫,并保持一段時間間隔,此時,計算機程序根據輸入產生的延時 進行該串字符的行切分,再根據該行各字符的每個筆劃間的位置、距 離等要素,將該行字符切分為多個單字符,然后啟動識別程序再對每 個單字符進行識別。
以上這些字符切分方法都存在不同的缺陷如雙框書寫方式限制 了使用者書寫的位置;全屏幕單字書寫方式致使輸入速度變慢,而全 屏幕多字書寫方式雖然加快了輸入速度,但是字符切分準確率低;而
后兩種輸入方式都會因輸入延時控制不好,造成未完成輸入即進行識 別,使識別正確率大大降低,給手寫輸入帶來不便。
發明內容
本發明所要解決的技術問題是提供一種利用輸入字符產生的高 度信息,判斷字符輸入的完整性,從而正確進行字符切分的方法。
本發明所采用的技術方案包括以下步驟 步驟l:坐標指示器輸入字符;
步驟2:坐標檢測器實時采集坐標指示器的三維運動軌跡數據; 步驟3:計算機存儲器存儲軌跡數據; 步驟4:測量軌跡數據的高度信息;
步驟5:比較高度信息與計算機預先設定的高度門限數據,當高 度信息大于預先設定的高度門限數據時,設置字符結束標志。
本發明的有益之處在于克服現有字符切分的缺點,精確字符切 分的準確度,減少輸入帶給使用者的操作限制。
圖1坐標指示器在坐標檢測器輸入字符的運動軌跡示意圖。
1-坐標檢測器2-坐標指示器3-坐標指示器輸入字符的運動軌
跡
圖2本發明提出的字符切分方法的技術原理框圖。 圖3應用本發明提出的字符切分方法的系統組成結構示意圖。 圖4本發明提出的字符切分方法應用在單個字符輸入情況的工 作流程圖。
圖5本發明提出的字符切分方法應用在多字符輸入情況的工作 流程圖。
圖6未經本發明提出的字符切分方法處理的手寫軌跡數據保存 格式。
筆劃n的軌跡信息指筆劃在第n劃與第n+l劃之間的軌跡信息 筆劃n的抬筆高度信息指筆劃在第n劃與第n+l劃之間的抬筆高 度信息
圖7經本發明提出的字符切分方法處理后的手寫軌跡數據保存 格式。
筆劃n的軌跡信息指筆劃在第n劃與第ri十1劃之間的軌跡信息 筆劃n的抬筆高度信息指筆劃在第n劃與第n+l劃之間的抬筆高 度信息
具體實施例方式
圖1顯示了坐標指示器2在坐標檢測器1輸入字符的三維運動軌
跡3,其中坐標指示器2用于字符的輸入,并發射其三維運動軌跡數 據,坐標檢測器l接收該軌跡數據信號。
圖2是本發明方法的技術原理框圖,包含以下步驟步驟(1) 坐標指示器輸入字符;步驟(2)坐標檢測器實時采集坐標指示器三 維運動軌跡數據;步驟(3)計算機存儲器存儲軌跡數據;步驟(4) 測量軌跡數據的高度信;步驟(5)比較高度信息與計算機預先設定 的高度門限數據,當高度信息大于預先設定的高度門限數據時,設置 字符結束標志。
圖3為應用本發明方法的典型應用系統的組成結構圖,包括坐 標指示器、坐標檢測器、高度門限比對模塊和計算機存儲器,此外, 還可以包含字符識別模塊和輸出模塊。坐標指示器將三維運動軌跡信 息傳遞給坐標檢測器,坐標檢測器將軌跡數據存儲在計算機存儲器 中,同時高度門限比對模塊測量軌跡數據的高度信息,并對比預先設 定的高度門限數據與測量的高度信息,當高度信息大于高度門限數據 時設置字符結束標志,將字符切分處理后的數據存儲在存儲器中,然 后字符識別模塊識別存儲器中處理后的數據,最后輸出識別結果。
一般字符的輸入主要有兩種方式, 一種是以單個字符方式逐一輸 入, 一種是以行即多個字符連續輸入的方式批量輸入。
下面以手寫筆作為坐標指示器,手寫板作為坐標檢測器為例,應 用本發明方法對輸入的單個字符進行切分的工作流程如圖4所示首 先,手寫筆輸入字符,手寫板實時采集由手寫筆發射的在字符筆劃輸 入時產生的三維運動軌跡數據,存儲器存儲這些軌跡數據,高度門限
比對模塊測量得出軌跡數據的抬筆高度信息,再與預先設定的筆劃高 度門限數據進行比較,當抬筆高度信息大于筆劃高度門限數據時設置 單字字符結束標志,啟動字符識別模塊,輸出識別結果。
當連續書寫一行字符時,應用本發明方法對整行字符進行切分的 工作流程如圖5所示手寫筆連續輸入一行字符,手寫板實時采集手 寫筆發射的三維運動軌跡數據,存儲器存儲軌跡數據,高度門限比對 模塊測量得出軌跡數據的抬筆高度信息,首先用測量得到的抬筆高度 信息與預先設定的行高度門限數據進行比較,當抬筆高度信息大于行 高度門限數據時,計算機判定該行字符輸入完整,并設置行字符結束 標志,然后,高度門限比對模塊再將這行的抬筆高度信息與預先設定 的筆劃高度門限數據進行比較,當抬筆高度信息大于筆劃高度門限數 據時,計算機設置單字字符結束標志,然后根據行字符結束標志判斷 整行是否全部比較完畢,如果沒有比較完畢,則重復抬筆高度信息與 筆劃高度門限數據的比較過程,當該行字符抬筆高度信息全部比較完 畢后,計算機啟動字符識別模塊,輸出識別結果。
圖6為未經本發明方法處理的手寫軌跡數據的保存格式,手寫筆 三維運動軌跡數據,以及測量得出的抬筆高度信息都是按照筆劃的先 后順序排列,沒有字符結束標志。
圖7是經過本發明方法處理的手寫軌跡數據的保存格式,在字符 的行與行之間和每個單字字符之間分別設置了行結束標志與單字字 符結束標志。
本發明的坐標指示器包括可用于手寫的計算機輸入設備,如手寫
筆、鼠標等等,坐標檢測器是指接收輸入信號的裝置,如手寫板、平 板電腦、觸摸屏等等。
本發明方法可廣泛應用于手寫字符輸入系統,提高字符切分的準 確度,使識別正確率大大提高,簡化了用戶使用輸入設備的操作方式。
權利要求
1、一種字符切分方法,所述方法包括如下步驟(1)坐標指示器輸入字符;(2)坐標檢測器實時采集坐標指示器的三維運動軌跡數據;(3)計算機存儲器存儲軌跡數據;(4)測量軌跡數據的高度信息;(5)比較高度信息與計算機預先設定的高度門限數據,當高度信息大于預先設定的高度門限數據時,設置字符結束標志。
2、 根據權利要求1所述的一種字符切分方法,其特征在于高 度門限比對模塊測量軌跡數據的高度信息,并比較測量的高度信息與 預先設定的高度門限數據。
3、 根據權利要求2所述的一種字符切分方法,其特征在于預 先設定的高度門限數據包括筆劃高度門限數據和行高度門限數據。
4、 根據權利要求3所述的一種字符切分方法,其特征在于單 字符切分的工作流程是坐標指示器輸入字符,坐標檢測器實時采集 由坐標指示器發射的三維運動軌跡數據,計算機存儲器存儲軌跡數 據,高度門限比對模塊測量得出軌跡數據的高度信息,再與預先設定 的筆劃高度門限數據進行比較,高度信息大于筆劃高度門限數據時, 計算機設置單字字符結束標志。
5、 根據權利要求3所述的一種字符切分方法,其特征在于多 個字符切分的工作流程是坐標指示器連續輸入一行字符,坐標檢測 器實時采集坐標指示器發射的三維運動軌跡數據,計算機存儲器存儲軌跡數據,髙度門限比對模塊測量得出軌跡數據的高度信息,高度信 息與預先設定的行高度門限數據進行比較,高度信息大于行高度門限 數據時,設置行字符結束標志;高度門限比對模塊再將這行的高度信 息與預先設定的筆劃高度門限數據進行比較,高度信息大于筆劃高度 門限數據時,設置單字字符結束標志;根據行字符結束標志判斷該行 高度信息是否全部比較完畢,如果沒有比較完畢,則重復高度信息與 筆劃高度門限數據的比較過程,直至該行高度信息全部比較完畢。
全文摘要
一種字符切分方法,屬于計算機模式識別技術領域。本發明的技術要點是坐標檢測器采集坐標指示器在輸入字符時產生的三維運動軌跡數據,并將軌跡數據信息保存在計算機存儲器中,通過測量軌跡數據中的高度信息,與計算機預先設定的高度門限數據進行比較,當高度信息大于門限數據時,計算機即可判斷字符輸入完整,設置字符結束標志。本發明的有益之處在于克服現有字符切分方式的缺陷,精確字符切分的準確度,可廣泛應用于手寫輸入系統,提高手寫識別的正確率。
文檔編號G06F3/041GK101178629SQ20061011433
公開日2008年5月14日 申請日期2006年11月7日 優先權日2006年11月7日
發明者劉迎建, 梁 馬 申請人:漢王科技股份有限公司