專利名稱:一種數字碼漢字輸入法及其鍵盤的制作方法
技術領域:
本發明涉及一種數字碼漢字輸入法及鍵盤,屬于計算機中文信息處理技術領域。
背景技術:
隨著手機、電子字典、掌上電腦、信息家電等設備漢字輸入的需要,“漢字編碼數字化”已成為中文信息處理領域急待解決的課題。
在申請號為200410032050.4(公開號為CN 1538278A)、發明名稱為《一種數碼漢字輸入法及其鍵盤》的中國發明專利中,本申請人提出了一種漢字數字碼編碼技術。該技術方案成功地解決了數字鍵盤漢字輸入“慢而煩”的難題,實現了“只用數字鍵,單手快速打漢字”的美好愿望。
考慮到數字碼漢字輸入法是面向大眾的漢字輸入法,人們對方案的“易學性”有特別高的要求。因此,本發明在申請號為200410032050.4發明專利的基礎上,對一些鍵位上的筆形及部件作了較大刪減,使之更符合手機、信息家電等含數字小鍵盤的設備對漢字輸入法易學性的要求。
發明內容
本發明的目的是針對申請號為200410032050.4的發明專利的技術改進,從而提供一種更加易學、規范的數字碼漢字輸入法及其鍵盤。
本發明的技術方案是該數字碼漢字輸入法的鍵盤包括有0~9共10個數字鍵,其特征在于各鍵所對應的漢字筆形為“1”“橫”類,對應“一 ”;“2”“豎”類,對應“丨亅”;“3”“撇”類,對應“丿”;“4”“捺”類,對應“丶”;“5”“折”類,對應“乙”;“6”“叉”類,對應“十ナ乂”;“7”“穿”類,對應“艸 卄廾卅”、“ 豐 ”;“8”“八”類,對應“八冫丷 ”、“人亻”;
“9”“小”類,對應“小”; “0”“方”類,對應“口”;并且,單個漢字的取碼規則為(1)獨體字按“前4末1”規則取碼,即按筆順取前4個筆形和最后1個筆形的代碼,單字不足五碼按實際碼長取碼;(2)合體字即可按上下、左右或內外分成首、尾兩部分的漢字,分為兩類一類是首部只能取到一個編碼的合體字、對稱結構的合體字、包圍結構但“包圍部分為非連續筆畫或包圍部分后寫”的合體字,仍按前述的“前4末1”規則取碼;另一類是首部能取到兩個及兩個以上編碼的合體字,按“首2尾3”規則取碼,即首部按筆順取前2個筆形的代碼,尾部按筆順取前2個和最后1個筆形的代碼,尾部不足三碼按實際碼長取碼。
為提高編碼效率,在所述的0~9十個數字鍵上還可安排一些組字頻度高的漢字部件,具體是“1”對應部件“扌”;“2”對應部件“日”;“3”對應部件“月”;“4”對應部件“亠”;“5”對應部件“纟”;“6”對應部件“木”;“9”對應部件“氵、灬、辶、廴”。
且所選的漢字部件,根據字符集的不同,允許作適當增減及鍵位變動。
為合理利用編碼空間,對于尾部只能取到一個編碼的合體字,也可仍按前述的“前4末1”規則取碼。
漢字詞組的取碼規則為二字詞取每字編碼的前三碼,共六碼,若某字不足三碼,以該字末碼補齊;三字詞取每字編碼的前二碼,共六碼,若某字不足二碼,以該字末碼補齊;多字詞取前三字的第一碼和最后一字的前三碼,共六碼,若最后一字不足三碼,以該字末碼補齊。
對于單字、詞組編碼并存的漢字輸入系統,由于兩者碼長不等,因此在輸入單字時,可將數字鍵盤上的某一“非數字鍵”作為單個漢字編碼的輸碼結束鍵。
與申請號為200410032050.4的專利技術相比,本發明更加簡單易學,可廣泛適用于手機、電子字典、掌上電腦、信息家電等各種具有數字輸入設備的產品。
圖1為本發明實施例的筆形—鍵位分布圖。
具體實施例方式
以下結合附圖實施例對本發明作進一步詳細描述。
(一)筆形、部件及代碼本發明將構成漢字的基本筆形分為5種單筆形和5種復筆形。
5種單筆形的劃分采用國家統一標準,即分為“橫(含提)、豎(含豎鉤)、撇、捺(含點)、折”,不再詳述。
5種復筆形為“叉”——連續寫成不含“折筆”的兩筆畫相交,具體為“十ナ乂”;“穿”——可分為“橫穿”、“縱穿”兩種,其中“橫穿”是指一橫橫穿隨后寫成的若干連續筆畫,具體為“艸 卄廾卅”;“縱穿”是指若干連續橫畫被后寫的一筆畫縱穿,具體為“ 豐 ”;“八”——“八、人”及其變形。具體為“八冫丷 ”、“人亻”;“小”——“小”及其變形。具體為“小 ”;“方”——四角齊整的方形。具體為“口”。
10種筆形的代碼助記詞為1 2 3 4 5,橫豎撇捺折;6 7 8 9 0,叉穿八小方。
為提高編碼效率,本發明還優選了10個高頻部件,按照易記、便于聯想的原則安排在數字鍵上,具體如下(1)扌 因其首筆為“一”,故定義在數字鍵“1”上。
(2)日 因其首筆為“丨”,故定義在數字鍵“2”上。
(3)月 因其首筆為“丿”,故定義在數字鍵“3”上。
(4)亠 因其首筆為“丶”,故定義在數字鍵“4”上。
(5)纟 因其首筆為“乙”,故定義在數字鍵“5”上。
(6)木 因首筆形為“十”,故定義在數字鍵“6”上。
(7)氵灬辶廴 因部件中有多個點,故定義在最大的數字鍵“9”上。
以上十個部件是根據規范、易記、高效等原則優選得到,在具體實施本發明時,根據字符集的不同,允許作適當增減及鍵位變動。
(二)單字取碼規則(1)獨體字——按“前4末1”規則取碼,即按筆順取前4個筆形(部件)和最后1個筆形(部件)的代碼,單字不足五碼按實際碼長取碼。如土61 片3215 冊35351 凹25251(2)合體字合體字,先從結構上將其分成兩部分,具體是“左右”結構的合體字分成左、右兩部分;“左中右”結構的合體字分成左、中右兩部分;“上下”結構的合體字分成上、下兩部分;“上中下”結構的合體字分成上、中下兩部分;包圍結構的合體字分為包圍、被包圍兩部分(或稱內、外兩部分)。
為便于敘述,將合體字先寫的部分稱為“首部”,后寫的部分稱為“尾部”。
合體字一分為二后,分別按“前4末1”、“首2尾3”兩種規則取碼,具體是①首部只能取到一個編碼的合體字、對稱結構的合體字、包圍結構但“包圍部分為非連續筆畫或包圍部分后寫”的合體字,仍按前述的“前4末1”規則取碼,如嘲06263 巫12881 坐8861 區165 裁61434②首部能取到兩個及兩個以上編碼的合體字,按“首2尾3”規則取碼,即首部按筆順取前2個筆形(部件)的代碼,尾部按筆順取前2個和最后1個筆形(部件)的代碼,尾部不足三碼按實際碼長取碼。如露14020 斑16461 虛21221 鄭8152為合理利用編碼空間,對于尾部只能取到一個編碼的合體字,仍可按前述的“前4末1”規則取碼,如華8356 朝6263 禮45245(三)詞組的取碼規則二字詞取每字編碼的前三碼,共六碼,若某字不足三碼,則以該字末碼補齊;如作業882228 一定111441三字詞取每字編碼的前二碼,共六碼,若某字不足二碼,則以該字末碼補齊;如計算機458463多字詞取前三字的第一碼和最后一字的前三碼,共六碼,若最后一字不足三碼,則以該字末碼補齊。
如改革開放571458由于單字和詞組的碼長不等,因此當漢字輸入系統有詞組編碼存在時,在輸完單字編碼后,可以鍵入數字鍵盤上的某一“非數字鍵”作為輸碼結束鍵。
權利要求
1.一種數字碼漢字輸入法及其鍵盤,該鍵盤包括有0~9共10個數字鍵,其特征在于各鍵所對應的漢字筆形為“1”“橫”類,對應“一 ”;“2”“豎”類,對應“丨亅”;“3”“撇”類,對應“丿”;“4”“捺”類,對應“丶”;“5”“折”類,對應“乙”;“6”“叉”類,對應“十ナ乂”;“7”“穿”類,對應“艸 卄廾卅”、“ 豐 ”;“8”“八”類,對應“八冫丷 ”、“人亻”;“9”“小”類,對應“小 ”;“0”“方”類,對應“口”;并且,單個漢字的取碼規則為(1)獨體字按“前4末1”規則取碼,即按筆順取前4個筆形和最后1個筆形的代碼,單字不足五碼按實際碼長取碼;(2)合體字即可按上下、左右或內外分成首、尾兩部分的漢字,分為兩類一類是首部只能取到一個編碼的合體字、對稱結構的合體字、包圍結構但“包圍部分為非連續筆畫或包圍部分后寫”的合體字,按前述的“前4末1”規則取碼;另一類是首部能取到兩個及兩個以上編碼的合體字,按“首2尾3”規則取碼,即首部按筆順取前2個筆形的代碼,尾部按筆順取前2個和最后1個筆形的代碼,尾部不足三碼按實際碼長取碼。
2.根據權利要求1所述的數字碼漢字輸入法及其鍵盤,其特征在于,0~9十個數字鍵上還安排有一些組字頻度高的漢字部件,具體是“1”對應部件“扌”;“2”對應部件“日”;“3”對應部件“月”;“4”對應部件“亠”;“5”對應部件“纟”;“6”對應部件“木”;“9”對應部件“氵、灬、辶、廴”。
3.根據權利要求1或2所述的數字碼漢字輸入法及其鍵盤,其特征在于,數字鍵上的漢字筆形或部件可以根據字符集的不同,允許作適當的增減及鍵位變動。
4.根據權利要求1所述的數字碼漢字輸入法及其鍵盤,其特征在于,對于尾部只能取到一個編碼的合體字按所述的“前4末1”規則取碼。
5.根據權利要求1、2、3、4所述的數字碼漢字輸入法及其鍵盤,其特征在于,漢字詞組的編碼規則為二字詞取每字編碼的前三碼,共六碼,若某字不足三碼,以該字末碼補齊;三字詞取每字編碼的前二碼,共六碼,若某字不足二碼,以該字末碼補齊;多字詞取前三字的第一碼和最后一字的前三碼,共六碼,若最后一字不足三碼,以該字末碼補齊。
6.根據權利要求5所述的數字碼漢字輸入法及其鍵盤,其特征在于,對于單字、詞組編碼并存的漢字輸入系統,可將數字鍵盤上的某一“非數字鍵”作為單個漢字編碼的輸碼結束鍵。
全文摘要
一種數字碼漢字輸入法及其鍵盤,該鍵盤包括有0~9共10個數字鍵,其特征在于各數字鍵所對應的漢字筆形為“1”對應“橫”類;“2”對應“豎”類;“3”對應“撇”類;“4”對應“捺”類;“5”對應“折”類;“6”對應“叉”類;“7”對應“穿”類;“8”對應“八”類;“9”對應“小”類;“0”對應“方”類;獨體字按“前4末1”規則取碼,合體字分別按“前4末1”、“首2尾3”兩種規則取碼。所述的0~9十個數字鍵上還可以安排“扌、日、月、亠、纟、木、氵、灬、辶、廴”等組字頻度高的漢字部件。本發明簡單易學,可適用于手機、掌上電腦、信息家電等各種具有數字輸入設備的產品。
文檔編號G06F3/023GK1632729SQ20041001052
公開日2005年6月29日 申請日期2004年12月25日 優先權日2004年12月25日
發明者羅康寧 申請人:羅康寧