專利名稱:簡易五筆漢字編碼方法及其鍵盤的制作方法
技術領域:
本發明涉及中文信息處理和漢字編碼技術領域。
漢字的計算機輸入編碼方案,迄今已有幾百種之多。這幾百種編碼方案,大致可分為音碼、形碼和音形碼三類。由選取的部首和筆劃的不同,形成了各種各樣的漢字拆分形碼和音形碼編碼方案。眾多的形碼和音形碼編碼方案,按漢字編碼碼長區分,可分為四碼編碼方案和三碼編碼方案兩類。
四碼編碼方案中,漢字和詞匯都以同樣的四碼編碼。初看起來,四碼編碼容量大,漢字重碼率低。但由于中文輸入包括漢字輸入和詞匯輸入,當詞匯容量增大時,漢字和詞匯的重碼率急劇上升。在一些四碼編碼方案中,為保持較低的漢字和詞匯的重碼率,不得不限制詞匯容量。
三碼編碼方案中,基本上采用漢字以三碼編碼,詞匯以四碼編碼方式。以這種編碼方式,漢字編碼空間和詞匯編碼空間相互獨立,詞匯的容量并不影響漢字的重碼率。但由于漢字僅以三碼編碼,其編碼容量較小。以26個英文字母鍵為編碼鍵位,采用三碼編碼,其編碼容量為17576個編碼。僅為GB2312-80中6763個漢字的2.6倍。以這樣小的編碼空間比,不論怎樣選取編碼碼元,勢必導致較高的漢字重碼率。另一方面,雖然漢字以三碼編碼,為要與詞匯輸入一致,在輸入一個漢字時,需要輸入一個空格鍵。因此,輸入一個漢字,仍然需要輸入四個鍵。
大多數形碼和音形碼編碼方案,為降低漢字重碼率,采用了較多的編碼碼元,如近百個或上百個字根。太多的編碼碼元,映射排列到編碼鍵盤上,必然顯得繁雜,難以做到有規律可尋,給該編碼方法的學習和使用造成了很大的困難。
因此,在保持適度的漢字低重碼率的基礎上,減少編碼碼元,兼顧易學易用和高輸入效率,是一個好的漢字編碼方案要達到的目標。這也是本發明提出的簡易五筆漢字編碼方法所要達到的目標。
本發明是這樣實現的創造性地提出常規編碼碼元和特殊編碼碼元編碼原理,根據此原理,字詞編碼兼容統一,而漢字和詞匯又能分別具有各自獨立的編碼空間。因此,一方面降低了詞匯的重碼率,另一方面,當詞匯容量增大時,并不影響漢字的重碼率。在常規編碼碼元中,提出了派生類編碼碼元。在特殊編碼碼元中,提出了單筆劃類和排列序號類編碼碼元。采用很少的30多個基本常規編碼碼元和一些特殊編碼碼元,對漢字和詞匯依形編碼,或增加字音類常規編碼碼元,對漢字和詞匯依音形編碼。編碼碼元在鍵盤上布置合理,規律性強。
此編碼方法的特征是規定了常規編碼碼元和特殊編碼碼元,設計了相應的編碼鍵盤,提出了基于常規編碼碼元和特殊編碼碼元的編碼原理,根據全部或部分是否選用特殊編碼碼元、派生類碼元和序號類碼元,可形成多種編碼方案及其相應的編碼鍵盤。定義26個英文字母鍵為常規編碼鍵位,并且定義一些符號鍵為特殊編碼鍵位,分別映射常規編碼碼元和特殊編碼碼元,根據全部或部分是否選用特殊編碼碼元、派生類碼元和序號類碼元,選用相應的編碼鍵位,映射選用的編碼碼元,可形成多種編碼方案及其相應的編碼鍵盤。
基于此編碼方法,根據全部或部分是否選用特殊編碼碼元、派生類碼元和序號類碼元,可形成多種編碼方案及其相應的編碼鍵盤(1)或者是依形編碼方案A,在由部首類和筆劃組合類編碼碼元組成的常規編碼碼元中,規定了派生類編碼碼元,以及規定了單筆劃類和排列序號類特殊編碼碼元,基于四類編碼碼元,即部首類碼元、筆劃類碼元、派生類碼元和序號類碼元,和相應的編碼鍵盤的漢字編碼規則,對漢字和詞匯依形編碼,(2)或者是依形編碼方案B,在由部首類和筆劃組合類編碼碼元組成的常規編碼碼元中,規定了派生類編碼碼元,以及規定了單筆劃類特殊編碼碼元,基于三類編碼碼元,即部首類碼元、筆劃類碼元和派生類碼元,和相應的編碼鍵盤的漢字編碼規則,對漢字和詞匯依形編碼,(3)或者是依形編碼方案C,規定了單筆劃類特殊編碼碼元,基于兩類編碼碼元,即部首類碼元和筆劃類碼元,和相應的編碼鍵盤的漢字編碼規則,對漢字和詞匯依形編碼,(4)或者是依形編碼方案D,基于兩類常規編碼碼元,即部首類碼元和筆劃類碼元,和相應的編碼鍵盤的漢字編碼規則,對漢字和詞匯依形編碼,(5)或者是依音形編碼方案A,在由部首類和筆劃組合類編碼碼元組成的常規編碼碼元中,規定了派生類編碼碼元,以及規定了單筆劃類和排列序號類特殊編碼碼元,基于五類編碼碼元,即字音類碼元、部首類碼元、筆劃類碼元、派生類碼元和序號類碼元,和相應的編碼鍵盤的漢字編碼規則,對漢字和詞匯依音形編碼,(6)或者是依音形編碼方案B,在由部首類和筆劃組合類編碼碼元組成的常規編碼碼元中,規定了派生類編碼碼元,以及規定了單筆劃類特殊編碼碼元,基于四類編碼碼元,即字音類碼元、部首類碼元、筆劃類碼元、和派生類碼元,和相應的編碼鍵盤的漢字編碼規則,對漢字和詞匯依音形編碼,(7)或者是依音形編碼方案C,規定了單筆劃類特殊編碼碼元,基于三類編碼碼元,即字音類碼元、部首類碼元、和筆劃類碼元,和相應的編碼鍵盤的漢字編碼規則,對漢字和詞匯依音形編碼,(8)或者是依音形編碼方案D,基于三類常規編碼碼元,即字音類碼元、部首類碼元、和筆劃類碼元,和相應的編碼鍵盤的漢字編碼規則,對漢字和詞匯依音形編碼。
基于此編碼方法,可以形成對漢字和詞匯以數字編碼,采用編碼數字鍵盤輸入漢字和詞匯的方法,即一種數字Chinese Keyed Entry簡稱數字“CKE”編碼方法。
此數字“CKE”編碼方法的特征是規定了常規編碼碼元和特殊編碼碼元,設計了相應的編碼數字鍵盤,提出了基于常規編碼碼元和特殊編碼碼元的編碼原理,根據全部或部分是否選用特殊編碼碼元、派生類碼元和序號類碼元,可形成多種編碼方案及其相應的編碼數字鍵盤。
此數字“CKE”編碼方法定義1到6或1到9的數字鍵的兩鍵組合中的一部分為常規編碼組合鍵位,一部分不用或可選為特殊編碼組合鍵位,定義1到9的數字鍵單鍵為特殊編碼單鍵位,分別映射常規編碼碼元和特殊編碼碼元,根據全部或部分是否選用特殊編碼碼元、派生類碼元和序號類碼元,選用相應的編碼數字鍵位,映射選用的編碼碼元,可形成多種數字編碼方案及其相應的編碼數字鍵盤。
基于此數字“CKE”編碼方法,根據全部或部分是否選用特殊編碼碼元、派生類碼元和序號類碼元,可形成多種數字編碼方案及其相應的編碼數字鍵盤(1)或者是依形數字編碼方案A,在由部首類和筆劃組合類編碼碼元組成的常規編碼碼元中,規定了派生類編碼碼元,以及規定了單筆劃類和排列序號類特殊編碼碼元,基于四類編碼碼元,即部首類碼元、筆劃類碼元、派生類碼元和序號類碼元,和相應的編碼數字鍵盤的漢字編碼規則,對漢字和詞匯依形編碼,(2)或者是依形數字編碼方案B,在由部首類和筆劃組合類編碼碼元組成的常規編碼碼元中,規定了派生類編碼碼元,以及規定了單筆劃類特殊編碼碼元,基于三類編碼碼元,即部首類碼元、筆劃類碼元和派生類碼元,和相應的編碼數字鍵盤的漢字編碼規則,對漢字和詞匯依形編碼,(3)或者是依形數字編碼方案C,規定了單筆劃類特殊編碼碼元,基于兩類編碼碼元,即部首類碼元和筆劃類碼元,和相應的編碼數字鍵盤的漢字編碼規則,對漢字和詞匯依形編碼,(4)或者是依形數字編碼方案D,基于兩類常規編碼碼元,即部首類碼元和筆劃類碼元,和相應的編碼數字鍵盤的漢字編碼規則,對漢字和詞匯依形編碼,(5)或者是依音形數字編碼方案A,在由部首類和筆劃組合類編碼碼元組成的常規編碼碼元中,規定了派生類編碼碼元,以及規定了單筆劃類和排列序號類特殊編碼碼元,基于五類編碼碼元,即字音類碼元、部首類碼元、筆劃類碼元、派生類碼元和序號類碼元,和相應的編碼數字鍵盤的漢字編碼規則,對漢字和詞匯依音形編碼,(6)或者是依音形數字編碼方案B,在由部首類和筆劃組合類編碼碼元組成的常規編碼碼元中,規定了派生類編碼碼元,以及規定了單筆劃類特殊編碼碼元,基于四類編碼碼元,即字音類碼元、部首類碼元、筆劃類碼元、和派生類碼元,和相應的編碼數字鍵盤的漢字編碼規則,對漢字和詞匯依音形編碼,
(7)或者是依音形數字編碼方案C,規定了單筆劃類特殊編碼碼元,基于三類編碼碼元,即字音類碼元、部首類碼元、和筆劃類碼元,和相應的編碼數字鍵盤的漢字編碼規則,對漢字和詞匯依音形編碼,(8)或者是依音形數字編碼方案D,基于三類常規編碼碼元,即字音類碼元、部首類碼元、和筆劃類碼元,和相應的編碼數字鍵盤的漢字編碼規則,對漢字和詞匯依音形編碼。
在本發明提出的簡易五筆漢字編碼方法的各種依形編碼方案和依音形編碼方案中,字詞最大編碼碼長可以選擇為四碼。為了減少大詞匯量的重碼率或用于GBK大字符集漢字輸入,字詞最大編碼碼長也可以選擇為五碼。可以選擇(1)或者是字詞4-4碼編碼方式,即漢字和詞匯的最大編碼碼長均為四碼。
(2)或者是字詞4-5碼編碼方式,即漢字和詞匯的最大編碼碼長各為四碼和五碼。
(3)或者是字詞5-5碼編碼方式,即漢字和詞匯的最大編碼碼長均為五碼。
在本發明提出的簡易五筆漢字數字“CKE”編碼方法的各種依形數字編碼方案和依音形數字編碼方案中,對應上述字詞4-4碼編碼方式,漢字和詞匯的最大數字編碼位數均為八位,對應上述字詞4-5碼編碼方式,漢字和詞匯的最大數字編碼位數各為八位和十位,對應上述字詞5-5碼編碼方式,漢字和詞匯的最大數字編碼位數均為十位。在上述字詞統一編碼方式中,漢字的數字編碼的最后位為結束碼0,對應數字鍵0。若僅輸入漢字,對應上述漢字4碼編碼方式,漢字的最大數字編碼位數為七位,對應上述漢字5碼編碼方式,漢字的最大數字編碼位數為九位。若漢字的數字編碼位數小于最大數字編碼位數,則補一個結束碼0。
較之其它各種漢字編碼方案,簡易五筆漢字編碼方法具有如下幾個重要的特點和優點1.基本編碼碼元少。僅有9個部首類碼元、1個三筆劃類碼元、25個兩筆劃類碼元和5個單筆劃類碼元,即,在依形編碼時,最多僅有40個基本編碼碼元。在依音形編碼時,僅增加23個或26個字音類碼元。
2.派生類碼元基于基本常規編碼碼元,在編碼和鍵位上與基本常規編碼碼元一致,易于掌握和熟悉。
3.規定了單筆劃類和排列序號類特殊編碼碼元。一方面,較之一般的三碼編碼方法,大大地擴展了漢字編碼容量,增強了漢字間的區分能力。其編碼容量大致估計,大約為26*31*31*7=174920個編碼,約為三碼編碼方法的編碼容量的10倍。另一方面,較之一般的四碼編碼方法,雖然漢字編碼容量要小一些,但詞匯編碼容量等于四碼編碼方法的編碼容量。因此,漢字編碼和詞匯編碼總容量比一般的四碼編碼方法的編碼容量要大很多。并且,由于通過此兩類特殊編碼碼元,將漢字編碼空間和詞匯編碼空間隔離開來,使漢字的重碼率和詞匯的重碼率互不影響。因此,不論詞匯容量怎樣擴大,始終不會影響漢字的重碼率。這樣,一方面能夠保持漢字的低重碼率,另一方面又能降低詞匯的重碼率。迄今所有其它各種漢字四碼編碼方法,都未能解決這個問題。對這些漢字四碼編碼方法來說,漢字和詞匯共用一個編碼空間。當詞匯容量增大時,漢字的重碼率急劇上升,若想保持較低的漢字重碼率,就只能限制詞匯容量。
4.漢字和詞匯均具有較低的重碼率,字詞綜合重碼率低。與目前使用較多的形碼編碼方案“五筆字型”相比,若“五筆字型”不計入詞匯,僅漢字而言,二者漢字重碼數接近。與依形和依音形編碼方案A、B和C相比,“五筆字型”的漢字重碼數要略少一些,而依音形編碼方案D的漢字重碼數,則略少于“五筆字型”。但是,當計入詞匯時,本發明的依形和依音形編碼方案A、B和C的漢字重碼數不論詞匯容量怎樣擴大,始終保持不變,而“五筆字型”的漢字重碼數急劇上升,遠遠大于前者的漢字重碼數。由于本發明的編碼規則定義、編碼碼元選擇和相應鍵盤布置合理,本發明的詞匯重碼數也遠遠小于“五筆字型”的詞匯重碼數,在不同的詞匯容量的情況下,僅為“五筆字型”的百分之五十至百分之七十四。考慮到“五筆字型”采用了一百多個字根,其編碼碼元數遠遠大于本發明的編碼碼元數。顯而易見,本發明提出的簡易五筆漢字編碼方法較之“五筆字型”及其它類似的漢字編碼方法,在各方面都要優越得多。
5.簡易五筆漢字編碼方法既可應用于普通大鍵盤,也可以轉為簡易五筆漢字數字“CKE”編碼方法,應用于編碼數字鍵盤。因此,不但可應用于計算機漢字鍵盤輸入,也可應用于手機等電子終端產品。
由此可見,簡易五筆漢字編碼方法編碼碼元少、重碼率低、詞匯容量大,易學易用、輸入效率高,具有很強的新穎性、創造性和實用性,可廣泛用于各類中文信息處理系統中。
圖1是本發明實施例的簡易五筆編碼碼元鍵盤A;圖2是本發明實施例的簡易五筆編碼碼元鍵盤B;圖3是本發明實施例的簡易五筆編碼碼元鍵盤C;圖4是本發明實施例的簡易五筆編碼碼元鍵盤D。其中,簡易五筆編碼碼元鍵盤C是在簡易五筆編碼碼元鍵盤A上省去了派生類碼元和排列序號類碼元及其對應的特殊編碼鍵位。簡易五筆編碼碼元鍵盤D是在簡易五筆編碼碼元鍵盤A上省去了派生類碼元、排列序號類碼元和單筆劃類碼元及其對應的特殊編碼鍵位。圖5、6、7和8分別是簡易五筆編碼碼元鍵盤A、B、C和D的另一種形式。
圖1所示的簡易五筆編碼碼元鍵盤A可用于依形編碼方案A和依音形編碼方案A,圖2所示的簡易五筆編碼碼元鍵盤B可用于依形編碼方案B和依音形編碼方案B,圖3所示的簡易五筆編碼碼元鍵盤C可用于依形編碼方案C和依音形編碼方案C,圖4所示的簡易五筆編碼碼元鍵盤D可用于依形編碼方案D和依音形編碼方案D。
表1是本發明實施例的簡易五筆數字“CKE”編碼方法雙鍵位組合表A;表2是本發明實施例的簡易五筆數字“CKE”編碼方法雙鍵位組合表B;表3是本發明實施例的簡易五筆數字“CKE”編碼方法雙鍵位組合表C;表4是本發明實施例的簡易五筆數字“CKE”編碼方法雙鍵位組合表D;表5是本發明實施例的簡易五筆數字“CKE”編碼方法雙鍵位組合表A2;表6是本發明實施例的簡易五筆數字“CKE”編碼方法雙鍵位組合表B2;表7是本發明實施例的簡易五筆數字“CKE”編碼方法雙鍵位組合表C2;表8是本發明實施例的簡易五筆數字“CKE”編碼方法雙鍵位組合表D2;表9是本發明實施例的簡易五筆數字“CKE”編碼方法雙鍵位組合表A3。其中,簡易五筆數字“CKE”編碼方法雙鍵位組合表C是在簡易五筆數字“CKE”編碼方法雙鍵位組合表A上省去了派生類碼元和排列序號類碼元及其對應的特殊編碼鍵位。簡易五筆數字“CKE”編碼方法雙鍵位組合表D是在簡易五筆數字“CKE”編碼方法雙鍵位組合表A上省去了派生類碼元、排列序號類碼元和單筆劃類碼元及其對應的特殊編碼鍵位。簡易五筆數字“CKE”編碼方法雙鍵位組合表A2是將在簡易五筆數字“CKE”編碼方法雙鍵位組合表A上的部分部首類碼元拆分在其它擴展雙鍵位上。簡易五筆數字“CKE”編碼方法雙鍵位組合表A3是將在簡易五筆數字“CKE”編碼方法雙鍵位組合表A上的部分部首類碼元和派生類碼元拆分在其它擴展雙鍵位上。簡易五筆數字“CKE”編碼方法雙鍵位組合表B2是將在簡易五筆數字“CKE”編碼方法雙鍵位組合表B上的部分部首類碼元拆分在其它擴展雙鍵位上。簡易五筆數字“CKE”編碼方法雙鍵位組合表C2是將在簡易五筆數字“CKE”編碼方法雙鍵位組合表C上的部分部首類碼元拆分在其它擴展雙鍵位上。簡易五筆數字“CKE”編碼方法雙鍵位組合表D2是將在簡易五筆數字“CKE”編碼方法雙鍵位組合表D上的部分部首類碼元拆分在其它擴展雙鍵位上。
表1、表5和表9所示的簡易五筆數字“CKE”編碼方法雙鍵位組合表A、A2和A3可用于依形數字編碼方案A和依音形數字編碼方案A,表2和表6所示的簡易五筆數字“CKE”編碼方法雙鍵位組合表B和B2可用于依形數字編碼方案B和依音形數字編碼方案B,表3和表7所示的簡易五筆數字“CKE”編碼方法雙鍵位組合表C和C2可用于依形數字編碼方案C和依音形數字編碼方案C,表4和表8所示的簡易五筆數字“CKE”編碼方法雙鍵位組合表D和D2可用于依形數字編碼方案D和依音形數字編碼方案D。
下面結合本發明實施例、附圖和附表對本發明的簡易五筆漢字編碼方法和簡易五筆漢字數字“CKE”編碼方法作進一步的詳細闡述。
一.簡易五筆漢字編碼碼元簡易五筆編碼碼元分為五類。在依形編碼方案中,不用字音類碼元,采用其余四類編碼碼元,其中根據全部或部分是否選用特殊編碼碼元、派生類碼元和序號類碼元,可形成四種依形編碼方案。在依音形編碼方案中,采用字音類碼元在內的五類編碼碼元,其中根據全部或部分是否選用特殊編碼碼元、派生類碼元和序號類碼元,可形成四種依音形編碼方案。
簡易五筆漢字數字“CKE”編碼方法亦采用此五類編碼碼元。在依形數字編碼方案中,不用字音類碼元,采用其余四類編碼碼元,其中根據全部或部分是否選用特殊編碼碼元、派生類碼元和序號類碼元,可形成四種依形數字編碼方案。在依音形數字編碼方案中,采用字音類碼元在內的五類編碼碼元,其中根據全部或部分是否選用特殊編碼碼元、派生類碼元和序號類碼元,可形成四種依音形數字編碼方案。
1.字音類碼元包括漢字的漢語拼音的首字母。字音類碼元為常規編碼碼元和基本編碼碼元。2.部首類碼元(1)“口”(2)“日”,對前四筆為“日”的一些字,如“申”,“電”,“果”和“里”等字,其前四筆也取“日”編碼碼元。
(3)“月”,包括其變形,即第一筆為豎,如“有”字的后四筆。
(4)“土”(5)“卄”(6)“木”(7)“氵”(8)“钅”(9)“口”,包括“國”字框,“田”字框,“目”字框和“罒”字框。
部首類碼元為常規編碼碼元和基本編碼碼元。凡一個部件為部首類碼元,或以部首類碼元開始,則此部件取相應的部首類碼元為編碼碼元。3.筆劃類碼元筆劃按字典標準規范,分為橫,豎,撇,點(捺)和折共五類,分別記為1,2,3,4,5。筆劃類碼元按筆劃數多少分為三類,有(1)單筆劃類此類為特殊編碼碼元和基本編碼碼元,對應特殊編碼鍵位。在此類編碼碼元中,對于默認單筆劃類,將單筆劃橫,豎,撇,點(捺)和折的編碼分別記為1,2,3,4和5;對于序號單筆劃類,將單筆劃橫,豎,撇,點(捺)和折的編碼分別記為7,8,8,9和60。由于只用四個特殊編碼鍵位,因此,“豎”和“撇”共用一個編碼。
(2)兩筆劃類兩筆劃類碼元為常規編碼碼元和基本編碼碼元。取部件的前兩筆,按筆劃橫,豎,撇,點(捺)和折的不同組合,分為25種,其編碼分別記為11,12,13,14,1521,22,23,24,2531,32,33,34,3541,42,43,44,4551,52,53,54,55如兩筆劃“橫橫”對應編碼“11”,兩筆劃“橫豎”對應編碼“12”。(3)三筆劃類三筆劃類碼元為常規編碼碼元和基本編碼碼元。三筆劃類碼元有一種,為三筆劃“橫豎折”,對應筆劃編碼“125”。如漢字“雨”,“西”和“束”等,其前三筆劃形狀相同,位置關系相同,均為“橫豎折”,對應筆劃編碼“125”。4.派生類碼元派生類碼元為常規編碼碼元,用來區分同類基本常規編碼碼元中不同部首和字根。(1)在兩筆劃類編碼碼元中,對同一類兩筆劃編碼,依前兩筆劃或前多筆劃位置關系不同,可劃分出不同的派生碼元。如部件“石”和“尢”,其前兩筆劃均為“橫撇”,屬于“橫撇”類編碼碼元,對應兩筆劃編碼“13”。但各自的兩筆劃位置關系不同,為區別其位置特征,可劃分不同的派生碼元為“石”和“ナ”。又如部件“千”和“禾”,其前兩筆劃均為“撇橫”,屬于“撇橫”類編碼碼元,對應兩筆劃編碼“31”。由于其前三筆劃位置關系相同,為區別與其它“撇橫”類編碼碼元不同的位置特征,可劃分出派生碼元“千”。再如部件“中”和“蟲”,其前兩筆劃均為“豎折”,屬于“豎折”類編碼碼元,對應兩筆劃編碼“25”。由于其前四筆劃位置關系相同,為區別與其它“豎折”類編碼碼元不同的位置特征,可劃分出派生碼元“中”。再如漢字“向”,“白”和“禹”等,其前三筆劃形狀相同,位置關系相同,均為“撇豎折”,對應筆劃編碼“325”,為區別與其它“撇豎”類編碼碼元不同的位置特征,可劃分出派生碼元“325”。
(2)在部首類編碼碼元中,對同一類部首編碼,依部首在部件中位置關系不同,可劃分出不同的派生碼元。如部件“口”和“足”,其部首編碼碼元均為“口”,但在部件“口”中,編碼碼元即為部件的全部,而在部件“足”中,編碼碼元僅為部件的一部分。為區別此特征,可劃分不同的派生碼元為“口”和“足”。
(3)派生類碼元列表“13”-石、ナ、_、其余“15”-扌、車、匚、其余“25”-中、山,貝、其余“31”-_、千、牜、其余“32”-亻、白(325)、其余“33”-彳、其余“35”-犭、魚、饣、其余(第二筆為左鉤者)“35”-匕、兒、幾、其余(第二筆為右鉤者)“42”-忄、門、其余“45”-讠、礻、其余(其中辶為三筆,對應筆劃編碼“454”,縮為“45”)“55”-纟、馬、其余“卄”-卄、革“口”-口、足5.序號類碼元此類為特殊編碼碼元,對應特殊編碼鍵位。
在鍵盤上,取26個英文字母鍵為常規編碼鍵。一個常規編碼鍵可能對應多個常規編碼碼元。這些多個常規編碼碼元排列在同一鍵位上,其排列順序可稱為碼元排列序號。此碼元排列序號可構成一類特殊編碼碼元,即序號類碼元。為簡便起見,規定一個常規編碼鍵最多可對應五個常規編碼碼元。在依音形編碼方案中,字音類碼元不計入排列順序,既不作為默認碼元,也不影響同一鍵位上其它常規編碼碼元的碼元排列序號。
規定第一個常規編碼碼元為默認碼元,從第二個常規編碼碼元起,用多個如四個序號類碼元來區別,依其先后分別將其編碼記為7,8,9和60。非派生類的兩筆劃碼元的碼元排列序號為最后一個,對應該鍵位上的最后一個序號類碼元。如將部首類碼元“土”和兩筆劃類碼元“21”依先后排列在一個英文鍵位上,則部首類碼元“土”為默認碼元,而兩筆劃類碼元“21”的排列序號為2,對應第一個序號類碼元,其編碼為“7”。在依音形編碼方案中,由于字音類碼元不計入排列順序,作為默認碼元的第一個常規編碼碼元,是從除了字音類碼元以外的同一鍵位上其它常規編碼碼元的排列順序開始計算。
在簡易五筆漢字數字“CKE”編碼方法中,將上述常規編碼鍵轉為常規編碼組合鍵,同樣適用上述說明。
二.簡易五筆編碼碼元鍵盤在標準英文鍵盤上,定義26個英文字母鍵為常規編碼鍵位,并且定義十個符號鍵為特殊編碼鍵位,分別映射常規編碼碼元和特殊編碼碼元。特殊編碼鍵位有兩種布置方式,分別相應于圖1所示的簡易五筆編碼碼元鍵盤A和圖2所示的簡易五筆編碼碼元鍵盤B。此兩類編碼碼元在編碼鍵位上的分布為1.常規編碼鍵位“Q”-犭、魚、35(第二筆為左鉤者)“W”-34“E”-月、彳、33“R”-亻、白(325)、32“T”-_、千、31“Y”-41“U”-纟、日、42“I”-43“O”-44“P”-讠、礻、45“A”-扌、車、15
“S”-氵、35(匕、兒、幾和其余第二筆為右鉤者)、14“D”-石、ナ、13“F”-12“G”-11“H”-土、21“J”-卄、22“K”-木、23“L”-雨(125)、24“M”-中、山,25“N”-51“B”-口、52“V”-53“C”-钅、54“X”-纟、55“Z”-口、足在依音形編碼方案中,字音類碼元即漢字的漢語拼音的首字母按常規拼音輸入方式布置在對應的英文字母鍵位上。其中聲母“ch”、“sh”和“zh”可以分別布置在鍵位“c”、“s”和“z”上,也可以選擇分別布置在鍵位“i”、“u”和“v”上。列在鍵位“S”上的派生類碼元35(匕、兒、幾和其余第二筆為右鉤者)可以選擇放在鍵位“Z”上,以簡化編碼碼元鍵盤布置。2.特殊編碼鍵位(相應于簡易五筆編碼碼元鍵盤A,如圖1所示)(1)單筆劃類“,”-編碼1,筆劃“橫”“”-編碼2,筆劃“豎”“[” -編碼3,筆劃“撇”“]” -編碼4,筆劃“點(捺)”“.” -編碼5,筆劃“折”(2)排列序號類“/”-7“-”-8(3)詞匯特殊編碼替代鍵“、”-替代鍵3.特殊編碼鍵位(相應于簡易五筆編碼碼元鍵盤B,如圖2所示)
在這種方式中,相應于默認常規編碼碼元和序號類常規編碼碼元,分別布置單筆劃類和序號單筆劃類編碼碼元。
(1)單筆劃類“,”-編碼1,筆劃“橫”“”-編碼2,筆劃“豎”“[” -編碼3,筆劃“撇”“]” -編碼4,筆劃“點(捺)”“.” -編碼5,筆劃“折”(2)序號單筆劃類“.” -編碼7,筆劃“橫”“-”-編碼8,筆劃“豎”“-”-編碼8,“撇”“=” -編碼9,筆劃“點(捺)”“\”-編碼60,筆劃“折”(3)詞匯特殊編碼替代鍵“、”-替代鍵常規編碼碼元和特殊編碼碼元在編碼鍵位上的分布,也可采取如圖5、圖6、圖7和圖8所示的簡易五筆編碼碼元鍵盤A、B、C和D的另一種形式。
對于簡易五筆漢字數字“CKE”編碼方法,將數字鍵1到9按行和列排成雙鍵位組合表,首鍵按行排列,末鍵按列排列。定義1到6或1到9的數字鍵的兩鍵組合中的一部分為常規編碼組合鍵位,一部分不用或可選為特殊編碼組合鍵位,定義1到9的數字鍵單鍵為特殊編碼單鍵位或特殊編碼鍵位。常規編碼組合鍵位和特殊編碼單鍵位或特殊編碼鍵位分別映射常規編碼碼元和特殊編碼碼元。特殊編碼單鍵位有兩種布置方式,分別相應于表1所示的簡易五筆數字“CKE”編碼方法雙鍵位組合表A和表2所示的簡易五筆數字“CKE”編碼方法雙鍵位組合表B。此兩類編碼碼元在編碼組合鍵位上的分布為1.常規編碼組合鍵位“11”-11,G“12”-12,F“13”-石、ナ、13、D“14”-氵、35(匕、兒、幾和其余第二筆為右鉤者)、14、S“15”-扌、車、15、A“21”-土、21、H“22”-卄、22、J
“23”-木、23、K“24”-雨(125)、24、L“25”-中、山,25、M“31”-_、千、31、T“32”-亻、白(325)、32、R“33”-月、彳、33、E“34”-34、W“35”-犭、魚、35(第二筆為左鉤者)、Q“41”-41、Y“42”-纟、日、42、U“43”-43、I“44”-44、O“45”-讠、礻、45、P“51”-51、N“52”-口、52、B“53”-53、V“54”-钅、54、C“55”-多、55、X“61”-口、足、Z在依音形數字編碼方案中,字音類碼元即漢字的漢語拼音的首字母按常規拼音輸入方式對應英文字母。其中聲母“ch”、“sh”和“zh”可以分別對應英文字母“c”、“s”和“z”,也可以選擇分別對應英文字母“i”、“u”和“v”。列在組合鍵位“14”上的派生類碼元35(匕、兒、幾和其余第二筆為右鉤者)可以選擇放在組合鍵位“35”上,以簡化編碼碼元數字鍵盤布置。各雙鍵位組合表中,為清楚起見,采用大寫英文字母。
相應于簡易五筆數字“CKE”編碼方法雙鍵位組合表A2、B2、C2和D2,上述部分部首類碼元拆分在其它擴展雙鍵位上。如“62”-日、“63”-月、“64”-钅、“65”-35(匕、幾、兒和其余第二筆為右鉤者)、“66”-口。相應于簡易五筆數字“CKE”編碼方法雙鍵位組合表A3,上述部分部首類碼元和派生類碼元拆分在其它擴展雙鍵位上。
2.特殊編碼單鍵位(相應于簡易五筆數字“CKE”編碼方法雙鍵位組合表A、A2和A3)(1)單筆劃類
“1”-編碼1,筆劃“橫”“2”-編碼2,筆劃“豎”“3”-編碼3,筆劃“撇”“4”-編碼4,筆劃“點(捺)”“5”-編碼5,筆劃“折”(2)排列序號類“7”-7“8”-8(3)詞匯特殊編碼替代鍵對應五個單筆劃編碼,在單筆劃編碼后補一個編碼6,構成詞匯特殊組合編碼,對應特殊雙鍵組合鍵位。如詞匯“三個”,其數字編碼為“11 16 34 26”,其中,“16”和“26”為特殊組合編碼。也可以選擇采取共用一個詞匯特殊組合編碼的方式。
3.特殊編碼單鍵位(相應于簡易五筆數字“CKE”編碼方法雙鍵位組合表B和B2)在這種方式中,相應于默認常規編碼碼元和序號類常規編碼碼元,分別布置單筆劃類和序號單筆劃類編碼碼元。如表2所示,特殊編碼單鍵位在編碼組合鍵位上的分布為(1)單筆劃類“1”-編碼1,筆劃“橫”“2”-編碼2,筆劃“豎”“3”-編碼3,筆劃“撇”“4”-編碼4,筆劃“點(捺)”“5”-編碼5,筆劃“折”(2)序號單筆劃類“7”-編碼7,筆劃“橫”“8”-編碼8,筆劃“豎”“8”-編碼8,筆劃“撇”“9”-編碼9,筆劃“點(捺)”“60”-編碼60,筆劃“折”(3)詞匯特殊編碼替代鍵對應五個單筆劃編碼,在單筆劃編碼后補一個編碼6,構成詞匯特殊組合編碼,對應特殊雙鍵組合鍵位。也可以選擇采取共用一個詞匯特殊組合編碼的方式。
在簡易五筆漢字數字“CKE”編碼方法中,取0為結束碼,對應數字鍵0,且數字鍵7、8和9既為特殊編碼單鍵位,又同時為結束碼。結束碼標志一個漢字或詞匯編碼的結束。
三.簡易五筆漢字取碼規則簡易五筆漢字輸入方法以漢字和部首為基本取碼部件,與漢字中其它部分既不相交也不相連即分離的筆劃組為輔助取碼部件。其取碼規則為1.漢字由三個以上的部件組成。
在漢字最大編碼碼長為四碼的編碼方式中,首先盡可能組合成三個較大的部件,然后按從左到右,從上到下的次序依次取前面的兩個和最后一個部件為取碼單元。在依形編碼方案中,如果最后一個部件由兩個子部件組成,則兩個子部件分別為取碼單元,即增加到四個取碼單元,否則,對最后一個部件,若用一個編碼碼元不能取盡整個部件,則最后一個部件其余部分為一個取碼單元,即增加到四個取碼單元。
在漢字最大編碼碼長為五碼的編碼方式中,首先盡可能組合成四個較大的部件,然后按從左到右,從上到下的次序依次取前面的三個和最后一個部件為取碼單元。在依形編碼方案中,如果最后一個部件由兩個子部件組成,則兩個子部件分別為取碼單元,即增加到五個取碼單元,否則,對最后一個部件,若用一個編碼碼元不能取盡整個部件,則最后一個部件其余部分為一個取碼單元,即增加到五個取碼單元。
2.漢字由三個部件組成。
在漢字最大編碼碼長為四碼的編碼方式中,按從左到右,從上到下的次序依次取三個部件為取碼單元。在依形編碼方案中,對第三個部件,若用一個編碼碼元不能取盡整個部件,則增加一個取碼單元,即增加到四個取碼單元,對第三個部件按兩個取碼單元,參照下述漢字為獨體字的情況處理。
在漢字最大編碼碼長為五碼的編碼方式中,按從左到右,從上到下的次序依次取三個部件為取碼單元。在依形編碼方案中,對第三個部件,若用一個編碼碼元不能取盡整個部件,則增加兩個取碼單元,即增加到五個取碼單元,對第三個部件按三個取碼單元,參照下述漢字為獨體字的情況處理。在依音形編碼方案中,對第三個部件,若用一個編碼碼元不能取盡整個部件,則增加一個取碼單元,即增加到四個取碼單元,對第三個部件按兩個取碼單元,參照下述漢字為獨體字的情況處理。
3.漢字由兩個部件組成。
在依形編碼方案中,依兩個部件的筆劃數多少,分別確定取碼方式(1)若第二部件的筆劃數小于四,而第一部件的筆劃數大于三并且可以取兩個編碼碼元,則第一部件有兩個取碼單元。否則,第一部件為一個取碼單元(2)若第二部件的筆劃數大于三,而第一部件的筆劃數明顯比第二部件的筆劃數多,即至少多三個筆劃,則第一部件有兩個取碼單元。或者當可取多于兩個編碼碼元,并且第一部件有多個子部件,而第二部件為部首偏傍時,則第一部件有兩個取碼單元。否則,第一部件為一個取碼單元。
(3)由于在漢字最大編碼碼長為四碼的編碼方式中,一個漢字最多可取四個編碼碼元,或在漢字最大編碼碼長為五碼的編碼方式中,一個漢字最多可取五個編碼碼元,當確定了第一部件的取碼單元數,就可確定第二部件的最多取碼單元數。
(4)若第一部件有兩個取碼單元,如果有兩個子部件,則兩個子部件分別為取碼單元;否則,參照下述漢字為獨體字的情況處理。
(5)若第二部件有兩個或三個取碼單元,如果有兩個子部件,則將第二部件看做由兩個子部件組成的漢字,參照上述漢字由兩個部件組成的情況處理;否則,參照下述漢字為獨體字的情況處理。
在依音形編碼方案中,取兩個部件為取碼單元(1)在漢字最大編碼碼長為四碼的編碼方式中,若第二部件有多個子部件,則增加一個取碼單元,即增加到共三個取碼單元,對第二部件的多個子部件統一依次或統一按首尾取兩個取碼單元。
在漢字最大編碼碼長為五碼的編碼方式中,若第二部件有多個子部件,則增加兩個取碼單元,即增加到共四個取碼單元,對第二部件的多個子部件統一依次或統一按首尾取三個取碼單元。
(2)否則,在漢字最大編碼碼長為四碼的編碼方式中,對第二個部件,若用一個編碼碼元不能取盡整個部件,則增加一個取碼單元,對第二個部件按兩個取碼單元,參照下述漢字為獨體字的情況處理。
在漢字最大編碼碼長為五碼的編碼方式中,對第二個部件,若用兩個編碼碼元不能取盡整個部件,則增加到三個取碼單元,對第二個部件按三個取碼單元,參照下述漢字為獨體字的情況處理。或對第二個部件,若用一個編碼碼元不能取盡整個部件,則增加一個取碼單元,對第二個部件按兩個取碼單元,參照下述漢字為獨體字的情況處理。
4.漢字為獨體字。
(1)若能從獨體字中提出編碼部件,則按前面的規則確定取碼單元。如漢字“乘”和“來”,可分別確定取碼單元為“禾”和“北”,以及取碼單元“木”和“從”。
(2)否則,若獨體字的前面部分是一個字,則將該字和后面部分各作為一個部件,按上述漢字由兩個部件組成情形,分配取碼單元。如漢字“蟲”,其前面部分為漢字“中”,則可將“中”和后面部分各作為一個部件,分配取碼單元。
(3)否則,若獨體字的后面部分是一個字,則將該字和前面部分各作為一個部件,按上述漢字由兩個部件組成情形,分配取碼單元。如漢字“言”,其后面部分為漢字“口”,則可將“口”和前面部分各作為一個部件,分配取碼單元。
(4)否則,按筆劃順序依次取碼。上述規則稍作對應改動,同樣適用于簡易五筆漢字數字“CKE”編碼方法。
四.簡易五筆漢字編碼規則1.在漢字最大編碼碼長為四碼的編碼方式中,漢字編碼最多取四個編碼碼元,對應最多四個編碼鍵位。在漢字最大編碼碼長為五碼的編碼方式中,漢字編碼最多取五個編碼碼元,對應最多五個編碼鍵位。
2.第一個編碼碼元必須是常規編碼碼元,其對應編碼鍵位為常規編碼鍵位,即26個英文字母鍵位。即在依形編碼方案中,第一個編碼碼元必須是部首類碼元,三筆劃類碼元或兩筆劃類碼元,若漢字僅有一個筆劃,則添加一個同樣筆劃,構成兩筆劃類碼元。如漢字“一”和“乙”,分別取編碼碼元為“11”和“55”。而在依音形編碼方案中,第一個編碼碼元必須是字音類碼元即漢字的漢語拼音的首字母。
3.除最后一個取碼單元外,在前面的幾個取碼單元中,若某取碼單元僅有一個筆劃,則添加一個同樣筆劃,構成兩筆劃類碼元。如漢字“合”,在依形編碼方案中,第二個取碼單元為“一”,則可取編碼碼元為“11”。
4.若漢字按取碼規則確定了取碼單元,其最后一個取碼單元只有一個筆劃在依形編碼方案D和在依音形編碼方案D中,則添加一個同樣筆劃,構成兩筆劃類碼元。如漢字“扎”和“扛”,其最后一個取碼單元只有一個筆劃,則其編碼碼元分別取為“55”和“11”。
在其余依形編碼方案中(1)若此漢字的第一個編碼碼元為相應的編碼鍵位上的默認碼元,即其碼元排列序號為1,則該取碼單元取單筆劃類特殊編碼碼元。如漢字“扎”和“扛”,其最后一個取碼單元只有一個筆劃,則其編碼碼元分別取為“5”和“1”,對應特殊編碼鍵位。
(2)相應于簡易五筆編碼碼元鍵盤A,若此漢字的第一個編碼碼元不為相應的編碼鍵位上的默認碼元,即其碼元排列序號大于1,則當該漢字按取碼規則確定少于最大編碼碼長取碼單元時,其最后一個取碼單元亦取單筆劃類特殊編碼碼元。如漢字“大”和“軋”,其取碼單元少于最大編碼碼長,最后一個取碼單元只有一個筆劃,則其編碼碼元分別取為“4”和“5”,對應特殊編碼鍵位。
(3)相應于簡易五筆編碼碼元鍵盤B,若此漢字的第一個編碼碼元不為相應的編碼鍵位上的默認碼元,即其碼元排列序號大于1,則該最后一個取碼單元取序號單筆劃類特殊編碼碼元。如漢字“大”和“軋”,其最后一個取碼單元只有一個筆劃,則其編碼碼元分別取為“8”和“9”,對應特殊編碼鍵位。
(4)相應于簡易五筆編碼碼元鍵盤C,該取碼單元取單筆劃類特殊編碼碼元。如漢字“大”和“軋”,其最后一個取碼單元只有一個筆劃,則其編碼碼元分別取為“4”和“5”,對應特殊編碼鍵位。
在其余依音形編碼方案中,由于漢字的第一個編碼碼元為字音類碼元
(1) 若此漢字的第二個編碼碼元為相應的編碼鍵位上的默認碼元,即其碼元排列序號為1,則該取碼單元取單筆劃類特殊編碼碼元。如漢字“扎”和“扛”,其最后一個取碼單元只有一個筆劃,則其編碼碼元分別取為“5”和“1”,對應特殊編碼鍵位。
(2) 相應于簡易五筆編碼碼元鍵盤A,若此漢字的第二個編碼碼元不為相應的編碼鍵位上的默認碼元,即其碼元排列序號大于1,則當該漢字按取碼規則確定少于最大編碼碼長取碼單元時,其最后一個取碼單元亦取單筆劃類特殊編碼碼元。如漢字“大”和“軋”,其取碼單元少于最大編碼碼長,最后一個取碼單元只有一個筆劃,則其編碼碼元分別取為“4”和“5”,對應特殊編碼鍵位。
(3) 相應于簡易五筆編碼碼元鍵盤B,若此漢字的第二個編碼碼元不為相應的編碼鍵位上的默認碼元,即其碼元排列序號大于1,則該最后一個取碼單元取序號單筆劃類特殊編碼碼元。如漢字“大”和“軋”,其最后一個取碼單元只有一個筆劃,則其編碼碼元分別取為“8”和“9”,對應特殊編碼鍵位。
(4) 相應于簡易五筆編碼碼元鍵盤C,該取碼單元取單筆劃類特殊編碼碼元。如漢字“大”和“軋”,其最后一個取碼單元只有一個筆劃,則其編碼碼元分別取為“4”和“5”,對應特殊編碼鍵位。
5.在漢字最大編碼碼長為四碼的編碼方式中,若漢字按取碼規則確定有四個取碼單元,或在漢字最大編碼碼長為五碼的編碼方式中,若漢字按取碼規則確定有五個取碼單元在依形編碼方案D和在依音形編碼方案D中,其最后一個編碼碼元的編碼方式與前面編碼碼元的編碼方式一樣,都是取常規編碼碼元。
在其余依形編碼方案中,其最后一個編碼碼元的編碼方式取決于此漢字的第一個編碼碼元的碼元排列序號。其規則為(1) 若此漢字的第一個編碼碼元為相應的編碼鍵位上的默認碼元,即其碼元排列序號為1,則其最后一個編碼碼元取該取碼單元的首筆所對應的單筆劃類特殊編碼碼元。如漢字“堆”,在漢字最大編碼碼長為四碼的編碼方式中,其第一個編碼碼元為“土”,在對應部首類碼元“土”的常規編碼鍵位上,對應默認碼元,第二個編碼碼元為“32”,第三個編碼碼元為“41”,第四個編碼碼元取單筆劃類碼元“橫”,其相應編碼為“1”。
(2) 相應于簡易五筆編碼碼元鍵盤A,若此漢字的第一個編碼碼元不為相應的編碼鍵位上的默認碼元,即其碼元排列序號大于1,則其最后一個編碼碼元取對應的序號類碼元。如對應兩筆劃類碼元“55”的常規編碼鍵位上,順序排列有派生類碼元“纟”和“55”。對漢字“編”和“騙”,在漢字最大編碼碼長為四碼的編碼方式中,前三個編碼均相同,第四個取碼單元也相同。由于“編”字的第一個編碼碼元“纟”為相應的編碼鍵位上的默認碼元,其碼元排列序號為1,因此其第四個編碼碼元取單筆劃碼元“橫”,相應編碼為“1”。而“騙”字的第一個編碼碼元“馬”,不為相應的編碼鍵位上的默認碼元,其碼元排列序號為2,因此其第四個編碼碼元取相應的第一個序號類碼元,編碼為“7”。
(3) 相應于簡易五筆編碼碼元鍵盤B,若此漢字的第一個編碼碼元不為相應的編碼鍵位上的默認碼元,即其碼元排列序號大于1,則其最后一個編碼碼元取該取碼單元的首筆所對應的序號單筆劃類特殊編碼碼元。如對應兩筆劃類碼元“55”的常規編碼鍵位上,順序排列有派生類碼元“纟”和“55”。對漢字“編”和“騙”,在漢字最大編碼碼長為四碼的編碼方式中,前三個編碼均相同,第四個取碼單元也相同。由于“編”字的第一個編碼碼元“纟”為相應的編碼鍵位上的默認碼元,其碼元排列序號為1,因此其第四個編碼碼元取單筆劃碼元“橫”,相應編碼為“1”。而“騙”字的第一個編碼碼元“馬”,不為相應的編碼鍵位上的默認碼元,其碼元排列序號為2,因此其第四個編碼碼元取序號單筆劃類碼元“橫”,相應編碼為“7”。
(4) 相應于簡易五筆編碼碼元鍵盤C,則其最后一個編碼碼元取該取碼單元的首筆所對應的單筆劃類特殊編碼碼元。如漢字“堆”,在漢字最大編碼碼長為四碼的編碼方式中,其第一個編碼碼元為“土”,在對應部首類碼元“土”的常規編碼鍵位上,對應默認碼元,第二個編碼碼元為“32”,第三個編碼碼元為“41”,第四個編碼碼元取單筆劃類碼元“橫”,其相應編碼為“1”。
在其余依音形編碼方案中,由于漢字的第一個編碼碼元為字音類碼元,其最后一個編碼碼元的編碼方式取決于此漢字的第二個編碼碼元的碼元排列序號。其規則為(1)若此漢字的第二個編碼碼元為相應的編碼鍵位上的默認碼元,即其碼元排列序號為1,則其最后一個編碼碼元取該取碼單元的首筆所對應的單筆劃類特殊編碼碼元。如漢字“堆”,在漢字最大編碼碼長為四碼的編碼方式中,其第二個編碼碼元為“土”,在對應部首類碼元“土”的常規編碼鍵位上,對應默認碼元,第三個編碼碼元為“32”,第四個編碼碼元取單筆劃類碼元“點”,其相應編碼為“4”。
(2)相應于簡易五筆編碼碼元鍵盤A,若此漢字的第二個編碼碼元不為相應的編碼鍵位上的默認碼元,即其碼元排列序號大于1,則其最后一個編碼碼元取對應的序號類碼元。如對應兩筆劃類碼元“55”的常規編碼鍵位上,順序排列有派生類碼元“纟”和“55”。對漢字“編”和“騙”,在漢字最大編碼碼長為四碼的編碼方式中,第二和第三個編碼均相同,第四個取碼單元也相同。由于“編”字的第二個編碼碼元“纟”為相應的編碼鍵位上的默認碼元,其碼元排列序號為1,因此其第四個編碼碼元取單筆劃碼元“豎”,相應編碼為“2”。而“騙”字的第二個編碼碼元“馬”,不為相應的編碼鍵位上的默認碼元,其碼元排列序號為2,因此其第四個編碼碼元取相應的第一個序號類碼元,編碼為“7”。
(3)相應于簡易五筆編碼碼元鍵盤B,若此漢字的第二個編碼碼元不為相應的編碼鍵位上的默認碼元,即其碼元排列序號大于1,則其最后一個編碼碼元取該取碼單元的首筆所對應的序號單筆劃類特殊編碼碼元。如對應兩筆劃類碼元“55”的常規編碼鍵位上,順序排列有派生類碼元“纟”和“55”。對漢字“編”和“騙”,在漢字最大編碼碼長為四碼的編碼方式中,第二和第三個編碼均相同,第四個取碼單元也相同。由于“編”字的第二個編碼碼元“纟”為相應的編碼鍵位上的默認碼元,其碼元排列序號為1,因此其第四個編碼碼元取單筆劃碼元“豎”,相應編碼為“2”。而“騙”字的第二個編碼碼元“馬”,不為相應的編碼鍵位上的默認碼元,其碼元排列序號為2,因此其第四個編碼碼元取序號單筆劃類碼元“橫”,相應編碼為“7”。
(4)相應于簡易五筆編碼碼元鍵盤C,則其最后一個編碼碼元取該取碼單元的首筆所對應的單筆劃類特殊編碼碼元。如漢字“堆”,在漢字最大編碼碼長為四碼的編碼方式中,其第二個編碼碼元為“土”,在對應部首類碼元“土”的常規編碼鍵位上,對應默認碼元,第三個編碼碼元為“32”,第四個編碼碼元取單筆劃類碼元“點”,其相應編碼為“4”。
6.在漢字最大編碼碼長為四碼的編碼方式中,若漢字按取碼規則確定少于四個取碼單元,并且最后一個編碼碼元為常規編碼碼元,或在漢字最大編碼碼長為五碼的編碼方式中,若漢字按取碼規則確定少于五個取碼單元,并且最后一個編碼碼元為常規編碼碼元在依形編碼方案D和在依音形編碼方案D中,補一個空格鍵。在其余依形編碼方案中(1)若該漢字的第一個編碼碼元為相應編碼鍵位上的默認碼元時,補一個空格鍵。
(2)相應于簡易五筆編碼碼元鍵盤A,若該漢字的第一個編碼碼元不為相應的編碼鍵位上的默認碼元時,補上一個相應的序號類碼元。如對應部首碼元“口”的常規編碼鍵位上,順序排列有派生類碼元“口”和“足”。對漢字“噪”和“躁”,其前三個編碼均相同,并且最后的第三個編碼碼元為常規編碼碼元。由于“躁”字的第一個編碼碼元“足”,不為相應的編碼鍵位上的默認碼元,其碼元排列序號為2,因此補上第四個編碼碼元,且取相應的第一個序號類碼元,其編碼為“7”。
(3)相應于簡易五筆編碼碼元鍵盤B,若該漢字的第一個編碼碼元不為相應的編碼鍵位上的默認碼元時,按最后一個編碼單元的首筆,補上一個相應的序號單筆劃類碼元。如對應部首碼元“口”的常規編碼鍵位上,順序排列有派生類碼元“口”和“足”。對漢字“噪”和“躁”,其前三個編碼均相同,并且最后的第三個編碼碼元為常規編碼碼元。由于“躁”字的第一個編碼碼元“足”,不為相應的編碼鍵位上的默認碼元,其碼元排列序號為2,因此補上第四個編碼碼元,且按最后一個編碼單元的首筆為“橫”,取相應的序號單筆劃類碼元,其編碼為“7”。
(4)相應于簡易五筆編碼碼元鍵盤C,補一個空格鍵。在其余依音形編碼方案中,由于漢字的第一個編碼碼元為字音類碼元(1)若該漢字的第二個編碼碼元為相應編碼鍵位上的默認碼元時,補一個空格鍵。
(2)相應于簡易五筆編碼碼元鍵盤A,若該漢字的第二個編碼碼元不為相應的編碼鍵位上的默認碼元時,補上一個相應的序號類碼元。如對應部首碼元“口”的常規編碼鍵位上,順序排列有派生類碼元“口”和“足”。對漢字“叭”和“趴”,其第二和第三個編碼均相同,且最后一個編碼碼元為常規編碼碼元。由于“趴”字的第二個編碼碼元“足”,不為相應的編碼鍵位上的默認碼元,其碼元排列序號為2,因此補上第四個編碼碼元,且取相應的第一個序號類碼元,其編碼為“7”。
(3)相應于簡易五筆編碼碼元鍵盤B,若該漢字的第二個編碼碼元不為相應的編碼鍵位上的默認碼元時,按最后一個編碼單元的首筆,補上一個相應的序號單筆劃類碼元。如對應部首碼元“口”的常規編碼鍵位上,順序排列有派生類碼元“口”和“足”。對漢字“叭”和“趴”,其第二和第三個編碼均相同,并且最后的第三個編碼碼元為常規編碼碼元。由于“趴”字的第二個編碼碼元“足”,不為相應的編碼鍵位上的默認碼元,其碼元排列序號為2,因此補上第四個編碼碼元,且按最后一個編碼單元的首筆為“撇”,取相應的序號單筆劃類碼元,其編碼為“8”。
(4)相應于簡易五筆編碼碼元鍵盤C,補一個空格鍵。
上述規則稍作對應改動,同樣適用于簡易五筆漢字數字“CKE”編碼方法。補一個空格鍵可以用補一個數字鍵0代替。
五.簡易五筆詞匯編碼規則在詞匯最大編碼碼長為四碼的編碼方式中,詞匯編碼規定統一用四個編碼碼元,并且僅用常規編碼碼元和一個替代鍵位。在詞匯最大編碼碼長為五碼的編碼方式中,詞匯編碼規定統一用五個編碼碼元,并且僅用常規編碼碼元和一個替代鍵位。
1.四字和四字以上詞匯在詞匯最大編碼碼長為四碼的編碼方式中,對詞匯的前四字,每字取其第一個編碼碼元。由于漢字編碼規則規定了每個漢字的第一個編碼碼元必須為常規編碼碼元,因此,此類詞匯的四個編碼碼元均為常規編碼碼元。
在詞匯最大編碼碼長為五碼的編碼方式中,對四字以上詞匯的前五字,每字取其第一個編碼碼元,對四字詞匯,取第四個字的第二個編碼碼元為該詞匯的第五個編碼碼元。若第四個字僅有一個編碼碼元,或其第二個編碼碼元為特殊編碼碼元,則該詞匯的第五個編碼鍵用一個替代鍵代替。在依形編碼方案中,如詞匯“大大小小”,第四個字“小”的第二個編碼碼元為單筆劃類特殊編碼碼元。因此,此詞匯的第五個編碼鍵用一個替代鍵代替。在依音形編碼方案中,如詞匯“合二為一”,第四個漢字“一”的第一個編碼碼元為漢語拼音字母“y”,第二個編碼碼元為單筆劃類特殊編碼碼元。因此,此詞匯的第五個編碼鍵用一個替代鍵代替。
在詞匯最大編碼碼長為五碼的編碼方式中,對四字詞匯,也可以選用另一種編碼方式,即取該詞匯的第一個字的前兩個編碼碼元為該詞匯的前兩個編碼碼元,對該詞匯的后三個字,每字取其第一個編碼碼元,分別為該詞匯的第三、第四和第五個編碼碼元。若第一個字僅有一個編碼碼元,或其第二個編碼碼元為特殊編碼碼元,則該詞匯的第二個編碼鍵用一個替代鍵代替。
2.三字詞匯在詞匯最大編碼碼長為四碼的編碼方式中,對詞匯的三個字,每字取其第一個編碼碼元。再取第三個字的第二個編碼碼元為該詞匯的第四個編碼碼元。若第三個字僅有一個編碼碼元,或其第二個編碼碼元為特殊編碼碼元,則該詞匯的第四個編碼鍵用一個替代鍵代替。在依形編碼方案中,如詞匯“第一個”,第三個字“個”的第二個編碼碼元為單筆劃類特殊編碼碼元。因此,此詞匯的第四個編碼鍵用一個替代鍵代替。在依音形編碼方案中,如詞匯“一等一”,第三個漢字“一”的第一個編碼碼元為漢語拼音字母“y”,第二個編碼碼元為單筆劃類特殊編碼碼元。因此,此詞匯的第四個編碼鍵用一個替代鍵代替。
在詞匯最大編碼碼長為四碼的編碼方式中,也可以選用另一種編碼方式,即取該詞匯的第一個字的前兩個編碼碼元為該詞匯的前兩個編碼碼元,對該詞匯的后兩個字,每字取其第一個編碼碼元,分別為該詞匯的后兩個編碼碼元。若第一個字僅有一個編碼碼元,或其第二個編碼碼元為特殊編碼碼元,則該詞匯的第二個編碼鍵用一個替代鍵代替。
在詞匯最大編碼碼長為五碼的編碼方式中,取該詞匯的第一個字的前兩個編碼碼元為該詞匯的前兩個編碼碼元,取該詞匯的第二個字的第一個編碼碼元,為該詞匯的第三個編碼碼元,再取第三個字的前二個編碼碼元為該詞匯的后兩個編碼碼元。若第三個字僅一個編碼碼元,或其第二個編碼碼元為特殊編碼碼元,則相應的編碼鍵用替代鍵代替。
在詞匯最大編碼碼長為五碼的編碼方式中,也可以選用另一種編碼方式,即對該詞匯的前兩個字,分別取其前兩個編碼碼元為該詞匯的前四個編碼碼元,再取第三個字的第一個編碼碼元為該詞匯的第五個編碼碼元。若前兩個字中,某個字僅有一個編碼碼元,或其第二個編碼碼元為特殊編碼碼元,則該詞匯的第五個編碼鍵用一個替代鍵代替。
3.兩字詞匯在詞匯最大編碼碼長為四碼的編碼方式中,對每字取前兩個編碼碼元,構成四個編碼碼元。若某字僅有一個編碼碼元,或其第二個編碼碼元為特殊編碼碼元,則相應的編碼鍵用一個替代鍵代替。在依形編碼方案中,如詞匯“一個”,漢字“一”僅有一個編碼碼元“11”,而漢字“個”的第二個編碼碼元為單筆劃類特殊編碼碼元。因此,此詞匯的四個編碼鍵中,第二個和第四個編碼鍵均用替代鍵代替。在依音形編碼方案中,如詞匯“一個”,漢字“一”的第一個編碼碼元為漢語拼音字母“y”,第二個編碼碼元為單筆劃類特殊編碼碼元。因此,此詞匯的四個編碼鍵中,第二個編碼鍵用替代鍵代替。
在詞匯最大編碼碼長為五碼的編碼方式中,取該詞匯的第一個字的前兩個編碼碼元為該詞匯的前兩個編碼碼元,取該詞匯的第二個字的前三個編碼碼元,為該詞匯的后三個編碼碼元,構成五個編碼碼元。若該詞匯的第一個字僅有一個編碼碼元,或其第二個編碼碼元為特殊編碼碼元,則相應的編碼鍵用一個替代鍵代替。若該詞匯的第二個字僅有兩個編碼碼元,或其第三個編碼碼元為特殊編碼碼元,則相應的編碼鍵用一個替代鍵代替。若該詞匯的第二個字僅有一個編碼碼元,或其第二個編碼碼元為特殊編碼碼元,則相應的編碼鍵用一個替代鍵代替,第五碼補一個空格鍵。
上述規則稍作對應改動,同樣適用于簡易五筆漢字數字“CKE”編碼方法。補一個空格鍵可以用補一個數字鍵0代替。
六.特殊編碼鍵使用說明在簡易五筆編碼碼元鍵盤上規定了特殊編碼鍵位。由于規定了漢字的第一個編碼碼元必須是常規編碼碼元,因此,并不影響特殊編碼鍵位作為原來的符號鍵位的使用。
當輸入第一個常規編碼鍵位時,即標志著進入了漢字或詞匯輸入狀態。在漢字輸入狀態,當輸入了一個特殊編碼鍵位,該特殊編碼鍵位對應著一個特殊編碼碼元,即所要輸入的漢字的最后一個編碼碼元,并標志著結束了漢字輸入狀態。在詞匯輸入狀態,當輸入了一個替代鍵位,若此時是對應輸入第二個編碼碼元,則繼續詞匯輸入狀態;若此時是對應輸入第四個編碼碼元,則標志著結束了詞匯輸入狀態。
當不是處于漢字或詞匯輸入狀態時,若輸入了一個特殊編碼鍵位,則此特殊編碼鍵位即作為原來的符號鍵位使用。
根據上述描述,對于本發明范圍內的某些編碼碼元、編碼鍵位、編碼規則和組合方式作出替換和改進,將是易見或等同的。因此,該所有的替換和改進仍被視為在本發明的權利要求的保護范圍之內。
表1.簡易五筆數字“CKE”編碼方法雙鍵位組合表A
表2.簡易五筆數字“CKE”編碼方法雙鍵位組合表B
表3.簡易五筆數字“CKE”編碼方法雙鍵位組合表C
表4.簡易五筆數字“CKE”編碼方法雙鍵位組合表D
表5.簡易五筆數字“CKE”編碼方法雙鍵位組合表A2
表6.簡易五筆數字“CKE”編碼方法雙鍵位組合表B2
表7.簡易五筆數字“CKE”編碼方法雙鍵位組合表C2
表8.簡易五筆數字“CKE”編碼方法雙鍵位組合表D2
表9.簡易五筆數字“CKE”編碼方法雙鍵位組合表A權利要求
1.一種漢字編碼方法及其鍵盤,其特征在于此編碼方法規定了常規編碼碼元和特殊編碼碼元,設計了相應的編碼鍵盤,提出了基于常規編碼碼元和特殊編碼碼元的編碼原理,根據全部或部分是否選用特殊編碼碼元、派生類碼元和序號類碼元,可形成多種編碼方案及其相應的編碼鍵盤。
2.按權利要求1所述的漢字編碼方法及其編碼鍵盤,其特征在于定義26個英文字母鍵為常規編碼鍵位,并且定義一些符號鍵為特殊編碼鍵位,分別映射常規編碼碼元和特殊編碼碼元,根據全部或部分是否選用特殊編碼碼元、派生類碼元和序號類碼元,選用相應的編碼鍵位,映射選用的編碼碼元,可形成多種編碼方案及其相應的編碼鍵盤。
3.按權利要求1所述的漢字編碼方法及其編碼鍵盤,其特征在于根據全部或部分是否選用特殊編碼碼元、派生類碼元和序號類碼元,可形成多種編碼方案及其相應的編碼鍵盤,(1) 或者是依形編碼方案A,在由部首類和筆劃組合類編碼碼元組成的常規編碼碼元中,規定了派生類編碼碼元,以及規定了單筆劃類和排列序號類特殊編碼碼元,基于四類編碼碼元,即部首類碼元、筆劃類碼元、派生類碼元和序號類碼元,和相應的編碼鍵盤的漢字編碼規則,對漢字和詞匯依形編碼,(2) 或者是依形編碼方案B,在由部首類和筆劃組合類編碼碼元組成的常規編碼碼元中,規定了派生類編碼碼元,以及規定了單筆劃類特殊編碼碼元,基于三類編碼碼元,即部首類碼元、筆劃類碼元和派生類碼元,和相應的編碼鍵盤的漢字編碼規則,對漢字和詞匯依形編碼,(3) 或者是依形編碼方案C,規定了單筆劃類特殊編碼碼元,基于兩類編碼碼元,即部首類碼元和筆劃類碼元,和相應的編碼鍵盤的漢字編碼規則,對漢字和詞匯依形編碼,(4) 或者是依形編碼方案D,基于兩類常規編碼碼元,即部首類碼元和筆劃類碼元,和相應的編碼鍵盤的漢字編碼規則,對漢字和詞匯依形編碼,(5) 或者是依音形編碼方案A,在由部首類和筆劃組合類編碼碼元組成的常規編碼碼元中,規定了派生類編碼碼元,以及規定了單筆劃類和排列序號類特殊編碼碼元,基于五類編碼碼元,即字音類碼元、部首類碼元、筆劃類碼元、派生類碼元和序號類碼元,和相應的編碼鍵盤的漢字編碼規則,對漢字和詞匯依音形編碼,(6) 或者是依音形編碼方案B,在由部首類和筆劃組合類編碼碼元組成的常規編碼碼元中,規定了派生類編碼碼元,以及規定了單筆劃類特殊編碼碼元,基于四類編碼碼元,即字音類碼元、部首類碼元、筆劃類碼元、和派生類碼元,和相應的編碼鍵盤的漢字編碼規則,對漢字和詞匯依音形編碼,(7)或者是依音形編碼方案C,規定了單筆劃類特殊編碼碼元,基于三類編碼碼元,即字音類碼元、部首類碼元、和筆劃類碼元,和相應的編碼鍵盤的漢字編碼規則,對漢字和詞匯依音形編碼,(8)或者是依音形編碼方案D,基于三類常規編碼碼元,即字音類碼元、部首類碼元、和筆劃類碼元,和相應的編碼鍵盤的漢字編碼規則,對漢字和詞匯依音形編碼。
4.一種漢字編碼方法及其鍵盤,其特征在于此編碼方法規定了常規編碼碼元和特殊編碼碼元,設計了相應的編碼數字鍵盤,提出了基于常規編碼碼元和特殊編碼碼元的編碼原理,根據全部或部分是否選用特殊編碼碼元、派生類碼元和序號類碼元,可形成多種編碼方案及其相應的編碼數字鍵盤。
5.按權利要求4所述的漢字編碼方法及其編碼鍵盤,其特征在于定義1到6或1到9的數字鍵的兩鍵組合中的一部分為常規編碼組合鍵位,一部分不用或可選為特殊編碼組合鍵位,定義1到9的數字鍵單鍵為特殊編碼單鍵位,分別映射常規編碼碼元和特殊編碼碼元,根據全部或部分是否選用特殊編碼碼元、派生類碼元和序號類碼元,選用相應的編碼鍵位,映射選用的編碼碼元,可形成多種編碼方案及其相應的編碼鍵盤,
6.按權利要求4所述的漢字編碼方法及其編碼鍵盤,其特征在于根據全部或部分是否選用特殊編碼碼元、派生類碼元和序號類碼元,可形成多種編碼方案及其相應的編碼鍵盤,(1)或者是依形數字編碼方案A,在由部首類和筆劃組合類編碼碼元組成的常規編碼碼元中,規定了派生類編碼碼元,以及規定了單筆劃類和排列序號類特殊編碼碼元,基于四類編碼碼元,即部首類碼元、筆劃類碼元、派生類碼元和序號類碼元,和相應的編碼數字鍵盤的漢字編碼規則,對漢字和詞匯依形編碼,(2)或者是依形數字編碼方案B,在由部首類和筆劃組合類編碼碼元組成的常規編碼碼元中,規定了派生類編碼碼元,以及規定了單筆劃類特殊編碼碼元,基于三類編碼碼元,即部首類碼元、筆劃類碼元和派生類碼元,和相應的編碼數字鍵盤的漢字編碼規則,對漢字和詞匯依形編碼,(3)或者是依形數字編碼方案C,規定了單筆劃類特殊編碼碼元,基于兩類編碼碼元,即部首類碼元和筆劃類碼元,和相應的編碼數字鍵盤的漢字編碼規則,對漢字和詞匯依形編碼,(4)或者是依形數字編碼方案D,基于兩類常規編碼碼元,即部首類碼元和筆劃類碼元,和相應的編碼數字鍵盤的漢字編碼規則,對漢字和詞匯依形編碼,(5)或者是依音形數字編碼方案A,在由部首類和筆劃組合類編碼碼元組成的常規編碼碼元中,規定了派生類編碼碼元,以及規定了單筆劃類和排列序號類特殊編碼碼元,基于五類編碼碼元,即字音類碼元、部首類碼元、筆劃類碼元、派生類碼元和序號類碼元,和相應的編碼數字鍵盤的漢字編碼規則,對漢字和詞匯依音形編碼,(6)或者是依音形數字編碼方案B,在由部首類和筆劃組合類編碼碼元組成的常規編碼碼元中,規定了派生類編碼碼元,以及規定了單筆劃類特殊編碼碼元,基于四類編碼碼元,即字音類碼元、部首類碼元、筆劃類碼元、和派生類碼元,和相應的編碼數字鍵盤的漢字編碼規則,對漢字和詞匯依音形編碼,(7) 或者是依音形數字編碼方案C,規定了單筆劃類特殊編碼碼元,基于三類編碼碼元,即字音類碼元、部首類碼元、和筆劃類碼元,和相應的編碼數字鍵盤的漢字編碼規則,對漢字和詞匯依音形編碼,(8) 或者是依音形數字編碼方案D,基于三類常規編碼碼元,即字音類碼元、部首類碼元、和筆劃類碼元,和相應的編碼數字鍵盤的漢字編碼規則,對漢字和詞匯依音形編碼。
全文摘要
本發明公開了一組簡易五筆漢字編碼方法及其鍵盤設計。提出了常規編碼碼元和特殊編碼碼元編碼原理,漢字和詞匯編碼兼容統一,分別具有各自獨立的編碼空間。既降低了詞匯的重碼率,且當詞匯容量增大時,并不影響漢字的重碼率。采用30多個基本常規編碼碼元和一些特殊編碼碼元,對漢字和詞匯依形或音形編碼。編碼碼元少,在鍵盤上布置合理,規律性強。重碼率低、詞匯容量大,易學易用、輸入效率高,可用于各類中文信息處理系統。
文檔編號G06F3/023GK1296207SQ00131540
公開日2001年5月23日 申請日期2000年10月22日 優先權日1999年11月15日
發明者譚善光 申請人:譚善光