專利名稱:左部右部筆畫數字編碼漢字電腦輸入法及其鍵盤的制作方法
技術領域:
本發(fā)明屬于漢字電腦輸入法及其鍵盤。
這里所述的電腦是指含有CPU電子元件和數字鍵盤的設備目前,數字鍵盤的應用范圍十分廣泛。例如,手機、電話、掌上電腦、PC機等設備都使用了數字鍵盤。但是,這些設備都沒有一種有效的漢字輸入法,人們迫切需要一種既簡單易學,重碼率又低,且能在數字鍵盤上使用的漢字輸入法。
在現有的技術中,解決數字鍵盤的漢字輸入方式有以下幾種1、五筆數碼鍵盤漢字電腦輸入法及其鍵盤這種輸入法的最大特征是將漢字中的上下、左右、包圍結構的漢字一分為二——“首部”和“余部”,然后再按編碼規(guī)則進行編碼。這種分法在某種程度上解決了現有數字編碼中的難學難用、重碼多、效率不高的問題。本發(fā)明人認為,這種輸入法把“上下、上中下、左右、左中右、包圍、半包圍”的漢字從結構上一分為二——“首部”和“余部”,一個很重要的目的就是在“跳躍技術”(例對于“余部”是取前3筆畫加末筆畫,而不是直接取前4筆畫,這種方法稱為“跳躍技術”)幫助下,降低重碼率。事實上也的確如此。但是,由此而產生了一個問題,即增加了學習的難度。其主要表現在以下兩點一是在把“上下、上中下、包圍、半包圍”結構的漢字劃分“首部”和“余部”時產生了嚴重的二義性,以致該發(fā)明人在其“發(fā)明專利申請公開說明書”中用整整一頁的篇幅加以定義、約定和說明,在其輸入法的使用說明書也整整用了二頁加以定義、約定和說明。例如,按其“取小不取大”的規(guī)則,拿字的“首部”應是“人”,但是,取“合”也可以。又如,把“咸”既當為“整字”,又可把它當成合體字,把“戊”定為“首部”。為了解決這一劃分的二義性,就必須增加容錯碼,這在實際應用中勢必增加重碼率,降低了使用效率。若不增加容錯碼,人們在使用過程中就無從“下手”。二是對90%以上合體字,采用了二次跳躍技術(一次是“首部”取第一筆畫加末筆畫,一次是“余部”取前3筆畫加末筆畫),也給人們帶來了難度,降低了輸入速度??傊拔骞P數碼”還是沒有很好解決“易學性”與“重碼率”這一長期困擾在眾多編碼工作者面前的矛盾。
2、五鍵五筆畫輸入法這是一種非常簡易學的數字輸入法。它用1、2、3、4、5分別代表橫、堅、撇、捺、折五種筆畫。對任何漢字,依書寫順序取其前邊的4個單筆畫,再加上最后一個單筆畫。但是,僅在國家一、二級字庫中,同一部件(如蟲、木、月、口)的漢字的數量就相當多,僅這些部件就占了前面的3個甚至4個碼,其編碼的離散工作只能由最后一筆畫來完成,造成了重碼率極高的后果。
3、拼音數字輸入法這一輸入法,按1-3次鍵來代表漢語拼音字母。它的優(yōu)點是“會念就會輸”,但是,要是發(fā)音不準或不會念的漢字就不能輸,且重碼率高,擊鍵次數多,效率低。
本發(fā)明的目的提出一種嶄新的“左部右部筆畫數字編碼漢字電腦輸入法及其鍵盤”的技術方案,以克服編碼上“易學性”與“重碼率”這一矛盾,在定義漢字的類型和劃分上,做到了“單一性”,提高了“易學度”,降低了重碼率,提高了輸入速度和使用效率,使含有數字鍵盤又需要輸入中文的設備(如PC機、掌上電腦、手機、電話、電子字典、電子記事本、收款機等),能夠用一種行之有效的漢字輸入法。
本發(fā)明首創(chuàng)的“左部右部筆畫數字編碼漢字電腦輸入法及其鍵盤”,是用數字鍵盤上的1、2、3、4、5五個數字鍵分別代表漢字的橫、豎、撇、捺(點)、折五種筆畫,并在6、7、8、9、0五個數字鍵位上安排了五組且每組“形意”相似的部件,其特征是將漢字中能夠清楚劃分的左右(含左中右)結構的字,從結構上劃分為“左部”和“右部”,稱這些漢字為“左右字”,把其它的漢字全部看作“整體字”;由“左部”的第一(或第一、第二)筆畫(部件)、“右部”的前三筆畫(部件)和最后一筆畫(部件)構成的“左右字”數字編碼,再加上“整體字”的前四筆畫(部件)和最后一筆畫(部件)的“整體字”的數字編碼,而構成的漢字筆畫數字編碼。
眾所周知,數字鍵盤上只有10個數字鍵可用于編碼,編碼空間有限,而大鍵盤有26個以上的按鍵可用于編碼,因此,數字編碼的重碼率不大可能低于大鍵盤輸入法的重碼率?;谶@種情況,在制定數字鍵盤輸入法方案的時候,應把“易學性”作為第一位來考慮,其次再考慮重碼率的問題。要做到易學易用,就必須定義清楚,在實際使用過程中不能有二義性,規(guī)則或約定要少,盡可能減少記憶量等。從這一思路出發(fā),本發(fā)明人經過長期的研究發(fā)現,“左右”(含左中右)結構的漢字,其“形狀”最容易被人們辯認,在劃分“左部”和“右部”時不產生“二義性”,并具有很好的離散能力。本發(fā)明人把這一認識用于編碼的實踐,成功地解決了現行技術方案中對漢字劃分的“二義性”嚴重、規(guī)則或約定多的問題,并在五組精選的部件的幫助下,大大降低了重碼率,提高了輸入速度和使用效率,首創(chuàng)出“左部右部筆畫數字漢字電腦輸入法及其鍵盤”,形成了一個嶄新的編碼理論體系。
“左部”是指對于“左右字”,按書寫順序,先寫到的那一部分。例如“鵬”的左部為“月”“湘”的左部為“氵”“偉”的左部為“亻”“明”的左部為“日”本發(fā)明的另一顯著特征是,在把漢字劃分為“左右字”和“整體字”的基礎上,對“左部”只取第一筆畫(部件)。這樣的取碼規(guī)則可以極大降低重碼率,提高編碼效率。眾所周知,左右結構的漢字在漢字中占有相當的數量,且同一部件,如“木、蟲、扌、月、口”的漢字很多,如何離散好這些漢字的重碼,也是編碼者必須重視的問題?,F在以部件“木”為例,來說明“左部”取一碼的作用。
在一、二級漢字字庫中,以部件“木”為左邊的漢字約有240個,若用現有前4末1的技術方案,部件“木”本身就占了4碼,僅剩最后1碼,按照五種筆畫的分配,平均重碼率為240/5=48。若用本發(fā)明,“木”只占1碼,還有4碼來離散其它的筆畫結構,共有5的4次方625種可能,平均重碼率為240/625≈0.38。本發(fā)明的重碼率僅是這種現有技術的1/125。采用“首部余部”輸入法,若限定碼長都是5碼,按照其權力要求書中所述的,首部的第一筆畫和末筆畫是必須的,則只剩有三個碼來離散“余部”的筆畫結構,重碼率為240/125=1.92,其重碼率是本發(fā)明的5倍。
例如在現有技術“五筆畫輸入法”中,左邊是“月”字旁末筆是捺(點)的字,有23個服、膠、脈、膜、腿、脹、脅、腹、膚、膝、膩、膊、腺、肘、脯、腮、腑、腋、膿、臆、膘、腆、胰,其編碼都是35114。若限定最大碼長都是五碼,用“五筆數碼”進行編碼時,還有以下4組重碼,共14個字31114膚、膩31314脹、腹31414膠、臆、腑、腋31124膜、肢、膝、脯、肘、膘。若用本發(fā)明進行編碼,結果是32514腮、腆34134腋、膠、腑31254膘、膊、脯共3組重碼,8個字。
同樣都是五種筆畫,同樣是最大碼長為5碼,易學度差不多,但是本發(fā)明都比現有的這二種技術好,實現了質的突破。
由此可見,本發(fā)明中的對“左部”只取1碼,“右部”取4碼,對離散重碼率有著重大作用。
為了離散重碼,當漢字字集大于國標一、二級字庫時,“左部”要取前2碼,“右部”取前3筆畫加末筆畫。
本發(fā)明還有一個顯著特征是選擇了五組,且每組形狀極其相似的部件作為取碼單位,并很有規(guī)律地分布到數字鍵盤上的6、7、8、9、0鍵位上。它有兩大作用一是便于記憶,大大增加易學度。在現有的技術方案中,一般都是直接選取使用頻度比較高的部件(如日、月、口、目),來加強編碼的離散能力,提高輸入速度。但對部件之間的形狀和規(guī)律缺乏足夠的研究與分析,所選取的部件多,且部件之間的“聯(lián)想性”差,其直接的后果是大大增加了記憶量和學習難度大。本發(fā)明不僅考慮到如何用部件來提高速度,降低重碼率,而且也充分考慮到它們的“易學性”、“易記性”和“易用性”。例如日、月、口、目這幾個使用頻度較高的部件,現有的很多技術方案都是“全盤接收”。其實這四個部件的外形有一個共同的特點,即外圍的形狀都是“、 ”。選取這兩個部件就代表了“日、月、口、目、、冖、 ”這七個部件,就記憶而言,只要記住一個,即″連續(xù)兩筆畫組成的三面包圍″,延伸出來自然會聯(lián)想到“冖、冂、、匚、幾、 、”等部件。再如漢字中橫的筆畫數量是五種筆畫中最多的,本發(fā)明把筆畫對“二”當作一部件將其從筆畫橫中分離出來,以達到離散漢字筆畫結構的目的,同時又把它歸于“亠、冫、氵”這一形意相似的部件組中。再如“钅”與“”這兩個部件,本發(fā)明把它們合二為一,只選取“”??傊?,本發(fā)明所選取的五組部件,每組“形意”都非常相似,且很有規(guī)律地安排在6、7、8、9、0五個數字鍵位上,便于記憶,易學度極高,這與傳統(tǒng)技術中多直接采用高頻的部件有著質的區(qū)別。二是成功地把漢字的筆畫(部件)較為平均地分配在10個數字鍵上,并大大降低了重碼率。本方案主要從兩個方面來考慮降低重碼率。一是,由于漢字的五種筆畫只占用1——5五個數字鍵,且這五種筆畫的數量大小差別較大。如何把數量比較大的筆畫,以部件的方式分離出來,分配到6、7、8、9、0這五個“空閑”的數字鍵上,盡可能使這10個數字鍵各自所表示的筆畫(部件)的數量相接近,以達到平均分配、減少重碼的效果;二是必須同時考慮這些部件能夠離散因上下、上中下、包圍結構的漢字與“獨體字”一樣當作“整體字”看待而產生的重碼。例如在國標一、二級字庫中,用“”作為“上部”的漢字就有114個,按照“整體字”的取碼規(guī)則前4末1,單“上部”的 就占了4碼,只剩下1碼來完成114個漢字的重碼離散工作,即使是最平均地分配到0-9十個鍵位上,也會產生10組且每組有11.4個漢字的重碼。象這樣的“上部”就占用了3-4個碼,且使用頻度較高的漢字還有不少。這個問題,若得不到解決,則把漢字分成“左右字”和“整體字”,且對“左右字”的左部只取一筆畫的優(yōu)越性就會因重碼率高而無法體現出來。本發(fā)明人經過長期的研究與實踐,選出了這5組且每組形意極其相似的部件,以上的問題終于得到完滿的解決。例如,在上下、上中下、包圍結構漢字中,其“上部”或“外圍”是同一部件(如日、口、廣、廣、口)的字不少,把這些部件中的“亠、冫、”提取起來,作為一個取碼單位,就把本來必須用3-5碼來完成對這些部件的編碼,變成了只用1-3碼即可。后面還有2-4碼來離散含有這些部件漢字的其它筆畫。同時,也對含有“亠、冫、、目”這些部件的漢字的筆畫結構進行離散,做到“一箭多雕”,使所選的部件少而精。因此“左部右部”數字編碼之所以成功,與這些精選的部件來離散漢字的筆畫(部件)是分不開的。
本發(fā)明人認為把漢字分成“左右字”和“整體字”,并把“左右字”分成“左部”和“右部”是本發(fā)明的基礎,對“左右字”的左部只取一碼和選取這5組每組形狀非常相似的部件是本發(fā)明的關鍵,它們相互配合,形成了一種嶄新的編碼體系。
以3755個國標一級字為例,本發(fā)明的根本特點和重大的技術進步,可以從本發(fā)明與現有最新技術方案進行比較中可以看出來。
總之,本發(fā)明無論在“易學性”,還是在降低重碼率、提高輸入速度和使用效率方面都比現有方案有了實質性的突破,特別是“易學性”方面更是顯而易見。其推廣應用的前景可觀。
本發(fā)明所述的“左部右部筆畫數字編碼漢字電腦輸入法及其鍵盤”,其特征還于不僅要有0-9十個數字鍵,還必須要有一些鍵來作為“翻屏”、“斷碼”、“重碼選擇”、“空格”等功能鍵。例如,在PC機上,數字鍵盤上的符號鍵“*、/、+、-、del”,手機或電話上的符號鍵“*、#、
”等都可用來作為“斷碼、重碼選擇、翻屏、刪除、空格”等功能鍵。
本發(fā)明的取碼規(guī)則1、對于“左右字”,先取“左部”的第一筆畫(部件),再取“右部”的前三筆畫(部件)和最后一筆畫(部件),共5碼。不足5碼的,有多少取多少。
2、對于“整體字”,先取前四筆畫(部件),再取最后一筆畫,共5碼。不足5碼的,有多少取多少。
特別約定對于其右邊是“頁、攵、刂、阝”的“左右字”,先取“左部”的前三筆畫(部件)和最后一筆畫(部件),再取“右部”的第一筆畫(部件)。
對取碼規(guī)則的說明1、當遇到部件時,應作為一個整體,取一碼,而不能將其拆成單筆畫。
2、當遇到部件時,取碼應“取大不取小”。
3、本發(fā)明中所提到的部件必須是相對獨立的。如果其它筆畫“穿透”了該部件的任何一個部位,則該部件則不算為本發(fā)明中所述的部件。例“者”由于“丿”穿透了“土”中的“一”,所以只能取“十”作為部件。
“廣”由于“丿”沒有穿透“亠”,所以“亠”仍然作為部件。
4、本發(fā)明拆字取筆畫(部件)的方法是,對已取過的筆畫(部件)可認為它不存在。例“中”按筆畫順序取碼時,由于“丨、 ”已取過,視其不存在,剩下的部件是“十”,作為部件取之。
圖1是左部右部筆畫數字編碼所用的數字鍵盤鍵位圖。
本發(fā)明的漢字編碼例如下明009湘96809鵬00931偉81152重31251 同0101 春11649天16權利要求
1.一種左部右部筆畫數字編碼漢字電腦輸入法及其鍵盤,所述的鍵盤是數字鍵盤,它利用數字鍵盤上的1、2、3、4、5等數字鍵來分別代表漢字的橫、豎、撇、捺(點)、折五種筆畫,還可以在0-9十個數字鍵上安排組字部件;其特征在于將漢字中左右結構(含左中右)的合體字從結構上分為“左部”和“右部”兩部分,稱這些合體字為“左右字”,把其余的漢字全部看成“整體字”;由左部的第一(或第一、第二)筆畫(部件)、右部的前三筆畫(部件)及最后一筆畫(部件)構成的“左右字”漢字筆畫數字編碼,再加上“整體字”的前四筆畫(部件)和最后一筆畫(部件)的“整體字”筆畫數字編碼而形成完整的左部右部筆畫數字編碼體系,使用數字鍵盤向電腦或通訊設備輸入漢字或漢字詞語。
2.如權利要求1所述的漢字輸入法及其鍵盤,其特征在于數字鍵位1表示漢字的橫,鍵位2表示漢字的豎,鍵位3表字的撇,鍵位4表示漢字的捺(點),鍵位5表示漢字的折,鍵位6表示部件“十、ナ”,鍵位7表示部件“土、士、、艸”,鍵位8表示部件“八、亻、人、丷、 、”,鍵位9表示部件“亠、冫、氵、二”,鍵位0表示部件“、、 、匚、冂、幾、冖、、 、”,以形成筆畫(部件)的鍵盤布局并按“左右字”、“整體字”的取碼規(guī)則而構成的10鍵最大碼長為6碼的編碼輸入法。
3.如權利要求1、2所述的漢字輸入法及其鍵盤,其特征在于本發(fā)明采用了五組部分“十、ナ”,“土、士、、艸”,“八、亻、人、丷、 、”,“亠、冫、氵、二”,“、、 、匚、冂、幾、冖、、 、”作為取碼單位。遇到這些部件時,不拆成單一筆畫,只取一碼。
4.如權利要求1、2、3所述的漢字輸入法及其鍵盤,其特征在于當字集小于或等于國標一、二級字庫時,“左右字”的左部只取第一筆畫(部件),以構成10鍵最大碼長為5碼的編碼輸入法。
5.如權利要求1、2、3所述的漢字輸出入法及其鍵盤,其特征是當字集大于國標一、二級字庫時,“左右字”的左部取前二筆畫(部件),以構成10鍵最大碼長為6碼的編碼輸入法。
6.如權利要求1、2、3、4所述的漢字輸入法及其鍵盤,其特征在于數字鍵上的部件可根據字集的大小需要在鍵位之間相互調換或適當的增減。
7.如權利要求1、2、3、4、5、6所述的輸入法及其鍵盤,其特征在于使用數字鍵盤上數字鍵以外的“*、+、-、#、 del“等符號鍵或組合鍵構成功能鍵,以實現重碼選擇、斷碼、翻屏、空格引導、刪除等功能。
8.如權利要求1、2、3、4、5、6、7所述的漢字輸入法及其鍵盤,其特征在于本發(fā)明可廣泛應用于中文手機、電話機、筆記本電腦、PC機、電子記事本、電子字典、機頂盒、收款機及上網等場合。
全文摘要
一種左部右部筆畫數字編碼漢字電腦輸入法及其鍵盤,其最大的特征是將左右結構的漢字從結構上劃分為“左部”和“右部”兩個部分,把其它所有的漢字都當作“整體字”。按照取碼規(guī)則而形成10鍵5碼的左部右部筆畫漢字輸入法。本發(fā)明可應用于通訊、信息、管理、網絡等系統(tǒng)。
文檔編號G06F3/023GK1324016SQ0111117
公開日2001年11月28日 申請日期2001年4月8日 優(yōu)先權日2001年4月8日
發(fā)明者鄭巖松 申請人:鄭巖松