專利名稱:廣宇碼編碼法及其鍵盤(pán)的制作方法
二十一世紀(jì),將是漢字走向世界大放光彩的世紀(jì)。在將來(lái)的計(jì)算機(jī)信息社會(huì)中,漢字要成為一種被世界范圍內(nèi)廣泛使用的文字,就必需象英文那樣使不同國(guó)度的人把漢字方便地輸入計(jì)算機(jī)里去,并且,隨著我國(guó)經(jīng)濟(jì)的發(fā)展,計(jì)算機(jī)漢字輸入在國(guó)內(nèi)必然得到廣泛地使用。因此發(fā)明一種能使國(guó)內(nèi)外的非計(jì)算機(jī)操作人員和非專職打字人員也能快速、準(zhǔn)確、簡(jiǎn)便地把漢字輸入到計(jì)算機(jī)的漢字編碼法及鍵盤(pán),則是一個(gè)亟待解決的難題。本發(fā)明屬于漢字編碼中的一種方法。
目前,漢字輸入法甚多,約有四、五百種,但實(shí)用的不多,國(guó)內(nèi)流行的漢字計(jì)算機(jī)編碼方式有下面幾類純讀音方式,我國(guó)幅員遼闊,方言多雜,人們不認(rèn)識(shí)或讀不準(zhǔn)的字很多,因而這種漢字輸入法使用范圍受到了限制。又因?yàn)闈h字同音字太多,需要不斷地在計(jì)算機(jī)屏幕上選擇需要的字才能輸入,不可能實(shí)現(xiàn)快速盲打,因此純讀音輸入方式效率很低。由于有讀音因素,此類漢字輸入方式不能在國(guó)內(nèi)各地都得到推廣,更不能推向世界。
音形結(jié)合方式,需要掌握讀音與字形兩種因素,使得操作人員更難學(xué)習(xí)和使用。因讀音的影響,此類漢字輸入方式不能推向國(guó)際。
整字大鍵盤(pán)法,需要制做專門(mén)的設(shè)備,增加系統(tǒng)成本,而且?guī)浊€(gè)漢字?jǐn)[在面前,非專職人員找字困難,輸入漢字效率很低。
拼形輸入法,雖然操作人員掌握后能高速輸入和盲打,但是現(xiàn)行的漢字輸入法需要記憶大量字根,并且根據(jù)這些字根拆、拼漢字,很多漢字能拆分成不同的字根組合,使人們?cè)诰幋a或輸入時(shí)猶豫不決,要想熟練掌握往往需要幾個(gè)月的時(shí)間,造成此類方法的推廣普及受到難記難掌握兩大缺點(diǎn)的阻礙。此類方法對(duì)非漢語(yǔ)國(guó)家基本不能使用。
目前,比較先進(jìn)的漢字編碼法是王永民發(fā)明的《優(yōu)化五筆字形編碼法及其鍵盤(pán)》,中國(guó)專利CN85100837.A,需要記憶217個(gè)字件,其中包括130種字根,這樣大量的字根集使人難以記憶。對(duì)于非專業(yè)人員要熟練掌握運(yùn)用其所規(guī)定的字根集,去拆分漢字進(jìn)行編碼很困難,一般需要幾個(gè)月的學(xué)習(xí)才能掌握。在國(guó)內(nèi)五筆字形輸入法雖然占領(lǐng)了大量計(jì)算機(jī)市場(chǎng),但是,非專職的操作人員和非專職的打字人員使用得不廣泛,主要原因就是這種輸入法要求操作者記憶大量的字根,不確定的字根組合阻礙了這種字根拼形的漢字輸入法的推廣應(yīng)用,限制了這種方法的使用范圍。而且這種方法不容易推向國(guó)際,原因是外國(guó)人相當(dāng)難記憶字意關(guān)連性不大的217個(gè)字件,更難運(yùn)用它們拆分、編碼輸入漢字。這種編碼方法僅使用計(jì)算機(jī)標(biāo)準(zhǔn)鍵盤(pán)上A-Y的25個(gè)字母鍵為漢字輸入鍵,數(shù)量少,可提供組合漢字代碼的數(shù)量少。
為了解決優(yōu)化五筆字型編碼法有大量難以記憶的字根,非專職人員或不同語(yǔ)種的人員難學(xué)習(xí),難掌握的缺點(diǎn),本發(fā)明提供一種有30個(gè)可供輸入漢字鍵位的編碼法,使人們將漢字輸入計(jì)算機(jī)時(shí)既不需要知道漢字的讀音,也不需要記憶大量的字根集,有一般漢字基礎(chǔ)知識(shí)的人,就能在兩個(gè)小時(shí)內(nèi)掌握并能方便地將漢字輸入計(jì)算機(jī),熟練后能夠達(dá)到高速盲打,實(shí)現(xiàn)每分鐘輸入150個(gè)左右漢字的輸入目標(biāo)。這樣能使專業(yè)和非專業(yè)計(jì)算機(jī)輸入人員和其他語(yǔ)種的人員都易于接受,容易掌握,能使?jié)h字推向世界,也能使計(jì)算機(jī)漢字輸入技術(shù)在中華大地得到更大面積的普及。
本發(fā)明的特征是把漢字按拆分字塊規(guī)則拆分成若干字塊,以每個(gè)字塊的第一筆五種筆劃和第二筆六種筆劃的三十種順序組合碼對(duì)應(yīng)標(biāo)準(zhǔn)計(jì)算機(jī)鍵盤(pán)的一個(gè)字符鍵上,另外有十-十五個(gè)定義字塊設(shè)定在字符鍵上,根據(jù)漢字所拆分字塊的前兩筆劃的順序組合碼、定義字塊對(duì)應(yīng)鍵位進(jìn)行編碼。達(dá)到或超過(guò)四個(gè)字塊的漢字,只取四碼。不足三個(gè)字塊的漢字需要補(bǔ)碼,取四種字型和六種角位筆劃結(jié)合成的二十四種識(shí)別補(bǔ)碼之一,進(jìn)行補(bǔ)碼的漢字編碼法。這就是本發(fā)明的整體夠思,一種完整的漢字編碼的方法。
字塊筆順第一筆有五種筆劃,橫(一)、豎(丨)、撇(丿)、捺(丶)、折(乙)。字塊筆順的第二筆有六種筆劃,橫(一)、豎(丨)、撇(丿)、捺(丶)、順折()、逆折(ㄥ)。如
圖1、圖2所示。字塊的每種前兩筆筆劃順序組合對(duì)應(yīng)一個(gè)順序組合碼。第一、第二筆劃的順序組合碼有三十種,把它們對(duì)應(yīng)定義到標(biāo)準(zhǔn)鍵盤(pán)的三十個(gè)字符鍵上,如圖5所示。
十三個(gè)定義字塊是“口、日、目、田、木、言、金、扌、糹、石、
、王、钅”定義到字符鍵上,如圖5所示。
二十四種識(shí)別補(bǔ)碼是由四種字型和六種角位筆劃組合而成。把它們定義到標(biāo)準(zhǔn)鍵盤(pán)的二十四個(gè)字符鍵上,如圖6所示。
這樣把一個(gè)標(biāo)準(zhǔn)鍵盤(pán)改造成為一個(gè)直觀易學(xué)、分布有規(guī)律的中文輸入鍵盤(pán)。在每個(gè)鍵盤(pán)帽上,可以粘貼一個(gè)印有該鍵位相對(duì)應(yīng)的筆劃順序組合的代碼和定義字塊,以及印有高頻漢字和印有計(jì)算機(jī)原鍵盤(pán)鍵位的字符的標(biāo)簽(圖7、圖8)。使用這樣的鍵盤(pán),可以向計(jì)算機(jī)輸入一、二級(jí)漢字及其繁體字,總共上萬(wàn)個(gè)漢字、四萬(wàn)多條詞匯。
本發(fā)明的優(yōu)點(diǎn)是,把漢字拆分成若干個(gè)字塊,按本拆分字塊的規(guī)則進(jìn)行拆分,使拆出的結(jié)果是唯一的。以字塊的前兩筆的順序組合碼、十三個(gè)定義字塊結(jié)合二十四個(gè)識(shí)別補(bǔ)碼進(jìn)行編碼,這樣的編碼方法能使?jié)h字輸入人員不需要記憶大量的字根,在知道橫、豎、撇、捺、折(順折、逆折)幾種基本筆劃,懂得漢字字型,掌握本發(fā)明提出的簡(jiǎn)單筆順規(guī)則和分字塊的規(guī)則,記住定義在鍵盤(pán)上的定義字塊,即使沒(méi)有操作過(guò)計(jì)算機(jī)的人學(xué)習(xí)兩個(gè)小時(shí)后,也能方便地進(jìn)行漢字輸入。本發(fā)明使?jié)h字輸入直觀易學(xué),操作簡(jiǎn)便輸入速度快。由于采用標(biāo)準(zhǔn)鍵盤(pán)的30個(gè)鍵位輸入漢字,比25個(gè)鍵位輸入的重碼率低。經(jīng)本編碼法編排,每個(gè)字塊的前兩筆的筆順組合對(duì)應(yīng)一個(gè)計(jì)算機(jī)鍵位,三十種筆劃順序組合碼在鍵盤(pán)上的排列分布,規(guī)律性很強(qiáng),輸入漢字時(shí)使用頻度高的鍵位絕大部分處于靈活手指控制之下,方便操作,只要熟悉了這種規(guī)律,就可以根據(jù)筆劃的順序組合碼,馬上找到相應(yīng)的鍵位。由于使用30個(gè)鍵位輸入漢字,可以輸入一、二級(jí)漢字及其繁體字上萬(wàn)個(gè)和四萬(wàn)多條詞匯,一般人員熟練后,每分鐘可以輸入大約150個(gè)漢字,使?jié)h字快速輸入成為普通人員也能掌握的技術(shù)。
說(shuō)明書(shū)附圖的說(shuō)明圖1、字塊的第一筆筆劃代號(hào)2、字塊第二筆筆劃和識(shí)別補(bǔ)碼角位筆劃的代號(hào)3、漢字的四種字型代號(hào)和字例圖4、字塊拆分次序5、字塊前兩筆筆劃順序組合碼及定義字塊共容6、識(shí)別補(bǔ)碼7、GY1系統(tǒng)定義字塊、高頻漢字和順序組合碼共容的中文鍵盤(pán)圖8、GY2系統(tǒng)定義字塊、高頻漢字和順序組合碼共容的中文鍵盤(pán)下面具體說(shuō)明順序組合碼和識(shí)別補(bǔ)碼的取法。
一、順序組合碼的取法字是由字塊所組成,把漢字拆分成若干字塊。按本發(fā)明的規(guī)則拆分具有唯一性。這種拆分方法對(duì)中、外的使用者很容易掌握。
拆分字塊的規(guī)則(以拆分第一字塊為例)1、漢字字塊是由兩筆或兩筆以上的筆劃組成的筆劃群體;
2、漢字中的筆劃關(guān)系有相交、相連和不交不連三種方式組合。筆劃之間相互交叉稱之為相交,例如“十”字的橫(一)和豎(丨)的相互關(guān)系為相交。筆劃相互接觸但不交叉稱之為相連,例如“上”字的豎(丨)和橫(一)的相互關(guān)系為相連。筆劃之間不相交也不相連的筆劃稱之為不交不連或獨(dú)立筆劃。例如“流”字的“氵”兩個(gè)點(diǎn)“丶”,“三”字各筆劃都為不交不連,是獨(dú)立筆劃。相交筆劃是不能拆分到兩個(gè)字塊中的,相連筆劃拆分到兩個(gè)字塊中是有原則的。
3、漢字所拆分成的字塊是有順序的,如圖4所示。例如“位”字是左右型漢字,字塊順序?yàn)?“亻”,2“亠”,3“
”;“府”字的字塊順序?yàn)椤皬V”第一字塊,“亻”第二字塊,“寸”第三字塊。
4、每一筆劃只能屬于一個(gè)字塊。
5、拆分字塊規(guī)則主則取第一個(gè)字塊位置的最高最左的一筆,再取比這一筆劃低的這一筆劃下方的所有筆劃(如果有筆劃和這一筆劃相交或相連,則所有筆劃是指和這一筆劃相交或相連的那些筆劃)中,位置最高最左的一筆筆劃。以這兩筆筆劃以及和這兩筆筆劃相交的筆劃的橫向總長(zhǎng)度為寬,以這兩筆筆劃以及和這兩筆筆劃相交的筆劃的縱向總長(zhǎng)度為長(zhǎng)的長(zhǎng)方形范圍內(nèi)的筆劃群體為第一字塊。
拆分字塊規(guī)則主則基本能確定字塊所占的范圍。下面副則規(guī)定了一些特殊情況的處理。
拆分字塊規(guī)則副則一符合下列情況之一的筆劃為第一字塊的筆劃。(1)、有一筆劃伸入第一字塊長(zhǎng)方形范圍內(nèi)和長(zhǎng)方形范圍內(nèi)的筆劃相連,而和其它筆劃不相交也不相連;(2)、有一筆劃絕大部分伸入第一字塊的范圍內(nèi);(3)、有一橫處于第一字塊長(zhǎng)方形范圍的底線上和這一范圍內(nèi)的筆劃相連,而不和其它筆劃相交;(4)、獨(dú)立筆劃緊挨處于第一字塊下方,且不能和其它筆劃組成字塊。符合上述四種情況之一的筆劃以及和這一筆劃相交的筆劃,都屬于第一字塊的筆劃。但如果有一點(diǎn)“丶”處于第一字塊長(zhǎng)方形范圍內(nèi)的底線上并能和其下方筆劃組合字塊則不屬于第一字塊的筆劃。例如“表”字第一字塊為“”,而不是“
”?!耙u”字第一字塊為“龍”。“紡”字的第一字塊是“纟”,而不是“
”?!斑@”字的第一字塊為“辶”。
拆分字塊規(guī)則副則二喇叭口形狀字塊,如“大”、“八”、“人”、“父”、“亼”,喇叭口處看作上下字塊的分界處。例如“介”字是由“人”和“
”兩個(gè)字塊組成;“合”字是由“亼”、“口”兩個(gè)字塊組成。
拆分字塊規(guī)則副則三包型漢字及包型字塊取外層為次序靠前字塊,剩余部分按其結(jié)構(gòu)特點(diǎn),依次分塊。
拆分字塊規(guī)則副則四十三個(gè)定義字塊是“口、日、目、田、木、扌、糹、金、王、言、
、石、钅”,被認(rèn)為是特定的筆劃群體,是一個(gè)整體。定義字塊獨(dú)立為一字塊,編碼輸入要鍵入定義字塊所對(duì)應(yīng)的字符鍵。有些字塊,如“里”、“
”、“果”,定義字塊位于這些字塊的頭部,編碼輸入要鍵入定義字塊所對(duì)應(yīng)的字符鍵。
分字塊規(guī)則副則五一個(gè)字塊不能被另一個(gè)字塊分隔開(kāi)。
按照上述規(guī)則取完第一字塊后,對(duì)剩余筆劃按字塊順序以同樣方法取第二字塊,依次類推。按上述的主則、副則處理漢字,拆分出字塊的結(jié)果是唯一的。
漢字分字塊舉例“華”字由字塊“亻”、“七”、“十”組成;“北”是由字塊“
”、“匕”組成;“管”字由字塊“
”、“
”、“宀”、“コ”組成;“理”字由字塊“王”、“里”組成;“局”字由字塊“尸”、“
”組成;“第”字由字塊“
”、“
”、“
”組成;“二”字由字塊“二”組成;“中”字由字塊“中”組成;“學(xué)”字由字塊“
”、“冖”、“子”組成;“成”字由字塊“戈”、“
”組成;“兇”字由字塊“凵”、“乂”組成;“古”字由字塊“十”、“口”組成;“這”字由字塊“辶”、“亠”、“乂”組成;“芳”字由字塊“艸”、“亠”、“
”組成;“踐”字由字塊“口”、“止”、“戔”組成;“物”字由字塊“牜”、“勹”、“
”組成;“問(wèn)”字由字塊“門(mén)”、“口”組成;“風(fēng)”字由字塊“幾”、“乂”組成;“病”字由字塊“疒”、“丙”組成或看成由“亠”、“
”、“丙”組成。
筆順規(guī)則為了編碼時(shí)便于取碼,使國(guó)內(nèi)外人員都能方便地使用,本發(fā)明按工程心理學(xué)的觀點(diǎn),以“先上后下,先左后右,先折后它”筆順規(guī)則,使編碼時(shí)取前兩筆的順序組合形狀更加形象直觀。
1、“先上后下”是指字塊的筆劃群里,筆劃最高點(diǎn)位置高的筆劃次序排在筆劃最高點(diǎn)位置低的筆劃之前。例如“劃”字的“刂”字塊的筆劃次序?yàn)橄日邸柏?,后豎“丨”。
2、“先左后右”是字塊的筆劃群中,對(duì)同一高度的筆劃之間,筆劃的最左端位置靠左的筆劃次序在前。例如“芳”字的“艸”字塊的前兩筆的筆劃為先豎(丨),后還是豎(丨)。
3、“先折后它”是指字塊的筆劃群里,筆劃的最高點(diǎn)處于同一高度的若干筆劃中,折形筆劃的次序在前。例如“同”字的“冂”字塊,筆劃次序?yàn)橄日?)后豎(丨)。
字塊筆順的第一筆分五種橫(一)、豎(丨)、撇(丿)、捺(丶)、折(、ㄥ),并依次命以阿拉伯?dāng)?shù)字1、2、3、4、5為代碼。如圖1所示。記憶方法為橫1、豎2、3撇、4捺、5折。字塊筆順的第二筆分六種橫(一)、豎(丨)、撇(丿)、捺(丶)、順折()、逆折(ㄥ),并依次命以阿拉伯?dāng)?shù)字1、2、3、4、5、6為代碼。如圖2所示。記憶方法橫1、豎2、3撇、4捺、5順、6逆折。
筆劃點(diǎn)“丶”應(yīng)歸入捺(
)一類。順折是指書(shū)寫(xiě)筆劃拐彎處全都是向順時(shí)針?lè)较蜣D(zhuǎn)的折筆劃,其余的折筆劃為逆折。例如順折有“亅、
、
、”等,逆折有“
、
、乙、
、ㄥ”等。
每個(gè)字塊(除定義字塊)按筆順規(guī)則取前兩筆劃的順序組合碼設(shè)定在一個(gè)字符鍵上。這樣用三十個(gè)字符鍵完成漢字字塊的編碼。排列位置如圖5。
二、識(shí)別補(bǔ)碼的取法按規(guī)則拆分字塊,少于三個(gè)字塊的漢字,應(yīng)在其筆劃順序組合碼輸入完成后補(bǔ)上一個(gè)識(shí)別補(bǔ)碼,直到補(bǔ)足三碼為止。識(shí)別補(bǔ)碼是由該漢字的字型代號(hào)和最后一個(gè)字塊的右下角或左下角角位筆劃的代號(hào)組合而成。
1、字型代號(hào)漢字分四種字型,包型、單塊型、左右型、上下型。左右型漢字的特征是能被豎線分開(kāi)。例如“擺、打、樹(shù)”上下型漢字的特征是能被橫線分開(kāi),不能被豎線分開(kāi)。例如“型、品、貧”。單塊型漢字的特征是整個(gè)漢字為一個(gè)字塊,而且按規(guī)則不能把整個(gè)漢字分成兩個(gè)字塊。例如土、五、女、力、丸都是單塊型漢字。包型結(jié)構(gòu)的漢字的特征是筆劃群體可以分為兩個(gè)層次,一個(gè)包圍層,另一個(gè)是被包圍層,兩層的連接比較松散,包圍層占去整個(gè)漢字的三個(gè)角以上。例如問(wèn)、風(fēng)、這、府、病、貳、屬、房、國(guó)、同、句、毯、建、問(wèn)、厘、慮、戎、戚都屬于包型字,它們的包圍層分別是門(mén)、幾、辶、廣、疒、弋、尸、戶、囗、冂、勹、毛、廴、門(mén)、廠、
、戈、戊。依據(jù)包型、單塊型、左右型、上下型四種字型的使用頻度,依次命以阿拉伯?dāng)?shù)字1、2、3、4作為四種字型的代號(hào)。
2、漢字最后字塊的左下角或右下角的角位筆劃代號(hào)左下角或右下角筆劃可以分為橫(一)、豎(丨)、撇(丿)、捺(丶)、順折()、逆折(ㄥ)六種,并依次命以阿拉伯?dāng)?shù)字1、2、3、4、5、6為代碼,如圖2所示。如果有兩筆劃共角,取筆劃最低的一筆為角位筆劃。
這樣字型代號(hào)和角位筆劃代號(hào)組合成二十四種視別補(bǔ)碼,分別設(shè)定在二十四個(gè)鍵位上,如圖6所示。按漢字分塊規(guī)則少于三塊的,應(yīng)在其筆劃順序碼后邊,補(bǔ)上一個(gè)字型代號(hào)和最后字塊的右下角角位筆劃結(jié)合的識(shí)別補(bǔ)碼。若補(bǔ)上一個(gè)識(shí)別補(bǔ)碼后還不足三碼,則再補(bǔ)上一個(gè)字型代號(hào)和最后字塊的左下角角位筆劃結(jié)合的識(shí)別補(bǔ)碼,這樣對(duì)漢字編碼時(shí),補(bǔ)足三碼后再加上一個(gè)空格鍵即完成編碼。例如“權(quán)”取木(14),又(54),34(字型代號(hào)3,角位筆劃代號(hào)4)“本”取本(21),24(字型代號(hào)2,角位筆劃代號(hào)4),23(字型代號(hào)2,角位筆劃代號(hào)3)本發(fā)明有兩套編碼體系,GY1系統(tǒng)和GY2系統(tǒng)。GY1系統(tǒng)能處理上萬(wàn)個(gè)簡(jiǎn)、繁體漢字和四萬(wàn)多條簡(jiǎn)體漢字的詞匯。GY1系統(tǒng)編碼碼長(zhǎng)最長(zhǎng)為四碼,編碼庫(kù)需要16位機(jī)1兆字節(jié),詞匯庫(kù)需要大約0.2兆字節(jié),字的選形庫(kù)采用國(guó)家標(biāo)準(zhǔn)的GB-2312(80)中字庫(kù),再加上1000多個(gè)繁體字。GY2系統(tǒng)只能處理一、二級(jí)簡(jiǎn)體漢字,適合低擋微型計(jì)算機(jī),GY2系統(tǒng)的編碼碼長(zhǎng)為三碼,編碼庫(kù)為虛庫(kù),不占內(nèi)存,漢字選形可采用磁盤(pán)存儲(chǔ)。這樣低擋微機(jī)采用GY2系統(tǒng),也能高速輸入漢字。
GY1系統(tǒng)的漢字、同編碼對(duì)所有的國(guó)標(biāo)一、二級(jí)漢字及其繁體漢字,按分塊規(guī)則分塊。取第一、二、三和最后一個(gè)字塊參加編碼。分塊少于三個(gè)字塊的漢字,按識(shí)別補(bǔ)碼的規(guī)則補(bǔ)足三碼為止。凡遇到十三個(gè)定義字塊取碼應(yīng)取定義字塊對(duì)應(yīng)的字符鍵。不足四碼的最后鍵入空格鍵。
高頻字的輸入在30個(gè)字符鍵的右上角都設(shè)有一個(gè)高頻字,如圖7所示。輸入高頻字時(shí)可先鍵入高頻字所對(duì)應(yīng)的字符鍵,再加打空格鍵。
次高頻字的輸入對(duì)容易以單個(gè)字出現(xiàn),且使用頻度較高的漢字,可以先打入編碼的前兩鍵,后加一個(gè)空格鍵。
對(duì)規(guī)定的十三個(gè)定義字塊,“口、日、目、田、木、扌、糹、言、金、王、石、
、钅”,“金、目”為鍵入三次對(duì)應(yīng)鍵加空格鍵,其余鍵入四次對(duì)應(yīng)鍵。如“目”鍵入“F、F、F、空格”;“口”鍵入“H、H、H、H”。
字符和空格的處理由于四個(gè)筆劃順序組合碼占用了標(biāo)點(diǎn)鍵,輸入字符和空格時(shí),先鍵入空格鍵給計(jì)算機(jī)一個(gè)信號(hào),再打需要輸入的字符鍵或空格鍵。
兩字詞的編碼取第一個(gè)字的前兩碼和第二個(gè)字的前兩碼。例如“先進(jìn)”依次取“
、兒、辶、井”四個(gè)字塊的前兩筆順序組合碼“23、36、46、32”其對(duì)應(yīng)鍵為“X”、“,”、“?!?、“D”。
三字詞匯的編碼取其第一、第二個(gè)漢字的第一碼和第三個(gè)漢字的前兩碼。例如“辦公室”取“辦、八、宀、
”四個(gè)字塊,其代碼為“K、I、L、W”(35、34、45、21)。又如“范圍廣”取“艸、囗、廣”三個(gè)字塊,其鍵位為“S、G、R、X”(22、52、41、23),其中“X”(23)為第三個(gè)字的識(shí)別補(bǔ)碼。
四字以上詞匯的編碼取其前三個(gè)字和最后一個(gè)字的第一碼。如“通用編碼”取“辶、冂、纟、石”四個(gè)字塊,鍵位“。、B、/、,”(46、53、56、36)。
GY2系統(tǒng)的漢字編碼類似于GY1系統(tǒng)的漢字編碼,但限定碼長(zhǎng)為三碼,取字的第一、第二和最后字塊參加編碼。GY2系統(tǒng)的定義字塊和GY1的也有所不同,去掉了“言、糹、金”三個(gè)繁體定義字塊,增加了“禾、衤、辶”定義字塊,如圖8所示。輸入“目、魚(yú)”時(shí)鍵入三次對(duì)應(yīng)鍵,加打空格鍵,其余定義字塊輸入時(shí),連打四次對(duì)應(yīng)鍵。補(bǔ)碼規(guī)則、高頻字輸入、次高頻字輸入、字符輸入如同GY1系統(tǒng)。
當(dāng)字編碼取碼模糊時(shí),可以用“A”鍵代替;當(dāng)詞編碼取碼模糊時(shí),可用“M”鍵代替。單筆劃字第一碼取筆劃對(duì)應(yīng)的識(shí)別補(bǔ)碼。例如“一”字取碼“W、W、W”(21、21、21)重碼的處理由于詞匯量大,重碼是不可能避免的。出現(xiàn)重碼時(shí)計(jì)算機(jī)發(fā)出一聲報(bào)警聲。有兩個(gè)萬(wàn)能鍵“-”鍵和“0”鍵。系統(tǒng)程序可對(duì)所鍵入的編碼利用萬(wàn)能鍵改造成新編碼,自動(dòng)進(jìn)行查找并顯示在顯示行的正常編輯位置上。常用字在前,其余字詞在后。若繼續(xù)鍵入下文,第一個(gè)字便顯示在正常編輯位置上;若用其它字詞,只需鍵入與該字相對(duì)應(yīng)的數(shù)字鍵,所需的字、詞即可顯示在現(xiàn)行編輯位置上。若出現(xiàn)空碼,計(jì)算機(jī)將發(fā)出兩聲報(bào)警聲。
中文字、詞典編排查字法本發(fā)明為字、詞典提供了簡(jiǎn)便、易行、快速的編排查字法。尤其是對(duì)大型詞典查閱詞條提供了快速簡(jiǎn)便的查字法。以往,詞典的查找方法是先根據(jù)部首和筆劃數(shù)查到字,再據(jù)詞第二個(gè)字的筆劃數(shù)查到詞。查找起來(lái)不方便。對(duì)大型詞典來(lái)說(shuō),檢字表在其中一分冊(cè)上,這就更增加了不便。
本發(fā)明提出的編排查字法如下對(duì)字按本發(fā)明規(guī)則取前三個(gè)字塊參加編碼,詞取第一個(gè)字的前三碼和第二個(gè)字的前一碼或前兩碼。按這個(gè)編碼的字母順序?yàn)榫幣彭樞蜃鳛樽帧⒃~在字、詞典中的順序。前三碼印刷在書(shū)的左上角或右上角。這樣可根據(jù)編碼直接查找到字、詞,而且不認(rèn)識(shí)的字詞也可以直接查到,不需再用專門(mén)的檢字表。
為了快速輸入漢字,必需以詞組輸入為主。這就要求編碼系統(tǒng)提供大量詞匯,本發(fā)明在盡可能避免重碼的前提下,提供了四萬(wàn)多條詞匯。并將所有簡(jiǎn)、繁體漢字編碼和部分詞匯編碼匯編成冊(cè)。本發(fā)明還提供了詞匯擴(kuò)充功能。擴(kuò)充詞匯的編碼格式和編碼系統(tǒng)提供的詞匯相同。用戶可以手工或使用詞匯增刪軟件,完成詞匯擴(kuò)充和刪減,并把詞匯建立在編碼系統(tǒng)中。為了避免擴(kuò)充詞匯和原有的系統(tǒng)詞匯重碼,可按下列方法處理擴(kuò)充詞匯編碼加入“;”鍵(55)或“P”鍵于編碼的四個(gè)碼中,其中的第一、第二或第三個(gè)碼為“P”鍵或“;”鍵,其余三碼是按編碼系統(tǒng)詞匯的編碼規(guī)則進(jìn)行編碼。一般只需采用第一碼為“P”鍵或“;”鍵,再加詞匯的前三個(gè)編碼。形成的擴(kuò)充容量即可夠擴(kuò)充幾千條詞匯使用。
本發(fā)明提出的漢字編碼處理方法,本質(zhì)上是依字形對(duì)漢字進(jìn)行編碼的。它吸收了一些編碼方法的優(yōu)點(diǎn),克服了以往拼形編碼法需要記憶大量字根的缺點(diǎn),使?jié)h字編碼方式有了重大突破。具有相同的前兩筆順序組合的字塊,頭部具有相近的形狀,有利于記憶掌握,在使用本發(fā)明時(shí)提高輸入速度,例如“艸、廿、甘、
、業(yè)、止”等,這些字塊的頭部具有極為相近的形狀;又如“亻、千、禾、釆、重、壬”,也是如此。因此從工程心理學(xué)的觀點(diǎn)來(lái)看,本發(fā)明極容易掌握,能使?jié)h字輸入速度提高。本發(fā)明適用于一切大、中、小、微型計(jì)算機(jī)中文信息處理系統(tǒng),并將在中文終端、中文電傳、電腦打字和計(jì)算機(jī)漢字排版印刷、字詞典的編排查閱等方面獲得廣泛應(yīng)用。
權(quán)利要求
1.一種漢字編碼方法,其特征在于把漢字按拆分字塊規(guī)則拆分成若干字塊,把字塊的第一筆五種筆劃和第二筆六種筆劃的順序組合碼,對(duì)應(yīng)定義在標(biāo)準(zhǔn)計(jì)算機(jī)鍵盤(pán)的字符鍵上,共三十種筆順組合碼定義在三十個(gè)字符鍵上,另外設(shè)定十一十五個(gè)定義字塊在字符鍵上,依漢字所拆分字塊的順序?qū)ψ謮K按筆順規(guī)則取其前兩筆劃的順序組合碼和定義字塊對(duì)應(yīng)的鍵位進(jìn)行漢字編碼,達(dá)到或超過(guò)四個(gè)字塊的漢字只取四碼,不足三個(gè)字塊的漢字需要補(bǔ)碼,取漢字的四種字型和六種角位筆劃結(jié)合的二十四種識(shí)別補(bǔ)碼之一,進(jìn)行補(bǔ)碼,形成一套編碼體系。
2.漢字編碼法的鍵盤(pán)排列圖,其特征在于根據(jù)漢字字塊第一筆和第二筆劃的順序組合碼、十三個(gè)定義字塊、三十個(gè)高頻漢字設(shè)定在計(jì)算機(jī)標(biāo)準(zhǔn)鍵盤(pán)上。
3.如權(quán)利要求1所述的漢字編碼法,其特征在于字塊的第一筆劃有五種基本筆劃,即橫、豎、撇、捺、折,并分別命以代號(hào)1、2、3、4、5;字塊的第二筆劃有六種基本筆劃,即橫、豎、撇、捺、順折、逆折,并分別命以代號(hào)1、2、3、4、5、6,第一筆劃和第二筆劃的筆順組合碼共三十種。
4.如權(quán)利要求1、3、所述的漢字編碼法,其特征在于字塊的筆劃順序?yàn)椤跋壬虾笙?,先左后右,先折后它”?br>
5.如權(quán)利要求1、3所述的漢字編碼法,其特征在于漢字的四種字型為包型、單塊型、左右型、上下型四種,分別命以代號(hào)為1、2、3、4,六種角位筆劃是漢字最后一個(gè)字塊的角位筆劃,即橫、豎、撇、捺、順折、逆折,并分別命以代號(hào)為1、2、3、4、5、6,二十四種識(shí)別補(bǔ)碼就是由四種字型代號(hào)和六種角筆筆劃代號(hào)的組合而成。
6.如權(quán)利要求1所述的漢字編碼法,其特征在于在GY1系統(tǒng)中對(duì)一、二級(jí)漢字及其對(duì)應(yīng)的繁體漢字和詞組進(jìn)行同一形式編碼。
7.如權(quán)利要求1所述的漢字編碼法,其特征在于GY1系統(tǒng)有十三個(gè)定義字塊,輸入“金、目”兩個(gè)定義字塊時(shí),連擊三次對(duì)應(yīng)鍵,加打一個(gè)空格鍵,輸入其余的定義字塊連擊四次對(duì)應(yīng)鍵。
8.如權(quán)利要求1所述的漢字編碼法,其特征在于三十個(gè)高頻漢字輸入時(shí),先擊一次對(duì)應(yīng)鍵,加擊一次空格鍵。
9.如權(quán)利要求1所述的漢字編碼法,其特征在于在GY1系統(tǒng)中,對(duì)于超過(guò)三個(gè)字塊組成的漢字只取其第一、第二、第三和最后一個(gè)字塊參加編碼。
全文摘要
本發(fā)明屬于一種純字形的漢字編碼方法。提出了字塊的概念、新筆順規(guī)則、四種字型和六種筆劃、簡(jiǎn)繁兼容和字詞兼容原理,將漢字按規(guī)則拆分成若干字塊,依字塊順序按新筆順規(guī)則取字塊的第一筆和第二筆劃的順序組合碼,結(jié)合定義字塊對(duì)應(yīng)鍵和識(shí)別補(bǔ)碼進(jìn)行漢字編碼。無(wú)記憶量、碼長(zhǎng)短、重碼少、鍵位使用概率分布合理、輸入速度高。使?jié)h字輸入如同英文輸入一樣簡(jiǎn)單。世界各國(guó)的使用者都能很容易掌握,使?jié)h字輸入技術(shù)走向國(guó)際。
文檔編號(hào)G06F3/023GK1063566SQ9110506
公開(kāi)日1992年8月12日 申請(qǐng)日期1991年7月29日 優(yōu)先權(quán)日1991年7月29日
發(fā)明者祁淑悅, 袁守玲 申請(qǐng)人:祁淑悅, 袁守玲