專利名稱:拼音四角筆碼(形)漢字輸入法及其鍵盤設計的制作方法
技術領域:
本發明是用于中文信息領域里的一個以“新華字典”全部部首加四角筆碼為基礎,并和漢字聲母相結合的信息處理漢字輸入法及其鍵盤設計。
公開發表的幾百種漢字輸入法,基本上可以分為純音碼、形碼、音形結合碼三大類編碼。純音碼有不需要學習,記憶量少的優點,但同時存在著單字重碼多,輸入慢,普通話說的不好的人和不認識的字無法輸入的缺點。由王永民先生發明的“五筆字型”是一種最為典型的純形碼,五筆字型有重碼少,輸入快不認識的字同樣能輸入,特別適合于專業打字員進行漢字輸入等優點,但卻存在著必須拆分漢字,必須記住近二百個字根,部首和字母鍵的對應關系,記憶量較大,不經常進行漢字輸入的人,用起來很不方便的缺點。由周志農先生發明的“自然碼”是最為典型的一種音形結合碼,由于引進了形碼的部首、字根,單字同碼現象大為改少,但必須記住一部分部首和字根同字母鍵的對應關系,同音碼相比增加了學習難度,普通話說的不好及不認識的字,同音碼一樣無法輸入。
本發明的目的是提出一個不但能夠克服上述三大類型編碼各種缺點的優秀輸入法,而且再能適用于各種不同層次,不同情況,不同需要,普通話講的差的人能使用,講的好的更能使用,年齡大的能使用,年齡輕的更能使用,由于它記憶量極小,十分易學,所以偶爾需要輸入漢字者能用,又由于其重碼極少,輸入簡捷,專職打字員也能用它進行高速輸入漢字,經過短時訓練就能熟練,一旦熟練終生不忘。
我們平常使用的漢字都是有橫(提)、豎、撇、捺(點)、折五大類筆劃所構成的,本輸入法分別用五種數碼1、2、3、4、5來表示這五大類筆劃,方塊漢字有四個角,有可能取得4個筆碼,本說明書為了便于使人了解取碼過程和順序,規定分別用①②③④為四個角所取筆碼的專用符號,例“共”字①共共②本輸入法優先取最高筆劃,所以①②所取四角筆劃組合碼(即為四角筆碼,下文不再特別指出)為22,③共④③④所取四角筆劃組合碼為34,根據附
圖1,22對應X鍵34對應于J鍵,“共”字屬部首“八”部(B鍵),“共”字聲母為G,所以“共”字編碼為XJBG。
鍵盤區位劃分和四角筆碼在鍵盤上的布局。漢字每角有可能抽取到五種筆劃,二角合起來有可能取得25種筆劃組合碼,(四角筆碼)并且字根“口”也算作一種筆劃組合碼其四角筆碼為61,26個四角筆碼分配在鍵盤的26個字母鍵上,具體分配如下P-11,O-12,I-13,U-14,Y-15,Z-21,X-22,C-23,V-24,B-25,M-31,L-32,K-33,J-34,H-35,A-41,S-42,D-43,F-44,G-45;Q-51,W-52,E-53,R-54,T-55,N-61。26個字母鍵位分為6個區,l至五區每區五個鍵位,N單獨為第6區,一區由P、O、I、U、Y五鍵組成,二區由Z、X、C、V、B五鍵組成,三區由M、L、K、J、H五鍵組成,四區由A、S、D、F、G五鍵組成,五區由Q、W、E、R、T五鍵組成,六個區的布局特征是一、二對頂(一、二區安置在鍵盤二個對頂角位置),橫向平衡(最大的單數區和最小的單數區及最大的雙數區和最小的雙數區安排在同一橫行)三、四中間(三、四區安排在鍵盤中間行)漢字聲母同字母鍵對應關系漢語拼音中的聲母CH、SH、ZH三個雙字母聲母,用I、U、V字母鍵代換,韻母YA、YAO、YE、YI……由于首字母都是y字母,所以認為這些韻母前面有個y聲母,用y鍵表示,韻母WA、WO、WU……由于首字母都是W字母,所以認為這些韻母前都有一個W聲母,用W鍵表示,其它只有韻母,沒有聲母的音節,可以認為在這些韻母前有一個零聲母,用O鍵表示,其它聲母都用和聲母同樣的字母鍵表示。
“新華字典”所采用部首在鍵盤上的布局中國漢字達數萬之多,各種部首字根八、九百之多。各種不同的字典所采用的部首都各不相同,各種不同的輸入法,為各自編碼需要,所采用的部首字根,更象萬花洞似的,什么都有,廣大中國人到底對哪一套部首字根最為熟悉和了解,毫無疑問,對“新華字典”所采用的那套部首最為了解,客觀事實上也只有“新華字典”所采用的那套部首對漢字的劃分最為規范,最為科學,最具權威。部首和字母鍵建立如何對應代換關系,會使記憶量降到最小極限,毫無疑問,把有讀音有傳統稱謂的部首和其讀音的聲母鍵建立對應代換關系,例部首“木”和“木”字的聲母M鍵,部首“亻”和“人”字的聲母“R”鍵建立對應代換關系。少數無讀音,無傳統稱謂的部首,按其首筆劃和次筆劃組成的筆劃組合碼,落實到相同四角筆碼所對應的字母鍵上去,只有這樣部首和字母鍵的對應關系的記憶量幾乎降為零,本輸入法采用的部首全部和“新華字典”采用的部首相同,并且幾乎全部都是根據讀音,和其對應的聲母字母鍵建立代換關系。部首和字母鍵的對應關系如下所述P魚(魚)-片爿(丬)皮疋 髟丿,O-扌,I(CH)-蟲車(車)廠臣赤齒(齒)辰廾,U-山饣(食)守(示)尸十水(氺) 手殳矢舌豕身鼠丨,Y-月 衤酉又(ㄡ)尢業用弋幺衣頁(頁)羊( )羽音乙聿(肀 )雨 Z-足()走子(孑)自攴,X-心忄()穴辛小()夕西(覀)血,C-艸寸采,V-竹()辶 舟止爪 豸隹,B-疒宀貝(貝)卜()冖比自鼻八(丷),N-女鳥(鳥)牛(牜 M-木目麻馬(馬)門(門)毛皿矛米麥(麥)黽(黽),L-石立力龍(龍)耒老里鹿鹵(鹵),K-口囗匚冂凵彡,J-钅(金)巾己(巳)斤幾 臼見(見)角,H-火禾戶虍黑勹,A-日(曰)一,S-纟(糹)四厶,D-刂刀()大歹斗豆門,F-氵冫父風(風)方缶灬,G-讠(言)廣革工弓戈瓜谷骨鬼艮 Q-犭氣犬欠青其彐( ),W-王亠文韋(韋)毋(母)瓦攵 ,E-阝耳兒卩 二,R-亻人(入)彳廴,T-土(士)田巛,其中以下25個部首扌蟲月山足艸忄竹疒女木口钅火日纟氵讠犭王阝(在左結構)石魚亻土為正鍵名部首,另外下述四部部首阝(在右結構)刂心鳥為末位正鍵名部首,除上述28位正鍵名部首外,以下29部部首車、廠、饣、礻、尸、衤、酉、走、穴、辛、辶、舟、宀、貝、目、麻、馬、門、立、口、禾、冫、廣、革、氣、亠、耳、人、牛為付鍵名部首,除正、付鍵名部首外其余全歸屬于普通部首。
A是英文中第一字母,“一”是任何部首筆劃檢字法中第一漢字,“日”是自然界中最為光亮的第一龐然大物,將這三個第一歸合在一起,部首“氵”“讠”“扌”雖然都有傳統稱謂,但它們稱謂的對應字母鍵已涌入大量部首,所以以上三部首只能到其它鍵位上安家,“氵”首筆和次筆都是點筆,所以二筆組合碼為44,部首“讠”首筆為點,次筆為折二筆組合碼為45,因此它們分別到四角筆碼44和45所對應的F和G字母鍵安家比較妥當,部首“扌”首筆為橫,次筆為豎鉤,豎鉤雖為折筆,但由于其絕大部分為豎筆成份,所以豎鉤也可以勉強看成豎筆,因此“扌”的首次筆劃組合碼也可勉強看作12,因此部首“扌”和四角筆碼12一樣對應于O鍵。為了使P、L鍵有正鍵名部首,“石”去掉首筆劃,第二、三筆劃的筆劃組合為32對應L鍵,“魚”取其最后二筆的筆劃組合為11對應P鍵。(漢字的聲母、部首和四角筆碼同26個字母鍵的對應代換關系詳見說明書附圖2。)抽取四角筆碼方法(一)取角順序書寫漢字一般講左右結構漢字(包括左中右結構)總是先寫左上角,次寫左下角,再寫右上角,后寫右下角,非左右結構漢字一般總是先寫左上角。次寫右上角,再寫左下角,后寫右下角,本輸入法為了順手,取角順序和書寫順序相同。
1)左右結構漢字(包括左中右結構)先取左上角,次取左下角,再取右上角,后取右下角。例①②數數③④2)非左右結構漢字先取左上角,次取右上角,再取左下角,后取右下角。例①單②③單④3)一筆劃漢字①②中的②重復取該筆劃,取完①②取碼工作就告結束。
二筆劃漢字①②取完二筆劃,取碼工作就告結束。三筆劃漢字,取完三筆后④可以按照取碼原則重復取①②③已取過的筆劃,四筆劃漢字和四筆劃以上漢字,凡被他角取過的筆劃不再重復取了。
例①一一②所以“一”的四角筆碼為11。①十十②所以“十”的四角筆碼為21。①土土②③圓土土④④重復取③已經取過的橫筆劃,所以“土”的四角筆碼為2111。
(二)1)取四角筆碼時,上角優先取最高筆劃,當漢字有幾個筆劃同屬最高筆劃時,左上角優先取擁有最高最左點的那一筆劃,右上角優先取擁有最高最右點的那一筆劃,同理下角優先取最底筆劃,左下角優先取擁有最底最左點的那一筆劃,右下角優先取擁有最底最右點的那一筆劃。例“王”字最上面的一橫一豎,同屬最高筆劃,但最高最左點在上面的一橫上,所以①取一橫,由于橫筆也被它角取走②就只能取余下的一豎,因此“王”字①②所組成的四角筆碼為12。
2)當最高最左點為二筆劃共有時,左上角優先取不但擁有最高最左點,而且兼顧盡量優先取靠近漢字左邊緣的那一筆劃,例①日②字,①取豎筆劃因為此筆劃不但擁有最高最左點,并且是漢字左邊緣筆劃,②取余下的折筆劃,所以日字①②所組成的四角筆碼為25。
3)當最高最左點為二筆劃共有,但二筆劃都是不靠近漢字左邊緣的筆劃,這時左上角優先取不但擁有最高最左點,而且兼顧優先取靠近漢字上邊緣的筆劃,例“又”字①又②二筆劃雖然都擁有最高最左點,但筆劃走向都是遠離左邊緣而去,而其中折筆劃,有一部分處在漢字的上邊緣位置上,所以①取折筆②取捺筆“又”字的四角筆碼為54。
(三)上下結構漢字中的上角優先取上結構,只有上結構筆劃取完后才能抽取中結構或下結構中的筆劃,下角優先取下結構筆劃,只有在下結構筆劃取完后,才能到中結構或上結構中抽取筆劃,同理左右結構中的左角只能取左結構中筆劃,只有左結構筆劃取完后,才能到中結構或右結構中抽取筆劃,右角只能取右結構中筆劃,只有右結構取完后才能到中結構或左結構中抽取筆劃,例,“發”字,①發②①取上結構中的折②取上結構中的點③發④③取下結構“又”字中的折筆,因為“又”字旁的撇是上結構中筆劃,③是下角不應取上結構中延伸下來的撇筆④取捺筆,所以“發”字四角筆碼為5454,例“絲”字①絲②①取折筆②取折筆③絲④③取橫筆④因為下結構筆劃已取完只能到上結構中抽取筆劃所以④取折筆因此“絲”字四角筆碼為5515。
(四)當中起筆的撇,下角有它筆者(他筆的起筆必須底于撇)優先取他筆,例“裁”字衣中的豎鉤起筆低于撇,所以③裁“裁”字③取豎鉤為所取筆劃,而“栽”字中的部首“木”中的豎筆因為其起筆高于撇的起筆,所以豎筆劃不能認為是撇的下角筆劃,所以“栽”字③栽③取撇筆劃為所取筆劃。
(五)筆劃從最高部位起筆,到最底部位止筆,這類筆劃稱作通長筆劃,例“中”字中居中的一豎就是通長筆劃。筆劃上面只有一個點筆劃,下面直到漢字下邊緣,或從漢字上邊緣起,下面只有半個撇筆劃,這類筆劃稱作次通長筆劃,例“市”和“少”字中間的一豎為次通長筆劃,筆形冫 八、丷同通長筆劃或次能長筆劃單獨相處時,優先取通長筆劃,例“小”字①小因為筆形“八”和通長筆劃單獨相處,所以①取居中的豎筆,例“木”字中的筆形“八”同居中的豎筆就屬于不單獨相處,因為豎筆的上下方向除筆形“八”外再有一橫筆劃,筆形“八”最多也只能講和豎筆劃的下半部分單獨相處。例“米”字上部筆形丷,顯然同通長豎筆劃不單獨相處所以①米①取筆形“丷”中的點筆劃。
2)筆形“冫、 八、丷、”同非通長筆劃和非次通長筆劃相處優先取筆形“冫、 八、丷、”的筆劃,例“兆”字“冫”同通長筆劃撤單獨相處,筆形 同通長筆劃折單獨相處,所以“兆”字①兆②①②抽取通長筆劃撇和折四角筆碼為35。而“鼗"字筆形“冫”和 相處的不是通長筆劃,也不是次通長筆劃,所以①鼗②①取“冫”中的點劃②取筆形 中的撇因此“鼗”字的①②組成的四角筆碼為43。
(六)①和③取到部件“口”時即以61作為“口”的四角筆碼,但當②④取到“口”時,由于前一碼也被他角取走,這時字元“口”只能取61后面的1個,例“韶”字,①②韶①取點筆劃,②取豎筆劃,韶③④③取折筆④由于③已取了折筆所以④只能取61中的1,因此“韶"字四角筆碼為4251。
漢字編碼方法(一)正鍵名部首所屬漢字編碼方法本輸入法共設立了二十八部正鍵名部首,其中3部半為末位正鍵名部首(“心”“刂”“鳥”和半部“阝”)本節所講的正鍵名部首實際上去掉了3部半部首后再剩二十四部半,它們都是一批最常見的部首。本輸入法對正鍵名部首是不進行抽取四角筆碼的,(正鍵名部首享受此項特權,本輸入法稱其為抽取四角筆碼豁免權下文不再特別說明)當漢字屬于正鍵名部首時,第一鍵首先輸入和正鍵名部首相對應的字母鍵(正鍵名部首享受此項特權,本輸入法稱之為優先輸入權,在左右結構漢字中只有正鍵名獨占整個左結構,在上下結構漢字中只有正鍵名部首獨占整個上結構時,才享受上項所說的豁免權和優先輸入權,對此下文不再特別說明)正鍵名部首所屬漢字編碼具體形式是(鍵名部首對應字母鍵)+(去掉正鍵名部首余下部分第1第2二角所取筆劃組合碼所對應字母鍵)+(去掉正鍵名部首余下部分第3第4二角所取組合筆劃碼所對應字母鍵)+(漢字聲母對應的字母鍵)去掉正鍵名部首余下部分是左右結構就按左右結構順序抽取筆劃,余下部分為非左右結構時就按非左右鮚構順序取碼,去掉正鍵名部首,余下部分不夠①②③④抽取筆劃,就按照前面所述一、三筆劃漢字一樣,采用重復取碼解決,而決不能因為筆劃不夠而轉向享受豁免權的鍵名部首上去抽取筆劃,例“億”“亻”對應于R鍵,①乙②“乙”的四角筆碼為55對應于T鍵,“億”聲母為Y對應于Y鍵所以“億”的編碼為RTY。
正鍵名部首所屬漢字編碼實例表
(二)末位正鍵名部首所屬漢字編碼方法本輸入法設立三部半末位正鍵名部首,它們是“刂”、“心”、“鳥”和“阝”,末位正鍵名部首不是隨便設立的,而是有一定道理、依據的,它們之中前三位部首,幾乎全部只是在漢字書寫結束前,最末書寫完的一個部首,部件“阝”在左結構中,屬于上述24部半中的一個正鍵名部首,在右結構中也是最末書寫完成的一個部首,所以“阝”只能算半部末位正鍵名部首,末位正鍵名部首由于其不處在漢字最顯眼部位(本輸入法所說最顯眼部位是指左右結構漢字的左結構,上下結構漢字中的上結構)所以不享受優先健入權,但它們必竟有著鍵名部首的名份,所以仍享受抽取四角筆碼豁免權(在末位正鍵名部首獨占整個下結構,或獨占整個右結構的情況下,才享受抽取四角筆碼豁免權)末位正鍵名部首所屬漢字,具體編碼形式是(去掉末位正鍵名部首,余下部分第1第2二角所取組合筆碼所對應字母鍵)+(去掉末位正鍵名部首余下部分第3第4二角所取組合筆碼所對應字母鍵)+(末位正鍵名部首所對應的字母鍵)+(漢字聲母所對應的字母鍵)末位正鍵名部首所屬漢字取碼實例表
(三)付鍵名所屬漢字編碼方法本輸入法設有29部付鍵名部首,它們大部分有較常見的部首組成,但由于“饣”、“宀”等常見部首無法安置到正鍵名部中,而“走”、“麻”等不常見部首由于容易產生同碼,無法安置到普通部首中去,所以在付鍵名部首中夾有一部分常見和不常見部首,記住這29部部首后,凡常見部首不在這29部中,必為正鍵名部首,不常見部首不在這29部中必為普通部首。當付鍵名部首獨占整個上結構或左結構時,享受優先鍵入權和抽取四角筆碼不完全豁免權(只抽取付鍵名部首左上角后,不再在付鍵名部首中抽取任何筆劃,將此稱作為不完全豁免權),和正鍵名部首所屬漢字相比,余下部分①②③就變成②③④。例,“炮”字,優先鍵入正鍵名部首“火”(H鍵)后余下部分取碼順序為①包②,③包④例“飽”字優先鍵入付鍵名部首饣(U)鍵后,取碼順序①飽,②包④包③。
付鍵名部首所屬漢字編碼具體形式是(付鍵名部首對應字母鍵)+(付鍵名部首左上角和去掉付鍵名部首余下部分第2角二角所取組合筆劃碼所對應的字母鍵)+(去掉付鍵名部首余下部分第3第4二角所取組合筆劃碼所對應字母鍵)+(漢字聲母對應字母鍵)付鍵名部首所屬漢字編碼實例
(四)鍵名部首編碼方法本輸入法共設置57部鍵名部首,由于正付鍵名部首都享受著抽取四角筆碼豁免權和不完全豁免權,所以被抽取的筆劃大部分在鍵名部首以外的余下部分中抽取,現在要為鍵名部首自身編碼,由于不存在余下部分,所以豁免權也失去了存在的條件,因此鍵名部首編碼,四角筆碼勢必在鍵名部首自身抽取,鍵名部首編碼具體形式是(鍵名部首所對應的字母鍵)+(鍵名部首第1第2二角所取組合筆劃碼所對應的字母鍵)+(鍵名部首第3第4二角所取組合筆劃碼所對應的字母鍵)+(鍵名部首讀音聲母對應的字母鍵)
鍵名部首編碼實例表
注(本輸入法漢字編碼字母不足四鍵,后面追加空格鍵,所以部首“亻”編碼字母后再須鍵入空格鍵,類似情況下文不作特別說明)。
(五)普通部首和普通部首所屬漢字編碼方法。
除鍵名部首外其余全是普通部首,它們都是不常見部首,普通部首不享受優先鍵入權,不享受抽取四角筆碼豁免權,其輸入編碼具體形式是(漢字第1第2二角所取組合筆劃碼所對應鍵位)+(漢字第3第4二角所取組合筆碼所對應鍵位)+(漢字所屬部首對應鍵位)+(漢字聲母對應鍵位)普通部首和普通部首所屬漢字編碼實例
“栽”字中的“木”部首由于不在最顯眼位置所以不享受優先輸入權和豁免權,實際上已降為普通部首。
(六)詞組編碼方法1)二字詞組取每字前二位編碼字母作為詞組碼,例“方”字前二位字母為AH,“法”字前二位字母為FZ,所以“方法”詞組碼為AHFZ。
2)三字詞組前二字各取單字編碼字母的首字母,最后一字取其單字編碼字母前二位字母,有上述四個字母構成詞組碼,例“電”字首字母為T,“視”字首字母為U,第三個“機”字前二個字母為MH,所以“電視機”詞組碼為TUMH。
3)四字詞組取每個字的首字母為編碼字母,例“新”字第一碼為D,“華”字第一碼為K,“字”字第一碼為B,“典”字第一碼為X,所以“新華詞典”詞組碼為DKBX。
4)四字以上詞組,取前三個字和后一個字的首字母為詞組碼,例“專”字首字母為Q,“利”字首字母為L,“事”字首字母為Q,“所”字首字母為K,所以專利事務所的詞組碼為QLQK。
不認識的字和聲母不能確定的字的輸入方法本輸入法凡屬國標(GB-2312)一、二級6763個常用漢字,在單字輸入時,最后一位編碼字母,都是和該漢字聲母所對應的字母鍵,即使普通話水平很差的人,一股說來大部分漢字聲母總能夠確定的,萬一有些字讀不準,聲母無法確定,或個別字不認識,本輸入法也能克服上述困難的。例如現在要將“真”字輸入計算機,我們假設操作者讀不準其聲母,或索性假設操作者不認識“真”這個字,根據直觀判斷,操作者很快能確定該字四角筆碼為2134(對應字母為ZJ)歸屬于普通部首“十”(U鍵),當操作者輸入ZJU后,由于不知該字聲母,勢必要作一短暫停頓,輸入第三字母U后大約隔0.8秒,提示行顯示,“真”漢拼ZHEN,“賣”漢拼MAI(該功能由軟件自動完成,0.8秒大約是注意力從鍵盤或計算機屏幕移向提示行所需要時間)根據提示行,操作者只要鍵入和聲母ZH對應的V鍵,“真”字就輸入計算機,提示行顯示“真”和“賣”二字說明在國標(GB-2312)6763個漢字中四角筆碼屬于2134,部首屬于“十”部的只有“真”和“賣”二字。而大部分漢字,在輸入前三個形碼字母后,唯一性已被確定。
漢字部首不能確定時的輸入方法當鍵名部首享受優先鍵入權,抽取四角筆碼豁免權時,不可能產生不能確定部首的麻煩事,因為這時的鍵名部首都獨占著顯眼的位置,而普通部首不但數量多,而且又不顯眼,所以在輸入普通部首所屬漢字時,往往會遇到不能確定漢字歸屬于什么部首的困難,為解決此困難,本輸入法特地設計了一個普通部首學習鍵,漢語拼音原有聲母,加上本輸入法定義的W、Y、O聲母共計有二十四聲母,因此聲母位上再余下二鍵,當原聲母位上代表聲母的字母轉移到原形碼部首位上,而余下二鍵中的一鍵或利用其它非字母鍵位。(本輸入法為A鍵)在聲母位置上鍵入時該鍵即為部首學習鍵,使用部首學習鍵的具體形式(漢字第1第2二角所取組合筆劃碼所對應字母鍵)+(漢字第3第4二角所取筆劃組合碼所對應字母鍵)+(漢字聲母對應字母鍵)+A鍵(部首學習鍵)例在不知“共”字歸何部首的情況下輸入“共”字其四角筆碼為2234(XJ)聲母G,輸入XJGA,A鍵出現在最后一位(聲母位),其功能相當于在詢問,現在輸入四角筆碼為2234聲母為G,請提示該漢字歸屬何部首,鍵入A鍵后,提示行立刻顯示1)共(八部)2)恭(忄部),也就是說在國標(GB-2312)中只有共和恭二字符合四角筆碼為2234,聲母為G這個要求,鍵入序號1“共”字就輸入計算機,設置部首學習鍵也可以換一種形式理解本輸入法聲母輸入位上的對應關系是漢語拼音原有21個聲母加上本輸入法定義的Y、W、O聲母,再余下二個鍵位沒有對應聲母,為了克服不常見部首難于確定的困難本輸入法設計了一種不常見部首所屬漢字的備用編碼,原聲母對應字母鍵安置在不能確定的部首碼位置上,為了使大量的備用碼和正式編碼不發生混淆不產生同碼,所以原聲母位有余下二鍵中的一鍵代替(本輸入法為A鍵),其表示具體形式是(漢字第1第2二角所取組合筆劃碼所對應字母鍵)+(漢字第3第4二角所取組合筆劃碼所對應字母鍵)+(漢字聲母對應字母鍵)+A鍵。這樣一來所有普通部首所屬漢字就有了二個編碼形式例“共”字正式編碼為XJBG備用編碼為XJGA,能夠知道其正確部首,用正式編碼輸入當然最好,不能確認其部首就用備用編碼輸入,用備用編碼發生同碼的情況雖然多了一些,但看一看提示行總比瞪著眼干著急好的多,總比尋找字典確認部首簡捷的多。
國標(GB-2312)外漢字輸入方法國標(GB-2312)裝有6763個一二級常用漢字,一般來講祖國大陸這些字已經夠用了,但考慮到我國臺灣省及港、澳特區流行的繁體字,以及國際上韓國、日本、新加坡也使用一部分漢字,考慮到我國進一步的開放改革和整個漢字文化圈的需要和交流可以說國標(GB-2312)內6763個漢字是無法滿足上述要求的,92年漢字文化圈有關國家有關地區的學者經過協商,終于建立了國際通用的裝有21003個漢字的計算機用漢字大字符集。國標(GB-2312)6763個常用漢字也全部裝入這個大字符集,因此除6763個祖國大陸常用漢字外,在大字符集中還有14240個漢字,(本文說的國標外漢字就是這14240個漢字),為了輸入國標外漢字,本輸入法設計了一個國標外漢字尋找鍵,漢語拼音原有聲母加上本輸入法定義的Y、W、O聲母和部首學習鍵再余下一鍵或利用其它非字母鍵位。(本輸入法E鍵)當該鍵在聲母位上鍵入時(本輸入法聲母位在編碼最后一位)該鍵即為國標外漢字尋找鍵,國標外漢字尋找時有三個形碼鍵,取碼原則和國標內漢字全部一樣,唯一不同的是國標內漢字最后一鍵,鍵入的是漢字聲母所對應字母鍵,而14240個國標外漢字最后一鍵,鍵入的都是E鍵。例有一個國標外漢字,上結構為“氏”字下結構為“十”字(該字大字符集內碼為9ADC)因為①氏②①②為35③十④③④為21,所以該國標外漢字四角筆碼為3521(HZ)歸屬“十”部(U鍵),當鍵入HZU0.8秒后提示行顯示“阜”(漢拼FU)“卑”(漢拼BEI),也就是說在國標6763個漢字中四角筆碼為3521(HZ)歸屬“十”部的只有“阜”和“卑”二字,國標內漢字沒有勢必只能到國標外漢字中去尋找,在三鍵形碼鍵HZU后再鍵入國標外漢字尋找鍵E后,提示行立刻顯示國標外的四角筆碼為3521,歸屬于“十”部的四個國標外漢字,其中序號為2的就是需要尋找輸入的上結構為“氏”下結構為“十”的國標外漢字,E鍵在聲母位(本輸入法為最后一位)鍵入時,它的功能相當于經查國標內漢字中凡符合四角筆碼為3521,部首歸屬于“十”部的漢字中,沒有要查找的漢字,請將國標以外的凡四角筆碼屬于3521部首歸屬于“十”部的漢字顯示到提示行。
關于國標外漢字尋找鍵也可以換一種角度理解本輸入法聲母輸入位上的對應關系是漢語拼音原有21個聲母加上本輸入法定義的Y、W、O聲母和部首學習鍵后再余下一鍵。(本輸入法為E鍵),為了避免國標內和國標外漢字在編碼時產生同碼情況,本輸入法設計了一種國標外漢字編碼方式,國標外漢字前幾位形碼取碼原則和方法全部和國標內漢字相同,不同的是國標內6763個漢字聲母位上鍵入和聲母相對應的字母鍵,而國標外漢字全部鍵入上面所述的余下一鍵。(本輸入法為E鍵)這樣1萬四千多個國標外漢字實際上只有三個形碼鍵在分化離散同碼現象,這樣在國標外漢字中勢必產生大量的同碼現象,象上述的一個編碼為HZUE的國標外漢字也發生了4字同碼現象,既然有同碼計算機軟件就自動在提示行顯示,從而達到了尋找和輸入的目的。采用國標(GB-2312)外漢字尋找鍵的方法,為我國漢字輸入技術成功地解決了,在輸入6763個常用漢字時,在不增加它們的重碼和碼長的情況下,使1萬四千多個國標外漢字也能順利地輸入計算機。本輸入法將全部國標外漢字劃分為下列四種情況。
(1)當漢字歸屬于正鍵名部首時,編碼具體形式是(正鍵名部首對應字母鍵)+(去掉正鍵名部首余下部分第1第2二角所取組合筆劃碼所對應的字母鍵)+(去掉正鍵名部首余下部第3第4二角所取組合筆劃碼所對應的字母鍵)+E鍵。
(2)當漢字歸屬于末位正鍵名部首時,編碼具體形式是(去掉末位正鍵名部首余下部分第1第2二角所取筆劃組合碼所對應的字母鍵)+(去掉末位正鍵名部首余下部分第3第4二角所取筆劃組合碼所對應的字母鍵)+(末位正鍵名部首所對應的字母鍵)+E鍵。
(3)當漢字歸屬于付鍵名部首所屬漢字時編碼具體形式是(付鍵名部首對應字母鍵)+(付鍵名部首左上角和去掉付鍵名部首余下部分第2角二角所取筆劃組合碼所對應的字母鍵)+(去掉付鍵名部首余下部分第3第4二角所取組合筆劃碼所對應的字母鍵)+E鍵。
(4)當漢字歸屬于普通部首所屬漢字時,編碼具體形式是(漢字第1第2二角所取筆劃組合碼所對應的字母鍵)+(漢字第3第4二角所取筆劃組合碼所對應的字母鍵)+(普通部首所對應的字母鍵)+E鍵。
權利要求
1一種以“新華字典”所采用的全部部首加四角筆碼為基礎,和漢字聲母相結合的中文信息處理漢字輸入法及其鍵盤設計,漢字聲母,“新華字典”的全部部首,四角筆碼和鍵盤中的26個鍵位對應情況其特征在于A漢語拼音中的聲母,僅三個雙字母聲母和其它字母鍵建立對應代換關系,ch對應于I鍵,sh對應于U鍵,zh對應于V鍵,韻母YA、YAO、YE、YI……由于首字母都是y字母,所以認為這些韻母前有一個y聲母.用y鍵表示,韻母WA、WO、WU……由于首字母都是W字母,所以認為這些韻母前都有一個W聲母,用W鍵表示,其它沒有聲母的韻母音節,其聲母用O鍵表示,B本輸入法規定全部漢字有橫、豎、撇、捺、折五種筆劃構成,并用1、2、3、4、5五種數碼代表,漢字每角有可能抽取到五種筆劃,二角合起來有可能取得25種筆劃組合碼(四角筆碼),并且字根“口”也算作一種筆劃組合碼其四角筆碼為61,26個四角筆碼分配在普通英文鍵盤的26個字母鍵上,具體分配如下P-11,O-12,I-13,U-14,Y-15,Z-21,X-22,C-23,V-24,B-25,M-31,L-32,K-33,J-34,H-35,A-41,S-42,D-43,F-44,G-45,Q-51,W-52,E-53,R-54,T-55,N-61C本輸入法選取“新華字典”的全部部首為基本輸入部首,凡有讀音和傳統稱謂的部首,幾乎全都安排在和其讀音所對應的聲母鍵位上,沒有讀音和稱謂的部首全都根據其前二個筆劃的組合碼安排在相同四角筆碼所對應的鍵位上,全部部首分配在普通英文鍵盤的26個字母鍵上,具體分配如下P-魚(魚)片爿(丬)皮疋 髟丿,O-扌,I(CH)-蟲車(車)廠臣赤齒(齒)辰廾,U-山饣(食)礻(示)尸十水(氺) 手殳矢舌豕身鼠丨,Y-月 衤酉又(ㄡ)尢業用弋幺衣頁(頁)羊( )羽音乙肀(聿 )雨 ,Z-足()走子(孑)自攴,X-心忄()穴辛小()夕西(覀)血,C-艸寸采,V-竹()辶 舟止爪(爫)豸隹,B-疒宀貝(貝)卜()冖比白鼻八(丷),N-女鳥(鳥)牛(牜 )、,M-木目麻馬(馬)門(門)毛皿矛米麥(麥)黽(黽),L-石立力龍(龍)耒老里鹿鹵(鹵),K-口囗匚冂凵彡,J-钅(金)巾己(巳)斤幾 臼見(見)角,H-火禾戶虍黑勹,A-日(曰)一,S-纟(糹)四厶,D-刂刀(ク)大歹斗豆 ,F-氵冫父風(風)、方缶灬,G-讠(言)廣革工弓戈瓜谷骨鬼艮 ,Q-犭氣犬欠青其彐( ),W-王亠文韋(韋)毋(母)瓦攵(夂) ,E-阝耳兒卩 二,R-亻人(入)彳廴,T-土(士)田巛,其中以下25個部首扌蟲月山足艸忄竹疒女木口钅火日纟氵讠犭王阝(在左結構)石魚亻土為正鍵名部首,另外下述四部部首阝(在右結構)刂心鳥為末位正鍵名部首,除上述28位正鍵名部首外,以下29部部首車、廠、饣、礻、尸、衤、酉、走、穴、辛、辶、舟、宀、貝、目、麻、馬、門、立、口、禾、冫、廣、革、氣、亠、耳、人、牛為付鍵名部首,除正、付鍵名部首外其余全歸屬于普通部首,D根據上述四角筆碼,部首、聲母和字母鍵位的對應關系,輸入漢字,并將全部漢字,劃分為下列五種漢字,(每種類型的漢字四角筆碼,抽取部首,取角順序均有所不同)(一)當漢字歸屬于正鍵名部首時,編碼具體形式是(正鍵名部首對應字母鍵)+(去掉正鍵名部首余下部分第1第2二角所取組合筆劃碼所對應的字母鍵)+(去掉正鍵名部首余下部分第3第4二角所取筆劃組合碼所對應的字母鍵)+(漢字聲母所對應的字母鍵)(二)當漢字歸屬于末位正鍵名部首時,編碼具體形式是(去掉末位正鍵名部首余下部分第1第2二角所取組合筆劃碼所對應的字母鍵)+(去掉末位正鍵名部首余下部分第3第4二角所取組合筆劃碼所對應的字母鍵)+(末位正鍵名部首所對應的字母鍵)+(漢字聲母對應的字母鍵)(三)當漢字歸屬于付鍵名部首所屬漢字時編碼具體形式是(付鍵名部首對應字母鍵)+(付鍵名部首左上角和去掉付鍵名部首余下部分第2角二角所取組合筆劃碼所對應的字母鍵)+(去掉付鍵名部首余下部分第3第4二角所取組合筆劃碼所對應的字母鍵)+(漢字聲母所對應的字母鍵)(四)正付鍵名部首單獨輸入計算機時,編碼具體形式是(鍵名部首所對應的字母鍵)+(鍵名部首第1第2二角所取組合筆劃碼所對應的字母鍵)+(鍵名部首第3和第4二角所取組合筆劃碼所對應的字母鍵)+(鍵名部首讀音聲母所對應的字母鍵)(五)當漢字歸屬于普通部首和普通部首所屬漢字時,編碼具體形式是(漢字第1第2二角所取筆劃組合碼所對應的字母鍵)+(漢字第3第4二角所取筆劃組合碼所對應的字母鍵)+(普通部首所對應的字母鍵)+(漢字聲母所對應的字母鍵)E詞組的輸入是建立在單個漢字輸入的基礎上進行的,詞組輸入時,按下列四種不同情況進行編碼輸入(一)當詞組為二字詞組時,其編碼形式是,每個字的前二個編碼字母為輸入編碼,(二)當詞組為三字詞組時,其編碼形式是,前二個字的第一個編碼字母和后一個字的前二個編碼字母為輸入編碼,(三)當詞組為四字詞組時,其編碼形式是,每個字的第一個編碼字母為輸入編碼,(四)當詞組中的漢字數超出四個漢字時,其編碼形式是詞組前三個字和最后一個字,這四個字每個字的第一個編碼字母,為輸入編碼,本輸入法及其特征是,所采用的部首和人們最為熟悉的“新華字典”所采用的部首完全相同,并且凡有讀音和稱謂的部首,幾乎全都按其讀音,安排在和其讀音對應的聲母鍵位上,沒有讀音和稱謂的部首,全都根據部首前二筆劃所組成的組合筆劃碼,將其安排在相同四角筆碼所對應的鍵位上,所有部首劃分成正鍵名部首(包括三部半部末位正鍵名部首)付鍵名部首和普通部首三大部分部首,根據部首的具體情況,又將漢字分成五種不同的類型的漢字,并運用了各種不同類型的漢字在鍵入部首,四角筆碼及抽取四角筆碼,順序多不相同的技術特點,從而使編碼重碼率達到了極底的程度,漢語拼音中有21個聲母,加上本輸入法定義的Y、W、O三個聲母,共計有24個聲母,本輸入法在輸入人們最常用的國標(GB-2312)6763個漢字時,編碼最后一碼都是代表漢字聲母的聲母碼,為了充分利用余下的二鍵,在這余下的二鍵上分別設立了部首學習鍵,國標(GB-2312)外漢字尋找鍵(或利用其它非字母鍵位設立尋找鍵和學習鍵),并且利用部首學習鍵,設計了一種在不能確定漢字歸屬何部首時仍能輸入漢字的方法,利用國標外漢字尋找鍵設計了一種能把國標一、二級6763個常用漢字以外的任何國標外外字輕易輸入計算機的方法。
2根據權利要求1,本發明的進一步特征是設計了一個部首學習鍵,并利用該鍵創造了一種在不能確定漢字部首歸屬時,仍能輸入漢字的方法,漢語拼音中有21個聲母,加上本輸入法定義的Y、W、O三個聲母,共計有24個聲母,本輸入法在輸入人們最常用的國標(GB-2312)6763個漢字時編碼最后一碼都是代表漢字聲母的聲母碼,為了充分利用余下的二鍵,在余下二鍵之中的一鍵或利用其它非字母鍵位(本輸入法為A鍵)設立為部首學習鍵,由于不能確定部首歸屬的漢字都是普通部首所屬漢字,其輸入方法是按照普通部首所屬漢字輸入時,在原輸入部首位置上,改換輸入漢字聲母,而在編碼最后一位鍵位上鍵入A鍵即成,其編碼表示形式為(漢字第1第2二角所取筆劃組合碼所對應的字母鍵)+(漢字第3第4二角所取筆劃組合碼所對應的字母鍵)+(漢字聲母所對應的字母鍵)+(A鍵)。
3根據權利要求1,本發明的進一步特征是設計了一個國標(GB-2312)外漢字尋找鍵,并利用該鍵創造了一種能把國標(GB-2312)一、二級6763個常用漢字以外的任何國標外漢字輕易輸入計算機的方法,漢語拼音中有21個聲母,加上本輸入法定義的y、w、o三個聲母,共計有24個聲母,本輸入法在輸入人們最常用的國標(GB-2312)6763個漢字時,編碼最后一碼都是代表漢字聲母的聲母碼,為了充分利用余下的二鍵,在余下二鍵之中的一鍵或利用其它非字母鍵位(本輸入法為E鍵)設立為國標(GB-2312)外漢字尋找鍵,輸入國標外漢字時,其前三鍵完全和國標(GB-2312)6763個漢字采用一樣的編碼原則輸入,不同的是最后一鍵在聲母碼位上,國標外漢字全部輸入E鍵,并將全部國標外漢字,劃分為下列四種情況(一)當漢字歸屬于正鍵名部首時,編碼具體形式是(正鍵名部首對應字母鍵)+(去掉正鍵名部首余下部分第1第2二角所取組合筆劃碼所對應的字母鍵)+(去掉正鍵名部首余下部分第3第4二角所取筆劃組合碼所對應的字母鍵)+E鍵,(二)當漢字歸屬于末位正鍵名部首時,編碼具體形式是(去掉末位正鍵名部首余下部分第1第2二角所取筆劃組合碼所對應的字母鍵)+(去掉末位正鍵名部首余下部分第3第4二角所取組合筆劃碼所對應的字母鍵)+(末位正鍵名部首所對應的字母鍵)+E鍵,(三)當漢字歸屬于付鍵名部首所屬漢字時,編碼具體形式是(付鍵名部首對應字母鍵)+(付鍵名部首左上角和去掉付鍵名部首余下部分第2角二角所取筆劃組合碼所對應的字母鍵)+(去掉付鍵名部首余下部分第3第4二角所取組合筆劃碼所對應的字母鍵)+E鍵,(四)當漢字歸屬于普通部首所屬漢字時,編碼具體形式是(漢字第1第2二角所取筆劃組合碼所對應的字母鍵)+(漢字第3第4二角所取筆劃組合碼所對應的字母鍵)+(普通部首所對應的字母鍵)+E鍵。
全文摘要
本發明是中文信息處理領域里的一種漢字輸入法,它成功地解決了漢字輸入技術中長期存在的容易學的輸入速度不快,輸入快但不容易學的矛盾。它采用的部首和《新華字典》全部相同,有讀音有稱謂的部首,幾乎全都安排在和其讀音聲母相對應的鍵位上,字根"口"和漢字每二角抽取到的筆劃組合,共有26種四角筆碼,將漢字分成五種不同類型,采用每種類型抽取四角筆碼、部首輸入的順序各不相同的技術,將重碼降至極底點。它適用于各種不同層次的人,向計算機高效快速地輸入漢字信息。
文檔編號G06F3/023GK1480823SQ0210720
公開日2004年3月10日 申請日期2002年3月7日 優先權日2002年3月7日
發明者白定泉 申請人:白定泉