專利名稱:五三音碼及其鍵盤的制作方法
技術領域:
本發明屬于電腦漢字編碼輸入方法,是本發明人前一項發明五三筆碼的延伸和重大改進,它是一種組合五三筆碼與音碼的發明,所以稱之為五三音碼,順便指出,稱“五三”而不稱“三五”是為了避商業性宣傳之嫌。
在鍵盤上用音碼輸入漢字時只要掌握漢字拼音便可輸入,人們大都能使用,但由于漢字同音字眾多,造成重碼多,有時甚至不得不從數十個甚至上百個同音字中挑選一個,故輸速較低。
為免去同音字選擇煩惱,目前所有問世的優秀漢字輸入法都主要向三個方向發展。一是智能語句語音輸入法,可仍然免不了同音字選擇;二是各種組字單元碼,特點是將眾多的組字單元按筆畫或拼音或象形等方式歸類,重碼低、輸速高。由于筆畫是一項足以與字母相提并論的有史以來最偉大發明之一,筆畫的發明使漢字由象形文字飛躍成為符號文字,所以按筆畫歸類的組字單元碼相對略勝一籌,較為流行,可各種組字單元碼有個通病,那就是組字單元數大大多于西文字母數,記不勝記,讓一般人望而生畏,無法全民普及;三是各種組字單元與拼音結合的編碼,特點是要記憶的組字單元較少,有一定的區分同音字能力,輸速較快,但因為組字單元數較少,丟失的信息過多,重碼率相對較高,并不能真正有效地免去同音字選擇。
這樣,目前所有問世的編碼都未能同時克服兩種主要缺陷或重碼率過高,人工干預過多,無法提高輸速;或規則繁雜,難學難記,不宜推廣。僅僅依據漢字的音、形特征編碼似乎已山窮水盡,不可能發明出能同時克服兩種主要缺陷的理想的完善的編碼了,事實并不如此,五三筆碼的問世為漢字輸入法最終解決打下了基礎。
本發明的目的是提供一種組合五三筆碼和音碼的電腦漢字編碼輸入方法,它具有幾分鐘學會、大部分漢字不必選擇同音字、輸速快的優點。采用調整方案的,也就是采用以碼長最多為2碼的五三筆碼為基礎,組字單元為配合,漢字結構為補充并結合拼音的,甚至可以幾乎不選同音字,從而實現高速脫稿輸入,而學成時間僅需10分鐘。同時克服了上述兩種主要缺陷。
由于本發明為五三筆碼和音碼的組合發明,所以最好先掌握五三筆碼的核心部分將漢字的各種筆畫歸類為橫、豎、撇、捺、折五種基本筆畫,其中點作捺,提作橫,但點提相連時,提作點,因撇捺由上向下傾斜,故歸類為斜筆畫,而折根據其沒折、彎、鉤前的運筆方向可分別并入上述三類筆畫中,這三類筆畫,本發明人稱之為根本筆畫,它與漢字各種筆畫的對應關系見圖1所示,順便指出,所有圖中的1、2、3都為橫、豎、斜的代號,接著編碼,規則是一、對1至4筆的漢字將筆畫歸類,按書寫順序根據筆畫的相交情況編碼;二、對5筆及以上漢字按書寫順序根據根本筆畫橫豎斜的排列組合次序對每三筆進行編碼,在依次出現的三個筆畫中,橫豎斜的排列組合不外乎27種,可一一對應地排列在26個英文字母及某個特定符號鍵上,一般為標點符號鍵,如果系統允許的話也可以排列在空格鍵、回車鍵上,甚至可以在標準鍵盤上新增一個鍵,但這會增加系統成本,為便于輸入漢字,本發明人利用26個字母的鍵位及“;”編碼,見圖2。
應當指出某幾種橫豎斜排列組合方式組字頻率很低,可將之合并排列在同一鍵上,這樣27種橫豎斜排列組合可排列在不足27個字母或符號鍵上,但這記憶不甚方便,所以一般還是以一一對應地排列好。上述規則是以4筆為界編碼的,其實也可以以N筆為界,還可以規定碼長最多為L,超過規定時改取最后一碼,N、L均為自然數,當碼長較短時,補上該漢字的拼音,構成五三音碼,音碼可前可后,一經選定不得改變,下面是規定碼長最多為2碼或3碼時的五三音碼的形部編碼具體規則(1)對只有1筆的漢字,橫、豎、撇、捺、折的編碼分別為1、2、3、4、5;(2)對2至5筆的漢字取其首一筆和末一筆,橫、豎、撇、捺、折當沒與上一筆相交時,其編碼分別為1、2、3、4、5;當只與上一筆相交時其編碼分別為6、7、8、9、0;當不止與上一筆相交時,其編碼分別為位于鍵盤左上角的5個字母Q、W、E、R、T;(3)對6筆及以上的漢字取其首三筆和末三筆,對首三筆和末三筆只須根據其橫、豎、斜的排列組合情況輸入對應的字母或符號鍵即可;
(4)對1至5筆的漢字或者按書寫順序對每三筆進行編碼,對每三筆只需根據其橫豎斜的排列組合情況輸入對應的字母或符號鍵即可。若還剩一筆,最末筆為橫或豎或撇或捺或折,其編碼分別為1或2或3或4或5;若還剩二筆,最末筆為橫或豎或撇或捺或折,其編碼分別為6或7或8或9或0;當然也可將最末筆改為剩下的第一筆,也可不考慮剩下的筆畫數。
(5)對6筆及以上的漢字或者按書寫順序先對頭三筆和次三筆編碼,若還剩一筆,最末筆為橫或豎或撇或捺或折,編碼分別為1或2或3或4或5;若還剩二筆,最末筆為橫或豎或撇或捺或折,編碼分別為6或7或8或9或0;若還剩三筆及以上,改取末三筆。對頭三筆、次三筆、末三筆只需根據其橫豎斜的排列組合情況輸入一一對應的字母或符號即可。
規則(1)~(4)都以6筆為界,其實也可以以3筆及以上的任意筆畫數為界。比如規定對4筆及以上的漢字取其首三筆和末三筆,對1至2筆的漢字可直接輸入其雙拼碼,這樣完全舍棄了數字鍵,但會增加點重碼。
音碼可以為全拼或簡拼或混拼或雙拼或不完整拼音。采用不完整拼音,因與全拼不一致,會增加重碼,一般不采用。為縮短碼長提高輸速,一般用雙拼法,在實施例中選用微軟雙拼,還約定音碼在后,因規則(4)包含規則(1),規則(2)要區分筆畫數,規則(5)碼長稍長,所以在實施例中按規則(3)、(4)編碼。
為提高漢字輸入速度還設置了簡碼、詞組、語句輸入法。
一、簡碼數字一至九只需擊一次相應的數字健,字母簡碼見圖3,該圖的特點是除A、O、E、I、U按拼音末字母,V按象形,“;”按筆畫定位外,其余都按拼音首字母定位。冒號前為一級簡碼,冒號后為與它在句子中用法類似的同類高頻字。對同類高頻字只需按該圖的左右順序在一級簡碼后擊相應的數字鍵1、2、3、4、5即可。
按規則(4)編碼時,由于全碼輸入時擊數字鍵不甚方便,一般大部分1至5筆的漢字都可舍去數字鍵,擊其簡碼。具體講對1至2筆的漢字可直接輸入其雙拼碼,對4至5筆的漢字可在輸入首三筆所對應的字母或符號后再接著輸入其雙拼音碼。用簡碼輸入時利用數字鍵會大大增加簡碼數量,二級簡碼按五三音碼形部編碼從理論上講有700多個,若利用數字鍵可擴充至1000個左右,這會明顯提高輸速。三級簡碼從理論上講可舍棄五三音碼4位編碼中的任意1位,考慮思維習慣一般舍棄形部編碼第二位碼或韻母。
二、詞組詞組輸入法有兩種一是聲韻雙拼法;二是按五三音碼形部編碼,雙字詞只需直接輸入每個漢字的形部編碼;三字詞輸入第一第二個漢字的形部第一位碼,再輸入第三個漢字的形部編碼;四字及以上的多字詞只需輸入第一、二、三和最后一個漢字形部第一位碼。形部編碼不足二碼,補上“,”鍵。
三、語句語句輸入時只需接連輸入句子中每個漢字的聲、韻母即可。
實施例一種電腦漢字編碼方法五三音碼1 JAVS DMNK HJZI BMMA FHFA WSYM若按規則(2)編碼,五的編碼為11WU,三的編碼為11SJ,若按規則(5)編碼,種的編碼為JLAVS,該實施例在詞組輸入時采用微軟雙拼輸入法。為盡可能消除重碼和避免編碼的二義性,單字輸入時不支持多音字輸入,詞組輸入時仍支持多音字輸入。
有些經常出現在字首或字尾的漢字組字單元組字頻率高,若完全按規則(3)、(4)編碼,容易集中排列在某一字母或符號鍵上,這會造成一定數量的重碼,因此有必要作適當調整。調整的方法是將這些組字單元從組字頻率高的某幾種橫豎斜排列組合鍵上抽出,排列到組字頻率低的橫豎斜排列組合鍵上,避免容易出現在編碼同一位置的組字頻率高的組字單元及橫豎斜某種排列組合排在同一鍵上,排列時還考慮了同音字因素,還可酌情參考組字單元和橫豎斜27種排列組合的實用頻率、鍵位壓縮、指法規則。本發明人綜合比較,反復優選后調整方案見圖4,圖4還調整了橫、豎、斜三類筆畫的排列次序,該圖也即優化五三音碼形部編碼鍵盤排列圖。下面作具體解說(1)目含且、罒、皿、臼,钅含金,日含 ,足含走,貝含見,扌含キ,讠含言, 含 、已、巳、己、巴、尸、 ,土含士、 、牛,氵含水, 含 ,含心,阝含耳,饣含食字頭 ,亻含 ,ㄨ含 ,特別指出廣不含疒,麻部,木不含未、口不得與其它筆畫相交,貝在字首時,按其末三筆編碼,也就是為C,這些被含的組字單元與基本組字單元或互為繁簡,或互相同源,或音、形、義基本相同,可視為同種組字單元,就象字母有大小手寫體一樣。
(2)以上組字單元嚴格按書寫順序出現在字首或字尾,才排列在相應的字母上,心的前三筆為豎斜斜時,編碼為聲母X。艸下面為氵時慣常與去氵后的字發生重碼,編碼非改不可,編碼為改的聲母G,艸下面為扌,犭前為氵、讠,日、口上面與十相連時編碼改為G,口上面為八、冂,編碼也為G,一橫與二豎相交或相連,一般為H,但艸下面連一到二橫時以廿代表,編碼為聲母N。連三橫時編碼作為組合組字單元,編碼也為G,例如萍的編碼為“GJP;”,“故”的編碼為GKGU,車、禾應位于字首,亻應在字的左部,ㄨ應該在字尾。不在規定位置時,編碼不作調整。女的書寫順序為橫折撇,忄的書寫順序點豎點,力刀的書寫順序因人而異,約定在下部時為撇折,其余都為折撇。離散的筆畫“乙”形似豎的代號2,約定作豎,己上面為山時不作調整。
(3)木根據其首三筆編碼;目、禾分別根據末三筆編碼;饣為食的簡體,其末三筆為N,日的左部,足的中部象E,亻變形后似W,貝象R,ㄨ形似X,讠象I、口象O, 象P,扌形似F,艸象H,犭的形似反K,反文低象K, 象2個L連成;王形似手寫體Z,大有撇有捺象倒立V,钅字頭形似V,所以將它們排列在相應的字母鍵上; 的前三筆出現在字首時,形如U, 出現在字尾時,為倒立的 ,編碼為U,土、月、氵、廣按聲母編碼,竹按韻母編碼。車的第二筆視為撇折的話,將它橫倒看,其首三筆就為豎斜豎,所以編碼為B,巾將其橫倒看,其筆畫為橫豎橫,所以排列在A上, 起筆形似L,且其三筆從右向左看為斜斜豎,所以將其排列在L上,小的第一三筆為豎斜,兼容在Y鍵上,小的第一三筆為豎斜,兼容在H鍵上, 的第一二筆為斜橫,下面又有二點,所以排列在J上,米的上半部從左至右點豎點、所以排列在P鍵上,是一線連三橫,所以排在Q上,特別規定馬、彳、忄、田、耳、魚、雨出現在字首時,第二碼取依書寫順序出現在其后的次三筆。門、口部取其內次三筆。如其后不足三筆時,仍按原來規則編碼。在對首三筆、其后次三筆、末三筆編碼時,遇到調整后的組字單元,則要優先按最大的組字單元編碼,木、馬、蟲在字下部時移至字首后編碼。另外,阝象B。例如驥的編碼為ARJI,固的編碼為RGGU,日的編碼為E1RI。
(4)由于每個鍵上最多只有2個基本組字單元,總共才30余個基本組字單元,與俄文字母相當,且主要按筆畫或拼音或象形(與西文字母或號相似)等方式排列在鍵上,極便于記憶,當然個別似乎有點聯想、無理。
(5)有的組字單元組字頻率高,但因不足3筆,信息含量低,被舍棄,有的組字單元在6筆以上,但組字頻率低,實際信息含量不足,也被舍棄。
(6)可以將某幾種橫豎斜排列組合方式排在同一鍵上,按規則(4)編碼時也可將剩下的筆畫歸類為另外幾種筆畫,比如將折分為順折、逆折等等,這些都屬于該領域普通專業技術人員的變形,不影響本發明實質。
有的漢字為左中右結構或上中下結構,兩頭組字單元又完全相同,形似夾著一個組字單元,本發明人稱之為夾字架。對夾字架可去掉其字首或字尾的組字單元,然后編碼,在實施例中去掉字尾的組字單元后編碼。
左中右結構,中間在三筆及以上,右邊為刂,上中下結構,上面為立,下面為兒也屬于廣義上的夾字架,對這些夾字架可同樣去掉字尾的組字單元后編碼。
赤部不屬于土部,齒、步部不屬于止部,所以應按下半部的首三筆編碼。與載類似結構重心在車處,與贏類似結構重心在貝處,所以應按重心所在編碼。另外約定組字單元玉、甫、戔右角的點忽略不計。
有的漢字為上下結構,并且至少有2個相同的組字單元依次出現在字尾,本發明人稱之為疊字架,對疊字架若有2個相同的組字單元,則形部第2碼取英文第一個字母A,若有3相同的組字單元,則取英文第二個字母B。左右結構,右面又為上下結構,并且至少有2個相同的組字單元依次出現在字尾,也屬于廣義上的疊字架,編碼為B。
實施例弼WEBI 贏JRY;輔BFFU 荔HBLI一種電腦漢字編碼方法五三音碼1 NWVS E0DM YONK S9HJ KZZI LHBMXAMA M5FH SCFA 5 3 JEYN XAMA其中電的簡碼EDM 漢的簡碼SHJ 方的簡碼MFH
作為五三音碼的一種變形,對6筆及以上的漢字形部編碼或者按筆畫或拼音或象形等方式先對義部編碼,一般當義部在字首時,第二碼取字尾三筆,在字尾時取字首三筆,在字中時約定取字首或字尾三筆。由于部首數量劃分不一,位置不易確定,相比之下以前一個方案為優選。
本編碼字詞兼容,不必進行換檔等附相操作,重碼字極少,重碼選擇方法和其它輸入法相同,另外還設置了去重鍵“。”也就是將形部編碼第二位碼改為“。”,這樣不影響指法,又可消除重碼,利于專職追求高速,“?”鍵為萬能查詢鍵,當某一位碼難以確定時,可用“?”代替,再利用提示行選擇,不足規定碼長的均以空格鍵結尾。
本編碼還提供了一種新的漢字修改方法,它使得漢字修改與西文差不多容易,方法是將光標移至所需要修改的字下,若該字與改后的字同音,雙擊改后的字的五三音碼形部編碼,改后的字即上屏,當然這需要強大的軟件支持。本方法顯然適用于語音語句輸入后的修改,軟件允許的話,只需念形部編碼的讀音。
本發明適用于一切大、中、小、微型計算機中文信息處理系統和通訊系統,可廣泛應用于中文終端、中文電傳、電腦打字和計算機排版印刷等各個方面,可在互聯網環境下運行。
本發明可以適用于繁體字的港、澳、臺地區,也可以用于日文、韓文,只是日文、韓文漢字與普通話讀音不同,組字單元的排列不完全相同,排列方法仍然相同。
五三音碼編碼規則極為簡單、客觀,音碼部份以雙拼法為最快,對于已經掌握雙拼法的人來說,不出短短十分鐘就能學會,而且學會后就能牢記不忘,沒掌握雙拼法的人可在練習雙拼法時同步學會。單字碼長最長不過四碼,重碼率幾乎為0,免去了同音字選擇煩惱,音碼部分選用南方模糊音幾乎不會增加重碼,南方模糊音的特點是c、s、z與ch、sh、zh,及in與ing不分,en、eng與清輔音b、p、m、f相拼時區分。支持語句輸入,不易疲勞。容量大,從理論上講可以容納全部6萬多個漢字,做到高速脫稿輸入,也就是說不僅適合于盲打,還適合于聽打、想打,使得漢字無論是輸入速度還是調出速度都要快于西文。
圖1、橫豎斜三類根本筆畫與漢字各種筆畫對應關系表。圖2、三個筆畫中橫豎斜的27種排列組合形式在鍵盤上的一種優選排列圖。圖3、一級簡碼和同類高頻字。圖4、優化五三音碼形部編碼鍵盤排列圖。圖2、圖4中1、2、3分別為橫、豎、斜的代號。
權利要求
1.一種五三音碼,其特征是組合五三筆碼和音碼,并允許以橫豎斜的排列組合不外乎27種,一一對應或大致一一對應地排列在27個或不足27個互不相同的鍵上為基礎,調整某些組字單元包括筆畫、若干特定結構漢字的歸類編排取碼方法的編碼。
2.一種五三音碼形部編碼鍵盤排列圖,其特征是橫豎斜的排列組合不外乎27種,一對應或大致一一對應地排列在27個或不足27個互不相同的鍵上,并允許把某些組字單元排列在鍵上。
3.根據權利要求1所述的五三音碼,其特征是當超過五三筆碼規定的最多碼長時,改取最后一碼,當規定碼長較短時,補上該漢字音碼,音碼可以為全拼或簡拼或混拼或雙拼或該漢字拼音前2個字母。
4.根據權利要求2所述的優化五三音碼形部編碼鍵盤排列圖,其特征是橫豎斜的排列組合不外乎27種,一一對應地排列在標準鍵盤的鍵上,排列組字單元時,一般要考慮兩點(1)避免容易出現在編碼同一位置的組字頻率高的組字單元及橫豎斜某種排列組合排列在同一鍵上,(2)漢字同音字因素,另外還可以參考鍵位壓縮或組字單元及橫豎斜排列組合的實用頻率或指法規則。
5.根據權利要求4所述的優化五三音碼形部編碼鍵盤排列圖,其特征是將基本組字單元主要按筆畫或拼音或象形方式排在鍵上,基本組字單元數與西文字母數大體接近,基本組字單元數還可以包含要么互為繁簡,要么互相同源,要么音或形或義基本相近的組字單元,有的組字單元甚至還可以規定必須位于漢字的特定位置,或者規定與某些近似的組字單元相區別。
6.根據權利要求3或5所述的優化五三音碼,其特征是形部編碼為(1)、對1至5筆的漢字按書寫順序根據每三筆的橫豎斜排列組合情況編碼,當剩下的筆畫不足三筆時歸類為幾種筆畫,用數字鍵編碼,一般歸類為橫豎撇捺折五類筆畫,當剩下一筆時,若為橫或豎或撇或捺或折,編碼分別為五個互不相同的數字,當剩下二筆時,可約定按剩下第一筆或第二筆編碼,第一筆或第二筆為橫或豎或撇或捺或折,編碼分別為另外5個互不相同的數字;(2)、對六筆及以上的漢字根據首三筆和末三筆的橫豎斜排列組合情況編碼;(3)、遇到排列在鍵上的組字單元可以規定優先按該組字單元編碼,有的組字單元還可以規定移動其在漢字中的位置后編碼或取其次三筆;(4)、遇到特定結構的漢字可以規定另行處理。
7.根據權利要求6所述的五三音碼,其特征是特定結構的漢字的形部編碼規則主要為(1)、對重心在漢字中某一位置的漢字要優先按重心所在編碼;(2)、對左中右結構或上中下結構,兩頭組字單元又完全相同的漢字可約定去掉某一頭后編碼;(3)、對上下結構并且至少有2個相同的組字單元依次出現在字尾的漢字可用一個或幾個優選的字母代替。
8.根據權利要求6所述的五三音碼,其特征是對6筆以上的漢字或者先對義部主要按筆畫或拼音或象形方式編碼,形部編碼第二碼一般當義部在字首時取其字尾的三筆,義部在字尾時取其字首的三筆,義部在字中時可約定取字首或字尾的三筆,對字首或字尾的三筆根據其橫豎斜的排列組合情況編碼。
全文摘要
本發明五三音碼提供一種組合五三筆碼和音碼的電腦漢字編碼輸入方法,它具有幾分鐘學會、大部分漢字不必選擇同音字、輸速快的優點。采用調整方案的,也就是采用以碼長最多為2碼的五三筆碼為基礎,組字單元為配合,漢字結構為補充并結合拼音的,甚至可以幾乎不選同音字,從而實現高速脫稿輸入,而學成時間僅需10多分鐘。
文檔編號G06F3/023GK1325052SQ0111140
公開日2001年12月5日 申請日期2001年3月5日 優先權日2000年3月8日
發明者王治陽 申請人:王治陽