專利名稱:五三音碼及其鍵盤的制作方法
技術領域:
本發明屬于電腦漢字編碼方法。是對本發明人前一項發明五三音碼的補充和完善,因此仍稱為五三音碼。將來軟件上市時改稱三五音碼。
在2001年3月5日的專利申請中,我因撰寫經驗不足,只說組字單元可以為任意個,最好與某種西文字母數相當,并沒有說可以為10或20或30或40或50或60個甚至以上,可能會被人繞過專利,因此不得不重新提出申請。另外還引進了作了改進的一分為二合體字技術,形成了完整的五三音碼體系。
本發明的目的是提供一種組合五三筆碼和音碼的電腦漢字編碼方法五三音碼。它具有幾分鐘學會,大部分漢字不必選擇同音字,輸入速度快的優點。采用調整方案的,也就是碼長最多為2碼的五三筆碼為基礎,組字部件為配合,漢字結構為補充并結合拼音的,甚至可以幾乎不選同音字,從而實現高速脫稿輸入,而學成時間僅需10來分鐘。同時克服了其它任何編碼都未能同時克服的二種主要缺陷或重碼率過高,人工干預過多,無法提高輸速;或規則繁雜,難學難記,不宜推廣。對義部和余下部分分別按書寫順序以每三筆編碼并結合拼音的五三音碼或將合體字一分為二,對第1部分、第2部分分別按書寫順序以每三筆編碼的五三音碼也具有簡單易記,重碼少、輸入速度快優點,只是規則稍微復雜點而已。
為達到五三音碼的目的,規定五三筆碼的碼長最多為L,當超過規定碼長時改取最后一碼。也就是改取位于字尾的筆畫的編碼。當規定L較短,比如為2碼或3碼時,補上該漢字的拼音,這一技術雖然簡單卻取得了大部分漢字不必選擇同音字的意想不到的良效。當規定五三筆碼的碼長最多為2碼,以每三筆編碼,為大大降低重碼,對某些組字部件作了調整。調整時要避免容易出現在形部編碼同一位置的組字頻率高的組字部件和橫豎斜某種排列組合形式排在同一鍵上,還要根據同音字的實際構成反復優選。排列時還要酌情考慮組字部件的筆畫數,組字部件及橫豎斜的27種排列組合形式的實用頻率、鍵位壓縮、指法規則等因素。所選用的基本組字部件可以為任意個,只要10來個就能非常有效地降低重碼,此后邊際遞減,為二、三十個,與某種西文字母數大體接近時就能使重碼率很低,有的組字部件還可以包含互為繁簡、互相同源、音或形或義基本接近,主要為形體直觀相似通常僅有個別筆畫差異的同類組字部件。因基本組字部件與西文字母數接近,且基本按筆畫或拼音或表形等方式排列所以極為簡單;其余用橫豎斜的27種排列組合離散,信息含量足,因此重碼率很低,這就克服了其他任何編碼都未能同時克服的2種主要缺陷。
由于漢字形體復雜,再加上鍵位壓縮,單純對首尾編碼仍有點重碼,為此可規定對少量組字部件可取其后三筆,其后不足三筆編碼規則不變。同樣遇到組字部件要優先按筆畫數最多的組字部件編碼。這一規則在輸入大字符集漢字時十分有效。
個別漢字取首尾首次都不能取分同音字,這時可針對漢字的結構作調整,對重心字某一碼要優先按重心所在編碼;夾字架可去掉某一頭后編碼;對疊字架重疊部分可優選幾個字母或其他符號作識別碼;對組合組字單元優選幾個字母或其它符號作識別碼。
作為五三音碼的一種變形,或者先對義部(部首)按筆畫或拼音或表形等方式編碼,按筆畫編碼指對義部以每三筆編碼,通常取其首三筆,按拼音編碼指取義部拼音聲母,按表形編碼指對義部與西文字母作類比編碼,對余下部分也按書寫順序以每三筆編碼,通常當義部在字首時第2碼取字尾三筆,在字中時第2碼取字首或字尾三筆,在字尾時取字首三筆。不足三筆取剩下的第1筆或第2筆。再與拼音組合。作為對五三音碼的另一種變形,將合體字一分為二,對第1部分、第2部分別以每三筆編碼,通常各取第1部分或第2部分的首三筆或末三筆。不足三筆可取剩下的第1筆或最末筆。再與拼音組合。在對三筆編碼時遇到組字部件也要優先按最筆畫數最多的組字部件編碼。
下面結合多個優選的實施例作詳細說明。
由于本發明為五三筆碼和音碼的組合發明,所以最好先掌握五三筆碼的編碼規則。將漢字的各種筆畫歸類為橫豎撇捺折,其中點作捺,豎鉤作豎,提作橫,但點提相連時提做點。因為撇捺都由上向下傾斜,故歸類為斜筆畫。而折根據其沒折、彎、鉤前的運筆方向可分別并入橫、豎、斜三類筆畫中,這三類筆畫本發明人稱之為根本筆畫。它與漢字各種筆畫的對應關系見
圖1所示。順便指出所有圖中的1、2、3都分別為橫、豎、斜的代號。還要指出這種歸類方法的要點是將撇捺并入斜筆畫,而折因為組字頻率低,如何并入橫豎斜三類筆畫中并不怎么重要。比如可將折分為彎、拐。彎指由左至右向下彎,如“口”字的第二筆等筆畫。拐指從上到下向右拐,如“七”字第二筆等筆畫。在將彎、拐分別并入橫、斜中。也可將折分為橫折、豎折、復折,再分別并入橫、豎、斜三類筆畫中。甚至可以將所有的折類筆畫都并入豎類筆畫中。這些都是該領域普通專業技術人員的變形,不影響本發明的實質。接著編碼,規則是(1)對1至4筆的漢字將其具體筆畫歸類后按書寫順序根據筆畫的相交情況編碼。
(2)對5筆及以上的漢字按書寫順序以每三筆編碼。在依次出現的三個筆畫中,橫豎斜的排列組合不外乎27種,可一一對應地排在26個英文字母及某個特定的符號鍵上,一般為標點符號鍵,如果系統允許的話,也可排在其它任何一個被指定的鍵上,甚至在標準鍵盤上新增一個鍵。為便于輸入漢字用26個字母及“;”鍵編碼。見圖2所示。
應當指出,橫豎斜三類筆畫都是抽象概念,只要考慮書寫順序,不必考慮散、連、交三種空間關系。將任何三個筆畫歸類為橫豎斜后依次排列,其三三組合都不外乎27種。某幾種橫豎斜的排列組合組字頻率低,可將其合并排在同一鍵上,這樣27種橫豎斜排列組合可合并排在不足27個字母或別的符號鍵上,但這記憶不方便,一般還是一一對應為好。上述規則是以4筆為界的,其實也可以以N筆為界,還可以規定碼長為L,當超過規定時可不對其后的筆畫編碼,也可規定改取最后筆畫的編碼,N、L均為正整數。當規定碼長較短時,不上該漢字的拼音,構成五三音碼。音碼可前可后,一經選定不得改變,在編碼實例中規定音碼在先。下面時規定五三音碼形部編碼碼長最多為2碼或3碼時的編碼規則(1)1筆的漢字,橫、豎、撇、捺、折的編碼分別為五個互不相同的符號,比如1、2、3、4、5;(2)2~5筆的漢字取其首一筆或末一筆,橫、豎、撇、捺、折的編碼分別為五個互不相同的符號,比如1、2、3、4、5。
(3)對6筆及以上的漢字取其首三筆或末三筆,對首三筆或末三筆只需根據其橫豎斜的排列組合情況以對應的字母或別的符號編碼。
(4)對1~5筆的漢字或者以每三筆編碼,對每三筆只需根據其橫豎斜的排列組合情況按對應的字母或別的符號編碼。若不足三筆,可將剩下的最末筆歸類為幾種筆畫,用幾個符號編碼,也可將剩下的最末筆改為剩下的第1筆,還可考慮剩下的筆畫數,當剩下二筆時,編碼為別的幾個互不相同的符號。一般將最末筆歸類為橫、豎、撇、捺、折用1、2、3、4、5編碼,也可用其聲母H、S、P、N、Z編碼,在所有編碼實例中用F、G、H、V、B編碼,因為排在其鍵上的橫豎斜排列組合,在字尾組字頻率較低。
(5)對6筆及以上的漢字或者按書寫順序先對頭三筆和次三筆編碼。若剩下不足三筆,對剩下的筆畫參照規則(4)處理;若剩下三筆及以上可取剩下的前三筆或末三筆。對頭三筆、次三筆、剩下的前三筆或末三筆只需根據其橫豎斜的排列組合情況以對應的字母或別的符號編碼。
規則(1)~(4)都是以6筆為界編碼,其實也可以以3筆及以上的任意筆畫數為界。比如以4筆為界,對4筆及以上的漢字不顧已經編碼過一律取其首三筆或末三筆,對1筆或2筆的漢字可直接用拼音編碼。這樣完全舍棄了剩下的筆畫,但會增加點重碼。音碼可以為全拼或簡拼或雙拼或混拼或不完整拼音。為縮短碼長,在實施例中采用雙拼,并選用微軟雙拼,見圖3所示。當然也可用別的雙拼,包括自定義雙拼。
因規則(4)包含規則(1),規則(2)要區分筆畫數,規則(5)碼長稍長,所以在實施例中按規則(3)、(4)編碼。編碼實例一(Y1F)種(VSJA)電(DMRB)腦(NKUO)漢(HJ;V)字(ZIKE)編(BMKS)碼(MADW)方(FHMB)法(FA;C)五(WUWF)三(SJQ)音(YNMQ)碼(MADW)以“種”為例,其雙拼為VS,其首三筆為斜橫豎,按圖2編碼為J,末三筆為橫橫豎,編碼為A,“種”的編碼為VSJA。又如“五”,雙拼為WU,首三筆為橫豎橫,編碼為W,最后一筆為橫,編碼為F,“五”的編碼就為WUWF。
如果采用簡碼和去重鍵,絕大部分漢字都不必選擇同音字,其它輸入法都是按字頻區分簡碼,那些字組字頻率高,用戶往往區分不清,本發明按筆畫數多少區分,筆畫數少的優先采用簡碼和去重鍵,去重鍵指將形部編碼第2碼用不參與編碼的符號代替,如“,”鍵。不過要記憶那些是簡碼,那些可用去重鍵會增加記憶負擔,力求全碼輸入時無重碼才是上策,五三音碼采用二三十個組字部件就能做到重碼低,見本發明人在先申請所示,已經公開。當時我為防止他人繞過專利,面面俱到了點,許多約定只能降低一對重碼幾乎無用,如規定車、禾部應位于字首,力、刀約定在下部時書寫順序為撇折,艸下面連橫時編碼為廿的聲母N等等。不必記憶,系統會給出兼容碼。所采用的組字部件可以為任意個比如為10、20、30、40、50、60、70、80、90、100個及以上,下面給出組字部件為十余個的編碼方案。
有些經常出現在字首或字尾的漢字組字頻率高,若完全按規則(3)、(4)編碼,容易幾種排在某一字母或其它符號鍵上,這會造成一定數量的重碼,因此有必要作適當的調整,調整的方法是將這些組字部件從組字頻率高的某幾種橫豎斜排列組合上抽出,排列到組字頻率低的橫豎斜排列組合形式上,排列時還要考慮同音字的實際構成,還可酌情考慮組字部件和橫豎斜27種排列組合的實用頻率、鍵位壓縮、指法規則,組字部件也可排在不屬于27個字母或符號鍵上。將十余個組字部件排在鍵上的方式見圖4所示,圖4還調整了橫豎斜27種排列組合形式在鍵盤上的布局,下面作具體解說(1)“豎橫橫”中的口、日、目、足、蟲慣常出現在字首,組字頻率都很高,將日、足、蟲抽出分別排到豎斜豎B、橫橫斜E、豎豎斜H鍵上,口還慣出現在字尾,排到字首字尾組字都頻率低的斜豎豎O鍵上。“橫豎橫”中的扌、土組字頻率較高,扌排到字首組字頻率較低的F鍵上,土排到組字頻率較低的T鍵上。扌還可包含“奉”的末三筆,共同的特征是二橫交一豎。“斜橫斜”中的疒、竹慣常出現在字首,將疒排到字首組字頻率較低的N上。“豎斜斜”中的小、及“衣”的末三筆在字尾的組字頻率較高,分別排到字尾組字頻率較低的H、斜斜豎L鍵上。“橫斜斜”中的大、“六”的末三筆、“文”的末三筆在字尾的組字頻率較高,將其分別排到字尾組字頻率較低的S、U、K鍵上。氵、火在字首的組字頻率較高,將氵排到C鍵上,女、纟在字首的組字頻率較高,將女排到Z鍵上。為直觀起見,將讠、亻字首組字頻率較低的I、P鍵上。
(2)蟲、小的首末筆為豎斜,兼容在H上。疒的末三筆為斜斜,兼容在N上。大起筆為橫,兼容在S上。亻為斜豎,兼容在P上。女起筆為橫斜,兼容在Z上。氵、土按聲母C、T排列。口象O、日象B、足的中部象E、扌象F、钅字頭象V、“衣”的末三筆中的豎提象L、“六”的末三筆向上旋轉后象U、“文”的末三筆旋轉后象K、讠象I,所以排在相應的鍵上。
(3)亻含人、氵含水、钅含金。除橫斜斜中的大、“六”的末三筆、“文”的末三筆中的橫筆畫兩端可一連其它筆畫外,其它組字部件中的橫筆畫兩端一律不得與其它筆畫相連。
下面是按規則(3)、(4)及圖4編碼的編碼實例一(YIF)種(VSJW)電(DMBB)腦(NKUO)漢(HJCV)字(ZIKZ)編(BMKS)碼(MAXA)方(FHMB)法(FACC)五(WUAF)三(SJQ)音(YNMB)碼(MAXA)以“電”字為例,雙拼為DM,前三筆遇到日,編碼為B,最后一筆為折,編碼為B。電的編碼就為DMBB。
漢字在其漫長的發展過程中形成了微妙的比數制,總的來看左右型的合體字大大多于上下型的合體字,上下型合體字又多于包圍型合體字。許多輸入法將這三種字型平等對待,用同樣多的識別碼去識別不大合理。部首又往往位于字首,不利于鍵位壓縮,容易造成幾個部首集中排在一個鍵上的情況,帶來重碼。有的輸入法將部首拆分以區別重碼,讓許多人不習慣,有的輸入法無視這一規律僅僅采用十個甚至更少的部首,結果造成大量的重碼,要人們去記其簡碼,表面的記憶因素少,實際的記憶量很大。從五三音碼十余個組字部件就能使重碼低,二、三十個組字部件就能使重碼很低,再增加組字部件就很再難降低重碼的邊際降重遞減規律看,采用二、三十個組字部件是最合理的。采用大字符集漢字時由于字符多,部首又容易集中在字首的情況,最好規定取某些組字部件書寫順序后的次三筆,不足三筆仍按原先編碼。結合漢字字型考慮,可規定上下結構或包圍結構、處于字首的組字部件可取其后次三筆。只有一、二筆的部首往往難以區分部首,三筆及以上的部首往往與其余部分涇渭分明的間隙,一看就知是部首。結合筆畫數與漢字字型考慮,可規定三筆及以上的上下結構或包圍結構的部首取其后的次三筆。也可規定筆畫數較多的左右結構處于字首的部首取其后次三筆,比如5筆或6筆或以上的左右結構處于字首的部首可規定取其書寫順序后的三筆。如果采用這一規定那么按圖4編碼在輸入國標6763個漢字時能使重碼較低。
有的漢字為左中右結構或上中下結構,兩頭組字部件又完全相同,形似架著一個組字部件,稱為夾字架,對架字夾可去掉字首或字尾后的組字部件取其首三筆或末三筆編碼。按圖4,弼的編碼為BIWB。
與載類似的漢字重心在車處,與贏類似的漢字重心在貝處,第二碼要按重心所在編碼。按圖4,“贏”的編碼Y;JC。
有的漢字為上下結構,并且至少有2個相同的組字部件依次出現在字尾,稱為疊字架。若有二個相同的組字部件,形部第2碼取優選的英文字母A,若有三個相同的組字部件,去優選的字母B。仍按圖4編碼,荔的編碼為LISB。
作為五三音碼的一種變形,對漢字形部編碼或者按筆畫或拼音或表形等方式先對義部(部首)編碼,在對余下部分按書寫順序以每三筆編碼。所說的對義部按拼音編碼是指取義部的聲母,參照自然碼。所說的對義部按表形編碼是指對義部與西文字母類比,參照表形碼。所說的按筆畫編碼是指按照五三筆碼以每三筆編碼。對余下部分也按書寫順序以每三筆所都音的字母或別的符號編碼。見圖2。當不足三筆時取剩下的第一筆或第二筆,規則與五三筆碼完全相同。為縮短碼長,可規定義部和余下部分各取1碼,一般當義部在字首時,第2碼取字尾三筆。義部在字中時,第2碼約定取字首或字尾三筆。義部在字尾時,取字首三筆。同樣也可以象前述方法那樣將組字部件排在鍵上,優先取碼。參照圖4。組字部件可以為二三十個甚至更多。也可以象前述方法那樣取某些組字部件后的三筆。由于部首數量劃分不一,位置不易確定。相比之下前一方案為優選。
作為五三筆碼的另一種變形,形部編碼或者將合體字一分為二。對第1部分、第2部分分別按書寫順序以每三筆對應的字母或別的符號編碼,與五三筆碼完全相同。見圖2。將合體字一分為二的方法是根據漢字的整體結構,在最初產生縫隙處將合體字一分為二,對形聲字當形部在字首或字尾時,應當以形部為界將合體字一分為二。比如“暮”字,盡管其部首為艸,但形部卻為日,所以要按形部與聲部交界處拆分。為縮短碼長,一般第1部分或第2部分各取一碼。可取第1部分或第2部分的首三筆或末三筆。不足三筆可取剩下的第1筆或最末筆。同樣也可按前述方法將某些組字部件排在鍵上優先取碼,為十多個組字部件時參照圖4。組字部件可以為二三十個甚至更多。盡管絕大多數漢字一看就知是單體字或合體字,但也有些字難以區分是合體字還是單體字,或雖是合體字卻不易拆分。相比之下仍以前一方案為優選。
本編碼字詞兼容,不必進行換擋等附加操作,重碼低,重碼的選擇方法與其它輸入法相同,或字頻或智能或筆畫數。“?”鍵為萬能查詢鍵。不足規定碼長的均以空格鍵結尾。
本編碼還提供了一種新的漢字修改方法。它使得漢字修改和西文差不多容易。方法是將光標移至所要修改的字,選定它,若該字讀音與改后的字相同,擊改后的字的五三音碼或變形五三音碼形部編碼,改后的字即上屏。當然這需要強大的軟件支持。本方法顯然是用于語句語音輸入后的修改,如果軟件允許的話,只需念形部編碼的讀音。
本發明可以適用于一切巨、大、中、小、微型計算機中文信息處理系統和通信系統,,可廣泛應用于中文終端、中文電傳、電腦打字、計算機排版印刷等各個方面。可以在互聯網環境下運行。
本發明可以適用于繁體字的港、澳、臺地區,也可以用于日文、韓文,只是日文、韓文漢字與普通話讀音不同,組字單元的排列不完全相同,排列方法仍然相同。
五三音碼編碼規則極為簡單、客觀,音碼部份以雙拼法為最快,對于已經掌握雙拼法的人來說,不出短短十分鐘就能學會,而且學會后就能牢記不忘,沒掌握雙拼法的人可在練習雙拼法時同步學會。單字碼長最長不過四碼,重碼率幾乎為0,免去了同音字選擇煩惱,音碼部分選用南方模糊音幾乎不會增加重碼,南方模糊音的特點是c、s、z與ch、sh、zh,及in與ing不分,en、eng與清輔音b、p、m、f相拼時區分。支持語句輸入,不易疲勞。容量大,從理論上講可以容納全部6萬多個漢字,做到高速脫稿輸入,也就是說不僅適合于盲打,還適合于聽打、想打,使得漢字無論是輸入速度還是調出速度都要快于西文。
權利要求
1.一種五三音碼,其特征是組合五三筆碼和音碼,并以橫豎斜的排列組合不外乎27種,可一一對應或大致一一對應排在27個或不足27個互不相同的字母或別的符號鍵上為基礎,允許將漢字分為義部、余部或按書寫順序將合體字一分為二、調整某些組字部件包括筆畫、若干特定結構的漢字的歸類編排取碼方法的編碼。
2.一種五三音碼形部編碼鍵盤排列圖,其特征是橫豎斜的排列組合不外乎27種,一一對應或大致一一對應地排在27個或不足27個互不相同的字母或別的符號鍵上,允許把某些組字部件排在鍵上,組字單元可以為任意個,可以為10、20、30、40、50、60、70、80、90、100個及以上。
3.根據權利要求1所述的五三音碼,其形部編碼特征是對1~5筆的漢字主要按書寫順序根據每三筆的橫豎斜排列組合情況以對應的字母或別的符號編碼;
4.根據權利要求1所述的五三音碼,其形部編碼特征是對6筆及以上的漢字根據首三筆或末三筆的橫豎斜排列組合情況以對應的字母或別的符號編碼。
5.根據權利要求1所述的五三音碼,其形部編碼特征是有的組字部件還可以取其書寫順序后的三筆。
6.根據權利要求5所述的五三音碼,其形部編碼特征是選定組字部件,一般要考慮組字部件的筆畫數或漢字整體結構字型。
7.根據權利要求1所述的五三音碼,其形部編碼特征是對漢字的義部和余下的部分分別按書寫順序主要以按書寫順序以每三筆對應的字母或別的符號編碼,一般對義部和余下的部分各取一碼。
8.根據權利要求1所述的五三音碼,其形部編碼特征是將合體字一為分二,對第1部分、第2部分分別主要按書寫順序以每三筆對應的字母或別的符號編碼,一般對第1部分、第2部分各取1碼
9.根據權利要求8所述的五三音碼,其形部編碼特征是對形部處于字首或字尾的形聲字要在形部和聲部交界處將其一分為二。
10.根據權利要求1或2或3或4或5或6或7或8或9所述的五三音碼,其形部編碼特征是若遇到排在鍵上的組字部件要優先按筆畫數最多的組字部件編碼。
全文摘要
本發明五三音碼提供一種組合五三筆碼和音碼的電腦漢字編碼輸入方法,它具有幾分鐘學會、大部分漢字不必選擇同音字、輸速快的優點。采用調整方案就是采用以碼長最多為2碼的五三筆碼為基礎,組字單元為配合,漢字結構為補充并結合拼音,甚至可以幾乎不選同音字,從而實現高速脫稿輸入,而學成時間僅需10多分鐘。
文檔編號G06F3/023GK1435746SQ02102628
公開日2003年8月13日 申請日期2002年1月28日 優先權日2002年1月28日
發明者王治陽 申請人:王治陽