專利名稱:結構型漢字編碼輸入法的制作方法
技術領域:
本發明涉及一種漢字編碼輸入技術,特別涉及在計算機、打字機及類似裝置上使用的漢字編碼輸入方式的文字處理系統。
隨著微型計算機在各個領域的廣泛使用,國內外的研究人員通過對微型計算機上流行的行編輯程序以及字處理系統進行改造,已將其用于對漢字的輸入與編輯。在漢字輸入方法上應用面較廣泛的幾種漢字操作系統中,主要配備了拼音、聯系、區位、國標、電報、首尾、五筆字型等漢字輸入方案。其中“五筆字型”是目前國內影響較大,應用面較廣,公認使用較為方便合理的一種漢字輸入法。雖然“五筆字型”漢字輸入方法比較直觀易學,輸入速度也較快,但由于其必須使用二十五個字母鍵來表示125個字根,在每個鍵位上一般安排有2至6種字根,鍵入字根時,需要查找各基本字根所在的鍵位,操作者在指法上必須經過較長時間的專門訓練、熟練記憶并掌握各字根所在的鍵位,才能達到一定的操作速度和實現盲打,訓練時間較長,記憶量較大,不便于迅速普及推廣。
本發明的目的在于提供一種操作更為簡便迅度的漢字編碼輸入方法。
當我們對漢字字形加以分析,就能得出這樣的結論,有的漢字可以分析出幾個具有獨立意義的漢字,有的漢字卻不能再行分析,那些不能再行分析的具有完整形體和獨立造字意圖的漢字,我們稱之為獨體字。而那些由兩個或兩個以上的獨體字按一定的組合規律組合而成的,有一定造字意圖的漢字,稱之為合體字。部首是指不具有獨立造字意圖的,但具有完整的形體,與獨體字能夠構成合體字的單位,部首中有的是獨體字的變形,更多的則是純粹的結構符號。當我們把部首和獨體字稱為字根時,也可以說漢字是以字根為單位,采用積木方式拼合起來的,而字根又由筆形構成。也就是說把每個字根機械地進行分析,就可得到若干的筆形,每個字根都具有一定數目的筆形,筆形的數量我們稱之為筆畫。
本發明就是利用了漢字組合的這一特征,設計出結構型漢字編碼方案的。
本發明是這樣實現的。
本發明涉及一種在計算機、打字機及類似裝置上使用漢字編碼輸入方式的文書處理系統,在該文書處理系統中的操作鍵盤上至少包括下列操作鍵功能鍵,即用于決定操作時編碼的輸入方式的鍵;
數字鍵,即用于輸入漢字編碼的鍵;
選字鍵,即用于對提示行上的字進行選擇的鍵;
空格鍵,即用于要求繼續提示的鍵;
清除鍵,即用于作廢某一次字碼輸入的鍵;
對于錯誤碼或不存在的字碼的輸入,系統會自動作廢該次輸入,并發出信號,等待新的輸入,本發明特征在于在對上述數字鍵進行操作時,所采用的漢字編碼輸入方法為一、將獨體字的編碼按照第一碼取該字的筆畫,即字碼,第二碼補零,第三碼取該字的起筆筆形代碼,第四碼取該字的收筆筆形代碼。
上述編碼中所提到的筆形是指構成現代漢字的各種點和線的形狀。為了適合漢字編碼技術的需要,我們將各種筆形概括為五種筆形,即橫、豎、捺、撇、勾。依其使用頻度,設立相應的代碼為0、9、8、7、6。即下列筆形配上下列相應的筆形為0-橫-一ㄥ
9-豎-丨
亅8-捺-
丶ㄑ7-撇-丿フ
6-勾-乙乚乛了
由上述規則可見,下列獨體字的編碼為手4079,筆畫4,補0,起筆筆形代碼7,收筆筆形代碼9。
良7088,筆畫7,補0,起筆筆形代碼8,收筆筆形代碼8。
二、將合體字的編碼按照筆形的書寫順序“讀”出組成合體字的各個部件(包括獨體字、部首或筆形)的筆畫數(即字碼或代碼,一般為0-9)的一組四位碼作為該合體字的編碼。
a、如果一個合體字的部件超過四部時,按漢字的結構取前四部筆畫編碼,例如嘲3242口-3,十-2,日-4,十-2橙4513木-4,癶-5,一-1,口-3滾3222氵-3,亠-2,八-2,厶-2b、如果一個合體字的部件剛好四部時按漢字的結構順序依次取四部筆畫,構成漢字的四位編碼,例如路3433口-3,止-4,夂-3,口-3統3222纟-3,亠-2,厶-2,兒-2常3233-3,冖-2,口-3,巾-3c、如果一個合體字的部件為三部時按漢字的結構順序依次取三部筆畫,第四碼取該字末部的收筆筆形代碼,如程5340禾-5,口-3,王-4,收筆“一”的筆形代碼為0,黃4528-4,由-5,八-2,收筆“丶”的筆形代碼為8,d、如果一個合體字的部件為二部時按漢字的結構順序依次取二部筆畫,第三、四碼取末部的起筆及收筆筆形代碼,如取6278 耳-6,又-2,又的起筆筆形“
”代碼為7,收筆筆形“
”代碼為8,三、詞匯編碼,在中文中,由單字可以組成成千上萬條的詞匯,且字和詞是混合在一起使用的,為了體現中文漢字的這一特點,在以單字編碼為基礎上,結構型設立了詞匯編碼,使系統既能準確地處理盡可能多的單字,又能有效地處理常用詞匯。為了相應地提高輸入速度,所有詞匯編碼一律為等長四碼,其碼型與單字碼完全相同。詞匯編碼按組成詞匯的單字數,分為雙字詞、三字詞、四字詞和多字詞四種情況,其輸入方式如下a、雙字詞取每個單字的前二碼,組成四位碼,如果詞匯中的字為獨體字,則按該獨體字的筆畫取兩個相同的重碼,如對待2332一定1135滋長3344b、三字詞取前兩個字的第一碼,最后一個字的前兩碼,(若最后一個字為獨體字時,取相同碼)組成四碼,如新技術2355計算機2642微型機3142c、四字詞每個字各取其第一碼,組成四碼,如中外合資4332家用電器3253自動控制6232d、多字詞取前四個單字的第一碼,組成四碼,如中國科學院4353中華人民共和國4225本發明的結構型漢字編碼輸入方法是將漢字分析為獨體字、部首和筆形三部分,由于只利用0~9十個數字鍵,因此不需要經過專門的指法訓練,就能實現對漢字及其詞匯進行直觀快速的編碼輸入(即實現盲打),做到見字識碼,會寫就會輸入,且簡明易學,記憶量少,本編碼的輸入方法對簡體字和繁體字均可適用。
采用本編碼法出現重碼字時,可以采用按其實用頻度作分級處理的辦法。即較常用的字首先顯示在顯示行的正常編輯位置上,若正好是用這個常用字,可繼續輸入下文,此字會自動顯示在正常編輯位置上,而不影響輸入速度。如果需要的是不常用的字,只需按與該字在提示行中的序號相同的數字鍵,所要的字即可顯示在現行編輯位置上。重碼時也可采用拼音字母進行選字,即當出現重碼時,只需按與該字的第一個拼音字母相同的字母鍵,所要的字即可顯示在現行編輯位置上,從而大大地縮短了重碼的選擇。
參見附圖
,這是作為一個實施例的操作鍵盤,采用結構型漢字編碼輸入法必須至少具有下述操作鍵并且按下述規程操作1、功能鍵(1),位于鍵盤的左邊,用于決定操作時編碼的輸入方法的鍵,因為一個文字處理系統可以同時采用幾種漢字輸入方法進行操作,所以必須通過功能鍵進行轉換。
2、數字鍵(2),位于鍵盤的右邊,用于輸入漢字編碼的鍵,鍵入一經開始顯示器的正常編輯位置上立即顯示與鍵入的編碼相對應的漢字。
3、數字選字鍵(3),位于鍵盤的頂部,用于對提示行按頻度順序出現的字進行選擇的鍵,由于在做了上述操作后,所要的漢字按頻度順序停留在提示行上,故需按與所要字在提示行中的序號相同的數字選字鍵。(包括0-9,10個數字鍵)。
或采用字母選字鍵(4),位于鍵盤的中央,用于對提示行中按拼音的第一個字母出現的字進行選擇的鍵(包括26個字母鍵)。
4、空格鍵(5),位于鍵盤的下部,用于要求繼續提示選字的鍵,若提示行所提示的五個或十個漢字中,沒有所要求的漢字,這時須按下空格鍵,要求繼續提示,然后用選字鍵輸入。
5、清除鍵(6),鍵盤中的ESC鍵被定義為清除鍵,是用于作廢其一次字碼輸入的鍵,即當操作者誤打為另一組編碼時,具有清除該編碼的功能。
至于錯誤碼或不存在字碼的輸入,系統會自動作廢該次輸入。
為了方便掌握漢字的部首及獨體字,充分有效地使用本編碼法,現列出《漢字部首及字例表》以及《獨體字及其檢碼表》。
彡3077
3077 凡3078 么3078 及3078久3078夕3078叉3078丸3078勺3078孓3078夂3078夊3078矢3078個3079千3079川3079彳3079女3080亡3080門3086宀3086廣3087之3088義3088巛3088丫3089口3090上3090馬3090囗3090彐3090己3096弓3096已3096巳3096尸3097小3098山3099巾3099弋3008四畫王4000 巨4000 廿4000
4000
4000無4006丐4006屯4006丏4006旡4006兂4006牙4007毋4007不4008木4008太4008犬4008專4008瓦4008歹4008尤4008 戈4008
4008 不4008 中4009車4009豐4009井4009韋4009卅4009爿4009幣4009母4009卐4009月4070鳥4070丘4070壬4070毛4076片4076氏4076 冘4076 今4077 勿4077
4077長4078乏4078爪4078丹4078夭4078
4078 手4079 升4079 斤4079 牛4079予4079幣4079方4080方4087戶4087
心4088為4088火4088卞4088日4090止4090丑4090日4090市4090見4096巴4096少4097尹4097水4098書4098尺4098肀4099弔4099五畫本5000世5000甘5000玉5008東5008母5008術5008丙5008未5008末5008
5008 木5008
5008 玉5008 戔5008卌5009
5009 疋5068 白5070 生5070乍5070矛5077鳥5078禾5078令5078皮5078樂5078瓜5078斥5078氐5078癶5078乎5079主5080必5087永5088四5090目5090且5090田5090由5090業5090皿5090冉5090凹5090凸5090
5090
5090
5090 電5096 民5096
5096
5098 水5098 甲5099 申5099
5099六畫西6000 耳6000 臣6000 互6000
6000
6006 米6008 頁6008 而6009
6009
權利要求
1.一種結構型漢字編碼輸入法,特別是在計算機、打字機及類似裝置上使用漢字編碼輸入法的文書處理系統,在該文書處理系統中的鍵盤上至少包括下列操作鍵功能鍵,即用于決定操作時編碼的輸入方式的鍵;數字鍵,即用于輸入漢字編碼的鍵(一般只采用0-9,10個數字鍵);選字鍵,即用于對提示行上的字進行選擇的鍵(包括0-9,10個數字鍵以及26個相對于漢字讀音的字母鍵);空格鍵,即用于要求繼續提示的鍵;清除鍵,即用于作廢某一次字碼輸入的鍵;對于錯誤碼或不存在的字碼的輸入,系統會自動作廢該次輸入,并發出信號,等待新的輸入,本發明的特征在于,在對上述數字鍵進行操作時,所采用的漢字編碼輸入方法為A、將獨體字的編碼按照第一碼取該字的筆畫,即字碼,第二碼補零,第三碼取該字的起筆筆形代碼,第四碼取該字的收筆筆形代碼,這樣一種四位碼的方式輸入;或B、將合體字的編碼按照筆形的書寫順序“讀”出組成合體字的各個部件(包括獨體字、部首或筆形)的筆畫(即字碼)或筆形代碼組成的一組四位碼作為該合體字的編碼。a、當一個合體字的部件超過四部時按漢字的結構取前四部筆畫編碼,b、當一個合體字的部件剛好四部時按漢字的結構順序依次取四部筆畫,構成漢字的四位編碼,c、當合體字的部件為三部時按漢字的結構順序依次取三部筆畫,第四碼取該字末部的收筆筆形代碼,如d、當合體字的部件為二部時按漢字的結構順序依次取二部筆畫,第三、四碼取末部的起筆及收筆筆形代碼,或C、將詞匯編碼按照如下方式輸入a、雙字詞取每個單字的前二碼,組成四位碼,如果詞匯中的字為獨體字,則按該獨體字的筆畫取兩個相同的重碼,b、三字詞取前兩個字的第一碼,最后一個字的前兩碼,c、四字詞每個字各取其第一碼,組成四碼,d、多字詞取前四個單字的第一碼,組成四碼。
2.根據權利要求1所述的結構型漢字編碼輸入法,其特征在于上述代碼代表的筆形為0-一
レ9-丨
亅8-
丶く7-丿フ
6-乙乚乛了
3.根據權利要求1所述的結構型漢字編碼輸入法,其特征在于重碼的處理方法是在按本編碼法輸入編碼后,再輸入所需漢字的頭一個拼音字母,此字即首先顯示在屏幕正常的編輯位置上,不需作任何處理,即可正常繼續鍵入。
全文摘要
本發明涉及一種結構型漢字編碼輸入技術,特別涉及在計算機、打字機及類似裝置上使用的漢字編碼輸入方式的文字處理系統。本發明是將漢字分解為獨體字、部首和筆形三部分,利用0—9十個數字鍵對漢字進行編碼。利用本發明方法不需經過專門的指法訓練,就能實現對漢字及其詞匯進行直觀快速的編碼輸入,做到見字識碼,會寫就會輸入,且簡明易學,記憶量少,本編碼的輸入法對簡體字和繁體字均可適用。
文檔編號G06F3/023GK1069350SQ9110405
公開日1993年2月24日 申請日期1991年8月4日 優先權日1991年8月4日
發明者黃文智 申請人:黃文智