專利名稱:東方漢字字根編碼法及東方漢字兼容外文編碼鍵盤的制作方法
技術領域:
本發明為東方漢字字根編碼法,它是一種新穎的形位編碼法,以及依據這一方法設計的東方漢字兼容外文編碼鍵盤。
漢字編碼的科學性和實用性是我國目前要解決漢字信息處理,實現計算機漢化的關鍵和難點。為此,人們作出了大量的研究,如拼音法,音形法等,然而現有這些編碼法要么重碼太多,計算機識別困難,鍵入速度太慢,要么就是對計算機人員不光具有準確掌握漢語拼音知識的能力,同時還要具備分拆漢字的能力,這樣就增加了學會使用的難度,上機實用性差,達不到漢字編碼簡練,鍵入速度快,實用易學,易普及的目的。
中國專利局已授予發明專利權的“優化五筆字型編碼法及其鍵盤”。在我國漢字信息處理上確實向前邁進了一大步,尤其是它運用現有26個英文字母的標準鍵盤,根據漢字筆劃順劃,字根結構,使漢字輸入達到每分鐘120-150個字,這對我國實現漢字信息處理現代化是一個很大的鼓舞,但正是由于它立足于利用原裝26個英文字母鍵盤來對漢字進行信息處理,因而使得它對漢字上千個字根優化有限,就是在它優化的字根范圍內,也不得不增加若干區分或轉譯層次,使其編碼復雜化,如它的同位字根編碼為“<鍵位代碼>+<首筆代碼>+<第二筆筆劃代碼>+<末筆筆劃代碼>”,因而帶來漢字編碼處理程序較長。又如在輸入漢字前,首先要考慮漢字經分解后的字根數,對于超過四個字根或少于四個字根的漢字其編碼程序的處理不一樣,這樣就要求操作者輸入漢字時首先要把漢字拆分為若干字根,根據字根量,才能準確輸入。
本發明提出的東方漢字字根編碼法以及東方漢字兼容外文編碼鍵盤,是本人經過八年多的努力探索研究而成的。東方漢字字根編碼法是一種新穎的形位編碼法。
其形-是指漢字的字根形和結構形。漢字的字根形有三種一筆獨立的,如“丶、一、丨、丿、乙等”;幾筆不交接的,如“八、冫、川、彡、巛等”;幾筆交接穿插的,如“丁、十、日、月、中、母、冊、又等”;漢字的結構形有九種獨體形,如“大、目、木、口等”;夾形,如“坐、巫、兆等”;穿插形,如“秉、夷、吏等”;上下形,如“音、意、琴、晶等”;左右形,如“行、微、部、韶等”;半包圍形,如“慶、屋、司、武、栽等”;開口形,如“兇、醫、成、同等”;全包圍形,如“園、因、團等”;載托形,如“運、爬、趕、題、處等”。
其位-是指字根在漢字結構中的位置次第。如“部”和“陪”字,均有三個相同的字根“立、口、阝”,因字根所處的位置不同,書寫時,其先后次第也不同,而構成了兩個不同讀音,不同含意的字。又如“景”和“晾”字,不僅字根相同,書寫時,其次第也相同,因其字根“日”所處的位置不同,結構形不同,而構成了兩個不同讀音,不同含意的字。再如“林”和“森”字,其字根只有一個相同的“木”,因其字根量的不同,結構形不同,而構成了兩個不同讀音,含意相近似的字。
字根是構成漢字的基本單元,相同或不同的字根之間相互并列、重疊、穿插、交接組合在一起,因其字根量的不同,字根組合方式不同,字根所處的位置不同,書寫時的次第不同就是產生成千上萬個漢字的基本原理和方法。
一、本發明就是在上述基本原理和方法的指導下,為實現漢字快速編碼,在構字單元的選擇上,采取了下列優化措施1.首先將1000左右的字根用于對8000多個漢字實施分拆統計,精選出構字能力強的字根,作為一個構字單元。
2.對8000多個漢字,按一般書寫漢字的規律和習慣,根據字根所處位置的頻率,優化出次第在前三位頻率較高的字根,作為一個構字單元。
3.將含有四個以上字根的漢字,經過綜合分析研究,選其部分漢字或兩個以上的字根,作為一個構字單元,以便減少擊鍵次數。
4.將人們比較容易分析為兩個字根的部分獨體字,不作為一個構字單元,分作為兩個構字單元,減少其構字單元數量。
5.將漢字或字根的簡寫體或繁寫體,變異體,變向體,均作為同一個構字單元。
這樣就形成了“東方漢字字根編碼總表”。(
圖1)二、在字鍵和鍵盤的設計上,采取了以下幾種手段1.將較常用的漢字分別選作每個字鍵的鍵名,并稱作母字根。其余的漢字字根按其使用頻率的高低分兩行依次排列,這些字根稱作子字根。并將這些漢字字根刻印在每個鍵帽上,有了明顯的標記,就有利于見字編碼和快速操作。
2.將音、形、意相近的漢字字根盡最大可能編入到同一個字鍵里,使其共用一個組配代碼,便于實現聯想或盲打。
3.為使每個字鍵帽上和整個鍵盤的清晰度更佳,將總表中的部分漢字字根的簡寫體或繁寫體,變異體,變向體剔除不刻印在字鍵帽上,但應參加該字鍵組配漢字編碼。
4.依據字根所處位置的次第頻率和構字詞能力的強弱以及手指擊鍵功能的靈敏度,在鍵盤設計上體現科學、合理的布局,把鍵盤設計成60個鍵位,并分成左右兩個區,共12行,10列,這樣就可實現如下編碼口訣“金木水火土,日月山石川。人民心目事,由己言二句。中國大開發,八方用力氣。子女小習書,央(養)才非一夕。工廠干生產,重(種)禾長東西。門口見牛魚,豐衣又足食”。從而大大提高人們的速記能力和擊鍵速率,做到易學、易記、易用。若將編碼鍵盤實體和編碼方法印刷在一張紙上,使人人手中一份,便可以做到隨時學,隨時自我進行漢字編碼模擬訓練,這對計算機的普及和應用必將起到很大的推動作用。
5.為了達到一機多用,其外文字符在字鍵中的分布是西文字母按通用英文打字機鍵盤排列次序依次排列,其字符刻印在字鍵帽的左下角;俄文字母按通用的俄文打字機鍵盤排列(其中有4個字母略有改動),其字符刻印在字鍵帽的左上角;日文五十音圖字符每段從左到右,每行從上至下依次排列,其平假名字符刻印在字鍵帽中的右上角,片假名字符刻印在字鍵帽中的右下角。同時將鍵帽上的漢文、西文、俄文、日文字符用四種顏色加以區別。
這樣便設計成了“東方漢字兼容外文編碼鍵盤”。(圖2)三.漢字編碼方法及漢字鍵入程序1.在漢字編碼方法上,應按東方漢字字根編碼總表中最大的字根進行編碼。每個字鍵的鍵名,即母字根只擊該鍵一次,作為該字的信息編碼。其后的漢字,依排列次第分別連擊二、三、四次鍵作為該字的信息編碼。例如鍵名“西”其后字根是“雨、兩、酉、、”,其鍵入程序是擊一次鍵顯示“西”,連擊二次鍵顯示“雨”,連擊三次鍵顯示“兩”,連擊四次鍵顯示“酉”。后面兩個字根不能直接鍵入顯示,只作為提示須與其它字鍵中的字根相組配后才能顯示所需的漢字。其它字鍵中的字根本身不成為其漢字都是這樣處理。
2.若漢字是由兩個以上字鍵中的漢字字根相組配,編碼時,不論該漢字字根在鍵中的次第均作為同一個編碼單元,只擊該鍵一次。編碼順序按書寫漢字的一般規律和習慣進行,即先上后下,先左后右,先外后里,先載托后乘載的原則。被分拆為兩個字根的獨體字,按書寫第一筆的字根為先。例“秉”字,先擊“禾”字根所在鍵,后擊“彐”字根所在鍵。
3.由四個以上字根構成的漢字,一般只取前三個字根即可。若遇前三個字根取了后,屏幕提醒顯示出二個漢字,若需前面的字,可不經處理繼續進行操作,若需后面的字,即按選擇鍵即可。若顯示三個以上的漢字,則按所需的字,加擊末尾字根所在鍵即可。例“裂”字,編碼順序是“一、夕、刂、衣”若只取前三個字根,得到的是“列、烈、裂”三個字,此時應加擊“衣”所在鍵。
4.對漢字構成的詞組、成語、短語、專用語、名人詩詞等實現簡碼快速編碼方法。由兩個字或三個字構成的詞組,則依漢字組詞先后次序共取四個字根,第一個漢字須取前兩個字根,若第一個字是一個字根,則取第二個字的前兩個字根,若第二個字也是一個字根,則取第三個字的前兩個字根。例“人民”,按一下“詞語”功能鍵,然后擊“人”、“民”所在鍵。“長城”則擊“長”、“土、戊”所在鍵。“新生”則擊“立、木”、“生”所在鍵。“說明”則擊“讠、丷”、“日、月”所在鍵。“海南島”則擊“氵、”,“十”、“
”所在鍵。由四個漢字以上構成的詞語均每字只取前一個字根。例“一箭雙雕”則擊“一、、又、冂”所在鍵。“中華人民共和國萬歲”則擊“中、亻、人、民、、禾、國、萬、山”所在鍵即可。
本發明可對《新華字典》和《現代漢語詞典》所收編的全部漢字進行編碼,平均每字擊鍵次數不到三次,一字最多只擊四次(不含空位鍵)。重碼少,便于取舍。
本發明可以建立一整套編碼系列,如漢字信息碼本,詞匯信息碼本,成語信息碼本,專用詞語信息碼本,名人詩詞信息碼本,漢語主題詞信息碼本等。
由上述可以看出本發明提出的東方漢字字根編碼法是一種適應能力較強的一種編碼方法,其最大的優點是從漢字字形結構出發,完全符合漢字本質特征,而且直觀,易學,實用。其鍵盤不僅是具有純漢字信息處理功能,同時又具有國際上最廣泛、最常用的幾種文字信息處理功能。它是一種比較理想的國際通用鍵盤,必將發揮應有的作用。
權利要求
1.本發明為一種東方漢字字根編碼法,其特征在于它是依據漢字的字根形,漢字的結構形和字根在漢字結構中所處的位置,次第及數量而對漢字及詞語進行編碼。
2.根據權利要求1所述的編碼法,其特征在于依據這種編碼方法對漢字分拆歸并,擇優精選出組合字詞能力強,次第在前四位頻率高的漢字字根,組成了《東方漢字字根編碼總表》。
3.根據權利要求1和2所述的編碼總表,其特征在于將編碼總表中除去部分漢字字根的簡寫體,繁寫體,變異體和變向體,均按編碼總表將漢字字根分別刻印在相對應的60個字鍵帽上,這樣就構成了《東方漢字兼容外文編碼鍵盤》。
4.根據權利要求1所述的編碼法,其特征在于將漢字字根形歸納為三種類型,即一筆獨立型;幾筆不交接型;幾筆交接穿插型。每種類型包括若干筆畫形態。
5.根據權利要求1所述的編碼法,其特征在于將漢字結構形歸納為九種類型,即獨體形;夾形;穿插形;載托形;上下形;左右形;半包圍形;開口形;全包圍形。每種類型包括若干結構形態。
6.根據權利要求1所述的編碼方法,其特征在于編碼順序以書寫漢字的一般規律和習慣,以書寫第一筆的字根為先,即先上后下,先左后右,先外后里,先載托后乘載的原則進行。
7.根據權利要求1和3,其特征在于將60個字鍵劃為十二行,十列,依次從中至兩邊,從下至上讀為“金木水火土,日月山石川,人民心目事,由已言二句。中國大開發,八方用力氣。子女小習書,央才非一夕。工廠干生產,重禾長東西。門口見牛魚,豐衣又足食。”以每一個字鍵名形成編碼口訣。
8.根據權利要求1和3,其特征在于外文字符在字鍵中的分布是西文字符按通用英文打字機鍵盤排列次序依次排列,其字符刻印在字鍵帽的左下角;俄文字符按通用的俄文打字機鍵盤排列次序依次排列,其字符刻印在字鍵帽的左上角;日文五十音圖字符每段從左到右,每行從上至下依次排列,其平假名字符刻印在字鍵帽的右上角,片假名字符刻印在字鍵帽的右下角。每字鍵中將漢、西、俄、日文字符用不同的顏色加于區別,以便鍵盤一目了然。
9.根據權利要求1和3,其特征在于對漢字進行編碼時,必須是按東方漢字字根編碼總表中最大的字根進行編碼。
10.根據權利要求1和3,其特征在于作鍵名的漢字,擊該鍵一次作為該字的信息代碼,其后的漢字則按字鍵中上行在前,下行接后的次第分別連擊該鍵二、三、四次鍵作為該字的輸入信息代碼。若與其它字鍵中的漢字字根相組配編碼時不論其漢字字根在該鍵中的次第,一律以該鍵名為代碼,即只擊該鍵一次作為該鍵中所有漢字字根的組配代碼。
11.根據權利要求1和3,其特征在于對漢字進行編碼時,按漢字一般書寫規律和習慣,只取前三個字根即可。若屏幕上出現兩個以上的漢字,經提示后,若需前一個字,可不必處理,若需后面的字,則取末尾字根。
12.根據權利要求1和3,其特征在于對《新華字典》和《現代漢語詞典》所收編的全部漢字可以進行編碼,碼長不超過四個代碼,平均每字擊鍵次數不到三次,重碼少易取舍,形成一套東方漢字信息編碼本。
13.根據權利要求1和3,其特征在于增加漢字詞語、西文、俄文、日文功能鍵,只須調檔,即可按其所需文種進行編碼。
14.根據權利要求1和3,其特征在于對漢語詞組,成語,短語,專用詞語,名人詩詞實現簡碼快速輸入檢出,其編碼方法是依詞語的漢字次第分別取每字的一至二個字根進行編碼。這樣可根據需要建立詞匯信息碼本,成語信息碼本,漢語主題詞信息碼本等,從而建立一整套中文編碼系列。
全文摘要
本發明為《東方漢字字根編碼法》以及依據這一方法設計的《東方漢字兼容外文編碼鍵盤》。這一編碼法主要根據漢字的字根形,漢字的結構形和字根在漢字結構中的位置,次第和數量對漢字進行編碼,其鍵盤為60個字鍵,可對《新華字典》和《現代漢語詞典》所收編的全部漢字進行編碼,平均每字擊鍵次數不到三次,為了使鍵盤具有多種功能,將西文、俄文、日文字符也布局在鍵盤上。采用這一新的漢字編碼法使漢字編碼更簡練,操作直觀,易學,輸入鍵入率高,為我國漢字信息處理計算機化將起很大的作用。
文檔編號G06F3/023GK1035013SQ8810976
公開日1989年8月23日 申請日期1988年12月29日 優先權日1988年12月29日
發明者李向東 申請人:李向東