專利名稱:改進結構型漢字編碼輸入法的制作方法
技術領域:
本發明涉及一種漢字編碼輸入技術,特別涉及在計算機、打字機及類似裝置上使用的漢字編碼輸入方式的漢字操作系統。
隨著計算機在國內應用的推廣和普及,已經出現了各種各樣的漢字輸入方法。目前,在微型機上應用面較廣的幾種漢字操作系統中,主要配備了拼音、聯想、區位、國標、電報、首尾、二維三碼、王碼(五筆字型)、自然碼等漢字輸入方式。其中“五筆字型”漢字輸入法是目前國內影響較大、應用面很廣,公認使用較為方便合理的一種快速漢字輸入法。雖然“五筆字型”輸入法具有見字識碼,會寫就會輸入,輸入速度很快等優點,但同樣存在著一定的不足之處,例如使用二十五個字母鍵來表示125個字根,在每個鍵位上一般安排2~6種字根,鍵入字根編碼時,除了需要熟練記憶并掌握不同的125種字根外,還需要查找各基本字根所對應的字母鍵位。操作者在指法上還須經過專門訓練,才能達到一定的編碼操作速度和實現盲打;以及不便于迅速普及推廣等。
本發明的目的在于提供一種操作更為簡便迅速且易于推廣普及的漢字編碼輸入方法。
當我們對漢字字形加以分析后,就能得出這樣的結論,漢字可以采用積木式拼合起來(王永民正是利用漢字這一特點,設計出五筆字型漢字輸入法)。一般漢字可以分析出幾個具有獨立意義的漢字,有的則不能再行分析。那些不能再行分析的具有完整形體和獨立造字意圖的漢字,我們稱之為獨體字(五筆字型稱為鍵名或成字字根)。那些不具有獨立造字意圖的,但具有完整的形體;與獨體字能夠組成合體字的單位,我們稱之為部首。部首中有的是獨體字的變形,有的則是純粹的結構符號(五筆字型稱從屬字根)。當我們把部首和獨體字稱為字根時,也可以說漢字是以字根為單位,采用積木式拼合起來的。而當我們把每個字根再進行機械地分析,就可得到這樣的結論,每個字根都是由一定數目的筆形構成的。筆形的數量我們稱之為筆畫。
本發明就是利用了漢字組合的這一特征,設計出改進結構型漢字編碼方案的。
本發明是這樣實現的。
本發明涉及一種在計算機、打字機及類似裝置上使用漢字編碼輸入方式的漢字操作系統,在運行該漢字程序系統中的操作鍵盤上至少包括下列操作鍵
功能鍵,即用于決定操作時編碼輸入方式的鍵;
數字鍵,即用于輸入漢字編碼的鍵;
選字鍵,即用于對提示行上顯示的字進行選擇的鍵;
空格鍵,即用于要求繼續提示的鍵;
清除鍵,即用于作廢某一次字碼輸入的鍵;
識別鍵,即用于識別詞匯編碼輸入的鍵;
對于錯誤碼或不存在字碼的輸入,程序自動響鈴提示,并自動刪除該次輸入,等待新的輸入。
本發明的特征在于,在對上述數字鍵進行操作時,所采用的漢字編碼輸入方法為
一、將獨體字的編碼按照第一碼取該字的筆畫,即字碼,第二、三碼取該字的起筆和次筆筆形代碼,第四碼取該字的收筆筆形代碼,不足四碼的補零,這樣一種四位碼的方式輸入。
上述編碼中所提到的筆形是指構成現代漢字的各種點和線的形狀。為適合漢字編碼技術的需要,我們將各種筆形概括為五種,即橫、豎、撇、捺、勾。依其使用頻度設立相應的代碼為0、9、8、7、6。即下列的筆形代碼配上相應的筆形為
0-橫-一
9-豎-丨 亅
8-撇-丿
7-捺-丶
乀 ㄑ
6-勾-乙 乚 乛 ㄋ
此筆形代碼同樣適用于合體字編碼中的筆形代碼。
由上述規則可見,下列獨體字的編碼為
廠2080 字碼2,起筆代碼0,次筆代碼8,不足四碼補0。
口3990 字碼3,起筆代碼9,次筆代碼9,收筆代碼0。
水4987 字碼4,起筆代碼9,次筆代碼8,收筆代碼7。
二、將合體字的編碼按照筆形的書寫順序“讀出”組成合體字的各個部件(包括獨體字、部首或筆形)的筆畫(即字碼)或筆形代碼構成的一組四位碼作為該合體字的編碼。
a.如果一個合體字的組成部件超過四部時,按該字的結構順序依次取第一、二、三、末部筆畫編碼,例如
攀4224 木-4,
-2,
-2,手-4
滾3224 氵-3,亠-2,八-2,
-4
倒2122 亻-2,一-1,厶-2,刂-2
b.如果一個合體字的組成部件剛好四部時,按該字的結構順序依次取四部筆畫編碼,例如
路3433 口-3,止-4,攵-3,口-3
照4234 日-4,刀-2,口-3,灬-4
鏡5542 钅-5,立-5,日-4,兒-2
c.如果一個合體字的組成部件為三部時,按該字的結構順序依次取三部筆畫編碼,第四碼取該字末部的收筆筆形代碼,例如
黃4527,-4,由-5,八-2,末部八的收筆筆形代碼為7。
慚3449,忄-3,車-4,斤-4,末部斤的收筆筆形代碼為9。
溫3450,氵-3,日-4,皿-5,末部皿的收筆筆形代碼為0。
d.如果一個合體字的組成部件為二部時,按該字的結構順序依次取二部筆畫編碼,第三、四碼分別取該字首部的起筆筆形代碼和該字末部的收筆筆形代碼,例如
地3306,土-3,也-3,首部土的起筆筆形代碼為0,末部也的收筆筆形代碼為6。
肥4486,月-4,巴-4,首部月的起筆筆形代碼為8,末部巴的收筆筆形代碼為6
季5380,禾-5,子-3,首部禾的起筆筆形代碼為8,末部子的收筆筆形代碼為0。
三、詞匯編碼,中文中由單字(獨體字和合體字)可以組成詞匯,且字和詞是混合在一起使用的。為了體現中文的這一特點,改進結構型在以單字編碼的基礎上,設立了詞匯編碼,使系統既能準確地處理盡可能多的單字,又能有效地處理常用詞匯。為了相應地提高字詞的輸入速度,所有的詞匯編碼一律為等長四碼,其碼型與單字編碼完全相同。詞匯編碼按組成詞匯的單字數,分為雙字詞、三字詞、四字詞和多字詞四種。為了降低字詞間重碼,在“改進結構型”狀態下,每鍵入一條詞組前,首先應鍵入一個DEL鍵,作為詞匯編碼識別符,系統自動處于改進結構型輸入狀態,DEL鍵即被定義為詞匯識別符。然后將詞匯編碼按照如下方式輸入
a.雙字詞取每個單字全碼的前兩碼構成四碼,如
微機3342 智能2324 技工3230
b.三字詞取前兩個單字的第一碼,最后一個單字的前兩碼構成四碼,如
計算機2642 座右銘3253
c.四字詞每字各取其全碼的第一碼構成四碼,如
科技市場5323 數據處理6334
d.多字詞取第一、二、三、及最末一個單字的第一碼,構成四碼,如
國防科工委3255 漢字操作系統3333
本發明的改進結構型漢字編碼輸入方法是將漢字分析為獨體字、部首和筆形三部分,以筆畫為鍵入編碼。由于只利用0~9十個數字鍵,因而不需要經過專門的指法訓練,就能實現對單字及詞匯進行直觀快速的編碼輸入(即實現盲打),做到見字識碼,會寫就會輸入,且簡明易學,記憶量少。本編碼法對簡化字和繁體字均可適用,同時,本輸入法可以作為漢字編碼檢索方法進行推廣普及應用。
采用本編碼法出現重碼字時,可以采用按其重碼字實用頻度作分級處理的辦法。
為了更進一步地提高重碼字的選擇輸入,當采用本編碼法進行編碼出現重碼字時,對于能讀出所需字或詞的拼音,則再鍵入一個字音碼進行選擇。即對于單字重碼時,再加上一個與該字拼音第一個字母相同的英文字母鍵;對于詞匯重碼時,則再加上一個與該詞匯最后一個單字拼音第一個字母相同的英文字母鍵。若仍出現重碼字,則重碼采用實用頻度作分級處理。
為了提高常用漢字的輸入速度,本方案設立了簡碼輸入法。即對常用的漢字只取其全碼的第一個、兩個或三個字碼,構成一級、二級或三級簡碼漢字,簡碼漢字不考慮筆形代碼。簡碼共分為兩類,每類分三級。
第一類為,在鍵入簡碼后,再加打空格鍵即可輸入。
第二類為,在鍵入簡碼后,再加打字音碼即可輸入。
參見附圖
,這是作為一個實施例的操作鍵盤,采用改進結構型漢字編碼輸入法必須至少具有下述操作鍵并且按下述規程操作
1.功能鍵(1),位于鍵盤左邊,用于決定操作時選擇編碼輸入方式的鍵,因一個漢字操作系統通常采用幾種漢字輸入法進行選擇操作,功能鍵用于轉換任一種輸入法。
2.數字鍵(2),位于鍵盤右邊,用于輸入漢字編碼的鍵,當鍵入一組編碼,顯示器將顯示與該編碼相對應的字詞。
3.數字選字鍵(3),位于鍵盤的頂部,用于對提示行中按實用頻度排列出現的字進行選擇的鍵,由于在做了上述操作后,所要的字詞按頻度順序顯示在提示行上,故需鍵入與所需要字在提示行中序號相應的數字鍵。
4.字母選字鍵(4),位于鍵盤中央,用于采用字音碼選擇重碼的鍵(包括與23個漢語拼音相對應的23個字母鍵)。
5.空格鍵(5),位于鍵盤下部,用于要求繼續提示待選字的鍵,若一次提示行中沒有所需要的待選字,這時須按空格鍵,提示行自動顯示下一批待選字。
6.清除鍵(6),鍵盤中的ESC鍵被定義為清除鍵,用于作廢某一次編碼輸入的鍵。
7.識別鍵(7),鍵盤中的DEL鍵被定義為識別鍵,用于識別詞匯編碼輸入的鍵。
至于錯誤碼或不存在字碼的輸入,程序自動響鈴提示,并自動刪除該次輸入。
為方便掌握并充分有效地使用本編碼法,以下列出字根總表。本表適用于簡化字編碼輸入方案。分獨體字和部首表,并按筆畫順序排列。其中“部首”表中也包括部分不常用獨體字,< >內為前一字根的變形。<注在各種可能的字根分析中,應按取盡可能大的字根進行編碼。>
獨體字
一畫一 乙()
二畫八(
)卜(
)廠 刀()丁 兒 二 幾(
)九 力 了 乃 七 人(人) 入 十 又(
) 丌 匕(
)乜 厶
三畫才 川(
)寸 大 干 工 弓 廣 已 巾 口 馬 門 女 千 三 山 上 尸 士 巳 土 萬 亡 夕 鄉 小()也 已 于 與 丈 之 子(孑) 弋 彳 孑 孓 幺
四畫巴 貝 不 長 車 豐(
) 夫 戈 火 見 斤 井 巨 六 毛 木 牛(
)片 壬 日 氏 手(
)書 水(氺)屯 瓦 王 韋 烏 毋(
) 五 心 牙 尹 日(曰)月(月)止 爪(爫
)廿 爿
五畫白 電(
) 瓜 禾(禾)甲 立 民 皿 母 目 鳥 皮 且 丘 申 石 四(罒)田 穴 業 永 由 戔 疋(
)
六畫臣 蟲 而 耳 臼 米(※)曲 西(西)血(
) 頁 曳 羽 舟 竹()自 耒 艮(
)
七畫甫 身 辛 言 酉 豕
八畫金(
)魚 雨(
)
部首
一畫丨 丿 丶
二畫匚 刂 (刂
)冂(冂
)亻 勹()亠 冫
讠 阝 卩() 廴 凵 (
)
(
)
三畫艸 廾 扌 尢 囗 彡 犭(
) 夂(攵) 饣 忄()丬 氵 宀 辶 彐(
)屮(
) 纟 巛
)
灬
四畫攵 灬 礻 肀 耂
五畫钅 疒 衤 癶
六畫虍
七畫
臣
權利要求
1、一種改進結構型漢字編碼輸入法,特別是在計算機、打字機及類似裝置上使用漢字編碼輸入法的漢字操作系統,在運行該漢字程序系統中的鍵盤上至少包括下列操作鍵
功能鍵,即用于決定操作時編碼的輸入方式的鍵;
數字鍵,即用于輸入漢字編碼的鍵(采用副鍵盤十個數字鍵);
選字鍵,即用于對提示行上的字進行選擇的鍵(采用打字機鍵盤上的十個數字鍵)
空格鍵,即用于要求繼續提示的鍵;
清除鍵,即用于作廢某一次字碼輸入的鍵;
識別鍵,即用于識別詞匯編碼輸入的鍵;
對于錯誤碼或不存在字碼的輸入,程序自動響鈴提示,并自動刪除該次輸入,等待新的輸入。
本發明的特征在于,在對上述數字鍵進行操作時,所采用的漢字編碼輸入方法為
A將獨體字的編碼按照第一碼取該字的筆畫,即字碼,第二、三碼取該字的起筆和次筆筆形代碼,第四碼取該字的收筆筆形代碼,不足四碼的補零,這樣一種四位碼的方式輸入
或B,將合體字的編碼按照筆形的書寫順序“讀出”組成合體字的各個部件(包括獨體字、部首或筆形)的筆畫(即字碼)或筆形代碼構成的一組四位碼作為該合體字的編碼。
a.當一個合體字的組成部件超過四部時按該字的結構順序依次取第一、二、三、末部筆畫,構成四位編碼。
b.當一個合體字的組成部件剛好四部時按該字的結構順序依次取四部筆畫,構成四位編碼。
c.當一個合體字的組成部件為三部時按該字的結構順序依次取三部筆畫,第四碼取該字末部的收筆筆形代碼。
d.當一個合體字的組成部件為二部時按該字的結構順序依次取二部筆畫,第三、四碼分別取該字首部的起筆筆形代碼和該字末部的收筆筆形代碼。
或C,在“改進結構型”狀態下,每鍵入一條詞組前,首先應鍵入一個DEL鍵,作為詞匯編碼識別符,然后將詞匯編碼按照如下方式輸入
a.雙字詞取每個單字全碼的前兩碼構成四碼。
b.三字詞取前兩個單字的第一碼,最后一個單字的前兩碼構成四碼。
c.四字詞每字各取其全碼的第一碼構成四碼。
d.多字詞取第一、二、三、及最末一個單字的第一碼,構成四位碼。
2、根據權利要求1所述的改進結構型漢字編碼輸入法,其特征在于上述筆形代碼代表的筆形為
0-橫-一
9-豎-丨 亅
8-撇-丿
7-捺-丶
乀
6-勾-乙 乚 乛 ㄋ
3、根據權利要求1所述的改進結構型漢字編碼輸入法,其特征在于重碼的處理是在鍵入按本編碼法輸入的四位碼字后,再加上一個字音碼輸入進行重碼字的選擇。若仍出現重碼,則重碼字采用實用頻度作分級處理。
4、根據權利要求1和3所述的改進結構型漢字編碼輸入法,其特征在于當對常用的漢字進行編碼時,可取其簡碼輸入。
全文摘要
本發明涉及一種改進結構型漢字編碼輸入技術,特別涉及在計算機、打字機及類似裝置上使用的漢字編碼輸入方式的漢字操作系統。本發明是將漢字分析為獨體字、部首和筆形三部分,利用0~9十個數字鍵對漢字進行編碼操作。利用本發明方法不需經過專門的指法訓練,就能實現對漢字及其詞匯進行直觀快速的編碼輸入,做到見字識碼,會寫就會輸入,且簡明易學,記憶量少,本編碼的輸入方式對簡化字和繁體字均可適用,同時,本編碼輸入法可以作為一種漢字編碼檢索方法進行推廣應用。
文檔編號G06F3/023GK1064958SQ92101839
公開日1992年9月30日 申請日期1992年3月18日 優先權日1992年3月18日
發明者黃文智 申請人:黃文智