專利名稱:漢字積木規范部件碼輸方法及其通用鍵盤的制作方法
技術領域:
本發明屬于中文信息處理技術領域,特別是涉及一種漢字鍵盤輸入技術及其計算機通用鍵盤設計。
術語解釋1、部件(即漢字“部件”)由五種單筆畫構字單元和由單筆畫組成的具有組配漢字功能的構字單元(過去叫“字元”、“字根”);國家語言文字工作委員會《信息處理用GB13000.1字符集漢字部件規范》(以下簡稱《部件規范》,1998年5月1日起實施)共計560個部件,實施后統一稱為“部件”。所有漢字由1個部件或兩個部件或多個部件構成。一個漢字的部件有多達18個部件的。
2、規范部件碼(以下簡稱“部件碼”)是指本發明符合下述標準和規范①信息處理用GB13000.1字符集漢字部件規范;②ISO10646C.J.K.國際標準;③GBK中國標準;④國家語委《漢字筆順規范》;⑤中國標準GB/T18031-2000《信息技術和數字鍵盤漢字輸入通用要求》等標準和規范。規范部件碼是指符合上述標準和規范的漢字編碼,即本發明創造。
3、漢字積木部件記載于積木上的一個漢字部件,是提供兒童、小學生學習部件碼的教學工具。寓部件于積木實物模型,使其直觀特征、獨立特征固定化,既方便識別,又避免嵌套拆字的隨意性所帶來的混亂。
4、非字部件不能獨立成字的部件。但《部件規范》沒有分類。
5、成字部件可以獨立成字的部件。但《部件規范》沒有分類。
6、起筆漢字楷書第一筆(依據國家語委《漢字筆順規范》,1997年4月7日施行)。
7、首形專指非字部件的起筆特征和與非字部件的起筆構成的“叉形”特征和“框形”特征;非字部件的首形特征有一(橫筆)、丨(豎筆)、丿(撇筆)、丶(點筆)、 (折筆)、乂(叉形)、(框形)七種首形特征。
8、首形部件碼與非字部件首形特征對應的輸入編碼,即是非字部件的輸入鍵位。
9、首聲專指成字部件的漢語拼音第一字母,也稱首聲字母。
10、首聲部件碼與成字部件首聲字母對應的輸入編碼,即是成字部件的輸入鍵位。
目前,國內外的計算機漢字編碼輸入方法近千種,但能夠覆蓋ISO10646C.J.K.國際標準(1993年)和GBK中國標準(1998年)的20902個漢字,同時又符合國家語委《漢字部件規范》(1998年)、《漢字筆順規范》(1997年)和GB/T18031-2000《信息技術和數字鍵盤漢字輸入通用要求》(2000年)的漢字編碼鍵盤輸入方法,尚未見到。現有同類漢字鍵盤輸入技術中有“鄭碼”(鄭易里,中國專利申請號89108851.2,中國專利局《發明專利公報》,1990年第25號公開)。九年前國家尚未頒布《漢字部件規范》,鄭碼的字根(《漢字部件規范》統稱部件)還有一部分不符合《漢字部件規范》和《漢字筆順規范》。鄭碼上市推廣應用已有九年,至今還不夠普及,廣大用戶仍然需要一種易學好用的新的漢字鍵盤輸入方法。
本發明的目的是為國內外提供一種符合國際、國內標準和國家漢字規范的新的漢字鍵盤輸入技術,并要求簡單、易學、速度快;適合三年級小學生以上用戶。適合小學生、中學生、職高生、大學生、干部、教師、科技人員、老年人、中年人都可使用;達到能夠輸入20000多單字和各種詞組,從而把漢字鍵盤輸入技術提高和普及到一個新的水平。本發明是通過以下的漢字鍵盤輸入技術及其通用鍵盤設計實現的。
1、一種依據漢字《部件規范》,以首形、首聲部件碼為基礎的計算機漢字積木規范部件碼輸入方法,使用經過重新定義的計算機通用鍵盤的漢字鍵盤輸入技術,其特征在于它是由有機聯系,相互依存而又相互促進的漢字單字輸入法、詞組輸入法組成,所述單字輸入法包括從《部件規范》的560個部件中,經系列研究,獲得277個非字部件和232個成字部件,并將所述277個非字部件和232個成字部件定義為部件碼的特征元集;將所述非字部件按其首形特征分別為一筆、丨筆、丿筆、丶筆、 筆、乂形、形七種首形特征,并將這七種首形部件碼按照所述通用鍵盤定義到計算機鍵盤的H、I、P、D、V、X、U七個字母鍵上;將所述成字部件按其首聲部件碼編碼輸入,并按照所述通用鍵盤定義到與其首聲字母相同的B、C、D、E、F、G、H、J、K、L、M、N、P、Q、R、S、T、W、X、Y、Z、21個英文字母鍵上,從而構成部件碼的成字部件特征元集;利用通用鍵盤上的相應非字部件的首形部件碼字母鍵輸入漢字的首形部件碼;利用通用鍵盤上的相應成字部件的首聲部件碼字母鍵輸入漢字的首聲部件碼;借助于所輸入的漢字首形部件碼和首聲部件碼輸入漢字中的任何一個漢字;2、根據權利要求1所述的漢字積木規范部件碼輸入方法及其通用鍵盤,其特征在于所述詞組輸入法中,二字詞分別各取兩字的頭、尾部件碼;三字詞取第1字頭、尾部件碼,取第2字的頭部件碼,取第3字的尾部件碼;四字詞及四字以上的詞取前三字的頭部件碼和末字的尾部件碼。
3、根據權利要求1所述漢字積木規范部件碼輸入方法及其通用鍵盤,其特征在于所述的漢字部件碼的非字部件特征元集所對應的首形部件碼、部件碼的成字部件特征元集所對應的首聲部件碼與計算機通用鍵盤26個字母鍵的確切對應關系,從而構成部件碼的首形、首聲特征元集鍵盤鍵位布局總表。
4、根據權利要求1所述的漢字積木規范部件碼輸入方法及其通用鍵盤,其特征在于所述漢字部件碼的277個非字部件特征元集與其首形特征輸入鍵位七個字母鍵的確切對應關系,從而構成部件碼的非字部件首形特征元集鍵盤健位布局表所示如表
部件碼首形、首聲特征元集鍵盤鍵位布局總表
部件碼非字部件首形特征元集鍵位布局表
下面結合部件碼首形、首聲特征元集鍵盤鍵位布局總表對本發明實施例的主要技術內容進一步詳細說明。
本發明的基本思路是①借鑒兒童漢字積木,直觀拼字,一個部件碼就是一個漢字積木,會玩漢字積木就會用部件碼直觀拼字輸入漢字單字和詞組(詞組的數量無限制);②借鑒英文用英文字母輸入英文單詞。例如,英文用W、A、T、E、R五個英文字母輸入“WATER”(水)。以此類比,部件碼用“木”、又”、“寸”三個部件的首聲部件碼“M”、“Y”、“C”輸入漢字“樹”字;會英文打字就會用部件碼首形、首聲特征元集鍵盤鍵位布局總表上的部件碼特征元集鍵盤鍵位布局、輸入20902個單字及其無限量的詞組,并打出文件、報告和報刊文章。
本發明是通過以下的漢字鍵盤輸入技術及其通用鍵盤設計實現的。計算機漢字積木規范部件碼輸入方法(簡稱“部件碼”)由①漢字單字輸入法為基礎;②漢語詞組輸入法為主體;③結合最高頻用字和最常用字輸入法;④成字部件初學入門提示輸入法;⑤非字部件提示輸入法,⑥成字部件無重碼快速輸入法所構成的相互有機聯系、與相互依存而又相互促進的漢字鍵盤輸入技術系統實現的。
所述非字部件和成字部件,因《部件規范》對非字部件和成字部件只有定義,沒有分類;所述非字部件是本發明人經系列研究分類;從《部件規范》的560個部件中經研究獲得277個自定義的非字部件,經與1988年國家語委和國家教委聯合發布的“常用字表”以及國家語委和國家新聞出版署聯合發布的“通用字表”進行驗證,在上述兩個“字表”中均沒有發現上述自定義的任何一個非字部件;而兩個“字表”覆蓋了各種出版物2100多萬用字的99.99%,說明本發明所定義的277個非字部件符合漢字使用實際。
所述成字部件都是由一個部件構成的漢字單字。成字部件是本發明人經系列研究分類;從《部件規范》的560個部件中經研究獲得232個自定義的成字部件,經與上述“常用字表”和“通用字表”進行驗證,有218個成字部件屬于“常用字表”,同時又是小學《語文》課本的用字;有14個成字部件屬于“通用字表”;說明這232個自定義的成字部件符合漢字使用實際,而且是小學文化程度以上的八億人都認識的字,這也是本發明面向廣大用戶的基礎。
所述單字輸入法包括從《部件規范》中獲得的自定義的277個非字部件特征元集及其鍵盤鍵位布局和自定義的232個成字部件特征元集及其鍵盤鍵位布局與其漢字鍵盤輸入技術系統實現的;將所述自定義的277個非字部件按其起筆特征和由非字部件的起筆構成的“叉形”及,其“框形”特征,分別用首形部件碼編碼輸入;所述非字部件的首形特征分別一(橫筆)、丨(豎筆)、丿(撇筆)、丶(點筆)、 (折筆)、乂(叉形)、(框形)七種首形特征,并將這七種首形特征元集所對應的部件碼,按照所述部件碼首形、首聲特征元集鍵盤鍵位布局總表定義到計算機通用鍵盤的H、I、P、D、V、X、U、七個字母鍵位上,同時賦于非字部件輸入鍵的鍵元名稱,并分別定名為H(橫筆鍵)、I(豎筆鍵)、P(撇筆鍵)、D(點、捺鍵)、V(折筆鍵)、X(叉形鍵)、U(框形鍵),并賦于所述于七個字母鍵為非字部件的輸入鍵元;將所述自定義的232個成字部件按其首聲部件碼編碼輸入,并按所述說明書附圖
定義到與其首聲字母相同的B、C、D、E、F、G、H、J、K、L、M、N、P、Q、R、S、T、W、X、Y、Z21個英文字母鍵位上;所述部件碼的編碼輸入,是利用計算機通用鍵盤相對應的非字部件的首形部件碼字母鍵輸入漢字的首形部件碼;利用計算機通用鍵盤相對應的成字部件的首聲部件碼的首聲字母鍵輸入漢字的首聲部件碼;這樣,就實現了ISO10646C.J.K.國際標準和GBK中國標準的20902漢字中的任何一個漢字單字的輸入技術。目前國際國內標準只有20902個漢字,部件碼將緊跟上述標準而不斷升級。
本發明部件碼的編碼規則是①碼長漢字的單字取1-4碼(即4個部件),不足4碼的單字其部件全取并加一個空格;多于4碼的單字,取頭三碼(即頭三個部件)和尾碼(即末尾-個部件)。
②取碼順序依據《漢字筆順規范》的漢字楷書筆順取碼;③詞組取碼規則是二字詞分別各取兩字的頭、尾部件碼;三字詞取第一字的頭、尾部件碼,取第二字取頭部件碼,取第三字尾部件碼;四字及四字以上的詞組,取前三字的頭部件碼和最末字的尾部件碼;詞組的取碼,若單字只有一個部件就只取一個部件。漢字的非字部件的編碼輸入,按七種首形部件碼及部件碼非字部件首形特征元集鍵位布局表上相應的H(橫筆鍵)、I(豎筆鍵)、P(撇筆鍵)、D(點、捺鍵)、V(折筆鍵)、X(叉形鍵)、U(框形鍵)七個字母鍵位輸入;在所采用的277個非字部件中,有26個非字部件同時又是非字部首,故未按首形部件碼輸入,占非字部件的9.3%,這是為了統一簡體字和繁體字輸入的需要而設計的,這屬于例外。在26個屬于例外的非字部件中,有17個常用非字部首為犭(犬)、讠(言)、(月)、(雨)、氵(水)、饣(食)、礻(示)、钅(金)、亻、彳(人)、(竹)、(八)、牛(牛)、 (西)、孑(子)、 (足)、衤(衣)分別以其掛靠的成字部件(即上列括號內的成字部首)的首聲部件碼輸入;有9個部首阝、卩(耳旁)、宀、冖(寶蓋)、艸(草頭)、( )、( )、扌(提手)、疒(病旁)分別以其部首的漢語名稱的第一字的首聲部件碼輸入,這是為了合乎部首的傳統使用習慣。
所采用的226個成字部件均按其首聲部件碼輸入,首聲部件碼與鍵盤字母鍵位相同,不須背記;但另有6個成字部件為“日、日、凸、凹、山、蟲”未按首聲部件碼輸入,約占成字部件的2.6%;這6個成字部件中,“日、日”兩個成字部件定義于“O字母鍵”(“太陽鍵”與“O”字母像形)輸入;“凸、凹、山”三個成字部件定義于“U字母鍵”(“框形鍵”的與“U”字母像形)輸入“蟲”一個成字部件,掛靠于 ”的首聲字母輸入,“ 字鍵”的“ ”字是發明人定義的,讀作“áo”,與“A”字母鍵同鍵。上述32個部件碼特征元集雖屬例外,但經在封鎖技術內容下,由內部的小學生試用,達到了一天學會輸入方法,第二天獨立輸入了短文件的全文。
所述單個非字部件的輸入方法,首形部件碼加字母鍵“000”提示輸入。單個非字部件在2100萬用字頻度中未見出現,屬于極其罕用。
所述單個成字部件(即只有一個部件的漢字單字)的輸入方法。①初學入門,首聲部件碼(即首聲字母)加字母鍵“VV”提示輸入,以方便自學;②提高盲打首聲部件碼(首聲字母)加“一、二筆及末筆筆畫”輸入。
所述最常用單字輸入及其鍵位布局最常用的26個單字采用“鍵名鍵”連擊四次輸入,有22個字母鍵均按最常用單字的首聲字母輸入,但因U、I、V三個字母鍵,漢語拼音沒有漢字,而“O”字母鍵的漢字又極少,只好采用像形聯想的單字來填補空缺,故UIVO四個字母鍵的單字是按首形輸入的,其22個白體字母鍵用單字的首聲輸入,四個黑體字母鍵用單字的首形輸入,其鍵盤鍵位布局如下所示Q W E R T Y U I O P前 為 二 任 體用 同 情 時 批A S D F G H J KL安 事 大 發 革和 就 科 來Z X C V B N M在 現 產 結 部農 命所述最常用高頻字輸入及其鍵位布局最常用的26個高頻單字采用一鍵輸入(加空格),有22個字母鍵均按最常用高頻單字的首聲字母輸入,但因U、I、V三個字母鍵,漢語拼音沒有漢字,而“O”字母鍵的漢字又極少,只好采用像形聯想的單字來填補空缺,故U、I、V、O四個字母鍵的單字是按首形輸入,其22個白體字母鍵用單字的首聲輸入,四個黑體字母鍵用單字的首形輸入,其鍵盤鍵位布局如下所示Q W E R TY U I O P起 我 而 人 提 有 國 性 口 平A S D F GH J K L愛 是 的 分 工 一 進 開 了Z X C V BN M中 學 長 經 不 年 民上列52個最常用單字的輸入,約占文件總共字數四分之一,采用上述簡化輸入方法,大大提高了輸入速度。
所述本發明部件碼的漢字單字輸入法、詞組輸入法(含詞語、詞匯),分別示例,如下表
部件碼 漢字單字輸入方法 實例
部件碼 漢字單字輸入方法 實例
部件碼 成字部件(即只有一個部件的漢字單字)提示輸入法實例 部件碼 成字部件(即只有一個部件的漢字單字)無重碼輸入法 實例
部件碼詞組輸入法實例
部件碼詞組輸入法實例
本發明漢字積木規范部件碼能夠覆蓋ISO10646C.J.K.國際標準(1993年)和GBK中國標準(1998年)中的20902個漢字,該標準是全世界目前最完善的漢字字符集,漢字最多,符號最全;本發明漢字編碼的設計能夠覆蓋現有91200多個單字,對漢字單字和詞語容納不受限制。部件碼將緊跟國際國內標準升級而不斷升級。
本發明“漢字積木規范部件碼”領先符合中國漢字《部件規范》(1998年)、《漢字筆順規范》(1997年)和GB/T18031-2000國家標準(2000年)等標準和規范;向廣大用戶提供了一種人人易學好用的速度快的能夠覆蓋20902個漢字的鍵盤輸入技術及其通用的漢字鍵盤輸入軟件;特別是為黨政、公安、金融、郵政、科技、教育、戶政、商貿、地理信息、人口普查系統等單位對20902個漢字輸入的迫切需要,以及大、中、小學學生的需要,提供了一個覆蓋20902個字的漢字鍵盤輸入的實用軟件。
本發明還為簡體字用戶(國內)和繁體字用戶(包括國內港、澳、臺用戶和日、韓、菲、新加坡以及世界各國用戶)可自選繁體字輸入或簡體字輸入;按繁體字輸入即得繁體字文件,按簡體字輸入即得簡體字文件;或者按繁體字、簡體字混合文本輸入即得繁、簡兩種字體混合的文件。本”發明專利申請書”就是按“部件碼”所述實施例輸入打印的。本發明部件碼在中文信息處理技術領域,首次突破小學生能夠輸入20000多個漢字單字(其中約有15000個單字是小學生、大學生都不認識的單字、生僻字和罕見字)。小學生都容易掌握使用,也就達到了廣大用戶易學好用的目的。
權利要求
本發明是通過以下的漢字鍵盤輸入技術及其通用鍵盤設計實現的。1、一種依據漢字《部件規范》,以首形、首聲部件碼為基礎的計算機漢字積木規范部件碼輸入方法,使用經過重新定義的計算機通用鍵盤的漢字鍵盤輸入技術,其特征在于它是由有機聯系,相互依存而又相互促進的漢字單字輸入法、詞組輸入法組成,所述單字輸入法包括從《部件規范》的560個部件中,經系列研究,獲得277個非字部件和232個成字部件,并將所述277個非字部件和232個成字部件定義為部件碼的特征元集;將所述非字部件按其首形特征分別為一筆、丨筆、丿筆、丶筆、 筆、乂形、形七種首形特征,并將這七種首形部件碼按照所述通用鍵盤定義到計算機鍵盤的H、I、P、D、V、X、U七個字母鍵上;將所述成字部件按其首聲部件碼編碼輸入,并按照所述通用鍵盤定義到與其首聲字母相同的B、C、D、E、F、G、H、J、K、L、M、N、P、Q、R、S、T、W、X、Y、Z、21個英文字母鍵上,從而構成部件碼的成字部件特征元集;利用通用鍵盤上的相應非字部件的首形部件碼字母鍵輸入漢字的首形部件碼;利用通用鍵盤上的相應成字部件的首聲部件碼字母鍵輸入漢字的首聲部件碼;借助于所輸入的漢字首形部件碼和首聲部件碼輸入漢字中的任何一個漢字;
2.根據權利要求1所述的漢字積木規范部件碼輸入方法及其通用鍵盤,其特征在于所述詞組輸入法中,二字詞分別各取兩字的頭、尾部件碼;三字詞取第1字頭、尾部件碼,取第2字的頭部件碼,取第3字的尾部件碼;四字詞及四字以上的詞取前三字的頭部件碼和末字的尾部件碼。
3.根據權利要求1所述漢字積木規范部件碼輸入方法及其通用鍵盤,其特征在于所述的漢字部件碼的非字部件特征元集所對應的首形部件碼、部件碼的成字部件特征元集所對應的首聲部件碼與汁算機通用鍵盤26個字母鍵的確切對應關系,從而構成部件碼的首形、首聲特征元集鍵盤鍵位布局總表。部件碼首形、首聲特征元集鍵盤鍵位布局總表
4.根據權利要求1所述的漢字積木規范部件碼輸入方法及其通用鍵盤,其特征在于所述漢字部件碼的277個非字部件特征元集與其首形特征輸入鍵位七個字母鍵的確切對應關系,從而構成部件碼的非字部件首形特征元集鍵盤健位布局表。部件碼 非字部件首形特征元集鍵位布局表
全文摘要
漢字積木規范部件碼依據漢字由部件組成和英文由字母組成的科學原理,賦予部件以字母和積木字塊的定義,一個部件碼就是一個固定的積木字塊;成字部件按拼音第一字母編碼、并標注在下端;非字部件按起筆部位特征:一丨丿文檔編號G06F3/023GK1325046SQ0010847
公開日2001年12月5日 申請日期2000年6月8日 優先權日2000年6月8日
發明者孫懷彥, 朱熙, 周羿, 蔣克難 申請人:朱熙