專利名稱:漢字部件拼聲編碼輸入法的制作方法
所屬領域本發明涉及一種漢字部件拼聲編碼輸入法,確切地說,涉及一種以漢字各個部件稱謂的聲母作為編碼元素的漢字編碼輸入方法。該方法適用于在普通計算機的鍵盤上輸入漢字,同樣適用于在其他裝置的鍵盤上輸入漢字,還可以用于漢字教學。屬于漢字編碼技術領域。
背景技術:
當今社會已經進入信息時代,漢字是中文信息的主要載體,目前面臨的主要任務是首先要學好漢字,其次是能夠將漢字用規則簡單、記憶容易、處理方便的方法輸入計算機或通信裝置進行漢字信息處理。漢字的特點是數目多,筆畫繁。長期以來漢字一直被認為是最難學的一種文字,尤其對于外國人來講,學習漢字更是一件非常頭痛的事。更為甚者,以前還曾有人主張廢棄漢字,因為外國人發明的計算機和鍵盤當時無法解決輸入和處理漢字;其實,這是對漢字的一種誤解。看一種文字的學習難易,不能只看表面現象,應該分析其實質,這實質就是其是否科學的,是否有規律可循,是否具有聯想功能,是否具有掌握有限的知識即可據此拓展而駕駛無限知識的能力。雖然中國漢字的數目眾多,形狀各異,但是,漢字的組成是有規律可循的所有的漢字都是由若干個部件(或稱部首)組成的,而且,漢字部件的數目是有限的。只要掌握了數量有限的部件,學習漢字就不再是一件困難的事。再者,部件具有很強的表意功能,每一個漢字的部件都有規范的稱謂或讀音;而在漢字的讀音中,掌握聲母要比掌握韻母容易的多,因此,如何通過這些有限的部件的聲母,來實現漢字的編碼輸入方法成為業內人士追求的目標。
發明內容
本發明的目的是提供一種以漢字規范部件為基礎的漢字部件拼聲編碼輸入法,該方法是依據國家語言文字規范的部件稱謂的聲母作為編碼元素,可用于計算機輸入漢字進行漢字信息處理,也可在其他裝置鍵盤、或掌上型電腦上輸入漢字。
本發明的另一目的是提供一種利用漢字部件拼聲編碼輸入法輸入漢字的鍵盤,以便能夠更好地利用本發明的編碼規則輸入漢字。
本發明的再一目的是提供一種以漢字規范部件為基礎的漢字部件拼聲編碼輸入法,該方法是依據國家語言文字委員會所規范的部件的稱謂的聲母作為其編碼元素,除了能夠作到規范、高效、易學地輸入漢字外,還能用于中小學生學習漢字,糾正錯別字,以信息技術整合其他學科,減輕學生負擔,提高教育質量。
本發明的目的是這樣實現的一種漢字部件拼聲編碼輸入法,其特征在于包括有下列步驟(1)首先將漢字依據其結構組成的部件為基礎進行分解,因為每一個漢字通常是由若干個部件所組成的;(2)所述的部件是以《信息處理用GB13000.1字符集漢字部件規范》中的20902個漢字的基礎部件及標準部首中的成字部件為依據的,其中成字部件和常用部件共301個是采用其稱謂的聲母作為其編碼元素,其余的322個部件則以其首筆筆畫稱謂的聲母作為其編碼元素,即根據首筆的五種基本筆畫橫(一)、豎(丨)、撇(丿)、點(丶)、折(乛),分別用其對應的聲母H、SH、P、D、ZH分別表示上述各部件的編碼元素;個別部件韻母自成音節的,則取其首字母作為其編碼元素;其具體分類情況列表如下 (3)利用計算機、或其他裝置上相應鍵盤上的字母分別代表上述取碼規則中的各個聲母;(4)進行漢字擊鍵輸入,其規則是按照該漢字的書寫順序選取其第一、第二、最末三個部件的編碼元素,上述編碼元素的組合就是該漢字的編碼。
在進行漢字拆分時可以拆成基礎部件,也可以拆成部首,兩者的漢字編碼應該是兼容的。
上述第(2)步驟中的拆分的部件也可以是以《信息處理用GB13000.1字符集漢字部件規范》中的全部漢字的基礎部件560個和合體成字部件73個共633個為依據的;是以這些部件稱謂的聲母作為其編碼元素;若是韻母自成音節的,則取其首字母作為其編碼元素;其具體分類情況列表如下 該漢字編碼輸入方法的擊鍵次數是不相等的,即根據該漢字的編碼元素字母敲擊相應的鍵進行輸入對于拆分成三個以上部件的漢字,是按照該漢字的書寫順序選取其第一、第二和最末三個部件的編碼元素,依次敲擊三次鍵;若有重碼,再根據屏幕提示,敲擊相應的數字鍵,使該字上屏。
對于少于三個部件的漢字,在敲擊完對應的編碼元素后,要敲擊空隔鍵表示結束該漢字的編碼輸入;若有重碼,再根據屏幕提示,敲擊相應的數字鍵,使該字上屏。
可以將聲母相同的部件按其組字頻率的高低降序編成一組,并選取每組頻率最高的部件標注在鍵盤所對應的按鍵上,稱之為鍵首部件。
所述的漢字編碼輸入方法中的第(2)步驟中的其余的322個部件也可以采用其稱謂的聲母作為其編碼元素進行擊鍵輸入,且按照其稱謂聲母作為其編碼元素與按照其首筆筆畫的讀音聲母作為其編碼元素的兩者的漢字編碼是兼容的。
本發明的利用漢字部件拼聲編碼輸入法輸入漢字的鍵盤是這樣實現的其為標準的計算機英文輸入鍵盤,其特征在于其中的英文字母鍵帽上方印有與該字母對應的鍵首部件,其對應關系為A-凹,B-八,C-艸,D-大、丶,E-阝,F-方,G-廣,H-火、一,I-(ZH)、、乛,J-金,K-口,L-立,M-木,N-女,P-皮、丿,Q-犬,R-亻,S-氵,T-扌,U-(CH)、蟲,V-(SH)、十、丨,W-玉,X-心,Y-月,Z-辶。
本發明的漢字部件拼聲編碼輸入方法的特點是1、規范本發明所采用的部件完全是遵照國家語言文字工作委員會近年頒布的GF3001-1997《信息處理用GB13000.1漢字部件規范》和標準部首,其中筆順是遵照《現代漢語通用字筆順規范》的規定。各部件的名稱讀音是根據部件的規范稱謂,漢字的拆分是根據《漢字基礎部件表》的使用規則,其編碼的取碼規則是根據漢字的書寫順序取碼,從而保障了本發明的漢字部件拼聲編碼輸入方法的規范性。
2、易學由于本發明只采取部件的聲母,避開了復雜的韻母,掌握起來比較容易。而且,對于常用的部件是取聲母,對于不常用、比較難認、難讀的部件則取其首筆筆畫的讀音的聲母,比較容易學習和掌握。此外,還采取基礎部件和成字部件兼容的技術,減少了拆分部件,縮短了碼長,使輸入效率提高,而多軌兼容的輸入方法更方便了用戶的選擇和使用習慣。
3、適應大容量漢字的編碼雖然常用漢字在幾千個之內,但是,很多場合的使用所涉及的漢字要達數萬個,例如,涉及到人名姓氏、地名、古籍等等,對于只會拼音的就無能為力,或者沒有掌握標準漢語拼音而使發音不準的用戶也會遇到麻煩。本發明漢字部件拼聲編碼輸入法對此是一種比較理想的解決方法。由于本發明是以漢字的部件(字形)為核心、以漢字的部件的稱謂聲母(拼音)為基礎,輔以五個基本筆畫稱謂的聲母而構成的一種以漢字字形為主、且形(各漢字的部件、部首)、聲(各部件稱謂的聲母)相結合的新穎的編碼輸入方法,該方法符合漢字是由部件組成、部件是由筆畫組成的構造規律,因此本發明漢字部件拼聲編碼輸入法能夠解決全部漢字的編碼難題,可以使漢字難學、難輸入的困惑變成一件方便、容易的事。例如,對于下述漢字“呝”、“兯”、“凬”大多數人都不認識,使用拼音編碼就毫無辦法。但是若使用本發明的輸入法則是一件很容易的事,因為組成它們的部件都是簡單的,對認識的部件取其聲母,不認識的部件則取其首筆筆畫的聲母,上述三個漢字的漢字部件拼聲編碼分別為KHY、BE、PHR。此外,本發明的漢字部件拼聲編碼輸入方法還可適用于韓國漢字、日本漢字及其它漢字的計算機編碼輸入。
總之,本發明的漢字部件拼聲編碼輸入方法是完全遵守漢字的構成規律,其所選取的部件全部是規范的,書寫的筆畫、筆順是遵守筆順規范,漢字的拆分則符合《漢字基礎部件表》使用規則,因此本發明的漢字部件拼聲編碼輸入法除了用于將漢字輸入計算機進行信息處理外,還可用于漢字教學,可使枯燥無味的漢字學習成為一種興趣濃厚的享受,使繁難、乏味的漢字學習成為有規律可循、比較容易掌握的事,使學生能夠學會以少駕多、以簡駛繁的認字、識字的能力。
圖1是本發明漢字部件拼聲編碼輸入方法中的301個常用成字部件及常用部件稱謂的聲母表和332個讀音困難的部件的首筆筆畫稱謂的聲母表。
圖2是本發明漢字部件拼聲編碼輸入方法中633個部件稱謂的聲母表。
圖3是本發明漢字部件拼聲編碼輸入方法中的鍵首部件在通用鍵盤上的布局示意圖。
具體實施例方式
本發明是一種漢字部件拼聲編碼輸入方法,包括有下列步驟
(1)首先將漢字依據其結構組成的部件為基礎進行分解,因為每一個漢字通常是由若干個部件所組成的;(2)所述的部件是以《信息處理用GB13000.1字符集漢字部件規范》中的20902個漢字的基礎部件及標準部首中的成字部件為依據的,其中成字部件和常用部件共301個是采用其稱謂的聲母作為其編碼元素,這些部件具有小學文化水平的人士均可認識,其余的讀音困難的322個部件則以其首筆筆畫的讀音聲母作為其編碼元素,即根據首筆的五種基本筆畫橫(一)、豎(丨)、撇(丿)、點(丶)、折(乛),分別用其對應的聲母H、SH、P、D、ZH分別表示上述各部件;個別部件的讀音是韻母自成音節的,則取其首字母作為其編碼元素;其具體分類情況列表如下 該步驟中的拆分的部件也可以是以《信息處理用GB13000.1字符集漢字部件規范》中560個基礎部件和73個合體成字部件共633個為依據,即都是采用以這些部件的稱謂的聲母作為其編碼元素;若是韻母自成音節的,則取其首字母作為其編碼元素;其具體分類情況列表如下
在進行該步驟中的漢字拆分時,可以拆成基礎部件,也可以拆成部首,兩者的漢字編碼應該是兼容的。同樣地,該步驟中的讀音困難的322個部件也可以采用其稱謂的聲母作為其編碼元素進行擊鍵輸入,且按照其稱謂聲母作為其編碼元素的漢字編碼與按照其首筆筆畫的讀音聲母作為其編碼元素的漢字編碼,兩者也是兼容的;(3)利用計算機、或其他裝置上的相應鍵盤上的字母分別代表上述取碼規則中的各個聲母;因為組成漢字的部件較多,而聲母只有20幾個,這樣,有些聲母可能包括幾十個部件,在一個鍵帽上表示成為不可能,因此,應用本發明的輸入方法時,可以將聲母相同的部件按其組字頻率的高低降序編成一組,在每一個聲母組中,只選取組字最多、使用頻率最高的一、二個部件定義為鍵首部件,并標注在鍵盤所對應的按鍵的鍵帽上。本發明的鍵首部件在鍵盤上的布局圖詳見圖3。
(4)進行漢字擊鍵輸入,其規則是按照該漢字的書寫順序選取其第一、第二、最末三個部件的編碼元素,上述編碼元素的組合就是該漢字的編碼。
本發明漢字編碼輸入方法的擊鍵次數是不相等的,即根據該漢字的編碼元素字母敲擊相應的鍵進行輸入;對于拆分成三個以上部件的漢字,是按照該漢字的書寫順序選取其第一、第二和最末三個部件的編碼元素,依次敲擊三次鍵;若有重碼,再根據屏幕提示,敲擊相應的數字鍵,使該字上屏。
對于少于三個部件的漢字在敲擊完對應的編碼元素后,要敲擊空隔鍵,表示結束該漢字的編碼輸入;若有重碼,再根據屏幕提示,敲擊相應的數字鍵,使該字上屏。
需要說明的是,為進一步提高輸入效率,適應人們的習慣,本發明選用一些合體的成字部件(部首),也就是說,有些漢字拆分成未級部件也行,拆成合體成字部首也行,例如,部首“豆”,即可用“豆”字的讀音聲母D表示,也可以拆分成三個基礎部件“一”、“凵”、“”分別用其聲母H、K、D表示之(部件“”是難讀音的部件,取其首筆畫“點”,聲母為D)。
按照漢字的書寫順序將漢字拆分成部件序列時,要遵循“漢字基礎部件表”的使用原則,即本發明漢字部件拼聲編碼方法在進行部件拆分時,必須遵守筆畫交重不拆、基礎部件不得再拆分、基礎部件可組成成字使用和不得組成非成字部件使用的原則,從而可以從根本上保障拆分的規范,避免了隨意亂拆的現象。
本發明的取碼原則是按漢字的書寫順序依次取第一、第二、最末個部件進行編碼。這主要是綜合考慮編碼效率和重碼率而設計的。因為要提高編碼效率,希望碼長越短越好;但是,碼短使得重碼率高,反之,碼長影響輸入速度,但是可以減少重碼率。根據GB2312-80字符集的6763個漢字部件拆分統計,四個以下部件組成的漢字為6147個,占全部整個字符的百分之九十一,平均每個漢字不到3.1個部件,因此,取三個部件比較合適。根據人們對漢字辨認難易程度和部件部位所包含的信息量,對于漢字的頭尾最容易辨認,區別漢字的能力也強,越往漢字的內部辨認越是困難,因此,選用第一、第二和最末共三個部件作為漢字的編碼元素,再依據圖1或圖2所示的漢字部件拼聲所列的部件聲母作為其編碼輸入的代碼,即可對漢字進行編碼。
下面利用圖1、圖2分別說明本發明編碼輸入過程。
(1)按圖2聲母表示法進行編碼輸入的實施例如漢字“鍵”、“盤”兩字。按書寫順序兩字分別拆分成“钅”、“聿”、“廴”和“舟”、“皿”,它們的規范稱謂分別是金(JIN)旁、聿(YU)、建之(JIANZHI);舟(ZHOU)、皿(MIN),分別取其聲母則是J、Y、J;ZH(用I表示)、M,那末漢字“鍵”的編碼是JYJ,“盤”的編碼是IM。然后進行漢字的輸入過程,即順序擊鍵,“鍵”字敲擊“J”、“Y”、“J”鍵,“盤”字敲擊“I”、“M”鍵,就可輸入“鍵”、“盤”二字。對于不足三個部件的漢字,要加增空隔鍵,再擊相應的數字鍵。例如,上例中的“盤”字,依次敲擊“I”鍵和“M”鍵之后,要敲擊一次空隔鍵。
(2)按圖1聲母表示法進行編碼輸入的實施例圖1是將常用成字及常用部件用其聲母表示,對于不常用漢字及部件則用首筆的聲母表示。如漢字“制”、“范”兩字。按書寫順序兩字分別拆分成 “刂”和“艸”、“氵”、 按其規范稱謂分別是制(ZHI)字旁、立刀(LIDAO),草字頭(CAOZITOU)、三點水(SANDIANSHUI)、倉(CANG)字底,其中部件“刂”、“艸”、“氵”均為常用部件,一般人士都知道。但是,對于部件 和 一般人士就不一定認識其稱謂。對于這些不常用的部件采用其首筆的聲母,這樣,一般人士都可以識別出來。部件 的首筆是“丿”,其稱謂是“撇”(PIE),其聲母為“P”,而部件 的首筆是 其稱謂是“折”(ZHE),其聲母為ZH。因此,漢字“制”的編碼為PL,漢字“范”的編碼為CSI(I代表ZH)。然后進行漢字的輸入過程,即順序敲擊“P”、“L”鍵,就可輸入“制”字,敲擊“C”、“S”、“I”鍵,就可輸入“范”字。對于不足三個部件的漢字,要增加空隔鍵,如有重碼,再擊相應的數字鍵。例如,上例中的“制”字,依次擊“P”鍵和“L”鍵之后,要敲擊一次空隔鍵。如上述漢字的編碼完成輸入后有重碼出現,根據屏幕提示,要擊相應的數字鍵。
(3)不再拆分的成字部件進行編碼的實施例在GB13000.1字符集中,有271個部件是成字部件,根據規則這些漢字不能再進行拆分,這些字的編碼元素是按其書寫順序取第一、第二和最末三個基本筆畫,這些基本筆畫的聲母組合即為該字的編碼。例如漢字“金”是基礎部件,這種字只能拆成基本筆畫,其第一、第二、最末三個基本筆畫分別為丿撇(PIE)、捺(NA)和一橫(HENG),所以,“金”的編碼即為PNH。
(4)多軌輸入的漢字編碼方法實施例如上所述,對于同一個漢字,本發明的使用者可以按照圖1、圖2兩種表示方法分別進行編碼,例如漢字“制”,可以按圖2方法編碼為IL( 為制ZHI字旁,“刂”為LIDAO),也可以按圖1方法編碼為PL( 的首筆筆畫為“丿”撇PIE)。為提高輸入效率,本發明對于有些漢字可以拆成基礎部件,也可以拆成成字的組合部件的,采取了兩者兼容技術,例如漢字“振”,按基礎部件拆分為“扌”、“廠”、“二”、 按成字的組合部件拆分為“扌”、“辰”。根據取碼規則只取第一、第二、最末三個部件,“振”字編碼部件序列為“扌”、“廠”、 由于部件 既可以按圖2部件聲母表示法取碼,也可以按圖1筆畫聲母法取碼。按圖2部件聲母表示法取碼為“扌”(TISHOU)、“廠”(CHANG)、 農(NONG)字底,取其聲母為T,U(表示CH)N,編碼為TUN;按圖1筆畫聲母法取碼為“扌”(TISHOU)、“廠”(CHANG)、 (ZHE)(首筆為折),取其聲母為T,U(表示CH),I(代表ZH),編碼為TUI。另外,“振”還可以按成字的組合部件折分為“扌”、“辰”,其稱謂分別為“扌”(TISHOU)、“辰”(CHEN),取其聲母T,U(表示CH),則“振”的編碼為TU。綜上所述,“振”的編碼可以有三種方法表示,即TUN、TUI和TU。本發明的多軌輸入兼容的方法為不同用戶的選擇和使用習慣提供了方便。
參見圖3所示的本發明提供的一種用于漢字部件拼聲編碼輸入法的鍵盤,其也是標準的計算機英文輸入鍵盤,只是在其中的英文字母鍵帽上方印有與該字母對應的本發明的鍵首部件,其對應關系為A-凹,B-八,C-艸,D-大、丶,E-阝,F-方,G-廣,H-火、一,I-(ZH)、、乛,J-金,K-口,L-立,M-木,N-女,P-皮、丿,Q-犬,R-亻,S-氵,T-扌,U-(CH)、蟲,V-(SH)、十、丨,W-玉,X-心,Y-月,Z-辶。使用該鍵盤,可以幫助用戶更好地掌握本發明的編碼輸入規則,以提高輸入效率。
權利要求
1.一種漢字部件拼聲編碼輸入法,其特征在于包括有下列步驟(1)首先將漢字依據其結構組成的部件為基礎進行分解,因為每一個漢字通常是由若干個部件所組成的;(2)所述的部件是以《信息處理用GB13000.1字符集漢字部件規范》中的20902個漢字的基礎部件及標準部首中的成字部件為依據的,其中成字部件和常用部件共301個是采用其稱謂的聲母作為其編碼元素,其余的322個部件則以其首筆筆畫的稱謂聲母作為其編碼元素,即根據首筆的五種基本筆畫橫(一)、豎(丨)、撇(丿)、點(、)、折(乛),分別用其對應的聲母H、SH、P、D、ZH分別表示上述各部件的讀音;個別韻母自成音節的部件則取其首字母作為其編碼元素;其具體分類情況列表如下 (3)利用計算機、或其他裝置上相應鍵盤上的字母分別代表上述取碼規則中的各個聲母;(4)進行漢字擊鍵輸入,其規則是按照該漢字的書寫順序選取其第一、第二、最末三個部件的編碼元素,上述編碼元素的組合就是該漢字的編碼。
2.根據權利要求1所述的漢字部件拼聲編碼輸入法,其特征在于在進行漢字拆分時可以拆成基礎部件,也可以拆成部首,兩者的漢字編碼應該是兼容的。
3.根據權利要求1所述的漢字部件拼聲編碼輸入法,其特征在于上述第(2)步驟中的拆分的部件也可以是以《信息處理用GB13000.1字符集漢字部件規范》中的全部漢字的基礎部件560個和合體成字部件73個共633個為依據的;是以這些部件的稱謂的聲母作為其編碼元素;若是韻母自成音節的,則取其首字母作為其編碼元素;其具體分類情況列表如下
4.根據權利要求1所述的漢字部件拼聲編碼輸入法,其特征在于該漢字編碼輸入方法的擊鍵次數是不相等的,即根據該漢字的編碼元素字母敲擊相應的鍵進行輸入對于拆分成三個以上部件的漢字,是按該漢字的書寫順序選取其第一、第二和最末三個部件的編碼元素,依次敲擊三次鍵;若有重碼,再根據屏幕提示,敲擊相應的數字鍵,使該字上屏。
5.根據權利要求1所述的漢字部件拼聲編碼輸入法,其特征在于對于少于三個部件的漢字,在敲擊完對應的編碼元素后,要敲擊空隔鍵,表示結束該漢字的編碼輸入;若有重碼,再根據屏幕提示,敲擊相應的數字鍵,使該字上屏。
6.根據權利要求1所述的漢字部件拼聲編碼輸入法,其特征在于可以將聲母相同的部件按其組字頻率的高低降序編成一組,并選取每組頻率最高的部件標注在鍵盤所對應的按鍵上,稱之為鍵首部件。
7.根據權利要求1所述的漢字部件拼聲編碼輸入法,其特征在于所述的漢字編碼輸入方法中的第(2)步驟中的其余的322個部件也可以采用其稱謂的聲母作為其編碼元素進行擊鍵輸入,且按照其稱謂聲母作為其編碼元素與按照其首筆筆畫的讀音聲母作為其編碼元素的兩者的漢字編碼是兼容的。
8.一種利用權利要求1所述的漢字部件拼聲編碼輸入法輸入漢字的鍵盤,為標準的計算機英文輸入鍵盤,其特征在于其中的英文字母鍵帽上方印有與該字母對應的鍵首部件,其對應關系為A-凹,B-八,C-艸,D-大、丶,E-阝,F-方,G-廣,H-火、一,I-(ZH)、、乛,J-金,K-口,L-立,M-木,N-女,P-皮、丿,Q-犬,R-亻,S-氵,T-扌,U-(CH)、蟲,V-(SH)、十、丨,W-玉,X-心,Y-月,Z-辶。
全文摘要
一種漢字部件拼聲編碼輸入法,是依據構成漢字的部件為基礎,以部件稱謂的聲母為編碼元素的漢字編碼輸入方法,其中少數韻母自成音節的取其第一個字母,對于讀音困難的部件也可取其首筆筆畫讀音的聲母,以該聲母字母作為編碼輸入的代碼。部件包括規范部件中的基礎部件(或稱末級部件)和傳統部首中的一些合體成字部件。漢字的拆分可以按基礎部件拆分,也可以按合體部首拆分;而且采用部件聲母編碼與采用部件筆畫聲母編碼兩種方法是兼容的。該輸入法適用于不同字符集和不同人群使用,具有規范、高效、易學的特點。既適用于普通計算機鍵盤輸入漢字,也適用其他裝置的鍵盤輸入漢字,以及漢字教學、漢字檢索。
文檔編號G06F3/023GK1337617SQ0113608
公開日2002年2月27日 申請日期2001年10月8日 優先權日2001年10月8日
發明者武云翠, 肖敏飛, 肖敏鵬 申請人:武云翠