專利名稱:漢字音形碼計算機鍵盤輸入法的制作方法
技術領域:
本發明屬于漢字編碼方法及漢字信息計算機鍵盤輸入方法領域。
目前,常用的漢字計算機輸入方法多為純形碼或純音碼。純形碼為了減少重碼使拆字規則變得很多而造成難記難學,純音碼由于重碼字太多需要選字而使輸入速度太慢。音形碼編碼方法避開了上述困難,采用音形結合的方法對漢字進行編碼,使拆字的規則變得非常簡單,且對國標GB-2312(80)中全部漢字進行編碼時無一重碼。音形碼既可對漢字編碼,也可對漢語詞組編碼,還可對非漢字符號(例如希臘字母、羅馬數字、特殊符號等)編碼。同時其編碼容量又可容納10萬條詞組,能滿足各方面的需要。音形碼依據標準通用鍵盤編碼。
一、漢字的編碼音形碼的漢字全碼共四碼,第一碼為音碼,第二、三、四碼為形碼。
(1)音碼的編碼規則音形碼編碼的第一個字符代表該字的讀音,例如漢語拼音方案中“我、你、他、發、看、民、然、平、在、次、所”等字的聲母分別是“W、N、T、F、K、M、R、P、Z、C、S”,聲母是上面字母的漢字在編碼時音碼就取上面的字母。漢字的拼音以“A、E、O”開頭的字稱為“零聲母”字,因為它們包含的字都很少,共有一百多個字,合并后被安排在數字鍵“0”上。以“Y”、“L”為聲母的漢字非常多,該方法將這些字按音序排列放到相鄰鍵“Y、U、I”及“L、;、’”上。以“Q、D、X、B”為聲母的字也較多,就分別讓他們的“鄰居”“1、E、A、V”來共同承擔任務。以卷舌音“zh、ch、sh”為聲母的字分別位于數字鍵“2,3”、“4,5”、“6,7”上……,全部音碼的排列位置見附圖
。
在附圖中可以看出,同聲母較多的漢字要占據兩個或三個字符鍵,每個字符鍵上標出了代表它分配漢字讀音的字母組合。例如“B”字鍵上寫著“ba-be”,代表讀音是“ba、bai、ban、bang、bao、bei、ben、beng”的漢字被安排在“B”字鍵上;“V”字鍵上寫著“bi-bu”,代表該鍵上有讀音是“bi、bian、biao、bie、bin、bing、bo、bu”的漢字。再例如“2”字鍵上寫著“zha-zhe”,代表讀音是“zha、zhai、zhan、zhang、zhao、zhe、zhei、zhen、zheng”的漢字就安排在“2”字鍵上。
采取以上將音碼勻攤搭配的方案后,大大減少了漢字的重碼機會,此方案稱為“音碼勻配”方案。
(2)形碼的編碼規則漢字大多是由幾個部分組成的,例如“問”字是由“門、口”兩個部分組成的,“碧”字是由“王、白、石”三個部分組成的,“酸”字是由“酉、厶、八、攵”四部分組成的……。構成漢字的每一部分叫作一個部件,大部分部件本身也是一個漢字。音形碼選取其中的168個部件作為構成漢字的基本元素,將它們按起筆的筆畫順序有規律的安排在40個字符鍵上。
音形碼選取的部件及位置安排見附圖。
從圖可以看出橫起筆的部件共有41個,在第一排從左向右排列,分別位于從“1”到“0”的十個數字鍵上;豎起筆的部件共有30個,在第二排從右向左排列,分別位于從“]”到“Y”的七個字符鍵上;撇起筆的部件共有41個,位置安排是從第二排的“T”鍵向左到“Q”鍵,再從第三排的“A”鍵向右拐到“F”鍵,共占九個鍵位;點起筆的部件共有30個,分布在第三排的“G”鍵到“’”鍵及第四排的“M”鍵上;折起筆的部件共有26個,放在“N”到“Z”鍵上。全部鍵位排列的順序為橫“W”形。
音形碼的部件安排相當好記,每個鍵上安排的第一個部件可用下面的口訣來幫助記憶。
一二三木五廠七西寸大業止口日山曲水長人和魚牛犬鳥豸彳門立心廣方將心病醫子女馬弓習(注上面口訣中,“和、醫”分別是“禾、乙”的諧音“牛、犬、將、病”及第二個“心”分別代表牛字旁、犬字旁、將字旁、病字旁及豎心旁。)記住了各個鍵上的第一個部件后,用聯想的方法記憶其余部件。因為其余部件有不少是和第一個部件在形狀上是很相似的,或者在其它方面有一些聯系。例如“2”字鍵上的部件都有兩橫、“3”字鍵上的部件都有三橫、“4”字鍵上的“豕”字與“4”字是諧音,部件“镸”又是“肆”字的一部分。還有“R”是“人”字拼音的聲母,“八”字和“人”字相似,該鍵上有“
”,兩邊鄰居有“丿”和“彡”。再如“’”、“;”上有“丶”、“冫”,而“氵”、“灬”和它們是鄰居;“D”字像月亮,“月”字就在該鍵上;“O”字像太陽和眼睛,“日”字和“目”字就安排在它的上面……。
音形碼在取形碼時,按照漢字的書寫順序依次選取,且每次都取筆畫最多的部件來編碼。例如“高”字就應按“
、冂、口”的拆分方法來編碼,其形碼為“JYP”,它的完整編碼為“GJYP”,而不能將“高”字拆為“亠、口、冂、口”。若漢字本身就是音形碼所選取的部件,它只有一個形碼,就對該字再重復取碼兩次,使它的形碼成為相同的三位碼。例如“可”字,該部件在“1”鍵上,那么它的形碼就為“111”,其完整編碼為“K111”。若漢字只能分為兩個部件,就對它的第二個部件再重復取碼一次,使它的形碼也達到三位。例如“汪、們、聽”三字的音形碼編碼分別為“WL33、MRGG、TPFF”。如果漢字是由三個以上的部件構成的,就取它的第一個、第二個和最后一個部件來進行編碼,例如“彰”字是由“立、日、十、彡”構成的,其中部件“十”不編碼,“彰”字的音形碼編碼就是“2HOE”。因為有按書寫順序每次都取筆畫最多的部件的規定,“天”字應分為“二、人”,不能分為“一、大”;“主”字要分為“亠、土”,不要分為“丶、王”。
音形碼輸入法規定在輸入“匚、口”這兩個部件時,考慮到它們的完整性,不能絕對按漢字書寫順序取碼,即允許“倒插筆”。在輸入“必”字時,當作先寫“心”再寫“丿”輸入“豕”時,當作先寫“豕”再寫“丶”。此外,所有漢字的拆分都必須嚴格按照正確的書寫順序進行。
考慮到初學者對某些字的拆分易出錯,本輸入方法設置了一些容錯碼。例如“辦”字,它的后兩筆應是兩個點,但很容易當作“八”字來輸入,故“辦”字可用“BN””輸入,也可用“BNRR”輸入;“秉”拆分方法究竟是“丿、一、
、小”,還是“丿、十、
、八”?不同的筆畫字典說法也不一致。音形碼兼顧兩種拆分方法,既可用“VT1Y”輸入,也可用“VT0R”輸入。
在音形碼漢字輸入方法中,絕大多數單字都具有簡碼。其中一級簡碼39個,二級簡碼1200多個,三級簡碼有5000多個,大多數常用漢字都有二級和三級簡碼。簡碼字多是本編碼方法的明顯優勢。
(3)漢字偏旁的輸入和“離散碼”漢字偏旁的讀音歷來是不一致的,有的就無法讀音。音形碼將它們的第一鍵都放在字母“O”上,第二鍵和第三鍵是“PP”,代表“偏旁”,最后一鍵是它第一筆的形碼。例如“宀”,輸入“OPP’”后,所有點起筆的偏旁都顯示出來,“宀”排在第9位,將它挑出來就行了。
盡管音形碼漢字輸入方法精心設計,將漢字進行了有效的分散,但是還有極個別的字重碼,不過這僅有的60對漢字中,幾乎每對都有一個是冷僻字,就將冷僻字的音碼改為“O”,形碼不變,這樣,所有的漢字就無一重碼了。音碼改為“O”的漢字的編碼叫’離散碼”。
需用離散碼輸入的漢字是耷、軹、汞、聱、玫、轂、嘉、赭、礪、驀、苜、甍、茼、霖、酶、丕、掭、贄、捃、焱、趾、貲、趿、嬲、蝥、貘、脘、皎、郫、閎、贏、屺、訌、麼、潢、黌、褡、皰、瘺、饗、瞑、暌、罟、哽、嗜、咼、犏、笙、儼、餿、鈦、鏞、郛、鋦、蜈、螅、蛐、駑、幡、帙。其中只有汞、玫、嘉、霖、酶、趾6個字是GB-2312(80)中的一級字,需要記憶,其它字一般是用不到的,勿需記憶。
(4)查詢碼的使用音形碼的第一碼是音碼,對于不認識的字,第一碼可用“`”代替符號“`”叫查詢碼。在輸入不認識的字時,只用將音碼改為“`”,其形碼不變。例如“亍”字的讀音為“chu”,其編碼為“52II”,如果不認識這個字,就按“`2II”輸入,這個字就上屏了。
(5)非漢字符號的編碼非漢字符號包括希臘字母、羅馬數字、帶圈或帶點的數字及一些特殊符號。它們的編碼的第一位都是“O”。
希臘字母編碼的前兩位是“OX”,其中“X”為“希”字的音碼。后兩位是該字母的讀音,讀音是一個漢語音節的取一個音碼,讀音超過一個漢語音節的取第一個和最后一個音節的音碼。例如“φ”的編碼為“OXF”,“α”的編碼為“OX0F”。
羅馬數字包括Ⅰ~Ⅻ共計12個數字,它們的編碼的前兩位是“O’”,其中“’”為“羅馬”的羅字的音碼。第三位和第四位是該羅馬數字的序數,分別是從1~12的數字。例如“Ⅶ”的編碼為“O’8”。
帶圈數字是指“①、②…⑩”這些數字,它們的編碼的前兩位為“O1”,其中“1”是“圈”字的音碼,后面的編碼就是該數字,例如“⑨”的編碼為“O19”。帶點數字是指“1.、2.…20.”這些數字,它們的編碼的前兩位是“OE”,其中“E”是“點”字的音碼,例如“18.”的編碼為“OE18”。
特殊符號包括常見的數學符號、標記符號等,它們的編碼的前兩位為“OT”,其中“T”是“特”字的音碼,后兩位按它的漢語讀音編碼。例如“>”的編碼為“OTDI”,“DI”代表“大于”;“℃”的編碼為“OT6E”,其中“6E”代表“攝氏度”。三、詞語的編碼音形碼漢字輸入方法對詞語進行編碼時,所有詞都取四碼。二字詞依次取其單字編碼的前兩碼;三字詞依次取每個字的第一碼和第三字的第二碼;四字詞及四字以上的詞(稱為多字詞)取第一、第二、第三及最后一字的第一碼。例如“作文”取“作”字編碼“ZRT2”的前兩碼“ZR”及“文”字編碼“WHHH”的前兩碼“WH”,構成“作文”一詞的編碼“ZRWH”;“計算機”的編碼為“JSJ4”;“改革開放”的編碼為“GGKF”;“鄧小平理論”的編碼為“DXP’”。
在進行詞語輸入時,如果遇到編碼為離散碼的字,仍按正常碼進行編碼輸入。
綜上所述,利用音形碼輸入漢字,規律性強,記憶量小,學習容易,用途廣泛,適合于專業人員高速盲打,也適合于非專業人員較快的學習和掌握。
權利要求
1.一種漢字音形碼計算機鍵盤輸入法,其特征在于漢字的編碼信息取自漢字的讀音(音碼)及漢字字形的部件(形碼),該音形碼共用四位,第一位是漢字的讀音代碼,然后是漢字的第一、第二及最后一個部件代碼。
2.權利要求1中音形碼音碼的特征為將漢字按讀音比較均勻的分配在各字符鍵上,聲母相同的漢字可以占2~3個字符鍵,各個漢字的音碼就是它所在鍵的字符。
3.音形碼形碼的特征為將所有組成漢字的音形碼部件按起筆的筆畫“橫、豎、撇、點、折”的順序分配在各字符鍵上,鍵上的字符就是這些部件的代碼,每個代碼對應二至五個部件。
4.根據權利要求1、2、3所述的音形碼,其特征在于由音形碼所規定的部件組成漢字,其音形碼部件的拆分規則是按照漢字書寫的規范筆順將漢字拆分成音形碼部件,且每次得到的都是筆畫最多的部件,不能構成規范部件時依次取筆畫編碼。
5.根據權利要求1、2、3、4所述的音形碼,其特征在于對國標GB-2312(80)中的全部漢字編碼,在遇到極個別的漢字重碼(共有60對)時,將每對中的一個不常用漢字的音碼改為“O”,其形碼不變,使全部漢字的編碼無一重碼。
6.根據權利要求1、2、3、4所述的音形碼,其特征在于對不認識的漢字編碼時,將其音碼視為“`”(此符號稱查詢碼,在標準鍵盤的左上角),形碼不變。
7.根據權利要求1、2、3、4所述的音形碼,其特征在于給詞組編碼時采用二字詞依次取各字的前兩碼,三字詞依次取各字的第一碼再加上第三字的第二碼,多字詞依次取第一、第二、第三及最后一字的第一碼。
8.音形碼對非漢字符號編碼時,其特征在于所有非漢字符號的第一碼都用“O”,希臘字母的第二碼用“X”(希字的音碼),羅馬數字的第二碼用“’”(羅字的音碼),特殊符號的第二碼用“T”(特字的音碼)。非漢字符號的第三碼和第四碼是該符號的讀音編碼。
全文摘要
漢字音形碼計算機鍵盤輸入法,本發明屬于計算機鍵盤漢字輸入方法領域。音形碼以漢字的讀音和字形進行編碼。編碼嚴格遵循漢字的讀音規范及書寫規范,使用者只要能對漢字進行讀和寫,就可很快掌握這個輸入方法。該方法實現了全部漢字輸入無一重碼,不認識的字也不影響輸入,同時又可輸入希臘字母、羅馬數字和特殊符號。由于該方法能容納10萬條詞語,所以字和詞的輸入速度相當快。音形碼是一種易學、快速的輸入方法。
文檔編號G06F3/023GK1234545SQ99103918
公開日1999年11月10日 申請日期1999年3月5日 優先權日1999年3月5日
發明者劉塽, 冉流霞 申請人:劉塽