首音碼漢字輸入法
【技術領域】
[0001 ] 本發明首音碼漢字輸入法涉及計算機信息處理技術領域。
【背景技術】
[0002]出生于40、50、60年代的人多有進行文字處理和上網交流信息的愿望,但他們苦于不熟悉借助于計算機鍵盤使用拼音輸入漢字,終感遺憾。對于他們來說,輸入漢字的速度并不是主要追求目標,準確度才是最重要的。一般文字處理和上網交流信息,能較熟練輸入3500個常用字已足夠,所以他們急切盼望有包括4000字左右的重碼少、幾乎不需翻頁的輸入法問世。現行所有的漢字輸入法均存在如下缺陷:1.形碼類輸入法記憶因素太多,輸入方法復雜,需要看字聯形,對文字處理時思維有較大影響。2.音碼類輸入法重碼多、需翻頁。僅以涵蓋由國家語言文字工作委員會和前國家教委聯合發布的《現代漢語常用字表》中3500常用字的“小學生字典”為例,在4108個字中,只有18個全拼音字無重碼,重碼率高達99.6%,在388個全拼音字組中,有重碼且需翻頁的組多達164個,翻頁率高達42.3%,最多的重碼字達62個,這就意味著如果每頁10個字的話,最多要翻7頁,如果每頁只有5個字,則最多要翻15頁。而計算機操作系統自帶的“微軟拼音”單字庫中既包含有簡體字也包含有繁體字,重碼率幾乎接近100%。3.對于拼音不熟悉和拼音不準的人來說無法使用全拼音輸入。
【發明內容】
[0003]本發明的目的在于為了解決以上缺陷,提供了一種只需要用漢字拼音的字首音進行編碼的首音碼漢字輸入法。
[0004]本發明的技術方案為:一種首音碼漢字輸入法,該首音碼漢字輸入法將字的首音或偏旁部首字的首音與通用鍵盤直接掛鉤,對于不是字的偏旁部首,按照字典上介紹的規則與鍵盤掛鉤。
[0005]首音碼單字取4碼,按字首音、第一偏旁部首字首音、第二偏旁部首字首音、最后偏旁部首字首音的順序編碼。
[0006]首音碼輸入單字是以漢字的結構為碼序的。現代漢字的間架結構可分為五大類型,這五大類型是:獨體、左右、上下、包圍、對稱;
按漢字結構書寫的次序為:先左后右,先上后下,先外后內,先外后內再封口 ;
對于左右、上下和兩分體的雜合結構字除字的首音編碼之外,只能取到兩個編碼,共計二碼;
首音碼的三字詞組也是用三個漢字的字首音編碼的,為了避免跟三字詞組發生重碼,對于二分體單字還要增加一個結構識別碼;在首音碼的編碼方案中,左右型用U,上下型用i,雜合性用V ;對稱字在取碼時如果缺碼,后面補上X ;
對于不可拆分成獨立“字塊”的獨體字,編碼方法是先重復取該字的兩個首音,最后取該字的第一筆畫首音; 字典中的一畫偏旁部首都是漢字的基本筆畫,有“橫”、“豎”、“撇”、“捺”、“點”、“折”,在首音碼中分別用它們的字首音h、S、p、n、d、z表示。
[0007]兩字詞組分別取第一字首音編碼,第二字首音編碼,第一字第二編碼,第二字第二編碼。三字詞組就取3碼,即每個字在首音碼中的編碼。
[0008]四字及多字詞組采用“前三末一”的取碼方法,分別取它們的字首音編碼。
[0009]本發明的優點在于:準確性例如:“謝”字在“小學生字典”拼音Xie中排在第20位,在“新華字典”中排位在第35位,如果用全拼輸入,肯定需要翻頁。但用首音碼在輸入xysc后卻可立即上屏,沒有重碼。要對音碼完全取消重碼幾乎是不可能的,只要將重碼降低至每頁10個以下,就可以在不翻頁的情況下準確輸入漢字。經過對4000個漢字逐一進行編碼,首音碼的重碼率為38.9%,翻頁率為2.3%,之所以這么低是因為其中占75.8%的字的重碼只有2、3個,僅需增加一個數字鍵即可選擇輸入,不需翻頁。可以說,在減少重碼和翻頁問題方面,與其他音碼相比較首音碼占有絕對的優勢。4000個漢字對于50歲以上的略懂拼音的中老年人來說應該足夠使用,如果需要輸入這4000個之外的字,可以用十分簡易、便捷的“人工造詞”方法,將其自動加入字庫輸入。易學性首音碼不需要區分z、C、s和zh、ch、sh,不需要使用韻母和音調,非常容易學,對于一般智力的人,只要I至2小時就可以學會并掌握應用。國際性首音碼只需要知道字的首音,對于同音的簡體字和繁體字,輸入方法幾乎完全相同。例如:“楊”和“楊”兩字,在“首音碼”中編碼都是:ymyu。所以,首音碼可以在使用漢字的任何國家和地區的50歲以上的廣大人群中進行推廣應用。公益性用首音碼打字,能鞏固對漢字結構和筆順等方面的知識,不像有些輸入法那樣,費了好大的勁總算背過其特有的字根和概念,卻只能用于打字,對其他文化事業沒有絲毫幫助,不能形成良性循環和相互促進。擴展性當前移動設備(手機、平板電腦等)都預裝了全拼和手寫輸入法,全拼重碼多,翻頁麻煩;手寫識別準確率不是很理想,不能書寫詞組輸入。首音碼的重碼少,翻頁率極低,詞組豐富。如果象全拼那樣在移動設備上預裝首音碼,將有助于加快信息的傳播和交換。
【具體實施方式】
[0010]一種首音碼漢字輸入法 1.輸入方法
首音碼是將字的首音或偏旁部首字的首音與通用鍵盤直接掛鉤的方法輸入,對于不是字的偏旁部首,按照字典上介紹的約定俗成的方法與鍵盤掛鉤,例如“芬”字的上部在字典的部首中注明為“草字頭”,用C注音編碼;
2.實施方式
首音碼單字取4碼,例如:“霸”的首音是b,“雨”的首音是1,“革”的首音是g,“月”的首音是1,“霸”字的編碼即為bygy。
[0011]各類音碼的區別主要在對單字的編碼原理,首音碼輸入單字是以漢字的結構為碼序的。現代漢字的間架結構可分為五大類型,這五大類型是:獨體,如:“乙”字;左右(包括左中右),如:“材”、“鋤”、“樓”、“飄”等字;上下(包括上中下),如:“忠”、“怠”、“想”、“霜”等字;包圍(又稱雜合),如:“慶”、“句”、“趟”、“風”、“區”、“兇”、“國”等字;對稱,如:“坐”、“北”、“非”等字。
[0012]按漢字結構書寫的次序為:先左后右,先上后下,先外后內,先外后內再封口。
[0013]對于左中右、上中下三分體字,可以按三個字塊取碼,對于左右、上下和兩分體的雜合結構字除字的首音編碼之外,就只能取到兩個編碼,例如:“材”字在首音碼中可以取到的碼是:“材”字的編碼c,“木”字的編碼m和“才”字的編碼C。由于首音碼的三字詞組也是用三個漢字的字首音編碼的,為了避免產生重碼,對于二分體單字還要增加一個結構識別碼。在首音碼的編碼方案中,左右型用U,上下型用i,雜合性用V。u、1、v在拼音里是不用的,正好用作結構識別,因此“材”字的全碼是:cmcu。對稱字在取碼時如果缺碼,后面補上X (在英文字母書寫體中的X正好左右對稱)。
[0014]對于不可拆分成獨立“字塊”(或稱構成字的零件簡稱“構件”)的獨體字,編碼方法是先取兩個整字首音碼,再取該字第一筆畫字音碼。漢字的基本筆畫有“橫”、“豎”、“撇”、“捺”、“點”、“折”,在首音碼中分別用它們的字首音h、s、p、n、d、z表示,所以“事”字在首首碼中的編碼是:ssh。
[0015]由于對獨體字編碼最后要取該字的第一筆畫音,這里就會涉及到漢字書寫的筆順問題。按照國家語言文字工作委員會的規定,“九”字的筆順是先撇后折,在首音碼中的正確編碼是:jjp,“力”字的筆順是先折后撇,在首音碼中的正確編碼是:llz。
[0016]在首音碼中,兩字詞組全碼取四碼,分別是:第一字首音編碼,第二字首音編碼,第一字第二編碼,第二字第二編碼。因此,“保證”的首音碼全碼是:bzry,它的簡碼是:bz,僅用兩碼。為了避免翻頁,兩字常用詞組的每組簡碼控制在十個以內。三字詞組就取3碼,例如:
“計算機”在首音碼中的編碼是:jsj。四字及多字詞組采用“前三末一”的取碼方法,分別取它們的字首音編碼。例如:“心有余而力不足”,在首音碼中的編碼是..耶。
【主權項】
1.一種首音碼漢字輸入法,其特征在于:該首音碼漢字輸入法將字的首音或偏旁部首字的首音與通用鍵盤直接掛鉤,對于不是字的偏旁部首,按照字典上介紹的規則與鍵盤掛鉤。
2.根據權利要求1所述首音碼漢字輸入法,其特征在于:首音碼單字取4碼,按字首首、第一偏芳部首字首首、第~■偏芳部首字首首、最后偏芳部首字首首的順序編碼。
3.根據權利要求1所述首音碼漢字輸入法,其特征在于:首音碼輸入單字是以漢字的結構為碼序的;現代漢字的間架結構可分為五大類型,這五大類型是:獨體、左右、上下、包圍、對稱; 按漢字結構書寫的次序為:先左后右,先上后下,先外后內,先外后內再封口 ; 對于左右、上下和兩分體的雜合結構字除字的首音編碼之外,只能取到兩個編碼,共計二碼; 首音碼的三字詞組也是用三個漢字的字首音編碼的,為了避免跟三字詞組發生重碼,對于二分體單字還要增加一個結構識別碼;在首音碼的編碼方案中,左右型用U,上下型用i,雜合性用V ;對稱字在取碼時如果缺碼,后面補上X ; 對于不可拆分成獨立“字塊”的獨體字,編碼方法是先重復取該字的兩個首音,最后取該字的第一筆畫首音; 字典中的一畫偏旁部首都是漢字的基本筆畫,有“橫”、“豎”、“撇”、“捺”、“點”、“折”,在首音碼中分別用它們的字首音h、S、p、n、d、z表示。
4.根據權利要求1所述首音碼漢字輸入法,其特征在于:兩字詞組分別取第一字首音編碼,第二字首音編碼,第一字第二編碼,第二字第二編碼;三字詞組就取3碼,即每個字在首音碼中的編碼。
5.根據權利要求1所述首音碼漢字輸入法,其特征在于:四字及多字詞組采用“前三末一”的取碼方法,分別取它們的字首音編碼。
【專利摘要】本發明公開一種首音碼漢字輸入法,該首音碼漢字輸入法將字的首音或偏旁部首字的首音與通用鍵盤直接掛鉤,對于不是字的偏旁部首,按照字典上介紹的規則與鍵盤掛鉤。本發明的優點在于:準確性,經過對4000個漢字逐一進行編碼,首音碼的重碼率為38.9%,翻頁率為2.3%。易學性,不需要使用韻母和音調,非常容易學。國際性,首音碼只需要知道字的首音,對于同音的簡體字和繁體字,輸入方法幾乎完全相同。公益性,用首音碼打字,能鞏固對漢字結構和筆順等方面的知識。擴展性,首音碼除了可以安裝在計算機上應用之外,還可以擴展應用預裝到移動設備(手機、平板電腦等)上。
【IPC分類】G06F3-023
【公開號】CN104598046
【申請號】CN201510083920
【發明人】謝書良
【申請人】謝書良
【公開日】2015年5月6日
【申請日】2015年2月16日