專利名稱:計算機漢字泛拼音編碼輸入法的制作方法
技術領域:
本發明屬于計算機漢字信息處理技術領域,涉及漢字拼音編碼的優化及其輸入方法。
漢字拼音碼作為明碼,在輸入操作應用上優于其他編碼。存在的問題是重碼太多。究其原因,主要在于只拼音不拼調,音調分離的編碼方法。這是一種不符合漢語音調結合固有屬性特征的不完全拼音編碼。這種編碼在用字符鍵盤輸入時,不得不多次多種類操作,從而影響其實用價值。
本發明的目的是改進只拼音不拼調的拼音編碼方法,提供一個符合漢語音調結合固有屬性的漢字完全拼音編碼,操作更為方便,字詞兼容實用的計算機漢字輸入技術。
本發明根據對漢字形、音、調屬性有關理論的研究,認為用于對漢字拼音編碼的拼音字母及其組合在賦予拼讀音及分類的同時,重要的是也應賦予聲調屬性,并加以分類。換句話說,應以漢語的聲調類為模對拼音字母及其組合再一次分類。那么,在這些具有漢語語音屬性的拼音字母及其組合所組成的有限集合上定義相應的抽象代數運算,使其拼音字母及其組合有序地排列,有機地組合,轉變為既拼音又“拼”調的漢字完全拼音編碼—漢字泛拼音編碼。它是一種拼音字母集上有序組編碼,由這些以單音節形式與漢字對映的編碼,易于編制多音節形式的詞碼。這是一個抽象代數系統。通過這個系統,具有漢語音、調屬性的字母集上有序組集與一定容量的漢字集各元素之間形成一一對映。因些,它是一個漢字編碼模型;不同于笛卡爾積集這樣的漢字編碼模型。
在拼音字母及其組合上賦予漢語音、調類,本發明認為不應該是隨意的,應根據漢字形、音、調與漢語音對映演變規律構擬,以拼音字母的漢語音、調構擬為前提進行構擬。其聲調宜分為四類,本發明用數字符號0、1、2、3、分別表示陰平、陽平、上聲和去聲。輕聲作為詞匯,語法現象處理。這些通過構擬、賦予漢語音、調類屬性的拼音字母,輔音字母及其組合以及元音字母及其組合,組成本發明漢字泛拼音編碼的碼元。后附本發明的碼元表。其中,部分字母及其組合被賦以多種音、調類屬性,以使其充分發揮編碼作用。另外,還規定字母e具有使前置的拼音字母讀其字母讀音,兩個拼音字母按反切拼音的作用,而其本身不參與拼讀發音。
本發明在上述拼音字母及其組合有限集或稱為本發明的碼元集上定義兩種抽象代數運算,以確定碼元的排序,拼讀音與“拼”調類1)乘法運算;以輔音字母及其組合在前,元音字母及其組合在后排序,其間拼讀成音,按聲調類乘法運算表“拼”調類。
2)加法運算;以元音字母及其組合在前,輔音字母及其結合在后排序,按元音字母及其組合讀音,而輔音字母及其組合只有音位而不參與拼讀,其間按聲調類加法運算表“拼”調類。
聲調類運算表
I、聲調類乘法運算表II、聲調類加法運算表× 0 1 2 3 + 0 1 2 30 0 0 0 0 0 0 1 2 31 0 1 2 3 1 1 2 3 02 0 2 0 2 2 2 3 0 13 0 3 2 1 3 3 0 1 2由上述抽象代數系統形成的拼音字母及其組合的有序排列是以元音字母及其組合為主的單音節形式,其排列形式有四類1)、單獨元音字母及其組合類,2)、輔音字母及其組合在前而元音字母及其組合在后排序類,3)、元音字母及其組合在前而輔音字母及其組合的在后排序類4)、輔音字母及其組合,元音字母及其組合與輔音字母及其組合的復合排序類。
在第二類排序里,允許兩個拼音字母與元音字母e排序,規定用反切拼音;拼讀時第一個字母用其輔音,而第二個字母用其隱含的元音;元音字母e作為反切拼音符號,不參與拼讀,它反映漢字反切拼讀的歷史,也是本發明的命名為漢字泛拼音編碼的第二個重要原因。
本發明編碼范圈可隨著碼元數量的增大而擴大,以適應進一步不同的需要。但是,為了提高漢字輸入效率,對于同音同義字(繁體、異體字),部分同音異義字,本發明采用相應的功能鍵通過變換程序的方法實現以同碼輸入。
編碼實例及其說明1)mam(媽);為第四類排序單音節字(詞)編碼,其讀音由m、a拼讀,而其聲調類據本發明聲調類運算表mam=0×3+0=0為陰平調。所以,當讀mā·ma3)ta(它),tye(他),txe(她);參與排序的字母雖然有所不同,但都可拼讀為tā。
本發明的優點是1)本發明的漢字泛拼音編碼,采用全拼形式,屬于明碼,易學易記,方便實用。
2)由于本漢字泛拼音編碼方案所具有的與相應容量的漢字集間的良好對映性,可用于改進漢字排序與檢索系統。
漢字泛拼音編碼碼元表I、拼音字母碼元表
II、輔音字母及其組合碼元表 III、元音字母及其組合碼元表
權利要求
1.一種計算機漢字泛拼音編碼輸入法,運用字符鍵盤進行漢字泛拼音編碼輸入,其特征在于漢字泛拼音編碼方案;在賦予漢語音、調類屬性的拼音字母及其組合集上定義抽象代數運算,以確定拼音字母及其組合的排序,拼讀音與“拼”調的編碼方法。
2.根據權利要求1所述的一種計算機漢字泛拼音編碼方案,其特征在于所述的賦予漢語音、調類的拼音字母及其組合集;以四個聲調類為模,對拼音字母及其組合再一次分類構成的賦有漢語音、調類固有屬性的拼音字母碼元,輔音字母及其組合碼元以及元音字母及其組合碼元全體。
3.根據權利要求1所述的一種計算機漢字泛拼音編碼方案,其特征在于所述的在賦予漢語音、調類屬性的拼音字母及其組合集,即本發明的漢字泛拼音編碼碼元集上定義抽象代數運算;定義乘法運算與加法運算兩種抽象代數運算確定以元音字母及其組合為主的排序,拼讀音以及“拼”調類;其中包含聲調類運算表乘法運算表與加法運算表確定所“拼”調類。
全文摘要
一種計算機漢字輸入法。它是以其具有漢語語音屬性的拼音字母及其組合的有序排列,既拼音又“拼”調為主要特征的漢字泛拼音編碼,運用字符鍵盤,字詞兼容實用的計算機漢字輸入技術。本發明的漢字泛拼音編碼還可用于改進漢字排序及檢索系統。
文檔編號G06F3/023GK1129328SQ9511488
公開日1996年8月21日 申請日期1995年4月29日 優先權日1995年4月29日
發明者陳松泉 申請人:陳松泉