專利名稱:一種將漢字部首詞組化雙聲編碼在數字鍵輸入漢字的方法
技術領域:
本發明屬漢字信息處理技術領域。
背景技術:
現有在數字鍵盤輸入漢字的方法,有拼音輸入,也有筆畫輸入。拼音輸入的前提是要認識該漢字,不認識的漢字用拼音輸入就有困難。筆畫輸入的可以不認識,但輸入筆畫多,速度慢。編碼輸入的方法少,且重碼率普遍偏高(以王永民《五筆字型》的重碼率為準)。編碼輸入要達到低于《五筆字型》的水平,很難。
本發明采用拼音輸入的基本方法,拆分漢字為標準部件,將漢字部首雙字詞組化,雙聲拼音編碼;加上直觀的筆畫編碼,單字和詞組混合輸入,重碼率比《五筆字型》低一半以上,可以實現盲打輸入。
發明內容
本發明是一種將漢字部首詞組化,結合筆畫和部件,組合編碼,在數字鍵的十個鍵位上輸入漢字的方法。
現行在數字鍵上輸入漢字的方法,普遍存在的問題是輸入鍵次太多,輸入速度太慢;不認識的漢字不能用拼音輸入;只輸入單字,不能輸入詞組;不能盲打輸入等問題。
本發明要解決的問題是用拼音的基本方法可以輸入所有漢字;輸入鍵次少,一個單字或一個多字詞組,最多六鍵完成;重碼率很低,低于《五筆字型》;可以實現盲打輸入。
本發明的幾個基本概念 數字鍵盤將數字鍵盤的十個鍵位設計為符合漢語拼音認讀習慣的聲母鍵位,(見附圖1)。符合漢語拼音認讀習慣指將漢語拼音的聲母依照漢語拼音方案的聲母表,將聲母順次讀為 b p m f;d t n l;g k h;j q x;zh ch sh r;z c s; 每組聲母在數字鍵盤上縱向排列,各字母所在鍵位編碼為 1 g j;2 b d;3 zh z;4 k q;5 p t;6 ch c r;7 h x;8 m n;9 sh s;0 f l; 特別安排的有y視為聲母,在3號鍵;w視為聲母,在4號鍵;將沒有聲母的字設計為零聲母,零聲母在5號鍵; 筆畫指橫(一)豎(丨)撇(丿)點(丶)折(乙)等五類。其中,捺(
)屬于點類。本發明將這五類筆畫依據其有無其他筆畫叉過,一分為二,又分出有叉筆的五類筆畫,即叉橫、叉豎、叉撇、叉點(叉捺)、叉折等五類。
在本說明書中,叉筆畫的表示如下,虛線表示有叉筆叉過
筆畫的編碼是橫1,豎2,撇3,點4,折5,叉橫9,叉豎8,叉撇7,叉點6,叉折0 中撇有其他筆畫與撇的中部相連特征的為“中撇”,中撇歸入叉撇; 直點和直捺與上下左右的橫或豎相鄰的點或捺,為“直點、直捺”,直點、直捺歸入叉點叉捺; 部件指《信息處理用GB13000.1字符集漢字部件規范》中所列,由筆畫組成的具有組配漢字功能的構字單位。部件分為成字部件和非成字部件兩種,成字部件中的成字以《國標GB-2310(80)》中的常用字為限; 超出常用字部分的成字歸入非成字部件部分;本發明所使用的部件除部首中合成成字部件和特別說明的部件外,均為不可再拆分的基礎部件; 部首指《現代漢語詞典》中所列部首; 部首成字的詞組化將部首中的下列成字全部兩字詞組化,并取兩字的聲母碼或中心字的聲母碼; 取一碼時取本字聲碼; 部首中合成成字部首單獨使用,再分解時,拆分成基礎部件使用; 部首中非成字的處理將部首中的下列非成字兩字詞組化,并取兩字的聲母碼;取一碼時取中心字; 筆畫與基礎部件合成常用字的,不再拆分,直接作為成字使用; 將不是部首的下列部件詞組化處理,作為部首使用
癶=登頭=登 部首中其他非常用字成字的處理取筆畫碼; 成字部首及非成字部首詞組第一聲碼鍵位示意見附圖2; 編碼輸入方法本發明單字和詞組均六位編碼; 單字是成字部件部首的取該字雙聲碼,再依次取筆畫的一、二、三、末筆畫碼,筆畫不足的,補0;凡筆畫不足的,均補0,下同; 單字是成字部件不是部首的取一聲碼,再依次取筆畫的一、二、三、四、末筆畫碼; 都是部首或都不是部首的兩部件單字每部件各取三碼;是部首的前兩碼取雙聲碼,第三碼取末筆畫碼;不是部首是成字的,取一聲碼和首末筆畫碼;不是部首也不是成字的,取一、二、末筆畫碼; 一個是部首,一個不是部首的兩部件單字是部首的取兩碼,不是部首的取四碼,是成字部件的,先取聲碼,再取一、二、末筆畫碼;不是成字部件的,取一、二、三、末筆畫碼; 三部件單字每個部件取二碼; 四部件單字一、四部件各取二碼,二、三部件各取一碼; 五部件單字一部件取二碼,其他部件各取一碼; 六部件及以上單字一部件取二碼,二、三、四、末部件各取一碼; 兩字詞每字取三碼;兩部件字,首部件取一碼,尾部件取兩碼;多部件字一、二、三部件各取一碼; 三字詞每字取兩碼; 四字詞首末字各取兩碼,二、三字各取一碼; 五字詞首字取兩碼,其他字各取一碼; 六字及六字以上詞首字取兩碼,二、三、四、末字各取一碼;
附圖1是24個聲母在10個鍵位上的設置鍵位圖; 附圖2是成字部首及非成字部首詞組鍵位示意圖;
具體實施例方式 下面結合實例具體說明; 數字鍵盤將數字鍵盤的十個鍵位設計為符合漢語拼音認讀習慣的聲母鍵位,(見附圖1)。符合漢語拼音認讀習慣指將漢語拼音的聲母依照漢語拼音方案的聲母表,將聲母順次讀為 b p m f;d t n l;g k h;j q x;zh ch sh r;z c s; 每組聲母在數字鍵盤上縱向排列,各字母所在鍵位編碼為 1 g j;2 b d;3 zh z;4 k q;5 p t;6 ch c r;7 h x;8 m n;9 sh s;0 f l; 特別安排的有y視為聲母,在3號鍵;w視為聲母,在4號鍵;將沒有聲母的字設計為零聲母,零聲母在5號鍵; 筆畫指橫(一)豎(丨)撇(丿)點(丶)折(乙)等五類。其中,捺(
)屬于點類。本發明將這五類筆畫依據其有無其他筆畫叉過,一分為二,又分出有叉筆的五類筆畫,即叉橫、叉豎、叉撇、叉點(叉捺)、叉折等五類。如“王”的第一筆為橫,第二筆為叉橫,第三筆為叉豎。其余類推。
在本說明書中,叉筆畫的表示如下,虛線表示有叉筆叉過
筆畫的編碼是橫1,豎2,撇3,點4,折5,叉橫9,叉豎8,叉撇7,叉點6,叉折0;橫與叉橫1、9相對,豎與叉豎2、8相對,等等,便于記憶,其余同; 中撇有其他筆畫與撇的中部相連特征的為“中撇”,如“亻、勹、牛”等,中撇歸入叉撇; 直點和直捺與上下左右的橫或豎相鄰的點或捺,為“直點、直捺”,如“亠”中的點,“卜”中的點,“其”中的點,“水”中的捺等,直點、直捺歸入叉點叉捺; 部件指《信息處理用GB13000.1字符集漢字部件規范》中所列,由筆畫組成的具有組配漢字功能的構字單位。部件分為成字部件和非成字部件兩種,成字部件中的成字以《國標GB-2310(80)》中的常用字為限,201個成字部件如下 口一八木日曰人入土士月金十田文貝七又大止女言蟲火山王玉心小立禾衣竹目幾石寸車廠四廣白工力皿米示門巾刀刁巳已己尸爪子耳卜羊兒牛習戈雨夕夫方食酉水二川干西斤臼豐見弓戊丁犬戶革由長舟歹冊而臣業未末自非毛巴且矛千中甫氏束里母手龍乙世皮黑亡瓦也丸不內父果上鬼亞身乃柬九電氣萬冉央曲兆乍必甘屯巨牙瓜了弗我重尹丘五民丫申于下東鄉及更予甲片為丑求垂尺韋乎丹夷久之井禹熏本肉串永象才兩斥州樂曳三飛專丈年史事凹吏秉個書凸承 超出常用字部分的成字歸入非成字部件部分,如“匕、缶、聿、廿、臾、艮、耒、豸、爿、弋”等;本發明所使用的部件除部首中合成成字部件和特別說明的部件外,均為不可再拆分的基礎部件; 部首指《現代漢語詞典》中所列部首;如“木、亻、氵、匚、缶、聿、音、鼻、”等; 部首成字的詞組化將部首中的下列成字全部兩字詞組化,并取兩字的聲母碼或中心字的聲母碼; 八=八一卜=卜辭齒=齒輪歹=歹徒耳=耳朵 白=白面廠=廠礦赤=赤膊刀=刀螂二=二胡 貝=貝殼車=車廂蟲=蟲子斗=斗爭方=方向 鼻=鼻子臣=臣服寸=寸斷豆=豆腐風=風雨 比=比較辰=辰年大=大會兒=兒童父=父親 戈=戈壁巾=巾幗母=母親尸=尸體小=小說 革=革命斤=斤斗木=木頭十=十分心=心靈 工=工廠口=口袋目=目光石=石膏穴=穴頭 弓=弓子老=老實鳥=鳥瞰食=食鹽羊=羊毛 谷=谷穗里=里頭牛=牛毛矢=矢口頁=頁碼 骨=骨肉力=力量女=女性士=士氣衣=衣裳 瓜=瓜分立=立場皮=皮革手=手續音=音樂 廣=廣泛龍=龍井片=片兒鼠=鼠疫用=用途 鬼=鬼魂鹵=鹵莽其=其他巳=巳年酉=酉年 禾=禾木鹿=鹿茸氣=氣勢田=田園又=又及 黑=黑板麻=麻醉欠=欠缺土=土方魚=魚蝦 戶=戶口馬=馬車青=青春瓦=瓦斯雨=雨滴 火=火車毛=毛筆犬=犬吠王=王國月=月亮 幾=幾許矛=矛盾人=人民韋=韋姓止=止境 己=己任門=門市日=日程文=文明爪=爪子 見=見識米=米粒山=山水夕=夕陽子=子孫 角=角落皿=皿底身=身材西=西方足=足旁 取一碼時取本字聲碼;如王=w; 部首中合成成字部首單獨使用,再分解時,拆分成基礎部件使用;如音=音樂+立場+日程; 部首中非成字的處理將部首中的下列非成字兩字詞組化,并取兩字的聲母碼;取一碼時取中心字 亻=單人=人讠=言詞=言彳=雙人=人爿=將旁=將 門=同匡=同阝=耳刀=耳忄=豎心=心礻=示威=示 冖=寶蓋=蓋丬=將旁=將犭=犬猶=犬疒=病毒=病 冫=兩點=點口=方匡=匡纟=絞絲=絲衤=衣裳=衣 刂=立刀=刀夂=折文=文艸=草頭=草虍=虎穴=虎 勹=包頭=包宀=寶蓋=蓋辶=走之=之=竹頭=竹 匚=三匡=匡尢=尤旁=尤饣=食鹽=食=足旁=足 卩=耳刀=耳巛=三拐=拐扌=提手=手 厶=私字=私廾=弄底=弄攵=反文=文 廴=建之=之彡=三撇=撇灬=四點=點 下列筆畫與基礎部件合成常用字的,不再拆分,直接作為成字使用 百辦幣丙叉產成旦乏凡互今韭舊虧禮良亂馬么滅鳥乓乒乞羌刃勺少生升失術戍司太天衛烏無戌血嚴藝億憶義引尤與再扎札軋正朱主 將不是部首的下列部件詞組化處理,作為部首使用
癶=登頭=登 部首中其他非常用字成字的處理與非成字部件等同,取筆畫碼;如“缶”的筆順筆畫碼
“缶”的首末筆畫碼
成字部首及非成字部首詞組鍵位示意見附圖2; 編碼輸入方法本發明單字和詞組均六位編碼; 單字是成字部件部首的取該字雙聲碼,再依次取筆畫的一、二、三、末筆畫碼,筆畫不足的,補0;凡筆畫不足的,均補0,下同; 如
工=工(g)廠(ch)+一丨一+補碼=161210; 音=音(y)樂(y)+立(l)場(ch)+日(r)+程(ch)=330666; 單字是成字部件不是部首的取一聲碼,再依次取筆畫的一、二、三、四、末筆畫碼; 如
乃=乃(n)+乙丿+補碼=853000; 都是部首或都不是部首的兩部件單字每部件各取三碼;是部首的前兩碼取雙聲碼,第三碼取末筆畫碼;不是部首是成字的,取一聲碼和首末筆畫碼;不是部首也不是成字的,取一、二、末筆畫碼; 如
一個是部首,一個不是部首的兩部件單字是部首的取兩碼,不是部首的取四碼,是成字部件的,先取聲碼,再取一、二、末筆畫碼;不是成字部件的,取一、二、三、末筆畫碼; 如打=提手(tsh)+丁(d)-丨+補碼=592120;
三部件單字每個部件取二碼; 如輕=車廂(chx)+ス(乙丶)+工廠(gch)=675416; 四部件單字一、四部件各取二碼,二、三部件各取一碼; 如照=日程(rch)+刀(d)+口(k)+四點(sd)=662492; 五部件單字一部件取二碼,其他部件各取一碼; 如
六部件及以上單字一部件取二碼,二、三、四、末部件各取一碼; 如
兩字詞每字取三碼;兩部件字,首部件取一碼,尾部件取兩碼;多部件字一、二、三部件各取一碼; 如大家=大會(dh)丶+宀(g)豕(一丶)=274114; 智慧=矢(sh)口(k)日(r)+豐(f)豐(f)彐(乙)=946005; 三字詞每字取兩碼; 如計算機=言(y)十(sh)+竹(zh)目(m)+木(m)幾(j)=393881; 四字詞首末字各取兩碼,二、三字各取一碼; 如掩耳盜鈴=手(sh)大(d)+耳(零)+點(d)+金(j)人(r)=925216; 五字詞首字取兩碼,其他字各取一碼; 如二一添作五=二胡(零h)+一(y)+點(d)+人(r)+五(w)=573264; 六字及六字以上詞首字取兩碼,二、三、四、末字各取一碼; 如
權利要求
一種將漢字部首詞組化雙聲編碼在數字鍵輸入漢字的方法,屬漢字信息處理技術領域,它涉及將漢字部首詞組化、漢字部件的拆分組合規則,以及部件和筆畫在數字鍵盤上的安排等,其特征是將漢字規范部首中的成字部件和一部分非成字部件詞組化,取雙聲母編碼;將橫(一)豎(ㄧ)撇(丿)點(丶)折(乙)等五類筆畫依據其有無其他筆畫叉過,一分為二,又分出有叉筆的五類筆畫,即叉橫、叉豎、叉撇、叉點(叉捺)、叉折等五類,共十類筆畫;用拼音的基本方法和十個筆畫,即可輸入所有漢字;
本發明的幾個基本概念
數字鍵盤將數字鍵盤的十個鍵位設計為符合漢語拼音認讀習慣的聲母鍵位(見附圖1);符合漢語拼音認讀習慣指將漢語拼音的聲母依照漢語拼音方案的聲母表,將聲母順次讀為
b p m f;d t n l;g k h;j q x;zh ch sh r;z c s;
每組聲母在數字鍵盤上縱向排列,各字母所在鍵位編碼為
1g j;2b d;3zh z;4k q;5p t;6ch c r;7h x;8m n;9sh s;0f l;
特別安排的有y視為聲母,在3號鍵;w視為聲母,在4號鍵;將沒有聲母的字設計為零聲母,零聲母在5號鍵;
筆畫指橫(一)豎(丨)撇(丿)點(丶)折(乙)等五類;其中,捺
屬于點類;本發明將這五類筆畫依據其有無其他筆畫叉過,一分為二,又分出有叉筆的五類筆畫,即叉橫、叉豎、叉撇、叉點(叉捺)、叉折等五類;
在本說明書中,叉筆畫的表示如下,虛線表示有叉筆叉過
=叉橫;
=叉豎;
=叉撇;
=叉捺、叉點;
=叉折;
筆畫的編碼是橫1,豎2,撇3,點4,折5,叉橫9,叉豎8,叉撇7,叉點6,叉折0;
中撇有其他筆畫與撇的中部相連特征的為“中撇”,中撇歸入叉撇;
直點和直捺與上下左右的橫或豎相鄰的點或捺,為“直點、直捺”,直點、直捺歸入叉點叉捺;
部件指《信息處理用GB13000.1字符集漢字部件規范》中所列,由筆畫組成的具有組配漢字功能的構字單位;部件分為成字部件和非成字部件兩種,成字部件中的成字以《國標GB-2310(80)》中的常用字為限;
超出常用字部分的成字歸入非成字部件部分;本發明所使用的部件除部首中合成成字部件和特別說明的部件外,均為不可再拆分的基礎部件;
部首指《現代漢語詞典》中所列部首;
部首成字的詞組化將部首中的成字全部兩字詞組化,并取兩字的聲母碼或中心字的聲母碼;
取一碼時取本字聲碼;
部首中合成成字部首單獨使用,再分解時,拆分成基礎部件使用;
部首中非成字的處理將部首中的一部件非成字兩字詞組化,并取兩字的聲母碼;取一碼時取中心字;
筆畫與基礎部件合成常用字的,不再拆分,直接作為成字使用;
部首中其他非常用字成字的處理取筆畫碼;
成字部首及非成字部首詞組鍵位示意見附圖2;
編碼輸入方法本發明單字和詞組均六位編碼;
單字是成字部件部首的取該字雙聲碼,再依次取筆畫的一、二、三、末筆畫碼,筆畫不足的,補0;凡筆畫不足的,均補0,下同;
單字是成字部件不是部首的取一聲碼,再依次取筆畫的一、二、三、四、末筆畫碼;
都是部首或都不是部首的兩部件單字每部件各取三碼;是部首的前兩碼取雙聲碼,第三碼取末筆畫碼;不是部首是成字的,取一聲碼和首末筆畫碼;不是部首也不是成字的,取一、二、末筆畫碼;
一個是部首,一個不是部首的兩部件單字是部首的取兩碼,不是部首的取四碼,是成字部件的,先取聲碼,再取一、二、末筆畫碼;不是成字部件的,取一、二、三、末筆畫碼;
三部件單字每個部件取二碼;
四部件單字一、四部件各取二碼,二、三部件各取一碼;
五部件單字一部件取二碼,其他部件各取一碼;
六部件及以上單字一部件取二碼,二、三、四、末部件各取一碼;
兩字詞每字取三碼;兩部件字,首部件取一碼,尾部件取兩碼;多部件字一、二、三部件各取一碼;
三字詞每字取兩碼;
四字詞首末字各取兩碼,二、三字各取一碼;
五字詞首字取兩碼,其他字各取一碼;
六字及六字以上詞首字取兩碼,二、三、四、末字各取一碼。
全文摘要
一種將漢字部首詞組化雙聲編碼在數字鍵輸入漢字的方法,屬漢字信息處理技術領域,它涉及將漢字部首詞組化、漢字部件的拆分組合規則,以及部件和筆畫在數字鍵盤上的安排等,其特征是將漢字規范部首中的成字部件和一部分非成字部件詞組化,取雙聲母編碼;將筆畫分為橫(一)豎(丨)撇(丿)點(丶)折(乙)等五類。其中,捺(ㄟ)屬于點類;將這五類筆畫依據其有無其他筆畫叉過,一分為二,又分出有叉筆的五類筆畫,即叉橫、叉豎、叉撇、叉點(叉捺)、叉折等五類,共十類筆畫;用拼音的基本方法和十個筆畫,可以輸入所有漢字;輸入鍵次少,一個單字或一個多字詞組,最多六鍵完成;重碼率很低,可以實現盲打輸入。
文檔編號G06F3/023GK101339463SQ200810096010
公開日2009年1月7日 申請日期2008年4月17日 優先權日2008年4月17日
發明者平 李, 想 李 申請人:平 李