專利名稱:四四方陣漢字輸入編碼法及其配套鍵盤的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種能通用于各種大中小型計(jì)算機(jī)(電腦)的漢字輸入編碼法及其配套鍵盤。
背景技術(shù):
目前,漢字編碼(輸入法)已達(dá)數(shù)百種,盡管種類繁多,但真正比較有實(shí)用性的(即已在社會(huì)上不同程度流行使用的),其實(shí)只有數(shù)得清的很少幾種,即便這些已經(jīng)在使用的漢字編碼(輸入法),也因各自的不同局限而無(wú)法在社會(huì)各階層中能真正廣泛普及使用,如一、音碼及音形混合碼學(xué)用這兩類碼必須要有扎實(shí)的拼音基礎(chǔ),而國(guó)人且別說(shuō)是成年人,即便是初中以上的在讀生,大多數(shù)人只是重字義輕字音,再說(shuō),音碼無(wú)視角上的直觀性,對(duì)尚在識(shí)字階段的中小學(xué)生來(lái)說(shuō),當(dāng)一些不認(rèn)識(shí)的生字(當(dāng)然不知道其讀音)出現(xiàn)時(shí)、即使拼音學(xué)得再好的無(wú)法可施,況且,音碼的單字重碼率高得離奇,這些都是音碼、及音形混合碼無(wú)法在大眾中真正普及的癥結(jié)所在。
二、形碼因初學(xué)時(shí)一般須背記大量字根,且其拆分字難以掌握,目前也只是在部分高知、白領(lǐng),以及各類電腦專業(yè)操作人員中使用較廣,而非能在社會(huì)各階層中廣泛普及使用。三、數(shù)字碼因使用鍵碼少,能用在小型電腦鍵盤上(如手機(jī)),但因其使用鍵碼太少,則編碼容量過(guò)小,重碼率高,不能輸入詞組,故其實(shí)用性很有限。
四、多選式輸入法因其無(wú)完整設(shè)定編碼,需在輸入過(guò)程中多次檢索選擇,故其輸入過(guò)程過(guò)于緩慢,節(jié)奏不流暢,且在小鍵盤上(如手機(jī)),同樣不能輸入詞組。
從上世紀(jì)八十年代初算起,漢字編碼(輸入法)的研制和應(yīng)用,已有二十多年。然而時(shí)至今日,為什么還沒(méi)有一套比較理想的編碼能在全民各階層中廣泛普及使用?其根本原因就在于漢字編碼(輸入法)的研制從其開(kāi)始,人們就不由自主地走進(jìn)了“繁瑣”與“簡(jiǎn)單”兩大誤區(qū)一、繁瑣地套用英文大鍵盤這是受英文鍵盤先入為主而形成的一種慣性思維。對(duì)于只有26個(gè)基本單元的英文來(lái)說(shuō)采用一對(duì)一,照搬式的大鍵盤,當(dāng)然直截了當(dāng)輕松自如,這是無(wú)可非議的最佳選擇。雖然漢語(yǔ)拼音也可以一對(duì)一地套用英文鍵盤,但國(guó)人應(yīng)用的是漢字不是拼音,要把拼音轉(zhuǎn)換成漢字,單字重碼率太高和國(guó)人大多數(shù)不諳拼音,則是兩座無(wú)法逾越的“山峰”。
眾所周知,漢字是一種由多層次多單元組合成的異形方塊體,組成漢字的基本單元有數(shù)百種之多,無(wú)論采用何種創(chuàng)意方案,要把如此之多的基本單元(即便整縮成少量其他符號(hào))套攤在散亂在龐大的幾十個(gè)鍵位上,根本無(wú)法達(dá)到簡(jiǎn)單明了提綱挈領(lǐng)的直觀效果。盡管二十多年來(lái)(即便以后),不知道有多少人在此鍵盤上“趨之若鶩”“前仆后繼”地耗費(fèi)了心血,其結(jié)果只能是讓大多數(shù)初學(xué)者或死記硬背、或眼花繚亂、或望而卻步。
二、簡(jiǎn)單地套用幾個(gè)數(shù)字鍵因大鍵盤繁瑣不盡人意,部分人便“棄繁從簡(jiǎn)”(忽略了編碼容量這個(gè)制約因素)簡(jiǎn)單搬用幾個(gè)純數(shù)字鍵。
按數(shù)理常識(shí)可知,任何編碼方案均存在著各自相應(yīng)的編碼容量(即該編碼法最多能組合成多少組不同的碼子),編碼容量由該編碼的碼位數(shù)(即幾位碼)和需使用的輸入鍵碼數(shù)量(不包括其它功能鍵)決定。
計(jì)算式為每碼位上最多使用鍵碼數(shù)的連乘積例(假設(shè))一種在手機(jī)上使用的四位數(shù)字編碼,其每位上均使用(0至9)十個(gè)數(shù)字鍵,則編碼容量=10×10×10×10=10000(組)這是理論容量,而實(shí)際上由于各編碼方案各自的局限,其使用率則遠(yuǎn)小于此,有些用于大鍵盤的編碼,其容量使用率還不到5%,小鍵盤上的高些,但最多不會(huì)超過(guò)40%。上列中的,最多只能使用到三、四千組碼。
而一種漢字編碼,若想要有較好的實(shí)用性,則至少要編入四萬(wàn)條詞組,再加上單字,字詞條要達(dá)五萬(wàn)條左右,以平均重碼2條為限,應(yīng)需使用2.5萬(wàn)組碼子,按40%倒算,其編碼容量應(yīng)高于六萬(wàn)組,上例中的手機(jī)碼只有一萬(wàn)容量,兩者相差甚遠(yuǎn)。
這就是在手機(jī)上僅使用十個(gè)以內(nèi)的數(shù)字鍵,不能輸入詞組碼的根本原因。至于有些編碼方案把碼位拉長(zhǎng)至五、六碼以上,想以此來(lái)增大容量,其實(shí)這只不過(guò)是一種割肉補(bǔ)瘡的得不償失之舉。要知道,四位碼是漢字編碼這一特定范疇(使用輸入鍵碼30以內(nèi),字詞條5萬(wàn)左右)內(nèi),惟一最佳的選擇,“減一”則容量過(guò)小,“增一”則會(huì)使輸入過(guò)程緩慢、零亂、節(jié)奏不流暢,更讓人望而生畏。
縱觀電腦應(yīng)用發(fā)展的潮流趨勢(shì),當(dāng)今世界,已沒(méi)有哪種科技產(chǎn)品會(huì)像電腦一樣,能如此地深入到社會(huì)的方方面面,并極大地提高人們的工作效率,充實(shí)豐富人們的生活內(nèi)涵。顯而易見(jiàn),理想的漢字編碼(輸入法)完全應(yīng)當(dāng)兼具易學(xué)、實(shí)用、通用三個(gè)基本要素一、易學(xué)即規(guī)則簡(jiǎn)單,無(wú)過(guò)多的背記;時(shí)間上,以小半天就可學(xué)會(huì),二、三天就可熟練為宜。倘若像學(xué)一門手藝(準(zhǔn)技術(shù))那樣費(fèi)力費(fèi)時(shí),則根本無(wú)法在全民各階層中普及使用。
二、實(shí)用即要有較快的輸入速度,至少比手寫應(yīng)快數(shù)倍,如果某種編碼(輸入法)只是容易學(xué)會(huì),但使用起來(lái)“寸步難行”(輸速太慢),其作用不過(guò)是略勝于無(wú),這種編碼(輸入法)即使半分鐘就能學(xué)會(huì),也毫無(wú)意義可言。
一、通用即學(xué)會(huì)一套編碼,能在各種大中小型電腦上輸入使用。
因此,一套能在絕大多數(shù)階層中廣泛普及,易學(xué)、實(shí)用、且能通用于各種大中小型計(jì)算機(jī)(電腦)的漢字編碼(輸入法)的問(wèn)世,已成為廣大消費(fèi)者的期盼和市場(chǎng)的呼喚。
發(fā)明內(nèi)容
1、一種通用于各種大中小型計(jì)算機(jī)(電腦)的漢字輸入編碼及其配套鍵盤,其特征是采用4×4型方陣漢字輸入鍵盤,每個(gè)方陣鍵各對(duì)應(yīng)于一種漢字筆畫(huà)在字結(jié)構(gòu)中的層位及該筆畫(huà)字成后的線段節(jié)數(shù),以首筆、末筆、四碼輸入漢字及詞語(yǔ),漢字的每個(gè)最小基本單元(字根、部件)的首筆和末筆,均在方陣盤中有各自的對(duì)應(yīng)鍵碼。
以漢字筆畫(huà)(首末筆)在結(jié)構(gòu)中的層位及字成后的線段節(jié)數(shù)為漢字編碼法的輸入視角點(diǎn),加上特創(chuàng)的4×4型方陣輸入鍵盤,這“三位一體”的突破性創(chuàng)新是本發(fā)明的核心特征。
1.1鍵盤(鍵碼對(duì)應(yīng)的層位和線段節(jié)數(shù))1.2鍵碼(編碼)代碼 2、本發(fā)明的具體技術(shù)如下2.1、鍵盤、鍵碼(對(duì)應(yīng)層位、線段節(jié)數(shù)、編碼代碼)16個(gè)方陣鍵分列成四層(空位鍵、數(shù)字0鍵、其他功能鍵在方陣外),各對(duì)應(yīng)于漢字筆畫(huà)在字結(jié)構(gòu)中所處的四種層位(頂、上、中、下);每層四鍵,凡屬側(cè)撇1節(jié)(線段)的筆畫(huà)均對(duì)應(yīng)相應(yīng)層位的左側(cè)鍵,如斤(側(cè)頂)、朱(側(cè)上)、片(側(cè)中)、廠(側(cè)下);凡屬頂撇1節(jié)的則按其撇下的支點(diǎn)頭數(shù),分別對(duì)應(yīng)于頂層各節(jié)數(shù)鍵,如乏(頂1)、豸(頂2)、采(頂3);其他所有類型筆畫(huà),均按其線段節(jié)數(shù)對(duì)應(yīng)于相應(yīng)層位的1、2、3鍵。
線段節(jié)數(shù)漢字筆畫(huà)自身彎、折、勾、 及與前后筆畫(huà)相交字成后形成的線段數(shù)量,超過(guò)3節(jié)的均算3節(jié)。
鍵碼(編碼)代碼方陣內(nèi)保留3×3型1-9常規(guī)數(shù)字鍵(兼作他用),頂層及左側(cè)各鍵選用形似鍵位特征的字母(A、V、W、S、P、D、Q)為代碼。
2.2、復(fù)筆的處理漢字筆畫(huà)中的連續(xù)點(diǎn)、橫、豎、(或含撇、捺),均視作一筆,按其節(jié)數(shù)(并將單節(jié)點(diǎn)、橫、豎歸入)整合成橫列式復(fù)筆陣、豎列式復(fù)筆陣兩類,如 一、二、三; 水(雨);分別對(duì)應(yīng)于頂層和左側(cè)面各相應(yīng)節(jié)數(shù)鍵(側(cè)上、側(cè)中、側(cè)下、側(cè)頂鍵又分別兼作側(cè)一、側(cè)二、側(cè)三、側(cè)四鍵)。
2.3、漢字的拆分2.3.1、拆分原則2.3.1.1、交筆、單體、夾體字(如上下夾王,正;左右?jiàn)A木、粥、辯)不拆。
2.3.1.2、一字拆作“二”;將組合體字簡(jiǎn)潔拆作兩部分,便于首筆、末筆、四碼輸入。
2.3.2、拆分方法2.3.2.1、上下型上部含“字”的,取最大字及同層左右筆(角框除外)拆出;中部或末部含“字”的,拆出“字”前非“字”筆畫(huà)。
2.3.2.2、角框、三圍框、四圍框?qū)⒖蚣芘c框內(nèi)筆分拆,但圍框體外另有筆畫(huà)時(shí),圍框本身不拆。
2.3.2.3、左右型右部不含“字”的,將左右分拆;右部含“字”將右部按上下型或角框分拆,其上部與左部合成首部,右下部為末部。
2.3.2.4、左中右型將左部中部拆出,四列式(如雌),將左1、左2拆出。
2.4、筆順最小字根(部件)按常規(guī)筆順,多種并用的統(tǒng)一為一種,組合體筆順則按首部首筆,末部末筆定。
2.5、首筆、末筆定位(層位)2.5.1、定位原則在最小字體中確定“字”筆層位。
2.5.2、定位方法2.5.2.1、單層筆畫(huà)(拆分后)“字”筆(如“十”的橫、豎),按定位原則可獨(dú)自定位,其筆不上不下則為中。
非“字”筆按在原結(jié)構(gòu)中的層位相對(duì)定a、相對(duì)為上,如“布”的上橫;b、相對(duì)為下,如“舉”的末豎;c、無(wú)相對(duì)層為中,如“布”的撇筆(側(cè)偏在旁)。
2.5.2.2、多層筆(豎向)首層為上(或頂),末層為下,如丁、 兩頭封為中,如“口”的首豎。
2.5.2.3、特殊結(jié)構(gòu)筆a、角折筆豎向三圍框的折筆,均按其與角內(nèi)筆或與框?qū)吂P的包容程度定位,包上部為上(如買、 );齊頭包為中(如 刀),上下兼具為中(如 );包下部為下(如 力)。
b、底橫側(cè)連(串)筆局部定位橫線上為上(如“正”的末豎),橫線側(cè)連(串)為中(如鄉(xiāng)、私、車、 的末筆)。
2.6、編碼方法2.6.1、漢字2.6.1.1、不可拆字取其首、末筆代碼(夾體圍框體則框上首筆,框內(nèi)末筆),再補(bǔ)兩空碼編足四碼。
2.6.1.2、可拆字各取兩部分的首、末筆代碼,不足碼的補(bǔ)空碼,依次編成四碼。末部為口字空框時(shí)(按框體末筆在框內(nèi)規(guī)則推斷)其末筆用空碼。
2.6.1.3、特常用可拆字代詞、介詞、常用動(dòng)詞、單位詞等常在語(yǔ)句中以單字出現(xiàn)的漢字,除按拆字規(guī)則編了四碼外,還按不可拆字只取首末筆及空碼編了簡(jiǎn)碼。
2.6.2、詞組2.6.2.1、二字詞每字各取首、末筆代碼(一筆字用空碼補(bǔ)末筆碼),依次編成四碼。
2.6.2.2、三字詞首字取首筆碼,次字取末筆碼、第三字取首筆、末筆碼,依次編成四碼。
2.6.2.3、四字以上詞首字首筆碼、次字末筆碼、第三字首筆碼,末字末筆碼。
2.6.2.4、詞中一筆字用碼需用二碼時(shí),末筆碼用空碼;只需一末筆碼時(shí),則用首筆碼(實(shí)筆碼)。
2.6.2.5、各字為末筆碼時(shí),若末部為三圍框、四圍框,則其末筆為框內(nèi)末筆(但框內(nèi)先發(fā)筆的三框字則反之,如“兇”字),若末部為空框,除口字框用空碼外,其他空框末筆均為框上末筆。
2.6.3、復(fù)體(復(fù)件、復(fù)字、復(fù)詞)2.6.3.1、復(fù)件(字中連續(xù)有數(shù)個(gè)非字的相同構(gòu)件)該部分直接用一碼相應(yīng)的復(fù)筆碼(后面均簡(jiǎn)稱復(fù)碼)。
2.6.3.2、復(fù)字(字中有幾個(gè)連續(xù)相同字根)a、純復(fù)字(如品)首筆碼+復(fù)碼+兩空碼b、部分復(fù)字,只需用二碼時(shí)(如棚),該部分為首筆碼+復(fù)碼;只需用一碼時(shí)(如操),該部分直接用一復(fù)碼。
2.6.3.3、復(fù)詞(詞語(yǔ)中連續(xù)幾個(gè)相同字)a、全復(fù)詞用四碼,首筆碼+末筆碼+空碼+復(fù)碼。
b、部分復(fù)詞只能用二碼時(shí)(復(fù)詞在詞語(yǔ)前面或后面),該部分為首筆碼+復(fù)碼;只能和一碼時(shí)(復(fù)詞在詞語(yǔ)中間或最后),該部分直接用一復(fù)碼。
2.7、重碼處理2.7.1、無(wú)重碼時(shí),輸入四碼,字或詞語(yǔ)即在屏幕上直接顯示。
2.7.2、有重碼時(shí),則在提示欄的1-9數(shù)點(diǎn)后同時(shí)顯示第一檔的9個(gè)以內(nèi)重碼,可直擊相應(yīng)數(shù)字鍵選擇。
2.7.3、現(xiàn)代基本不用的單字、非常用的詞語(yǔ),所有地名(省會(huì)以上除外),人名、國(guó)名(中、美、英、法、俄除外)、藥名、疾病名、專業(yè)術(shù)語(yǔ)等,以及超過(guò)9個(gè)的重碼,均設(shè)在第二檔重碼欄內(nèi),輸入四碼后,只需加擊一下空位鍵,即可在提示欄中顯示,再直擊數(shù)字鍵選擇。
具體實(shí)施例方式漢字很復(fù)雜,但也很奇妙,如果把漢字結(jié)構(gòu)的多層位和其筆畫(huà)的多線段(筆畫(huà)自身彎、折、勾,及與前后筆畫(huà)相交所致)這兩個(gè)基本特征,分解轉(zhuǎn)換到一個(gè)形似中文漢字構(gòu)架的4×4型方陣鍵盤上(表1),使之和各鍵碼一一對(duì)應(yīng),則整個(gè)鍵盤條理清晰、直觀簡(jiǎn)潔、鍵碼數(shù)量適中(編碼容量近八萬(wàn)組),且鍵盤結(jié)構(gòu)緊湊,既可用于小型鍵盤(與現(xiàn)行手機(jī)上的3×3型數(shù)字盤相較,只在周邊作了“ ”線的小幅調(diào)整),也可在大鍵盤上“立足”(由其右側(cè)數(shù)字鍵改制)。表1鍵盤(鍵碼對(duì)應(yīng)的層位和線段節(jié)數(shù))表2鍵碼(編碼)代碼 四四方陣漢字輸入編碼法的問(wèn)世,將給人們提供一套易學(xué)、實(shí)用、且能通用于各種大中小型電腦的理想漢字編碼輸入技術(shù)。
本發(fā)明的具體技術(shù)如下一、鍵盤1、層位16個(gè)方陣鍵分列四層,每層四個(gè)鍵(空位鍵、數(shù)字0鍵、其他功能鍵在方陣盤外),漢字各部分的首筆和未筆均在方陣盤上有各自的對(duì)應(yīng)層位(頂、上、中、下)。
2、線段節(jié)數(shù)(1)漢字筆畫(huà)自身彎、折、勾而成,如一、 分別為1、2、3、節(jié)。
(2)或被前后筆畫(huà)相交而成,如“又”,其首、未兩筆分別為3、2節(jié)。
(3)線段節(jié)數(shù)超過(guò)3節(jié),如“毛、事”,兩字末筆超過(guò)3節(jié),但仍視作3節(jié)。
3、鍵碼(編碼)代碼方陣內(nèi)保留3×3型1-9常規(guī)數(shù)字鍵(以便兼作他用)、頂層及左側(cè)各鍵選用形似鍵位特征的字母為編碼代碼,見(jiàn)表2。
4、鍵碼與首末筆的對(duì)應(yīng)漢字的每個(gè)基本單元(字根、部件)的首筆和末筆,按其所處的結(jié)構(gòu)層位和字成后的線段節(jié)數(shù),均在方陣盤中有對(duì)應(yīng)的鍵碼。即(1)凡屬側(cè)撇1節(jié)的筆畫(huà)均對(duì)應(yīng)相應(yīng)層位的左側(cè)鍵。如斤(首筆為側(cè)頂)、朱(首筆為側(cè)上)、片(首筆為側(cè)中)、廠(末筆為側(cè)下)。
(2)凡屬頂撇1節(jié)的筆畫(huà),則按其撇下的支點(diǎn)頭數(shù)(不論是否相連),分別對(duì)應(yīng)于頂層各相應(yīng)節(jié)數(shù)鍵。如乏(頂1)、豸(頂2)、采(頂3)。
(3)其他所有類型筆畫(huà),均按其線段節(jié)數(shù)對(duì)應(yīng)于相應(yīng)層位的1、2、3鍵。如“丁”字,其首、末筆對(duì)應(yīng)鍵位分別為上1、下2,換成編碼代碼則為1鍵、8鍵;“羊”字,其首、末筆對(duì)應(yīng)頂2、下3(即V鍵、9鍵)。
二、復(fù)筆的處理為使編碼輸入簡(jiǎn)潔,對(duì)連續(xù)相同的筆畫(huà)(即復(fù)筆)均視作一筆(一碼)。復(fù)筆不份層位,凡橫列式復(fù)筆均對(duì)應(yīng)于頂層相應(yīng)節(jié)數(shù)鍵碼,如分別對(duì)應(yīng)于頂1、頂2、頂3、側(cè)頂(亦即橫復(fù)1、橫復(fù)2、橫復(fù)3、復(fù)4)鍵;豎列式復(fù)筆則對(duì)應(yīng)于左側(cè)相應(yīng)鍵碼,如一、二、三,分別對(duì)應(yīng)于側(cè)上、側(cè)中、側(cè)下(亦即豎復(fù)1、豎復(fù)2、豎復(fù)3)鍵。為使各復(fù)筆陣列整齊,相關(guān)單筆(點(diǎn)、橫、豎)均列其中。
復(fù)筆基本特點(diǎn)1、各復(fù)筆均需連續(xù)完成,間隔筆不屬,如镸,其首橫和中間兩橫不屬連續(xù)筆;扌其上橫和下提不連續(xù)(但心、必的上3點(diǎn)雖不是連續(xù)筆,則仍算復(fù)3點(diǎn),這是僅一的例外)。
2、各筆節(jié)數(shù)相同如 三、豐,3種復(fù)筆中,每種內(nèi)各筆線段節(jié)數(shù)相同,分別為1、1、2節(jié)(僅有“ ”其各筆節(jié)數(shù)不同,仍為橫復(fù)3,為唯一例外)。
3、橫列同層位,豎列同邊鄰如“升”字,其末“ ”豎雖是連續(xù)復(fù)筆,但左豎在首撇下,右豎屬中,兩豎不同層,則不屬?gòu)?fù)筆;如部件“ ”,其上橫有邊鄰、下橫無(wú),則不屬?gòu)?fù)筆。
4、除純橫復(fù)筆從嚴(yán)外(如二、三、 豐,均為橫筆,不可撇橫混用),其他各類復(fù)筆(單節(jié)除外)均要求不嚴(yán),可點(diǎn)、豎、撇、捺混用,如 川、卄、卅、 水(唯“八”、“兒”字不屬?gòu)?fù)筆)。
5、分列于對(duì)稱軸兩邊的點(diǎn)、撇、捺、均視為復(fù)筆(但對(duì)角交叉不屬,如為)如木、半、舟、雨、水。
6、復(fù)件()、復(fù)字(品)復(fù)詞(好好)的相關(guān)內(nèi)容在編碼規(guī)則中補(bǔ)述。
三、漢字的拆分(一)、拆分原則一字拆作二,一定、六不拆。
1、一字拆作二由于采用首筆、末筆、四碼輸入漢字,這種編碼法能兼收漢字筆畫(huà)在字頭字尾的不同層位不同線段節(jié)數(shù)的多樣性,使字、詞條在編碼中分布均勻合理重碼少。
本編碼容量為16×17×17×17=78608組,實(shí)際使用3萬(wàn)組,除編入了6700個(gè)單字外,還編入了5.2萬(wàn)條詞語(yǔ),但字詞條的平均重碼未超過(guò)2條,輸入快捷均勻。因此,在考慮重碼因素的前提下,須采用一種較簡(jiǎn)潔的拆分方法,將漢字塊狀地一分為二,使其由一字變一“詞”,便于首筆、末筆四碼輸入。
2、六不拆為達(dá)到上述目的,則須對(duì)部分特殊結(jié)構(gòu)作一些拆分限制,以免拆分過(guò)于零碎見(jiàn)表3。表3六不拆 3、“一定”定字中“字”的范圍“字”的范圍按本編碼的漢字拆分方法(在后),字中含“字”的上下型漢字才可拆成兩部分,故須對(duì)“字”的范圍界定。
a、現(xiàn)代書(shū)面行文常用的字(也即國(guó)標(biāo)一、二級(jí)標(biāo)準(zhǔn)的6763個(gè)漢字以內(nèi))且去除一、二、三幾個(gè)字。如“丁”字就不能認(rèn)為含“一”字而拆成兩部分。
b、易出現(xiàn)在字頭字尾的幾個(gè)非常用字(部首)×、 厶、口(所有口字框),除上述兩點(diǎn)范圍內(nèi),其他古字,偏字均不算本拆分意義上的“字”。(二)、拆分方法表4拆分方法 四、筆順1、基本字根(部件)按常規(guī)書(shū)寫筆順,多種筆順并用的字根統(tǒng)一為一種,即力(刀、力)、萬(wàn)(一、 萬(wàn))、乃( 乃)、及(丿、 及)。
2、本編碼設(shè)制之需而作調(diào)整的唯一部首犭( 犭)3、組合字筆順按首部首筆,末部末筆定。如“國(guó)”字,其書(shū)寫末筆為框底橫,而本編碼將其拆為“國(guó)”、“玉”兩部分,則“國(guó)”的末筆應(yīng)為“玉”上的點(diǎn),而非“國(guó)”字的底橫。
五、首筆、末筆定位(層位)1、定位原則凡“字”筆均在最小字體中確定層位。
如“辜”按規(guī)則拆成“古”、“辛”兩部分,若對(duì)“古”的首筆“一橫”定層位,因該筆所屬的最小字為“十”,則首筆“一橫”的層位應(yīng)是中(在“十”字里,該筆不上不下),而不是“古”字的上,同理,“辛”的末筆“1豎”的層位也是中,而不是“辛”字的下。
2、定位方法表5定位方法 (表中未及之例,可參看表6及相關(guān)內(nèi)容)
六、首末筆在方陣鍵盤上的分布(見(jiàn)表6)表6非死記硬背的字根表,只是將各類首、末筆(圖表中各字粗筆處)示例,按點(diǎn)、橫、豎、撇、捺、折分類成橫列,分置于各相應(yīng)鍵碼,使相關(guān)內(nèi)容上下左右橫豎成行,便于理解。雖有一定字幅,但因條理簡(jiǎn)潔,初學(xué)者看完本說(shuō)明相關(guān)內(nèi)容結(jié)合表6,再用以下口訣統(tǒng)攬歸納,稍加體會(huì)即可熟識(shí),無(wú)須背記。
方陣共四層,單撇繞三邊;橫復(fù)按頂層,豎復(fù)擺左側(cè);中間數(shù)字鍵,位層一二三;冰河水下流,仁行須到底。
(一)、“方陣共四層,單撇繞三邊”在4×4型方陣鍵盤上,有一明顯規(guī)律,漢字筆畫(huà)中,凡一節(jié)的撇筆(即單撇),按本編碼的有關(guān)規(guī)則,它們剛好能(也只能)出現(xiàn)在方陣鍵盤的頂層,左側(cè)、下層三邊的所有十個(gè)鍵碼上。
(二)、“橫復(fù)按頂層,豎復(fù)擺左側(cè)”1、橫列復(fù)筆可分為點(diǎn)、撇、豎筆三個(gè)橫向復(fù)筆陣列。
(1)、點(diǎn)漢字中的所有橫列2、3、4復(fù)點(diǎn),以及除屬側(cè)壁、側(cè)頂?shù)淖笥疫咟c(diǎn)外(如卜、禮、為、我)的其他所有層位的單點(diǎn),均分別對(duì)應(yīng)于頂層的A、V、W、S。
(2)、撇除邊頂撇(如白、我)定在左側(cè)S鍵上外,其他各頂撇均按其撇下所對(duì)應(yīng)的“支點(diǎn)”頭數(shù)(不論是否相連)、分別對(duì)應(yīng)于A、V、W鍵。但可拆字應(yīng)按拆后狀態(tài)定位,如“質(zhì)”拆成“ ”,其頂撇對(duì)應(yīng)于頂鍵S鍵,而不是對(duì)應(yīng)于“二支點(diǎn)”的V鍵。
(3)、豎除單豎從嚴(yán)外(必須是處于上下連接筆中部的中垂線,如山、工、斤、亻,和左右結(jié)構(gòu)中的平行單豎,如舊、刂)其余復(fù)2、復(fù)3、復(fù)4從寬如工、業(yè)、 、川、 、水、豕2、豎列復(fù)筆可分為橫線復(fù)筆、側(cè)壁上復(fù)筆兩個(gè)陣列(1)、橫線如一、二、三、豆、旦、 、豐。其中組合字的“一”橫,其對(duì)應(yīng)面應(yīng)是平行面,如“豆、旦,但字中非兩面平行的夾橫則按拆分后確定,如“貴”按規(guī)則拆成“中、 ”中的上橫屬橫線復(fù)筆在P鍵。
(2)、側(cè)壁上復(fù)筆漢字筆畫(huà)除有上、中、下相連的結(jié)構(gòu)類型外,還有一類筆畫(huà)立足在側(cè)壁(直豎或立式撇、捺筆)上引出,如卜、乍、非、礻、衤、犭、人、內(nèi)。
側(cè)壁上筆畫(huà)特點(diǎn)a、可點(diǎn)、橫、撇、捺并用,但不和上下筆相連,如“長(zhǎng)”的首撇,“內(nèi)”的末撇,“衤”的側(cè)2點(diǎn)。
b、側(cè)壁上各筆無(wú)上下層之分,只有數(shù)量之分,其側(cè)一、側(cè)二、側(cè)三、側(cè)四分別對(duì)應(yīng)左側(cè)P、D、Q、S鍵。
3、特殊鍵位側(cè)頂S鍵其鍵位兼具頂層,側(cè)位,橫列復(fù)四( ),豎列側(cè)壁復(fù)四(水、家、雨)四重特征,故特選帶有雙向轉(zhuǎn)角且其音近似“四”音的字母“S”為代碼,字根X、乙也分別因音似、形似“S”定位在S鍵上(包括九、虧、乃等含內(nèi)錯(cuò)角的雙折筆)(三)、“中間數(shù)字鍵,層位一二三”除去上述對(duì)應(yīng)于頂層和左側(cè)各鍵位的筆畫(huà),其余首、末筆畫(huà)只須按其所屬層位和線段節(jié)數(shù)(一、二、三),對(duì)應(yīng)于中間各數(shù)字鍵。
(四)、“冰河水下流,仁行須到底”按照規(guī)則,部首冫、氵和亻、彳、彡的撇筆各屬豎列復(fù)筆陣列應(yīng)對(duì)應(yīng)于左側(cè)各鍵位,但從編碼分布角度考慮,特將其移至下層,因其分別是冰、河、仁、行、須的部首,且均是從上層,或中層移至下層,故取其句字面意加深記憶。
七、編碼規(guī)則(見(jiàn)表7)八、其他(字詞范圍,重碼、錯(cuò)碼處理)(一)、字詞范圍1、字國(guó)標(biāo)GB2312-80的一、二級(jí)6763個(gè)異體漢字。對(duì)于其他在現(xiàn)代無(wú)實(shí)用意義偏冷古字暫未編入;繁體字商家制作軟件時(shí),可按通用做法設(shè)置功能鍵用簡(jiǎn)化字置換。
2、詞語(yǔ)為滿足實(shí)用性(在手機(jī)上人們單手擊鍵的速度不可能很快,因此在保證重碼率正常的前提下,盡可能地編入較多的常用詞語(yǔ)是提高編碼輸入速度的唯一途徑),本編碼能輸入5.2萬(wàn)條詞語(yǔ),包括全部常規(guī)詞組、成語(yǔ)、警句、格言,地名(設(shè)區(qū)市以上、各國(guó)國(guó)名首都名)、物名(所有生活用品)、人名(國(guó)家領(lǐng)導(dǎo)人、古今名人)、生活常用品、政府各部局名、公共場(chǎng)所名、新聞公文中常出現(xiàn)的特定聯(lián)詞、時(shí)間詞、序列詞、以及日常口語(yǔ)及書(shū)面中需常用的非常規(guī)聯(lián)詞(如你來(lái)、我去、他想、不能等),總之,除了代詞、介詞、連詞、副詞、縣以下地名、一般人名,偏冷物名專業(yè)技術(shù)語(yǔ)等,本編碼輸入過(guò)程中極少單獨(dú)輸入單字。
(二)重碼處理1、編碼容量16×17×17×17=78608組(除首碼外,后三位碼上均會(huì)輸入空位碼,多一位數(shù))。
2、重碼實(shí)際使用3萬(wàn)組碼,能輸入字詞條共5.95萬(wàn)條,平均重碼不到2條;其中16500組碼無(wú)重碼(占總使用碼55%),12500組碼的重碼在2至5條之間(占總數(shù)41%),900組碼的重碼在6條至10條之間,只有35組碼的重碼超過(guò)10條(但不超過(guò)18條),前兩類共占總數(shù)96%,后兩者只占4%。且編碼設(shè)置時(shí),將重碼中的較偏冷單字和詞語(yǔ)均放在第二檔重碼提示欄中,超過(guò)十個(gè)重碼的則增設(shè)第三檔提示欄,因此,實(shí)際輸入過(guò)程中的無(wú)重碼比例遠(yuǎn)高于55%,而重碼提示欄的重碼極少超過(guò)5條,能適用小屏幕電腦(手機(jī)),極具實(shí)用、通用性。
(三)錯(cuò)碼處理1、對(duì)個(gè)別字因筆順原因而輸入了錯(cuò)碼,電腦屏幕上該字則會(huì)被小括號(hào)框住,以示筆順有誤,如“力”字,折為首筆,若反之而輸入,熒幕上則出現(xiàn)(力)字。
2、對(duì)人們因習(xí)慣而在詞組中常誤用的字,則用中括號(hào)框住顯示,如“委曲求全”誤輸為“委[屈]求全”。
(四)漢字拆分、編碼流程示例見(jiàn)表8。表6首、末筆在方陣鍵盤上的分布(圖表中各字粗筆處) 表7編碼規(guī)則
表8漢字拆分、編碼流程示例
權(quán)利要求
1.一種通用于各種大中小型電腦的漢字輸入編碼法及其配套鍵盤,其特征是采用4×4型方陣漢字輸入鍵盤,每個(gè)方陣鍵各對(duì)應(yīng)于一種漢字筆畫(huà)在字結(jié)構(gòu)中的層位及該筆畫(huà)字成后的線段節(jié)數(shù),以首筆、末筆、四碼輸入漢字及詞語(yǔ),漢字的每個(gè)最小基本單元(字根、部件)的首筆和末筆,均在方陣盤中有各自的對(duì)應(yīng)鍵碼1.1鍵盤(鍵碼對(duì)應(yīng)的層位和線段節(jié)數(shù))1.2鍵碼(編碼)代碼
2.按照權(quán)利要求1所述的漢字輸入編碼法及其配套鍵盤,其特征是2.1、鍵盤、鍵碼(對(duì)應(yīng)層位、線段節(jié)數(shù)、編碼代碼)16個(gè)方陣鍵分列成四層(空位鍵、數(shù)字0鍵、其它功能鍵在方陣外),各對(duì)應(yīng)于漢字筆畫(huà)在結(jié)構(gòu)中所處的四種層位(頂、上、中、下),每層四鍵,凡屬側(cè)撇1節(jié)(線段)的筆畫(huà)均對(duì)應(yīng)相應(yīng)層位的左側(cè)鍵,凡屬頂撇1節(jié)則按其撇下的支點(diǎn)頭數(shù),分別對(duì)應(yīng)于頂層各節(jié)數(shù)鍵,其它所有類型筆畫(huà),均按其線段節(jié)數(shù)對(duì)應(yīng)于相應(yīng)層位的1、2、3鍵,線段節(jié)數(shù)漢字筆畫(huà)自身彎、折、勾,及與前后筆畫(huà)相交字成后所形成的線段數(shù)量,超過(guò)3節(jié)的均算3節(jié),鍵碼(編碼)代碼方陣內(nèi)保留3×3型1-9常規(guī)數(shù)字鍵(兼作他用),頂層及左側(cè)各鍵選用形似鍵位特征的字母(A、V、W、S、P、D、Q)為代碼,2.2、復(fù)筆的處理漢字筆畫(huà)中的連續(xù)點(diǎn)、橫、豎、(或含撇、捺),均視作一筆,按其節(jié)數(shù)(并將單節(jié)點(diǎn)、橫、豎歸入)整合成橫列式復(fù)筆陣、豎列式復(fù)筆陣兩類,分別對(duì)應(yīng)于頂層和左側(cè)面各相應(yīng)節(jié)數(shù)鍵(側(cè)上、側(cè)中、側(cè)下、側(cè)頂鍵又分別兼作側(cè)一、側(cè)二、側(cè)三、側(cè)四鍵),2.3漢字的拆分2.3.1、拆分原則2.3.1.1、交筆,單體、夾體字不拆,2.3.1.2、一字拆作“二”,將組合體字簡(jiǎn)潔拆作兩部分,便于首筆、末筆、四碼輸入,2.3.2、拆分方法2.3.2.1、上下型上部含“字”的,取最大字及同層左右筆(角框除外)拆出,中部或末部含“字”的,拆出“字”前非“字”筆畫(huà),2.3.2.2、角框、三圍框、四圍框?qū)⒖蚣芘c框內(nèi)筆分拆。但圍框體外另有筆畫(huà)時(shí),圍框本身不拆,2.3.2.3、左右型右部不含“字”的,將左右分拆;右部含“字”,將右部按上下型或角框分拆,其上部與左部合成首部,右下部為末部,2.3.2.4、左中右型將左部中部拆出,四列式時(shí),將左1、左2拆出。2.4、筆順最小字根(部件)按常規(guī)筆順,多種并用的統(tǒng)一為一種,組合體筆順則按首部首筆,末部末筆定,2.5、首筆、末筆定位(層位)2.5.1、定位原則在最小字體中確定“字”筆層位,2.5.2、定位方法2.5.2.1、單層筆畫(huà)(拆分后)“字”筆,按定位原則可獨(dú)自定位,非“字”筆按在原結(jié)構(gòu)中的層位相對(duì)定,2.5.2.2、多層筆(豎向)首層為上(或頂),末層為下,兩頭封為中,不上不下為中,2.5.2.3、特殊結(jié)構(gòu)筆a、折筆、豎向三圍的折筆均按其與角內(nèi)筆或與框?qū)吂P的包空容程度定位,包上部為上,齊頭包為中,上下兼具為中,包下部為下,b、底橫側(cè)連(串)筆局部定位橫線上為上,橫線側(cè)連(串)為中,2.6、編碼方法2.6.1、漢字2.6.1.1、不可拆字取其首、末筆代碼(夾體圍框則框上首筆,框內(nèi)末筆),再補(bǔ)兩空碼編足四碼,2.6.1.2、可拆字各取兩部分的首、末筆代碼,不足碼的補(bǔ)空碼,依次編成四碼,末部為口字空框時(shí)(按框體末筆在框內(nèi)規(guī)則推斷)其末筆用空碼,2.6.1.3、特常用可拆字代詞、介詞、常用動(dòng)詞、單位詞等常在語(yǔ)句中以單字出現(xiàn)的漢字,除按可拆字規(guī)則編了四碼外,還按不可拆字只取首末筆及空碼編了簡(jiǎn)碼,2.6.2、詞組2.6.2.1、二字詞每字各取首、末筆代碼(一筆字用空碼補(bǔ)末筆碼),依次編成四碼,2.6.2.2、三字詞首字取首筆碼、次字取末筆碼、第三字取首筆、末筆碼,依次編成四碼,2.6.2.3、四字以上詞首字首筆碼、次字未筆碼、第三字首筆碼,末字未筆碼,2.6.2.4、詞中一筆字用碼需用二碼時(shí),末筆碼用空碼,只需一末筆碼時(shí),則用首筆碼(實(shí)筆碼)。2.6.2.5、各字為末筆碼時(shí),若末部為三圍框、四圍框,則其末筆為框內(nèi)末筆(但框內(nèi)先發(fā)筆的三框字則反之),若末部為空框,除口字框用空碼外,其他空框末筆均為框上末筆,2.6.3、復(fù)體(復(fù)件、復(fù)字、復(fù)詞)2.6.3.1、復(fù)件(字中連續(xù)有數(shù)個(gè)非字的相同構(gòu)件)該部分直接用一碼相應(yīng)的復(fù)筆碼(后面均簡(jiǎn)稱復(fù)碼),2.6.3.2、復(fù)字(字中有幾個(gè)連續(xù)相同字根)a、純復(fù)字首筆碼+末筆碼+兩空碼b、部分復(fù)字,需用二碼時(shí)該部分為,首碼+復(fù)碼;只需用一碼時(shí),該部分直接用一復(fù)碼,2.6.3.3、復(fù)詞(詞語(yǔ)中連續(xù)幾個(gè)相同字)a、全復(fù)詞用四碼,首筆碼+末筆碼+空碼+復(fù)碼,b、部分復(fù)字,只能用二碼時(shí)(復(fù)詞在詞語(yǔ)前面或后面),該部分為,首筆碼+復(fù)碼,只能用一碼時(shí)(復(fù)詞在詞語(yǔ)中間或最后),該部分直接用一復(fù)碼,2.7、重碼處理2.7.1、無(wú)重碼時(shí),輸入四碼,字或詞語(yǔ)即在屏幕上直接顯示,2.7.2、有重碼時(shí),則在提示欄的1-9數(shù)點(diǎn)后同時(shí)顯示第一檔的9個(gè)以內(nèi)重碼,可直擊相應(yīng)數(shù)字鍵選擇,2.7.3、現(xiàn)代基本不用的單字、非常用的詞語(yǔ),所有地名(省會(huì)以上除外)、人名、國(guó)名(中、美、英、法、俄除外)、藥名、疾病名、專業(yè)術(shù)語(yǔ)等,以及超過(guò)9個(gè)重碼,均設(shè)在第二檔重碼欄內(nèi),輸入四碼后,只需加擊一下空位鍵,即可在提示欄中顯示,再直擊數(shù)字鍵選擇。
全文摘要
本發(fā)明公開(kāi)了一種能通用于各種大中小型計(jì)算機(jī)(電腦)的漢字輸入編碼法及其配套鍵盤。其特點(diǎn)是采用4×4型方陣漢字輸入鍵盤,每個(gè)方陣鍵各對(duì)應(yīng)于一種漢字筆畫(huà)在字結(jié)構(gòu)中的層位及該筆畫(huà)字成后的線段節(jié)數(shù),以首筆、末筆、四碼輸入漢字及詞語(yǔ),漢字的每個(gè)最小基本單元(字根、部件)的首筆和末筆,均在方陣盤中有各自的對(duì)應(yīng)鍵碼。本發(fā)明提供一套易學(xué)、實(shí)用、且能通用于各種大中小型電腦的理想漢字編碼輸入技術(shù),能極大的提升全民族的電腦普及率。
文檔編號(hào)G06F3/023GK1482530SQ0312462
公開(kāi)日2004年3月17日 申請(qǐng)日期2003年7月4日 優(yōu)先權(quán)日2003年7月4日
發(fā)明者曾艾明 申請(qǐng)人:曾艾明