專利名稱:一種計算機自然語言的優(yōu)化輸入方法
技術領域:
本發(fā)明屬于計算機輸入技術領域,為有序序列型輸入裝置,更進一步地提供了一種通用的優(yōu)化輸入方法。
自從計算機用于文字處理以來,人們很自然地采用了現(xiàn)存的打字機工作方式,特別是西文的計算機輸入更是如此。漢字的計算機輸入雖然采用了各種編碼,初步地解決了漢字的計算機輸入問題,但在原理上依然沒有跳出打字機的工作方式,這種工作方式的最大特征是把輸入過程變成一個純機械式的,并且輸入編碼和內容之間是一種靜態(tài)的,一一對應的簡單關系。這種傳統(tǒng)的工作方式有兩個缺點一是在輸入過程中,沒有充分發(fā)揮出計算機的優(yōu)越性,而僅僅把計算機作為打字機對待;二是從信息的觀點看,這種靜態(tài)的輸入方式帶有許多冗余信息。雖然在漢字輸入中為了克服這一缺點,引入了靜態(tài)的簡碼,但這種靜態(tài)的簡碼,無形中加大了輸入人員的記憶量,而且這種事先規(guī)定的簡碼,往往在輸入許多文章時并不是真正的簡碼。
雖然在計算機的漢字輸入方面也出現(xiàn)了幾種智能輸入法,如臺灣倚天公司“忘形輸入法”和哈爾濱工業(yè)大學王曉龍博士的“音聲輸入法”是當前漢字智能輸入法的代表,這兩種輸入法的優(yōu)點是充分利用了計算機來處理漢字輸入的難題;缺點是對整個語句進行分析,往往給輸入帶來不確定性,為了克服這種不確認性,常常需要對整句進行再編輯、修改后才能送出,這樣就容易打斷輸入人員的連續(xù)思維,也失去了和顯示內容的實時和同步性。聯(lián)想漢字雖然不存在再編輯、修改問題,但聯(lián)想式輸入有三個缺點一是每個字,尤其是常用字可聯(lián)想的詞太多,導致大量的屏幕選擇,盡管以后的版本增加頻選功能,但反而把原來的次序調亂了;二是對聯(lián)想的第一個字輸入沒有簡化,如果聯(lián)想不下去,只有老老實實輸入全編碼;三是由于中文大量是雙字詞,所以聯(lián)想往往只能聯(lián)想一次。
本發(fā)明的目的在于為有序序列型輸入裝置,提供一種通用的優(yōu)化輸入方法,它利用了文章中上、下文的關聯(lián)性,避免了輸入過程中的重復冗余信息。提高傳統(tǒng)輸入法(無論是中文還是西文)的輸入效率,改變傳統(tǒng)輸入法只要人去適應計算機的單向工作方式,而新的優(yōu)化輸入法做到了讓計算機也適應人的雙向工作方式。
本發(fā)明的特征在于當自然語言的單字、詞組、短語構成有序序列形式在輸入裝置上輸入時,可依據上文輸入的完整有序序列,自動地預區(qū)分下文輸入的有序序列第一步下文輸入可分兩種情況進行1.下文輸入的完整有序序列在上文中未輸入過,繼續(xù)輸入完整的下文有序序列;
2.下文輸入的完整有序序列在上文中輸入過,輸入簡碼以后,在屏幕提示區(qū),預提示的內容是、與該簡碼相對應的當前使用頻度最高的單字、詞組、短語;
第二步預提示的單字、詞組或短語為需要輸入的內容時,可通過確認動作來選取;也可繼續(xù)進行下文輸入,沒有確認動作;
第三步預提示的單字、詞組或短語不是所輸入的內容時,可繼續(xù)后面的下文輸入,沒有確認動作;
第四步對輸入過程中形成的簡碼,可以進行記憶、恢復、清除、予置、鎖定操作。
下面結合傳統(tǒng)編碼輸入法“前導漢字編碼”實例,進一步說明本發(fā)明對自然語言輸入的優(yōu)化。
前導漢字編碼的單字編碼如下前導碼(點、橫、豎、撇)+聲母+韻母+同音字區(qū)分碼例如“北”、“京”二字的輸入全編碼為
bfb-北 *jcx-京上面第三鍵分別代表拼音韻母(即雙拼表示),f-ei、c-ing。單字全編碼長度等于4。
這時,第一步輸入分兩種情況如果在上文中未輸入過單字“北”、“京”二字,要想用單字輸入它們,便只能輸入上述單字的全編碼。
如果在上文中已輸入過單字“北”、“京”二字,只需輸入它們的簡碼,這時屏幕的提示區(qū)便預提示出(假定“北”、“京”二字就是下面簡碼相對應的當前最高頻字) b 北(在提示行的右下角預提示)*j京(在提示行的右下角預提示)第二步如果這時確實需要輸入的就是“北”、“京”二字,就可以在該字出現(xiàn)在提示區(qū)時,鍵入空格鍵便完成輸入。碼長等于二碼。
上例中,如果使用者沒有注意到預提示信息,那么,仍然可以輸入北京二字的全編碼。
另外,假定使用者想輸入的是“計”字,同時它也在上文中輸入過,但由于該字在上文的輸入頻度比“京”字的輸入頻度要低,因此,輸入編碼的前兩碼后,屏幕提示的是*j京(在提示行的右下角預提示)為了輸入“計”字,勿需理睬預提示信息,而直接轉入下一步。
第三步繼續(xù)輸入“計”字的全編碼,“*jis-計”,這樣就完成了“計”字的輸入。
同樣道理,前導漢字編碼的常用二字詞編碼為
前導碼+聲母+韻母+前導碼+聲母+韻母下面是“北京”一詞的全編碼
bf*jc-北京常用二字詞全編碼長度等于6。
這時,第一步輸入分兩種情況如果在上文中未輸入過“北京”一詞,要想用詞輸入它們,便只能輸入上述詞組的全編碼。
如果在上文中已輸入過詞組“北京”,只需輸入它們的簡碼,這時屏幕的提示區(qū)便預提示出(假定“北京”就是下面簡碼相對應的當前最高頻常用詞組)
bf 北京(在提示行的右下角預提示)第二步如果這時確實需要輸入的就是“北京”一詞,就可以在該詞出現(xiàn)在提示區(qū)時,鍵入空格鍵便完成輸入。碼長等于三碼。
上例中,如果使用者沒有注意到預提示信息,那么,仍然可以輸入北京一詞的全編碼。
另外,假定使用者想輸入的是“北方”一詞,同時它也在上文中輸入過,但由于該詞在上文的輸入頻度比“北京”的輸入頻度要低,因此,輸入編碼的前三碼后,屏幕提示的是
bf 北京(在提示行的右下角預提示)為了輸入“北方”一詞,勿需理睬預提示信息,而直接轉入下一步。
第三步繼續(xù)輸入“北方”一詞的全編碼,“*bf*fv-北方”,(例中v-<p>
本發(fā)明的應用不完全依賴輸入裝置,只要是對自然語言采用有序序列的輸入裝置,均可采用本優(yōu)化輸入法,典型的實施例是用于中文或西文的筆輸入計算機中。
眾所周知,筆輸入的難點在于正確的識別率和輸入速度。采用本發(fā)明后對二者均有改善。
例1中文筆輸入假定我們在上文中輸入過某些字、詞、短語,在下文輸入時,由于上、下文的相關性,我們沒有必要重新輸入上文的全部重復成份,只需輸入某字、某詞、某短語的前面部分(和前例一樣),計算機可以預提示出可能性最大的某字、某詞、某短語,如果命中,只需確認一下,如果輸入的字、詞、短語和預提示不一致,只要繼續(xù)下面的輸入即可。這樣輸入的冗余信息減少,也減少了輸入冗余信息帶來的誤識別問題,同時提高了輸入速度和識別率。
例2西文筆輸入假定上文輸入過“computer”,在下文輸入時,在手寫區(qū)域寫入“com”后,可預提示“computer”,這時在利用筆確認后,即可輸入完整的“computer”。如果想輸入的是“command”,而不是“computer”,就無須確認動作,只要繼續(xù)補輸入后面的“mand”就行了。至于以后是“computer”,還是“command”占有“com”這個簡碼,要由上面兩個詞使用的頻度決定。本例中到底簡碼長度取多少為宜?是3位還是4位?可根據實施方案確定,從上面例子可看出,無論是西文的筆輸入還是中文的筆輸入,采用本優(yōu)化輸入法后,都可以有效地提高筆式計算機的輸入速度,同時免去了對冗余信息的再識別引起的誤碼率。
權利要求
1.一種計算機自然語言的優(yōu)化輸入方法,其特征在于當自然語言的單字、詞組、短語構成有序序列形式在輸入裝置上輸入時,可依據上文輸入的完整有序序列,自動地預區(qū)分下文輸入的有序序列第一步下文輸入可分兩種情況進行1.下文輸入的完整有序序列在上文中未輸入過,繼續(xù)輸入完整的下文有序序列;2.下文輸入的完整有序序列在上文中輸入過,輸入簡碼以后,在屏幕提示區(qū),預提示的內容是、與該簡碼相對應的當前使用頻度最高的單字、詞組、短語;第二步預提示的單字、詞組或短語為需要輸入的內容時,可通過確認動作來選?。灰部衫^續(xù)進行下文輸入,沒有確認動作;第三步預提示的單字、詞組或短語不是所輸入的內容時,可繼續(xù)后面的下文輸入,沒有確認動作;第四步對輸入過程中形成的簡碼,可以進行記憶、恢復、清除、予置、鎖定操作。
2.如同權利要求1所述的優(yōu)化輸入方法,其特征在于所述的簡碼元素個數(shù)(碼長)必須少于原來完整有序序列的元素個數(shù),并且保持原來次序、仍第一元素為序;單字、詞組或短語構成的完整有序序列簡碼的碼長,分別為n1、n2、n3,互不相等,其中n1,n2,n3的值取決于具體的實施方案。
3.如同權利要求1所述的優(yōu)化輸入方法,其特征在于所述的確認動作與輸入裝置有關,當輸入裝置帶有輸入鍵(或微動開關)時,可指定相應的鍵位(或微動開關)來實現(xiàn);當輸入裝置帶有光標(或坐標)定位功能,可通過光標定位于預提示區(qū)區(qū)域或坐標定位于特定的區(qū)域來實現(xiàn)。
4.如同權利要求1所述的優(yōu)化輸入方法,其特征在于所述的記憶操作是對本次輸入過程中可使用的簡碼全部保存;所述的恢復操作是對前次記憶操作所保存的簡碼全部恢復;所述的清除操作是對本次輸入過程中可使用的簡碼全部清除;所述的予置操作是對予先選定的簡碼全部裝入;所述的鎖定操作是對本次輸入過程中可使用的簡碼不再改變;需要變動時,可取消鎖定操作。
全文摘要
本發(fā)明屬于計算機輸入技術領域,為有序序列型輸入裝置,更進一步地提供了一種通用的優(yōu)化輸入方法。它利用了文章中上、下文的相關性,避免了輸入過程中重復的冗余信息,提高了傳統(tǒng)輸入法(無論是中文還是西文)的輸入效率,改變了傳統(tǒng)輸入法只要人去適應計算機的單向工作方式,而新的優(yōu)化輸入法做到了讓計算機也適應人的雙向工作方式。
文檔編號G06F3/023GK1095504SQ9410247
公開日1994年11月23日 申請日期1994年3月12日 優(yōu)先權日1994年3月12日
發(fā)明者余克艱 申請人:余克艱