專利名稱:漢字輸入平臺數據構架下的界面技術的制作方法
技術領域:
本發明屬于中文電腦的信息處理,是建立不同編碼輸入的一種通用漢字輸入平臺數據構架下的界面技術。
在已有的技術中,雖然建立了中文平臺,例如“中文之星”的中文平臺是一個優秀的系統,但是其中有關輸入技術卻僅僅采用了碼表編輯器(見《中文之星2.0高級使用技巧》ISBN7-302-01796-4),該編輯器不但限定數字鍵不能作為編碼鍵位,使一批含數字鍵的編碼無法進入中文平臺而且提示僅限于重碼,特別是在人機界面上缺乏指導操作的描述和菜單功能,致使中文電腦中最主要的,和用戶打交道最多的漢字輸入,缺少友好的界面幫助,影響了智能化的發展,在這里所指的智能化是利用電腦所做的一切旨在幫助減輕記憶,判斷的技術。
本發明的主要目的在于建立滿足絕大多數漢字輸入法的平臺數據構架,它支撐通用的、友好的人機界面,并且能夠體現不同的編碼特色。
本發明的基本內容是(1)規范的各種輸入法進入平臺所建立的編碼數據文件,應包括該輸入法在不同碼位上的鍵元集合及其功效作用,鍵元串的前示性結局和指導說明以及字詞編碼間的關系參數;(2)平臺固有獨立的詞庫數據表是相關型樹形結構,其中以字表漢字為首詞素的詞族是“樹”,首詞素、第二詞素及后繼詞素為“根、枝、葉”,首詞素通過鏈接參數指向枝、葉集,枝葉間以特征鏈代碼建序劃分層次,并以歸原地址碼聯結字表數據;(3)對于每一鍵串,屏幕窗口上不但顯示當前已鍵入的信息,前示后續鍵位所帶來的結局,而且有指導后續操作的說明。
在這里所謂經過規范處理的漢字編碼,是指任何一個準備建立在這一個輸入平臺上的編碼源文件,在人機交互方式下按數據文件格式輸入以下內容(1)該編碼所限定的最大碼長的長度,例如漢語拼音輸入的最大碼長的長度是6碼。
(2)該輸入法所限定的用于漢字編碼各碼位上的鍵元集合,其中包括用作選擇鍵(結束鍵)的鍵位。例如,按漢語拼音輸入首鍵是不包括“v、i、o、u”的字母鍵,次鍵則是所有字母鍵(當用v代u時)。
(3)功能作用的鍵位,例如向后翻頁的翻頁鍵和向前翻頁鍵以及通配符鍵。
(4)參數字和語詞編碼之間的關系,例如雙字詞的編碼是這兩個漢字各自編碼的前兩碼。其它參數,例如字集是GB-2312的6763個漢字及1-9區的符號。
(5)漢字集和編碼數據的對照表,例如“智”對應于(MJK);詞組和編碼數據的對照表,這里說的詞組可以是縮寫方式或定義方式來編碼的詞組。例如“北京電視臺”對應于(BTV)。
(6)提示窗口中指示文字的對照表,例如在“雙拼”輸入中地擊“Q”鍵之后,“后續鍵窗口”出現由Q鍵為聲母的各雙拼的代表字而“指示窗口”則告訴用戶“選擇待輸入漢字的同音字鍵位”這時用戶無需記住雙拼韻母的代碼便可使用“雙拼輸入”了。
(7)針對本編碼的“協助用戶的help文件”的文字和圖符的說明。
對于漢字平臺有適應于不同內容的多行可變提示窗口,窗口的左上部分為當前信息行,所提示的內容包括編碼名稱,當前鍵串的編碼串以及該碼串對應的內容(漢字的字、詞和符號);其右部窗口對應的是編碼串后續鍵所前示的內容,其左下部分是指導續操作有關的文字指示說明。
在源文件的鍵位定義中必需有翻頁鍵和回翻鍵,但是翻頁鍵只能自第二鍵以后才有同碼字的翻頁,在輸入一個漢字之前擊翻頁鍵是作為功能轉換之用,所引起的提示是菜單式圖符或文字,例如列出如下的菜單。
(1)區位碼 (2)漢語拼音(3)雙拼 (4)筆形碼 (5)形碼(6)ASC碼 (7)全角(半角) (8)窗口1行(多行) (9)提示(不提示)
(0)退出此后根據選擇的號碼切換到新的編碼或工作環境中去。作為底層的輸入平臺技術在設置鍵位(如ALT+F[n])時就不會和應用軟件引起沖突。并且也免除了用戶記憶功能鍵或長期占用屏幕提示信息行位置。
在輸入一個漢字以前擊回翻鍵,則是作為針對當前編碼的說明(help)文件的開關。這種文件是說明當前編碼技術要點,編碼規則和碼元分布的內容,其內容可以因編碼而異。
對于輸入平臺的窗口而言,屏幕上設置的鍵位圖符,它不只是起提示作用,而且也作為圖形界面的開關,譬如在Windows環境下用鼠標器,在屏幕觸摸技術和光筆方式下,都起到和鍵盤上的擊鍵具有同樣功效。
上述輸入平臺技術的一個不可缺少的組成部分是公用的相關的字詞表,輸入平臺面向各種不同的編碼,如果同時安裝不同編碼的詞庫固然很不經濟,即使跟隨編碼切換也是不勝其繁,因此,采用樹形結構的詞表是合理的(見《漢字鍵盤輸入技術與理論基礎》6.4.3及6.4.4節,清華大學、廣西科學技術出版社,ISBN7-302-01448-5)其要點是與字編碼相關的語詞處理所用詞庫的數據結構是采用樹形結構(Tree Structure),它的“樹”是首詞素所復蓋詞的子集,首詞素作為“樹根”,并以鏈接參數指向詞庫中的枝、葉集的起始地址,以“特征鏈(類型)”聯結“枝”、“葉”等層的詞素以實現局部樹結構的遍歷(tree traresal)。其中每一詞素數據結構中包含特征鏈代碼及指向該詞素在字編碼字表的地址,因此,可以用歸原算法根據字詞相關來檢驗輸入的詞素編碼是否一致,從而決定該詞素字的有效性。例如待輸入的詞是“機智”其中“機”的編碼是“FQY”“智”的編碼是“MJK”,取每字前兩碼因此“機智”的詞碼是“FQMJ”,當輸入之后由前兩碼查得可復蓋的漢字有“棚、機”等字,根據“棚”作首詞素的詞族有“棚子”,“棚戶”。由“棚”指向“(棚)戶”、“(棚)子”的枝、葉集后,歸原到編碼字表地址檢驗出“子”及“戶”的前兩碼均不是MJ,因此,要轉入“機”為首詞素的詞族如“(機)關”、“(機)敏”、“(機)智”、“(機)動”……其中根據歸原的字表地址所檢驗的編碼只有“智”的前兩碼是MJ,因此詞碼“FQMJ”所對應的雙字詞是“機智”,完成了樹形結構公用詞表歸原算法的局部遍歷過程。從這一例子可知,當語詞輸入僅僅和字編碼的碼表相關時,公用詞庫本身就獨立于輸入方法之外。這樣除了大約7~10K的鏈接參數表外,大體上可以做到每一千詞約增加2K字節的開銷,對于3萬詞條的詞庫而言僅占用60K空間,因而十分經濟。
綜上所述,智能化漢字輸入平臺界面技術的優越性表現在1、提供滿足絕大數漢字輸入法的漢字輸入平臺技術,節省各自獨立開發輸入法軟件所需的力量和費用。
2、界面上的,通用性強又能體現不同的特色,適應并提高了各類輸入法的水平。
3、智能化和友好的界面、前示技術(結局和指示)減輕了使用者的負擔、壓力。
4、菜單驅動的(triangle)功能轉換方式,避免了應用軟件上的組合功能鍵和漢字功能轉換間的可能發生的沖突。
5、樹形結構的壓縮字詞表及相關的歸原算法,極大地降低語詞庫空間開銷,與普通列表方式相比,對于一個三萬詞條的的詞庫由200K以上降低到70K左右。
6、提供了屏幕上直接應用圖形界面開關來輸入漢字的環境。
由于存在上述優點,本發明很好地達到了前面所述的發明目的。提供了圍繞數據構架和界面設計的一系列構成漢字輸入平臺的技術。
下面是本發明的最佳設計例和附1是適用本發明拼音輸入首鍵前示的窗口界面圖2是適用本發明的雙拼輸入的次鍵前示窗口界面
圖1和圖2是在全拼和雙拼輸入中典型的界面窗口的顯示圖形,其特點是集中前示的的漢字(高頻字)、所在在鍵位及對操作的指導全都顯示給用戶,是漢字拼音輸入的人機交互式界面形態。
在圖1中提示窗口左上角的[全拼]標明系統是在漢語拼音的狀態下,其后的指示是“前示內容是一鍵簡碼,”指明了右邊的前示區中每一個鍵位上所標明的漢字的一鍵簡碼,(其中字母鍵是要加空格以后才能上文本的)。后面的指示是指明功能轉換作用的“]”鍵(見表1)和給予幫助的“[”鍵(給出一頁的help文件)。
圖2是雙拼輸入中在聲母鍵Q后雙拼的韻母代碼之同音字提示窗口,鍵位上的同音字又是空格鍵上屏的聲韻簡碼,而數字鍵提示的是一鍵“Q”的簡碼擴充。
表1首鍵“]”后的功能轉換
權利要求
1.通過鍵盤或鼠標器把漢字輸入電腦的通用平臺技術,在已有的中文平臺技術中,所采用的碼表編輯器在范圍和智能化度上均未能充分適應當前漢字輸入電腦的要求。本發明的基本特征在于(1)規范的各種輸入法進入平臺所建立的編碼數據文件,應包括該輸入法在不同碼位上的鍵元集合及其功效作用,鍵元串的前示性結局和指導說明以及字詞編碼間的關系參數;(2)平臺固有獨立的詞庫數據表是相關型樹形結構,其中以字表漢字為首詞素的詞族是“樹”,首詞素、第二詞素及后繼詞素為“根、枝、葉”,首詞素通過鏈接參數指向枝、葉、集,枝葉間以特征鏈代碼建序劃分層次,并以歸原地址碼聯結字表數據;(3)對于每一鍵串,屏幕窗口上不但顯示當前已鍵入的信息,前示后續鍵位所帶來的結局,而且有指導后續操作的說明。
2.根據權項1所述輸入平臺技術,有適應于不同內容的多行可變提示窗口,其左上部分為當前信息行,所提示的內容包括編碼名稱,當前鍵串的編碼,以及該碼串對應的內容(漢字和符號);其右部窗口對應的是編碼串后續鍵所前示的內容,其左下部分是指導操作有關的文字指示說明。
3.根據權項1所述的輸入平臺技術,在規范處理的各種不同的漢字編碼時,還要輸入下列內容(1)該編碼所限定的最大碼串長度(字、詞),(2)功能作用的鍵位,(3)字、詞組的碼表,(4)針對本編碼的協助用戶的說明文件。
4.根據權項3所述的輸入平臺技術,作為功能作用的定義代碼中有向后翻頁的翻頁鍵和向前翻頁的回翻鍵,當在輸入一個漢字之前擊翻頁鍵是作為功能轉換之用,所引起的提示是菜單式圖符或文字,在輸入一個漢字之前擊回翻鍵是作為針對當前編碼的說明文件的開關。
5.根據權項1至權項4所述的輸入平臺技術界面,屏幕上設置鍵位圖符,在用鼠標器,觸摸技術和光筆方式的驅動下和鍵盤具有同樣的功效。
全文摘要
本發明屬于電腦的漢字平臺技術,目的在于建立通用的、智能化的、友好的人機界面環境,推動各種輸入方法向高層次發展。本發明的主要特征是把規范化的編碼數據和參數,在通用樹形字詞表的支撐下,建立一個多行前示性的屏幕窗口界面,該窗口不但有當前的輸入狀態信息,還包括前示性的結局和操作指導的內容。上述技術可以向絕大多數的漢字編碼提供良好的漢字輸入的界面環境,同時又具有各自不同特色,減少系統的開發費用和時間。
文檔編號G06F3/02GK1140274SQ9510743
公開日1997年1月15日 申請日期1995年7月7日 優先權日1995年7月7日
發明者胡宣華, 華紹和, 蔣順炳 申請人:胡宣華, 華紹和, 蔣順炳