專利名稱:中文字形輸入裝置及中文字形輸入法的制作方法
技術領域:
本發明涉及根據中文文字字形輸入中文的中文字形輸入,特別涉及使用有限個數的鍵輸入中文的中文字形輸入裝置及中文字形輸入法。
背景技術:
迄今為止,作為一種中文的輸入法,具有將漢字根據其字形進行輸入的字形輸入法。如利用這種現有的字形輸入法,要根據漢字字形將其分解為稱為部件的部分,使用者通過將多個部件進行組合而指定所希望的漢字。這個所謂的部件概念,不是在學校的基礎教育中使用的概念,而是為了進行中文輸入而開發的概念。因此,在開發中文輸入程序及裝置時,部件也多半是適應設想的條件而單獨生成的。
這樣,分解漢字生成部件的字形分解法雖然沒有統一,但任何一種字形分解法都將漢字分解為500種以上的部件。為了能將這樣生成的500種以上的部件利用數十個鍵輸入,將各部件編入數十種部件組中。即,各部件都屬于某一個部件組。因此,使用者不僅事先要記憶全部500種以上的部件,而且必須同時記憶各部件屬于哪一個部件組。
對于多數漢字而言,一個文字是由多個部件構成的。于是,使用者通過按照規定預定的組合的規則的順序指定多個部件逐步收斂得出作為候選的漢字。因此,除了上述部件及部件組之外,使用者還必須事先記憶部件組合規則。圖24是現有的字形輸入法的說明圖。如此圖所示,通過按照規定預定的組合的規則的順序指定各部件,可確定滿足指定條件的漢字組。
最近,開發了面向便攜式電話機或PDA(個人數字助理)的字形輸入法。根據這一方法,對于生成的部件組,可通過對9個鍵進行兩次擊鍵而選擇部件組。具體而言,就是生成81種部件組,各部件組按照其字形特征再分類成為9種。于是,通過第一擊鍵選擇應該最先輸入的部件的字形特征,通過第二擊鍵選擇具有該字形特征的部件組中所希望的那個。之后,通過第三擊鍵選擇應該接著輸入的部件的字形特征,通過第四擊鍵及其后的擊鍵從滿足至此輸入的條件的漢字組之中選擇所希望的漢字。這種9鍵輸入法,在不是利用一次擊鍵而是利用兩次擊鍵選擇一個部件組這一點上,與上述的利用數十個鍵的輸入法是不同的,但其輸入的基本概念則是共同的。
根據上述現有的字形輸入法,首先輸入的部件(第1部件)及接著輸入的部件(第2部件),無論哪一個都是從利用同一字形分解法生成的各部件中進行選擇。在這種字形輸入法中,使用者對通過指定第1部件收斂得出的候選群很難通過其后的輸入進行更有效地收斂。即,因為在進行最初收斂時利用的條件和在其后收斂時利用的條件是根據利用同一字形分解法生成的各部件指定的,因此很難將多量的漢字均等地劃分到通過收斂確定的各漢字組。
例如,在此輸入法中,在指定與“三點水”相當的部件作為第1部件的場合,滿足這一指定條件的候選個數,在GB編碼(GB2312)規定的6763字中可達到大約350字。另外,在指定與“草字頭”相當的部件作為第1部件的場合,候選個數也同樣為大約350字。
這樣收斂得出的約350字的漢字,通過第三擊鍵可再次收斂。假設將約350字的漢字對應9個鍵進行平均9等分,則每一個鍵分配到的漢字約為40個。但是,實際上,為第三擊鍵設定的選擇分支與第一擊鍵設定的相同。因此,很難對各鍵均等地分配漢字。具體地說,有時對一個鍵可分配多達80個字的漢字。在這一點上,由于收斂不充分,要進行高效率的輸入是很難的。
發明內容
本發明的目的是提供一種可使用有限個數的鍵高效地輸入字形的中文字形輸入裝置及中文字形輸入法。
為達到上述目的,本發明采用以下的字形分類法。該字形分類法是將作為輸入對象所設想的全部漢字按照其字形特征分類為多個字形小組。此外,此字形分類法,通過將各字形小組編入上位組而形成多層的層結構。從此層結構的上位各組中選擇一個組,同樣地,通過從屬于所選擇的組的下位各組中選擇一個組,來確定作為輸入對象的漢字所屬的字形小組。
例如,在將這些字形小組分類為大約1000個左右以使使用頻率高的漢字分散到不同的組,將這些字形小組編入大約100個左右的中組中,將這些字形中組編入大約10個左右的字形大組中的場合,對大約10個左右的數字鍵等的輸入鍵進行3次擊鍵就可能確定一個字形小組。因此,就可以在具備10個左右的鍵的各種信息設備上進行中文字形輸入。這種信息設備例如,可以是便攜式電話機,也可以是PDA。
根據字形小組進行分類的漢字,可以是簡體字,也可以是繁體字。另外,此處的漢字也可以是在日本、韓國或其他國家及地區使用的漢字。
附圖的簡要說明
圖1為示出根據本發明的一實施方式的漢字分類的說明圖。
圖2為模式地示出本發明的一實施方式的中文字形輸入的構成的方框圖。
圖3為示出觸摸屏式的便攜式電話機的外觀的模式圖。
圖4為示出中文輸入模式(大分類選擇)的第2顯示單元的顯示例的模式圖。
圖5為示出中文輸入程序的輸入模塊的構成的模式圖。
圖6為示出大分類表的模式圖。
圖7為示出中分類表的模式圖。
圖8為示出進行中分類選擇時的第2顯示單元的顯示例的模式圖。
圖9為示出小分類表的模式圖。
圖10為示出進行小分類選擇時的第2顯示單元的顯示例的模式圖。
圖11為示出進行小分類選擇時的第2顯示單元的顯示例的模式圖。
圖12為示出進行小分類選擇時的第2顯示單元的顯示例的模式圖。
圖13為示出進行小分類選擇時的第2顯示單元的顯示例的模式圖。
圖14為示出進行小分類選擇時的第2顯示單元的顯示例的模式圖。
圖15為示出進行小分類選擇時的第2顯示單元的顯示例的模式圖。
圖16為示出進行小分類選擇時的第2顯示單元的顯示例的模式圖。
圖17為示出進行小分類選擇時的第2顯示單元的顯示例的模式圖。
圖18為示出進行小分類選擇時的第2顯示單元的顯示例的模式圖。
圖19為示出進行小分類選擇時的第2顯示單元的顯示例的模式圖。
圖20為示出本發明的一實施方式的處理的流程圖。
圖21為示出辭典數據的模式圖。
圖22為示出中文字形輸入的具體示例的模式圖。
圖23為示出通常的便攜式電話機的顯示例的模式圖。
圖24為已有的字形輸入法的說明圖。
具體實施例方式
首先,對根據本發明的字形分類法予以說明。該字形分類法,是根據漢字使用頻率的統計調查結果對其進行分類,將使用頻率高的漢字不集中于一個組內。即,考慮將使用頻率高的漢字,分配到不同的組中。
另外,在該字形分類法中,不采用迄今為止一直采用的“部件”,而代之以采用在學校基礎教育中的“部首”。因為通常使用漢字的人具有關于部首的知識,因此即使對部首不再進行學習,也可以理解這種字形分類法。另外,部首的種類與部件相比要少得多,多半具有固有的意義。因此,易于理解根據字形而被分類的各組的定義及其特征。另外,對不具有關于部首的知識的人來說,與部件的情況相比較,該知識掌握起來也簡單得多。另外,因為所掌握的知識與學校的基礎教育是一致的,所以采用此部首的字形分類法對漢字教育也能起到作用。
對所有的漢字都可確定部首。所以,對應于大約200種部首,可將漢字分類到大約200種組中。如設定為GB2312規定的漢字,則屬于各部首的漢字,少的情況下為數個,多的情況下為數百個。這些部首中,對使用頻率高的漢字數少的部首,是將多個這樣的部首集合在一起組合成為一個字形組。另一方面,對使用頻率高的漢字數多的部首,則根據部首以外的字形信息再進行細分類。另外,漢字中除部首以外的部分稱為“部首外”,此部首外的字形信息用于對漢字進行進一步的細分。
作為此部首外的字形信息,可使用部首外的筆畫及筆順信息。具體而言,部首外信息可以是按照寫字時的筆順的第一筆畫、第二筆畫、第三筆畫等信息。另外,至于利用到第幾個筆畫可根據細分的程度而定。即,在屬于某一部首的使用頻率高的漢字的個數多的場合,要根據多的筆畫信息對這些漢字進行細分。
關于筆畫,在中國,確定有標準化的基本筆畫。此基本筆畫,利用數字1~5表示如下。即,1橫(從左向右的筆跡線),2豎(從上向下的筆跡線),3撇(從右上向左下的筆跡線),4點(從左上向右下的筆跡線),5折(各種折線)。
在本發明的字形分類法中,為了表現筆畫,除了上述的數字1~5之外,還使用表示無筆畫的數字0。另外,希望在字形分類法中利用基本筆畫有助于此基本筆畫的標準的普及及漢字教育。
更具體而言,基本筆畫及筆順,是通過將數字順序排列而表現的。例如,“1”表示第一基本筆畫是橫,“12”表示第一基本筆畫是橫,第二基本筆畫是豎。另外,關于基本筆畫及筆順,不僅可通過這種數字串表示,也可以通過部首及漢字本身表現。即,“十”表示第一基本筆畫為橫,第二基本筆畫為呈十字交叉狀的豎,而“口”表示第一基本筆畫為豎,第二基本筆畫為折以及第三基本筆畫為橫的口字狀的筆跡線。
此外,字形組,也有根據漢字部首的位置信息定義的。例如,部首“山”在“峰”字中位于漢字的左側,在“巖”字中位于漢字的上側,在“岳”字中位于漢字的下側。這些“峰”、“巖”、岳”可分別根據其部首信息表現為“山左”、“山上”及“山下”。這樣,在漢字部首的位置為上側、下側、左側、右側或中側的場合,通過在部首名的緊后方添加“上”、“下”、“左”、“右”或“中”就可以表示出該漢字所屬的字形組的特征。另外,在漢字部首的位置為上、下、左、右或中以外的場合,通過在部首名的緊后方添加“*”,可以表示出該漢字所屬的字形組的特征。例如,“島”字,由于其部首“山”的位置在上、下、左、右或中以外,所以其對應的標為“山*”。此“*”為表示其他的意思的標。
如利用上述標法,“土左33”表示部首“土”位于漢字左側,部首外的第一基本筆畫是撇,第二基本筆畫也是撇的漢字。另外,“土左34”表示部首“土”位于漢字左側,部首外的第一基本筆畫是撇,第二基本筆畫是點的漢字。如果屬于“土左33”的漢字及屬于“土左34”的漢字都形成一個漢字組而漢字太少時,可以將兩者合起來形成一個漢字組。此漢字組可標為“土左33/4”。此處記號“/”表示的意思是“或”。此記號的有效范圍,原則上,是僅標分字符串的該記號前后1個文字。另外,記號“-”是表示范圍的記號,意思是“至”。例如,“土左1-4”表示將“土左1”、“土左2”、“土左3”或“土左4”的漢字匯集到一個漢字組。
于是,在本實施方式中,將使用頻率高的漢字適當分散而分類為約950個漢字組。按照上述標法這些漢字組的每一個都具有唯一的分辨特征。另外,以上述標法表示的漢字組稱為字形小組。
圖1為示出根據本發明的一實施方式的漢字分類的說明圖。如此圖1所示,這950個字形小組編入字形中組及字形大組的層結構以使其可以通過對10個鍵擊鍵3次而確定。即,各字形小組屬于10個(或10個以下)字形中組的某一個,各字形中組屬于10個字形大組的某一個。這樣,就可以根據由字形大組、字形中組及字形小組組成的樹形結構進行分類。
圖2為模式地示出有關本實施方式的便攜式電話機的中文字形輸入的部分的方框圖。圖3為此便攜式電話機的外觀的模式圖。此便攜式電話機備有第1顯示單元11,第2顯示單元12,輸入單元13,模式切換按鈕14以及控制單元20。第1顯示單元11,例如,由液晶顯示器組成,可顯示文字、數字及記號。第2顯示單元12,例如,由液晶顯示器組成,其表面設置有作為透明觸摸屏的輸入單元13。模式切換按鈕14系用于在電話號碼輸入模式(一次擊鍵輸入一個數字)、英文文字輸入模式(兩次擊鍵確定輸入一個文字)及中文輸入模式(三次擊鍵輸入一個漢字字形信息)之間進行切換。
控制單元20與這些第1顯示單元11、第2顯示單元12、輸入單元13及模式切換按鈕14分別相連接。于是,控制單元20可在第1顯示單元11中顯示所要求的文字。并且,第2顯示單元12被分割為4行3位的矩形區域。于是,控制單元20,可在這些矩形區域內分別顯示所希望的數字、記號或字符串。
此外,控制單元20,在輸入單元13被按下的場合,可檢測出輸入單元13的哪一部分被按下了。因此,在使用者通過輸入單元13按下第2顯示單元12的各矩形區域的場合,控制單元20可檢測出對應于哪一矩形區域的部分被按下。所以,各矩形區域可分別作為獨立的按鈕(鍵)使用。
另外,控制單元20具有可存儲數據的字形緩沖器21及指針緩沖器22。字形緩沖器21,在中文輸入模式中,取得輸入單元13的按押歷史,存放有在按下后退鍵時返回到前一步驟的信息。此外,控制單元20,具有圖中未示出的ROM及RAM作為存儲單元,在其中的ROM內存儲有中文字形輸入程序23。此中文字形輸入程序23,具有輸入模塊24及轉換模塊25。
另外,此便攜式電話機,具有圖中未示出的無線接收發送單元及收發話單元,使用者可進行與通常的便攜式電話機同樣的通話。此外,使用者可將包含英文文字及中文的文本數據輸入并將輸入的數據作為電子郵件發送出去。
這些英文文字及中文的輸入分別在英文文字輸入模式及中文輸入模式下完成。另外,使用者通過操作模式切換按鈕14可在英文文字輸入模式和中文輸入模式之間進行切換。于是,控制單元20,在設定為英文文字輸入模式時可接受英文文字輸入,在設定為中文輸入模式時可接受中文輸入。
圖4為示出中文輸入模式中的顯示單元12的顯示例的模式圖。另外,此圖4示出輸入階段設定為后述的大分類選擇時的狀態。利用模式切換按鈕14,在設定為中文輸入模式時,在第2顯示單元12上顯示圖4示出的輸入引導。
圖5為示出中文字形輸入程序23的輸入模塊24的構成的模式圖。此輸入模塊24,包含有分別與大分類選擇24a、中分類選擇24b及小分類選擇24c各輸入階段的處理相對應的代碼段。大分類選擇24a的處理對應第一次擊鍵,中分類選擇24b的處理對應第二次擊鍵,而小分類選擇24c對應第三次擊鍵。
另外,在控制單元20的ROM中,存放有大分類表D、中分類表D0~D9以及小分類表D00~D99。大分類表D,供輸入階段為大分類選擇24a時進行參照,中分類表D0~D9,供輸入階段為中分類選擇24b時進行參照,而小分類表D00~D99,供輸入階段為小分類選擇24c時進行參照。
圖6為示出大分類表D的模式圖。此大分類表D,具有多個記錄。這些記錄具有“按鈕”、“引導”以及“指針”字段。在“指針”字段中,存放有在按下10個按鈕(對應數字1~9、0)時生成的數字代碼。
此大分類表D的各記錄分別對應各字形大組,在“引導”字段中存放有表示對應的字形大組的符號。在“指針”字段中存放有指向中分類表D0~D9的指針。另外,在中分類選擇24b中,只參照各中分類表D0~D9中的一個。即,在大分類選擇24a中選擇的字形大組所對應的記錄的“指針”,指定中分類表D0~D9中的一個。
利用第一次擊鍵,通過選擇大分類表D的一個記錄,完成大分類選擇24a,輸入階段轉移到中分類選擇24b。在此中分類選擇24b中,參照中分類表D0~D9。圖7為示出中分類表D0~D9的模式圖。各中分類表D0~D9每一個都具有多個記錄。這些中分類表D0~D9的各記錄,具有“按鈕”、“引導”以及“指針”字段。在“按鈕”字段中,存放有在按下10個按鈕(對應數字1~9、0)時生成的數字代碼。
此中分類表D0~D9的各記錄分別對應各字形中組,在“引導”字段中存放有表示對應的字形中組的符號。在“指針”字段中存放有指向小分類表D00~D99的指針。另外,在小分類選擇24c中,只參照各小分類表D00~D99中的一個。即,在中分類選擇24b中選擇的字形中組所對應的記錄的“指針”,指定小分類表D00~D99中的一個。
圖8為示出設定輸入階段為中分類選擇24b時顯示單元12的顯示例的模式圖。在前一階段的大分類選擇24a中,如按下圖4示出的任何一個按鈕,在中分類選擇24b中,圖8的(D0)~(D9)中的一個顯示于第2顯示單元12。另外,在圖8中,顯示的是配置為4行3列的多個顯示例,各顯示例分別對應于圖4的4行3列的按鈕。在圖4中,12個按鈕中只有10個為大分類選擇所利用,如按下這10個按鈕中的任何一個,就顯示圖8的顯示例中的對應位置的內容。
利用第二次擊鍵,通過選擇中分類表D0~D9的一個記錄,完成中分類選擇24b,輸入階段轉移到小分類選擇24c。在此小分類選擇24c中,參照小分類表D00~D99。
圖9為示出小分類表D00~D99的模式圖。各小分類表D00~D99每一個都具有多個記錄。這些小分類表D00~D99的各記錄,具有“按鈕”、“引導”以及“字形代碼”字段。在“按鈕”字段中,存放有在按下10個按鈕(對應數字1~9、0)時生成的數字代碼。
此小分類表D00~D99的各記錄分別對應各字形小組,在“引導”字段中存放有表示對應的字形小組的符號。在“字形代碼”字段中存放有單純地賦予對應的字形小組的字形代碼。
圖10至圖19為示出在設定輸入階段為小分類選擇24c時顯示單元12的顯示例的模式圖。在前一階段的中分類選擇24b中,如按下圖8示出的任何一個按鈕,在小分類選擇24c中,圖10至圖19中的各顯示例中的一個顯示于顯示單元12。
另外,在圖10中,顯示的是配置為4行3列的多個顯示例,各顯示例分別對應于圖8的(D1)的4行3列的按鈕。如按下這10個按鈕中的任何一個,就顯示圖10的顯示例中的對應位置的內容。同樣,圖11與圖8的(D2)對應,圖12與圖8的(D3)對應,圖13與圖8的(D4)對應,圖14與圖8的(D5)對應,圖15與圖8的(D6)對應,圖16與圖8的(D7)對應,圖17與圖8的(D8)對應,圖18與圖8的(D9)對應,圖19與圖8的(D0)對應。
利用第三次擊鍵,通過選擇小分類表D00~D99的一個記錄,完成小分類選擇24c,確定作為輸入對象的漢字所屬的字形小組。
下面參照圖20的流程圖,以中文字形輸入程序23的輸入模塊24的處理為中心再予以說明。此流程圖,以使用者操作模式切換按鈕14設定中文輸入模式開始,以設定其他的輸入模式而結束。
另外,控制單元20,在執行此流程圖中,參照指針緩沖器22,可識別在該定時的輸入階段是大分類選擇、中分類選擇及小分類選擇中的哪一個階段。即對于輸入階段,在指針緩沖器22為NULL時判定其為大分類選擇,在指針緩沖器22中存放有D0~D9中的任何一個時判定其為中分類選擇,而在指針緩沖器22中存放有D00~D99中的任何一個時判定其為小分類選擇。
在最初的S1中,控制單元20,將指針緩沖器22設定為NULL,設定輸入階段為大分類選擇。
在S2中,控制單元20參照大分類表D(圖6),在第2顯示單元12中顯示作為候選的各字形大組。于是,顯示單元12,切換為圖4所示的狀態。
在S3中,控制單元20等待使用者的輸入。如檢測出輸入,處理就進入S4。
在S4中,控制單元20判斷使用者的輸入是按下輸入單元13的輸入,還是其他的輸入。另外,其他的輸入包括按下后退鍵、按下轉換模塊25使用的鍵等。在按下輸入單元13的場合,進入S5,在其余場合處理進入S15。
在S5中,控制單元20參照指針緩沖器22,判斷輸入階段是大分類選擇、中分類選擇及小分類選擇中的哪一個。如是大分類選擇,處理就進入S6,如是中分類選擇,處理就進入S9,而如是小分類選擇,處理就進入S12。
在S6中,控制單元20根據使用者在輸入單元13上按下的位置,確定圖4所顯示的各按鈕中的哪一個按鈕被按下。即,控制單元20確定使用者選擇的是大分類表D(圖6)的哪一個記錄。于是,控制單元20,在第1顯示單元11上顯示所確定的記錄的“引導”的字形大組。例如,如“引導”確定的是“121/2”記錄,則在顯示單元11上顯示“121/2”。另外,字形大組的“121/2”指示的是筆畫是以橫、豎、橫(121)的筆順開始的部首,或筆畫以橫、豎、橫(122)的筆順開始的部首的各字形中組。
在S7中,控制單元20通過設置指針緩沖器22,可將輸入階段設置為中分類選擇。具體而言,控制單元20取得在S6中對大分類表D(圖6)確定的記錄的“指針”字段的值,并寫入到指針緩沖器22。例如,“引導”是確定“121/2”記錄的話,則在指針緩沖器22中存放“D1”。
在S8中,控制單元20參照各中分類表D0~D9(圖7)中的指針緩沖器22中存放的值所對應的內容,在第2顯示單元12上顯示作為候選的各字形中組。于是,在顯示單元12上顯示圖8的(D0)~(D9)中的一個。例如,如在指針緩沖器22中存放的是“D1”,則顯示圖8的(D1)。于是,處理返回到S3。
在S9中,因為在S5中判定的輸入階段是中分類選擇,控制單元20根據使用者在輸入單元13上按下的位置,確定如圖8的某一個所示的那樣所顯示的各按鈕中的哪一個按鈕被按下。即,控制單元20確定使用者選擇的是中分類表D0~D9(圖7)的哪一個記錄。于是,控制單元20,在第1顯示單元11上顯示所確定的記錄的“引導”的字形中組來取代顯示于顯示單元11上的字形大組。例如,如“引導”確定的是“土左1-4”記錄,則在顯示單元11上顯示“土左1-4”來代替此前顯示于顯示單元11上的字形大組“121/2”。另外,“土左1-4”指示的是部首是偏旁“土”,部首外的筆畫以1至4開始的各字形小組。
在S10中,控制單元20通過設置指針緩沖器22,可將輸入階段設置為小分類選擇。具體而言,控制單元20,取得在S9中對中分類表D1~D9(圖7)確定的記錄的“指針”字段的值,并寫入到指針緩沖器22。例如,若中分類表D1的“引導”確定的是“土左1-4”記錄,則在指針緩沖器22中存放“D11”。
在S11中,控制單元20參照各小分類表D00~D99(圖9)中的指針緩沖器22中存放的值所對應的內容,在第2顯示單元12上顯示作為候選的各字形小組。于是,在顯示單元12上顯示圖10至圖19的各顯示例中的一個。例如,如在指針緩沖器22中存放的是“D11”,則顯示圖10的(D11)。于是,處理返回到S3。
在S12中,因為在S5中判定的輸入階段是小分類選擇,則控制單元20根據使用者在輸入單元13上按下的位置,確定如圖10至圖19的某一個顯示例所示的那樣所顯示的各按鈕中哪一個按鈕被按下。即,控制單元20確定使用者選擇的是小分類表D00~D99(圖9)的哪一個記錄。所確定的記錄的“字形代碼”就被決定作為使用者輸入的字形小組的字形代碼。
此外,控制單元20,通過將決定的字形小組的字形代碼轉送到轉換模塊25而從此轉換模塊25取得與該字形代碼相對應的漢字。另外,在作為候選的漢字有多個的場合,例如,在轉換模塊25中,作為第一候選登記的漢字。另外,轉換模塊25,也可考慮已經輸入的字形代碼來選擇漢字。于是,控制單元20在第1顯示單元11上顯示從轉換模塊25取得的漢字來代替顯示于顯示單元11上的字形中組。
在S13中,控制單元20通過清除指針緩沖器22,將輸入階段設置為大分類選擇。即,指針緩沖器22被設置為NULL為下一個輸入做好準備。
在S14中,控制單元20參照大分類表D(圖6),在第2顯示單元12上顯示作為候選的各字形大組。于是,顯示單元12被切換為圖4所示的狀態。于是,處理返回到S3。
另一方面,在S15中,控制單元20根據使用者的操作執行相對應的處理。例如,如按下轉換模塊25使用的鍵,則按照對該鍵定義的功能,執行漢字選擇及確定等的處理。于是,處理返回到S3。
如上所述,在本實施方式中,通過3次擊鍵決定字形小組,根據此字形小組的字形代碼,執行漢字轉換。下面再對此漢字轉換予以說明。
此漢字轉換是通過參照預先存儲于存儲單元中的辭典數據而完成的。另外,此漢字轉換也可以以單詞為單位進行。即,也可以對作為構成輸入對象的單詞的所有的漢字,在確定各漢字分別所屬的全部各字形小組之后,根據這些各字形小組的字形代碼順序排列而成的字形代碼組,進行以單詞為單位的轉換。
圖21為示出辭典數據的模式圖。此辭典數據具有與字形代碼組相對應的多個記錄。具體而言,在各記錄的“字形代碼”的字段中存放字形代碼組,在“單詞群”的字段中按照使用頻率存放具有由該字形代碼組規定的特征的全部單詞。于是,轉換模塊25參照此辭典數據,確定與輸入模塊24輸出的字形代碼組相對應的單詞群,并在第1顯示單元11中顯示確定的單詞群中使用頻率最高的單詞。
于是,在顯示的單詞與作為輸入對象的單詞不同的場合,使用者通過按下被定義為轉換用的按鍵,也可以選擇該單詞群中其它的候選。也可以將單詞群中的各單詞的排列進行更新以反映此使用者對各單詞的使用頻率。換言之,單詞群中的各單詞的排列可以是固定的,也可以是可變的。
另外,在上述的“單詞”中也包含在中文文法中通常不看作單詞的“虛詞”。另外,漢字轉換不限于以單詞為單位,也可以以由短語構成的字符串為單位進行轉換。
下面,參照圖22,更具體地對單詞“砂糖”的輸入予以說明。在圖22的各顯示例P01~P07中每一個都模式化地示出兩顯示單元11、12。
圖22的P01是中文輸入模式的初始畫面。在此P01中,在第2顯示單元12上顯示大分類表D的各字形大組。另外,在第1顯示單元11上無任何顯示。“砂糖”的“砂”的部首是偏旁“石”,由于偏旁“石”的筆畫是以13筆順開始,所以屬于字形大組“1*符”。如使用者按下“1*符”選擇字形大組“1*符”,則兩顯示單元11、12切換為P02的狀態。
在P02中,在第1顯示單元11上顯示“1*符”,在第2顯示單元12上顯示中分類表D3的各字形中組。因為在這些各字形中組之中有部首為偏旁“石”的組,如使用者按下示出偏旁“石”的“石”按鈕而選擇字形中組“石”,則兩顯示單元11、12切換為P03狀態。
在P03中,在第1顯示單元11上顯示“石”,在第2顯示單元12上顯示小分類表D31的各字形小組。在此小分類表D31中部首為偏旁“石”的漢字還以其部首外的筆畫的筆順進行分類。因為“砂”的部首外是以筆畫2(豎)開始,如使用者按下“石2/0”按鈕而選擇字形小組“石2/0”,則兩顯示單元11、12切換為P04狀態。
在P04中,在第1顯示單元11上顯示與字形小組“石2/0”的字形代碼314相對應的第一候選漢字“石”。另一方面,在第2顯示單元12上,顯示大分類表D的各字形大組供下面輸入時使用。下一個漢字“糖”的部首是“米”,由于此“米”是以筆畫43的筆順開始而屬于字形大組“41-43言”。如使用者按下“41-43言”按鈕而選擇字形大組“41-43言”,則兩顯示單元11、12切換為P05狀態。
在P05中,在第1顯示單元11上顯示與輸入完畢的字形小組“石2/0”相對應的漢字“石”,并且,顯示新選擇的字形大組“41-43言”。另一方面,在第2顯示單元12上,顯示中分類表D8的各字形中組。因為其中部首“米”包含在字形中組“羊米”中,如使用者按下“羊米”按鈕而選擇字形中組“羊米”,則兩顯示單元11、12切換為P06狀態。
在P06中,在第1顯示單元11上顯示漢字“石”及字形中組“羊米”,在第2顯示單元12上,顯示小分類表D89的各字形小組。“糖”字,由于其部首外是以筆畫4開始而屬于字形小組“米4”。如使用者按下“米4”按鈕而選擇字形小組“米4”,則兩顯示單元11、12切換為P07狀態。
在P07中,在第1顯示單元11上顯示“砂糖”。這是因為接著在P06中顯示的“石”決定了字形小組“米4”,而轉換模塊25,考慮到先輸入的字形小組“石2/0”的字形代碼314和后輸入的字形小組“米4”的字形代碼898兩方面進行再轉換而得到它。即,顯示與字形代碼組“314898”相對應的第一候選單詞“砂糖”。另一方面,在第2顯示單元12上,顯示大分類表D的各字形大組供下面輸入時使用。
示于上述圖2及圖3的電話機是觸摸屏式便攜式電話機,但本發明也可應用于通常的便攜式電話機。圖23為示出通常的便攜式電話機的外觀的模式圖。此便攜式電話機只具有一個液晶顯示屏31。在此場合,顯示輸入結果的第1顯示單元11及顯示候選按鈕的第2顯示單元12的顯示內容,每一個都可以顯示于液晶顯示屏31的畫面內。使用者可以一邊觀看液晶顯示屏31上與顯示單元12相對應的顯示,一邊通過按下輸入單元13的數字鍵,與上述同樣地進行中文輸入。
如根據上述的本實施方式中的中文輸入程序,通過對10個左右的有限的鍵進行3次擊鍵就可以決定字形小組,另外,對各字形小組進行的分類使得使用頻率高的漢字不集中。因此,通過3次擊鍵就可以高效率地收斂得出候選漢字。
使用根據以上述字形分類法分類的字形小組生成的試驗用辭典,對轉換效率進行了驗證。此試驗用辭典中的單詞群中的各單詞按使用頻率的排列是固定的,它是不包含有關詞性和語法等屬性信息的最基本的辭典,在將包含1068萬字的一年期間的人民日報數據轉換為各字形小組的第一候選的場合的正確率達87.8%。此外,如利用具有學習功能并且增加詞性和語法等屬性信息的單詞辭典,對單詞的前后連接關系進行分析,則正確率還可以提高。因而可以實現高轉換精度及高效率的中文輸入。
另外,根據本實施方式的字形分類法,可利用該漢字所屬的字形小組指定所有的漢字。所以,使用者沒有必要記憶在利用已有的部件進行中文輸入時所必需的各部件的組合規則。此外,本實施方式的中文輸入程序是按照分類的層結構對使用者進行引導而輸入。所以,可實現易于使用的中文輸入。
根據如上所述構成的本發明,通過對10個左右有限的鍵進行有限次數的擊鍵就可以決定字形小組。即,可以高效率地收斂得出作為轉換候選的漢字。
權利要求
1.一種中文字形輸入裝置,包括,具有可與漢字的字形特征相對應的多個按鈕的輸入單元及根據對此輸入單元進行的操作輸入中文的控制單元,其特征在于,上述控制單元執行如下的處理過程,即基本選擇過程和詳細選擇過程,其中基本選擇過程根據通過將作為輸入對象而設想的全部漢字按照其字形特征分類為多個字形小組,并將這些字形小組編入上位組而形成的多層的層結構,從此層結構的上位各組中選擇一個組,詳細選擇過程根據上述層結構,從屬于由上述基本選擇步驟所選擇的組的下位各組中選擇一個組,來確定作為輸入對象的漢字所屬的字形小組。
2.一種中文字形輸入裝置,包括具有可與漢字的字形特征對應的多個按鈕的輸入單元及根據對此輸入單元進行的操作輸入中文的控制單元,其特征在于,上述控制單元執行如下的處理過程,即,第1提示過程,用于根據通過將作為輸入對象而設想的全部漢字按照其字形特征分類為多個字形小組,并將這些字形小組編入多個字形中組,并將這些字形中組分別編入多個字形大組而形成的層結構,提示上述各字形大組,第1確定過程,用于在上述第1提示過程中提示的各字形大組中,根據使用者對上述輸入單元的操作確定一個字形大組,第2提示過程,用于提示屬于在上述第1確定過程中確定的字形大組的各字形中組,第2確定過程,用于在上述第2提示過程中提示的各字形中組中,根據使用者對上述輸入單元的操作確定一個字形中組,第3提示過程,用于提示屬于在上述第2確定過程中確定的字形中組的各字形小組,第3確定過程,用于在上述第3提示過程中提示的各字形小組中,根據使用者對上述輸入單元的操作確定作為輸入對象的漢字所屬的字形小組。
3.如權利要求2所述的中文字形輸入裝置,其特征在于上述輸入單元的按鈕的個數為與數字鍵個數相同的有限的個數,上述字形大組被分類為該有限的個數,從而可通過對上述輸入單元一次擊鍵而確定,屬于上述各字形大組的各字形中組被分類為上述有限的個數,屬于上述各字形中組的各字形小組被分類為上述有限的個數。
4.如權利要求2所述的中文字形輸入裝置,其特征在于,上述第1提示過程通過顯示代表屬于該字形大組的各字形中組的字形特征的引導來提示上述各字形大組,上述第2提示過程通過顯示代表屬于該字形中組的各字形小組的字形特征的引導來提示上述各字形中組,上述第3提示過程通過顯示代表屬于該字形小組的各漢字的字形特征的引導來提示上述各字形小組。
5.如權利要求2所述的中文字形輸入裝置,其特征在于,使用漢字部首進行上述字形小組的分類。
6.如權利要求2所述的中文字形輸入裝置,其特征在于,使用漢字的筆畫及筆順進行上述字形小組的分類。
7.如權利要求5或6所述的中文字形輸入裝置,其特征在于,使用漢字部首以外的部分的筆畫及筆順進行上述字形小組的分類。
8.如權利要求1或2所述的中文字形輸入裝置,其特征在于,上述控制單元還執行轉換過程,用于在對于輸入對象為一個以上的漢字,確定了與該漢字分別對應的一個以上的字形小組的場合,通過參照將一個以上的字形小組和漢字的字符串對應起來的辭典數據,將與確定的一個以上的字形小組相對應的漢字字符串確定為輸入對象字符串。
9.一種中文字形輸入方法,用于根據對具有與漢字的字形特征對應的多個按鈕的輸入單元進行操作而輸入漢字,其特征在于該方法包括步驟,基本選擇步驟,用于根據通過將作為輸入對象而設想的全部漢字按照其字形特征分類為多個字形小組,并通過將這些字形小組編入上位組而形成的多層的層結構,從此層結構的上位各組中選擇一個組,和詳細選擇步驟,用于根據上述層結構,從屬于由上述基本選擇步驟所選擇的組的下位各組中選擇一個組,來確定作為輸入對象的漢字所屬的字形小組。
10.一種中文字形輸入方法,用于根據對具有與漢字的字形特征對應的多個按鈕的輸入單元進行操作而輸入漢字,其特征在于包括如下步驟,第1提示步驟,用于根據通過將作為輸入對象而設想的全部漢字按照其字形特征分類為多個字形小組,通過將這些字形小組編入多個字形中組,并將這些字形中組分別編入多個字形大組而形成的層結構,提示上述各字形大組,第1確定步驟,用于在上述第1提示步驟中提示的各字形大組中,根據使用者對上述輸入單元的操作確定一個字形大組,第2提示步驟,用于提示屬于在上述第1確定步驟中確定的字形大組的各字形中組,第2確定步驟,用于在上述第2提示步驟中提示的各字形中組中,根據使用者對上述輸入單元的操作確定一個字形中組,第3提示步驟,用于提示屬于在上述第2確定步驟中確定的字形中組的各字形小組,第3確定步驟,用于在上述第3提示步驟中提示的各字形小組中,根據使用者對上述輸入單元的操作確定作為輸入對象的漢字所屬的字形小組。
全文摘要
本發明提供一種中文字形輸入裝置及中文字形輸入法。其中,所有的漢字分屬于不考慮部件而考慮部首而被分類的字形小組。各字形小組被編入更上位的字形中組,各字形中組被編入更上位的字形大組。按照此字形分類的層結構引導輸入。即,首先提示各字形大組,通過第一次擊鍵選擇其中的一個。接著,提示各字形中組,通過第二次擊鍵選擇其中的一個。然后,提示各字形小組,通過第三次擊鍵選擇其中的一個,確定輸入對象漢字所屬的字形小組。這樣,根據對數字鍵等的三次擊鍵就可以高效率地收斂得出候選漢字。
文檔編號H03M11/04GK1434365SQ0214075
公開日2003年8月6日 申請日期2002年7月16日 優先權日2002年1月21日
發明者菅野芩 申請人:富士通株式會社