專利名稱::用于生成亞洲語字符的識別體系結構的制作方法用于生成亞洲語字符的識別體系結構背景用于英文的語音識別(SR)引擎需要拼寫向導,主要是因為引擎詞典中不能夠包括所有或基本上所有合適的名詞,尤其是名字。另一方面,中文字符集可被認為是閉合的,因為所有字符都包括在詞典中。不必考慮或擔憂詞匯外的字符。然而,中文SR引擎的主要問題是跨多個不同字符的同音字共享。有大約47,000個有效的中文字符,但中文中只有大約1600個不同但固定的音節。這意味著,如果這些音節跨不同的字符平均分布,每一音節可對應于大約23-31個不同的字符,這些字符中的許多都表示不同的事物。固定音節是與有效中文字符相關聯的音節集合。例如,音節"chu"對應于像"出初處……"(其拼音是/chuh/)等字符,但不存在對應于任何有效字符的"chiu"。因為固定音節的有限數量,所以存在大量的共享同一發音的字符。以下是共享同一發音/lih/的54個字符的一個示例;并且/lih/的列表仍然不全面力利立麗例莉歷俐勵厲曆栗笠粒蒞隸儷吏壢另慄戾櫪瀝琍璣痢癘^荔螗釙靂螗釙靈礪鬲鵜麗儷凓勵歷厲麻歴嚦琍蜊耍悧驚撬……因此,在引擎未能正確識別一個詞時,用戶可以嘗試從備選列表中糾正它,或嘗試重復說出所需的詞以供識別,但這由于以下問題而不成功。第一,如果聲學模型(AM)未正確處理語音音頻或AM對所需的詞具有比其它詞更低的相關性分數,而其它詞具有更高的語言模型(LM)分數,則不管用戶說出該詞多少次,輸出可能都不是來自備選列表的正確的詞。第二,假定發聲的音頻被AM正確地處理,但如果所需字符在超過備選項的數量的列表項中并且未被呈現給用戶,則用戶將不能在不鍵入的情況下獲得該詞。這可能發生在中文中,尤其是在字符還是數字或數的同音4字時,此時SR引擎還顯示數的不同格式的ITN(逆文本標準化,如將"twelve"標準化成"12")結果。第三,即使中文SR引擎不考慮詞匯外字符,但用戶可以通過不同的字符的組合來創造新詞。除新詞之外,各詞之間沒有空間來標記詞邊界。為確定詞邊界,亞洲語言(至少與簡體中文(CHS)、繁體中文(CHT)、和日文(JPN)相關)需要在引擎或IME(輸入方法編輯器)進程中進行斷詞。因此,在用戶向中文SR引擎口述諸如人名(該人名很可能是未知的詞)等正確的名詞時,SR正確地處理該名字的可能性很低,除非該名字很常見并且在訓練數據中出現過。即使AM和LM完美地工作,用戶仍然可能接收到與所期望的輸出"劉莉"不同的具有諸如"劉麗"等字符的輸出名字(焦點在于第二字符,其中第一字符是姓且第二字符是名),這是由于上述的同音字問題,即"麗"和"莉"是同音字但用作不同個人的名。對于中文對話期間的人們的感知而言也是如此,在對話中第一個人告訴第二個人他的名字,而第二個人將需要問第一個人該名字中確切地使用的是哪些字符。最后,當用戶在SR過程期間嘗試糾正詞中的字符時,通過選擇字符和/或重復說出字符以確定正確的字符是否將最終出現在備選列表上來獲得正確的輸出是可能的。通常,在字符不具有許多同音字時,獲得供替換的正確的詞是可能的。然而,這類糾正將在單獨的字符的基礎上完成。在SR中將不采取這一糾正,因為SR按詞而非按單個字符來學習。因此,如果用戶想要在文檔中多次使用這一字符,用戶將需要在每次講出該字符時都重復糾正過程。因此,常規識別過程是麻煩而且低效的。概述以下提出了簡化概述以便提供對在此描述的某些新穎實施例的基本理解。本概述不是詳盡的概覽,并且它不旨在標識關鍵/重要的元素,也不旨在描繪其范圍。其唯一的目的是以簡化的形式來介紹一些概念,作為稍后提出的更為詳細的描述的序言。所公開的體系結構提供用于亞洲語語音識別算法的拼寫模式。這方便確定新詞的邊界以及將新詞添加到詞典中。因此,與其中詞糾正發生多次的常規系統不同,基于該拼寫模式,詞糾正只發生一次。具體地,在中文字符的上下文中,拼寫模式方便在語音識別引擎返回不正確的口述字符時輸入中文字符。使用該拼寫模式來糾正的詞是作為一個單元來糾正的并且被當作詞。這是因為與例如其中詞邊界很容易識別的英文單詞不同,亞洲語言中的邊界不清楚。因此,通過經歷拼寫模式來輸入中文字符(在該示例中)減少或消除了后續識別處理中對該詞的誤識別。所公開的拼寫模式適用于其中字符具有對應的固定發聲的簡體中文、繁體中文、和/或諸如日文等其它亞洲語言。為實現上述及相關目的,本文結合下面的描述和附圖描述某些說明性方面。然而,這些方面僅指示了可利用此處公開的原理的各種方法中的少數幾種,且旨在包括所有這些方面及其等效方面。結合附圖閱讀下面的詳細描述,則其它優點和新穎特征將變得顯而易見。附圖簡述圖1示出計算機實現的轉換系統。圖2示出基于在拼寫/糾正過程期間所學習的新詞來方便詞典共享的系統。圖3示出采用方便自動化一個或多個功能的推斷組件的系統。圖4示出可由此處公開的拼寫/糾正體系結構采用的一個或多個方法。圖5示出采用詞發音作為字符規范方法的系統。圖6示出在用戶期望亞洲語字符/詞作為輸出時所呈現的拼寫對話框面板的屏幕截圖。圖7示出在用戶期望英文單詞作為輸出時所呈現的拼寫對話框面板的屏幕截圖。圖8示出所呈現的用于同音字命令處理的拼寫對話框面板的屏幕截圖。圖9示出響應于用于同音字糾正的語音激活命令來呈現的拼寫模式對話框面板的屏幕截圖。圖10示出其中響應于所發聲的索引選擇來糾正誤識別的詞并清除列表框的面板。圖11示出所呈現的用于語音發音的拼寫對話框面板的屏幕截圖。圖12示出所呈現的用于糾正所說出的發音的拼寫對話框面板的屏幕截圖。圖13示出基于對所說出的發音的糾正來呈現的具有修訂的同音字列表框的拼寫對話框面板的屏幕截圖。圖14示出在糾正誤識別的詞時,并且光標移動到下一字符以對所說出的發音進行處理以使用戶可以在需要時繼續對該下一字符進行糾正時所呈現的拼寫對話框面板的屏幕截圖。圖15示出根據第二方法將正面、中性、和負面意義用于字符加權的系統。圖16示出根據第三方法按所需字符的子分量的語音輸入來采用詞分解的系統。圖17示出所呈現的用于通過平假名的語音/鍵入輸入來進行日語識別和處理以獲得日文漢字的拼寫對話框面板的屏幕截圖。圖18示出所呈現的用于與獲得日文羅馬字相關的日語識別和處理的拼寫對話框面板的屏幕截圖。圖19示出根據所公開的體系結構的識別語音的方法。圖20示出使用拼寫向導來糾正識別結果的方法。圖21示出將語音發音轉換成字符的方法。圖22示出在亞洲語和英語中使用拆分命令來進行糾正處理的方法。圖23示出在亞洲語拼寫向導中使用同音字命令的方法。圖24示出將加權值應用于詞意義的方法。圖25示出共享經更新的詞典的方法。圖26示出將字符分解用于拼寫糾正的方法。圖27A和27B示出基于用于拼寫糾正的多個方法來進行糾正處理的方法。圖28示出可用于執行根據所公開的體系結構的糾正處理的計算系統7的框圖。圖29示出了用于根據所公開的體系結構的糾正處理的示例性計算環境的示意性框圖。詳細描述此處所公開的是提供算法、數據、以及至少一個用戶界面(UI)的體系結構,該用戶界面包括用于亞洲語語音識別和獲得新詞/字符或對誤識別的字符的糾正的拼寫模式。現在參考附圖,附圖中相同的附圖標記用于指代在全文中相同的元素。在以下描述中,為解釋起見,闡述了眾多具體細節以提供對本發明的全面理解。然而,顯然,這些新穎實施例可以在沒有這些具體細節的情況下實現。在其它情況下,以框圖形式示出了公知的結構和設備以便于描述它們。首先參考附圖,圖1示出了計算機實現的轉換系統100。系統100包括接收亞洲語聲音或語音輸入并對該輸入執行識別處理的語音識別組件102。在某些情況下,識別過程會輸出不正確的亞洲語字符和/或詞。因此,系統100還包括糾正組件104,該組件用于基于語音識別組件所輸出的不正確的亞洲語字符/詞和/或新亞洲語字符/詞來生成正確的字符和/或詞。系統IOO將至少在用于用戶交互的UI、用于檢索英語和亞洲語詞并還用于提供和執行不同的命令來啟動各UI面板并與其進行交互的拆分拼寫面板UI、以及用于捕捉新詞并確定詞邊界的用戶拼寫模式的上下文中更詳細地描述。系統100還在用戶使用發音通過語音輸入獲得字符、包含所需字符的詞、所需字符的子分量、通過同音字列表來選擇時進行幫助,并隨后從經轉換的候選中選擇所需字符。提供了包含存儲語音系統中的音素的語音距離信息的數據的數據存儲,并且數據被存儲在混淆矩陣表中。該信息幫助用戶快速并容易地糾正誤識別的發音,從而減少系統犯同樣錯誤的可能性。提供了包含具有每一字符的使用頻率以及字符可以存在于其中的諸如人名、公司名等可能類別的數據的數據存儲。因此,在檢測到關鍵詞時,將觸發對應的類別并且在列表中會將用于該類別的字符推得更高。讀取詞8中的關鍵字符并重新調整字符列表,以使所需字符在列表頂部出現,因為其余的糾正也是此處公開的方法的一部分。系統100通過使用包含所需字符的詞來進行語音輸入以方便獲得字符,并還通過檢查字符的子分量來以方便獲得字符。系統100的UI處理同音字命令,以獲得正確的詞并避免重新輸入發音。用戶還可以共享新詞的詞典,并發送回新詞以供評估和更新不同的詞典。此外,其它亞洲語語音輸入(例如日文)可以在多個(例如四個)不同的書寫系統之間切換。圖2示出基于在糾正過程期間所學習的新詞來方便詞典共享的系統200。系統200包括圖1的語音識別組件102和拼寫/糾正組件104。然而,糾正組件104的輸出饋送回識別組件102以更新內部詞典122。然而,注意,詞典202可以在識別組件102的外部。如在常規識別系統中一樣,系統200還可包括語言模型(LM)204和聲學模型(AM)206。LM204(或語法文件)包含詞序列的概率集合。AM206基于語音數據及其轉錄來以音素的形式表征詞的聲學行為。AM206基于從語音音頻信號生成的特征向量來對語言的聲音單元進行建模。識別組件102處理從LM204和AM206接收到的輸入以提供最佳輸出。然而,如所示的,在諸如亞洲語言識別處理等復雜應用程序中,提供正確的結果并隨后解決不正確的結果會是一個挑戰。因此,在得到經糾正的結果時,更新(或改進)詞典202是有好處的。這些更新在這樣的復雜應用程序中可能是很重要的。因此,在適當的安全檢査就位的情況下,共享組件208方便與其它優化或系統和/或詞典供應商來共享諸如詞典202等信息,以分發新詞典語料庫。這將在此處更詳細地描述。圖3示出采用方便自動化一個或多個功能的推斷組件302的系統300。例如,不僅可以基于用戶(例如用戶簡檔)還可以基于組件302所學習和推理的語音和糾正活動來做出推斷。考慮用戶對英文遠遠比中文更精通,則推斷組件302隨時間學習到用戶通常有與特定中文字符相關聯的語音識別錯誤。因此,推斷組件302可以在預測到用戶犯同樣錯誤的情況下,通過呈現拼寫模式界面對發音界面來自動化UI的功能以更有效地幫助該用戶。在另一示例中,可能學習到,比起所提供的任何其它模式,用戶通常偏好使用拼寫模式。因此,在遇到選擇一種方法來進行糾正時,組件302將自動地呈現拼寫模式UI。這些只是可以基于學習和推理所作出的許多推斷中的幾個示例,學習和推理不僅對于用戶交互,還對于往往基于特定輸入準則而重復發生的系統進程。推斷組件302可以采用機器學習和推理(MLR)例如來監控、分析、計算、以及使用所學習和推理的結果。本發明的體系結構(例如,結合選擇)可采用各種基于MLR的方案來實現其各個方面。例如,用于確定選擇和呈現哪個字符或詞中的哪個字符的過程可以經由自動分類器系統和進程來促進。分類器是將輸入屬性向量x=(xl,x2,x3,x4,xn)映射到類標簽c/a^(x)的函數。分類器也可以輸出輸入屬于一個類的置信度,即f(x)=cowyWe"ce(c/a^W)。這樣的分類可采用概率性的和/或其它統計性的分析(例如,分解成分析效用和成本以最大化對一人或多人的期望值)來預測或推斷用戶期望自動執行的動作。如此處所使用的,術語"推斷"和"推論"通常是指從經由事件和/或數據捕捉的一組觀察結果來推理或推斷系統、環境和/或用戶的狀態的過程。例如,推斷可用于標識特定的上下文或動作,或可生成狀態的概率分布。推斷可以是概率性的,即,推斷是基于對數據和事件的考慮的對所關注狀態的概率分布的計算。推斷也可以指用于從一組事件和/或數據組成更高級事件的技術。這類推斷導致從一組觀察到的事件和/或存儲的事件數據中構造新的事件或動作,而無論事件是否在相鄰時間上相關,也無論事件和數據是來自一個還是若干個事件和數據源。支持向量機(SVM)是可采用的分類器的一個示例。SVM通過在可能的輸入空間中找出以最優方式將觸發輸入事件和非觸發事件分離開來的超曲面來操作。直觀上,這使得分類對于接近但不等同于訓練數據的測試數據正確。可采用其它定向和非定向模型分類方法,包括,例如,各種形式的統計回歸、樸素貝葉斯、貝葉斯網絡、決策樹、神經網絡、模糊邏輯模型以及表示不同獨立性模式的其它統計分類模型。如此處所使用的分類也包括用于分派排名和/或優先級的方法。如從本說明書中可以容易地理解的,本發明的體系結構可以使用顯式訓練(例如,經由一般訓練數據)以及隱式訓練(例如,經由觀察用戶行為、接收外來信息)的分類器。例如,SVM經由分類器構造器和特征選擇模塊內的學習或訓練階段來配置。因此,可采用分類器來根據預定準則自動學習和執行多個功能。推斷組件302可以與識別組件102、糾正組件104、詞典202、LM204(未示出連接)、AM206和共享組件208進行接口,以例如監控用戶和系統進程并獲得數據。在系統300中使用推斷組件302只是采用和連接推斷的多個不同方式的一個示例。換言之,可以用后面的附圖中的系統組件的更詳細說明來采用推斷組件302。圖4示出可由此處公開的糾正體系結構采用的一個或多個方法400。例如,拼寫/糾正組件104可包括詞發音方法402、詞中的字符方法404、以及字符分解方法406。這些方法400提供至少三種指定字符的方式。可以指定字符的方式包括給出關于如何用本地音標來發出該詞的音的信息(例如發音方法402)。詞中的字符方法404包括給出關于如何通過給出其中存在該字符的詞來寫出該字符的信息。例如,如果用戶選擇指定"薰",則用戶可以說"薰陶的薰"。這類似于在英文中使用"a,asingEEk"。給出關于如何組成(或分解)字符的信息由分解方法406提供。換言之,用戶可以說出字符的組成部分。例如,如果用戶想要指定"李",則用戶可以說"木子;李"。所有三種方法(402、404和406)都在此詳細描述。第一種方法(發音方法402)可以使用拼寫向導來提供,而方法404和406可以直接應用而不用向導。然而,可以理解,所有方法(402、404和406)都可以使用向導來實現,以使用戶可以選擇這些方法中的一個來進行詞糾正。還可以理解,對術語"向導"的使用決不旨在被解釋為限制。換言之,可以呈現集中于總體過程的一小部分的一系列對話框,而非通常可被認為是引導用戶提供一個過程的向導。在用戶嘗試以中文字符或詞鍵入時,使用發音方法402。在某些亞洲11國家中,使用亞洲語字符的發音方法是常見的。然而,可以使用除繁體中文OS中的發音以外的其它輸入方法。給定發音所提供的方便性,許多用戶在使用鍵盤鍵入字符時會使用發音(注音)。情況對于使用簡體中文OS的中國大陸用戶而言更是這樣,其中使用拼音(本地發音系統)來用鍵盤鍵入字符。臺灣用戶(使用繁體中文)將鍵入"丁U^"和用于第一音調的空格鍵,來得到使用該發音的詞列表,例如"勳薰勛……",并選擇這些詞中的一個,例如第二個詞"薰"。相反,中國大陸用戶可以鍵入"xun"并接收詞列表,諸如"勳薰勛……",并選擇這些詞中的一個,例如第二個詞"薰"。然而,鍵入花費時間并且可能易于出錯。對臺灣用戶而言這尤其消耗時間和勞動,因為繁體中文的語音系統與中國大陸中文中使用的26個字母集合(用于拼音)不同。例如,音標看起來像""夕n匸",并且第一個符號"""可被認為是/b/聲,但被給出了鍵1(數字)禾卩!(感嘆號),而非對于字母b的鍵盤鍵。因此用戶需要學習每一符號位于鍵盤上的哪里。另一方面,中國大陸使用的拼音有26個英文字母組成,如果用戶熟悉26個英文字母在鍵盤上的位置,則不需要學習另一種鍵盤設置。拼寫向導通過允許用戶通過語音而非鍵入獲得中文詞來克服這一限制。這在用戶不熟悉音標和/或26個英文字母在鍵盤上的位置的情況下、或在用戶不頻繁與符號交互以快速選擇和輸入符號的情況下尤其有用。第二(即詞中的字符)方法404可比詞發音方法402更復雜,因為所選的包含該字符的詞可以是任何詞,甚至來自名人的名字。所公開的體系結構將包含中文語言中所使用的所有字符,但可以不包含所有詞,尤其是尚未是訓練數據的一部分的最新近名人的名字。用戶可以選擇包含所需字符的詞,但該字符可以不是該詞中的第一個字符。該字符可以出現在該詞的中間或結尾。例如,用戶可以說"薰陶的陶"來得到最后(或粗體)字符"陶"。為獲得良好的識別準確度,對使用什么類型的詞來指定字符和或者對哪些詞分配較高加權或者特別訓練哪些詞具有良好的感覺是合乎需要的。正確地收集和安排數據幫助提升SR準確度。另外,SR的AM越好,來自該方法的結果越好。一旦實現了這些,則采用這一方法404來糾正誤識別的中文詞可以比第一方法402更容易,因為獲得正確的字符的步驟的數量少于提供發音。第三方法406可被用于較少量的一些容易分解的詞。換言之,沒有大量的可被容易地分解并被廣泛使用的詞。因此,可以在語法(或LM)中列出可分解詞以支持這一方法406。圖5示出采用詞發音作為字符規范方法的系統500。如上所示,可以將拼寫向導用于發音方法。為支持用戶提供發音和選擇正確的字符,向導采用在字符和發音之間進行映射的一個或多個數據文件。另外,提供同音詞的優化列表以使用戶可以快速獲得所需字符。以下描述供在語音系統和字符之間進行轉換的數據文件。在該第一示例中,語音系統是以CHS/CHT描述的,連同示例性數據文件的概覽。如上所述,CHS使用拼音,而拼音也使用英文的26個字母,但具有可任選聲調信息。相反,CHT使用注音,注音是象形符號而非正規中文。CHT的注音類似于英文的國際音標(IPA)。例如,對于字符"田",以下給出CHS和CHT的語音表示CHS:tianCHT:亡一弓'圖5的識別組件102示出多個亞洲語言引擎502(示為亞洲語言iSR引擎……亞洲語言wSR引擎,其中N是正整數)。引擎502中的第一引擎504使用詞發音方法402,詞發音方法402又使用三個數據文件506來提供數據。每一語言引擎502將三個數據文件506用于將發音轉換成字符的過程。第一數據文件508將詞作為索引并將每一個詞的相關信息作為值來存儲,該值包括發音、聲調、使用頻率、和/或可能的類別。第二數據文件510將發音作為索引并將具有該發音的所有詞作為值,并以基于使用頻率的次序來存儲。第三數據文件512用于存儲音素之間的混淆矩陣信息,以供用戶高效地糾正誤識別的音素。13如所示的,第一數據文件508存儲字符的信息和字符發音、聲調、頻率、和/或可能的類別。例如,CHS:好hao—3—1—z;hao—4—1—z田tian21nCHT:好廠幺_3—1—z;廠幺—4_1—z田太一弓21n對于不同詞中的具有不同的發音的字符,如"好"(該字符在"很好"中用作第三聲;但在"喜好"中用作第四聲)),在一個行中記錄可能的發音,各元素由分號(;)分開。根據最近信息,有大約47035個有效的中文字符,大量中文字符很少使用并且是整個歷史積累下來的。中國有文化的人現行只使用大約2000個字符。因此,落入該2000個現行使用的字符集中的字符可被首先顯示。為知道現行使用的集合中的字符是否顯示在呈現給用戶的列表的頂部或頂部附近,現行使用的字符被標記為"1",其它的被標記為"2"。出現在諸如人名等特定類別中的字符可被給出人名的類別碼,例如"n"。系統500還可包括用于跟蹤存儲在第二數據文件510中的字符和/或詞的使用頻率的頻率組件514,。該第二數據文件510存儲發音,并以出現在不同詞中的頻率以及該詞或字符的頻率的次序來存儲與該發音相關聯的字符。第一數據文件508存儲詞是否落入2000個現行使用的字符。該第二數據文件510根據總體活動/不活動頻率和根據與其它同音字符相關的使用頻率中的一個或兩者來對字符進行排序。頻率信息可以從現有訓練數據中獲得。第二數據文件510中的次序可以基于對用戶選擇的學習和推理來調整。如果第一數據文件508中可以指定更多具體頻率信息,則第二數據文件510可以從第一數據文件508中生成。然而,第二數據文件510應在用戶簡檔文件夾中生成并保存,以使第二文件510可被用來在學習了用戶選擇之后保存經調整的次序。以下列表指示發音和詞頻率。下劃線的詞是很少使用的詞。CHShao—1蒿侔嚆薅迭hao—2豪毫蠔號嚎貉壕濠蚵鶴MMhao—3好郝怒hao—4號浩耗皓鎬好灝顥涸昊犒皓tianl天添佛夭......tian2田填恬甜汩昀外舌瓚……tian—3舔忝靦殄腆映係碘……tian4瑱掭站CHT廠幺—1蒿偉嚆薅迭廠幺_2豪毫蠔號嚎貉壕濠蚵鶴MM……廠幺_3好郝怒廠幺—4號浩耗皓鎬好灝顥涸MJffi:……亡一弓—i天添佛夷……亡一巧_2田填恬甜汩昀外舌瓚……*一弓3舔忝靦殄腆喚掭腆……亡一丐4瑱掭站可以提供上下文無關語法(CFG)來存儲有效音節。對于CHS,用戶能夠說出"TIAN"來在CHS語音系統中獲得"tian",并隨后將其轉換成使用該發音的字符列表。CFG包括允許用戶說"TIAN"來在轉換成字15符之前接收"tian"的另一選擇。該方法對雙元音或雙元音加上尾鼻音中的一些進行分組,如以下所給出的,<xmlversion="1.0"encoding:"utf-16"><grammarxml:lang="zh-TW"version="l.0"xmlns="http:〃www.w3.org/2001/06/grammar"xmlns:sapi="http:〃schemas/microsoft.com/Speech/2002/06/SRGSExtensions"root-"Greeting"tag-format="semantics-ms/l.0"><mleid="Greeting"scope="public"〉<ori6-of><item><tokensapi:pron="bo_ho—ha—ha_h">ba</token〉</item><item><tokensapi:pron="bo—ho_ha—heh_h">bai</token〉</item><item><tokensapi:pron二"bo_ho_haa—hng—h">bang</token></item></one-of><one-of><item〉<tokensapi:pron="bii—hi_hgeeh—hi—h">ba</token></item><item><tokensapi:pron二"bii_hi—hgeeh_hi_hgaa—heh—h">bai</token></item><item><tokensapi:pron="bii_hi_hgeeh—hi_hgeel—hnn_hjii_hi—h">bang</token></item></onc-of>對于CHT,在語法中只使用注音中的音素。引擎中所使用的發音也將在語法中提供以增加SR準確度。<xmlversion="1.0"encoding-"utf-16"><grammarxml:lang="zh-TW"version="1.0"xmlns="http:〃www.w3.org/2001/06/grammar"xmlns:sapi="http:〃schemas/microsoft.com/Speech/2002/06/SRGSExtensionsroot="Greeting"tag-format="semantics-ms/l()"><ruleid="Greeting"scope="public"><onc-of><item><tokensapi:pron="bo—ho—ha—ha—h">勺丫</token></item><item><tokensapi:pron="bo一ho—ha—heh—h"〉"17勞</token></item><item><tokensapi:pron="bo—ho—haa一hng—h">勺允</token></item>如果發音被不正確地識別,則向導允許用戶糾正發音。在選擇了要糾正的音素后,向導示出與誤識別的音素相近的音素列表,并且該列表可以根據兩音素之間的距離來排序,該距離取決于例如吐字的位置、吐字的方式、聲帶振動、上下文、和其它本地方言的影響。在臺灣許多人講國語和閩南語。來自閩南語方言的聲音結構以若干方式極大地影響國語語調。大多數人不能區分"生《尸日(巻舌音)"和"卩虧厶(齒齦音)",而一些人不能區分"匸(唇齒摩擦音)"與"廠(軟腭摩擦音)"。對于中國大陸南方某些方言,/n/和/l/是不可區分的,并且還影響其它所學習的語言的成果。對最小可區分音素集合之間的距離給出更短的距離。上下文指的是兩個音素是否出現在同一上下文中。例如,""(/b/)"和"夕(/ph/)"在上下文方面比"27(/b/)"和"匸(/f/)"更近,因為這些音素后面可跟隨同樣的核元音和尾輔音。<table>tableseeoriginaldocumentpage18</column></row><table>基于CHT中所使用的輔音的這些特征的示例性混淆矩陣表在以下給出。下表是通過基于吐字的位置、吐字的方式、聲帶振動、上下文、以及其它本地方言的影響來計算距離獲得的。這一類型的混淆矩陣還可以通過自動地比較具有不同音子的將覆蓋吐字的位置、吐字的方式、聲帶振動的AM來生成。混淆矩陣還可以通過具有不同音子的AM并基于上下文和其它方言的影響來調整以得到最終形式來獲得。可以使用同樣的方法來生成CHT的元音和聲調的矩陣,以及所有其它亞洲語言的輔音和元音。<table>tableseeoriginaldocumentpage18</column></row><table>4143675455436545432門672378956767874632564344324421力1412434432325621443244211673446234力6784667634《142324323421432432廠432321241212321<12123212T321221蟲12124沖122尸14234"P12虧1厶可以向中文和英文拼寫模式提供拆分命令,例如以獲得更好的識別結果。例如,可以對"中文拼字(拼寫)"和"英文拼字"進行拆分。這樣做的原因包括以下各項。在使用英文拼寫時,可以直接向文本返回英文字母;但在使用中文拼寫時,輸出音標并隨后將其轉換成中文。因此,這兩個拼寫模式的過程是不同的。英文字母和中文音標中的一些是同音的。因19此,拆分兩個過程避免了混淆。此外,如果拆分該過程,則所激活的CFG可以更加簡單。另外,識別準確度會更高。拆分這兩個命令使CHS受益最大,因為CHS中的音標也是相同的26個英文字母。如果不執行拆分,則用于轉換成中文字符的時間將是未知的。此外,如果用戶旨在對中文使用拼音,則可不執行對有效語音序列的更嚴格的檢査。以下描述在用戶說出命令時所觸發和呈現的一系列拼寫模式面板(或屏幕截圖)。圖6示出在用戶期望亞洲字符/詞作為輸出時所呈現的拼寫對話框面板600的屏幕截圖。在用戶說出"中文拼字"時,呈現拼寫模式面板600,且其包括指示面板600是中文拼寫(拼字)面板的標題欄602,使用發音來獲得字符或同音字命令來改變字符(注音拼字或諧音換字)604,發音(注音)606,以及各中文對話框選擇器同音字(諧音)(H)選擇器608、確定(確定)(0)選擇器610、和取消(取消)(E)選擇器612。在用戶說出"英文拼字"時,圖7示出在用戶期望英文單詞作為輸出時所呈現的拼寫模式對話框面板700的屏幕截圖。面板700用中文示出"拼寫(拼字)面板"702、"清晰地拼寫單詞"(或吐字清晰)的中文指令(用清晰的聲音拼出文字)704、"再次拼寫"的中文指令(再拼字一次)706、以及用中文標記的一個或多個選擇器確定(確定)選擇器708和取消(取消)選擇器710。面板700還呈現英文字母和/或其它字符(例如@)的經索引和排序的列表712。雖然在該實施例中被示為有某種程度的不同,但面板600和700具有除在一個中出現而不在另一個中出現的特征之外的更相似的外觀以提供更一致的用戶體驗是合乎需要的。圖8-10呈現與使用同音字糾正的過程相關聯的屏幕截圖。圖8示出所呈現的用于同音字命令處理的拼寫對話框面板800的屏幕截圖。用于獲得作為同音字的正確字符的命令被發聲。所顯示/識別的詞作為608中的"諧音(同音字)"來提供。該語音命令界面可被認為比鍵入更高效,因為可以避免對音標的重復鍵入。換言之,有時所發聲的命令被正確地識別,但用戶想要不同的字符。并非提示用戶重復發音,該命令可被處理以輸出同音字列表。使用這一功能,通過語音來糾正提供了超過手動輸入(例如鍵入)的改進用戶體驗。S卩,在用戶通過鍵入手動地輸入發音并從同音字列表中選擇詞時,該詞將作為底下有虛線的文本來呈現。在該模式中,用戶仍然可以改變來自列表的字符。然而,在用戶對詞確信時,用戶可以選擇回車(或"確定")選擇器610以在文本中鎖定該詞,以使輸入系統不再從所分配的LM分數自動調整該詞。因此,一旦在對話框面板800中鎖定了詞,則如果用戶想要再次改變該詞,則必須重試音標。該語音命令界面通過識別"諧音"命令而節省了手動輸入的額外努力。作為第一步驟,用戶通過說"更正1號字"來選擇要糾正的詞。隨后加亮第一字符802。用戶隨后可以說用于同音字的"諧音"或選擇"諧音"("同音字")選擇器608,以獲得原始中文字符的同音字(H)字符。面板800還以中文呈現對話框選擇器同音字選擇器608、確定選擇器610和取消選擇器612。注意,可以對面板800中的任何字符(標記為1、2或3的域中)執行通過同音字命令或提供發音的糾正,其中802是第一字符。然而,候選字符列表將是不同的。來自同音字命令的候選列表將包含音調相同或稍微不同的字符。來自提供發音的候選列表將包含與用戶給出的發音精確匹配的字符。如果用戶將采用發音,則將使第二字符被加亮來呈現圖8的屏幕截圖,而非如圖IO所示的第一字符被加亮。隨后,在用戶提供了發音后,呈現圖11的屏幕截圖。圖9示出響應于用于同音字糾正的語音激活命令來呈現的拼寫模式對話框面板900的屏幕截圖。拼寫向導支持原始字符的發音,以便在列表框902中呈現經索引的同音字符列表。用戶隨后可以通過說出相關聯的索引號,如第一候選的"一"或"一號",或在該情況下點擊字符906來選擇所需字符。作為響應,發音面板900將清除列表框902,用所選字符906替換原始字符802,并且如圖IO的面板1000所示,列表框902已響應于所發聲的索引選擇而被清除。向導隨后將交互移動到第二字符1002(第二域中)以進行類似處理,如以上根據圖8的字符802(第一域中)所述。繼續圖10,所發聲的糾正可以通過提供發音來完成。如果向導尚未移動到并加亮第二字符1002,則用戶通過說出"更正二號字"來通過選擇或導航到要糾正的詞來開始,以加亮第二字符1002。21圖11示出所呈現的用于語音發音的拼寫對話框面板1100的屏幕截圖。接著,用戶說出用于發音的"TL4h",該發音在發音域1102中被呈現給用戶,并且向導再次在列表框902中提供經索引的詞列表。列表框卯2以更頻繁使用的詞在頂部并且較不頻繁使用的詞靠近底部的次序列出候選詞。另外,在系統指示用諸如姓等關鍵詞來糾正第一字符802時,系統將檢測到該關鍵詞并調整對后續字符候選列表的糾正。在這種情況下,在糾正其余字符時,用于名的字符將提升到候選列表902的頂部。如上所述,用戶隨后可以通過說出相關聯的索引號來選擇所需字符,諸如與第二候選相關聯的"二"或"二號"以獲得"薰"。此后,所選候選替換舊字符且發音面板1100將被清除,并且列表框902將從對話框中移除。如果SR不正確地識別了發音,則向導將基于上述混淆矩陣來顯示最接近的音素。圖12示出所呈現的用于糾正所說出的發音的拼寫對話框面板1200的屏幕截圖。用戶可以通過說來表達要糾正的音素以與向導進行交互,例如"更正第一個音"。第一音素1202隨后將被加亮。音素列表框1204隨后將被呈現為具有以音素距離為次序的音素列表。用戶隨后可以說出"〈"(等于拼音中的"qi"),以使第一誤識別的音素1202被正確的音素"〈"替換,如列表框1204中的經索引的"1"。圖13示出基于對所說出的發音的糾正來呈現的具有修訂的同音字列表框902的拼寫對話框面板1300的屏幕截圖。基于改變的音素來糾正同音字符列表框902。接著,用戶通過說出相關聯的號碼來選擇圖14中示出的第一字符1402,如在該情況下是"一"或"一號"。因此,所選候選替換原始字符且發音域1102將被清除,并且列表框902將從對話框中移除。圖14示出在光標移動到下一字符以對所說出的發音進行處理或在圖13的處理完成時所呈現的拼寫對話框面板1400的屏幕截圖。如此處所描述的,名字可能需要拼寫向導,因為每一用戶不會精確知道名字中所使用的字符。因此,提示可以從名字中獲得并提供。例如,在某些情況下,可能只有幾百個類型的姓值得考慮,并且如上所述,已經知道該集合是固定的。因此,在選擇總是詞/字符串的第一字符的姓時,列表框中所顯示的字符候選列表將被調整。例如,對于使用'fan'的名字,該字符可以是凡、繁、煩、藩、犯等。對于大多數字符,用戶將選擇正面或中性意義的名字,在以上前兩個示例中示出。然而,如果訓練數據是從報紙上獲得的(這是大多數當前語言訓練系統的情況),該字符可能與具有很高頻率計數的最后的意義"犯"相關聯。因此,通過在數據文件中提供類別信息,詞的列表可以根據提示來調整。可被考慮的提示包括但不限于個人名字(例如姓)、街道名稱(例如利用路、街、市和縣)、以及公司/組織名稱(例如利用公司和院)。當用戶更熟悉或精通在拼寫模式中用多個字符來選擇詞并且基于有限的字符序列來正確地解析該詞(以尋找詞邊界)時,以上場景更易于由所公開的系統來處理(或識別)。如果用戶只從多個字符的詞中選擇一個字符,則該系統可能丟失該新詞的詞邊界信息。上述第二方法通過包含所需字符的詞的語音輸入來獲得中文字符。圖15示出根據第二方法將正面、中性、和負面意義用于字符加權的系統1500。圖15的識別組件102示出多個亞洲語言引擎502,其中第一引擎504使用詞中的字符方法404,該方法又使用數據文件1502來提供數據。每一語言引擎502都可以使用數據文件1502來基于詞中的字符方法404獲得字符。第一數據文件1504包括正面和中性意義的詞,第二數據文件1506包括負面意義的詞,而第三數據文件1508包括詞典中的不是這兩個數據文件(1504和1506)的一部分的其余詞。根據詞中的字符方法404,和/或除提供發音來獲得字符之外,用戶還可以通過給出包含所需字符的其它詞來獲得字符。類似于"a,asinapple"用戶可以諸如通過說出包含所需字符"薰"的詞"薰陶的薰"指定該字符。"薰陶"是包含所需字符"薰"的詞。詞"的"是指示所需字符是該詞的一部分的所有格形式。為獲得SR識別準確度,具有關于往往用來指定字符的詞的信息或數據是合乎需要的。在許多情況下,往往使用最頻繁使用的詞以及具有正面語義的詞來指定字符。以下是可以獲得CFG的詞的方式。可以收集名字的大型語料庫,以具有這些名字中通常將使用的字符的列表。此外,該語料庫應當是有效字符的小子集。另外,識別準確度可以通過尋找詞的包含該字符的大型語料庫,隨后將這些詞分組到包括正面或中性意義的第一組或文件1504和包括負面意義的第二組或文件1506來改進。往往使用具有正面或中性意義的詞來指定名字中使用的字符。系統1500可包括向詞分配加權數據或值的加權組件1510。隨后可以向正面和中性意義分配較高的加權值,向負面意義分配中間加權值,并向詞典中的不包含通常在名字中使用的字符的其余詞分配較低加權值。此外,這三個組中的詞可以使用圖5的頻率組件514以基于詞使用頻率來排序。該方法例如適用于中文以及日文中的漢字。在UI光標處于拼寫窗口的頂部(或拆分或中文)面板中的各字符(諸如802、1002和1402中的各字符)中的一個的上方時,該方法活動。即,用戶可以提供發音或者包含該字符的詞以最終獲得所需字符。上述第三方法406提供詞分解來獲得中文字符。圖16示出根據第三方法按所需字符的子分量的語音輸入來采用詞分解的系統1600。識別組件102示出多個亞洲語言引擎502,其中第一引擎504使用字符分解方法406,該方法又利用數據文件1602來提供數據。每一語言引擎502都可以使用數據文件1602來基于字符分解方法406獲得字符。第一數據文件1604包括可分解字符而第二數據文件1606包括字符的組成分量。用戶可以通過說"木子;李"來指定"李"以通過提供詞的子分量來獲得所需字符,其中"木"和"子"是組合形成"李"的子分量符號;"木"是該字符的頂部符號而"子"是底部符號。可以理解,可分解并且用戶還普遍使用的字符并不很多。因此,將收集可被分解的所有字符和普遍使用的可分解表達式并將其包括在語法中。類似于第二方法404,在光標處于拼寫向導面板的拆分面板的頂部面板中的各字符(諸如802、1002和1402中的各字符)中的一個的上方時,第三方法406可以活動。換言之,用戶可以通過發音或包含詞、或子分量來得到所需字符。系統1600包括用于尋找、處理和存儲流行字符1604并將這些字符分解成組成分量1606的流行性組件1608。簡要參考圖2,共享組件208允許用戶共享本地詞典,以改進其他用24戶的SR準確度或減少他們的糾正努力。在用戶使用本體系結構的各方面時,該用戶可以"教導"該系統,或該系統可以學習該用戶的活動和/或系統數據/參數(例如,使用圖3的推斷組件302的學習和推理能力)。如用戶所指示的,所識別的詞的概率可以改變,以示出哪些詞被最頻繁地使用。另外,如果詞未出現在圖2的默認詞典202中,則用戶可以將其添加到詞典的用戶定義的部分。此時,用戶可以"告訴"語音識別器102在詞典中的哪里(例如默認或用戶定義的)可以找到附加的詞。跨多個用戶共享、加載、以及上傳新詞典的能力方便提供持續改進的分布式語料庫。換言之,每一用戶將使用心疼或類似的詞來"教導"各個用戶計算機和方法。例如,在組或協作環境中,與其他用戶共享用戶定義的詞典是有好處的。例如,在團隊項目的上下文中,隨著用戶用新詞更新相關聯的用戶詞典,共享可以將這些新詞傳播給項目團隊的其他成員。共享可以用多種方式來執行,包括在其中在多個用戶之間共享單個文件以及批量共享對逐詞共享的中央位置。除域另一用戶或團隊共享之外,所公開的體系結構的共享組件208包括向供應商實體提供關于語音識別器102學習了什么的反饋,以使供應商可以改進默認詞典的能力。為此,語音識別器102可包括允許用戶指示向用戶定義的詞典添加的新詞是否可以在用戶系統、項目團隊、禾P/或公司邊界之外共享的機制。如果允許,則識別器102可以將該信息發送到供應商,以供審閱并包括在下一公共發行或更新的默認詞典中。然而,如果用戶不允許這一點,則不向供應商發送新添加的項。可以發送到供應商的項的示例是社區中最近變得流行的新的工業范圍的詞,而專用詞的示例可以是公司名稱或項目的內部名稱。應當考慮安全問題以確保共享不違反例如知識產權規章、共享的內容的范圍、以及共享的決策過程。所公開的體系結構還方便使用和實現不同亞洲語字符集的命令。例如,日語具有四種不同類型的書寫系統平假名、片假名、日文漢字和日文羅馬字。平假名可被認為是日文語音系統,并且也是有效的書寫系統(類似于西班牙語,其中用戶寫的即是該詞聽起來的)。片假名是較正式的書寫系統,其具有到平假名的一對一映射。日文漢字通常用于書寫名字。類似于中文,一組平假名聲音可對應于日文漢字中的多個同音字。因此,可以采用相同的拼寫面板和過程來從平假名獲得日文漢字。此外,并非像在中文中一樣提供同音字功能,將給出平假名和片假名的按鈕,以便如果用戶只想要平假名或對應的片假名,則可以利用在拆分面板方法(圖17中的1708或圖18中的1806)的頂部詞面板中得到詞的語音命令能力或按鈕。可以有一個按鈕或選擇器供用戶選擇和/或根據按鈕名稱的語音命令來將平假名轉換成日文羅馬字。因為一組平假名可以對應于多個日文羅馬字字符,所以在用戶說出例如"口一7字"("日文羅馬字")等平假名發音以觸發日文羅馬字轉換時,用于列出曰文漢字的同音字的列表框將被清除并用日文羅馬字的結果來重新填充。隨后,用戶可以說所需日文羅馬字字符前的索引號來將該日文羅馬字字符移動到頂部詞面板(圖17中的1708或圖18中的1806)。例如,對于諸如"土",該字符在平假名、片假名、日文漢字、曰文羅馬字等四種書寫系統的輸出如下平假名,6片假名日文羅馬字tsuchi、tuchi、tuti日文漢字土存在共享同一發音(同一片假名)的其它日文漢字,例如,日文漢字同音字槌、鎚、壌、椎圖17示出所呈現的用于通過平假名的語音/鍵入輸入來進行日語識別和處理以獲得日文漢字的拼寫對話框面板1700的屏幕截圖。面板1700包括指示使用平假名的標題欄^力、'《入力"冬A)。列表框1704示出日文羅馬字詞列表的日文漢字同音字列表或圖18中的1802。串1706告訴用戶使用平假名作為輸入來處理到所需書寫系統的轉換。詞面板1708存儲輸26入到詞處理器應用程序的最終字符。發音域1710示出所識別的輸入以供處理。面板1700還包括以下選擇器日文羅馬字(a—7字)(R)1712、平假名(^6力;&)(H)選擇器1714、片假名(力夕力于)(K)選擇器1716、確定(OK)(0)選擇器1718、以及取消(*^>七A)(E)選擇器1720。為獲得日文漢字字符,用戶可以說出"O6力;&入力"冬^"("平假名輸入面板")以觸發向導拼寫面板1700,隨后說出",6"(平假名中的"土"),這作為反饋在發音域1710中呈現給用戶(此后,列表框1704將自動地說出日文漢字同音字符的列表,每一字符前具有數字索引)。用戶隨后可以說出"l番"("第一個")來使列表框1704中的第一個詞"土"被移動到詞面板域1708。列表框1704此后不再展示。用戶隨后可以說"確定"來關閉拼寫面板1700,并且使用當前使用的任何文字處理程序來將詞面板1708中的詞"土"復制到文檔中。為獲得平假名,用戶可以說^力;《入力八°木A"以觸發拼寫面板1700的啟動。在用戶說出",6"以使",6"呈現在發音域1710中時,列表框1704將自動地生成日文漢字同音字符的列表作為默認列表;然而,用戶可以選擇忽略該列表。接著,用戶可以說出^力5&"("平假名")并且1710中所識別的",^"將自動地被移動到詞面板1708。列表框1704隨后將被移除,因為不再需要它了。通過說"OK(確定)",用戶使對話框拼寫面板1700關閉,并且詞面板1708中的詞將被復制到當前打開的文檔中。為獲得片假名,用戶可以說出^力;^入力"冬A"以觸發拼寫面板1700的啟動。在用戶說出",6"以使",6"呈現在發音面板域1710中時,列表框1704將自動地生成日文漢字同音字符的列表;然而,用戶可以選擇忽略該列表。接著,用戶可以說"力夕力于"("片假名"),并且系統將獲得片假名版本千"(片假名中的"土"),并且該系統將在詞面板1708中直接寫f"。隨后可以使列表框1704消失,因為不再需要它了。用戶可以選擇"OK"來關閉拼寫面板1700,并且詞面板1708中的詞將經由現有文字處理器來復制到文檔中。圖18示出所呈現的用于與獲得日文羅馬字相關的日語識別和處理的拼寫對話框面板1800的屏幕截圖。為獲得日文羅馬字,用戶可以說"^b力、'&入力"木A"以觸發拼寫面板1800來打開。在用戶說出",6"以使",6"呈現在發音面板域1804中時,列表框1802將在列表框1802中自動地生成日文漢字同音字符的列表;然而,用戶可以忽略該列表。如果用戶說出"a—T字"("日文羅馬字"),則系統會將",6"轉換成曰文羅馬字版本。因為存在日文羅馬字版本的多個候選,所以用日文羅馬字的候選替換列表框1802中的日文漢字候選。用戶隨后可以說出"l番"以獲得列表框1802中的第一個詞,以使"tsuchi"移動到詞面板1806。隨后可以使列表框1802消失。如果用戶說"OK",則拼寫面板1800關閉,并且詞面板1806中的詞將被復制到文檔中或當前正在使用的文字處理器中。盡管參考如屏幕截圖的各個附圖示出并描述了向用戶顯示信息的一些方式,但相關領域的技術人員可以認識到,可采用各種其它替換方案。術語"屏幕"、"屏幕截圖"、"網頁"、"文檔"和"頁面"在本文中一般可互換使用。頁面或屏幕作為顯示描述、作為圖形用戶界面或通過描繪屏幕(例如,無論是個人計算機、PDA、移動電話還是其它合適的設備)上的信息的其它方法被存儲和/或傳輸,其中要顯示在頁面上的布局和信息或內容被存儲在存儲器、數據庫或另一存儲設施中。圖19示出根據所公開的體系結構的識別語音的方法。盡管出于解釋簡明的目的,此處例如以流圖或流程圖形式示出的一個或多個方法被示出并描述為一系列動作,但是可以理解和明白,這些方法不受動作的次序的限制,因為根據本發明,某些動作可以按與此處所示并描述的不同的次序和/或與其它動作同時發生。例如,本領域技術人員將會明白并理解,方法可被替換地表示為一系列相互關聯的狀態或事件,諸如以狀態圖的形式。此外,并非一方法中所示的所有動作都是對于新穎實現所必需的。在1900處,語音識別引擎接收亞洲語語音形式的語音輸入。在1902處,對亞洲語語音信號進行識別處理以輸出結果。在1904處,進入拼寫/糾正模式來拼寫新詞或糾正結果。在1906處,基于語音發音和/或字符選擇來單遍糾正結果的拼寫。在1908處,隨后將經糾正的結果輸出到文檔或應用程序。圖20示出使用拼寫向導來糾正識別結果的方法。在2000處,識別引擎接收亞洲語語音輸入。在2002處,對亞洲語語音信號進行識別處理,并進入糾正模式以糾正結果的拼寫。在2004處,啟動拼寫向導作為糾正模式的一部分。在2006處,通過語音發音來將亞洲語字符輸入到向導。在2008處,經由向導基于語音發音來糾正拼寫。圖21示出將語音發音轉換成字符的方法。在2100處,開始為轉換過程準備數據文件。在2102處,創建經索引的詞和詞值的數據文件,該值包括發音、音調、使用頻率、以及類別。在2104處,按照使用頻率的次序來創建經索引的發音和具有發音作為值的詞的數據文件。在2106處,創建音素距離的混淆矩陣的數據文件。在2108處,訪問數據文件以經由拼寫向導進行發音處理。圖22示出在亞洲語和英語中使用拆分命令來進行糾正處理的方法。在2200處,呈現亞洲語和英語兩者中的拆分命令。在2202處,進行是否要進入英文拼寫糾正模式的檢査。如果是,則在2204處,進入英文拼寫模式。在2206處,通過拼寫模式中可用的方法基于語音信號來呈現候選字符列表。在2208處,基于所選候選來拼寫新詞或糾正誤識別的詞。如果在2202處,未進入英文拼寫模式,則流程去到2210以進入亞洲語拼寫模式,并如上所述隨后去到2206以繼續。圖23示出在亞洲語拼寫向導中使用同音字命令的方法。在2300處,呈現亞洲語和英語兩者中的拆分命令。在2302處,進入亞洲語拼寫糾正模式。在2304處,接收同音字命令。在2306處,基于目標字符的同音字字符來呈現候選字符的列表。在2308處,基于所選候選來糾正誤識別的詞。圖24示出將加權值應用于詞意義的方法。在2400處,開始準備通過包含所需字符的詞來進行糾正。在2402處,收集名字的大型語料庫。在2404處,尋找包含名字中的字符的詞。在2406處,將詞分組到正面和中性意義的文件中。在2408處,將詞分組到負面意義的文件中。在2410處,將高加權應用于正面和中性意義組中的詞。在2412處,將中等加權應用于負面意義組中的詞。在2414處,將低加權應用于不在這兩組中的詞。在2416處,根據使用頻率來對詞進行排序。圖25示出共享經更新的詞典的方法。在2500處,進入糾正模式。在2502處,跟蹤和記錄糾正模式期間所采用的新詞。在2504處,將新詞輸入到本地詞典中。在2506處,隨后將經更新的詞典傳送給其他用戶。在2508處,用戶可以將經更新的詞典傳送給供應商以更新分發詞典語料庫。圖26示出將字符分解用于拼寫糾正的方法。在2600處,啟動拼寫糾正模式。在2602處,用戶說出所需字符的子分量符號。在2604處,該方法循環通過子分量和相應字符之間的關系的對應的表。在2606處,如果存在超過一個匹配,則呈現子分量的所有可能的字符。在2608處,隨后基于子分量來選擇候選字符。圖27A和27B示出基于用于拼寫糾正的多個方法來進行糾正處理的方法。在2700處,引擎接收亞洲語語音輸入。在2702處,在UI中呈現所識別的引擎結果。在2704處,系統接收進入拼寫/糾正模式的語音命令(直接輸入新詞)。流程隨后去到2706,在此,為詞上下文處理同樣的和/或其它字符。另選地,流程可以從2702去到2708,在此,系統接收選擇詞來糾正的語音命令。在2710處,系統接收進入拼寫模式和選擇并糾正字符的語音命令。如上所述,流程隨后去到2706,在此,為詞上下文處理同樣的和/或其它字符。移到圖27B,在2712處,基于所計算的上下文來訪問可能的詞列表。例如,上下文可以是個人名字。在2714處,基于同樣的和/或其它字符來對詞列表的字符進行排序。在2716處,選擇對字符進行選擇的方法。在2718處,流程可以行進到2720,在2720中,選擇在其中以類似用法說出包含字符的詞的方法。另選地,在2722處,選擇通過提供所需字符的發音來獲得字符的方法。另外,在2724處,選擇在其中按子分量來說出詞以獲得字符的方法。或者,在2726處,選擇說出(多個)詞以獲得同音字列表并從該同音字列表中進行選擇的方法。在2728處,添加新字符或隨后用所選字符替換拼錯的詞中的不正確的字符。在2730處,隨后從用戶接收對整個詞正確性的語音確認。在2732處,隨后使用正確的字符來糾正引擎結果。如在本申請中所使用的,術語"組件"和"系統"旨在表示計算機相關的實體,其可以是硬件、硬件和軟件的組合、軟件、或者執行中的軟件。例如,組件可以是但不限于,在處理器上運行的進程、處理器、硬盤驅動器、多個(光和/或磁存儲介質的)存儲驅動器、對象、可執行代碼、執行的線程、程序、和/或計算機。作為說明,運行在服務器上的應用程序和服務器都可以是組件。一個或多個組件可以駐留在進程和/或執行的線程內,且組件可以位于一臺計算機內上/或分布在兩臺或更多的計算機之間。現在參考圖28,示出了可用于執行根據所公開的體系結構的糾正處理的計算系統2800的框圖。為了提供用于其各方面的附加上下文,圖28及以下討論旨在提供對其中可實現該各方面的合適的計算系統2800的簡要概括描述。盡管以上描述是在可在一個或多個計算機上運行的計算機可執行指令的一般上下文中進行的,但是本領域的技術人員將認識到,新穎實施例也可結合其它程序模塊和/或作為硬件和軟件的組合來實現。一般而言,程序模塊包括執行特定任務或實現特定抽象數據類型的例程、程序、組件、數據結構等等。此外,本領域的技術人員可以理解,本發明的方法可用其它計算機系統配置來實施,包括單處理器或多處理器計算機系統、小型計算機、大型計算機、以及個人計算機、手持式計算設備、基于微處理器的或可編程消費電子產品等,其每一個都可操作上耦合到一個或多個相關聯的設備。所示各方面也可以在其中某些任務由通過通信網絡鏈接的遠程處理設備來執行的分布式計算環境中實施。在分布式計算環境中,程序模塊可以位于本地和遠程存儲器存儲設備中。計算機通常包括各種計算機可讀介質。計算機可讀介質可以是可由計算機訪問的任何可用介質,且包括易失性和非易失性介質、可移動和不可移動介質。作為示例而非限制,計算機可讀介質可以包括計算機存儲介質和通信介質。計算機存儲介質包括以存儲如計算機可讀指令、數據結構、程序模塊或其它數據等信息的任何方法或技術實現的易失性和非易失性、可移動和不可移動介質。計算機存儲介質包括但不限于RAM、ROM、EEPROM、閃存或者其它存儲器技術、CD-ROM、數字視頻盤(DVD)或其它光盤存儲、磁帶盒、磁帶、磁盤存儲或其它磁存儲設備、或可以用于存儲所需信息并且可以由計算機訪問的任何其它介質。再次參考圖28,用于實現各方面的示例性計算系統2800包括計算機2802,計算機2802包括處理單元2804、系統存儲器2806和系統總線2808。系統總線2808向包括但不限于系統存儲器2806的各系統組件提供到處理單元2804的接口。處理單元2804可以是市場上可購買到的各種處理器中的任意一種。雙微處理器和其它多處理器體系結構也可用作處理單元2804。系統總線2808可以是若干種總線結構中的任一種,這些總線結構還可互連到存儲器總線(帶有或沒有存儲器控制器)、外圍總線、以及使用各類市場上可購買到的總線體系結構中的任一種的局部總線。系統存儲器2806包括只讀存儲器(ROM)2810和隨機存取存儲器(RAM)2812。基本輸入/輸出系統(BIOS)儲存在諸如ROM、EPROM、EEPROM等非易失性存儲器2810中,其中BIOS包含幫助諸如在啟動期間在計算機2802內的元件之間傳輸信息的基本例程。RAM2812還可包括諸如靜態RAM等高速RAM來用于高速緩存數據。計算機2802還包括內置硬盤驅動器(HDD)2814(例如,EIDE、SATA),該內置硬盤驅動器2814還可被配置成在合適的機殼(未示出)中外部使用;磁軟盤驅動器(FDD)2816(例如,從可移動磁盤2818中讀取或向其寫入);以及光盤驅動器2820(例如,從CD-ROM盤2822中讀取,或從諸如DVD等其它高容量光學介質中讀取或向其寫入)。硬盤驅動器2814、磁盤驅動器2816和光盤驅動器2820可分別通過硬盤驅動器接口2824、磁盤驅動器接口2826和光盤驅動器接口2828來連接到系統總線2808。用于外置驅動器實現的接口2824包括通用串行總線(USB)和IEEE1394接口技術中的至少一種或兩者。驅動器及其相關聯的計算機可讀介質提供了對數據、數據結構、計算機可執行指令等的非易失性存儲。對于計算機2802,驅動器和介質容納適當的數字格式的任何數據的存儲。盡管以上對計算機可讀介質的描述涉及HDD、可移動磁盤以及諸如CD或DVD等可移動光學介質,但是本領域的技術人員應當理解,示例性操作環境中也可使用可由計算機讀取的任何其它類型的介質,諸如zip驅動器、磁帶盒、閃存卡、盒式磁帶等等,并且任何這樣的介質可包含用于執行所公開的體系結構的新穎方法的計算機可執行指令。多個程序模塊可存儲在驅動器和RAM2812中,包括操作系統2830、一個或多個應用程序2832、其它程序模塊2834和程序數據2836。所有或部分操作系統、應用程序、模塊和/或數據也可被高速緩存在RAM2812中。應該明白,所公開的體系結構可以用市場上可購得的各種操作系統或操作系統的組合來實施。用戶可以通過一個或多個有線/無線輸入設備,例如鍵盤2838和諸如鼠標2840等定點設備將命令和信息輸入到計算機2802中。輸入/輸出設備可包括話筒/揚聲器2837和其它設備(未示出),例如,IR遙控器、操縱桿、游戲手柄、指示筆、觸摸屏等等。這些和其它輸入設備通常通過耦合到系統總線2808的輸入設備接口2842連接到處理單元2804,但也可通過其它接口連接,如并行端口、IEEE1394串行端口、游戲端口、USB端口、IR接口等等。監視器2844或其它類型的顯示設備也經由接口,諸如視頻適配器2846連接至系統總線2808。除了監視器2844之外,計算機通常包括諸如揚聲器、打印機等其它外圍輸出設備(未示出)。計算機2802可使用經由有線和/或無線通信至一個或多個遠程計算機,諸如遠程計算機2848的邏輯連接在網絡化環境中操作。遠程計算機2848可以是工作站、服務器計算機、路由器、個人計算機、便攜式計算機、基于微處理器的娛樂設備、對等設備或其它常見的網絡節點,并且通常包括相對于計算機2802描述的許多或所有元件,盡管為簡明起見僅示出了存儲器/存儲設備2850。所描繪的邏輯連接包括到局域網(LAN)2852和/或例如廣域網(WAN)2854等更大的網絡的有線/無線連接。這一LAN和WAN連網環境常見于辦公室和公司,并且方便了諸如內聯網等企業范圍計算機網絡,所有這些都可連接到例如因特網等全球通信網絡。當在LAN連網環境中使用時,計算機2802通過有線和/或無線通信網絡接口或適配器2856連接到局域網2852。適配器2856可以方便到LAN2852的有線或無線通信,并且還可包括其上設置的用于與無線適配器2856通信的無線接入點。當在WAN連網環境中使用時,計算機2802可包括調制解調器2858,或連接到WAN2854上的通信服務器,或具有用于通過WAN2854,諸如通過因特網建立通信的其它裝置。或為內置或為外置以及有線和/或無線設備的調制解調器2858經由串行端口接口2842連接到系統總線2808。在網絡化環境中,相對于計算機2802所描述的程序模塊或其部分可以存儲在遠程存儲器/存儲設備2850中。應該理解,所示網絡連接是示例性的,并且可以使用在計算機之間建立通信鏈路的其它手段。計算機2802可用于與操作上設置在無線通信中的任何無線設備或實體通信,這些設備或實體例如有打印機、掃描儀、臺式和/或便攜式計算機、便攜式數據助理、通信衛星、與無線可檢測標簽相關聯的任何一個設備或位置(例如,公用電話亭、報亭、休息室)以及電話機。這至少包括Wi-Fi和藍牙TM無線技術。由此,通信可以如對于常規網絡那樣是預定義結構,或者僅僅是至少兩個設備之間的自組織(adhoc)通信。現在參考圖29,示出了用于根據所公開的體系結構的糾正處理的示例性計算環境2900的示意性框圖。系統2900包括一個或多個客戶機2902。客戶機2902可以是硬件和/或軟件(例如,線程、進程、計算設備)。例如,客戶機2902可容納cookie和/或相關聯的上下文信息。系統2900還包括一個或多個服務器2904。服務器2904也可以是硬件和/或軟件(例如,線程、進程、計算設備)。服務器2904可以例如通過使用本體系結構來容納線程以執行變換。在客戶機2902和服務器2904之間的一種可能的通信能夠以適合在兩個或多個計算機進程之間傳輸的數據分組的形式進行。數據分組可包括例如cookie和/或相關聯的上下文信息。系統2900包括可以用來使客戶機2902和服務器2904之間通信更容易的通信框架2906(例如,諸如因特網等全球通信網絡)。通信可經由有線(包括光纖)和/或無線技術來促進。客戶機2902操作上被連接到可以用來存儲對客戶機2902本地的信息(例如,cookie和/或相關聯的上下文信息)的一個或多個客戶機數據存儲2908。同樣地,服務器2904可在操作上連接到可以用來存儲對服務器2904本地的信息的一個或多個服務器數據存儲2910。以上所描述的包括所公開的體系結構的各示例。當然,描述每一個可以想到的組件和/或方法的組合是不可能的,但本領域內的普通技術人員應該認識到,許多其它組合和排列都是可能的。因此,本新穎的體系結構旨在涵蓋所有這些落入所附權利要求書的精神和范圍內的更改、修改和變化。此外,就在說明書或權利要求書中使用術語"包括"而言,這一術語旨在以與術語"包含"在被用作權利要求書中的過渡此時所解釋的相似的方式為包含性的。權利要求1.一種計算機實現的轉換系統(100),包括用于基于語音輸入來輸出亞洲語字符的語音識別組件(102);以及用于基于所述語音識別組件的不正確的輸出來生成經糾正的輸出的糾正組件(104)。2.如權利要求1所述的系統,其特征在于,所述糾正組件包括方便口頭或手動地進行用戶交互的用于選擇并糾正所述不正確的輸出的拼寫向導。3.如權利要求1所述的系統,其特征在于,所述糾正組件接收與使用本地音標的詞發音相關的信息。4.如權利要求1所述的系統,其特征在于,所述糾正組件接收有關如何通過提供所述字符在其中被使用的詞來書寫詞的信息。5.如權利要求1所述的系統,其特征在于,所述糾正組件接收與如何組成所述字符相關的信息。6.如權利要求l所述的系統,其特征在于,還包括采用基于概率和/或基于統計的分析來預測或推斷期望自動執行的動作的推斷組件。7.如權利要求1所述的系統,其特征在于,還包括用于與其他用戶和詞典供應商共享經更新的詞典的共享組件。8.如權利要求1所述的系統,其特征在于,還包括用于基于意義來對詞進行加權的加權組件。9.如權利要求1所述的系統,其特征在于,還包括用于存儲使用頻率信息的頻率組件,所述糾正組件使用該使用頻率信息來提供候選字符的排序列表。10.如權利要求1所述的系統,其特征在于,所述亞洲語字符具有中文或日文的書寫形式,該書寫形式包括具有相關聯的固定發音的象形文字。11.一種識別語音的計算機實現的方法,包括識別亞洲語語音信號來輸出結果(1902);進入拼寫/糾正模式以糾正所述結果的拼寫(1904);以及基于語音發音或字符選擇中的至少一個來單遍糾正所述結果的拼寫(l麵)。12.如權利要求11所述的方法,其特征在于,還包括響應于接收到所述亞洲語語音信號來自動地進入所述拼寫/糾正模式,其中糾正模式包括接收所述語音發音的拼寫向導。13.如權利要求11所述的方法,其特征在于,還包括應用存儲用于糾正所述拼寫的音素距離的混淆矩陣。14.如權利要求11所述的方法,其特征在于,還包括使用發聲的同音命令來糾正所述拼寫。15.如權利要求11所述的方法,其特征在于,還包括基于將詞分解成諸符號子分量來糾正所述拼寫。16.如權利要求11所述的方法,其特征在于,還包括在糾正所述拼寫的同時發展新詞典,并將所述新詞典傳送給另一用戶。17.如權利要求11所述的方法,其特征在于,還包括基于所述亞洲語語音信號的語言來在多個書寫系統之間切換。18.如權利要求11所述的方法,其特征在于,還包括基于包含所述字符的一個或多個詞的語音輸入來選擇該字符。19.如權利要求11所述的方法,其特征在于,還包括生成候選字符的區分了優先次序的列表,并將所述候選字符作為經索引的列表來呈現以供通過手動地或通過語音命令中的一種方式來選擇。20.—種計算機實現的系統,包括用于識別亞洲語語音信號來輸出結果的計算機實現的裝置(102);用于進入拼寫/糾正模式來糾正所述結果的拼寫的計算機實現的裝置(302);用于執行關鍵字搜索的計算機實現的裝置(502);以及用于基于語音命令和手動字符選擇來單遍糾正所述結果的拼寫的計算機實現的裝置(104)。全文摘要一種用于在亞洲語言語音識別系統中糾正不正確的識別結果的體系結構。可以響應于接收到語音輸入來啟動一種拼寫模式,該拼寫模式用于糾正識別結果的不正確的拼寫或生成新詞。糾正可以通過語音和/或手動選擇和輸入來獲得。該體系結構方便單遍糾正,而非像常規系統中那樣多次糾正。使用該拼寫模式來糾正的詞是作為一個單元來糾正的并且被當作詞。該拼寫模式至少適用于亞洲大陸的語言,如簡體中文、繁體中文、和/或諸如日文等其它亞洲語言。文檔編號G06F17/28GK101669116SQ200880013543公開日2010年3月10日申請日期2008年4月8日優先權日2007年4月26日發明者A·奇特拉普,K·E·弗里吉,S-Z·郭,T·美和,Y·宮申請人:微軟公司