專利名稱::用于為語音對話系統編輯信息的方法用于為語音對話系統編輯信息的方法
技術領域:
:本發明涉及用于為語音對話系統編輯信息的方法、裝置和系統。在因特網頁面上,信息以多種形式被顯示,并且可以通過圖形用戶界面被用戶看到。顯示的一種可能的形式是表格,在該表格中信息按有序的編行列以文本或者數據的形式被反映。要顯示的信息在此被劃分為行(水平的行列)和列(垂直的行列),使得通常在一行或者一列的表格元素的內容之間存在語義上的和/或句法上的關聯。在此情況下有問題的是,這樣顯示出的信息只有通過圖形用戶界面才能被用戶使用,然而這在確定的應用環境中是不可能的或者僅僅是有條件地可能的。例如在驅車旅行期間,當用戶想通過因特網接入來讀取因特網頁面上以表格形式顯示的信息時,情況如此.因此值得期望的是,提供對因特網頁面上的表格的語音接入,其中用戶以自然語言提出與主題有關的問題,并且獲得以自然語言朗讀的合適的答案。在美國專利文獻US6,859,777B2中描述了一種用于通過語音控制在因特網頁面上導航的方法。為此,語音識別器的詞匯表動態地根據在因特網頁面上找到的交叉參考(鏈接)產生。這些鏈接隨后可以被用戶說出,以便導航至另一頁面。然而,可在因特網頁面上找到的其余的和內容有關的信息不能通過這種方法被綁定。這樣,特別不可能的是,用戶在語音對話系統中有目的地詢問在因特網頁面上以表格形式顯示的信息,隨后期望的信息通過語音對話系統被輸出。因此,本發明所基于的任務在于,提供用于為語音對話系統編輯信息的方法、裝置和語音對話系統,借助該語音對話系統,以表格形式顯示的信息可以被用戶有目的地詢問。根據本發明,該任務通過具有權利要求1、12和13的特征的方法、裝置和語音對話系統來解決。本發明的有利的改進方案在從屬權利要求中^L說明。根據本發明,在一種用于為語音對話系統編輯信息的方法中提供以表格形式顯示的信息。以表格形式顯示的信息和/或該信息的顯示根據預先給定的準則來標準化并且以可訪問的形式被存儲。此外,表格元素的水平的和/或垂直的行列(Reihe);故分配第一語法,并且相應的行列中的表格元素被分配第二語法。第一和第二語法描述語音輸入的結構和概念規則,借助這些規則,能夠識別所分配的行列和相應的行列的所分配的表格元素。基于所分配的第一和第二語法,為語音對話系統編輯以表格形式顯示的信息。該方法具有有利的效果,即根據按照特定的方針實現的基于因特網的應用全自動地生成針對語音對話系統的轉換。因此,例如可能的是,根據在因特網中可用的FAQ列表(常見問題,FrequentlyAskedQuestions)生成半自動的具有語音接入的幫助系統。此外,借助舒適的語音對話應用,該方法能夠使供應商注意其在因特網上的供應品,而不必為此投資分離的、特別地制造的語音對話機。因此,當這些信息在因特網中由供應商在表格中適當地提供并且由該方法所編輯的信息在車輛中被語音對話系統使用時,例如車輛駕駛者可以在路上問明下一個加油站或者下一個餐館。根據本發明的一種改進方案,以表格形式顯示的信息在至少一個可預先給定的數據庫中被確定。因此,可以有利地訪問由該方法預先給定的因特網地址,并且在這些網頁中搜索HTML表格對象。根據本發明的另一種擴展方案,水平定向的表格在第一列中具有標題。用于標準化所確定的以表格形式顯示的信息的可預先給定的準則是水平定向的表格。這利用如下知識在第一行列中相對于其余行列中的正常字形為粗體的情況下可以看出強烈的指示,即標題位于第一行列中。由此,可以有利地以相同的定向來顯示所找到的表格。這樣,例如也在本發明的范圍內的是,將多維的表格或者嵌套的表格按照預先給定的方案來展開,使得這些表格隨后具有相同的定向并且由此可比較,根據本發明的另一種擴展方案,用于標準化所確定的以表格形式顯示的信息的預先給定的準則是信息的文字顯示的統一。這例如具有以下優點,即縮寫被解析或者被統一,在文本部分中出現的特殊符號、諸如縮寫點或者序數點根據預先給定的試探法通過所定義的字母數字鏈來替代,并且未知的符號通過空白字符來替代。這種處理方式具有以下優點,即以表格形式顯示的信息是統一的并且由此是可比較的。根據本發明的一種優選的擴展方案,表格元素分別被分配被至少一個類別,并且根據所分配的類別和被標準化的信息,表格元素的水平和/或垂直的行列被分配一個類別。第一和第二語法借助所分配的類別來確定。在此情況下,借助所分配的類別特別是根據數據庫來確定語法。該改進方案具有有利的效果,即也為語音對話應用編輯表格,在這些表格的情況下,所產生的或者根據數據庫所確定的標準語法不能被應用。根據本發明的另一種有利的擴展方案,所分配的類別包括句法類別、語義類別和標準類別。句法類別在此情況下例如是所有類別的日期說明、時間和尺寸。語義類別例如是包括屬于確定語義類別的元素的列表的本體。如果不能分配合適的句法類別或者語義類別,則分配所謂的標準類別或者默認類別。根據本發明的另一種有利的擴展方案,針對語音合成設置有標準輸出,該標準輸出根據上下文在語音對話系統中輸出編輯好的信息。這些標準輸出例如包括開始通知、系統輸出和應答輸出。根據語音對話系統所處的狀態,可以由語音合成系統為用戶輸出預先給定的標準輸出或者利用編輯好的信息所組合的標準輸出.按照根據本發明的用于為語音對話系統編輯信息的裝置,該裝置具有用于提供以表格形式顯示的信息的裝置。此外,還具有用于根據預先給定的準則來標準化以表格形式顯示的信息和/或這些信息的顯示的裝置以及用于將這些信息以可訪問的方式進行存儲的裝置。此外,該裝置還具有用于將第一語法分配給水平和/或垂直的行列以及將第二語法分配給相應的行列中的表格元素的裝置,其中第一和第二語法描述語音輸入的結構和概念規則,借助這些規則能夠識別所分配的行列和相應的行列的所分配的表格元素。因此,基于所分配的第一和第二語法,為語音對話系統編輯以表格形式顯示的信息。根據按照本發明的用于在語音對話中以表格形式顯示的信息的可詢問性的語音對話系統,該語音對話系統具有以下組件語音識別單元,用于識別由用戶進行的詢問,對話機,用于確定由用戶詢問的以表格形式顯示的信息,以及語音合成單元,用于輸出被詢問的信息。以下根據附圖借助實施例來進一步闡述本發明。圖1示出用于為語音對話系統編輯以表格形式顯示的信息的方法的示意圖,圖2示出具有關于歐洲的國家的信息的標準化表格。圖1以示意圖示出一種用于為語音對話系統109編輯在因特網101中找到的、以表格形式顯示的信息102的方法。為此,通過表格編譯器103搜索因特網101中的表格,并且為語音對話系統109編輯表格。在表格爬蟲(Tabellen-Crawler)104中,首先在因特網中搜索HTML表格,檢驗這些表格的可用性,并且將可用的表格進行本地存儲。表格變換器105將可用的表格的顯示以及相應的文本表格元素標準化。語法猜測器(GrammarGuesser)106基于用于表格內容的合適的數據庫IIO確定適當的語法,隨后根據這些語法生成用于語音對話系統109的語音識別器的語音模型。提示生成器107根據內容以及必要時根據表格的標題生成所有對于應用來說所必需的輸出。在應用生成器108中,表格變換器105、語法猜測器106和提示生成器IO7的結果以預先給定的數據結構被組合成所期望的語音對話應用,使得表格本身被轉化為邏輯數據結構,相應的詢問可以在該邏輯數據結構上被分析。對話機109在運行的系統中識別用戶的自由的、自然語言的詢問,將這些詢問翻譯為表格詢問,并且最后以自然語言再現所找到的解決方案。以下再此詳細地描述圖1中所示的根據本發明的方法的各個組件。一旦表格爬蟲104被啟動,它就依次訪問在列表中被預先給定的因特網地址,例如http://www,sportl-de和http://www.koeliude。表格爬蟲跟蹤設定值(Vorgabe)內的鏈接,并且在所有的頁面中搜索根據〈table〉和〈/table〉的HTML表格格式而成幀的HTML對象。所找到的表格被自動地檢查其可用性,例如檢查其表格元素是否包含足夠的文本。隨后,基于不同的試探法(Heuristik)來確定表格的定向。例如,第一列中的粗體相對于其余列中的正常字體給出強烈的指示在第一列中是標題,也即表格水平定向。相反,第一行中的粗體和其余行中的正常字體指示表格的垂直定向。如果表格是多維的,例如在距離表格時常常情況如此,則該表格按照預先給定的方案被展開。類似地,嵌套表格、也即表格中的表格以合適的方式被展開。所找到的并且以可訪問的形式存儲的表格隨后通過表格變換器105被標準化。為此,例如將垂直定向的表格變換為水平定向的表格。此外,將縮寫解析或者統一,以及根據預先給定的試探法通過所定義的字母數字鏈來替代在文本部分中出現的特殊符號(例如縮寫點或者序數點)。此外,未知的符號通過空白字符來替代。所有找到的并且以可訪問的形式存儲的表格都被類似地處理。在下一步驟中,通過語法猜測器106為語音識別器確定應用特定的詞匯表,用戶在對話中可以通過該詞匯表訪問表格元素的值。為此,首先給標準化表格的每個表格元素分配類別。存在句法類別和語義類別。句法類別例如是所有種類的日期說明、時間和尺寸。如果表格元素中的文本例如由具有隨后的"平方公里"的基數構成,則將類別"面積量度"分配給該表格元素。語義類型通過本體(0ntologien)而確定。為此,具有可擴展的本體集合的的數據庫可供該方法使用。這些本體是確定的語義類別的所有所屬元素的簡單列表。例如,針對"地球上的所有國家,,的本體是地球上的所有國家的列表,由阿富汗開始直到塞浦路斯。分配現在通過相應的表格元素中的文本與這些列表的簡單調整來實現。相應的表格元素得到所有語義類別,在這些語義類別的本體中,出現相應的表格元素的文本。例如,將類別"地球上的所有國家,,以及"歐洲的所有國家"分配給具有文本"法國"的表格元素。隨后,確定行的類別。為此,收集這些行的各個表格元素的類別,并且基于不同的試探法來確定整個行的最可能的類別。例如,具有表格元素"法國,,和"意大利"的行將被分配類別"歐洲的所有國家",因為這是被分配給該行的大多數表格元素的最小的類別。如果句法類別和語義類別都不能被分配給表格元素或者行,則該表格元素或者行獲得預先給定的默認類別或者標準類別。在該過程結束并且表格的每一行都唯一地被分配類別之后,確定對于語音對話系統的語音模型來說所必需的語法。為此,表格編譯器擁有具有語法的另一數據庫。這些語法描述當用戶想知道關于確定的主題的一些內容時他在自由對話中將使用的詞鏈。這些詞鏈并不描述完整的句子,而是僅僅描述表達的部分。例如在用戶表達"法國有多大?"中,詞鏈"多大,,由第一語法描述,而詞鏈"法國"由第二語法描述。表格編譯器的語法原則上根據是涉及對值的詢問還是涉及用于值的過濾器而不同。對值的詢問在下面被稱為觸發語法,而用于值的過濾器被稱為過濾器語法。觸發語法提供占位符作為觸發值,該占位符在分析中用行的相應的標題來替代。過濾器語法提供過濾值作為結果,該過濾值與表格元素中的標準化的條目進行比較。過濾器語法的一部分是簡單的詞列表,這些詞列表基本上對應于本體的列表。例如,過濾器語法被設置用于地球上的所有國家,該過濾器語法在其變型方案中也包含地球上的所有國家的名稱。因此,詞鏈"美利堅合眾國"、"合眾國"或者"USA"例如都提供相同的值"USA"。同樣,表格元素中的例如"合眾國"的所有條目都被標準化為值"USA"。過濾器語法的另一部分描述被用于數值的詞鏈、例如"三十萬平方公里"。這是用于尺寸、日期、時間等等的過濾器語法。過濾器語法的其它組成部分是用于比較結構的詞鏈、例如"大于三十萬平方公里"或者"最大"。此外,也存在描述表格元素彼此之間的比較結構的過濾器語法,例如用于諸如"哪個國家比意大利更大?"的表達。為此,設置有特別的形式,該形式引入占位符,比較措詞與該占位符相關聯,并且該占位符在實際的表達中相應地被替代.從該語法數據庫中選擇最適合當前應用的語法。為此,使用不同的試探法,這些試探法考慮行的類別、行的標題以及在數值情況下考慮其最小值和最大值。由此,每行都被分配觸發語法和過濾器語法。此外可以規定,為了將語音識別器的總詞匯量保持盡可能小,將過濾器語法中的數值限制為有意義的取整(Rundung)。針對被分配默認類別的行,產生默認語法。作為默認觸發語法,獲取行的標題,并且將"哪個"置于其前面。作為默認過濾器語法,獲取所涉及的行的表格元素。語法猜測器以這種方式為每個應用提供觸發語法和過濾器語法的集合,這些觸發語法和過濾器語法在其整體上描述用戶能夠通過相應的表格在自由對話中問明的內容。在下一步驟中,由提示生成器生成針對應用的提示或者陳述。在此情況下,設置有三種提示開始消息提示、系統提示和應答提示。開始消息提示用于通知用戶,他可以在應用中關于因特網中的哪個主題進行聊天。系統例如利用以下的開始消息提示來通知用戶"已找到關于歐洲的國家的新表格。在該表格中編行列了關于國家、首都、面積和象征的信息。"該開始消息提示通過以下方式被自動生成,即給表格的標題"歐洲的國家"配備前綴"我...關于...新的表格"。隨后,給行標題配備前綴"找到了。在該表格中有關于…的信息",隨后各個行標題通過逗號和最后的"以及"來分開列舉。如果表格沒有標題,則相應地不同地生成開始消息提示。系統提示在一般的對話狀況中、例如當用戶的表達未被理解時或者當用戶調用了幫助功能時被播放。應答提示在該實施例中有兩個任務一方面它直接確認用戶說了什么,或者語音識別器理解了什么,并且另一方面它回答問題。例如,用戶詢問"法國的首都叫什么?",于是系統利用應答提示"關于你對法國首都的詢問,我找到如下答案巴黎"來回答。該應答提示通過以下方式來生成,即首先將由過濾器語法所識別的過濾值作為過濾器進行存儲,在該例子中為過濾值"法國"。類似地,存儲觸發語法,例如在該例子中"首都叫什么?"。隨后,根據所存儲的觸發語法和過濾器語法來建立數據結構,該數據結構作為詢問被發送給具有其所存儲的、編輯好的表格的應用。接著,用言辭表達所得到的結果值、觸發值和過濾值,使得上述答案能夠被輸出。對于值的言辭表達,存在合適的標準提示,使得例如"五七五九零零零零零"不被讀出,而是"五億七千五百九十萬"。提示生成器107因此為每個應用提供提示集合,該集合為用戶介紹應用的內容,對標準狀況作出反應,以及以自然語言呈現所找到的答案。在應用生成器108中,將由語法猜測器106和提示生成器107所生成的數據結構組合為對于語音對話應用來說可用的結構。首先,如果表格標題不可識別,則為應用給出名稱,該名稱對應于表格標題或者輔助結構。以該名稱編制目錄并且產生配置文件。在應用目錄中生成四個子目錄,這四個子目錄包括包含對話流的描述和提示的子目錄,包含對后臺系統(在此情況下是作為數據結構被適當地編輯的表格)的訪問描述的子目錄,語法所在的子目錄,以及由此生成的語音模型所在的子目錄。利用該數據結構,語音對話應用被完整地描述,并且可以被加栽到所期望的語言平臺上,例如加載到PDA或者車頭單元上。語音對話系統109—般由語音識別單元、語音合成單元以及對話機組成。下面借助圖2介紹一些對話序列,這些對話序列可以基于由圖1中的表格編譯器所生成的語音對話應用利用語音對話系統來實施。1."關于法國,你知道什么?,,在這種情況下,詢問過濾值,因此法國所在的列207的所有表格元素都被讀出(巴黎,544,000平方公里,58,850,000,雄雞)。2."在歐洲有哪些首都?"在這種情況下,詢問觸發值,因此具有標題首都的行202的所有表達元素都被讀出(巴黎,羅馬)。3."意大利的首都叫什么?"在這種情況下,詢問觸發值和過濾值,因此在行首都202和列意大利206的交叉處出現的表格元素(羅馬)被讀出。4."意大利多大并且首都叫什么?"在這種情況下,詢問兩個不同的觸發值和一個過濾值,因此讀出在行首都202和列意大利206的交叉處出現的表格元素,以及讀出在行面積203和列意大利206的交叉處出現的表格元素(301,336平方公里,羅馬)。5."關于巴黎,你知道什么?"在這種情況下,詢問過濾值,因此在此實際上讀出整個列巴黎207的表格元素。然而有意義的是引入限制,使得這里僅僅讀出在參考行國家201和列巴黎207的交叉處出現的表格元素(法國)。6."關于歐洲的國家,你知道什么?"在這種情況下,既不詢問過濾值也不詢問觸發值,因此在此實際上讀出整個表格。然而有意義的是引入限制,使得僅僅輸出參考行國家201的表格元素,并且系統在這種情況下以"等等,,結束(法國,意大利等等)。本發明并不限于這里所描述的實施例。權利要求1.一種用于為語音對話系統編輯信息的方法,其中-提供以表格形式顯示的信息,-以表格形式顯示的信息和/或該信息的顯示根據預先給定的準則來標準化并且以可訪問的形式被存儲,-表格元素的水平的和/或垂直的行列被分配第一語法,并且相應的行列中的表格元素被分配第二語法,-第一和第二語法描述語音輸入的結構規則和概念規則,借助這些規則,能夠識別所分配的行列和相應的行列的所分配的表格元素,-基于所分配的第一和第二語法,為語音對話系統編輯以表格形式顯示的信息。2.根據權利要求l所述的方法,其中,以表格形式顯示的信息在至少一個可預先給定的數據庫中被確定。3.根據權利要求1所述的方法,其中,-水平定向的表格在第一列中具有標題,-用于標準化所確定的以表格形式顯示的信息的預先給定的準則是水平定向的表格。4.根據權利要求1所述的方法,其中,用于標準化所確定的以表格形式顯示的信息的預先給定的準則是信息的文字顯示的統一。5.根據權利要求1所述的方法,其中,借助表格元素中的條目來產生第一和第二語法。6.根據權利要求1所述的方法,其中,借助數據庫來確定第一和第二語法。7.根據權利要求1所述的方法,其中,-表格元素分別被分配給至少一個類別,-根據所分配的類別和被標準化的信息,表格元素的水平的和/或垂直的行列被分配給一個類別,-借助所分配的類別來確定笫一和第二語法。8.根據權利要求1所述的方法,其中,所分配的類別包括句法類別、語義類別和標準類別。9.根據權利要求1所述的方法,其中,能夠訪問至少一個具有本體和/或語法的數據庫。10.根據權利要求1所述的方法,其中,能夠擴展具有本體和/或語法的數據庫。11.根據權利要求1所述的方法,其中,針對語音合成設置有標準輸出,該標準輸出根據上下文在語音對話系統中輸出編輯好的信息。12.—種用于為語音對話系統編輯信息的裝置,其中該裝置具有-用于提供以表格形式顯示的信息的裝置,-用于根據預先給定的準則來標準化以表格形式顯示的信息和/或該信息的顯示的裝置以及用于將該信息以可訪問的形式進行存儲的裝置,-用于將第一語法分配給水平和/或垂直的行列以及將笫二語法分配給相應的行列中的表格元素的裝置,其中所述語法描述語音輸入的結構和概念規則,借助這些規則能夠識別所分配的行列和相應的行列的所分配的表格元素,使得基于所分配的第一和第二語法為語音對話系統編輯以表格形式顯示的信息。13.—種用于在語音對話中以表格形式顯示的信息的可詢問性的系統,該系統具有以下組件-語音識別單元,用于識別由用戶進行的詢問,-對話機,用于確定由用戶詢問的以表格形式顯示的信息,以及-語音合成單元,用于輸出被詢問的信息。全文摘要對于許多應用環境來說值得期望的是,提供對因特網頁面上的表格的語音接入,其中用戶以自然語言提出與主題有關的問題,并且獲得以自然語言讀出的表格中的合適答案。本發明實現一種用于為語音對話系統編輯以表格形式顯示的信息的方法,使得可以在用戶對話中有目的地詢問表格中的信息。文檔編號G06F17/27GK101366076SQ200680052491公開日2009年2月11日申請日期2006年10月25日優先權日2006年2月10日發明者H·-U·布洛克,M·格爾克,S·沙克特爾申請人:西門子公司