專利名稱:自動提供文本交換服務的方法和系統的制作方法
技術領域:
本發明涉及自動語音系統的領域,更具體地,涉及使用自動語音應用 環境以自動提供基于文本的交互式服務。
背景技術:
交互式語音應答(IVR)系統通常用于通過通信網絡的語音信道提供 自動客戶服務。IVR系統可以使例行客戶請求快速、有效和自動地進行處 理。當請求是非例行的或者當呼叫者使用IVR系統有困難時,進行從IVR 系統到客戶服務代理的轉換。即使當需要人工交互時,IVR系統也可以獲 得必要的初步信息,諸如賬戶號碼和呼叫原因,這可確保呼叫者被轉送到 合適的人工代理,并確保人-人交互時間減少到最少。成功使用IVR系統 可以使呼叫中心最低限度地配備人員,同時以在等待隊列中花費相對少的 時間來向客戶提供高水平的服務。
IVR系統,尤其是具有自然語言理解(NLU)能力和/或大量上下文無 關的語法的魯棒性系統,表示巨大的金融和沖支術投資。該投資包括用于購 買/租賃和維護IVR體系結構硬件、IVR體系結構軟件和在該體系結構上 執行的語音應用的成本。額外的重要的追加成本可與維護充足數量的語音 質量信道以處理預期的呼叫量有關。另外,這些信道中的每一個都使用語 音服務器的一個可用端口,而該語音服務器具有有限數量的昂貴端口。每 個信道還使用 一定數量的在呼叫者和IVR系統之間建立語音質量信道所需 的帶寬。
傳統的方案不允許該昂貴的IVR體系結構凈皮調整以處理其它通信信道 上的客戶服務交互,諸如聊天信道或即時消息信道。相反,使用傳統技術
實現聊天信道要求在單獨的體系結構上進行單獨的投資。也就是說, 新的成本以購買和維護聊天體系結構硬件、聊天體系結構軟件和在該體系 結構上執行的聊天應用。
發明內容
一種使用自動語音應用環境的體系結構以自動提供實時的基于文本的 交互服務的解決方案。更具體地,該解決方案利用聊天機器人對象,也稱
為聊天機器人(Chatbot),來執行語音應用,以動態地將從文本交換客戶 機接收的文本轉換成語音服務器可使用的輸入,并動態地將來自語音應用 的輸出轉換為具有適于客戶機的格式的文本。文本交換客戶機可以是聊天 客戶機、即時消息(IM)客戶機、文本消息客戶機或任何其它實時的文本 通信客戶才幾。
在一個實施例中,該解決方案可以使用未修改的、現貨供應 (off-the-shelf )的文本交換軟件,諸如SAMETIME、TRILLIAN、 YAHOO! MESSENGER等。另外,該解決方案也可以使用未修改的語音應用環境來 執行未修改的語音應用,諸如已有的僅用于語音交互的VoiceXML應用。 另外,該解決方案不需要利用專門的設備、協議或其它類型的通信制品。
本發明可根據與在此提出的素材一致的許多方面來實現。例如,本發 明的 一個方面可包括自動應答方法。該方法可接收通過實時的文本交換接 口輸入的用戶交互。這些與語音應用之間的用戶交互可以4艮據需要動態和 自動地轉換為語音服務器可使用的格式。在一個實施例中,語音服務器的 文本輸入應用編程接口 (API)可用于直接接收文本輸入。另外,可以從 語音服務器接收自動交互,其被動態和自動地轉換為文本交換接口所接受 的格式。例如,由語音應用產生的語音標記可以被轉換為純文本。文本交 換接口可以是現貨供應的未修改的接口 。語音應用可以是沒有固有的文本 交換能力的基于VoiceXML的應用。
本發明的另 一個方面可以包括一種用于擴展自動語音應用環境以提供 文本交換服務的方法。該方法涉及自動語音應用環境和文本交換客戶機。
自動語音應用環境可執行自動語音應答應用,其允許用戶通過語音信道實 時地交互。文本交換客戶機可以通過文本交換信道與另 一個文本交換設備 實時地交互。在該方法中,可以在語音應用環境和文本交換客戶機之間建 立通信會話。該通信會話可包括到自動語音應用環境的服務器信道,并且 包括到文本交換客戶機的文本交換信道。在通信會話期間,交互可以動態 和自動地在服務器信道和文本交換信道之間轉換。
本發明的另 一個方面可包括一種用于提供文本交換服務的系統,其包
括文本交換客戶機、語音應用環境和Chatbot服務器。文本交換客戶機可 通過文本交換信道發送和接收實時的文本交換。語音應用環境可執行自動 語音應答應用,其允許用戶通過語音信道實時地交互。Chatbot服務器可 以建立涉及文本交換客戶機和自動語音應答應用的通信會話。在通信" 期間,Chatbot服務器可以動態地在文本交換客戶機和語音應用環境之間 轉換消息。
應當指出,本發明的多個方面可以被實現為用于控制計算設備以實現 在此描述的功能的程序,或者用于使計算設備能夠執行與在此描述的步驟 對應的過程的程序。該程序可以通過在磁盤、光盤、半導體存儲器和任何 其它記錄媒體上存儲來提供,或者也可以作為通過載波傳輸的數字編碼的 信號提供。所描述的程序可以是單個程序或者可實現為多個子程序,其中 每一個子程序在單個計算設備內進行交互,或者通過網絡空間以分布方式 交互。
在此詳述的方法也可以是至少部分地由服務代理和/或由服務代理操 縱的機器執行以響應服務請求的方法。
在附圖中示出了優選的實施例,然而應當理解,本發明并不限于所示 出的結構和手段。
圖1是根據在此公開的本發明的一個實施例的允許文本交換接口和語 音使能應用之間的動態交互的Chatbot服務器的系統的示意圖。
圖2是示出根據在此公開的本發明的一個實施例的文本交換客戶機、 Chatbot服務器、語音服務器和應用服務器之間的交互的處理流程圖。
圖3是根據在此公開的本發明的一個實施例的用于使用Chatbot服務 器和語音應用服務器提供文本交換服務的系統的示意圖。
具體實施例方式
圖1是根據在此公開的本發明的一個實施例的允許文本交換接口 110 和語音使能應用119之間的動態交互的Chatbot服務器114的系統100的 示意圖。系統100允許文本交換客戶機110和語音使能應用119之間的自 動交互。
語音使能應用119可以是VoiceXML應用,諸如用于通常配置在聯系 中心的交互式語音應答系統(IVR)的應用。文本交換客戶機接口 110可 以是用于任何類型的文本交換通信的接口 ,諸如使用SAMETIME、 TRILLIAN、 YAHOO!MESSENGER等的即時消息(IM)通信、聊天通 信、文本消息。
與大多數語音服務器一樣,語音服務器118可以包括文本;f莫式接口 106,其通常被語音識別引擎的開發者、系統維護者和/或訓練者使用。例 如, 一組私有的、受限的或標準化的(例如,MRCPv2 INTERPRET)應 用編程接口 (API)可用作接口 106。可以使這組在生產環境內通常不可用 或者不可訪問的API能夠創建文本輸入信道,該文^r入信道與通常用在 生產環境中運行的語音服務器118建立的語音信道相比,消耗少得多的計 算資源。在大多數情況下,文本模式接口 106在生產語音服務器118內是 存在的,但處于休眠。可以使接口 106能夠用于與Chatbot服務器進行基 于文本的交互。
接口 106的使用以對應用服務器108透明的方式出現,因此,對應用 119沒有影響。也就是說,應用119和應用服務器108仍然不知道語音服 務器118正在通過接口 106處理文本輸入,與語音輸入相反。由語音服務 器118產生并發送到Chatbot服務器114的輸出在任何情況下都相同。進 一步地,由應用服務器108產生并發送到Chatbot服務器114的輸出亦如 此。因此,多個通信會話,其中一些是使用接口 106的基于文本的會話, 其它是基于語音的會話,可以同時由應用服務器108處理。系統110可以 無需對應用服務器108的體系結構變化、(無需對假定接口 106存在的語 音服務器118的變化)、無需改變語音使能應用119的代碼而實現。這是 真的,即使應用119可能缺少對文本交換交互的顯式編碼支持,并且沒有 所公開的發明就不能支持這樣的交互。進一步地,文本交換接口 110可以 是任何現貨供應的文本交換軟件,其不需要進行修改以如在系統100中所 示的運行。
在系統100中,Chatbot服務器114可以取得121與其執行的語音使 能應用119相關的語音標記123。 Chatbot服務器114也可以轉送來自接口 110的文本輸入120,以經由接口 106發送語音服務器118可使用的文本 122。語音服務器118可以相對識別語法匹配輸入,并生成用于Chatbot 服務器114的文本輸出124。當Chatbot服務器執行該應用時,可以使用 該輸出124。應用119處理該輸出,其通常以語音標記片段的形式,諸如 VoiceXML (其還可以使用W3C語音合成標記語言或SSML ),產生響應 輸出。當執行文本交換操作時,由語音服務器118執行的標準語音合成操 作可以被忽略。Chatbot服務器114可以動態地將響應輸出從標記轉換為 接口 110處理的文本輸出126。例如,在標記標簽之間包含的文本內容可 以從應用119標記中提取(即,標記標簽可以省略)并包含在文本126消 息中。
與依賴語音信道的自動通信,諸如包含語音服務器118的傳統使用的 通信不同,通過Chatbot服務器114的文本消息通信要求很少的硬件資源 來復制獲得同時的客戶請求的能力。這允許系統100使用相同的體系結構 處理更大量的請求而降低客戶等待時間。另外,與語音服務器118的文本 交互和語音交互具有不同的動態。例如,使用文本交換接口 110的客戶不 要求以匆忙的方式來回答問題,這允許更深思熟慮和準確的輸入,從而導 致更相關的應答,這進而帶來不斷增加的客戶滿意度。
圖2是示出根據在此公開的本發明的一個實施例的文本交換客戶機 204、 Chatbot服務器206、語音服務器208和應用服務器209之間的交互 的處理流程圖200。
語音服務器208可以包括文#入API,其通常由語音識別引擎的開 發者、系統維護者和/或訓練者使用。可以使這組在生產環境中通常不可用 或者不可訪問的API能夠允許語音服務器208直接使用文本,這要求比處 理由服務器208通常接收的語音輸入所需要的少得多的計算資源。
如所示的,客戶機204可以向Chatbot服務器206發送請求210以初 始化文g式信道。Chatbot服務器206可以向語音服務器208發送信道 初始化消息212以建立^"。服務器208可以積極地響應,使信道214在 服務器206和208之間建立。然后Chatbot服務器206可與客戶機204建 立所請求的文本信道216。在步驟216之后,Chatbot服務器206可以向應 用服務器209發送請求217,這使得語音使能應用被實例化。也就是說, 應用標記220可以被傳送到Chatbot服務器206用于執行。
當Chatbot服務器206執行語音使能應用119時,可以產生應用開始 的提示221。服務器206可以將由應用119提供的標記轉換222成用文本 提示224呈現的純文本,該純文本被發送到客戶機204。例如,提示221 可以用標記編寫并可包括
<prompt> text context </prompt> 。 轉換222可以提取文本上下文(忽略標記標簽)并產生文本提示224,其 僅僅包括文本上下文。客戶機204可以通過文本信道響應226該提示。月良 務器206可以向語音服務器208轉發響應228,它可以與響應226相同。 語音服務器208可以通過程序動作230將響應228與語音語法相匹配,從 而得到文本結果232。語音服務器208可以向Chatbot服務器206傳送文 本結果232。當Chatbot服務器206執行用于執行應用119的程序邏輯243 時,使用該輸出232,這使得標記被生成。Chatbot服務器206可以將包含 在所生成的標記內的文本內容轉換236成發送到客戶才幾204的文本結果 237。交互以這種方式繼續進行,直到客戶機204發送請求238以結束通信 會話。Chatbot服務器206可以響應地關閉240其與語音服務器208之間 的信道。Chatbot服務器206還關閉242其與客戶機204之間的文本交換 信道,此時,通信會話終止。
圖3是根據在此公開的本發明的一個實施例的用于使用Chatbot服務 器320和語音應用服務器340以提供文本交換服務的系統的示意圖。該系 統可包括網絡360,其可通信地連接通信設備310、 Chatbot服務器320、 語音服務器330、應用服務器340和企業服務器350。
網絡360可以包括任何的各種組件,有線和/或無線的,其共同允許包 含在栽波內的數字編碼信息從任何可通信連接的組件傳送到任何其它可通 信連接的組件。
通信設備310可以是任何將客戶302連接到網絡360的通信設備。例 如,設備310可以包括移動電話、有線電話、計算機、筆記本、計算板、 個人數字助理(PDA)、便攜式計算設備、娛樂系統、交互式媒體設備等。 特定種類的設備310包括文本交換設備312、語音通信設備314和多模式 設備316'
文本交換設備312是能夠進行實時的交互式文本交換的計算設備。這 些文本交換包括在線聊天、即時消息和文本消息。通信設備314可以是任 何能夠通過網絡360進行實時語音通信的設備。這包括基于VoIP的通信、 傳統的電路交換通信、雙向無線通信等。多模式設備316是能夠參與文本 交換和語音交換的設備。 一些多模式設備316受限于一次一種模式的通信, 而其它設備能夠同時進行多模式的通信。
當執行文本交換時,設備310可以使用接口 318。該接口 318可以顯 示運行文本對話,并包括輸入新文本的部分。接口 318可以是用于即時消 息客戶機、聊天客戶機和/或文本消息客戶機的界面。
Chatbot服務器320可以是VoiceXML服務器或者動態地將來自設備 310的文本交換消息轉換為語音服務器330可使用的消息的等同設備。使 用讓語音月良務器330接收文本的文本輸入API 344可以允許來自i殳備310
的文本直接被語音服務器330使用。Chatbot服務器320也可以動態地將 來自語音服務器330的輸出轉換為由語音應用使用的輸出,然后使其在接 口 318內可呈現。
對于每個被管理的通信會話,Chatbot服務器320可以實例化Chatbot 對象324。 Chatbot對象324可以包括SIP服務器端應用程序(servlet)和 一個或者多個解釋器,諸如呼叫控制擴展標記語言(CCXML)解釋器、 語音擴展標記語言(VoiceXML)解釋器、擴y^文本標記語言(XML) 加語音簡檔(X+V)解釋器、語音應用語言標記(SALT)解釋器、媒體 資源控制協議(MCRP)解釋器、定制的標記解釋器等。SIP服務器端應 用程序可將進入的SIP請求映射到適當的解釋器。
由Chatbot對象324處理的通信會話可包含多個不同的通信信道,諸 如信道370和信道372。信道370可以是在Chatbot服務器320和設備310 之間建立的通信信道。信道372可以是在Chatbot服務器320和語音服務 器330之間建立的通信信道。可以看出,應用月良務器340不知ii^戶302 用于與服務器320進行通信的通信模式和信道類型。專門的文4^入API 344可用于允許語音服務器330直接使用由Chatbot服務器320提供的文 本輸入。
服務器320的轉換引擎322可以執行任何必要的轉換以將來自文本交 換設備312的輸出改變為語音服務器330可使用的輸入。通常,對于由語 音服務器330使用的文本,不需要大量的轉換,語音服務器330通過API 344 提供對文本才莫式交互功能的訪問。可以看出,在測試和開發階段,文本模 式交互功能通常由開發者使用,但是在此,在運行時用于允許語音服務器 直接處理文本。例如,因特網工程任務組(IETF)標準媒體資源控制協議 第2版(MRCPv2 )包含稱為語音識別器資源的INTERPRET的文本模式 解釋功能,其允許語音服務器330直接處理文本。
應用服務器340通常產生語音標記輸出,諸如VoiceXML輸出,語音 ^^務器將其轉換為音頻輸出。轉換引擎322可以從語音標記中41取文本內 容,并通過信道370將所提取的文本傳送到通信設備310。
應用服務器340可以是使用標準化運行平臺的模塊組件的應用服務 器。應用服務器340可以表示多層環境的中間件服務器。運行平臺可以提 供用于開發分布式、多層、基于Web的應用的功能。運行平臺還可以包括 標準的服務集、應用編程接口和協議。也就是說,運行平臺可允許開發者 創建企業應用,其在多個平臺之間是可擴展和可移動的。運行平臺可以包 括相關技術規范的集合,這些技術規范描述所要求的程序編程接口 (API) 和遵循的策略。
在一個實施例中,運行平臺可以是JAVA 2 PLATFORM ENTERPRISE EDITION (J2EE )軟件平臺。因此,應用服務器340可以 是J2EE應用服務器,諸如紐約Armonk的國際商用機器公司的 WEBSPHERE應用服務器、加利福尼亞San Jose的BEA系統公司的BEA WEBLOGIC應用服務器、喬治亞州亞特蘭大的JBoss公司的JBOSS應用 服務器和ObjectWeb聯盟的JOnAS應用服務器等。運行平臺不應被認為 局限于此,其它軟件平臺,諸如.NET軟件平臺在此也可以考慮。
IVR應用342可以是允許呼叫者進行交互并從企業服務器350的數據 庫接收信息的應用。訪問VoiceXML服務器320 (其已經被擴展用于 Chatbot 320 )可以接受使用M音信號的用戶輸入、語音輸入和文本輸入。 IVR應用342以單個VoiceXML應用的形式向用戶提^(^言息,該應用可被 任何模式使用,包括DTMF、語音和聊天。語音標記也可以被直接傳送到 轉換引擎322,在轉換引擎322,語音標記被轉換為可在接口 318中呈現的 文本。
IVR應用342可以向用戶提供一系列提示,并+艮據先前建立的對話菜 單接收和處理提示響應。語音處理操作,諸如文本-語音變換操作、語音-文本變換操作、呼叫者識別操作和語音授權操作,可由位于遠程的語音服 務器330提供。沒有Chatbot服務器320的介入,IVR應用342將不能與 文本交換設備312進行交互,因為IVR應用342沒有用于處理文本交換輸 入/輸出的本地編碼。
本發明可以用硬件、軟件或者硬件和軟件的結合實現。本發明可以以
集中方式在一個計算機系統中實現,或者以不同的元件散布在幾個互連的 計算機系統中的分布方式實現。任何類型的用于實現在此描述的方法的計 算機系統或者其它裝置是合適的。硬件和軟件的典型組合可以是具有計算 機程序的通用計算機系統,其中當計算機程序被加載和執行時,其控制該 計算機系統,以使其執行描述的方法。
本發明還可以內嵌在計算機程序產品中,該計算機程序產品包括能夠 實現在此描述的方法的所有特征,并且當其被加載到計算機系統時能夠實 現這些方法。本文中的計算機程序是指以任何語言、代碼或符號的指令集
的任何表達,其能夠使具有信息處理能力的系統直接或在a)轉換為另一 種語言、代碼或符號;b)采用不同的物質形式再現的任意一個或者兩者之 后實現特定的功能。
權利要求
1.一種自動應答方法,包括接收通過實時文本交換接口輸入的用戶交互;執行未修改的語音使能應用;動態和自動地將與所述應用的所述用戶交互轉換為語音服務器可使用的格式;動態和自動地將來自所述語音服務器的輸出轉換為語音使能用應用可直接使用的輸出;以及將來自所述語音使能應用的輸出轉換為可在所述文本交換接口中呈現的格式。
2. 如權利要求1所述的方法,其中,所述方法在生產環境中執行, 并且所述語音服務器包括用于處理文本輸入的應用編程接口 (API)。
3. 如權利要求1所述的方法,其中,所述語音服務器使用文本輸入 API,其允許所述語音服務器直接使用文本輸入,并且語音標記的轉換提 取在所述文本交換接口中直接呈現的文本內容。
4. 如權利要求3所述的方法,其中,所述文本交換接口是即時消息 接口、聊天接口和文本消息接口中的至少一個。
5. 如權利要求1所述的方法,其中,所述語音服務器被配置為同時 處理多個通信會話,所述會話包括至少一個涉及所述文本交換接口的會話和至少一個涉及使用語音接口的人的會話。
6. 如權利要求1所述的方法,其中,所述語音應用是用語音標記語 言編寫的單模式應用,并且由所述文本交換接口發送和接收的交互是基于文本的交互。
7. 如權利要求1所述的方法,其中,所述語音應用是基于VoiceXML 的應用。
8. 如權利要求1所述的方法,其中,所述文本交換接口是現貨供應 的未修改的接口 ,并且所述語音應用是沒有固有的文本交換能力的標準語音使能應用。
9. 如權利要求1所述的方法,其中,權利要求1的所述步驟是由至 少一個機器根據至少一個具有可由所述至少一個機器執行的多個代碼部分 的計算機程序自動執行的步驟。
10. 如權利要求l所述的方法,其中,權利要求1的所述步驟由服務 代理和由所述服務代理管理的計算設備中的至少一個執行,執行所述步驟 以響應服務請求。
11. 一種用于擴展自動語音應用環境以提供文本交換服務的方法,包括識別自動語音應用環境,其被配置為執行用于允許用戶通過語音信道 實時交互的自動語音應答應用;識別文本交換客戶機,其被配置為通過文本交換信道與另 一個文本交 換i殳備實時交互;在所述語音應用環境和所述文本交換客戶機之間建立通信^",其中 所述通信會話包括到所述自動語音應用環境的服務器信道,并且所述通信 會話包括到所述文本交換客戶機的文本交換信道;以及在所述通信會話期間,動態和自動地在所述服務器信道和所述文本交 換信道之間轉換交互。
12. 如權利要求ll所述的方法,其中,至少一個所述自動語音應答應 用是基于VoiceXML的應用,其中在所述語音應用環境中包括的語音服務 器的文本輸入API用于接受基于文本的輸入。
13. 如4又利要求11所述的方法,還包括自動將包含從所述服務器信道接收的文本內容的語音標記轉換為包括 所述文本內容的文本消息,所述文本消息通過所述文本交換信道傳送。
14. 如權利要求ll所述的方法,其中,所述文本交換接口是即時消息 接口、聊天接口和文本消息接口中的至少一個。
15. 如權利要求11所述的方法,其中,所述文本交換接口是現貨供應 的未修改的接口 ,并且所述語音應用環境包括至少一個沒有固有的文本交換能力的標準語音使能應用。
16. 如權利要求11所迷的方法,其中,權利要求11的所述步驟是由 至少一個機器才艮據至少一個具有可由所述至少一個機器執行的多個代碼部 分的計算枳4呈序自動執行的步驟。
17. —種用于提供文本交換服務的系統,包括文本交換客戶機,其被配置為通過文本交換信道發送和接收實時文本 交換;語音應用環境,其被配置為執行用于允許用戶通過語音信道實時交互 的自動語音應答應用;以及Chatbot服務器,其被配置為建立涉及所述文本交換客戶機和所述自 動語音應答應用的通信會話,其中,在所述通信會話期間,所述Chatbot 服務器以對所述文本交換客戶機和所述自動語音應答應用透明的方式動態 地在所述文本交換客戶機和所述語音應答應用之間轉換消息。
18. 如權利要求17所述的系統,其中,所述語音應用環境包括用于處 理文本輸入的應用編程接口 (API),其中所述Chatbot服務器進行傳送。
19. 如權利要求17所述的系統,其中,所述語音應用環境支持多個同 時執行的使用所述自動語音應答應用的通信會話,其中至少一個所述同時 執行的通信會話是與所述文本交換客戶機的文本交換通信,并且至少 一個通信會話。
20.如權利要求17所述的系統,其中,所述文本交換接口是現貨供應 的未修改的接口 ,并且所述自動語音應答應用是沒有固有的文本交換能力 的基于VoiceXML的應用。
全文摘要
本解決方案包括自動應答方法。該方法可接收通過實時文本交換接口輸入的用戶交互。這些與語音應用之間的用戶交互可根據需要被動態和自動地轉換為語音服務器可使用的格式。語音服務器的文本輸入API可用于允許語音服務器直接接收文本輸入。另外,自動交互可從語音服務器接收,其可以動態和自動地轉換為文本交換接口可接收的格式。文本交換接口可以是現貨供應的未修改的接口。語音應用可以是沒有固有的文本交換能力的基于VoiceXML的應用。
文檔編號H04L12/58GK101207584SQ20071018663
公開日2008年6月25日 申請日期2007年11月14日 優先權日2006年12月19日
發明者B·D·曼達利亞, V·S·莫爾, W·L·努斯比克爾, 帕爾馬 W·V·達 申請人:國際商業機器公司