專利名稱:使用聲音相關的車輛信息以增強語音對話的方法和系統的制作方法
技術領域:
本發明涉及使用例如與聲音相關的車輛信息,信號處理,以及其他操作或信息的組合增強車輛語音對話。
背景技術:
許多車輛裝備有語音對話,語音致動,或語音控制的車輛系統。語音對話系統可以基于言語命令執行功能,提供信息,和/或提供響應。語音對話系統可以將來自麥克風的聲音(例如,由車輛乘客發出的言語)處理或轉換為音頻信號。語音識別可以應用到音頻信號,并且識別的言語可以由語義解釋器處理。基于言語命令的解釋,諸如對話控制系統的系統可以執行動作,產生響應,或執行其他功能。響應可以是例如視頻信號,音頻信號,文本至語音信號,由車輛系統進行的動作,或對車輛乘客的其他通知的形式。聲音命令的清楚和辨識能力可以影響語音激活車輛系統的功能。然而麥克風在減小聲音命令的清晰度的情況下會經常接收與言語和非言語相關的聲音的信號。與非言語相關的聲音可以包括車輛相關的噪音(例如,發動機噪音,冷卻系統噪音等),非車輛相關的噪音(例如,車輛外部的噪音),音頻系統聲音(例如,音樂,廣播相關聲音),以及其他聲音。非言語相關的聲音可能經常大于言語命令,勝過和/或曲解言語命令。因此,如果非言語相關的聲音曲解言語命令,則語音識別系統或方法可能不能正確地運作。類似地,系統,例如對話控制系統的精確度在對言語命令產生響應時可以被非言語相關的聲音減小。非言語相關的聲音,例如,可以曲解或勝過文本至通話響應,音頻,以及從語音對話系統和/或其他系統輸出的其他信號。因此,需要基于與聲音或聲學相關的車輛信息以增強語音識別,對話控制,和/或言語提示系統的系統或方法。
發明內容
表示一個或多個聲音的聲音相關車輛信息可以在處理器中接收。聲音相關車輛信息可以或可以不包括音頻信號。基于聲音相關的車輛信息與車輛相關聯的語音對話系統的語音對話可以被修改。本發明還提供了以下方案:
1.一種方法,包括:
在與車輛相關聯的處理器中接收表不一個或多個聲音的聲音相關的車輛信息,聲音相關的車輛信息不包括音頻信號;以及
基于聲音相關的車輛信息修改與車輛相關聯的語音對話系統的語音對話。2.如方案I所述的方法,包括基于聲音相關的車輛信息確定干擾曲線記錄。3.如方案2所述的方法,其中基于聲音相關的車輛信息修改與車輛相關聯的語音對話系統的語音對話包括:
基于干擾曲線記錄確定導入音頻提示;以及 輸出導入音頻提示至使用者。
4.如方案2所述的方法,其中基于聲音相關的車輛信息修改與車輛相關聯的語音對話系統的語音對話包括:
基于干擾曲線記錄修改音頻提示的程度和定時;以及 輸出修改的音頻提示。5.如方案2所述的方法,其中基于聲音相關的車輛信息修改與車輛相關聯的語音對話系統的語音對話包括:
基于干擾曲線記錄修改對話類型以減小語法困惑。6.如方案2所述的方法,其中基于聲音相關的車輛信息修改與車輛相關聯的語音對話系統的語音對話包括:
監控使用者混淆;以及 輸出對使用者混淆的音頻提示響應。7.如方案2所述的方法,其中基于聲音相關的車輛信息修改與車輛相關聯的語音對話系統的語音對話包括:
基于干擾曲線記錄修改多種形式對話。8.如方案I所述的方法,包括:
在增加對話成功中基于聲音相關的車輛信息測量修改語音對話的成功;以及 基于測量的成功適用語音對話修改。9.一種系統,包括:
存儲器;
與車輛相關聯的處理器,其用于:
在與車輛相關聯的處理器中接收表不一個或多個聲音的聲音相關的車輛信息,聲音相關的車輛信息不包括音頻信號;以及
基于聲音相關的車輛信息修改與車輛相關聯的語音對話系統的語音對話。10.如方案9所述的系統,其中處理器用于基于聲音相關的車輛信息確定干擾曲線記錄。11.如方案10所述的系統,其中為了基于聲音相關的車輛信息修改與車輛相關聯的語音對話系統的語音對話,該處理器用于:
基于干擾曲線記錄確定導入音頻提示;以及 輸出導入音頻提示至使用者。12.如方案10所述的系統,其中為了基于聲音相關的車輛信息修改與車輛相關聯的語音對話系統的語音對話,該處理器用于:
基于干擾曲線記錄修改音頻提示的程度和定時;以及 輸出修改的音頻提示。13.如方案10所述的系統,其中為了基于聲音相關的車輛信息修改與車輛相關聯的語音對話系統的語音對話,該處理器用于:
基于干擾曲線記錄修改對話類型以減小語法困惑;以及 輸出修改的提不。14.如方案10所述的系統,其中為了基于聲音相關的車輛信息修改與車輛相關聯的語音對話系統的語音對話,該處理器用于: 監控使用者混淆;以及 輸出對使用者混淆的音頻提示響應。15.如方案10所述的系統,其中為了基于聲音相關的車輛信息修改與車輛相關聯的語音對話系統的語音對話,該處理器用于:
基于干擾曲線記錄修改多種形式對話。16.如方案9所述的系統,其中處理器用于:
在增加對話成功中基于聲音相關的車輛信息測量語音對話修改的成功;以及 基于測量的成功適用語音對話修改。17.一種方法,包括:
在與語音對話系統相關聯的控制器接收與引起聲音的車輛系統的操作相關的信息; 基于信息計算干擾曲線記錄,干擾曲線記錄表示噪音類型和噪音水平;以及 基于干擾曲線記錄改變對話控制。18.如方案17所述的方法,其中基于干擾曲線記錄改變對話控制包括:
基于干擾曲線記錄延遲從語音對話系統輸出音頻提示。19.如方案17所述的方法,其中基于干擾曲線記錄改變對話控制包括減小與語義解釋器相關聯的信任水平。20.如方案17所述的方法,其中基于干擾曲線記錄改變對話控制包括基于干擾曲線記錄修改后臺應用相關聯的語音對話系統。
在說明書的總結部分中尤其指出并且清楚地要求保護的是看作本發明的主題。然而,當結合附圖閱讀時,通過參照以下詳細描述可以最佳地理解本發明的組成以及操作方法,以及其目標,特征,和優點。圖1是根據本發明的實施例的具有自動語音識別系統的車輛的示意 圖2是根據本發明的實施例的自動語音識別系統的示意 圖3是根據本發明的實施例的語音對話系統的方框 圖4是根據本發明的實施例的自動語音識別系統的方框 圖5是根據本發明的實施例的語音對話促使系統的方框 圖6是根據本發明的實施例的語音對話系統的方框圖;以及 圖7是根據本發明的實施例的方法的流程圖。將要理解,為簡單和清楚地示出,附圖中所示的元件不必須按比例繪制。例如,為了清楚,一些元件的尺寸可以相對于其他元件放大。此外,認為合適的話,在附圖中附圖標記可以重復以表示對應或類似的元件。
具體實施例方式在以下的詳細描述中,為了提供本發明的實施例的徹底理解,闡述了許多的細節。然而,本領域技術人員將要理解的是,在沒有這些具體細節的情況下可以實施本發明的實施例。在其他示例中,公知的方法,過程,部件,以及電路沒有具體描述,以免使本發明不清
λ.Μ
/E.ο
除非以其他方式具體地指出,否則從以下討論中清楚的是,整個說明書討論中適用的諸如“處理”,“計算”,“存儲”,“確定”等術語,表示計算機或計算系統,或類似的電子計算裝置的動作和/或處理,其將對表示為計算系統的寄存器和/或存儲器內的物理(諸如電子)量的數據進行操作和/或轉換為類似表示為計算系統的存儲器,寄存器或其他這樣的信息存儲,傳輸或顯示裝置內的物理量的其他數據。本發明的實施例可以使用聲音相關的車輛信息(例如,車輛系統上的信息,其涉及車輛中的聲音,但本身不包括聲音信號或記錄或音頻信號或記錄),涉及產生或引起聲音的車輛系統操作的信號或信息,聲學相關的車輛信息,或干擾聲音信息(例如,表示窗戶位置,發動機每分鐘轉數(RPM),車輛速度,加熱通風與制冷(HVAC)系統風扇設置,音頻水平,或其他參數的數據);外部聲音測量;以及其他信息以增強語音識別,促進使用,例如語音對話,對話控制,和/或其他的語音對話系統或方法。提示例如可以是從語音對話系統輸出到使用者的信息,言語,或其他的音頻信號。聲音或聲學相關的車輛信息本身可以不包括聲音信號。例如,聲音或聲學相關的信息可以表不發動機RPM (例如包括其上的信息),但不是表不發動機產生的聲音的信號。聲音或聲學相關的信息可以表不窗戶打開(或打開一定量)的事實(例如包括其上的信息),而不是表示風通過打開的窗戶所產生的聲音。聲音相關的車輛信息可以表示或包括描述車輛或車輛系統的狀態的車輛參數。產生或引起聲音的與車輛系統操作相關的聲音相關的車輛信息或信號或信息可以用來產生干擾曲線記錄(IPR)。干擾曲線記錄例如可以包括噪音或聲音類型參數,噪音水平或聲音強度參數,及其他信息。(在一些實施例中,聲音相關的車輛信息可以包括噪聲類型參數和/或噪聲水平參數。)噪聲類型參數例如可以表示或基于一種聲音相關的車輛信息(例如,發動機RPM,HVAC風扇設置,窗戶位置,音頻重放水平,車輛速度,或其他信息)或聲音相關車輛信息的類型的組合。例如,噪聲類型參數可以包括窗戶是否打開或打開多少的指示(但不包括表示風聲的信號)。噪聲水平參數可以表示聲音強度水平相關的車輛信息(例如,HVAC風扇設置聞,中,低,或關閉;首頻重放水平聞,中,低,或關閉;或其他聲首相關的車輛信息)或聲音相關的車輛信息的組合(例如,打開窗戶和閾值速度以上的速度可以表示為風的噪聲類型參數和高的噪音水平參數)。例如,噪聲水平參數可以包括風扇是否運行或運行多少的指示(但不包括表示風扇的聲音的信號)。在一些實施例中,干擾曲線記錄可以是或可以包括整數(例如,8位整數或其他類型的整數),百分比,一個范圍的值,或其他數據或信息。在一些實施例中,干擾曲線記錄(例如,噪聲類型參數,噪聲水平參數和/或其他參數)可以用來增強語音識別。干擾曲線記錄例如可以由語音識別系統或處理(例如,包括信號處理器,自動語音識別(ASR)系統,或其他系統或方法)使用從而修改或改變聲音信號以提高語音識別系統或處理解碼。在一個示例中,信號處理器,ASR,或其他系統可以基于干擾曲線記錄(例如,噪聲類型參數和噪聲水平參數),應用預訓練的濾波器(例如,Weiner濾波器,梳狀濾波器,或其他電子信號濾波器)從而修改或改變輸入信號以限制或除去噪音并且提高語音識別。例如,基于噪聲類型參數可以應用一種類型的預訓練濾波器,并且基于噪聲水平參數濾波器設置或參數可以確定和/或應用。濾波器設置或參數例如可以控制或表示濾波器的量或水平或濾波,濾波的頻率,或濾波器的其他屬性。濾波的水平(例如,濾波的量),濾波的頻率,以及濾波器的其他屬性例如可以基于可以表示窗戶位置(例如,窗戶打開了多少的百分比)的噪聲水平參數,發動機每分鐘轉數(RPM),車輛速度,環境控制風扇設置,音頻重放水平,或其他車輛參數。例如,如果噪聲水平參數表示高水平的噪音而不是低水平的噪音,濾波的更高水平或量而不是低水平可以應用到輸入信號中。當然可以使用濾波器水平和噪聲水平參數的不同組合。可以使用其他信號處理方法和/或模塊。在一個示例中,基于干擾曲線記錄(例如,噪聲類型參數和噪聲水平參數),ASR或其他系統可以應用預訓練聲學模型以改進語音識別。基于干擾曲線記錄(例如,噪聲類型參數,噪聲水平參數,和/或其他參數)可以選擇一種預訓練聲學模型(例如,在多個聲學模型中)。在一些實施例中,一種聲學模型可以對應于一個或多個干擾曲線記錄。例如,基于聲音相關的車輛信息如果產生了預定的干擾曲線記錄,則可以使用預定聲學模型。根據一些實施例,基于干擾曲線記錄可以適用語音識別處理的變型。在適用操作中,監督的學習可以用來適用或改變信號修改參數(例如,濾波器參數或其他參數),適用或訓練聲學模型變換矩陣,適用或改變使用哪個預訓練的聲學模型,或適用語音對話系統的其他特征。在適用操作中,信號修改參數的效果例如可以通過確定在識別言語中(例如,字,句,以及言語的其他部分)的語音識別系統的ASR或其他部件的成功或有效性進行監控或測量。基于該測量,信號修改參數例如可以適用或改變以改進語音識別和語音對話系統的功能或成功。在一個示例中,基于給定組的噪音類型參數和噪音水平參數可以應用以給定組濾波器參數操作的預定濾波器(例如,Weiner濾波器,梳狀濾波器,或其他的濾波器)。基于噪音類型參數和噪音水平參數,適用模塊例如可以測量以給定組參數操作的濾波器在增強或改進語音識別中是如何有效或成功的。基于該測量,濾波器參數可以適用或改變以改進或增強語音識別。可以適用其他的信號修改參數。在一些實施例中,干擾曲線記錄(例如,噪音類型參數,噪音水平參數,和/或其他的參數)可以由文本至言語,音頻處理,或其他模塊或方法進行使用以增強言語提示或語音對話,音頻輸出,或典型地至乘客的其他的音頻信號輸出。基于噪音類型參數,噪音水平參數,和/或其他的參數,音頻處理模塊或其他的系統例如可以增加或減小提示水平,成形或重新成形提示頻譜,修改提示程度,或以其他方式改變提示。音頻處理模塊例如可以增加音頻輸出音量水平,成形或重新成形音頻頻譜(例如,音頻重放頻譜),修改音頻重放程度,和/或以其他方式改變音頻或聲音。基于噪音類型參數,噪音水平參數,和/或其他參數,文本至言語模塊或其他系統例如可以修改或改變言語速率,音節持續時間,或其他的言語相關的參數。根據一些實施例,可以適用基于干擾曲線記錄的言語提示,音頻輸出,或其他音頻信號輸出的修改。在適用操作中,監督的學習可以用來適用或改變與增加或降低提示水平相關的參數,用于成形或重新成形提示頻譜的參數,用來修改提示程度的參數,和/或其他參數。在適用操作中,可以測量用來增加或降低提示水平的參數,用來重新成形提示頻譜的參數,用來修改提示程度的參數,和/或其他參數的效果。言語或音頻提示的實質或內容可以改變。基于測量,可以適用或改變用來增加或降低提示水平的參數,用來重新成形提示頻譜的參數,用來修改提示程度的參數,和/或其他參數以改進或增強提示或音頻輸出功能。在一些實施例中,干擾曲線記錄(例如,噪音類型參數,噪音水平參數,和/或其他參數)例如可以通過對話控制模塊或其他系統或方法使用以增強車輛乘員與語音對話系統的互動。語音對話控制模塊或其他系統例如可以基于噪音類型參數,噪音水平參數,和/或其他參數修改對話控制,介紹提示(例如,介紹性的提示),修改音頻提示,修改輸出言語的實質或內容,修改對話類型,收聽并且響應使用者混淆,修改多種形式對話,修改后端應用功能,和/或執行其他操作。根據一些實施例,可以適用基于干擾曲線記錄的語音對話控制的修改。在適用操作中,監督的學習可以用來適用或改變在對話控制中使用的參數,提示介紹,提示修改,對話類型修改,使用者混淆響應,多種形式對話修改,后端應用功能修改,和/或其他的操作。在適用操作中,可以測量在對話控制中使用的參數,提示介紹,提示修改,對話類型修改,使用者混淆響應,多種形式對話修改,后端應用功能修改,和/或其他的操作的效果。基于測量,可以適用或改變在對話控制中使用的參數,提示介紹,提示修改,對話類型修改,使用者混淆響應,多種形式對話修改,后端應用功能修改,和/或其他的操作以改進或增強語音對話系統功能。根據本發明的實施例的語音對話系統或方法通過基于精確定時的或實時的車輛聲音相關的信息,噪聲特性的預先理解,以及其他信息,修改或改變自動語音識別,音頻提示,對話控制和/或其他操作,可以是尤其有用的。附加地,用來修改或改變自動語音識別,提示,對話控制和/或其他操作的參數可以適用或改變以在語音對話系統的整個壽命中改進語音對話系統的功能。通過本發明的實施例可以實現其他的和不同的優點。圖1是根據本發明的實施例的具有自動語音識別系統的車輛的示意圖。車輛10(例如汽車,貨車,或其他車輛)可以包括或連接到語音對話系統100。一個或多個麥克風20可以與系統100相關聯,并且麥克風20可以接收或記錄對話,環境噪聲,車輛噪聲,音頻信號及其他聲音。麥克風20可以位于車艙22內部,車艙22外部,或在其他位置。例如,一個麥克風20可以位于車艙22內部并且可以接收或記錄言語,非言語相關的聲音,噪音,和/或車艙22內部的聲音。非言語相關的聲音可以包括例如車輛10相關的噪音(例如,發動機噪音,加熱通風與制冷(HVAC)系統噪聲等),非車輛相關的噪音(例如,車輛外部的噪音),音頻系統聲音(例如,音樂,廣播相關聲音),以及其他聲音。一個或多個外部麥克風24例如可以位于車艙22的外部(例如,在車身,保險杠,車尾行李箱,擋風玻璃或其他位置上)。一個或多個傳感器可以附著于車輛10或與車輛10相關聯。窗戶位置傳感器60,發動機每分鐘轉速(RPM)傳感器26,車速傳感器28 (例如,車速表),HVAC傳感器30 (例如,HVAC風扇設置傳感器),音頻水平傳感器32(例如,音頻系統音量水平),外部麥克風24,以及諸如風擋刮水器傳感器的其他或不同的傳感器可以測量聲音相關的車輛信息,車輛參數,車輛狀態,車輛外部的噪音,或車輛相關信息。聲音相關的車輛信息或干擾聲音信息可以例如經由有線鏈接50 (例如,數據總線,控制器區域網(CAN)總線,Flexray,以太網)或無線鏈接傳輸至系統100。可以由系統100或其他系統使用聲音相關的車輛信息以確定表不聲音相關的車輛信息的干擾曲線記錄(例如,噪聲曲線記錄)或其他數據。可以使用其他或不同的傳感器或信息。在本發明的一個實施例中,語音對話系統100可以是或可以包括安裝在儀表板上或車輛的控制臺中,客艙22中,或車尾行李箱中的計算裝置。在替換的實施例中,語音對話系統100可以位于車輛的其他部分中,可以位于車輛的多個部分中,或可以具有遠程定位的全部或部分其功能(例如,在遠程服務器中或諸如移動電話的便攜式計算裝置中)。語音對話系統100例如可以執行一個或多個輸出語音對話或音頻提示至車輛乘客并且輸入表示來自車輛乘客的言語的音頻信息。根據一些實施例,揚聲器,麥克風,電聲換能器,耳機,或其他裝置40可以響應于聲音命令,語音響應,音頻命令,音頻警告,信息請求,或其他音頻信號輸出,廣播,或傳輸音頻提示或語音對話。至聲音命令的音頻提示和/或響應例如可以響應于來自車輛乘客的言語命令,請求,或應答輸出。提示例如可以包括關于系統100功能,車輛功能的信息,來自使用者(例如,車輛乘客)的問題請求信息,由使用者請求的信息,或其他信息。在一些實施例中,提示和語音輸入可以以其他方式在車輛中使用。在一些實施例中,顯示器,屏幕,或其他圖像或視頻輸出裝置42可以輸出信息,警告,視頻,圖像或其他數據至車輛10中的乘客。顯示器42上顯示的信息例如可以響應于來自車輛10中的駕駛員或其他乘客的信息請求而顯示。在一些實施例中,車輛10可以包括與麥克風20分開或相關聯的輸入裝置或區域44。輸入裝置或觸覺裝置44例如可以是觸摸屏,鍵盤,指針裝置,轉向信號或其他裝置。輸入裝置44例如可以用來使能,停用,或調整語音對話系統100的設置。盡管論述了各種傳感器和輸入,在某些實施例中可以僅使用傳感器或輸入的子集(例如,一個或其他數目)。圖2是根據本發明的實施例的語音對話系統的示意圖。語音對話系統100可以包括一個或多個處理器或控制器110,存儲器120,長期存儲器130,輸入裝置或區域44,以及輸出裝置或區域42。輸入裝置或區域140與輸出裝置或區域150例如可以組合成可以是系統100的一部分的觸屏顯示器和輸入。系統100可以包括一個或多個數據庫150,其可以包括例如聲音或聲學相關的車輛信息160 (例如,干擾聲音信息),干擾曲線記錄(IPR)180,語音對話系統實體170,以及其他信息。聲音相關的車輛信息160例如可以包括車輛參數,記錄的聲音,和/或其他信息。數據庫150例如可以包括干擾曲線記錄180 (例如,噪聲類型參數、噪聲水平參數,和/或其他信息),噪聲曲線,噪聲曲線記錄,和/或表示車輛參數和/或其他信息的其他數據。數據庫150可以全部或部分地存儲在存儲器120,長期存儲器130的一個或兩者中,或其他裝置中。處理器或控制器110例如可以是中央處理器(CPU),芯片,或任意適當的計算或計算機裝置。處理器或控制器110可以包括多個處理器,并且可以包括通用處理器和/或諸如圖形處理芯片的專用處理器。處理器Iio可以執行例如存儲在存儲器120或長期存儲器130中的代碼或指令以實施本發明的實施例。存儲器120可以是或可以包括,例如,隨機存取存儲器(RAM),只讀存儲器(R0M),動態RAM (DRAM),同步DRAM (SD-RAM),雙數據率(DDR)存儲芯片,閃速存儲器,易失性存儲器,非易失性存儲器,超高速緩沖存儲器,緩沖器,短期存儲器單元,長期存儲器單元,或其他適當的存儲器單元或存儲單元。存儲器120可以是或可以包括多個存儲器單元。長期存儲器130可以是或可以包括,例如,硬盤驅動器,軟盤驅動器,光盤(⑶)驅動器,可錄式光盤(⑶-R)驅動器,通用串行總線(USB)裝置或其他適當的可移動的和/或固定的存儲單元,并且可以包括多個這樣的單元或這樣的單元的組合。圖3是根據本發明的實施例的語音對話系統的方框圖。圖3的系統例如可以是圖2的系統的一部分,或其他系統的一部分,并且可以將其功能由圖2的系統,或由其他系統執行。圖3的系統的部件例如可以是專用硬件部分,或可以是由處理器110執行的全部或部分代碼。麥克風20或其他輸入裝置可以接收,記錄或測量車輛中聲音,噪音,和/或言語。聲音可以包括言語,言語命令,語音命令或來自車輛10中的乘客的其他表示。麥克風20可以將包括言語命令的表不輸入聲音的音頻信號或信號200傳輸或發送至系統100,語音識別系統或處理201,或其他模塊或系統。語音識別系統或處理201例如可以包括信號處理器202(例如,語音識別前端),語音識別模件204,以及其他系統或模塊。包括言語命令的表不輸入聲音的音頻信號200可以輸出到與系統100相關聯的自動語音識別系統201,信號處理器或信號處理或增強裝置,適用模塊,或其他裝置。信號處理器202例如可以接收音頻信號。信號處理器202例如可以濾波,放大數字化,或以其他方式轉換信號200。信號處理器202可以傳輸信號200至語音識別模件或裝置204。自動語音識別(ASR)模塊或語音識別模件204可以摘錄,識別,或確定來自信號200的字,句,語言,語音,或聲音模式。字可以通過例如將音頻信號與聲學模型,列表,或公知的字,語音和/或句的數據庫進行比較而摘錄。基于比較,基于最高的相似性和/或匹配的可能性,可能識別的字或句可以排序。ASR模塊204可以將表示識別的字或句的信號200輸出或傳輸至語義解釋器206。根據一些實施例,車輛乘客可以輸入命令或信息至輸入裝置44。輸入裝置44可以傳輸或輸出表不命令或信息的信號至觸覺輸入識別模塊208。觸覺輸入識別模塊208可以識別,解碼,摘錄,或確定信號中或來自信號的字,句,語言,或語音。觸覺輸入識別模塊208例如可以通過將來自輸入44的信號與字,句,語言,或語音的統計的模型,數據庫,詞典或目錄相比較以識別信號中的字,句,語言,或語音。觸覺輸入識別模塊208可以將表示識別的字或句的信號輸出或傳輸至語義解釋器206。觸覺信號例如可以與來自語義解釋器206中的ASR模塊204的信號合并或進行比較。根據一些實施例,語義解釋器206可以確定來自ASR模塊204,觸覺輸入識別模塊208和/或其他裝置或模塊的信號輸出中的字,句,語言或語音的含義。語義解釋器206例如可以是分析程序(例如,語義分析程序)。語義解釋器206例如可以將識別的字串與可以表示含義的對話動作進行映射。對話動作例如可以參看應用的實體(例如,應用實體的部件)。例如,使用者可以提供言語命令或字串(例如“為我尋找酒店”)并且語義解釋器206可以分析或映射字串至對話動作(例如,信息(類型=酒店))。語義解釋器206例如可以使用一種模型,其涉及字至應用實體(例如,應用實體中的對話動作)。模型例如可以被歸入語音識別語法(例如,數據庫150,存儲器120,或其他位置中)和/或其他位置。語音識別模塊204可以識別聲明中的字并且傳輸表示字的信號至語義解釋器206。對話動作,表示言語命令的信息,和/或其他信息或信號可以輸出到對話控制模塊210。在一些實施例中,對話控制模塊210可以產生,計算或確定至對話動作的響應。例如,如果對話動作是信息請求(例如,信息(類型=酒店)),對話控制模塊210可以確定至提供信息的請求的響應(例如,酒店的位置),請求進一步信息的響應(例如,“你的價格范圍是多少? ”),或其他響應。對話控制模塊210可以結合或關聯后端應用212運作。后端應用212例如可以是數據搜索(例如,搜索發動機),導航,立體聲或廣播控制,音樂檢索,或其他類型的應用。根據一些實施例,反應發生器或響應生成模塊214例如可以接收來自對話控制模塊210的響應信息。響應生成模塊214例如可以公式化或產生文本,短語,或字(例如,公式化句子),用于輸出到車輛乘客的響應。可視示意模塊216可以通過響應生成模塊214產生顯示文本響應輸出的圖像,系列圖像,或視頻。可視示意模塊216可以輸出圖像,系列圖像,或視頻至顯示器44或其他裝置。文本至言語模塊218可以轉換來自響應生成模塊214的文本至言語,音頻信號輸出,或可聽信號輸出。語音信號可以從文本至言語模塊218輸出至音頻信號處理器220。音頻信號處理器220可以從數字至音頻轉換信號,放大信號,解壓縮信號,和/或其他修改或轉變信號。音頻信號可以輸出到揚聲器40。揚聲器40可以廣播響應至車輛乘客。干擾曲線模塊222可以接收聲音相關的車輛信息160,車輛參數,接收的聲音信號,和/或來自數據總線50或其他源的表示一個或多個聲音的其他信息。在一些實施例中,數據總線50可以傳輸或轉換聲音相關的車輛信息160至與語音對話系統100相關聯的干擾曲線模塊222或與系統100相關聯的其他模塊或裝置。干擾曲線記錄(IPR)ISO可以基于聲音相關的車輛信息160通過干擾曲線模塊222產生,確定或計算。干擾曲線記錄180可以包括噪聲水平參數(例如,聲音強度參數),噪聲或聲音類型參數,和/或其他信息。基于聲音相關的車輛信息160,接收的聲音,和/或表示聲音或噪音的其他信息,可以確定噪聲水平參數,噪聲類型參數、和/或其他參數。例如,聲音相關的車輛信息160可以表示或表明加熱,通風,和空調(HVAC)系統風扇打開并且以高設置在操作。例如可以產生包括風扇的噪聲類型參數(例如,噪聲類型=風扇)以及高噪聲水平參數(例如,噪聲水平=高)的IPR 180以表示指示HVAC風扇在高設置的聲音相關的車輛信息160。可以產生包括噪聲類型參數,噪聲水平參數,以及其他參數的其他參數的其他IPR 180。噪聲水平參數和噪聲類型參數可以表示車輛中的噪音或聲音或車輛中類似存在的噪音或聲音,但典型地不包括實際噪音或聲音的音頻信號或記錄。根據一些實施例,基于噪聲水平參數,噪聲類型參數,和/或其他參數,修改模塊或步驟224可以改變或修改音頻信號200,濾波器噪音,和/或以其他方式修改自動語音識別。在一些實施例中,通過應用濾波器至音頻信號200,確定在語音識別中使用的聲學模型,和/或以其他方式增強信號處理202,語音識別204,或語音識別步驟或處理,修改模塊224可以修改音頻信號200。根據一些實施例,干擾曲線記錄例如可以通過文本至對話218,音頻處理220,或其他模塊或方法進行使用以增強從系統100輸出的音頻言語提示,聲頻輸出,或其他聲音或廣播。文本至對話218參數或輸出可以通過增加或降低言語速度,增加或降低音節持續時間,和/或以其他方式修改從系統100的言語輸出(例如,經由揚聲器40)可以進行修改。基于干擾曲線記錄(例如,噪聲類型參數,噪聲水平參數,及其他參數)可以修改與音頻處理220相關的參數(例如,提示水平,提示頻譜,音頻重放,或其他參數)。來自系統的音頻輸出例如可以通過增加提示水平(例如,音量),改變提示音高,成形或重新成形提示頻譜(例如,以增加信號噪音比),增強音頻重放(例如,立體聲重放),和/或以其他方式增強或改變來自系統100的聲頻輸出(例如,經由揚聲器40)而修改。可以使用文本至言語218,音頻處理220,和/或其他類型言語提示或聲頻輸出修改224的組合。例如,可以使用Lombard類型或其他類型的言語修改。Lombard類型修改例如可以以人在喧吵環境下,具有背景噪聲的環境下,或在溝通很困難的設置中的對話為模型。Lombard類型修改例如可以使用音頻處理220,文本至言語218,或其他模塊和/或操作修改音頻頻譜,音高,言語速度,音節持續時間及其他音頻特性。根據一些實施例,基于噪聲水平參數,噪聲類型參數,和/或其他參數,可以修改和/或改變對話控制210或與言語對話系統100相關聯的其他系統或處理。例如通過實施或利用澄清動作(例如,詢問使用者輸入的清楚的確認,以重復輸入,或其他澄清),確定并且輸出介紹的音頻提示(例如,在窗戶下降,高發動機RPM,或基于其他車輛參數時聲音識別可能困難,提示使用者使用輸出言語),修改提示(例如,控制提示的速度或定時),修改對話類型(例如,提示使用者單一的軌跡或簡單的信息而不是復雜信息,強制使用精確的短語,避免混合的主動以及其他修改),監控并且響應使用者混淆,和/或以其他方式修改對話控制210,對話控制210可以修改或改變(例如,通過修改模塊224)。在一些實施例中,多種形式對話(例如,結合觸覺,視覺或其他對話的語音對話)例如可以修改(例如,通過修改模塊224)。例如,通過在言語提示上恢復成,評價,或證實可見顯示,通過還原為系統假設的可見顯示(例如,對于信息以及其他提示的問題,請求),提示或請求來自使用者的觸覺確認(例如,提示使用者從顯示在觸摸屏或其他輸出裝置上的響應的清單中選擇響應),鼓勵使用者觸覺形式(例如,減少與語義解釋器206相關聯的信任水平),基于應用功能的子集的其他形式從言語切換(例如通過觸覺裝置的簡單命令和控制),或其他修改,多種形式對話可以修改。基于干擾曲線記錄可以修改后端應用功能(例如,通過修改模塊224)。例如,后端應用服務或特征的功能可以鎖定,減少,或以其他方式修改(例如,鎖定語音搜索,允許廣播控制,以及其他服務)。圖4是根據本發明的實施例的自動語音識別系統的方框圖。根據一些實施例,干擾曲線模塊222可以接收聲音相關的車輛信息160,例如包括或表示來自數據總線50的車輛參數以及其他信息。車輛參數例如可以包括窗戶位置(例如,打開或關閉,打開一定量等),發動機設置(例如發動機每分鐘轉數(RPM )),車輛速度,HVAC風扇設置(例如,關閉,低,中,高),音頻重放水平,或其他車輛相關參數。根據一些實施例,干擾曲線模塊222可以接收來自麥克風的聲音相關的車輛信息160 (例如,外部麥克風24,內部麥克風20,或其他麥克風)。在一些實施例中,來自麥克風的聲音相關的車輛信息160可以包括非言語相關的聲音,車輛相關的聲音,非車輛相關的聲音,基礎結構聲音,風噪音,路面噪音,來自車艙外的人的言語,環境聲音。干擾模塊222例如可以基于聲音相關的車輛信息160產生干擾曲線記錄(IPR) 180。干擾曲線記錄180例如可以是表格,數據集,數據庫,或其他組信息。每個IPR 180例如可以是聲音相關的車輛信息160 (例如,車輛參數以及其他聲音或信息)的表現。例如IPR 180可以包括噪音水平參數304 (例如,聲音強度參數),噪音類型參數306 (例如,聲音類型參數或噪音分類參數),以及表示聲音相關的車輛信息160的其他參數。在一些實施例中,噪音水平參數304,噪音類型參數306,以及其他參數可以表示聲音相關的車輛信息160的種類的組合(例如,車輛參數,接收的聲音,和/或其他聲音或信息)。包括噪音水平參數304,噪音類型參數306,和/或其他參數的IPR 180例如可以表示實時的,連續的,或在預定時間段的車輛參數(例如,發動機RPM,HVAC風扇設置,窗戶位置等)或車輛相關的聲音。當語音對話系統100啟動,車輛在任何時間通電,或在其他時間,干擾曲線記錄180例如可以連續,實時產生。
噪音類型參數306例如可以是表示或源自包括車輛參數(例如,發動機RPM,窗戶位置,HVAC風扇設置,車輛速度,音頻重放水平,以及其他參數)的聲音相關的車輛信息160和/或其他信息的分類,歸類,標簽,標記,或信息。基于接收自CAN總線50的信號(例如,聲音相關的車輛信息160),噪音或聲音類型參數306例如可以確定,產生,或分配。接收自CAN總線50的信號例如可以表示或包括聲音相關的車輛信息160,其可以表示車輛參數(例如,車輛窗戶位置,發動機RPM,車輛速度,HVAC風扇設置,音頻重放水平,以及其他參數)和/或其他信息。噪音類型參數306例如可以表示車輛參數,預先限定的車輛參數的組合,或接收自CAN總線50的其他信息。例如,如果信號接收自CAN總線50顯示發動機RPM高于閾值RPM值,發動機的噪音類型參數306 (例如,噪音_類型=發動機)可以產生或分配。例如,經由CAN總線50接收的顯示HVAC系統在某設置的信號可以導致風扇的噪音或聲音類型參數306的產生或分配(例如,噪音_類型=風扇)。例如,顯示窗戶打開的聲音相關的車輛信息160可以導致窗戶的噪音類型參數306的分配(例如,噪音_類型=窗戶)。可以使用其他的噪音類型參數306確定,分配,以及分類。噪音水平參數304例如可以源自于車輛參數(例如,包括風扇刻度或輸入設置,HVAC系統設置,發動機RPM,車輛速度,音頻重放水平,和/或其他的車輛參數)。噪音水平參數304例如可以是聲音水平(例如,聲音分貝水平(dB))的表示或聲音水平或特征的其他測量。噪音水平參數304例如可以是低,中,高或其他參數并且可以表示或定量聲音強度的范圍。在一些實施例中,干擾曲線記錄180 (例如,噪音水平參數304以及噪音類型參數306)可以使用邏輯(例如,使用度量或閾值),數學方法,表格(例如查找表),或其他操作確定,產生,或計算。例如,如果聲音相關的車輛信息160顯示發動機RPM高于預定閾值,可以確定或產生發動機的噪音類型參數306 (例如,噪音_類型=發動機)以及高的噪音水平參數304 (例如,噪音_類型=高)。例如,如果來自數據總線的車輛參數顯示HVAC風扇在高設置,可以分配等于風扇的噪音類型參數306 (例如,噪音_類型=風扇),高的噪音水平參數304(噪音_水平=高),和/或其他的參數。可以使用其他的操作。典型地,噪音類型參數是從清單,例如,發動機,窗戶打開,風扇,風,音頻,音頻等中選出來的離散參數。然而,可以使用其他的噪音類型參數。噪音類型參數和噪音水平參數典型地不包括關于產生的實際噪音的錄音或其他的直接信息。在一些實施例中,多種類型的聲音相關的車輛信息160的組合(例如,車輛參數,測量的聲音,以及其他聲音或信息)在一些實施例中可以以邏輯操作和/或其他的數學操作使用以確定或計算干擾曲線記錄180 (例如,噪音水平參數304和噪音類型參數306)。例如,如果來自數據總線的聲音相關的車輛信息160顯示車輛速度大于閾值速度(例如,70英里/小時(mph)或其他速度)以及窗戶位置超過閾值(例如,超過25%打開或其他閾值),可以確定,分配,或產生高的噪音水平參數304 (例如,噪音_水平=高)和等于風的噪音類型參數306 (例如,噪音_類型=風)。可以使用其他的閾值和參數。在一些實施例中,干擾曲線記錄180可以使用量化或其他操作確定,產生,或計算。聲音相關的車輛信息160,車輛參數,測量的聲音,或其他信息例如可以量化以確定噪音水平參數304值和噪音類型參數306值。例如,發動機RPM值可以量化為8位或其他大小的整數噪音水平參數304值。噪音水平參數304 (例如,8位整數表示發動機噪聲)例如可以包括與發動機特征相關的信息(例如,發動機基本的頻率和諧波)。音頻重放水平,例如可以量化為8位或其他大小的整數。每個8位整數例如可以表示干擾曲線記錄180(例如,噪音水平參數304)。可以使用其他的量化步驟。根據一些實施例,修改模塊或處理224可以基于干擾曲線記錄180修改音頻信號200,濾波器信號,以及改進語音對話系統100功能。在一些實施例中,修改模塊或處理224可以修改音頻信號200,濾波器噪音,音頻信號200的修改特征,和/或以其他方式獨立于語音識別裝置300 (例如,在語音識別204之前),依賴于語音識別302 (例如,在語音識別204期間,使用例如ASR前端314),或在其他步驟或處理期間,改變聲音信號200。在一些實施例中,音頻信號200 (例如,來自麥克風20的輸出)可以獨立于語音識別模塊204或在語音識別模塊204中接收之前進行修改,濾波或改變。例如,系統100可以包括多個濾波器312 (例如,Weiner濾波器,梳狀濾波器,模擬,數字,被動,主動,離散時間,連續時間,以及其他類型的濾波器)并且每個濾波器312可以包括濾波器參數320。濾波器312例如可以存儲在存儲器120,數據庫150,長期存儲器130,或類似的存儲裝置中。每個濾波器312和濾波器參數320例如,可以最佳地用于濾波某些噪音水平參數304和噪音類型參數306。音頻信號200例如可以在信號處理202期間修改和/或改變。音頻信號200可以基于干擾曲線記錄180 (例如,噪音類型參數306和噪音水平參數304)在信號處理202期間修改。基于噪音類型參數306,修改模塊310例如可以確定濾波器312 (例如,Weiner濾波器,梳狀濾波器,低通濾波器,高通濾波器,帶通濾波器,或其他類型的濾波器)或其他模塊或裝置以濾波,限制,或減少干擾噪音。濾波器參數322 (例如,頻率,振幅,諧波,調音,或其他參數)例如可以基于噪音水平參數304確定。濾波器312可以應用到信號處理器202或在其他模塊或步驟中的輸入信號,音頻信號200,或其他類型的信號中。根據一些實施例,如果IPR 180顯示風噪音(例如,噪音_類型=風)可能存在,可以通過信號處理器202應用濾波器312 (例如,Weiner濾波器)以濾波或減少音頻信號200中的風噪音。在一些實施例中,Weiner濾波器參數320可以基于噪音水平參數304 (例如,噪音_水平=高,中,低,或關閉),噪音類型參數306,以及其他參數而確定。例如,修改模塊224可以包括預定的Weiner濾波器參數320以基于給定的噪音水平參數304在信號處理202期間應用。濾波器312 (例如,Weiner濾波器)應用后,信號中減少或限制了風噪音的音頻信號200例如可以輸出到自動語音識別(ASR)模塊204。根據一些實施例,如果IPR 180顯示可能存在發動機噪音(噪音_類型=發動機),在信號處理202期間可以應用時間改變的梳狀濾波器312以濾出發動機噪聲。隨時間變化的梳狀濾波器312參數例如可以基于噪音水平參數304 (例如,表示發動機噪音的8位整數)而確定。噪音水平參數304 (例如,8位整數表示發動機噪聲)例如可以包括與發動機特征相關的信息(例如,發動機基本的頻率和諧波)。基于噪音水平參數304,隨時間變化的梳狀濾波器312參數例如可以確定。隨時間變化的梳狀濾波器參數322例如可以確定從而梳狀濾波器與音頻信號200的發動機噪聲部分中的基本的頻率和諧波對齊。具有與音頻信號200的發動機噪音部分中的基本的頻率和諧波對齊的參數322的隨時間變化的梳狀濾波器參數322可以在聲音信號200轉換(例如,信號傅里葉變換)中衰減或減少發動機基本的頻率和諧波的強度。具有衰減或減少的基本的發動機頻率和振幅的信號200例如可以輸出到自動語音識別解碼器316中。自動語音識別解碼器316可以解釋音頻信號200中的言語,命令,或其他息。根據一些實施例,可以測量在增加的語音識別功能中基于噪音類型參數和噪音水平參數的語音識別修改的成功。基于該測量,可以適用成功的語音識別修改(例如,在學習或監督的學習操作期間)。根據一些實施例,使用給定干擾曲線記錄180 (例如,噪音類型參數306和噪音水平參數304)的濾波器參數322 (例如,Weiner濾波器,梳狀濾波器等)可以在制造期間,在適用處理320期間(例如,學習或監督的學習操作),或其他時間中限定。濾波器參數322例如,可以確定從而濾波器312在除去來自音頻信號200的噪音時最有效。在適用處理320期間,與信號200相關的信號200和IPR 180可以在系統100接收(例如,在適用模塊320處)。例如,信號200可以包括言語,噪音,以及可能的其他聲音。與信號200相關的干擾曲線記錄180例如可以在同時或大致同時接收信號200時并行地從數據總線50輸出。適用模塊320例如可以通過將信號200與(例如,用預定濾波器參數320操作的)來自濾波器312的信號輸出進行比較或使用其他方法測量在從信號200除去噪音時濾波器參數322如何有效(例如,基于IPR 180得出或確定)。在改進語音識別中成功或濾波器參數322可以使用其他的方法和/或度量進行測量。適用模塊320可以基于測量變化或適用濾波器參數322以更有效地從與給定IPR 180相關的信號200中除去噪音(例如,給定噪音類型參數306和噪音水平參數304)。適用步驟320例如可以是當車輛由駕駛員駕駛時或在其他時間并且濾波器參數322可以基于監督的學習或其他的方法適用時而執行。例如,在適用處理320期間,車輛可以在窗戶打開時以超過預定閾值速度駕駛并且高的噪音水平參數304和風的噪音類型參數306 (例如,噪音_類型=風)可以產生。在適用操作320期間,包括言語以及其他噪音(例如,車輛相關的噪音)的信號200可以在系統100處接收(例如,來自麥克風20)。適用模塊320例如可以測量在從信號200中除去噪音時濾波器參數322如何有效(例如,基于噪音類型參數306和噪音水平參數304)。在一些實施例中,通過將信號200與來自濾波器312的信號輸出進行比較(例如,用預先確定的濾波器參數320操作)或使用其他的方法,可以測量在從信號200中除去噪音時濾波器參數322如何有效。與噪音類型參數306和噪音水平參數304相關的濾波器參數322例如可以適用或改變為更有效的濾波器或從信號200中除去噪音。在一些實施例中,如果在從信號中除去噪音時測量的濾波器參數322是有效的或成功的,與噪音類型參數306和噪音水平參數304相關的濾波器參數322可以不改變或適用。濾波器參數322的成功或有效例如可以通過估計給定濾波器參數322的語音識別204的性能或功能而確定。可以使用其他的方法和度量。根據一些實施例,修改模塊310可以修改語音識別模塊204中的模塊和/或裝置內的音頻信號200。音頻信號200,例如可以從麥克風20或類似裝置接收并且可以包括來自車輛乘員(例如,乘客,駕駛員等)的言語以及其他聲音(例如,背景噪音,車輛相關的聲音,以及其他聲音)。語音識別模塊204例如可以包括自動語音識別(ASR)前端314。基于IPR180,信號可以在ASR前端314修改以濾波出噪音(例如,風噪音,發動機噪音或其他類型的噪音)或以其他方式修改音頻信號200。濾波器312 (例如,Weiner濾波器)例如可以用于ASR前端314中的信號200以從音頻信號200中濾波出風噪音。該類型的濾波器312和濾波器參數322可以基于噪音類型參數306和噪音水平參數304確定。例如,車輛10可以在窗戶打開時以超過閾值速度的速度移動并且可以產生風的噪音類型參數306和高的噪音水平參數304。基于風的噪音類型參數306和高的噪音水平參數304,具有預定濾波器參數322的濾波器312 (例如,Weiner濾波器)可以應用到ASR前端314中的信號200中。根據一些實施例,自動語音識別模塊204可以包括聲學模型318。在聲音分析以解碼言語期間可以選擇在多個聲學模型318中的具體的以前產生的聲學模型,模型的選擇例如取決于干擾曲線記錄180 (例如,噪音水平參數304和/或噪音類型參數306)。聲學模型318可以是或可以包括表示音素,聲音,字,句或言語的其他元素以及它們相關的或典型的波形之間關系的統計模型(例如,Hidden Markov Model (HMM)統計模型或其他統計模型)。根據一些實施例,IPR 180 (例如,噪音水平參數304,噪音類型參數306,或其他參數)可以用來確定,選擇或挑選在語音識別操作中使用哪個聲學模型318。例如,IPR 180(例如,高的噪音水平參數304和窗戶的噪音類型參數306)可以顯示信號中高的窗戶噪音。修改模塊310可以基于顯不高的窗戶噪音的IPR 180,在一些聲學模型318中選擇或確定最適于解碼具有高的窗戶噪音的信號中的言語的聲學模型318。在適用操作320,制造,試驗,或其他時間期間,可以從言語采樣中適用,訓練或產生聲學模型318。基于噪音水平參數304和噪音類型參數306在適用操作320期間(例如,監督的學習操作)例如可以適用聲學模型318。適用模塊320例如可以測量聲學模型322(例如,基于IPR 180確定的)在從信號200中解碼言語時如何有效。可以測量在改進語音識別時聲學模型322 (例如,包括預定聲學模型變換矩陣)的成功以及基于測量可以適用聲學模型322。例如可以使用最大似然線性回歸或其他的數學方法適用聲學模型322以適用或者訓練結合預定噪音類型參數306和噪音水平參數304使用的聲學模型變換矩陣。例如,在適用或訓練操作期間,車輛10可以在窗戶打開的情況下以超過閾值速度駕駛。高的噪音水平參數304和風的噪音類型參數306 (例如噪音_類型=風)可以產生并且輸出至適用模塊320。言語以及其他噪音可以記錄(例如,由麥克風20)并且包括言語的信號200可以輸出到適用模塊320。可以測量基于風的噪音類型參數306 (例如,噪音_類型=風)和高的噪音水平參數304 (例如,噪音_水平=高)的解碼言語中的聲學模型318的成功。基于測量,使用最大似然線性回歸技術或其他的數學或統計方法可以產生或適用聲學模型變換矩陣。當產生顯示高的風噪音(例如,風的噪音類型參數306和高的噪音水平參數304)的干擾曲線記錄180時,具有適用的聲學模型變換矩陣的聲學模型318例如可以在隨后的系統100操作中使用。當車輛10由駕駛員駕駛的同時例如可以執行適用320 (例如,包括監督的學習),并且聲學模型318可以基于監督的學習改變或修改。最適合于在具有高的窗戶噪音的信號中解碼言語的聲學模型318例如可以在具有高的風噪音的監督的學習操作期間已經訓練或限定。圖5是根據本發明的實施例的增強語音對話音頻提示的方框圖。根據一些實施例,干擾曲線記錄180 (例如,包括噪音類型參數306和噪音水平參數304)可以用來修改音頻信號400 (例如,從系統100輸出)。干擾曲線記錄180 (例如,噪音類型參數306和噪音水平參數304)可以由文本至言語218,音頻處理220,或其他模塊或方法使用以提高言語提示,聲音輸出,或從系統100的廣播輸出。
根據一些實施例,修改模塊224可以基于干擾曲線記錄180 (例如,噪音類型參數306,噪音水平參數304,以及其他參數)修改與音頻處理220相關的參數(例如,提示水平,提示頻譜,提示程度,聲音型譜,音頻水平,或其他參數)。修改模塊224例如可以增加提示水平(例如,音量),改變提示頻譜,成形和/或重新成形提示頻譜(例如,增加信號噪音比),增強音頻重放(例如,立體重放),和/或以其他方式增強或改變從系統100的聲音輸出(例如,經由揚聲器40)。例如,如果噪音水平參數304顯示信號400中的噪音超過閾值水平(例如,dB水平),可以增加提示水平(例如,來自揚聲器40的輸出)音頻水平407。在一些實施例中,提示頻譜402例如可以修改,成形,或重新成形。提示可以是來自系統100的音頻或聲音輸出,例如,包括對車輛乘員的言語并且提示頻譜402例如可以是音頻頻譜,包括一定范圍的頻率,強度,聲音壓力,聲音能量,和/或其他聲音相關的參數。提示頻譜402例如可以修改,成形,或重新成形以增加車輛10中的信號噪音比(例如,在車輛內部中或在車輛乘員的附近)。提示頻譜402例如可以修改以增強或放大對應于來自車輛相關的聲音中高噪音能量(例如,發動機噪音,風噪音,風扇噪音,以及其他聲音)的頻譜部分中的提示頻譜402 (例如,頻率頻譜,能量頻譜,或其他類型的聲音相關的頻譜)。提示頻譜402例如可以放大具有高的噪音能量的頻譜的一部分以增加信號噪音比,其可以表示提示聲音水平(例如,從系統100的提示輸出)與車輛內部中的噪音水平(例如,發動機噪音,風噪音,HVAC風扇噪音,以及其他噪音)的比率。提示頻譜402例如可以使用音頻處理器模塊220,文本至言語模塊218,或其他系統或模塊進行修改。在一個實施例中,噪音類型參數306可以顯示發動機噪音(例如,噪音_類型參數=發動機)以及噪音水平參數304可以表示發動機噪音的水平。噪音水平參數304例如可以是發動機RPM的量化表現(例如,8位整數或表示發動機RPM的其他整數)。基于噪音水平參數304 (例如,發動機RPM的量化表示),修改模塊224可以放大或加強提示頻譜402的預定部分。例如,噪音類型參數306和噪音水平參數304可以對應于聲音頻譜的低頻率部分(例如,低于1000赫茲(Hz)或其他頻率)中的高噪音能量和頻譜的高頻率部分(例如,高于1000赫茲(Hz)或其他頻率)中的低噪聲能量。提示頻率頻譜402的低頻率部分(例如,低于1000赫茲或其他頻率)可以放大或加強以增加低頻率的提示與發動機噪音的比率。在一些實施例中,音頻頻譜404 (例如,來自立體聲,收音機或其他裝置)例如可以修改或重新成形。音頻頻譜404例如可以修改或重新成形以增加車輛中的音頻信號與噪音的比率。音頻頻譜404例如可以使用音頻處理模塊220和/或其他裝置或模塊進行修改。音頻信號404例如可以修改以加強或放大對應于來自車輛相關的聲音中高噪音能量(例如,發動機噪音,風噪音,風扇噪音,以及其他聲音)的音頻頻譜404的部分中的音頻頻譜404(例如,音頻頻率頻譜,音頻能量頻譜,或其他類型的聲音相關的頻譜)。音頻頻譜404例如可以放大具有高噪音能量的頻譜的一部分以增加信號噪音比,其可以表示車輛內部中的音頻(例如,來自揚聲器40的音頻輸出)與噪音的比率。根據一些實施例,音頻提示或音頻程度406可以基于干擾曲線記錄180修改或改變。提示或音頻程度406例如可以基于噪音類型參數306和噪音水平參數304修改以增加提示或音頻(例如,來自揚聲器40的輸出)的清晰度和/或可理解性。例如,噪音類型參數306可以顯示車輛10中風噪音的存在并且噪音水平參數304可以表示風噪音的水平(例如,風噪音的音量)。基于噪音水平參數304 (例如,低,中,高,或其他參數),可以改變(例如,使得更高或更低)提示或音頻程度406 (例如,與頻率相關)。提示或音頻程度406的改變例如可以取決于噪音水平參數306的比率或以其他方式與噪音水平參數306相關的。例如,在比柔軟的車輛噪音更大的車輛噪音存在時,提示或音頻程度406可以進一步改變(例如,與如果噪音水平參數304中或低相比,如果噪音水平參數304高,可以更高的改變)。在一些實施例中,基于噪音類型參數306和噪音水平參數304,提示或音頻程度306可以更低地減少或改變。根據一些實施例,修改模塊224通過增加或減少言語速率410,增加或減少音節持續時間412,和/或以其他方式修改從系統100的言語輸出(例如,經由揚聲器40)例如可以修改文本至言語218輸出。言語速率410例如可以基于噪音類型參數306,噪音水平參數304,和/或其他信息修改。言語速率410例如可以修改以減少高噪音條件中提示的言語速率410 (例如,如果噪音水平參數306更高或其他值)。降低言語速率410例如可以增加在大聲或高噪音環境(例如,在具有大聲的車輛相關的聲音的車輛中)中語音對話的可理解性。在一些實施例中,言語速率410可以基于噪音類型參數306和噪音水平參數304增加以增加來自系統100的語音對語話頻提示的可理解性。根據一些實施例,提示音節持續時間412例如可以基于噪音類型參數306,噪音水平參數304,和/或其他信息修改。提示音節持續時間412例如可以包括輔音,元音,和/或與人言語相關的其他音節的發音的持續時間。音節持續時間412例如可以取決于或相對于噪音水平參數304按比例增加。例如,音節持續時間412相對于由噪音類型參數306和噪音水平參數304表不的車輛相關的聲音(例如,發動機噪音,HVAC系統噪音,風噪音以及其他聲音)增加而增加(例如,音節發音的持續時間可以更長)。在一些實施例中,可以修改文本至言語218,音頻處理220,和/或其他類型的言語提示或聲頻輸出。修改模塊224例如可以使用Lombard類型或其他的言語修改。Lombard類型修改可以模擬人言語修改或在高聲環境,具有高背景噪音的環境,或其他高噪音水平環境中補償。Lombard類型修改例如可以包括從包括修改提示信號頻譜402,修改提示信號程度406,修改提示信號言語速率410,和修改提示信號音節持續時間412的組中選擇出的信號400修改的任何組合。Lombard類型修改例如可以取決于噪音類型參數306,噪音水平參數304,以及其他信息。例如,顯示高的風噪音可能存在時,風的噪音類型參數306(例如,噪音_類型=風)和高的噪音水平參數304可以產生。基于噪音類型參數306和噪音水平參數304,可以修改提示頻譜402,提示程度406,提示言語速率410,提示音節持續時間412,和/或其他提示參數的預定組合以增加提示的可理解性。在制造,試驗,適用320,或其他處理期間例如可以確定噪音類型參數306和噪音水平參數304的應用預定組合的給定組合。預定組合例如可以是最佳地增加言語提示的可理解性,可懂性或清晰度的組合。根據一些實施例,可以適用320提示修改以改進提示的清晰度和/或可理解性。與預定噪音類型參數306,噪音水平參數304,以及其他參數相關的提示修改224的有效性或影響進行測量和適用或可以基于測量進行改變。提示修改的有效性例如可以通過監控使用者或乘員對修改提示的響應進行測量。例如,提示可以基于噪音類型參數306,噪音水平參數304,和/或其他參數進行修改并且乘員對提示的響應可以測量。例如,提示可以引起或請求來自乘員的響應。如果乘員對提示不作出響應,以不可預知的方式對提示作出響應(例如,提供了混淆的響應),或執行其他動作,可以確定可以適用提示修改224以改進提示的清晰度。在一個示例中,提示修改224例如可以通過使得提示修改224停用而適用。例如,如果確定提示修改224不改進言語提示的清晰度或可理解性,可以停止或停用提示修改224(例如,提示修改模塊)。在一個示例中,提示修改224通過改變提示修改參數(例如,頻譜,程度,言語速率,音節持續時間,和/或其他提示修改參數)可以修改。例如,提示頻譜402修改參數可以適用或改變以改進言語提示的清晰度。提示頻譜402修改參數例如可以適合于加強或提高提示頻譜402的不同部分中的提示信號400。可以使用其他的適用方法。圖6是根據本發明的實施例的語音對話控制系統的方框圖。根據一些實施例,對話控制210或與語音對話系統100的其他系統或處理可以基于噪音類型參數304,噪音水平參數306,和/或其他參數進行修改或改變224。對話控制動作500可以基于干擾曲線記錄180(例如,噪音類型參數306,噪音水平參數304,和/或其他參數)進行修改224。對話控制作用500例如可以通過對話控制210模塊操作而執行并且可以包括提示輸出到使用者,與輸入或輸出確定相關的動作,或其他操作。對話控制作用500例如可以包括解釋動作502,減少語義解釋器信任水平504,以及其他處理或操作。對話控制動作500例如可以基于干擾曲線記錄180 (例如,噪音類型參數306,噪音水平參數304,和/或其他參數)通過實施解釋動作502進行修改。如果噪音類型參數306和噪音水平參數304顯示在車輛10附近(例如,在車艙)可能存在高噪音,解釋動作502例如可以實施或利用。根據一些實施例,解釋動作502可以包括使用者輸入的清楚的確認,音頻提示或詢問使用者重復輸入,或以其他方式提示使用者解釋輸入。請求使用者輸入的清楚確認的音頻提示508例如可以是輸出(例如,使用揚聲器40)。例如,使用者可以詢問(例如,輸入言語至語音對話系統請求信息)語音對話以尋找餐廳(例如,“最近的餐廳在哪里? ”)。如果噪音類型參數306和噪音水平參數304顯示存在高水平或噪音(例如,車輛相關的噪音或聲音的高水平),語音對話模塊210例如可以輸出使用者語句的提示請求確認。音頻提示508例如可以輸出,詢問使用者證實使用者正在尋找餐廳(例如,“你是否在說‘最近的餐廳在哪里? ’ ”)。如果噪音類型參數306和噪音水平參數304顯示可能存在背景噪音,當使用者輸入難以理解,或在其他時間時,每次使用者提供輸入時提示508可以輸出請求使用者輸入的清楚的確認。可以使用其他的解釋動作或提示。根據一些實施例,解釋動作502可以包括詢問或請求使用者重復輸入。對話控制模塊210例如可以輸出提示,請求使用者重復它們的輸入。例如,如果使用者詢問語音對話系統100去尋找最近的酒店(例如,“最近的酒店在哪里”)并且噪音類型參數306和/或噪音水平參數304顯示可能發生高噪音水平(例如,噪音_水平=高),提示可以輸出,請求使用者重復它們的輸入。提示508例如可以輸出,詢問使用者重復他們的語句(例如,“請重復”,“我沒有聽清楚,請重復”,或其他重復的請求)。如果噪音類型參數306和噪音水平參數304顯示可能存在背景噪音,當使用者輸入難以理解,或在其他時間時,每次使用者提供輸入時提示508可以輸出請求使用者重復他們的輸入。可以使用其他的解釋動作502。根據一些實施例,可以鼓勵解釋動作502和/或通過改變語義解釋器信任水平504(例如,通過減少信任水平504或以其他方式改變信任水平504)可以增加解釋動作502的可能性。信任水平504可以基于噪音類型參數306和噪音水平參數304進行改變或修改。信任水平504例如可以表示來自使用者的字串,短語,或其他言語輸入(例如,“為我找酒店”)與語音對話系統實體170中的對話動作相匹配或相對應(例如,通知(類型=酒店))的可能性或確定性。信任水平504例如可以是表示字串與語音對話系統實體170中的對話動作匹配的信任度,可能性,或概率的百分比,數值,或其他參數。信任水平504例如可以與由語義解釋器206產生的對話動作相關聯。對話動作和相關的信任水平504例如可以從語義解釋器206輸出到對話控制模塊210。對話控制模塊210例如可以基于對話動作和相關的信任水平504產生輸出到使用者的響應。例如,如果信任水平504低于閾值信任水平506,對話控制模塊504可以執行解釋動作502 (例如,請求使用者輸入的清楚的確認,請求使用者重復輸入,以及其他解釋動作)。如果與對話動作相關的信任水平504高于閾值信任水平506,對話動作可以視為使用者的輸入的正確解釋(例如,使用者的語音對話轉換為字串)并且對話控制模塊210例如可以產生響應,執行動作,或以其他方式響應于對話動作。根據一些實施例,從語義解釋器206輸出的信任水平504例如可以基于噪音類型參數306,噪音水平參數304,和/或其他信息進行修改或減少。例如,如果噪音水平參數304顯示可能存在車輛相關的噪音超過預定閾值(例如,噪音_水平=中,噪音_水平=高,或其他噪音_水平值),可以減少來自語義解釋器的信任水平504輸入。在一些實施例中,如果噪音類型參數306和/或噪音水平參數304顯示對高的噪音水平的緩和在車輛10中可能發生(例如,車輛客艙中),信任水平504例如可以從百分之九十(例如,90%)減少至例如百分之八十(例如,80%)或其他值。可以使用其他的信任水平504。信任水平504中的減少例如可以是非線性的。無論噪音類型參數306和/或噪音水平參數304顯示背景噪音是否可能存在,超過預定邊界信任水平的信任水平504例如可以不減少或改變。例如,當低于邊界閾值(例如,百分之九十五或其他值)的信任水平504可能減少的同時,超過邊界閾值(例如,百分之九十五或其他值)信任水平504 (例如,與對話動作相關的)可以不改變或減少。可以使用其他的邊界閾值。根據一些實施例,可以適用320給定干擾曲線記錄(例如,噪音類型參數306,噪音水平參數304,以及其他信息)的對話控制動作500的修改。例如,通過測量噪音類型參數306和/或噪音水平參數304與對話控制210成功或功能之間的相互關系,可以適用對話控制動作500 (例如,執行解釋動作502,減少信任水平504,以及其他修改)的修改。在適用處理320中例如可以確定給定干擾曲線記錄180的對話控制210的最佳修改。用于給定干擾曲線記錄180的對話控制的最佳修改可以是對使用者最少麻煩的和/或最佳改進系統100功能的修改。例如,噪音類型參數306與噪音水平參數304可以顯示高的風噪音可能存在并且語義解釋器信任水平504可以基于噪音類型參數306和噪音水平參數304修改224。可以測量具有修改的信任水平504的對話控制210功能(例如,對話控制210的成功或對話控制210成功)。基于對話控制210是否輸出對使用者輸入的適當的響應,例如可以測量對話控制210功能或成功。例如,如果使用者輸入對最近加油站的位置的請求(例如,“最近的加油站在哪里? ”),對話控制210響應列出的加油站將被認為是對話成功而來自對話控制210的無關主題音頻提示508 (例如,“最近的餐廳是餐廳A和餐廳B”)輸出將不會認為成功。可以使用其他的成功測量方法。基于對話控制210功能或成功的測量,給定干擾曲線記錄180的對話控制動作500可以適用以改進對話控制210系統的功能。例如,當噪音類型參數306和噪音水平參數304顯示高的風噪音可能存在時,適用320可以確定解釋動作502 (例如,使用者輸入的清楚的確認,要求使用者重復輸入)比減少語義解釋器信任水平504更有效。例如,當噪音類型參數306和噪音水平參數304顯示高的發動機噪音可能存在時,適用320可以確定減少信任水平504 (例如,通過預定信任水平減少參數或量)對使用者是最有效和最少麻煩的。例如,對話控制動作500的修改224 (例如,實施解釋動作502,減少信任水平504,以及其他修改)例如可以適于使用給定組的噪音類型參數306和噪音水平參數304的最有效和最少麻煩的對話控制動作500。根據一些實施例,基于干擾曲線記錄180 (例如,噪音類型參數306,噪音水平參數304,以及其他信息)可以導入和/或修改音頻提示508。提示例如可以包括來自系統100的信息輸出并且可以響應于使用者輸入通過對話控制模塊210產生。提示508可以響應于使用者輸入從系統100典型地輸出以提供信息至使用者,或用于其他功能。在一些實施例中,提示508可以通知使用者由于高的背景噪音語音對話系統100功能和/或性能可能減少或改變。例如提示508可以基于噪音類型參數306和/或噪音水平參數304產生。提示508例如可以設置語音對話系統100性能的使用者的期望(例如,系統100性能可能減少),為使用者準備不同的交互作用類型(例如,通知使用者系統100可以請求使用者解釋語句,重復語句,并且執行其他的功能),或以其他方式通知使用者在背景噪音存在時系統100性能可能改變。噪音類型參數306和噪音水平參數304例如可以顯示高的風噪音。基于顯示高的風噪音的噪音類型參數306和噪音水平參數304,通過對話控制模塊210可以產生提示508并且輸出至使用者(例如,使用揚聲器40)。提示508例如可以設置具有高的風噪音的系統100性能的使用者期望。例如,提示可以是“請注意在高速時窗戶打開時聲音識別是困難的”或其他的提示508。基于提示508,使用者可以考慮關閉車輛窗戶以改進系統100性能。在一些實施例中,提示508可以基于為使用者準備的不同的語音對話交互作用類型的噪音類型參數306和噪音水平參數304。提示508例如可以是“聲音識別很困難,我可以請求進一步解釋,請原諒,你想去哪里? ”或其他提示。基于提示508,使用者的期望可以管理并且使用者例如可以準備或預先警告系統100可能輸出進一步解釋動作502 (例如,請求解釋,重復,以及其他解釋)和/或系統100功能可能修改(例如,補償背景噪音的高水平)。根據一些實施例,基于干擾曲線記錄180 (例如,噪音類型參數306,噪音水平參數304,以及其他信息)可以修改或控制提示508的速度和/或定時。提示508輸出的定時例如可以修改或推遲以在當低背景噪音(例如,車輛相關的聲音)可能存在于車輛10中時輸出提示508。例如,噪音類型參數306和噪音水平參數304可以顯示高的發動機噪音可能存在于車輛中(例如,噪音_類型=發動機并且噪音_水平=高)。高的發動機噪音的噪音類型參數306和噪音水平參數304例如可以顯示發動機RPM可能高(例如,駕駛員可能加速車輛10)。基于顯示高的發動機噪音的噪音類型參數306和噪音水平參數304,對話控制210可能延遲提示508輸出。對話控制210例如可以延遲提示508輸出,直到噪音水平參數304顯示發動機噪音可能減少為止。在一些實施例中,對話控制210可能在預定一段時間延遲提示508輸出。例如可以是車輛加速的典型的或平均時間量的預定一段時間可以基于典型的駕駛員特性(例如,典型的加速時間),或可能是其他時間段。典型的或平均加速時間例如可以在車輛試驗,制造期間,或在語音對話適用處理320期間確定。根據一些實施例,對話類型514可以修改以改變或減少語法困惑510或基于干擾曲線記錄180 (例如,噪音類型參數306,噪音水平參數304,和/或其他信息)。語法困惑510例如可以是在給定時間由語音識別模塊或裝置204使用的語音識別語法的復雜度。對話控制模塊210例如可以基于干擾曲線記錄180確定語法困惑。語法困惑510例如可以通過執行單個口識別,強制使用精確的措辭,避免混合的創造,和/或使用其他的技術或方法進行減少或修改。語法困惑510例如可以基于噪音類型參數306和噪音水平參數304減少或改變。例如,噪音類型參數306和噪音水平參數304可以顯示高的風噪音(例如噪音_類型=風,噪音_水平=高)可能存在。基于顯示高的風噪音的噪音類型參數306和噪音水平參數304,對話控制210可以通過執行單個口識別,強制使用精確的措辭,避免混合的創造,和/或執行其他的動作減少語法困惑510。單個口識別例如可以通過減少或修改復雜的提示而減少語法困惑510,該減少或修改復雜的提示請求多個口或類型的信息為請求減少數目或單個口的信息的多個較簡單的音頻提示。例如,“你喜歡聽什么音樂”的復雜的提示可以修改或簡化為多個單個口提示“請輸入音樂名稱”,后面跟隨“請輸入藝術家”和/或其他的提示。當然可以使用與其他主題相關的其他提不。在一些實施例中,通過強制使用來自使用者(例如,車輛乘員)的精確的措辭,可以修改對話類型514以減少語法困惑510。來自使用者的精確的措辭可以通過提示使用者提供精確的響應而不是一般的響應而強制使用。例如,其可能引起來自使用者的許多不同的響應的提示508 “你想要哪個服務”,可以修改為可以引出來自使用者的具體的或精確的措辭的“請說出一個:a.音樂,b.方向,c.氣候控制”的提示。如果噪音類型參數306和/或噪音水平參數304顯示車輛中可能存在高的噪音水平(例如,風,發動機,HVAC系統,音頻重放或其他噪音)對話控制模塊210可以強制使用來自使用者的精確的措辭。當然可以使用與其他追相關的其他提示。在一些實施例中,對話類型514可以通過減少混合的初始對話類型514進行修改以減少語法困惑510。混合的初始對話類型514例如可以允許使用者響應他們沒有問的問題。如果噪音類型參數306和/或噪音水平參數304顯示可能存在超過閾值的噪音水平,混合的創造例如可以停止或停用以減少語法困惑510。例如,對話控制210可以輸出請求一種信息的提示(例如,“你想尋找什么類型的酒店”),并且混合的創造可以允許使用者提供無關的主題響應(例如,“最近的餐廳在哪里? ”)。可以使用與其他主題相關的其他提示508。停止混合的創造例如可以需要使用者響應所問的問題,而不允許使用者改變話題主題。如果使用者提供與問題無關的主題響應,對話控制模塊210可以請求使用者響應所問的問題。根據一些實施例,可以適用320給定干擾曲線記錄180 (例如,噪音類型參數306,噪音水平參數304,以及其他參數或信息)的對話類型514的修改。對話類型514修改224(例如,改變語法困惑510或其他的對話類型修改)例如可以通過測量基于干擾曲線記錄180(例如,噪音類型參數306和/或噪音水平參數304)的對話類型514的修改與對話控制210成功或功能之間的相互關系而適用。可以確定用于給定干擾曲線記錄180的對話類型514或語法困惑510減少方法的最佳修改(例如,單個口識別,強制使用精確措辭,避免混合的創造,或其他語法困惑減少方法)。用于給定干擾曲線記錄180的對話類型514的最佳修改可以是對使用者最少麻煩,最改進系統100功能,和/或引起對話成功的修改。對話類型514的最佳修改例如可以通過測量在有和沒有對話類型514或語法困惑510的修改的情況下對話控制210成功而確定。可以比較與對話類型514或語法困惑510的不同類型的修改相關的測量的對話控制成功以確定最改進對話控制成功的對話類型514或語法困惑510的修改。例如,干擾曲線記錄180 (例如,噪音類型參數306和噪音水平參數304)可以顯示高HVAC相關的噪音可能存在并且語法困惑510可能基于干擾曲線記錄180減少或修改224。語法困惑510例如可以通過修改對話類型514以強制使用精確措辭而減少(例如,提示使用者從選項列表中選擇(例如,“請說一個:a.音樂,b.方向,或c.油”代替“你想要那種服務? ”))。可以測量具有精確措辭的強制使用(例如,減少的語法困惑510)的對話控制210成功(例如,對話控制系統210的成功)。對話控制210功能或成功例如可以基于使用者是否正確地完成對話動作(例如,響應于提示),使用者是否獲得正確的對話結果(例如,使用者發現他們尋找的東西),或基于其他的度量或參數而測量。具有精確措辭的強制使用(例如,減少的語法困惑510)的對話控制210成功(例如,對話控制系統210的成功)可以與沒有精確措辭的對話控制210成功或具有對話類型514或語法困惑510的其他類型的修改的對話控制成功210進行比較。例如,其確定基于某一干擾曲線記錄180 (例如,噪音類型參數306和噪音水平參數304)的一種對話類型514修改以減少語法困惑510 (例如,單個口識別)可以引起減少的對話控制成功或比另一種對話類型514修改和/或沒有修改以減少語法困惑510的更少成功。基于該確定,給定某一干擾曲線記錄180的一種對話類型514可能在增加對話成功中較少成功或不成功,該類型的對話類型514修改例如可以停止,適用,和/或由不同類型的對話類型514修改替代。例如,適用320可以確定當噪音類型參數306和噪音水平參數304顯示可能存在高的HVAC噪音或其他車輛相關的噪音時通過強制使用精確措辭減少語法困惑510可能比避免混合的創造更有效。例如,適用320可以確定當噪音類型參數306和噪音水平參數304顯示可能存在高的HVAC噪音時通過強制使用精確措辭減少語法困惑510可能對使用者最有效和最少麻煩。根據一些實施例,基于干擾曲線記錄180 (例如,噪音水平參數304,噪音類型參數306,以及其他信息)對話控制210可以監控(例如,收聽)并且響應使用者混淆516。如果噪音類型參數306和噪音水平參數304顯示在車輛10中或圍繞車輛10可能存在高的噪音水平,對話控制210例如可以修改以監控或收聽并且響應使用者的混淆516。為了監控并且響應使用者混淆516,對話控制210例如可以修改以識別來自使用者的解釋請求輸入。解釋請求(例如,由使用者說出)例如可以包括措辭,諸如“重復”,“我聽不見你”,“重復該提示”,“不清楚”,“什么? ”,或其他措辭。來自使用者的解釋請求例如可以由對話控制210響應。對話控制210例如可以通過重復最后的提示輸出,改述最后提示,或執行其他動作來響應來自使用者的解釋請求。提示508 (例如,“最近的餐廳是ABC飯館”或其他提示)例如可以通過改變提示508中措辭的順序而改述(例如,“ABC是最近的餐廳”)。可以使用其他的提示。根據一些實施例,基于干擾曲線記錄180 (例如,噪音類型參數306,噪音水平參數304,和/或其他信息)可以修改多種形式,多功能,或其他類型的對話。多種形式對話512例如可以包括結合觸覺,視覺的語音對話,或其他對話。多種形式對話512例如可以包括請求使用者輸入信息至觸覺裝置(例如,輸入裝置44或其他裝置)的語音對話音頻提示。可以使用其他類型的多種形式對話512。在一些實施例中,如果噪音類型參數306和噪音水平參數304顯示在車輛10中或圍繞車輛10可能存在高水平的噪音,多種形式的對話512例如可以通過恢復成或證實為在言語提示上的可見顯示,通過恢復成或切換為系統假設的可見顯示(例如,問題,請求信息,或其他提示),提示或請求來自使用者的觸覺確認(例如,從顯示在觸摸屏或其他輸出裝置上的響應列表中選擇響應),鼓勵觸覺形式的使用(例如,減少語義解釋器的信任),從言語切換到應用功能的子集的其他形式(例如,通過觸覺裝置的簡單命令和控制),或其他修改進行修改。基于噪音類型參數306和噪音水平參數304,對話控制模塊210例如可以通過顯示問題,詢問信息,以及輸出裝置42 (例如顯示屏)上其他類型的提示轉換成系統假設的可見顯示。例如使用者可以要求觸覺確認。對話控制210例如可以要求使用者使用觸覺裝置,輸入裝置44 (例如,鍵盤,觸摸屏,或其他輸入裝置)和/或其他裝置確認對話提示508 (例如,語音對話提示)或來自系統100的其他信息輸出進行響應。系統100例如可以使用揚聲器40,輸出裝置42,或其他裝置輸出語句“請通過輸入是確認你說過酒店”,并且使用者可以通過輸入響應(例如,按下按鈕,輸入“是”或其他的響應)至輸入裝置44或其他裝置提供觸覺確認。在一些實施例中,對話控制模塊210可以要求使用者從選項列表中選擇響應。例如,系統100可以提示使用者使用觸覺裝置,輸入裝置44 (例如,鍵盤,觸摸屏,或其他輸入裝置),和/或其他裝置從一列選項中選擇選項。系統100例如可以輸出提示“請在觸摸屏上選擇類別:酒店,餐廳,或加油站”并且使用者可以通過在觸覺裝置,輸入裝置44,和/或其他裝置上輸入選擇的選項(例如,酒店,餐廳,或加油站)而響應提示。根據一些實施例,修改模塊224例如可以通過改變語義解釋器信任水平504而鼓勵或增加觸覺對話的使用。例如如果信任水平504低于閾值信任水平506,對話控制模塊504可以請求觸覺確認,觸覺選擇,或來自使用者的其他類型的輸入。如果與對話動作相關的信任水平504高于閾值信任水平506,對話動作可以視為使用者輸入的正確解釋,并且系統100可以基于對話控制使用言語(例如,系統100可以不請求觸覺確認,觸覺選擇,或來自使用者的其他類型的輸入)。信任水平504例如可以基于干擾曲線記錄180 (例如,噪音類型參數306,噪音水平參數304,或其他信息)而減少。例如,如果干擾曲線記錄180 (例如,噪音水平參數304)顯示可能存在車輛噪音相關的噪音超過預定閾值(例如,噪音_水平=中,噪音_水平=高,或其他噪音_水平值),可以減少來自語義解釋器的信任水平504輸入。信任水平504例如可以是與語音識別中的確定性相關或取決于語音識別中的確定性的連續的值(例如,在0%與100%之間或其他數值范圍)。基于干擾曲線記錄180,信任水平504例如可以從第一信任水平值改變(例如,減小或增加)至第二信任水平值(例如,信任水平值小于第一信任水平值)。信任水平504例如可以根據函數(例如,連續函數)改變(例如,減少或增加)。如果噪音水平參數304顯示零或低背景噪音(例如,噪音水平參數=低),信任水平504例如可以是百分之九十五(例如,95%)或任意其他值。如果干擾曲線記錄180顯示降低至高噪音水平在車輛10中可能存在,信任水平504例如可以從第一值(例如,百分之九十五或其他值)例如減少至第二值(例如,百分之八十或其他值),其例如小于第一值。如果干擾曲線記錄180 (例如,噪音類型參數306和/或噪音水平參數304)顯示高的背景噪音,減少信任水平504可以增加對話控制210可請求觸覺確認,來自使用者的選擇或其他觸覺輸入的可能性。根據一些實施例,多種形式對話可以通過從言語至系統100功能(例如,預定后端應用212功能)的子集的其他形式(例如,觸覺輸入,視覺輸出,和/或其他形式)切換而修改。基于噪音類型參數306,噪音水平參數304,和/或其他信息,一個或多個后端應用212可以從基于言語的形式至非言語的言語形式(例如,觸覺或其他形式)進行切換。其他后端應用212例如可以不切換至非言語形式(例如,控制和/或命令可以保持基于言語)。例如,如果噪音類型參數306與噪音水平參數304顯示高的發動機噪音(例如,噪音_類型=發動機,噪音_水平=高),當其他后端應用212可不從言語切換至基于觸覺的控制的同時,預定后端應用212 (例如,收音機,地圖,語音搜索,或其他后端應用)功能(例如,控制和命令)可以從基于言語至基于觸覺的控制(例如,使用輸入裝置44)進行切換。例如,如果聲音類型參數306和/或聲音水平參數304顯示背景噪音,語音搜索和/或其他的后臺應用212可停止(例如,鎖定),并且基于言語的收音機控制和/或其他的后臺應用212可以不停止(例如,可保持工作)。如果在車輛試驗,制造期間,或適用320期間,聲音類型參數306和/或聲音水平參數304顯示背景噪音,例如可以確定哪個后端應用212切換至其他形式(例如,觸覺輸入或其他輸入模式)或停止。根據一些實施例,可以適用320給定干擾曲線記錄180 (例如,噪音類型參數306,噪音水平參數304,以及其他信息)的多種形式對話512的修改。通過測量噪音類型參數306和/或噪音水平參數304與對話控制210成功或功能之間的相關性,例如可以適用320多種形式對話512的修改224 (例如,恢復成可見顯示,請求觸覺確認,鼓勵觸覺形式的使用,從言語至應用功能子集的其他形式的切換,和/或其他修改)。適用320例如可以確定用于給定干擾曲線記錄180的多種形式對話512的最佳修改(例如,恢復成可見顯示,請求觸覺確認,鼓勵觸覺形式的使用,從言語至應用功能子集的其他形式的切換和/或其他修改)。用于給定干擾曲線記錄180的對話類型514的最佳修改可以是對使用者最少麻煩和/或最佳改進系統100功能的修改。多種形式對話512修改策略或方法的適用320可以類似于對話類型514修改策略的適用,對話控制動作500的適用,以及其他適用320處理或方法。在一些實施例中,可以適用基于噪音類型曲線306和噪音水平曲線304的對話控制210操作的全部類型的修改224。如在此討論的,修改224的類型,可以包括對話控制動作500的修改,音頻提示508的導入,提示508的修改,對話類型514的修改(例如,以減少語法困惑510),監控并且響應使用者混淆516,多種形式對話512的修改,后端應用212功能的修改,和/或其他類型的修改224。可以測量,估計,或計算基于噪音類型參數306和/或噪音水平參數304的對話成功與對話控制的修改之間的相關性。一種類型的對話控制210修改224的成功例如可以通過確定使用者是否對對話控制提示508提供了可預測的響應(例如,使用者是否響應了有關或無關主題),使用者是否提供了對提示508的任何響應,或使用其他方法進行測量或估計。基于測量的對話控制成功,通過停止,停用,改變或切換對話控制修改224的類型,或以其他方式改變對話控制修改224,可以適用對話控制210處理與操作的修改。對話控制修改224操作例如可以通過變化與給定噪音類型參數306與噪音水平參數304相關的參數而改變。例如,可以改變語義解釋器信任水平504,可以改變與提示的速度和定時相關的參數,可以改變或適用其他參數以改進對話控制210成功。可以適用或改變其他參數和操作。圖7是根據本發明的實施例的方法的流程圖。在操作600中,表示或對應于一個或多個聲音的聲音相關的車輛信息(例如,圖2的聲音相關的車輛信息160,或與產生或引起聲音的車輛系統的操作相關的信號或信息)可以接收在處理器中(例如,圖3的干擾曲線模塊222)。在一些實施例中聲音相關的車輛信息不包括音頻信號。干擾曲線模塊222例如可以由處理器110全部或部分地實施。操作610中,干擾曲線記錄(例如,圖2的干擾曲線記錄180)可以基于聲音相關的車輛信息確定。干擾曲線記錄可以包括噪音類型參數(例如,圖6的噪音類型參數306),噪音水平參數(例如,圖6的噪音水平參數304),和/或其他參數。干擾曲線記錄例如可以基于多種類型的與聲音相關的車輛信息使用邏輯操作或其他數學操作確定。在一些實施例中,干擾曲線記錄可以通過量化聲音相關的車輛信息(例如,車輛發動機RPM信息)確定。操作620中,與車輛相關聯的語音對話系統(例如,圖2的系統100)的語音對話(例如,在圖3的對話控制210和/或圖6的對話控制210中)基于聲音相關的車輛信息和/或干擾曲線記錄可以修改。語音對話例如可以通過利用解釋動作(例如,圖6的解釋動作502),確定和輸出導入提示(例如,圖6的提示508),修改提示的程度和定時,修改對話類型(例如,圖6的語法困惑510)以減小語法困惑(例如,圖6的語法困惑510),監控和響應使用者困惑(例如,圖6的使用者混淆516),修改多種形式對話(例如,圖6的多種形式對話512),和/或使用其他語音對話修改方法來修改。可以使用其他或不同系列的操作。本發明的實施例可以包括用于執行在此處描述的操作的裝置。這樣的裝置可以為所需目的特別地構造,或可以包括通過存儲在計算機中的計算機程序有選擇地啟動或重新配置的計算機或處理器。這樣的計算機程序可以存儲在計算機可讀或處理器可讀的非臨時存儲介質,包括軟盤,光盤,CD-ROM,磁性光盤的任意類型的盤,只讀存儲器(R0M),隨機存取存儲器(RAM),電可編程只讀存儲器(EPR0M),電可擦除和可編程只讀存儲器(EEPR0M),磁或光學卡,或適于存儲電指令的任意其他類型的介質。將要理解,各種編程語言可以用來實施在此處描述的本發明的教導。本發明的實施例可以包括物品,諸如非臨時的計算機或處理器可讀非臨時的存儲介質,例如存儲器,盤驅動器,或USB閃速存儲器編碼,包括或存儲指令,例如計算機可執行指令,當由處理器或控制器執行時使得處理器或控制器執行在此公開的方法。指令可以使得處理器或控制器執行實現在此公開的方法的處理。在此公開了不同的實施例。某些實施例的特征可結合其他實施例的特征;因此某些實施例可結合多個實施例的特征。為了示出和描述的目的,已經展現了本發明的實施例的上述描述。不旨在是排他的或將本發明限制為公開的精確形式。本領域技術人員應當理解,在上述教導下可做出許多修改,變化,替換,改變,以及等同形式。因此應當理解所附的權利要求旨在覆蓋落入本發明的真實精神內的全部這樣的修改和變化。
權利要求
1.一種方法,包括: 在與車輛相關聯的處理器中接收表不一個或多個聲音的聲音相關的車輛信息,聲音相關的車輛信息不包括音頻信號;以及 基于聲音相關的車輛信息修改與車輛相關聯的語音對話系統的語音對話。
2.如權利要求1所述的方法,包括基于聲音相關的車輛信息確定干擾曲線記錄。
3.如權利要求2所述的方法,其中基于聲音相關的車輛信息修改與車輛相關聯的語音對話系統的語音對話包括: 基于干擾曲線記錄確定導入音頻提示;以及 輸出導入音頻提示至使用者。
4.如權利要求2所述的方法,其中基于聲音相關的車輛信息修改與車輛相關聯的語音對話系統的語音對話包括: 基于干擾曲線記錄修改音頻提示的程度和定時;以及 輸出修改的音頻提示。
5.如權利要求2所述的方法,其中基于聲音相關的車輛信息修改與車輛相關聯的語音對話系統的語音對話包括: 基于干擾曲線記錄修改對話類型以減小語法困惑。
6.如權利要求2所述的方法,其中基于聲音相關的車輛信息修改與車輛相關聯的語音對話系統的語音對話包括: 監控使用者混淆;以及 輸出對使用者混淆的音頻提示響應。
7.如權利要求2所述的方法,其中基于聲音相關的車輛信息修改與車輛相關聯的語音對話系統的語音對話包括: 基于干擾曲線記錄修改多種形式對話。
8.如權利要求1所述的方法,包括: 在增加對話成功中基于聲音相關的車輛信息測量修改語音對話的成功;以及 基于測量的成功適用語音對話修改。
9.一種系統,包括: 存儲器; 與車輛相關聯的處理器,其用于: 在與車輛相關聯的處理器中接收表不一個或多個聲音的聲音相關的車輛信息,聲音相關的車輛信息不包括音頻信號;以及 基于聲音相關的車輛信息修改與車輛相關聯的語音對話系統的語音對話。
10.一種方法,包括: 在與語音對話系統相關聯的控制器接收與引起聲音的車輛系統的操作相關的信息; 基于信息計算干擾曲線記錄,干擾曲線記錄表示噪音類型和噪音水平;以及 基于干擾曲線記錄改變對話控制。
全文摘要
本發明涉及使用聲音相關的車輛信息以增強語音對話的方法和系統。具體地,可以在處理器中接收表示一個或多個聲音的聲音相關的車輛信息。聲音相關的車輛信息可以或可以不包括音頻信號。基于聲音相關的車輛信息與車輛相關聯的語音對話系統的語音對話可以被修改。
文檔編號G10L15/26GK103208287SQ201310018029
公開日2013年7月17日 申請日期2013年1月17日 優先權日2012年1月17日
發明者E.茨爾克爾-漢科克, O.尖霍尼 申請人:通用汽車環球科技運作有限責任公司