專利名稱:語音識別控制系統和語音識別控制方法
技術領域:
本發明涉及一種適合由操作者發出語音來控制電子設備的輸入/輸出的語音識別控制系統和語音識別控制方法。
具體來講,本發明提供了一種控制裝置,它對輸入操作者的語音與已寄存的語音識別表比較,并按照這種比較結果控制電子設備的輸入/輸出,其中當該電子設備連接到該控制裝置時,則寄存該電子設備的語音識別表,因此通過語音識別可以控制每一個可語音識別的電子設備的輸入/輸出。
隨著新近技術的發展,當前正在開發和推廣多種電子設備。為了達到簡化和輕松使用這些電子設備的目的,現在當務之急的開發任務是快速開發以提高可操作性,且通過例如語音識別操作電子設備的語音識別控制系統,來加速這樣的開發任務。該語音識別控制系統的作用在于根據操作者發出語音來操作電子設備,與公知的手動操作比較,它能夠更簡化和輕松操作電子設備。
當執行這樣的控制時,該語音識別控制系統必須識別任何連接的可語音識別的電子設備,只有這樣,該系統才能夠通過語音識別進行準確地控制。例如,該語音識別控制系統把輸入的語音轉換成為對應于識別電子設備的一種專用的控制命令,然后該控制命令輸出到該電子設備,進行控制該電子設備。
利用上面提到這樣的語音識別控制系統的一個例子是一種汽車語音識別控制系統。汽車所使用的公知電子設備包括適合語音識別的壓縮光盤(CD)播放器和微型的光盤(MD)播放器以及基于全球定位系統的導航系統(汽車導航器)。由于這樣的裝置是由語音識別進行控制,因此即使當驅動期間,也能夠對汽車實現容易操作而不危及完全。
根據常規的語音識別控制系統,在一種語音識別CD播放器、MD播放器和汽汽車導航儀連接到一種語音識別系統和通過語音識別操作這些電子設備的情況下,該語音識別控制系統預先寄存某些可語音識別的CD播放器、MD播放器和汽汽車導航儀,并且預先確定一個總線(通信線路),通過該總線連接每個寄存CD播放器、MD播放器和汽車導航儀。即,通過使用專用的總線執行專用識別操作。
因此,通過把預寄存的CD播放器、MD播放器和汽汽車導航儀連接到專用總線,通過語音識別就可以控制它們的輸入/輸出。
然而,根據常規的語音識別控制系統,只有在語音識別控制系統中先前寄存的整個的語音識別電子設備的每一個都連接到專用總線,才識別它們,從而通過語音識別執行控制。
因此,當已經連接了適合于語音識別的任何未寄存的電子設備(例如,新型電子或其它的公司出品的設備)時,由于僅存在已寄存的電子設備的控制信息,因此不識別這個裝置。因此,即使該電子設備是適合于語音識別的那些電子設備,也會出現某些問題,包括寄存手續復雜;和隨每個裝置的類型而寄存的內容是不同的問題,因此通過語音識別就不可能對它們執行正確的控制。
本發明通過改善對連接到該控制系統的電子設備進行識別的方法而實現解決上述問題的目的。而且本發明的一個目的是提供一種能夠通過語音識別控制整個的語音可識別電子設備的語音識別控制系統和語音識別控制方法。
根據本發明的一個方面,提供了一種語音識別控制系統,該系統控制具有事先記錄的語音識別表的每個電子設備的輸入/輸出,在每個電子設備中預先儲存操作者的語音作為期望值。該控制系統包括輸入操作者的語音的語音輸入裝置,以及通過識別由該語音輸入裝置輸入的操作者的語音控制電子設備的輸入/輸出的控制裝置。當已經把任何未寄存的電子設備連接到該控制裝置時,該控制裝置立即寄存該電子設備提供的語音識別表,以及當該操作者的語音已經輸入到語音輸入裝置時,該控制裝置立即對操作者的語音與預寄存的電子設備的語音識別表進行比較,然后根據操作者的語音與該語音識別表的比較結果,控制該電子設備的輸入/輸出。
按照本發明,當任何未寄存的電子設備連接到這種控制裝置時,該控制裝置寄存該電子設備的語音識別表,并且該控制裝置識別由該語音輸入裝置所輸入的操作者的語音。隨后控制裝置對該操作者的語音與寄存的語音識別表進行比較,根據這種比較結果控制該電子設備的輸入/輸出,使得即使當連接任何未寄存的可語音識別的電子設備時,該電子設備仍然響應操作者的語音操作該電子設備。
根據本發明的另一個方面,提供一種語音識別控制系統中采用的語音識別控制方法,該方法識別操作者的語音以及從控制部分控制每個電子設備的輸入/輸出。該控制方法包括以下步驟向每個電子設備提供一個語音識別表,在該語音識別表中預先把操作者的語音儲存為一個期望值;然后當已經把任何未寄存的具有語音識別表的電子設備連接到該控制部分時,在控制部分寄存該電子設備的語音識別表,隨后當輸入了該操作者的語音,就立即對操作者的語音與在控制部分中寄存的該電子設備的語音識別表進行比較;而且根據操作者的語音與該語音識別表的比較結果控制該電子設備的輸入/輸出。
按照本發明的語音識別控制方法,當分別提供語音識別表的未寄存的各種的電子設備已經連接到該控制部分時,各種的語音識別表被分別寄存在該控制部分中,使得響應操作者的語音就可以控制每個電子設備的輸入/輸出。
因此,語音識別控制系統和方法能夠通過語音識別控制整個的語音可識別的電子設備。
參考所給出的結合附圖的說明,本發明的上面的以及其它特征和優點將變得明顯的。
圖1是顯示本發明的一個實施例的語音識別控制系統結構的例子的方框圖;圖2表示顯示面板結構的例子的平面圖;圖3表示選擇圖像P的顯示例子的圖像圖;圖4表示再寄存圖像Q1的一個顯示例子的圖像圖;圖5表示再寄存圖像Q2的一個顯示例子的圖像圖;圖6表示再寄存圖像Q3的一個顯示例子的圖像圖;圖7表示再寄存圖像Q4的一個顯示例子的圖像圖;圖8表示再寄存圖像Q5的一個顯示例子的圖像圖;圖9表示語音識別控制系統的操作例子(單一連接)的方框圖;圖10表示語音識別控制系統的另一個操作例子(復合的連接)的方框圖;圖11表示按照選擇處理過程的一個選擇例子(手動輸入)的流程;圖12表示按照選擇處理過程的另一個選擇例子(語音輸入)的流程;
圖13表示按照再寄存處理過程的一個再寄存例子(手動輸入)的流程;以及圖14表示按照再寄存處理過程的另外一個再寄存例子(語音輸入)的流程;以下將說明表示本發明的語音識別控制系統的一個優選實施例。在這個實施例中,包括一種控制裝置,該控制裝置用于把輸入操作者的語音與寄存的語音識別表比較而且根據這樣的比較結果控制電子設備的輸入/輸出。以及當該電子設備連接到該控制裝置時,寄存該電子設備的語音識別表,S使得通過語音識別就可以控制整個的可語音識別的電子設備的每一個的輸入/輸出。這里前提是使用MD播放器作為具有語音識別表的未寄存的電子設備。
圖1表示作為本發明的一個實施例的語音識別控制系統100結構的例子的方框圖。語音輸入單元20起到圖1中語音輸入裝置的作用,雖然沒有示出,但它有輸入語音的麥克風、放大該輸入語音的麥克風放大器以及把該輸入模擬信號轉換成數字信號的A-D轉換器。該語音輸入單元20首先輸入操作者語音構成的指令(以下稱為語音命令),然后把該輸入語音命令(語音模擬數據)轉換成適合于視頻和音頻信號傳送的語音數字數據Vdd(同步的數據),每一125μs秒傳輸或接收固定數量的數據包形式的語音數字數據Vdd,而且把如此獲得的語音數字數據Vdd輸出。
該語音輸入單元20連接到比如例如IEEE 1394總線10的通信線路上。各種的裝置連接到該IEEE 1394總線10從而構成一個局域網。這個IEEE 1394總線10起到與IEEE 1394標準一致的高性能的串行總線接口的作用,并且適合于用于傳送同步數據等。具有語音識別表ITm的未寄存的MD播放器200連接到該IEEE 1394總線10,在該語音識別表ITm中把操作者發出語音命令經數字化后獲得的語音數字數據Vdd存儲為一個期望值。這個語音識別表ITm有表示該MD播放器200的作為期望值的語音命令“MD”。
構成的控制裝置的語音識別器31、控制器32等也連接到IEEE 1394總線10。該語音識別器31寄存該電子設備的語音識別表ITm以及通過IEEE 1394總線10輸入從語音輸入20輸出的語音數字數據Vdd。當僅存在一個寄存的語音識別表時,該語音識別器31對輸入的語音數字數據Vdd與寄存的語音識別表ITm比較,然后執行語音識別例行程序識別語音數字數據Vdd。
在本例中,如果語音數字數據Vdd與該語音識別表ITm中的期望值一致,則通過使用該比較的語音識別表ITm,把語音數字數據Vdd轉換成異步數據的語音文本數據TDm,隨后通過IEEE 1394總線10傳送該語音文本數據TDm給控制器32。控制器32使用語音文本數據TDm按照由操作者發出的語音執行控制作用。
當語音識別器31有許多寄存的語音識別表時,這里并沒有示出,該語音識別器31把輸入語音數字數據Vdd與整個寄存的語音識別表的每個進行比較,并且執行該語音識別例行程序。如果語音數字數據vdd符合例如語音識別表ITx中的期望值,則根據語音識別表ITx把語音數字數據vdd轉換成語音文本數據TDx等。在語音識別器31有多個寄存的語音識別表的情況下,對是否存在任何重復的期望值或者相同的語音命令(語音數字數據Vdd)作出檢測,在連接到IEEE 1394總線10的顯示面板40上顯示這樣的檢測結果。隨后參考圖2將描述這個顯示面板40。語音輸入單元20、IEEE 1394總線10以及語音識別器31不受到上述的限制,可以由任何其它有相同的功能的等同物替代。
控制器32包括CPU(中央處理機)等,而且識別出具有語音識別表ITm的MD播放器200被連接到IEEE 1394總線10。通過三個階段的處理,也就是總線初始化階段、樹識別階段以及自我識別階段,獲得關于節點(連接的裝置)的信息,識別該連接。在總線初始化階段,響應連接的節點的接通,復位該總線,并且完全地刪除關于節點連接的的整個的信息。
在樹結構識別階段,通過控制器32的路由選擇分別地連接的節點被識別以便按照樹結構連接進行操作。以及在自識別階段,通過通知自ID包的其它節點分別地設置獨有的自節點ID,在自ID包中從樹的終端處葉片節點按次序設置自節點ID。當識別出MD播放器200的連接時,控制器32立即響應總線判別把傳送許可送到該語音識別器31,從該MD播放器發出該總線判別,請求許可傳送該自語音識別表ITm。在這個階段,按照異步傳輸模式(ATM)執行判別。
當語音輸入單元20接收到操作者的語音命令是表示將要使用的電子設備的名稱,比如“MD”表示MD播放器200的的指令時,則通過語音識別,具有表示ND播放器200的內容的語音文本數據TDm被從語音識別器31傳送到控制器32,該語音識別器31處理語音命令“MD”,然后控制器32把根據語音文本數據TDm產生的裝置通知信號Hm輸出到語音識別器31。該裝置通知信號Hm通知語音識別器31按照后面的語音識別處理程序使用寄存的MD播放器200的語音識別表ITm。
當語音輸入單元20接收到操作者的語音命令是表示比如“播放”該電子設備的指令時,則通過語音識別,具有表示“播放”MD播放器200的內容的語音文本數據被從語音識別器31傳送到控制器32,該語音識別器31具有處理的語音命令“播放”,然后控制器32把根據語音文本數據TDm產生的控制命令COm輸出到語音識別器31。這個控制命令COm起到控制MD播放器200的輸入/輸出的作用。在這個例子中,命令Com控制MD播放器200操作在“播放”模式中。
應當理解這里控制器32不局限于僅僅上述例子,以及可以替換為任何有相同的功能的同等物。語音識別器31獨自地連接到IEEE 1394總線,但是也可能包含在控制器32或MD播放器200中。另外,代替只連接到IEEE 1394總線,語音輸入單元20還可能連接到語音識別器31、控制器32或MD播放器200。雖然顯示面板40只連接到IEEE 1394總線,但是還可能連接到控制器32等。
圖2表示在語音識別控制系統100的顯示面板40結構的例子的平面圖。在圖2所示的顯示屏幕41等上,顯示了該系統的操作狀態以及各種的信息。在顯示屏幕41下有多個設置按鍵42,在顯示屏幕41的在右邊從上到下設置決定按鍵43、開始按鍵44、停止按鍵45、十字鍵46、音量開關47等。例如,通過例如,按動十字按鍵44,移動屏幕上顯示的光標到期望的位置操作之后按動該決定按鍵43,選擇了期望的顯示圖像。該顯示面板40不僅局限于這個例子,以及可能替換為任何有相同的功能的同等物。
如果圖1所示的語音識別器31檢測到存在相同的語音命令(語音數字數據Vdd)的重復期望值,則在屏幕41上顯示“警告”,而且還要顯示選擇處理過程,用于挑選將用于這樣的重復期望值的一個期望值,或顯示再寄存處理過程,用于再寄存另外一個期望值(語音)當作該重復的一個。當語音識別器31響應語音數字數據Vdd的輸入檢測到出現任何重復期望值時,顯示有這樣的選擇處理過程的一個選擇圖像P。
當寄存語音識別表ITm時,語音識別器31檢測到出現任何重復期望值時,顯示有這樣的再寄存處理過程的一個再寄存圖像Q。通過或者手動輸入或者語音輸入可以獲得選擇圖像P和再寄存圖像Q。以下參考圖3將解釋選擇圖像P,參考圖4到8解釋再寄存圖像Q1-Q5。
圖3是說明選擇圖像P的顯示例子的圖像圖。這里前提是MD播放器、CD播放器和汽車導航儀相連接。如圖3所示,在顯示屏幕41上的選擇圖像P的上部分中顯示了“警告”。在“警告”的下面顯示了“可能“播放”的許多源中你選擇哪個?”。另外,在屏幕41的下部顯示“CD”、“MD”,和“取消”。顯示的這些“CD”、“MD”和“取消”是操作者的選擇的命令,通過語音識別或通過操作決定按鍵43和十字按鍵46,就可以選擇任意這樣的命令。在顯示中轉換所選擇的背景。
圖4到8是分別地描述再寄存圖像Q1到Q5的顯示例子的圖像圖。如圖4所示,在顯示屏幕41上的再寄存圖像Q1的上部分中顯示了“警告”。而且在“警告”的下面顯示“在多個裝置中已經檢測出相同的字”。并且在下面還顯示了“查看詳情”、“取消”命令。通過語音識別或通過操作決定按鍵43和十字按鍵46,就可以選擇這樣的“查看詳情”和“取消”。在顯示中轉換所選擇的一個鍵的背景。
響應再寄存圖像Q1中的“查看詳情”的選擇,在顯示屏幕41上顯示圖5所示的再寄存圖像Q2。在再寄存圖像Q2的左上方和右上方分別作為命令顯示“菜單”和“返回”命令。而且在“菜單”的下面按照向下的順序顯示“CD”、“HD”和“MD”命令。這些表示在“CD”、“HD”和“MD”中存在相同重復字。這里,HD表示在汽車導航儀中的硬盤(未示出)。
當例如從“CD”、“HD”和“MD”命令中選擇出了“MD”,并且轉換了它的背景時,則在右邊按照向下的順序顯示關于“MD”的信息例如,“停止”、“跳過”和“播放”。“MD”的這些“停止”、“跳過”和“播放”表示將與其它裝置(“CD”和“HD”)重復。
響應寄存圖像Q2中選擇出的將被再寄存的該字,顯示圖6所示的再寄存圖像Q3。在該再寄存圖像Q3的左上方顯示“菜單”命令。而且在接近該圖像中心,顯示一個命令,該指令達到“輸入將被再寄存的字,或在取消的情況下輸入取消”在這個階段,除了這樣的顯示以外,還通過語音合成讀取等可以用語音廣播該顯示的指令的內容。
響應在再寄存圖像Q3中輸入將被再寄存的字的語音命令,顯示圖7所示的再寄存圖像Q4。在左上方顯示“菜單”指令。而且在接近圖像中心,顯示一則消息,它表明已經完成了在例如“MD播放”之后在再寄存圖像Q3中輸入該再寄存的操作,即,替代MD的“播放”,“MD播放”已經被寄存。在這個階段,除了這樣的顯示以外,還通過語音合成讀取等可以用語音廣播的該顯示的處理結果。
當顯示再寄存圖像Q4之后必要再寄存任何其它字時,顯示圖8所示的再寄存圖像Q5。在如此顯示的再寄存圖像Q7中,排除了例如已經完成了用于再寄存的指令“播放”。因為按照這種方式僅僅顯示那些還沒有再寄存的內容,因此操作者隨后能夠選擇用于順序的寄存整個的顯示字所期望的字,并且再寄存該選擇的字。
下面將給出本發明的一個優選實施例的有關語音識別控制方法的說明。這里,將按照兩種情況情況分別地進行說明,一個情況是單一電子設備連接的單連接情況,另外一個情況是多路電子設備連接的多重連接情況。a.單連接的語音識別圖9表示語音識別控制系統100的操作例子(單一連接)的方框圖。這里前提是將連接的電子設備是具有語音識別表ITm的一個未寄存的MD播放器200。
當如圖9所示MD播放器200已經連接到IEEE 1394總線10時,控制器32初始化該總線從而刪除所有的關于系統的連接的配置信息。然后控制器32執行樹識別,以便識別可進行樹操作的連接的配置。其后控制器32執行自識別,設置自節點ID,從而確認MD播放器200已經連接到IEEE 1394總線10。
隨后,已經確認如此連接的MD播放器200對控制器32執行判別,用于請求許可傳送該語音識別表ITm到語音識別器31。當響應該判別許可控制器32進行這樣的傳送時,則MD播放器200立即傳輸該自語音識別表ITm給語音識別器31。然后語音識別器31寄存如此傳送的該語音識別表ITm,從而在該語音識別控制系統100中寄存這個最近連接的MD播放器200。
當操作者(未示出)通過語音識別控制連接到該語音識別控制系統100的MD播放器200時,操作者發出,例如,語音命令“播放”。然后語音輸入單元20接收這種語音命令。其后語音輸入單元20把輸入的語音命令轉換成語音數字數據Vdd并且通過IEEE 1394總線10發出相同的語音數字數據Vdd給語音識別器31。
具有如此接收語音數字數據Vdd的語音識別器31通過把語音數字數據Vdd與預寄存的語音識別表ITm比較,執行一個語音識別處理,如果該語音數字數據Vdd(“播放”)符合語音識別表ITm中的期望值,則語音識別器31通過使用該語音識別表ITm把語音數字數據Vdd(“播放”)轉換成語音文本數據TDm,然后通過IEEE 1394總線10把這種語音文本數據TDm傳輸給控制器32。
控制器32按照傳送的語音文本數據TDm產生一個控制命令COm,以“播放”模式操作該MD播放器200,然后把該控制命令COm傳輸給MD播放器200。響應這個控制命令COm,MD播放器200按照從操作者發出該語音命令執行它的“播放”操作。
因此,當具有語音識別表ITm的未寄存的MD播放器200連接到IEEE 1394總線10時,語音識別器31寄存該語音識別表ITm,以使以前沒有寄存的這個MD播放器200能夠被語音識別器31確認,因此這個MD播放器200能夠響應該語音命令實現對MD播放器200的期望的操作。b.多重連接中的語音識別圖10表示語音識別控制系統100的操作例子(多重連接)的一個方框圖。其中,前提是有語音識別表ITc的未寄存的CD播放器300和有語音識別表ITn的未寄存的汽車導航儀400還連接到已經預先連接有MD播放器200的IEEE 1394總線10上,該MD播放器200有語音識別表ITm。
當如圖10所示CD播放器300和汽車導航儀400另外地連接到預先連接了MD播放器200的IEEE 1394總線10時,通過總線的初始化一次完全地刪除所有的前述的連接的配置,按照控制器32執行的連接確認處理。然后控制器32確認該新連接的MD播放器200、CD播放器300和汽車導航儀400。其后MD播放器200、CD播放器300和汽車導航儀400執行判斷,然后把MD播放器200的語音識別表ITm、CD播放器的語音識別表ITc和汽車導航儀400的語音識別表ITn分別地傳送給語音識別器31。隨后語音識別器31寄存傳送到這里的語音識別表ITm、ITc和ITn,在該語音識別控制系統100中寄存了MD播放器、CD播放器300和汽車導航儀400。
當操作者通過語音識別控制連接到該語音識別控制系統100的MD播放器200、CD播放器300和汽車導航儀400時,例如在播放一個在該MD播放器200中裝裁的MD記錄介質(未示出)的情況下,首先該操作者發出指示這個MD播放器200的語音命令“MD”。然后語音輸入單元20接收這種語音命令。其后語音輸入單元20把輸入的語音命令轉換到語音數字數據Vdd并且通過IEEE 1394總線10發出相同的語音數字數據Vdd給語音識別器31。
具有如此接收的語音數字數據Vdd的該語音識別器31通過把該語音數字數據Vdd與預寄存的語音識別表ITm、ITc和ITn比較,執行語音識別處理。因為該語音識別表ITm具有作為期望值的語音數字數據Vdd(“MD”),該語音數字數據Vdd表示這個MD播放器200的名字,因此語音識別器31通過使用語音識別表ITm,把語音數字數據Vdd(“MD”)轉換成語音文本數據TDm(“MD”),然后把該語音文本數據TDm通過IEEE 1394總線10傳輸給控制器32。
該控制器32根據傳送給它的語音文本數據TDm產生一個裝置通知信號Hm。然后控制器32把這個裝置通知信號Hm送給語音識別器31,從而通知語音識別器31使用MD播放器200的語音識別表ITm,執行后面的語音識別。其后,如果操作者發出例如一個語音命令“播放”,則語音輸入單元20接收這種語音命令。然后語音接收裝置20把接收的語音命令轉換成語音數字數據Vdd并且通過IEEE 1394總線10輸出相同的語音數字數據Vdd給語音識別器31。
具有接收的語音數字數據Vdd的語音識別器31通過把語音數字數據Vdd與備用的語音識別表ITm比較,執行語音識別處理。而且如果該語音數字數據Vdd(“播放”,)與語音識別表ITm中的該期望值一致,則語音識別器31通過使用該語音識別表ITm把該語音數字數據(“播放”)轉換成為語音文本數據TDm,然后把該語音文本數據TDm通過IEEE 1394總線10傳輸給控制器32。
控制器32按照傳送的語音文本數據TDm產生以“播放”模式操作該MD播放器200的控制命令COm,然后把該控制命令COm傳輸給MD播放器200。響應這個控制命令COm,MD播放器200按照從操作者發出該語音命令執行它的“播放”操作。
雖然沒有表示出,但同樣的響應所輸入的語音命令“CD”,從控制器32輸出一個裝置通知信號Hc,從而在備用的狀態時放置CD播放器的語音識別表ITc。而且當輸入語音命令“播放”時,控制器32使用語音識別表ITc根據轉換該語音數字數據Vdd(“Play”)所獲得的語音文本數據TDc,產生一個控制命令COc。而且CD播放器300按照該控制命令COc執行它的“播放”操作。
雖然沒有表示出,但同樣的響應所輸入的語音命令“汽車導航”,從控制器32輸出一個裝置通知信號Hn,從而把汽車導航儀400的語音識別表Itn置為備用的狀態。而且當輸入一個語音命令“播放”時,控制器32使用語音識別表ITn根據轉換該語音數字數據Vdd(“播放”)所獲得的語音文本數據TDn,產生一個控制命令COn。而且汽車導航儀400按照該控制命令COn執行它的“播放”操作。
因此,即使在這樣的未寄存的CD播放器300和汽車導航儀400已經另外地連接到預先連接了MD播放器200的該IEEE 1394總線10的情況下,該語音識別器31也可以自動識別MD播放器200的語音識別表ITm、CD播放器300的語音識別表ITc和汽車導航儀400的語音識別表ITn。因此,響應操作者的語音命令,都可以操作任意的這些MD播放器200、CD播放器300和汽車導航儀400。
現在假設在許多連接的電子設備中有重復期望值,即,它們的所有的寄存的語音識別表ITm、ITc和ITn都分別有作為期望值的語音命令“播放”。下面針對當僅僅已經輸入語音“播放”代替將使用的電子設備的名字時,由于在確定選擇那個語音識別表用于轉換該輸入語音的過程中出現的故障所引起的語音不識別(voice non-recognition),分別地對后面的每一情況給出說明。(1)裝置選擇操作所進行的處理過程圖11是語音識別控制系統100中根據選擇處理過程的一種選擇實例子(手動輸入)的流程。圖12是該控制系統100中根據一種選擇處理過程的另外一個選擇處理例子(語音輸入)的流程。這里前提是在語音識別器31中寄存了MD播放器200的語音識別表ITm、CD播放器300的語音識別表ITc和汽車導航儀400的語音識別表ITn(圖10),其中語音命令“播放”被設置成一個期望值。
首先,將對通過手動輸入進行的裝置選擇操作進行說明。如圖11所示,在步驟S1處操作者發出例如“播放”語音命令,用語音把“播放”輸入給語音輸入單元20(圖10),然后該程序前進到步驟S2。隨后在步驟S2,語音識別器31通過對輸入的語音命令的轉換所獲得的語音數字數據vdd與寄存的語音識別表ITm、ITc和ITn中的每一個進行比較,執行它的語音識別。其后程序前進到步驟S3。
在步驟S3,語音識別器31檢測在關于語音數字數據Vdd(“播放”)的語音識別結果(比較結果)中是否存在任何重復的期望值,而且如果沒有任何重復的期望值,則該程序前進到步驟S6,進行該裝置的“播放”操作,比如MD播放器200例如在步驟S1處被輸入了設置作為一個期望值的語音命令“播放”,這樣就完成了該處理例行程序。同時,在步驟S3已經檢測到重復期望值的情況下,該程序前進到步驟S4,在此選擇圖像P(圖4)被顯示在顯示屏41(圖10)。
然后程序前進到步驟S5,在此步驟S5處,操作者通過該決定按鍵43和該十字按鍵46,操作在該選擇圖像P上顯示的命令“CD”、“MD”和“取消”,選擇例如指令“MD”。因此,對應于“MD”的并且由語音識別器31寄存的該語音識別表ITm被設置成備用的狀態,以便用于后面的語音識別操作。其后程序前進步驟S6,執行步驟S5所選擇的MD播放器200的“播放”操作,因此完成了該處理例行程序。
隨后,將對響應于語音輸入所進行的裝置選擇操作進行說明。如圖12所示,在步驟T1處操作者發出例如“播放”語音命令,用語音把該“播放”輸入給語音輸入單元20,然后該程序前進到步驟T2。隨后在步驟T2,語音識別器31通過對輸入的語音命令的轉換所獲得的語音數字數據vdd與寄存的語音識別表ITm、ITc和ITn中的每一個進行比較,執行它的語音識別。其后程序前進到步驟T3。
在步驟T3,語音識別器30檢測在關于語音數字數據Vdd(“播放”)的語音識別結果中是否存在任何重復的期望值,而且如果沒有重復的期望值,則該程序前進到步驟T7,執行該語音命令,因此完成了該處理例行程序。同時,在步驟T3已經檢測有重復期望值的情況下,該程序前進到步驟T4,在該步驟,在屏幕41上顯示所選擇的圖像P,并且通過語音合成把所選擇的圖像P上所顯示的警告同時通知操作者。
然后程序前進到步驟T5,在此步驟T5處,操作者通過選擇性地輸入,從在該選擇圖像P上顯示的命令“CD”、“MD”和“取消”中,選擇例如指令“MD”,而且程序前進到步驟T6,按照輸入語音命令“MD”執行語音識別操作。其后在步驟T7,對應于步驟T6所處理并且由語音識別器31所寄存的語音命令“MD”的這個MD播放器200的語音識別表ITm被處于備用的狀態,以便用于后面的語音識別。而且響應步驟T1所輸入的語音命令,執行MD播放器200的“播放”操作,這樣就完成了該處理例行程序。(2)再寄存處理圖13是語音識別控制系統100中根據再寄存處理過程的再寄存例子(手動輸入)的流程。圖14是該控制系統100中根據再寄存處理過程的另外一個再寄存例子(語音輸入)的流程。這里前提是圖10中分別顯示的具有語音識別表ITm的MD播放器200、具有語音識別表ITc的CD播放器300和具有語音識別表ITn顯示的汽車導航儀400連接到IEEE 1394總線10,語音命令“播放”設置為一個期望值。
首先,將對通過手動輸入進行的再寄存操作進行說明。當具有語音識別表ITm的MD播放器200、具有語音識別表ITc的CD播放器300和具有語音識別表ITn的汽車導航儀400已經連接到IEEE 1394總線10時,如圖13所示,該程序前進到步驟U1。在步驟U1由語音識別器31確認這樣的連接,然后該程序前進到步驟U2。
其后在步驟U2,MD播放器200把語音識別表ITm傳輸到語音識別器31。同樣,CD播放器300把語音識別表ITc傳輸到語音識別器31,以及汽車導航儀400把語音識別表ITn傳輸到語音識別器31。然后語音識別器31寄存這些傳送來的語音識別表ITm、ITc以及ITn。在步驟U3,檢測在語音識別器31中所寄存的語音識別表ITm、ITc以及ITn中是否存在關于相同的語音(語音數字數據Vdd)的任何重復的期望值。而且如果沒有重復期望值,則完成該處理例行程序。同時,如果在步驟U3有重復期望值,則程序前進到步驟U4,在該步驟處,在屏幕41上顯示再寄存圖像Q1(圖4)。
在步驟U4,通過操作決定按鍵43和十字按鍵46,在該再寄存圖像Q1上選擇例如“查看詳情”的一個指令,然后該程序前進到步驟U5。隨后在步驟U5,該再寄存圖像Q1改變到下一個再寄存圖像Q2(圖5),在該再寄存圖像Q2上顯示了重復字(期望值)。當把例如該重復字“播放”改變到另外一個字時,操作者操作決定按鍵43和十字按鍵46,選擇“播放”,程序前進到步驟U6。
然后在步驟U6,再寄存圖像Q2改變到下一個再寄存圖像Q3(圖6),在再寄存圖像Q3處,顯示該重復期望值的再寄存的指南,而且通過語音合成,把這樣顯示的指南同時地通知操作者。其后程序前進到步驟U7,在該步驟U7操作者用語音輸入例如作為新的命令“MD播放”。然后程序前進到步驟U8,在該步驟用語音確認該輸入的命令“MD播放”,這樣重新再寄存“MD播放“代替”了“播放”。
隨后該程序前進到步驟U9,在該步驟U9,再寄存圖像Q3改變到下一個再寄存圖像Q4(圖7),該再寄存圖像Q4顯示出完成了該再寄存操作,而且通過語音合成把這樣顯示的該再寄存的完成同時地通知操作者。其后該程序返回到步驟U3,再一次檢測是否有任何重復期望值。如果檢測的結果表示沒有重復期望值,則完成該程序。同時,如果步驟U3所獲得的結果表示存在重復期望值,則程序前進到步驟U4,顯示下一個再寄存圖像Q5(圖8)。在這個圖像Q5中顯示某些仍然沒有再寄存的重復期望值。連接著再寄存新的命令用于說明該重復期望值,最后在步驟U3將再檢測不到出現該重復期望值,因此程序到達它的結束。
接下來,將對通過語音輸入所進行的再寄存進行說明。在圖14所示的步驟W1中,按照與圖13的步驟U1相同的方式確認該連接。而且在步驟W2,按照與圖13中步驟U2處相同的方式傳送和寄存該語音識別表ITm、ITc和ITn。然后在步驟W3,檢測在語音識別器31中所寄存的語音識別表ITm、ITc以及ITn中是否存在關于相同的語音(語音數字數據Vdd)的任何重復的期望值。如果檢測的結果表示沒有重復期望值,則結束該程序。同時,如果步驟W3獲得的結果表示有重復的期望值,則程序前進到步驟W4,在該步驟W4處,在屏幕41上顯示該再寄存圖像Q1(圖4)。
在步驟W4,用語音輸入再寄存圖像Q1上顯示的“查看詳情”的語音命令。然后程序前進的步驟W5,在步驟W5,該再寄存圖像Q1改變到下一個再寄存圖像Q2(圖5),在該再寄存圖像Q2上顯示了重復字(期望值)。當例如該重復字“播放”改變到另外一個字時,操作者用語音輸入通過語音識別進行處理的語音命令“播放”,因此,選擇了“播放”為將改變的字。
然后在步驟W6,該再寄存圖像Q2改變到下一個再寄存圖像Q3(圖6),顯示再寄存該重復期望值的指南,并且把這樣顯示的指南,通過語音合成同時通知操作者。其后該程序前進到步驟W7,在步驟W7處,用語音輸入例如新指令“MD播放”。然后程序前進到步驟W8,在該步驟用語音確認該輸入的指令“MD播放”,這樣重新再寄存“MD播放”代替“播放”。
隨后程序前進到步驟W9,在該步驟W9處該再寄存圖像Q3改變到下一個再寄存圖像Q4(圖7),在該再寄存圖像Q4上顯示了完成該再寄存,而且通過語音合成把這樣顯示的該再寄存的完成同時地通知操作者。其后該程序返回到步驟W3,再一次檢測是否有重復期望值。如果檢測的結果表示沒有重復期望值,則完成該處理例行程序。同時,如果步驟W3所獲得的結果表示存在重復期望值,則處理程序前進到步驟W4,顯示下一個再寄存圖像Q5(圖8)。在這個圖像Q5中,顯示某些仍然沒有再寄存的重復期望值。因為接著再寄存新的命令用于說明該重復期望值,因此最后在步驟W3將再檢測不到出現該重復期望值,因此結束程序。
因此,即使由于存在重復期望值導致語音不識別,通過選擇裝置,仍然能夠容易解決這種現象,并且通過再寄存該期望值就能夠加強語音識別的精度。
因此,根據如上所述的本發明的優選實施例的語音識別控制系統100和語音識別控制方法,當有語音識別表ITm的MD播放器200已經連接到IEEE1394總線10時,控制器32確認MD播放器200的這樣的連接,然后語音識別器31寄存傳送給它的該語音識別表ITm。隨后語音輸入單元20把輸入的操作者的語音轉換成為語音數字數據Vdd。其后語音識別器31對語音數字數據Vdd與寄存的語音識別表ITm中的期望值進行比較,從而執行語音識別,而且還使用該語音識別表ITm把數字數據Vdd轉換成為語音文本數據TDm。而且控制器32把控制命令Com傳輸給該MD播放器200,該MD播放器200起到根據文本數據TDm遵守該語音命令執行操作的作用,因此按照該語音命令也能夠操作具有該語音識別表ITm的甚至還未寄存的MD播放器200。
即使在未寄存的CD播放器300以及汽車導航儀400已經另外地連接到先前連接了這個MD播放器200的IEEE 1394總線10的情況下,該語音識別器31仍能寄存該語音識別表ITc和ITn,從而響應語音命令執行對MD播放器、CD播放器300以及汽車導航儀400的操作。
因此,通過語音識別就可以操作適合于語音識別的整個電子設備。另外,為了防備出現由于存在有關該語音命令的一些重復的期望值的語音不識別情況,本發明還有一種選擇處理過程,用于通過手動地或者語音輸入,指導操作者選擇將使用的裝置,來處理這樣的語音非識別情況,本發明還有一種再寄存處理過程,用于在連接該裝置的時候指導操作者檢測這樣的重復,并且寄存新的字來代替該重復的期望值,因此增加了語音識別的準確度和可操作性,并且還使操作者自己定制該語音識別控制系統。
如上所述,在本發明的語音識別控制系統中,提供了一種語音輸入裝置,對輸入的操作者的語音與連接的電子設備的所寄存的語音識別表進行比較,而且提供了一種控制裝置,用于根據這樣的比較結果控制該電子設備的輸入/輸出。
依據這種結構,即使當已經連接了任意語音可識別的未寄存的電子設備時,通過識別語音也能對電子設備進行操作。
在本發明的一種控制方法中,執行以下步驟向每個電子設備提供一種語音識別表,在該語音識別表中預先把操作者的語音儲存成為一個期望值;然后當已經把任何未寄存的具有所提供的語音識別表的電子設備連接到一個控制部分時,在控制部分寄存該電子設備的語音識別表,隨后,當輸入了該操作者的語音,就立即對操作者的語音與在控制部分中寄存的該電子設備的語音識別表進行比較;而且根據該操作者的語音與該語音識別表的比較結果控制該電子設備的輸入/輸出。
因此,語音識別可以應用于全部可語音識別的電子設備。
本發明尤其地適合于利用語音輸入執行對汽車電子設備的控制操作的語音識別控制系統等。
權利要求
1.一種控制具有預記錄的語音識別表的電子設備的輸入/輸出的語音識別控制系統,在該預記錄的語音識別表中預先儲存了作為期望值的操作者的語音,所述系統包括輸入該操作者語音的語音輸入裝置;和用于通過識別由所述語音輸入裝置輸入的該操作者的語音,控制所述電子設備的輸入/輸出的控制裝置;其中,當任意未寄存的電子設備已經連接到所述控制裝置時,所述控制裝置寄存由所述電子設備提供的語音識別表,而且當該操作者的語音已經由所述語音輸入裝置輸入時,所述控制裝置把該操作者的語音與該預寄存的電子設備的語音識別表比較,然后根據操作者的語音與該語音識別表的比較結果,控制所述電子設備的輸入/輸出。
2.根據權利要求1而且包括語音輸入裝置和控制裝置的語音識別控制系統,其中所述控制裝置具有用于寄存所述電子設備的語音識別表和用于通過該語音識別表與由所述輸入裝置輸入的語音比較確認該操作者的語音的一種語音識別單元,所述控制裝置還具有控制器,該控制器根據所述語音識別單元所執行的比較結果控制所述電子設備的輸入/輸出。
3.根據權利要求2而且包括語音輸入裝置、語音識別單元和控制裝置的語音識別控制系統,其中所述控制裝置通過比較寄存的電子設備的語音識別表與輸入的操作者的語音確認該語音,而且當該操作者的語音與該語音識別表中的期望值一致時,所述語音識別單元通過使用所述語音識別表把該操作者的語音轉換成為語音文本數據,然后傳輸該語音文本數據給所述控制器。
4.根據權利要求3而且包括語音輸入裝置、語音識別單元和控制器的語音識別控制系統,其中,當已經確認由所述語音輸入裝置輸入的該操作者的語音表示對所述電子設備進行操作時,所述控制器控制根據從所述語音識別單元傳送的并且表示操作所述電子設備的語音文本數據,控制所述電子設備的輸入/輸出。
5.根據權利要求3而且包括語音輸入裝置、語音識別單元和控制器的語音識別控制系統,其中,當已經確認由所述語音輸入裝置輸入的該操作者的語音表示了所述電子設備的預定名字時,所述控制器接收從所述語音識別單元傳送的而且表示操作所述電子設備的名字的語音文本數據,并且指導所述語音識別單元使用所述電子設備的該語音識別表,執行后面的語音識別操作。
6.根據權利要求3而且包括語音輸入裝置、語音識別單元和控制器的語音識別控制系統,其中所述語音輸入裝置、語音識別單元和控制器經過通信線路互相連接,并且由所述語音輸入裝置輸入的操作者的語音和語音文本數據兩者都傳輸給所述通信線路。
7.一種用于確認操作者的語音和從控制部分控制各種的電子設備的輸入/輸出的語音識別控制系統中所采用的語音識別控制方法,所述方法包括以下步驟提供給每個所述電子設備的語音識別表,在語音識別表中預先儲存作為期望值的操作者的語音;當具有所述語音識別表的任意未寄存的電子設備已經連接到所述控制部分時,在所述控制部分寄存有關電子設備的該語音識別表;當輸入操作者的語音時,則比較該操作者的語音與所述控制部分中的電子設備的語音識別表;以及根據操作者的語音與語音識別表的比較結果控制所述電子設備的輸入/輸出。
8.根據權利要求7的語音識別控制方法,其特征在于當確認了操作者的語音,則針對所述控制部分中寄存的多個語音識別表中相同的語音,檢測是否存在任何重復的期望值。
9.根據權利要求8的語音識別控制方法,其中顯示作為一種指南的所述選擇過程,它允許操作者選擇預定的重復的期望值中的一個。
10.根據權利要求7的語音識別控制方法,其特征在于當寄存了連接到所述控制部分的多個電子設備的語音識別表時,針對在所述控制部分中寄存的多個語音識別表中相同的語音,檢測是否存在任何重復期望值,以及當檢測出任何重復期望值,則把這樣的檢測到的該重復期望值通知給操作者,以及還把用于處理該重復的期望值的再寄存程序通知給該操作者。
11.根據權利要求10語音識別控制方法,其中顯示作為一種指南的所述再寄存過程,它允許操作者把該重復期望值再寄存成另外一個語音。
全文摘要
一種語音識別控制系統能夠通過語音識別對電子設備進行控制。系統包括:語音輸入器、語音識別器和控制器,控制器確認語音輸入器獲得的操作者的語音和控制具有語音識別表的MD播放器的輸入/輸出,在語音識別表中預先儲存作為期望值的操作者語音。當連接未寄存的MD播放器時,語音識別器寄存由MD播放器提供的語音識別表,當語音輸入器輸入操作者的語音,控制器對語音與預寄存的語音識別表比較,控制器根據比較結果控制MD播放器的輸入/輸出。
文檔編號G10L15/26GK1288225SQ00130680
公開日2001年3月21日 申請日期2000年7月27日 優先權日1999年7月27日
發明者宮崎良朗, 田中民也, 村山靜江, 清田和久, 金子健二 申請人:索尼公司