專利名稱:語音辨識功能啟動系統及方法
技術領域:
本發明涉及一種語音辨識功能啟動系統及方法,特別是涉及一種可以依據聲音的
變異度決定是否啟動語音辨識功能的系統及方法。
背景技術:
近年來,電子裝置,如計算機與便攜式裝置變得越來越高階且變得更多功能化。由
于這些裝置與應用的便利,也使得這些裝置逐漸成為人們的生活必需品之一。 為了提供更便利的輸入與操作方式,部分電子裝置可以提供語音辨識系統。使用
者可以利用語音完成輸入與操作電子裝置。另外,當使用者處于不適合利用手動輸入與操
作的環境中,如在開車的時候,語音辨識系統亦提供使用者更便捷與安全的輸入與操作方
式。雖然通過語音可以輸入與操作電子裝置與/或汽車系統。然而,如何啟動語音辨識系
統成為設計者的重要關鍵。 由于環境中充滿各式各樣的聲音,如果讓語音辨識系統持續地辨識聲音,常常會 產生許多錯誤的辨識。因此,通常會額外設計一個按鈕來啟動語音辨識系統。由于使用者 必須手動按下此按鈕來啟動語音辨識系統,因此,對于使用者而言是不便的,且在特殊狀況 下,如行車中,此行為是缺乏安全性的。 為了克服前述問題,一種已知技術開發來啟動語音辨識系統。在此已知技術中,系 統會持續檢測聲音中是否包括一關鍵字。當檢測到關鍵字時,則啟動語音辨識系統,以進行 完整的語音辨識功能。在此已知技術中,使用者無須手動按下任何按鈕便可啟動語音辨識 系統。然而,由于系統仍然是持續地檢測聲音中是否含有關鍵字。若在聲音源不單純或較 為吵雜的環境中,可能形成錯誤的辨識亦是非常驚人的。因此,利用關鍵字來啟動語音辨識 系統的技術亦鮮見實作于產品上。
發明內容
有鑒于此,本發明提供語音辨識功能啟動系統及方法。 本發明實施例的一種語音辨識功能啟動系統包括一收音單元與一處理模塊。處理
模塊取得收音單元檢測得到的一第一期間的一第一聲音,且計算第一期間內第一聲音的一
第一變異度。處理模塊判斷第一變異度是否小于一第一設定值。當第一變異度小于第一設
定值時,處理模塊取得收音單元檢測得到的一第二期間的一第二聲音,且判斷第二聲音中
是否包括一關鍵字。當第二聲音中包括關鍵字時,處理模塊啟動一語音辨識功能。當語音
辨識功能啟動時,收音單元檢測得到的一第三聲音中的每一文字將被檢測。 本發明實施例的一種語音辨識功能啟動方法。首先,取得一第一期間的一第一聲
音,且計算第一期間內第一聲音的一第一變異度。判斷第一變異度是否小于一第一設定值。
當第一變異度小于第一設定值時,取得一第二期間的一第二聲音。判斷第二聲音中是否包
括一關鍵字。當第二聲音中包括關鍵字時,啟動一語音辨識功能。當語音辨識功能啟動時,
一第三聲音中的每一文字將被檢測。
本發明的上述方法可以通過程序碼方式存在。當程序碼被機器載入且執行時,機器變成用以實行本發明的裝置。 為使本發明的上述目的、特征和優點能更明顯易懂,下文特舉實施例,并結合附圖
詳細說明如下。 圖式簡單說明
圖1為一示意圖是顯示依據本發明實施例的語音辨識功能啟動系統。 圖2為一流程圖是顯示依據本發明實施例的語音辨識功能啟動方法。 附圖符號說明 100 語音辨識功能啟動系統; 110 收音單元; 120 顯示單元; 130 處理模塊; S202、S204、. 、S220 步驟。
具體實施例方式圖1顯示依據本發明實施例的語音辨識功能啟動系統。 語音辨識功能啟動系統100可以是一電子裝置,如計算機系統、汽車系統、與便攜式裝置,如多媒體播放器、個人數字助理、全球衛星定位裝置、觸控式手機、智慧型手機或移動電話等的手持式裝置。語音辨識功能啟動系統IOO包括一收音單元110、一顯示單元120與一處理模塊130。收音單元110可以是一麥克風用以接收環境中的聲音。顯示單元120可以是一螢幕或是一燈號,用以顯示關鍵字檢測圖示。處理模塊130依據收音單元110接收的聲音執行本案的語音辨識功能啟動方法,其細節將于后說明。
圖2顯示依據本發明實施例的語音辨識功能啟動方法。 如步驟S202,通過收音單元110接收一期間的聲音,且如步驟S204,計算期間內聲音的變異度(Variance)。值得注意的是,計算變異度的方法是數值分析領域熟習的技術,在此不再贅述。如步驟S206,判斷此期間聲音的變異度是否小于一第一設定值,且維持一既定時間。注意的是,第一設定值與既定時間可以依據不同需求彈性設計。當此期間聲音的變異度并未小于第一設定值或持續既定時間時(步驟S206的否),流程回到步驟S202。當此期間聲音的變異度小于第一設定值且持續既定時間時(步驟S206的是),如步驟S208,通過顯示單元120顯示一關鍵字檢測圖示。關鍵字檢測圖示的顯示可以提示使用者進行關鍵字的輸入。值得注意的是,步驟S206中判斷變異度是否小于第一設定值既定時間是用以避免瞬間聲音變化與/或不同聲音源造成的誤判。然而,在一些實施例中,步驟S206亦可僅判斷變異度是否小于第一設定值即可。 如步驟S210,通過收音單元110持續接收另一期間的聲音,且如步驟S212,計算此期間內聲音的變異度。如步驟S214,判斷此期間聲音的變異度是否大于一第二設定值。當此期間聲音的變異度并未大于第二設定值時(步驟S214的否),流程回到步驟S210。當此期間聲音的變異度大于第二設定值時(步驟S214的是),如步驟S216,判斷聲音中是否包括一內定的關鍵字。類似地,步驟S212與S214中計算與判斷此期間聲音的變異度是否大于第二設定值用以避免瞬間聲音變化和/或不同聲音源造成的誤判。然而,在一些實施例
4中,步驟S212與S214可以省略,而直接進行步驟S216的判斷。若聲音中并未包括內定的關鍵字(步驟S216的否),如步驟S218,取消在顯示單元120中相應關鍵字檢測圖示的顯示,并回到步驟S202。若聲音中包括內定的關鍵字(步驟S216的是),如步驟S220,啟動一語音辨識功能。注意的是,當語音辨識功能啟動時,接收的聲音中每一文字都將會被檢測。
因此,本申請的語音辨識功能啟動系統及方法可以依據環境中聲音的變異度自動啟動語音辨識功能。當期間內聲音的變異度小于設定值時,啟動關鍵字檢測,且在檢測到關鍵字的后自動啟動語音辨識功能,從而在便捷與安全性的考量下,啟動語音辨識功能。
本發明的方法,或特定型態或其部份,可以以程序碼的型態存在。程序碼可以包含于實體媒體,如軟盤、光盤片、硬盤、或是任何其他機器可讀取(如計算機可讀取)儲存媒體,亦或不限于外在形式的計算機程序產品,其中,當程序碼被機器,如計算機載入且執行時,此機器變成用以參與本發明的裝置。程序碼也可以通過一些傳送媒體,如電線或電纜、光纖、或是任何傳輸型態進行傳送,其中,當程序碼被機器,如計算機接收、載入且執行時,此機器變成用以參與本發明的裝置。當在一般用途處理單元實作時,程序碼結合處理單元提供一操作類似于應用特定邏輯電路的獨特裝置。 雖然本發明已以較佳實施例揭示如上,然其并非用以限定本發明,本領域的技術人員在不脫離本發明的精神和范圍的前提下可做若干的更動與潤飾,因此本發明的保護范圍以本發明的權利要求為準。
權利要求
一種語音辨識功能啟動系統,包括一收音單元;以及一處理模塊,取得該收音單元檢測得到的一第一期間的一第一聲音,計算該第一期間內該第一聲音的一第一變異度,且判斷該第一變異度是否小于一第一設定值,當該第一變異度小于該第一設定值時,取得該收音單元檢測得到的一第二期間的一第二聲音,且判斷該第二聲音中是否包括一關鍵字,當該第二聲音中包括該關鍵字時,啟動一語音辨識功能,其中,當該語音辨識功能啟動時,該收音單元檢測得到的一第三聲音中的每一文字將被檢測。
2. 如權利要求1所述的語音辨識功能啟動系統,其中該處理模塊還判斷該第一變異度 是否小于該第一設定值一既定時間,當該第一變異度小于該第一設定值該既定時間時,方 取得該第二聲音。
3. 如權利要求1所述的語音辨識功能啟動系統,還包括一顯示單元,用以當該第一變 異度小于該第一設定值時,顯示一關鍵字檢測圖示。
4. 如權利要求3所述的語音辨識功能啟動系統,其中當該第二聲音中并未包括該關鍵 字時,該顯示單元取消該關鍵字檢測圖示的顯示。
5. 如權利要求1所述的語音辨識功能啟動系統,其中該處理模塊還計算該第二聲音的 一第二變異度,且判斷該第二變異度是否大于一第二設定值,當該第二變異度大于該第二 設定值時,方判斷該第二聲音中是否包括該關鍵字。
6. —種語音辨識功能啟動方法,包括下列步驟 取得一第一期間的一第一聲音; 計算該第一期間內該第一聲音的一第一變異度; 判斷該第一變異度是否小于一第一設定值;當該第一變異度小于該第一設定值時,取得一第二期間的一第二聲音; 判斷該第二聲音中是否包括一關鍵字;以及 當該第二聲音中包括該關鍵字時,啟動一語音辨識功能, 其中,當該語音辨識功能啟動時,一第三聲音中的每一文字將被檢測。
7. 如權利要求6所述的語音辨識功能啟動方法,還包括下列步驟 判斷該第一變異度是否小于該第一設定值一既定時間;以及 當該第一變異度小于該第一設定值該既定時間時,方取得該第二聲音。
8. 如權利要求6所述的語音辨識功能啟動方法,還包括當該第一變異度小于該第一設 定值時,顯示一關鍵字檢測圖示。
9. 如權利要求8所述的語音辨識功能啟動方法,還包括當該第二聲音中并未包括該關 鍵字時,取消該關鍵字檢測圖示的顯示。
10. 如權利要求6所述的語音辨識功能啟動方法,還包括下列步驟計算該第二聲音的一第二變異度; 判斷該第二變異度是否大于一第二設定值;以及當該第二變異度大于該第二設定值時,方判斷該第二聲音中是否包括該關鍵字。
全文摘要
一種語音辨識功能啟動系統及方法。首先,取得一第一期間的一第一聲音,且計算第一期間內第一聲音的一第一變異度。判斷第一變異度是否小于一第一設定值。當第一變異度小于第一設定值時,取得一第二期間的一第二聲音。判斷第二聲音中是否包括一關鍵字。當第二聲音中包括關鍵字時,啟動一語音辨識功能。當語音辨識功能啟動時,一第三聲音中的每一文字將被檢測。
文檔編號G10L15/26GK101714355SQ20081016168
公開日2010年5月26日 申請日期2008年10月6日 優先權日2008年10月6日
發明者周燕麗, 周福強 申請人:宏達國際電子股份有限公司