專利名稱:一種中文及控制命令語音識別輸入方法、裝置的制作方法
技術領域:
本發明屬于語音識別領域,尤其涉及一種中文及控制命令語音識別輸入方法、裝置。
背景技術:
現有語音識別輸入技術中,當接收到中文拼音語音信號后,檢索語音數據庫,并對語音數據與輸入的中文拼音語音信號進行大量對比,最后選擇出較正確的、符合語音信號的中文。由于用戶漢語發音不夠準確,造成語音識別輸入裝置對用戶語音信號識別率較低, 無法準確通過語音輸入中文及控制命令。
發明內容
本發明實施例的目的在于提供一種中文及控制命令語音識別輸入方法,旨在解決現有語音識別輸入裝置對語音信號識別率較低,無法準確語音輸入中文及控制命令的問題。本發明實施例是這樣實現的,一種中文及控制命令語音識別輸入方法,所述中文語音識別輸入方法包括以下步驟接收外部輸入的中文語音輸入代碼的字母或拼音語音信號;識別輸入的字母或拼音語音信號,檢索數據庫;輸出顯示與所述語音信號一致、以阿拉伯數字順序編號的中文;接收輸入的中文旁邊的阿拉伯數字語音信號;識別輸入的阿拉伯數字語音信號;輸出顯示與所述阿拉伯數字語音信號一致的中文;所述控制命令語音識別輸入方法包括以下步驟接收外部輸入的與現有控制命令綁定的語音輸入代碼的字母、拼音或數字語音信號;識別輸入的語音信號,檢索數據庫;執行與所述語音信號一致的控制命令。本發明實施例的另一目的在于提供一種中文及控制命令語音識別輸入裝置,所述裝置包括中文語音識別輸入單元,用于接收外部輸入的中文語音輸入代碼的字母、拼音或數字語音信號,完成中文語音識別輸入;控制命令語音識別輸入單元,用于接收外部輸入的與現有控制命令綁定的語音輸入代碼的字母、拼音或數字語音信號,完成控制命令語音識別輸入;語音輸入模式切換單元,用于通過特定按鍵在中文語音識別輸入模式與控制命令語音識別輸入模式相互切換。本發明還可以采用如下技術措施
所述中文語音識別輸入單元包括字母語音 信號接收模塊,用于接收外部輸入的中文語音輸入代碼的字母語或拼音語音信號;字母語音信號識別模塊,用于識別輸入的字母或拼音語音信號,檢索數據庫;中文選擇顯示模塊,用于輸出顯示與所述字母或拼音語音信號一致、以阿拉伯數字順序編號的中文;數字語音信號接收模塊,用于接收輸入的中文旁邊的阿拉伯數字語音信號;數字語音信號識別模塊,用于識別輸入的阿拉伯數字語音信號;中文輸出模塊,用于輸出顯示與所述阿拉伯數字語音信號一致的中文。所述控制命令語音識別輸入單元包括控制命令語音信號接收模塊,用于接收外部輸入的與現有控制命令綁定的語音輸入代碼的字母、拼音或數字語音信號;語音信號識別模塊,用于識別輸入的語音信號,檢索數據庫;控制命令執行模塊,用于執行與所述語音信號一致的控制命令。本發明通過采用阿拉伯數字及字母和拼音組成中文語音輸入代碼和控制命令語音輸入代碼,并根據中文語音輸入代碼和控制命令語音輸入代碼進行語音輸入,實現了快速、準確地輸入中文和控制命令,減少了對語音信號的對比數量,大大提高了語音信號識別的準確率,達到語音輸入中文與控制命令的唯一識別。
圖1是本發明實施例提供的中文語音識別輸入方法的流程圖;圖2是本發明實施例提供的控制命令語音識別輸入方法的流程圖;圖3是本發明實施例提供的中文及控制命令語音識別輸入裝置的結構圖。
具體實施例方式為了使本發明的目的、技術方案及優點更加清楚明白,以下結合附圖及實施例,對本發明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發明,并不用于限定本發明。本發明通過采用阿拉伯數字及字母組成中文語音輸入代碼和控制命令語音輸入代碼,并根據中文語音輸入代碼和控制命令語音輸入代碼進行語音輸入圖1示出本發明實施例提供的中文語音識別輸入方法的流程圖,詳述如下在步驟SlOl中,接收外部輸入的中文語音輸入代碼的字母或拼音語音信號;在步驟S102中,識別輸入的字母或拼音語音信號,檢索數據庫;在步驟S103中,輸出顯示與所述語音信號一致、以阿拉伯數字順序編號的中文;在步驟S104中,接收輸入的中文旁邊的阿拉伯數字語音信號;在步驟S105中,識別輸入的阿拉伯數字語音信號;在步驟S106中,輸出顯示與所述阿拉伯數字語音信號一致的中文。中文語音輸入代碼的字母語音信號與中文語音輸入代碼的拼音語音信號在輸入時可以通過特定按鍵進行轉換。
圖2示出本發明實施例提供的控制命令語音識別輸入方法的流程圖,詳述如下在步驟S201中,接收外部輸入的與現有控制命令綁定的語音輸入代碼的字母、拼
音或數字語音信號; 在步驟S202中,識別輸入的語音信號,檢索數據庫;在步驟S203中,執行與所述語音信號一致的控制命令。作為本發明第一實施例,所述方法通過特定按鍵在中文語音識別輸入模式與控制命令語音識別輸入模式相互切換,可以通過輸入設備的SHIFT按鍵進行切換。作為本發明第二實施例,所述字母語音包括漢語字母發音和英語字母發音。本發明實施例中,在輸入“高(中文拼音GA0) ”字時,可以依次用英文字母發音讀出字母G、A、0,也可以依次用中文拼音字母發音讀出字母G、A、0。作為本發明第三實施例,所述拼音語音包括中文拼音的單獨聲母發音加單獨韻母
躲立反曰。本發明實施例中,在輸入“高(中文拼音GA0) ”字時,還可以依次將該中文拼音GAO 的單獨聲母G的發音加單獨韻母AO的發音讀出G、A0。作為本發明第四實施例,所述控制命令與阿拉伯數字、中文或字母按一定排列組合綁定,并編寫在控制命令旁,作為控制命令語音輸入代碼;對于同時等候選擇的控制命令,控制命令語音輸入代碼不能重復。本發明實施例中,可以將英文字母D與“刪除”命令捆綁連接,并編寫在控制命令旁,將數字“0”與“復制”命令連接,將中文“回”與“回車”命令連接等,并編寫在控制命令旁,作為控制命令語音輸入代碼。作為本發明第五實施例,所述阿拉伯數字包括阿拉伯數字0、1、2、3、4、5、6、7、8、9
十個數字。作為本發明第六實施例,所述字母包括從A到Z 二十六個字母。本發明實施例中,進行中文語音識別輸入時,通過特定按鍵,如輸入設備的SHIFT 按鍵,切換到中文語音識別輸入模式。在該模式下,如輸入“高”字時,依次用英文字母發音或中文拼音字母發音讀出字母G、A、0,或依次將該中文拼音GAO的單獨聲母G的發音加單獨韻母AO的發音讀出G、A0,則顯示“1、高;2、搞3告;4稿;5膏;6糕…9誥。”等候選中文, 然后將要輸入的中文旁邊對應的阿拉伯數字1通過語音輸入,即可輸出顯示所要輸入的中文。本發明實施例中,用戶可以用所述語音方式輸入單個中文,也可是兩個以上中文組成的中文詞語或是完整的中文語句。如輸入中文詞語“高效”(中文拼音GA0、XIA0)時,用英文字母發音或中文拼音字母發音依次讀出字母“6、4、0、乂、1、4、0”,也可用英文字母發音或中文拼音字母發音依次讀該中文拼音的聲母,如“G、X”,或依次將該中文拼音GAO、XIAO的GAO單獨聲母G的發音加單獨韻母AO的發音讀出G、A0,及XIAO單獨聲母X的發音加單獨韻母I、AO的發音讀出X、 I、AO。再如輸入“今天”,可以用英文字母發音或中文拼音字母發音依次讀該中文拼音的聲母“ J、T”,也可以讀出J、T、I、A、N,或依次將該中文拼音JIN、TIAN中的JIN的聲母J的發音加單獨韻母IN的發音讀出J、IN,及TIAN單獨聲母T的發音加單獨韻母I、AN的發音讀出Τ、I, AN ;在所顯示的候選文字中,通過阿拉伯數字的語音輸入再次進行選擇輸出。在輸入中文語句時,方法與前述單字、詞語的語音輸入方式相同。當需要執行有關控制命令時,切換到控制命令語音識別輸入模式,在該模式下,讀出由英文字母、阿拉伯數字或相應的中文等構成的控制命令語音輸入代碼,對接收輸入的語音信號進行識別,確定要執行的控制命令,啟動命令執行程序,執行控制命令。本發明實施例中,將英文字母D與電腦命令“刪除”組合后,需要進行“刪除”操作時,讀出英文字母D,當接收到英文字母D的語音信號時,調取“刪除”命令,啟動命令執行程序,執行“刪除”命令。圖3示出了本發明實施例提供的中文及控制命令語音識別輸入裝置,所述裝置包括中文語音識別輸入單元31,用于接收外部輸入的中文語音輸入代碼的字母、拼音或數字語音信號,完成中文語音識別輸入;控制命令語音識別輸入單元32,用于接收外部輸入的與現有控制命令綁定的語音輸入代碼的字母、拼音或數字語音信號,完成控制命令語音識別輸入;語音輸入模式切換單元33,用于通過特定按鍵在中文語音識別輸入模式與控制命令語音識別輸入模式相互切換。作為本發明第七實施例,所述中文語音識別輸入單元31包括字母拼音語音信號接收模塊311,用于接收外部輸入的中文語音輸入代碼的字母或拼音語音信號;字母拼音語音信號識別模塊312,用于識別輸入的字母或拼音語音信號,檢索數據庫;中文選擇顯示模塊313,用于輸出顯示與所述語音信號一致、以阿拉伯數字順序編號的中文;數字語音信號接收模塊314,用于接收輸入的中文旁邊的阿拉伯數字語音信號;數字語音信號識別模塊315,用于識別輸入的阿拉伯數字語音信號;中文輸出模塊316,用于輸出顯示與所述阿拉伯數字語音信號一致的中文。作為本發明第八實施例,所述控制命令語音識別輸入單元32包括控制命令語音信號接收模塊321,用于接收外部輸入的與現有控制命令綁定的語音輸入代碼的字母、拼音或數字語音信號;語音信號識別模塊322,用于識別輸入的語音信號,檢索數據庫;控制命令執行模塊323,用于執行與所述語音信號一致的控制命令。在本發明實施例中,在進行中文語音識別輸入時,通過語音輸入模式切換單元33 切換到中文語音識別輸入模式;字母拼音語音信號接收模塊311接收外部輸入的中文語音輸入代碼的字母或拼音語音信號;字母拼音語音信號識別模塊312識別字母或拼音語音信號接收模塊311接收輸入的字母或拼音語音信號,檢索數據庫;中文選擇顯示模塊313依照字母拼音語音信號識別模塊312識別的結果,輸出顯示與所述語音信號一致、以阿拉伯數字順序編號的中文;數字語音信號接收模塊314接收輸入的中文旁邊的阿拉伯數字語音信號;數字語音信號識別模塊315識別數字語音信號接收模塊314接收輸入的阿拉伯數字語音信號;中文輸出模塊316根據數字語音信號識別模塊315識別的結果,輸出顯示與所述阿拉伯數字語音信號一致的中文。在進行控制命令語音識別輸入時,通過語音輸入模式切換單元33切換到控制語音識別輸入模式;控制命令語音信號接收模塊321接收外部輸入的與現有控制命令綁定的語音輸入代碼的字母、拼音或數字語音信號;語音信號識別模塊322識別控制命令語音信號接收模塊321接收輸入的語音信號,檢索數據庫;控制命令執行模塊323根據語音信號識別模塊322識別的結果,執行與所述語音信號一致的控制命令。本發明實施例的另一目的在于提供一種包含所述裝置的語音識別輸入設備。本發明通過采用阿拉伯數字及字母組成中文語音輸入代碼和控制命令語音輸入代碼,并根據中文語音輸入代碼和控制命令語音輸入代碼進行語音輸入,實現了快速、準確地輸入中文和控制命令,減少了對語音信號的對比數量,大大提高了語音信號識別的準確率,達到語音輸入中文與控制命令的唯一識別。以上所述僅為本發明的較佳實施例而已,并不用以限制本發明,凡在本發明的精神和原則之內所作的任何修改、等同替換和改進等,均應包含在本發明的保護范圍之內。
權利要求
1.一種中文及控制命令語音識別輸入方法,其特征在于,所述中文語音識別輸入方法包括以下步驟接收外部輸入的中文語音輸入代碼的字母或拼音語音信號; 識別輸入的字母或拼音語音信號,檢索數據庫;輸出顯示與所述字母或拼音語音信號一致、以阿拉伯數字順序編號的中文;接收輸入的中文旁邊的阿拉伯數字語音信號;識別輸入的阿拉伯數字語音信號;輸出顯示與所述阿拉伯數字語音信號一致的中文;所述控制命令語音識別輸入方法包括以下步驟接收外部輸入的與現有控制命令綁定的語音輸入代碼的字母、拼音或數字語音信號; 識別輸入的語音信號,檢索數據庫; 執行與所述語音信號一致的控制命令。
2.如權利要求1所述的方法,其特征在于,所述方法通過特定按鍵在中文語音識別輸入模式與控制命令語音識別輸入模式相互切換。
3.如權利要求1所述的方法,其特征在于,所述字母語音包括漢語字母發音和英語字母發音。
4.如權利要求1所述的方法,其特征在于,所述拼音語音包括中文拼音的單獨聲母發音加單獨韻母發音。
5.如權利要求1所述的方法,其特征在于,所述控制命令與阿拉伯數字、中文或字母按一定排列組合綁定,并編寫在控制命令旁,作為控制命令語音輸入代碼;對于同時等候選擇的控制命令,控制命令語音輸入代碼不能重復。
6.如權利要求1所述的方法,其特征在于,所述阿拉伯數字包括阿拉伯數字0、1、2、3、 4、5、6、7、8、9十個數字。
7.如權利要求1所述的方法,其特征在于,所述字母包括從A到Z二十六個字母。
8.一種中文及控制命令語音識別輸入裝置,其特征在于,所述裝置包括中文語音識別輸入單元,用于接收外部輸入的中文語音輸入代碼的字母、拼音或數字語音信號,完成中文語音識別輸入;控制命令語音識別輸入單元,用于接收外部輸入的與現有控制命令綁定的語音輸入代碼的字母、拼音或數字語音信號,完成控制命令語音識別輸入;語音輸入模式切換單元,用于通過特定按鍵在中文語音識別輸入模式與控制命令語音識別輸入模式相互切換。
9.如權利要求8所述的裝置,其特征在于,所述中文語音識別輸入單元包括字母拼音語音信號接收模塊,用于接收外部輸入的中文語音輸入代碼的字母或拼音語音信號;字母拼音語音信號識別模塊,用于識別輸入的字母或拼音語音信號,檢索數據庫; 中文選擇顯示模塊,用于輸出顯示與所述語音信號一致、以阿拉伯數字順序編號的中文;數字語音信號接收模塊,用于接收輸入的中文旁邊的阿拉伯數字語音信號; 數字語音信號識別模塊,用于識別輸入的阿拉伯數字語音信號;中文輸出模塊,用于輸出顯示與所述阿拉伯數字語音信號一致的中文。
10.如權利要求8所述的裝置,其特征在于,所述控制命令語音識別輸入單元包括控制命令語音信號接收模塊,用于接收外部輸入的與現有控制命令綁定的語音輸入代碼的字母、拼音或數字語音信號;語音信號識別模塊,用于識別輸入的語音信號,檢索數據庫; 控制命令執行模塊,用于執行與所述語音信號一致的控制命令。
全文摘要
本發明適用于語音識別領域,提供了一種中文及控制命令語音識別輸入方法、裝置,所述中文語音識別輸入方法包括接收外部輸入的中文語音輸入代碼的字母或拼音語音信號;識別輸入的語音信號;輸出顯示與語音信號一致、以阿拉伯數字順序編號的中文;接收輸入的中文旁邊的阿拉伯數字語音信號;識別輸入的阿拉伯數字語音信號;輸出中文;所述控制命令語音識別輸入方法包括接收外部輸入的控制命令語音輸入代碼的語音信號;識別輸入的語音信號;執行控制命令。本發明通過用阿拉伯數字及字母組成中文語音輸入代碼和控制命令語音輸入代碼,并根據中文語音輸入代碼和控制命令語音輸入代碼進行語音輸入,實現快速、準確輸入中文和控制命令。
文檔編號G06F3/16GK102221985SQ201010148499
公開日2011年10月19日 申請日期2010年4月16日 優先權日2010年4月16日
發明者韋宏偉, 韋建功 申請人:韋宏偉