基于振動的聲音識別系統和識別方法
【技術領域】
[0001]本發明涉及聲音識別的技術領域,尤其是指基于振動的聲音識別系統和識別方法。
【背景技術】
[0002]聲音識別技術是一種行為識別技術,根據識別設備不斷地測量、記錄聲音的波形和變化,聲音識別基于將現場采集到的聲音同登記過的聲音模板進行精確的匹配,完成識別過程。對于聲音識別技術來說,由于不需要過多的接觸以及實體間交互模式的認證,因此,它在使用中無疑要比其他識別技術更加的便利。而在配置過程中,由于當前大多的IT產品都已經安裝了聲卡和話筒,因而它的構架上也可以節約更多的成本。此外,對于使用環境來說,由于不需要像監控設備那樣對角度有著更高的要求,所以語音識別系統的使用環境無疑也會更加的隨意和隱蔽。再者,聲音識別也是一種非接觸的識別技術,用戶可以很自然地接受。
[0003]近幾年,聲音識別技術的應用途徑和應用前景將越來越廣泛,日益增多的聲音識別技術應用到機器、儀器上,以減少人工操作,如聽寫機、對講翻譯機等語音識別產品仍大量使用。作為一種識別技術其缺點在于:聲音變化的范圍太大,很難精確的匹配;聲音會隨著音量、速度和音質的變化(例如感冒時)而影響到采集與比對的結果;很容易用錄在磁帶上的聲音來欺騙聲音識別系統,而高保真的麥克風很昂貴不適合普通用戶,鑒于聲音識別技術本身目前還處于初級階段,仍是一項復雜、艱巨的任務,同時其應用領域也有待拓展。
[0004]目前聲音識別技術應用最廣泛的是電信業務。在美國,首先提出的聲激電話能通過聲音指令撥通20個人名的電話,使用時,只需按下聲音撥號機的按鈕,即可接通電話公司的計算機,按要求編制出姓名和號碼的程序,在家打電話,只需對著撥號機叫一下對方的名字,電話即可接通。現階段,聲音識別的準確性是識別技術中最難克服的問題,即使識別設備不斷地測量、記錄聲音的波形和變化,而外界環境的影響可能使現場采集到的聲音同登記過的聲音模板無法進行精確的匹配。
[0005]而對聲音識別中算法的要求,一般聲音識別算法存在的占用CPU時間長、識別速度跟不上語速的弱點,聲音識別正確率較低。現有技術上的缺陷主要表現如下:聲音識別的準確性較差,采集到的聲音信號和聲音模板無法得到精確的匹配;聲音識別算法占用CPU時間較長,識別速度較慢。
【發明內容】
[0006]為此,本發明所要解決的技術問題在于克服現有技術中所述語音識別準確率低、占用CPU的時間長且識別速度慢等問題從而提供一種聲音識別的準確性高,且能將采集到的聲音信號和聲音模板精確匹配的基于振動的聲音識別系統以及識別方法。
[0007]為解決上述技術問題,本發明所述的基于振動的聲音識別系統,包括振動器以及與所述振動器相連接的識別器,其中所述識別器上設有MIC放大器、A/D轉換器、以及語音處理器,所述振動器產生的振動聲音轉換成語音特征信號,所述語音特征信號經過所述MIC放大器的放大后,所述A/D轉換器將模擬量轉化成數字量,再將所述數字量輸入所述語音處理器中進行語音識別,所述語音處理器利用隱馬爾科夫模型對所述數字量進行特征提取,調用所述隱馬爾可夫模型進行聲音識別的訓練,不斷修改隱馬爾可夫模型參數,以獲取最佳參數值,根據所述最佳參數值確定算法將所述數字量轉換成識別模型,所述識別模型與樣本庫所存聲音模板進行匹配識別。
[0008]在本發明的一個實施例中,所述識別器上還設有I/O控制器,所述語音識別完成后進入I/o控制器完成語音控制。
[0009]在本發明的一個實施例中,所述I/O控制器與所述語音處理器相連接。
[0010]在本發明的一個實施例中,所述MIC放大器與所述A/D轉換器相連接,所述A/D轉換器與所述語音處理器相連接。
[0011]本本發明的一個實施例中,所述振動器產生的振動聲音經過聲音傳感器轉換成語音特征信號。
[0012]本發明還提供了一種根據上述任意一項所述的基于振動的聲音識別系統用于識別聲音的方法如下:步驟S1:根據所述振動器的振動發出的聲音轉換成語音特征信號;步驟S2:所述語音特征信號經過所述MIC放大器的放大后,所述A/D轉換器將模擬量轉化成數字量;步驟S3:所述語音處理器:利用隱馬爾科夫模型對所述數字量進行特征提取,調用所述隱馬爾可夫模型進行聲音識別的訓練,不斷修改隱馬爾可夫模型參數,以獲取最佳參數值,根據所述最佳參數值確定算法將所述數字量轉換成識別模型,所述識別模型與樣本庫所存聲音模板進行匹配識別;步驟S4:若所述識別模型與所述聲音模板的特征相匹配,則輸出高電平,完成語音的識別。
[0013]在本發明的另一個實施例中,所述語音特征信號包括語音在短時間段的平均聲音強度以及由振動產生的聲音的方向不斷變化的電信號在給定的短時間段內通過零軸的次數。
[0014]在本發明的另一個實施例中,所述隱馬爾可夫模型用一個三元組表示為λ=(Α,Β,π ),其中,A={au}為狀態轉移概率矩陣;B ={bj(k)}是觀測信號概率密度;={> J為初始狀態概率集合。
[0015]在本發明的另一個實施例中,所述樣本庫中所存聲音模板是將聲音樣本量化后存入至樣本文件中。
[0016]在本發明的另一個實施例中,所述識別器設置在特定芯片內。
[0017]本發明的上述技術方案相比現有技術具有以下優點:
本發明所述聲音識別具有精確的準確性,和聲音模板可以得到精確的匹配,另外,基于振動聲音識別算法的優化和聲音識別集成電路的設置,提高了識別速度。
【附圖說明】
[0018]為了使本發明的內容更容易被清楚的理解,下面根據本發明的具體實施例并結合附圖,對本發明作進一步詳細的說明,其中
圖1是本發明基于振動的聲音識別系統的流程圖;
圖2是本發明基于振動的聲音識別的方法流程圖。
【具體實施方式】
[0019]實施例一:
如圖1所示,本實施例提供一種基于振動的聲音識別系統,包括振動器10以及與所述振動器10相連接的識別器15,其中所述識別器15上設有MIC放大器11、A/D轉換器12、以及語音處理器13,所述振動器10產生的振動聲音轉換成語音特征信號,所述語音特征信號經過所述MIC放大器11的放大后,所述A/D轉換器12將模擬量轉化成數字量,再將所述數字量輸入所述語音處理器中進行語音識別,所述語音處理器13利用隱馬爾科夫模型對所述數字量進行特征提取,調用所述隱馬爾可夫模型進行聲音識別的訓練,不斷修改隱馬爾可夫模型參數,以獲取最佳參數值,根據所述最佳參數值確定算法將所述數字量轉換成識別模型,所述識別模型與樣本庫所存聲音模板進行匹配識別。
[0020]本發明所述的基于振動的聲音識別系統,包括振動器10以及與所述振動器10相連接的識別器15,通過敲擊所述振動器10產生的聲音,不會因為其它人聲或者發音的差異而被干擾,所以信號源比較單純,且信號簡單,聲音識別的準確性較高;所述識別器15上設有MIC放大器11、A/D轉換器12、以及語音處理器13,所述振動器10產生的振動聲音轉換成語音特征信號,所述語音特征信號經過所述MIC放大器11的放大后,所述A/D轉換器12將模擬量轉化成數字量,再將所述數字量輸入所述語音處理器13中進行語音識別,所述語音處理器13利用隱馬爾科夫模型對所述數字量進行特征提取,調用所述隱馬爾可夫模型進行聲音識別的訓練,不斷修改隱馬爾可夫模型參數,以獲取最佳參數值,根據所述最佳參數值確定算法將所述數字量轉換成識別模型,所述識別模型與樣本庫所存聲音模板進行匹配識別。本發明所述的聲音識別系統,通過振動產生的聲音直接識別集成電路的設置不易受外界環境的干擾,不但提高了聲音識別的準確性以及識別速度,而且有利于將采集到的聲音信號和聲音模板進行精確的匹配,也能有效提高配對速度,使語音識別的速度提高。
[0021]所述MIC放大器11與所述A/D轉換器12相連接,所述振動器10產生的振動聲音轉換成語音特征信號,所述語音特征信號經過所述MIC放大器11的放大后傳輸至所述A/D轉換器12,所述A/D轉換器12與所述語音處理器13相連接,所述A/D轉換器12將模擬量轉化成數字量,再將所述數字量輸入所述語音處理器13中進行語音識別。
[0022]所述識別器15上還設有I/O控制器14,所述語音識別完成后進入所述I/O控制器14完成語音控制。所述I/O控制器14與所述語音處理器13相連接,所述語音識別完成后根據所述I/O控制器14完成語音控制的相應功能。具體地,為了實現語音識別完成后根據所述I/O控制器14完成語音控制的相應功能,本發明所述的識別器15上還設有相應的外電路。
[0023]本發明所述振動器10產生的振動聲音經過聲音傳感器轉換成語音特征信號,所述語音特征信號經過所述MIC放大器11放大后,利用所述A/D轉換器12轉換,使放大后的電信號的模擬量轉化成數字量,將數字量輸入語音處理器13進行語音識別,基于語音識別算法完成識別后進入所述I/O控制器14完成語音控制。
[0024]本發明所述聲音識別設備不斷地測量、記錄聲音的波形和變化,基于振動將采集到的聲音同登記過的聲音模板進行精確的匹配,能有效提高配對速度,使語音識別的速度
[0025]實施例二:
本發明還提供了一種基于振動的聲音識別系統用于識別聲音的方法如下:步驟S1:根據所述振動器10的振動發出的聲音轉換成語音特征信號;步驟S2:所述語音特征信號經過所述MIC放大器11的放大后,所述A/D轉換器12將模擬量轉化成數字量;步驟S3:所述語音處理器13利用隱馬爾科夫模型對所述數字量進行特征提取,調用所述隱馬爾可夫模型進行聲音識別的訓練,不斷修改隱馬爾可夫模型參數,以獲取最佳參數值,根據所述最佳參數值確定算法將所述數字量轉換成識別模型,所述識別模型與樣本庫所存聲音模板進行匹配識別;步驟S4:若所述識別模型與所述聲音模板的特征相匹配,則輸出高電平,完成語音的識別。
[0026]本發明所述的基于振動的聲音識別方法,所述步驟SI中,根據所述振動器10的振動發出的聲音轉換成語音特