專利名稱:基于music和調制譜濾波的語音信號動態特征提取方法
技術領域:
本發明涉及一種漢語音信號動態特征參數提取方法,特別涉及一種基于MUSIC和調制譜濾波的語音信號動態特征參數提取方法。
背景技術:
語音識別最基礎最重要的開發環節是語音信號特征參數的提取。早在上世紀40年代,R. K. Potter等人提出了 “Visible Speech”的概念,指出語譜圖對語音信號有很強的描述能力,并且試著用語譜信息進行語音識別,這就形成了最早的語音特征。到了 50年代,人們發現要對語音信號進行識別就必須從語音波形中提取能夠反映語音特性的某些參數,這樣不僅可以減小模板數目、運算量及存儲量,而且可以濾除語音信號中無用的冗余信息,于是就出現了幅度、短時幀平均能量、短時幀過零率、短時自相關系數等。隨著識別技術的發展,人們發現時域中的特征參數其穩定性和區分能力都不是很好,于是開始利用頻域參數作為語音信號的特征,比如基音周期、共振峰頻率、線性預測系數(LPC)、線譜對(LSP)、倒譜系數等,目前使用最為廣泛的特征參數是基于人耳聽覺模型的美爾倒譜系數(MFCC)。但是這些參數一旦應用于噪聲環境時,其性能會急劇下降。而且上面所提出的特征參數都反映語音的靜態特征,語音信號的動態特性是指從連續幾幀語音中提取的特征參數,比如可以通過靜態特征的差分參數和加速度參數來獲取,但差分參數和加速度參數并不能將動態信息挖掘得很充分,所以它們尚不能很好地反映語音信號的動態特性。
發明內容
本發明所要解決的技術問題是提供一種簡單且高魯棒的基于MUSIC和調制譜濾波的語音信號動態特征參數提取方法,通過使用該方法,使語音識別系統的性能在低信噪比環境下有了顯著的提高。本發明的技術解決方案是
一種基于MUSIC和調制譜濾波的語音信號動態特征提取方法,包括以下步驟
1、語音信號預處理
通過麥克風輸入語音信號,由處理單元采樣量化后獲得相應語音數據,然后進行預加重、分幀加窗和端點檢測;
2、MUSIC譜估算
根據矩陣理論,獲得預處理后每幀數據向量的自相關矩陣特征值和特征矢量,將特征矢量空間分解為信號子空間和噪聲子空間,進而根據這兩個空間之間的正交關系來估算信號譜,其功率譜函數為
權利要求
1. 一種基于MUSIC和調制譜濾波的語音信號動態特征提取方法,其特征是包括以下步驟1.1、語音信號預處理通過麥克風輸入語音信號,由處理單元采樣量化后獲得相應語音數據,然后進行預加重、分幀加窗和端點檢測;1. 2、MUSIC譜估算根據矩陣理論,獲得預處理后每幀數據向量的自相關矩陣特征值和特征矢量,將特征矢量空間分解為信號子空間和噪聲子空間,進而根據這兩個空間之間的正交關系來估算信號譜,其功率譜函數為
2.根據權利要求1所述的基于MUSIC和調制譜濾波的語音信號動態特征提取方法,其特征是所述語音信號預處理時,采樣量化由處理單元以11.025kHz的采樣頻率、16bit的量化精度進行;預加重是通過一階數字預加重濾波器實現,其預加重濾波器的系數取值為O.93-0. 97之間;以幀長N=256點的標準進行分幀,并對分幀后的數據加漢明窗處理,端點檢測是利用短時能零積法進行。
3.根據權利要求1所述的基于MUSIC和調制譜濾波的語音信號動態特征提取方法,其特征是所述MUSIC譜估算時,采用基于奇異值分解的方法確定數據的自相關矩陣的特征值。
4.根據權利要求1所述的基于MUSIC和調制譜濾波的語音信號動態特征提取方法,其特征是所述調制譜濾波時,采用加漢明窗平滑后的結果;采用的濾波器為
5.根據權利要求1所述的基于MUSIC和調制譜濾波的語音信號動態特征提取方法,其特征是所述調制譜能量和計算時,采用每幀的前15幀和后16幀以及當前幀共32幀作為當前幀的調制譜計算數據。
6.根據權利要求2所述的基于MUSIC和調制譜濾波的語音信號動態特征提取方法,其特征是所述預加重濾波器的系數取值為O. 9375。
7.根據權利要求1所述的基于MUSIC和調制譜濾波的語音信號動態特征提取方法,其特征是所述離散余弦變換時,倒譜系數個數L=12。
全文摘要
一種基于MUSIC和調制譜濾波的語音信號動態特征提取方法,其主要包括語音信號預處理、MUSIC譜估算、調制譜濾波、調制譜能量和計算、對數能量計算(Log)及離散余弦變換(DCT)。由于調制譜具有時頻集聚性,它不僅可以充分地反映語音之間的動態特征而且對語音環境的敏感度較低,所以根據干擾信號與語音信號在調制信息中不同的反映,采用基于多信號分類法譜估算技術,并對得到的MUSIC譜進行調制譜濾波,然后提取其倒譜系數作為特征參數。與現有方法相比,具有很好的魯棒性,不僅使語音識別系統的識別率有了顯著的提高,而且對語音信號的后續研究起到了很好的鋪墊作用。
文檔編號G10L15/02GK103021405SQ20121051517
公開日2013年4月3日 申請日期2012年12月5日 優先權日2012年12月5日
發明者韓志艷, 倫淑嫻, 王健, 郭艷東, 王東, 郭兆正, 王麗君 申請人:渤海大學