語音基音周期估計方法和裝置制造方法
【專利摘要】本發明涉及一種語音基音周期估計方法和裝置。所述裝置包括:信號預處理單元、歸一化自相關函數計算單元和基音周期后處理單元。所述方法包括:S1、對語音信號進行除去直流分量、感知加權和信號下采樣的預處理;S2、計算所述預處理后的語音信號的歸一化自相關函數值;S3、確定基音周期搜索范圍內所述歸一化自相關函數值中的最大值,將所述最大值對應的基音周期候選值確定為所述語音信號的基音周期估計值。本發明較好地克服了基音周期估計中的倍頻和半頻錯誤,提升了基音周期估計方法的抗噪聲性能,同時降低了算法的運算復雜度,改進了相應的數字音頻/語音編碼效率。本發明能夠適用于各種語音編解碼算法中的基音搜索,具有廣泛的適用性。
【專利說明】語音基音周期估計方法和裝置
【技術領域】
[0001]本發明涉及語音編碼技術,更具體地說,涉及一種語音基音周期估計方法和裝置。【背景技術】
[0002]基音周期是指人發音時聲帶振動的周期。基音周期是語音編碼中一個重要的問題,其準確性將直接影響到語音編碼器的編碼質量和效率。準確的基音周期性分析,可以在語音編碼過程中有效地去除冗余,降低編碼的比特數,實現低比特率高質量語音編碼。但是,由于語音的特殊性,基音周期的準確搜索會面臨如下困難:
[0003](I)語音信號變化十分復雜,聲門激勵波形不是一個完全的周期脈沖串,并且語音波形的周期是時變的。
[0004](2)在語音的開頭和結尾部分并不具有聲帶振動那樣的周期性,有些清濁音等過渡音是很難判定它屬于周期或非周期信號,從而也就無法估計基音周期。
[0005](3)要從語音信號中去除聲道影響,直接取出僅和聲帶振動有關的信息比較困難。
[0006](4)在濁音段定義每個基音周期的準確開始和結束這一困難限制了基音的可靠測量,這不僅因為語音信號本身是準周期的(即基音是有變化的),同時也因為波形易受共振峰和噪聲等的影響。
[0007](5)在實際應用中,背景噪聲會影響基音檢測的性能,對于移動通信環境尤為重要,因為波形經常會出現高電平噪聲。
[0008](6)基音周期變化范圍較大也給準確基音檢測帶來了一定的困難。
[0009]目前,還沒有一種通用的方法能精確可靠地提取出語音在任一情況下的基音周期。傳統的基音檢測方法,可分為時域法和頻域法。在時域,傳統的基音周期算法包括基于平均幅度差函數(Average Magnitude Difference Function, AMDF)的基音估計算法、基于短時自相關函數(Autocorrelation Function, ACF)基音檢測算法。這兩種算法可以參見如下文獻的介紹:
[0010]Chu, Wai C.Speech coding algorithms !foundation and evolution ofstandardized coders.John ffiley&Sons, Inc.2003, pp.33-45。
[0011]在頻域的角度,Griffin和Lim提出了一種頻域基音周期估計方案(D.ff.Griffin,J.S.Lim.Multiband Excitation Vocoder.1EEE Trans ASSP, 1988, 36 (8)),用于多帶激勵語音編碼算法(MBE), 這種基音周期估計算法采用閉環分析合成方法,匹配信號頻域波形,得到最優基音周期估計。
[0012]在實際應用中,基于時域的基音搜索算法由于其算法簡單,性能較佳而得到廣泛應用。例如在當前的語音編碼標準G.729、AMR-WB中,均采取了時域改進的短時自相關函數(ACF)基音檢測算法(鮑長春.低碼率數字語音編碼基礎.北京:北京工業大學出版社,2001.2.)。但是,通常時域的ACF方法容易產生“倍頻”和“半頻”錯誤,AMDF方法不能有效跟蹤語音頻率快速變化。頻域方法一般采用倒譜法,由于引入對數運算,使計算量大幅度增加,且易受噪音的影響。
【發明內容】
[0013]本發明要解決的技術問題在于,針對現有技術的上述缺陷,提供一種低復雜度、高效的語音基音周期估計方法和裝置,能較好地克服基音周期估計中的倍頻與半頻錯誤,并能提升抗噪聲性能。
[0014]本發明解決其技術問題所采用的技術方案是:提出一種語音基音周期估計方法,包括如下步驟:
[0015]S1、對語音信號進行除去直流分量、感知加權和信號下采樣的預處理;
[0016]S2、使用下式計算所述預處理后的語音信號的歸一化自相關函數值:
[0017]
【權利要求】
1.一種語音基音周期估計方法,其特征在于,包括如下步驟: 51、對語音信號進行除去直流分量、感知加權和信號下采樣的預處理; 52、使用下式計算所述預處理后的語音信號的歸一化自相關函數值:
2.根據權利要求1所述的方法,其特征在于,所述步驟SI進一步包括: 511、對語音信號重采樣到內部采樣率; 512、對重采樣的語音信號進行高通濾波以除去直流分量; 513、對高通濾波后的語音信號進行感知加權; 514、對感知加權后的語音信號進行低通濾波和1/2下采樣。
3.根據權利要求2所述的方法,其特征在于,所述內部采樣率為12.8kHz,所述高通濾波的截止頻率為50Hz。
4.根據權利要求1所述的方法,其特征在于,所述步驟S3進一步包括: 531、依據語音信號的采樣率,將基音周期搜索范圍劃分成第一區間、第二區間和第三區間,分別得到各個區間的歸一化自相關函數最大值和對應的基音周期候選值; 532、依據一定的權重參數,從所述三個區間的歸一化自相關函數最大值中選擇出所述基音周期搜索范圍的歸一化自相關函數最大值,將該最大值對應的基音周期候選值確定為所述語音信號的基音周期估計值。
5.根據權利要求4所述的方法,其特征在于,所述步驟S32進一步包括:判斷第二區間的歸一化自相關函數最大值是否大于等于第一區間的歸一化自相關函數最大值與所述權重參數的乘積,如果是,則將第二區間的歸一化自相關函數最大值對應的基音周期候選值確定為所述語音信號的基音周期估計值,否則,進一步判斷第三區間的歸一化自相關函數最大值是否大于等于第一區間的歸一化自相關函數最大值與所述權重參數的乘積,如果是,則將第三區間的歸一化自相關函數最大值對應的基音周期候選值確定為所述語音信號的基音周期估計值,否則將第一區間的歸一化自相關函數最大值對應的基音周期候選值確定為所述語音信號的基音周期估計值。
6.根據權利要求5所述的方法,其特征在于,所述第一區間、第二區間和第三區間具體為[L_min,39],[40,79],[80,L_max],其中L_min表示基音周期搜索范圍的起始值,L_max表示基音周期搜索范圍的結束值。
7.一種語音基音周期估計裝置,其特征在于,包括: 信號預處理單元,對語音信號進行除去直流分量、感知加權和信號下采樣的預處理; 歸一化自相關函數計算單元,使用下式計算所述預處理后的語音信號的歸一化自相關函數值:
8.根據權利要求7所述的裝置,其特征在于,所述信號預處理單元進一步對語音信號重采樣到內部采樣率,然后對重采樣的語音信號進行高通濾波以除去直流分量,隨后對高通濾波后的語音信號進行感知加權,最后對感知加權后的語音信號進行低通濾波和1/2下采樣。
9.根據權利要求7所述的裝置,其特征在于,所述基音周期后處理單元進一步依據語音信號的采樣率,將基音周期搜索范圍劃分成第一區間、第二區間和第三區間,分別得到各個區間的歸一化自相關函數最大值和對應的基音周期候選值,并依據一定的權重參數,從所述三個區間的歸一化自相關函數最大值中選擇出所述基音周期搜索范圍的歸一化自相關函數最大值,將該最大值對應的基音周期候選值確定為所述語音信號的基音周期估計值。
10.根據權利要求9所述的裝置,其特征在于,所述基音周期后處理單元依據一定的權重參數從所述三個區間的歸.一化自相關函數最大值中選擇出所述基音周期搜索范圍的歸一化自相關函數最大值具體為:判斷第二區間的歸一化自相關函數最大值是否大于等于第一區間的歸一化自相關函數最大值與所述權重參數的乘積,如果是,則將第二區間的歸一化自相關函數最大值對應的基音周期候選值確定為所述語音信號的基音周期估計值,否貝U,進一步判斷第三區間的歸一化自相關函數最大值是否大于等于第一區間的歸一化自相關函數最大值與所述權重參數的乘積,如果是,則將第三區間的歸一化自相關函數最大值對應的基音周期候選值確定為所述語音信號的基音周期估計值,否則將第一區間的歸一化自相關函數最大值對應的基音周期候選值確定為所述語音信號的基音周期估計值。
【文檔編號】G10L19/00GK103474074SQ201310409433
【公開日】2013年12月25日 申請日期:2013年9月9日 優先權日:2013年9月9日
【發明者】閆建新, 張勇 申請人:深圳廣晟信源技術有限公司