合成音頻信號的裝置與方法、解碼器、編碼器、系統以及計算機程序的制作方法

文檔序號：9291758閱讀：642來源：國知局

合成音頻信號的裝置與方法、解碼器、編碼器、系統以及計算機程序的制作方法
【技術領域】
[0001] 本發明涉及音頻編碼領域，更具體地，涉及合成音頻信號領域。實施例涉及語音編碼，具體地，涉及稱為碼激發線性預測編碼（CELP)的語音編碼技術。實施例提供用于在新穎或固定碼本中形成CELP的碼的過程中進行自適應傾斜補償的方法。
【背景技術】
[0002] CELP編碼方案廣泛地用于語音通信中，且是對語音進行編碼的高效方式。CELP通過將兩個激發的和傳遞至線性預測濾波器（例如，LPC合成濾波器1/A(z))來合成音頻信號。一個激發來自經過解碼的過去（其被稱為自適應碼本），且另一貢獻來自由固定碼填充的固定或新穎碼本。CELP編碼方案的一個問題在于，在低比特率下，新穎碼本未被充分地填充以用于高效地對語音的精細結構進行模型化（modeling)，從而感知的質量降級且所合成的輸出信號聽起來嘈雜。
[0003] 為了減輕編碼偽像，在參考文獻[1]中和參考文獻[2]中已經提出和描述了不同的解決方案。在這些參考中，通過增強對應于音頻信號的當前幀的共振峰（formant)的頻譜區域來自適應地且頻譜地（spectrally)形成新穎碼本的碼。共振峰位置及形狀可直接根據LPC系數來推斷，LPC系數為在編碼器及解碼器兩者處都可用的系數。對新穎碼本的碼c(n)的共振峰增強是通過以下簡單濾波操作實現的：
[0004] c (n) *fe (n) 〇
[0005] 亦此濾被討趕中，f_ W縣縣有以下轉移函數的濾波器的脈沖響應：
[0006]
[0007] 其中wl及w2為兩個加權常數，其或多或少地強調轉移函數Fjz)的共振峰結構。新穎碼本的所得的所形成的碼繼承了語音信號的一個特性且所合成的信號聽起來噪聲較少。
[0008] 在CELP編碼方案中，通常還將向新穎碼本的碼添加頻譜傾斜，這是通過如下對來自新穎碼本的碼進行如下濾波來實現的：
[0009] Ft(z) =1-0Z工。
[0010] 因子0與先前音頻幀的發聲有關，且可根據來自自適應碼本的能量貢獻估計發聲。舉例而言，若先前幀有聲，則預期當前幀亦有聲，并且碼將在低頻中具有更多能量，BP，頻譜具有負傾斜。

【發明內容】

[0011] 本發明的目的是提供一種用于合成音頻信號的改進方法。
[0012] 此目的是通過根據權利要求1的裝置及通過根據權利要求19的方法來實現的。
[0013] 本發明提供一種用于合成音頻信號的裝置，所述裝置包括處理單元，該處理單元被配置為將頻譜傾斜應用于用于合成所述音頻信號的當前幀的碼本的碼，其中所述頻譜傾斜基于所述音頻信號的當前幀的頻譜傾斜。
[0014] 本發明提供一種用于合成音頻信號的方法，所述方法包括將頻譜傾斜應用于用于合成所述音頻信號的當前幀的碼本的碼，其中所述頻譜傾斜是基于所述音頻信號的當前幀的頻譜傾斜確定的。
[0015] 本申請的發明人發現，通過在合成信號時利用音頻信號的頻譜傾斜的性質來改進可實現的編碼增益，可以在低比特率及較高比特率處都進一步改進音頻信號的合成。根據實施例，本發明涉及語音編碼，例如，使用CELP語音編碼技術，該CELP語音編碼技術允許增強CELP的編碼增益，從而增強經過解碼或合成的信號的感知質量。本發明的方法是基于發明人的以下發現：可通過根據當前處理的實際輸入信號的頻譜傾斜的函數，適配碼本的碼 (例如，CELP新穎碼本的碼）的頻譜傾斜，來實現這一改進。本發明的方法是有利的，這是因為，除了增強的編碼增益外，在低比特率下（其中新穎碼本未被充分填充以用于高效地模型化語音的精細結構），其還允許進一步的共振峰增強。在較高比特率下（其中新穎碼本被充分填充），應用本發明的方法將增強編碼增益。更具體地，在較高比特率下，可不需要共振峰增強，這是因為新穎碼本對于適當地模型化語音的精細結構來講足夠大，且進一步增強共振峰將使所合成的信號聽起來過于合成。然而，最佳碼并非在頻譜上平坦的，且添加頻譜傾斜將增強編碼增益。根據實施例，對將要應用于新穎碼本的碼的最佳傾斜的估計越準確，其與輸入信號的當前幀的傾斜關聯越清晰（specifically)。
[0016] 根據實施例，基于針對音頻信號的當前幀的頻譜包絡信息確定音頻信號的當前幀的頻譜傾斜，其中頻譜包絡信息可由LPC系數定義。此實施例是有利的，因為其允許基于已經在編碼器及解碼器兩者處可用的信息（即，LPC系數）確定當前幀的頻譜傾斜。
[0017] 根據另外實施例，可基于LPC合成濾波器的截斷無限脈沖響應確定基于LPC系數的音頻信號的當前幀的頻譜傾斜。根據實施例，截斷可由新穎碼本的大小（亦即，新穎碼本中的碼的數目）確定。此方法是有利的，因為其允許使頻譜傾斜的確定與新穎碼本的實際大小直接有關。
[0018] 根據另外實施例，無限脈沖響應可以是具有未加權的轉移函數或加權的轉移函數的LPC合成濾波器的無限脈沖響應。使用未加權的轉移函數允許對頻譜傾斜進行簡化確定，而使用加權的轉移函數是有利的，這是因為其允許具有更接近最佳傾斜的斜率的頻譜傾斜。
[0019] 根據實施例，通過基于包括頻譜傾斜的轉移函數對來自碼本的碼進行濾波，將所確定的頻譜傾斜應用于各個碼。此實施例是有利的，因為可通過簡單的濾波過程實現增強。
[0020] 根據又一實施例，可將當前幀的頻譜傾斜與同音頻信號的先前幀的發聲有關的因子進行組合，例如，通過基于包括頻譜傾斜及該因子的轉移函數對來自碼本的碼濾波來實現。此方法是有利的，因為其提供獲得最佳傾斜的更好估計的可能性。
[0021] 本發明提供一種包括用于合成音頻信號的本發明裝置的音頻解碼器。
[0022] 本發明提供一種用于解碼音頻信號的音頻解碼器，其中音頻解碼器被配置為將頻譜傾斜應用于用于合成所述音頻信號的當前幀的碼本的碼，其中所述頻譜傾斜基于所述音頻信號的當前幀的頻譜傾斜。
[0023] 本發明提供一種用于對音頻信號進行編碼的編碼器，其中所述音頻編碼器被配置為根據所述音頻信號的當前幀的頻譜傾斜確定針對表示所述音頻信號的當前幀的碼本的碼的頻譜傾斜。
[0024] 本發明提供一種系統，所述系統包括本發明的音頻解碼器及本發明的音頻編碼器。
[0025] 本發明提供一種存儲指令的非瞬時計算機介質，所述指令當在計算機上運行時執行用于合成音頻信號的本發明方法。
【附圖說明】
[0026] 現將結合附圖進一步詳細地描述本發明的實施例，其中：
[0027] 圖1示出了根據第一實施例的用于合成音頻信號的本發明的裝置的示意性表示；
[0028] 圖2示出了根據本發明的第二實施例的信號合成器的簡化框圖，該信號合成器基于CELP方案進行操作；
[0029] 圖3示出了根據本發明的另一實施例的信號合成器的簡化框圖，其再次應用加入了先前幀的發聲的CELP編碼方案；
[0030] 圖4示出了根據本發明的教導進行操作的解碼器（例如，語音解碼器）的實施例；以及
[0031] 圖5示出了根據本發明的教導進行操作的編碼器（例

完整全部詳細技術資料下載

當前第1頁1 2 3 4