編碼方法、解碼方法、編碼裝置、解碼裝置、程序、記錄介質的制作方法
【專利摘要】在編碼處理中,對將來自音響信號的頻域的樣本串除以加權包絡、除以增益所得的結果進行量化,從而將各樣本進行可變長編碼。使用此時在可變長編碼中可節省的信息,對量化前的樣本和量化后的樣本的誤差進行量化。決定根據可節省的比特數來量化哪個樣本的誤差的規則而進行量化。在解碼處理中,對輸入的碼串的可變長碼進行解碼而獲得頻域的樣本串,進而,以與可變長碼的比特數對應的規則來解碼誤差信號,并從該獲得的樣本串基于輔助信息而獲得原來的樣本串。
【專利說明】編碼方法、解碼方法、編碼裝置、解碼裝置、程序、記錄介質
【技術領域】
[0001]本發明涉及音響信號的編碼技術以及通過該編碼技術而獲得的碼串的解碼技術。更詳細而言,涉及將音響信號變換為頻域而獲得的頻域的樣本串的編碼和其解碼。
【背景技術】
[0002]作為低比特(例如10kbit/s?20kbit/s左右)的聲音信號或音響信號的編碼方法,已知DFT (離散傅里葉變換)或MDCT (變形離散余弦變換)等的對于正交變換系數的自適應編碼。例如作為標準規格技術的AMR-WB+(Extended Adaptive Mult1-Rate Wideband)具有TCX (transform coded excitation:變換編碼勵振)編碼模式,其中,將DFT系數按每8個樣本進行歸一化而進行矢量量化(例如,參照非專利文獻I。)。
[0003]現有技術文獻
[0004]非專利文獻
[0005]非專利文獻1:ETSI TS126290V6.3.0 (2005-06)
【發明內容】
[0006]發明要解決的課題
[0007]以AMR-WB+為首,由于在基于TCX的編碼中不考慮基于周期性的頻域的系數的幅度的偏差,所以若匯集偏差大的幅度而編碼則編碼效率降低。在TCX中的量化或編碼中有各種變形例,但例如考慮通過算術碼等的熵編碼對將通過將系數除以增益所得的信號的量化而成為了離散值的MDCT系數從頻率低到高進行了排列的序列進行壓縮的情況。此時,將多個樣本設為I碼元(編碼單位),依賴就在該碼元之前的碼元而自適應性地控制分配碼。一般,幅度越小則越分配短碼,在幅度大的情況下分配長碼。其結果,每個幀的比特數平均地降低,但在每個幀的分配比特數固定的情況下,存在被降低的比特不能有效利用的可能性。
[0008]本發明鑒于這樣的技術的背景,其目的在于,提供一種能夠以低運算量改善離散信號、尤其是聲音音響數字信號的低比特的編碼的質量的編碼、解碼技術。
[0009]用于解決課題的手段
[0010]本發明的一個方式的編碼方法,將來自規定的時間區間的音響信號的頻域的樣本串以規定的個數的比特進行編碼,包括:編碼步驟,將與頻域的樣本串的各樣本的值對應的整數值通過可變長編碼進行編碼而生成可變長碼;誤差計算步驟,計算從頻域的樣本串的各樣本的值減去與該各樣本的值對應的整數值所得的誤差值的串;以及誤差編碼步驟,使用作為從規定的個數減去可變長碼的比特的個數所得的個數的比特的剩余比特,對誤差值的串進行編碼而生成誤差碼。
[0011 ] 本發明的一個方式的解碼方法解碼方法,對輸入的由規定的個數的比特構成的碼進行解碼,包括:解碼步驟,對在碼中包含的可變長碼進行解碼而生成整數值的串;誤差解碼步驟,對由作為從規定的個數減去可變長碼的比特的個數所得的個數的比特的剩余比特構成的、碼中包含的誤差碼進行解碼,從而生成誤差值的串;以及加法運算步驟,將整數值的串的各樣本與誤差值的串的對應的誤差樣本進行相加。
[0012]發明效果
[0013]通過以能夠通過對于整數值的可變長碼而節省的比特即剩余比特解碼誤差值,從而即使是在每個幀的比特數固定的情況下也能夠實現編碼效率的提高或量化失真的減輕
坐寸ο
【專利附圖】
【附圖說明】
[0014]圖1是用于說明實施方式的編碼裝置的構成的方框圖。
[0015]圖2是用于說明實施方式的編碼裝置的處理的流程圖。
[0016]圖3是用于說明加權歸一化MDCT系數和功率譜包絡的關系的圖。
[0017]圖4是用于說明剩余比特數多的情況下的處理的例的圖。
[0018]圖5是用于說明實施方式的解碼裝置的構成的方框圖。
[0019]圖6是用于說明實施方式的編碼裝置的處理的流程圖。
【具體實施方式】
[0020]參照【專利附圖】
【附圖說明】本發明的實施方式。另外,對于重復的構成要素分配相同的參照標號并省略重復說明。
[0021 ] 該實施方式的一個特征在于,將規定的時間區間設為幀,將對來自幀內的音響信號的頻域的樣本串進行量化的框架中,進行頻域的樣本的加權平坦化后的序列的可變長編碼,以及通過使用可通過該可變長編碼而節省的剩余比特決定優先級而量化誤差信號來減少編碼的失真的編碼的改善。尤其,即使是在每個幀的分配比特數固定的情況下,也產生可變長編碼的優點。
[0022]作為來自音響信號的頻域的樣本串、換言之基于音響信號的頻域的樣本串,例如能夠例示將幀單位的聲音音響數字信號從時域變換為頻域而獲得的DFT系數串或MDCT系數串、對這樣的系數串應用了歸一化或加權或量化等的處理的系數串等。以下,以MDCT系數串為例說明實施方式。
[0023][編碼的實施方式]
[0024]最初,參照圖1至圖4說明編碼處理。
[0025]如圖1所示,編碼裝置I例如包括頻域變換部11、線性預測分析部12、線性預測系數量化編碼部13、功率譜包絡計算部14、加權包絡歸一化部15、歸一化增益計算部16、量化部17、誤差計算部18、編碼部19、誤差編碼部110。編碼裝置I進行圖2中例示的編碼方法的各處理。以下,說明編碼裝置I的各處理。
[0026]“頻域變換部11”
[0027]首先,頻域變換部11以幀單位將聲音音響數字信號變換為頻域的N點的MDCT系數串(步驟S11)。
[0028]一般,在編碼側量化MDCT系數串,將已量化的MDCT系數串進行編碼,并將獲得的碼串傳輸到解碼側,在解碼側從該碼串再構成已量化的MDCT系數串,進一步,通過MDCT反變換能夠再構成時域的聲音音響數字信號。
[0029]另外,MDCT系數的幅度具有與通常的DFT的功率譜近似相同的幅度包絡(功率譜包絡)。因此,通過進行與幅度包絡的對數值成比例的信息分配,能夠使全部頻帶的MDCT系數的量化失真(量化誤差)均勻地分散,能夠減小整體的量化失真,除此之外,還實現信息壓縮。另外,功率譜包絡能夠使用通過線性預測分析而求出的線性預測系數而高效地估計。
[0030]作為控制這樣的量化誤差的方法,有自適應性地分配各MDCT系數的量化比特的(將幅度平坦化后調整量化的步驟幅度的)方法或、通過加權矢量量化而自適應性地加權而決定碼的方法。這里,說明在本發明的實施方式中執行的量化方法的一例,但希望留意并不限定于說明的量化方法。
[0031]“線性預測分析部12”
[0032]線性預測分析部12以幀單位對聲音音響數字信號進行線性預測分析,求出預定的次數為止的線性預測系數而輸出(步驟S12)。
[0033]“線性預測系數量化編碼部13”
[0034]線性預測系數量化編碼部13求出與線性預測分析部12求出的線性預測系數對應的碼和已量化線性預測系數而輸出(步驟S13)。此時,也可以進行將線性預測系數變換為LSP (Line Spectral Pairs,線譜對),求出與LSP對應的碼與已量化LSP,將已量化LSP變換為已量化線性預測系數的處理。
[0035]作為與線性預測系數對應的碼的線性預測系數碼成為對解碼裝置2發送的碼的一部分。
[0036]“功率譜包絡計算部14”
[0037]功率譜包絡計算部14將線性預測系數量化編碼部13輸出的已量化線性預測系數變換為頻域而求出功率譜包絡(步驟S14)。求出的功率譜包絡發送到加權包絡歸一化部15。此外,如圖1中虛線所示,根據需要而發送到誤差編碼部110。
[0038]與N點的MDCT系數串的各系數X(I)、……、X(N)對應的功率譜包絡系數串的各系數W(l)、……、W(N),能夠通過將已量化線性預測系數變換為頻域而獲得。例如,通過作為全極型模型的P次自回歸過程,時刻t的時間信號y⑴通過追溯到P時刻的過去的自己的值y(t-l)、……、y(t-p)和預測殘差e(t)以及已量化線性預測系數αι、……、^。而由式(I)表示。此時,功率譜包絡系數串的各系數W(n) [I < η < N]由式(2)表示。exp(.)為以納皮爾數作為底數的指數函數、j為虛數單位、σ 2為預測殘差能量。
[0039]【數I】
[0040]
【權利要求】
1.一種編碼方法,將來自規定的時間區間的音響信號的頻域的樣本串以規定的個數的比特進行編碼,包括: 編碼步驟,將與上述頻域的樣本串的各樣本的值對應的整數值通過可變長編碼進行編碼而生成可變長碼; 誤差計算步驟,計算從上述頻域的樣本串的各樣本的值減去與該各樣本的值對應的整數值所得的誤差值的串;以及 誤差編碼步驟,使用作為從上述規定的個數減去上述可變長碼的比特的個數所得的個數的比特的剩余比特,對上述誤差值的串進行編碼而生成誤差碼。
2.如權利要求1所述的編碼方法,其中, 上述誤差編碼步驟使用上述剩余比特,優先編碼在構成上述誤差的串的誤差樣本中對應的上述整數值不為O的誤差樣本。
3.如權利要求1所述的編碼方法,其中, 上述誤差編碼步驟使用上述剩余比特,優先編碼在構成上述誤差值的串的誤差樣本中對應的功率譜包絡值、功率譜包絡值的概算值或者功率譜包絡值的估計值大的誤差樣本。
4.如權利要求1至3的任一項所述的編碼方法,其中, 上述誤差編碼步驟以I比特編碼在構成上述誤差值的串的誤差樣本中成為編碼的對象的各誤差樣本的值的正負的信息。
5.如權利要求4所述的編碼方法,其中,` 將根據整數值而決定的值設為再構成值的絕對值、將上述再構成值的絕對值設為在誤差樣本的值為正時對應的再構成值、將從O減去上述再構成值的絕對值所得的值設為在誤差樣本的值為負時對應的再構成值, 上述誤差編碼步驟在上述剩余比特的數大于構成上述誤差值的串的誤差樣本的數的情況下,對從上述各誤差樣本的值減去與上述各誤差樣本對應的再構成值所得的值的正負的信息使用別的I比特進一步編碼。
6.如權利要求4或5所述的編碼方法,其中, 在整數值不為O時的再構成值的絕對值大于在整數值為O時的再構成值的絕對值。
7.一種解碼方法,對輸入的由規定的個數的比特構成的碼進行解碼,包括: 解碼步驟,對在上述碼中包含的可變長碼進行解碼而生成整數值的串; 誤差解碼步驟,對由作為從上述規定的個數減去上述可變長碼的比特的個數所得的個數的比特的剩余比特構成的、上述碼中包含的誤差碼進行解碼,從而生成誤差值的串;以及 加法運算步驟,將上述整數值的串的各樣本與上述誤差值的串的對應的誤差樣本進行相加。
8.如權利要求7所述的解碼方法,其中, 上述誤差解碼步驟解碼以上述剩余比特表現的、構成上述誤差的串的誤差樣本中對應的上述整數值不為O的誤差樣本。
9.如權利要求7所述的解碼方法,其中, 上述誤差解碼步驟解碼以上述剩余比特表現的、構成上述誤差值的串的誤差樣本中對應的功率譜包絡值、功率譜包絡值的概算值或者功率譜包絡值的估計值大的誤差樣本。
10.如權利要求7至9的任一項所述的解碼方法,其中,將根據整數值而決定的值設為再構成值的絕對值, 上述誤差解碼步驟將上述誤差值的串的各誤差樣本的值設為如下值,即將由通過解碼上述誤差碼而獲得的與上述各誤差樣本對應的I比特的信息確定的正負反映到基于與上述各誤差樣本對應的整數值的再構成值的絕對值的值。
11.如權利要求10所述的解碼方法,其中, 上述誤差解碼步驟在有與上述各誤差樣本的值對應的別的I比特的信息的情況下,將上述各誤差樣本的值設為如下值,即將上述反映的值與將由上述別的I比特的信息確定的正負反映到基于與上述各誤差樣本對應的整數值的再構成值的絕對值的1/2的值的值相加的值。
12.如權利要求10或11所述的解碼方法,其中, 在整數值不為O時的再構成值的絕對值大于在整數值為O時的再構成值的絕對值。
13.—種編碼裝置,將來自規定的時間區間的音響信號的頻域的樣本串以規定的個數的比特進行編碼,包括: 編碼部,將與上述頻域的樣本串的各樣本的值對應的整數值通過可變長編碼進行編碼而生成可變長碼; 誤差計算部,計算從上述頻域的樣本串的各樣本的值減去與該各樣本的值對應的整數值所得的誤差值的串;以及 誤差編碼部,使用作為從上述規定的個數減去上述可變長碼的比特的個數所得的個數的比特的剩余比特,對上述誤差值的串進行編碼而生成誤差碼。
14.如權利要求13所 述的編碼裝置,其中, 上述誤差編碼部使用上述剩余比特,優先編碼在構成上述誤差的串的誤差樣本中對應的上述整數值不為O的誤差樣本。
15.如權利要求13所述的編碼裝置,其中, 上述誤差編碼部使用上述剩余比特,優先編碼在構成上述誤差值的串的誤差樣本中對應的功率譜包絡值、功率譜包絡值的概算值或者功率譜包絡值的估計值大的誤差樣本。
16.一種解碼裝置,對輸入的由規定的個數的比特構成的碼進行解碼,包括: 解碼部,對在上述碼中包含的可變長碼進行解碼而生成整數值的串; 誤差解碼部,對由作為從上述規定的個數減去上述可變長碼的比特的個數所得的個數的比特的剩余比特構成的、上述碼中包含的誤差碼進行解碼,從而生成誤差值的串;以及 加法運算部,將上述整數值的串的各樣本與上述誤差值的串的對應的誤差樣本進行相加。
17.如權利要求16所述的解碼裝置,其中, 上述誤差解碼步驟解碼以上述剩余比特表現的、構成上述誤差的串的誤差樣本中對應的上述整數值不為O的誤差樣本。
18.如權利要求16所述的解碼裝置,其中, 上述誤差解碼部解碼以上述剩余比特表現的、構成上述誤差值的串的誤差樣本中對應的功率譜包絡值、功率譜包絡值的概算值或者功率譜包絡值的估計值大的誤差樣本。
19.一種程序,使計算機實現權利要求1至12所述的方法的各步驟。
20.一種計算機可讀取的記錄介質,記錄了用于使計算機實現權利要求1至12所述的方法的各 步驟的程序。
【文檔編號】G10L19/035GK103460287SQ201280015955
【公開日】2013年12月18日 申請日期:2012年3月26日 優先權日:2011年4月5日
【發明者】守谷健弘, 原田登, 鎌本優, 日和崎佑介, 福井勝宏 申請人:日本電信電話株式會社