高效編碼和解碼的方法及裝置的制作方法

文檔序號：7563949閱讀：232來源：國知局

專利名稱：高效編碼和解碼的方法及裝置的制作方法
技術領域：
本發明涉及高效編碼方法和裝置，高效解碼方法和裝置，通過高效編碼、傳輸、記錄、重放將輸入數字數據編碼，并對產生應答數據的數據進行解碼。
存在著若干種對音頻或視頻信號進行高效編碼的方法。其中典型的是分頻帶編碼(SBC)，這種編碼是將時域信號劃分的多頻帶信號而不是將時域音頻信號劃分為多個塊的非塊成形頻帶劃分系統，和將時域信號劃分為多個塊、通過正交變換將所得塊變換為頻域信號并從一個頻帶到另一頻帶將所得頻域信號編碼的塊成形頻帶劃分系統。也稱之為變換編碼。還存在一種已知的高效編碼是分頻帶編碼與變換編碼的結合，其中用分頻帶編碼將時域信號劃分的多個頻帶的信號，隨后從一個頻帶到另一頻帶將相應頻帶的信號正交變換為編碼的頻域信號。
上述方法中所用的濾波器可拿1976年R.E.Crochiere的“分頻帶語音數編碼”(BellSgst.Tach.J.Vol.55No.81976)中討論的90°相移鏡象濾波器(QMF)來舉例。用多相90°相移濾波器的等頻帶濾波器劃分方法在ICASSP83，Boston，JosephH.Rothweiler的“多相90°相移濾波器-一種新的分頻帶編碼技術”中進行了討論。
可用將輸入音頻信號變為預置單位時間周期(幀)間隔上的塊，并用將時域信號變換為頻域信號的快速富里葉變換(FFT)、正弦變換(DCT)或修正正弦變換(MDCT)處理所得塊的正交變換來列舉正交變換。對于MDCT，可參見ICASSP1987中J.P.Princen(A.B.BradleyVniv.ofSurreyRoyalMelbourneInst.ofTech)的“基于時域混合抵消的和用濾波器頻帶設計的分頻帶/變換編碼”。在我們于1992年9月24日提交的共同未決的美國專利序列號07/950，945中詳細討論了MDCT的具體技術。
在量化頻率分量時，考慮人的聽覺特性選擇頻帶。亦即，將音頻信號劃分為多個、例如25個已知為臨界帶的頻帶，其中在頻率增大的方向頻帶變得越寬。在對相應頻帶的數據編碼時，將預定數的位分配給每個頻帶或通過自適應位分配將可變數的位分配給每一頻帶。例如，當由位分配對用MDCT得到的系數數據編碼時，用自適應的位數對由基于塊的MDCT獲得的相應頻帶的MDCT系數數據編碼。已知以下兩種位分配方法。
在1977年8月IEEE聲學、語音和信號處理會議文集ASSP-25第4號卷中，是根據頻帶的信號量進行位分配的。對于該系統來說，量化噪聲頻譜變得平緩且噪聲能量最小。但是，人耳實際感覺到的噪聲并非最佳，因為未到用聽覺掩蔽效應。
在ICASSP1980“臨界頻帶編碼器-聽覺系統的感性要求的數字編碼”(M.A.KransnerMIT)中，討論了一種產生每頻帶實現固定位分配所需的信噪比的方法。然而，用該方法產生令人滿意的特征值是不可能的，因為即使測量具有正弦波輸入的特性時該位分配保持一定。
上述方法未考慮諸如輸入信息信號的時間變化一類的瞬時特性。由此，不能解決高度振動的前回波的問題，這種高度振動的前回波是在輸入信息信號在幅度上突然改變時，尤其是小信息信號變為較大信息信號時產生的。前回波期間意味著如下現象，即恰好在小信息信號突然變為較大信息信號之前產生的量化噪聲被聽到，而未被反向掩蔽所覆蓋，從而導致音質的降低。
對于將前回波降低到人耳聽不到的水平的方法，本申請人在1990年7月18日提交的美國序列號07/553608中已提出了一種自適應地改變塊長度的方法。具體說來，該方法是細分確實存在變化信號因此存在出現前回波的很大危險性的塊。盡管用該方法可有效抑制前回波，但前回波仍存在于細分的塊部分中，即使達有限程度。
如果僅考慮頻率特性作出位分配，則難于避免在信息信號的突然傳遞期間前回波所引起的音質降低。這樣帶來了對有效防止前回波出現的方法的需要。
因此本發明的主要目的是提供一種就人的聽覺而論無前回波的位分配方法。
按照本發明的高效編碼裝置，通過優先將至少一部分可用作位分配的位分配給根據頻道之間信息信號的瞬時變化具有較大信息信號瞬時變化的頻道而防止前回波。根據作為信息信號頻率分量的歸一化信息的標度因子檢測并判定瞬時變化的信息信號瞬時變化大小對避免新的算術和邏輯運算是有效的，因為該參量形成從編碼器傳輸到解碼器的部分子數據。
作為又一方法，對運行而言還希望根據在進一步劃分具有標度因子的塊的時間寬度獲得的時間標度上的分塊信息幅度瞬時變化作出檢測和判定。不僅改變頻道之間的位分配而且根據頻道中相鄰塊之間的信號信息瞬時變化改變頻道中的位分配在進一步減小前回波上是有效的。
按照本發明，為將時域信息信號轉化為頻域信號，可利用其中通過塊或形頻率分析如正交變換將諸如濾波器一類非塊成形頻率分析的輸出、諸如正交變化一類塊成形頻率分析的輸出或非塊成形頻率分析的輸出映射在頻標上的結構。
在位分配時，有可能依據各頻道信息信號頻譜分配適于作位分配的部分位作為第一位分配，并利用剩余的位作為第一位分配附加部分。在附加位中，對與信息信號的瞬時特性一致的頻道和頻道之一作出位分配。通過使與各頻道信息信號一致的位分配與附加位分配之間的比率依賴于信息信號的瞬時變化，有可能獲得音質進一步要求的位分配。
如果正交變換的塊尺寸自適應地隨信息信號的時間特性變化，同時在頻道之間進行位分配，則在信息信號為次穩態信號時有可能增加塊長度從而提高頻率分辨率，同時還可能在信息信號為非穩態信號時提高時間分辨率，以減少回波發生的時間，防止音質降低。
本發明提供一種能夠減少在高效編碼時有可能產生的前回波所導致的音質降低并便于影片或需要高音質的音頻系統的音頻記錄和重放的系統。

圖1是表示按照本發明的高效編碼裝置的說明性布局的電路方框圖;
圖2示出了圖9裝置沿時間標度和沿頻率標度劃分信號的方式;
圖3是表示用圖1所示裝置找出多頻道位分配參數的配備的方框圖;
圖4是表示找出音調的方式的圖形;
圖5是表示第一次位分配的方式的圖示;
圖6是表示在第一次位分配中均勻分配的情況下噪聲頻譜的圖示;
圖7是表示用于產生表現出對信號電平的依賴性和對信息信號頻譜的依賴性的聽覺效果的位分配的噪聲頻譜實例的圖示;
圖8是在第二次位分配中均勻分配的情況下噪聲譜的圖示;
圖9是用于產生表現對信號電平的依賴性和對信息信號頻譜的依賴性的聽覺效果的位分配實例的圖示;
圖10示出找出考慮頻道之間信息信號的時間特性的位分配參數的方式;
圖11是表示按照本發明的高效解碼裝置的說明性布局的電路方框圖;
圖12是第一次位分配的量與平均頻道音調之間的關系的圖示;
圖13是第一次位分配的量與平均頻道時間變化率之間的關系的圖示。
參見圖1，詳細說明了由分頻帶編碼(SBC)、自適應變換編碼(ATC)以及自適應位分配(APC-AB)對諸如音頻PCM信號一類的輸入數字信號進行高效編碼的技術。
在如圖1所示的高效編碼裝置中，用濾波器或類似物將輸入數字信號劃分為多個頻帶并從一個頻帶到另一頻帶進行正交變換，以產生由自適應位分配根據考慮做說明的人的聽覺特性的臨界帶編碼的頻域頻譜數據。這時，當頻率上升時，臨界帶被細分為塊。在借助濾波器等實現的非塊成形系統的情況下，這些頻帶自然可具有相等寬度。
此外，在本實施例中，在正交變換之前，塊尺寸或塊長度依據輸出信號自適應地變化，并根據臨界頻帶或從更高頻率的臨界帶細分的塊實現浮點操作。該臨界帶表示考慮人的聽覺特性而作出的頻率劃分所產生的頻帶。亦即，臨界帶是適合窄帶噪聲頻帶，它屏蔽具有與噪聲相同強度和噪聲頻率附近的頻帶的純音。從0到22kHz的整個頻率范圍劃分為例如25個臨界帶，選擇頻帶使越靠近較高頻率帶寬變得越寬。
參見圖1，具有例如從0到22kHz頻率范圍的音頻PCM信號施加于輸入端10。用諸如QMF濾波器一類的頻帶劃分濾波器將輸入信號劃分為從0到11kHz的頻帶和從11到22kHz的頻帶。由頻帶劃分濾波器12將0到11kHz的頻帶劃分為0到5.5kHz的頻帶和5.5到11kHz的頻帶。來自濾波器11的11khz到22kHz的信號提供給作為正交變換電路實施的修正離散余弦變換(MDCT)電路13，而來自濾波器12的5.5kHz到11kHz的信號提供給修正離散余弦變換(MDCT)電路14，以及來自濾波器12的0kHz到5.5kHz信號提供給修改離散余弦變換(MDCT)電路15以用MDCT加以處理。
圖2示出了MDCT電路13至15的塊尺寸的具體實例。在圖2的具體實例中，三個濾波器輸出中每個均具有兩種正交變換的塊尺寸。亦即，對應頻帶0到5.5kHz上的低頻信號和頻帶5.5到11kHz上的中頻信號，每塊分別由對應長塊尺寸(圖2A)的128個樣本和對應短塊尺寸(圖2B)的32個樣本構成。另一方面，對于頻帶11到22kHz上的高頻信號來說，每塊分別由長塊尺寸(圖2A)的256個樣本和短塊尺寸(圖2B)的32個樣本構成。如果以該方式選擇短塊尺寸，趨于較高頻時間分辨率增加，所用的窗口種類數下降，而每頻帶正交變換的抽樣數保持相同。
返回圖1，由MDCT電路13至MDCT電路15通過MDCT(修正離散系統變換)獲得的頻域頻譜數據或MDCT系數按照臨界帶或在較高頻率范圍內按照臨界頻帶進一步劃分的小尺寸的塊加以分組，并傳輸到自適應位分配編碼電路16，17和18。依據自適應位分配編碼電路16，17和18為每個臨界帶或在較高頻率范圍內為每個由臨界帶進一步劃分的小尺寸的塊分配的位數對頻譜數據或MDCT系數數據進行再量化。在輸出端22，24和26輸出這樣編碼的數據。表明對信號幅度使用哪種歸一化的標度因子和表明已使用哪種位長度的位長度信息是同時傳輸的。
對于圖1所示的MDCT電路13到15的輸出，通過例如計算頻帶中各幅度值的均方根值得出臨界頻帶或由臨界帶細分的小尺寸塊的信號能量。標度因子本身自然可用于后續位分配。在這種情況下，不必進行新的能量計算，這就減小硬件尺寸。當然可利用幅度值的峰值或平均值代替各頻帶的能量。
參照圖3說明自適應位分配電路的操作。盡管在本實施例中有8個頻道，但圖3中僅示出頻道1和8，其它頻道被省略。利用頻道1對這些頻道的公共部分加以解釋。頻道1的輸入信息信號加到輸入端31。通過映射功能電路32將輸入信息信號從時域信號映射到頻率軸上。如果利用濾波器，分頻帶信號變為時域抽樣。在正交變換輸出的情況下，則產生頻域抽樣。由塊成形功能電路33將這些樣本分組為各由多個樣本組成的集。若利用濾波器，多個時域樣本被分組在一起，然而，在正交變換輸出的情況下，多個頻域抽樣樣本被分組在一起。在圖1實施例中，通過瞬時變化計算功能電路44計算映射期同MDCT輸入時域信號的瞬時變化。
歸一化功能電路37將由塊成形功能電路33分組為各由多個樣本組成的塊的樣本歸一化。標度因子計算功能電路35計算標度因子即歸一化系數。由所計算的標度因子，音調計算功能電路36計算音調的大小。以這種方式得出的參數用于在位分配功能電路38中進行位分配。如果假定代表MDCT系數并準備用作傳輸或記錄的位數對所有頻道而言為800kbps，則確定了本實施例中用于第一次位分配的位數。
由此，在與信號頻譜有關的信息中，利用(a)與音調相關的信息以及(b)與信息信號的瞬時變化相關的信息。
首先參見與音調相關的信息，被信號頻譜分量數所除的信號頻譜分量的相鄰值之間的差的絕對值之和用來作為指數。更精確地說，作塊浮動的基于塊的標度因子的相鄰標度因子指數之間的差的平均值用來作為指數。標度因子指數實際上對應于標度因子的對數。在本實施例中，用于進行第一項位分配的位的數量與表示音調的值相關，并設定600kbps的最小值。
以下述方式計算音調。
Tm＝1/WLmax(∑ABS(SFn-Sfn-1)
Tav＝(1/CH)∑Tm其中Tm＝每頻道的音調m＝頻道號WLmax＝字長的最大值＝16Ch＝頻道數量SFn＝實際對應于峰值對數的標度因子指數n塊浮動的頻帶數Tav平均頻道音調以該方式得出的Tav值與圖12所示的第一位分配量相關。
在本實施例中，第一位分配模式的分配與附加的至少一種其它位分配之間的分布比例依賴于信息信號的瞬時變化特性。在本實施例中，通過比較為正交變換從時間塊尺寸劃分的每時域的相鄰塊的信息信號峰值來檢測信息信號幅度突然變大的時間區域以確定分布比例。
以下述方式計算時間變化率。
Vt＝VmVav＝(1/Vmax)＊(1/Ch)Vt其中Vt是每頻道的時間分塊的峰值以db表示的從較小值到較大值變化的每頻道之和Vm每頻道的時間分塊的峰值以db表示的從較小值到較大值變化的最大值的大小，該最大值限制為30db并以Vmax表示
m頻道號Ch頻道的數量Vav以db表示的每頻道的時間分塊的峰值從較小值到較大值的均頻道變化以該方式得出的Vav值與圖13所示第一次位分配的量相關聯。
歸根結底，由下列方程得出第一位分配量B＝1/2(Bf+Bt)其中B第一位分配的最終值Bf由Tav得了的位分配量Bt由Vav得出的位分配量在以這種方式確定了第一次位分配所用的位數量之后，頻道進行第一次位分配的位分配。
依據信號性質可作出多種選擇。當然可根據頻標上的標度因子分布作出自適應位分配。在這種情況下，可依據頻道總體的頻率標度上的標度因子分布借助于頻道之間的位分配作出有效位分配。在該情況下，如果在相同音域中混合多個頻道的信息信號以便如同在說話者的情況下到達左耳和右耳，則可假定頻道總體的混合信號進行了有效掩蔽。因此，進行位分配是有效的，使得各頻道達到相同的噪聲電平。由此，與標度因子指數成正比地進行位分配就夠了。
Bm＝B×∑SFn/SS＝∑(∑SFn)其中Bm每頻道的第一次位分配量
B頻道總體的第一次位分配量SFn＝實現上對應于峰值對數的標度因子指數n＝塊浮動的頻帶號m＝頻道號S＝頻道總體的標度因子指數之和然后，進行第一次位分配中未運用的位分配。
(1)抽樣值總體的均勻分配圖6示出了該情況下位分配量化噪聲譜。對整體頻帶可作出均勻噪聲電平衰減。
(2)實現表現依賴于信號電平和信息信號頻譜的聽覺效果的位分配圖8中示出了該情況下位分配的典型量化噪聲頻譜。在這些情況下，依據信息信號頻譜實現位分配。特別是，實現位分配以著重于信息信號頻譜的低頻端從而補償低頻端比高頻帶更顯示出現的掩蔽效果下降。這是基于著重于信號頻譜低頻的掩蔽曲線的非對稱性，以考慮相鄰臨界帶之間的掩蔽。
圖8和9示出了位分配的方式。在整個頻率范圍上信號頻譜平滑的低音調輸入信號的情況下，如圖8中所示更多的位分配給第一次位分配。反之，在高音調輸入信號的情況下，第一位分配的位數量減少，如圖9所示，而第二位分配的位數量增加，如圖9所示，因此更多的位分配給具有較大電平的信號頻譜。
在圖7和9中，設立第二位分配以便將著重點放在低頻端。在本實施例中，存在多種位分配模式，其中較短時間間隔的塊的位數量分布于各頻率。此外，在本實施例中，提供位分配率在中到低頻范圍和高頻范圍不同的多種位分配模式。選擇這樣一種模式，其中信號大小越小，高頻端的位分配量越少。以這種方式，利用對較小信號大小削弱高頻敏感度的高聲效果成為可能。盡管對信號大小而言此時可利用整個頻率范圍的信號值，但所用的是利用濾波器或MDCT輸出的非塊成形頻率劃分電路的輸出。最終，由圖3所示的位分配功能電路38得到第一位分配和附加于第一位分配的位分配之和。
除了以上所述，本發明還包含檢測各頻道信號的瞬變特性以改變各頻道的位分配量的過程。以如下方式得到表示瞬時變化的指標。
如果如圖10所示存在8個頻道，作為各頻道輸入信息信號位分配的時間單元的位分配時間塊被瞬時化分為得出各自峰值的四個分塊。依據從較小值變為較大值的分塊峰值差的大小這些位分布于頻道之間。若C個位的總和適于這八個頻道的位分配，且從較小值到較大值變化的分塊的峰值之差表示為a，b，c，d，e，f，g以及hdb，則要用C＊a/T，……C＊h/T位作出位分配，其中T＝a+b+c+d+e+f+g+h。信號信息的增加率越大，分配給頻道的位數越多。最終的位分配為上述位分配的位之和。
此外，若可用作第一位分配的位數等于C，則有可能提供t位作為前回波的防范圍措施。即，若C-t位是可用在八頻道中的位數，且每頻道相應分塊的峰值差的大小表示為a，b，c，d，e，f，g和hdb，則可由(C-t)＊a/T，(C-t)＊b/T，……(C-t)＊h/T位進行位分配。
對于前回波為最大值即存在a，b，c，d，e，f，g和h中的最大值的頻道之一來說，優選分配t位。因此，更多的t位分配給該頻道致使前回波顯著減少。尤其，當本技術用于其中主要前向信號FRFL是臨界的電影膠片的聲跡時，可將t位分配給它們中之一。另外，可將該t個位分配給低音喇叭頻道。
圖11示出用于將高效編碼的信號解碼的解碼電路。各頻帶的量化MDCT系統加到解碼電路122，124和126的輸入端，而所用的塊尺寸信息加到輸入端123，125及127。解碼電路116，117及118釋放利用自適應位分配信息的位分配。在MDCT電路113，114及115中，頻域信號被轉換的時域信號。由IQMF電路將部分范圍的時域信號解碼為整個范圍的信號。
由以上敘述可見本發明提供了一種在從聽覺上講希望的多頻道系統中壓縮瞬時振動信息信號的位分配方法。
權利要求
1.對多個頻道的數字信息信號進行預定位分配并根據分配的位獲得編碼的信息信號的高效編碼方法，其特征在于在頻道之中進行位分配的量是基于各頻道信息信號的瞬時變化。
2.如權利要求1所述的高效編碼方法，其特征在于根據各頻道數字信息信號的幅度信息的瞬時變化控制頻道中位分配量。
3.如權利要求1所述的高效編碼方法，其特征在于幅度信息是各頻道數字信息信號的能量值，峰值或平均值。
4.如權利要求4所述的高效編碼方法，其特征在于根據各頻道比例因子的瞬時變化控制頻道中的位分配量。
5.如權利要求4所述的高效編碼方法，其特征在于依據各頻道標度因子瞬時變化和頻道中位分配導致的字長瞬變控制頻道中的位分配量。
6.如權利要求1所述的高效編碼方法，其特征在于依據各頻道瞬時相鄰多個塊的幅度信息瞬變控制頻道中的位分配量。
7.如權利要求1到6所述的高效編碼方法，其特征在于用作位分配的位總體劃分為依賴于以相對于時間和頻率的細分獲得的小塊表示信號量的指數模式的第一位分配和至少一種附加于所述第一位分配的聽覺效果的其它位分配。
8.如權利要求7所述的高效編碼方法，其特征在于所述第一位分配與至少一種其它位分配之間的分布率是依據信息信號自適應地加以控制的。
9.如權利要求8所述的高效編碼方法，其特征在于控制所述分布率使得所述信息信號的瞬時變化越大，所述第一位分配的分布率變得越小。
10.發權利要求1至9所述的高效編碼方法，其特征在于在非塊成形頻率分析之后通過諸如正交變換一類的塊成形頻率分析來分析非塊成形頻率分析的輸出，以由相對于時間和頻率的細分獲得的小塊產生抽樣。
11.如權利要求10所述的高效編碼方法，其特征在于非塊成形頻率分析的頻帶寬度至少在最低范圍內是相同的。
12.如權利要求10所述的高效編碼方法，其特征在于接近較高頻率范圍至少在最高頻率范圍非塊成形頻率分析的頻帶寬度較寬。
13.如權利要求10或11所述的高效編碼方法，其特征在于用濾波器實現所述非塊成形頻率分析。
14.如權利要求13所述的高效編碼方法，其特征在于所述濾波器是多相90°相移濾波器。
15.如權利要求所述的高效編碼方法，其特征在于所述濾波器是90°相移鏡象濾波器。
16.如權利要求10所述的高效編碼方法，其特征在于接近較高頻率范圍至少在最高頻率范圍非塊成形頻率分析的頻帶寬度較寬。
17.如權利要求10所述的高效編碼方法，其特征在于所述塊成形頻率分析由MDCT進行。
18.如權利要求10到17所述的高效編碼方法，其特征在于根據輸入信號瞬時特性自適應地改變所述塊成形頻率分析的塊尺寸。
19.如權利要求18所述的高效編碼方法，其特征在于對于至少兩個非塊成形頻率分析輸出頻帶中每個相互獨立地改變所述塊尺寸。
20.如權利要求1至19所述的高效編碼方法，其特征在于已編碼的信息記錄在記錄介質上。
21.如權利要求20所述的高效編碼方法，其特征在于所述記錄介質是電影膠片，光盤，磁帶或磁光盤。
22.用如權利要求21所述的高效編碼記錄方法進行記錄的記錄介質。
23.如權利要求20所述的記錄介質，其特征在于所述記錄介質是電影膠片、光盤、磁帶或磁光盤。
24.如權利要求1到18所述的高效編碼方法，其特征在于在數字信息傳輸通道上傳輸已編碼的信息。
25.如權利要求24所述的高效編碼方法，其特征在于所述傳輸通道是數字信息傳輸通道。
26.一種高解碼方法，其特征在于對記錄的信息或由如權利要求21所述的高效編碼方法記錄或傳輸的傳輸信號進行解碼。
全文摘要
根據各頻道信息信號瞬時變化控制頻道間位分配量。此外，根據各頻道數字信息信號幅度信息瞬變控制頻道間位分配量。至少可用作位分配的部分位對隨多頻道之一信息信號瞬變大小具有較大信息信號瞬變的頻道作優先分配。結果，在多音頻信號頻道的系統中可防止歸因于高效編碼期間前回波的音質下降。
文檔編號H04N7/26GK1093843SQ94101748
公開日1994年10月19日申請日期1994年2月2日優先權日1993年2月2日
發明者赤桐健三申請人:索尼公司

完整全部詳細技術資料下載