在一頻譜域中用以處理已解碼音頻信號的裝置及方法
【專利摘要】用以處理已解碼音頻信號(100)的設備包含用以濾波該已解碼音頻信號來獲得已濾波音頻信號(104)的濾波器(102),用以將該已解碼音頻信號及該已濾波音頻信號轉換成相對應的頻譜表示型態的時間頻譜轉換器級(106),各個頻譜表示型態具有多個子帶信號,用以通過將子帶信號乘以各個加權系數執行該已濾波音頻信號的頻率選擇性加權來獲得已加權已濾波音頻信號的加權器(108),用以執行該已加權已濾波音頻信號與該已解碼音頻信號的該頻譜表示型態之間的逐一子帶減法的減法器(112),及用以將結果音頻信號或從該結果音頻信號獲得的一信號轉換成時域表示型態來獲得已處理已解碼音頻信號(116)的頻譜時間轉換器(114)。
【專利說明】在一頻譜域中用以處理已解碼音頻信號的裝置及方法
【技術領域】
[0001]本發明涉及音頻處理,更明確言之,涉及用于質量提升的已解碼音頻信號的處理。【背景技術】
[0002]近年來,已經達成有關切換式音頻編解碼器的進一步發展。高質量及低位率的切換式音頻編解碼器乃統一語音與音頻編碼構思(USAC構思)。常見的前處理/后處理包含:MPEG環繞(MPEG)功能單元,其處置立體聲或多聲道處理,及加強SBR(eSBR)單元,其處理于輸入信號中較高音頻的參數表示型態。接著存在二分支,一個分支包含高階音頻編碼(AAC)工具路徑,并且另一個分支包含以線性預測編碼(LP或LPC定義域)為基礎的路徑,其又轉而成為LPC殘差的頻域表示型態或時域表示型態。在量化及算術編碼后,AAC及LPC 二者的全部傳輸頻譜表示在MDCT定義域。時域表示型態使用ACELP激勵編碼方案。編碼器及解碼器的框圖在IS0/IEC CD23003-3的圖1.1和圖1.2給出。
[0003]切換式音頻編解碼器的一額外實例為如3GPP TS26.290V10.0.0 (2011-3)描述的擴充式適應多速率寬帶(AMR-WB+)編解碼器。AMR-WB+音頻編解碼器處理輸入幀等于以內部取樣頻率Fs為2048樣本。內部取樣頻率系限于12800至38400Hz的范圍。2048樣本幀分成兩個臨界取樣的相等頻率頻帶。如此導致相對應于低頻(LF)頻帶及高頻(HF)頻帶的兩個1024樣本的超幀。各個超幀被劃分為四個256樣本幀。于內部取樣率取樣系經由使用可變取樣轉換方案獲得,該方案重新取樣輸入信號。然后,低頻信號及高頻信號使用兩個不同辦法編碼:低頻信號使用「核心」編碼器/解碼器基于切換式ACELP及轉換編碼激勵(TCX)編碼與解碼。在ACELP模式中,使用標準AMR-WB編解碼器。高頻信號系利用頻寬延長(BWE)方法以相當少的位(每個幀16位)編碼。AMR-WB編碼器包括前處理功能、LPC分析、開放回路搜尋功能、適應性碼簿搜尋功能、創新性碼簿搜尋功能、及內存更新。ACELP解碼器包含數項功能,諸如解碼適應性碼簿、解碼增益、解碼創新性碼簿、解碼ISP、長期預測濾波器(LTP濾波器)、組成性激勵功能、四個子幀的ISP的內插、后處理、合成濾波器、解除強調及升頻取樣框來最終獲得語音輸出的低頻帶部分。語音輸出的高頻帶部分通過使用HB增益指數、VAD旗標、及16kHz隨機激勵而產生。此外,HB合成濾波器的使用系接著帶通濾波器。進一步細節請參考G.722.2的圖3。
[0004]此一方案在AMR-WB+已通過執行單聲道低帶信號的后處理而提高。參考示出了AMR-WB+中的功能的圖7、圖8及圖9。圖7示出了音準加強器700、低通濾波器702、高通濾波器704、音準追蹤階段706及加法器708。這些框連接如圖7所示及由解碼信號饋送。
[0005]在低頻音準加強中,使用二頻帶分解,及適應性濾波只應用至低頻帶。如此導致整個后處理,大部分鎖定目標在接近該合成語音信號的第一諧波之頻率。圖7示出了二頻帶音準加強器的框圖。在較高分支中,解碼信號通過高通濾波器704濾波來產生較高頻帶信號%。在較低分支中,解碼信號首先通過音準加強器700處理,及然后經由低通濾波器702濾波來獲得較低頻帶后處理信號(s_)。后處理解碼信號經由該較低頻帶后處理信號與該較高頻帶信號相加獲得。音準加強器的目的是減低在該解碼信號中的諧波間噪聲,該目的通過圖9第一行指示的具有轉移函式He的時變線性濾波器達成,及由圖9第二行的方程式描述。α是控制諧波間衰減的系數。T為輸入信號分/7)的音準周期,及(η)為音準加強器的輸出信號。參數T及α隨著時間改變,且通過音準追蹤級706以數值α=1給定,由圖9第二行的方程式描述的濾波器增益在頻率I/ (2Τ)、3/ (2Τ)、5/ (2Τ)等也即在DC (OHz)與諧波頻率1/T、3/T、5/T等的中點恰為零。當α趨近于零時,如圖9第二行定義的由濾波器所產生的諧波間的衰減減少。當α為零時,濾波器無效用,且為全通。為了將后處理限于低頻區,加強信號經低通濾波來產生信號^ef,該信號加至高通濾波信號sH來獲得后處理合成信號Se。
[0006]相當于圖7的例示說明的另一配置在圖8例示說明,圖8的配置免除高通濾波的需要。此點就圖9針對sE的第三方程式解說。ΚΡ(η)為低通濾波器的脈沖響應,及hHP(n)為互補高通濾波器的脈沖響應。然后,后處理信號sE(n)系由圖9的第三方程式給定。如此,后處理系相當于從合成信號匆扣除已定標低通濾波長期誤差信號a.eu(n)。長期預測濾波器的轉移函式系給定如圖9的末行指示。此種交替后處理配置在圖8中圖解。數值T通過在各個子幀所接收的閉路音準滯后給定(分量音準滯后系舍入至最近的整數)。執行檢查音準加倍的簡單追蹤。若于延遲T/2的標準化音準相關性大于0.95,則值T/2用作為用于后處理的新音準滯后。因子α通過a=0.5gp給定,限于α大于或等于零及小于或等于
0.5。gp為以O及I為界限的解碼音準增益。于TCX模式中,α值被設定為零。具有25系數的線性相位有限脈沖響應(FIR)低通濾波器以約500赫茲的截止頻率使用。濾波器延遲為12樣本。上分支須導入相對應于在下分支處理延遲的延遲,來維持在執行減法前兩個分支的信號的時間排齊。在AMR-WB+中的Fs=2x核心的取樣率。核心取樣率等于12800赫茲。故截止頻率等于500赫茲。已發現特別針對低延遲應用,由線性相位FIR低通濾波器所導入的12樣本濾波器延遲促成編碼/解碼方案的總延遲。在編碼/解碼鏈中其它位置有其它系統性延遲來源,FIR濾波器延遲與其它來源累積。
【發明內容】
[0007]本發明的一目的是提供改良`的音頻信號處理構思,該構思更適用于實時應用或多向通訊景況,諸如行動電話景況。
[0008]此目的通過根據權利要求1項的處理已解碼音頻信號的設備、或根據權利要求15項的處理已解碼音頻信號的方法、或根據權利要求16項的計算機程序而予達成。
[0009]本發明基于發現在已解碼信號的低音后濾波中的低通濾波器對總延遲的貢獻成問題而須減少。為了達成此項目的,已濾波音頻信號在時域系未經低通濾波,但在頻譜域經低通濾波,諸如QMF定義域或任何其它頻譜域,例如MDCT定義域、快速傅利葉轉換(FFT)定義域等。已發現從頻譜域轉換至頻域,并且例如轉換至低分辨率頻域,諸如QMF定義域可以低延遲執行,欲于頻譜域體現的濾波器的頻率選擇性,只可通過加權來自已濾波音頻信號的頻域表示型態的各個子帶信號而體現。因此頻率選擇特性的此種“影響”經執行而無任何系統性延遲,原因在于子帶信號的乘法或加權運算不會遭致任何延遲。已濾波音頻信號及原先音頻信號的減法也系在頻譜域執行。再者,較佳地執行例如無論如何皆需要的額外操作,諸如頻譜帶復制解碼或立體聲或多聲道解碼在一個且同一 QMF域額外地執行。頻時轉換只在解碼鏈的末端執行來將最終產生的音頻信號帶回時域。如此,取決于應用用途,當不再要求在QMF域的額外處理操作時,通過減法器產生的結果音頻信號可就此轉換回時域。但當解碼算法在QMF域有額外處理操作時,則頻譜時間轉換器并非連接至減法器輸出,反而連接至最末頻域處理裝置的輸出。
[0010]較佳地,用以濾波已解碼音頻信號的濾波器為長期預測濾波器。再者,較佳頻譜表示型態為QMF表示型態,額外地較佳頻率選擇性為低通特性。
[0011]但與長期預測濾波器相異的任何其它濾波器、與QMF表示型態相異的任何其它頻譜表示型態、或與低通特性相異的任何其它頻率選擇性可用來獲得已解碼音頻信號的低延遲后處理。
【專利附圖】
【附圖說明】
[0012]圖1A為依據一實施例用以處理已解碼音頻信號的設備的框圖;
[0013]圖1B為用以處理已解碼音頻信號的設備的一較佳實施例的框圖;
[0014]圖2A示出了頻率選擇特性作為低通特性;
[0015]圖2B示出了加權系數及相聯結的子帶;
[0016]圖2C示出了時/頻轉換器及隨后連接的用以施加加權系數至各個單獨子帶信號的加權器的串級;
[0017]圖3示出了在圖8例示說明的AMR-WB+中低通濾波器的頻率響應中的脈沖響應;
[0018]圖4示出了脈沖響應及頻率響應轉換成QMF域;
[0019]圖5示出了用于32QMF子帶實例的加權器的加權因子;
[0020]圖6示出了針對16QMF頻帶的頻率響應及相聯結的16加權因子;
[0021]圖7示出了 AMR-WB+的低頻音準加強器的框圖;
[0022]圖8示出了 AMR-WB+的體現后處理配置;
[0023]圖9示出了圖8的實施方式的衍生 '及
[0024]圖10示出了依據一實施例的長期預測濾波器的低延遲體現。
【具體實施方式】
[0025]圖1A例示說明用以處理在線已解碼音頻信號100的設備。在線已解碼音頻信號100被輸入至濾波器102用以濾波該已解碼音頻信號來獲得的在線已濾波音頻信號104。濾波器102連接至時間頻譜轉換器級106,例示說明為用于已濾波音頻信號的106a及用于在線已解碼音頻信號100的106b兩個各個時間頻譜轉換器。時間頻譜轉換器級106被配置為將該音頻信號及該已濾波音頻信號轉換成各自有多個子密碼有效期的相對應頻譜表示型態。在圖1A中這以雙線表示,指示框106a、106b的輸出包含多個各個子帶信號而非單一信號,如針對框106a、106b的輸入例不說明。
[0026]處理設備額外包含加權器108,用以對框106a輸出的已濾波音頻信號執行頻率選擇性加權,執行方式將各個子帶信號乘以各個加權系數來獲得在線已加權已濾波音頻信號110。
[0027]此外,設置減法器112。減法器被配置為執行已加權已濾波音頻信號與由框106b所產生的該音頻信號的頻譜表示型態間的逐一子帶減法。[0028]此外,設置頻譜時間轉換器114。由框114所執行的頻時轉換使得由減法器112所產生的結果音頻信號或從該結果音頻信號獲得的信號轉換成時域表示型態而獲得在線已處理已解碼音頻信號116。
[0029]雖然圖1A指示因時頻轉換及加權的延遲顯著低于因FIR濾波的延遲,但此點并非于全部情況下皆屬必要,原因在于其中QMF是絕對地必要的情況下,可避免FIR濾波的延遲及QMF的延遲累加。因此當針對低音后濾波因時頻轉換加權的延遲甚至高于FIR濾波的延遲時,本發明也有用。
[0030]圖1B示出看USAC解碼器或AMR-WB+解碼器的脈絡的本發明的較佳實施例。圖1B示出的設備包含ACELP解碼器級120、TCX解碼器級122及連接點124,在該處連接解碼器120、122的輸出。連接點124始于兩個各個分支。第一分支包含濾波器102,濾波器102較佳地被配置為由音準滯后T設定的長期預測濾波器,接著為適應性增益α的放大器129。此外,第一分支包含時間頻譜轉換器106a,其較佳系體現為QMF分析濾波器組。再者,第一分支包含加權器108,其被配置為加權由QMF分析濾波器組106a所產生的子帶信號。
[0031]在第二分支中,已解碼音頻信號通過QMF分析濾波器組106b而轉換成頻譜域。
[0032]雖然各個QMF框106a、106b是例示說明為兩個分開組件,但須注意用于分析已濾波音頻信號及音頻信號,并非必要要求有兩個各個的QMF分析濾波器組。取而代之,當信號逐一地轉換時,單一 QMF分析濾波器組及內存即足。但用于極低延遲體現,較佳系針對各個信號使用各個QMF分析濾波器組,讓單一 QMF框不會形成算法的瓶頸。
[0033]較佳地,轉換成頻譜域及轉換回時域通過算法執行,具有針對正向及反向轉換的延遲小于具有頻率選擇性特性的時域中濾波的延遲。因此,轉換須具有總延遲小于關注的濾波器的延遲。特別有用者為低分辨率轉換,諸如以QMF為基礎的轉換,原因在于低頻率分辨率結果導致需要小型轉換窗,也即導致縮小的系統性延遲。較佳應用用途只要求低分辨率轉換分解該信號成少于40個子帶,諸如32或只有16個子帶。但即便在時頻轉換及加權導入比低通濾波器更高的延遲的應用中,由于下述事實而獲得優點,免除了其它處理程序所必然需要的低通濾波器與時間頻譜轉換的延遲累加。
[0034]但針對由于其它處理操作諸如重新取樣、SBR或MPS而無論如何皆要求時頻轉換的應用,與由時頻轉換或頻時轉換所遭致的延遲無關地,獲得延遲減少,原因在于將濾波器體現“含括”入頻譜域,可完全節省時域濾波器延遲,由于下述事實:執行逐一子帶加權而無任何系統性延遲。
[0035]自適應放大器129通過控制器130控制。控制器130被配置為當輸入信號為TCX解碼信號時,設定放大器129的增益α為零。典型地,在切換音頻編解碼器諸如USAC或AMR-WB+中,在連接點124的已解碼信號典型地來自TCX解碼器122或來自ACELP解碼器120。因此有兩個解碼器120、122的已解碼輸出信號的時間多任務。控制器130被配置為針對目前時間瞬間,決定該輸出信號來自TCX解碼信號或ACELP解碼信號。當決定有TCX信號時,適應性增益α被設定為零,使得由組件102、109、106a、108所組成的第一分支不具任何意義。此點由于下述事實,用在AMR-WB+或USAC的特定種類的濾波只要求用在ACELP解碼信號。但當執行諧波濾波或音準加強以外的其它后濾波體現時,則取決于需求,可差異地設定可變增益α。
[0036]但當控制器130決定目前可用信號乃ACELP解碼信號時,放大器129的值被設定為α的正確值,典型地為O至0.5。于此種情況下,第一分支為有意義,減法器112的輸出信號實質上與在連接點124的原先已解碼音頻信號有別。[0037]用在解碼器120及放大器128的音準信息(音準滯后及增益α )可來自該解碼器及/或專用音準追蹤器。較佳地,信息來自該解碼器,并且然后通過專用音準追蹤器/該已解碼信號的長期預測分析而重新處理(提煉)。
[0038]由減法器112執行每帶或每子帶減法所產生的結果音頻信號并不立刻執行回到時域。取而代之,該信號前傳至SBR解碼器模塊128。模塊128連接至單聲-立體聲或單聲道-多聲道解碼器,諸如MPS解碼器131,在該處MPS表示MPEG環繞。
[0039]典型地,頻帶數目通過頻譜帶寬復制解碼器提升,通過在框128輸出的額外三個行132指示。
[0040]再者,輸出數目通過框131額外提升。框131從在框129輸出的單聲道信號產生例如五聲道信號或任何其它有二或更多聲道的信號。例示說明具有左聲道L、右聲道R、中聲道C、左環繞聲道Ls及右環繞聲道Rs的五聲道景況。因此針對各個單獨聲道存在有頻譜時間轉換器114,換言的,于圖1B中存在有五倍,來將各個單獨聲道信號從頻譜域,在圖1B實例中為QMF域,轉換回于框114輸出的時域。再度,并非必要為多個各個頻譜時間轉換器。也可有單一頻譜時間轉換器,其逐一地處理轉換。但當要求極低延遲體現時,較佳系針對各個頻道使用各個頻譜時間轉換器。
[0041]本發明的優點在于由低音后濾波器所導入的延遲,及更明確言之,由低通濾波器FIR濾波器所導入的延遲減少。因此任一種頻率選擇性濾波就QMF所要求的延遲,或概略言的,就時/頻轉換而言不會導入額外延遲。
[0042]當無論如何要求QMF或一般而言要求時-頻轉換時,本發明特別優良例如在圖1B的情況,在該處無論如何SBR功能及MPS功能系在頻譜域執行。在該處要求QMF的替代體現為當以已解碼信號執行重新取樣時的景況,并且當為了重新取樣目的而要求具有不同濾波器組聲道數目的QMF分析濾波器組及QMF合成濾波器組時的景況。
[0043]此外,由于二信號也即TCX及ACELP信號現在具有相同延遲,故ACELP與TCX間維持恒定幀。
[0044]帶寬延展解碼器129的功能以細節描述于IS0/IEC⑶23003-3章節6.5。多聲道解碼器131的功能以細節描述于IS0/IEC⑶23003-3章節6.11。TCX解碼器及ACELP解碼器背后的功能系以細節描述于IS0/IEC CD23003-3區塊6.12至6.17。
[0045]隨后,討論圖2Α至圖2C來例示說明示意實例。圖2Α例示說明示意低通濾波器的經頻率選擇的頻率響應。
[0046]圖2Β例示說明針對圖2Α所指的子帶數目或子帶的加權指數。在圖2Α的示意情況下,子帶I至6具有等于I的加權系數,也即無加權,而子帶7至10具有遞減的加權系數,及子帶11至11具有零的加權系數。
[0047]時間頻譜轉換器諸如106a及隨后連接器加權器108的串級的相對應體現例示說明于圖2C。各個子帶1、2、…、14輸入以%、W2、…W14指示的各個加權框內。加權器108由該子帶信號的各次取樣乘以加權系數而施加圖2B的該表的加權因子至各個單獨子帶信號。然后,于加權器的輸出端,存在有已加權子帶信號,然后輸入圖1A的減法器112,減法器112額外地執行于頻譜域的減法。[0048]圖3例示說明該AMR-WB+編碼器于圖8的低通濾波器的脈沖響應及頻率響應。于時域的低通濾波器1? (η)在AMR-WB+由下列系數定義。
[0049]a[13] = [0.088250,0.086410,0.081074,0.072768,0.062294,0.050623,0.038774,0.027692,0.018130, 0.010578, 0.005221,0.001946,0.000385];
[0050]hLP (n) =a (13_n)針對 n 為 I 至 12
[0051]hLP (n) =a (n_12)針對 n 為 13 至 25
[0052]圖3例示說明的脈沖響應及頻率響應針對一種情況,當濾波器施加至12.8kHz的時域信號樣本時。則所產生的延遲為12樣本延遲,也即0.9375毫秒。
[0053]圖3例示說明的濾波器具有于QMF域的頻率響應,于該處各個QMF具有400赫茲分辨率。32QMF頻帶涵蓋于12.8kHz的信號樣本的帶寬。頻率響應及QMF域例示說明于圖4。
[0054]具有400赫茲分辨率的幅值頻率響應形成當施加低通濾波器于QMF域時的權值。加權器108的權值系用于圖5摘述的前述參數實例。
[0055]這些權值可計算如下:
[0056]ff=abs (DFT (hLP (n),64)),在該處DFT (x,N)代表信號x的長度N的離散富利葉變換。若X比N更短,則信號以N減X個零的大小填塞。DFT的長度N系相對應于兩倍QMF子帶數目。因1^ (η)乃實際系數信號,W示出了頻率O與尼奎斯特(Nysquist)頻率間的厄爾米辛(Hermitian)對稱及Ν/2頻率系數。
[0057]通過由分析濾波器 系數的頻率響應,其相對應于約2*pi*10/256的截止頻率。此點用來設計濾波器。為了節省若干ROM的耗用及有鑒于定點體現,然后這些系數經量化以14位寫成。
[0058]然后在QMF域的濾波執行如下:
[0059]Y=于QMF域的后處理信號
[0060]X=于來自核心編碼器的QMF信號中的已解碼信號
[0061]E=于TD產生的欲從X移除的諧波間噪聲
[0062]Y (k)=X (k) -V (k).E (k),針對 k 為 I 至 32
[0063]圖6例示說明又一實例,在該處QMF具有800赫茲分辨率,故16頻帶涵蓋于
12.SkHz取樣的信號的全帶寬。然后系數W如圖6指示在線圖的下方。濾波以就圖6討論的相同方式進行,但k只有I至16。
[0064]在16頻帶QMF中的該濾波器的頻率響應作圖為如圖6的例示說明。
[0065]圖10例示說明于圖1B示出了于102的長期預測濾波器的更進一步加強。
[0066]更明確言之,針對低延遲體現,圖9中第三行至末行的該項兔/? + 1)有問題。原因
在于相對于真實時間n,T樣本系在未來。因此為了解決此種情況,在該處因低延遲體現,尚
未能獲得未來數值,故與《 + 1)以^置換,如圖10指示。然后,長期預測濾波器估算先前技
術的長期預測,但使用較少延遲或零延遲。業已發現估算為夠好,相對于減少延遲的增益系比音準加強的些微損耗更優異。
[0067]雖然已經以設備脈絡描述若干方面,但顯然這些方面也表示相對應方法的描述,在該處一框或一裝置相對應于一方法步驟或一方法步驟的特征。同理,以方法步驟的脈絡描述的構面也表示相對應設備的相對應框或項或特征結構的描述。
[0068]取決于某些體現要求,本發明的實施例可在硬件或在軟件中體現。體現可使用數字儲存媒體執行,例如軟盤、DVD、CD、ROM、PROM、EPROM、EEPROM或閃存,可電子讀取控制信號儲存在其上,這些信號與(或可與)可編程計算機系統協作,因而執行各個方法。
[0069]依據本發明的若干實施例包含具有可電子式讀取控制信號的非過渡數據載體,這些控制信號可與可編程計算機系統協作,因而執行本文所述方法中的一者。
[0070]大致言之,本發明的實施例可體現為具有程序代碼的計算機程序產品,該程序代碼當計算機程序產品在計算機上運行時可執行該等方法中的一者。該程序代碼例如可儲存在機器可讀取載體上。
[0071]其它實施例包含儲存在機器可讀取載體上的用以執行本文所述方法中的一者的計算機程序。
[0072]換言的,因此,本發明方法的實施例為一種具有一程序代碼的計算機程序,該程序代碼系當該計算機程序于一計算機上運行時用以執行本文所述方法中的一者。
[0073]因此,本發明方法的又一實施例為數據載體(或數字儲存媒體或計算機可讀取媒體)包含用以執行本文所述方法中的一者的計算機程序記錄于其上。
[0074]因此,本發明方法的又一實施例為表示用以執行本文所述方法中的一者的計算機程序的數據串流或信號序列。數據串流或信號序列例如可經組配來通過數據通訊連接,例如通過因特網轉移。
[0075]又一實施例包含處理構件例如計算機或可編程邏輯裝置,其被配置為或適用于執行本文所述方法中的一者。
[0076]又一實施例包含一計算機,其上安裝有用以執行本文所述方法中的一者的計算機程序。
[0077]在若干實施例中,可編程邏輯裝置(例如可現場編程門陣列)可用來執行本文描述的方法的部分或全部功能。于若干實施例中,可現場編程門陣列可與微處理器協作來執行本文所述方法中的一者。大致上該等方法較佳通過任何硬件裝置執行。
[0078]前述實施例僅供舉例說明本發明的原理。須了解,本文所述配置及細節的修改及變化將為本領域技術人員顯而易見。因此,旨在僅受審查中的權利要求所限而非受由以描述及解說本文實施例所呈示的特定細節所限。
【權利要求】
1.一種用以處理一已解碼音頻信號(100)的設備,所述設備包含: 用以濾波所述已解碼音頻信號來獲得一已濾波音頻信號(104)的一濾波器(102); 用以將所述已解碼音頻信號和所述已濾波音頻信號轉換成相對應的頻譜表示型態的一時間頻譜轉換器級(106),其中,各個頻譜表示型態均具有多個子帶信號; 用以通過將子帶信號乘以各個加權系數執行所述已濾波音頻信號的所述頻譜表示型態的頻率選擇性加權來獲得一已加權已濾波音頻信號的一加權器(108); 用以執行所述已加權已濾波音頻信號與所述已解碼音頻信號的所述頻譜表示型態之間的一逐一子帶減法以獲得一結果音頻信號的一減法器(112);以及 用以將所述結果音頻信號或從所述結果音頻信號獲得的一信號轉換成一時域表示型態來獲得一已處理已解碼音頻信號(116)的一頻譜時間轉換器(114)。
2.根據權利要求1所述的設備,進一步包含一帶寬增強解碼器(129)或者一單聲-立體聲或一單聲道-多聲道解碼器(131)來計算從所述結果音頻信號獲得的所述信號, 其中,所述頻譜時間轉換器(114)被配置為不轉換所述結果音頻信號,而是將從所述結果音頻信號獲得的所述信號轉換成所述時域,使得在由所述時間頻譜轉換器級(106)定義的相同頻譜域中執行由所述帶寬增強解碼器(129)或者所述單聲-立體聲或單聲道-多聲道解碼器(131)進行的全部處理。
3.根據權利要求1或2所述的設備, 其中,所述已解碼音頻信號為一代數碼激勵線性預測(ACELP)已解碼輸出信號,以及 其中,所述濾波器(102)為由音準信息控制的一長期預測濾波器。
4.根據以上任一權利要求所述的設備, 其中,所述加權器(108)被配置為加權所述已濾波音頻信號,使得較低的頻率子帶與較高的頻率子帶相比被衰減得較少或不被衰減,由此所述頻率選擇性加權將一低通特性施加給所述已濾波音頻信號。
5.根據以上任一權利要求所述的設備, 其中,所述時間頻譜轉換器級(106)和所述頻譜時間轉換器(114)被配置為分別實現一正交鏡像濾波器(QMF)分析濾波器組和一正交鏡像濾波器合成濾波器組。
6.根據以上任一權利要求所述的設備, 其中,所述減法器(112)被配置為從所述音頻信號的相對應的子帶信號中扣除所述已加權已濾波音頻信號的一子帶信號來獲得所述結果音頻信號的一子帶,所述這些子帶屬于相同濾波器組聲道。
7.根據以上任一權利要求所述的設備, 其中,所述濾波器(102)被配置為執行所述音頻信號與至少在時間上位移一音準周期的音頻信號的一加權組合。
8.根據權利要求7所述的設備, 其中,所述濾波器(102)被配置為通過只組合所述音頻信號與存在于較早時間瞬間的所述音頻信號來執行所述加權組合。
9.根據以上任一權利要求所述的設備, 其中,所述頻譜時間轉換器(114)具有相對于所述時間頻譜轉換器級(106)的一不同數目的輸入聲道,以獲得一樣本率轉換,其中,當到所述頻譜時間轉換器的所述輸入聲道的數目高于所述時間頻譜轉換器級的輸出聲道的數目時獲得一升頻取樣;并且其中,當到所述頻譜時間轉換器的所述輸入聲道的數目小于所述時間頻譜轉換器級的輸出聲道的數目時獲得一降頻取樣。
10.根據以上任一權利要求所述的設備, 用以在一第一時間部分提供所述已解碼音頻信號的一第一解碼器(120); 用以在一不同的第二時間部分提供另一已解碼音頻信號的一第二解碼器(122); 連接至所述第一解碼器(120)及所述第二解碼器(122)的一第一處理分支; 連接至所述第一解碼器(120)及所述第二解碼器(122)的一第二處理分支; 其中,所述第二處理分支包含所述濾波器(102)及所述加權器(108),并且另外地,包含一可控制式增益級(129)和一控制器(130),其中,所述控制器(130)被配置為將所述增益級(129)的一增益設定至針對所述第一時間部分的一第一值以及設定至針對所述第二時間部分的一第二值或設定至零,所述第二值低于所述第一值。
11.根據以上任一權利要求所述的設備,進一步包含用以提供一音準滯后并用以基于所述音準滯后作為所述音準信息來設定所述濾波器(102)的一音準追蹤器。
12.根據權利要求10或11所述的設備,其中,所述第一解碼器(120)被配置為用以提供所述音準信息或用以設定所述濾波器(102)的所述音準信息的一部分。
13.根據權利要求10、11或12中任一項所述的設備,其中,所述第一處理分支中的一輸出端和所述第二處理分支中的一輸出端連接至所述減法器(112)的輸入端。
14.根據以上任一權利要求所述的設備,其中,所述已解碼音頻信號由包括在所述設備的一 ACELP解碼器(120)提供,以及 其中,所述設備進一步包含被實現為一轉換編碼激勵(TCX)解碼器的另一解碼器(122)。
15.一種處理一已解碼音頻信號(100)的方法,所述方法包含: 濾波(102)所述已解碼音頻信號來獲得一已濾波音頻信號; 將所述已解碼音頻信號和所述已濾波音頻信號轉換成(106)相對應的頻譜表示型態,其中,各個頻譜表示型態均具有多個子帶信號; 通過將子帶信號乘以各個加權系數來執行(108)所述已濾波音頻信號的所述頻率選擇性加權以獲得一已加權已濾波音頻信號; 執行(112)所述已加權已濾波音頻信號與所述已解碼音頻信號的所述頻譜表示型態之間的一逐一子帶減法以獲得一結果音頻信號;以及 將所述結果音頻信號或從所述結果音頻信號獲得的一信號轉換成(114)一時域表示型態來獲得一已處理已解碼音頻信號(116)。
16.一種具有一程序代碼的計算機程序,當所述計算機程序在一計算機上運行時,所述程序代碼用以執行根據權利要求15的處理一已解碼音頻信號的方法。
【文檔編號】G10L19/012GK103503061SQ201280015997
【公開日】2014年1月8日 申請日期:2012年2月10日 優先權日:2011年2月14日
【發明者】紀堯姆·福奇斯, 拉爾夫·蓋爾, 馬庫斯·施內爾, 埃曼努埃爾·拉維利, 斯特凡·多赫拉 申請人:弗蘭霍菲爾運輸應用研究公司