諧波音頻信號的帶寬擴展的制作方法
【專利摘要】一種在編解碼器中支持諧波音頻信號的帶寬擴展(BWE)的方法和裝置。編解碼器的解碼器部分中的方法包括:接收與頻帶b及頻帶b的多個相鄰頻帶相關聯的多個增益值。所述方法還包括:確定重建的對應頻帶b’是否包括譜峰。當頻帶b’包括譜峰時,基于接收到的多個增益值將與頻帶b’相關的增益值設置為第一值;否則基于接收到的多個增益值將所述增益值設置為第二值。本發明使得增益值與帶寬擴展頻域中的波峰位置一致。
【專利說明】諧波音頻信號的帶寬擴展
【技術領域】
[0001] 本發明涉及音頻信號的編碼和解碼,更具體地,涉及支持諧波音頻信號的帶寬擴 展(臓)。
【背景技術】
[0002] 基于變換的編碼是當今的音頻壓縮/傳輸系統中最常用的方案。這種方案的主 要步驟是首先通過合適的變換(例如DFT(離散傅立葉變換)、DCT(離散余弦變換)或 MDCT (修正離散余弦變換))將信號波形的短塊轉換到頻域。然后變換系數被量化、發送或 存儲且隨后用于重建音頻信號。這種方案對于一般的音頻信號有效,但是需要足夠高的比 特速率以創建變換系數的足夠好的表示。下面將給出這種變換域編碼方案的高層概述。
[0003] 將要編碼的波形逐塊地變換到頻域。用于此目的一個常用變換是所謂的修正離散 余弦變換(MDCT)。將由此得到的頻域變換矢量分成頻譜包絡(緩慢變化的能量)和頻譜殘 留。頻譜殘留是使用所述頻譜包絡對所獲得的頻域矢量進行歸一化而獲得的。對頻譜包絡 進行量化,將量化指標發送到解碼器。接下來,使用量化的頻譜包絡作為比特分配算法的輸 入,并基于頻譜包絡的特性分配用于編碼殘留矢量的比特。作為此步驟的結果,某個數量的 比特被分配給殘留的不同部分(殘留矢量或"子矢量")。一些殘留矢量不接收任何比特且 必定是充滿噪聲的或帶寬擴展的。通常,殘留矢量的編碼是兩個步驟的過程;首先對矢量項 的幅值進行編碼,接著對非零項的符號(不要與"相位"混淆,相位是與例如傅立葉變換相 關的)進行編碼。將針對于殘留幅值和符號的量化指標發送給解碼器,在解碼器中將殘留 和頻譜包絡進行組合,并最終變換回時域。
[0004] 電信網絡的容量在持續增長。然而,盡管有增長的容量,仍然存在限制每一通信信 道所需帶寬的強驅動力。在移動網絡中,用于每個呼叫的較小的傳輸帶寬在移動設備和服 務于該設備的基站兩者中都產生較低的功率消耗。這轉化成了移動運營商能量和成本的節 約,同時,最終用戶將體驗到延長的電池壽命和增長的通話時間。此外,每一用戶消耗的帶 寬越少,移動網絡能夠(并行地)服務的用戶就越多。
[0005] 提高將被以低的或中等的比特速率傳送的音頻信號質量的一個方法是集中可用 的比特以精確地表示音頻信號中的較低頻率。因此,使用BWE技術來基于僅需要少量比特 的較低頻率塑造較高頻率。這些技術的背景是人類聽覺系統的靈敏度取決于頻率。具體而 言,人類聽覺系統(例如我們的聽力)對于較高頻率不太精確。
[0006] 在典型的頻域BWE方案中,高頻變換系數按照頻帶進行分組。針對每個頻帶,對增 益(能量)進行計算、量化并發送(至信號的解碼器)。在解碼器端,用高頻增益對所接收 到的低頻系數的翻轉或平移(translate)及能量歸一化版本進行縮放(scale)。這樣,BWE 并不完全是"瞎的",因為至少頻譜能量與目標信號的高頻頻帶的頻譜能量相似。
[0007] 然而,某些音頻信號的BWE可能會導致音頻信號包含瑕疵,這對聽眾帶來煩惱。
【發明內容】
[0008] 本文提出了支持和改善諧波音頻信號的BWE的技術。
[0009] 根據本發明的第一方面,提出了一種變換音頻解碼器中的方法。該方法用于支持 諧波音頻信號的帶寬擴展(BWE)。所提出的方法可以包括與頻帶b及頻帶b的多個相鄰頻 帶相關的多個增益值的接收。所提出的方法還包括確定帶寬擴展頻率區域的重建的對應頻 帶b'是否包括譜峰。此外,如果該頻帶包括至少一個譜峰,該方法包括基于所接收到的多 個增益值將與頻帶b'相關的增益值G b設置為第一值。如果該頻帶不包括任何譜峰,該方 法包括基于所接收到的多個增益值將與頻帶b'相關的增益值G b設置為第二值。因此使得 增益值與頻譜的帶寬擴展部分中的波峰位置一致。
[0010] 此外,該方法可能包括:接收反映原始信號的高頻部分的至少一段的波峰能量與 噪聲底能量之間關系的參數或系數α。該方法還可以包括:基于接收到的系數α,將對應 的重建的高頻段的變換系數與噪聲混合。從而使得可以重建/仿真原始信號的高頻部分的 噪聲特性。
[0011] 根據本發明的第二方面,提出了一種支持諧波音頻信號的帶寬擴展(BWE)的變換 音頻解碼器或編解碼器。該變換音頻編解碼器包括適于執行上面描述的動作的功能單元。 此外,提出了一種變換音頻編碼器或編解碼器,包括適于導出或提供一個或更多個參數的 功能單元,當將所述一個或更多個參數提供給變換音頻解碼器時,能夠進行本文描述的噪 聲混合。
[0012] 根據本發明的第三方面,提出了一種用戶終端,其包括根據本發明第二方面的變 換音頻編解碼器。用戶終端可能是例如移動終端、平板設備、計算機、智能電話等諸如此類 的設備。
【專利附圖】
【附圖說明】
[0013] 現在將通過示例性的實施例并參照附圖的方式更詳細地描述本發明,在附圖中:
[0014] 圖1示出了諧波音頻頻譜,即諧波音頻信號的頻譜。這種類型的頻譜通常針對于 例如單一樂器聲音、嗓音等。
[0015] 圖2示出了諧波音頻頻譜的帶寬擴展。
[0016] 圖3a示出了用解碼器接收到的對應BWE頻帶增益(?來進行縮放的BWE頻譜(也 在圖2中示出)。頻譜的BWE部分嚴重失真。
[0017] 圖3b示出了本文提出的利用修正的BWE頻帶增益0Am° d來進行縮放的BWE頻譜。在 這種情況下,頻譜的BWE部分得到了所希望的形狀。
[0018] 圖4a和圖4b是示出了根據示例性實施例的變換音頻解碼器中的過程中的動作的 流程圖。
[0019] 圖5是示出了根據示例性實施例的變換音頻解碼器的框圖。
[0020] 圖6是示出了根據示例性實施例的變換音頻編碼器中的過程中的動作的流程圖。
[0021] 圖7是示出了根據示例性實施例的變換音頻編碼器的框圖。
[0022] 圖8是示出了根據示例性實施例的變換音頻解碼器中的裝置的框圖。
【具體實施方式】
[0023] 如上所述,音頻信號的帶寬擴展與一些問題相關聯。在解碼器中,當翻轉或平移低 頻帶(即經編碼、傳輸和解碼的頻帶部分)以形成高頻帶時,不能確定譜峰將會與原始信號 或"真實的"高頻帶中的譜峰結束于(end up)相同的頻帶中。來自低頻帶中的譜峰也許會 結束于在原始信號沒有波峰的頻帶中。還可能是另一種方式,即,低頻信號的沒有波峰的部 分(在翻轉或平移之后)結束于原始信號具有波峰的頻帶中。圖1提供了諧波頻譜的示例, 圖2提供了 BWE原理的圖示,接下來將對此作進一步的描述。
[0024] 如上描述的效果可能導致具有主要諧波內容的信號產生嚴重質量下降。原因是波 峰和增益位置間的這種不匹配將導致不必要的波峰衰減,或者兩個譜峰之間低能量頻譜系 數的放大。
[0025] 本文描述的方案涉及一種基于與波峰位置有關的信息來控制帶寬擴展區域的帶 寬增益的新方法。此外,本文提出的BWE算法能夠通過所發送的噪聲混合等級來控制"譜峰 噪聲底比"。這導致了在擴展的高頻中保留大量結構的BWE。
[0026] 本文描述的方案適用于諧波音頻信號。圖1示出了諧波音頻信號的頻譜(還可以 表示為諧波頻譜)。從圖中可以看出,頻譜包括波峰。這種類型的頻譜典型地適用于例如單 一樂器(如長笛)的聲音或者嗓音等。
[0027] 本文將討論諧波音頻信號頻譜的兩個部分。一個包括較低頻率的下部,其中"下" 表示低于將要進行帶寬擴展的部分;一個包括較高頻率的上部,例如比下部高。本文使用的 像"下部"或"低/較低頻率"之類的表達指的是諧波音頻頻譜的低于BWE交叉頻率的部分 (參見圖2)。類似地,像"上部"或者"高/較高頻率"之類的表達指的是諧波音頻頻譜的 高于BWE交叉頻率的部分(參見圖2)。
[0028] 圖2示出了諧波音頻信號的頻譜。本文接下來討論的兩個部分,在BWE交叉頻率 左邊的可看作下部,在BWE交叉頻率右邊的可看作上部。在圖2中,用淺灰色示出了原始頻 譜,即(在編碼器端看到的)原始音頻信號的頻譜。用深/較深灰色示出了頻譜的帶寬擴 展部分。頻譜的帶寬擴展部分不由編碼器進行編碼,而是通過使用先前描述的接收到的頻 譜的下部在解碼器端進行重建。在圖2中,出于比較的原因,對于較高頻率能看到原始(淺 灰色)頻譜和BWE(深灰色)頻譜兩者。較高頻率的原始頻譜對于解碼器是未知的,針對于 每一個BWE頻帶(或者高頻帶)的增益值例外。在圖2中,BWE頻帶用虛線分隔。
[0029] 為了更好地理解在頻譜的帶寬擴展部分中的增益值和波峰位置之間的不匹配的 問題,可以研究圖3a。在頻帶302a,原始頻譜包括波峰,但重建的BWE頻譜不包括波峰。這 在圖2的頻帶202中可以看到。因此,當將針對包括波峰的原始頻帶計算的增益應用于不 包括波峰的BWE頻帶時,如在頻帶302a中看到的那樣,將放大BWE頻帶的低能量頻譜系數。
[0030] 圖3a中的頻帶304a表示了相反的情況,即,原始頻譜的對應頻帶不包括波峰,但 重建的BWE頻譜的對應頻帶包括波峰。因此,針對(從編碼器接收到的)頻帶所獲得的增 益是針對于低能量頻帶計算的。當將該增益應用于包括波峰的對應頻帶時,結果變成了衰 減的波峰,如在圖3a的頻帶304a中所見。從感知或心理聲學的觀點來看,因為多種原因, 頻帶302a中示出的情況比頻帶304a中的情況對聽眾來說要更糟糕。簡單地描述,也就是, 與聲音分量的異常缺失相比,體驗到聲音分量的異常出現通常令聽眾更加不愉快。
[0031] 接下來將描述新的BWE算法的一個示例,以闡述本文所描述的概念。
[0032] 設Y (k)表示BWE區域(高頻變換系數)中變換系數的集合。將這些變換系數分組 到B個頻帶
【權利要求】
1. 一種由變換音頻解碼器執行的用于支持諧波音頻信號的帶寬擴展"BWE"的方法,所 述方法包括: -接收(401a)與頻帶b及頻帶b的多個相鄰頻帶相關聯的多個增益值; -確定(404a)帶寬擴展頻率區域的重建的對應頻帶b'是否包括譜峰,以及: 當重建的頻帶b'包括至少一個譜峰時: -基于接收到的多個增益值,將與重建的頻帶b'相關聯的增益值設置(406a:l)為第 一值;以及 當重建的頻帶b'不包括任何譜峰時: -基于接收到的多個增益值,將與重建的頻帶b'相關聯的增益值設置(406a :2)為第 二值,其中,所述第二值小于或等于所述第一值; 從而使得增益值與所述帶寬擴展頻率區域中的波峰位置一致。
2. 根據權利要求1所述的方法,其中,所述第一值是接收到的多個增益值的加權和。
3. 根據權利要求2所述的方法,其中,所述加權和是接收到的多個增益值的平均值。
4. 根據前述權利要求的任意一項所述的方法,其中,所述第二值是接收到的多個增益 值中最小的增益值之一。
5. 根據前述權利要求中任一項所述的方法,其中,所述第二值是接收到的多個增益值 之中的最小增益值。
6. 根據前述權利要求中任一項所述的方法,還包括: -接收(402b)反映原始信號的高頻部分的至少一段的波峰能量與噪聲底能量之間的 關系的系數α ; -基于接收到的系數α,將對應的重建的高頻段的變換系數與噪聲混合(403b), 從而能夠實現所述原始信號的所述高頻部分的噪聲特性的重建。
7. -種用于支持諧波音頻信號的帶寬擴展"BWE"的音頻解碼器(501),所述音頻解碼 器包括: -接收單元,適于接收與頻帶b及頻帶b的多個相鄰頻帶相關聯的多個增益值; -確定單元(504),適于確定帶寬擴展頻率區域的重建的對應頻帶b'是否包括譜峰; -增益應用單元(508),適于: -當重建的頻帶b'包括至少一個譜峰時,基于接收到的多個增益值將與重建的頻帶b' 相關聯的增益值設置為第一值;以及 -當重建的頻帶b'不包括任何譜峰時,基于接收到的多個增益值將與重建的頻帶b'相 關聯的增益值設置為第二值,其中,所述第二值小于或等于所述第一值; 從而使得增益值與所述帶寬擴展頻率區域中的波峰位置一致。
8. 根據權利要求7所述的音頻解碼器,其中,所述第一值是接收到的多個增益值的加 權和。
9. 根據權利要求8所述的音頻解碼器,其中,所述加權和是接收到的多個增益值的平 均值。
10. 根據權利要求7-9中任一項所述的音頻解碼器,其中,所述第二值是接收到的多個 增益值之中最小的增益值之一。
11. 根據權利要求7-10中任一項所述的音頻解碼器,其中,所述第二值是接收到的多 個增益值之中的最小增益值。
12. 根據權利要求7-11中任一項所述的音頻解碼器,還適于接收反映原始信號的高頻 部分的至少一段的波峰能量和噪聲底能量之間的關系的系數α ;以及還包括: -噪聲混合單元(510),適于基于接收到的系數α將對應的重建的高頻段的變換系數 與噪聲混合, 從而能夠實現所述原始信號的所述高頻部分的噪聲特性的重建。
13. -種包括根據權利要求6-12中任一項所述的音頻解碼器的用戶設備。
14. 一種由變換音頻編碼器執行的用于支持諧波音頻信號的帶寬擴展"BWE"的方法, 所述方法包括: -確定(602)與在諧波音頻信號的頻譜的上部中的頻帶b相關聯的波峰能量; -確定(603)與所述頻帶b相關聯的噪聲底能量; -基于所確定的波峰能量和噪聲底能量,確定(604)與所述頻帶b相關聯的噪聲混合系 數α ;以及 -向對應的變換音頻解碼器提供(606)所述噪聲混合系數α。
15. 根據權利要求14所述的方法,其中,所述頻譜的上部是包括比BWE交叉頻率更高頻 率的部分。
16. -種用于支持諧波音頻信號的帶寬擴展"BWE"的音頻編碼器,所述音頻編碼器包 括: -確定單元(704),適于確定與在諧波音頻信號的頻譜的上部中的頻帶b相關聯的波峰 能量和噪聲底能量; -噪聲系數單元(706),適于基于所確定的波峰能量和噪聲底能量,確定與所述頻帶b 相關聯的噪聲混合系數α ;以及 -提供單元(708),適于向對應的變換音頻解碼器提供所述噪聲混合系數α。
17. -種包括計算機可讀代碼的計算機程序(810),當在處理單元中運行時,使得音頻 解碼器執行根據權利要求1-6中任一項所述的方法。
18. -種計算機程序產品(808),包括計算機可讀介質和存儲在所述計算機可讀介質 中的根據權利要求16所述的計算機程序(810)。
【文檔編號】G10L21/038GK104221082SQ201280071983
【公開日】2014年12月17日 申請日期:2012年12月21日 優先權日:2012年3月29日
【發明者】塞巴斯蒂安·內斯隆德, 沃洛佳·格蘭恰諾夫, 托馬斯·詹森·托夫特戈德 申請人:瑞典愛立信有限公司