高頻重建期間的音頻信號處理的制作方法
【專利說明】
[0001] 本發明申請是申請日期為2011年7月14日、申請號為"201180016982. 8"、發明名 稱為"高頻重建期間的音頻信號處理"的發明專利申請的分案申請。
技術領域
[0002] 本申請涉及音頻信號的HFR(高頻重建/再生)。具體地,本申請涉及一種用于執 行音頻信號的HFR的方法和系統,該音頻信號跨越用于重建音頻信號的高頻的低頻范圍具 有能量水平的大的變化。
【背景技術】
[0003] 諸如譜帶復制(SBR)技術的HFR技術允許顯著提高傳統的感知音頻編解碼器的編 碼效率。HFR與MPEG-4高級音頻編碼(AAC)相結合形成了極為高效的音頻編解碼器,其已 用在XM衛星廣播系統和世界數字廣播聯盟中,并且還在3GPP、DVD論壇等中被標準化。AAC 和SBR的組合被稱為aacPlus。aacPlus是MPEG-4標準的一部分,在MPEG-4標準中aacPlus 被稱為高效AAC簡檔(HE-AAC)。通常,HFR技術可以通過向后和向前兼容的方式與任何感 知音頻編解碼器組合,因此提供了升級已建立的如EurekaDAB系統中使用的MPEGLayer-2 的廣播系統的可能。HFR方法還可以與語音編解碼器組合以允許超低位率的寬帶語音。
[0004] HFR的基本思想在于如下觀測結果:信號的高頻范圍的特性和同一信號的低 頻范圍的特性之間通常存在強相關性。因此,通過從低頻范圍到高頻范圍的信號變調 (transposition)可以實現對信號的原始輸入高頻范圍的表示的良好近似。
[0005] 在通過引用合并于此的W098/57436中建立了這一變調概念,作為一種用于從音 頻信號的低頻帶重建高頻帶的方法。通過在音頻編碼和/或語音編碼中使用這一概念,可 以獲得位率的顯著節約。在下文中,將參考音頻編碼,但是應注意,所描述的方法和系統同 樣適用于語音編碼以及統一語音和音頻編碼(USAC)。
[0006] 使用濾波器組或可選的變換,可以在時域或頻域中執行高頻重建。該處理通常牽 涉若干步驟,其中兩個主要操作是首先創建高頻激勵信號,以及隨后對高頻激勵信號構形 以近似原始高頻譜的譜包絡。創建高頻激勵信號的步驟可以例如基于單邊帶調制(SSB),其 中具有頻率《的正弦波被映射到具有頻率《+A?的正弦波,其中A?是固定頻移。換 言之,通過低頻子帶到高頻子帶的"上復制(copy-up) "操作,可以從低頻信號生成高頻信 號。創建高頻激勵信號的另一方法可以牽涉低頻子帶的諧波變調。T階的諧波變調典型地 被設計為將低頻信號的頻率為《的正弦波映射到高頻信號的具有頻率Tu(其中T>1)的 正弦波。
[0007] HFR技術可以用作源編碼系統的一部分,其中用于引導HFR處理的分類控制信息 連同窄帶/低頻信號的表示一起從編碼器傳送到解碼器。對于其中不可以傳送額外的控制 信號的系統,可以利用根據解碼器側的可用信息估計的適當的控制數據,在解碼器側應用 該處理。
[0008] 高頻激勵信號的前述包絡調整的目的在于實現模擬原始高帶譜形的譜形。為此, 必須修改高頻信號的譜形。換言之,將應用于高帶的調整是現有譜包絡和期望的目標譜包 絡的函數。
[0009] 對于在頻域中操作的系統,例如在偽QMF濾波器組中實現的HFR系統,由于借助于 組合來自源頻率范圍的若干貢獻來創建高帶信號會將人工譜包絡引入到將進行包絡調整 的高帶中,因此現有技術方法在這一點上不是最優的。換言之,在HFR處理期間從低頻信號 生成的高帶或高頻信號典型地呈現人工譜包絡(典型地包括譜中斷)。這給譜包絡調整器 造成了困難,因為調整器不僅必須有能力以適當的時間和頻率分辨率應用期望的譜包絡, 而且調整器還必須能夠清除由HFR信號生成器人工引入的譜特性。這給包絡調整器的設計 約束造成了困難。結果,這些困難往往導致感知的高頻能量損失,以及高帶信號中的譜形的 可聽中斷,特別是對于語音類型的信號。換言之,傳統的HFR信號生成器往往將中斷和水平 變化引入達到在低帶范圍中具有大的水平變化的信號(例如撕撕聲)的高帶信號中。當隨 后包絡調整器暴露于該高帶信號時,包絡調整器不能合理地和一致地從低帶信號的任何自 然譜特征中分離新引入的中斷。
[0010] 本文描述了針對前述問題的解決方案,其導致了提高的感知音頻質量。具體地,本 文描述了對從低帶信號生成高帶信號的問題的解決方案,其中有效地調整高帶信號的譜包 絡以在不引入不合需要的人工產物的情況下模擬高帶中的原始譜包絡。
【發明內容】
[0011] 本文提出了作為高頻重建信號生成的一部分的附加的校正步驟。作為該附加的校 正步驟的結果,提高了高頻分量或高帶信號的音頻質量。該附加的校正步驟可以應用于使 用高頻重建技術的所有源編碼系統,以及目的在于重建音頻信號的高頻的任何單端后處理 方法或系統。
[0012] 根據一個方面,提供了一種編碼器(901),其被配置成從音頻信號(903)生成控制 數據(905),編碼器(901)包括:用于分析音頻信號(903)的譜形并且確定當根據音頻信號 (903)的多個低頻子帶信號(602)再生音頻信號(903)的高頻分量時引入的譜包絡中斷的 程度的裝置;以及用于生成用于基于中斷的程度控制高頻分量的再生的控制數據(905)的 裝置。
[0013] 根據一個方面,還提供了一種音頻解碼器(700),被配置成對位流(704)解碼,位 流(704)表示低頻音頻信號(707)以及描述相應的高頻音頻信號的譜包絡的目標能量集 合(708),其中,位流(704)還表示控制數據(905),音頻解碼器(700)被配置成:根據與低 頻音頻信號(707)和目標能量集合相關聯的多個低頻子帶信號(602)確定多個高頻子帶信 號,其中,控制數據(905)表示是否還使用多個譜增益系數用于確定多個高頻子帶信號,其 中,多個譜增益系數與多個低頻子帶信號(602)中的各個低頻子帶信號的能量相關聯;以 及根據多個低頻子帶信號和多個高頻子帶信號生成寬帶音頻信號。
[0014] 根據一個方面,還提供了一種用于從音頻信號(903)生成控制數據(905)的方法, 該方法包括:分析音頻信號(903)的譜形以確定當根據音頻信號(903)的多個低頻子帶信 號再生音頻信號(903)的高頻分量時引入的譜包絡中斷的程度;以及生成用于基于中斷的 程度控制高頻分量的再生的控制數據(905)。
[0015] 根據一個方面,還提供了一種用于對位流(704)進行解碼的方法,位流(704)表示 低頻音頻信號(707)以及描述相應的高頻音頻信號的譜包絡的目標能量集合(708),其中, 位流(704)還表示控制數據(905),該方法包括:根據與低頻音頻信號(707)和目標能量集 合相關聯的多個低頻子帶信號(602)確定多個高頻子帶信號,其中,控制數據(905)表示是 否還根據多個譜增益系數確定多個高頻子帶信號,其中,多個譜增益系數與多個低頻子帶 信號(602)中的各個低頻子帶信號的能量相關聯;以及根據多個低頻子帶信號和多個高頻 子帶信號生成寬帶音頻信號。
[0016]根據一個方面,描述了一種被配置成生成覆蓋高頻區間的多個高頻子帶信號的系 統。該系統可以被配置成從多個低頻子帶信號生成多個高頻子帶信號。多個低頻子帶信號 可以是低帶或窄帶音頻信號的子帶信號,可以使用分析濾波器組或變換來確定它們。特別 地,可以使用分析QMF(正交鏡像濾波器)濾波器組或FFT(快速傅立葉變換)從低帶時域 信號確定多個低頻子帶信號。多個生成的高頻子帶信號可以對應于從其得到多個低頻子帶 信號的原始音頻信號的高頻子帶信號的近似。特別地,多個低頻子帶信號和多個(重新) 生成的高頻子帶信號可以對應于QMF濾波器組和/或FFT變換的子帶。
[0017]該系統可以包括用于接收多個低頻子帶信號的裝置。這樣,該系統可以設置在從 低帶信號生成多個低頻子帶信號的分析濾波器組或變換的下游。低帶信號可以是已在核心 解碼器中從接收到的位流解碼的音頻信號。位流可以存儲在例如致密盤或 DVD的存儲介質 上,或者位流可以通過例如光學或無線傳送介質的傳送介質在解碼器處被接收。
[0018] 該系統可以包括用于接收目標能量集合的裝置,目標能量也可以稱為尺度因子 (scalefactor)能量。每個目標能量可以覆蓋高頻區間中的不同的目標區間,該目標區間 也可以稱為尺度因子帶。典型地,與目標能量集合對應的目標區間集合覆蓋整個高頻區間。 目標能量集合的目標能量