專利名稱:用于信號分析和合成的自適應混合變換的制作方法
技術領域:
本發明通常涉及信號分析和合成濾波器組諸如可以在音頻和視頻編碼系統中使用的那些濾波器組。更具體而言,本發明涉及通過能夠適配濾波器組的時間和頻率分辨率 的塊變換的級聯而實現的分析和合成濾波器組。
背景技術:
通常使用編碼系統來減小充分表示源信號所需的信息量。通過減小信息容量要 求,能夠在具有較低帶寬的信道上發送信號表示或使用較小的空間在媒體上存儲信號表 示。編碼能夠通過刪除源信號中的冗余分量或不相關分量而減小源信號的信息容量要求。 所謂的感知編碼方法和系統通常使用濾波器組,通過使用頻譜分量基本組去相關源信號來 減小冗余,以及通過根據心理感知準則自適應量化頻譜分量來減小不相關性。許多感知編碼系統通過塊變換實現濾波器組。在音頻編碼系統中,例如,通過時間 分段或時域采樣的塊表示的源音頻信號被變換成表示該源信號的頻譜內容的多組頻域系 數。這些分段的長度確立濾波器組的時間分辨率和頻率分辨率。時間分辨率隨分段長度的 減小而增加。頻率分辨率隨分段長度的增加而增加。由于這種關系,分段長度的選擇使得 在塊變換濾波器組的時間和頻率分辨率之間進行折衷。分段長度的單一選擇不能夠對于典型編碼系統所遇到的所有源信號條件提供分 辨率之間的最佳折衷。如果濾波器組具有較高的頻率分辨率(如果使用較長的分段長度則 能夠提供),通常能夠更有效地編碼緩慢變化或穩定的源信號。如果濾波器組具有較高的時 間分辨率(如果使用較短的分段長度則能夠提供),通常能夠更有效地編碼快速變化或高 度不穩定的源信號。通過響應于改變源信號條件適配分段長度,塊變換濾波器組能夠優化 其時間和頻率分辨率之間的折衷。在音頻編碼系統中可以使用例如各種各樣的變換實現濾波器組,但是廣泛地使用 特定的修改離散余弦變換(MDCT),因為它具有用于音頻編碼的若干非常有吸引力的特性, 其中包括能夠提供臨界采樣同時允許相鄰的源信號分段相互重疊。MDCT也是具有吸引力 的,因為它能夠基本上刪除在分段內基本上穩定的源信號中所有冗余分量。MDCT濾波器 組的正確操作要求使用重疊的源信號分段以及滿足一定準則的窗口函數,在Princen等 人的"Subband/Transform CodingUsing Filter Bank Designs Based on Time Domain AliasingCancellation,,(Proc. of the 1987International Conference onAcoustics, Speech and Signal Processing(ICASSP),1987 年 5 月,第 2161-64 頁)中描述了這些準 貝U。不幸的是,由于對必須應用于重疊源信號分段的窗口函數施加的要求,難以響應于信號 條件適配MDCT濾波器組的時間和頻率分辨率。—種有時稱為“窗口切換”的已知技術能夠通過響應于檢測到一定的信號條件諸如突然的信號改變或幅度瞬變而自適應地在兩個不同窗口函數之間進行切換,來適配MDCT濾波器組的時間分辨率。根據于1993年5月25日授予Edler的美國專利5214742中描述 的這種技術,不改變分段長度,而是通過在不同的窗口函數形狀之間進行切換以減小每個 分段中通過濾波器組變換的非零采樣的數量,來適配時間分辨率。不幸的是,這種技術不適 配濾波器組的頻率分辨率,并且無論何時減小時間分辨率都將嚴重地惡化濾波器組的頻率 選擇性,因為窗口切換需要的窗口函數的形狀必須是次最佳的以滿足MDCT正確操作的要 求。另一種有時稱為“塊切換”的已知技術類似于上述的窗口切換技術,因為它也在 不同的窗口函數形狀之間進行切換,但是塊切換技術通過響應于檢測到一定信號條件諸如 突然的信號改變或幅度瞬變而還自適應地在兩個不同的分段長度之間切換,能夠適配MDCT 濾波器組的時間和頻率分辨率。這種技術在高級音頻編碼器(AAC)中使用,在Bosi等人的 "IS0/IEC MPEG-2 Advanced Audio Coding” (J. AudioEng. Soc.,vol. 45,no. 10,1997 年 10 月,第789-814頁)中描述了該AAC。在AAC中,MDCT濾波器組被應用于穩定的長度等于2048個采樣的源信號分段,并 且應用于非穩定的長度等于256個采樣的源信號分段。在AAC中通過使用適于較長分段 的“長窗口函數”,適于較短分段的“短窗口函數”,允許從較長分段長度切換到較短分段長 度的“長到短橋接窗口函數”,以及允許從較短分段長度切換到較長分段長度的“短到長橋 接窗口函數”,來實現塊切換。兩種橋接窗口函數允許在不同的分段長度之間進行切換,同 時滿足MDCT正確操作所必需的準則。從較長分段長度切換到較短分段長度以及切換回到 較長長度是通過使用長到短橋接窗口函數應用MDCT于長分段,使用短窗口函數應用MDCT 于八個短分段的整數倍,以及使用短到長橋接窗口函數應用MDCT于長分段來實現的。緊接 著,必須應用MDCT于長分段,但可以使用長窗口函數或如果想要另一個塊切換則可以使用 長到短橋接窗口函數。盡管塊切換提供適配MDCT濾波器組的時間和頻率分辨率的方式,由于若干原因 它不是理想的解決方案。一個原因是在塊長度切換期間,由于橋接窗口函數的形狀必須是 次最佳的以允許進行分段長度切換并滿足MDCT正確操作的要求,從而惡化了變換的頻率 選擇性。另一個原因是切換不能在任意的時間發生。如上所述,MDCT必須在切換到較長分 段長度之后立即應用于另一個長分段。立即切換到較短長度是不可能的。這種塊切換技術 也不是一種理想的解決方案,因為這種切換機制僅提供兩種分段長度,這些分段長度對于 所有信號條件來說不是最佳的。例如,由于AAC中的較長和較短分段長度對于大多數語音 信號分段來說都不是最佳的,從而AAC中的兩種分段長度不是最佳的。對于語音的非穩定 性質來說2048采樣分段通常太長,256采樣分段通常太短而不能有效地刪除冗余的分量。 而且,存在許多穩定信號,對于這些信號來說長于2048個采樣的分段長度將會更佳。結果, 由于塊切換以適配MDCT濾波器組的時間和頻率分辨率的能力有限,損害了 AAC的性能。在遵循杜比數字(Dolby Digital)編碼比特流標準的編碼系統中使用另一種形式 的塊切換。在2001年8月20日公布的高級電視系統委員會(ATSC)題為“Revision A to Digital Audio Compression (AC-3) Standard” 的 A/52A 文件中描述了這種編碼標準,有時 稱為“AC-3”。在AC-3編碼系統中使用的塊切換形式應用MDCT于對于穩定信號是512個采 樣而對于非穩定信號是256個采樣的源信號分段。AC-3編碼系統中使用的塊切換技術提供當進行長度切換時更為靈活的選擇。而且,編碼性能對于非穩定的源信號如語音來說相當 好;但是,對于更穩定的信號的編碼性能受到較長分段提供的相對低的頻率分辨率的限制。在1995年2月28日授予Davidson的美國專利5394473中描述了用于MDCT濾波 器組的時間和頻率分辨率自適應控制的其他技術。這些技術中的部分技術允許使用窗口函 數應用MDCT濾波器組于基本上任何長度的分段,這些窗口函數比其他已知技術提供好得 多的頻率響應。不幸的是,這些技術必須適配MDCT的核心或基本函數,所以,它們與現有的 比特流標準如上述的AC-3標準不兼容。這些技術也是計算強度大的。
發明內容
需要一種效率更高和有效的方式以適配通過變換如MDCT實現的濾波器組的頻率 分辨率。該解決方案應該提供一種簡化其包含到與現有比特流標準兼容的系統中的實現。 這通過使用混合變換濾波器組來達到,該混合變換濾波器組可以通過級聯塊變換實現。根據本發明的教導,分析和合成濾波器組通過包括主變換與一個或更 多次變換級 聯的混合變換實現。在一種實現中,所述主變換是應用于相互重疊一半分段長度的源信號 分段的MDCT,以及所述次變換是對于在時間上的特定頻率應用于MDCT系數的非重疊塊的 DCT。可以通過增加由一個或更多次變換所變換的塊中的系數數量,增加濾波器組的頻率分 辨率。該一個或更多次變換可以應用于MDCT系數的塊,其具有隨系數頻率變化的系數數 量,從而允許以各種各樣的方式適配濾波器組的頻率分辨率。通過參考以下討論和附圖可以更好地理解本發明的各種特征及其優選實施例,其 中在若干附圖中相似的附圖標記表示相似的元件。僅僅將以下討論和附圖的內容作為實例 闡述,而不應該理解成表示對本發明范圍的限制。
圖1是在編碼系統中使用的發送機的示意方框圖。圖2是在編碼系統中使用的接收機的示意方框圖。圖3是可以用于實現本發明各個方面的設備的示意方框圖。圖4是包含本發明各個方面的分析濾波器組的示意方框圖。圖5是包含本發明各個方面的分析濾波器組的示意方框圖。
具體實施例方式A.引言本發明提供了一種通過混合變換實現的能夠容易地適配其頻率分辨率的濾波器 組。圖1和2分別例示了在可以包含本發明各個方面的音頻編碼系統中的發送機和接收機 的示意方框圖。在以下部分中簡要地討論了該例示發送機和接收機的特征。在這種討論之 后,將討論分析和合成濾波器組的有關特征。1.發送機圖1中例示的發送機應用分析濾波器組3于從路徑1接收的源信號以產生表示源 信號的頻譜內容的頻譜系數,應用編碼器5于頻譜系數以產生編碼的信息,以及應用格式 化器8于該編碼的信息以產生適于沿路徑9傳輸的輸出信號。該輸出信號可以立即傳送到接收機或被記錄以隨后傳送。分析濾波器組3可以以下面描述的各種方式來實現。在本公開中,術語如“編碼器”和“編碼”并無意圖暗示任何特定類型的信息處理。例如,經常使用編碼來減小信息容量需求;但是,本公開中的這些術語不必表示這種類型 的處理。編碼器5可以執行基本上任何類型的期望處理。在一種實現中,通過根據感知模 型、使用各種各樣的量化技術(包括在2001年6月12日授予Davidson等人的美國專利 6246345中描述的向量量化和增益自適應量化)來量化頻譜系數,產生編碼的信息。對于本 發明來說特定類型的編碼并不重要。2.接收機圖2中例示的接收機應用去格式化器23于從路徑21接收的輸入信號以獲得編碼 的信息,應用解碼器25于編碼的信息以獲得表示源信號的頻譜內容的頻譜系數,以及應用 合成濾波器組27于該頻譜系數以產生沿路徑29傳輸的輸出信號,該輸出信號是源信號的 復制品但可以不是精確的復制品。合成濾波器組27可以以與分析濾波器組3的實現互補 的各種方式實現。在本公開中,術語如“解碼器”和“解碼”并不意圖暗示任何特定類型的信息處理。 解碼器25可以執行基本上任何類型的所需或期望的處理。在一種與上述編碼處理相反的 實現中,將量化的頻譜分量解碼成去量化的頻譜系數。對于本發明來說特定類型的解碼并 不重要。B.自適應混合變換分析濾波器組3和合成濾波器組27包括混合變換,可以分別如圖4和5所示來實 現。圖4所示的分析濾波器組3包括主變換43以及與該主變換級聯的一個或更多次 變換45。該主變換被應用于源信號分段以產生表示該源信號分段的頻譜內容的多組頻譜系 數。對于在時間上的特定頻率,一個或更多次變換中的每個變換被應用于頻譜系數塊。響 應于控制信號而適配每個塊中系數的數量。圖5所示的合成濾波器組27包括一個或更多逆次變換52以及與該逆次變換級聯 的逆主變換54。對于在時間上的特定頻率,一個或更多逆次變換中的每個變換產生頻譜系 數塊。響應于控制信號而適配每個塊中的系數數量。對于在頻率上的特定時間頻譜系數塊 被組合成多組頻譜系數,以及主變換應用于該多組頻譜系數以產生被組合來提供原始源信 號的復制品的信號分段。分析濾波器組和合成濾波器組的主變換實現了一種分析/合成系統,其中逆主變 換消除了正向主變換產生的時域混疊贗象。例如,在上述Princen論文中描述的修改離散 余弦變換(MDCT)和逆MDCT (IMDCT)實現了成奇數堆棧的臨界采樣的單邊帶分析/合成系 統的時域等效。這些變換在這里稱為成奇數堆棧時域混疊消除(O-TDAC)變換。另一種TDAC 實現在Princen等人的"Analysis/Synthesis FilterBank Design Based on Time Domain Aliasing Cancellation,,(IEEETrans. on Acoust. , Speech, Signal Proc. , vol. ASSP-34, 1986,pp. 1153-1161)中描述。在這種實現中的分析濾波器組包括應用MDCT和修改離散正 弦變換(MDST)來交替信號分段。所述合成濾波器組包括應用IMDCT和逆MDST (IMDST)。這 些變換實現了成偶數堆棧的臨界采樣的單邊帶分析/合成系統的時域等效并且稱為成偶 數堆棧時域混疊消除變換。
次變換可以通過許多變換包括離散余弦變換(DCT)、離散正弦變換(DST)、和離散傅里葉變換(DFT)中的任何變換實現。在分析濾波器組3的優選實現中,類型-II DCT與上述0-TDACMDCT級聯使用。在 合成濾波器組27的對應實現中,O-TDAC IMDCT與類型-II逆DCT(IDCT)級聯使用。在以 下更詳細地討論這些實現。1.分析濾波器組參考圖4,從路徑1接收源信號采樣序列并存儲在緩沖器41中。分析器47是通過 應用某種分析處理于所存儲的采樣來確定在每個分段中源信號采樣數量、或分段長度以用 于隨后處理的可選組件。按需要可以使用基本上任何分析處理。例如,可以如以上引用的 ATSCA/52A文獻中所描述的那樣檢測幅度瞬變。表示所選擇分段長度的信息沿路徑2傳送 到格式化器7以包含在輸出信號中。在省略分析器47和路徑2的替換實現中使用固定長 度分段。a)分析窗口函數窗口 42通過利用分析窗口函數加權每個分段中的源信號采樣而形成重疊段序 列。響應于從路徑2接收的分段長度信息,適配用于每個分段的分析窗口函數的長度和形 狀。可以使用各種各樣的窗口函數,但是通常優選Kaiser-Bessel-DerivecKKBD)窗口函 數,因為它具有極佳的頻率選擇性特性。這種窗口函數從可以如下表示的Kaiser-Bessel 窗口函數推導出<formula>formula see original document page 8</formula>(1)其中,α = Kaiser-Bessel α 因數,η=窗口函數采樣號,N =以采樣數量表示的窗口函數長度,以及<formula>formula see original document page 8</formula>從4到7的α值對于典型的音頻編碼應用來說所起作用良好。上述推導利用長度等于期望窗口函數長度N減去重疊區間ν的矩形窗口函數卷積 Kaiser-Bessel窗口函數W (η)。參見表達式2。這種卷積可以簡化為如表達式3所示。<formula>formula see original document page 8</formula> (2)<formula>formula see original document page 8</formula>(3)其中,ν =在分段重疊區間內的采樣數量,N=窗口函數的期望長度,
W(η)=長度為 ν+1 的 Kaiser-Bessel 窗 口函數WP (η)=長度為N的推導積窗口,以及
<formula>formula see original document page 9</formula>通過取推導積窗口 WP(n)的平方根可以獲得KBD分析窗口函數。在表達式4中示
出了這種分析窗口函數。<formula>formula see original document page 9</formula>
b)主變換主變換43將加窗源信號采樣的每個分段變換成一組頻譜系數。一組系數中的每 個系數表示用于特定頻率的加窗分段的頻譜內容。在優選實現中使用O-TDAC MDCT。這種 變換可以表示為<formula>formula see original document page 9</formula>
其中,k=頻率系數號,η =輸入信號采樣號,m=源信號分段號,N =源信號分段長度,χ (η)=在采樣η處源信號χ的值,以及C(k) = MDCT 系數 k。O-TDAC MDCT產生以下形式的一組頻譜系數<formula>formula see original document page 9</formula>
主變換可以直接地根據表達式5實現或者通過在計算上效率更高的處理諸如使 用在美國專利5394473中描述的快速傅里葉變換(FFT)的那些處理來實現。可以響應于分 段長度使用基本上任何可期望的處理來適配分析窗口函數和主變換。在美國專利5214742、 美國專利5394473、上述ATSC A/52A文獻以及ISO/MPEG AAC文獻中公開了幾種技術。表示用于一個或更多相應頻率中每個頻率的加窗源信號分段的頻譜內容的頻譜 系數沿相應信號路徑傳遞并存儲在緩沖器中。例如,圖4所示的發送機沿兩條信號路徑中 的一條傳送用于兩個相應頻率中每個頻率的頻譜系數以存儲在緩沖器44a和44b中。為了 清楚例示,在圖4中只示出了兩條信號處理路徑。在典型系統中使用的分析濾波器組3的 實現可具有成百上千的路徑。
c)頻譜分量分析參考圖4所示的上部信號路徑,用于分段序列中特定頻率的頻譜系數存儲在緩沖器44a中并組合成塊。分析器48a確定每個塊中系數的數量,即塊長度,并沿路徑49a傳送 該長度。這個長度可以通過分析緩沖器44a中存儲的系數來確定。對于本發明來說特定的 分析方法不是原則上關鍵的。這里描述了幾種分析方法。一種基本的方法形成頻譜系數的最長可能塊,其中相應塊中的系數在數值上充分 地類似。這可以通過各種方法予以確定。一種方法是計算相鄰頻譜系數之間的數值差并識 別平均差小于某一閾值的相鄰系數的最長塊。另一種方法是使用緩沖器中存儲的用于多條 信號路徑的頻譜系數。這種方法針對頻譜系數帶對數值差求和以及識別在該帶上平均差小 于某一閾值的最長塊。這個帶的寬度可以與所謂的人聽覺系統的臨界帶寬相當。另一種基本方法依賴于通過在發送機中其它地方進行的信號編碼處理執行的信 號分析。例如,與上述A/52A文獻中描述的比特流標準兼容的發送機產生具有頻譜系數的 編碼信號,該頻譜系數表示為與定標因子相關的定標值。分析這些定標因子以識別能夠共 享同一組定標因子的MDCT系數組序列。分析器48a將用于其相應信號路徑的塊長度適配 成等于共享指數的系數組的數量。d)次變換次變換45a將頻譜系數的每個塊變換成一組混合變換系數。響應于從路徑49a接 收的塊長度信息適配該變換的長度。在優選實現中,類型-II DCT被應用于不相互重疊的 頻譜系數塊。這種變換可以表示為<formula>formula see original document page 10</formula>其中,X (k,j)=對于MDCT系數k的混合變換系數j,M = MDCT系數k的塊長度,以及<formula>formula see original document page 10</formula>所述次變換可以直接根據表達式7實現或者它可以通過在計算上效率更高的已 知處理諸如 Rao 等人的 “Discrete Cosine Transform" (Academic Press, Inc. , 1990)的 第4章中描述的處理實現。e)格式化器和其他信號路徑格式化器46a是可用來將混合變換系數以及塊長度信息組合到編碼器5和格式化 器7所能夠處理的數據中的可選組件。這允許圖1中所示發送機中的分析濾波器組3在對 發送機剩余部分的改變最小的情況下通過混合變換實現。緩沖器44b、分析器48b、次變換45b、以及格式化器46b在下部信號路徑中執行類 似于以上對于上部信號路徑中相應組件所討論的處理。f)編碼在典型的系統中,編碼器5產生以某種編碼形式表示混合變換系數的編碼的信 息。如果使用感知編碼處理,混合變換系數將被編碼成減小感知不相關性的形式。感知編 碼處理通常使得頻譜信息丟失,這不能夠通過接收機恢復或重建。這種丟失的概率在以下通過符號表示,它表示對混合變換產生的混合變換系數的可能修改。對于本發明而 言使用這種編碼處理并不是關鍵。2.合成濾波器組參考圖5,去格式化器51a和51b根據分別從路徑26a和26b接收的數據獲得混合 變換系數和塊長度信息。該塊長度信息沿路徑59a和59b傳送,以及混合變換系數被傳送 到逆次變換52a和52b。為了清楚例示,在圖5中只示出了兩個信號處理路徑。在典型系統 中使用的合成濾波器組27的實現可具有成百上千的路徑。去格式化器51b、逆次變換52b、緩沖器53b在下部信號路徑中執行類似于以下對 于上部信號路徑中相應組件所討論的處理。a)去格式化器參考圖5所示的上部信號路徑,去格式化器51a是可用于根據從去格式化器23和 解碼器25接收的數據分解多組混合變換系數和塊長度信息的可選組件。這允許在對接收 機剩余部分的改變最小的情況下將合成濾波器組27的混合變換實現包含在圖2所示的現 有接收機中。b)逆次變換逆次變換52a將一組混合變換系數變換成頻譜系數塊,該頻譜系數表示對于源信 號分段序列的特定頻率的頻譜內容。該頻譜系數塊存儲在緩沖器53a中。響應于從路徑 59a接收的塊長度信息而適配變換的長度。在優選實現中,類型-II IDCT被應用于不相互 重疊的頻譜系數塊。這種變換可以如下表示
I 2ΛΓ f(2m + lVr 一C(k, m) =J--T Rj . X(k' J')cos … ,0 < m < M (8)
VM PoL 2M .其中,0(/t,m)=根據編碼的混合變換系數獲得的MDCT系數k。該逆次變換可以直接根據表達式8實現或者它可以通過在計算上效率更高的已 知處理實現。c)逆主變換緩沖器53a和53b存儲頻譜系數并將這些頻譜系數傳送到逆主變換54,以使得該 逆主變換接收多組表示相應源信號分段的頻譜內容的頻譜系數。通過應用逆變換于該多組 頻譜系數而產生信號采樣的分段并存儲在緩沖器55中。響應于從路徑22接收的分段長度 信息而適配逆主變換的長度。在優選實現中使用O-TDAC IMDCT。在典型的應用中,在發送機中丟棄一半的MDCT系數。該丟棄的系數可以通過接收 機使用以下表達式進行恢復C(k) = -C(N-k) , N/2 ^ k < N(9)O-TDAC IMDCT可以如下表示
<formula>formula see original document page 11</formula>其中,; =恢復的信號釆樣。
所述逆主變換可以直接根據表達式10實現或者它可以通過在計算上效率更高的已知處理諸如使用在美國專利5394473中描述的FFT的那些處理實現。d)合成窗口函數窗口 56通過利用合成窗口函數來加權緩沖器55中存儲的信號采樣分段并將加權 的采樣添加到在重疊部分中相互重疊的分段中,產生沿路徑29的輸出信號。所述逆主變 換、合成窗口函數以及重疊添加處理消除了由正向變換產生的時域混疊贗象的至少相當大 部分。消除可能不精確,這是因為由編碼處理以及在計算主和次變換中有限的算術精度所 導致的對變換系數的修改。響應于從路徑22接收的分段長度信息,適配用于每個分段的合 成窗口函數的長度和形狀。在優選實現中使用等于以上在表達式4中示出的分析窗口函數 WA的KBD窗口函數。可以響應于分段長度信息使用諸如以上描述的處理來適配合成窗口函數以及逆
主變換。C.實現前面的公開僅僅闡述了幾種實現。可以使用各種各樣的變換和變換類型。可以以 各種各樣的方式來應用和實現本發明的原理。包含本發明各個方面的設備可以以各種方式實現,其中包括計算機或其他設備執 行的軟件,這些設備包括更專用組件諸如耦合至類似于通用計算機中的那些組件的數字信 號處理器(DSP)電路。圖3是可用于實現本發明各個方面的設備70的示意方框圖。DSP 72 提供計算資源。RAM 73是DSP 72使用的用來進行信號處理的系統隨機存取存儲器(RAM)。 ROM 74表示某種形式的永久性存儲器諸如只讀存儲器(ROM),用于存儲操作設備70以及執 行本發明各個方面所需的程序。I/O控制器75表示通過通信信道76、77接收和發送信號的 接口電路。模數轉換器和數模轉換器可以根據接收和/或發送模擬信號的需要包括在I/O 控制器75中。在所示的實施例中,所有主要的系統組件連接到總線71,該總線可以表示不 止一條物理總線;但是,不需要總線體系結構實現本發明。在以通用計算機系統實現的實施例中,可以包括附加的組件用于對接設備諸如鍵 盤或鼠標以及顯示器,以及用于控制具有存儲媒體諸如磁帶或磁盤、或光學媒體的存儲設 備。該存儲媒體可用來記錄用于操作系統的指令的程序、實用程序和應用程序,并且可以包 括實現本發明各個方面的程序的實施例。通過以各種各樣方式實現的組件,包括離散的邏輯組件、集成電路、一個或更多 ASIC和/或程序控制的處理器,能夠執行實踐本發明各個方面所需的功能。實現這些組件 的方式對于本發明來說并不重要。本發明的軟件實現可以通過各種各樣的機器可讀媒體諸如包括從超聲到紫外線 頻率的整個頻譜中的基帶或調制通信路徑、或使用基本上任何記錄技術傳送信息的存儲媒 體包括磁帶、卡或磁盤、光卡或光盤、以及在象紙這樣的媒體上的可檢測標記進行傳送。
權利要求
一種產生輸出信號的方法,包括接收具有頻譜內容的源信號的采樣;應用主變換于所述采樣的重疊分段以產生多組頻譜系數,其中,所述主變換是修改離散余弦變換,每組頻譜系數具有時域混疊贗象并表示對于一組頻率的相應源信號分段的頻譜內容;根據所述多組頻譜系數獲得表示該組頻率中的相同頻率的多個頻譜系數,并將所述多個頻譜系數組合成一個或更多頻譜系數塊,其中,響應于塊長度控制信號而適配在所述一個或更多塊中每個塊中組合的頻譜系數的數量;應用次變換于所述一個或更多頻譜系數塊以產生一組或更多組混合變換系數,其中,所述次變換是應用于不相互重疊的頻譜系數塊的離散余弦變換,響應于塊長度控制信號而適配應用于所述一個或更多頻譜系數塊中每個塊的所述次變換的長度;通過根據感知模型用增益自適應量化來量化所述一組或更多組混合變換系數,產生編碼的信息;以及將表示所述一組或更多組混合變換系數的所述編碼的信息以及所述塊長度控制信號組合到輸出信號中。
2.—種產生輸出信號的方法,包括接收包含編碼的信息的輸入信號,該編碼的信息表示源信號的頻譜內容; 通過根據感知模型按照增益自適應量化的逆過程對所述編碼的信息進行去量化,從該 輸入信號獲得塊長度控制信號和一組或更多組混合變換系數;應用逆次變換于該一組或更多組混合變換系數以產生一個或更多頻譜系數塊,該頻譜 系數表示對于在一組頻率中相同頻率的源信號的頻譜內容,其中,所述逆次變換是應用于 表示不相互重疊的頻譜系數塊的多組混合變換系數的逆離散余弦變換,響應于所述塊長度 控制信號而適配應用于所述多組混合變換系數的所述逆次變換的長度;將所述頻譜系數組合成多組頻譜系數,其中,每組頻譜系數具有時域混疊贗象并表示 對于該組頻率中所有頻率的源信號的分段的頻譜內容;以及應用逆主變換于該多組頻譜系數以產生對應于源信號的分段的輸出信號分段,其中, 該逆主變換是逆修改離散余弦變換,而且該逆主變換基本上消除所述時域混疊贗象。
3.一種用于產生輸出信號的設備,包括(a)輸入端;(b)輸出端;和(c)耦合至輸入端和輸出端的信號處理電路,其中該信號處理電路適于 從輸入端接收具有頻譜內容的源信號的采樣;應用主變換于所述采樣的重疊分段以產生多組頻譜系數,其中,所述主變換是修改離 散余弦變換,每組頻譜系數具有時域混疊贗象并表示對于一組頻率的相應源信號分段的頻 譜內容;根據所述多組頻譜系數獲得表示該組頻率中的相同頻率的多個頻譜系數,并將所述多 個頻譜系數組合成一個或更多頻譜系數塊,其中,響應于塊長度控制信號而適配在所述一 個或更多塊中每個塊中組合的頻譜系數的數量;應用次變換于所述一個或更多頻譜系數塊以產生一組或更多組混合變換系數,其中,所述次變換是應用于不相互重疊的頻譜系數塊的離散余弦變換,響應于所述塊長度控制信 號而適配應用于所述一個或更多頻譜系數塊中每個塊的所述次變換的長度;通過根據感知模型用增益自適應量化來量化所述一組或更多組混合變換系數,產生編 碼的信息;以及將表示所述一組或更多組混合變換系數的所述編碼的信息以及所述塊長度控制信號 組合到被發送到輸出端的輸出信號中。
4. 一種用于產生輸出信號的設備,包括(a)輸入端;(b)輸出端;和(c)耦合至輸入端和輸出端的信號處理電路,其中該信號處理電路適于從所述輸入端接收包含編碼的信息的輸入信號,該編碼的信息表示源信號的頻譜內容;通過根據感知模型按照增益自適應量化的逆過程對所述編碼的信息進行去量化,從該 輸入信號獲得塊長度控制信號和一組或更多組混合變換系數;應用逆次變換于該一組或更多組混合變換系數以產生一個或更多頻譜系數塊,該頻譜 系數表示對于在一組頻率中相同頻率的源信號的頻譜內容,其中,所述逆次變換是應用于 表示不相互重疊的頻譜系數塊的多組混合變換系數的逆離散余弦變換,響應于所述塊長度 控制信號而適配應用于所述多組混合變換系數的所述逆次變換的長度;將所述頻譜系數組合成多組頻譜系數,其中,每組頻譜系數具有時域混疊贗象并表示 對于該組頻率中所有頻率的源信號的分段的頻譜內容;以及應用逆主變換于該多組頻譜系數以產生對應于源信號的分段的輸出信號分段,其中, 該逆主變換是逆修改離散余弦變換,而且該逆主變換基本上消除所述時域混疊贗象,以及 所述輸出信號分段被發送到輸出端。
全文摘要
本發明涉及用于信號分析和合成的自適應混合變換。諸如在音頻和視頻編碼系統中使用的分析和合成濾波器組中每個濾波器組通過混合變換實現,該混合變換包括主變換與一個或更多次變換級聯。用于濾波器組的主變換實現其中消除時域混疊贗象的分析/合成系統。對變換系數的塊應用與該主變換級聯的所述次變換。改變該塊長度以適配分析和合成濾波器組的時間分辨率。
文檔編號G06T9/00GK101826071SQ20101016609
公開日2010年9月8日 申請日期2005年1月21日 優先權日2004年2月19日
發明者格蘭特·A.·戴維森, 馬克·S.·溫登 申請人:杜比實驗室特許公司