專利名稱:對參數進行自適應分組以獲得提高的編碼效率的制作方法
技術領域:
本發明涉及參數的無損編碼,具體涉及針對有效參數壓縮的編碼 規則的產生和使用。
背景技術:
最近以來,多通道音頻再現技術越來越顯重要,這或許是因為如下事實例如目前已為人熟知之mp3技術的音頻壓縮/編碼技術,使得利 用網絡或者其它具有有限帶寬的傳輸通道來分發音頻記錄成為可能。該 mp3編碼技術之所以會變的這么有名,系因為如下事實它可以以立體 聲格式,亦即以包含第一或者左立體聲通道以及第二或者右立體聲通道 的音頻記錄的數字表示,來分發記錄。然而,傳統的二聲道系統有其基本的缺點,因此,開發出環繞聲技 術。 一種推薦的多通道環繞聲表示除了包括兩個立體聲通道L以及R以 外,還包括額外的中央通道C以及兩個環繞聲道Ls、 Rs。該參考聲音格 式也稱為三/二立體聲,意謂其具有三個前端通道以及兩個環繞聲道。 一般說來,五個傳輸通道是必須的。在重放環境中,至少需要把五個揚 聲器放在五個適當的位置,以獲得距離該五個已經適當放置的揚聲器特 定距離的最佳甜美音點。已經有許多為人熟知的技術,可以用來降低傳輸多通道音頻信號所 需要的數據量,這些技術稱為聯合立體聲技術。為此目的,請參考第9 圖,其中顯示了一聯合立體聲設備60。該設備可以是一個用來實行強度 立體聲(intensity stereo簡寫為IS)或者立體聲提示編碼(binaural cue coding簡寫為BCC)的設備。這樣的一個設備通常會接收至少兩個 通道(CH1、 CH2、…CHn)作為輸入,并輸出至少是單一載波通道以及 參數數據。對該參數數據進行定義,使得在解碼器中能夠計算原始通道 (CH1、 CH2、…CHn)的逼近(approximation)。一般說來,該載波通道會包含子波段采樣、頻譜系數、時域采樣等, 如此一來可以提供基礎(underlying)信號的比較良好的表示,而參數 數據不包含該頻譜系數的采樣,但包括控制參數,以控制特定的重建算 法,例如乘法加權、時間平移、頻率平移、相位平移等。該參數數據因 此僅包含該信號或者與其關連的通道的比較粗糙的表示。若以數字來表 示,載波通道所需的數據量大約在60kbit/s至70kbit/s的范圍內。而 一個通道的參數輔助信息所需要的數據量典型地在1.5kbit/s至 2.5kbit/s的范圍內。幾種為人熟知的參數數據包括縮放因子、強度 立體聲信息或者立體聲提示參數,如同下文所述。舉例而言,BCC技術在下列文章中有所敘述AES convention paper 5574, "Binaural Cue Coding applied to Stereo and Multi-Channel Audio Compression" , C. Faller, F. Baumgarte, May 2002, Munich; IEEE WASPAA Paper "Efficient representation of spatial audio using perceptual parametrization" , October 2001, Mohonk, NY; "Binaural cue coding applied to audio compression with flexible rendering", C. Faller and F. Baumgarte, AES 113th Convention, Los Angeles, Preprint 5686, October 2002 ; 以及 "Binaural cue coding-Part II:Schemes and applications " ,C. Faller 禾卩 F.Baumgarte, IEEE Trans, on Speech and Audio Proc. ,volume level . 11, no. 6, Nov. 2003。在BCC編碼方式中,首先利用具有重迭窗口的基于離散傅立葉變換 (Discrete Fourier Transform,簡寫為DFT)的變換將多個音頻輸入通 道轉換為頻譜表示。由上述方法得到的均勻頻譜被分為不重迭的部分, 每一部分的頻寬與等效矩形帶寬(Equivalent Rectangular Bandwidth, 簡寫為ERB)近似成正比。然后針對每一部分,在兩個通道之間進行BCC 參數的估測。 一般說來,每個通道的BCC參數都相對于參考通道而給出, 并且進一步被量化。該傳輸參數最后再根據指定的方程式(已編碼的)進 行計算,其也可能依賴于待處理的信號的特定部分。多個BCC參數確實存在。舉例而言,ICLD參數用來描述兩個相比 較的通道所包含能量的差(比值)。通道間相干性/相關性(inter-channel coherence/correlation,簡寫為ICC)參數用來描述兩個通道之間的相關性,其可以理解為兩個通道波形的相似性。通道間時 間差(inter-channel time difference,簡寫為ICTD)參數用來描述兩 個通道之間的全局時移,而通道間相位差(inter-channel phase difference,簡寫為IPD)參數則是用來描述信號之間相位的差。應當注意的是,在音頻信號的框架式處理(frame-wise processing)中,BCC分析也以框架式執行,也就是時變的,而且還以 頻率式(frequency-wise)而執行。這意味著,對于每一個頻譜波段, 分別獲得BCC參數。這還意味著,如果用聲音濾波器組(bank)將輸入 信號分解為例如32個帶通信號,則BCC分析塊獲得針對此32個波段中 每一個的BCC參數組。一種相關的技術,也就是所謂的參數立體聲,在下列文章中有所描 述J. Breebaart, S, van de Par, A. Kohlrausch, E. Schuijers "High-Quality Parametric Spatial Audio Coding at Low Bitrates", AES 116thConvention, Berlin, Pr印rint 6072, May 2004;以及E. Schuijers , J. Breebaart , H. Purnhagen , J. Engdegard , "Low Complexity Parametric Stereo Coding", AES 116th Convention, Berlin, Pr印rint 6073, May 2004。總括來說,多通道音頻信號參數編碼的新近方法(空間音頻編碼以 及立體聲提示編碼等),是借助下混合(downmix)信號(可以是單通道的,或者包括若干通道)以及參數輔助信息(空間提示)來表示多通道音頻信 號,所述參數輔助信息描述了感知的空間聲基寬(sound stage)的特 征。通常希望將輔助信息的數據率維持的盡可能低,以便將額外開銷信 息降至最低,并且為下混合信號的編碼留出盡可能多的可用傳輸容量。一種使輔助信息的比特率保持為低的方法是,例如通過向輔助信息 應用熵編碼算法,對空間音頻方案的輔助信息進行無損編碼。無損編碼己經廣泛用于一般的音頻編碼中,以確保量化的頻譜系數 和輔助信息的最佳緊密表示。適當的編碼方案與方法的例子可以在 IS0/IEC標準MPEG1第3部分、MPEG2第7部分以及MPEG4第3部分中 找到。這些標準以及,例如IEEE paper "Noiseless Coding of Quantized Spectral Coefficients in MPEG-2 Advanced Audio Coding ,, S. R. Quackenbush, J. D. Johnston' IEEE WASPAA, Mohonk, NY, October 1997 描述了現有技術狀態中的技術,包含以如下手段對量化的參數進行無損編碼*量化頻譜系數的多維霍夫曼(Huffman)編碼 參針對系數組,使用公共(多維)霍夫曼碼本參將值編碼為一個孔(hole),或者將符號信息以及數量信息分別進 行編碼(即針對給定的絕對值僅具有霍夫曼碼本條目,這減小了所需碼 本的大小,"帶符號的"與"無符號的"碼本的比較)參使用具有不同的最大絕對值的替代碼本,亦即在待編碼的參數中 具有不同的最大絕對值參針對每一個LAV,使用具有不同統計分布的替代碼本*以輔助信息的方式把霍夫曼碼本的選擇發送至解碼器*使用"分區"(sections)來定義每一個所選霍夫曼碼本的應用范圍 頻率縮放因子的差分編碼,以及隨后對結果進行霍夫曼編碼 在MPEG1音頻標準中,提出另一種將粗略量化值以無損的方式編碼 為單一 PCM碼的技術(在該標準內被稱作分組(grouping),并且用于 第2層),這在IS0/IEC標準11172-3: 93中有更詳細的解釋。出版物 "Binaural cue coding - Part II: Schemes and applications" , C. Faller與F. Baumgarte, IEEE Trans, on Speech and Audio Proc., volume level. 11, no. 6, Nov. 2003提到一些有關BC C參數編碼的信息.其提出以如下方式對量化的ICLD參數進行差分編 碼參在頻率上進行差分編碼,而且隨后對結果進行霍夫曼編碼(使用 一維霍夫曼碼)*在時間上進行差分編碼,而且隨后對結果進行霍夫曼編碼(使用 一維霍夫曼碼)
最后,選擇更有效率的變體(variant)作為原始音頻信號的表示。 如同前面所提到的,己經提出通過在頻率上(以及可選地在時間上) 進行差分編碼、然后選擇更有效率的變體而對壓縮性能進行優化。然后, 通過一些輔助信息將所選變體發信號通知(signal)給解碼器。已經做出大量努力以減小下混合音頻信號及相應輔助信息的大小。 然而,可實現的比特率仍舊過高,以致不能實現每種可能的應用。例如, 針對移動電話的音頻和視頻內容的流需要最小可能的比特率,因而需要 更有效率的內容編碼。發明內容本發明的目的是提供一種改進的編碼概念,能夠以更高的效率對 參數值進行無損壓縮。根據本發明的第一方面,該目的通過一種用于參數壓縮的壓縮單 元而實現,所述參數包括具有原始信號第一部分的表示 (representation)的第一參數集,所述參數還包括具有原始信號第 二部分的表示的第二參數集,所述第二部分與所述第一部分相鄰,所 述壓縮單元包括供給器,用于供給第一元組和第二元組,每個元組 具有至少兩個參數,第一元組具有來自第一參數集的兩個參數,而第 二元組具有來自第一參數集的一個參數以及來自第二參數集的一個參 數;比特估測器,基于編碼規則來估測使用包括第一元組的第一元組 序列對參數集進行編碼所需的比特數,以及使用包括第二元組的第二 元組序列對參數集進行編碼所需的比特數;以及提供器,用于提供編碼 塊,所述提供器可以使用導致較少比特數的元組序列來提供所述編碼 塊,并提供指示從中導出所述編碼塊的元組序列的序列指示。根據本發明的第二方面,該目的通過一種用于對編碼參數塊進行 解碼并用于處理序列指示的解碼器而實現,所述參數包括具有原始信 號第一部分的表示的第一參數集,所述參數還包括具有原始信號第二 部分的表示的第二參數集,所述第二部分與所述第一部分相鄰,所述 解碼器包括解壓縮器,所述解壓縮器可使用取決于用于對元組序列進行編碼的編碼規則的解碼規則,對編碼參數塊進行解壓縮以導出參數的元組序列,每一個元組具有至少兩個參數;以及幀建構器,用于 接收序列指示,所述序列指示指示所述編碼塊所基于的多個不同序列 中所使用的元組序列,而且所述幀建構器還用于使用所用元組序列的 信息來建構所述參數集。根據本發明的第三方面,該目的通過一種用于參數壓縮的方法而 實現,所述參數包括具有原始信號第一部分的表示的第一參數集,所 述參數還包括具有原始信號第二部分的表示的第二參數集,所述第二 部分與所述第一部分相鄰。根據本發明的第四方面,該目的通過一種當在計算機上運行時執 行如上方法的計算機程序而實現。根據本發明的第五方面,該目的通過一種用于對編碼參數塊進行 解碼并用于處理序列指示的方法而實現,所述參數包括具有原始信號 第一部分的表示的第一參數集,所述參數還包括具有原始信號第二部 分的表示的第二參數集,所述第二部分與所述第一部分相鄰。根據本發明的第六方面,該目的通過一種當在計算機上運行時執 行如上方法的計算機程序而實現。根據本發明的第七方面,該目的通過一種參數的壓縮表示而實 現,所述參數包括具有原始信號第一部分的表示的第一參數集,所述 參數還包括具有原始信號第二部分的表示的第二參數集,所述第二部分與所述第一部分相鄰,所述參數的壓縮表示包括表示所用元組序 列的編碼參數塊;以及序列指示,所述序列指示指示所述編碼參數塊所基于的第一或第二序列中的所用元組序列,其中第一序列包括具有 來自第一參數集的兩個參數的第一元組,而第二序列包括具有來自第 一參數集的一個參數和來自第二參數集的一個參數的第二元組。本發明基于如下發現當包括具有原始信號第一部分的表示的第 一參數集和具有原始信號第二部分的表示的第二參i集的參數被布置 在第一元組序列和第二元組序列中時,可進行有效的編碼,其中,所 述第一元組序列包括具有來自所述原始信號的單一部分的兩個參數的 參數元組,而所述第二元組序列包括具有來自所述原始信號第一部分
的一個參數以及來自所述原始信號第二部分的一個參數的參數元組。 使用比特估測器來估測對所述第一和第二元組序列進行編碼所需的比 特數,從而能夠實現有效的編碼,其中,僅對導致較少比特數的元組 序列進行編碼。因此,基本原理是,例如在時間和頻率上對待編碼的參數進行重 新排列,并最終使用一種參數排列(元組序列)進行壓縮,該排列導 致壓縮參數具有較少比特數。在本發明的一個實施例中,以具有兩個參數的對的形式,把描述 原始信號兩個連續時間部分的頻譜表示的兩個頻譜參數集進行自適應 分組,以提高編碼效率。因此, 一方面使用包括來自相同時間部分的 兩個相鄰頻率參數的參數元組而產生元組序列。另一方面,使用利用 來自原始信號第一時間部分的第一參數和來自原始信號第二時間部分 的相應參數而建構的元組而產生第二元組序列。然后,使用二維霍夫 曼碼對兩個元組序列進行編碼。比較兩個編碼后的元組序列的大小, 并最終選擇導致較少比特數的元組進行傳送。與使用哪種元組建構編 碼數據有關的信息作為附加的輔助信息被傳送至解碼器。先前描述的本發明的解碼器的一個優點是,由于把參數分組為包 括兩個參數的元組,因而可以把二維霍夫曼碼用于壓縮,這通常會導 致較低的比特率。第二個優點是,自適應分組(即在編碼過程中動態地在兩種可能 的分組策略中進行抉擇的概念)進一步減小了輔助信息的比特率。針對具有兩個連續幀的集合,在兩種分組策略之間僅做出一次抉 擇,這會額外地減小所需的輔助信息量,因為針對具有兩個完整連續 時幀的集合僅需傳送一次指示,該指示指示出編碼期間所使用的分組 策略。在本發明的其他實施例中, 一種本發明的壓縮單元額外包括差分 編碼器,所述差分編碼器在自適應分組前在時間或頻率上對參數進行 差分編碼。該差分編碼和自適應分組以及適當的霍夫曼碼本進一步減 小了待傳送的輔助信息的大小。兩種差分編碼的可能與兩種分組策略導致了總共4種可能的組合,進一步增大了查找編碼規則的概率,其
導致低輔助信息比特率。在本發明的其他實施例中,本發明的概念用于解壓縮單元,允許 對編碼參數塊進行解碼,并基于輔助信息而重建原始幀,所述輔助信 息表明了編碼參數塊所基于的分組方案。在有利修改中,本發明的解 碼器還允許對沒有進行自適應分組的數據進行解碼,因而能夠實現本 發明的解碼器與現有裝置的兼容性。
下文參考附圖來描述本發明的優選實施例,其中-圖l示出了本發明的壓縮單元;圖2示出了對參數進行自適應分組的兩種可能;圖3示出了對參數進行自適應分組的一些額外的可能;圖4示出了不同的編碼方案;圖5示出了本發明的解碼器;圖6示出了現有技術的多通道編碼器。
具體實施方式
圖1示出了本發明的壓縮單元90,包括供給器IOO、比特估測器 102和提供器104。供給器100在兩個數據輸出端供給具有元組106a的第一序列和 具有元組106b的第二序列。提供器104在其兩個數據輸入端108a和 108b上接收元組106a和106b。比特估測器在其數據輸入端110a和 110b上接收兩個元組。比特估測器102估測通過向兩元組106a和106b施加編碼規則而 導致的比特數。比特估測器102選擇導致較少比特數的元組,并通過 信令輸出112a發信號(signal)表明是元組106a還是106b將導致較 少的比特數。基于比特估測器102的決定,最終把導致較少比特數的元組編碼 為編碼塊118,經提供器104的輸出端120a而提供,其中,該提供器 還在其信令線路120b上發出序列指示的信號,其指示對哪個元組(106a或106b)的原始序列進行編碼而導出編碼塊118。在備選實施例中,當省略供給器100和提供器104之間的虛線連 接122a和122b時,可實現相同的功能。在該備選方案中,比特估測 器102會把元組106a和106b的序列進行編碼,且會把兩個不同的編 碼塊124a和124b傳送至提供器104,其中,提供器額外地發出信號, 以表明編碼塊124a和124b從元組106a和106b的原始序列中的哪個 序列導出。對此,可以使用比特估測器102的信令輸出端112a,或該 信令可由提供器104隱式地導出。在該備選實施例中,提供器104僅把具有較少比特數的編碼塊轉 送至其輸出端120a,并附帶地提供序列指示。圖2示出了用于導出待編碼元組序列的兩種自適應分組方案的示 例。為了解釋本發明的自適應分組的原理,示出了原始信號中的4個 后續(subsequent)時幀130a至130d,其中每一個幀具有包括5個 頻譜參數132a至132e的集合。根據本發明,兩個連續幀的頻譜參數要么在頻率上進行分組(如 元組134a和134b所示),要么在時間上進行分組(如元組136a和136b 所示),從而建構元組序列。時間上的分組導致第一元組序列138,而 頻率上的分組導致第二元組序列140。例如,使用霍夫曼碼本對元組序列138和140進行編碼,形成兩 個不同的碼字序列142和144。根據本發明,最終把需要較少比特數 的碼字序列傳輸至解碼器,該解碼器必須額外地接收序列指示,該指 示表明碼字序列的基礎是時間分組還是頻率分組。從圖2中可以看出, 對于所示出的參數對(二維)自適應分組的示例,該序列指示可以僅包 含l個單一比特。圖3示出了可用于實現本發明的自適應分組的一些備選的分組策 略,其允許大于二維的霍夫曼碼。圖3示出了二維霍夫曼碼146a、三維霍夫曼碼146b和四維霍夫 曼碼146c的分組策略。對于每一種策略,示出了兩個連續的時幀,其 中,相同的大寫字母代表屬于相同元組的參數。圖2已經示出了二維霍夫曼碼情況下的分組,在頻率和時間上建 構二維元組148a和148b。在建構包括3個參數的元組的情況下,頻 率元組158a是這樣的元組一幀內的三個相鄰頻率參數被分組到一起 以形成元組。以如下方式建構時間元組150b:來自一幀的兩個相鄰參 數與來自另一幀的一個參數進行組合,如圖3所示。通過把一個幀的四個相鄰參數分組為一個元組,與其他時間元組 相對應地建構四維時間分組元組152a。以如下方式建構時間分組元組 152b:把一幀的兩個相鄰參數與另一幀的兩個相鄰參數進行組合,其 中單一幀的參數對描述兩個連續時幀的相同頻譜特性。如圖3中所示,允許不同的分組方案可明顯降低輔助信息的比特 率,例如,如果使用具有不同維度的多個預定霍夫曼碼本,可在編碼 過程中改變分組的維度,使得在編碼過程中的任意時間都可使用導致 最低比特率的表示(r印resentation)。圖4示出了如何通過在霍夫曼編碼過程前應用一些差分編碼,從 而使用本發明的壓縮單元(額外地包括差分編碼器)進一步減少輔助 信息。為了說明時間和頻率上的差分編碼,使用已經在圖2中示出的參 數的相同的絕對表示160作為各種差分編碼步驟的基礎。第一種可能 是,在頻率上對參數的絕對表示160進行差分編碼,形成差分編碼參 數162。從圖4中可以看到,為了對絕對表示160進行差分編碼,使 每個時幀的第一參數不變,而第二參數則被絕對表示160的第二參數 與第一參數的差而取代。依照相同規則建構差分編碼表示內的其它參 數。另一種可能是時間上的差分編碼,產生表示164。從圖4中可以 看出,該表示以如下方式建構使整個第一幀不變,而隨后的幀的參 數被絕對表示的參數與先前幀的相同參數之差而取代。第三種可能是,先在頻率上迸行差分編碼,然后在時間上進行差 分編碼,或者相反,兩種情況下均形成在時間和頻率上進行差分編碼 的相同的編碼表示166。要注意的是,有機會使用原始信號的這4種不同的表示作為自適 應分組的輸入。看一看給定參數示例的不同表示160至166,能清楚 地看出差分編碼怎樣對輔助信息的傳輸率產生影響。看一看絕對表示 160,可以看出時間上的分組和頻率上的分組均不會形成具有相同內容 的元組。因此,無法建構向最頻繁出現的元組分配最短碼字的合適的 霍夫曼碼本。情況不同的是,看一看頻率上的差分編碼表示162,可以建構只 需具有4個條目以覆蓋全部表示的霍夫曼碼本,而且會向元組(l, 1) 或元組(2, 2)分配最小長度的碼字,從而實現緊密的輔助信息。該優點在時間上的差分編碼表示164中較不明顯。然而,此處亦 能得到頻率上的分組并利用多個元組(5, 5)和(10, 10)。對于時間和頻率上的差分編碼表示166來說,甚至可能實現比表 示162中更小的輔助信息比特率,這是因為時間上的分組會形成高重 復性(multiplicity)的元組(l, 0),如圖中所示,而這允許建構向 先前元組分配最短碼字的霍夫曼碼本。從圖4中可以清楚地看到,利用自適應分組和差分編碼的本發明 概念的高靈活性允許選擇最為適合原始音頻信號的策略,因而允許保 持輔助信息比特率為低。總之,在一個優選實施例中,對量化參數值首先在時間上進行差 分編碼(變體l),并在頻率上進行差分編碼(變體2)。然后,把形成的 參數在時間上(變體a)和頻率上(變體b)進行自適應分組。結果,產生 四種可能的組合(la、 lb、 2a、 2b),從中選取最佳者并發信號通知解 碼器。這可以由僅為2比特的信息來完成,例如比特組合OO、 01、 10、 11表示變體la、 lb、 2a、 2b。圖5示出了根據本發明的解碼器,用于對編碼參數塊進行解碼, 其中,該參數塊包括具有第一頻譜參數集的第一幀以及具有第二頻譜 參數集的第二幀。解碼器200包括解壓縮器202與幀建構器204。解壓縮器在輸入 端上接收編碼參數塊206。解壓縮器使用解碼規則從編碼參數塊206 中導出參數元組序列208。該參數元組序列208被輸入幀建構器204。幀建構器額外地接收序列指示210,其指示編碼器使用哪個元組 序列來建構編碼參數塊。 然后,幀建構器204對序列指示210所指引的元組序列208進行 重新排列,從參數元組序列208中重建第一幀112a和第二幀112b。上文所述的本發明的優選實施例通過向待使用多維霍夫曼碼進 行編碼的數值引入自適應分組,進一步提高了編碼效率。做為示例, 可進行頻率上的二維數值分組以及時間上的二維數值分組。然后,編 碼方案會進行兩種類型的編碼,并選擇更有利的一種(即需要較少比特 的變體)。該決策通過輔助信息而發信號通知給解碼器。如圖3中所示,在其他示例中,還可以建構更高維度的霍夫曼碼, 應用不同的分組策略以建構元組。假定的示例示出了通過僅把來自兩 個連續幀的參數分組到一起以建構元組的分組策略。還可能使用來自 三個或更多個連續幀的參數而進行分組,以直接方式(straight forward way)進行分組。在本發明的編碼器的修改中,還可能使用不同的霍夫曼碼本,把 差分分組和差分編碼策略進行組合,以導出輔助信息的最短可能表示。 這可以進一步減小編碼音頻信號的輔助信息比特率,其代價是需要額 外的輔助信息參數,發信號通知用于編碼的霍夫曼碼本。所述的本發明優選實施例以示例的方式示出了本發明的概念,其 中分組策略在兩個連續時幀內不發生變化。在本發明的修改中,當然 還可能使兩個幀的集合內的時間和頻率上的分組之間存在多個變化, 這意味著幀內還提供序列指示,以發信號通知分組策略的變化。在給定的示例中,在霍夫曼編碼前對該參數進行差分編碼。當然, 在參數的霍夫曼編碼前還可以使用每種其它的無損編碼規則,該編碼 的目標是導出盡可能多的相同內容的元組。圖4中給出了4種不同的可能的參數表示,即絕對表示、頻率上 的差分表示、時間上的差分表示以及時間和頻率上的差分表示。為了 在4個表示中進行選擇,如圖4所示,發信號通知使用哪個表示的輔 助信息在大小上必須至少為2個比特。為了平衡可能獲得的編碼效率 與附加的頻譜表示指示的關系,在原理上當然還可以決定僅允許兩種 可能的表示,把頻譜表示指示的長度減小至單一比特。作為本發明解碼器的示例,圖5示出了除接收編碼參數塊206之
外還接收某些輔助信息的解碼器200。在給定的示例中,指引幀建構器204的輔助信息僅包括序列指示210。根據本發明的解碼器當然可 以處理所需的任意其它輔助信息,特別是頻譜表示指示,其指示已被 用于對原始幀進行編碼的頻譜表示。取決于本發明的方法的特定實現要求,本發明的方法可以以硬件或 者軟件實現。該實現可以使用數字儲存媒介來執行,特別是其上存儲有 電可讀控制信號的盤、DVD或CD,其與可編程計算機系統一同操作,從 而執行本發明的方法。因此大體上說,本發明是在機器可讀載體上存儲 有程序代碼的計算機程序產品,當該計算機程序產品在計算機上運行 時,該程序代碼可以用于執行本發明的方法。換句話說,本發明的方法 是具有程序代碼的計算機程序,當該計算機程序在計算機上運行時,該 程序代碼可用于執行本發明的方法中至少一種方法。雖然在上文中參考特定實施例進行了特定的示出與描述,本領域 的技術人員可以理解,在不背離本發明的精神和范圍的前提下,可以 在形式和細節上做出各種其他的改變。應當理解的是,在不背離這里 所公開的以及由所附權利要求所包括的更寬的概念的前提下,可做出 各種改變以適應不同的實施例。
權利要求
1.一種用于參數壓縮的壓縮單元,所述參數包括具有原始信號第一部分的表示的第一參數集,所述參數還包括具有原始信號第二部分的表示的第二參數集,所述第二部分與所述第一部分相鄰,所述壓縮單元包括供給器,用于供給第一元組和第二元組,每個元組具有至少兩個參數,第一元組具有來自第一參數集的兩個參數,而第二元組具有來自第一參數集的一個參數以及來自第二參數集的一個參數;比特估測器,基于編碼規則來估測使用包括第一元組的第一元組序列對參數集進行編碼以及使用包括第二元組的第二元組序列對參數集進行編碼所需的比特數;以及提供器,用于提供編碼塊,所述提供器可以使用導致較少比特數的元組序列來提供所述編碼塊,并提供指示從中導出所述編碼塊的元組序列的序列指示。
2. 如權利要求1所述的壓縮單元,其中 信號的第一和第二部分的頻譜表示。
3. 如權利要求1所述的壓縮單元,其中 部分在時間或空間上相鄰。
4. 如權利要求1所述的壓縮單元,其中 視頻信號的第一幀的表示,而第二參數集包括原始音頻或視頻信號的第二 幀的表示。
5,如權利要求1所述的壓縮單元,其中,所述供給器可以僅使用具有來自一個單一參數集的元組而供給 第一元組序列中的第一元組和所有余下的元組,而且可以僅使用具有來自 第一參數集的至少一個參數以及來自第二參數集的至少一個參數的元組而 供給第二元組序列中的第一元組以及所有余下的元組;以及 所述提供器可以提供針對一個編碼塊的單一序列指示。
6.如權利要求1所述的壓縮單元,其中,所述供給器可以供給 由來自單一參數集的兩個參數所組成的第一元組,所述兩個參數是原始信號的表示內的相鄰參數;以及 由來自第一參數集的第一參數和來自第二參數集的第二參數所組成的 第二元組,所述第一和第二參數描述了所述表示中的原始信號的相同特性。
7. 如權利要求1所述的壓縮單元,其中,所述供給器可以供給 第一元組,由整數倍個數的來自單一參數集的兩個參數組成,所述參數是原始信號的表示內的相鄰參數;以及第二元組,由來自第一參數集的兩個或更多個參數以及來自第二參數 集的相同個數的參數組成,所述參數在原始信號的表示內相鄰,來自第一 和第二參數集的參數描述了所述表示內的原始信號的相同特性。
8. 如權利要求1所述的壓縮單元,其中,所述供給器可以供給 第一元組,由來自一個參數集的原始信號的表示的奇數個相鄰參數組成;以及第二元組,由大部分來自一個參數集的原始信號表示的相鄰參數以及 小部分來自另一參數集的原始信號的表示的相鄰參數組成,其中,對于第 二元組序列的連續元組,所述大部分參數從第一和第二參數集中交替獲取。
9. 如權利要求1所述的壓縮單元,其中,所述比特估測器可使用編碼規則,對第一元組序列進行編碼以 導出第一編碼塊,對第二元組序列進行編碼以導出第二編碼塊,并通過對第一和第二編碼塊的比特進行計數來估測所需比特數;以及所述提供器可以轉送第一或第二編碼塊,其選擇具有較少比特數的塊。
10. 如權利要求1所述的壓縮單元,其中,所述比特估測器可以根據編碼規則,估測對元組序列進行編碼所需的比特;以及所述提供器可以對元組序列進行編碼,提供具有較少比特數的編碼塊。
11. 如權利要求l所述的壓縮單元,其中,所述參數集包括視頻信號或 音頻信號的參數表示。
12. 如權利要求1所述的壓縮單元,其中,所述編碼規則為對長度相同但參數不同的元組進行編碼會導致具有不同長度的碼字。
13. 如權利要求1所述的壓縮單元,其中,所述參數包括描述第一和第 二原始音頻通道之間的空間相互關系的BCC參數,而且該BCC參數從如下 BCC參數列表中選擇通道間相干性/相關性(ICC)通道間電平差(ICLD) 通道間時間差(ICTD) 通道間相位差(IPD)。
14. 如權利要求1所述的壓縮單元,還包括差分編碼器,所述差分編碼 器用于處理原始信號,使得第一參數集和第二參數集包括差別表示,所述 差別是時間、頻率或時間和頻率上的差別。
15. 如權利要求14所述的壓縮單元,其中,所述供給器可以供給第一元組分組和第二元組分組,所述元組 分組內的元組具有來自如下表示中的一種表示的參數時間上的差分表示、頻率上的差分表示、時間和頻率上的差分表 示以及絕對表示,第一元組分組的元組具有來自第一參數集的兩個參數,而第二元組分 組具有來自第一參數集的一個參數和來自第二參數集的一個參數;以及所述比特估測器可以估測對至少八個元組序列的元組序列進行編碼所 需的比特數,每一個序列具有元組分組中的一個元組;以及除了所述序列指示以外,所述提供器可發信號表明表示指示,該表示 指示指示了導致較低比特數的表示。
16. 如權利要求15所述的壓縮單元,其中,所述提供器可操作用于 使用具有至少三個比特的二進制數據字來發信號表明序列指示和表示指 示。
17. 如權利要求1所述的壓縮單元,其中,所述編碼規則為每個元組 具有與其相關聯的不同碼字分組中的單一碼字。
18. 如權利要求1所述的壓縮單元,其中,所述編碼規則包含霍夫曼碼本。
19. 一種用于對編碼參數塊進行解碼并用于處理序列指示的解碼器,所 述參數包括具有原始信號第一部分的表示的第一參數集,所述參數還包括 具有原始信號第二部分的表示的第二參數集,所述第二部分與所述第一部分相鄰,所述解碼器包括解壓縮器,所述解壓縮器可使用取決于用于對元組序列進行編碼的編 碼規則的解碼規則,對編碼參數塊進行解壓縮以導出參數的元組序列,每 一個元組具有至少兩個參數;以及 幀建構器,用于接收序列指示,所述序列指示指示所述編碼塊所基于 的多個不同序列中所使用的元組序列,而且所述幀建構器還用于使用所用 元組序列的信息來建構所述參數集。
20. 如權利要求19所述的解碼器,其中,第一和第二參數集包括原始信號的第一和第二部分的頻譜表示。
21. 如權利要求19所述的解碼器,其中,原始信號的第一部分和第二部分在時間或空間上相鄰。
22. 如權利要求19所述的解碼器,其中,第一參數集包括原始音頻或 視頻信號的第一幀的表示,而第二參數集包括原始音頻或視頻信號的第二 幀的表示。
23. 如權利要求19所述的解碼器,其中,所述幀建構器可以接收針對 一個編碼參數塊的單一序列指示,并使用僅包括由所述序列指示所指示類 型的元組的元組序列來建構參數集。
24. 如權利要求19所述的解碼器,其中,所述幀建構器可以建構包括視頻信號或音頻信號的參數表示的參數集。
25. 如權利要求19所述的解碼器,其中,所述幀建構器可以建構包括 BCC參數的參數集,該BCC參數描述了第一和第二音頻通道之間的空間相互 關系,而且該BCC參數從如下BCC參數列表中選擇通道間相干性/相關性(ICC) 通道間電平差(ICLD) 通道間時間差(ICTD) 通道間相位差(IPD)。
26. 如權利要求19所述的解碼器,還包括差分解碼器,所述差分解碼 器用于接收表示指示并對參數集進行處理,使得從差別頻譜表示中導出參 數,所述差別是時間、頻率或時間和頻率上的差別,其中,所述差分解碼 器可以取決于所述表示指示而處理第一和第二參數集。
27. 如權利要求26所述的解碼器,其中,所述幀建構器和所述差分解碼器可以接收序列指示和表示指示,所述序列指示和表示指示包括具有至 少三個比特的二進制數據字的形式。
28. 如權利要求19所述的解碼器,其中,所述解碼規則為編碼參數塊內的每一個碼字具有與其相關聯的不同元組分組中的單一元組。
29. —種用于參數壓縮的方法,所述參數包括具有原始信號第一部分的 表示的第一參數集,所述參數還包括具有原始信號第二部分的表示的第二 參數集,所述第二部分與所述第一部分相鄰,所述方法包括-供給第一元組和第二元組,每一個元組具有至少兩個參數,第一元組 具有來自第一參數集的兩個參數,而第二元組具有來自第一參數集的一個 參數以及來自第二參數集的一個參數;基于編碼規則來估測使用包括第一元組的第一元組序列對參數集進行 編碼所需的比特數,以及使用包括第二元組的第二元組序列對幀進行編碼 所需的比特數;使用導致較少比特數的元組序列來提供編碼塊;以及提供指示從中導出所述編碼塊的元組序列的序列指示。
30. —種用于對編碼參數塊進行解碼并用于處理序列指示的方法,所述 參數包括具有原始信號第一部分的表示的第一參數集,所述參數還包括具 有原始信號第二部分的表示的第二參數集,所述第二部分與所述第一部分 相鄰,所述方法包括使用取決于用于對元組序列進行編碼的編碼規則的解碼規則,對編碼 參數塊進行解壓縮以導出參數的元組序列,每一個元組具有至少兩個參數;接收序列指示,所述序列指示指示所述編碼塊所基于的多個不同序列 中所使用的元組序列;以及使用所用元組序列的信息來建構所述參數集。
31. —種具有程序代碼的計算機程序,當在計算機上運行時,所述程序 代碼用于執行一種用于參數壓縮的方法,所述參數包括具有原始信號第一 部分的表示的第一參數集,所述參數還包括具有原始信號第二部分的表示 的第二參數集,所述第二部分與所述第一部分相鄰,所述方法包括供給第一元組和第二元組,每一個元組具有至少兩個參數,第一元組 具有來自第一參數集的兩個參數,而第二元組具有來自第一參數集的一個 參數以及來自第二參數集的一個參數;基于編碼規則來估測使用包括第一元組的第一元組序列對參數集進行 編碼所需的比特數,以及使用包括第二元組的第二元組序列對幀進行編碼 所需的比特數;使用導致較少比特數的元組序列來提供編碼塊;以及 提供指示從中導出所述編碼塊的元組序列的序列指示。
32. —種具有程序代碼的計算機程序,當在計算機上運行時,所述程 序代碼用于執行一種用于對編碼參數塊進行解碼并用于處理序列指示的方 法,所述參數包括具有原始信號第一部分的表示的第一參數集,所述參數 還包括具有原始信號第二部分的表示的第二參數集,所述第二部分與所述 第一部分相鄰,所述方法包括使用取決于用于對元組序列進行編碼的編碼規則的解碼規則,對編碼 參數塊進行解壓縮以導出參數的元組序列,每一個元組具有至少兩個參數;接收序列指示,所述序列指示指示所述編碼塊所基于的多個不同序列 中所使用的元組序列;以及使用所用元組序列的信息來建構所述參數集。
33. —種參數的壓縮表示,所述參數包括具有原始信號第一部分的表示 的第一參數集,所述參數還包括具有原始信號第二部分的表示的第二參數 集,所述第二部分與所述第一部分相鄰,所述參數的壓縮表示包括表示所用元組序列的編碼參數塊;以及序列指示,所述序列指示指示所述編碼參數塊所基于的第一或第二序 列中的所用元組序列,其中第一序列包括具有來自第一參數集的兩個參數 的第一元組,而第二序列包括具有來自第一參數集的一個參數和來自第二 參數集的一個參數的第二元組。
34. 如權利要求33所述的參數的壓縮表示,其中所述參數的壓縮表示 儲存在計算機可讀介質上。
全文摘要
本發明基于如下發現當包括具有原始信號第一部分的表示的第一參數集和具有原始信號第二部分的表示的第二參數集的參數被布置在第一元組序列和第二元組序列中時,可進行有效的編碼,其中,所述第一元組序列包括具有來自所述原始信號的單一部分的兩個參數的參數元組,而所述第二元組序列包括具有來自所述原始信號第一部分的一個參數以及來自所述原始信號第二部分的一個參數的參數元組。使用比特估測器來估測對所述第一和第二元組序列進行編碼所需的比特數,從而能夠實現有效的編碼,其中,僅對導致較少比特數的元組序列進行編碼。
文檔編號H03M7/40GK101160726SQ200680012093
公開日2008年4月9日 申請日期2006年2月13日 優先權日2005年4月13日
發明者于爾根·赫勒, 卡斯滕·林茨邁爾, 拉爾夫·施佩爾施奈德, 約翰內斯·希爾珀特 申請人:弗勞恩霍夫應用研究促進協會