立體聲編碼和解碼的方法及其設備的制作方法

文檔序號：7746314閱讀：190來源：國知局

專利名稱：立體聲編碼和解碼的方法及其設備的制作方法
技術領域：
本發明涉及編碼數據的方法，例如涉及一種利用可變的數據分量的角度旋轉來編碼音頻和/或圖像數據的方法。此外，本發明還涉及使用這些方法的編碼器，并涉及用于對這些編碼器所生成的數據進行解碼的解碼器。另外，本發明關注經由數據載體和/或通信網絡傳遞的編碼數據，這種編碼數據根據上述方法產生。
背景技術：
已知許多用于編碼音頻和/或圖像數據以便產生相應編碼輸出數據的當代方法。一個編碼音頻的當代方法示例是公知為MP3的MPEG-ILayer III，其被記載于IS0/IEC JTC1/SC29/WG11 MPEG, ISl1172-3，Information Technology-Coding of Moving Picture and Associated Audiofor Digital Storage Media at up to about 1.5Mbit/s, Part 3 :Audio(信息技術-以直至約1. 5Mbit/s為數字存儲介質編碼移動圖片和相關音頻，第3 部分音頻)，MPEG-I，1992。這些當代方法中的某些方法用來改進編碼效率，即通過使用中/側(M/S)立體聲編碼或和/差立體聲編碼提供增強的數據壓縮，J. D. Johnston和A. J Ferreira 于 1992 年 3 月在加利福尼亞的舊金山 Proc. IEEE，Int. Conf. Acoust. ,Speech and Signal Proc. II :569_572 的"Sum-difference stereo transformcoding (禾口 -差立體聲轉換編碼)”中對和/差立體聲編碼進行了闡述。在M/S編碼中，立體聲信號分別包括左聲道和右聲道信號1 [η]、！"[η]，例如通過應用式1和2(Eq. 1和2)描述的處理將它們編碼為一個和信號m[n]和一個差信號s[n]m[n] = r[n]+l[n]s [η] = r[n]-l[n]
當信號l[n]和r[n]幾乎相同時，由于差信號s[n]接近零并因而輸送相對少量息而和信號有效包括了大部分信號信息內容，M/S編碼能夠提供有效的數據壓縮。這種情況下，表示和信號和差信號所要求的比特率接近獨立編碼信號l[n]和r[n]所要求的一半。式1和2容許以式3 (Eq. 3)中旋轉矩陣的方式表示其中c為通常用于防止限幅的恒定比例縮放系數。盡管式3有效對應信號1 [n]、r [η]旋轉45°，但如式4(Eq.4)中所提供的那樣，其它旋轉角度是可能的，其中α為應用到信號1 [η]、r[η]的旋轉角度，產生此后分別被描述為主要信號和殘留信號的相應編碼信號m' [n]、s' [η] ,cos(a) sin(a)Y /["]、、-sin(a) cos(a) 角度α被有利地為可變的，以通過減少殘留信號s' [η]中出現的信息內容并集中信息內容在主要信號m' [η]中(即最小化殘留信號s' [η]中的能量并由此最大化主要信號m' [η]中的能量)來為大范圍的信號l[n]、r[n]提供增強的壓縮。式1-4表示的編碼技術通常不應用到寬帶信號，而是應用到多個子信號，每個子信號只表示用來輸送音頻信號的全帶寬的一個較小部分。此外，式1-4的技術還通常應用到信號l[n]、r[n]的頻域表示。在公布的美國專利US 5621855中，其中闡述了一種對具有第一和第二信號分量的數字信號進行子帶編碼的方法，該數字信號被子帶編碼，用以響應第一信號分量產生具有第一q采樣信號塊的第一子帶信號并響應第二信號分量產生具有第二q采樣信號塊的第二子帶信號，第一子帶信號和第二子帶信號處于相同的子帶，且第一和第二信號塊在時間上等價。第一和第二信號塊被處理，用以在時間等價采樣的點表示之間獲得一個最小距離值。當最小距離值小于或等于閥值距離值時，在第一塊的每個采樣乘以cos( α)并將第二信號塊的每個采樣乘以-sin(a)之后，通過將第一和第二信號塊中的各個時間等價采樣對加到一起來獲得一個包括q采樣的合成塊。盡管前述旋轉角度α的應用容許減少其中只應用45°旋轉的M/S編碼的許多缺點，但也會發現當這些方法應用到信號組時是有問題的，例如立體聲信號對，當其中出現可觀的相對的相互相位或時間偏移時。本發明旨在解決這一問題。

發明內容
本發明的一個目的是提供一種編碼數據的方法。根據本發明的第一方面，提供了一種編碼多個輸入信號(1，r)以產生相應編碼數據的方法，該方法包括步驟處理輸入信號(l，r)以確定第一參數(灼),所述第一參數(朽)描述信號(l，r) 間相對相位差異和時間差異中的至少一個，并應用這些第一參數處理輸入信號以產生相應的中間信號；處理中間信號和/或輸入信號(1，r)以確定第二參數，所述第二參數描述生成主要信號(m)和殘留信號(s)所需要的中間信號的旋轉，所述主要信號(m)的幅值或能量大于殘留信號(s)，并應用這些第二參數處理中間信號以產生主要信號(m)和殘留信號(s)；量化第一參數、第二參數，并編碼至少部分主要信號(m)和殘留信號(S)以產生相應量化數據；以及多路復用量化數據以產生編碼數據。本發明的優勢在于能夠提供更有效的數據編碼。優選地，在該方法中，編碼數據只包括殘留信號(S)的一部分。部分包含殘留信號 (S)能夠增強編碼數據中可達到的數據壓縮。更優選地，在該方法中，編碼數據還包括一個或多個指示包含在編碼數據中的殘
6留信號部分的參數。這些指示參數容許使編碼數據的后續解碼的復雜性降低。優選地，該方法的步驟(a)和(b)通過對頻域(l[k]，r[k])中表示的輸入信號 (l[n],r[n])實施復旋轉實現。實施復旋轉能夠更有效地處理多個輸入信號之間出現的相對時間和/或相位差異。更優選地，在頻域或子帶域執行步驟(a)和(b)。“子帶”被理解為小于一個信號所需完整頻率帶寬的頻率區域。優選地，在包括輸入信號(l、r)的完整頻率范圍的子部分中應用該方法。更優選地，通過其它編碼技術對該完整頻率范圍的其它子部分進行編碼，例如前述的傳統M/S編碼。優選地，該方法包括在步驟(C)之后的附加步驟，該步驟無損耗地編碼量化數據以提供用于在步驟(d)中多路復用的數據以產生編碼數據。更優選地，使用Huffman編碼來實現該無損耗編碼。使用無損耗編碼能夠實現潛在地更高的音頻質量。優選地，該方法包括通過刪除殘留信號(S)中出現的感知上無關的時頻信息來對殘留信號(s)進行操作的步驟，所述操作后的殘留信號(s)貢獻到編碼數據(100)中，并且所述感知上無關的信息對應輸入信號頻譜_時間表示中的選定部分。刪除感知上無關的信息使本方法能夠在編碼數據中提供更高程度的數據壓縮。優選地，在該方法的步驟(b)中，通過最小化殘留信號(S)的幅值或能量導出第二參數(α ；HD, P)。同其它導出參數的方法相比，這種方法生成第二參數在計算上是高效的。優選地，在該方法中，通過信道間強度差參數和相干參數(UD，P )表示第二參數 (α ；UD，P)。該方法的這種實現能夠提供對現有參數立體聲編碼和相關解碼硬件或軟件的向后兼容。優選地，在該方法的步驟(C)和(d)中，編碼數據被安排在多個重要層中，所述層包括輸送主要信號(m)的基層、包含對應多個立體聲告知參數的第一和/或第二參數的第一增強層、輸送殘留信號(s)的表示的第二增強層。更優選地，第二增強層還被再分為第一子層和第二子層，第一子層用于輸送殘留信號(s)的主要相關(mostrelevant)時頻信息，第二子層用于輸送殘留信號(s)的次相關(lessrelevant)時頻信息。這些層和子層按要求表示輸入信號能夠增強編碼信號傳輸錯誤的穩定性并使其對更簡單的解碼硬件向后兼容。根據本發明的第二方面，提供了一種編碼器，用于編碼多個輸入信號(1，r)以產生對應的編碼數據，該編碼器包括第一處理裝置，用于處理輸入信號(l，r)以確定描述信號(l，r)間相對相位差異和時間差異中至少一個的第一參數(朽)，所述第一處理裝置可操作地應用這些第一參數 (灼)來處理輸入信號以便產生對應的中間信號；第二處理裝置，用于處理中間信號以確定描述產生主要信號(m)和殘留信號(S) 所需要的中間信號的旋轉，所述主要信號(m)的幅值或能量高于殘留信號(s)，第二處理裝置可操作地應用這些第二參數處理中間信號以產生至少主要信號(m)和殘留信號(s)；量化裝置，用于量化第一參數(灼)、第二參數(α ；UD, P)以及至少部分主要信號(m)和殘留信號(s)來產生對應的量化數據；以及多路復用裝置，用于多路復用量化數據以產生編碼數據。該編碼器的優點在于其能夠提供有效的數據編碼。
優選地，該編碼器包括通過刪除殘留信號(S)中出現的感知上無關的時頻信息來操作殘留信號(s)的處理裝置，所述變換殘留信號(s)貢獻到編碼數據(100)中，且所述感知上無關的信息對應輸入信號頻譜_時間表示中的選定部分。刪除感知上無關的信息使編碼器能夠在編碼數據中提供更高程度的數據壓縮。根據本發明的第三方面，提供了一種解碼編碼數據以重新產生多個輸入信號的相應表示(Γ，r')的方法，所述輸入信號(1，r)已被在先編碼產生所述編碼數據，該方法包括步驟多路分解編碼數據以產生相應的量化數據；處理量化數據以產生相應的第一參數(Vi )、第二參數以及至少一個主要信號 (m)和一個殘留信號(s)，所述主要信號(m)的幅值或能量高于殘留信號(s)；通過應用第二參數旋轉該主要信號(m)和殘留信號(s)，以產生相應的中間信號；以及通過應用第一參數(fPi )處理中間信號以重新產生所述輸入信號的所述表示 (Γ，r')，第一參數(灼)描述信號(l，r)間相對相位差異和時間差異中的至少一個。該方法提供了能夠對已使用根據本發明第一方面的方法有效編碼的數據進行有效解碼的優點。優選地，該方法的步驟(b)還包括對殘留信號(S)的丟失時頻信息適當補充從主要信號(m)中導出的合成殘留信號的步驟。所述合成信號的產生能夠導致有效解碼編碼數據。優選地，在該方法中，編碼數據包括多個指示殘留信號(S)的哪些部分被編碼到編碼數據中的參數。包括這些指示參數能夠使編碼要求高效和更少量的計算。根據本發明的第四方面，提供了一種解碼器，用于解碼編碼數據以重新產生多個輸入信號的相應表示(Γ，r')，所述輸入信號(l，r)已被在先編碼產生編碼數據，該解碼器包括多路分解裝置，用于多路分解編碼數據以產生相應的量化數據；第一處理裝置，用于處理量化數據以產生相應的第一參數(釣)、第二參數以及至少一個主要信號(m)和一個殘留信號(s)，所述主要信號(m)的幅值或能量高于殘留信號 (s)；第二處理裝置，用于通過應用第二參數來旋轉主要信號(m)和殘留信號(s)，以產生相應的中間信號；以及第三處理裝置，用于通過應用第一參數()來處理中間信號，以產生輸入信號 (l，r)的所述表示，第一參數描述信號(l，r)間的相對相位差異和時間差異中的至少一個。優選地，第二處理裝置可操作地產生從解碼的主要信號(m)中導出的補充合成信號，用以提供從解碼的殘留信號中丟失的信息。根據本發明的第五方面，提供了根據本發明第一方面的方法產生的編碼數據，該數據為記錄在數據載體上的數據或可經由通信網絡傳遞的數據中的一種。根據本發明的第六方面，提供了用于在計算硬件上執行本發明第一方面的方法的軟件。根據本發明的第七方面，提供了在計算硬件上執行本發明第三方面的方法的軟件。根據本發明的第八方面，提供了記錄在數據載波上的編碼數據和可經由通信網絡傳遞的編碼數據中的至少一種編碼數據，所述數據包括量化第一參數、量化第二參數、和對應至少部分主要信號(m)和殘留信號(s)的量化數據的多路復用，其中主要信號(m)的幅值或能量高于殘留信號(s)，所述主要信號(m)和所述殘留信號(s)可通過根據第二參數旋轉中間信號導出，通過處理多個輸入信號來產生所述中間信號以補償第一參數所描述的在多個輸入信號間的相對相位和/或時間延遲。應該理解，在不背離所附權利要求規定的本發明范疇的前提下，本發明的特征容許結合到任何組合當中。

現參考下列附圖僅通過示例的方式對本發明實施例進行闡述，其中圖1說明滿足相對相互時間和相位延遲的信號1 [n]、r [η]的采樣序列；圖2對依照式1和2的傳統M/S變換應用到圖1的信號以產生相應的和信號與差信號m [n]、s [η]進行說明；圖3對依照式4的旋轉變換應用到圖1信號以產生相應主要信號m[n]和殘留信號s [η]進行說明；圖4對應用根據本發明的依照式5至15的復旋轉變換以產生相應的主要信號 m[n]和殘留信號s[n]進行說明，其中盡管圖1的信號具有相對相互相位和時間延遲，但殘留信號具有相對小的幅值；圖5是根據本發明的編碼器的示意圖；圖6是根據本發明的解碼器的示意圖，該解碼器同圖5的編碼器兼容；圖7是參數立體聲解碼器的示意圖；圖8是根據本發明的增強參數立體聲編碼器的示意圖；以及圖9是根據本發明的增強參數立體聲解碼器的示意圖，該解碼器同圖9編碼器兼容。
具體實施例方式總的說來，本發明涉及一種編碼數據的方法，其相對前述使用可變旋轉角度的M/ S編碼方法表現出進步。發明者為了能夠更好地編碼同滿足一定相位和/或時間偏移的信號組相對應的數據而發明了該方法。此外，同傳統編碼技術相比，該方法通過使用當信號 l[n]、r[n]分別由其等價的復值頻域表示1 [k]、r[k]表示時可用的旋轉角度α值而提供了優勢。角度α被設置為實值并且是實值相位旋轉，該實值相位旋轉被應用于使信號 l[n]、r[n]相互“相干”，用以調節這些信號間的相互時間和/或相位延遲。但是，復值旋轉角度α的使用使本發明更容易實現。這種通過角度α實現旋轉的替代方法可在本發明的范疇內實施。前述時域信號l[n]、r[n]的頻域表示優選通過應用式5和6 (Eq. 5和6)描述的時間加窗過程來導出以提供加窗信號ljn]、!·』!!]
9 其中(！二幀指標，^ =。，^，…表示連續的信號幀；H =跳躍尺寸或更新尺寸；并且η =時間指標，具有取值范圍0到L-1，其中參數L等價于窗h[n]的長度。可通過式7和8 (Eq. 7和8)中所描述的離散傅立葉變換(DFT)或功能上等價的變換將加窗信號la[n]、ra[n]變換到頻域其中參數N表示DFT長度，因此N彡L。由于實值序列的DFT是對稱的，因此只有前N/2+1個點在轉換后被保存下來。為了在實施DFT時保存信號能量，優選使用下面式9 和10 (Eq. 9和10)中描述的比例縮放 /
本發明方法執行式11 (Eq. 11)描述的信號處理操作來將式7和8中的頻域信號表示l[k]、r[k]轉換為頻域中的相應旋轉和信號與差信號m" [k]、s" [k] 其中α =實值可變旋轉角度；Ψχ =用來最大化信號在相關邊界上的連續性的共用角度；并且
約=用來通過相位旋轉右聲道信號來最小化殘留信號W]的能量的角度。角度約的使用是可選的。此外，優選在逐幀的基礎上即幀步驟上動態執行按照式 11的旋轉。但是，這種逐幀旋轉中的動態變化將潛在地導致和信號m" [k]中的間斷，可通過適當選擇角度夠至少部分刪除所述間斷。另外，優選將式11的頻率范圍k = 0，…，Ν/2+1劃分為子范圍，即區。編碼期間對每個區來說，其相應的角度參數α、約和約被獨立確定、編碼并隨后被發送或輸送到解碼器用于后續解碼。通過安排要再分的頻率范圍，可在編碼期間更好地捕獲信號特征，這潛在地導致更高的壓縮比。執行了按照式7到11的映射后，對信號m “ [k]、s “ [k]進行式12和13(Eq. 12&13)中描述的離散傅立葉逆變換
其中mq[n]=主要時域表示；并且Sq[η]=殘留(差)時域表示。在該方法中，主要和殘留表示隨后被轉換成窗基礎上的表示，按式14和15 (Eq. 14 和15)描述的處理操作所提供那樣對所述窗基礎上的表示應用重疊m [n+qH] = m [n+qH] +2Re {mq [η] h [η]} Eq. 14s [n+qH] = s [n+qH]+2Re {sq [η] h [η]} Eq. 15或者，式5到15描述的本發明方法的處理操作容許至少部分通過使用復調制濾波器組來實際實現。計算機處理硬件中應用的數字處理可用來執行本發明。為了說明本發明方法，將闡述本發明的一個信號處理示例。例如，將兩個時間信號用作需要使用本方法處理的初始信號，這兩個信號由式16和17(Eq. 16和17)定義1 [η] = 0. 5cos (0. 32n+0. 4) +0. OSz1 [η] +0. 06ζ2 [η] Eq. 16r[n] = 0. 25cos(0. 32η+1. 8)+0. OSz1 [η]+0. 05ζ3[η] Eq. 17其中Zl[n]、ζ2[η]和ζ3[η]為相互獨立的單位方差白噪聲序列。為了更好地理解本發明方法的操作，圖1中示出了式16和17描述的信號1 [n]、r [η]的一些部分。圖2中示出M/S變換信號m[n]和s[n]，這些信號是從式16和17的信號1 [η]、 r[n]通過式1和2的傳統處理導出的。由圖2可以看出，從式16和17的信號產生信號 m[n]和s[n]的傳統方法將導致殘留信號s[n]的能量高于式17中輸入信號r[n]的能量。很明顯，由于信號s [η]不具有可忽略的幅值，因此應用到式16和17信號上的傳統M/S變換信號處理在信號壓縮方面是低效的。通過使用式4描述的旋轉變換，使示例信號1 [n]、r[n]能夠如圖3所示那樣降低其相應殘留信號s[n]中的殘留能量并相應增強其主要信號m[n]。盡管式4的旋轉方法能夠比圖2中給出的傳統M/S處理實現得更好，但發明者發現當信號1 [n]、r[n]滿足相對相互相位和/或時間偏移時式4的旋轉方法并不令人滿意。當式16和17的采樣信號1 [n]、r [η]被轉換到頻域時，則其受到按照式5到15的復優化旋轉，將殘留信號s[n]的能量降低到圖4所示的較低幅值是可能的。下面闡述用來實現式5到15所描述的信號處理的編碼器硬件的實施例。圖5中，示出了根據本發明的一個編碼器，通常由10表示。編碼器10用來接收左聲道(1)和右聲道(r)互補輸入信號并編碼這些信號以產生編碼比特流(bs)lOO。此外，編碼器10包括相位旋轉單元20、信號旋轉單元30、時間/頻率選擇器40、第一編碼器50、第二編碼器60、參數量化處理單元(Q) 70以及比特流多路復用器單元80。輸入信號1、r耦合到相位旋轉單元20的輸入端，相位旋轉單元20的相應輸出端連接到信號旋轉單元30。信號旋轉單元30的主要信號和殘留信號分別由m、s表示。主要信號m經由第一編碼器50輸送到多路復用器單元80。此外，殘留信號s經由時間/頻率選擇器40耦合到第二編碼器60并隨后耦合到多路復用器單元80。來自相位旋轉單元20的角度參數輸出約、約經由處理單元70耦合到多路復用器單元80。此外，角度參數輸出α 從信號旋轉單元30經由處理單元70耦合到多路復用器單元80。多路復用器單元80包括前述的編碼比特流輸出(bs)lOO。操作中，相位旋轉單元20對信號1、r應用處理以便對它們之間的相對相位差異做出補償，并由此產生參數A、其中參數約表示這種相對相位差異，參數灼、外被傳遞到處理單元70進行量化，并由此作為相應的參數數據包含在編碼比特流100中。被補償了相對相位差異的信號l、r傳遞到信號旋轉單元30，信號旋轉單元30為角度α確定一個優化值用以將最大量的信號能量集中在主要信號m中并將最少量的信號能量集中在殘留信號s中。主要信號和殘留信號m、s而后經由編碼器50、60傳遞以便被轉換成合適的格式包含在比特流100中。處理單元70接收角度信號α、隊、豹并將它們同編碼器50、60的輸出一起多路復用，以便產生比特流輸出(bs)lOO。因此，比特流(bs) 100包括包含主要信號和殘留信號m、s以及角度參數數據α、<f\、約的表示的數據流，其中參數釣是必需的，而參數夠是可選的但有益的包含該參數。編碼器50和60優選實現為兩個單聲道音頻編碼器，或實現為一個雙聲道編碼器。可選地，可在時間/頻率選擇器40中刪除殘留信號s沒有在感知上貢獻到比特流100中的某些部分(例如在時頻平面中表示時被識別)，由此提供下面更詳細闡述的可伸縮的數據壓縮。編碼器10可選地能夠用來在包括輸入信號的完整頻率范圍的一部分上處理輸入信號(l、r)。輸入信號(l、r)中沒有被編碼器10編碼的那些部分隨后被其它方法平行地被編碼，例如通過前面闡述的傳統M/S編碼。如果需要，可實現左聲道(1)和右聲道(r)輸入信號的單獨編碼。編碼器10容許被實現在硬件中，例如實現為一種專用集成電路或此類電路組。或者，編碼器10可實現在執行于計算硬件上(例如在專有軟件驅動信號處理集成電路或此類電路組上)的軟件中。圖6中，總的由200表示同編碼器10兼容的解碼器。解碼器200包括一個比特流多路分解器210、第一和第二解碼器220、230，用于去量化(de-quantizing)參數的處理單元240、信號旋轉解碼器單元250以及提供同輸入到編碼器10中的輸入信號l、r相對應的解碼輸出Γ、r'的相位旋轉解碼單元260。多路分解器210被配置來接收由編碼器10產生的比特流(bs)lOO，該比特流(bs) 100例如通過數據載體(例如諸如⑶或DVD的光盤數據載體)和/或經由諸如因特網的通信網絡從編碼器10輸送到解碼器200。多路分解器 210的多路分解輸出被耦合到解碼器220、230的輸入端并被耦合到處理單元240。第一和第二解碼器220、230分別包括被耦合到旋轉解碼器單元250的主要和殘留解碼輸出m'、 s'。此外，處理單元240包括同樣被耦合到旋轉解碼器單元250的旋轉角度輸出α'；角度α ‘對應于針對編碼器10的前述角度α的解碼版本。角度輸出灼’、朽’對應于針對編碼器10的前述角度夠、約的解碼版本；這些角度輸出同來自旋轉解碼器單元250的解碼主要信號和殘留信號輸出一起被輸送到相位旋轉解碼單元260，相位旋轉解碼單元260正如說明的那樣包括解碼輸出Γ、r'。操作中，解碼器200執行編碼器10中所執行的編碼步驟的逆步驟。因此，在解碼
12器200中，在多路分解器210中多路分解比特流100以分離同主要信號和殘留信號相對應的數據，所述數據被解碼器220、230重構以產生解碼的主要信號和殘留信號m'、s'。然后根據角度α'旋轉這些信號m'、s'，并隨后通過角度灼’、釣‘針對相對相位對它們進行校正以便重新生成左聲道信號和右聲道信號Γ >r'。從多路分解器210中多路分解的參數重新生成角度夠‘、釣’、 α'，并在處理單元240中分離這些角度。編碼器10和解碼器200中，優選地在比特流100中傳送一個U D值和一個相干值 P，而不是前述角度α。UD值被用來表示信道間差異，即表示左信道信號和右信道信號1、 r間頻率和時間變量幅值差異。相干值P表示頻率變量相干，即相位同步后左聲道信號和右聲道信號l、r間的相似性。但是，例如在解碼器200中，可容易地通過應用式18(Eq. 18) 從II D值和P值導出角度α 圖7中，由400總的表示參數解碼器，這個解碼器400與根據本發明的編碼器互為補充。解碼器400包括比特流多路分解器410、解碼器420、解相關單元430、比例縮放單元 440、信號旋轉單元450、相位旋轉單元460以及去量化單元470。多路分解器410包括一個用于接收比特流信號(bs)lOO的輸入端和四個用于信號m、s數據、角度參數數據、U D數據和相干數據P的相應輸出端，這些輸出端如圖示那樣連接到解碼器420和去量化單元470。解碼器420的一個輸出端經由解相關單元430耦合，以便重新產生輸入到比例縮放功能440 的殘留信號表示s'。此外，重新產生的主要信號表示m'從解碼器單元420輸送到比例縮放單元440。同樣從去量化單元470為比例縮放單元440提供U D'和相干數據P ‘。比例縮放單元440的輸出端被耦合到信號旋轉單元450，用以產生中間輸出信號。隨后，在相位旋轉單元460中使用去量化單元470解碼的角度灼’、約’來校正這些中間輸出信號，以便重新產生左聲道信號和右聲道信號表示Γ、r'。解碼器400同圖6解碼器200的區別在于解碼器400包括解相關單元430，該解相關單元430通過解相關單元430內執行的解相關過程來根據主要信號m'估計殘留信號 s'。此外，左和右輸出信號Γ、r'間的相干量通過比例縮放操作確定。比例縮放操作在比例縮放單元440中被執行并涉及主要信號m'和殘留信號s'間的比率。參考圖8，示出一個由500總的表示的增強編碼器。編碼器500包括分別接收左和右輸入信號l、r的相位旋轉單元510、信號旋轉單元520、時間/頻率選擇器530、各個第一和第二編碼器540、550、量化單元560以及包括比特流輸出(bs) 100的多路復用器570。來自相位旋轉單元510的角度輸出從相位旋轉單元510耦合到量化單元560。此外，來自相位旋轉單元510的相位校正過的輸出經由信號旋轉單元520和時間/頻率選擇器530被連接，用以分別產生主要信號和殘留信號m、s以及UD和相干P數據/參數。UD和相干P 數據/參數耦合到量化單元560，而主要信號和殘留信號m、s經由第一和第二編碼器540、 550傳遞，用以為多路復用器570產生相應的數據。多路復用器570還用來接收描述角度釣、朽、相干P和II D的數據。多路復用器570可操作地多路復用來自編碼器540、550和量化單元560的數據，用以產生比特流(bs)lOO。
13
編碼器500中，直接將殘留信號s編碼為比特流100。可選地，時間/頻率選擇器單元530可操作地確定殘留信號s時間/頻率平面的哪個部分被編碼成比特流(bs) 100，由此單元530確定殘留信息包含在比特流100中的程度，并由此影響編碼器500中可得到的壓縮同比特流100中包含信息的程度之間的折衷。在圖9中，由600總的表示增強參數解碼器，解碼器600與圖8所示編碼器500互為補充。解碼器600包括多路分解器610、各個第一和第二解碼器620、640、解相關單元630、組合器單元650、比例縮放單元660、信號旋轉單元670、相位旋轉單元680以及去量化單元 690。多路分解器單元610被耦合來接收編碼比特流(bs) 100并將相應的多路分解輸出提供到第一和第二解碼器620、640，并且還提供到多路分解器單元690。同解相關單元630和組合器單元650連接的解碼器620、640分別可操作地重新產生主要信號和殘留信號的表示 m'、s'。這些表示在比例縮放單元660中接受比例縮放過程并隨后在信號旋轉單元670 中接受旋轉，以便產生中間信號，隨后中間信號在旋轉單元680中響應于去量化單元690所產生的角度參數被相位旋轉，用以重新產生左聲道和右聲道信號的表示Γ、r'。解碼器600中，比特流100被多路分解成用于主要信號m'、殘留信號s'和立體聲參數的獨立流。隨后，主要信號和殘留信號m'、s'分別被解碼器620、640解碼。殘留信號s'中被編碼到比特流100中的那些頻譜/時間部分在比特流100中被隱含(即通過檢測時頻平面中的“空白”區域)或明確(即通過從比特流100解碼的表示信令參數)傳遞。解相關單元630和組合器單元650可操作地利用合成殘留信號有效填充所解碼的殘留信號 s'中的空白時頻區域。這個合成信號通過使用所解碼的主要信號m'來產生并從解相關單元650輸出。對于所有的其它時頻區域，應用殘留信號s構造解碼殘留信號s'；對于這些區域，不在比例縮放單元660應用比例縮放。可選地，對于這些區域，在編碼器500中傳送前述角度α是有益的，而并非II D和相干P數據，因為輸送單個角度參數α所需要的數據速率比輸送等價的II D和相干P參數數據所需要的數據速率低。但是，角度α參數 (而不是IID和相干P參數數據)在比特流100中的傳輸使編碼器500和解碼器600無法同使用這種U D和相干P數據的常規傳統參數立體聲(PS)系統向后兼容。編碼器10、500的各個選擇器單元40、530在選擇需要將殘留信號s的哪個時頻區域編碼到比特流100中時優選使用一種感知模型。通過編碼編碼器10、500中殘留信號S的不同時頻方面，由此有可能實現比特率可縮放編碼器和解碼器。當比特流100中的多個層相互依賴時，同感知上很相關的時頻方面相對應的編碼數據被包含在該多個層中包括的基層中，感知上更不重要的數據被移動到該多個層中包括的精煉層或增強層中；“增強層”也稱為“精煉層”。這樣的一種方案中，所述基層優選包括對應主要信號m的比特流、第一增強層以及第二增強層，其中第一增強層包括同諸如前述角度α、灼、豹的立體聲參數相對應的比特流，第二增強層包括同殘留信號s對應的比特流。比特流數據100中層的這種安排允許對殘留信號s進行輸送的第二增強層被可選地丟失或刪除；此外，圖10中示出的解碼器600能夠如前面闡述的那樣將解碼的多個剩余層同合成殘留信號相組合，用以產生感知上有意義的殘留信號以便用戶欣賞。此外，如果例如由于成本和/或復雜性限制而可選地沒有為解碼器600提供第二解碼器640，即使以降低的質量但仍能解碼殘留信號S。刪除前述比特流(bs) 100中的編碼角度參數灼、約可能導致前述比特流(bs) 100的比特率進一步降低。這種情況下，解碼器600中的相位旋轉單元680通過定值(例如零值)的缺省旋轉角度重建所重新產生的信號Γ >r'；這種進一步的比特率降低利用以下特性，即人類聽覺系統在較高音頻處是相對相位不靈敏的。作為一個示例，在比特流 (bs) 100中傳輸參數& ,且從那里刪除參數仍以便降低比特率。前面闡述的根據本發明的編碼器和互補解碼器可潛在用于大范圍的電子儀器和系統中，例如至少下列之一中因特網收音機、因特網流傳送、電子音樂分發(EMD electronic music distribution)、固態音頻播放器和記錄器以及通常的電視和音頻產品。盡管上面闡述了一種編碼輸入信號(l、r)以產生比特流100的方法以及解碼前述比特流100的補充方法，但應該理解本發明容許用來編碼多于兩個的輸入信號。例如本發明能夠適于為多信道音頻(例如5信道家庭影院系統)提供數據編碼和相應解碼。在附加的權利要求書中，括號內包含的數字和其它符號用來輔助理解權利要求書，而不以任何方式限制權利要求的范圍。應該理解，在不背離附加的權利要求書規定的本發明范圍的前提下容許對前述的本發明實施例做出修改。在解釋說明書及其權利要求書時，諸如“包括”、“包括”、“結合”、“含有”，“是”以及
“具有”的表述應該以非窮盡的方式理解，也就是說應該被理解為還可能存在沒有清楚列出的其它項目或者部件。參考為單數的也可理解成參考復數，反之亦然。
權利要求
一種編碼和解碼裝置，用于將至少第一和第二寬帶數字音頻信號成分(L，R)編碼成復合數據信號，以及用于將該復合數據信號解碼成所述至少第一和第二數字音頻信號成分的副本，所述編碼裝置包括-輸入單元，用于分別接收所述至少第一和第二寬帶數字音頻信號成分；-時-頻轉換單元，用于將寬帶第一和第二數字音頻信號成分中的每個成分轉換成多個窄帶子信號，針對寬帶數字音頻信號成分的用于窄帶的子信號表示所述窄帶中的寬帶音頻信號成分，-信號旋轉單元，用于在窄帶中將所述窄帶中的所述第一和第二數字音頻信號成分的子信號轉換成針對所述窄帶的復合子信號，該信號旋轉單元還適于可選地在窄帶內將所述第一和第二數字音頻信號成分的子信號轉換成誤差子信號，-信號組合單元，用于將復合子信號和誤差子信號(如果存在的話)組合成復合數據信號，-輸出單元，用于提供所述復合數據信號，所述解碼裝置包括-輸入單元，用于接收所述復合數據信號，-解復用單元，用于從所述復合數據信號恢復復合子信號和誤差子信號(如果存在的話)，-解相關單元，用于將復合子信號解相關成解相關的子信號，-另一組合單元，用于在窄帶內將所述窄帶中的所述解相關的子信號與所述窄帶中的誤差子信號進行組合，使得當在窄帶中存在誤差子信號時，將該誤差信號提供為另一組合單元的輸出端的輸出信號，以及當在窄帶中不存在誤差子信號時，將所述窄帶中的所述解相關的子信號提供為所述另一組合單元的輸出端的輸出信號，-另一信號旋轉單元，用于在窄帶內將復合子信號和輸出信號轉換成所述窄帶內針對第一和第二數字音頻信號成分的子信號的副本，-頻-時轉換單元，用于將所述第一和第二數字音頻信號成分的子信號的副本轉換成所述第一和第二數字音頻信號成分的副本。
2.如權利要求1所述的編碼和解碼裝置，其特征在于，_所述信號旋轉單元適于在后續的時間間隔內，在窄帶內將所述窄帶內的所述第一和第二數字音頻信號成分的子信號轉換成在所述后續的時間間隔內針對所述窄帶的復合子信號，所述信號旋轉單元還適于在特定時間間隔內，在所述窄帶內可選地將所述第一和第二數字音頻信號成分的子信號轉換成誤差子信號，-所述另一組合單元適于在特定時間間隔內以及在窄帶內，將所述特定時間間隔和所述窄帶內的解相關的子信號與所述特定時間間隔和所述窄帶內的誤差子信號進行組合，使得當在特定時間間隔內和在窄帶內存在誤差子信號時，將該誤差信號提供為所述另一組合單元輸出端的輸出信號，當在所述特定時間間隔內和在所述窄帶內不存在誤差子信號時，將所述特定時間間隔和所述窄帶內的解相關的子信號提供為所述另一組合單元的輸出端的輸出信號，2_所述另一信號旋轉單元適于在后續的時間間隔內，在窄帶內將復合子信號和輸出信號轉換成在所述時間間隔的每個間隔內、所述窄帶內針對第一和第二數字音頻信號成分的子信號的副本。
3.如權利要求1所述的編碼和解碼裝置，其特征在于，所述信號旋轉單元還適于產生控制信號，該信號指示誤差信號是否可用于窄帶，所述信號組合單元還適于將控制信號組合到所述復合數據信號中，所述解復用單元還適于從所述復合數據信號中恢復控制信號，所述另一信號旋轉單元適于根據控制信號向其輸出端提供誤差子信號或解相關的子信號。
4.如權利要求2所述的編碼和解碼裝置，其特征在于，信號旋轉單元還適于產生控制信號，使得它指示在時間間隔內，誤差信號是否可用于窄帶，所述信號組合單元還適于將控制信號組合到所述復合數據信號內所述解復用單元還適于從所述復合數據信號中恢復控制信號，所述另一信號旋轉單元適于根據該控制信號向其輸出端提供誤差子信號或解相關的子信號。
5.用于如權利要求1或3所述裝置內的解碼裝置，所述解碼裝置包括-輸入單元，用于接收復合數據信號，-解復用單元，用于從所述復合數據信號中恢復復合子信號和誤差子信號(如果存在的話)，-解相關單元，用于將復合子信號解相關成解相關的子信號，_另一組合單元，用于在窄帶內將所述窄帶內的解相關的子信號與所述窄帶內的誤差子信號進行組合，使得當窄帶內存在誤差子信號時，將該誤差信號提供為所述另一組合單元的輸出端的輸出信號，當窄帶內不存在誤差子信號時，將所述窄帶內的解相關的子信號提供為所述另一組合單元的輸出端的輸出信號，_另一信號旋轉單元，用于在窄帶內將復合子信號和輸出信號轉換成在所述窄帶內針對第一和第二數字音頻信號成分的子信號的副本，_頻-時轉換單元，用于將所述第一和第二數字音頻信號成分的子信號的副本轉換成第一和第二數字音頻信號成分的副本。
6.用于如權利要求2或4所述裝置內的解碼裝置，所述解碼裝置包括-輸入單元，用于接收復合數據信號，-解復用單元，用于從所述復合數據信號中恢復復合子信號和誤差子信號(如果存在的話)，-解相關單元，用于將復合子信號解相關成解相關的子信號，-另一組合單元，用于在特定時間間隔內以及在窄帶內，將所述特定時間間隔和所述窄帶內的解相關的子信號與所述特定時間間隔和所述窄帶內的誤差子信號進行組合，使得當在特定時間間隔內和在窄帶內存在誤差子信號時，將該誤差信號提供為所述另一組合單元的輸出端的輸出信號，當在所述特定時間間隔內和在所述窄帶內不存在誤差子信號時，將所述特定時間間隔和所述窄帶內的解相關的子信號提供為所述另一組合單元的輸出端的輸出信號，-另一信號旋轉單元，用于在后續的時間間隔內，在窄帶內將復合子信號和輸出信號轉換成在所述時間間隔的每個間隔內、所述窄帶內針對第一和第二數字音頻信號成分的子信號的副本，“頻_時轉換單元，用于將所述第一和第二數字音頻信號成分的子信號的副本轉換成第一和第二數字音頻信號成分的副本。
7.如權利要求5所述的解碼裝置，用在如權利要求3所述的裝置內，其特征在于，所述解復用單元還適于從所述復合數據信號中恢復控制信號，所述另一信號旋轉單元適于根據所述控制信號將誤差子信號或解相關的子信號提供給它的輸出端。
全文摘要
提供一種編碼輸入信號(l、r)以產生編碼數據(100)的方法。該方法包括處理輸入信號(l、r)以確定描述信號(l、r)間相對相位差異和時間差異的第一參數并應用這些第一參數處理輸入信號以產生中間信號。該方法包括處理中間信號以確定描述第一中間信號角度旋轉的第二參數(α；IID，ρ)，用以產生一個主要信號(m)和一個殘留信號(s)，該主要信號(m)的幅值或能量高于殘留信號(s)。可應用這些第二參數處理中間信號以產生主要信號(m)和殘留信號(s)。該方法還包括量化第一參數、第二參數以及主要信號和殘留信號(m，s)，用以產生相應的量化數據，用于后續多路復用以產生編碼數據(100)。
文檔編號H04S1/00GK101887726SQ20101014931
公開日2010年11月17日申請日期2005年3月29日優先權日2004年4月5日
發明者D·J·布里巴特, E·G·P·舒伊杰斯, F·P·邁伯格, L·M·范德克克霍夫申請人:皇家飛利浦電子股份有限公司

完整全部詳細技術資料下載