專利名稱:多聲道低比特率編碼解碼方法和設備的制作方法
技術領域:
本發明涉及為了降低對傳送音頻信息的信號的信號要求的多聲道音頻信息高質量編碼和解碼技術。本發明可用于在諸如通常將個人計算機接至公用網絡的電話線路之類的帶寬較窄的傳輸通路上實時傳送多聲道音頻信息。
在音頻信號處理領域,怎樣盡量減少表示音頻信號所需的信息量而對信號質量又沒有可察覺的損失是一個頗有意義的課題。通過減少所需的信息量,使得信號表示對通信通路和存儲媒體的信息容量要求得到降低。
在各種開發中,特別關注的是在諸如日常電話線路那樣的帶寬較窄的通信通路上實時傳送多聲道的高質量數字音頻信號。這種通信通路通常用來將個人計算機接到公用網絡上,在目前傳輸能力不超過50 Kbps。所謂實時傳送音頻信號是隨著信號的接收這些信號所表示的音頻信息可以不間斷地回放出來。
通過采用兩種類似壓縮技術或其中的一種技術可以降低信息容量要求。一種有時稱為“有損”壓縮的技術以不保證(往往是有礙于)原始信號的完全恢復的方式降低信息容量要求,而另一種有時稱為“無損”壓縮的技術以可以完全恢復原始信號的方式降低信息容量要求。
量化是一種眾所周知的有損壓縮技術。量化通過減少用于表示數字信號樣本的比特數來降低信息容量要求,但這樣也就降低了數字信號表示精度。在音頻編碼應用中,精度的降低或者說量化誤差表現為量化噪聲。如果這誤差太大,量化噪聲就會影響編碼信號的主觀質量。
各種音頻編碼技術試圖通過除去察覺不到的或與能察覺的編碼質量無關的一些信息分量對輸入信號進行有損壓縮而沒有任何可察覺的不良影響。利用互逆的解碼技術可以恢復這輸入信號的一個副本,這個副本在感覺上與輸入信號沒有區別,如果所除去的分量確實是無關的話。例如,裂帶(split-band)編碼將一個輸入信號分裂成一些窄帶信號后按照心理聽覺原理對每個窄帶信號進行自適應量化。
心理聽覺原理建立在人們的聽覺系統類似于一系列具有可變中心頻率和隨中心頻率變化的帶寬的高度不對稱調諧濾波器這樣的頻率分析的基礎上。人們的聽覺系統檢測不同音調的能力通常隨音調之間的頻率差的增大而增大,然而人們的聽覺系統的分辨能力對于比上述濾波特性的帶寬小的頻率差都基本上保持恒定。這個帶寬在整個音頻頻譜內改變,稱為“臨界帶寬”。一個優勢信號在聽覺上對臨界帶寬內其他信號的遮蔽要比對頻率在臨界帶寬外的其他信號的遮蔽大。一個優勢信號不僅可以遮蔽與之同時發生的其他信號,而且還可以遮蔽在它前后發生的其他信號。前、后遮蔽效應的持續時間取決了遮蔽信號的幅度,但前遮蔽效應通常要比后遮蔽效應持續時間短得多。前遮蔽時間可能延長到100毫秒以上,但一般認為限于5毫秒以內。后遮蔽可能持續到500毫秒以上,但一般認為在50毫秒左右。一個信號的被遮蔽分量是沒有關系的,可以除去而不會影響聽眾的感覺。
裂帶音頻編碼通常是利用一個前向或“分析”濾波器組將音頻信號在帶寬上劃分成一些帶寬分別與人們聽覺系統臨界帶寬匹配的子帶信號。每個子帶信號用一些剛好是以保證每個子帶內的量化噪聲被本子帶可能還有相鄰子帶內的譜分量遮蔽掉的比特進行量化。裂帶音頻解碼利用一個逆或“綜合”濾波器組來重構原始信號的副本。如果濾波器組內各濾波器的帶寬和各子帶信號的量化精度選得合適,所重構的這個副本在感覺上可以與原始信號沒有區別。
有兩種這樣的編碼技術子帶編碼和變換編碼。子帶編碼可以利用各種模擬和/或數字濾波技術實現濾波器組。變換編碼利用各種時域到頻域的變換實現濾波器組。一些相鄰的頻域變換系數可以組成有效帶寬為各變換系數帶寬之和的相應“子帶”。
在以下的說明中,所謂“裂帶編碼”之類指的是子帶編碼和解碼、變換編碼和解碼、以及其他對有用信號帶寬各部分進行操作的編碼和解碼技術。所謂“子帶”是指有用信號帶寬的這些部分,無論是用一個真實子帶編碼器、變換編碼器還是其他技術實現的。所謂“子帶信號”是指子帶內經相應裂帶濾波的信號表示。
有損壓縮可以包括比例變換。許多包括裂帶編碼的編碼技術傳送采用比例標定表示方式的信號,擴展由有限的比特表示的編碼信息的動態范圍。標定表示包括一個或多個配合與編碼信號元相應的“標定值”的“定標因子”。已有許多標定表示的形式。由于在某種程度上犧牲了標定值的精度,甚至可以用更少的比特來傳送采用“塊標定表示”的信息。塊標定表示包括一個標定值組或塊和與之配合的一個共同的定標因子。
無損型壓縮通過減少或除去信號中冗余的分量來降低信息容量要求而沒有任何損失。相應的解壓縮技術可以通過提供在壓縮期間所除去的冗余分量完全恢復原來的信號。無損壓縮技術包括行程長編碼、差分編碼、線性預測編碼、變換編碼等。這些壓縮技術的一些改變、結合和自適應形式也是為人所知的。
無損與有損壓縮技術結合的混合技術也是為人所知的。例如,采用基于變換的濾波器組的裂帶編碼就是將無損的變換編碼與有損的心理聽覺感受編碼結合在一起。
諸如上面所述的單聲道編碼技術并不能充分降低信息要求以使多信道高質量的音頻可以在諸如傳統的電話線路那樣的窄帶寬通路上傳送進行實時回放。各種高性能編碼系統要求用64 Kbps或更高的速率來實時傳送帶寬為15 KHz的音頻信號。由于要用幾倍這樣的比特率來傳送多個聲道,因此要求單聲道編碼系統的性能有這樣大的改善以致能在諸如日常電話線路之類的有限帶寬通信線路上實時傳送多聲道音頻信號是不可能的。需要進一步降低信息容量的要求由這里稱為空間編碼技術的多聲道編碼技術執行。
一種空是編碼是用一個編碼矩陣合并多路信號,以后再用一個相應的解碼矩陣恢復原始信號的副本。已知的許多4∶2∶4矩陣變換技術是將四個原始信號變換成兩個信號進行傳輸或存儲,以后再從這兩個編碼信號恢復出四個原始信號的副本。這種編碼技術的缺點是信號之間的串音電平很高。業已研究了若干種自適應矩陣變換技術來降低串音電平,然而無論在降低串音或降低容量要求上都不夠充分。
另一種空間編碼是將多個輸入信號分裂為一些子帶信號,產生一個表示各信道在每個子帶內的譜電平的導向信息向量,將所有聲道在給定頻率子帶內的子帶信號合并成一個總和或復合子帶信號,再對這些復合子帶信號進行感覺編碼,以及將編碼復合子帶信號與導向向量匯編成一個編碼信號。相應的解碼器通過按照各子帶的導向向量對相應復合子帶信號定標為每路輸出信號產生各頻率子帶內的子帶信號,再使標定的子帶信號通過逆濾波器組產生各路輸出信號。這種編碼系統的兩個例子可參見Davis等人的美國專利5,853,962以及國際標準化機構的“高達1.5Mbps的數字存儲媒體的運動圖像和伴音的編碼”(“Coding of MovingPictures and Associated Audio for Digital Storage Media At Up ToAbout 1.5 Mbis/s”International Organization for Standardization,CD11172-3,Part 3(Audio),Annex 3-G(Joint Stereo Coding),PP.G-1 toG-4)。
不幸的是,這些空間編碼技術,即使結合了感覺編碼,也不能使多聲道高質量的音頻信號以低比特率在窄帶寬的通路上傳送,實時回放。在將比特率充分降低時,這些技術復現的原始輸入信號的副本帶有所不希望有的后生聲,如啁啾聲、卡搭聲和拉鏈噪聲(像拉鏈拉上、拉下時發出的聲音)。
本發明的目的是提供一種將多個音頻信號編碼成一個低比特率的編碼信號和對這種編碼信號進行解碼產生這些音頻信號的一個高質量副本的方法和設備。
按照本發明的一種情況,有一個編碼器在多個頻率子帶內根據多個輸入信號產生多個聲道子帶信號;產生一個表示至少部分帶寬內輸入信號的復合信號;根據一個頻率子帶內各聲道子帶信號產生一個表示一個聲場的空間特征的空間特征信號,所述空間特征信號呈現為傳送表示各聲道子帶信號的信號電平的信息的第一形式和表示一個或幾個預定方向的第二形式;以及將所述復合信號、所述空間特征信號和一個指示空間特征信號形式的指示匯編成一個編碼信號。
按照本發明的另一種情況,有一個編碼器在多個頻率子帶內根據多個輸入信號產生多個聲道的子帶信號;產生一個表示至少部分帶寬內輸入信號的復合信號;根據一個頻率子帶內各聲道的子帶信號產生一個表示一個聲場的空間特征的空間特征信號,所述空間特征信號傳送表示各聲道的子帶信號的信號電平的信息,使得表示信號電平的信息的值的減少被限制為與人們聽覺系統的時間后遮蔽特性的減少相應;以及將所述復合信號和所述空間特征信號匯編成一個編碼信號。
按照本發明的又一種情況,有一個解碼器從一個編碼信號得出一個或多個復合信號和多個空間特征信號再從一個或多個復合信號導出多個復合子帶信號,其中每個空間特征信號與一個相應的復合子帶信號關聯,表示一個與這個復合子帶信號相應的聲場的空間特征;從空間特征信號導出多個增益因子,其中這些增益因子的值的減少被限制為與人們聽覺系統的時間后遮蔽特性中的減小相應,再按照相應增益因子分別將每個復合子帶信號映射成一個或多個過渡性子帶信號;以及通過用一個或多個逆濾波器組對這些過渡性子帶的作用產生多個輸出信號。
按照本發明的又一種情況,有一個解碼器從一個編碼信號得出一個或多個復合信號、多個空間特征信號和一個指示空間特征信號形式的指示,其中每個空間特征信號與一個相應的復合子帶信號關聯,表示一個與這個復合子帶信號相應的聲場的空間特征,而所述指示指出所述空間特征信號是表示多個信號電平的第一形式和/或表示一個或多個方向的第二形式;從空間特征信號導出多個增益因子,再按照相應增益因子分別將每個復合子帶信號映射成一個或多個過渡性子帶信號,其中對于所關聯的空間特征信號具有第一形式的,映射還按照一個與這些信號電平關聯的空間配置信號和一個表示多個輸出換能器的空間配置的換能器配置信號進行,而對于所關聯的空間特征信號具有第二形式的,映射還按照一個或多個方向和換能器配置信號進行;以及通過用一個或多個逆濾波器對這些過渡性子帶的作用產生多個輸出信號。
本發明的各個特點和優選實施例參閱以下結合附圖所作的詳細說明可以得到更好的理解。在這些附圖中,相同的標號指的是相同的器件。以下說明和附圖的內容只是作為舉例給出的,并不構成對本發明專利保護范圍的限制。
在這些附圖中
圖1和2為按本發明設計的多聲道編碼器的兩個實施例的原理方框圖;圖3為按本發明設計的復合信號產生器的一個實施例的原理方框圖;圖4為按本發明設計的多聲道編碼器的另一個實施例的原理方框圖;以及圖5和6為按本發明設計的多聲道解碼器的兩個實施例的原理方框圖。
圖1例示了按本發明編碼器設計的多聲道編碼器的一個實施例。子帶信號產生器10接收來自通路1的輸入信號,根據這個輸入信號產生聲道子帶信號加到通路11和12上。類似,子帶信號產生器20根據從通路2接收到的輸入信號產生聲道子帶信號加到通路21和22上,而子帶信號產生器30根據從通路3接收到的輸入信號產生聲道子帶信號加到通路31和32上。在許多實際的實施例中,每個子帶信號產生器要產生多于兩個的聲道子帶信號。
對于許多應用情況,可以預料每個子帶信號產生器將產生表示覆蓋每個輸入信號的有用帶寬的各頻率子帶的聲道子帶信號,然而實現本發明并不需要這樣。例如,一個或幾個子帶信號產生器可以產生表示只是有用帶寬的一部分(例如低于1.5KHz左右的那部分帶寬)的聲道子帶信號。通常,應該對所有輸入信號將由空間編碼器40分析以確定聲場空間特征的那部分頻譜產生各聲道子帶信號。
空間編碼器40根據從這些子帶信號產生器接收到的各聲道子帶信號產生空間特征信號加到通路41和42上。這些空間特征信號各表示一個與各自頻率子帶內一個或幾個聲道子帶信號相應的聲場的空間特征。復合信號產生器60通過合并從通路1、2和3接收到的輸入信號產生一個復合信號加到通路61上。
雖然可以設想本發明可以與諸如感覺編碼之類的某種數據壓縮結合使用,然而對于實現本發明而言數據壓縮并不要求。如果采用數據壓縮,實質上可以對加到通路61上的復合信號進行任何形式的數據壓縮。
格式化器50將從通路41和42接收到的空間特征信號和從通路61接收到的復合信號匯編成一個輸出信號送至通路51進行傳輸或存儲。如果復合信號要受到數據壓縮或編碼,就將編了碼的形式而不是復合信號本身匯編入輸出信號。
圖2例示了按本發明設計的多聲道編碼器的另一個實施例。這個實施例與圖1所示的完全相同,只是增加了一個子帶信號產生器70,根據從通路61接收到的復合信號產生復合子帶信號加到通路71至73上。
如果在這個第二實施例中采用數據壓縮,就可以對這些復合子帶信號進行。具體地說,可以應用感覺編碼技術在復合子帶信號的帶寬與臨界帶寬相當的情況下取得良好的效果。應當指出的是子帶信號產生器70產生的復合子帶信號的帶寬不必與子帶信號產生器10、20和30產生的聲道子帶信號的帶寬相同。確實,甚至子帶信號產生器10、20和30產生的聲道子帶信號的帶寬也不必相同。
可以用各種技術來實現這幾個子帶信號產生器。例如,可以采用非遞歸,遞歸或格形濾波器。有些非遞歸濾波器可以用多項式濾波器或多項式變換來實現。專用濾波器實施方案的例子有各種變換,諸如離散付立葉變換(DFT)和離散余弦變換(DCT)、正交鏡像濾波器(QMF)和所謂的偶疊和奇疊時域混疊抵消(TDAC)變換。這些變換的分析特性受變模前對信號樣本塊所加的窗函數的形狀的影響。
在任何實施例中所用的各個子帶信號產生器的分析性質不必完全相同。例如,子帶信號產生器10、20和30最好采用完全相同的設計成使頻譜分辨力最佳和提供子帶信號功率精確計量的濾波器組。然而,在子帶信號產生器70中,可以通過提供臨界采樣和在譜分辨力與時間分辨力之間進行折衷將濾波器組選擇成使數據壓縮最佳化。
圖3例示了一個可用于圖1所示編碼器的復合信號產生器的實施例。在這個實施例中,子帶信號產生器170根據從通路1接收到的輸入信號產生子帶信號,加到通路171和173上。類似,子帶信號產生器180根據從通路2接收到的輸入信號產生子帶信號,加到通路181至183上,而子帶信號產生器190根據從通路3接收到的輸入信號產生子帶信號,加到通路191至193上。子帶信號產生器260根據從通路171、181和191接收到的子帶信號產生復合子帶信號,加到通路261上。類似,子帶信號產生器270根據從通路172、182和192接收到的子帶信號產生復合子帶信號,加到通路271上,而子帶信號產生器280根據從通路173、183和193接收到的子帶信號產生復合子帶信號,加到通路281上。在一個實施例中,子帶信號產生器260、270和280通過將從子帶信號產生器170、180和190接收到的子帶信號相加產生復合子帶信號。另一種形成復合子帶信號的方法將在下面說明。對于本發明的實施來說,怎樣產生復合子帶信號并不是關鍵性的,可以對這些信號進行某種形式的數據壓縮。
圖4例示了按照本發明設計的多聲道編碼器的另一個實施例。這個實施例與圖1所示實施例完全相同,只是復合信號產生器160根據子帶信號產生器10、20和30產生的聲道子帶信號產生一個或幾個復合信號,加到通路161上。在一個實施例中,復合信號產生器160將每個輸入信號在給定頻率子帶內的聲道子帶信號合并成這個頻率子帶的復合子帶信號。加到通路161上的所產生的一個或幾個復合信號可以是經過某種數據壓縮的。
解碼器圖5例示了按照本發明設計的多聲道解碼器的一個實施例。解格式化器510在從通路501接收到的編碼信號中提取一個或幾個復合信號和空間特征信號。在所示實施例中,復合信號沿通路511傳送,而空間特征信號分別沿通路515和516傳送。子帶信號產生器520根據從通路511接收到的復合信號產生復合子帶信號,加到通路521和522上。空間解碼器530根據從通路515和516接收到的這些空間特征信號得出多個增益因子,利用這些增益因子將復合子帶信號映射成一個或幾個過渡性子帶信號。過濾信號產生器540產生的那些過渡性子帶信號分別加到通路541、542和543上,而過渡信號產生器550產生的分別加到通路551、552和553上。輸出信號產生器560根據從通路541和551接收到的過渡性子帶信號產生一個輸出信號,加到通路561上。類似,輸出信號產生器570根據從通路542和552接收到的過渡性子帶信號產生一個輸出信號,加到通路571上,而輸出信號產生器580根據從通路543和553接收到的過渡性子帶信號產生一個輸出信號,加到通路581上。
在圖示解碼器的各實施例中,每個過渡性子帶信號都被映射入所有的輸出信號,然而并非一定要這樣。一個給定的過渡性子帶信號不必映射入所有的輸出信號。
如果從編碼信號中提取的復合信號是經過數據壓縮的,那么按需要可以對通過通路511傳送的信號和/或通過521和522傳送的子帶信號進行相應形式的數據擴展。
可以利用諸如前面所述的各種濾波和變換技術來實現子帶信號產生器。可以利用逆變換技術來實現輸出信號產生器。
圖6例示了按本發明設計的多聲道解碼器的另一個實施例。這個實施例與圖5所示實施例完全相同,只是解格式化器510直接從編碼信號中提取復合子帶信號,加到通路512和513上。按需要,可以對復合子帶信號進行數據擴展。用來實現輸出信號產生器的逆濾波或逆變換應該與用來產生編入編碼信號的復合子帶信號的濾波或變換技術是互補的。
空間特征信號的產生按照本發明設計的編碼器可以產生兩種形式之一或兩種形式的空間特征信號。第一形式信號稱為I型信號,在一個實施例中表示對聲場有貢獻的每個聲道子帶信號的信號電平的某種度量。信號電平的度量例如可以是峰值振幅、平均振幅或均方根(RMS)。在另一個實施例中,I型信號表示對聲場有貢獻的每個“虛擬”聲道子帶信號的信號電平的某種度量。一個虛擬聲道不需要作為一個物理實體存在,但可以是一個概念性實體,表示例如來自兩個或更多個物理聲道的信號的加權和或者其他組合。實質上,空間特征信號的元數不需要等于對聲場有貢獻的實際物理聲道的聲道數。
第二形式信號稱為II型信號,表示聲場的一個或幾個視在方向,可能還有對聲場寬度或方向延展性的指示。一個方向例如可以用三維或二維空間內的一個向量表示。
在一個對表示例如五個輸入聲道的復合信號編碼的系統中,一個頻率子帶的相應II型空間特征信號包括五個信號電平的度量(如功率),亦即每個輸入聲道在這個頻率子帶內的度量。在同一個系統中,一個頻率子帶的相應II型空間特征信號包括對一個或幾個方向的表示。例如,在每個頻率子帶只表示一個方向的實施例中,每個子帶的II型信號可以表示為二維或三維空間的直角座標或球座標內的一個向量。
II型信號的信息容量要求與輸入信道數無關,然而必需將由每個輸入聲道表示的聲源的數目和位置通知產生這種空間特征信號的過程,以便能正確確定聲場方向。
在一個實施例中,編碼器為各頻率子帶產生兩種類型之一或兩種類型的空間特征信號。可以主要根據諸如所需音頻質量、輸出聲道帶寬和/或視在方向數之類的任何準則進行選擇。II型信號可以用于聲道帶寬較小的多聲道系統,因為對一個II型信號編碼所需的比特數通常要比對一個I型信號編碼所需的比特數少一些。如果一個子帶的相應聲場被認為具有大于某個門限數的方向數,那么I型信號可能就需要較少的比特。
例如,假設幾個表示一個大型交響樂團的音頻信號的聲道需以高質量復現,而另一個表示一個蚊子在這個交響樂團處來回飛行的音頻信息的聲道可以較低質量復現。于是,對于表示交響樂團的這些子帶信號的空間特征信號就能以第一形式形成,而對于表示蚊子的這些子帶信號的空間特性信號能以第二形式形成。
隨著一個聲場的視在方向數的增加,傳送一個II型信號所需的比特數也增加,因此,當一個子帶的聲場的視在方向數增加時,對于這個子帶通常寧可選用I型空間特征信號。如果在一個頻率子帶內只有一個聲道具有顯著的譜能量,那么這個子帶的聲場的視在方向數就定為1。如果在一個子帶內有幾個聲道具有顯著的能量,倘若在這個子帶內這些聲道的振幅和相位是相關的,因而表示單個聲源,那么視在方向數也定為1。
對于各頻率子帶來說,聲道子帶信號與空間特征信號之間的關系不必相同。此外,這關系不需要固定,而是可以隨對諸如輸入信號特性或輸出聲道帶寬之類的考慮而變的。在一個簡單的實施例中,對于每個頻率子帶產生一個相應的空間特征信號,表示一個與這個子帶內的所有聲道子帶信號相應的聲場的空間特征。
在圖1、2和4所示實施例的另一個例子中,加到通路41上的所產生的空間特征信號表示一個與從通路11、21和31接收到的這些聲道子帶信號相應的聲場的空間特征,而加到通路42上的所產生的空間特征信號表示一個與從通路12和32接收到的這些聲道子帶信號相應的聲場的空間特征。在這個例子的變型中,產生另一個空間特征信號,表示一個與通路22接收到的聲道子帶信號相應的聲場的空間特征。
在還有一個例子中,編碼器自適應地形成上述兩種形式之一或兩種形式的空間特征信號。這種自適應可以是基于在一個頻率子帶內需表示的視在方向的數目、這些視在方向的感覺寬度和/或傳送空間特征信號可用的比特的數目。在一個優選實施例中,選來表示空間特征信號的形式提供了信息容量要求和音響質量之間的最佳折衷。
在一些應用中,空間特征信號的信息容量要求可以通過限制這些信號變化的時間變化率來降低。對于I型信號,利用時間平滑來限制頻譜電平度量可能變化的變化率。時間平滑也可用來限制這些度量的增大和減小,然而,可以預料對減小的時間平滑與對增大的時間平滑通常更為有效,冒犯也少些。對于II型信號,利用時間平滑來限制方向向量可以改變空間定向的變化率。可以用許多方式來降低信息容量的要求。
利用時間平滑,空間特征信號可以用較少的比特編碼,因為這些信號的元可以不必那么經常編碼和發送。解碼器可以利用內插或某種形式的濾波恢復這些所略去的元。此外,在采用差分編碼的情況下,可以減少表示信號所需的比特,因為時間平滑限制了相繼值之間的差分的動態范圍,從而只需要較少的比特就能表示差分代碼。
通常,時間平滑的程度取決于人們聽覺系統的時間遮蔽特性。例如,可以減小允許電平降低到后時間遮蔽門限以下的變化率,如果所得的電平不超過遮蔽門限,就感覺不到有什么影響。在一些實施例中,變化率限制成不超過每秒120至140 dB左右。在另一個實施例中,對于認為是瞬態的事件將放松時增大率的限制。
可以用多種方式來檢測瞬態。例如,如果在一段短時間內(例如10毫秒)各種信號的振幅增大超過一個門限(例如10 dB),可以認為出現了一個瞬態過程。這樣的信號例如包括輸入信號、復合信號、一個或幾個聲道子帶信號或復合子帶信號,特別是較高頻率子帶的子帶信號。還可以比較相繼時間間隔的頻譜內容的各種度量。例如,可以比較相鄰變換塊的強調較高頻率系數的變換系數加權和。
在一些應用中,可以通過限制信號隨頻譜不同的頻譜變化率來降低空間特征信號的信息容量要求。對于I型信號,利用頻譜平滑限制在相鄰子帶內的相應信號電平度量之差。這種技術在用差分編碼表示各子帶的空間特征信號的實施例中可以用來獲得良好的效果。由于對信息從一個子帶到另一個子帶的改變量的限制,可以將值之間變化的動態范圍減小到只需要較少的比特來表示差分代碼。在許多實施例中,對變化量的限制固有地取決于在用來產生聲道子帶信號的濾波器組和變換內相鄰子帶之間的頻譜泄漏。對用于譜包絡編碼的頻譜平滑的詳細說明可參閱美國專利5,581,653。
還可以通過增大在像塊定標和變換編碼那樣的各種塊編碼方案中所用的塊的長度來降低信息要求。不幸的是,由于塊長度的增大也降低了編碼過程的時間分辨力,因此在空間特征信號和實際聲場之間時間上的不一致也增大。這種誤差的影響可以通過在編碼信號內納入一個在一個塊內哪里空間特征發生明顯改變的指示來減小。實際上,這指示表示了一個塊的開始到空間特征改變之間的延遲量。
復合信號和復合子帶信號可以在一個編碼器內形成一個或幾個復合信號,以后在一個解碼器內分裂成復合子帶信號,見前面結合圖5所作的說明。或者,也可以在一個編碼器內形成復合子帶信號。而由一個解碼器就從編碼信號中提取這些信號,見前面結合圖6所作的說明。對于實現本發明而言,哪種方法都不是要絕對遵從的。
可以用各種方式將信號合并成復合信號和復合子帶信號。一種可以合并信號的方式是將來自各聲道的相應數字采樣值相加,形成一個簡單的和信號,或者將來自各聲道的采樣值加權相加,形成一個較為復雜的和信號。另一種方式是取來自各聲道的相應采樣值的平方和的平方根,形成一個RMS信號。
還有一種形成復合信號的方式是產生一些參數信號,諸如遵從樂器數字接口(MIDI)標準的信號,或傳送音節周期和頻譜包絡成一組濾波器參數的信號和相應的像由寬帶聲碼器產生的激勵信號。在解碼器內根據這些參數信號綜合出適當的信號。由于產生參數信號也就是另一種形式的數據壓縮,因此可以理解,對于實現本發明而言,不一定非要用哪種特定技術。
歸一化在編碼器產生復合子帶信號予以編碼的情況下,通過按照各個空間特征信號中的最大元分別對相應復合子帶信號歸一化可以降低復合子帶信號和相應I型空間特征信號的信息容量要求。
例如,假設一個I型信號傳送一個特定的頻率子帶內來自左、右和中聲道的子帶信號的信號功率的RMS度量。在這個例子中,來自左、右和中聲道的子帶信號的功率度量分別為0.4、0.8和0.1,而通過合并來自這三個聲道的子帶信號得到的復合子帶信號的功率度量為1.2。復合子帶信號用這個特定頻率子帶內最大聲道子帶信號的度量與復合子帶信號的度量之比RR=0.81.2=23]]>定標。
凈效應是將復合子帶信號的信號電平度量標定為與最大聲道子帶信號(在本例中為來自右聲道的子帶信號)相同的電平。經定標的復合子帶信號可以按需要編碼。這個頻率子帶的I型空間特征信號包括一個由三個分別表示按最大信號電平定標的各聲道子帶信號的信號電平的元構成的向量。在這個例子中,空間特征信號向量V的元具有表示左、右和中聲道子帶信號相對電平的值v=(0.40.8,0.80.8,0.10.8)=(0.5,1.0,0.125)]]>這個向量可以按需要編碼。在一個實施例中,向量編碼成每個元用0dB、-3dB、-7dB、-10dB和“斷開”五個電平之一表示的形式。在另一個實施例中,向量各元可以表示不同的電平數。
增益因子的得出和利用如以上結合圖5和6所示實施例說明的那樣,空間解碼器530根據空間特征信號得出多個增益因子。這些增益因子用來將復合子帶信號映射成一個或幾個過渡性子帶信號。可以用若干種方式得出增益因子,這取決于空間特征信號所用的類型和輸出聲道的數目和方法。
作為一個簡單的例子,在一個采用I型空間特征信號的編碼系統中,在輸出聲道的數目和方位與輸入聲道的數目和方位相同的情況下增益因子可以直接根據在空間特征信號內傳送的信號電平的度量得出。如果一個頻帶子帶的相應I型空間特征信號傳送各輸入聲道的功率度量,那么各輸出聲道的增益因子就正比于I型信號中的相應電平。
然而,如果輸入與輸出聲道的數目和方位不同,得出增益因子的過程就要復雜一些。一種可能的得出一個特定頻率子帶的增益因子的過程是為每個輸入聲道形成一個向量,每個向量的方向表示各輸入聲道的方位,而長度與I型空間特征信號中所傳送的各信號電平的度量相應。再將這些向量分別投影到表示各輸出聲道空間方位朝向的相應軸上。每個輸出聲道的增益因子根據相應軸上各投影的和得出。
對于II型空間特征信號可以類似地得出增益因子。然而,一個原則差別是對于解碼器來說不需要知道輸入聲道的空間方位。
在自適應地在兩種空間特征信號之間切換的編碼系統中,也自適應地按需要切換得出增益因子的方式。
得出增益因子后,通過將一個相應的增益因子作用到適當的復合子帶信號上產生一個特定頻率子帶的一個或幾個過渡性信號。實際上,對于一個輸出聲道在一個頻率子帶內的過渡性子帶信號為在這個子帶內的復合子帶信號乘以適當的增益因子,即ISij=gij·XSj其中ISij為對于聲道i在頻率子帶j內的過渡性子帶信號;gij為所得出的對于聲道i在頻率子帶j內的增益因子;以及XSj為在頻率子帶j內的復合子帶信號。通過將一個給定頻率子帶內的所有過渡性信號相加就得到對于相應輸出聲道在這個頻率子帶內的輸出聲道子帶信號。如前面所述,輸出信號本身是使這個輸出聲道的輸出聲道子帶信號通過逆濾波器或綜合濾波器得到的。
在多聲道回放系統中,對于一個特定的聲道在一個或幾個頻率子帶內的子帶信號可以略去或成為零。實際上,編碼系統確定在這個特定聲道和頻率子帶不需要聲能量來營造一個特定的音響效果。于是,就可以引入這些省略而不會影響所希望的聽覺效果來說,表明了本發明在編碼效率上獲得的增益。
業已發現,在許多情況下,這樣的時間平滑可以減小所恢復的信號中的啁啾聲、拉鏈噪聲和其他空間編碼的后生聲。在一些優選實施例中,增益因子的值的變化按人們聽覺系統的時間遮蔽特性加以控制。例如,在合成電平不超過人們聽覺系統的時間后遮蔽門限的情況下,可以減小允許輸出聲道子帶信號的電平減小到這個門限以下的變化率而不會有可察覺的影響。在一些實施例中,變化率被限制到不超過每秒120至140dB。在另一個實施例中,對于認為是一個暫態過程的事件,可以放寬對增大率的限制。暫態過程可以用包括前面所討論的那些在內的各種方式檢測。
在一些實施例中,通過限制增益因子隨譜變化的譜變化率可以改善所復現的信號的質量。這種技術對于采用分析/綜合濾波器組的編碼系統特別有效。在這種系統中,利用綜合濾波器組相鄰子帶頻率響應特性的交疊來抵消混疊的后生聲。一些眾所周知的例如有QMF和TDAC變換。如果相鄰子帶內的信號所受到的放大在增益上相差很大,那么這種濾波系統的混疊抵消特性就會變差。通過控制相鄰子帶的增益可以相差的大小,就能控制混疊抵消,使之不致惡化。在采用混疊抵消濾波系統的優選實施例中,對給定輸出信號的相鄰子帶之間的增益之差進行限制,使得未抵消的這些混疊后生聲基本上感覺不出來。
如上所述,一些采用塊編碼的實施例還可以將一個指出要出現一個值得注意的事件的時間的指示納入一個塊內。例如,編碼器可以將一個指出一個諸如在方向上的瞬時或突然改變之類事件在一個塊開始后多少時間發生的延遲的指示納入編碼信號內。于是,解碼器根據這樣的指示可以在時域內對一個或幾個信號施行一些改變。在采用數字濾波器的實施例中,這些改變原則上可以加到從信號解格式化到輸出信號產生的整個解碼過程中的任何信號上。在采用塊變換的實施例中,這些改變可以加到子帶信號產生前的復合信號511上和/或加到從一個或幾個逆濾波器組得到的輸出信號上。
權利要求
1.一種通過對多個各表示一個相應聲道的音頻信息的輸入信號進行編碼產生一個編碼信號的方法,所述方法包括下列步驟產生多個表示所述輸入信號的在多個頻率子帶內的聲道子帶信號;產生一個表示所述輸入信號的帶寬的至少一個部分的復合信號;根據一個頻率子帶內各聲道子帶信號產生一個表示一個聲場的空間特征的空間特征信號,其中所述空間特征信號傳送表示所述各聲道子帶信號的信號電平的信息,使得表示所述信號電平的所述信息的值的減小被限制成與人們聽覺系統的時間后遮蔽特性的減小相應;以及將所述復合信號和所述空間特征信號匯編成所述編碼信號。
2.一種通過對多個各表示一個相應聲道的音頻信息的輸入信號進行編碼產生一個編碼信號的方法,所述方法包括下列步驟產生多個表示所述輸入信號的在多個頻率子帶內的聲道子帶信號;產生一個表示所述輸入信號的帶寬的至少一個部分的復合信號;根據一個頻率子帶內各聲道子帶信號產生一個表示一個聲場的空間特征的空間特征信號,其中所述空間特征信號呈現為傳送表示所述各聲道子帶信號的信號電平的信息的第一形式和呈現為表示一個或幾個預定方向的第二形式;以及將所述復合信號、所述空間特征信號和一個所述空間特征信號的形式的指示匯編成所述編碼信號。
3.一種按權利要求2所述的方法,其中所述空間特征信號根據各自頻率子帶內所述各聲道子帶信號產生,如果所述聲場的視在方向的數目大于一個門限數,就呈現為所述第一形式,否則就呈現為所述第二形式。
4.一種按權利要求3所述的方法,其中所述門限數在所述各聲道子帶信號中只有一個具有顯著譜能量時或者在所述各聲道子帶信號中所有具有顯著譜能量的還具有相關的振幅和相關的相位時為1,而所述聲場被認為具有一個視在方向。
5.一種按權利要求2所述的方法,其中所述呈現為所述第二形式的相應空間特征信號還表示所述聲場在一個預定方向左右延展的度量。
6.一種按權利要求2所述的方法,其中所述呈現為所述第一形式的相應空間特征信號將表示所述信號電平的所述信息的值的減小限制成與人們聽覺系統的時間后遮蔽特性的減小相應。
7.一種按權利要求1或2所述的方法,其中所述復合信號是通過合并在各自頻率子帶內的兩個或更多個聲道子帶信號產生的。
8.一種按權利要求1或2所述的方法,其中所述復合信號是一個通過使一個寬帶信號通過一個濾波器組或變換而產生的子帶信號,而所述寬帶信號是通過合并所述輸入信號中的兩個或更多個產生的。
9.一種按權利要求1或2所述的方法,其中所述復合信號是通過合并通過使兩個或更多個所述輸入信號通過一個濾波器組或變換而得到的子帶信號產生的。
10.一種按權利要求1或2所述的方法,其中所述復合信號是一個參數信號。
11.一種按權利要求1或2所述的方法,其中所述聲道子帶信號是通過對所述輸入信號進行一個或多個離散變換而產生的,呈現為相應的變換系數塊。
12.一種按權利要求1或2所述的方法,其中所述頻率子帶的帶寬大體分別與人們聽覺系統的臨界帶寬相應。
13.一種按權利要求1或2所述的方法,其中所述各聲道子帶信號根據一個共同時間間隔內的所述輸入信號產生,而所述方法還包括產生一個指示在所述共同時間間隔內所述各個聲場在振幅或方向上突然發生改變的時間的延遲信號,以及將所述延遲信號匯編入所述編碼信號。
14.一種按權利要求1或2所述的方法,其中所述復合信號是一個與各自頻率子帶相應的子帶信號,而所述方法還包括將所述復合信號傳送的信息相對這個頻率子帶內的信號電平度量最大的那個聲道子帶信號的信號電平的度量規一化。
15.一種按權利要求1或2所述的方法,所述方法還包括產生與多個相鄰頻率子帶分別相應的所述各空間特征信號的差分編碼表示,所述差分編碼表示包括動態范圍按相鄰頻率子帶內所述聲道子帶信號之間的譜泄漏限制的一個或幾個代碼。
16.一種對一個編碼信號進行解碼產生一個或幾個輸出信號送至一個或幾個輸出換能器體現的方法,所述方法包括下列步驟根據所述編碼信號得出一個或幾個復合信號和多個空間特征信號,再根據所述一個或幾個復合信號得出多個復合子帶信號,其中每個空間特征信號分別與各自的一個復合子帶信號關聯,表示與所述這個復合子帶信號相應的一個聲場的空間特征;根據所述空間特征信號得出多個增益因子,其中所述各增益因子的值的減小被限制成與人們聽覺系統的時間后遮蔽特性的減小相應,再將各個復合子帶信號分別按相應增益因子映射成一個或幾個過渡性子帶信號;以及通過使所述各過渡性子帶信號通過一個或幾個逆濾波器組產生所述多個輸出信號。
17.一種對一個編碼信號進行解碼產生一個或幾個輸出信號送至一個或幾個輸出換能器體現的方法,所述方法包括下列步驟根據所述編碼信號得出一個或幾個復合信號、多個空間特征信號和一個所述各空間特征信號的形式的指示,再根據所述一個或幾個復合信號得出多個復合子帶信號,其中每個空間特征信號分別與各自的一個復合子帶信號關聯,表示與所述這個復合子帶信號相應的一個聲場的空間特征,而所述指示指出所述各空間特征信號是否呈現為表示多個信號電平的第一形式和/或表示一個或幾個方向的第二形式;根據所述空間特征信號得出多個增益因子,再將各個復合子帶信號分別按相應增益因子映射成一個或幾個過渡性子帶信號,對于具有所述第一形式的所述關聯空間特征信號,所述映射還按一個與所述信號電平關聯的空間配置信號和一個表示所述各輸出換能器的空間配置的換能器配置信號進行,而對于具有所述第二形式的所述關聯空間特征信號,所述映射還按所述一個或幾個方向和所述換能器配置信號進行;以及通過使所述各過渡性子帶信號通過一個或幾個逆濾波器組產生所述多個輸出信號。
18.一種按權利要求17所述的方法,其中所述各增益因子的值的減小被限制成與人們聽覺系統的時間后遮蔽特性的減小相應。
19.一種按權利要求16或17所述的方法,其中所述復合子帶信號通過使所述一個或幾個復合信號通過一個濾波器組或變換得出。
20.一種按權利要求16或17所述的方法,其中所述復合信號是一個參數信號,而所述得出過渡性子帶信號的步驟包括根據所述參數信號產生一個頻譜或時間信號。
21.一種按權利要求16或17所述的方法,所述方法還包括根據所述編碼信號得出一個延遲信號,再根據所述延遲信號延遲映射所述相應復合信號。
22.一種按權利要求16或17所述的方法,其中所述過渡性子帶信號具有分別與人們聽覺系統的臨界帶寬相應的帶寬。
23.一種按權利要求16或17所述的方法,其中所述輸出信號通過施加具有混疊抵消特性的逆濾波器組或進行具有混疊抵消特性的逆變換產生,而所述映射限制相鄰頻率子帶內的所述過渡性子帶信號的電平之差,使得由于混疊抵消不完全而產生的噪聲基本上感覺不出來。
24.一種通過對多個各表示一個相應聲道的音頻信息的輸入信號進行編碼產生一個編碼信號的編碼器,所述編碼器包括產生多個表示所述輸入信號的在多個頻率子帶內的聲道子帶信號的裝置;產生一個表示所述輸入信號的帶寬的至少一個部分的復合信號的裝置;根據一個頻率子帶內各聲道子帶信號產生一個表示一個聲場的空間特征的空間特征信號的裝置,其中所述空間特征信號傳送表示所述各聲道子帶信號的信號電平的信息,使得表示所述信號電平的所述信息的值的減小被限制成與人們聽覺系統的時間后遮蔽特性的減小相應;以及將所述復合信號和所述空間特征信號匯編成所述編碼信號的裝置。
25.一種通過對多個各表示一個相應聲道的音頻信息的輸入信號進行編碼產生一個編碼信號的編碼器,所述編碼器包括產生多個表示所述輸入信號的在多個頻率子帶內的聲道子帶信號的裝置;產生一個表示所述輸入信號的帶寬的至少一個部分的復合信號的裝置;根據一個頻帶子帶內各信道子帶信號產生一個表示一個聲場的空間特征的空間特征信號的裝置,其中所述空間特征信號呈現為傳送表示所述各聲道子帶信號的信號電平的信息的第一形式和呈現為表示一個或幾個預定方向的第二形式;以及將所述復合信號、所述空間特征信號和一個所述空間特征信號的形式的指示匯編成所述編碼信號的裝置。
26.一種按權利要求25所述的編碼器,其中所述空間特征信號根據各自頻率子帶內所述各聲道子帶信號產生,如果所述聲場的視在方向的數目在于一個門限數,就呈現為所述第一形式,否則就呈現為所述第二形式。
27.一種按權利要求26所述的編碼器,其中所述門限數在所述各聲道子帶信號中只有一個具有顯著譜能量時或者在所述各聲道子帶信號中所有具有顯著譜能量的還具有相關的振幅和相關的相位時為1,而所述聲場被認為具有一個視在方向。
28.一種按權利要求25所述的編碼器,其中所述呈現為所述第二形式的相應空間特征信號還表示所述聲場在一個預定方向左右延展的度量。
29.一種按權利要求25所述的編碼器,其中所述呈現為所述第一形式的相應空間特征信號將表示所述信號電平的所述信息的值的減小限制成與人們聽覺系統的時間后遮蔽特征的減小相應。
30.一種按權利要求24或25所述的編碼器,所述編碼器還包括通過合并在各自頻率子帶內的兩個或更多個聲道子帶信號產生所述復合信號的裝置。
31.一種按權利要求24或25所述的編碼器,所述編碼器還包括通過合并所述輸入信號中的兩個或更多個產生一個寬帶信號的裝置,以及使所述寬帶信號通過一個濾波器組或變換產生所述復合信號的裝置。
32.一種按權利要求24或25所述的編碼器,所述編碼器還包括使所述輸入信號中的兩個或更多個通過一個濾波器組或變換的裝置,以及通過合并所得到的子帶信號產生所述復合信號的裝置。
33.一種按權利要求24或25所述的編碼器,其中所述復合信號是一個參數信號。
34.一種按權利要求24或25所述的編碼器,所述編碼器還包括通過對所述輸入信號進行一個或幾個離散變換產生呈現為變換系數塊的所述聲道子帶信號的裝置。
35.一種按權利要求24或25所述的編碼器,其中所述頻率子帶的帶寬大體分別與人們聽覺系統的臨界帶寬相應。
36.一種按權利要求24或25所述的編碼器,其中所述各聲道子帶信號根據一個共同時間間隔內的所述輸入信號產生,而所述編碼器還包括產生一個指示在所述共同時間間隔內所述各個聲場在振幅或方向上突然發生改變的時間的延遲信號的裝置,以及將所述延遲信號匯編入所述編碼信號的裝置。
37.一種按權利要求24或25所述的編碼器,其中所述復合信號是一個與各自頻率子帶相應的子帶信號,而所述編碼器還包括將所述復合信號傳送的信息相對這個頻率子帶內的信號電平度量最大的那個聲道子帶信號的信號電平的度量規一化的裝置。
38.一種按權利要求24或25所述的編碼器,所述編碼器還包括產生與多個相鄰頻率子帶分別相應的所述各空間特征信號的差分編碼表示的裝置,而所述差分編碼表示包括動態范圍按相鄰頻率子帶內所述聲道子帶信號之間的譜泄漏限制的一個或幾個代碼。
39.一種對一個編碼信號進行解碼產生一個或幾個輸出信號送至一個或幾個輸出換能器體現的解碼器,所述解碼器包括根據所述編碼信號得出一個或幾個復合信號和多個空間特征信號,再根據所述一個或幾個復合信號得出多個復合子帶信號的裝置,其中每個空間特征信號分別與各自的一個復合子帶信號關聯,表示與所述這個復合子帶信號相應的一個聲場的空間特征;根據所述空間特征信號得出多個增益因子,其中所述各增益因子的減小被限制成與人們聽覺系統的時間后遮蔽特性的減小相應,再將各個復合子帶信號分別按相應增益因子映射成一個或幾個過渡性子帶信號的裝置;以及使所述各過渡性子帶信號通過一個或幾個逆濾波器組產生所述多個輸出信號的裝置。
40.一種對一個編碼信號進行解碼產生一個或幾個輸出信號送至一個或幾個輸出換能器體現的解碼器,所述解碼器包括根據所述編碼信號得出一個或幾個復合信號、多個空間特征信號和一個所述各空間特征信號的形式的指示,再根據所述一個或幾個復合信號得出多個復合子帶信號的裝置,其中每個空間特征信號分別與各自的一個復合子帶信號關聯,表示與所述這個復合子帶信號相應的一個聲場的空間特征,而所述指示指出所述各空間特征信號是否呈現為表示多個信號電平的第一形式和/或表示一個或幾個方向的第二形式;根據所述空間特征信號得出多個增益因子,再將各個復合子帶信號分別按相應增益因子映射成一個或幾個過渡性子帶信號的裝置,對于具有所述第一形式的所述關聯空間特征信號,所述映射還按一個與所述信號電平關聯的空間配置信號和一個表示所述各換能器的空間配置的換能器配置信號進行,而對于具有所述第二形式的所述關聯空間特征信號,所述映射還按所述一個或幾個方向和所述換能器配置信號進行;以及使所述各過渡性子帶信號通過一個或幾個逆濾波器組產生所述多個輸出信號的裝置。
41.一種按權利要求40所述的解碼器,其中所述各增益因子的減小被限制成與人們聽覺系統的時間后遮蔽特性的減小相應。
42.一種按權利要求39或40所述的解碼器,所述解碼器還包括使所述一個或幾個復合信號通過一個濾波器組或變換得出所述復合子帶信號的裝置。
43.一種按權利要求39或40所述的解碼器,其中所述復合信號是一個參數信號,而所述得出過渡性子帶信號的裝置根據所述參數信號還產生一個頻譜或時間信號。
44.一種按權利要求39或40所述的解碼器,所述解碼器還包括根據所述編碼信號得出一個延遲信號,再根據所述延遲信號延遲映射所述相應復合信號的裝置。
45.一種按權利要求39或40所述的解碼器,其中所述過渡性子帶信號具有分別與人們聽覺系統的臨界帶寬相應的帶寬。
46.一種按權利要求39或40所述的解碼器,所述解碼器還包括施加一個具有混疊抵消特性的逆濾波器組或進行一個具有混疊抵消特性的逆變換產生所述輸出信號的裝置,而所述映射裝置限制相鄰頻率子帶內的所述過渡性子帶信號的電平之差,使得由于混疊抵消不完全而產生的噪聲基本上感覺不出來。
全文摘要
裂帶編碼系統將多個聲道的輸入信號合并成各種形式的復合信號,產生相應表示多個頻率子帶內的聲場空間特征的空間特征信號。這些空間特征信號可以呈現為兩種形式之一或兩種形式。在第一形式,這信號表示從各輸入信號得出的子帶信號的信號電平的度量;而在第二形式,這信號表示聲場的一個或幾個視在方向。空間特征信號的類型可以動態地按照包括輸入信號特性在內的各種準則自適應地改變。在編碼器中可以對空間特征信號進行時間平均和頻譜平滑。時間平滑和頻譜平滑在解碼器內可以加到根據空間特征信號得出的各增益因子上。
文檔編號H04R5/04GK1264533SQ98807259
公開日2000年8月23日 申請日期1998年6月19日 優先權日1997年7月16日
發明者馬克·F·戴維斯, 馬修·C·費勒斯 申請人:多爾拜實驗特許公司