專利名稱:對多聲道音頻信號進行編碼/解碼的系統(tǒng)、介質和方法
技術領域:
本發(fā)明的實施例涉及音頻信號的編碼和/或解碼,更具體地講,涉及對多聲道音頻信號進行編碼/解碼的系統(tǒng)和方法。
背景技術:
一般音頻編碼的示例包括波形多聲道音頻編碼和參數多聲道音頻編碼。在波形多聲道音頻編碼中,可接收5音頻聲道信號,并輸出5音頻聲道信號。波形多聲道音頻編碼的 示例包括MPEG-2MC音頻編碼、AAC MC音頻編碼以及BSAC/AVS MC音頻編碼。MPEG-2MC音頻編碼是以兩種類型的模式被執(zhí)行的,一種是對原始信號進行操作的模式,另ー種是對下混頻(downmix)的信號和其他獨立的信號進行操作的模式,AAC MC音頻編碼是使用PCE和默認設置對原始信號被執(zhí)行的,BSAC/AVS MC是使用channel_configuration_idx對原始信號執(zhí)行的比特分片算術音頻編碼(bit sliced arithmetic audio coding)。參數多聲道音頻編碼的示例包括將I個或2個輸入的聲道信號編碼為5個或6個聲道信號的MPEG環(huán)繞編碼。此外,MPEG環(huán)繞編碼基于量化矩陣擴展(QMF,Quant MatrixExtension)、逆一輸入至兩輸出的解碼工具(R-0TT,a reverse one-input to two-outputdecoding tool)、逆兩輸入至三輸出的角軍石馬工具(a reverse two-input to three-outputdecoding tool, R-TTT)以及關于擴展的信號的R-OTT樹。這里,作為示例,ー輸入至兩輸出工具可以是獲得一個輸入并產生兩個輸出的工具。圖I示出這樣的MPEG環(huán)繞解碼器。在解碼器的接收器端有各種揚聲器配置,例如,
1、2、3(前)/0(后),3/1,3/2以及5/2。因此,輸入的編碼的音頻流可被解碼為全部可用的音頻聲道信號,其中,可根據在解碼器的接收器端使用的揚聲器配置選擇性地挑選所述全部可用的音頻聲道信號用于輸出。類似地,圖2示出用于將輸入的音頻聲道信號編碼為音頻比特流的相應的編碼器以及用于對編碼的音頻聲道信號進行解碼的解碼器。在MPEG環(huán)繞的情況下,編碼器對M個輸入的音頻聲道信號進行編碼,并輸出N個音頻聲道信號作為音頻比特流,其中,M大于N。然后,解碼器可對N個編碼的音頻聲道信號進行解碼,并輸出L個解碼的音頻聲道信號,其中,L大于或等于N,M大于或等于し然而,在這樣的傳統(tǒng)解碼器中,通過將M個輸入的音頻聲道信號解碼(例如,當M=N = L吋)或通過將下混頻的M個輸入音頻聲道信號上混頻為N個音頻聲道信號井隨后對N個音頻聲道信號進行解碼來直接產生L個音頻聲道信號。然而,難以在接收器基于實際已知類型的揚聲器配置,將輸入的音頻聲道信號解碼為合適數量的聲道的音頻信號
發(fā)明內容
技術問題本發(fā)明的實施例提供一種對多聲道音頻信號進行編碼/解碼的系統(tǒng)、介質和方法,通過該多聲道音頻信號解碼系統(tǒng)、介質和方法,基于可選的解碼級別根據在解碼器的接收器端的揚聲器配置的類型,將輸入的音頻聲道信號選擇性地解碼為復數數量的聲道的音頻信號。將在接下來的描述中部分闡述本發(fā)明另外的方面和/或優(yōu)點,還有一部分通過描述將是清楚的,或者可以經過本發(fā)明的實施而得知。技術方案為了實現至少上面的和/或其他方面和優(yōu)點,本發(fā)明的實施例包括一種多聲道音頻信號解碼系統(tǒng),所述多聲道音頻信號解碼系統(tǒng)包括解碼級別產生單元,產生解碼級別信息以控制將具有預定數量N的編碼的音頻聲道信號和空間信息的比特流解碼為數量L(其·中,L ^ N)的音頻聲道信號的解碼級別,其中,所述空間信息包括相應的聲道之間的幅值差和/或相似性的信息;音頻解碼器,基于解碼級別信息通過不同級別的解碼對比特流進行選擇性地解碼,并產生數量L的音頻聲道信號。為了實現至少上面的和/或其他方面和優(yōu)點,本發(fā)明的實施例包括一種多聲道音頻信號解碼方法,所述多聲道音頻信號解碼方法包括包括基于解碼級別信息對比特流進行選擇性地解碼,以控制將具有預定數量N的編碼的音頻聲道信號和空間信息的比特流解碼為數量L的音頻聲道信號的解碼級別,其中,所述空間信息包括相應的聲道之間的幅值差和/或相似性的信息。為了實現至少上面的和/或其他方面和優(yōu)點,本發(fā)明的實施例包括一種多聲道音頻信號解碼系統(tǒng),所述多聲道音頻信號解碼系統(tǒng)包括第一 OTT解碼器,將以包括相應的編碼的單個音頻聲道信號的相應的比特流形式的單個音頻聲道信號和空間信息解碼為兩個音頻聲道信號,其中,所述空間信息包括相應的聲道之間的幅值差和/或相似性的信息;TTT解碼器,將所述兩個音頻聲道信號解碼為三個音頻聲道信號作為第一、第二和第三聲道信號;第二 OTT解碼器,將第一聲道信號解碼為第一復數個聲道信號;第三OTT解碼器,將第二聲道信號解碼為第二復數個聲道信號;第四OTT解碼器,將第三聲道信號解碼為第三復數個聲道信號。為了實現至少上面的和/或其他方面和優(yōu)點,本發(fā)明的實施例包括一種多聲道音頻信號解碼方法,所述多聲道音頻信號解碼方法包括第一 OTT解碼,將以包括相應的編碼的單個音頻聲道信號的相應的比特流形式的單個音頻聲道信號和空間信息解碼為兩個音頻聲道信號,其中,所述空間信息包括相應的聲道之間的幅值差和/或相似性的信息;TTT解碼,將在第一 OTT解碼中獲得的兩個音頻聲道信號解碼為三個音頻聲道信號作為第一、第二和第三聲道信號;第二 OTT解碼,將第一聲道信號解碼為第一復數個聲道信號;第三OTT解碼,將第二聲道信號解碼為第二復數個聲道信號;第四OTT解碼,將第三聲道信號解碼為第三復數個聲道信號。為了實現至少上面的和/或其他方面和優(yōu)點,本發(fā)明的實施例包括一種多聲道音頻信號解碼系統(tǒng),所述多聲道音頻信號解碼系統(tǒng)包括=TTT解碼器,將以包括相應的編碼的兩個音頻聲道信號的相應的比特流形式的兩個音頻聲道信號和空間信息解碼為三個音頻聲道信號作為第一、第二和第三聲道信號,其中,所述空間信息包括相應的聲道之間的幅值差和/或相似性的信息;第一 OTT解碼器,將第一聲道信號解碼為第一復數個聲道信號;第ニ OTT解碼器,將第二聲道信號解碼為第二復數個聲道信號;第三OTT解碼器,將第三聲道信號解碼為第三復數個聲道信號;第四OTT解碼器,將由第一 OTT解碼器解碼的第一復數個聲道信號之一解碼為第四復數個聲道信號;第五OTT解碼器,將由第二 OTT解碼器輸出的第ニ復數個聲道信號中的一個聲道信號解碼為第五復數個聲道信號。為了實現至少上面的和/或其他方面和優(yōu)點,本發(fā)明的實施例包括一種多聲道音頻信號解碼方法,所述多聲道音頻信號解碼方法包括=TTT解碼,將以包括相應的編碼的兩個音頻聲道信號的相應的比特流形式的兩個音頻聲道信號和空間信息解碼為三個音頻聲道信號作為第一、第二和第三聲道信號,其中,所述空間信息包括相應的聲道之間的幅值差和/或相似性的信息 ,第一 OTT解碼,將第一聲道信號解碼為第一復數個聲道信號;第二OTT解碼,將第二聲道信號解碼為第二復數個聲道信號;第三OTT解碼,將第三聲道信號解碼為第三復數個聲道信號;第四OTT解碼,將在第一 OTT解碼輸出的第一復數個聲道信號之一解碼為第四復數個聲道信號;第五OTT解碼,將在第二OTT解碼中輸出的第二復數個聲道信號中的一個聲道信號解碼為第五復數個聲道信號。
為了實現至少上面的和/或其他方面和優(yōu)點,本發(fā)明的實施例包括一種多聲道音頻信號解碼系統(tǒng),所述多聲道音頻信號解碼系統(tǒng)包括=TTT解碼器,將以包括相應的編碼的兩個音頻聲道信號的相應的比特流形式的兩個音頻聲道信號和空間信息解碼為三個音頻聲道信號作為第一、第二和第三聲道信號,其中,所述空間信息包括相應的聲道之間的幅值差和/或相似性的信息;第一 OTT解碼器,將第一聲道信號解碼為第一復數個聲道信號;第ニ OTT解碼器,將第二聲道信號解碼為第二復數個聲道信號;第三OTT解碼器,將第三聲道信號解碼為第三復數個聲道信號;第四OTT解碼器,將第三OTT解碼器的第三復數個聲道信號中的一個聲道信號解碼為第四復數個聲道信號;第五OTT解碼器,將第四OTT解碼器的第四復數個聲道信號中的一個聲道信號解碼為第五復數個聲道信號。為了實現至少上面的和/或其他方面和優(yōu)點,本發(fā)明的實施例包括一種多聲道音頻信號解碼方法,所述多聲道音頻信號解碼方法包括=TTT解碼,將以包括相應的編碼的兩個音頻聲道信號的相應的比特流形式的兩個音頻聲道信號和空間信息解碼為三個音頻聲道信號作為第一、第二和第三聲道信號,其中,所述空間信息包括相應的聲道之間的幅值差和/或相似性的信息;第一 OTT解碼,將第一聲道信號解碼為第一復數個聲道信號;第二OTT解碼,將第二聲道信號解碼為第二復數個聲道信號;第三OTT解碼,將第三聲道信號解碼為第三復數個聲道信號;第四OTT解碼,將在第三OTT解碼中輸出的第三復數個聲道信號中的一個聲道信號解碼為第四復數個聲道信號;第五OTT解碼器,將在第四OTT解碼中輸出的第四復數個聲道信號中的一個聲道信號解碼為第五復數個聲道信號。為了實現至少上面的和/或其他方面和優(yōu)點,本發(fā)明的實施例包括一種多聲道音頻信號解碼系統(tǒng),所述多聲道音頻信號解碼系統(tǒng)包括第一 OTT解碼器,對包括作為第一和第二音頻聲道信號的兩個編碼的音頻聲道信號和空間信息的比特流進行解碼,以便將第一音頻聲道信號解碼為第一復數個音頻聲道信號,其中,所述空間信息包括相應的聲道之間的幅值差和/或相似性的信息;第二 OTT解碼器,將第二音頻聲道信號解碼為第二復數個聲道信號作為第一和第二聲道信號;第三OTT解碼器,將由第一 OTT解碼器輸出的第一復數個音頻聲道信號中的一個音頻聲道信號解碼為第三復數個聲道信號;第四OTT解碼器,將第一聲道信號解碼為第四復數個聲道信號;第五OTT解碼器,將第二聲道信號解碼為第五復數個聲道信號;第六OTT解碼器,將第一OTT解碼器輸出的第一復數個音頻聲道信號中的另一音頻聲道信號解碼為第六復數個聲道信號。為了實現至少上面的和/或其他方面和優(yōu)點,本發(fā)明的實施例包括一種多聲道音頻信號解碼方法,所述多聲道音頻信號解碼方法包括第一 OTT解碼,將包括作為第一音頻聲道信號和第二音頻聲道信號的兩個編碼的音頻聲道信號和空間信息的比特流進行解碼,以便將第一音頻聲道信號解碼為第一復數個音頻聲道信號,其中,所述空間信息包括相應的聲道之間的幅值差和/或相似性的信息 ,第二 OTT解碼,將第二音頻聲道信號解碼為第ニ復數個聲道信號作為第一和第二聲道信號;第三OTT解碼,將在第一 OTT解碼中獲得的第一復數個音頻聲道信號中的一個音頻聲道信號解碼為第三復數個聲道信號;第四OTT解碼,將第一聲道信號解碼為第四復數個聲道信號;第五OTT解碼,將第二聲道信號解碼為第五復數個聲道信號;第六OTT解碼,將在第一OTT解碼中獲得的第一復數個音頻聲道信號中的另一音頻聲道信號解碼為第六復數個聲道信號。為了實現至少上面的和/或其他方面和優(yōu)點,本發(fā)明的實施例包括一種多聲道音 頻信號編碼系統(tǒng),所述多聲道音頻信號編碼系統(tǒng)包括第一 OTT編碼器,從左前音頻聲道(LF)信號和左環(huán)繞音頻聲道(LS)信號產生第一 OTT音頻聲道(L’)信號和第一 OTT參數,其中,第一 OTT參數包括關于相應的LF和LS聲道之間的幅值差和/或相似性的信息;第二OTT編碼器,從右前音頻聲道(RF)信號和右環(huán)繞音頻聲道(RS)信號產生第二 OTT音頻聲道(R’ )信號和第二 OTT參數,其中,第二 OTT參數包括相應的RF和RS聲道之間的幅值差和/或相似性的信息;第三OTT編碼器,從中音頻聲道(C)信號和低音音頻聲道(LFE)信號產生第三OTT音頻聲道C’信號和第三OTT參數,其中,第三OTT參數包括相應的C和LFE聲道之間的幅值差和/或相似性的信息;TTT編碼器,從分別由第一 OTT編碼器、第二 OTT編碼器和第三OTT編碼器輸出的L’、R’和C’聲道信號產生復數個TTT音頻聲道信號和TTT參數,其中,所述TTT參數包括相應的L’、R’和C’聲道之間的幅值差和/或相似性的信息;第四OTT編碼器,從由TTT編碼器輸出的復數個TTT音頻聲道信號產生第四OTT音頻聲道信號和第四OTT參數,其中,第四OTT參數包括相應的復數個TTT聲道之間的幅值差和/或相似性的信息;比特流產生単元,壓縮由第一至第四OTT編碼器產生的OTT參數、由TTT編碼器產生的TTT參數以及由第四OTT編碼器產生的第四OTT音頻聲道信號,以產生比特流。為了實現至少上面的和/或其他方面和優(yōu)點,本發(fā)明的實施例包括一種多聲道音頻信號編碼系統(tǒng),所述多聲道音頻信號編碼系統(tǒng)包括第一 OTT編碼器,從前左音頻聲道(FL)信號和前左中音頻聲道(FLC)信號產生第一 OTT音頻聲道(FL’ )信號和第一 OTT參數,其中,第一 OTT參數包括相應的FL和FLC聲道之間的幅值差和/或相似性的信息;第二OTT編碼器,從前右音頻聲道(FR)信號和前右中音頻聲道(FRC)信號產生第二 OTT音頻聲道FR’信號和第二 OTT參數,其中,第二 OTT參數包括關于相應的FR和FRC聲道之間的幅值差和/或相似性的信息;第三OTT編碼器,從由第一 OTT編碼器產生的音頻聲道(FL’)信號和后左音頻聲道(BL)信號產生第三OTT音頻聲道(L’)信號和第三OTT參數,其中,第三OTT參數包括相應的FL’和BL聲道之間的幅值差和/或相似性的信息;第四OTT編碼器,從由第二 OTT編碼器產生的音頻聲道(FR’ )信號和后右音頻聲道(BR)信號產生第四OTT音頻聲道(R’)信號和第四OTT參數,其中,第四OTT參數包括相應的FR’和BR聲道之間的幅值差和/或相似性的信息;第五OTT編碼器,從中音頻聲道(C)信號和低音音頻聲道LFE信號產生第五OTT音頻聲道(C’ )信號和第五OTT參數,其中,第五OTT參數包括相應的C和LFE聲道之間的幅值差和/或相似性的信息;TTT編碼器,從分別由第三OTT編碼器、第四OTT編碼器和第五OTT編碼器輸出的L’、R’和C’聲道信號產生復數個TTT音頻聲道信號和TTT參數,其中,TTT參數包括相應的L’、R’和C’聲道之間的幅值差和/或相似性的信息;比特流產生単元,壓縮由第一至第五OTT編碼器以及TTT編碼器產生的參數以及由TTT編碼器產生的復數個TTT音頻聲道信號,以產生比特流。為了實現至少上面的和/或其他方面和優(yōu)點,本發(fā)明的實施例包括一種多聲道音頻信號編碼系統(tǒng),所述多聲道音頻信號編碼系統(tǒng)包括第一 OTT編碼器,從前左中音頻聲道(FLC)信號和前右中音頻聲道(FRC)信號產生第一 OTT音頻聲道(FC’)信號和第一 OTT參數,其中,第一 OTT參數包括相應的FLC和FRC聲道之間的幅值差和/或相似性的信息;第ニ OTT編碼器,從由第一 OTT編碼器輸出的音頻聲道(FC’ )信號和中音頻聲道(C)信號產生第二 OTT音頻聲道(C”)信號和第二 OTT參數,其中,第二 OTT參數包括相應的FC’和C聲道之間的幅值差和/或相似性的信息;第三OTT編碼器,從前左音頻聲道(FL)信號和后左音頻聲道(BL)信號產生第三OTT音頻聲道(L’)信號和第三OTT參數,其中,第三OTT參 數可包括相應的FL和BL聲道之間的幅值差和/或相似性的信息;第四OTT編碼器,從音頻聲道(FR)信號和后右音頻聲道(BR)信號產生第四OTT音頻聲道(R’ )信號和第四OTT參數,其中,第四OTT參數包括相應的FR和BR聲道之間的幅值差和/或相似性的信息;第五OTT編碼器,從由第二 OTT編碼器輸出的音頻聲道(C”)信號和低音音頻聲道(LFE)信號產生第五OTT音頻聲道(C’)信號和第五OTT參數,其中,第五OTT參數包括相應的C”和LFE聲道之間的幅值差和/或相似性的信息;TTT編碼器,從分別由第三OTT編碼器、第四OTT編碼器和第五OTT編碼器輸出的L’、R’和C’聲道信號產生復數個TTT音頻聲道信號和TTT參數,其中,TTT參數包括L’、R’和C’聲道之間的幅值差和/或相似性的信息;比特流產生単元,壓縮由第一至第五OTT編碼器以及TTT編碼器產生的參數以及由TTT編碼器產生的復數個TTT音頻聲道信號,以產生比特流。為了實現至少上面的和/或其他方面和優(yōu)點,本發(fā)明的實施例包括一種多聲道音頻信號編碼系統(tǒng),所述多聲道音頻信號編碼系統(tǒng)包括第一 OTT編碼器,從前左中音頻聲道(FLC)信號和前右中音頻聲道(FRC)信號產生第一 OTT音頻聲道(C’ )信號和第一 OTT參數,其中,第一 OTT參數包括相應的FLC和FRC聲道之間的幅值差和/或相似性的信息;第ニ OTT編碼器,從前左音頻聲道(FL)信號和后左音頻聲道(BL)信號產生第二 OTT音頻聲道(じ)信號和第二 OTT參數,其中,第二 OTT參數包括相應的FL和BL聲道之間的幅值差和/或相似性的信息;第三OTT編碼器,從前右音頻聲道(FR)信號和后右音頻聲道(BR)信號產生第三OTT音頻聲道(R’)信號和第三OTT參數,其中,第三OTT參數包括相應的FR和BR聲道之間的幅值差和/或相似性的信息;第四OTT編碼器,從中音頻聲道(C)信號和低音音頻聲道(LFE)信號產生第四OTT音頻聲道(C”)信號和第四OTT參數,其中,第四OTT參數包括相應的C和LFE聲道之間的幅值差和/或相似性的信息;第五OTT編碼器,從由第ニ OTT編碼器輸出的音頻聲道(L’ )信號和由第一 OTT編碼器輸出的音頻聲道(C’ )信號產生第五OTT音頻聲道信號和第五OTT參數,其中,第五OTT參數包括相應的L’和C’聲道之間的幅值差和/或相似性的信息;第六OTT編碼器,從由第三OTT編碼器輸出的音頻聲道(R’)信號和由第四OTT編碼器輸出的音頻聲道(C”)信號產生第六OTT音頻聲道信號和第六OTT參數,其中,第六OTT參數包括相應的R’和C”聲道之間的幅值差和/或相似性的信息;比特流產生単元,壓縮由第一至第六OTT編碼器產生的參數、由第五OTT編碼器產生的第五OTT音頻聲道信號以及由第六OTT編碼器產生的第六OTT音頻聲道信號,以產生比特流。為了實現至少上面的和/或其他方面和優(yōu)點,本發(fā)明的實施例包括一種多聲道音頻信號編碼方法,所述多聲道音頻信號編碼方法包括第一 OTT編碼,從左前音頻聲道(LF)信號和左環(huán)繞音頻聲道(LS)信號產生第一 OTT音頻聲道(L’)信號和第一 OTT參數,其中,第一 OTT參數包括關于相應的LF和LS聲道之間的幅值差和/或相似性的信息;第二 OTT編碼,從右前音頻聲道(RF)信號和右環(huán)繞音頻聲道(RS)信號產生第二 OTT音頻聲道(R’)信號和第二 OTT參數,其中,第二 OTT參數包括相應的RF和RS聲道之間的幅值差和/或相似性的信息;第三OTT編碼,從中音頻聲道(C)信號和低音音頻聲道(LFE)信號產生第三OTT音頻聲道(C’ )信號和第三OTT參數,其中,第三OTT參數包括相應的C和LFE聲道之 間的幅值差和/或相似性的信息;TTT編碼,從分別在第一 OTT編碼、第二 OTT編碼和第三OTT編碼中產生的L’、R’和C’聲道信號產生TTT參數和復數個TTT音頻聲道信號,其中,TTT參數包括相應的L’、R’和C’聲道之間的幅值差和/或相似性的信息;第四OTT編碼,從在TTT編碼中產生的復數個TTT音頻聲道信號產生第四OTT音頻聲道信號和第四OTT參數;壓縮在第一至第四OTT編碼以及TTT編碼中產生的參數和在第四OTT編碼中產生的第四OTT音頻聲道信號,以產生比特流。為了實現至少上面的和/或其他方面和優(yōu)點,本發(fā)明的實施例包括一種多聲道音頻信號編碼方法,所述多聲道音頻信號編碼方法包括第一 OTT編碼,從前左音頻聲道(FL)信號和前左中音頻聲道(FLC)信號產生第一 OTT音頻聲道(FL’ )信號和第一 OTT參數,其中,第一 OTT參數包括相應的FL和FLC聲道之間的幅值差和/或相似性的信息 ,第二 OTT編碼,從前右音頻聲道(FR)信號和前右中音頻聲道(FRC)信號產生第二 OTT音頻聲道(FR’)信號和第二 OTT參數,其中,第二 OTT參數包括關于相應的FR和FRC聲道之間的幅值差和/或相似性的信息;第三OTT編碼,從在第一 OTT編碼中產生的音頻聲道(FL’)信號和后左音頻聲道(BL)信號產生第三OTT音頻聲道(L’ )信號和第三OTT參數,其中,第三OTT參數包括相應的FL’和BL聲道之間的幅值差和/或相似性的信息;第四OTT編碼,從在第二OTT編碼中產生的音頻聲道(FR’ )信號和后右音頻聲道(BR)信號產生第四OTT音頻聲道(R’)信號和第四OTT參數,其中,第四OTT參數包括相應的FR’和BR聲道之間的幅值差和/或相似性的信息;第五OTT編碼,從中音頻聲道(C)信號和低音音頻聲道(LFE)信號產生第五OTT音頻聲道(C’ )信號和第五OTT參數,其中,第五OTT參數包括相應的C和LFE聲道之間的幅值差和/或相似性的信息;TTT編碼,從分別在第三OTT編碼、第四OTT編碼和第五OTT編碼中產生的L’、R’和C’聲道信號產生復數個TTT立體聲音頻聲道信號和TTT參數,其中,TTT參數包括相應的L’、R’和C’聲道之間的幅值差和/或相似性的信息;壓縮在第一至第五OTT編碼中產生的參數以及在TTT編碼中產生的復數個立體聲音頻聲道信號,以產生比特流。為了實現至少上面的和/或其他方面和優(yōu)點,本發(fā)明的實施例包括一種多聲道音頻信號編碼方法,所述多聲道音頻信號編碼方法包括第一 OTT編碼,從前左中音頻聲道(FLC)信號和前右中音頻聲道(FRC)信號產生第一 OTT音頻聲道(FC’)信號和第一 OTT參數,其中,第一 OTT參數包括相應的FLC和FRC聲道之間的幅值差和/或相似性的信息;第ニ OTT編碼,從在第一 OTT編碼中產生的音頻聲道(FC’ )信號和中音頻聲道(C)信號產生第二 OTT音頻聲道(C”)信號和第二 OTT參數,其中,第二 OTT參數包括相應的FC’和C聲道之間的幅值差和/或相似性的信息;第三OTT編碼,從前左音頻聲道(FL)信號和后左音頻聲道(BL)信號產生第三OTT音頻聲道(L’ )信號和第三OTT參數,其中,第三OTT參數可包括相應的FL和BL聲道之間的幅值差和/或相似性的信息;第四OTT編碼,從前右音頻聲道(FR)信號和后右音頻聲道(BR)信號產生第四OTT音頻聲道(R’ )信號和第四OTT參數,其中,第四OTT參數包括相應的FR和BR聲道之間的幅值差和/或相似性的信息;第五OTT編碼,從在第二 OTT編碼中產生的音頻聲道(C”)信號和低音音頻聲道(LFE)信號產生第五OTT音頻聲道(C’)信號和第五OTT參數,其中,第五OTT參數包括相應的C”和LFE聲道之間的幅值差和/或相似性的信息;TTT編碼器,從分別在第三OTT編碼、第四OTT編碼和第五OTT編碼中產生的L’、R’和C’聲道信號產生復數個TTT (立體聲)音頻聲道信號和TTT參數,其中,TTT參數包括相應L’、R’和C’聲道之間的幅值差和/或相似性的信息;壓 縮在第一至第五OTT編碼中產生的參數以及在TTT編碼中產生的音頻聲道信號,以產生比特流。為了實現至少上面的和/或其他方面和優(yōu)點,本發(fā)明的實施例包括一種多聲道音頻信號編碼方法,所述多聲道音頻信號編碼方法包括第一 OTT編碼,從前左中音頻聲道(FLC)信號和前右中音頻聲道(FRC)信號產生第一 OTT音頻聲道(C’ )信號和第一 OTT參數,其中,第一 OTT參數包括相應的FLC和FRC聲道之間的幅值差和/或相似性的信息;第ニ OTT編碼,從前左音頻聲道(FL)信號和后左音頻聲道(BL)信號產生第二 OTT音頻聲道(じ)信號和第二 OTT參數,其中,第二 OTT參數包括相應的FL和BL聲道之間的幅值差和/或相似性的信息;第三OTT編碼,從前右音頻聲道(FR)信號和后右音頻聲道(BR)信號產生第三OTT音頻聲道R’信號和第三OTT參數,其中,第三OTT參數包括相應的FR和BR聲道之間的幅值差和/或相似性的信息;第四OTT編碼,從中音頻聲道(C)信號和低音音頻聲道(LFE)信號產生第四OTT音頻聲道(C”)信號和第四OTT參數,其中,第四OTT參數包括相應的C和LFE聲道之間的幅值差和/或相似性的信息;第五OTT編碼,從在第二 OTT編碼中產生的音頻聲道(じ)信號和在第一 OTT編碼中產生的音頻聲道(C’ )信號產生第五OTT音頻聲道信號和第五OTT參數,其中,第五OTT參數包括相應的L’和C’聲道之間的幅值差和/或相似性的信息;第六OTT編碼,從在第三OTT編碼中產生的音頻聲道(R’)信號和在第四OTT編碼中產生的音頻聲道(C”)信號產生第六OTT音頻聲道信號和第六OTT參數,其中,第六OTT參數包括相應的R’和C”聲道之間的幅值差和/或相似性的信息;壓縮在第一至第六OTT編碼中產生的參數、在第五OTT編碼中產生的第五OTT音頻聲道信號以及在第六OTT編碼中產生的第六OTT音頻聲道信號,以產生比特流。為了實現至少上面的和/或其他方面和優(yōu)點,本發(fā)明的實施例包括至少ー種包含用于控制實現本發(fā)明的實施例的至少ー個處理部件的計算機可讀代碼的介質。有益效果在根據本發(fā)明的對多聲道音頻信號進行編碼/解碼的設備和方法中,即使單個輸入流也可基于使用的揚聲器配置的類型被選擇性地解碼為合適數量的聲道的音頻聲道信號??蓛H通過對輸入的比特流進行部分地解碼而非全部解碼來實現可伸縮聲道解碼。在可伸縮聲道解碼中,解碼器設置解碼級別,井根據解碼級別輸出音頻聲道信號。因此,可降低解碼的復雜性。
通過下面結合附圖對實施例進行的描述,本發(fā)明的這些和/或其他方面和優(yōu)點將會變得清楚并更易于理解,其中圖I示出傳統(tǒng)的MPEG環(huán)繞解碼器; 圖2示出用于對輸入的音頻聲道信號進行編碼的傳統(tǒng)的編碼器、作為結果的編碼的音頻聲道信號比特流以及用于對編碼的音頻聲道信號進行解碼的傳統(tǒng)的解碼器;圖3示出根據本發(fā)明實施例的多聲道音頻信號解碼系統(tǒng);圖4示出根據本發(fā)明實施例的多聲道音頻信號解碼方法;圖5示出根據本發(fā)明實施例的通過參照各種解碼級別對如圖4所述的下混頻的信號進行解碼的解碼器;圖6示出根據本發(fā)明實施例的多聲道音頻信號解碼系統(tǒng);圖7示出根據本發(fā)明的另ー實施例的多聲道音頻信號解碼方法;圖8示出根據本發(fā)明實施例的多聲道音頻信號解碼系統(tǒng);圖9示出根據本發(fā)明的另ー實施例的多聲道音頻信號解碼方法;圖10示出根據本發(fā)明的另ー實施例的多聲道音頻信號解碼系統(tǒng);圖11示出根據本發(fā)明的另ー實施例的多聲道音頻信號解碼方法;圖12示出根據本發(fā)明的另ー實施例的多聲道音頻信號解碼系統(tǒng);圖13示出根據本發(fā)明實施例的多聲道音頻信號解碼方法;圖14示出根據本發(fā)明實施例的多聲道音頻信號編碼系統(tǒng);圖15示出根據本發(fā)明實施例的多聲道音頻信號編碼方法;圖16示出根據本發(fā)明的另ー實施例的多聲道音頻信號編碼系統(tǒng);圖17示出根據本發(fā)明實施例的多聲道音頻信號編碼方法;圖18示出根據本發(fā)明的另ー實施例的多聲道音頻信號編碼系統(tǒng);圖19示出根據本發(fā)明的另ー實施例的多聲道音頻信號編碼方法;圖20示出根據本發(fā)明的另ー實施例的多聲道音頻信號編碼系統(tǒng);圖21示出根據本發(fā)明的另ー實施例的多聲道音頻信號編碼方法。
具體實施例方式以下,將參照附圖更充分地描述本發(fā)明的示例性實施例,示例性實施例在附圖中示出,其中,相同的標號始終表示相同的部件。以下通過參照附圖描述實施例以解釋本發(fā)明。以下,根據本發(fā)明的不同實施例,即使單個輸入比特流也可基于接收器揚聲器配置的類型被選擇性地解碼為合適數量的聲道的音頻聲道信號。相應地,可僅通過對輸入的比特流進行部分解碼來實現可伸縮聲道解碼。在可伸縮聲道解碼中,解碼器可設置用于設置解碼的等級的解碼級別,井根據解碼級別輸出音頻聲道信號,從而降低解碼復雜性。
圖3示出根據本發(fā)明實施例的多聲道音頻信號解碼系統(tǒng),作為示例,該多聲道音頻信號解碼系統(tǒng)可包括音頻解碼器300和解碼級別產生單元350。解碼級別產生單元350可產生有助于將具有預定數量N的音頻聲道信號和空間信息的比特流解碼為預定數量L(L^N)的音頻聲道信號的解碼級別信息。這里,空間信息可包括在聲道的相應編碼期間關于聲道之間的幅值差和相似性的信息。因此,音頻解碼器300可根據這樣的解碼級別信息選擇性地對比特流進行解碼,并輸出L個音頻聲道信號。圖4示出根據本發(fā)明實施例的多聲道音頻信號解碼方法。在操作400,可產生在將例如包括N個音頻聲道信號和空間信息的比特流選擇性地解碼為L個音頻聲道信號時使用的解碼級別信息。比特流可以是包括有空間信息的下混頻的信號,例如,單聲道信號,通過基于空間信息更改下混頻的信號來最終上混頻為另外的信號。這里,如上面提到的,比特流可包括下混頻的信號和附加素材(material),作為示例,附加素材可被不同地稱為特別參
數或空間提示(cue),其中,附加素材包括關于每個混頻的信號如何彼此區(qū)分或如何與下混頻的單聲道信號區(qū)分開來的信息。通過僅發(fā)送下混頻的信號和附加素材的技術,可減少基本數據量,例如,與每個單獨的左示例聲道和右示例聲道所需的數據相比,對于下混頻的單聲道信號,差不多發(fā)送全部數據的一半。因此,進ー步來說,圖5進ー步示出通過參照各種解碼級別對下混頻的信號進行解碼的解碼器。標號dlO、dll和dl2表示這樣的解碼級別,其中,dlO表示核心解碼級別。圖5示出在dll級別的2至3解碼工具(TTT),以及在dl2級別的I至2解碼工具(OTT)。作為示例,如果dl2級別用于對下混頻的信號解碼,則針對左聲道、右聲道和中聲道的揚聲器,僅左(じ)、右(R’ )和中(C’ )被解碼并輸出。下面參照圖6進ー步討論該操作?;氐綀D4,在操作450,可基于解碼級別對比特流解碼以輸出與適當的解碼級別相應的期望數量的解碼的音頻聲道信號。圖6示出根據本發(fā)明實施例的多聲道音頻信號解碼系統(tǒng),作為示例,該多聲道音頻信號解碼系統(tǒng)可包括 第一 OTT解碼器600、TTT解碼器610、第二 OTT解碼器620、第三OTT解碼器630以及第四OTT解碼器640。多聲道音頻信號解碼系統(tǒng)還可包括例如解碼級別產生單元650。第一OTT解碼器600對包括一個音頻聲道信號(例如,下混頻信號)以及上述空間信息的比特流進行解碼,從而單個音頻聲道信號被上混頻并被輸出為兩個音頻聲道信號。這里,空間信息可包括在聲道的相應編碼期間聲道之間的幅值差以及關于相同聲道之間的相似性的信息。如果在解碼期間使用dll級別,則由第一 OTT解碼器600輸出的兩個音頻聲道可被當作立體聲音頻聲道,例如,選擇性地輸出左揚聲器和右揚聲器。TTT解碼器610將兩個音頻聲道信號解碼為三個音頻聲道信號。這里,由TTT解碼器610輸出的三個音頻聲道信號的三個聲道可被當作例如左音頻聲道L’、右音頻聲道R’以及中音頻聲道C’。當由TTT解碼器610輸出的三個音頻聲道信號被稱為第一、第二和第三聲道信號吋,第二 OTT解碼器620可將第一聲道信號解碼為兩個聲道信號。這兩個聲道信號的兩個聲道可被當作例如左前音頻聲道LF和左環(huán)繞音頻聲道LS。類似地,第三OTT解碼器630可將第二聲道信號解碼為兩個聲道信號。這兩個聲道信號的兩個聲道可被當作例如右前音頻聲道RF和右環(huán)繞音頻聲道RS。同樣,第四OTT解碼器640可將第三聲道信號解碼為兩個聲道信號。這兩個聲道信號的兩個聲道可以是例如中音頻聲道C和低音音頻聲道LFE。在一個實施例中,解碼級別產生單元650可產生在將比特流選擇性地解碼為預定數量的音頻聲道信號時使用的解碼級別信息。作為示例,解碼級別信息可包括第一解碼級別dlO、第二解碼級別dll、第三解碼級別dl2以及第四解碼級別dl3。第一解碼級別dlO可用在包括一個音頻聲道信號的比特流的解碼中,以控制將該比特流解碼為ー個音頻聲道信號進行輸出的選擇級別。第二解碼級別dll可用在包括在第一解碼級別dlO輸出的單個音頻聲道信號的比特流的解碼中,以控制將該比特流解碼為兩個音頻 聲道信號的選擇級別。第三解碼級別dl2可用在包括在第二解碼級別dll輸出的兩個音頻聲道信號的比特流的解碼中,以控制將該比特流解碼為三個音頻聲道信號(例如,L’、R’和C’聲道)的選擇級別。第四解碼級別dl3可用在包括在第三解碼級別dl2輸出的三個音頻聲道信號的比特流的解碼中,以控制將該比特流解碼為例如5. I音頻聲道LF、LS、RF、RS、C和LFE的選擇級別。圖7示出根據本發(fā)明實施例的多聲道音頻信號解碼方法。在操作700,對包括單個音頻聲道信號和空間信息的比特流進行解碼,以輸出兩個音頻聲道信號,其中,空間信息包括例如聲道之間的幅值差和/或關于聲道之間的相似性的信息。所述兩個聲道可被當作例如立體聲音頻聲道。在操作720,可將例如來自操作700的兩個音頻聲道信號解碼為三個音頻聲道信號,其中,例如由TTT解碼器610輸出的所述三個音頻聲道的三個聲道被當作左音頻聲道じ、右音頻聲道1 ’以及中音頻聲道C’。當例如在操作720獲得的三個音頻聲道信號被稱為第一、第二和第三聲道信號時,在操作740,第一、第二和第三聲道信號的每個被解碼為兩個聲道信號,從而輸出5. I聲道信號。這里,第一聲道解碼為的兩個聲道信號的兩個聲道可被當作左前音頻聲道LF和左環(huán)繞音頻聲道LS,第二聲道信號解碼為的兩個聲道信號的兩個聲道可被當作右前音頻聲道RF和右環(huán)繞音頻聲道RS,第三聲道信號解碼為的兩個聲道信號的兩個聲道可被當作中音頻聲道C和低音音頻聲道LFE。因此,為了實現將比特流解碼為預定數量的音頻聲道信號,可能需要解碼級別信息。解碼級別信息可包括第一解碼級別,可用在將包括一個音頻聲道信號的比特流解碼為ー個音頻聲道信號的選擇性的解碼中;第二解碼級別,可用在將包括在第一解碼級別輸出的單個音頻聲道信號的比特流解碼為兩個音頻聲道信號的選擇性的解碼中;第三解碼級另IJ,可用在將包括在第二解碼級別輸出的兩個音頻聲道信號的比特流解碼為三個聲道L’、R’和C’的三個音頻聲道信號的選擇性的解碼中;第四解碼級別,可用在將包括在第三解碼級別輸出的三個音頻聲道信號的比特流解碼為例如5. I音頻聲道LF、LS、RF、RS、C和LFE的信號的選擇性的解碼中。圖8示出根據本發(fā)明實施例的多聲道音頻信號解碼系統(tǒng),作為示例,該多聲道音頻信號解碼系統(tǒng)可包括=TTT解碼器800、第一 OTT解碼器810、第二 OTT解碼器820、第三OTT解碼器830、第四OTT解碼器840以及第五OTT解碼器850。多聲道音頻信號解碼系統(tǒng)還可包括例如解碼級別產生單元860。TTT解碼器800對包括兩個音頻聲道信號和空間信息的比特流進行解碼,以將兩個音頻聲道信號輸出為例如三個音頻聲道信號。這里,空間信息可包括在聲道的相應的編碼期間關于聲道之間的幅值差和相似性的信息。由TTT解碼器800輸出的三個音頻聲道信號的三個聲道可被當作例如左音頻聲道L’、右音頻聲道R’以及中音頻聲道C’。在由TTT解碼器800輸出的三個音頻聲道信號被稱為第一、第二和第三聲道信號時,第一 OTT解碼器810將第一聲道信號解碼為兩個聲道信號,其中,這兩個聲道信號的兩個聲道被當作前左音頻聲道FL’和后左音頻聲道BL。第二 OTT解碼器820可將第二聲道信號解碼為兩個另外的聲道信號,其中,這兩個聲道信號的兩個聲道可被當作前右音頻聲道FR’和后右音頻聲道BR。第三OTT解碼器830可將第三聲道信號解碼為兩個另外的聲道信號,其中,這兩個聲道信號的兩個聲道被當作中音頻聲道C和低音音頻聲道LFE。 第四OTT解碼器840可進ー步將第一 OTT解碼器810的輸出信號中的ー個(即,前左音頻聲道FL’的信號)解碼為兩個另外的聲道信號,其中,由第四OTT解碼器840輸出的這兩個聲道信號的兩個聲道被當作前左音頻聲道FL和前左中音頻聲道FLC。第五OTT解碼器850可進ー步將第二 OTT解碼器820的輸出信號中的ー個(即,前右音頻聲道FR’的信號)解碼為兩個另外的聲道信號,其中,由第五OTT解碼器850輸出的這兩個聲道信號的兩個聲道被當作前右音頻聲道FR和前右中音頻聲道FRC。解碼級別產生單元860可產生在將比特流選擇性地解碼為預定數量的音頻聲道信號時使用的解碼級別信息。這里,作為示例,解碼級別信息可包括第一解碼級別dlO、第ニ解碼級別dll、第三解碼級別dl2以及第四解碼級別dl3。第一解碼級別dlO可在將包括兩個音頻聲道信號的比特流選擇性地解碼為兩個音頻聲道信號時使用。第二解碼級別dll可在將包括在第一解碼級別dlO輸出的兩個音頻聲道信號的比特流選擇性地解碼為例如三個音頻聲道L’、R’和C’的信號時使用。第三解碼級別dl2可在將包括在第二解碼級別dl I輸出的三個音頻聲道信號的比特流選擇性地解碼為例如5. I音頻聲道FL’、BL、FR’、BR、C和LFE的信號時使用。第四解碼級別dl3可在例如將FL’聲道信號選擇性地解碼為兩個音頻聲道FL和FLC的信號以及將FR’聲道信號選擇性地解碼為兩個音頻聲道FR和FRC的信號時使用,從而輸出總共7. I聲道信號。圖9示出根據本發(fā)明實施例的多聲道音頻信號解碼方法。在操作900,對包括兩個音頻聲道信號和空間信息的比特流進行解碼,以輸出三個音頻聲道信號,其中,空間信息可包括在聲道的相應的編碼期間關于聲道之間的幅值差和相似性的信息。所述三個音頻聲道信號的三個聲道可被當作例如左音頻聲道L’、右音頻聲道R’和中音頻聲道C’。當在操作900獲得的三個音頻聲道信號被稱為第一、第二和第三聲道信號時,在操作920,可將第一、第二和第三聲道信號中的每個進一歩解碼為兩個另外的聲道信號,以輸出5. I聲道信號。第一聲道解碼為的兩個聲道信號的兩個聲道可被當作前左音頻聲道FL’和后左音頻聲道BL,第二聲道信號解碼為的兩個聲道信號的兩個聲道可被當作前右音頻聲道FR’和后右音頻聲道BR,第三聲道信號解碼為的兩個聲道信號的兩個聲道可被當作中音頻聲道C和低音音頻聲道LFE。在操作940,5. I聲道的兩個聲道的信號的每個被進ー步解碼,以輸出7. I聲道的信號。在操作940中的兩個聲道信號被解碼為的信號的聲道可被當作例如前左音頻聲道FL、前左中音頻聲道FLC、前右音頻聲道FR以及前右中音頻聲道FRC。為了實現上述將比特流解碼為預定數量的音頻聲道信號,可使用例如由解碼器生成的解碼級別信息,以便可基于適當的解碼級別對音頻聲道信號進行解碼并輸出。在本實施例中,解碼級別信息可包括第一解碼級別dlO,可在將包括兩個音頻聲道信號的比特流選擇性地解碼為兩個音頻聲道信號時使用;第二解碼級別dll,可在將包括在第一解碼級別dlO輸出的兩個音頻聲道信號的比特流選擇性地解碼為例如三個音頻聲道L’、R’和C’的信號時使用;第三解碼級別dl2,可在將包括三個音頻聲道信號的比特流選擇性地解碼為5. I音頻聲道LF、LS、RF、RS、C和LFE的信號時使用;第四解碼級別dl3,可在將FL’聲道信號選擇性地解碼為兩個音頻聲道FL和FLC的信號以及將FR’聲道信號選擇性地解碼為兩個聲道信號FR和FRC的信號以輸出總共7. I聲道信號時使用。圖10示出根據本發(fā)明實施例的多聲道音頻信號解碼系統(tǒng),作為示例,該多聲道音頻信號解碼系統(tǒng)可包括=TTT解碼器1000、第一 OTT解碼器1010、第二 OTT解碼器1020、第三OTT解碼器1030、第四OTT解碼器1040以及第五OTT解碼器1050。多聲道音頻信號解碼系統(tǒng)還可包括例如解碼級別產生單元1060?!TT解碼器1000可對包括兩個音頻聲道信號和空間信息的比特流進行解碼,以從兩個音頻聲道信號輸出三個音頻聲道信號。這里,空間信息可包括在聲道的相應的編碼期間關于聲道之間的幅值差和相似性的信息。由TTT解碼器1000輸出的三個音頻聲道信號的三個聲道可被當作例如左音頻聲道L’、右音頻聲道R’以及中音頻聲道C’。在由TTT解碼器1000輸出的三個音頻聲道信號被稱為第一、第二和第三聲道信號時,第一 OTT解碼器1010可將第一聲道信號解碼為兩個聲道信號。這兩個聲道信號的兩個聲道可被當作例如前左音頻聲道FL和后左音頻聲道BL。第二 OTT解碼器1020可將第二聲道信號解碼為兩個聲道信號,其中,這兩個聲道信號的兩個聲道可被當作例如前右音頻聲道FR和后右音頻聲道BR。類似地,第三OTT解碼器1030可將第三聲道信號解碼為兩個聲道信號,其中,這兩個聲道信號的兩個聲道被當作例如中音頻聲道C”和低音音頻聲道LFE。第四OTT解碼器1040可進ー步將第三OTT解碼器1030的輸出信號中的ー個(例如,中音頻聲道C”的信號)解碼為兩個聲道信號,其中,由第四OTT解碼器1040輸出的這兩個聲道信號的兩個聲道被當作例如前中音頻聲道FC’和中音頻聲道C。第五OTT解碼器1050可進ー步將第四OTT解碼器1040的輸出信號中的ー個(例如,FC’聲道信號)解碼為兩個聲道信號,其中,由第五OTT解碼器1050輸出的這兩個聲道信號的兩個聲道被當作例如前左中音頻聲道FLC和前右中音頻聲道FRC。在一個實施例中,解碼級別產生單元1060可產生可在將比特流選擇性地解碼為預定數量的音頻聲道信號期間使用的解碼級別信息。作為示例,解碼級別信息可包括第一解碼級別dlO、第二解碼級別dll、第三解碼級別dl2以及第四解碼級別dl3。這里,第一解碼級別dlO可在將包括兩個音頻聲道信號的比特流解碼為兩個音頻聲道信號的選擇性解碼期間使用,第二解碼級別dll可在將包括在第一解碼級別dlO輸出的兩個音頻聲道信號的比特流選擇性地解碼為三個音頻聲道L’、R’和C’的信號期間使用,第三解碼級別dl2可在將包括在第二解碼級別dl I輸出的三個音頻聲道信號的比特流選擇性地解碼為5. I音頻聲道FL、BL、FR、BR、C”和LFE的信號期間使用,第四解碼級別dl3可在將FC’聲道信號選擇性地解碼為兩個聲道FLC和FRC信號期間使用,從而輸出總共7. I
聲道信號。圖11示出根據本發(fā)明實施例的多聲道音頻信號解碼方法。在操作1100,對包括兩個音頻聲道信號和空間信息的比特流進行解碼,以從兩個音頻聲道信號輸出三個音頻聲道信號,其中,空間信息包括聲道之間的幅值差和關于聲道之間的相似性的信息。所述三個音頻聲道信號的三個聲道可被當作例如左音頻聲道L’、右音頻聲道R’和中音頻聲道C’。當在操作1100獲得的三個音頻聲道信號被稱為第一、第二和第三聲道信號時,在操作1120,可將第一、第二和第三聲道信號中的每個解碼為兩個聲道信號,以輸出5. I聲道信號。更具體地說,第一聲道解碼為的兩個聲道信號的兩個聲道可被當作前左音頻聲道FL和后左音頻聲道BL,第二聲道信號解碼為的兩個聲道信號的兩個聲道可被當作前右音頻聲道FR和后右音頻聲道BR,第三聲道信號解碼為的兩個聲道信號的兩個聲道可被當作中音頻聲道C”和低音音頻聲道LFE。 在操作1140,在操作1120輸出的5. I聲道的兩個聲道的信號可被進ー步解碼為兩個聲道信號,其中,這兩個聲道信號的聲道被當作例如前中音頻聲道FC’和中音頻聲道C。在操作1160,在操作1140輸出的兩個聲道信號中的一個例如可被解碼為兩個聲道信號,從而輸出7. I聲道信號,其中,這兩個聲道信號的聲道被當作例如前左中音頻聲道FLC和前右中音頻聲道FRC。因此,根據本實施例,為了實現上述將比特流選擇性解碼為預定數量的音頻聲道信號,可使用由解碼器生成的解碼級別信息,以便基于解碼級別輸出音頻聲道信號。解碼級別信息可包括第一解碼級別dlO,可在將包括兩個音頻聲道信號的比特流選擇性地解碼為兩個音頻聲道信號期間使用;第二解碼級別dl I,可在將包括在第一解碼級別dlO輸出的兩個音頻聲道信號的比特流選擇性地解碼為三個音頻聲道L’、R’和C’的信號期間使用;第三解碼級別dl2,可在將包括三個音頻聲道信號的比特流選擇性地解碼為5. I音頻聲道FL、BL、FR、BR、C”和LFE的信號期間使用;第四解碼級別dl3,可在將FC’聲道信號選擇性地解碼為兩個音頻聲道FLC和FRC的信號期間使用,從而輸出總共7. I聲道信號。圖12示出根據本發(fā)明實施例的多聲道音頻信號解碼系統(tǒng),作為示例,該多聲道音頻信號解碼系統(tǒng)可包括 第一 OTT解碼器1200、第二 OTT解碼器1210、第三OTT解碼器1220、第四OTT解碼器1230、第五OTT解碼器1240以及第六OTT解碼器1250。在實施例中,多聲道音頻信號解碼系統(tǒng)還可包括例如解碼級別產生單元1260。響應于包括兩個音頻聲道信號(例如,第一和第二音頻聲道信號)和空間信息的比特流,第一 OTT解碼器1200可將第一音頻聲道信號解碼為兩個音頻聲道信號。這里,空間信息可包括在聲道的相應的編碼期間關于聲道之間的幅值差以及聲道之間的相似性的信息。由第一 OTT解碼器1200輸出的兩個音頻信號的聲道可被當作例如左音頻聲道L’和中音頻聲道C’。第二 OTT解碼器1210可對比特流進行解碼,以輸出兩個音頻聲道信號作為第二音頻聲道信號。由第二 OTT解碼器1210輸出的兩個音頻聲道信號的聲道可被作為右音頻聲道R’和中音頻聲道C”。第三OTT解碼器1220可將由第一 OTT解碼器1200輸出的兩個聲道信號中的ー個(例如,L’聲道信號)解碼為另外兩個聲道信號。由第三OTT解碼器1220輸出的兩個音頻聲道信號的兩個聲道可被作為例如前左音頻聲道FL和后左音頻聲道BL。由第二 OTT解碼器1210輸出的兩個音頻聲道信號被稱為第一和第二聲道信號時,第四OTT解碼器1230可將第一聲道信號解碼為兩個聲道信號,其中,這兩個聲道信號的兩個聲道可被當作前右音頻聲道FR和后右音頻聲道BR。第五OTT解碼器1240可將第二聲道信號解碼為兩個聲道信號,其中,這兩個聲道信號的兩個聲道被當作中音頻聲道C和低音音頻聲道LFE。第六OTT解碼器1250可將第一 OTT解碼器1200的兩個輸出信號中的另ー輸出信號(例如,C’聲道信號)解碼為兩個聲道信號,其中,由第六OTT解碼器1250輸出的這兩個聲道信號的兩個聲道是前左中音頻聲道FLC和前右中音頻聲道FRC。在實施例中,解碼級別產生單元1260可產生可在將比特流選擇性地解碼為預定數量的音頻聲道信號時使用的解碼級別信息。作為示例,解碼級別信息可包括第一解碼級 別dlO、第二解碼級別dll、第三解碼級別dl2以及第四解碼級別dl3。這里,第一解碼級別dlO可在將包括兩個音頻聲道信號的比特流選擇性地解碼為兩個音頻聲道信號期間使用。第二解碼級別dll可在將包括在第一解碼級別dlO輸出的兩個音頻聲道信號的比特流選擇性地解碼為例如四個音頻聲道L’、C’、R’和C”的信號期間使用。第三解碼級別dl2可在例如將L’音頻聲道信號選擇性地解碼為兩個音頻聲道FL和BL的信號期間、將要被解碼的R’音頻聲道信號被選擇性地解碼為兩個音頻聲道FR和BR的信號期間以及將要被解碼的C”音頻聲道信號被選擇性地解碼為兩個聲道信號C和LFE的信號期間使用。第四解碼級別dl3可在將C’聲道信號選擇性地解碼為兩個聲道FLC和FRC信號期間使用。圖13示出根據本發(fā)明實施例的多聲道音頻信號解碼方法。在操作1300,對包括兩個音頻聲道信號(例如,第一音頻聲道信號和第二音頻聲道信號)和空間信息的比特流進行解碼,以將第一音頻聲道信號輸出為兩個音頻聲道信號(例如,L’和C’音頻聲道信號),其中,空間信息可包括在聲道的相應編碼期間聲道之間的幅值差和聲道之間的相似性的信息。這里,L’和C’分別表示左音頻聲道和中音頻聲道。此外,在操作1300,可對比特流解碼,以便將第二音頻聲道信號輸出為兩個音頻聲道信號例如R’和C”音頻聲道信號,其中,R’和C”分別表示右音頻聲道和中音頻聲道。在操作1320,在操作1300獲得的L’信號可被解碼為前左音頻聲道FL和后左音頻聲道BL的信號。在操作1340,第一音頻信號被解碼為前右音頻聲道(FR)信號和后右音頻聲道(BR)信號。在操作1360,第二聲道(C”)可被解碼為中音頻聲道(C)信號和低音音頻聲道(LFE)信號。此外,在操作1380,在操作1300獲得的C’聲道信號可被解碼為前左中音頻聲道(FLC)信號和前右中音頻聲道(FRC)信號。在該實施例中,為了實現將比特流選擇性地解碼為預定數量的音頻聲道信號,可使用由解碼器生成的解碼級別信息,以便基于解碼級別輸出音頻聲道信號。解碼級別信息可包括第一解碼級別dlO,可在將包括兩個音頻聲道信號的比特流選擇性地解碼為兩個音頻聲道信號期間使用;第二解碼級別dl 1,可在將在第一解碼級別dlO輸出的兩個音頻聲道信號選擇性地解碼為四個音頻聲道L’、R’、C’、和C”的信號期間使用;第三解碼級別dl2,可在將L’音頻聲道信號選擇性地解碼為FL和BL音頻聲道信號期間、將R’音頻聲道信號選擇性地解碼為FR和BR音頻聲道信號期間以及將C”音頻聲道信號選擇性地解碼為C和LFE音頻聲道信號期間使用;第四解碼級別dl3,可在將C’聲道信號選擇性地解碼為FLC和FRC音頻聲道信號期間使用。在上面的實施例中,可使用時域瞬時整形(TP, temporal shaping)和瞬時包跡整形(TES, temporal envelope shaping)以獲得中間輸出。此外,姆個解碼級別可大于三樹深(tree depth)。例如,以五個聲道編碼的MPEG環(huán)繞數據可被解碼為被建立樹結構的7個揚聲器播放。根據上面所述,現在將進一歩描述根據本發(fā)明實施例的對這樣的多聲道音頻信號進行編碼的系統(tǒng)、介質和方法。圖14示出根據本發(fā)明實施例的多聲道音頻信號編碼系統(tǒng),該多聲道音頻信號編碼系統(tǒng)可包括例如第一 OTT編碼器1400、第二 OTT編碼器1410、第三 OTT編碼器1420、TTT編碼器1430、第四OIT編碼器1440以及比特流產生單元1450。第一 OTT編碼器1400可使用左前音頻聲道(LF)信號和左環(huán)繞音頻聲道(LS)信號產生第一 OTT音頻聲道(L’)信號和第一 OTT參數(也可能被稱為空間信息或空間提不),其中,第一 OTT參數可包括關于相應的聲道之間的幅值差和相似性的信息。第二 OTT編碼器1410可使用右前音頻聲道(RF)信號和右環(huán)繞音頻聲道(RS)信號產生第二 OTT音頻聲道(R’ )信號和第二 OTT參數,其中,第二 OTT參數可包括相應的聲道之間的幅值差和關于相應的聲道之間的相似性的信息。第三OTT編碼器1420可使用中音頻聲道(C)信號和低音音頻聲道(LFE)信號產生第三OTT音頻聲道(C’ )信號和第三OTT參數,其中,第三OTT參數可包括聲道的幅值之間的幅值差和關于相應的聲道之間的相似性的信息。此外,TTT編碼器1430可使用分別由第一 OIT編碼器1400、第二 OIT編碼器1410和第三OIT編碼器1420輸出的L’、R’和C,聲道信號產生TTT音頻聲道信號和TTT參數,其中,所述TTT參數可包括相應的聲道之間的幅值差和關于相應的聲道之間的相似性的信息。第四OTT編碼器1440可使用由TTT編碼器1430輸出的TTT音頻聲道信號產生第四OTT音頻聲道信號和第四OTT參數,其中,第四OTT參數可包括相應的聲道之間的幅值差和關于相應的聲道之間的相似性的信息。然后,比特流產生単元1450可壓縮由第一至第四OTT編碼器1400、1410、1420和1440產生的OIT參數、由TTT編碼器1430產生的TTT參數以及由第四OTT編碼器1440產生的音頻信號,以產生以后可基于這樣的編碼的音頻信號和壓縮的參數信息被解碼的比特流。圖15示出根據本發(fā)明實施例的多聲道音頻信號編碼方法。在操作1500,可從左前音頻聲道(LF)信號和左環(huán)繞音頻聲道(LS)信號產生第一 OTT參數和第一 OTT音頻聲道(じ)信號。在操作1510,可從右前音頻聲道(RF)信號和右環(huán)繞音頻聲道(RS)信號產生第二OTT參數和第二 OTT音頻聲道(R’ )信號。在操作1520,可從中音頻聲道(C)信號和低音音頻聲道(LFE)信號產生第三OTT參數和第三OTT音頻聲道(C’ )信號。在操作1530,還可從分別在操作1500、1510和1520產生的L’、R’和C’聲道信號產生TTT參數和TTT (立體聲)音頻聲道信號。在操作1540,可從在操作1530產生的立體聲音頻聲道信號產生第四OTT參數和第四OTT音頻聲道(下混頻的單聲道)信號。在操作1550,壓縮在操作1500、1510、1520、1530和1540產生的參數以及在操作1540產生的單聲道的下混頻音頻聲道信號,以產生比特流。圖16示出根據本發(fā)明實施例的多聲道音頻信號編碼系統(tǒng),該多聲道音頻信號編碼系統(tǒng)可包括例如第一 OTT編碼器1600、第二 OTT編碼器1610、第三OTT編碼器1620、第四OIT編碼器1630、第五OIT編碼器1640、TTT編碼器1650、以及比特流產生單元1660。第一 OTT編碼器1600可使用前左音頻聲道(FL)信號和前左中音頻聲道(FLC)信號產生第一 OTT音頻聲道(FL’ )信號和第一 OTT參數,其中,第一 OTT參數可包括關于相應的聲道之間的幅值差和相似性的信息。第二 OTT編碼器1610可使用前右音頻聲道(FR)信號和前右中音頻聲道(FRC)信號產生第二 OTT音頻聲道(FR’ )信號和第二 OTT參數,其 中,第二 OTT參數可包括關于相應的聲道之間的幅值差和相似性的信息。第三OTT編碼器1620可使用由第一 OTT編碼器1600產生的FL’音頻聲道信號和后左音頻聲道(BL)信號進一步產生第三OTT音頻聲道(L’ )信號和第三OTT參數,其中,第三OTT參數可包括關于相應的聲道之間的幅值差和相似性的信息。第四OTT編碼器1630可使用由第二 OTT編碼器1610產生的FR’音頻聲道信號和后右音頻聲道(BR)信號產生第四OTT音頻聲道(R’)信號和第四OTT參數,其中,第四OTT參數可包括關于相應的聲道之間的幅值差和相似性的信息。第五OTT編碼器1640可使用中音頻聲道(C)信號和低音音頻聲道(LFE)信號產生第五OTT音頻聲道(C’ )信號和第五OTT參數,其中,第五OTT參數可包括關于相應的聲道之間的幅值差和相似性的信息。TTT編碼器1650可使用分別由第三OTT編碼器1620、第四OIT編碼器1630和第五OTT編碼器1640輸出的L’、R’和C’聲道信號產生TTT音頻聲道信號和TTT參數,其中,所述TTT參數可包括相應的聲道之間的聲道的幅值之差和相似性的信息。 然后,比特流產生單元1660可壓縮由第一至第五OTT編碼器1600至1640以及ITT編碼器1650產生的參數以及由TTT編碼器1650產生的TTT音頻聲道信號,以產生比特流。圖17示出根據本發(fā)明實施例的多聲道音頻信號編碼方法。在操作1700,可從FL音頻聲道信號和FLC音頻聲道信號產生第一 OTT音頻聲道(FL’)信號和第一 OTT參數。在操作1710,可從FR音頻聲道信號和FRC音頻聲道信號產生第二 OTT音頻聲道(FR’ )信號和第二 OTT參數。在操作1720,可使用在操作1700產生的FL’音頻聲道信號和BL音頻聲道信號產生第三OTT音頻聲道(L’ )信號和第三OTT參數。此外,在操作1730,可從在操作1710產生的FR’音頻聲道信號和BR音頻聲道信號產生第四OTT音頻聲道(R’)信號和第四OTT參數。在操作1740,可從C音頻聲道信號和LFE音頻聲道信號產生第五OTT音頻聲道(C’ )信號和第五OTT參數。在操作1750,可從分別在操作1720、1730和1740產生的L’、R’和C’聲道信號產生TTT(立體聲)音頻聲道信號和TTT參數。然后在操作1760,可壓縮在操作1700、1710、1720、1730、1740和1750產生的參數以及在操作1750產生的立體聲音頻聲道信號,以產生相應的比特流。
圖18示出根據本發(fā)明實施例的多聲道音頻信號編碼系統(tǒng),該多聲道音頻信號編碼系統(tǒng)可包括例如第一 OTT編碼器1800、第二 OTT編碼器1810、第三OTT編碼器1820、第四OIT編碼器1830、第五OIT編碼器1840、TTT編碼器1850、以及比特流產生單元1860。第一 OTT編碼器1800可使用前左中音頻聲道(FLC)信號和前右中音頻聲道(FRC)信號產生第一 OTT音頻聲道(FC’)信號和第一 OTT參數,其中,第一 OTT參數可包括關于相應的聲道之間的幅值差和相似性的信息。第二 OTT編碼器1810可使用由第一 OTT編碼器1800輸出的FC’音頻聲道信號和中音頻聲道(C)信號產生第二 OTT音頻聲道(C”)信號和第二 OTT參數,其中,第二 OTT參數可包括相應的聲道之間的幅值差和關于相應的聲道之間的相似性的信息。第三OTT編碼器1820可使用前左音頻聲道(FL)信號和后左音頻聲道(BL)信號產生第三OTT音頻聲道(L’ )信號和第三OTT參數,其中,第三OTT參數可包括關于相應的 聲道之間的幅值差和相似性的信息。第四OTT編碼器1830可使用FR音頻聲道信號和后右音頻聲道(BR)信號產生第四OTT音頻聲道(R’)信號和第四OTT參數,其中,第四OTT參數可包括關于相應的聲道之間的幅值差和相似性的信息。第五OTT編碼器1840可使用由第ニ OTT編碼器1810輸出的C”音頻聲道信號和低音音頻聲道(LFE)信號產生第五OTT音頻聲道(C’ )信號和第五OTT參數,其中,第五OTT參數可包括關于相應的聲道之間的幅值差和相似性的信息。TTT編碼器1850可使用分別由第三OTT編碼器1820、第四OIT編碼器1830和第五OTT編碼器1840輸出的L’、R’和C’聲道信號產生TTT音頻聲道信號和TTT參數,其中,所述TTT參數可包括關于相應的聲道之間的幅值差和相似性的信息。然后,比特流產生單元1860可壓縮由第一至第五OTT編碼器1800至1840以及TTT編碼器1850產生的參數以及由TTT編碼器1850產生的TTT音頻聲道信號,以產生比特流。圖19示出根據本發(fā)明實施例的多聲道音頻信號編碼方法。在操作1900,可從FLC音頻聲道信號和FRC音頻聲道信號產生第一 OTT音頻聲道(FC’)信號和第一 OTT參數。在操作1910,可從在操作1900產生的FC’音頻聲道信號和C音頻聲道信號產生第二 OTT音頻聲道(C” )信號和第二 OTT參數。在操作1920,可從FL音頻聲道信號和BL音頻聲道信號產生第三OTT音頻聲道(L’ )信號和第三OTT參數。在操作1930,可從FR音頻聲道信號和BR音頻聲道信號產生第四OTT音頻聲道(R’)信號和第四OTT參數。在操作1940,可從在操作1910產生的C”音頻聲道信號和LFE音頻聲道信號產生第五OTT音頻聲道(C’ )信號和第五OTT參數。在操作1950,可從分別在操作1920、1930和1940產生的L’、R’和C’聲道信號產生TTT (立體聲)音頻聲道信號和TTT參數,在操作1960,可壓縮在操作1900至1950產生的參數和在操作1950產生的立體聲音頻聲道信號,以產生比特流。圖20示出根據本發(fā)明的實施例的多聲道音頻信號編碼系統(tǒng),該多聲道音頻信號編碼系統(tǒng)可包括例如第一 OTT編碼器2000、第二 OTT編碼器2010、第三OTT編碼器2020、第四OTT編碼器2030、第五OTT編碼器2040、第六OTT編碼器2050、以及比特流產生単元2060。第一 OTT編碼器2000可使用前左中音頻聲道(FLC)信號和前右中音頻聲道(FRC)信號產生第一 OTT音頻聲道(C’ )信號和第一 OTT參數,其中,第一 OTT參數可包括關于相應的聲道之間的幅值差和相似性的信息。第二 OTT編碼器2010可使用前左音頻聲道(FL)信號和后左音頻聲道(BL)信號產生第二 OTT音頻聲道(L’)信號和第二 OTT參數,其中,第ニ OTT參數可包括關于相應的聲道之間的幅值差和相似性的信息。第三OTT編碼器2020可使用前右音頻聲道(FR)信號和后右音頻聲道(BR)信號產生第三OTT音頻聲道(R’ )信號和第三OTT參數,其中,第三OTT參數可包括關于相應的聲道之間的幅值差和相似性的信
o第四OTT編碼器2030可使用中音頻聲道(C)信號和低音音頻聲道(LFE)信號產生第四OTT音頻聲道(C”)信號和第四OTT參數,其中,第四OTT參數可包括關于相應的聲道之間的幅值差和相似性的信息。第五OTT編碼器2040可使用由第二 OTT編碼器2010輸出的じ音頻聲道信號和由第一 OTT編碼器2000輸出的C’音頻聲道信號產生第五OTT音頻聲道信號和第五OTT參數,其中,第五OTT參數可包括關于相應的聲道之間的幅值差和相似性的信息。第六OTT編碼器2050可使用由第三OTT編碼器2020輸出的R’音頻聲道信號和由第四OTT編碼器2030輸出的C”音頻聲道信號產生第六OTT音頻聲道信號和第六OTT 參數,其中,第六OTT參數可包括關于相應的聲道之間的幅值差和相似性的信息。然后,比特流產生單元2060可壓縮由第一至第六OTT編碼器2000至2050產生的參數、由第五OTT編碼器2040產生的第五OTT音頻聲道信號以及由第六OTT編碼器2050產生的第六OTT音頻聲道信號,以產生比特流。圖21示出根據本發(fā)明的實施例的多聲道音頻信號編碼方法。在操作2100,可從FLC音頻聲道信號和FRC音頻聲道信號產生第一 OTT音頻聲道(C’)信號和第一 OTT參數。在操作2110,可從FL音頻聲道信號和BL音頻聲道信號產生第二 OTT音頻聲道(L’ )信號和第二 OTT參數。在操作2120,可從FR音頻聲道信號和BR音頻聲道信號產生第三OTT音頻聲道(R’ )信號和第三OTT參數。在操作2130,可從C音頻聲道信號和LFE音頻聲道信號產生第四OTT音頻聲道(C”)信號和第四OTT參數。在操作2140,可從在操作2110產生的L’音頻聲道信號和在操作2100產生的C’音頻聲道信號產生第五OTT音頻聲道信號和第五OTT參數。在操作2150,可從在操作2120產生的R’音頻聲道信號和在操作2130產生的C”音頻聲道信號產生第六OTT (立體聲)音頻聲道信號和第六OTT參數。在操作2160,可壓縮在操作2100至2140產生的參數、在操作2140產生的第五OTT音頻聲道信號以及在操作2150產生的立體聲音頻聲道信號,以產生比特流。除了上面所述的實施例,本發(fā)明的實施例還可通過介質(例如,計算機可讀介質)上的計算機可讀代碼/指令被實施,以控制至少ー個處理部件來實施上述任何實施例。所述介質可對應于允許計算機可讀代碼的的存儲和/或傳輸的任何介質。計算機可讀代碼可以各種方式在介質上被記錄/傳輸,介質的示例包括例如磁存儲介質(例如,ROM、軟盤、硬盤等)、光記錄介質(例如,CD-ROM或DVD)以及諸如通過互聯(lián)網的載波的存儲/傳輸介質。這里,介質還可以是根據本發(fā)明實施例的諸如作為結果的信號或比特流的信號。介質還可以是分布式網絡,從而計算機可讀代碼以分布式方式存儲/傳輸和執(zhí)行。此外,僅作為示例,所述處理部件可包括處理器或計算機處理器,處理部件可以分布和/或包括在單個裝置中。除了上面所述,盡管從系統(tǒng)的角度解釋了實施例,但是相應的實施例可同樣在設備中被實施。盡管已經顯示和描述了本發(fā)明的幾個實施例,但是本領域的技術人員應該理解,在本發(fā)明的原理和精神的情況下,可以對這些實施例進行改變,本發(fā)明的范圍由權利要求及其等同物限定?!?br>
權利要求
1. 一種多聲道音頻信號解碼方法,包括接收具有預定數量N的編碼的音頻聲道信號和空間信息的比特流;通過使用樹結構基于空間信息將比特流解碼為數量L的音頻聲道信號,其中,將比特流解碼為數量L的音頻聲道信號的步驟包括將包括兩個音頻聲道信號和空間信息的比特流解碼為第一、第二和第三聲道信號,將第一聲道信號解碼為第一兩個聲道信號,將第二聲道信號解碼為第二兩個聲道信號,將第三聲道信號解碼為第三兩個聲道信號,將第一兩個聲道信號中的一個聲道信號解碼為第四兩個聲道信號,將第二兩個聲道信號中的一個聲道信號解碼為第五兩個聲道信號。
全文摘要
一種對多聲道音頻信號進行編碼/解碼的系統(tǒng)、介質和方法,所述系統(tǒng)包括解碼級別產生單元,產生用于將包括一定數量的音頻聲道信號和空間信息的比特流解碼為一定數量的音頻聲道信號的解碼級別信息,其中,所述空間信息包括關于相應的聲道之間的幅值差和/或相似性的信息;音頻解碼器,根據解碼級別信息對比特流進行解碼。因此,即使單個輸入流也可基于使用的揚聲器配置的類型被選擇性地解碼為合適數量的聲道??赏ㄟ^對輸入的比特流進行部分地解碼來實現可伸縮聲道解碼。在可伸縮聲道解碼中,解碼器可設置解碼級別,并根據解碼級別輸出音頻聲道信號,從而可降低解碼復雜性。
文檔編號H03M7/30GK102779514SQ20121019119
公開日2012年11月14日 申請日期2006年11月21日 優(yōu)先權日2005年11月21日
發(fā)明者吳殷美, 苗磊, 金重會 申請人:三星電子株式會社