用相位信息和殘差信息進(jìn)行編碼/解碼的設(shè)備和方法
【專利說明】
[0001] 本申請是向中國知識產(chǎn)權(quán)局提交的申請日為2010年10月25日、申請?zhí)枮?201080047876. 1、發(fā)明名稱為"用相位信息和殘差信息進(jìn)行編碼/解碼的設(shè)備和方法"的申 請的分案申請。
技術(shù)領(lǐng)域
[0002] 一個或多個實施例設(shè)及一種用于對多個聲道信號進(jìn)行編碼的編碼設(shè)備和對多個 聲道信號進(jìn)行解碼的解碼設(shè)備及其一個或多個方法,更具體地講,設(shè)及一種用于基于相位 信息和殘差信號對多個聲道信號進(jìn)行編碼的編碼設(shè)備和對多個聲道信號進(jìn)行解碼的解碼 設(shè)備及其一個或多個方法。
【背景技術(shù)】
[0003] 通常,多聲道音頻編碼可包括波形多聲道音頻編碼和參數(shù)多聲道音頻編碼。僅作 為波形多聲道音頻編碼的示例,可使用運動圖像專家組(MPE0-2運動補償(MC)音頻編碼、 高級音頻編碼(AAC)MC音頻編碼、位片算術(shù)編碼/應(yīng)用可視化系統(tǒng)度SAC/AV巧MC音頻編碼 等。僅作為示例,波形多聲道音頻編碼可基于輸入到原始編碼器的五個聲道信號(注意到, 立體聲或7個聲道信號W及可選擇的聲道信號數(shù)量同樣是可用的),從解碼器輸出來自發(fā) 送的單個或立體編碼信號的五個聲道信號。
[0004] 例如,參數(shù)多聲道音頻編碼可包括MPEG環(huán)繞聲編碼,例如,在對發(fā)送的一個或兩 個聲道的上混合之后輸出用于表示六個或八個多聲道的一個或兩個輸入聲道。
[0005] 通過使用示例性配置,可使用參數(shù)立體聲(P巧技術(shù)對單聲道信號或立體聲信號 進(jìn)行編碼。另外,參數(shù)立體聲技術(shù)可對輸入立體聲信號進(jìn)行下混合,W產(chǎn)生單聲道信號,提 取指示立體聲信號的邊信息的立體聲參數(shù),并通過對產(chǎn)生的單聲道信號和提取的立體聲參 數(shù)進(jìn)行編碼來對立體聲信號進(jìn)行編碼。然后,解碼器可基于解碼的立體聲參數(shù)對解碼的單 聲道信號進(jìn)行上混合。
[0006] 作為在運種情況下使用的立體聲參數(shù)的示例,基于立體聲信號中包括的至少兩個 聲道信號的能量級別指示強度差的聲道間強度差(IID)或聲道電平差(CLD)、基于立體聲 信號中包括的至少兩個聲道信號的波形的相似度指示兩個聲道信號之間的相關(guān)度的聲道 間相干性(ICC)或聲道間相關(guān)性(ICC)、指示立體聲信號中包括的至少兩個聲道信號之間 的相位差的聲道間相位差(IPD)、基于單聲道信號指示至少兩個聲道信號之間的相位差如 何分布的整體相位差(OPD)等可被提供。
[0007] 運里,為了對多聲道進(jìn)行編碼的目的,可擴展參數(shù)立體聲技術(shù),即,多個單聲道或 立體聲信號可被分級地產(chǎn)生,用于每級下混合的各參數(shù)信息可被產(chǎn)生。針對單層的上混合, MPEG環(huán)繞聲技術(shù)例如可基于1到2 ( -到二,0TT)模塊和2-3 (二到STTT)模塊執(zhí)行編碼 的單聲道或立體聲信號到多個聲道的上混合。如注意到的并僅作為示例,可WW分級的方 式(例如,樹結(jié)構(gòu))執(zhí)行多個運種模塊,W使5個或更多個輸入多信號可被最終下混合為單 個單聲道或立體聲信號,然后被最終上混合為比編碼的單個單聲道或立體聲信號更多的多 信號。例如,五個或屯個多信號可被編碼器下混合為一個單聲道或立體聲信號,并最終被解 碼器上混合回五個或屯個多信號。
[0008] 當(dāng)MPEG環(huán)繞聲編碼方案通過用參數(shù)表示多個聲道信號來對多個聲道信號進(jìn)行 編碼時,即使比特率增加,多個聲道信號從各參數(shù)對所有原始信號不正確地解碼,即,各參 數(shù)可能對于從下混合的信號適當(dāng)?shù)亟獯a成上混合的多個聲道信號,無法提供足夠正確的信 息。因此,本發(fā)明人發(fā)現(xiàn)了運樣的期望:當(dāng)用參數(shù)表示多個聲道信號時,將多個聲道信號解 碼成與原始信號接近的方法。
【發(fā)明內(nèi)容】
[0009]根據(jù)一個或多個實施例的一方面,可提供一種編碼設(shè)備,包括:參數(shù)編碼器,提取 與N個聲道信號的相位信息相關(guān)的一個或多個空間參數(shù),并對提取的一個或多個空間參數(shù) 進(jìn)行編碼;下混合單元,基于提取的一個或多個空間參數(shù)將N個聲道信號下混合成M個聲道 信號;殘差信號編碼器,基于下混合的M個聲道信號來對與N個聲道信號相關(guān)的殘差信號進(jìn) 行編碼;聲道信號編碼器,對M個聲道信號進(jìn)行編碼;輸出器,輸出編碼的殘差信號和編碼 的M個聲道信號。
[0010]運里,N可W等于2,M等于1。
[0011]殘差信號編碼器可提取殘差信號作為當(dāng)將N個聲道信號與基于提取的一個或多 個空間參數(shù)表示的一個或多個聲道信號進(jìn)行比較時所產(chǎn)生的誤差信號。
[0012]可通過多個二到一(TTO)下混合模塊進(jìn)行分級下混合來對至少5個聲道信號的多 聲道信號進(jìn)行編碼,所述編碼設(shè)備可包括:包括參數(shù)編碼器和下混合單元的所述多個TTO 混合模塊中的至少一個,編碼設(shè)備輸出編碼的殘差信號和編碼的M個聲道信號,W使輸出 的編碼的殘差信號和輸出的編碼的M個聲道信號可用于通過多次上混合來再現(xiàn)至少所述5 個聲道信號。
[0013]根據(jù)一個或多個實施例的一方面,可提供一種解碼設(shè)備,包括:聲道信號解碼器, 基于代數(shù)碼激勵線性預(yù)測(ACELP)、加權(quán)線性預(yù)測變換(wLPT)和高級音頻編碼(AAC)中的 至少一個從比特流中解碼出編碼的M個聲道信號;參數(shù)解碼器,對編碼的M個聲道信號的至 少一個編碼的空間參數(shù)進(jìn)行解碼;相位信息估計單元,基于至少一個解碼的空間參數(shù)來估 計相位信息;殘差信號解碼器,對編碼的M個聲道信號的編碼的殘差信號進(jìn)行解碼;矩陣計 算器,基于估計的相位信息計算用于對解碼的M個聲道信號進(jìn)行上混合的上混合矩陣;上 混合單元,基于解碼的殘差信號和上混合矩陣來將解碼的M個聲道信號上混合為N個聲道 信號。
[0014]運里,所述至少一個解碼的空間參數(shù)可包括聲道電平差(CLD)和聲道間相位差 (IPD)中的至少一個,CLD指示基于N個聲道信號的能量等級的強度差,IPD指示N個聲道 信號之間的相位差,相位信息估計單元基于所述至少一個解碼的空間參數(shù)估計整體相位差 (OPD),OTO指示N個聲道信號之間的一個或多個相位差在解碼的M個聲道信號中的分布程 度。
[0015]殘差信號可W是基于N個聲道信號與基于所述至少一個空間參數(shù)而表示的一個 或多個聲道信號之間的比較而所產(chǎn)生的誤差信號。
[001引 運里,N可W等于2,M等于1。
[0017] 可通過多個一到二(OTT)上混合模塊進(jìn)行分級上混合對至少5個聲道信號的多聲 道信號進(jìn)行解碼,所述解碼設(shè)備可包括:所述多少OTT上混合模塊中的至少一個,包括上混 合單元,從而解碼的N個聲道信號可用于通過N個聲道信號的附加OTT上混合來再現(xiàn)所述 至少5個聲道信號。
[0018] 根據(jù)一個或多個實施例的一方面,可提供一種解碼設(shè)備,包括:聲道信號解碼器, 基于W下中的至少一個來對W運動圖像專家組語音和音頻聯(lián)合編碼器(MPEGUSAC)編碼的 編碼M個聲道信號進(jìn)行解碼:基于操作線性預(yù)測域(LPD)的代數(shù)碼激勵線性預(yù)測(ACELP)、 加權(quán)線性預(yù)測變換(wLPT)和基于頻域(FD)的高級音頻編碼(AAC);參數(shù)解碼器,對編碼的 M個聲道信號的一個或多個編碼的空間參數(shù)進(jìn)行解碼;相位信息估計單元,基于解碼的一 個或多個空間參數(shù)估計相位信息;殘差信號解碼器,對編碼的M個聲道信號的編碼的殘差 信號進(jìn)行解碼;矩陣計算器,基于估計的相位信息計算用于解碼的M個聲道信號的上混合 矩陣;上混合單元,基于解碼的殘差信號和上混合矩陣將解碼的M個聲道信號上混合成N個 聲道信號。
[0019] 根據(jù)一個或多個實施例的一方面,可提供一種編碼方法,包括:提取與N個聲道信 號的相位信息相關(guān)的一個或多個空間參數(shù),并對提取的一個或多個空間參數(shù)進(jìn)行編碼;基 于提取的一個或多個空間參數(shù)將N個聲道信號下混合成M聲道信號;基于下混合的M個聲 道信號來對與N個聲道信號相關(guān)的殘差信號進(jìn)行編碼;對M個聲道信號編碼;輸出編碼的 殘差信號和編碼的M個聲道信號。
[0020] 運里,N可W等于2,M可W等于1。
[0021] 對殘差信號進(jìn)行編碼的步驟可包括:提取殘差信號作為當(dāng)將N個聲道信號與通過 提取的一個或多個空間參數(shù)表示的一個或多個聲道信號進(jìn)行比較時所產(chǎn)生的誤差信號。
[0022] 可通過多個二到一(TTO)下混合模塊進(jìn)行分級下混合來對至少5個聲道信號的多 聲道信號進(jìn)行編碼,所述編碼設(shè)備包括:所述多個TTO下混合模塊中的至少一個,執(zhí)行參數(shù) 提取和N個聲道信號到M個聲道信號的下混合,輸出步驟還包括:輸出編碼的殘差信號和編 碼的M個聲道信號,W使輸出的編碼的殘差信號和輸出的編碼的M個聲道信號可用于通過 多次上混合來再現(xiàn)所述至少5個聲道信號。
[0023] 根據(jù)一個或多個實施例的一方面,可提供一種解碼方法,包括:從比特流解碼出編 碼的M個聲道信號;對編碼的M個聲道信號的至少一個編碼的空間參數(shù)進(jìn)行解碼;基于至 少一個解碼的空間參數(shù)來估計相位信息;對編碼的M個聲道信號的編碼的殘差信號進(jìn)行解 碼;基于估計的相位信息來計算用于對解碼的M個聲道信號進(jìn)行上混合的上混合矩陣;基 于解碼的殘差信號和上混合矩陣來將解碼的M個聲道信號上混合成N個聲道信號。
[0024] 解碼的至少一個空間參數(shù)可包括聲道電平差(CLD)和聲道間相位差(IPD)中的至 少一個,CLD指示基于N個聲道信號的能量等級的強度差,IPD指示N個聲道信號之間的相 位差,估計可步驟包括:基于解碼的至少一個空間參數(shù)估計整體相位差(OPD),oro指示N個 聲道信號之間的一個或多個相位差在解碼的M個聲道信號中的分布程度。