用于降低空間參數誤碼率的三維音頻編碼方法及裝置的制造方法
【技術領域】
[0001] 本發明設及數字音頻領域,針對提高重建=維音頻空間感知質量的需求,尤其設 及一種基于不等差錯保護來降低=維音頻空間參數誤碼率的編碼技術方案。
【背景技術】
[000引 2009年底,立維電影《阿凡達》在全球立十多個國家登上票房榜首,到2010年9月 初,全球累計票房超過27億美元。《阿凡達》之所W能取得如此輝煌的票房成績,在于它所 采用的全新的=維特效制作技術帶給人們感官上的震撼效果。要想達到更好的視聽體驗, 還需要有與S維視頻內容同步的S維聲場聽覺效果,才能真正達到身臨其境的視聽感受。
[0003] 3D音頻通常的輸出碼流結構包括兩部分:下混單聲道信號部分和3D空間參數部 分。而隨著越來越高的3D空間分辨率W及越來越多的聲道或對象數量,編碼聲道和空間參 數的比特率會線性地急劇地增加,該就要求更大的帶寬來傳輸3D音頻。
[0004] 因此,當帶寬有限且聚焦于3D音頻的空間感知質量時,3D碼流中的空間參數部分 就具有相對而言更高的重要性,需要更多的保護。
【發明內容】
[0005] 本發明的目的在于針對帶寬有限且需要保證3D音頻的空間感知質量的現狀,提 供一種用于降低3D音頻空間參數誤碼率的UEP編碼方案。
[0006] 本發明的技術方案提供一種用于降低空間參數誤碼率的=維音頻編碼方法,編碼 過程包括W下步驟,
[0007] 步驟C1,設輸入為經信源編碼器編碼所得大小為nbits的3D音頻碼流,將該3D 音頻碼流的3D空間參數部分作為MIB部分,其大小為ainbits,a1為系數,0 <a1< 1 ; 為MIB部分添加窗Wi,窗Wi只包含MIB部分相應的3D空間參數比特集合S1;所述MIB部分 為更重要比特部分;
[000引步驟C2,將3D音頻碼流的下混單聲道信號部分作為LIB部分,并添加窗W2,窗胖2 包含MIB部分相應的3D空間參數比特集合Si和LIB部分相應的下混單聲道信號比特集合 S2;所述LIB部分為次重要比特部分;
[0009] 步驟C3,選擇窗Wi和窗W之一,包括根據選擇概率Ti來選擇窗W。i= 1,2,其 中,Tl是窗Wi相應的選擇概率,T2是窗W2相應的選擇概率,T 2= 1-T 1,〇《1 ;
[0010] 步驟C4,隨機產生一個度數d,包括根據步驟C3所選窗Wi相應的度分布函數 Qi(x)選擇一個度數d;
[0011] 步驟巧,從步驟C3所選窗Wi中隨機選取d個符號并進行模為2的異或運算,得到 一個編碼符號;
[0012] 步驟C6,返回步驟C3生成新的編碼符號,直至得到m個編碼符號,輸出大小為m bits的編碼碼流;其中,m= 丫n,丫為預設的解碼開銷。
[0013] 而且,度分布函數Qi(x),i= 1,2采用同一個度分布函數如下,
[0014] Q(X)= 0. 007969X+0. 493570x2+0. 166220x3
[0015] +0. 072646x4+0. 082558x5+0. 056058x8+0. 037229x9
[0016] +0. 055590x19+0. 025023x64+0. 003135x66
[0017] 其中,X為隨機變量。
[001引 而且,T 1= 0. 084, T 2= 0. 916。
[0019]而且,丫大于1. 07。
[0020] 而且,丫取值為1.2。
[0021] 本發明還相應提供一種用于降低空間參數誤碼率的=維音頻編碼裝置,包括W下 模塊,
[0022] 第一加窗模塊,用于設輸入為經信源編碼器編碼所得大小為nbits的3D音頻碼 流,將該3D音頻碼流的3D空間參數部分作為MIB部分,其大小為ainbits,a1為系數,0 <ai< 1 ;為MIB部分添加窗Wi,窗Wi只包含MIB部分相應的3D空間參數比特集合Si;所 述MIB部分為更重要比特部分;
[0023] 第二加窗模塊,用于將3D音頻碼流的下混單聲道信號部分作為LIB部分,并添加 窗胖2,窗W2包含MIB部分相應的3D空間參數比特集合S1和LIB部分相應的下混單聲道信 號比特集合S,;所述LIB部分為次重要比特部分;
[0024] 窗選擇模塊,用于選擇窗Wi和窗W2之一,包括根據選擇概率Ti來選擇窗Wi,i =1,2,其中,Ti是窗Wi相應的選擇概率,T2是窗W2相應的選擇概率,T2= 1-T1, 0《T 1 ;
[0025] 度數生成模塊,用于隨機產生一個度數d,包括根據窗選擇模塊所選窗Wi相應的度 分布函數Qi(x)選擇一個度數d;
[0026] 編碼符號生成模塊,用于從窗選擇模塊所選窗Wi中隨機選取d個符號并進行模為 2的異或運算,得到一個編碼符號;
[0027] 輸出模塊,用于命令窗選擇模塊重新生成新的編碼符號,直至得到m個編碼符號, 輸出大小為mbits的編碼碼流;其中,m= 丫n,丫為預設的解碼開銷。
[002引而且,度分布函數Qi(x),i= 1,2采用同一個度分布函數如下,
[0029] Q(X)= 0. 007969X+0. 493570x2+0. 166220x3
[0030] +0. 072646x4+0. 082558x5+0. 056058x8+0. 037229x9
[0031] +0. 055590x19+0. 025023x64+0. 003135x66 [003引其中,X為隨機變量。
[0033]而且,T 1= 0. 084, T 2= 0. 916。
[0034] 而且,丫大于 1.07。
[0035] 而且,丫取值為1. 2。
[0036] 本發明通過對包含有下混單聲道部分和3D空間參數部分的3D音頻碼流進行不等 差錯保護來降低3D音頻空間參數的誤碼率,提高重建S維音頻的空間質量,令3D多聲道空 間音頻信號經過信源編碼器后得到的3D音頻碼流輸入到基于不等差錯保護的編碼設計方 案所設計的編碼器中,對碼流的3D空間參數部分進行重點保護,對下混單聲道信號部分進 行次重點保護,來實現對輸入的3D音頻碼流的不等差錯保護;由于3D空間參數是使得重建 =維音頻具有空間感知質量的關鍵信息,而該樣的不等差錯保護方案能夠很好地保護更關 鍵信息而又不會過多地損壞次關鍵信息。與傳統方法的均等差錯保護策略對比,使用不等 差錯保護策略來傳輸3D音頻碼流可W在帶寬有限的情況下使3D音頻空間參數誤碼率降低 一個數量級。因此,本發明通過對3D音頻碼流進行不等差錯保護,能夠降低3D音頻空間參 數誤碼率,提高重建=維音頻的空間質量,得到更好的=維音頻重放效果W及整體的視聽 感受。
【附圖說明】
[0037]圖1是本發明實施例的編碼方案流程圖。
[003引圖2是本發明實施例的加窗示意圖。
【具體實施方式】
[0039]W下結合附圖和實施例詳細說明本發明技術方案。
[0040] 本發明提供一種降低3D音頻空間參數誤碼率的肥P編碼方案,即一種基于不等差 錯保護來降低=維音頻空間參數誤碼率,提高重建=維音頻空間感知質量的編碼方法,實 現將一種不等差錯保護的編碼方法應用于=維音頻碼流。本發明考慮到,因特網和移動網 絡是典型的二進制可擦除信道炬EC)。傳統的數據傳輸中,所有的數據在邸C上都是均等 差錯保護巧EP)的,但在有些情況下對數據中一部分數據的可靠性要求很高,該部分數據 需要更多的保護,而其他數據的可靠性可W相對差一些,需要的保護就相對少些,因此提出 在音頻傳輸領域使用不等差錯保護扣邸)策略。本發明進一步針對音頻傳輸的數據特征進 行U邸策略具體實現設計,所提供編碼方案的輸入是經過信源編碼器編碼的3D音頻碼流, 包括下混單聲道信號部分和3D空間參數部分。
[0041] 具體實施時可采用計算機軟件技術實現自動運行流程。參見圖1,本發明實施例實 現信道編碼器的功能,執行W下流程:
[0042] 步驟C1,經過信源編碼器編碼的大小為nbits的3D音頻碼流作為輸入,其中,該 碼流的3D空間參數部分被視為更重要比特(MIB)部分,其大小為ain(0 <a1<l)bits, 并為其添加窗Wi,該窗只包含MIB部分相應的3D空間參數比特集合Si。
[00創具體實施時,根據已知的MIB部分大小和n的比值可m十算出a1的具體取值。
[0044] 步驟C2,將3D音頻碼流的下混單聲道信號部分作為次重要比特(LIB)部分,其大 小為a2n(0 <a2< 1)bits也就是(1-a1)n,并添加窗胖2,該窗包含MIB部分相應的3D空 間參數比特集合Si和LIB部分相應的下混單聲道信號比特集合S2。
[0045] 實施例中n= 96000, 〇1= 0. 2,則Si的大小為19200bits,而S2的大小為 768(K)bits,圖2展示了本實施例的加窗示意圖,其中S。i= 1,2,. . .,96000代表信息符號, S。i= 1,2, ...,19200 代表集合Si中的信息符號,S。i= 19201,19202, ...,96000 代表集 合S2中的信息符號。
[0046] 步驟C3,按照概率選擇Wi和W2之一;根據選擇概率T。i= 1,2來選擇窗i= 1,2,其中,Ti是窗Wi相應的選擇概率,T2是窗W2相應的選擇概率,WT1(〇《 來選擇窗Wi,WT2= 1-T1(0《T1)來選擇窗W2。
[0047] 實施例中,肥P情況下T1= 0. 084,T2= 0. 916,而傳統的均等差錯保護巧邸)情 況下,T1=0,T2= 1。
[0048] 步驟C4,每生成一個編碼符號前,都要隨機產生一個度數d,根據步驟C3所選窗Wi 相應的度數分布〇i(x)來選擇一個度d。其中,X是度分布函數〇i(x)的自變量,它是一個 隨機變量。
[0049] 對于所有自變量X,度分布函數Q(X)是編碼度數為X的概率,其表達式為:
[00加]
(1)
[0化1] 而此處該個隨機變量X就是度數d,取值為1,2,…,n。
[0化2] 具體實施時,本領域技術人員可W自行設定具體的度分布函數Qi(x),i