用于降低空間參數誤碼率的三維音頻編碼方法及裝置的制造方法

文檔序號：9261970閱讀：572來源：國知局

用于降低空間參數誤碼率的三維音頻編碼方法及裝置的制造方法
【技術領域】
[0001] 本發明設及數字音頻領域，針對提高重建=維音頻空間感知質量的需求，尤其設及一種基于不等差錯保護來降低=維音頻空間參數誤碼率的編碼技術方案。
【背景技術】
[000引 2009年底，立維電影《阿凡達》在全球立十多個國家登上票房榜首，到2010年9月初，全球累計票房超過27億美元。《阿凡達》之所W能取得如此輝煌的票房成績，在于它所采用的全新的=維特效制作技術帶給人們感官上的震撼效果。要想達到更好的視聽體驗，還需要有與S維視頻內容同步的S維聲場聽覺效果，才能真正達到身臨其境的視聽感受。
[0003] 3D音頻通常的輸出碼流結構包括兩部分：下混單聲道信號部分和3D空間參數部分。而隨著越來越高的3D空間分辨率W及越來越多的聲道或對象數量，編碼聲道和空間參數的比特率會線性地急劇地增加，該就要求更大的帶寬來傳輸3D音頻。
[0004] 因此，當帶寬有限且聚焦于3D音頻的空間感知質量時，3D碼流中的空間參數部分就具有相對而言更高的重要性，需要更多的保護。

【發明內容】

[0005] 本發明的目的在于針對帶寬有限且需要保證3D音頻的空間感知質量的現狀，提供一種用于降低3D音頻空間參數誤碼率的UEP編碼方案。
[0006] 本發明的技術方案提供一種用于降低空間參數誤碼率的=維音頻編碼方法，編碼過程包括W下步驟，
[0007] 步驟C1，設輸入為經信源編碼器編碼所得大小為nbits的3D音頻碼流，將該3D 音頻碼流的3D空間參數部分作為MIB部分，其大小為ainbits,a1為系數，0 <a1< 1 ; 為MIB部分添加窗Wi，窗Wi只包含MIB部分相應的3D空間參數比特集合S1;所述MIB部分為更重要比特部分；
[000引步驟C2,將3D音頻碼流的下混單聲道信號部分作為LIB部分，并添加窗W2,窗胖2 包含MIB部分相應的3D空間參數比特集合Si和LIB部分相應的下混單聲道信號比特集合 S2;所述LIB部分為次重要比特部分；
[0009] 步驟C3,選擇窗Wi和窗W之一，包括根據選擇概率Ti來選擇窗W。i= 1，2,其中，Tl是窗Wi相應的選擇概率，T2是窗W2相應的選擇概率，T 2= 1-T 1，〇《1 ;
[0010] 步驟C4,隨機產生一個度數d，包括根據步驟C3所選窗Wi相應的度分布函數 Qi(x)選擇一個度數d;
[0011] 步驟巧，從步驟C3所選窗Wi中隨機選取d個符號并進行模為2的異或運算，得到一個編碼符號；
[0012] 步驟C6,返回步驟C3生成新的編碼符號，直至得到m個編碼符號，輸出大小為m bits的編碼碼流；其中，m= 丫n，丫為預設的解碼開銷。
[0013] 而且，度分布函數Qi(x)，i= 1，2采用同一個度分布函數如下，
[0014] Q(X)= 0. 007969X+0. 493570x2+0. 166220x3
[0015] +0. 072646x4+0. 082558x5+0. 056058x8+0. 037229x9
[0016] +0. 055590x19+0. 025023x64+0. 003135x66
[0017] 其中，X為隨機變量。
[001引而且，T 1= 0. 084, T 2= 0. 916。
[0019]而且，丫大于1. 07。
[0020] 而且，丫取值為1.2。
[0021] 本發明還相應提供一種用于降低空間參數誤碼率的=維音頻編碼裝置，包括W下模塊，
[0022] 第一加窗模塊，用于設輸入為經信源編碼器編碼所得大小為nbits的3D音頻碼流，將該3D音頻碼流的3D空間參數部分作為MIB部分，其大小為ainbits,a1為系數，0 <ai< 1 ;為MIB部分添加窗Wi，窗Wi只包含MIB部分相應的3D空間參數比特集合Si;所述MIB部分為更重要比特部分；
[0023] 第二加窗模塊，用于將3D音頻碼流的下混單聲道信號部分作為LIB部分，并添加窗胖2,窗W2包含MIB部分相應的3D空間參數比特集合S1和LIB部分相應的下混單聲道信號比特集合S,;所述LIB部分為次重要比特部分；
[0024] 窗選擇模塊，用于選擇窗Wi和窗W2之一，包括根據選擇概率Ti來選擇窗Wi，i =1，2,其中，Ti是窗Wi相應的選擇概率，T2是窗W2相應的選擇概率，T2= 1-T1， 0《T 1 ;
[0025] 度數生成模塊，用于隨機產生一個度數d，包括根據窗選擇模塊所選窗Wi相應的度分布函數Qi(x)選擇一個度數d;
[0026] 編碼符號生成模塊，用于從窗選擇模塊所選窗Wi中隨機選取d個符號并進行模為 2的異或運算，得到一個編碼符號；
[0027] 輸出模塊，用于命令窗選擇模塊重新生成新的編碼符號，直至得到m個編碼符號，輸出大小為mbits的編碼碼流；其中，m= 丫n，丫為預設的解碼開銷。
[002引而且，度分布函數Qi(x)，i= 1，2采用同一個度分布函數如下，
[0029] Q(X)= 0. 007969X+0. 493570x2+0. 166220x3
[0030] +0. 072646x4+0. 082558x5+0. 056058x8+0. 037229x9
[0031] +0. 055590x19+0. 025023x64+0. 003135x66 [003引其中，X為隨機變量。
[0033]而且，T 1= 0. 084, T 2= 0. 916。
[0034] 而且，丫大于 1.07。
[0035] 而且，丫取值為1. 2。
[0036] 本發明通過對包含有下混單聲道部分和3D空間參數部分的3D音頻碼流進行不等差錯保護來降低3D音頻空間參數的誤碼率，提高重建S維音頻的空間質量，令3D多聲道空間音頻信號經過信源編碼器后得到的3D音頻碼流輸入到基于不等差錯保護的編碼設計方案所設計的編碼器中，對碼流的3D空間參數部分進行重點保護，對下混單聲道信號部分進行次重點保護，來實現對輸入的3D音頻碼流的不等差錯保護；由于3D空間參數是使得重建 =維音頻具有空間感知質量的關鍵信息，而該樣的不等差錯保護方案能夠很好地保護更關鍵信息而又不會過多地損壞次關鍵信息。與傳統方法的均等差錯保護策略對比，使用不等差錯保護策略來傳輸3D音頻碼流可W在帶寬有限的情況下使3D音頻空間參數誤碼率降低一個數量級。因此，本發明通過對3D音頻碼流進行不等差錯保護，能夠降低3D音頻空間參數誤碼率，提高重建=維音頻的空間質量，得到更好的=維音頻重放效果W及整體的視聽感受。
【附圖說明】
[0037]圖1是本發明實施例的編碼方案流程圖。
[003引圖2是本發明實施例的加窗示意圖。
【具體實施方式】
[0039]W下結合附圖和實施例詳細說明本發明技術方案。
[0040] 本發明提供一種降低3D音頻空間參數誤碼率的肥P編碼方案，即一種基于不等差錯保護來降低=維音頻空間參數誤碼率，提高重建=維音頻空間感知質量的編碼方法，實現將一種不等差錯保護的編碼方法應用于=維音頻碼流。本發明考慮到，因特網和移動網絡是典型的二進制可擦除信道炬EC)。傳統的數據傳輸中，所有的數據在邸C上都是均等差錯保護巧EP)的，但在有些情況下對數據中一部分數據的可靠性要求很高，該部分數據需要更多的保護，而其他數據的可靠性可W相對差一些，需要的保護就相對少些，因此提出在音頻傳輸領域使用不等差錯保護扣邸）策略。本發明進一步針對音頻傳輸的數據特征進行U邸策略具體實現設計，所提供編碼方案的輸入是經過信源編碼器編碼的3D音頻碼流，包括下混單聲道信號部分和3D空間參數部分。
[0041] 具體實施時可采用計算機軟件技術實現自動運行流程。參見圖1，本發明實施例實現信道編碼器的功能，執行W下流程：
[0042] 步驟C1，經過信源編碼器編碼的大小為nbits的3D音頻碼流作為輸入，其中，該碼流的3D空間參數部分被視為更重要比特（MIB)部分，其大小為ain(0 <a1<l)bits，并為其添加窗Wi，該窗只包含MIB部分相應的3D空間參數比特集合Si。
[00創具體實施時，根據已知的MIB部分大小和n的比值可m十算出a1的具體取值。
[0044] 步驟C2,將3D音頻碼流的下混單聲道信號部分作為次重要比特（LIB)部分，其大小為a2n(0 <a2< 1)bits也就是（1-a1)n，并添加窗胖2,該窗包含MIB部分相應的3D空間參數比特集合Si和LIB部分相應的下混單聲道信號比特集合S2。
[0045] 實施例中n= 96000, 〇1= 0. 2,則Si的大小為19200bits，而S2的大小為 768(K)bits，圖2展示了本實施例的加窗示意圖，其中S。i= 1，2,. . .，96000代表信息符號， S。i= 1，2, ...，19200 代表集合Si中的信息符號，S。i= 19201，19202, ...，96000 代表集合S2中的信息符號。
[0046] 步驟C3,按照概率選擇Wi和W2之一；根據選擇概率T。i= 1，2來選擇窗i= 1，2,其中，Ti是窗Wi相應的選擇概率，T2是窗W2相應的選擇概率，WT1(〇《來選擇窗Wi，WT2= 1-T1(0《T1)來選擇窗W2。
[0047] 實施例中，肥P情況下T1= 0. 084,T2= 0. 916,而傳統的均等差錯保護巧邸）情況下，T1=0，T2= 1。
[0048] 步驟C4,每生成一個編碼符號前，都要隨機產生一個度數d，根據步驟C3所選窗Wi 相應的度數分布〇i(x)來選擇一個度d。其中，X是度分布函數〇i(x)的自變量，它是一個隨機變量。
[0049] 對于所有自變量X，度分布函數Q(X)是編碼度數為X的概率，其表達式為：
[00加]
(1)
[0化1] 而此處該個隨機變量X就是度數d，取值為1，2,…，n。
[0化2] 具體實施時，本領域技術人員可W自行設定具體的度分布函數Qi(x)，i

完整全部詳細技術資料下載

當前第1頁1 2