一種G.729到AMR12.2速率的轉(zhuǎn)碼方法與流程

文檔序號(hào)：12007109閱讀：494來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

本發(fā)明涉及一種G.729到AMR12.2速率的轉(zhuǎn)碼方法，屬于信號(hào)處理技術(shù)領(lǐng)域。

背景技術(shù)：
信息的傳輸與交換在當(dāng)代人們生活中不可或缺，在諸多信息數(shù)據(jù)中，語音數(shù)據(jù)無疑占有舉足輕重的地位。數(shù)字語音通信具有高可靠性、高抗干擾能力等優(yōu)點(diǎn),隨著通信技術(shù)的不斷發(fā)展，其所占的比重越來越大。為了提高通信效率，數(shù)字語音壓縮編碼技術(shù)得到了廣泛應(yīng)用，出現(xiàn)了多種語音壓縮編碼標(biāo)準(zhǔn)。為了保證網(wǎng)際間的互通性，語音編碼器之間的無縫連接變得越來越重要。要實(shí)現(xiàn)不同網(wǎng)絡(luò)間的語音碼流順利轉(zhuǎn)換，就需要把一端編碼器的碼流轉(zhuǎn)換成另一端所能識(shí)別的碼流，這種碼流轉(zhuǎn)換技術(shù)就稱為語音轉(zhuǎn)碼。G.729和AMR是兩種使用廣泛的語音壓縮編碼標(biāo)準(zhǔn)。G.729是國際電信聯(lián)盟(ITU)于2006年制定的8kbps語音編碼協(xié)議，G.729A是G.729標(biāo)準(zhǔn)的簡化版本；G.729B是與G.729(A)配合的靜音壓縮標(biāo)準(zhǔn)；G.729AB是指將低復(fù)雜度的G.729A和具有靜音壓縮功能的G.729B聯(lián)合使用的語音編碼標(biāo)準(zhǔn)，它在實(shí)際中應(yīng)用最多，已廣泛用于IP電話、視頻會(huì)議系統(tǒng)等領(lǐng)域。AMR是WCDMA移動(dòng)通信系統(tǒng)的自適應(yīng)多速率語音編碼標(biāo)準(zhǔn)，它共有8個(gè)速率，其中12.2kbps是其最高速率，該標(biāo)準(zhǔn)在蜂窩移動(dòng)通信系統(tǒng)中發(fā)揮著重要作用。為了實(shí)現(xiàn)IP電話和蜂窩移動(dòng)通信系統(tǒng)之間的互通，需要進(jìn)行G.729AB與AMR編碼器之間的轉(zhuǎn)碼工作。傳統(tǒng)的解決方法是采用先解后編(DecodethenEncode，DTE)方式進(jìn)行轉(zhuǎn)碼，即用源解碼器將傳輸?shù)谋忍亓鬟M(jìn)行解碼，恢復(fù)出重建語音，然后再使用目標(biāo)編碼器對(duì)重建語音進(jìn)行編碼，生成目標(biāo)解碼器可以解碼的碼流。這種方法雖然能夠完成不同編碼器之間的轉(zhuǎn)碼操作，但存在轉(zhuǎn)碼后語音質(zhì)量低、計(jì)算復(fù)雜度高和延時(shí)長等缺點(diǎn)。

技術(shù)實(shí)現(xiàn)要素：
本發(fā)明針對(duì)以上問題的提出，而研制一種G.729到AMR12.2速率的轉(zhuǎn)碼方法。本發(fā)明采取的技術(shù)方案如下：將輸入比特流輸入到G.729AB解碼單元，利用G.729AB解碼單元對(duì)輸入比特流進(jìn)行解碼，然后將解碼得到的幀類型、LSP系數(shù)、基音延時(shí)、固定碼本矢量、碼本增益以及合成語音輸入G.729AB到AMR-12.2kbps轉(zhuǎn)碼單元，對(duì)每一部分進(jìn)行相應(yīng)的轉(zhuǎn)碼：根據(jù)解碼得到的幀類型信息來對(duì)目標(biāo)幀的VAD信息做出判斷；將解碼端得到的LSP系數(shù)和整數(shù)基音延時(shí)分別作為編碼端的LSP系數(shù)和開環(huán)基音延時(shí)；利用輸入語音與重構(gòu)語音之間的均方誤差最小準(zhǔn)則，同時(shí)采用G.729AB的快速搜索方法和AMR-12.2kbps1/6分辨率，搜索編碼端的閉環(huán)基音延時(shí)；用加權(quán)輸入語音和加權(quán)重構(gòu)語音之間的均方誤差最小準(zhǔn)則來搜索固定碼本中的碼矢，在搜索過程中利用量化信號(hào)的最大絕對(duì)值來獲得部分脈沖的位置，同時(shí)減少部分脈沖的搜索個(gè)數(shù)。最后對(duì)各個(gè)參數(shù)進(jìn)行編碼，得到輸出比特流。本發(fā)明的有益效果：為了驗(yàn)證本發(fā)明方法的有效性，進(jìn)行了若干實(shí)驗(yàn)測(cè)試。測(cè)試中，將經(jīng)過轉(zhuǎn)碼后的輸出比特流經(jīng)過AMR-12.2kbps解碼后，得到轉(zhuǎn)碼后的語音，然后對(duì)該語音進(jìn)行測(cè)試。本發(fā)明使用PESQ、MOS-LQO作為轉(zhuǎn)碼后客觀語音質(zhì)量的衡量指標(biāo)。測(cè)試序列選用ITU-T在G.729AB和AMR中提供的10組標(biāo)準(zhǔn)文件，測(cè)試結(jié)果如表3，表3在具體實(shí)施方式里面。從表3中可以看出，本發(fā)明的轉(zhuǎn)碼方法在計(jì)算量上比傳統(tǒng)方式下降了44％左右，PESQ值和MOS-LQO都有所增加。附圖說明圖1G.729AB和AMR編解碼算法原理框圖。圖2G.729AB與AMR幀結(jié)構(gòu)對(duì)應(yīng)圖。圖3G.729AB到AMR12.2kbps轉(zhuǎn)碼裝置。圖4G.729AB到AMR-12.2kbps的轉(zhuǎn)碼。圖5LSP參數(shù)解碼流程圖。圖6基音延時(shí)解碼流程圖。圖7閉環(huán)基音搜索流程圖。圖8固定碼本搜索流程圖。具體實(shí)施方式下面結(jié)合附圖對(duì)本實(shí)用新型最進(jìn)一步說明：G.729AB和AMR是兩種使用廣泛的語音壓縮編碼標(biāo)準(zhǔn)。G.729是國際電信聯(lián)盟(ITU)于2006年制定的8kbps語音編碼協(xié)議，G.729A是G.729標(biāo)準(zhǔn)的簡化版本；G.729B是與G.729(A)配合的靜音壓縮標(biāo)準(zhǔn)；G.729AB是指將低復(fù)雜度的G.729A和具有靜音壓縮功能的G.729B聯(lián)合使用的語音編碼標(biāo)準(zhǔn)，它在實(shí)際中應(yīng)用最多，已廣泛用于IP電話、視頻會(huì)議系統(tǒng)等領(lǐng)域。AMR是WCDMA移動(dòng)通信系統(tǒng)的自適應(yīng)多速率語音編碼標(biāo)準(zhǔn)，它共有8個(gè)速率，其中12.2kbps是其最高速率，該標(biāo)準(zhǔn)在蜂窩移動(dòng)通信系統(tǒng)中發(fā)揮著重要作用。為了實(shí)現(xiàn)IP電話和蜂窩移動(dòng)通信系統(tǒng)之間的互通，需要進(jìn)行G.729AB與AMR編碼器之間的轉(zhuǎn)碼工作。傳統(tǒng)的解決方法是采用先解后編(DecodethenEncode，DTE)方式進(jìn)行轉(zhuǎn)碼，即用源解碼器將傳輸?shù)谋忍亓鬟M(jìn)行解碼，恢復(fù)出重建語音，然后再使用目標(biāo)編碼器對(duì)重建語音進(jìn)行編碼，生成目標(biāo)解碼器可以解碼的碼流。這種方法雖然能夠完成不同編碼器之間的轉(zhuǎn)碼操作，但存在轉(zhuǎn)碼后語音質(zhì)量低、計(jì)算復(fù)雜度高和延時(shí)長等缺點(diǎn)。為了解決上述DTE方式語音轉(zhuǎn)碼存在的問題，本發(fā)明給出了一種在G.729AB與AMR-12.2kbps間高效的轉(zhuǎn)碼方法。該方法在保證語音質(zhì)量的前提下，使轉(zhuǎn)碼算法的計(jì)算復(fù)雜度降低40％以上。該發(fā)明具有轉(zhuǎn)碼后語音質(zhì)量高、計(jì)算復(fù)雜度低、轉(zhuǎn)碼算法延時(shí)小等優(yōu)點(diǎn)，從而可降低設(shè)備的成本，保證不同設(shè)備供應(yīng)商間設(shè)備的兼容與互通。G.729AB與AMR均基于CELP語音生成模型，兩個(gè)編碼算法對(duì)于語音信號(hào)的處理過程基本相同。G.729AB和AMR編解碼算法的原理框圖如圖1所示：在編碼端，首先，都需要將輸入語音經(jīng)過預(yù)處理后，通過VAD判決進(jìn)行分類，分為語音幀和非語音幀；然后，根據(jù)不同的幀類型選用不同的編碼方法：對(duì)于語音幀，采用高速率的語音幀編碼算法；對(duì)于非語音幀，采用DTX技術(shù)進(jìn)行編碼處理，將需要傳送的噪聲信息通過SID幀發(fā)送到解碼端；最后，將編碼后的比特流進(jìn)行傳輸。在解碼端，根據(jù)不同的幀類型，選擇不同的解碼算法來生成合成語音：對(duì)非語音幀，采用CNG算法生成合成語音；對(duì)語音幀，采用語音幀解碼算法生成合成語音。最后對(duì)合成語音作一些后置處理以改善音質(zhì)?，F(xiàn)有技術(shù)介紹為了解決DTE方式轉(zhuǎn)碼存在的問題，國內(nèi)外提出了一些轉(zhuǎn)碼方法。下面結(jié)合幾篇外文文獻(xiàn)和專利，對(duì)現(xiàn)有轉(zhuǎn)碼技術(shù)進(jìn)行簡要介紹?，F(xiàn)有技術(shù)簡介(1)2004年，M.Ghenania在文獻(xiàn)“Low-costSmartTranscodingAlgorithmbetweenITU-TG.729(8kbit/s)and3GPPNB-AMR(12.2kbit/s)”中提出了一種G.729與AMR12.2kbit/s之間的轉(zhuǎn)碼方法。其基本思路是：將源解碼器解碼得到的LSP參數(shù)和基音延時(shí)參數(shù)直接賦值給目標(biāo)編碼器；對(duì)于代數(shù)碼書，則利用源編碼器搜索得到的代數(shù)碼書脈沖位置附近的N個(gè)非零脈沖構(gòu)成子代數(shù)碼書；然后，目標(biāo)編碼器在子代數(shù)碼書上，采用目標(biāo)編碼器的代數(shù)碼書搜索算法來得到代數(shù)碼書脈沖位置和符號(hào)。(2)在公開號(hào)為US20050075868A1的美國專利中，申請(qǐng)人公開了一種從EVRC到G.729AB轉(zhuǎn)碼的方法。其基本思路是：通過內(nèi)插EVRC的LSP參數(shù)來得到G.729AB的LSP參數(shù)，將EVRC的閉環(huán)基音延時(shí)賦值給G.729AB的開環(huán)基音延時(shí)，利用EVRC固定碼本搜索結(jié)果以及G.729AB相關(guān)信號(hào)的最大值來限制G.729AB固定碼本的搜索范圍。現(xiàn)有技術(shù)缺點(diǎn)(1)在目標(biāo)編碼器開啟DTX功能時(shí)，需要采用VAD算法來重新判斷當(dāng)前輸入幀的VAD信息，其中VAD操作會(huì)使整體轉(zhuǎn)碼操作的計(jì)算復(fù)雜度增加。(2)閉環(huán)基音搜索部分采用直接參數(shù)轉(zhuǎn)換，雖然可以大幅度降低計(jì)算量，但是語音質(zhì)量下降較多，無法滿足電信用戶的要求。(3)利用源編碼器固定碼本的脈沖搜索結(jié)果來限制目標(biāo)編碼器的固定碼本搜索范圍，使得語音質(zhì)量下降明顯。本發(fā)明技術(shù)方案的詳細(xì)闡述本發(fā)明所要解決的技術(shù)問題(1)在目標(biāo)編碼器開啟DTX功能時(shí)，需要采用VAD算法來重新判決當(dāng)前輸入幀的VAD信息，其中VAD操作會(huì)使整體轉(zhuǎn)碼操作的計(jì)算復(fù)雜度增加。(2)閉環(huán)基音搜索部分采用直接參數(shù)轉(zhuǎn)換，雖然可以大幅度降低計(jì)算量，但是語音質(zhì)量下降較多。(3)利用源編碼器固定碼本的脈沖搜索結(jié)果來限制目標(biāo)編碼器的固定碼本搜索范圍，使得語音質(zhì)量下降明顯。為了解決以上技術(shù)問題，在特定速率下，本發(fā)明給出一種有效的轉(zhuǎn)碼方法，在滿足不同編碼器間有效互通的同時(shí)，可以降低轉(zhuǎn)碼計(jì)算復(fù)雜度，提升轉(zhuǎn)碼后的語音質(zhì)量。本發(fā)明提供的完整技術(shù)方案如下：本發(fā)明首先利用G.729AB解碼器對(duì)輸入比特流進(jìn)行解碼，得到幀類型、LSP系數(shù)、基音延時(shí)、固定碼本矢量、碼本增益以及合成語音，將合成語音作為輸入語音輸入到AMR編碼器。然后對(duì)每一部分進(jìn)行相應(yīng)的轉(zhuǎn)碼：根據(jù)輸入比特流中的幀類型信息來對(duì)目標(biāo)幀的VAD信息做出判斷；將解碼端得到的LSP系數(shù)和整數(shù)基音延時(shí)分別作為編碼端的LSP系數(shù)和開環(huán)基音延時(shí)；利用輸入語音與重構(gòu)語音之間的均方誤差最小準(zhǔn)則，同時(shí)采用G.729AB的快速搜索方法和AMR-12.2kbps1/6分辨率，搜索編碼端的閉環(huán)基音延時(shí)；用加權(quán)輸入語音和加權(quán)重構(gòu)語音之間的均方誤差最小準(zhǔn)則來搜索固定碼本中的碼矢，在搜索過程中利用量化信號(hào)的最大絕對(duì)值來獲得部分脈沖的位置，同時(shí)減少部分脈沖的搜索個(gè)數(shù)。最后對(duì)各個(gè)參數(shù)進(jìn)行編碼，得到輸出比特流。G.729AB與AMR-12.2kbps之間轉(zhuǎn)碼的首要問題是幀長不同，G.729AB是對(duì)10ms語音幀進(jìn)行編碼，而AMR-12.2kbps是對(duì)20ms語音幀進(jìn)行編碼。為了解決語音幀長度不同的問題，其對(duì)應(yīng)關(guān)系如圖2所示：將2個(gè)G.729AB語音幀對(duì)應(yīng)1個(gè)AMR語音幀，它們具有相同的子幀結(jié)構(gòu)，G.729AB將1個(gè)語音幀分成2個(gè)5ms子幀，AMR將一個(gè)語音幀分成4個(gè)5ms子幀。本發(fā)明給出的G.729AB到AMR-12.2kbps轉(zhuǎn)碼裝置結(jié)構(gòu)圖如圖3所示。該裝置由3個(gè)單元組成：G.729AB解碼單元、G.729AB到AMR-12.2kbps轉(zhuǎn)碼單元和AMR-12.2kbps編碼單元。本發(fā)明具體實(shí)現(xiàn)過程如圖4所示。G.729AB解碼單元G.729AB解碼單元包括比特解析單元、幀類型解碼單元、語音幀解碼單元和非語音幀解碼單元、合成濾波單元。語音幀解碼單元和非語音幀解碼單元包括LSP解碼單元、基音延時(shí)解碼單元、固定碼本解碼單元和增益解碼單元。(1)比特解析單元比特解析單元用于對(duì)輸入比特流的比特分配進(jìn)行解析。語音幀、SID幀、非傳輸幀的有效長度不同，語音幀的有效長度為80bits，SID幀的有效長度為15bits，非傳輸幀的有效長度為0bits。表1和表2分別給出了語音幀和SID幀比特流順序及其對(duì)應(yīng)的參數(shù)說明。(2)幀類型解碼單元根據(jù)輸入有效比特流的長度來判斷幀類型：若長度為80，則為語音幀，ftype＝1；若長度為15，則為SID幀，ftype＝2；若長度為0，則為不傳輸幀，ftype＝0。(3)語音幀解碼單元語音幀解碼單元包括LSP解碼單元、基音延時(shí)解碼單元、固定碼本解碼單元和增益解碼單元。表1語音幀發(fā)送參數(shù)及其順序表2靜音幀發(fā)送參數(shù)及其順序1)LSP解碼單元LSP參數(shù)解碼流程圖如圖5：①根據(jù)L0、L1、L2、L3解析出LSP的量化輸出這里，ξ1i(L1)表示第一級(jí)碼本中序號(hào)為L1的碼矢量中的第i個(gè)參數(shù)，ξ2i(L2)表示第二級(jí)低維碼本中序號(hào)為L2的碼矢量中的第i個(gè)參數(shù)，ξ3i(L3)表示第二級(jí)高維碼本中序號(hào)為L3的碼矢量中的第i個(gè)參數(shù)。②為避免在量化合成濾波中出現(xiàn)尖銳的震蕩，需調(diào)整解碼后的參數(shù)：式(1)中的循環(huán)變量i從2到10取值，每次增加1，每次循環(huán)中執(zhí)行：若滿足條件，則執(zhí)行操作。其中，J為最小距離。這個(gè)調(diào)整要作兩次，第一次J＝0.0012，第二次J＝0.0006。③計(jì)算當(dāng)前幀m的量化LSF系數(shù)這里，是前幾幀量化輸出，是當(dāng)前幀的量化輸出，是滑動(dòng)平均預(yù)測(cè)器的系數(shù)，可以由L0碼書搜索得到。④計(jì)算得到之后，檢查對(duì)應(yīng)濾波器的穩(wěn)定性，步驟如下：Ⅰ、按照的升序重新排列Ⅱ、若則Ⅲ、若則Ⅳ、若則⑤由LSF系數(shù)求出LSP系數(shù)計(jì)算得到的LSP系數(shù)作為G.729AB的第二子幀，第一子幀的LSP系數(shù)用相鄰幀對(duì)應(yīng)的參數(shù)線性內(nèi)插得到：其中，是前一幀10ms的LSP系數(shù)，是當(dāng)前10ms幀的LSP系數(shù)。⑥將LSP系數(shù)轉(zhuǎn)換為LP系數(shù)ai，具體步驟如下：Ⅰ、循環(huán)變量i取值范圍從1到5，每次增加1；每次變量i循環(huán)時(shí)，執(zhí)行f1(i)＝-2q2i-1f1(i-1)+2f1(i-2)操作；Ⅱ、循環(huán)變量j取值范圍從i-1到1，每次減少1；每次循環(huán)變量j循環(huán)時(shí)，執(zhí)行f1(j)＝f1(j)-2q2i-1f1(j-1)+f1(j-2)操作；其中，f1(0)＝1,f1(-1)＝0；將q2i-1替換成q2i即可得到f2(i)；Ⅲ、由f1(i)，f2(i)計(jì)算f1'(i)，f2'(i)：f1'(i)＝f1(i)+f1(i-1),i＝1,…,5；f2'(i)＝f2(i)+f2(i-1),i＝1,…,5Ⅳ、計(jì)算LP系數(shù)：2)基音延時(shí)解碼單元基音延時(shí)解碼流程圖如圖6：①計(jì)算奇偶校驗(yàn)位P：由收到的P1前6位異或得到P；②如果P與P0不相同，則認(rèn)為接收發(fā)生了錯(cuò)誤，當(dāng)前幀第一子幀的基音延時(shí)T1用前一幀第二子幀的基音延時(shí)T2來替代；如果P與P0相同，則認(rèn)為接收正確，那么利用收到的基音延時(shí)序號(hào)P1尋找基音延時(shí)的整數(shù)部分和分?jǐn)?shù)部分：如果P1<197，int(T1)＝(P1+2)/3+19，frac＝P1-3*int(T1)+58；否則，int(T1)＝P1-112，frac＝0。③第二子幀T2的整數(shù)部分由P2和t_min得到：t_min＝int(T1)-5若t_min<20，則t_min＝20；t_max＝t_min+9若t_max>143則t_max＝143；t_min＝t_max-9T2解碼：int(T2)＝(P1+2)/3-1+t_min，frac＝P2-2-3*((P2+2)/3-1)④確定基音延時(shí)后，在給出的整數(shù)延時(shí)k和分?jǐn)?shù)延時(shí)t處，內(nèi)插過去的激勵(lì)resLP(n)來計(jì)算自適應(yīng)碼本矢量v(n):這個(gè)內(nèi)插濾波器b60由在±59處截?cái)嗟臐h明窗截取取樣函數(shù)sinx/x得到，在±60處(b60(60)＝0)用0填充，該濾波器的截止頻率為3.6KHz。3)固定碼本解碼單元固定碼本是代數(shù)碼本結(jié)構(gòu)，每個(gè)碼本矢量含有N個(gè)非零脈沖，每個(gè)脈沖的幅度或正或負(fù)。脈沖位置由接收到的固定碼本序號(hào)C來得到，脈沖符號(hào)由S碼得到，構(gòu)造固定碼本矢量c(n)：c(n)＝S0δ(n-C0)+S1δ(n-C1)+S2δ(n-C2)+S3δ(n-C3),n＝0,…,39；(6)如果基音延時(shí)的整數(shù)部分T小于子幀長度40，c(n)按照下式修正：4)增益解碼單元增益解碼是在子幀上進(jìn)行的，接收到的增益碼本序號(hào)GA、GB均是2維碼本，利用下式計(jì)算每子幀的自適應(yīng)碼本增益和固定碼本增益相關(guān)因子γ：γ＝GA2(GA)+GB2(GB)；(9)其中，GA1、GA2、GB1、GB2中的下標(biāo)是維號(hào)。量化固定碼本增益計(jì)算公式如下：其中，g'c是預(yù)測(cè)的固定碼本增益。(4)非語音幀解碼單元非語音幀LSP解碼與語音幀LSP解碼基本相同；基音延時(shí)值通過在范圍[40,103]內(nèi)隨機(jī)產(chǎn)生；固定碼本的脈沖位置及脈沖符號(hào)也是隨機(jī)產(chǎn)生的；自適應(yīng)碼本增益限制在0.5內(nèi)，在[0,0.5]范圍內(nèi)隨機(jī)選擇；能量值作為固定碼本增益。(5)合成濾波單元對(duì)于語音幀，將得到的自適應(yīng)和固定碼本矢量分別乘以各自的增益，相加可得激勵(lì)信號(hào)；然后將激勵(lì)信號(hào)通過LP合成濾波器得到合成語音信號(hào)。對(duì)于非語音幀，激勵(lì)信號(hào)采用三個(gè)信號(hào)的混合，其中兩個(gè)信號(hào)來自G.729AB的激勵(lì)信號(hào)，另一個(gè)來自高斯白噪聲發(fā)生器；將上述得到的激勵(lì)信號(hào)通過LP合成濾波器，得到舒適噪聲信號(hào)。G.729AB到AMR-12.2kbps轉(zhuǎn)碼單元G.729AB到AMR-12.2kbps轉(zhuǎn)碼單元用于得到AMR-12.2kbps編碼所需的參數(shù)。具體步驟如下：(1)VAD部分本發(fā)明屏蔽AMR編碼時(shí)的VAD操作，利用G.729AB解碼得到的幀類型信息判斷AMR-12.2kbps編碼時(shí)VAD的信息，具體作法如下：1)若G.729AB解碼得到的幀類型ftype＝1，則VAD_flagG.729AB＝1；否則，VAD_flagG.729AB＝0。2)根據(jù)連續(xù)兩幀G.729AB的VAD_flag判斷AMR編碼端VAD_flag的值，VAD_flag的值為VAD_flagAMR＝VAD_flagG.729AB_1||VAD_flagG.729AB_2，(11)這里，VAD_flagG.729AB_1表示第一幀G.729AB的VAD信息，VAD_flagG.729AB_2表示第二幀G.729AB的VAD信息。(2)LSP部分將G.729AB第2n-1幀和第2n幀的LSP參數(shù)，傳遞給AMR-12.2kbps第n幀的第二子幀和第四子幀，即其中，表示G.729AB第2n-1幀的LSP系數(shù)，表示G.729AB第2n幀的LSP系數(shù)，表示AMR-12.2kbps第n幀的第二子幀，表示AMR-12.2kbps第n幀的第四子幀。第一和第三子幀的LSP系數(shù)由下式得到：將得到LSP系數(shù)轉(zhuǎn)換為LP系數(shù)ai，具體步驟如下：1)循環(huán)變量i取值范圍從1到5，每次增加1；每次變量i循環(huán)時(shí)，執(zhí)行f1(i)＝-2q2i-1f1(i-1)+2f1(i-2)操作；2)循環(huán)變量j取值范圍從i-1到1，每次減少1；每次循環(huán)變量j循環(huán)時(shí)，執(zhí)行f1(j)＝f1(j)-2q2i-1f1(j-1)+f1(j-2)操作；其中，f1(0)＝1,f1(-1)＝0；將q2i-1替換成q2i即可得到f2(i)；3)由f1(i)，f2(i)計(jì)算f1'(i)，f2'(i)：f1'(i)＝f1(i)+f1(i-1),i＝1,…,5；f2'(i)＝f2(i)+f2(i-1),i＝1,…,54)計(jì)算LP系數(shù)：(3)開環(huán)基音搜索部分將G.729AB第2n-1幀和第2n幀的第一子幀閉環(huán)基音參數(shù)作為AMR-12.2kbps第n幀的兩個(gè)開環(huán)基音參數(shù)：(4)自適應(yīng)碼本搜索部分本發(fā)明利用G.729AB閉環(huán)基音搜索的思想簡化AMR-12.2kbps整數(shù)部分的搜索過程，并且根據(jù)AMR-12.2kbps的1/6分辨率進(jìn)行分?jǐn)?shù)部分的搜索，具體搜索流程圖如圖7所示：1)計(jì)算基音延時(shí)的搜索范圍[t0_min,t0_max]在第一/第三子幀，t0_min＝max{18,TOP-3}，t0_max＝min{143,TOP+3}。在第二/第四子幀，t0_min＝max{18,T1-5}，t0_max＝min{143,T1+4}，其中T1是前一子幀(第一或第三子幀)基音分?jǐn)?shù)延時(shí)的最大整數(shù)部分。2)計(jì)算LP濾波器的殘差信號(hào)resLP(n)：其中，s(n)是G.729AB解碼后得到的合成語音；是量化了的預(yù)測(cè)系數(shù)。3)將殘差信號(hào)resLP(n)通過感知加權(quán)合成濾波器，從而得到用于自適應(yīng)碼本搜索的目標(biāo)信號(hào)x(n)，即x(n)＝resLP(n)*h(n)；(19)4)計(jì)算x(n)與h(n)的相關(guān)：5)將LP殘差信號(hào)賦值給激勵(lì)信號(hào)u(n)：u(n)＝resLP(n)，n＝0,…,39；6)計(jì)算R(k)：7)求出R(k)最大值對(duì)應(yīng)的k，即為最佳整數(shù)基音延時(shí)。8)在最佳整數(shù)基音延時(shí)k附近的分?jǐn)?shù)(從-3/6到-3/6，步長為1/6)內(nèi)插R(k)：其中，b24是內(nèi)插濾波器系數(shù)，t＝0,…,5分別對(duì)應(yīng)分?jǐn)?shù)0、1/6、2/6、3/6、-2/6和-1/6。搜索R(k)t的最大值所對(duì)應(yīng)的t，即為最佳分?jǐn)?shù)基音延時(shí)。9)確定基音延時(shí)后，在給出的整數(shù)延時(shí)k和分?jǐn)?shù)延時(shí)t處內(nèi)插過去的激勵(lì)u(n)來計(jì)算自適應(yīng)碼本矢量v(n):其中，b60是內(nèi)插濾波器系數(shù)。10)計(jì)算自適應(yīng)碼本的增益：其中，y(n)＝v(n)*h(n)。(5)固定碼本搜索部分固定碼本搜索流程圖如圖8所示：1)計(jì)算固定碼本搜索的目標(biāo)信號(hào)x2(n)：其中，y(n)＝v(n)*h(n)是自適應(yīng)碼本矢量濾波，是量化了的自適應(yīng)碼本增益。2)計(jì)算x2(n)與h(n)的相關(guān)信號(hào)d(n)：3)計(jì)算h(n)的自相關(guān)矩陣Φ，其中Φ的每個(gè)元素按下式計(jì)算：4)計(jì)算量化信號(hào)b(n)：5)計(jì)算符號(hào)信號(hào)S(n)＝sgn[b(n)]。6)脈沖搜索位置預(yù)選。按量化信號(hào)|b(n)|從大到小的順序重置每個(gè)軌道的脈沖位置。用前M區(qū)的脈沖位置作為搜索脈沖的候選，取M＝5。7)記錄|b(n)|最大值的位置及其所在軌道數(shù)。將i0固定在所有軌道中|b(n)|最大值的位置，i1固定在下一軌道中|b(n)|最大值的位置。8)在候選的脈沖搜索位置上，按照AMR編碼標(biāo)準(zhǔn)里的深度優(yōu)先樹方法搜索出其它8個(gè)脈沖的位置，即脈沖{i2,i3}、{i4,i5}、{i6,i7}、{i8,i9}在依次軌道上成對(duì)地、順序地在嵌套環(huán)中搜索出。搜索準(zhǔn)則是使下式最大：其中，mi是第i個(gè)脈沖的位置，N是脈沖的個(gè)數(shù)，N＝10。9)計(jì)算固定碼本矢量c(n)：其中，Si是第i個(gè)脈沖的符號(hào)，mi是第i個(gè)脈沖的位置，N是脈沖的個(gè)數(shù)，N＝10。10)計(jì)算固定碼本增益gc：AMR-12.2kbps編碼單元AMR-12.2kbps編碼單元用于將轉(zhuǎn)碼后的參數(shù)按照AMR-12.2kbps量化方法重新量化后，寫入到輸出比特流。本發(fā)明技術(shù)方案帶來的有益效果為了驗(yàn)證本發(fā)明方法的有效性，進(jìn)行了若干實(shí)驗(yàn)測(cè)試。測(cè)試中，將經(jīng)過轉(zhuǎn)碼后的輸出比特流經(jīng)過AMR-12.2kbps解碼后，得到轉(zhuǎn)碼后的語音，然后對(duì)該語音進(jìn)行測(cè)試。本發(fā)明使用PESQ、MOS-LQO作為轉(zhuǎn)碼后客觀語音質(zhì)量的衡量指標(biāo)。測(cè)試序列選用ITU-T在G.729AB和AMR中提供的10組標(biāo)準(zhǔn)文件，測(cè)試結(jié)果如表3。從表3中可以看出，本發(fā)明的轉(zhuǎn)碼方法在計(jì)算量上比傳統(tǒng)方式下降了44％左右，PESQ值和MOS-LQO都有所增加。表3DTE方法與本發(fā)明方法性能測(cè)試結(jié)果對(duì)比本發(fā)明的實(shí)施在大幅度地降低計(jì)算量的同時(shí)，提高了語音質(zhì)量，降低了通信設(shè)備的成本和功耗，因此本發(fā)明具有廣泛的應(yīng)用價(jià)值和前景。以上所述，僅為本發(fā)明較佳的具體實(shí)施方式，但本發(fā)明的保護(hù)范圍并不局限于此，任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi)，根據(jù)本發(fā)明的技術(shù)方案及其發(fā)明構(gòu)思加以等同替換或改變，都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。本發(fā)明涉及的縮略語和關(guān)鍵術(shù)語定義如下：AMR：AdaptiveMulti-Rate自適應(yīng)多速率。WCDMA：WidebandCodeDivisionMultipleAccess寬帶碼分多址。IP：InternetProtocol網(wǎng)絡(luò)協(xié)議。CELP：CodeExcitedLinearPrediction碼激勵(lì)線性預(yù)測(cè)。VAD：VoiceActivityDetector語音激活檢測(cè)。DTX：DiscontinuousTransmission不連續(xù)傳輸。CNG：ComfortNoiseGenerator舒適噪音生成。SID：SilenceInsertionDescriptor靜音插入描述。MA：MovingAverage滑動(dòng)平均。LP：LinearPrediction線性預(yù)測(cè)。LPC：LinearPredictiveCoding線性預(yù)測(cè)編碼。LSP：LinearSpectrumPair線譜對(duì)。LSF：LinearSpectrumFrequency線譜頻率。PESQ：PerceptualEvaluationofSpeechQuality主觀語音質(zhì)量評(píng)估。MOS-LQO：MeanOpinionScore–ListeningQualityObjective平均意見分?jǐn)?shù)-客觀聽覺質(zhì)量。ITU-T：InternationalTelecommunicationUnion-Telecommunicationstandardizationsector國際電信聯(lián)盟-電信標(biāo)準(zhǔn)化部門。MOPS：MillionOperationsPerSecond百萬次操作每秒。DTE：DecodethenEncode。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陳喆;殷福亮;李騰
技術(shù)所有人：大連理工大學(xué)
我是此專利的發(fā)明人

上一篇：耳機(jī)檢測(cè)裝置的制作方法
上一篇：一種超保真喇叭的制作方法與工藝

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！