本發(fā)明涉及一種G.729到AMR12.2速率的轉(zhuǎn)碼方法,屬于信號(hào)處理技術(shù)領(lǐng)域。
背景技術(shù):信息的傳輸與交換在當(dāng)代人們生活中不可或缺,在諸多信息數(shù)據(jù)中,語音數(shù)據(jù)無疑占有舉足輕重的地位。數(shù)字語音通信具有高可靠性、高抗干擾能力等優(yōu)點(diǎn),隨著通信技術(shù)的不斷發(fā)展,其所占的比重越來越大。為了提高通信效率,數(shù)字語音壓縮編碼技術(shù)得到了廣泛應(yīng)用,出現(xiàn)了多種語音壓縮編碼標(biāo)準(zhǔn)。為了保證網(wǎng)際間的互通性,語音編碼器之間的無縫連接變得越來越重要。要實(shí)現(xiàn)不同網(wǎng)絡(luò)間的語音碼流順利轉(zhuǎn)換,就需要把一端編碼器的碼流轉(zhuǎn)換成另一端所能識(shí)別的碼流,這種碼流轉(zhuǎn)換技術(shù)就稱為語音轉(zhuǎn)碼。G.729和AMR是兩種使用廣泛的語音壓縮編碼標(biāo)準(zhǔn)。G.729是國際電信聯(lián)盟(ITU)于2006年制定的8kbps語音編碼協(xié)議,G.729A是G.729標(biāo)準(zhǔn)的簡化版本;G.729B是與G.729(A)配合的靜音壓縮標(biāo)準(zhǔn);G.729AB是指將低復(fù)雜度的G.729A和具有靜音壓縮功能的G.729B聯(lián)合使用的語音編碼標(biāo)準(zhǔn),它在實(shí)際中應(yīng)用最多,已廣泛用于IP電話、視頻會(huì)議系統(tǒng)等領(lǐng)域。AMR是WCDMA移動(dòng)通信系統(tǒng)的自適應(yīng)多速率語音編碼標(biāo)準(zhǔn),它共有8個(gè)速率,其中12.2kbps是其最高速率,該標(biāo)準(zhǔn)在蜂窩移動(dòng)通信系統(tǒng)中發(fā)揮著重要作用。為了實(shí)現(xiàn)IP電話和蜂窩移動(dòng)通信系統(tǒng)之間的互通,需要進(jìn)行G.729AB與AMR編碼器之間的轉(zhuǎn)碼工作。傳統(tǒng)的解決方法是采用先解后編(DecodethenEncode,DTE)方式進(jìn)行轉(zhuǎn)碼,即用源解碼器將傳輸?shù)谋忍亓鬟M(jìn)行解碼,恢復(fù)出重建語音,然后再使用目標(biāo)編碼器對(duì)重建語音進(jìn)行編碼,生成目標(biāo)解碼器可以解碼的碼流。這種方法雖然能夠完成不同編碼器之間的轉(zhuǎn)碼操作,但存在轉(zhuǎn)碼后語音質(zhì)量低、計(jì)算復(fù)雜度高和延時(shí)長等缺點(diǎn)。
技術(shù)實(shí)現(xiàn)要素:本發(fā)明針對(duì)以上問題的提出,而研制一種G.729到AMR12.2速率的轉(zhuǎn)碼方法。本發(fā)明采取的技術(shù)方案如下:將輸入比特流輸入到G.729AB解碼單元,利用G.729AB解碼單元對(duì)輸入比特流進(jìn)行解碼,然后將解碼得到的幀類型、LSP系數(shù)、基音延時(shí)、固定碼本矢量、碼本增益以及合成語音輸入G.729AB到AMR-12.2kbps轉(zhuǎn)碼單元,對(duì)每一部分進(jìn)行相應(yīng)的轉(zhuǎn)碼:根據(jù)解碼得到的幀類型信息來對(duì)目標(biāo)幀的VAD信息做出判斷;將解碼端得到的LSP系數(shù)和整數(shù)基音延時(shí)分別作為編碼端的LSP系數(shù)和開環(huán)基音延時(shí);利用輸入語音與重構(gòu)語音之間的均方誤差最小準(zhǔn)則,同時(shí)采用G.729AB的快速搜索方法和AMR-12.2kbps1/6分辨率,搜索編碼端的閉環(huán)基音延時(shí);用加權(quán)輸入語音和加權(quán)重構(gòu)語音之間的均方誤差最小準(zhǔn)則來搜索固定碼本中的碼矢,在搜索過程中利用量化信號(hào)的最大絕對(duì)值來獲得部分脈沖的位置,同時(shí)減少部分脈沖的搜索個(gè)數(shù)。最后對(duì)各個(gè)參數(shù)進(jìn)行編碼,得到輸出比特流。本發(fā)明的有益效果:為了驗(yàn)證本發(fā)明方法的有效性,進(jìn)行了若干實(shí)驗(yàn)測(cè)試。測(cè)試中,將經(jīng)過轉(zhuǎn)碼后的輸出比特流經(jīng)過AMR-12.2kbps解碼后,得到轉(zhuǎn)碼后的語音,然后對(duì)該語音進(jìn)行測(cè)試。本發(fā)明使用PESQ、MOS-LQO作為轉(zhuǎn)碼后客觀語音質(zhì)量的衡量指標(biāo)。測(cè)試序列選用ITU-T在G.729AB和AMR中提供的10組標(biāo)準(zhǔn)文件,測(cè)試結(jié)果如表3,表3在具體實(shí)施方式里面。從表3中可以看出,本發(fā)明的轉(zhuǎn)碼方法在計(jì)算量上比傳統(tǒng)方式下降了44%左右,PESQ值和MOS-LQO都有所增加。附圖說明圖1G.729AB和AMR編解碼算法原理框圖。圖2G.729AB與AMR幀結(jié)構(gòu)對(duì)應(yīng)圖。圖3G.729AB到AMR12.2kbps轉(zhuǎn)碼裝置。圖4G.729AB到AMR-12.2kbps的轉(zhuǎn)碼。圖5LSP參數(shù)解碼流程圖。圖6基音延時(shí)解碼流程圖。圖7閉環(huán)基音搜索流程圖。圖8固定碼本搜索流程圖。具體實(shí)施方式下面結(jié)合附圖對(duì)本實(shí)用新型最進(jìn)一步說明:G.729AB和AMR是兩種使用廣泛的語音壓縮編碼標(biāo)準(zhǔn)。G.729是國際電信聯(lián)盟(ITU)于2006年制定的8kbps語音編碼協(xié)議,G.729A是G.729標(biāo)準(zhǔn)的簡化版本;G.729B是與G.729(A)配合的靜音壓縮標(biāo)準(zhǔn);G.729AB是指將低復(fù)雜度的G.729A和具有靜音壓縮功能的G.729B聯(lián)合使用的語音編碼標(biāo)準(zhǔn),它在實(shí)際中應(yīng)用最多,已廣泛用于IP電話、視頻會(huì)議系統(tǒng)等領(lǐng)域。AMR是WCDMA移動(dòng)通信系統(tǒng)的自適應(yīng)多速率語音編碼標(biāo)準(zhǔn),它共有8個(gè)速率,其中12.2kbps是其最高速率,該標(biāo)準(zhǔn)在蜂窩移動(dòng)通信系統(tǒng)中發(fā)揮著重要作用。為了實(shí)現(xiàn)IP電話和蜂窩移動(dòng)通信系統(tǒng)之間的互通,需要進(jìn)行G.729AB與AMR編碼器之間的轉(zhuǎn)碼工作。傳統(tǒng)的解決方法是采用先解后編(DecodethenEncode,DTE)方式進(jìn)行轉(zhuǎn)碼,即用源解碼器將傳輸?shù)谋忍亓鬟M(jìn)行解碼,恢復(fù)出重建語音,然后再使用目標(biāo)編碼器對(duì)重建語音進(jìn)行編碼,生成目標(biāo)解碼器可以解碼的碼流。這種方法雖然能夠完成不同編碼器之間的轉(zhuǎn)碼操作,但存在轉(zhuǎn)碼后語音質(zhì)量低、計(jì)算復(fù)雜度高和延時(shí)長等缺點(diǎn)。為了解決上述DTE方式語音轉(zhuǎn)碼存在的問題,本發(fā)明給出了一種在G.729AB與AMR-12.2kbps間高效的轉(zhuǎn)碼方法。該方法在保證語音質(zhì)量的前提下,使轉(zhuǎn)碼算法的計(jì)算復(fù)雜度降低40%以上。該發(fā)明具有轉(zhuǎn)碼后語音質(zhì)量高、計(jì)算復(fù)雜度低、轉(zhuǎn)碼算法延時(shí)小等優(yōu)點(diǎn),從而可降低設(shè)備的成本,保證不同設(shè)備供應(yīng)商間設(shè)備的兼容與互通。G.729AB與AMR均基于CELP語音生成模型,兩個(gè)編碼算法對(duì)于語音信號(hào)的處理過程基本相同。G.729AB和AMR編解碼算法的原理框圖如圖1所示:在編碼端,首先,都需要將輸入語音經(jīng)過預(yù)處理后,通過VAD判決進(jìn)行分類,分為語音幀和非語音幀;然后,根據(jù)不同的幀類型選用不同的編碼方法:對(duì)于語音幀,采用高速率的語音幀編碼算法;對(duì)于非語音幀,采用DTX技術(shù)進(jìn)行編碼處理,將需要傳送的噪聲信息通過SID幀發(fā)送到解碼端;最后,將編碼后的比特流進(jìn)行傳輸。在解碼端,根據(jù)不同的幀類型,選擇不同的解碼算法來生成合成語音:對(duì)非語音幀,采用CNG算法生成合成語音;對(duì)語音幀,采用語音幀解碼算法生成合成語音。最后對(duì)合成語音作一些后置處理以改善音質(zhì)?,F(xiàn)有技術(shù)介紹為了解決DTE方式轉(zhuǎn)碼存在的問題,國內(nèi)外提出了一些轉(zhuǎn)碼方法。下面結(jié)合幾篇外文文獻(xiàn)和專利,對(duì)現(xiàn)有轉(zhuǎn)碼技術(shù)進(jìn)行簡要介紹?,F(xiàn)有技術(shù)簡介(1)2004年,M.Ghenania在文獻(xiàn)“Low-costSmartTranscodingAlgorithmbetweenITU-TG.729(8kbit/s)and3GPPNB-AMR(12.2kbit/s)”中提出了一種G.729與AMR12.2kbit/s之間的轉(zhuǎn)碼方法。其基本思路是:將源解碼器解碼得到的LSP參數(shù)和基音延時(shí)參數(shù)直接賦值給目標(biāo)編碼器;對(duì)于代數(shù)碼書,則利用源編碼器搜索得到的代數(shù)碼書脈沖位置附近的N個(gè)非零脈沖構(gòu)成子代數(shù)碼書;然后,目標(biāo)編碼器在子代數(shù)碼書上,采用目標(biāo)編碼器的代數(shù)碼書搜索算法來得到代數(shù)碼書脈沖位置和符號(hào)。(2)在公開號(hào)為US20050075868A1的美國專利中,申請(qǐng)人公開了一種從EVRC到G.729AB轉(zhuǎn)碼的方法。其基本思路是:通過內(nèi)插EVRC的LSP參數(shù)來得到G.729AB的LSP參數(shù),將EVRC的閉環(huán)基音延時(shí)賦值給G.729AB的開環(huán)基音延時(shí),利用EVRC固定碼本搜索結(jié)果以及G.729AB相關(guān)信號(hào)的最大值來限制G.729AB固定碼本的搜索范圍。現(xiàn)有技術(shù)缺點(diǎn)(1)在目標(biāo)編碼器開啟DTX功能時(shí),需要采用VAD算法來重新判斷當(dāng)前輸入幀的VAD信息,其中VAD操作會(huì)使整體轉(zhuǎn)碼操作的計(jì)算復(fù)雜度增加。(2)閉環(huán)基音搜索部分采用直接參數(shù)轉(zhuǎn)換,雖然可以大幅度降低計(jì)算量,但是語音質(zhì)量下降較多,無法滿足電信用戶的要求。(3)利用源編碼器固定碼本的脈沖搜索結(jié)果來限制目標(biāo)編碼器的固定碼本搜索范圍,使得語音質(zhì)量下降明顯。本發(fā)明技術(shù)方案的詳細(xì)闡述本發(fā)明所要解決的技術(shù)問題(1)在目標(biāo)編碼器開啟DTX功能時(shí),需要采用VAD算法來重新判決當(dāng)前輸入幀的VAD信息,其中VAD操作會(huì)使整體轉(zhuǎn)碼操作的計(jì)算復(fù)雜度增加。(2)閉環(huán)基音搜索部分采用直接參數(shù)轉(zhuǎn)換,雖然可以大幅度降低計(jì)算量,但是語音質(zhì)量下降較多。(3)利用源編碼器固定碼本的脈沖搜索結(jié)果來限制目標(biāo)編碼器的固定碼本搜索范圍,使得語音質(zhì)量下降明顯。為了解決以上技術(shù)問題,在特定速率下,本發(fā)明給出一種有效的轉(zhuǎn)碼方法,在滿足不同編碼器間有效互通的同時(shí),可以降低轉(zhuǎn)碼計(jì)算復(fù)雜度,提升轉(zhuǎn)碼后的語音質(zhì)量。本發(fā)明提供的完整技術(shù)方案如下:本發(fā)明首先利用G.729AB解碼器對(duì)輸入比特流進(jìn)行解碼,得到幀類型、LSP系數(shù)、基音延時(shí)、固定碼本矢量、碼本增益以及合成語音,將合成語音作為輸入語音輸入到AMR編碼器。然后對(duì)每一部分進(jìn)行相應(yīng)的轉(zhuǎn)碼:根據(jù)輸入比特流中的幀類型信息來對(duì)目標(biāo)幀的VAD信息做出判斷;將解碼端得到的LSP系數(shù)和整數(shù)基音延時(shí)分別作為編碼端的LSP系數(shù)和開環(huán)基音延時(shí);利用輸入語音與重構(gòu)語音之間的均方誤差最小準(zhǔn)則,同時(shí)采用G.729AB的快速搜索方法和AMR-12.2kbps1/6分辨率,搜索編碼端的閉環(huán)基音延時(shí);用加權(quán)輸入語音和加權(quán)重構(gòu)語音之間的均方誤差最小準(zhǔn)則來搜索固定碼本中的碼矢,在搜索過程中利用量化信號(hào)的最大絕對(duì)值來獲得部分脈沖的位置,同時(shí)減少部分脈沖的搜索個(gè)數(shù)。最后對(duì)各個(gè)參數(shù)進(jìn)行編碼,得到輸出比特流。G.729AB與AMR-12.2kbps之間轉(zhuǎn)碼的首要問題是幀長不同,G.729AB是對(duì)10ms語音幀進(jìn)行編碼,而AMR-12.2kbps是對(duì)20ms語音幀進(jìn)行編碼。為了解決語音幀長度不同的問題,其對(duì)應(yīng)關(guān)系如圖2所示:將2個(gè)G.729AB語音幀對(duì)應(yīng)1個(gè)AMR語音幀,它們具有相同的子幀結(jié)構(gòu),G.729AB將1個(gè)語音幀分成2個(gè)5ms子幀,AMR將一個(gè)語音幀分成4個(gè)5ms子幀。本發(fā)明給出的G.729AB到AMR-12.2kbps轉(zhuǎn)碼裝置結(jié)構(gòu)圖如圖3所示。該裝置由3個(gè)單元組成:G.729AB解碼單元、G.729AB到AMR-12.2kbps轉(zhuǎn)碼單元和AMR-12.2kbps編碼單元。本發(fā)明具體實(shí)現(xiàn)過程如圖4所示。G.729AB解碼單元G.729AB解碼單元包括比特解析單元、幀類型解碼單元、語音幀解碼單元和非語音幀解碼單元、合成濾波單元。語音幀解碼單元和非語音幀解碼單元包括LSP解碼單元、基音延時(shí)解碼單元、固定碼本解碼單元和增益解碼單元。(1)比特解析單元比特解析單元用于對(duì)輸入比特流的比特分配進(jìn)行解析。語音幀、SID幀、非傳輸幀的有效長度不同,語音幀的有效長度為80bits,SID幀的有效長度為15bits,非傳輸幀的有效長度為0bits。表1和表2分別給出了語音幀和SID幀比特流順序及其對(duì)應(yīng)的參數(shù)說明。(2)幀類型解碼單元根據(jù)輸入有效比特流的長度來判斷幀類型:若長度為80,則為語音幀,ftype=1;若長度為15,則為SID幀,ftype=2;若長度為0,則為不傳輸幀,ftype=0。(3)語音幀解碼單元語音幀解碼單元包括LSP解碼單元、基音延時(shí)解碼單元、固定碼本解碼單元和增益解碼單元。表1語音幀發(fā)送參數(shù)及其順序表2靜音幀發(fā)送參數(shù)及其順序1)LSP解碼單元LSP參數(shù)解碼流程圖如圖5:①根據(jù)L0、L1、L2、L3解析出LSP的量化輸出這里,ξ1i(L1)表示第一級(jí)碼本中序號(hào)為L1的碼矢量中的第i個(gè)參數(shù),ξ2i(L2)表示第二級(jí)低維碼本中序號(hào)為L2的碼矢量中的第i個(gè)參數(shù),ξ3i(L3)表示第二級(jí)高維碼本中序號(hào)為L3的碼矢量中的第i個(gè)參數(shù)。②為避免在量化合成濾波中出現(xiàn)尖銳的震蕩,需調(diào)整解碼后的參數(shù):式(1)中的循環(huán)變量i從2到10取值,每次增加1,每次循環(huán)中執(zhí)行:若滿足條件,則執(zhí)行操作。其中,J為最小距離。這個(gè)調(diào)整要作兩次,第一次J=0.0012,第二次J=0.0006。③計(jì)算當(dāng)前幀m的量化LSF系數(shù)這里,是前幾幀量化輸出,是當(dāng)前幀的量化輸出,是滑動(dòng)平均預(yù)測(cè)器的系數(shù),可以由L0碼書搜索得到。④計(jì)算得到之后,檢查對(duì)應(yīng)濾波器的穩(wěn)定性,步驟如下:Ⅰ、按照的升序重新排列Ⅱ、若則Ⅲ、若則Ⅳ、若則⑤由LSF系數(shù)求出LSP系數(shù)計(jì)算得到的LSP系數(shù)作為G.729AB的第二子幀,第一子幀的LSP系數(shù)用相鄰幀對(duì)應(yīng)的參數(shù)線性內(nèi)插得到:其中,是前一幀10ms的LSP系數(shù),是當(dāng)前10ms幀的LSP系數(shù)。⑥將LSP系數(shù)轉(zhuǎn)換為LP系數(shù)ai,具體步驟如下:Ⅰ、循環(huán)變量i取值范圍從1到5,每次增加1;每次變量i循環(huán)時(shí),執(zhí)行f1(i)=-2q2i-1f1(i-1)+2f1(i-2)操作;Ⅱ、循環(huán)變量j取值范圍從i-1到1,每次減少1;每次循環(huán)變量j循環(huán)時(shí),執(zhí)行f1(j)=f1(j)-2q2i-1f1(j-1)+f1(j-2)操作;其中,f1(0)=1,f1(-1)=0;將q2i-1替換成q2i即可得到f2(i);Ⅲ、由f1(i),f2(i)計(jì)算f1'(i),f2'(i):f1'(i)=f1(i)+f1(i-1),i=1,…,5;f2'(i)=f2(i)+f2(i-1),i=1,…,5Ⅳ、計(jì)算LP系數(shù):2)基音延時(shí)解碼單元基音延時(shí)解碼流程圖如圖6:①計(jì)算奇偶校驗(yàn)位P:由收到的P1前6位異或得到P;②如果P與P0不相同,則認(rèn)為接收發(fā)生了錯(cuò)誤,當(dāng)前幀第一子幀的基音延時(shí)T1用前一幀第二子幀的基音延時(shí)T2來替代;如果P與P0相同,則認(rèn)為接收正確,那么利用收到的基音延時(shí)序號(hào)P1尋找基音延時(shí)的整數(shù)部分和分?jǐn)?shù)部分:如果P1<197,int(T1)=(P1+2)/3+19,frac=P1-3*int(T1)+58;否則,int(T1)=P1-112,frac=0。③第二子幀T2的整數(shù)部分由P2和t_min得到:t_min=int(T1)-5若t_min<20,則t_min=20;t_max=t_min+9若t_max>143則t_max=143;t_min=t_max-9T2解碼:int(T2)=(P1+2)/3-1+t_min,frac=P2-2-3*((P2+2)/3-1)④確定基音延時(shí)后,在給出的整數(shù)延時(shí)k和分?jǐn)?shù)延時(shí)t處,內(nèi)插過去的激勵(lì)resLP(n)來計(jì)算自適應(yīng)碼本矢量v(n):這個(gè)內(nèi)插濾波器b60由在±59處截?cái)嗟臐h明窗截取取樣函數(shù)sinx/x得到,在±60處(b60(60)=0)用0填充,該濾波器的截止頻率為3.6KHz。3)固定碼本解碼單元固定碼本是代數(shù)碼本結(jié)構(gòu),每個(gè)碼本矢量含有N個(gè)非零脈沖,每個(gè)脈沖的幅度或正或負(fù)。脈沖位置由接收到的固定碼本序號(hào)C來得到,脈沖符號(hào)由S碼得到,構(gòu)造固定碼本矢量c(n):c(n)=S0δ(n-C0)+S1δ(n-C1)+S2δ(n-C2)+S3δ(n-C3),n=0,…,39;(6)如果基音延時(shí)的整數(shù)部分T小于子幀長度40,c(n)按照下式修正:4)增益解碼單元增益解碼是在子幀上進(jìn)行的,接收到的增益碼本序號(hào)GA、GB均是2維碼本,利用下式計(jì)算每子幀的自適應(yīng)碼本增益和固定碼本增益相關(guān)因子γ:γ=GA2(GA)+GB2(GB);(9)其中,GA1、GA2、GB1、GB2中的下標(biāo)是維號(hào)。量化固定碼本增益計(jì)算公式如下:其中,g'c是預(yù)測(cè)的固定碼本增益。(4)非語音幀解碼單元非語音幀LSP解碼與語音幀LSP解碼基本相同;基音延時(shí)值通過在范圍[40,103]內(nèi)隨機(jī)產(chǎn)生;固定碼本的脈沖位置及脈沖符號(hào)也是隨機(jī)產(chǎn)生的;自適應(yīng)碼本增益限制在0.5內(nèi),在[0,0.5]范圍內(nèi)隨機(jī)選擇;能量值作為固定碼本增益。(5)合成濾波單元對(duì)于語音幀,將得到的自適應(yīng)和固定碼本矢量分別乘以各自的增益,相加可得激勵(lì)信號(hào);然后將激勵(lì)信號(hào)通過LP合成濾波器得到合成語音信號(hào)。對(duì)于非語音幀,激勵(lì)信號(hào)采用三個(gè)信號(hào)的混合,其中兩個(gè)信號(hào)來自G.729AB的激勵(lì)信號(hào),另一個(gè)來自高斯白噪聲發(fā)生器;將上述得到的激勵(lì)信號(hào)通過LP合成濾波器,得到舒適噪聲信號(hào)。G.729AB到AMR-12.2kbps轉(zhuǎn)碼單元G.729AB到AMR-12.2kbps轉(zhuǎn)碼單元用于得到AMR-12.2kbps編碼所需的參數(shù)。具體步驟如下:(1)VAD部分本發(fā)明屏蔽AMR編碼時(shí)的VAD操作,利用G.729AB解碼得到的幀類型信息判斷AMR-12.2kbps編碼時(shí)VAD的信息,具體作法如下:1)若G.729AB解碼得到的幀類型ftype=1,則VAD_flagG.729AB=1;否則,VAD_flagG.729AB=0。2)根據(jù)連續(xù)兩幀G.729AB的VAD_flag判斷AMR編碼端VAD_flag的值,VAD_flag的值為VAD_flagAMR=VAD_flagG.729AB_1||VAD_flagG.729AB_2,(11)這里,VAD_flagG.729AB_1表示第一幀G.729AB的VAD信息,VAD_flagG.729AB_2表示第二幀G.729AB的VAD信息。(2)LSP部分將G.729AB第2n-1幀和第2n幀的LSP參數(shù),傳遞給AMR-12.2kbps第n幀的第二子幀和第四子幀,即其中,表示G.729AB第2n-1幀的LSP系數(shù),表示G.729AB第2n幀的LSP系數(shù),表示AMR-12.2kbps第n幀的第二子幀,表示AMR-12.2kbps第n幀的第四子幀。第一和第三子幀的LSP系數(shù)由下式得到:將得到LSP系數(shù)轉(zhuǎn)換為LP系數(shù)ai,具體步驟如下:1)循環(huán)變量i取值范圍從1到5,每次增加1;每次變量i循環(huán)時(shí),執(zhí)行f1(i)=-2q2i-1f1(i-1)+2f1(i-2)操作;2)循環(huán)變量j取值范圍從i-1到1,每次減少1;每次循環(huán)變量j循環(huán)時(shí),執(zhí)行f1(j)=f1(j)-2q2i-1f1(j-1)+f1(j-2)操作;其中,f1(0)=1,f1(-1)=0;將q2i-1替換成q2i即可得到f2(i);3)由f1(i),f2(i)計(jì)算f1'(i),f2'(i):f1'(i)=f1(i)+f1(i-1),i=1,…,5;f2'(i)=f2(i)+f2(i-1),i=1,…,54)計(jì)算LP系數(shù):(3)開環(huán)基音搜索部分將G.729AB第2n-1幀和第2n幀的第一子幀閉環(huán)基音參數(shù)作為AMR-12.2kbps第n幀的兩個(gè)開環(huán)基音參數(shù):(4)自適應(yīng)碼本搜索部分本發(fā)明利用G.729AB閉環(huán)基音搜索的思想簡化AMR-12.2kbps整數(shù)部分的搜索過程,并且根據(jù)AMR-12.2kbps的1/6分辨率進(jìn)行分?jǐn)?shù)部分的搜索,具體搜索流程圖如圖7所示:1)計(jì)算基音延時(shí)的搜索范圍[t0_min,t0_max]在第一/第三子幀,t0_min=max{18,TOP-3},t0_max=min{143,TOP+3}。在第二/第四子幀,t0_min=max{18,T1-5},t0_max=min{143,T1+4},其中T1是前一子幀(第一或第三子幀)基音分?jǐn)?shù)延時(shí)的最大整數(shù)部分。2)計(jì)算LP濾波器的殘差信號(hào)resLP(n):其中,s(n)是G.729AB解碼后得到的合成語音;是量化了的預(yù)測(cè)系數(shù)。3)將殘差信號(hào)resLP(n)通過感知加權(quán)合成濾波器,從而得到用于自適應(yīng)碼本搜索的目標(biāo)信號(hào)x(n),即x(n)=resLP(n)*h(n);(19)4)計(jì)算x(n)與h(n)的相關(guān):5)將LP殘差信號(hào)賦值給激勵(lì)信號(hào)u(n):u(n)=resLP(n),n=0,…,39;6)計(jì)算R(k):7)求出R(k)最大值對(duì)應(yīng)的k,即為最佳整數(shù)基音延時(shí)。8)在最佳整數(shù)基音延時(shí)k附近的分?jǐn)?shù)(從-3/6到-3/6,步長為1/6)內(nèi)插R(k):其中,b24是內(nèi)插濾波器系數(shù),t=0,…,5分別對(duì)應(yīng)分?jǐn)?shù)0、1/6、2/6、3/6、-2/6和-1/6。搜索R(k)t的最大值所對(duì)應(yīng)的t,即為最佳分?jǐn)?shù)基音延時(shí)。9)確定基音延時(shí)后,在給出的整數(shù)延時(shí)k和分?jǐn)?shù)延時(shí)t處內(nèi)插過去的激勵(lì)u(n)來計(jì)算自適應(yīng)碼本矢量v(n):其中,b60是內(nèi)插濾波器系數(shù)。10)計(jì)算自適應(yīng)碼本的增益:其中,y(n)=v(n)*h(n)。(5)固定碼本搜索部分固定碼本搜索流程圖如圖8所示:1)計(jì)算固定碼本搜索的目標(biāo)信號(hào)x2(n):其中,y(n)=v(n)*h(n)是自適應(yīng)碼本矢量濾波,是量化了的自適應(yīng)碼本增益。2)計(jì)算x2(n)與h(n)的相關(guān)信號(hào)d(n):3)計(jì)算h(n)的自相關(guān)矩陣Φ,其中Φ的每個(gè)元素按下式計(jì)算:4)計(jì)算量化信號(hào)b(n):5)計(jì)算符號(hào)信號(hào)S(n)=sgn[b(n)]。6)脈沖搜索位置預(yù)選。按量化信號(hào)|b(n)|從大到小的順序重置每個(gè)軌道的脈沖位置。用前M區(qū)的脈沖位置作為搜索脈沖的候選,取M=5。7)記錄|b(n)|最大值的位置及其所在軌道數(shù)。將i0固定在所有軌道中|b(n)|最大值的位置,i1固定在下一軌道中|b(n)|最大值的位置。8)在候選的脈沖搜索位置上,按照AMR編碼標(biāo)準(zhǔn)里的深度優(yōu)先樹方法搜索出其它8個(gè)脈沖的位置,即脈沖{i2,i3}、{i4,i5}、{i6,i7}、{i8,i9}在依次軌道上成對(duì)地、順序地在嵌套環(huán)中搜索出。搜索準(zhǔn)則是使下式最大:其中,mi是第i個(gè)脈沖的位置,N是脈沖的個(gè)數(shù),N=10。9)計(jì)算固定碼本矢量c(n):其中,Si是第i個(gè)脈沖的符號(hào),mi是第i個(gè)脈沖的位置,N是脈沖的個(gè)數(shù),N=10。10)計(jì)算固定碼本增益gc:AMR-12.2kbps編碼單元AMR-12.2kbps編碼單元用于將轉(zhuǎn)碼后的參數(shù)按照AMR-12.2kbps量化方法重新量化后,寫入到輸出比特流。本發(fā)明技術(shù)方案帶來的有益效果為了驗(yàn)證本發(fā)明方法的有效性,進(jìn)行了若干實(shí)驗(yàn)測(cè)試。測(cè)試中,將經(jīng)過轉(zhuǎn)碼后的輸出比特流經(jīng)過AMR-12.2kbps解碼后,得到轉(zhuǎn)碼后的語音,然后對(duì)該語音進(jìn)行測(cè)試。本發(fā)明使用PESQ、MOS-LQO作為轉(zhuǎn)碼后客觀語音質(zhì)量的衡量指標(biāo)。測(cè)試序列選用ITU-T在G.729AB和AMR中提供的10組標(biāo)準(zhǔn)文件,測(cè)試結(jié)果如表3。從表3中可以看出,本發(fā)明的轉(zhuǎn)碼方法在計(jì)算量上比傳統(tǒng)方式下降了44%左右,PESQ值和MOS-LQO都有所增加。表3DTE方法與本發(fā)明方法性能測(cè)試結(jié)果對(duì)比本發(fā)明的實(shí)施在大幅度地降低計(jì)算量的同時(shí),提高了語音質(zhì)量,降低了通信設(shè)備的成本和功耗,因此本發(fā)明具有廣泛的應(yīng)用價(jià)值和前景。以上所述,僅為本發(fā)明較佳的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),根據(jù)本發(fā)明的技術(shù)方案及其發(fā)明構(gòu)思加以等同替換或改變,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。本發(fā)明涉及的縮略語和關(guān)鍵術(shù)語定義如下:AMR:AdaptiveMulti-Rate自適應(yīng)多速率。WCDMA:WidebandCodeDivisionMultipleAccess寬帶碼分多址。IP:InternetProtocol網(wǎng)絡(luò)協(xié)議。CELP:CodeExcitedLinearPrediction碼激勵(lì)線性預(yù)測(cè)。VAD:VoiceActivityDetector語音激活檢測(cè)。DTX:DiscontinuousTransmission不連續(xù)傳輸。CNG:ComfortNoiseGenerator舒適噪音生成。SID:SilenceInsertionDescriptor靜音插入描述。MA:MovingAverage滑動(dòng)平均。LP:LinearPrediction線性預(yù)測(cè)。LPC:LinearPredictiveCoding線性預(yù)測(cè)編碼。LSP:LinearSpectrumPair線譜對(duì)。LSF:LinearSpectrumFrequency線譜頻率。PESQ:PerceptualEvaluationofSpeechQuality主觀語音質(zhì)量評(píng)估。MOS-LQO:MeanOpinionScore–ListeningQualityObjective平均意見分?jǐn)?shù)-客觀聽覺質(zhì)量。ITU-T:InternationalTelecommunicationUnion-Telecommunicationstandardizationsector國際電信聯(lián)盟-電信標(biāo)準(zhǔn)化部門。MOPS:MillionOperationsPerSecond百萬次操作每秒。DTE:DecodethenEncode。