專利名稱:一種基于量化信號域的立體聲及多聲道編解碼方法與系統的制作方法
技術領域:
本發明屬于立體聲/多聲道編碼技術領域,具體地說是一種基于量化信號域的立體聲及多聲道編解碼方法與系統。
背景技術:
與單聲道編碼不同,立體聲及多聲道編碼除了可以利用聲道信號本身的冗余和聲學掩蔽特性來達到壓縮目的外,往往還可以利用聲道間的相關性冗余和互掩蔽效應來進一步壓縮,因此立體聲及多聲道編碼往往能夠以比獨立聲道編碼更低的編碼速率達到相同的編碼質量。這種技術一般稱為聲道耦合技術,在立體聲環境也被稱為立體聲編碼技術。
目前常用的聲道耦合技術可以分為兩大類。一類是在輸入信號的變換域上實現聲道耦合,去除聲道間冗余;另一類是在墑編碼過程中,通過聯合墑編碼的方式來實現去除聲道間冗余。這兩類又可以分別分為有損耦合和無損耦合。
第一類聲道耦合技術如圖1所示。這類聲道耦合技術是目前應用最廣泛的立體聲及多聲道編碼技術。其中以和/差(M/S)聯合立體聲編碼技術為代表,約翰斯頓(Johnston,J.D.)和費里拉(Ferreira,A.J.)1992年在音頻、語音和信號處理國際會議(ICASSP)上發表的《和/差立體聲變換編碼》一文中研究了這種聯合立體聲編碼技術;屬于開源計劃的音頻編碼器Ogg Vorbis中采用的方極坐標映射也屬于其中的一種之一。這種聲道耦合技術是在原始信號的變換域上實現聲道耦合,其優點是參與耦合的值沒有經過縮放,耦合精度較高。但是,由于耦合是在量化前做的,這就改變了量化模塊的輸入信號,因此需要對將用于量化模塊的聲學掩蔽參數進行重新計算和調整。這就帶來了幾個問題1、對于耦合后的聲道需要重新設計聲學模型,而目前對自然聲音的聲學模型內在機理尚且未被完全認識,對這類人為耦合的聲音更只能通過試驗的方法進行逼近。對于一些如方極坐標映射之類的非線性變換,耦合后聲學模型的設計就更加麻煩。2、在解碼端,聲道解耦合將導致量化誤差在聲道間交叉分布,導致聲道泄漏和合成質量下降。3、由于耦合的聲道值沒有經過縮放,因此聲道間的強度差異往往直接影響耦合去相關性的效果。
另一類聲道耦合技術是通過聯合墑編碼的方式去除相關性冗余,如采用多維聯合碼本技術。此類聲道耦合技術將聲道耦合和墑編碼聯系在一起,雖然和本專利中的方案一樣,回避了上述所述的問題,但一方面聲道耦合方式受制于墑編碼形式,約束了去聲道間冗余的技術選擇,另一方面也增加了墑編碼的設計復雜度,碼本的存儲空間以及實現的硬件代價。此外這類聲道耦合技術和傳統的聲道耦合方案之間也存在著兼容性的問題。
發明內容
為了克服現有技術中的不足,本發明的目的在于提供一種基于量化信號域的立體聲及多聲道編解碼方法與系統,以解決量化噪聲在聲道間交織和聲道泄漏問題。
本發明的再一個目的在于提供一種基于量化信號域的立體聲及多聲道編解碼方法與系統,以避免耦合后聲學模型的重新設計。
本發明的第三個目的在于提供一種基于量化信號域的立體聲及多聲道編解碼方法與系統,進一步提高多聲道及立體聲編碼的壓縮效率。
為完成上述發明目的,本發明提供一種基于量化信號域的立體聲及多聲道編碼方法,該方法包括以下步驟1)將經采樣的音頻信號送入時域預處理模塊進行高通濾波、采樣率轉換、比特深度轉換和聲道轉換等預處理,將經過預處理的音頻信號按照頻帶對時域信號進行劃分;2)將經過頻帶劃分的頻域信號進行頻域處理;3)利用聲學模型模塊輸出的聲學掩蔽參數對經頻域處理的信號進行量化;4)對經量化的信號進行聲道耦合,去除聲道對信號間的相關性冗余;5)對去除了相關性冗余的信號進行無損編碼,并將編碼結果輸出。
為完成上述發明目的,本發明還提供一種基于量化信號域的立體聲及多聲解碼方法,該方法包括以下步驟1).將接收到的編碼信號在無損編碼模塊中進行傳輸格式的解封裝,并對解封裝后的信號進行無損解碼;2).將上述無損解碼后的信號在聲道解耦合模塊中進行聲道解耦合;3).對解耦合后的信號在解量化模塊中利用編碼端傳輸的量化步長進行反量化;4).塊根據編碼端的處理在頻域反處理模中進行與編碼端相應的逆向操作,并將得到的信號送入濾波器組/時頻反變換模塊;5).對從頻域反處理模塊輸出的信號在濾波器組/時頻變換模塊中進行反變換;6).將從濾波器組/時頻變換模塊輸出的時域信號在時域后處理模塊中進行后處理,并將處理后的信號送入到音頻發生器。
為完成上述發明目的,本發明還提供一種基于量化信號域的立體聲及多聲道編碼系統,包括音頻信號采樣器、聲學模型模塊、時域預處理模塊、濾波器組/時頻變換模塊、頻域處理模塊、量化模塊,聲道耦合模塊和無損編碼模塊,其特征在于,所述音頻信號采樣器,用于將經采樣的音頻信號送入所述時域預處理模塊;所述時域預處理模塊,對輸入的采樣信號進行高通濾波、采樣率轉換、比特深度轉換和聲道轉換等預處理;所述濾波器組/時頻變換模塊,將經過預處理的音頻信號按照頻帶對時域信號進行劃分;所述頻域處理模塊,將經過頻帶劃分的頻域信號進行頻域處理;所述量化模塊,其輸入端連接頻域處理模塊,輸出端與聲道耦合模塊連接,用于利用聲學模型模塊輸出的聲學掩蔽參數對經頻域處理的音頻信號進行量化;所述聲道耦合模塊,一端連接量化模塊,另一端連接無損編碼模塊,對經量化的信號進行聲道耦合,去除聲道對信號間的相關性冗余;所述無損編碼模塊,對去除了相關性冗余的信號進行無損編碼,并將編碼結果輸出。
為完成上述發明目的,本發明還提供一種基于量化信號域的立體聲及多聲道解碼系統,包括無損解碼模塊、聲道解耦合模塊、解量化模塊、頻域反處理模塊、濾波器組/時頻變換模塊、時域后處理模塊,其特征在于所述無損解碼模塊,用于將接收到的編碼信號進行傳輸格式的解封裝,并對解封裝后的信號進行無損解碼;所述聲道解耦合模塊,其一端連接無損解碼模塊,另一端連接解量化模塊,用于將上述無損解碼后的信號在聲道解耦合模塊中進行聲道解耦合;所述解量化模塊,其輸入端分別與聲道解耦合模塊和無損解碼模塊連接,輸出端連接頻域處理模塊,用于對解耦合后的信號在解量化模塊中利用編碼端傳輸的量化步長進行反量化;所述頻域反處理模塊,根據編碼端的處理進行與編碼端相應的逆向操作,并將得到的信號送入濾波器組/時頻反變換模塊;所述濾波器組/時頻變換模塊,對從頻域反處理模塊輸出的信號進行反變換;所述時域后處理模塊,將從濾波器組/時頻變換模塊輸出的時域信號在時域后處理模塊中進行后處理,并將處理后的信號送入到音頻發生器;所述音頻發生器,將從時域后處理模塊輸出的處理后的信號由作為音頻信號輸出。
本發明具有明顯的優點和積極效果。與傳統的聲道耦合技術相比,本發明將聲道耦合模塊移動到量化模塊后面來實現,即在量化信號域上進行聲道耦合。1、由于這種耦合方式沒有改變量化模塊的輸入,因此不需要對量化模塊中所用到的聲學模型參數進行重新計算。目前人們對于聲學掩蔽模型的內在機理認識還不是非常充分,對于耦合后的這種人為信號的掩蔽模型認識就更不清楚。不用對耦合信號更新聲學掩蔽參數可以有效地回避由不準確的參數估計所帶來的編碼增益降低。2、在解碼端,由于聲道解耦合也是在量化信號域上進行的,不引入量化噪聲,因此有效地解決了量化噪聲在聲道間交織和聲道泄漏等問題。3、由于在量化過程中一般都會通過提取比例因子之類的信息對信號進行歸一化處理,因此在量化信號域上進行聲道耦合處理可以有效回避由于左右聲道強度差異而導致的耦合效果降低問題。4、本發明將去聲道相關性冗余和立體聲及多聲道聲學模型設計分離開來,有利于分別對其進行優化分析,降低了設計復雜度,提供了更強的靈活性。在對立體聲及多聲道聲學模型機理和設計充分認識的前提下,引入聲道間互掩蔽效還可以進一步提高壓縮效率。與聯合墑編碼技術相比,本發明實現去聲道間冗余的技術手段仍然是現有技術中的變換耦合,去聲道相關性冗余的效果取決于變換的正交性,而不是聯合墑編碼的方式。差分編碼是其中的一個特例,它既可以被認為是墑編碼的一種,同時也是正交變換的一種,但是本發明的基本原理與聯合墑編碼技術是不同的,兩者有交集,但都不能被對方所包括。其次,從結構上來說,本發明的聲道耦合模塊與無損墑編碼是兩個獨立的模塊,本發明中的聲道耦合模塊可以是有損的,也可以是無損的,這大大提高了靈活性。再次,由于本發明仍然通過變換耦合的方式去除聲道間的相關性冗余,因此本發明完全兼容現有的立體聲及多聲道耦合技術,傳統聲道耦合技術中采用的聲道耦合映射算法可以直接應用于本發明中。
本發明
具體實施例方式
中提供了一種基于量化信號域(PQCC)的改進方極坐標耦合方法,該方法能有效去除聲道間的相關性冗余,且其實現也較簡單。而原來的方極坐標(SPSC)的性能與立體聲聲學模型的設計存在較大關系,當立體聲聲學模型設計合理時,PQCC和SPSC的編碼性能相當,PQCC同樣也可以利用立體聲聲學模型中的左右聲道互掩蔽效應,但PQCC將去除聲道相關性冗余和立體聲聲學模型分開,具有更好的靈活性。采用該方法可以有效地解決現有技術中存在的耦合聲道聲學模型設計困難、聲道間存在泄漏和量化噪聲交織的問題以及聲道間強度差異對聲道耦合效果的影響問題,此外,本發明的方法將去聲道間相關性冗余和立體聲及多聲道聲學模型分離開來,降低了設計復雜度,靈活性強。
圖1為傳統聲道耦合技術的實現結構示意圖;
圖2為本發明系統原理構成圖;圖3為根據本發明的基于量化信號域的立體聲及多聲道編碼方法的流程圖;圖4為根據本發明的基于量化信號域的立體聲及多聲道解碼方法的流程圖;圖5為根據本發明最佳實施例的基于量化信號域的方極坐標編碼方法流程圖;圖6為啟用聲道耦合的判決框圖;圖7為PQCC、SPSC和獨立雙聲道編碼的ODG得分示意圖。
圖8為圖7所示的來源于MPEG組織的標準測試序列的12個測試序列。
具體實施例方式
下面結合說明書附圖來說明本發明的具體實施方式
。
圖2是本發明的系統構成圖,參見圖2,本發明的系統構成包括編碼系統和解碼系統兩部分。根據本發明的基于量化信號域的立體聲及多聲道編碼系統包括以下裝置音頻信號采樣器,其輸出端與預處理模塊和聲學模型模塊相連,用于采集聲音信號,并送入時域預處理模塊和聲學模型模塊。
時域預處理模塊,其輸入端連接音頻信號采樣器,輸出端與濾波器組/時頻變換模塊相連,用于將音頻信號進行預處理,如高通濾波、采樣率轉換、比特深度轉換和聲道轉換等。高通濾波是將低頻濾去的一種濾波技術。采樣率轉換的作用是將一種采樣率轉換為另一種采樣率。比特深度轉換是將不同的輸入比特深度轉換為編碼器要求的比特深度。聲道轉換是將輸入的聲道數轉換為編碼器所要求的聲道數。
濾波器組/時頻變換模塊,其輸入端連接時域預處理模塊,輸出端與頻域處理模塊連接,用于按照頻帶對時域信號進行劃分。主要方法是將經過預處理的音頻信號變換到頻域上或者進行帶通濾波。濾波器組和時頻變換是并列的兩種技術,可以單獨使用也可以聯合使用,這兩種技術的目的都是將時域信號按照頻帶劃分,濾波器組是利用一系列互相相鄰的帶通濾波器來實現其功能的,時頻變換是利用正交變換來實現的。
頻域處理模塊,其輸入端連接濾波器組/時頻變換模塊,輸出端與量化模塊相連,用于將經過帶通濾波或者時頻變換的頻域信號進行頻域處理,如噪聲整形和頻域預測等。噪聲整形的目的是使噪聲主要集中到掩蔽能力強的信號位置,在信號掩蔽能力弱的位置減少噪聲的生成,頻域預測是通過線性預測去掉信號間的相關性。
量化模塊,其輸入端連接頻域處理模塊,輸出端分別與聲道耦合模塊和無損編碼模塊連接,用于利用聲學模型模塊輸出的聲學掩蔽參數對經頻域處理的信號進行量化,并送入聲道耦合模塊和無損編碼模塊。不考慮速率控制的量化模塊是一個量化器,用預定的步長對其進行量化。
聲道耦合模塊,其輸入端連接量化模塊,輸出端連接無損編碼模塊,用于去除聲道對信號之間的相關性冗余。其主要方法是通過變換耦合去除相關性冗余,優選的耦合方式為正交變換耦合。通過變換耦合可以將原來在多個聲道中重復存在的冗余信息映射到同一個域上,從而減少了信號間的相關性,變換的正交性決定了這種去除相關性冗余的效果。
無損編碼模塊,其輸入端連接聲道耦合模塊,用于對去除了聲道間相關性冗余的信號進行無損編碼,并將編碼結果按傳輸所需要的格式進行封裝輸出。最簡單的無損編碼模塊的功能就是查表操作。
參見圖2,根據本發明的一種基于量化信號域的立體聲及多聲道解碼系統,包括以下裝置無損解碼模塊、聲道解耦合模塊、解量化模塊、頻域反處理模塊、濾波器組/時頻反變換模塊、時域后處理模塊和音頻信號發生器。
無損解碼模塊執行編碼端無損編碼模塊的逆處理,其輸出端與聲道解耦合模塊連接,用于將傳輸格式解封裝,并對解封裝后信號進行無損解碼。
聲道解耦合模塊執行編碼端聲道耦合模塊的逆處理,其輸入端連接無損解碼模塊,輸出端連接解量化模塊,用于對無損解碼后的信號進行解耦合。
解量化模塊執行編碼端量化模塊的逆處理,其輸入端與聲道解耦合模塊連接,輸出端連接頻域反處理模塊,用于將解耦合后的信號進行反量化。
頻域反處理模塊執行編碼端頻域處理模塊的逆處理,其輸入端連接解量化模塊,輸出端連接濾波器組/時頻反變換模塊,用于將解量化的信號按照編碼端的處理進行與其相應的逆向操作,并將得到的信號送往濾波器組/時頻反變換模塊。
濾波器組/時頻反變換模塊執行編碼端濾波器組/時頻變換模塊的逆處理,其輸入端與頻域反處理模塊連接,輸出端與時域后處理模塊連接。用于對頻域反處理模塊輸出的經過頻域反處理的信號進行逆濾波或者時頻反變換,并將輸出的時域信號送往時域后處理模塊。
時域后處理模塊,其輸入端與濾波器組/時頻反變換模塊連接,輸出端直接與音頻信號發生器連接,用于按照輸出設備和應用環境的需要對時域信號進行各種轉換或者增強處理,最后將符合要求的音頻信號送往音頻信號發生器。
音頻信號發生器代表了音頻信號的播放或者存儲操作,其輸入端與時域后處理模塊連接。
圖3為根據本發明的基于量化信號域的立體聲及多聲道編碼方法的流程圖。下文將參考圖3,對本發明的立體聲及多聲道編碼方法進行詳細描述。
首先,在步驟301,對輸入的音頻信號進行采樣,并將采樣所得的音頻信號送入時域預處理模塊和聲學模型模塊。
在步驟302,時域預處理模塊對采樣后的音頻信號進行預處理,預處理包括高通濾波、采樣率轉換、比特深度轉換和聲道轉換等。并將經過預處理的信號送入聲學模型模塊。
然后,在步驟303,濾波器組/時頻變換模塊將在步驟302中經過預處理的音頻信號變換到頻域上或進行帶通濾波,按照頻帶對時域信號進行劃分。
在步驟304,頻域處理模塊將經過頻帶劃分的頻域信號進行頻域處理。之后,流程進入到步驟305。
在步驟305,量化模塊利用聲學模型模塊輸出的聲學掩蔽參數對經頻域處理的信號進行量化,并送入聲道耦合模塊和無損編碼模塊。掩蔽參數為聲學模型根據輸入信號計算所得的人耳在當前信號下對噪聲的敏感程度,量化模塊根據該參數并結合輸出速率的要求確定當前的量化精度。量化過程中包括通過提取比例因子信息對信號進行歸一化處理的步驟。歸一化過程可描述為假設比例因子為SF,歸一化前信號為x,則歸一化后信號為x/f(SF),其中f(SF)為變量SF的函數。
在步驟306,聲道耦合模塊去除聲道對信號間的相關性冗余,其常用正交變換耦合技術。最后,在步驟307,無損編碼模塊對聲道耦合后的信號進行無損編碼,并將編碼結果按所需的傳輸格式進行封裝輸出。
圖4為根據本發明的基于量化信號域的立體聲及多聲道解碼方法的流程圖。下面將參考圖4,對本發明的立體聲及多聲道解編碼方法進行詳細描述。
首先,在步驟401,無損解碼模塊對傳輸格式進行解封裝,并對解封裝后的信號進行無損解碼,分別提取出量化頻譜、耦合標志信息、量化步長信息以及其他輔助信息。
然后,在步驟402,聲道解耦合模塊根據耦合標志信息,對從無損解碼模塊輸出的無損解碼后的信號進行聲道解耦合,當耦合標志信息指示啟用聲道耦合時,對其進行解耦合處理,否則直接將信號傳遞到解量化模塊。
在步驟403,解量化模塊根據量化步長信息,對解耦合后的信號進行反量化,解量化后,流程進入到步驟404。
接下來,在步驟404,頻域反處理模塊根據輔助信息,按照編碼端的處理進行與編碼端相應的逆向操作,并將得到的信號送入濾波器組/時頻反變換模塊;在步驟405,濾波器組/時頻變換模塊對從頻域反處理模塊輸出的信號進行反變換。
在步驟406,時域后處理模塊將從濾波器組/時頻變換模塊輸出的時域信號進行后處理,并將處理后的信號送入到音頻發生器。
最后,在步驟407,音頻發生器將從時域后處理模塊輸出的處理后的信號作為音頻信號輸出。
圖5為根據本發明實施例的基于量化信號域的方極坐標編碼系統框圖。參見圖5,其中示出了根據本發明最佳實施例的采用改進的方極坐標立體聲編碼技術而實現的基于量化信號域的立體聲及多聲道編碼系統。
方極坐標映射如下所示,式(1)為編碼端的耦合公式,式(2)為解碼端的解耦合公式。
ma=labs(l-r),abs(l)>abs(r)r-abs(l-r),else---(1)]]>lr=mm-sign(m)*a,a>0m+sign(m)*am,else---(2)]]>由上述兩式可以看出,這種變換映射與和/差(M/S)映射不同,是一種非革命線性的映射關系,并且存在著聲道間的混疊,因此,傳統聲道耦合框架中存在的問題對其影響將更加嚴重,從而降低去相關性冗余所帶來的編碼增益。采用本發明的基于量化信號域的立體聲及多聲道編碼方法可以有效避免這些問題,并且便于實現和優化。
下面參照圖5描述本實施例的改進的方極坐標立體聲編解碼系統如圖5所示,改進的方極坐標立體聲編解碼系統主要包括時域預處理模塊,時域后處理模塊,濾波器組/時頻變換模塊,濾波器組/時頻反變換模塊,聲學模型模塊,頻域處理模塊,頻域反處理模塊,量化模塊,反量化模塊,聲道耦合模塊,無損編碼模塊,無損解碼模塊等。
時域預處理模塊,該模塊將輸入音頻信號進行高通濾波,采樣率轉換、比特深度轉換,聲道轉換等預處理操作。位于本系統解碼端的時域后處理模塊,它是上述時域預處理模塊在解碼端的對應模塊,但并不一定完全為其逆操作。時域后處理模塊除了執行時域預處理模塊中必要的逆操作以外,還根據輸出音頻設備的要求,對其輸入信號進行相應的格式轉換以及增強處理。
經過預處理的音頻信號由濾波器組/時頻變換模塊變換到頻域上或進行帶通濾波,劃分信號的頻帶。位于該系統解碼端的濾波器組/時頻反變換模塊執行上述濾波器組/時頻變換模塊的逆操作。
聲學模型模塊利用輸入音頻信號根據音頻的聲學機理和試驗模型提取聲學掩蔽參數,該掩蔽參數將作為指導信息,用于量化模塊的量化過程。
經過帶通濾波或者時頻變換的頻域信號利用頻域處理模塊進行噪聲整形、頻域預測等頻域處理。位于該系統解碼端的頻域反處理模塊為其逆模塊。
量化模塊利用聲學模型模塊輸出的聲學掩蔽參數對頻域處理模塊的輸出信號進行量化。解碼端的反量化模塊為其逆模塊。
聲道耦合模塊包括兩部分,分別執行聲道耦合判決操作和聲道之間的變換耦合。當判決模塊經判決后啟用變換耦合時(下文將詳細描述該操作過程),聲道耦合模塊進行變換耦合,并輸出耦合后信號,否則直接輸出輸入信號。解碼端的聲道解耦合模塊為其逆模塊,負責聲道之間的解耦合。在改進的方極坐標立體聲編解碼方案中,此處采用方極坐標映射方式,但這只是一個示例,其他變換同樣適用于聲道耦合模塊。當編碼為多聲道編碼時,所需變動只是變換維數的增加而已。
無損編碼模塊負責將信號進行無損編碼壓縮,并將編碼結果封裝成傳輸所需要的格式。解碼端的無損解碼模塊為其逆模塊。
是否啟用聲道耦合的判決過程可以根據圖6所示的聲道耦合模塊中聲道耦合判決的流程圖來決定。將未耦合的信號送入聲道耦合模塊進行耦合,并將該信號送到無損編碼模塊進行無損編碼;無損編碼模塊對聲道耦合模塊輸出的耦合后信號進行無損編碼;比較耦合信號的編碼比特數與未耦合信號的編碼比特數;判斷耦合后編碼比特數是否減少,減少則采用聲道耦合編碼方式,否則不采用聲道耦合編碼。
在本發明的無損編碼模塊中,當采用聲道耦合編碼模式時,為了進一步提高編碼效率,對量化模塊中提取的歸一化因子采取聲道間差分編碼的方案。
假設聲道0的第m個歸一化因子為N(0,m),聲道1的第m個歸一化因子為N(1,m),則差分編碼后的歸一化因子為N′(0,m)=N(0,m)-N(0,m-1)N′(1,m)=N(1,m)-N(0,m)]]>
即主聲道的歸一化因子按照常規的差分編碼進行,耦合聲道的歸一化因子在聲道間進行差分編碼。
圖7給出了改進的基于量化信號域的立體聲及多聲道編碼方法(PQCC,Post-quantization coupling coding)、方極坐標立體聲編碼(SPSC,Square-polar stereo coding)和獨立雙聲道編碼(dual-channelcoding)的客觀損傷等級(ODG,objective degradation grade)示意圖。參見圖7,比較的雙方都是基于相同的聲學模型即國際標準化組織ISO聲學模型II,所不同的只在于聲道耦合模塊的處理過程。本發明采用評估方式得出的客觀損傷等級(ODG)對編碼結果進行比較。PQCC方法、SPSC方法的平均ODG得分分別為-1.16,-1.53。本發明的方案要明顯優于原來的SPSC方法,其關鍵之處在于原來方極坐標映射的聲學模型設計困難,部分序列采用SPSC耦合后編碼質量反而不如采用獨立雙聲道的編碼結果,參見圖8中的sc01,sc03,sm01,sm02,sm03序列(序列所對應的音頻內容見圖8的附表)。
試驗結果證明,聲道間的相關性在量化信號域上仍能得到有效的保持,本發明的基于量化信號域的聲道耦合方法是可行的。在理論上,當SPSC的耦合信號聲學模型設計合理時,SPSC的編碼質量與本發明中的編碼方案的編碼質量是相當的,而且本發明中的PQCC方案同樣可以利用立體聲聲學模型中的左右聲道互掩蔽效應,只需在設計聲學模型時將其考慮在內即可。但是由于本發明中將去除聲道間相關性冗余和立體聲及多聲道聲學模型分離開來,降低了設計復雜度,其實現要更簡單靈活,且易于實施。
以上所述僅為本發明的優選實施例而已,并不用于限制本發明,對于本領域的技術人員來說,本發明可以有各種更改和變化。凡在本發明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發明的權利要求范圍之內。
權利要求
1.一種基于量化信號域的立體聲及多聲道編碼方法,該方法包括以下步驟1)將經采樣的音頻信號送入時域預處理模塊進行高通濾波、采樣率轉換、比特深度轉換和聲道轉換等預處理;2)將經過預處理的音頻信號按照頻帶對時域信號進行劃分;3)將經過頻帶劃分的頻域信號進行頻域處理;4)利用聲學模型模塊輸出的聲學掩蔽參數對經頻域處理的信號進行量化;5)對經量化的信號進行聲道耦合,去除聲道對信號間的相關性冗余;6)對去除了相關性冗余的信號進行無損編碼,并將編碼結果輸出。
2.根據權利要求1所述的基于量化信號域的立體聲及多聲道編碼方法,其中,所述步驟5中的去除聲道對信號間的相關性冗余采用變換耦合方法。
3.根據權利要求2所述的基于量化信號域的立體聲及多聲道編碼方法,其特征在于,所述步驟5中的聲道耦合是采用方極坐標映射來耦合。
4.根據權利要求2所述的基于量化信號域的立體聲及多聲道編碼方法,其中所述步驟5中的變換為整數變換。
5.根據權利要求1所述的基于量化信號域的立體聲及多聲道編碼方法,其中,所述步驟4的量化步驟還包括通過提取比例因子信息對信號進行歸一化處理的步驟,所述比例因子在步驟5中采用聲道間差分編碼方式進行編碼。
6.根據權利要求1所述的基于量化信號域的立體聲及多聲道編碼方法,其特征在于,所述步驟6進一步包括以下步驟6.1)、將未經聲道耦合的信號送入聲道耦合模塊進行耦合,并將該信號送到無損編碼模塊進行無損編碼;6.2)、無損編碼模塊對聲道耦合模塊輸出的經過變換耦合的信號進行無損編碼;6.3)、比較耦合后信號的無損編碼比特數與未進行聲道耦合信號的無損編碼比特數;6.4)、判斷耦合后編碼比特數相對于未耦合的編碼比特數是否減少,減少則采用聲道耦合編碼方式,否則不采用聲道耦合編碼。
7.一種基于量化信號域的立體聲及多聲解碼方法,該方法包括以下步驟1).將接收到的編碼信號在無損編碼模塊中進行傳輸格式的解封裝,并對解封裝后的信號進行無損解碼;2).將上述無損解碼后的信號在聲道解耦合模塊中進行聲道解耦合;3).對解耦合后的信號在解量化模塊中利用編碼端傳輸的量化步長進行解量化;4).根據編碼端的處理在頻域反處理模中進行與編碼端相應的逆向操作,并將得到的信號送入濾波器組/時頻反變換模塊;5).對從頻域反處理模塊輸出的信號在濾波器組/時頻變換模塊中進行反變換;6).將從濾波器組/時頻變換模塊輸出的時域信號在時域后處理模塊中進行后處理,并將處理后的信號送入到音頻發生器。
8.根據權利要求7所述的基于量化信號域的立體聲及多聲道解碼方法,其中,所述步驟2中的解耦合是采用變換耦合來進行。
9.根據權利要求8所述的基于量化信號域的立體聲及多聲道解碼方法,其特征在于,所述步驟2中的聲道解耦合是采用方極坐標映射來進行。
10.根據權利要求8所述的基于量化信號域的立體聲及多聲道解碼方法,其中所述步驟2中所采用的變換為整數變換。
11.根據權利要求7所述的基于量化信號域的立體聲及多聲道解碼方法,其中,所述步驟3的解量化步驟還包括通過提取比例因子信息對信號進行反歸一化處理的步驟,所述比例因子在步驟2中采用聲道間差分編碼方式進行編碼。
12.根據權利要求7所述的基于量化信號域的立體聲及多聲道解碼方法,其特征在于,所述步驟2進一步包括以下步驟2.1)、聲道解耦合模塊根據耦合標志信息,對從無損解碼模塊輸出的無損解碼后的信號進行聲道解耦合,當耦合標志信息指示啟用聲道耦合時,對其進行解耦合處理,否則直接將信號傳遞到解量化模塊。
13.一種基于量化信號域的立體聲及多聲道編碼系統,包括音頻信號采樣器、聲學模型模塊、時域預處理模塊、濾波器組/時頻變換模塊、頻域處理模塊、量化模塊,聲道耦合模塊和無損編碼模塊,其特征在于,所述音頻信號采樣器,用于將經采樣的音頻信號送入所述時域預處理模塊;所述時域預處理模塊,對輸入的采樣信號進行高通濾波、采樣率轉換、比特深度轉換和聲道轉換等預處理;所述濾波器組/時頻變換模塊,將經過預處理的音頻信號按照頻帶對時域信號進行劃分;所述頻域處理模塊,將經過頻帶劃分的頻域信號進行頻域處理;所述量化模塊,其輸入端連接頻域處理模塊,輸出端與聲道耦合模塊連接,用于利用聲學模型模塊輸出的聲學掩蔽參數對經頻域處理的音頻信號進行量化;所述聲道耦合模塊,一端連接量化模塊,另一端連接無損編碼模塊,對經量化的信號進行聲道耦合,去除聲道對信號間的相關性冗余;所述無損編碼模塊,對去除了相關性冗余的信號進行無損編碼,并將編碼結果輸出。
14.根據權利要求13所述的基于量化信號域的立體聲及多聲道編碼系統,其中,所述聲道耦合模塊采用變換耦合來去除聲道對信號間的相關性冗余。
15.根據權利要求14所述的基于量化信號域的立體聲及多聲道編碼方法,其特征在于,所述聲道耦合模塊采用方極坐標映射來進行聲道耦合。
16.根據權利要求14所述的基于量化信號域的立體聲及多聲道編碼系統,其中所述聲道耦合模塊采用的變換為整數變換。
17.根據權利要求13所述的基于量化信號域的立體聲及多聲道編碼系統,其中,所述量化模塊,還包括通過提取比例因子信息對信號進行歸一化處理,所述比例因子在所述無損編碼模塊中采用聲道間差分編碼方式進行編碼。
18.根據權利要求13所述的基于量化信號域的立體聲及多聲道編碼系統,其特征在于,所述聲道耦合模塊,將未經聲道耦合的信號在聲道耦合模塊中進行耦合,還將該未經聲道耦合的信號送到無損編碼模塊進行無損編碼;所述無損編碼模塊,對聲道耦合模塊輸出的經過變換耦合的信號進行無損編碼;比較耦合后信號的無損編碼比特數與未進行聲道耦合信號的無損編碼比特數;判斷耦合后編碼比特數相對于未耦合的編碼比特數是否減少,減少則采用聲道耦合編碼方式,否則不采用聲道耦合編碼。
19.一種基于量化信號域的立體聲及多聲道解碼系統,包括無損解碼模塊、聲道解耦合模塊、解量化模塊、頻域反處理模塊、濾波器組/時頻變換模塊、時域后處理模塊,其特征在于,所述無損解碼模塊,用于將接收到的編碼信號進行傳輸格式的解封裝,并對解封裝后的信號進行無損解碼;所述聲道解耦合模塊,其一端連接無損解碼模塊,另一端連接解量化模塊,用于將上述無損解碼后的信號在聲道解耦合模塊中進行聲道解耦合;所述解量化模塊,其輸入端分別與聲道解耦合模塊和無損解碼模塊連接,輸出端連接頻域處理模塊,用于對解耦合后的信號在解量化模塊中利用編碼端傳輸的量化步長進行反量化;所述頻域反處理模塊,根據編碼端的處理進行與編碼端相應的逆向操作,并將得到的信號送入濾波器組/時頻反變換模塊;所述濾波器組/時頻變換模塊,對從頻域反處理模塊輸出的信號進行反變換;所述時域后處理模塊,將從濾波器組/時頻變換模塊輸出的時域信號在時域后處理模塊中進行后處理,并將處理后的信號送入到音頻發生器;所述音頻發生器,將從時域后處理模塊輸出的處理后的信號由作為音頻信號輸出。
20.根據權利要求19所述的基于量化信號域的立體聲及多聲道解碼系統,其中,所述聲道解耦合模塊中的解耦合是采用變換耦合來進行。
21.根據權利要求20所述的基于量化信號域的立體聲及多聲道解碼系統,其特征在于,所述聲道解耦合模塊中的聲道解耦合是采用方極坐標映射來進行。
22.根據權利要求20所述的基于量化信號域的立體聲及多聲道解碼系統,其中所述聲道解耦合模塊中所采用的變換為整數變換。
23.根據權利要求19所述的基于量化信號域的立體聲及多聲道解碼系統,其中,所述解量化模塊中進行的解量化包括通過提取比例因子信息對信號進行反歸一化處理,所述比例因子在聲道解耦合模塊中采用聲道間差分編碼方式進行編碼。
24.根據權利要求19所述的基于量化信號域的立體聲及多聲道解碼系統,其特征在于所述聲道解耦合模塊,根據耦合標志信息,對從無損解碼模塊輸出的無損解碼后的信號進行聲道解耦合,當耦合標志信息指示啟用聲道耦合時,對其進行解耦合處理,否則直接將信號傳遞到解量化模塊。
全文摘要
本發明是一種基于量化信號域的立體聲及多聲道編解碼方法與系統。量化模塊輸入端連接頻域處理模塊,輸出端與聲道耦合模塊和無損編碼模塊連接,聲道耦合模塊一端連接量化模塊,另一端連接無損編碼模塊,用于對聲道對進行變換耦合。將音頻信號送入進行預處理并將按照頻帶對時域信號進行劃分;將經過頻帶劃分的頻域信號進行頻域處理;量化經頻域處理的信號;去除聲道對信號間的相關性冗余;對去除了相關性冗余的信號進行無損編碼并將編碼結果輸出。本發明將聲道耦合模塊移動到量化模塊后面來實現,不需重新計算聲學模型參數,解決了量化噪聲在聲道間交織、聲道泄漏和耦合后聲學模型設計困難等問題,利于優化分析,設計復雜度低,靈活性高。
文檔編號H04R5/00GK1787078SQ200510114198
公開日2006年6月14日 申請日期2005年10月25日 優先權日2005年10月25日
發明者李迅, 陳水仙 申請人:芯晟(北京)科技有限公司