基于原子預選擇的音頻匹配追蹤方法與系統的制作方法【
技術領域:
】[0001]本發明屬于音頻編碼
技術領域:
,尤其涉及一種基于原子預選擇的音頻匹配追蹤方法與系統。【
背景技術:
】[0002]稀疏表示一般指用盡量少的基函數來準確地表示原始信號,從而抓住信號的主要特征,進而從本質上降低信號處理成本。匹配追蹤(MP,Matchingpursuit)作為使用較廣的稀疏表示算法之一,其基本思路是在迭代過程中依次從過完備字典中選擇最優原子,使得信號的逼近更為優化。由于MP算法用來表示信號的過完備字典基可以自適應根據信號本身的特點來靈活地選取;并且其在原子選擇過程中采取的是一種重復迭代逼近的貪婪算法,保證了最終得到的原子系數個數較少,MP算法被廣泛應用于信號分析的各個領域,如圖像處理,生物醫學信號處理,音頻處理等。[0003]隨著人們對流媒體質量要求的提高以及移動終端用戶數量的不斷增加,音視頻編碼效率的要求也日漸提高。傳統匹配追蹤算法因其計算復雜度較高,不適應于實時處理。目前已提出多種快速匹配追蹤算法,如文獻1的聯合字典方法,文獻2的算法改進優化方法,然而這些算法都涉及耗時的優化,或是犧牲稀疏表示效率為補償,計算速度也難以滿足大規模問題的需要,文獻3Krstulovid等人提出一種基于短時Gabor原子的遍歷型算法,利用非完備的定長原子從信號起始端至終端遍歷,多次迭代選擇最優匹配原子得到最終稀疏系數。這一算法字典的數據量非常小,在降低計算復雜度的同時有效減少了存儲計算負擔。[0004]雖然該方法相較于其他稀疏表示算法而言,計算復雜度略有降低,但仍然難以在實時應用中使用。匹配追蹤算法中降低計算復雜度的主要途徑之一為減少其迭代次數,當所使用稀疏字典為短時字典時,對長時信號局部進行MP算法的耗時必將遠遠小于遍歷型MP算法。[0005]文中涉及如下參考文獻:[0006][l]RavelliE,RichardG,DaudetL.UnionofMDCTbasesforaudiocoding[J].Audio,Speech,andLanguageProcessing,IEEETransactionson,2008,16(8):1361-1372.[0007][2]Gharavi-AlkhansariM,HuangTS.Afastorthogonalmatchingpursuitalgorithm[C]//Acoustics,SpeechandSignalProcessing,1998.Proceedingsofthe1998IEEEInternationalConferenceon.IEEE,1998,3:1389-1392.[0008][3]KrstulDviGS,GribonvalR.MPTK:Matchingpursuitmadetractable[C]//Acoustics,SpeechandSignalProcessing,2006.ICASSP2006Proceedings.2006IEEEInternationalConferenceon.IEEE,2006,3:111-111.【
發明內容】[0009]針對現有技術存在的不足,本發明根據能量對聽覺感知的影響,提供了一種基于原子預選擇的音頻匹配追蹤方法與系統,本發明通過依次迭代對信號能量值較高的部分進行匹配跟蹤,在不影響信號最終重構效果的同時縮短了遍歷過程所耗時間。[0010]本發明采用的技術方案如下:[0011]-種基于原子預選擇的音頻匹配追蹤方法,包括:[0012]信號分解和信號重構,其中,信號分解包括步驟:[0013]S1根據原始信號類型選擇短時字典,并以短時字典為稀疏字典;[0014]S2逐一計算原始信號中連續樣本{Si,Si+1,...Si+^丨的能量,i依次取1、2、~length(S)-N+1,提取能量最高的連續樣本,記為Smaxenergy;N為短時字典原子長度;length(S)為原始信號長度;[0015]S3獲得稀疏字典各原子在Smaxe3ne3rgy上的原子權重,原子權重絕對值的最大值為[0016]S4計算彳目號殘差-''SmaxOT啤為~:?對應的原子;冋時,將記錄于當前稀疏系數矩陣的第ioptmax行第joptmax列,ioptmax為&_腿的原子標號,j〇ptmax為的原子中心位置,當前稀疏系數矩陣初始值為零矩陣;[0017]S5當信號殘差達到目標SNR或迭代次數達到預設值時,結束信號分解,輸出當前稀疏系數矩陣;否則,將當前信號殘差flato作為原始信號重復步驟2~5;[0018]信號重構包括:[0019]S7提取當前稀疏系數矩陣中原子權重及其對應的行號、列號;[0020]S8將原子權重分別與對應的原子做乘積得恢復信號,將各恢復信號分別賦值給與步驟1中原始信號長度相同的零向量Mi,以零向量Mi第jc>ptmax個點為恢復信號的中心點,j〇ptmax為當前恢復信號對應原子權重的列號;賦值后的向量依次累加得重構信號。[0021]步驟S2中,原始信號中連續樣本{Si,Si+1,..義+^丨的能量即該連續樣本中所有樣本幅度的平方和。[0022]步驟S2中,原始信號中連續樣本{Si,Si+1,..義+^丨的能量即該連續樣本中所有樣本幅度的絕對值之和。[0023]步驟S2中,原始信號中連續樣本{Si,Si+1,..義+^丨的能量即該連續樣本中所有樣本幅度的最大值。[0024]上述基于原子預選擇的音頻匹配追蹤方法對應的系統,包括:[0025]信號分解單元和信號重構單元,其中,信號分解單元進一步包括:[0026]字典建立模塊101,用來根據原始信號類型選擇短時字典,并以短時字典為稀疏字血.,、,[0027]預處理模塊102,用來逐一計算原始信號中連續樣本的能量,i依次取1、2、…length(S)-N+l,提取能量最高的連續樣本,記為Smaxenergy;N為短時字典原子長度;length(S)為原始信號長度;[0028]權值比較模塊103,用來獲得稀疏字典各原子在Smaxenergy上的原子權重,原子權重絕對值的最大值為\<_;[0029]殘差計算模塊104,用來計算信號殘差*^=^_^胃為對應的原子;同時,將記錄于當前稀疏系數矩陣的第i〇Ptmax行第j〇ptmax列,i〇ptmax為Apmax的原子標號,joptmax為的原子中心位置,當前稀疏系數矩陣初始值為零矩陣;[0030]閾值控制模塊105,用來當信號殘差flater達到目標SNR或迭代次數達到預設值時,結束信號分解,輸出當前稀疏系數矩陣;否則,將當前信號殘差S'latCT作為原始信號輸入預處理模塊102;[0031]信號重構單元進一步包括:[0032]重構系數提取模塊201,用來提取當前稀疏系數矩陣中原子權重及其對應的行號、列號;[0033]信號合成模塊202,用來將原子權重分別與對應的原子做乘積得恢復信號,將各恢復信號分別賦值給與原始信號長度相同的零向量姐,以零向量姐第」_max個點為恢復信號的中心點,j〇Ptmax為當前恢復信號對應原子權重的列號;賦值后的向量依次累加得重構信號。[0034]和現有技術相比,本發明具有如下特點:[0035]本發明通過對信號中短時能量較高的部分進行非完備字典的MP算法,減少了遍歷計算的次數,降低了計算復雜度。在字典構建中,增大了原子的頻率跨度,減少了字典對頻率成分的約束。該稀疏表達算法不受待處理信號長度的限制,字典數據量較小。該發明生成的重構信號相比于其他匹配追蹤快速算法(如KrStiil0:vi6^?法)在音質無下降的同時可以獲得較快的計算速度。【附圖說明】[0036]圖1是本發明實施例信號分解部分的具體流程圖;[0037]圖2是本發明實施例信號重構部分的具體流程圖;[0038]圖3是本發明實施例信號分解子系統結構框圖;[0039]圖4是本發明實施例的信號重構子系統結構框圖;[0040]圖5是原子中心位置示意圖。【具體實施方式】[0041]為了便于本領域技術人員理解和實施,下面結合附圖及實施例對本發明技術方案作進一步詳細描述,應當理解,此處所描述的實施例僅用于說明和解釋本發明,并不用于限定本發明。[0042]圖1~2為本發明方法的具體流程,包括信號分解和信號重構兩大部分。[0043]信號分解的具體實現包括以下步驟:[0044]步驟1,根據原始信號類型選擇短時字典。[0045]本步驟為音頻匹配跟蹤方法中常規步驟。對于語音處理系統,選擇具有語音特性的短時字典;對于瞬變信號處理系統,選擇相對瞬態的短時字典。對于一些特征并不明顯或是同時需要處理多種類型信號的系統,選擇普適性較強的短時字典。[0046]本實施例中,測試樣本包含語言信號、音樂信號等類型,短時字典選擇伸縮性較強的Gabor字典。Gabor字典中原子構建方式如下:[0048]式(1)中,w表示頻率尺度;μ表示時間偏移量;σ表示時間尺度;Aw,μ,。表示w、μ、σ下的原子能量;η表示Gabor原子的時域樣點;gw,μ,σ(η)表示在時域樣點η下原子幅度。[0049]傳統基于Gabor字典的匹配追蹤法在時間偏移量μ取值時,會在字典中原子數目允許的范圍內盡可能多的得到各種尺度的時間偏移量μ。本實施例中μ=0,使得字典中所有原子與預處理中選取的能量值較高的部分信號對應,能量均位于其中心位置。假設η的變化范圍是1~Ν,頻率尺度w、時間尺度〇、原子能量λ共有Μ個組合形式,則字典大小為ΜΧΝ。本實施例中,Μ取20,Ν取1001。[0050]步驟2,原始信號進行預處理,逐一計算原始信號中連續樣本能量,將能量值最高的連續樣本記為Sm_ne3rgy,連續樣本長度即步驟1選擇的短時字典的原子長度N。[0051]下面將提供幾種能量計算方法。[0052](1)根據能量定義計算連續樣本的能量值Energy,如下:[0054]式(1)中,Si為原始信號S的第i個樣本,也用來表示原始信號S第i個樣本的幅度;m為尺度平移量,m依次取0、1、-_16即也(5)4,16即也(5)為原始信號5的長度。[0055](2)由于樣本的幅度平方和與信號的幅度絕對值之和存在類正比關系,另外,樣本幅度絕對值之和的計算量遠小于樣本的幅度平方和的計算量。因此,可采用公式(3)近似計算連續樣本的能量值Energy:[0057]式(3)中,Si為原始信號S的第i個樣本,也用來表示原始信號S第i個樣本的幅度;m為尺度平移量,m依次取0、1、-_當前第1頁1 2