本發明涉及基音頻率檢測方法,特別是一種極低信噪比環境下的基音頻率檢測方法。
背景技術:
基音頻率檢測作為語音的基本參數,在語音分析合成以及語音分離等語音處理領域有著廣泛的用途。準確可靠地估計并提取基音頻率對語音信號處理至關重要。高信噪比的基音頻率檢測已經十分成熟,但這些方法在低信噪比環境下難以較好效果,特別是極低信噪比環境下的檢測效果很差。鑒于此,本發明提供一種極低信噪比環境下的基音頻率檢測方法。
技術實現要素:
針對現有技術在極低信噪比環境下的進行基音頻率檢測有著明顯不足,本發明提供了一種極低信噪比環境下的基音頻率檢測方法。該方法包括以下步驟:
1.訓練過程:
(1)對語音數據庫按時間順序作語音分幀{frm(1),frm(2),…,frm(n)},并利用標準算法提取語音幀的基音頻率f0作為基音頻率真實值,并構成序列{f0(1),f0(2),…,f0(n)},其中n為語音幀的總數;
(2)在純凈語音幀基礎上疊加噪聲制作新的語音分幀序列{frmnoise(1),frmnoise(2),…,frmnoise(n)},并利用pefac算法將語音幀信號轉化為相對應的特征波形序列
(3)利用優化因子與特征波形一起構造蟻群路徑的適應度函數,并進行全局搜索,直至得到最佳優化因子。其中優化因子為未知的m維向量α=[α1,α2,…,αm],優化因子優化之后的特征波形
蟻群的訓練過程具體步驟為:
步驟一:令α=[α1,α2,…,αi,…,αm],單維取值范圍[xdownxup],搜索精度prec,則αi∈{xdown+prec,xdown+2*prec,…,+l*prec},
其中,floor(·)為取整函數。α被劃分為m×l個節點,節點αij與信息素τij及啟發式信息ηij相關聯,為αi=xdown+j*preci的期望,啟發式信息ηij=1/δdij,其中
步驟二:路徑的構建,第k只螞蟻走到節點(i,j)的概率為:
步驟三:信息素更新:當所有螞蟻構建好路徑,各節點上的信息素按如下公式更新:
第k只螞蟻在所在節點上釋放的信息素為
步驟四:終止條件為滿足最大迭代次數即可,此時最佳路徑對應的α值即αoptimal。
2.測試過程:
(1)對測試語音信號進行分幀處理,并提取其基音特征波形
(2)利用最佳優化因子αoptimal優化,即構造優化后的基音特征波形
(3)識別并找出
本發明的上述技術方案與現有技術方案相比較,具有以下優點:
a、采用pefac算法提取特征波形,繼承了其低信噪比環境下抑制噪聲的優點;
b、采用蟻群優化算法搜索最佳優化因子,使得優化之后的所得到的基音頻率估計值在低信噪比環境下更接近于真實基音頻率值;
附圖說明
圖1是根據本發明的一個實施例構成的系統方框圖;
具體實施方式
本發明提出的極低信噪比環境下的基音頻率檢測方法結合附圖及實施例進一步說明如下:
本發明的方法流程如圖1所示,包括以下步驟:
1.訓練過程:
(1)對語音數據庫按時間順序分幀;
(2)并利用標準算法提取語音幀的基音頻率作為基音頻率真實值;
(3)對疊加有噪聲的語音庫信號按時間順序分幀并利用pefac算法將語音幀信號轉化為相對應的基音特征波形;
(4)利用優化因子作為未知參數與基音特征波形一起構造蟻群適應度函數,并進行全局搜索,直至得到最佳優化因子。
2.測試過程:
(1)對特測試的語音信號分幀;
(2)將語音幀信號轉化為其相對應的基音特征波形;
(3)利用已訓練好的最佳優化因子對基音特征波形進行優化,從而生成優化后的基音特征波形,并計算出優化后的基音特征波形的最大峰值所對應的頻率作為基音頻率的估計值。
本發明上述方法各步驟的具體實施例詳細說明如下:
上述訓練過程步驟(1)中的語音庫實施例為timit國際標準數據庫,30名男性和30名女性的語音,每人語音時長20分鐘,總時長為20小時。按時間分幀的采樣率為16khz,每幀數據的為160個采樣點;上述訓練過程步驟(2)提取語音庫基音頻率的標準方法為praat算法工具;
上述訓練過程步驟(3)疊加的噪聲信號類型為高斯白噪聲,且語音分幀方法與步驟(1)一致,將幀格式語音信號轉化為基音特征波形的算法為pefac算法,其算法流程如下:
(a)將語音幀信號通過短時傅里葉變換映射到頻域,并作標準化處理成為xt′(q),其中q為對數化頻率,即q=log(f)。
(b)對xt′(q)卷積運算生成基音特征波形
上述訓練過程步驟(4)中的優化因子的實施例為10維向量,且每一維的取值范圍為0.5~1.5。基音特征波形為維度為250維的頻域向量信號,頻域跨度為60~400hz的基音頻域最大范圍;
優化因子α與基音特征波形
蟻群訓練參數設置,如優化因子單維取值范圍[0.51.5],搜索精度0.01,α=2.5,β=2.5,ρ=0.5,蟻群總數為100,最大迭代次數為60信息素釋放函數實施例
上述測試過程步驟(1)中的分幀方法與訓練過程步驟(1)中保持一致;上述測試過程步驟(2)中的基音特征波形轉化方法與訓練過程步驟(3)保持一致;
上述測試過程步驟(3)中的基音特征波形優化運算與上述訓練過程步驟(4)保持一致,且優化因子采用訓練產生的最佳優化因子αoptimal。