共振峰依賴的語音信號(hào)增強(qiáng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及語音信號(hào)處理中的降噪。
【背景技術(shù)】
[0002] 常見的降噪算法對(duì)嘈雜的信號(hào)中存在的噪聲類型做出假設(shè)。例如,維納濾波器引 入均方差(MSE)成本函數(shù)作為目標(biāo)距離測(cè)量,以最優(yōu)地最小化期望的信號(hào)與經(jīng)濾波的信號(hào) 之間的距離。然而,MSE不能說明人類對(duì)信號(hào)質(zhì)量的感知。另外,濾波算法通常獨(dú)立地應(yīng)用 于頻率箱中的每個(gè)。因此,所有類型的信號(hào)被同等處置。這允許在許多不同情形下的良好 的降噪性能。
[0003] 然而,汽車環(huán)境中的移動(dòng)通信情況是特殊的,這時(shí)因?yàn)樗鼈儼Z音作為它們期 望的信號(hào)。行駛過程中存在的噪聲的主要特征在于具有較低頻率的漸增的噪聲水平。語音 信號(hào)處理開始于來自語音感測(cè)麥克風(fēng)的輸入音頻信號(hào)。麥克風(fēng)信號(hào)表不多個(gè)不同聲源的混 合物。除語音分量外,麥克風(fēng)信號(hào)中的所有其他聲源分量都充當(dāng)不期望的噪聲,所述不期望 的噪聲使得對(duì)語音分量的處理復(fù)雜化。在中度到高度噪聲境況中從噪聲分量中分離期望的 語音分量尤其困難,尤其是在以高速公路行駛速度行駛的汽車客艙之內(nèi),在多名人員正在 同時(shí)講話時(shí),或者有音頻內(nèi)容存在的情況下。
[0004] 在語音信號(hào)處理中,麥克風(fēng)信號(hào)通常首先被分割成適當(dāng)大小的重疊塊并對(duì)其應(yīng)用 窗口函數(shù)。然后使用快速傅立葉變換(FFT)將每個(gè)經(jīng)開窗的信號(hào)塊變換到頻域中,以產(chǎn)生 嘈雜的短期譜信號(hào)。為了降低不期望的噪聲分量,同時(shí)保持語音信號(hào)盡可能自然,計(jì)算信 噪比依賴(SNR:信噪比)的加權(quán)系數(shù)并將其應(yīng)用于譜信號(hào)。然而,現(xiàn)有的常規(guī)方法使用的 SNR依賴的加權(quán)規(guī)則,所述SNR依賴的加權(quán)規(guī)則在每個(gè)頻率中獨(dú)立地運(yùn)行,并且不考慮被處 理的實(shí)際語音聲音的特征。
[0005] 圖1顯示了用于語音信號(hào)降噪的典型裝置。分析濾波器組102從麥克風(fēng)101接收 麥克風(fēng)信號(hào)y(i)。y(i)包括語音分量(i)和由麥克風(fēng)接收到的噪聲分量n(i)兩者。參 數(shù)(i)是采樣索引,其識(shí)別用于麥克風(fēng)信號(hào)y采樣的時(shí)間段。分析濾波器組102通過應(yīng)用 FFT變換來將時(shí)域麥克風(fēng)采樣轉(zhuǎn)換成頻域表示幀。分析濾波器組102將濾波器系數(shù)分離成 頻率箱。如在附圖中所指出的,麥克風(fēng)信號(hào)的頻域表示為Y(k,其中,k表示幀索引,并 且U表示頻率箱索引。將麥克風(fēng)信號(hào)的頻域表示提供給降噪濾波器103。在降噪濾波器中 計(jì)算信噪比加權(quán)系數(shù),從而得到濾波器系數(shù)H (k ,并且濾波器系數(shù)和頻域表示相乘,從而 得到降噪信號(hào)^0,//;)。針對(duì)幀的所有頻率,在合成濾波器組中收集降噪頻域信號(hào),并且通 過逆向變換(例如,逆向FFT)來傳遞幀。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的實(shí)施例指向用于語音信號(hào)處理的裝置??梢栽谡Z音識(shí)別之前完成對(duì)語音 信號(hào)的處理。該系統(tǒng)和方法也可以與移動(dòng)電話信號(hào)一起被采用,并且更具體地在嘈雜的汽 車環(huán)境中,以便提高接收的語音信號(hào)的可懂度。
[0007] 接收包括語音信號(hào)分量和噪聲分量的輸入麥克風(fēng)信號(hào)。麥克風(fēng)信號(hào)被變換到短期 譜信號(hào)的頻域集中。然后,基于檢測(cè)譜信號(hào)中的高能量密度區(qū)域來估計(jì)在譜信號(hào)之內(nèi)的語 音共振峰分量。對(duì)譜信號(hào)應(yīng)用一個(gè)或多個(gè)動(dòng)態(tài)調(diào)節(jié)的增益因子,以增強(qiáng)語音共振峰分量。
[0008] 包括至少一個(gè)硬件實(shí)施的計(jì)算機(jī)處理器(例如,數(shù)字信號(hào)處理器)的計(jì)算機(jī)實(shí)施 的方法可以處理語音信號(hào)并且識(shí)別并提升頻域中的共振峰。可以由麥克風(fēng)接收具有語音信 號(hào)分量和噪聲分量的輸入麥克風(fēng)信號(hào)。
[0009] 語音預(yù)處理器將麥克風(fēng)信號(hào)變換到短期譜信號(hào)的頻域集中?;跈z測(cè)譜信號(hào)中的 高能量密度區(qū)域來在譜信號(hào)之內(nèi)識(shí)別出語音共振峰分量。對(duì)譜信號(hào)應(yīng)用一個(gè)或多個(gè)動(dòng)態(tài)調(diào) 節(jié)的增益因子,以增強(qiáng)語音共振峰分量。
[0010] 可以基于使用線性預(yù)測(cè)編碼濾波器尋找譜峰來識(shí)別和估計(jì)共振峰。也可以使用無 限脈沖響應(yīng)平滑濾波器來估計(jì)共振峰以使譜信號(hào)平滑。識(shí)別共振峰之后,可以使用窗口函 數(shù)來提升用于共振峰被識(shí)別處的頻率箱的系數(shù)。窗口函數(shù)提升并成形總體濾波器系數(shù)。然 后可以對(duì)原始語音輸入信號(hào)應(yīng)用總體濾波器。根據(jù)共振峰檢測(cè)可靠性來動(dòng)態(tài)地調(diào)節(jié)用于提 升的增益因子。動(dòng)態(tài)地調(diào)節(jié)成形的窗口并且只將其應(yīng)用于具有經(jīng)識(shí)別的語音的頻率箱。在 本發(fā)明的某些實(shí)施例中,可以取決于信噪比來動(dòng)態(tài)地調(diào)整提升窗口函數(shù)。
[0011] 在本發(fā)明的實(shí)施例中,應(yīng)用增益因子以過低估計(jì)噪聲分量,以便減少譜信號(hào)的共 振峰區(qū)域中的語音失真。額外地,增益因子可以與一個(gè)或多個(gè)噪聲抑制系數(shù)進(jìn)行組合,以提 高寬帶信噪比。
[0012] 可以在具有一個(gè)或多個(gè)模塊的系統(tǒng)之內(nèi)實(shí)施共振峰檢測(cè)和共振峰提升。如本文所 使用的,術(shù)語模塊可以意指專用集成電路或通用處理器和被存儲(chǔ)在存儲(chǔ)器中的相關(guān)聯(lián)的源 代碼。每個(gè)模塊可以包括一個(gè)或多個(gè)處理器。系統(tǒng)可以包括語音信號(hào)輸入部,以用于接收 具有語音信號(hào)分量和噪聲分量的麥克風(fēng)信號(hào)。額外地,系統(tǒng)可以包括信號(hào)預(yù)處理器,以用于 將麥克風(fēng)信號(hào)變換到的短期譜信號(hào)的頻域集中。系統(tǒng)包括共振峰估計(jì)模塊和共振峰增強(qiáng)模 塊兩者。共振峰估計(jì)模炔基于檢測(cè)譜信號(hào)中的高能量密度的區(qū)域來估計(jì)在譜信號(hào)之內(nèi)的語 音共振峰分量。共振峰增強(qiáng)模塊確定一個(gè)或多個(gè)動(dòng)態(tài)調(diào)節(jié)的增益因子,所述一個(gè)或多個(gè)動(dòng) 態(tài)調(diào)節(jié)的增益因子應(yīng)用于譜信號(hào)以增強(qiáng)語音共振峰分量。
【附圖說明】
[0013] 圖1示出了用于語音信號(hào)降噪的典型的現(xiàn)有技術(shù)的裝置。
[0014] 圖2示出了語音譜信號(hào)的曲線圖,所述曲線圖示出了如何識(shí)別其中的共振峰分 量。
[0015] 圖3示出了用于確定共振峰的位置的流程圖;
[0016] 圖3A示出了可能的提升窗口函數(shù)。
[0017] 圖4示出了用于語音信號(hào)降噪的本發(fā)明的實(shí)施例,所述語音信號(hào)降噪包括共振峰 檢測(cè)和共振峰提升。
[0018] 圖5示出了用于語音信號(hào)降噪的一個(gè)具體實(shí)施例的進(jìn)一步詳情。
[0019] 圖6示出了根據(jù)本發(fā)明實(shí)施例的語音信號(hào)增強(qiáng)方法中的各個(gè)邏輯步驟。
【具體實(shí)施方式】
[0020] 本發(fā)明的各個(gè)實(shí)施例指向在語音信號(hào)處理中通過識(shí)別并加強(qiáng)在麥克風(fēng)信號(hào)之內(nèi) 的語音共振峰來增強(qiáng)語音質(zhì)量和可懂度的計(jì)算高效的技術(shù)。共振峰表示在特定的頻率間隔 (譜峰)之內(nèi)的聲能量的主要集中物,所述主要集中物對(duì)解讀語音內(nèi)容來說是重要的。共振 峰的識(shí)別和加強(qiáng)可以與降噪算法結(jié)合使