專利名稱:去除語音信號中背景噪聲的方法
技術領域:
本發明涉及一種去除語音信號中背景噪聲(background noise)的方法,且特別涉及一種對各頻帶的衰減系數(attenuation factor)作平滑濾波處理的語音信號處理方法。
背景技術:
根據助聽器的使用滿意度調查結果顯示,助聽器使用者常有“環境噪音過度放大令人感到疲倦”和“聽得見卻聽不清楚”的抱怨。因此,去除信號中的噪聲以提高配戴舒適度成為目前研發數字助聽器技術的重要課題之一。目前一些去除語音信號中的背景噪聲的方法雖可明顯提高信噪比(signal to noise ratio,簡稱為SNR),但是對語音可辨識度的改善并不明顯,甚至附帶產生額外的噪聲(泛稱為musical noise)或者破壞語音的流暢度。
背景噪聲干擾為一種時域(time domain)波形疊加作用,最初接收到的噪聲語音信號可表示為y[n]=x[n]+w[n],其中x[n]表示未受干擾的語音信號,w[n]則表示背景噪聲。
傳統的去除噪聲方法可表示為X^[i]=γ[i]Y[i],]]>其中Y[i]為噪聲語音信號y[n]經過快速傅立葉變換(fast Fourier transform)后屬于頻帶i的部分,i∈
,N為頻帶數量,|Y[i]|表示噪聲語音信號y[n]在頻帶i的振幅,而γ[i]表示上述振幅的衰減系數。
傳統的衰減系數計算方法為γ[i]=|D[i]|2|Y[i]|2,]]>其中|D[i]|2=|Y[i]|2-α|W[i]|2,if|Y[i]|2≥α1-β|W[i]|2β|Y[i]|2,elsewhere]]>|W[i]2為背景噪聲在頻帶i的能量,α和β為預設之系數。如此,計算出X^[i]=γ[i]Y[i]]]>之后,接著對 做傅立葉反變換(inverse Fourier transform),即可得到去除背景噪聲后的語音信號。
語音信號在相鄰的頻帶之間有相關性,然而如上所述,傳統方法并未利用這一點,傳統的振幅衰減系數是在每個頻帶分開計算。所以傳統方法應有改進的空間。
發明內容
本發明的目的是提供一種去除語音信號中背景噪聲的方法,本方法可提高去除背景噪聲后的語音音質以及可辨識度。
為達到上述及其它目的,本發明提出一種去除語音信號中背景噪聲的方法,包括下列步驟。首先,定義頻帶i的衰減系數γ[i]=|D[i]|2|Y[i]|2,]]>其中|D[i]|2=|Y[i]|2-α|W[i]|2,if|Y[i]|2≥α1-β|W[i]|2β|Y[i]|2,elsewhere]]>|Y[i]|2為噪聲語音信號在頻帶i的能量,|W[i]|2為背景噪聲在頻帶i的能量,i∈
,N為頻帶數量,α和β為預設之系數。然后計算頻帶i的順向衰減系數γf[i]≡γ[i]=λf·γ[i]+(1-λf)γ[i-1],其中λf為預設的系數。然后計算頻帶i的反向衰減系數γb[i]=λb·γb[i]+(1-λb)γb[i-1],其中γb[i]=γ[N-1-i],λb為預設的系數。接著計算頻帶i的平滑衰減系數γ^[i]=λc·γ‾f[i]+(1-λc)γ‾b[N-1-i]),]]>其中λc為預設的系數。然后根據平滑衰減系數計算語音頻譜估測值X^[i]=γ^[i]Y[i].]]>最后,將 作傅立葉反變換,得到去除背景噪聲后的語音信號。
上述之去除語音信號中背景噪聲的方法,在一實施例中,γ[-1]=γ
,而且γ‾b[-1]=γ[N-1].]]>依照本發明的較佳實施例所述,上述之去除語音信號中背景噪聲的方法是利用語音信號在相鄰頻帶之間的關聯性對衰減系數作平滑濾波處理,以取代傳統的振幅衰減系數,實驗結果證明此方法可以提高去除背景噪聲后的語音音質以及可辨識度。
為讓本發明的上述和其它目的、特征和優點能更明顯易懂,下文特舉本發明之較佳實施例,并配合附圖,作詳細說明如下。
圖1為根據本發明一實施例的去除語音信號中背景噪聲的方法流程圖。
圖2為傳統技術以及本發明一實施例的衰減系數對照圖。
主要元件標記說明110~160流程圖步驟具體實施方式
由傳統方法所得到的去除噪聲后的語音頻譜是由各頻帶獨立計算而來,本發明提出的方法則是利用頻帶間的相依關系以提高去噪聲處理后語音的可辨識度。
以下說明請參照圖1。圖1為根據本發明一實施例的去除語音信號中背景噪聲的方法流程圖。首先,在步驟110定義各頻帶的衰減系數。假設本實施例的頻帶數量為N,i∈
,則頻帶i的衰減系數定義為γ[i]=|D[i]|2|Y[i]|2,]]>其中|D[i]|2=|Y[i]|2-α|W[i]|2,if|Y[i]|2≥α1-β|W[i]|2β|Y[i]|2,elsewhere]]>|Y[i]|2為最初接收的噪聲語音信號在頻帶i的能量,|W[i]|2為背景噪聲在頻帶i的能量,α和β為預設之系數。
定義衰減系數后,在步驟120利用一階IIR(infinite impulse response)濾波器q[n]=λp[n]+(1-λ)q[n-1]對頻帶i的衰減系數γ[i]作濾波處理,以計算頻帶i的順向衰減系數γf[i]。本實施例的計算公式為γf[i]≡γ[i]=λf·γ[i]+(1-λf)γ[i-1],其中λf為預設的系數。經過簡單的推算可知,順向衰減系數γf[i]為根據γ
至γ[i]計算而來。
接下來,在步驟130利用上述的一階IIR濾波器對頻帶順序反置的衰減系數γ[i]作濾波處理,以計算頻帶i的反向衰減系數γb[i]。本實施例的計算公式為γb[i]=λb·γb[i]+(1-λb)γb[i-1],其中γb[i]=γ[N-1-i],λb為預設的系數。經過簡單的推算可知,反向衰減系數γb[i]為根據γ[N-1-i]至γ[N-1]計算而來。
在上述的差分方程式運算中,初始條件為γ[-1]=γ
,而且γb[-1]=γ[N-1]。
接下來,在步驟140將順向和反向的濾波結果作線性組合以計算頻帶i的平滑衰減系數 本實施例的計算公式為γ^[i]=λc·γ‾f[i]+(1-λc)γ‾b[N-1-i]),]]>其中λc為預設的系數。然后在步驟150計算平滑處理后的語音頻譜估測值X^[i]=γ^[i]Y[i],]]>最后,在步驟160將 作傅立葉反變換,就能得到去除背景噪聲后的語音信號。
圖2為傳統技術以及本實施例的衰減系數對照圖,其橫軸為頻帶編號,其縱軸為衰減系數值。圖2的設定為λf=λb=λc=0.5,除了標明為傳統技術的折線之外,其余折線皆為本實施例的數據。由圖2可以發現,合并順向及反向的結果使得每一頻帶的衰減系數會受到其左右頻帶衰減系數的影響而調整其值,因此可達到利用頻帶間相依關系調整頻帶衰減系數的目的。
以下說明本實施例的實驗結果,首先是關于音節辨識率的實驗。這個實驗是以18位男性和11位女性在安靜室內各念120個中文人名的干凈語音數據庫訓練中文音節模型。至于背景噪聲,是將此干凈語音數據庫分別加入操作房噪聲、白色噪聲、人聲噪聲和工廠噪聲,其中每種噪聲分別依信噪比20dB、15dB、10dB、5dB和0dB由波形合成而得。將此噪聲語音數據庫的每個語音檔案,用本實施例的方法做去除噪聲處理,然后以干凈語音模型做自動音節辨識,得到如下的結果。下列每一個實驗數據都是四種噪聲和五種信噪比,總共二十種組合的平均值。
表1、本實施例的音節辨識率實驗數據
在本實驗中λf=λb=λ,λ=1時平滑衰減系數
等于傳統的衰減系數γ[i],所以λ=1時的41.8%就是傳統方法的實驗數據。另一方面,完全不做去除噪聲的音節正確率為32.9%。由表1可知,本實施例的方法確實可提高去除噪聲后的辨識率,在λ=0.45時可達到最高辨識率46.2%。
第二個實驗是以測量音質好壞的語音音質聽覺評量(perceptualevaluation of speech quality,簡稱為PESQ)來比較不同方法的結果。PESQ分數范圍為
,其中4為音質無失真的最高分數。實驗結果如下表所示。
表2、去除背景噪聲后的語音音質測量
同樣的,在本實驗中λf=λb=λ,λ=1時的2.44為傳統方法的PESQ分數。另一方面,完全不做去除噪聲的分數為2.08。由表2可知,本實施例的方法確實可提高去除背景噪聲后的語音音質。
本發明雖然是受到數字助聽器的啟發,但是本發明的應用并不限于數字助聽器,也可以應用于其它領域,例如錄音筆之類的數字錄音應用。
綜上所述,本發明提出的去除語音信號中背景噪聲的方法,是利用語音信號在相鄰頻帶之間的關聯性對衰減系數作平滑濾波處理,以取代傳統的振幅衰減系數,實驗結果證明上述方法可以提高去除背景噪聲后的語音音質以及可辨識度。
雖然本發明已以較佳實施例披露如上,然其并非用以限定本發明,任何所屬技術領域的技術人員,在不脫離本發明的精神和范圍內,當可作些許的更動與改進,因此本發明的保護范圍當視權利要求所界定者為準。
權利要求
1.一種去除語音信號中背景噪聲的方法,其特征是包括下列步驟定義頻帶i的衰減系數γ[i]=|D[i]|2|Y[i]|2,]]>其中|D[i]|2=|Y[i]|2-α|W[i]|2,if[Y[i]|2≥α1-β|W[i]|2β|Y[i]|2,elsewhere,]]>|Y[i]|2為噪聲語音信號在頻帶i的能量,|W[i]|2為背景噪聲在頻帶i的能量,i∈
,N為頻帶數量,α和β為預設之系數;根據γ
至γ[i]計算頻帶i的順向衰減系數γf[i];根據γ[N-1-i]至γ[N-1]計算頻帶i的反向衰減系數γb[i];根據γf[i]及γb[i],計算頻帶i的平滑衰減系數 計算語音頻譜估測值X^[i]=γ^[i]Y[i];]]>以及將 作傅立葉反變換,得到去除背景噪聲后的語音信號。
2.根據權利要求1所述之去除語音信號中背景噪聲的方法,其特征是γf[i]≡γ[i]=λf·γ[i]+(1-λf)γ[i-1],λf為預設的系數。
3.根據權利要求2所述之去除語音信號中背景噪聲的方法,其特征是γ[-1]=γ
。
4.根據權利要求2所述之去除語音信號中背景噪聲的方法,其特征是λf為0.5。
5.根據權利要求1所述之去除語音信號中背景噪聲的方法,其特征是γb[i]=λb·γb[i]+(1-λb)γb[i-1],γb[i]=γ[N-1-i],λb為預設的系數。
6.根據權利要求5所述之去除語音信號中背景噪聲的方法,其特征是γb[-1]=γ[N-1]。
7.根據權利要求5所述之去除語音信號中背景噪聲的方法,其特征是λb為0.5。
8.根據權利要求1所述之去除語音信號中背景噪聲的方法,其特征是γ^[i]=λc·γ‾f[i]+(1-λc)γ‾b[N-1-i]),]]>λc為預設的系數。
9.根據權利要求8所述之去除語音信號中背景噪聲的方法,其特征是λc為0.5。
10.一種去除語音信號中背景噪聲的方法,其特征是包括下列步驟定義頻帶i的衰減系數γ[i]=|D[i]|2|Y[i]|2,]]>其中|D[i]|2=|Y[i]|2-α|W[i]|2,if|Y[i]|2≥α1-β|W[i]|2β|Y[i]|2,elsewhere,]]>|Y[i]|2為噪聲語音信號在頻帶i的能量,|W[i]|2為背景噪聲在頻帶i的能量,i∈
,N為頻帶數量,α和β為預設之系數;計算頻帶i的順向衰減系數γf[i]≡γ[i]=λf·γ[i]+(1-λf)γ[i-1],其中λf為預設的系數;計算頻帶i的反向衰減系數γb[i]=λb·γb[i]+(1-λb)γb[i-1],其中γb[i]=γ[N-1-i],λb為預設的系數;計算頻帶i的平滑衰減系數γ^[i]=λc·γ‾f[i]+(1-λc)γ‾b[N-1-i]),]]>其中λc為預設的系數;計算語音頻譜估測值X^[i]=γ^[i]Y[i];]]>以及將 作傅立葉反變換,得到去除背景噪聲后的語音信號。
11.根據權利要求10所述之去除語音信號中背景噪聲的方法,其特征是γ[-1]=γ
,而且γb[-1]=γ[N-1]。
12.根據權利要求10所述之去除語音信號中背景噪聲的方法,其特征是λf=λb=λc=0.5。
全文摘要
一種去除語音信號中背景噪聲的方法,包括下列步驟。首先,定義頻帶i的衰減系數,然后根據相鄰頻帶的衰減系數作平滑濾波處理,以計算頻帶i的順向衰減系數以及反向衰減系數。接著對順向衰減系數及反向衰減系數作線性組合以計算頻帶i的平滑衰減系數。然后使用平滑衰減系數計算語音頻譜估測值。最后,使用傅立葉反變換以得到去除背景噪聲后的語音信號。
文檔編號H04R25/00GK1991980SQ20051013745
公開日2007年7月4日 申請日期2005年12月30日 優先權日2005年12月30日
發明者黃泰惠 申請人:財團法人工業技術研究院