專利名稱:諧波噪聲的減去消除的制作方法
技術領域:
本發(fā)明總體上涉及抑制噪聲的領域,更具體地,涉及一種消除所關注信號中的未知頻率的附加正弦擾動的方法。該方法集中于提高視頻信號的質量。然而本發(fā)明并不限于聲學領域,即,其可以應用于壓力傳感器的信號。
背景技術:
音頻處理中的共同問題是信息承載信號受到一個或更多個正弦信號的干擾。抑制這些干擾信號的傳統(tǒng)方法是使用將頻率調至該正弦干擾頻率的固定陷波濾波器,如在“Halbleiter-Schaltungstechnik”(by Ulrich Tietzeand Christoph Schenk,Springer,12th edition,2002)中所描述的。
為了使所關注信號的質量僅發(fā)生略微的下降,要求濾波器的陷波非常陡,為了良好抑制,需要準確知道干擾頻率。如果不是如此,則陷波濾波器的常規(guī)方法不再適用,而必須使用在“Adaptive IIR Filtering inSignal Processing and Contrl”(by Philip A.Regalia Marcel Dekker,1994)中提出的自適應方法。該濾波器與含有最高頻率的主正弦干擾同步,并完全抑制該干擾。此外,該濾波器能夠追蹤該干擾頻率的較小的依從于時間的變化。然而,該方法的一個主要缺點在于其不保存陷波頻率處的承載信息的譜內容。由此無法清楚地分開兩個正弦波(一個代表噪聲,另一個代表有用信息)。
當把對正弦干擾的抑制視為對擾動的消除時可以解決以上問題。生成人造基準信號并從噪聲信息承載信號中減去該信號。該抑制目前取決于用于基準信號的正弦參數的估計值的質量。
一旦找到了良好的估計,則可以放慢估計處理或將其完全停止,以使得估計器無法跟蹤由所關注信號引起的振幅和相位的變化。只要正弦干擾參數對于時間保持常數,就可以保存該頻譜內容。如果這些參數變化,則不再保存該頻譜內容,并迫使重新啟動常規(guī)估計過程?,F有技術的方法假設要消除的頻率是已知的,并且大部分方法對于振幅和相位的連續(xù)參數估計使用梯度下降方法,例如“Geruschreduktionsverfahren mitmodellbasierten Anstzen für Freisprecheinrichtungen in Kraftfahrzeugen”(by Henning Puder,PhD Thesis,Technische Universitt Darmstadt,2003)。為了處理語音信號,利用下降步長來控制對于擾動正弦參數的估計,并且該估計只在語音暫停時才被激活。這樣,大大減少了對于語音部分中的有用頻率內容的抑制。
發(fā)明內容
考慮以上幾點,本發(fā)明的目的是提供一種改進的噪聲消除技術,其還可以應用于干擾頻率未知的情況。
通過獨立權利要求的特征來實現所述目的。在獨立權利要求中定義了有利特征。
本發(fā)明通過補償技術從受擾動的語音信號中基本上去除了個別的正弦干擾?;痉椒ㄊ鞘褂谜腋蓴_的同相/正交模型。
所提出的方法估計并跟蹤以下參數各干擾的同相振幅、正交振幅以及頻率。由擴展的卡爾曼濾波器遞歸地進行該估計。根據這三個參數,通過生成基準信號并從干擾信號中減去該基準信號來補償干擾信號中的正弦干擾。
通過擴展的卡爾曼濾波器來依次進行三個未知正弦干擾參數的估計。類似于自適應陷波濾波器,該濾波器收斂于功率最強的頻率,并估計其參數。通過對于所假設的測量值以及卡爾曼體系中的設備噪聲協(xié)方差選擇不同值,來對參數估計過程進行控制。測量協(xié)方差中的較大值例如固定了估計值和基準信號。本發(fā)明所提出的方法的優(yōu)點在于,無需獲知干擾頻率,并且與自適應陷波濾波器相反,不消除信號信息。
在抑制電機噪聲的情況下,可以通過諸如電機的旋轉計數器的附加傳感器來確定用于卡爾曼濾波器的初始化以及信號和干擾的方差的各個值。還可以通過學習過程來確定這些值,在該過程中識別出可能的擾動/干擾/噪聲以及它們的性質。由此確定的值并不是干擾頻率的確切值,而只是其估計值,這對于加速卡爾曼濾波器自適應以及提高估計精度是有用的。
此外,在過濾處理中通過添加獨立的測量方程來容易地整合(intergrate)初始化之后的連續(xù)傳感器信息。由此可以完成旋轉計數器與其它裝置的傳感器聯合。
根據本發(fā)明的第一方面,提供了一種用于消除受擾動的有用信號中的未知頻率的正弦擾動的方法。由此,該方法包括以下步驟估計正弦擾動的三個參數,即振幅、相位和頻率;根據所估計的參數生成基準信號,并從受擾動的有用信號中減去基準信號。
可以利用附加傳感器的值和/或學習過程對正弦擾動參數的估計值進行初始化。
具體地,可以通過連續(xù)重復該方法來消除多個正弦擾動。
在估計步驟之前對受擾動的有用信號進行帶通濾波。
由此在將該方法應用于各波段之前可以利用多個帶通濾波器將受擾動的有用信號分解為多個頻段。
此外,可以消除第一頻段中的給定正弦擾動,并可以通過為了消除第一頻段中的給定正弦擾動而生成的基準信號,來消除第二頻段中的給定正弦擾動。
可以通過調整為了消除第一頻段中的給定正弦擾動而生成的基準信號,來將第二頻段中的給定正弦擾動消除到第一頻段頻率響應與第二頻段頻率響應的比率。
可以通過擴展的卡爾曼濾波器進行該估計。
此外,可以調整估計步驟中的初始化值的置信度。
然后還可以通過控制擴展的卡爾曼濾波器的誤差協(xié)方差矩陣來調整置信度。
可以時間選擇地并特別地根據語音活動測量來執(zhí)行該方法。
可以根據Ephraim和Malah方法對所獲取的所估計的有用信號進行濾波。
根據本發(fā)明的另一方面,提出了一種計算機軟件程序產品,當將其運行在計算裝置上時實現了前述方法。
根據本發(fā)明的另一方面,提供了一種用于消除在受擾動的信息承載信號中的未知頻率的正弦擾動的系統(tǒng),其中計算裝置執(zhí)行上述方法。
根據結合附圖的以下詳細說明書和所附權利要求,本發(fā)明的其它優(yōu)點和可能應用將變得清楚。其中,圖1表示根據本發(fā)明的通過加入基準信號來消除受擾動的信號中的噪聲,圖2表示遞歸卡爾曼估計算法,以及圖3表示遞歸擴展卡爾曼估計算法。
具體實施例方式
補償方法下面參照圖1說明本發(fā)明的整體補償方法,該方法提出通過添加基準噪聲來消除受擾動的信號中的噪聲。
從圖1可以看出,本發(fā)明提出的方法估計(2)并跟蹤對于各個干擾的以下參數同相振幅、正交振幅和頻率。通過擴展的卡爾曼濾波器來遞歸進行該估計。隨后,根據三個估計參數(3),生成(4)基準信號(5),并從受擾動的信號(1)中減去(6)該信號,以補償受擾動的信號(1)中的正弦擾動(9)。
所使用的基準信號是根據噪聲模型(4)生成的人造信號(5) 該人造信號表示疊加在信息承載信號(8)s(n)上的實際擾動噪聲(9)的估計值。通過確定以下模型參數來間接地進行所述基準信號的估計(2)θ^=[θ^1,θ^2···,θ^n]T]]>公式1通過從整個受擾動的信號(1)y(n)中減去(6)人造模型信號(5) 來抑制噪聲(9)
s^(n)=y(n)-v^(n)=s(n)+v(n)-v^(n)=s(n)+e(n)]]>公式2其中e(n)是在時刻n的噪聲補償之后的誤差信號,s(n)是在時刻n的有用信號,(n)是所估計的時刻n的有用信號,v(n)是時刻n的干擾噪聲, 是所估計的時刻n的干擾噪聲,并且y(n)是時刻n的受到額外擾動的有用信號。
處理正弦振蕩補償的適當模型是本發(fā)明所使用的同相/正交模型。在該模型中,可以通過以下三個參數(θ1、θ2和θ3)來描述根據公式(3)的一般正弦信號v(n),v(n)=Acos(2πf~n+φ)]]>公式3θ1=Acosφ 公式4aθ2=Asinφ 公式4bθ3=f~]]>公式4c這三個參數分別表示同相分量、正交分量和歸一化頻率。
通過下面的公式描述基準信號的生成v(n,θ)=θ1cos(2πθ3·n)-θ2sin(2πθ3·n) 公式5該方法基本上消除了陷波濾波的缺點。這使得1、有針對性地衰減所確定的振蕩,而不是完全刪除它們。由此可以保留有用信號的恒定且持續(xù)的振蕩。
2、根據輸入信號和最后估計值利用模型參數的恒定估計 來暫時跟蹤干擾頻率的變化θ^(n)=f(y(n),y(n-1),...θ^(n-1),θ^(n-2),...)]]>公式6通過所述方法得到的結果取決于估計器(2)的精度以及區(qū)別有用信號(8)與噪聲信號(9)的概率。相位或頻率的小估計誤差在一段時間后可能導致基準信號與噪聲信號之間相減的大誤差。因此絕對需要恒定的新估計值(2)。為了使計算成本保持在低水平,本發(fā)明提出了使用順序方法。
卡爾曼濾波器下面將參照圖2和圖3說明本發(fā)明如何利用順序估計方法,即卡爾曼濾波器。
為了計算當前估計值 卡爾曼濾波器只需要受擾動的信號的當前抽樣值y(n)=s(n)+v(n)、參數的最后估計 以及采用誤差協(xié)方差矩陣M(n-1|n-1)形式的關于所述估計精度的信息。此外,濾波器的有利特征在于其對隨時間線性變化的參數θ(n)提供最佳線性估計結果,可參見“Fundamentals of Statistical Signal Processing-Estimation Theory”,(Steven M.Kay,Signal Processing Series,Prentice Hall,1993)。最佳估計值表示卡爾曼濾波器使所有線性估計器的期望正交誤差(即,線性最小平方誤差(LMMSE))最小。
下面說明如何將通用卡爾曼方程調整為根據本發(fā)明的諧波噪聲的減去消除。
由于標準方法需要線性動態(tài)模型,所以首先假設第三參數(即θ3=f~0)]]>已知。在描述使用根據本發(fā)明的擴展的卡爾曼濾波器的以下部分中,對已有方程進行了改進,并增加了頻率估計。
要估計的參數θ(n)是系統(tǒng)的狀態(tài)變量。通過線性隨機系統(tǒng)來模擬這些參數隨時間的變化。
θ(n)=A·θ(n-1)+B·u(n),n≥0 公式7θ1(n)θ2(n)=1001·θ1(n-1)θ2(n-1)+1001·u(n)]]>公式8其中θ1(n)和θ2(n)規(guī)定正弦擾動的當前的同相和正交分量,并且u(n)是正態(tài)分布的零平均二維白噪聲u~N(0,Q) 公式9其中信道θ1(n)和θ2(n)彼此不相關,并具有相同的方差Q=diag[σu2σu2]]]>公式10可以通過受擾動的噪聲信號(1)y(n)來觀察參數θ(n)y(n)=θ1(n)cos(2πf~0·n)-θ2(n)sin(2πf~0·n)+w(n)]]>=hT(n)θ(n)+w(n)]]>公式11其中w(n)表示了話音信號(8)s(n)對噪聲信號(9)v(n)的影響
v(n)=hT(n)θ(n)=[cos(2πf~0n)-sin(2πf~0n)]·θ1(n)θ2(n)]]>公式12“話音噪聲”w(n)可以通過平均值μw(n)和其方差σw2(n)來統(tǒng)計描述。然而,這對于其統(tǒng)計特性的完全描述并不充分,因為高斯分布的假設對于該話音信號并不成立。結果,在最小均方誤差(MMSE)方面,卡爾曼濾波器不會生成最佳結果,而只提供了用于線性估計方法的最佳值(LMMSE)。圖2表示從以上定義和假設得到的遞歸卡爾曼估計算法。
初始化包括設置值 和M(-1|-1)。算法從n=0開始。理論上建議在時刻n=-1使用參數θ作為平均值和協(xié)方差的起始值。因為難于對這些參數分配統(tǒng)計數據,所以本發(fā)明提出使用θ(-1|-1)的合理猜想值作為起始值。由M(-1|-1)決定所述起始值的置信度。為了估計同相或正交分量,假設使用
T作為平均值。利用以下誤差協(xié)方差矩陣,可能的估計范圍幾乎不受到限制M(-1|-1)=σ200σ2,]]>σ2=100 公式13如果對于σ2,選擇小很多的值,則在某一時間段內,該算法可以尋找起始值范圍內的“正確”參數θ(n)。如果該算法沒有找到所述參數,則其只慢慢改變其“搜索方向”。濾波器表現出極強的“偏向”。
可以通過協(xié)方差矩陣Q來控制振幅值θ1(n)和θ2(n)的跟蹤。根據本發(fā)明,矩陣Q是對角矩陣 公式14以便跟隨兩個振幅分量的獨立改變。根據本發(fā)明,背景噪聲的適當值為σu2=10-13。過大值所導致的特征看起來像陷波濾波器的特征。
擴展的卡爾曼濾波器下面參照圖3說明本發(fā)明如何利用擴展的卡爾曼濾波器。
利用上述濾波器,無法適當的跟蹤頻率變化??梢酝ㄟ^對圖2中表示的卡爾曼濾波器算法添加用于頻率的第三遞歸公式來改變此問題。則卡爾曼濾波器能夠與具有可變頻率的振蕩同步,并能夠跟蹤并及時補償改變。不幸的是,該改進無法在通常的卡爾曼理論領域中執(zhí)行,這是因為以下觀測公式在頻率范圍內是非線性的y(n)=θ1cos(2πθ3n)-θ2sin(2πθ3n)+w(n)=h(θ(n),n)+w(n)公式15不管怎樣仍可以利用卡爾曼濾波器的順序估計公式。實際上,通過采用泰勒級數近似值,可以將項h(θ(n),n)線性化。由此,如以下公式所述在估計值 附近研究基準模型h(θ,n)h(θ(n),n)≈h(θ^(n|n-1))+∂h∂θ(n)|θ(n)=θ^(n|n-1)(θ(n)-θ^(n|n-1))]]>=h(θ^(n|n-1),n)+h~(n)T·(θ(n)-θ^(n|n-1))]]>公式16然后公式15變成y(n)=h(θ^(n|n-1),n)+h~(n)T·(θ(n)-θ^(n|n-1))+w(n)]]>=h~(n)Tθ(n)+w(n)+(h(θ^(n|n-1),n)-h~(n)Tθ^(n|n-1))]]>=h~(n)Tθ(n)+w(n)+z(n)]]>公式17現在所述公式為線性的,并且與卡爾曼模型公式(即公式11)的不同之處僅在于以下已知項z(n)=h(θ^(n|n-1),n)-h~(n)Tθ^(n|n-1)]]>公式18通過轉換y′(n)=y(tǒng)(n)-z(n),得到與正態(tài)卡爾曼濾波器相同的起始前提。當使用卡爾曼濾波器方法時,得到圖3所示的估計算法(稱為擴展的卡爾曼濾波器(EKF))。
預測步驟(步驟1和步驟2)保持不變。只有參數數量增加了1至3個。已將頻率添加給參數的同相/正交分量??柭鼮V波器算法(步驟4b、5b和6b)的三個其它公式顯示出略微的變化。根據新測量的值y(n)執(zhí)行預測估計值的校正的公式使用非線性模型 來預測期望測量值 (步驟5b)。放大/增益(步驟4b)和估計誤差(步驟6b)使用第一階線性化 必須對于各新步驟計算該值。與線性卡爾曼濾波器類似,不能進行增益和誤差過程中的離線計算。此外,濾波器因線性化而失去其線性最優(yōu)特性,并且可以將估計誤差M(n|n)翻譯為實際誤差的一階近似。
子頻段分解下面將說明由本發(fā)明執(zhí)行的子頻段分解。
并不直接在受擾動的語音信號(1)y(n)上進行根據本發(fā)明的抑制。相反,本發(fā)明提出首先執(zhí)行子頻段分解,這是諧波噪聲的減去消除的第一步。其功能再現了人耳蝸的神經信號處理。然后在更高的神經級別進行噪聲抑制,并使用通過耳蝸過濾的信號。
表示良好結果的模型是Patterson提出的伽馬調(Gammatone)濾波器組。與此相關,參見Malcom Slaney的技術報告“An Efficientimplementation of the Patterson Holdsworth auditory filter bank”(AppleComputer Inc,1993)。所述濾波器組包括多個不同的八階帶通濾波器,其中這些濾波器具有相互不同的帶寬以及不同的中心頻率距離。根據心理聲學分析來限定帶寬和距離、或者頻段交疊,并且它們隨著頻率增加而增加。
作為對機器人頭部的耳蝸進行模擬的示例已提出使用一種型式的具有100個信道的所述伽馬調濾波器組。在濾波器組的不同的頻段受限信道中,實現了正弦擾動的噪聲降低。根據擾動頻率,必須在多于一個的信道中執(zhí)行抑制,這是由于在交疊的相鄰信道中可能存在相同的衰減擾動。則也必須在其它信道中抑制擾動頻率。這意味著與直接處理(即陷波濾波)相比,需要相當多的額外工作。另一方面,根據本發(fā)明的補償技術得益于子頻段分解。通過分解來分離接近的正弦干擾。該濾波器組尤其對于深頻率顯示出低的信道寬度,使得其能夠分離具有高功率的正弦振蕩(即,網絡蜂鳴(humming)的100Hz和200Hz振蕩)。
僅在一個信道上執(zhí)行估計過程。便利地,所選信道是對于給定初始頻率具有最大振幅行程的信道。則主信道與聯合信道(co-channel)的轉移函數之間的固定關系使得能夠對于其它信道生成適當的人造基準噪聲。
總結本發(fā)明所提出的補償方法與陷波濾波的兩點不同為-首先,其只需要有限地初步認知要補償的頻率,即該算法在初始值附近自動收斂于功率最大的頻率,-其次,其可以通過控制模型噪聲參數σw2(n)和Q(n)來防止擴展的卡爾曼濾波器去除相同頻率的語音部分。
本發(fā)明提出通過語音活動檢測(VAD)方法來實現該控制。該方法用于移動通信領域,例如參見“Voice-Activity Detector”,(ETSI Rec.GSM 06.92,1989)。所述檢測方法確定閾值。在高于該閾值,即,當信號中出現語音時,通過如σw2=104]]>那樣對測量噪聲賦予較大的值,來終止參數估計。在低于該閾值時,即,當信號中不再出現語音時,再次開始參數估計和跟蹤。
還可以通過添加獨立的測量公式來包括來自不同傳感器源的信息,即旋轉計數器。通過這種方式,即使在講話過程中也可以跟蹤頻率值,并且無需停止估計。
根據本發(fā)明,將多個擴展的卡爾曼濾波器進一步串聯。由此,第一濾波器必須消除信號或該信號的給定頻段中的功率最強的正弦擾動。然后將所獲得的信號提供給可以抑制功率次強的正弦擾動的第二濾波器。
還提出執(zhí)行另一步驟來抑制剩余擾動信號。由此,在補償步驟之后,可以根據Ephraim和Malah的方法過濾該信號。所述方法在以下文獻中描述“Speech enhancement using a minimum mean-square errorshort-time spectral amplitude estimator”(by Yariv Ephraim and David Malah,IEEE Transactions on Acoustics,Speech and Signal Processing,32(6),December 1984)。
權利要求
1.一種用于消除受擾動的有用信號(1)中的未知頻率的正弦擾動的方法,包括以下步驟估計(2)所述正弦擾動(9)的三個參數,所述三個參數是振幅、相位和頻率,根據所估計的參數生成(4)基準信號(5),以及從所述受擾動的有用信號(1)中減去(6)所述基準信號(5)。
2.根據權利要求1所述的方法,其中,利用附加傳感器的值和/或學習過程對所述正弦擾動(9)的參數的估計(2)進行初始化。
3.根據權利要求1或2所述的方法,其中,對來自附加傳感器的信息進行整合,作為卡爾曼體系的附加測量公式。
4.根據前述任一項權利要求所述的方法,其中,通過連續(xù)地重復權利要求1的方法來消除多個正弦擾動(9)。
5.根據前述任一項權利要求所述的方法,其中,在所述估計(2)步驟之前對所述受擾動的有用信號(1)進行帶通濾波。
6.根據權利要求5所述的方法,其中,在將權利要求1或4的方法應用于各波段之前,利用多個帶通濾波器將所述受擾動的有用信號(1)分解為多個頻段。
7.根據權利要求6所述的方法,其中消除第一頻段中的給定正弦擾動(9),并且通過為了消除所述第一頻段中的給定正弦擾動(9)而生成的基準信號(5),來消除第二頻段中的給定正弦擾動(9)。
8.根據權利要求7所述的方法,其中,通過調整為了消除所述第一頻段中的給定正弦擾動(9)而生成的所述基準信號(5),來將所述第二頻段中的給定正弦擾動(9)消除到第一頻段頻率響應與第二頻段頻率響應的比率。
9.根據前述任一項權利要求所述的方法,其中通過擴展的卡爾曼濾波器進行所述估計(2)。
10.根據前述任一項權利要求所述的方法,其中調整所述估計(2)步驟的初始值中的置信度。
11.根據引用權利要求9的權利要求10所述的方法,其中通過控制所述擴展的卡爾曼濾波器的誤差協(xié)方差矩陣來調整所述置信度。
12.根據前述任一項權利要求所述的方法,其特征在于,所述方法是時間選擇性執(zhí)行的。
13.根據權利要求12所述的方法,其特征在于,所述方法是根據語音活動測量執(zhí)行的。
14.根據前述任一項權利要求所述的方法,其中,根據Ephraim和Malah對所獲取的所估計的有用信號(7)進行過濾。
15.一種計算機軟件程序產品,當將所述產品在計算裝置上運行時,實現了根據前述任一項權利要求所述的方法。
16.一種用于消除受擾動的信息承載信號中的未知頻率的正弦擾動的系統(tǒng),其中,計算裝置被設計為,實現根據權利要求1至14中的任一項所述的方法。
全文摘要
諧波噪聲的減去消除。音頻處理的一個共同問題是有用信號(8)受到應當被抑制的一個或更多個正弦噪聲(9)的干擾。所提出的用于消除受到干擾的有用信號(1)中的未知頻率的正弦擾動(9)的方法包括以下步驟估計該擾動(9)的三個正弦參數,所述三個正弦參數是振幅、相位和頻率;根據所估計的參數生成(4)基準信號(5);并且從受到干擾的信息承載信號(1)中減去基準信號(5)。通過擴展的卡爾曼濾波器來進行該估計。
文檔編號G10L21/00GK1702738SQ20051007462
公開日2005年11月30日 申請日期2005年5月26日 優(yōu)先權日2004年5月26日
發(fā)明者弗蘭克·茹布蘭, 馬丁·黑克曼, 比約恩·舍夫林 申請人:本田研究所歐洲有限公司