專利名稱:用于回聲抵消的剩余回聲估計的制作方法
技術領域:
本發明總的涉及回聲抵消系統,更具體地,涉及回聲抵消系統中用于減小剩余回聲的系統。
背景技術:
在“揚聲器電話”應用中,“近區講話人”是使用揚聲器電話的人,以及“遠區講話人”是在電話線的遠端的人。遠區講話人的語音被廣播(通過揚聲器播放)到揚聲器電話和近區講話人所在的室內(或其他的聲音封閉空間)。回聲是通過遠區講話人的語音傳播到室內并隨后在話筒處被接收而產生的。聲波回聲抵消器(AEC)被使用來抵消在話筒處接收的回聲。聲波回聲抵消器典型地是自適應濾波器,它模擬室內的各個回聲路徑。存在聲波回聲抵消器基本上不能抵消回聲的極端的情形,諸如,拉長的雙重講話或快速的近區講話人的運動。在這些情形下,遠區講話人可能聽到成為回聲的他/她自己的聲音的短的突發。
剩余回聲抑制技術試圖去除在聲波回聲抵消后剩余的回聲,由此阻止遠區講話人聽見這樣的突發,而同時仍舊允許近區講話人的話音不被打擾地傳送通過。剩余回聲抑制技術一直是研究的課題,已發表了許多描述有關工作的論文。例子包括S.Gustafsson等的“CombinedAcoustic Echo Control and Noise Reduction for Hands-FreeTelephony(用于免提電話的組合的聲波回聲控制和噪聲減小)”,Signal Processing,Vol.64,pp.21-32,1998,此后稱為“Gustafsson”;以及V.Turbin等的“Using PsychoacousticCriteria in聲波Acoustic Echo Cancellation Algorithms(在回聲抵消算法中使用心理聲音準則)”,Proc.IWAENC’97,London,pp.53-56,Sept.1997,此后稱為“Turbin”。盡管正在進行的研究工作,當前的剩余回聲抑制技術在去除剩余回聲方面并不是完全有效的。
附圖簡述
圖1顯示帶有剩余回聲估計的聲波回聲抵消系統;圖2顯示矢量項計算器的第一部分;圖3顯示矢量項計算器的第二部分;以及圖4顯示在揚聲器電話中的語音活動性檢測器。
實施例描述在以下的實施例詳細說明中,參考附圖并通過說明,顯示了其中可以實施本發明的特定的實施例。在附圖上,相同的數字描述在幾個圖上基本上相同的部件。這些實施例以足夠的細節被描述,使得本領域技術人員能夠實施本發明。也可以利用其他的實施例,以及可以作出結構的、邏輯的和電學的改變,而不背離本發明的范圍。而且,應該理解,本發明的各種實施例雖然不同,但并不一定互相排斥。例如,在一個實施例中描述的特定的特性,結構,或特征可被包括在其他實施例內。所以,以下的詳細說明不是以限制性的意義作出的,本發明的范圍只由附屬的權利要求書規定,連同由這樣的權利要求被授權的等價物的全部范圍。
本發明的方法和設備提供在聲波回聲抵消系統中估計剩余回聲的機制。自適應濾波器產生回聲的估值,以及從話筒輸入信號中減去回聲的估值。當回聲和回聲的估值不完全一致時,不想要的剩余回聲仍保留在信號中。本發明的方法和設備提供了一種剩余回聲估值器,它在沒有在話筒輸入信號的各個分量之間作出統計學的獨立性假設的情況下分開地估計剩余回聲的離散傅立葉變換(DFT)的實部和虛部。剩余回聲估值器使用不帶有回聲的話筒輸入信號的近似值來計算實部和虛部。根據是近區講話人還是遠區講話人在講話,使用不同的近似值。
圖1顯示具有回聲抵消和剩余回聲估值的揚聲器電話。揚聲器電話102包括自適應濾波器112,剩余回聲估值器(REE)116,加法器124,噪聲減小(NR)電路120,揚聲器106,和話筒128。揚聲器電話102可包括許多其他電路,諸如處理器,放大器等等。許多這樣的其他電路在圖1上被省略,以便清楚地顯示本發明的新穎部分。揚聲器電話102包括揚聲器106,它播放來自遠區講話人的語音。遠區講話人語音在節點104處從遠端被接收,以及通過揚聲器106被播放。在節點104處的語音數據在通過自適應濾波器112處理之前還要被延時電路108延時。
在某些實施例中,在節點104處的語音數據是數字數據。在這些實施例中,數字-模擬(D/A)變換器把數字數據變換成模擬波形,供揚聲器106播放。在這些實施例中,延時電路108可以是數字延時單元,諸如寄存器存儲器或移位寄存器。在其他實施例中,在節點104處的數據是模擬數據。在這些實施例中,延時電路108可以是模擬延時單元,諸如集中的或分布的模擬延時線。延時電路108可以是固定延時或可變延時。通常,當回聲路徑是較長時,延時電路108中的延時是較長的。例如,當揚聲器電話102被使用在汽車中時,回聲路徑是短的,以及延時電路108的延時是短的。同樣例如,當揚聲器電話102被使用在大的會議室時,回聲路徑更長,以及延時電路108的延時也相應地更長。
在運行時,揚聲器106把遠端語音播放到聲音環境中。來自聲音封閉空間的回聲信號yn在話筒128處被接收。聲音封閉空間對回聲的影響由方塊130代表,它包含轉移函數H1。也就是說,由揚聲器播放的語音受到轉移函數H1的作用,然后在話筒128處被接收。除了回聲yn以外,話筒128也接收近端語音信號sn和近端噪聲信號vn。近端語音信號sn代表來自近區講話人136的語音,由轉移函數H2建模,如方塊132所示,以及噪聲信號vn代表噪聲138,由轉移函數H3建模,如方塊134所示。所以,話筒128接收yn,sn和vn的總和。這在節點126處顯示為zn。
至少在某種程度上,yn和vn代表zn中的不希望的分量。例如,yn是由揚聲器106與話筒128的耦合造成的。當yn的大的分量沒有被抵消,以及成為發回到遠端的信號的一部分時,遠區講話人會聽到他/她的經過一段延時后的話音,這會在打電話期間引起混亂。另外,同樣例如,如果vn過分大,則遠區講話人聽到大量噪聲,以及這會打斷電話交談。與此相反,近端語音信號通常是zn中的想要的分量。當近端語音忠實地傳輸到遠端時,可以進行有效的通信。
自適應濾波器112把回聲的轉移函數近似為,以及從延時的遠端語音信號xn產生回聲信號yn的估值 加法器124從zn中減去 在節點122處產生en。自適應濾波器112可以是適合于自適應回聲抵消系統使用的任何濾波器。例子包括(但不限于)S.Gay,S.Tavathia,”Thefast affine projection algorithm(快速擬似投射算法)”,Proc.IEEE ICASSP,Detroit,USA,1995,pp.3023-3026;和G.Glentis,K.Berberidis,”A Unified viewEfficient least squaresadaptive algorithms for FIR transversal filtering(統一觀點用于FIR橫向濾波的有效的最小平方自適應算法)”,IEEE SignalProcessing Magazine,vol.16,pp.13-41,July 1999。
zn,yn和en被輸入到剩余回聲估值器116,產生剩余回聲的估值。剩余回聲估值和en被輸入到噪聲減小(NR)電路120以減小在en中的噪聲。理想地, 與yn完全一致,以及en只包含近端語音信號sn以及或許某些背景噪聲vn。然而,實際上這是不可能的,en總是包含某些剩余回聲量rn=yn-,即,en=sn+vn+rn。當遠區講話人處于靜默時(xn=0),加到噪聲減小算法上的輸入只是語音加背景噪聲。當遠區講話人講話時,“噪聲”(或不希望的分量)包括背景噪聲vn加回聲yn。噪聲減小電路120使用噪聲譜估值器來跟蹤近區靜止背景噪聲。準靜止剩余回聲通過剩余回聲估值器(REE)被分開地估值。然后通過使用復合的“噪聲”估值實現NR。
在某些實施例中,噪聲減小電路120留下小量的近區靜止背景噪聲來掩蔽剩余回聲。這可以通過使用在Tubin中討論的算法(見以上的背景部分)來完成。
任何的各種類別的語音譜估值器可用來修正噪聲功率譜估值,以便計入剩余回聲。適當的噪聲減小算法的例子和電路可以在以下論文中找到S.F.Boll,”Suppression of acoustic noise in speechusing spectral subtraction(通過使用頻譜相減抑制語音中的噪聲聲音)”,IEEE Trans.Acoust.Speech Signal Process.ASSP-27(April 1979)113-120;和Y.Ephraim,D.Malah,”Speechenhancement using a minimum mean-square error short-timespectral amplitude estimator(使用均方誤差短時間頻譜幅度估值器的語音增強)”,IEEE Trans.Acoust.Speech Signal Process.32(6)(December 1984)1109-1121.
剩余回聲估值
Gustafsson的以前的著作(見以上的背景部分)假設先驗的剩余回聲統計可以通過一個加到自適應濾波器輸出端的實數值確定性變換函數Fn而被估值。
變換函數是其中大寫字母代表由小寫字母代表的相應變量的離散傅立葉變換(DFT)分量。例如,En(k)代表en的DFT分量。
Gustafsson從上述的他們的著作中省略關于E{|Zn(k)|2),E{|En(k)|2)和的估值的細節,但它們典型地使用樣本值的“泄漏平均”來估值。使用在真實值與估計的剩余回波功率譜之間的歐幾里得距離以量度估值器的成功程度而得到的實驗結果表明瞬時值給出非常良好的結果。還是在Gustafsson中,雖然沒有討論子頻帶的數目和寬度,Fn被劃分成子頻帶以及每個Fn(k)被子頻帶中的平均值代替。在太小的情況下,Fn(k)沒有被包括在平均值中。實驗結果表示,當子頻帶尺寸是一個DFT頻點(bin)時達到低的估值誤差。
以上的公式(1)和(2)作了兩個假設Fn是實數值,以及是sn,vn和yn是統計上獨立的。對于剩余回聲估值在使用公式(1)和(2)的實驗結果時產生的估值剩余回聲功率譜的信噪比最好為約2.0dB。在記住這兩個假設的情況下,現在討論公式(2)的推導。然后去掉兩個假設,就可給出結果。
像SNR那樣的測量值是通過規定實數值轉移函數Fn,將剩余回聲譜分量與回聲Yn(k)相聯系,這樣,假設變換函數Fn是實數值,把(4)代入到(3),則產生這導致在(6)中使用(4)的關系式,則產生假設sn,vn,yn是在統計上獨立的,以及具有零中值,則以下的關系式保持正確。
從(8a)減去(8b)和從(6)和(7)代入,產生對Fn(k)求解二次方程,產生兩個解,Fn(k)=1和更有意義的解對于sn=0的實驗結果表明,在確定性變換中的誤差是來源于推導中的以下兩個假設F是實數值;以及sn,vn和yn是在統計上獨立的。實驗結果表明,更精確的剩余回聲估值是連同著一個在沒有假設統計獨立性的情況下得出的非實數值變換函數F而達到的。
去除F是實數值的假設令Fn(k)=Frn(k)+jFin(k),以及把這個定義通過(4)和(5)代入(6)和(7),并最后代入(9),導致二次方程的系列解。當Fin(k)被強迫為零時,實現(10)的解。當Frn(k)被強迫為零時,解為實驗結果表明,這個選擇不一定比已提出的更好。然而,重新組織該問題,導致非模糊的變換。可以把分開的變換函數用于Rn(k)的實部和虛部以代替(4)。
這導致對于實部和虛部的分開的解。方程(10)由以下形式的兩個解代替這個方法導致實驗結果的重大的改進。剩余回聲估值改進到45dB的SNR(沒有近區講話人的無噪聲情形)。下面,在(16)中顯示的數字的具有良好性能的公式也被使用來得到這個結果。
去除統計獨立的假設去除統計獨立的假設使公式(10)變為下式當與(13)相組合時,這成為以下形式的兩個方程矢量項(cross-term)取決于兩個未知項,即語音和噪聲譜分量。在計算變換函數時的非確定性被分離為矢量項估值。對于包括和0.5[Zn(k)+的矢量項的近似,研究了幾個選擇。近端的失真作為在與sn之間的Itakura-Saito失真被測量。遠端抑制則使用回聲反射損耗增強(ERLE)來測量。已經發現,把矢量項包括在內可以適當地改進在雙向講話期間的剩余回聲估值。然而,近端不是沒有失真的,而且某些剩余回聲仍舊是可聽見的。結果(下面討論)顯示于表1。
避免數字敏感性公式(7)對于Fn(k)的數值接近于1時是敏感的。以上作為替換的公式也遇到這個問題。在一個實施例中,當或很小(<10.0)時,通過使用和設置Rn(k)為零,這個情形可避免。這個改變大大改善了實驗結果。使用這種修正,在(1)中計算的剩余回聲估值從約2dB改進到約11.5dBSNR(沒有近區講話人的無噪聲情形)。
表1 對于各種矢量項的帶有和不帶有噪聲的模擬的近端、遠端和雙向講話情形的樣本結果
表1顯示對于帶有和不帶有近端噪聲的模擬的實驗結果。在近端單個講話期間的語音失真作為在和sn之間的Itakura-Saito失真ISD被測量。這些結果顯示在標以“ISD-近端”的各行中。可以得到純凈信號sn,因為使用了室內模擬器來產生話筒輸入zn。Itakura-Saito失真也用來測量雙向講話性能。這些結果顯示在標以“ISD-DT”的各行中。平均的ERLE用來測量在遠端單個講話期間的性能。這些結果被顯示在標以“ERLE-遠端”的各行中。不是用話筒輸入來對ERLE進行歸一化,而是用近端信號sn來對ERLE實施歸一化。不論在具有噪聲和沒有噪聲的情形下,在遠端單個講話期間,當矢量項被設置為0時,剩余回聲被很好地抑制(-23dB ERLE)。當近端在工作時,矢量項顯得很重要。在這些情形下,對矢量項使用估測可以得到更好的性能。在雙向講話期間,用代替矢量項可提供非常良好的結果(ISD中10-14倍的改進)。在近端單個講話期間,當存在背景噪聲時,使用代替矢量項的使用給出給出非常好的結果(ISD中8倍的改進)。在這兩種情形下,剩余回聲抑制是輕微的,遠端的失真是可聽見的。
在以上表格形式中顯示的結果,現在以對于每個近端單獨講話、遠端單獨講話、和雙向講話情形的分開的方程來表示。對于近端單個講話,剩余回聲的實部和虛部由系統通過使用以下的兩個方程進行估值。
對于遠端單獨講話,剩余回聲的實部和虛部由系統通過使用以下的兩個方程進行估值。
以及對于雙向講話,剩余回聲的實部和虛部由系統通過使用以下的兩個方程進行估值。
如上所示的、能夠計算矢量項的剩余回聲估值器顯示在其余的圖上以及參照這些圖進行描述。
圖2顯示剩余回聲估值器的第一部分的方框圖。電路200產生,en和zn的頻譜分量的實部。信號,en和zn分別被顯示在節點114,122和126上,它們被分別輸入到窗函數202,204和206。下標”n”是方塊的下標。可以使用任何適當的窗函數,包括矩形、Hamming、或Hann窗。在某些實施例中,窗函數202,204和206被省略。
在某些實施例中,AEC和NR是在時域中執行的。在這些實施例中,快速傅立葉變換(FFT)方塊208,210和212被使用來產生信號,en和zn的頻域表示,以便在剩余回聲估值器中使用。在其他的實施例中,AEC和NR在頻域中執行,窗方塊202,204和206以及FFT方塊208,210和212不存在。
FFT方塊208在節點220產生,以及把同一個結果提供到在節點222產生的平方函數214。FFT方塊210產生以及平方函數216在節點224產生。FFT方塊212在節點232產生,以及把同一個結果提供給用于在節點232產生的平方函數218。加法器226分別接收在節點222,224和230處的,,以及在節點228產生。
電路200產生,en和zn頻譜分量的實部。完整的剩余回聲估值器包括相應于電路200的另一個電路,它產生同一個頻譜分量的虛部。
圖3顯示剩余回聲估值器的第二部分的方框圖。電路300在節點232,220,228和222接收信號,這些節點相應于圖2上相同的號碼的節點。電路300也在節點302接收信號,它相應于來自噪聲減小電路(諸如噪聲減小電路120(圖1))的以前的輸出頻譜分量。加法器304和乘法器303與305產生,它被用作為當出現雙向講話事件時的矢量項。乘法器308產生,它只在有近端語音時才被使用。當存在不同的語音活動時,乘法器306和312實施在矢量項之間的切換。
在某些實施例中(軟判決實施例),在節點310和314產生的矢量項以變化的幅度被產生,以及由加法器316相加在一起。結果,在節點318產生的分子包括兩種類型的矢量項的分量。在軟判決實施例中,乘法器306和312產生可變的輸出值,它們是頻譜分量_和_的函數,以及輸出被加法器316相加在一起。
在其他的實施例中(硬判決實施例),_和_取數值“1”和“0”,以及乘法器306和312用作為開關,它們或者讓輸入通過,或者不讓輸入通過。例如,當_是“1”時,乘法器306用作為開關,以及把傳送到節點310。在這種情形下,乘法器306用作為閉合的開關以及乘法器312用作為打開的開關。另外,當_是“1”時,乘法器312把傳送到節點314。在這種情形下,乘法器316用作為閉合的開關以及乘法器306用作為打開的開關。下面參照圖4討論_和_的產生。
除法器320把節點318處的分子除以節點222處的,在節點322處產生。節點322處的代表剩余回聲的譜分量的實部的平方的估值。
加法器304與316,和乘法器306,308與312形成矢量項計算器,它計算以上表1所示的各種矢量項。本領域技術人員將會看到,其他實施例可被使用于矢量項計算器而不背離本發明的范圍。例如,電路300的全部或一部分可以用軟件實施。軟件可以在通用計算機,數字信號處理器(DSP),或其他處理器上執行。另外,電路300的全部或一部分可以專用硬件實施,諸如專用集成電路(ASIC)。
圖4顯示在揚聲器電話中的語音活動性檢測器的方框圖。雙向講話檢測器402在節點104接收遠端音頻,以及在節點126接收由話筒128獲取的近端音頻。在硬判定實施例中,當雙向講話在進行時,雙向講話檢測器402把_設置為等于1,否則,把_設置為等于0。語音活動性檢測器404在節點126接收近端音頻,以及確定在話筒處是否存在語音信號。與門406接收語音活動性檢測器404的輸出和在節點408上_的邏輯反。與門406在節點410產生變量_。在硬判定實施例中,如果沒有雙向講話但有近端語音活動,則β設置為1。否則_設置為零。在軟判決實施例中,_和_的范圍取0與1之間的實數值(包括0和1在內)。例如,在一個實施例中,_取0與1之間的實數值,以及_由乘法器而不是由與門406生成。在這樣的實施例中,乘法器按_=(1-_)*來產生_(語音活動性檢測器輸出)。
將會看到,以上的說明的意圖是說明性的,而不是限制性的。在閱讀和了解以上的說明后,許多其他實施例對于本領域技術人員是顯而易見的。所以,本發明的范圍是參照附屬的權利要求書被確定的,連同由這樣的權利要求書被授權的等價物的全部范圍。
權利要求
1.聲波回聲抵消系統,包括自適應濾波器,用于產生回聲估值和包括剩余回聲的誤差項,以及剩余回聲估值器,用于獨立地計算剩余回聲的離散傅立葉變換(DFT)的實部和虛部的估值。
2.權利要求1的波聲回聲抵消系統,其中剩余回聲估值器包括第一輸入節點,用于接收復合信號,其中包括近端語音、噪聲、和遠端語音的回聲;第二輸入節點,用于接收回聲估值;以及第三輸入節點,用于接收在回聲估值與復合信號之間的差值。
3.權利要求2的聲波回聲抵消系統,其中剩余回聲估值器被配置成當近端語音為活動的和遠端語音處于靜默時通過使用復合信號作為近端語音與噪聲的估值來計算剩余回聲的DFT的實部和虛部。
4.權利要求2的波聲回聲抵消系統,其中剩余回聲估值器被配置成當近端語音和遠端語音兩者都是活動的時通過使用復合信號與先前的輸出樣本的平均值作為近端語音與噪聲的估值來計算剩余回聲的DFT的實部和虛部。
5.權利要求2的聲波回聲抵消系統,其中剩余回聲估值器被配置成當近端語音是靜默和遠端語音是活動的時通過使用基本上為零的數值作為近端語音與噪聲的估值來計算剩余回聲的DFT的實部和虛部。
6.權利要求1的聲波回聲抵消系統,還包括一個響應于剩余回聲的DFT的實部和虛部以及在回聲估值與復合信號之間差值的噪聲減小電路。
7.揚聲器電話,包括一個被耦合到揚聲器的輸出端口,用于把遠端語音發送到聲音環境;一個被耦合到話筒的輸入端口,用于從聲音環境接收包括近端語音、噪聲、和遠端語音的回聲的復合信號;自適應濾波器,用于產生遠端語音的回聲的估值;以及剩余回聲估值器,用于獨立地估計在遠端語音的回聲與遠端語音的回聲的估值之間的差值的DFT的實部和虛部。
8.權利要求7的揚聲器電話,其中剩余回聲估值器包括矢量項計算器,用于計算由于缺少近端語音、噪聲、和遠端語音的回聲在統計上是獨立的假設而造成的矢量項的估值。
9.權利要求8的揚聲器電話,其中矢量項計算器被配置成根據究竟是遠端語音還是近端語音具有大于門限值的能量,從而不同地估計近端語音與噪聲的和值。
10.權利要求9的揚聲器電話,其中矢量項計算器被配置成當近端語音活動性檢測器指示近端語音具有大于門限值的能量以及雙向講話檢測器指示遠端語音具有低于門限值的能量時,估計該和值作為復合信號。
11.權利要求8的揚聲器電話,還包括噪聲減小電路,響應于剩余回聲的實部和虛部以產生近端語音的估值;以及用來估計近端語音與噪聲的和值的電路,該電路響應于雙向講話指示器,該電路還被配置成用來估計該和值作為復合信號與近端語音的先前的估值的平均值。
12.權利要求8的揚聲器電話,其中揚聲器電話在計算機中實施。
13.估計聲波回聲抵消系統中的剩余回聲的方法,該方法包括分開地估計剩余回聲的DFT的實部和虛部。
14.權利要求13的方法,其中分開地估計包括根據近端復合信號的DFT的實部、自適應濾波器輸出信號的DFT的實部、由近端復合信號與自適應濾波器輸出信號之間的差值產生的誤差信號的DFT的實部、和近端語音信號的DFT的實部與近端噪聲信號的DFT的實部的和值的近似值,從而估計剩余回聲的DFT的實部。
15.權利要求14的方法,其中剩余回聲的DFT的實部的平方按照基本上類似于下式的公式而被估計其中是剩余回聲的DFT的實部;是誤差信號的DFT的實部;是近端復合信號的DFT的實部;是自適應濾波器輸出信號的DFT的實部;以及表示近端語音信號的DFT的實部與近端噪聲信號的DFT的實部的和值的近似值。
16.權利要求15的方法,還包括當近端講話人處于靜默時,使用近端復合信號的DFT的實部來近似近端語音信號的DFT的實部與近端噪聲信號的DFT的實部的和值。
17.權利要求16的方法,其中剩余回聲的DFT的實部的平方按照基本上類似于下式的公式而被估計
18.權利要求15的方法,還包括只在近端講話人處于靜默時,才使用基本上為零的數值來近似近端語音信號的DFT的實部與近端噪聲信號的DFT的實部的和值。
19.權利要求18的方法,其中剩余回聲的DFT的實部的平方按照基本上類似于下式的公式而被估計
20.權利要求15的方法,還包括當存在雙向講話事件時,使用近端復合信號的DFT的實部與來自回聲抵消系統的以前輸出的DFT的和值來近似近端語音信號的DFT的實部與近端噪聲信號的DFT的實部的和值。
21.權利要求20的方法,其中剩余回聲的DFT的實部的平方按照基本上類似于下式的公式而被估計其中代表來自回聲抵消系統的以前輸出的DFT的實部。
22.權利要求13的方法,其中分開地估計包括通過使用包括由于缺少在話筒處接收的近端復合信號中的信號分量在統計上是獨立的假設而造成的矢量項的公式來估計剩余回聲的DFT的虛部。
23.權利要求22的方法,其中矢量項包括回聲估值的DFT的虛部和近端語音信號的DFT的虛部與近端噪聲信號的DFT的虛部的和值的乘積,以及其中估計剩余回聲的DFT的虛部的步驟包括用一個不同的乘積來代替矢量項,以作為近端語音信號是否包含足夠的能量以及遠端語音信號是否包含足夠的能量的函數。
24.權利要求22的方法,其中剩余回聲的DFT的虛部的平方按照基本上類似于下式的公式而被估計其中是剩余回聲的DFT的虛部;是誤差信號的DFT的虛部;是近端復合信號的DFT的虛部;是自適應濾波器輸出信號的DFT的虛部;以及表示近端語音信號的DFT的虛部與近端噪聲信號的DFT的虛部的和值的近似值。
25.權利要求24的方法,還包括當近端講話人處于靜默時,使用近端復合信號的DFT的虛部來近似近端語音信號的DFT的虛部與近端噪聲信號的DFT的虛部的和值。
26.權利要求25的方法,其中剩余回聲的DFT的虛部的平方按照基本上類似于下式的公式而被估計
27.權利要求24的方法,還包括只在近端講話人處于靜默時,才使用基本上為零的數值來近似近端語音信號的DFT的虛部與近端噪聲信號的DFT的虛部的和值。
28.權利要求27的方法,其中剩余回聲的DFT的虛部的平方按照基本上類似于下式的公式而被估計
29.權利要求22的方法,還包括當存在雙向講話事件時,使用近端復合信號的DFT的虛部與來自聲波回聲抵消系統的以前輸出的DFT的和值來近似近端語音信號的DFT的虛部與近端噪聲信號的DFT的虛部的和值。
30.權利要求20的方法,其中剩余回聲的DFT的虛部的平方按照基本上類似于下式的公式而被估計其中表示來自回聲抵消系統的以前輸出的DFT的虛部。
全文摘要
回聲抵消系統中剩余回聲的離散傅立葉變換(DFT)的實部和虛部分量是通過使用沒有作在近端話筒輸入信號的分開的分量之間的統計獨立性的假設得出的變換函數被分開地估計的。剩余回聲估值器通過使用不帶有回聲的話筒輸入信號的近似,計算分量的實部和虛部。取決于近端講話人和/或遠端講話人是否正在講話,使用不同的近似。
文檔編號H04M9/08GK1486566SQ01818918
公開日2004年3月31日 申請日期2001年9月14日 優先權日2000年9月15日
發明者M·E·戴舍爾, M E 戴舍爾 申請人:英特爾公司