殘留回波消除方法及裝置制造方法
【專利摘要】本發明公開了一種殘留回波消除方法及裝置。其中,該方法包括:對當前接收到的殘留回波信號進行特征提取,得到殘留回波向量;獲取存儲的用戶語音模板向量,其中,用戶語音模板向量通過對預先錄制的用戶語音進行語音特征提取得到;判斷殘留回波向量與用戶語音模板向量之間的距離是否大于預先設定向量閾值,在判斷結果為是的情況下,確定殘留回波信號為非用戶信號,并消除非用戶信號。通過本發明,達到了能處理由于雙端通話、回波路徑改變、濾波器階數不匹配等因素產生的線性殘留回波,同時還能處理噪聲信號和其他非線性殘留回波的效果。
【專利說明】殘留回波消除方法及裝置
【技術領域】
[0001]本發明涉及通信領域,具體而言,涉及一種殘留回波消除方法及裝置。
【背景技術】
[0002]隨著無線通信技術的飛速發展,人們對話音通信的質量及舒適性提出了更高的要求。其中,舒適自然的免提對話環境正成為人們日益增長的需求。然而回波的存在卻影響了通信質量,嚴重時能夠使通信系統不能正常工作。
[0003]對于回波的抑制,一般采用自適應回波抵消的方法。自適應濾波器通過對聲回授通道的沖擊響應的辨識,產生出同回聲相同的信號,再從近端話音和回聲的混合信號中減去回聲信號來達到回聲對消的目的。它既可以保證對話音質量影響最小,又使得回聲得到最大的抑制。自適應回波對消技術的最大特點就是對聲回授通道所在的空間(不論內部空間尺寸如何,不論其內部陳設如何,也不論講話者所處位置)而言,它都會自動地跟蹤房間聲學特性的變化,最大限度地抑制由聲回授引起回聲乃至嘯叫。然而,在實際應用中需要提前對自適應濾波器的階數進行設定,只有當通話環境的沖擊響應階數與自適應濾波器的階數匹配時,自適應濾波算法才能取得很好的效果,否則將出現較大的殘留回波信號。同時,通話中常常存在雙端通話,回波路徑突變等現象,這些都會影響自適應濾波器的收斂性能,導致回波不能有效地得到消除,出現殘留回波。另外,由于話筒的過飽和等因素在通話過程中會出現非線性回波信號,而自適應濾波器只能處理線性回波,最終導致輸出信號中存在非線性殘留回波信號。
[0004]殘留回波信號的存在使得用戶的回波問題并沒有真正得到解決,嚴重影響用戶的聽覺體驗。一般的解決辦法是在自適應回波抑制裝置之后加入殘留回波抑制模塊,對自適應濾波器的輸出信號進行進一步的處理。
[0005]傳統的殘留回波抑制方法在檢測到存在殘留回波信號時,通過斷開開關來消除殘留回波信號。然而,在信噪比較小的情況下殘留回波抑制器會出現轉換效應,該效應是由于噪聲抑制器在應該處理殘留回波的時間處理了噪聲,使得殘留回波抑制器頻繁的處于開關狀態。轉換效應嚴重影響了用戶的聽覺感受,找到一種能將噪聲和殘留回波同時進行處理的其他非線性方法十分必要。
[0006]同時,隨著手機終端的迅速發展,用戶的個性化服務已經成為未來的發展方向。傳統的針對手機終端的回波抑制處理并未利用用戶的個性化信息。
[0007]針對相關技術中移動語音通信中的殘留回波問題,目前尚未提出有效的解決方案。
【發明內容】
[0008]本發明提供了一種殘留回波消除方法及裝置,以至少解決上述問題。
[0009]根據本發明的一個方面,提供了一種殘留回波消除方法,包括:對當前接收到的殘留回波信號進行特征提取,得到殘留回波向量;獲取存儲的用戶語音模板向量,其中,用戶語音模板向量通過對預先錄制的用戶語音進行語音特征提取得到;判斷殘留回波向量與用戶語音模板向量之間的距離是否大于預先設定的向量閾值,在判斷結果為是的情況下,確定殘留回波信號為非用戶信號,并消除非用戶信號。
[0010]優選地,通過以下方式得到用戶語音模板向量:通過獲取用戶語音的第一線性預測系數,建立用戶語音的語音高斯混合模型;根據用戶語音高斯混合模型計算用戶語音模板向量。
[0011]優選地,獲取用戶語音的第一線性預測系數,包括:對用戶語音以第一預定采樣頻率進行采樣,得到第一用戶語音序列;對第一用戶語音序列進行端點檢測和重組處理,得到第二用戶語音序列;計算第二用戶語音序列的第一線性預測系數。
[0012]優選地,對當前接收到的殘留回波信號進行特征提取,得到殘留回波向量,包括:通過獲取殘留回波信號的第二線性預測系數,建立殘留回波信號的信號高斯混合模型;根據信號語音高斯混合模型計算殘留回波向量。
[0013]優選地,獲取殘留回波信號的第二線性預測系數,包括:對殘留回波信號以第二預定采樣頻率進行采樣,得到第一信號序列;對第第一信號序列進行端點檢測和重組處理,得到第二信號序列;計算第二信號序列的第二線性預測系數。
[0014]根據本發明的另一方面,提供了一種殘留回波消除裝置,包括:提取模塊,用于對當前接收到的殘留回波信號進行特征提取,得到殘留回波向量;獲取模塊,用于獲取存儲的用戶語音模板向量,其中,用戶語音模板向量通過對預先錄制的用戶語音進行語音特征提取得到;判斷模塊,用于判斷殘留回波向量與用戶語音模板向量之間的距離是否大于預先設定的向量閾值;確定模塊,用于在判斷模塊的判斷結果為是的情況下,確定殘留回波信號為非用戶信號;消除模塊,用于消除非用戶信號。
[0015]優選地,獲取模塊包括:第一建立模塊,用于通過獲取用戶語音的第一線性預測系數,建立用戶語音的語音高斯混合模型;第一計算模塊,用于根據用戶語音高斯混合模型計算用戶語音模板向量;存儲模塊,用于存儲用戶語音模板向量。
[0016]優選地,第一建立模塊包括:第一采樣單元,用于對用戶語音以第一預定采樣頻率進行采樣,得到第一用戶語音序列;第一處理單元,用于對第一用戶語音序列進行端點檢測和重組處理,得到第二用戶語音序列;第一計算單元,用于計算第二用戶語音序列的第一線性預測系數。
[0017]優選地,提取模塊包括:第二建立模塊,用于通過獲取殘留回波信號的第二線性預測系數,建立殘留回波信號的信號高斯混合模型;第二計算模塊,用于根據信號語音高斯混合模型計算殘留回波向量。
[0018]優選地,第二建立模塊包括:第二采樣單元,用于對殘留回波信號以第二預定采樣頻率進行采樣,得到第一信號序列;第二處理單元,用于對第第一信號序列進行端點檢測和重組處理,得到第二信號序列;第二計算單元,用于計算第二信號序列的第二線性預測系數。
[0019]通過本發明,采用預先為用戶語音提取語音特征,將接收到的殘留回波信號與語音特征作對比以確定是否需要對殘留回波進行消除的方式,解決了現有技術無法將噪聲和殘留回波同時進行處理問題,進而達到了能處理由于雙端通話、回波路徑改變、濾波器階數不匹配等因素產生的線性殘留回波,同時還能處理噪聲信號和其他非線性殘留回波,從而避免了傳統的殘留回波抑制器的轉換效應,滿足了實際語音通信的需求的效果。
【專利附圖】
【附圖說明】
[0020]此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,本發明的示意性實施例及其說明用于解釋本發明,并不構成對本發明的不當限定。在附圖中:
[0021]圖1是根據本發明實施例的殘留回波消除方法流程圖;
[0022]圖2是根據本發明實施例的殘留回波消除裝置的結構框圖;
[0023]圖3是根據本發明實施例的優選殘留回波消除裝置的結構框圖;
[0024]圖4是根據本發明優選實施例一的殘留回波消除裝置的結構示意圖;
[0025]圖5是根據本發明優選實施例一的殘留回波消除裝置中的用戶語音處理模塊的結構示意圖;
[0026]圖6是根據本發明優選實施例一的殘留回波消除過程示意圖;
[0027]圖7是根據本發明優選實施例一的殘留回波消除裝置中的實時處理模塊的結構示意圖;
[0028]圖8是根據本發明優選實施例二的殘留回波消除裝置的結構示意圖;
[0029]圖9是根據本發明優選實施例三的殘留回波消除裝置的結構示意圖;
[0030]圖10是根據本發明優選實施例三的殘留回波消除流程圖。
【具體實施方式】
[0031]下文中將參考附圖并結合實施例來詳細說明本發明。需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。
[0032]在對本發明實施例進行詳細描述之前,對本發明實施例解決其技術問題的思路做一個簡要介紹:人與人之間在發音器官上存在著差異,同時說話時發音習慣也有不同,這使得每個人的語音具備獨一無二的特點。本發明實施例正是利用這個特點能夠分辨出哪些是用戶需要的信號,哪些是需要濾除的信號。
[0033]圖1是根據本發明實施例的殘留回波消除方法流程圖,如圖1所示,該方法流程主要包括以下步驟(步驟S102-步驟S106):
[0034]步驟S102,對當前接收到的殘留回波信號進行特征提取,得到殘留回波向量;
[0035]步驟S104,獲取存儲的用戶語音模板向量,其中,用戶語音模板向量通過對預先錄制的用戶語音進行語音特征提取得到;
[0036]步驟S106,判斷殘留回波向量與用戶語音模板向量之間的距離是否大于預先設定的向量閾值,在判斷結果為是的情況下,確定殘留回波信號為非用戶信號,并消除非用戶信號。
[0037]在本實施例的步驟S104中,可以通過以下方式得到用戶語音模板向量:獲取用戶語音的第一線性預測系數,建立用戶語音的語音高斯混合模型;根據用戶語音高斯混合模型計算用戶語音模板向量。
[0038]其中,當獲取用戶語音的第一線性預測系數時,可以通過以下方式來實現:對用戶語音以第一預定采樣頻率進行采樣,得到第一用戶語音序列;對第一用戶語音序列進行端點檢測和重組處理,得到第二用戶語音序列;計算第二用戶語音序列的第一線性預測系數。[0039]在本實施例中,步驟S102可以這樣實現:通過獲取殘留回波信號的第二線性預測系數,建立殘留回波信號的信號高斯混合模型;根據信號語音高斯混合模型計算殘留回波向量。
[0040]其中,當獲取殘留回波信號的第二線性預測系數時,可以通過以下方式來實現:對殘留回波信號以第二預定采樣頻率進行采樣,得到第一信號序列;對第第一信號序列進行端點檢測和重組處理,得到第二信號序列;計算第二信號序列的第二線性預測系數。
[0041]例如,在實際應用中,上述殘留回波消除方法可以這樣進行:
[0042](I)在處理殘留回波之前建立用戶語音模型,建立后存儲在終端中作為用戶語音幀的模板,該模塊錄制近端用戶的語音,再依次對錄制的用戶語音進行端點檢測、特征提取,最后建立用戶語音模型。
[0043](2)實時處理殘留回波信號。對當前接收到的殘留回波信號進行特征提取,建立信號高斯混合模型。
[0044](3)判斷、消除非用戶語音幀。通過比較用戶語音模型和殘留回波信號高斯模型判斷殘留回波信號的當前幀是否為非用戶語音幀,并將非用戶語音幀置零,將用戶語音幀正常輸出。
[0045]在進行完三個步驟之后,繼續跳轉到步驟(2)循環運行。
[0046]圖2是根據本發明實施例的殘留回波消除裝置的結構框圖,如圖2所示,該裝置主要包括:提取模塊10、獲取模塊20、判斷模塊30、確定模塊40以及消除模塊50。其中,提取模塊10,用于對當前接收到的殘留回波信號進行特征提取,得到殘留回波向量;獲取模塊20,連接至提取模塊10,用于獲取存儲的用戶語音模板向量,其中,用戶語音模板向量通過對預先錄制的用戶語音進行語音特征提取得到;判斷模塊30,連接至獲取模塊20,用于判斷殘留回波向量與用戶語音模板向量之間的距離是否大于預先設定的向量閾值;確定模塊40,連接至判斷模塊30,用于在判斷模塊的判斷結果為是的情況下,確定殘留回波信號為非用戶信號;消除模塊50,連接至確定模塊40,用于消除非用戶信號。
[0047]圖3是根據本發明實施例的優選殘留回波消除裝置的結構框圖,如圖3所示,在該優選殘留回波消除裝置中,獲取模塊20可以包括:第一建立模塊22,用于通過獲取用戶語音的第一線性預測系數,建立用戶語音的語音高斯混合模型;第一計算模塊24,連接至第一建立模塊22,用于根據用戶語音高斯混合模型計算用戶語音模板向量;存儲模塊26,連接至第一計算模塊24,用于存儲用戶語音模板向量。
[0048]其中,第一建立模塊22可以包括:第一米樣單兀222,用于對用戶語音以第一預定采樣頻率進行采樣,得到第一用戶語音序列;第一處理單元224,連接至第一采樣單元222,用于對第一用戶語音序列進行端點檢測和重組處理,得到第二用戶語音序列;第一計算單元226,連接至第一處理單元224,用于計算第二用戶語音序列的第一線性預測系數。
[0049]在該優選殘留回波消除裝置中,提取模塊10可以包括:第二建立模塊12,用于通過獲取殘留回波信號的第二線性預測系數,建立殘留回波信號的信號高斯混合模型;第二計算模塊14,連接至第二建立模塊12,用于根據信號語音高斯混合模型計算殘留回波向量。
[0050]其中,第二建立模塊12可以包括:第二采樣單元122,用于對殘留回波信號以第二預定采樣頻率進行采樣,得到第一信號序列;第二處理單元124,連接至第二采樣單元122,用于對第第一信號序列進行端點檢測和重組處理,得到第二信號序列;第二計算單元126,連接至第二處理單元124,用于計算第二信號序列的第二線性預測系數。
[0051]對于上述的優選殘留回波消除裝置的結構而言,在實際應用中,不必局限于該結構,例如,也可以采用如下優選實施例一、優選實施例二和優選實施例三的結構來實現上述實施例提供的殘留回波消除方法。
[0052]下面結合圖4至圖10以及優選實施例一、優選實施例二和優選實施例三對上述實施例提供的殘留回波消除方法及殘留回波消除裝置進行詳細說明。
[0053]實施例一
[0054]圖4是根據本發明優選實施例一的殘留回波消除裝置的結構示意圖,如圖1所示,該裝置包括:用戶語音處理模塊,實時處理模塊,和判決輸出模塊。在實際應用中,用戶語音處理模塊首先錄制近端用戶的語音依次進行端點檢測,特征提取,最后建立高斯模型。用戶語音處理模塊的結構如圖5所示,錄制語音長度一般取50-60S,以8000Hz采樣后得到用戶語音序列f(n)。由于得到的語音序列不完全是語音幀,還存在說話的停頓間隔,所以需要對其進行端點檢測和重組處理。端點檢測模塊將f (η)分成K幀& (1=1,2,...!(),幀長為L (本實施例中L取256),根據規則I和規則計算幀能量:
[0055]energyi= Σ ^21,[規則 I],
[0056]
【權利要求】
1.一種殘留回波消除方法,其特征在于,包括: 對當前接收到的殘留回波信號進行特征提取,得到殘留回波向量; 獲取存儲的用戶語音模板向量,其中,所述用戶語音模板向量通過對預先錄制的用戶語音進行語音特征提取得到; 判斷所述殘留回波向量與所述用戶語音模板向量之間的距離是否大于預先設定的向量閾值,在判斷結果為是的情況下,確定所述殘留回波信號為非用戶信號,并消除所述非用戶信號。
2.根據權利要求1所述的方法,其特征在于,通過以下方式得到所述用戶語音模板向量: 通過獲取所述用戶語音的第一線性預測系數,建立所述用戶語音的語音高斯混合模型; 根據所述用戶語音高斯混合模型計算所述用戶語音模板向量。
3.根據權利要求2所述的方法,其特征在于,獲取所述用戶語音的第一線性預測系數,包括: 對所述用戶語音以第一預定采樣頻率進行采樣,得到第一用戶語音序列; 對所述第一用戶語音序列進行端點檢測和重組處理,得到第二用戶語音序列; 計算所述第二用戶語音序列的所述第一線性預測系數。
4.根據權利要求1至3中任一項所述的方法,其特征在于,對當前接收到的殘留回波信號進行特征提取,得到殘留回波向量,包括: 通過獲取所述殘留回波信號的第二線性預測系數,建立所述殘留回波信號的信號高斯混合模型; 根據所述信號語音高斯混合模型計算所述殘留回波向量。
5.根據權利要求4所述的方法,其特征在于,獲取所述殘留回波信號的第二線性預測系數,包括: 對所述殘留回波信號以第二預定采樣頻率進行采樣,得到第一信號序列; 對所述第第一信號序列進行端點檢測和重組處理,得到第二信號序列; 計算所述第二信號序列的所述第二線性預測系數。
6.一種殘留回波消除裝置,其特征在于,包括: 提取模塊,用于對當前接收到的殘留回波信號進行特征提取,得到殘留回波向量; 獲取模塊,用于獲取存儲的用戶語音模板向量,其中,所述用戶語音模板向量通過對預先錄制的用戶語音進行語音特征提取得到; 判斷模塊,用于判斷所述殘留回波向量與所述用戶語音模板向量之間的距離是否大于預先設定的向量閾值; 確定模塊,用于在所述判斷模塊的判斷結果為是的情況下,確定所述殘留回波信號為非用戶信號; 消除模塊,用于消除所述非用戶信號。
7.根據權利要求6所述的裝置,其特征在于,所述獲取模塊包括: 第一建立模塊,用于通過獲取所述用戶語音的第一線性預測系數,建立所述用戶語音的語音高斯混合模型;第一計算模塊,用于根據所述用戶語音高斯混合模型計算所述用戶語音模板向量; 存儲模塊,用于存儲所述用戶語音模板向量。
8.根據權利要求7所述的裝置,其特征在于,所述第一建立模塊包括: 第一采樣單元,用于對所述用戶語音以第一預定采樣頻率進行采樣,得到第一用戶語音序列; 第一處理單元,用于對所述第一用戶語音序列進行端點檢測和重組處理,得到第二用戶語音序列; 第一計算單元,用于計算所述第二用戶語音序列的所述第一線性預測系數。
9.根據權利要求6至8中任一項所述的裝置,其特征在于,所述提取模塊包括: 第二建立模塊,用于通過獲取所述殘留回波信號的第二線性預測系數,建立所述殘留回波信號的信號高斯混合模型; 第二計算模塊,用于根據 所述信號語音高斯混合模型計算所述殘留回波向量。
10.根據權利要求9所述的裝置,其特征在于,所述第二建立模塊包括: 第二采樣單元,用于對所述殘留回波信號以第二預定采樣頻率進行采樣,得到第一信號序列; 第二處理單元,用于對所述第第一信號序列進行端點檢測和重組處理,得到第二信號序列; 第二計算單元,用于計算所述第二信號序列的所述第二線性預測系數。
【文檔編號】H04M9/08GK103533193SQ201210382181
【公開日】2014年1月22日 申請日期:2012年10月10日 優先權日:2012年7月4日
【發明者】劉冬梅, 孫燾, 王進軍, 薛濤, 王霞, 張琦 申請人:中興通訊股份有限公司