專利名稱:一種單講狀態下回聲抵消的方法、裝置及系統的制作方法
技術領域:
本發明涉及通信領域,尤其是涉及視頻會議中一種單講狀態下回聲抵消的方法、 裝置及系統。
背景技術:
視頻會議可以讓身處兩地的與會者員面對面地進行交流,如圖1所示為現有技術中本端會場的音頻通信布局示意圖,在本端會場100內,具有與會者IOla 101c,麥克風 102a 102c、揚聲器103a 103c以及顯示屏(未繪示)。麥克風10 102c除了采集與會者IOla IOlc的聲音外(對應圖1中虛線),還采集揚聲器103a 103c所對應的回聲信號(對應圖1中實線)。因此,為了保證通話質量,就需要對麥克風10 102c所采集的信號進行回聲抵消,所謂回聲抵消就是將麥克風10 102c所采集到的信號減去揚聲器10 102c的回聲信號。如圖2所示為一種多聲道回聲抵消的原理框圖,圖中的m對應幀的順序號,根據圖 2,可以得出回聲抵消的公式為E(m) =Y(m)-X(m) · H(m)公式(1)其中X(m)為遠端傳送過來的P路揚聲器的回聲信號,Y(m)為本端會場中拾取的 Q路麥克風信號,E (m)為最終估計的Q路最終殘差信號,即去除回聲后的麥克風信號,H(m) 為表征回聲路徑的濾波器系數。在現有的回聲抵消系統中,由于X(m)和Y(m)都是可以實時采集到的,因此要得到 E(m),必須估計表征回聲路徑的濾波器系數H(m)。同時得到E(m)后,還需再用E(m)更新 H(m),具體的,可基于RLS算法或者LMS算法等算法來更新H(m)。確定H(m)后,利用公式 (1)即可去除麥克風信號X(m)中的回聲信號。需要指出的是,上述H(m)的更新僅在“單講”的條件下進行,即遠端會場的與會者中當且僅當一個人在講話,而本端會場中的與會者沒有聲音發出。而當“雙講”的時候,即遠端會場的與會者中有兩個以上的人同時講話,或者遠端會場有人講話,同時本端會場也有人講話時,H(m)并不執行更新。但是上述現有技術中,由于存在多條回聲路徑,因此需要估計多條回聲路徑的回聲信號,即需要更新多條回聲路徑的濾波器系數H(m),比如當圖1中某一時刻處于上述“單講”狀態時,如果揚聲器103a 103c均有回聲信號,則需要更新3 X 3 = 9條回聲路徑的濾波器系數H(m);如果揚聲器103a 10 有回聲信號,則需要更新2X3 = 6條回聲路徑的濾波器系數H(m)。可見,如果當揚聲器的數量及麥克風的數量增加時,再進行回聲抵消過程中需要更新的濾波器系數H (m)的數量將會大量增加,而更新濾波器系數H (m)的計算復雜度也會大幅增加,也從而需要提高處理器的處理能力,或者是需要增加處理器的個數,進而導致了硬件成本的增加
發明內容
本發明用于提供一種回聲抵消的方法、裝置及系統,用于減少回聲抵消中需要更新的濾波器系數,降低回聲抵消中對處理器性能的需求,減少硬件成本的付出。一方面,本發明實施例提供了一種單講狀態下的回聲抵消的方法,該方法包括接收遠端會場發送的聲音信號和與所述聲音信號所對應的方位信息;根據所述方位信息判斷所述聲音信號在本端會場中的所屬播放區域;對所述聲音信號進行雙講狀態檢測,如果處于單講狀態,則更新所述聲音信號的所屬播放區域對應回聲路徑的虛擬濾波器系數;利用所述虛擬濾波器系數進行回聲抵消。另一方面,本發明實施例還提供了一種單講狀態下的回聲抵消裝置,包括接收單元,用于接收遠端會場發送的聲音信號和與所述聲音信號所對應的方位信息;區域判斷單元,用于根據所述方位信息判斷所述聲音信號在本端會場中的所屬播放區域;雙講檢測單元,用于對所述聲音信號進行雙講狀態檢測;自適應更新單元,用于當所述虛擬聲源僅處于單講狀態時,更新所述播放區域所對應回聲路徑的虛擬濾波器系數;回聲抵消單元,用于利用所述虛擬濾波器系數進行回聲抵消。另一方面,本發明實施例還提供了一種音頻通信系統,所述系統包括麥克風陣列和如上所述的回聲抵消裝置,所述麥克風陣列用于采集遠端會場的聲音信號和與所述聲音信號所對應的方位信息,所述回聲抵消裝置根據所述聲音信號和所述方位信號采用如上所述的方法對本端會場所采集的聲音信號進行回聲抵消。本發明實施例在進行回聲抵消時,只需要更新聲音信號所屬區域所對應的回聲路徑的虛擬濾波器系數,即同一時刻最多只需要更新和麥克風陣列數量相同的虛擬濾波器系數,因此大幅降低了回聲抵消時的運算復雜度,從而降低了回聲抵消中對處理器性能的需求,減少了硬件成本的付出。
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。圖1為現有技術中本端會場的音頻通信布局示意圖;圖2為一種多聲道回聲抵消的原理框圖;圖3為本發明實施例提供的一種單講狀態下回聲抵消的方法流程示意圖;圖4為本發明實施例提供的本端會場中虛擬聲源的模擬示意圖;圖5為本發明實施例提供的一種虛擬聲源合成環境的俯視圖;圖6為圖5的簡化示意圖;圖7所示為本發明實施例提供的另一種虛擬聲源合成環境的簡化俯視圖;圖8為本發明實施例提供的另一種單講狀態下回聲抵消的方法流程示意圖;圖9為本發明實施例提供的一種回聲抵消的工作示意圖;圖10為本發明實施例提供的一種單講狀態下回聲抵消裝置的結構示意圖;圖11為本發明實施例提供的一種區域判斷單元的結構示意圖;圖12為本發明實施例提供的另一種單講狀態下回聲抵消裝置的結構示意5CN 102387269 A
說明書
3/11 頁 圖13為本發明實施例提供的一種音頻通信系統的結構示意圖;圖14為本發明實施例提供的另一種音頻通信系統的結構示意圖;圖15為本發明實施例提供的一端會場的布局示意圖;圖16為圖15中一個麥克風所對應的回聲路徑示意圖;圖17為圖15中某一時刻需要更新的虛擬濾波器系數所對應的回聲路徑示意圖。
具體實施例方式下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。如圖3所示為本發明實施例提供的一種單講狀態下回聲抵消的方法流程示意圖, 本實施例是從本端的回聲抵消裝置側對本發明所作的描述,該方法包括如下步驟S301 接收遠端會場發送的聲音信號和與所述聲音信號所對應的方位信息;在本實施例中,遠端會場可以通過設置一個或多個麥克風陣列來實現遠端聲音信號及與該聲音信號所對應方位信息的采集(比如利用到達時間差(Time Difference of Arrival, TDOA)技術),然后將采集到的信號發送給本端會場的回聲抵消裝置。S302 根據所述方位信息判斷所述聲音信號在本端會場中的所屬播放區域;在視頻會議中,遠端會場的景象會在本端會場的顯示設備上進行重放,為了能使本端會場的與會者感受到遠端會場正在講話的與會者的正確方位,需要根據上述方位信息判斷上述聲音信號在本端會場(顯示設備)中所屬的播放區域,該播放區域與遠端會場發出上述聲音信號的與會者的實際位置相對應。S303 對所述聲音信號進行雙講狀態檢測,如果僅處于單講狀態,則更新所述播放區域所對應回聲路徑的虛擬濾波器系數;在本實施例中可以模擬遠端會場與會者從本端會場中的上述播放區域發出上述聲音信號,從而本端會場與會者可以感受到上述聲音是從期望的方向發出的,使得本發明實施例可以在本端真實地模擬現場會議,該模擬的聲音信號在本實施例中可以稱之為虛擬聲源。作為本發明的一個實施例,可以利用幅度矢量合成定位(Vector Base Amplitude Panning,VBAP)技術通過多個揚聲器來實現上述虛擬聲源的效果。下面以兩個揚聲器來進行舉例說明如圖4所示為本發明實施例提供的本端會場中虛擬聲源的模擬示意圖,其中顯示設備403用于呈現遠端會場的影像,影像404為遠端會場中的與會者在顯示設備403 中的影像。如果揚聲器401a和揚聲器401b發出的聲音是相同的,那么本端會場與會者402 實際聽到的影像404的聲音是從揚聲器401a和揚聲器401b的中心連線的中點位置P1發出的。而實際上與會者402聽到影像404的聲音應該是從P2位置發出,也就是在這種情況下與會者402并沒有感受到正確的聲音方位。而如果采用VBAP技術,就能將影像404對應的與會者發出的聲音虛擬在P2位置發出,從而使得與會者402感受到了聲音的正確方位。以圖4為例,本步驟中所稱虛擬聲源即為從P2位置發出影像404所對應的遠端與會者的聲音,而虛擬濾波器系數即為P2位置到本端麥克風的回聲路徑的濾波器系數。
S304 利用所述虛擬濾波器系數進行回聲抵消。本端的回聲抵消裝置可以將上述更新的虛擬濾波器系數代入公式(1)中來對本端麥克風陣列所采集到的聲音信息進行回聲抵消操作。對于本端會場與會者講話,遠端會場與會者收聽的情況,和上述情況相似,在此不再贅述。本發明實施例在進行回聲抵消時,只需要更新聲音信號所屬區域所對應回聲路徑的虛擬濾波器系數,當本端麥克風陣列數量為Q時,虛擬聲源到麥克風陣列的回聲路徑為Q 條,因此同一時刻最多只需要更新Q個虛擬濾波器系數,相對于現有技術中有可能最多需要更新PXQ(P為本端揚聲器的數量)個濾波器系數來說,大幅降低了回聲抵消時的運算復雜度,從而降低了回聲抵消中對處理器性能的需求,減少了硬件成本的付出。另外本發明實施例使得與會者可以感受遠端講話人從期望的方位發出聲音,使得視頻會議更加逼真。下面對本發明實施例對利用更新的虛擬濾波器系數進行回聲抵消的實施方式進行說明首先以兩個揚聲器合成虛擬聲源為例來進行說明,如圖5所示為本發明實施例提供的一種虛擬聲源合成環境的俯視圖,該環境中包括揚聲器501a、揚聲器501b及與會者 503,其中揚聲器501a和揚聲器501b的位置固定不動,虛擬聲源502所在位置為要虛擬的聲源的位置。在本實施例中以與會者503為中心在平面上劃分X和Y軸,通道1為揚聲器 501a到與會者503之間的通道,通道2為揚聲器501b到與會者503之間的通道,通道3為虛擬聲源502所在位置到與會者503之間的通道,Zp為通道3和Y軸的夾角,Z外為通道1 和通道2與Y軸的夾角,且0° <φ0< 90° ,Ζφ < Ζφ0。基于上述環境,立體聲幅度合成可以用公式表示如下幻2+S=C公式O)= llj^公式(3) sin 外 +^2上式中&通道1信號幅度的增益因子,g2通道2信號幅度的增益因子,gl,g2e
,C是一個定值,它是控制聲音距離的參數,虛擬聲源502的位置距離與會者503距離越大,則C越小,反之,則越大。考慮到揚聲器501a和揚聲器501b到與會者503的距離,可以認為虛擬聲源502 的位置是和兩個揚聲器位于同一條直線上的,圖5可以簡化成如圖6所示。如圖6所示,虛擬聲源502距離Y軸的距離為d2,揚聲器501a和揚聲器301b到Y軸的距離為dl,可以得到
sin d, 二寸二 R 公式(4) Sin^0 Ci1將公式(4)代入公式(3)可以得到= &公式(5) “1- 6 2聯合公式⑵、公式(5)可以得到gl = (l + R)· ^^ 公式(6)
權利要求
1.一種單講狀態下的回聲抵消的方法,其特征在于,所述方法包括接收遠端會場發送的聲音信號和與所述聲音信號所對應的方位信息;根據所述方位信息判斷所述聲音信號在本端會場中的所屬播放區域;對所述聲音信號進行雙講狀態檢測,如果處于單講狀態,則更新所述聲音信號的所屬播放區域對應回聲路徑的虛擬濾波器系數;利用所述虛擬濾波器系數進行回聲抵消。
2.如權利要求1所述的方法,其特征在于,所述根據所述方位信息判斷所述聲音信號在本端會場中的所屬播放區域包括將本端會場劃分成多個播放區域;根據所述方位信息獲得對應所述多個播放區域的區域系數;根據所述多個播放區域的區域系數獲得所述方位信息在本端會場中的所屬播放區域。
3.如權利要求1所述的方法,其特征在于,所述接收遠端會場發送的聲音信號和與所述聲音信號所對應的方位信息之后還包括對所述聲音信號進行增強處理來抑制所述聲音信號中的干擾信號。
4.如權利要求1所述的方法,其特征在于,所述方位信息包括一維坐標信息。
5.如權利要求1所述的方法,其特征在于,所述虛擬濾波器系數為多個揚聲器所對應回聲路徑的濾波器系數以及所述多個揚聲器的通道信號幅度的增幅因子的加權和,所述利用所述虛擬濾波器系數進行回聲抵消包括將本端會場采集的麥克風信號減去所述本端會場揚聲器對應回聲路徑的回聲信號與所述虛擬濾波器系數的乘積,得到經過回聲抵消后的麥克風信號。
6.一種單講狀態下的回聲抵消裝置,其特征在于,包括接收單元,用于接收遠端會場發送的聲音信號和與所述聲音信號所對應的方位信息;區域判斷單元,用于根據所述方位信息判斷所述聲音信號在本端會場中的所屬播放區域;雙講檢測單元,用于對所述聲音信號進行雙講狀態檢測;自適應更新單元,用于當所述虛擬聲源僅處于單講狀態時,更新所述播放區域所對應回聲路徑的虛擬濾波器系數;回聲抵消單元,用于利用所述虛擬濾波器系數進行回聲抵消。
7.如權利要求6所述的裝置,其特征在于,所述區域判斷單元包括區域劃分模塊,用于將本端會場劃分成多個播放區域;區域系數獲取模塊,用于根據所述方位信息獲得對應所述多個播放區域的區域系數;區域判斷模塊,用于根據所述多個播放區域的區域系數獲得所述方位信息在本端會場中的所屬播放區域。
8.如權利要求6所述的裝置,其特征在于,所述裝置還包括聲音信號增強處理單元,用于對遠端會場發送的所述聲音信號進行增強處理;所述雙講檢測單元,還用于對經過增強處理的聲音信號進行雙講狀態檢測。
9.如權利要求6所述的裝置,其特征在于,所述回聲抵消單元具體用于將本端會場采集的麥克風信號減去本端會場揚聲器對應回聲路徑的回聲信號與所述虛擬濾波器系數的乘積,得到經過回聲抵消后的麥克風信號,所述虛擬濾波器系數為多個揚聲器所對應回聲路徑的濾波器系數以及所述多個揚聲器的通道信號幅度的增幅因子的加權和。
10. 一種音頻通信系統,其特征在于,所述系統包括麥克風陣列和如權利要求6-9任一所述的回聲抵消裝置,所述麥克風陣列用于采集遠端會場的聲音信號和與所述聲音信號所對應的方位信息,所述回聲抵消裝置根據所述聲音信號和所述方位信號采用如權利要求 1-5任一所述回聲抵消的方法對本端會場所采集的聲音信號進行回聲抵消。
全文摘要
本發明實施例提供了一種回聲抵消的方法、裝置和系統,包括接收遠端會場發送的聲音信號和與所述聲音信號所對應的方位信息;根據所述方位信息判斷所述聲音信號在本端會場中的所屬播放區域;對所述聲音信號進行雙講狀態檢測,如果處于單講狀態,則更新所述聲音信號的所屬播放區域對應回聲路徑的虛擬濾波器系數;利用所述虛擬濾波器系數進行回聲抵消。本發明實施例在進行回聲抵消時,只需要更新聲音信號所屬區域所對應回聲路徑的虛擬濾波器系數,即同一時刻最多只需要更新和麥克風陣列數量相同的虛擬濾波器系數,因此大幅降低了回聲抵消時的運算復雜度,從而降低了回聲抵消中對處理器性能的需求,減少了硬件成本的付出。
文檔編號H04N7/14GK102387269SQ201010268880
公開日2012年3月21日 申請日期2010年8月27日 優先權日2010年8月27日
發明者王東琦, 詹五洲 申請人:華為終端有限公司