專利名稱:一種聲源定位方法及裝置的制作方法
技術領域:
本發明涉及聲源定位領域,尤其涉及一種基于加權的交叉相關函數的可控響應功率的聲源定位方法及裝置。
背景技術:
聲源定位在麥克風陣列的應用中占據重要位置,它可用于遠程會議,為麥克風陣列指示波束聚焦的方向,為會議攝像頭提供指向信息。聲源定位技術可以指示聲源目標所在的空間方位,為后續的信息采集與處理提供重要的空間信息。可控響應功率的聲源定位算法是聲源定位領域應用最為廣泛的算法,它以噪聲和混響條件下的魯棒性而著稱。在這類聲源定位方法中,其中一種流行的快速可控響應功率方法是采用廣義交叉相關實現的。該方法采用麥克風對之間形成的交叉相關函數,計算聲源在各個可能位置上的功率譜,尋求產生最大功率的方位。然而,該方法存在一個根本性的問題,即受到聲源入射方向、環境噪聲、以及混響的影響,各個交叉相關函數的可靠性并不相同。傳統的實現方法對所有的交叉相關函數同等對待,但是一些可靠性較低的交叉相關函數對最終的定位結果產生了副作用。
發明內容
本發明的目的是提供一種能夠克服上述缺陷的聲源定位方法及裝置。在本發明的第一方面,提供了一種聲源定位方法,包括將通過麥克風陣列接收的聲源信號轉化成數字聲音信號,所述麥克風陣列中包括多個麥克風;對所述數字聲音信號進行頻譜提取和白化處理,得到針對每個麥克風的數字聲音信號的白化頻譜;根據針對每個麥克風的數字聲音信號的白化頻譜計算出聲源位置第一值;根據所述聲源位置第一值計算聲源位置第二值;以及比較所述聲源位置第一值與所述聲源位置第二值,根據比較結果確定所述聲源的位置。在本發明的第二方面,提供了一種聲源定位裝置,包括麥克風陣列,用于接收聲源信號并將其轉化成數字聲音信號,所述麥克風陣列中包括多個麥克風;頻譜提取白化模塊,用于對所述數字聲音信號進行頻譜提取和白化處理,得到針對每個麥克風的數字聲音信號的白化頻譜;第一計算模塊,用于根據針對每個麥克風的數字聲音信號的白化頻譜計算出聲源位置第一值;第二計算模塊,用于根據所述聲源位置第一值計算聲源位置第二值;以及比較確定模塊,用于比較所述聲源位置第一值與所述聲源位置第二值,根據比較結果確定所述聲源的位置。本發明通過根據可控響應功率計算中的交叉相關函數的可靠性為其賦予各自的權重系數,從而排除不可靠的交叉相關對最終定位結果的影響。提高了聲源定位方法的魯棒性。
圖1是根據本發明實施例的聲源定位方法的流程圖;以及圖2是根據本發明實施例的聲源定位裝置的示意圖。
具體實施例方式下面通過附圖和實施例,對本發明的技術方案做進一步的詳細描述。圖1是根據本發明實施例的基于權重的聲源定位方法的流程圖。在步驟101,將通過麥克風陣列接收的聲源信號轉換成數字聲音信號。在步驟102,提取該數字聲音信號的頻譜并對其進行白化處理,得到針對麥克風陣列中每個麥克風的數字聲音信號的白化頻譜。首先,可以通過對數字聲音信號進行快速傅利葉變換(FFT)的方式來提取頻譜。在進行快速傅利葉變換之前,先要對接收到的數字聲音信號進行緩存。對一幀的數字聲音信號先補零到N點,N > F,N=2J, j為整數,且j ^ 8 ;然后,進行N點的快速傅利葉變換,得到一幀的數字化聲音信號的離散頻譜\k
權利要求
1.一種聲源定位方法,包括: 將通過麥克風陣列接收的聲源信號轉化成數字聲音信號,所述麥克風陣列中包括多個麥克風; 對所述數字聲音信號進行頻譜提取和白化處理,得到針對每個麥克風的數字聲音信號的白化頻譜; 根據針對每個麥克風的數字聲音信號的白化頻譜計算出聲源位置第一值; 根據所述聲源位置第一值計算聲源位置第二值;以及 比較所述聲源位置第一值與所述聲源位置第二值,根據比較結果確定所述聲源位置。
2.根據權利要求1所述的方法,其中,所述根據每對麥克風的數字聲音信號的白化頻譜計算出聲源位置第一值的步驟包括: 對針對每個麥克風的數字聲音信號的白化頻譜進行交叉相關,得到針對交叉匹配的每一對麥克風的數字聲音信號的交叉相關函數; 根據所述交叉相關函數得到交叉匹配的每一對麥克風中兩個麥克風接收聲源的聲音信號的時間延遲;以及 根據所述交叉相關函數和所述時間延遲計算多個可控響應功率,并且根據其中的最大可控響應功率得到所述聲源位置第一值。
3.根據權利要求2所述的方法,其中,所述根據所述聲源位置第一值計算聲源位置第二值的步驟包括: 根據所述聲源位置第一值、所述時間延遲及其對應的交叉匹配的每一對麥克風的間距,計算每一交叉相關函數的權重;以及 根據所述每一交叉相關函數及其權重、以及所述時間延遲計算多個可控響應功率,并且根據其中的最大可控響應功率得到所述聲源位置第二值。
4.根據權利要求2所述的方法,其中,所述根據所述交叉相關函數得到交叉匹配的每一對麥克風中兩個麥克風接收聲源的聲音信號的時間延遲的步驟包括: 根據所述交叉相關函數得到交叉相關函數序列,并且根據交叉匹配的每一對麥克風的間距計算最大時間延遲; 根據所述最大時間延遲確定搜索范圍; 根據所述搜索范圍,在所述交叉相關函數序列中搜索最大值;以及根據所述最大值得到交叉匹配的每一對麥克風中兩個麥克風接收聲源的聲音信號的時間延遲。
5.根據權利要求3所述的方法,其中,根據所述聲源位置第一值、所述時間延遲及其對應的交叉匹配的每一對麥克風的間距,計算每一交叉相關函數的權重的步驟包括: 根據聲源位置第一值計算對應的聲音信號入射方向與麥克風對連線之間的夾角; 根據所述時間延遲和麥克風對的間距估計所述夾角的估計值; 計算所述夾角和所述夾角的估計值的角度差的方差;以及 根據所述方差計算每一交叉相關函數的權重。
6.根據權利要求1所述的方法,還包括: 對所述數字聲音信號進行加窗和/或加重處理之后再進行所述頻譜提取和白化處理。
7.根據權利要求1所述的方法,其中,所述頻譜提取是通過對所述數字聲音信號進行快速傅利葉變換FFT得到的。
8.根據權利要求1所述的方法,其中,所述比較所述聲源位置第一值與所述聲源位置第二值,根據比較結果確定最終的聲源位置的步驟包括: 比較所述聲源位置第一值與所述聲源位置第二值,如果所述聲源位置第一值和所述聲源位置第二值之差不大于預定閾值,則將所述聲源位置第二值確定為所述聲源的位置。
9.一種聲源定位裝置,包括: 麥克風陣列,用于接收聲源信號并將其轉化成數字聲音信號,所述麥克風陣列中包括多個麥克風; 頻譜提取白化模塊,用于對所述數字聲音信號進行頻譜提取和白化處理,得到針對每個麥克風的數字聲音信號的白化頻譜; 第一計算模塊,用于根據針對每個麥克風的數字聲音信號的白化頻譜計算出聲源位置第一值; 第二計算模塊,用于根據所述聲源位置第一值計算聲源位置第二值;以及比較確定模塊,用于比較所述聲源位置第一值與所述聲源位置第二值,根據比較結果確定所述聲源的位置。
10.根據權利要求9所述的聲源定位裝置,還包括: 預處理模塊,用于對 所述數字聲音信號進行預加窗和/或加重之后再進行所述頻譜提取和白化處理。
全文摘要
本發明涉及一種聲源定位方法及裝置,該方法包括將通過麥克風陣列接收的聲源信號轉化成數字聲音信號,所述麥克風陣列中包括多個麥克風;對所述數字聲音信號進行頻譜提取和白化處理,得到針對每個麥克風的數字聲音信號的白化頻譜;根據針對每個麥克風的數字聲音信號的白化頻譜計算出聲源位置第一值;根據所述聲源位置第一值為可控響應功率計算中的每一對交叉相關函數賦予權重系數,根據權重系數計算聲源位置第二值;比較所述聲源位置第一值與所述聲源位置第二值,根據比較結果確定最終的聲源位置。本發明通過為可控響應功率計算中的每一對交叉相關函數賦予權重系數,弱化不可靠的交叉相關函數對最終定位結果的影響,從而提高了聲源定位的魯棒性。
文檔編號G01S5/18GK103076593SQ20121058704
公開日2013年5月1日 申請日期2012年12月28日 優先權日2012年12月28日
發明者應冬文, 李軍鋒, 馮永強, 潘接林, 顏永紅 申請人:中國科學院聲學研究所, 上海中科高等研究院, 北京中科信利技術有限公司