一種srp聲源定位的快速實現方法
【技術領域】
[0001] 本發明涉及聲源定位技術,特別是一種SRP聲源定位的方法。
【背景技術】
[0002] 聲源定位技術主要分為3大類,即基于最大可控響應功率的波束形成方法、采用 高分辨率譜估計的方法和基于時延估計的兩步定位方法。2002年,J. H. DiBiase (見文獻 [1]J. H. DiBiase. A high-accuracy, low-latency technique for talker localization in reverberant environments[D]. Providence RI, USA:Brown University, 2000 和 文獻[2]譚穎,殷福亮,李細林.改進的SRP-PHAT聲源定位方法[J].電子與信息學 報,2006, 28(7) :1223 ~1227.見文獻[3]Jacek P.Dmochowski.A Generalized Steered Response Power Method for Computationally Viable Source Localization. IEEE transactions on audio, speech, and language processing, VOL. 15, NO. 8, 2007)提出了 聯合可控響應功率和相位變換(SRP-PHAT)的聲源定位方法,該方法將可控響應功率方法 固有的魯棒性、短時分析特征與時延估計中相位變換方法對信號周圍環境的不敏感性相結 合,使聲源定位系統具有一定的抗噪性、抗混響性。但是,SRP-PHAT方法運算量龐大,并且 在惡劣環境下(噪聲干擾大、混響影響嚴重)性能急劇下降,因此在實時處理和實際應用時 變得困難。
【發明內容】
[0003] 發明目的:為了克服現有技術中存在的不足,本發明提供了一種SRP聲源定位的 快速實現方法,用于解決現有的SRP-PHAT方法運算量打且惡劣環境下性能差的技術問題。
[0004] 技術方案:為實現上述目的,本發明采用的技術方案為:
[0005] -種SRP聲源定位的快速實現方法,包括如下步驟:
[0006] 步驟1、利用基于凸優化的波束指向可調的寬帶穩健遠場頻率不變波束形成器算 法得到Farrow結構波束形成器的最優權值,從而設計完成Farrow結構波束形成器;
[0007] 步驟2、利用Farrow結構波束形成器在調整波束指向時無需重新計算權值這個結 構特征,將各麥克風陣列的輸入信號進行FFT運算,根據不同麥克風以及輸入信號的階數 將FFT運算后的輸入信號進行兩兩相乘、求得相位加權函數;
[0008] 步驟3、將各麥克風陣列的輸入信號輸入至Farrow結構波束形成器中進行空域濾 波,空域濾波后的輸出信號進行FFT運算,根據不同麥克風以及輸出信號的階數將FFT運算 后的輸出信號進行兩兩相乘求得相位加權函數對應量,;
[0009] 步驟4、根據兩個麥克風以及各自輸入信號的階數所確定的相位加權函數以及相 位加權函數對應量為一組進行對應,將屬于同一組的相位加權函數與相位加權函數對應量 進行相乘,然后將相乘的結果進行IFFT運算之后并累加求和得到所有的麥克風中的兩兩 麥克風的廣義互相關函數之和并進行鎖存;
[0010] 步驟5、將兩兩麥克風的廣義互相關函數之和與掃描角度唯一有關的調向參數D 進行乘積相加運算,得到相應掃描點的瞬時功率,搜索瞬時功率的最大峰值得到對應的指 向角度Θ / ;
[0011] 步驟6、對Farrow結構波束形成器的系統誤差進行校準,并將步驟5中獲得的指向 角度Θ /校準為最終的定位角度Θ P
[0012] 進一步的,在本發明中,所述步驟1的具體步驟為:基于凸優化的思想設計穩健波 束指向可調的頻率不變波束形成器,穩健的最大誤差最小化的優化設計的代價函數:
[0015] 上面代價函數(4)式中包含從上往下的3個式子:第一個式子表示的物理含義是 在主瓣范圍內保證頻率不變;第二個式子表示在旁瓣范圍內需要對實際響應值小于一個上 限值,達到使旁瓣范圍內的能量譜盡量小的目的;第三個式子的目的在于保證在指定波束 指向方向,參考頻率f;以及參考方向上的波束響應為1。
[0016] 代價函數(4)式中:
[0017] g是導向量;△ g是導向矢量的誤差;f是頻率點;Θ是波達方向;Φ是波束指向角 度;ψ是預定義的可調方向范圍、fk、θ η分別表示離散的可調方向角度點、頻率點以 及波達方向角度點;是參考頻率;Ω是感興趣的頻帶范圍;Z是預設的參數范圍;Θ ρ是 主瓣角度范圍;?s是旁瓣角度范圍;ε表示將導向矢量誤差Ag的模值控制在ε值的界 內;同理,η則表示其左側的表達式的模值被認為控制在η值得界內;F是加權系數;/是 權值的轉置;
[0018] 利用SeDumi軟件對上式進行求解得出Farrow結構波束形成器的最優權值w。
[0019] 基于Farrow結構波束形成器始終只需一組固定的權值,通過調整調向參數D這一 參數,即可實現波束指向實時調整,無需重新求解權值,這正是我們設計的F arrow結構波 束形成器用于SRP聲源定位法能夠簡化計算量的關鍵原因所在。
[0020] 所述步驟3中編號為j的麥克風陣元的輸入信號經過Farrow結構波束形成器的 空域濾波作用后輸出信號力為:
[0023] M是Farrow結構波束形成器中的濾波器的階數;
[0024] 并且有:
[0026] (7)式中:
[0027] xk (t)表示第k個麥克風陣元的輸入信號,這里的η表示離散形式;1"表示最優 權值w中的第k個麥克風陣元的第m階濾波器的權值;K表示麥克風陣元的個數;
[0028] 根據Farrow波束形成器的結構,在這里Ani是只要通過一次計算之后就可以直接 鎖存起來的數據。即輸出信號y,只取決于調向參數D,即A ni可被直接鎖存,從而達到實時 調整波束指向的目的。
[0029] 所述步驟2中,由Farrow結構波束形成器的SRP-PHAT方法的波束輸出功率 Ρ( τ。,. . .,τ K D 定義為:
[00301
[0031] (8)式中:
[0032] 這里Ρ( τ。,. . .,τ κ J中的τ k表示第k個陣元相對于參考陣元的時延差; 為第k個麥克風接收到的輸入信號Xk (t)的傅里葉變換;
[0033] 為第1個麥克風接收到的輸入信號Xl(t)的傅里葉變換;是XiW)的 共輒轉置;
[0034] 且有:
[0035]
[0036]
[0037] D1= ( Θ 廠90。)/90。 (11)
[0038] 這里i表示可調角度離散形式的每個離散點;
[0039] 多通道形式的PHAT的相位加權函數¥?(0?·)為:
[0040]
[0041] (12)式表述的含義:將每個麥克風陣元輸入信號進行FFT運算之后再兩兩進行相 乘、取模、求倒數一系列運算之后得相位加權函數。
[0042] 所述步驟4運算量降低的具體表現原理:
[0043] 令:
[0044]
[0045] (13)式中:
[0048] (14)式子表示的含義是:第k個麥克風陣元、第m#FIR濾波器的輸入信號·W 經過空域濾波之后得到的輸出信號將被鎖存在為,》;1的數據里。同理可解釋(15)式中的 為,)? P
[0049] 這樣很容易理解(13)式所表達的含義是:將鎖存起來的數據即輸入信號與權值 進行卷積再進行FFT后兩兩相乘,再與相應的加權函數進行相乘,IFFT運算之后累加求和, 可得所有麥克風兩兩麥克風的廣義互相關函數之和并進行鎖存在H里。這一系列的過程隨 著權值的形成一步完成并鎖存下來,無需重新計算。所述步驟4中利用Farrow結構波束形 成器特殊的結構優勢,降低計算量的原理過程。
[0050] 所述步驟5中,按照Farrow結構波束形成器的結構圖寫出其瞬時功率:
[0052] 所述步驟5中按照Farrow結構波束形成器的結構圖將調向參數D與已經鎖存的 輸出數據結合起來,達到調向的目的。
[0053] 所述步驟5中,傳統的SRP-PHAT與本發明的Farrow-SRP-PHAT運算量對比:
[0054] 假設傳統的SRP-PHAT中的常規波束形成器有K個陣元、每個陣元有N個抽頭、掃 描點數為n'、信號序列長度為L點。
[0055] 復乘次數:n' *[N*K*L+K2*[(3/2)*L*log2L+3L]]次
[0056] 復加次數:n' *[ (N-I) *K*L+K2*[3*L*log2L] +(K2-I) *L]次
[0057] 假設本發明中的Farrow結構波束形成器有K個陣元、每個陣元有M階N個抽頭 FIR濾波器、掃