一種三維空間聲源定位方法

文檔序號：6227154閱讀：390來源：國知局

一種三維空間聲源定位方法
【專利摘要】本發明提供一種改進的三維空間聲源定位方法，屬于聲源定位【技術領域】。本發明包括：建立雙L型麥克風陣列；在歸一化頻域最小均方方法基礎上，通過引入懲罰函數對頻譜能量進行修正，從而自適應地估計出不同陣元的沖激響應并計算時延差；利用得到的時延差與雙L型麥克風位置的關系，來確定通過聲源的位置坐標。較傳統的定位方法而言，本發明陣列結構簡單、計算量少，有效地提高了抗噪聲性能、抗混響能力及定位精度，更加適合用于室內三維聲源定位，可廣泛應用于車載免提電話、視頻會議系統、語音識別系統以及智能機器人等各個領域。
【專利說明】一種三維空間聲源定位方法
【技術領域】
[0001]本發明屬于聲源定位【技術領域】，尤其是涉及一種利用麥克風陣列進行聲源三維定位的方法。
【背景技術】
[0002]目前，基于麥克風陣列的聲源定位是聲學信號處理領域中的一個重要問題，相較于傳統的陣列信號處理，陣列麥克風處理的語音信號沒有載波，能夠處理的信號范圍廣，適應能力強，在車載免提電話、視頻會議系統、語音識別系統以及智能機器人等領域都有廣泛應用。基于麥克風陣列的聲源定位主要有基于可控波束形成的定位方法、基于到達時延差的定位方法和基于高分辨率的定位方法。其中，基于可控波束形成的定位方法對麥克風陣列接收到的語音信號進行濾波、加權求和，然后直接控制麥克風指向使波束有最大輸出功率的方向，因其計算復雜度高不可能被用于實時處理系統；基于高分辨率的定位方法利用求解麥克信號間的相關矩陣來定出方向角，從而進一步定出聲源位置，雖然成功地應用于一些陣列信號的處理，但在實際應用中定位效果不佳，不僅受到陣列結構限制而且在信號不平穩時計算量會成倍增加；而其中，基于到達時延差的聲源定位方法是通過估計聲源到麥克風之間的時延差并根據麥克風的位置來估計聲源位置，不受陣列結構限制、計算量小。
[0003]基于到達時延差的聲源定位方法主要分兩部分完成:時延估計和定位。時延估計方法主要有廣義互相關方法(Generalized Cross Correlation, GCC)、最小均方誤差方法(Least Mean Square, LMS)和自適應特征值分解方法(Adaptive EngenvalueDecomposition, AED)。其中，GCC方法在混響環境下性能會下降很多；LMS方法性能基本與它相當；AED方法是通過估計雙信道沖激響應來抑制混響，但它要求雙信道互質，不含有公共零點。然而，在實際室內環境中，沖激響應長度一般很長，雙信道互質的可能性很小，AED方法不再適用。為了提高互質的可能性，Y (Arden) Huang等人將AED雙通道估計方法推廣到自適應多通道估計方法(Adaptive Multichannel, AMC),提出利用歸一化多通道頻域最小均方方法(Normalized Multichannel Frequency-domain Least Mean Square, NMCFLMS)來估計各個陣元的沖激響應。NMCFLMS方法的基本思想是，將觀測信號分成連續的塊信號，采用頻域歸一化最小均方方法進行頻域信道估計，雖具有多通道頻域最小均方方法復雜度低和牛頓法收斂速度快的特點，但在信道加性噪聲存在時可能會發散，不能有效地進行信道估計。
[0004]定位方法主要有最小二乘法和幾何定位法，前者計算復雜，且對初值敏感；后者利用麥克風位置參數與時延估計值確定雙曲面的函數關系，多個雙曲面的交點即為確定聲源位置，計算簡單，但容易出現非唯一的閉合解，難以有效定位。

【發明內容】

[0005]針對現有技術中聲源定位方法在信道加性噪聲存在時可能會發散，不能有效地進行信道估計以及難以有效定位聲源的缺陷，本發明提供一種改進的三維空間聲源定位方法，利用修正歸一化多通道頻域最小均方方法(MNMCFLMS)及限定信道沖激響應長度的方法進行信道估計，有效提高了聲源定位的精度。
[0006]為了達到上述目的，本發明提供如下技術方案:
[0007]一種三維空間聲源定位方法，包括如下步驟:
[0008]步驟A，在三維直角坐標系中，建立兩個在同一平面上且相對設置的L型麥克風陣列；
[0009]步驟B，采用修正的歸一化多通道頻域最小均方方法估計聲源信號到達各麥克風的時延差，包括下述步驟:
[0010]步驟B-1，聲源信號s (η)經第i個麥克風的信道沖激響應hi (η)后與信道加性噪聲￥?合并,得第i個麥克風的接收信號Xi (n):Xi (η) = sT (n) Iii (n)+Vi (η)；
[0011]其中，T表示矩陣轉置操作；η為時間序列，是整數；
[0012]當不計信道加性噪聲時，第i個麥克風的接收信號Xi(Ii)與第j個麥克風的接收信號Xj(n)間的關系為:
[0013]-V； (H)Iij(H) 二 x] (")&(");
[0014]步驟B-2，用長度為2Lh的矩形窗函數w(n)對第i個麥克風的接收信號Xi (η)進行加窗處理，得到第i個麥克風的第η幀接收信號為:
[0015]
【權利要求】
1.一種三維空間聲源定位方法，其特征在于，包括如下步驟: 步驟A，在三維直角坐標系中，建立兩個在同一平面上且相對設置的L型麥克風陣列；步驟B，采用修正的歸一化多通道頻域最小均方方法NMCFLMS估計聲源信號到達各麥克風的時延差，包括下述步驟: 步驟B-1，聲源信號s(n)經第i個麥克風的信道沖激響應Iii (η)后與信道加性噪聲Vi (η)合并，得第i個麥克風的接收信號XiOO:Xi (n) = sT (n) Iii (n)+Vi (η)；其中，T表示矩陣轉置操作；η為時間序列，是整數；當不計信道加性噪聲時，第i個麥克風的接收信號Xi (η)與第j個麥克風的接收信號Xj (η)間的關系為:
2.根據權利要求1所述的三維空間聲源定位方法，其特征在于，所述Jp (η)為約束條件下的懲罰函數，約束條件為:
3.根據權利要求1或2所述的三維空間聲源定位方法，其特征在于，所述步驟B-2中信道沖激響應的長度Lh限制條件為:
4.根據權利要求1所述的三維空間聲源定位方法，其特征在于，所述步驟A中兩個L型陣列布放規律如下:第一個麥克風micl置于X軸上，其坐標為(d，0，0);第二個麥克風mic2與坐標原點重疊，其坐標為(0，0，0);第三個麥克風mic3置于Y軸，其坐標為(0，d，0)，d為兩個相鄰麥克風之間距離，為實數，第一、二、三個麥克風構成了第一個L型麥克風陣列；同時，以X = D/2為對稱軸，建立與第一個L型麥克風陣列相對的第二個L型麥克風陣列，其中，第四個麥克風mic4的坐標為(0，0，0)，第五個麥克風!11化5的坐標為(D_d，0，O)，第六個麥克風mic6的坐標為(D，d, O) ；D為兩個相對的L型麥克風陣列間的距離。
5.根據權利要求1或4所述的三維空間聲源定位方法，其特征在于，所述步驟C中，確定聲源位置的步驟如下: 步驟C-1，位置為(x，y，z)的聲源信號到達第i個麥克風和第j個麥克風的時延差r與第i個麥克風和第j個麥克風間距離du的關系為4 ，詳細關系有如下兩組:
【文檔編號】G01S5/20GK103995252SQ201410202062
【公開日】2014年8月20日申請日期:2014年5月13日優先權日:2014年5月13日
【發明者】郭業才, 朱賽男, 張寧, 黃友銳申請人:南京信息工程大學

完整全部詳細技術資料下載