專利名稱:一種基于立體聲信號的移動音源定位方法
技術領域:
本發明屬于聲學技術領域,特別是涉及一種基于立體聲信號的移動音源定位方 法。
背景技術:
聽覺研究表明,在神經中樞對輸入聲信息進行整合時,對音源定位最重要的依據 是兩耳之間聲音信號的差別,通常用空間線索ITD(耳間時間差)和ILD(耳間聲級差)兩 個概念來描述這種差別。從音源到達雙耳的音源信號由于聲波傳輸路程存在差異,從而產生到達雙耳的時 間偏移稱為ITD(耳間時間差),其提供了有關音源方位角位置信息。此外,諸如人頭、軀干 和耳廓的衍射、折射及共振效應等使得到達兩檢測器接收信號強度存在差異,稱為ILD(耳 間聲級差),ILD隨著音源位置而系統變化,同樣提供了音源方位角位置信息。ITD和ILD以互補的方式工作,具體來說,對頻率小于1. 5kHz的低頻信號ITD對定 位起主要作用,而當頻率大于1. 5kHz時ILD對定位起主要作用。ILD對高頻信號起主要作 用是因為高頻信號的衰減特性,在聲源信號傳至雙耳的路徑中,除了空氣的吸收外,人的頭 部就相當于一個障礙物,高頻信號將因此被衰減。當頻率低于約1. 5kHz時,聲波波長大于 人的頭部寬度,聲波將產生所謂的“頭部衍射”而沿著頭部表面彎曲,從而繞過了這一遮擋 物,使得聲音信號傳到左耳的強度比右耳沒有衰減或衰減很小,因此空間線索ILD的定位 作用就很不明顯了 ;ITD是基于頻率特性而產生兩耳信號時間上的差異,由于聽覺系統所 感知的其實是耳間的相位差IPD(Interaural Phase Differences),所以ITD實際上通過 IPD起作用,當信號頻率小于1. 5kHz時,由于其半波長大于兩耳間的距離,所以人耳很容易 感知這種相位差并判別其相對關系,而當頻率大于1. 5kHz時,其波長小于兩耳間距,此時 將會產生IPD判決模糊,人耳無法辨別信號相位從而導致ITD沒有明顯定位作用。基于ITD和ILD音源定位互補特性,目前國際上通常基于ITD和ILD對音源方位 進行聯合估計,即基于音源位置、ITD和ILD間的相關先驗知識,通過聯合學習方法以實現 音源方位定位,但這種方法只適用于靜止音源,對于移動音源,當其以較快速度移動時由于 多普勒效應的存在會使音源的接受頻率發生變化,而ILD與頻率緊密相關,一旦音源頻率 發聲變化,原先的先驗知識便不再適用,從而使對音源方位的估計產生偏差。因此目前本領 域一個比較重要的問題是如何針對移動音源設計相應的ITD和ILD聯合音源定位修正方 法,消除由于多普勒效應所帶來的定位偏差問題。
發明內容
考慮到上述現有技術的已知解決方案的缺陷,本發明的目的是提供一種根據立體 聲信號進行移動音源定位的改進技術。為實現上述目的,本發明的技術方案為一種基于立體聲信號的移動音源定位方 法,基于ITD測量和ILD測量實現移動音源定位,所述ITD測量和ILD測量獲取方式為,對立體聲檢測器所生成的兩路時域信號進行預處理,分別得到兩路頻域信號,利用兩路頻域 信號分別計算各個頻帶的ITD測量和ILD測量;預先在各個已知的音源位置對ITD測量和 ILD測量分別進行學習,得到ITD頻率對位置矩陣和ILD頻率對位置矩陣;在對特定時間步 中的移動音源進行音源位置定位時,進行以下步驟,步驟1,獲取某特定時間步的ITD測量和ILD測量;步驟2,將步驟1所得特定時間步的ITD測量和ITD頻率對位置矩陣進行比較,將 步驟ι所得特定時間步的ILD測量與ILD頻率對位置矩陣分別進行比較,從而針對各個頻 帶獲得音源位置的概率分布,分別構成ITD概率分布矩陣和ILD概率分布矩陣;步驟3,將步驟2所得ITD概率分布矩陣和ILD概率分布矩陣進行組合,獲得用于 在該特定時間步進行音源位置定位的聯合概率分布;步驟4,基于多普勒效應對步驟3所得的聯合概率分布進行修正,獲得修正結果;步驟5,應用信息論過程,根據步驟4所得對聯合概率分布的修正結果,在該特定 時間步提取對于音源位置的最佳估計。而且,步驟3中,對ITD概率分布矩陣和ILD概率分布進行組合取決于音源位置參數。而且,步驟4中,對聯合概率分布的修正實現方式為,通過音源移動速度計算頻率 遷移量來修正用于音源定位的聯合概率分布。本發明技術方案使用信息論過程來產生可以與后續測量進行組合的預測,以改善 基于時間的移動音源定位,并追蹤并跟隨移動音源。
圖1為本發明實施例的流程圖;圖2為本發明實施例的學習步驟設置示意圖。
具體實施例方式下面以實施例結合附圖對本發明的技術方案作進一步說明。本發明實施例提供的方位角移動音源定位方法,參見附圖1,包括以下步驟Si. 1 雙耳檢測;SL 2:預處理;Si. 3 計算 ITD 和 ILD 測量;Si. 4 基于ITD測量對頻率對位置矩陣進行學習;Si. 5 基于ILD測量對頻率對位置矩陣進行學習;Si. 6 ITD 矩陣比較;Si. 7 ILD 矩陣比較;Si. 8 將ITD和ILD概率分布矩陣進行組合;Si. 9 聯合概率分布修正;Si. 10 位置估計。學習和定位都要獲取ITD和ILD測量,實施例通過Si. USl. 2和Si. 3實現。Si. 1 具體實施時,參見附圖2,根據立體聲檢測器LO (即具有至少兩個獨立的聲音傳感器Ll和L2)檢測立體聲信號1,來對音源位置S進行定位,得到立體聲檢測器所生成的兩路時域信 號。Si. 2具體實施時,對立體聲信號1的兩路時域信號分別進行時_頻變換,得到兩路頻 域信號2。Si. 3具體實施時,利用相關算法基于兩路頻域信號2對每個時間步的ITD測量 3和ILD測量4進行計算。對于ITD,可以通過SSD(方差和)或標準相關系數等方法來計 算點態比較;對于ILD,可以通過對頻域信號的對數預處理之后計算絕對值范數的差來進 行該運算。區別在于,學習過程所用的是不同已知音源位置的ITD和ILD測量結果;定位過 程只知道特定時間步的ITD和ILD測量結果,該特定時間步中的未知音源位置需通過比較 學習結果得到。實施例的學習過程包括Si. 4和Si. 5。Si. 4和Si. 5具體實施時,對于不同的音源 位置S,對ITD頻率對位置矩陣和ILD頻率對位置矩陣進行學習,通過監控的方式來進行學 習而獲得先驗知識,這表示在學習過程中音源位置S是已知的。對ITD和ILD測量分別進 行該學習步驟,并且得到ITD和ILD基準頻率對位置矩陣,這些矩陣代表用于所有可能頻率 的特定位置S。附圖2給出了實際中是如何學習的,以特定方位位置(如圖2所示,實施例 取不同方位角)來布置音源S,然后從音源S播放聲音信號,并且計算頻率對位置矩陣。對 相同位置的所有矩陣(每個位置包括ITD矩陣和ILD矩陣2個矩陣)取均值,以獲得通用 的ITD頻率對位置矩陣5和ILD頻率對位置矩陣6,這是一種貝葉斯處理過程。對于所有選 中的位置S進行此過程,在學習步驟中只需處理少數用于學習的離散位置,例如平均分布 在方位角面上的離散位置。在預先進行學習后,需要對某特定時間步中的移動音源定位,以獲取未知的音源 位置時,實施例的定位過程進行以下步驟Si. 6和Si. 7具體實施時,針對各個頻道,將所測得的位置未知的音源的ITD測量 3和ILD測量4與所學習的頻率對位置矩陣5、6分別進行比較,以獲取音源位置的ITD概率 分布矩陣7和ILD概率分布矩陣8 ;Si. 8具體實施時,將ITD概率分布矩陣7和ILD概率分布矩陣8進一步進行組合, 以獲得用于音源定位的聯合概率分布9。可以根據音源位置參數來進行ITD概率分布矩陣7 和ILD概率分布矩陣8的組合,為實現此目的,將矩陣中的每一個概率分布解釋為用于測量 的條件概率,該條件概率以頻率,提示(ITD/ILD)和位置為條件,即概率分布中包含3個變 量——頻率,ITD/ILD和音源位置;基于頻率和提示的邊緣化導致僅以位置為條件的概率;Si. 9具體實施時,可以根據音源在各個時間步角度的變化估計音源的移動速度, 進而基于多普勒效應公式計算音源的頻率遷移量,從而在用于音源定位的聯合概率分布9 中減去這部分頻率遷移量的影響,得到修正結果,即修正聯合概率分布10 ;Si. 10具體實施時,將信息理論過程應用于修正聯合概率分布10,以提取對于音 源位置的最佳估計,即音源方位角估計11。例如,可以使用貝葉斯方法來獲取方位估計。為 此,必須利用先驗(即學習所得ITD頻率對位置矩陣5和ILD頻率對位置矩陣6)和當前用 作似然性的概率分布10來計算后驗。然后可以利用諸如MAP(最大后驗)或匪SE(最小均 方誤差)的方法,根據后驗來計算音源方位角估計11。具體實施時,可以采用計算機軟件技術實現以上步驟的自動執行,也可以按照音 頻技術領域以硬件裝置形式提供實施應用。凡符合本發明所提供技術方案精神的情況,包 括等同替換方案,都應當在本發明所要求保護范圍內。
5
為便于實施參考起見,本發明提供采用貝葉斯處理具體實現過程如下學習過程假定短時空間線索ITD構成一個隨機過程,用隨機矢量^ (空間線索所在頻帶一 定時間上的集合)對其進行描述,令Δ T,b為Bark帶b的ITD值(ITD測量),B為最高Bark 帶,即b取值為1至B,則ΔΓ=(ΔΓ1,ΔΓ2,...,ΔΓβ)⑴則ITD頻率對位置矩陣為PT,b(AT,b| λ) (1 彡 b 彡 B) (2)其中,λ標識方向(如圖2所示音源位置S分別到聲音傳感器Ll和L2所構成的 方向角),P用于標識概率,Pt, b是表示在各個頻帶b上的ITD測量概率。公式(2)表達的 就是在每個頻帶上都有一個ITD的概率,共同構成概率矩陣。假定短時空間線索ILD構成一個隨機過程,用隨機矢量^ (空間線索所在頻帶一 定時間上的集合)對其進行描述,令Δ u為Bark帶b的ILD值(ILD測量),B為最高Bark 帶,則⑶則ILD頻率對位置矩陣為PL,b(AL,b| λ) (1 彡 b 彡 B) (4)其中,Pu是表示在各個頻帶b上的ILD測量概率。定位過程^的概率密度函數基于統計音源在各個方向的空間線索而得。定義λ方向的概 率密度函數為μ),假設i的各個部分是統計獨立的,則ITD概率密度(ITD概率分布矩 陣)為Ρ(Ατ IΛ) = Υ\ΡΤ^(ΔΓι, μ)(5)
b=l的概率密度函數基于統計音源在各個方向的空間線索而得。定義λ方向的概 率密度函數為i^i I Λ),假設i的各個部分是統計獨立的,則ILD概率密度(ILD概率分布矩 陣)為P(AlIA) = flPL, (Al^A)(6)
b=\則聯合概率密度為Ρ(11 λ) = ρ(1τ I X)P(1L I a) = f\Pr,(Ar^ I X)f{PL,μ)(7)
b=\ b=\考慮到頻度對于空間線索ITD和ILD影響程度的不同,針對移動音源,對聯合概率 密度計算方法進行如下修正,以去除頻率對空間線索ILD的影響
B5_ADoppler=Π pLAKb \λ)(8)
其中,AD。pplCT為多普勒效應帶來的頻率改變。根據信息論觀點,通過空間線索來獲取方向信息可描述為貝葉斯最大后驗概率似 然估計,根據貝葉斯公式,在各個方向λ的條件概率密度為
權利要求
一種基于立體聲信號的移動音源定位方法,其特征在于基于ITD測量和ILD測量實現移動音源定位,所述ITD測量和ILD測量獲取方式為,對立體聲檢測器所生成的兩路時域信號進行預處理,分別得到兩路頻域信號,利用兩路頻域信號分別計算各個頻帶的ITD測量和ILD測量;預先在各個已知的音源位置對ITD測量和ILD測量分別進行學習,得到ITD頻率對位置矩陣和ILD頻率對位置矩陣;在對特定時間步中的移動音源進行音源位置定位時,進行以下步驟,步驟1,獲取某特定時間步的ITD測量和ILD測量;步驟2,將步驟1所得特定時間步的ITD測量和ITD頻率對位置矩陣進行比較,將步驟1所得特定時間步的ILD測量與ILD頻率對位置矩陣分別進行比較,從而針對各個頻帶獲得音源位置的概率分布,分別構成ITD概率分布矩陣和ILD概率分布矩陣; 步驟3,將步驟2所得ITD概率分布矩陣和ILD概率分布矩陣進行組合,獲得用于在該特定時間步進行音源位置定位的聯合概率分布;步驟4,基于多普勒效應對步驟3所得的聯合概率分布進行修正,獲得修正結果;步驟5,應用信息論過程,根據步驟4所得對聯合概率分布的修正結果,在該特定時間步提取對于音源位置的最佳估計。
2.根據權利要求1所述的移動音源定位方法,其特征在于步驟3中,對ITD概率分布 矩陣和ILD概率分布進行組合取決于音源位置參數。
3.根據權利要求1或2所述的移動音源定位方法,其特征在于步驟4中,對聯合概率 分布的修正實現方式為,通過音源移動速度計算頻率遷移量來修正用于音源定位的聯合概 率分布。
全文摘要
本發明為一種基于立體聲信號的移動音源定位方法,包括對立體聲檢測器兩路時域信號進行預處理得到兩路頻域信號;利用兩路頻域信號計算各個頻帶的ITD和ILD測量;在各個音源位置對ITD和ILD測量分別進行學習,得到ITD頻率對位置學習矩陣和ILD頻率對位置學習矩陣;將所測得的ITD和ILD測量與所學習的矩陣分別進行比較,將得到的ITD和ILD概率分布矩陣進行組合,獲得用于音源定位的聯合概率分布;基于多普勒效應對用于音源定位的聯合概率分布進行修正;應用信息論過程來提取音源位置的最佳預測。本發明針對移動音源所獨有的多普勒效應對基于ITD和ILD的音源方位聯合估計方法做出改進,可有效提升音源定位準確率。
文檔編號G01S5/18GK101982793SQ20101051492
公開日2011年3月2日 申請日期2010年10月20日 優先權日2010年10月20日
發明者劉進峰, 周成, 涂衛平, 王國英, 王曉晨, 王松, 胡瑞敏, 董石, 高麗, 黃勇 申請人:武漢大學