分到后期混響音的過(guò)渡必須已知。該過(guò)渡通過(guò)達(dá)到閾值的 相關(guān)性測(cè)量來(lái)確定,其中閾值根據(jù)從室內(nèi)脈沖響應(yīng)的早期部分中的早期反射音中所選擇的 一個(gè)的相關(guān)性測(cè)量來(lái)設(shè)定。相關(guān)性測(cè)量可以描述關(guān)于室內(nèi)脈沖響應(yīng)的、在包括初期狀態(tài)的 聲能中的衰變的相似點(diǎn)以及在初期狀態(tài)之后的任何時(shí)間開(kāi)始的在預(yù)定義頻率范圍的聲能 中的衰變的相似點(diǎn)。
[0085] 根據(jù)實(shí)施例,音頻信號(hào)的單獨(dú)處理包括在第一初期期間將音頻信號(hào)和室內(nèi)脈沖響 應(yīng)的早期反射音部301,302-起處理,以及在第二處理期間將音頻信號(hào)和室內(nèi)脈沖響應(yīng)的 擴(kuò)散混響音304-起處理,第二處理不同于第一處理且與第一處理相分離。從第一處理到第 二處理的改變出現(xiàn)在過(guò)渡時(shí)間。根據(jù)進(jìn)一步的實(shí)施例,在第二處理中擴(kuò)散(后期)混響音304 可替換成合成混響音。在該情形中,所提供的室內(nèi)脈沖響應(yīng)可僅包括早期反射音部301,302 (參見(jiàn)圖5),且不包括后期擴(kuò)散混響音304。
[0086] 圖6(A)顯示根據(jù)本發(fā)明實(shí)施例的用于分別地與室內(nèi)脈沖響應(yīng)的早期部分和后期 混響音一起處理音頻信號(hào)的第一示例性信號(hào)處理單元的方塊圖。可在上述的立體聲渲染器 236中執(zhí)行根據(jù)室內(nèi)脈沖響應(yīng)的不同部分的音頻信號(hào)的處理。音頻輸入信號(hào)400可為非混響 音頻素材,例如多聲道音頻輸入信號(hào),其與室內(nèi)脈沖響應(yīng)相卷積;或例如使用仿真頭或耳道 式麥克風(fēng)測(cè)量到的室內(nèi)脈沖響應(yīng)。卷積允許增益原始的非混響音頻素材的空間印象,仿佛 是在與室內(nèi)脈沖響應(yīng)相關(guān)聯(lián)的空間中聆聽(tīng)該音頻素材。例如,在上述的立體聲渲染器236 中,期望在室內(nèi)脈沖響應(yīng)中分別地將音頻信號(hào)和直達(dá)聲音301以及早期反射音一起處理,將 音頻信號(hào)和后期混響音304-起處理。為了處理音頻輸入信號(hào)400,方塊402用于處理直達(dá)聲 音,方塊404用于處理早期反射音以及方塊406用于處理后期混響音。通過(guò)第一加法器412將 各個(gè)方塊402至406的輸出信號(hào)408至410相結(jié)合,以產(chǎn)生早期處理信號(hào)414。處理器406提供 的早期處理信號(hào)414以及混響信號(hào)416通過(guò)第二加法器418結(jié)合,以產(chǎn)生音頻輸出信號(hào)420, 其提供給聽(tīng)眾仿佛音頻信號(hào)在與該室內(nèi)脈沖響應(yīng)相關(guān)聯(lián)的空間中聆聽(tīng)的印象。
[0087]將后期混響音302與直達(dá)聲音以及早期反射音分開(kāi)處理的優(yōu)點(diǎn)在于減少計(jì)算復(fù)雜 度。更具體地,對(duì)全部脈沖響應(yīng)使用卷積計(jì)算是非常昂貴的。因此,為了模擬后期混響音,通 常使用具有較低復(fù)雜度的混響音算法來(lái)處理音頻信號(hào)。脈沖響應(yīng)的直達(dá)聲音部以及早期反 射音部通過(guò),例如卷積計(jì)算,更精確地進(jìn)行計(jì)算。進(jìn)一步的優(yōu)點(diǎn)在于對(duì)混響音控制的可能 性。后期混響音可取決于使用者的輸入或音頻信號(hào)的內(nèi)容而修改測(cè)量的空間參數(shù)。為了達(dá) 成上述優(yōu)點(diǎn),必須已知早期反射音302結(jié)束且后期混響音304開(kāi)始的過(guò)渡位置(例如時(shí)間 點(diǎn))。當(dāng)后期混響音處理開(kāi)始的太早,則音頻信號(hào)可能會(huì)有較低的質(zhì)量而人聽(tīng)力能發(fā)現(xiàn)明顯 消失的早期反射音。另一方面,如果過(guò)渡時(shí)間發(fā)現(xiàn)的太晚,則計(jì)算效率將不會(huì)被利用,造成 早期反射音處理通常比后期混響音處理更昂貴。例如,在時(shí)域取樣的過(guò)渡可提供至立體聲 渲染器作為輸入?yún)?shù),然后根據(jù)接收的過(guò)渡,該輸入?yún)?shù)控制處理器402至406用于分別地 處理音頻信號(hào)。
[0088]圖6(B)顯示根據(jù)本發(fā)明另一實(shí)施例的用于分別地與室內(nèi)脈沖響應(yīng)的早期部分和 后期混響音一起處理音頻信號(hào)的另一信號(hào)處理單元的方塊圖。接收輸入信號(hào)400,例如多聲 道音頻輸入信號(hào),并施加至第一處理器422用于處理早期部分,即根據(jù)圖5所示的室內(nèi)脈沖 響應(yīng)300中的直達(dá)聲音301以及早期反射音302處理音頻信號(hào)。多聲道音頻輸入信號(hào)400也施 加至第二處理器424用于根據(jù)室內(nèi)脈沖響應(yīng)的后期混響音304處理音頻信號(hào)。在立體聲渲染 器中,如上所述,主要因?yàn)榻档陀?jì)算復(fù)雜度,所以理想的是處理直達(dá)聲音以及從后期混響音 區(qū)分出早期反射音。例如,直達(dá)聲音以及早期反射音的處理可通過(guò)第一處理器422執(zhí)行的卷 積方法留印至音頻信號(hào),而后期混響音可被替換成第二處理器424提供的合成混響音。整體 雙聲道輸出信號(hào)420為處理器422提供的卷積結(jié)果428以及處理器424提供的合成混響信號(hào) 430的結(jié)合。根據(jù)實(shí)施例,加法器432結(jié)合信號(hào)428以及430以輸出整體雙聲道輸出信號(hào)420。 [0089] 如上所述,第一處理器422可將音頻輸入信號(hào)400與室內(nèi)脈沖響應(yīng)的直達(dá)聲音以及 早期反射音進(jìn)行卷積運(yùn)算,可從具有多個(gè)紀(jì)錄的雙聲道室內(nèi)脈沖響應(yīng)的外部數(shù)據(jù)庫(kù)434中 提供該室內(nèi)脈沖響應(yīng)給第一處理器422。第二處理器或混響器424可基于混響器參數(shù)如混響 音RT60以及混響音能量進(jìn)行操作,混響器參數(shù)可通過(guò)分析436從儲(chǔ)存的雙聲道室內(nèi)脈沖響 應(yīng)獲得。應(yīng)注意的是,分析436并非渲染器的必要部分,相反地,表示各個(gè)混響音參數(shù)可從儲(chǔ) 存在數(shù)據(jù)庫(kù)434中的各個(gè)響應(yīng)獲得;此可在外部完成。可通過(guò)計(jì)算在八音度或1/3八音度濾 波器組分析中的能量以及RT60混響音時(shí)間來(lái)決定混響器參數(shù);或者以多個(gè)脈沖響應(yīng)分析的 結(jié)果的平均值來(lái)確定混響器參數(shù)。
[0090] 此外,處理器422以及424從數(shù)據(jù)庫(kù)434直接接收或經(jīng)由分析436接收輸入?yún)?shù),也 接收關(guān)于在室內(nèi)脈沖響應(yīng)中從早期部分到后期混響音的過(guò)渡的信息。以下將更詳細(xì)地描述 確定過(guò)渡的方法。
[0091] 根據(jù)實(shí)施例,過(guò)渡分析可用于區(qū)別早期反射音以及后期混響音。其可提供至立體 聲渲染器作為輸入?yún)?shù)(例如,其可從有用于配置混響器的RT60數(shù)值以及能量數(shù)值的專(zhuān)用 文檔/界面中讀?。?。分析可根據(jù)一組雙聲道室內(nèi)脈沖響應(yīng)(一組用于多個(gè)方位角以及仰角 的BRIR對(duì))。分析可為預(yù)處理步驟,其針對(duì)每個(gè)脈沖響應(yīng)分別地執(zhí)行,然后獲得所有過(guò)渡數(shù) 值的中位數(shù)作為該組BRIR的整體過(guò)渡數(shù)值。然后,整體過(guò)渡數(shù)值可用于在雙聲道輸出信號(hào) 的計(jì)算中從后期混響音中分離早期反射音。
[0092] 有幾個(gè)已知的方法用于確定過(guò)渡,然而,現(xiàn)在將描述這些方法的缺點(diǎn)。在現(xiàn)有技術(shù) 參考文獻(xiàn)[1 ]中,所述的方法使用能量衰變救援(EDR)以及相關(guān)性測(cè)量來(lái)確定從早期反射音 到后期混響音的過(guò)渡時(shí)間。然而,現(xiàn)有技術(shù)參考文獻(xiàn)[1]所述的方法有缺點(diǎn)。
[0093] 1.該方法強(qiáng)烈地取決于雙聲道脈沖響應(yīng)的方位角以及直達(dá)聲音與第一撞擊反射 的振幅之間的關(guān)系。
[0094] 2.過(guò)渡時(shí)間在任意頻帶中進(jìn)行計(jì)算。沒(méi)有一般的知識(shí)有關(guān)于哪個(gè)頻帶可用于整體 脈沖響應(yīng)的正確的過(guò)渡時(shí)間。
[0095] 3.沒(méi)有信息有關(guān)于該方法的必要相關(guān)性步驟。
[0096] 另一已知的方法是通過(guò)空間中回音的散布來(lái)描述早期反射音,例如通過(guò)每秒反射 的平均數(shù)量,并且當(dāng)該數(shù)量超過(guò)預(yù)定義的閾值(參見(jiàn)現(xiàn)有技術(shù)參考文獻(xiàn)[2])時(shí),確定為后期 混響音的開(kāi)始。該方法依賴(lài)空間特性,即空間體積,但其通常是未知的??臻g體積不能容易 地從測(cè)量的脈沖響應(yīng)得出。因此,該方法并非適合應(yīng)用于從測(cè)量的脈沖響應(yīng)計(jì)算過(guò)渡。而 且,目前關(guān)于反射音必須多密才被稱(chēng)為后期混響音沒(méi)有常識(shí)。
[0097] 另一可能性,在技術(shù)參考文獻(xiàn)[3]中所描述的是比較在脈沖響應(yīng)窗中一時(shí)間上的 實(shí)際分布與時(shí)域的高斯分布。假設(shè)后期混響音具有正態(tài)分布。在正態(tài)分布中大約1/3 (精確 地為Ι/e)的取樣在平均值的標(biāo)準(zhǔn)偏差外,而大約2/3的取樣在平均值的標(biāo)準(zhǔn)偏差內(nèi)。明顯 地,早期反射音有更多取樣在一個(gè)標(biāo)準(zhǔn)偏差之內(nèi),而較少取樣在一個(gè)標(biāo)準(zhǔn)偏差之外。在一個(gè) 標(biāo)準(zhǔn)偏差之外的取樣對(duì)在一個(gè)標(biāo)準(zhǔn)偏差之內(nèi)的取樣之間的比率可用于定義過(guò)渡時(shí)間。然 而,該方法的缺點(diǎn)在于因?yàn)樵摫嚷视袝r(shí)在閾值附近波動(dòng)所以該過(guò)渡也難以用此手段定義。 該手段也強(qiáng)烈地取決于用于計(jì)算比率的滑行窗的尺寸以及類(lèi)型。
[0098] 除了上述方法,峰態(tài)(Kurtosis)(隨機(jī)信號(hào)的更階累積量)可用于確定過(guò)渡時(shí)間。 當(dāng)向脈沖響應(yīng)的后期部接近時(shí),其可快速降低,如現(xiàn)有技術(shù)參考文獻(xiàn)[4]所概述。然而,針對(duì) 過(guò)渡(使用當(dāng)其第一次到達(dá)零時(shí)迅速降低或時(shí)間)的閾值的定義并非清楚。
[0099] 另有一方法,其不依賴(lài)測(cè)量的脈沖響應(yīng)的分析,但是依賴(lài)空間體積,如同文獻(xiàn)[2] 所描述。該方法假設(shè)過(guò)渡時(shí)間僅取決于體積,但是其不考慮邊界的擴(kuò)散屬性。因此,當(dāng)不需 要精確地確定過(guò)渡轉(zhuǎn)換時(shí)間時(shí),結(jié)果僅是過(guò)渡時(shí)間的近似值,并非為了避免上述缺點(diǎn)而所 需的精確值。進(jìn)一步,空間的體積通常不是已知的且不容易地從測(cè)量的脈沖響應(yīng)中得到。 [0100]其他已知的方法則完全地忽略環(huán)境且定義過(guò)渡時(shí)間為簡(jiǎn)單的80ms,例如,請(qǐng)參見(jiàn) 現(xiàn)有技術(shù)參考文獻(xiàn)[5]。然而,該數(shù)值完全脫離空間特性或測(cè)量的脈沖響應(yīng),因此對(duì)于從脈 沖響應(yīng)的提醒分隔出后期混響音的目的而言太不準(zhǔn)確。
[0101]除了改良的音頻信號(hào)處理之外,根據(jù)本發(fā)明的實(shí)施例也提供確定在室內(nèi)脈沖響應(yīng) 中早期反射音以及后期混響音之間的過(guò)渡時(shí)間的改良方法,以產(chǎn)生更精確的過(guò)渡時(shí)間的確 定。將于下面段落描述的實(shí)施例,提供簡(jiǎn)單且有效可能以使用FFT分析從測(cè)量的脈沖響應(yīng)中 計(jì)算出過(guò)渡時(shí)間。
[0102] 圖7顯示根據(jù)本發(fā)明實(shí)施例的用于確定在室內(nèi)脈沖響應(yīng)中早期反射音和后期混響 音之間的過(guò)渡時(shí)間的方法的流程圖。為了確定從早期反射音到后期混響音的過(guò)渡時(shí)間,在 第一步驟500中確定聲能的時(shí)間-頻率分布。例如,根據(jù)實(shí)施例,能量衰變救援(E (t,f ),EDR) 可在步驟500中計(jì)算。EDR可為直接從測(cè)量的(例如雙聲道)室內(nèi)脈沖響應(yīng)中計(jì)算,以及可解 釋成共享能量衰變曲線(xiàn)(Schroeder integration EDC(d))的頻域擴(kuò)張,該曲線(xiàn)顯示在時(shí)間 t.之后在脈沖響應(yīng)中的剩余能量。取代使用寬帶脈沖響應(yīng),EDR從時(shí)間-頻率表示獲得,且為 此目的,可使用許多不同時(shí)間-頻率表示。一旦聲能的時(shí)間-頻率分布已經(jīng)在步驟500所確 定,則在步驟502確定時(shí)間-頻率分布的時(shí)間塊上的聲能以及在初期狀態(tài)的整體聲能之間的 相關(guān)性測(cè)量。在步驟504中確定相關(guān)性測(cè)量是否到達(dá)定義的閾值(例如,落在定義閾值的下 方)。如果未達(dá)到閾值,本方法進(jìn)行步驟506,選擇下一個(gè)時(shí)間塊以及目前時(shí)間塊的后續(xù)分 布,并針對(duì)下一個(gè)時(shí)間塊重復(fù)進(jìn)行步驟502以及504。如此,根據(jù)步驟502至506,相關(guān)性測(cè)量 用于計(jì)算步驟500確定的EDR的每個(gè)時(shí)間塊和初期狀態(tài)的整體能量之間的相關(guān)性數(shù)值。當(dāng)相 關(guān)性測(cè)量達(dá)到定義的閾值(例如,落在定義閾值之下)時(shí),則表示到達(dá)過(guò)渡時(shí)間。換句話(huà)說(shuō), 當(dāng)在步驟504中對(duì)于目前時(shí)間塊確定相關(guān)性測(cè)量低于閾值,則本方法進(jìn)行步驟508將目前時(shí) 間塊的時(shí)間輸出作為過(guò)渡時(shí)間。
[0103] 以下將更詳細(xì)地描述本發(fā)明方法的實(shí)施例。最初,可將測(cè)量的雙聲道脈沖響應(yīng)作 為輸入用于過(guò)渡時(shí)間的計(jì)算。然后,Page分布或Levin分布用于能量衰變救援(EDR)的計(jì)算。 Page分布是指參考過(guò)去執(zhí)行光譜的衍生物,而時(shí)間反轉(zhuǎn)信號(hào)的Page分布被稱(chēng)為L(zhǎng)evin分布 (也參見(jiàn)現(xiàn)有技術(shù)參考文獻(xiàn)[2])。該分布描述瞬間功率譜,以及脈沖響應(yīng)h(t)(例如,參加圖 5)的EDR如下所示計(jì)算:
[0105] 其中
[0106] E(t,ω)=能量衰變救援,
[0107] h(T)=室內(nèi)脈沖響應(yīng),
[0108] ω =2Jif〇
[0109] 根據(jù)上述公式的計(jì)算在直達(dá)聲音301(參見(jiàn)圖5)處開(kāi)始,而隨著時(shí)間增加能量衰變 救援包括更不明顯的反射以及更多隨機(jī)混響音。根據(jù)所述的實(shí)施例,為了容易計(jì)算,能量衰 變救援以1毫秒長(zhǎng)度的時(shí)間塊進(jìn)行計(jì)算。通過(guò)上述功能,確定聲能的時(shí)間-頻率分布,如圖7 中已經(jīng)描述的關(guān)于步驟500。
[0110] 接著,在圖7中已經(jīng)描述的關(guān)于步驟502至步驟506,根據(jù)Pearson積差相關(guān)(也稱(chēng)為 相關(guān)性系數(shù))確定相關(guān)性測(cè)量p(t)。具體而言,根據(jù)如下所示的實(shí)施例,在初期狀態(tài)時(shí)整體 能量中每個(gè)時(shí)間塊的聲能的相關(guān)性為:
[0112] 其中
[0113] Ε(1,ω)=在頻率f的全部頻率范