用于生成多個參數化音頻流的裝置和方法以及用于生成多個揚聲器信號的裝置和方法
【技術領域】
[0001] 本發明總體上設及參數化空間音頻處理,更具體地,設及用于生成多個參數化音 頻流的裝置和方法W及用于生成多個揚聲器信號的裝置和方法。本發明的進一步的實施例 設及基于扇區(sector)的參數化空間音頻處理。
【背景技術】
[0002] 在多聲道收聽中,收聽者由多個揚聲器圍繞。存在有多種已知方法W捕獲該樣的 設置的音頻。首先考慮揚聲器系統和用該些揚聲器系統能產生的空間感受。在沒有特殊技 術的情況下,常見的雙聲道立體聲設備只能在連接揚聲器的線路上產生聽覺事件。無法產 生從其它方向發出的聲音。邏輯上,通過使用環繞收聽者的更多個揚聲器,可W涵蓋更多個 方向并且可W產生更自然的空間感受。最為眾所周知的多聲道揚聲器系統和布局為5. 1標 準("ITU-R775-1"),其包括相對于收聽位置在0°、30°和110°的方位角處的五個揚聲 器。也已知具有位于不同方向的不同數量的揚聲器的其它系統。
[0003] 在本領域中,針對前述揚聲器系統已經設計出數種不同的記錄方法,W便再現如 同在記錄環境中會感知的收聽情況下的空間感受。針對選擇的多聲道揚聲器系統記錄空間 聲音的理想方式是使用數量與所存在的揚聲器相同的麥克風。在該樣的情況下,麥克風的 指向性圖案(directivitypattern)也應該對應于揚聲器布局,W使得只用一個、兩個、或 S個麥克風記錄來自任何單一方向的聲音。使用的揚聲器越多,因而需要的指向性圖案就 越窄。然而,該樣的窄指向性麥克風相當昂貴,并且通常具有非平坦的頻率響應,該不是期 望的。此外,使用具有太寬指向性圖案的數個麥克風作為多聲道再現的輸入,結果導致多彩 而模糊的聽覺感知,原因在于從單一方向發出的聲音經常是用比所需的揚聲器更多的揚聲 器來再現。因此,當前的麥克風最適合雙聲道記錄和再現,而沒有環繞空間感受的目標。
[0004] 空間聲音記錄的另一種已知方法是記錄分散在寬廣空間區域的大量麥克風。例 如,當記錄在舞臺上的一支管弦樂團時,單一樂器可由所謂的點麥克風拾取,其位置接近聲 源。前聲音舞臺的空間分布例如可由傳統的立體聲麥克風捕獲。對應于后期混響的聲場分 量可由位于距舞臺相對遠的距離的數個麥克風捕獲。然后,音響師可W通過使用可用的全 部麥克風聲道的組合來混合期望的多聲道輸出。然而,該記錄技術暗示極大型記錄設置W 及記錄聲道的手工混音,該實際上通常是不可行的。
[0005] 用于基于定向音頻編碼值irAC)記錄和再現空間音頻的傳統系統(如在W下中 所述;T. Lokki、J. Merimaa、V. Pulkki ;Method for Reproducing Natural or Modified Spatial Impression in Multichannel Listening(用于在多聲道收聽中再現自然或修正 空間感受的方法),美國專利第7,787,638B2號,2010年8月31日,W及V.化化ki ;Spatial Sound Reproduction with Directional Audio Coding(利用定向音頻編碼的空間聲音再 現),J. Audio E;ng. Soc. , Vol. 55, No. 6, PP. 503-516, 2007)依賴于簡單通用的聲場模型。因 此,它們有一些系統性缺點,該限制了實際上可達到的聲音質量和體驗。
[0006] 已知的解決方案的常見問題為該些解決方案相當復雜且通常與空間聲音質量的 劣化相關聯。
[0007] 因此,本發明的目的是提出參數化空間音頻處理的改進構想,其允許使用相對簡 單且緊湊的麥克風配置來達成更高質量、更逼真的聲音記錄和再現。
【發明內容】
[000引該目的通過根據權利要求1所述的裝置、根據權利要求13所述的裝置、根據權利 要求15所述的方法、根據權利要求16所述的方法、根據權利要求17所述的計算機程序、或 根據權利要求18所述的計算機程序來實現。
[0009] 根據本發明的一個實施例,一種用于根據從在記錄空間中進行記錄而獲得的輸入 空間音頻信號來生成多個參數化音頻流的裝置包括分段器(segmentor)和生成器。該分段 器被配置用于從輸入空間音頻信號提供至少兩個輸入分段音頻信號。該里,該至少兩個輸 入分段音頻信號與記錄空間的對應分段相關聯。該生成器被配置用于針對至少兩個輸入分 段音頻信號中的每一個生成參數化音頻流W獲得多個參數化音頻流。
[0010] 為本發明的基礎的基本構想為在從輸入空間音頻信號提供至少兩個輸入分段音 頻信號的情況下、W及在針對至少兩個輸入分段音頻信號中的每一個生成參數化音頻流W 獲得多個參數化音頻流的情況下,能夠實現改進的參數化空間音頻處理,其中至少兩個輸 入分段音頻信號與該記錄空間的對應分段相關聯。該允許使用相對簡單且緊湊的麥克風配 置來實現更高質量、更逼真的空間聲音記錄和再現。
[0011] 根據另一實施例,該分段器被配置成針對記錄空間的每個分段而使用指向性圖 案。此處,該指向性圖案指示至少兩個輸入分段音頻信號的指向性。通過使用指向性圖案, 可W獲得所觀察的聲場的更佳模型匹配,特別是在復雜聲音場景中。
[0012] 根據另一實施例,該生成器被配置用于獲得多個參數化音頻流,其中,多個參數化 音頻流均包括至少兩個輸入分段音頻信號的分量和對應的參數化空間信息。例如,每個參 數化音頻流的參數化空間信息包括到達方向值0A)參數和/或擴散性參數。通過提供D0A 參數和/或擴散性參數,可W在參數化信號表示域中描述觀察的聲場。
[0013] 根據又一實施例,一種用于根據從記錄在錄空間中的輸入空間音頻信號得到的多 個參數化音頻流來生成多個揚聲器信號的裝置包括呈現器和組合器。該呈現器被配置用于 從多個參數化音頻流提供多個輸入分段揚聲器信號。此處,輸入分段揚聲器信號與記錄空 間的對應分段相關聯。該組合器被配置用于組合輸入分段揚聲器信號W獲得多個揚聲器信 號。
[0014] 本發明的另外的實施例提供了用于生成多個參數化音頻流的方法W及用于生成 多個揚聲器信號的方法。
【附圖說明】
[0015] W下,將參照【附圖說明】本發明的實施例,在附圖中:
[0016] 圖1示出用于用分段器和生成器從記錄在記錄空間中的輸入空間音頻信號生成 多個參數化音頻流的裝置的實施例的框圖;
[0017] 圖2示出基于混合或矩陣化運算的、根據圖1的裝置的該實施例的分段器的示意 圖;
[001引圖3示出使用指向性圖案的、根據圖1的裝置的該實施例的分段器的示意圖;
[0019] 圖4示出基于參數化空間分析的、根據圖1的裝置的該實施例的生成器的示意 圖;
[0020] 圖5示出用于用呈現器和組合器從多個參數化音頻流生成多個揚聲器信號的裝 置的實施例的框圖;
[0021] 圖6示出記錄空間的示例分段的示意圖,每個分段表示在二維(2D)平面內或在S 維(3D)空間內的方向子集;
[0022] 圖7示出針對記錄空間的兩個分段或扇區的示例揚聲器信號計算的示意圖;
[0023] 圖8示出使用二階B格式輸入信號的、針對記錄空間的兩個分段或扇區的示例揚 聲器信號計算的示意圖;
[0024] 圖9示出包括在參數化信號表示域中的信號修正的、針對記錄空間的兩個分段或 扇區的示例揚聲器信號計算的示意圖;
[0025] 圖10示出由根據圖1的裝置的該實施例的分段器提供的輸入分段音頻信號的示 例極性圖案(polarpattern)的示意圖;
[0026] 圖11示出用于執行聲場記錄的示例麥克風配置的示意圖擬及
[0027] 圖12示出用于獲得更高階麥克風信號的全向麥克風的示例圓形陣列的示意圖。
【具體實施方式】
[002引在利用附圖更詳細地討論本發明之前,須指出的是,在附圖中,相同元件、具有相 同功能或相同效果的元件W相同的附圖標記提供,使得在不同實施例中示例說明的該些元 件及其功能的描述在不同實施例中可相互交換或可彼此適用。
[0029] 圖1示出用于使用分段器110和生成器120根據從在記錄空間中進行記錄而獲 得的輸入空間音頻信號105來生成多個參數化音頻流125 ( 0。的裝置100的實施 例的框圖。例如,該輸入空間音頻信號105包括全向信號W和多個不同的定向信號X、Y、 Z、U、V(或X、Y、U、V)。如圖1所示,該裝置100包括分段器110和生成器120。例如,該分 段器110被配置用于從輸入空間音頻信號105的全向信號W和多個不同定向信號X、Y、Z、 U、V提供至少兩個輸入分段音頻信號115 (W。X。Y。Zi),其中該至少兩個輸入分段音頻信號 115(Wi,Xi,Yi,Zi)與記錄空間的對應分段Segi相關聯。此外,生成器120可被配置用于針對 至少兩個輸入分段音頻信號115 (Wi,X。Yi,Zi)中的每一個生成參數化音頻流W獲得多個參 數化音頻流125(0。Wi,Wi)。
[0030] 通過用于生成多個參數化音頻流125的裝置100,可W避免空間聲音質量的劣化 并避免相對復雜的麥克風配置。因此,根據圖1的裝置100的實施例允許使用相對簡單且 緊湊的麥克風配置獲得更高質量、更逼真的空間聲音記錄。
[0031] 在實施例中,記錄空間的分段Segi均表示二維(2D)平面內或S維(3D)空間內的 方向子集。
[0032] 在實施例中,記錄空間的分段Segi均W關聯的定向度量為特征。
[0033]根據實施例,該裝置100被配置用于執行聲場記錄W獲得輸入空間音頻信號105。 例如,分段器110被配置用于將關注的全角度范圍劃分成記錄空間的分段Segi。此外,記錄 空間的分段Segi均可覆蓋相比于關注的全角度范圍縮小的角度范圍。
[0034] 圖2示出基于混合(或矩陣化)運算的、根據圖1的裝置100的該實施例的分 段器110的示意圖。如在圖2中示例性地示出,分段器110被配置成使用混合或矩陣化 運算來根據全向信號W和多個不同定向信號X、Y、Z、U、V生成至少兩個輸入分段音頻信 號115 (W。X。Y。Zi),該混合或矩陣化運算取決于記錄空間的分段Segi。通過圖2中示例 性示出的分段器110,可W使用預定義的混合或矩陣化運算來將構成輸入空間音頻信號 105的全向信號W和多個不同的定向信號X、Y、Z、U、V映射為至少兩個輸入分段音頻信號 115 (W。X。Y。Zi)。該預定義的混合或矩陣化運算取決于記錄空間的分段Segi,并且實質上 可W用于從輸入空間音頻信號105分出來至少兩個輸入分段音頻信號115 (W。X。Y。Z