雙耳信號的信號生成的制作方法
【專利摘要】描述了一種用于基于多聲道信號來產生雙耳信號的設備,所述多聲道信號表示多個聲道并且用于由揚聲器配置來再現,所述揚聲器配置具有與每個聲道相關聯的虛擬聲源位置。所述設備包括:相關性減小器,用于以不同方式處理并因此減小在所述多個聲道的左聲道和右聲道、所述多個聲道的前聲道和后聲道、以及所述多個聲道的中心聲道和非中心聲道中的至少一對聲道之間的相關性,以得到彼此間相似性減小的聲道集合;多個方向濾波器;第一混頻器,用于將對向收聽者的第一耳道的聲傳輸加以建模的方向濾波器的輸出進行混頻;以及第二混頻器,用于將對向收聽者的第二耳道的聲傳輸加以建模的方向濾波器的輸出進行混頻。根據另一方面,形成彼此間相似性減小的頭部相關傳遞函數集合。
【專利說明】雙耳信號的信號生成
[0001]本申請是申請日為2009年7月30日,申請號為200980138924.5的專利申請“雙
耳信號的信號生成”的分案申請。
【技術領域】
[0002]本發明涉及產生雙耳信號的與房間反射和/或回響有關的貢獻、產生雙耳信號自身、以及形成彼此間相似性減小的頭部相關傳遞函數集合。
【背景技術】
[0003]人類聽覺系統能夠確定感知到的聲音來自哪個或哪些方向。為此,人類聽覺系統評估右耳處接收到的聲音與左耳處接收到的聲音之間的特定差異。特定差異包括例如所謂的耳間提示,所述耳間提示是指耳朵之間的聲音信號差。耳間提示是最重要的定位方法。耳朵之間的壓力等級差(即,耳間聲級差(ILD))是用于定位的最重要的單個提示。當聲音從水平面以非零仰角到達時,該聲音在每個耳朵中具有不同的聲級。與未被遮擋的耳朵相比,被遮擋的耳朵具有必然受抑制的聲像。用于定位的另一非常重要的特性是耳間時間差(ITD)。與未被遮擋的耳朵相比,被遮擋的耳朵離聲源的距離更遠,從而更晚獲得聲音波前。在低頻下強調ITD的含義,與未被遮擋的耳朵相比,低頻聲音在到達被遮擋的耳朵時沒有衰減很多。ITD在較高頻率下不太重要,這是因為聲音波長與耳朵之間的距離更接近。因此,換言之,定位利用以下事實:當聲音從聲源分別傳播到收聽者的左耳和右耳時,聲音經過與收聽者的頭部、耳朵和肩膀的不同交互。
[0004]當人收聽立體聲信號時會出現問題,其中將由擴音器裝置經由耳機來再現的所述立體聲信號。當收聽者感到聲源位于頭部中時,收聽者很有可能認為聲音不自然、難聽并且煩擾。這種現象在學術上通常稱作“頭內”定位。長期收聽“頭中”聲音會導致收聽疲勞。由于人類聽覺系統在定位聲源時所依賴的信息(即,耳間提示)丟失或不清楚,因此會出現這種現象。
[0005]為了呈現立體聲信號或者甚至具有多于兩個聲道的多聲道信號以實現耳機再現,可以使用方向濾波器來對這些交互進行建模。例如,從解碼后的多聲道信號產生耳機輸出可以包括:在解碼之后利用一對方向濾波器對每個信號進行濾波。這些濾波器典型地對從房間內虛擬聲源向收聽者耳道的聲音傳輸進行建模,所謂的雙耳房間傳遞函數(BRTF)。BRTF執行時間修改、聲級修改和譜修改、以及對房間反射和回響進行建模。可以在時間域或頻域實現方向濾波器。
[0006]然而,由于需要許多(B卩,NX2,其中N是解碼聲道的個數)濾波器,所以這些方向濾波器非常長,如,在44.1kHz下有20000個濾波器抽頭,濾波過程需要非常大的計算量。因此,有時將方向濾波器減小到最小。所謂的頭部相關傳遞函數(HRTF)包含方向信息,所述方向信息包括耳間提示。一般的處理模塊用于對房間反射和回響進行建模。房間處理模塊可以是在時域或頻域的回響算法,并且可以對單聲道或二聲道輸入信號起作用,其中所述單聲道或二聲道輸入信號是通過對多聲道輸入信號的聲道求和而從多聲道輸入信號得到的。例如,在W099/14983A1中描述了這種結構。如所描述的,房間處理模塊實現房間反射和/或回響。房間反射和回響對于所定位的聲音是重要的,尤其相對于距離和外
化(externalization)-意味著在收聽者頭部外面感知到聲音。前述文獻還建議使用方
向濾波器作為在相應聲道的不同地延遲的版本上工作的FIR濾波器集合,以對從聲源到相應耳朵的直接路徑和不同反射進行建模。此外,在對通過一對耳機提供更愉悅收聽體驗的多種方法的描述中,該文獻還建議分別相對于左后方聲道和右后方聲道的和與差,對中心聲道與左前方聲道的混合以及中心聲道與右前方聲道的混合進行延遲。
[0007]然而,這樣實現的收聽結果仍然很大程度上缺乏雙耳輸出信號的空間寬度的減小以及缺乏外化。此外,已經認識到,除了上述呈現多聲道信號以實現耳機再現的方法外,常常對電影對白和音樂中的語音的一部分感到不自然、有回響并且空間上不等。
【發明內容】
[0008]因此,本發明的目的是提供一種雙耳信號生成方案,從而實現更穩定且舒適的耳機再現。
[0009]根據權利要求1、3、4和7中任一項所述的設備以及根據權利要求16至19中任一項雙耳所述的方法實現了該目的。
[0010]本發明所基于的第一思想是,通過以下操作可以實現用于耳機再現的更穩定且舒適的雙耳信號:以不同方式處理并因此而減小在多個聲道的左聲道和右聲道、所述多個聲道的前聲道和后聲道、以及所述多個聲道的中心聲道和非中心聲道中的至少一對聲道之間的相似性,從而得到彼此間相似性減小的聲道集合。然后將該彼此間相似性減小的聲道集合饋送至多個方向濾波器,多個方向濾波器后面是分別針對左耳和右耳的相應混頻器。通過減小多聲道輸入信號的聲道的彼此間相似性,可以增大雙耳輸出信號的空間寬度并可以改善外化。
[0011]本發明所基于的另一思想是,通過以下操作可以實現用于耳機再現的更穩定且舒適的雙耳信號:在譜變化的意義上,在所述多個聲道中的至少兩個聲道之間,以不同方式執行相位和/或幅度修改,從而得到彼此間相似性減小的聲道集合,然后可以將所述彼此間相似性減小的聲道集合饋送至多個方向濾波器,所述多個方向濾波器后面是分別針對左耳和右耳的相應混頻器。同樣,通過減小多聲道輸入信號的聲道的彼此間相似性,可以增大雙耳輸出信號的空間寬度并可以改善外化。
[0012]當通過以下方式來形成彼此間相似性減小的頭部相關傳遞函數集合時,也可以實現上述優點:使原始的多個頭部相關傳遞函數的脈沖響應相對于彼此而延遲,或在譜變化的意義上,相對于彼此以不同方式修改原始的多個頭部相關傳遞函數的脈沖響應的相位響應和/或幅度響應。可以例如,響應于要使用的虛擬聲源位置的指示,通過使用頭部相關傳遞函數作為方向濾波器,作為設計步驟離線地進行形成,或者在雙耳信號生成期間在線地進行形成。
[0013]本發明所基于的另一思想是,在以下情況下,電影或音樂中的一些部分產生更自然地感知的耳機再現:形成多聲道信號的聲道的單聲道或立體聲下混頻,其中將對所述多聲道信號應用房間處理器以產生雙耳信號的與房間反射/回響有關的貢獻,使得所述多個聲道以在多聲道信號的至少兩個聲道之間不同的聲級處對單聲道或立體聲下混頻作出貢獻。例如,發明人意識到,典型地電影對白和音樂中的話音主要被混頻到多聲道信號的中心聲道,并且中心聲道信號在被饋送至房間處理模塊時產生常常不自然的回響和在譜方面不等的感知輸出。然而發明人發現,通過利用聲級降低(例如3-12dB或具體地6dB的衰減)將中心聲道饋送至房間處理模塊,可以克服這種缺陷。
【專利附圖】
【附圖說明】
[0014]在下文中,關于附圖更詳細地描述了優選實施例,附圖中:
[0015]圖1示出了根據實施例的用于生成雙耳信號的設備的框圖;
[0016]圖2示出了根據另一實施例的用于形成彼此間相似性遞減的頭部相關傳遞函數集合的設備的框圖;
[0017]圖3示出了根據另一實施例的用于生成雙耳信號的與房間反射和/或回響有關的貢獻的設備;
[0018]圖4a和4b示出了根據不同實施例的圖3的房間處理器的框圖;
[0019]圖5示出了根據實施例的圖3的下混頻發生器發生器的框圖;
[0020]圖6示出了根據實施例的對使用空間音頻編碼的多聲道信號的圖示加以表示的示意圖;
[0021]圖7示出了根據實施例的雙耳輸出信號發生器;
[0022]圖8示出了根據另一實施例的雙耳輸出信號發生器的框圖;
[0023]圖9示出了根據另一實施例的雙耳輸出信號發生器的框圖;
[0024]圖10示出了根據另一實施例的雙耳輸出信號發生器的框圖;
[0025]圖11示出了根據另一實施例的雙耳輸出信號發生器的框圖;
[0026]圖12示出了根據實施例的圖11的雙耳空間音頻解碼器的框圖;以及
[0027]圖13示出了根據實施例的圖11的修改后的空間音頻解碼器的框圖。
【具體實施方式】
[0028]圖1示出了用于產生雙耳信號的設備,所述雙耳信號例如用于基于對多個聲道加以表示的多聲道信號的耳機再現,以及用于通過具有與每個聲道相關聯的虛擬聲源位置的揚聲器配置來再現。該設備通常以附圖標記10來表示,包括相似性減小器12、多個方向濾波器14a-14h(方向濾波器14)、第一混頻器16a和第二混頻器16b。
[0029]相似性減小器12被配置為將表不多個聲道18a_18d的多聲道信號18變成聲道彼此間相似性減小的聲道20a-20d聲道集合20。由多聲道信號18表示所表示的聲道18a-18d的個數可以是兩個或多個。僅出于示意的目的,圖1中已經明確示出了 4個聲道聲道18a-18d。多個聲道18例如可以包括中心聲道、左前方聲道、右前方聲道、左后方聲道以及右后方聲道。聲音設計器根據多個單獨音頻信號對聲道18a-18d進行混頻,其中所述多個單獨音頻信號表示例如單獨指令、聲樂作品或其他單獨聲源,假定或目的在于由揚聲器裝置(圖1中未示出)來再現聲道18a-18d,使揚聲器位于與每個聲道18a-18d相關聯的預定虛擬聲源位置。
[0030]根據圖1的實施例,多個聲道18a_18d至少包括左右聲道對、前后聲道對、或者中心與非中心聲道對。當然,在多個聲道18a-18d(聲道18)內可以存在多于一個上述對。相似性減小器12被配置為以不同方式處理并從而減小多個聲道中各個聲道之間的相似性,以得到由聲道20a-20d組成的彼此間相似性減小的聲道集合20。根據第一方面,相似性減小器12可以減小多個聲道18中的左右聲道、多個聲道18中的前后聲道、以及多個聲道18中的中心與非中心聲道中至少一對聲道之間的相似性,以得到由聲道20a-20d組成的彼此間相似性減小聲道集合20。根據第二方面,附加地/備選地,相似性減小器(12)在譜變化的情況下在多個聲道中的至少兩個聲道之間以不同方式執行相位和/或幅度修改,以得到彼此間相似性減小聲道集合20。
[0031]如以下將更詳細描述的,例如,相似性減小器12可以通過使各個對相對于彼此而延遲,或通過例如在多個頻帶中的每個頻帶中將各個聲道對延遲不同的量,來實現不同的處理,從而得到彼此間相關性減小聲道集合20。當然,也存在其他可能來減小聲道之間的相關性。換言之,相關性減小器12可以具有傳遞函數,根據該傳遞函數,每個聲道的譜能量分布保持相同,即,該傳遞函數作為相關音頻譜范圍上的量值1,然而相似性減小器12以不同方式修改其子帶或頻率分量的相位。例如,相關性減小器12可以被配置為:同樣對聲道18的所有聲道或一個或多個聲道進行相位修改,使得針對特定的頻帶,使第一聲道的信號相對于另一聲道而延遲至少一個采樣。此外,相關性減小器12可以被配置為:同樣引起相位修改,使得對于多個頻帶,第一聲道相對于另一聲道的組延遲表現出至少八分之一采樣的標準偏差。所考慮的頻帶可以是Bark頻帶或任何其子集或其他頻帶子部分(sub-division)。
[0032]減小相關性并不是防止人類聽覺系統遭遇頭內定位的唯一途徑。相關性僅僅是多種可能方式之一,通過這些方式,人類聽覺系統測量到達兩只耳朵的聲音的相似性,從而測量聲音的回程方向(in-bound direction)。相應地,相似性減小器12還可以通過例如在多個頻帶中的每個頻帶中對各個聲道進行不同量的聲級減小,來實現不同的處理,從而以譜形成的方式得到彼此間相似性減小聲道集合20。譜形成可以例如擴大相對譜形成減小,例如由于耳朵的遮擋而引起的后聲道聲音相對于前聲道聲音的相對譜形成減小。相應地,相似性減小器12可以相對于其他聲道對后聲道進行譜變化聲級減小。在該譜形成中,相似性減小器12可以具有在相關音頻譜范圍上恒定的相位響應,然而相似性減小器12以不同方式修改其子頻帶或頻率分量的幅度。
[0033]多聲道信號18表不多個聲道18a_18d的方式在原則上不限于任何特定表不。例如,多聲道信號18可以使用空間音頻編碼以壓縮方式表示多個聲道18a-18d。根據空間音頻編碼,可以利用多個聲道18a_18d被下混頻到的下混頻信號伴隨下混頻信息和空間參數來表示所述多個聲道18a-18d,其中所述下混頻信息表示將獨立聲道18a-18d混頻到下混頻聲道中所依據的混頻比,所述空間參數例如利用聲級/強度差、相位差、時間差和/或各個單獨聲道18a-18d之間的相關性/相關性的度量來描述多聲道信號的空間圖像。將相關性減小器12的輸出分割成各個單獨的聲道20a-20d。可以作為時間信號、或作為光譜圖(例如,譜分解到子頻帶中)來輸出聲道20a-20d。
[0034]方向濾波器14a_14h被配置為對聲道20a_20d中相應的一個聲道的從與相應聲道相關聯的虛擬聲源位置向收聽者相應耳道的聲傳播進行建模。在圖1中,方向濾波器14a-14d對向例如左耳道的聲傳播進行建模,而方向濾波器14e_14d對向右耳道的聲傳輸進行建模。方向濾波器可以對從室內虛擬聲源位置向收聽者耳道的聲傳輸進行建模,并且可以通過執行時間、聲級和譜修改并可選地對房間反射和回響進行建模,來執行該建模。可以在時域或頻域實現方向濾波器18a-18h。即,方向濾波器可以是諸如濾波器、FIR濾波器之類的時域濾波器,或者可以通過將各個傳遞函數采樣值與聲道20a-20d的各個譜值相乘而在頻域工作。具體地,方向濾波器14a-14h可以被選擇為對相應的頭部相關傳遞函數進行建模,所述頭部相關傳遞函數描述了從相應的虛擬聲源位置到相應耳道的相應聲道信號20a_20d的交互,包括例如與人的頭部、耳朵和肩膀的交互。第一混頻器16a被配置為對方向濾波器14a-14d的輸出進行混頻,以得到用于對雙耳輸出信號的左聲道作出貢獻或者甚至就是雙耳輸出信號的左聲道的信號22a,其中方向濾波器14a_14d對于向收聽者左耳道的聲傳輸進行建模;而第二混頻器16b被配置為對方向濾波器14e_14h的輸出進行混頻,以得到用于對雙耳輸出信號的右聲道作出貢獻或者甚至就是雙耳輸出信號的右聲道的信號22b,其中方向濾波器14e-14h對于向收聽者右耳道的聲傳輸進行建模。
[0035]如以下將關于各個實施例而更詳細描述的,可以向信號22a和22b添加其他貢獻,以考慮室內反射和/或回響。通過這種方式,可以降低方向濾波器14a-14h的復雜度。
[0036]在圖1的設備中,相似性減小器12抵消對分別輸入到混頻器16a和16b中的相關信號進行求和的負面效應,據此,可以導致雙耳輸出信號22a和22b的空間寬度有很大的減小并且缺乏外化。相似性減小器12所實現的去相關減小了這些負面效應。
[0037]在進入下一實施例之前,換言之,圖1示出了從例如解碼后的多聲道信號產生耳機輸出的信號流。每個信號由方向濾波器對來濾波。例如,聲道18a由方向濾波器對14a_14e來濾波。不幸地,在典型的多聲道聲音產生中,聲道18a_18d之間存在很大的相似性(如,相關性)。這會對雙耳輸出信號造成負面影響。即,在用方向濾波器14a_14h處理了多聲道信號之后,在混頻器16a和16b中將方向濾波器14a_14h輸出的中間信號相加,以形成耳機輸出信號20a和20b。對相似/相關的輸出信號求和會使得輸出信號20a和20b的空間寬度大大減小并且缺乏外化。這對于左右信號和中心聲道的相似性/相關性來說是尤為成問題的。相應地,相似性減小器12用于盡可能地減小這些信號之間的相似性。
[0038]應注意,通過去除相似性減小器12,同時將方向性濾波器修改為不僅執行前述對聲傳輸的建模,還實現上述不相似性(如,去相關),可以實現相似性減小器12為了減小多個聲道18a-18d(聲道18)中各個聲道之間的相似性而執行的大多數測量。相應地,方向性傳感器可以不對HRTF進行建模,而是對修改后的頭部相關傳遞函數進行建模。
[0039]圖2例如示出了設備,該設備用于形成彼此間相似性減小的頭部相關傳遞函數集合,以對聲道集合的從與相應聲道相關聯的虛擬聲源位置向收聽者耳道的聲傳輸進行建模。通常由30來表示的設備包括HRTF提供器32和HRTF處理器34。
[0040]HRTF提供器32被配置為提供原始的多個HRTF。步驟32可以包括:使用標準仿真頭部的測量,以測量從特定聲位置向標準仿真收聽者的耳道的頭部相關傳遞函數。類似地,HRTF提供器32可以被配置為簡單地從存儲器查找或加載原始HRTF。備選地,HRTF提供器32可以被配置為例如根據感興趣的虛擬聲源位置按照預定的公式來計算HRTF。相應地,HRTF提供器32可以被配置為工作在用于設計雙耳輸出信號發生器的設計環境中,或者可以是這種雙耳輸出信號發生器信號自身的一部分,以例如響應于虛擬聲源位置的選擇或改變來在線提供原始HRTF。例如,設備30可以是雙耳輸出信號發生器的一部分,所述雙耳輸出信號發生器能夠提供針對不同揚聲器配置的多聲道信號,不同揚聲器布置具有與其聲道相關聯的不同虛擬聲源位置聲道。在這種情況下,HRTF提供器32可以被配置為以適于當前預期虛擬聲源位置的方式來提供原始HRTF。
[0041]HRTF處理器34被配置為使至少HRTF對的脈沖響應相對于彼此而位移,或在譜變化的情況下以不同方式相對于彼此來修改HRTF對的相位和/或幅度響應。HRTF對可以對左右聲道、前后聲道、以及中心與非中心聲道中的一對聲道進行建模。實際上,可以利用應用于多聲道信號中的一個或多個聲道的以下技術之一或這些技術的組合來實現這一點:SP,將相應聲道的HRTF延遲;修改相應HRTF的相位響應和/或對相應HRTF應用諸如全通濾波器之類的去相關濾波器,從而得到彼此間相關性減小的HRTF集合;和/或在譜修改的情況下修改相應HRTF的幅度響應,從而得到至少彼此間相似性減小的HRTF集合。在任一情況下,得到的各個聲道之間的去相關性/不相似性可以支持人類聽覺系統外部地定位聲源,從而防止發生頭內定位。例如,HRTF處理器34可以被配置為:同樣引起聲道HRTF中的全部聲道、一個或多個聲道的相位響應的修改,使得引入特定頻帶的第一 HRTF的組延遲,或者將第一 HRTF的特定頻帶相對于另一個HRTF延遲至少一個采樣。此外,HRTF處理器34可以被配置為:同樣引起相位響應的修改,使得針對多個頻帶,第一 HRTF相對于另一個HRTF的組延遲表現出至少八分之一采樣的標準偏差。所考慮的頻帶可以是Bark頻帶或其子頻帶或任何其他頻帶子部分。
[0042]從HRTF處理器34得到的彼此間相似性減小的HRTF集合可以用于設定圖1的設備的方向濾波器14a-14h的HRTF,其中,可以存在或不存在相似性減小器12。由于修改后的HRTF的不相似性特性,即使當沒有相似性減小器12時也可以類似地實現與雙耳輸出信號的空間寬度以及改進的外化有關的前述優點。
[0043]如上所述,圖1的設備可以伴隨另一通路,所述另一通路被配置為基于輸入聲道18a_18d中的至少一些聲道的下混頻,得到雙耳輸出信號的與房間反射和/或回響有關的貢獻。這降低了方向濾波器14a-14h的復雜度。圖3示出了用于產生雙耳信號的這種與房間反射和/或房間回響有關的貢獻的設備。設備40包括彼此串聯的下混頻發生器42和房間處理器44,其中房間處理器44在下混頻發生器42后面。設備40可以連接在圖1的設備的輸入與雙耳輸出信號的輸出之間,在圖1的設備的輸入處輸入多聲道信號18,在雙耳輸出信號的該輸出處,將房間處理器44的左聲道貢獻46a添加到輸出22a,將房間處理器44的右聲道輸出46b添加到輸出22b。下混頻發生器42根據多聲道信號18的聲道形成單聲道或立體聲下混頻48,處理器44被配置為通過基于單聲道或立體聲信號48對房間反射和/或回響進行建模,來產生雙耳信號的與房間反射和/或回響有關的貢獻的左聲道46a和右聲道46b。
[0044]房間處理器44所基于的思想是,例如可以基于下混頻(例如,多聲道信號18的聲道的簡單的求和)以對收聽者透明的方式來建模在房間內出現的房間反射/回響。由于與沿著從聲源到耳道的直接路徑或視線傳播的聲音相比,房間反射/回響出現較晚,所以房間處理器的脈沖響應代表或替代圖1所示方向濾波器的脈沖響應的尾部。可以將方向濾波器的脈沖響應限制為收聽者頭部、耳朵和肩膀處出現的直接路徑以及反射和衰減進行建模,從而縮短方向濾波器的脈沖響應。當然,方向濾波器所建模的內容與房間處理器44所建模的內容之間的界限可以自由改變,使得方向濾波器還可以例如對第一房間反射/回響進行建模。[0045]圖4a和4b示出了房間處理器的內部結構的可能實現。根據圖la,為房間處理器44饋送單聲道下混頻信號48,房間處理器44包括兩個回響濾波器50a和50b。與方向濾波器類似,回響濾波器50a和50b可以被實現為在時域或頻域操作。回響濾波器50a和50b的輸入都接收單聲道下混頻信號48。回響濾波器50a的輸出提供左聲道貢獻輸出46a,而回響濾波器50b輸出右聲道貢獻信號46b。圖4b不出了在為房間處理器44提供立體聲下混頻信號48的情況下,房間濾波器44的內部結構的示例。在這種情況下,房間處理器包括四個回響濾波器50a-50d。回響濾波器50a和50b的輸入連接至立體聲下混頻48的第一聲道48a,而回響濾波器50c和50d的輸入連接至立體聲下混頻48的另一聲道48b。回響濾波器50a和50c的輸出連接至加法器52a的輸入,加法器52a的輸出提供左聲道貢獻46a。回響濾波器50b和50d的輸出連接至另一加法器52b的輸入,所述另一加法器52b的輸出提供右聲道貢獻46b。
[0046]盡管已經描述了下混頻發生器42可以簡單地通過對每個聲道均等地加權來對多聲道信號18的聲道進行求和,然而圖3的實施例并不限于此。相反,圖3的下混頻發生器42可以被配置為形成單聲道或立體聲下混頻48,使得多個聲道,以在多聲道信號18的至少兩個聲道之間不同的聲級處,對單聲道或立體聲下混頻作出貢獻。通過這種方式,可以防止或促使被混頻到多聲道信號的特定的一個或多個聲道中的多聲道信號的特定內容(如,語音或背景音樂)受到房間處理,從而避免不自然的聲音。
[0047]例如,圖3的下混頻發生器42可以被配置為形成單聲道或立體聲下混頻48,使得多聲道信號18的多個聲道的中的中央聲道以相對于多聲道信號18的其他聲道而言聲級降低的方式對單聲道或立體聲下混頻信號48作出貢獻。例如,聲級降低的量可以在3dB和12dB之間。聲級降低可以均勻地分布在多聲道信號18的聲道的有效譜范圍上,或者可以是頻率相關的,如,集中在特定的譜部分(如,典型地被話音信號占用的譜部分)上。相對于其他聲道而言聲級降低的量可以與所有其他聲道相同。即,可以以同樣的聲級將其他聲道混頻到下混頻信號48中。備選地,可以以不等的聲級將其他聲道混頻到下混頻信號48中。那么可以針對其他聲道的均值或者包括聲級降低的那個聲道在內的所有聲道的均值,來測量相對于其他聲道而言的聲級降低的量。如果是這樣,則其他聲道的混頻權重的標準偏差或所有聲道的混頻權重的標準變差可以小于等級降低的聲道相對于上述均值而言混頻權重的等級降低的66%。
[0048]相對于中心聲道而言的等級降低的效果是:經由貢獻56a和56b得到的雙耳輸出信號至少在以下更詳細描述的一些情況下被收聽者更自然地感知到,而沒有聲級降低。換言之,下混頻發生器42形成多聲道信號18的聲道的加權和,其中與中心聲道相關聯的加權值相對于其他聲道的加權值而減小。
[0049]在電影對白或音樂的話音部分期間,中心頻率的聲級降低是尤為有利的。由于非話音階段中的聲級降低,在這些話音部分期間得到的音頻印象改善過度地補償了微小懲罰。然而,根據備選實施例,聲級降低不是恒定的。相反,下混頻發生器42可以被配置為在關閉聲級降低的模式與開啟聲級降低的模式之間進行切換。換言之,下混頻發生器42可以被配置為以時間變化的方式來改變聲級降低的量。變化可以是二進制形式或模擬形式的,在零與最大值之間。下混頻發生器42可以被配置為根據在多聲道信號18內包含的信息來執行模式切換或聲級降低量變化。例如,下混頻發生器42可以被配置為檢測話音階段或區分這些話音階段與非話音階段,或者可以為中心聲道的連續幀分配對話音內容(至少是順序量表(ordinal scale)的話音內容)進行測量的話音內容測量。例如,下混頻發生器42利用話音濾波器來檢測中心聲道中話音的存在,并確定該濾波器的輸出聲級是否超過了和閾值。然而,下混頻發生器42對中心聲道內話音階段的檢測并不是執行上述與時間有關的聲級降低量變化的模式切換的唯一方式。例如,多聲道信號18可以具有與該多聲道信號18相關聯的輔助信息,所述輔助信息尤其用于區分話音階段與非話音階段,或者定量地測量話音內容。在這種情況下,下混頻發生器42將響應于該輔助信息來操作。另一種可能是,下混頻發生器42還可以根據例如中心聲道、左聲道和右聲道的電流等級之間的比較,來執行上述模式切換或聲級降低量變化。如果中心聲道分別各自地比左聲道和右聲道或者比左聲道與右聲道之和高出特定的閾值比率,則下混頻發生器42可以假定當前存在話音階段并相應地作出動作,即,執行聲級降低。類似地,下混頻發生器42可以使用中心聲道、左聲道和右聲道之間的聲級差,以實現上述相依性。
[0050]除此之外,下混頻發生器42可以響應于用于對多聲道信號18的多個聲道的空間圖像加以描述的空間參數。圖5中示出了這一點。圖5示出了在多聲道信號18利用特殊音頻編碼(即,通過使用多個聲道被下混頻到的下混頻信號62,以及對多個聲道的空間圖像加以描述的空間參數64)來表示多個聲道的情況下,下混頻發生器42的示例。可選地,多聲道信號18還可以包括對單獨聲道被混頻到下混頻信號62或下混頻信號62的獨立聲道中的比值加以描述的下混頻信息,因為下混頻聲道62可以例如是普通下混頻信號62或立體聲下混頻信號62。圖5的下混頻發生器42包括解碼器64和混頻器66。解碼器64根據空間音頻解碼對多聲道信號18進行解碼,以得到包括尤其是中心聲道66和其他聲道68在內的多個聲道。混頻器66被配置為通過執行上述聲級降低,對中心聲道66和其他非中心聲道68進行混頻,以得到單聲道或立體聲信號48。如虛線70所指示的,如上所述,混頻器66可以被配置為使用空間參數64,以在聲級降低模式與變化聲級降低量的非聲級降低模式之間切換。混頻器66所使用的空間參數64可以例如是對可以如何可以從下混頻信號62得到中心聲道66、左聲道或右聲道加以描述的聲道預測系數,其中混頻器66可以附加地使用對上述左聲道和右聲道之間的相干性或交叉相關加以表示的聲道間相干/交叉相關參數,上述左聲道和右聲道可以分別是是左前方聲道與左后方聲道的下混頻以及右前方聲道與右后方聲道的下混頻。例如,可以以固定的比率將中心聲道混頻到立體聲下混頻信號62的上述左聲道和右聲道中。在這種情況下,兩個聲道預測系數就足夠確定如何從立體聲下混頻信號62的兩個聲道的相應線性組合中得到中心聲道、左聲道和右聲道。例如,混頻器66可以使用聲道預測系數的和與差之間的比率,以區分話音階段與非話音階段。
[0051]盡管描述了關于中心聲道的聲級降低以不例多個聲道的加權求和,使得中心聲道以在多聲道信號18的至少兩個聲道之間不同的聲級,對單聲道或立體聲混頻作出貢獻,然而也存在其他示例,在所述其他示例中,有利地將其他聲道相對于另一個或另一些聲道進行聲級降低或聲級放大,這是因為,在與多聲道信號中的其他內容相同但降低/提高的聲級下,所述另一個或另一些聲道中存在的一些聲源內容將受到或不受到房間處理。
[0052]關于利用下混頻信號62和空間參數64來表示多個輸入聲道的可能性,非常概括地說明了圖5。關于圖6,強化了該描述。關于圖6的描述還用于理解關于圖10至13而描述的以下實施例。圖6示出了譜分解成多個子頻帶82的下混頻信號62。在圖6中,將子頻帶82示例性地示為水平延伸,子頻帶82被布置為使得子頻帶頻率如頻域箭頭84所指示的從底部到頂部增大。沿水平方向的延伸應表示時間軸86。例如,下混頻信號62包括針對每個子頻帶82的譜值序列88。通過采樣值88來采樣子頻帶82的時間分辨率可以由濾波器組時隙90來限定。因此,時隙90和子頻帶92限定了某一時間/頻率分辨率或柵格。通過如圖6中虛線所示將相鄰的采樣值88合并成時間/頻率片92來限定較粗略的時間/頻率柵格,這些片限定了時間/頻率參數分辨率或柵格。前述空間參數62是在該時間/頻率參數分辨率92下限定的。時間/頻率參數分辨率92可以隨時間改變。為此,可以將多聲道信號62分成連續幀94。對于每一幀,可以單獨地設置時間/頻率參數分辨率92。在解碼器64在時域接收下混頻信號62的情況下,解碼器64可以包括內部分析濾波器組,以得到如圖6所示的下混頻信號62的表示。備選地,下混頻信號62以如圖6所示的形式進入解碼器64,在這種情況下解碼器64中不需要分析濾波器組。如圖5中已經提到的,對于每個片92,可以存在兩個聲道預測參數,所述聲道預測參數關于相應的時間/頻率片92揭示如何可以從立體聲下混頻信號62的左聲道和右聲道得到右聲道和左聲道。此外,對于片92,還可以存在聲道間相干/交叉相關(ICC)參數,所述聲道間相干/交叉相關(ICC)參數指示要從立體聲下混頻信號62得到的左聲道和右聲道之間的相似性,其中已將一個聲道完全混頻到立體聲下混頻信號62的一個聲道中,而將另一聲道完全混頻到立體聲下混頻信號62的另一聲道中。然而,對于每個片92還可以存在聲道聲級差(CLD)參數,所述聲道聲級差(CLD)參數指示上述左聲道與右聲道之間的聲級差。可以對CLD參數應用對數標度的非均勻量化,其中當聲道之間存在較大的聲級差時,非均勻量化具有接近零dB的高精度以及較粗糙的分辨率。此外,在空間參數64內可以存在其他參數。這些參數可以尤其地限定用于通過混頻來形成上述左聲道和右聲道的聲道(如,左后方聲道、左前方聲道、右后方聲道和右前方聲道)有關的CLD和ICC。
[0053]應注意,上述實施例可以彼此相組合。以上已經提到了一些組合可能性。下文中將關于圖7至13的實施例來描述其他可能性。此外,圖1和5的前述實施例分別假定設備內實際存在中間聲道20、66和68。然而,情況并不必須如此。例如,通過省去相似性減小器12,可以使用由圖2的設備得到的修改后的HRTF來限定圖1的方向濾波器,在這種情況下,通過在時間/頻率參數分辨率92內合適地組合空間參數和修改后的HRTF,并相應地應用所得到的線性組合系數以形成雙耳信號22a和22b,圖1的設備可以對表示多個聲道18a_18d的下混頻信號(如圖5所示的下混頻信號62)起作用。
[0054]類似地,下混頻發生器42可以被配置為適當地組合空間參數64以及針對中心聲道要實現的聲級降低量,以得到用于房間處理器44的單聲道或立體聲下混頻48。圖7示出了根據實施例的雙耳輸出信號發生器。通常以附圖標記100來表示的發生器包括多聲道解碼器102、雙耳輸出104以及分別在多聲道解碼器102與雙耳輸出之間延伸的兩個路徑,即,直接路徑106和回響路徑108。在直接路徑中,方向濾波器110連接至多聲道解碼器102的輸出。直接路徑還包括由加法器112組成的第一加法器組以及由加法器114組成的第二加法器組。加法器112對前一半方向濾波器110的輸出信號進行求和,第二加法器114對后一半方向濾波器114的輸出信號進行求和。第一加法器112和第二加法器114的求和后的輸出表示雙耳輸出信號22a和22b的前述直接路徑貢獻。提供加法器116和118,以將貢獻信號22a和22b與回響路徑108提供的雙耳貢獻信號(即,信號46a和46b)相組合。在回響路徑10)8中,混頻器120和房間處理器122串聯在多聲道解碼器102的輸出與加法器116和118的相應輸入之間,加法器116和118的輸出限定了在輸出104處輸出的雙耳
輸出信號。
[0055]為了易于理解圖7的設備的以下描述,在圖1至6中使用的附圖標記部分地用于表示圖7中與圖1至6中出現的元件相對應或用于執行圖1至6中出現的元件的功能的元件。在以下描述中,相應的描述將更清楚。然而應注意,為了易于以下描述,在假定相似性減小器執行相關性減小的前提下描述了以下實施例。相應地,在下文中相似性減小器是指相關性減小器。然而從上文中可以清楚看出,以下概述的實施例完全可以用于相似性減小器執行相似性降低而不是相關性減小的情況。此外,在假定用于針對房間處理產生下混頻的混頻器產生中心聲道聲級降低的情況下,起草了下述實施例,然而如上所述,這完全可以應用于備選實施例。
[0056]圖7的設備使用信號流從解碼后的多聲道信號124在輸出104處產生耳機輸出。多聲道解碼器102根據比特流輸入126處的比特流輸入得到解碼后的多聲道124,例如通過空間音頻解碼來得到。在解碼之后,由方向濾波器110組成的方向濾波器對對解碼后的多聲道信號124的每個信號或聲道進行濾波。例如,方向濾波器20DirFilter (I, L)和DirFilteHl,R)對解碼后的多聲道信號124的第一(上)聲道進行濾波,方向濾波器DirFilter (2, L)和DirFilter (2,R)對聲道第二(從頂部起第二個)信號或聲道進行濾波,等等。這些濾波器110可以對從房間內虛擬聲源到收聽者耳道的聲傳輸(所謂的雙耳房間傳遞函數(BRTF))進行建模。這些濾波器110可以執行時間、聲級和譜修改,并且還可以部分地對房間反射和回響進行建模。可以在時域或頻域實現方向濾波器110。由于可能需要許多個(NX 2,其中N是解碼聲道的個數)濾波器110,所以如果這些方向濾波器應當對房間反射和回響完整地建模,則這些方向濾波器可以相當長,即,在44.1kHz下20000個濾波器抽頭,在這種情況下濾波過程需要非常大的計算量。有利地將方向濾波器110減至最小,所謂的頭部相關傳遞函數(HRTF)和公共處理模塊122用于對房間反射和回響進行建模。房間處理模塊122可以在時域或頻域實現回響算法,并且可以根據一個或兩個聲道輸入信號48進行操作,所述一個或兩個聲道輸入信號48是通過混頻器120內的混頻矩陣根據解碼后的多聲道輸入信號124來計算的。房間處理模塊實現房間反射和/或回響。房間反射和回響對于定位聲音來說是重要的,尤其是在距離和外化(意味著在收聽者頭部的外部感知到聲音)方面。
[0057]典型地,產生多聲道聲音,使得主要聲音能量包含在前聲道中,即,左前、右前、中心。電影對白和音樂中的話音典型地被混頻到中心聲道。如果中心聲道信號被饋送至房間處理模塊122,則通常將合成的輸出不自然地感知為回響和頻譜上不等。因此,根據圖7的實施例,將中心聲道以顯著的聲級降低(如,衰減了 6dB)饋送至房間處理模塊122,如上所述,所述聲級降低是在混頻器120內執行的。到目前為止,圖7的實施例包括根據圖3和5的配置,其中圖7的附圖標記102、124、120和122分別對應于圖3和5中的附圖標記18、64 ;附圖標記66和68的組合;附圖標記66 ;和附圖標記44。
[0058]圖8示出了根據另一實施例的另一雙耳輸出信號發生器。該發生器總體上由附圖標記140來表示。為了易于描述圖8,使用了與圖7中的附圖標記相同的附圖標記。為了表明混頻器120并不必須具有如圖3、5和7的實施例中指示的功能(即,執行關于中心聲道的聲級降低),使用附圖標記40’來分別表示方框102、120和122的布置。換言之,混頻器122內的聲級降低在圖8的情況下是可選的。然而與圖7不同,分別在每對方向濾波器110與針對解碼后多聲道信號124的相關聲道的解碼器102的輸出之間連接去相關器。用附圖標記142” 1422、等等來表不去相關器。去相關器142” 1422用作圖1所不的相關減小器12。僅如圖8所示,但是不必為解碼后的多聲道信號124的每個聲道提供去相關器142^144。而是,一個去相關性就足以。去相關器142可以簡單地是延遲。優選地,每個延遲142^14?所引起的延遲量可以互不相同。另一種可能是,去相關器142^14?還可以是全通濾波器,即,具有傳遞函數的濾波器,其中該傳遞函數的幅度恒定為1,但相應聲道譜分量的相位變化。優選地去相關器142^14?所引起的相位修改針對每個聲道而不同。當然也可以存在其他情況。例如,去相關器142^14?可以被實現為FIR濾波器等等。
[0059]因此,根據圖8的實施例,元件142^142^ 110、112和114根據圖1的設備10來操作。
[0060]類似于圖8,圖9示出了圖7的雙耳輸出信號發生器的變體。因此,還使用與圖7所用附圖標記相同的附圖標記來說明圖9。與圖8的實施例相類似,混頻器122的聲級降低僅在圖9的情況下是可選的,因此圖9中的附圖標記是40’,而不是像圖7中一樣是’40。圖9的實施例解決了在多聲道聲音產生過程中所有聲道之間存在顯著相關性的問題。在利用方向濾波器110處理了多聲道信號之后,加法器122和144對每個濾波器對的二聲道中間信號進行求和,以在輸出104處形成耳機輸出信號。加法器112和114對相關的輸出信號進行求和導致輸出104處的輸出信號的空間寬度極大減小并且缺乏外化。這對于解碼后的多聲道信號124內左右信號和中心聲道的相關性而言是尤為成問題的。根據圖9的實施例,方向濾波器被配置為盡可能具有去相關的輸出。為此,圖9的設備包括設備30,所述設備30用于根據某一原始HRTF集合來形成要由方向濾波器110使用的彼此間相關性減小、HRTF集合。如上所述,關于與解碼后多聲道信號124的一個或多個聲道相關聯的方向濾波器對的HRTF,設備30可以 使用以下技術之一或以下技術的組合:
[0061]例如通過對濾波器的脈沖響應進行移位(例如通過對濾波器抽頭進行移位),對方向濾波器或相應的方向濾波器對進行延遲;
[0062]修改相應方向濾波器的相位響應;以及
[0063]對相應聲道的相應方向濾波器應用諸如全通濾波器之類的去相關濾波器。這樣的全通濾波器可以被實現為FIR濾波器。
[0064]如上所述,設備30可以響應于在比特流輸入126處的比特流所針對的揚聲器配置的改變來工作。
[0065]圖7至9的實施例關注于解碼后的多聲道信號。以下實施例涉及麥克風的參數多聲道解碼。
[0066]總體來說,空間音頻解碼是一種多聲道壓縮技術,該技術采用多聲道音頻信號中的感知性聲道間不相關性來實現更高的壓縮率。可以在空間提示或空間參數(即,對多聲道音頻信號的空間圖像加以描述的參數)方面實現這一點。空間提示典型地包括聲級/強度差、相位差以及聲道之間相關性/相關性的度量,并且可以以非常緊湊的方式來表示。空間音頻編碼的構思已被產生MPEG環繞標準(即,IS0/IEC23003-1)的MPEG所采用。空間參數(如,空間音頻編碼中采用的空間參數)還可以用于描述方向濾波器。通過這么做,可以將解碼空間音頻數據與應用方向濾波器的步驟相組合,以高效地解碼并呈現用于耳機再現的多聲道音頻。
[0067]圖10中給出了針對耳機輸出的空間音頻解碼器的一般結構。圖10的解碼器一般用附圖標記200來表示,并且包括雙耳空間子頻帶修改器202,所述雙耳空間子頻帶修改器202包括:針對立體聲或單聲道下混頻信號204的輸入、針對空間參數206的另一輸入、以及針對雙耳輸出信號208的輸出。下混頻信號與空間參數206 —起構成前述多聲道信號18,并且表示所述多聲道信號18的多個聲道。
[0068]內部地,子頻帶修改器202包括以上述順序連接在下混頻信號輸入與子頻帶修改器202的輸出之間的分析濾波器組208、矩陣化單元或線性組合器210、以及合成濾波器組212。此外,子頻帶修改器202包括參數轉換器214,由空間參數206和如設備30所得到的修改后的HRTF集合來饋送該參數轉換器214。
[0069]在圖10中,假定下混頻信號之前已被解碼,包括例如熵編碼。為雙耳空間音頻解碼器饋送下混頻信號204。參數轉換器214使用空間參數206以及以修改后HRTF參數216的形式對方向濾波器的參數描述,來形成雙耳參數218。矩陣化單元210以2X2矩陣(在立體聲下混頻信號的情況下)以及1X2矩陣(在單聲道下混頻信號204的情況下)的形式在頻域將這些參數218應用于分析濾波器組208 (參見圖6)所輸出的譜值88。換言之,雙耳參數218在圖6所示的時間/頻率參數分辨率92方面變化,并且應用于每個采樣值88。可以使用內插分別將矩陣系數和雙耳參數218從較粗略的時間/頻率參數域92平滑到分析濾波器組208的時間/頻率分辨率。即,在立體聲下混頻204的情況下,單元210執行的矩陣化針對由下混頻信號204的左聲道的采樣值與下混頻信號204的右聲道的相應采樣值組成的每一個采樣值對,產生兩個采樣值。產生的兩個采樣值分別是雙耳輸出信號208的左聲道和右聲道的一部分。在單聲道下混頻信號2(4的情況下,單元210執行的矩陣化針對由單聲道下混頻信號204每個采樣值,產生兩個采樣值,即,一個采樣值針對雙耳輸出信號208的左聲道,另一個采樣值針對雙耳輸出信號208的右聲道。雙耳參數218限定了從下混頻信號204的一個或兩個采樣值到雙耳輸出信號208的相應左聲道采樣值和右聲道采樣值的矩陣運算。雙耳參數218已經反映了修改后的HRTF參數。因此,雙耳參數218如上所述將多聲道信號18的輸入聲道去相關。
[0070]因此,矩陣化單元210的輸出是如圖6所示的修改后的譜圖。合成濾波器組212根據該修改后的光譜圖來重構雙耳輸出信號208。換言之,合成濾波器組212將矩陣化單元210產生的二聲道信號輸出轉換到時域。當然,這是可選的。
[0071]在圖10的情況下,不分別處理房間反射和回響效應。如果有的話,必須在HRTF216中考慮這些效應。圖11示出了將雙耳空間音頻解碼器200’與單獨的房間反射/回響處理相結合的雙耳輸出信號發生器。圖11中的附圖標記200’表示圖11的雙耳空間音頻解碼器200’可以使用修改后的HRTF,S卩,如圖2所示的原始HRTF。然而可選地,圖11的雙耳空間音頻解碼器200’可以是圖10所示的雙耳空間音頻解碼器。在任何情況下,除了雙耳空間解碼器200’以外,圖11中通常以附圖標記230來表示的雙耳輸出信號發生器都還包括下混頻音頻解碼器232、修改后的空間音頻子頻帶修改器234、房間處理器122以及兩個加法器116和118。下混頻音頻解碼器232連接在比特流輸入126與雙耳空間解碼器200’的雙耳空間音頻子頻帶修改器202之間。下混頻音頻解碼器232被配置為對輸入126處的比特流輸入進行解碼,以得到下混頻信號214和空間參數206。除了空間參數206以外,還向雙耳空間音頻子頻帶修改器202以及修改后的空間音頻子頻帶修改器234提供下混頻信號204。修改后的空間音頻子頻帶修改器234利用空間參數206以及修改后的參數236根據下混頻信號204來計算用作房間處理器122的輸入的單聲道或立體聲下混頻48,其中所述修改后的參數236反映了上述中心聲道的聲級降低量。加法器116和118逐個聲道地對雙耳空間音頻子頻帶修改器202和房間處理器122的貢獻輸出進行求和,以在輸出238處產生雙耳輸出信號。
[0072]圖12示出了圖11的雙耳解碼器200’的功能的框圖。應注意,圖12沒有示出圖11的雙耳空間解碼器200’的實際內部結構,而是示出了雙耳空間解碼器200’得到的信號修改。已經提到過,雙耳空間解碼器200’的內部結構通常符合圖10所示的結構,與圖10所示結構的區別在于,當雙耳空間解碼器200’以原始HRTF來工作時,可以省略設備30。此夕卜,圖12示例性地針對雙耳空間解碼器200’使用由多聲道信號18表示的僅三個聲道以形成雙耳輸出信號208的情況,示出了雙耳空間解碼器200’的功能。具體地,“2至3”即,TTT盒(box)用于從立體聲下混頻204的兩個聲道中得到中心聲道242、右聲道244和左聲道246。換言之,圖12示例性地假定下混頻204是立體聲混頻。TTT盒248所使用的空間參數206包括上述聲道預測系數。圖12中由延遲L、延遲R和延遲C來表示的三個去相關器實現了相關性減小。這三個去相關器與例如圖1和7的情況下引入的去相關相對應。然而,同樣已經提到過,盡管實際結構與圖10所示的相對應,但圖12僅示出了由雙耳空間解碼器200’實現的信號修改。因此,盡管相對于形成方向濾波器14的HRTF,將形成相關性減小器12的延遲示為單獨的特征,然而相關性減小器12中延遲的存在可以被看作是HRTF參數的修改,其中這些HRTF參數形成圖12的方向濾波器14的原始HRTF。首先,圖12僅示出了雙耳空間解碼器200’針對耳機再現將聲道去相關。通過簡單的方式,即,通過在矩陣M和雙耳空間解碼器200’的參數處理中添加延遲模塊,實現了去相關。因此,雙耳空間解碼器200’可以對單獨的聲道應用以下修改,即:
[0073]優選地將中心聲道延遲至少一個采樣,
[0074]在每個頻帶中以不同的間隔來延遲中心聲道,
[0075]優選地左聲道和右聲道延遲至少一個采樣,和/或
[0076]在每個頻帶中以不同的間隔來延遲左聲道和右聲道。
[0077]圖13示出了圖11的修改后的空間音頻子頻帶修改器的結構的示例。圖13的子頻帶修改器234包括2至3或TTT盒262、加權級264a_264e、第一加法器266a和266b、第二加法器268a和268b、針對立體聲下混頻204的輸入、針對空間參數206的輸入、針對殘差信號270的另一輸入、以及針對下混頻48的輸出,其中下混頻48由房間處理器來處理,根據圖13,下混頻48是立體聲信號。
[0078]圖13在結構上限定了修改后的空間音頻子頻帶修改器234的實施例,圖13的TTT盒262僅通過使用空間參數206根據立體聲下混頻204來重構中心聲道、右聲道244和左聲道246。同樣已經提到過,在圖12的情況下,實際上并不計算聲道242-246。相反,雙耳空間音頻子頻帶修改器修改矩陣M,使得將立體聲下混頻信號204直接轉變成反映HRTF的雙耳貢獻。然而,圖13的TTT盒206實際上執行重構。可選地,如圖13所示,當基于立體聲下混頻204和空間參數206來重構聲道242-246時,TTT盒262可以使用反映預測殘差的殘差信號270,如上所述,殘差信號包括聲道預測系數以及可選地ICC值。第一加法器266a被配置為將聲道242-246相加,以形成立體聲下混頻48的左聲道。具體地,加法器266a和266b形成加權和,其中加權值由加權級264a、264b、264c和264e來限定,加權級264a、264b、264c和264e可以對相應的聲道246至242應用相應的加權值和EQa。類似地,加法器268a和268b形成聲道246至242的加權和,其中加權級264b、264d和264e形成加權值,力口權和形成立體聲下混頻48的右聲道。
[0079]如上所述,選擇加權級264a_264e的參數270,使得實現立體聲下混頻48中的上述中心聲道聲級降低,從而如上所述產生關于自然聲音感知的優點。
[0080]因此,換言之,圖13示出了可以與圖12的雙耳空間解碼器200’相結合應用的房間處理模塊。在圖13中,下混頻信號204用于饋送該模塊。下混頻信號204包含多聲道信號的所有信號,以能夠提供立體聲加兼容性。如上所述,希望為房間處理模塊饋送僅包含減小的中心信號在內的信號。圖13的修改后的空間音頻子頻帶修改器用于執行這種聲級降低。具體地,根據圖13,可以使用殘差信號270,以重構中心、左和右聲道242-246。中心、左和右聲道242-246的殘差信號可以由下混頻音頻解碼器232來解碼,盡管圖11中未示出。可以針對左、右和中心聲道242-246將加權級264a-264e所應用的EQ參數和加權值實值化。可以存儲和應用針對中心聲道242的單個參數集合,根據圖13,示例性地將中心聲道相等地混頻到立體聲下混頻48的左和右輸出。
[0081]饋送到修改后的空間音頻子頻帶修改器234中的EQ參數270可以具有以下特性。首先,優選地可以使中心聲道信號衰減至少6dB。此外,中心聲道信號可以具有低通特性。此外,可以在低頻下提高其余聲道的差信號。為了補償中心聲道242相對于其他聲道244和246而言較低的電平,應當相應地增大在雙耳空間音頻子頻帶修改器202中使用的針對中心聲道的HRTF參數的增益。
[0082]設定EQ參數的主要目的是減小在用于房間處理模塊的輸出中的中心聲道信號。然而,僅應將中心聲道抑制到有限程度:在TTT盒內從左下混頻聲道和右下混頻聲道減去中心聲道信號。如果降低了中心聲級,則左和右聲道中的偽跡可以變得可聽。因此,EQ級中的中心聲級降低是在抑制與偽跡之間的折衷。能夠尋求對EQ參數的固定設定,但這并不是對所有信號而言都是最優的。相應地,根據實施例,可以使用自適應算法或模塊274利用以下參數之一或以下參數的組合來控制中心聲級降低的量:
[0083]可以如虛線276所指示的來使用空間參數206,其中空間參數206用于在TTT盒262內根據左和右下混頻聲道204來解碼中心聲道242。
[0084]還可以如虛線278所指示的來使用中心聲道、左聲道和右聲道的聲級。
[0085]還可以如虛線278所指示的來使用中心聲道、左聲道和右聲道242-246之間的聲級差。
[0086]還可以如虛線278所指示的來使用單一類型檢測算法的輸出,如,話音活動性檢測器。
[0087]最后,如虛線280所指示的,可以使用對音頻內容加以描述的動態元數據的靜態,以確定中心聲級降低的量。
[0088]盡管在設備的上下文中描述了一些方面,然而應清楚,這些方面還展現了相應方法的描述,其中模塊或設備與方法步驟或方法步驟的特征相對應。類似地,在方法步驟的上下文中描述的方面也展現了對相應設備的相應模塊或項目或特征的描述,如,ASIC的一部分、程序代碼的子例程、或已編程的可編程邏輯的一部分。
[0089]本發明的已編碼音頻信號可以存儲在數字存儲介質上,或者可以在諸如無線傳輸介質或有線傳輸介質(如,互聯網)之類的傳輸介質上傳輸。
[0090]根據特定的實現需求,可以以硬件或軟件的形式來實現本發明。可以使用數字存儲介質(例如,軟盤、DVD、CD、ROM、PROM、EPROM、EEPROM或閃存)來執行這些實現,其中所述數字存儲介質上存儲有電可讀控制信號,所述電可讀控制信號與可編程計算機系統協作(或能夠與可編程計算機系統協作),使得執行相應的方法。
[0091]根據本發明的一些實施例包括一種數據載體,所述數據載體具有電可讀控制信號,所述電可讀控制信號能夠與可編程計算機系統協作,使得執行本文描述的方法之一。
[0092]通常,可以將本發明的實施例實現為具有程序代碼的計算機程序產品,所述程序代碼操作用于在所述計算機程序產品在計算機上運行時執行方法之一。所述程序代碼可以例如存儲在機器可讀載體上。
[0093]其他實施例包括存儲在機器可讀載體上的、用于執行本文描述的方法之一的計算機程序。
[0094]因此換言之,本發明方法的實施例是一種具有程序代碼的計算機程序,所述程序代碼用于當所述計算機程序在計算機上運行時執行本文描述的方法之一。
[0095]因此,本發明方法的另一實施例是一種數據載體(或數據存儲介質、或計算機可讀介質),包括存儲在該數據載體上的計算機程序,所述計算機程序用于執行本文描述的方
法之一。
[0096]因此,本發明方法的另一實施例是一種數據流或信號序列,所述數據流或信號序列表示用于執行本文描述的方法之一的計算機程序。所述數據流或信號序列可以例如被配置為經由數據通信連接來傳遞,例如經由互聯網來傳遞。
[0097]另一實施例包括一種處理裝置,例如計算機或可編程邏輯器件,所述處理裝置被配置為適于執行本文描述的方法之一。
[0098]另一實施例包括一種計算機,在所述計算機上安裝有用于執行本文描述的方法之一的計算機程序。
[0099]在一些實施例中,可以使用一種可編程邏輯器件(例如,現場可編程門陣列)來執行本文描述的方法的一些或全部功能。在一些實施例中,現場可編程門陣列可以與微處理器協作,以執行本發明描述的方法之一。通常,方法優選地由任何硬件設備來執行。
[0100]上述實施例僅僅用于說明本發明的原理。應理解,對于本領域技術人員來說,對本文描述的布置和細節的修改和改變是顯而易見的。因此,本發明僅由所附權利要求的范圍來限定,而不由本文中通過描述和說明實施例而提供的特定細節來限定。
【權利要求】
1.一種用于基于多聲道信號來產生雙耳信號的與房間反射/回響有關的貢獻的設備,所述多聲道信號表示多個聲道并且用于由揚聲器配置來再現,所述揚聲器配置具有與每個聲道相關聯的虛擬聲源位置,所述設備包括: 下混頻發生器,用于形成多聲道信號的聲道的單聲道或立體聲下混頻;以及 房間處理器,用于基于單聲道或立體聲下混頻通過對房間反射/回響進行建模,來產生雙耳信號的與房間反射/回響有關的貢獻, 其中,下混頻發生器被配置為形成單聲道或立體聲下混頻,使得所述多個聲道以在多聲道信號的至少兩個聲道之間不同的聲級,對單聲道或立體聲下混頻作出貢獻, 其中,下混頻發生器被配置為形成單聲道或立體聲下混頻,使得所述多個聲道中的中心聲道相對于多聲道信號的其他聲道而言以聲級降低的方式來對單聲道或立體聲下混頻作出貢獻。
2.根據權利要求1所述的設備,其中,下混頻發生器被配置為通過空間音頻編碼,根據下混頻信號以及對所述多個聲道之間的聲級差、相位差、時間差和/或相關性度量加以描述的關聯空間參數,來重構所述多個聲道。
3.根據權利要求2所述的設備,其中,下混頻發生器被配置為執行所述形成,使得至少兩個聲道中的第一聲道相對于該至少兩個聲道中的第二聲道而言,聲級降低的量取決于空間參數。
4.根據權利要求2所述的設備,其中,下混頻發生器被配置為通過空間音頻編碼,根據立體聲下混頻信號、聲道預測系數和殘差信號(270),來重構所述多個聲道,其中所述聲道預測系數描述如何將立體聲下混頻信號的聲道線性地組合以預測中心聲道、左聲道和右聲道構成的三元組,所述殘差信號(270)反映了預測三元組時的預測殘差。
5.根據權利要求1至4中任一項所述的設備,其中,下混頻發生器被配置為執行所述形成,使得至少兩個聲道中的第一聲道相對于該至少兩個聲道中的第二聲道而言,聲級降低的量取決于所述多個聲道的各個單獨聲道之間的聲級差和/或相關性。
6.根據權利要求5所述的設備,其中,下混頻發生器被配置為基于與下混頻信號一起表示所述多個聲道的空間參數,來獲得所述多個聲道的各個單獨聲道之間的聲級差和/或相關性。
7.根據權利要求1至4中任一項所述的設備,其中,下混頻發生器被配置為執行所述形成,使得至少兩個聲道中的第一聲道相對于該至少兩個聲道中的第二聲道而言,聲級降低的量隨時間變化,如在多聲道信號的輔助信息內傳輸的時間變化指示符所指示的一樣。
8.根據權利要求1所述的設備,所述設備還包括: 信號類型檢測器,用于檢測多聲道信號內的語音階段和非語音階段,其中,下混頻發生器被配置為執行所述形成,使得與在非語音階段期間相比,在語音階段期間聲級降低的量更高。
9.一種用于基于多聲道信號來產生雙耳信號的與房間反射/回響有關的貢獻的方法,所述多聲道信號表示多個聲道并且用于由揚聲器配置來再現,所述揚聲器配置具有與每個聲道相關聯的虛擬聲源位置,所述方法包括: 形成多聲道信號的聲道的單聲道或立體聲下混頻;以及 基于單聲道或立體聲下混頻通過對房間反射/回響進行建模,來產生雙耳信號的與房間反射/回響有關的貢獻, 其中,下混頻發生器被配置為形成單聲道或立體聲下混頻,使得所述多個聲道以在多聲道信號的至少兩個聲道之間不同的聲級,對單聲道或立體聲下混頻作出貢獻, 其中,執行形成單聲道或立體聲下混頻,使得所述多個聲道中的中心聲道相對于多聲道信號的其他聲道而言,以聲級降低的方式來對單聲道或立體聲下混頻作出貢獻。
10.一種用于基于多聲道信號來產生雙耳信號的與房間反射/回響有關的貢獻的設備,所述多聲道信號表示多個聲道并且用于由揚聲器配置來再現,所述揚聲器配置具有與每個聲道相關聯的虛擬聲源位置,所述設備包括: 下混頻發生器,用于形成多聲道信號的聲道的單聲道或立體聲下混頻;以及房間處理器,用于基于單聲道或立體聲下混頻通過對房間反射/回響進行建模,來產生雙耳信號的與房間反射/回響有關的貢獻, 其中,下混頻發生器被配置為形成單聲道或立體聲下混頻,使得所述多個聲道以在多聲道信號的至少兩個聲道之間不同的聲級,對單聲道或立體聲下混頻作出貢獻, 其中,下混頻發生器被配置為通過空間音頻編碼,根據下混頻信號以及對所述多個聲道之間的聲級差、相位差、時間差和/或相關性度量加以描述的關聯空間參數,來重構所述多個聲道;以及 其中,下混頻發生器被配置為執行所述形成,使得至少兩個聲道中的第一聲道相對于該至少兩個聲道中的第二聲道而言,聲級降低的量取決于空間參數。
11.一種用于基于多聲道信號來產生雙耳信號的與房間反射/回響有關的貢獻的方法,所述多聲道信號表示多個聲道并且用于由揚聲器配置來再現,所述揚聲器配置具有與每個聲道相關聯的虛擬聲源位置,所述方法包括: 形成多聲道信號的聲道的單聲道或立體聲下混頻;以及 基于單聲道或立體聲下混頻通過對房間反射/回響進行建模,來產生雙耳信號的與房間反射/回響有關的貢獻, 其中,下混頻發生器被配置為形成單聲道或立體聲下混頻,使得所述多個聲道以在多聲道信號的至少兩個聲道之間不同的聲級,對單聲道或立體聲下混頻作出貢獻, 其中,所述方法還包括:通過空間音頻編碼,根據下混頻信號以及對所述多個聲道之間的聲級差、相位差、時間差和/或相關性度量加以描述的關聯空間參數,來重構所述多個聲道;以及 其中,執行所述形成,使得至少兩個聲道中的第一聲道相對于該至少兩個聲道中的第二聲道而言,聲級降低的量取決于空間參數。
12.一種用于基于多聲道信號來產生雙耳信號的與房間反射/回響有關的貢獻的設備,所述多聲道信號表示多個聲道并且用于由揚聲器配置來再現,所述揚聲器配置具有與每個聲道相關聯的虛擬聲源位置,所述設備包括: 下混頻發生器,用于形成多聲道信號的聲道的單聲道或立體聲下混頻;以及房間處理器,用于基于單聲道或立體聲下混頻通過對房間反射/回響進行建模,來產生雙耳信號的與房間反射/回響有關的貢獻, 其中,下混頻發生器被配置為形成單聲道或立體聲下混頻,使得所述多個聲道以在多聲道信號的至少兩個聲道之間不同的聲級,對單聲道或立體聲下混頻作出貢獻,其中,下混頻發生器被配置為執行所述形成,使得至少兩個聲道中的第一聲道相對于該至少兩個聲道中的第二聲道而言,聲級降低的量取決于所述多個聲道的各個單獨聲道之間的聲級差和/或相關性, 或者使得至少兩個聲道中的第一聲道相對于該至少兩個聲道中的第二聲道而言,聲級降低的量隨時間變化,如在多聲道信號的輔助信息內傳輸的時間變化指示符所指示的一樣。
13.一種用于基于多聲道信號來產生雙耳信號的與房間反射/回響有關的貢獻的方法,所述多聲道信號表示多個聲道并且用于由揚聲器配置來再現,所述揚聲器配置具有與每個聲道相關聯的虛擬聲源位置,所述方法包括: 形成多聲道信號的聲道的單聲道或立體聲下混頻;以及 基于單聲道或立體聲下混頻通過對房間反射/回響進行建模,來產生雙耳信號的與房間反射/回響有關的貢獻, 其中,下混頻發生器被配置為形成單聲道或立體聲下混頻,使得所述多個聲道以在多聲道信號的至少兩個聲道之間不同的聲級,對單聲道或立體聲下混頻作出貢獻, 其中,執行所述形成,使得至少兩個聲道中的第一聲道相對于該至少兩個聲道中的第二聲道而言,聲級降低的量取決于所述多個聲道的各個單獨聲道之間的聲級差和/或相關性, 或者使得至少兩個聲道中的第一聲道相對于該至少兩個聲道中的第二聲道而言,聲級降低的量隨時間變化,如在多聲道信號的輔助信息內傳輸的時間變化指示符所指示的一樣。
14.一種用于基于多聲道信號來產生雙耳信號的與房間反射/回響有關的貢獻的設備,所述多聲道信號表示多個聲道并且用于由揚聲器配置來再現,所述揚聲器配置具有與每個聲道相關聯的虛擬聲源位置,所述設備包括: 下混頻發生器,用于形成多聲道信號的聲道的單聲道或立體聲下混頻;以及房間處理器,用于基于單聲道或立體聲下混頻通過對房間反射/回響進行建模,來產生雙耳信號的與房間反射/回響有關的貢獻, 其中,下混頻發生器被配置為形成單聲道或立體聲下混頻,使得所述多個聲道以在多聲道信號的至少兩個聲道之間不同的聲級,對單聲道或立體聲下混頻作出貢獻, 其中,所述設備還包括: 信號類型檢測器,用于檢測多聲道信號內的語音階段和非語音階段,其中,下混頻發生器被配置為執行所述形成,使得與在非語音階段期間相比,在語音階段期間聲級降低的量更高。
15.一種用于基于多聲道信號來產生雙耳信號的與房間反射/回響有關的貢獻的方法,所述多聲道信號表示多個聲道并且用于由揚聲器配置來再現,所述揚聲器配置具有與每個聲道相關聯的虛擬聲源位置,所述方法包括: 形成多聲道信號的聲道的單聲道或立體聲下混頻;以及 基于單聲道或立體聲下混頻通過對房間反射/回響進行建模,來產生雙耳信號的與房間反射/回響有關的貢獻, 其中,下混頻發生器被配置為形成單聲道或立體聲下混頻,使得所述多個聲道以在多聲道信號的至少兩個聲道之間不同的聲級,對單聲道或立體聲下混頻作出貢獻, 其中,所述方法還包括: 檢測多聲道信號內的語音階段和非語音階段,其中,執行形成,使得與在非語音階段期間相比,在語音階段期間聲 級降低的量更高。
【文檔編號】H04S7/00GK103634733SQ201310481493
【公開日】2014年3月12日 申請日期:2009年7月30日 優先權日:2008年7月31日
【發明者】哈拉爾德·蒙特, 伯恩哈德·諾伊格鮑爾, 約翰內斯·希爾珀特, 安德烈亞斯·悉塞勒, 珍·普洛斯提斯 申請人:弗勞恩霍夫應用研究促進協會