專利名稱:音頻錄音的自適應動態范圍增強的制作方法
技術領域:
本發明一般涉及音頻信號處理,更特別地,涉及通過恢復或強調音頻流和錄音的 動態范圍來增強它們。
背景技術:
遵照格言“聲音越大越好”,在唱片業中以更高水平的響度灌錄(master)和發行 唱片成為一般慣例。伴隨諸如CD的數字媒體格式的出現,用通過可用于代表編碼信號的比 特數限定的最大峰值電平將音樂編碼。在達到CD的最大振幅時,通過諸如多頻帶動態范圍 壓縮、峰值限制和均衡化的信號處理技術,仍可進一步增加響度感知。通過使用這種數字灌 錄工具,錄音師可通過壓縮瞬態峰值(諸如鼓擊)并增加得到的信號的增益使平均信號電平 最大化。極度使用動態范圍壓縮可將削波和其它可聽到的畸變引入到錄音的波形中。使用 這種極度動態范圍壓縮的現代唱片集因此以犧牲音樂再現的質量來得到響度。增加音樂發 行物的響度以匹配競爭發行物的實踐可具有兩種效果。由于存在可用于錄音的最大響度級 (與響度受回放揚聲器和放大器限制的回放相反),提升歌曲或音軌的總響度最終產生從開 始到結束最大并且均勻地響亮的片段。這產生具有小的動態范圍(在大聲部分和安靜部分 存在很小的差異)的音樂,這種效果常常被視為藝術家創作表現的疲勞和空白。另一可能的效果是畸變。在數字領域中,它通常被稱為削波。數字媒體不能輸出比 數字滿刻度高的信號,因此不管信號的峰值什么時候被按過該點,這都導致變得被削波的 波形。當出現這種情況時,它有時可產生可聽的卡嗒聲。但是,類似鼓擊的某些聲音將僅對 于非常短的時間達到它們的峰值,并且,如果該峰值遠比信號的其余部分聲音大,那么該卡 嗒聲將不被聽到。在許多的情況下,鼓擊的峰值被削波,但是它不被隨意的收聽者檢測到。圖la和圖lb提供有害的灌錄技術的視覺呈現。圖la和圖lb所不的首頻錄首 波形代表原始灌錄音軌和已經通過使用不同的技術灌錄的同一版本的音軌。圖la表示原 始錄音,大量峰值的存在表示代表存在于原始性能中的各種類型的力度(dynamics)的高動 態范圍。由于諸如鼓擊的某些敲擊節拍聽起來將是有力并且清楚的,因此該錄音提供振動 收聽體驗。相反,在圖lb中示出的錄音被重新灌錄以用于更大聲的商業CD發行。存在于 原始錄音中的大多數峰值被壓縮或者甚至被削波,并且,作為結果,錄音的動態范圍已經受損。在商業音樂的灌錄階段越來越侵略性地使用動態范圍壓縮已經產生大量來自消費者、 制作者和藝術家的強烈反對。音頻行業為解決該問題所討論的方法集中于討論處于問題本源的灌錄技術。在 Bob Katz.的Mastering Audio, Second Edition:The Art and the Science 中描述了這樣 的一個例子。Katz描述了如何可通過使用處理信號的校準監視以及使用更多適度的壓縮 參數在不使最終的結果畸變的情況下對于響度灌錄唱片。而大多數的灌錄工程師會同意, Katz的方法常常被播音室管理的需求取代。即使更保守的灌錄技術變為新的標準,它也解 決不了已被灌錄并分發給最終用戶的現有錄音的主要部分的問題。用于修改音頻錄音的力度的現有處理技術在現有技術中是已知的。一種這種處理 是響度調平(leveling),其中經受不同程度動態范圍壓縮的音頻材料的覺察響度之間的差 值被歸一化為某預定水平。但是,這些方法被用于將從各種源播放的連續音軌的平均響度 歸一化,并且不進行任何嘗試以恢復過度動態范圍壓縮內容的動態范圍。作為結果,當在更 低的規定收聽級別上被播放時,壓縮媒體可更加不發出動態表現的聲音。另一已知的技術是,如在授權給Bench的發明名稱為Dynamic Expander的美國專 利No. 3,978,423中描述的那樣,應用向上擴展器(upward expander)。向上擴展器根據固 定“擴展曲線”向音頻信號施加時間變化增益,由此輸出信號電平比高于選擇的閾值的輸入 電平大。作為結果,源信號的較大聲音部分的振幅增加。但是,這可在輸出信號中導致具有 過分強調的瞬態的原本動態的聲道(sound track)。另一已知的技術是當檢測到瞬態時提升較低和較高頻帶的動態譜均衡 化。作為結果,產生更動態的輸出。在以下的文獻中描述了動態譜均衡化X Rodet, F Jaillet, Detection and Modeling of Fast Attack Transients (2001), Proceedings of the International Computer Music Conference ;授權給 Goodwin 等的發明名稱為 Transient Detection and Modification in Audio Signals 的美國專利 No. 7, 353, 169 ; 和授權給Avendano等的發明名稱為Method for Enhancing Audio Signals的美國專利申 請No. 11/744,465。與前面的方法不同,這些動態增強技術專門地影響信號瞬態。但是,它 影響所有的信號瞬態,甚至是已表現出高力度的那些信號瞬態。動態譜均衡化一般向所有 音頻信號內容施加處理,不管它是否需要。對于某些類型的音頻內容,這可導致過度動態處 理輸出。授權給Hipert等的美國專利No. 6,453,282概括了在離散時間音頻域中進行瞬態 檢測的方法。由于當總體觀看信號時由于瞬態導致的能量變化變得不明顯,因此當分析嚴 重動態范圍壓縮的材料時,這種時域方法是不可靠的。這導致瞬態信號的錯誤分類并導致 產生誤判(false positive)。鑒于不斷增加對于改善音頻錄音的呈現的關注,在本領域中需要改善音頻處理。
發明內容
根據本發明,提供用于調節音頻信號的方法和裝置。本發明對于音頻信號、特別是 對于經受了有害灌錄技術的音頻信號的動態范圍提供強制增強。根據本發明的一個方面,提供一種用于調節音頻信號的方法,該方法具有以下的 步驟接收至少一個音頻信號,每個音頻信號具有至少一個通道,每個通道在時間序列上被分成多個幀;對于多個連續時間段計算音頻信號的動態偏移的至少一個測量值;將音頻信 號濾波成多個子帶,每個幀由至少一個子帶代表;從連續時間段導出動態增益因子;分析 幀的至少一個子帶以確定是否在幀中存在瞬態;和向具有瞬態的每個幀施加動態增益因子。動態偏移的測量值可由時間段的波峰因數(crest factor)代表。可通過在幀內 取得峰值信號大小的函數與音頻信號的平均信號大小的函數的比,計算每個連續時間段的 波峰因數。方法還可包括對于至少一個子帶計算子帶相對能量函數的步驟。可通過比較幀或該幀的一部分的每個子帶中的子帶瞬態能量與相對能量閾值并 將通過該相對能量閾值的子帶的數量求和,計算每個幀的總體子帶瞬態能量。在該幀的 分析中通過相對能量閾值的子帶的數量大于預定分數的總子帶的情形下,瞬態可存在于幀 中。例如,在對該幀的分析中,通過相對能量閾值的子帶的數量大于四分之一的總子帶的情 形下,瞬態可存在于幀中。方法通過下述步驟繼續,對于分析中的總子帶數量,基于通過閾值的子帶的數量 計算動態增益加權因子。根據加權因子加權每個幀的動態增益因子。如果對于該幀沒有檢 測到瞬態,則該幀的先前動態增益可通過使用指數衰減曲線減小為1的值。在向輸入信號 施加最終動態增益之前,可進行對于音調狀音頻的檢查,以避免對于存在于輸入信號中的 強音調進行可聽的調制。如果在子帶內檢測到強音調,則對于該幀周期不向該子帶施加附 加的增益,并且,該子帶的動態增益繼續以基于先前幀的動態增益值衰減。根據本發明的另一方面,提供一種音頻信號處理裝置。音頻信號處理裝置包括用 于接收至少一個音頻信號的接收部件,每個音頻信號具有至少一個通道,每個通道在時間 序列上被分成多個幀;用于對于多個連續時間段計算音頻信號的動態偏移的至少一個測量 值的計算部件;用于將音頻信號濾波成多個子帶的濾波部件,每個幀由至少一個子帶代表; 用于從動態偏移的測量值導出動態增益并分析幀的至少一個子帶以確定是否在幀內存在 瞬態并且向具有瞬態的每個幀施加動態增益的導出部件。
參照以下的描述和附圖,將更好地理解這里公開的各種實施例的這些和其它特征 和優點,其中,類似的附圖標記始終表示類似的部件,并且其中圖la是原始音頻錄音的波形的透視圖;圖lb是動態范圍被過度壓縮的重新灌錄的音頻錄音的波形的透視圖;圖2是根據本發明的實施例的使用用于在多通道揚聲器或頭戴式耳機上回放的 自適應動態增強的收聽環境的示意圖;圖3是示出根據本發明的實施例的在自適應動態增強處理器之前的可選響度調 平處理塊的流程圖;圖4是示出在根據本發明的一個實施例的用于檢測瞬態并因此施加增益的自適 應動態增強處理中采取的步驟的流程圖;圖5是示出在根據本發明的一個實施例的檢測瞬態、針對已知的閾值評價瞬態并 因此施加自適應EQ曲線的自適應動態增強處理中采取的步驟的流程圖。
具體實施例方式以下關于附圖闡述的詳細描述意圖是作為本發明的當前優選實施例的描述,并且 不是要代表可以構建或利用本發明的唯一形式。描述結合示出的實施例闡述用于開發和操 作本發明的功能和步驟次序。但是,應當理解可通過也要包含于本發明的精神和范圍內的 不同實施例實現相同或等同的功能和次序。還應理解,使用諸如第一和第二等的關系術語 僅用于相互區分實體,而未必要求或隱含這些實體之間的任何實際的這種關系或次序。本發明的目的是解決有害錄音技術中的問題,在有害錄音技術中,采用侵略性應 用動態范圍壓縮算法,音頻錄音被灌錄為盡可能的大聲。這些錄音信號中的瞬態的動態偏 移遠比它們應當偏移的低。當在適度的級別上收聽時,這產生弱聲、沉悶或無生氣再現的感 受。本發明分析音頻錄音的力度,并增強表現有害灌錄實踐的跡象的瞬態。使用通過 分析源音頻錄音信號的響度和動態性能得到的智能/自適應處理來設計本發明。除非必 須,避免修改原始音頻錄音信號的力度。但是,也可由用戶調整附加的動態處理的缺省量, 使得任何錄音的力度可對于更尖鋭或“更強力”的聲音被夸大,或者對于更細微的增強減 小。可以使用本發明以增強源自任何媒體源的任何音樂、電影或游戲聲軌和任何收聽環境 中的瞬態カ度。現在參照圖2,提供示出多個實施例的實現的示意圖。圖2示出用于在揚聲器或 頭戴式耳機上回放動態增強的音頻錄音的音頻收聽環境。音頻收聽環境包括至少ー個諸如 DVD或BD播放器、TV調諧器、CD播放器、手持播放器、因特網音頻/視頻設備或游戲控制臺 等的至少ー個消費者電子設備10。消費者電子設備10提供被動態增強以補償任何有害灌 錄技術的源音頻錄音。在本實施例中,消費者電子設備10與音頻再現系統12連接。音頻再現系統12通 過動態增強音頻錄音的自適應動態增強處理(ADE)來處理音頻錄音。在替代性的實施例中, 獨立式消費者電子設備10可通過ADE處理增強音頻錄音。音頻再現系統12包含諸如IBMPowerPC, Inter Pentium ( X86)處理器等的可 代表一個或多個常規類型的這種處理器的中央處理單元(CPU)。隨機存取存儲器(RAM)暫 時存儲由CPU執行的數據處理操作的結果,并且一般通過專用的存儲器通道與其互連。音 頻再現系統12還可以包含也在i/o總線上與CPU通信的諸如硬盤驅動器的永久存儲設備。 也可以連接諸如磁帶機、光驅的其它類型的存儲設備。圖形卡也通過視頻總線與CPU連接, 并且向顯示監視器傳送代表顯示數據的信號。諸如鍵盤或鼠標的外設數據輸入設備可以在 USB端口上與音頻再現系統連接。USB控制器對于與USB端ロ連接的外設翻譯送往和來自 CPU的數據和指令。諸如打印機、麥克風和揚聲器等的附加設備可與音頻再現系統12連接。音頻再現系統12可利用諸如來自Redmond,Washington的微軟公司的WINDOWS、來 自Cupertino, CA的蘋果公司的MAC OS、和具有X-Windows窗ロ系統的各種UNIX版本等的 具有圖形用戶界面(GUI)的操作系統。音頻再現系統12執行ー個或多個計算機程序。一 般地,操作系統和計算機程序以有形的方式體現于例如包含硬盤驅動器的固定和/或可去 除數據存儲設備中的一個或多個的計算機可讀介質中。操作系統和計算機程序均可從上述 的數據存儲設備被加載到RAM中以供CPU執行。計算機程序可包含指令,這些指令當被CPU 讀取和執行時導致其執行步驟以執行本發明的步驟或特征。
以上的音頻再現系統12僅代表適于實現本發明的各方面的一個示例性裝置。音 頻再現系統12可具有許多不同的配置和結構。可以在不背離本發明的范圍的情況下很容 易地替代任何這種配置或結構。本領域技術人員可以認識到,上述的次序最常用于計算機 可讀介質中,但是,可在不背離本發明范圍的情況下,存在能夠被替代的其它現有次序。可通過硬件、固件、軟件或它們的任意組合實現ADE處理的一個實施例的要素。當 實現為硬件吋,ADE處理可在一個音頻信號處理器上被使用,或者分布于各種處理部件之 間。當實現為軟件時,本發明的實施例的要素基本上是用于執行必要任務的代碼段。軟件 優選包含用于實施在本發明的一個實施例中描述的操作的實際代碼或模仿或模擬操作的 代碼。程序或代碼段可被存儲于處理器或機器可存取介質中,或者在傳送介質上,通過在載 波中體現的計算機數據信號或通過載波調制的信號被傳送。“處理器可讀或可存取介質”或 “機器可讀或可存取介質”可包含可存儲、傳送或傳遞信息的任何介質。處理器可讀介質的 例子包含電子電路、半導體存儲器件、只讀存儲器(ROM)、閃速存儲器、可擦ROM (ER0M)、軟 盤、緊致盤(CD) ROM、光盤、硬盤、光纖介質、射頻(RF)鏈接等。計算機數據信號可包含可在 諸如電子網絡信道、光纖、空氣、電磁、RF鏈接等的傳送介質上傳播的任何信號。代碼段可通 過諸如因特網、內聯網等的計算機網絡被下載。可在制造物品中體現機器可存取介質。機 器可存取介質可包含當被機器訪問時導致機器執行以下描述的操作的數據。術語“數據”這 里指的是出于機器可讀目的編碼的任何類型的信息。因此,它可包含程序、代碼、數據、文件等。
可通過軟件實現本發明的實施例的全部或一部分。軟件可具有相互耦合的幾個模 塊。軟件模塊與另ー模塊耦合以接收變量、參數、自變數、指針等,并且/或者產生或通過結 果、更新的變量、指針等。軟件模塊也可以是與在平臺上運行的操作系統交互作用的軟件驅 動器或接ロ。軟件模塊也可以是配置、建立、初始化、發送和接收送往和來自硬件設備的數 據的硬件驅動器。本發明的一個實施例可被描述為通常示為程序框圖、流程圖、結構圖或框圖的處 理。雖然框圖可將操作描述為依次的處理,但是可以并行或同時地執行多個操作。另外,操 作的次序可被重新配置。處理在完成其操作時終止。處理可與方法、程序、過程等對應,圖2 是示出用于在頭戴式耳機14或揚聲器16上再現的音頻再現系統12的示意圖。音頻再現 系統12可從各種音頻或音頻/視頻源10接收數字或模擬音頻源信號。音頻源信號可以是 單個信號、二通道信號(諸如音樂軌道或TV廣播)或多通道信號(諸如電影聲道)。音頻信號 可以是諸如真實世界聲音或工程聲音等的任何被覺察或不被覺察的聲音。音頻再現系統12可包含用于連接模擬音頻源的模擬數字轉換器或數字音頻輸入 接ロ。它可包含用于處理音頻信號的數字信號處理器以及用于將處理的輸出信號轉換成被 發送到換能器(頭戴式耳機14或揚聲器16)的電信號的數字模擬轉換器和信號放大器。音 頻再現系統12可以是專用于音頻和/或視頻信號的選擇、處理和路由的家庭影院接收器或 汽車音響系統。作為替代方案,音頻再現系統12和音頻信號源中的一個或幾個可被一起結 合到諸如便攜式媒體播放器、電視機或膝上型計算機的消費者電子設備10中。諸如在電視 機或膝上型計算機的情況下,揚聲器16也可被結合到同一電器中。圖3是示出ADE處理環境的高層流程圖。流程圖通過接收輸入信號在步驟300上 開始。輸入信號是數字音頻信號。在本實施例中,在步驟310中,通過響度調平算法處理輸入信號,由此,隨時間適調整到來的輸入信號的增益,使得它具有基本上恒定的平均響度級 (比如說,-20dB相對于OdB的滿度)。響度調平算法是可選的特征,并且對于實現ADE處理來 說是不需要的。隨后,在320中,如果存在上游增益歸一化算法,那么ADE處理可在不導致可 源自信號波形削波的可聽的偽信號的情況下,將基準增益電平因子化為擴展到來的信號的 增益所需要的可用的動態余量(headroom)。該通信由虛線箭頭表示。ADE動態余量需求也 可將輸入的灌錄增益和輸入信號內容的增益因子化。可通過使用由DYNAMICS ENHANCEMENT LEVEL描述的用戶參數縮放施加的動態增強的量。使用輸出限制器以確保作為向輸入信號 施加需要的動態EQ的結果不出現輸出飽和。現在參照圖4,示出描述ADE處理的一個實施例的流程圖。ADE處理通過接收代表 音頻錄音的輸入信號在步驟400中開始。輸入信號是至少一個通道的數字音頻信號。輸入 信號代表通過模擬/數字轉換被轉換成數字格式的已被轉換成電子信號并被適當地預處 理的有形的物理現象、特別是聲音。一般地,如在本領域中已知的那樣,會施加模擬濾波、數 字濾波和其它的預處理,以使混淆、飽和或下游的其它信號處理誤差最小化。可通過諸如 PCM編碼的常規的線性方法代表音頻信號。在步驟410中,通過可適當地為互補正交鏡像 濾波器組的多抽頭、多頻帶、分析濾波器組濾波輸入信號。作為替代方案,可以使用諸如多 相濾波器組的偽正交鏡像濾波器(PQMF)。濾波器組產生多個子帶信號輸出。在本實施例 中,使用這種子帶輸出中的64個。但是,本領域技術人員很容易認識到輸入信號可被濾波 成任意數量的子帶。作為濾波功能的一部分,濾波器組應優選還關鍵地大大削弱每個子帶 中的子帶信號,特別是將每個子帶信號削弱到剛剛足以完全代表每個子帶中的信號(“臨界 采樣”)的更少數量的采樣/秒。該子帶采樣也可模仿人聽覺的生理機能。在濾波之后,在步驟420中分析子帶以進行瞬態檢測。可以設想,不是所有的子帶 都被用于瞬態分析,原因是,可以獲知,某些頻率具有瞬態的可能性很低。在本實施例中,通 過使用在頻帶上計算能量的加權和的瞬態檢測算法來檢測瞬態。由于信號能量通常占據叫 低的頻率,因此使用附加權重以強調瞬態不再顯著的信號的能量。這減少瞬態識別過程中 的“誤判”的可能性
其中TEhf (m, c)是瞬時的高頻加權瞬態能量,k是頻帶指數,m是分析巾貞指數,c代 表通道指數,w(k)與第k個頻率加權濾波系數對應,以及|G (k,m,c) |代表第c個通道的 第m個分析幀的第k個頻帶的絕對增益。本領域技術人員可以理解,可根據本發明應用各 種瞬態檢測算法,并且以上的例子作為例子被提供且不應被解釋為限制本發明的范圍。將瞬時的瞬態能量函數與先前的瞬態能量的時間平均相比較。該比較表明可能的 瞬態事件,其中,瞬時的瞬態能量應遠大于平均瞬態能量。可通過在每個頻帶中應用泄漏積 分器濾波器(leaky integrator filter)計算平均瞬態能量TEav :TEav(m, c) = (1_ a TE) TEav(m_l, c) + a TETEHF(m, c)(2)其中,a TE與瞬態能量阻尼因子對應,m代表幀指數,以及c代表通道指數。如果 那么觸發瞬態開端,其中,Gteans與一些預定的短暫閾值對
應。一般地,2 3 WG_S的值產生良好的結果,但是,閾值也可根據源材料改變。隨后,在CN 102668374 A說明書7/11 頁
步驟440中,通過在64個分析頻帶中的每ー個中取峰值信號電平與先前信號電平的時間平 均的比,計算多頻帶波峰因數值CF (k, m, c)。
權利要求
1.ー種用于調節音頻信號的方法,包括 接收至少一個音頻信號,每個音頻信號具有至少ー個通道,每個通道在時間序列上被分成多個巾貞; 對于多個連續時間段計算音頻信號的動態偏移的至少ー個測量值; 將音頻信號濾波成多個子帶,每個幀由至少ー個子帶代表; 從動態偏移的測量值導出動態增益; 分析幀的至少ー個子帶以確定是否在幀中存在瞬態;和 向具有瞬態的每個幀施加動態增益。
2.根據權利要求I所述的方法,其中,動態偏移的測量值是時間段的波峰因數。
3.根據權利要求2所述的方法,其中,通過在幀內取得峰值信號大小的函數與音頻信號的平均信號大小的函數的比,計算每個連續時間段的波峰因數。
4.根據權利要求I所述的方法,其中,分析步驟還包含 計算至少ー個子帶的子帶相對能量函數,所述子帶相對能量函數被表示為
5.根據權利要求4所述的方法,其中,通過將幀的每個子帶中的子帶相對能量與閾值相比較并將通過閾值的子帶的數量求和,計算每個幀的總體子帶瞬態能量,該總體子帶瞬態能量被表示為 TE (m, c) = Σ (RE (k, m, c) > REteesh) 其中 TE(m, c)=在第c個通道的第m個幀上測量的總體子帶瞬態能量; RE (k, m, c)=在第c個通道的第m個巾貞的第k個子帶上測量的子帶相對能量;以及 REthresh=閾值相對能量值。
6.根據權利要求5所述的方法,其中,在該幀的分析中通過閾值的子帶的數量大于預定分數的總子帶的情形下,瞬態存在于幀中。
7.根據權利要求5所述的方法,還包括以下的步驟 基于通過閾值的子帶的數量,計算每個幀的加權因子。
8.根據權利要求7所述的方法,其中,基于加權因子加權每個幀的動態增益。
9.根據權利要求I所述的方法,還包括 導出每個幀中的每個子帶的子帶增益;和 向每個子帶施加子帶增益。
10.根據權利要求9所述的方法,其中,通過確定峰值增益電平與時間平均増益的比,計算每個子帶的子帶波峰因數,該波峰因數被表示為
11.根據權利要求10所述的方法,其中,將子帶波峰因數與預定的音調閾值相比,并且如果子帶波峰因數低于預定的音調閾值,則子帶增益不被進一歩修改。
12.根據權利要求11所述的方法,其中,如果對于具有低于預定的音調閾值的子帶波峰因數的每個子帶沒有檢測到瞬態,則通過使用指數衰減曲線減小施加的子帶增益。
13.根據權利要求11所述的方法,其中,如果對于具有低于預定的音調閾值的子帶波峰因數的每個子帶檢測到音調成分,則通過使用指數衰減曲線減小施加的子帶增益。
14.一種音頻信號處理裝置,包括 用于接收至少ー個音頻信號的接收部件,每個音頻信號具有至少ー個通道,每個通道在時間序列上被分成多個幀; 用于對于多個連續時間段計算音頻信號的動態偏移的至少ー個測量值的計算部件; 用于將音頻信號濾波成多個子帶的濾波部件,每個幀由至少ー個子帶代表; 用于從動態偏移的測量值導出動態增益并分析幀的至少ー個子帶以確定是否在幀內存在瞬態并且向具有瞬態的每個幀施加動態增益的導出部件。
15.根據權利要求14所述的音頻信號處理裝置,其中,動態偏移的測量值是時間段的波峰因數。
16.根據權利要求15所述的音頻信號處理裝置,其中,通過在幀內取得峰值信號大小的函數與音頻信號的平均信號大小的函數的比,計算每個連續時間段的波峰因數。
17.根據權利要求16所述的音頻信號處理裝置,其中,計算至少ー個子帶的子帶相對能量函數,該子帶相對能量函數被表示為
18.根據權利要求17所述的音頻信號處理裝置,其中,通過比較幀的每個子帶中的子帶瞬態能量與閾值并將通過閾值的子帶的數量求和,計算每個幀的總體子帶瞬態能量,該總體子帶瞬態能量被表示為 TE (m, c) = Σ (RE (k, m, c) > REteesh) 其中 TE(m, c)=在第c個通道的第m個幀上測量的總體子帶瞬態能量; RE (k, m, c)=在第c個通道的第m個巾貞的第k個子帶上測量的子帶相對能量;以及 REthresh=閾值相對能量值。
19.根據權利要求18所述的音頻信號處理裝置,其中,瞬態存在于幀中,其中通過閾值的子帶的數量大于幀中的總子帶的四分之一。
20.根據權利要求19所述的音頻信號處理裝置,其中,基于通過閾值的子帶的數量,計算每個幀的加權因子。
21.根據權利要求20所述的音頻信號處理裝置,其中,根據加權因子對于每個幀將動態增益加權。
22.根據權利要求14所述的音頻信號處理裝置,其中,分析部件計算每個幀中的每個子帶的子帶增益,并且,向每個子帶施加子帶增益。
23.根據權利要求22所述的音頻信號處理裝置,其中,通過確定峰值增益電平與時間平均増益的比,計算每個子帶的子帶波峰因數,該波峰因數被表示為
24.根據權利要求23所述的音頻信號處理裝置,其中,將子帶波峰因數與預定的音調閾值相比,并且如果子帶波峰因數低于預定的音調閾值,則子帶增益不被進一歩修改。
25.根據權利要求23所述的音頻信號處理裝置,其中,如果對于具有低于預定的音調閾值的子帶波峰因數的每個子帶沒有檢測到瞬態,則通過使用指數衰減曲線減小施加的子帶增益。
26.根據權利要求23所述的音頻信號處理裝置,其中,如果對于具有低于預定的音調閾值的子帶波峰因數的每個子帶檢測到音調成分,則通過使用指數衰減曲線減小施加的子帶增益。
全文摘要
本發明涉及音頻錄音的自適應動態范圍增強。提供用于調節音頻信號的方法和裝置。根據本發明的一個方面,提供一種用于調節音頻信號的方法,該方法包括以下的步驟接收至少一個音頻信號,每個音頻信號具有至少一個通道,每個通道在時間序列上被分成多個幀;對于多個連續時間段計算音頻信號的動態偏移的至少一個測量值;將音頻信號濾波成多個子帶,每個幀由至少一個子帶代表;從連續時間段導出動態增益因子;分析幀的至少一個子帶以確定是否在幀中存在瞬態;和向具有瞬態的每個幀施加動態增益因子。
文檔編號H03G7/00GK102668374SQ201080053361
公開日2012年9月12日 申請日期2010年10月8日 優先權日2009年10月9日
發明者E·斯特因, J-M·卓特, M·維爾什 申請人:Dts(英屬維爾京群島)有限公司