用于對編碼輸入信號進行解碼的方法和設備的制作方法
【專利摘要】提供了用于對編碼輸入信號進行解碼的方法和設備。所述方法包括:接收包括編碼音頻信息和相關聯(lián)的元數(shù)據(jù)的編碼輸入信號,相關聯(lián)的元數(shù)據(jù)包括一個或多個解碼控制參數(shù)、用于指定適合于被第一解碼模式使用的動態(tài)范圍壓縮的一個或多個第一參數(shù)、以及用于指定適合于被第二解碼模式使用的動態(tài)范圍壓縮的一個或多個第二參數(shù);對編碼音頻信息應用解碼處理,以獲得子帶信號,其中,響應于一個或多個解碼控制參數(shù)來調節(jié)所述解碼處理;修改子帶信號,以獲得具有改變的動態(tài)范圍特性的修改子帶信號,其中,響應于一個或多個第二參數(shù)來調節(jié)所述修改;對修改子帶信號應用合成濾波器組,以獲得時域音頻信號;以及對時域音頻信號施加增益并應用限制器。
【專利說明】用于對編碼輸入信號進行解碼的方法和設備
[0001]本申請是申請?zhí)枮椤?01180009098.1”、發(fā)明名稱為“用于對便攜式裝置內的音頻信號的響度進行非破壞性標準化的系統(tǒng)和方法”的發(fā)明專利申請(進入國家階段的PCT申請,其國際申請?zhí)枮镻CT/US2011/023531)的分案申請。
[0002]對相關申請的引用
[0003]本申請要求2010年2月11日提交的美國專利臨時申請61/303,643的優(yōu)先權,其全部內容通過引用合并于此。
【技術領域】
[0004]本申請總體涉及對音頻信號的編碼和解碼,并且更具體地,涉及可用于針對較寬范圍的回放裝置和收聽環(huán)境對音頻信號進行編碼和解碼的技術。
【背景技術】
[0005]手持式和其它類型的便攜式裝置的日益普及已經(jīng)對用于在這些裝置上回放的媒體內容的創(chuàng)作者和分發(fā)者產生了新的機會和挑戰(zhàn),同樣也已經(jīng)對裝置的設計者和制造者產生了新的機會和挑戰(zhàn)。許多便攜式裝置能夠回放廣泛的媒體內容類型和格式,包括通常與用于HDTV (高清電視)、Blu-ray (藍光)或DVD (數(shù)字多功能盤)的高質量、寬帶寬和寬動態(tài)范圍的音頻內容相關聯(lián)的那些媒體內容類型和格式。便攜式裝置可用于在其自身的內部聲換能器上或者在諸如耳機的外部換能器上回放該類型的音頻內容;然而,這些便攜式裝置通常無法在變化的媒體格式和內容類型中以一致的響度和可理解度來再現(xiàn)該內容。
【發(fā)明內容】
[0006]本發(fā)明涉及提供用于對音頻信號進行編碼和解碼、以在包括手持式和其它類型的便攜式裝置的多種裝置上進行回放的改進方法。
[0007]根據(jù)本發(fā)明的一個方面,提供了一種用于對編碼輸入信號進行解碼以生成音頻輸出信號的方法,其中,所述方法包括:接收包括編碼音頻信息和相關聯(lián)的元數(shù)據(jù)的所述編碼輸入信號,其中,所述相關聯(lián)的元數(shù)據(jù)包括一個或多個解碼控制參數(shù)、用于指定適合于被第一解碼模式使用的動態(tài)范圍壓縮的一個或多個第一參數(shù)、以及用于指定適合于被第二解碼模式使用的動態(tài)范圍壓縮的一個或多個第二參數(shù),所述第一解碼模式使用第一參考再現(xiàn)水平,所述第二解碼模式使用第二參考再現(xiàn)水平;對所述編碼音頻信息應用解碼處理,以獲得子帶信號,其中,響應于所述一個或多個解碼控制參數(shù)來調節(jié)所述解碼處理;修改所述子帶信號,以獲得具有改變的動態(tài)范圍特性的修改子帶信號,其中,響應于所述一個或多個第二參數(shù)來調節(jié)所述修改;對所述修改子帶信號應用合成濾波器組,以獲得時域音頻信號;以及對所述時域音頻信號施加增益并應用限制器,其中,所述增益的施加提高所述音頻輸出信號的有效參考再現(xiàn)水平,并且其中,所述限制器的應用防止所述音頻輸出信號的幅度超過限幅水平。
[0008]根據(jù)本發(fā)明的另一個方面,提供了一種用于對編碼輸入信號進行解碼以生成音頻輸出信號的設備,其中,所述設備包括:用于接收包括編碼音頻信息和相關聯(lián)的元數(shù)據(jù)的所述編碼輸入信號的裝置,其中,所述相關聯(lián)的元數(shù)據(jù)包括一個或多個解碼控制參數(shù)、用于指定適合于被第一解碼模式使用的動態(tài)范圍壓縮的一個或多個第一參數(shù)、以及用于指定適合于被第二解碼模式使用的動態(tài)范圍壓縮的一個或多個第二參數(shù),所述第一解碼模式使用第一參考再現(xiàn)水平,所述第二解碼模式使用第二參考再現(xiàn)水平;用于對所述編碼音頻信息應用解碼處理以獲得子帶信號的裝置,其中,響應于所述一個或多個解碼控制參數(shù)來調節(jié)所述解碼處理;用于修改所述子帶信號以獲得具有改變的動態(tài)范圍特性的修改子帶信號的裝置,其中,響應于所述一個或多個第二參數(shù)來調節(jié)所述修改;用于對所述修改子帶信號應用合成濾波器組以獲得時域音頻信號的裝置;以及用于對所述時域音頻信號施加增益并應用限制器的裝置,其中,所述增益的施加提高所述音頻輸出信號的有效參考再現(xiàn)水平,并且其中,所述限制器的應用防止所述音頻輸出信號的幅度超過限幅水平。
[0009]本發(fā)明的各種特征及其優(yōu)選實施例可通過參考以下論述和附圖而得到更好的理解,在附圖中,相同的附圖標記在多幅圖中指的是相同的元件。附圖和以下論述的內容僅作為示例來闡述,并且不應理解為表示對本發(fā)明的范圍的限制。
【專利附圖】
【附圖說明】
[0010]圖1是回放裝置的示意框圖。
[0011]圖2是編碼裝置的示意框圖。
[0012]圖3至圖5是轉碼裝置的示意框圖。
[0013]圖6是可用于實現(xiàn)本發(fā)明的各個方面的裝置的示意框圖。
【具體實施方式】
[0014]A.介紹
[0015]本發(fā)明涉及用于對音頻信息進行編碼和解碼,以在具有挑戰(zhàn)性的收聽環(huán)境(諸如手持式和其它類型的便攜式裝置的用戶所遇到的收聽環(huán)境)中進行回放。諸如以下所描述的公開標準描述了音頻編碼和解碼的一些示例:由高級電視業(yè)務顧問委員會有限公司(Advanced Television Systems Committee, Inc.)在 2005 年 6 月 14 日公布的 “DigitalAudio Compression Standard(AC-3, E-AC-3) ”,修訂 B,文檔 A/52B (此處稱為 “ATSC 標準”),以及由國際標準組織(ISO)公布的IS0/IEC13818-7,高級音頻編碼(AAC)(此處稱為“MPEG-2AAC標準”)和IS0/IEC14496-3,子部分4 (此處稱為“MPEG-4音頻標準”)。只是作為示例而給出了遵照這些標準的編碼和解碼處理。本發(fā)明的原理也可用于遵照其它標準的編碼系統(tǒng)。
[0016]發(fā)明人發(fā)現(xiàn),遵照一些編碼標準的裝置的可用特征通常不足以用于手持式和其它類型的便攜式裝置的典型的應用和收聽環(huán)境。當這些類型的裝置被用于對遵照這些標準的編碼輸入信號的音頻內容進行解碼時,所解碼的音頻內容通常以如下響度水平被再現(xiàn):該響度水平顯著低于通過對專門為在這些裝置上回放而準備的編碼輸入信號進行解碼而獲得的音頻內容的響度水平。
[0017]遵照例如ATSC標準的編碼輸入信號(此處稱為“遵照ATSC的編碼信號”)包含編碼音頻信息以及用于描述該信息可以如何解碼的元數(shù)據(jù)。一些元數(shù)據(jù)參數(shù)標識動態(tài)范圍壓縮簡檔,該動態(tài)范圍壓縮簡檔指定當對編碼音頻信息進行解碼時可如何對音頻信息的動態(tài)范圍進行壓縮??梢员3纸獯a信號的完全動態(tài)范圍,或者可以在解碼時以不同的程度來對其進行壓縮,以滿足不同應用和收聽環(huán)境的要求。其它元數(shù)據(jù)標識編碼音頻信息的響度的某種度量,諸如編碼信號中的對話的水平或平均節(jié)目水平。該元數(shù)據(jù)可被解碼器用于調整解碼信號的幅度,以在回放期間實現(xiàn)指定的響度或參考再現(xiàn)水平。在一些應用中,可以指定或假設一個或多個參考再現(xiàn)水平,而在其它應用中,用戶可對參考再現(xiàn)水平的設置進行控制。例如,用于對遵照ATSC的編碼信號進行編碼和解碼的編碼處理假設要以兩個參考再現(xiàn)水平之一回放對話。一個水平是比限幅水平低31dB,其中限幅水平是最大的可能數(shù)字值或滿量程(FS)值,這個比限幅水平低31dB的水平在這里標記為-31dBFS。使用該水平的解碼模式有時稱為“線模式(Line Mode)”,并且旨在用于適合較寬動態(tài)范圍的應用和環(huán)境中。另一水平被設置為_20dBFS。使用該第二水平的解碼模式有時稱為“RF模式”,其旨在用在如在通過對射頻(RF)信號調制而進行廣播時所遇到的應用和環(huán)境中,其中需要較窄的動態(tài)范圍以避免過調制。
[0018]對于另一示例,遵照MPEG-2AAC標準和MPEG-4音頻標準的編碼信號包括用于標識編碼音頻信息的平均響度水平的元數(shù)據(jù)。對遵照MPEG-2AAC和MPEG-4音頻的編碼信號進行解碼的處理可允許收聽者指定期望的回放水平。解碼器使用該期望的回放水平和平均響度元數(shù)據(jù)來調整解碼信號的幅度,以實現(xiàn)期望的回放水平。
[0019]當手持式和其它類型的便攜式裝置被用于根據(jù)這些元數(shù)據(jù)參數(shù)來對遵照ATSC、遵照MPEG-2AAC以及遵照MPEG-4音頻的編碼信號的音頻內容進行解碼和回放時,動態(tài)范圍和響度水平通常是不適合的,這是由于這些類型的裝置所遇到的不利的收聽環(huán)境或者由于因在這些裝置中使用的較低操作電壓而導致的電限制。
[0020]遵照其它標準的編碼信號使用類似類型的元數(shù)據(jù),并且可包括用于指定期望的回放響度水平的規(guī)定。對這些信號進行解碼的便攜式裝置通常遇到相同的問題。
[0021]本發(fā)明可用于改進手持式和便攜式裝置的用戶的收聽體驗,而不需要專門為這些裝置準備的內容。
[0022]B.裝置概述
[0023]圖1是包括本發(fā)明的各個方面的一種類型的接收器/解碼器裝置10的示意框圖。裝置10從信號路徑11接收編碼輸入信號,在反格式化器12中應用適當?shù)奶幚硪詮妮斎胄盘柼崛【幋a音頻信息和相關聯(lián)的元數(shù)據(jù),將編碼音頻信息傳遞到解碼器14并且沿信號路徑13傳遞元數(shù)據(jù)。編碼音頻信息包括表示聽覺刺激的譜內容的編碼子帶信號,并且元數(shù)據(jù)指定多種參數(shù)的值,這多種參數(shù)包括一個或多個解碼控制參數(shù)以及用于根據(jù)動態(tài)范圍壓縮簡檔來指定動態(tài)范圍壓縮的一個或多個參數(shù)。術語“動態(tài)范圍壓縮簡檔”指的是諸如增益因子、壓縮進行(compress attack)次數(shù)和壓縮釋放(compress release)次數(shù)的特征,這些特征定義了動態(tài)范圍壓縮器的操作特性。
[0024]解碼器14對編碼音頻信息應用解碼處理以獲得解碼子帶信號,該解碼子帶信號被傳遞到動態(tài)范圍控制16。可響應于從信號路徑13接收的解碼控制參數(shù)來調節(jié)解碼處理的操作和功能??捎糜谡{節(jié)解碼處理的操作和功能的解碼控制參數(shù)的示例是用于標識音頻信道的數(shù)量和配置的參數(shù),其中該音頻信道由編碼音頻信息表示。
[0025]動態(tài)范圍控制16可選地調整解碼音頻信息的動態(tài)范圍。該調整可響應于從信號路徑13和/或從控制信號接收的元數(shù)據(jù)而被啟動或關閉以及調節(jié),其中可響應于來自收聽者的輸入來提供該控制信號。例如,可響應于收聽者操作開關或者選擇用于裝置10的操作選項來提供控制信號。
[0026]在遵照例如ATSC標準、MPEG-2AAC標準或MPEG-4音頻標準的實施中,編碼輸入信號包括以段或幀的序列布置的編碼音頻信息。各個幀包含如下編碼子帶信號:這些編碼子帶信號表示具有其完全動態(tài)范圍的音頻信號的譜分量。動態(tài)范圍控制16可不采取動作,這允許以最大的動態(tài)范圍量來回放音頻信號,或者動態(tài)范圍控制16可修改解碼子帶信號,以按照不同的程度來壓縮動態(tài)范圍。
[0027]合成濾波器組18對解碼子帶信號應用可由動態(tài)范圍控制16調整的一組合成濾波器,并且在其輸出處提供可以是數(shù)字或模擬信號的時域音頻信號。
[0028]增益-限制器20在本發(fā)明的一些實施中用于調整時域音頻信號的幅度。增益-限制器20的輸出沿著路徑21傳遞,以用于隨后由聲換能器進行呈現(xiàn)。
[0029]圖2是包括本發(fā)明的各個方面的編碼器/發(fā)送器裝置30的示意框圖。裝置30從信號路徑31接收表示聽覺刺激的音頻輸入信號。裝置30對音頻信號應用一組分析濾波器,以獲得作為輸入音頻信號的頻域表示的子帶信號或者表示輸入音頻信號的一組帶限信號。元數(shù)據(jù)計算器34對音頻輸入信號和/或從音頻輸入信號獲得的一個或多個信號(諸如來自分析濾波器組32的子帶信號或音頻輸入信號的變型形式)進行分析,以計算指定多種參數(shù)的值的元數(shù)據(jù),這多種參數(shù)包括編碼控制參數(shù)、一個或多個解碼控制參數(shù)以及用于根據(jù)動態(tài)范圍壓縮簡檔來指定動態(tài)范圍壓縮的一個或多個參數(shù)。元數(shù)據(jù)計算器34可對時域信號、頻域信號或者時域和頻域信號的組合進行分析。也可響應于從路徑33接收的一個或多個元數(shù)據(jù)參數(shù)來調節(jié)由元數(shù)據(jù)計算器34執(zhí)行的計算。編碼器36對分析濾波器組32的輸出應用編碼處理,以獲得包括編碼子帶信號的編碼音頻信息,該編碼音頻信息被傳遞到格式化器38??身憫趶穆窂?3接收的編碼控制參數(shù)來調節(jié)編碼處理。編碼處理還可生成沿著路徑33的其它解碼控制參數(shù),以供在裝置10中執(zhí)行的處理用于對編碼音頻信息進行解碼。格式化器38將編碼音頻信息和元數(shù)據(jù)中的至少一些元數(shù)據(jù)匯編成為具有適合于傳輸或存儲的格式的編碼輸出信號,該元數(shù)據(jù)包括一個或多個解碼控制參數(shù)以及用于指定動態(tài)范圍壓縮的一個或多個參數(shù)。
[0030]在遵照例如ATSC標準、MPEG-2AAC標準或MPEG-4音頻標準的實施中,編碼輸出信號包括以段或幀的序列布置的編碼音頻信息。各個幀包含如下編碼子帶信號:這些編碼子帶信號表示具有其完全動態(tài)范圍的音頻信號的譜分量,并且具有用于以參考再現(xiàn)水平進行回放的幅度。
[0031]反格式化器12、解碼器14、合成濾波器組18、分析濾波器組32、編碼器36以及格式化器38在設計和操作方面可以是傳統(tǒng)的。一些示例包括遵照上述公開標準的相應部件。在這些標準中指定或提出的部件的實施適合用于本發(fā)明,但并非必需這些部件。這些部件的特定實施都不是必須的。
[0032]圖3至圖5是包括上述裝置10和裝置30中的一些部件的轉碼器裝置40的不同實施的示意框圖。這些部件與它們的對應部件基本上相同地工作。圖3所示的裝置40能夠將從路徑11接收的編碼輸入信號轉碼成遵照相同編碼標準的變型形式。在該實施中,裝置40從信號路徑11接收編碼輸入信號,在反格式化器12中應用適當?shù)奶幚硪詮木幋a輸入信號提取第一編碼音頻信息和相關聯(lián)的元數(shù)據(jù),將第一編碼音頻信息傳遞到解碼器14和格式化器38,并且沿著信號路徑43傳遞元數(shù)據(jù)。第一編碼音頻信息包括表示聽覺刺激的譜內容的編碼子帶信號,并且元數(shù)據(jù)指定多種參數(shù)的值,這多種參數(shù)包括一個或多個解碼控制參數(shù)以及用于根據(jù)第一動態(tài)范圍壓縮簡檔來指定動態(tài)范圍壓縮的一個或多個參數(shù)。解碼器14對第一編碼音頻信息應用解碼處理以獲得解碼子帶信號。可響應于從信號路徑43接收的一個或多個解碼控制參數(shù)來調節(jié)解碼處理的操作和功能。子帶信號可以是聽覺刺激的頻域表示或者表示聽覺刺激的一組帶限信號。
[0033]元數(shù)據(jù)計算器44對解碼子帶信號和/或從解碼子帶信號得到的一個或多個信號進行分析,以計算用于根據(jù)第二動態(tài)范圍壓縮簡檔來指定動態(tài)范圍壓縮的一個或多個參數(shù)值。例如,可通過對解碼子帶信號應用合成濾波器組18來得到一個或多個信號??身憫趶穆窂?3接收的元數(shù)據(jù)來調節(jié)由元數(shù)據(jù)計算器44執(zhí)行的計算。如果合成濾波器組18的輸出不需要用于元數(shù)據(jù)計算,則可從該實施中省略合成濾波器組18。
[0034]圖4中示出了裝置40的另一實施。該實施與圖3所示的實施類似,但是包括編碼器36。包括編碼器36允許裝置40將遵照第一編碼標準的、從路徑11接收的編碼輸入信號轉碼成遵照第二編碼標準的編碼輸出信號,該第二編碼標準可與第一編碼標準相同或不同,只要兩個編碼標準的子帶信號兼容即可。這可在該實施中通過使編碼器36對子帶信號應用編碼處理以獲得遵照第二編碼標準的第二編碼音頻信息來實現(xiàn)。第二編碼音頻信息被傳遞到格式化器38??身憫趶穆窂?3接收的元數(shù)據(jù)來調節(jié)編碼處理。編碼處理還可生成沿著路徑43的其它元數(shù)據(jù),以供在裝置10中執(zhí)行的處理用于對編碼音頻信息解碼。格式化器38將從路徑43接收的元數(shù)據(jù)和其接收的編碼音頻信息匯編成具有適合于傳輸或存儲的格式的編碼輸出信號。
[0035]圖5中示出了裝置40的又一實現(xiàn)。該實現(xiàn)包括合成濾波器組18,該合成濾波器組18被應用于解碼子帶信號,以獲得編碼音頻信息的時域或寬帶表示。包括合成濾波器組18和分析濾波器組32允許裝置40在基本上任意編碼標準選擇之間進行轉碼。合成濾波器組18的輸出被傳遞到分析濾波器組32,分析濾波器組32生成子帶信號,以供編碼器36進行編碼。編碼器36對分析濾波器組32的輸出應用編碼處理,以獲得第二編碼音頻信息,該第二編碼音頻信息被傳遞到格式化器38。編碼處理還可生成沿著路徑43的其它元數(shù)據(jù),以供在裝置10中執(zhí)行的處理用于對編碼音頻信息解碼。元數(shù)據(jù)計算器44可根據(jù)其對從解碼器14接收的子帶信號、合成濾波器組18的輸出以及分析濾波器組32的輸出中的任意或全部的分析來計算元數(shù)據(jù)參數(shù)值。
[0036]以下更詳細地描述裝置10和裝置30的一些方面。這些描述適用于裝置40的相應特征。這些方面是按照遵照上述ATSC標準的方法和裝置的特征和特性來描述的。這些具體特征和特性僅作為示例來討論。這些實施中的根本原理直接適用于遵照其它標準的方法和裝置。
[0037]C.接收器/解碼器
[0038]上述回放問題可通過使用下述三種不同技術中的一種或多種來解決。第一技術使用增益限制并且可通過僅在裝置10中的特征來實施。第二技術和第三技術使用動態(tài)范圍壓縮,并且其實施需要在裝置10和裝置30兩者中的特征。
[0039]1.增益-限制器[0040]第一技術以RF模式而不是以線模式來操作裝置10,以使得其利用動態(tài)范圍控制16對遵照ATSC的編碼輸入信號進行解碼,動態(tài)范圍控制16提供較高的動態(tài)范圍壓縮水平和較高的參考再現(xiàn)水平。增益-限制器20提供額外的增益,從而將有效參考再現(xiàn)水平提高到從-14dBFS到-8dBFS的值。經(jīng)驗結果表明等于-lldBFS的參考水平對于很多應用給出良好結果。
[0041]增益-限制器20還應用限制操作,以防止放大的數(shù)字信號超過0dBFS。限制器的操作特性可以影響再現(xiàn)音頻的感知質量,但是沒有特定限制器對本發(fā)明而言是必須的。限制器可基本上以任意可能期望的方式來實施。優(yōu)選地,限制器被設計成提供“軟”限制功能而非“硬”限幅功能。
[0042]2.差分壓縮值[0043]第二技術允許裝置10在動態(tài)范圍控制16中應用一個或多個修改的動態(tài)范圍壓縮參數(shù)。反格式化器12從編碼輸入信號獲得差分動態(tài)范圍壓縮(DRC)參數(shù)值,并且沿著路徑13將差分參數(shù)值與傳統(tǒng)的DRC參數(shù)值一起傳遞到動態(tài)范圍控制16。動態(tài)范圍控制16通過對傳統(tǒng)的DRC參數(shù)值和對應的差分DRC參數(shù)值進行算術組合來計算所需的一個或多個DRC參數(shù)值。在該情形中不需要使用增益-限制器20。
[0044]由生成編碼輸入信號的編碼器/發(fā)送器裝置30在編碼輸入信號中提供差分DRC參數(shù)值。這在以下進行描述。
[0045]如果編碼輸入信號不包含這些差分DRC值,則裝置10可以使用根據(jù)上述第一技術的增益-限制器20。
[0046]3.獨特壓縮簡檔
[0047]第三技術允許裝置10在動態(tài)范圍控制16中應用根據(jù)新動態(tài)范圍壓縮簡檔的動態(tài)范圍壓縮。反格式化器12從編碼輸入信號獲得新簡檔的一個或多個DRC參數(shù)值,并且沿路徑13將它們傳遞到動態(tài)范圍控制16。在該情形中不需要使用增益-限制器20。
[0048]由生成編碼輸入信號的編碼器/發(fā)送器裝置30在編碼輸入信號中提供新動態(tài)范圍壓縮簡檔的DRC參數(shù)值。這在以下進行描述。
[0049]如果編碼輸入信號不包含新DRC簡檔的一個或多個DRC參數(shù)值,則裝置10可以使用根據(jù)上述第一技術的增益-限制器20。
[0050]D.編碼器/發(fā)送器
[0051]1.差分壓縮值
[0052]在裝置10中通過使用從編碼輸入信號提取的差分DRC參數(shù)值來實施上述第二技術的處理。這些差分參數(shù)值由生成編碼信號的裝置30來提供。
[0053]裝置30提供一組差分DRC參數(shù)值,這組差分DRC參數(shù)值表示將存在于編碼信號中的一組DRC參數(shù)值與新DRC簡檔的一組對應的基本參數(shù)值之間的差,并且是防止解碼音頻信號樣本超過0dBFS以實現(xiàn)較高的參考再現(xiàn)水平所需的。用于計算DRC參數(shù)值的特定方法都不是本發(fā)明必須的。在由高級電視業(yè)務顧問委員會有限公司(AdvancedTelevision Systems Committee, Inc.)在 2009 年 11 月 4 日公布的 “ATSC RecommendedPractice!Techniques for Estalishiing an Maintaining Audio Loudness for DigitalTelevision”,文檔A/85 (尤其是在第9節(jié)和附錄F)中以及在Robinson等人的“DynamicRange Control via Metadata”,預印號 5028,107th AES convention,紐約,1999 年 9 月中公開了遵照ATSC標準的用于計算參數(shù)值的公知方法。
[0054]如果編碼輸出信號遵照ATSC標準、MPEG-2AAC標準或MPEG-4音頻標準,則參考再現(xiàn)水平增加到從-14dBFS到-8dBFS的值。經(jīng)驗結果表明等于-lldBFS的參考水平對于很多應用給出良好結果。
[0055]對于遵照ATSC的編碼輸出信號,元數(shù)據(jù)計算器34計算對于該標準中指定的對應的基本參數(shù)“compr”的差分參數(shù)值。格式化器38可將差分參數(shù)值匯編成各個編碼信號幀的標記為“addbsi”(額外比特流信息)和/或“auxdata”(輔助數(shù)據(jù))的部分。如果差分參數(shù)值被匯編成“addbsi”部分或“auxdata”部分,則編碼信號將與所有遵照ATSC的解碼器兼容。不能識別差分參數(shù)值的那些解碼器仍然可以通過忽略“addbsi”和“auxdata”部分而正確地對編碼信號幀進行處理和解碼。參考以上引用的A/52b文獻文檔以得到更多細節(jié)。
[0056]對于遵照MPEG-2AAC標準或MPEG-4音頻標準的編碼輸出信號,格式化器38可將差分參數(shù)值匯編成各個編碼信號幀的在兩個標準中被標記為“Fill_Element”或“Data_StreanuElement”的部分。如果差分參數(shù)值被匯編成這些部分之一,則編碼信號將與所有遵照MPEG-2AAC標準和MPEG-4音頻標準的解碼器兼容。參考以上引用的IS0/IEC13818-7和IS0/IEC14496-3文檔以得到更多細節(jié)。
[0057]可計算差分參數(shù)值,并以大于、等于或小于對應的基本參數(shù)值在編碼信號中的速率的速率來將差分參數(shù)值插入到編碼信號中。差分值的速率可變化。用于表示先前的差分值是否應該再次使用的標志或比特也可包括在編碼信號中。
[0058]2.獨特壓縮簡檔
[0059]在裝置10中通過使用從編碼輸入信號提取的、新動態(tài)范圍壓縮簡檔的DRC參數(shù)值來實施上述第三技術的處理。這些參數(shù)值由生成編碼信號的裝置30來提供。
[0060]裝置30通過計算如下參數(shù)值來得到新DRC簡檔的DRC參數(shù)值:這些參數(shù)值是防止解碼音頻信號樣本超過0dBFS以得到較高的參考再現(xiàn)水平所需的。
[0061 ] 如果編碼輸出信號遵照ATSC標準、MPEG-2AAC標準或MPEG-4音頻標準,則元數(shù)據(jù)計算器34基于參考再現(xiàn)水平增加到從-14dBFS到-8dBFS的值這一假設來計算DRC壓縮值。經(jīng)驗結果表明等于-lldBFS的參考水平對于很多應用給出良好結果。格式化器38可將DRC簡檔的參數(shù)值匯編成各個編碼信號幀的如上所述的用于差分參數(shù)的部分。幀的這些部分的使用允許編碼信號與遵照各個標準的所有解碼器兼容。
[0062]E.實現(xiàn)
[0063]包括本發(fā)明的各個方面的裝置可以以多種方式來實現(xiàn),這些方式包括用于由計算機或某種其它裝置執(zhí)行的軟件,該其他裝置包括耦合到與通用計算機中發(fā)現(xiàn)的部件類似的部件的更專用的部件(諸如數(shù)字信號處理器(DSP)電路)。圖6是可用于實施本發(fā)明的方面的裝置70的示意框圖。處理器72提供計算資源。RAM73是被處理器72用于進行處理的系統(tǒng)隨機存取存儲器(RAM)。R0M74表示某種形式的持久存儲裝置(諸如只讀存儲器(ROM)),其用于存儲操作裝置70所需的程序并且可以用于執(zhí)行本發(fā)明的各個方面。I/O控制75表示用于利用通信信道76、77接收輸入信號和發(fā)送輸出信號的接口電路。在所示出的實施例中,所有主要的系統(tǒng)部件均連接到總線71,總線71可表示多于一個物理或邏輯總線;然而,總線架構不是實現(xiàn)本發(fā)明必須的。
[0064]在由通用計算機系統(tǒng)實現(xiàn)的實施例中,可包括額外的部件,用于與諸如鍵盤或鼠標和顯示器的裝置接口,以及用于控制具有存儲介質(諸如磁帶或磁盤、或者光學介質)的存儲裝置78。存儲介質可用于記錄用于操作系統(tǒng)、用途以及應用的指令的程序,并且可包括實施本發(fā)明的各個方面的程序。
[0065]實踐本發(fā)明的各個方面所需的功能可以由以多種方式實施的部件來執(zhí)行,這些部件包括分立邏輯部件、集成電路、一個或多個ASIC和/或程序控制處理器。這些部件實現(xiàn)的方式對本發(fā)明并不重要。
[0066]本發(fā)明的軟件實施可通過多種機器可讀介質(諸如貫穿包括從超聲頻率到紫外線頻率的頻譜的調制通信信道或基帶)或者使用基本上任何記錄技術表達信息的存儲介質(包括磁帶、卡或盤、光卡或光盤、以及包括紙的介質上的可檢測標記)來表達。
[0067]根據(jù)本申請,提供了以下方案:
[0068]方案1.一種用于對編碼輸入信號進行解碼以生成音頻輸出信號的方法,其中,所述方法包括:
[0069]接收包括編碼音頻信息和相關聯(lián)的元數(shù)據(jù)的所述編碼輸入信號,所述相關聯(lián)的元數(shù)據(jù)包括一個或多個解碼控制參數(shù)以及一個或多個第一參數(shù),所述一個或多個第一參數(shù)根據(jù)第一動態(tài)范圍壓縮簡檔來指定動態(tài)范圍壓縮,并且所述相關聯(lián)的元數(shù)據(jù)可選地包括一個或多個第二參數(shù),所述一個或多個第二參數(shù)根據(jù)第二動態(tài)范圍壓縮簡檔來指定動態(tài)范圍壓縮,其中,所述一個或多個第一參數(shù)具有下述值:根據(jù)生成所述編碼音頻信息的編碼處理而設置所述值,以表示具有用于以第一參考再現(xiàn)水平進行回放的、不超過限幅水平的幅度的聽覺刺激;并且其中,所述一個或多個第二參數(shù)具有下述值:根據(jù)生成所述編碼音頻信息的編碼處理而設置所述值,以表示具有用于以第二參考再現(xiàn)水平進行回放的、不超過所述限幅水平的幅度的所述聽覺刺激,所述第二參考再現(xiàn)水平高于所述第一參考再現(xiàn)水平;
[0070]對所述編碼音頻信息應用解碼處理,以獲得表示所述聽覺刺激的譜內容的子帶信號,其中,響應于所述一個或多個解碼控制參數(shù)來調節(jié)所述解碼處理;
[0071]修改所述子帶信號,以獲得具有改變的動態(tài)范圍特性的修改子帶信號,其中,如果所述元數(shù)據(jù)包括所述一個或多個第二參數(shù),則響應于所述一個或多個第二參數(shù)來調節(jié)所述修改,或者如果所述元數(shù)據(jù)不包括所述一個或多個第二參數(shù),則響應于所述一個或多個第一參數(shù)來調節(jié)所述修改;
[0072]對所述修改子帶信號應用合成濾波器組,以獲得時域音頻信號;以及
[0073]如果所述元數(shù)據(jù)不包括所述一個或多個第二參數(shù),則響應于所述元數(shù)據(jù)而對所述時域音頻信號施加增益并應用限制器,其中,所述增益的施加修改所述時域音頻信號,以獲得具有用于以所述第二參考再現(xiàn)水平進行回放的幅度的所述音頻輸出信號,并且其中,所述限制器的應用防止所述音頻輸出信號的幅度超過所述限幅水平。
[0074]方案2.根據(jù)方案I所述的方法,其中,所述一個或多個第二參數(shù)表示所述第一動態(tài)范圍壓縮簡檔和所述第二動態(tài)范圍壓縮簡檔的對應參數(shù)之間的差。
[0075]方案3.根據(jù)方案I或2所述的方法,其中,所述編碼輸入信號遵照ATSC標準、MPEG-2AAC標準或MPEG-4音頻標準,所述第一參考再現(xiàn)水平對應于低于所述限幅水平20dB的幅度,并且所述第二參考再現(xiàn)水平對應于低于所述限幅水平IldB的幅度。
[0076]方案4.一種用于對表示聽覺刺激的音頻輸入信號進行編碼的方法,其中,所述方法包括:[0077]接收所述音頻輸入信號;
[0078]對所述音頻輸入信號應用分析濾波器組,以生成表示所述音頻輸入信號的譜內容的子帶信號;
[0079]分析從所述音頻輸入信號得到的一個或多個信號,以計算元數(shù)據(jù),所述元數(shù)據(jù)包括一個或多個第一參數(shù)以及一個或多個第二參數(shù),所述一個或多個第一參數(shù)根據(jù)第一動態(tài)范圍壓縮簡檔來指定動態(tài)范圍壓縮,而所述一個或多個第二參數(shù)根據(jù)第二動態(tài)范圍壓縮簡檔來指定動態(tài)范圍壓縮,其中,所述一個或多個第一參數(shù)具有下述值:所述值被設置為表示具有用于以第一參考再現(xiàn)水平進行回放的、不超過限幅水平的幅度的所述聽覺刺激,并且其中,所述一個或多個第二參數(shù)具有下述值:所述值被設置為表示具有用于以第二參考再現(xiàn)水平進行回放的、不超過所述限幅水平的幅度的所述聽覺刺激;
[0080]對所述子帶信號應用編碼處理,以獲得編碼音頻信息;以及
[0081]將所述編碼音頻信息和所述元數(shù)據(jù)匯編成具有適合于傳輸或存儲的格式的編碼輸出信號,其中,所述一個或多個第二參數(shù)表示所述第一動態(tài)范圍壓縮簡檔和所述第二動態(tài)范圍壓縮簡檔的對應參數(shù)之間的差。
[0082]方案5.根據(jù)方案4所述的方法,其中,所述編碼輸出信號遵照ATSC標準、MPEG-2AAC標準或MPEG-4音頻標準,所述第一參考再現(xiàn)水平對應于低于所述限幅水平20dB的幅度,并且所述第二參考再現(xiàn)水平對應于低于所述限幅水平IldB的幅度。
[0083]方案6.—種用于對編碼輸入信號進行轉碼以生成編碼輸出信號的方法,其中,所述方法包括:
[0084]接收包括第一編碼音頻信息和相關聯(lián)的元數(shù)據(jù)的所述編碼輸入信號,所述相關聯(lián)的元數(shù)據(jù)包括一個或多個解碼控制參數(shù)以及一個或多個第一參數(shù),所述一個或多個第一參數(shù)根據(jù)第一動態(tài)范圍壓縮簡檔來指定動態(tài)范圍壓縮,其中,所述一個或多個第一參數(shù)具有下述值:根據(jù)生成所述第一編碼音頻信息的第一編碼處理而設置所述值,以表示具有用于以第一參考再現(xiàn)水平進行回放的、不超過限幅水平的幅度的聽覺刺激;
[0085]對所述第一編碼音頻信息應用解碼處理,以獲得表示所述聽覺刺激的譜內容的子帶信號,其中,響應于所述一個或多個解碼控制參數(shù)來調節(jié)所述解碼處理;
[0086]分析從所述子帶信號獲得的一個或多個信號,以計算一個或多個第二參數(shù),所述一個或多個第二參數(shù)根據(jù)第二動態(tài)范圍壓縮簡檔來指定動態(tài)范圍壓縮,其中,所述一個或多個第二參數(shù)具有下述值:所述值被設置為表示具有用于以第二參考再現(xiàn)水平進行回放的、不超過所述限幅水平的幅度的所述聽覺刺激;以及
[0087]將第二編碼音頻信息、所述一個或多個第一參數(shù)以及所述一個或多個第二參數(shù)匯編成具有適合于傳輸或存儲的格式的編碼輸出信號,其中,所述第二編碼音頻信息是所述子帶信號的編碼表示。
[0088]方案7.根據(jù)方案6所述的方法,其中,所述一個或多個第二參數(shù)表示所述第一動態(tài)范圍壓縮簡檔和所述第二動態(tài)范圍壓縮簡檔的對應參數(shù)之間的差。
[0089]方案8.根據(jù)方案6或7所述的方法,包括:對所述子帶信號應用合成濾波器組以獲得所述一個或多個信號,其中所述一個或多個信號被分析以計算指定動態(tài)范圍壓縮的所述一個或多個第二參數(shù)。
[0090]方案9.根據(jù)方案6至8中任一項所述的方法,包括:對所述子帶信號應用第二編碼處理,以生成所述第二編碼音頻信息。
[0091]方案10.根據(jù)方案6至8中任一項所述的方法,其中,所述第二編碼音頻信息是所述第一編碼音頻信息。
[0092]方案11.根據(jù)方案6至10中任一項所述的方法,其中,所述編碼輸入信號遵照ATSC標準、MPEG-2AAC標準或MPEG-4音頻標準,并且所述第一參考再現(xiàn)水平對應于低于所述限幅水平20dB的幅度。
[0093]方案12.根據(jù)方案6至10中任一項所述的方法,其中,所述編碼輸出信號遵照ATSC標準、MPEG-2AAC標準或MPEG-4音頻標準,并且所述第二參考再現(xiàn)水平對應于低于所述限幅水平IldB的幅度。
[0094]方案13.—種設備,包括用于執(zhí)行根據(jù)方案I至12中任一項所述的方法的步驟的
>J-U裝直。
[0095]方案14.一種用于記錄指令程序的存儲介質,所述指令程序能夠由裝置執(zhí)行,以執(zhí)行根據(jù)方案I至12中任一項所述的方法的步驟。
【權利要求】
1.一種用于對編碼輸入信號進行解碼以生成音頻輸出信號的方法,其中,所述方法包括: 接收包括編碼音頻信息和相關聯(lián)的元數(shù)據(jù)的所述編碼輸入信號,其中,所述相關聯(lián)的元數(shù)據(jù)包括一個或多個解碼控制參數(shù)、用于指定適合于被第一解碼模式使用的動態(tài)范圍壓縮的一個或多個第一參數(shù)、以及用于指定適合于被第二解碼模式使用的動態(tài)范圍壓縮的一個或多個第二參數(shù),所述第一解碼模式使用第一參考再現(xiàn)水平,所述第二解碼模式使用第二參考再現(xiàn)水平; 對所述編碼音頻信息應用解碼處理,以獲得子帶信號,其中,響應于所述一個或多個解碼控制參數(shù)來調節(jié)所述解碼處理; 修改所述子帶信號,以獲得具有改變的動態(tài)范圍特性的修改子帶信號,其中,響應于所述一個或多個第二參數(shù)來調節(jié)所述修改; 對所述修改子帶信號應用合成濾波器組,以獲得時域音頻信號;以及對所述時域音頻信號施加增益并應用限制器,其中,所述增益的施加提高所述音頻輸出信號的有效參考再現(xiàn)水平,并且其中,所述限制器的應用防止所述音頻輸出信號的幅度超過限幅水平。
2.根據(jù)權利要求1所述的方法,其中,所述第一參考再現(xiàn)水平對應于低于所述限幅水平31dB的幅度,所述第二參考再現(xiàn)水平對應于低于所述限幅水平20dB的幅度,并且所述有效參考再現(xiàn)水平對應于低于所述限幅水平14dB至SdB的幅度。
3.根據(jù)權利要求 2所述的方法,其中,所述有效參考再現(xiàn)水平對應于低于所述限幅水平IldB的幅度。
4.一種用于對編碼輸入信號進行解碼以生成音頻輸出信號的設備,其中,所述設備包括: 用于接收包括編碼音頻信息和相關聯(lián)的元數(shù)據(jù)的所述編碼輸入信號的裝置,其中,所述相關聯(lián)的元數(shù)據(jù)包括一個或多個解碼控制參數(shù)、用于指定適合于被第一解碼模式使用的動態(tài)范圍壓縮的一個或多個第一參數(shù)、以及用于指定適合于被第二解碼模式使用的動態(tài)范圍壓縮的一個或多個第二參數(shù),所述第一解碼模式使用第一參考再現(xiàn)水平,所述第二解碼模式使用第二參考再現(xiàn)水平; 用于對所述編碼音頻信息應用解碼處理以獲得子帶信號的裝置,其中,響應于所述一個或多個解碼控制參數(shù)來調節(jié)所述解碼處理; 用于修改所述子帶信號以獲得具有改變的動態(tài)范圍特性的修改子帶信號的裝置,其中,響應于所述一個或多個第二參數(shù)來調節(jié)所述修改; 用于對所述修改子帶信號應用合成濾波器組以獲得時域音頻信號的裝置;以及用于對所述時域音頻信號施加增益并應用限制器的裝置,其中,所述增益的施加提高所述音頻輸出信號的有效參考再現(xiàn)水平,并且其中,所述限制器的應用防止所述音頻輸出信號的幅度超過限幅水平。
5.根據(jù)權利要求4所述的設備,其中,所述第一參考再現(xiàn)水平對應于低于所述限幅水平31dB的幅度,所述第二參考再現(xiàn)水平對應于低于所述限幅水平20dB的幅度,并且所述有效參考再現(xiàn)水平對應于低于所述限幅水平14dB至SdB的幅度。
6.根據(jù)權利要求5所述的設備,其中,所述有效參考再現(xiàn)水平對應于低于所述限幅水平IldB的幅度。
【文檔編號】H03G7/00GK103795364SQ201410039751
【公開日】2014年5月14日 申請日期:2011年2月3日 優(yōu)先權日:2010年2月11日
【發(fā)明者】杰弗里·C·里德米勒, 哈拉爾德·H·蒙特, 米夏埃爾·舒格, 梅爾廷·沃爾特斯 申請人:杜比實驗室特許公司, 杜比國際公司