專利名稱:語音對(duì)其余音頻(vra)交互中心聲道下混音的制作方法
交叉引用的有關(guān)申請(qǐng)本申請(qǐng)請(qǐng)求1999年6月15日提交的標(biāo)題為“語音對(duì)其余音頻(VRA)交互中心聲道下混音”的美國(guó)臨時(shí)專利申請(qǐng)系列號(hào)60/139242的權(quán)利。
本發(fā)明領(lǐng)域本發(fā)明的實(shí)施例總的涉及一個(gè)用于處理音頻信號(hào)的方法和設(shè)備,更具體地涉及用于處理音頻信號(hào)以改善大范圍最終用戶的收聽效果的一種方法和設(shè)備。
本發(fā)明背景具有“高檔”或昂貴設(shè)備包括多聲道放大器和多揚(yáng)聲器系統(tǒng)的最終用戶當(dāng)前具有有限能力來獨(dú)立于其它其余聲道上的音頻信號(hào)調(diào)節(jié)多聲道音頻系統(tǒng)的中心聲道上的音量。由于許多電影在中心聲道上具有大多數(shù)對(duì)話而其它音響效果位于其它聲道上,該有限的調(diào)節(jié)能力允許最終用戶提升大多數(shù)對(duì)話聲道的幅度,以便在大聲音響效果片段期間對(duì)話更容易理解?,F(xiàn)在,這種有限調(diào)節(jié)具有嚴(yán)重缺點(diǎn)。首先,這種調(diào)節(jié)能力只對(duì)具有DVD播放機(jī)和多聲道揚(yáng)聲器系統(tǒng)例如六揚(yáng)聲器家庭影院系統(tǒng)的最終用戶有用,這樣的系統(tǒng)允許所有揚(yáng)聲器獨(dú)立地調(diào)節(jié)。這種調(diào)節(jié)在優(yōu)選音頻信號(hào)(例如,語音或?qū)υ?和其余音頻信號(hào)(所有其它聲道)期間也需要連續(xù)調(diào)整。最后的缺點(diǎn)是,如果其余音頻電平增加太大或?qū)υ掚娖綔p少太多,在電影節(jié)目一個(gè)音頻段期間可接受的語音對(duì)其余音頻(VRA)調(diào)節(jié)可能對(duì)于另一個(gè)音頻段不好。
事實(shí)是大多數(shù)最終用戶許多年也不具有并且也不想具有允許該調(diào)節(jié)能力的家庭影院,即杜比數(shù)字解碼器、六聲道可變?cè)鲆娣糯笃骱投鄵P(yáng)聲器系統(tǒng)。另外,最終用戶不具有保證在節(jié)目開始時(shí)所選擇的VRA比率在整個(gè)節(jié)目期間保持相同的能力。
圖3表示了普通家庭影院系統(tǒng)預(yù)定立體定位設(shè)置。盡管沒有對(duì)于5.1立體聲道的文字規(guī)則,但是有工業(yè)標(biāo)準(zhǔn)。如同在此所使用,術(shù)語“立體聲道”表示輸出設(shè)備的物理位置(例如,揚(yáng)聲器)和來自輸出設(shè)備的聲音如何發(fā)送給最終用戶。這些標(biāo)準(zhǔn)之一是將大多數(shù)對(duì)話定位在中心聲道226上。同樣地,需要立體定位的其他音響效果將安置在任何其他四個(gè)左、右、左環(huán)繞、右環(huán)繞揚(yáng)聲器上,標(biāo)記為L(zhǎng)221、R222,Ls223、Rs224。另外,為避免損壞中距離揚(yáng)聲器,低頻效果(LFE)被安置在指向亞低音揚(yáng)聲器225的0.1聲道上。
數(shù)字音頻壓縮允許廠家為最終用戶提供更大的音頻動(dòng)態(tài)范圍,這通過模擬傳輸是不可能實(shí)現(xiàn)的。更大動(dòng)態(tài)范圍在某些非常大聲的音響效果出現(xiàn)時(shí)引起大多數(shù)對(duì)話與聲音相比太低。下列例子提供了解釋。假設(shè)模擬傳輸(或錄音)有能力傳輸高達(dá)95dB的動(dòng)態(tài)范圍而對(duì)話典型地以80dB被記錄。當(dāng)其余音頻達(dá)到上限而有人正說話時(shí),其余音頻的大聲段可以妨礙對(duì)話??墒?,當(dāng)數(shù)字音頻壓縮允許動(dòng)態(tài)范圍達(dá)到105dB時(shí),這種情況惡化。很清楚,對(duì)話將保持在針對(duì)其他聲音的某個(gè)電平(80dB)上,現(xiàn)在只有大聲其余音頻可以更真實(shí)地按照其幅度再現(xiàn)。用戶抱怨在DVD上對(duì)話被錄音得太低是非常普遍的。實(shí)際上,與具有有限動(dòng)態(tài)范圍的模擬錄音相比對(duì)話IS在適當(dāng)電平并且更適合和真實(shí)。
即使對(duì)于現(xiàn)在具有適當(dāng)校對(duì)的家庭影院系統(tǒng)的消費(fèi)者,在現(xiàn)在生產(chǎn)的許多DVD電影中對(duì)話經(jīng)常被大聲其余音頻部分掩蓋。一小部分消費(fèi)者通過增加中心聲道音量或減少所有其他聲道音量能夠稍微改善清晰度。可是,這種固定調(diào)節(jié)只對(duì)于某些音頻通道可接受,它破壞了適當(dāng)校準(zhǔn)的電平。揚(yáng)聲器電平一般被校準(zhǔn)以在觀看位置產(chǎn)生一定的聲壓級(jí)(SPL)這種適當(dāng)校準(zhǔn)保證觀看盡可能真實(shí)。不幸的是,這意味著大聲音被非常大聲地再現(xiàn)。在后半夜觀看期間,這可能是不希望的。可是,揚(yáng)聲器電平的任何調(diào)節(jié)將破壞該校準(zhǔn)。
本發(fā)明概述一種解碼音頻信號(hào)的方法包括接收具有多個(gè)聲道上限定的數(shù)字音頻信號(hào),其中多個(gè)聲道之一是中心聲道而所述其他多個(gè)聲道至少之一是其余音頻聲道;比較中心聲道與其他多個(gè)聲道的至少一個(gè)以確定中心聲道與其他多個(gè)聲道的比率;當(dāng)該比率不滿足預(yù)定數(shù)值時(shí)自動(dòng)調(diào)節(jié)中心聲道和其他多個(gè)聲道的至少一個(gè)。
附圖簡(jiǎn)要說明
圖1表示了按照本發(fā)明的總方案,在錄音或廣播節(jié)目中將有關(guān)語音信息與一般背景音頻分開。
圖2表示按照本發(fā)明的示范性實(shí)施例,接收和重新播放被編碼節(jié)目信號(hào)。
圖3表示普通家庭影院系統(tǒng)預(yù)定立體定位設(shè)置。
圖4表示一個(gè)按照本發(fā)明的系統(tǒng),其中最終用戶具有選項(xiàng)以選擇自動(dòng)語音對(duì)其余音頻(VRA)電平特性或校準(zhǔn)后音頻特性。
圖5表示按照本發(fā)明如何實(shí)現(xiàn)下混音的原理圖的實(shí)施例。
圖6表示按照本發(fā)明如何實(shí)現(xiàn)下混音的原理圖的替換實(shí)施例。
圖7圖示了具有標(biāo)準(zhǔn)化下混音系數(shù)的現(xiàn)有技術(shù)杜比數(shù)字編碼器和解碼器。
圖8表示了按照本發(fā)明每個(gè)編碼5.1聲道上最終用戶可調(diào)節(jié)電平。
圖9表示了按照本發(fā)明實(shí)施例的圖8所示的接口盒。
圖10表示了將音樂安置在左和右聲道而語音安置在中心聲道并且在下混音之前調(diào)節(jié)中心聲道的處理。
圖11表示了按照本發(fā)明原理的圖10中所示的系統(tǒng)的替代實(shí)施例。
詳細(xì)說明本發(fā)明描述一種方法和設(shè)備,用于針對(duì)多聲道音頻節(jié)目的其余聲道的優(yōu)選語音對(duì)其余音頻容量而調(diào)節(jié)多聲道節(jié)目的中心聲道電平。
另外,本發(fā)明描述了一種方法和設(shè)備,用于以一種方式在音頻介質(zhì)上重新錄音舊主音量和錄音新主音量,該方式允許最終用戶調(diào)節(jié)優(yōu)選的語音對(duì)其余音頻。如同在此所使用的,術(shù)語“主音量”是指在音頻錄音過程中在最開始步驟產(chǎn)生的音頻介質(zhì)。另外,術(shù)語“最終用戶”是指廣播或聲音錄音的消費(fèi)者或聽眾或在收聽通過錄音或廣播發(fā)送的音頻介質(zhì)上音頻信號(hào)的人。另外,術(shù)語“優(yōu)選音頻”是指音頻信號(hào)的語音成分、語音信息或主要語音成分,而術(shù)語“其余音頻”是指音頻信號(hào)的背景、音樂或非語音成分。
在此描述的本發(fā)明不限于任何特定音頻COREC(壓縮/解壓縮)標(biāo)準(zhǔn),并且可以與任何音頻CODEC一起使用,例如數(shù)字影院音響(DTS)、杜比數(shù)字、索尼動(dòng)態(tài)數(shù)字音響(SDDS)、脈沖編碼調(diào)制(PCM)等。
優(yōu)選的音頻對(duì)其余音頻比率的價(jià)值本發(fā)明始于這種認(rèn)識(shí),即優(yōu)選音頻信號(hào)相對(duì)任何其余音頻比率的優(yōu)先收聽范圍相當(dāng)大,當(dāng)然地大于以往預(yù)計(jì)的范圍。這一重大發(fā)現(xiàn)是針對(duì)對(duì)優(yōu)選音頻信號(hào)電平與所有其余音頻信號(hào)電平比率選擇的小群體抽樣測(cè)試的結(jié)果。
對(duì)于聽力損傷者和正常聽眾所希望范圍的特定調(diào)節(jié)在了解正常人和聽力受損者如何感覺不同類型音頻節(jié)目中對(duì)話和其余音頻之間比率方面已經(jīng)進(jìn)行了非常有針對(duì)性的研究。已經(jīng)發(fā)現(xiàn),在語音和其余音頻之間所希望調(diào)節(jié)范圍上人們有很大不同。
已經(jīng)對(duì)包括小學(xué)生、中學(xué)生、中年人和老年人的隨機(jī)抽樣群體進(jìn)行了兩個(gè)實(shí)驗(yàn)??偣矞y(cè)試了71人。測(cè)試包括要求用戶對(duì)足球比賽(其中其余音頻是人群噪聲)和流行歌曲(其中其余音頻是音樂)調(diào)節(jié)語音電平和其余音頻電平。通過對(duì)每個(gè)選擇將對(duì)話音或語音量線性數(shù)值除以其余音頻音量線性數(shù)值形成稱為VRA(語音對(duì)其余音頻)比的標(biāo)稱。
作為給測(cè)試的結(jié)果清楚了幾個(gè)事實(shí)。第一,對(duì)于體育和音樂媒介沒有兩個(gè)人選擇相同的語音和其余音頻比。這是非常重要的,因?yàn)槿藗円呀?jīng)依賴廠家提供呈現(xiàn)給每個(gè)人的VRA(其不能由用戶調(diào)節(jié))。假設(shè)這些測(cè)試結(jié)果,這明顯不會(huì)想到。第二,盡管VRA一般高于聽力受損者(以改善清晰度),具有正常聽力的人們也選擇與廠家現(xiàn)在提供所不同的比率。
很重要的是提出了這樣的事實(shí),即任何提供VRA調(diào)節(jié)的設(shè)備必須提供至少與這些測(cè)試所得出一樣多的調(diào)節(jié)能力,以便滿足重要群體。由于語音和家庭影院媒體提供各種節(jié)目,我們應(yīng)當(dāng)考慮比率范圍應(yīng)當(dāng)從至少任何媒體(音樂或體育)最低比率擴(kuò)展到音樂或體育的最高比率。這是0.1到20.17,或46dB的分貝范圍。也應(yīng)當(dāng)注意,這僅僅是抽樣人群和調(diào)節(jié)能力應(yīng)當(dāng)理論上無限大,因?yàn)楫?dāng)觀看體育廣播時(shí)非??赡芤粋€(gè)人可以選擇無人群噪聲而另一個(gè)人選擇沒有解說。注意,這類研究和大范圍改變VRA的特定希望在文章和現(xiàn)有技術(shù)中還沒有報(bào)告或討論過。
在該測(cè)試中,較年長(zhǎng)者被選擇和要求進(jìn)行固定背景噪聲和解說員語音之間的調(diào)節(jié)(該測(cè)試后來在學(xué)生群體中進(jìn)行),其中只有后者可以改變而前者被設(shè)置為6.00。年長(zhǎng)者的結(jié)果如下表1個(gè)人設(shè)置17.50
24.5034.0047.5053.0067.0076.5087.7595.5010 7.0011 5.00為進(jìn)一步說明所有年紀(jì)人們具有不同聽力需要和選擇的事實(shí),一組21位大學(xué)生被選擇收聽語音和背景的混音并且通過對(duì)語音電平進(jìn)行一次調(diào)節(jié)選擇語音對(duì)背景比率。在足球比賽人群噪聲情況下,背景噪聲被固定設(shè)置為六(6.00)并且學(xué)生被允許一場(chǎng)一場(chǎng)地調(diào)節(jié)解說員語音音量,該語音已經(jīng)被單獨(dú)錄音并且是純語音或基本上純語音。換句話說,學(xué)生被選擇進(jìn)行與年長(zhǎng)人群相同的測(cè)試。學(xué)生們都是十七八或二十出頭。結(jié)果如下表2學(xué)生 語音設(shè)置1 4.752 3.753 4.254 4.505 5.206 5.757 4.258 6.709 3.2510 6.0011 5.0012 5.2513 3.00
144.25153.25163.00176.00182.00194.00205.50216.00年長(zhǎng)者群體的年齡(見表1)范圍在36到39,而個(gè)體在40或50歲群體占多數(shù)。如同該測(cè)試所表示的,平均設(shè)置趨向適當(dāng)增高表明某些大范圍的聽力下降。該范圍從3.00到7.75之間變化,分布范圍為4.75,這證實(shí)了所發(fā)現(xiàn)的人們選擇的語音對(duì)背景或火熱優(yōu)選信號(hào)對(duì)其余音頻的收聽比率變量范圍。兩組音量設(shè)置的總范圍服從2.0到7.75的范圍。這些電平代表用于進(jìn)行實(shí)驗(yàn)的音量調(diào)節(jié)裝置的時(shí)間數(shù)值。它們提供了信號(hào)對(duì)噪聲數(shù)值范圍的指示(當(dāng)與“噪聲”電平6.0相比),這可能是不同用戶的希望。
為獲得對(duì)這些如何有關(guān)不同用戶所選擇的相對(duì)大聲音范圍有更好了解,考慮從2.0到7.75的非線性音量控制范圍代表增加20dB或十(10)倍。因此,即使對(duì)于小抽樣人群和單一類型的音頻節(jié)目,發(fā)現(xiàn)不同聽眾針對(duì)“其余音頻”選擇相當(dāng)明顯不同的“優(yōu)選信號(hào)”電平。這種選擇跨越年齡組,表明它與個(gè)人選擇和基本聽力一致,這是以前從沒有預(yù)計(jì)到的。
如同測(cè)試結(jié)果表示的,沒有年齡引起的聽力損害的學(xué)生(見表2)選擇的的范圍從低設(shè)置2.00到高設(shè)置6.70而明顯不同,范圍為4.70或幾乎從1到10的總發(fā)我的一半。該測(cè)試說明了大多數(shù)錄音和廣播音頻信號(hào)的“一應(yīng)具全”概念給單個(gè)聽眾非常少的能力來調(diào)節(jié)混音以適合他們自己的選擇或收聽需要。而且,學(xué)生具有與年長(zhǎng)者一樣的大范圍證明了在選擇和聽力需要方面的個(gè)人差別。該測(cè)試的結(jié)果是收聽選擇大范圍不同。
進(jìn)一步測(cè)試已經(jīng)在更大抽樣群體上確認(rèn)了該結(jié)果。此外,該結(jié)果根據(jù)音頻類型而改變。例如,當(dāng)音頻信號(hào)源是音樂時(shí),語音對(duì)其余音頻的比率從幾乎零到大約10范圍改變,而當(dāng)音頻信號(hào)源是體育節(jié)目時(shí),同樣比率在幾乎零到大約20范圍改變。另外,標(biāo)準(zhǔn)偏差增加幾乎三倍,而平均值比音樂增加了兩倍多。
上述測(cè)試的最后結(jié)果是,如果選擇優(yōu)選音頻對(duì)其余音頻比率并且永遠(yuǎn)固定,最有可能產(chǎn)生低于重要人群部分所希望的音頻節(jié)目。另外,如上所述,優(yōu)化比率可以是短期和長(zhǎng)期時(shí)變函數(shù)。因此,希望完全控制優(yōu)選音頻對(duì)其余音頻比率以滿足“正常”或沒有聽力損害聽眾的收聽需要。另外,為最終用戶提供對(duì)該比率的最終控制允許最終用戶優(yōu)化他們的收聽感受。
最終用戶獨(dú)立調(diào)節(jié)優(yōu)選音頻信號(hào)和其余音頻信號(hào)是本發(fā)明一方面的明顯表現(xiàn)。為詳細(xì)說明本發(fā)明,考慮優(yōu)選音頻信號(hào)是有關(guān)語音信息的應(yīng)用場(chǎng)合。
產(chǎn)生優(yōu)選音頻信號(hào)和其余音頻信號(hào)圖1表示了在錄音或廣播節(jié)目中將有關(guān)語音信息與一般背景音響分開的總方案。首先需要由節(jié)目導(dǎo)演進(jìn)行確認(rèn),以便定義有關(guān)語音。演員、一組演員或播音員必須被識(shí)別為有關(guān)說話者。
一旦有關(guān)說話者被識(shí)別,他們的語音通過語音麥克風(fēng)1拾音。語音麥克風(fēng)1需要近距離麥克風(fēng)(在播音員情況下)或用于音響錄音的高方向性瞄準(zhǔn)麥克風(fēng)。除了高方向性,這些麥克風(fēng)1需要語音頻帶限制,最好為200-5000Hz。方向性和帶通濾波的組合使耦合到錄音上有關(guān)語音信息的背景噪聲最低。在某些節(jié)目類型中,防止聲音耦合的需要可以通過脫機(jī)記錄有關(guān)對(duì)話語音和將對(duì)話配音在節(jié)目視頻部分適當(dāng)位置來避免。背景麥克風(fēng)2應(yīng)當(dāng)是均勻?qū)拵б蕴峁┩暾谋尘靶畔⒁纛l質(zhì)量,例如音樂。
攝象機(jī)3將用于提供節(jié)目的視頻部分。音頻信號(hào)(語音和有關(guān)語音)將在編碼器4與視頻信號(hào)一起編碼??傊?,通過簡(jiǎn)單地利用不同載波頻率調(diào)制,音頻信號(hào)通常與視頻信號(hào)分開。由于大多數(shù)廣播現(xiàn)在是立體聲,解碼有關(guān)語音信息與背景的一種方式是將有關(guān)語音信息復(fù)用到單獨(dú)立體聲聲道,該方式與左前或右前聲道被增加到兩聲道立體聲以產(chǎn)生四聲盤記錄的方式相同。盡管這將產(chǎn)生另外廣播帶寬的需要,對(duì)于錄音介質(zhì),這不引起問題,只要視盤或磁帶播放機(jī)中的音頻電路設(shè)計(jì)得解碼有關(guān)語音信息。
一旦信號(hào)被編碼,無論認(rèn)為哪種方式適合,被編碼信號(hào)通過天線13由廣播系統(tǒng)發(fā)送而廣播,或被錄音系統(tǒng)6記錄在磁帶或盤上。在記錄聲像信息的情況下,背景和語音信息可以簡(jiǎn)單地安置在分開的記錄磁道上。
接收和解碼優(yōu)選音頻信號(hào)和其余音頻。
圖2表示了接收和重新播放被編碼節(jié)目信號(hào)的示范性實(shí)施例。接收機(jī)系統(tǒng)7在廣播信息情況下根據(jù)被編碼音頻/視頻信號(hào)解碼主載波頻率。在錄音介質(zhì)14的情況下,VCR的磁頭或CD播放機(jī)8的光頭將產(chǎn)生被編碼音頻/視頻信號(hào)。
在任何情況下,這些信號(hào)應(yīng)當(dāng)被發(fā)送給解碼系統(tǒng)9。解碼器9使用標(biāo)準(zhǔn)解碼技術(shù)例如包絡(luò)檢波與頻分或時(shí)分解調(diào)的組合,將信號(hào)分成視頻、語音音頻和背景音頻。背景音頻信號(hào)被送給單獨(dú)可變?cè)鲆娣糯笃?0,該放大器可以由收聽者調(diào)節(jié)到他們的選擇。語音信號(hào)被送給可變?cè)鲆娣糯笃?1,該放大器可以由收聽者調(diào)節(jié)到他們特定要求,如上所述。
兩個(gè)被調(diào)節(jié)信號(hào)通過統(tǒng)一增益相加放大器12相加以產(chǎn)生最后音頻輸出。替代地,兩個(gè)被調(diào)節(jié)信號(hào)由統(tǒng)一增益相加放大器12相加并且由可變?cè)鲆娣糯笃?5進(jìn)一步調(diào)節(jié)以產(chǎn)生最后音頻輸出。以此方式,在播放音頻節(jié)目時(shí)收聽者可以調(diào)節(jié)有關(guān)語音對(duì)背景電平以優(yōu)化音頻節(jié)目達(dá)到他們唯一的收聽要求。每次相同的收聽者播放相同音頻時(shí),由于收聽者聽力改變而比率設(shè)置可能需要改變。設(shè)置保持無限可調(diào)節(jié)以適應(yīng)這種靈活性。
中心聲道的自動(dòng)VRA調(diào)節(jié)特性中心聲道電平的某些增加或其余揚(yáng)聲器電平的減少為具有多聲道音響系統(tǒng)例如具有調(diào)節(jié)能力的5.1聲道音響系統(tǒng)的最終用戶提供了語音清晰度的改善。注意,不是所有消費(fèi)者具有這種系統(tǒng),而本發(fā)明允許所有消費(fèi)者具有該能力。
圖4表示了一個(gè)系統(tǒng),其中最終用戶具有選項(xiàng)以選擇自動(dòng)VRA電平特性或被校準(zhǔn)音頻特性。該系統(tǒng)包括一個(gè)被校準(zhǔn)解碼器231、開關(guān)235和237、一個(gè)處理器232和多個(gè)放大器234、238和236。如圖4所示,該系統(tǒng)通過移動(dòng)開關(guān)235到位置B校準(zhǔn),該位置被認(rèn)為是正常工作位置,在此使用5.1解碼器輸出聲道通過功率放大器236直接到達(dá)5.1揚(yáng)聲器輸入。解碼器然后被校準(zhǔn)以便揚(yáng)聲器電平對(duì)于家庭影院系統(tǒng)適合。如上所述,這些揚(yáng)聲器電平可能不適合夜晚觀看。
替代地,開關(guān)235可以被移動(dòng)到位置A,該位置允許最終用戶選擇所希望VRA比率并且通過針對(duì)其他音頻聲道調(diào)節(jié)中心聲道相對(duì)電平而自動(dòng)保持。
在不干擾用戶所選擇VRA的音頻節(jié)目段期間,揚(yáng)聲器以原來校準(zhǔn)格式再現(xiàn)音頻聲音。只有當(dāng)其余音頻變得太大聲或語音變成太輕聲時(shí)在放棄自動(dòng)電平特性。在這些時(shí)刻,語音電平可以被提高,其余音頻可能被降低,或兩者組合。這通過“檢查實(shí)際VRA”處理器232完成。檢查實(shí)際VRA處理器232包括所有必要硬件和軟件以及其組合以執(zhí)行上述功能。如果最終用戶通過開關(guān)235選擇自動(dòng)VRA保持特性被使用,則5.1聲道電平在檢查實(shí)際VRA模塊232中被比較。如果平均中心電平對(duì)于其他聲道有足夠的比率(其他聲道可以全部相反校準(zhǔn)以符合觀看位置的室內(nèi)聲音和預(yù)定SPL),則正常被校準(zhǔn)電平通過快速開關(guān)237由放大器再現(xiàn)。
如果該比率被預(yù)定為不滿意,則快開關(guān)237將中心聲道釋放到其自動(dòng)電平調(diào)節(jié)并且所有其他揚(yáng)聲器到自己的自動(dòng)電平調(diào)節(jié)。
按照本發(fā)明1)這些自動(dòng)VRA-HOLD特性被直接應(yīng)用于現(xiàn)有5.1音頻聲道;2)現(xiàn)在在家庭影院中可調(diào)節(jié)的中心電平可以針對(duì)其余聲道被調(diào)節(jié)到特定比率并且在出現(xiàn)瞬間被保持;3)當(dāng)用戶所選擇VRA不被影響時(shí)被校準(zhǔn)電平被再現(xiàn),并且當(dāng)其仍然適合臨時(shí)改變校準(zhǔn)引起的瞬間改變時(shí)被自動(dòng)對(duì)準(zhǔn),由此以更真實(shí)方式再現(xiàn)音頻;4)允許最終用戶選擇自動(dòng)(或手工)VRA或被校準(zhǔn)系統(tǒng),由此消除在中心聲道調(diào)節(jié)之后對(duì)重新校準(zhǔn)的需要。
也應(yīng)當(dāng)注意,盡管該電平被認(rèn)為自動(dòng)調(diào)節(jié),該特性也可以希望提供簡(jiǎn)單人工增益調(diào)節(jié),如圖4所示。
對(duì)非中心聲道揚(yáng)聲器方案的下混音的中心聲道調(diào)節(jié)如上所述,許多最終用戶不具有家庭影院系統(tǒng)??墒?,DVD播放機(jī)正變得更普及并且在不遠(yuǎn)的將來將廣播數(shù)字電視。這些數(shù)字音頻格式將要求最終用戶具有5.1聲道解碼器以便收聽任何廣播音頻,可是,他們可能沒有奢侈到購買具有5.1音頻聲道的完全可調(diào)節(jié)和校準(zhǔn)家庭影院系統(tǒng)。
本發(fā)明的下個(gè)方面利用一個(gè)事實(shí),即廠家將推出5.1聲道音響給可能沒有完全再現(xiàn)能力的最終用戶,同時(shí)允許他們調(diào)節(jié)語音以保持音頻VRA比率電平。另外,本發(fā)明的這方面通過允許最終用戶選擇保持或維護(hù)該比率而不用具有多揚(yáng)聲器可調(diào)節(jié)系統(tǒng)的特性而增強(qiáng)。
圖5表示了按照本發(fā)明的實(shí)施例如何實(shí)現(xiàn)下混音的原理圖。如圖所示,下混音通過接口單元241從DVD播放機(jī)輸出端口接收5.1聲道(在此情況下杜比數(shù)字)比特流來實(shí)現(xiàn)。該信號(hào)然后被發(fā)送給用戶音頻解碼器,按照用戶所選擇VRA對(duì)中心聲道243進(jìn)行用戶調(diào)節(jié)。輸出信號(hào)然后送給立體聲、四聲道或不提供中心聲道揚(yáng)聲器的任何其它揚(yáng)聲器裝置244。
圖6表示了按照本發(fā)明如何實(shí)現(xiàn)下混音的原理圖的替代實(shí)施例。對(duì)于非家庭影院音頻系統(tǒng)的下混音為所有用戶提供了受益于可選擇VRA的方法。被調(diào)節(jié)對(duì)話以一種方式被分配給非中心聲道揚(yáng)聲器,該方式使音頻節(jié)目的預(yù)定立體位置保留得盡可能完好。可是,對(duì)話電平將簡(jiǎn)單地更高。如圖所示,一個(gè)N聲道D/A轉(zhuǎn)換器252將來自用戶音頻解碼器并用于用戶調(diào)節(jié)中心聲道下混音243的數(shù)字信號(hào)轉(zhuǎn)換為模擬信號(hào)。該模擬信號(hào)然后送給一個(gè)N揚(yáng)聲器音頻播放設(shè)備253。
由非常詳細(xì)的方法將5.1音頻聲道(杜比數(shù)字)下混音成為4聲道(杜比專家邏輯電路)、成為2聲道(立體聲)或1聲道(單聲道)。以適當(dāng)比率組合的5.1聲道被選擇對(duì)于消費(fèi)者具有的任何再現(xiàn)設(shè)備產(chǎn)生優(yōu)化立體定位?,F(xiàn)有下混音方法的問題是它們對(duì)最終用戶是透明的并且不可控制。這可能出現(xiàn)清晰度問題,假設(shè)動(dòng)態(tài)范圍被利用在更新的5.1聲道音頻混音方式。
作為例子,考慮已經(jīng)用5.1聲道產(chǎn)生的電影具有其余音頻蓋過了對(duì)話的一段,使對(duì)話很難理解。如果消費(fèi)者具有6揚(yáng)聲器和6聲道可調(diào)節(jié)增益放大器,語音清晰度可以被改善并且保持,如上所述??墒?,只具有立體聲再現(xiàn)的消費(fèi)者將接收一個(gè)與圖7所示圖一樣的5.1聲道下混音版本(摘自“杜比數(shù)字廣播實(shí)施指導(dǎo)”)。實(shí)際上,中心聲道電平被衰減了DD比特流中指定的數(shù)量(或者-3,-4.5或-6dB)。這進(jìn)一步減少了其他聲道上包含大聲其余音頻的片段的清晰度。
本發(fā)明的這方面通過在它們被混音到用戶再現(xiàn)設(shè)備之前在每個(gè)立體聲道上安置可調(diào)節(jié)增益而回避了下混音問題。
圖8表示了每個(gè)被解碼5.1聲道上的最終用戶可調(diào)節(jié)電平。通常,低頻效果(LFE)聲道的下混音不進(jìn)行,以防止電子元件飽和和減少清晰度??墒牵瑢?duì)于在下混音出現(xiàn)之前的最終用戶調(diào)節(jié)變化,有可能在下混音中包括最終用戶指定比率的LFE。
讓最終用戶調(diào)節(jié)每個(gè)聲道電平(電平調(diào)節(jié)器263a-g)允許最終用戶具有任何數(shù)量的再現(xiàn)揚(yáng)聲器以利用以前只有具有5.1再現(xiàn)聲道的聽眾才可使用的語音電平調(diào)節(jié)。
如上所述,該設(shè)備可以外部用于任何解碼器271,不論是單獨(dú)解碼器、DVD的內(nèi)部、或電視機(jī)內(nèi)部,也不論在家庭影院系統(tǒng)中再現(xiàn)聲道的數(shù)量。最終用戶必須簡(jiǎn)單命令解碼器271分配一個(gè)(5.1)輸出和“接口盒”將執(zhí)行以前由解碼器執(zhí)行的調(diào)節(jié)和下混音。
圖9表示了該接口盒282。它可以從任何解碼器提取輸入,5.1被解碼音頻聲道,對(duì)每個(gè)聲道施加獨(dú)立增益,按照消費(fèi)者具有的再現(xiàn)揚(yáng)聲器數(shù)量下混音。
另外,本發(fā)明的這方面可以通過在任何下混音執(zhí)行之前在每個(gè)5.1聲道上安置獨(dú)立用戶可調(diào)節(jié)聲道增益而結(jié)合到任何解碼器中。當(dāng)前的方法是在必要時(shí)下混音并且然后進(jìn)行增益。這不能改善對(duì)話清晰度,因?yàn)閷?duì)于任何下混音條件,該中心被混合到包含其余音頻的其它聲道中。
也應(yīng)當(dāng)注意,前面討論的自動(dòng)VRA-HOLD裝置非??蓱?yīng)用于該實(shí)施例。通過調(diào)節(jié)每個(gè)放大器增益一旦VRA被選擇,VRA-HOLD特性將在下混音之前保持該比率。由于選擇該比率同時(shí)收聽任何被下混音的再現(xiàn)設(shè)備,下混音電路的比例將通過消費(fèi)者應(yīng)用的另外中心電平調(diào)節(jié)而被補(bǔ)償。所以,作為下混音處理自身的結(jié)果,不需要另外補(bǔ)償。
也應(yīng)當(dāng)注意,在用戶調(diào)節(jié)放大和下混音之前的帶通濾波將消除比語音頻率更低和比語音頻率更高的聲音(200Hz到4000Hz例如),和可能改善某些通道的清晰度。也經(jīng)常可能為改善清晰度而被消除的中心聲道上內(nèi)容也存在在左和右聲道,因?yàn)樗鼈冾A(yù)計(jì)再現(xiàn)反之在語音帶寬之外的音樂和效果。這保證不出現(xiàn)其余音頻聲音保真度失真而同時(shí)也改善了語音清晰度。
本發(fā)明的這方面1)允許具有任何數(shù)量揚(yáng)聲器的消費(fèi)者利用當(dāng)前只對(duì)具有5.1再現(xiàn)揚(yáng)聲器的消費(fèi)者可使用的VRA比率調(diào)節(jié);2)允許這些消費(fèi)者針對(duì)其他聲道上的其余音頻設(shè)置中心聲道上所希望電平,并且使該比率在整個(gè)VRA-HOLD特性瞬間保持相同;3)可以應(yīng)用于任何5.1聲道解碼器輸出而不修改比特流或增加所需要傳輸帶寬,即對(duì)于硬件獨(dú)立。
對(duì)于VRA再現(xiàn)的三聲道錄音為提供在此所公開構(gòu)思的例子,必須在媒體某些應(yīng)用中選擇一定的媒體??墒?,特定例子不排除其他形式的媒體或來自本發(fā)明范圍的稍微修改錄音技術(shù)。另外,盡管本發(fā)明重點(diǎn)討論了三聲道音頻轉(zhuǎn)換為兩聲道音頻,設(shè)想以VRA調(diào)節(jié)目的的特定下混音方式的多聲道錄音也在不脫離本發(fā)明范圍。
為最終用戶提供VRA調(diào)節(jié)裝置的目的是為改善清晰度而單獨(dú)控制語音或?qū)υ掚娖胶推溆嘁纛l的電平。所討論的本發(fā)明上述方面利用一個(gè)事實(shí),即許多多聲道產(chǎn)品在中心聲道上安置大多數(shù)對(duì)話,在這種多聲道節(jié)目中許多用戶不能獲得提升中心聲道電平所需要的調(diào)節(jié)。因此,如上所述,廠家不需任何區(qū)別地為最終用戶提供有限的VRA調(diào)節(jié)能力。如下所討論的,討論了一種生產(chǎn)方法,該方法利用前面討論的元件保證更有效的VRA調(diào)節(jié)。另外,利用上述相同實(shí)際硬件的裝置,許多舊音頻錄音可以重新利用新生產(chǎn)技術(shù)進(jìn)行處理,這樣為用戶提供了利用上述硬件調(diào)節(jié)當(dāng)前5.1聲道再現(xiàn)以調(diào)節(jié)VRA的裝置。
用于描述上生產(chǎn)方法特點(diǎn)的第一個(gè)例子上典型的流行音樂。主錄音一般包括各種音頻聲道,可以包括鼓、吉他、貝斯和嗓音。這些聲道當(dāng)然在單一記錄介質(zhì)上被同步,所以他們的播放將構(gòu)成完整的歌曲。當(dāng)當(dāng)前CD(或DVD音頻)盤被生產(chǎn)時(shí),最終用戶不可能具有對(duì)語音的任何控制來保持音頻比率??墒?,如果廠家打算將音樂混音安置在所希望隔開的左和右聲道而同時(shí)將語音安置在中心聲道上,分開的“節(jié)目”將獨(dú)立于播放由最終用戶調(diào)節(jié)。(該生產(chǎn)通過利用包括多聲道節(jié)目的DVD音頻標(biāo)準(zhǔn)實(shí)現(xiàn))。許多,如果DVD以該方式生產(chǎn)(音樂在左和右而語音在中心),它可以由上述從5.1聲道到2聲道的下混音設(shè)備播放,而在下混音之前在中心聲道上調(diào)節(jié)。該特定實(shí)施例在圖9表示。
圖10表示了在左和右聲道上安置音樂而在中心聲道安置語音并且在下混音之前在中心聲道上調(diào)節(jié)的過程。該過程開始于包括語音和其余音頻的主音頻節(jié)目90的產(chǎn)生。來自主音頻節(jié)目90的信號(hào)在左和右聲道上被混音并且均等調(diào)節(jié),如模塊91瞬時(shí)。產(chǎn)生一個(gè)三聲道音頻介質(zhì)92,以便左和右音頻節(jié)目駐留在音頻介質(zhì)的左和右位置,而同時(shí)語音駐留在音頻介質(zhì)的中心聲道上。該介質(zhì)產(chǎn)生得語音電平在針對(duì)總的節(jié)目其余音頻電平的標(biāo)準(zhǔn)再現(xiàn)電平上。這保證在播放中最終用戶通過以相同電平設(shè)置語音和其余音頻電平能夠體驗(yàn)標(biāo)準(zhǔn)混音。
陰平播放設(shè)備93分配所有的音頻5.1聲道給電平調(diào)節(jié)/下混音硬件94,該硬件在前面本發(fā)明中描述過。該下混音可以被設(shè)置得從5.1聲道音頻節(jié)目產(chǎn)生立體聲節(jié)目。由于大多數(shù)音樂再現(xiàn)不需要環(huán)繞或低頻效果,為VRA再現(xiàn)的下混音是被調(diào)節(jié)語音電平與左和右音樂節(jié)目的簡(jiǎn)單組合。該產(chǎn)生多聲道方法依賴于一個(gè)事實(shí),即并非大多數(shù)最終用戶將下混音到適合節(jié)目類型的更少數(shù)量聲道。音樂是極好的例子,因?yàn)榱Ⅲw聲圖象一般滿足純音頻表演。該方法簡(jiǎn)單利用了更高容量DVD介質(zhì)可使用的外部空間,以便安置適合于下混音的對(duì)話聲道。該實(shí)施例不需要對(duì)中心聲道電平調(diào)節(jié)的上述系統(tǒng)元件進(jìn)行任何改變,但是利用了VRA能力的系統(tǒng)元件。
圖11保護(hù)色了按照本發(fā)明的圖10中描述的實(shí)施例的替代實(shí)施例??梢韵M麖S家生產(chǎn)(并且最終用戶體驗(yàn))立體定位的語音。為保持語音和保持其余音頻永遠(yuǎn)與最終用戶相互隔離并且具有立體定位能力,四音頻聲道必須傳輸給最終用戶(對(duì)于全空間再現(xiàn))。這些音頻聲道包括左音頻、右音頻、左語音和右語音。如圖10瞬時(shí),主聲道使所有音樂和空間定位錄音完整。產(chǎn)生一個(gè)多聲道錄音介質(zhì),例如5.1音頻DVD,以便左音頻(沒有語音)在單一聲道上(例如L),右音頻在R上,左語音在左環(huán)繞聲道而右語音在右環(huán)繞聲道。對(duì)純語音使用環(huán)繞聲道完全是隨意的,并且離散聲道可以用于任何上述信號(hào)而不失一般性。在生產(chǎn)和整個(gè)標(biāo)準(zhǔn)化過程中,為介質(zhì)類型確定每個(gè)音頻成分的位置;在此假設(shè)左和右語音在左和右環(huán)繞上,而左和右音頻在右聲道的左前。圖11表示了所需要的下混音和與圖10的區(qū)別。音頻增益被施加到左和右音頻信號(hào)上而語音增益被施加到左和右兩個(gè)語音信號(hào)。這允許所需要VRA調(diào)節(jié)能力。左節(jié)目然后通過將左語音和左音頻組合而產(chǎn)生,而右節(jié)目通過將右音頻和右語音組合產(chǎn)生,如圖所示。作為上述過程的結(jié)果,將獲得純立體聲節(jié)目同時(shí)最終用戶仍然能夠調(diào)節(jié)VRA比率。
本發(fā)明的實(shí)施例公開一個(gè)方法,用于通過利用安裝語音的多聲道進(jìn)行錄音而保證下混音技術(shù)與中心聲道調(diào)節(jié)系統(tǒng)元件兼容。建議將語音安置在中心聲道上,以便下混音為立體聲播放。這不排除使用用于對(duì)話或用于其余音頻的其它聲道。需要類似調(diào)節(jié)和下混音技術(shù)以重新產(chǎn)生具有所希望立體位置的總節(jié)目,而不論原來所錄音的聲道如何??墒牵绻撓到y(tǒng)元件沒有設(shè)計(jì)得禁止預(yù)定格式,下混音將不與該產(chǎn)生兼容并且最終結(jié)果將不可預(yù)測(cè)。通過保證利用中心聲道作為專用對(duì)話聲道進(jìn)行生產(chǎn),最終用戶可以利用類似系統(tǒng)元件調(diào)節(jié)任何下混音情況的VRA??梢匀匀划a(chǎn)生任何多聲道音頻格式的多聲道語音段的VRA調(diào)節(jié)(需要在幾個(gè)聲道上再現(xiàn)),只要語音與其余音頻分開產(chǎn)生的DVD上。這需要多聲道產(chǎn)生語音和其余音頻兩者并且受所使用音頻格式聲道數(shù)量的限制。
權(quán)利要求
1.一種解碼一個(gè)音頻信號(hào)的方法包括接收一個(gè)具有其上定義的多個(gè)聲道的數(shù)字音頻信號(hào),其中所述多個(gè)聲道之一是中心聲道而所述多個(gè)聲道的其它至少之一是其余音頻聲道;比較所述中心聲道與所述至少所述多個(gè)聲道的其它至少之一,以確定所述中心聲道對(duì)所述其它所述多個(gè)聲道的比率;和當(dāng)所述比率不滿足預(yù)定數(shù)值時(shí),自動(dòng)調(diào)節(jié)所述中心聲道和所述至少所述多個(gè)其它聲道之一。
2.按照權(quán)利要求1的方法,進(jìn)一步包括當(dāng)該比率數(shù)值超過所述預(yù)定數(shù)值時(shí)調(diào)節(jié)所述中心聲道和所述至少所述多個(gè)其它聲道之一的步驟。
3.按照權(quán)利要求1的方法,進(jìn)一步包括當(dāng)該比率數(shù)值低于所述預(yù)定數(shù)值時(shí)調(diào)節(jié)所述中心聲道和所述至少所述多個(gè)其它聲道之一的步驟。
4.按照權(quán)利要求1的方法,其中所述中心聲道主要是語音聲道。
5.按照權(quán)利要求1的方法,其中所述中心聲道是語音聲道。
6.按照權(quán)利要求1的方法,其中所述至少所述其它多個(gè)聲道之一包括一個(gè)非語音聲道。
7.一種音頻系統(tǒng)用于為最終用戶優(yōu)化音頻節(jié)目播放,包括一個(gè)接收機(jī)接收被編碼音頻信號(hào),所述被編碼音頻信號(hào)包括優(yōu)選的音頻信號(hào)和其余音頻信號(hào);一個(gè)解碼器耦合到所述接收機(jī),并且解碼所述編碼音頻信號(hào)以重新產(chǎn)生優(yōu)選音頻信號(hào)和其余音頻信號(hào);一個(gè)第一用戶可調(diào)節(jié)放大器耦合到所述解碼器并且調(diào)節(jié)所述優(yōu)選音頻信號(hào);一個(gè)第二用戶可調(diào)節(jié)放大器耦合到所述解碼器并且調(diào)節(jié)所述優(yōu)選其余音頻信號(hào);一個(gè)處理器連接到所述解碼器,比較所述優(yōu)選音頻信號(hào)對(duì)所述其余音頻信號(hào)的比率,并且輸出一個(gè)數(shù)值;和一個(gè)控制器,用于當(dāng)所述比率沒有滿足預(yù)定數(shù)值時(shí)自動(dòng)調(diào)節(jié)所述優(yōu)選音頻信號(hào)對(duì)所述其余音頻信號(hào)的所述比率。
8.按照權(quán)利要求7的系統(tǒng),其中當(dāng)該比率超過所述預(yù)定數(shù)值時(shí)優(yōu)選音頻信號(hào)被調(diào)節(jié)。
9.按照權(quán)利要求7的系統(tǒng),其中當(dāng)該比率低于所述預(yù)定數(shù)值時(shí)優(yōu)選音頻信號(hào)被調(diào)節(jié)。
10.按照權(quán)利要求7的系統(tǒng),其中當(dāng)該比率超過所述預(yù)定數(shù)值時(shí)其余音頻信號(hào)被調(diào)節(jié)。
11.按照權(quán)利要求7的系統(tǒng),其中當(dāng)該比率低于所述預(yù)定數(shù)值時(shí)其余音頻信號(hào)被調(diào)節(jié)。
12.按照權(quán)利要求1的系統(tǒng),其中所述優(yōu)選音頻信號(hào)主要包括語音信號(hào)。
13.按照權(quán)利要求1的系統(tǒng),其中所述優(yōu)選音頻信號(hào)包括語音信號(hào)。
14.按照權(quán)利要求1的系統(tǒng),其中所述其余音頻信號(hào)包括非語音聲道。
全文摘要
一種解碼音頻信號(hào)的方法包括接收具有多個(gè)聲道(221-226或CENTER,ALL OTHER SPEAKERS)定義的數(shù)字音頻信號(hào),其中多個(gè)聲道之一是執(zhí)行聲道(C或CENTER)而多個(gè)聲道的其他聲道至少一個(gè)是其余音頻聲道;比較中心聲道(C或CENTER)與多個(gè)其他聲道(221-24或ALLOTHER SPEAKERS)至少一個(gè);和當(dāng)該無線電臺(tái)的預(yù)定數(shù)值沒有滿足時(shí),自動(dòng)調(diào)節(jié)(232,233)中心聲道和多個(gè)其他聲道至少一個(gè)。
文檔編號(hào)H04S7/00GK1369189SQ00811414
公開日2002年9月11日 申請(qǐng)日期2000年6月13日 優(yōu)先權(quán)日1999年6月15日
發(fā)明者M·A·沃德雷, W·R·桑德斯 申請(qǐng)人:聽覺增強(qiáng)有限公司