專利名稱:數字音頻信息在其存儲媒介上的多路調制編碼方法與裝置的制作方法
技術領域:
本發明涉及能顯著擴展激光盤、袖珍盤、數字音頻磁帶及其它常規數字錄音媒介有效容量的方法與裝置,更具體而言涉及將多數字聲信號多路調制到數字通道上的方法及其相關裝置,其中該通道正為這些記錄媒介上的脈沖編碼調制(PCM)數字音頻通道所占用。
目前市場上標準的數字音頻格式為雙通道立體聲16位線性PCM系統。這種編碼形式用于袖珍盤(CDs)、激光盤和數字音頻磁帶(DAT),以及專業數字磁帶錄音機。它在略高于90dB的動態范圍內提供雙聲道,且對于常規的CD,它提供大約一小時的錄音時間。一種誤差修正技術系統被用來檢測并修正位誤差,從而導致了能給出可靠的高質量立體聲錄音的系統。
盡管16位線性數字音頻可提供良好的錄音質量,但它還不能達到非常高的質量標準以滿足錄音愛好者的要求。目前已經出現了新的20位模-數編碼器和數-模解碼器,但這些器件不能與用于現有CD和激光盤的16位線性PCM技術相兼容;從而該新型編碼器和解碼器對質量的改善不能在現行的數字音頻標準中實現。
常規數字錄音媒介對雙通道立體聲的限制以及大約一小時的錄音時間也是不合要求的。例如,六聲道裝置將具有產生類似于十足裝備的六軌劇場環境收聽效果的潛力。另外,可在單個盤上進行遠超過一小時的錄音,這在許多情況下將是有利的,同時其非常迅速的盤存取能力仍將允許錄音的任何部分被快速和方便地存取。
本發明的目的在于提供一種方法和裝置,其用于將更高質量的多通道數字音頻存儲于常規錄音媒介(如CD、激光盤和DAT)的立體聲通道和/或進行比該媒介通常所能實現的錄音時間更長的錄音。該系統有足夠的適應性,能處理許多不同種類的音頻輸入,且不需要特別的新成分。
該目的通過壓縮多軌輸入數字音頻信號的數據比特率以使其壓縮后組合數據比特率不超過該音頻存儲媒介的最大數據比特率而實現。接著,該壓縮信號相互進行多路調制以產生一多路調制信號,該信號具有不超過該存儲媒介最大容量的數據比特率。在編碼成該存儲媒介所使用的格式之后(例如常規的AES/EBU),該多路調制信號被記錄在該存儲媒介之上。實現重放的過程是,從存儲媒介上讀取所錄信號,對該讀取信號以與編碼方式互補的方式進行解碼,對該解碼信號以與多路調制方式互補的方式進行信號分離,再對該分離信號以與壓縮方式互補的方式進行解壓縮。然后該解壓縮信號可通過數-模變換器(DAC)進行處理并提供給揚聲器。
壓縮因子的選擇與輸入信號通道的數據比特率、錄音媒介的數據比特率容量以及輸入通道數相關,以便使壓縮后輸入信號的組合數據比特率不超過該錄音媒介的容量。用于存儲音頻采樣的錄音媒介具有對每個采樣預定的位數,從而壓縮輸入信號被多路調制成具有相同位數的數據組。盡管這樣會導致某些輸入采樣被分離在不同的數據組之中,但互補的解碼處理可恢復原始采樣的完整性。
不同輸入格式要求不同類型的多路調制,為適應這一點,可將識別標志碼與該輸入信號一起錄入以保證信號分離以互補的方式進行。這一點的實現,可指定32位AES/EBU子系統中的一位作為識別標志,也可提供一個獨立的模式識別輸入。當大量輸入軌道存在時,如當具有擴展長度的較低質量輸入軌道被分解為用以順序編碼的大量子通道時,可利用中等存儲媒介編輯各個輸入通道組以進行多路調制。
附圖簡要說明
圖1為將多數字音頻輸入在數字存儲媒介上進行編碼的系統框圖,該數字存儲媒介的容量小于輸入信號組合的容量;圖2為解碼系統的框圖,該系統用于從該存儲媒介上重現該數字音頻信號;圖3描述了較高比特級音頻輸入信號至記錄于數字音頻存儲媒介的較低比特級數據流的壓縮與多路調制;圖4為另一種用于大量輸入數據通道的多路調制方案的框圖;圖5的數據圖描述了用于本發明優選方案的常規AES/EBU接口標準;圖6A1~圖6A7以及圖6B1~圖6B7共同組成了用于本發明優選方案的AES/EBU編制器的原理圖;圖7A1~圖7A7、圖7B1和圖7B2以及圖7C1~圖7C7共同組成了用于本發明優選方案的解碼器的原理圖。
本發明給出了將六個或甚至更高質量(即20位)的數字音頻通道可兼容地編碼于常規立體聲PCM數據比特流上的方法,因而極大地擴展了數字音頻存儲媒介(如CD、激光盤和DAT)的有效數據存儲容量。例如,在通常只能存儲大約一小時立體聲(雙通道)16位音頻的CD上,這種方法可記錄一小時六軌超高保真20位音頻,或記錄四小時16位立體聲數字音頻,或記錄四十小時調幅射頻質量的音頻。
編碼系統的框圖在圖1中給出。多軌數字音頻輸入信號CH1、CH2…CHn以線性數字音頻格式而給出,其典型格式為對每個采樣16、18或20位。如果本發明用于記錄超高質20-20KHz帶寬的數字音頻信號,則輸入數據的形式為具有每秒24,100采樣率的20位線性PCM信號,該采樣率與常規立體聲16位線性編碼音頻相同。對于擴展時間調幅質量的音頻編碼,可將四十通道20-4KHz 16位線性PCM信號(其采樣率為每秒8,820)輸入該系統。
將n個輸入通道各自分別施加于數據壓縮器C1、C2…Cn,該壓縮器將輸入數據音頻壓縮成較低的數據比特率。這種數據比特率壓縮器以前已用于實時無線電及電視廣播,而同樣的壓縮器也可用于此項新應用。適合的數據壓縮器包括音頻處理技術公司的APTX100(其將數據比特率縮減四倍),DolbyRAC-3、SonyRATRAC以及European Musician壓縮規則系統。
數據壓縮算法的選擇應使得來自所有壓縮器輸出端的數據比特率的總和不超過常規雙通道16位線性PCM音頻的數據比特率。例如,如果有20位數據的六個輸入通道,則4∶1的壓縮率將實現足夠的壓縮。這六個20位輸入通道中每一個具有1.25倍于16位立體聲通道的數據比特率,而輸入通道的數量為立體聲通道的三倍。因而,壓縮前的組合輸入信號數據率為該16位數據比特率的3.75倍。從而將該輸入信號的數據比特率壓縮四倍便滿足了組合壓縮輸入數據比特率不超過16位立體聲數據比特率的要求。
壓縮音頻信號由多路調制器2相互進行多路調制。該多路調制可以用若干方式實現。最簡單的方法是以反復的方式循環該壓縮輸入,而在每個周期順序從各個壓縮輸入中提取一位或一組位。在優選方案中(這將在下面進行詳細說明),依次從每個壓縮器提取16位數據單元以產生在數據比特率上等價于16位雙通道立體聲信號的多路調制輸出。
在該多路調制的過程中,要求該調制數據在優選AES/EBU格式的數據單元中是位置穩定的,以便使來自基本CD或其它數字存儲媒介誤差修正裝置的插值與代換在最終多路調制信號重現時產生最小的音頻誤差。正象在上述六通道20位輸入音頻信號的場合,如果來自壓縮器的組合數據率小于16位線性PCM立體聲數據率,則附加的位誤差修正可利用常規的誤差修正芯片裝置(如Reed Solomon誤差修正規范)而引入該數字多路調制器。
多路調制器2的輸出可選擇存入數據文件4(如計算機硬盤),在那里可進行編輯函數或添加同步信號之類的附加處理。然后,該多路調制信號被送入常規編制器6,該編制器將該信號編制成用于記錄在數字音頻存儲媒介上的適當格式;本應用中的常規格式為AES/EBU。該多路調制信號在數據率上等效于雙通道16位線性PCM,從而對于AES/EBU編制器6而言它等效于常規的立體聲信號。適合的編制器由若干公司生產,例如由晶體半導體公司生產的CS8401、CS8402數字音頻接口傳送器。
為最大程度地增加處理不同類型輸入音頻信號的靈活性,該多路調制器2應當可調以接受不同數目的輸入通道,并允許選擇在多路調制周期內從各個通道所提取的數據位數。常規AES/EBU編制器(又稱為接口傳送器)包括用戶位輸入端8,該端口允許多路調制模式被記錄在AES/EBU比特流之內。當該比特流在重放過程中從數字錄音媒介上被解時,該多路調制模式信息被利用來控制信號分離。另一方面,可加入移位寄存器以將壓縮用戶信息直接置于具有AES/EBU格式的20位音頻數據部分之中,這將在下面加以介紹。該格式化數字音頻數據通過常規數字錄音機10被記錄在CD、激光盤、DAT或其它類型設計的數字錄音媒介12上。
將該錄制數字音頻數據轉換成驅動揚聲器的模擬聲音信號的解碼系統如圖2所示。它包括常規數字重放裝置14,用以讀出記錄在存儲媒介上的音頻數據,并將該數據以標準AES/EBU系列比特流的形式輸出。AES/EBU接口接收機(如晶體半導體公司的CS8411或CS8412)以與圖1中AES/EBU編制器6相互補的方式進行工作以產生等價于雙通道16位線性PCM的輸出。AES/EBU接口接收機16的輸出由信號分離器18進行信號分離,該信號分離器以互補于圖1多路調制器2的方式進行工作。利用將適當的控制信號沿輸出線22送至信號分離器18,AES/EBU用戶位可通過附加微處理器控制器20讀出并被用來選擇編碼過程中任何不同形式的多路調制方案。信號分離模式也可以人為選定,可直接或通過該控制器的用戶輸入端24進行選擇。該控制器的另一個輸出26設定系統時鐘28的采樣時鐘率。例如,在不同于高保真錄音的擴展調幅質量錄音的情況下,采樣率從每秒44,100減至每秒8,820;而該時鐘率必須與用于錄音過程的采樣率相匹配。
來自信號分離器18的比特流輸出被饋至數字音頻解壓器D1、D2…Dn,其方式與由圖1中多路調制器2從壓縮器C1、C2…Cn接收壓縮音頻輸入信號的方式相互補。最后,來自信號分離器D1、D2…Dn的輸出被分別送到數-模變換器DAC1、DAC2…DACn。在此,它們被轉變成模擬信號,通過輸出線01、02…0n進行傳送以驅動揚聲器。在目前最高數字音頻質量的情況下,由這些DAC而來的輸出可達到22或甚至24位線性PCM編碼。
圖3描述了由圖1所示系統將載有高質量音頻信號(如20位)的多音頻輸入通道加工成模擬用于AES/EBU編制器6的常規16位立體聲輸入的方式。輸入通道CH1、CH2…CHn被描述為包含20位采樣S1、S2、S3、S4等的各個系列比特流。這些輸入信號被壓縮器C1、C2…Cn壓縮成5位壓縮采樣信號CS1、CS2、CS3、CS4等。多路調制器2對壓縮通道進行循環,在每個周期內對每個通道提取16位。這代表了來自三個完整采樣的位,再加上來自第四采樣的附加位。在圖3中,來自CH1的字30包含通道1數據比特流中三個5位采樣再加上來自第四采樣的第一位,該字被該多路調制器所獲取并將其放入輸出多路調制數據比特流32。隨后再從CH2獲取包含三個5位采樣加上來自第四采樣一個附加位的字34,該字在多路調制輸出中緊隨字30之后。該多路調制以這種方式繼續進行直到第n通道中的字36,該字仍包含三個5位采樣加上來自第四采樣的一個附加位。在從最后一個通道取得一個字后,另一個循環周期開始,從第一通道取得一個新的16位字,其首位為壓縮采樣信號CS4的第二位。
表面上,這種多路調制過程不保證每個通道壓縮采樣的完整性,從而可能含預期在重放時導致輸入音頻信號的損失。然而,由于重放過程中信號分離的互補特性,該輸入采樣的完整性可在解壓縮之前得到恢復。
用于被壓縮輸入數字音頻信號的壓縮因子應足夠大以允許該信號以這種方式進行多路調制。首先,對具有比數字音頻存儲媒介所載正常位密度大的每采樣位數(如20位比16位),該壓縮因子應至少同輸入信號每采樣位數與通常存儲于存儲媒介上每采樣位數的比率相等。第二,當所提供的輸入通道數多于存儲媒介正常所存儲的通道數時(如6通道對雙通道立體聲),該壓縮因子應當至少同輸入信號通道數與存儲媒介正常所錄通道數的比率相等。當輸入信號比正常所錄既有較大每采樣位數又有較大通道數時,該壓縮因子應至少等于上述兩個比率的乘積。
圖4的框圖描述了長時間錄制相對較低質量音頻數據(如40小時單軌調幅無線電音頻)的方式。該四十小時被分成連續的部分,比如分成四十個一時部分,而每一個部分按一個獨立的通道來處理。這些不同的″通道″被組合成便于處理的組,比如組成五組,每組八個通道;這種情況在圖4中被推廣到一般情形,即每組可包含n個通道。標號數字1-1表示第一組的第一通道,1-2表示第一組的第二通道,2-1表示第二組的第一通道,余此類推。總分組數用m表示。
通道CH1-1至CHm-n中的每一個分別用于壓縮器C1-1至Cm-n。每組壓縮器的輸出又分別施加于數據文件DF1,DF2,…DFm。各組壓縮音頻輸入由其各自數據文件進行合并與編輯,而該數據文件的輸出由多路調制器2進行多路調制。該輸入音頻信號的進一步處理過程如圖1所示。
例如,如果四十小時調幅質量的音頻要記錄在通常具有一小時雙通道立體聲的CD上,可將該四十小時分成各含八個通道的五組,而把這四十個小時在這些通道之間依次分配。各組的八個壓縮通道由各自的數據文件進行合并,這五個數據文件的輸出被多路調制成AES/EBU編制器的輸入,該輸入模擬正常的16位立體聲信號。在解碼器部分,提供了互補數據文件設計以存儲解碼通道1-2至m-n,同時通道1-1被轉換成模擬格式并由揚聲器重放。在播放通道1-1的所需時間內,所有其余通道可聚集在其各自的數據文件中。順序跟隨其后的各個通道接著被重放,直到整個四十小時播放的完成。這個重放過程可以在任何需要的時間被中斷。
利用中間硬盤數據文件提供了極大的靈活性,因為同時輸入所有通道是不必要的。例如,該系統還可用于借助將四小時雙通道輸入音頻信息通過數據壓縮器錄在硬盤中間數據文件上而錄制超過四小時的立體聲數字音頻,然后將該信號編輯成八通道格式并將其以平行于AES/EBU的格式輸出這里所使用的AES/EBU格式如圖5所示,其進一步的詳細介紹請參見有關資料,如晶體半導體公司的數字音頻產品數據手冊,1994年1月,第6-35至6-68頁。該AES/EBU數據被組織成數據塊40,其中每個數據塊包含二十四個通道狀態字節42。每個字節包括八個結構44,而每個結構含有一對子結構46,其中每個子結構包含三十二位。因此數據塊40包含384個32位子結構46。在每個子結構中,前四位0-3保留作為前置位,4-7位作為輔助數據位,8-27位作為音頻數據位,28位作為有效標志位,29位作為用戶數據位,30位作為通道狀態數據位,而31位作為奇偶校驗位。29位可用于編碼當前多路調制模式;因為每個數據塊可提供總數據為384個這樣的用戶位,所以實際上可定義任意數量的多路調制模式。
圖6A1至6A7以及圖6B1至6B3共同構成了圖1所示AES/EBU編制器(發送器)6特定方案的原理圖。以下所提到的與圖6電路有關的部分數字均為工業標準術語,除了晶體半導體公司的CS8401 AES/EBU發送器U2和用于接收AES/EBU信號而為該發送器生成時鐘的晶體半導體公司的CS8412AES/EBU接收機U3之外。該電路包括75C01發送緩沖器FIFO U4,可編程邏輯PALCE22V10并一串變換器U6,用于發送DMA計時的PALCE16V8 U8,用于AES/EBU收/發計時的一對PALCE16V8 U10和U12,地址解碼器PALCE22V10U14,用于發送DMA符號交換的雙74HCT74 U16,一對74HCT374控制寄存器U18和U20,一對74HCT244狀態寄存器U22和U23以及至IBM計算機的邊緣接口48。
IBM數據文件4由DMA轉移到發送緩沖器FIFO U4。該數據讀出由信號/OUTHF所控制,其中該信號為FIFO半完全標志。IBM計算機總線信號/IOW、TC、IRQ12及DREQ0排定DMA次序。DMA由控制信號/ENDMA0起動。信號SCK為串行移位時鐘,而FSYNC為結構的同步信號;標定的FSYNC速率為44.1kHz。FSYNC的每周期四個字節被從發送緩沖器FIFO U4的輸出轉移到并一串變換器U6。U6的串行輸出SDATAO被移入AES/EBU發送器U2。U2的端口11為用戶位輸入端(圖1中數字8),它由FSYNC計時。U2的端口20為AES/EBU發送輸出端。數字錄音機(圖1中數字10)為任何可接受AES/EBU格式數據的錄音機,例如D3格式的錄像機。
特定解碼方案的原理圖由圖7A1至7A7、7B1、7B2以及7C1至7C3共同給出。該解碼器包括晶體半導體公司的CS8412 AES/EBU接收機U30;四個PALCE16V8 U32、U34、U36和U38,分別用于SYNC檢測、同步間隔檢測、在同步信號下降上自由換向以及無同步信號三毫秒之后靜默;六個音頻處理技術公司的APTX100 4∶1音頻解壓器U40、U42、U44、U48、U50和U52;三個晶體半導體公司的CS4328數一模變換器U56、U58和U60;用于解壓器的PALCE16V8中斷計時器U62;74HC14通電復位裝置U64;PALCE22V10 APT中斷發生器U66;PALCE16V8 APT輸出延遲裝置U68;MTO-TI-60MHz APT DSP時鐘42;以及三個TL072雙輸出放大器A2、A4和A6。尋址表50被提供給解壓器U40、U42、U44、U48、U50和U52。
AES/EBU接收機U30對來自數字記錄媒介的AES/EBU數據進行解碼;它執行圖2AES/EBU接收機16的功能。FSYNC輸出是結構同步信號,具有每個采樣一次的頻率,標稱值為44.1kHz。SCK輸出為位時鐘,它是解碼器的移位時鐘。SDATA輸出為串行數據,它傳至同步檢測電路和音頻解壓器。11MHz輸出為U30鎖相環的輸出,它用于對U56-U60 DAC中的數字濾波進行計時。U30-14為用戶位輸出,它由FSYNC進行計時。U32檢測串行數據中的同步模式;在本方案中,同步標志為多路調制時隙中的十六進制數$55AA。U32-18為同步檢測信號。U32的/SCK輸出對U68進行計時,它加入1/2位的延遲以產生輸出信號APTDO0DEL、APTDO1DEL及APTDO2DEL,它是DAC U56-U60的數據。
端口U34-18表明最后三個同步標志處在適當位置,而/FSYNC輸出用于區分多路調制數據的奇偶時隙。端口U36-17(即SYNC)識別用于APT音頻解壓器的時隙。它由U34-18信號進行同步。U36-18表示SYCH和U34-18是一致的;該信息用于復位計數器38,它在未收到同步信號三毫秒之后使解碼器靜默。APTDI(即解碼器串行輸入數據)在靜默情況下被置零。/MUTE信號在靜默時將U68輸出置零。
來自音頻解壓器U40、U42、U44、U48、U50和U52的解壓輸出被標記為APTDO0至APTDO2,且成對進行多路調制。音頻解壓器DAC U56、U58和U60為數一模變換器,其對應于圖2中元件DAC1、DAC2、…DACn。每個雙放大器A2、A4和A6包括兩個放大器,用以提供六通道輸出容量。
盡管所給出并介紹的是本發明的特定方案,但熟悉此項技術的人將會推演出許多變形和替代方案。因此,應當指出,本發明只受后附權利要求的局限。
權利要求
1.將具有預定數據比特率的多通道數字音頻信息記錄于永久數字存儲媒介的方法,它包括提供可存儲數字音頻信號的永久性數字存儲媒介(12),其中數字音頻信號由該存儲媒介以預定格式并以不超過預定最大數據比特率的速率所接收;提供多通道輸入數字音頻信號(CH1、CH2、…CHn),其組合數據比特率超過該最大數據比特率;壓縮(C1、C2、…Cn)該多通道輸入數字音頻信號的數據比特率以使其壓縮后的組合數據比特率不超過存儲媒介的最大數據比特率;多路調制(2)該壓縮數字音頻信號使之成為具有不超過存儲媒介最大數據比特率之比特率的多路調制信號(32);編碼(6)該多路調制信號使之具有該預定格式;將該編碼信號記錄(10)于該數字存儲媒介上。
2.根據權利要求1的方法,其中該數字存儲媒介用于存儲具有預定每采樣位數的音頻采樣信號(CS1、CS2、…),該輸入數字音頻信號被提供為具有大于預定數目每采樣位數的音頻采樣(S1、S2、…),該輸入數字音頻信號的數據比特率以該數據比特率壓縮步驟進行壓縮,其壓縮因子至少等于該輸入數字音頻信號每采樣位數與該預定每采樣位數的比率。
3.根據權利要求2的方法,其中該數字存儲媒介用于存儲預定數目的音頻通道,且該輸入數字音頻信號的數據比特率壓縮因子至少等于該每采樣位比率與輸入信號通道數同該預定音頻通道數比率的乘積。
4.根據權利要求3的方法,其中該壓縮數字音頻信號被多路調制成具有該預定位數數據組的多路調制信號。
5.根據權利要求1的方法,其中還包括在該壓縮步驟之后對該各組中間數字存儲媒介(DF1、DF2、…DFn)中的數字音頻信號進行編輯的步驟,并將該多路調制步驟施加于該編輯信號組。
6.用于將具有預定數據比特率的多通道數字音頻信號記錄于可存儲數字音頻信號的永久性數字存儲媒介(12)上的系統,其中數字音頻信號由該數字存儲媒介以預定格式并以不超過預定最大數據比特率的速率所接收,該輸入數字音頻信號具有大于該最大數據比特率的組合數據比特率;該系統包括一組用于壓縮各輸入數字音頻信號通道(CH1、CH2、…CHn)數據比特率的壓縮器(C1、C2、…Cn),以便使壓縮后的組合數據比特率不超過該存儲媒介的最大數據比特率;多路調制器(2),用于將來自該數據比特率壓縮器的輸出多路調制成具有不超過存儲媒介最大數據比特率的多路調制信號;編碼器(6),用于將來自該多路調制器的輸出編碼成該預定格式;錄音機(10),用于將來自該編碼器的輸出錄制在該數字存儲媒介上。
7.根據權利要求6的錄音系統,用于設計成存儲雙通道立體聲錄音的數字存儲媒介,其中該多路調制器生成在數據比特率方面等效于適合記錄在該數字存儲媒介上的雙通道立體聲信號的輸出。
8.根據權利要求6的錄音系統,其中該數字存儲媒介設計用于存儲具有預定每采樣位數的音頻采樣信號(CS1、CS2、…),而該壓縮器壓縮該輸入數字音頻信號的數據比特率,其壓縮因子至少等于該輸入數字音頻信號每采樣位數與該預定每采樣位數的比率。
9.根據權利要求8的錄音系統,其中該數字存儲媒介設計用于存儲預定數目的音頻通道,而該壓縮器壓縮該輸入數字音頻信號的數據比特率,其壓縮因子至少等于該每采樣位數比率與輸入信號通道數同該預定音頻通道數比率的乘積。
10.根據權利要求6的錄音系統,其中還包括中間數字存儲媒介(DF1、DF2、…DFm),用于編輯由該數據比特率壓縮器壓縮之后的各組數字音頻信號,并將該編輯信號組提供給該多路調制器。
全文摘要
具有大于數字存儲媒介(CD、激光盤或數字錄音帶)最大數據比特率之組合數據比特率的超高質或超長數字音頻通道被記錄于音頻媒介上。錄制的實現過程是,壓縮多通道輸入信號數據比特率使之壓縮后組合數據比特率不超過存儲媒介的最大值,多路調制該壓縮音頻信號,編碼該調制信號成為預定格式,最后在存儲媒介上錄制該編碼信號。重放的實現是以與錄制過程互補的方式對來自存儲媒介的信號進行解碼、信號分離及解壓縮。
文檔編號G11B20/12GK1140513SQ95191502
公開日1997年1月15日 申請日期1995年1月23日 優先權日1994年2月4日
發明者特里·D·比爾德, 詹姆斯·S·凱查姆 申請人:Dts工業技術股份有限公司