專利名稱:用于以高質量的可變速度播放視聽媒體的系統和方法
技術領域:
本發明涉及視聽(A/V)媒體的解碼和播放。
背景技術:
傳統用于播放視聽(A/V)媒體的系統包括模擬系統(例如錄像機(VCR))、以及諸如DVD播放器、個人視頻記錄器(PVR)、機頂盒與個人電腦(PC)的數字系統。許多傳統系統包括有使用戶以快進或慢移播放模式播放A/V媒體的圖像部分功能。在這些模式的操作過程中,音頻部分通常完全關閉。換言之,在快進或慢移播放模式中,允許用戶看到快進或慢移播放的圖像部分,但是完全不能聽到音頻部分。從用戶角度看這是不合需求的,因為用戶可能期望在快速或慢速播放期間聽到A/V媒體的音頻部分。
現在將參考圖1和2示出這一原理。圖1是所示為用于播放A/V媒體的傳統系統如何操作以在正常速度進行播放的功能框圖100。如在本文中使用的,“正常”表示A/V媒體不是在快進或慢移播放模式。圖2是所示為傳統系統如何在快進或慢移模式下操作的功能框圖200。圖1和圖2普遍適用于表述模擬和數字系統,以及表述處理單信道音頻信號和多信道音頻信號的系統。
如圖1所示,正常速度的播放涉及功能塊102、104、106和108。在塊102,傳統系統接收編碼的A/V信號并將其拆分為編碼的圖像信號和編碼的音頻信號。在塊104,傳統系統以正常速度將編碼的圖像信號解碼,以生成解碼的圖像信號。在塊106,傳統系統以正常速度將編碼的音頻信號解碼,以生成解碼的音頻信號。在塊108,傳統系統將解碼的圖像信號和音頻信號相互同步,并最終將他它們以正常速度播放。
如圖2所示,快速或慢速播放僅涉及功能塊202、204和206。在塊202,傳統系統接收編碼的A/V信號并從中析取編碼的圖像信號。在塊204,傳統系統以正常速度的X倍對編碼的圖像信號進行解碼,其中X為正常解碼/播放的預定義的乘數。當想要快速播放時,X大于1;而想要慢速播放時,X小于1。因此,例如X=0.5時,將使播放速度降低一半;而當X=2時,播放速度為正常速度的2倍。在塊206,傳統系統然后以期望的速度倍數X播放解碼的圖像信號。
如圖2所示,傳統系統中的快進或慢移播放通常不提供任何音頻播放。這可能因為在快進模式中,必須使數據解碼的速率相對于快進功能的速度而增長。這樣,如果播放速度提高1倍,則圖像和音頻數據的解碼速率必須加倍;如果播放速度提高2倍,則圖像和音頻數據的解碼速率必須變為原正常速度的3倍;依此類推。因此,必須使用額外的處理功率以滿足這些增加的解碼需求。當音頻信號為多信道編碼音頻(諸如杜比數字(Dolby Digital)(AC-3)或MPEG多信道音頻)時,系統必須包括大量的額外處理功率以提供所有音頻信道的加速的處理。這些用于處理功率的增加的需求導致了實施播放A/V媒體系統的成本增加。
試圖在快進或慢移模式中播放音頻中出現的另一難點是在仍獲得高質量音頻播放效果的情況下將音頻信號與圖像信號同步。例如,簡單地增加或降低音頻部分的播放速度以匹配圖像部分的播放速度將影響音頻的音色和音調,從而使人類語音在快進模式可具有高音調的類似“花栗鼠”的音調,而在慢移模式具有低音調的類似“沉睡巨人”的音調。
因此期望提供一種播放A/V媒體的系統,該系統中在快進或慢移模式時可使音頻部分隨同圖像部分一起播放。還期望提供這樣的系統,其中在快進或慢移模式中的音頻部分具有高質量,從而不改變人類語音的音色和音調。還期望提供這樣的系統,其中在快進或慢速播放模式時將對音頻信號解碼以及進行其它處理所需的處理功率最小化,并最好不超過在正常播放速度時處理音頻信號所需的處理功率。
發明內容
本發明涉及一種用于高質量可變速率播放A/V媒體的系統和方法。本發明的一個實施例使A/V媒體的音頻部分在快進或慢移模式下與A/V媒體的圖像部分一同播放。在一個實施例中,使用了時標修正以確保在快進或慢速移動模式下播放的音頻部分具有高質量。在進一步的實施例中,僅對編碼的音頻信號的部分進行解碼,以將快進或慢移期間對音頻信號解碼以及進行其它處理所需的處理功率最小化。在又一個實施例中,在快進或慢移模式期間對音頻信號解碼以及進行其它處理所需的處理功率不超過以正常播放速度處理音頻信號所需的功率。
特別地,本發明的一個實施例提供了一種用于處理以預定播放速度播放的A/V媒體的方法。根據該方法,編碼的圖像信號被接收,而編碼的音頻信號也被接收。編碼的音頻信號包括對應于多個音頻信道的信息。編碼的圖像信號被解碼以生成解碼的圖像信號。編碼的音頻信號被解碼以生成解碼的音頻信號,其中將編碼的音頻信號解碼包括僅將對應于多個音頻信道的子集的信息解碼。然后將解碼的音頻信號進行時標修正,以生成時標修正音頻信號。最后,將解碼的圖像信號以及時標修正的音頻信號同步,從而在預定的播放速度播放。
在本發明的一個替換實施例中,提供了一種用于處理以預定播放速度播放的A/V媒體的方法。根據該方法,編碼的圖像信號被接收,而編碼的音頻信號也被接收。編碼的音頻信號包括對應于多個頻率部分的信息。將編碼的圖像信號解碼以生成解碼的圖像信號。將編碼的音頻信號解碼以生成解碼的音頻信號,其中將編碼的音頻信號解碼包括僅將對應于多個頻率部分的子集的編碼音頻信號中的信息解碼。然后將解碼的音頻信號進行時標修正,以生成時標修正音頻信號。最后,將解碼的圖像信號以及時標修正的音頻信號同步,從而在預定的播放速度播放。
在本發明的另一替換實施例中,提供了一種用于處理以預定播放速度播放的A/V媒體的方法。根據該方法,編碼的圖像信號被接收,而編碼的音頻信號也被接收。將編碼的圖像信號解碼以生成解碼的圖像信號。將編碼的音頻信號解碼以生成解碼的音頻信號。然后將解碼的音頻信號進行時標修正以生成時標修正的音頻信號。最后,將解碼的圖像信號以及時標修正的音頻信號同步,從而在預定的播放速度播放。
在本發明的另一替換實施例中,提供了一種用于處理以預定播放速度播放的A/V媒體的方法。根據該方法,編碼的圖像信號被接收,而編碼的音頻信號也被接收。將編碼的圖像信號解碼以生成解碼的圖像信號。將編碼的音頻信號解碼并進行時標修正以生成時標修正的音頻信號。最后,將解碼的圖像信號以及時標修正的音頻信號同步,從而在預定的播放速度播放。
本發明的一個實施例提供了一種用于處理以預定播放速度播放的A/V媒體的系統。該系統包括接收編碼的圖像信號的裝置和接收編碼的音頻信號的裝置。編碼的音頻信號包括對應于多個音頻信道的信息。該系統還包括將編碼的圖像信號解碼以生成解碼的圖像信號的裝置,以及將編碼的音頻信號解碼以生成解碼的音頻信號的裝置,其中將編碼的音頻信號解碼的裝置包括僅將對應于多個音頻信道的子集的編碼音頻信號中的信息解碼的裝置。該系統進一步包括將解碼的音頻信號進行時標修正以生成時標修正音頻信號的裝置,以及將解碼的圖像信號以及時標修正的音頻信號同步從而在預定的播放速度播放的裝置。
在本發明的替換實施例中,還提供了一種用于處理以預定播放速度播放的A/V媒體的系統。該系統包括接收編碼的圖像信號的裝置和接收編碼的音頻信號的裝置。編碼的音頻信號包括對應于多個頻率部分的信息。該系統還包括將編碼的圖像信號解碼以生成解碼的圖像信號的裝置,以及將編碼的音頻信號解碼以生成解碼的音頻信號的裝置,其中將編碼的音頻信號解碼的裝置包括僅將對應于多個頻率部分的子集的編碼音頻信號中的信息解碼的裝置。該系統進一步包括將解碼的音頻信號進行時標修正以生成時標修正音頻信號的裝置,以及將解碼的圖像信號以及時標修正的音頻信號同步從而在預定的播放速度播放的裝置。
在本發明的另一替換實施例中,還提供了一種用于處理以預定播放速度播放的A/V媒體的系統。該系統包括接收編碼的圖像信號的裝置和接收編碼的音頻信號的裝置。該系統還包括將編碼的圖像信號解碼以生成解碼的圖像信號的裝置,以及將編碼的音頻信號解碼以生成解碼的音頻信號的裝置。該系統進一步包括將解碼的音頻信號進行時標修正以生成時標修正音頻信號的裝置,以及將解碼的圖像信號以及時標修正的音頻信號同步從而在預定的播放速度播放的裝置。
在本發明的另一替換實施例中,還提供了一種用于處理以預定播放速度播放的A/V媒體的系統。該系統包括接收編碼的圖像信號的裝置和接收編碼的音頻信號的裝置。該系統還包括將編碼的圖像信號解碼以生成解碼的圖像信號的裝置,以及將音頻信號解碼并進行時標修正以生成時標修正音頻信號的裝置。該系統進一步包括將解碼的圖像信號以及時標修正的音頻信號同步從而在預定的播放速度播放的裝置。
根據本發明的一個方面,提供了一種用于處理以預定播放速度播放的A/V媒體的方法,包括接收編碼的圖像信號;接收編碼的音頻信號;該編碼的音頻信號包括對應于多個音頻信道的信息;將編碼的圖像信號解碼以生成解碼的圖像信號;將編碼的音頻信號解碼以生成解碼的音頻信號,其中將編碼的音頻信號解碼包括僅將對應于多個音頻信道的子集的編碼的音頻信號中的信息解碼;將解碼的音頻信號進行時標修正,以生成時標修正音頻信號;以及將解碼的圖像信號與時標修正的音頻信號同步,從而在預定的播放速度播放。
優選地,該方法進一步包括
接收合并的編碼音頻-圖像信號;以及將合并的編碼音頻-圖像信號拆分為編碼的圖像信號和編碼的音頻信號。
優選地,該編碼的圖像和音頻信號為數字信號。
優選地,該編碼的圖像和音頻信號為模擬信號。
優選地,該方法還包括將編碼的音頻信號從模擬信號轉換為數字信號。
優選地,多個音頻信道的子集中的信道的數量基于預定的播放速度確定。
優選地,對應于多個音頻信道的信息包括對應于多個音頻信道中的每個信道的多個頻率部分的信息,其中將編碼的音頻信號解碼以生成解碼的音頻信號包括僅將對應于多個音頻信道的每個子集信道中的頻率部分的子集的信息進行解碼。
根據本發明的一個方面,提供了一種用于處理以預定播放速度播放的A/V媒體的方法,包括接收編碼的圖像信號;接收編碼的音頻信號,該編碼的音頻信號包括對應于多個頻率部分的信息;將編碼的圖像信號解碼以生成解碼的圖像信號;將編碼的音頻信號解碼以生成解碼的音頻信號,其中將編碼的音頻信號解碼包括僅將對應于多個頻率部分的子集的編碼音頻信號中的信息解碼;將解碼的音頻信號進行時標修正,以生成時標修正音頻信號;以及將解碼的圖像信號與時標修正的音頻信號同步,從而在預定的播放速度播放。
優選地,該方法進一步包括接收合并的編碼音頻-圖像信號;以及將合并的編碼音頻-圖像信號拆分為編碼的圖像信號和編碼的音頻信號。
優選地,該編碼的圖像和音頻信號為數字信號。
優選地,該編碼的圖像和音頻信號為模擬信號。
優選地,該方法還包括將編碼的音頻信號從模擬信號轉換為數字信號。
優選地,多個頻率部分的子集中的頻率部分數量基于預定的播放速度確定。
根據本發明的一個方面,提供了一種用于處理以預定播放速度播放的A/V媒體的方法,包括接收編碼的圖像信號;接收編碼的音頻信號;將編碼的圖像信號解碼以生成解碼的圖像信號;將編碼的音頻信號解碼以生成解碼的音頻信號;將解碼的音頻信號進行時標修正以生成時標修正的音頻信號;以及將解碼的圖像信號與時標修正的音頻信號同步,從而在預定的播放速度播放。
根據本發明的一個方面,提供了一種用于處理以預定播放速度播放的A/V媒體的方法,包括接收編碼的圖像信號;接收編碼的音頻信號;
將編碼的圖像信號解碼以生成解碼的圖像信號;將編碼的音頻信號解碼并進行時標修正以生成時標修正的音頻信號;以及將解碼的圖像信號與時標修正的音頻信號同步,從而在預定的播放速度播放。
根據本發明的一個方面,提供了一種用于處理以預定播放速度播放的A/V媒體的系統,該系統包括接收編碼的圖像信號的裝置;接收編碼的音頻信號的裝置,編碼的音頻信號包括對應于多個音頻信道的信息;將編碼的圖像信號解碼以生成解碼的圖像信號的裝置;將編碼的音頻信號解碼以生成解碼的音頻信號的裝置,其中將編碼的音頻信號解碼的裝置包括僅將對應于多個音頻信道的子集的編碼音頻信號中的信息解碼的裝置;將解碼的音頻信號進行時標修正以生成時標修正音頻信號的裝置;以及將解碼的圖像信號與時標修正的音頻信號同步從而在預定的播放速度播放的裝置。
優選地,該系統還包括接收合并的編碼音頻-圖像信號的裝置;以及將合并的編碼音頻-圖像信號拆分為編碼的圖像信號和編碼的音頻信號的裝置。
優選地,該編碼的圖像和音頻信號為數字信號。
優選地,該編碼的圖像和音頻信號為模擬信號。
優選地,該系統還包括將編碼的音頻信號從模擬信號轉換為數字信號的裝置。
優選地,多個音頻信道的子集中的信道的數量基于預定的播放速度確定。
優選地,對應于多個音頻信道的信息包括對應于多個音頻信道中的每個信道的多個頻率部分的信息,其中將編碼的音頻信號解碼以生成解碼的音頻信號包括僅將對應于多個音頻信道的每個子集信道中的頻率部分的子集的信息進行解碼。
根據本發明的一個方面,還提供了一種用于處理以預定播放速度播放的A/V媒體的系統,包括接收編碼的圖像信號的裝置;接收編碼的音頻信號的裝置,編碼的音頻信號包括對應于多個頻率部分的信息;將編碼的圖像信號解碼以生成解碼的圖像信號的裝置;將編碼的音頻信號解碼以生成解碼的音頻信號的裝置,其中將編碼的音頻信號解碼的裝置包括僅將對應于多個頻率部分的子集的編碼音頻信號中的信息解碼的裝置;將解碼的音頻信號進行時標修正以生成時標修正音頻信號的裝置;以及將解碼的圖像信號與時標修正的音頻信號同步從而在預定的播放速度播放的裝置。
優選地,該系統還包括接收合并的編碼音頻-圖像信號的裝置;以及將合并的編碼音頻-圖像信號拆分為編碼的圖像信號和編碼的音頻信號的裝置。
優選地,該編碼的圖像和音頻信號為數字信號。
優選地,該編碼的圖像和音頻信號為模擬信號。
優選地,該系統還包括將編碼的音頻信號從模擬信號轉換為數字信號的裝置。
優選地,多個頻率部分的子集中的頻率部分的數量基于預定的播放速度確定。
根據本發明的一個方面,還提供了一種用于處理以預定播放速度播放的A/V媒體的系統,包括接收編碼的圖像信號的裝置;接收編碼的音頻信號的裝置;將編碼的圖像信號解碼以生成解碼的圖像信號的裝置;將編碼的音頻信號解碼以生成解碼的音頻信號的裝置;將解碼的音頻信號進行時標修正以生成時標修正音頻信號的裝置;以及將解碼的圖像信號與時標修正的音頻信號同步從而在預定的播放速度播放的裝置。
根據本發明的一個發面,還提供了一種用于處理以預定播放速度播放的A/V媒體的系統,包括接收編碼的圖像信號的裝置;接收編碼的音頻信號的裝置;將編碼的圖像信號解碼以生成解碼的圖像信號的裝置;將音頻信號解碼并進行時標修正以生成時標修正音頻信號的裝置;
以及將解碼的圖像信號與時標修正的音頻信號同步從而在預定的播放速度播放的裝置。
本發明的進一步特征和優點,以及本發明的各實施例的結構和操作將參考附圖在以下詳細描述。應注意,本發明并不限于此處描述的特定實施例。這些實施例在此處僅用于示例目的。本領域技術人員在基于此處的教授后將清楚本發明的其他實施例。
此處結合并作為說明書一部分的附圖示出了本發明,并且與描述一起進一步說明了本發明的原理,從而使本領域的技術人員可實踐和使用本發明。
圖1是功能框圖,示出了傳統的用于播放A/V媒體的系統如何實現正常速度播放。
圖2是功能框圖,示出了傳統的用于播放A/V媒體的系統如何在快進或慢移期間操作。
圖3是根據本發明的第一實施例的用于在快進或慢移模式中播放A/V媒體的系統的功能框圖。
圖4是根據本發明的第二實施例的用于在快進或慢移模式中播放A/V媒體的系統的功能框圖。
通過以下結合附圖的詳細描述,本發明的特征和優點將變得更加清楚,在附圖中相同的引用特征表示所有對應的部件。在圖中,相同引用編號通常表示功能類似和/或結構類似的部件。部件第一次出現的圖由對應引用編號最左側的數字表示。
具體實施例方式
A.根據本發明的一個實施例的A/V媒體的快進/慢移播放圖3是根據本發明的第一實施例的用于在快進或慢移模式中播放A/V媒體的系統的功能框圖300。如本領域技術人員可基于此處提供的教授理解的是,圖300的每一個功能模塊都可容易地由硬件、軟件或硬件和軟件的結合來實現。還應注意,圖300中功能模塊的排列和定義旨在傳達概念,而不意味本發明限制于特定的實施方式。參考圖3描述的實施例可作為任何播放A/V媒體的設備或裝置(包括但不限于VCR、DVD播放器、PVR、機頂盒、或個人電腦)的組成部分而實施。
如圖3所示,流程開始于塊302,系統接收編碼的A/V信號并將其拆分為編碼的圖像信號和編碼的音頻信號。編碼的A/V信號可從本地存儲媒體(例如VHS磁帶、DVD、或硬盤驅動器)中讀取,或者通過網絡(例如線纜和/或光纖寬帶通訊網絡)從遠端位置接收。
在塊304,系統以X倍速度將編碼的圖像信號解碼以生成X倍速度的解碼圖像信號,其中X為正常解碼/播放速率的預定乘數。當期望快速播放時,X大于1;當需要慢速播放時,X小于1。針對快速或慢速播放解碼編碼的圖像信號的技術是本領域的公知技術,任意適當的技術可用于實現塊304的功能。例如,在一些針對快速播放而處理編碼的圖像信號技術中,圖像幀被丟棄。如另一實例,在一些針對慢速播放而處理編碼的圖像信號技術中,相同數量的圖像幀被解碼以播放,但它們播放較長的一段時間。然而,應注意,本發明并不限于任何特定的針對快速或慢速播放而對編碼的圖像信號進行解碼的技術。
在塊306,系統為編碼的音頻信號提供正常解碼。如本文中使用的,“正常”表示所采用的編碼的音頻信號解碼方式與正常播放A/V媒體的速度相同(即不是快進和慢移播放)。
根據本發明的實施例,編碼的音頻信號可包括模擬信號或數字信號。編碼的音頻信號還可包括單一(單)信道音頻信號和多信道音頻信號。根據本發明的實施例,可以支持的單信道音頻格式的示例包括但不限于具有單音頻的VHS錄像帶。根據本發明的實施例,可以支持的多信道音頻格式的示例包括但不限于高保真立體聲VHS錄像帶、杜比環繞、杜比數字5.1、杜比數字EX、DTS數字環繞、DTS ES 6.1或MPEG多信道音頻。
在步驟308,系統對正常解碼的音頻信號進行時標修正以匹配音頻信號的X倍播放速度。時標修正指在保留信號本地頻率內容時用于改變音頻信號持續時長的各種技術。時標修正的目的是提高或降低記錄的音頻信號的感知播放速率,而對原始信號的音色、音調或逼真度沒有明顯影響。有很多種已知的時標修正技術,且為一個給定的應用選擇適當的運算法則涉及設計選擇。應注意,本發明并不限于任何特定的時標修正技術。
在步驟310,實現時標修正之后,系統將解碼的圖像信號和時標修正的音頻信號同步,并將它們以X倍速度播放。這樣,根據本發明的一個實施例,在快進或慢移模式觀看A/V媒體的用戶將還可聽到高質量、時標修正的音頻,其中音頻與加速或減速播放的圖像信號同步。
相對于傳統播放A/V媒體的系統(通常在這些操作模式下完全省略音頻部分的播放),本發明以上描述的實施例在快進或慢移模式期間播放時標修正的音頻部分,具有顯著的優點。但是應注意,參考圖3描述的實施例相對于現有系統或許需要額外的處理功率,以在快進或慢移播放模式期間將音頻信號解碼和進行時標修正。這些增加的處理功率的需求轉化為播放A/V媒體系統實現時的成本的增加。
B.根據本發明的一個實施例的使用部分音頻解碼來快進/慢移播放A/V媒體圖4是根據本發明的第二實施例的用于在快進或慢移模式中播放A/V媒體的系統的功能框圖400。該第二實施例意圖在快進或慢移模式期間,對音頻信號解碼和進行其它處理時,最小化所需的處理功率。事實上,該實施例可用于將在快進或慢移模式期間處理音頻信號的處理功率最小化,從而使所需的處理功率不超過以正常播放速度解碼音頻所需的功率。如將在以下詳細描述的,圖4的實施例通過僅解碼部分編碼的音頻信號而節省處理功率。
如本技術領域人員基于此處提供的教授可理解的,圖400的每一功能塊可容易地通過硬件、軟件或硬件和軟件的結合來實現。還應注意,圖400中功能塊的排列和定義旨在傳達概念,而不意味將本發明限制于特定的實施方式。參考圖4描述的實施例可作為任何播放A/V媒體的設備或裝置(包括但不限于VCR、DVD播放器、PVR、機項盒、或個人電腦)的組成部分而實施。
如圖4所示,流程開始于塊402,系統接收編碼的A/V信號并將其拆分為編碼的圖像信號和編碼的音頻信號。在塊404,系統以X倍速度將編碼的圖像信號解碼以生成X倍速度的解碼圖像信號,其中X為正常解碼/播放速率的預定乘數。當期望快速播放時,X大于1;當需要慢速播放時,X小于1。針對快速或慢速播放而解碼編碼的圖像信號的技術是本領域的公知技術,任意適當的技術可用于實現塊404的功能。應注意,本發明并不限于任何特定的針對快速或慢速播放而對編碼的圖像信號進行解碼的技術。
在步驟406,僅部分解碼編碼的音頻信號。根據本發明的實施例,部分解碼包括(1)部分信道解碼,其中僅多信道編碼音頻信號中的多個信道的子集被解碼;(2)部分帶寬解碼,其中僅編碼音頻信號中的多個頻率部分的子集被解碼;或者(3)部分信道/帶寬解碼,其中僅多信道編碼音頻信號的多個信道的子集被解碼,以及僅這些信道內的頻率部分的子集被解碼。然而,這些例子并不意圖限制本發明,而本發明可包括部分解碼編碼的音頻信號的其他方法。
部分信道解碼具有如下優點盡管提供了多信道音頻,僅需要對這些信道的子集進行解碼,以在快進或慢移模式期間將適當的音頻播放提供給用戶。這樣,例如,編碼的音頻信號為總共具有5個音頻信道的杜比數字5.0信號時,對于快進或慢移模式期間的播放,可僅對兩個音頻信道進行解碼。例如,僅對右前和左前信道解碼。盡管用戶在快進或慢移期間不能收聽到所有5個音頻信道,但他或她仍可聽到音頻部分,而通過僅解碼音頻信道的子集可顯著節省處理功率。
例如,可以預料,在2倍速快進模式中僅解碼5信道音頻信號中的2個信道,需要的處理功率與在正常播放模式中解碼四音頻信道所需的功率相當。這意味著,在具有足夠處理功率以在正常播放模式中解碼5音頻信道的系統中,在2倍快進模式期間實際上是節省了等于解碼一個音頻信道的處理功率。所節省的處理功率可用于對部分解碼的音頻信號進行時標修正,如將在以下更詳細討論的。
如另一個例子,5信道音頻信號中僅一個信道可在4倍快進模式中解碼。例如,僅中央信道可被解碼。可以預料的是,在正常播放模式具有解碼5音頻信道的足夠處理功率的系統中,這也可節省等于用于解碼系統中一個音頻信道的處理功率。再次地,所節省的處理功率可被用于對部分解碼的音頻信號進行時標修正。
部分帶寬解碼具有以下優點許多傳統音頻編碼器使用頻率域方法處理全頻段的音頻信號(一般來說是20Hz到20KHz),該頻率域方法將信號轉換為頻率域,然后將轉換后的信號編碼為多個不同的頻率部分。然而,僅需要解碼這些頻率部分的子集,以在快進或慢移模式期間為用戶提供合適的音頻播放。例如,本發明的一個實施例僅解碼低于10KHz的頻率部分而忽略任何高于10KHz部分,而不是解碼從20Hz到20KHz的所有頻率部分。可以預料,忽略高于10KHz頻率部分對用戶的聽覺影響將最小化;然而,卻可顯著節省處理功率。因此根據本發明的典型實施例,僅將編碼音頻信號的基帶或低波段頻率部分解碼以在快進或慢移模式下播放。
部分信道/帶寬解碼將部分信道解碼和部分帶寬解碼結合,以節省更多的處理功率。根據部分信道/帶寬解碼,僅解碼多信道編碼音頻信號中多個信道的子集,然后僅解碼每一子集信道中多個頻率部分的子集。
在一個實施例中,待解碼的編碼音頻信號的信道和/或頻率部分的數量取決于期望的播放速率。例如,在一個實施例中,在2倍速快進模式被解碼的信道和/或頻率部分比在4倍速快進模式被解碼的信道和/頻率部分多。該例子的前提是在2倍速快進模式解碼音頻信號所需處理功率比在4倍速快進模式界面所需功率少。因此,在2倍速快進模式可以得到更多處理功率以解碼額外的信道和/或頻率部分。
在編碼的音頻信號被部分解碼后,系統以X倍速度對部分解碼的音頻信號進行時標修正,如塊408所示。如參考圖3所討論的,時標修正指在保留信號本地頻率內容時用于改變音頻信號持續時長的各種技術,其目的是提高或降低記錄的音頻信號的感知播放速率,而對原始信號的音色、音調或逼真度沒有明顯影響。有很多種已知的時標修正技術,且為一個給定的應用選擇適當的運算法則涉及設計選擇。應注意,本發明并不限于任何特定的時標修正技術。
根據本發明的一個實施例,由于通過部分解碼編碼的音頻信號節省了處理功率,在慢移或快進模式實現部分解碼和時標修正音頻信號所需的合并的處理功率,可實際地小于或等于在正常播放模式實現所有編碼的音頻信號的解碼所需的處理功率。
在步驟410,在對部分解碼的音頻信號進行時標修正后,系統將解碼的圖像信號和時標修正的音頻信號進行同步,并將它們以X倍速度播放。因此,根據本發明的一個實施例,以快進或慢移模式觀看A/V媒體的用戶也將聽到高質量、時標修正的音頻,其中音頻與加速或減速播放的圖像信號同步。然而,通過僅部分解碼編碼的音頻信號節省了大量的處理功率。這使得播放A/V媒體的系統的制造商保留了處理功率的需求,而所需成本與正常的全信道、全帶寬解碼處于相同級別。
C.其他設計考慮以上描述的實施例使用時標修正來匹配正常或部分編碼音頻信號用以快速或慢速播放。時標修正被認為較其他方法更適合,因其產生了高質量的音頻輸出。例如匹配快進播放的解碼音頻信號可由周期性丟棄音頻幀(例如僅每隔一幀解碼音頻信號)實現。然而,可以預料該方法將導致較差質量的音頻,因為音頻信號通常不以補償這樣的遺失幀的方式編碼。在另一實施例中,匹配慢移播放的解碼音頻信號可由重復音頻幀實現。然而,可以預料的是該方法將導致質量很差的音頻。此外,如在上述背景技術部分指出的,簡單地提高或降低音頻部分的播放速度以匹配圖像部分的速度將影響音頻的音色和音調,將使人類的語音在快進模式具有高音調的類似“花栗鼠”的音調,而在慢移模式具有低音調的類似“沉睡巨人”的音調。
如果即使采用部分解碼處理功率約束還存在,則可使用較低復雜度的時標修正算法。如上所提的,本領域的技術人員了解很多不同的時標修正算法。
大多數傳統的時標修正技術使用數字信號處理實現。然而,如上指出的,參考圖3和圖4的實施例可適用于模擬系統(例如VCR)和數字系統(例如DVD播放器)兩者。因此,當系統為模擬系統且使用數字信號處理來實現時標修正時,假定在時標修正之前在音頻處理路徑中提供模擬到數字轉換功能。例如,可提供A/D轉換作為解碼功能的一部分,或者作為完全獨立的操作,盡管概念上差異較大。
在快進功能應用到模擬信號源的實施例中,對模擬音頻信號進行數字化處理將得到采樣率比“正常(1倍)”速率大的數字音頻信號。假定時標修正算法期望輸入具有正常速率的數字音頻信號,則必須在應用時標修正之前改變采樣速率。
這可通過許多方式實現。在一個實施例中,A/D轉換功能以增大的采樣速率對音頻信號采樣,然后將數字化的信號當作具有正常的采用速率的信號一樣處理。例如,假定用于數字音頻的正常采樣速率為48KHz,而使用了2倍速快進功能。在一個實施例中,在A/D轉換期間,模擬信號以96KHz的采樣率進行數字化,但在其數字化之后,將音頻信號當作48KHz的信號一樣處理。結果,它將以2倍的時間完成播放,從而在它流入時標修正算法之前,從2倍速模擬信號回復到正常的1倍速數字域。如果期望1.5倍速,則乘以1.5后的48KHz采樣率(即72KHz)可用于將模擬音頻信號數字化。
在一個替換實施例中,A/D轉換功能以正常采樣率采樣,然后根據實際播放速度,將其當作具有不同采樣率的數字化的信號一樣處理。因此,例如,在A/D轉換期間,將模擬信號在48KHz(正常采樣率)數字化;然后,對于2倍速快進功能,將它當作24KHz采樣信號一樣處理,或對于1.5倍速快進功能,將它當作32KHz采樣信號一樣處理。對于2倍速慢移,模擬信號可在48KHz數字化,然后將其當作96KHz采樣信號一樣處理。
以下將對參考圖3和圖4中描述實施例中的音頻處理方法作進一步討論。在那些實施例中,為了表述清楚,解碼功能和時標修正功能顯示為分離的操作。然而在一些實施例中,這些函數可合并為一個單個操作。
語音的一個典型模型為“語音編碼器模型”。根據該模型,包括有元音聲的有聲語音在時間域中呈現為周期性波形,其中周期即為音調或音調周期。音調周期的倒數為音調頻率。無聲語音(unvoiced speech)呈現為隨機噪音,但為頻譜形狀。通過將白噪音(white noise)經過一些濾波器而使其具有一些頻譜波峰和波谷,能夠很好地模擬無聲語音。另外,還有一些過渡段。
時標修正可在保存信號的本地頻率內容時改變音頻信號持續時間。如何實現時標修正可采用不同的技術,但是在多數情況下,如果要保持音調,則元音波形不能改變。例如,假定100毫秒(ms)語音信號包括10個特定元音聲的音調周期。如果想要以2倍速快進播放該信號,則可丟棄5音調周期,而剩下具有相同周期長度和音調頻率的5音調周期。
對于無聲語音,這可被模仿為經過濾波器的白噪音,其中濾波器可改變。假定想要將無聲語音提速一倍,則可將濾波器特性變為兩倍(即一半的時間),并仍然保持噪音激發。
在參考圖3和圖4描述的實施例中,音頻信號的解碼和時標修正描述為分離的操作步驟。然而,基于以前的原理,這兩個步驟可合并為單個步驟,而仍然保持本發明的精神和范圍。
例如,假定期望采用2倍速快進功能,且編碼的音頻信號為簡單脈沖編碼調制(PCM)信號,其中每一數字樣本通過相互獨立濾波的代碼字表示。在這樣的系統中,解碼和時標修正步驟可容易地合并到一個操作中。例如,執行2倍速快進功能,在解碼期間每隔一個聲音語音周期可跳過。因此如果聲音語音為8個周期長,在解碼期間每隔一個周期跳過,將生成4個周期長的聲音語音信號以及兩倍的速度因子。對于無聲語音,可在解碼期間跳過一定數量的采樣,然后可將剩余部分連接到一起。或者,為了將信號減慢一半,可在解碼期間重復每一音調周期,或者重復聲音波形的代碼片斷。
因此,如上所述,根據本發明的一個實施例,音頻信號的解碼和時標修正可合并為單個操作步驟。
D.結論盡管本發明的實施例已表述如上,可理解的是,它們僅用于例示本發明,而非限制。本領域技術人員可理解的是,在不脫離本發明的權利要求的精神和范圍內可對此處描述的細節做各種改變。因此,本發明的寬度和范圍不應由上述任一典型實施例來限制,而應根據權利要求和它們的等效來定義。
權利要求
1.一種用于處理以預定播放速度播放的視聽媒體的方法,其特征在于,包括接收編碼的圖像信號;接收編碼的音頻信號,所述編碼的音頻信號包括對應于多個音頻信道的信息;將所述編碼的圖像信號解碼以生成解碼的圖像信號;將所述編碼的音頻信號解碼以生成解碼的音頻信號,其中將編碼的音頻信號解碼包括將僅對應于多個音頻信道的子集的編碼的音頻信號中的信息解碼;對所述解碼的音頻信號進行時標修正,以生成時標修正的音頻信號;以及將所述解碼的圖像信號與時標修正的音頻信號同步,以便在預定的播放速度播放。
2.根據權利要求1所述的方法,其特征在于,還包括接收合并的編碼音頻-圖像信號;以及將所述合并的編碼音頻-圖像信號拆分為編碼的圖像信號和編碼的音頻信號。
3.根據權利要求1所述的方法,其特征在于,所述編碼的圖像信號和音頻信號為數字信號。
4.一種用于處理以預定播放速度播放的視聽媒體的方法,其特征在于,包括接收編碼的圖像信號;接收編碼的音頻信號,所述編碼的音頻信號包括對應于多個頻率部分的信息;將所述編碼的圖像信號解碼以生成解碼的圖像信號;將所述編碼的音頻信號解碼以生成解碼的音頻信號,其中將編碼的音頻信號解碼包括將僅對應于多個頻率部分的子集的編碼音頻信號中的信息解碼;對所述解碼的音頻信號進行時標修正,以生成時標修正的音頻信號;以及將所述解碼的圖像信號與時標修正的音頻信號同步,以便在預定的播放速度播放。
5.一種用于處理以預定播放速度播放的視聽媒體的方法,其特征在于,包括接收編碼的圖像信號;接收編碼的音頻信號;將所述編碼的圖像信號解碼以生成解碼的圖像信號;將所述編碼的音頻信號解碼以生成解碼的音頻信號;對所述解碼的音頻信號進行時標修正以生成時標修正的音頻信號;以及將所述解碼的圖像信號與時標修正的音頻信號同步,以便在預定的播放速度播放。
6.一種用于處理以預定播放速度播放的視聽媒體的方法,其特征在于,包括接收編碼的圖像信號;接收編碼的音頻信號;將所述編碼的圖像信號解碼以生成解碼的圖像信號;將所述編碼的音頻信號解碼并進行時標修正以生成時標修正的音頻信號;以及將所述解碼的圖像信號與時標修正的音頻信號同步,以便在預定的播放速度播放。
7.一種用于處理以預定播放速度播放的視聽媒體的系統,其特征在于,包括接收編碼的圖像信號的裝置;接收編碼的音頻信號的裝置,所述編碼的音頻信號包括對應于多個音頻信道的信息;將所述編碼的圖像信號解碼以生成解碼的圖像信號的裝置;將所述編碼的音頻信號解碼以生成解碼的音頻信號的裝置,其中所述將編碼的音頻信號解碼的裝置包括將僅對應于多個音頻信道的子集的編碼音頻信號中的信息解碼的裝置;將所述解碼的音頻信號進行時標修正以生成時標修正的音頻信號的裝置;以及將所述解碼的圖像信號與時標修正的音頻信號同步以便在預定的播放速度播放的裝置。
8.一種用于處理以預定播放速度播放的視聽媒體的系統,其特征在于,包括接收編碼的圖像信號的裝置;接收編碼的音頻信號的裝置,所述編碼的音頻信號包括對應于多個頻率部分的信息;將所述編碼的圖像信號解碼以生成解碼的圖像信號的裝置;將所述編碼的音頻信號解碼以生成解碼的音頻信號的裝置,其中將編碼的音頻信號解碼的裝置包括將僅對應于多個頻率部分的子集的編碼音頻信號中的信息解碼的裝置;對所述解碼的音頻信號進行時標修正以生成時標修正的音頻信號的裝置;以及將所述解碼的圖像信號與時標修正的音頻信號同步以便在預定的播放速度播放的裝置。
9.一種用于處理以預定播放速度播放的視聽媒體的系統,其特征在于,包括接收編碼的圖像信號的裝置;接收編碼的音頻信號的裝置;將所述編碼的圖像信號解碼以生成解碼的圖像信號的裝置;將所述編碼的音頻信號解碼以生成解碼的音頻信號的裝置;對所述解碼的音頻信號進行時標修正以生成時標修正的音頻信號的裝置;以及將所述解碼的圖像信號與時標修正的音頻信號同步以便在預定的播放速度播放的裝置。
10.一種用于處理以預定播放速度播放的視聽媒體的系統,其特征在于,包括接收編碼的圖像信號的裝置;接收編碼的音頻信號的裝置;將所述編碼的圖像信號解碼以生成解碼的圖像信號的裝置;將所述編碼的音頻信號解碼并進行時標修正以生成時標修正的音頻信號的裝置;以及將所述解碼的圖像信號與時標修正的音頻信號同步以便在預定的播放速度播放的裝置。
全文摘要
本發明提供了一種用于以高質量的可變速度播放視聽媒體的系統和方法。該系統接收編碼的圖像信號和編碼的音頻信號。將編碼的圖像信號解碼以生成解碼的圖像信號,并將編碼的音頻信號解碼以生成解碼的音頻信號。將解碼的音頻信號進行時標修正從而生成時標修正的音頻信號。然后使解碼的圖像信號和時標修正的音頻信號同步,以在預定播放速度播放。僅對編碼的音頻信號進行部分解碼處理,可節省處理功率。
文檔編號G11B27/00GK1700757SQ200510072548
公開日2005年11月23日 申請日期2005年5月12日 優先權日2004年5月13日
發明者朱因韋·陳 申請人:美國博通公司