專利名稱:低比特率音頻編碼的制作方法
技術領域:
本發明涉及諸如特定音頻信號的寬帶信號的編碼和解碼。
當傳輸寬帶信號,例如諸如語音之類的音頻信號的時候,壓縮或編碼技術被用于降低信號的帶寬或比特率。
圖1示意的是一個已知的參數編碼方案,具體來說是一個正弦編碼器,該正弦編碼器在本發明中采用并且描述在WO01/69593。在該編碼器中,輸入音頻信號x(t)被分離為數個(可能重疊的)時間段(segment)或幀,通常每幀的持續時間20ms。每段被分解為瞬變、正弦和噪聲分量。也有可能提取輸入音頻信號的其它分量,比如諧波組合(harmonics complex),但是這些與本發明的目的并不相關。
在正弦分析器130中,每段的信號x2利用一些由幅度、頻率和相位參數表示的正弦曲線模擬。這一信息通常是利用傅立葉變換(FT)對一個分析時間間隔(interval)提取而出的,傅立葉變換提供了該時間段的譜表示,包括頻率、每個頻率的幅度、每個頻率的相位,這里每個相位是有“約束(wrap)”的,即在范圍{-π,π}內。一旦某段的正弦信息被估計,則啟動跟蹤算法(track)。該算法使用了一個費用(cost)函數,在逐段的基礎上將不同段中的正弦曲線鏈接起來,而獲得所謂的軌跡(track)。跟蹤算法因此得到了由正弦軌跡構成的正弦代碼Cs,所述正弦軌跡自某個時刻開始,在多個時間段上發展達一定的持續時間然后結束。
在這樣的正弦編碼中,通常傳輸形成在編碼器中的軌跡的頻率信息。這可以采用較為簡單且代價較低的方式實現,因為軌跡僅具有緩慢變化的頻率。頻率信息因此可以采用時間差分編碼加以有效傳輸。一般而言,幅度也可以隨著時間加以差分編碼。
和頻率相反,相位隨著時間變化較快。如果頻率是恒定的,相位將隨著時間線性變化,并且頻率變化將導致相位相應地偏離線性軌道。作為軌道段指數的函數,相位將具有大致線性的性質。編碼相位的傳輸因此變得更為復雜。但是,當傳輸的時候,相位限制在傅立葉變換規定的范圍{-π,π}內,即相位被“約束”。由于這種模2π的相位表示法,相位的結構性幀內關系被丟棄,并且乍看起來似乎是隨機變量。
但是,由于相位是頻率的積分(integral),相位是多余的并且原則上是不必傳輸的。這被稱為相位連續(continuation),顯著降低了比特率。
在相位連續中,僅每個軌跡的第一正弦被傳輸以便節省比特率。每個后續的相位基于初始相位和軌跡的頻率計算得到。由于頻率是量化的,并且并不能總是非常準確地加以估價,連續相位將偏離測量相位。實驗表明相位連續降低了音頻信號的品質。
傳輸每個正弦曲線的相位提高了在接收機端的解碼信號的質量,但是它顯著提高了比特率/帶寬。因此,一種聯合式的頻率/相位量化器,其中一個正弦軌跡的數值在-π和π之間的測量相位利用測量頻率和鏈接信息加以去約束(unwrapped),導致沿一個軌跡去約束后的相位單調遞增。在該編碼器中,去約束的相位利用自適應差分脈沖碼調制(ADPCM)量化器量化并且傳輸給解碼器。解碼器從去約束的相位軌線(trajectory)提取正弦軌跡的頻率和相位。
在相位連續中,僅有編碼頻率被傳輸,而相位則是在解碼器處通過利用相位和頻率之間的積分關系,根據頻率數據加以恢復。但是,公知的是當利用相位連續的時候,相位不能完美恢復。如果頻率誤差出現,例如由于頻率中的測量誤差或者由于量化噪聲,利用積分關系重構的相位將通常呈現出漂移特征的誤差。這是因為頻率誤差具有大致隨機的特征。低頻誤差由積分放大,其后果是恢復的相位趨向于偏離實際測量的相位。這導致可聽缺陷(artifact)的出現。
這一點示意在圖2a中,其中Ω和Ψ分別是一個軌跡的實頻率和實相位。在編碼器和解碼器中頻率和相位具有由字母“I”表示的積分關系。編碼器中的量化過程模擬為增加的噪聲n。在解碼器中,恢復的相位Ψ由此包括兩個分量實相位Ψ和噪聲分量ε2,這里噪聲ε2的恢復后的相位和功率譜密度函數具有顯著的低頻特征。
因此,可以看到在相位連續中,由于恢復相位是低頻信號的積分,恢復后的相位是低頻信號自身。但是,在重構過程中引入的噪聲也顯性存在于該低頻段中。因此,難以將這些源分離,以期濾除編碼過程中引入的噪聲n。
在常規量化方法中,頻率和相位是彼此獨立被量化的。一般而言,均勻的標量量化器被應用于相位參數。出于與感知有關的原因,對低頻的量化應當比高頻更準確。因此,利用ERB或巴克(Bark)函數將頻率轉換為非均勻的表示然后再均勻量化,其結果是非均勻的量化器。此外,物理理由也可以找到在諧波組合,較高的諧波頻率趨向于有比低頻更高的頻率變化。
當頻率和相位共同量化的時候,依賴于頻率的量化準確性并不是那么簡單明了(straightforward)。采用均勻量化辦法,導致低質量的聲音重構。此外,對于量化精度可以降低的高頻率,可以發展需要比特數較少的量化器。對于去約束的相位,類似的機制將是值得的。
本發明提供了采用低比特率編碼寬帶信號,特別是諸如語音信號之類的音頻信號的方法。在正弦編碼器中,每個音頻段對一些正弦曲線進行估計。一個正弦曲線由頻率、幅度和相位表示。通常,相位按獨立于頻率的方式來量化。本發明利用了對相位的頻率相關的量化,具體地說對低頻采用比在高頻更小的量化間隔量化。這樣,低頻的去約束的相位得以按比高頻相位更加準確的方式量化,可能是采用較小的量化范圍。本發明將解碼信號質量顯著提高,特別是對于低比特率量化器而言。
本發明允許在同樣具有非均勻頻率量化的同時共同量化頻率和相位。這帶來傳輸具有低比特率的相位信息的優點,同時保持在所有頻率,特別是在低頻處的良好相位精度和信號質量。
本發明方法的優點是相位準確度得以提高,特別是在較低頻率處,和高頻率處相比,相位誤差對應一個較大的時間誤差。這很重要,因為人耳不僅對頻率和相位敏感,而且還對瞬變現象中的絕對時序敏感。本發明的方法改進了聲音質量,特別是在僅有少量比特用于量化相位和頻率值的時候。另一方面,所需要的聲音質量可以利用較少的比特獲得。由于低頻變化緩慢,量化范圍可以給予更多的限制,獲得更準確的量化。此外,調整為更精細的量化的速度也快多了。
本發明可以應用于采用正弦曲線的音頻編碼器。本發明涉及編碼器和解碼器。
圖1是現有技術的音頻編碼器,本發明的一個實施方案實現在該編碼器中;圖2a示意了在現有技術系統中相位和頻率之間的關系;圖2b示意了在根據本發明的音頻系統中相位和頻率之間的關系;圖3a和3b是圖1的音頻編碼器的正弦編碼器部件的優選實施方案;圖4是本發明的一個實施方案得以實現在其中的一個音頻播放器;和圖5a和5b是圖4的音頻播放器的正弦合成器部件的一個優選下文結合附圖描述本發明的優選實施方案,其中同樣的部件采用同樣的參考標號,并且實現同樣的功能,除非另行規定。在本發明的一個優選實施方案中,編碼器1是WO01/69593的圖1所描述類型的正弦編碼器。該現有技術編碼器和其對應的解碼器的操作已經被充分描述,這里僅對與本發明相關的內容進行描述。
在現有技術和本發明的所述優選實施方案中,音頻編碼器1按照一定的采樣頻率對輸入音頻信號采樣,獲得音頻信號的數字表示x(t)。編碼器1然后將采樣的輸入信號分離為三個分量瞬變信號分量,持續不變的確定性(deterministic)的分量,和持續不變的隨機(stochastic)分量。音頻編碼器1包括瞬變編碼器11、正弦編碼器13和噪聲編碼器14。
瞬變編碼器11包括瞬變檢測器(TD)110、瞬變分析器(TA)111和瞬變合成器(TS)112。首先,信號x(t)進入瞬變檢測器110。該檢測器110估計是否有瞬變信號分量及其位置。該信息饋送給瞬變分析器111。如果瞬變信號分量的位置被確定,瞬變分析器111試圖提取瞬變信號分量(的主要部分)。它匹配一個形狀函數給信號段,該信號段優選開始于一個估計開始位置,并且通過采用例如(小)數量的正弦分量,確定形狀函數下的內容。該信息包含在瞬變代碼CT中,有關產生瞬變代碼CT的詳細信息參見WO01/69593。
瞬變代碼CT被提供給瞬變合成器112。在減法器16中合成的瞬變信號分量從輸入信號x(t)中減去,得到信號x1。采用一個增益控制機制GC(12),根據x1得到x2。
信號x2被提供給正弦編碼器13,在該編碼器13中信號在正弦分析器(SA)130中分析,后者確定(確定性的)正弦分量。因此,將會看到盡管瞬變分析器的存在是需要的,但是本發明可以在沒有這樣的分析器的情況下加以實施。或者,如上所述,本發明也可以采用諧波組合分析器加以實施。簡言之,正弦編碼器將輸入信號x2編碼為從一幀段鏈接到下一幀段的正弦分量的軌跡。
現在按照和現有技術中相同的方式參看圖3a。在優選實施方案中,在傅立葉變換(FT)單元40中輸入信號x2的每一段被變換到頻域中。對于每一段,FT單元提供了測量幅度A、相位φ和頻率ω。如前文所提到,傅立葉變換所提供的相位范圍被限制在-π≤φ<π。一個跟蹤算法(TA)單元42取每一段的信息,并且通過采用適當的費用函數,將正弦曲線從一段鏈接到下一段,從而為每一軌跡產生一個測量相位φ(k)和頻率ω(k)的序列。
與現有技術相反,分析器130最終產生的正弦代碼Cs包括相位信息,并且頻率在解碼器中從該信息重構而得。
但是,如前文所提,測量相位被約束(wrap),這意味著它被限制到一個模2π表示法。因此,在優選實施方案中,分析器包括一個相位去約束(unwrapper)器(PU)44。在該去約束器中模2π表示被去約束,暴露了一個軌跡的結構性幀內相位特性(behaviour)Ψ。由于正弦軌跡中的頻率幾近恒定,將會看到去約束相位Ψ通常是幾乎線性增加(或遞減)函數,而這使得廉價的相位傳輸,即低比特率,成為可能。去約束的相位Ψ被提供作為相位編碼器(PE)46的輸入。相位編碼器46輸出適于傳輸的量化后的表示水平r。
現在參看相位去約束器44的操作,如前文所說,一個軌跡的瞬時相位Ψ和瞬時頻率Ω由下列關系式關聯ψ(t)=∫T0tΩ(τ)dτ+ψ(T0)...(1)]]>這里T0是參考時刻。
幀k=K,K+1...K+L-1中的正弦軌跡具有測得的頻率ω(k)(表示為單位每秒弧度)和測得相位φ(k)(用單位弧度表示)。幀中心之間的距離由U給出(用秒表示的更新速率)。測得的頻率被設定為具有ω(k)=Ω(kU)的假定在下面(underlying)連續時間頻率軌跡Ω的樣本,并且類似地,測得相位是具有(k)=Ψ(kU)mod(2π)的相關連續時間相位軌跡Ψ的樣本。對于正弦編碼,假定Ω是近乎恒定的函數。
假定在一段內頻率近乎恒定,方程1可以近似表達如下ψ(kU)=1(k-1)UkUΩ(t)dt+ψ((k-1)U)]]>≈{ω(k)+ω(k-1)}U/2+ψ((k-1)U)]]>(2)因此,將會看到,在得知給定段的相位和頻率與下一段的頻率的情況下,有可能估計下一段的去約束相位值,乃至一個軌跡內的每段的去約束相位值。
在優選實施方案中,相位去約束器確定時刻k的去約束因子m(k)Ψ(kU)=φ(k)+m(k)2π(3)去約束因子m(k)告訴相位去約束器44獲得去約束相位所要增加的周期數。
組合方程2和3,相位去約束器確定增量去約束因子e(k)如下2πe(k)=2π{m(k)-m(k-1)}={ω(k)+ω(k-1)}U/2-{φ(k)-φ(k-1)}這里e應當是整數。但是,由于測量和模型誤差,增量去約束因子將不嚴格為整數,因此e(k)=round([{ω(k)+ω(k-1)}U/2-{φ(k)-φ(k-1)}]/(2π))假定模型和測量誤差較小。
在具有增量去約束因子e的情況下,方程(3)的m(k)以累計和的形式計算,這里在不損失一般性的情況下,相位去約束器在第一幀K以m(K)=0開始,并且根據m(k)和φ(k)確定(去約束)相位Ψ(kU)。
實踐中,采樣數據Ψ(kU)和Ω(kU)因測量誤差而發生失真φ(k)=ψ(kU)+ε1(k),ω(k)=Ω(kU)+ε2(k),這里ε1和ε2分別是相位和頻率誤差。為了避免對去約束因子的確定變得不清楚,測量數據需要以充分的準確性加以確定。因此,在優選實施方案中,跟蹤被限制使得δ(k)=e(k)-[{ω(k)+ω(k-1)}U/2-{φ(k)-φ(k-1)}](2π)<δ0這里δ是取整操作中的誤差。誤差δ主要由ω中由于與U的乘法而導致的誤差確定。假定ω是由采樣頻率為Fs的輸入信號的采樣樣本的傅立葉變換的絕對值的最大值確定并且傅立葉變換的分辨率是2π/La,La是分析尺寸。為了位于所考慮的邊界內,我們有下列關系LaU=δo]]>這意味著分析尺寸應當數倍于更新尺寸,以便去約束準確,例如設定δ0=1/4,分析尺寸應當4倍于更新尺寸(忽略相位測量中的誤差ε1)。
這意味著分析尺寸應當被更新尺寸大數倍,以便去約束準確,例如設定δ0=1/4,分析尺寸應當4倍于更新尺寸(忽略相位測量中的誤差ε1)。
為避免取整操作中的決定誤差而可采取的第二預設條件是恰當地定義軌跡。在跟蹤單元42中,正弦軌跡通常是通過考慮幅值和頻率差來定義的。此外,也有可能計入鏈接準則中的相位信息。例如,我們可以根據
ϵ={φ(k)-φ~(k)}mod2π]]>將相位預測誤差ε定義為測量值和預測值φ之間的差。這里預測值可以取值φ~(k)=φ(k-1)+{ω(k)-ω(k-1)}U/2]]>這樣,優選的是跟蹤單元42禁止ε大于某個值的軌跡(例如ε>π/2),得到一個對e(k)的明確定義。
此外,編碼器可以計算相位和頻率,比如將在解碼器處可利用的相位和頻率。如果將在解碼器處可利用的相位和頻率與比如當前在編碼器處的相位和頻率相差過大的話,可以決定中斷一個軌跡,即表明一個軌跡的結束并且利用當前頻率和相位以及它們鏈接的正弦數據開始新的軌跡。
相位去約束器(PU)44所產生的采樣去約束相位Ψ(kU)被作為輸入提供給相位編碼器(PE)46,以便產生一組表示水平r。對一般單調改變的特征比如去約束相位進行有效傳輸的技術是已知的。在優選實施方案中,圖3b,采用了自適應差分脈沖編碼調制(ADPCM)。這里,預測器(PF)48被用于估計下一軌跡段的相位,并且僅在量化器(Q)50中編碼該差值。由于Ψ被預期是一個近似線性的函數并且出于簡化的考慮,預測器48被選擇為具有下列形式的二階濾波器y(k+1)=2x(k)-x(k-1)這里,x是輸入,y是輸出。但是,將會看到也有可能采取其它的函數關系(包括高階關系)并且引入對濾波器系數的自適應(后向或前向)調整。在優選實施方案中,一個后向自適應控制機制(QC)52出于簡化的考慮,被用于控制量化器50。前向自適應控制同樣也是可行的,但是將需要額外的比特率開銷。
將要看到的是,編碼器(和解碼器)對一個軌跡的初始化開始于有關開始相位φ(0)和頻率ω(0)的了解。它們由另一個機制量化和傳輸。另外,圖5b編碼器的量化控制器52和解碼器中的相應控制器62中所使用的初始量化步長要么被傳輸,要么在編碼器和解碼器中被設為某個值。最后,一個軌跡的結束點可以用一個單獨的側流來通知,要么表示為在相位的比特流中的獨特的碼元。
去約束相位的開始頻率在編碼器和解碼器中都是已知的。基于該頻率,選擇了量化精度。對于開始于低頻率的去約束相位軌線而言,選擇一個比開始于高頻的去約束相位軌線更準確的量化柵格,即更高的分辨率。
在ADPCM量化器中,去約束的相位Ψ(k)根據該軌跡中的在前相位進行預測/估計,這里k表示軌跡中的數目。然后,預測相位Ψ(k)和去約束相位Ψ(k)之間的差被量化和傳輸。量化器對軌跡中的每個去約束相位進行了調整。當預測誤差小的時候,量化器限制可能數值的范圍,量化可以變得更準確。在另一方面,當量化誤差大的時候,量化器采用更粗略的量化。
量化器Q(在圖3b中)量化預測誤差Δ,該誤差由Δ(k)=ψ(k)-ψ~(k)]]>計算得到。
預測誤差Δ可以利用查找表加以量化。為此,表Q被維持。例如,對于一個2比特的ADPCM量化器,Q的初始表可以類似于表1所示的表。
表1第一連續所用的量化表Q量化按如下方式完成。預測誤差Δ和邊界b比較,使得下列公式得到滿足bli<Δ≤bui從滿足以上關系式的i值出發,通過r=i計算表示等級r。
相關的表示等級存儲在表示表R中,該表如表2所示。
表2第一連續所用的表示表R對于軌跡的下一正弦分量的量化,表Q的各條目乘以因子c。
Q(k+1)=Q(k)*cR(k+1)=R(k)*c在一個軌跡的解碼期間,兩個表根據所產生的表示等級r縮放。如果對于當前子幀r是1或2(內部等級),那么量化表的縮放因子c被設為C=2-1/4由于c<1,一個軌跡中下一正弦曲線的頻率和相位變得更加準確。如果r是0或3(外部等級),那么縮放因子被設置為C=21/2由于c>1,一個軌跡的下一正弦的量化準確度下降。利用這些因子,可以利用兩次縮小撤消(undone)一次放大。放大和縮小因子的差異導致放大快速開始,而相應的縮小則需要兩步。
為了避免量化表中的條目過小或過大,僅在內部等級的絕對值在π/64和3π/4之間的情況下才進行所述調整。在那種情況下c設為1。
在解碼器中僅表R必須保持,以便根據量化預測誤差轉換為所接收的表示等級r。該去量化操作由圖5b中的模塊DQ完成。
利用以上設置,重構的聲音質量需要改進。根據本發明,為去約束的相位軌跡采用不同的初始表,這取決于開始頻率。由此得到更好的聲音質量。這按以下方式完成。初始表Q和R基于軌跡的第一頻率進行縮放。在表3,給出縮放因子和頻率范圍。如果一個軌跡的第一頻率落在某個頻率范圍內,則選擇適當的縮放因子,表R和Q除以該縮放因子。端點也可以取決于該軌跡的第一頻率。在解碼器中,一個相應的過程被執行,以便從正確的初始表R開始。
表3和頻率有關的縮放因子和初始表表3給出了一個2比特ADPCM量化器的頻率相關縮放因子和相應的初始表Q和R的一個例子。音頻頻率范圍0-22050Hz被分為四個子頻段。可以看到相對高頻段而言,低頻段的相位精度得到改善。
子頻段的數量和與頻率有關的縮放因子可以改變并且可以經過選擇,以配合各個目的和要求。如上所述,表3中的和頻率有關的初始表Q和R可以動態放大和縮小,以便適應相位從一個時間段到下一個時間段的進展。
在例如一個3比特ADPCM量化器中,3比特所定義的八個量化間隔的初始邊界可以作如下定義Q={-∞ -1.41 -0.707 -0.35 0 0.350.707 1.41 ∞},并且可以具有最小柵格大小π/64,最大柵格大小π/2。表示表R可以看作R={-2.117,-1.0585,-0.5285,-0.1750,0.1750,0.5285,1.0585,2.117}。一個如表3所示的表Q和R的類似的與頻率有關的初始化可以在該例子中使用。
從正弦編碼器產生的正弦碼Cs,正弦信號分量由正弦合成器(SS)131按照與下文對于解碼器的正弦合成器(SS)32描述的相同方式重構。該信號在減法器17中去減正弦編碼器13的輸入x2,得到剩余信號x3。正弦編碼器13所產生的剩余信號x3被送給優選實施方案的噪聲分析器14,后者產生表征該噪聲的噪聲碼CN,參見如國際專利申請PCT/EP00/04599的描述。
最后,在多路復用器15中,音頻流AS被構成,它包括碼CT,CS和CN。音頻流AS被提供給例如數據總線,天線系統,存儲介質等等。
圖4給出一個音頻播放器3,它適用于對從數據總線、天線系統、存儲介質等獲得的例如由圖1的編碼器1產生的音頻流AS’解碼。音頻流AS’被多路分解器30多路分解,獲得碼CT、CS、CN。這些碼被分別提供給瞬變合成器31、正弦合成器32和噪聲合成器33。根據瞬變碼CT,在瞬變合成器31中計算瞬變信號分量。在瞬變碼指明一個形狀函數的情況下,基于所接收的參數計算該形狀。進而,基于正弦分量的頻率和幅度計算形狀內容。如果瞬變碼CT指明一個步長(step),那么不計算瞬變。總瞬變信號yT是所有瞬變的總和。
包含有分析器130編碼的信息的正弦碼Cs被正弦合成器32用來產生信號ys。現在參看圖5a和b,正弦合成器32包括相位解碼器(PD)56,它和相位編碼器46兼容。這里,去量化器(DQ)60和二階預測濾波器(PF)64相結合,根據表示等級r,提供給預測濾波器(PF)64的初始信息φ(0),ω(0)和量化控制器(QC)62的初始量化步長,產生去約束相位Ψ(的估計值)。
如圖2b示意,可以通過差分從去約束相位Ψ恢復頻率。假定解碼器處的相位誤差近似為白的,并且由于差分放大了高頻,差分可以和低通濾波器結合,降低噪聲,并且因此在解碼器獲得頻率的準確估計。
在優選實施方案中,濾波單元(FR)58通過諸如前向、后向或中間(central)誤差的過程逼近差分,該差分是從去約束相位獲得頻率ω所必要的。這使得解碼器產生可在常規方式下用于合成編碼信號的正弦分量的相位Ψ和頻率ω,作為輸出。
同時,當信號的正弦分量正在被合成的時候,噪聲碼CN被饋送給噪聲合成器NS33,該合成器主要是一個濾波器,具有逼近噪聲的頻譜的頻率響應。NS33通過用噪聲碼CN濾波白噪聲信號產生重構噪聲yN。總信號y(t)包括瞬變信號yT與一乘積的總和,該乘積是任意幅度解壓縮(g)與正弦信號ys和噪聲信號yN的總和的乘積。音頻播放器包括兩個加法器36和37,對相應的信號求和。總信號被提供給輸出單元35,該單元例如是揚聲器。
圖6示意了根據本發明的音頻系統,它包括圖1所示的音頻編碼器1和圖4所示的音頻播放器3。這樣的系統提供了播放和紀錄特征。音頻流AS從音頻編碼器通過通信通道2提供給音頻播放器,通信通道2可以是無線連接,數據總線20或存儲介質。在通信通道2是存儲介質的情況下,存儲介質可以固定在系統中,或者可以是可移出的盤,記憶棒等。通信通道12可以是音頻系統的一部分,但是通常在音頻系統之外。
來自一些連續段的編碼數據被鏈接。這按下列方式完成。對于每段,一些正弦曲線被確定(例如利用FFT)。一個正弦曲線由頻率、幅度和相位構成。每段的正弦曲線的數目是可變的。一旦對于一個段確定了正弦曲線,便分析以便連接到來自在前段的各正弦曲線。這被稱作“鏈接”或“跟蹤”。分析是基于當前段的正弦曲線和在前段的所有正弦曲線之間的差進行的。鏈接/跟蹤是與在先段中具有最小差的正弦曲線進行的。如果甚至這一最小差也大于某個閾值,那么無需連接到在前段的正弦曲線。這樣,一個新的正弦曲線得以產生或“誕生”。
正弦曲線之間的差利用“費用函數”確定,該函數利用正弦曲線的頻率、幅度和相位。該分析是對每段進行的。結果是一個音頻信號有數量較大的軌跡。一個軌跡有一個誕生點,這是一個與在前段的各正弦曲線之間沒有連接的正弦曲線。誕生正弦曲線以非差分的方式編碼。連接到在前段正弦曲線的正弦曲線被稱作連續,它們相對于在前段的正弦曲線以差分方式編碼。這節約了大量的比特,因為僅僅差而不是絕對值被編碼。
如果f(n-1)是來自在前段的正弦曲線的頻率并且f(n)是來自當前段的連接正弦曲線,那么f(n)-f(n-1)傳輸給解碼器。數n表示軌跡中的數,n=1是誕生,n=2是第一連續等等。對于幅度,這同樣成立。初始正弦曲線(誕生正弦曲線)的相位值被傳輸,而對于一個連續,沒有相位被傳輸,但是相位可以從頻率檢索。如果一個軌跡在下一段中沒有連續,則該軌跡結束或“死亡”。
權利要求
1.一種編碼信號的方法,所述方法包括下列步驟對于多個序列段的每一段提供相應的一組采樣信號值(x(t));分析所述采樣的信號值(x(t)),來確定所述多個序列段的每段的一個或多個正弦分量,每個正弦分量包含頻率值(Ω)和相位值(ψ);在多個序列段上鏈接正弦分量,以提供正弦軌跡;對于所述多個序列段的每段中的每個正弦軌跡,按照至少一個在前段的相位值的函數確定預測相位值(ψ(k));對于每個正弦軌跡,確定測量相位值(ψ),包括一般單調變化的值;按照預測相位值(ψ(k))和該段的測量相位值(ψ)的函數量化正弦碼(Cs),這里正弦碼(Cs)是依賴于相應正弦軌跡的至少一個頻率值(Ω)而量化的;和產生包括代表頻率和相位和鏈接信息的正弦碼(Cs)的編碼信號(AS)。
2.如權利要求1所述的方法,其特征在于,在包含具有第一頻率值的第一正弦分量的第一正弦軌跡中,利用第一量化精度對正弦碼(Cs)量化;在包含具有比第一頻率值高的第二頻率值的第二正弦分量的第二正弦軌跡中,利用低于或等于第一量化精度的第二量化精度對正弦碼(Cs)量化。
3.如權利要求1所述的方法,其特征在于一個軌跡的正弦碼(Cs)包括初始相位值和初始頻率值,預測步驟采用初始頻率值和初始相位值來提供第一預測。
4.如權利要求1所述的方法,其特征在于每個鏈接的段的相位值是按照下列參數的函數確定的,所述參數包括在前段的頻率和鏈接段的頻率的積分(integral);和在前段的相位;其中正弦分量包括在范圍{-π,π}內的相位值(ψ)。
5.如權利要求1所述的方法,其特征在于正弦碼的量化包括確定在每個預測相位值(ψ(k))和相應觀測相位值(ψ)之間的相位差。
6.如權利要求4所述的方法,其特征在于所述產生步驟包括按照量化正弦碼(Cs)的函數控制所述量化步驟。
7.如權利要求6所述的方法,其特征在于正弦碼(Cs)包括軌跡的端點的指示符。
8.如權利要求1所述的方法,其特征在于所述方法包括下列步驟利用正弦碼(Cs)合成正弦分量;從采樣信號值(x(t))減去合成信號值,以提供一組表示音頻信號的殘余分量的值(x3);通過確定參數來模制(model)音頻信號的殘余分量,逼近所述殘余分量;以及在音頻流(AS)中包含所述參數。
9.如權利要求1所述的方法,其特征在于采樣的信號值(x1)表示已經從中除去瞬變分量的音頻信號。
10.一種解碼音頻流(AS’)的方法,所述音頻流包括代表頻率、相位和鏈接信息的正弦碼(Cs),所述方法包括下列步驟接收包含該音頻流(AS’)的信號;去量化正弦碼(Cs),由此獲得去約束的去量化的相位值(ψ),這里正弦碼(Cs)是依賴于相應正弦軌跡的至少一個頻率值(Ω)而去量化的;根據該去約束的去量化的相位值(ψ)計算頻率值(Ω),并且采用去量化的頻率和相位值(Ω,ψ)來合成音頻信號(y(t))的正弦分量。
11.如權利要求10所述的方法,其特征在于,在包含具有第一頻率值的第一正弦分量的第一正弦軌跡中,利用第一量化精度對正弦碼去量化;在包含具有比第一頻率值高的第二頻率值的第二正弦分量的第二正弦軌跡中,利用低于或等于第一量化精度的第二量化精度對正弦碼去量化。
12.如權利要求10所述的方法,其特征在于每個鏈接的正弦分量的相位值是按照下列參數的函數確定的,所述參數包括在前段的頻率和鏈接段的頻率的積分;和在前段的相位;其中正弦分量包括在范圍{-π,π}內的相位值。
13.如權利要求12所述的方法,其特征在于所述量化精度是按照量化正弦碼的函數控制的。
14.一種音頻編碼器,用于處理對于多個序列段的每一段而言的一組相應采樣信號值,所述編碼器包括分析器,分析所述采樣信號值,來確定所述多個序列段的每段的一個或多個正弦分量,每個正弦分量包含頻率值和相位值;鏈接器(13),在多個序列段上鏈接正弦分量,以提供正弦軌跡;相位去約束器(44),對于所述多個序列段的每段中的每個正弦軌跡,按照至少一個在前段的相位值的函數確定預測相位值(ψ(k)),并且對于每個正弦軌跡,確定測量相位值(ψ),包括一般單調變化的值;量化器(50),按照預測相位值(ψ(k))和該段的測量相位值(ψ)的函數量化正弦碼(Cs),這里正弦碼(Cs)是依賴于相應正弦軌跡的至少一個頻率值而量化的;和提供包括代表頻率和相位的正弦碼(Cs)的編碼信號的裝置(15)。
15.如權利要求14所述的音頻編碼器,其特征在于所述量化器(15)經調整,用于在包含具有第一頻率值的第一正弦分量的第一正弦軌跡中,利用第一量化精度對正弦碼(Cs)量化;在包含具有比第一頻率值高的第二頻率值的第二正弦分量的第二正弦軌跡中,利用低于或等于第一量化精度的第二量化精度對正弦碼(Cs)量化。
16.一種音頻播放器,包括讀取編碼音頻信號的裝置,所述信號包括表示每個鏈接正弦分量的軌跡的頻率和相位的正弦碼;去量化器,產生相位值,和根據相位值產生頻率值;和,合成器,用于采用所產生的相位和頻率值來合成音頻信號的正弦分量。
17.音頻系統,包括如權利要求14所述的音頻編碼器和如權利要求16所述的音頻播放器。
18.一種音頻流,包括表示在音頻信號的多個序列段上鏈接的正弦分量軌跡的正弦碼,所述碼表示按照至少一個在前段的相位值的函數的預測相位值,一個測量相位值包括一般單調變化的值;正弦碼(Cs)是按照預測相位值(ψ(k))和該段的測量相位值(ψ)的函數量化的,這里正弦碼(Cs)是依賴于相應正弦軌跡的至少一個頻率值(Ω)而量化的。
19.一種存儲介質,其上存儲有如權利要求18所述的音頻流。
全文摘要
在正弦音頻編碼器中,每個音頻段對一些正弦曲線進行估計。一個正弦曲線由頻率、幅度和相位表示。通常,相位按獨立于頻率的方式來量化。本發明利用了對相位的頻率相關的量化,具體地說對低頻采用比在高頻更小的量化間隔量化。這樣,低頻的去約束的相位得以按比高頻相位更加準確的方式量化,可能采用較小的量化范圍。本發明將解碼信號質量顯著提高,特別是對于低比特率量化器而言。
文檔編號G10L19/093GK1826634SQ200480020673
公開日2006年8月30日 申請日期2004年7月8日 優先權日2003年7月18日
發明者A·J·格里茨, A·C·鄧布林克 申請人:皇家飛利浦電子股份有限公司