] 圖Ilb展示根據第一方面的實施例的當相比于圖2中所展示的整形器時實施又一 可選結構的又一整形器的示意性方塊圖;
[0048] 圖12展示根據第一方面的實施例的用于編碼音頻信號的方法的示意性流程圖;
[0049] 圖13展示根據第一方面的實施例的用于解碼包括預測系數和增益參數的所接收 的音頻信號的方法的示意性流程圖;
[0050] 圖14展示根據第二方面的實施例的用于編碼音頻信號的方法的示意性流程圖;及
[0051] 圖15展示根據第二方面的實施例的用于解碼所接收的音頻信號的方法的示意性 流程圖。
【具體實施方式】
[0052] 即使出現在不同的附圖中,W下描述中仍通過相等或等效參考編號表示相等或等 效的組件、或具有相等或等效功能的組件。
[0053] 在W下描述中,闡述多個細節W提供對本發明的實施例的較透徹解釋。然而,對于 本領域技術人員而言是顯而易見的,可無需運些特定細節實踐本發明的實施例。在其他情 況下,W方塊圖形式而非詳細展示熟知結構和器件W便避免混淆本發明的實施例。另外,除 非另外特定指出,否則可將下文中所描述的不同實施例的特征彼此組合。
[0054] 在下文中,將參考描述修改音頻信號。可通過放大和/或衰減音頻信號的部分而修 改音頻信號。音頻信號的部分可為(例如)時域中的音頻信號序列和/或其在頻域中的頻譜。 關于頻域,可通過放大或衰減配置于頻率處或頻率范圍中的頻譜值而修改頻譜。修改音頻 信號的頻譜可包括操作序列,例如先放大和/或衰減第一頻率或頻率范圍且之后放大和/或 衰減第二頻率或頻率范圍。頻域中的修改可表示為頻譜值與增益值和/或衰減值的計算(例 如,乘法、除法、求和等)。可依序執行修改,例如首先將頻譜值乘W第一乘法值且接著乘W 第二乘法值。乘W第二乘法值且接著乘W第一乘法值可接收到相同或幾乎相同的結果。又, 可首先組合第一乘法值和第二乘法值,且接著就組合乘法值而言將其應用于頻譜值同時接 收到相同或類似的運算結果。因此,下文所描述的用于形成或修改音頻信號的頻譜的修改 步驟并不限于所描述次序,而是也可W改變次序進行執行同時接收到相同結果和/或效果。
[0055] 圖1展示用于編碼音頻信號102的編碼器100的示意性方塊圖。編碼器100包括帖建 立器110,帖建立器110用于基于音頻信號102產生帖序列112。序列112包括多個帖,其中音 頻信號102的每個帖包括時域長度(持續時間)。例如,每個帖可包括IOms、20ms或30ms的長 度。
[0056] 編碼器100包括分析器120,分析器120用于從音頻信號的帖獲得預測系數化PC = 線性預測系數)122和殘差信號124。帖建立器110或分析器120用于確定音頻信號102在頻域 中的表示。可選地,音頻信號102可已為頻域中的表示。
[0057] 預測系數122可為(例如)線性預測系數。可選地,也可應用非線性預測,使得預測 器120用于確定非線性預測系數。線性預測的優勢為用于確定預測系數的減少的計算工作。
[0058] 編碼器100包括有聲/無聲決定器130,有聲/無聲決定器130用于確定出殘差信號 124是否是從無聲信號音頻帖確定的。如果是從有聲信號帖確定出殘差信號124,則決定器 130用于將殘差信號提供至有聲帖編碼器140,如果是從無聲音頻帖確定出殘差信號124,則 將殘差信號提供至增益參數計算器150。為確定殘差信號122是從有聲還是無聲信號帖確定 的,決定器130可使用不同方法,例如殘差信號的樣本的自動相關。例如,ITlK國際電信聯合 會)-T(電信標準化部口)標準G.718中提供了用于決定信號帖為有聲還是無聲的方法。配置 于低頻率處的大量能量可指示信號的有聲部分。可選地,無聲信號可導致高頻率處的大量 能量。
[0059] 編碼器100包括共振峰信息計算器160,共振峰信息計算器160用于從預測系數122 計算語音相關的頻譜整形信息。
[0060] 語音相關的頻譜整形信息可(例如)通過確定包括比鄰域大的能量的經處理的音 頻帖的頻率或頻率范圍而考慮共振峰信息。頻譜整形信息能夠將語音的量值頻譜分段成共 振峰(即,凸塊)和非共振峰(即,谷線)頻率區。可(例如)通過使用預測系數122的導抗頻譜 頻率(ISF)或線譜頻率化SF)表示獲得頻譜的共振峰區。實際上,ISF或LSF表示使用預測系 數122的合成濾波器所諧振的頻率。
[0061] 將語音相關的頻譜整形信息162和無聲殘差轉遞至增益參數計算器150,該增益參 數計算器150用于從無聲殘差信號和頻譜整形信息162計算增益參數gn。增益參數gn可為標 量值或多個標量值,即,增益參數可包括多個值,多個值和待放大或衰減信號頻譜的多個頻 率范圍中的頻譜值的放大或衰減相關。解碼器可用于在解碼期間將增益參數gn應用于所接 收的經編碼的音頻信號的信息,使得基于增益參數放大或衰減所接收的經編碼的音頻信號 的部分。增益參數計算器150可用于通過一個或多個數學表達式或帶來連續值的確定規則 而確定增益參數gn。例如,借助于處理器用數字方式所執行的運算(在具有受限數目的比特 的變量中表達結果)可帶來經量化的增益戰,。可選地,可根據量化方案進一步量化結果獲得 經量化的增益信息。因此,編碼器100可包括量化器170。量化器170可用于將所確定的增益 gn量化至由編碼器100的數字運算所支持的最接近的數字值。可選地,量化器170可用于將 量化函數(線性或非線性)應用于已經數字化的且因此經量化的欣然(fain)因子gn。非線性 量化函數可考慮(例如)人類聽覺在低聲音壓力水平下的高度敏感和高壓力水平下的較不 敏感的對數相依性。
[0062] 編碼器100進一步包括信息獲得單元180,信息獲得單元180用于從預測系數122獲 得預測系數相關信息182。預測系數,例如用于激勵革新碼本的線性預測系數,具有對失真 或誤差的低魯棒性。因此,例如,將線性預測系數轉換成頻譜間頻率(ISF)和/或獲得線譜對 (LSP)并傳輸到其的相關信息和經編碼的音頻信號。LSP和/或ISF信息具有對傳輸媒體中的 失真(例如,誤差或計算器誤差)的較高魯棒性。信息獲得單元180可進一步包括量化器,量 化器用于提供關于LSF和/或ISP的經量化的信息。
[0063] 可選地,信息獲得單元可用于轉遞預測系數122。可選地,可無需信息獲得單元180 而實現編碼器100。可選地,量化器可為增益參數計算器150或比特流形成器190的功能區 塊,使得比特流形成器190用于接收增益參數gn并基于其獲得經量化的增益療。可選地,當 增益參數gn已經量化時,可無需量化器170而實現編碼器100。
[0064] 編碼器100包括比特流形成器190,該比特流形成器190用于接收由有聲帖編碼器 140分別提供的經編碼的音頻信號的與有聲帖相關的有聲信號、有聲信息142,接收經量化 的增益復,和預測系數相關信息182并基于此形成輸出信號192。
[0065] 編碼器100可為聲音編碼裝置的部分,例如,固定或移動電話或包括用于傳輸音頻 信號的麥克風的裝置(例如,計算機、平板PC等)。可(例如)經由移動通信(無線)或經由有線 通信(例如,網絡信號)傳輸輸出信號192或從其獲得的信號。
[0066] 編碼器100的優勢在于輸出信號192包括從轉換成經量化的增益氣的頻譜整形信 息所獲得的信息。因此,輸出信號192的解碼可允許實現或獲得進一步語音相關信息,且因 此解碼信號,使得所獲得的經解碼的信號相對于語音質量的感知水平具有高質量。
[0067] 圖2展示用于解碼所接收的輸入信號202的解碼器200的示意性方塊圖。所接收的 輸入信號202可對應于(例如)由編碼器100所提供的輸出信號192,其中輸出信號192可由高 水平層編碼器編碼、經由媒體傳輸、由高層處所解碼的接收裝置接收,從而為解碼器200產 生輸入信號202。
[0068] 解碼器200包括用于接收輸入信號202的比特流解形成器(解多路復用器;demux)。比特流解形成器 210 用于提供預測系數 122、經量化的增益離和有聲信息 142。為獲得 預測系數122,比特流解形成器可包括當相比于信息獲得單元180時用于執行反運算的反信 息獲得單元。可選地,相對于信息獲得單元180,解碼器200可包括用于執行反運算的反信息 獲得單元(未展示)。換句話說,預測系數可被解碼(即,被復原)。
[0069] 解碼器200包括共振峰信息計算器220,共振峰信息計算器220用于從預測系數122 (此由于預測系數122是針對共振峰信息計算器160而描述)計算語音相關的頻譜整形信息。 共振峰信息計算器220用于提供語音相關的頻譜整形信息222。可選地,輸入信號202也可包 括語音相關的頻譜整形信息222,其中傳輸預測系數或與預測系數相關的信息(經量化的 LSF及/或IS巧而非語音相關的頻譜整形信息222實現較低比特率的輸入信號202。
[0070] 解碼器200包括隨機噪聲產生器240,隨機噪聲產生器240用于產生類噪聲信號(其 可經簡化表示為噪聲信號)。隨機噪聲產生器240可用于再生(例如)當度量并儲存噪聲信號 時所獲得的噪聲信號。可(例如)通過在電阻或另一電組件處產生熱噪聲并通過將所記錄數 據儲存于存儲器上而度量并記錄噪聲信號。隨機噪聲產生器240用于提供(類)噪聲信號n (n)。
[0071] 解碼器200包括整形器250,整形器250包括整形處理器252和可變放大器254。整形 器250用于頻譜上整形噪聲信號n(n)的頻譜。整形處理器252用于接收語音相關的頻譜整形 信息,且用于(例如)通過將噪聲信號n(n)頻譜的頻譜值乘W頻譜整形信息的值而整形噪聲 信號n(n)的頻譜。也可通過將噪聲信號n(n)與由頻譜整形信息所給出的濾波器卷積而在時 域中執行該運算。整形處理器252用于將經整形的噪聲信號256、其頻譜分別提供至可變放 大器254。可變放大器254用于接收增益參數gn,且用于放大經整形的噪聲信號256的頻譜W 獲得經放大整形的噪聲信號258。放大器可用于將經整形的噪聲信號256的頻譜值乘W增益 參數gn的值。如上文所闡述,可實施整形器250,使得可變放大器254用于接收噪聲信號n(n) 并將經放大的噪聲信號提供至用于整形經放大的噪聲信號的整形處理器252。可選地,整形 處理器252可用于接收語音相關的頻譜整形信息222和增益參數gn,并將兩信息一個接一個 地依序應用于噪聲信號n(n),或(例如)通過乘法或其他計算組合兩信息并將經組合的參數 應用于噪聲信號n(n)。
[0072] 通過語音相關的頻譜整形信息整形的類噪聲信號n(n)或其經放大的版本實現經 解碼的音頻信號282,音頻信號282具有較多語音相關(自然)的聲音質量。此情況允許獲得 高質量音頻信號和/或減少編碼器側處的比