本發明涉及系統、方法和技術,其用于對音頻信號進行處理以為收聽者提供更強的低音印象,或者換言之,以便將“虛擬低音”與音頻信號相加,例如以使得可以通過沒有良好低音產生特性的揚聲器或其它音頻輸出裝置進行播放。
背景技術:
平板電視機和移動裝置的出現加速了小型揚聲器的廣泛使用,公知小型揚聲器具有差的低音(即,低頻)性能。由于收聽者對聲音質量的總體印象較強地受到低音性能的影響,因此該特性通常使得小型揚聲器處于不利位置。因此,非常期望改進所感知的低音性能,尤其是對于包括小型揚聲器的裝置。
提升低音性能的傳統方法是簡單地放大音頻譜的低頻部分,從而使得低音聽起來更大聲。然而,由于當在低頻將電能轉換為聲能時小型揚聲器通常具有差的效率,從而引起諸如電池消耗和過熱的問題,因此這樣的方法的有效性大大受到限制。潛在的更嚴重的問題在于,低頻的放大可以引起揚聲器線圈的過度偏移,從而導致失真,并且在一些情況下,導致對揚聲器的損壞。
替選方法是利用“虛擬音調(virtual pitch)”的音質效果。對于用于示出該效果的簡單示例,考慮基頻F0為100赫茲(Hz)的音調。盡管可以通過播放100Hz的純音在人耳中產生100Hz音調的感覺,但是樂器和人類聲帶通常使用具有合成諧波結構(諸如100Hz、200Hz、300Hz等)的聲調集合產生該感覺,這也可以提供更完整的(和區分的)聲音質量。更有意思的在于,100Hz的基頻處的聲調對于人類具有聽到100Hz音調的感覺是不必要的。即使100Hz的聲調丟失,200Hz、300Hz、400Hz等的諧音的集合也可以產生100Hz音調的感覺。人耳顯然可以僅根據諧音而推出音調。該現象稱為虛擬音調。
虛擬音調的概念的一個分支在于,不需要物理地產生基頻F0處的聲調以便產生F0處的音調的感覺。當應用于小型揚聲器的低音增強時,這意味著不需要在小型揚聲器低效的低頻浪費能量。替代地,可以通過使用揚聲器在產生方面更高效的較高頻率聲調而產生類似的低音印象。只要提供了適當的諧波結構,虛擬音調效果就可以足夠強以產生強的低音感覺。該一般方法在這里稱為虛擬低音(virtual bass)。
早期的虛擬低音技術在時域中工作并且一般包括以下步驟:
1.使用帶通濾波器從輸入音頻信號提取低頻分量以形成低音信號;
2.通過經由非線性裝置饋送低音信號而生成較高階的諧波;
3.使用帶通濾波器選擇高階諧波的一部分(虛擬音調);以及
4.將所選擇的高階諧波與原始信號相加。
然而,本發明人意識到對于該方法存在問題,包括非線性裝置引入了互調失真,這會顯著降低音頻質量。
更近期的技術使用相位聲碼器(phase vocoder)而在頻域中工作,例如,如下:
1.使用短時傅立葉變換(STFT)將輸入音頻信號變換到離散傅立葉變換(DFT)域;
2.將低頻諧音的頻率線性地按比例提高至揚聲器可以有效地產生聲音的頻率;
3.使用按比例提高后的諧波頻率來驅動正弦波疊加合成器(sum-of-sinusoids synthesizer)對時域虛擬低音信號進行合成;以及
4.將虛擬低音信號與原始信號相加。
然而,本發明人意識到該方法的至少一個問題在于,其使得諧音之間的頻率差也按比例被提高,因此所得到的虛擬音調頻率高于其應該為的頻率。換言之,所得到的虛擬低音通常將被感知為具有比原始信號的低音部分高的音調。甚至更壞的是,在許多情況下,特別是涉及音樂的情況下,所感知的音調中的上述偏移然后將使得所感知的低音與音頻信號的其它部分沖突,從而導致聲音質量的更嚴重下降。
技術實現要素:
本發明通過使用被發現產生更好結果(即,音頻信號的原始低音部分的更真實印象)的某些方法來解決上述問題。
本發明的一個具體實施例涉及一種用于對音頻信號進行處理的設備,其包括:(a)輸入線,輸入原始音頻信號;(b)變換模塊,將原始音頻信號變換成頻率分量的集合;(c)濾波器,提取這樣的頻率分量的低音部分;(d)估計器,估計這樣的低音部分內的低音聲音的基頻;(e)頻移器,將低音部分偏移作為估計器估計的基頻的整數倍的頻率,從而提供虛擬低音信號;(f)加法器,具有(i)耦合到原始音頻信號和虛擬低音信號的輸入以及(ii)輸出;以及(g)音頻輸出裝置,耦合到加法器的輸出。
另一實施例涉及一種用于對音頻信號進行處理的設備,其包括:(a)輸入線,輸入時域中的原始音頻信號;(b)低音提取濾波器,提取原始音頻信號的低音部分,該低音部分也在時域中;(c)估計器,估計低音部分內的低音聲音的基頻;(d)頻移器,將低音部分偏移作為估計器估計的基頻的整數倍的正頻率增量,從而提供虛擬低音信號;(e)加法器,具有(i)耦合到原始音頻信號和虛擬低音信號的輸入和(ii)輸出;以及(f)音頻輸出裝置,耦合到加法器的輸出。
根據每個上述布置,通常可以獲得更好的音頻輸出,特別是當通過不能提供良好的低音產生的揚聲器或其它音頻輸出裝置播放音頻信號時。
以上概述僅旨在提供本發明的某些方面的簡要描述。本發明的更完整理解可以通過參考權利要求和結合附圖的優選實施例的以下詳細描述來獲得。
附圖說明
在以下公開內容中,參照附圖來描述本發明。然而,應理解,附圖僅描繪了本發明的某些代表性和/或示例性實施例和特征,并且不旨在以任何方式限制本發明的范圍。以下是每幅附圖的簡要描述。
圖1是用于在頻域中將虛擬低音與音頻信號相加的系統的框圖。
圖2是用于在時域中將虛擬低音與音頻信號相加的系統的框圖。
圖3是用于執行單邊帶(SSB)調制的系統的框圖。
具體實施方式
本申請涉及同一發明人在同一日期提交的題為“Addition of Virtual Bass in the Frequency Domain”的共同轉讓美國專利申請。
為了便于引用,本公開被劃分為章節。每個章節的總體主題由該章節的標題來指示。然而,這樣的標題僅被包括用于有利于可讀性,并且不旨在以任何方式限制本發明的范圍。
頻域中的虛擬低音的相加
現在參照圖1討論主要在頻域中工作的本實施例的第一實施例。如在以下更詳細地討論的,圖1示出了系統5,系統5用于對原始輸入音頻信號10(通常為數字形式,即,在時間上離散或被采樣以及在值方面離散或被量化)進行處理,以便產生與原始信號10相比可以具有較少實際低音內容但是添加了“虛擬低音”的輸出音頻信號40,例如,從而使得輸出音頻信號40更適合于不是非常擅長產生低音的揚聲器或其它輸出裝置。
參照圖1,初始,正向變換模塊12將輸入音頻信號10從時域變換為頻域(例如,DFT)表示。可以在模塊12內使用傳統STFT或者其它傳統頻率變換技術。在以下討論中,一般假設使用STFT,從而產生DFT表示,但是期望不失一般性,并且這里的每個具體引用可以例如利用上述更一般的語言來替換。
所得到的變換后的信號然后被提供(即,耦合)到低音提取器14,并且可選地被提供到高通濾波器15。低音提取器14例如使用具有如下通帶(例如,頻譜的受到不超過3dB衰減的部分)的帶通濾波器而從DFT(或其它頻率)系數提取輸入信號10的低頻部分16:
其中,是低端截止(-3dB)頻率,是高端截止頻率,并且上述范圍優選地以預期低音強但是期望的揚聲器或其它最終輸出裝置42無法有效地產生聲音的頻率為中心。另外,低音提取器14的帶寬優選地跨越足夠的倍頻程(octave)(例如,至少一個1個、2個或更多個)以便從源音頻信號10提取適當的諧波結構以用于以下所指示的目的。這樣的通帶的一個代表性示例是[40,160]Hz。更一般地,優選地是至少10Hz、15Hz、20Hz或30Hz,并且優選地是100Hz至200Hz。
通常,低音提取器14例如通過將具有期望濾波器特性的窗函數直接應用于正向STFT模塊12提供的頻率系數而抑制輸入信號10的較高頻分量(以及優選地還抑制非常低頻分量,例如,低于人類聽力范圍的分量)。在優選實施例中,低音提取器14的目的是輸出期望被復制為虛擬低音(例如,不包括低于人類聽力范圍的任何非常低頻能量)的低音信號(包括低音信號的基頻和低音信號的諧波結構的至少一部分)。
如圖1所示,所提取的低音信號16被提供到F0估計器24,F0估計器24用于估計低音信號16內的正生成的虛擬低音信號25期望對應的低音聲音(或音調)(即,虛擬低音信號25期望替換的低音聲音)的基頻F0。注意,在這里的討論中,基頻可互換地稱為F0或F0。盡管可使用任何F0檢測算法來提供基頻F0的估計,但是由于DFT(或其它頻率)頻譜的可用性,在當前實施例中,頻域中的方法是優選的。通常,這樣的技術中的隱含是正處理的音頻信號內的確定其基頻的主音或音調(在該情況下,主低音聲音或音調)的識別。在這點上,本發明人已發現任何給定時刻的單個低音聲音或音調的感覺的產生可以提供良好的聲音質量。當前,優選的方法如在Xuejing Sun,“A Pitch Determination Algorithm Based on Subharmonic-to-Harmonic Ratio”,The 6th International Conference of Spoken Language Processing,2000,pp.676-679和/或Xuejing Sun,“Pitch Determination and Voice Quality Analysis Using Subharmonic-to-Harmonic Ratio”,2002IEEE International Conference on Acoustics,Speech,and Signal Processing(ICASSP),vol.1,pp.I-333-I-336,13-17May 2002中所述。
可以可選地采用平滑機制來保證音頻幀之間的平滑轉變(即,幀之間的F0的平滑變化)。一個這樣的實施例使用以下一階無限脈沖響應(IIR)濾波器:
其中,n是幀編號,是平滑后的F0,并且α是濾波器系數并且與采樣頻率fs和時間常數τ有關,如:
低音不是始終存在于音頻信號中。當對于音頻幀不存在低音時,可以可選地禁止虛擬低音增強機制。以此方式開啟和關閉虛擬低音機制通常將產生更強以及更加期望的低音對比。為此目的,大部分F0檢測算法產生每個音頻幀的F0顯著性值(salience value),該F0顯著性值通常指示幀中的音調諧波結構的強度。例如,當使用這些F0檢測算法時,諧波幅度的和(SH)以及以上引用的Sun的文章中提及的次諧波與諧波的比率(SHR)可以用作顯著性函數。在SH的情況下,諧波結構越強,顯著性值越高。另一方面,SHR提供相反關系:SHR越高,諧波結構越弱。
在任意情況下,可以容易地采用所選擇的F0顯著性值來實現該開/關機制。例如,在某些實施例中,如果給定幀中的F0顯著性值低于(或者高于,根據顯著性值的特性,如先前段落所指出的)指定(例如,固定或動態設置的)閾值(或者不滿足例如與指定閾值有關的指定標準),則關閉虛擬低音機制(例如,對于該幀,虛擬低音信號25被設置或強制為0)。如上所述,存在產生不同顯著性值的多個潛在顯著性函數。每個這樣的顯著性函數通常具有可以調諧的多個參數,因此以實驗方式確定對于優選地要使用的給定顯著性值的適當閾值(用于開啟和關閉虛擬低音功能)。例如,閾值可基于來自各個評估器的測試組的主觀質量評估。替選地,并非使用在一定意義上確定為“最優”的固定閾值,用戶30可設置有允許用戶30例如根據他的或她的單獨偏好和/或基于當前正產生的特定聲音的性質(或聲音的類型)而調整值的用戶接口元件。在此外的實施例中,使用這些方法的組合(例如,在用戶30沒有指定設置的這些實例中,基于先前用戶設置,允許用戶30在期望時調整值以及采用機器學習算法來設置值)。
F0估計從估計器24被提供到轉換計算器26,轉換計算器26計算頻移器28隨后將用于轉換低音信號16的頻移(例如,轉換為輸出裝置42可以有效地產生聲音的頻率)。為了適當地維持低音信號的諧波結構,轉換后的諧音的頻率優選地是基頻F0的整數倍,因此頻移的值優選地是:
Δ=kF0
其中,k是正整數,這里稱為頻移乘數。使用這樣的頻移乘數,F0,2F0,3F0,...處的低音諧波頻率集合將被轉換(在頻移器28中)為F0+kF0,2F0+kF0,3F0+kF0,..處的目標諧波頻率集合。
以此方式,目標諧波頻率之間的差仍是F0,并且每個諧波頻率仍是F0的整數倍。因此,該諧波頻率集合將產生缺失的虛擬音調的感覺。另外,F0周圍的頻率的相同量(Δ)的轉換通常可以從感知角度保留原始低音質量。
頻移乘數優選地保證低音信號被偏移為揚聲器可以有效地產生聲音的頻率。在這點上,如果表示揚聲器可以有效地產生聲音的最低頻率,則對于具有公式1給出的通帶的低音信號的一個這樣的頻移乘數可被確定為:
其中,是返回大于或等于x的最小整數的向上取整函數(ceiling function)。對于在公式1中給出的所提取低音信號16(假定包括F0)的范圍,轉換后(頻率偏移后)的F0的相應范圍于是將是:
當所估計的F0在公式1給出的范圍的右端時,以上指定的乘數k可使得低音信號被轉換為非常高的頻率范圍,從而導致不期望的低音感知。該問題可通過替代地使用以下乘數來緩解:
該乘數是所估計的F0的函數,因此,隨著所估計的F0改變而在幀之間變化。為了限制當所估計的F0在得到作為整數的flt/F0的值附近改變時的不連續性影響,優選地,在公式1中給出的范圍的頂部的一倍頻程F0范圍被設置為用于所允許的F0估計的范圍,即,使得F0估計被限制在以下范圍內:
并且,任何初始的F0估計通過提高其倍頻程而被偏移到該范圍中。然后,轉換乘數可獲得為:
其是固定值。由于該修改后的F0估計被限制為公式5中指定的范圍,因此轉換后(偏移后)的F0的相應范圍是:
其顯著小于公式3指定的范圍。
如公式6所闡述的定義乘數k的另一優點在于,其使得與作為對于大部分F0檢測算法的共同問題的倍頻程誤差的問題無關。在這點上,注意,F0檢測算法易于產生比真實F0高或低一個或多個倍頻程的估計。如果使用公式2或公式4,則這樣的誤差將使得低音信號被轉換為顯著不同的頻率。由于所估計的F0被轉換為公式5的范圍,因此當使用公式6時,該問題變得無關。
轉換計算器26將轉換信息(例如,僅Δ或者k與F0一起)提供到頻移器28,該頻移器28優選地將整個提取的低音信號16轉換(或偏移)固定頻率增加Δ(例如,轉換為揚聲器或其它輸出裝置42可以有效地產生聲音的頻率),同時保證低音信號16的諧波結構保持不變。第n個STFT幀的虛擬低音信號V(f,n)的頻率表示可以從低音信號16的頻率表示B(f,n)獲得,例如,如:
V(f,n)=B(f-Δ,n)ej2πΔnM,
其中,M是STFT的塊大小。期望以上指出的相位調整保證連續STFT幀之間的平滑相位轉變。參見例如J.Laroche和M.Dolson,“New phase-vocoder techniques for real-time pitch shifting,chorusing,harmonizing,and other exotic audio modifications,”Journal of the Audio Engineering Society,47.11(1999):pp.928-936。
注意,在當前優選實施例中,F0被限制為與變換頻率(例如,DFT)頻點(bin)對應的頻率,因此,Δ是頻點寬度的整數倍。為此目的,發現采用這樣的限制顯著地簡化了所需的處理,而不會引起質量的任何顯著下降。然而,可以適應部分情況,并且這樣做的系統和處理旨在包括在本發明的范圍內。在先前段落引用的Laroche和Dolson的文章討論了根據這些路線的方法。
由于人類響度感知在低頻較不敏感,因此在缺少調整的情況下,與存在于原始信號10中的實際低音相比,要在系統5中添加的虛擬低音信號25(其包括較高頻率的集合)通常將聽起來(即,被感知為)更大聲。然而,優選地,使得所添加的虛擬低音聲音與原始低音一樣響,以維持所感知的響度平衡。為此目的,響度控制模塊29的主要目的是估計與輸入信號10中的原始低音相比虛擬低音信號25的所感知的響度水平的改變,然后使用該信息生成期望使兩者均衡的比例因子,即,估計對于虛擬低音信號25的最優音量調整以使得虛擬低音與原始音頻信號10良好地混合。另外,在某些實施例中,系統5呈現使得用戶30調整導致該比例因子的修改以便適合用戶30的偏好(例如,增加或減小的低音感覺)的設置的用戶接口。
優選地,響度控制模塊29首先估計所提取的低音信號16的聲音壓力水平(SPL)或功率。這樣做的一種方法是計算通帶內的功率的以下平均值,例如:
其中,Xn是第n個DFT系數,L和H分別是低音信號16內的最低和最高DFT頻點編號。另外,響度控制模塊29優選地標識所提取的低音信號16內的代表性或額定頻率。幾何平均值可用于計算原始低音信號16的該代表性或額定頻率,例如,如:
其中,fn是第n個DFT頻點的頻率。該代表性或額定頻率和功率然后可以被插入到ISO 226:2003的公式(2)中以獲得原始低音信號16的響度水平LN。
類似地,對于相應虛擬低音信號25的代表性或額定頻率可被計算為如下:
該代表性或額定頻率fV和響度水平LN然后可以被插入到ISO 226:2003的公式(1)中以獲得目標SPL,其然后可以被轉換為目標比例因子s,如:
經過或者沒有經過用戶30修改(例如,如以上所討論的)的該比例因子s然后與虛擬低音信號25一起被提供到乘法器32,以便產生期望的經音量調整的虛擬低音信號25’。響度控制模塊29和乘法器32的組合在這里可以共同被稱為“響度控制器”或“響度均衡器”。另外,盡管這里引用了ISO 226:2003,可替代地使用任何其它(例如,類似的)等響度水平數據集合。
如以上所指出的,輸入信號10的經頻域變換后的形式也可被提供到可選高通濾波器15。高通濾波器15(如果設置)的目的是抑制期望輸出裝置42不能有效再現的頻譜的全部較低部分。例如,可由高通濾波器15濾除低于指定頻率(例如,具有50Hz至200Hz的值)的頻率。應指出,特別是由于優選地低音提取器14提取低音音調(或聲音)的諧波結構的至少一部分,因此在低音信號16的頻譜與高通濾波器15通過的頻譜之間可存在重疊。與低音提取器14類似,高通濾波器15(如果設置)通常例如通過直接對變換模塊12提供的頻率系數應用具有期望濾波器特性的窗函數而執行其濾波操作(即,在該情況下,抑制輸入信號10的低頻分量)。如之前所指出的,高通濾波器15可以減少例如否則將在小型揚聲器中浪費的或可能導致其他負面影響的能量,但是其不是根據本發明的虛擬低音系統、處理或方法的關鍵或必要部分。
在加法器35中,頻域虛擬低音信號25’與經頻率變換的并且可能的高通濾波后的輸入信號相加。最終,在模塊36中執行反向變換(即,在模塊12中執行的變換的逆變換)以便將合成信號轉換回時域。所得到的輸出信號40通常在被提供到揚聲器或其它輸出裝置42之前將受到額外的處理(例如,數模變換、響度補償(諸如在2015年9月13日提交的共同轉讓美國專利申請第14/852,576號中所討論的,其全部內容通過引用合并于此)和/或放大)。替選地,可在將輸入信號10提供到系統5之前對輸入信號10執行這樣的額外處理中的任何處理或全部。
時域中的虛擬低音的相加
現在主要參照圖2討論完全在時域中操作的本實施例的替選實施例。如以下更詳細地討論的,圖2示出了系統105,系統105用于對原始輸入音頻信號10(通常為數字形式)進行處理,以便產生輸出音頻信號140,如在上述系統5中,輸出音頻信號140可以具有與原始信號10相比較少的實際低音內容但是添加了“虛擬低音”,例如,從而使得輸出音頻信號140更適合于不擅長產生低音的揚聲器或其它輸出裝置。
參照圖2,初始,低音提取器114優選地使用帶通濾波器而提取輸入信號10的低頻部分(例如,除了低于人類聽力范圍的非常低頻部分之外)。與低音提取器14相同,低音提取器114的通帶優選地在公式1中指定,并且低音提取器114的特性與低音提取器14的特性相同,除了低音提取器14在時域中工作之外。傳統的有限脈沖響應(FIR)或IIR濾波器可用于低音提取器114。所提取的低音信號(或低音部分)116被提供到F0估計器124。
盡管F0估計器124可使用任何F0檢測算法來提供基頻F0的估計,但是為了避免額外復雜度,在當前實施例中時域中的方法是優選的。優選的F0檢測算法檢查稱為整合窗(integration window)的指定數量的音頻樣本,該整合窗的大小優選地至少為與最小預期F0對應的周期的兩倍。在獲得F0值之后,優選地將音頻樣本提前稱為幀的多個樣本,該幀的大小優選地為整合窗的大小的一部分(即,小于整合窗)。如果頻繁地更新F0估計(即,與整合窗相比,幀大小較小),則優選地使用諸如過零率(ZCR)方法的簡單F0檢測方法,以便維持合理的計算負荷。另一方面,如果不頻繁地更新F0估計,則可以使用更復雜的方法來提供更可靠且準確的F0估計,諸如,如例如在Kawahara H.de Cheveigné,“YIN,a fundamental frequency estimator for speech and music”,J Acoust Soc Am.,Apr 2002,111(4):1917-30中討論的YIN估計方法。另外,與F0估計器24相同,F0估計器124優選地還采用(例如,類似的或相同的)平滑機制對音頻幀之間的F0估計和/或顯著性測量估計和相應閾值(或者類似或相關的標準)的變化進行平滑,以在各個幀內開啟和關閉虛擬低音機制。
估計器124生成的F0估計被提供到優選地與上述轉換計算器26類似或相同的轉換計算器126,并且相同的考慮一般適用。轉換計算器126的輸出(例如,僅Δ或者k與F0一起)然后被提供到頻移器128和響度控制模塊129。
頻移器128將整個提取的低音信號116轉換(或頻移)所計算的正頻率增量Δ,例如,轉換為揚聲器可以有效地產生聲音的頻率,同時保證低音信號的諧波結構保持不變。實現頻移器128的簡單方式是使用雙邊帶(DSB)調制,例如,如下:
v(n)=b(n)cos(2πfcn),
其中,分別地,n是樣本索引,fc是載波頻率(例如,Δ),b(n)是所提取的低音信號116,并且v(n)是所得到的虛擬低音信號125。使用傅立葉變換的調制定理,得到虛擬低音信號的頻譜V(f),如:
其中,B(f)是所提取的低音信號116的頻譜。如上所述,虛擬低音頻譜在載波頻率的任一側包括兩個邊帶或者低音頻譜的頻移副本,其中,較低邊帶是低音頻譜的頻率翻轉或鏡像副本。如果載波頻率被設置為所估計的F0的倍數,則兩個邊帶可以仍然維持有效諧波結構,因此虛擬低音頻譜B(f)構成有效虛擬信號。
存在用于選擇載波頻率fc的其它選擇。一種選擇是選擇使得較低和較高邊帶都被轉換為揚聲器可以有效地產生聲音的頻率范圍的值。該方法將導致在虛擬低音信號125中存在低音頻譜的兩個經頻移的副本:較低邊帶和較高邊帶,因此,虛擬低音信號的音色將顯著改變。另一選擇是選擇載波頻率fc為僅使得較高邊帶被轉換為揚聲器可以有效地產生聲音的頻率范圍的值。由于基本低音頻率是F0,因此這樣的載波頻率優選地被選擇為:
fc=kf0,
其保證較低邊帶低于揚聲器可以有效地產生聲音的頻率,因此限制了較低邊帶對音色的影響。然而,該較低邊帶通常產生了過熱以及線圈偏移,因此,該較低邊帶應該被限制。
當較低邊帶被抑制時,所得到的頻移方法稱為單邊帶(SSB)調制。SSB調制的一種方法是采用帶通濾波器來濾除較低邊帶。該濾波器優選地具有與所提取的低音信號116類似或相同的帶寬,但是其中心頻率優選地隨著所估計的F0變化。由于變化的中心頻率,優選地使用諸如以下截斷理想帶通濾波器的FIR濾波器:
其中,N是濾波器的長度,M=N/2,并且fl和fh分別是通帶的與低邊緣和高邊緣對應的頻率。
SSB調制的當前更優選的方法是使用希爾伯特變換以從所提取的低音信號116創建分析信號,將該分析信號轉換成期望頻率,以及取其實部。在圖3中示出了用于有效地實現該處理的一種算法。希爾伯特變換可由FIR濾波器來近似,該FIR濾波器可以使用帕克斯-麥克萊倫(Parks-McClellan)算法來設計(例如,如在David Ernesto Troncoso Romero和Gordana Jovanovic Dolecek,“Digital FIR Hilbert Transformers:Fundamentals and Efficient Design Methods”,chapter 19in“MATLAB-A Fundamental Tool for Scientific Computing and Engineering Applications-Volume 1”,Prof.Vasilios Katsikis(Ed.),Intech,ISBN:978-953-51-0750-7,InTech,DOI:10.5772/46451,pp.445-482(2012)中討論的)。對于使用IIR濾波器的實現,參見例如Scott Wardle,“A Hilbert transformer frequency shifter for audio,”First Workshop on Digital Audio Effects DAFx,1998。
如圖2所示,所提取的低音信號116和轉換計算器126的輸出(例如,僅Δ或者k與F0一起)被提供到響度控制模塊129,響度控制模塊129優選地提供與上述響度控制模塊29類似的功能,但是在時域中操作。例如,在該實施例中,可如下計算所提取的低音信號116內的功率值的滑動平均值:
其中,x(n)是輸入樣本值,并且N是塊大小。更簡單的實施例是使用低階IIR濾波器,諸如以下一階IIR濾波器:
P(n)=αP(n-1)+(1-α)x2(n),
公式8
其中,α是濾波器系數并且與采樣頻率fs和時間常數τ有關,如:
可例如使用公式1中給出的限制的算術平均值或以下幾何平均值來計算低音信號的代表性或額定頻率:
該代表性或額定頻率和所計算的低音功率(例如,如公式7或公式8中給出的)然后可以被插入到ISO 226:2003的公式(2)中以獲得其響度水平LN。
虛擬低音信號125的頻率范圍是:
因此,虛擬低音信號125的代表性或額定頻率可被計算為以上限制的算術平均值或其幾何平均值,例如:
該代表性或額定頻率和響度水平LN然后可以被插入到ISO 226:2003的公式(1)中以獲得目標SPL其可以進一步被轉換為比例因子,例如,如:
如在先前實施例中,該比例因子s優選地可由用戶30來修改。在具有或沒有這樣的修改的情況下,比例因子s然后與虛擬低音信號125一起被提供到乘法器132,以便產生期望的經音量調整的虛擬低音信號125’。響度控制模塊129和乘法器132的組合在這里可以共同被稱為“響度控制器”或“響度均衡器”。
輸入信號10還可被提供到可選的高通濾波器115。與高通濾波器15(如果設置)類似,濾波器115優選地抑制輸入音頻信號10的頻譜的期望輸出裝置42不能有效地再現的整個較低部分。濾波器115(如果設置)的優選頻率特性與以上針對濾波器15提供的優選頻率特性相同。然而,濾波器115(如果設置)在時域中工作(例如,被實現為FIR或IIR濾波器)。
在濾波器115(如果設置)之后,延遲元件134對可能濾波后的原始音頻信號進行延遲以在時間上將該信號與合成虛擬低音信號125’對準。此后,在加法器135中將兩個信號相加。所得到的輸出信號140通常在被提供到揚聲器或其它輸出裝置42之前經受額外的處理(例如,如以上關于系統5所討論的)。替選地,與系統5相同,可在將輸入信號10提供到系統105之前對輸入信號10執行這樣的額外處理中的任何處理或全部。
系統環境
一般而言,除了明確相反指出之外,這里描述的所有系統、方法、功能和技術可以利用一個或多個可編程通用計算裝置來實踐。這樣的裝置(例如,包括這里所述的任何電子裝置)通常將包括例如經由例如公共總線彼此耦合的以下部件中的至少一部分:(1)一個或多個中央處理單元(CPU);(2)只讀存儲器(ROM);(3)隨機存取存儲器(RAM);(4)其它集成或附接存儲裝置;(5)用于與其它裝置接口的輸入/輸出軟件和電路(例如,使用硬接線連接,諸如串行端口、并行端口、USB連接或火線連接,或者使用無線協議,諸如射頻標識(RFID)、任何其它近場通信(NFC)協議、藍牙或802.11協議);(6)用于例如使用硬接線連接(諸如以太網卡)或無線協議(諸如碼分多址(CDMA)、全球移動通信系統(GSM)、藍牙、802.11協議或者任何其它基于蜂窩或非基于蜂窩的系統)連接到一個或多個網絡的軟件和電路,這些網絡在本發明的許多實施例中進而連接到因特網或任何其它網絡;(7)顯示器(諸如陰極射線管顯示器、液晶顯示器、有機發光顯示器、聚合物發光顯示器或任何其它薄膜顯示器);(8)其它輸出裝置(諸如一個或多個揚聲器、耳機、激光或其它光投影儀和/或打印機);(9)一個或多個輸入裝置(諸如鼠標、一個或多個物理開關或可變控制、觸摸板、平板、觸敏顯示器或其它指向裝置、鍵盤、小鍵盤、麥克風和/或攝像裝置或掃描儀);(10)大容量存儲單元(諸如硬盤驅動器或固態驅動器);(11)實時時鐘;(12)可拆卸存儲讀/寫裝置(諸如閃存驅動器、利用半導體存儲器的任何其它便攜式驅動器、磁盤、磁帶、光磁盤、光盤等);和/或(13)調制解調器(例如,用于發送傳真或用于連接到因特網或任何其它計算機網絡)。在操作中,在一定程度上由這樣的通用計算機執行的用于實現以上方法和功能的處理步驟通常初始存儲在大容量存儲裝置(例如,硬盤或固態驅動器)中,被下載到RAM中,然后由CPU在RAM之外執行。然而,在一些情況下,處理步驟初始存儲在RAM或ROM中和/或直接在大容量存儲裝置之外執行。
可從各種賣方獲得用于實現本發明的適當通用可編程裝置。在各個實施例中,根據任務的大小和復雜性而使用不同類型的裝置。這樣的裝置可以包括例如大型計算機、多處理器計算機、一個或多個服務器盒、工作站、個人(例如,臺式、筆記本、平板或板式)計算機和/或甚至更小的計算機(諸如個人數字助理(PDA)、無線電話(例如,智能電話)或任何其它可編程設施或裝置),無論是單獨的、硬接線到網絡的還是無線連接到網絡的都可以。
另外,盡管以上描述了通用可編程裝置,但是在替選實施例中,替代地(或者另外地)使用一個或多個專用處理器或計算機。一般地,應注意,除了明確相反指出之外,上述任何功能都可以由執行軟件和/固件的通用處理器、專用(例如,基于邏輯的)硬件或這些方案的任何組合來實現,其中,基于已知的工程折中來選擇特定實現。更具體地,如本領域技術人員容易想到的,在上述任何處理和/或功能以固定的、預定的和/或邏輯方式來實現的情況下,可以由執行編程(例如,軟件或固件)的處理器、邏輯部件(硬件)的適當布置或者這兩者的任意組合來完成。換言之,如何將邏輯和/或算術操作轉換成用于在處理器內執行這樣的操作的指令和/或轉換成用于執行這樣的操作的邏輯門配置是容易理解的;實際上,編譯器通常可用于這兩種轉換。
應理解,本發明還涉及其上存儲有用于執行本發明的方法和功能的軟件或固件程序指令(即,計算機可執行處理指令)的機器可讀有形(或者非暫態)介質。作為示例,這樣的介質包括磁盤、磁帶、光學可讀取介質(諸如CD和DVD)或者半導體存儲器(諸如各種類型的存儲卡、USB閃存裝置、固態驅動器等)。在每種情況下,介質可采取便攜式物品的形式(諸如微型盤驅動器或小盤、磁碟、卡帶、盤式磁帶、卡、棒等),或者可采取相對較大或不便移動的物品的形式(諸如設置在計算機或其它裝置中的硬盤驅動器、ROM或RAM)。如這里所使用的,除非清楚相反指出,對存儲在計算機可讀或機器可讀介質上的計算機可執行處理步驟的引用旨在包括這樣的處理步驟存儲在單個介質上的情形以及這樣的處理步驟跨越多個介質存儲的情形。
先前描述主要強調了電子計算機和裝置。然而,應理解,可替代地使用任何其它計算裝置或其它類型的裝置,諸如利用能夠執行基本邏輯和/或算術操作的電子、光學、生物和化學處理的任何組合的裝置。
另外,在本公開引用處理器、計算機、服務器、服務器裝置、計算機可讀介質或其它存儲裝置、客戶端裝置或任何其它種類的設備或裝置的情況下,除了清楚相反指出之外,這樣的引用應被理解為包括使用多個這樣的處理器、計算機、服務器、服務器裝置、計算機可讀介質或其它存儲裝置、客戶端裝置或任何其它這樣的設備或裝置。例如,服務器一般可以(以及通常將)使用單個裝置或例如具有適當的負載平衡的服務器裝置的簇(本地或地理上分散)來實現。類似地,服務器裝置和客戶端裝置通常將配合執行完整方法的處理步驟,例如,其中,每個這樣的裝置具有其自己的存儲這樣的處理步驟的一部分的存儲裝置和其自己的執行這些處理步驟的處理器。
如這里所使用的,術語“耦合”或者該詞的任何其它形式旨在表示直接連接或者通過一個或多個其它元件或處理塊連接。在附圖和/或其討論中,在各個步驟、模塊或處理塊被示出和/或討論為直接連接到彼此的情況下,這樣的連接應被理解為可包括另外的元件和/或處理塊的耦合。除非在這里明確地并且具體地相反指出,否則這里對信號的引用表示信號的任何處理后形式或未處理形式。即,這里討論的和/或要求保護的具體處理步驟不旨在為排他性的;相反,可在這里明確討論的或要求保護的任何兩個處理步驟之間執行中間處理。
另外的考慮
在先前討論中,術語“操作者”、“操作”、“功能”和類似術語可以指的是根據特定實現/實施例的方法步驟或硬件部件。
除非清楚相反指出,在以上討論中諸如“最優”、“優化”、“最小化”、“最佳”和類似詞的詞以及表示比較的其它詞和前綴不以其絕對意義來使用。替代地,這樣的術語通常旨在根據任何其它潛在限制來理解,諸如用戶指定限制和目標以及成本和處理限制。
這里對旨在觸發、限制、過濾或者影響處理步驟、其它動作、處理步驟或動作的主體或者任何其它活動或數據的“標準”、“多個標準”、“條件”、“多個條件”或類似詞的引用旨在表示“一個或多個”,而與使用單數還是復數形式無關。例如,任何標準或條件可以包括動作、事件和/或發生(即,多部分標準或條件)的任何組合(例如,布爾組合)。
類似地,在以上討論中,功能有時被歸于特定模塊或部件。然而,功能一般可在任何不同的模塊或部件當中根據期望重新分配,從而在一些情況下,完全避免對于特定部件或模塊的需要和/或需要添加新的部件或模塊。如本領域技術人員所理解的,參考本發明的具體實施例,根據已知工程折中而優選地進行功能的精確分配。
在以上討論中,詞“包括(include)”、“包含(includes)”、“具有(including)”和該詞的所有其它形式不應被理解為限制性的,而是這樣的詞之后的任何具體項應被理解為僅是示例性的。
在以上以及在這里通過引用并入的文獻中描述了本發明的多個不同實施例,其中每個這樣的實施例被描述為包括某些特征。然而,如本領域技術人員所理解的,旨在為結合任何單個實施例的討論描述的特征不限于該實施例,而是也可包括和/或布置在任何其它實施例的各種組合中。
因此,盡管關于本發明的示例性實施例和附圖詳細描述了本發明,但是對本領域技術人員來說明顯的是,可在不背離本發明的精神和范圍的情況下實現本發明的各種調整和修改。因此,本發明不限于圖中示出的和以上描述的具體實施例。相反,旨在為不背離本發明的精神的所有這樣的變型應被視為在僅由所附權利要求限定的范圍中。