基于頻譜分析的超低時延音頻處理方法與系統的制作方法
【專利摘要】本發明涉及音頻信號處理領域,涉及基于頻譜分析的超低時延音頻處理方法及系統。該方法包括步驟1對輸入的時域音頻信號進行分幀和短時頻域變換;步驟2對短時頻域變換后的音頻信號經頻域功能函數進行分析處理,得出各個時頻單元的增益;步驟3對所述各個時頻單元的增益進行優化;步驟4將優化后的增益作為合成線性相位的FIR濾波器的頻響特征,通過頻率抽樣設計法計算得到FIR濾波器系數;步驟5,將FIR濾波器系數作用到FIR濾波器中,通過將步驟1的時域音頻信號直接進行FIR濾波器濾波得到期望輸出的音頻信號。該系統包括短時頻域變換模塊,信號處理模塊,平滑濾波模塊,濾波器系數計算模塊和濾波器應用模塊,本發明能降低實時信號處理的群時延。
【專利說明】
基于頻譜分析的超低時延音頻處理方法與系統
技術領域
[0001] 本發明涉及音頻信號處理領域,尤其針對數字助聽器的實時聲音信號處理功能, 提供超低時延的頻譜分析方法及處理系統。
【背景技術】
[0002] 目前在語音/音頻信號處理領域,基于頻譜分析的信號處理是極為常見做法。例 如,均衡器,降噪,頻譜搬移,反饋信號消除等最長見技術均是在頻譜分析的基礎上完成的。 為了精確的分析頻域信號特性,我們需要較高的頻譜分辨率,但是越高的頻譜分辨率會帶 來更高的信號群延時。
[0003] 群延時在電話,手機,耳機,助聽器和人工電子耳蝸等音頻設備中至關重要,引入 額外的信號通路延時可能對這些設備的性能和可用性造成重大的影響。在數字助聽器中, 佩戴者自己說話的聲信號會通過氣導、骨導及助聽器放大傳輸到佩戴者的耳膜或錘骨。其 中,通過助聽器的聲信號會延遲數毫秒。當聲通道信號與放大信號疊加時,因不同頻率的相 位變化率不同,會造成某些頻段聲音的抵消,某些頻段聲音的放大。這個叫做梳狀濾波效 應。梳狀濾波效應會變化助聽器本身的原始頻響,而這個影響會隨著延時增大變得更加明 顯 [7]。另一方面,系統延時本身也會影響助聽器的聽感一一若延時5ms,用戶便可以感知到 聲延時[1];若延時1 〇ms,用戶會對自己發出的聲音產生聽感上的混淆;15ms以上的延時會降 低語音辨析度[2]。因此,系統延時越小越好,而在助聽器中系統延時最大不可超過l〇ms,不 然會對患者使用帶來反面影響。
[0004] 在音頻處理中,一般我們會通過快速傅里葉變換(FFT)頻域分析法實現多頻帶處 理。根據FFT得出的頻譜信號,進行一系列的頻域信號處理,得出處理后的頻譜數據。再使 用快速傅里葉逆變換(IFFT)重疊相加合成還原相應時域輸出信號,如圖1所示。
[0005] 此時,系統群延時包括A/D轉換延時,信號處理延時,以及算法處理帶來的延時,表 示為:
[0006] Dgr〇up = Dad+Dp+Dwin (1)
[0007] 其中Dad是A/D轉換器把采集到的數據存入FIFO緩存所產生的延時,DP是處理一幀 信號所產生的延時,D win是因系統窗結構引起的延時,屬于算法延時。不同的系統根據需求 會引用不同窗函數,甚至選擇不同的系統結構。窗不僅可以處理幀與幀之間信號處理上的 不連續性,同時也可以提高頻譜分析特性 [2]。
[0008]在實時信號處理系統中,信號采樣時間與信號處理時間均等于一幀信號長度,即:
[0009] DP = R/fs(2)
[0010] ---------------------------------------------
[0011] DAD = R/fs (3)
[0012]式⑵,⑶中R是一幀信號的長度,fS是采樣率。
[0013] 這樣,式(1)可被簡化成:
[0014] Dgr〇up = 2R/fs+Dwin (4)
[0015] WOLA(Weighted Overlap Add)【11】是助聽器領域使用最廣使用的時頻分析方法, 其系統框圖如圖2所示。時域輸入信號為x(n,r),時域輸出信號為y(n,r)。其中n代表輸入 幀,r代表幀內采樣點。時域輸入信號x(n,r)經過W0LA分析模塊運算得出頻域信號X(n,k),k 是頻域子帶序號。處理模塊通過頻域輸入信號X(n,k)計算期望增益G(n,k)。處理模塊包括 助聽器系統包含的所有頻域處理算法,如WDRC,降噪,反饋抑制等。G(n,k)為所有算法輸出 增益整合后的值。頻域輸入信號X(n,k)應用期望增益G(n,k)后得出頻域輸出信號Y(n,k),Y (n,k)通過W0LA合成模塊轉換為時域輸出信號y (n,r)。
[0016] W0LA分析(WOLA-Analysis)的處理過程如圖3所示,輸入序列x(n,r),存到長度為 La的輸入緩沖,與長度為La的分析窗Wa加權處理;將加權后的序列分成若干組,每組長度為 N,然后將各組序列累加,再進行循環位移;最后通過快速傅里葉變換得到頻域輸入信號X (n,k)〇
[0017] W0LA綜合是W0LA分析的逆過程,如圖4所示。其中,Ws是長度為Ls的合成窗;由圖3 和圖4可知,分析窗和合成窗的長度分別為La和Ls,因此W0LA系統的窗延時為
[0018] Dwin=((La+Ls)/2-R)/fs (5)
[0019] 從而可以得出W0LA群延時
(6)
[0021]目前助聽器行業普遍采用16kHz采樣,32個子帶(K = 32,N = 64)的信號處理系統。 因 TOLA窗長度限制,參照優選窗配置表【12】,選一對32子帶的窗選項,即:La= 128,Ls = 64,N =64,R= 16,代入到式(6),可計算對應群延時
[0022]然而,助聽器若想采用更高的頻率分辨率,比如,采用N=128,那對應的系統群延 時會達到約14ms。這已經超過了助聽器延時不能超過10ms的經驗限制。
[0023] 根據 1961 年Eberhard Zwicker發布的聲學臨界帶寬模型(Bark scale critical band)[13],人耳蝸低頻段臨界帶寬范圍在80Hz至160Hz之間。換句話說,一個16KHz采樣率的 助聽器系統,若要達到人耳聽覺系統的頻率分辨率,那至少需要100個線性頻帶(N=200)。
[0024] 總而言之,系統群延時影響了助聽器等實時音頻系統的實時性與準確性,也限制 了頻率分辨率的提高,而如何能夠提供一種降低實時音頻系統群延時的方法成為了本領域 技術人員迫切解決的問題。
【發明內容】
[0025] 解決上述技術問題,本發明提出了一種基于頻譜分析的超低時延音頻處理方法及 系統,可以大幅度降低實時信號處理的群時延。
[0026] 為了達到上述目的,本發明所采用的技術方案是,一種基于頻譜分析的超低時延 音頻處理方法,如圖5所示,包括以下步驟:
[0027] 步驟1,對輸入的時域音頻信號進行分幀和短時頻域變換;
[0028] 步驟2,對短時頻域變換后的音頻信號,經頻域功能函數進行分析處理,得出各個 時頻單元的增益;
[0029] 步驟3,對所述各個時頻單元的增益進行優化,以降低音質失真;
[0030] 步驟4,將優化后的增益作為合成線性相位的FIR濾波器的頻響特征,通過頻率抽 樣設計法計算得到FIR濾波器系數;
[0031] 步驟5,將FIR濾波器系數作用到FIR濾波器中,通過將步驟1的時域音頻信號直接 進行FIR濾波器濾波得到期望輸出的音頻信號。
[0032] 進一步的,所述步驟1中的短時頻域變換為加權重疊相加分析(Weighted Overlap Add Analysis,W0LA-a)〇
[0033]進一步的,所述步驟2中的分析處理是根據具體算法功能的需求計算相應的增益, 具體算法功能包含寬動態范圍壓縮算法,頻譜降噪算法等任意頻域聲音信號處理算法。 [0034]進一步的,所述步驟3中的優化包括,采用加重移動平均模型(Weighted MovingAverage Method)【4】,如式(7)所不:
(7)
[0036] 其中k為子帶序號;M為平滑的長度,在這里選為奇數;a為平滑向量。
[0037] 進一步的,所述步驟4中的合成線性相位的FIR濾波器,具體包括:
[0038]使用頻率抽樣設計法設計FIR濾波器,把步驟3所得的增益值當作理想的頻率響 應,同時確保線性相位,如式(8)~(9)所示:
[0039]當N為偶數時,
[0041 ] 當N為奇數時,
[0043] 式中N為WOLA-a處理時FFT的點數;
[0044] 將上述的濾波器的頻率響應H(k)進行傅里葉逆變換(IFFT)得濾波器的系數h(n), 濾波器的長度為n = N。
[0045] 更進一步的,因本發明的輸入信號是直接通過FIR濾波器濾波得出期望的輸出信 號,并沒有通過窗函的分析或合成,這樣本發明的群延時公式變化為:
[0046] D?P = Dad +Dp+ Dmer (10)
[0047] 其中,DFilter是FIR濾波過程所產生的延時,其延時時長為:
[0049]其中,n為濾波器介數。 (11) (12)
[0050]因 n = N,可以得出本發明的群延時公式:
[0052] 本發明通過使用自適應FIR濾波器實現信號處理。通過式(6)減去式(12)可得出本 發明相對傳統W0LA信號處理系統的延時差異公式,如式(13)。
(13)
[0054]在W0LA濾波器組的參數設置當中,分析窗,合成窗和FFT的點數必須滿足La多Ls多 N彡2R;同時,La,Ls,N,R之間要滿足倍數關系[11]。另外,在OnsemiConductor公司提供的最 優化的W0LA配置 [12]中,分析窗至少為幀長的4倍,即La》4R;合成窗至少為幀長的2倍,即Ls 彡2R。上述條件通過式(13)可得出:
(14)
[0056]因此,我們可以得出結論:本發明一種基于頻譜分析的超低時延音頻處理方法相 對W0LA系統至少減少了1幀長度的群延時。
[0057]相應的,本發明還公開了一種基于頻譜分析的超低時延音頻處理系統,包括:
[0058] 短時頻域變換模塊,用于將輸入的時域音頻信號進行分幀并變換到頻域;
[0059] 信號處理模塊,用于對所述的短時頻域變換后的音頻信號,計算系統所需的增益;
[0060] 平滑濾波模塊,用于對所述的各個時頻單元的增益進行平滑,以降低音質失真;
[0061] 濾波器系數計算模塊,用于對所述的平滑后的增益使用頻率抽樣設計法,計算濾 波器的系數;
[0062] 濾波器應用模塊,用于將輸入的時域音頻信號通過所述的合成濾波器得到最終的 時域音頻信號輸出。
[0063] 本發明通過采用上述技術方案,與現有技術相比,具有如下優點:本發明提出的基 于頻譜分析的超低時延音頻處理方法有效降低了算法延時,從而大幅度降低實時信號處理 的群時延,并沒有產生信號失真或諧波過大等不良效應。
[0064]本發明提出的基于頻譜分析的超低時延音頻處理系統,同樣降低了理論系統延 時,提尚了廣品的性能。
【附圖說明】
[0065]圖1信號頻域處理系統框圖。
[0066]圖2 W0LA濾波器組處理系統框圖。
[0067]圖3 W0LA濾波器組處理系統流程圖。
[0068] 圖4 W0LA分析處理系統框圖。
[0069]圖5 W0LA合成處理系統框圖。
[0070]圖6是本發明實施例的WDRC處理系統框圖。
[0071]圖7是本發明實施例的WDRC輸入輸出曲線圖。
[0072]圖8為算法延時對比圖。
[0073]圖9為原始輸入時幅圖。
[0074]圖10為WOLA合成方式輸出時幅圖。
[0075]圖11為FIR濾波方式輸出時幅圖。
[0076]圖12為原始輸入時頻圖。
[0077]圖13為W0LA合成方式輸出時頻圖。
[0078]圖14為FIR濾波方式輸出時頻圖。
【具體實施方式】
[0079]現結合附圖和【具體實施方式】對本發明進一步說明。
[0080]作為一個具體的實施例,本發明采用基于超低時延FIR合成濾波器的寬動態范圍 壓縮(WDRC)方法,如圖6所示,主要包括如下步驟:
[0081 ]步驟1,輸入緩沖更新與短時頻域變換:即對輸入的時域音頻信號進行分幀和短時 頻域變換;
[0082] 步驟2,頻域信號處理:對短時頻域變換后的音頻信號,經頻域功能函數進行分析 處理,得出各個時頻單元的增益;具體包含通道劃分及通道能量估計、平滑處理、通道壓縮 增益計算、子帶增益計算;
[0083] 步驟3,增益平滑:對所述各個時頻單元的增益進行優化,以降低音質失真;
[0084] 步驟4,濾波器系數計算:將優化后的增益作為合成線性相位的FIR濾波器的頻響 特征,通過頻率抽樣設計法計算得到FIR濾波器系數;
[0085] 步驟5,FIR濾波器濾波:將FIR濾波器系數作用到FIR濾波器中,通過將步驟1的時 域音頻信號直接進行FIR濾波器濾波得到期望輸出的音頻信號。
[0086] 緩沖區的輸入信號經過短時頻域變換分成若干個子帶(或說成頻帶)。將幾個子帶 進行組合分成數個獨立的頻率區域,這些頻率區域叫做通道。通道劃分及通道能量估計要 根據人耳對頻率的感知特性進行能量與聲壓級的計算 [9:^WDRC的目的是根據每個通道的輸 入聲壓級,把輸出聲壓級壓縮至目標增益。目標增益是目標公式根據患者聽損,及患者的其 他信息(聽損類型,性別,年齡,耳腔結構等)計算得出的 [7]。通常,PC端的驗配軟件會通過目 標曲線預先計算出WDRC所需的閾值,壓縮比等信息,存入助聽器芯片中方便調用。增益還原 步驟是將通道增益還原成子帶的增益。增益平滑步驟通過對各子帶的壓縮增益進行平滑, 以降低由于子帶間的壓縮增益偏差過大引起的吉布斯失真現象 [8]。濾波器系數計算步驟通 過平滑后的增益做為頻率響應,使用頻率抽樣設計法計算FIR濾波器系數。FIR濾波器濾波 是將濾波器系數作用在FIR濾波器上,實時更新,再將輸入信號通過濾波器濾波,得到聲音 壓縮效果。
[0087]在本發明優選實施例中,采樣率為16kHz,采樣精度為16bit,信號以幀為單位進行 處理,幀長是2ms,即每幀的采樣點數R=32。時頻變換方法采用加權重疊相加分析(W0LA-&),其中,1^ = 256,1^ = 128 4=128,選擇偶型變換。對應的時頻變換后的頻域子帶數1(= 64。將第n幀信號x(n,r)通過時頻變換后得到第n幀的頻域信號X(n,k)。其中kG[0,K-l],表 示子帶數。
[0088] 進一步的,因 X(n,k) =a(n,k)+b(n,k) X i,X(n,k)可分為實部和虛部,分別為a (n,k)、b(n,k)〇
[0089]圖6中示出的基于超低時延FIR合成濾波器的寬動態范圍壓縮(WDRC)實現方法實 施例包括:
[0090]以下將上述步驟1至步驟5進一步展開,步驟1展開為步驟S1和步驟S2,步驟2展開 為步驟S3至S5,步驟3展開為步驟S6,步驟4展開為步驟S7和步驟S8,步驟5展開為步驟S9。 [0091 ]步驟S1,圖6中的短時頻域變換模塊采用加權重疊相加分析(WOLA-a),對經麥克風 采集、模數變換后的時域信號x(n,r)進行時頻變化得到頻域信號X(n,k);
[0092]步驟S2,圖6中的通道能量計算模塊與子帶增益計算模塊采用人耳模型ERB (equivalent rectangular bandwidth)頻標[5],進行通道分割與子帶還原。其通道分割點 的設定分別為:187.5Hz、562.5Hz、1062.5Hz、2062.5Hz、3737.5Hz、8000Hz。這樣我們就可以 將0~187.5Hz頻段所包含的子帶都劃到通道1里來,將187.5~562.5Hz頻段所包含的子帶 都劃到通道2里來,對于其他通道數的情況,依次類推。其次,通過均方根公式計算通道能量 Prms,并轉換為聲壓級(Sound Pressure Level,SPL,單位為dB SPL)。因不同的麥克風有不 同的輸入靈敏度,因此,此時得出的聲壓級Prms需要與麥克風靈敏度Senmi。結合才是助聽器 接收到的實際的聲信號聲壓級。其具體步驟如下:假設通道M內有K個子帶,而通道1~m-1共 有M個子帶,則通道m的能量均方根P RMS(m)為:
[0094] 聲壓級的定義為將待測聲壓有效值p(e)與參考聲壓p(ref)的比值取常用對數, 再乘以20,即:
1,其中參考聲壓P(ref)-般取空氣參考聲壓,為2X 1〇_5帕。所以,通道m的聲壓級SPL(m):
[0095] SPL(m) =201ogio(PRMs(m) )+Senmic+94 (16)
[0096]其中,Senmi。為麥克風靈敏度,94為轉換到dB域上的參考聲壓。
[0097]步驟S3,頻域信號處理部分中的平滑處理采用壓縮釋放公式進行,如式(17)所示, 得出平滑后的輸入聲壓級YspiXm): if SPL (/?, m) > Ysr, m) YSPl [njn) = (\ - a) y. YSPL (? -1, m) + a x SPL(n, m)
[0098] q]:s& (17) Ysri [n,m ) = {X - {3) y. Ysr/ (n-1,m) + ^ x SPL (n, m) end
[0099] 其中a為跟蹤時間(Attack Time)系數,0為釋放時間(Release Time)系數。其取值 方法為
,其中R為一幀的采樣點數,fS為采樣率,T為時間常數。在本次優 選實例中跟蹤時間常數為12ms;當通道的中心頻率小于500Hz時釋放時間常數為125ms,大 于500時為70ms。
[0100]步驟S4,通道壓縮增益計算模塊根據YSPL(n,m)和設置好的輸入/輸出函數關系曲 線計算壓縮增益。輸入/輸出函數關系曲線如圖7所示,
[0101]壓縮比定義為
[0103] 通道壓縮增益可以通過壓縮比,輸入拐點得出。因聲壓級處于對數域,所以該通道 的經過動態范圍壓縮處理后的增益的計算要用如下公式計算:
[0105] 其中LTh為WDRC輸入拐點,m為通道數。在本發明的優選實例中,壓縮比設定為CR = 3:1;輸入拐點設定為LTh = 45dB SPL。
[0106] 步驟S5,子帶增益計算模塊對所述的各個通道的增益還原成各個時頻單元的增 益,也就是使通道內的子帶增益等于該通道的增益。
[0107] 步驟S6,圖6中增益平滑模塊將步驟5所述的各個時頻單元的增益通過式(7)提到 的加重移動平均方法進行平滑,以進一步降低音質失真。在優選實例中使用5點平滑,即M = 5,對應的平滑向量a如式(20)所示。
[0108] a= [0.07,0.25,0.36,0.25,0.07] (20)
[0109] 步驟S7,所述的合成線性相位的FIR濾波器,使用頻率抽樣設計法設計FIR濾波器, 把步驟6所得的增益值當作理想的頻率響應進行計算。其中,增益值均為實數。為了保證信 號連續性,濾波器要確保線性相位,具體公式如式(21):
[0111] 步驟S8,將H(k)進行IFFT得到濾波器系數h(n)。上述的步驟7與步驟8屬于圖6中的 濾波器系數計算模塊。
[0112] 步驟S9,對用圖6中FIR濾波器模塊,將步驟8所述的濾波器系數h(n)應用到FIR濾 波器中,對輸入的時域信號進行濾波,得到期望的輸出信號。
[0113] 為了表述本發明提出的基于頻譜分析的超低時延音頻處理系統有更小的群延時, 通過式(11)計算本發明的FIR濾波延時:
(22)
[0115] 通過式(5)計算利用W0LA合成方式的窗延時:
[0116] Dwin=((256+128)/2-32)/fs = 160/fs (23)
[0117] 圖8為通過仿真輸入單位沖擊信號測試系統延時的結果。仿真過程沒有加入A/D采 樣與系統處理時間,因此,圖形上只包含算法部分帶來的延時(即窗延時或濾波器延時)。圖 8(上)為輸入單位沖擊信號,其沖擊點在第100個采樣點。圖8(中)為通過W0LA合成得出的輸 出信號,其沖擊點在第260點。圖8(下)為本發明一一通過FIR濾波得出的輸出信號,其沖擊 點在第163點與164點之間。也就是說,采用W0LA合成方式的系統延時為160個采樣點,采用 時變FIR濾波方式的系統延時為63.5個采樣點,這與式(22),式(23)計算得出的結果相吻 合。 (24)
[0118]同樣的,可以通過式(6)與式(12)分別計算使用W0LA合成方式的系統群延時 !>=;;,以及使用FIR濾波方式的系統群延時:
(25)
[0122] 由此可見,傳統的W0LA系統若采用64子帶的頻率分辨率,在16KHz采樣率下系統延 時達到了 14ms,顯然是不可接受的。然而,本發明提出的基于頻譜分析的超低時延音頻處理 方法在同樣采樣率與頻率分辨率下只產生了 8ms的系統延時,在助聽器可接受的延時時長 范圍內。
[0123] 再者,通過掃頻信號對WDRC壓縮效果進行測試。測試音頻輸入聲壓級為94dBSPL, 掃頻頻率從〇Hz到8000Hz;通道的壓縮比均設為3,壓縮拐點設在45dB。圖9為歸一化的掃頻 輸入信號的時域圖。參考聲壓設定為94,因此,歸一化后的OdB代表系統中94dB SPL。圖10, 圖11分別為通過W0LA合成得出的時域信號與本發明提出的通過時變FIR濾波得出的時域輸 出信號。參照圖9,圖10和圖11可知,掃頻頻率經過子帶分割點與同道分割點時均產生了對 應的能量抖動。圖12,圖13和圖14是對應圖9,圖10和圖11的時頻圖。圖13和圖14與圖12比較 可知,兩種方法均在頻域上產生了一定量的諧波,W0LA合成方式產生的諧波比FIR濾波方式 產生的諧波較多一些。
[0124] 總之,本發明提出的基于頻譜分析的超低時延音頻處理方法有效降低了算法延時 60.31%,降低了理論系統延時42.86%,并沒有產生信號失真或諧波過大等不良效應。
[0125] 相應的,本實施例還公開了一種基于頻譜分析的超低時延音頻處理系統,包括:
[0126] 短時頻域變換模塊,用于將輸入的時域音頻信號進行分幀并變換到頻域;
[0127] 信號處理模塊,用于對所述的短時頻域變換后的音頻信號,計算系統所需的增益;
[0128] 平滑濾波模塊,用于對所述的各個時頻單元的增益進行平滑,以降低音質失真;
[0129] 濾波器系數計算模塊,用于對所述的平滑后的增益使用頻率抽樣設計法,計算濾 波器的系數;
[0130] 濾波器應用模塊,用于將輸入的時域音頻信號通過所述的合成濾波器得到最終的 時域音頻信號輸出。
[0131] 盡管結合優選實施方案具體展示和介紹了本發明,但所屬領域的技術人員應該 明白,在不脫離所附權利要求書所限定的本發明的精神和范圍內,在形式上和細節上可以 對本發明做出各種變化,均為本發明的保護范圍。
[0132] 參考文獻:
[0133] [l]Moir J.(1976)0n differential time delay.J Audio Eng Soc,24(9):752〇
[0134] [2]Stone MA,Moore BCJ.(2003)Tolerable hearing aid delays.Ill.Effects on speech production and perception of across-frequency variation in delay.Ear&Hear,24(2):175-83〇
[0135] [3]0ppenheim,Alan V.;Schafer,Ronald ff.(1975).Digital signal processing.Englewood Cliffs,N.J.:Prentice-Hall.ISBN 0-13-214635-5〇
[0136] [4]''Weighted Moving Averages:The Basics"? Investopedia〇
[0137] [ 5 ] Smi th,Ju 1 ius 0 ?; Abe 1,Jonathan S ?( 1 OMay 2007 )? "Equi valent Rectangular Bandwidth".Bark and ERB Bilinear Transforms.Center for Computer Research in Music and Acoustics(CCRMA),Stanford University,USA.Retrieved 20January 2013〇
[0138] [7]Harvey Dillon,(2012)?"Hearing Aids".Thieme Medical Publishers Inc; 2.ISBN:1604068108。
[0139] [8]Hewitt,Edwin;Hewitt,Robert E.(1979).^The Gibbs-ffi1braham phenomenon:An episode in Fourier analysis".Archive for History of Exact Sciences 21(2):129-160.doi:10.1007/BF00330404.Retrieved 16September 2011.Available on-line at:National Chiao Tung University:Open Course Ware: Hewitt&Hewitt,1979。
[0140] [9]James M.Kates.Digital Hearing Aids[B]?San Diego,CA 92123:Plural Publishing INC.2008,263-290。
[0141] [10]Zwicker,E.(1961) /Subdivision of the audible frequency range into critical bands,"The Journal ofthe Acoustical Society of America,Volume 33, Issue 2,pp.248_248(1961)〇
[0142] [ll]Brennan,Robert,Schneider,Todd,"A Flexible Filterbank Structure for Extensive Signal Manipulations in Digital Hearing Aids"?Circuits and Systems,1998.ISCAS'98。
[0143] [12]^Reference Manua1:HEAR Configurable Accelerator^,0N Semiconductor,(November 2009)〇
[0144] [13]Julius 0?Smith III and Jonathan S?Abel?"The Bark Frequency Scale",CCRMA.Stanford.edu。
【主權項】
1. 一種基于頻譜分析的超低時延音頻處理方法,其特征在于:包括以下步驟: 步驟1,對輸入的時域音頻信號進行分幀和短時頻域變換; 步驟2,對短時頻域變換后的音頻信號,經頻域功能函數進行分析處理,得出各個時頻 單元的增益; 步驟3,對所述各個時頻單元的增益進行優化,以降低音質失真; 步驟4,將優化后的增益作為合成線性相位的FIR濾波器的頻響特征,通過頻率抽樣設 計法計算得到FIR濾波器系數; 步驟5,將FIR濾波器系數作用到FIR濾波器中,通過將步驟1的時域音頻信號直接進行 FIR濾波器濾波得到期望輸出的音頻信號。2. 根據權利要求1所述的一種基于頻譜分析的超低時延音頻處理方法,其特征在于:所 述步驟1中的短時頻域變換為加權重疊相加分析。3. 根據權利要求1所述的一種基于頻譜分析的超低時延音頻處理方法,其特征在于:所 述步驟2中的分析處理是根據具體算法功能的需求計算相應的增益。4. 根據權利要求1所述的一種基于頻譜分析的超低時延音頻處理方法,其特征在于:所 述步驟3中的優化包括采用加重移動平均模型,如式(7)所示:其中k為子帶序號;M為平滑的長度,在這里選為奇數;a為平滑向量。5. 根據權利要求1所述的一種基于頻譜分析的超低時延音頻處理方法,其特征在于:所 述步驟4中的合成線性相位的FIR濾波器,具體包括: 使用頻率抽樣設計法設計FIR濾波器,把步驟3所得的增益值當作理想的頻率響應,同 時確保線性相位,如式(8)~(9)所示:式中N為WOLA-a處理時FFT的點數; 將上述的濾波器的頻率響應H(k)進行傅里葉逆變換(IFFT)得濾波器的系數h(n),濾波 器的長度為n = N。6. 根據權利要求5所述的一種基于頻譜分析的超低時延音頻處理方法,其特征在于:輸 入信號是直接通過FIR濾波器濾波得出期望的輸出信號,并沒有通過窗函的分析或合成,群 延時公式為:其中,DFiiter是FIR濾波過程所產生的延時,其延時時長為:其中,η為濾波器介數。 因 η = Ν,可以得出本發明的群延時公式:7. -種基于頻譜分析的超低時延音頻處理系統,其特征在于:包括: 短時頻域變換模塊,用于將輸入的時域音頻信號進行分幀并變換到頻域; 信號處理模塊,用于對所述的短時頻域變換后的音頻信號,計算系統所需的增益; 平滑濾波模塊,用于對所述的各個時頻單元的增益進行平滑,以降低音質失真; 濾波器系數計算模塊,用于對所述的平滑后的增益使用頻率抽樣設計法,計算濾波器 的系數; 濾波器應用模塊,用于將輸入的時域音頻信號通過所述的合成濾波器得到最終的時域 音頻信號輸出。
【文檔編號】G10L21/0232GK105931649SQ201610194961
【公開日】2016年9月7日
【申請日】2016年3月31日
【發明人】梁維謙, 馬桂林, 薛行棟, 樸志剛
【申請人】歐仕達聽力科技(廈門)有限公司