一種帶降噪的人工耳蝸言語處理系統及方法
【專利摘要】本發明公開了一種帶降噪的人工耳蝸言語處理系統及方法,其中方法包括以下步驟:對外界的聲音信號進行拾取,拾取到的信號為帶噪信號;對帶噪信號進行時域到頻域的轉換;根據頻率對帶噪信號進行分頻處理,將帶噪信號劃分至不同的頻率通道;對每個通道的帶噪信號的包絡進行計算和提取;對每個通道的帶噪信號的噪聲功率譜進行估計;根據所估計的噪聲功率譜,使用二元掩蔽法對每個通道的帶噪信號的噪聲進行消除。本發明用于對每個通道的帶噪信號進行噪聲功率譜的估計,通過二元掩蔽的方法對每個通道的噪聲信號進行消除,從而實現提高人工耳蝸植入者在噪聲環境下的言語識別率和聽音感受的效果。
【專利說明】
一種帶降噪的人工耳蝸言語處理系統及方法
技術領域
[0001] 本發明屬于醫療器械領域,特別涉及一種帶降噪的人工耳蝸言語處理系統及方 法。
【背景技術】
[0002] 人工耳蝸可以幫助重度或極重度的耳聾患者恢復部分聽力。在安靜的環境中,多 數植入者能達到較高的言語理解水平和交流能力。但在噪聲環境下,耳蝸植入者言語的識 別率會隨著語音信號信噪比(SNR)的降低而出現陡降。同時,強噪聲還會嚴重破壞耳蝸植入 者的聽音感受。
[0003] 人工耳蝸植入者在安靜環境中言語測試各項識別率從高到低依次為短句、韻母、 聲母和單音節詞;而在不同噪聲環境中平均言語識別率從高到低依次為韻母、聲母、單音節 詞和短句,其中短句的影響最大,且各項識別率明顯低于其在安靜環境中的識別率;噪聲的 頻率譜越接近測試聲的言語長時平均譜,植入者的言語識別率越低。因此,消除噪聲可以有 效提升人工耳蝸植入者在噪聲環境下的言語識別能力。
[0004] 現有的技術中,降噪采用譜減法,即用在頻域將短時的帶噪語音功率譜減去噪聲 的功率譜,估計的語音功率譜通過如下公式得到:
[0005] |SK(〇^|Yw(w)j-E[DJ0)^
[0006] 其中|Yw( ω ) I是帶噪語音的功率譜,E[ |DW( ω ) I ]是噪聲的功率譜。需要注意的是, 這種方法主要針對短時功率譜。然后利用人的聽覺系統對語音的幅度比較敏感,而對語音 的相位不敏感的特性,增強后的語音信號根據如下公式估計:
[0007] Sj(-))-|Sn(c))|cxp(jY,(c·)))
[0008] Su(m)= F '[sJvro)J
[0009] 這種降噪方法雖然簡單,但是由于對噪聲功率譜的估計總是會出現誤差,并且易 產生令人反感的"音樂噪聲",影響植入者的聽音感受和可懂度。
[0010] 針對以上問題,本發明提出了一種基于多通道的針對人工耳蝸的降噪算法,核心 思想是通過對每個通道的帶噪信號進行噪聲功率譜的估計,然后使用二元掩蔽的方法對每 個通道的噪聲信號進行消除來提高在噪聲環境下的言語識別率和聽音感受。
【發明內容】
:
[0011] 有鑒于此,本發明的目的在于提供一種帶降噪的人工耳蝸言語處理系統及方法, 用于對每個通道的帶噪信號進行噪聲功率譜的估計,通過二元掩蔽的方法對每個通道的噪 聲信號進行消除,從而實現提高人工耳蝸病人在噪聲環境下的言語識別率和聽音感受的效 果。
[0012] 為達到上述目的,本發明提供了一種帶降噪的人工耳蝸言語處理系統,包括依次 連接的信號輸入單元,快速傅葉里變換單元,分頻處理單元,包絡檢測單元,其特征在于,還 包括依次連接的降噪處理單元,通道選擇單元,非線性壓縮單元,脈沖調制單元,其中,
[0013] 所述信號輸入單元,用于對外界的聲音進行拾取,拾取到的信號為帶噪信號;
[0014] 所述快速傅葉里變換單元,用于對所述信號輸入單元拾取到的帶噪信號進行時域 到頻域的轉換;
[0015] 所述分頻處理單元,用于根據頻率對快速傅里葉變換后的帶噪信號進行分頻處 理,將帶噪信號劃分至不同的頻率通道;
[0016] 所述包絡檢測單元,用于對分頻處理單元輸出的每個通道的帶噪信號的包絡進行 計算和提取;
[0017] 所述降噪處理單元與所述包絡檢測單元連接,包括噪聲估計單元和噪聲消除單 元,所述噪聲估計單元,用于對每個通道的帶噪信號的噪聲功率譜進行估計;所述噪聲消除 單元,用于根據所估計的噪聲功率譜,使用二元掩蔽法對每個通道的帶噪信號的噪聲進行 消除;
[0018] 所述通道選擇單元,用于對所有的16-24個通道進行能量選擇,選出經降噪處理后 能量最強的6-8個通道;
[0019] 所述非線性壓縮單元,用于對上述6-8通道信號幅度的動態范圍進行壓縮和映射;
[0020] 所述脈沖調制單元,用于根據壓縮好的包絡,對電脈沖進行調制后輸出。
[0021] 可選地,所述噪聲估計單元,帶噪信號功率譜的局部最小值,通過如下公式進行估 計: 「m99l p ( , Y_ J P(ni,k), P,,,;,,(m-l.k)> P(m,k) > [υΡμηβ(m"· !>k) + λ(Ρ(ηι, k)- pp{m -1,k)), P· (m-l,k)< P(m,k)
[0023] 其中,Pmin(m,k)為第k通道,第m幀帶噪信號功率譜的局部最小值,γ是取值范圍為 0.9到0.99的常量,λ是取值范圍為0.1到0.5之間的常量,β是取值范圍為0.2到0.5之間的常 量,P(m,k)為第k通道,第m幀的帶噪信號的功率譜,P min(m-l,k)為第k通道,第m-Ι幀帶噪信 號功率譜的局部最小值。
[0024] 可選地,所述噪聲估計單元,通過計算每幀更新的帶噪信號的功率譜,以及所估計 的帶噪信號功率譜的局部最小值,功率譜比R通過如下公式得到: "/ , \ P(m, k)
[0025] -7--τ,
[0026] 其中,R(m,k)為第k通道,第m幀的功率譜比,P (m,k)為第k通道,第m幀的帶噪信號 的功率譜,Pmin(m,k)為第k通道,第m幀帶噪信號功率譜的局部最小值。
[0027] 可選地,所述噪聲估計單元,通過計算當前帶噪信號的加權功率譜與局部最小功 率譜的功率譜比,與一個常量閾值T進行比較,語音信號出現的概率通過如下公式得到: ., s ?αΚ?ηι-1, k)+(l - a), R(tn, k ) > Τ
[0028] lVl'm,k) _ jHK(m- I, R(m 'l<) < T,
[0029] 其中,K(m,k)為第k通道,第m幀語音信號出現的概率,α是取值范圍為0.2到0.5的 常量,R(m,k)為第k通道,第m幀的功率譜比,T是常量閾值,其取值范圍為2到5。
[0030] 可選地,所述噪聲估計單元,根據語音信號出現的概率,噪聲估計的平滑因子通過 如下公式進行更新:
[0031] as(m,k)=ad+(l-ad)K(m,k),
[0032] 其中,as(m,k)為第k通道,第m幀噪聲估計的平滑因子,ad是取值范圍為0.8到0.95 的常量,K(m,k)為第k通道,第m幀語音信號出現的概率。
[0033] 可選地,所述噪聲估計單元,根據更新后噪聲估計的平滑因子,每個通道的噪聲功 率譜通過如下公式得到:
[0034] D(m,k) = as(m,k)D(m_l,k) + ( l_as(m,k)) | Y(m,k) |2,
[0035] 其中,D(m,k)為第k通道,第m幀噪聲估計的功率譜,as(m,k)為第k通道,第m幀噪聲 估計的平滑因子,|Y(m,k) |2為第k通道,第m幀的帶噪信號短時功率譜。
[0036] 可選地,所述噪聲消除單元,根據所估計的噪聲功率譜計算的信噪比,通過如下公 式得到:
[0038] 其中,SNR (m,k)為第k通道,第m幀的信噪比,P (m,k)為第k通道,第m幀的帶噪信號 的功率譜;D(m,k)為第k通道,第m幀所估計的噪聲功率譜。
[0039] 可選地,所述噪聲消除單元,根據所計算的信噪比與閾值仏進行比較,帶噪信號降 噪后的信號能量值通過如下公式得到: (、f |Y(m,kf, SNRim.kJ^T,,
[0040] S(in,k;= ., g|Y(m.k)|:', SNR(m,k)<Ta
[0041] 其中,S(m,k)為第k通道,第m幀的帶噪信號降噪后的信號能量值,g是取值范圍為 0.1到0.5的常量,Tg是取值范圍為2到3的常量,SNR(m,k)為第k通道,第m幀的信噪比。
[0042]基于上述目的,本發明還提供了一種帶降噪的人工耳蝸言語處理方法,包括以下 步驟:
[0043] 對外界的聲音進行拾取,拾取到的信號為帶噪信號;
[0044] 對所述信號輸入單元拾取到的帶噪信號進行時域到頻域的轉換;
[0045] 根據頻率對快速傅里葉變換后的帶噪信號進行分頻處理,將聲信號劃分至不同的 頻率通道;
[0046] 對分頻處理單元輸出的每個通道的帶噪信號的包絡進行計算和提取;
[0047] 對每個通道的帶噪信號的噪聲功率譜進行估計;
[0048] 根據所估計的噪聲功率譜,使用二元掩蔽法對每個通道的帶噪信號的噪聲進行消 除;
[0049] 對所有的16-24個通道進行能量選擇,選出經降噪處理后能量最強的6-8個通道; [0050]對上述6-8通道信號幅度的動態范圍進行壓縮和映射;
[0051 ]根據壓縮好的包絡,對電脈沖進行調制后輸出。
[0052]可選地,所述噪聲估計單元,帶噪信號功率譜的局部最小值,通過如下公式進行估 計: 「m"l Ρ J P(m,k), Ρ·(ηι-1,?φ P(m,k) 腿l,k)+>、(P(m,k) -βΡ(ηι- l,k)), P麗(m- l,k)< P(m,k)
[0054] 其中,Pmin(m,k)為第k通道,第m幀帶噪信號功率譜的局部最小值,γ是取值范圍為 0.9到0.99的常量,λ是取值范圍為0.1到0.5之間的常量,β是取值范圍為0.2到0.5之間的常 量,P(m,k)為第k通道,第m幀的帶噪信號的加權功率譜,P min(m-l,k)為第k通道,第m-Ι幀帶 噪信號功率譜的局部最小值。
[0055] 可選地,所述噪聲估計單元,通過計算每幀更新的帶噪信號的加權功率譜,以及所 估計的帶噪信號功率譜的局部最小值,功率譜比R通過如下公式得到:
[0057] 其中,R(m,k)為第k通道,第m幀的功率譜比,P (m,k)為第k通道,第m幀的帶噪信號 的加權功率譜,Pmin(m,k)為第k通道,第m幀帶噪信號功率譜的局部最小值。
[0058] 可選地,所述噪聲估計單元,通過計算當前帶噪信號的加權功率譜與局部最小功 率譜的功率譜比,與一個常量閾值T進行比較,語音信號出現的概率通過如下公式得到: , V I αΚ(m- 1,k) + (1 -α\ R(ni,k)> Τ
[0059] K(m,kJ=i ; ; ' ' ):, (:al( (m - 1, k ), R (m, k) < 1
[0060] 其中,K(m,k)為第k通道,第m幀語音信號出現的概率,α是取值范圍為0.2到0.5的 常量,R(m,k)為第k通道,第m幀的功率譜比,T是常量閾值,其取值范圍為2到5。
[0061] 可選地,所述噪聲估計單元,根據語音信號出現的概率,噪聲估計的平滑因子通過 如下公式進行更新:
[0062] as(m,k)=ad+(l_ad)K(m,k),
[0063] 其中,as(m,k)為第k通道,第m幀噪聲估計的平滑因子,ad是取值范圍為0.8到0.95 的常量,K(m,k)為第k通道,第m幀語音信號出現的概率。
[0064] 可選地,所述噪聲估計單元,根據語音信號出現的概率來更新用于噪聲估計的平 滑因子,每個通道的噪聲功率譜通過如下公式得到:
[0065] D(m,k) = as(m,k)D(m_l,k) + ( l_as(m,k)) | Y(m,k) |2,
[0066] 其中,D(m,k)為第k通道,第m幀噪聲估計的功率譜,as(m,k)為第k通道,第m幀噪聲 估計的平滑因子,|Y(m,k) |2為第k通道,第m幀的帶噪信號短時功率譜。
[0067] 可選地,所述噪聲消除單元,根據所估計的噪聲功率譜計算的信噪比,通過如下公 式得到:
[0069] 其中,SNR(m,k)為第k通道,第m幀的信噪比,P(m,k)為第k通道,第m幀的帶噪信號 的功率譜;D(m,k)為第k通道,第m幀所估計的噪聲功率譜。
[0070] 可選地,所述噪聲消除單元,根據所計算的信噪比與閾值仏進行比較,帶噪信號降 噪后的信號能量值通過如下公式得到: t 、 |Υ(ηι,Ι<1\ SNR(m(k)>TL,
[0071] S(mk)H 丨 丨 g , g|Y(m.k)|% SNR(m,l<)< I;
[0072] 其中,S(m,k)為第k通道,第m幀的帶噪信號降噪后SNR(m,k)的信號功率譜,g是取 值范圍為0.1到0.5的常量,Tg是取值范圍為2到3的常量,為第k通道,第m幀的信噪比。
[0073] 本發明的有益效果在于:通過計算當前功率譜與局部最小功率譜的比值,來判斷 是否有語音信號出現,繼而采用二元掩蔽的方法對每個通道的噪聲功率譜進行消除,這樣 可以最大程度的保留語音信號,減少語音信號的畸變,在消除噪聲的同時讓人工耳蝸植入 者擁有更好的言語感知水平。
【附圖說明】:
[0074] 為了使本發明的目的、技術方案和有益效果更加清楚,本發明提供如下附圖進行 說明:
[0075] 圖1為本發明實施例的帶降噪的人工耳蝸言語處理器的結構示意圖;
[0076] 圖2為本發明實施例的帶降噪的人工耳蝸言語處理器中一具體實施例中帶噪信號 功率譜局部最小值,與所估計的噪聲功率譜的波形示意圖;
[0077] 圖3為本發明實施例的帶降噪的人工耳蝸言語處理器中一具體實施例中原始噪聲 短時功率譜與算法估計的噪聲功率譜波形示意圖;
[0078] 圖4為本發明實施例的帶降噪的人工耳蝸言語處理器中一具體實施例中原始語音 信號,帶噪信號,以及降噪后信號功率譜的波形對比示意圖;
[0079] 圖5為本發明實施例的帶降噪的人工耳蝸言語處理器方法的策略流程圖;
【具體實施方式】:
[0080] 下面將結合附圖,對本發明的優選實施例進行詳細的描述。
[0081] 參見圖1,所示為本發明實施例的帶降噪的人工耳蝸言語處理策略流程圖,其包 括:信號輸入單元101,快速傅葉里變換單元102,分頻處理單元103,包絡檢測單元104,還包 括依次連接的降噪處理單元105,通道選擇單元108,非線性壓縮單元109,脈沖調制單元 110,其中,
[0082]信號輸入單元101,用于對外界的聲音進行拾取,拾取到的信號為帶噪信號;
[0083]快速傅葉里變換單元102,用于對所述信號輸入單元拾取到的帶噪信號進行時域 到頻域的轉換;
[0084]分頻處理單元103,用于根據頻率對快速傅里葉變換后的帶噪信號進行分頻處理, 將帶噪信號劃分至不同的頻率通道;
[0085]包絡檢測單元104,用于對分頻處理單元輸出的每個通道的帶噪信號的包絡進行 計算和提取;
[0086]降噪處理單元105與所述包絡檢測單元104連接,包括噪聲估計單元106和噪聲消 除單元107,所述噪聲估計單元106,用于對每個通道的帶噪信號的噪聲功率譜進行估計;所 述噪聲消除單元107,用于根據所估計的噪聲功率譜,使用二元掩蔽法對每個通道的帶噪信 號的噪聲進行消除;
[0087] 通道選擇單元108,用于對所有的16-24個通道進行能量選擇,選出經降噪處理后 能量最強的6-8個通道;
[0088]非線性壓縮單元109,用于對上述6-8通道信號幅度的動態范圍進行壓縮和映射;
[0089]脈沖調制單元110,用于根據壓縮好的包絡,對電脈沖進行調制后輸出。
[0090] 針對以上實施例的技術方案,其中信號輸入單元101,快速傅葉里變換單元102,分 頻處理單元103,包絡檢測單元104,通道選擇單元108,非線性壓縮單元109,脈沖調制單元 110可參考現有技術中的實現方式,本發明實施例的重點在于降噪處理單元105,與所述包 絡檢測單元104連接,包括噪聲估計單元106,其對每個通道的帶噪信號的噪聲功率譜進行 估計;以及噪聲消除單元107,其根據所估計的噪聲功率譜,使用二元掩蔽法對每個通道的 帶噪信號的噪聲進行消除。通過以上兩個步驟可有效的估計和消除帶噪信號中的噪聲信 號,提高言語識別率和聽音感受。
[0091] 降噪處理單元105包括噪聲估計單元106和噪聲消除單元107。以下將對降噪處理 單元105的實現過程作進一步的說明,以使本領域內的技術人員能更好的理解本發明實施 例的實現過程。
[0092] 噪聲估計單元106對每個通道的帶噪信號的噪聲功率譜進行估計過程如下:每幀 都對帶噪信號的功率譜進行更新,通過比較當前帶噪信號的功率譜與上一幀時功率譜的局 部最小值,估計當前帶噪信號功率譜的局部最小值;計算當前功率譜與其局部最小值的比 值判斷是否有語音信號出現;根據對平滑因子的控制,估計每個通道的噪聲功率譜;
[0093] 進一步地,在具體應用實例中,比較當前帶噪信號功率譜與上一幀時功率譜的局 部最小值,當前帶噪信號功率譜的局部最小值,通過如下公式進行估計: f P(m,k). P(m,k)
[0094] Pmrtl(m,k)= i / 、 / / 、 / u / \ / 、, lyP,,,,丨,(ni- 1,k) + λ(ρ(ηι,k) - βΡ(m- i,k)), Pmii,(m-l.k )< P(m.k)
[0095] 其中,Pmin(m,k)為第k通道,第m幀帶噪信號的功率譜局部最小值,γ是取值范圍為 0.9到0.99的常量,λ是取值范圍為0.1到0.5之間的常量,β是取值范圍為0.2到0.5之間的常 量,P(m,k)為第k通道,第m幀的帶噪信號的功率譜,P min(ml,k)為第k通道,第m-Ι幀帶噪信號 功率譜的局部最小值。
[0096] 此方法中,若當前功率譜大于當前功率譜的局部最小值,局部最小值會逐步向當 前功率譜靠攏,這樣即使捕捉不到最優的局部最小值,算法也會根據當前功率譜來估計次 優的局部最小值。
[0097] 進一步地,通過計算每幀更新的帶噪信號的功率譜,以及所估計的帶噪信號功率 譜的局部最小值,功率譜比R通過如下公式得到:
[0099]其中,R(m,k)為第k通道,第m幀的功率譜比,P (m,k)為第k通道,第m幀的帶噪信號 的功率譜,Pmin(m,k)為第k通道,第m幀帶噪信號的功率譜局部最小值。
[0100]此方法中,通過計算當前功率譜與功率譜局部最小值的比值,來判斷是否有語音 信號的出現,由于功率譜的局部最小值是相對穩定的,以它為基準來判斷語音信號是否出 現更加穩定和可靠。因為噪聲越強,帶噪信號功率譜的局部最小值往往越高,這是由穩態噪 聲的信號頻譜特性所決定的。
[0101] 進一步地,比較功率譜比與常量閾值,語音信號出現的概率通過如下公式得到: Γ ? / s. [fxK(m-l,!<) + (]-a), R(m,k)> T
[0102] K(ni,k)- : : ' ; ; 、 I 〇f,K (m- 1, k ), R (rn,k) < T
[0103] 其中,K(m,k)為第k通道,第m幀語音信號出現的概率,α是取值范圍為0.2到0.5的 常量,R(m,k)為第k通道,第m幀的功率譜比,閾值Τ的取值范圍為2到5。
[0104] 進一步地,根據語音信號出現的概率來更新用于噪聲估計的平滑因子,繼而估計 每個通道的噪聲功率譜,如下公式所示:
[0105] as(m,k)=ad+(l-ad)Km,k),
[0106] D(m,k) = as(m,k)D(m_l,k) + ( l_as(m,k)) | Y(m,k) |2,
[0107] 其中,as(m,k)為第k通道,第m幀噪聲估計的平滑因子,ad是取值范圍為0.8到0.95 的常量,K(m,k)為第k通道,第m幀語音信號出現的概率;D(m,k)為第k通道,第m幀噪聲估計 的功率譜,a s(m,k)為第k通道,第m幀噪聲估計的平滑因子,|Y(m,k)|2為第k通道,第m幀的帶 噪信號短時功率譜。
[0108] 此方法中,根據對平滑因子的控制,可以實現在語音信號出現時,暫停對噪聲功率 譜的更新,而當語音信號消失后再繼續更新的效果。
[0109] 噪聲消除單元107通過二元掩蔽的方法對每個通道的噪聲功率譜進行消除的過程 如下:根據噪聲估計單元106所估計的噪聲功率譜計算信噪比,與閾值1^進行比較,采用二 元掩蔽法對每個通道的噪聲功率譜進行消除。進一步地,在具體應用實施例中,根據所估計 的噪聲功率譜計算信噪比,通過如下公式得到: ,、 |Y(m,kf, SNR(m,k)2Tg
[0110] S(m,k)d 丨 ' 1 . s * g|Y(m,k)|、 SNR(m,k)<Tg
[0111] 其中,S(m,k)為第k通道,第m幀的帶噪信號降噪后的信號能量值,g是取值范圍為 0.1到0.5的常量,Tg是取值范圍為2到3的常量,SNR(m,k)為第k通道,第m幀的信噪比。
[0112] 此方法中,采用二元掩蔽法對每個通道的噪聲功率譜進行消除,可以最大程度保 留語音信號的信息,減少語音信號的畸變。
[0113] 通過以上技術方案估計功率譜的局部最小值,判別語音信號,以及噪聲消除,這樣 可較好的提高在噪聲環境下的言語識別率和聽音感受。
[0114] 以下將通過具體應用實例來說明本發明實施例的降噪處理單元105的實施效果。 需要說明的是圖2中,若當前局部最小值大于當前功率譜,則用當前功率譜來更新功率譜的 局部最小值;若當前功率譜大于當前局部最小值,功率譜的局部最小值則會逐步逼近當前 功率譜。
[0115] 對于帶噪信號的噪聲功率譜估計和噪聲信號消除,以噪聲輸入為5分貝信噪比的 語譜噪聲為例;
[0116] 比較當前帶噪信號功率譜與上一幀時功率譜的局部最小值來估計當前幀功率譜 的局部最小值;參考圖2所示,其中,曲線1是第k通道,第m幀的帶噪信號的功率譜P(m,k),曲 線2是第k通道,第m幀帶噪信號功率譜的局部最小值P min(m,k),可見按此算法估計局部最小 值,即使捕捉不到最優的局部最小值,算法會根據當前功率譜來估計次優的局部最小值。
[0117] 根據功率譜與其局部最小值的比值對平滑因子的控制,可以實現在語音信號出現 時,暫停對噪聲功率譜的更新,而當語音信號消失后再繼續更新的效果。參照圖2所示,其中 曲線1是第k通道,第m幀的帶噪信號的功率譜P(m,k),曲線3是第k通道,第m幀所估計的噪聲 功率譜D (m,k ),可見按此算法估計的噪聲功率譜只在功率譜與其局部最小值的比值較小 時,也就是語音信號出現的概率較低時才會更新。
[0118] 根據如上所述的噪聲估計方法,可以實現對噪聲短時功率譜進行大致估計的效 果。參照圖3所示,其中曲線3是第k通道,第m幀所估計的噪聲功率譜D(m,k),曲線4是外界的 原始噪聲的短時功率譜,可見按此算法估計的噪聲功率譜可大致反映原始噪聲能量變化的 趨勢。
[0119] 根據如上所述的噪聲估計方法,可以實現對噪聲信號進行消除的效果。參照圖4所 示,其中曲線1是第k通道,第m幀的帶噪信號的功率譜P(m,k),曲線5為原始語音信號的功率 譜,曲線6是第k通道,第m幀的帶噪信號降噪后的信號能量值S(m,k),可見此降噪方法在保 留語音信號信息,減少語音信號畸變的同時,消除了大部分的噪聲信號。
[0120] 與上述帶降噪的人工耳蝸言語處理器對應的是,本發明又一實施例提供了帶降噪 的人工耳蝸言語處理方法,其流程圖參見圖5,包括以下步驟:
[0121] S101,對外界的聲音進行拾取,拾取到的信號為帶噪信號;
[0122] S102,對所述信號輸入單元拾取到的帶噪信號進行時域到頻域的轉換;
[0123] S103,根據頻率對快速傅里葉變換后的帶噪信號進行分頻處理,將帶噪信號劃分 至不同的頻率通道;
[0124] S104,對分頻處理單元輸出的每個通道的帶噪信號的包絡進行計算和提取;
[0125] S105,對每個通道的帶噪信號的噪聲功率譜進行估計;
[0126] S106,根據所估計的噪聲功率譜,使用二元掩蔽法對每個通道的帶噪信號的噪聲 進行消除;
[0127] S107,對所有的16-24個通道進行能量選擇,選出經降噪處理后能量最強的6-8個 通道;
[0128] S108,對上述6-8通道信號幅度的動態范圍進行壓縮和映射;
[0129] S109,根據壓縮好的包絡,對電脈沖進行調制后輸出。
[0130] 其中 5101,5102,5103,5104,5105,5106,5107,5108,5109,以5107,5108,5109可參 考現有技術中的實現方式,本發明實施例的重點在于S105和S106兩個單元,即根據所估計 的噪聲功率譜,使用二元掩蔽法對每個通道的噪聲進行消除,可較好的解決在噪聲環境下 言語識別率低的問題。
[0131] 以下將對S105和S106的實現過程作進一步的說明,以使本領域內的技術人員能很 好的理解本發明實施例的實現過程。
[0132] S105,對每個通道的帶噪信號的噪聲功率譜進行估計:每幀都對帶噪信號的功率 譜進行更新,通過比較當前帶噪信號的功率譜與上一幀時功率譜的局部最小值,估計當前 帶噪信號功率譜的局部最小值;計算當前功率譜與其局部最小值的比值判斷是否有語音信 號出現;根據對平滑因子的控制,估計每個通道的噪聲功率譜;
[0133] 進一步地,在具體應用實例中,比較當前帶噪信號加權功率譜與上一幀時功率譜 的局部最小值,當前帶噪信號功率譜的局部最小值,通過如下公式進行估計:
[0134] P P(m.k)' P_ mi" ' [,卩",…(m_ 1,k) + λ(Ρ(η' k)- βΡ(ηι- 1,k)),Pmill (m-l,k)< P(m,k)
[0135] 其中,Pmin(m,k)為第k通道,第m幀帶噪信號功率譜的局部最小值,γ是取值范圍為 0.9到0.99的常量,λ是取值范圍為0.1到0.5之間的常量,β是取值范圍為0.2到0.5之間的常 量,P(m,k)為第k通道,第m幀的帶噪信號的加權功率譜,Pmin(m-l,k)為第k通道,第m-1幀帶 噪信號功率譜的局部最小值。
[0136] 此方法中,若當前功率譜大于當前功率譜的局部最小值,局部最小值會逐步向當 前功率譜靠攏,這樣即使捕捉不到最優的局部最小值,算法也會根據當前功率譜來估計次 優的局部最小值。
[0137] 進一步地,通過計算每幀更新的帶噪信號的加權功率譜,以及所估計的帶噪信號 功率譜的局部最小值,功率譜比R通過如下公式得到:
[0139]其中,R(m,k)為第k通道,第m幀的功率譜比,P(m,k)為第k通道,第m幀的帶噪信號 的功率譜,Pmin(m,k)為第k通道,第m幀帶噪信號功率譜的局部最小值。
[0140]此方法中,通過計算當前功率譜與功率譜的局部最小值的比值,來判斷是否有語 音信號的出現,由于功率譜的局部最小值是相對穩定的,以它為基準來判斷語音信號是否 出現更加穩定和可靠。因為噪聲越強,帶噪信號功率譜的局部最小值往往越高,這是由穩態 噪聲的信號頻譜特性所決定的。
[0141] 進一步地,比較功率譜比與常量閾值,語音信號出現的概率通過如下公式得到:
[0142] K(mJ<) = jaK(m-lk|+(1-4
[al<.(m- l,k), R(m,k) < T
[0143] 其中,K(m,k)為第k通道,第m幀語音信號出現的概率,a是取值范圍為0.2到0.5的 常量,R(m,k)為第k通道,第m幀的功率譜比,閾值T的取值范圍為2到5。
[0144] 此方法中,閾值T是根據上一幀所估計的信噪比得出的,信噪比越高,閾值越低,反 之亦然。這樣的算法可以更加準確地判斷語音信號出現的概率。
[0145] 進一步地,根據語音信號出現的概率來更新用于噪聲估計的平滑因子,繼而估計 每個通道的噪聲功率譜,如下公式所示:
[0146] as(m,k)=ad+(l_ad)K(m,k),
[0147] D(m,k)=as(m,k)D(m-l,k) + (l-as(m,k)) |Y(m,k) |2,
[0148] 其中,as(m,k)為第k通道,第m幀噪聲估計的平滑因子,ad是取值范圍為0.8到0.95 的常量,K(m,k)為第k通道,第m幀語音信號出現的概率;D(m,k)為第k通道,第m幀噪聲估計 的功率譜,a s(m,k)為第k通道,第m幀噪聲估計的平滑因子,|Y(m,k)|2為第k通道,第m幀的帶 噪信號短時功率譜。
[0149] 此方法中,根據對平滑因子的控制,可以實現在語音信號出現時,暫停對噪聲功率 譜的更新,而當語音信號消失后再繼續更新的效果。
[0150] 噪聲消除單元106通過二元掩蔽的方法對每個通道的噪聲功率譜進行消除的過程 如下:根據噪聲估計單元105所估計的噪聲功率譜計算信噪比,與閾值1^進行比較,采用二 元掩蔽法對每個通道的噪聲功率譜進行消除。進一步地,在具體應用實施例中,根據所估計 的噪聲功率譜計算信噪比,通過如下公式得到: ,、 |Y(ni,l<f, SNR(m(k)>T"
[0151] S(m,k)= 1 丨 8 , g|Y(m,k)|", SNR(m,k)<T!!
[0152] 其中,S(m,k)為第k通道,第m幀的帶噪信號降噪后的信號能量值,g是取值范圍為 0.1到0.5的常量,Tg是取值范圍為2到3的常量,SNR(m,k)為第k通道,第m幀的信噪比。
[0153] 此方法中,采用二元掩蔽法對每個通道的噪聲功率譜進行消除,可以最大程度保 留語音信號的信息,減少語音信號的畸變。
[0154] 同樣的具體應用實例可參見圖2至圖4對應的仿真波形圖,通過以上技術方案選出 最優的功率譜局部最小值,計算當前功率譜與功率譜局部最小值的比值來判斷是否有語音 信號出現,根據對平滑因子的控制,可以實現在語音信號出現時,暫停對噪聲功率譜的更 新,當語音信號消失后繼續更新的效果,使用二元掩蔽法消除噪聲,可以最大程度保留語音 信號,減少語音信號的畸變,讓人工耳蝸植入者擁有更好的言語感知水平。
[0155] 最后說明的是,以上優選實施例僅用以說明本發明的技術方案而非限制,盡管通 過上述優選實施例已經對本發明進行了詳細的描述,但本領域技術人員應當理解,可以在 形式上和細節上對其作出各種各樣的改變,而不偏離本發明權利要求書所限定的范圍。
【主權項】
1. 一種帶降噪的人工耳蝸言語處理系統,包括依次連接的信號輸入單元,快速傅葉里 變換單元,分頻處理單元,包絡檢測單元,其特征在于,還包括依次連接的降噪處理單元,通 道選擇單元,非線性壓縮單元,脈沖調制單元,其中, 所述信號輸入單元,用于對外界的聲音進行拾取,拾取到的信號為帶噪信號; 所述快速傅葉里變換單元,用于對所述信號輸入單元拾取到的帶噪信號進行時域到頻 域的轉換; 所述分頻處理單元,用于根據頻率對快速傅里葉變換后的帶噪信號進行分頻處理,將 帶噪信號劃分至不同的頻率通道; 所述包絡檢測單元,用于對分頻處理單元輸出的每個通道的帶噪信號的包絡進行計算 和提取; 所述降噪處理單元與所述包絡檢測單元連接,包括噪聲估計單元和噪聲消除單元,所 述噪聲估計單元,用于對每個通道的帶噪信號的噪聲功率譜進行估計;所述噪聲消除單元, 用于根據所估計的噪聲功率譜,使用二元掩蔽法對每個通道的帶噪信號的噪聲進行消除; 所述通道選擇單元,用于對所有的16-24個通道進行能量選擇,選出經降噪處理后能量 最強的6-8個通道; 所述非線性壓縮單元,用于對上述6-8通道信號幅度的動態范圍進行壓縮和映射; 所述脈沖調制單元,用于根據壓縮好的包絡信號,對電脈沖進行調制后輸出。2. 根據權利要求1所述的帶降噪的人工耳蝸言語處理系統,其特征在于,所述噪聲估計 單元,帶噪信號的功率譜局部最小值,通過如下公式進行估計:其中,Pmin(m,k)為第k通道,第m帖帶噪信號的功率譜局部最小值,丫是取值范圍為0.9 到0.99的常量,λ是取值范圍為0.1到0.5之間的常量,β是取值范圍為0.2到0.5之間的常量, P(m,k)為第k通道,第m帖的帶噪信號的功率譜,Pmin(m-l,k)為第k通道,第m-1帖帶噪信號功 率譜的局部最小值。3. 根據權利要求2所述的帶降噪的人工耳蝸言語處理系統,其特征在于,所述噪聲估計 單元,通過計算每帖更新的帶噪信號的功率譜,W及所估計的帶噪信號功率譜的局部最小 值,功率譜比R通過如下公式得到:其中,R(m,k)為第k通道,第m帖的功率譜比,P(m,k)為第k通道,第m帖的帶噪信號的功 率譜,Pmin(m,k)為第k通道,第m帖帶噪信號功率譜的局部最小值。4. 根據權利要求3所述的帶降噪的人工耳蝸言語處理系統,其特征在于,所述噪聲估計 單元,通過計算當前帶噪信號的功率譜與功率譜的局部最小值的比值,與一個常量闊值T進 行比較,語音信號出現的概率通過如下公式得到:其中,K(m,k)為第k通道,第m帖語音信號出現的概率,α是取值范圍為0.2到0.5的常量, R(m,k)為第k通道,第m帖的功率譜比,Τ是一個常量闊值,其取值范圍為2-5。5. 根據權利要求4所述的帶降噪的人工耳蝸言語處理系統,其特征在于,所述噪聲估計 單元,根據語音信號出現的概率來更新用于噪聲估計的平滑因子,每個通道的噪聲功率譜 通過如下公式得到: D(m,k)=as(m,k)D(m-l,k) + (l-as(m,k)) |Y(m,k) |2, 其中,D(m,k)為第k通道,第m帖所估計的噪聲功率譜,as(m,k)為第k通道,第m帖所估計 的平滑因子,|Wm,k) I2為第k通道,第m帖的帶噪信號的短時功率譜。6. 根據權利要求5所述的帶降噪的人工耳蝸言語處理系統,其特征在于,所述噪聲消除 單元,根據所估計的噪聲功率譜計算的信噪比,通過如下公式得到:其中,SNR(m,k)為第k通道,第m帖的信噪比,P(m,k)為第k通道,第m帖的帶噪信號功率 譜;D(m,k)為第k通道,第m帖所估計的噪聲功率譜。7. 根據權利要求6所述的帶降噪的人工耳蝸言語處理系統,其特征在于,所述噪聲消除 單元,根據所計算的信噪比與闊值Tg進行比較,帶噪信號降噪后的信號能量值通過如下公 式得到:其中,S(m,k)為第k通道,第m帖的帶噪信號降噪后的信號能量值,g是取值范圍為0.1到 0.5的常量,Tg是取值范圍為2到3的常量,SNR(m,k)為第k通道,第m帖的信噪比。8. -種帶降噪的人工耳蝸言語處理方法,其特征在于,包括W下步驟: 對外界的聲音進行拾取,拾取到的信號為帶噪信號; 對所述信號輸入單元拾取到的帶噪信號進行時域到頻域的轉換; 根據頻率對快速傅里葉變換后的帶噪信號進行分頻處理,將聲信號劃分至不同的頻率 通道; 對分頻處理單元輸出的每個通道的帶噪信號的包絡進行計算和提取; 對每個通道的帶噪信號的噪聲功率譜進行估計; 根據所估計的噪聲功率譜,使用二元掩蔽法對每個通道的帶噪信號的噪聲進行消除; 對所有的16-24個通道進行能量選擇,選出經降噪處理后能量最強的6-8個通道; 對上述6-8通道信號幅度的動態范圍進行壓縮和映射; 根據壓縮好的包絡信息,對電脈沖進行調制后輸出。9. 根據權利要求8所述的帶降噪的人工耳蝸言語處理方法,其特征在于,所述噪聲估計 單元,帶噪信號的功率譜局部最小值,通過如下公式進行估計:其中,Pmin(m,k)為第k通道,第m帖帶噪信號的功率譜局部最小值,丫是取值范圍為0.9 到0.99的常量,λ是取值范圍為0.1到0.5之間的常量,β是取值范圍為0.2到0.5之間的常量, P(m,k)為第k通道,第m帖的帶噪信號的功率譜,Pmin(m-l,k)為第k通道,第m-1帖帶噪信號功 率譜的局部最小值。10. 根據權利要求9所述的帶降噪的人工耳蝸言語處理方法,其特征在于,所述噪聲估 計單元,通過計算每帖更新的帶噪信號的功率譜,W及所估計的帶噪信號功率譜的局部最 小值,功率譜比R通過如下公式得到:其中,R(m,k)為第k通道,第m帖的功率譜比,P(m,k)為第k通道,第m帖的帶噪信號的功 率譜,Pmin(m,k)為第k通道,第m帖帶噪信號功率譜的局部最小值。11. 根據權利要求10所述的帶降噪的人工耳蝸言語處理方法,其特征在于,所述噪聲估 計單元,通過計算當前帶噪信號的功率譜與功率譜的局部最小值的比值,與一個常量闊值T 進行比較,語音信號出現的概率通過如下公式得到:其中,K(m,k)為第k通道,第m帖語音信號出現的概率,α是取值范圍為0.2到0.5的常量, R(m,k)為第k通道,第m帖的功率譜比,Τ是一個常量闊值,其取值范圍為2-5。12. 根據權利要求11所述的帶降噪的人工耳蝸言語處理方法,其特征在于,所述噪聲估 計單元,根據語音信號出現的概率來更新用于噪聲估計的平滑因子,每個通道的噪聲功率 譜通過如下公式得到: D(m,k)=as(m,k)D(m-l,k) + (l-as(m,k)) |Y(m,k) |2, 其中,D(m,k)為第k通道,第m帖所估計的噪聲功率譜,as(m,k)為第k通道,第m帖所估計 的平滑因子,|Wm,k) I2為第k通道,第m帖的帶噪信號的短時功率譜。13. 根據權利要求12所述的帶降噪的人工耳蝸言語處理方法,其特征在于,所述噪聲消 除單元,根據所估計的噪聲功率譜計算的信噪比,通過如下公式得到:其中,SNR(m,k)為第k通道,第m帖的信噪比,P(m,k)為第k通道,第m帖的帶噪信號功率 譜;D(m,k)為第k通道,第m帖所估計的噪聲功率譜。14. 根據權利要求13所述的帶降噪的人工耳蝸言語處理方法,其特征在于,所述噪聲消 除單元,根據所計算的信噪比與闊值Tg進行比較,帶噪信號降噪后的信號能量值通過如下 公式得到:其中,S(m,k)為第k通道,第m帖的帶噪信號降噪后的信號能量值,g是取值范圍為0.1到 0.5的常量,Tg是取值范圍為2到3的常量,SNR(m,k)為第k通道,第m帖的信噪比。
【文檔編號】G10L25/60GK106098077SQ201610617620
【公開日】2016年11月9日
【申請日】2016年7月28日 公開號201610617620.9, CN 106098077 A, CN 106098077A, CN 201610617620, CN-A-106098077, CN106098077 A, CN106098077A, CN201610617620, CN201610617620.9
【發明人】王寧遠, 孫曉安, 平利川, 黃穗
【申請人】浙江諾爾康神經電子科技股份有限公司