一種基頻輪廓提取的人工耳蝸言語處理方法和系統的制作方法
【技術領域】
[0001] 本發明屬于醫療器械領域,特別涉及一種基頻輪廓提取的人工耳蝸言語處理方法 和系統。
【背景技術】
[0002] 語音的基頻在語言理解中起到極為重要的作用。在漢語中,基頻對區分普通話四 聲起決定性作用。基頻是普通話聲調的本質成分,是辨認普通話聲調的充分而又必要的征 兆。
[0003] 基頻提取是語音信號處理的基本問題。在近40年來,人們提出了上百種基頻提取 算法。不同的應用場景,決定了算法的復雜度和魯棒性。應用于實時信號處理的基頻提取算 法一直是語音信號處理的關注點。而在助聽設備,例如助聽器中,由于超低功耗及實時性的 應用要求,基頻提取一直是一項有挑戰的任務。
[0004] 人工耳蝸言語處理器在系統復雜性與低功耗要求上要遠高于助聽器。目前在所有 商用人工耳蝸言語處理器上,還未見實現實時提取基頻信息的報道。而基頻信息對人工耳 蝸植入者,尤其是聲調語言為母語的人工耳蝸植入者尤其重要。獲得基頻信息有助于改善 編碼策略的時域包絡表達,從而達到提升聲調語言識別的目的。
【發明內容】
[0005] 有鑒于此,本發明的目的在于提供一種基頻輪廓提取的人工耳蝸言語處理方法和 系統,提出對聲信號進行一階求導,降階差分,提取基頻信號包絡變化率,來追蹤基頻輪廓。
[0006] 為達到上述目的,本發明提供了一種基頻輪廓提取的人工耳蝸言語處理方法,包 括以下步驟:
[0007] 對接收到的一幀的聲信號進行降采樣,保證信號的趨勢形狀,減小總體計算量;
[0008] 第一次低通濾波,去除高次諧波,保留有效頻率之內的信號;
[0009] 一階求導,保留信號的周期性和趨勢形狀,減小信號幅值;
[0010] 降階差分,利用周期信號的性質,通過比較原始信號及其時移信號的差值絕對值, 在差值絕對值最小處確定周期點;
[0011] 第二次低通濾波,對信號進行平滑處理,重點平滑每個谷底,避免出現谷底奇異 占.
[0012] 查找當前幀的一個最小值和一個次小值,避免基頻的加倍或減半;
[0013] 比較連續兩幀的最小值,得到周期改變值Δ Τ。
[0014] 優選地,所述降采樣的采樣頻率為8kHz,采樣點為192個。
[0015] 優選地,所述第一次低通濾波采用13階的FIR濾波器。
[0016] 優選地,所述一階求導,采用2點中心差值方法。
[0017] 優選地,所述降階差分,方程為
[0018] 其中,x(i)為原始信號,τ為時移差值范圍,W為計算窗長,S為降階系數。
[0019] 基于上述目的,本發明還提供了一種基頻輪廓提取的人工耳蝸言語處理系統,包 括:
[0020] 預處理單元,包括降采樣模塊,用于對接收到的一幀的聲信號進行降采樣,保證信 號的趨勢形狀,減小總體計算量;和與降采樣模塊連接的第一次低通濾波模塊,用于去除高 次諧波,保留有效頻率之內的信號;
[0021] -階求導單元,與所述預處理單元連接,用于保留信號的周期性和趨勢形狀,減小 信號幅值;
[0022] 降階差分單元,與所述一階求導單元連接,利用周期信號的性質,通過比較原始信 號及其時移信號的差值絕對值,在差值絕對值最小處確定周期點;
[0023] 后處理單元,與所述降階差分單元連接,包括第二次低通濾波模塊,對信號進行平 滑處理,重點平滑每個谷底,避免出現谷底奇異點;和與第二次低通濾波模塊連接的小值模 塊,用于查找當前幀的一個最小值和一個次小值,避免基頻的加倍或減半;和與小值模塊連 接的比較模塊,用于比較連續兩幀的最小值,得到周期改變值AT。
[0024] 優選地,所述預處理單元的降采樣模塊,采樣頻率為8kHz,采樣點為192個。
[0025] 優選地,所述預處理單元的第一次低通濾波模塊,采用13階的FIR濾波器。
[0026] 優選地,所述一階求導單元,采用2點中心差值方法。
[0027] 優選地,所述降階差分單元,采用的方程為
[0028]
[0029] 其中,x(i)為原始信號,τ為時移差值范圍,W為計算窗長,S為降階系數。
[0030] 本發明的有益效果在于:與現有技術相比,提出對聲信號信號一階求導來解決以 下問題:基本差分方程對輸入信號幅度變化敏感,例如:信號輸入動態范圍大;漫變的直流 信號;輸入噪聲等;一階求導后的信號可以最大限度解決定點計算中的定標問題;提出在差 分方程中采取降階計算,來減小總體計算量;提出比較連續幀2個最小值的辦法來解決基頻 提取中最常見的基頻加倍或減半的問題;提出追蹤基頻信號包絡變化率,而非基頻絕對值, 來最小化總體計算量;同時,調整變化率的參數選擇可以靈活應用于人工耳蝸策略。
【附圖說明】
[0031] 為了使本發明的目的、技術方案和有益效果更加清楚,本發明提供如下附圖進行 說明:
[0032] 圖1為本發明實施例的基頻輪廓提取的人工耳蝸言語處理方法的步驟流程圖;
[0033] 圖2為本發明實施例的基頻輪廓提取的人工耳蝸言語處理系統的結構示意圖; [0034]圖3為本發明實施例的基頻輪廓提取的人工耳蝸言語處理方法中S101后的波形示 意圖;
[0035]圖4為本發明實施例的基頻輪廓提取的人工耳蝸言語處理方法中S102后的波形示 意圖;
[0036]圖5為本發明實施例的基頻輪廓提取的人工耳蝸言語處理方法中S103后的波形示 意圖;
[0037]圖6為本發明實施例的基頻輪廓提取的人工耳蝸言語處理方法中S104、S105后的 波形示意圖。
【具體實施方式】
[0038]下面將結合附圖,對本發明的優選實施例進行詳細的描述。
[0039]參見圖1及圖3-6,所示為本發明實施例的基頻輪廓提取的人工耳蝸言語處理方法 的步驟流程圖及各步驟的波形圖,包括以下步驟:
[0040] S101,對接收到的一幀的聲信號進行降采樣,保證信號的趨勢形狀,減小總體計算 量;
[0041 ] S102,第一次低通濾波,去除高次諧波,保留有效頻率之內的信號;
[0042] S103,一階求導,保留信號的周期性和趨勢形狀,減小信號幅值;
[0043] S104,降階差分,利用周期信號的性質,通過比較原始信號及其時移信號的差值絕 對值,在差值絕對值最小處確定周期點;
[0044] S105,第二次低通濾波,對信號進行平滑處理,重點平滑每個谷底,避免出現谷底 奇異點;
[0045] S106,查找當前幀的一個最小值和一個次小值,避免基頻的加倍或減半;
[0046] S107,比較連續兩幀的最小值,得到周期改變值Δ T。
[0047] 進一步地,S101中降采樣的采樣頻率為8kHz,采樣點為192個,圖3所示為對一幀的 聲信號進行降采樣后的波形圖。
[0048] 進一步地,S102中第一次低通濾波采用13階的FIR濾波器,保證任意幅頻特性的同 時具有嚴格的線性相頻特性,同時其單位抽樣響應是有限長的,因而形成的是穩定的系統。 圖4所示為S101和S102后的波形,曲線1為S101降采樣后的波形,曲線2為S102第一次低通濾 波后的波形。
[0049] 進一步地,S103中一階求導,采用2點中心差值方法,設原始信號為x(n),x(n) = [x (n+l)-x(n-l)]/2,圖5所示為S102和S103后的波形,曲線3為一階求導后的波形,可見一階 求導后保留了周期性,減小了信號的幅度動態范圍,減少直流噪聲和信號的極低頻分量,即 一階求導具有高通濾波的作用。
[0050] 進一步地,S104中降階差分,
[0051] 其中,x(i)為原始信號,τ為時