一種語音識別的方法、裝置及終端的制作方法
【技術領域】
[0001] 本發明涉及音頻分析或處理技術領域,特別涉及一種語音識別的方法、裝置及終 端。
【背景技術】
[0002] 語音交互是指人與機器進行語音交流,讓機器聽懂人說的話。語音識別技術就是 讓機器通過識別和理解過程把語音信號轉變為相應的文本或命令的高技術。
[0003] 目前的語音識別方案,在設備的揚聲器有音頻輸出時(播放音樂或者輸出聲音) 的情況下,語音交互的識別率就會大幅降低,尤其在音頻的音量較大時,語音交互會出現沒 有識別反應或識別錯誤的情況。而現有的降噪技術,在設備揚聲器有音頻輸出時的場景下 是不生效的,存在語音識別率較低的問題,降噪效果有待進一步提升。
【發明內容】
[0004] 本發明實施例提出了一種語音識別的方法、裝置及終端,用以現有的語音識別技 術在設備揚聲器有音頻輸出時,存在的語音識別率較低的問題。
[0005] 本發明實施例提供了一種語音識別的方法,應用于揚聲器有音頻輸出時的語音識 另Ij,包括如下步驟:
[0006] -種語音識別的方法,其特征在于,包括如下步驟:
[0007] 接收音頻輸入信號;
[0008] 獲取第一音頻信號,所述第一音頻信號為本機音頻輸出裝置輸出的音頻信號;
[0009] 獲取第一增益/衰減系數,所述第一增益/衰減系數為所述第一音頻信號在本機 音頻輸入裝置位置的各頻點的增益或衰減;
[0010] 根據所述第一增益/衰減系數及所述第一音頻信號確定第一干擾音頻信號,所述 第一干擾音頻信號為本機音頻輸入裝置接收到的由本機音頻輸出裝置輸出的音頻信號; [0011] 從所述音頻輸入信號中濾除所述第一干擾音頻信號得到第二音頻信號,所述第二 音頻信號為本機音頻輸入裝置接收到的待識別音頻信號;
[0012] 對所述第二音頻信號進行語音識別處理。
[0013] 本發明實施例提供了一種語音識別的裝置,應用于揚聲器有音頻輸出時的語音識 別設備,包括:
[0014] 接收單元,用于接收音頻輸入信號;
[0015] 獲取單元,用于獲取第一音頻信號,所述第一音頻信號為本機音頻輸出裝置輸出 的音頻信號;
[0016] 獲取單元進一步用于獲取第一增益/衰減系數,所述第一增益/衰減系數為所述 第一音頻信號在本機音頻輸入裝置位置的各頻點的增益或衰減;
[0017] 確定單元,用于根據所述第一增益/衰減系數及所述第一音頻信號確定第一干擾 音頻信號,所述第一干擾音頻信號為本機音頻輸入裝置接收到的由本機音頻輸出裝置輸出 的音頻信號;
[0018] 濾除單元,用于從所述音頻輸入信號中濾除所述第一干擾音頻信號得到第二音頻 信號,所述第二音頻信號為本機音頻輸入裝置接收到的待識別音頻信號;
[0019] 識別處理單元,用于對所述第二音頻信號進行語音識別處理。
[0020] 本發明實施例提供了一種終端,包括:本機音頻輸入裝置、本機音頻輸出裝置及語 音識別的裝置,
[0021] 所述本機音頻輸入裝置,用于接收音頻信號;
[0022] 所述本機音頻輸出裝置,用于輸出音頻信號;
[0023] 所述語音識別的裝置,用于根據所述本機音頻輸入裝置接收到的音頻信號及所述 本機音頻輸出裝置輸出的音頻信號,進行語音識別處理。
[0024] 本發明有益效果如下:
[0025] 本發明實施例提供的語音識別的方法、裝置及終端,根據第一音頻信號及第一增 益/衰減系數確定第一干擾音頻信號,進而從本機音頻輸入裝置接收到的音頻信號中濾除 第一干擾音頻信號,考慮到了本機音頻輸出裝置與本機音頻輸入裝置之間的音頻傳播路徑 及本機音頻輸出裝置輸出的音頻信號經過該傳播路徑后的各頻點的增益或損耗,可以準確 得到第一干擾音頻信號,有效提高了在本機音頻輸出裝置有音頻輸出時進行語音識別的語 音識別率。
【附圖說明】
[0026] 下面將參照附圖描述本發明的具體實施例,
[0027] 圖1為本發明實施例中的語音識別的方法流程示意圖;
[0028] 圖2為本發明實施例中的語音識別的裝置結構示意圖;
[0029] 圖3為本發明實施例中的終端結構示意圖。
【具體實施方式】
[0030] 為了使本發明的技術方案及優點更加清楚明白,以下結合附圖對本發明的示例性 實施例進行進一步詳細的說明,顯然,所描述的實施例僅是本發明的一部分實施例,而不是 所有實施例的窮舉。并且在不沖突的情況下,本說明書中的實施例及實施例中的特征可以 互相結合。
[0031] 圖1為本發明實施例中的語音識別的方法流程示意圖,如圖1所示,語音識別的方 法可以包括如下步驟:
[0032] 步驟101 :接收音頻輸入信號;
[0033] 步驟102 :獲取第一音頻信號,第一音頻信號為本機音頻輸出裝置輸出的音頻信 號;
[0034] 步驟103 :獲取第一增益/衰減系數,第一增益/衰減系數為第一音頻信號在本機 音頻輸入裝置位置的各頻點的增益或衰減;
[0035] 步驟104 :根據第一增益/衰減系數及第一音頻信號確定第一干擾音頻信號,第一 干擾音頻信號為本機音頻輸入裝置接收到的由本機音頻輸出裝置輸出的音頻信號;
[0036] 步驟105 :從音頻輸入信號中濾除第一干擾音頻信號得到第二音頻信號,第二音 頻信號為本機音頻輸入裝置接收到的待識別音頻信號;
[0037] 步驟106 :對第二音頻信號進行語音識別處理。
[0038] 具體實施中,該語音識別的方法可以應用于移動終端、個人電腦、機器人等設備。 其中,本機音頻輸入裝置為本機接收音頻信號的裝置,例如,目前本機音頻輸入裝置可以是 麥克風,也不排除未來的可能會出現的其他形式的可以接收音頻信號的裝置或器件。本機 音頻輸出裝置為本機輸出音頻信號的裝置,例如,目前本機音頻輸出裝置可以是揚聲器,也 不排除未來的可能會出現的其他形式的可以輸出音頻信號的裝置或器件。
[0039] 語音識別的時候,本機音頻輸入裝置在接收待識別音頻信號的同時,還會接收本 機所處環境的背景噪音以及由本機音頻輸出裝置輸出的被本機音頻輸入裝置接收到的音 頻信號。其中,濾除背景噪音已有較成熟的解決方案,可以用多個麥克風,一個麥克風采集 攜帶背景噪音的音頻信號,另一個或多個麥克風采集背景噪音,上述兩種麥克風所拾取的 背景噪聲音量是基本相同的,而記錄的人聲會有6dB左右的音量差,對這些實時采樣的數 字信號進行頻譜分析,在和背景噪音信息庫進行比對后,讓講話者的聲音頻譜通過,而對背 景噪音的頻譜進行抑制,根據信號消除原理疊加在原有通話信號上以達到較明顯的消除背 景噪音的效果,從帶背景噪音的語音信號中提取盡可能純凈的原始語音。而對于本機音頻 輸出裝置輸出的音頻信號造成對語音識別的干擾,上述方案則無法解決。
[0040] 第一音頻信號,即:本機音頻輸出裝置輸出的音頻信號,經過一段距離被本機音頻 輸入裝置接收,由于第一音頻信號經過一段距離的傳輸后,會產生一定的損耗。為了能夠更 為準確的獲知第一干擾音頻信號,需要獲取第一音頻信號及第一增益/衰減系數,但在具 體實施中,對上述二者的獲取時序不作具體限定,可以先獲取第一音頻信號,也可以先獲取 第一增益/衰減系數。
[0041] 本發明實施例提供的語音識別的方法可以根據本機音頻輸出裝置輸出的音頻信 號在本機音頻輸入裝置位置的各頻點的增益或衰減及本機音頻輸出裝置輸出的音頻信號, 確定本機音頻輸出裝置輸出的音頻信號造成對語音識別的干擾信號,進而從音頻輸入信號 中濾除本機音頻輸出裝置輸出的音頻信號造成對語音識別的干擾信號,以得到待識別音頻 信號。
[0042] 本發明實施例提供的語音識別的方法,根據第一音頻信號及第一增益/衰減系數 確定第一干擾音頻信號,進而從本機音頻輸入裝置接收到的音頻信號中濾除第一干擾音頻 信號,考慮到了本機音頻輸出裝置與本機音頻輸入裝置之間的音頻傳播路徑及本機音頻輸 出裝置輸出的音頻信號經過該傳播路徑后的各頻點的增益或損耗,可以準確得到第一