一種語音即時識別系統的制作方法
【技術領域】
[0001]本申請涉及語音識別技術領域,尤其涉及一種語音即時識別系統。
【背景技術】
[0002]隨著電子產品的快速發展與普及,對電子產品的智能化應用程度也有了更高的要求。目前,語音識別技術為用戶提供了人機語音交互模式來控制電子產品的快捷途徑。用戶可以通過特定的語音喚醒應用程序,說出設定的語音喚醒短語即可喚醒電子產品,并可根據語音提示的指令方便地進行撥號、瀏覽網頁等進一步操作。
[0003]另外,聲紋識別是一種利用人的聲音實現的語音識別技術,由于人在講話時使用的發聲器官存在一定的差異性,任何兩個人聲音的聲紋圖譜都有差異,因此,聲紋可以作為表征個體差異的生物特征,也即可以通過建立聲紋特征模型來表征不同的個體,進而利用該聲紋特征模塊進行識別不同的個體。
[0004]本申請的發明人在實現本申請的過程中,發現現有技術至少存在如下技術缺陷:當前已實現的語音識別方案中,聲紋識別和語音喚醒是分別獨立應用的,例如,用戶需要啟用語音喚醒時,電子產品中的語音喚醒應用程序根據用戶輸入的語音數據,與預設的喚醒短語如“語音小助手”或者“語音小秘書”等進行匹配,如果用戶輸入的語音數據能夠與預設的喚醒短語相匹配,則執行喚醒功能;否則,拒絕執行喚醒功能;之后,用戶需要通過語音控制電子產品實現特定的操作時,需要再次輸入相關的語音指令或語音信息,再通過電子產品中的聲紋確認應用程序對用戶輸入的語音數據進行文本相關或者文本無關的聲紋確認,如果聲紋確認通過,則執行相應的指令操作,如果聲紋確認未通過,則拒絕執行相應的指令操作。因此,上述的語音識別方案,存在用戶交互效率低下,響應速度慢等缺陷或不足。
【發明內容】
[0005]本申請所要解決的技術問題是克服現有技術中語音識別時交互效率低下的缺陷。
[0006]為了解決上述技術問題,本申請提供了一種語音即時識別系統,所述即時識別系統包括:語音輸入模塊,用于接收語音數據;第一識別模塊,用于對接收到的所述語音數據進行第一模式語音識別,所述第一模式語音識別包括識別所述語音數據中是否包含第一語音識別信息;第二識別模塊,當所述第一識別模塊識別出所述語音數據中包含所述第一語音識別信息時,依據所述語音數據進行第二模式語音識別;響應模塊,依據所述第二識別模塊進行第二模式語音識別的結果,執行或者拒絕執行所述第一語音識別信息對應的操作。
[0007]優化的,所述第二識別模塊依據所述第一識別信息對所述語音數據進行的所述第二模式語音識別包括:預設命令相關的聲紋確認;
[0008]所述響應模塊依據所述第二模式語音識別的結果,執行或者拒絕執行所述第一語音識別信息對應的操作是指:所述響應模塊當所述預設命令相關的聲紋的確認結果為通過時,執行所述第一語音識別信息對應的操作;當所述預設命令相關的聲紋的確認結果為未通過時,拒絕執行所述第一語音識別信息對應的操作。
[0009]優化的,所述電子產品還包括第三識別模塊,
[0010]所述第一識別模塊還用于當識別出所述語音數據中包含所述第一語音識別信息以外的第二語音識別信息時,將所述第二語音識別信息發送給所述第三識別模塊;所述第三識別模塊用于依據所述第二語音識別信息進行第三模式語音識別;所述響應模塊還用于當執行所述第一語音識別信息對應的操作前,接收所述第三識別模塊進行所述第三模式語音識別的結果;依據所述第三模式語音識別的結果,執行或者拒絕執行所述第一語音識別信息對應的操作及所述第二語音識別信息對應的操作。
[0011 ]優化的,所述第三識別模塊依據所述第二語音識別信息進行的所述第三模式語音識別包括:預設命令無關的聲紋確認;
[0012]所述響應模塊依據所述第三模式語音識別的結果,執行或者拒絕執行所述第一語音識別信息對應的操作及所述第二語音識別信息對應的操作是指:所述響應模塊當所述預設命令無關的聲紋的確認結果為通過時,執行所述第一語音識別信息對應的操作及所述第二語音識別信息對應的操作;當所述預設命令無關的聲紋的確認結果為未通過時,拒絕執行所述第一語音識別信息對應的操作及所述第二語音識別信息對應的操作。
[0013]優化的,所述電子產品還包括與所述第三識別模塊相連的預設命令無關聲紋確認模型訓練模塊;所述預設命令無關聲紋確認模型訓練模塊用于依據特定場景的語音數據,對所述第三識別模塊進行預設命令無關的聲紋確認所采用的模型進行優化訓練。
[0014]優化的,所述的電子產品還包括:設置模塊,用于根據第一指令設置或修改所述第一語音識別信息的集合,或者根據所述第一指令設置或修改所述第一語音識別信息與操作之間的對應關系。
[0015]本發明的優點在于:用戶可以利用語音識別信息進行預設命令相關的聲紋確認和綜合聲紋確認,以保證只有特定用戶的命令得到執行,從而避免獨立的聲紋確認步驟而產生的冗余交互,提高了交互效率;可以進行聲紋確認匹配度的優化訓練,提高聲紋確認的性能和準確性。
【附圖說明】
[0016]圖1是本發明語音即時識別系統的組成示意圖。
[0017]圖2是基于本發明的語音識別方法的示意圖;
【具體實施方式】
[0018]為使本申請的目的、技術方案和優點更加清楚明白,下文中將結合附圖對本申請的實施例進行詳細說明。需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互任意組合。
[0019]在附圖的流程圖示出的步驟可以在諸如一組計算機可執行指令的計算機系統中執行。并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執行所示出或描述的步驟。
[0020]如圖1所示,一種語音即時識別系統,包括如下主要功能模塊/單元:
[0021 ]語音輸入模塊21,用于接收語音數據;
[0022]第一識別模塊22,用于對接收到的所述語音數據進行第一模式語音識別,所述第一模式語音識別包括識別所述語音數據中是否包含第一語音識別信息;
[0023]第二識別模塊23,當所述第一識別模塊識別出所述語音數據中包含所述第一語音識別信息時,依據所述語音數據進行第二模式語音識別;
[0024]響應模塊24,依據所述第二識別模塊進行第二模式語音識別的結果,執行或者拒絕執行所述第一語音識別信息對應的操作。
[0025]本實施例中,當語音輸入中包含第一語音識別信息時,通過一次語音輸入就可以完成對第一語音識別信息兩種模式的語音識別,根據識別結果就能自動進行或拒絕進行第一語音識別信息對應的操作,整個過程無需用戶進行冗余的操作,只要進行一次性的語音輸入即可,簡化了語音識別的過程。
[0026]本實施例中,所述第一語音識別信息可以包括一個或多個,可以采用第一語音識別信息的集合的形式保存。每個第一語音識別信息可以對應于不同的操作,當然,也不排除幾個第一語音識別信息對應于相同的操作的情況。如果所述語音數據的全部或部分與第一語音識別信息的集合中至少一個所述第一語音識別信息A匹配,則認為該語音數據中包括第一語音識別信息A;如果所述語音數據中的部分與第一語音識別信息A匹配,部分與第一語音識別信息B匹配,則可以根據