語音識別方法、裝置和藍牙耳的制造方法
【專利摘要】本發明涉及一種語音識別方法。包括:訓練命令集中的命令詞,獲取每個命令詞的參考特征矢量序列以為該命令詞構建參考模板,各個命令詞的參考模板構成參考模板集;從待測語音信號中提取特征參數,生成待測特征矢量序列,待測特征矢量序列構成測試模板;將測試模板和參考模板集進行匹配以生成測試模板與每個參考模板的匹配分數;將各個參考模板的匹配分數和預設的第一門限值以及預設的第二門限值進行比對,如果各個參考模板的匹配分數中的次小得分和最小得分的差值大于第二門限值,且最小得分小于第一門限值,則最小得分的參考模板所對應的命令詞被識別為待測語音信號中的命令詞。實現了較低的誤識別率和誤拒絕率,且用戶體驗性較好。
【專利說明】
【技術領域】
[0001] 本發明語音識別領域,尤其涉及一種語音識別方法、裝置和藍牙耳機。 語音識別方法、裝置和藍牙耳機
【背景技術】
[0002] 隨著智能手機的普及,使用藍牙耳機的用戶越來越多,尤其是開車用戶。由于藍 牙耳機體型較小,按鍵很少,一些藍牙耳機需要按組合鍵來完成相應操作,因此造成藍牙耳 機操作比較復雜,用戶體驗較差,尤其是在車載環境下,還涉及安全因素。現在市場上一些 高端藍牙耳機已經支持通過語音命令來代替手工操作,但這些高端藍牙耳機基本都支持 非特定人語音,在使用過程中,存在以下缺陷:1)語音命令事先已固定好,用戶無法定制和 修改,無法滿足用戶個性化需求;2)非特定人語音識別算法對計算和存儲資源要求較高, 導致目前支持非特定人語音識別的高端藍牙耳機成本較高,功耗較大;3)只能支持一種語 音,例如英語或者中文普通話,缺少對地方方言支持。現有基于孤立詞的特定人語音識別算 法能解決上述問題,孤立詞,指的是用戶發音方式,需要為識別命令集中每個命令詞建立一 個模板;特定人,指的是識別和訓發音人為同一個人,很容易支持多種語音和地方方言的支 持。
[0003] 但是現有特定人語音識別算法雖然集內命令(已訓練命令詞)識別率較高,但集 外命令(沒有訓練命令詞)誤識別率也較高,即虛假接受類錯誤較高,這樣會出現較多的誤 識別,導致用戶體驗很差。
[0004] 特定人語音識別算法為了解決集外命令的誤識別,增加了一個門限值參數,如果 最小的DTW匹配分數小于該門限值,則接受這個識別結果,如果最小的DTW匹配分數大于該 門限值,則拒絕這個識別結果。但在實際應用中,由于外界環境噪聲干擾,這個門限值很難 選擇,選擇過高,會導致誤識別率較高,選擇過低,會導致誤拒絕率較高。
【發明內容】
[0005] 本發明的目的是解決特定人語音識別時的誤識別率和誤拒絕率較高的問題,通過 雙門限的識別分數后處理機制,保證特定人孤立詞語音識別的誤識別率和誤拒絕率都維持 在很低的水平。
[0006] 第一方面,本發明實施例提供了一種特定人孤立詞的語音識別方法,所述方法包 括:
[0007] 訓練命令集中的命令詞,獲取每個命令詞的參考特征矢量序列以為該命令詞構建 參考模板,各個命令詞的參考模板構成參考模板集;
[0008] 從待測語音信號中提取特征參數,生成待測特征矢量序列,其中所述待測特征矢 量序列構成測試模板;
[0009] 將所述測試模板和所述參考模板集進行匹配以生成所述測試模板與每個參考模 板的匹配分數;
[0010] 將各個參考模板的匹配分數和預設的第一門限值以及預設的第二門限值進行比 對,如果各個參考模板的匹配分數中的次小得分和最小得分的差值大于第二門限值,且所 述最小得分小于第一門限值,則最小得分的參考模板所對應的命令詞被識別為待測語音信 號中的命令詞。
[0011] 結合第一方面,在第一方面的第一種可能的實現方式中,所述訓練命令集中的命 令詞,獲取每個命令詞的參考特征矢量序列以為該命令詞構建參考模板具體包括:
[0012] 訓練命令集中的命令詞,每一個所述命令詞至少訓練兩遍以獲取至少兩組特征矢 量序列,如果所述兩組特征矢量序列中的第一組特征矢量序列和第二組特征矢量序列的失 真得分小于預設門限,根據所述第一組特征矢量序列和所述第二組特征矢量序列確定該命 令詞的參考特征矢量序列以為該命令詞構建參考模板,其中所述訓練命令集包括集內命令 。
[0013] 結合第一方面,在第一方面的第二種可能的實現方式中,所述參考特征矢量序列 包括參考MFCC的C1-C12倒譜分量和1階差分系數構成的24維特征參數,所述待測特征矢 量序列包括待測MFCC的C1-C12倒譜分量和1階差分系數構成的24維特征參數;
[0014] 所述將所述測試模板和所述參考模板集進行匹配以生成所述測試模板與每個參 考模板的匹配分數,具體包括:
[0015] 利用DTW算法,將所述測試模板的待測特征矢量序列中由MFCC的C1-C12倒譜分 量和1階差分系數構成的24維特征參數和所述參考模板集中的每個參考模板的參考特征 矢量序列中由MFCC的CI-C12倒譜分量和1階差分系數構成的24維特征參數分別進行運 算,獲取所述測試模板相對于每個參考模板的匹配分數。
[0016] 結合第一方面,在第一方面的第三種可能的實現方式中,所述訓練命令集包括集 內命令詞和集外命令詞,在預設環境下,對集外命令詞和集內命令詞分別進行錄音和特征 提取,將獲取到的特征矢量序列與所述參考模板集進行匹配,生成所述特征矢量序列的得 分,利用直方圖統計方法,確定第一門限值和第二門限值。
[0017] 第二方面,本發明實施例提供了一種語音識別裝置,所述裝置包括:第一獲取單 元,第二獲取單元,匹配單元,比對單元;
[0018] 所述第一獲取單元,用于訓練命令集中的命令詞,獲取每個命令詞的參考特征矢 量序列以為該命令詞構建參考模板,各個命令詞的參考模板構成參考模板集;
[0019] 所述第二獲取單元,從待測語音信號中提取特征參數,生成待測特征矢量序列,其 中所述待測特征矢量序列構成測試模板;
[0020] 所述匹配單元,用于將所述測試模板和所述參考模板集進行匹配以生成所述測試 模板與每個參考模板的匹配分數;
[0021] 所述比對單元,用于將各個參考模板的匹配分數和預設的第一門限值以及預設的 第二門限值進行比對,如果各個參考模板的匹配分數中的次小得分和最小得分的差值大于 第二門限值,且所述最小得分小于第一門限值,則最小得分的參考模板所對應的命令詞被 識別為待測語音信號中的命令詞。
[0022] 結合第二方面,在第二方面的第一種可能的實現方式中,所述第一獲取單元具體 用于:
[0023] 訓練命令集中的命令詞,每一個所述命令詞至少訓練兩遍以獲取至少兩組特征矢 量序列,如果所述兩組特征矢量序列中的第一組特征矢量序列和第二組特征矢量序列的失 真得分小于預設門限,根據所述第一組特征矢量序列和所述第二組特征矢量序列確定該命 令詞的參考特征矢量序列以為該命令詞構建參考模板,其中所述訓練命令集包括集內命令 。
[0024] 結合第二方面,在第二方面的第二種可能的實現方式中,所述參考特征矢量序列 包括參考MFCC的C1-C12倒譜分量和1階差分系數構成的24維特征參數,所述待測特征矢 量序列包括待測MFCC的C1-C12倒譜分量和1階差分系數構成的24維特征參數;
[0025] 所述匹配單元具體用于,利用DTW算法,將所述測試模板的待測特征矢量序列中 由MFCC的C1-C12倒譜分量和1階差分系數構成的24維特征參數和所述參考模板集中的 每個參考模板的參考特征矢量序列中由MFCC的CI-C12倒譜分量和1階差分系數構成的24 維特征參數分別進行運算,獲取所述測試模板相對于每個參考模板的匹配分數。
[0026] 第三方面,本發明實施例提供了一種藍牙耳機,所述藍牙耳機包括第二方面所述 的語音識別裝置。
[0027] 通過使用本發明實施例提供的語音識別方法、裝置和藍牙耳機,解決了特定人孤 立詞語音識別時的誤識別率和誤拒絕率較高的問題,實現了特定人孤立詞識別時較低的誤 識別率和誤拒絕率,而且用戶體驗性較好。
【專利附圖】
【附圖說明】
[0028] 圖1為本發明實施例一提供的語音識別方法流程圖;
[0029] 圖2為本發明實施例二提供的語音識別裝置示意圖。
【具體實施方式】
[0030] 下面通過附圖和實施例,對本發明的技術方案做進一步的詳細描述。
[0031] 圖1為本發明實施例一提供的語音識別方法流程圖。如圖1所示,本實施例包括 以下步驟:
[0032] 步驟S110,訓練命令集中的命令詞,獲取每個命令詞的參考特征矢量序列以為該 命令詞構建參考模板,各個命令詞的參考模板構成參考模板集。
[0033] 可選地,所述訓練命令集中的命令詞,獲取每個命令詞的參考特征矢量序列以為 該命令詞構建參考模板具體包括:
[0034] 訓練命令集中的命令詞,每一個所述命令詞至少訓練兩遍以獲取至少兩組特征矢 量序列,如果所述兩組特征矢量序列中的第一組特征矢量序列和第二組特征矢量序列的失 真得分小于預設門限,根據所述第一組特征矢量序列和所述第二組特征矢量序列確定該命 令詞的參考特征矢量序列以為該命令詞構建參考模板,其中所述訓練命令集包括集內命令 。
[0035] 具體地,訓練命令集中的命令詞,每一個命令詞可以訓練兩遍。進行第一遍訓 練時,獲取該命令詞的特征參數,該特征參數可以以Mel頻率倒譜系數(Mel Frequency Cepstrum Coefficient,MFCC)中的C1-C12倒譜分量和1階差分系數構成的24維特征參數 表示,將獲取到的24維特征參數可以稱為第一組特征參數,該第一組特征參數構成第一組 特征矢量序列,該第一組特征矢量序列可以以不=^ι,χ?2,··…表示;進行第二遍訓練時, 獲取到第二組特征參數,該第二組特征參數也可以以MFCC中的C1-C12和1階差分系數構 成的24維特征參數表示,獲取到的第二組特征參數構成第二組特征矢量序列,該第二組特 征矢量序列可以以A =卜21,?,……表示,其中,Xl,x2表示第一遍和第二遍提取命令詞中 的每幀語音信號的C1-C12倒譜分量和1階差分系數的24維特征參數,?\,T2為第一遍和 第二遍提取命令詞中的最后一巾貞語音信號的巾貞序號。一般,每巾貞語音信號對應時間長度為 10 ?20ms。
[0036] 通過動態時間規整(Dynamic Time Warping, DTW)算法計算第一組特征矢量序列 和第二組特征矢量序列的失真得分,即dd x2),如果dd x2)小于預設門限,則該第一組 特征矢量序列和第二組特征矢量序列的一致性較好,可以通過XdPX 2的時間彎折平均獲取 參考特征矢量序列,該參考特征矢量序列可以以A = {ap a2, . . .,aj表示。
[0037] 訓練命令詞可以包括接聽、掛斷、重撥和配對(這只是舉例,訓練命令詞具體內容 可以根據實際需求任意設置)。對于命令集中的每一個命令詞,都可以生成一個參考模板, 即接聽、掛斷、重撥和配對對應4個參考模板,該4個參考模板構成參考模板集。
[0038] 步驟S120,從待測語音信號中提取特征參數,生成待測特征矢量序列,其中所述待 測特征矢量序列構成測試模板。
[0039] 具體地,檢測用戶輸入的語音信號,從該語音信號中提取特征參數,該特征參數可 以以上述步驟S110中的MFCC的C1-C12倒譜分量和1階差分系數構成的24維特征參數表 示,提取到的24維特征參數構成待測特征矢量序列,該待測特征矢量序列即為測試模板, 該測試模板可以以B = {bp b2, . . .,bj表示。
[0040] 步驟S130,將所述測試模板和所述參考模板集進行匹配以生成所述測試模板與每 個參考模板的匹配分數。
[0041] 可選地,所述將所述測試模板和所述參考模板集進行匹配以生成所述測試模板與 每個參考模板的匹配分數,具體包括:
[0042] 利用DTW算法,將所述測試模板的待測特征矢量序列中由MFCC的C1-C12倒譜分 量和1階差分系數構成的24維特征參數和所述參考模板集中的每個參考模板的參考特征 矢量序列中由MFCC的CI-C12倒譜分量和1階差分系數構成的24維特征參數分別進行運 算,獲取所述測試模板相對于每個參考模板的匹配分數。
[0043] 具體地,以將測試模板和參考模板集中的一個參考模板進行匹配為例,該參考模 板的參考特征矢量序列為A = {ap a2, . . .,,該測試模板的待測特征矢量序列為B = IK b2, · · ·,比},其中,I關J。生成匹配分數可以采用現有技術,比如,可以利用DTW算法尋 找一個最佳的時間規正函數,使待測語音模板的時間軸i非線性地映射到參考模板的時間 軸j,使總的累積失真量最小,從而獲得匹配分數。由于是將測試模板和每一個參考模板進 行比對,可以獲知生成的匹配分數的個數和參考模板的個數是相等的。
[0044] 步驟S140,將各個參考模板的匹配分數和預設的第一門限值以及預設的第二門限 值進行比對,如果各個參考模板的匹配分數中的次小得分和最小得分的差值大于第二門限 值,且所述最小得分小于第一門限值,則最小得分的參考模板所對應的命令詞被認為是待 測語音信號中的命令詞。
[0045] 具體地,以參考模板集中訓練了 4個命令詞為例,該4個命令詞可以是接聽、掛斷、 重撥和配對,利用DTW算法,將待測特征矢量序列分別與參考模板集中的命令詞"接聽"對 應的參考模板、命令詞"掛斷"對應的參考模板、命令詞"重撥"對應的參考模板和命令詞 "配對"對應的參考特征矢量序列進行匹配后,可以獲得一組匹配分數,假如獲得的匹配分 數為113, 302, 278, 269,匹配分數越小,表示該參考模板和所述測試模板的匹配度越高,其 對應的命令詞越可能被認為是識別結果,在這一組匹配分數中,最小得分為113,最小得分 和次小得分的差值為269-113 = 156,預設的第一門限值可以以threhold_score表示,預 設的第二門限值可以以threhold_dist表示,如果預設的第一門限值threhold_score的值 為200,第二門限值threhold_dist的值為100,如果每個參考模板的匹配分數中的最小得 分和次小得分的差值大于第二門限值,同時每個參考模板的匹配分數的最小得分小于第一 門限值,則最小得分的參考模板所對應的命令詞被識別為待測語音信號中的命令詞。在上 述匹配分數中,只有接聽命令詞所對應匹配分數滿足要求,則可以正確的識別出接聽這個 命令詞,從而實現了語音識別。
[0046] 第一門限值和第二門限值可以根據各種各樣的方式獲得,比如可以通過經驗來設 置,隨后根據誤識別率和錯拒絕率來確定識別效果,看是否可以調整兩個門限值,直到得到 最優的第一門限值和第二門限值。
[0047] 此外,在一個優選的實施例中,在預設環境下,對集外命令詞(不屬于訓練集命 令,實驗選取集外命令詞有介紹、配合、拒絕、重載以及咳嗽聲,共5個)和集內命令詞(屬 于訓練集命令)分別進行錄音和特征提取,將獲取到的特征矢量序列與所述參考模板集進 行匹配,生成所述特征矢量序列的得分,利用直方圖統計方法,生成第一門限值和第二門限 值。
[0048] 比如,選取20位特定人,該20位特定人男女可以各占一半。首先在安靜會議室 環境下進行集內命令詞訓練,得到每個特定人集內命令詞的參考模板集。然后在三種環境 下,比如辦公室、會議室、戶外,進行錄音,可以對每個命令詞錄10遍,當集內命令為接聽、 掛斷、重撥、配對時,可以采集到的集內命令詞樣本每個特定人有4*3*10 = 120個,當集外 命令有為介紹、配合、拒絕、重載以及咳嗽聲時,可以采集到的集外命令詞樣本每個特定人 有5*3*10 = 150個,每個特定人總共采集到的樣本有270個。針對每個特定人,對這270 個樣本,可以進行DTW匹配計算,將該270個樣本和對應特定人的參考模板集進行匹配,得 到270組匹配分數。20位特定人可以得到270*20 = 5400組匹配分數。然后對這5400組 匹配分數統計出每一組匹配分數的最小得分以及最小得分和次小得分的差值,可以使用直 方圖統計方法,通過分析集內命令和集外命令匹配分數的最小得分以及最小得分和次小得 分的差值的分布,獲得第一門限值和第二門限值。
[0049] 當采用本發明實施例提供的語音識別方法,即threhold_score參數取值為200, 而threhold_dist參數取值為100時,集內命令的識別率為95 %,而集外命令拒絕率為 95%。當采用傳統的單一門限值方法,即threhold_score參數取值為200時,集內命令的 識別率為95%,而集外命令的拒絕率為70%。顯然采用雙門限判決方法后,在保證集內命 令識別率不下降的前提下去,集外命令的誤識別率由30%降低為5%。
[0050] 在本發明中的方案中,通過設置第一門限值,并將第一門限值與參考模板的匹配 分數的最小得分進行比較,從而保證了匹配度足夠好的參考模板才能通過識別,從而可以 降低誤識別率;通過設置第二門限值,并將第二門限值與參考模板的匹配分數的最小得分 和次小得分的差值進行比較,從而保證了只有最小得分和次小得分的差值足夠大的識別結 果才能通過識別,降低了集外命令詞的誤識別率,這樣實現了特定人孤立詞識別時較低的 誤識別率和誤拒絕率,而且用戶體驗性較好。
[0051] 圖2為本發明實施例二提供的語音識別裝置示意圖。如圖2所示,本實施例包括: 第一獲取單元210,第二獲取單元220,匹配單元230,比對單元240 ;
[0052] 第一獲取單元210,用于訓練命令集中的命令詞,獲取每個命令詞的參考特征矢量 序列以為該命令詞構建參考模板,各個命令詞的參考模板構成參考模板集;
[0053] 可選地,第一獲取單元210具體用于:訓練命令集中的命令詞,每一個所述命令詞 至少訓練兩遍以獲取至少兩組特征矢量序列,如果所述兩組特征矢量序列中的第一組特征 矢量序列和第二組特征矢量序列的失真得分小于預設門限,根據所述第一組特征矢量序列 和所述第二組特征矢量序列確定該命令詞的參考特征矢量序列以為該命令詞構建參考模 板,其中所述訓練命令集包括集內命令詞。
[0054] 第二獲取單元220,從待測語音信號中提取特征參數,生成待測特征矢量序列,其 中所述待測特征矢量序列構成測試模板;
[0055] 所述匹配單元230,用于將所述測試模板和所述參考模板集進行匹配以生成所述 測試模板與每個參考模板的匹配分數;
[0056] 可選地,所述匹配單元230具體用于,利用DTW算法,將所述測試模板的所述待測 特征矢量序列中由MFCC的C1-C12倒譜分量和1階差分系數構成的24維特征參數和所述 參考模板集中的每個參考模板的參考特征矢量序列中由MFCC的CI-C12倒譜分量和1階差 分系數構成的24維特征參數分別進行運算,獲取所述測試模板相對于每個參考模板的匹 配分數。
[0057] 所述比對單元240,用于將各個參考模板的匹配分數和預設的第一門限值以及預 設的第二門限值進行比對,如果各個參考模板的匹配分數中的次小得分和最小得分的差值 大于第二門限值,且所述最小得分小于第一門限值,則最小得分的參考模板所對應的命令 詞被識別為待測語音信號中的命令詞。
[0058] 進一步地,本發明實施例可以應用在藍牙耳機中,所述藍牙耳機包括如圖2所示 的語音識別裝置。
[0059] 在本發明實施例提供的語音識別裝置和藍牙耳機中,通過設置第一門限值,并將 第一門限值與參考模板的匹配分數的最小得分進行比較,從而保證了匹配度足夠好的參考 模板才能通過識別,從而可以降低誤識別率;通過設置第二門限值,并將第二門限值與參考 模板的匹配分數的最小得分和次小得分的差值進行比較,從而保證了只有最小得分和次小 得分的差值足夠大的識別結果才能通過識別,降低了集外命令詞的誤識別率,實現了特定 人孤立詞識別時較低的誤識別率和誤拒絕率,而且用戶體驗性較好。
[0060] 以上所述的【具體實施方式】,對本發明的目的、技術方案和有益效果進行了進一步 詳細說明,所應理解的是,以上所述僅為本發明的【具體實施方式】而已,并不用于限定本發明 的保護范圍,凡在本發明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含 在本發明的保護范圍之內。
【權利要求】
1. 一種語音識別方法,其特征在于,所述方法包括: 訓練命令集中的命令詞,獲取每個命令詞的參考特征矢量序列以為該命令詞構建參考 模板,各個命令詞的參考模板構成參考模板集; 從待測語音信號中提取特征參數,生成待測特征矢量序列,其中所述待測特征矢量序 列構成測試模板; 將所述測試模板和所述參考模板集進行匹配以生成所述測試模板與每個參考模板的 匹配分數; 將各個參考模板的匹配分數和預設的第一門限值以及預設的第二門限值進行比對,如 果各個參考模板的匹配分數中的次小得分和最小得分的差值大于第二門限值,且所述最小 得分小于第一門限值,則最小得分的參考模板所對應的命令詞被認為待測語音信號中的命 令詞。
2. 如權利要求1所述的方法,其特征在于,所述訓練命令集中的命令詞,獲取每個命令 詞的參考特征矢量序列以為該命令詞構建參考模板具體包括: 訓練命令集中的命令詞,每一個所述命令詞至少訓練兩遍以獲取至少兩組特征矢量序 列,如果所述兩組特征矢量序列中的第一組特征矢量序列和第二組特征矢量序列的失真得 分小于預設門限,根據所述第一組特征矢量序列和所述第二組特征矢量序列確定該命令詞 的參考特征矢量序列以為該命令詞構建參考模板,其中所述訓練命令集包括集內命令詞。
3. 如權利要求1所述的方法,其特征在于,所述參考特征矢量序列包括參考MFCC的 C1-C12倒譜分量和1階差分系數構成的24維特征參數,所述待測特征矢量序列包括待測 MFCC的C1-C12倒譜分量和1階差分系數構成的24維特征參數; 所述將所述測試模板和所述參考模板集進行匹配以生成所述測試模板與每個參考模 板的匹配分數,具體包括: 利用動態時間規整DTW算法,將所述測試模板的待測特征矢量序列中由MFCC的C1-C12 倒譜分量和1階差分系數構成的24維特征參數和所述參考模板集中的每個參考模板的參 考特征矢量序列中由MFCC的CI-C12倒譜分量和1階差分系數構成的24維特征參數分別 進行運算,獲取所述測試模板與每個參考模板的匹配分數。
4. 如權利要求1所述的方法,其特征在于,在預設環境下,對集外命令詞和集內命令詞 分別進行錄音和特征參數提取,將獲取到的特征矢量序列與所述參考模板集進行匹配,生 成所述特征矢量序列的得分,利用直方圖統計方法,確定第一門限值和第二門限值。
5. -種語音識別裝置,其特征在于,所述裝置包括:第一獲取單元,第二獲取單元,匹 配單元,比對單元; 所述第一獲取單元,用于訓練命令集中的命令詞,獲取每個命令詞的參考特征矢量序 列以為該命令詞構建參考模板,各個命令詞的參考模板構成參考模板集; 所述第二獲取單元,用于從待測語音信號中提取特征參數,生成待測特征矢量序列,其 中所述待測特征矢量序列構成測試模板; 所述匹配單元,用于將所述測試模板和所述參考模板集進行匹配以生成所述測試模板 與每個參考模板的匹配分數; 所述比對單元,用于將各個參考模板的匹配分數和預設的第一門限值以及預設的第二 門限值進行比對,如果各個參考模板的匹配分數中的次小得分和最小得分的差值大于第二 門限值,且所述最小得分小于第一門限值,則最小得分的參考模板所對應的命令詞被識別 為待測語音信號中的命令詞。
6. 如權利要求5所述的裝置,其特征在于,所述第一獲取單元具體用于: 訓練命令集中的命令詞,每一個所述命令詞至少訓練兩遍以獲取至少兩組特征矢量序 列,如果所述兩組特征矢量序列中的第一組特征矢量序列和第二組特征矢量序列的失真得 分小于預設門限,根據所述第一組特征矢量序列和所述第二組特征矢量序列確定該命令詞 的參考特征矢量序列以為該命令詞構建參考模板,其中所述訓練命令集包括集內命令詞。
7. 如權利要求5所述的裝置,其特征在于,所述參考特征矢量序列包括參考MFCC的 C1-C12倒譜分量和1階差分系數構成的24維特征參數,所述待測特征矢量序列包括待測 MFCC的C1-C12倒譜分量和1階差分系數構成的24維特征參數; 所述匹配單元具體用于,利用DTW算法,將所述測試模板的待測特征矢量序列中由 MFCC的C1-C12倒譜分量和1階差分系數構成的24維特征參數和所述參考模板集中的每個 參考模板的參考特征矢量序列中由MFCC的CI-C12倒譜分量和1階差分系數構成的24維 特征參數分別進行運算,獲取所述測試模板與每個參考模板的匹配分數。
8. -種藍牙耳機,其特征在于,所述藍牙耳機包括如權利要求5-7任一項所述的語音 識別裝置。
【文檔編號】G10L15/07GK104103272SQ201410337554
【公開日】2014年10月15日 申請日期:2014年7月15日 優先權日:2014年7月15日
【發明者】馮宇紅 申請人:無錫中星微電子有限公司