一種語音識別的特征向量量化快速收斂方法
【專利摘要】本發明為大規模孤立詞語音識別的特征向量量化提供了一種快速收斂的方法,能比較快的建立碼本。本發明的方法解決了一般特征向量由于詞匯量大而導致碼本建立過程慢的缺點,實驗結果表明,相比較于模擬退火算法,該發明的碼本建立過程中運算的迭代次數減小了一個10的量級,同時消除了除法運算和大量的乘法運算。
【專利說明】一種語音識別的特征向量量化快速收斂方法
【技術領域】
[0001] 本發明涉及孤立詞語音識別領域,具體涉及一種語音識別的特征向量量化快速收 斂方法。
【背景技術】
[0002] 在向量空間中,對大量的向量進行某種特性的統計是很難的,甚至是不現實的。如 果用一個編碼來表示具有相似特性的一簇向量,則可以減少數學建模上計算的復雜度以及 減少運算時間。這些具有相似特性的向量的集合稱為簇,或聚類。比如,相互之間歐式距離 小于某個閾值的向量可以歸類到同一個簇中,或向量的范數小于某個閾值的向量可以歸類 到同一個簇中,等等。
[0003] 在語音識別系統中,語音的特征參數本身就是一個向量,可以按照某種規則將語 音特征參數進行分類。語音識別中,一個很關鍵的步驟就是特征參數的量化,以利于減小 存儲空間和進行后續的匹配模板的計算。以d維向量為例,我們可以把一個d維向量對應 到d維向量空間內的一個點。所有d維向量的集合就構成了坐標空間C。將整個坐標空間 C劃分成Μ個區域,每個區域成為一個聚類,每個聚類用一個符號,例如數字編號來代表,其 屬性用該聚類的中心點的一個d維向量表示。
[0004] 實際上,碼本就是Μ個聚類形成的集合,建立碼本的過程就是模式分類中的聚類 的實現過程。常用的聚類實現的方法都可以用來建立碼本,主要有:LBG聚類算法、模擬退 火算法等等。
[0005] LBG聚類算法、模擬退火算法實現的語音識別的碼本比較準確,但確定是在實現聚 類的過程中,由于要反復迭代計算,迭代次數比較大,因此上述兩種算法的收斂速度都比較 慢。如何在不損失碼本精度的前提下,加快聚類算法的收斂速度,快速建立碼本就是一個必 須要考慮的問題。
【發明內容】
[0006] 為解決現有技術中存在的問題,本發明為大規模孤立詞語音識別提供了一種不損 失碼本精確度,但能加快聚類收斂速度,快速建立碼本的方法。本發明通過以下技術方案實 現:
[0007] -種語音識別的特征向量量化快速收斂方法,其特征在于:所述方法包括以下步 驟:
[0008] (1)使用LBG算法對語音特征向量進行訓練,產生初始碼本,碼本的個數與訓練用 詞庫中詞的個數相同;
[0009] (2)從詞庫中隨機選一個詞,將其標識為Α,該詞經特征參數提取后,和所有碼本 按照下式進行平均量化誤差D 1的計算,
[0010]
【權利要求】
1. 一種語音識別的特征向量量化快速收斂方法,其特征在于:所述方法包括以下步 驟: (1) 使用LBG算法對語音特征向量進行訓練,產生初始碼本,碼本的個數與訓練用詞庫 中詞的個數相同; (2) 從詞庫中隨機選一個詞,將其標識為A,該詞經特征參數提取后,和所有碼本按照 下式進行平均量化誤差D1的計算,
其中,τ是一個詞的有效語音幀的幀數,q是子簇的中心向量;如果詞語B的碼本給出 最小的范數,則進行步驟(3),否則進行步驟(4); (3) 對每一個詞的每一幀特征向量Xt,找出其在詞A的簇中的距離它最近的子簇,該子 簇的中心向量用Cj表示;找出Xt在詞B的簇中的距離它最近的子簇,該子簇的中心向量 用Cf表示,距離分別用D A、DB表示;如果(DA-DB)/DA〈 δ,則按照下式改變對應子簇的中心向 量:
如果(da-db)/da>s,則按照下式改變對應子簇的中心向量:
其中s是預先定義的一個閾值,α是一個可變量,α隨著迭代次數的增加而減小; (4) 在該情況下,詞Α被正確識別,只需要調整詞Α的碼本的子簇的中心向量,對每一幀 的幀向量Xt,按照下式進行跳幀
其中,β是一個預先定義的可變量,β隨著迭代次數的增加而遞減; (5) 返回步驟(2),進行迭代,直到⑷=δ或β = 〇。
2. 根據權利要求1所述的方法,其特征在于:所述步驟(1)中產生初始碼本的具體步 驟為: 首先,將同一個孤立詞由不同的人發音實現的語音信號的特征向量歸類到同一個簇 中,這樣對Ν個詞的語音識別系統,則可以建立Ν個簇,每個簇中的所有向量繼續歸類成一 定數量的子簇,即第i個簇中的子簇個數為隊; 對第i個簇,隨機地選擇隊個向量,每個向量初始地代表一個子簇的平均值或中心向 量,對第i個簇中剩余的每個特征向量,根據其與各個子簇的中心向量的歐氏距離,將它賦 給最近的子簇,該過程中采用LBG算法來實現。
3. 根據權利要求2所述的方法,其特征在于:根據最終的簇來劃分特征向量時,有的子 簇包含的向量數為零,所以要阻止空子簇的出現;若有空子簇,則取消對應的子簇,然后找 出平均畸變最大的子簇,把對應該子簇的向量一分為二,重復檢測,直到沒有空子簇出現為 止。
【文檔編號】G10L15/06GK104064181SQ201410281283
【公開日】2014年9月24日 申請日期:2014年6月20日 優先權日:2014年6月20日
【發明者】劉明, 王明江 申請人:哈爾濱工業大學深圳研究生院