一種發音檢錯方法及裝置的制造方法
【技術領域】
[0001] 本申請涉及發音檢錯技術領域,尤其涉及一種發音檢錯方法及裝置。
【背景技術】
[0002] 自上世紀90年代開始,為了解除傳統方法的束縛,越來越多的語音識別、語言學、 教育學等方面的研究人員開展計算機輔助發音訓練(Computer Assisted Pronunciation Training,CAPT)系統的研究與開發,用于取代或者部分取代"教師"的作用,實現對學習者 發音水平的自動評估,并對發音錯誤給予反饋與指導,提高學習效果與效率。
[0003] 發音檢錯即檢測出用戶發音過程中的錯誤,作為CAPT系統的重要環節,受到很多 研究人員的關注。現有發音檢錯系統中,發音得分通常計算為語音單元片斷相應于其對應 系統預設模型的相似度,系統預設模型由系統預先在采集的語音數據上訓練得到。然而, 由于訓練數據的有限性,訓練數據中包含的基本語音單元的詞頻分布往往具有一定的偏向 性,如常用單詞not、and等往往出現頻率較高,而較生僻的單詞則出現頻率較低。而在真實 數據測試中,由于測試數據環境和訓練數據的不盡一致,數據充足的模型識別率高,而那些 數據稀疏的模型識別可能出現失真。相應的,基于該模型打分的發音得分可能存在一定的 偏差,從而導致發音檢測的準確率不高。
【發明內容】
[0004] 為解決上述技術問題,本申請實施例提供一種發音檢錯方法及裝置,能夠減小發 首得分出現的偏差,提_發首檢錯的準確率。技術方案如下:
[0005] 一種發音檢錯方法,包括:
[0006] 獲取待檢錯語音信號;
[0007] 提取所述語音信號的語音特征序列;
[0008] 對所述語音特征序列進行切分,獲取基本語音單元片斷;
[0009] 對所述基本語音單元片斷進行模型得分補償,獲得所述基本語音單元片斷的發音 得分;
[0010] 根據所述基本語音單元片斷的發音得分進行發音檢錯。
[0011] 優選地,所述對所述基本語音單元片斷進行模型得分補償,獲得所述基本語音單 元片斷的發音得分,包括:
[0012] 確定所述基本語音單元片斷對應的發音模型和競爭模型;
[0013] 計算所述基本語音單元片斷與所述發音模型的第一似然度得分,以及所述基本語 音單元片斷與所述競爭模型的第二似然度得分;
[0014] 獲得所述基本語音單元片斷對應的所述競爭模型的模型補償系數;
[0015] 根據所述模型補償系數對其對應的所述第二似然度得分進行補償,獲得第三似然 度得分;
[0016] 根據所述競爭模型對應的所述第三似然度得分及所述第一似然度得分獲得所述 基本語音單元片斷的發音得分。
[0017] 優選地,所述獲得所述基本語音單元片斷對應的所述競爭模型的模型補償系數, 包括:
[0018] 獲取訓練數據;
[0019] 獲取所述訓練數據中的基本語音單元片斷;
[0020] 確定所述基本語音單元片斷對應的發音模型及競爭模型;
[0021] 計算所述基本語音單元片斷的第一似然度得分集合及第二似然度得分集合;其 中,所述第一似然度得分集合為由所有所述訓練數據中的基本語音單元片斷與所述發音模 型的似然度得分形成的集合;所述第二似然度得分集合為由所有所述訓練數據中的基本語 音單元片斷與所述競爭模型的似然度得分形成的集合;
[0022] 根據所述第一似然度得分集合及所述第二似然度得分集合,確定所述基本語音單 元片斷對應的競爭模型的模型補償系數。
[0023] 優選地,所述根據所述第一似然度得分集合及所述第二似然度得分集合,確定所 述基本語音單元片斷對應的競爭模型的模型補償系數,包括:
[0024] 計算所述第一似然度得分集合與所述第二似然度得分集合之間的似然度得分差 集合;
[0025] 對所述似然度得分差集合中的對象按照數值從小到大進行排序,得到一得分差數 組 SCORE';
[0026] 根據預設的所述發音模型和所述競爭模型間的虛警比例P%及所述似然度得分差 集合中的對象個數N,獲得得分差數組SCORE'中的對象SCORE' (N*P % );
[0027] 如果所述對象SCORE' (N*P%)大于0,則將所述基本語音單元片斷對應的所述競 爭模型的模型補償系數設置為〇 ;否則,將所述對象SCORE' (N*P% )作為所述基本語音單 元片斷對應的所述競爭模型的模型補償系數。
[0028] 優選地,所述根據所述第一似然度得分集合及所述第二似然度得分集合,確定所 述基本語音單元片斷對應的競爭模型的模型補償系數,包括:
[0029] 計算所述第一似然度得分集合與所述第二似然度得分集合之間的似然度得分差 集合;
[0030] 從所述似然度得分差集合中選擇最小的N*P%個對象,N為所述似然度得分差集 合中的對象個數,P%為所述發音模型和所述競爭模型間的虛警比例;
[0031] 獲取所述N*P%個對象中最大的值;
[0032] 如果所述最大的值大于0,則將所述基本語音單元片斷對應的所述競爭模型的模 型補償系數設置為〇 ;否則,將所述最大的值作為所述基本語音單元片斷對應的所述競爭 模型的模型補償系數。
[0033] 一種發音檢錯裝置,包括:
[0034] 信號獲取單元,用于獲取待檢錯語音信號;
[0035] 特征提取單元,用于提取所述語音信號的語音特征序列;
[0036] 片斷獲取單元,用于對所述語音特征序列進行切分,獲取基本語音單元片斷;
[0037] 得分補償單元,用于對所述基本語音單元片斷進行模型得分補償,獲得所述基本 語音單元片斷的發音得分;
[0038] 發音檢錯單元,用于根據各所述基本語音單元片斷的發音得分進行發音檢錯。
[0039] 優選地,所述得分補償單元包括:
[0040] 模型確定子單元,用于確定所述基本語音單元片斷對應的發音模型和競爭模型;
[0041] 得分計算子單元,用于計算所述基本語音單元片斷與所述發音模型的第一似然度 得分,以及所述基本語音單元片斷與所述競爭模型的第二似然度得分;
[0042] 系數獲得子單元,用于獲得所述基本語音單元片斷對應的所述競爭模型的模型補 償系數;
[0043] 補償子單元,用于根據所述模型補償系數對其對應的所述第二似然度得分進行補 償,獲得第三似然度得分;
[0044] 得分確定子單元,用于根據所述競爭模型對應的所述第三似然度得分及所述第一 似然度得分獲得所述基本語音單元片斷的發音得分。
[0045] 優選地,所述系數獲得子單元包括:
[0046] 數據獲取子單元,用于獲取訓練數據;
[0047] 片斷獲取子單元,用于獲取所述訓練數據中的基本語音單元片斷;
[0048] 確定子單元,用于確定所述基本語音單元片斷對應的發音模型及競爭模型;
[0049] 集合獲得子單元,用于計算所述基本語音單元片斷的第一似然度得分集合及第二 似然度得分集合;其中,所述第一似然度得分集合為由所有所述訓練數據中的基本語音單 元片斷與所述發音模型的似然度得分形成的集合;所述第二似然度得分集合為由所有所述 訓練數據中的基本語音單元片斷與所述競爭模型的似然度得分形成的集合;
[0050] 系數確定子單元,用于根據所述第一似然度得分集合及所述第二似然度得分集 合,確定所述基本語音單元片斷對應的所述競爭模型的模型補償系數。
[0051] 優選地,所述系數確定子單元包括:
[0052] 集合計算子單元,用于計算所述第一似然度得分集合與所述第二似然度得分集合 之間的似然度得分差集合;
[0053] 排序子單元,用于對所述似然度得分差集合中的對象按照數值從小到大進行排 序,得到一得分差數組SCORE';
[0054] 對象獲取子單元,用于根據預設的所述發音模型和所述競爭模型間的虛警比 例P %及所述似然度得分差集合中的對象個數N,獲得得分差數組SCORE '中的對象 SCOREi (N*P% );
[0055] 第一確定子單元,用于判斷所述對象SCORE' (N*P% )是否大于0 ;如果是,則將 所述基本語音單元片斷對應的所述競爭模型的模型補償系數設置為〇 ;否則,將所述對象 SCORE' (N*P%)作為所述基本語音單元片斷對應的所述競爭模型的模型補償系數。
[0056] 優選地,所述系數確定子單元包括:
[0057] 集合計算子單元,用于計算所述第一似然度得分集合與所述第二似然度得分集合 之間的似然度得分差集合;
[0058] 第一選擇子單元,用于從所述似然度得分差集合中選擇最小的N*P%個對象,N 為所述似然度得分差集合中的對象個數,P