一種指令式語音控制發音詞典輔助生成方法
【技術領域】
[0001]本發明屬語音處理技術,模式識別技術。
【背景技術】
[0002]隨著語音識別技術的發展和不斷成熟,語音識別技術產品的應用領域和范圍在不斷擴展,逐漸深入到人們生活、生產的各個環節,成為改善生活和工作質量、提高效率的重要支撐工具。
[0003]語音識別技術的應用領域不同,其實現的方式有所區別。以互聯網平臺為基礎的語音識別服務依托于強大的數據服務器和背后龐大的系統維護專業團隊,能夠為人們提供日常生活交流的語音服務。然而對于各專業領域的工作系統,一般不具備上述條件,適合采用專用的指令式的語音控制操作方式,這種語音控制功能一般不需要日常更新和維護,也不需要大型的服務器平臺,能夠實時識別響應,適合于在各專業生產領域內廣泛應用。
[0004]目前的語音識別技術,在實現過程中包含兩部分的處理,即語音模型處理和語法模型處理。語音模型處理主要基于連續HMM模型,識別出語音的發音序列,語法模型處理中包含了由各字詞組成語句的語言組織語法規則。大規模互聯網語音識別應用采用無限詞匯,其詞匯和語法規則需要不斷地維護和刷新,以適應于不斷涌現的新的詞匯和用法;專用系統的語音控制僅僅針對系統人機操作本身有限的詞匯,其詞法和語法相對固定,不需要頻繁刷新維護,因此在語音識別的實現技術上可以采用預先設計定義的詞法和語法結構。其中,發音字典文件就是定義指令式語音控制目標系統指令詞匯及其發音的專用詞法文件。
[0005]發音字典文件的基本實現形式如下:
[0006]a)每個詞(或短語)為一條記錄,每條記錄包括詞(短語)的漢字碼和發音兩部分數據;
[0007]b)發音為該詞(短語)的發音序列在識別模型庫中對應的單音素發音注記字符組入口 ο
[0008]其中,每個單音素發音注記字符是模型庫對每個基本發音單位的符號表示,這些注記字符實際上是與拼音(或國際音標)功能相似的另一套音標表示方式,語音識別器使用這些注記字符的組合用于定義所有的語言發音,同時也存在著注記字符組合與漢語拼音的一一對應關系。
[0009]發音字典在語音識別中主要應用在兩個方面:其一是在識別過程中建立識別出的聲音音素模型與字(詞)和語句之間的映射關系;其二是用于個性化自適應處理過程中的自適應樣本采集和訓練腳本。
[0010]發音字典中包含了語音控制系統所有語音指令中所包含的字詞,其數量規模隨實際應用系統而定,復雜的系統(飛機駕駛艙控制)可以有近1000條的詞條規模。
[0011]在指令式語音識別控制系統開發過程中,一直采用人工編輯的方式產生發音字典文件,這需要編輯人員非常熟悉單音素發音注記字符,一套漢字注記符包含143個基本音素發音符號。對于一套指令數量較多的語音控制系統,人工編輯發音字典文件過程中難免會產生一些錯誤,需要反復的測試來查找修正這些錯誤,耗費較多的人力和時間。
[0012]本發明面向中大詞匯量的語音控制產品,利用該發明可以有效降低語音控制產品開發過程的工作量,降低實現難度,并能夠保證語音控制產品的開發質量,降低對相關開發人員的專業性要求,實現語音控制產品開發人力資源的合理利用,也有助于提高產品開發效率、縮短產品開發周期,進而產生良好的經濟效益。
【發明內容】
[0013]此項發明的目的在于提供一種指令式語音控制發音詞典輔助生成方法,將人工全手動輸入編輯發音字典文件的方式轉變成計算機輔助生成方式,有效降低語音控制產品開發、測試、修改過程的工作量,消除產生人為差錯的可能性,提高語音控制產品的開發質量和效率,節省人力資源、縮短產品開發周期。
[0014]本發明的發明目的通過以下技術方案實現:
[0015]—種指令式語音控制發音詞典輔助生成方法,包含以下步驟:
[0016]a)向計算機程序輸入語音指令漢字字符串及該語音指令漢字字符串對應的音調信息;
[0017]b)計算機程序按語音指令漢字字符串中字符出現的依次將語音指令漢字字符轉換為對應的語首指令拼首字符;
[0018]c)計算機程序將語音指令拼音字符轉換為語音指令音素發音注記字符;
[0019]d)由計算機程序在語音控制發音字典文件中添加語音指令漢字字符及該語音指令漢字字符對應的音素發音注記字符。
[0020]本發明的有益效果在于:
[0021]通過使用該發明,語音控制發音字典文件的計算機處理生成效率比全人工編輯提高3倍以上,不會產生差錯,免除了針對語音控制發音字典文件的錯誤查找和修正,降低了語音控制產品的整體缺陷故障因素。
【附圖說明】
[0022]圖1為本發明的實例界面;
[0023]圖2為本發明的實施流程圖。
[0024]具體實現方式
[0025]下面結合附圖和實施例對本發明作進一步的詳細描述。
[0026]1、操作界面與基本處理流程
[0027]操作界面的形式如附圖1所示。
[0028]其中,文件管理菜單中實現文件創建、文件打開、文件保存的功能;在查找修改菜單中實現添加、查找及修改字典內容的功能選擇;查找結果框中顯示查找指定指令詞或短語有無的結果;添加詞條按鈕用于選擇添加新的指令詞或短語;確認按鈕用于確認當前指令詞發音標注碼的生成結束;添加停頓按鈕用于選擇是否在指令詞發音標注碼尾部添加停頓標注。詞條輸入框用于輸入指令詞條漢字字符串;字音選擇按鈕框將顯示出當前處理字符的所有拼音發音,提供操作者加以選擇,三角箭頭按鈕用于在輸入的指令字符串中選擇當前處理的字符;發音注記框顯示出當前已處理字符的發音注記轉換結果。
[0029]整體的基本處理流程如附圖2所示。對于每一個輸入的指令詞或短語字符串,按照每個漢字在該字符串中出現的順序逐一人工確定其在指令中的發音,計算機程序將該發音的拼音轉換成相應的音素發音注記符,順序拼接各音素發音注記符形成與指令字符串相對應的因素發音注記符串,再根據實際需要選擇在其末尾處添加停頓注記符,完成一條指令詞或短語的音素發音注記符轉換處理。
[0030]2、漢字字符與拼音字符串的轉換
[0031]本發明實例中,漢字字符串與拼音字符串的轉換,主要用于選擇漢字在語音指令中的實際發音,并獲得相應的拼音表示字符串。
[0032]本發明在實現過程中使用帶有音調標注的漢字-拼音對照表,可用漢字字符查找出其對應的所有發音的拼音字符串及其音調標注。其中,漢字-拼音對照表可以在互聯網的相關網站獲得。其查找方法可根據該表的編排規律自行確定。
[0033]3、拼音字符串與音素發音注記字符串的轉換
[0034]本發明實例中,拼音字符串與音素發音注記字符串的轉換是利用拼音-注記符對照表,可用拼音查找出其相應的音素發音注記符字符串。該表是和語音模型庫配套的數據文件,共有1000多條記錄,包含了所有漢語中出現的發音拼音,每條記錄中包含了帶聲調的拼音字符串和相對應的音素發音注記符字符串,其查找方法可根據該表的編排規律自行確定。
[0035]可以理解的是,對本領域普通技術人員來說,可以根據本發明的技術方案及其發明構思加以等同替換或改變,而所有這些改變或替換都應屬于本發明所附的權利要求的保護范圍。
【主權項】
1.一種指令式語音控制發音詞典輔助生成方法,包含以下步驟: a)向計算機程序輸入語音指令漢字字符串及該語音指令漢字字符串對應的音調信息; b)計算機程序按語音指令漢字字符串中字符出現的依次將語音指令漢字字符轉換為對應的語首指令拼首字符; c)計算機程序將語音指令拼音字符轉換為語音指令音素發音注記字符; d)由計算機程序在語音控制發音字典文件中添加語音指令漢字字符及該語音指令漢字字符對應的音素發音注記字符。
【專利摘要】本發明公開了一種指令式語音控制發音詞典輔助生成方法,包含以下步驟:a)向計算機程序輸入語音指令漢字字符串及該語音指令漢字字符串對應的音調信息;b)計算機程序將語音指令漢字字符串轉換為對應的語音指令拼音字符串;c)計算機程序將語音指令拼音字符串轉換為語音指令音素發音注記字符串;d)由計算機程序在語音控制發音字典文件中添加語音指令漢字字符及該語音指令漢字字符對應的音素發音注記字符串。本發明將人工全手動輸入編輯發音字典文件的方式轉變成計算機輔助生成方式,有效降低語音控制產品開發、測試、修改過程的工作量。
【IPC分類】G10L15/22, G10L15/26, G10L15/00
【公開號】CN105225659
【申請號】CN201510574070
【發明人】原帥, 須明
【申請人】中國航空無線電電子研究所
【公開日】2016年1月6日
【申請日】2015年9月10日