一種基于音標的語音編碼方法
【技術領域】
[0001]本發明涉及語音編碼技術,特別是涉及在語音編碼過程中以音標作為語音波形分類標準的應用。
【背景技術】
[0002]編碼、傳輸、存儲和譯碼是語音數字傳輸和數字存儲的必要過程。語音編碼的目的就是要使表達語音信號的比特數目最小。
[0003]語音編碼就是對模擬的語音信號進行編碼,將模擬信號轉化成數字信號,從而降低傳輸碼率并進行數字傳輸。
[0004]語音編碼的基本方法可分為波形編碼、參量編碼(音源編碼)和混合編碼。
[0005]波形編碼是將時域的模擬話音的波形信號經過取樣、量化、編碼而形成的數字話音信號;參量編碼是基于人類語言的發音機理,找出表征語音的特征參量,對特征參量進行編碼;混合編譯碼是結合波形編譯碼和參量編譯碼之間的優點。
【發明內容】
[0006]本發明是一種基于音標的語音編碼方法,其特征在于,包括:
[0007]通過對源語音按照語言學的音標體系進行分類,進而對源語音頻譜進行波形分析,從而得到與音標對應的單音素波形片段與有限個音素組合的多音素波形片段,并以音標記錄音頻波形片段(可以多個近似波形片段映射一個音標);再把這些音標的文本信息轉換為二進制代碼;通過逆向的解碼過程,由上述音標的文本信息轉換而成的二進制代碼也可以被還原成音標的文本信息,進一步地,音標的文本信息被還原成為擬制語音,從而實現語音承載信息的傳遞。
[0008]源語音經過編碼處理后,以音標一一即一種語音代碼一一的文本替代語音音頻本身,使得該段語音信息的存儲、傳輸占用資源大大降低。
[0009]源語音經過編碼處理后,再解碼還原的語音,是擬制語音,是對源語音中聲音本身的部分信息有選擇地舍棄,突出了對語音承載的信息中語言信息的保留。
【主權項】
1.一種基于音標的語音編碼方法,其特征在于,包括: 通過對源語音按照語言學的音標體系進行分類,進而對源語音頻譜進行波形分析,從而得到與音標對應的單音素波形片段與有限個音素組合的多音素波形片段,并以音標記錄音頻波形片段(可以多個近似波形片段映射一個音標);再把這些音標的文本轉換為二進制代碼;通過逆向的解碼過程,由上述音標的文本信息轉換而成的二進制代碼也可以被還原成音標的文本信息,但進一步地,音標的文本信息被還原成為擬制語音,從而實現語音承載信息的傳遞。
2.根據權利要求1所述的方法,其特征在于: 源語音經過編碼處理后,以音標一一即一種語音代碼一一的文本替代語音音頻本身,使得該段語音信息的存儲、傳輸占用資源大大降低。
3.根據權利要求1所述的方法,其特征在于: 源語音經過編碼處理后,再解碼還原的語音,只能是擬制語音,是對源語音中聲音本身的部分信息有選擇地舍棄,突出了對語音承載的信息中語言信息的保留。
【專利摘要】本發明涉及一種語音編碼方法。通過對源語音按照語言學的音標體系進行分類,并以音標作為中間變量,對源語音進行編碼。源語音經過編碼處理后,以音標——即一種語音代碼——的文本替代語音音頻本身,使得該段語音信息的存儲、傳輸占用資源大大降低。源語音經過編碼處理后,再解碼還原的語音,是擬制語音,是對源語音中聲音本身的部分信息有選擇地舍棄,突出了對語音承載的信息中語言信息的保留。
【IPC分類】G10L19-02
【公開號】CN104575506
【申請號】CN201410386135
【發明人】聞冰, 白青山
【申請人】聞冰, 白青山
【公開日】2015年4月29日
【申請日】2014年8月6日