一種多傳輸方式的tts語音合成系統及方法
【技術領域】
[0001]本發明屬于聲學及數字信號處理技術領域,具體涉及一種多傳輸方式的TTS語音合成系統及方法的設計。
【背景技術】
[0002]語音合成(Text To Speech),簡稱TTS技術,涉及聲學、語言學、數字信號處理技術、多媒體技術等多個學科技術,是中文信息處理領域的一項前沿技術。
[0003]語音合成就是一個將文本轉化為語音輸出的過程,這個過程的工作主要是將輸入的文本按字或詞分解為音素,并且對文本中的數字、貨幣單位、單詞變形以及標點等要特殊處理的符號進行分析,以及將音素生成數字音頻然后用揚聲器播放出來或者存為聲音文件后用多媒體軟件播放。
[0004]與一些用預先錄制的聲音文件實現發聲的應用程序相比,TTS的發聲引擎只有幾兆大小,不需要大量的聲音文件支持,因此可以節省很大的存儲空間,并且可以朗讀預先未知的任何語句。目前市場上現有的TTS語音合成技術應用也非常廣泛,如車載信息終端語音播報,公交報站,考勤機,語音電子書等。
[0005]隨著現代技術的不斷發展,通訊方式也是多種多樣,各具特色。目前通訊方式大體可分為有線通訊傳輸方式和無線通訊傳輸方式兩類。現廣泛應用的有線通訊傳輸方式有:RS232、RS485、USB、以太網等;無線通訊方式有:GPRS/GSM、藍牙、WIF1、ZigBee、433MHZ 無線通訊等。這些通訊方式的傳輸速率也在幾Kbps到幾十Mbps不等,即使是幾Kbps的傳輸速率對傳輸文字信息來說也已經是綽綽有余了,因此針對不同的需求可以選擇不同的通訊方式。
[0006]現有技術中,具有語音播報的設備都是將語音合成器集成在系統設備內部,需要內部處理器進行判斷控制TTS語音合成,而不能單獨獨立出來進行遠程數據傳輸再合成語音進行播報。在現代農業物聯網高速發展的時代里,比如溫室大棚里的溫濕度光照采集器采集到了數據,需要將這些數據用語音的方式報告給溫室里的管理員,如果每一個采集器都集成一個語音合成器,不僅在系統安裝與操作時非常麻煩,也會極大地浪費成本。
【發明內容】
[0007]本發明的目的是為了解決現有技術中具有語音播報的設備不能單獨獨立出來進行遠程數據傳輸再合成語音進行播報的問題,提出了一種多傳輸方式的TTS語音合成系統及方法。
[0008]本發明的技術方案為:一種多傳輸方式的TTS語音合成系統,包括文字信息處理模塊、通訊模塊、TTS語音合成模塊、音頻功率放大模塊以及揚聲器模塊;文字信息處理模塊與TTS語音合成模塊之間模塊化分離,并通過通訊模塊傳輸需要合成語音的文本信息,TTS語音合成模塊將文本合成語音后輸出音頻信號,音頻信號再經音頻功率放大模塊放大后輸出到揚聲器模塊發聲。
[0009]優選地,通訊模塊包括有線通訊模塊和無線通訊模塊。
[0010]優選地,有線通訊模塊包括RS232通訊模塊、RS485通訊模塊、USB通訊模塊、以太網通訊模塊,無線通訊模塊包括GPRS/GSM無線模塊、WIFI無線模塊、藍牙無線模塊、2.4G無線模塊、433M無線模塊、ZigBee無線模塊。
[0011]優選地,TTS語音合成模塊包括一個通用有線通訊模塊接口和一個通用無線通訊模塊接口,用于插接各種有線轉串口和無線轉串口的通訊模塊。
[0012]本發明還提供了一種多傳輸方式的TTS語音合成方法,包括以下步驟:
[0013]S1、文字信息處理模塊生成需要合成語音的文本信息;
[0014]S2、通訊模塊將文本信息傳輸至TTS語音合成模塊;
[0015]S3、TTS語音合成模塊將文本信息合成為語音信號;
[0016]S4、音頻功率放大模塊對語音信號進行功率放大;
[0017]S5、揚聲器模塊播放語音。
[0018]本發明的有益效果是:本發明將TTS語音合成系統中的主處理器和語音合成器模塊化分離,獨立形成一套適用于多種場合、具有多種傳輸方式的TTS語音合成器廣播系統,中間應用無線或有線的通訊方式直接傳輸文字信息,使得該TTS語音合成系統可靈活應用于各種場景。
【附圖說明】
[0019]圖1為本發明提供的一種多傳輸方式的TTS語音合成系統框圖。
[0020]圖2為本發明實施例1的TTS語音合成方法流程圖。
[0021]圖3為本發明實施例2的TTS語音合成方法流程圖。
[0022]圖4為本發明實施例3的TTS語音合成方法流程圖。
【具體實施方式】
[0023]下面結合附圖對本發明的實施例作進一步的說明。
[0024]本發明提供了一種多傳輸方式的TTS語音合成系統,如圖1所示,包括文字信息處理模塊、通訊模塊、TTS語音合成模塊、音頻功率放大模塊以及揚聲器模塊;文字信息處理模塊與TTS語音合成模塊之間模塊化分離,并通過通訊模塊傳輸需要合成語音的文本信息,TTS語音合成模塊將文本合成語音后輸出音頻信號,音頻信號再經音頻功率放大模塊放大后輸出到揚聲器模塊發聲。
[0025]其中,文字信息處理模塊為各類能夠發送文字信息的設備,如手機、個人電腦、各種數據采集終端等。
[0026]通訊模塊用于將文字信息處理模塊中需要合成語音的文本信息傳輸到TTS語音合成模塊,可分為有線通訊模塊和無線通訊模塊。有線通訊模塊包括RS232通訊模塊、RS485通訊模塊、USB通訊模塊、以太網通訊模塊;無線通訊模塊包括GPRS/GSM無線模塊、WIFI無線模塊、藍牙無線模塊、2.4G無線模塊、433M無線模塊、ZigBee無線模塊。
[0027]為了能夠從各種通訊模塊中獲取需要合成語音的文本信息,本發明在TTS語音合成模塊里設計了一個通用有線通訊模塊接口和一個通用無線通訊模塊接口,用于插接各種有線轉串口和無線轉串口的通訊模塊。
[0028]隨著TTS語音合成技術的不斷發展,TTS語音合成器不斷集成化,現有技術中通常將TTS語音合成器集成在一個非常小的芯片里。本發明實施例中TTS語音合成模塊選用SYN6288語音合成器,該芯片具有如下特點:
[0029](I)支持 GB2312、GBK、BIG5 和 UNICODE 內碼格式的文本;
[0030](2)具有清晰、自然、準確的中文語音合成效果,可合成任意的中文文本,并支持英文字母的合成;
[0031](3