專利名稱:語音數據處理平臺及系統的制作方法
技術領域:
本實用新型涉及移動通訊技術領域,特別是指一種語音數據處理平臺及系統。
背景技術:
隨著移動通訊技術的發展和電子技術的發展,越來越多客戶端設備(例如移動終端)具有了數據處理功能和數據通訊功能。現有的語音數據處理平臺一般都包括用于與客戶端設備通訊的局端通訊模塊,用于進行語音識別的語音識別模塊。這樣可以將從客戶端設備接收到的語音進行識別后,進行相應的處理。這種方式可以極大的方便使用者的使用。但是對于現有的語音數據處理平臺,只能通過單一的語音向客戶端設備播放信息,這種方式造成用戶體驗感很差。
實用新型內容針對現有的客戶端設備存在的上述缺陷和問題,本實用新型實施例的目的是提出一種能夠降低客戶端設備成本和使用復雜度的語音數據處理平臺及系統。為了達到上述目的,本實用新型實施例提出了一種語音數據處理系統,包括語音數據處理平臺和客戶端;所述系統包括設置于語音數據處理平臺或客戶端的語音識別模塊;所述語音數據處理平臺還包括用于與客戶端進行通訊的局端通訊模塊;數據處理模塊,連接所述局端通訊模塊以對接收到的語音識別模塊識別出的文本進行處理;語音合成模塊,用于將所述數據處理模塊的處理結果生成個性化語音并發送到客戶端;所述客戶端包括用于連接所述局端通訊模塊的客戶端通訊模塊;播放模塊,連接所述客戶端通訊模塊以將所述語音數據處理平臺發送來的語音進行播放。本實用新型實施例還提出了一種語音數據處理平臺,包括用于與客戶端進行通訊的局端通訊模塊;數據處理模塊,連接所述局端通訊模塊以對接收到的語音識別模塊識別出的文本進行處理;語音合成模塊,用于將所述數據處理模塊的處理結果生成個性化語音并發送到客戶端;本實用新型實施例提出了一種語音數據處理平臺、系統,可以采用TTS技術生成個性化語音,從而提高的用戶使用體驗感。
為了更清楚地說明本實用新型實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本實用新型的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。圖I為本實用新型實施例的一種系統的結構示意圖;圖2為本實用新型實施例的另一種系統的結構示意圖;圖3為本實用新型實施例的語音數據處理平臺的結構示意圖。
具體實施方式下面將結合本實用新型的附圖,對本實用新型的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本實用新型一部分實施例,而不是全部的實施例。基于本實用新型中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬于本實用新型保護的范圍。語音合成(Text To Speech),簡稱TTS技術,涉及聲學、語言學、數字信號處理技術、多媒體技術等多個學科技術,是中文信息處理領域的一項前沿技術。語音合成就是一個將文本轉化為語音輸出的過程,這個過程的工作主要是將輸入的文本按字或詞分解為音素,并且對文本中的數字、貨幣單位、單詞變形以及標點等要特殊處理的符號進行分析,以及將音素生成數字音頻然后用揚聲器播放出來或者存為聲音文件以后用多媒體軟件播放。本申請的發明點在于,利用以后的TTS技術來實現個性化語音播放,同時在語音數據處理平臺可以進行翻譯。實施例I本實用新型實施例提出了一種語音數據處理系統,其結構如圖I所示,包括語音數據處理平臺I和客戶端2 ;所述語音數據處理平臺I包括局端通訊模塊11,語音識別模塊12、數據處理模塊13、TTS模塊14 (即語音合成模塊);所述局端通訊模塊11用于連接客戶端2以與客戶端2進行通訊。所述語音識別模塊12連接局端通訊模塊11和數據處理模塊13,以將所述客戶端2發送來的語音進行識另IJ,并將識別后的文本發送到所述數據處理模塊13。所述數據處理模塊13用于接收所述語音識別模塊識別出的文本,并對所述文本繼續進行處理。TTS模塊14,連接所述數據處理模塊13以將處理后的文本轉換為個性化的語音,并通過局端通訊模塊11發送到客戶端2。其中,客戶端可以預先接入該語音數據處理平臺1,對自己喜好的語音類型進行設定。語音數據處理平臺I根據該設定以及該客戶端的唯一標識來確定每個用戶喜好的個性化語音并存儲。這樣以后用戶每次接入時聽到的都是自己喜歡的語音,提高用戶的使用體驗感。申請人:在此需要說明,上述各個模塊均為已有技術,本實用新型的發明點在于將上述各個模塊集中在一起連接形成一個語音數據處理平臺和系統。所述客戶端2包括客戶端通訊模塊21和播放模塊22。客戶端通訊模塊11用于連接局端通訊模塊21,播放模塊22,連接所述客戶端通訊模塊21以將所述語音數據處理平臺I發送來的語音進行播放。[0029]其中,所述數據處理模塊包括機器翻譯單元和/或導航單元。所述機器翻譯單元用于對文本進行多語言翻譯后發送到TTS模塊;所述導航單元用于根據文本生成導航信息后發送到TTS模塊。這樣客戶端可以直接將語音發送到語音數據處理平臺,然后由語音數據處理平臺進行語音識別后,進行相應的處理。該處理可以包括但不限于進行多語言翻譯,進行導航。當然,為了提供更好的服務,該語音數據處理平臺可以設置多個各種單元以完成不同的服務。多語言翻譯、導航只是本實用新型實現的一個具體方式,而非對本實用新型做出的限定。同時,通過語音數據處理平臺I通過TTS模塊14轉換為語音后,還可以將對應的文本也采用郵件/短消息方式發送到客戶端2。更進一步的,所述客戶端包括信號輸送模塊以向機械設備輸送信號以指令機械設備進行固定動作。其中,客戶端可以通過無線或藍牙對連接的機械設備進行信號輸送,以指令機械設備的固定動作輸出(機器玩具)。這樣可以使語音數據處理平臺I通過客戶端對機械設備直接進行控制。·[0032]實施例2本實用新型另一實施例還提出了一種語音數據處理系統,其與第一實施例的區別在于語音識別模塊設置在客戶端。其結構如圖2所示,包括語音數據處理平臺I和客戶端2 ;所述語音數據處理平臺I包括局端通訊模塊11、數據處理模塊13、TTS模塊14 ;所述數據處理模塊13連接局端通訊模塊11,以將客戶端2的語音識別模塊23識別出的文本繼續進行處理。TTS模塊14,連接所述數據處理模塊13以將處理后的文本轉換為個性化的語音,并通過局端通訊模塊11發送到客戶端2。其中,客戶端可以預先接入該語音數據處理平臺1,對自己喜好的語音類型進行設定。語音數據處理平臺I根據該設定以及該客戶端的唯一標識來確定每個用戶喜好的個性化語音并存儲。這樣以后用戶每次接入時聽到的都是自己喜歡的語音,提高用戶的使用體驗感。所述客戶端2包括客戶端通訊模塊21和播放模塊22、語音識別模塊23。客戶端通訊模塊21用于連接局端通訊模塊11,播放模塊22,連接所述客戶端通訊模塊21以將所述語音數據處理平臺I發送來的語音進行播放。客戶端2在接收到用戶的語音后,首先通過語音識別模塊23進行識別后,將識別后的文本通過客戶端通訊模塊21發送到語音數據處理平臺I。語音數據處理平臺I進行相應處理后再通過語音的方式發送到客戶端2。其中,所述數據處理模塊包括機器翻譯單元和/或導航單元。所述機器翻譯單元用于對文本進行多語言翻譯后發送到TTS模塊;所述導航單元用于根據文本生成導航信息后發送到TTS模塊。更進一步的,所述客戶端包括信號輸送模塊以向機械設備輸送信號以指令機械設備進行固定動作。其中,客戶端可以通過無線或藍牙對連接的機械設備進行信號輸送,以指令機械設備的固定動作輸出(機器玩具)。這樣可以使語音數據處理平臺I通過客戶端對機械設備直接進行控制。實施例3本實用新型第三實施例提出了一種語音數據處理平臺,其結構如圖3所示,包括局端通訊模塊11、數據處理模塊13、TTS模塊14 ;[0041]所述數據處理模塊13連接局端通訊模塊11,以將客戶端2的語音識別模塊23識別出的文本繼續進行處理。TTS模塊14,連接所述數據處理模塊13以將處理后的文本轉換為個性化的語音,并通過局端通訊模塊11發送到客戶端2。其中,客戶端可以預先接入該語音數據處理平臺1,對自己喜好的語音類型進行設定。語音數據處理平臺I根據該設定以及該客戶端的唯一標識來確定每個用戶喜好的個性化語音并存儲。這樣以后用戶每次接入時聽到的都是自己喜歡的語音,提高用戶的使用體驗感。其中,所述語音數據處理平臺I還包括語音識別模塊12,所述語音識別模塊12分別連接所述局端通訊模塊11和數據處理模塊13,以將所述客戶端發送來的語音進行識別,并將識別后的文本發送到所述數據處理模塊13。以上所述,僅為本實用新型的具體實施方式
,但本實用新型的保護范圍并不局限于此,任何熟悉本技術領域的技術人員在本實用新型揭露的技術范圍內,可輕易想到變化或替換,都應涵蓋在本實用新型的保護范圍之內。因此,本實用新型的保護范圍應所述以權利要求的保護范圍為準。
權利要求1.一種語音數據處理系統,其特征在于,包括語音數據處理平臺和客戶端;所述系統包括設置于語音數據處理平臺或客戶端的語音識別模塊; 所述語音數據處理平臺還包括 用干與客戶端進行通訊的局端通訊模塊; 數據處理模塊,連接所述局端通訊模塊以對接收到的語音識別模塊識別出的文本進行處理; 語音合成模塊,用于將所述數據處理模塊的處理結果生成個性化語音并發送到客戶端; 所述客戶端包括 用于連接所述局端通訊模塊的客戶端通訊模塊; 播放模塊,連接所述客戶端通訊模塊以將所述語音數據處理平臺發送來的語音進行播放。
2.根據權利要求I所述的語音數據處理系統,其特征在于,所述數據處理模塊包括機器翻譯單元和/或導航單元; 所述機器翻譯單元用于對文本進行多語言翻譯后發送到語音合成模塊; 所述導航単元用于根據文本生成導航信息后發送到語音合成模塊。
3.根據權利要求I或2所述的語音數據處理系統,其特征在于,所述語音識別模塊設置于所述客戶端,所述語音識別模塊連接所述客戶端通訊模塊以將識別后的語音發送到所述語音數據處理平臺。
4.根據權利要求I或2所述的語音數據處理系統,其特征在于,所述語音識別模塊設置于所述語音數據處理平臺,所述語音識別模塊分別連接所述局端通訊模塊和數據處理模塊,以將所述客戶端發送來的語音進行識別,并將識別后的文本發送到所述數據處理模塊。
5.根據權利要求I所述的語音數據處理系統,其特征在于,所述客戶端包括信號輸送模塊以向機械設備輸送信號以指令機械設備進行固定動作。
6.一種語音數據處理平臺,其特征在于,包括 用干與客戶端進行通訊的局端通訊模塊; 數據處理模塊,連接所述局端通訊模塊以對接收到的語音識別模塊識別出的文本進行處理; 語音合成模塊,用于將所述數據處理模塊的處理結果生成個性化語音并發送到客戶端。
7.根據權利要求6所述的語音數據處理平臺,其特征在于,所述數據處理模塊包括機器翻譯單元和/或導航單元; 所述機器翻譯單元用于對文本進行多語言翻譯后發送到語音合成模塊; 所述導航単元用于根據文本生成導航信息后發送到語音合成模塊。
8.根據權利要求6或7所述的語音數據處理平臺,其特征在于,所述語音數據處理平臺還包括 語音識別模塊,所述語音識別模塊分別連接所述局端通訊模塊和數據處理模塊,以將所述客戶端發送來的語音進行識別,并將識別后的文本發送到所述數據處理模塊。
專利摘要本實用新型提供了一種語音數據處理平臺及系統。所述系統包括語音數據處理平臺和客戶端;所述系統包括設置于語音數據處理平臺或客戶端的語音識別模塊;所述語音數據處理平臺包括用于與客戶端進行通訊的局端通訊模塊;數據處理模塊,連接所述局端通訊模塊以對接收到的語音識別模塊識別出的文本進行處理;語音合成模塊,用于將所述數據處理模塊的處理結果生成個性化語音并發送到客戶端;所述客戶端包括用于連接所述局端通訊模塊的客戶端通訊模塊;播放模塊,連接所述客戶端通訊模塊以將所述語音數據處理平臺發送來的語音進行播放。本實用新型可以采用TTS技術生成個性化語音,從而提高的用戶使用體驗感。
文檔編號G10L13/00GK202587038SQ20122015175
公開日2012年12月5日 申請日期2012年4月11日 優先權日2012年4月11日
發明者沈嘉鑫, 許軍, 邵穎, 王鋼 申請人:上海車音網絡科技有限公司