一種發送消息的播放方法、系統及相關設備的制作方法
【專利摘要】本發明實施例公開了消息播放方法、系統及設備,應用于通信【技術領域】。本發明實施例中,接收終端在接收到包括用戶標識和文本信息的消息,獲取用戶標識對應的語音標識和圖像標識,并獲取根據語音標識指示的語音特征參數、圖像標識指示的圖像特征參數及文本信息生成或獲取語音動畫流并播放該語音動畫流。使得可以將消息中的文本信息根據用戶標識播放成語音動畫流,既可以生動地展示消息中的文本信息,又可以根據用戶標識對應的語音標識和圖像標識對消息進行個性化展示。
【專利說明】一種發送消息的播放方法、系統及相關設備
【技術領域】
[0001]本發明涉及通信【技術領域】,特別涉及發送消息的播放方法、系統及相關設備。
【背景技術】
[0002]在現有的通信過程中,接收消息的一端對發送消息的展示一般采用直接展示,t匕如將發送消息中的文本信息解析后進行顯示,或將發送消息中的媒體流解析后進行播放等,但是這種展示方法比較單一,無法滿足用戶對發送消息展示的需求。
【發明內容】
[0003]本發明實施例提供了發送消息的播放方法、系統及相關設備,對發送消息進行個性化的展示,用于解決現有技術存在著的展示方式單一的問題。
[0004]本發明實施例第一方面提供一種消息播放方法,應用于終端設備,所述方法包括:
[0005]接收消息,所述消息中包括用戶標識和文本信息;
[0006]獲取與所述用戶標識對應的語音標識和圖像標識,所述語音標識用于指示語音特征參數,所述圖像標識用于指示圖像特征參數;
[0007]根據所述語音標識指示的語音特征參數,所述圖像標識指示的圖像特征參數以及所述文本信息生成或獲取語音動畫流并播放所述語音動畫流。
[0008]本發明實施例第一方面的第一種可能的實現方式中,所述接收消息之前還包括:
[0009]提供設置界面,所述設置界面用于接收所述用戶標識與所述語音標識以及所述圖像標識之間的對應關系;
[0010]從所述設置界面上接收所述用戶標識與所述語音標識以及所述圖像標識之間的對應關系并儲存所述對應關系;
[0011]所述獲取與所述用戶標識對應的語音標識和圖像標識包括:
[0012]根據存儲的對應關系獲取與所述用戶標識對應的所述語音標識和所述圖像標識。
[0013]結合本發明實施例第一方面,或第一方面的第一種可能實現方式,在本發明實施例第一方面的第二種可能的實現方式中,所述根據所述語音標識指示的語音特征參數,所述圖像標識指示的圖像特征參數以及所述文本信息生成語音動畫流,具體包括:
[0014]所述終端設備獲取所述語音標識指示的語音特征參數,及獲取所述圖像標識指示的圖像特征參數;
[0015]所述終端設備根據所述語音標識指示的語音特征參數將所述文本信息轉換成音素時間序列和語音流;
[0016]所述終端設備根據所述音素時間序列及所述圖像標識指示的圖像特征參數生成動畫流;
[0017]所述終端設備將所述語音流及所述動畫流同步合成語音動畫流。
[0018]結合本發明實施例第一方面的第二種可能實現方式,在本發明實施例第一方面的第三種可能的實現方式中,所述接收消息之前還包括:
[0019]獲取圖像樣本和語音樣本;
[0020]提取獲取圖像樣本的圖像特征參數,按第一對應關系儲存所述圖像特征參數與圖像標識;
[0021]提取獲取語音樣本的語音特征參數,按第二對應關系儲存所述語音特征參數與語音標識;
[0022]所述獲取所述語音標識指示的語音特征參數,及圖像標識指示的圖像特征參數包括:根據所述第二對關系獲取所述語音標識指示的語音特征參數,根據所述第一對應關系獲取所述圖像標識指示的圖像特征參數。
[0023]結合本發明實施例第一方面,或第一方面第一種可能實現方式,在本發明實施例第一方面的第四種可能的實現方式中,所述根據所述語音標識指示的語音特征參數,所述圖像標識指示的圖像特征參數以及所述文本信息獲取語音動畫流包括:
[0024]將所述語音標識和圖像標識發送給服務器,以指示所述服務器根據所述語音標識指示的語音特征參數、所述圖像標識指示的圖像特征參數及文本信息生成所述文本信息的語音動畫流;
[0025]獲取所述服務器發送的語音動畫流。
[0026]結合本發明實施例第一方面的第四種可能實現方式,在本發明實施例第一方面的第五種可能的實現方式中,所述接收消息之前還包括:
[0027]獲取圖像樣本和語音樣本;
[0028]將所述圖像樣本發送給服務器,以指示所述服務器提取所述圖像樣本的圖像特征參數,并按第一對應關系儲存所述圖像特征參數與圖像標識;
[0029]將獲取的語音樣本發送給服務器,以指示所述服務器提取所述語音樣本的語音特征參數,并按第二對應關系儲存所述語音特征參數與所述語音標識。
[0030]本發明實施例第二方面提供一種消息播放方法,應用于網絡服務器,所述方法包括:
[0031]接收發送終端發送的消息,所述消息中包括文本信息和所述發送終端對應用戶的用戶標識;
[0032]根據預先存儲的用戶標識與語音標識和圖像標識的對應關系,獲取與所述發送終端發送的用戶標識對應的語音標識以及圖像標識,所述語音標識用于指示語音特征參數,所述圖像標識用于指示圖像特征參數;
[0033]根據所述發送終端發送的用戶標識對應的語音標識指示的語音特征參數、以及圖像標識指示的圖像特征參數,以及所述文本信息生成語音動畫流;
[0034]將生成的所述語音動畫流發送給接收終端,使得所述接收終端收到后播放所述語音動畫流。
[0035]在本發明實施例第二發明的第一種實現方式中,所述根據所述發送終端發送的用戶標識對應的語音標識指示的語音特征參數、以及圖像標識指示的圖像特征參數,以及所述文本信息生成語音動畫流,具體包括:
[0036]獲取所述語音標識指示的語音特征參數,及獲取所述圖像標識指示的圖像特征參數;[0037]根據所述語音標識指示的語音特征參數將所述文本信息轉換成音素時間序列和語音流;
[0038]根據所述音素時間序列及所述圖像標識指示的圖像特征參數生成動畫流;
[0039]將所述語音流及所述動畫流同步合成語音動畫流。
[0040]結合本發明實施例第二方面的第一種可能實現方式,在本發明實施例第二方面的第二種可能的實現方式中,所述接收終端設備發送的消息之前還包括:
[0041]接收終端設備發送的圖像樣本和語音樣本;
[0042]提取所述圖像樣本的圖像特征參數,按第一對應關系儲存所述圖像特征參數與圖像標識;
[0043]提取所述語音樣本的語音特征參數,按第二對應關系儲存所述語音特征參數與圖像標識;
[0044]所述獲取所述語音標識指示的語音特征參數具體包括:根據所述第二對關系獲取所述語音標識指示的語音特征參數;所述獲取所述圖像標識指示的圖像特征參數具體包括:根據所述第一對應關系獲取所述圖像標識指示的圖像特征參數。
[0045]本發明實施例第三方面提供一種終端設備,包括:
[0046]消息接收單元,用于接收消息,所述消息中包括用戶標識和文本信息;
[0047]標識獲取單元,用于獲取與所述消息接收單元接收的發送消息中用戶標識對應的語音標識和圖像標識,所述語音標識用于指示在生成語音動畫流時,用于生成所述語音動畫流中的語音所需的語音特征參數,所述圖像標識用于指示生成所述語音動畫流時,用于生成所述語音動畫流中的圖像所需的圖像特征參數;
[0048]媒體流獲取單元,用于根據所述語音標識指示的語音特征參數、所述圖像標識指示的圖像特征參數及文本信息生成或獲取語音動畫流;
[0049]播放單元,用于播放所述媒體流獲取單元生成或獲取的語音動畫流。
[0050]結合本發明實施例第三方面第一種可能實現方式中,所述終端設備還包括:
[0051]界面提供單元,用于提供設置界面,所述設置界面用于接收所述用戶標識與所述語音標識以及所述圖像標識之間的對應關系;
[0052]第一對應關系儲存單元,用于從所述設置界面上接收所述用戶標識與所述語音標識以及所述圖像標識之間的對應關系并儲存所述對應關系;
[0053]所述標識獲取單元,具體用于根據所述第一對應關系儲存單元儲存的對應關系獲取所述語音標識和圖像標識。
[0054]結合本發明實施例第三方面,或第三面的第一種可能實現方式,在本發明實施例第三方面的第二種實現方式中,所述媒體流獲取單元具體包括:
[0055]特征獲取單元,獲取所述標識獲取單元獲取的語音標識指示的語音特征參數,及獲取所述標識獲取單元獲取的圖像標識指示的圖像特征參數;
[0056]語音流生成單元,用于根據所述語音標識指示的語音特征參數將所述文本信息轉換成音素時間序列和語音流;
[0057]動畫流生成單元,用于根據所述語音流生成單元生成的音素時間序列及所述圖像標識指示的圖像特征參數生成動畫流;
[0058]同步單元,用于將所述語音流及所述動畫流同步合成語音動畫流。[0059]結合本發明實施例第三方面第二種可能實現方式,在本發明實施例第三方面的第三種實現方式中,所述終端設備還包括:
[0060]第二對應關系儲存單元,用于獲取圖像樣本,并提取獲取所述圖像樣本的圖像特征參數,按第一對應關系儲存所述圖像特征參數與圖像標識;及用于獲取語音樣本,并提取獲取語音樣本的語音特征參數,按第二對應關系儲存所述語音特征參數與語音標識;
[0061]所述特征獲取單元,具體用于分別根據所述第二對應關系儲存單元儲存的第一對應關系和第二對應關系,獲取所述圖像標識指示的圖像特征參數和所述語音標識指示的語音特征參數。
[0062]結合本發明實施例第三方面,或第三面的第一種可能實現方式,在本發明實施例第三方面的第四種實現方式中,所述媒體流獲取單元具體包括:
[0063]標識發送單元,用于將所述語音標識和圖像標識發送給服務器,以指示所述服務器根據所述語音標識指示的語音特征參數、所述圖像標識指示的圖像特征參數及文本信息生成所述文本信息的語音動畫流;
[0064]發送媒體流獲取單元,用于獲取所述服務器發送的語音動畫流。
[0065]結合本發明實施例第三方面第四種可能實現方式,在本發明實施例第三方面的第五種實現方式中,所述終端設備還包括:
[0066]樣本發送單元,用于獲取圖像樣本,將獲取的圖像樣本發送給服務器,以指示所述服務器提取所述圖像樣本的圖像特征參數,并按第一對應關系儲存所述圖像特征參數與圖像標識;及用于獲取語音樣本,并將獲取的語音樣本發送給服務器,以指示所述服務器提取所述語音樣本的語音特征參數,并按第二對應關系儲存所述語音特征參數與圖像標識。
[0067]本發明實施例第四方面提供一種服務器,包括:
[0068]發送消息接收單元,用于接收發送終端發送的消息,所述消息中包括文本信息和所述發送終端對應用戶的用戶標識;
[0069]媒體標識獲取單元,用于根據預先存儲的用戶標識與語音標識和圖像標識的對應關系,獲取與所述發送終端發送的用戶標識對應的語音標識以及圖像標識,所述語音標識用于指示語音特征參數,所述圖像標識用于指示圖像特征參數;
[0070]媒體流生成單元,用于根據所述發送終端發送的用戶標識對應的語音標識指示語音特征參數、圖像標識指示的圖像特征參數,以及所述文本信息生成語音動畫流;
[0071]媒體流發送單元,用于將生成的所述語音動畫流發送給接收終端,使得所述接收終端收到后播放所述語音動畫流。
[0072]在本發明實施例第四方面的第一種可能的實現方式中,所述媒體流生成單元具體包括:
[0073]媒體特征獲取單元,用于獲取所述語音標識指示的語音特征參數,及獲取所述圖像標識指示的圖像特征參數;
[0074]轉換單元,用于根據所述語音標識指示的語音特征參數將所述文本信息轉換成音素時間序列和語音流;
[0075]生成單元,用于根據所述音素時間序列及所述圖像標識指示的圖像特征參數生成動畫流;
[0076]合成單元,用于將所述語音流及所述動畫流同步合成語音動畫流。[0077]結合本發明實施例第四方面的第一種可能實現方式,在本發明實施例第四方面的第二種可能的實現方式中,所述服務器還包括:
[0078]樣本接收單元,用于接收終端設備發送的圖像樣本和語音樣本;
[0079]對應關系儲存單元,用于提取所述圖像樣本的圖像特征參數,并按第一對應關系儲存所述圖像特征參數與圖像標識,及提取所述語音樣本的語音特征參數,并按第二對應關系儲存所述語音特征參數與圖像標識;
[0080]所述媒體特征獲取單元,具體用于根據所述第二對關系獲取所述語音標識指示的語音特征參數;且根據所述第一對應關系獲取所述圖像標識指示的圖像特征參數。
[0081]本發明實施例第五方面提供一種消息播放系統,包括接收終端和服務器;
[0082]所述接收終端是如上述本發明實施例第三方面的第四種或第五種實現方式所述的終端設備;
[0083]所述服務器,用于根據所述語音標識指示的語音特征參數、所述圖像標識指示的圖像特征參數及文本信息生成所述文本信息的語音動畫流并發送給所述接收終端。
[0084]本發明實施例第六方面提供一種消息播放系統,包括接收終端和網絡服務器;
[0085]所述網絡服務器是如上述權利要求本發明實施例第四方面到第四方面的第二種實現方式的服務器中任一種方式所述的服務器;
[0086]所述接收終端,用于接收所述網絡服務器發送的語音動畫流,并播放所述語音動畫流。
[0087]本發明實施例中,接收終端在接收到包括用戶標識和文本信息的消息,獲取用戶標識對應的語音標識和圖像標識,并根據語音標識指示的語音特征參數、圖像標識指示的圖像特征參數及文本信息生成或獲取語音動畫流并播放該語音動畫流。使得可以將消息中的文本信息根據用戶標識播放成語音動畫流,既可以生動地展示消息中的文本信息,又可以根據用戶標識對應的語音標識和圖像標識對消息進行個性化展示。
【專利附圖】
【附圖說明】
[0088]為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。
[0089]圖1是本發明實施例提供的一種發送消息播放方法的流程圖;
[0090]圖2是本發明實施例中生成語音動畫流的結構示意圖;
[0091]圖3是本發明實施例提供的另一種消息播放方法的流程圖;
[0092]圖4是本發明具體應用實施例中提供的一種發送消息的播放方法結構示意圖;
[0093]圖5是本發明實施例中終端設備提供的設置界面的示意圖;
[0094]圖6是本發明具體應用實施例中提供的另一種發送消息播放方法的結構示意圖;
[0095]圖7是本發明具體應用實施例中提供的另一種發送消息播放方法的結構示意圖;
[0096]圖8是本發明實施例提供的一種終端設備的結構示意圖;
[0097]圖9是本發明實施例提供的另一種終端設備的結構示意圖;
[0098]圖10是本發明實施例提供的另一種終端設備的結構示意圖;[0099]圖11是本發明實施例提供的另一種終端設備的結構示意圖;
[0100]圖12是本發明實施例提供的一種服務器的結構示意圖;
[0101]圖13是本發明實施例提供的另一種服務器的結構示意圖;
[0102]圖14是本發明實施例提供的另一種服務器的結構示意圖。
【具體實施方式】
[0103]下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
[0104]本發明實施例提供一種消息播放方法,主要是對于進行通信的終端設備,當接收終端接收到發送終端發送的發送消息后進行的播放,比如當手機I接收到手機2發送的短消息,對該短消息的播放,本實施例的方法是接收終端即接收消息的終端設備所執行的方法,流程圖如圖1所示,包括:
[0105]步驟101,接收終端接收發送終端發送的消息比如短消息等,在消息中包括發送終端對應用戶的用戶標識和文本信息。
[0106]步驟102,接收終端獲取與用戶標識對應的語音標識和圖像標識,這里語音標識是用于指示語音特征參數,而圖像標識用于指示圖像特征參數。
[0107]可以理解,當接收終端接收到消息后,解析該消息得到能唯一標識一個用戶的用戶標識,比如在發送終端上使用的用戶識別模塊(Subscriber IdentityModel, SIM)的號碼,或用戶注冊賬號等,并可以在接收終端中查找預置的與該用戶標識對應的語音標識和圖像標識,其中在接收終端中可以預先儲存不同用戶標識對應的語音標識和圖像標識,t匕如儲存陌生聯系人及接收終端中各個聯系人對應的語音標識和圖像標識等。
[0108]具體地,接收終端可以通過如下的步驟來設置語音標識和圖像標識:
[0109]A:用戶操作該接收終端的按鍵(包括物理按鍵或觸摸按鍵),使得接收終端提供設置界面,該設置界面用于接收某一用戶標識與語音標識以及圖像標識之間的對應關系,在該設置界面上可以包括該用戶標識,及該用戶標識對應的語音標識和圖像標識的選擇信息,比如選擇接收終端中儲存的哪個圖像標識和語音標識的信息等。
[0110]其中圖像標識為唯一標識數據庫中某一圖像特征參數的信息,即在數據庫中將圖像標識與圖像特征參數進行綁定儲存,語音標識為唯一標識數據庫中某一語音特征參數的信息,即在數據庫中將語音標識與語音特征參數進行綁定儲存。而圖像特征是指某一圖像向用戶所表現出的屬性比如顏色、線條和輪廓等屬性,具體可以通過圖像特征參數來表示比如像素等參數,語音特征是指某一段語音向用戶所表現出的屬性,比如音色、音調和音量,具體可以通過語音特征參數來表示,比如基音、梅爾倒譜參數、共振峰參數等參數。
[0111]B:用戶選擇某一圖像標識和語音標識后,當接收終端從設置界面上接收到上述用戶標識對應用戶選擇的語音標識和圖像標識,儲存該用戶標識與選擇的語音標識和圖像標識之間的對應關系。這樣接收終端可以根據步驟B儲存的對應關系中獲取與步驟101中接收的消息中的用戶標識對應的語音標識和圖像標識。
[0112]步驟103,根據上述語音標識指示的語音特征參數、圖像標識指示的圖像特征參數及文本信息生成或獲取語音動畫流并播放該語音動畫流。
[0113]需要說明的是,接收終端可以自己根據語音特征參數和圖像特征參數生成語音動畫流;也可以將語音特征參數和圖像特征參數發送給服務器,由服務器來生成語音動畫流并返回給接收終端進行播放,這種情況下,接收終端不用生成語音動畫流,減輕了接收終端的運作負擔。
[0114]接收終端或服務器在生成語音動畫流時,需要先獲取語音標識指示的語音特征參數及圖像標識指示的圖像特征參數;然后再根據語音動畫技術來生成語音動畫流,其中,在獲取圖像特征參數和語音特征參數時,可以在接收端終或服務器端的數據庫中進行查找。
[0115]而接收終端或服務器根據語音動畫技術生成語音動畫流時,具體可以通過TTS模塊、動畫模塊和同步合成模塊來實現,結構示意圖如圖2所示,主要是將文本轉語音(Textto Speech, TTS)技術和動畫技術結合起來,其中TTS主要是將文字信息實時轉化為標準流暢的語音朗讀出來的技術,動畫技術主要是運用計算機技術合成特定圖像的運動,比如在人臉動畫技術中包括人臉建模和人臉表情動畫生成等。本實施例中,TTS模塊可以根據語音標識指示的語音特征參數將文本信息轉換成語音流及文本信息對應的音素時間序列比如在語音流中讀文本信息中每個文字的時間順序及每個文字之間間隔等信息;動畫模塊可以根據音素時間序列及與圖像特征參數生成動畫流,具體地,可以先根據圖像特征參數進行圖像建模,然后確定語音流中讀文本信息中每個文字時圖像的運動狀態,從而根據因素時間序列形成動畫流;最后同步合成模塊將語音流和動畫流同步合成語音動畫流。
[0116]可見,本發明實施例中,接收終端在接收到包括用戶標識和文本信息的消息,獲取了用戶標識對應的語音標識和圖像標識,并根據語音標識指示的語音特征參數、圖像標識指示的圖像特征參數及文本信息生成或獲取語音動畫流并播放該語音動畫流。使得可以將消息中的文本信息根據用戶標識播放成語音動畫流,既可以生動地展示消息中的文本信息,又可以根據用戶標識對應的語音標識和圖像標識對消息進行個性化展示。
[0117]需要說明的是,接收終端在執行上述步驟103時,可以是由接收終端來生成語音動畫流,這樣就需要接收終端確定語音標識指示的語音特征參數和圖像標識指示的圖像特征參數,而這些語音特征參數和圖像特征參數可以是用戶預置在接收終端中的,具體地,接收終端在預置圖像特征參數時,可以先獲取一個圖像樣本,比如通過攝像頭或在本地查找一個圖像樣本,并提取該圖像樣本的圖像特征參數比如用于表示顏色和線條等特征的參數,將提取的圖像特征參數通過圖像標識來唯一標識,按第一對應關系儲存圖像特征參數與圖像標識;接收終端在預置語音特征參數時,可以先獲取語音樣本比如通過錄音器或在本地查找一個語音樣本,并提取該語音樣本的語音特征參數比如用于表示音色、音調和音量等特征的參數,將提取的語音特征參數通過語音標識來唯一標識,并按第二對應關系儲存語音特征參數與語音標識。這樣接收終端在獲取語音標識指示的語音特征參數時,會根據上述儲存的第二對關系獲取步驟102中獲取的語音標識指示的語音特征參數,在獲取圖像標識指示的圖像特征參數時,會根據上述儲存的第一對應關系獲取步驟102中獲取的圖像標識指示的圖像特征參數。
[0118]在另一個具體的實施例中,接收終端在執行上述步驟103時,可以是由接收終端先將步驟102中獲取的語音標識和圖像標識發送給服務器,由服務器來生成語音動畫流,這樣服務器需要確定語音標識指示的語音特征參數和圖像標識指示的圖像特征參數,而這些語音特征參數和圖像特征參數可以是由接收終端通過網絡在服務器中預置的,具體地:接收終端可以先獲取圖像樣本,并將圖像樣本發送給服務器,以指示服務器提取圖像樣本的圖像特征參數,并在服務器中按第一對應關系儲存圖像特征參數與圖像標識;且接收終端還可以將獲取語音樣本,并將語音樣本發送給服務器,以指示服務器提取語音樣本的語音特征參數,并在服務器中按第二對應關系儲存語音特征參數與語音標識。這樣服務器可以根據語音特征參數、圖像特征參數和文本信息生成語音動畫流。
[0119]本發明實施例提供一種消息播放方法,主要是對于進行通信的終端設備,發送終端通過網絡服務器將消息發送給接收終端進行播放,比如當手機I通過網絡服務器接收到手機2發送的短消息,對該短消息的播放,本實施例的方法是網絡服務器所執行的方法,其中該網絡服務器可以是發送終端到接收終端路徑中的任一網絡設備,流程圖如圖3所示,包括:
[0120]步驟201,網絡服務器接收發送終端(比如手機)發送的消息比如短消息等,在消息中包括發送終端對應用戶的用戶標識和文本信息。
[0121]步驟202,網絡服務器根據預先存儲的用戶標識與語音標識和圖像標識的對應關系,獲取與發送終端發送的用戶標識對應的語音標識和圖像標識,這里語音標識是用于指示語音特征參數,而圖像標識用于指示圖像特征參數。
[0122]可以理解,當發送終端在發送消息給接收終端的過程中,該消息經過網絡服務器后,該網絡服務器解析該消息得到能唯一標識發送終端對應用戶的用戶標識,比如在發送終端上使用的SM卡號碼即手機號碼等,并可以在網絡服務器預置的對應關系中查找與發送終端發送的用戶標識對應的語音標識和圖像標識,其中在網絡服務器中可以預先儲存不同用戶標識對應的語音標識和圖像標識,這些信息可以是接收終端通過網絡預置到網絡服務器中的,比如接收終端可以將接收終端中儲存的各個聯系人對應的語音標識和圖像標識同步到網路側。
[0123]步驟203,網絡服務器根據上述語音標識指示的語音特征參數、圖像標識指示的圖像特征參數,以及文本信息生成語音動畫流。其中網絡服務器具體在生成語音動畫流時,需要先獲取語音標識指示的語音特征參數和獲取圖像標識指示的圖像特征參數;然后再根據語音動畫技術來生成語音動畫流,具體地可以通過TTS模塊、動畫模塊和同步合成模塊來實現,具體生成的流程與上述接收終端生成語音動畫流的過程類似,在此不進行贅述。
[0124]其中,網絡服務器獲取的圖像特征參數和語音特征參數可以是分別根據接收終端提供的圖像樣本和語音樣本預置在網絡服務器中的,具體地,網絡服務器可以接收上述接收終端發送的圖像樣本,并提取該圖像樣本的圖像特征參數,將提取的圖像特征參數通過圖像標識來唯一標識,并按第一對應關系儲存圖像特征參數與圖像標識;網絡服務器還可以接收上述接收終端發送的語音樣本,并提取該語音樣本的語音特征參數,將提取的語音特征參數通過語音標識來唯一標識,并按第二對應關系儲存語音特征參數與語音標識。這樣網絡服務器在獲取語音標識指示的語音特征參數時,會根據上述儲存的第二對關系獲取步驟202中獲取的語音標識指示的語音特征參數,在獲取圖像標識指示的圖像特征參數時,會根據上述儲存的第一對應關系獲取步驟202中獲取的圖像標識指示的圖像特征參數。
[0125]步驟204,網絡服務器將生成的語音動畫流發送給接收終端,使得接收終端收到后播放該語音動畫流。
[0126]本發明實施例中,當包括發送終端對應的用戶標識和文本信息的消息從發送終端發送到接收終端的過程中,在經過網絡服務器時,由網絡服務器獲取用戶標識對應的語音標識和圖像標識,并生成的語音動畫流后將生成的語音動畫流發送給接收終端播放,其中語音動畫流是服務器根據語音標識指示的語音特征參數、圖像標識指示的圖像特征參數及文本信息生成的。使得可以將消息中的文本信息根據用戶標識播放成語音動畫流,既可以生動地展示消息中的文本信息,又可以根據用戶標識對應的語音標識和圖像標識對消息進行個性化展示;且本實施例中,不用接收終端生成語音動畫流,減輕了終端的負擔。
[0127]以下以一個具體的實施例來說明本發明實施例中所述的消息播放方法,參考圖4所示,本實施例的接收終端中包括短信處理模塊、參數配置模塊、模板制作模塊、語音動畫引擎和語音動畫播放器,其中:
[0128]參數配置模塊可以設置通訊錄中每個聯系人對應的人臉圖像標識和語音標識,具體地,用戶通過操作接收終端使得參數配置模塊提供對通訊錄中聯系人信息進行設置的設置界面,如圖5所示,用戶可以編輯聯系人的姓名、電話和郵箱,且還可以通過選擇的方式來選擇發音人的標識即語音標識,和選擇人臉圖像的標識即圖像標識,具體地,用戶可以在一個下拉的菜單中進行選擇,其中下拉菜單中顯示的圖像標識或語音標識都已經是儲存在接收終端的數據庫中的,當數據庫進行更新后,可以同步更新該下拉菜單中顯示的語音標識和圖像標識;當接收終端從設置界面上接收到用戶編輯的信息,則儲存用戶編輯的姓名、電話、郵箱、發首人標識和人臉圖像標識的對應關系。
[0129]模板制作模塊可以通過攝像頭或在本地查找一個人臉圖像樣本,然后提取該人臉圖像樣本的圖像特征參數比如用于表示人臉的輪廓等特征的參數,用一個圖像標識比如“張三”來標識該圖像特征參數,再將該圖像標識和圖像特征參數的對應關系儲存到數據庫中;同樣,模塊制作模塊可以通過錄音器或在本地查找一段語音樣本,然后提取該語音樣本的語音特征參數比如用于表示音色和音調等特征的參數,用一個語音標識比如“唐老鴨”來標識該語音特征參數,再將該語音標識和語音特征參數的對應關系儲存到數據庫中。
[0130]當接收終端的短信處理模塊接收到其它移動終端發送的短消息,則將短消息中的用戶標識比如對端的SIM卡號通知給參數配置模塊,并將短消息中的文本信息發給語音動畫引擎。這樣參數配置模塊會在通訊錄中查找到該SIM卡號對應的人臉圖像標識和語音標識并傳送到模板制作模塊,而模塊制作模塊在數據庫中找到該人臉圖像標識指示的人臉圖像特征參數及語音標識指示的語音特征參數并傳送到語音動畫引擎中。語音動畫引擎中的TTS模塊會根據文本信息和語音特征參數生成語音流和音素時間序列,而人臉動畫模塊會根據該音素時間序列及人臉圖像特征參數生成人臉動畫流,最后由同步模塊將語音流和人臉動畫流進行同步合成語音動畫流,并傳送給語音動畫播放器進行播放。
[0131]通過上述接收終端來生成語音動畫流并播放的方式,實現了將短消息進行形象地播放,且可以根據用戶自己的需要來進行播放。
[0132]參考圖6所示,本實施例的接收終端中包括短信處理模塊、參數配置模塊、數據庫、語音動畫引擎和語音動畫播放器,其中:
[0133]接收終端可以通過A2接口將獲取的人臉圖像樣本發送給服務器,通過A3接口將獲取的語音樣本發送服務器,由服務器進行圖像特征參數或語音特征參數的提取后儲存到服務器的數據庫中,且服務器在更新數據庫后可以通過Al接口將更新的信息發送給接收終端進行更新接收終端的數據庫。則在本實施例中,接收終端接收到短消息后,生成語音動畫流的過程與如圖3對應的實施例類似,不同的是,本實施例中接收終端在獲取語音標識指示的語音特征參數和人臉圖像指示的人臉圖像特征參數時可以從接收終端的數據庫中獲取,也可以從服務器的數據庫中獲取,這樣接收終端省去對圖像特征參數和語音特征參數的提取。
[0134]參考圖7所示,本實施例中語音動畫流在服務器端生成,其中接收終端中包括短信處理模塊、參數配置模塊和語音動畫播放器,服務器中包括所述模板制作模塊和語音動畫引擎,其中:
[0135]接收終端可以通過A4接口將獲取的人臉圖像樣本發送給服務器,通過A5接口將獲取的語音樣本發送服務器,由服務器中的模板制作模塊進行圖像特征參數或語音特征參數的提取后儲存到服務器的數據庫中。則在本實施例中,接收終端接收到短消息后,將其中的文本信息通過接口 Al發送給服務器中的語音動畫引擎;而將用戶標識比如對端的SIM卡號發送給接收終端包括的參數配置模塊,由參數配置模塊在通訊錄中查找到對應的語音標識和圖像標識后,通過接口 A2將語音標識和圖像標識發送給服務器的模板制作模塊,服務器中的語音動畫引擎和模板制作模塊配合生成語音動畫流后,通過接口 A3發送給接收終端的語音播放器進行播放,這樣接收端省去對生成語音動畫流的過程,減少功耗。
[0136]本發明實施例還提供一種終端設備即上述圖1對應實施例的方法中的接收終端,結構示意圖如圖8所示,包括:
[0137]消息接收單元10,用于接收消息,所述消息中包括用戶標識和文本信息;
[0138]標識獲取單元11,用于獲取與所述消息接收單元10接收的消息中用戶標識對應的語音標識和圖像標識,所述語音標識用于指示語音特征參數,所述圖像標識用于指示圖像特征參數;
[0139]媒體流獲取單元12,用于根據所述標識獲取單元11獲取的語音標識指示的語音特征參數、所述標識獲取單元11獲取的圖像標識指示的圖像特征參數及文本信息生成或獲取語音動畫流,具體地,媒體流獲取單元12可以根據語音動畫技術生成,或向服務器請求獲取語音動畫流。
[0140]播放單元13,用于播放所述媒體流獲取單元12生成或獲取的語音動畫流。
[0141]本發明實施例的終端設備中,消息接收單元10接收到包括用戶標識和文本信息的消息,標識獲取單元11獲取了用戶標識對應的語音標識和圖像標識,并由媒體流獲取單元12根據語音標識指示的語音特征參數、圖像標識指示的圖像特征參數及文本信息生成或獲取語音動畫流,最后由播放單元13播放播放該語音動畫流。使得可以將消息中的文本信息根據用戶標識播放成語音動畫流,既可以生動地展示消息中的文本信息,又可以根據用戶標識對應的語音標識和圖像標識對消息進行個性化展示。
[0142]參考圖9所示,在一個具體的實施例中,終端設備除了可以包括如圖8所示的結構夕卜,還可以包括界面提供單元14、第一對應關系儲存單元15和第二對應關系儲存單元16,且其中的媒體流獲取單元12可以通過語音流生成單元120、動畫流生成單元121、同步單元122和特征獲取單元123來實現,其中:
[0143]界面提供單元14,用于提供設置界面,所述設置界面用于接收所述用戶標識與所述語音標識以及所述圖像標識之間的對應關系。
[0144]第一對應關系儲存單元15,用于從所述設置界面上接收所述用戶標識與所述語音標識以及所述圖像標識之間的對應關系并儲存所述對應關系。
[0145]第二對應關系儲存單元16,用于獲取圖像樣本,并提取獲取圖像樣本的圖像特征參數,按第一對應關系儲存所述圖像特征參數與圖像標識;且該第二對應關系儲存單元16還可以獲取語音樣本,并提取獲取語音樣本的語音特征參數,按第二對應關系儲存所述語音特征參數與語音標識。
[0146]特征獲取單元123,用于獲取所述標識獲取單元11獲取的語音標識指示的語音特征參數,及獲取所述標識獲取單元11獲取的圖像標識指示的圖像特征參數;
[0147]語音流生成單元120,用于根據特征獲取單元123獲取的所述語音標識指示的語音特征參數將所述文本信息轉換成音素時間序列和語音流;
[0148]動畫流生成單元121,用于根據所述語音流生成單元120生成的音素時間序列及所述特征獲取單元123獲取的圖像標識指示的圖像特征參數生成動畫流;
[0149]同步單元122,用于將所述語音流及所述動畫流同步合成語音動畫流。
[0150]本發明實施例的終端設備中,當消息接收單元10接收到消息后,標識獲取單元11根據其中的用戶標識獲取對應的語音標識和圖像標識,媒體流獲取單元12中的特征獲取單元123會獲取語音特征參數和圖像特征參數,語音流生成單元120根據消息中的文本信息及特征獲取單元123獲取的語音標識指示的語音特征參數生成音素時間序列和語音流,動畫流生成單元121根據該音素時間序列及特征獲取單元123獲取的圖像標識指示的圖像特征參數生成動畫流,最后由同步單元122將語音流和動畫流同步合成語音動畫流,并由播放單元13播放同步單元122合成的語音動畫流。
[0151]本實施例中,界面提供單元14可以提供設置界面以供用戶來設置某個用戶標識對應的語音標識和圖像標識,當第一對應關系儲存單元15接收到所述用戶標識對應用戶在該設置界面上編輯的語音標識和圖像標識,儲存用戶標識與該語音標識和圖像標識的對應關系,則標識獲取單元11是根據第一對應關系儲存單元15儲存的對應關系來獲取與所述消息接收單元10接收消息中用戶標識對應的語音標識和圖像標識的。且終端設備可以通過第二對應關系儲存單元16儲存圖像特征參數和語音特征參數,這樣媒體流獲取單元12中的特征獲取單元123就可以根據第二對應關系儲存單元16儲存的對應關系獲取圖像特征參數和語音特征參數。
[0152]參考圖10所示,在另一個具體的實施例中,終端設備除了可以包括如圖8所示的結構外,還可以包括界面提供單元14、第一對應關系儲存單元15和樣本發送單元17,且媒體流獲取單元12還可以通過標識發送單元124和發送媒體流獲取單元125來實現,具體地:
[0153]樣本發送單元17,用于獲取圖像樣本,將獲取的圖像樣本發送給服務器,以指示所述服務器提取所述圖像樣本的圖像特征參數,并按第一對應關系儲存所述圖像特征參數與圖像標識,且該樣本發送單元17還可以獲取語音樣本,并將獲取的語音樣本發送給服務器,以指示所述服務器提取所述語音樣本的語音特征參數,并按第二對應關系儲存所述語音特征參數與圖像標識。
[0154]標識發送單元124,用于將所述標識獲取單元11獲取的語音標識和圖像標識發送給服務器,以指示所述服務器根據所述語音標識指示的語音特征參數、所述圖像標識指示的圖像特征參數及文本信息生成所述文本信息的語音動畫流;發送媒體流獲取單元125,用于獲取所述服務器發送的語音動畫流,并由播放單元13來播放該語音動畫流。
[0155]本實施例中,終端設備可以通過樣本發送單元17將圖像樣本和語音樣本發送給服務器,由服務器來按第二對應關系儲存語音特征參數與語音標識及按第一對應關系儲存圖像標識和圖像特征參數,從而節省了終端設備的存儲資源。
[0156]本發明實施例還提供一種終端設備即上述圖1對應實施例的方法中的接收終端,結構示意圖如圖11所示,包括分別連接到總線上的存儲器20、處理器21、輸入裝置23和輸出裝置24,其中:
[0157]存儲器20中用來儲存從輸入裝置23輸入的數據,且還可以儲存處理器21處理數據的必要文件等信息;
[0158]輸入裝置23和輸出裝置24是用戶終端與其他設置通信的端口 ;
[0159]本實施例中輸入裝置23接收消息后傳送給處理器21,該消息中包括用戶標識和文本信息;處理器21可以執行如下的步驟:獲取與用戶標識對應的語音標識和圖像標識;根據語音標識指示的語音特征參數,圖像標識指示的圖像特征參數以及文本信息生成或獲取語音動畫流并播放該語音動畫流。
[0160]進一步地,處理器21還可以在獲取語音標識和圖像標識之前,提供設置界面,該設置界面用于接收用戶標識與語音標識以及圖像標識之間的對應關系,并將從設置界面上接收的用戶標識與語音標識以及圖像標識之間的對應關系傳送給存儲器20進行儲存。這樣處理器21在獲取語音標識和圖像標識時,可以根據存儲器20中儲存的對應關系獲取。
[0161]進一步地,在一種情況下,處理器21在獲取生成的語音動畫流時,可以先獲取語音標識指示的語音特征參數,及獲取圖像標識指示的圖像特征參數;根據語音標識指示的語音特征參數將文本信息轉換成音素時間序列和語音流;根據音素時間序列及圖像標識指示的圖像特征參數生成動畫流;將語音流及所述動畫流同步合成語音動畫流。在這種情況下,處理器21可以通過如下步驟來預置圖像特征參數和語音特征參數,具體地,處理器21可以獲取圖像樣本,提取獲取圖像樣本的圖像特征參數,將圖像標識和圖像特征參數傳送給存儲器20按第一對應關系儲存圖像特征參數與圖像標識;處理器21還可以語音樣本,提取獲取語音樣本的語音特征參數,并將語音特征參數與語音標識傳送給存儲器20按第二對應關系儲存,處理器21在生成語音動畫流的過程中獲取語音特征參數和圖像特征參數時,可以分別根據存儲器20中儲存的第二對應關系和第一對應關系獲取。
[0162]進一步地,在一種情況下,處理器21可以控制輸出裝置24將語音標識和圖像標識發送給服務器,以指示服務器根據語音標識指示的語音特征參數、所述圖像標識指示的圖像特征參數及文本信息生成文本信息的語音動畫流,當輸入裝置23接收到服務器發送的語音動畫流,即可傳送給處理器21進行其他處理。在這種情況下,處理器21可以獲取圖像樣本和語音樣本,并控制輸出裝置24將圖像樣本發送給服務器,以指示服務器提取圖像樣本的圖像特征參數,并按第一對應關系儲存圖像特征參數與圖像標識,且處理器21還可以控制輸出裝置24將獲取的語音樣本發送給服務器,以指示服務器提取語音樣本的語音特征參數,并按第二對應關系儲存語音特征參數與圖像標識。
[0163]本發明實施例還提供一種服務器即上述圖3對應實施例的方法中的網絡服務器,結構示意圖如圖12所示,包括:
[0164]發送消息接收單元30,用于接收發送終端發送的消息,所述消息中包括文本信息和所述發送終端對應用戶的用戶標識;
[0165]媒體標識獲取單元31,用于根據預先存儲的用戶標識與語音標識和圖像標識的對應關系,獲取與所述發送消息接收單元30接收的消息中發送終端發送的用戶標識對應的語音標識以及圖像標識,所述語音標識用于指示在生成語音動畫流時,用于生成所述語音動畫流中的語音所需的語音特征參數,所述圖像標識用于指示生成所述語音動畫流時,用于生成所述語音動畫流中的圖像所需的圖像特征參數;
[0166]媒體流生成單元32,用于根據所述媒體標識獲取單元31獲取的發送終端發送的用戶標識對應的語音標識指示的語音特征參數、圖像標識指示的圖像特征參數,以及所述文本信息生成語音動畫流;
[0167]媒體流發送單元33,用于將生成的所述語音動畫流發送給接收終端,使得所述接收終端收到后播放所述語音動畫流。
[0168]本發明實施例中,當包括發送終端對應的用戶標識和文本信息的消息從發送終端發送到接收終端的過程中,在經過網絡服務器時,由網絡服務器中的發送消息接收單元30接收該消息,媒體標識獲取單元31獲取用戶標識對應的語音標識和圖像標識,并由媒體流生成單元32生成的語音動畫流后,媒體流發送單元33將生成的語音動畫流發送給接收終端進行播放,其中語音動畫流是根據語音標識指示的語音特征參數、圖像標識指示的圖像特征參數及文本信息生成的。使得在消息中的文本信息可以根據不同用戶標識播放成不同的語音動畫流,既可以生動地播放消息中的文本信息,又可以根據用戶標識對應的語音標識和圖像標識對消息進行個性化播放;且本實施例中,不用接收終端生成語音動畫流,減輕了終端的負擔。
[0169]參考圖13所示,在一個具體的實施例中,服務器除了包括如圖12所示的結構外,還可以包括:樣本接收單元34和對應關系儲存單元35,且媒體流生成單元32具體可以通過媒體特征獲取單元320、轉換單元321、生成單元322和合成單元323來實現,具體地:
[0170]媒體特征獲取單元320,用于獲取所述媒體標識獲取單元31獲取的語音標識指示的語音特征參數,及獲取所述媒體標識獲取單元31獲取的圖像標識指示的圖像特征參數;
[0171]轉換單元321,用于根據媒體特征獲取單元320獲取的所述語音標識指示的語音特征參數將所述文本信息轉換成音素時間序列和語音流;
[0172]生成單元322,用于根據所述轉換單元321轉換的音素時間序列,及所述媒體特征獲取單元320獲取的圖像標識指示的圖像特征參數生成動畫流;
[0173]合成單元323,用于將所述轉換單元321轉換的語音流及所述生成單元322生成的動畫流同步合成語音動畫流。
[0174]樣本接收單元34,用于接收終端設備發送的圖像樣本和語音樣本;對應關系儲存單元35,用于提取所述樣本接收單元34接收的圖像樣本的圖像特征參數,并按第一對應關系儲存所述圖像特征參數與圖像標識,及提取所述樣本接收單元34接收的語音樣本的語音特征參數,并按第二對應關系儲存所述語音特征參數與圖像標識。這樣媒體特征獲取單元320就可以根據所述對應關系儲存單元35中儲存的第二對關系獲取語音特征參數,可以根據所述對應關系儲存單元35中儲存第一對應關系獲取圖像特征參數。[0175]本發明實施例還提供一種服務器即上述圖3對應實施例的方法中的網絡服務器,結構示意圖如圖14所示,包括分別連接到總線上的存儲器40、處理器41、輸入裝置43和輸出裝置44,其中:
[0176]存儲器40中用來儲存從輸入裝置43輸入的數據,且還可以儲存處理器41處理數據的必要文件等信息;
[0177]輸入裝置43和輸出裝置44是用戶終端與其他設置通信的端口 ;
[0178]本實施例中輸入裝置43接收到發送終端發送的消息后傳送給處理器41,該消息中包括文本信息和所述發送終端對應用戶的用戶標識;由處理器41根據存儲器40中存儲的用戶標識與語音標識和圖像標識的對應關系,獲取與發送終端發送的用戶標識對應的語音標識以及圖像標識,且根據發送終端發送的用戶標識對應的語音標識指示的語音特征參數、圖像標識指示的圖像特征參數,以及文本信息生成語音動畫流;并控制輸出裝置44將生成的語音動畫流發送給接收終端,使得接收終端收到后播放語音動畫流。
[0179]進一步地,本實施例中的處理器41在生成語音動畫流時,可以先獲取語音標識指示的語音特征參數,及獲取圖像標識指示的圖像特征參數;然后根據語音標識指示的語音特征參數將文本信息轉換成音素時間序列和語音流;根據音素時間序列及圖像標識指示的圖像特征參數生成動畫流;將語音流及動畫流同步合成語音動畫流。
[0180]進一步地,本實施例中可以預先在存儲器40中預置語音特征和圖像特征,具體地,當輸入裝置43接收終端設備發送的圖像樣本和語音樣本傳送給處理器41 ;由處理器41提取圖像樣本的圖像特征參數,并將圖像特征參數與圖像標識按第一對應關系儲存到存儲器40中,且處理器41還可以提取語音樣本的語音特征參數,并將語音特征參數與圖像標識按第二對應關系儲存到存儲器40中。這樣處理器41在生成語音動畫流的過程中,可以根據存儲器40中儲存的第二對關系獲取語音特征參數,且根據存儲器40中儲存的第一對應關系獲取圖像特征參數。
[0181]本發明實施例還提供一種消息播放系統,包括接收終端和服務器,其中:
[0182]接收終端,用于接收消息,所述消息中包括用戶標識和文本信息;獲取所述用戶標識對應的語音標識和圖像標識;根據所述語音標識指示的語音特征參數、所述圖像標識指示的圖像特征參數及文本信息獲取語音動畫流并播放該語音動畫流;所述語音標識用于指示語音特征參數,所述圖像標識用于指示圖像特征參數;
[0183]服務器,用于根據所述語音標識指示的語音特征參數、所述圖像標識指示的圖像特征參數及文本信息生成所述文本信息的語音動畫流并發送給所述接收終端,具體的生成語音動畫流的方法如上述方法實施例中所述。
[0184]其中接收終端可以是如圖8、10和11中任一個圖所示的終端設備,且終端設備中各個單元之間可以按照上述圖1對應方法實施例中所述的方法進行消息的播放,在此不進行贅述。
[0185]本發明實施例還提供一種消息播放系統,包括接收終端和網絡服務器,其中:
[0186]所述網絡服務器,用于接收到發送終端發送的消息后該消息中包括文本信息和所述發送終端對應用戶的用戶標識;根據預先儲存的用戶標識與語音標識和圖像標識的對應關系,獲取與發送終端發送的用戶標識對應的語音標識以及圖像標識,且根據發送終端發送的用戶標識對應的語音標識指示的語音特征參數、圖像標識指示的圖像特征參數,以及文本信息生成語音動畫流;并將生成的語音動畫流發送給接收終端;所述語音標識用于指示語音特征參數,所述圖像標識用于指示圖像特征參數;
[0187]所述接收終端,用于接收所述網絡服務器發送的語音動畫流,并播放所述語音動畫流。
[0188]其中網絡服務器可以是如圖12到14中任一個圖所示的服務器,網絡服務器中各個單元之間可以按照上述圖3對應方法實施例中所述的方法進行消息的播放,在此不進行贅述。
[0189]本領域普通技術人員可以理解上述實施例的各種方法中的全部或部分步驟是可以通過程序來指令相關的硬件來完成,該程序可以存儲于一計算機可讀存儲介質中,存儲介質可以包括:只讀存儲器(ROM)、隨機存取存儲器(RAM)、磁盤或光盤等。
[0190]以上對本發明實施例所提供的消息播放方法、系統及相關設備,進行了詳細介紹,本文中應用了具體個例對本發明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發明的方法及其核心思想;同時,對于本領域的一般技術人員,依據本發明的思想,在【具體實施方式】及應用范圍上均會有改變之處,綜上所述,本說明書內容不應理解為對本發明的限制。
【權利要求】
1.一種消息播放方法,其特征在于,應用于終端設備,所述方法包括: 接收消息,所述消息中包括用戶標識和文本信息; 獲取與所述用戶標識對應的語音標識和圖像標識,所述語音標識用于指示語音特征參數,所述圖像標識用于指示圖像特征參數; 根據所述語音標識指示的語音特征參數、所述圖像標識指示的圖像特征參數以及所述文本信息生成或獲取語音動畫流并播放所述語音動畫流。
2.如權利要求1所述的方法,其特征在于,所述接收消息之前,所述方法還包括: 提供設置界面,所述設置界面用于接收所述用戶標識與所述語音標識以及所述圖像標識之間的對應關系; 從所述設置界面上接收所述用戶標識與所述語音標識以及所述圖像標識之間的對應關系并存儲所述對應關系; 所述獲取與所述用戶標識對應的語音標識和圖像標識包括: 根據存儲的對應關系獲取與所述用戶標識對應的所述語音標識和所述圖像標識。
3.如權利要求1或2所述的方法,其特征在于,所述根據所述語音標識指示的語音特征參數、所述圖像標識指示的圖像特征參數以及所述文本信息生成語音動畫流包括: 所述終端設備獲取所述語音標識指示的語音特征參數,及獲取所述圖像標識指示的圖像特征參數;` 所述終端設備根據所述語音標識指示的語音特征參數將所述文本信息轉換成音素時間序列和語音流; 所述終端設備根據所述音素時間序列及所述圖像標識指示的圖像特征參數生成動畫流; 所述終端設備將所述語音流及所述動畫流同步合成語音動畫流。
4.如權利要求3所述的方法,其特征在于,所述接收消息之前,所述方法還包括: 獲取圖像樣本和語音樣本; 提取獲取圖像樣本的圖像特征參數,按第一對應關系儲存所述圖像特征參數與圖像標識; 提取獲取語音樣本的語音特征參數,按第二對應關系儲存所述語音特征參數與語音標識; 所述獲取所述語音標識指示的語音特征參數,及圖像標識指示的圖像特征參數包括:根據所述第二對關系獲取所述語音標識指示的語音特征參數,根據所述第一對應關系獲取所述圖像標識指示的圖像特征參數。
5.如權利要求1或2所述的方法,其特征在于,所述根據所述語音標識指示的語音特征參數、所述圖像標識指示的圖像特征參數以及所述文本信息獲取語音動畫流包括: 將所述語音標識和圖像標識發送給服務器,以指示所述服務器根據所述語音標識指示的語音特征參數、所述圖像標識指示的圖像特征參數及文本信息生成所述文本信息的語音動畫流; 獲取所述服務器發送的語音動畫流。
6.如權利要求5所述的方法,其特征在于,所述服務器根據所述語音標識指示的語音特征參數、所述圖像標識指示的圖像特征參數及文本信息生成所述文本信息的語音動畫流,具體包括: 所述服務器獲取所述語音標識指示的語音特征參數,及獲取所述圖像標識指示的圖像特征參數; 所述服務器根據所述語音標識指示的語音特征參數將所述文本信息轉換成音素時間序列和語音流; 所述服務器根據所述音素時間序列及所述圖像標識指示的圖像特征參數生成動畫流; 所述服務器將所述語音流及所述動畫流同步合成語音動畫流。
7.如權利要求6所述的方法,其特征在于,所述接收消息之前還包括: 獲取圖像樣本和語音樣本; 將所述圖像樣本發送給服務器,以指示所述服務器提取所述圖像樣本的圖像特征參數,并按第一對應關系儲存所述圖像特征參數與圖像標識; 將獲取的語音樣本發送給服務器,以指示所述服務器提取所述語音樣本的語音特征參數,并按第二對應關系儲存所述語音特征參數與所述語音標識; 所述服務器獲取所述語音標識指示的`語音特征參數,及所述圖像標識指示的圖像特征參數包括:根據所述第二對關系獲取所述語音標識指示的語音特征參數,根據所述第一對應關系獲取所述圖像標識指示的圖像特征參數。
8.一種消息播放方法,其特征在于,應用于網絡服務器,所述方法包括: 接收發送終端發送的消息,所述消息中包括文本信息和所述發送終端對應用戶的用戶標識; 根據預先存儲的用戶標識與語音標識和圖像標識的對應關系,獲取與所述發送終端發送的用戶標識對應的語音標識以及圖像標識,所述語音標識用于指示語音特征參數,所述圖像標識用于指示圖像特征參數; 根據所述語音標識指示的語音特征參數、以及圖像標識指示的圖像特征參數,以及所述文本信息生成語音動畫流; 將生成的所述語音動畫流發送給接收終端,使得所述接收終端收到后播放所述語音動畫流。
9.如權利要求8所述的方法,其特征在于,所述根據所述語音標識指示的語音特征參數、以及圖像標識指示的圖像特征參數,以及所述文本信息生成語音動畫流,具體包括: 獲取所述語音標識指示的語音特征參數,及獲取所述圖像標識指示的圖像特征參數; 根據所述語音標識指示的語音特征參數將所述文本信息轉換成音素時間序列和語音流; 根據所述音素時間序列及所圖像標識指示的圖像特征參數生成動畫流; 將所述語音流及所述動畫流同步合成語音動畫流。
10.如權利要求9所述的方法,其特征在于,所述接收終端設備發送的消息之前還包括: 接收終端設備發送的圖像樣本和語音樣本; 提取所述圖像樣本的圖像特征參數,按第一對應關系儲存所述圖像特征參數與圖像標識;提取所述語音樣本的語音特征參數,按第二對應關系儲存所述語音特征參數與圖像標識; 所述獲取所述語音標識指示的語音特征參數具體包括:根據所述第二對關系獲取所述語音標識指示的語音特征參數;所述獲取所述圖像標識指示的圖像特征參數具體包括:根據所述第一對應關系獲取所述圖像標識指示的圖像特征參數。
11.如權利要求8到10任一項所述的方法,其特征在于,所述發送終端為手機,所述發送終端發送的消息為短消息,所述消息中包括的用戶標識為手機號碼。
12.一種終端設備,其特征在于,包括: 消息接收單元,用于接收消息,所述消息中包括用戶標識和文本信息; 標識獲取單元,用于獲取與所述消息接收單元接收的發送消息中用戶標識對應的語音標識和圖像標識,所述語音標識用于指示語音特征參數,所述圖像標識用于指示圖像特征參數; 媒體流獲取單元,用于根據所述語音標識指示的語音特征參數、所述圖像標識指示的圖像特征參數以及所述文本信息生成或獲取語音動畫流; 播放單元,用于播放所述媒體流獲取單元生成或獲取的所述語音動畫流。
13.如權利要求12所述的終端設備,其特征在于,所述終端設備還包括: 界面提供單元,用于提供設置界面,所述設置界面用于接收所述用戶標識與所述語音標識以及所述圖像標識之間的對應關系; 第一對應關系儲存單元,用于從所述設置界面上接收所述用戶標識與所述語音標識以及所述圖像標識之間的對應關系并儲`存所述對應關系; 所述標識獲取單元,具體用于根據所述第一對應關系儲存單元儲存的對應關系獲取與所述用戶標識對應的所述語音標識和圖像標識。
14.如權利要求12或13所述的終端設備,其特征在于,所述媒體流獲取單元具體包括: 特征獲取單元,獲取所述標識獲取單元獲取的語音標識指示的語音特征參數,及獲取所述標識獲取單元獲取的圖像標識指示的圖像特征參數; 語音流生成單元,用于根據所述語音標識指示的語音特征參數將所述文本信息轉換成音素時間序列和語音流; 動畫流生成單元,用于根據所述語音流生成單元生成的音素時間序列及所述圖像標識指示的圖像特征參數生成動畫流; 同步單元,用于將所述語音流及所述動畫流同步合成語音動畫流。
15.如權利要求14所述的終端設備,其特征在于,所述終端設備還包括: 第二對應關系儲存單元,用于獲取圖像樣本,并提取獲取所述圖像樣本的圖像特征參數,按第一對應關系儲存所述圖像特征參數與圖像標識;及用于獲取語音樣本,并提取獲取語音樣本的語音特征參數,按第二對應關系儲存所述語音特征參數與語音標識; 所述特征獲取單元,具體用于分別根據所述第二對應關系儲存單元儲存的第一對應關系和第二對應關系,獲取所述圖像標識指示的圖像特征參數和所述語音標識指示的語音特征參數。
16.如權利要求12或13所述的終端設備,其特征在于,所述媒體流獲取單元具體包括: 標識發送單元,用于將所述語音標識和圖像標識發送給服務器,以指示所述服務器根據所述語音標識指示的語音特征參數、所述圖像標識指示的圖像特征參數及文本信息生成所述文本信息的語音動畫流; 發送媒體流獲取單元,用于獲取所述服務器發送的語音動畫流。
17.如權利要求16所述的終端設備,其特征在于,所述終端設備還包括: 樣本發送單元,用于獲取圖像樣本,將獲取的圖像樣本發送給服務器,以指示所述服務器提取所述圖像樣本的圖像特征參數,并按第一對應關系儲存所述圖像特征參數與圖像標識;及用于獲取語音樣本,并將獲取的語音樣本發送給服務器,以指示所述服務器提取所述語音樣本的語音特征參數,并按第二對應關系儲存所述語音特征參數與圖像標識。
18.一種服務器,其特征在于,包括: 發送消息接收單元,用于接收發送終端發送的消息,所述消息中包括文本信息和所述發送終端對應用戶的用戶標識; 媒體標識獲取單元,用于根據預先存儲的用戶標識與語音標識和圖像標識的對應關系,獲取與所述發送終端發送的用戶標識對應的語音標識以及圖像標識,所述語音標識用于指示語音特征參數,所述圖像標識用于指示圖像特征參數; 媒體流生成單元,用于根據所述語音標識指示語音特征參數、圖像標識指示的圖像特征參數,以及所述文本信息生成語音動畫流; 媒體流發送單元,用于將生成的所述語音動畫流發送給接收終端,使得所述接收終端收到后播放所述語音動畫流。
19.如權利要求18所述的服務器,其特征在于,所述媒體流生成單元具體包括: 媒體特征獲取單元,用于獲取所述語音標識指示的語音特征參數,及獲取所述圖像標識指示的圖像特征參數; 轉換單元,用于根據所述語音標識指示的語音特征參數將所述文本信息轉換成音素時間序列和語音流; 生成單元,用于根據所述音素時間序列及所述圖像標識指示的圖像特征參數生成動畫流; 合成單元,用于將所述語音流及所述動畫流同步合成語音動畫流。
20.如權利要求19所述的服務器,其特征在于,所述服務器還包括: 樣本接收單元,用于接收終端設備發送的圖像樣本和語音樣本; 對應關系儲存單元,用于提取所述圖像樣本的圖像特征參數,并按第一對應關系儲存所述圖像特征參數與圖像標識,及提取所述語音樣本的語音特征參數,并按第二對應關系儲存所述語音特征參數與圖像標識; 所述媒體特征獲取單元,具體用于根據所述第二對關系獲取所述語音標識指示的語音特征參數;且根據所述第一對應關系獲取所述圖像標識指示的圖像特征參數。
21.一種消息播放系統, 其特征在于,包括接收終端和服務器; 所述接收終端是如上述權利要求16或17所述的終端設備;所述服務器,用于根據所述語音標識指示的語音特征參數、所述圖像標識指示的圖像特征參數及文本信息生成所述文本信息的語音動畫流并發送給所述接收終端。
22.一種消息播放系統,其特征在于,包括接收終端和網絡服務器; 所述網絡服務器是如上述權利要求18到20任一項所述的服務器;所述接收終端,用于接收所述網絡服務器發送的`語音動畫流,并播放所述語音動畫流。
【文檔編號】H04M1/725GK103796181SQ201210436069
【公開日】2014年5月14日 申請日期:2012年11月5日 優先權日:2012年11月5日
【發明者】來意哲 申請人:華為技術有限公司