一種輸出語音的方法、語音交互的方法及電子設備的制作方法
【專利摘要】本發明提供一種輸出語音的方法、語音交互的方法及電子設備。該輸出語音的方法應用于一電子設備中,所述方法包括:獲得第一待輸出內容;分析所述第一待輸出內容,獲得第一情緒信息,所述第一情緒信息用于表示所述待輸出內容所攜帶的情緒;獲得所述第一待輸出內容對應的第一待輸出語音數據;基于所述第一情緒信息,對所述第一待輸出語音數據進行處理,產生包含第二情緒信息的第二待輸出語音數據,其中,所述第二情緒信息用于表示所述電子設備在輸出所述第二待輸出語音數據時以使得用戶獲得所述電子設備的情緒,其中,所述第一情緒信息與所述第二情緒信息相匹配/相關聯;輸出所述第二待輸出語音數據。
【專利說明】一種輸出語音的方法、語音交互的方法及電子設備
【技術領域】
[0001]本發明涉及計算機【技術領域】,尤其涉及一種輸出語音的方法、語音交互的方法及電子設備。
【背景技術】
[0002]隨著電子設備技術與語音識別技術的發展,用戶與電子設備之間的溝通和互動越來越多,電子設備可以將文本信息轉換成語音輸出,而且用戶和電子設備可以通過語音互動,例如,電子設備可以回答用戶提出的問題,使得電子設備越來越人性化。
[0003]然而,本發明人在實現本發明的過程中發現,雖然電子設備可以識別用戶的語音進行相應操作、或者將文本轉換為語音輸出、或者與用戶進行語音交談,但是現有技術中的語音互動系統、或語音輸出系統中電子設備的語音信息中不帶有與情感表達相關的信息,進而導致輸出的語音也不帶有任何情緒,所以對話比較單調,使得語音控制和人機互動的效率較低,用戶體驗差。
【發明內容】
[0004]本發明提供一種輸出語音的方法、語音交互的方法及電子設備,用以解決現有技術中存在的電子設備的輸出語音數據中不帶有與情感表達相關的信息的技術問題,及由此而帶來的人機交互時情感單調,用戶體驗差的問題。
[0005]本發明一方面提供了一種輸出語音的方法,應用于一電子設備中,所述方法包括:獲得第一待輸出內容;分析所述第一待輸出內容,獲得第一情緒信息,所述第一情緒信息用于表示所述待輸出內容所攜帶的情緒;獲得所述第一待輸出內容對應的第一待輸出語音數據;基于所述第一情緒信息,對所述第一待輸出語音數據進行處理,產生包含第二情緒信息的第二待輸出語音數據,其中,所述第二情緒信息用于表示所述電子設備在輸出所述第二待輸出語音數據時以使得用戶獲得所述電子設備的情緒,其中,所述第一情緒信息與所述第二情緒信息相匹配/相關聯;輸出所述第二待輸出語音數據。
[0006]優選地,所述獲得第一待輸出內容具體為:獲取通過即時通信應用接收到的語音數據;獲取通過所述電子設備的聲音輸入裝置錄入的語音數據;或者獲取顯示在所述電子設備的顯示單元上的文本信息。
[0007]優選地,當所述第一待輸出內容為所述語音數據時,所述分析所述第一待輸出內容,獲得第一情緒信息,具體包括:分別將所述語音數據的音頻譜與M個特征頻譜模板中的每一個特征頻譜模板進行對比,獲得所述語音數據的音頻譜與所述每一個特征頻譜模板的M個對比結果,其中M為大于等于2的整數;基于所述M個對比結果,確定所述語音數據的音頻譜與所述M個特征頻譜模板中相似度最高的特征頻譜模板;確定所述相似度最高的特征頻譜模板所對應的情緒信息為所述第一情緒信息。
[0008]優選地,所述對所述第一待輸出語音數據進行處理,產生包含第二情緒信息的第二待輸出語音數據,具體包括:調整所述第一待輸出語音數據所對應的字的聲調、音量、或字與字間的停頓時間,產生所述第二待輸出語音數據。
[0009]本發明另一方面提供一種語音交互的方法,應用于一電子設備,所述方法包括:接收一用戶輸入的第一語音數據;分析所述第一語音數據,獲得第一情緒信息,所述第一情緒信息用于表示輸入所述第一語音數據的用戶在輸入所述第一語音數據時的情緒;獲得一針對所述第一語音數據的第一回應語音數據;基于所述第一情緒信息對所述第一回應語音數據進行處理,產生包含第二情緒信息的第二回應語音數據;所述第二情緒信息用于表示所述電子設備在輸出所述第二回應語音數據時以使得所述用戶獲得所述電子設備的情緒,其中,所述第一情緒信息與所述第二情緒信息相匹配/相關聯;輸出所述第二回應語音數據。
[0010]優選地,所述分析所述第一語音數據,獲得第一情緒信息,具體包括:分別將所述第一語音數據的音頻譜與M個特征頻譜模板中的每一個特征頻譜模板進行對比,獲得所述第一語音數據的音頻譜與所述每一個特征頻譜模板的M個對比結果,其中M為大于等于2的整數;基于所述M個對比結果,確定所述第一語音數據的音頻譜與所述M個特征頻譜模板中相似度最高的特征頻譜模板;確定所述相似度最高的特征頻譜模板所對應的情緒信息為所述第一情緒信息。
[0011]優選地,所述分析所述第一語音數據,獲得第一情緒信息,具體包括:判斷所述第一語音數據的連續輸入次數是否大于一預定值;當所述連續輸入次數大于一預定值時,確定所述第一語音數據中的情緒信息為所述第一情緒信息。
[0012]優選地,所述基于所述第一情緒信息對所述第一回應語音數據進行處理,產生包含第二情緒信息的第二回應語音數據,具體包括:調整所述第一回應語音數據所對應的字的聲調、音量、或字與字間的停頓時間,產生所述第二回應語音數據。
[0013]優選地,所述基于所述第一情緒信息對所述第一回應語音數據進行處理,產生包含第二情緒信息的第二回應語音數據,具體為:基于所述第一情緒信息,在所述第一回應語音數據上增加一用于表示所述第二情緒信息的語音數據,獲得所述第二回應語音數據。
[0014]本發明一實施例還提供一種電子設備,所述電子設備包括:電路板;獲得單元,電性連接于所述電路板,用于獲得第一待輸出內容;處理芯片,設置于所述電路板上,用于分析所述第一待輸出內容,獲得第一情緒信息,所述第一情緒信息用于表示所述待輸出內容所攜帶的情緒;獲得所述第一待輸出內容對應的第一待輸出語音數據;基于所述第一情緒信息,對所述第一待輸出語音數據進行處理,產生包含第二情緒信息的第二待輸出語音數據,其中,所述第二情緒信息用于表示所述電子設備在輸出所述第二待輸出語音數據時以使得用戶獲得所述電子設備的情緒,其中,所述第一情緒信息與所述第二情緒信息相匹配/相關聯;輸出單元,電性連接于所述處理芯片,用于輸出所述第二待輸出語音數據。
[0015]優選地,當所述第一待輸出內容為一語音數據時,所述處理芯片具體用于分別將所述語音數據的音頻譜與M個特征頻譜模板中的每一個特征頻譜模板進行對比,獲得所述語音數據的音頻譜與所述每一個特征頻譜模板的M個對比結果,其中M為大于等于2的整數;基于所述M個對比結果,確定所述語音數據的音頻譜與所述M個特征頻譜模板中相似度最高的特征頻譜模板;確定所述相似度最高的特征頻譜模板所對應的情緒信息為所述第一情緒信息。
[0016]優選地,所述處理芯片具體用于調整所述第一待輸出語音數據所對應的字的聲調、音量、或字與字間的停頓時間,產生所述第二待輸出語音數據。[0017]本發明再一實施例還提供一種電子設備,所述電子設備包括:電路板;語音接收單元,電性連接于所述電路板,用于接收一用戶輸入的第一語音數據;處理芯片,設置于所述電路板上,用于分析所述第一語音數據,獲得第一情緒信息,所述第一情緒信息用于表示輸入所述第一語音數據的用戶在輸入所述第一語音數據時的情緒;獲得一針對所述第一語音數據的第一回應語音數據;基于所述第一情緒信息對所述第一回應語音數據進行處理,產生包含第二情緒信息的第二回應語音數據;所述第二情緒信息用于表示所述電子設備在輸出所述第二回應語音數據時以使得所述用戶獲得所述電子設備的情緒,其中,所述第一情緒信息與所述第二情緒信息相匹配/相關聯;輸出單元,電性連接于所述處理芯片,用于輸出所述第二回應語音數據。
[0018]優選地,所述處理芯片具體用于分別將所述第一語音數據的音頻譜與M個特征頻譜模板中的每一個特征頻譜模板進行對比,獲得所述第一語音數據的音頻譜與所述每一個特征頻譜模板的M個對比結果,其中M為大于等于2的整數;基于所述M個對比結果,確定所述第一語音數據的音頻譜與所述M個特征頻譜模板中相似度最高的特征頻譜模板;確定所述相似度最高的特征頻譜模板所對應的情緒信息為所述第一情緒信息。
[0019]優選地,所述處理芯片具體用于判斷所述第一語音數據的連續輸入次數是否大于一預定值;當所述連續輸入次數大于一預定值時,確定所述第一語音數據中的情緒信息為所述第一情緒信息。
[0020]優選地,所述處理芯片具體用于調整所述第一回應語音數據所對應的字的聲調、音量、或字與字間的停頓時間,產生所述第二回應語音數據。
[0021]優選地,所述處理芯片具體用于基于所述第一情緒信息,在所述第一回應語音數據上增加一用于表示所述第二情緒信息的語音數據,獲得所述第二回應語音數據。
[0022]本發明實施例中提供的一個或多個技術方案,至少具有如下技術效果或優點:
[0023]本發明一實施例采用分析待輸出內容(例如短信或其他文本信息、或通過即時通信軟件接收到的語音數據、或者是通過電子設備的聲音輸入裝置錄入的語音數據)的情緒信息,然后基于情緒信息,對與待輸出內容對應的待輸出語音數據進行處理,最后獲得包含第二情緒信息的待輸出語音數據,所以當電子設備輸出包含第二情緒信息的待輸出語音數據時,用戶能夠獲得電子設備的情緒。因此,通過這種方法,可以使得電子設備根據不同內容或場景輸出不同情緒的語音信息,使得用戶能夠更清楚的了解到電子設備的情緒,所以使得輸出語音的效率更高效,用戶體驗更好。
[0024]本發明另一實施例中,當用戶輸入第一語音數據后,分析第一語音數據,獲得對應的第一情緒,然后獲得針對第一語音數據的第一回應語音數據,再基于第一情緒信息對第一回應語音數據進行處理,產生包含第二情緒信息的第二回應語音數據,使得第二回應語音數據輸出時,用戶能夠獲得電子設備的情緒,所以人機可以更好的交互,電子設備也更人性化,使得人機交互效率更高,用戶體驗更好。
【專利附圖】
【附圖說明】
[0025]圖1為本發明第一實施例中的輸出語音的方法流程圖;
[0026]圖2為本發明第二實施例中的語音交互的方法流程圖;
[0027]圖3為本發明第一實施例中的電子設備的功能框圖;[0028]圖4為本發明第二實施例中的電子設備的功能框圖。
【具體實施方式】
[0029]本發明實施例提供一種輸出語音的方法、語音交互的方法及電子設備,用以解決現有技術中存在的電子設備的輸出語音數據中不帶有與情感表達相關的信息的技術問題,及由此而帶來的人機交互時情感單調,用戶體驗差的問題。
[0030]本發明實施例中的技術方案為解決上述的技術問題,總體思路如下:
[0031]對獲得的待輸出內容或者用戶輸入的語音數據進行分析,獲得待輸出內容或者用戶輸入的語音數據對應的第一情緒,然后獲得針對待輸出內容或第一語音數據的語音數據,再基于第一情緒信息對該語音數據進行處理,產生包含第二情緒信息的語音數據,使得包含第二情緒信息的語音數據輸出時,用戶能夠獲得電子設備的情緒,可以使得電子設備根據不同內容或場景輸出不同情緒的語音信息,使得用戶能夠更清楚的了解到電子設備的情緒,所以使得輸出語音的效率更高效,而且,人機可以更好的交互,電子設備也更人性化,使得人機交互效率更高,用戶體驗更好。
[0032]為了更好的理解上述技術方案,下面將結合說明書附圖以及具體的實施方式對上述技術方案進行詳細的說明。
[0033]本發明一實施例提供一種輸出語音的方法,應用于一電子設備上,該電子設備例如是手機、平板電腦、筆記本電腦等電子設備。
[0034]請參考圖1,該方法包括:
[0035]步驟101:獲得第一待輸出內容;
[0036]步驟102:分析第一待輸出內容,獲得第一,清緒信息,第一,清緒信息用于表不第一待輸出內容所攜帶的情緒;
[0037]步驟103:獲得第一待輸出內容對應的第一待輸出語音數據;
[0038]步驟104:基于第一情緒信息,對第一待輸出語音數據進行處理,產生包含第二情緒信息的第二待輸出語音數據,其中,第二情緒信息用于表示電子設備在輸出第二待輸出語音數據時以使得用戶獲得電子設備的情緒,其中,第一情緒信息與第二情緒信息相匹配/相關聯;
[0039]步驟105:輸出第二待輸出語音數據。
[0040]其中,第一情緒信息與第二情緒信息相匹配/相關聯,例如可以是第二情緒用于增強第一情緒,也可以是第二情緒用于緩和第一情緒信息,當然,在具體實施過程中,還可以設置其他情形的匹配或關聯規則。
[0041]其中,在步驟101中,獲得第一待輸出內容,在具體實施過程中,可以是獲取通過即時通信應用接收到的語音數據,例如是通過米聊、微信等聊天軟件接收到的語音數據;也可以是通過電子設備的聲音輸入裝置錄入的語音數據,例如是通過麥克風錄入用戶的語音數據;也可以是顯示在電子設備的顯示單元上的文本信息,例如短信、電子書或者網頁上的文本信息。
[0042]其中,步驟102和步驟103沒有先后順序,后續說明以先執行步驟102為例,但實際實施時,也可以先執行步驟103。
[0043]接下來執行步驟102,在該步驟中,如果第一待輸出內容是文本信息,則分析第一待輸出內容,獲得第一情緒信息,具體可以先對文本進行語言學分析,逐句進行詞匯、語法和語義的分析,確定句子的結構和每個字的因素的組成,包括但不限于文本的斷句、字詞切分、多音字的處理、數字的處理、縮略詞的處理,例如還可以分析文本的標點符號,確定是問句還是陳述句,亦或是感嘆句,所以根據詞匯本身的意思和標點符號就可以比較簡單的分析出文本所攜帶的情緒。
[0044]具體來說,例如文本信息是“我好開心啊! ”,那么經過上述方法的分析,其中“開心”本身的詞義就是代表著一種聞興的情緒,還有感嘆詞“啊”,就進一步表不這種聞興的情緒比較強烈,然后還有感嘆號,更是進一步增強了高興的情緒,所以通過分析到這些信息,就可以獲得該文本所攜帶的情緒,即獲得了第一情緒。
[0045]然后執行步驟103,即獲得第一待輸出內容對應的第一待輸出語音數據,即將文本所對應的單字或詞組或短語從語音合成庫中提取出來,形成第一待輸出語音數據,其中語音合成庫可以是現有的語音合成庫,即普通的可以是事先存放在電子設備本地,也可以存放在網絡上的服務器中,當電子設備連接于網絡中時,可通過網絡在服務器的語音合成庫中提取出文本所對應的單字或詞組或短語。
[0046]接下來,執行步驟104,基于第一情緒信息,對第一待輸出語音數據進行處理,產生包含第二情緒信息的第二待輸出語音數據,具體來說,可以調整第一待輸出語音數據所對應的字的聲調、音量、或字與字之間的停頓時間。繼續沿用上面的例子,即可將“開心”對應的語音音量提高,可以將“啊”感嘆詞的聲調提高,也可以將程度副詞“好”和后面的“開心”之間的停頓時間增長,增強開心情緒的程度。
[0047]關于從設備側來講,如何調整上述聲調、音量、或字與字之間的停頓時間,可以有很多種實現方式,例如,可以事先訓練一些模型,例如針對表達情緒的詞,諸如“開心”、“難過”、“高興”,可以訓練為將音量提高;對于感嘆詞,可以訓練為將聲調提高;而可以訓練程度副詞和后面緊跟的形容詞或動詞之間的停頓時間增長,也可以訓練形容詞和緊跟其后的名詞之間的停頓時間增長。因此,可以按照這樣的模型進行調整,具體調整可以是調整相應語音的音頻譜。
[0048]當將第二待輸出語音信息輸出時,用戶就可以獲得電子設備的情緒,在本實施例中,也可以獲得發短信的人的情緒,使得用戶可以更有效率的使用電子設備,而且也更人性化,促進用戶之間高效的交流。
[0049]在另一實施例中,當步驟101中獲得的第一待輸出內容是通過即時通信應用接收到的語音數據或者通過電子設備的聲音輸入裝置錄入的語音數據,那么在步驟102中,分析該語音數據,獲得第一情緒信息可以通過方法實現:
[0050]分別將該語音數據的音頻譜與M個特征頻譜模板中的每一個特征頻譜模板進行對比,獲得該語音數據的音頻譜與每一個特征頻譜模板的M個對比結果,其中M為大于等于2的整數;然后基于M個對比結果,確定該語音數據的音頻譜與M個特征頻譜模板中相似度最高的特征頻譜模板;確定相似度最高的特征頻譜模板所對應的情緒信息為第一情緒信肩、O
[0051]在具體實施過程中,可以事先訓練M個特征頻譜模板,即通過大量的訓練,得出例如高興的情緒的音頻譜特征,同樣的方法可以得出多個特征頻譜模板,所以當獲得第一待輸出內容的語音數據時,就將該語音數據的音頻譜與M個特征頻譜模板進行對比,獲得與每個特征頻譜模板的相似度值,最后相似度值最大的特征頻譜模板對應的情緒即為該語音數據對應的情緒,所以就獲取到了第一情緒信息。
[0052]當獲得第一情緒信息后,執行步驟103,在本實施例中,因為第一待輸出內容已經是語音數據了,所以可以不執行該步驟103,而直接進入步驟104。
[0053]在另一實施例中,步驟103也可以是在原語音數據的基礎上增加語音數據,繼續沿用前述實例,當獲得的語音數據是“我好開心啊! ”,可以在步驟103中,獲得“睡,我好開心啊! ”的語音數據,即進一步表達出高興的情緒。
[0054]關于步驟104和步驟105,與前述第一個實施例中的類似,所以在此不再贅述。
[0055]本發明另一實施例還提供一種語音交互的方法,應用于一電子設備,請參考圖2,該方法包括:
[0056]步驟201:接收一用戶輸入的第一語音數據;
[0057]步驟202:分析第一語音數據,獲得第一情緒信息,第一情緒信息用于表示輸入第一語音數據的用戶在輸入第一語音數據時的情緒;
[0058]步驟203:獲得一針對第一語音數據的第一回應語音數據;
[0059]步驟204:基于第一情緒信息對第一回應語音數據進行處理,產生包含第二情緒信息的第二回應語音數據;第二情緒信息用于表示電子設備在輸出第二回應語音數據時以使得用戶獲得電子設備的情緒,其中,第一情緒信息與第二情緒信息相匹配/相關聯;
[0060]步驟205:輸出第二回應語音數據。
[0061]其中,第一情緒信息與第二情緒信息相匹配/相關聯,例如可以是第二情緒用于增強第一情緒,也可以是第二情緒用于緩和第一情緒信息,當然,在具體實施過程中,還可以設置其他情形的匹配或關聯規則。
[0062]本實施例中的語音交互方法可以應用于例如對話系統或者即時聊天軟件中,還可以應用于語音控制系統,當然,這里的應用場景僅為舉例說明,并非用于限制本發明。
[0063]以下將舉例詳細說明該語音交互方法的具體實施過程。
[0064]在本實施例中,例如用戶通過一麥克風向電子設備輸入第一語音數據“今天天氣怎么樣? ”然后執行步驟202,即分析第一語音數據,獲得第一情緒信息,該步驟具體也可以采用前述第二實施例中的分析方式分析,即分別將該第一語音數據的音頻譜與M個特征頻譜模板中的每一個特征頻譜模板進行對比,獲得該第一語音數據的音頻譜與每一個特征頻譜模板的M個對比結果,其中M為大于等于2的整數;然后基于M個對比結果,確定該第一語音數據的音頻譜與M個特征頻譜模板中相似度最高的特征頻譜模板;確定相似度最高的特征頻譜模板所對應的情緒信息為第一情緒信息。
[0065]在具體實施過程中,可以事先訓練M個特征頻譜模板,即通過大量的訓練,得出例如高興的情緒的音頻譜特征,同樣的方法可以得出多個特征頻譜模板,所以當獲得第一語音數據時,就將該第一語音數據的音頻譜與M個特征頻譜模板進行對比,獲得與每個特征頻譜模板的相似度值,最后相似度值最大的特征頻譜模板對應的情緒即為該第一語音數據對應的情緒,所以就獲取到了第一情緒信息。
[0066]假如在該實施例中,第一情緒信息是一種低落的情緒,即用戶在輸入第一語音信息時情緒很低落。
[0067]接下來執行步驟203,當然步驟203也可以在步驟202之前執行,獲得針對第一語音數據的第一回應語音數據,繼續沿用上面的例子,用戶輸入的是“今天天氣怎么樣?”,那么電子設備可以通過網絡實時獲取天氣信息,并將天氣信息轉化為語音數據,對應的句子例如是“今天天氣晴朗,溫度28度,適合出游”。
[0068]然后基于步驟202中獲得的第一情緒信息,對第一回應語音數據進行處理,在本實施例中,第一情緒信息表示一種低落的情緒,說明用戶精神狀態不佳,有點沒干勁,所以在一實施例中,可以調整第一回應語音數據所對應的字的聲調、音量、或字與字間的停頓時間,產生第二回應語音數據,使得輸出的第二回應數據是一種歡快、情緒高昂的語氣,即用戶感受到電子設備輸出的語句是輕松愉快的,所以可以幫助用戶改善負面的情緒。
[0069]具體的調整規則,可以參考前述實施例中的調整規則,例如改變形容詞“晴朗”的音頻譜,使得這個形容詞的聲調和音量都比較高昂以及歡快。
[0070]在另一實施例中,步驟204可以具體是基于第一情緒信息,在第一回應語音數據上增加一用于表示第二情緒信息的語音數據,獲得第二回應語音數據。
[0071]具體來說,例如增加一些語氣助詞,例如將第一回應語音數據對應的語句“今天天氣晴朗,溫度28度,適合出游”調整為“今天天氣晴朗,溫度28度,適合出游哦”,即在語音合成庫中提取到“哦”的語音數據,然后合成在第一回應語音數據中,就形成了第二回應語音數據。當然,上述兩種不同的調整方式也可以互相結合使用。
[0072]在進一步的實施例中,當在步驟202中分析第一語音數據,獲得第一情緒信息,也可以是判斷第一語音數據的連續輸入次數是否大于一預定值;當連續輸入次數大于一預定值時,確定第一語音數據中的情緒信息為第一情緒信息。
[0073]具體來說,例如用戶多次輸入“今天天氣怎么樣? ” 一直都沒有得到答案,可能會由于網絡的原因電子設備沒有獲取到天氣信息,所以之前一直都回復了“對不起,沒有找到”,所以當判斷到第一語音數據的連續輸入次數已經大于一預定值了,則可以判斷出用戶的心情已經很著急,甚至都有生氣的情緒了,但是電子設備依然未查詢到天氣信息,這時就去獲取第一回應語音數據“對不起,沒有找到”,然后基于第一情緒信息,可以用上述兩種類似的方法去處理第一回應語音數據,即調整聲調、音量、或字與字之間的停頓時間,或者是加上表示強烈歉意和遺憾的語音數據,例如“真的非常對不起,沒有找到”,使得輸出的語句帶有遺憾和抱歉的情緒,使得用戶聽到之后生氣的情緒降低,提高用戶體驗。
[0074]以下將再舉一具體實例來說明該方法的具體實施過程,在本實施例中,例如是應用在一個即時聊天軟件中,在步驟201中,例如接收的是用戶A輸入的第一語音數據,例如“你怎么還沒有完成工作? ”,可以采用前述實施例中的分析方法分析之后發現,用戶A很生氣,這時又獲得了用戶B針對用戶A的第一語音數據的第一回應語音數據,例如用戶B說“工作太多了,我完成不了! ”,為了避免用戶A和用戶B之間爭吵起來,因為用戶A已經很生氣了,所以電子設備就將用戶B的第一回應語音數據進行處理,變得情緒比較緩和,這樣用戶A聽到之后,情緒也不會更加生氣,同樣用戶B端的電子設備同樣也可以做類似的處理,這樣就使得用戶A和用戶B不至于情緒太激動而發生爭執,所以電子設備的人性化使得用戶體驗更好。
[0075]以上只描述了本實施例的使用過程,具體其中如何分析情緒和如何調整語音數據可參考前述各實施例中的相關描述,為了說明書的簡潔,在此不再贅述。
[0076]本發明一實施例中還提供一種電子設備,該電子設備例如是手機、平板電腦、筆記本電腦等電子設備。
[0077]如圖3所示,該電子設備包括:電路板301 ;獲得單元302,電性連接于電路板301,用于獲得第一待輸出內容;處理芯片303,設置于電路板301上,用于分析第一待輸出內容,獲得第一情緒信息,第一情緒信息用于表示待輸出內容所攜帶的情緒;獲得第一待輸出內容對應的第一待輸出語音數據;基于第一情緒信息,對第一待輸出語音數據進行處理,產生包含第二情緒信息的第二待輸出語音數據,其中,第二情緒信息用于表示電子設備在輸出第二待輸出語音數據時以使得用戶獲得電子設備的情緒,其中,第一情緒信息與第二情緒信息相匹配/相關聯;輸出單元304,電性連接于處理芯片303,用于輸出第二待輸出語音數據。
[0078]其中,電路板301可以是電子設備的主板,進一步,獲得單元302可以是數據接收裝置,或者是聲音輸入裝置,例如麥克風。
[0079]進一步,處理芯片303可以是單獨的語音處理芯片,也可以是集成在處理器中。而輸出單元304例如是揚聲器或喇叭等聲音輸出裝置。
[0080]在一實施例中,當第一待輸出內容為一語音數據時,處理芯片303具體用于分別將語音數據的音頻譜與M個特征頻譜模板中的每一個特征頻譜模板進行對比,獲得語音數據的音頻譜與每一個特征頻譜模板的M個對比結果,其中M為大于等于2的整數;基于M個對比結果,確定語音數據的音頻譜與M個特征頻譜模板中相似度最高的特征頻譜模板;確定相似度最高的特征頻譜模板所對應的情緒信息為第一情緒信息。具體過程請參考圖1實施例中的相關描述。
[0081]在另一實施例中,處理芯片303具體用于調整第一待輸出語音數據所對應的字的聲調、音量、或字與字間的停頓時間,產生第二待輸出語音數據。
[0082]前述圖1實施例中的輸出語音的方法中的各種變化方式和具體實例同樣適用于本實施例的電子設備,通過前述對輸出語音的方法的詳細描述,本領域技術人員可以清楚的知道本實施例中電子設備的實施方法,所以為了說明書的簡潔,在此不再詳述。
[0083]在另一實施例中,還提供一種電子設備,該電子設備例如是手機、平板電腦、筆記本電腦等電子設備。
[0084]請參考圖4,該電子設備包括:電路板401 ;語音接收單元402,電性連接于電路板401,用于接收一用戶輸入的第一語音數據;處理芯片403,設置于電路板401上,用于分析第一語音數據,獲得第一情緒信息,第一情緒信息用于表示輸入第一語音數據的用戶在輸入第一語音數據時的情緒;獲得一針對第一語音數據的第一回應語音數據;基于第一情緒信息對第一回應語音數據進行處理,產生包含第二情緒信息的第二回應語音數據;第二情緒信息用于表示電子設備在輸出第二回應語音數據時以使得用戶獲得電子設備的情緒,其中,第一情緒信息與第二情緒信息相匹配/相關聯;輸出單元404,電性連接于處理芯片403,用于輸出第二回應語音數據。
[0085]其中,電路板401可以是電子設備的主板,進一步,語音接收單元402可以是數據接收裝置,或者是聲音輸入裝置,例如麥克風。
[0086]進一步,處理芯片403可以是單獨的語音處理芯片,也可以是集成在處理器中。而輸出單元404例如是揚聲器或喇叭等聲音輸出裝置。
[0087]在一實施例中,處理芯片403具體用于分別將第一語音數據的音頻譜與M個特征頻譜模板中的每一個特征頻譜模板進行對比,獲得第一語音數據的音頻譜與每一個特征頻譜模板的M個對比結果,其中M為大于等于2的整數;基于M個對比結果,確定第一語音數據的音頻譜與M個特征頻譜模板中相似度最高的特征頻譜模板;確定相似度最高的特征頻譜模板所對應的情緒信息為第一情緒信息。
[0088]在另一實施例中,處理芯片403具體用于判斷第一語音數據的連續輸入次數是否大于一預定值;當連續輸入次數大于一預定值時,確定第一語音數據中的情緒信息為第一情緒信息。
[0089]在另一實施例中,處理芯片403具體用于調整第一回應語音數據所對應的字的聲調、音量、或字與字間的停頓時間,產生第二回應語音數據。
[0090]在另一實施例中,處理芯片403具體用于基于第一情緒信息,在第一回應語音數據上增加一用于表示第二情緒信息的語音數據,獲得第二回應語音數據。
[0091]前述圖2實施例中的語音交互的方法中的各種變化方式和具體實例同樣適用于本實施例的電子設備,通過前述對語音交互的方法的詳細描述,本領域技術人員可以清楚的知道本實施例中電子設備的實施方法,所以為了說明書的簡潔,在此不再詳述。
[0092]本發明實施例中提供的一個或多個技術方案,至少具有如下技術效果或優點:
[0093]本發明一實施例采用分析待輸出內容(例如短信或其他文本信息、或通過即時通信軟件接收到的語音數據、或者是通過電子設備的聲音輸入裝置錄入的語音數據)的情緒信息,然后基于情緒信息,對與待輸出內容對應的待輸出語音數據進行處理,最后獲得包含第二情緒信息的待輸出語音數據,所以當電子設備輸出包含第二情緒信息的待輸出語音數據時,用戶能夠獲得電子設備的情緒。因此,通過這種方法,可以使得電子設備根據不同內容或場景輸出不同情緒的語音信息,使得用戶能夠更清楚的了解到電子設備的情緒,所以使得輸出語音的效率更高效,用戶體驗更好。
[0094]本發明另一實施例中,當用戶輸入第一語音數據后,分析第一語音數據,獲得對應的第一情緒,然后獲得針對第一語音數據的第一回應語音數據,再基于第一情緒信息對第一回應語音數據進行處理,產生包含第二情緒信息的第二回應語音數據,使得第二回應語音數據輸出時,用戶能夠獲得電子設備的情緒,所以人機可以更好的交互,電子設備也更人性化,使得人機交互效率更高,用戶體驗更好。
[0095]本領域內的技術人員應明白,本發明的實施例可提供為方法、系統、或計算機程序產品。因此,本發明可采用完全硬件實施例、完全軟件實施例、或結合軟件和硬件方面的實施例的形式。而且,本發明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(包括但不限于磁盤存儲器和光學存儲器等)上實施的計算機程序產品的形式。
[0096]本發明是參照根據本發明實施例的方法、設備(系統)、和計算機程序產品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理設備的處理器以產生一個機器,使得通過計算機或其他可編程數據處理設備的處理器執行的指令產生用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。[0097]這些計算機程序指令也可存儲在能引導計算機或其他可編程數據處理設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產生包括指令裝置的制造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
[0098]這些計算機程序指令也可裝載到計算機或其他可編程數據處理設備上,使得在計算機或其他可編程設備上執行一系列操作步驟以產生計算機實現的處理,從而在計算機或其他可編程設備上執行的指令提供用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
[0099]顯然,本領域的技術人員可以對本發明進行各種改動和變型而不脫離本發明的精神和范圍。這樣,倘若本發明的這些修改和變型屬于本發明權利要求及其等同技術的范圍之內,則本發明也意圖包含這些改動和變型在內。
【權利要求】
1.一種輸出語音的方法,應用于一電子設備,其特征在于,所述方法包括: 獲得第一待輸出內容; 分析所述第一待輸出內容,獲得第一情緒信息,所述第一情緒信息用于表示所述第一待輸出內容所攜帶的情緒; 獲得所述第一待輸出內容對應的第一待輸出語音數據; 基于所述第一情緒信息,對所述第一待輸出語音數據進行處理,產生包含第二情緒信息的第二待輸出語音數據,其中,所述第二情緒信息用于表示所述電子設備在輸出所述第二待輸出語音數據時以使得用戶獲得所述電子設備的情緒,其中,所述第一情緒信息與所述第二情緒信息相匹配/相關聯; 輸出所述第二待輸出語音數據。
2.如權利要求1所述的方法,其特征在于,所述獲得第一待輸出內容具體為: 獲取通過即時通信應用接收到的語音數據; 獲取通過所述電子設備的聲音輸入裝置錄入的語音數據;或者 獲取顯示在所述電子設備的顯示單元上的文本信息。
3.如權利要求2所述的方法,其特征在于,當所述第一待輸出內容為所述語音數據時,所述分析所述第一待輸出內容,獲得第一情緒信息,具體包括: 分別將所述語音數據的音頻譜與M個特征頻譜模板中的每一個特征頻譜模板進行對t匕,獲得所述語音數據·的音頻譜與所述每一個特征頻譜模板的M個對比結果,其中M為大于等于2的整數; 基于所述M個對比結果,確定所述語音數據的音頻譜與所述M個特征頻譜模板中相似度最高的特征頻譜模板; 確定所述相似度最高的特征頻譜模板所對應的情緒信息為所述第一情緒信息。
4.如權利要求1所述的方法,其特征在于,所述對所述第一待輸出語音數據進行處理,產生包含第二情緒信息的第二待輸出語音數據,具體包括: 調整所述第一待輸出語音數據所對應的字的聲調、音量、或字與字間的停頓時間,產生所述第二待輸出語音數據。
5.一種語音交互的方法,應用于一電子設備,其特征在于,所述方法包括: 接收一用戶輸入的第一語音數據; 分析所述第一語音數據,獲得第一情緒信息,所述第一情緒信息用于表示輸入所述第一語音數據的用戶在輸入所述第一語音數據時的情緒; 獲得一針對所述第一語音數據的第一回應語音數據; 基于所述第一情緒信息對所述第一回應語音數據進行處理,產生包含第二情緒信息的第二回應語音數據;所述第二情緒信息用于表示所述電子設備在輸出所述第二回應語音數據時以使得所述用戶獲得所述電子設備的情緒,其中,所述第一情緒信息與所述第二情緒信息相匹配/相關聯; 輸出所述第二回應語音數據。
6.如權利要求5所述的方法,其特征在于,所述分析所述第一語音數據,獲得第一情緒信息,具體包括: 分別將所述第一語音數據的音頻譜與M個特征頻譜模板中的每一個特征頻譜模板進行對比,獲得所述第一語音數據的音頻譜與所述每一個特征頻譜模板的M個對比結果,其中M為大于等于2的整數; 基于所述M個對比結果,確定所述第一語音數據的音頻譜與所述M個特征頻譜模板中相似度最高的特征頻譜模板; 確定所述相似度最高的特征頻譜模板所對應的情緒信息為所述第一情緒信息。
7.如權利要求5所述的方法,其特征在于,所述分析所述第一語音數據,獲得第一情緒信息,具體包括: 判斷所述第一語音數據的連續輸入次數是否大于一預定值; 當所述連續輸入次數大于一預定值時,確定所述第一語音數據中的情緒信息為所述第一情緒信息。
8.如權利要求5所述的方法,其特征在于,所述基于所述第一情緒信息對所述第一回應語音數據進行處理,產生包含第二情緒信息的第二回應語音數據,具體包括: 調整所述第一回應語音數據所對應的字的聲調、音量、或字與字間的停頓時間,產生所述第二回應語音數據。
9.如權利要求5所述的方法,其特征在于,所述基于所述第一情緒信息對所述第一回應語音數據進行處理,產生包含第二情緒信息的第二回應語音數據,具體為: 基于所述第一情緒信息,在所述第一回應語音數據上增加一用于表示所述第二情緒信息的語音數據,獲得所述第二回應語音數據。
10.一種電子設備,其特征在于,包括: 電路板; 獲得單元,電性連接于所述電路板,用于獲得第一待輸出內容; 處理芯片,設置于所述電路板上,用于分析所述第一待輸出內容,獲得第一情緒信息,所述第一情緒信息用于表示所述待輸出內容所攜帶的情緒;獲得所述第一待輸出內容對應的第一待輸出語音數據;基于所述第一情緒信息,對所述第一待輸出語音數據進行處理,產生包含第二情緒信息的第二待輸出語音數據,其中,所述第二情緒信息用于表示所述電子設備在輸出所述第二待輸出語音數據時以使得用戶獲得所述電子設備的情緒,其中,所述第一情緒信息與所述第二情緒信息相匹配/相關聯; 輸出單元,電性連接于所述處理芯片,用于輸出所述第二待輸出語音數據。
11.如權利要求10所述的電子設備,其特征在于,當所述第一待輸出內容為一語音數據時,所述處理芯片具體用于分別將所述語音數據的音頻譜與M個特征頻譜模板中的每一個特征頻譜模板進行對比,獲得所述語音數據的音頻譜與所述每一個特征頻譜模板的M個對比結果,其中M為大于等于2的整數;基于所述M個對比結果,確定所述語音數據的音頻譜與所述M個特征頻譜模板中相似度最高的特征頻譜模板;確定所述相似度最高的特征頻譜模板所對應的情緒信息為所述第一情緒信息。
12.如權利要求10所述的電子設備,其特征在于,所述處理芯片具體用于調整所述第一待輸出語音數據所對應的字的聲調、音量、或字與字間的停頓時間,產生所述第二待輸出語音數據。
13.—種電子設備,其特征在于,包括: 電路板;語音接收單元,電性連接于所述電路板,用于接收一用戶輸入的第一語音數據; 處理芯片,設置于所述電路板上,用于分析所述第一語音數據,獲得第一情緒信息,所述第一情緒信息用于表示輸入所述第一語音數據的用戶在輸入所述第一語音數據時的情緒;獲得一針對所述第一語音數據的第一回應語音數據;基于所述第一情緒信息對所述第一回應語音數據進行處理,產生包含第二情緒信息的第二回應語音數據;所述第二情緒信息用于表示所述電子設備在輸出所述第二回應語音數據時以使得所述用戶獲得所述電子設備的情緒,其中,所述第一情緒信息與所述第二情緒信息相匹配/相關聯; 輸出單元,電性連接于所述處理芯片,用于輸出所述第二回應語音數據。
14.如權利要求13所述的電子設備,其特征在于,所述處理芯片具體用于分別將所述第一語音數據的音頻譜與M個特征頻譜模板中的每一個特征頻譜模板進行對比,獲得所述第一語音數據的音頻譜與所述每一個特征頻譜模板的M個對比結果,其中M為大于等于2的整數;基于所述M個對比結果,確定所述第一語音數據的音頻譜與所述M個特征頻譜模板中相似度最高的特征頻譜模板;確定所述相似度最高的特征頻譜模板所對應的情緒信息為所述第一情緒信息。
15.如權利要求13所述的電子設備,其特征在于,所述處理芯片具體用于判斷所述第一語音數據的連續輸入次數是否大于一預定值;當所述連續輸入次數大于一預定值時,確定所述第一語音數據中的情緒信息為所述第一情緒信息。
16.如權利要求13所述的電子設備,其特征在于,所述處理芯片具體用于調整所述第一回應語音數據所對應的字 的聲調、音量、或字與字間的停頓時間,產生所述第二回應語音數據。
17.如權利要求13所述的電子設備,其特征在于,所述處理芯片具體用于基于所述第一情緒信息,在所述第一回應語音數據上增加一用于表示所述第二情緒信息的語音數據,獲得所述第二回應語音數據。
【文檔編號】G06F3/16GK103543979SQ201210248179
【公開日】2014年1月29日 申請日期:2012年7月17日 優先權日:2012年7月17日
【發明者】戴海生, 王茜鶯, 汪浩 申請人:聯想(北京)有限公司