支持語音對話功能的移動終端和語音對話方法
【專利摘要】提供一種支持語音對話功能的移動終端和語音對話方法,該方法用于基于用戶的當前情緒狀態、年齡和性別輸出不同的內容。支持語音對話功能的移動終端包括:顯示單元;音頻處理單元;控制單元,響應于用戶輸入而選擇對應于與用戶相關聯的第一標準的內容,基于與用戶相關聯的第二標準確定內容輸出方案,根據內容輸出方案通過顯示單元和音頻處理單元輸出選擇的內容。
【專利說明】支持語音對話功能的移動終端和語音對話方法
【技術領域】
[0001]本發明涉及具備語音對話功能的移動終端以及語音對話控制方法,更具體地說,涉及一種用于根據用戶的當前情緒、年齡和性別區別地輸出內容的具備語音對話功能的終端和語音對話控制方法。
【背景技術】
[0002]傳統的語音對話功能以這樣的方式操作:從由終端生產商提供的基本回答集合中選擇針對用戶問題的回答。因此,語音對話功能被限制為針對相同的問題給出相同的回答,而不考慮用戶。這意味著當多個用戶使用具備語音對話功能的終端時,傳統的語音對話功能不提供針對用戶優選的回答。
【發明內容】
[0003]做出本發明以解決至少上述問題和缺點,并提供至少下述優點。因此,本發明的一方面提供一種用于輸出反應用戶的當前情緒狀態、年齡和性別的內容的移動終端及其語音對話控制方法。
[0004]根據本發明的一方面,提供一種支持語音對話功能的移動終端。該移動終端包括:顯示單元;音頻處理單元;控制單元,被配置為響應于用戶輸入而選擇對應于與用戶相關聯的第一標準的內容,基于與用戶相關聯的第二標準確定內容輸出方案,根據內容輸出方案通過顯示單元和音頻處理單元輸出選擇的內容。
[0005]根據本發明的另一方面,提供一種移動終端的語音對話方法。該方法包括:響應于用戶輸入選擇對應于與用戶相關聯的第一標準的內容;基于與用戶相關聯的第二標準確定內容輸出方案;根據內容輸出方案通過移動終端的顯示單元和音頻處理單元輸出選擇的內容。
【專利附圖】
【附圖說明】
[0006]從下面結合附圖的詳細描述中,本發明的實施例的以上和其他方面、特點和優點將變得清楚,在附圖中:
[0007]圖1是示出根據本發明實施例的移動終端100的配置的框圖;
[0008]圖2是示出根據本發明實施例的語音對話功能控制方法的流程圖;
[0009]圖3是在根據本發明實施例的語音對話控制方法中使用的將情緒狀態與內容進行映射的表;
[0010]圖4和圖5是示出根據本發明實施例的基于第一標準輸出的內容的屏幕顯示的示圖;
[0011]圖6是示出圖2的第一標準獲得步驟的細節的流程圖;
[0012]圖7是在根據本發明實施例的語音對話控制方法中使用的將情緒狀態與內容進行映射的表;[0013]圖8和圖9是示出根據本發明實施例的基于第一標準輸出的內容的屏幕顯示的示圖;
[0014]圖10是在根據本發明實施例的語音對話控制方法中使用的將情緒狀態與內容進行映射的表;
[0015]圖11是示出根據本發明實施例的基于第一標準輸出的內容的屏幕顯示的示圖;
[0016]圖12是示出根據本發明實施例的用于移動終端的語音對話功能的系統的示意圖。
【具體實施方式】
[0017]下面將參照附圖更全面地描述本發明,在附圖中示出本發明的示意性實施例。然而,本發明可被實施為多種不同的形式,并不應被解釋為限制于這里闡述的實施例。而是,提供這些實施例從而使本發明的描述將是全面且完整的,并且將本發明的范圍完整地傳達給本領域技術人員。本發明將由權利要求所限定。
[0018]雖然以下參照附圖更詳細地描述序號,在附圖中示出本發明的示意性實施例,但是本發明可被實施為多種不同的形式,并不應被術語限制,所述術語僅用于將一個元件、區域、層或區間與另一元件、區域、層或區間區分開來。因此,在不脫離本發明構思的教導的情況下,下面討論的第一元件、組件、區域、層或區間可以被稱為第二元件、組件、區域、層或區間。應理解,當使用連接詞“和/或”等來描述一個或多個相關的列出項目時,描述包括所述一個或多個相關的列出項目的任意和所有組合。
[0019]圖1是示出根據本發明實施例的移動終端100的配置的框圖。
[0020]參照圖1,移動終端100包括無線電通信單元110、相機單元120、位置測量單元130、音頻處理單元140、顯示單元150、存儲單元160和控制單元170。
[0021]無線電通信單元110發送/接收攜帶數據的無線電信號。無線電通信單元110可包括被配置為對發送信號進行上轉換和放大的射頻(RF)發送器以及被配置為對接收的信號進行低噪放大和下轉換的RF接收器。無線電通信單元110將通過無線電信道接收到的數據傳輸到控制單元170,并將從控制單元170輸出的數據通過無線電信道發送出去。
[0022]相機單元120接收視頻信號。相機單元120處理在視頻會議模式下或圖像拍攝模式下由圖像傳感器獲得的靜止圖像或運動圖像的視頻幀。相機單元120可將處理后的視頻幀輸出到顯示單元150。由相機單元120處理的視頻幀可被存儲在存儲單元中和/或通過無線電通信單元110被發送到外部。
[0023]根據移動終端110的實現方式,相機單元120可包括兩個或更多個相機模塊。例如,移動終端100可包括朝向與顯示單元150的屏幕相同方向的相機以及朝向與屏幕相反方向的另一相機。
[0024]位置測量單元130可設置有衛星信號接收模塊,用于基于從衛星接收到的信號測量移動終端100的當前位置。通過無線電通信單元110,位置測量單元130還可基于從設施內的內部或外部無線電通信設備接收到的信號來測量移動終端100的當前位置。
[0025]音頻處理單元140可設置有編解碼器組,編解碼器組包括用于處理包數據的數據編解碼器和用于處理諸如語音的音頻信號的音頻編解碼器。音頻處理單元140可通過音頻編解碼器將數字音頻信號轉換為模擬音頻信號,從而通過揚聲器(SPK)輸出模擬信號,音頻處理單元140可將通過麥克風(MIC)輸入的模擬信號轉換為數字音頻信號。
[0026]顯示單元150以可視方式向用戶顯示菜單、輸入數據、功能配置信息等。顯示單元150輸出啟動屏幕、待機屏幕、菜單屏幕、通話屏幕和其他應用執行屏幕。
[0027]可利用液晶顯示器(IXD)、有機發光二極管(0LED)、有源矩陣OLED (AM0LED)、柔性顯示器和3維(3D)顯示器來實現顯示單元150。
[0028]存儲單元160存儲移動終端100的操作所需要的程序和數據,并可被劃分為程序區域和數據。程序區域可存儲用于控制移動終端100的整體操作的基本程序、用于啟動移動終端100的操作系統(OS)、多媒體內容回放應用和用于執行可選功能(諸如語音對話、相機、音頻回放和視頻回放)的其他應用。數據區域可存儲在使用移動終端100的狀態下產生的數據,諸如靜止和運動圖像、電話簿和音頻數據。
[0029]控制單元170控制移動終端100的組件的整體操作。在根據用戶操縱執行的語音對話功能中,控制單元170接收通過音頻處理單元140輸入的用戶語音,并控制顯示單元150顯示與用戶語音相應的內容。控制單元170還可通過音頻處理單元140播放與用戶語音相應的內容。這里,內容可包括多媒體內容(諸如文本、圖片、語音、電影和視頻片段)和諸如天氣、推薦位置和最喜愛聯系人的信息中的至少一個。
[0030]更具體地說,控制單元170識別用戶語音以獲得相應文本。接下來,控制單元170檢索與文本相應的內容并通過顯示單元150和音頻處理單元140中的至少一個輸出內容。最后,控制單元170可檢查文本的意思以在存儲在存儲單元160中的相關內容中檢索相應內容。以這種方式,通過使用交互語音通信,可通過相關的存儲內容向用戶提供期望的信息。例如,如果用戶說出“今天的天氣? ”,則移動終端100接收通過音頻處理單元140輸入的用戶語音。之后移動終端100檢索與從用戶語音獲得的文本“今天的天氣”相應的內容(天氣信息),并通過顯示單元150和音頻處理單元140中的至少一個輸出檢索到的內容。
[0031]具體地說,在本發明的實施例中,控制單元170可根據用戶的當前情緒、年齡和性別選擇將通過顯示單元150和/或音頻處理單元140輸出的內容。為了完成該目的,根據本發明的實施例,控制單元170可包括內容選擇模塊171和內容輸出模塊175。
[0032]圖2是示出根據本發明實施例的語音對話功能控制方法的流程圖。
[0033]參照圖2,如果在步驟S210執行語音對話功能,則在步驟S220,內容選擇模塊171獲得與用戶相關聯的第一標準。這里,第一標準可包括用戶的當前情緒狀態。情緒狀態表示諸如高興、悲傷、憤怒、驚訝等的感情或感受。
[0034]在步驟S230,內容選擇模塊171確定是否檢測到用戶語音輸入。如果通過語音處理單元140檢測到用戶語音輸入,則在步驟S240,內容選擇模塊171基于第一標準選擇與用戶語音輸入相應的內容。更具體地說,內容選擇模塊171從用戶語音獲得短語。接下來,內容選擇模塊171檢索與短語相應的內容。接下來,內容選擇模塊171使用基于第一標準預定的情緒狀態信息選擇內容之一。這里,情緒狀態特定的內容信息可以被預配置并被存儲在存儲單元160中。內容選擇模塊171還可首先基于第一標準檢索內容并隨后選擇與短語相應的內容之一。
[0035]另一方面,如果在步驟S230沒有檢測到用戶語音輸入,則在步驟S250,內容選擇模塊171基于第一標準選擇內容。
[0036]如果內容被選擇,則在步驟S260,內容輸出模塊175獲得與用戶相關聯的第二標準。這里,第二標準可包括用戶年齡和性別中的至少一個。用戶年齡可以是精確的用戶年齡,或者是預定年齡組之一。例如,可利用精確的數字(諸如30或50)指示用戶年齡,或利用年齡組(諸如20幾歲、50幾歲、兒童、成人和老年人)指示用戶年齡。
[0037]具體地說,內容輸出模塊從相機單元120接收用戶的面部圖像。內容輸出模塊175可基于存儲在存儲單元160中的按照年齡組或按照性別的平均面部信息從用戶的面部圖像自動獲得第二標準。內容輸出模塊175還接收通過語音處理單元140輸入的用戶語音。接下來,內容輸出模塊175可使用按照年齡組或按照性別的平均語音信息從用戶語音獲得第二標準。內容輸出模塊175還可基于構成從用戶語音獲得的短語的詞語來獲得第二標準。此時,內容輸出模塊175可使用按照年齡組或按照性別的詞語來獲得第二標準。例如,如果從用戶語音獲得短語“我想要新的jim-jam”,則可基于詞語“jim-jam”判斷該用戶是兒童。
[0038]內容輸出模塊175可基于用戶面部圖像和語音兩者獲得第二標準。雖然描述針對內容輸出模塊175基于用戶面部圖像和語音獲得第二標準的情況,但是本發明的各種實施例不限于此,而是可被實施為能夠使用戶輸入第二標準。在此情況下,由用戶輸入的第二標準可被存儲在存儲單元160中。內容輸出模塊175基于存儲在存儲單元160中的第二標準執行預定功能。
[0039]如果獲得了第二標準,則在步驟S270,內容輸出模塊175基于第二標準確定內容輸出方案。也就是說,內容輸出模塊175通過改變構成由內容選擇模塊171選擇的內容的詞語、選擇的內容的輸出速度以及選擇的內容的輸出大小,來確定內容輸出方案。
[0040]更具體地說,內容輸出模塊175可基于按照年齡組的詞語信息或按照性別的詞語信息來將構成選擇的內容的詞語改變為適合于第二標準的詞語。例如,如果內容包括“Pajamas商店”并且如果用戶屬于“兒童”年齡組,則內容輸出模塊175將詞語“Pajamas”改為適合于兒童的詞語“Jim jam”。
[0041]內容輸出模塊175基于存儲在存儲單元160中的按照年齡組的輸出速度信息或按照性別的輸出速度信息確定選擇的內容的輸出速度。例如,如果用戶屬于“兒童”或“老年人”年齡組,則內容輸出模塊175可降低選擇的內容的語音回放速度。
[0042]內容輸出模塊175還基于按照年齡組的輸出大小信息或按照性別的輸出大小信息確定選擇的內容的輸出大小。例如,如果用戶屬于“老年人”年齡組,則內容輸出模塊175可基于按照年齡組的輸出大小信息增加選擇的內容的輸出音量以及選擇的內容的顯示大小(例如,字體大小)。存儲單元160存儲包含年齡組或性別到內容輸出方案(內容輸出速度和大小)的映射的表,并且內容輸出模塊175基于存儲在表映射中的數據確定選擇的內容的輸出方案。如果選擇了內容輸出方案,則在步驟S280,內容輸出模塊175根據內容輸出方案通過顯示單元150和音頻處理單元140輸出由內容選擇模塊171選擇的內容。
[0043]之后,如果在步驟S290檢測到語音對話功能終止請求,則控制單元170結束語音對話功能。如果在步驟S290沒有檢測到語音對話功能終止請求,則控制單元170將處理返回步驟S220。
[0044]如上所述,本發明的語音對話控制方法選擇適合于用戶的當前情緒狀態的內容,并根據用戶的年齡和/或性別確定內容輸出方案,從而向用戶提供個性化的內容。該方法能夠提供更逼真的語音對話功能。[0045]同時,如果從通過語音處理單元140輸入的用戶語音獲得的短語是用于改變內容輸出方案的請求,則內容輸出模塊175根據短語改變內容輸出方案。例如,在已經根據基于第二標準確定的內容輸出方案輸出內容之后,如果用戶說出短語“你能更快更輕地說話嗎? ”,則控制輸出模塊175將語音回放速度增加一級并將音頻音量減小一級。
[0046]內容輸出模塊175可將改變后的內容輸出方案存儲在存儲單元160中。之后,內容輸出模塊175使用先前存儲的內容輸出方案歷史改變基于第二標準確定的內容輸出方案。內容輸出模塊175可根據改變后的內容輸出方案輸出選擇的內容。
[0047]下面參照圖3至圖5描述根據本發明實施例的內容輸出處理。
[0048]圖3是在根據本發明實施例的語音對話控制方法中使用的將情緒狀態與內容進行映射的表。圖4和圖5是示出根據本發明實施例的基于第一標準輸出的內容的屏幕顯示的示圖。
[0049]參照圖3,內容被預先映射到情緒狀態。情緒狀態“高興”被映射到內容A,情緒狀態“悲傷”被映射到內容B,情緒狀態“憤怒”被映射到內容C,情緒狀態“驚訝”被映射到內容D。這些情緒狀態和內容被預先映射并被存儲在存儲單元160中。
[0050]內容選擇模塊171可在按照情緒狀態的內容中選擇適合于第一標準(用戶的當前情緒狀態)的內容。
[0051]參照圖4,基于從通過音頻處理單元140輸入的用戶語音獲得的短語UT以及第一標準(用戶的當前情緒狀態),內容選擇模塊171選擇針對情緒狀態“高興”的內容A (ATI)和針對情緒狀態“悲傷”的內容B (AT2 )。
[0052]參照圖5,基于第一標準(用戶的當前情緒狀態),內容選擇模塊171選擇針對情緒狀態“憤怒”的內容C (ATI)和針對情緒狀態“驚訝”的內容D (AT2)。
[0053]雖然圖3針對每個情緒狀態映射一個內容項目,但是本發明不限于此,而是可被實施為每個情緒狀態映射多個內容項目。在此情況下,內容選擇模塊171可隨機地選擇與第一標準(用戶的當前情緒狀態)相應的多個內容之一。
[0054]
[0055]可按照情緒狀態對內容進行分組。“內容組”表示具有相同/相似屬性的內容的集合。例如,內容組可被分類為“動作”電影內容組、“R&B”音樂內容組等中的一個。在此情況下,內容選擇模塊171可隨機地選擇滿足第一標準(用戶的當前情緒狀態)的內容組的內容
之一 O
[0056]圖6是示出圖2的第一標準獲得步驟的細節的流程圖。
[0057]參照圖6,內容選擇模塊171在步驟S310從相機單元120獲得用戶的面部圖像,并在步驟S320從面部圖像檢測面部區域。也就是說,內容選擇模塊171檢測具有眼、鼻和嘴的面部區域。
[0058]接下來,內容選擇模塊171在步驟S330提取眼、鼻和嘴的基準點,并在步驟S340基于基準點識別面部表情。也就是說,內容選擇模塊171基于存儲在存儲單元160中的按照表情的基準點信息識別用戶的當前表情。
[0059]之后,在步驟S350,內容選擇模塊171基于表情自動地檢索第一標準,所述表情基于預定的按照情緒狀態的表情信息被確定。這里,按照情緒狀態的表情信息可以被預先配置并被存儲在存儲單元160中。[0060]雖然描述針對內容選擇模塊171基于用戶的面部圖像獲得第一標準的情況,但是本發明不限于此,而是可被實施為能夠使用戶輸入第一標準。
[0061]下面參照圖7至圖9描述根據本發明實施例的另一內容輸出處理。
[0062]圖7是在根據本發明實施例的語音對話控制方法中使用的將情緒狀態與內容進行映射的表。圖8和圖9是示出根據本發明實施例的基于第一標準輸出的內容的屏幕顯示的示圖。
[0063]內容選擇模 塊171可使用用戶的過去內容回放歷史,基于第一標準(用戶的當前情緒狀態)選擇內容。過去內容回放歷史被存儲在存儲單元160中,并且每當內容根據用戶操縱被播放時都被更新。
[0064]參照圖7,回放的次數或各個內容項目被存儲在存儲單元160中。內容Al被播放三次,內容A2被播放十次,內容BI被播放五次,內容B2被播放兩次,內容Cl被播放八次,內容C2被播放十五次,內容Dl被播放兩次,內容D2被播放一次。內容Al和A2被映射到情緒狀態“高興”,內容BI和B2被映射到情緒狀態“悲傷”,內容Cl和C2被映射到情緒狀態“憤怒”,內容Dl和D2被映射到情緒狀態“驚訝”(見圖3)。
[0065]內容選擇模塊171可基于過去內容回放歷史選擇適合于第一標準(用戶的當前情緒狀態)的多個內容之一。
[0066]參照圖8,如果第一標準(用戶的當前情緒)是“高興”,則內容選擇模塊171從映射到第一標準(用戶的當前情緒)的內容Al和A2中選擇已被更頻繁地播放的內容A2 (ATl)0如果第一標準(用戶的當前情緒)是“悲傷”,則內容選擇模塊171從映射到第一標準(用戶的當前情緒)的內容BI和B2中選擇已被更頻繁地播放的內容BI (AT2)。
[0067]此時,內容選擇模塊171可選擇映射到第一標準(用戶的當前情緒)的多個內容。然后,內容輸出模塊175可基于過去內容回放歷史確定多個內容的輸出位置。
[0068]參照圖9,如果第一標準(用戶的當前情緒)是“高興”,則內容選擇模塊171選擇內容Al和A2兩者作為滿足第一標準(用戶的當前情緒)的內容(ATI)。然后,內容輸出模塊175將內容Al布置在已被更頻繁地播放的內容A2之下(AT I)。如果第一標準(用戶的當前情緒)是“悲傷”,則內容選擇模塊171選擇內容BI和B2兩者作為滿足第一標準(用戶的當前情緒)的內容(AT2)。然后,內容輸出模塊175將內容B2布置在已被更頻繁地播放的內容BI之下(AT2)。
[0069]下面參照圖10和圖11描述根據本發明實施例的另一內容輸出處理。
[0070]圖10是在根據本發明實施例的語音對話控制方法中使用的將情緒狀態與內容進行映射的表。圖11是示出根據本發明實施例的基于第一標準輸出的內容的屏幕顯示的示圖。
[0071]內容選擇模塊171可基于第一標準(用戶的當前情緒狀態)和用戶的基于過去情緒狀態的內容輸出歷史來選擇內容。用戶的基于過去情緒狀態的內容輸出歷史被存儲在存儲單元160中,并且在語音對話功能激活時,每當內容根據用戶的情緒狀態被輸出時都被更新。
[0072]參照圖10,基于過去情緒狀態的內容輸出次數被存儲在存儲單元160中。內容Al已經被輸出二次,內各A2已經被輸出八次,內各BI已經被輸出四次,內各B2已經被輸出一次,內容Cl已經被輸出三次,內容C2已經被輸出十一次,內容Dl已經被輸出兩次,內容D21已經被輸出五次。
[0073]內容選擇模塊171可使用基于過去情緒狀態的內容輸出歷史來選擇被映射到第一標準(用戶的當前情緒狀態)的多個內容之一。
[0074]參照圖11,如果第一標準(用戶的當前情緒狀態)是“高興”,則內容選擇模塊171從內容Al和A2中選擇與用戶的過去情緒狀態相關聯的已被更頻繁地輸出的內容A2作為與第一標準相應的內容(ATI)。如果第一標準(用戶的當前情緒)是“悲傷”,則內容選擇模塊171從內容BI和B2中選擇與用戶的過去情緒狀態相關聯的已被更頻繁地輸出的內容B2作為與第一標準(用戶的當前情緒狀態)相應的內容(AT2)
[0075]內容選擇模塊171可選擇被映射為滿足第一標準(用戶的當前情緒狀態)的所有內容。然后,內容輸出模塊175使用基于過去情緒狀態的內容輸出歷史確定多個內容的輸出位置。例如,如果第一標準(用戶的當前情緒狀態)是“高興”,則內容選擇模塊171選擇內容Al和A2兩者作為與第一標準(用戶的當前情緒狀態)相應的內容。然后,內容輸出模塊175將內容Al布置在內容A2之下,其中,根據過去的用戶情緒狀態,內容A2已被更頻繁地播放。
[0076]下面描述根據本發明實施例的另一內容輸出處理。
[0077]內容選擇模塊171可基于第一標準(用戶的當前情緒狀態)使用通過位置測量單元130獲得的移動終端100的當前位置選擇內容。更具體地說,內容選擇模塊171基于第一標準(用戶的當前情緒狀態)獲得多個內容。接下來,內容選擇模塊171從獲得的內容中選擇與在移動終端的當前位置的預定半徑范圍內的區域相關聯的內容。例如,如果內容是關于推薦地點(飯店、咖啡廳等)的信息,則內容供選擇模塊171可基于移動終端的當前位置信息選擇適合于移動終端100的當前位置的內容。
[0078]當然,內容選擇模塊171可獲得與在移動終端的當前位置的預定半徑范圍內的區域相關聯的多個內容,然后從獲得的內容中選擇滿足第一標準(用戶的當前情緒狀態)的內容。
[0079]雖然描述針對控制單元170、內容選擇模塊171和內容輸出模塊175被單獨配置且負責不同功能的情況,但是本發明不限于此,而是可被實施為控制單元、內容選擇模塊和內容輸出模塊以集成方式操作的形式。
[0080]圖12是示出根據本發明實施例的移動終端的語音對話功能的系統的示意圖。
[0081]由于這里的移動終端100與以上參照圖1描述的移動終端相同,因此在此省略對移動終端100的詳細描述。根據本發明實施例的移動終端100通過無線通信網絡300連接到服務器200。
[0082]在以上描述的實施例中,移動終端100的控制單元170執行第一標準獲得操作、基于第一標準的內容選擇操作、第二標準獲得操作以及內容輸出方案確定操作。
[0083]然而,在此實施例中,移動終端100的控制單元170通過無線電通信單元100與服務器交換數據,并且執行第一標準獲得操作、基于第一標準的內容選擇操作、第二標準獲得操作以及內容輸出方案確定操作。
[0084]例如,移動終端100的控制單元170向服務器200提供通過相機單元120輸入的用戶的面部圖像以及通過音頻處理單元140輸入的用戶語音。然后,服務器200基于用戶的面部圖像和用戶語音獲得第一標準和第二標準。服務器200向移動終端100提供獲得的第一標準和第二標準。
[0085]雖然在單個用戶的假設下進行了描述,但是本發明不限于此,并且本發明也可被應用于多個用戶使用移動終端100的情況。在此情況下,需要添加識別移動終端100的當前用戶的操作。可以按照用戶來存儲用戶的過去內容輸出方案歷史、用戶的過去內容回放歷史以及用戶的基于過去情緒狀態的內容輸出歷史。因此,即使當多個用戶使用移動終端100時,也可提供針對用戶的內容。
[0086]如上所述,本發明的具備語音對話功能的移動終端和語音對話控制方法能夠選擇適合于用戶的當前情緒狀態的內容并根據用戶的年齡和性別確定內容輸出方案。因此,可提供為單個用戶定制的內容。因此,本發明能夠實現逼真的語音對話功能。
[0087]雖然在上面已經詳細描述了本發明的實施例,但是本領域普通技術人員應理解和清楚,在不脫離由權利要求及其等同物限定的本發明的精神和范圍的情況下,這里描述的基本發明構思的多種改變和修改仍落入本發明的精神和范圍內。
【權利要求】
1.一種支持語音對話功能的移動終端,該移動終端包括: 顯示單元; 音頻處理單元; 控制單元,被配置為響應于用戶輸入而選擇對應于與用戶相關聯的第一標準的內容,基于與用戶相關聯的第二標準確定內容輸出方案,根據內容輸出方案通過顯示單元和音頻處理單元輸出選擇的內容。
2.如權利要求1所述的移動終端,其中,第一標準是用戶的當前情緒狀態,第二標準是包括用戶 的年齡和性別中的至少一個的用戶信息。
3.如權利要求1所述的移動終端,其中,控制單元選擇與第一標準相應的內容,所述相應的內容包括預定的根據用戶的情緒狀態的至少一個內容。
4.如權利要求1所述的移動終端,其中,控制單元基于第一標準和用戶的過去內容回放歷史選擇內容。
5.如權利要求1所述的移動終端,其中,控制單元基于第一標準和移動終端的當前位置信息選擇內容。
6.如權利要求1所述的移動終端,其中,控制單元基于與用戶的過去情緒狀態相關聯的內容輸出歷史選擇內容。
7.如權利要求1所述的移動終端,其中,音頻處理單元接收用戶的語音,控制單元基于第一標準選擇與從所述語音獲得的短語相應的內容。
8.如權利要求7所述的移動終端,其中,控制單元基于構成所述短語的詞語獲得第二標準。
9.如權利要求1所述的移動終端,其中,控制單元基于第二標準改變構成內容的詞語、內容的輸出速度和內容的輸出大小中的至少一個,并根據內容輸出方案輸出內容。
10.如權利要求1所述的移動終端,其中,音頻處理單元接收用戶的語音,并且當從語音獲得的短語是用于改變內容輸出方案的請求時,控制單元改變內容輸出方案。
11.如權利要求1所述的移動終端,其中,控制單元使用用戶的過去內容輸出方案歷史改變基于第二標準確定的內容輸入方案,并根據改變的內容輸出方案輸出內容。
12.如權利要求1所述的移動終端,還包括:相機單元,拍攝用戶的面部圖像,其中,控制單元基于用戶的面部圖像自動地獲得第一標準。
13.如權利要求12所述的移動終端,其中,控制單元基于從用戶的面部圖像獲得的面部表情從預定的按照情緒狀態的表情信息獲得第一標準。
14.如權利要求1所述的移動終端,還包括:相機單元,拍攝用戶的面部圖像,其中,音頻處理單元接收用戶的語音,并且控制單元基于用戶的面部圖像和用戶的語音中的至少一個來自動地獲得第二標準。
15.如權利要求1所述的移動終端,其中,控制單元通過音頻處理單元接收第一標準和第二標準。
16.一種移動終端的語音對話方法,該方法包括: 響應于用戶輸入選擇對應于與用戶相關聯的第一標準的內容; 基于與用戶相關聯的第二標準確定內容輸出方案; 根據內容輸出方案通過移動終端的顯示單元和音頻處理單元輸出選擇的內容。
17.如權利要求16所述的方法,其中,第一標準是用戶的當前情緒狀態,第二標準是包括用戶的年齡和性別中的至少一個的用戶信息。
18.如權利要求16所述的方法,其中,選擇內容的步驟包括:選擇與第一標準相應的內容,所述相應的內容包括預定的根據用戶的情緒狀態的至少一個內容。
19.如權利要求16所述的方法,其中,選擇內容的步驟包括:基于第一標準和用戶的過去內容回放歷史選擇內容。
20.如權利要求16所述的方法,其中,選擇內容的步驟包括:基于第一標準和移動終端的當前位置信息選擇內容。
21.如權利要求16所述的方法,其中,選擇內容的步驟包括:基于與用戶的過去情緒狀態相關聯的內容輸出歷史選擇內容。
22.如權利要求16所述的方法,還包括:接收用戶的語音,其中,選擇內容的步驟包括基于第一標準選擇與從所述語音獲得的短語相應的內容。
23.如權利要求22所述的方法,還包括:基于構成所述短語的詞語獲得第二標準。
24.如權利要求16所述的方法,其中,確定內容輸出方案的步驟包括:基于第二標準改變構成內容的詞語、內容的輸出速度和內容的輸出大小中的至少一個,并根據內容輸出方案輸出內容。
25.如權利要求24所述的方法,還包括:接收用戶的語音,其中,確定內容輸出方案的步驟包括:當從語音 獲得的短語是用于改變內容輸出方案的請求時,改變內容輸出方案。
26.如權利要求16所述的方法,其中,確定內容輸出方案的步驟包括:使用用戶的過去內容輸出方案歷史改變基于第二標準確定的內容輸出方案。
27.如權利要求16所述的方法,還包括: 接收用戶的面部圖像; 基于用戶的面部圖像自動地獲得第一標準。
28.如權利要求27所述的方法,其中,獲得第一標準的步驟包括:基于從用戶的面部圖像獲得的面部表情從預定的按照情緒狀態的表情信息獲得第一標準。
29.如權利要求16所述的方法,還包括: 接收用戶的面部圖像和語音中的至少一個; 基于用戶的面部圖像和語音中的至少一個自動地獲得第二標準。
30.如權利要求16所述的方法,還包括:通過音頻處理單元接收第一標準和第二標準。
【文檔編號】H04M1/725GK103984408SQ201410044807
【公開日】2014年8月13日 申請日期:2014年2月7日 優先權日:2013年2月7日
【發明者】安智賢, 金少拉, 金鎮龍, 金賢璟, 金熙云, 安由美 申請人:三星電子株式會社