根據用戶數據輸入提供信息的終端設備、程序和服務器設備的制造方法
【專利摘要】提供了一種減輕用戶在通過語音發出指令時所經歷的困難的方法。如果用戶在終端設備上執行預定操作,則終端設備顯示對話畫面并且等待語音指令。當自開始顯示對話畫面以用于等待狀態起過去了預定時間段而用戶沒有發出語音指令時,終端設備顯示根據用戶的屬性或用戶所在的環境的屬性來提示語音質量的文本。即使用戶不確定語音指令的內容,也可根據所顯示的提示來發出語音指令。因此允許流暢地發出語音指令。
【專利說明】
根據用戶數據輸入提供信息的終端設備、程序和服務器設備
技術領域
[0001]本發明涉及一種根據用戶對終端設備的數據輸入向用戶提供信息的機制。
【背景技術】
[0002]存在一種使得終端設備能夠執行符合其用戶通過語音(speech)發出的指令的處理的機制(以下,此機制稱作“語音代理系統”)。
[0003]例如,非專利文獻I介紹了由語音代理系統執行的任務的示例。其中一個示例是響應于用戶向智能電話中發出的語音:“搜索這里附近的出租車!”,使得智能電話顯示可向用戶的當前位置派遣出租車的出租車公司的信息的任務。
[0004]引用列表
[0005]非專利文獻
[0006]非專利文獻1:NTT D0C0M0公司的 “What you can do with Shabette Concier”。于2013年10月18 曰從http://www.nttdocom0.c0.jp/service/informat1n/shabette_concier/feature/index.html 檢索。
【發明內容】
[0007]技術問題
[0008]語音代理系統使用戶能夠通過語音來指示終端設備執行期望的處理。通常,與通過字符輸入等發出指令相比,通過語音發出指令(以下稱作“語音指令”)不太費事。然而,不熟悉語音指令的用戶可能不知道他/她應該發出哪種語音以使得終端設備準確地執行符合指令的處理。即使熟悉語音指令的用戶也不可能馬上想出針對他/她所期望的處理的指令的可取語音的內容。
[0009]鑒于上述問題,本發明的目的是減輕用戶在發出語音指令時所經歷的困難。
[0010]問題的解決方案
[0011]為了解決所述問題,本發明提供一種終端設備,該終端設備包括:屬性獲取單元,其獲取表示用戶的屬性或者用戶周圍的環境的屬性的屬性數據;語句獲取單元,其獲取表示提示用戶發出語音指令的語句的提示語句數據,該提示語句數據與屬性數據所表示的屬性相對應;顯示控制單元,其指示顯示設備顯示由提示語句數據表示的語句;語音數據獲取單元,其獲取語音數據,該語音數據表示由用戶響應于顯示設備顯示由提示語句數據表示的語句而發出的語音;處理標識數據獲取單元,其獲取處理標識數據,該處理標識數據標識與語音數據所表示的指令相對應的處理;以及處理執行單元,其執行由處理標識數據標識的處理。
[0012]上述終端設備還可包括向服務器設備發送屬性數據和語音數據的發送單元,并且所述終端設備可被配置如下:語句獲取單元從服務器設備接收作為對發送單元發送的屬性數據的回復而發送的提示語句數據;并且處理標識數據獲取單元從服務器設備接收作為對發送單元發送的語音數據的回復而發送的處理標識數據。
[0013]上述終端設備可被配置如下:發送單元向服務器設備發送提示語句標識數據,該提示語句標識數據標識表示當語音數據獲取單元獲取語音數據時由顯示設備顯示的語句的提示語句數據;并且處理標識數據獲取單元從服務器設備接收作為對語音數據和提示語句標識數據的發送的回復而發送的處理標識數據,所述處理標識數據標識與語音數據表示的指令和提示語句標識數據所標識的語句的組合相對應的處理。
[0014]上述終端設備可被配置如下:屬性獲取單元獲取表示用戶所發出的語音的語音數據作為屬性數據。
[0015]本發明還提供一種服務器設備,該服務器設備包括:接收單元,其從終端設備接收屬性數據,該屬性數據表示終端設備的用戶的屬性或者用戶周圍的環境的屬性;語句獲取單元,其獲取表示提示用戶發出語音指令的語句的提示語句數據,該提示語句數據與屬性數據所表示的屬性相對應;發送單元,其向終端設備發送提示語句數據,其中,所述接收單元接收在發送單元發送提示語句數據之后從終端設備發送的語音數據;語音識別單元,其識別語音數據所表示的指令;以及處理標識數據生成單元,其生成標識與所述指令對應的處理的處理標識數據。所述發送單元向終端設備發送處理標識數據,作為對接收單元接收到的語音數據的回復。
[0016]上述服務器設備還可包括存儲控制單元,并且服務器設備可被配置如下:接收單元從多個終端設備中的每一個接收屬性數據和語音數據;所述存儲控制單元使得存儲設備將接收單元從各個終端設備接收到的屬性數據與指令語句數據彼此關聯地存儲,所述指令語句數據表示由接收單元從終端設備接收到的語音數據表示并且由語音識別單元識別的指令的語句;并且所述語句獲取單元利用與通過接收單元從所述多個終端設備中的一個接收到的屬性數據具有預定關系的屬性數據關聯地存儲在存儲設備中的指令語句數據,生成待從發送單元發送到所述多個終端設備中的所述一個終端設備的提示語句數據。
[0017]上述服務器設備可被配置如下:所述存儲控制單元使存儲設備將指令語句數據與時間數據彼此關聯地存儲,所述時間數據表示指令語句數據所表示的指令的發出時間;并且所述語句獲取單元基于存儲在存儲設備中的多條指令語句數據以及與所述多條指令語句數據關聯地存儲的時間數據來指定表示隨著時間過去而使用頻度增加的指令的指令語句數據,并且利用所指定的指令語句數據來生成待從發送單元發送的提示語句數據。
[0018]上述服務器設備可被配置如下:所述存儲控制單元使存儲設備將指令語句數據與終端標識數據彼此關聯地存儲,所述指令語句數據由語音識別單元從語音數據生成,并且所述終端標識數據標識已發送語音數據的終端設備;并且所述語句獲取單元生成提示與標識所述多個終端設備中的一個的終端標識數據關聯地存儲在存儲設備中的指令語句數據所表示的指令不具有預定相似性的指令的提示語句數據,作為待從發送單元發送到所述多個終端設備中的所述一個終端設備的提示語句數據。
[0019]上述服務器設備還可包括獲取處理間相關性數據的相關性數據獲取單元,該處理間相關性數據表示多個處理項目中包括的兩個任意處理項目之間的相關性的大小,并且服務器設備可被配置如下:所述接收單元接收從終端設備發送的語音數據作為屬性數據;所述語音識別單元識別由屬性數據表示的指令;所述處理標識數據生成單元生成處理標識數據,該處理標識數據標識與屬性數據所表示的指令相對應的處理項目;并且所述語句獲取單元基于與屬性數據所表示的指令所對應的處理項目的相關性的大小從所述多個處理項目當中選擇一個處理項目,并且獲取表示提示針對所選擇的一個處理項目的指令的語句的提示語句數據,作為與屬性數據所表示的屬性相對應的提示語句數據,所述大小由處理間相關性數據表示。
[0020]本發明還提供一種使計算機執行下列處理的程序:獲取表示用戶的屬性或者用戶周圍的環境的屬性的屬性數據的處理;獲取表示提示用戶發出語音指令的語句的提示語句數據的處理,該提示語句數據與所述屬性數據所表示的屬性相對應;指示顯示設備顯示由提示語句數據表示的語句的處理;獲取語音數據的處理,該語音數據表示由用戶響應于顯示設備顯示由提示語句數據表示的語句而發出的語音;獲取處理標識數據的處理,該處理標識數據標識與語音數據所表示的指令對應的處理;以及通過處理標識數據來標識的處理。
[0021]本發明的效果
[0022]本發明提示用戶發出與用戶的屬性或者用戶周圍環境的屬性對應的語音指令。用戶可參考提示的內容來考慮語音的內容。這減輕了用戶發出語音指令時經歷的困難。
【附圖說明】
[0023]圖1示出根據實施方式的語音代理系統的總體配置。
[0024]圖2示出根據實施方式的終端設備的硬件組件。
[0025]圖3示出根據實施方式的終端設備的功能組件。
[0026]圖4示出根據實施方式的服務器設備的硬件組件。
[0027]圖5示出根據實施方式的服務器設備的功能組件。
[0028]圖6示出根據實施方式的服務器設備所使用的屬性數據庫的結構。
[0029]圖7示出根據實施方式的服務器設備所使用的同義詞數據庫的結構。
[0030]圖8示出根據實施方式的服務器設備所使用的相關性數據庫的結構。
[0031]圖9示出根據實施方式的服務器設備所使用的日志數據庫的結構。
[0032]圖1OA示例性地示出根據實施方式的顯示在終端設備的顯示器上的畫面。
[0033]圖1OB示例性地示出根據實施方式的顯示在終端設備的顯示器上的畫面。
[0034]圖1OC示例性地示出根據實施方式的顯示在終端設備的顯示器上的畫面。
[0035]圖1lA示例性地示出根據實施方式的顯示在終端設備的顯示器上的畫面。
[0036]圖1lB示例性地示出根據實施方式的顯示在終端設備的顯示器上的畫面。
[0037]圖1lC示例性地示出根據實施方式的顯示在終端設備的顯示器上的畫面。
[0038]圖1lD示例性地示出根據實施方式的顯示在終端設備的顯示器上的畫面。
[0039]圖12示出由根據實施方式的語音代理系統執行的一系列處理。
[0040]圖13示出根據實施方式的服務器設備使用的指令語句列表的結構。
[0041]圖14A示例性地示出根據變型例的顯示在終端設備的顯示器上的畫面。
[0042]圖14B示例性地示出根據變型例的顯示在終端設備的顯示器上的畫面。
[0043]圖14C示例性地示出根據變型例的顯示在終端設備的顯示器上的畫面。
[0044]圖15示出根據變型例的服務器設備所使用的處理間相關性數據庫的結構。
[0045]圖16示出根據變型例的服務器設備所使用的模型語句數據庫的結構。
[0046]圖17示出根據變型例的終端設備的功能組件。
[0047]圖18示出根據變型例的服務器設備的功能組件。
[0048]圖19示出由根據變型例的語音代理系統執行的一序列處理。
[0049]圖20A示例性地示出根據變型例的顯示在終端設備的顯示器上的畫面。
[0050]圖20B示例性地示出根據變型例的顯示在終端設備的顯示器上的畫面。
[0051]圖20C示例性地示出根據變型例的顯示在終端設備的顯示器上的畫面。
[0052]圖20D示例性地示出根據變型例的顯示在終端設備的顯示器上的畫面。
[0053]圖20E示例性地示出根據變型例的顯示在終端設備的顯示器上的畫面。
[0054]附圖標記列表
[0055]I 語音代理系統
[0056]11 終端設備
[0057]12 服務器設備
[0058]19 通信網絡
[0059]101 存儲器
[0060]102 處理器
[0061]103 通信 IF
[0062]104 觸摸顯示器
[0063]105 麥克風
[0064]106 時鐘
[0065]107 GPS 單元
[0066]109 總線
[0067]111 屬性獲取單元
[0068]112 發送單元
[0069]113 語句獲取單元
[0070]114 顯示控制單元
[0071]115 語音數據獲取單元
[0072]116 處理標識數據獲取單元
[0073]117 處理執行單元
[0074]121 接收單元
[0075]122 語音識別單元
[0076]123 處理標識數據生成單元
[0077]124 發送單元
[0078]125 存儲控制單元
[0079]126 定時器單元
[0080]127 語句獲取單元
[0081]201 存儲器
[0082]202 處理器
[0083]203 通信 IF
[0084]209 總線
[0085]321 相關性數據獲取單元
[0086]1041 顯示器
[0087]1042 觸摸屏
【具體實施方式】
[0088][實施方式]
[0089]下面描述根據本發明的實施方式的語音代理系統I。圖1示出語音代理系統I的總體構造。語音代理系統I包括由用戶攜帶的終端設備ll-ι至ll-η以及服務器設備12。終端設備11-1至ll-η的數量根據使用語音代理系統I的用戶的數量而任意地改變。以下,當不需要與其余終端設備11-1至ll-η相區分時,終端設備11-1至ll-η中的任一個被稱作“終端設備11”。當用戶向終端設備11發出了語音指令時,服務器設備12解釋用戶的語音的含義,并且指示終端設備11執行必要處理。盡管在圖1中服務器設備12被描繪為單個設備,服務器設備12可由例如彼此協作的多個設備組成。終端設備11和服務器設備12可經由通信網絡19彼此執行數據通信。
[0090]終端設備11包括與例如配備有觸摸顯示器的普通平板個人計算機相同的硬件組件。另選地,終端設備11可以是其它類型的計算機中的任一個。圖2示出平板個人計算機的硬件組件作為終端設備11的示例性硬件組件。圖2中示例性地示出的終端設備11包括存儲器101、處理器102、通信接口(IF)103、觸摸顯示器104、麥克風105、時鐘106和全球定位系統(GPS)單元107作為硬件組件。這些組件經由總線109彼此連接。
[0091]存儲器101是包括易失性半導體存儲器、非易失性半導體存儲器等的存儲設備。它存儲操作系統(OS)、應用程序和各種類型的數據(例如,用戶數據),并且用作由處理器102執行的數據處理的工作區域。處理器102是諸如中央處理單元(CPU)和圖形處理單元(GPU)的處理設備。通信IF 103是經由通信網絡19與服務器設備12執行各種類型的無線數據通信的接口。
[0092]觸摸顯示器104包括顯示器1041和觸摸屏1042。顯示器1041是諸如液晶顯示器的顯示設備,并且顯示字符、圖形、照片等。例如,觸摸屏1042為電容式觸摸屏。它是輸入裝置,當手指或相似的指點器觸摸或者變得與輸入裝置相鄰時,其通過指定觸摸或相鄰的位置來接受用戶操作。在以下描述中,為了方便起見,觸摸或相鄰被簡稱作“觸摸”。
[0093]顯示器1041和觸摸屏1042被層疊。當用戶利用指點器觸摸顯示在顯示器1041上的圖像時,指點器實際觸摸觸摸屏1042,并且指定觸摸的位置。依照OS和應用程序,處理器102基于觸摸屏1042所指定的位置來指定用戶利用指點器觸摸所意圖的操作的內容。
[0094]麥克風105是拾取聲音并且生成聲音數據的聲音拾取設備。在語音代理系統I中,麥克風105拾取用戶的語音并且生成語音數據。時鐘106是連續測量自參考時間起逝去的時間段并生成指示當前時間的時間數據的設備。GPS單元107是從多個衛星接收信號,基于所接收的信號來指定終端設備11的當前位置(也就是說,用戶的當前位置),并且生成指示所指定的位置的位置數據的設備。
[0095]在包括上述硬件組件的終端設備11中,處理器102執行符合存儲在存儲器101中的程序的處理。結果,終端設備11充當包括圖3所示的功能組件的設備。
[0096]終端設備11包括屬性獲取單元111、發送單元112、語句獲取單元113、顯示控制單元114、語音數據獲取單元115、處理標識數據獲取單元116和處理執行單元117作為功能組件。
[0097]屬性獲取單元111獲取表示終端設備11的用戶的屬性或者用戶周圍的環境的屬性的屬性數據。作為示例,在本實施方式中,表示用戶的性別、年齡和當前位置以及當前時間的數據用作屬性數據。用戶的性別和年齡是用戶的屬性的示例,而用戶的當前位置和當前時間是用戶周圍的環境的屬性的示例。表示用戶的性別和年齡的數據利用例如觸摸屏1042通過用戶操作被輸入至終端設備11,屬性獲取單元111獲取用戶由此輸入的數據。另一方面,屬性獲取單元111獲取例如由GPS單元107生成的位置數據作為表示用戶的當前位置的數據。在本實施方式中,表示當前時間的數據(時間數據)由服務器設備12生成以用于使用,因此屬性獲取單元111無需獲取時間數據。
[0098]發送單元112向服務器設備12發送由屬性獲取單元111獲取的屬性數據。發送單元112還向服務器設備12發送由語音數據獲取單元115獲取的語音數據。
[0099]提示語句獲取單元113通過從服務器設備12接收提示語句數據來獲取提示語句數據,提示語句數據表示提示終端設備11的用戶發出語音指令的語句。顯示指令單元114指示顯示器1041顯示由語句獲取單元113獲取的提示語句數據所表示的語句。
[0100]語音數據獲取單元115從麥克風105獲取語音數據,語音數據表示用戶所發出的并且由麥克風105拾取的語音。上述發送單元112向服務器設備12發送由語音數據獲取單元115獲取的語音數據。處理標識數據獲取單元116獲取從服務器設備12發送的處理標識數據,處理標識數據是對從發送單元112發送的語音數據的回復。由處理標識數據獲取單元116獲取的處理標識數據標識與從發送單元112向服務器設備12發送的語音數據所表示的指令相對應的處理。作為示例,在本實施方式中,處理標識數據利用標識功能的功能ID和指定該功能的具體處理的參數的組合來標識處理。
[0101]處理執行單元117執行由處理標識數據獲取單元116獲取的處理標識數據所標識的處理。
[0102]現在將描述服務器設備12的組件。服務器設備12具有與可經由通信網絡19與外部設備執行數據通信的普通計算機相同的硬件組件。圖4示出服務器設備12的硬件組件。具體地,服務器設備12包括存儲器201、處理器202和通信IF 203作為硬件組件。這些組件經由總線209彼此連接。
[0103]存儲器201是包括易失性半導體存儲器、非易失性半導體存儲器等的存儲設備。它存儲OS、應用程序以及諸如用戶數據的各種類型的數據,并且用作處理器202的數據處理的工作區域。處理器202是諸如CPU和GPU的處理設備。通信IF 203是經由通信網絡19與其它設備執行各種類型的數據通信的接口。
[0104]服務器設備12通過執行符合存儲在存儲器201中的程序的處理來充當包括圖5所示的功能組件的設備。服務器設備12包括接收單元121、語音識別單元122、處理標識數據生成單元123、發送單元124、存儲控制單元125、定時器單元126和語句獲取單元127作為功能組件。
[0105]接收單元121接收從各個終端設備11發送的屬性數據。接收單元121還接收從各個終端設備11發送的語音數據。
[0106]語音識別單元122通過已知的語音識別處理來識別由接收單元121接收到的語音數據所表示的指令,并且生成表示所識別的指令的語句的指令語句數據。處理標識數據生成單元123生成處理標識數據,處理標識數據標識與語音識別單元122所生成的指令語句數據對應的處理。
[0107]發送單元124向發送用于生成處理標識數據的語音數據的終端設備11發送由處理標識數據生成單元123生成的處理標識數據。發送單元124還向發送用于獲取提示語句數據的屬性數據的終端設備11發送由語句獲取單元127獲取的提示語句數據。
[0108]存儲控制單元125使存儲器201彼此關聯地存儲下列項目:由接收單元121從終端設備11中的一個接收到的屬性數據、由語音識別單元122利用接收單元121從同一個終端設備11接收到的語音數據生成的指令語句數據、以及表示指令語句數據所表示的指令的發出時間的時間數據(由定時器單元126生成)。
[0109]定時器單元126生成表示當前時間的時間數據。提示語句獲取單元127通過利用諸如從各種終端設備11接收到并被存儲在存儲器201中的屬性數據以及與這些屬性數據關聯地存儲在存儲器201中的指令語句數據的數據生成提示語句數據,來獲取與由接收單元121從終端設備11中的一個接收到的屬性數據所表示的屬性相對應的提示語句數據。
[0110]現在將描述存儲在終端設備11和服務器設備12中的數據的結構。終端設備11的存儲器101存儲標識終端設備11的終端標識數據以及表示用戶的性別和年齡的數據。例如,當終端設備11首次啟動根據本實施方式的程序時,從服務器設備12獲取到終端標識數據。表示用戶的性別和年齡的數據例如由用戶利用觸摸屏1042輸入。
[0111]服務器設備12的存儲器201存儲屬性數據庫、同義詞數據庫、相關性數據庫和日志數據庫。屬性數據庫管理終端設備11的用戶的屬性數據。同義詞數據庫管理同義詞數據,同義詞數據表示基本關鍵字(基礎關鍵字)和與基礎關鍵字同義的關鍵字(同義關鍵字)之間的對應關系。相關性數據庫管理相關性數據,相關性數據表示各種關鍵字與各種功能之間的相關性的大小。日志數據庫管理與終端設備11的用戶所發出的語音指令有關的日志數據。
[0112]圖6示出屬性數據庫的示例性結構。屬性數據庫是與終端設備11對應的記錄的集合,并且具有[終端標識數據]、[性別]、[年齡]和[位置]作為數據字段。以下,[(數據字段名稱)]表示由數據字段名稱指定的數據字段。在這些字段中,存儲有與其字段名稱對應的數據。從終端設備11發送給服務器設備12的數據在適當的定時(例如,當終端設備11首次啟動根據本實施方式的程序時)被存儲到[終端標識數據]、[性別]和[年齡]中。[年齡]根據需要來更新。[位置]在適當的定時(例如,當終端設備11進入等待語音指令的狀態(稍后描述)時)基于從終端設備11發送給服務器設備12的位置數據頻繁地更新。
[0113]圖7示出同義詞數據庫的示例性結構。同義詞數據庫是與各種基礎關鍵字相對應的記錄的集合,并且具有[基礎關鍵字]和[同義關鍵字]作為數據字段。以下,[(數據字段名稱)]表示由該數據字段名稱指定的數據字段。在各個數據字段中,存儲有與其數據字段名稱對應的數據。注意,與一個基礎關鍵字關聯的同義關鍵字的數量變化。
[0114]圖8示出相關性數據庫的示例性結構。相關性數據庫是與關鍵字對應的記錄的集合,并具有[關鍵字]、[類型]、[功能ID]、[功能名稱]、[參數]和[分數]作為數據字段。
[0115]在[關鍵字]中,存儲有表示關鍵字(存儲在同義詞數據庫中的基礎關鍵字中的一個)的文本數據。在[類型]中,存儲有表示關鍵字的類型的文本數據。例如,在圖8中,“食物名稱”被存儲在第一記錄的[類型]中作為關鍵字“拉面”的類型。
[0116]標識功能的功能ID被存儲在[功能ID]中。表示功能的名稱的文本數據被存儲在[功能名稱]中。以下,各個功能被稱作功能“(功能名稱)”。
[0117]表示用于功能的參數的類型的文本數據被存儲在[參數]中。例如,在圖8中,存儲在第一記錄的[參數]中的“食物名稱,當前位置”所表示的數據指示具有類型“食物名稱”和當前位置的關鍵字被用于功能“餐館搜索”。
[0118]代表表示關鍵字與功能之間的相關性的大小的數值數據的分數被存儲在[分數]中。注意,相關性數據庫中的各個記錄可將多組數據存儲在[功能ID]、[功能名稱]、[參數]和[分數]中。
[0119]圖9示出日志數據庫的示例性結構。日志數據庫是與各種終端設備11的用戶所發出的語音指令對應的記錄的集合,并且具有[終端標識數據]、[時間]、[位置]、[指令語句]和[處理標識數據]作為數據字段。發送表示語音指令的語音數據的終端設備11的終端標識數據被存儲在[終端標識數據]中。表示語音指令的發出時間的數據被存儲在[時間]中。表示在發出語音指令的時候用戶(即,終端設備11)的位置的數據被存儲在[位置]中。表示語音數據所指示的指令的語句的指令語句數據被存儲在[指令語句]中。標識與語音指令對應的處理的處理標識數據被存儲在[處理標識數據]中。
[0120]下面描述由具有上述組件的語音代理系統I執行的任務。圖1OA至圖1OC和圖1lA至圖1lD示例性地示出在語音代理系統I中當用戶發出語音指令時顯示在終端設備11的顯示器1041上的畫面。圖1OA至圖1OC示出當自終端設備11開始等待用戶的語音指令起過去了預定時間段(例如,10秒)之前用戶發出語音指令時顯示在顯示器1041上的畫面的轉變。另一方面,圖1lA至圖1lD示出當自終端設備11開始等待用戶的語音指令起過去了預定時間段用戶未發出語音指令時顯示在顯示器1041上的畫面的轉變。
[0121]圖1OA示出在等待用戶的語音指令的同時顯示在顯示器1041上的對話畫面。在等待狀態期間,對話畫面顯示例如語句“有什么需要幫助么?”作為提示用戶發出語音指令的規定提示語句。如果如圖1OB所示在該對話畫面顯示在顯示器1041上期間用戶發出語音指令,則終端設備11執行與語音指令相對應的處理,并且如圖1OC所示在顯示器1041上顯示與語音指令相對應的畫面(處理執行畫面)。
[0122]類似于圖10A,圖1lA示出等待狀態的對話畫面。如果自等待狀態的對話畫面開始顯示起過去了預定時間段(例如,10秒)而用戶未發出語音指令,則如圖1lB所示,在顯示器1041上顯示提示用戶發出語音指令的新提示語句。該提示語句根據終端設備11的用戶的性別和年齡(用戶的屬性)以及用戶的當前位置和當前時間(用戶周圍的環境的屬性)來生成。因此,有很高的概率此提示語句與用戶希望發出的語音指令的內容有共同點。如果如圖1lC所示用戶發出語音指令,則終端設備11執行與語音指令對應的處理,并且如圖1lD所示,在顯示器1041上顯示與語音指令對應的處理執行畫面。
[0123]圖12示出用戶發出語音指令時由語音代理系統I執行的一系列處理。下面參照圖
12描述由語音代理系統I執行的處理。
[0124]首先,當用戶在終端設備11上執行預定操作時,終端設備11的顯示控制單元114使顯示器1041顯示等待狀態的對話畫面(圖1OA或圖11A)(步驟S101)。隨著等待狀態的開始,終端設備11的屬性獲取單元111從GPS單元107獲取表示終端設備11的當前位置(S卩,用戶的當前位置)的位置數據。發送單元112將屬性獲取單元111所獲取的位置數據與存儲在存儲器101中的終端標識數據一起發送給服務器設備12(步驟S102)。
[0125]在對話畫面被顯示在顯示器1041上期間維持終端設備11與服務器設備12之間建立的通信連接。在建立通信連接時,一旦服務器設備12識別出終端設備11,它可隨后經由通信連接一直識別終端設備11,直至通信連接被解除。因此,在步驟S102中終端設備11向服務器設備12發送終端標識數據之后,在下面描述的處理中,無需再次向服務器設備12發送終端標識數據。
[0126]服務器設備12的接收單元121接收從終端設備11發送的終端標識數據和位置數據(步驟S103)。存儲控制單元125從存儲器201讀出屬性數據庫(圖6),并且將接收單元121所接收的位置數據存儲(通過覆寫)在把由接收單元121在步驟S103中接收到的終端標識數據存儲在[終端標識數據]中的記錄的[位置]中。存儲控制單元125使存儲器201存儲如此更新的屬性數據庫(步驟S104)。
[0127]在步驟S104之后,繼續執行步驟S105至S108的處理。由于這些處理中所使用的數據的一部分是在下面描述的步驟Slll至S121的處理中生成的,所以現在將首先描述步驟Sm 至 Sm。
[0128]隨著等待狀態開始,與步驟S102的處理并行地,終端設備11的語音數據獲取單元115等待從麥克風105輸出表示用戶的語音的語音數據。如果用戶發出語音指令(步驟Slll為“是”),則麥克風105輸出語音數據,并且語音數據獲取單元115獲取語音數據(步驟
5112)。發送單元112向服務器設備12發送由語音數據獲取單元115獲取的語音數據(步驟
5113)0
[0129]當服務器設備12的接收單元121接收到從終端設備11發送的語音數據時(步驟
5114),語音識別單元122識別由語音數據表示的語音的內容,并且生成表示所識別的內容的語句的口頭語句數據(表示同義詞轉換之前的指令語句的指令語句數據)(步驟S115)。例如,如圖1OB中示例性地示出的,如果用戶發出語音指令“告訴我新宿站的位置”,則語音識別單元122生成表示語句“告訴我新宿站的位置”的口頭語句數據。
[0130]隨后,處理標識數據生成單元123依照存儲在同義詞數據庫(圖7)中的同義詞數據,將包含在由語音識別單元122生成的口頭語句數據所表示的語句中的關鍵字(同義關鍵字)轉換為基礎關鍵字,并且生成表示轉換后的語句(指令語句)的指令語句數據(步驟S116)。例如,假設在步驟S115中生成表示語句“告訴我新宿站的位置”的口頭語句數據。在這種情況下,同義關鍵字“告訴我……的位置”被轉換為基礎關鍵字“請告訴我……的位置”,并且在步驟S116中生成表示語句“請告訴我新宿站的位置”的指令語句數據。
[0131]隨后,處理標識數據生成單元123指定與在步驟S116中生成的指令語句數據所表示的指令語句相對應的處理,并且生成標識所指定的處理的處理標識數據(步驟S117)。具體地,處理標識數據生成單元123首先提取包含在指令語句數據所表示的指令語句中的關鍵字。隨后,對于所提取的各個關鍵字,處理標識數據生成單元123從相關性數據庫(圖8)提取在[關鍵字]中存儲有所述關鍵字的記錄。隨后,對于存儲在所提取的一個或更多個記錄的[功能ID]中的各個功能ID,處理標識數據生成單元123獲得存儲在[分數]中的分數的總和。
[0132]例如,假設在步驟S116中生成表示語句“請告訴我新宿站的位置”的指令語句數據。在這種情況下,處理標識數據生成單元123提取“請告訴我……的位置”和“新宿站”作為關鍵字。隨后,處理標識數據生成單元123從相關性數據庫提取在[關鍵字]中存儲有“新宿站”的記錄(圖8中的第四記錄)以及在[關鍵字]中存儲有“請告訴我……的位置”的記錄(圖8中的第五記錄)。然后,對于所提取的這些記錄的[功能ID]中存儲的“F0356”、“F2527”等中的每一個,處理標識數據生成單元123獲得存儲在[分數]中的數值的總和。結果,例如,與指令語句對應的功能的分數被指定如下:由功能ID“F0356”標識的功能“換乘導航”的分數為“14”,由功能ID “F2527”標識的功能“地圖顯示”的分數為“18”。
[0133]處理標識數據生成單元123指定按照上述方式指定最高分數的功能作為與指令語句對應的功能。隨后,處理標識數據生成單元123從提取自指令語句數據的關鍵字當中提取具有存儲在與所指定的功能關聯的相關性數據的[參數]中的數據所表示的類型的關鍵字。然后,處理標識數據生成單元123生成處理標識數據,該處理標識數據包括標識按照上述方式指定的功能的功能ID并且包括所提取的關鍵字(如果有的話)作為參數。例如,處理標識數據生成單元123生成包括功能“地圖顯示”的功能ID“F2537”和參數“新宿站”的處理標識數據作為與指令語句“請告訴我新宿站的位置”關聯的處理標識數據。
[0134]發送單元124向發送語音數據的終端設備11發送由處理標識數據生成單元123生成的處理標識數據,作為對由接收單元121在步驟S114中接收到的語音數據的回復(步驟S118)。終端設備11的處理標識數據獲取單元116接收從服務器設備12發送的處理標識數據(步驟SI 19)。處理執行單元117執行由處理標識數據獲取單元116接收到的處理標識數據標識的處理(步驟S120)。結果,圖1OC中示例性地示出的處理執行畫面顯示在顯示器1041上。
[0135]另一方面,與步驟S118的處理并行地,服務器設備12的存儲控制單元125更新日志數據庫(圖9)(步驟S121)。具體地,存儲控制單元125從存儲器101讀出日志數據庫,并且增加新的記錄。隨后,存儲控制單元125將在步驟S103中接收到的終端標識數據和位置數據、在步驟S116中生成的指令語句數據以及在步驟S117中生成的處理標識數據分別存儲在增加的記錄的[終端標識數據]、[位置]、[指令語句]和[處理標識數據]中。存儲控制單元125還從定時器單元126獲取表示此時的當前時間的時間數據,并且將該時間數據存儲在[時間]中。存儲控制單元125使存儲器201存儲如此更新的日志數據庫。
[0136]在這種情況下,確切地說,由存儲在[時間]中的時間數據表示的時間比語音指令的發出時間晚了執行步驟S112至S117所需的時間段。然而,由于之間的差異幾乎可忽略,所以此時間數據被用作表示語音指令的發出時間的數據。類似地,確切地說,由存儲在[位置]中的位置數據指示的位置可不同于在發出語音指令的時候用戶的位置。然而,由于之間的差異也幾乎可忽略,所以此位置數據被用作表示在發出語音指令的時候用戶的位置的數據。為了將表示更準確的時間和位置的數據存儲在日志數據庫中,例如,終端設備11可包括定時器單元并且向服務器設備12發送表示步驟S112中語音數據的獲取時間的時間數據以及在步驟S112中獲取語音數據的時候由GPS單元107生成的位置數據,并且服務器設備12可將這些數據存儲在日志數據庫中。
[0137]每當各種終端設備11中的任一個的用戶發出語音指令時,執行步驟S121的處理。結果,日志數據庫(圖9)存儲與各種終端設備11上發出的語音指令有關的許多日志數據。存儲在日志數據庫中的日志數據被用于生成下面所述的提示語句數據。
[0138]現在描述步驟S104之后的步驟S105至S108的處理。在步驟S104中存儲控制單元125更新了屬性數據庫(圖6)之后,語句獲取單元127從日志數據庫(圖9)提取與由屬性與終端設備11的用戶的屬性相似的用戶過去發出的語音指令有關的日志數據(步驟S105)。
[0139]具體地,語句獲取單元127使用[終端標識數據]作為鍵(key)將日志數據庫(圖9)與屬性數據庫(圖6)組合,并且從與屬性數據庫組合的日志數據庫提取具有下列特征的記錄:存儲在[性別]中的數據表示與在步驟S104中更新的屬性數據相同的性別、由存儲在[年齡]中的數據表示的年齡與更新的屬性數據中的年齡的差異為預定閾值或更小(例如,年齡大或小五歲或更小)、由存儲在[位置]中的數據表示的位置與更新的屬性數據中的位置相距預定閾值或更小(例如,Ikm或更小)、由存儲在[時間]中的數據表示的時間與更新的屬性數據中的時間的差異為預定閾值或更小(例如,早或晚一個小時或更短)(不考慮日期)。
[0140]隨后,語句獲取單元127利用在步驟S105中提取的記錄來生成提示語句數據(步驟S106)。具體地,首先,語句獲取單元127將記錄分組,使得一個組中的記錄在[處理標識數據]中存儲相同的數據。然后,語句獲取單元127對各個組中所包括的記錄的數量進行計數。另外,對于各個組,語句獲取單元127將包括在組中的記錄的[指令語句]中所存儲的整個數據當中數最大的數據指定為該組的代表性指令語句數據。結果,語句獲取單元127生成圖13中示例性地示出的數據表(以下稱作“指令語句列表”)。指令語句列表具有[處理標識數據]、[指令語句]和[數量]作為數據字段。[指令語句]存儲表示用于發出用于由存儲在[處理標識數據]中的數據標識的處理的指令的代表性指令語句。[數量]存儲表示已針對存儲在[處理標識數據]中的數據所標識的處理發出指令的次數的數據。
[0141]提示語句獲取單元127按照存儲在[數量]中的數據所指示的數量的降序從指令語句列表選擇預定數量的(例如,10個)記錄,并且利用存儲在所選擇的記錄的[指令語句]中的指令語句數據生成例如表示語句“最近經常查詢‘XXX’”的提示語句數據(“XXX”表示各個指令語句數據所表示的指令語句)。注意,由語句獲取單元127生成的提示語句數據所表示的語句的格式不限于上述示例。例如,指令語句數據本身可被生成為提示語句數據。另選地,表示通過檢索指令語句數據所表示的語句的一部分并且將所提取的部分嵌入模型語句中而生成的語句的數據可被生成為提示語句數據。
[0142]發送單元124將語句獲取單元127所生成的提示語句數據作為對由接收單元121在步驟S103中接收到的終端標識數據和位置數據的回復發送給發送這些數據的終端設備11(步驟S107)。終端設備11的提示語句獲取單元113接收從服務器設備12發送的提示語句數據(步驟S108)。
[0143]因此,終端設備11從服務器設備12獲取與用戶的屬性和用戶周圍環境的屬性對應的預定數量的(例如,10)提示語句數據。在這種狀態下,如果自終端設備11進入等待語音指令的狀態起過去了預定時間段(例如,10秒)而沒有發出語音指令(步驟S131為“是”),則顯示控制單元114例如從在步驟S108中接收到的所述預定數量的提示語句數據當中隨機地選擇一條提示語句數據,并且使得顯示器1041顯示呈現所選擇的那條提示語句數據所表示的語句的對話畫面(步驟S132)。結果,在顯示器1041上顯示了圖1lB中示例性地示出的對話畫面。
[0144]隨后,如果用戶發出語音指令(步驟Slll為“是”),則重復步驟S112至S121的處理,并且圖1lD中示例性地示出的處理執行畫面顯示在顯示器1041上。另一方面,如果自用戶發出語音指令起或者自顯示在顯示器1041上的提示語句改變起過去了預定時間段而沒有發出語音指令(步驟S131為“是”),則重復步驟S132的處理,并且在顯示器1041上顯示呈現新的提示語句的對話畫面。
[0145]如上所述,當用戶意圖發出語音指令,但是沒有馬上想起語音指令的內容時,語音代理系統I向用戶呈現與用戶的屬性和用戶周圍環境的屬性對應的提示語句。這使得用戶能夠容易地發出語音指令。
[0146][變型例]
[0147]上述語音代理系統I是本發明的實施方式,并且可以在本發明的技術構思的范圍內按照各種方式來修改。現在將描述這些變型例。下面,將主要聚焦于變型例與實施方式之間的不同來描述變型例,與實施方式相似的組件和任務的描述將被適當地省略。另外,在根據以下變型例的語音代理系統的組件當中,與根據實施方式的語音代理系統I的組件相同或對應的組件被給予與之相同的標號。需要注意,兩個或更多個實施方式與以下變型例可適當地組合。
[0148](I)為了生成提示語句數據,語句獲取單元127可基于分別存儲在日志數據的[時間]和[指令語句]中的時間數據和指令語句數據,從存儲在日志數據庫(圖9)中的整個指令語句數據當中指定表示在例如當前時間與過去的時間點之間的預定時間段內隨著時間過去而使用頻度增加的指令的指令語句數據。然后,語句獲取單元127可利用所指定的指令語句數據生成提示語句數據。
[0149]此變型例有很高的概率向用戶呈現表示許多用戶最近頻繁使用的示例語音指令的提示語句。因此,此變型例對于想要獲得此時吸引許多其他用戶的注意力的熱點話題信息的用戶而言是可取的。
[0150](2)提示語句獲取單元127可生成提示語句數據,該提示語句數據要發送給例如終端設備Il-X以使得所生成的提示語句數據提示對于終端設備Il-X的終端標識數據關聯地存儲在日志數據庫(圖9)中的特定指令語句數據所表示的指令而言沒有預定相似性的指令。
[0151]在此變型例的具體示例中,語句獲取單元127提取與終端設備11 - X的終端標識數據關聯地存儲在日志數據庫中的處理標識數據,并且利用在[處理標識數據]中存儲有包括所提取的處理標識數據中所包括的功能ID的處理標識數據的日志數據以外的日志數據來生成提示語句數據。在這種情況下,向終端設備Il-X的用戶呈現提示語句,該提示語句提示執行使用與他/她在過去通過語音指令所使用的任何功能不同的功能的處理的語音指令。因此,給予用戶使用他/她過去從來沒有使用過的功能的機會。
[0152]在此變型例的另一具體示例中,語句獲取單元127從存儲在日志數據庫中的整個日志數據中排除在[終端標識數據]中存儲有終端設備Il-X的終端標識數據的日志數據,并且僅利用與不同于終端設備Il-X的終端設備11有關的日志數據來生成提示語句數據。當存儲在日志數據庫中的日志數據的條數較少時,生成要發送給終端設備I1-X的提示語句數據有很高的概率使用與過去在終端設備Il-X上發出的語音指令有關的日志數據中所包括的指令語句數據。這種不便不會發生于前述具體示例中。
[0153]用戶知道他/她在過去發出過的語音指令,發出相似的語音指令通常沒有困難。因此,鑒于本發明的目的,向用戶呈現提示與他/她在過去發出過的語音指令相同或相似的語音指令的提示語句是不可取的。本變型例降低了這種不便的發生概率。
[0154](3)當在圖12的步驟S132中提示語句顯示在顯示器1041上期間用戶發出語音指令時,例如,提示語句標識數據可與語音數據一起被發送給服務器設備12,該提示語句標識數據標識表示在發出語音指令的時候所顯示的提示語句的提示語句數據。在服務器設備12中,處理標識數據生成單元123可生成處理標識數據,該處理標識數據標識與指令語句數據所表示的指令(語音數據所表示的指令)和由提示語句標識數據標識的提示語句數據所表示的語句的組合對應的處理。
[0155]圖14A至圖14C示例性地示出在本變型例中顯示在顯示器1041上的畫面。圖14A中示例性地示出的畫面顯示以下提示語句最近經常查詢‘秋葉原劇場是什么?圖12的步驟S132)。如果如圖14B所示,用戶響應于此提示語句說出例如“我也對這感興趣”,則發送單元112向服務器設備12發送表示用戶的語音指令“我也對這感興趣”的語音數據以及表示提示語句“最近經常查詢‘秋葉原劇場是什么?’”的提示語句數據(圖12的步驟S113)。
[0156]在服務器設備12中,處理標識數據生成單元123將包括在指令語句“我也對這感興趣”中的“這”指定為包括在提示語句“最近經常查詢‘秋葉原劇場是什么? ’”中的“秋葉原劇場”。然后,它生成語句“我也對秋葉原劇場感興趣”以及與此語句對應的處理標識數據(圖12的步驟S117)。另選地,處理標識數據生成單元123可通過簡單地提取包含在指令語句“我也對這感興趣”和提示語句的引號(‘’)內的部分(‘秋葉原劇場是什么?’部分)中的關鍵字來指定與語音指令對應的處理。在終端設備11中,處理執行單元117執行如此生成的處理標識數據所標識的處理。結果,如圖14C所示,在顯示器1041上顯示與語音指令對應的處理執行畫面。
[0157]在上述示例中,從終端設備11向服務器設備12發送提示語句數據。在本變型例中,從終端設備11發送給服務器設備12的數據是標識提示語句的數據(提示語句標識數據)就足夠了,提示語句數據是這種數據的示例。因此,例如,服務器設備12可向終端設備11發送附有提示語句標識數據的各個提示語句數據(圖12的步驟S107),代替提示語句數據,終端設備11可向服務器設備12發送附于提示語句數據的提示語句標識數據。
[0158]在本變型例中,當用戶想要發出與提示語句所表示的示例語音指令相同或相似的語音指令時,用戶無需讀出示例語音指令,而是可按照更自然講話的形式向終端設備11發出語音指令。
[0159](4)在實施方式中,用戶的性別和年齡用作用于生成提示語句數據的用戶屬性。另夕卜,用戶的當前位置和當前時間用作用于生成提示語句數據的用戶周圍環境的屬性。在本發明中,用于生成提示語句數據的用戶的屬性和用戶周圍環境的屬性不限于上面剛提及的那些,可使用各種類型的其它屬性。
[0160]例如,除了性別和年齡以外或者代替性別和年齡,用戶的興趣愛好和職業、在過去發出過語音指令的次數(表示發出語音指令的技能)、在過去發出語音指令的頻度等可構成用于生成提示語句數據的用戶的屬性。
[0161]另外,除了當前位置和當前時間以外或者代替當前位置和當前時間,例如,用戶所在區域的當前天氣和氣溫、表示用戶是在家、辦公室還是另一地點的信息、表示今天是不是周末或放假的信息等可構成用于生成提示語句數據的用戶周圍環境的屬性。
[0162](5)用戶在過去(例如,最近)發出過的語音指令用作表示用戶的興趣愛好或要求的屬性。因此,用戶在過去發出過的語音指令可構成用于生成提示語句數據的用戶的屬性。在此變型例中,服務器設備12的存儲器201存儲處理間相關性數據庫和模型語句數據庫。處理間相關性數據庫針對可由終端設備11執行的多個處理項目當中的各個任意處理對,管理表示處理對之間的相關性的大小的處理間相關性數據。模型語句數據庫管理表示與各個處理項目對應的提示語句的模型的模型語句數據。
[0163]圖15示出處理間相關性數據庫的示例性結構。在變型例中,作為示例,將假設逐功能地指定處理間相關性。因此,處理間相關性數據庫是與可由終端設備11執行的多個處理項目一對一關聯的記錄的集合,并且具有[第一功能]和[第二功能]作為數據字段。[第一功能]具有[功能ID]和[功能名稱]作為子字段,其中分別存儲有第一功能的功能ID和功能名稱。對于多個第二功能(與第一功能具有相關性的所有其它功能)中的每一個,[第二功能]具有[功能ID]、[功能名稱]和[分數]作為子字段,其中分別存儲有第二功能的功能ID、第二功能的功能名稱以及代表表示第一處理與第二處理之間的相關性的大小的數值的分數。
[0? 64]例如,圖15的第一行中示例性地示出的數據表示:表示由功能ID “F1025”標識的功能“餐館搜索”和由功能ID“F0356”標識的功能“換乘導航”之間的相關性的大小的分數為“10”。
[0165]圖16示出模型語句數據庫的示例性結構。模型語句數據庫是與可由終端設備11執行的多個處理項目一對一關聯的記錄的集合,并且具有以下數據字段:存儲有功能ID的[功能ID]、存儲有功能名稱的[功能名稱]以及存儲有表不提不功能的提不語句的t旲型的t旲型語句數據的[模型語句]。
[0166]例如,圖16的第一行中示例性地示出的數據表示:與功能ID“F0356”所標識的功能“換乘導航”關聯的模型語句是“想要坐火車去(地點)”。這里,“(地點)”表示具有包括“地點”(參見圖8)的類型的關鍵字被插入其中。
[0167]圖17示出根據本變型例的終端設備31的功能組件。終端設備31獲取語音數據作為屬性數據。因此,終端設備31包括作為單個組件的屬性獲取單元111和語音數據獲取單元115,而不進行區分。
[0168]圖18示出根據本變型例的服務器設備32的功能組件。服務器設備32包括從例如存儲器201讀出處理間相關性數據庫(圖15)并且獲取處理間相關性數據的相關性數據獲取單元 321 ο
[0169]依照處理間相關性數據,服務器設備32的語句獲取單元127基于例如與最近由處理標識數據生成單元123生成的處理標識數據所標識的處理項目的相關性的大小,從可由終端設備31執行的多個處理項目當中選擇一個處理項目,并且針對所選擇的處理項目生成提示指令的提示語句數據。
[0170]圖19示出在本變型例中由語音代理系統I執行的一系列處理。需要注意,在圖19中,與圖12的步驟相同或對應的步驟被給予與之相同的標號。
[0171]在本變型例中,首先,終端設備31的用戶在對話畫面開始顯示之后發出語音指令(步驟S101)。然后,終端設備31和服務器設備32執行與語音指令對應的一系列處理(步驟S112至S120),并且終端設備31執行與語音指令對應的處理。
[0172]需要注意,在本變型例中,在生成標識與語音指令對應的處理的處理標識數據(步驟S117)之后,服務器設備32生成提示語句數據(步驟S301),并且將處理標識數據與在步驟S301中生成的提示語句數據一起發送(步驟S118)。終端設備31接收響應于語音數據的發送(步驟S113)而與處理標識數據一起從服務器設備32發送的提示語句數據(步驟S119)。在步驟S119中接收到的提示語句數據稍后用于顯示提示語句(步驟S132)。
[0173]下面描述在步驟S301中服務器設備32生成提示語句數據的示例性過程。首先,相關性數據獲取單元321在處理間相關性數據庫(圖15)中搜索在[第一功能]的[功能ID]中存儲有由處理標識數據生成單元123在步驟SI 17中生成的處理標識數據中所包括的功能ID的記錄,并且將此記錄傳遞給語句獲取單元127。
[0174]提示語句獲取單元127從接收自相關性數據獲取單元321的記錄的[第二功能]中所包括的數據當中選擇與表示最大數值的[分數]關聯的[功能ID]中所存儲的功能ID,作為標識與對應于用戶最近所發出的語音指令的功能具有最大相關性的功能的功能ID。隨后,語句獲取單元127在模型語句數據庫(圖16)中搜索與所選擇的功能ID對應的記錄,并且獲取存儲在搜索到的記錄的[模型語句]中的模型語句數據。
[0175]隨后,如果由處理標識數據生成單元123在步驟S117中生成的處理標識數據中所包含的關鍵字包括類型與模型語句數據所表示的“(地點)”等匹配的關鍵字,則語句獲取單元127用該關鍵字取代“(地點)”等中的字符串。表示替換后的語句的數據用作提示語句數據。在步驟S301中服務器設備32生成提示語句數據的示例性過程的描述這樣結束。
[0176]圖20A至圖20E示例性地示出在本變型例中顯示在終端設備31的顯示器1041上的畫面的轉變。在對話畫面上,首先,用戶發出語音指令(圖20A),并且終端設備31執行與語音指令對應的處理(圖20B)。隨后,如果用戶有一段時間沒有向終端設備31發出語音指令,則顯示器1041顯示提示語音指令的提示語句(圖20C)。此提示語句提示針對與對應于用戶最近發出過的語音指令的處理具有高相關性的處理的指令。如果用戶根據提示語句的提示發出新的語音指令(圖20D),則終端設備31與該新的語音指令對應的處理(圖20E)。
[0177](6)在實施方式中,沒有關于用于生成提示語句數據的日志數據所指示的語音指令的發出時間的新/舊狀態的特別限制,存儲在日志數據庫中的整個日志數據是步驟S105(圖12)中的提取目標。另選地,在存儲在日志數據庫中的整個日志數據當中,例如,僅與當前時間與過去的時間點之間的預定時間段(例如,一年)內發出過的語音指令有關的日志數據可用于生成提示語句數據。
[0178](7)在生成提示語句數據時,語句獲取單元127可從存儲在日志數據庫中的整個日志數據排除在[處理標識數據]中存儲有包括特定功能ID的處理標識數據的日志數據,并且僅使用不包括該特定功能ID的日志數據。
[0179]當發出用于執行使用特定類型的功能(例如,日程管理)的處理的指令時,用戶可大量使用他/她自己所特定的詞語(例如,他/她的熟人的姓名)。因此,包括在與該類型的功能有關的指令語句數據中的信息對其他用戶而言可能無用,或者從個人信息的保護角度可能不可取。通過本變型例,可避免這種不便。
[0180](8)在實施方式中,為了生成提示語句數據(圖12的步驟S106),語句獲取單元127基于屬性數據中的相似性將從日志數據庫提取的日志數據所指示的指令語句數據分組,使得一個組中的每一個指令語句數據都與同一的處理標識數據關聯。然后,對包括在各個組中的日志數據的條數進行計數,包括最大數量的日志數據的組中的指令語句數據(代表指令語句數據)用于生成提示語句數據。這是語句獲取單元127用來選擇用于生成提示語句數據的指令語句數據的方法的具體示例,并且可被各種類型的其它方法代替。
[0181]可基于其它標準來進行分組。例如,代替將與相同處理標識數據關聯的指令語句數據歸類到一個組中,表示包含相同關鍵字的指令語句的指令語句數據可被歸類到一個組中。另外,在選擇用于生成提示語句數據的指令語句數據組時,按照日志數據的條數的降序選擇預定數量的組的方法可被例如以下方法代替:按照日志數據的條數的降序排除預定數量的組(例如,第一組至第五組),并且按照日志數據的條數的降序從剩余組(例如,第六組和隨后的組)進行選擇。這防止了僅許多用戶頻繁發出的語音指令(例如,“現在天氣如何?”)作為提示語句被重復地呈現給用戶的不便情況。此外,在過去的預定時間段內由語句獲取單元127用來生成提示語句數據的指令語句數據可不用于生成新的提示語句數據(要被發送給同一終端設備11)。這防止了相同或相似的提示語句被重復地呈現給同一用戶的不便情況。
[0182](9)在實施方式中,服務器設備12的語句獲取單元127通過使用從日志數據庫提取的日志數據中所包括的指令語句數據生成提示語句數據來獲取提示語句數據。提示語句獲取單元127可不生成提示語句數據,并且可通過從例如存儲器201讀出提示語句數據或者從外部設備接收提示語句數據來獲取提示語句數據。例如,語句獲取單元127可基于屬性數據的相似性來檢索從日志數據庫提取的日志數據中所包括的指令語句數據,并且原樣獲取檢索到的指令語句數據作為提示語句數據。
[0183](10)在實施方式中,服務器設備12執行語音識別處理(圖12的步驟S115)以及指定與語音指令對應的處理的處理(圖12的步驟S116和S117)。這些處理中的一個或二者可由終立而設備11執燈。
[0184](11)在實施方式中,分別被示例性地描述為顯示器1041、觸摸屏1042和麥克風105的顯示設備、輸入裝置和聲音拾取設備全部被內置于終端設備11中。然而,它們中的至少一個可被配置為不同于終端設備11的外部設備。另外,在實施方式中,終端設備11所使用的各種類型的數據被存儲在內置于終端設備11中的存儲器101中。然而,這些數據的全部或一部分可被存儲在外部存儲設備中。類似地,代替存儲器201,服務器設備12所使用的各種類型的數據的全部或一部分可被存儲在外部存儲設備中。
[0185](12)在實施方式中,終端設備11在進入等待語音指令的狀態時向服務器設備12發送終端標識數據和位置數據(圖12的步驟S102和S103),這些數據的發送觸發了生成和發送提示語句數據的處理(圖12的步驟S104至S108)。這些處理不限于在終端設備11進入等待語音指令的狀態的時刻執行。例如,每當預定時間段過去時,或者在檢測到終端設備11移動了預定距離或更長距離的時刻,終端設備11可向服務器設備12發送位置數據。另外,當終端設備11需要顯示提示語句(圖12的步驟S131為“是”)時,終端設備11可向服務器設備12發送對提示語句數據的請求,并且可以響應于該請求來執行生成和發送提示語句數據的處理(圖12的步驟S104至S108)。
[0186](13)在實施方式或變型例中,在跟隨在終端設備11從服務器設備12接收到提示語句數據之后(跟隨在圖12的步驟S108或圖19的步驟S119之后)并且在用戶響應于提示語句的顯示而發出語音指令(圖12的步驟S132或者圖19的步驟S132)之前的時間段內,終端設備11可執行提示語句提示的處理的至少一部分作為后臺處理。
[0187]在實施方式的變型中,在圖12所示的一系列處理中,服務器設備12在步驟S106中基于例如在步驟S105中從日志數據庫(圖9)提取的日志數據的[處理標識數據]中所存儲的數據來指定提示語句數據以及標識與提示語句數據對應的處理的處理標識數據。然后,在步驟S107中,服務器設備12向終端設備11發送提示語句數據以及所指定的處理標識數據。當在步驟S108中終端設備11接收到提示語句數據以及處理標識數據時,終端設備11在后臺執行由所接收的處理標識數據所標識的處理,而不等待用戶的語音指令。
[0188]在變型例(5)的變型中,在圖19所示的一系列處理中,服務器設備12在步驟S118中發送提示語句數據以及處理標識數據,終端設備11在步驟S119中接收提示語句數據以及處理標識數據。因此,在步驟S119的處理之后,終端設備11在后臺執行由所接收的處理標識數據所標識的處理,而不等待用戶的語音指令。
[0189]隨后,如果響應于提示語句,用戶如提示語句所提示地發出語音指令,則終端設備11顯示已在后臺執行的處理的結果。
[0190]在此變型例中,符合提示語句所提示的語音指令的處理在發出語音指令之前已經執行。因此,當用戶如提示語句所提示的發出語音指令時,更快速地向用戶呈現處理的結果O
[0191]需要注意,用戶未必就發出提示語句所提示的語音指令。例如,在圖1lA至圖1lD的示例中,響應于表示示例性語句“告訴我附近的好披薩餐館”的提示語句,用戶發出語音指令“那么告訴我附近的好咖喱餐館”。在這種情況下,對應于提示語句的處理與對應于語音指令的處理具有不同的參數和相同的功能。因此,在這種情況下同樣,如果在發出語音指令之前在后臺激活此功能(在圖1lA至圖1lD的示例中,功能“餐館搜索”),則處理的結果可被馬上顯示。
[0192]在變型例的另一變型中,當用戶響應于提示語句發出語音指令時,終端設備11可顯示符合語音指令的處理結果,而無需訪問服務器設備12。在這種情況下,為了識別用戶如提示語句所提示而發出的語音指令,終端設備11包括與包括在服務器設備12中的語音識別單元122和處理標識數據生成單元123相似的組件。當用戶如提示語句所提示的發出語音指令時,終端設備11識別語音數據所表示的語音并且生成指令語句數據以及處理標識數據(與圖12或圖19的步驟S115至S117的處理相似的處理),而無需向服務器設備12發送語音數據。如果由如此生成的處理標識數據標識的處理(與語音數據對應的處理)與在后臺執行的處理匹配,則終端設備11馬上顯示已經執行的處理的結果。
[0193]在此變型例中,即使當用戶如提示語句所提示的發出語音指令時終端設備11無法與服務器設備12通信,終端設備11也向用戶呈現符合語音指令的處理的結果。
[0194](14)終端設備11可包括揚聲器,可經由揚聲器來讀出提示語句。在這種情況下,作為功能組件,終端設備11包括:語音數據生成單元,其生成語音數據,該語音數據表示通過讀出提示語句數據所表示的語句而形成的語音;以及語音數據輸出單元,其將語音數據輸出給揚聲器。語音數據輸出單元與顯示控制單元114發出用于顯示提示語句的指令同時將語音數據輸出給揚聲器。結果,提示語句不僅被顯示,而且以語音的形式被呈現給用戶。
[0195](15)在實施方式中,終端設備11和服務器設備12通過使普通計算機執行符合根據本發明的程序的處理來實現。另選地,終端設備11和服務器設備12中的一方或二者可被配置為所謂的專用設備。
[0196]本發明將被理解為系統(其示例是語音代理系統)、構成該的終端設備和服務器設備、由這些設備執行的處理的方法、使得計算機充當這些設備的程序以及記錄有該程序的計算機可讀非暫時性記錄介質。需要注意,根據本發明的程序可經由記錄介質或者經由諸如互聯網的網絡提供給計算機。
【主權項】
1.一種終端設備,該終端設備包括: 屬性獲取單元,該屬性獲取單元獲取表示用戶的屬性或者所述用戶周圍的環境的屬性的屬性數據; 語句獲取單元,該語句獲取單元獲取提示語句數據,所述提示語句數據表示提示所述用戶發出語音指令的語句,并且所述提示語句數據與所述屬性數據表示的所述屬性對應;顯示控制單元,該顯示控制單元使顯示設備顯示由所述提示語句數據表示的語句; 語音數據獲取單元,該語音數據獲取單元獲取語音數據,所述語音數據表示所述用戶響應于所述顯示設備顯示由所述提示語句數據表示的語句而發出的語音; 處理標識數據獲取單元,該處理標識數據獲取單元獲取處理標識數據,所述處理標識數據標識與所述語音數據表示的指令對應的處理;以及 處理執行單元,該處理執行單元執行由所述處理標識數據標識的處理。2.根據權利要求1所述的終端設備,該終端設備還包括: 發送單元,該發送單元向服務器設備發送所述屬性數據和所述語音數據,其中所述語句獲取單元接收作為對所述發送單元發送所述屬性數據的回復而從所述服務器設備發送的所述提示語句數據,并且 所述處理標識數據獲取單元接收作為對所述發送單元發送所述語音數據的回復而從所述服務器設備發送的所述處理標識數據。3.根據權利要求2所述的終端設備,其中 所述發送單元向所述服務器設備發送提示語句標識數據,所述提示語句標識數據標識表示當所述語音數據獲取單元獲取了所述語音數據時由所述顯示設備顯示的語句的所述提示語句數據,并且 所述處理標識數據獲取單元接收作為對所述語音數據和所述提示語句標識數據的發送的回復而從所述服務器設備發送的所述處理標識數據,所述處理標識數據標識與所述語音數據所表示的指令和所述提示語句標識數據所標識的語句的組合對應的處理。4.根據權利要求1至3中任一項所述的終端設備,其中 所述屬性獲取單元獲取表示所述用戶發出的語音的所述語音數據作為所述屬性數據。5.一種服務器設備,該服務器設備包括: 接收單元,該接收單元從終端設備接收屬性數據,所述屬性數據表示所述終端設備的用戶的屬性或者所述用戶周圍的環境的屬性; 語句獲取單元,該語句獲取單元獲取提示語句數據,所述提示語句數據表示提示所述用戶發出語音指令的語句的,并且所述提示語句數據與所述屬性數據表示的所述屬性對應; 發送單元,該發送單元向所述終端設備發送所述提示語句數據,其中,在所述發送單元發送所述提示語句數據之后,所述接收單元接收從所述終端設備發送的語音數據; 語音識別單元,該語音識別單元識別所述語音數據所表示的指令;以及處理標識數據生成單元,該處理標識數據生成單元生成標識與所述指令對應的處理的處理標識數據,并且 其中,作為對所述接收單元接收到的所述語音數據的回復,所述發送單元向所述終端設備發送所述處理標識數據。6.根據權利要求5所述的服務器設備,該服務器設備還包括 存儲控制單元,其中 所述接收單元從多個終端設備中的每一個接收所述屬性數據和所述語音數據, 所述存儲控制單元使存儲設備將所述接收單元從各個終端設備接收到的所述屬性數據與指令語句數據彼此關聯地存儲,所述指令語句數據表示由所述接收單元從所述終端設備接收到的所述語音數據表示并且被所述語音識別單元識別的指令的語句,并且 所述語句獲取單元利用與如下的屬性數據關聯地存儲在所述存儲設備中的指令語句數據生成待從所述發送單元向所述多個終端設備中的所述一個終端設備發送的提示語句數據,其中該屬性數據與由所述接收單元從所述多個終端設備中的一個終端設備接收到的屬性數據具有預定關系。7.根據權利要求6所述的服務器設備,其中 所述存儲控制單元使所述存儲設備將指令語句數據與時間數據彼此關聯地存儲,所述時間數據表示所述指令語句數據所表示的指令的發出時間,并且 所述語句獲取單元基于存儲在所述存儲設備中的多條指令語句數據以及與所述多條指令語句數據關聯地存儲的時間數據來指定表示隨著時間過去而使用頻度增加的指令的指令語句數據,并且利用所指定的指令語句數據來生成待從所述發送單元發送的提示語句數據。8.根據權利要求6或7所述的服務器設備,其中 所述存儲控制單元使所述存儲設備將指令語句數據與終端標識數據彼此關聯地存儲,所述指令語句數據由所述語音識別單元根據語音數據生成,并且所述終端標識數據標識發送所述語音數據的終端設備,并且 所述語句獲取單元生成提示如下指令的提示語句數據,作為待從所述發送單元向所述多個終端設備中的一個終端設備發送的提示語句數據,其中該指令與和標識所述多個終端設備中的一個終端設備的終端標識數據關聯地存儲在所述存儲設備中的指令語句數據所表示的指令不具有預定相似性。9.根據權利要求5所述的服務器設備,該服務器設備還包括: 相關性數據獲取單元,該相關性數據獲取單元獲取處理間相關性數據,所述處理間相關性數據表示多個處理項目中包括的兩個任意處理項目之間的相關性的大小,其中所述接收單元接收從所述終端設備發送的所述語音數據作為所述屬性數據, 所述語音識別單元識別由所述屬性數據表示的指令, 所述處理標識數據生成單元生成處理標識數據,所述處理標識數據標識與所述屬性數據所表示的指令對應的處理項目,并且 所述語句獲取單元基于所述處理間相關性數據所表示的、與對應于所述屬性數據所表示的指令的處理項目之間的相關性的大小,從所述多個處理項目當中選擇一個處理項目,并且獲取表示如下語句的提示語句數據作為與所述屬性數據所表示的屬性對應的提示語句數據,該語句提示用于所選擇的一個處理項目的指令。10.—種使計算機執行下列操作的程序: 獲取表示用戶的屬性或者所述用戶周圍的環境的屬性的屬性數據; 獲取提示語句數據,所述提示語句數據表示提示所述用戶發出語音指令的語句,所述提示語句數據與所述屬性數據所表示的屬性對應; 在顯示設備上顯示所述提示語句數據所表示的語句; 獲取語音數據,所述語音數據表示由所述用戶響應于所述顯示設備顯示由所述提示語句數據表示的語句而發出的語音; 獲取處理標識數據,所述處理標識數據標識與所述語音數據所表示的指令對應的處理;以及 基于所述處理標識數據來標識處理。
【文檔編號】G10L15/22GK105874531SQ201480072290
【公開日】2016年8月17日
【申請日】2014年12月24日
【發明人】栗棲俊治, 柘植結旗
【申請人】株式會社Ntt都科摩