在對(duì)話交互系統(tǒng)中推斷搜索輸入中的用戶意圖的方法和系統(tǒng)的制作方法
【專(zhuān)利說(shuō)明】在對(duì)話交互系統(tǒng)中推斷搜索輸入中的用戶意圖的方法和系統(tǒng)
[0001]對(duì)相關(guān)申請(qǐng)的交叉引用
[0002]本申請(qǐng)要求以下專(zhuān)利申請(qǐng)的權(quán)益,其內(nèi)容通過(guò)引用被結(jié)合于此:
[0003]于2013 年 5 月 I 日提交的標(biāo)題為 “Method of and System for Inferring UserIntent in Search Input in a Conversat1nal Interact1n System,,的美國(guó)專(zhuān)利申請(qǐng)N0.13/874,523 ;
[0004]于2012 年 11 月 2 日提交的標(biāo)題為“Method of and System for Inferring UserIntent in Search Input in a Conversat1nal Interact1n System,,的美國(guó)專(zhuān)利申請(qǐng)N0.13/667,400 ;
[0005]于2012 年 11 月 2 日提交的標(biāo)題為“Method of and System for UsingConversat1n State Informat1n in a Conversat1nal Interact1n System,,的美國(guó)專(zhuān)利申請(qǐng) N0.13/667,388 ;
[0006]于2012年 10 月 11 日提交的標(biāo)題為“Method of and System for Content SearchBased on Conceptual Language Clustering” 的美國(guó)臨時(shí)專(zhuān)利申請(qǐng) N0.61/712,721 ;及
[0007]于2012 年 7 月 20 日提交的標(biāo)題為“A Conversat1nal Interact1n System forLarge Corpus Informat1n Retrieval” 的美國(guó)臨時(shí)專(zhuān)利申請(qǐng) N0.61/673,867。
技術(shù)領(lǐng)域
[0008]本發(fā)明一般地涉及對(duì)話交互技術(shù),并且更具體地,涉及基于解決輸入歧義和/或推斷對(duì)話會(huì)話中已發(fā)生變化來(lái)推斷用戶意圖。
【背景技術(shù)】
[0009]對(duì)話系統(tǒng)有望成為跨一系列設(shè)備導(dǎo)航大型信息庫(kù)的優(yōu)選模式,其中設(shè)備包括:智能電話、平板電腦、TV/STB、多模態(tài)設(shè)備,諸如像“Goggles”(谷歌的太陽(yáng)鏡)的可穿戴計(jì)算設(shè)備、類(lèi)似Xbox/Kinect的混合手勢(shì)識(shí)別/語(yǔ)音識(shí)別系統(tǒng)、汽車(chē)信息系統(tǒng)以及一般的家庭娛樂(lè)系統(tǒng)。處于舞臺(tái)中心、作為主要交互模式的基于觸摸界面的時(shí)代也許慢慢地進(jìn)入尾聲,其中在許多日常生活的用例中,用戶寧愿說(shuō)出自己的意圖,并且系統(tǒng)理解和按該意圖執(zhí)行。這同時(shí)被顯著的硬件、軟件和算法的進(jìn)步所激發(fā),這些進(jìn)步使得與幾年前相比,文本到語(yǔ)音有效得多。
[0010]盡管正朝著純對(duì)話接口做出進(jìn)展,但是現(xiàn)有的簡(jiǎn)單請(qǐng)求響應(yīng)方式的對(duì)話系統(tǒng)只夠在小型信息庫(kù)中解決面向特定任務(wù)的或者特定信息檢索的問(wèn)題-這些系統(tǒng)不能在大型語(yǔ)料信息庫(kù)上很好的執(zhí)行。
[0011]其核心本質(zhì)上是請(qǐng)求響應(yīng)系統(tǒng)的當(dāng)前系統(tǒng)試圖提供諸如響應(yīng)用戶問(wèn)題的對(duì)話方式的界面,如下:
[0012]用戶:我的支票賬戶余額是多少?
[0013]系統(tǒng):它是$2,459.34。
[0014]用戶:存款呢?
[0015]系統(tǒng):它是$6,209.012。
[0016]用戶:貨幣市場(chǎng)如何?
[0017]系統(tǒng):它是$14,599.33。
[0018]這些本質(zhì)上是提供對(duì)話連續(xù)性概念的面向目標(biāo)的或面向任務(wù)的請(qǐng)求響應(yīng)系統(tǒng),盡管每個(gè)請(qǐng)求響應(yīng)對(duì)都彼此獨(dú)立并且所維護(hù)的唯一上下文是簡(jiǎn)單的上下文,即,用戶的銀行賬戶。當(dāng)前對(duì)話系統(tǒng)的其它例子是那些使用戶走過(guò)一系列良好定義的并通常預(yù)先確定的決策樹(shù)路徑以完成用戶意圖(諸如預(yù)定晚餐、預(yù)定機(jī)票等)的系統(tǒng)。
[0019]申請(qǐng)人已發(fā)現(xiàn),理解用戶的意圖(即使在其中用戶意圖可以跨單純的信息檢索到觀看演出或預(yù)訂演出/電影票的諸如數(shù)字娛樂(lè)的領(lǐng)域內(nèi))結(jié)合理解表達(dá)意圖的用戶話語(yǔ)的語(yǔ)義以提供匹配用戶意圖的清楚和簡(jiǎn)潔的響應(yīng)是當(dāng)前系統(tǒng)在對(duì)話空間中未能解決的難題。除具有明確意圖表達(dá)的簡(jiǎn)單句子之外,通常難以提取表達(dá)意圖的句子的意圖和語(yǔ)義,即使在單個(gè)請(qǐng)求/響應(yīng)交換式的交互中。不具有良好定義步驟的面向任務(wù)的意圖增加了這種復(fù)雜性(諸如遍歷預(yù)定的判定樹(shù))。同樣有問(wèn)題的是需要一系列用戶請(qǐng)求和系統(tǒng)響應(yīng)來(lái)使任務(wù)完成的那些交互(例如,像預(yù)定晚餐)。還有,豐富的信息庫(kù)會(huì)尤其具有挑戰(zhàn)性,因?yàn)閷?duì)實(shí)體的用戶意圖表達(dá)可以采用許多有效且自然的形式,并且同一詞匯標(biāo)記(單詞)會(huì)與許多不同的用戶意圖相關(guān)地出現(xiàn)。
[0020]當(dāng)語(yǔ)料庫(kù)很大時(shí),在不用對(duì)話來(lái)澄清詞匯沖突和多種語(yǔ)義解釋的情況下,這些沖突或歧義增加了滿足用戶意圖的復(fù)雜性。有時(shí),甚至不可能理解用戶的意圖,或者表達(dá)意圖的句子的語(yǔ)義-類(lèi)似于在現(xiàn)實(shí)生活中人之間的對(duì)話中所發(fā)生的。系統(tǒng)問(wèn)最少量的問(wèn)題(從在對(duì)話中理解另一個(gè)人的角度看)來(lái)理解用戶意圖的能力,正如人將會(huì)做的那樣(一般來(lái)說(shuō)其中參與方都知道所討論的領(lǐng)域),將決定系統(tǒng)到人類(lèi)對(duì)話的接近程度。
[0021]超出簡(jiǎn)單的多步驟旅行/晚餐預(yù)訂(例如,對(duì)話中的步驟是明確定義的請(qǐng)求/響應(yīng)序列,在每一步中沒(méi)有太多的歧義解決方案)的進(jìn)行對(duì)話或交流的系統(tǒng)同樣面臨為了有效率而不得不維護(hù)對(duì)話狀態(tài)的復(fù)雜性。例如,這些系統(tǒng)將需要推斷對(duì)意圖和實(shí)體的隱含引用(例如,對(duì)人、物體或任何名詞的引用)以及在用戶的句子中限定意圖的屬性(例如,“給我顯示Tom Hanks最近的電影而不是老電影”;“給我顯示更多的動(dòng)作片和更少的暴力片”)。還有,申請(qǐng)人已發(fā)現(xiàn),不僅跟蹤由用戶做出的對(duì)之前輸入中的實(shí)體、屬性等的引用,而且跟蹤系統(tǒng)對(duì)用戶的多模式響應(yīng)的實(shí)體、屬性等的引用是有益的。
[0022]還有,申請(qǐng)人已發(fā)現(xiàn),在用戶/系統(tǒng)交流期間維護(hù)代詞到賓語(yǔ)/主語(yǔ)的關(guān)聯(lián)增強(qiáng)了用戶的體驗(yàn)。例如,在諸如“在近期的Daniel Craig電影的原聲曲目中的Led Zeppelin歌曲…誰(shuí)演奏的它? ”的復(fù)雜用戶輸入中將代詞“它”關(guān)聯(lián)到其賓語(yǔ)/主語(yǔ)“Led Zeppelin歌曲”的語(yǔ)音分析器(或自然語(yǔ)言處理器)通過(guò)不需要用戶始終使用特定的語(yǔ)法來(lái)幫助用戶。但是,這種簡(jiǎn)單的代詞到賓語(yǔ)/主語(yǔ)的關(guān)聯(lián)在處理以下交流時(shí)是無(wú)效的:
[0023]Ql:誰(shuí)在新星球大戰(zhàn)中扮演Ob1-wan Kenobi ?
[0024]A:Ewan McGregor。
[0025]Q2:他與 Scarlet Johansson 的電影有哪些?
[0026]這里,在第二個(gè)問(wèn)題中的“他”指響應(yīng)中的人,而不是來(lái)自用戶輸入中的人。更復(fù)雜的例子如下:
[0027]Ql:誰(shuí)在 Kramer vs.Kramer 中扮演主角?
[0028]Al:Meryl Streep 和 Dustin Hoffman。
[0029]Q2:他的更多電影有哪些?
[0030]A2:這里是一些Dustin Hoffman的電影…[Dustin Hoffman電影的列表]。
[0031]Q3:她的更多電影有哪些?
[0032]這里,在Q2中的“他的”和在Q3中的“她的”指回到響應(yīng)Al。在這些情況下,在理解用戶意圖時(shí),單獨(dú)的自然語(yǔ)言處理器是無(wú)效的。在以下描述的幾個(gè)實(shí)施例中,語(yǔ)言處理器與對(duì)話狀態(tài)引擎以及特定于領(lǐng)域的信息一起工作,其中特定于領(lǐng)域的信息指示實(shí)體的男性和女性屬性,這能夠幫助解決這些對(duì)之前對(duì)話交流的代詞指代。
[0033]進(jìn)行用戶對(duì)話的系統(tǒng)面臨的另一個(gè)挑戰(zhàn)是對(duì)用戶意圖變化的確定,即使是在同一領(lǐng)域內(nèi)。例如,用戶可能以尋找例如娛樂(lè)領(lǐng)域中的問(wèn)題的答案開(kāi)始。在進(jìn)行探索更多關(guān)于那個(gè)問(wèn)題的對(duì)話的同時(shí),決定尋求完全不同的意圖路徑。當(dāng)前系統(tǒng)期望用戶提供發(fā)起新對(duì)話的明確提示。如果用戶未能提供那個(gè)重要提示,則系統(tǒng)響應(yīng)仍將限制在用戶已經(jīng)下降到的探索路徑的狹小范圍,并且將用戶的輸入限制到那個(gè)狹小的上下文,這通常導(dǎo)致就算不是荒謬的也是不想要的響應(yīng)。當(dāng)用戶選擇在對(duì)話中間切換領(lǐng)域時(shí),弄錯(cuò)上下文的結(jié)果甚至更加刺眼(以至于該系統(tǒng)看起來(lái)滑稽無(wú)能)。例如,當(dāng)用戶探索娛樂(lè)空間中的內(nèi)容時(shí),可能說(shuō):“我餓了”。如果系統(tǒng)沒(méi)有意識(shí)到這是切換到新的領(lǐng)域(餐館/飲食領(lǐng)域),則它會(huì)認(rèn)為“我餓了”是在娛樂(lè)空間中提出的問(wèn)題而進(jìn)行響應(yīng),并且提供在那個(gè)領(lǐng)域的響應(yīng),在這個(gè)例子中,這將是滑稽的錯(cuò)誤響應(yīng)。
[0034]另一方面,人類(lèi)通過(guò)語(yǔ)句最基本的屬性自然地認(rèn)識(shí)到這種大幅的領(lǐng)域切換,并相應(yīng)地做出響應(yīng)(例如,“我們要訂比薩嗎? ”)。即使在到新領(lǐng)域的過(guò)渡不是那么明顯的偏遠(yuǎn)場(chǎng)景中,人類(lèi)參與者會(huì)猶豫,但是很快就從第一說(shuō)話者的反饋中恢復(fù)(“哦,不,我的意思是我餓了 -我想吃東西! ”)。對(duì)話中人類(lèi)認(rèn)為理所當(dāng)然的這些細(xì)微但重要的對(duì)話元素是人與人對(duì)話的豐富性和與自動(dòng)化系統(tǒng)對(duì)話的豐富性的區(qū)別所在。
[0035]總而言之,本文所公開(kāi)技術(shù)的實(shí)施例試圖緊密地匹配用戶的意圖,并且像人類(lèi)交互一樣與用戶進(jìn)行對(duì)話。某些實(shí)施例展示了以下非窮盡特征列表中的任何一個(gè)或多個(gè)特征:a)解決意圖和/或意圖描述中的歧義,并且每當(dāng)適用時(shí)利用用戶的偏好(一些實(shí)現(xiàn)使用基于特定于領(lǐng)域的垂直信息的計(jì)算元素和邏輯);b)在與用戶的整個(gè)交流中維護(hù)描述意圖的活動(dòng)意圖和/或?qū)嶓w/屬性的狀態(tài),以便隱含地推斷用戶間接地對(duì)對(duì)話中早先提到的意圖/實(shí)體/屬性所做的引用;c)每當(dāng)適用時(shí),修改對(duì)用戶的響應(yīng),以匹配用戶的偏好;d)隱含地確定在領(lǐng)域內(nèi)和跨領(lǐng)域開(kāi)始新話題的對(duì)話邊界,并相應(yīng)地修改響應(yīng);e)假設(shè)未能理解用戶的意圖(例如,或者因?yàn)橐鈭D無(wú)法找到或者意圖的最佳猜測(cè)的信心指數(shù)低于閾值),則進(jìn)行最少的對(duì)話來(lái)理解用戶的意圖(以類(lèi)似于人類(lèi)在對(duì)話中為了理解意圖所做的方式)。在本發(fā)明的一些實(shí)施例中,對(duì)意圖的理解可以利用設(shè)備(例如,像平板設(shè)備)的顯示能力來(lái)圖形地顯示用戶可以交互以提供關(guān)于用戶意圖的線索的直觀演示。
【發(fā)明內(nèi)容】
[0036]在本發(fā)明的一個(gè)方面中,公開(kāi)了一種用于在對(duì)話交互系統(tǒng)中推斷搜索輸入中的用戶意圖的方法和系統(tǒng)。
[0037]在本發(fā)明的另一個(gè)方面中,基于解決搜索輸入的歧義部分來(lái)推斷搜索輸入中的用戶意圖的方法包括提供對(duì)一組內(nèi)容項(xiàng)的訪問(wèn)。每個(gè)內(nèi)容項(xiàng)都與描述相應(yīng)內(nèi)容項(xiàng)的元數(shù)據(jù)相關(guān)聯(lián)。該方法還包括提供用戶偏好簽名。用戶偏好簽名描述用戶對(duì)(i)特定的內(nèi)容項(xiàng)和(ii)與內(nèi)容項(xiàng)相關(guān)聯(lián)的元數(shù)據(jù)中至少一個(gè)的偏好。該方法還包括從用戶接收搜索輸入。用戶意圖使該搜索輸入用來(lái)識(shí)別至少一個(gè)期望的內(nèi)容項(xiàng)。該方法還包括確定搜索輸入的一部分包含歧義標(biāo)識(shí)符。用戶意圖使該歧義標(biāo)識(shí)符用來(lái)至少部分地識(shí)別至少一個(gè)期望的內(nèi)容項(xiàng)。該方法還包括基于搜索輸入的部分與由用戶偏好簽名描述的用戶偏好匹配來(lái)推斷歧義標(biāo)識(shí)符的含義并且基于搜索輸入和所推斷的歧義標(biāo)識(shí)符的含義與和內(nèi)容項(xiàng)相關(guān)聯(lián)的元數(shù)據(jù)進(jìn)行比較而從一組內(nèi)容項(xiàng)中選擇內(nèi)容項(xiàng)。
[0038]在本發(fā)明還有的方面中,歧義標(biāo)識(shí)符可以是代詞、語(yǔ)法虛詞(syntacticexpletive)、娛樂(lè)題材和/或名稱(chēng)的至少一部分。
[0039]在本發(fā)明還有的另一個(gè)方面中,與內(nèi)容項(xiàng)相關(guān)聯(lián)的元數(shù)據(jù)包括與內(nèi)容項(xiàng)相關(guān)聯(lián)的實(shí)體之間的關(guān)系的映射。
[0040]在本發(fā)明還有的方面中,用戶偏好簽名是基于用戶提供的明確的偏好和/或基于對(duì)用戶在一段時(shí)間內(nèi)所做的內(nèi)容項(xiàng)選擇的分析??蛇x地,用戶偏好簽名描述用戶對(duì)與內(nèi)容項(xiàng)相關(guān)聯(lián)的元數(shù)據(jù)的偏好,該元數(shù)據(jù)包括該用戶偏好的實(shí)體。
[0041]在本發(fā)明的另一個(gè)方面中,基于解決搜索輸入的歧義部分來(lái)推斷搜索輸入中的用戶意圖的方法包括提供對(duì)一組內(nèi)容項(xiàng)的訪問(wèn)。每個(gè)內(nèi)容項(xiàng)都與描述相應(yīng)內(nèi)容項(xiàng)的元數(shù)據(jù)相關(guān)聯(lián)。該方法還包括從用戶接收搜索輸入。用戶意圖使該搜索輸入來(lái)識(shí)別至少一個(gè)期望的內(nèi)容項(xiàng)。該方法還包括確定搜索輸入的一部分是否包含歧義標(biāo)識(shí)符。用戶意圖使該歧義標(biāo)識(shí)符來(lái)至少部分地識(shí)別至少一個(gè)期望的內(nèi)容項(xiàng)。在其中搜索輸入的一部分包含歧義標(biāo)識(shí)符的情況下,該方法包括:基于搜索輸入的部分與由用戶偏好簽名描述的用戶偏好匹配來(lái)推斷歧義標(biāo)識(shí)符的含義、基于搜索輸入和所推斷的歧義標(biāo)識(shí)符含義與和內(nèi)容項(xiàng)相關(guān)聯(lián)的元數(shù)據(jù)比較,從一組內(nèi)容項(xiàng)中選擇內(nèi)容項(xiàng),以及在其中搜索輸入不包含歧義標(biāo)識(shí)符的情況下,基于搜索輸入與和內(nèi)容項(xiàng)相關(guān)聯(lián)的元數(shù)據(jù)的比較來(lái)從一組內(nèi)容項(xiàng)中選擇內(nèi)容項(xiàng)。
[0042]以上列出的任何方面都可以與以上列出的任何其它方面和/或與本文所公開(kāi)的技術(shù)結(jié)合。
【附圖說(shuō)明】
[0043]為了對(duì)本發(fā)明的各種實(shí)施例有更完整的理解,現(xiàn)在結(jié)合附圖參考以下描述,附圖中:
[0044]圖1為解釋的目的說(shuō)明了結(jié)合于此的用戶界面方法。
[0045]圖2為解釋的目的說(shuō)明了結(jié)合于此的用戶界面方法。
[0046]圖3為解釋的目的說(shuō)明了結(jié)合于此的用戶界面方法。
[0047]圖4為解釋的目的說(shuō)明了結(jié)合于此的用戶界面方法。
[0048]圖5為解釋的目的說(shuō)明了結(jié)合于此的用戶界面方法。
[0049]圖6說(shuō)明了表示實(shí)體及實(shí)體間關(guān)系的圖的例子。
[0050]圖7說(shuō)明了表示實(shí)體及實(shí)體間關(guān)系的圖的例子。