本發明涉及意圖識別技術領域,具體涉及一種基于多維度信息的意圖識別方法及系統。
背景技術:
目前,現有的用戶意圖識別多是基于用戶使用的平臺、設備上的時間和地點等外部日常信息,例如:幾點幾分時在網頁上停留與點選,在APP上的點擊位置等,來預測用戶的意圖與偏好。但是,缺乏用戶語言文字上的信息,導致預測的結果失真,準確度差。并且,現有的用戶意圖識別不具備個人化推論能力,用戶體驗差。
如何提高意圖識別的精準度和數據處理效率,防止意圖預測失真,增強用戶體驗,是本領域技術人員亟需解決的問題。
技術實現要素:
針對現有技術中的缺陷,本發明提供一種基于多維度信息的意圖識別方法及系統,能夠提高意圖識別的精準度和數據處理效率,防止意圖預測失真,增強用戶體驗。
第一方面,本發明提供一種基于多維度信息的意圖識別方法,該方法包括:獲取用戶的文本信息、用戶歷史操作信息和外部信息;
對文本信息進行信息提取和/或識別,獲取特征信息;
根據特征信息、用戶歷史操作信息和外部信息,進行意圖識別,獲取用戶預測意圖。
進一步地,對文本信息進行信息提取和/或識別,獲取特征信息,具體包括:對文本信息進行信息提取,獲取提取信息;
對文本信息進行話題識別,獲取話題識別信息;
對文本信息進行情緒識別,獲取情緒狀態信息;
對文本信息進行語言行為識別,獲取語言行為信息,特征信息包括提取信息、話題識別信息、情緒狀態信息和語言行為信息;
根據特征信息、用戶歷史操作信息和外部信息,進行意圖識別,具體包括:
根據提取信息、話題識別信息、情緒狀態信息和語言行為信息,以及用戶歷史操作信息和外部信息,進行意圖識別。
進一步地,對文本信息進行信息提取,獲取提取信息,具體包括:
對文本信息進行詞語、語意提取,獲取提取信息;
在獲取提取信息之后,進行意圖識別之前,該方法還包括:根據文本信息和提取信息,修正文本信息。
基于上述任意基于多維度信息的意圖識別方法實施例,進一步地,對文本信息進行信息提取和/或識別,獲取特征信息,具體包括:對當前文本信息進行話題識別,獲取當前話題信息;
對歷史文本信息進行話題識別,獲取歷史話題信息,文本信息包括當前文本信息和歷史文本信息,特征信息包括當前話題信息和歷史話題信息;
根據特征信息、用戶歷史操作信息和外部信息,進行意圖識別,具體包括:
根據當前話題信息、歷史話題信息、用戶歷史操作信息和外部信息,進行意圖識別。
進一步地,對文本信息進行信息提取和/或識別,獲取特征信息,具體包括:對當前文本信息進行情緒識別,獲取當前情緒信息;
對歷史文本信息進行情緒識別,獲取歷史情緒信息,文本信息包括當前文本信息和歷史文本信息,特征信息包括當前情緒信息和歷史情緒信息;
根據特征信息、用戶歷史操作信息和外部信息,進行意圖識別,具體包括:
根據當前情緒信息、歷史情緒信息、用戶歷史操作信息和外部信息,進行意圖識別。
第二方面,本發明提供一種基于多維度信息的意圖識別系統,該系統包括信息獲取子系統、特征信息確定子系統和意圖預測子系統,信息獲取子系統用于獲取用戶的文本信息、用戶歷史操作信息和外部信息;特征信息確定子系統用于對文本信息進行信息提取和/或識別,獲取特征信息;意圖預測子系統用于根據特征信息、用戶歷史操作信息和外部信息,進行意圖識別,獲取用戶預測意圖。
進一步地,特征信息確定子系統具體用于:對文本信息進行信息提取,獲取提取信息;對文本信息進行話題識別,獲取話題識別信息;對文本信息進行情緒識別,獲取情緒狀態信息;對文本信息進行語言行為識別,獲取語言行為信息,特征信息包括提取信息、話題識別信息、情緒狀態信息和語言行為信息;
意圖預測子系統具體用于:根據提取信息、話題識別信息、情緒狀態信息和語言行為信息,以及用戶歷史操作信息和外部信息,進行意圖識別。
進一步地,特征信息確定子系統在對文本信息進行信息提取,獲取提取信息時,具體用于:對文本信息進行詞語、語意提取,獲取提取信息;該系統還包括文本修正子系統,用于根據文本信息和提取信息,修正文本信息。
基于上述任意基于多維度信息的意圖識別系統實施例,進一步地,特征信息確定子系統具體用于:對當前文本信息進行話題識別,獲取當前話題信息;對歷史文本信息進行話題識別,獲取歷史話題信息,文本信息包括當前文本信息和歷史文本信息,特征信息包括當前話題信息和歷史話題信息;
意圖預測子系統具體用于:根據當前話題信息、歷史話題信息、用戶歷史操作信息和外部信息,進行意圖識別。
進一步地,特征信息確定子系統具體用于:對當前文本信息進行情緒識別,獲取當前情緒信息;對歷史文本信息進行情緒識別,獲取歷史情緒信息,文本信息包括當前文本信息和歷史文本信息,特征信息包括當前情緒信息和歷史情緒信息;
意圖預測子系統具體用于:根據當前情緒信息、歷史情緒信息、用戶歷史操作信息和外部信息,進行意圖識別。
由上述技術方案可知,本發明基于多維度信息的意圖識別方法及系統,能夠通過用戶的文本信息進行提取或識別,獲得特征信息。根據用戶的特征信息和用戶歷史操作信息,結合外部信息,對用戶意圖進行識別,能夠提高意圖識別的精準度。并且,該方法結合用戶歷史操作信息,根據用戶的個性化使用狀態,意圖識別精準、可靠,數據處理效率高,有助于提高用戶體驗。
因此,本發明基于多維度信息的意圖識別方法及系統,能夠提高意圖識別的精準度和數據處理效率,防止意圖預測失真,增強用戶體驗。
附圖說明
為了更清楚地說明本發明具體實施方式或現有技術中的技術方案,下面將對具體實施方式或現有技術描述中所需要使用的附圖作簡單地介紹。在所有附圖中,類似的元件或部分一般由類似的附圖標記標識。附圖中,各元件或部分并不一定按照實際的比例繪制。
圖1示出了本發明所提供的一種基于多維度信息的意圖識別方法流程圖;
圖2示出了本發明所提供的一種基于多維度信息的意圖識別系統結構示意圖;
圖3示出了本發明所提供的另一種基于多維度信息的意圖識別系統結構示意圖。
具體實施方式
下面將結合附圖對本發明技術方案的實施例進行詳細的描述。以下實施例僅用于更加清楚地說明本發明的技術方案,因此只是作為示例,而不能以此來限制本發明的保護范圍。
需要注意的是,除非另有說明,本申請使用的技術術語或者科學術語應當為本發明所屬領域技術人員所理解的通常意義。
第一方面,本發明實施例提供一種基于多維度信息的意圖識別方法,結合圖1,該方法包括:
步驟S1,獲取用戶的文本信息、用戶歷史操作信息和外部信息,其中,文本信息可以是用戶輸入的文本語句,用戶歷史操作信息為用戶的操作接口、設備信息或手機、計算機等操作媒介上的使用習慣信息,外部信息為使用時間、使用地點或當前熱門話題、新聞等;
步驟S2,對文本信息進行信息提取和/或識別,獲取特征信息;
步驟S3,根據特征信息、用戶歷史操作信息和外部信息,進行意圖識別,獲取用戶預測意圖。
由上述技術方案可知,本實施例基于多維度信息的意圖識別方法,能夠通過用戶的文本信息進行提取或識別,獲得特征信息。根據用戶的特征信息和用戶歷史操作信息,結合外部信息,對用戶意圖進行識別,能夠提高意圖識別的精準度。并且,該方法結合用戶歷史操作信息,根據用戶的個性化使用狀態,意圖識別精準、可靠,數據處理效率高,有助于提高用戶體驗。
因此,本實施例基于多維度信息的意圖識別方法,能夠提高意圖識別的精準度和數據處理效率,防止意圖預測失真,增強用戶體驗。
具體地,在獲取特征信息時,該方法具體實現過程如下:
對所述文本信息進行信息提取,獲取提取信息,在此,根據文本信息的語意進行信息提取;
對文本信息進行話題識別,獲取話題識別信息,在此,根據文本信息的話題進行識別,如識別主要話題、次要話題等;
對文本信息進行情緒識別,獲取情緒狀態信息;
對文本信息進行語言行為識別,獲取語言行為信息,如文本信息的句型、語氣等,特征信息包括提取信息、話題識別信息、情緒狀態信息和語言行為信息;
根據特征信息、用戶歷史操作信息和外部信息,進行意圖識別,具體包括:根據提取信息、話題識別信息、情緒狀態信息和語言行為信息,以及用戶歷史操作信息和外部信息,進行意圖識別。同時,本實施例基于多維度信息的意圖識別方法還能夠根據提取信息、話題識別信息、情緒狀態信息和語言行為信息四種信息中的至少一種,并結合用戶歷史操作信息和外部信息,進行意圖識別。
在此,本實施例基于多維度信息的意圖識別方法,能夠識別或提取出用戶的語意、話題、情緒和語言行為等多方面的信息,為意圖識別提供全面、有效的信息支持,有助于提高意圖識別的準確度,防止意圖預測失真。
具體地,在獲取提取信息時,本實施例基于多維度信息的意圖識別方法能夠針對詞語、語意進行提取,即對文本信息進行詞語、語意提取,獲取提取信息,即結合文本信息的語意進行提取,同時,也會提取關鍵詞、專有名詞等。在獲取提取信息之后,進行意圖識別之前,該方法還包括:根據文本信息和提取信息,修正文本信息,即結合文本信息的上下文文意和原始語句,將文本信息的原始語句進行修正或改寫,以有利于意圖識別和預測,降低意圖識別過程的數據處理復雜程度。
為了進一步提高意圖識別的準確性,該方法還能夠對歷史文本信息進行識別,如進行話題識別時,該方法的具體實現過程如下:
對當前文本信息進行話題識別,獲取當前話題信息,如當前主要話題、當前次要話題、當前熱門話題等;
對歷史文本信息進行話題識別,獲取歷史話題信息,如主要話題、當前次要話題、常聊話題、喜好話題等,歷史文本信息包括當前文本信息和歷史文本信息,特征信息包括當前話題信息和歷史話題信息;
根據特征信息、用戶歷史操作信息和外部信息,進行意圖識別,具體包括:根據當前話題信息、歷史話題信息、用戶歷史操作信息和外部信息,進行意圖識別。在此,該方法能夠兼顧用戶的歷史話題信息,結合用戶在討論不同話題時的個性化使用狀況,進行用戶意圖識別,有助于增強意圖識別的準確性。
如進行情緒識別時,該方法的具體實現過程如下:
對當前文本信息進行情緒識別,獲取當前情緒信息;
對歷史文本信息進行情緒識別,獲取歷史情緒信息,如用戶歷史主要情緒狀態、用戶歷史次要情緒狀態等,文本信息包括當前文本信息和歷史文本信息,特征信息包括當前情緒信息和歷史情緒信息;
根據特征信息、用戶歷史操作信息和外部信息,進行意圖識別,具體包括:根據當前情緒信息、歷史情緒信息、用戶歷史操作信息和外部信息,進行意圖識別。在此,該方法能夠兼顧用戶的歷史情緒信息,結合用戶在不同情緒下的個性化使用狀況,進行用戶意圖識別,有助于增強意圖識別的準確性。
具體地,在實現上述處理過程中,該方法主要采用邏輯規則或機器學習等算法,來推論使用者的意圖。在訓練階段,該方法透過事先搜集的每個用戶的文本信息,進行信息識別、提取,獲取該用戶的提取信息、話題識別信息、情緒狀態信息和語言行為信息,以及該用戶的歷史操作信息和外部信息,對每種信息進行意圖反饋,以更新邏輯運算單元個數、排序方式或機器學習參數。例如,根據訓練階段中每個用戶的實際意圖狀況和實驗反饋意圖進行對比,若對比結果不一致,則更新邏輯運算單元個數、排序方式或機器學習參數,且重復進行迭代,當實際意圖狀況與實驗反饋意圖一致性達到最高時,則體質迭代,且訓練完成。在測試階段,當使用者輸入一個本文句子時,我們可以通過過往的數據訓練進行推論。
第二方面,本發明實施例提供一種基于多維度信息的意圖識別系統,結合圖2,該系統包括信息獲取子系統1、特征信息確定子系統2和意圖預測子系統3,信息獲取子系統1用于獲取用戶的文本信息、用戶歷史操作信息和外部信息;特征信息確定子系統2用于對文本信息進行信息提取和/或識別,獲取特征信息;意圖預測子系統3用于根據特征信息、用戶歷史操作信息和外部信息,進行意圖識別,獲取用戶預測意圖。
由上述技術方案可知,本實施例基于多維度信息的意圖識別系統,能夠通過用戶的文本信息進行提取或識別,獲得特征信息。根據用戶的特征信息和用戶歷史操作信息,結合外部信息,對用戶意圖進行識別,能夠提高意圖識別的精準度。并且,該系統結合用戶歷史操作信息,根據用戶的個性化使用狀態,意圖識別精準、可靠,數據處理效率高,有助于提高用戶體驗。
因此,本實施例基于多維度信息的意圖識別系統,能夠提高意圖識別的精準度和數據處理效率,防止意圖預測失真,增強用戶體驗。
為了進一步提高本實施例基于多維度信息的意圖識別系統的準確性,結合圖3,特征信息確定子系統2能夠識別多方面的信息,特征信息確定子系統2包括信息提取模塊、話題識別模塊、情緒識別模塊和語言行為識別模塊,其中,信息提取模塊對文本信息進行信息提取,獲取提取信息;話題識別模塊對文本信息進行話題識別,獲取話題識別信息;情緒識別模塊對文本信息進行情緒識別,獲取情緒狀態信息;語言行為識別模塊對文本信息進行語言行為識別,獲取語言行為信息,特征信息包括提取信息、話題識別信息、情緒狀態信息和語言行為信息;意圖預測子系統3具體用于:根據提取信息、話題識別信息、情緒狀態信息和語言行為信息,以及用戶歷史操作信息和外部信息,進行意圖識別。在此,特征信息確定子系統2能夠識別或提取出用戶的語意、話題、情緒和語言行為等多方面的信息,為意圖識別提供全面、有效的信息支持,有助于意圖預測子系統3提高意圖識別的準確度,防止意圖預測失真。
特征信息確定子系統2在對文本信息進行信息提取,獲取提取信息時,具體用于:對文本信息進行詞語、語意提取,獲取提取信息;該系統還包括文本修正子系統,用于根據文本信息和提取信息,修正文本信息,以有利于意圖識別和預測,降低意圖識別過程的數據處理復雜程度。
在進行話題識別時,特征信息確定子系統2的話題識別模塊具體用于:對當前文本信息進行話題識別,獲取當前話題信息;對歷史文本信息進行話題識別,獲取歷史話題信息,文本信息包括當前文本信息和歷史文本信息,特征信息包括當前話題信息和歷史話題信息;意圖預測子系統3具體用于:根據當前話題信息、歷史話題信息、用戶歷史操作信息和外部信息,進行意圖識別。在此,特征信息確定子系統2能夠兼顧用戶的歷史話題信息,為意圖預測子系統3提供用戶在討論不同話題時的個性化使用狀況,以進行用戶意圖識別,有助于增強意圖識別的準確性。
在進行情緒識別時,特征信息確定子系統2的情緒識別模塊具體用于:對當前文本信息進行情緒識別,獲取當前情緒信息;對歷史文本信息進行情緒識別,獲取歷史情緒信息,文本信息包括當前文本信息和歷史文本信息,特征信息包括當前情緒信息和歷史情緒信息;意圖預測子系統3具體用于:根據當前情緒信息、歷史情緒信息、用戶歷史操作信息和外部信息,進行意圖識別。在此,特征信息確定子系統2能夠兼顧用戶的情緒狀況,為意圖預測子系統3提供用戶在不同情緒時的個性化使用狀況,以進行用戶意圖識別,有助于增強意圖識別的準確性。
最后應說明的是:以上各實施例僅用以說明本發明的技術方案,而非對其限制;盡管參照前述各實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分或者全部技術特征進行等同替換;而這些修改或者替換,并不使相應技術方案的本質脫離本發明各實施例技術方案的范圍,其均應涵蓋在本發明的權利要求和說明書的范圍當中。