本發明涉及通信
技術領域:
,具體涉及一種基于場景信息獲取聊天回復內容的方法及裝置。
背景技術:
:目前,不管是智能聊天機器人系統提供的智能聊天回復內容、還是通訊終端提供給通訊雙方用于選擇或智能回復的聊天回復內容,大多是通過數據庫匹配的方式獲取。這種通過數據庫匹配方法獲取聊天回復內容的方法主要分為二個步驟,即首先對聊天發起句進行預處理,獲得分詞文本,然后將獲得的分詞文本與預先建立的數據庫進行匹配,從而獲得聊天回復內容。但這種匹配方式并沒有結合參與智能聊天的通訊雙方的任何場景信息、屬性信息或其他狀態信息等,故導致獲取的聊天回復內容單一固定,聊天的智能化程度低以及用戶體驗不佳。技術實現要素:本發明提供了一種基于場景信息獲取聊天回復內容的方法及裝置,以解決現有獲取聊天回復內容的方法沒有結合參與聊天的通訊雙方的場景信息,導致獲取的聊天回復內容單一固定,聊天的智能化程度低以及用戶體驗不佳的技術問題。根據本發明的一方面,提供了一種基于場景信息獲取聊天回復內容的方法,包括:接收聊天發起句;根據聊天發起句獲取聊天發起句所屬的話題分類;采集預先設定的與話題分類關聯的輔助場景條目的內容信息,獲得輔助場景信息;根據輔助場景信息在預先設定的與話題分類對應的話題數據庫中對聊天發起句進行數據匹配,并將數據匹配的結果作為與聊天發起句對應的聊天回復內容。進一步地,根據聊天發起句獲取聊天發起句所屬的話題分類包括:獲取聊天發起句的上文聊天內容,并將聊天發起句和聊天發起句的上文聊天內容合并成文本格式的預處理文本;提取預處理文本的關鍵詞;根據關鍵詞獲取聊天發起句所屬的話題分類。進一步地,采集預先設定的與話題分類關聯的輔助場景條目的內容信息,獲得輔助場景信息包括:預先設定與話題分類關聯的輔助場景條目,獲得關聯輔助場景條目;采用計算、推理、查詢、搜索或其任意組合的方式獲取與關聯輔助場景條目對應的內容信息,獲得輔助場景信息。進一步地,根據輔助場景信息在預先設定的與話題分類對應的話題數據庫中對聊天發起句進行數據匹配包括:創建與話題分類對應的話題數據庫,其中,話題數據庫包括至少一個以話題分類為聊天主題的樣本聊天對,樣本聊天對包括樣本聊天發起句、與樣本聊天發起句對應的回復條件ID以及與回復條件ID對應的結論內容;采用創建回復條件ID的創建規則對輔助場景信息進行標識,獲得標識ID;在話題數據庫中匹配與聊天發起句相同的樣本聊天發起句,以及在與樣本聊天發起句對應的回復條件ID中匹配與標識ID相同的回復條件ID,并將與標識ID相同的回復條件ID對應的結論內容作為數據匹配的結果。進一步地,輔助場景條目包括:發送和/或接收聊天發起句的通訊終端的姓名條目、性別條目、年齡條目、即時通訊賬號條目、電子郵箱地址條目、家庭地址條目、職業類別條目、職務條目、工作單位條目、單位地址條目、銀行賬號條目、好友印象條目、通訊錄分組條目、關系條目、興趣愛好條目、朋友圈狀態條目、心情條目、最近關注話題條目、時間條目、節日條目、季節條目、地理位置信息條目、距離條目、場景圖像條目。進一步地,采集輔助場景條目中的場景圖像條目的內容信息包括:采集發送和/或接收聊天發起句的通訊終端的場景圖像;采用DOG算子提取場景訓練圖像的感興趣區域,并計算場景訓練圖像的感興趣區域的SIFT特征;采用K均值聚類算法對場景訓練圖像的感興趣區域的SIFT特征進行聚類,獲得多個聚類中心,并建立由與每一個聚類中心對應的視覺單詞構成的視覺單詞詞典;采用DOG算子提取場景圖像的感興趣區域,并在視覺單詞詞典中匹配與場景圖像的感興趣區域的SIFT特征最接近的視覺單詞;根據場景圖像的感興趣區域的視覺單詞的分布對場景圖像采用預先訓練好的支持向量機分類器進行分類,獲得發送和/或接收聊天發起句的通訊終端的場景圖像條目的內容信息。根據本發明的另一方面,提供了一種基于場景信息獲取聊天回復內容的裝置,包括:接收裝置,用于接收聊天發起句;話題分類獲取裝置,用于根據聊天發起句獲取聊天發起句所屬的話題分類;輔助場景信息獲取裝置,用于采集預先設定的與話題分類關聯的輔助場景條目的內容信息,獲得輔助場景信息;匹配裝置,用于根據輔助場景信息在預先設定的與話題分類對應的話題數據庫中對聊天發起句進行數據匹配,并將數據匹配的結果作為與聊天發起句對應的聊天回復內容。進一步地,話題分類獲取裝置包括:預處理文本獲取裝置,用于獲取聊天發起句的上文聊天內容,并將聊天發起句和聊天發起句的上文聊天內容合并成文本格式的預處理文本;關鍵詞提取裝置,用于提取預處理文本的關鍵詞;話題分類確定裝置,用于根據關鍵詞確定聊天發起句所屬的話題分類。進一步地,輔助場景信息獲取裝置包括:設定裝置,用于預先設定與話題分類關聯的輔助場景條目,獲得關聯輔助場景條目;計算推理裝置,用于采用計算、推理、查詢、搜索或其任意組合的方式獲取與關聯輔助場景條目對應的內容信息,獲得輔助場景信息。進一步地,匹配裝置包括:話題數據庫創建裝置,用于創建與話題分類對應的話題數據庫,其中,話題數據庫包括至少一個以話題分類為聊天主題的樣本聊天對,樣本聊天對包括樣本聊天發起句、與樣本聊天發起句對應的回復條件ID以及與回復條件ID對應的結論內容;標識裝置,用于采用創建回復條件ID的創建規則對輔助場景信息進行標識,獲得標識ID;ID匹配裝置,用于在話題數據庫中匹配與聊天發起句相同的樣本聊天發起句,以及在與樣本聊天發起句對應的回復條件ID中匹配與標識ID相同的回復條件ID,并將與標識ID相同的回復條件ID對應的結論內容作為數據匹配的結果。本發明具有以下有益效果:本發明提供了一種基于場景信息獲取聊天回復內容的方法及裝置,該方法通過自動采集與接收的聊天發起句所屬的話題分類關聯的輔助場景條目的內容信息獲得輔助場景信息,并結合輔助場景信息獲取與聊天發起句對應的聊天回復內容,解決了現有獲取聊天回復內容的方法沒有結合參與聊天的通訊雙方的場景信息,導致獲取的聊天回復內容單一固定,聊天的智能化程度低以及用戶體驗不佳的技術問題,實現了根據不同的場景信息獲取不同的聊天回復內容,且獲取的聊天回復內容充分結合了通訊雙方的場景信息,并與通訊雙方息息相關,體現了較高的智能化和個性化水平。此外,基于場景信息自動獲取聊天回復內容無需人工編輯,提高了聊天會話速度,提升了用戶體驗。除了上面所描述的目的、特征和優點之外,本發明還有其它的目的、特征和優點。下面將參照圖,對本發明作進一步詳細的說明。附圖說明構成本申請的一部分的附圖用來提供對本發明的進一步理解,本發明的示意性實施例及其說明用于解釋本發明,并不構成對本發明的不當限定。在附圖中:圖1是本發明優選實施例的基于場景信息獲取聊天回復內容的方法流程圖;圖2是本發明優選實施例假設采集的接收聊天發起句的通訊終端的場景圖像;圖3是本發明優選實施例對假設采集的接收聊天發起句的通訊終端的場景圖像與視覺單詞詞典匹配后獲得的視覺單詞結果圖;圖4是本發明優選實施例針對第一個精簡實施例獲取聊天回復內容的方法流程圖;圖5是本發明優選實施例針對第二個精簡實施例獲取聊天回復內容的方法流程圖;圖6是本發明優選實施例的基于場景信息獲取聊天回復內容的裝置結構框圖。附圖標記說明:10、接收裝置;20、話題分類獲取裝置;30、輔助場景信息獲取裝置;40、匹配裝置。具體實施方式以下結合附圖對本發明的實施例進行詳細說明,但是本發明可以由權利要求限定和覆蓋的多種不同方式實施。參照圖1,本發明的優選實施例提供了一種基于場景信息獲取聊天回復內容的方法,包括:步驟S101,接收聊天發起句;步驟S102,根據聊天發起句獲取聊天發起句所屬的話題分類;步驟S103,采集預先設定的與話題分類關聯的輔助場景條目的內容信息,獲得輔助場景信息;步驟S104,根據輔助場景信息在預先設定的與話題分類對應的話題數據庫中對聊天發起句進行數據匹配,并將數據匹配的結果作為與聊天發起句對應的聊天回復內容。本發明提供的基于場景信息獲取聊天回復內容的方法,通過自動采集與接收的聊天發起句所屬的話題分類關聯的輔助場景條目的內容信息獲得輔助場景信息,并結合輔助場景信息獲取與聊天發起句對應的聊天回復內容,解決了現有獲取聊天回復內容的方法沒有結合參與聊天的通訊雙方的場景信息,導致獲取的聊天回復內容單一固定,聊天的智能化程度低以及用戶體驗不佳的技術問題,實現了根據不同的場景信息獲取不同的聊天回復內容,且獲取的聊天回復內容充分結合了通訊雙方的場景信息,并與通訊雙方息息相關,體現了較高的智能化和個性化水平。此外,基于場景信息自動獲取聊天回復內容無需人工編輯,提高了聊天會話速度,提升了用戶體驗。本實施例中的輔助場景條目為預先設定的用于獲取發起或接收聊天發起句的通訊終端相關信息的條目,例如興趣愛好條目、朋友圈狀態條目、心情條目、最近關注話題條目等等。本實施例通過首先獲取聊天發起句所屬的話題分類,可以初步確定聊天回復內容的回復主題或回復方向,且通過首先對聊天發起句進行話題分類劃分,有利于后續基于話題分類獲取的聊天回復內容更有針對性,專業性,同時提高了獲取聊天回復內容的獲取效率。參照表1,表1給出了幾種不同的話題分類及與其關聯的輔助場景條目。例如,如果話題分類為“旅游”話題分類時,則通過日常經驗可知,通訊終端對屬于“旅游”話題分類的聊天發起句進行回復時,務必會要考慮到天氣好壞的因素、有沒有時間的因素、地點因素以及是否有旅游興趣愛好因素等等,而對話題分類為“發郵件”話題分類時,則通過日常經驗可知,通訊終端對屬于“發郵件”話題分類的聊天發起句進行回復時,務必會考慮到電子郵箱發送或接收的電子郵箱地址因素,而基本不會考慮天氣好壞的因素,需要說明的是,本實施例針對不同的話題分類預先設定的與之關聯的輔助場景條目并非是固定的,而僅僅是根據日常經驗人為給定的,也即用戶可以根據需要自行設定與話題分類關聯的輔助場景條目。表1可選地,根據聊天發起句獲取聊天發起句所屬的話題分類包括:獲取聊天發起句的上文聊天內容,并將聊天發起句和聊天發起句的上文聊天內容合并成文本格式的預處理文本;提取預處理文本的關鍵詞;根據關鍵詞確定聊天發起句所屬的話題分類。具體地,本實施例可以根據對預處理文本分詞后獲得的分詞文本的詞頻統計確定預處理文本的關鍵詞,也可以根據對預處理文本分詞后獲得的分詞文本的加權詞頻統計確定預處理文本的關鍵詞。這主要是由于本實施例確定聊天發起句所屬的話題分類并不僅僅是基于聊天 發起句,而是基于聊天發起句和聊天發起句的上文聊天內容,而在實際的實施過程中,聊天發起句相對于聊天發起句的上文聊天內容對獲取聊天發起句所屬的話題分類更具有參考價值,故本實施例采用對預處理文本分詞后獲得的分詞文本的加權詞頻統計確定預處理文本的關鍵詞,也即對離聊天發起句越接近的聊天內容賦予權重更大的權重系數。本實施例在根據預處理文本獲得關鍵詞后,可以采用關鍵詞對應的內容作為聊天發起句所屬的話題分類,也可以根據預設的關鍵詞與話題分類的關聯映射表查詢與關鍵詞對應的話題分類。本實施例通過結合聊天發起句和聊天發起句的上文聊天內容獲取聊天發起句所屬的話題分類,充分考慮了聊天發起句所處的聊天語境,相對于僅僅依靠聊天發起句獲得其所屬的話題分類的準確度更高。且通過加權的方式對預處理文本分詞后獲得的分詞文本的詞頻統計確定關鍵詞,使得獲取的聊天發起句的所屬話題分類更精確。需要說明的是,當本實施例中聊天發起句沒有聊天上文內容時,本實施例則僅僅根據聊天發起句獲取其所屬的話題分類,且本實施例中獲取聊天發起句的上文聊天內容的范圍由用戶自定義,例如可以獲取一定時間內的上文聊天內容,或一定內容條數內的上文聊天內容。可選地,采集預先設定的與話題分類關聯的輔助場景條目的內容信息,獲得輔助場景信息包括:預先設定與話題分類關聯的輔助場景條目,獲得關聯輔助場景條目;采用計算、推理、查詢、搜索或其任意組合的方式獲取與關聯輔助場景條目對應的內容信息,獲得輔助場景信息。在實際的實施過程中,本實施例可以通過對通訊雙方的個人信息、社交信息、通訊信息、網上購物信息、上網足跡信息、用戶行為信息、用戶業務信息等數據的計算、推理、查詢、搜索或其任意組合的方式獲取與關聯輔助場景條目對應的內容信息,其中,用戶行為信息是指用戶尋求他所需求的信息時所表現出來的需求表達、信息獲取、信息利用等行為的信息。通訊信息又包括用戶自己的歷史通訊記錄、使用同一通訊應用軟件的其他用戶的歷史通訊記錄以及第三方應用軟件提供的通訊記錄。具體地,通訊記錄又包括通話記錄和短信記錄,且短信記錄又包括手機短信記錄或即時通訊消息記錄,通話記錄又包括手機通話記錄和即時通訊語音和視頻通話記錄。例如當輔助場景條目為地理位置信息條目時,可通過查詢GPS定位的信息獲取,當輔助場景條目為距離條目時,則可以通過計算通訊雙方的地理位置差獲取,當輔助場景條目為最近關注話題條目時,可通過搜索通訊用戶最近的網頁瀏覽記錄獲取,當輔助場景條目為天氣條目時,既可以通過查詢天氣網頁獲取,也可通過采集的溫度、風向、濕度等氣象信息推理獲取。可選地,根據輔助場景信息在預先設定的與話題分類對應的話題數據庫中對聊天發起句進行數據匹配包括:創建與話題分類對應的話題數據庫,其中,話題數據庫包括至少一個以話題分類為聊天主題的樣本聊天對,樣本聊天對包括樣本聊天發起句、與樣本聊天發起句對應的回復條件ID以及與回復條件ID對應的結論內容;采用創建回復條件ID的創建規則對輔助場景信息進行標識,獲得標識ID;在話題數據庫中匹配與聊天發起句相同的樣本聊天發起句,以及在與樣本聊天發起句對應的回復條件ID中匹配與標識ID相同的回復條件ID,并將與標識ID相同的回復條件ID對應的結論內容作為數據匹配的結果。本實施例創建的與話題分類對應的話題數據庫包括至少一個以話題分類為聊天主題的樣本聊天對,樣本聊天對包括樣本聊天發起句、與樣本聊天發起句對應的回復條件ID以及與回復條件ID對應的結論內容,通過匹配與聊天發起句相同的樣本聊天發起句以及在與樣本聊天發起句對應的回復條件ID中匹配與標識ID相同的回復條件ID,考慮了與話題分類關聯的所有輔助場景條目的內容信息,從而使得獲取的聊天回復內容充分結合了通訊雙方的場景信息,并與通訊雙方息息相關,體現了較高的智能化和個性化水平。需要說明的是,在實際的實施過程中,本實施例也可以通過匹配與聊天發起句最相似的樣本聊天發起句以及在與樣本聊天發起句對應的回復條件ID中匹配與標識ID相同的回復條件ID,獲取數據匹配的結果。本實施例中的創建條件ID的創建規則由用戶自定義,例如當話題分類為祝福問候,且與該話題分類關聯的輔助場景條目只包括2條時,具體為發送聊天發起句和接收聊天發起句的通訊終端的關系條目和發送聊天發起句的通訊終端的天氣條目。則針對話題數據庫中每一個樣本聊天發起句,在分別創建發送聊天發起句和接收聊天發起句的通訊終端的關系條目和發送聊天發起句的通訊終端的天氣條目時的回復條件ID號由用戶自定義,例如針對天氣條目,可以定義“1”表示天氣好,“2”表示天氣差,也可以定義“1”表示晴朗,“2”表示下雨,“3”表示下雪等等。假設本實施例中發送聊天發起句和接收聊天發起句的關系條目包括4種內容選項(具體為“1”表示親人關系、“2”表示朋友關系、“3”表示同事關系、“4”表示同學關系),發送聊天發起句的通訊終端的天氣條目包括2種內容選項(具體為“1”表示天氣好、“2”表示天氣差),則在創建日常祝福問候話題分類對應的話題數據庫時,需要建立包含所有選項組合的結論內容,即回復條件ID號包括{“11”、“21”、“31”、“41”、“12”、“22”、“32”、“42”},共八個回復條件ID號,也即該話題數據庫針對其中的每一個樣本聊天發起句,均包括8個回復條件ID號以及與回復條件ID號分別對應的結論內容,需要說明的是,本實施例針對每一個回復條件ID的結論內容可以為一條會話內容,也可以為多條會話內容。本實施例中創建的與話題分類的話題數據庫具有自動學習和自動更新的功能,具體地,當采集到輔助場景條目的內容信息不包含在已創建的話題數據庫中輔助場景條目的內容信息時,例如在關于“祝福問候”話題數據庫中,對于“天氣”輔助場景條目的內容信息選項僅僅包括三個,分別為:“1”表示晴朗,“2”表示下雨,“3”表示下雪,則當采集到“天氣”輔助場景條目的內容信息為“陰天”時,系統將在“天氣”輔助場景條目下創建字段號“4”表示陰天的內容信息選項,以及對應更新回復條件ID號及與其對應的結論內容。本實施例在獲取輔助場景信息后,首先采用創建回復條件ID的創建規則對輔助場景信息進行標識,獲得標識ID,具體地,假設本實施例采集的發送聊天發起句和接收聊天發起句的通訊終端的關系條目的內容信息為“同事”,發送聊天發起句的通訊終端的天氣條目的內容信息為“好”,則獲得的標識ID號為“31”,然后在話題數據庫中匹配與聊天發起句相同的樣本聊天發起句,以及在與樣本聊天發起句對應的回復條件ID中匹配與標識ID相同的回復條件ID,并將與標識ID相同的回復條件ID對應的結論內容作為與聊天發起句對應的聊天回復內容。這樣,針對同一個聊天發起句,根據不同的輔助場景信息可獲得不同的標識ID,從而獲 得不同的結論內容,即聊天回復內容,從而實現了根據通訊雙方的場景信息智能獲取與聊天發起句對應的聊天回復內容,使得基于場景信息獲取的聊天回復內容更貼切,更智能和人性化,具有較高的智能化程度和個性化水平。可選地,輔助場景條目包括:發送和/或接收聊天發起句的通訊終端的姓名條目、性別條目、年齡條目、即時通訊賬號條目、電子郵箱地址條目、家庭地址條目、職業類別條目、職務條目、工作單位條目、單位地址條目、銀行賬號條目、好友印象條目、通訊錄分組條目、關系條目、興趣愛好條目、朋友圈狀態條目、心情條目、最近關注話題條目、時間條目、節日條目、季節條目、地理位置信息條目、距離條目、場景圖像條目。本實施例的場景條目不限于只包括上述的場景條目,同時也不限于包括上述全部的場景條目,具體由用戶自定義或根據需要和系統設計復雜度和設計精度進行選取。可選地,采集輔助場景條目中的場景圖像條目的內容信息包括:采集發送和/或接收聊天發起句的通訊終端的場景圖像;采用DOG算子提取場景訓練圖像的感興趣區域,并計算場景訓練圖像的感興趣區域的SIFT特征;采用K均值聚類算法對場景訓練圖像的感興趣區域的SIFT特征進行聚類,獲得多個聚類中心,并建立由與每一個聚類中心對應的視覺單詞構成的視覺單詞詞典;采用DOG算子提取場景圖像的感興趣區域,并在視覺單詞詞典中匹配與場景圖像的感興趣區域的SIFT特征最接近的視覺單詞;根據場景圖像的感興趣區域的視覺單詞的分布對場景圖像采用預先訓練好的支持向量機分類器進行分類,獲得發送和/或接收聊天發起句的通訊終端的場景圖像條目的內容信息。本實施例中的SIFT特征是一種尺度不變特征轉換,是在空間尺度中尋找極值點,并提取出其位置、尺度、旋轉不變量。具體地,本實施例在視覺單詞詞典中匹配與場景圖像的感興趣區域的SIFT特征最接近的視覺單詞的具體過程為:將場景圖像的每一個感興趣區域的SIFT特征與視覺單詞詞典中每一個視覺單詞對應的聚類中心的SIFT特征進行相似度計算,當計算出感興趣區域與視覺單詞的相似度大于預設閾值時,就認為該視覺單詞是與該感興趣區域最接近的視覺單詞。這樣,就能將場景圖像的所有感興趣區域用視覺單詞表示,并基于場景圖像中的視覺單詞的分布情況設計和訓練分類器,從而最終獲得發送和/或接收聊天發起句的通訊終端的場景圖像條目的內容信息。參照圖2,圖2為本實施例假設采集的接收聊天發起句的通訊終端接收聊天發起句的場景圖像,通過對該場景圖像的五個感興趣區域的SIFT特征提取,以及通過計算每一個感興趣區域的SIFT特征與視覺單詞詞典的相似度,從而獲得與上述五個感興趣區域最接近的視覺單詞,分別為“天空”、“國旗”、“建筑物”、“獅子”、“橋”,具體參照圖3,然后再根據獲得的與上述五個感興趣區域最接近的視覺單詞,采用預先訓練好的支持向量機獲得接收聊天發起句的通訊終端的場景圖像條目的內容信息。本實施例通過采集發送和/或接收聊天發起句的通訊終端的場景圖像獲得發送和/或接收聊天發起句的通訊終端的場景圖像條目的內容信息,使得基于場景圖像信息獲取的輔助場景信息更接近真實場景信息,并且使得采用基于場景圖像信息獲得的與聊天發起句對應的聊天回復內容更加具有個性化,以及更符合通訊語境。下面針對二個精簡實施例對本發明的基于場景信息獲取聊天回復內容的過程和原理進行更進一步說明。精簡實施例一針對的通訊情景為:通訊終端A給通訊終端B發送內容為“要不要一起去逛街?”的文本格式的聊天發起句,參照圖4,通訊終端B基于場景信息獲取聊天回復內容的方法包括:步驟S201,接收聊天發起句。具體地,本實施例接收的聊天發起句為文本格式的字符串,即“要不要一起去逛街?”。步驟S202,獲取聊天發起句的上文聊天內容,并將聊天發起句和聊天發起句的上文聊天內容合并成文本格式的預處理文本。具體地,假設本實施例中聊天發起句的上文內容一共包括四條對話內容,具體為:通訊終端A:忙嗎?/通訊終端B:還好。/通訊終端A:最近感覺沒有合適的衣服穿了!/通訊終端B:是吧。則獲取的預處理文本為{忙嗎?/還好。/最近感覺沒有合適的衣服穿了!/是吧。/要不要一起去逛街呢?}。步驟S203,提取預處理文本的關鍵詞。通過對預處理文本進行分詞、去除停用詞、詞性標注、語義消歧等操作后,假設提取的分詞文本包括{“忙”、“衣服”、“穿”、“逛街”},且本實施例采取加權詞頻統計的方式進行詞頻統計,并選取最大加權詞頻統計值對應的分詞文本為預處理文本的關鍵詞。具體地,由于本實施例的預處理文本一共包括五條聊天內容,則分別設置的五個加權系數分別為k1=0.5、k2=0.2、k3=0.15、k4=0.1、k5=0.05,其中加權系數隨預處理文本中的聊天內容離聊天發起句時間間隔由小至大逐漸遞減,而加權系數的具體值由用戶根據需要自定義。由于本實施例提取的分詞文本的詞頻數都為一,故經過對每個分詞文本進行加權詞頻計算后,可以獲得關鍵詞為“逛街”。步驟S204,根據關鍵詞確定聊天發起句所屬的話題分類。具體地,本實施例采用關鍵詞對應的內容作為聊天發起句所屬的話題分類,即本實施例中聊天發起句所屬的話題分類為“逛街”。步驟S205,采集預先設定的與話題分類關聯的輔助場景條目的內容信息,獲得輔助場景信息。具體地,假設本實施例預先設定的與話題分類關聯的場景條目共有3個,分別為f1=發送聊天發起句和接收聊天發起句的通訊終端的關系條目、f2=發送聊天發起句和接收聊天發起句的通訊終端的距離條目、f3=接收聊天發起句的通訊終端的天氣條目,具體見表1。且假設本實施例通過查詢接收聊天發起句的通訊終端的通訊錄備注信息,獲得f1=發送聊天發起句和接收聊天發起句的通訊終端的關系條目的內容信息為“朋友”,且通過計算發送聊天發起句和接收聊天發起句的通訊終端的地理位置差獲得f2=發送聊天發起句和接收聊天發起句的通訊終端的距離條目的內容信息為“遠”(預先定義地理位置差大于10公里時返回“遠”內容信息至距離條目),且通過在互聯網上搜索接收聊天發起句的通訊終端所在地理位置的天氣信息 獲得f3=接收聊天發起句的通訊終端的天氣條目的內容信息為“晴朗”。步驟S206,創建與話題分類對應的話題數據庫,其中,話題數據庫包括至少一個以話題分類為聊天主題的樣本聊天對,樣本聊天對包括樣本聊天發起句、與樣本聊天發起句對應的回復條件ID以及與回復條件ID對應的結論內容。具體地,假設本實施例定義針對f1條目的內容信息選項有Nf1種、針對f2、f3條目的內容信息選項分別有Nf2和Nf3種,則“逛街”話題數據庫中針對同一個樣本聊天發起句的回復條件ID組合數=Nf1*Nf2*Nf3種。步驟S207,采用創建回復條件ID的創建規則對輔助場景信息進行標識,獲得標識ID。具體地,假設本實施例Nf1的數目為6、Nf2的數目為3、Nf3的數目為5,具體見表二,則通過查詢創建回復條件ID號的創建規則可以獲得表示發送聊天發起句和接收聊天發起句的通訊終端的關系是“朋友”時對應的字段號為“2”、表示發送聊天發起句和接收聊天發起句的通訊終端的距離條目為“遠”時對應的字段號為“1”,表示接收聊天發起句的通訊終端的天氣是“晴朗”時對應的字段號為“1”,從而將輔助場景信息表示為與回復條件ID號一致的ID號。需要說明的是,在具體的實施過程中,本實施例針對每一個輔助場景條目均設置內容信息包含為“空”的情況(具體用“0”字段號表示),這是因為在實際的實施過程中,可能出現沒法獲取輔助場景條目對應的內容信息,例如本實施例中,若接收聊天發起句的通訊終端沒有安裝GPS定位或沒有開通獲取地理位置權限時,則系統返回的數據為空。又例如在一些需要依靠互聯網查詢和搜索獲取輔助場景條目內容信息的情況,在通訊終端斷開網絡鏈接或進入無網絡信號區域時是不能獲取相關的搜索結果。表2關系條目字段號距離條目字段號天氣條目字段號空0空0空0同事1遠1晴朗1朋友2近2陰天2親人3下雨3同學4下雪4上下級5步驟S208,在話題數據庫中匹配與聊天發起句相同的樣本聊天發起句,以及在與樣本聊天發起句對應的回復條件ID中匹配與標識ID相同的回復條件ID,并將與標識ID相同的回復條件ID對應的結論內容作為數據匹配的結果。具體地,本實施例在匹配與聊天發起句相同或相似的樣本聊天發起句后,根據標識ID號(“2+1+1”)很容易獲得與其相同的回復條件ID號,從而將回復條件ID對應的結論內容作為與聊天發起句對應的回復內容,假設本實施例針對樣本聊天發起句“要不要一起去逛街呢”,獲取的與回復條件ID號“2+1+1”對應的結論內容為3條,分別為“親,我離你那太遠了,下次再約可否?”、“今天天氣不錯,我正好也想出來逛逛。”、“雖然我離你那挺遠的,但今天天氣不錯,所以還是想出來逛逛”。在實際的聊天回復時,系統將提供該三條聊天回復內容供用戶選擇。可以看出,當采集的輔助場景條目的內容信息不同時,獲取的標識ID不同,從而獲取的聊天回復內容不同,故解決了現有獲取聊天回復內容的方法沒有結合參與聊天的通訊雙方的場景信息,導致獲取的聊天回復內容單一固定,聊天的智能化程度低以及用戶體驗不佳的技術問題,實現了根據不同的場景信息獲取不同的聊天回復內容,且獲取的聊天回復內容充分結合了通訊雙方的場景信息,并與通訊雙方息息相關,體現了較高的智能化和個性化水平。 此外,本實施例基于場景信息自動獲取聊天回復內容無需人工編輯,提高了聊天會話速度,提升了用戶體驗。精簡實施例二針對的通訊情景為:通訊終端A給通訊終端B發送內容為“忙嗎?”的文本格式的聊天發起句,參照圖5,通訊終端B基于場景信息獲取聊天回復內容的方法包括:步驟S301,接收聊天發起句。具體地,本實施例接收的聊天發起句為文本格式的字符串,即“忙嗎?”。步驟S302,根據聊天發起句獲取聊天發起句所屬的話題分類。具體地,假設本實施例中聊天發起句的上文內容為空,且鑒于聊天發起句的內容簡單,故易獲取聊天發起句所屬的話題分類為“打招呼”。步驟S303,預先設定與話題分類關聯的輔助場景條目。具體地,假設本實施例預先設定的與話題分類關聯的輔助場景條目只有1個,具體為f1=接收聊天發起句的通訊終端的場景圖像條目。步驟S304,采集接收聊天發起句的通訊終端的場景圖像。步驟S305,提取場景圖像的感興趣區域,并在視覺單詞詞典中匹配與場景圖像的感興趣區域的SIFT特征最接近的視覺單詞。具體地,本實施例首先通過DOG(DifferenceofGaussian)算子提取場景圖像的感興趣區域,然后計算每一個感興趣區域的SIFT特征,并在視覺單詞詞典中匹配與場景圖像的感興趣區域的SIFT特征最接近的視覺單詞。假設通過匹配后,本實施例匹配出與三個感興趣區域對應的視覺單詞分別為“路標”、“車道”、“距離指示牌”。步驟S306,根據場景圖像的感興趣區域的視覺單詞的分布對場景圖像采用預先訓練好的支持向量機分類器進行分類,獲得輔助場景條目的內容信息。具體地,本實施例采用支持向量機的方法設計分類器,且在訓練階段對已知場景分類的9類圖像進行訓練(機場、海洋、森林、村莊、街道、樹木、高樓、高速公路、辦公室),每類圖像均包括100幅不同的訓練樣本圖像。通過將步驟S305得到的包含三個視覺單詞的場景圖像(“路標”、“車道”、“距離指示牌”)輸入到預先訓練好的支持向量機分類器,可以得到接收聊天發起句的通訊終端的場景圖像條目的內容信息為“高速公路”。步驟S307,根據輔助場景信息在預先設定的與話題分類對應的話題數據庫中對聊天發起句進行數據匹配,并將數據匹配的結果作為與聊天發起句對應的聊天回復內容。具體地,假設本實施例預先設定的與話題分類“打招呼”對應的話題數據庫中,針對聊天發起句“忙嗎?”且輔助場景條目的內容信息為“高速公路”的回復內容包括多項,例如“我在高速上,不方便回信息,下高速和您聯系。”、“不好意思,現在不方便回信息,稍后和您聯系”等等,則分別將這些聊天回復內容顯示在通訊終端供用戶選擇。本實施例通過采集接收聊天發起句的通訊終端的場景圖像,并基于采集的場景圖像獲取輔助場景條目的內容信息,使得基于該內容信息獲得的輔助場景信息更接近真實場景信息,從而使得采用基于輔助場景信息獲得的與聊天發起句匹配的聊天回復內容智能化程度高、具有個性化。參照圖6,本發明的優選實施例提供的基于場景信息獲取聊天回復內容的裝置,包括:接收裝置10,用于接收聊天發起句;話題分類獲取裝置20,用于根據聊天發起句獲取聊天發起句所屬的話題分類;輔助場景信息獲取裝置30,用于采集預先設定的與話題分類關聯的輔助場景條目的內容信息,獲得輔助場景信息;匹配裝置40,用于根據輔助場景信息在預先設定的與話題分類對應的話題數據庫中對聊天發起句進行數據匹配,并將數據匹配的結果作為與聊天發起句對應的聊天回復內容。進一步地,話題分類獲取裝置20包括:預處理文本獲取裝置,用于獲取聊天發起句的上文聊天內容,并將聊天發起句和聊天發起句的上文聊天內容合并成文本格式的預處理文本;關鍵詞提取裝置,用于提取預處理文本的關鍵詞;話題分類確定裝置,用于根據關鍵詞確定聊天發起句所屬的話題分類。進一步地,輔助場景信息獲取裝置30包括:設定裝置,用于預先設定與話題分類關聯的輔助場景條目,獲得關聯輔助場景條目;計算推理裝置,用于采用計算、推理、查詢、搜索或其任意組合的方式獲取與關聯輔助場景條目對應的內容信息,獲得輔助場景信息。進一步地,匹配裝置40包括:話題數據庫創建裝置,用于創建與話題分類對應的話題數據庫,其中,話題數據庫包括至少一個以話題分類為聊天主題的樣本聊天對,樣本聊天對包括樣本聊天發起句、與樣本聊天發起句對應的回復條件ID以及與回復條件ID對應的結論內容;標識裝置,用于采用創建回復條件ID的創建規則對輔助場景信息進行標識,獲得標識ID;ID匹配裝置,用于在話題數據庫中匹配與聊天發起句相同的樣本聊天發起句,以及在與樣本聊天發起句對應的回復條件ID中匹配與標識ID相同的回復條件ID,并將與標識ID相同的回復條件ID對應的結論內容作為數據匹配的結果。本發明提供的基于場景信息獲取聊天回復內容的裝置,通過自動采集與接收的聊天發起句所屬的話題分類關聯的輔助場景條目的內容信息獲得輔助場景信息,并結合輔助場景信息獲取與聊天發起句對應的聊天回復內容,解決了現有獲取聊天回復內容的方法沒有結合參與聊天的通訊雙方的場景信息,導致獲取的聊天回復內容單一固定,聊天的智能化程度低以及用戶體驗不佳的技術問題,實現了根據不同的場景信息獲取不同的聊天回復內容,且獲取的聊天回復內容充分結合了通訊雙方的場景信息,并與通訊雙方息息相關,體現了較高的智能化和個性化水平。此外,基于場景信息自動獲取聊天回復內容無需人工編輯,提高了聊天會話速度,提升了用戶體驗。本實施例基于場景信息獲取聊天回復內容的裝置的具體工作過程和工作原理可參照本實施例的基于場景信息獲取聊天回復內容的方法的工作過程和工作原理。本發明實施例中的接收或發送聊天發起句的通訊終端設備可以是臺式電腦、平板電腦、 個人數字助理、手機、電視機、車載電腦、可穿戴通信設備等。以上所述僅為本發明的優選實施例而已,并不用于限制本發明,對于本領域的技術人員來說,本發明可以有各種更改和變化。凡在本發明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發明的保護范圍之內。當前第1頁1 2 3