信息處理方法、設備和系統的制作方法
【專利摘要】本發明實施例涉及一種信息處理方法、設備和系統,該方法包括:終端設備獲取終端用戶的用戶標識,并將用戶標識發送至系統設備,使得系統設備獲取與用戶標識對應的社交媒體數據,抽取社交媒體數據中的上下文信息,并對上下文信息進行聚類處理,聚類處理后得到用戶屬性模型;終端設備從系統設備接收終端用戶的用戶屬性模型和信息回復模型,并根據用戶屬性模型確定終端用戶的所有聯系人的用戶屬性;當接收到聯系人發送的待回復信息時,抽取待回復信息的上下文信息,并根據待回復信息的上下文信息、聯系人的用戶屬性、以及信息回復模型生成回復信息,并將回復信息發送至聯系人。因此,本發明實現了具有用戶語言偏好和風格的信息自動回復。
【專利說明】信息處理方法、設備和系統
【技術領域】
[0001] 本發明涉及通信【技術領域】,尤其涉及一種信息處理方法、設備和系統。
【背景技術】
[0002] 隨著移動互聯網的普及,手機信息業務依然是目前手機用戶最常使用的業務之 一,若能為手機用戶提供出色的信息操作體驗是手機制造商贏得用戶的重要途徑,因此,手 機制造商為了給手機用戶帶來更好的體驗,幫助用戶自動回復信息則是改善用戶體驗的一 個非常重要方面,同時也給手機用戶帶來了很大的方便。
[0003] 目前,短信自動回復系統采用的是基于規則的短信自動回復系統或者單純基于歷 史信息作為訓練語料的短信自動回復系統。對于基于規則的短信自動回復系統,其待回復 的信息通常是系統內置的或者用戶預先定義的,比如,當短信回復系統接收到待回復信息 后,根據預先定義好的規則(如開會、開車等)回復設置好的信息。對于單純基于歷史信 息作為訓練語料的短信自動回復系統,一般采用用戶的歷史信息作為訓練語料生成回復模 型,并對接收的信息進行回復。
[0004] 但是,對于基于規則的短信自動回復系統,其回復的內容基本固定而不會根據用 戶的語言偏好和風格回復信息。對于單純基于歷史信息作為訓練語料的短信自動回復系 統,其用來作為訓練語料的歷史信息相對較少,很難獲取更大范圍的訓練語料。
【發明內容】
[0005] 本發明提供了一種信息處理方法、設備和系統,以解決現有技術中對于基于規則 的短信自動回復系統,其回復的內容基本固定而不會根據用戶的語言偏好和風格回復信 息,以及對于單純基于歷史信息作為訓練語料的短信自動回復系統,其用來作為訓練語料 的歷史信息相對較少,很難獲取更大范圍的訓練語料的問題。
[0006] 在第一方面,本發明提供了一種信息處理方法,所述方法包括:終端設備獲取終端 用戶的用戶標識,并將所述用戶標識發送至系統設備,使得所述系統設備獲取與所述用戶 標識對應的社交媒體數據,抽取所述社交媒體數據中的上下文信息,并對所述上下文信息 進行聚類處理,所述聚類處理后得到用戶屬性模型;所述終端設備從所述系統設備接收所 述終端用戶的所述用戶屬性模型和信息回復模型,并根據所述用戶屬性模型確定所述終端 用戶的所有聯系人的用戶屬性;當接收到所述聯系人發送的待回復信息時,抽取所述待回 復信息的上下文信息,并根據所述待回復信息的上下文信息、所述聯系人的用戶屬性、以及 所述信息回復模型生成回復信息,并將所述回復信息發送至所述聯系人。
[0007] 在第一種可能的實現方式中,所述獲取終端用戶的用戶標識具體為:獲取所述終 端用戶在社交媒體上的用戶標識,所述用戶標識為所述終端用戶在所述社交媒體上注冊的 標識信息。
[0008] 結合第一方面或結合第一方面的第一種可能的實現方式,在第二種可能的實現方 式中,所述根據所述待回復信息的上下文信息、所述聯系人的用戶屬性、以及所述信息回復 模型生成回復信息具體為:根據所述待回復信息的上下文信息、所述聯系人的用戶屬性、所 述聯系人的歷史信息、以及所述信息回復模型生成回復信息。
[0009] 在第二方面,本發明提供了一種信息處理方法,所述方法包括:系統設備接收終端 設備發送的終端用戶的用戶標識;獲取與所述用戶標識對應的社交媒體數據,抽取所述社 交媒體數據中的上下文信息,并對所述上下文信息進行聚類處理,所述聚類處理后得到用 戶屬性模型;對所述社交媒體數據、所述上下文信息和所述用戶屬性模型進行訓練,所述訓 練后得到信息回復模型;向所述終端設備發送所述用戶屬性模型和所述信息回復模型,以 使所述終端設備根據所述用戶屬性模型和所述信息回復模型對所述終端用戶接收到的待 回復信息進行處理。
[0010] 在第一種可能的實現方式中,接收所述終端設備在社交媒體上的用戶標識,所述 用戶標識為所述終端用戶在所述社交媒體上注冊的標識信息。
[0011] 結合第二方面或結合第二方面的第一種可能的實現方式,在第二種可能的實現方 式中,所述上下文信息包括時間類、地點類、事件類和人物屬性類信息,所述抽取所述社交 媒體數據中的上下文信息,并對所述上下文進行聚類處理,所述聚類處理后得到用戶屬性 模型具體為:抽取所述社交媒體數據中的時間類、地點類、事件類和人物屬性類信息,將所 述人物屬性類信息進行聚類并訓練,所述訓練后得到所述用戶屬性模型。
[0012] 在第三方面,本發明提供了一種終端設備,所述設備包括:獲取單元,用于獲取終 端用戶的用戶標識,并將所述用戶標識發送至系統設備,使得所述系統設備獲取與所述用 戶標識對應的社交媒體數據,抽取所述社交媒體數據中的上下文信息,并對所述上下文信 息進行聚類處理,所述聚類處理后得到用戶屬性模型;接收單元,用于接收所述系統設備發 送的與所述終端用戶相對應的所述用戶屬性模型和信息回復模型,并根據所述用戶屬性模 型確定所述終端用戶的所有聯系人的用戶屬性,以及將所述所有聯系人的用戶屬性和所述 信息回復模型傳輸給信息處理單元;信息處理單元,用于從所述接收單元接收所述所有聯 系人的用戶屬性和所述信息回復模型,當接收到所述聯系人發送的待回復信息時,抽取所 述待回復信息的上下文信息,并根據所述待回復信息的上下文信息、所述聯系人的用戶屬 性、以及所述信息回復模型生成回復信息,并將所述回復信息發送至所述聯系人。
[0013] 在第一種可能的實現方式中,所述獲取單元還用于獲取所述終端用戶在社交媒體 上的用戶標識,所述用戶標識為所述終端用戶在所述社交媒體上注冊的標識信息。
[0014] 結合第三方面或結合第三方面的第一種可能的實現方式,在第二種可能的實現方 式中,所述接收單元還用于根據所述待回復信息的上下文信息、所述聯系人的用戶屬性、所 述聯系人的歷史信息、以及所述信息回復模型生成回復信息。
[0015] 在第四方面,本發明提供了一種系統設備,所述設備包括:接收單元,用于接收終 端設備發送的終端用戶的用戶標識,以及將所述用戶標識傳輸給用戶屬性模型生成單元; 用戶屬性模型生成單元,用于從所述接收單元接收所述用戶標識,獲取與所述用戶標識對 應的社交媒體數據,抽取所述社交媒體數據中的上下文信息,并對所述上下文信息進行聚 類處理,所述聚類處理后得到用戶屬性模型,及將所述社交媒體數據、所述上下文信息和所 述用戶屬性模型傳輸給信息回復模型生成單元,以及將所述用戶屬性模型傳輸給發送單 元;信息回復模型生成單元,用于從所述用戶屬性模型生成單元接收所述社交媒體數據、所 述上下文信息和所述用戶屬性模型,對所述社交媒體數據、所述上下文信息和所述用戶屬 性模型進行訓練,所述訓練后得到信息回復模型,以及將所述信息回復模型傳輸給發送單 元;發送單元,用于從所述用戶屬性模型生成單元接收所述用戶屬性模型,從所述信息回復 模型生成單元接收所述信息回復模型,向所述終端設備發送所述用戶屬性模型和所述信息 回復模型,以使所述終端設備根據所述用戶屬性模型和所述信息回復模型對所述終端用戶 接收到的待回復信息進行處理。
[0016] 在第一種可能的實現方式中,所述接收單元還用于接收所述終端設備在社交媒體 上的用戶標識,所述用戶標識為所述終端用戶在所述社交媒體上注冊的標識信息。
[0017] 結合第四方面或結合第四方面的第一種可能的實現方式,在第二種可能的實現方 式中,所述上下文信息包括時間類、地點類、事件類和人物屬性類信息,所述用戶屬性模型 生成單元還用于抽取所述社交媒體數據中的時間類、地點類、事件類和人物屬性類信息,將 所述人物屬性類信息進行聚類并訓練,所述訓練后得到所述用戶屬性模型。
[0018] 在第五方面,本發明提供了一種信息處理系統,所述系統包括:在第三方面提供的 終端設備和在第四方面提供的系統設備。
[0019] 通過應用本發明公開的信息處理方法、設備和系統,終端設備獲取終端用戶的用 戶標識,并將所述用戶標識發送至系統設備;當系統設備接收終端設備發送的終端用戶的 用戶標識后,獲取與所述用戶標識對應的社交媒體數據,抽取所述社交媒體數據中的上下 文信息,并對所述上下文信息進行聚類處理,所述聚類處理后得到用戶屬性模型,以及對所 述社交媒體數據、所述上下文信息和所述用戶屬性模型進行訓練,所述訓練后得到信息回 復模型,并向所述終端設備發送所述用戶屬性模型和所述信息回復模型;當終端設備接收 所述系統設備發送的與所述終端用戶相對應的用戶屬性模型和信息回復模型后,根據所述 用戶屬性模型確定所述終端用戶的所有聯系人的用戶屬性,當接收到所述聯系人發送的待 回復信息時,抽取所述待回復信息的上下文信息,并根據所述待回復信息的上下文信息、所 述聯系人的用戶屬性、以及所述信息回復模型生成回復信息,并將所述回復信息發送至所 述聯系人,從而使得系統端利用社交媒體數據作為訓練語料進行建模,從而擴大了語料采 集的范圍,并降低了采集成本,同時,上下文信息作為信息回復模型訓練參數,使得回復內 容更具有針對性,還有,引入用戶屬性模型作為上下文參數,可以將在社交媒體對不同對象 的回復風格、方式引入信息回復;同時,終端設備根據接收到的信息和已訓練好的信息回復 模型自動生成回復內容,實現了具有用戶語言偏好和風格的信息自動回復。
【專利附圖】
【附圖說明】
[0020] 圖1為本發明實施例一提供的信息處理方法的流程圖;
[0021] 圖2為本發明實施例二提供的信息處理方法的流程圖;
[0022] 圖3為本發明實施例三提供的終端設備的示意圖;
[0023] 圖4為本發明實施例四提供的系統設備的示意圖;
[0024] 圖5為本發明實施例五提供的終端設備的示意圖;
[0025] 圖6為本發明實施例六提供的系統設備的示意圖;
[0026] 圖7為本發明實施例七提供的信息處理系統的示意圖。
【具體實施方式】
[0027] 為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例 中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是 本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員 在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
[0028] 本發明公開了一種信息處理方法、設備和系統,利用終端設備獲取終端用戶的用 戶標識,并將所述用戶標識發送至系統設備;當系統設備接收終端設備發送的終端用戶的 用戶標識后,獲取與所述用戶標識對應的社交媒體數據,抽取所述社交媒體數據中的上下 文信息,并對所述上下文信息進行聚類處理,所述聚類處理后得到用戶屬性模型,以及對所 述社交媒體數據、所述上下文信息和所述用戶屬性模型進行訓練,所述訓練后得到信息回 復模型,并向所述終端設備發送所述用戶屬性模型和所述信息回復模型;當終端設備接收 所述系統設備發送的與所述終端用戶相對應的用戶屬性模型和信息回復模型后,根據所述 用戶屬性模型確定所述終端用戶的所有聯系人的用戶屬性,當接收到所述聯系人發送的待 回復信息時,抽取所述待回復信息的上下文信息,并根據所述待回復信息的上下文信息、所 述聯系人的用戶屬性、以及所述信息回復模型生成回復信息,并將所述回復信息發送至所 述聯系人,從而使得系統端利用社交媒體數據作為訓練語料進行建模,從而擴大了語料采 集的范圍,并降低了采集成本,同時,上下文信息作為信息回復模型訓練參數,使得回復內 容更具有針對性,還有,引入用戶屬性模型作為上下文參數,可以將在社交媒體對不同對象 的回復風格、方式引入信息回復;同時,終端設備根據接收到的信息和已訓練好的信息回復 模型自動生成回復內容,實現了具有用戶語言偏好和風格的信息自動回復。
[0029] 圖1為本發明實施例一提供的信息處理方法的流程圖。如圖所示,本實施例具體 包括以下步驟:
[0030] 步驟110,終端設備獲取終端用戶的用戶標識,并將所述用戶標識發送至系統設 備,使得系統設備接收到用戶標識后,獲取與該用戶標識對應的社交媒體數據,抽取所述社 交媒體數據中的上下文信息,并對所述上下文信息進行聚類處理,所述聚類處理后得到用 戶屬性模型。其中,終端用戶的用戶標識是其在社交媒體上的用戶標識,該用戶標識為終端 用戶在社交媒體上注冊的標識信息。其中,社交媒體包括微博、博客和社交網絡等。
[0031] 具體地,社交媒體(Social Media)指的是允許人們撰寫、分享、評價、討論、相互溝 通的網站和技術。在當今的網絡時代,臉譜(facebook)、推特(twitter)、微博等新興社交 媒體成為人們溝通的重要渠道。據統計,2012年,互聯網用戶超過20%的上網時間用于社 交媒體,而目前全球有超過10億人在使用社交媒體,占網民人數的大約70%。超過6億用 戶每天使用社交媒體。因此,很多用戶在社交媒體上留下了大量的社交媒體數據,并且這些 數據是公開的,從而使得花費很小的代價就能獲取這些數據。終端設備將終端用戶在社交 媒體上的用戶標識發送至系統設備,目的是使得系統設備根據用戶標識在社交媒體上獲取 終端用戶的社交媒體數據,并抽取這些社交媒體數據的上下文(context)信息,根據這些 社交媒體數據和抽取出的上下文信息建立用戶屬性模型和信息回復模型。
[0032] 其中,用戶屬性模型'如公式(1)所示。
[0033] u(m)-Vi 公式(1)
[0034] 在公式(1)中,m是上下文信息。
[0035] 信息回復模型yi如公式(2)所示。
[0036] f(m,t,1,e,u(m)) - yi 公式(2)
[0037] 在公式⑵中,m是上下文彳目息,t是時間類彳目息,1是地點類彳目息,e是事件類/[目 肩、。
[0038] 在本發明實施例中,使用用戶屬性模型Vi作為信息回復模型yi中的一個參數。用 戶屬性模型代表一類用戶屬性,如親人、同事、親密好友等,而用戶模型在社交媒體數據和 信息數據中都可以進行學習,并可以進行替換。
[0039] 步驟120,終端設備接收所述系統設備發送的與所述終端用戶相對應的用戶屬性 模型和信息回復模型,并根據所述用戶屬性模型確定所述終端用戶的所有聯系人的用戶屬 性。
[0040] 具體地,當終端設備接收到系統設備發送的用戶屬性模型即用戶屬性集合或者聚 類結果后,會為終端用戶的通訊簿中的每一個聯系人確定其用戶屬性。其確定過程具體為: 根據某一聯系人的歷史信息數據和每一個用戶屬性(可以用聚類的聚類中心)計算相似 度,以相似度最高的屬性作為該聯系人的用戶屬性,比如,將一個聯系人的歷史信息數據, 與親人、同事、親密好友等用戶屬性計算相似度,最后計算出相似度最高的用戶屬性為親 人,則該聯系人的用戶屬性為終端用戶的親人。
[0041] 步驟130,當終端設備接收到所述聯系人發送的待回復信息時,抽取所述待回復信 息的上下文信息,并根據所述待回復信息的上下文信息、所述聯系人的用戶屬性、以及所述 信息回復模型生成回復信息,并將所述回復信息發送至所述聯系人。其中,待回復信息的上 下文信息包括時間類、地點類和事件類信息。
[0042] 具體地,在本發明實施例中引入了"上下文",該上下文包括時間、地點、事件、對話 人物屬性等。當終端用于回復某個聯系人發送的待回復信息時,在不同的上下文場景中,其 回復信息的表述會有很大的不同。比如,當回復信息為"很忙,現在沒時間"這個意思,對于 聯系人是客戶時可能表述成"我現在有事,稍后會聯系您",而對于聯系人是好友時可能表 述成"忙死了,回頭打給您哈",這里造成回復內容的表述不同的原因是對話人物屬性不同 即聯系人的用戶屬性不同。
[0043] 進一步地,步驟130中回復信息的生成不僅根據待回復信息的上下文信息、聯系 人的用戶屬性、以及信息回復模型,還要參考聯系人的歷史信息。
[0044] 進一步地,步驟130之后還包括:將生成的回復信息進行語言修飾,并將所述語言 修飾后的信息發送至所述聯系人。
[0045] 因此,本發明公開了一種信息處理方法,利用終端設備獲取終端用戶的用戶標識, 并將所述用戶標識發送至系統設備,接收所述系統設備發送的與所述終端用戶相對應的用 戶屬性模型和信息回復模型,根據所述用戶屬性模型確定所述終端用戶的所有聯系人的用 戶屬性,當接收到所述聯系人發送的待回復信息時,抽取所述待回復信息的上下文信息,并 根據所述待回復信息的上下文信息、所述聯系人的用戶屬性、以及所述信息回復模型生成 回復信息,并將所述回復信息發送至所述聯系人,從而使得終端設備根據接收到的信息和 已訓練好的信息回復模型自動生成回復內容,實現了具有用戶語言偏好和風格的信息自動 回復。
[0046] 圖2為本發明實施例二提供的信息處理方法的流程圖。如圖所示,本實施例具體 包括以下步驟:
[0047] 步驟210,系統設備接收終端設備發送的終端用戶的用戶標識。其中,終端用戶的 用戶標識是終端用戶在社交媒體上的用戶標識,該用戶標識包括微博、博客和社交網絡。 [0048] 步驟220,系統設備獲取與所述用戶標識對應的社交媒體數據,抽取所述社交媒體 數據中的上下文信息,并對所述上下文進行聚類處理,所述聚類處理后得到用戶屬性模型。
[0049] 進一步地,步驟220中的上下文信息包括時間類、地點類、事件類和人物屬性類信 息。步驟220具體為:系統設備抽取所述社交媒體數據中的時間類、地點類、事件類和人物 屬性類信息,將所述人物屬性類信息進行聚類并訓練,所述訓練后得到所述用戶屬性模型。
[0050] 具體地,系統設備在社交媒體上獲取與所述用戶標識對應的社交媒體數據,比如, 終端用戶的回復信息。當獲取到社交媒體數據后,抽取這些社交媒體數據中的上下文信息 即上下文關鍵詞,其包括時間類、地點類、事件類和人物屬性類信息,將上下文信息中的人 物屬性類信息進行聚類并訓練,所述訓練后得到用戶屬性模型,該用戶屬性模型 Vi如公式 (1)所示。其中,人物屬性類信息包括語氣詞、稱呼、習慣用語等。另外,還要將抽取的上下 文信息和社交媒體數據寫入數據庫。
[0051] 其中,用戶屬性模型的建立方式一般為:系統設備對終端用戶按照和終端用戶的 用戶屬性相關的關鍵詞進行聚類,比如,稱呼、口頭禪,訓練得到用戶模型,并將用戶屬性模 型分別存入數據庫和發送給終端設備塊。
[0052] 步驟230,系統設備對所述社交媒體數據、所述上下文信息和所述用戶屬性模型進 行訓練,所述訓練后得到信息回復模型;
[0053] 具體地,信息回復模型yi如公式(2)所示。
[0054] 步驟240,系統設備向所述終端設備發送所述用戶屬性模型和所述信息回復模型, 以使所述終端設備根據所述用戶屬性模型和所述信息回復模型對所述終端用戶接收到的 待回復信息進行處理。
[0055] 另外,系統會周期性執行步驟220至步驟240,周期可以較長,比如,7天執行一次。 其目的是及時獲取終端用戶最新的社交媒體數據,并根據用戶最新后社交媒體數據得到用 戶屬性模型和信息回復模型,并將重新得到的用戶屬性模型和信息回復模型發送給終端設 備,用以終端設備根據系統設備重新得到的用戶屬性模型和信息回復模型更新自身保存的 用戶屬性模型和信息回復模型。
[0056] 因此,本發明實施例提供的信息處理方法,系統設備接收終端設備發送的終端用 戶的用戶標識,獲取與用戶標識對應的社交媒體數據,抽取該社交媒體數據中的上下文信 息,并對抽取到的上下文信息進行聚類處理,其聚類處理后得到用戶屬性模型,以及對社交 媒體數據、上下文信息和用戶屬性模型進行訓練,訓練后得到信息回復模型,并向終端設備 發送用戶屬性模型和信息回復模型,以使終端設備根據用戶屬性模型和信息回復模型對終 端用戶接收到的待回復信息進行處理,從而使得系統端利用社交媒體數據作為訓練語料進 行建模,從而擴大了語料采集的范圍,并降低了采集成本,同時,上下文信息作為信息回復 模型訓練參數,使得回復內容更具有針對性,還有,引入用戶屬性模型作為上下文參數,可 以將在社交媒體對不同對象的回復風格、方式引入信息回復。
[0057] 圖3為本發明實施例三提供的終端設備的示意圖。該終端設備用于執行本發明實 施例一提供的信息處理方法。如圖所示,本實施例具體包括:獲取單元31、接收單元32和 信息處理單元33。
[0058] 獲取單元31用于獲取終端用戶的用戶標識,并將所述用戶標識發送至系統設備, 使得所述系統設備獲取與所述用戶標識對應的社交媒體數據,抽取所述社交媒體數據中的 上下文信息,并對所述上下文信息進行聚類處理,所述聚類處理后得到用戶屬性模型;接收 單元32用于接收所述系統設備發送的與所述終端用戶相對應的用戶屬性模型和信息回復 模型,并根據所述用戶屬性模型確定所述終端用戶的所有聯系人的用戶屬性,以及將所述 所有聯系人的用戶屬性和所述信息回復模型傳輸給信息處理單元33 ;信息處理單元33用 于從所述接收單元32接收所述所有聯系人的用戶屬性和所述信息回復模型,當接收到所 述聯系人發送的待回復信息時,抽取所述待回復信息的上下文信息,并根據所述待回復信 息的上下文信息、所述聯系人的用戶屬性、以及所述信息回復模型生成回復信息,并將所述 回復信息發送至所述聯系人。
[0059] 其中,所述待回復信息的上下文信息包括時間類、地點類和事件類信息。
[0060] 進一步地,所述獲取單元31還用于獲取所述終端用戶在社交媒體上的用戶標識, 所述用戶標識為所述終端用戶在所述社交媒體上注冊的標識信息。其中,社交媒體包括微 博、博客和社交網絡等。
[0061] 進一步地,所述接收單元32還用于根據所述待回復信息的上下文信息、所述發信 人的用戶屬性、所述發信人的歷史信息、以及所述信息回復模型生成回復信息。
[0062] 另外,本發明實施例提供的終端設備還包括:語言修飾單元34。
[0063] 語言修飾單元34用于將所述回復信息進行語言修飾,并將所述語言修飾后的信 息發送至所述聯系人。
[0064] 因此,本發明公開了一種終端設備,通過獲取終端用戶的用戶標識,并將所述用戶 標識發送至系統設備,接收所述系統設備發送的與所述終端用戶相對應的用戶屬性模型和 信息回復模型,根據所述用戶屬性模型確定所述終端用戶的所有聯系人的用戶屬性,當接 收到所述聯系人發送的待回復信息時,抽取所述待回復信息的上下文信息,并根據所述待 回復信息的上下文信息、所述聯系人的用戶屬性、以及所述信息回復模型生成回復信息,并 將所述回復信息發送至所述聯系人,從而使得終端設備根據接收到的信息和已訓練好的信 息回復模型自動生成回復內容,實現了具有用戶語言偏好和風格的信息自動回復。
[0065]圖4為本發明實施例四提供的系統設備的示意圖。該系統設備用于執行本發明實 施例二提供的信息處理方法。如圖所示,本實施例具體包括:接收單元41、用戶屬性模型生 成單元42、信息回復模型生成單元43和發送單元44。
[0066] 接收單元41用于接收終端設備發送的終端用戶的用戶標識,以及將所述用戶標 識傳輸給用戶屬性模型生成單元42 ;用戶屬性模型生成單元42用于從所述接收單元41 接收所述用戶標識,獲取與所述用戶標識對應的社交媒體數據,抽取所述社交媒體數據中 的上下文信息,并對所述上下文信息進行聚類處理,所述聚類處理后得到用戶屬性模型,及 將所述社交媒體數據、所述上下文信息和所述用戶屬性模型傳輸給信息回復模型生成單元 43,以及將所述用戶屬性模型傳輸給發送單元44 ;信息回復模型生成單元43用于從所述用 戶屬性模型生成單元42接收所述社交媒體數據、所述上下文信息和所述用戶屬性模型,對 所述社交媒體數據、所述上下文信息和所述用戶屬性模型進行訓練,所述訓練后得到信息 回復模型,以及將所述信息回復模型傳輸給發送單元44 ;發送單元44用于從所述用戶屬性 模型生成單元42接收所述用戶屬性模型,從所述信息回復模型生成單元43接收所述信息 回復模型,向所述終端設備發送所述用戶屬性模型和所述信息回復模型,以使所述終端設 備根據所述用戶屬性模型和所述信息回復模型對所述終端用戶接收到的待回復信息進行 處理。其中,所述上下文信息包括時間類、地點類、事件類和人物屬性類信息。
[0067] 進一步地,所述接收單元41還用于接收所述終端設備在社交媒體上的用戶標識, 所述用戶標識為所述終端用戶在所述社交媒體上注冊的標識信息。其中,社交媒體包括微 博、博客和社交網絡等。
[0068] 進一步地,所述用戶屬性模型生成單元42還用于抽取所述社交媒體數據中的時 間類、地點類、事件類和人物屬性類信息,將所述人物屬性類信息進行聚類并訓練,所述訓 練后得到所述用戶屬性模型。
[0069] 因此,本發明實施例提供的系統設備,通過接收終端設備發送的終端用戶的用戶 標識,獲取與所述用戶標識對應的社交媒體數據,抽取所述社交媒體數據中的上下文信息, 并對所述上下文信息進行聚類處理,所述聚類處理后得到用戶屬性模型,以及對所述社交 媒體數據、所述上下文信息和所述用戶屬性模型進行訓練,所述訓練后得到信息回復模型, 并向所述終端設備發送所述用戶屬性模型和所述信息回復模型,以使所述終端設備根據所 述用戶屬性模型和所述信息回復模型對所述終端用戶接收到的待回復信息進行處理,從而 使得系統端利用社交媒體數據作為訓練語料進行建模,從而擴大了語料采集的范圍,并降 低了采集成本,同時,上下文信息作為信息回復模型訓練參數,使得回復內容更具有針對 性,還有,引入用戶屬性模型作為上下文參數,可以將在社交媒體對不同對象的回復風格、 方式引入信息回復。
[0070] 圖5為本發明實施例五提供的終端設備的示意圖。該終端設備用于執行本發明實 施例一提供的信息處理方法。如圖所示,本發明實施例包括:設備端口 51、處理器52和存 儲器53。設備總線54用于連接設備端口 51、處理器52和存儲器53。
[0071] 設備端口 51用于與系統設備相連接。
[0072] 存儲器53可以是永久存儲器,例如硬盤驅動器和閃存,存儲器53中具有軟件模塊 和設備驅動程序。軟件模塊能夠執行本發明上述方法的各種功能模塊;設備驅動程序可以 是網絡和接口驅動程序。
[0073] 在啟動時,這些軟件組件被加載到存儲器53中,然后被處理器52訪問并執行如圖 1所示的方法。
[0074] 圖6為本發明實施例六提供的系統設備的示意圖。該系統設備用于執行本發明實 施例二提供的信息處理方法。如圖所示,本發明實施例包括:設備端口 61、處理器62和存 儲器63。設備總線64用于連接設備端口 61、處理器62和存儲器63。
[0075] 設備端口 61用于與終端設備相連接。
[0076] 存儲器63可以是永久存儲器,例如硬盤驅動器和閃存,存儲器63中具有軟件模塊 和設備驅動程序。軟件模塊能夠執行本發明上述方法的各種功能模塊;設備驅動程序可以 是網絡和接口驅動程序。
[0077] 在啟動時,這些軟件組件被加載到存儲器63中,然后被處理器62訪問并執行如圖 2所示的方法。
[0078] 圖7為本發明實施例七提供的信息處理系統的示意圖。如圖所示,本實施例具體 包括:本發明實施例三提供的終端設備71和本發明實施例四提供的系統設備72,或者本發 明實施例五提供的終端設備71和本發明實施例六提供的系統設備72。
[0079] 專業人員應該還可以進一步意識到,結合本文中所公開的實施例描述的各示例的 單元及算法步驟,能夠以電子硬件、計算機軟件或者二者的結合來實現,為了清楚地說明硬 件和軟件的可互換性,在上述說明中已經按照功能一般性地描述了各示例的組成及步驟。 這些功能究竟以硬件還是軟件方式來執行,取決于技術方案的特定應用和設計約束條件。 專業技術人員可以對每個特定的應用來使用不同方法來實現所描述的功能,但是這種實現 不應認為超出本發明的范圍。
[0080] 結合本文中所公開的實施例描述的方法或算法的步驟可以用硬件、處理器執行的 軟件模塊,或者二者的結合來實施。軟件模塊可以置于隨機存儲器(RAM)、內存、只讀存儲器 (ROM)、電可編程ROM、電可擦除可編程ROM、寄存器、硬盤、可移動磁盤、CD-ROM、或【技術領域】 內所公知的任意其它形式的存儲介質中。
[0081] 以上所述的【具體實施方式】,對本發明的目的、技術方案和有益效果進行了進一步 詳細說明,所應理解的是,以上所述僅為本發明的【具體實施方式】而已,并不用于限定本發明 的保護范圍,凡在本發明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含 在本發明的保護范圍之內。
【權利要求】
1. 一種信息處理方法,其特征在于,所述方法包括: 終端設備獲取終端用戶的用戶標識,并將所述用戶標識發送至系統設備,使得所述系 統設備獲取與所述用戶標識對應的社交媒體數據,抽取所述社交媒體數據中的上下文信 息,并對所述上下文信息進行聚類處理,所述聚類處理后得到用戶屬性模型; 所述終端設備從所述系統設備接收所述終端用戶的所述用戶屬性模型和信息回復模 型,并根據所述用戶屬性模型確定所述終端用戶的所有聯系人的用戶屬性; 當接收到所述聯系人發送的待回復信息時,抽取所述待回復信息的上下文信息,并根 據所述待回復信息的上下文信息、所述聯系人的用戶屬性、以及所述信息回復模型生成回 復信息,并將所述回復信息發送至所述聯系人。
2. 根據權利要求1所述的信息處理方法,其特征在于,所述獲取終端用戶的用戶標識 具體為: 獲取所述終端用戶在社交媒體上的用戶標識,所述用戶標識為所述終端用戶在所述社 交媒體上注冊的標識信息。
3. 根據權利要求1或2所述的信息處理方法,其特征在于,所述根據所述待回復信息的 上下文信息、所述聯系人的用戶屬性、以及所述信息回復模型生成回復信息具體為: 根據所述待回復信息的上下文信息、所述聯系人的用戶屬性、所述聯系人的歷史信息、 以及所述信息回復模型生成回復信息。
4. 根據權利要求1至3任一項所述的信息處理方法,其特征在于,所述根據所述待回復 信息的上下文信息、所述聯系人的用戶屬性、以及所述信息回復模型生成回復信息之后,還 包括: 將所述回復信息進行語言修飾,并將所述語言修飾后的信息發送至所述聯系人。
5. 根據權利要求1至4任一項所述的信息處理方法,其特征在于,所述待回復信息的上 下文信息包括時間類、地點類和事件類信息。
6. -種信息處理方法,其特征在于,所述方法包括: 系統設備接收終端設備發送的終端用戶的用戶標識; 獲取與所述用戶標識對應的社交媒體數據,抽取所述社交媒體數據中的上下文信息, 并對所述上下文信息進行聚類處理,所述聚類處理后得到用戶屬性模型; 對所述社交媒體數據、所述上下文信息和所述用戶屬性模型進行訓練,所述訓練后得 到信息回復模型; 向所述終端設備發送所述用戶屬性模型和所述信息回復模型,以使所述終端設備根據 所述用戶屬性模型和所述信息回復模型對所述終端用戶接收到的待回復信息進行處理。
7. 根據權利要求6所述的信息處理方法,其特征在于,所述接收終端設備發送的終端 用戶的用戶名信息具體為: 接收所述終端設備在社交媒體上的用戶標識,所述用戶標識為所述終端用戶在所述社 交媒體上注冊的標識信息。
8. 根據權利要求6或7所述的信息處理方法,其特征在于,所述上下文信息包括時間 類、地點類、事件類和人物屬性類信息,所述抽取所述社交媒體數據中的上下文信息,并對 所述上下文進行聚類處理,所述聚類處理后得到用戶屬性模型具體為: 抽取所述社交媒體數據中的時間類、地點類、事件類和人物屬性類信息,將所述人物屬 性類信息進行聚類并訓練,所述訓練后得到所述用戶屬性模型。
9. 一種終端設備,其特征在于,所述設備包括: 獲取單元,用于獲取終端用戶的用戶標識,并將所述用戶標識發送至系統設備,使得所 述系統設備獲取與所述用戶標識對應的社交媒體數據,抽取所述社交媒體數據中的上下文 信息,并對所述上下文信息進行聚類處理,所述聚類處理后得到用戶屬性模型; 接收單元,用于接收所述系統設備發送的與所述終端用戶相對應的所述用戶屬性模型 和信息回復模型,并根據所述用戶屬性模型確定所述終端用戶的所有聯系人的用戶屬性, 以及將所述所有聯系人的用戶屬性和所述信息回復模型傳輸給信息處理單元; 信息處理單元,用于從所述接收單元接收所述所有聯系人的用戶屬性和所述信息回復 模型,當接收到所述聯系人發送的待回復信息時,抽取所述待回復信息的上下文信息,并根 據所述待回復信息的上下文信息、所述聯系人的用戶屬性、以及所述信息回復模型生成回 復信息,并將所述回復信息發送至所述聯系人。
10. 根據權利要求9所述的終端設備,其特征在于,所述獲取單元還用于獲取所述終端 用戶在社交媒體上的用戶標識,所述用戶標識為所述終端用戶在所述社交媒體上注冊的標 識息。
11. 根據權利要求9或10所述的終端設備,其特征在于,所述接收單元還用于根據所述 待回復信息的上下文信息、所述聯系人的用戶屬性、所述聯系人的歷史信息、以及所述信息 回復模型生成回復信息。
12. 根據權利要求9至11任一項所述的終端設備,其特征在于,所述設備還包括: 語言修飾單元,用于將所述回復信息進行語言修飾,并將所述語言修飾后的信息發送 至所述聯系人。
13. 根據權利要求9至12任一項所述的終端設備,其特征在于,所述待回復信息的上下 文信息包括時間類、地點類和事件類信息。
14. 一種系統設備,其特征在于,所述設備包括: 接收單元,用于接收終端設備發送的終端用戶的用戶標識,以及將所述用戶標識傳輸 給用戶屬性模型生成單元; 用戶屬性模型生成單元,用于從所述接收單元接收所述用戶標識,獲取與所述用戶標 識對應的社交媒體數據,抽取所述社交媒體數據中的上下文信息,并對所述上下文信息進 行聚類處理,所述聚類處理后得到用戶屬性模型,及將所述社交媒體數據、所述上下文信息 和所述用戶屬性模型傳輸給信息回復模型生成單元,以及將所述用戶屬性模型傳輸給發送 單元; 信息回復模型生成單元,用于從所述用戶屬性模型生成單元接收所述社交媒體數據、 所述上下文信息和所述用戶屬性模型,對所述社交媒體數據、所述上下文信息和所述用戶 屬性模型進行訓練,所述訓練后得到信息回復模型,以及將所述信息回復模型傳輸給發送 單元; 發送單元,用于從所述用戶屬性模型生成單元接收所述用戶屬性模型,從所述信息回 復模型生成單元接收所述信息回復模型,向所述終端設備發送所述用戶屬性模型和所述信 息回復模型,以使所述終端設備根據所述用戶屬性模型和所述信息回復模型對所述終端用 戶接收到的待回復信息進行處理。
15. 根據權利要求14所述的系統設備,其特征在于,所述接收單元還用于接收所述終 端設備在社交媒體上的用戶標識,所述用戶標識為所述終端用戶在所述社交媒體上注冊的 標識信息。
16. 根據權利要求14或15所述的系統設備,其特征在于,所述上下文信息包括時間類、 地點類、事件類和人物屬性類信息,所述用戶屬性模型生成單元還用于抽取所述社交媒體 數據中的時間類、地點類、事件類和人物屬性類信息,將所述人物屬性類信息進行聚類并訓 練,所述訓練后得到所述用戶屬性模型。
17. -種信息處理系統,其特征在于,所述系統包括:根據權利要求9至13任一項所述 的終端設備和根據權利要求14至16任一項所述的系統設備。
【文檔編號】H04W88/02GK104144392SQ201310166626
【公開日】2014年11月12日 申請日期:2013年5月8日 優先權日:2013年5月8日
【發明者】李華飛, 張軼博 申請人:華為技術有限公司