本發明涉及文本信息處理,尤其是指一種電商、旅游平臺用戶評論回復生成方法、裝置、設備以及可讀儲存介質。
背景技術:
1、電商、旅游平臺用戶評論回復生成旨在針對電商平臺、旅游平臺上面用戶發表的對某項商品或服務的具體評論,自動生成高質量的、有針對性的回復,其可以顯著減少服務提供商的人工負擔。
2、早期常用的評論回復生成技術為基于模板的快速回復技術,這類方法主要是利用提前設計好的回復模板自動回復用戶評論,從而減少人工負擔;其中,提前設計好的回復模板可以是完整的、通用的模板,也可以是留有較少填空的模板,以便加入店名、商品名等特殊信息;但是該類方法缺乏靈活性和多樣性,對于所有的評論都采用少量相同的模板進行回復,無法根據評論內容進行合適的回復,從而無法解決評論中提到的問題,無法讓用戶滿意。
3、隨著神經網絡技術的發展,為了解決上述問題,基于循環神經網絡的評論回復生成技術被提出用于自動生成回復,這類方法利用循環神經網絡分別構成編碼器和解碼器,編碼器編碼評論文本和屬性信息到隱藏向量,解碼器從隱藏向量解碼出最終的回復文本,在一定程度上可以滿足結合評論內容進行回復的要求,但是回復的內容不夠流暢,容易出現語句不通順、生成重復字等問題,且由于數據的限制更容易生成通用的重復的模板內容回復。
4、隨著自然語言處理中的預訓練-微調技術出現,為了解決上述問題,基于預訓練-微調的評論回復生成技術被提出,這類方法以大規模預訓練模型作為骨干網絡,在特定領域的下游數據集上利用微調技術進行訓練和適配,同時結合檢索技術從收集到的大規模相關數據集中檢索出相關評論-回復對,以幫助更好地完成該領域的回復生成任務;例如,現有技術中利用預訓練模型bart的編碼器來更好地編碼評論文本和屬性信息到隱藏向量中,同時結合檢索技術從收集的相關數據中檢索出大量相關的評論-回復對融合到上述隱藏向量中,最終利用bart的解碼器從隱藏向量中解碼出回復文本,由于其生成的文本流暢性較高,同時能夠與評論文本有一定的相關性,出現了越來越多微調各種預訓練模型的技術來完成評論回復生成任務,例如微調預訓練模型gpt-2等。
5、現有的基于預訓練-微調的評論回復生成技術存在以下缺陷:(1)無法很好地捕捉評論中提到的具體方面的問題,容易生成與評論內容相關性不高的回復;(2)需要結合檢索增強,即針對某一領域的評論文本生成對應的回復文本時,需要從當前領域的大規模數據檢索池中檢索類似評論-回復對,若該技術所適用的領域越多,所需額外的供檢索數據的類型越多,檢索池中的數據量會越大,最終導致回復速度慢、回復效率低;同時,針對某個領域的特征進行集成,遷移到其他領域時可能會缺少為之前領域特征設計的模塊,即僅在某個領域的數據上進行訓練后,無法很好地適用于其他領域,造成缺乏領域移植能力的問題,例如,只在服裝領域數據上訓練和適配后,無法很好地回復酒店評論的內容;(3)現有的方法往往只評論情感極性,缺少對現有評論的有效信息挖掘和利用,例如存在的多種方面對應的話術、各個方面的情感,導致無法很好地針對評論中提到的具體方面的問題進行回復,缺乏針對性,從而導致不能很好地緩解用戶的矛盾,無法讓用戶滿意。
6、綜上所述,如何生成合適的回復文本提高用戶滿意度是目前有待解決的問題。
技術實現思路
1、為此,本發明所要解決的技術問題在于克服現有技術中基于評論文本,生成的回復文本不合適,導致用戶滿意度低的問題。
2、為解決上述技術問題,本發明提供了一種電商、旅游平臺用戶評論回復生成方法,包括:
3、利用基于bert的細粒度方面情感抽取工具,抽取當前評論文本的方面關鍵詞及其對應的情感傾向,得到當前評論文本的三元組集合;其中,每個三元組由方面關鍵詞、情感傾向、置信度構成;基于當前評論文本,利用評論回復生成模型,得到當前評論文本的偽回復文本;
4、基于當前評論文本,利用方面話術抽取方法,得到當前評論文本的方面話術,包括:
5、利用標點符號分割當前評論文本及其偽回復文本,得到當前評論文本的各個子句、當前偽回復文本的各個子句;
6、將當前評論文本的各個子句、當前偽回復文本的各個子句輸入至評論回復生成模型后,進行池化操作,得到當前評論文本的各個子句的向量表示、當前偽回復文本的各個子句的向量表示;計算當前評論文本的每個子句的向量表示與當前偽回復文本的每個子句的向量表示之間的余弦相似度;
7、若當前評論文本的當前子句的向量表示與當前偽回復文本的當前子句的向量表示之間的余弦相似度大于閾值,則當前評論文本的當前子句與當前偽回復文本的當前子句對齊成功,得到當前評論文本的一組評論-話術對;若當前評論文本的當前子句的向量表示與當前偽回復文本的當前子句的向量表示之間的余弦相似度小于等于閾值,則當前評論文本的當前子句與當前偽回復文本的當前子句對齊失敗,不構成一組評論-話術對;依次判斷當前評論文本的各個子句的向量表示與當前偽回復文本的各個子句的向量表示之間的余弦相似度是否大于閾值,從而得到當前評論文本的評論-話術對集合,并將評論-話術對集合中各個話術進行拼接,得到當前評論文本的方面話術;
8、根據當前評論文本的三元組集合、評論-話術對集合,判斷當前評論文本是否有消極情感和方面話術;若當前評論文本無消極情感,且無方面話術,則選擇第一指令約束模板;若當前評論文本無消極情感,且有方面話術,則選擇第二指令約束模板;若當前評論文本有消極情感,且無方面話術,則選擇第三指令約束模板;若當前評論文本有消極情感,且有方面話術,則選擇第四指令約束模板;
9、基于當前評論文本,獲取當前評論文本的領域、店名、屬性信息;根據選擇的指令約束模板,基于當前評論文本以及當前評論文本的領域、店名、屬性信息、三元組集合、方面話術,組裝得到當前評論文本的指令約束文本;
10、將當前評論文本的指令約束文本輸入至評論回復生成模型中,輸出當前指令約束文本的方面和情感話術、以及結合當前指令約束文本的方面和情感話術的回復內容;將結合當前指令約束文本的方面和情感話術的回復內容作為當前評論文本的回復文本。
11、優選地,將結合當前指令約束文本的方面和情感話術的回復內容作為當前評論文本的回復文本后還包括:
12、若當前評論文本的回復文本解決了當前評論文本中所有方面關鍵詞對應的問題,則將當前評論文本的回復文本作為當前評論文本的最終回復文本,并采用當前最終回復文本回復當前評論文本;
13、若當前評論文本的回復文本未解決當前評論文本中所有方面關鍵詞對應的問題,則根據當前評論文本,選擇需要回復的方面關鍵詞及其對應的情感傾向;根據需要回復的方面關鍵詞及其對應的情感傾向,利用方面調整模塊,得到當前評論文本的新的方面話術;其中,所述方面調整模塊為基于數據集中的評論-回復對,利用方面抽取方法,得到數據集對應的評論-話術對集合;基于數據集對應的評論-話術對集合,找到與需要回復的方面關鍵詞對應的話術,從而得到當前評論文本的新的方面話術;
14、將新的方面話術加入當前評論文本的指令約束文本中,得到當前評論文本的新的指令約束文本;將當前評論文本的新的指令約束文本輸入至評論回復生成模型中,輸出新的指令約束文本的方面和情感話術、以及結合新的指令約束文本的方面和情感話術的回復內容;將結合新的指令約束文本的方面和情感話術的回復內容后,判斷當前評論文本的回復文本是否解決當前評論文本中所有方面關鍵詞對應的問題;若當前評論文本的回復文本未解決當前評論文本中所有方面關鍵詞對應的問題,則繼續進行方面調整,直至生成的當前評論文本的回復文本解決了當前評論文本中所有方面關鍵詞對應的問題,將此時得到的回復文本作為當前評論文本的最終回復文本,并采用當前最終回復文本回復當前評論文本。
15、優選地,指令約束模板中各個符號包括:[d]表示領域,為酒店或服裝;[r]表示評論文本;[shop]表示商店名稱;[properties]表示屬性信息;[a]表示情感傾向為消極情感的方面關鍵詞;[scripts]表示方面話術。
16、優選地,組裝當前評論文本的指令約束文本時,基于當前評論文本,將各個符號替換為對應的文本;將當前評論文本的三元組集合中的消極情感對應的各個置信度從高到低進行排列,至多選取最高的三個置信度對應的方面關鍵詞,替換[a]。
17、優選地,各個指令約束模板包括:
18、所述第一指令約束模板為“有[d]領域的評論文本:[r];店名為[shop],屬性信息有:[properties];請生成流暢且有針對性的回復文本:”;
19、所述第二指令約束模板為“有[d]領域的評論文本:[r];店名為[shop],屬性信息有:[properties];可在回復中添加方面話術:[scripts],請生成流暢且有針對性的回復文本:”;
20、所述第三指令約束模板為“有[d]領域的評論文本:[r];店名為[shop],屬性信息有:[properties];當前評論文本中表達了消極情感的方面關鍵詞:[a],請生成流暢且有針對性的回復文本:”;
21、所述第四指令約束模板為“有[d]領域的評論文本:[r];店名為[shop],屬性信息有:[properties];當前評論文本中表達了消極情感的方面關鍵詞:[a],可在回復中添加方面話術:[scripts],請生成流暢且有針對性的回復文本:”。
22、優選地,所述計算當前評論文本的每個子句的向量表示與當前偽回復文本的每個子句的向量表示之間的余弦相似度,其表達式為:
23、;
24、其中,表示當前評論文本的第i個子句的向量表示與當前偽回復文本的第j個子句的向量表示之間的余弦相似度;表示當前評論文本的第i個子句的向量表示;表示當前偽回復文本的第j個子句的向量表示;分別表示的歐氏范數,即的向量長度。
25、優選地,所述評論回復生成模型為在預訓練模型bart的基礎上,增加了話術生成模塊和復制模塊的模型。
26、本發明還提供了一種電商、旅游平臺用戶評論回復生成裝置,包括:
27、三元組集合抽取模塊:利用基于bert的細粒度方面情感抽取工具,抽取當前評論文本的方面關鍵詞及其對應的情感傾向,得到當前評論文本的三元組集合;其中,每個三元組由方面關鍵詞、情感傾向、置信度構成;基于當前評論文本,利用評論回復生成模型,得到當前評論文本的偽回復文本;
28、方面話術生成模塊:基于當前評論文本,利用方面話術抽取方法,得到當前評論文本的方面話術,包括:利用標點符號分割當前評論文本及其偽回復文本,得到當前評論文本的各個子句、當前偽回復文本的各個子句;將當前評論文本的各個子句、當前偽回復文本的各個子句輸入至評論回復生成模型后,進行池化操作,得到當前評論文本的各個子句的向量表示、當前偽回復文本的各個子句的向量表示;計算當前評論文本的每個子句的向量表示與當前偽回復文本的每個子句的向量表示之間的余弦相似度;若當前評論文本的當前子句的向量表示與當前偽回復文本的當前子句的向量表示之間的余弦相似度大于閾值,則當前評論文本的當前子句與當前偽回復文本的當前子句對齊成功,得到當前評論文本的一組評論-話術對;若當前評論文本的當前子句的向量表示與當前偽回復文本的當前子句的向量表示之間的余弦相似度小于等于閾值,則當前評論文本的當前子句與當前偽回復文本的當前子句對齊失敗,不構成一組評論-話術對;依次判斷當前評論文本的各個子句的向量表示與當前偽回復文本的各個子句的向量表示之間的余弦相似度是否大于閾值,從而得到當前評論文本的評論-話術對集合,并將評論-話術對集合中各個話術進行拼接,得到當前評論文本的方面話術;
29、指令約束模板選擇模塊:根據當前評論文本的三元組集合、評論-話術對集合,判斷當前評論文本是否有消極情感和方面話術;若當前評論文本無消極情感,且無方面話術,則選擇第一指令約束模板;若當前評論文本無消極情感,且有方面話術,則選擇第二指令約束模板;若當前評論文本有消極情感,且無方面話術,則選擇第三指令約束模板;若當前評論文本有消極情感,且有方面話術,則選擇第四指令約束模板;
30、指令約束文本確定模塊:基于當前評論文本,獲取當前評論文本的領域、店名、屬性信息;根據選擇的指令約束模板,基于當前評論文本以及當前評論文本的領域、店名、屬性信息、三元組集合、方面話術,組裝得到當前評論文本的指令約束文本;
31、回復文本生成模塊:將當前評論文本的指令約束文本輸入至評論回復生成模型中,輸出當前指令約束文本的方面和情感話術、以及結合當前指令約束文本的方面和情感話術的回復內容;將結合當前指令約束文本的方面和情感話術的回復內容作為當前評論文本的回復文本。
32、本發明還提供了一種電商、旅游平臺用戶評論回復生成設備,包括:
33、存儲器,用于存儲計算機程序;
34、處理器,用于執行所述計算機程序時實現如上述所述一種電商、旅游平臺用戶評論回復生成方法的步驟。
35、本發明還提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被處理器執行時實現如上述所述一種電商、旅游平臺用戶評論回復生成方法的步驟。
36、本發明的上述技術方案相比現有技術具有以下有益效果:
37、(1)本發明所述的一種電商、旅游平臺用戶評論回復生成方法,基于bart的評論回復生成模型,得到評論文本的各個子句以及偽回復文本的各個子句后,計算評論文本的各個子句與偽回復文本的各個子句之間的余弦相似度信息,得到評論文本的評論-話術對集合,進而得到評論文本的方面話術;根據評論文本有無消極情感和有無方面話術,選擇合適的指令約束模板后,基于評論文本,填充選擇的指令約束模板,得到評論文本對應的指令約束后,將評論文本對應的指令約束輸入至評論回復生成模型中,得到評論文本對應的回復文本;在上述過程中,本發明在基礎的評論回復生成方法上進行細粒度方面情感分析和融合,挖掘評論中的方面及情感信息,為生成針對性的回復內容提供參考;同時,通過方面話術抽取方法,可以很好地捕捉評論文本中的具體方面的問題;此外,基于自然語言處理中預訓練微調技術進行開發,利用大規模預訓練模型bart編碼評論文本和屬性信息,使得僅利用評論文本和相關屬性信息就能生成流暢的、與評論文本相關度高的回復內容,沒有重復現象,通用回復出現的次數較少,從而生成了更加合適的回復文本;
38、(2)本發明所述的一種電商、旅游平臺用戶評論回復生成方法,設計了多種指令約束模板,每個指令約束模板中,都包含了與評論文本相關的領域、商店名稱、屬性信息,結合指令微調的技術,在生成回復文本的過程中,無需修改模型結構,且無需收集多個領域的大量的評論-回復數據供檢索,可直接利用數據進行訓練,即能夠在多領域中直接應用,利用一個模型完成多個領域的評論回復生成任務,提高了回復效率,增強了領域適應性;
39、(3)本發明所述的一種電商、旅游平臺用戶評論回復生成方法,通過方面話術抽取方法,得到評論文本各個方面關鍵詞對應的話術,得到的各個話術可以很好地有針對性地答復評論文本中的各個方面關鍵詞對應的問題;考慮到生成的回復文本可能沒有解決評論文本中的所有方面關鍵詞對應的問題,為了進一步地有針對性地回復評論文本中未解決的方面關鍵詞對應的問題,添加方面調整模塊,找到得到的新的方面話術,并添加到評論文本的指令約束文本中,填充得到評論文本的新的指令約束文本,從而得到評論文本的最終回復文本;在此過程中,利用方面級情感分析技術,準確識別評論中的負向方面,同時結合話術挖掘技術從數據中挖掘出方面有關的話術,結合模板和話術生成有針對性的回復內容,能夠做到方面感知的針對性的回復,提高用戶的滿意度。