本技術涉及人工智能,更具體地說,涉及一種文本處理方法、裝置、設備及存儲介質。
背景技術:
1、寫作是人們日常生活和學習中必不可少的實用技能,也是學校教育中要求學生重點掌握的必備能力。
2、寫作者為了提高所撰寫的文本的質量,需要對文本進行修改,但什么樣的修改結果相對于原文來說是高質量的,對于寫作者來說,可能是不清楚的,因此,有必要為寫作者提供一份潤色后文本,以供寫作者參考。
技術實現思路
1、有鑒于此,本技術提供了一種文本處理方法、裝置、設備及存儲介質,以生成潤色文本。
2、為了實現上述目的,現提出的方案如下:
3、一種文本處理方法,包括:
4、獲得目標文本的糾錯后文本和所述目標文本對應的目標寫作要求;所述目標寫作要求為所述目標文本對應的多個寫作要求中的至少一個寫作要求;所述目標文本在所述目標寫作要求方面的質量,低于所述目標文本在所述多個寫作要求中的非目標寫作要求方面的質量;
5、基于所述多個寫作要求、所述目標寫作要求和所述糾錯后文本生成潤色后文本;所述潤色后文本在所述目標寫作要求方面的質量,高于所述目標文本在所述目標寫作要求方面的質量;
6、輸出所述潤色后文本。
7、上述方法,可選的,所述基于所述多個寫作要求、所述目標寫作要求和所述糾錯后文本生成潤色后文本,包括:
8、在所述糾錯后文本中確定與所述目標寫作要求對應的目標片段;
9、將目標信息與所述目標片段相關聯;所述目標信息包括如下至少一項:所述目標寫作要求、與所述目標寫作要求對應的目標評語;所述目標評語用于引導寫作者對所述目標文本進行修改,以提高所述目標文本在所述目標寫作要求方面的質量;
10、至少對所述多個寫作要求、相關聯的所述目標信息和所述目標片段、所述糾錯后文本進行處理,以生成所述潤色后文本。
11、上述方法,可選的,所述至少對所述多個寫作要求、相關聯的所述目標信息和所述目標片段、所述糾錯后文本進行處理,以生成所述潤色后文本,包括:
12、對修改輔助信息、所述多個寫作要求、相關聯的所述目標信息和所述目標片段、所述糾錯后文本進行處理,以生成所述潤色后文本。
13、上述方法,可選的,獲得所述目標文本對應的目標寫作要求,包括:
14、利用所述目標文本的糾錯后文本生成所述目標文本對應的目標寫作要求;
15、或者,
16、獲得所述目標文本對應的目標評語;基于所述目標評語確定所述目標文本對應的目標寫作要求。
17、上述方法,可選的,
18、所述目標評語為評閱者針對所述目標文本輸入的評語;
19、或者,
20、所述目標評語通過對所述糾錯后文本進行處理得到。
21、上述方法,可選的,還包括:
22、獲得所述目標文本對應的多個寫作要求,以及所述糾錯后文本中的各個句子的位置信息;
23、至少對所述糾錯后文本、所述各個句子的位置信息以及所述多個寫作要求進行處理,獲得所述目標文本對應的評語;所述目標文本對應的評語至少包括所述目標評語。
24、上述方法,可選的,所述目標文本對應的評語包括:總評和片段評語;
25、所述總評是基于所述多個寫作要求針對所述目標文本的整體的評閱結果;
26、不同的片段評語是對所述目標文本中的不同文本片段的評閱結果;
27、所述目標評語至少包括所述總評中的至少部分內容。
28、上述方法,可選的,所述片段評語包括說明式評語和啟發式評語;
29、所述說明式評語用陳述的方式指出所述片段評語對應的文本片段的優缺點和/或修改建議;所述啟發式評語用提問的方式指出對所述片段評語對應的文本片段進行修改的建議;
30、所述目標評語還包括目標說明式評語和所述啟發式評語;所述目標說明式評語用陳述的方式指出所述目標說明式評語對應的文本片段的修改建議。
31、上述方法,可選的,至少對所述多個寫作要求、相關聯的所述目標信息和所述目標片段、所述糾錯后文本進行處理,以生成所述潤色后文本的過程通過潤色模型實現;
32、所述潤色模型以原始文本的糾錯后文本、所述原始文本對應的多個樣本寫作要求以及相關聯的目標樣本信息和目標樣本片段為訓練數據,以所述原始文本對應的潤色后文本為標簽,以所述潤色模型生成的潤色后文本趨近于所述標簽為目標,對所述潤色模型進行訓練得到;
33、所述訓練數據中的目標樣本信息包括如下至少一項:所述原始文本對應的目標樣本寫作要求,與所述目標樣本寫作要求對應的目標樣本評語;所述目標樣本評語用于引導寫作者對所述原始文本進行修改,以提高所述原始文本在所述目標樣本寫作要求方面的質量。
34、上述方法,可選的,所述獲得目標文本的糾錯后文本,包括:
35、對所述目標文本進行別字糾錯,生成所述目標文本的別字糾錯結果;所述目標文本的每個別字糾錯結果包括所述目標文本中的錯別字,以及所述錯別字對應的正確字;
36、對所述目標文本進行語病糾錯,生成所述目標文本的語病糾錯結果;所述目標文本的每個語病糾錯結果包括所述目標文本中的存在語病的句子,以及所述存在語病的句子對應的正確句子;
37、基于所述目標文本、所述別字糾錯結果和所述語病糾錯結果,獲得所述糾錯后文本。
38、一種文本處理裝置,所述裝置包括:
39、處理模塊,用于獲得目標文本的糾錯后文本和所述目標文本對應的目標寫作要求;基于所述多個寫作要求、所述目標寫作要求和所述糾錯后文本獲得潤色后文本;所述目標寫作要求為所述目標文本對應的多個寫作要求中的至少一個寫作要求;所述目標文本在所述目標寫作要求方面的質量,低于所述目標文本在所述多個寫作要求中的非目標寫作要求方面的質量;所述潤色后文本在所述目標寫作要求方面的質量,高于所述目標文本在所述目標寫作要求方面的質量;
40、輸出模塊,用于輸出所述潤色后文本。
41、上述裝置,可選的,所述處理模塊基于所述多個寫作要求、所述目標寫作要求和所述糾錯后文本生成潤色后文本時,用于:
42、在所述糾錯后文本中確定與所述目標寫作要求對應的目標片段;
43、將目標信息與所述目標片段相關聯;所述目標信息包括如下至少一項:所述目標寫作要求、與所述目標寫作要求對應的目標評語;所述目標評語用于引導寫作者對所述目標文本進行修改,以提高所述目標文本在所述目標寫作要求方面的質量;
44、至少對所述多個寫作要求、相關聯的所述目標信息和所述目標片段、所述糾錯后文本進行處理,以生成所述潤色后文本。
45、上述裝置,可選的,所述處理模塊至少對所述多個寫作要求、相關聯的所述目標信息和所述目標片段、所述糾錯后文本進行處理,以生成所述潤色后文本時,用于:
46、對修改輔助信息、所述多個寫作要求、相關聯的所述目標信息和所述目標片段、所述糾錯后文本進行處理,以生成所述潤色后文本。
47、上述裝置,可選的,所述處理模塊獲得所述目標文本對應的目標寫作要求時,用于:
48、利用所述目標文本的糾錯后文本生成所述目標文本對應的目標寫作要求;
49、或者,
50、獲得所述目標文本對應的目標評語;基于所述目標評語確定所述目標文本對應的目標寫作要求。
51、上述裝置,可選的,
52、所述目標評語為評閱者針對所述目標文本輸入的評語;
53、或者,
54、所述目標評語通過對所述糾錯后文本進行處理得到。
55、上述裝置,可選的,所述處理模塊還用于:
56、獲得所述目標文本對應的多個寫作要求,以及所述糾錯后文本中的各個句子的位置信息;
57、至少對所述糾錯后文本、所述各個句子的位置信息以及所述多個寫作要求進行處理,獲得所述目標文本對應的評語;所述目標文本對應的評語至少包括所述目標評語。
58、上述裝置,可選的,所述目標文本對應的評語包括:總評和片段評語;
59、所述總評是基于所述多個寫作要求針對所述目標文本的整體的評閱結果;
60、不同的片段評語是對所述目標文本中的不同文本片段的評閱結果;
61、所述目標評語至少包括所述總評中的至少部分內容。
62、上述裝置,可選的,所述片段評語包括說明式評語和啟發式評語;
63、所述說明式評語用陳述的方式指出所述片段評語對應的文本片段的優缺點和/或修改建議;所述啟發式評語用提問的方式指出對所述片段評語對應的文本片段進行修改的建議;
64、所述目標評語還包括目標說明式評語和所述啟發式評語;所述目標說明式評語用陳述的方式指出所述目標說明式評語對應的文本片段的修改建議。
65、上述裝置,可選的,所述處理模塊基于潤色模型實現;
66、所述潤色模型以原始文本的糾錯后文本、所述原始文本對應的多個樣本寫作要求以及相關聯的目標樣本信息和目標樣本片段為訓練數據,以所述原始文本對應的潤色后文本為標簽,以所述潤色模型生成的潤色后文本趨近于所述標簽為目標,對所述潤色模型進行訓練得到;
67、所述訓練數據中的目標樣本信息包括如下至少一項:所述原始文本對應的目標樣本寫作要求,與所述目標樣本寫作要求對應的目標樣本評語;所述目標樣本評語用于引導寫作者對所述原始文本進行修改,以提高所述原始文本在所述目標樣本寫作要求方面的質量。
68、上述裝置,可選的,所述處理模塊獲得目標文本的糾錯后文本時,用于:
69、對所述目標文本進行別字糾錯,生成所述目標文本的別字糾錯結果;所述目標文本的每個別字糾錯結果包括所述目標文本中的錯別字,以及所述錯別字對應的正確字;
70、對所述目標文本進行語病糾錯,生成所述目標文本的語病糾錯結果;所述目標文本的每個語病糾錯結果包括所述目標文本中的存在語病的句子,以及所述存在語病的句子對應的正確句子;
71、基于所述目標文本、所述別字糾錯結果和所述語病糾錯結果,獲得所述糾錯后文本。
72、一種文本處理設備,包括存儲器和處理器;
73、所述存儲器,用于存儲程序;
74、所述處理器,用于執行所述程序,實現如上任一項所述的文本處理方法的各個步驟。
75、一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時,實現如上任一項所述的文本處理方法的各個步驟。
76、從上述的技術方案可以看出,本技術實施例提供的文本處理方法、裝置、設備及存儲介質,獲得目標文本的糾錯后文本和目標文本對應的目標寫作要求;目標寫作要求為目標文本對應的多個寫作要求中的至少一個寫作要求;目標文本在目標寫作要求方面的質量,低于目標文本在多個寫作要求中的非目標寫作要求方面的質量;基于多個寫作要求、目標寫作要求和糾錯后文本生成潤色后文本;輸出潤色后文本。潤色后文本在目標寫作要求方面的質量,高于目標文本在目標寫作要求方面的質量。本技術獲得目標文本的糾錯后文本和目標文本對應的寫作薄弱點(即目標寫作要求),基于多個寫作要求、目標寫作要求和糾錯后文本生成潤色后文本,所生成的潤色后文本在目標寫作要求方面的質量提高了,實現了圍繞目標文本的寫作薄弱點進行潤色的目的,即實現了對目標文本的個性化潤色,為寫作者提供個性化的參考。