本發明涉及信息技術的,尤其涉及一種測評報告自動生成系統及方法。
背景技術:
1、近年來,隨著我國信息化建設不斷推進,企業數據量呈現出爆炸式增長的趨勢,企業管理人員需要根據數據背后所反映出來的現象或趨勢,將其轉化成企業管理的有效資源,以制定更準確的決策,在這個過程中,一份好的報告可輔助決策者精準決策,提高工作效率。
2、目前,申請號為202211372432.6的中國發明專利,提供了一種報告自動生成、報告模板配置方法和裝置,解析報告模板,以確定報告模板中的變量;根據變量,展示待配置清單界面;待配置清單界面中包括各變量對應的輸入控件;響應于針對各輸入控件的輸入操作,確定各變量的取數方式;保存報告模板和對應的各取數方式,以完成對報告模板的配置。該方法雖然通過配置化的方式完成報告模板的開發,經過配置的報告模板可自動渲染生成報告,雖然提升了報告模板的開發效率,但是僅僅針對報告中的數據部分進行替換修改,并沒有生成具有針對性的報告,適用范圍局限,并且沒有針對生成的報告進行質量評估和報告生成過程的調整,不利于報告生成的質量。
技術實現思路
1、本發明解決的技術問題是:現有技術僅僅針對報告中的數據部分進行替換修改,并沒有生成具有針對性的報告,適用范圍局限,并且沒有針對生成的報告進行質量評估和報告生成過程的調整,不利于報告生成的質量。
2、為解決上述技術問題,第一方面,本發明提供一種測評報告自動生成方法,包括以下步驟:
3、步驟s1,獲取調查數據表,將調查數據表輸入預先訓練好的序列生成模型,得到數據關鍵詞;
4、步驟s2,根據所述數據關鍵詞匹配模板庫中的報告模板,并將所述調查數據表中的調查數據根據數據標識符輸入報告模板中數據模板的相應位置,生成測評數據報告;
5、步驟s3,將所述數據關鍵詞輸入genius模型中,獲取文本報告,并根據所述報告模板匹配規則庫中對應的語法規則,利用所述語法規則對文本報告進行語法修正,獲取測評文本報告;
6、步驟s4,合并測評數據報告和測評文本報告,獲取測評報告;
7、步驟s5,若任一調查數據被修改,則根據被修改的調查數據的數據標識符和數據關聯表更新相關聯的其他調查數據,獲取更新后的調查數據表,并根據更新后的調查數據表重復步驟s1~s3,獲取終版測評報告;
8、步驟s6,用戶對終版測評報告進行模板評估、語法評估和數據關鍵詞評估獲取評分信息,并通過評分信息調整報告模板、語法規則和序列生成模型,所述評分信息包括模板評分、語法評分和關鍵詞評分;
9、作為本發明所述的一種測評報告自動生成方法的一種優選方案,其中:
10、所述步驟s1具體包括以下步驟:
11、步驟s101,獲取調查數據表;
12、步驟s102,將調查數據表的調查數據輸入預先訓練好的序列生成模型的編碼器,根據第一映射序列將所述調查數據編碼成固定大小的特征向量;
13、步驟s103,將所述特征向量輸入序列生成模型的解碼器,根據第二映射序列獲取各個調查數據所對應的關鍵詞,并利用自注意力機制獲取各個關鍵詞的權重;
14、步驟s104,根據關鍵詞的權重由大到小將關鍵詞進行排序,并提取前n個關鍵詞作為所述調查數據的數據關鍵詞,所述n為大于零的自然數;
15、訓練序列生成模型包括:
16、獲取調查數據集,對調查數據集進行數據預處理,將預處理后調查數據集按照一定比例劃分為調查數據訓練集與調查數據測試集,對調查數據訓練集進行數據標注,將數據標注好的調查數據訓練集輸入訓練生成模型的第一雙向循環神經網絡,調查數據作為輸入和數據標注的數據特征作為輸出進行訓練,并利用調查數據測試集對訓練后的第一雙向循環神經網絡進行測試,直至擬合度達到預期閾值,則停止訓練,獲取序列生成模型的編碼器并生成第一映射序列;
17、獲取所述數據標注的數據特征,對所述數據特征進行關鍵詞標注,獲取數據關鍵詞,將數據特征作為輸入和數據關鍵詞作為輸出訓練第二雙向循環神經網絡,直至擬合度達到預期閾值,則停止訓練,得到序列生成模型的解碼器并生成第二映射序列;
18、作為本發明所述的一種測評報告自動生成方法的一種優選方案,其中:
19、所述步驟s2具體包括以下步驟:
20、步驟s201,利用所述n個數據關鍵詞根據各個模板的模板關鍵詞在模板庫中匹配相應模板,將關鍵詞匹配度最高的模板作為報告模板;
21、步驟s202,將所述調查數據的數據標識符根據占位標識符匹配報告模板中的各個占位符,并將匹配成功的調查數據替換到報告模板中的相應占位符,所述數據標識符和占位標識符為一一對應的關系;
22、步驟s203,將替換完成的報告模板作為測評數據報告;
23、作為本發明所述的一種測評報告自動生成方法的一種優選方案,其中:
24、所述步驟s3具體包括以下步驟:
25、步驟s301,將所述數據關鍵詞輸入genius模型,獲取文本報告;
26、步驟s302,利用pysbd庫對所述文本報告進行分句處理,獲取各個文本分句,并對所述文本分句進行編號;
27、步驟s303,獲取所述報告模板的模板編號,并根據所述模板編號在規則庫中匹配相應的語法規則,利用所述語法規則分別對各個文本分句進行語法檢測,獲取所述文本分句的語法錯誤,并根據語法規則對所述文本分句進行調整;
28、步驟s304,根據所述編號的順序將所述文本分句進行合并,獲取測評文本報告;
29、所述genius模型的訓練包括:
30、獲取優質的文本報告,利用yake方法抽取所述文本報告的關鍵詞,使用mask方法掩蓋處理關鍵詞之外的文本報告內容,獲取文本草稿,將所述文本草稿輸入深度學習模型,所述文本草稿作為模型輸入和所述文本報告作為模型輸出進行訓練,直至模型擬合度達到預期閾值,則停止訓練,得到genius模型;
31、作為本發明所述的一種測評報告自動生成方法的一種優選方案,其中:
32、所述步驟s6具體包括以下步驟:
33、步驟s601,用戶對所述終版測評報告的報告模板的適配度進行評估,獲取模板評分,用戶對所述文本報告的句子語法進行評估,獲取語法評分,用戶對文本報告的核心報告內容進行評估,獲取關鍵詞評分;
34、步驟s602,若模板評分小于或等于預期閾值,則用戶調整所述報告模板的模板關鍵詞;
35、步驟s603,若語法評分小于等于預期閾值,則獲取文本報告的語法規則使用記錄,根據所述語法規則使用記錄獲取所述文本報告使用的語法規則,用戶根據所述文本報告的語法錯位,調整所述語法規則;
36、步驟s604,若關鍵詞評分小于等于預期閾值,則調整所述序列生成模型的第一映射序列;
37、作為本發明所述的一種測評報告自動生成方法的一種優選方案,其中:
38、所述根據被修改的調查數據的數據標識符和數據關聯表更新相關聯的其他調查數據包括:
39、獲取被修改的調查數據的數據標識符,根據所述數據標識符獲取數據關聯表中與所述數據標識符相關聯的其他數據標識符以及之間的關聯關系,根據修改后的調查數據和關聯關系修改其他相關聯的調查數據,所述數據關聯表包括數據標識符和各個標識符之間的關聯關系;
40、作為本發明所述的一種測評報告自動生成方法的一種優選方案,其中:
41、所述步驟s303具體包括以下步驟:
42、步驟s3031,利用句法分析將所述文本分句劃分為若干分詞,并根據各個分詞之間的關系構造所述文本分句的抽象語法樹;
43、步驟s3032,獲取所述報告模板的模板編號,根據所述模板編號在規則庫中匹配相應的語法規則,根據所述語法規則生成相應的正則表達式,并利用正則表達式對所述抽象語法樹進行檢測,獲取檢測不合格的所述抽象語法樹對應的文本分句;
44、步驟s3033,利用所述正則表達式對所述文本分句的若干分詞進行調整,獲取調整后的文本分句;
45、作為本發明所述的一種測評報告自動生成方法的一種優選方案,其中:
46、所述利用yake方法抽取所述文本報告的關鍵詞包括:
47、對所述文本報告進行預處理,去除非語義字符,所述非語義字符包括表達符號和數字;
48、定義所述文本報告的關鍵詞特征,所述關鍵詞特征包括分詞位置、分詞在句中的出現頻率、分詞在文本報告中的出現頻率和分詞的上下文關系,所述分詞的上下文關系通過分詞的不同候選詞的數量進行判斷;
49、根據關鍵詞特征分別獲取各個分詞的位置評分、句頻率評分、文本頻率評分和候選詞評分,并根據所述位置評分、句頻率評分、文本頻率評分和候選詞評分獲取各個分詞的關鍵權重;
50、將各個分詞根據關鍵權重按照從大到小的順序排列,并去除重復分詞,提取前m個分詞,將所述分詞定義為文本報告的關鍵詞,所述m為大于零的自然數。
51、第二方面,本發明提供一種測評報告自動生成系統,包括報告生成模塊、報告修改模塊和報告評估模塊;
52、所述報告生成模塊用于獲取調查數據表,根據所述調查數據表利用序列生成模型獲取數據關鍵詞,并根據所述數據關鍵詞匹配報告模板、生成測評數據報告和測評文本報告,將所述測評數據報告和所述測評文本報告合并獲取測評報告;
53、所述報告修改模塊用于根據修改的調查數據對已生成的測評報告進行更新,獲取終版測評報告;
54、所述報告評估模塊用于用戶對終版測評報告進行模板評估、語法評估和數據關鍵詞評估,獲取評分信息,并根據評分信息調整報告模板、語法規則和序列生成模型。
55、作為本發明所述的一種測評報告自動生成系統的一種優選方案,其中:
56、所述報告生成模塊包括數據報告生成單元和文本報告生成單元;
57、所述數據報告生成單元用于根據獲取調查數據表,根據所述調查數據表獲取數據關鍵詞,并通過數據關鍵詞匹配報告模板并生成測評數據報告;
58、所述文本報告生成單元用于將所述數據關鍵詞輸入genius模型,獲取文本報告,并利用語法規則對文本報告進行檢測調整獲取測評文本報告,合并所述測評數據報告和所述測評文本報告獲取測評報告。
59、本發明的有益效果:本發明通過利用序列生成模型根據調查數據獲取數據關鍵詞,并將數據關鍵詞輸入genius模型中得到文本報告,通過利用語法規則對文本報告進行語法檢測與調整獲取測評文本報告,使測評報告的內容更加靈活和更具針對性,節省了大量人力物力,保障了測評報告的內容質量,并擴大了報告自動生成方法的適用范圍。
60、通過數據關鍵詞匹配報告模板,并根據數據標識符將調查數據替換報告模板中的相應占位符,提高了測評報告的生成效率,并且不同模板的匹配也保障了測評報告的針對性,擴大了報告自動生成方法的適用范圍。
61、在調查數據需要修改時,僅需更新相應的任一調查數據,便能夠根據數據關聯表調整其他相關聯的調查數據,及時更新測評數據報告和測評文本報告,使更新過程更加便捷簡單,節省了大量人力物力。
62、用戶對終版測評報告進行語法評估、數據關鍵詞評估和模板評估,并根據評估結果對語法規則、模板關鍵詞和序列生成模型進行調整,提高了測評報告的生成質量,保障了良好的用戶體驗感。