本技術屬于人工智能,具體為ai技術將知識隱藏于文本文件獨立或組合閱讀的方法。
背景技術:
1、傳統電子文件在閱讀時,閱讀的內容僅限于文件本身,不能對文件本身做一些拓展或者關聯匹配,并且相對于網頁而言,需要在維護的時候添加備注,不能自動備注、標記或者判斷;并且文件閱讀都是在線匹配查詢,不能夠離線查看。
技術實現思路
1、本發明的目的在于提供ai技術將知識隱藏于文本文件獨立或組合閱讀的方法,以解決上述背景技術中提出的一個或多個問題。
2、為實現上述目的,本發明提供如下技術方案:基于ai技術將知識隱藏于文本文件獨立或組合閱讀的方法,包括以下步驟:
3、步驟s1:設置知識匹配庫;
4、步驟s2:分析判斷上傳的文件類型,若文件類型不為標準的ofd文件,則轉換為標準的ofd文件;
5、步驟s3:利用nlp對文件進行分析,獲取文件所屬領域類型,若不能判斷文件的領域類型,則匹配知識匹配庫中的通用數據;
6、步驟s4:根據文件領域類型,解析并獲取文件內容信息,得到需要擴展的文本隊列,將文本隊列輸入到知識模型中,獲取到一一對應的?key、value鍵值對模型;
7、步驟s5:記錄原文的內容(key)以及原文的解釋說明(value)之間的關聯關系信息按照格式進行排版,形成知識庫xml文件,生成ofd的拓展文件包,生成新的ofd文件,新的ofd文件可用于在線或離線傳輸并閱讀;
8、步驟s6:利用ofd閱讀器加載ofd文件的原文件進行閱讀,若原文件存在知識拓展文件包,則解析知識拓展文件包,并將原文文件指定的內容標識顯示,并采用不同的顯示模式對文件的知識匹配庫進行展示閱讀。
9、優選的,所述知識匹配庫的字段包括所屬領域、書面的描述、具體的含義與內容解釋、出處、內容描述。
10、優選的,所述步驟s2中分析判斷上傳的文件類型,如果是pdf、ppt、pptx、doc、docx、xls、xlxs、cad、true、dlf文件時,將其轉換為ofd文件;如果是圖片或者掃描件文件時,將文件進行ocr生成雙層的ofd文件;如果是音頻、視頻等文件,則將其作為資源填充到ofd的框架中,并將其中的文字識別出來,作為音視頻的字幕同步進行展示。
11、優選的,所述文件所屬領域類型包括醫療行業、科技行業、教育行業、政法、化學;所述通用數據是指:不同領域之間相同的行業解釋信息。
12、優選的,所述步驟s4中分析文件的具體步驟為:
13、步驟s41:解析文件內容信息,對詞組,詞條、相關語句進行語義分析;
14、步驟s42:獲得需要進行擴展的文本隊列;
15、步驟s43:將上述文本隊列輸入到知識模型中,獲取到一一對應的key、value模型;
16、步驟s44:將步驟s43中生成的擴展文本保存生成新的ofd文件。
17、優選的,所述擴展文本為用于記錄原文的內容以及原文的解釋說明之間的關聯關系。
18、優選的,所述步驟s5中采用ofd閱讀器進行閱讀的具體步驟如下:
19、步驟s51:利用ofd閱讀器加載ofd原文基本內容,并判斷原文是否存在拓展文件;
20、步驟s52:若原文存在拓展文件,則解析拓展文件,并將原文中指定內容進行標識顯示,指定內容包括原文的單詞,詞條,語句;
21、步驟s53:并將擴展文件中內容以多種形式展示在ofd原文中,展現形式包括鼠標懸浮展示,ofd原文右側批注內容描述;
22、步驟s54:在原文中繪制菜單展示全文中包含的名字及解釋。
23、優選的,對知識匹配庫中的內容操作包括編輯、修改、擦除;ofd原文展現的拓展文件內容根據知識匹配庫的更新進行實時更新調整。
24、優選的,在閱讀過程中,能夠選擇不同模式,控制展示內容是否動態顯示或隱藏。
25、優選的,當原文ofd文件是組合文件時,組合文件目錄上能夠展示是否存在隱藏知識的內容信息。
26、與現有技術相比,本發明的有益效果是:
27、(1)本發明利用ai技術和ofd拓展文件有效地進行了融合,創造了一種將知識隱藏在文件中的方法,通過這種技術對文件進行加工使得原來的文件附著了大量的知識內容,提升了閱讀者的閱讀體驗,提高了閱讀效率;
28、(2)本發明通過ofd轉換技術可以將各類文件進行轉換,能夠使得將知識隱藏在文件中的范圍擴大,適用于更多的文件類型;
29、(3)本發明支持離線閱讀,文件在經過加工以后可以將知識附著在文件上,無需其他在線的知識庫或者任何后臺的支持。
1.基于ai技術將知識隱藏于文本文件獨立或組合閱讀的方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的基于ai技術將知識隱藏于文本文件獨立或組合閱讀的方法,其特征在于:所述知識匹配庫的字段包括所屬領域、書面的描述、具體的含義與內容解釋、出處、內容描述。
3.根據權利要求1所述的基于ai技術將知識隱藏于文本文件獨立或組合閱讀的方法,其特征在于:所述步驟s2中分析判斷上傳的文件類型,如果是pdf、ppt、pptx、doc、docx、xls、xlxs、cad、true、dlf文件時,將其轉換為ofd文件;如果是圖片或者掃描件文件時,將文件進行ocr生成雙層的ofd文件;如果是音頻、視頻等文件,則將其作為資源填充到ofd的框架中,并將其中的文字識別出來,作為音視頻的字幕同步進行展示。
4.根據權利要求1所述的基于ai技術將知識隱藏于文本文件獨立或組合閱讀的方法,其特征在于:所述文件所屬領域類型包括醫療行業、科技行業、教育行業、政法、化學;所述通用數據是指:不同領域之間相同的行業解釋信息。
5.根據權利要求1所述的基于ai技術將知識隱藏于文本文件獨立或組合閱讀的方法,其特征在于,所述步驟s4中分析文件的具體步驟為:
6.根據權利要求5所述的ai技術將知識隱藏于文本文件獨立或組合閱讀的方法,其特征在于:所述步驟s44中擴展文本為用于記錄原文的內容以及原文的解釋說明之間的關聯關系。
7.根據權利要求1所述的ai技術將知識隱藏于文本文件獨立或組合閱讀的方法,其特征在于,所述步驟s5中采用ofd閱讀器進行閱讀的具體步驟如下:
8.根據權利要求1所述的ai技術將知識隱藏于文本文件獨立或組合閱讀的方法,其特征在于:對知識匹配庫中的內容操作包括編輯、修改、擦除;ofd原文展現的拓展文件內容根據知識匹配庫的更新進行實時更新調整。
9.根據權利要求7所述的ai技術將知識隱藏于文本文件獨立或組合閱讀的方法,其特征在于:在閱讀過程中,能夠選擇不同模式,控制展示內容是否動態顯示或隱藏。
10.根據權利要求1所述的ai技術將知識隱藏于文本文件獨立或組合閱讀的方法,其特征在于:當原文ofd文件是組合文件時,組合文件目錄上能夠展示是否存在隱藏知識的內容信息。