本技術屬于人工智能和自然語言處理,具體涉及一種基于大語言模型與知識圖譜協同的智能問答方法。
背景技術:
1、隨著生成式ai技術的快速發展,基于大語言模型的智能問答系統已經成為自然語言處理領域的重要研究熱點。此類系統旨在通過自然語言形式的提問,結合上下文環境為用戶提供準確且可信的回答,從而改進用戶的搜索體驗。智能問答系統主要由三個模塊構成:問題分析模塊、信息檢索模塊和答案抽取模塊。這三個模塊協同工作,以確保從用戶的提問到最終答案的生成流程高效且準確。
2、智能問答系統的發展大致經歷了幾個階段,包括基于大規模文檔集的問答系統、基于問題答案對(如faq和cqa)的問答系統、基于知識圖譜的問答系統以及基于大規模語言模型的問答系統。每個階段的技術都有其特定的優勢和局限性。例如,基于大規模文檔集的問答系統可以訪問大量的非結構化數據,但對復雜問題的理解不夠準確;基于問題答案對的問答系統雖然能提供高質量的答案,但獲取和維護這些問答對的成本較高,且在面對多樣化的用戶提問時表現不佳;基于知識圖譜的問答系統能夠提供結構化和詳細的答案,但在構建和維護知識圖譜時成本高昂;而基于大規模語言模型的問答系統如chatgpt,則以其強大的自然語言理解和生成能力而聞名,但在垂直領域知識問答時存在準確性問題。
3、盡管智能問答系統已經在意圖識別、信息檢索和答案生成等方面取得了顯著進步,然而現有的智能問答系統在處理需要多步推理和多種推理技巧的問題時,如多跳推理、計數等,將復雜問題分解為簡單問題并準確描述其邏輯推理過程是一大難題。大語言模型雖然具有強大的語言理解和內容生成能力,但其生成的內容缺乏可解釋性,且存在事實上的錯誤。同時,知識圖譜雖然具有高度結構化和可解釋性,但是構建成本高,而且在自然語言處理方面相對較弱。大語言模型在更新知識時較慢,并且難以整合長尾知識,還存在數據泄露的風險。此外,訓練和推理的成本高昂,這限制了它們獲取新知識的能力。
技術實現思路
1、本技術提供了一種基于大語言模型與知識圖譜協同的智能問答方法,以解決復雜問題的可解釋性差的問題。
2、本技術所采用的技術方案為:
3、本技術實施例提供一種基于大語言模型與知識圖譜協同的智能問答方法,包括:
4、將復雜問題拆解為多個簡單問題,分析所述簡單問題與基本函數的關聯程度,以形成多跳推理路徑;
5、基于大模型的多任務學習框架對所述簡單問題自動抽取結構化信息,以構建知識圖譜;
6、構建基于邏輯推理大模型的累積推理學習框架,對所述知識圖譜基于所述多跳推理路徑形成的過程結果進行迭代驗證,以修正推理路徑,直至推理出正確答案。
7、本技術提供的一種基于大語言模型與知識圖譜協同的智能問答方法還包括下述附加技術特征:所述將復雜問題拆解為多個簡單問題,具體為:
8、基于通用基礎大模型進行微調訓練,以強化大模型的邏輯推理能力,使用指令微調對大模型的輸出進行條件約束,確保所述復雜問題拆分后的每個子問題僅包含一個三元組,這樣每個所述子問題就用一個基本函數進行求解,并且每個所述子問題僅包含單一的關系,從而成為所述簡單問題。
9、根據本技術的一個實施例,所述分析所述簡單問題與基本函數的關聯程度,以形成多跳推理路徑,具體為:
10、將每個所述簡單問題視為一個智能體,使用多智能體強化學習的基本函數調用模型,在所述簡單問題和基本函數之間建立匹配關系,優化選擇策略;
11、基于逆二叉樹的可變長度推理路徑描述方法,將所述復雜問題的程序建模拆解為一個多步驟程序,利用逐步的中間程序求解來模擬回答問題的復雜邏輯推理過程。
12、根據本技術的一個實施例,基于大模型的多任務學習框架對所述簡單問題自動抽取結構化信息,以構建知識圖譜,具體為:
13、將所述復雜問題拆解為多個所述簡單問題,并進行向量化表示,將向量化后的所述簡單問題與向量庫內容進行語義相似度匹配,查找出與所述簡單問題語義最接近的詞,嵌入所對應的文本塊,對檢索的文本塊自動抽取結構化信息;
14、基于大模型的多任務學習框架,通過人類指令來指導輸出,對信息抽取任務進行統一建模,并捕獲任務間的依賴關系,給定源文本和特定任務的指令后,對所述大模型進行訓練以生成表示所需輸出結構及其相應標簽的令牌序列,利用圖神經網絡構建領域知識圖譜,利用圖神經網絡的信息傳播機制學習數據間的語義關系。
15、根據本技術的一個實施例,所述構建基于邏輯推理大模型的累積推理學習框架,對所述知識圖譜基于所述多跳推理路徑形成的過程結果進行迭代驗證,以修正推理路徑,直至推理出正確答案,具體為:
16、基于所述復雜問題生成的所述多跳推理路徑,不同的所述知識圖譜給出各自的邏輯推理路徑;
17、引入決策者和驗證者,所述決策者負責根據當前上下文選擇潛在的推理路徑或生成可能的結果,所述驗證者則根據累積的上下文判斷當前推理路徑的準確性,并評估當前結果是否為最終的推理結果;
18、每個處理單元的輸出作為下一個單元的輸入,每個單元的推理結果累積起來,利用所述邏輯推理大模型對每個所述處理單元的輸出進行迭代驗證,確保在推理每個中間環節都能評估當前的推理結果;
19、建立反饋循環機制,使所述邏輯推理大模型能夠根據驗證結果動態調整推理路徑。
20、根據本技術的一個實施例,所述給定源文本和特定任務的指令后,對所述大模型進行訓練以生成表示所需輸出結構及其相應標簽的令牌序列,具體為:
21、設計描述性指令,所述指令幫助所述大模型理解不同的信息提取任務,并采用包括所有候選類別的選項機制作為輸出空間的約束;任務指令提供足夠的信息,以確保所述大模型能夠從輸入文本中提取相關信息并生成所需的輸出結構,包括要提取的信息類型、輸出結構的格式以及在提取過程中需要遵循的任何附加約束或規則;
22、在訓練期間,提供所有任務的指令,并根據每個任務的一組標記數據對模型進行微調;
23、對于所述源文本,設計的所述描述性指令將引導預先訓練的語言模型生成目標結構及其相應的類型,所述模型將以自然語言的形式生成目標結構,同時生成與之相對應的標簽;
24、每個任務實例都包含四個屬性:任務指令、選項、輸入文本和輸出,任務指令描述了如何從輸入文本中提取相關信息并生成所需的輸出結構;選項是任務的輸出標簽約束;輸入文本是所述任務實例的輸入句子,而輸出則是從樣本的原始標簽轉換而來的句子;
25、最終生成的令牌序列用于構建所述知識圖譜。
26、根據本技術的一個實施例,所述任務指令描述了如何從輸入文本中提取相關信息并生成所需的輸出結構;所述選項是任務的輸出標簽約束;所述輸入文本是所述任務實例的輸入句子,所述輸出是從樣本的原始標簽轉換而來的句子。
27、一種包含指令的計算機程序產品,當其在設備上運行時,使得設備執行實現基于大語言模型與知識圖譜協同的智能問答方法中的步驟。
28、一種計算機可讀存儲介質,其上存儲有程序,該程序被處理器執行時實現基于大語言模型與知識圖譜協同的智能問答方法中的步驟。
29、一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的程序,所述處理器執行所述程序時實現基于大語言模型與知識圖譜協同的智能問答方法中的步驟。
30、由于采用了上述技術方案,本技術所取得的有益效果為:
31、1.本技術將大模型與知識圖譜深度協同,構建了基于知識圖譜檢索增強生成模型的智能問答系統。在問題分析環節,基于大模型思維鏈對復雜問題拆解,并用逆二叉樹描述其邏輯推理過程;在信息檢索環節,基于大模型多任務調優指令模型對檢索到的文本進行信息抽取,并自動構建知識圖譜;在答案生成環節,利用累積推理學習框架根據問題描述從知識圖譜中推理正確的答案,從而改變現有知識問答范式,提升復雜問題的邏輯解析能力、知識結構化表示能力和多跳問答的過程推理能力,實現從海量文本庫中推理出可解釋性答案。
32、2.本技術通過使用基于大模型思維鏈的復雜問題邏輯推理過程描述方法,實現了將復雜問題轉化為簡單問答推理組合問題,提升了復雜問題多跳推理回答的準確率。
33、3.本技術使用大模型提升知識圖譜構建精度,構建了基于大模型多任務指令調優的領域知識圖譜,增強了大模型掛載外部數據的問答范式可解釋性。
34、4.本技術搭建了基于邏輯推理大模型的累積推理學習框架,解決了知識謬誤問題,并降低了多跳推理問答中的推理誤差。
35、5.本技術構建了大模型和知識圖譜協同驅動的新型智能問答系統,該系統具備了更加深入的語義理解能力、強大的知識表示和推理能力,實現了復雜問題的可解釋性推理,進一步推動了該領域的發展。