技術編號:39721091
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。本發明屬于自然語言處理、多模態,尤其涉及一種聯合蘊含推理結構生成的可解釋性多模態多跳推理問答方法。背景技術、多模態多跳問題回答(mmqa)是一項復雜的任務,涉及到多個輸入來源,如文本、表格和圖像。它需要通過不同的模態進行推理,以生成準確和完整的答案。目前,大多數多模態多跳問題回答方法采用將多模態信息轉化為文本描述的方法,即通過將圖像通過圖像標題模型進行轉換,將表格通過自然語言描述進行轉換,然后使用大規模語言模型(llms)生成答案。這種方法的顯著優點是可以利用llms強大的語言理解和生成能力,...
注意:該技術已申請專利,請尊重研發人員的辛勤研發付出,在未取得專利權人授權前,僅供技術研究參考不得用于商業用途。
該專利適合技術人員進行技術研發參考以及查看自身技術是否侵權,增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。