基于多模態(tài)大模型的文檔生成方法、裝置、設(shè)備及介質(zhì)與流程

文檔序號(hào)：40533275發(fā)布日期：2024-12-31 13:50閱讀：10來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

基于多模態(tài)大模型的文檔生成方法、裝置、設(shè)備及介質(zhì)與流程

本申請(qǐng)涉及數(shù)據(jù)處理領(lǐng)域，尤其涉及一種基于多模態(tài)大模型的文檔生成方法、裝置、設(shè)備及介質(zhì)。

背景技術(shù)：

1、在金融領(lǐng)域中，營銷類場景的ppt都是基于ppt模板結(jié)構(gòu)的方法生成，用戶通過將ppt文案內(nèi)容結(jié)構(gòu)化，在特定字段，例如主標(biāo)題、副標(biāo)題、內(nèi)容、數(shù)據(jù)等，填入相應(yīng)的內(nèi)容，再通過字段的名稱和個(gè)數(shù)匹配相應(yīng)的ppt模板。

2、現(xiàn)有ppt生成方法雖然省去了用戶制作ppt的大部分過程，但是ppt的內(nèi)容都需要手動(dòng)輸入；且由于模板個(gè)數(shù)有限制，而ppt內(nèi)容的形式多種多樣，同時(shí)受限于ppt內(nèi)容的字?jǐn)?shù)、ppt內(nèi)容的形式，容易導(dǎo)致ppt模板和ppt內(nèi)容不匹配的問題，需要人為對(duì)ppt模板或ppt內(nèi)容進(jìn)行調(diào)整，使得ppt生成效率低下。

3、因此，如何提高演示文檔的生成效率成為目前亟待解決的技術(shù)問題。

技術(shù)實(shí)現(xiàn)思路

1、本申請(qǐng)?zhí)峁┝艘环N基于多模態(tài)大模型的文檔生成方法、裝置、設(shè)備及介質(zhì)，旨在提高演示文檔的生成效率。

2、第一方面，本申請(qǐng)?zhí)峁┮环N基于多模態(tài)大模型的文檔生成方法，所述基于多模態(tài)大模型的文檔生成方法包括以下步驟：

3、基于多模態(tài)大模型，對(duì)輸入文本進(jìn)行大綱內(nèi)容提取，并對(duì)提取的大綱內(nèi)容進(jìn)行結(jié)構(gòu)化處理，輸出結(jié)構(gòu)化文本；

4、基于文本解析器，對(duì)所述結(jié)構(gòu)化文本進(jìn)行內(nèi)容解析，獲得所述結(jié)構(gòu)化文本對(duì)應(yīng)的文本屬性；

5、基于文檔生成模型，對(duì)所述結(jié)構(gòu)化文本以及所述結(jié)構(gòu)化文本對(duì)應(yīng)的文本屬性進(jìn)行自適應(yīng)元素匹配，生成目標(biāo)文檔。

6、第二方面，本申請(qǐng)還提供一種基于多模態(tài)大模型的文檔生成裝置，所述基于多模態(tài)大模型的文檔生成裝置包括：

7、結(jié)構(gòu)化文本輸出模塊，基于多模態(tài)大模型，對(duì)輸入文本進(jìn)行大綱內(nèi)容提取，并對(duì)提取的大綱內(nèi)容進(jìn)行結(jié)構(gòu)化處理，輸出結(jié)構(gòu)化文本；

8、文本屬性解析模塊，用于基于文本解析器，對(duì)所述結(jié)構(gòu)化文本進(jìn)行內(nèi)容解析，獲得所述結(jié)構(gòu)化文本對(duì)應(yīng)的文本屬性；

9、演示文稿生成模塊，用于基于文檔生成模型，對(duì)所述結(jié)構(gòu)化文本以及所述結(jié)構(gòu)化文本對(duì)應(yīng)的文本屬性進(jìn)行自適應(yīng)元素匹配，生成目標(biāo)文檔。

10、第三方面，本申請(qǐng)還提供一種計(jì)算機(jī)設(shè)備，所述計(jì)算機(jī)設(shè)備包括處理器、存儲(chǔ)器、以及存儲(chǔ)在所述存儲(chǔ)器上并可被所述處理器執(zhí)行的計(jì)算機(jī)程序，其中所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí)，實(shí)現(xiàn)如上述的基于多模態(tài)大模型的文檔生成方法的步驟。

11、第四方面，本申請(qǐng)還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序，其中所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)，實(shí)現(xiàn)如上述的基于多模態(tài)大模型的文檔生成方法的步驟。

12、本申請(qǐng)?zhí)峁┮环N基于多模態(tài)大模型的文檔生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)，本申請(qǐng)方法包括基于多模態(tài)大模型，對(duì)輸入文本進(jìn)行大綱內(nèi)容提取，并對(duì)提取的大綱內(nèi)容進(jìn)行結(jié)構(gòu)化處理，輸出結(jié)構(gòu)化文本；基于文本解析器，對(duì)所述結(jié)構(gòu)化文本進(jìn)行內(nèi)容解析，獲得所述結(jié)構(gòu)化文本對(duì)應(yīng)的文本屬性；基于文檔生成模型，對(duì)所述結(jié)構(gòu)化文本以及所述結(jié)構(gòu)化文本對(duì)應(yīng)的文本屬性進(jìn)行自適應(yīng)元素匹配，生成目標(biāo)文檔。通過上述方式，本申請(qǐng)通過結(jié)合多模態(tài)大模型和文本解析器，實(shí)現(xiàn)了對(duì)輸入文本的自動(dòng)化大綱提取和結(jié)構(gòu)化處理，進(jìn)而文檔生成模型通過自適應(yīng)元素匹配技術(shù)，將結(jié)構(gòu)化文本和其屬性智能匹配到最合適的演示文檔模板上，不僅減少了手動(dòng)調(diào)整模板和內(nèi)容的時(shí)間，還增加了演示文檔模板的多樣性，從而顯著提高了演示文檔的生成效率和成果質(zhì)量。

技術(shù)特征：

1.一種基于多模態(tài)大模型的文檔生成方法，其特征在于，所述方法包括：

2.根據(jù)權(quán)利要求1所述的基于多模態(tài)大模型的文檔生成方法，其特征在于，所述基于多模態(tài)大模型，對(duì)輸入文本進(jìn)行大綱內(nèi)容提取，并對(duì)提取的大綱內(nèi)容進(jìn)行結(jié)構(gòu)化處理，輸出結(jié)構(gòu)化文本，包括：

3.根據(jù)權(quán)利要求1所述的基于多模態(tài)大模型的文檔生成方法，其特征在于，所述基于多模態(tài)大模型，對(duì)輸入文本進(jìn)行大綱內(nèi)容提取，并對(duì)提取的大綱內(nèi)容進(jìn)行結(jié)構(gòu)化處理，輸出結(jié)構(gòu)化文本之前，還包括：

4.根據(jù)權(quán)利要求3所述的基于多模態(tài)大模型的文檔生成方法，其特征在于，所述基于第一數(shù)據(jù)集，對(duì)圖片分類模型進(jìn)行圖像單模態(tài)訓(xùn)練，直至所述圖片分類模型的損失值收斂，包括：

5.根據(jù)權(quán)利要求3所述的基于多模態(tài)大模型的文檔生成方法，其特征在于，所述基于第二數(shù)據(jù)集，對(duì)所述圖片分類模型和預(yù)訓(xùn)練的第一語言模型進(jìn)行圖像文本多模態(tài)訓(xùn)練，直至所述圖片分類模型和所述第一語言模型的損失值收斂，包括：

6.根據(jù)權(quán)利要求1所述的基于多模態(tài)大模型的文檔生成方法，其特征在于，所述基于文檔生成模型，對(duì)所述結(jié)構(gòu)化文本以及所述結(jié)構(gòu)化文本對(duì)應(yīng)的文本屬性進(jìn)行自適應(yīng)元素匹配，生成目標(biāo)文檔之前，還包括：

7.根據(jù)權(quán)利要求1所述的基于多模態(tài)大模型的文檔生成方法，其特征在于，所述輸入文本包括圖片文本、文字文本以及prompt文本中的一種或多種。

8.一種基于多模態(tài)大模型的文檔生成裝置，其特征在于，所述基于多模態(tài)大模型的文檔生成裝置包括：

9.一種計(jì)算機(jī)設(shè)備，其特征在于，所述計(jì)算機(jī)設(shè)備包括處理器、存儲(chǔ)器、以及存儲(chǔ)在所述存儲(chǔ)器上并可被所述處理器執(zhí)行的計(jì)算機(jī)程序，其中所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí)，實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的基于多模態(tài)大模型的文檔生成方法的步驟。

10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其特征在于，所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序，其中所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)，實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的基于多模態(tài)大模型的文檔生成方法的步驟。

技術(shù)總結(jié)
本申請(qǐng)?zhí)峁┮环N基于多模態(tài)大模型的文檔生成方法、裝置、設(shè)備及介質(zhì)，涉及數(shù)據(jù)處理領(lǐng)域。本申請(qǐng)方法通過結(jié)合多模態(tài)大模型和文本解析器，實(shí)現(xiàn)了對(duì)輸入文本的自動(dòng)化大綱提取和結(jié)構(gòu)化處理，進(jìn)而文檔生成模型通過自適應(yīng)元素匹配技術(shù)，將結(jié)構(gòu)化文本和其屬性智能匹配到最合適的演示文檔模板上，不僅減少了手動(dòng)調(diào)整模板和內(nèi)容的時(shí)間，還增加了演示文檔模板的多樣性，從而顯著提高了演示文檔的生成效率和成果質(zhì)量。

技術(shù)研發(fā)人員：舒暢,陳遠(yuǎn)旭
受保護(hù)的技術(shù)使用者：平安科技（深圳）有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/30

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：舒暢,陳遠(yuǎn)旭
技術(shù)所有人：平安科技（深圳）有限公司
我是此專利的發(fā)明人

上一篇：一種預(yù)防及治療放射性腸炎的天然化合物
上一篇：一種用于染紗廠紗線自動(dòng)裝卸設(shè)備的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

基于多模態(tài)大模型的文檔生成方法、裝置、設(shè)備及介質(zhì)與流程

基于多模態(tài)大模型的文檔生成方法、裝置、設(shè)備及介質(zhì)與流程