本發明屬于人工智能領域,涉及文本處理、深度學習、金融技術等,特別是一種基于多模態的銀行間資金面情緒指數預測方法及裝置。
背景技術:
1、防范金融風險需要堅持實施穩健的貨幣政策,保持流動性合理充裕。作為貨幣政策傳導的重要場所,銀行間貨幣市場發揮著市場穩定器的作用。然而,當前該市場存在以下痛點:場外人工交互效率低下、操作風險管控難度大、價格發現規則不成熟等。同時,相較于國際上普遍運用人工智能和大數據技術賦能金融交易,金融市場資金交易對新一代人工智能技術的開放程度較低。因此,解決金融貨幣市場資金交易在詢價的資金交易效率和價格預測等方面存在的問題,重點在于研究和解決資金面預測及報價的關鍵核心技術問題。
2、銀行間市場的資金流動和情緒指數對金融機構和市場參與者具有重要的參考價值。傳統的情緒指數構建方法往往依賴單一數據源,如歷史交易數據或經濟指標數據,難以全面反映市場情緒的復雜變化。同時現有的情緒指數預測方法主要依賴單一模態的數據,這些方法無法充分利用多種數據來源的信息,導致預測準確性較低。為此,本發明提出了一種綜合利用多模態數據的銀行間資金面情緒指數的指標體系和一種能夠綜合多模態數據的情緒指數預測方法。通過綜合利用多模態數據(如歷史新聞數據和宏觀經濟指數數據),并結合人工智能和機器學習技術,能夠更準確地預測銀行間市場的資金面情緒指數,提高市場的透明度和穩定性,從而更好地服務于金融機構和市場參與者。
技術實現思路
1、本發明的目的在于針對現有技術的不足,提供一種基于多模態的銀行間資金面情緒指數預測方法及裝置。
2、本發明的目的是通過以下技術方案來實現的:一種基于多模態的銀行間資金面情緒指數預測方法,包括:
3、獲取金融領域的新聞數據、金融機構內部數據、宏觀經濟指數數據和市場交易數據;
4、從所述金融領域的新聞數據和所述金融機構內部數據中提取文本特征;所述文本特征包括金融機構內部文本數據的量化情感分析結果、歷史新聞進行相似性分析和文本中提及關鍵詞次數;
5、從所述宏觀經濟指數數據和所述市場交易數據中提取宏觀經濟指數特征;所述宏觀經濟指數特征包括銀行操作及宏觀指標水平、市場交易信息指標水平和交易員情緒;
6、將所述文本特征和所述宏觀經濟指數特征進行融合,得到多模態特征;
7、基于所述多模態特征進行資金面情緒指數預測。
8、進一步地,所述從所述金融領域的新聞數據和所述金融機構內部數據中提取文本特征,包括:
9、使用bert模型并結合bilstm模型提取所述金融領域的新聞數據和所述金融機構內部數據中的文本特征。
10、進一步地,所述bert模型經過如下預訓練和微調:
11、在從所述金融領域的新聞數據和所述金融機構內部數據上對bert模型進行預訓練;
12、預訓練后,模型進入微調階段,針對情感感知任務調整輸入表示和輸出層,以優化模型在情感分析上的表現;
13、所述情感感知任務包括金融機構內部文本數據的量化情感分析、歷史新聞進行相似性分析和文本中提及關鍵詞次數分析;
14、所述金融機構內部文本數據的量化情感分析具體為對金融機構內部文本進行情感分析,提取情感分數,以評估機構內部對市場的情緒;
15、所述歷史新聞進行相似性分析運用非官方發布的文件與歷史新聞情緒的比較來刻畫資金面交易情緒,評估當前市場情緒與歷史事件的相似度;
16、所述文本中提及關鍵詞次數分析具體為統計與金融市場相關的關鍵詞出現的頻次,反映市場關注度和情緒傾向。
17、進一步地,所述歷史新聞進行相似性分析中,相似度的計算公式如下:
18、
19、
20、
21、
22、其中,為向量與向量夾角的余弦值:
23、
24、
25、其中,分別表示基于詞頻總數、情感方向、詞頻修正、詞頻均值構建的情感相似性評價模型;、分別表示在時間點t的正向詞匯和負向詞匯的總數,、分別表示在初始時間點0的正向詞匯和負向詞匯的總數,、分別表示在時間點t的正向詞匯和負向詞匯的平均數,、分別表示在初始時間點0的正向詞匯和負向詞匯的平均數;
26、所述文本中提及關鍵詞次數分析中,情緒傾向的計算方式如下:
27、
28、
29、其中,和分別表示基于詞頻總數和均值的情感傾向,、分別表示正向詞匯和負向詞匯的總數,、分別表示正向詞匯和負向詞匯的平均數。
30、進一步地,所述從所述宏觀經濟指數數據和所述市場交易數據中提取宏觀經濟指數特征,包括:
31、使用bilstm模型從所述宏觀經濟指數數據和所述市場交易數據中提取宏觀經濟指數特征。
32、進一步地,所述將所述文本特征和所述宏觀經濟指數特征進行融合,得到多模態特征,包括:
33、將所述文本特征和所述宏觀經濟指數特征按時間對齊、拼接,形成一個綜合的多模態特征表示。
34、進一步地,所述基于所述多模態特征進行資金面情緒指數預測,包括:
35、將多模態特征表示輸入transformer模型,再將經過transformer處理后的特征表示通過線性層進行轉換,輸出資金面情緒指數的預測值。
36、進一步地,所述transformer模型包括多個相同的編碼器;每個編碼器包括自注意力機制和前饋神經網絡,每個自注意力層和前饋層之后都進行了殘差連接,并且使用了層歸一化。
37、本發明還提供了一種基于多模態的銀行間資金面情緒指數預測裝置,包括一個或多個處理器,用于實現上述的一種基于多模態的銀行間資金面情緒指數預測方法。
38、本發明還提供了一種計算機可讀存儲介質,其上存儲有程序,該程序被處理器執行時,用于實現上述的一種基于多模態的銀行間資金面情緒指數預測方法。
39、本發明實施例的有益效果是:本發明提出了一種綜合利用多種數據源和一種基于全局注意力機制的多模態融合模型,以解決單一數據源難以全面反映市場情緒的復雜變化的問題,同時提高銀行間資金面情緒指數的預測能力。本發明綜合考慮了金融領域的歷史新聞文本、金融機構內部數據和宏觀經濟指數、市場交易數據兩種模態數據,并使用全局注意力機制對歷史新聞文本、金融機構內部數據和宏觀經濟指數、市場交易數據的特征進行融合,充分利用文本中的信息和經濟指數數據,以提高模型的預測結果,獲得更好的多模態融合效果。首先,對于金融新聞文本的處理,本發明建立了一個金融新聞語料庫,并利用大型語言模型逐句分析金融新聞文本中的情感表達,以建立情感感知型摘要數據集;接下來,對bert模型進行領域自適應預訓練,并利用預訓練的bert結合bilstm和基于注意力機制的指針網絡,在情感感知型金融新聞摘要數據集上微調模型。訓練完成后,直接使用訓練好的注意力矩陣獲得段落級別的多文本融合向量表示,并使用平均池化進行融合。最后,將得到的文本特征進行拼接,輸入到bilstm模型中,通過前向和后向lstm層進一步提取得到文本特征。同獲取宏觀經濟指數數據,建立金融數據庫。隨后,利用bilstm對每一個指數進行分析,得到對應的數值特征。最終,將提取的文本特征和宏觀經濟指數特征按時間對齊、拼接,形成一個綜合的多模態特征表示,輸入到transformer模型中,生成最終的資金面情緒指數預測值。該方法有效提升了市場情緒的全面感知和預測能力。還有特征融合過程中,attention機制動態調整各模態特征的重要性權重。最終,將多模態特征通過自注意力機制進行深層次處理和交互,從而為投資決策提供可靠的情緒預測,同時降低計算資源需求。