一種基于多模態學習的自動化市場分析方法
【專利摘要】本發明是一種基于多模態學習的自動化市場分析方法,先對學習裝置進行訓練,然后在實際使用中利用訓練好的學習裝置對市場進行預測;所述學習裝置訓練的方法為:首先采集市場的不同模態信息并對該信息進行標注;然后使用行情數據特征、文字特征的多示例生成方法將底層特征轉換成為多示例包的形式;最后采用能夠利用多種不同模態的多示例多標記學習方法對數據進行融合處理,進行多標記學習。本發明通過對市場的多個側面信息進行獲取,以更為全面的刻畫市場的變動,能夠更為準確的預測市場變化。利用多模態信息進行市場行情預測的方法,實施過程能夠對不同模態的數據信息加以使用,適用性強,效果好。
【專利說明】一種基于多模態學習的自動化市場分析方法
【技術領域】
[0001]在本發明屬于自動化市場分析方法領域,具體地說是基于多模態學習的自動化市場分析方法。
【背景技術】
[0002]通過執行預先設定好的交易策略,利用計算機平臺輸入交易指令的算法交易已經成為目前主流的交易方式之一。考慮到市場微觀結構的構成收到多種制約因素的限制,也即微觀市場行情和多個不同的情報源相關。而目前的多數算法交易方法往往關注市場的一個側面,例如價格或者相關新聞報道,僅僅考慮到單一因素,并且將其作為決定性因素加以考慮,這種方式導致了自動交易算法不能獲取全面的市場信息,從而難以對市場的變化加以把握,這將導致市場變化預測的不準確,甚至對市場的變動作出錯誤的預測,進而使得風險提升。
【發明內容】
[0003]本發明要解決的技術問題是針對現有技術存在的不足,提出使用多模態學習技術對市場的多源制約因素加以后融合,進而提高預測準確度的基于多模態學習的自動化市場分析方法。
[0004]本發明所要解決的技術問題是通過以下的技術方案來實現的,本發明是一種基于多模態學習的自動化市場分析方法,其特點是,先對學習裝置進行訓練,然后在實際使用中利用訓練好的學習裝置對市場進行預測;所述學習裝置訓練的方法為:首先采集市場的不同模態信息并對該信息進行標注;然后使用行情數據特征、文字特征的多示例生成方法將底層特征轉換成為多示例包的形式;最后采用能夠利用多種不同模態的多示例多標記學習方法對數據進行融合處理,進行多標記學習。
[0005]本發明說的學習裝置為支撐向量機SVM或者條件隨機場CRF。
[0006]本發明一種基于多模態學習的自動化市場分析方法技術方案中,進一步優選的技術方案是:所述市場的不同模態信息為市場行情數據或市場描述文字信息。
[0007]本發明一種基于多模態學習的自動化市場分析方法技術方案中,進一步優選的技術方案是:所述學習裝置訓練的具體步驟如下:
A、收集市場的多種模態信息,對搜集的對象進行人工標注;
B、通過多示例生成方法將搜集的市場信息底層特征轉化為多示例包的表示形式:{(X,t),y},其中媒體對象標記為X,相應的其他模態信息記為t,人工標注標記為y ;
C、使用訓練模型M訓練收集的數據,得到相關的模型參數:標記生成式子模型參數α、β 7 ;市場直接行情特征模態信息生成子模型參數β c ;其他模態信息生成式子模型參數β t以及多模態輸入隱變量控制模型參數H。
[0008]本發明一種基于多模態學習的自動化市場分析方法技術方案中,進一步優選的技術方案是:學習裝置的使用步驟如下: a、收集測試市場行情數據特征;
b、通過多示例生成方法將市場行情的底層特征轉化為多示例包的表示形式{(X)}或者{(X,t)};
C、使用訓練模型M處理新市場特征I,輸出預測標記I。
[0009]本發明一種基于多模態學習的自動化市場分析方法技術方案中,進一步優選的技術方案是:所述訓練模型M的生成式概率模型建模方法為:
(1)令市場行情由主題模型生成,其中標記y由參數α通過LatentDirichletAllocat1n子模型和條件多項式分布參數β y生成;
(2)令α'由標記先驗分布決定;
(3)令市場行情特征,即多示例包中的每個示例X都是由參數α'通過LatentDirichlet Allocat1n參數η子模型和條件多項式分布參數β。生成;
(4)令其他模態特征t同樣由參數α'通過Latent Dirichlet Allocat1n子模階段型和條件多項式分布參數Pt生成,即兩種模態特征X和t的主題由同樣的參數α '決定,并且如若其他模態也是多示例包表示,貝1J包中每個示例都均由上述模型生成。
[0010]與現有技術相比,本發明通過對市場的多個側面信息進行獲取,以更為全面的刻畫市場的變動,能夠更為準確的預測市場變化。利用多模態學習技術對市場價格特征、新聞文字特征等多源信息進行融合,能夠更為準確地對市場行情進行預測,提高算法交易策略的性能和準確度,降低風險,使其適用性強,效果好。
【具體實施方式】
[0011]以下進一步描述本發明的具體技術方案,以便于本領域的技術人員進一步地理解本發明,而不構成其權力的限制。
[0012]實施例1,一種基于多模態學習的自動化市場分析方法,先對學習裝置進行訓練,然后在實際使用中利用訓練好的學習裝置對市場進行預測;所述學習裝置訓練的方法為:首先采集市場行情數據或市場描述文字信息等的不同模態的信息并對該信息進行標注;然后使用行情數據特征、文字特征的多示例生成方法將底層特征轉換成為多示例包的形式;最后采用能夠利用多種不同模態的多示例多標記學習方法對數據進行融合處理,進行多標記學習。
[0013]實施例2,實施例1所述的基于多模態學習的自動化市場分析方法中:所述學習裝置訓練的具體步驟如下:
步驟100,收集市場的多種模態信息,對搜集的對象進行人工標注;
步驟101,通過多示例生成方法將搜集的市場信息底層特征轉化為多示例包的表示形式:{(X,t),y},其中媒體對象標記為X,相應的其他模態信息記為t,人工標注標記為y;
步驟102,使用訓練模型M訓練收集的數據,得到相關的模型參數:標記生成式子模型參數α、β y ;市場直接行情特征模態信息生成子模型參數β c ;其他模態信息生成式子模型參數β t以及多模態輸入隱變量控制模型參數H。
[0014]所述訓練模型M的生成式概率模型建模方法為:
(I)(標記-主題子模型部分)令市場行情由主題模型生成,其中標記y由參數α通過Latent Dirichlet Allocat1n (LDA)子模型和條件多項式分布(參數β y)生成; (2)令α'由標記先驗分布決定;
(3)(標記-市場特征子模型部分)令市場行情特征,即多示例包中的每個示例X都是由參數ct丨通過Latent Dirichlet Allocat1n (LDA,參數η )子模型和條件多項式分布(參數β c)生成;
(4)(標記-其他模態特征子模型部分)令其他模態特征t同樣由參數α'通過LatentDirichlet Allocat1n (LDA)子模階段型和條件多項式分布(參數β D生成,即兩種模態特征X和t的主題由同樣的參數α '決定,并且如若其他模態也是多示例包表示,則包中每個示例都均由上述模型生成。
[0015]實施例3,實施例1和實施例2所述的基于多模態學習的自動化市場分析方法中:所述學習裝置訓練的具體步驟如下:學習裝置的使用步驟如下:
步驟200,收集測試市場行情數據特征(如果有其他模態的數據也進行收集);
步驟201,通過多示例生成方法將市場行情的底層特征轉化為多示例包的表示形式{(χ)}或者{(X,t)};
步驟202,使用訓練模型M處理新市場特征I,輸出預測標記I。
[0016]所述訓練模型M的生成式概率模型建模方法為:
(1)(標記-主題子模型部分)令市場行情由主題模型生成,其中標記y由參數α通過Latent Dirichlet Allocat1n (LDA)子模型和條件多項式分布(參數β y)生成;
(2)令α'由標記先驗分布決定;
(3)(標記-市場特征子模型部分)令市場行情特征,即多示例包中的每個示例χ都是由參數ct丨通過Latent Dirichlet Allocat1n (LDA,參數η )子模型和條件多項式分布(參數β c)生成;
(4)(標記-其他模態特征子模型部分)令其他模態特征t同樣由參數α'通過LatentDirichlet Allocat1n (LDA)子模階段型和條件多項式分布(參數β D生成,即兩種模態特征χ和t的主題由同樣的參數α '決定,并且如若其他模態也是多示例包表示,則包中每個示例都均由上述模型生成。
【權利要求】
1.一種基于多模態學習的自動化市場分析方法,其特征在于,先對學習裝置進行訓練,然后在實際使用中利用訓練好的學習裝置對市場進行預測;所述學習裝置訓練的方法為:首先采集市場的不同模態信息并對該信息進行標注;然后使用行情數據特征、文字特征的多示例生成方法將底層特征轉換成為多示例包的形式;最后采用能夠利用多種不同模態的多示例多標記學習方法對數據進行融合處理,進行多標記學習。
2.根據權利要求1所述的基于多模態學習的自動化市場分析方法,其特征在于,所述市場的不同模態信息為市場行情數據或市場描述文字信息。
3.根據權利要求1所述的基于多模態學習的自動化市場分析方法,其特征在于,所述學習裝置訓練的具體步驟如下: A、收集市場的多種模態信息,對搜集的對象進行人工標注; B、通過多示例生成方法將搜集的市場信息底層特征轉化為多示例包的表示形式:{(X,t),y},其中媒體對象標記為X,相應的其他模態信息記為t,人工標注標記為y ; C、使用訓練模型M訓練收集的數據,得到相關的模型參數:標記生成式子模型參數α、β 7 ;市場直接行情特征模態信息生成子模型參數β c ;其他模態信息生成式子模型參數β t以及多模態輸入隱變量控制模型參數H。
4.根據權利要求1所述的基于多模態學習的自動化市場分析方法,其特征在于,學習裝置的使用步驟如下: a、收集測試市場行情數據特征; b、通過多示例生成方法將市場行情的底層特征轉化為多示例包的表示形式{(X)}或者{(X,t)}; C、使用訓練模型M處理新市場特征I,輸出預測標記I。
5.根據權利要求3或4所述的基于多模態學習的自動化市場分析方法,其特征在于,所述訓練模型M的生成式概率模型建模方法為: (1)令市場行情由主題模型生成,其中標記y由參數α通過LatentDirichletAllocat1n子模型和條件多項式分布參數β y生成; (2)令α'由標記先驗分布決定; (3)令市場行情特征,即多示例包中的每個示例X都是由參數α'通過LatentDirichlet Allocat1n參數η子模型和條件多項式分布參數β。生成; (4)令其他模態特征t同樣由參數α'通過Latent Dirichlet Allocat1n子模階段型和條件多項式分布參數Pt生成,即兩種模態特征X和t的主題由同樣的參數α '決定,并且如若其他模態也是多示例包表示,貝1J包中每個示例都均由上述模型生成。
【文檔編號】G06Q30/02GK104318459SQ201410629223
【公開日】2015年1月28日 申請日期:2014年11月11日 優先權日:2014年11月11日
【發明者】詹德川, 周尚晨 申請人:蘇州晨川通信科技有限公司