本發明屬于空中交通管制的航班時刻優化,具體涉及一種基于深度強化學習的機場群航班時刻優化方法及系統。
背景技術:
1、長遠來看,航空運輸需求將會呈現持續增長趨勢,但機場容量、航路點容量等空域資源是有限的,隨之而來的是,航班時刻需求增加,但機場沒有充足的可用資源,二者之間的矛盾將導致交通擁堵和航班延誤等情況的出現。
2、機場群是在一定地區范圍內各機場與城市間形成的空間集群,以一個或多個樞紐機場為關鍵核心。伴隨著城市地區的擴張,機場形成了相互制約的機場群。空域資源在機場群之間高度共享,所以需要協同發展、共同調控。以機場群為核心調控空域資源分配,能夠使機場資源得到更加科學合理的利用,將促進機場群協同發展。
技術實現思路
1、本發明的目的是提供一種基于深度強化學習的機場群航班時刻優化方法及系統。
2、為了解決上述技術問題,本發明第一方面提供了一種基于深度強化學習的機場群航班時刻優化方法,包括:
3、對實際的機場群航班運行數據預處理,構建航班運行數據集;
4、馬爾科夫過程建模,確定智能體、狀態空間、動作空間、獎勵函數、環境模擬器;
5、構建基于dqn的機場群航班時刻優化模型;
6、利用航班實際運行數據集,驗證優化模型的合理性。
7、本發明的第二方面提供了一種基于深度強化學習的機場群航班時刻優化系統,包括:
8、航班運行數據集構建模塊,用于對實際的機場群航班運行數據預處理,構建航班運行數據集;
9、馬爾科夫過程建模模塊,用于進行馬爾科夫過程建模,確定智能體、狀態空間、動作空間、獎勵函數、環境模擬器;
10、優化模型構建模塊,用于構建基于dqn的機場群航班時刻優化模型;
11、合理性驗證模塊,用于利用航班實際運行數據集,驗證優化模型的合理性。
12、本發明的有益效果是:
13、本發明的基于深度強化學習的機場群航班時刻優化方法使用dqn優化航班時刻表,用深度神經網絡來代替傳統強化學習的表格,結合了強化學習的決策能力與深度學習的數據分析能力,使得處理大規模數據空間的任務更加高效;dqn能夠進行長期規劃,考慮未來的獎勵,相較于傳統的啟發式算法能夠更好地避免陷入局部最優解,有利于指導現實航班運行時刻優化。
14、本發明的其他特征和優點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發明而了解。本發明的目的和其他優點在說明書、權利要求書以及附圖中所特別指出的結構來實現和獲得。
15、為使本發明的上述目的、特征和優點能更明顯易懂,下文特舉較佳實施例,并配合所附附圖,作詳細說明如下。
1.一種基于深度強化學習的機場群航班時刻優化方法,其特征在于,包括:
2.如權利要求1所述的機場群航班時刻優化方法,其特征在于,
3.如權利要求2所述的機場群航班時刻優化方法,其特征在于,
4.如權利要求3所述的機場群航班時刻優化方法,其特征在于,
5.如權利要求4所述的機場群航班時刻優化方法,其特征在于,
6.如權利要求5所述的機場群航班時刻優化方法,其特征在于,
7.一種基于深度強化學習的機場群航班時刻優化系統,其特征在于,包括: