本發明涉及一種航天器任務規劃方法,尤其涉及一種基于狀態目標性的啟發式航天器任務規劃方法,屬于航空航天
技術領域:
。
背景技術:
:航天領域是二十一世紀世界技術發展的主要領域之一。由于航天任務中航天器一般距離地球遠、飛行時間長、所處環境動態多變等特點,導致航天器的操作和控制存在極大的挑戰,例如通信的長時延問題、長期可靠性問題、實時控制問題等。隨著航天領域的發展,航天器高度依賴地面控制的方式越來越不適應日益復雜的航天活動。因此,需要航天器自主完成任務規劃,減少對地面站點的依賴,提高航天任務規劃的靈敏度和自主性。航天器在軌自主任務規劃技術是解決遠距離自主運行問題的一項關鍵技術。航天器根據空間環境的感知和認識及本身的能力和狀態,利用智能規劃理論技術,依據一段時間內的任務目標,自動地生成一組時間有序動作序列,并實時監測執行過程。深空1號采用基于啟發式調度測試系統(HSTS),它將狀態變量描述為時間線的形式,根據時間線的結構功能特點將規劃與調度有機地結合在一起,能夠準確的找到滿足所有資源和時間約束的可行解。歐空局采用基于時間線的規劃和約束滿足技術,在MEXAR2的基礎上,開發出了APSI(AdvancedPlanningandSchedulingInitiative)平臺,將規劃領域模型描述為并行的時間線集合,在規劃過程中對時間線間同步性約束進行推理和傳播。上述規劃系統雖然均能夠進行在軌自主任務規劃,但是仍存在可以進步的空間。例如,APSI的局限性為它的設計目的在于解決復雜度較高的問題,缺少對于一般問題的普適性;深空一號中將全部狀態變量都表示為時間線的形式,造成搜索空間的急劇膨脹,并且單一的搜索模式會引發冗余的規劃操作,大大增加搜索規劃的時間,影響規劃求解的效率。技術實現要素:針對航天器任務規劃問題中系統約束復雜及冗余的規劃操作引發的規劃效率低下的問題,本發明公開的一種基于狀態目標性的啟發式航天器任務規劃方法要解決的技術問題是,提高真實航天器任務規劃中問題搜索和求解速率,在更短的時間內獲取合理的規劃解,解決規劃操作引發的規劃效率低下的問題。本發明的目的是通過下述技術方案實現的:本發明公開的一種基于狀態目標性的啟發式航天器任務規劃方法,針對航天器系統約束復雜和系統狀態信息互相耦合特點,利用多維時間線刻畫航天器的多個并行子系統。并根據子系統約束特點,對滿足時間線參量化篩選條件的時間線進行時間線參量化處理,削減問題的搜索空間。同時,根據狀態的目標性信息進行狀態和缺陷挑選的啟發式設計,通過對最高權值的狀態和最高評價值的缺陷進行優先挑選確保任務目標的實現,提高航天器任務規劃效率。所述的時間線參量化篩選條件指當其中一個狀態變量Ai的狀態除與自身狀態存在約束外,僅與另一個狀態變量Aj(i≠j)間存在約束關系,所述的狀態變量Ai即為滿足時間線參量化篩選條件的狀態變量。本發明公開的一種基于狀態目標性的啟發式航天器任務規劃方法,包括如下步驟:步驟一:綜合考慮航天器結構、任務需求、設備狀態和航天器能力四項因素,對航天器的構成、資源、分系統功能以及需要滿足的各種約束條件進行描述。所述的各種約束條件根據實際航天器系統而定,包括因果約束、時間約束和資源約束。針對航天器系統約束復雜和系統狀態信息互相耦合的特點,利用多維時間線刻畫航天器的多個并行子系統,通過時間線的耦合關系描述系統的復雜約束及系統間依賴關系,形成多維耦合時間線的模型架構,對各并行子系統的行為隨時間的演化和各并行子系統的依賴關系進行描述。步驟二:選取模型中滿足時間線參量化篩選條件的狀態變量Ai進行時間線參量化處理,將狀態變量Ai當作狀態變量Aj的參量進行建模,用于縮減問題搜索空間,提高規劃的求解速率。各并行子系統分別由一個狀態變量進行表示,每個狀態變量都由時間線的形式進行描述,各并行子系統對應的狀態變量為狀態變量A1、狀態變量A2、狀態變量A3……狀態變量An。所述的時間線參量化篩選條件指當其中一個狀態變量Ai的狀態除與自身狀態存在約束外,僅與另一個狀態變量Aj(i≠j)間存在約束關系,所述的狀態變量Ai即為滿足時間線參量化篩選條件的狀態變量。當滿足上述的時間線參量化篩選條件時,選取模型中狀態變量Ai,進行時間線參量化處理,將狀態變量Ai當作狀態變量Aj的參量進行建模,用于縮減問題搜索空間,提高規劃的求解速率。所述的時間線參量化處理具體是指將狀態變量Ai挑選出來,狀態變量Ai不以時間線的形式進行建模,而是將狀態變量Ai作為狀態變量Aj的參量進行處理,并且狀態變量Ai與狀態變量Aj的約束關系轉化為狀態變量Aj自身內部的參量約束。步驟三:選用規劃空間規劃方法作為基本的算法架構,根據狀態目標性信息進行狀態和缺陷挑選啟發式設計,優先確保實現任務目標,提高算法的效率。所述的步驟三具體實現方法為。步驟3.1:將時間線根據與目標狀態的相關性分類:目標時間線,即存在狀態為規劃任務目標的時間線;強目標約束時間線指不存在狀態為規劃任務目標,但與目標狀態存在直接約束關系的時間線;弱目標約束時間線指不存在狀態為規劃任務目標,與目標狀態之間無直接約束關系,但是與目標時間線上其它狀態存在約束關系的時間線;普通時間線指既不存在狀態為規劃任務目標,又與目標時間線上所有狀態都無直接聯系的時間線。狀態為狀態變量的取值。定義狀態k的權值為qk,權值qk作為規劃過程中狀態挑選順序的評價指標,其中qk∈R+。權值qk的取值與其本身是否為目標狀態及其所屬時間線類型相關。權值qk具體計算方法為。步驟3.1.1:時間線TLi存在目標相關度指標α,α∈[0,1]。根據上述時間線的分類情況,目標時間線上αg=1,普通時間線αs=0,另兩類時間線,即強目標約束時間線的目標相關度αq與弱目標約束時間線的目標相關度αr之間的關系為,0<αr<αq<1其中,αq與αr的具體取值可根據任務約束數量及耦合度具體選擇。步驟3.1.2:狀態k的目標性βk:βk∈[0,10],根據狀態k與目標狀態G的約束相關性,決定該狀態的目標性βk,具體取值范圍為,其中,目標Sg為任務規劃目標狀態;目標約束狀態Sc為非任務規劃目標狀態,表示與目標狀態存在直接約束關系的狀態;目標弱相關狀態Sr為非任務規劃目標狀態,描述那些與目標狀態同一時間線但與目標無直接約束的狀態;目標無關狀態Ss為非任務規劃目標狀態,表示那些既與目標無直接關系,也位于不同時間線的狀態。步驟3.1.3:定義狀態k自身狀態約束值Wk。所挑選的狀態自身的狀態約束數量以及約束狀態的目標性會影響任務規劃可能的規劃步數以及回溯情況,從而影響規劃問題的求解速度。假設狀態k的狀態約束數量為n,則自身狀態約束值Wk為,其中,γ為約束適應度,為狀態約束因素。步驟3.1.4:求取狀態k的權值qk的計算函數為,步驟3.2:在狀態集合中對上述確定權值函數的狀態進行挑選,優先挑選權值qk大的狀態k作為步驟3.3需要處理的對象。步驟3.3:對挑選出的狀態k的未解決的開放條件(opencondition)缺陷的評價值F進行計算,并優先挑選評價值F大的缺陷進行優先解決。解決開放條件缺陷通過兩種形式實現,方式一為在解決缺陷的過程中,需要不斷向各時間線上添加新的狀態,方式二為在解決缺陷的過程中,與已經存在的狀態建立新的約束關系(即mergestate)。同一時間線上,由于互斥約束的存在,不允許不同狀態在時間上存在重疊。為避免上述情況,對缺陷的評價值F進行計算,以確定缺陷的處理順序,其中,m為所要添加的狀態所在時間線已有狀態數量,ε∈[0,10]為開放條件缺陷的適應度參數,表示開放條件缺陷在所有缺陷中的優先程度,ε取值越高,表明開放條件缺陷在所有缺陷中的優先程度越低。步驟3.4:迭代處理步驟3.2和步驟3.3,將全部缺陷解決后,輸出最終的規劃結果,完成航天器任務規劃。所述的全部缺陷包括開放條件、未賦值變量缺陷(unboundvariable)和沖突缺陷(threat)。Europa中應用的航天器任務規劃方法已給出所述的未賦值變量缺陷(unboundvariable)和沖突缺陷(threat)的解決方法。有益效果:1、針對航天器系統約束復雜和系統狀態信息互相耦合的特點,本發明公開的一種基于狀態目標性的啟發式航天器任務規劃方法,利用多維時間線刻畫航天器的多個并行子系統,并根據其約束特點,對部分時間線進行參量化處理,從而削減問題搜索空間,提高任務規劃求解效率。2、本發明公開的一種基于狀態目標性的啟發式航天器任務規劃方法,根據狀態目標性信息進行狀態和缺陷挑選啟發式設計,優先確保實現任務目標,提高算法的效率。原有航天器任務規劃方法雖然能夠進行問題求解,但是帶有大量冗余操作和不必要的節點回溯,通過設計啟發式信息,使得航天器任務規劃方法能夠在更短時間內獲取合理的規劃解,提高任務規劃求解效率。附圖說明:圖1是本發明公開的一種基于狀態目標性的啟發式航天器任務規劃方法的流程圖;圖2是基本規劃算法和啟發式任務規劃算法中隨目標數增加規劃任務的求解時間情況。圖中:實線表示基本規劃算法不同數量任務目標下規劃求解時間變化曲線,虛線表示啟發式規劃算法在不同數量任務目標下規劃求解時間變化曲線。具體實施方式為了更好地說明本發明的目的和優點,下面通過對航天器系統進行建模,并給定初始任務目標數為9,針對模型對改進的啟發式航天器任務規劃方法進行實際應用,對本發明做出詳細解釋。實施例1:本實施例公開的一種基于狀態目標性的啟發式航天器任務規劃方法,具體實現步驟如下:步驟一:綜合考慮航天器結構、任務需求、設備狀態和航天器能力四項因素,對航天器的構成、資源、分系統功能以及需要滿足的各種約束條件進行描述。所述的各種約束條件根據實際航天器系統而定,包括因果約束、時間約束和資源約束。針對航天器系統約束復雜和系統狀態信息互相耦合的特點,利用多維時間線刻畫航天器的多個并行子系統,通過時間線的耦合關系描述系統的復雜約束及系統間依賴關系,形成多維耦合時間線的模型架構,對各并行子系統的行為隨時間的演化和依賴關系進行描述。本實施例具體選取的子系統如下表所示。表1各子系統名稱及對應狀態數量子系統名稱狀態變量數量狀態數量姿態子系統13相機子系統15對地通訊子系統14著陸器通訊子系統14推進子系統14能源管理子系統13軌控子系統12GNC子系統13電纜子系統15太陽帆板子系統13安全鎖子系統13步驟二:選取模型中滿足時間線參量化篩選條件的狀態變量Ai進行時間線參量化處理,將狀態變量Ai當作狀態變量Aj的參量進行建模,用于縮減問題搜索空間,提高規劃的求解速率。各并行子系統分別由一個狀態變量進行表示,每個狀態變量都由時間線的形式進行描述,各并行子系統對應的狀態變量為狀態變量A1、狀態變量A2、狀態變量A3……狀態變量An。所述的時間線參量化篩選條件指當其中一個狀態變量Ai的狀態除與自身狀態存在約束外,僅與另一個狀態變量Aj(i≠j)間存在約束關系,所述的狀態變量Ai即為滿足時間線參量化篩選條件的狀態變量。當滿足上述的篩選條件時,選取模型中狀態變量Ai,進行時間線參量化處理,將狀態變量Ai當作狀態變量Aj的參量進行建模,用于縮減問題搜索空間,提高規劃的求解速率。所述的時間線參量化處理具體是指將狀態變量Ai挑選出來,狀態變量Ai不以時間線的形式進行建模,而是將狀態變量Ai作為狀態變量Aj的參量進行處理,并且狀態變量Ai與狀態變量Aj的約束關系轉化為狀態變量Aj自身內部的參量約束。根據模型中的約束關系,選出的滿足時間線參量化篩選條件的狀態變量為電纜子系統對應的狀態變量,將電纜子系統進行時間線參量化處理,作為安全鎖子系統的參量參與規劃。步驟三:選用規劃空間規劃方法作為基本的算法架構,根據狀態目標性信息進行狀態和缺陷挑選啟發式設計,優先確保實現任務目標,提高算法的效率。所述的步驟三具體實現方法為。步驟3.1:將時間線根據與目標狀態的相關性分類:目標時間線,即存在狀態為規劃任務目標的時間線;強目標約束時間線指不存在狀態為規劃任務目標,但與目標狀態存在直接約束關系的時間線;弱目標約束時間線指不存在狀態為規劃任務目標,與目標狀態之間無直接約束關系,但是與目標時間線上其它狀態存在約束關系的時間線;普通時間線指既不存在狀態為規劃任務目標,又與目標時間線上所有狀態都無直接聯系的時間線。狀態為狀態變量的取值。定義狀態k的權值為qk,權值qk作為規劃過程中狀態挑選順序的評價指標,其中qk∈R+。權值qk的取值與其本身是否為目標狀態及其所屬時間線類型相關。這里選取相機子系統的拍照狀態為例。權值qk具體計算方法為。步驟3.1.1:時間線TLi存在目標相關度指標α,α∈[0,1]。根據上述時間線的分類情況,目標時間線上αg=1,普通時間線αs=0,另兩類時間線,即強目標約束時間線的目標相關度αq與弱目標約束時間線的目標相關度αr之間存在如下關系,0<αr<αq<1其中,αq與αr的具體取值可根據任務約束數量及耦合度具體選擇。這里,將強目標約束時間線的目標相關度αq與弱目標約束時間線的目標相關度αr的具體取值為,拍照時間線為目標時間線,所以時間線的目標相關度為α=1。步驟3.1.2:狀態k的目標性βk:βk∈[0,10],根據狀態k與目標狀態G的約束相關性,決定該狀態的目標性βk,具體取值范圍為,其中,目標Sg為任務規劃目標狀態;目標約束狀態Sc為非任務規劃目標狀態,表示與目標狀態存在直接約束關系的狀態;目標弱相關狀態Sr為非任務規劃目標狀態,描述那些與目標狀態同一時間線但與目標無直接約束的狀態;目標無關狀態Ss為非任務規劃目標狀態,表示那些既與目標無直接關系,也位于不同時間線的狀態。本實施例中狀態目標性的具體取值為,選取的拍照狀態為目標狀態,所以拍照狀態的目標性為β=10。步驟3.1.3:定義狀態k自身狀態約束值Wk。所挑選的狀態自身的狀態約束數量以及約束狀態的目標性會影響任務規劃可能的規劃步數以及回溯情況,從而影響規劃問題的求解速度。假設狀態k的狀態約束數量為n,則狀態約束值Wk為,其中,γ為約束適應度,為狀態約束因素。這里取γ=0.5。由于拍照狀態與另外三個狀態P1,P2和P3之間存在約束關系,并且三個狀態P1,P2和P3的時間線目標相關度指標α與狀態目標性β為,其中,狀態P1的時間線目標相關度指標為α1,狀態目標性為β1;狀態P2的時間線目標相關度指標為α2,狀態目標性為β2;狀態P3的時間線目標相關度指標為α3,狀態目標性為β3。拍照狀態的狀態約束值為,W=0.5×(0×3+1×6+1×3)=4.5步驟3.1.4:求取狀態k的權值qk的計算函數為,這里,拍照狀態的權值q為,q=1×10+4.5=14.5步驟3.2:在狀態集合中對上述確定權值函數的狀態進行挑選,優先挑選權值qk大的狀態k作為步驟3.3需要處理的對象。步驟3.3:對挑選出的狀態k的未解決的開放條件(opencondition)缺陷的評價值F進行計算,并優先挑選評價值F大的缺陷進行優先解決。解決開放條件缺陷通過兩種形式實現,方式一為在解決缺陷的過程中,需要向各時間線上添加新的狀態,方式二為在解決缺陷的過程中,與已經存在的狀態建立新的約束關系(即mergestate)。同一時間線上,由于互斥約束的存在,不允許不同狀態在時間上存在重疊。為避免上述情況,對缺陷的評價值F進行計算,以確定缺陷的處理順序:其中,m為所要添加的狀態所在時間線已有狀態數量,ε∈[0,10]為開放條件缺陷的適應度參數,表示開放條件缺陷在所有缺陷中的優先程度,ε取值越高,表明開放條件缺陷在所有缺陷中的優先程度越低。這里取ε=3.0。步驟3.4:迭代處理步驟3.2和步驟3.3,將全部缺陷解決后,輸出最終的規劃結果,完成航天器任務規劃。所述的全部缺陷包括開放條件、未賦值變量缺陷(unboundvariable)和沖突缺陷(threat)。Europa中應用的航天器任務規劃方法已給出所述的未賦值變量缺陷(unboundvariable)和沖突缺陷(threat)的解決方法。通過上述步驟,使用改進的啟發式航天器任務規劃方法得到規劃結果的時間為406ms,使用基本的航天器任務規劃方法得到規劃結果的時間為544ms。通過比較可以看出,由于對電纜子系統進行時間線參量化處理,能夠削減問題搜索空間,并且設計的狀態和缺陷挑選的啟發式能夠有效避免冗余的規劃步驟,提高規劃的效率,所以使用改進的啟發式航天器任務規劃方法得到規劃結果的時間要少于使用基本的航天器任務規劃方法得到規劃結果的時間。對比結果均是在初始任務目標數為9的情況下得到的。在其他目標數下使用改進的啟發式航天器任務規劃方法得到規劃結果的時間和使用基本的航天器任務規劃方法得到規劃結果的時間對比如圖2所示。所述的基本的航天器任務規劃方法為不通過時間線參量化處理,也不使用根據狀態目標性信息設計的狀態和缺陷挑選的啟發式的航天器任務規劃方法。以上所述的具體描述,對發明的目的、技術方案和有益效果進行了進一步詳細說明,所應理解的是,以上所述僅為本發明的具體實施例,用于解釋本發明,并不用于限定本發明的保護范圍,凡在本發明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本發明的保護范圍之內。當前第1頁1 2 3