一種多Agent系統非對稱分布式約束優化方法
【專利摘要】本發明提出了一種多Agent系統非對稱分布式約束優化方法,包括如下步驟:控制器接收Agent信息并獲得非對稱關系,構建Agent連接圖;根據Agent連接圖中的節點間的連接關系,建立基于排序的鏈式結構;將Agent連接圖按照深度優先的方式構造深度優先樹;通過分枝定界策略,計算不同深度優先樹的根節點的權重值,最終獲取更優的樹形結構;依賴得到更優的樹形結構,調整多Agent系統中的Agent行為參數。本發明針對多Agent系統的非對稱特征,引入預測機制,彌補不完全信息決策的不足,使Agent能預估自己行為的影響,獲取更有效的策略,在一定程度上改變收益非單調特性,達到個體利益和全局利益的平衡。
【專利說明】一種多Agent系統非對稱分布式約束優化方法
【技術領域】
[0001]本發明涉及一種非對稱分布式約束優化方法,特別涉及一種多Agent系統非對稱分布式約束優化方法。
【背景技術】
[0002]多Agent系統是研究在一群自治的Agent之間如何協調它們的知識、目標、技能和相互規劃采取行動或解決問題。該系統目前已逐步應用在了任務調度、資源分配、傳感器網絡、交通管理、微網配置等實際應用中。但是,當前在這些應用領域中,對于多Agent系統仍然使用的是“對稱性”特性,即認為各Agent對與其有約束關系的其他Agent的特征、取值(策略)空間及代價(收益)函數有準確的信息,每個Agent沒有個人的偏好信息和隱私性,進而簡化了其求解的過程。
[0003]但是,在實際問題中,大多數的多Agent系統都具有非對稱特征,即每個個體具有自己的偏好且不希望與其他個體共享。例如,在微網控制中,每個分布式電源(DG)由于各自的特性不同(如風能或水電站電源等等),彼此之間的影響是不同的,在相同網絡配置下相鄰DG的收益也不相同,而每個DG并不清楚其他DG的收益情況。因此,現實情況使得在此類多Agent系統中,需要充分考慮其非對稱性特征。
【發明內容】
[0004]為了克服上述現有技術中存在的缺陷,本發明的目的是提供一種多Agent系統非對稱分布式約束優化方法,解決Agent非對稱不完全信息的響應、雙向代價求解和個體收益的私密性的組合問題以及如何設計Agent組織結構和策略并且使它們能達到較好的匹配問題。
[0005]為了實現本發明的上述目的,本發明提供了一種多Agent系統非對稱分布式約束優化方法,其包括如下步驟:
[0006]SI,控制器接收Agent信息,根據所述Agent信息獲得非對稱關系,判斷各個Agent之間是否存在約束關系,如果存在,則在有約束關系的兩個Agent間搭建一條邊,從而構建Agent連接圖,其中,各個Agent之間的約束關系決定了 Agent節點之間的連接關系,并判定所述連接圖為稀疏圖還是稠密圖;
[0007]S2,根據Agent連接圖中的節點間的連接關系,采用單枝的構造策略,建立基于排序的鏈式結構,每個Agent節點作為鏈式結構中的一環,由于Agent間約束關系的稀疏緊密程度不同,Agent在鏈中的不同位置及其鄰居關系會導致整個鏈式結構的不同分布;
[0008]S3,將步驟SI中所述Agent連接圖按照深度優先的方式構造深度優先樹,首先對根進行選擇時,采用了約束關系最多的節點作為根,然后根據約束邊的數量和有無回邊確定子節點,構造深度優先樹;
[0009]S4,通過分枝定界策略,計算不同深度優先樹的根節點的權重值,在計算根節點權重時,采用分枝定界遍歷的方式,通過設置閾值,并計算每個Agent節點的上下界來進行剪枝,以最終獲取更優的樹形結構;
[0010]S5,依賴步驟S4中得到的所述更優的樹形結構,調整多Agent系統中的Agent的行為參數。
[0011]本發明的多Agent系統非對稱分布式約束優化方法針對多Agent系統的非對稱特征,引入預測機制,彌補不完全信息決策的不足,使Agent能預估自己行為的影響,獲取更有效的策略,在一定程度上改變收益非單調特性,達到個體利益和全局利益的平衡。
[0012]在本發明的一種優選實施方式中,在步驟S2中,在形成鏈的過程中,統計每個Agent的約束關系數量,約束關系最多的Agent排列在最前,隨著約束關系的降低依次排列,約束關系最少的Agent排列在最后,建立基于排序的鏈式結構。
[0013]在本發明的另一種優選實施方式中,在步驟S2中,在形成鏈的過程中,統計每個Agent的約束關系數量,約束關系最多的Agent排列在最前,選擇與排列好的Agent鏈中的最后一個Agent向后相鄰的鄰居中約束關系最多的Agent排列在后,建立基于排序的鏈式結構。
[0014]通過建立鏈式結構,每個Agent節點作為鏈式結構中的一環,其在鏈中的不同位置會造成整個鏈式結構的不同權重分布。
[0015]另外,在形成鏈的過程中,本發明會嘗試通過“按約束關系多優先排序”或“按約束關系多優先排序+鄰居關系”的方式來構建鏈式結構,快速準確。
[0016]在本發明的一種優選實施方式中,由于該鏈式結構有存在回路的很大可能性,在排序構造鏈式結構的過程中,增加了反向檢測搜索和階段搜索,用以解決某個Agent節點或某些Agent節點進入鏈之后可能出現的回路情況,以獲取更優的鏈式結構。
[0017]在本發明的一種優選實施方式中,在步驟S3中將所述Agent連接圖按照深度優先的方式構造深度優先樹的方法為:
[0018]S31,將約束關系最多的Agent選擇為根節點,令根節點為參考節點;
[0019]S32,將與參考節點有連接關系的所有節點建立節點集;
[0020]S33,選擇所述節點集中與參考節點連接的約束邊最多的節點作為子節點,在選擇時需判斷該節點的加入會否造成出現交叉回邊或偽樹;
[0021]S34,當S33中構造的深度優先樹出現交叉回邊或偽樹時,則放棄選擇最后納入樹的該節點,而重新選擇其他Agent節點作為子節點來繼續構造深度優先樹,新的節點選擇規則仍然是判斷是否有與參考節點連接的約束邊次多的節點,如果有,則選擇與參考節點連接的約束邊次多的節點作為子節點,令子節點為參考節點,返回步驟S32,如果沒有,則執行步驟S35 ;
[0022]S35,將其他沒有在樹中出現的Agent根據約束邊的連接關系與樹中的節點相連。
[0023]從而構造出樹型結構。
[0024]在本發明的一種優選實施方式中,根據當前節點在步驟S2中得到的鏈式結構中該節點的前后節點次序,選擇與該節點緊鄰的向下一個節點作為子節點,如果當有交叉回邊和偽樹時,則選擇與該節點緊鄰的向下第二個節點作為子節點。
[0025]在本發明的一種優選實施方式中,在步驟S4中分枝定界策略,計算不同深度優先樹的根節點的權重值的方法為:
[0026]對每個Agenti定義了上下界:
【權利要求】
1.一種多Agent系統非對稱分布式約束優化方法,其特征在于,包括如下步驟: SI,控制器接收Agent信息,根據所述Agent信息獲得非對稱關系,判斷各個Agent之間是否存在約束關系,如果存在,則在有約束關系的兩個Agent間搭建一條邊,從而構建Agent連接圖,其中,各個Agent之間的約束關系決定了 Agent節點之間的連接關系,并判定所述連接圖為稀疏圖還是稠密圖; S2,根據Agent連接圖中的節點間的連接關系,采用單枝的構造策略,建立基于排序的鏈式結構,每個Agent節點作為鏈式結構中的一環,由于Agent間約束關系的稀疏緊密程度不同,Agent在鏈中的不同位置及其鄰居關系會導致整個鏈式結構的不同分布; S3,將步驟SI中所述Agent連接圖按照深度優先的方式構造深度優先樹,首先對根進行選擇時,采用了約束關系最多的節點作為根,然后根據約束邊的數量和有無回邊確定子節點,構造深度優先樹; S4,通過分枝定界策略,計算不同深度優先樹的根節點的權重值,在計算根節點權重時,采用分枝定界遍歷的方式,通過設置閾值,并計算每個Agent節點的上下界來進行剪枝,以最終獲取更優的樹形結構; S5,依賴步驟S4中得到的所述更優的樹形結構,調整多Agent系統中的Agent行為參數。
2.如權利要求1所述的多Agent系統非對稱分布式約束優化方法,其特征在于:在步驟S2中,在形成鏈的過程中,統計每個Agent的約束關系數量,約束關系最多的Agent排列在最前,隨著約束關系的降低依次排列,約束關系最少的Agent排列在最后,建立基于排序的鏈式結構。
3.如權利要求1所述的多Agent系統非對稱分布式約束優化方法,其特征在于:在步驟S2中,在形成鏈的過程中,統計每個Agent的約束關系數量,約束關系最多的Agent排列在最前,選擇與排列好的Agent鏈中的最后一個Agent向后相鄰的鄰居中約束關系最多的Agent排列在后,建立基于排序的鏈式結構。
4.如權利要求1所述的多Agent系統非對稱分布式約束優化方法,其特征在于:在排序構造鏈式結構的過程中,增加了反向檢測搜索和階段搜索,用以解決某個Agent節點或某些Agent節點進入鏈之后可能出現的回路情況,以獲取更優的鏈式結構。
5.如權利要求1所述的多Agent系統非對稱分布式約束優化方法,其特征在于:在步驟S3中將所述Agent連接圖按照深度優先的方式構造深度優先樹的方法為: S31,將約束關系最多的Agent選擇為根節點,令根節點為參考節點; S32,將與參考節點有連接關系的所有節點建立節點集; S33,選擇所述節點集中與參考節點連接的約束邊最多的節點作為子節點,在選擇時需判斷該節點的加入會否造成出現交叉回邊或偽樹; S34,當S33中構造的深度優先樹出現交叉回邊或偽樹時,則放棄選擇最后納入樹的該節點,而重新選擇其他Agent節點作為子節點來繼續構造深度優先樹,新的節點選擇規則仍然是判斷是否有與參考節點連接的約束邊次多的節點,如果有,則選擇與參考節點連接的約束邊次多的節點作為子節點,令子節點為參考節點,返回步驟S32,如果沒有,則執行步驟 S35 ; S35,將其他沒有在樹中出現的Agent根據約束邊的連接關系與樹中的節點相連。
6.如權利要求5所述的多Agent系統非對稱分布式約束優化方法,其特征在于:根據當前節點在步驟S2中得到的鏈式結構中該節點的前后節點次序,選擇與該節點緊鄰的向下一個節點作為子節點,如果當有交叉回邊和偽樹時,則選擇與該節點緊鄰的向下第二個節點作為子節點。
7.如權利要求1所述的多Agent系統非對稱分布式約束優化方法,其特征在于:在步驟S4中分枝定界策略,計算不同深度優先樹的根節點的權重值的方法為: 對每個Agenti定義了上下界:
【文檔編號】G06F9/50GK103995750SQ201410244687
【公開日】2014年8月20日 申請日期:2014年6月4日 優先權日:2014年6月4日
【發明者】張程, 陳自郁 申請人:重慶大學