基于模糊推理系統的多機器人角度控制圍捕方法
【技術領域】:
[0001] 本發明涉及了一種在動態環境下基于角度控制的多機器人圍捕策略,具體為一種 基于模糊推理系統的多機器人角度控制圍捕方法。
【背景技術】:
[0002] 由于多機器人系統具有空間上的分布性、功能上的多樣性、執行任務時的并行性、 較強的容錯能力和更低的經濟成本等單機器人無法比擬的優越性,使得多機器人系統近年 來成為人們廣泛關注的熱點。多機器人系統研究的主要問題包括群體結構、任務分配、通信 方式、協作學習等。為了使得研究更具有在實際場景中的意義,研究者們集中對一些多機器 人任務進行研究,包括編隊協作、搜索、圍捕等。其中,多機器人協作圍捕是一個非常典型的 問題,它涉及到多機器人領域中的多個方面,包括多機器人體系結構、通信方式、協作控制、 任務分配等技術,拓展后在軍事以及工業領域有著較為廣泛的的應用。
[0003] 文獻[1]探討了以勢場柵格法為基礎的協作圍捕策略,引入"虛擬范圍"減少了路 徑規劃次數。文獻[2]模擬免疫系統中B細胞的抗體間的相互作用,提出了機器人行為決策 圍捕算法,使得追捕機器人形成有效包圍圈,實現多機器人圍捕。文獻[3]提出了基于多機 器人學習的圍捕方式,取得了一定的效果。文獻[4]分析了成功圍捕目標機器人的臨界條 件,并設計了多機器人的伏擊圍捕方案,取得了良好的效果。文獻[5]提出了一種基于動態 預測目標軌跡尾部點的多機器人圍捕算法,通過多項式擬合對機器人進行預測并實現圍 捕。文獻[6]通過L型,R型,Μ型模糊控制器的設計實現多機器人圍捕,通過實驗驗證了可行 性。文獻[7]提出了隊形、包抄、捕捉策略,結合狀態轉換保證了任務實現。文獻[8-10]采用 嘗試模擬和利用生物免疫系統及動物捕食過程,探討并實現了多機器人任務。
[0004] 參考文獻:
[0005] [1]SUGAR T G,KUMAR V.Control of cooperating mobile manipulators[J] .IEEE Transactions on Robotics and Automation.2002.18(1):94-103;
[0006] [2]譚永麗,方彥軍.基于人工免疫系統的多機器人追捕問題[J].武漢大學學報, 2014,47(1):105-109。
[0007] [3]Liu Jie,Liu Shuhua,ffu Hongyan,et al.A pursuit evasion algorithm based on hierarchical reinforcement 1earning[C]//International Conference on Measuring Technology and Mechatronics Automation. Zhangjiajie: IEEE,2009:482-486;
[0008] [4]付勇,汪浩杰.一種多機器人圍捕策略[J].華中科技大學學報(自然科學版), 2008,36(2):26-29;
[0009] [5]胡俊,朱慶保.基于動態預測軌跡和圍捕點的多機器人圍捕算法[J].電子學 報,2011,39(11 ):2480-2485;
[0010] [6]袁璦焦繼樂曹志強等.基于模糊控制協調策略的多自主機器人圍捕[J].華中 科技大學學報(自然科學版),2011,39(2) :328-331;
[0011] [7]CA0 Zhi-qiang,Zhang Bin,Wang Shuo,et al.Cooperative hunting of multiple mobile robots in an unknown environment[J].Acta Automatica Sinica, 2003,29(4):536-543;
[0012] [8]Khan,Muhammad T,De Silva,Clarence ff.Autonomous and robust multirobot cooperation using an artificial immune system[J]. International Journal of Robotics and Automation,2012,27(1):60_75;
[0013] [9]Gao Yunyuan,ffei Wei.Multi-robot autonomous cooperation intergrated with immune based dynamic task allocation[C]//Proceedings of the sixth international conference on intelligent systems design and applications, ISDA2006,2:586-591;
[0014] [10]C.Muro,R.Escobedo,L.Spector,R.P.Coppinger.ffolf-pack(Canis lupus) hunting strategies emerge from simple rules in computational simulations!!J] .Behavioural Processes.2011(3)〇
[0015] 但以上研究工作沒有充分考慮到多機器人圍捕策略中的以下相關問題:首先,由 于過于簡化多機器人問題使得策略的實際有效性不能保證。其次,機器人在仿真環境中,對 移動機器人的運動方式限制過多,且未考慮機器人的運動學約束,沒有體現移動機器人在 環境中的實際運行狀態,難以驗證算法在實際情況中的可行性。再者,沒有給出多機器人圍 捕的整體圍捕流程,無法覆蓋多機器人圍捕任務中的各種復雜情況。最后,逃跑者由于感知 以及運動方式上的不足使得逃跑者較為容易的實現圍捕。
【發明內容】
:
[0016]發明目的:
[0017] 本發明提供一種基于模糊推理系統的多機器人角度控制圍捕方法,其目的是解決 以往所存在的問題。
[0018] 技術方案:
[0019] 基于模糊推理系統的多機器人角度控制圍捕方法,其特征在于:該方法采用兩層 模糊推理來實現多機器人圍捕策略;第一層模糊推理系統為決策層,用于對圍捕任務狀態 進行識別,選擇對應的多機器人策略;當圍捕者處于搜索狀態時,決策層模糊推理的輸出 Search,圍捕者執行搜索策略;當圍捕者處于接近狀態時,決策層輸出Approach,即接近策 略;當圍捕者處于圍捕狀態時,決策層輸出Surround,圍捕者進行圍捕策略。
[0020] 決策層模糊規則的設計以3個圍捕者與目標的距離Lle作為輸入;通過隸屬度函數 進行模糊化:隸屬度函數將精確的輸入值轉化為對應的模糊集以及相應的隸屬度;L le的模 糊集為距離區間上的{S,M,L};再對規則庫中的規則進行匹配;第i條規則心如下:
[0021 ] R/. ij L^.is 為狐1 L... is 凡 cuid A is St.
[0022] 其中Lle表示第i號機器人距離逃跑者e的距離,4為第i條規則的第n個輸入的模糊 集;Si為規則的輸出,表示決策選擇的策略;
[0023] 根據每條規則的前件,利用梯形隸屬度函數計算在對應模糊集上0~1的隸屬度;3 個輸入變量經過隸屬度函數模糊化得到的隸屬度為以 1(342(3^3(3,再對規則進行匹配,得到模 糊規則的隸屬度為輸入變量隸屬度中的最小值;
[0024]最后將各條規則的輸出按照模糊規則隸屬度進行疊加,得到輸出;輸出的策略包 括搜索策略,接近策略,圍捕策略。
[0025] 搜索策略:
[0026]當決策層模糊推理的輸出為Search,圍捕者執行搜索策略,具體實現采用隨機搜 索方式進行搜索;每個機器人擁有多組備選的左右輪速,其中包含了直行、左轉、右轉行為; 機器人每次隨機選取其中一組左右輪速來運動;
[0027]接近策略:
[0028] 當決策層輸出Approach時,圍捕者整體執行接近策略,即圍捕者對逃跑者進行接 近;采用模糊推理系統實現對目標的接近;
[0029] 對于該模糊推理系統,以被圍捕者的預測點為接近目標,圍捕者當前的朝向與目 標之間的偏角α作為輸入,輸出為一組左右輪速值;
[0030] 輸入通過隸屬度函數模糊化,夾角的模糊集為在-180°到180°上的{匪,NS,0,PS, ΡΜ};模糊化后,根據規則庫進行推理,得到最終的輸出;規則如下:
[0031] If a is NM then Output is LRT
[0032] 當偏角α較大時(匪),輸出LRT,即機器人向右側大幅度轉向的一組左右輪速,并逐 漸朝向目標;隨著偏角的減小,機器人將通過直行迅速接近目標;
[0033] 模糊規則庫中的每條規則的輸出均為一組左右輪速;在得到模糊推理系統的輸出 的一組左右輪速后,需要根據機器人當前的運動信息計算出單位時間后的坐標;在實際環 境中,機器人的運動方式不是單純的質點,而是符合運動學約束的運動方式,機器人的運動 不存在突變;因此,該坐標的計算需要符合輪式機器人的運動學約束;
[0034] 為了在仿真程序中更好的體現機器人的運動,所有機器人的運動基于以下5組左 右輪速形成;
[0035]為了保證多機器人圍捕算法的可行性,需要考慮機器人運動學約束,這樣可以真 實模擬實際情況,更好的驗證多機器人圍捕算法;輪式機器人的線速度及角速度由左右輪 諫Vr·, VI計筧得到
[0038] 根據線速度及角速度,可以計算出單位之間t內機器人在X,Y方向上的運動距離
[0039] dx = R · (1-cos ω t) (3)
[0040] dy = R · sin ω t(4)
[0041] 其中R為機器人運動旋轉的極徑,由機器人線速度及角速度計算得到
\ · r " / /
[0043]公式(5)中的d為輪式機器人的輪