移動機(jī)器人的路徑規(guī)劃方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于路徑規(guī)劃技術(shù)領(lǐng)域,尤其涉及一種移動機(jī)器人的路徑規(guī)劃方法。
【背景技術(shù)】
[0002] 移動機(jī)器人的路徑規(guī)劃是指機(jī)器人根據(jù)傳感器攝像頭獲得的信息對所處環(huán)境進(jìn) 行感知并自主的規(guī)劃出一條抵達(dá)目標(biāo)狀態(tài)的路線。
[0003] 傳統(tǒng)的移動機(jī)器人的路徑規(guī)劃方法存在如下問題:
[0004] 文獻(xiàn)1 (宋勇,李貽斌,李彩虹.移動機(jī)器人路徑規(guī)劃強(qiáng)化學(xué)習(xí)的初始化[J].控 制理論與應(yīng)用,2012, 29 (012) : 1623-1628)針對現(xiàn)有路徑規(guī)劃算法收斂慢的特點,提出了 一種基于人工勢場的Q學(xué)習(xí)初始化算法,根據(jù)人工勢場來得到環(huán)境的先驗知識,使得算法 中Q值初始化為更好的參數(shù),加快收斂速度,但算法是應(yīng)用在離散柵格的環(huán)境中,與現(xiàn)實應(yīng) 用不符。
[0005] 文獻(xiàn)2 (柳長安,鄢小虎,劉春陽,等.基于改進(jìn)蟻群算法的移動機(jī)器人動態(tài)路 徑規(guī)劃方法[J].電子學(xué)報,2011,39 (5) : 1220-1224)提出了一種基于改進(jìn)蟻群算法的路徑 規(guī)劃算法,克服了局部最優(yōu)問題,但同樣對環(huán)境做了柵格化處理,不能處理環(huán)境信息完全未 知的路徑規(guī)劃問題。
[0006] 文獻(xiàn)3(陳世明,江冀海,吳龍龍,等.受限空間自適應(yīng)區(qū)域柵格化的優(yōu)化路徑 規(guī)劃[J].控制與決策,2012, 27(7))針對環(huán)境中障礙物分布復(fù)雜且存在封閉邊界的受限空 間的情況,采用粒子群算法提出了一種環(huán)境自適應(yīng)區(qū)域柵格化的優(yōu)化路徑規(guī)劃算法,但論 文中并沒有對復(fù)雜的非凸障礙物進(jìn)行分析而今采用簡單的圓形障礙物進(jìn)行了仿真。
[0007] 文獻(xiàn)4 (喬俊飛,樊瑞元,韓紅桂,等.機(jī)器人動態(tài)神經(jīng)網(wǎng)絡(luò)導(dǎo)航算法的研宄和 實現(xiàn)[J].控制理論與應(yīng)用,2010, 27 (1) : 111-115)提出了根據(jù)機(jī)器人所處環(huán)境狀態(tài)自適應(yīng) 的調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)的動態(tài)神經(jīng)網(wǎng)絡(luò)導(dǎo)航算法,通過神經(jīng)網(wǎng)絡(luò)來實現(xiàn)機(jī)器人狀態(tài)與動作間的映 射關(guān)系,但論文中的機(jī)器人的動作空間只有五個離散的動作,大大降低了系統(tǒng)的自由度。
[0008] 文獻(xiàn)(王梅,王葉婷,屠大維,等.基于混合勢場法的移動機(jī)器人路徑規(guī)劃[J]. 計算機(jī)應(yīng)用研宄,2012, 29(7) : 2447-2449)針對人工勢場法中的局部最優(yōu)、目標(biāo)不可達(dá)等 問題,在斥力場函數(shù)中加入斥力因子,克服了上述缺陷,但算法中對于傳感器信息的處理過 多的依賴于專家知識。
[0009] 文獻(xiàn)(郜園園,阮曉鋼,宋洪軍,等.一種基于混合學(xué)習(xí)策略的移動機(jī)器人路徑 規(guī)劃方法[J].控制與決策,2012, 27 (12))采用模糊推理系統(tǒng)和學(xué)習(xí)自動機(jī)的原理,提出了 一種混合學(xué)習(xí)策略,能夠與未知環(huán)境實時交互并自適應(yīng)的學(xué)習(xí)規(guī)劃策略,但同樣算法需要 依據(jù)較多的專家知識來獲取合適的模糊規(guī)則。
[0010] 人工魚群算法是由文獻(xiàn)(李曉磊,邵之江,錢積新.一種基于動物自治體的尋 優(yōu)模式:魚群算法[J].系統(tǒng)工程理論與實踐,2002, 22(11) :32-38)提出的一種多點啟發(fā) 式隨機(jī)搜索算法,算法基于自然界中魚群覓食的自然行為,使得算法具有優(yōu)良的尋優(yōu)能力, 但是該算法泛用性低,對每個新地圖都需要重新進(jìn)行訓(xùn)練。
【發(fā)明內(nèi)容】
[0011] 基于此,針對上述技術(shù)問題,提供一種移動機(jī)器人的路徑規(guī)劃方法。
[0012] 為解決上述技術(shù)問題,本發(fā)明采用如下技術(shù)方案:
[0013] 一種移動機(jī)器人的路徑規(guī)劃方法,包括:
[0014] 1)通過多個距離傳感器探測移動機(jī)器人與障礙物之間的距離Si,所述多個距離傳 感器均勻分布于所述移動機(jī)器人的周向正面,該移動機(jī)器人采用差分驅(qū)動小車模型,其運(yùn) 動學(xué)方程如下:
[0015]
【主權(quán)項】
1. 一種移動機(jī)器人的路徑規(guī)劃方法,其特征在于,包括: 1) 通過多個距離傳感器探測移動機(jī)器人與障礙物之間的距離Si,所述多個距離傳感器 均勻分布于所述移動機(jī)器人的周向正面,該移動機(jī)器人采用差分驅(qū)動小車模型,其運(yùn)動學(xué) 方程如下:
,i為所述距離傳感器的數(shù)量,(x,y,0)表示所述移動機(jī)器人在慣性系下的坐標(biāo)以及 該移動機(jī)器人的朝向與慣性系x軸之間的夾角,V、《分別為機(jī)器人的速度與角速度; 2) 提供一具有淘汰機(jī)制的魚群算法,該算法包括: 覓食行為:在一標(biāo)號為1,2,…,M的人工魚集合F中,設(shè)當(dāng)前第i條人工魚狀態(tài)XiGRn,n為求解空間維數(shù),魚在自身視野范圍內(nèi)的求解空間中隨機(jī)搜索新的狀態(tài)并加以判斷是 否滿足移動條件,即若P(X」)>P(\),其中P( ? ) :Rn-R為目標(biāo)函數(shù),則按下式更新自身的 狀態(tài): Xi(k+1) = (1-a )Xi(k) + a Xj (2) ,其中0〈a< 1為覓食學(xué)習(xí)率; 若反復(fù)搜索次數(shù)達(dá)到最大搜索次數(shù),則在視野范圍以n維高斯分布取樣一點作為下一 個狀態(tài),即有: Xjk+l)?略〇〇, 〇2) (3) 聚群行為:對當(dāng)前人工魚i,定義鄰接人工魚集合: Ni={jGF|IIX-XjII^dnj^i} (4) ,其中II?II為歐氏范數(shù),d表示人工魚最大視野距離,判斷視野范圍內(nèi)的所有人工魚 的狀態(tài)中心
是否擁擠,若不擁擠,即若 .P^),其中S用擁擠度因子,則按下式更新人工魚i的狀態(tài):
,y為算法迭代步長,若不滿足擁擠度條件,則執(zhí)行覓食行為。 追尾行為:人工魚i在視野范圍內(nèi)搜索目標(biāo)函數(shù)值最大的鄰接人工魚j,有 j=argmaXj,{P(Xj, ) |jrGNj(6) 且判斷該人工魚周圍是否擁擠,即若P(Xj) / |隊| >S?P%),則依下式更新人工魚i的 狀態(tài):
淘汰機(jī)制:依據(jù)目標(biāo)函數(shù)的值,淘汰m條低適應(yīng)度的人工魚,0 <m〈M為預(yù)設(shè)的淘汰數(shù) 目;依次從M-m條人工魚中以等概率選取一條魚設(shè)為人工魚i,將人工魚i的狀態(tài)Xi作為高 斯分布的期望,通過式(3)在人工魚i附近生成一條魚,重復(fù)上述過程直到生成m條魚; 3) 所述移動機(jī)器人由具有神經(jīng)網(wǎng)絡(luò)的控制器控制,所述神經(jīng)網(wǎng)絡(luò)的輸入I以及輸入0 分別為: I(r^,9d,s"s。,^",S5)eR0=0 (Gdffi)!^GR2 ,rd以及0d分別為碰撞點與目標(biāo)的距離偏差以及角度偏差,rd=II(x,y)-(xg*yg)II, 9 d= 0-argtan(yg/xg)G(-jt,jt]; 在每個離散步驟內(nèi),若檢測到滿足如下任意一個結(jié)束條件: 距離偏差rd= || (x,y)_(xg*yg) ||彡e,e>〇為設(shè)定的距離容許誤差; 彐/.A. S . tf,即迭代時間等于最大迭代時間; 貝1J,結(jié)束當(dāng)前試驗,返回目標(biāo)函數(shù)的值為
4) 所述神經(jīng)網(wǎng)絡(luò)通過所述魚群算法更新神經(jīng)網(wǎng)絡(luò)權(quán)值,即人工魚的狀態(tài)X: 4a)初始化魚群最優(yōu)狀態(tài)以及最優(yōu)目標(biāo)函數(shù)值公告板,在[-3, 3]的取值范圍內(nèi)隨機(jī)初 始化魚群狀態(tài)X; 4b)若滿足魚群聚群條件,則執(zhí)行聚群行為,否則執(zhí)行覓食行為; 4c)若滿足魚群追尾條件,則執(zhí)行追尾行為,否則執(zhí)行覓食行為; 4d)更新所述公告板,執(zhí)行淘汰機(jī)制; 4e)若到達(dá)最大迭代次數(shù),則結(jié)束魚群算法并將人工魚群的狀態(tài)X以及目標(biāo)函數(shù)的值 輸出至公告板,用以記錄最優(yōu)參數(shù),否則返回4b)步驟; 人工魚的狀態(tài)
,其中了表示矩陣?yán)睘樾邢蛄浚? 5) 通過已知訓(xùn)練地圖模板訓(xùn)練所述神經(jīng)網(wǎng)絡(luò); 6) 通過訓(xùn)練過的神經(jīng)網(wǎng)絡(luò)規(guī)劃所述移動機(jī)器人在環(huán)境信息未知的環(huán)境空間中的行走 路徑。
2. 根據(jù)權(quán)利要求1所述的一種移動機(jī)器人的路徑規(guī)劃方法,其特征在于,所述神經(jīng)網(wǎng) 絡(luò)為三層前饋網(wǎng)絡(luò)。
3. 根據(jù)權(quán)利要求1或2所述的一種移動機(jī)器人的路徑規(guī)劃方法,其特征在于,所述距離 傳感器采用激光傳感器或超聲傳感器。
【專利摘要】一種移動機(jī)器人的路徑規(guī)劃方法,包括:通過多個距離傳感器探測移動機(jī)器人與障礙物之間的距離;提供一具有淘汰機(jī)制的魚群算法;移動機(jī)器人由具有神經(jīng)網(wǎng)絡(luò)的控制器控制;神經(jīng)網(wǎng)絡(luò)通過魚群算法更新神經(jīng)網(wǎng)絡(luò)權(quán)值;通過已知地圖模板訓(xùn)練所述神經(jīng)網(wǎng)絡(luò);通過訓(xùn)練過的神經(jīng)網(wǎng)絡(luò)規(guī)劃移動機(jī)器人在環(huán)境信息未知的環(huán)境空間中的行走路徑。本發(fā)明采用加入淘汰機(jī)制的魚群算法針對具有神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的控制器對移動機(jī)器人進(jìn)行控制,機(jī)器人只需要在一個模板地圖里進(jìn)行訓(xùn)練,就可憑借神經(jīng)網(wǎng)絡(luò)的泛化性能來學(xué)習(xí)到壁障和到目的地的行為,即算法學(xué)習(xí)出的是一種泛化的行為而不是特定地圖的路徑軌跡,增強(qiáng)了機(jī)器人對于復(fù)雜位置環(huán)境的適應(yīng)能力。
【IPC分類】G05D1-02
【公開號】CN104571113
【申請?zhí)枴緾N201510028275
【發(fā)明人】趙曉萌, 謝月飛, 吳學(xué)純, 王劍邦, 張如高, 虞正華
【申請人】博康智能網(wǎng)絡(luò)科技股份有限公司
【公開日】2015年4月29日
【申請日】2015年1月20日