基于神經網絡的旋翼無人機的自適應逆控制方法
【技術領域】
[0001] 本發明屬于無人機技術領域,設及一種基于神經網絡的旋翼無人機的自適應逆控 制方法。
【背景技術】
[0002] 旋翼無人機是一種能夠垂直起降、W若干個旋翼作為動力裝置、不載操作人員的 一種飛行器。它W能夠垂直起降,任意懸停等靈活的控制方式W及結構簡單噪聲小等特點, 近年來逐步成為了一個研究熱點。由于旋翼無人機動力學模型具有強禪合、欠驅動W及強 非線性等特點,設計出一個有效的旋翼無人機控制器是非常不易的,尤其是在對象模型參 數變化W及外界有干擾的情況下。在現有的技術中,一般的做法是將旋翼無人機動力學模 型進行簡化,W降低其控制器設計的復雜程度,進而利用傳統或現代控制方法對該簡化模 型進行控制器設計。
[0003] 在現有技術對旋翼無人機控制器設計方法中,一般的做法是將旋翼無人機動力學 模型進行簡化處理,來減低其控制器設計難度。但是,簡化動力學模型進行控制器設計也必 將導致系統模型不匹配的問題,進而使得在實際控制中,所設計的控制器達不到理想的控 制效果。
【發明內容】
[0004] 本發明的目的是提供一種基于神經網絡的旋翼無人機的自適應逆控制方法,解決 了現有技術中存在的問題,利用兩個神經網絡分別建立旋翼無人機系統模型的正向模型 和逆向模型,從而實現對完整旋翼無人機的控制和辨識。
[0005] 本發明所采用的技術方案是,一種基于神經網絡的旋翼無人機的自適應逆控制方 法,按照下式進行控制:
[000引其中;n是學習率,巧:+|和町;分別是隱含層中第P個神經元與輸出層中第t個神 經元第n+l次和第n次訓練后的值,C1和C分別是輸入層中第m個神經元與隱含層中第 P個神經元第n+1次和第n次訓練后的值,?
分別表示能力函數Ec對變量 Wtp和Vpm的負梯度方向。
[0009] 本發明的有益效果是,利用神經網絡具有較強的非線性映射能力,對旋翼無人機 完整模型進行控制器設計。利用兩個神經網絡分別建立旋翼無人機系統模型的正向模型和 逆向模型,從而實現對完整旋翼無人機的控制和辨識。系統辨識器(正向模型)的作用是 為系統逆控制器提供學習信號,進而實現逆控制器對外界干擾和旋翼無人機自身參數變化 具有良好的魯椿性。沒有對旋翼無人機系統模型進行任何簡化處理,而直接對完整的旋翼 無人機模型進行控制器設計。由于完整旋翼無人機系統模型與真實旋翼無人機系統具有更 好的一致性,因此本發明設計的控制器在實際旋翼無人機飛行中,具有更好的控制效果。
【附圖說明】
[0010] 圖1是本發明中控制系統框架圖。
[0011] 圖2是處理后的樣本集對系統辨識器的訓練方法圖。
[0012] 圖3是處理后的樣本集對逆系統控制器的訓練方法圖。
【具體實施方式】
[0013] 下面結合附圖和【具體實施方式】對本發明進行詳細說明。
[0014] 建立旋翼無人機理想系統模型情況下的系統辨識器和逆系統控制器,W達到系統 辨識器反映理想系統模型的輸入輸出關系,逆系統控制器反映理想逆系統模型的輸入輸出 關系。當目標信號值輸入到如圖1所示的控制系統時,由于外界干擾、載重變化等原因使得 系統模型輸出與目標輸出產生誤差,通過自適應算法對系統辨識器和逆系統控制器做反饋 校正已使得控制系統對外界干擾和載重變化具有良好的魯椿性。在本發明中,系統辨識器 的作用是建立一個等效于系統對象輸入輸出之間的映射關系,為逆系統控制器提供學習信 息。
[0015] 本發明一種基于神經網絡的旋翼無人機的自適應逆控制方法,具體按照W下步驟 進行:
[0016] 1.訓練樣本集采集
[0017] 白噪聲信號可W激勵出系統的全部特征。因此用幅值一定的白噪聲信號作為樣本 采集時的系統激勵信號,并用該激勵信號激勵旋翼無人機對象,得到該激勵下對象的對應 輸出。循環該操作,得到一個合適大小的訓練樣本集。
[001引 2.樣本處理
[0019] 對樣本集進行篩選處理。由于旋翼無人機在正常飛行過程中姿態角變化不大,因 此在本發明中總是限定姿態角大小在-10°~10°,并W此為標準對輸出超過該范圍的樣 本進行篩選處理。雖然經過處理的樣本弱化了所映射的非線性強度,但是該種處理大大簡 化了神經網絡結構和訓練時間,并且符合旋翼無人機的實際飛行情況。
[0020] 3.確定系統辨識器和逆系統控制器的神經網絡結構
[0021] 神經網絡的輸入層和輸出層的神經元數目是由所需擬合的非線性函數決定的,而 隱含層的神經元數目是由經驗得到的。根據圖2和圖3所示的基于BP原理的訓練方法,可 W確定系統控制器網絡和系統辨識器網絡的輸入層神經元和輸出層神經元數目都為9個 和3個。根據確定隱含層的經驗公式:^ = ^*^ + 〇,其中,111表示隱含層神經元數目,11 表示輸入層神經元數目,1表示輸出層神經元數目,a為1-10之間的常數。因此,可W把隱 含層神經元的數目確定為10個。在本方案中,可W確定系統控制器和系統辨識器采用相同 結構的BP神經網絡;神經網絡各層神經元數采用9X10X3的結構且隱含層激活函數采用S型對數函數,即/W=>(其中,X表示隱含層中各神經元的輸入,f(x)表示隱含層 中各神經元的輸出)。
[0022] 4.系統辨識器和逆系統控制器訓練
[002引根據已確定的神經網絡結構,利用處理后的樣本集對系統辨識器和逆系統控制器 進行訓練,訓練方法如圖2、圖3所示。系統辨識器是利用樣本集中白噪聲信號作為輸入信 號,對應對象輸出信號作為系統辨識器的訓練目標信號進行訓練。逆系統控制器是利用樣 本集中對象輸出信號作為輸入信號,對應的白噪聲信號作為系統控制器的訓練目標信號 進行訓練。
[0024] 5.自適應算法設計
[0025] 根據BP算法原理,設計系統辨識器和逆系統控制器的自適應算法。自適應算法的 具體設計過程在下文給出。
[0026] 6.在線調整
[0027] 當對象實際輸出與目標輸出有誤差時,將該誤差作為反饋信號,利用自適應算法 對系統辨識器和逆系統控制器的網絡權值做反饋調整。
[002引其中,控制系統的自適應算法設計是本發明中的核屯、內容。W下給出基于BP原理 自適應算法設計過程。為了方便后續工作的闡述,給出W下定義和說明:
[0029] 系統辨識器和逆系統控制器的網絡結構都為MXPXT,即輸入層神經元數目為M 個,隱含層神經元數目為P個,輸出層神經元數目為T個。
[0030] 對于逆系統控制器,V= (Vpm)pxM,W= (Wtp)TxP分別表示輸入層與隱含層之間、隱含 層與輸出層之間的連接權值矩陣(Vpm和Wtp分別表式輸入層第m個神經元到隱含層第P個 神經元的連接權值和隱含層第P個神經元到輸出層第t個神經元的連接權值)。并且,為方 便敘述,定義Vp: = (Vpi,Vp2,…,VpM),P= 1,2,…P;Wt: = (Wti,V口,…,Vtp),t= 1,2,…T, 分別表示第一層權值矩陣中與隱含層第P個神經元相關聯的的權值向量和第二層權值矩 陣中與輸出層第t個神經元相關聯的的權值向量。
[0031] 與上述逆控制器對應,在系統辨識器中,Q=(Qpm)pxM,U=扣tp)TXP分別表示輸入 層與隱含層之間、隱含層與輸出層之間的連接權值矩陣(Qpm和Utp分別表式輸入層第m個 神經元到隱含層第P個神經元的連接權值和隱含層第P個神經元到輸出層第t個神經元的 連接權值)。用HI=化Ip)pxi,冊二化〇p)p>a分別表示系統控制器中隱含層的輸入、輸出向 量化Ip和冊P分別表示隱含層中第P個神經元的輸入、輸出),XI,而分別表示系統辨識器 和逆系統控制器的輸入向量。
[003引ya=(4d,白d,ih),y= (4,日,110,少二從例分別為系統目標輸出,系統對 象實際