一種保魯棒性的pid控制參數優化方法
【專利摘要】本發明公開一種保魯棒性的PID控制參數優化方法,先采用約束粒子群優化算法,將控制器的性能指標和控制器所要滿足的約束條件進行綜合,形成帶約束條件的性能指標函數,從而將約束優化問題轉化為一般的非約束優化問題,再采用標準粒子群算法獲得滿足約束條件的最優PID控制參數。此種優化方法可搜索最優的PID控制器參數,使得所得到的控制器滿足μ綜合魯棒性指標,并進一步將該PID控制器參數優化方法應用于導彈PID控制器。
【專利說明】
-種保魯棒性的PID控制參數優化方法
技術領域
[0001] 本發明屬于自動控制技術領域,特別設及一種保魯棒性的PID控制參數優化方法。
【背景技術】
[0002] 導彈的控制器設計是導彈實現自動攻擊目標的關鍵技術之一,控制器設計的好壞 直接關系到導彈的飛行品質和脫祀量指標,是導彈飛行控制系統設計的核屯、內容。目前的 導彈機絕大多數采用PID控制器,隨著導彈控制技術的發展,如第五代空對空格斗導彈等, 一個日益突出的要求是需要所設計的控制器滿足多變量魯棒性指標。
[0003] 傳統的導彈PID控制律設計方法是單通道設計多通道驗證的方法,并且所采用的 單通道設計方法只能采用幅值裕度、相角裕度等傳統單通道魯棒性指標,且傳統魯棒方法 設計的控制器存在階數過高難W實現的弱點,而經典PID控制方法實現簡單但又無法在設 計過程中保證多變量系統的魯棒性能。近年來,采用非線性優化算法來解決控制器優化設 計問題的研究已逐步進入應用階段。
【發明內容】
[0004] 本發明的目的,在于提供一種保魯棒性的PID控制參數優化方法,其可捜索最優的 PID控制器參數,使得所得到的控制器滿足y綜合魯棒性指標,并進一步將該PID控制器參數 優化方法應用于導彈PID控制器。
[0005] 為了達成上述目的,本發明的解決方案是:
[0006] -種保魯棒性的PID控制參數優化方法,先采用約束粒子群優化算法,將控制器的 性能指標和控制器所要滿足的約束條件進行綜合,形成帶約束條件的性能指標函數,從而 將約束優化問題轉化為一般的非約束優化問題,再采用標準粒子群算法獲得滿足約束條件 的最優PID控制參數。
[0007] 上述優化方法具體包括如下步驟:
[000引步驟A、確定粒子種群數量N和優化最大代數kmax ;
[0009] 步驟B、在粒子的取值范圍內初始化粒子種群每一個粒子的位置和速度;
[0010] 步驟C、采用y分析方法計算魯棒性指標,同時計算時域性能指標作為約束條件并 進行性能指標函數的綜合;
[0011] 步驟D、判斷當前最優值是否滿足性能指標停止條件或達到最大優化代數,如滿足 二者之一即停止算法并轉到步驟F;
[0012] 步驟E、更新每個粒子的位置并轉到步驟C;
[OOU]步驟F、輸出最優粒子的位置和對應的性能指標函數值。
[0014]上述步驟A中,通過下式將約束優化問題轉化為非約束優化問題:
[001引靡為的 [0016]其中fm(x)定義為:
[0017]
[001引其中,f (X)為原目標函數,hmax(x): =max( Iihl(X),h2(x),--,hn(X)])表示當前所 有約束條件中違反量最大的約束條件。
[0019] 上述優化方法應用的ii-PID控制器設計描述為:給定目標函數
[0020]
[0021] 捜索其最小值并滿足由時域響應指標組成的約束條件;其中u = K(s,x)y表示控制 器,X G Rm為控制器參數,S為復數域自變量。
[0022] 上述ii-PID控制器的樣例導彈在15000米高度、2.8馬赫、40度攻角下的特征工作點 縱向通道狀態空間模型,其狀態方程為:
[0023]
[0024]
[0025]
[0026] 式中:u、w分別為縱向和法向速度,a為攻角,q為俯仰角速率,Az為法向加速度A為 等效升降艙偏角。
[0027] 采用上述方案后,本發明利用一種改進的粒子群優化算法一簡便約束粒子群優化 算法捜索最優的PID控制器參數,并進一步將該PID控制器參數優化方法應用于導彈的保魯 棒性PID控制器。所述簡便約束粒子群優化算法的基本思想是采用目標函數替換的方法將 約束優化問題轉化為非約束優化問題,具有簡便易用的優點。利用本發明PID控制器參數優 化方法對導彈PID控制器進行優化,所得到的導彈PID控制器能夠在滿足傳統時域指標的同 時使得多變量魯棒性指標---y值最小,即具有最佳的魯棒性能。。
[0028] 相比現有技術,本發明具有W下有益效果:
[0029] (1)所得到的控制器在滿足時域指標的同時可W保證魯棒性指標一 y值最小;
[0030] (2)對約束條件進行綜合時沒有引入任何新的算法參數;
[0031] (3)相比于現有約束PSO算法,本發明的綜合算法更加簡單;
[0032] (4)對原目標函數沒有連續可微等要求;
[0033] (5)具有優良的捜索性能。
【附圖說明】
[0034] 圖I是標準帶不確定性反饋控制系統結構示意圖;
[0035] 圖2是本發明中進行魯棒性分析是采用的y分析結構示意圖;
[0036] 圖3是導彈Raytheon駕駛儀的俯仰/偏航通道PID控制器結構示意圖;
[0037] 圖4是采用罰函數法PSO算法對樣例導彈縱向通道PID控制器參數進行優化時的性 能指標函數收斂性曲線;
[0038] 圖5是采用ALPSO算法對樣例導彈縱向通道PID控制器參數進行優化時的性能指標 函數收斂性曲線;
[0039] 圖6是采用本發明對樣例導彈縱向通道PID控制器參數進行優化時的性能指標函 數收斂性曲線;
[0040] 圖7是對本發明結果進行驗證的樣例導彈閉環系統仿真結構示意圖;
[0041 ]圖8是獲得的PID控制器魯棒特性曲線圖;
[0042] 圖9是獲得的PID控制器對標稱系統的階躍響應圖;
[0043] 圖10是獲得的PID控制器對攝動系統的階躍響應圖。
【具體實施方式】
[0044] W下將結合附圖,對本發明的技術方案進行詳細說明。
[0045] 本發明提供一種保魯棒性的PID控制參數優化方法,它是先采用約束粒子群優化 算法,將控制器的性能指標和控制器所要滿足的約束條件進行綜合,形成新的帶約束條件 的性能指標函數,從而將約束優化問題轉化為一般的非約束優化問題,再采用標準粒子群 算法獲得滿足約束條件的最優PID控制參數,所述優化方法具體包括如下步驟:
[0046] 步驟A、確定粒子種群數量N和優化最大代數kmax ;
[0047] 步驟B、在粒子的取值范圍內初始化粒子種群每一個粒子的位置和速度;
[0048] 步驟C、采用y分析方法計算魯棒性指標,同時計算時域性能指標作為約束條件并 進行性能指標函數的綜合;
[0049] 步驟D、判斷當前最優值是否滿足性能指標停止條件或達到最大優化代數,如滿足 二者之一即停止算法并轉到步驟F;
[0050] 步驟E、更新每個粒子的位置并轉到步驟C;
[0051 ]步驟F、輸出最優粒子的位置和對應的性能指標函數值。
[0052] W下將對本發明中的幾個技術特征進行詳細說明。
[0化3] UPSO算法
[0化4] 粒子群優化算法是由美國社會屯、理學家化mes Kennedy和電氣工程師Russell 化6^1曰的在1995年共同提出的一種進化計算技術,它是一種通過模擬鳥類群體行為進行建 模與仿真研究而發展起來的一種基于群體協作的隨機捜索算法,屬于群體智能捜索算法的 一種,也稱為微粒群算法。該算法原理是從一組隨機的初始值出發,采用基于鄰域的捜索技 術,通過迭代來尋找最優解,在每一次迭代中,粒子通過個體極值(粒子本身找到的最優解) 和群體極值(種群目前找到的最優解)來更新自己。由于粒子群優化算法其算法本身結構簡 單,并在多種復雜非凸優化問題的應用中表現優異,近年來引起了越來越多的關注。
[0化5] 1.1標準PSO算法
[0056]在PSO算法中,每一個優化問題的解作為一只單個的鳥,或稱為粒子,粒子的屬性 包括其位置X和速度V。每個粒子在多維空間中依據個體經驗和群體中其他粒子的經驗來動 態調整自身移動的軌跡與速度。在第k次迭代中,第i個粒子Xi=(Xi,l,Xi,2, . . .,Xi,m) GRm依 據W下公式對位置和速度進行調整:
[0057] (1)
[0化引 (2)
[0059] (3)
[0060] 泌
[006。 其中,為粒子i在第k次迭代時第d維位置,Xmax,d,Xmin,d為粒子在第d維的最遠和 最近位置,粒子的運動被設定為不能超過此邊界;vf,為粒子i在第k次迭代時第d維速度, Vmax,d為粒子在第d維的最大速度,粒子的運動被設定為不能超過此最大速度;it/為粒子i個 體當前在第d維位置的最優值;為粒子群體當前在第d維位置的最優值;Cl為粒子個體 認知加速常數,C2為群體認知加速常數,參數Cl和C2分別代表了個體自身行為和群體行為對 個體影響的大小;(I4、結是介于[0,1]之間的隨機數;《為慣性系數,代表了粒子的運動慣 性,按照運動慣性隨進化代數逐漸減小的原則,其表達式為:
[0062]
試
[0063] 式中:Omax和Wmin分別為W的最大值與最小值;kmax為最大進化代數。
[0064] 1.2本發明設及的約束PSO算法
[0065] 粒子群優化算法最初是作為一種非約束優化算法被提出的,然而在大量的工程實 踐中,有相當多的應用屬于要求滿足一定不等式約束條件下的優化問題。典型的約束PSO算 法有自適應懲罰函數粒子群優化算法和ALPSO算法,然而運兩種算法均有一些如前所述不 足之處。為了克服運些不足,本發明提出了一種新型簡便易用的約束PSO算法。
[0066] -般約束優化問題可W描述為:
[0067] mm/(X) , F = |xe r?|M-t)<〇1 始)
[0068] 其中,函數h(x):=比I(X),h2(x),--,hn(x)],(Rm一Rn)表示約束條件,F表示所有 可行的區域,在本發明中,假設F為非空集合。
[0069] 本發明采用如下一種新穎簡便的方法將式(6)所描述的約束優化問題轉化為式 (7)所示的非約束優化問題,在該過程中不需要增加任何新的算法參數。
[0070] 曾9 乂"W (7)
[0071]其中fm(X)定義為:
[0072]
(S)
[007;3]其中,f (X)為原目標函數(性能指標函數),hmax(x): =max( Iihi(X) ,h2(x), . . . . ,hn (X)])表示當前所有約束條件中違反量最大的約束條件。在自適應罰函數法中,每一步都需 要考慮所有的約束條件,顯然是沒有必要的。取arctan(f (X))的形式可W使得函數在(―, + -)上為單調增函數,同時,當粒子未處于可行域時(約束條件不滿足的區域),即hmax(X)> 0時,考慮融合約束條件時采用指數函數的形式更加有利于在算法的初始階段擴大捜索范 圍而在算法末段通過細致捜索從而增大得到最優值的概率。為了使得粒子能夠進入可行 域,即當hmaxUlk" Khmax(Xik)時,能滿足fmUik" Kfm(Xik),因此運里把底數取為 arctan(/切) + 1 + 1。另外,當批處于可行域時,即hmaxUKO,只考慮原目標函數,且減去y使優 化算法保持W下特性:當依據式(1)-式(4)進化到下一代,即使此時(xf") > O,出現 /,,(AfI)Sl的情形,因為fm(Xlk)<0<l《fm(Xlk"),ff+l與g放,,仍將處于可行域中。可見,依據 上述原理,所有違反約束條件的粒子都具有自動回到可行域的趨勢。
[0074] 顯然,當式(8)所示的fm(X)取得最優值時,原目標函數f(x)也取得最優值,且所有 的約束條件均得到滿足。此時,原約束優化問題就轉化為了非約束優化問題,可W采用1.1 節的標準PSO算法進行尋優。
[0075] 本文提出的算法最大的優勢在于其簡便性,它不需要像ALPSO算法那樣要求目標 函數連續可微,也不需要像自適應罰函數法那樣增加新的需調參數。在后續內容中,該算法 將與ALPSO算法、罰函數法進行性能比較。
[0076] 2、算法性能測試
[0077] 目前,非線性優化算法的優劣尚不能從理論上進行證明,通常只能通過測試函數 的實測結果來進行比較。為了驗證所提出的約束粒子群優化算法的性能,在本部分內容中 采用了多個標準測試函數來對其性能進行全面測試與驗證,其中包含24個標準測試函數, 我們選擇了其中帶不等式約束的單目標優化問題共12個測試函數,運些測試函數在約束優 化算法的性能測試中被廣泛采用。
[0078] 表1=種約束優化算法測試結果 「00701
「00801
[0081 ] 測試程序在Matlab7.8環境下運行,采用一臺Intel巧CPU PC機,內存為4G字節。 每個任務運行30次,算法停止的條件是達到最大進化代數1000。同時為了與前述自適應罰 函數法PSO算法、ALPSO算法進行對比,對運兩種算法也進行了同樣的測試。在進行比較分析 時,粒子群算法參數取為:
[0082] ?粒子數量:30
[0083] ?粒子維數:依測試函數
[0084] ?粒子最大移動速度:Vmax, d = Xmax, d/2
[0085] 參學習因子:ci = 2,C2 = 2
[0086] ?慣性系數最大與最小值:Wmax = O . 9 ,Wmin = O . 4
[0087] ?最大捜索代數:1000
[0088] 測試結果如表1所示,顯然,本發明提出的簡便約束PSO算法在處理帶約束的優化 問題中具有優越的性能,對測試函數尋優的成功率明顯高于自適應罰函數PSO算法和ALPSO 算法,并且得到的最終優化結果及其分布特性也優于上述兩種算法。
[0089] 3、導彈y-PID控制器設計
[0090] 3.1理論分析
[0091 ] 結構奇異值]i(structured Singular Value)是一種線性代數工具,用來定量地表 征結構化不確定性對線性動態系統穩定性及性能的影響。相比于方法,y綜合方法可W同 時分析控制系統的魯棒穩定性和魯棒性能。
[0092] 3.1.化分析方法
[0093] 對任意多輸入不確定線性閉環系統,可W從圖1看出。其中M代表系統傳遞函數矩 陣,由控制器和控制對象構成。
[0094] AeAVA,代表模型不確定性,即作為控制對象的數學模型與實際對象存在的差異, 且有:
[0095]
魄
[0096] 及叫AgS間A)叫 (1日)
[0097] 其中
I示A的最大奇異值。
[0098] 若系統不確定性A滿足式(10),則系統傳遞函數矩陣M的結構奇異值定義為:
[0099]
(11)
[0100] 直接按照式(11)來求解結構奇異值y是非常困難的,通常采用的是一種逼近方法。 首先計算y值的上下界,當上下界之差足夠小時,取其為近似值,該方法稱為"D-r迭代法, 由Doyle在1985年提出。
[0101] 3.1.化-PID控制器設計問題
[0102] y分析問題可由圖2表示,在此結構中,M代表廣義控制對象W及控制器,Wi表示外 部輸入信號,Z2和W2分別表示模型不確定性的輸入和輸出信號,Zl表示控制輸出信號。此時 系統E (s,x)可分解為如下形式:
[0103] (12)
[0104] -PID控制器設計可W描述為:給定目標函數
[0105] (。)
[0106] 捜索其最小值并滿足由時域響應指標組成的約束條件。其中式(13)中的K(s,x)表 示控制器,X G Rm為控制器參數,S為復數域自變量。
[0107] 3.2導彈控制設計與仿真
[0108] 樣例導彈采用基于多工作點線性化模型的控制律設計,六自由度非線性模型驗證 的方法,因此本發明中控制律設計仍W線性化模型為設計對象。W樣例導彈在15000米高 度、2.8馬赫、40度攻角下的特征工作點縱向通道狀態空間模型為例,其狀態方程為:
[0109
[0110
[0111
[011 ^ 式中:U、w分別為縱向和法向速度,a為攻角,q為俯仰角速率,Az為法向加速度,Se為 等效升降艙偏角。
[0113] 導彈的定結構控制器可W有各種形式,如姿態控制器、迎角控制器和過載控制器 等,每種控制器依據控制對象本身的特性和控制需求還可W細分為更多的回路控制結構。 不失一般性,本文W經典Raytheon駕駛儀控制結構為例,其縱向控制結構如圖(3)所示。
[0114] 樣例導彈縱向通道所需滿足的時域性能指標如表2所示:
[0115] 表2縱向通道階躍響應性能指標
[0116]
[0117]由于控制參數均為正值,為了縮小捜索空間的范圍,將待尋優的控制參數轉換為: [011 引(Xel Xe2 Xe3 Xe4) = Qogioiy IogiokS l0gl0k4 IogiokO)
[0119] 此時,根據手工設計的經驗,待尋優參數的范圍可W設置為:
[0120] A fe: = {(Xel,Xe2,Xe3,Xe4) GR4:-2<Xei<2, i = 1,2,3,4},樣例導彈定結構魯棒控制 問題即為在滿足上述階躍響應時域性能指標的約束條件下尋找優化參數
目得目標函數y取得最小值。 L0121」由于導彈的ii-PID控制器的設計問題相比于測試函數而言要復雜得多,計算量也 大很多,依據多輪設計與仿真的經驗,此時簡便約束PSO算法的參數可W取為:
[0122] ?粒子數量:20
[0123] ?粒子維數:4
[0124] 參粒子最大移動速度:Vmax, d = Xmax, d/2i = l. . .4,
[0125] 參學習因子:ci = 2,C2 = 2
[0126] ?慣性系數最大與最小值:Wmax = O . 9 ,Wmin = O . 4
[0127] ?最大捜索代數:20
[01 %] ?每個任務運行次數:50
[0129] ?終止條件:達到最大代數
[0130] 采用如上所述性能指標函數和約束條件,基于S種不同PSO算法的優化結果如表 3-表5所示:
[0131] 表3罰函數PSO算法優化結果 rni39i
[0138]由表3-表5可知,罰函數PSO算法所得到的蘭種y值均最大,y最小值大于1,表明該 優化方法所得到的控制器魯棒性較差;ALPSO算法總體性能次之;本發明提出的簡便約束 PSO算法顯然具有最佳的性能,并且傳統的幅值和相角裕度指標也驗證了運一結果。基于上 述S種PSO算法的目標函數收斂性曲線如圖4-圖6所示。
[0139] 由圖4-圖6明顯可見,相比于罰函數PSO算法和ALPSO算法,本發明提出的簡便約束 PSO算法在設計樣例導彈縱向通道控制律過程中具有最好的統計收斂特性。
[0140] 在簡便約束PSO算法得到的50次結果中,選取最優值結果:iy = 0.97,K5 = 0.2,K4 =2.44,K0 = 0.41作為控制參數,并且在圖7所示的俯仰通道閉環系統中,模型不確定性函 數和噪聲干擾的大小分別取為:模型不確定性權函數Win:2 ? (s+3.2)/(s+160);加速度計 噪聲:1 % ;角速率巧螺噪聲:0.1 % ;
[0141 ]對閉環控制系統的頻域和時域性能分析如下:
[0142] (1)頻域性能分析
[0143] a.魯棒穩定性分析
[0144] 圖7所示的俯仰通道閉環系統中,令外輸入為0,僅考慮輸入端乘型不確定性A in 作用下Zl的響應。圖8所示從dl到Zl的傳遞函數的結構奇異值上界曲線。由圖中可見結構奇 異值均在0.3 W下,表明系統具有良好的魯棒穩定性。
[0145] b.魯棒性能分析
[0146] 考察在外輸入和輸入端乘型不確定性同時作用下系統的性能。如圖8下圖所示,結 構奇異值均在IW下,表明系統的魯棒性能也滿足指標要求。
[0147] (2)時域性能分析
[0148] a.標稱系統單位階躍響應
[0149] 圖7所示的俯仰通道閉環系統中,令Ain = O且擾動d2 = 0,僅考慮俯仰通道過載命 令Azg=I作用下系統的階躍響應。從圖9可見,系統的標稱性能滿足表2所示的時域性能指 標。
[0150] b.攝動系統單位階躍響應
[0151] 在外輸入和輸入端乘型不確定性同時作用下系統的階躍響應如圖10所示,可知系 統在攝動下的性能仍然滿足表2所示的時域性能指標,從而印證了頻域分析的結果。
[0152] 根據上述實例可W看出本發明所提出的簡便約束粒子群優化算法用于PID控制器 參數優化的優越性,本發明方法尤其適合于導彈魯棒PID控制器設計,使得所設計的無人機 PID控制律能夠在滿足傳統時域指標的同時能保證多變量魯棒性指標---y值最小,即具有 最佳的魯棒性能。
[0153] W上實施例僅為說明本發明的技術思想,不能W此限定本發明的保護范圍,凡是 按照本發明提出的技術思想,在技術方案基礎上所做的任何改動,均落入本發明保護范圍 之內。
【主權項】
1. 一種保魯棒性的PID控制參數優化方法,其特征在于:先采用約束粒子群優化算法, 將控制器的性能指標和控制器所要滿足的約束條件進行綜合,形成帶約束條件的性能指標 函數,從而將約束優化問題轉化為一般的非約束優化問題,再采用標準粒子群算法獲得滿 足約束條件的最優PID控制參數。2. 如權利要求1所述的一種保魯棒性的PID控制參數優化方法,其特征在于:所述優化 方法具體包括如下步驟: 步驟A、確定粒子種群數量N和優化最大代數kmax; 步驟B、在粒子的取值范圍內初始化粒子種群每一個粒子的位置和速度; 步驟C、采用μ分析方法計算魯棒性指標,同時計算時域性能指標作為約束條件并進行 性能指標函數的綜合; 步驟D、判斷當前最優值是否滿足性能指標停止條件或達到最大優化代數,如滿足二者 之一即停止算法并轉到步驟F; 步驟Ε、更新每個粒子的位置并轉到步驟C; 步驟F、輸出最優粒子的位置和對應的性能指標函數值。3. 如權利要求2所述的一種保魯棒性的PID控制參數優化方法,其特征在于:所述步驟A 中,通過下式將約束優化問題轉化為非約束優化問題: 其中fm(X)定義為:其中,f (X)為原目標函數,hmax(x): =max([hi(x),h2(x),--,hn(x)])表示當前所有約 束條件中違反量最大的約束條件。4. 如權利要求2所述的一種保魯棒性的PID控制參數優化方法,其特征在于:所述優化 方法應用的μ-PID控制器設計描述為:給定目標函數搜索其最小值并滿足由時域響應指標組成的約束條件;其中u = K(s,x)y表示控制器,X e RmS控制器參數,s為復數域自變量。5. 如權利要求4所述的一種保魯棒性的PID控制參數優化方法,其特征在于:所述μ-PID 控制器的樣例導彈在15000米高度、2.8馬赫、40度攻角下的特征工作點縱向通道狀態空間 模型,其狀態方程為: 輸出方程為:式中:u、w分別刃縱冋和、/云冋速度,α刃攻用,q73俯仰用速準,Az方r/云冋刀pm度,心為等效 升降舵偏角。
【文檔編號】G05B13/04GK105955029SQ201610395162
【公開日】2016年9月21日
【申請日】2016年6月6日
【發明人】張民, 陳亮, 夏衛政, 陳欣
【申請人】南京航空航天大學