專利名稱:基于自適應蟻群智能的非線性pid控制參數整定方法
技術領域:
任何比例-微分-積分(Proportional-Integral-Differential,PID)控制器性能的好壞完全依賴于其控制參數的優化。非線性比例-微分-積分(Non-Linear PID,NLPID)控制器是一種新型的控制器,其參數優化方法和技術一直處于不斷發展之中,采用仿生智能方法對NLPID參數進行優化已逐漸成為PID領域中一個關鍵技術。
蟻群算法是新興的人工智能算法,應用蟻群算法已經很好的解決的許多NP類問題。針對一種新型的NLPID控制器的參數優化問題,我們發明了一種基于自適應蟻群智能的控制參數整定方法。本發明是解決NLPID參數整定問題的有效技術途徑,同時,該方法也可應用于解決其它類型控制參數的組合優化問題。
背景技術:
PID控制器本質上是一種對“過去”、“現在”和“未來”信息估計的控制算法。PID控制早在20世紀30年代末期就已經出現,迄今經歷了近70年的不斷更新換代,由于其具有算法簡單、使用方便、魯棒性好、可靠性高等優點,目前在控制工程領域中仍有約90%的控制回路具有PID結構。
常規PID控制算法本身具有一定的局限性,如下 (1)對于在實際應用場合中的常規PID控制器,由于受到參數優化方法煩雜的困擾,往往優化不良,性能不佳; (2)常規PID參數優化目前在工程中多采用經驗法、試湊法等方法,這些方法費時又費力,且往往優化效果不佳; (3)常規PID控制作為一種線性控制方法,對于噪聲干擾以及復雜非線性系統往往很難得到好的控制效果。
為了改善其性能,國際上很多學者對PID控制算法進行了大量的研究和改進,出現了NLPID控制、選擇性PID-PD控制、I-PD控制、魯棒PID控制、智能PID控制以及自適應PID控制等許多新型的PID控制算法。
任何PID控制器性能的好壞完全依賴于其控制參數的優化。幾十年來,PID控制器的參數優化方法和技術一直處于不斷發展之中,控制領域中的許多重要國際雜志(如Automatica、IEEE匯刊等)不斷發表了一些新的研究成果,其中Hang C.C.等對經典的Z-N法進行了改進,進而提出了RZN法;Astrom K.J.等則以系統具有期望的相位裕度為指標提出兩種PID參數優化方法;Ho W.等提出了一種利用幅值裕度和相位裕度優化PID參數的方法;Ota T.等和Lin C.L.等提出了利用改進的GA來優化PID參數的方法;Liu Y.J.等和Gaing Z.L.提出了一種利用PSO算法來優化PID參數的方法;等等。
本發明在對NLPID參數整定問題的解決中采用蟻群智能的如下特點 (1)在螞蟻不斷散布生物信息激素的加強作用下,新的信息會很快被加入到環境中。而由于生物信息激素的蒸發更新,舊的信息會不斷被丟失,體現出一種動態特性; (2)由于許多螞蟻在環境中感受散布的生物信息激素同時自身也散發生物信息激素,這使得不同的螞蟻會有不同的選擇策略,具有分布性; (3)最優路線是通過眾多螞蟻的合作被搜索得到的,并成為大多數螞蟻所選擇的路線,這一過程具有協同性; (4)螞蟻個體之間、群體之間以及與環境之間的相互作用、相互影響、相互協作,可以完成的復雜的任務,這種適應性表現為蟻群算法的魯棒性; (5)自組織使得螞蟻群體的行為趨向結構化,其原因在于包含了一個正反饋的過程。這個過程利用了全局信息作為反饋,正反饋使系統演化過程中較優解的自增強作用,使得問題的解向著全局最優化的方向不斷變化,最終能有效地獲得相對較優解。
蟻群算法尋優過程中所體現出的并行性、協同性、自組織性、動態性、強魯棒性等特點與控制參數整定的許多要求是相符的。用改進的自適應蟻群智能整定NLPID控制參數可以不依賴被控對象的精確數學模型,能有效地攻克十分困難的優化問題,使處理問題更具靈活性、適應性和魯棒性。同時,可提高NLPID參數整定的實時性,滿足復雜系統的實時控制要求,也可用于解決其它類型控制參數的組合優化問題。
發明內容
蟻群算法是一種最新發展的仿生智能優化算法,該算法模擬了自然界螞蟻的群體覓食行為。自然界中,螞蟻通過相互協調完成相對其本身來說比較艱巨的任務,科學家發現螞蟻總能在較短的時間尋找到其巢穴與食物源之間最短的路徑。蟻群算法最早用來成功地解決了著名的旅行商問題(Traveling Salesman Problem)。目前人們對蟻群算法的研究已經由當初單一的旅行商問題領域滲透到了多個應用領域,由解決一維靜態優化問題發展到解決多維動態組合優化問題,由離散域范圍內的研究逐漸拓展到了連續域范圍內的研究,而且在蟻群算法的硬件實現上也取得了很多突破性進展,從而使這種新興的仿生優化算法展現出勃勃生機和廣闊的發展前景。
蟻群算法的主要特點是正反饋、并行性及分布式計算。正反饋過程使得該方法能較快地發現問題的較好解;分布式易于并行實現,與啟發式算法相結合,使得該方法易于發現更好的解。
經過生物學家研究,發現螞蟻之間是通過一種稱為信息激素的化學物質來互相通信,并互相影響,真實的螞蟻外出覓食的時候會不斷地在經過的路徑上分泌信息素,記錄自己經過的路線,路徑上的信息素濃度將影響后續螞蟻的行進路線。對于較短的路徑,在單位時間內經過的螞蟻數量較多,路徑上的信息素濃度較高,吸引著較多的螞蟻沿該路徑搜索;對于距離較長的路徑,由于單位時間內經過的螞蟻數量較少,路徑上的信息素濃度較低;而且信息素會隨著時間而揮發,從而較長的路徑的信息素濃度弱化就會比較明顯,而對于較短路徑則由于經過的螞蟻數量較多,信息素濃度的衰減作用就顯得次要,主要體現為信息素濃度被經過的螞蟻增強,從而形成了一種正反饋。這種正反饋機制為蟻群尋找最優路徑提供了可行性。螞蟻走過的路徑越短,信息激素濃度越高,而信息激素濃度越高,吸引的螞蟻越多,最后所有的螞蟻都集中到信息激素濃度最高的一條路徑上,這條路徑就是從巢穴到食物源的最短路徑。
圖1為真實螞蟻的覓食過程。
蟻群算法實際上是一類智能多主體系統,其自組織機制使得蟻群算法不需要對所求問題的每一方面都有詳盡的認識。自組織本質上是蟻群算法機制在沒有外界作用下使系統熵增加的動態過程,體現了從無序到有序的動態演化,其邏輯結構如圖2所示。
蟻群算法的數學模型為設bi(t)表示t時刻位于元素i的螞蟻數目,τij(t)為t時刻路徑(i,j)上的信息量,n表示TSP規模,m為蟻群中螞蟻的總數目,則;Γ={τij(t)|ci,cjC}是t時刻集合C中元素(城市)兩兩連接lij上殘留信息量的集合。在初始時刻各條路徑上信息量相等,并設τij(0)=const,基本蟻群算法的尋優是通過有向圖g=(C,L,Γ)實現的。
螞蟻k(k=1,2,…,m)在運動過程中,根據各條路徑上的信息量決定其轉移方向。這里用禁忌表tabuk(k=1,2,…,m)來記錄螞蟻k當前所走過的城市,集合隨著tabuk進化過程作動態調整。在搜索過程中,螞蟻根據各條路徑上的信息量及路徑的啟發信息來計算狀態轉移概率。pijk(t)表示在t時刻螞蟻k由元素(城市)i轉移到元素(城市)j的狀態轉移概率
式中,allowedk={C-tabuk}表示螞蟻k下一步允許選擇的城市。α為信息啟發式因子,表示軌跡的相對重要性,反映了螞蟻在運動過程中所積累的信息在螞蟻運動時所起的作用,其值越大,則該螞蟻越傾向于選擇其它螞蟻經過的路徑,螞蟻之間協作性越強;β為期望啟發式因子,表示能見度的相對重要性,反映了螞蟻在運動過程中啟發信息在螞蟻選擇路徑中的受重視程度,其值越大,則該狀態轉移概率越接近于貪心規則。ηij(t)為啟發函數,其表達式如下 式中,dij表示相鄰兩個城市之間的距離。對螞蟻k而言,dij越小,則ηij(t)越大,pijk(t)也就越大。顯然,該啟發函數表示螞蟻從元素(城市)i轉移到元素(城市)j的期望程度。
為了避免殘留信息素過多引起殘留信息淹沒啟發信息,在每只螞蟻走完一步或者完成對所有n個城市的遍歷(也即一個循環結束)后,要對殘留信息進行更新處理。這種更新策略模仿了人類大腦記憶的特點,在新信息不斷存入大腦的同時,存貯在大腦中的舊信息隨著時間的推移逐漸淡化,甚至忘記。由此,t+n時刻在路徑(i,j)上的信息量可按如下規則進行調整 τij(t+n)=(1-ρ)·τij(t)+Δτij(t)(3) 式中,ρ表示信息素揮發系數,則1-ρ表示信息素殘留因子,為了防止信息的無限積累,ρ的取值范圍為ρ
,β1[770,790],β2
; 第二步循環次數NC←NC+1; 第三步螞蟻的禁忌表索引號k=1; 第四步螞蟻數目k←k+2; 第五步每兩只螞蟻作為一個派對共同選擇一個最優解空間節點作為起點; 第六步螞蟻甲根據狀態轉移概率公式(14)計算的概率選擇最優解空間節點j1并前進,j1∈{C-tabuk};螞蟻乙也根據狀態轉移概率公式(14)計算的概率選擇最優解空間節點j2并前進,j2∈{C-tabuk-j1}
第七步當前路徑長度大于本次20只螞蟻相遇循環的最短路徑,則終止此次相遇循環; 第八步修改禁忌表指針,即選擇好之后將螞蟻移動到新的最優解空間節點,并把該最優解空間節點移動到該螞蟻個體的禁忌表中; 第九步若集合C中最優解空間節點未遍歷完,即k<20,則跳轉到Step4,否則繼續到下一步Step10; 第十步根據螞蟻所走過的路徑,利用式(10)計算該路徑對應的NLPID控制系數β0、β1及β2,利用式(12)和(13)計算螞蟻所對應的目標函數值,記錄對應著本次循環周期中ITAE最小性能指標的最優路徑,并將其對應的NLPID控制參數存入控制系數β0、β1及β2中 第十一步按照公式(17)自適應調節信息素殘留系數ρ
第十二步根據公式(15)和(16)更新每條路徑上的信息素軌跡
第十三步如果循環次數NC≥100或整個蟻群已經收斂到同一條路徑,則循環結束并輸出最優空間節點路徑及其所對應的NLPID控制系數β0、β1及β2,否則清空禁忌表并跳轉到Step2。
用改進后的自適應蟻群算法連續進行了10次數字仿真所得的最優解均值為。目標函數J隨迭代次數的進化過程如圖6所示。
由圖6可見,最優目標函數J能夠以極快的速度收斂下來,從而尋到滿意的結果,具有良好的收斂性和穩定性。
圖7給出了采用自適應蟻群智能整定NLPID控制參數的飛行仿真轉臺系統跟蹤帶噪聲的標準信號和跟蹤帶噪聲的隨機信號時的運行情況。采用的帶噪聲標準正弦信號為r(t)=5sin(πt)+σ(t),帶噪聲隨機信號為r(t)=1.5sin(2πt)+0.5cos(6πt)+σ(t),其中,σ(t)為5%的白噪聲,即|σ(t)|<0.05。
圖7(a)為跟蹤帶噪聲標準正弦信號時的運行情況;圖7(b)和圖7(c)分別為圖7(a)中標注為1和標注為2的局部放大圖;圖7(d)為跟蹤帶噪聲隨機信號時的運行情況。
權利要求
1.基于自適應蟻群智能的非線性PID控制參數整定方法,其特征在于該方法的具體步驟如下
第一步根據實際控制系統模型特征確定非線性PID控制器中的參數ρ0、α′、δ、δ1、δ2、R1及R2,并估計非線性PID控制器中系數β0、β1、β2最優解的范圍,然后在變量區域內打網格,分成
個小的空間區域;令時間t=0和循環次數NC=0,設置螞蟻數目m及最大循環次數NCmax,將m個螞蟻置于n個小的空間區域的節點上,令最優解空間區域內每條邊(i,j)的初始化信息量τij=const,ρmin=const,且初始時刻Δτij=0,其中const表示常數;
第二步循環次數NC←NC+1;
第三步螞蟻的禁忌表索引號k=1;
第四步螞蟻數目k←k+2;
第五步每兩只螞蟻作為一個派對共同選擇一個最優解空間節點作為起點;
第六步螞蟻甲根據狀態轉移概率公式
式中,allowedl表示螞蟻l下一步允許走過的空間網格路徑點的集合,τij為螞蟻l鄰域內的信息素數量,α為信息啟發式因子,β為期望啟發式因子;
以該公式計算的概率選擇最優解空間節點j1并前進,j1∈{C-tabuk);螞蟻乙也根據該狀態轉移概率公式計算的概率選擇最優解空間節點j2并前進,j2∈{C-tabuk-j1};
第七步當前路徑長度大于本次m只螞蟻相遇循環的最短路徑,則終止此次相遇循環;
第八步修改禁忌表指針,即選擇好之后將螞蟻移動到新的最優解空間節點,并把該最優解空間節點移動到該螞蟻個體的禁忌表中;
第九步若集合C中最優解空間節點未遍歷完,即k<m,則跳轉到第四步,否則繼續到下一第十步;
第十步根據螞蟻所走過的路徑,利用下列公式
計算該路徑對應的非線性PID控制系數β0、β1及β2,利用公式
式中,T表示仿真計算步長,N表示仿真計算的總點數;
設螞蟻總數為m,尋優時,將螞蟻按照隨機原則散布在空間網格點上,對于每個螞蟻l,定義其評價函數值為i點的目標函數Ji和相鄰為j點的目標函數Jj的差值,并記
ΔJij=Ji-Jj,i,j
利用上列公式計算螞蟻所對應的目標函數值,記錄對應著本次循環周期中ITAE最小性能指標的最優路徑,并將其對應的NLPID控制參數存入控制系數β0、β1及β2中;
第十一步按照公式
自適應調節信息素殘留系數ρ;
第十二步根據下列公式
式中,ρ為信息素的殘留系數,Δτijl表示第l只螞蟻本次循環中在路徑ij上留下的單位長度的信息素物質,可用下式來進行計算
式中,Q是常數,Jl表示第l只螞蟻在本次循環中的目標函數計算值;
按照上列公式更新每條路徑上的信息素軌跡;
第十三步如果循環次數NC≥NCmax或整個蟻群已經收斂到同一條路徑,則循環結束并輸出最優空間節點路徑及其所對應的非線性PID控制系數β0、β1及β2,否則清空禁忌表并跳轉到第二步。
全文摘要
本發明提供了一種基于自適應蟻群智能的非線性PID控制參數整定方法。它包括如下步驟估計非線性PID控制器中待定系數最優解的范圍;在變量區域內打網格,分成多個空間區域;設定蟻群算法的初始參數及禁忌表索引指針,每兩只螞蟻作為一個派對共同選擇某一節點作為起點;兩只螞蟻分別根據狀態轉移概率選擇最優解空間節點并前進;修改禁忌表指針,根據螞蟻所走過的路徑,計算該路徑對應的非線性PID控制的待定系數,并計算螞蟻所對應的目標函數值,且記錄本次循環周期中ITAE最小性能指標;隨后將其對應的非線性PID控制參數存入控制系數中,同時自適應調節信息素殘留系數,并更新每條路徑上的信息素軌跡。如此循環,直至得到最優結果。
文檔編號G05B13/02GK101118421SQ20071012177
公開日2008年2月6日 申請日期2007年9月13日 優先權日2007年9月13日
發明者段海濱, 王道波, 于秀芬 申請人:北京航空航天大學