專利名稱:適用于非線性系統狀態的粒子估計方法
技術領域:
本發明屬于工程領域,具體涉及的是非線性系統狀態估計的技術領域。
技術背景非線性系統狀態估計問題廣泛存在于信號處理及其相關領域中,例如視覺跟 蹤、語音識別、機器人定位、通信和故障檢測等。盡管經過了近半個世紀的發 展,但非線性系統狀態估計方法還較不成熟。
一方面,這是由于非線性系統的復雜性、多樣性所造成的;另一方面,由于非線性系統中各種隨機噪聲的存在, 導致狀態估計更加困難,影響了狀態估計的準確率,為非線性系統狀態估計帶 來了較大的困難。20世紀80年代以來,非線性系統狀態估計方法受到越來越多的 關注,其中最常用的是擴展卡爾曼濾波器。但擴展卡爾曼濾波僅對某些特定的 非線性系統有效,對于一般的非線性系統擴展卡爾曼濾波不能保證其收斂且濾 波誤差較大。近年來一種在非線性系統狀態估計方面^r有獨到優勢的新濾波方 法一粒子濾波得到了迅速的發展,它有效克服了擴展卡爾曼濾波的缺點,并已被 成功應用于眾多非線性系統狀態估計問題中,例如,美國國家航空和宇宙航行 局研制的"火星漫游者"機器人、艦船渦輪發動機、渦輪噴氣飛機發動機等。 粒子濾波是遞歸貝葉斯狀態估計的一種模擬實現方法。它利用大量隨機樣本(或 稱為粒子)代表待估計狀態的后驗概率密度函數。這些粒子通過系統模型按時 間順序向前傳播,從而得到大量系統狀態的路徑樣本。各時刻系統狀態的后驗 概率密度函數用這些粒子來代表。目前比較有實用價值的粒子濾波方法有標準 粒子濾波方法(SIR)、輔助粒子濾波方法(APF)、正則化粒子濾波方法(RPF) 和高斯粒子濾波方法(GPF)。其中,輔助粒子濾波方法、正則化粒子濾波方法 和高斯粒子濾波方法均是標準粒子濾波方法的改進方法。如果用j^表示/r時刻的系統狀態,用"表示j^的觀測值,用{^(/>:/=1,2,...》^}代 表A時刻的所有粒子,用/KvW表示觀測似然函數,則標準粒子濾波方法的步驟可描述為步驟一、粒子預測步驟一將A時刻系統狀態先驗分布作為重要性密度函數并從中抽取隨機粒子^(0:—l,2,…A);步驟二、粒子權值更新步驟一得到A時刻系統狀態觀測值貝后,利用觀測似然函數計算^時刻上述各粒子的似然函數值并將其作為^時刻各粒子的權值即涵啡稀):—1,2"" W;步驟三、系統狀態估計步驟一利用這些粒子及其權值組成的離散概率分布作 為A時刻系統狀態后驗概率分布,去近似A時刻系統狀態的真實概率分布,并用 于A時刻系統狀態估計;步驟四、重采樣步驟一在上述離散概率分布中重新采樣得到新的粒子群,各 粒子的權值等于1/N,然后返回步驟一。輔助粒子濾波方法在標準粒子濾波方法的基礎上,采用輔助方法預先從前一 時刻的粒子樣本中選出較好的預測粒子,以期其粒子組成的離散概率分布接近 系統狀態真實概率分布的可能性更高。實際應用中該方法的估計精度在系統噪 聲較小時好于標準粒子濾波方法,但當系統噪聲較大時精度不如標準粒子濾波 方法。正則化粒子濾波方法改變了標準粒子濾波方法步驟四中的重采樣。不像 標準粒子濾波方法在離散概率分布上重采樣,正則化粒子濾波方法利用正則化 方法獲得一個連續概率分布并從中重采樣。該方法改善了標準粒子濾波方法中 存在的粒子多樣性匱乏問題,但它有一個理論上的缺陷,即所得的粒子離散概 率分布不再能保證是漸進地收斂到系統狀態真實概率分布。實際應用中當粒子 多樣性匱乏問題較嚴重時該方法好于標準粒子濾波方法。高斯粒子濾波方法在 標準粒子濾波方法的基礎上,采用一個高斯分布來近似系統狀態真實概率分布, 并且沒有重采樣步驟。當系統狀態真實概率分布服從高斯分布時該方法的狀態 估計精度優于標準粒子濾波方法。綜上所述,以上四種方法都具有各自的優點,在其所適合的應用范圍內都是 比較有效的。然而在實際非線性系統狀態估計中,系統狀態觀測似然函數常常 具有雙峰特性,這通常導致上述方法的狀態估計精度較差。 發明內容本發明是為解決現有粒子濾波方法在對非線性系統狀態進行估計時,因系 統狀態觀測似然函數具有雙峰特性而導致估計精度較差的問題,進而提供的一 種適用于非線性系統狀態的粒子估計方法。本發明的步驟為步驟一、粒子預測步驟將A時刻系統狀態先驗分布作為重要性密度函數 并從中抽取隨機粒子{^(/):/=1,2,...^}; 步驟二、粒子權值更新步驟(1) 得到A時刻系統狀態觀測值力后,利用觀測似然函數計算/^時刻各粒子 的似然函數值為(/K^^(,W,其中—l,2,…,N;(2) 計算各粒子觀測向量F④和系統狀態觀測向量Kt間的夾角^i),其中/=1,2,.."N;(3) 計算A時刻各粒子的權值^②如下^(/)=,"')Xjp(h I ^ (/)),/ = 1,2,."iV計算/^£+/時刻各粒子的權值^^+/,)如下』)= x /7d+, I &_』)),/ = 1,2,." iV 其中,"是一個預先指定的比例因子; 步驟三、系統狀態估計步驟(7J A時刻系統狀態的濾波估計一利用/t時刻粒子及其權值組成的離散概 率分布作為&時刻系統狀態后驗概率分布,去近似/t時刻系統狀態 的真實概率分布,并用于A時刻系統狀態估計;時刻系統狀態的平滑估計--利用時刻粒子及其權值組成 的離散概率分布作為時刻系統狀態后驗概率分布,去近似 /^+/時刻系統狀態的真實概率分布,并用于時刻系統狀態估 計;O返回步驟一;用JCA表示A時刻的系統狀態,用力表示A的觀測值,用^(/):/=1,2,...^} 代表A時刻的所有粒子,用p(vlA:)表示觀測似然函數,用{~(/):戶/^:+1,...,/^代 表^£+1時刻到A時刻的所有粒子,用^^=0^+/0,>^+^,...,^朋表示粒子觀測向量,用「={^4+1,^+2,...,^}表示系統狀態觀測向量,用6Y,)表示這兩種 向量的夾角。這里,1和/是兩個預先指定的常量且1 《是一個預先指 定的比例因子。本發明的粒子權值更新步驟和系統狀態估計步驟不同于現有的粒子濾波方法,本發明方法在粒子權值更新步驟中將粒子觀測向量和系統狀態觀測向量的 夾角作為計算粒子權值的參數,并在系統狀態估計步驟中加入了平滑操作。這 些特征都是現有的粒子濾波方法所不具備的。本發明適用于一般非線性系統狀 態估計問題的求解,在系統狀態觀測似然函數具有雙峰特性時該方法優于現有 粒子濾波方法,能有效地提高非線性系統狀態的估計精度。
圖1是本發明的方法與SIR、 APF、 RPF和GPF算法的性能對比實驗效 果圖。
具體實施方式
具體實施方式
一本發明基于下述理論基礎如果一個粒子的觀測路徑靠近系統狀態的觀測 路徑,則該粒子的路徑應靠近系統狀態的路徑。如果將一個粒子的一系列觀測 值和系統狀態的一系列觀測值分別看作一個粒子觀測向量和系統狀態觀測向 量,則可用這兩個向量的夾角來度量它們之間的相似程度。當該夾角較小時就 表示該粒子靠近系統狀態。用A表示A時刻的系統狀態,用"表示J^的觀測值,用^(/):/=1,2,...^}代 表A時刻的所有粒子,用jKvW表示觀測似然函數,用{~(/):7'=^丄+1,...,/^代表yn+i時刻到&時刻的所有粒子,用ni:)={^i+^,》-i+/o,...,j^:n表示粒子觀領U向量,用^={^./:+1,>^:+2,...,力}表示系統狀態觀測向量,用0④表示這兩種向 量的夾角。這里,£和/是兩個預先指定的常量且1^/<£, 《是一個預先指定 的比例因子。本實施方式的非線性系統狀態粒子估計方法步驟為步驟一、粒子預測步驟將/t時刻系統狀態先驗分布作為重要性密度函數 并從中抽取隨機粒子{^/):/=1,2,...>^;步驟二、粒子權值更新步驟(1) 得到A時刻系統狀態觀測值力后,利用觀測似然函數計算A時刻各粒子 的似然函數值為(p(v4^(/)》,其中lM,2,.,.,N;(2) 計算各粒子觀測向量K②和系統狀態觀測向量Kt間的夾角^i),其中,.=1,2,""N;(3)計算A時刻各粒子的權值<formula>formula see original document page 8</formula>如下<formula>formula see original document page 8</formula>計算<formula>formula see original document page 8</formula>時刻各粒子的權值<formula>formula see original document page 8</formula>如下<formula>formula see original document page 8</formula>其中,《是一個預先指定的比例因子; 步驟三、系統狀態估計步驟-(7JA時刻系統狀態的濾波估計一利用A時刻粒子及其權值組成的離散概 率分布作為A時刻系統狀態后驗概率分布,去近似A時刻系統狀態的真實 概率分布,并用于A時刻系統狀態估計;時刻系統狀態的平滑估計一利用時刻粒子及其權值組成 的離散概率分布作為時刻系統狀態后驗概率分布,去近似時 刻系統狀態的真實概率分布,并用于時刻系統狀態估計;(3)返回步驟一。本具體實施方式
的非線性系統狀態粒子估計方法步驟二中第(2)子步驟所 述的向量K(T^和F之間的夾角0④的計算步驟為 步驟1、計算K②和K的內積如下步驟2、分別計算K④和F的范數如下<formula>formula see original document page 8</formula>遵步驟3、計算K②和F之間的夾角e②如下廣歐、、<formula>formula see original document page 8</formula>其中,arccos"是反余弦函數。本方法在被應用于如下具有代表性的觀測似然函數有雙峰特性的非線性系統中時,本方法的誤差遠小于SIR、 APF、 RPF和GPF方法。<formula>formula see original document page 9</formula>使用粒子總數 =100、 W-廣A/(0,1)、 W~A/(0,1), xQ=ai; —次實驗運行時 間為5000個時間點,共進行100次實驗運行r取/_=5、 /=2和gf1.8;采用誤差均方根值(賜SE)評價算法性能。實驗結果顯示在圖1中,其中PE代表本 方法結果,SIR代表標準粒子濾波方法,APF代表輔助粒子濾波方法,RPF代表 正則化粒子濾波方法,GPF代表高斯粒子濾波方法。
權利要求
1、適用于非線性系統狀態的粒子估計方法,其特征是它通過下述步驟實現步驟一、粒子預測步驟將k時刻系統狀態先驗分布作為重要性密度函數并從中抽取隨機粒子{x(i)i=1,2,...,N};步驟二、粒子權值更新步驟(1)得到k時刻系統狀態觀測值yk后,利用觀測似然函數計算k時刻各粒子的似然函數值為{p(yk|xk(i))},其中i=1,2,...,N;(2)計算各粒子觀測向量V(i)和系統狀態觀測向量V之間的夾角θ(i),其中i=1,2,...,N;(3)計算k時刻各粒子的權值qk(i)如下qk(i)=eα/θ(i)×p(yk|xk(i)),i=1,2,..,N計算k-L+l時刻各粒子的權值qk-L+l(i)如下qk-L+l(i)=eα/θ(i)×p(yk-L+l|xk-L+l(i)),i=1,2,..,N其中,α是一個預先指定的比例因子;步驟三、系統狀態估計步驟(1)k時刻系統狀態的濾波估計一利用k時刻粒子及其權值組成的離散概率分布作為k時刻系統狀態后驗概率分布,去近似k時刻系統狀態的真實概率分布,并用于k時刻系統狀態估計;(2)k-L+l時刻系統狀態的平滑估計一利用k-L+l時刻粒子及其權值組成的離散概率分布作為k-L+l時刻系統狀態后驗概率分布,去近似k-L+l時刻系統狀態的真實概率分布,并用于k-L+l時刻系統狀態估計;(3)返回步驟一;用xk表示k時刻的系統狀態,用yk表示xk的觀測值,用{x(i)i=1,2,...,N}代表k時刻的所有粒子,用p(y|x)表示觀測似然函數,用{xj(i)j=k-L+1,...,k}代表k-L+1時刻到k時刻的所有粒子,用V(i)={yk-L+1(i),yk-L+2(i),...,yk(i)}表示粒子觀測向量,用V={yk-L+1,yk-L+2,...,yk}表示系統狀態觀測向量,用θ(i)表示這兩種向量的夾角;這里,L和l是兩個預先指定的常量且1≤l<L,α是一個預先指定的比例因子。
2、根據權利要求1所述適用于非線性系統狀態的粒子估計方法, 其特征是步驟二中第(2)子步驟的向量r②和F之間的夾角0②的 計算步驟為步驟1、計算F④和K的內積如下步驟2、分別計算F②和K的范數如下步驟3、計算F②和K之間的夾角0②如下 W.、 「 ( 、其中,arccos(J是反余弦函數
全文摘要
適用于非線性系統狀態的粒子估計方法。本發明屬于工程領域,具體涉及到非線性系統狀態估計的技術領域。它是為解決對非線性系統狀態進行估計時,因系統狀態觀測似然函數具有雙峰特性使狀態估計精度較差的問題。它在標準粒子濾波方法的基礎上,在粒子權值更新步驟中將粒子觀測向量和系統狀態觀測向量的夾角作為計算粒子權值的參數,并在系統狀態估計步驟中加入了平滑操作。本發明適用于一般非線性系統的狀態估計問題,當系統狀態觀測似然函數具有雙峰特性時,該方法的狀態估計精度較高。
文檔編號G06N7/00GK101261691SQ200810064328
公開日2008年9月10日 申請日期2008年4月18日 優先權日2008年4月18日
發明者彭喜元, 軍 梁 申請人:哈爾濱工業大學