基于改進的kpca和隱馬爾科夫模型的工業故障診斷方法
【技術領域】
[0001] 本發明屬于工業過程監控與故障診斷領域,特別涉及一種基于改進的KPCA和隱 馬爾科夫模型的工業故障診斷方法。
【背景技術】
[0002] 隨著工業過程復雜性的增長,工業過程監測和診斷的有效性對于保障生產過程安 全、維持產品質量和優化產品利益變得日益重要。
[0003] 對于過程監控和故障診斷問題,傳統的方法大多采用多元統計過程監控技術 (MultivariableStatisticalProcessMonitoring,MSPM),其中以主元分析(Principal ComponentAnalysis,PCA)、偏最小二乘(PartialLeastSquares,PLS)和獨立成分分析 (IndependentComponentAnalysis,ICA)為代表等方法已在工業過程監控中得到了成功 的應用。傳統的PCA、ICA等方法均假設過程變量間的關系是線性的,但是實際中測量變 量難以滿足這個假設條件,常呈現強烈的非線性特性。盡管核方法的引入,如核扣八,核 PCA(KerneIPCA)等方法被提出用于解決變量間的非線性,但是,上述方法具有以下缺點, 原始數據從輸入空間映射到高維特征空間后變得冗余,而且核矩陣是一個以樣本數目為大 小的方陣。隨著樣本數目的增多,計算量不斷增大,而在工業過程,樣本數目往往是巨大的, 因此用原始的KPCA來提取變量間的非線性關系是困難的,由此,可能會引起故障診斷發生 錯誤。
【發明內容】
[0004] 本發明的目的在針對現有技術的不足,提供一種基于改進的KPCA和隱馬爾科夫 模型的工業故障診斷方法,通過相似性分析方法的引入大大提高了KPCA在大樣本情況下 的計算效率,并且利用隱馬爾科夫模型極強的動態過程時間序列建模能力和時序模式分類 能力。因此,本方法在工業過程具有強非線性以及存在海量數據的情況下,可以實現有效地 故障診斷。
[0005] 一種基于改進的KPCA和隱馬爾科夫模型的工業故障診斷方法,該方法的步驟如 下:
[0006] 步驟一:離線建模,對工業過程采集的離線數據,在原空間進行相似性分析,去除 相似樣本,得到數據集D1,引入核函數巾將數據集D1投影到高維特征空間,同樣在特征 空間進行數據的相似性分析,去除相似樣本,得到數據集D2,根據數據集D2中數據計算相 應的核矩陣以及核主元,將得到的核主元作為隱馬爾科夫模型(HMM)的觀測序列,訓練隱 馬爾科夫模型;
[0007] 步驟二:在線診斷,對在線采集的數據在原空間進行相似性分析,去除相似樣本, 同樣在特征空間進行數據的相似性分析,去除相似樣本,計算相應的核矩陣以及核主元,即 得到相應的觀測序列后,選擇最匹配的HMM模型,從而判斷故障類型。
[0008] 步驟一所述的離線建模過程如下:
[0009] 1)工業過程采集的第i個時刻監測數據M=[各,毛,…,足f,i= 1,…,U, 其中^表示樣本個數;
[0010] 2)在原輸入空間進行相似性分析,去除相似樣本,得到數據集Q1,
[0011] 2. 1)初始時只有2個數據點,即W1 = {名..?」} = ,新數據點根據以下提出 的相似性指數公式進行相似性的判斷,
【主權項】
1. 一種基于改進的KPCA和隱馬爾科夫模型的工業故障診斷方法,其特征在于,該方法 的步驟如下: 步驟一:離線建模,對工業過程采集的離線數據,在原空間進行相似性分析,去除相似 樣本,得到數據集〇1,引入核函數4將數據集口1投影到高維特征空間,同樣在特征空間 進行數據的相似性分析,去除相似樣本,得到數據集Q2,根據數據集Q2中數據計算相應的 核矩陣W及核主元,將得到的核主元作為隱馬爾科夫模型(HMM)的觀測序列,訓練隱馬爾 科夫模型; 步驟二:在線診斷,對在線采集的數據在原空間進行相似性分析,去除相似樣本,同樣 在特征空間進行數據的相似性分析,去除相似樣本,計算相應的核矩陣W及核主元,即得到 相應的觀測序列后,選擇最匹配的HMM模型,從而判斷故障類型。
2. 根據權利要求1所述的方法,其特征在于,步驟一所述的離線建模過程如下: 1) 工業過程采集的第i個時刻監測數據風二防為,…,兩,,f,*二1,柄< ^1),其中n;表示樣本個數; 2) 在原輸入空間進行相似性分析,去除相似樣本,得到數據集口1, 2. 1)初始時只有2個數據點,即A^i二位?馬}二,新數據點根據W下提出的相 似性指數公式進行相似性的判斷,
(1) 其中X。。,表示新數據點;
2.。如果導<7^,新數據點被引入,否則該樣本點被舍棄,即Ni=Nw,其中丫。是預 先設定好的一個足夠小的值,滿足〇 < >/^ < 1 ; 2. 3)對原始輸入空間進行相似性分析之后,被保留的數據點個數為ni,所W我們獲得 了數據集Qi; 3) 引入核函數4將數據集投影到高維特征空間,在特征空間進行相似性分析,去 除相似樣本,得到數據集Q2, 3. 1)特征空間中相似性指數公式定義如下:
3. 2)如果< ?^,新數據點被引入,否則該樣本點被舍棄,其中丫1是預先設定好的 一個足夠小的值,滿足0 < < 1; 3. 3)對特征空間進行相似性分析之后,被保留的數據點個數為ri2,所W我們獲得了數 據集口2; 4) 對數據集Q2,計算核矩陣KW及核主元, 4.1)計算核矩陣 K。' = < 巫(X,巫(xj)〉=K(X。xj) (3) 其中使用徑向基核函數
r為常數; 4.2)對核矩陣K進行中屯、化處理, K=K-\J<-K\-\\"K\" (4) 其中
4. 3)計算主成分tk
(5) 5)將得到的核主元作為隱馬爾科夫模型的觀測序列0,訓練隱馬爾科夫模型,得到其 參數 ^ = (A,B, 31,M,腳; 其中,A是隱含狀態轉移概率矩陣,描述了HMM模型中各個狀態之間的轉移概率,見下 式做~(7)
式中,"V、'/簡記為au,表示在t時刻,狀態為Si的條件下,在t+1時刻狀態是SJ的概 率. B是觀測值概率密度矩陣,見下式
其中0是觀測向量,Cj.m是隱含狀態j的第m個混合成分的混合系數,H是對數凹或楠 圓對稱密度,y是隱含狀態Sj.的第m個混合成分的均值向量,U是隱含狀態Sj.的第m個 混合成分的協方差矩陣,Cj.m滿足隨機約束:
Cjm、yJm、Uj.m的重估是該樣的;C的重估值是HMM在隱含狀態Sj.帶有第k個混合成分 的次數的期望除WHMM處于隱含狀態Sj.的次數的期望,y的重估值是由第k個混合成分 說明的觀測矢量的部分期望值,Uj.m是由第k個混合成分說明的觀測矢量的部分協方差,見 公式(11)~(13),
n是初始狀態概率矩陣,N是隱含狀態的數目,M是每個隱含狀態下的高斯混合成分的 數目。
3. 根據權利要求2所述的方法,其特征在于,步驟二所述的在線診斷程如下: a) 在線采集工業過程的數據; b) 在原空間進行相似性分析,去除相似樣本,得到數據集〇1,引入核函數4將數據集 Q1投影到高維特征空間,同樣在高維特征空間進行數據的相似性分析,去除相似樣本,得 到數據集〇2,根據數據集中數據計算相應的核矩陣W及核主元; C)W核主元作為觀測序列,選擇最匹配的HMM模型,從而判斷故障類型。
4. 根據權利要求1所述的方法,其特征在于,所述的工業過程具有非線性。
5. 根據權利要求1所述的方法,其特征在于,所述的工業故障為高爐冶煉過程故障。
6. -種根據權利要求1-4任一項所述的方法用于高爐冶煉過程故障診斷。
【專利摘要】本發明公開了一種基于改進的KPCA和隱馬爾科夫模型的工業故障診斷方法,屬于工業過程監控與診斷技術領域。本發明通過相似性分析方法的引入大大提高了KPCA在大樣本情況下的計算效率,并且利用隱馬爾科夫模型極強的動態過程時間序列建模能力和時序模式分類能力,對工業過程的故障進行分類。因此與其它現有的方法相比,由于充分考慮了工業數據的非線性特性以及海量數據的特點,本發明方法不僅可以降低計算的復雜度,而且可以更有效處理過程的非線性特征,從而對于非線性工業故障診斷具有更高的準確率。
【IPC分類】G05B23-02
【公開號】CN104793606
【申請號】CN201510177746
【發明人】楊春節, 王琳, 孫優賢
【申請人】浙江大學
【公開日】2015年7月22日
【申請日】2015年4月15日