基于主元分析和d-s證據理論的故障診斷方法
【技術領域】
[0001]本發明屬于計算機領域,涉及數學建模,尤其是一種基于主元分析和D-S證據理論的故障診斷方法。
【背景技術】
[0002]隨著人工智能、專家系統和信息融合的研宄不斷深入,必然要遇到如何處理不確定信息的問題。現代計算能力的顯著提高可以讓我們對不確定性有更深入的研宄,對復雜問題的計算已經不是主要問題,關鍵是如何用數學框架(古典概率論)來完整的表示不確定性。對不確定性的兩重性定義如下:
[0003]1、偶然不確定性(Aleatory Uncertainty):這種類型的不確定性主要是由于系統的隨機性造成的,也稱為隨機不確定性,不可減少的不確定性,客觀不確定性等。
[0004]2、認識不確定性(Epistemic Uncertainty):這種類型的不確定性主要是由于對系統缺乏一定的認識造成的,是進行系統分析時的產物。也稱為主觀不確定性,可減少的不確定性,認識的不確定性,或者稱為無知。
[0005]對于這兩種類型的不確定性,在傳統上人們用概率論來描述。但是,古典概率論并不能描述認知上的不確定性。若用貝葉斯概率來解決認知不確定性,則要求分析者知道所有有關事件發生概率的相關知識。如果沒有這些知識,根據拉普拉斯決策準則(又稱不充分理由原則),常采用均勻分布函數,這就是當樣本空間的概率分布在不知道的情況下,我們可以認為樣本是以等概率事件發生的。比如引起某系統發生故障的原因有A、B和C三個。若認為A導致系統發生故障的概率為0.3,但是沒有任何關于B和C的可靠性的知識。根據拉普拉斯決策準則,在古典概率論里會認為B和C可能導致系統無法正常工作的概率均為0.35。這是在對關于B和C毫無相關知識的情況下對這兩個原因的不可靠性的一個比較準確的描述。
[0006]在古典概率里的另外一個假設就是加法定理,即滿足某個性質的所有概率之和為1這就得到一個這樣的結論,如果我們知道了某個事件可能發生的概率,比如是0.3,那就相當于我們知道該事件不可能發生的概率,就是1-03 = 0.7。但是這個結論往往是不正確的。這就涉及到在主觀信念上對不確定性的建模問題。雖然加法定理和不充分理由原則可能適合于解決偶然不確定性里對于隨機事件的建模問題,但是在應用于知識和概念上時還存在一定問題。
[0007]綜上所述,當沒有關于某一事件發生概率的知識,或者這部分知識是不確切的,模糊的,或者相互矛盾的,需要研宄不確定性更一般的表示,以解決認知不確定性的情況。雖然在概率論里不能解決此類問題,不可能對不確定性賦以一個確定的概率值,但是我們可以對集合或者區間進行概率賦值,把命題的不確定性問題轉化為集合的不確定問題,這是Dempster-Shafer 理論的貢獻。
[0008]主元分析(Principal Components Analysis) [165]又譯為主成份分析,是多元統計過程控制技術中最常用的方法之一。它首先采集系統在正常運行過程中的各個變量信號,組成的高維變量空間,在力保數據信息丟失最少的原則下進行壓縮處理,建立一個降維的統計模型:PCA模型,然后提取系統PCA模型輸出數據的統計特征參數,通過分析處理這些統計特性參數監測并判斷系統的運行狀態,可以再采用其它的理論方法(如:多元統計的其它方法、人工智能理論、神經網絡技術、信息融合理論等)來診斷具體的故障位置和性質。
[0009]主元分析方法的引入最早出現于多元統計學領域中[166,167],其核心思想是通過將相關的一組數據集進行降維,并盡量保留原來數據集的變化信息。降維的實現主要通過將原變量集轉換成一組互不相關的新變量集(即所謂的潛隱變量),這些新變量按照其方差的大小進行排列。如此,新變量集中的前若干個變量(即所謂的主元)便保留了原始變量的絕大部分變化信息。
[0010]主元分析的過程實質是對原坐標系進行平移和旋轉變換,使得新坐標的原點與數據集合的重心重合。新坐標系的第一軸與數據變異的最大方向對應,新坐標軸的第二軸與第一軸標準正交,并且與數據變異的第二大方向對應…依此類推。這些新的主軸分別就是PiQ = 1,2,若經過舍棄少量信息后,主軸Pi (i = 1,2,…,k,k〈m)能夠有效地表示原始數據的變異情況,則原來的m維空間就被降至k維,這就是原樣本集合在新空間投影所生成的新樣本集合,可以近似地表達原樣本集合。
[0011]由于主元分析技術將系統所有的測量變量視為一個整體,對它們進行一體化處理,所以各變量之間的相互耦合關系也被保留在PCA模型中。PCA模型描述了正常工況下各過程變量之間的關系,這種變量間的內在聯系是由質量平衡、能量平衡以及操作限制等各方面的約束形成的。當系統運行數據與主元模型產生較大的偏離時,表現在檢測樣本的得分向量和變量噪聲將超出主元模型中各自空間的正常范圍。在進行故障分離時,采用PCA貢獻圖方法,以系統過程變量之間的關聯性作為故障診斷的依據。
[0012]所謂的主元模型,指的是對來自正常穩態工況下的樣本數據集合進行主元分析后得到的一系列統計信息,主要包括:變量均值向量U、變量方差矩陣DO、協方差矩陣COV(X)、主元方差矩陣D λ、負載矩陣P、主元得分矩陣T以及主元個數k等。
[0013]D-S證據理論方法在故障診斷中,需要合成、處理多各信息源所提供的關于故障的各種證據,證據也就是命題信任度的產生方法有很多,但都面臨一個樣本數據維數的問題,當數據維數過大時,會使證據的產生異常困難。一般來說,產生證據的各類算法的復雜度隨著量測維數的增大和遞推步數呈幾何級數增加,會產生組合爆炸的情況,采用分類識別網絡時會延長網絡的訓練時間,甚至導致網絡不收斂。
[0014]基于主元分析法模型的貢獻圖故障診斷方法雖然簡單易行,不需要預先的過程知識,但它是以系統過程變量之間的關聯性作為依據進行故障診斷,無法為過程的故障與變量建立一種一一對應的因果關系,只能顯示出一組與該故障相關聯的系統變量,不一定是最后的所辨識的故障,沒有分離出其本質,所以故障分離能力較弱,無法進行直接的故障診斷,并且當變量個數較多并且故障常常反映為多個變量變化時,會導致較高的誤診率,因此在實際應用中,還需要由工程操作人員根據經驗進行合理的判斷。
[0015]在故障診斷方法中,主元分析法和D-S證據理論方法都得到廣泛應用,但這兩種方法都有自身的缺點。為何克服上述兩種方法的缺點,同時發揮各自的優點,本案將PCA與D-S證據理論結合起來進行研宄,采用PCA方法對數據處理,可以把高維數據壓縮成一個攜帶了原數據絕大部分信息的較低維數的數據,對來自各個信息源的低維特征數據進行關聯,以降低算法的復雜度,提高實時性,然后利用D-S證據理論進行融合處理,最終分離出故障。
【發明內容】
[0016]本方法針對D-S理論方法在進行多個數據源關聯時,隨著量測維數的增大和遞推步數的增加,會出現組合爆炸的問題,以及主元分析方法雖然可以在損失最少信息的情況下把原有數據壓縮成低維的新數據,但在故障分離方面能力較弱的缺點,提出一種PCA和D-S證據理論相結合的故障診斷方法。
[0017]為實現上述目的本發明所采用的技術方案是:
[0018]一種基于主元分析和D-S證據理論的故障診斷方法,該方法基于PCA與D-S證據理論相結合的故障診斷方法,其步驟為:
[0019]⑴采用主元分析法進行故障檢測,利用PCA把相關過程數據所組成的高維數據空間投影壓縮到低維特征子空間,用少部分獨立的主元變量來描述多維空間的絕大部分動態信息,把檢測數據用主元模型進行分析,判斷PCA模型的T2統計量和Q統計量是否超限,若有一個超限,則認為發生故障;
[0020]⑵對于步驟⑴中已發生的故障,采用PCA方法分析處理正常運行數據&和各種故障數據fi(i = 1,2,…,η),從而得到相應的低維特征矩陣TKiQ =0,1,…,η),以此作為訓練神經網絡,建立分類識別器;
[0021]⑶將步驟⑵中的正常運行數據&和各種故障數據f i分別用正常主元模型PCAjP故障主元模型PCAiQ = 1,2,…,η)進行主元分析,得到各個主元模型下的低維特征矩陣tkji = 0,1,…,n),然后進行網絡識別,其結果作為D-S證據理論的證據,再進行證據融合處理,按照分離法則最終分離故障。
[0022]而且,步驟⑴中所述的主元模型,指的是對來自正常穩態工況下的樣本數據集合進行主元分析后得到的一系列統計信息,主要包括:變量均值向量μ、變量方差矩陣D。、協方差矩陣COV(X)、主元方差矩陣Dx、負載矩陣P、主元得分矩陣T以及主元個數k等。確定的主元數,其具有一定的主觀性。一般來說當前k個主元的累積貢獻率達到85%以上的時候,我們就可以認為已求的主元個數k可以綜合原數據足夠多的信息,可根實際情況選定。
[0023]而且,步驟⑴中,T2統計量,即Hotelling T 2統計量,Q統計量,即平方預報誤差SPE (Squared Predict1n Error)統計量。
[0024]而且,步驟⑴中主元分析法建立的主元模型是:正常主元模型PCAtl和各類故障主元模型 PCAi (i = 1,2,…,η)。
[0025]而且,步驟⑵中,所述正常運行數據&是從傳感器網絡獲得系統正常運行數據,各種故障數據A是通過實驗以及歷史運行數據得到各種典型故障數據,采用PCA方法分析處理即為將正常運行數據fo以及各種故障數據f 1建立與其相應的正常主元模型PCA ^和各類故障主元模型PCAiQ = 1,2,…,η),同時獲得各個主元模型下的低維特征向量TKiQ = 0,1,…,η),組成低維特征矩陣ΤΚ。
[0026]而且,步驟⑵中,訓練神經網絡是采用徑向基函數網絡(RBFNN)對低維特征矩陣TK進行信息融合識別,得到TK = TVTK1-+TKn,TKiG RkXv(i = O, I,…,η)是第i種故障類型特征向量,k是選取的主元個數,V是變量個數,以此作為訓練RBF神經網絡,并建立分類識別器。
[0027]而且,步驟⑶中,通過步驟⑵中的分類