用于設備狀態監測中故障診斷的歸納的模式識別的制作方法
【專利摘要】在設備狀態監測中使用歸納的模式識別來識別故障。在運行數據中識別模式簇。除了評注的訓練數據,使用模式簇來訓練分類器。運行數據也被用來將運行數據中的信號聚類為信號簇。通過評價置信度矢量,然后分類所監測的數據樣本,所述置信度矢量包括用在與訓練數據中所包含的信號相同的信號簇中的信號替換該包含在訓練數據中的信號。
【專利說明】用于設備狀態監測中故障診斷的歸納的模式識別
【技術領域】
[0001] 本發明一般地涉及設備狀態監測,并且更具體涉及用于使用有監督的基于模式識 別的技術從有限的訓練數據中檢測設備故障的方法、系統和計算機可讀介質。
【背景技術】
[0002] 設備狀態監測的任務是在早期階段檢測設備故障,使得能夠及時進行維護。在故 障情況下,非常重要的是知道故障的原因,從而能夠進行相應定位的、并且由此更有效的維 護。
[0003] 基于規則的系統也許是最廣泛使用的狀態監測方法。規則的一般格式是"如果一 個條件,則一個故障類型"。規則通過擁有基礎系統模型的知識的專家定義;然而,設計精確 的規則是非常深思熟慮并且耗時的過程,特別是對于具有許多傳感器和故障類型的復雜系 統。例如,需要80人數年的時間來開發商業上成功的狀態監測規則庫。
【發明內容】
[0004] 本發明要通過提供一種用于設備狀態監測的方法而解決上述需求。通過計算機接 收包括了隨著時間來自于0個信號的歷史運行數據。從來自于在運行數據中的個體信號的 數據中提取I個模式X。基于相似性,將I個模式聚類為K個模式簇c k,并且基于0個信號 中的相關性,將0個信號聚類為R個信號簇。
[0005] 接收評注的訓練數據樣本,其包含來自于從0個信號中選擇的N個信號的數據并 且具有至少一個標記的故障時段。創建KXN置信度矢量,其包含了用于N個信號中的每個 信號的K個置信度值,每個置信度值代表了在信號的標記的故障時段中從數據中提取的模 式X屬于K個模式簇中的一個的置信度。通過使用KXN置信度矢量來訓練分類器。
[0006] 然后接收監測的數據樣本,其包括來自于0個信號的數據。基于0個信號中的至 少一個不在I個信號中的信號處于與I個信號中的一個信號相同的信號簇中,并且還基于 對〇個信號中的至少一個信號具有與I個信號中的一個信號的、包含于KXN置信度矢量中 的置信度值相似的置信度值的判斷,將監測的數據樣本被分類為提示故障。
[0007] 在本發明的另一方面,提供了一種非暫時性計算機可用的介質,其具有存儲在其 上的計算機可讀指令,用于由處理器執行,以執行如上所述用于設備狀態監測的方法。
【專利附圖】
【附圖說明】
[0008] 圖1是按照本發明的一個實施方式的設備狀態監測工具的示意圖,
[0009] 圖2是示出了按照本發明的一個實施方式的用于不同信號分類的置信度水平的 示例表,
[0010] 圖3是示出了按照本發明的一個實施方式的用于實例化一個工具的計算機系統 的示意圖。
【具體實施方式】 toon] 本公開著重于一種用于使用機器學習的方法,并且具體地是有監督的基于模式識 別的技術。機器學習模型是數據驅動的:它們是從訓練數據自動被學習的。這可以非常快 地完成(例如,在數分鐘之內)。如果被合適地訓練,則機器學習模型能夠比使用規則庫所 可能的更好地描述復雜故障狀態。
[0012] 因為機器學習技術是數據驅動的,所以它們需要足夠的訓練數據以獲得期望的精 度。訓練數據應當代表正常運行和故障模式二者。然而該要求是非常難以滿足的。容易獲 得代表了正常狀態的訓練數據,因為設備在其大部分壽命期間應當正常運行。而獲取代表 了故障類型的訓練數據是相當的挑戰,因為某些類型的故障可能僅非常罕見地發生(甚至 我們考慮相似設備的集合)。即使對于那些少數實例,用戶也不可能花時間評注它們全部。 由此非常可能的是,僅可獲得代表了一個故障的一個訓練樣本,其使得故障相當難以學習。 此外,在監測期間,相同的故障類型可能在與在訓練期間規定的信號不同的組的信號上顯 示。由此如果采用傳統的分類方法,幾乎不可能分類新的故障類型。
[0013] 圖1中示出的圖100提供在此提出的技術的概覽。技術包括兩部分:訓練部分120 和監測部分150。訓練部分120附加地包括兩個子部分。在第一子部分中,使用運行數據 131。特征在132從運行數據中被提取并且被用于信號聚類133和模式聚類134。在訓練 120的第二子部分中,對用戶評注的數據141進行特征提取142并且將其轉換為置信度矢量 143,其在144被用來訓練分類器。
[0014] 在監測期間,來自于提取的特征151的信號聚類和模式聚類的結果被用來計算用 于測試模式的置信度值表152。然后在153從置信度值表中創建候選假定。最可能的候選假 定在154被分類以做出最終判斷("是"意味著存在故障并且"否"意味著模式是正常的。)
[0015] 在此描述的技術從有限的訓練樣本歸納出在未來監測期間可以預期到的故障特 征。在以下提出歸納的兩個方案,即模式聚類134和信號聚類133 (圖1),以從所述設備或 類似設備的運行數據中提取有用信息。這樣的運行數據是容易獲得的。運行數據可以包括 用戶評注的訓練數據和未評注的數據,并且可以包含已知或未知的故障。
[0016] 在模式聚類方案中,模式通過將運行數據中的所有模式進行聚類而被歸納。每個 簇可以被看作是一個癥候。在與評注的模式相同的簇內的所有模式是相似的并且能夠被看 作是評注的模式的可能變形。示出了一個癥候的模式的置信度也被計算,以允許軟聚類。
[0017] 在信號聚類方案中,信號通過使用運行數據對所有信號進行聚類而被歸納。假定 是,對于相同的故障類型的相似的癥候在未來只能在相似的信號上發生。在監測期間,不是 僅檢查通過評注所規定的信號,而是檢查與評注的信號相似的所有可能信號。每個可能的 候選形成一個假設并且主要的假設被用于做出最終判斷。
[0018] 問題定義
[0019] 在訓練期間,用戶從總共0個可獲得的和有意義的信號中選擇N個信號, S1, S2, ...,Sn。那些選擇的N個信號可以是原始的傳感器(例如測量溫度、壓力)。它們也 可以是來自于先前的數據處理的結果,諸如計算的值(例如幾個原始傳感器的平均值)或 殘差(傳感器值與其理想值的偏差)。此外,用戶在故障發生時標記在h-Τ+Ι和h之間的 時間階段T。數據評注通過圖1的塊141示出。
[0020] 上面的評注的目的是提示故障看起來如何并且其何時發生。用戶可以評注該故障 的L個這樣的實例。理想地,應當僅選擇涉及該故障的信號。類似地,應當僅標記當故障發 生時的時間戳。設X,T維的矢量,表示信號s的模式,使得
[0021] X = [s (t0_T+l),s (t0_T+2),· · ·,s (t0) ]τ。
[0022] 所有N個模式可以被置于
【權利要求】
1. 一種用于設備狀態監測的方法,包括: 通過計算機接收包括了隨著時間來自于O個信號的歷史運行數據; 從來自于在運行數據中的個體信號的數據中提取I個模式X; 基于相似性,將所述I個模式聚類為K個模式簇Ck; 基于所述O個信號中的相關性,將所述O個信號聚類為R個信號簇; 接收評注的訓練數據樣本,其包含了來自于從所述O個信號中選擇的N個信號的數據 并且具有至少一個標記的故障時段; 創建KXN置信度矢量,其包含了用于所述N個信號中的每個信號的K個置信度值,每 個置信度值代表了從信號的標記的故障時段中的數據中提取的模式X屬于K個模式簇中的 一個的置信度; 使用所述KXN置信度矢量來訓練分類器; 通過計算機接收包括了來自于所述O個信號的數據的監測的數據樣本;以及 基于所述〇個信號中的不在I個信號中的至少一個信號處于與所述I個信號中的一個 信號相同的信號簇中,并且還基于對所述〇個信號中的至少一個信號具有與所述I個信號 中的一個信號的、包含于所述KXN置信度矢量中的置信度值相似的置信度值的判斷,而通 過計算機將監測的數據樣本分類為提示故障。
2. 根據權利要求1所述的方法,其中,從運行數據中的個體信號提取I個模式包括使用 固定長度的滑動時間窗。
3. 根據權利要求1所述的方法,其中,將所述I個模式聚類為K個模式簇并且將所述O 個信號聚類為R個信號簇還包括: 對于所述I個模式的每一個,提取描述了模式的標量特征;和 使用所述標量特征來聚類模式和信號。
4. 根據權利要求1所述的方法,其中,將所述I個模式聚類為K個模式簇對于所有O個 信號執行。
5. 根據權利要求1所述的方法,其中,將所述I個模式聚類為K個模式簇對于相同信號 簇中的信號執行。
6. 根據權利要求1所述的方法,其中,將所述I個模式聚類為K個模式簇包括應用 K-mean聚類以形成簇。
7. 根據權利要求1所述的方法,其中,將所述O個信號聚類為R個信號簇還包括: 基于歷史運行數據計算成對的信號相關性;和 使用分級式聚類對信號進行聚類。
8. 根據權利要求1所述的方法,其中,代表模式X屬于模式簇ck的置信度的每個置信 度值通過下式定義:
其中Pk是簇ck的權重,并且dist(f(x),μk)是在描述模式X的模式特征矢量f(x)和 簇Ck的平均μk之間的距離。
9. 根據權利要求1所述的方法,其中,對于特定信號,K個置信度值中的一個置信度值 等于1,并且該K個置信度值中的剩余置信度值等于零。
10. 根據權利要求1所述的方法,其中,對于N個信號中的每一個,K個置信度值的和等 于1。
11. 根據權利要求1所述的方法,其中,對監測的數據樣本進行分類包括: 對于監測的數據樣本信號O的子組合,評價置信度矢量,其中每個評注的數據訓練信 號N或者包括在子組合中或者在子組合中由如下所監測的數據樣本信號代表,該所監測的 數據樣本信號處于與被代表的評注的數據訓練信號相同的信號簇Ck中。
12. 根據權利要求11所述的方法,其中,對監測的數據樣本進行分類還包括: 應用貪婪算法,以識別主導的置信度矢量;和 判斷,用于所述主導的置信度矢量的評價函數值是否超過閾值。
13. -種非暫時性計算機可用介質,具有存儲于其上的計算機可讀指令,用于由處理器 運行,以執行設備狀態監測的方法,該方法包括: 接收隨著時間來自于O個信號的歷史運行數據; 從來自于在運行數據中的個體信號的數據中提取I個模式X; 基于相似性,將所述I個模式聚類為K個模式簇ck; 基于所述O個信號中的相關性,將所述O個信號聚類為R個信號簇; 接收有評注的訓練數據樣本,其包含了來自于從所述O個信號中選擇的N個信號的數 據并且具有至少一個標記的故障時段; 創建KXN置信度矢量,其包含了用于N個信號中的每個信號的K個置信度值,每個置 信度值代表了從信號的標記的故障時段中的數據中提取的模式X屬于所述K個模式簇中的 一個的置信度; 通過使用所述KXN置信度矢量來訓練分類器; 接收包括來自于所述O個信號的數據的監測的數據樣本; 基于所述O個信號中的至少一個不在I個信號中的信號處于與所述I個信號中的一個 信號相同的信號簇中,并且還基于對所述O個信號中的至少一個信號具有與所述I個信號 中的一個信號的、包含于所述KXN置信度矢量中的置信度值相似的置信度值的判斷,而將 監測的數據樣本分類為提示故障。
14. 根據權利要求13所述的非暫時性計算機可用介質,其中,從運行數據中的個體信 號提取I個模式包括使用固定長度的滑動時間窗。
15. 根據權利要求13所述的非暫時性計算機可用介質,其中,將所述I個模式聚類為K 個模式簇并且將所述〇個信號聚類為R個信號簇還包括: 對于所述I個模式的每一個,提取描述了該模式的標量特征;和 使用所述標量特征來聚類模式和信號。
16. 根據權利要求13所述的非暫時性計算機可用介質,其中,將所述I個模式聚類為K 個模式簇對于所有〇個信號執行。
17. 根據權利要求13所述的非暫時性計算機可用介質,其中,將所述I個模式聚類為K 個模式簇對于相同信號簇中的信號執行。
18. 根據權利要求13所述的非暫時性計算機可用介質,其中,將所述I個模式聚類為K 個模式簇包括應用K-mean聚類以形成簇。
19. 根據權利要求13所述的非暫時性計算機可用介質,其中,將所述O個信號聚類為R 個信號簇還包括: 基于歷史運行數據計算成對的信號相關性;和 使用分級式聚類對信號進行聚類。
20. 根據權利要求13所述的非暫時性計算機可用介質,其中,代表模式X屬于模式簇ck 的置信度的每個置信度值通過下式定義:
其中Pk是簇ck的權重,并且dist(f(x),μk)是在描述模式X的模式特征矢量f(x)和 簇Ck的平均μk之間的距離。
21. 根據權利要求13所述的非暫時性計算機可用介質,其中,對于特定信號,K個置信 度值中的一個置信度值等于1,并且該K個置信度值的剩余置信度值等于0。
22. 根據權利要求13所述的非暫時性計算機可用介質,其中,對于所述N個信號中的每 一個,K個置信度值的和等于1。
23. 根據權利要求13所述的非暫時性計算機可用介質,其中,對監測的數據樣本進行 分類包括: 對于監測的數據樣本信號O的子組合,評價置信度矢量,其中每個評注的數據訓練信 號N或者包括在子組合中、或者在子組合中由如下監測的數據樣本信號代表,該監測的數 據樣本信號處于與被代表的評注的數據訓練信號相同的信號簇Ck中。
24. 根據權利要求23所述的非暫時性計算機可用介質,其中,對監測的數據樣本進行 分類還包括: 應用貪婪算法,以識別主導的置信度矢量;和 判斷,用于主導的置信度矢量的評價函數值是否超過閾值。
【文檔編號】G05B23/02GK104471501SQ201380036704
【公開日】2015年3月25日 申請日期:2013年6月3日 優先權日:2012年6月12日
【發明者】C.袁, A.查克雷博蒂, L.威布金, H.哈克斯坦 申請人:西門子公司