用于數據異常監測的傳感器選擇方法的評價方法
【專利摘要】用于數據異常監測的傳感器選擇方法的評價方法,涉及傳感器異常檢測,目的是為了解決現有技術中缺少對傳感器選擇方法的性能評價方的問題。本發明采用觀察法和待評價方法分別選取兩組傳感器進行異常數據監測,從兩組中選取編號相同的作為待測傳感器,再從每組選取一個與另一組編號不同的作為訓練傳感器,利用兩個訓練傳感器分別構建兩個核主成分分析模型并得到兩個門限閾值,待測傳感器的監測數據超過門限閾值的作為誤檢數據,低于或等于門限閾值的作為正確數據,計算兩種傳感器選擇方法的誤檢率,以此對待評價的傳感器選擇方法進行評價。本發明能夠反映出傳感器選擇方法對數據異常檢測的影,特別適用于飛機發動機的狀態檢測。
【專利說明】
用于數據異常監測的傳感器選擇方法的評價方法
技術領域
[0001] 本發明設及系統狀態監測過程中,用于數據異常監測的傳感器異常的選擇技術。
【背景技術】
[0002] 復雜系統(例如飛機發動機)的狀態監測能夠提供有效的故障診斷和失效預測,同 時能夠提供有效的維修策略,節省大量的人力與物力。隨著科學技術的發展,出現了眾多的 故障診斷與失效預測試法、狀態監測數據異常監測方法。運些方法是建立在獲取系統正確 狀態的前提條件下,布置于系統中的大量傳感器對于不同的方法并不是所有的傳感器都能 提供有效信息,為提高傳感器感知系統狀態可靠性,研究人員也提出了很多的傳感器故障 與異常監測方法,然而已有的研究忽略了用于系統狀態監測的傳感器選擇與數據異常監測 之間的關系,導致無法判斷該傳感器選擇方法對數據異常監測的影響。
【發明內容】
[0003] 本發明的目的是為了解決現有技術中缺少對傳感器選擇方法的性能評價方法的 問題,提供一種用于數據異常監測的傳感器選擇方法的評價方法。
[0004] 本發明所述的用于數據異常監測的傳感器選擇方法的評價方法,包括W下步驟:
[0005] 步驟一、對所有待選擇的傳感器進行編號,采用所有待選擇的傳感器進行數據異 常監測,得到由所有待選擇的傳感器的監測數據構成的數據集;
[0006] 步驟二、通過方法A選出一組傳感器作為第一組傳感器,通過方法B選出另一組傳 感器為第二組傳感器;其中方法A是指待評價的傳感器選擇方法,方法B是指觀察法;
[0007] 步驟Ξ、選取兩組傳感器中編號相同的傳感器作為測試傳感器,從第一組傳感器 中選取與第二組傳感器編號不同的傳感器作為方法A的訓練傳感器,從第二組傳感器中選 取與第一組傳感器編號不同的傳感器作為方法B的訓練傳感器;
[000引步驟四、利用方法A的訓練傳感器構建方法A的核主成分分析模型,并利用該核主 成分分析模型得到方法A的訓練數據集殘差,即方法A的口限闊值;利用方法B的訓練傳感器 構建方法B的核主成分分析模型,并利用該核主成分分析模型得到方法B的口限闊值;
[0009] 步驟五、從數據集中選取測試傳感器的所有監測數據,利用核主成分分析模型將 該所有監測數據中的每個監測數據轉化成測試數據殘差,
[0010] 對于方法A:將每個測試數據殘差分別與方法A的口限闊值進行對比,超過方法A的 口限闊值的測試數據殘差作為誤檢數據,低于或等于方法A的口限闊值的測試數據殘差作 為正確數據,根據該誤檢數據的個數和該正確數據的個數計算方法A的誤檢率;
[001。 對于方法B:將每個測試數據殘差分別與方法B的口限闊值進行對比,超過方法B的 口限闊值的測試數據殘差作為誤檢數據,低于或等于方法B的口限闊值的測試數據殘差作 為正確數據,根據該誤檢數據的個數和該正確數據的個數計算方法B的誤檢率;
[0012] 步驟六、將方法B的誤檢率與方法A的誤檢率的差值作為方法A的評價結果。
[0013] 本發明提出的傳感器選擇方法的評價方法能夠反映出傳感器選擇方法對數據異 常監測的影響,尤其適用于飛機發動機狀態的監測,在該評價方法的基礎上,作適當修改即 可W用于各種系統,用來改善系統大狀態監測方面的性能。
【附圖說明】
[0014] 圖1為賭與概率的關系圖;
[0015] 圖2為實施方式Ξ中的評價過程的框架;
[0016] 圖3為發動機結構示意圖,其中1表示風扇,2表示燃燒室,3表示低壓滿輪,4表示噴 嘴,5表示高壓滿輪,6表示低壓壓縮機,7表示高壓壓縮機;
[0017] 圖4為數據集1中的基于賭和排列賭的傳感器選擇方法的異常監測結果;
[0018] 圖5為數據集1中的觀察法的異常監測結果;
[0019] 圖6為數據集2中的基于賭和排列賭的傳感器選擇方法的異常監測結果;
[0020] 圖7為數據集2中的觀察法的異常監測結果。
【具體實施方式】
【具體實施方式】 [0021] 一:結合圖1說明本實施方式,本實施方式所述的用于數據異常監測 的傳感器選擇方法的評價方法,包括W下步驟:
[0022] 步驟一、對所有待選擇的傳感器進行編號,采用所有待選擇的傳感器進行數據異 常監測,得到由所有待選擇的傳感器的監測數據構成的數據集;
[0023] 步驟二、通過方法A選出一組傳感器作為第一組傳感器,通過方法B選出另一組傳 感器為第二組傳感器;其中方法A是指待評價的傳感器選擇方法,方法B是指觀察法;
[0024] 步驟Ξ、選取兩組傳感器中編號相同的傳感器作為測試傳感器,從第一組傳感器 中選取與第二組傳感器編號不同的傳感器作為方法A的訓練傳感器,從第二組傳感器中選 取與第一組傳感器編號不同的傳感器作為方法B的訓練傳感器;
[0025] 步驟四、利用方法A的訓練傳感器構建方法A的核主成分分析模型,并利用該核主 成分分析模型得到方法A的訓練數據集殘差,即方法A的口限闊值;利用方法B的訓練傳感器 構建方法B的核主成分分析模型,并利用該核主成分分析模型得到方法B的口限闊值;
[0026] 步驟五、從數據集中選取測試傳感器的所有監測數據,利用核主成分分析模型將 該所有監測數據中的每個監測數據轉化成測試數據殘差,
[0027] 對于方法A:將每個測試數據殘差分別與方法A的口限闊值進行對比,超過方法A的 口限闊值的測試數據殘差作為誤檢數據,低于或等于方法A的口限闊值的測試數據殘差作 為正確數據,根據該誤檢數據的個數和該正確數據的個數計算方法A的誤檢率;
[0028] 對于方法B:將每個測試數據殘差分別與方法B的口限闊值進行對比,超過方法B的 口限闊值的測試數據殘差作為誤檢數據,低于或等于方法B的口限闊值的測試數據殘差作 為正確數據,根據該誤檢數據的個數和該正確數據的個數計算方法B的誤檢率;
[0029] 步驟六、將方法B的誤檢率與方法A的誤檢率的差值作為方法A的評價結果。
[0030] 本實施方式采用傳統的觀察法作為評價基準,利用公知的核主成分分析模型來獲 取關鍵參數口限闊值,利用誤檢率作為衡量異常監測性能的指標。
[0031]
【具體實施方式】二:結合圖1說明本實施方式,本實施方式是對實施方式一所述的用 于數據異常監測的傳感器選擇方法的評價方法進一步限定,本實施方式中,步驟四中核主 成分分析模型的構建方法為:
[0032] 首先,通過非線性變換將訓練數據映射到高維空間;
[0033] 然后,通過線性主成分分析法實現特征空間,訓練數據矩陣使用 義。=[^0;0...;0/居肢蜘表示,訓練數據向量使用向量無,巨阪|,11(1空/<11)表示;然后將訓練 數據通過非線線映射#:xe阪1" 妍映射到高維特征空間;然后通過線性主成分分 析得到投影向量f (projection vector),使公式(7)對于訓練數據有最大的方差值,
[0034] t = ( Φ (x))^f (7)
[0035] 最優化問題用式(8)表示:
[0038] Jkpca()為形成的目標優化函數,
[0039] t = [ti t2…tn]T稱作得分向量(score vector),由利用訓練數據通過線性主成 分分析得到,
[0040]
(9)
[0041] α為相關系數,投影向量f與非線性映射Φ之間存在公式(9)所示的關系。
[0042] 通過式(8)與式(9),得到式(10)。
[0045] 通過滿足公式(10)的優化問題,利用訓練數據映射到高維空間后的數據得到核主 成分分析模型所采用的訓練數據集殘差,所述訓練數據集殘差為口限闊值,并利用核主成 分分析模型得到測試數據殘差。
[0046] 其中,JkpcaO是通過上述公式之前的關系得到的最終優化目標函數。
[0047] 本實施試方式采用了常規的核主成分分析模型構建方法,其中的每一個步驟均為 本領域公知的方法。測試數據殘差大于訓練數據集殘差值,說明該測試數據被誤檢為異常 數據;測試數據殘差小于訓練數據集殘差,說明該測試數據無誤。
[004引【具體實施方式】結合圖1至圖7說明本實施方式,本實施方式采用實施方式一所 述的評價方法對基于賭和排列賭的傳感器選擇方法進行評價,整個過程的框架如圖2所示。
[0049] 如圖3所示,飛機發動機由風扇、燃燒室、高壓壓縮機、低壓壓縮機、高壓滿輪、低壓 滿輪、噴嘴等組成。在對發動機狀態監測過程中,共有21個傳感器獲取其工作的氣壓、溫度、 轉速等信息。其工作包含了一種失效模式、兩種失效模式、一種操作方式、六種操作方式等。
[0050] 步驟一、21個傳感器獲取的具體狀態監測數據如表1所示。
[0051 ]表1發動機工作與失效數據集
[0化2]
[0化3]
[0054] 步驟二、采用基于賭和排列賭的傳感器選擇方法從21個傳感器中選取7個傳感器 組成第一組傳感器。用基于賭和排列賭的傳感器選擇方法為:
[0055] 傳感器輸出的每一個狀態監測數據可W作為隨機變量,每一種數據都W-定的概 率出現,該隨機變量的賭可W通過下式進行計算。
[0056]
(1)
[0057] 其中,p(xi)代表第i類數據出現的概率,N表示數據的所有種類,得到的賭單位為 b i t。為便于理解賭,此處給出一個取值只有1或0的隨機變量的賭,隨機變量的表示如式(2) 所示。
[0化引
倭)
[0059] 其賭通過式(3)來計算得到。
[0060] H=-qlog2q-(l-q)log2(l-q) (3)
[0061] 實際賭值曲線如圖1所示。賭用于衡量傳感器數據所含有的信息多少,信息量越大 的代表傳感器數據越有價值;根據賭的值選擇信息量多的傳感器,對運些信息量多的傳感 器進行排列賭計算。
[0062] 排列賭用于表示連續η個數據所有的排列種類π,其定義如式(4)所示。 W 創
(4)
[0064] 排列賭的定義考慮了所有排列的情況,并不適用于有退化特征的對象狀態監測。 本實施方式將排列賭改進成只考慮兩個連續數據的情況,用于描述數據的上升或下降趨 勢,該趨勢是系統狀態監測后續處理所需要的一種典型特征。通過排列賭分析傳感器數據 的上升與下降趨勢,在實際應用中,具有上升趨勢與下降趨勢的數據能夠對系統狀態監測 提供有價值的信息。根據排列賭的計算結果再選出監測數據具有上升或下降數據趨勢的傳 感器。
[0065] 在W往的方法中,應用較多的是觀察法,即主觀去判斷傳感器數據的上升與下降 趨勢,通過此方法選擇7個傳感器的編號為2、4、7、8、11、12、15。
[0066] 步驟Ξ、為比較兩種方法的性能,測試傳感器應為同一個傳感器,訓練傳感器為不 同的傳感器,因此,本實施方式選取15號傳感器作為測試傳感器,選取3號傳感器作為基于 賭和排列賭的傳感器選擇方法的訓練傳感器,選取2號傳感器作為觀察法的訓練傳感器;
[0067] 步驟四、利用步驟Ξ選取的兩個訓練傳感器分別構建兩個核主成分分析模型,并 利用兩個核主成分分析模型分別得到基于賭和排列賭的傳感器選擇方法的口限闊值接近 0.3(圖4中的橫線),觀察法的口限闊值接近0.25(圖5中的橫線);
[0068] 步驟五、從數據集1中選取15號傳感器的所有監測數據,衡量傳感器異常監測性能 的指標為誤檢率,由公式(11)所示:
[0069]
(。)
[0070] 其中FH?代表誤檢率,FN代表正確數據中被誤檢的個數,TP代表正確的數據被監測 為正確數據的個數。
[0071] 將數據集1中的每個監測數據分別與基于賭和排列賭的傳感器選擇方法的口限闊 值進行對比,如圖4所示,超過該口限闊值的監測數據作為誤檢數據,低于或等于該口限闊 值的監測數據作為正確數據,根據該誤檢數據的個數和該正確數據的個數計算的誤檢率為 10.42%,采用同樣的方法計算觀察法的誤檢率為32.81 %。
[0072] 采用數據集2中的監測數據得到的異常監測結果如圖6和圖7所示,得到的基于賭 和排列賭的傳感器選擇方法的誤檢率為1.12%,得到的觀察法的誤檢率為34.64%,二者相 差 33.52%。
[0073] 步驟六、通過對兩組誤檢率的值進行分析可知,采用數據集1得到的兩個誤檢率相 差22.39%,采用數據集2得到的兩個誤檢率相差22.39%,基于賭和排列賭的傳感器選擇方 法在數據異常監測方面比傳統的觀察法更具有優勢。
【主權項】
1. 用于數據異常監測的傳感器選擇方法的評價方法,其特征在于,該方法包括以下步 驟: 步驟一、對所有待選擇的傳感器進行編號,采用所有待選擇的傳感器進行數據異常監 測,得到由所有待選擇的傳感器的監測數據構成的數據集; 步驟二、通過方法A選出一組傳感器作為第一組傳感器,通過方法B選出另一組傳感器 為第二組傳感器;其中方法A是指待評價的傳感器選擇方法,方法B是指觀察法; 步驟三、選取兩組傳感器中編號相同的傳感器作為測試傳感器,從第一組傳感器中選 取與第二組傳感器編號不同的傳感器作為方法A的訓練傳感器,從第二組傳感器中選取與 第一組傳感器編號不同的傳感器作為方法B的訓練傳感器; 步驟四、利用方法A的訓練傳感器構建方法A的核主成分分析模型,并利用該核主成分 分析模型得到方法A的訓練數據集殘差,即方法A的門限閾值;利用方法B的訓練傳感器構建 方法B的核主成分分析模型,并利用該核主成分分析模型得到方法B的門限閾值; 步驟五、從數據集中選取測試傳感器的所有監測數據,利用核主成分分析模型將該所 有監測數據中的每個監測數據轉化成測試數據殘差, 對于方法A:將每個測試數據殘差分別與方法A的門限閾值進行對比,超過方法A的門限 閾值的測試數據殘差作為誤檢數據,低于或等于方法A的門限閾值的測試數據殘差作為正 確數據,根據該誤檢數據的個數和該正確數據的個數計算方法A的誤檢率; 對于方法B:將每個測試數據殘差分別與方法B的門限閾值進行對比,超過方法B的門限 閾值的測試數據殘差作為誤檢數據,低于或等于方法B的門限閾值的測試數據殘差作為正 確數據,根據該誤檢數據的個數和該正確數據的個數計算方法B的誤檢率; 步驟六、將方法B的誤檢率與方法A的誤檢率的差值作為方法A的評價結果。2. 根據權利要求1所述的用于數據異常監測的傳感器選擇方法的評價方法,其特征在 于,步驟四中核主成分分析模型的構建方法為: 首先,通過非線性變換將訓練數據映射到高維空間; 然后,通過線性主成分分析法實現特征空間,訓練數據矩陣使用為=比趕... e 表示,訓練數據向量使用向量sn)表示;然后將訓練數據通過非線線映射參:* k 映射到高維特征空間;然后通過線性主成分分析得到投影向量f,使公式 (7)對于訓練數據有最大的方差值, t=((Hx))Tf (7) 最優化問題用式(8)表示:s. t. f Tf = 1 (8) Jkpca()為形成的目標優化函數, t=[姑2…tn]T稱作得分向量,由利用訓練數據通過線性主成分分析得到, (9) α為相關系數,投影向量f與非線性映射Φ之間存在公式(9)所示的關系; 通過式(8)與式(9),得到式(10);通過滿足公式(10)的優化問題,利用訓練數據映射到高維空間后的數據得到核主成分 分析模型所采用的訓練數據集殘差,所述訓練數據集殘差為門限閾值,并利用核主成分分 析模型得到測試數據殘差。
【文檔編號】G06K9/62GK106067032SQ201610362743
【公開日】2016年11月2日
【申請日】2016年5月26日 公開號201610362743.2, CN 106067032 A, CN 106067032A, CN 201610362743, CN-A-106067032, CN106067032 A, CN106067032A, CN201610362743, CN201610362743.2
【發明人】劉連勝, 彭宇, 王本寬, 劉大同, 彭喜元
【申請人】哈爾濱工業大學