基于數據平滑度函數的火電機組負荷(準)穩態工況聚類算法
【技術領域】
[0001] 本發明屬于火力發電廠汽輪機組安全經濟性遠程診斷與服務技術領域,具體涉及 一種基于數據平滑度函數的機組負荷(準)穩態工況聚類算法。
【背景技術】
[0002] 在現階段,依靠現代信息技術,特別是計算機網絡技術的快速發展和應用,節能技 術實驗室實現了對發電企業和發電集團信息基礎設施的整合和利用,通過機組現場實時一 次運行數據的集中報送,逐步建成了集火電機組實時數據采集、傳輸、存儲和計算為一體的 能耗大數據支撐平臺。通過機組能耗大數據支撐平臺,為異地電廠或發電集團的設備運行 原始參數等各種資源與節能技術的有效溝通,提供了非常方便的聯系交流途徑,實現了異 地數據共享的功能。
[0003] 然而火電機組是一個復雜的耦合系統,尤其是具有多級回熱和再熱系統的大容 量、高參數機組,由于工況的暫態變化,以及機組在蓄熱、放熱、壓縮、膨脹等熱力過程中的 熱慣性,導致其實時運行參數的傳輸具有滯后性和動態性的特點。并且各個設備運行狀態 存在不確定變化,在(準)穩態與非穩態之間不斷交替運行,過渡狀態中數據的統計特性變 動尤其劇烈,其中機組負荷是一個表征機組運行工況的重要參數,所有的機組二次性能指 標數據計算都是在特定機組負荷或者說特定工況下進行的。
[0004] 進行設備狀態診斷分析時首先要獲得歷史數據集的穩定工況,只有(準)穩態工 況下各參數才具有較強狀態的一致性,在非穩態工況下,數據不能真實地反映系統輸入輸 出的關系,會帶來辨識和建模誤差。如果直接從機組歷史數據庫中將非穩態數據提取并用 于計算分析,其結果會有較大的波動和偏差,不能反映機組設備的實際運行狀態和性能,非 穩態數據在機組的診斷和分析方面不具有實際的指導意義和應用價值。
【發明內容】
[0005] 本發明要解決的技術問題是提供一種有效的基于數據平滑度函數的機組負荷 (準)穩態工況判定方法,以實現對火電廠能耗大數據平臺中海量機組數據的(準)穩態工 況判定,其可以更加高效準確的獲取機組海量數據的(準)穩態工況,并在系統平臺中保存 為典型工況數據集,為機組后續的性能指標計算和診斷分析提供重要的數據支撐。
[0006] 為解決上述技術問題,本發明所采取的技術方案為:一種基于數據平滑度函數的 機組負荷(準)穩態工況聚類算法,其具體包括以下步驟:
[0007] (1)系統平臺機組負荷數據預處理
[0008] 數據預處理是獲取機組負荷典型工況數據集的第一步,通過綜合應用統計學方法 對采集數據進行數據校正,以消除粗大誤差和壞值點,提高所研宄數據對象的準確性和一 致性,使其能夠真實反映機組的運行狀況;
[0009] 以系統平臺歷史數據庫中2n+l個機組負荷數據為研宄對象,標記數據采樣間 隔節點分別為X_n,x_n+1,…,x_i,Xd,Xi,…,Xm,xn。機組負荷數據分別記為W_n,W_n+1,… ,W+WyWi,…,Wm,Wn,表示在對應間隔節點上系統采集到的機組負荷數據。由于系統平臺按 照時間每5分鐘對實際運行的機組進行一次數據采集,同時將采集到的數據存儲在系統數 據庫中,即系統平臺是以時間序列為等距節點的數據采集模式。做變換t= (x-X(l)/5則上 述 2n+l個等間隔節點變為:t_n= -n,t_n+1= -n+1,…,t_!= -1,t〇= 0,ti= 1,…,t= n_l,tn=n
[0010] 用m次多項式擬合機組負荷數據,如下式(1):
[0011]
【主權項】
1. 一種基于數據平滑度函數的機組負荷(準)穩態工況聚類算法,包括以下步驟: (1) 機組負荷數據預處理 數據預處理是獲取機組負荷典型工況數據集的第一步,通過綜合應用統計學方法對采 集數據進行數據校正,以消除粗大誤差和壞值點,使其能夠真實反映機組的運行狀況; (2) 定義數據平滑度函數F 對經過預處理的機組負荷數據集進行(準)穩態判定,以機組負荷數據單調變化的程 度大小為判定準則,定義機組負荷數據平滑度函數F ; (3) 通過聚類算法獲得機組負荷(準)穩態工況 按照設定的數據平滑度要求,以數據平滑度函數為準則對數據進行區分和分類,通過 聚類獲得機組典型工況數據集。
2. 根據權利要求1所述的一種基于數據平滑度函數的機組負荷(準)穩態工況聚類 算法,其特征在于:所述步驟(1)中所述的機組負荷數據預處理,以系統平臺歷史數據庫中 2n+l個機組負荷數據為研宄對象,標記數據采樣間隔節點分別為x_ n,x_n+1,…,x-i,X(l,X1,… ,χ η+ xn,機組負荷數據分別記為W_n,W_n+1,…,W+ Wtl, W1,…,Wlri, Wn,表示在對應間隔節點上 系統采集到的機組負荷數據;由于系統平臺按照時間每5分鐘對實際運行的機組進行一次 數據采集,同時將采集到的數據存儲在系統數據庫中,即系統平臺是以時間序列為等距節 點的數據采集模式;做變換t = (x-x^/5,則上述2n+l個等間隔節點變為:t_n= -n, t _η+ι =-n+1, ···, t_!= -I, t 〇= 0, t != I, ···, t n_!= n-1, t n= n 用m次多項式擬合機組負荷數據,如下式(I):
其中,Ci一待定參數(i = 0, 1,; m-階次因子。 為了消除粗差和壞值點,需要確定待定參數Ci,構造以下等式:
應用最小二乘原理,使誤差值& (_n < j < η)的平方和最小,以獲得最優的系數Ci,
公式(3)分別對Ci求偏導,并令其為0,可得以下方程組:
求解方程組(4),獲得最優參數Ci,將其代入公式(1)中從而得到機組負荷數據的回歸 值%,以代替原始機組負荷數據Wj。
3. 根據權利要求1所述的一種基于數據平滑度函數的機組負荷(準)穩態工況聚類算 法,其特征在于:所述步驟(2)中定義數據平滑度函數,對經過預處理的機組負荷數據集進 行(準)穩態判定,以機組負荷數據單調變化的程度大小為判定準則,定義機組負荷數據平 滑度的相關概念如下: 待判定的機組負荷歷史數據為Wi,其中,i = 1,2, ···]!; 定義機組負荷數據變化量為Cli= (Wi-WiJ ; η個機組負荷數據變化量為Wd,其中 Wd= d2+d3+...+dn 為了考核機組負荷數據的波動程度,引入機組負荷數據平滑度函數的概念; 計算待判定的η個機組負荷數據平均值,其中
因此機組負荷數據平滑度函數F為:
機組負荷數據平滑度F的具體意義是:當指定時間段數據平滑度比較大時,則表示負 荷數據呈現單調增加或單調減小的趨勢;反之,當數據平滑度較小時,說明負荷數據變化比 較平緩;數據平滑度函數是一個介于〇和1之間的數。
4.根據權利要求1所述的一種基于數據平滑度函數的機組負荷(準)穩態工況聚類算 法,其特征在于:所述步驟(3)中通過聚類算法獲得機組負荷(準)穩態工況,具體步驟如 下: 輸入:某臺機組負荷歷史數據集; 輸出:機組負荷數據聚類結果,機組典型工況數據; Stepl:將指定的機組負荷歷史數據按照時間序列放入數組中; Step2:機組負荷數據預處理,剔除粗差和壞值; Step3:定義變量i,并置為零; Step4:定義指針W(t),并將其指向機組負荷數據集的初始位置; Step5: (1) 指針指向的位置標記為tl = *W(tI); (2) 由指針位置向后,掃描機組負荷數組; (3) 計算該時間段內的機組負荷數據平滑度函數,并做判斷; 如果不滿足數據平滑度函數要求,那么: {指針W(t)指向掃描數據終止點,重復過程⑴一(3) ;} 否則: {(4)繼續掃描相同數量的機組負荷數據; (5)計算所掃描的全部機組負荷數據平滑度函數,并判斷; 如果滿足數據平滑度函數要求,那么: {重復過程⑷一(5) ;} 否則: {指針w(t)指向掃描(準)穩態工況數據終止點,并標記為to = *w(to) ;}} Ste6:計算t〇-tI,并做判斷; 如果(t〇-tI)> = 1小時,那么: {確定為一個機組負荷(準)穩態工況聚類,并標記為一個典型工況數據集; 計數變量:i = i+Ι ; 指針W(t)指向掃描數據結束點的下一個數據點處; 轉向過程(1),重復以上過程直到機組負荷數據集中不存在沒有被掃描的數據為止;} 否則: {指針W(t)指向掃描數據結束點的下一個數據點處; 轉向過程(1),重復以上過程直到機組負荷數據集中不存在沒有被掃描的數據為 止;}。
【專利摘要】本發明公開了一種基于數據平滑度函數的機組負荷(準)穩態工況聚類算法,其步驟為:(1)通過綜合應用統計學方法對采集到的機組負荷數據進行數據預處理,提高所研究數據對象的準確性和一致性,使其能夠真實反映機組的運行狀況;(2)以數據平滑度函數為準則,截斷大于設定臨界閾值的單調數據區域,對機組負荷數據進行(準)穩態工況判定;(3)選擇符合數據平滑度要求,且滿足最短(準)穩態工況時間的機組負荷數據,通過有效的聚類算法獲得機組典型工況數據集并存儲。本方法靈活適用,適于火電機組負荷數據(準)穩態工況的判定,可以獲取機組運行典型工況數據,為后續的機組診斷服務以及機組運行狀態分析優化等工作提供了有效的數據支撐。
【IPC分類】G06F19-00
【公開號】CN104750973
【申請號】CN201510090659
【發明人】李曉光, 盧盛陽, 郭江龍, 米翠麗, 陳二松
【申請人】河北省電力建設調整試驗所
【公開日】2015年7月1日
【申請日】2015年2月28日