基于負荷重采樣的電廠燃燒過程機器學習建模方法
【專利摘要】本發(fā)明提出了一種基于負荷重采樣的電廠燃燒過程機器學習建模方法。本發(fā)明包括如下步驟:步驟(1).從實時運行數(shù)據(jù)中提取穩(wěn)態(tài)樣本;步驟(2).基于負荷將樣本劃分成訓練子集和測試子集;步驟(3).利用所得訓練樣本對模型進行訓練,并用測試樣本對模型的泛化能力進行驗證。本發(fā)明通過基于負荷劃分樣本子集,避免了現(xiàn)有的基于熱態(tài)實驗數(shù)據(jù)的電廠燃燒過程建模方法的不足,使得到的模型更能反映鍋爐燃燒過程的特性;解決了電廠穩(wěn)態(tài)樣本在負荷上分布的不均衡性,保證了模型的泛化能力。
【專利說明】基于負荷重采樣的電廠燃燒過程機器學習建模方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于過程系統(tǒng)建模與優(yōu)化領(lǐng)域,具體涉及一種電廠穩(wěn)態(tài)數(shù)據(jù)提取以及基于負荷重采樣的電廠燃燒過程機器學習建模的方法。
【背景技術(shù)】
[0002]在機器學習建模的過程中,為了避免模型出現(xiàn)過擬合、驗證模型的泛化能力,常常需要將已有的數(shù)據(jù)樣本劃分成兩個或多個獨立的樣本子集,而在選擇模型結(jié)構(gòu)參數(shù)時也需要將樣本劃分成均等的幾個子集。在劃分樣本子集的過程中,如果樣本存在不均衡性(這里所說的不均衡性是指樣本在負荷分布上的不一致:高、低負荷上樣本多,中負荷則樣本少),所得到的樣本子集在統(tǒng)計特征上容易出現(xiàn)顯著的差異,進而造成模型泛化能力不足:在訓練子集上表現(xiàn)很好,在測試子集上則誤差較大。
[0003]目前,電廠的燃燒過程的模型大多基于現(xiàn)場熱態(tài)實驗的穩(wěn)態(tài)工況數(shù)據(jù),這種方法需要機組停運,往往需要消耗比較大的人力物力,而得到的穩(wěn)態(tài)工況數(shù)據(jù)只是常見的幾個負荷工況。對于競價上網(wǎng)的火力電廠而言,需要不停跟蹤電網(wǎng)的負荷指令,機組發(fā)電負荷波動頻繁,幾個典型的穩(wěn)態(tài)負荷工況很難反映出鍋爐燃燒過程的特性,難以適應電廠燃燒優(yōu)化的實時需求。另一方面,利用電廠歷史數(shù)據(jù)庫中的運行數(shù)據(jù)進行建模,需要解決兩個問題:一是如何從實時運行數(shù)據(jù)中提取穩(wěn)態(tài)樣本;二是當所得穩(wěn)態(tài)樣本在負荷工況上分布不均衡時,如何將樣本劃分成用于建模的訓練樣本以及用于模型驗證的測試樣本。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的是針對現(xiàn)有建模方法的不足,提供一種基于負荷重采樣的電廠燃燒過程機器學習建模方法。
[0005]本發(fā)明解決其建模問題所采用的方案如下:
[0006]步驟(I).從實時運行數(shù)據(jù)中提取穩(wěn)態(tài)樣本。
[0007]依據(jù)以下條件來獲取鍋爐燃燒過程的穩(wěn)態(tài)樣本:
[0008]1-1.鍋爐主蒸汽流量的波動范圍不超過最大負荷對應的蒸汽流量的2.5%,且此狀態(tài)保持在I個小時以上,則認為鍋爐主蒸汽流量的波動很小,處于穩(wěn)定狀態(tài);
[0009]1-2.鍋爐的總煤量波動范圍保持在最大負荷對應總煤量的2.5%,且此狀態(tài)保持在I個小時以上,則認為鍋爐的總給煤量波動很小,處于穩(wěn)定狀態(tài);
[0010]1-3.在滿足上述兩個條件的基礎(chǔ)上,機組運行的各臺磨煤機的啟停狀態(tài)未發(fā)生變化;
[0011]設(shè)X1Q),X2 (i)表示鍋爐的主蒸汽流量、總煤量,MaLXpMatX2表示鍋爐處于最大負荷對應的蒸汽流量和總煤量,winSize表示時間窗口的大小;state_no_change表示磨煤機狀態(tài),取值I或O:1表示磨煤機在winSize時間段內(nèi)運行狀態(tài)未變化,O表示磨煤機在winSize時間段內(nèi)運行狀態(tài)發(fā)生了變化;由此將上述三個條件寫成數(shù)學表達式的形式:
【權(quán)利要求】
1.基于負荷重采樣的電廠燃燒過程機器學習建模方法,其特征在于包括如下步驟: 步驟(1).從實時運行數(shù)據(jù)中提取穩(wěn)態(tài)樣本; 步驟(2).基于負荷將樣本劃分成訓練子集和測試子集; 步驟(3).利用所得訓練樣本對模型進行訓練,并用測試樣本對模型的泛化能力進行驗證。
2.如權(quán)利要求1所述的基于負荷重采樣的電廠燃燒過程機器學習建模方法,其特征在于所述的步驟(1)依據(jù)以下條件來獲取鍋爐燃燒過程的穩(wěn)態(tài)樣本: 1-1.鍋爐主蒸汽流量的波動范圍不超過最大負荷對應的蒸汽流量的2.5%,且此狀態(tài)保持在I個小時以上,則認為鍋爐主蒸汽流量的波動很小,處于穩(wěn)定狀態(tài); 1-2.鍋爐的總煤量波動范圍保持在最大負荷對應總煤量的2.5%,且此狀態(tài)保持在I個小時以上,則認為鍋爐的總給煤量波動很小,處于穩(wěn)定狀態(tài); 1-3.在滿足上述兩個條件的基礎(chǔ)上,機組運行的各臺磨煤機的啟停狀態(tài)未發(fā)生變化; 設(shè)X1⑴,X2⑴表示鍋爐的主蒸汽流量、總煤量,Max_Xi,Max_X2表示鍋爐處于最大負荷對應的蒸汽流量和總煤量,winSize表示時間窗口的大小;state_no_change表示磨煤機狀態(tài),取值I或O:1表示磨煤機在winSize時間段內(nèi)運行狀態(tài)未變化,O表示磨煤機在winSize時間段內(nèi)運行狀態(tài)發(fā)生了變化;由此將上述三個條件寫成數(shù)學表達式的形式:
3.如權(quán)利要求1所述的基于負荷重采樣的電廠燃燒過程機器學習建模方法,其特征在于所述的步驟(2)所述的基于負荷將樣本劃分成訓練子集和測試子集具體如下: 2-1.通過步驟(1)獲得穩(wěn)態(tài)樣本數(shù)據(jù),將樣本數(shù)據(jù)與變量的實際運行范圍進行比較,刪除樣本數(shù)據(jù)中超出變量實際范圍的異常值; 2-2.將機組負荷按照低到高的分成10個等距離的半閉負荷子區(qū)間;由于每一個樣本都對應一個負荷值,則可根據(jù)穩(wěn)態(tài)樣本所對應的負荷,將所得穩(wěn)態(tài)樣本依次劃入各個負荷子區(qū)間; 2-3.通過如下方式保證各個負荷子區(qū)間中樣本數(shù)目大小保持一致:設(shè)樣本總數(shù)為D,負荷子區(qū)間數(shù)為N,則每個負荷子區(qū)間的平均樣本數(shù)為A=D/N,對于每個子區(qū)間中的樣本數(shù)B,若A>B,則隨機刪除其中的B-A個樣本;若B < A則樣本全部保留; 2-4.對每一個負荷子區(qū)間,隨機的把其中15~25% (具體的比例依照實際的樣本數(shù)而定)的穩(wěn)態(tài)樣本作為測試子集,余下的75~85%則作為訓練子集。
4.如權(quán)利要求1所述的基于負荷重采樣的電廠燃燒過程機器學習建模方法,其特征在于步驟(3)中所述的訓練樣本為步驟(2)中所有各個負荷子區(qū)間訓練子集的集合;測試樣本為步驟(2)中所有各個負荷子區(qū)間測試子集的集合。
【文檔編號】G06F19/00GK103778324SQ201410005560
【公開日】2014年5月7日 申請日期:2014年1月2日 優(yōu)先權(quán)日:2014年1月2日
【發(fā)明者】徐祖華, 王占能, 趙均, 邵之江 申請人:浙江大學