一種基于大數據技術的電力系統短期負荷預測方法
【技術領域】
[0001] 本發明設及電力系統工程技術領域,尤其設及一種基于大數據技術的電力系統短 期負荷預測方法。
【背景技術】
[0002] 電力系統短期負荷預測結果關系到電力系統調度運行和生產計劃的制定,準確的 短期負荷預測結果有助有提高系統的安全性和穩定性,能夠減少發電成本。隨著電力系統 中分布式能源(太陽能、風能、儲能等)的大量接入,負荷的變化規律更加難W把握,該種不 確定性將會增加電力系統負荷預測的難度。因此亟待一種能夠更好把握負荷變化規律的預 測方法。
[0003] 用戶是電網中的最基礎組成部分,也是造成電網負荷波動的源頭。然而,現今的負 荷預測方法都是針對系統級的負荷預測,最深入的也不過是母線級別的預測。因此,研究一 種針對用戶級的負荷預測框架,并利用數據挖掘方法發掘用戶用電行為規律,提高負荷預 測的精度是十分必要的。
【發明內容】
[0004] 本發明提出了一種基于大數據技術的電力系統短期負荷預測方法,有效解決由于 用戶用電規律復雜造成的負荷預測精度較低問題。
[0005] 為達到上述目的,本發明采用的技術方案是;一種基于大數據技術的電力系統短 期負荷預測方法,包括如下步驟:
[0006] (1)負荷曲線聚類分析。對待預測日前一年的歷史負荷數據進行W天為單位的凝 聚層次聚類分析,將形狀特征相似的負荷曲線歸為一類;
[0007] (2)確立關鍵影響因素。結合歷史負荷及天氣數據計算灰色關聯分析結果,并對結 果排序得出影響負荷的關鍵影響因素;
[0008] (3)建立分類規則,W層次聚類分析結果及關鍵影響因素為輸入,采用CART算法 建立決策樹,得到凝聚層次聚類分析結果;
[0009] (4)將待預測日分類。將待預測日的關鍵因素日特征向量數據輸入決策樹,得到待 預測日的分類結果;
[0010] (5)訓練預測模型并預測。選取相應類中的歷史負荷數據訓練支持向量機模型,根 據步驟4中得出的待預測日的分類結果,選用對應的支持向量機模型完成預測;
[0011] 做計算系統負荷。針對預測目標電網中的所有用戶,重復W上步驟,累加所有用 戶負荷并疊加網損負荷得到整個電網的系統級負荷。
[0012] 進一步的,所述步驟(1)具體包括如下步驟:
[0013] 采用的聚類分析算法為改進的凝聚層次聚類算法。同時,本發明將歐式距離中每 一個維度的差值進行最大值歸一化,如下式所示:
[0014]
[0015] 其中,每一天為一個負荷序列,n代表該負荷序列為一個n維向量(通常為96維); di2代表負荷序列1和負荷序列2的空間距離;該距離中的Xik代表第一個負荷序列中的第 k維數據,x,k代表第二個負荷序列中的第k維數據;X代表所有負荷序列第k維中的最大 值。
[0016] 將待預測日前一年的歷史負荷數據作為歷史數據集。采用上述應用標準化歐式距 離改進的層次聚類算法,W每天n點的負荷數據形成一個向量,通過計算各個向量之間的 標準化歐式距離,將其由零散分布的獨立樣本逐漸歸為趨勢相近的若干類。
[0017] 進一步的,所述步驟(2)具體包括如下步驟:
[0018] 采用灰色關聯分析算法計算每個因素的灰色關聯度。將預測日前一年的歷史負荷 數據、氣象數據W及日類型數據集作為分析樣本,設定母序列為負荷值,天氣因素、日類型 為若干子序列。采用灰色關聯分析算法分析各個子序列與母序列的相關性,最后將一年每 天的灰色關聯度求均值即可得到各個影響因素的灰色關聯度。對灰色關聯度進行排序,選 定值較大的前4個作為影響負荷的關鍵影響因素,具體步驟如下:
[0019] (a)確定規范化屬性矩陣;
[0020] 歷史負荷數據值為母序列Y= {y。72,…,yp}T,與之對應的關鍵影響因素為子序列 Xi= {Xii,X2。…,XpjT,則可得到矩陣如下;
[0021]
[0022] 式中P代表有P個樣本,q代表有q個待分析的影響因素,X代表因素序列,y代表 負荷序列。
[0023] 化)接下來對A矩陣按列用下式進行均值規范化處理,
[002引式中,Xik代表第i個因素的第t時刻的值,di代表各個序列的均值化算子,是化 表每列元素的平均值。其中,母序列Y也按照同理規范化處理,記其均值化算子為D。
[0027] (C)A矩陣經過規范化后為:
[0028]
[002引 (d)計算關聯系數
[0030]因素Xi的第t個指標與負荷序列Y的第t個指標之間的關聯系數Ci(t)的幾何 意義是曲線Xi與曲線Y在t時刻的相對差值,其計算公式如下:
[0031]
[0032]式中,Amax為|mk(t)-ei(t)I的最大值,Amin為|mk(t)-ei(t)I的最小值; I化(t)-ei(t)|為t時刻的值。P為分辨系數,其作用在于提高關聯系數之間的差異性,一 般在0~1之間選取,通常取P= 0. 5。
[0033] (e)確定關鍵影響因素排序
[0034] 在上述關聯系數的基礎上,可m十算出因素X占負荷Y的關聯度為:
[00 巧]
[0036] 一般情況下,灰色關聯度值值在0到1之間。值越接近1,變量X、Y之間的線性 相關程度就越大,的絕對值越接近0,表示X、Y之間越沒有線性相關關系;0<r<l,表示X、 Y有相關關系,但是非線性關系;IrI> 0. 6,視為局度關聯;0. 2《IrI<0. 6,視為中等相關; IrI<0. 2,視為關聯性極弱,可W忽略。
[0037] 進一步的,所述步驟(3)具體包括如下步驟:
[0038] 采用的算法為CART決策樹算法,在每個節點(除葉節點外)將選用Gini指數最 小的關鍵影響因素,將當前節點的歷史負荷數據集分割為兩個子集,直到最后的分類結果 與步驟1中的聚類結果吻合。該過程完成對歷史負荷及關鍵影響因素數據與聚類結果間禪 合關系的學習,能夠清楚完善的表征分類規則。
[0039] 進一步的,所述步驟巧)具體包括如下步驟:
[0040] 針對步驟1的分類結果,將每類的負荷數據及相應的關鍵因素數據構建訓練樣 本,訓練若干個支持向量機模型。支持向量機的核函數選擇RBF核函數,參數的尋優方法選 用網格尋優法,即窮舉法。
[0041] 根據步驟4中得出的待預測日的分類結果,選用對應的支持向量機模型完成預 測。
[0042] 進一步的,所述步驟(6)在化doop大數據計算平臺上完成。
[0043] 本發明具有的優點和積極效果是;本發明提供一種基于大數據技術的電力系統短 期負荷預測方法,并利用數據挖掘方法發掘用戶用電行為規律,提高負荷預測的精度,有助 有提高電力系統的安全性和穩定性,能夠減少發電成本。
【附圖說明】
[0044] 圖1為本發明的結構框架示意圖;
[0045] 圖2為本發明的算法流程圖;
[0046] 圖3為用戶#1的層次聚類樹狀圖;
[0047] 圖4為用戶#1的6類負荷曲線圖;
[0048] 圖5為大數據計算平臺框架圖;
[0049] 圖6為基于大數據技術的電力系統短期負荷預測方法效果圖。
【具體實施方式】
[0050] 下面結合附圖和【具體實施方式】對本發明作進一步詳細的說明。
[0051] 如圖2所示,一種基于大數據技術的電力系統短期負荷預測方法,包括W下步驟:
[0052] S1輸入歷史負荷數據;
[0053] S2利用改進層次聚類算法對輸入歷史負荷數據進行聚類;
[0054] 由于負荷曲線的走勢與日類型,天氣因素等密切相關。通過曲線的聚類分析,可W 將形狀特征相似的負荷曲線歸為一類。
[00巧]本發明采用的聚類分析算法為改進的凝聚層次聚類算法。同時,本發明將歐式距 離中每一個維度的差值進行最大值歸一化,如下式所示:
[0056]