一種基于聯合學習的電力用戶用電量預測方法
【技術領域】
[0001] 本發明屬于計算機應用技術、數據挖掘、電力數據分析技術領域,特別是涉及一種 基于聯合學習的電力用戶用電量預測方法。
【背景技術】
[0002] 隨著智能電網、通信網絡技術和傳感器技術的發展,使電網系統中積累了大量的 數據,同時也給電力數據的分析帶來了新的挑戰。基于這些數據預測未來時間段內用戶的 用電量,是電力數據分析中最重要的任務之一。例如,胡杰等從適用條件、數據形式、計算復 雜度和適用范圍等方面對電力負荷常用的幾種方法進行了比較分析和總結。張素香等提出 了并行局部加權線性回歸算法,研究并解決了海量數據電力負荷短期預測問題。也有些研 究者采用線性回歸模型來預測用戶的用電量,在對某省份的用電量預測任務中取得較好的 性能。王徳文等提出了基于隨機森林算法的并行負荷預測方法。而黃元生等則采用一元線 性回歸分析法和趨勢比率誤差調整法,基于以往五年我國季度月度用電量數據,對未來短 期內我國的用電量做出了科學的預測。蔡劍彪提出了云計算下的智能電網負荷預測平臺構 建的基本方法,并利用智能化的多級協調技術,提高了各級電網的負荷預測精度。
[0003] 然而,傳統的用電量預測工作都是將所有用戶作為一個整體進行建模,并對電力 系統供電負荷做一個整體的預測,而忽略了用戶自身的特點、用戶之間的區別和關聯關系。
【發明內容】
[0004] 為了解決上述問題,本發明的目的在于提供一種基于聯合學習的電力用戶用電量 預測方法。
[0005] 為了達到上述目的,本發明提供的基于聯合學習的電力用戶用電量預測方法包括 按順序進行的下列步驟:
[0006] 步驟1)輸入用戶用電記錄數據,然后利用上述用戶用電記錄數據構建用戶用電 記錄矩陣,之后利用用戶用電記錄矩陣計算用戶每天的用電總量,并表示為向量;最后輸出 所有用戶的用電記錄矩陣;輸入用戶地理位置信息,然后將上述用戶地理位置信息用層級 表示,之后對用戶地理位置信息相似度進行衡量,最后輸出所有用戶的地理位置信息和地 理位置信息相似度矩陣;
[0007] 步驟2)根據步驟1)獲得的所有用戶的地理位置信息對供電區域進行劃分,構建 區域之間用戶整體用電行為相似度矩陣;
[0008] 步驟3)根據步驟1)中獲得的用電記錄矩陣和步驟2)中獲得的區域之間用戶整 體用電行為相似度矩陣,構建用戶用電量在日期維度上的線性關系模型,并對線性預測模 型求解;構建不同供電區域中的多個線性預測模型,并進行線性預測模型之間知識傳遞與 相互學習,最后聯合優化多個線性預測模型。
[0009] 在步驟1)中,所述的輸入用戶用電記錄數據,然后利用上述用戶用電記錄數據構 建用戶用電記錄矩陣,之后利用用戶用電記錄矩陣計算用戶每天的用電總量,并表示為向 量;最后輸出所有用戶的用電記錄矩陣的方法為:
[0010] 用戶用電記錄數據中的所有用戶被表示為集合:
[0011] U = {Ui, u2, ···,%}
[0012] 其中N表示數據中包含的用戶個數,Ul表示第i個用戶;
[0013] 第i個用戶的用電記錄數據被構建為用電記錄矩陣:
[0014] U,e
[0015] 其中D表示數據中用電記錄包含的天數,T表示每個用戶每天的用電記錄包含的 均勻采樣點的個數,蜓#表示Τ行D列的非負實數矩陣;同時,用和Uf分別表示矩陣A 的第t行和第d列,即用戶1!在每天第t個時間點上的所有用電記錄和在第d天的用電記 錄,并用<表示矩陣A的第t行第d列上的元素;根據Ui,可以計算用戶在D天中每天的用 電總量,并表示為向量Xi;Xi中每個元素的計算公式如下:
[0016] X卜ψΚ
[0017] 最后輸出所有用戶的用電記錄矩陣:
[0018]
[0019]在步驟1)中,所述的輸入用戶地理位置信息,然后將上述用戶地理位置信息用層 級表示,之后對用戶地理位置信息相似度進行衡量,最后輸出所有用戶的地理位置信息和 地理位置信息相似度矩陣的方法是:
[0020] 第i個用戶的地理位置信息被表示為結構體:
[0021]
[0022] 其中gi為居住地點中某個組成部分的字符串表示,按行政單位,即省、城市、區 縣、鄉鎮、街道、小區從大到小的順序排列;
[0023] 任意兩個地理位置在第k級行政單位上的相鄰關系表示為:
[0024]
[0025] 其中€為0/1值,表示兩個地理位置是否相鄰,S(·,·)為邏輯函數,當兩個字 符串相同時取值1,否則為〇,η(·,·)通過查詢數據庫來判斷兩個相同級別的行政單位 在地理位置上是否相鄰;
[0026] 最終,輸出所有用戶的的地理位置信息矩陣和地理位置信息相似度矩陣:
[0027]
[0028]
[0029] 在步驟2)中,所述的對供電區域進行劃分,構建區域之間用戶整體用電行為相似 度矩陣的方法為:
[0030] 步驟2. 1)統計供電范圍內所有最低行政單位的S2. 1階段;
[0031] 抽取所有用戶地理位置信息矩陣gl,g2,…,gN中的最低級行政單位的字符串表示 展Γ,去重,得到供電范圍內的所有最低行政單位Ω= {ω1;ω2,···,coj;
[0032] 步驟2. 2)供電區域劃分方案初始化的S2. 2階段;
[0033] 將步驟2. 1)中得到的所有最低行政單位Ω= {ωι,ω2,…,coj作為供電區域的 初始劃分;
[0034] 步驟2. 3)計算供電區域鄰接矩陣的S2. 3階段;
[0035] 根據供電區域ωρ中包含的所有地理位置,計算供電區域ωp的結構化表示,公式 如下:
[0036] 如果 V&e 卜· ,+ ?
[0037] 否則 4=0,
[0038] 然后,計算任意兩個供電區域ωρ和ωq的鄰接關系,并構建鄰接矩陣A,公式如 下:
[0039] apq=η(ωp,oq);
[0040] 步驟2. 4)計算供電區域中用戶整體用電相似度的S2. 4階段;
[0041] 采用用電區域中所有用戶的用電量向量的均值來表示供電區域中用戶整體的用 電量,公式如下:
[0042] = i:, ;
[0043] 然后,采用向量的余弦相似度計算不同區域間用戶整體用電行為的相似度,構建 相似關系矩陣S,公式如下:
[0044] spq=Cos(X(ωp),X(ωq));
[0045] 步驟2. 5)融合地理上相鄰且用戶總體用電需求相似的供電區域的S2. 5階段;
[0046] 根據鄰接矩陣A,對任意兩個相鄰的供電區域ω#Ρωq,若用戶整體用電行為相似 度spq大于閾值Φ,則合并兩個供電區域;
[0047] 步驟2. 6)判斷供電區域劃分是否收斂的S2. 6階段;
[0048] 若供電區域的劃分已經收斂,則進行步驟2. 7),否則返回步驟2. 3);
[0049] 步驟2. 7)輸出結果的S2. 7階段;
[0050] 輸出供電區域劃分結果,本流程至此結束。
[0051] 在步驟3)中,所述的根據步驟1)中獲得的用電記錄矩陣和步驟2)中獲得的區域 之間用戶整體用電行為相似度矩陣,構建用戶用電量在日期維度上的線性關系模型,并對 線性預測模型求解的方法是;
[0052] 構建單個供電區域上用戶用電量在日期維度上的模型是用電量預測的基礎;以供 電區域ω為例,用戶Ui在接下來一天中的用電量y1與用電量向量Χι之間關系的模型為:
[0053] / =μ'1X; + …+ + 5, =xfw+ &
[0054] 即用戶在連續D+1天內的用電量是線性相關的,因此用電量y1可以通過用電量向 量^中不同元素的線性組合來進行預測;其中w是線性組合參數,1