本發明涉及充電負荷分析,尤其涉及一種基于數據相關性的電動汽車充電負荷預測方法及系統。
背景技術:
1、隨著電動汽車數量的不斷增加,電動汽車充電負荷的預測成為電網調度和規劃中的重要問題。現有的充電負荷預測方法主要依賴于歷史數據的統計分析和簡單的預測模型,但這些方法存在以下幾個方面的不足:
2、忽視數據的復雜相關性:現有方法通常忽略了多維數據之間的復雜相關性。電動汽車充電負荷受到多個因素的影響,包括電動汽車充電記錄、充電站位置、電網負荷、天氣狀況、交通流量等。現有技術往往沒有充分考慮這些因素之間的相互關系,導致預測精度不高。
3、缺乏對關鍵特征的識別和保留:現有方法在數據預處理中,缺乏有效的特征選擇和降維處理,未能準確識別并保留對充電負荷預測具有重要影響的關鍵特征。數據中的冗余和噪聲特征可能會干擾模型的訓練和預測,降低模型的性能。
4、未能充分利用時間序列數據的特性:電動汽車充電負荷數據具有明顯的時間序列特性,現有方法往往未能有效捕捉和利用這一特性,傳統的統計分析方法和簡單的機器學習模型難以處理時間序列數據中的長短期依賴關系,影響預測的準確性和穩定性。
技術實現思路
1、基于上述目的,本發明提供了一種基于數據相關性的電動汽車充電負荷預測方法及系統。
2、一種基于數據相關性的電動汽車充電負荷預測方法,包括以下步驟:
3、s100,從多個數據源采集多維數據,多維數據包括電動汽車充電記錄、充電站位置、電網負荷、天氣數據、交通流量;
4、s200,采用數據相關性分析法分析多維數據之間的相關性,對相關性強的數據進行關聯標記;
5、s300,基于數據相關性分析的結果,采用降維方法對數據進行特征選擇,構建特征向量,在特征向量構建過程中考慮已關聯標記的數據;
6、s400,基于機器學習模型,并將構建的特征向量作為輸入,對歷史數據進行訓練,建立充電負荷預測模型;
7、s500,充電負荷預測:將實時采集到的多維數據輸入經過優化的充電負荷預測模型,得到電動汽車的充電負荷預測結果。
8、s600,結果輸出:將預測結果以圖表、報告形式輸出,供電網調度和規劃參考。
9、可選的,所述s100中多維數據的采集包括:
10、s110,從電動汽車管理系統中獲取電動汽車充電記錄,所述充電記錄包括充電開始時間、充電結束時間、充電量、電池狀態和車輛位置信息;
11、s120,從充電站運營商或公共充電站管理系統中獲取充電站位置數據,所述位置數據包括充電站的地理坐標、充電樁數量、充電功率;
12、s130,從電網運營商獲取電網負荷數據,所述負荷數據包括歷史負荷記錄、實時負荷數據、峰谷負荷分布和區域負荷信息;
13、s140,從氣象部門或氣象數據服務提供商獲取天氣數據,所述天氣數據包括降雨量、風速和天氣預報信息;
14、s150,從交通管理部門或交通數據服務提供商獲取交通流量數據,所述交通流量數據包括道路擁堵情況、車輛通行速度、交通事故信息;
15、s160,對采集到的多維數據進行預處理,預處理包括數據清洗操作、數據歸一化操作。
16、可選的,所述s200具體包括:
17、s210,使用皮爾遜相關系數法分析各特征變量與電動汽車充電負荷之間的線性相關性,計算每個特征變量與充電負荷的相關系數,特征變量為多維數據中的具體數據項;
18、s220,使用互信息法分析各特征變量與電動汽車充電負荷之間的非線性相關性,計算每個特征變量與充電負荷的互信息值;
19、s230,進行時滯相關性分析,評估各特征變量與充電負荷之間的滯后關系,計算時滯相關系數;
20、s240,對線性相關性、非線性相關性分析和時滯相關性分析的結果進行綜合評估,確定與電動汽車充電負荷具有強相關性的特征變量;
21、s250,對確定為強相關性的特征變量進行關聯標記,記錄其在數據集中的位置和相關性強度,以便在后續的特征選擇和模型訓練過程中優先考慮這些特征變量。
22、可選的,所述皮爾遜相關系數分析表示為:,其中,和分別表示特征變量和電動汽車充電負荷,表示數據點的數量;
23、所述互信息分析表示為:
24、,其中,和分別表示特征變量和電動汽車充電負荷,表示和的聯合概率分布,和分別表示和的邊緣概率分布;
25、所述時滯相關性分析表示為:
26、,其中,和分別表示特征變量和滯后時間后的充電負荷,表示數據點的數量。
27、可選的,所述綜合評估包括將皮爾遜相關系數、互信息值和時滯相關系數進行標準化處理,使其取值范圍一致,標準化表示為:
28、;
29、設皮爾遜相關系數、互信息值和時滯相關系數分別標準化為、和,則綜合相關性評分為:
30、,其中,、和為權重系數,反映線性、非線性和時滯相關性的相對重要性;
31、關聯標記:對綜合評估結果中評分進行排序,根據排序選擇特征變量進行關聯標記,記錄該特征變量在數據集中的位置和相關性強度。
32、可選的,所述s300具體包括:
33、s310,將原始數據矩陣表示為,其行表示樣本,列表示特征變量,對已關聯標記的特征變量賦予高權重,構建加權數據矩陣,加權表示為:,其中,是第個特征的權重,對于關聯標記的特征,賦予高權重,對于其他特征,賦予權重;
34、s320,利用改進的主成分分析計算加權數據矩陣的協方差矩陣:
35、,其中,為樣本數量,為加權數據矩陣的轉置,對協方差矩陣進行特征值分解,得到特征值和對應的特征向量:,按特征值的大小對特征向量進行排序,選擇前個特征向量,構建特征向量矩陣:
36、,其中,為保留的主要成分數量;
37、s330,構建特征向量:將加權數據矩陣投影到特征向量矩陣上,得到降維后的特征向量矩陣:,在特征向量構建過程中,確保已關聯標記的特征變量在降維后的特征向量中占據重要位置,保留其強相關性。
38、可選的,所述s400中的建立充電負荷預測模型具體包括:
39、s410,根據特征向量的特點和預測任務的需求,選擇lstm(長短期記憶網絡)模型作為機器學習模型,以處理時間序列數據的長短期依賴關系;
40、s420,對構建的特征向量進行數據分割,將特征向量和對應的歷史充電負荷數據分為訓練集和驗證集;
41、s430,構建lstm模型的網絡結構,設置輸入層、多個lstm層、全連接層和輸出層,初始化模型參數;
42、s440,將訓練集的特征向量矩陣作為輸入,歷史充電負荷數據作為輸出,對lstm模型進行訓練,調整模型參數以優化模型性能;將訓練集的特征向量矩陣作為輸入,歷史充電負荷數據作為輸出,訓練lstm模型,訓練過程表示為:
43、模型訓練模型;
44、s450,使用驗證集對訓練好的lstm模型進行評估,計算預測誤差和模型性能指標,包括均方誤差(mse),根據評估結果對模型進行優化,均方誤差損失函數衡量模型預測值與實際值之間的誤差:,最終得到性能優異的充電負荷預測模型。
45、可選的,所述s430中的構建lstm模型的網絡結構具體包括:
46、輸入層:設定輸入層的維度為特征向量的長度,如果降維后的特征向量矩陣的維度為,其中是樣本數量,是特征數量,則輸入層的維度為;
47、lstm層:添加一個或多個lstm層,每層包含若干lstm單元,lstm層的單元數量根據數據集的規模和復雜性進行調整,單元數量越多,模型的學習能力越強,但計算量也越大:
48、層輸出;
49、全連接層:lstm層的輸出通過全連接層,轉換為預測結果,全連接層用于持續提取特征和進行線性變換,表示為:
50、全連接層輸出層輸出,其中,是權重矩陣,是偏置向量;
51、輸出層:設定輸出層為一個節點,用于輸出預測的充電負荷值。
52、可選的,所述s600具體包括:
53、s610,將充電負荷預測結果進行可視化處理,生成相關圖表,包括充電負荷曲線圖、負荷分布圖;
54、s620,編寫預測報告,詳細記錄預測結果,包括預測值、預測誤差、預測時間信息;
55、s630,將生成的圖表和報告整合成完整的pdf輸出文件,供電網調度和規劃部門參考。
56、一種基于數據相關性的電動汽車充電負荷預測系統,用于實現上述的基于數據相關性的電動汽車充電負荷預測方法,包括以下模塊:
57、采集模塊,從多個數據源采集包括電動汽車充電記錄、充電站位置、電網負荷、天氣數據、交通流量在內的多維數據;
58、預處理模塊,用于對采集到的多維數據進行數據清洗、數據歸一化;
59、相關性分析模塊,用于采用皮爾遜相關系數、互信息法和時滯相關性分析,對多維數據之間的相關性進行分析,并對與電動汽車充電負荷具有強相關性的特征變量進行關聯標記;
60、特征選擇與降維模塊,用于基于數據相關性分析的結果,采用改進的主成分分析方法對數據進行特征選擇和降維處理,構建特征向量;
61、預測模型訓練模塊,基于lstm模型,將構建的特征向量作為輸入,對歷史數據進行訓練,建立充電負荷預測模型;
62、實時數據處理與預測模塊,用于將實時采集到的多維數據輸入經過優化的充電負荷預測模型,生成電動汽車的充電負荷預測結果;
63、結果輸出模塊,用于將預測結果輸出。
64、本發明的有益效果:
65、本發明,通過采集多維數據(包括電動汽車充電記錄、充電站位置、電網負荷、天氣數據和交通流量),采用改進的主成分分析方法,對綜合評估后的特征變量進行降維處理,構建特征向量,在降維過程中,對相關性強的特征變量進行關聯標記并賦予較高權重,充分保留關鍵特征,提高了模型輸入數據的有效性,選擇長短期記憶網絡(lstm)模型,充分利用其處理時間序列數據長短期依賴關系的優勢,對充電負荷進行高精度預測。
66、本發明,提出了綜合性的數據相關性分析方法,結合皮爾遜相關系數、互信息、時滯相關性多種分析手段,對多維數據進行全面評估,識別出對充電負荷具有顯著影響的特征變量。在降維處理過程中,對綜合評估后的特征變量進行關聯標記,并采用加權主成分分析方法,對關聯標記的特征變量賦予較高權重,確保這些關鍵特征在降維后的特征向量中得到充分表達,有效減少了冗余特征,保留了數據中的主要信息,提高了模型訓練的效率和預測的精度。