本技術涉及智能配電優化,具體涉及一種分布式智能配電優化方法、一種分布式智能配電優化裝置、一種機器可讀存儲介質及一種終端設備。
背景技術:
1、電力系統領域的發展伴隨著可持續發展的需求,新型電力系統的重要性日益增長,未來的電力生產和供應系統被稱為智能電網,將為能源生產和調度帶來重大好處。但是,目前的智能電網存在配電系統高復雜度、高動態性與高異構性的問題,同時,新型能源大多受到地理位置、氣候變化與天氣因素等限制,使得電力系統的供給平衡相比傳統電網具有更大的壓力,配電網的優化面臨巨大的挑戰。目前,基于綜合考慮智能電網實體的計算能力、配電任務通信傳輸效率和通信傳輸價格,通常采用經典博弈理論對智能電網中高動態異構網絡環境中分布式網絡實體的效用函數進行動態建模,然而,隨著參與者數量越來越大,經典博弈理論模型由于計算的復雜性難以奏效,無法準確預測智能電網的最優配電策略。
技術實現思路
1、本技術實施例的目的是提供一種分布式智能配電優化方法、裝置、存儲介質及終端設備,以解決上述問題。
2、為了實現上述目的,本技術第一方面提供一種分布式智能配電優化方法,包括:
3、構建表征分布式智能電網中,各智能電網實體的不同業務狀態的概率分布的平均場分布模型;
4、基于所述平均場分布模型構建智能電網實體的收益函數,對所述收益函數執行動態規劃轉換,獲得表征智能電網實體在不同業務狀態和時間下,收益與配電策略的映射關系的價值函數,其中,配電策略包括智能電網實體在當前業務狀態和時間下的業務動作;
5、以所述價值函數為控制方程,基于預設多目標動態優化算法對所述控制方程求解,并基于有限差分法對預設的平均場演化方程求解,以在所述控制方程和平均場演化方程均達到納什均衡點時得到各智能電網實體的最優配電策略,基于所述最優配電策略對各智能電網實體進行配電優化。
6、可選地,基于所述平均場分布模型構建智能電網實體的收益函數,包括:
7、依據預設的業務收益因子、平均場影響因子、傳輸成本因子、計算成本因子、通信傳輸資源及智能電網實體的計算資源,構建智能電網實體的業務狀態、業務動作及平均場分布對應的成本收益函數;
8、依據預設的懲罰因子、當前配電任務所對應的業務任務總量、各智能電網實體的當前業務狀態及智能電網實體的數量,構建表示不同業務任務分配狀態下各智能電網實體的終端懲罰的懲罰函數;
9、基于所述成本收益函數及所述懲罰函數構建智能電網實體的收益函數。
10、可選地,對所述收益函數執行動態規劃轉換,獲得表征智能電網實體在不同業務狀態和時間下,收益與配電策略的映射關系的價值函數,包括:
11、基于貝爾曼最優原理,將所述收益函數轉換為智能電網實體的價值函數;
12、獲得表征智能電網實體在不同業務狀態和時間下,收益與配電策略的映射關系的價值函數之后,所述方法還包括:
13、基于預設的時間變化量對所述價值函數進行轉換,對經轉換后的價值函數進行泰勒展開以得到對應的目標函數;
14、令所述時間變化量趨于預設值,以基于所述目標函數生成表示智能電網實體的配電策略與業務狀態的hjb方程。
15、可選地,以所述價值函數為控制方程,包括:
16、以所述hjb方程為控制方程;
17、所述多目標動態優化算法,包括:
18、s1、初始化算法參數,所述算法參數至少包括種群中的粒子數量、粒子的慣性權重、粒子初始速度及粒子初始位置,其中,種群中每個粒子表示當前配電任務的一個可行解;
19、s2、基于預設適應度函數計算各粒子的適應度值;
20、s3、依據各粒子的適應度值確定各粒子的個體極值、種群群體極值及種群的平均適應度值,其中,個體極值是單個粒子截止現在時刻搜索到的最優位置,群體極值是整個粒子群截止現在時刻搜索到的最優位置;
21、s4、基于種群的平均適應度值、粒子的慣性權重的最大值及粒子的慣性權重的最小值更新各粒子的慣性權重;
22、s5、依據各粒子的慣性權重、個體極值及種群群體極值更新各粒子的當前速度和當前位置,返回步驟s2,若種群群體極值在連續迭代n次后仍未更新,依據個體極值及種群群體極值更新各粒子的當前速度和當前位置;
23、s6、判斷是否滿足終止條件,若是,輸出當前最優個體極值與種群群體極值中適應度值較大的一者為當前最優解,否則,返回步驟s2。
24、可選地,基于種群的平均適應度值、粒子的慣性權重的最大值及粒子的慣性權重的最小值更新各粒子的慣性權重,包括:
25、通過以下公式更新各粒子的慣性權重:
26、
27、其中,表示粒子的慣性權重,表示粒子的慣性權重的最小值,表示粒子的慣性權重的最大值,表示種群的平均適應度值, gi( t)表示 t時刻時粒子 i的適應度值,min gi( t)表示所有粒子的最小適應度值。
28、可選地,依據個體極值及種群群體極值更新各粒子的當前速度和當前位置,包括:
29、通過以下公式更新各粒子的當前速度:
30、
31、通過以下公式更新各粒子的當前位置:
32、
33、其中, filialv表示粒子的當前速度, filialx表示粒子的當前位置, c表示學習因子, poolv (seedi )表示個體極值的速度, poolv (seedj )表示種群群體極值的速度, poolx (seedi )表示個體極值的位置, poolx (seedj )表示種群群體極值的位置, norm表示求模長。
34、可選地,所述平均場演化方程,包括:
35、
36、其中,表示智能電網實體在時間 t和業務狀態 s下的平均場分布、 m( t, s)表示 m( t, s)關于能量狀態e的變化率、表示 t時刻的能量使用狀態、 m( t, s)表示 m( t, s)關于隊列狀態 q的變化率、表示 t時刻的隊列狀態。
37、可選地,基于有限差分法對預設的平均場演化方程求解,包括:
38、基于有限差分法對預設的平均場演化方程求解,得到以下關系式:
39、
40、其中,,,,表示時刻、能級和狀態處的平均場的值,表示時刻、能級和狀態處的功率,表示時刻、能級和狀態處的隊列狀態的值。
41、本技術第二方面,提供一種分布式智能配電優化裝置,包括:
42、模型構建模塊,被配置為構建表征分布式智能電網中,各智能電網實體的不同業務狀態的概率分布的平均場分布模型;
43、收益函數構建模塊,被配置為基于所述平均場分布模型構建智能電網實體的收益函數,對所述收益函數執行動態規劃轉換,獲得表征智能電網實體在不同業務狀態和時間下,收益與配電策略的映射關系的價值函數,其中,配電策略包括智能電網實體在當前業務狀態和時間下的業務動作;
44、配電優化模塊,被配置為以所述價值函數為控制方程,基于預設多目標動態優化算法對所述控制方程求解,并基于有限差分法對預設的平均場演化方程求解,以在所述控制方程和平均場演化方程均達到納什均衡點時得到各智能電網實體的最優配電策略,基于所述最優配電策略對各智能電網實體進行配電優化。
45、可選地,基于所述平均場分布模型構建智能電網實體的收益函數,包括:
46、依據預設的業務收益因子、平均場影響因子、傳輸成本因子、計算成本因子、通信傳輸資源及智能電網實體的計算資源,構建智能電網實體的業務狀態、業務動作及平均場分布對應的成本收益函數;
47、依據預設的懲罰因子、當前配電任務所對應的業務任務總量、各智能電網實體的當前業務狀態及智能電網實體的數量,構建表示不同業務任務分配狀態下各智能電網實體的終端懲罰的懲罰函數;
48、基于所述成本收益函數及所述懲罰函數構建智能電網實體的收益函數。
49、可選地,對所述收益函數執行動態規劃轉換,獲得表征智能電網實體在不同業務狀態和時間下,收益與配電策略的映射關系的價值函數,包括:
50、基于貝爾曼最優原理,將所述收益函數轉換為智能電網實體的價值函數;
51、獲得表征智能電網實體在不同業務狀態和時間下,收益與配電策略的映射關系的價值函數之后,所述收益函數構建模塊,還被配置為:
52、基于預設的時間變化量對所述價值函數進行轉換,對經轉換后的價值函數進行泰勒展開以得到對應的目標函數;
53、令所述時間變化量趨于預設值,以基于所述目標函數生成表示智能電網實體的配電策略與業務狀態的hjb方程。
54、可選地,以所述價值函數為控制方程,包括:
55、以所述hjb方程為控制方程;
56、所述多目標動態優化算法,包括:
57、s1、初始化算法參數,所述算法參數至少包括種群中的粒子數量、粒子的慣性權重、粒子初始速度及粒子初始位置,其中,種群中每個粒子表示當前配電任務的一個可行解;
58、s2、基于預設適應度函數計算各粒子的適應度值;
59、s3、依據各粒子的適應度值確定各粒子的個體極值、種群群體極值及種群的平均適應度值,其中,個體極值是單個粒子截止現在時刻搜索到的最優位置,群體極值是整個粒子群截止現在時刻搜索到的最優位置;
60、s4、基于種群的平均適應度值、粒子的慣性權重的最大值及粒子的慣性權重的最小值更新各粒子的慣性權重;
61、s5、依據各粒子的慣性權重、個體極值及種群群體極值更新各粒子的當前速度和當前位置,返回步驟s2,若種群群體極值在連續迭代n次后仍未更新,依據個體極值及種群群體極值更新各粒子的當前速度和當前位置;
62、s6、判斷是否滿足終止條件,若是,輸出當前最優個體極值與種群群體極值中適應度值較大的一者為當前最優解,否則,返回步驟s2。
63、可選地,基于種群的平均適應度值、粒子的慣性權重的最大值及粒子的慣性權重的最小值更新各粒子的慣性權重,包括:
64、通過以下公式更新各粒子的慣性權重:
65、
66、其中,表示粒子的慣性權重,表示粒子的慣性權重的最小值,表示粒子的慣性權重的最大值,表示種群的平均適應度值, gi( t)表示 t時刻時粒子 i的適應度值,min gi( t)表示所有粒子的最小適應度值。
67、可選地,依據個體極值及種群群體極值更新各粒子的當前速度和當前位置,包括:
68、通過以下公式更新各粒子的當前速度:
69、
70、通過以下公式更新各粒子的當前位置:
71、
72、其中, filialv表示粒子的當前速度, filialx表示粒子的當前位置, c表示學習因子, poolv (seedi )表示個體極值的速度, poolv (seedj )表示種群群體極值的速度, poolx (seedi )表示個體極值的位置, poolx (seedj )表示種群群體極值的位置, norm表示求模長。
73、可選地,所述平均場演化方程,包括:
74、
75、其中,表示智能電網實體在時間 t和業務狀態 s下的平均場分布、 m( t, s)表示 m( t, s)關于能量狀態e的變化率、表示 t時刻的能量使用狀態、 m( t, s)表示 m( t, s)關于隊列狀態 q的變化率、表示 t時刻的隊列狀態。
76、可選地,基于有限差分法對預設的平均場演化方程求解,包括:
77、基于有限差分法對預設的平均場演化方程求解,得到以下關系式:
78、
79、其中,,,,表示時刻、能級和狀態處的平均場的值,表示時刻、能級和狀態處的功率,表示時刻、能級和狀態處的隊列狀態的值。
80、本技術第三方面,提供一種機器可讀存儲介質,該機器可讀存儲介質上存儲有指令,該指令在被處理器執行時使得所述處理器被配置成執行如上述的分布式智能配電優化方法。
81、本技術第四方面,提供一種終端設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現如上述的分布式智能配電優化方法的步驟。
82、本技術基于平均場博弈對動態異構網絡下一個時刻的最優配電策略進行預測,能夠有效降低分布式智能配電網絡中大量網絡實體節點的效用函數優化求解復雜度,保證智能配電網絡的高效性與可靠性,可以顯著提高電網的運行效率,尤其適用于規模大、結構復雜的電網系統。
83、本技術實施例的其它特征和優點將在隨后的具體實施方式部分予以詳細說明。