基于線性相似度排序的電力運行月度重要指標篩選方法
【技術領域】
[0001] 本發明涉及電力運行監測領域,尤其是一種電力運行月度重要指標篩選方法。
【背景技術】
[0002] 隨著電網公司外部經營環境的快速變化,電網企業面臨著社會用電量增速下降, 收入增長放緩的不利局面。因此電網企業需要從公司可持續發展的視角,對公司的運營狀 況進行全局性、綜合性的分析,發現公司運營中存在的能力短板,使決策者能夠制定相應的 策略對能力短板予以消除。同時,還需要在日常的動態運營過程中,能夠連續的、敏捷的發 現公司運營中存在的異動,追溯原因,使公司能夠動態的調整自身運營能力,應對快速變化 的內、外部環境。
[0003] 省級電力公司需要對公司運營動態開展了常態化的監測日報、公司月度運營動態 分析報告等分析工作,對公司領導對公司運營狀況的把握形成了初步的支撐。因此,從電網 的經濟效益出發考慮,找出能夠支撐決策,判斷運營狀態的重要指標,并加以分析就顯得異 常迫切了。
【發明內容】
[0004] 為了克服已有電力運行監測方式的無法判斷指標重要性的不足,本發明提供一種 有效篩選出月度重要指標的基于線性相似度排序的電力運行月度重要指標篩選方法。
[0005] 本發明解決其技術問題所采用的技術方案是:
[0006] -種基于線性相似度排序的電力運行月度重要指標篩選方法,所述篩選方法包括 以下步驟:
[0007] (1)從數據庫中取出所有月級別指標的統計數據;
[0008] ⑵對所有指標X進行編號,并加入集合XS={XiIi= 1,2…n},Xi為指標i的月 統計數據;
[0009] (3)線性相似度計算
[0010](3. 1)對集合XS中的n個指標兩兩組合;
[0011] (3. 2)依次對所有組合進行相關度計算,相關系數計算公j
~,、h,分別表示指標期望與指標Xj的期望,分別表示指標Xi的標準差與指 標Xj的標準差,記指標Xi與指標Xj之間的相關系數為Pz,z,;
[0012] 對所有相關系數Pz,'.取其絕對值!Px,'.I記作Aj,并加入集合RS={TijIi= 1,2…n,j= 1,2…n,i乒j};
[0013] (4)篩選月度重要指標
[0014] (4. 1)對集合RS進行降序處理,按照rij的值從大到小重新排序;
[0015] (4.2)保留集合RS中rij值在區間[0.9,1]內所有元素,遍歷集合RS,直至出現 ryo. 9,刪除該元素及其后的所有元素;
[0016] (4. 3)統計集合RS中每一個指標出現的次數,若指標i出現a次則記ti=a, aG[0,n-1],并加入集合TS= {tk|k= 1,2*"n},這里下標k即指標的編號;
[0017] (4. 4)對集合TS進行降序處理,按照tk的值從大到小重新排序;
[0018] (4.5)設6值為1;
[0019] (4.6)取集合TS的第e項和第e+1項,計算第e項與第e+1項之差,并將差值加入 集合CS;
[0020] (4. 7)對e進行加1操作,并判斷第e+1項是否為集合TS的最后一項;若否,回到 步驟4.6;若是,繼續下一步驟4.8;
[0021] (4.8)從集合CS找出的最大差值c;
[0022] (4. 9)在集合TS中找出產生最大差值c的減數項tf,并刪除tf及其以后的所有元 素;
[0023](5)提交月度重要指標
[0024] (5. 1)經過篩選以后集合TS中剩余的tk,指標k是月度重要指標;
[0025] (5. 2)從集合XS中找出月度重要指標的統計數據xk,提交這些指標數據至數據 庫。
[0026] 進一步,所述步驟(4.8)中,從集合CS找出的最大差值c時,若出現兩個或兩個以 上最大差值c,則取第一個為最大差值c。
[0027] 本發明的技術構思為:本發明設計了一種基于相似度排序的電力運行月度重要指 標篩選方法。
[0028] 在實際分析過程中,從數據庫中取所有月級別指標的統計數據,然后采用Pearson 線性相關度計算計算所有指標兩兩之間的相關系數。然后將相關系數絕對值對于[0.9,1] 之間的兩兩指標提取出來,并統計所有提出來的指標中每個指標的出現次數。最后根據每 個指標的統計次數從大到小排序,計算所有相鄰兩個指標統計次數之差,找出最大次數之 差。截取這個指標之前的所有統計指標,這些指標便是所需的月度重要指標,并提交數據 庫。該項發明運用相關系數計算,找出了關聯性較強的指標,并通過一定的篩選方法,找出 月度重要指標。為公司運營,領導層決策提供了可靠的依據,有效強化管理,及時調整運營, 規避風險震蕩,實現效益最大化。
[0029] 本發明的有益效果主要表現在:1、效益最大化;2、動態監測分析;3、快速反應。
【附圖說明】
[0030] 圖1是基于線性相似度排序的電力運行月度重要指標篩選方法的流程圖。
[0031]圖2是基于線性相似度排序的電力運行月度重要指標篩選系統的結構圖。
【具體實施方式】
[0032] 下面結合附圖對本發明作進一步描述。
[0033] 參照圖1和圖2,一種基于線性相似度排序的電力運行月度重要指標篩選方法,包 括以下步驟:
[0034] 第一步:從數據庫中取出所有月級別指標的統計數據。
[0035] 第二步:對所有指標進行編號,并加入集合XS={Xi|i= 1,2…n},Xi為指標i月 統計數據。
[0036] 第三步:對集合XS中的n個指標進行兩兩組合,共有種組合。 £(1,-|iA)U',-ns )
[0037] 第四步:依次對所有組合進行相關度計算,相關系數計算公式h^;. hk分別表示指標Xi的期望與指標Xj的期望,%、分別表示指標Xi的標準差與指 標&的標準差,記指標^與指標\之間的相關系數為。對所有相關系數取其絕 對值IPa. 丨記作Aj,并加入集合RS={Tijli= 1,2",n,j= 1,2",n,i乒j}。
[0038] 第五步:對集合RS進行降序處理。按照的值從大到小重新排序。
[0039] 第六步:保留集合RS中rij值在區間[0.9,1]內所有元素。遍歷集合RS,直至出 現ru〈0. 9,刪除該元素及其后的所有元素。
[0040] 第七步:統計集合RS中每一個指標出現的次數,即統計rij下標i(j和i的意義相 同)出現的次數。若指標i出現4次則記ti= 4,并加入集合TS={tk|k= 1,2…n}。這 里下標k即指標的編號
[0041] 第八步:對集合TS進行降序處理。按照tk的值從大到小重新排序。
[0042] 第九步:設e值為1。
[0043] 第十步:取集合TS中的第e項與第e+1項,計算差值并將值加入集合CS。
[0044] 第十一步:對e進行加1操作,并判斷第e+1項是否為集合TS的最后一項。若否, 回到第十步;若是,繼續下一步。
[0045] 第十二步:從集合CS找出的最大差值c。(若出現兩個最大差值,則取第一個為最 大差值c)
[0046] 第十三步:在集合TS中找出產生最大差值的減數項tf,并刪除&及其之后的所有 元素。(包括減數項tf)
[0047] 第十四步:集合TS中剩余的tk,指標k是篩選出來的月度重要指標。
[0048] 第十五步:從集合XS中找出月度重要指標的統計數據xk,提交這些指標數據至數 據庫。
[0049] 參照圖2,應用本方法實現的基于線性相似度排序的電力運行月度重要指標篩選 系統,主要包括:線性相似度計算模塊、篩選月度重要指標模塊、提交月度重要指標模塊、用 戶交互模塊。
[0050](1)線性相似度計算模塊:采用線性相關度計算,對數據庫中所有的月級別指標 的統計數據進行兩兩的相關系數計算。
[0051] (2)篩選月度重要指標模塊:取相關系數的絕對值在區間[0. 9,1]內的分組指標, 統計指標出現次數并按次數降序排列指標,計算最大次數差值。
[0052] (3)月度重要指標更新模塊:篩選出最大差值之前的所有指標,并找出這些月度 重要指標的統計數據提交至數據庫。
[0053] (4)用戶交互模塊:客戶端系統配置,指標分析結果,數據可視化展示,指標分析 算法工具。
【主權項】
1. 一種基于線性相似度排序的電力運行月度重要指標篩選方法,其特征在于:所述篩 選方法包括以下步驟: (1) 從數據庫中取出所有月級別指標的統計數據; (2) 對所有指標x進行編號,并加入集合XS={Xi|i= 1,2…n},Xi為指標i的月統計 數據; (3) 線性相似度計算 (3. 1)對集合XS中的n個指標兩兩組合; (3. 2)依次對所有組合進行相關度計算,相關系數計算公式R分別表示指標Xi的期望與指標xj的期望,分別表示指標Xi的標準差與指 標Xj的標準差,記指標Xi與指標Xj之間的相關系數為; 對所有相關系數Px,xy.取其絕對值II記作Aj,并加入集合RS={TijIi= 1, 2…n,j =1,2...n,i乒j}; (4) 篩選月度重要指標 (4. 1)對集合RS進行降序處理,按照rij的值從大到小重新排序; (4.2)保留集合RS中rij值在區間[0.9,1]內所有元素,遍歷集合RS,直至出現ryo. 9,刪除該元素及其后的所有元素; (4. 3)統計集合RS中每一個指標出現的次數,若指標i出現a次則記ti=a,aG[〇,n_l],并加入集合TS= {tk|k= 1,2…n},這里下標k即指標的編號; (4. 4)對集合TS進行降序處理,按照tk的值從大到小重新排序; (4. 5)設e值為1 ; (4. 6)取集合TS的第e項和第e+1項,計算第e項與第e+1項之差,并將差值加入集合CS; (4. 7)對e進行加1操作,并判斷第e+1項是否為集合TS的最后一項;若否,回到步驟 4. 6 ;若是,繼續下一步驟4. 8 ; (4. 8)從集合CS找出的最大差值c; (4. 9)在集合TS中找出產生最大差值c的減數項tf,并刪除%及其以后的所有元素; (5) 提交月度重要指標 (5. 1)經過篩選以后集合TS中剩余的tk,指標k是月度重要指標; (5. 2)從集合XS中找出月度重要指標的統計數據xk,提交這些指標數據至數據庫。2. 如權利要求1所述的一種基于線性相似度排序的電力運行月度重要指標篩選方法, 其特征在于:所述步驟(4.8)中,從集合CS找出的最大差值c時,若出現兩個或兩個以上最 大差值c,則取第一個為最大差值c。
【專利摘要】一種基于線性相似度排序的電力運行月度重要指標篩選方法,從數據庫中取所有月級別指標的統計數據,然后采用Pearson線性相關度計算計算所有指標兩兩之間的相關系數。然后將相關系數絕對值對于[0.9,1]之間的兩兩指標提取出來,并統計所有提出來的指標中每個指標的出現次數。最后根據每個指標的統計次數從大到小排序,計算所有相鄰兩個指標統計次數之差,找出最大次數之差。截取這個指標之前的所有統計指標,這些指標便是所需的月度重要指標,并提交數據庫。本發明提供一種有效篩選出月度重要指標的基于線性相似度排序的電力運行月度重要指標篩選方法。
【IPC分類】G06Q50/06, G06F17/30
【公開號】CN104992374
【申請號】CN201510319313
【發明人】蔣一波, 盛尚浩, 樓弘, 鄭建煒
【申請人】浙江工業大學
【公開日】2015年10月21日
【申請日】2015年6月11日