一種配電網二次設備類型識別方法及系統的制作方法
【專利摘要】本發明涉及一種配電網二次設備類型識別方法及系統,所述方法包括:對運行監控數據進行預處理;對預處理后的運行監控數據進行分詞和詞頻統計,獲取候選1?項集;用Apriori算法處理所述候選1?項集,獲取強關聯規則;根據所述強關聯規則識別配電網二次設備的類型;本發明提供的方案,應用頻繁模式挖掘方法對大規模指定范圍的配電網運行監控數據進行關聯規則挖掘,產生二次設備分類規則,利用此規則對設備進行明確歸類,實現海量種類繁多的配電網二次設備的歸類統計,為配電網設備運行狀態監視評估奠定基礎。
【專利說明】
一種配電網二次設備類型識別方法及系統
技術領域
[0001]本發明涉及電力系統自動化分析技術領域,具體涉及一種配電網二次設備類型識別方法及系統。【背景技術】
[0002]電網規模不斷擴大,各配電網采用不同廠家、不同類型的電氣二次設備,使配電網中二次設備種類繁多且數量巨大,在實際應用中,二次設備類型信息往往缺失,使二次設備類別區分不明確。這使得目前電網信息化以及能源互聯網構建過程中所要求的電網設備運行狀態監視評估遇到很大困難,包括設備的分類統計、設備仿真等實際需求。經調研,目前還未存在一種基于實際運行監控數據的專門針對配電網二次設備類型的智能識別方法。
[0003]頻繁模式挖掘是數據挖掘領域的一種典型的關聯規則產生方法,將大量數據作為候選項集,通過特定的自學習算法發現頻繁項集并產生關聯規則。針對配電網二次設備識別與分類工作,通過對運行監控數據進行頻繁模式挖掘,產生設備與其類型的關聯規則,從而利用此規則進行設備智能識別與分類。采用此種自學習的方式進行配電網設備識別,可以依據不同地區的運行監控數據集產生具有該地區特色的設備類型關聯規則,從而實現地區個性化設備智能識別分類。
【發明內容】
[0004]本發明提供一種配電網二次設備類型識別方法及系統,其目的是應用頻繁模式挖掘方法對大規模指定范圍的配電網運行監控數據進行關聯規則挖掘,產生二次設備分類規貝1J,利用此規則對設備進行明確歸類,實現海量種類繁多的配電網二次設備的歸類統計,為配電網設備運行狀態監視評估奠定基礎。
[0005]本發明的目的是采用下述技術方案實現的:
[0006]—種配電網二次設備類型識別方法,其改進之處在于,包括:
[0007]對運行監控數據進行預處理;
[0008]對預處理后的運行監控數據進行分詞和詞頻統計,獲取候選1-項集;
[0009]用Apr1ri算法處理所述候選1-項集,獲取強關聯規則;
[0010]根據所述強關聯規則識別配電網二次設備的類型。[〇〇11] 優選的,所述對運行監控數據進行預處理包括:
[0012]應用CEP引擎,對所述運行監控數據的名稱和格式進行關鍵詞提取和與所述運行監控數據無關信息的剔除;
[0013]應用CEP引擎,對所述運行監控數據的各信號進行信號內關鍵詞剔除、信號內含有的裝置名稱剔除、信號內關鍵詞的替換和關鍵詞組的模糊匹配。
[0014]優選的,所述對處理后運行監控數據進行分詞和詞頻統計包括:
[0015]配置ElasticSearch,將預處理后的運行監控數據加載入ElasticSearch,獲取運行監控信號的分詞集合和詞頻統計數,并將所述分詞集合作為候選1-項集。
[0016]優選的,所述用Apr1ri算法處理所述候選1-項集,獲取強關聯規則包括步驟: [〇〇17] a.根據最小支持度對當前候選1-項集進行剪枝,剪掉小于所述最小支持度的項集,獲取頻繁i_項集,并判斷所述頻繁i_項集是否為空集,若是,則執行步驟c,若否,則執行步驟b;
[0018] b.將所述頻繁i_項集進行自然連接,獲取候選(i+l)_項集,掃描信號分詞集合,統計所述候選(i+l)_項集的詞頻統計數,并返回步驟a,其中,所述自然連接為任意兩項進行組合;[〇〇19] c.設置最小置信度閾值,將上述步驟生成的全部頻繁項集進行置信度驗證,獲取強關聯規則。
[0020]優選的,所述根據所述強關聯規則識別配電網二次設備的類型包括:遍歷所述配電網二次設備的運行監控數據,將所述配電網二次設備的運行監控數據與所述強關聯規則進行匹配,獲取所述配電網二次設備的類型。
[0021] —種配電網二次設備類型識別系統,其改進之處在于,所述系統包括:[〇〇22]預處理模塊,用于對運行監控數據進行預處理;
[0023]分詞模塊,用于對預處理后的運行監控數據進行分詞和詞頻統計,獲取候選1-項集;[0〇24] Apr1ri算法處理模塊,用于用Apr1ri算法處理所述候選1-項集,獲取強關聯規則;
[0025]識別模塊,用于根據所述強關聯規則識別配電網二次設備的類型。[〇〇26]優選的,所述預處理模塊包括:[〇〇27]第一預處理單元,用于應用CEP引擎,對所述運行監控數據的名稱和格式進行關鍵詞提取和與所述運行監控數據無關信息的剔除;[〇〇28]第二預處理單元,用于應用CEP引擎,對所述運行監控數據的各信號進行信號內關鍵詞剔除、信號內含有的裝置名稱剔除、信號內關鍵詞的替換和關鍵詞組的模糊匹配。 [〇〇29]優選的,所述分詞模塊包括:[0〇3〇] 分詞單元,用于配置ElasticSearch,將預處理后的運行監控數據加載入 ElasticSearch,獲取運行監控信號的分詞集合和詞頻統計數,并將所述分詞集合作為候選 1-項集。[0〇31 ]優選的,所述Apr1ri算法處理模塊包括:
[0032]第一處理單元,用于根據最小支持度對當前候選1-項集進行剪枝,剪掉小于所述最小支持度的項集,獲取頻繁i_項集,并判斷所述頻繁i_項集是否為空集,若是,則執行第三處理單元,若否,則執行第二處理單元;[〇〇33]第二處理單元,用于將所述頻繁i_項集進行自然連接,獲取候選(i+l)_項集,掃描信號分詞集合,統計所述候選(i+l)_項集的詞頻統計數,并返回步驟a,其中,所述自然連接為任意兩項進行組合;[〇〇34]第三處理單元,用于設置最小置信度閾值,將上述步驟生成的全部頻繁項集進行置信度驗證,獲取強關聯規則。
[0035]優選的,所述識別模塊包括:識別單元,用于遍歷所述配電網二次設備的運行監控數據,將所述配電網二次設備的運行監控數據與所述強關聯規則進行匹配,獲取所述配電網二次設備的類型。
[0036]本發明的有益效果:
[0037]本發明提供的一種配電網二次設備類型識別方法及系統,提出了一種針對不同地區的大規模配電網運行監控數據頻繁模式挖掘的電網設備智能識別方法,利用CEP數據預處理技術、ElasticSearch分詞技術和Apr1ri頻繁項集挖掘技術進行數據處理及規則自學習,從而利用關聯規則進行設備識別和類型匹配。可以自動將指定范圍的海量雜亂的配電網設備及運行監控信號進行有效的歸類處理,是配電網設備運行狀態監視評估必要的數據準備,為配電網二次設備運行狀態監視系統及其他基于設備分析的應用系統奠定了數據基礎。【附圖說明】
[0038]圖1是本發明一種配電網二次設備類型識別方法的流程圖;
[0039]圖2是本發明實施例中Apr1ri算法的實現過程流程圖;
[0040]圖3是本發明一種配電網二次設備類型識別系統的結構示意圖。【具體實施方式】[〇〇41]下面結合附圖對本發明的【具體實施方式】作詳細說明。
[0042]為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其它實施例,都屬于本發明保護的范圍。
[0043]本發明提供的一種配電網二次設備類型識別方法,如圖1所示,包括:[0〇44]101.對運行監控數據進行預處理;
[0045]102.對預處理后的運行監控數據進行分詞和詞頻統計,獲取候選1-項集;
[0046]103.用Apr1ri算法處理所述候選1-項集,獲取強關聯規則;
[0047]104.根據所述強關聯規則識別配電網二次設備的類型。[〇〇48]具體的,配電網運行監控數據的預處理方法。采用復雜事件處理引擎,將輸入的原始數據通過既定的規則庫(包括切分、提取、替換、匹配等)進行預處理,產生所需格式的熟數據,所述步驟101包括:
[0049]應用CEP引擎,對所述運行監控數據的名稱和格式進行關鍵詞提取和與所述運行監控數據無關信息的剔除;
[0050]應用CEP引擎,對所述運行監控數據的各信號進行信號內關鍵詞剔除、信號內含有的裝置名稱剔除、信號內關鍵詞的替換和關鍵詞組的模糊匹配。[0051 ]例如,取清洗后的運行監控信號樣本為:[〇〇52]{直流電源空開投非電量投非全相投檢修態重瓦斯有載瓦斯油溫1油溫2繞組溫高壓力釋放壓力突變冷卻故障跳主變高壓側開關二A相1跳主變高壓側開關二B相1跳主變高壓側開關二C相1閉鎖重合投高壓側強切1母投高壓側強切2母};[〇〇53]{投直流電源空開投交流電壓空開投充電保護壓板投過流壓板跳閘出口 1A跳閘出口 1B跳閘出口 1C失靈跳相鄰開關I失靈跳相鄰開關n失靈啟動1母差1失靈啟動1母差2失靈啟動遠傳1失靈啟動遠傳2失靈聯跳主變A相跟跳動作B相跟跳動作C相跟跳動作A相跳閘B相跳閘}{投直流電源空開投交流電壓空開投重合閘壓板投過流投檢修過流保護動作過流I段動作過流n段動作過流m段動作低壓減載動作低周減載動作重合閘動作后加速動作ta斷線TV斷線裝置異常直流電源消失裝置閉鎖A網通信中斷B網通信中斷};
[0054]進一步的,利用ElasticSearch對海量運行監控數據進行文本劃分和詞頻統計,生成原始項集,所述步驟102包括:
[0055]配置ElasticSearch,將預處理后的運行監控數據加載入ElasticSearch,獲取運行監控信號的分詞集合和詞頻統計數,并將所述分詞集合作為候選1-項集。
[0056]例如:對其進行分詞操作,得到部分結果如下,作為初始事務數據庫:
[0057]{直流,電源,空開,投,電量,全相,檢修,瓦斯,油溫,繞組,壓力,釋放,突變,冷卻, 故障,主變,高壓側,開關,相,閉鎖,重合,強切};[〇〇58]{直流,電源,空開,投,開關,相,交流,充電,保護,壓板,過流,跳閘,出□,失靈,相鄰,啟動,母差,遠傳,聯跳,跟跳,動作};
[0059]{直流,電源,空開,投,交流,重合閘,壓板,過流,檢修,保護,動作,I段,n段,m段,低壓,減載,低周,后加速,TA,TV,斷線,裝置,異常,消失,閉鎖,A網,B網,通信,中斷};
[0060]掃描初始事務數據庫,對所有項進行支持度計數統計,生成候選項集:
[0061]{:跳閘,1} {:后加速,1}{斷線,1}{異常,1}{消失,1}{遠傳,1}{出口,1}{故障,1} {:重合,1}{過流,2}{1段,1}{裝置,1}{動作,2}{壓板,2} {:重合閘,1}{瓦斯,1}{強切,1}{全相, 1}{跟跳,1}{減載,1}{保護,2}{啟動,1}{壓力,1}{閉鎖,2}{聯跳,1}{11段,1}{8網,1}{通信,i}{主變,i}{tv,i}{a網,i}{開關,2}{直流,3}{冷卻,1} {:高壓側,1}{突變,i}{m段,1} {釋放,1}{中斷,1}{交流,2}{電源,3}{相鄰,1}{TA,1}{空開,3}{檢修,2}{繞組,1}{電量, 1}{充電,1}{低壓,1}{母差,1}{失靈,1}{低周,1}{相,2}{油溫,1}{投,3};
[0062]如圖2所示,在原始項集的基礎上,利用Apr1ri方法發現所有設備頻繁項集,從而產生設備與類型關聯規則,進一步的,所述步驟103,包括步驟:[〇〇63] a.根據最小支持度對當前候選1-項集進行剪枝,剪掉小于所述最小支持度的項集,獲取頻繁i_項集,并判斷所述頻繁i_項集是否為空集,若是,則執行步驟c,若否,則執行步驟b;
[0064]b.將所述頻繁i_項集進行自然連接,獲取候選(i+l)_項集,掃描信號分詞集合,統計所述候選(i+l)_項集的詞頻統計數,并返回步驟a,其中,所述自然連接為任意兩項進行組合;
[0065]c.設置最小置信度閾值,將上述步驟生成的全部頻繁項集進行置信度驗證,獲取強關聯規則。
[0066]例如:設最小支持度計數為1,篩選候選項集,得到出現次數大于等于1的項集,SP 頻繁1-項集,并對頻繁項集中所有項進行自然連接組合,形成候選2-項集;
[0067]掃描初始事務數據庫,對候選2-項集中所有項進行支持度計數,篩選出支持度計數大于等于1的所有項,形成頻繁2-項集,對頻繁2-項集中所有項進行組合,形成候選3項集,再通過掃描初始事務數據庫進行篩選,依次類推,直至形成的頻繁k-項集為空集。[〇〇68]通過產生的關聯規則對配電網設備進行類型識別,輸出分類處理后的設備數據, 所述步驟104包括:遍歷所述配電網二次設備的運行監控數據,將所述配電網二次設備的運行監控數據與所述強關聯規則進行匹配,獲取所述配電網二次設備的類型。
[0069]—種配電網二次設備類型識別系統,如圖3所示,所述系統包括:
[0070]預處理模塊,用于對運行監控數據進行預處理;
[0071]分詞模塊,用于對預處理后的運行監控數據進行分詞和詞頻統計,獲取候選1-項集;[0〇72] Apr1ri算法處理模塊,用于用Apr1ri算法處理所述候選1-項集,獲取強關聯規則;
[0073]識別模塊,用于根據所述強關聯規則識別配電網二次設備的類型。[〇〇74]具體的,所述預處理模塊包括:[〇〇75]第一預處理單元,用于應用CEP引擎,對所述運行監控數據的名稱和格式進行關鍵詞提取和與所述運行監控數據無關信息的剔除;[〇〇76]第二預處理單元,用于應用CEP引擎,對所述運行監控數據的各信號進行信號內關鍵詞剔除、信號內含有的裝置名稱剔除、信號內關鍵詞的替換和關鍵詞組的模糊匹配。 [〇〇77]所述分詞模塊包括:[〇〇78] 分詞單元,用于配置ElasticSearch,將預處理后的運行監控數據加載入 ElasticSearch,獲取運行監控信號的分詞集合和詞頻統計數,并將所述分詞集合作為候選 1-項集。
[0079]所述Apr1ri算法處理模塊包括:
[0080]第一處理單元,用于根據最小支持度對當前候選1-項集進行剪枝,剪掉小于所述最小支持度的項集,獲取頻繁i_項集,并判斷所述頻繁i_項集是否為空集,若是,則執行第三處理單元,若否,則執行第二處理單元;
[0081]第二處理單元,用于將所述頻繁1-項集進行自然連接,獲取候選(i+l)_項集,掃描信號分詞集合,統計所述候選(i+l)_項集的詞頻統計數,并返回步驟a,其中,所述自然連接為任意兩項進行組合;[〇〇82]第三處理單元,用于設置最小置信度閾值,將上述步驟生成的全部頻繁項集進行置信度驗證,獲取強關聯規則。
[0083]所述識別模塊包括:識別單元,用于遍歷所述配電網二次設備的運行監控數據,將所述配電網二次設備的運行監控數據與所述強關聯規則進行匹配,獲取所述配電網二次設備的類型。
[0084]最后應當說明的是:以上實施例僅用以說明本發明的技術方案而非對其限制,盡管參照上述實施例對本發明進行了詳細的說明,所屬領域的普通技術人員應當理解:依然可以對本發明的【具體實施方式】進行修改或者等同替換,而未脫離本發明精神和范圍的任何修改或者等同替換,其均應涵蓋在本發明的權利要求保護范圍之內。
【主權項】
1.一種配電網二次設備類型識別方法,其特征在于,所述方法包括:對運行監控數據進行預處理;對預處理后的運行監控數據進行分詞和詞頻統計,獲取候選1-項集;用Apr1ri算法處理所述候選1-項集,獲取強關聯規則;根據所述強關聯規則識別配電網二次設備的類型。2.如權利要求1所述的方法,其特征在于,所述對運行監控數據進行預處理包括:應用CEP引擎,對所述運行監控數據的名稱和格式進行關鍵詞提取和與所述運行監控 數據無關信息的剔除;應用CEP引擎,對所述運行監控數據的各信號進行信號內關鍵詞剔除、信號內含有的裝 置名稱剔除、信號內關鍵詞的替換和關鍵詞組的模糊匹配。3.如權利要求1所述的方法,其特征在于,所述對處理后運行監控數據進行分詞和詞頻 統計包括:配置ElasticSearch,將預處理后的運行監控數據加載入ElasticSearch,獲取運行監 控信號的分詞集合和詞頻統計數,并將所述分詞集合作為候選1-項集。4.如權利要求1所述的方法,其特征在于,所述用Apr 1ri算法處理所述候選1-項集,獲 取強關聯規則包括步驟:a.根據最小支持度對當前候選i_項集進行剪枝,剪掉小于所述最小支持度的項集,獲 取頻繁i_項集,并判斷所述頻繁i_項集是否為空集,若是,則執行步驟c,若否,則執行步驟 b;b.將所述頻繁i_項集進行自然連接,獲取候選(i+1)_項集,掃描信號分詞集合,統計所 述候選(i+l)_項集的詞頻統計數,并返回步驟a,其中,所述自然連接為任意兩項進行組合;c.設置最小置信度閾值,將上述步驟生成的全部頻繁項集進行置信度驗證,獲取強關 聯規則。5.如權利要求1所述的方法,其特征在于,所述根據所述強關聯規則識別配電網二次設 備的類型包括:遍歷所述配電網二次設備的運行監控數據,將所述配電網二次設備的運行 監控數據與所述強關聯規則進行匹配,獲取所述配電網二次設備的類型。6.—種配電網二次設備類型識別系統,其特征在于,所述系統包括:預處理模塊,用于對運行監控數據進行預處理;分詞模塊,用于對預處理后的運行監控數據進行分詞和詞頻統計,獲取候選1-項集;Apr1ri算法處理模塊,用于用Apr1ri算法處理所述候選1-項集,獲取強關聯規則;識別模塊,用于根據所述強關聯規則識別配電網二次設備的類型。7.如權利要求6所述的系統,其特征在于,所述預處理模塊包括:第一預處理單元,用于應用CEP引擎,對所述運行監控數據的名稱和格式進行關鍵詞提 取和與所述運行監控數據無關信息的剔除;第二預處理單元,用于應用CEP引擎,對所述運行監控數據的各信號進行信號內關鍵詞 剔除、信號內含有的裝置名稱剔除、信號內關鍵詞的替換和關鍵詞組的模糊匹配。8.如權利要求6所述的系統,其特征在于,所述分詞模塊包括:分詞單元,用于配置E last icSearch,將預處理后的運行監控數據加載入 ElasticSearch,獲取運行監控信號的分詞集合和詞頻統計數,并將所述分詞集合作為候選1-項集。9.如權利要求6所述的系統,其特征在于,所述Apr1ri算法處理模塊包括:第一處理單元,用于根據最小支持度對當前候選1-項集進行剪枝,剪掉小于所述最小 支持度的項集,獲取頻繁i_項集,并判斷所述頻繁i_項集是否為空集,若是,則執行第三處 理單元,若否,則執行第二處理單元;第二處理單元,用于將所述頻繁1-項集進行自然連接,獲取候選(i+1)-項集,掃描信號 分詞集合,統計所述候選(i+l)_項集的詞頻統計數,并返回步驟a,其中,所述自然連接為任 意兩項進行組合;第三處理單元,用于設置最小置信度閾值,將上述步驟生成的全部頻繁項集進行置信 度驗證,獲取強關聯規則。10.如權利要求6所述的系統,其特征在于,所述識別模塊包括:識別單元,用于遍歷所 述配電網二次設備的運行監控數據,將所述配電網二次設備的運行監控數據與所述強關聯 規則進行匹配,獲取所述配電網二次設備的類型。
【文檔編號】G06Q50/06GK106022950SQ201610298818
【公開日】2016年10月12日
【申請日】2016年5月6日
【發明人】艾明浩, 葛賢軍, 李志宏, 付云琦, 趙立強, 于建成, 陳乃仕, 吳磊
【申請人】中國電力科學研究院, 國家電網公司, 國網天津市電力公司