一種評價智能終端與電能表的表碼數據同步狀態的方法及其系統的制作方法
【技術領域】
[0001] 本發明涉及電力信息技術領域,尤其涉及一種評價智能終端與電能表的表碼數據 同步狀態的方法及其系統。
【背景技術】
[0002] 數據是組織最具價值的資產之一。企業的數據質量與業務績效之間存在著直接聯 系,高質量的數據可以使公司保持競爭力并在經濟動蕩時期立于不敗之地。有了普遍深入 的數據質量,企業在任何時候都可以信任滿足所有需求的所有數據。
[0003] 在智能電網中,影響電力數據質量的因素主要包括數據完整性和數據準確性。其 中,數據完整性約束包括實體完整性約束、參照完整性約束、函數依賴約束、統計約束四類。 而智能電網中的計量自動化終端通常會發生通信故障和記錄時間對不齊等問題,這些問題 在數據中心中直接反應為數據記錄缺失和約束不嚴格。基于此,有必要研究計量自動化智 能終端和電能表終端采集到的電能量表碼數據在缺失同步性上的整體趨勢,從而對電網運 行狀態有一個整體的認識,提升采集終端的運維水平,提高終端完整率。
【發明內容】
[0004] 本發明所要解決的技術問題是:提供一種評價智能終端與電能表的表碼數據同步 狀態的方法及其系統,以分析智能終端和電能表的運行狀態和數據傳輸的一致性,利于運 維工作人員掌握計量自動化系統端運行狀態,提升采集終端的運維水平及終端數據完整 率。
[0005] 為解決上述技術問題,本發明采用的技術方案如下:
[0006] 提供一種評價智能終端與電能表的表碼數據同步狀態的方法,包括步驟:
[0007] 從數據主站獲取一預設時間內智能終端和電能表所采集的所有表碼數據,并對表 碼數據進行預處理;
[0008] 根據表碼數據在整點時刻上的存在情況,對預處理后的表碼數據進行去值化處 理;
[0009] 對去值化處理后的兩份表碼數據進行異或處理;
[0010] 采用K-均值聚類算法對異或處理后的表碼數據進行聚類分析,以得到聚類結果; [0011]根據聚類結果評價智能終端與電能表的表碼數據的同步狀態。
[0012]與現有技術相比,該方法先從數據主站獲取一預設時間內智能終端和電能表所采 集的所有表碼數據,并對其進行預處理及去值化處理,之后對兩份數據進行異或處理以整 合數據,接著采用及其學習中的K-均值聚類算法(即KMEANS算法)對處理后的數據進行聚類 分析,最后根據聚類分析結果對智能終端和電能表的表碼數據進行同步狀態的整體評價; 該方法可以及時發現計量自動化系統中的電能表與智能終端采集數據的差異,從而對電網 運行狀態有一個整體的認識,提升了采集終端的運維水平,提高了終端完整率,且該方法是 數據挖掘及機器學習在電網數據中的有效應用,對數據質量的提升具有一定的指導意義。
[0013] 相應地,本發明還提供了一種評價智能終端與電能表的表碼數據同步狀態的系 統,包括:
[0014] 獲取模塊,用于從數據主站獲取一預設時間內智能終端和電能表所采集的所有表 碼數據,并對表碼數據進行預處理;
[0015] 去值化處理模塊,用于根據表碼數據在整點時刻上的存在情況,對預處理后的表 碼數據進行去值化處理;
[0016] 異或處理模塊,用于對去值化處理后的表碼數據進行異或處理;
[0017] 分析模塊,用于采用κ-均值聚類算法對異或處理后的表碼數據進行聚類分析,以 得到聚類結果;
[0018] 評價模塊,用于根據聚類結果評價智能終端與電能表的表碼數據的同步狀態。
【附圖說明】
[0019] 圖1為本發明評價智能終端與電能表的表碼數據同步狀態的方法的主流程圖。
[0020] 圖2為本發明方法一實施例的流程圖。
[0021] 圖3為圖2中步驟S207的子流程圖。
[0022] 圖4為本發明評價智能終端與電能表的表碼數據同步狀態的系統的結構框圖。 [0023]圖5為圖4中裝置300的結構框圖。
[0024]圖6為圖5中分析模塊的結構框圖。
【具體實施方式】
[0025] 現在參考附圖描述本發明的實施例,附圖中類似的元件標號代表類似的元件。
[0026] 請參考圖1,本發明評價智能終端與電能表的表碼數據同步狀態的方法,包括:
[0027] S101,從數據主站獲取一預設時間內智能終端和電能表所采集的所有表碼數據, 并對表碼數據進行預處理;
[0028] S102,根據表碼數據在整點時刻上的存在情況,對預處理后的表碼數據進行去值 化處理;
[0029] S103,對去值化處理后的兩份表碼數據進行異或處理;
[0030] S104,采用K-均值聚類算法對異或處理后的表碼數據進行聚類分析,以得到聚類 結果;
[0031] S105,根據聚類結果評價智能終端與電能表的表碼數據的同步狀態。
[0032] 再請參考圖2,在本發明的一優選實施例中,該方法具體包括:
[0033] S201,通過智能終端和電能表分別采集整點時刻的表碼數據,即智能終端和電能 表采集表碼數據的頻率為lh-次。
[0034] S202,電能表所采集的表碼數據通過485總線傳輸至智能終端。
[0035] S203,智能終端將兩份表碼數據通過GPRS網絡傳輸至數據主站;具體地,智能終端 包含信號傳輸模塊,可以將自身采集到的和電能表傳輸來的這兩份冗余的數據一并通過 GPRS移動網絡傳輸到數據主站。需要說明的是,當發生硬件損壞、S頂故障、485規約錯誤、無 信號等軟硬件問題時,傳輸采集到的表碼數據至主站便會發生缺失或者數據損壞。且,發送 至數據主站的表碼數據包含了用戶實時用電信息,其所包含的具體內容如表1所示:
[0036]
[0037] 表1:表碼數據樣例表
[0038] S204,從數據主站獲取一預設時間內智能終端和電能表所采集的所有表碼數據, 并對,表碼數據進行預處理;具體地,從數據主站獲取2014年12月1日當天所有的智能終端 和電能表采集到的表碼數據,判斷任一條表碼數據的重要字段是否發生缺失,若發生缺失, 則拋棄該條表碼數據并視該條表碼數據為空。
[0039] S205,根據表碼數據在整點時刻上的存在情況,對預處理后的表碼數據進行去值 化處理;具體地,每份智能終端和電能表的表碼數據根據其在相應的整點時間的數據存在 與否,化為表2所示的數據格式: 「rwwil L〇〇4l j 表2:評價悮型數據選取
[0042] 其中P0INTID代表智能終端或者電能表的數據點編號,ΒΜ0、ΒΜ1、···、ΒΜ23分別代表 數據在〇點時刻、1點時刻、…、23點時刻的數據存在與否,若數據存在則標記為1,否則標記 為0〇
[0043] S206,對去值化處理后的兩份所述表碼數據進行異或處理;具體地,將去值化并整 理好格式的智能終端和電能表的兩份數據在相應的時間位置上進行異或處理,得到如表3 所示的數據: 「0044?
?〇(Μ5」表3:評價模型數據構造
[0046]其中P0INTID代表智能終端的數據點編號,DATATIME代表數據時間,以天為準, X0R0、X0R1、…、X0R23分別代表互相關聯的智能終端和電能表在0點時刻、1點時刻、…、23點 時刻的去值化后的數據的異或結果,若智能終端和電能表的表碼數據均缺失或者均存在則 標記為1,否則標記為0。
[0047] S207,采用K-均值聚類算法對異或處理后的所述表碼數據進行聚類分析,以得到 聚類結果。考慮到計量自動化系統采集的表碼數據并沒有完整性標注,且需要從原始的表 碼數據中辨別出智能終端和電能表采集到的數據的差異,因此使用無監督的機器學習模型 比較合適,其中K-均值聚類算法可以將相似的對象歸到同一個簇中并且易于實現,在海量 數據處理中有應用優勢。其中,K-均值聚類算法具體步驟將在下文詳述。
[0048] S208,根據聚類結果評價所述智能終端與電能表的表碼數據的同步狀態。
[0049] 具體地,請參考圖3,步驟S207包括:
[0050] S2071,設定多個簇,提取任一條所述表碼數據并將該條表碼數據分配于任一簇 中;
[0051] S2072,設定算法中K的數值;其中,K由所述聚類結果的精度確定,如果想讓數據結 果更加精準,可以是當地增加 K的數值,在本實施例中,取K = 4;
[0052] S2073,隨機確定K個初始點作為各個簇的初始質心,根據剩余的表碼數據與各個 簇的初始質心的歐式距離,將剩余的表碼數據分配到最相近的簇中;
[0053] S2074,計算每一個簇中所有表碼數據的均值,并將均值作為該簇的新質心;
[0054] S2075,根據新質心重新分配所有的表碼數據;
[0055] S2076,迭代S2074和S2075直到所有的所述表碼數據分配不再變化;