本技術涉及電力數據分析的,尤其是涉及一種電力數據解析方法及系統。
背景技術:
1、目前,在電力系統中,電力數據的實時監測與分析對于保障電網穩定運行、預防故障發生具有重要意義;隨著大數據、云計算、物聯網和人工智能等技術的快速發展,電力系統正迎來智能化升級的新機遇。大數據技術在電力系統中的應用,可以實現對海量數據的收集、存儲、處理和分析,為電力系統的運行管理提供有力支持。機器學習作為人工智能的重要分支,能夠通過對歷史數據的訓練和學習,自動提取特征并構建預測模型,實現對電力系統運行狀態的實時監測和預警。
2、然而,目前存在的語料庫及單詞嵌入大多面向通用領域,由于文本結構和專業詞匯的差距,電力領域的某些單詞可能與通用領域的單詞具有完全不同的含義,面向通用領域的詞嵌入往往無法滿足電力領域的解析需求,導致無法準確的對電力數據信息進行解析。
技術實現思路
1、為了提高對電力數據解析的準確性,本技術提供一種電力數據解析方法及系統。
2、第一方面,本技術提供的一種電力數據解析方法,采用如下的技術方案:
3、一種電力數據解析方法,包括以下步驟:
4、搭建數據庫:建立電力系統數據庫,內部存儲歷史電力數據、故障信息和專業相關數據;
5、數據采集:采集電力系統中的歷史電力數據、故障信息,收集電力系統和電力設備信息并存儲為專業相關數據,其中,電力設備信息包括電力設備名稱、產品名稱數據,獲取途徑為專業綜合門戶網站中電力設備和電力詞典頁面的相關信息;收集電力分析報告、事故報告,存儲為分析數據;
6、數據預處理:對歷史電力數據、故障信息和專業相關數據進行格式化和標準化處理;
7、第一提取:在預處理后的數據中,提取與電力系統運行規律和故障特征相關的知識,記作第一數據;
8、第二提取:結合領域專業名詞以及第一數據,對分析數據進行分詞,形成第一詞匯,并根據語句語義,建立詞匯關系;然后將第一詞匯結合詞匯關系,存儲為第二數據;
9、數據再處理:對第二數據進行過濾;
10、偏向轉譯:獲取分析人員所屬專業領域信息,對第二數據中的第一詞匯,進行領域偏向轉換為專業詞匯或近義書面詞匯,形成轉譯詞匯集;
11、相似度計算:將轉譯詞匯集內的詞匯與第一數據中的專業詞匯進行相似度計算,獲得相似度集;
12、相似度判斷:判斷相似度是否大于設定界定值,若是,則執行替換步驟,反之,則執行修正步驟;
13、替換:根據第一數據對轉譯詞匯進行替換,并結合詞匯關系,存儲為第三數據;
14、修正:將轉譯詞匯原始語句調出,根據語義修正第一詞匯;
15、知識本體構建:根據第一數據、第三數據、電力系統、歷史電力數據和故障信息,搭建知識本體分析模型;
16、實時監測:實時獲取電力數據,形成查詢需求;
17、輸出結果:根據查詢需求中的查詢詞匯,輸入知識本體分析模型中,調取詞匯關系,生成最終的結果。
18、通過采用上述技術方案,現有技術往往側重于電力數據的單一處理環節,如數據清洗、特征提取或故障檢測等,本技術方案則整合了多個處理環節,形成了一個完整的電力數據解析流程,能夠更全面地處理和分析電力數據;通過設置領域詞匯轉譯步驟,能夠根據分析人員的專業領域信息,將通用詞匯轉換為專業詞匯或近義書面詞匯,提高了詞匯的準確性和專業性,同時,通過相似度計算步驟,進一步確保了轉譯詞匯與第一數據中專業詞匯的一致性;且通過專業領域的干預,使得形成的知識本體分析模型根據針對性,便于提高電力數據解析的準確性。
19、通過構建知識本體分析模型,實現了對電力系統知識的系統表示和高效利用,同時,實時監測步驟能夠實時獲取電力數據,形成查詢需求,為電力數據的動態分析和預警提供了有力支持;根據查詢需求中的查詢詞匯,調取詞匯關系,生成具有智能化和個性化特點的結果,提高了結果的可讀性和實用性。
20、總體來說,通過綜合數據處理能力和領域詞匯轉譯與相似度計算步驟,本技術方案能夠更準確地解析電力數據,提高數據解析的準確性和效率;通過知識本體構建和實時監測步驟,本技術方案能夠實時監測電力系統的運行狀態,及時發現并預警潛在故障,從而增強電力系統的可靠性和安全性;通過本技術方案的處理和分析,電力數據可以被更有效地利用和共享,為電力行業的科學研究、工程設計和運營管理等領域提供更加豐富和準確的數據支持。
21、可選地,在知識本體構建步驟中,還包括根據電力系統構建,確定傳播路徑,并生成sdg有向無環圖。
22、通過采用上述技術方案,sdg通過節點和邊的形式直觀展示了電力系統中的知識結構和傳播路徑,sdg中的節點和邊不僅表示了知識之間的關聯關系,還隱含了知識的傳播路徑和推理規則;通過分析sdg中的節點和邊,可以實現對電力系統中知識的推理和故障定位。當電力系統發生故障時,可以通過分析sdg中故障節點及其相鄰節點的關系,快速定位故障的原因和傳播路徑,從而采取相應的應對措施。
23、可選地,在第二提取步驟和數據再處理步驟之間,還設置有重復判斷步驟;
24、重復判斷:包括字符距離判斷步驟、關系提取步驟、詞匯重復判斷步驟、刪除步驟、間隔組詞步驟、拼合步驟和詞意判斷步驟;
25、字符距離判斷:獲取相鄰兩個第一詞匯之間的字符距離,判斷是否小于等于t,若是,則執行詞匯重復判斷,反之,則執行關系提取步驟;
26、關系提取:判斷兩個相鄰第一詞匯之間是否存在額外信息,若是,則在額外信息中提取關系屬性,并將其存入第二數據中,然后執行數據再處理步驟;
27、詞匯重復判斷:判斷相鄰兩個第一詞匯是否相同,若是,則執行刪除步驟;反之,在執行拼合步驟;
28、刪除:刪除相鄰兩個第一詞匯中的其中一個,然后執行間隔組詞步驟;
29、間隔組詞:將剩余的第一詞匯與前后第一詞匯之間的間隔字符進行組詞,形成新的第一詞匯,然后執行詞意判斷步驟;
30、拼合:將相鄰兩個第一詞匯組合,形成新的第一詞匯,然后執行詞意判斷步驟;
31、詞意判斷:判斷第一詞匯的詞意是否完整,若是,形成第一詞匯,并優化第二數據,然后執行數據再處理步驟,反之,則執行修正步驟。
32、通過采用上述技術方案,通過判斷相鄰兩個第一詞匯之間的字符距離,可以有效識別出過于接近的詞匯,進而進行更深入的詞匯重復判斷或關系提取。這有助于避免數據冗余,提高數據的準確性和緊湊性。
33、對于完全相同的相鄰詞匯,直接進行刪除處理,可以顯著減少數據的重復度,提高數據處理的效率;對于非完全相同的相鄰詞匯,通過拼合或間隔組詞的方式形成新的詞匯,有助于捕捉更復雜的語義關系,同時減少數據的碎片化;在相鄰詞匯之間存在額外信息時,通過提取關系屬性并存入第二數據中,可以豐富第一詞匯之間的語義關系,為后續的數據分析和處理提供更有價值的信息;通過對新形成的第一詞匯進行詞意完整性判斷,可以確保第一詞匯在語義上的準確性和完整性,避免歧義和誤解;在詞意判斷不完整時,執行修正步驟,可以靈活調整第一詞匯,確保數據的準確性和可用性。這種靈活性有助于應對復雜多變的電力數據環境。
34、在詞意判斷完整并形成新的第一詞匯后,對第二數據進行優化,可以進一步提升數據的質量和價值,為后續的數據分析和應用提供更有力的支持;重復判斷步驟中的各個子步驟大多可以通過自動化算法實現,這有助于減少人工干預,提高數據解析的智能化水平。
35、可選地,在字符距離判斷步驟和關系提取步驟之間,還設置有無效判斷步驟;
36、無效判斷:判斷第一詞匯是否存在連續重復字符串,若是,則執行優化詞匯步驟,反之,則執行關系提取步驟;
37、優化詞匯:將該字符串過濾,優化第一詞匯,然后執行詞意判斷步驟。
38、通過采用上述技術方案,無效判斷步驟通過檢查第一詞匯中是否存在連續重復的字符串,能夠精準地識別出數據中的冗余部分;這種冗余可能源于數據錄入錯誤、復制粘貼時的失誤或數據清洗不徹底等原因;通過過濾掉這些連續重復的字符串,可以顯著提升數據的質量;在識別出連續重復字符串后,優化詞匯步驟會對其進行過濾,并對第一詞匯進行相應調整;這一步驟不僅去除了冗余信息,還使得第一詞匯更加簡潔明了,有助于提升數據處理的效率和準確性;通過無效判斷和優化詞匯步驟,可以顯著減少數據中的冗余部分,從而降低數據處理的復雜度;這有助于加快數據處理速度,提高整體效率。
39、如果數據中存在連續重復的字符串而未得到及時處理,那么在后續的關系提取、詞意判斷等步驟中可能會引發錯誤或誤導;通過增設無效判斷步驟,可以在早期階段發現并解決這些問題,從而避免后續處理中的潛在風險。
40、通過優化詞匯步驟,可以確保數據中的第一詞匯在格式和內容上保持一致性;這種一致性有助于提升數據解析的可靠性,使得分析結果更加準確可信;且有助于支持多樣化的數據分析需求,如趨勢分析、關聯規則挖掘等;優化后的數據在可視化呈現時更加清晰直觀,有助于用戶快速理解數據背后的信息和規律,這有助于提升數據應用的廣泛性和用戶體驗。
41、可選地,在輸出結果步驟之后還設置有異常確定步驟;
42、異常確定:包括:定位步驟、第一獲取步驟和節點替換步驟;
43、定位:將異常數據位置記作異常節點,并獲取異常節點前后斷點,記作第i個斷點和第i+1個斷點;
44、第一獲取:獲取第i個斷點和第i+1個斷點之間的替換支路,記作修復節點;
45、節點替換:將異常節點用修復節點進行替換。
46、通過采用上述技術方案,通過定位步驟,可以精準地識別出電力數據中的異常數據位置,并將其標記為異常節點,這一步驟是后續異常處理的基礎,確保了異常數據能夠被準確地識別和處理。
47、在定位異常節點的同時,還獲取了其前后的斷點,即第i個斷點和第i+1個斷點;這些斷點信息對于后續獲取替換支路(修復節點)至關重要,有助于確保替換操作的準確性和有效性。
48、在第一獲取步驟中,根據前后斷點信息,高效地獲取了位于第i個斷點和第i+1個斷點之間的替換支路,即修復節點,這一步驟是節點替換操作的前提,確保了替換操作的可行性;通過精準地獲取替換支路,可以確保替換操作不會引入新的異常或錯誤;同時,替換支路的準確性也有助于提升數據修復后的質量和可靠性。
49、在節點替換步驟中,將異常節點用修復節點進行了替換,這一步驟是異常處理的核心,通過替換操作可以消除異常數據對整體數據質量的影響。
50、通過替換異常節點,可以顯著提升電力數據的質量,且能夠維持電力系統的正常運行,便于在工作人員工作時間進行維護;修復后的數據更加準確、完整和可靠,為后續的數據分析和應用提供了有力支持。
51、可選地,在節點替換步驟之后,還設置有結果重索步驟;
52、結果重索:獲取第i個斷點和第i+1個斷點之間的電力數據,再次形成查詢需求,然后執行驗證判斷步驟;
53、驗證判斷:判斷異常數據是否消除,若是,則執行故障定位步驟,反之,則執行輸出結果步驟;
54、故障定位:確定第i個斷點和第i+1個斷點之間的異常節點確實存在異常,并形成日志記錄在數據庫內,然后再次執行輸出結果步驟。
55、通過采用上述技術方案,通過重新獲取第i個斷點和第i+1個斷點之間的電力數據,并再次形成查詢需求,可以確保對替換后的數據進行全面的檢查和驗證,這一步驟有助于發現可能因替換操作而引入的新問題或遺漏的異常數據。
56、通過判斷異常數據是否消除,可以驗證替換操作的有效性;如果異常數據已被成功消除,則表明替換操作是成功的;如果異常數據仍然存在,則需要進行進一步的處理。
57、在確定異常數據仍然存在的情況下,故障定位步驟可以精確地確定第i個斷點和第i+1個斷點之間的異常節點,并確認其確實存在異常;這一步驟有助于快速定位問題源頭,為后續的處理提供有力支持。
58、將故障定位的結果形成日志記錄在數據庫內,可以方便后續的數據分析和故障排查,同時,日志記錄還可以作為數據修復和異常處理過程的追溯依據,確保處理過程的透明性和可追溯性。
59、從異常數據的定位、替換到結果重索和驗證判斷,再到故障定位和日志記錄,形成了一個完整的異常處理閉環,這一閉環流程有助于確保異常數據得到全面、準確的處理,增強數據解析與處理的準確性。
60、通過記錄和分析異常處理過程中的日志和數據,可以發現數據解析與處理流程中存在的問題和不足,為后續的優化和改進提供有力支持;通過結果重索和驗證判斷步驟,可以確保修復后的數據質量得到顯著提升;高質量的數據可以為后續的數據分析和應用提供有力支持,提升數據應用的穩定性和可靠性。
61、在異常處理過程中,通過精確的故障定位和日志記錄,可以及時發現并處理潛在的安全風險。這有助于確保電力數據的安全性和保密性,防止數據泄露或被惡意篡改。
62、可選地,在所述驗證判斷和輸出結果步驟之間,還設置有摸排步驟;
63、摸排:根據sdg有向無環圖,確定異常節點的前置關聯節點,然后執行逐一替換步驟;
64、逐一替換:獲取前置關聯節點的前后斷點,并獲取修復節點,依次進行替換,并執行結果重索步驟。
65、通過采用上述技術方案,摸排步驟通過sdg(有向無環圖)來確定異常節點的前置關聯節點;且sdg作為一種表示系統元素間依賴關系的圖形化工具,能夠清晰地展示異常節點與其前置節點之間的邏輯聯系,這一步驟有助于深入剖析異常數據的產生原因,為后續的逐一替換提供精準的目標定位。
66、通過摸排前置關聯節點,可以進一步挖掘異常數據的根源,從而避免僅對表面現象進行處理而忽視根本問題;這有助于提升異常處理的深度和準確性,確保數據修復的長期有效性。
67、在逐一替換后,執行結果重索步驟可以驗證替換操作的有效性;這一步驟不僅確保了數據的準確性,還通過不斷迭代和優化,提升了異常處理的效率和質量。
68、通過摸排和逐一替換前置關聯節點,可以確保整個數據解析與處理流程的穩健性,這有助于避免異常數據在后續處理中引發連鎖反應,導致更多的問題出現;摸排、逐一替換、結果重索等步驟共同構成了一個完整的異常處理閉環;這一閉環流程不僅有助于確保異常數據得到全面、準確的處理,還通過不斷迭代和優化,提升了數據解析與處理的穩健性;可以確保修復后的數據質量得到顯著提升。高質量的數據可以為后續的數據分析和應用提供有力支持,提升數據應用的可靠性和準確性;通過優化異常處理流程,可以確保數據在決策過程中發揮更大的作用,提升電力系統的智能化水平和運營效率。
69、可選地,其中實時監測步驟之后,還設置有需求補充步驟;
70、需求補充:包括:圖像數據獲取步驟、數據劃分步驟和實況提取步驟;
71、圖像數據獲取:獲取形成查詢需求位置處的實時圖像,形成圖像數據;
72、數據劃分:將圖像數據劃分為多個具有不同精度圖像塊;
73、實況提取:提取圖像塊中的關聯信息,對查詢需求進行豐富,然后輸入知識本體分析模型中,并執行輸出結果步驟。
74、通過采用上述技術方案,通過獲取形成查詢需求位置處的實時圖像,可以直觀地了解該位置的實際情況,這些圖像數據為電力數據的解析提供了重要的視覺參考,有助于更準確地理解數據的含義和背景。
75、將圖像數據劃分為多個具有不同精度的圖像塊,并提取其中的關聯信息,可以進一步豐富查詢需求的內容,這種處理方式不僅提高了數據的精度和細節,還增強了數據之間的關聯性,使得電力數據更加完整和準確。
76、通過圖像信息對電力數據進行關聯,可以實現對電力數據的空間定位,這種關聯方式有助于快速識別異常數據所在的位置,為后續的處理提供有力支持。
77、結合圖像信息和電力數據,可以更加準確地定位異常數據,并識別其產生的原因,這種綜合處理方式不僅提高了異常識別的準確性,還縮短了異常處理的時間,提升了整體效率。
78、實時監測步驟與需求補充步驟的結合,使得電力數據的解析與處理更加智能化;通過實時監測獲取的數據與圖像數據的結合,可以實現對電力系統的全面監控和精準分析。
79、通過圖像數據的獲取和劃分,可以實現數據的可視化展示。這種展示方式不僅提高了數據的可讀性和易懂性,還為數據的應用提供了更多的可能性。
80、結合圖像信息和電力數據,可以開發出更加靈活多樣的數據應用;這些應用不僅滿足了電力系統對數據的多樣化需求,還提升了數據的應用價值和實用性。
81、可選地,在實況提取步驟之后還設置有異常判斷步驟;
82、異常判斷:對于每個圖像塊,判斷是否存在表面異常信息,若是,則根據輸出結果和表面異常信息,確定故障類型,并執行輸出結果步驟。
83、通過采用上述技術方案,異常判斷步驟通過對每個圖像塊進行細致分析,能夠準確識別出圖像中是否存在表面異常信息;這種判斷方式不僅提高了異常檢測的精度,還避免了因忽略細節而導致的誤報或漏報。
84、一旦檢測到表面異常信息,異常判斷步驟會結合輸出結果進行綜合分析,從而準確確定故障類型;這種確定方式有助于后續處理措施的針對性制定,提高了故障處理的效率和準確性;結合輸出結果和表面異常信息,異常判斷步驟能夠迅速定位到故障發生的位置,這種定位方式不僅縮短了故障查找的時間,還降低了因故障導致的停電風險;準確的故障定位為后續處理提供了有力支持;維修人員可以根據故障類型和位置信息,快速制定維修方案并實施,從而提高了故障處理的效率和質量。
85、異常判斷步驟的加入,為數據的應用提供了更多的可能性;通過對圖像數據的分析和處理,可以開發出更加多樣化的數據應用,滿足電力系統的不同需求;通過準確的異常檢測和故障定位,可以及時發現和處理電力系統中的潛在問題,從而避免或降低因故障導致的損失;這種處理方式不僅提高了數據的實用性,還提升了數據的價值。
86、第二方面,本技術提供的一種電力數據解析系統,采用如下的技術方案:
87、一種電力數據解析系統,包括以下模塊:
88、數據庫:用于存儲歷史電力數據、故障信息、專業相關數據和實時電力數據;
89、數據采集模塊:輸出端與數據庫的輸入端連接,用于采集電力系統中的歷史電力數據、故障信息,收集電力系統和電力設備信息并存儲為專業相關數據;收集電力分析報告、事故報告,存儲為分析數據,并將其存儲在數據庫內;
90、數據預處理模塊:輸入端與數據庫的輸出端連接,用于對歷史電力數據、故障信息和專業相關數據進行格式化和標準化處理;
91、第一提取模塊:輸入端與數據預處理模塊的輸出端連接,用于對預處理后的數據進行信息提取;
92、第二提取模塊:輸入端與第一提取模塊的輸出端連接,用于根據第一提取模塊提取的數據對分析數據進行分詞,形成第二數據;
93、數據再處理模塊:輸入端與第二提取模塊的輸出端連接,用于對第二數據進行過濾;
94、偏向轉譯模塊:輸入端與數據再處理模塊的輸出端連接,用于根據分析人員所屬專業領域信息,用于對第二數據中的第一詞匯,進行領域偏向轉換;
95、相似度計算模塊:輸入端與偏向轉譯模塊的輸出端連接,用于計算轉譯詞匯與第一數據中的專業詞匯之間的相似度;
96、相似度判斷模塊:輸入端與相似度計算模塊的輸出端連接,用于判斷相似度是否大于設定界定值;
97、替換模塊:輸入端與相似度判斷模塊的輸出端連接,用于在相似度大于設定界定值時,根據第一數據對轉譯詞匯進行替換;
98、修正模塊:輸入端與相似度判斷模塊的輸出端連接,用于在相似度小于等于設定界定值時,將轉譯詞匯原始語句調出,根據語義修正第一詞匯;
99、知識本體構建:輸入端與修正模塊的輸出端、替換模塊的輸出端以及數據庫的輸出端連接,用于搭建知識本體分析模型;
100、實時監測模塊:輸出端與知識本體構建模塊的輸入端連接,用于實時獲取電力數據,形成查詢需求;
101、輸出結果:輸入端與知識本體構建模塊的輸出端連接,用于根據查詢需求中的查詢詞匯,調取詞匯關系,生成最終的結果。
102、通過采用上述技術方案,系統通過數據采集和預處理模塊,實現了對電力數據的整合和標準化處理,提高了數據的一致性和準確性;通過第一提取模塊和第二提取模塊,系統能夠智能化地提取和分詞處理電力數據;偏向轉譯模塊能夠根據分析人員的專業領域信息,對詞匯進行領域偏向轉換,提高了詞匯的準確性和專業性。
103、相似度計算模塊和判斷模塊能夠快速準確地計算詞匯之間的相似度,并根據設定界定值進行判斷,這有助于系統快速定位相關詞匯,提高數據解析的效率;系統能夠根據相似度判斷結果,靈活地選擇詞匯替換或修正策略,這確保了最終結果的準確性和可靠性。
104、通過知識本體構建模塊,系統能夠搭建起電力數據的知識本體分析模型;實時監測模塊能夠實時獲取電力數據,形成查詢需求,并與知識本體分析模型相結合,生成最終的結果;這使得系統能夠實現對電力數據的實時監測和快速響應;整體上,該系統通過智能化的數據解析和處理流程,提升了電力數據的解析能力和應用能力;這有助于電力系統實現更加精準的數據分析和決策支持,提高電力系統的運行效率和安全性。
105、綜上所述,本技術包括以下至少一種有益技術效果:
106、1.?通過設置領域詞匯轉譯步驟,能夠根據分析人員的專業領域信息,將通用詞匯轉換為專業詞匯或近義書面詞匯,提高了詞匯的準確性和專業性;
107、2.?通過對圖像數據的分析和處理,可以開發出更加多樣化的數據應用,滿足電力系統的不同需求;通過準確的異常檢測和故障定位,可以及時發現和處理電力系統中的潛在問題,從而避免或降低因故障導致的損失;這種處理方式不僅提高了數據的實用性,還提升了數據的價值。