提供的一種油氣生產物聯網大數據的處理方法的一個實施例的流程圖;
[0057]圖2是本申請提供的一種油氣生產物聯網大數據的處理系統的一個實施例的結構示意圖。
[0058]圖3是實際應用中一種油氣生產物聯網大數據處理系統的結構示意圖。
【具體實施方式】
[0059]本申請實施例提供一種基于Hadoop的油氣生產物聯網大數據的處理方法及系統。
[0060]為了使本技術領域的人員更好地理解本申請中的技術方案,下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例。基于本申請中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都應當屬于本申請保護的范圍。
[0061]下面結合附圖對本申請所述的基于Hadoop的油氣生產物聯網大數據的處理方法進行詳細的說明。雖然本申請提供了如下述實施例或流程圖所述的方法操作步驟,但基于常規或者無需創造性的勞動在所述方法中可以包括更多或者更少的操作步驟。在邏輯性上不存在必要因果關系的步驟中,這些步驟的執行順序不限于本申請實施例提供的執行順序。所述的方法的在實際中的裝置或終端產品執行時,可以按照實施例或者附圖所示的方法順序執行或者并行執行(例如并行處理器或者多線程處理的環境)。
[0062]本申請實施例所提供的一種基于Hadoop的油氣生產物聯網大數據的處理方法的流程示意圖,如圖1所示。該方法包括:
[0063]SllO:根據作業任務,Hadoop平臺從實時數據庫中獲取生產單元的油氣生產物聯網大數據。
[0064]Hadoop可以稱為分布式處理框架,其可以對海量的數據(即大數據)進行計算以及存儲。
[0065]所述作業任務可以包括所需處理的生產單元的油氣生產物聯網大數據的類型和/或數量。所述作業任務可以是即時接收的;也可以是預先接收的。
[0066]所述生產單元可以包括抽油機井、螺桿栗井、電潛栗井、注入井、采氣井、計量間、注配間、中轉站和/或聯合站等。所述油氣生產物聯網大數據也可以稱為油氣生產數據,其可以包括海量的油壓、油溫、套管的壓力、套管的管壁溫度、工作電流、載荷、牽引力和/或有毒有害氣體的濃度等類型的數據。大數據可以是指無法在可承受的時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,例如數萬條數據。
[0067]所述從實時數據庫中獲取生產單元的油氣生產物聯網大數據可以是指在觸發條件下,Hadoop平臺利用預先或即時獲取的配置文件,從所述實時數據庫中獲取對應的油氣生產物聯網大數據。具體的,可以根據所述配置文件中對油氣生產物聯網大數據所設定的標識,從所述實時數據庫中獲取具有與所述標識相匹配的油氣生產物聯網大數據。
[0068]所述觸發條件可以是進行數據處理的時間信息,例如預定義的周期性時間;也可以是接收到指示進行數據處理的指令,例如自動化腳本指令或者用戶指令。
[0069]所述配置文件可以是從關系數據庫中獲取的,其可以包括油氣生產物聯網大數據的標識、算法配置參數以及油氣生產物聯網大數據的存儲方式等等。
[0070]所述標識可以是油氣生產物聯網大數據的標簽或ID號。所述油氣生產物聯網大數據的標簽可以包括井場數據標簽、站庫數據標簽和/或管網數據標簽。井場數據標簽可以包括油井、氣井和水井等各種類型井的相關采集參數。站庫數據標簽可以包括計量間、注配間、中轉站、聯合站以及處理廠等各類型站庫的相關采集參數。管網數據標簽可以包括油田集輸管網、集氣干線以及支線等各類型管網的相關采集參數。所述相關采集參數可以包括壓力、溫度、載荷和/或工作電流等。
[0071]所述油氣生產物聯網大數據的標簽可以是采用多層級編碼的方式來進行命名的。以井場數據標簽為例,標簽的第一層級表示井場數據,例如可以用JC表示;標簽的第二層級表示井的類型,例如I表示油井,2表示氣井,3表示水井;標簽的第三層級表示井中傳感器的類型,例如P表示壓力傳感器,T表示溫度傳感器,I表示電流傳感器。
[0072]所述實時數據庫中的油氣生產物聯網大數據可以是通過傳輸層中的有線傳輸或無線傳輸從感知層中的數據采集單元中實時獲取或預先在預設時間內獲取的。
[0073]由于實時數據庫中的數據可以是井、站、管網前端的傳感器按照秒級上傳的,因此在不考慮網絡傳輸數據造成的延時,向實時數據庫上傳油氣生產物聯網大數據幾乎與現場采集同時進行,因而Hadoop平臺從實時數據庫中獲取的油氣生產物聯網大數據可以是實時采集的,這有利于后續對油氣生產物聯網大數據進行實時處理。
[0074]S120: Hadoop平臺對所獲取的油氣生產物聯網大數據進行分布式計算。
[0075]在從實時數據庫中獲取油氣生產物聯網大數據后,Hadoop平臺可以對所獲取的油氣生產物聯網大數據進行分布式計算。具體的,
[0076]Hadoop平臺可以根據配置文件中的算法配置參數,從邏輯算法庫中調用對應的邏輯算法,例如觸限告警算法、觸限預警算法、參數趨勢預測算法和/或參數波動分析算法等,利用所調用的算法對所獲取的油氣生產物聯網大數據進行分布式計算。例如,對于套管中油的溫度,可以計算井內多個位置點處油的平均溫度;也可以計算多個點處油溫的波動幅度。
[0077]對所獲取的油氣生產物聯網大數據進行分布式計算具體可以是Hadoop平臺中的每個節點對所獲取的油氣生產物聯網大數據進行并行計算,從而可以提高計算速度,提高處理數據的效率。
[0078]在一實施例中,在利用所調用的算法對油氣生產物聯網大數據進行分布式計算之前,Hadoop平臺可以根據配置文件中的油氣生產物聯網大數據的標識,對所述油氣生產物聯網大數據進行分類以及排序。例如,首先,對不同類型的井進行分類,得到油井、氣井和水井各自所對應的油氣生產物聯網大數據;然后,對同一類型的井中不同類型的油氣生產物聯網大數據進行排序,可以排序如下:壓力、溫度、工作電流、載荷等等。
[0079]需要說明的是,對所述油氣生產物聯網大數據進行分類和對所述油氣生產物聯網大數據進行排序之間的執行順序并沒有限制。
[0080]S130:HadOOp平臺將所述油氣生產物聯網大數據的計算結果與預設閾值進行對比,以判斷所述生產單元是否發生異常。
[0081]在對所述油氣生產物聯網大數據進行分布式計算后,Hadoop平臺可以將所述油氣生產物聯網大數據的計算結果與預設閾值進行對比,根據對比結果判斷所述油氣生產物聯網大數據中是否存在異常數據。例如,在對比出所述油氣生產物聯網大數據的計算結果與預設閾值不相符時,Hadoop平臺可以判斷所述油氣生產物聯網大數據中存在異常數據。在判斷出所述油氣生產物聯網大數據中存在異常數據時,Hadoop平臺可以判斷所述異常數據所對應的生產單元發生異常。例如,對于生產單元為天然氣井,所計算的井內油壓大于50MPa,則可以判斷該油壓為異常數據,該天然氣井發生異常。再例如,套管上不同位置處的管壁壓力相對于與預設壓力波動很大,則可以判斷該管壁壓力為異常數據,進而判斷該套管可能產生異常,例如其內壁破裂。再例如,該生產單元的工作電流遠大于預設的工作電流,則可以判斷該工作電流為異常數據,該生產單元中的馬達可能產生異常。再例如,某一油井內的牽引力過大,則可以判斷該牽引力為異常數據,該油井有可能被卡住或者井壁可能結錯。
[0082]所述預設閾值可以是即時或預先從所述配置文件中獲取的,也可以是預先存儲的。對于不同類型的油氣生產物聯網大數據,可以設置不同的預設閾值。需要說明的是,該預設閾值可以是具體的一個數值,也可以是某一個數值范圍。
[0083]S140 = Hadoop平臺在判斷出所述生產單元發生異常時,輸出所述油氣生產物聯網大數據的分析結果。
[0084]在判斷出所述油氣生產物聯網大數據中存在異常數據時,Hadoop平臺可以生成所述油氣生產物聯網大數據的分析結果,然后向用戶輸出所述分析結果。所述分析結果可以包括所述油氣生產物聯網大數據與預設閾值的對比結果、異常數據和/或警示信息。
[0085]所述警示信息可以用于向用戶警示所述生產單元發生異常。所述警示信息可以為光信