本發明涉及石油測井技術領域,特別是涉及大數據測井領域。
背景技術:
測井信息和沉積是地層巖石物理性質的反映和控制因素,因此測井資料一直以來被作為油氣儲層沉積學研究中基礎而重要的信息來源,測井相則是測井信息與儲層沉積學特征之間的橋梁。對于大部分的油氣井來說,測井資料是僅有的覆蓋全井段地層的綜合信息來源,因此測井相識別分析方法一直作為油氣勘探與開發地質研究中一個最重要的研究手段。
然而,測井信息具有模糊性的特點,具有地質意義的多解性和模糊性。因此,測井相的識別與分析必須建立在大量已有的沉積特征與測井參數關系(測井響應)綜合深度分析基礎之上,同時還要參考野外露頭、巖心錄井和地震分析的結果,選取適合地質特點的建模方法,才能實現測井相的準確識別。
此外,由于缺乏有效的測井相自動識別方法和技術,目前的測井相識別主要是通過地質工作人員的人工識別實現的,并且由于人員經驗差異、主觀差異、測井數據的系統差異等因素,地質人員面對的數據量大、工作量繁重。不僅如此,地質人員的經驗差異、主觀因素、不同時期不同儀器測井數據的系統差異等因素,使得傳統的測井相識別準確性大打折扣。
將大數據分析、深度學習等先進技術應用于油氣地質研究是解決當前石油行業大數據分析資源閑置的探索與嘗試。近年來,石油行業建立了大量的云數據中心,但利用率不高,資源被嚴重浪費。其中一個重要原因就是缺乏大數據處理平臺以及相應的大數據技術來充分利用這些計算、存儲資源。
建立高效、準確的測井相識別方法是現在油氣地質研究的迫切需求。
技術實現要素:
為解決現有技術的不足,本發明提出了一種基于模糊理論和神經網絡的測井相識別方法。
本發明的技術方案是這樣實現的:
一種基于模糊理論和神經網絡的測井相識別方法,首先,構建模糊區域卷積神經網絡,將給出目標假設區域和目標識別放入同一個網絡中,共享卷積計算,一個訓練過程更新整個網絡的權重;
接下來,測井數據經過模糊區域卷積神經網絡進行卷積和池化操作,卷積層和池化層交互,在卷積層和池化層進行模糊操作,從模糊區域卷積神經網絡的第一層開始,逐漸增加模糊化的層數,針對不同的數據集調整模糊化層數,模糊區域卷積神經網絡的最后一層得到特征向量,該特征向量通過一個滑動窗口將特征映射到一個低維向量中,然后將特征輸入到兩個全連接層,一個全連接層用來定位,另一個全連接層用來分類。
可選地,所述卷積層公式表達為:
池化層公式表達為:
其中,偏置和權重均為模糊數,這里使用對稱三角模糊數,為模糊數組成的向量,第j個模糊數的隸屬函數為:
可選地,在模糊區域卷積神經網絡的訓練過程中,定義一個聯合損失函數:
其中,pi是此樣本為測井曲線形態的預測概率,是樣本的標簽,如果是相應的測井曲線形態,為1,否則為0,Ncls是二分類邏輯損失;ti是預測物體邊界的四個參數組成的向量,為標注區域參數組成的向量,它們分別為:
tx=(x-xa)/wa th=(y-ya)/ha
tw=log(w/wa) th=log(h/ha)
其中,x、y、w和h分別代表物體的中心坐標、寬度和長度,x,xa,x*分別代表預測區域,錨定區域和標注區域,回歸損失R為平滑損失函數
表示只有當錨定區域為正樣本時,才計算回歸損失,否則不計算,歸一化參數Ncls和Nreg分別代表從特征向量映射的低維向量的長度和錨定區域的數量。
可選地,首先進行測井數據的規范化,將原始數據均轉換為無量綱化指標測評值,各指標測評值都處于同一個數量級別上,再進行綜合測評分析。
可選地,進行測井數據的規范化采用如下的規范化方法:
Sx=(x-M)/S,x∈{GR,AC,DEN,CNL,SDN,...}
其中,x表示每條測井曲線的數據,Sx表示規范化后的測井曲線數據,M為相應測井曲線數據的均值,S為每條測井曲線數據的標準差。
本發明的有益效果是:
(1)根據測井大數據中數據模糊的特點,融入模糊理論,提出模糊區域卷積神經網絡FR-CNN,并提出漸進模糊的方法,從模糊區域卷積神經網絡的第一層開始,逐漸增加模糊化的層數,從而優化網絡結構和參數,實現更好的分析性能和精度;
(2)針對不同的測井數據集調整FR-CNN模糊化的層數,使提取的特征更好的反映油氣儲層本身的特性,可以解決測井數據模糊性問題。
附圖說明
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本發明模糊區域卷積神經網絡的結構示意圖;
圖2為對稱三角模糊數坐標示意圖。
具體實施方式
下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
測井數據具有模糊性的特點,造成這種模糊性的原因是多方面的,包括噪音、不一致性、不完整性等造成的測井數據的數據空間污染,也包括不同時期、不同儀器測井帶來的系統性數據差異,這些問題帶來的測井數據模糊性都制約了測井相的準確識別。
本發明提出了一種基于模糊理論和神經網絡的測井相識別方法,對測井數據構建出多維度的數據空間,將模糊理論與深度學習網絡R-CNN融合,提出解決模糊數據情況下測井相的識別方法,根據測井大數據中數據模糊的特點,融入模糊理論,提出模糊區域卷積神經網絡FR-CNN(Fuzzy R-CNN),進一步提出漸進模糊方法,從卷積神經網絡第一層開始,逐漸增加模糊化的層數,優化網絡結構和參數,最終建立FR-CNN的理論和方法,實現更好的分析性能和精度。
設計合適的模糊區域卷積神經網絡是本發明的重點,下面對本發明模糊區域卷積神經網絡的構建進行詳細說明。
模糊區域卷積神經網絡FR-CNN建立于深度學習網絡R-CNN的基礎之上,如圖1所示,FR-CNN將給出目標假設區域和目標識別放入同一個網絡中,共享卷積計算,避免復雜的計算步驟,只需要一個訓練過程便可以更新整個網絡的權重,同時也加快檢測速度,達到快速處理的目的。
圖1中,測井數據經過模糊區域卷積神經網絡,進行卷積和池化操作。模糊區域卷積神經網絡訓練的核心在于卷積層和池化層的交互,因此在卷積層和池化層進行模糊操作。為了避免模糊過度導致的信息損失過多,并且考慮到模糊區域卷積神經網絡提取特征的精細化程度逐層降低,這里改變傳統模糊神經網絡對每一層的模糊化,本發明提出漸進模糊的方法,即從模糊區域卷積神經網絡的第一層開始,逐漸增加模糊化的層數,針對不同的數據集調整模糊化層數,使提取的特征更好的反映測井曲線的特性,從而得到最佳識別結果,并提高識別效率。
模糊區域卷積神經網絡的最后一層得到特征向量,該特征向量通過一個小的滑動窗口將特征映射到一個低維向量中,然后將特征輸入到兩個全連接層,一個全連接層用來定位,另一個全連接層用來分類。在每一個滑動窗口處同時給出幾個目標假設區域,可稱之為錨定區域,這個區域以滑動窗口為中心,擁有不同的橫縱比和縮放比例。
卷積神經網絡R-CNN的卷積層公式可以表達為:
其中,表示的是在第i層神經元的第j個特征向量的(x,y)位置處的值,表示連接到第m個特征向量的卷積核在位置(p,q)上的權值。Pi和Qi分別表示卷積核的高度和寬度,bij為偏置項,f(x)表示神經元的激活函數。
R-CNN池化層公式表達為:
xij=f(βijdown(xi-1j)+bij) (2)
down(.)表示一個下采樣函數,典型的操作一般是對輸入數據的不同n*n塊的所有信息進行求和,這樣輸出數據在兩個維度上都縮小了n倍,每個輸出map都對應一個屬于自己的乘性偏置β和一個加性偏置b。
卷積神經網絡的輸入和計算過程都是實數,得到的結果都是確定性的,而對于數據缺失等數據模糊的情況,本發明的模糊區域卷積神經網絡中引入模糊理論,改進的公式如下:
卷積層公式表達為:
池化層公式表達為:
其中偏置和權重均為模糊數,這里使用對稱三角模糊數,為模糊數組成的向量,第j個模糊數的隸屬函數為
如圖2所示,wj是模糊數的對稱中心,是模糊數的半長,代表w處的隸屬度。
在模糊區域卷積神經網絡的訓練過程中,定義一個聯合損失函數:
其中pi是此樣本為測井曲線形態的預測概率,是樣本的標簽,如果是相應的測井曲線形態,為1,否則為0,Ncls是二分類(0或1)邏輯損失。
ti是預測物體邊界的四個參數組成的向量,為標注區域參數組成的向量,它們分別為:
tx=(x-xa)/wa th=(y-ya)/ha (7)
tw=log(w/wa)th=log(h/ha)
其中x、y、w和h分別代表物體的中心坐標、寬度和長度,x,xa,x*分別代表預測區域,錨定區域和標注區域(y,w,h同理)。回歸損失R為平滑損失函數
表示只有當錨定區域為正樣本時才計算回歸損失,否則不計算。歸一化參數Ncls和Nreg分別代表從特征向量映射的低維向量的長度和錨定區域的數量。
采用不同的測井手段會產生不同的數據。如采用自然伽馬(GR)、補償聲波(AC)、補償密度(DEN)、補償中子(CNL)及中子視孔隙度與密度視孔隙度差(SDN)等具有不同的量綱,數據之間不具有可比性,因此,本發明需要首先進行測井數據的規范化,將原始數據均轉換為無量綱化指標測評值,即各指標測評值都處于同一個數量級別上,再進行綜合測評分析。
采用如下的規范化方法:
Sx=(x-M)/S,x∈{GR,AC,DEN,CNL,SDN,...}
其中,x表示每條測井曲線的數據,Sx表示規范化后的測井曲線數據;M為相應測井曲線數據的均值,S為每條測井曲線數據的標準差。
本發明從已有的測井數據中進行標定,建立FR-CNN的訓練數據集,在此基礎上,由于不同的測井方法所揭示的信息不盡相同,所以選擇不同測井數據的組合作為FR-CNN的輸入,從而確定FR-CNN最優的測井數據組合,并優化FR-CNN的進行測井相識別時的網絡參數和結構。
本發明根據測井大數據中數據模糊的特點,融入模糊理論,提出模糊區域卷積神經網絡FR-CNN,并提出漸進模糊的方法,從模糊區域卷積神經網絡的第一層開始,逐漸增加模糊化的層數,從而優化網絡結構和參數,實現更好的分析性能和精度;而且,本發明針對不同的測井數據集調整FR-CNN模糊化的層數,使提取的特征更好的反映油氣儲層本身的特性,可以解決測井數據模糊性問題。
以上所述僅為本發明的較佳實施例而已,并不用以限制本發明,凡在本發明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發明的保護范圍之內。