一種地震數據的地震道集并行抽取方法
【技術領域】
[0001] 本發明涉及一種地球勘探中海量地震數據存儲技術和設備,尤其涉及一種地震數 據的地震道集并行抽取方法。
【背景技術】
[0002] 隨著地震勘探技術的不斷進步和多道多分量地震勘探采集技術的應用,使得地震 勘探的數據量巨大,這給地震數據的存儲和處理帶來了一定的困難。在地震數據存儲過程 中,地震數據一般以地震道為單位記錄組成一種特殊的文件格式(如SEG-Y、SEG-D文件格 式等),其存儲的地震數據信息結構如圖1所示,它是由文件卷頭信息和地震道信息組成, 其中地震道信息包括地震道頭信息和地震道數據兩部分。根據卷頭和道頭信息可從地震數 據文件中獲取多種地震道集,地震道集是地震數據中具有某一共同屬性的地震道的集合, 它是地震數據處理中的基本模塊,比如常用的地震道集有共炮點道集(CSG)、共接收點道集 (CRG)、共中心點道集(CMP)和共偏移距道集(COG)。通常地震數據文件根據某一種地震道 集按順序方式記錄,故該地震道集中的地震道在地震數據文件中是連續的(簡稱為連續式 地震道集),此時其它幾種地震道集中的地震道就無法保持連續,在地震數據文件中呈離散 分布(簡稱為非連續式地震道集)。根據地震道的不同屬性,從圖1中的M個地震道獲取不 同的地震道集組合,稱為道集抽取。
[0003] 當地震數據存儲介質為磁盤時,在抽取非連續式地震道集過程中,由于待抽取的 地震道位置不連續,故磁盤讀取完一個地震道數據后,磁頭需要機械移動到下一個地震道 數據的位置,才能重新開始讀數據操作,即磁盤的訪問過程屬于隨機訪問。訪問數據時,磁 盤的響應時間由磁頭的尋道時間、旋轉延時時間和傳送時間三部分組成。目前市場上主流 磁盤的尋道時間典型值是4. 6ms,旋轉延時則取決于磁盤的轉速:普通7200RPM硬盤的轉動 延遲是4. 2ms,而高端10000RPM的是3ms。傳送時間包括內部數據傳送時間和外部數據傳送 時間,其中內部數據傳送時間是指當磁盤存儲器的尋址工作完成之后,磁頭至硬盤緩存之 間的數據時間;外部數據傳送時間為電腦通過數據總線從磁盤內部緩存區中所讀取數據的 時間。目前主流磁盤的內部數據傳送速率在70?90MB/S,而外部數據傳輸速率在100MB/ s以上。對于地震道而言,一般單個地震道數據量都不大,約為30KB,其傳送時間為0. 3? 0.4ms。因此,磁盤在小數據讀寫過程中,尋道時間和旋轉延時遠大于傳送時間。可見大量 的隨機小數據訪問,致使機械磁盤的性能大大下降,成為抽取非連續式地震道集的I/O瓶 頸。
[0004] 在實際地震數據處理方面,地震數據處理動輒需要處理數以TB的海量數據,在對 地震數據進行數理方法如靜校正、疊加、DM0、濾波等處理時,處理過程中需要反復抽取不同 的地震道集數據。故地震數據處理具有處理的數據量大、處理過程多和反復處理等特征,這 些特征帶來了巨大的磁盤I/O訪問量問題,因此,存儲設備的I/O性能成為海量地震數據處 理時間的一個關鍵因素。
[0005] 綜上分析,從地震數據存儲和處理的特征反映了地震勘探數據處理系統中將面臨 的一個關鍵問題:磁盤I/O所花費的時間占總處理的時間比例越來越大。在地震勘探數據 處理系統中,提供一種專門快速地實現地震數據的存儲系統顯得尤為重要。磁盤陣列技術 由于其自身所具有的諸多優點正在得到越來越廣泛的應用,它是由多塊磁盤構成的一種超 大容量存儲系統,已成為地震數據存儲中常用的存儲設備。但目前基于磁盤陣列設計的地 震數據存儲系統無法克服隨機小數據訪問I/O效率低的問題。
[0006] 常規的基于磁盤陣列抽取地震道集的流程如圖2所示,地震數據處理軟件將地震 道集請求根據索引轉換成一系列的讀地震道的讀請求,即標準的seek和read函數調用。當 操作系統接收到這些函數調用后,會將其發送給磁盤陣列控制器,控制器再根據具體情況 指揮相應的磁盤進行地震道數據的讀取操作。地震數據處理軟件在接收到地震道數據后, 將發送執行下一個地震道數據讀取過程。最后循環直至所有的地震道都正確執行完后,地 震數據處理軟件可獲得地震道集數據。從常規的地震道集抽取流程可以看出,因為read函 數一般為阻塞調用,所以只有在當前地震道數據訪問結束后,才能發起下一地震道指令數 據讀取,即是以串行方式來讀取地震道集中的各個地震道數據。
[0007] 根據上述流程,分析抽取連續式地震道集的性能:在磁盤上讀取一塊數據所需要 的時間Tt(rtal可描述為
[0008] Ttotal=tseek+tdelay+ts (1)
[0009] 式中,tSMk為尋道時間,tdday為旋轉延時,ts為傳送時間。
[0010] 在抽取順序地震道集時,由于目標數據是連續的,所以文件系統的預讀技術及多 I/O合并技術會使得tseek= 0且tdelay= 0,則式(1)可簡化為
[0011]
【主權項】
1. 一種地震數據的地震道集并行抽取方法,其特征在于包括以下步驟: 步驟一,將地震數據文件按地震道數據使用均勻化存儲技術寫入磁盤中; 步驟二,客戶端中的地震數據處理軟件發出讀地震道集請求指令后,地震道集指令以 廣播方式發送到各個數據節點上; 步驟三,數據節點對接收到的地震道集指令進行解析,轉換為相應的讀地震道請求隊 列,再根據隊列讀取本地磁盤中的地震道數據,最后將讀出的地震道數據返回給客戶端; 步驟四,客戶端接收數據節點陣列返回的地震道數據,并對地震道數據按道集的地震 道順序進行排序,最后返回給地震數據處理軟件。
2. 根據權利要求1所述的一種地震數據的地震道集并行抽取方法,其特征在于:所述 步驟一中將地震數據文件按地震道數據均勻化存儲技術寫入磁盤中的具體方法是:客戶端 獲取各數據節點信息,包括數據節點總數量N和每個數據節點IP地址;對數據節點進行初 始化,即在每個數據節點中建立相應的文件名或編號與之對應,為每一個數據道用偽隨機 編碼方式確定存儲位置,便于在讀取數據時進行查找;客戶端向數據節點陣列發送命令表 示將要寫入文件,數據節點收到命令后,開始準備接受數據包; 以地震道為單位讀取地震數據文件,按照地震道數據均勻化存儲技術將地震道數據分 別以網絡包的方式發送給數據節點,數據節點接收網絡包后將其寫入相應的文件中; 當地震數據文件發送完成后,向數據節點發送寫文件結束命令,寫文件過程結束。
3. 根據權利要求1所述的一種地震數據的地震道集并行抽取方法,其特征在于:所述 數據節點根據解析生成的地震道隊列,判斷地震道是否存儲在本地磁盤上,若存在,則讀出 地震道數據,并返回至客戶端;若不存在,則執行隊列中的下一請求,如此循環直至隊列結 束。
4. 根據權利要求1所述的一種地震數據的地震道集并行抽取方法,其特征在于:所述 步驟三中數據節點是通過MCU對接收到的地震道集指令進行解析后,根據索引文件將其轉 換為相應的地震道請求隊列,數據節點根據請求隊列中的任務讀取地震道數據,再將該數 據封裝為一個網絡命令包返回給客戶端;所述步驟四中,客戶端對地震道數據按道集的地 震道順序排序,其順列與請求隊列的排序一致。
5. 根據權利要求1-4任意一項所述的一種地震數據的地震道集并行抽取方法,其特征 在于:所述地震數據文件的格式為SEG-Y格式,所述SEG-Y格式以CSG順序方式記錄保存地 震數據,以CRGXMP和COG非連續式地震道集抽取速度為測試對象,并與常規的RAIDO存儲 系統進行對比分析;以每秒抽取地震道個數作為設備的性能測試指標。
【專利摘要】本發明涉及一種地震數據的地震道集并行抽取方法,包括以下步驟:將地震數據文件使用均勻化存儲技術寫入磁盤中;客戶端發出讀地震道集請求指令后,地震道集指令發送到各個數據節點上;數據節點對地震道集指令進行解析,轉換為讀地震道請求隊列,再根據隊列讀取地磁盤中的地震道數據,最后地震道數據返回給客戶端;客戶端接收地震道數據,并對地震道數據按道集進行排序,最后返回給地震數據處理軟件。發明解決了常規基于磁盤陣列系統由于串行抽取地震道集從而導致的效率低下的問題,大大提高了地震數據的I/O效率,且可擴展性強;讓各個數據節點執行完非連續式地震道集指令的時間趨于一致,保證了存儲系統能夠達到理論上預期的抽取效率。
【IPC分類】G01V1-24
【公開號】CN104570063
【申請號】CN201510073212
【發明人】武杰, 張捷
【申請人】安徽吉拓電子技術有限公司
【公開日】2015年4月29日
【申請日】2015年2月11日