基于遙感數據深度學習的近海污染物識別與跟蹤方法
【技術領域】
[0001] 本發明屬于數字圖像識別領域,具體設及一種近海污染物識別與跟蹤方法。
【背景技術】
[0002] 近幾十年,隨著世界工業的發展,海洋的污染也日趨加重,有害物質進入海洋環境 而造成的污染,會損害生物資源,危害人類健康,妨礙捕魚和人類在海上的其他活動,損壞 海水質量和環境質量等,使海洋生態系統遭到破壞。海洋污染物主要包括石油、重金屬和酸 堿、放射性核素、固體廢料等,其中,石油污染物是最常見的海洋污染物之一,主要是由工業 生產,包括海上油井管道泄漏、油輪事故、船舶排污等造成的,每年排入海洋的石油污染物 約一千萬噸,一次突發性泄漏的石油量可達10萬噸W上,大片海水被油膜覆蓋,導致海洋生 物大量死亡,嚴重影響海產品的價值。
[0003] 因此,有必要對海上各類污染物進行快速識別并做相應的預測與預警。當前高分 辨率的衛星和航空遙感技術能夠拍攝出海洋表層的許多污染影像。然而,海洋遙感覆蓋面 積大,具有同時性,能夠幾乎在同等條件下把獲得的資料同船舶測點取樣進行對比,能連 續、長期而且快速地觀測海洋的特點,而且可W得到用船舶觀測法不能完整觀測到的海洋 特征,如海洋表面水溫、海流移動、海水分布、波浪、沿海岸泥沙混濁流,W及赤潮、海面油污 染等。利用衛星遙感和數據挖掘技術監測海上污染物無論從理論上和實踐上都證明是可行 的,并且具有節約資金.適時、快速、連續大范圍監測的優勢,無異是未來實現海洋全面監測 的必然手段。尤其是在保護海洋環境;對非法排污罰款提供依據;確定油污面積、排污量、擴 散規律;為清除油污制定方案提供資料等方面都具有十分重要的意義。
[0004] 遙感具有大面積、快速、動態、低成本獲取區域信息的優勢,由于海上污染物的復 雜性,如何從大量的遙感圖像中識別并跟蹤污染物目標已成為一個亟需解決的科學前沿問 題。目前利用遙感圖像深度學習來提取海洋環境污染物目標的相關研究還未見報道。已有 的遙感技術在海洋環境監測中的應用,目前國內外主要集中在海洋溢油監測,W及懸浮物、 葉綠素等要素上的定量遙感識別方面,然而,海量的遙感影像具有極大的信息量,它同時具 有空間分辨和時間分辨的能力,但真正把運些信息提取和挖掘出來是極其復雜和困難的。 例如,例如Landsat衛星的TM圖像,一幅覆蓋185km X 185km地面面積,象元空間分辨率為 30m,象元光譜分辨率為28位的圖,其數據量約為6000X6000 = 36Mb。若將6個波段全部送入 計算機,其數據量為:36Mb X 6 = 216Mb,而每天獲取的整體數據量將高達TB級,為了提高對 運樣龐大數據的處理速度,遙感數字圖像技術隨之得W迅速發展。
[0005] 遙感影像深度學習技術是指通過對大量的遙感影像進行機器學習,自學習出各類 污染物的特征,過濾掉圖像中無用的或干擾的信息,抽取圖像源中關鍵的有用信息,準確地 判斷和檢測出污染物目標,從而為各類工作的順利推進提供直觀且有價值的圖像依據。然 而,雖然深度學習有較多優點,但仍然有需要解決的科學性問題,例如:對于一個特定的框 架,對于多少維的輸入它可W表現得較優(如果是圖像,可能是上百萬維)?有什么正確的機 理可W去增強一個給定的深度學習架構,W改進其魯棒性和對扭曲和數據丟失的不變性? 模型方面是否有其他更為有效且有理論依據的深度模型學習算法?
[0006] 因此,從遙感影像中建模深度學習 W識別污染物目標的需求角度看,深度學習模 型及相關科學問題成為一個必需解決的技術難題;
[0007] 綜上所述,由于海量遙感影像數據處理、圖像內容挖掘所存在的技術挑戰目前尚 未有很好的、全面的解決方案,因此針對遙感影像的新特點和新變化,研發具有自主知識產 權的、創新性的、先進的針對海量遙感影像的近海污染物識別當前是非常必要和緊迫的。本 發明正是針對運些技術和應用問題展開的,發明的成功研發和產業化對于公共安全、國家 安全等方面將有重要的意義。
【發明內容】
[0008] 本發明針對現有近海環境監管技術存在的"發現不全面"、"缺乏對遙感數據的內 容挖掘"的問題,基于多年來在衛星應用領域的研發和產業應用基礎,提出了一個全面、系 統、深入的基于遙感數據深度學習的近海污染物目標識別與跟蹤的解決方案。
[0009] 本發明具體通過如下技術方案實現:
[0010] -種基于遙感數據深度學習的近海污染物識別與跟蹤方法,基于近海污染物識別 與跟蹤系統,所述系統分為用于應用層、內容分析與挖掘層、資源數據集成層、資源獲取層; 所述方法包括:
[0011] 首先,采用海量遙感影像數據分布式處理技術對多源遙感影像資源統一數據集 成、分布式處理,包括數據標準化處理、噪音數據過濾、歸一化、數據一致性檢查,形成污染 物目標數據庫;
[0012] 然后,通過卷積神經網絡C順建立衛星遙感圖像的深度學習模型,利用空間關系減 少需要學習的參數數目W提高一般前向BP算法的訓練性能;利用權值共享降低網絡的復雜 性;
[0013] 最后,由于深度卷積神經網絡模型的卷積層計算量大,全連接層參數多,可將一個 完整深度卷積網絡的計算拆分到多個GPU上進行合理調度來并行地執行,通過模型并行和 數據并行運兩個數據/計算組織層次上來加速訓練,快速針對特定污染物目標的識別、檢 測、跟蹤和行為分析。
【附圖說明】
[0014] 圖1是本發明的基于遙感數據深度學習的近海污染物識別與跟蹤系統框圖;
[0015] 圖2是一致性哈希的工作方式示意圖;
[0016] 圖3是一致性哈希處理節點添加/移除時的情況示意圖;
[0017]圖4是卷積神經網絡訓練過程卷積神經網絡訓練過程示意圖;
[0018]圖5是權值共享示意圖;
[0019] 圖6是Feature Map的示意圖;
[0020]圖7是Image化t深度卷積神經網絡模型;
[0021 ]圖8是從單GPU訓練到多GPU模型并行訓練的概要視圖;
[0022] 圖9是2GPU模型并行系統框架示意圖;
[0023] 圖10是數據處理和計算流水線示意圖;
[0024] 圖11是硬件體系結構示意圖;
[0025] 圖12是模型并行中的模型劃分方案示意圖;
[00%]圖13是對Image化t網絡的模型并行和數據并行劃分示意圖。
【具體實施方式】
[0027] 下面結合【附圖說明】及【具體實施方式】對本發明進一步說明。
[0028] 本發明的基于遙感數據深度學習的近海污染物識別與跟蹤系統,如附圖1所示,分 為用于應用層、內容分析與挖掘層、資源數據集成層、資源獲取層,包括污染物目標識別、決 策支持子系統、報警子系統、污染物漂移預報子系統、各種污染品化學成份及危害數據庫、 清污救助材料/設備性能及存貨數據庫、地理信息系統、污染應急反應能力評估子系統、污 染損害評估子系統等,可結合無線通訊系統技術實現地面應急反應中屯、與海巡飛機和海上 作業船舶之間的可視化信息通訊,依據海巡飛機的報告,快速生成救助、清除方案,指揮清 污船快速準確地進行多項海上清污技術的集成式清污作業。
[0029] 首先,通過多個不同的遙感衛星W及航拍獲得的影像資源原始數據具有多源、異 構、海量的特點,例如,不同種類的遙感影像在空間分辨率、光譜分辨率、福射分辨率和時間 分辨率是有區別的,圖像格式和成像方式也有所不同。因此進行分析和挖掘前必須解決資 源數據的集成和標準化問題。本發明采用海量遙感影像數據分布式處理技術對多源遙感影 像資源統一數據集成、分布式處理,包括數據標準化處理、噪音數據過濾、歸一化、數據一致 性檢查,形成污染物目標數據庫。
[0030] 然后,通過卷積神經網絡C順建立衛星遙感圖