一種大氣顆粒物質量濃度的擬合方法
【專利摘要】本發明公開了一種大氣顆粒物質量濃度的擬合方法,首先獲取氣象條件參數、反應大氣物化特性的關鍵化學組分參數與大氣顆粒物質量濃度的原始數據參數,并以日為時間尺度,構成各個參數的原始值時間序列;利用所得到的原始值時間序列,逐日前后依次取差值,變換得到各個原始參數的逐日絕對變化量數據時間序列,并進行歸一化處理;然后構建BP神經網絡,枚舉隱層神經元個數,對變換得到的各個原始參數的逐日絕對變化量數據時間序列進行訓練,并確定最優的拓撲結構;利用所得到的最優拓撲結構,對大氣顆粒物的質量濃度進行數據擬合,以及趨勢預測分析。上述方法能夠減小常規擬合方法的誤差,更好地模擬氣象條件和大氣關鍵化學組分與大氣顆粒物質量濃度之間的復雜非線性映射關系。
【專利說明】
_種大氣)顆粒物質量濃度的擬合方法
技術領域
[0001] 本發明涉及環境監測技術領域,尤其涉及一種大氣顆粒物質量濃度的擬合方法。
【背景技術】
[0002] 近年來,粗放型的經濟產業結構、以煤為主的能源生產和消費結構,以及快速的城 市化進程,導致中國大氣環境污染問題日益凸顯。其中,以高濃度大氣可吸入顆粒物(PM 10)/ 細顆粒物(PM2.5)和低大氣能見度為典型特征的城市和區域大氣復合污染及其對公眾健康 的影響得到國際社會的高度關注。PM 2.5和PM1Q分別是指大氣中空氣動力學直徑小于2.5微米 和10微米的顆粒物,通常根據被人體呼吸能深入到的呼吸系統位置分別被稱為可入肺顆粒 物和可吸入顆粒物。PM2.5和PM 1Q組成中均可劃分為由各類排放源直接排放的一次顆粒物部 分和由于各類氣態前體物(二氧化硫、氮氧化物、揮發性有機物、氨等)在大氣中通過大氣物 理化學反應生成的二次顆粒物部分,其在大氣中的質量濃度水平高低還取決于風速、風向、 溫度、濕度、降水量、氣壓等氣象條件對其在大氣中的擴散稀釋影響。可見,由于大氣顆粒物 的成分復雜、來源廣泛,以及各類氣態前體物參與大氣物理化學過程的非線性和復雜性,導 致目前對其形成機理和迀移轉化過程、及其在大氣中的擴散行為等的認識尚未完全透徹和 明晰。同時,由于PM 2.5和PM1Q的粒徑區間范圍不同,一次排放來源和二次生成過程及其構成 比例存在差異,導致大氣PM 2.5和PM1Q的物理化學性質也不盡相同。在這種情況下,利用各種 數學模型和統計分析方法,結合對其一次排放和二次生成機理的認識,對大氣顆粒物質量 濃度的時間序列進行統計分析,成為了一種能夠快速、且可較為準確地掌握其質量濃度變 化規律及影響因素的重要方法和手段。
[0003] 但在現有技術中,對大氣顆粒物PM2.5和PM1Q質量濃度進行統計分析時,大部分研究 側重直接考察PM 2.5和PM1Q質量濃度的原始值與各種氣象條件參數的原始值之間的關系,即 利用氣象條件參數的原始值作自變量,顆粒物的質量濃度作因變量,但這些研究默認了在 時間尺度上,顆粒物前后之間互不影響,單純地考慮由氣象條件決定的擴散稀釋過程,而忽 略了顆粒物在大氣中的積累、沉降,以及排放到大氣中的各種氣態前體物(二氧化硫、氮氧 化物、揮發性有機物、氨等)在大氣氧化性(臭氧等)作用下通過復雜的大氣物理化學過程生 成二次顆粒物的影響,因此并不能全面地反映大氣顆粒物在大氣中的所有擴散稀釋和生消 反應過程,使得這類利用原始值進行直接數據擬合的效果并不理想。
【發明內容】
[0004] 本發明的目的是提供一種大氣顆粒物質量濃度的擬合方法,該方法能夠更科學和 全面地反映和覆蓋大氣顆粒物從進入大氣開始的所有產生、迀移輸送、轉化和干濕沉降等 過程,減小常規擬合方法的誤差,更好地模擬氣象條件和大氣關鍵化學組分與大氣顆粒物 質量濃度之間的復雜非線性映射關系。
[0005] -種大氣顆粒物質量濃度的擬合方法,所述方法包括:
[0006] 首先獲取氣象條件參數、反應大氣物化特性的關鍵化學組分參數與大氣顆粒物質 量濃度的原始數據參數,并以日為時間尺度,構成各個參數的原始值時間序列;
[0007] 利用所得到的原始值時間序列,逐日前后依次取差值,變換得到各個原始參數的 逐日絕對變化量數據時間序列,并進行歸一化處理;
[0008] 然后構建BP神經網絡,枚舉隱層神經元個數,對變換得到的各個原始參數的逐日 絕對變化量數據時間序列進行訓練,并確定最優的拓撲結構;
[0009] 利用所得到的最優拓撲結構,對大氣顆粒物的質量濃度進行數據擬合,以及趨勢 預測分析。
[0010] 所述氣象條件參數包括以下一種或多種:日平均氣溫,最高氣溫,最低氣溫,平均 濕度,最大濕度,最小濕度,海平面氣壓,日降雨量,日平均風速和最大風速;
[0011] 所述反應大氣物化特性的關鍵化學組分參數包括以下一種或多種:s〇2、n〇2、co和 〇3的日均質量濃度;
[0012] 所述大氣顆粒物質量濃度的原始數據參數包括以下一種或兩種:PM2.5和PM1Q的日 均質量濃度。
[0013] 所述各個原始參數的逐日絕對變化量數據時間序列通過依次對各原始參數變量 取逐日差值得到,具體計算公式為:
[0014] Δ xi(t) =Xi(t)-Xi(t_l)
[0015] 其中,Xl⑴和Xl(t-1)分別代表當前日和前一日的各個輸入向量或輸出向量的原 始參數值,Xi代表所涉及到的各個參數。
[0016] 在所構建的BP神經網絡中,以反映氣象條件參數與關鍵化學組分各個參數的逐日 絕對變化量數據時間序列作為輸入向量,具體的輸入向量表示為:
[0018]并以大氣顆粒物質量濃度的原始數據對應的逐日絕對變化量數據時間序列作為 輸出向量,具體的輸出向量表不為:
[0020]其中,Ax(t)為各參數變量(X)當前日與前一日的逐日差值;f?為日平均溫度; Tmax( t)為日最高溫度;Tmin( t)為日最低溫度;/7(〇為日平均濕度;Hmax( t)為日最大濕度;Hmin ⑴為日最小濕度;P(t)為日降水量;B(t)為日均氣壓;印)為日平均風速;Vmax⑴為日最高 風速;瓦W/.K冗冗⑴、Δ0?)(〇和G(/)分別為二氧化硫、二氧化氮、一氧化碳和臭氧的日 平均質量濃度;兩和分別表示當日和前一日的大氣顆粒物PM 1Q或PM2.5 日平均質量濃度。
[0021]所述BP神經網絡在輸入前會對輸入輸出向量的各參數進行歸一化操作,去除各參 數絕對值變化量序列的量綱影響,具體的歸一化公式表示為:
[0023] 其中,AxiUV為各參數歸一化后時間序列中對應的逐日絕對變化量數值;Δχ (t)為各參數逐日變化量時間序列原始值;△ X(t )max為各參數逐日變化量時間序列中的最 大值;△ X( t )min為各參數逐日變化量時間序列中的最小值。
[0024] 所述確定最優的拓撲結構的過程具體包括:
[0025] 在枚舉隱層神經元個數時,將樣本歸一化后的時間序列輸入所構建的BP神經網 絡;
[0026] 以擬合的殘差平方和代表擬合效果,比較不同隱層神經元個數情況下的擬合效 果,選擇最小殘差平方和所對應的拓撲結構為最優的拓撲結構。
[0027] 由上述本發明提供的技術方案可以看出,上述方法能夠更科學和全面地反映和覆 蓋大氣顆粒物從進入大氣開始的所有產生、迀移輸送、轉化和干濕沉降等過程,減小常規擬 合方法的誤差,更好地模擬氣象條件和大氣關鍵化學組分與大氣顆粒物質量濃度之間的復 雜非線性映射關系。
【附圖說明】
[0028] 為了更清楚地說明本發明實施例的技術方案,下面將對實施例描述中所需要使用 的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本 領域的普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他 附圖。
[0029] 圖1為本發明實施例所提供的大氣顆粒物質量濃度的擬合方法流程示意圖;
[0030] 圖2為本發明所舉實例中輸入向量擴展前后PM2.5日均質量濃度擬合效果比較示意 圖;
[0031] 圖3為本發明所舉實例中輸入向量擴展前后PM10日均質量濃度擬合效果比較示意 圖;
[0032]圖4為本發明所舉實例中PM2.5日均質量濃度趨勢預測的結果示意圖;
[0033]圖5為本發明所舉實例中PM1()日均質量濃度趨勢預測的結果示意圖。
【具體實施方式】
[0034] 下面結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整 地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基于本 發明的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施 例,都屬于本發明的保護范圍。
[0035] 本發明實施例所述方法從統計分析的角度出發,利用參數的逐日絕對變化量數據 時間序列建立氣象條件和大氣關鍵化學組分與大氣顆粒物質量濃度之間的映射關系,從而 能夠更全面地模擬并揭示氣象條件和反映大氣物理化學性質的關鍵化學組分與大氣顆粒 物質量濃度之間的復雜非線性關系。下面將結合附圖對本發明實施例作進一步地詳細描 述,如圖1所示為本發明實施例所提供的大氣顆粒物質量濃度的擬合方法流程示意圖,所述 方法包括:
[0036] 步驟11:首先獲取氣象條件參數、反應大氣物化特性的關鍵化學組分參數與大氣 顆粒物質量濃度的原始數據參數,并以日為時間尺度,構成各個參數的原始值時間序列;
[0037] 在該步驟中,所述氣象條件參數包括以下一種或多種:日平均氣溫,最高氣溫,最 低氣溫,平均濕度,最大濕度,最小濕度,海平面氣壓,日降雨量,日平均風速和最大風速; [0038]所述反應大氣物化特性的關鍵化學組分參數包括以下一種或多種:S0 2、N02、C0和 〇3的日均質量濃度;其中,s〇2、n〇2和C0濃度表征大氣中通過二次反應生成二次氣溶膠顆粒 物的潛力值,〇3濃度則用于反映和表征大氣氧化性,從而在一定程度上從大氣物理化學機 理方面更好地反映和描述了大氣二次顆粒物生成潛力的強度;
[0039] 所述大氣顆粒物質量濃度的原始數據參數包括以下一種或兩種:PM2.5和PM1Q的日 均質量濃度。
[0040] 步驟12:利用所得到的原始值時間序列,逐日前后依次取差值,變換得到各個原始 參數的逐日絕對變化量數據時間序列,并進行歸一化處理;
[0041] 在該步驟中,具體操作是以每日的各個原始參數數據減去前一日的原始參數數 據,獲得各個原始參數變量的逐日數據差值,進而得到各個原始參數的逐日絕對變化量數 據時間序列,具體計算公式為:
[0042] Δ xi(t) =Xi(t)-Xi(t_l)
[0043] 其中,11(〇和11(卜1)分別代表當前日和前一日的各個輸入向量或輸出向量的原 始參數值,Xi代表所涉及到的各個參數。
[0044] 步驟13:然后構建BP神經網絡,枚舉隱層神經元個數,對變換得到的各個原始參數 的逐日絕對變化量數據時間序列進行訓練,并確定最優的拓撲結構;
[0045] 在該步驟中,在所構建的BP神經網絡中,以反映氣象條件參數與關鍵化學組分各 個參數的逐日絕對變化量數據時間序列作為輸入向量,具體的輸入向量表示為:
[0047]并以大氣顆粒物質量濃度的原始數據對應的逐日絕對變化量數據時間序列作為 輸出向量,具體的輸出向量表不為:
[0049]其中,Ax(t)為各參數變量(X)當前日與前一日的逐日差值;f(i)為日平均溫度; Tmax( t)為日最高溫度;Tmin(t)為日最低溫度;哀(?)為日平均濕度;Hmax(t)為日最大濕度;H min ⑴為日最小濕度;P(t)為日降水量;B(t)為日均氣壓;「(〇為日平均風速;Vmax⑴為日最高 風速;奶:⑴、、Δ(Χ>(〇和G(/)_分別為二氧化硫(S〇2)、二氧化氮(N〇2)、一氧化碳 (〇0)和臭氧(〇3)的日平均質量濃度;/ >#1〇<^2..5的_和.戶財1.0。《.5(|-1)分別表不當日和前一日的大 氣顆粒物PM 1Q或PM2.5日平均質量濃度。所有參數均取步驟12中得到的逐日絕對變化量數據 序列。
[0050]另外,所述BP神經網絡在輸入前會對輸入輸出向量的各參數進行歸一化操作,去 除各參數絕對值變化量序列的量綱影響,具體的歸一化公式表示為:
[0052]其中,AxiUV為各參數歸一化后時間序列中對應的逐日絕對變化量數值;Δχ (t)為各參數逐日變化量時間序列原始值;△ X(t)max為各參數逐日變化量時間序列中的最 大值;△ X( t )min為各參數逐日變化量時間序列中的最小值。
[0053] 通過上述歸一化操作可以統一和縮小各個參數的數據分布范圍,以便提高擬合精 度和收斂速度。
[0054] 進一步的,上述確定最優的拓撲結構的過程具體包括:
[0055]在枚舉隱層神經元個數時,將樣本輸入所構建的BP神經網絡;
[0056] 以擬合的殘差平方和代表擬合效果,比較不同隱層神經元個數情況下的擬合效 果,選擇最小殘差平方和所對應的拓撲結構為最優的拓撲結構。
[0057] 具體實現中,首先確定神經網絡的激勵函數和訓練函數,將歸一化后樣本數據時 間序列輸入神經網絡,由MATLAB神經網絡工具箱將樣本隨機分為訓練樣本與驗證樣本。其 中,訓練樣本通過激勵函數處理與神經元之間的傳遞后,得到擬合誤差,誤差前向傳遞,訓 練函數不斷調整神經元之間的權重,逐漸改進和提升擬合效果,驗證樣本用于在學習過程 中的檢驗,以避免過擬合現象的發生。每次神經元之間的權重調整后,驗證樣本檢驗誤差是 否下降,當連續一定次數權重調整后,若誤差沒有進一步下降,則退出學習過程,學習完成。
[0058] 然后就可以利用上述尋找到的最優拓撲結構構建網絡并進行訓練,得到最終的擬 合網絡。
[0059] 步驟14:利用所得到的最優拓撲結構,對大氣顆粒物的質量濃度進行數據擬合,以 及趨勢預測分析。
[0060] 在該步驟中,進行數據擬合或趨勢預測時,BP神經網絡的輸入輸出向量與上述步 驟13中所描述的輸入輸出向量一致。
[0061] 下面以具體的實例對上述擬合方法的過程進行詳細說明,以北京市為例,對北京 市2014年8月至2015年7月的大氣顆粒物濃度進行統計分析。
[0062]首先,獲取2014年8月1日至2015年7月31日的日氣象條件參數、大氣關鍵化學組分 參數和大氣顆粒物質量濃度參數的原始值時間序列。
[0063]然后再利用各個參數變量的原始值時間序列生成逐日絕對變化量時間序列,并進 一步將該逐日絕對變化量時間序列進行線性歸一化,使得各個參數的數據范圍區間通過歸 一化處理縮小為[-1,1];
[0064] 再設置三層BP神經網絡,網絡的激勵函數為tansig函數,訓練函數為traingd函 數;枚舉隱層神經元個數,以擬合的殘差平方和作為擬合優劣的評判指標;
[0065] 將歸一化后的逐日絕對變化量時間序列輸入BP神經網絡中進行訓練,尋找BP神經 網絡的最優拓撲結構,具體Mat lab函數如下:
[0067]根據上述枚舉,發現對PM2.5來說,最優的隱層神經元個數為14,而對ΡΜιο來說,最優 的隱層神經元個數是21。
[0068]與傳統的氣象條件原始值對應大氣顆粒物濃度原始值的擬合方法進行對比,如圖 2所示為本實例中輸入向量擴展前后PM2.5日均質量濃度擬合效果比較示意圖,如圖3所示為 本實例中輸入向量擴展前后PM 1Q日均質量濃度擬合效果比較示意圖,由圖2和3可知:通過擴 展輸入變量,在輸入參數變量中引入和增加了包括反映大氣物化性質的關鍵化學組分參數 和反映前期顆粒物污染水平和積累的前一日顆粒質量濃度變量,并利用輸入參數變量和輸 出參數變量的歸一化的逐日絕對變化量數據時間序列建立一種新型的復雜非線性映射關 系,較直接采用氣象條件和大氣PM 2.5/PM1Q顆粒物濃度原始數據時間序列的傳統映射方法可 以獲得更好的數據擬合效果,并可從大氣PM 2.5/PM1Q顆粒物的一次直接排放、前期積累和大 氣中二次顆粒物的生消機理等方面更好地解釋輸入變量和輸出變量之間的復雜非線性關 系,顯示出本方法的創新性、優越性和科學性。
[0069]進一步,再利用北京市2015年1月至7月的數據,以得出的最優拓撲結構的BP神經 網絡進行訓練,并對2015年8月的PM2.5和PM1Q日均質量濃度分別進行短期趨勢預測實驗,如 圖4所示為本實例中PM2.5日均質量濃度趨勢預測的結果示意圖,如圖5所示為本實例中ΡΜιο 日均質量濃度趨勢預測的結果示意圖,由圖4和5可知:用本方法構建的新型映射關系對未 來北京市大氣PM2. 5與PM1Q質量濃度進行趨勢預測,預測趨勢正確,未來三天內的誤差較小, 具有較高的預測準確度和可信度,三天后由于蝴蝶效應的影響,誤差不斷積累,預測的偏差 逐漸增大。就實際應用而言,本方法對預測未來3-5天以內的短期大氣顆粒物質量濃度變化 發展趨勢具有應用價值。
[0070] 綜上所述,與現有方法相比,本發明實施例所提供的方法優點在于:
[0071] 1)本方法突破了以往直接利用氣象條件原始值和大氣PM2.5或PM 1Q顆粒物質量濃度 原始值建立二者之間映射關系的非線性統計回歸分析方法。在常規氣象條件作為輸入變量 的基礎上,通過在輸入變量中增加引入反映二次顆粒物生成潛力的氣態前體物參數(二氧 化硫、二氧化氮、一氧化碳)、反映大氣氧化性的大氣關鍵化學組分參數(臭氧),以及反映前 一日大氣中累積的大氣顆粒物PM 1Q或PM2.5日平均質量濃度等一系列新的輸入參數變量,對 各個參數的逐日絕對變化量進行線性歸一化,并利用BP神經網絡擬合輸入與輸出參數變量 之間的復雜非線性關系,從而構建發明了一種關于氣象條件、大氣關鍵化學組分與大氣顆 粒物質量濃度之間復雜非線性的新型映射關系。
[0072] 2)本方法對現有各個參數的逐日原始數據時間序列的利用更加充分,充分挖掘了 不同參數的原始數據時間序列中所蘊含的內涵信息,從而使得利用輸入和輸出參數變量的 逐日絕對變化量建立的映射關系得到了更優的擬合效果,更加貼近事實情況和科學全面地 反映大氣中顆粒物的一次直接排放、二次顆粒物生成、前期積累和大氣干濕沉降等顆粒物 的生消及迀移轉化過程。
[0073] 以上所述,僅為本發明較佳的【具體實施方式】,但本發明的保護范圍并不局限于此, 任何熟悉本技術領域的技術人員在本發明披露的技術范圍內,可輕易想到的變化或替換, 都應涵蓋在本發明的保護范圍之內。因此,本發明的保護范圍應該以權利要求書的保護范 圍為準。
【主權項】
1. 一種大氣顆粒物質量濃度的擬合方法,其特征在于,所述方法包括: 首先獲取氣象條件參數、反應大氣物化特性的關鍵化學組分參數與大氣顆粒物質量濃 度的原始數據參數,并以日為時間尺度,構成各個參數的原始值時間序列; 利用所得到的原始值時間序列,逐日前后依次取差值,變換得到各個原始參數的逐日 絕對變化量數據時間序列,并進行歸一化處理; 然后構建BP神經網絡,枚舉隱層神經元個數,對變換得到的各個原始參數的逐日絕對 變化量數據時間序列進行訓練,并確定最優的拓撲結構; 利用所得到的最優拓撲結構,對大氣顆粒物的質量濃度進行數據擬合,以及趨勢預測 分析。2. 根據權利要求1所述大氣顆粒物質量濃度的擬合方法,其特征在于, 所述氣象條件參數包括以下一種或多種:日平均氣溫,最高氣溫,最低氣溫,平均濕度, 最大濕度,最小濕度,海平面氣壓,日降雨量,日平均風速和最大風速; 所述反應大氣物化特性的關鍵化學組分參數包括以下一種或多種:s〇2、n〇2、co和0 3的 日均質量濃度; 所述大氣顆粒物質量濃度的原始數據參數包括以下一種或兩種:PM2.5和PM1Q的日均質 量濃度。3. 根據權利要求1所述大氣顆粒物質量濃度的擬合方法,其特征在于, 所述各個原始參數的逐日絕對變化量數據時間序列通過依次對各原始參數變量取逐 日差值得到,具體計算公式為: A xi(t) = xi(t)-xi(t-l) 其中,^(〇和^(卜1)分別代表當前日和前一日的各個輸入向量或輸出向量的原始參 數值,Xl代表所涉及到的各個參數。4. 根據權利要求1所述大氣顆粒物質量濃度的擬合方法,其特征在于, 在所構建的BP神經網絡中,以反映氣象條件參數與關鍵化學組分各個參數的逐日絕對 變化量數據時間序列作為輸入向量,具體的輸入向量表示為:并以大氣顆粒物質量濃度的原始數據對應的逐日絕對變化量數據時間序列作為輸出 向量,具體的輸出向量表示為:其中,Ax(t)為各參數變量(X)當前日與前一日的逐日差值;Π?)為日平均溫度;Tmax(t) 為日最高溫度;Tmin(t)為日最低溫度;吞的為日平均濕度;Hmax(t)為日最大濕度;H min(t)為 日最小濕度;P⑴為日降水量;B⑴為日均氣壓;「⑴為日平均風速;Vmax⑴為日最高風速; 免勸、%(/_)、Δ而(/)和0,(/)分別為二氧化硫、二氧化氮、一氧化碳和臭氧的日平均質 量濃度;兩冗詠咖仍和卜1)分別表示當日和前一日的大氣顆粒物ΡΜιο或PM2.5日平均 質量濃度。5. 根據權利要求1所述大氣顆粒物質量濃度的擬合方法,其特征在于, 所述BP神經網絡在輸入前會對輸入輸出向量的各參數進行歸一化操作,去除各參數絕 對值變化量序列的量綱影響,具體的咁一化公忒弄示為,其中,AxiUV為各參數歸一化后時間序列中對應的逐日絕對變化量數值;Ax(t)為各 參數逐日變化量時間序列原始值;A x(t)max為各參數逐日變化量時間序列中的最大值;Δχ (t)min為各參數逐日變化量時間序列中的最小值。6. 根據權利要求1所述大氣顆粒物質量濃度的擬合方法,其特征在于,所述確定最優的 拓撲結構的過程具體包括: 在枚舉隱層神經元個數時,將樣本輸入所構建的BP神經網絡; 以擬合的殘差平方和代表擬合效果,比較不同隱層神經元個數情況下的擬合效果,選 擇最小殘差平方和所對應的拓撲結構為最優的拓撲結構。
【文檔編號】G06N3/02GK105868559SQ201610189221
【公開日】2016年8月17日
【申請日】2016年3月29日
【發明人】田賀忠, 段事恒, 王堃, 朱傳勇, 王勇
【申請人】北京師范大學