一種空氣污染物濃度預測方法
【技術領域】
[0001] 本發明涉及一種數據預測方法,尤其涉及一種空氣污染物濃度預測方法。
【背景技術】
[0002] 目前,常用的城市空氣污染物濃度預報方法主要有數值預報、逐步線性回歸模型、 灰色預測、自回歸移動平均模型(AutoRegressiveand Moving Average,ARMA)、支持向量回 歸模型(Support Vector Machine,SVR)、支持向量回歸模型、人工神經網絡模型等。其中, 自回歸移動平均模型是建模平穩時間序列的有效工具,在城市空氣污染物濃度預報中得到 了廣泛的應用。
[0003] 空氣污染物濃度由于受多種氣象條件和大氣理化過程影響,會出現各種異常情 況,而現有自回歸移動平均模型無法反映短時事件和意外事件的影響,預測不是很理想。
【發明內容】
[0004] 本發明的目的在于克服現有技術中存在的上述不足,而提供一種空氣污染物濃度 預測方法,解決現有技術中預測空氣污染物濃度的精度不高的問題。
[0005] 本發明提供了一種空氣污染物濃度預測方法,包括:對空氣污染物濃度數據使用 Mallat算法進行多尺度小波分解,對最后一級尺度的低頻近似序列使用支持向量回歸模 型即SVR建模預測,對其它高頻細節序列使用自回歸移動平均模型即ARM建模預測,使用 Mallat算法對各級系數序列進行重構,得到空氣污染物濃度的預測結果。
[0006] 上述方法還可以具有以下特點:所述方法中進行三級尺度的小波分解,并且對第 一級高頻細節序列、第二級高頻細節序列、第三級高頻細節序列均使用ARMA進行建模預 測,對第三級低頻近似序列使用SVR建模預測。
[0007] 上述方法還可以具有以下特點:所述方法中重構時,先將第三級低頻近似序列和 第三級高頻細節序列預測結果經過濾波器系數加權和得到第二級低頻近似序列的預測值; 結合第二級高頻細節序列預測值得到第一級低頻近似序列預測值;最后結合第一高頻細節 序列預測值,得到最終預測結果。
[0008] 上述方法還可以具有以下特點:采用最小二乘法對ARMA模型的參數進行估計。
[0009] 上述方法還可以具有以下特點:采用在SVR模型中采用交叉驗證法確定懲罰系數 C、帶寬參數〇。
[0010] 上述方法還可以具有以下特點:在ARM模型中使用赤池信息量準則選擇模型的 階數
[0011] 本發明的預測方法中,使用了多尺度小波分解,并針對不同模型的適用特點對小 波分解后不同級別尺度的序列使用不同的模型,即利用ARMA更適用于平穩序列的預測以 及SVR更適用于不平穩序列的預測的特點對最后一級尺度的相對較為不平穩的低頻近似 序列使用SVR建模預測并且對其它相對較為平穩的高頻細節序列使用ARM建模預測。該 方法可以實現較高的預測精度。
【附圖說明】
[0012] 圖1是一種空氣污染物濃度預測方法的流程圖;
[0013] 圖2是具體實施例中空氣污染物濃度預測方法的流程圖。 具體實施例
[0014] 為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例 中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是 本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員 在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。需要 說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互任意組合。
[0015] 圖1是空氣污染物濃度預測方法的流程圖,此方法包括以下步驟:
[0016] 步驟1,對空氣污染物濃度數據使用Mallat算法進行多尺度小波分解。
[0017] 步驟2,對最后一級尺度的低頻近似序列使用SVR建模預測,對其它高頻細節序列 使用ARM建模預測。
[0018] 步驟3,使用Mallat算法對各級系數序列進行重構,得到空氣污染物濃度的預測 結果。
[0019] 下面對上述方法進行詳細說明。
[0020] 本方法中步驟1中的多尺度小波分解采用Mallat算法實現。運用Mallat算法, 可以將信號逐層分解,每一層分解的結果是將上次分解得到的低頻信號再分解成低頻和高 頻兩部分。計算公式如下
[0023] 其中,j為分解尺度,k、m為平移變量,Ajin為近似系數,是低頻部分;D jik為細節系 數,是高頻部分,h。、Ill分別是低通和高通濾波器。
[0024] 步驟3中,利用分解后的小波系數重構原來的序列,小波系數的重構公式為
[0026] 步驟2中使用的ARMA模型是建模平穩隨機序列常用的一種模型。模型如下:
[0028] 式中隨機干擾ε t為均值為零,方差為σ 2的白噪聲。al,a2,;bl,b2…,bq 不全為零,分別稱為AR系數和MA系數。p,q分別稱為自回歸(AR)階數和移動平均(M)階 數。
[0029] ARMA建模及預測步驟如下:
[0030] a)數據預處理
[0031] 數據的預處理包括去均值處理和差分平穩化處理。去均值采用下式進行: #= ·Υ,其中冢為原始序列X的均值。差分平穩化是指對X'依次采用一階差分處理直到 序列平穩。平穩性檢驗采用ADF檢驗方法。
[0032] b)模型識別
[0033] 模型識別是基于自相關函數和偏相關函數的定階方法。對于AR(p)或MA(q)型, 可以利用其樣本的自相關函數和樣本偏自相關函數的截尾特性判定模型的階數。對于 ARMA(p,q)型,一般使用赤池信息量準則(Akaike Information Criterion,簡稱AIC)選擇 模型的階數。
[0034] c)參數估計
[0035] 采用最小二乘法對ARMA模型的參數進行估計,具有算法簡單、估計精度高、收斂 快、魯棒性強的優點。
[0036] d)模型檢驗
[0037] 對序列建立模型后需要檢驗模型的合理性,若檢驗不通過,則調整模型階數,重新 估計參數和檢驗,直到檢驗通過為止。一般采用自相關函數圖檢驗和DW系數檢驗。
[0038] e)預測