一種基于神經網絡原理的潛流濕地出水濃度的預測方法
【專利摘要】本發明公開了一種基于神經網絡原理的潛流濕地出水濃度的預測方法,包括以下步驟:S1、獲取采集到的用于構建預測模型的多維數據,包括潛流濕地的孔隙率、水力負荷、污染負荷、污染物組分特性及水質理化特征;S2、根據神經網絡原理構建預測模型,設置多維數據為輸入層,設置率定的神經元數為隱含層,得到的輸出層為模擬的多項污染物濃度;S3、獲取多組實際數據對構建的預測模型進行可靠性評估和反饋調試;S4、根據驗證后的預測模型,模擬出濕地出水濃度,對潛流濕地出水濃度進行長期持續預測。本發明為長期性持續性監測潛流濕地出水濃度提供一種便捷有效的方法,且建立的預測模型可靠性高,預測結果精確。
【專利說明】
-種基于神經網絡原理的潛流濕地出水濃度的預測方法
技術領域
[0001] 本發明設及潛流濕地凈化效率預測領域,尤其設及一種基于神經網絡原理的潛流 濕地出水濃度的預測方法。
【背景技術】
[0002] 隨著我國工農業生產的發展,人口的不斷增加,由之帶來的水污染問題日趨嚴峻, 基本呈現出北方水源性缺水、南方水質性缺水。水污染已成為限制國民經濟發展的重要因 子之一。水環境治理刻不容緩。
[0003] 人工濕地具有建造及運行費用低、維護簡單、處理效果好、適用面廣、對負荷變化 的適應能力強等優點,因此被廣泛應用于各種廢水的處理。人工濕地凈化污水的機理主要 依賴于濕地內部的基質、植物及微生物的協同作用。影響濕地凈化效能的因素很多,可W概 括為=大類:構筑因素(如基質/植物類型、流態、尺寸等)、運行工況(水力負荷、污染負荷、 強化措施等)及環境條件(降雨、氣溫、光照等)。人工濕地的凈化過程設及水化學、生物動 力、微生物、氣象等諸多內容,其中某些變化原理目前尚不清楚。因此很多學者將人工濕地 的凈化過程視為"黑箱"。
[0004] 人工神經網絡是由大量的、簡單的處理單元(稱為神經元)廣泛地互相連接而形成 的復雜網絡系統,是一個高度復雜的非線性動力學習系統。人工神經網絡具有大規模并行、 分布式存儲和處理、自組織、自適應和自學能力,特別適合處理需要同時考慮許多因素和條 件的、不精確和模糊的信息處理問題。因此它也比較適用于處理人工濕地的"黑箱"問題。
[0005] 近年來大量研究表明,人工濕地的凈化效能不僅取決于構筑方式、運行工況,還與 人工濕地進/出水的理化特征密切相關。因此,可W利用運些影響因素來模擬人工濕地的凈 化效能。然而人工濕地的凈化效能與影響因素間并非單純的線性關系,通常具有明顯的非 線性,很難有直觀的規律可循。因此,利用人工神經網絡可W很好地實現人工濕地凈化效能 與影響因素之間的映射關系。它為模擬人工濕地出水濃度提供了一種可能。
[0006] 目前評價人工濕地凈化效能的主要依據之一還是水質監測(如氮、憐、有機物分析 等)。同時水質監測也為人工濕地設計者、研究者或管理者提供了必要的調控信息。然而長 期性持續性水質監測不僅難度高、耗資巨大,而且費時費力。因此,探究適宜的水質監測(或 預測)技術已成為一種必要。
【發明內容】
[0007] 本發明要解決的技術問題在于針對現有技術中長期性持續性水質監測不僅難度 高、耗資巨大的缺陷,提供一種利用Matlab神經網絡擬合工具進行準確預測的基于神經網 絡原理的潛流濕地出水濃度的預測方法。
[000引本發明解決其技術問題所采用的技術方案是:
[0009]本發明提供一種基于神經網絡原理的潛流濕地出水濃度的預測方法,包括W下步 驟:
[0010] SI、獲取采集到的用于構建預測模型的多維數據,包括潛流濕地的孔隙率、水力負 荷、污染負荷、污染物組分特性及水質理化特征;
[0011] S2、根據神經網絡原理構建預測模型,設置多維數據為輸入層,設置率定的神經元 數為隱含層,得到的輸出層為模擬的多項污染物濃度;
[0012] S3、獲取多組實際數據對構建的預測模型進行可靠性評估和反饋調試;
[0013] S4、根據驗證后的預測模型,模擬出濕地出水濃度,對潛流濕地出水濃度進行長期 持續預測。
[0014] 進一步地,本發明的步驟Sl中還包括對多維數據進行預處理的方法,具體為:
[0015] 將多維數據分為建模數據和驗證數據,建模數據又進一步劃分為訓練、驗證和測 試;部分,其中驗證和測試各自所占建模數據的比例在5 % -35 %之間。
[0016] 進一步地,本發明的步驟Sl中的多維數據為影響濕地凈化效能的多項參數,其中 水質理化特征通過在線檢測裝置獲取。
[0017] 進一步地,本發明的步驟S2中構建預測模型的方法具體為:
[0018] 通過Matlab神經網絡擬合工具建立預測模型,在率定隱含層神經元數前提下進行 多次訓練的結果,隱含層神經元數的率定采用試錯法。
[0019] 進一步地,本發明的步驟S3中可靠性評估和反饋調試的方法具體為:
[0020] 計算模擬結果的均方誤差、絕對誤差、相對誤差W及相關系數;
[0021] 反饋調試驗證結果欠佳的條件為:相關系數的顯著性水平P〉0.05,此時對已構建 的預測模型重新進行有限次訓練,W獲得更好的模擬結果;
[0022] 訓練結束判定的依據是驗證結果取得了最小的均方誤差、相對誤差和/或最高的 相關系數。
[0023] 進一步地,本發明的步驟S4中還包括對預測模型進行整合應用的方法,具體為:
[0024] 通過在線檢測裝置獲取潛流濕地后期水質理化特征數據,該在線檢測裝置與PC機 聯用,PC機上安裝有Matlab神經網絡擬合工具;該PC機利用前期采集的多維數據已經人工 建立了潛流濕地出水濃度的預測模型;將潛流濕地后期水質理化特征數據導入Matlab神經 網絡擬合工具中,并利用已經構建的預測模型模擬出濕地出水濃度,達到對潛流濕地出水 濃度進行長期性持續性快捷預測的目的。
[0025] 進一步地,本發明的步驟Sl中的染物組分特性包括污染物類別、可生化性強弱和 碳氮比。
[0026] 進一步地,本發明的步驟Sl中的水質理化特征包括溫度、溶解氧、pH值、電導率、氧 化還原電位和總溶解固體。
[0027] 本發明產生的有益效果是:本發明的基于神經網絡原理的潛流濕地出水濃度的預 測方法,基于采集的多維數據,利用Matlab神經網絡擬合工具建立潛流濕地出水濃度的預 測模型,并將后期采集的濕地進/出水理化特征參數代入上述模型中,預測出濕地出水目標 污染物濃度;該方法只需獲取水質理化特征就可W建立濕地出水多項目標污染物的預測模 型,數據獲取難度較低;通過采集的多維數據可同時建立多項目標污染物的預測模型,便于 各項目標污染物之間的比較,可為潛流濕地的優化設計和運行管理提供依據;且建立的預 測模型可靠性高,預測結果精確。
【附圖說明】
[0028] 下面將結合附圖及實施例對本發明作進一步說明,附圖中:
[0029] 圖1是本發明實施例的基于神經網絡原理的潛流濕地出水濃度的預測方法的流程 圖;
[0030] 圖2(a)是本發明實施例的基于神經網絡原理的潛流濕地出水濃度的預測方法的 TN預測模型的構建及驗證結果的觀察值與模擬值比較(a);
[0031] 圖2(b)是本發明實施例的基于神經網絡原理的潛流濕地出水濃度的預測方法的 TN預測模型的構建及驗證結果的觀察值與模擬值比較(b);
[0032] 圖3(a)是本發明實施例的基于神經網絡原理的潛流濕地出水濃度的預測方法的 TAN預測模型的構建及驗證結果的觀察值與模擬值比較(a);
[0033] 圖3(b)是本發明實施例的基于神經網絡原理的潛流濕地出水濃度的預測方法的 TAN預測模型的構建及驗證結果的觀察值與模擬值比較(b);
[0034] 圖4是本發明實施例的基于神經網絡原理的潛流濕地出水濃度的預測方法的結構 框圖。
【具體實施方式】
[0035] 為了使本發明的目的、技術方案及優點更加清楚明白,W下結合附圖及實施例,對 本發明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅用W解釋本發明,并不 用于限定本發明。
[0036] 如圖1所示,本發明實施例的基于神經網絡原理的潛流濕地出水濃度的預測方法, 包括W下步驟:
[0037] S1、獲取采集到的用于構建預測模型的多維數據,包括潛流濕地的孔隙率、水力負 荷、污染負荷、污染物組分特性及水質理化特征;染物組分特性包括污染物類別、可生化性 強弱和碳氮比;水質理化特征包括溫度、溶解氧、pH值、電導率、氧化還原電位和總溶解固 體。
[0038] 多維數據為影響濕地凈化效能的多項參數,其中水質理化特征可W通過在線檢測 裝置獲取。多維數據又分為建模數據和驗證數據。建模數據又進一步劃分為訓練、驗證和測 試;部分,其中驗證和測試各自所占建模數據的比例在5 % -35 %之間。
[0039] S2、根據神經網絡原理構建預測模型,具體是調用MatlabR2013a軟件包中的 Neural Network Fitting Tool 工具(工具默認算法為Levenberg-Marquardt backpropagation algoritKtrainlm)),設置多維數據為輸入層,設置率定的神經元數為 隱含層,得到的輸出層為模擬的多項污染物濃度;
[0040] 預測模型的構建是在Matlab神經網絡擬合工具中完成,具體是在率定隱含層神經 元數前提下進行多次訓練的結果。隱含層神經元數的率定采用試錯法。
[0041] S3、獲取多組實際數據對構建的預測模型進行可靠性評估和反饋調試;
[0042] 可靠性評估是基于模擬結果的均方誤差(MSE)、絕對誤差(AE)、相對誤差(RE) W及 相關系數(R)等。反饋調試是驗證結果欠佳后(如相關系數的顯著性水平P〉〇.05),對已構建 的預測模型重新進行有限次訓練(如總訓練次數《300),W獲得更好的模擬結果。訓練結束 判定的依據是驗證結果取得了最小的均方誤差(MSE)、相對誤差(RE)和(或)最高的相關系 數(R)O
[0043] S4、根據驗證后的預測模型,模擬出濕地出水濃度,對潛流濕地出水濃度進行長期 持續預測。
[0044] 通過在線檢測裝置獲取潛流濕地后期水質理化特征數據,該在線檢測裝置與PC機 聯用,PC機上安裝有Matlab神經網絡擬合工具;該PC機利用前期采集的多維數據已經人工 建立了潛流濕地出水濃度的預測模型;將潛流濕地后期水質理化特征數據導入Matlab神經 網絡擬合工具中,并利用已經構建的預測模型模擬出濕地出水濃度,達到對潛流濕地出水 濃度進行長期性持續性快捷預測的目的。
[0045] 實施例1:垂直流濕地出水TN的模擬與驗證
[0046] -種基于神經網絡原理的潛流濕地出水濃度的預測方法,至少包括W下步驟:1) 采集用于構建預測模型的多維數據;2)預測模型的構建;3)預測模型的驗證;4)預測模型的 整合應用,其特征在于:步驟1)采集的多維數據涵蓋潛流濕地的孔隙率、水力負荷、污染負 荷及水質理化特征等。步驟2)預測模型的構建方法是基于神經網絡原理,利用PC機中安裝 的Mat Iab神經網絡擬合工具建立預測模型。如圖4所示,建模過程涵蓋=個模塊:輸入層、隱 含層及輸出層。輸入層為步驟1)采集的多維數據,隱含層為率定的神經元數,輸出層為模擬 的污染物濃度。步驟3)驗證是用另外多組數據對已構建的預測模型進行可靠性評估和反饋 調試。步驟4)是基于建立的預測模型提出潛流濕地出水濃度的一種預測方法。
[0047] 多維數據為影響濕地凈化效能的多維參數,其中水質理化特征可W通過在線檢測 裝置獲取。多維數據又分為建模數據和驗證數據。建模數據又進一步劃分為訓練、驗證和測 試=部分。
[004引多維數據同步采集于尺寸規格一致的9組垂直流濕地系統,它們都用于處理低濃 度水產養殖廢水,需要模擬的目標污染物是總氮和氨氮。多維數據采集過程中,每組濕地系 統持續監測10次,選取其中6組濕地系統數據用于構建預測模型,剩余3組濕地系統數據用 于預測模型的驗證,因此建模數據與驗證數據的比例為6:3。建模數據中訓練、驗證、測試各 自所占的默認百分比依次為70%、15%和15%。所述的多維數據設及水力負荷化LR)、基質 孔隙率(0、溫度(T)、溶解氧(DO)、抑值、電導率化C)、氨氮(TAN)、總氮(TN)等,其中在線水 質理化特征(指溫度、溶解氧、pH值、電導率等)用YSI ProPlus多參數水質測量儀獲取,氨 氮、總氮的測定采用國標法。
[0049] 預測模型的構建是在Matlab神經網絡擬合工具中完成,具體是在率定隱含層神經 元數前提下進行多次訓練的結果。隱含層神經元數的率定采用試錯法。
[0050] 本實施例中,TN預測模型的構建是在MatlabR2013a軟件中進行,具體是由其中的 化ural化twork Fitting Tool工具完成。建模過程中,WTN代表進水污染負荷,因此輸入 層變量為:水力負荷化LR)、基質孔隙率(O、進水度及進/出水的溫度(T)、溶解氧(DO)、 pH值、電導率化C)等。輸出層為TO濃度。隱含層神經元數采用試錯法確定:即分別構建了隱 含層神經元數從2到35的模型。由于輸入權值和闊值影響著神經網絡性能變化,所W每個模 型訓練10次,分別記錄訓練結果的均方誤差MSE和相關系數R。結果見表1和表2。
[0051] 表1 TN不同隱含層神經元數下模型訓練的M沈表現
[0化2]
[
[
[0055]由表1和2可知,均方誤差MSE隨著神經元數的增加有先降低而后增加的趨勢,而相 關系數R呈現相反趨勢。當神經元數為20時對應最低的MSE和最高的R。運說明隱含層神經元 數過少時,模型會出現擬合不足,容錯性差,識別新樣本能力低等問題;隱含層神經元數過 多則會增加模型的迭代次數和訓練時間,導致模型過度擬合,降低模型的泛化能力,從而造 成模型預測能力下降。因此TN建模過程將隱含層神經元數設為20。
[0化6] 在MatlabR2013a環境下,調用化ural化twork Fitting Tool工具構建網絡,TN建 模樣本分為42個訓練樣本、9個驗證樣本、9個測試樣本,訓練函數為默認方法trainlm函數。 網絡經過32次訓練后建立預測模型,隨后進行=次驗證,預測模型的構建及驗證結果見表3 和圖 2(a)、圖 2(b)。
[0057]由表3和圖2(a)、圖2(b)可知,利用選取的6組垂直流濕地系統數據所構建的預測 模型能被剩余3組濕地系統的數據所驗證;驗證過程中觀察值與模擬值都達到了顯著或極 顯著水平,且相對誤差的絕對值在4.6%-12.6%之間,說明該方法所建立的預測模型具有 一定的可信度。因此,在后期濕地凈化效能跟蹤觀察過程中,若既定基質孔隙率、水力負荷 及污染負荷,只需要獲取水質理化特征就可W預測出濕地出水T腳農度。
[0化引表3 TN預測模型的構建及驗證結果 [0化9]
[0060] 實施例2:垂直流濕地出水TAN的模擬與驗證
[0061] 與實施例1類似,分別構建了隱含層神經元數從巧1帖的模型,每個模型訓練10次, 分別記錄訓練結果的均方誤差MSE和相關系數R,結果見表4和5。
[0062] 表4 TAN不同隱含層神經元數下模型訓練的MSE表現
[0063]
[OC
[OC
[0066] 由表4和5可知,均方誤差MSE和相關系數R隨著神經元數的增加均有起伏而無明顯 的變化趨勢,但是當神經元數為10時,對應最小的均方誤差MSE和最高的相關系數R。因此氨 氮建模過程將隱含層神經元數設為10。
[0067] 同樣地,在MatlabR2013a環境下,調用化ural Network Fitting Tool工具構建網 絡,氨氮建模樣本分為42個訓練樣本、9個驗證樣本、9個測試樣本,訓練函數為默認方法 trainlm函數。網絡經過28次訓練后建立預測模型,隨后進行S次測試,訓練及測試結果見 表6和圖3(a)、圖3(b)。
[0068] 表6 TAN預測模型的構建及驗證結果
[0069]
[0070] 由表6和圖3(a)、圖3(b)可知,利用選取的6組垂直流濕地系統數據所構建的預測 模型能被剩余3組濕地系統的數據所驗證;驗證過程中觀察值與模擬值都達到了顯著或極 顯著水平,且相對誤差的絕對值在15.3%-22.5%之間,說明該方法所建立的預測模型具有 一定的可信度。因此,在后期濕地凈化效能跟蹤觀察過程中,若既定基質孔隙率、水力負荷 及污染負荷,只需要獲取水質理化特征就可W預測出濕地出水TA腳農度。
[0071] 本發明的基于神經網絡原理的潛流濕地出水濃度的預測方法如下:
[0072] 1)首先采集影響濕地凈化效能的多維數據,如基質孔隙率、水力負荷、污染負荷、 污染物組分特性、進/出水理化特征等,其中水質理化特征可用在線檢測裝置獲取;
[0073] 2)利用所采集的多維數據,借助于Matlab神經網絡擬合工具建立濕地出水污染物 濃度的預測模型。建模過程涵蓋輸入層、隱含層及輸出層。輸入層涵蓋濕地的孔隙率、水力 負荷、污染負荷、污染物組分特性、進/出水理化特征等,輸出層為模擬的多項目標污染物濃 度,隱含層為率定的神經元數。構建的預測模型通過多次驗證和反復調試后最終確定;
[0074] 3)將后期監測采集的多維數據代入上述構建的預測模型中達到對多項目標污染 物(如氨氮、總氮、總憐、有機物等)的持續預測目的。后期采集的多維數據中除污染負荷(可 W單項指標代替)外,其它數據(如孔隙率、水力負荷、污染物組分特性、進/出水理化特征) 都易于獲取。
[0075] 本發明與現有技術相比,其有益效果與優點在于:
[0076] 1.該方法建立了潛流濕地出水濃度的預測模型,建模過程中除進水污染負荷外, 其它指標都易于獲取,尤其是水質理化特征。在既定濕地孔隙率、水力負荷、污染負荷(可W 單項指標代替)及污染物組分特性條件下,只需要獲取水質理化特征就可W建立濕地出水 多項目標污染物的預測模型。而水質理化特征可W通過在線監測裝置獲取,簡便易行。
[0077] 2.該方法利用采集的多維數據可同時建立多項目標污染物的預測模型,便于各項 目標污染物之間的比較,可為潛流濕地的優化設計和運行管理提供依據。
[0078] 3.該方法基于神經網絡原理,迎合了當前人工濕地凈化機理存在的"黑箱"問題, 建立的預測模型可靠性高,預測結果精確。
[0079] 一系列試驗證明該方法很好地模擬了垂直流濕地處理水產養殖廢水的凈化效果, 對濕地出水總氮模擬的相對誤差絕對值在4.6%-12.6%,對濕地出水氨氮模擬的相對誤差 絕對值在15.3%-22.5%,且模擬值與觀察值之間的相關性都達到了顯著或極顯著水平,說 明構建的預測模型可用于總氮、氨氮的預測。
[0080]應當理解的是,對本領域普通技術人員來說,可W根據上述說明加 W改進或變換, 而所有運些改進和變換都應屬于本發明所附權利要求的保護范圍。
【主權項】
1. 一種基于神經網絡原理的潛流濕地出水濃度的預測方法,其特征在于,包括以下步 驟: 51、 獲取采集到的用于構建預測模型的多維數據,包括潛流濕地的孔隙率、水力負荷、 污染負荷、污染物組分特性及水質理化特征; 52、 根據神經網絡原理構建預測模型,設置多維數據為輸入層,設置率定的神經元數為 隱含層,得到的輸出層為模擬的多項污染物濃度; 53、 獲取多組實際數據對構建的預測模型進行可靠性評估和反饋調試; 54、 根據驗證后的預測模型,模擬出濕地出水濃度,對潛流濕地出水濃度進行長期持續 預測。2. 根據權利要求1所述的基于神經網絡原理的潛流濕地出水濃度的預測方法,其特征 在于,步驟S1中還包括對多維數據進行預處理的方法,具體為: 將多維數據分為建模數據和驗證數據,建模數據又進一步劃分為訓練、驗證和測試三 部分,其中驗證和測試各自所占建模數據的比例在5 % -35 %之間。3. 根據權利要求1所述的基于神經網絡原理的潛流濕地出水濃度的預測方法,其特征 在于,步驟S1中的多維數據為影響濕地凈化效能的多項參數,其中水質理化特征通過在線 檢測裝置獲取。4. 根據權利要求1所述的基于神經網絡原理的潛流濕地出水濃度的預測方法,其特征 在于,步驟S2中構建預測模型的方法具體為: 通過Matlab神經網絡擬合工具建立預測模型,在率定隱含層神經元數前提下進行多次 訓練的結果,隱含層神經元數的率定采用試錯法。5. 根據權利要求1所述的基于神經網絡原理的潛流濕地出水濃度的預測方法,其特征 在于,步驟S3中可靠性評估和反饋調試的方法具體為: 計算模擬結果的均方誤差、絕對誤差、相對誤差以及相關系數; 反饋調試驗證結果欠佳的條件為:相關系數的顯著性水平P>〇.05,此時對已構建的預 測模型重新進行有限次訓練,以獲得更好的模擬結果; 訓練結束判定的依據是驗證結果取得了最小的均方誤差、相對誤差和/或最高的相關 系數。6. 根據權利要求1所述的基于神經網絡原理的潛流濕地出水濃度的預測方法,其特征 在于,步驟S4中還包括對預測模型進行整合應用的方法,具體為: 通過在線檢測裝置獲取潛流濕地后期水質理化特征數據,該在線檢測裝置與PC機聯 用,PC機上安裝有Matlab神經網絡擬合工具;該PC機利用前期采集的多維數據已經人工建 立了潛流濕地出水濃度的預測模型;將潛流濕地后期水質理化特征數據導入Matlab神經網 絡擬合工具中,并利用已經構建的預測模型模擬出濕地出水濃度,達到對潛流濕地出水濃 度進行長期性持續性快捷預測的目的。7. 根據權利要求1所述的基于神經網絡原理的潛流濕地出水濃度的預測方法,其特征 在于,步驟S1中的染物組分特性包括污染物類別、可生化性強弱和碳氮比。8. 根據權利要求1所述的基于神經網絡原理的潛流濕地出水濃度的預測方法,其特征 在于,步驟S1中的水質理化特征包括溫度、溶解氧、pH值、電導率、氧化還原電位和總溶解固 體。
【文檔編號】G06N3/02GK106021884SQ201610313261
【公開日】2016年10月12日
【申請日】2016年5月12日
【發明人】張世羊, 程靜, 班宜輝, 徐舟影
【申請人】武漢理工大學