基于最小二乘支持向量機集成的熱工過程軟測量建模方法
【專利摘要】基于最小二乘支持向量機集成的熱工過程軟測量建模方法,屬于熱工技術和人工智能交叉【技術領域】。該方法選擇輔助變量作為模型的輸入,要預測的關鍵變量作為模型的輸出,選取運行數據作為初始訓練樣本,利用軟模糊均值聚類(SFCM)方法將初始樣本劃分成相互重疊并有差異的子數據集,在各組子數據集上建立個體模型,對個體模型的預測輸出進行合成得到關鍵變量的估計;對于任意新采集樣本xk,得到相應的預測值本發明提出了軟模糊均值聚類方法,通過構建集成模型,提高了模型的預測精度,減少了模型的計算復雜度,提高了運算效率;對邊界樣本進行了有效地處理;有利于工程實現;能夠對關鍵變量進行精確預測;對熱工系統的優化運行有重要的意義。
【專利說明】基于最小二乘支持向量機集成的熱工過程軟測量建模方法
【技術領域】
[0001]本發明涉及一種基于最小二乘支持向量機(least squares support vectormachine, LSSVM)集成的熱工過程軟測量建模方法,屬于熱工技術和人工智能交叉【技術領域】。
【背景技術】
[0002]由于檢測技術和經濟等方面條件的限制,在實際熱工過程中,一些表征特征的關鍵變量例如成分、質量等難以實現直接的測量,建立這些變量與其他變量的關系模型對實現生產過程的優化有著重要的意義。雖然部分電站安裝了在線分析儀器來實現對某些參數進行檢測,但這些硬件傳感器價格昂貴,安裝和維護成本較高,并且經常關閉維修。因此構建這些參數的軟測量模型對其冗余檢測也是十分必要的。
[0003]由于熱工過程機理的復雜性和不確定性,建立準確的機理模型往往是非常困難的。近年來,神經網絡、支持向量機等人工智能的發展使基于數據的建模技術得到了廣泛的應用。最小二乘支持向量機(least squares support vector machine, LSSVM)是基于統計學習理論的一種新的人工智能建模方法,它以結構風險最小化為原則,與神經網絡相比具有更好的泛化能力。而且,LSSVM利用等式約束代替不等式約束,使學習問題通過線性方程組來求解,從而減少了算法的復雜度,縮短了訓練時間。
[0004]在利用支持向量機等方法構建模型時,模型的參數一般通過交叉驗證法選取,而這種搜尋是非常耗時的。另一方面,由于操作人員的習慣和控制系統的設計,過程的運行工況往往集中在某些局部區域,而且在大范圍內變化,單一的回歸模型不僅會降低預測的精度,同時也使計算的復雜性增加,給模型的構建、實施以及更新維護帶來困難。因此,尋找一種新的快速學習算法來準確描述非線性、大范圍工況熱工過程具有一定的現實意義。
[0005]集成學習是構建多個學習機對同一問題進行學習,通過多個個體模型的結合,得到一個預測精度更高、普適性更強的復合全局模型。而且,利用集成學習“分而治之”的思想,將大規模數據劃分成多個子數據集,可以大大縮減搜尋參數和模型訓練的時間。構建有差異的個體和尋找合適的合成策略是影響集成學習性能的兩個重要因素。基于實際熱工過程的特點,利用經典的模糊均值聚類(fuzzy c-means, FCM)方法把原始樣本劃分為不同的子樣本空間,可以訓練出具有差異性的個體。然而,傳統的FCM方法基于最大隸屬度原則,往往無法很好地處理邊界樣本。因此,本發明創造性地考慮利用FCM的隸屬度的截集,即軟模糊均值聚類(soft fuzzy c-means, SFCM)方法來劃分樣本。對于相對穩定的LSSVM算法,訓練得到的各個子模型之間會存在一定程度的共線性,從而使集成效果變差。偏最小二乘法(partial least squares, PLS)基于主成分提取的思想,所提取的成分既能很好地概括自變量系統中的信息,又能最好地解釋因變量,并抑制系統中的噪聲干擾。因此利用PLS方法作為合成策略來提取各個子模型中差異性較大的成分,去除冗余和共線性信息。
【發明內容】
[0006]本發明的目的在于克服現有熱工過程的預測精度不高、計算耗時的不足,提出了一種基于最小二乘支持向量機(least squares support vector machine, LSSVM)集成的熱工過程軟測量建模方法。該方法通過多個個體模型的結合,得到一個預測精度更高、普適性更強的復合全局模型。而且,利用集成學習“分而治之”的原則,將大規模數據劃分成多個子數據集,可以很大程度上縮減搜尋參數和訓練模型的時間。該方法預測精度高、成本低、計算速度快,有利于應用于工程實踐之中。
[0007]基于實際熱工過程的特點,首先利用軟模糊均值聚類(soft fuzzyc-means, SFCM)把原始樣本劃分為不同的子樣本空間;然后在各子空間上建立具有差異性的最小二乘支持向量機(least squares support vector machine, LSSVM)個體學習機;最后利用偏最小二乘回歸(partial least squares,PLS)作為合成策略,得到關鍵變量最終的預測輸出。本發明的技術方案按以下步驟進行:
[0008]基于最小二乘支持向量機集成的熱工過程軟測量建模方法,該方法步驟為:
[0009]步驟1:根據相關機理分析,選擇合適的輔助變量作為模型的輸入,要預測的關鍵變量作為模型的輸出。選取工況跨度較大且具有代表性的運行數據作為初始訓練樣本,并可以記為?(χ,,.&)!&,其中Xj e Rp表示第j組作為輸入變量,Yj e R為第j組作為輸出變量,P為輸入變量個數,N為樣本數量。
[0010]步驟2:利用軟模糊均值聚類方法,將采集的原始數據劃分成相互重疊并有差異的子數據集。所述軟模糊均值聚類方法為:定義目標函數
[0011]
【權利要求】
1.基于最小二乘支持向量機集成的熱工過程軟測量建模方法,其特征在于,該方法步驟為:步驟1:選擇輔助變量作為模型的輸入,要預測的關鍵變量作為模型的輸出,選擇運行數據作為初始訓練樣本,記為,其中Xj e Rp表示第j組作為輸入變量,y」e R為第j組作為輸出變量,P為輸入變量個數,N為樣本數量; 步驟2:利用軟模糊均值聚類方法,將采集的原始數據劃分成相互重疊并有差異的子數據集; 所述軟模糊均值聚類方法為:定義目標函數
2.根據權利要求1所述的基于最小二乘支持向量機集成的熱工過程軟測量建模方法的模型,其特征在于,所述模型根據權利要求1所述的基于最小二乘支持向量機集成的熱工過程軟測量建模方法建模得到。
【文檔編號】G06F17/30GK103455635SQ201310438819
【公開日】2013年12月18日 申請日期:2013年9月24日 優先權日:2013年9月24日
【發明者】呂游, 楊婷婷, 劉吉臻 申請人:華北電力大學