專利名稱:面向高維非線性軟測量模型的輔助變量約簡方法
技術領域:
本發明屬于軟測量技術領域,具體涉及一種面向高維非線性軟測量模型的輔助變量約簡方法,用于指導生產過程輔助變量的精簡。
背景技術:
當前,在工業過程、生物信息、環境保護、食品安全等領域出現大量非線性、復雜關聯、不可測度對象參數的檢測問題,基于軟計算實現的軟測量技術正是在這種強烈的工業需求下蓬勃發展起來,并成為解決這類問題的有效方法,有廣闊的發展前景。例如中國專利(專利號:200410017533.7)就提出了一種基于支持向量機的軟測量建模方法。在軟測量過程中,首先面對的問題就是輔助變量的選擇,一方面希望盡可能不遺漏重要的解釋因素;另一方面,又要遵循參數節省原則,使輔助變量的個數盡可能少。在實際工作中,為了較完備地描述和分析系統,分析人員往往傾向于較周到地選取所能得到的一切輔助變量。而這樣構成的輔助變量之間常常存在多重相關性,造成建模中協方差矩陣的病態,降低建模的精度,破壞模型的穩定性,影響著軟測量的精度和泛化能力。因此,必須去除這種相關性,實現高維非線性軟測量模型的輔助變量約簡。
發明內容
本發明的目的在于提供一種面向高維非線性軟測量模型的輔助變量約簡方法,能夠在建模效果最佳的準則上找出含輔助變量個數最少的輔助變量集對主導變量進行預測,實現對主導變量精簡化的軟測量。本發明的技術方案如下:一種面向高維非線性軟測量模型的輔助變量約簡方法,其關鍵在于按如下步驟進行:步驟一:確定與主導變量可能相關的η個原始輔助變量,采集η個原始輔助變量和主導變量的取值,組成樣本集,樣本集大小為m ;將η個原始輔助變量數據寫成矩陣X= [Xl,…,Xi,…xm]T形式,主導變量數據寫成矩陣 Y =[y1; -,Yi,...ym]T,其中,Xi e RxxSyi e R,i = 1,2,…,m,并將 X,Y 進行標準化處理;所述標準化處理就是:若η個原始輔助變量數據寫成矩陣
權利要求
1.一種面向高維非線性軟測量模型的輔助變量約簡方法,其特征在于按如下步驟進行: 步驟一:確定與主導變量可能相關的η個原始輔助變量,采集η個原始軸助變量和主導變量的取值,組成樣本集,樣本集大小為m ;將η個原始輔助變量數據寫成矩陣X= [Xl,..., Xi,…xm]T形式,主導變量數據寫成矩陣 γ=[7ι,…,7i,...yjT,其中,Xi e Rnxi,yi e R,i = 1,2,…,m,并將 χ,γ 進行標準化處理; 步驟二:融合核獨立成分分析KICA(Kernel Independent Components Analysis)與虛假最近鄰點FNN(False Nearest Neighbors)方法,分別計算n個原始輔助變量的權重值;步驟三:按照權重值,將η個原始輔助變量組成原始輔助變量序列; 步驟四:確定最佳輔助變量集,包括以下步驟: 第一步,設定循環次數N = η ; 第二步,隨機從樣本集中選擇P個樣本作為訓練樣本,剩下的m-p個樣本作為檢驗樣本; 第三步,根據所述訓練樣本,利用BP神經網絡建立當前的輔助變量序列中所包含變量的非線性模型; 第四步,將所述檢驗樣本的當前輔助變量值輸入至所述非線性模型,得到m-p個檢驗樣本對應的主導變量預測值;` 第五步,計算m-p個檢驗樣本預測值的均方誤差MSE ; 第六步,刪除當前的輔助變量序列中權重值最小的原始輔助變量,組成新的原始輔助變量序列,并設定N = N-1,判斷此時N是否為O: 如果N古0,則回到第三步; 如果N = 0,則最小的檢驗樣本預測值的均方誤差MSE對應當前的輔助變量序列即為最佳輔助變量集; 步驟五:最佳輔助變量集在步驟四中對應的非線性模型即為軟測量的約簡模型。
2.根據權利要求1所述的面向高維非線性軟測量模型的輔助變量約簡方法,其特征在于步驟二中的虛假最近鄰點方法,步驟如下: 步驟一:將由所有原始輔助變量組成的η維數據看成是A= (Xl,X2,…,,…,xn); 步驟二:將剔除的輔助變量Xi設為零,重新得到A的投影向量B= (χ1; χ2, -χ^,Ο,Xi+i,…,Xn); 步驟三:計算高維相空間中相點A與其投影向量B之間的相似性測度COSab,其中, _ Α.ΒΤ⑴ -關0) 步驟四:依次考察原始輔助變量X1, X2,…,Xn,通過比較相應 變化情況,確定輸 /=1入變量對原始數據結構的影響大小,按變化由大到小的順序進行變量選擇;相似性測度COSab越大,說明剔除該變量對原始數據結構影響越小,可被剔除,相似性測度COSab越小,說明剔除該變量對原始數據結構影響越大,為了保持原有數據結構,該變量應被保留。
3.根據權利要求1所述的面向高維非線性軟測量模型的輔助變量約簡方法,其特征在于步驟二中的融合核獨立成分分析與虛假最近鄰點方法,如下: (一)、利用KICA算法計算樣本集的k個KICA主元得分向量ti;i = 1,2,..., k,組成主元得分矩陣T=[t1;...,&,…,tk],按如下步驟進行:(1)輸入:輔助變量X= [X1,…,Xi,…xm]T,輸出為Y = Iiy1,…,yi7…ym]T; (2)定義輔助變量矩陣χ的核矩陣:計算核矩陣1(,其中,1(的第1_位元素為1^= 1^0^,Xj),i,j = 1,2,…,m,其中k(.)為核函數;(3)中心化核矩陣
4.根據權利要求1所述的面向高維非線性軟測量模型的輔助變量約簡方法,其特征在于在利用BP神經網絡建立原始輔助變量序列中所包含變量的非線性模型的過程中,輸入層的節點個數等于當前原始輔助變量序列中所包含的變量個數,隱含層的節點個數通過交互驗證法確定,輸出層的節點個數為1,其中,隱含層的傳遞函數為:
全文摘要
本發明公開了一種面向高維非線性軟測量模型的輔助變量約簡方法,其特征在于按如下步驟進行一、確定與主導變量可能相關的n個原始輔助變量,采集n個原始輔助變量和主導變量取值數據并組成樣本集;二、融合KICA和FNN方法分別計算n個原始輔助變量的權重值;三、組成原始輔助變量序列;四、建模并根據最小均方誤差MSE確定最佳輔助變量;五、得到軟測量的約簡模型。本發明能夠在建模效果最佳的基礎上找出含輔助變量個數最少的輔助變量集對主導變量進行建模,實現對輔助變量的約簡。
文檔編號G06F17/50GK103186696SQ20131006850
公開日2013年7月3日 申請日期2013年3月5日 優先權日2013年3月5日
發明者蘇盈盈, 李太福, 顏克勝, 姚力忠, 曾誠 申請人:重慶科技學院