專利名稱:多模型神經網絡的生物發酵過程軟測量建模方法及軟儀表的制作方法
技術領域:
本發明涉及軟測量儀表的優化建模方法,應用于生物發酵的軟測量及軟儀表構造技術領域,具體是在生物發酵過程中引入多模型神經網絡建模方法,在線測量一些難以在實際發酵過程中測量的關鍵變量。
背景技術:
微生物發酵工程被廣泛地應用于抗生素、氨基酸及精細化工產品的生產,在醫藥工業、化學工業、輕工食品和環境保護等諸多領域都涉及微生物發酵,已成為生物化學工程和現代生物技術及其產業化的基礎。由于微生物發酵過程機理的復雜性,以及連續流加發酵過程的復雜性,微生物發酵過程的控制問題成為難點,雖然在各領域內提出了相應的控制方法,但其技術還停留在如何構造基于模型的生物反應器。
微生物發酵過程控制問題的核心之一是重要過程變量的檢測,如PH、溫度、溶氧(DO)、氧補給率(OUR)、二氧化碳排出率(CER)等。盡管目前已提出一些輔助測試手段,但受檢測技術發展水平的限制,一些類似細胞內代謝產物這樣的關鍵變量始終是不易檢測的,導致針對發酵過程的先進優化控制算法和策略只能停留在理論討論上,而無法在工業上實際應用。
早期的軟測量技術主要用于控制變量或擾動不可測的場合,其目的是實現工業過程的復雜控制,因此采用的軟測量模型也是與控制系統模型相對應的線性模型和機理模型。隨著測量技術的發展,為了滿足對測量的更高要求,近年來軟測量技術能夠實現難測參數的在線測量,軟測量模型也發展到基于神經網絡模型和基于人工智能的混合模型研究。軟測量技術已成為過程控制和過程檢測領域的主要發展趨勢之一。
軟測量技術是依據某種優化準則,利用由輔助變量構成的可測信息,通過軟件計算實現對主導變量的測量,其核心是表征輔助變量和主導變量之間的數學關系的軟測量模型,因此目前普遍都是要解決軟測量模型建立問題,即一個數學建模問題。目前軟測量方法主要有基于機理分析的軟測量,基于統計回歸的軟測量,基于神經網絡的軟測量和基于混合模型的軟測量。
近幾年,利用神經網絡(NN,下同)對生物過程辨識以及在線估計已被采用,然而,由于生物發酵過程的復雜性和過程測量數據中離群點的存在,采用單一模型進行軟測量建模時,生物量濃度在線估計結果往往不準確,如對大量樣本僅用一個NN建立軟測量模型,會導致網絡結構過于龐大,訓練時間較長。因此,幾個模型組合的多模型建模方法可提高模型的魯棒性和預測能力。在多模型建模方法之下,一種基于聚類算法的多模型神經網絡軟測量建模方法得到了廣泛的應用。
發明內容
本發明的目的是為克服現有技術中生物發酵生長過程的測量精度不高、測量結果不準確的缺陷,提供了一種基于多模型神經網絡的生物發酵過程軟測量建模方法及其軟儀表結構,可在線測量、計算速度快、抗干擾能力強和精度高。
本發明建模方法采用的技術方案是先通過數據預處理模塊用歸一化和主元分析方法對輸入的變量數據進行預處理,然后通過數據預處理模塊對預處理后的主元變量集作聚類劃分,再用BP神經網絡模型模塊對不同的類分別建立子神經網絡,最后建立多模型神經網絡軟測量模型,通過多模型神經網絡軟測量模型在線測試發酵過程中的生物量濃度,將測量的數值通過生物量濃度軟測量值顯示儀顯示。
本發明軟儀表采用的技術方案是將用于測量生物發酵易測變量的現場智能儀表連接于生物發酵設備,用于測量操作變量的控制器連接在生物發酵設備和數據預處理模塊之間,存放數據的DCS數據庫模塊連接在現場智能儀表和數據預處理模塊之間,數據預處理模塊的輸出依次連接數據分類模塊、BP神經網絡模型模塊、多模型NN神經網絡軟測量模型和生物量濃度軟測量值顯示儀。
本發明的有益效果是 1、結合生物發酵過程的機理知識和數據驅動建模的多模型建模方法,所建模型簡單,科學地反應了微生物的生長規律,實現了生物量濃度的在線測量,克服了傳統離線測量方法中時間滯后所造成的控制不及時、已有測量儀表的測量精度不高等缺陷,抗干擾能力強,預測精度高。
2、針對單一神經網絡模型的網絡結構過于復雜、訓練時間較長、模型魯棒性和預測能力較差的現象,引入基于粒子群算法的核模糊C均值聚類算法結合多模型神經網絡建模方法,克服了單一模型的復雜性和不準確性,為利用多模型神經網絡對生物發酵過程進行軟測量建模提供了可靠的基礎。
下面結合附圖和具體實施方式
對本發明進一步詳細說明。
圖1為多模型神經網絡的生物發酵過程軟儀表結構示意圖。
圖2為粒子群算法的核模糊C均值聚類算法的流程圖。
圖3為多模型神經網絡的生物發酵過程軟測量建模方法的流程圖。
圖4為本發明的軟測量模型結構示意圖。
圖5為本發明的軟測量儀表估計某一批發酵過程的生物量濃度的實驗結果。
具體實施例方式 如圖1,將用于測量生物發酵易測變量的現場智能儀表連接于生物發酵設備,用于測量操作變量的控制器連接在生物發酵設備和數據預處理模塊之間,存放數據的DCS(Distributed Control System,集成控制系統)數據庫模塊連接在現場智能儀表和數據預處理模塊之間。數據預處理模塊的輸出依次連接數據分類模塊、BP神經網絡模型模塊、多模型NN神經網絡軟測量模型和生物量濃度軟測量值顯示儀。本發明通過數據預處理模塊用歸一化和主元分析方法對輸入的變量數據進行預處理,然后通過數據預處理模塊對預處理后的主元變量集作聚類劃分,再通過BP神經網絡模型模塊對不同的類分別建立子神經網絡,最后建立多模型神經網絡軟測量模型,通過多模型神經網絡軟測量模型在線測試發酵過程中的生物量濃度,將測量的數值通過生物量濃度軟測量值顯示儀顯示出來,具體實現步驟如下 1、數據預處理模塊 這一模塊用于將從DCS數據庫模塊輸入的模型輸入變量進行預處理,利用主元分析方法(PCA)有效地去除模型變量間的冗余信息,減小相關性,降低模型的復雜度。
2、數據分類模塊 數據分類模塊使用的方法是聚類分析方法,聚類分析是多元統計分析的一種,也是非監督模式識別的一個重要分支,它把一個沒有類別標記的樣本集按照某種準則分為若干個子類,使相似的樣本盡可能的歸為一類,而將不相似的樣本盡可能劃分到不同的類中。這一部分需要注意的問題是1)聚類分析的分類數目,即建立子神經網絡的數目;2)聚類算法的選擇,一種好的聚類算法能有效地減少模型間的相關性,從而提高生物發酵過程軟測量模型的精度。
3、BP神經網絡模型模塊 基于神經網絡的建模屬于黑箱建模,輸入變量和輸出變量之間的映射關系是由神經網絡來完成的,生物發酵過程中的在線可測變量X、發酵對象的控制輸入量U作為軟測量儀表的輸入變量,被估計的發酵產物量作為軟測量儀表的輸出變量。BP神經網絡模型模塊采用BP神經網絡作為各個子模型的訓練方法,設BP神經網絡的輸出層第k個神經元的實際輸出為yk,輸入為netk,與此層相鄰的隱含層中任一神經元j的輸出為yj,則有 yk=f(netk) (2) 式中,wkj是神經元k與神經元j之間的連接權,為神經元的輸出函數,通常取為S型(sigmoid)函數,表示為 式中,hk為神經元k的閾值,θ0為陡度參數,用以調節S型函數的陡度; 令訓練樣本為k,對于任一輸入模式Xp,若相應有輸出層中第k個神經元的期望輸出Opk,則輸出層的輸出方差表示為 式中,Opk代表期望輸出,ypk代表實際輸出;反向誤差傳播學習的目的是修改連接權w值,使E達到的最小值;要求連接權wkj,wji應沿Ep的負梯度方向學習;所以wkj的修正量為 4、多模型神經網絡軟測量模型 多模型建模方法的優劣很大程度上取決于模型個數的設定和子模型網絡的選取。多模型神經網絡軟測量模型建模時,主要三個問題1)子神經網絡的數目,即根據發酵的機理知識選擇合適的數目;2)子神經網絡的訓練算法的選擇,Levenberg-Marquardt(拉凡格氏)BP算法由于具備快速收斂性和有效的記憶功能,被選作訓練子神經網絡;3)軟測量模型的輸出,即可由各個子神經網絡的輸出和與之相對應的隸屬度的加權和計算出來。
如圖2,上述數據分類模塊采用基于粒子群優化算法的核模糊C均值聚類算法(PSKFCM)對數據集作聚類劃分。先設定粒子群算法中的各個參數,從中隨機選擇初始粒子集作為聚類中心和定義適應度函數,根據公式計算核矩陣和隸屬度矩陣,再計算每個粒子的適應度值,根據適應度值和粒子群優化算法更新公式修正個體極值和全局極值,最后判斷是否滿足條件,若滿足條件便執行FCM聚類算法實現數據分類,若不滿足條件再重新計算矩陣。具體實現步驟如下 1)給定聚類數目C,允許誤差ε,t=1; 2)設定群體規模N,慣性權重,學習因子c1,c2,指數權重m; 3)初始化粒子群l1,l2,…,lC,其中lj為一個任意產生的聚類中心的集合,從樣本集X={x1,x2,…,xN}中任取C個向量來初始化lj; 4)計算核矩陣K(xi,lj); K(x,y)=exp[-(x-y)2/σ2] (6) 式中,vi為第i個聚類中心,xij為第i類的第j個樣本數據,l為第i個聚類所包含的樣本數目。
5)針對每個樣本根據式(8)計算隸屬度矩陣; 6)由式(9)計算出f(xi),根據式(10)、(11)修正粒子速度和位置,根據適應度的值修改Pid(t)(個體極值)和Pgd(t)(全局極值),以便產生下一代粒子; Vid(t+1)=ω·Vid(t)+c1·r1(Pid(t)-Xid(t)) (10) +c2·r2(Pgd(t)-Xid(t)) Xid(t+1)=Xid(t)+Vid(t+1),(i=1,2,…,N)(11) 7)若當前迭代次數達到預先設定的最大次數,則停止迭代。在最后一代找到最優解,輸出取得Pgd的粒子,即聚類中心的集合,否則轉到步驟4),t=t+1; 8)根據式(8)更新粒子群體的隸屬度; 9)根據式(12)更新群體的聚類中心。計算相鄰兩代隸屬度矩陣之差E,若E<ε,停止;否則轉到8)。
上述多模型神經網絡的生物發酵過程軟測量建模方法如圖3所示,具體實現步驟如下 1)對生物發酵過程對象,根據工藝分析和操作分析,選擇控制輸入變量和在線可測變量作為模型的輸入,離線測量的發酵數據作為模型的輸出,即確定圖3中的實驗數據; 2)對輸入的樣本數據進行輔助變量的選擇; 3)確定聚類數目C,允許誤差ε,t=1,群體規模N,慣性權重,學習因子c1,c2,指數權重m;利用基于粒子群優化算法的核模糊C均值聚類算法對輸入變量做聚類分析; 4)根據聚類后的n個數據類,建立n個神經網絡子模型; 5)多模型神經網絡軟測量輸出為各子NN模型輸出的加權和,權值為隸屬度ui(i=1,2,...,C),要滿足下式 式中,C為聚類數目,N為樣本數,U=[μij]C×N是模糊C劃分矩陣,μij為樣本xi對應于第j個聚類的隸屬度值,V=[vj]為C個聚類中心組成的集合,m是影響隸屬度矩陣模糊化程度的指數權重。權值做如下的處理 則整個模型的輸出可由下式計算出來 式中fi為第i個子NN的輸出值。
根據以上步驟所得到的多模型神經網絡模型即定為該生物發酵對象的軟測量儀表。
下面提供1個實施例來說明本發明,但不是對本發明進行限制,只要在本發明保護范圍內對本發明做出的修改和改變,都落入本發明的保護范圍。
實施例1 參照圖1,主要包括生物發酵設備、用于測量易測變量的現場智能儀表、用于測量操作變量的控制器、存放數據的DCS數據庫模塊、生物量濃度軟測量值顯示儀、所述現場智能儀表、控制器與生物發酵設備和DCS數據庫模塊連接。
如圖2,核模糊C均值聚類的具體實施步驟是 步驟1.給定聚類數目C,允許誤差ε,t=1; 步驟2.設定群體規模N,慣性權重w,學習因子c1,c2,指數權重m; 步驟3.初始化粒子群l1,l2,…,lC,其中lj為一個任意產生的聚類中心的集合,從樣本集X={x1,x2,…,xN}中任取C個向量來初始化lj; 步驟4.計算核矩陣K(xi,lj); K(x,y)=exp[-(x-y)2/σ2] (6) 式中,vi為第i個聚類中心,xij為第i類的第j個樣本數據,l為第i個聚類所包含的樣本數目。
步驟5.針對每個樣本根據式(8)計算隸屬度矩陣; 步驟6.由式(9)計算出f(xi),根據式(10)、(11)修正粒子速度和位置,根據適應度的值修改Pid(t)(個體極值)和Pgd(t)(全局極值),以便產生下一代粒子; Vid(t+1)=ω·Vid(t)+c1·r1(Pid(t)-Xid(t)) (10) +c2·r2(Pgd(t)-Xid(t)) Xid(t+1)=Xid(t)+Vid(t+1),(i=1,2,…,N)(11) 步驟7.若當前迭代次數達到預先設定的最大次數,則停止迭代。在最后一代找到最優解,輸出取得Pgd的粒子,即聚類中心的集合,否則轉到步驟4,t=t+1; 步驟8.根據式(8)更新粒子群體的隸屬度; 步驟9.根據式(12)更新群體的聚類中心。計算相鄰兩代隸屬度矩陣之差E,若E<ε,停止;否則轉到8)。
見圖4的軟測量模型的結構示意圖,首先通過主元分析法對輸入變量進行預處理,利用基于粒子群優化算法的核模糊C均值聚類算法對主元變量集作聚類劃分,根據分類數據建立多模型神經網絡軟測量模型。方法的具體實施步驟如下 步驟1.針對發酵罐中的微生物發酵生產過程收集發酵數據存放入DCS數據庫,并將數據分為訓練樣本和預測樣本; 步驟2.對所有的歷史發酵數據進行數據歸一化預處理操作,將所有變量值限制在
區間內; 步驟3.對歸一化后的數據進行主元分析; 步驟4.確定聚類數目C,允許誤差ε,t=1,群體規模N,慣性權重w,學習因子c1,c2,指數權重m; 步驟5.利用基于粒子群優化算法的核模糊C均值聚類算法對輸入變量做聚類分析; 步驟6.根據聚類后的輸入輸出樣本數據,建立子神經網絡子模型; 步驟7.多模型神經網絡軟測量輸出為各子NN模型輸出的加權和,權值為隸屬度ui(i=1,2,...,C),要滿足下式 式中,C為聚類個數,N為樣本數,U=[μij]C×N是模糊C劃分矩陣,μij為樣本xi對應于第j個聚類的隸屬度值,V=[vj]為C個聚類中心組成的集合,m是影響隸屬度矩陣模糊化程度的指數權重。
權值做如下的處理 則整個模型的輸出可由下式計算出來 式中fi為第i個子NN的輸出值。
步驟8.導入工業現場測量的可測變量數據X和控制發酵對象的輸入量的數據U,根據模型的要求選擇以上變量,然后再對選中的變量進行數據預處理和數據分類處理; 步驟9.將以上處理完畢的數據用多模型神經網絡軟測量模型估計出發酵過程中的生物量濃度。
以下以紅霉素生產發酵過程對本發明技術方案做進一步描述 紅霉素是醫學中重要的藥物之一,其生產發酵過程中的生物量濃度很難利用一般傳感器實時準確地測量出來。將基于本發明的軟測量方法應用于紅霉素發酵過程中估計其生物量濃度。
根據對紅霉素發酵機理以及流程工藝的分析,考慮到這一發酵生產過程中對生物量濃度具有影響的各種因素,取實際生產過程中常用的15個操作變量和易測變量,有時間、溶解氧、pH值、糊精流量、豆油流量、丙醇流量、水流量、糊精體積、豆油體積、丙醇體積、水體積、溫度、相對氣壓、轉速、空氣流量。將這些狀態變量通過數據預處理模塊,利用主元分析算法對狀態變量處理之后,獲得的溫度、pH、相對壓力、轉速、溶解氧作為軟測量模型的輸入變量,生物量濃度作為軟測量模型的輸出變量。根據對微生物發酵過程生長速率曲線的分析,確定聚類數目為4。本發明中子NN選用三層前饋網絡,輸入層節點為6,隱含層節點為10,輸出層節點為1。隱含層和輸出層函數分別選用S型函數和線性函數。
圖5基于本發明的軟測量儀表估計某一批發酵過程的生物量濃度的實驗結果,圖中星號表示通過傳感器等手段離線采集到的生物量濃度,實線表示利用基于多模型神經網絡軟測量模型預測到的生物量濃度,由圖5可知,本發明可高精度在線測量發酵過程中參數變量。
下表1為利用基于多模型神經網絡軟測量建模方法對紅霉素發酵生產過程中3批發酵數據的估計生物量濃度,用最大相對誤差(MRE)和均方誤差(MSE)二個預測性能的評價指標評價該軟測量儀表的估計精度。
表1
權利要求
1、一種多模型神經網絡的生物發酵過程軟測量建模方法,其特征是先通過數據預處理模塊用歸一化和主元分析方法對輸入的變量數據進行預處理,然后通過數據預處理模塊對預處理后的主元變量集作聚類劃分,再用BP神經網絡模型模塊對不同的類分別建立子神經網絡,最后建立多模型神經網絡軟測量模型,通過多模型神經網絡軟測量模型在線測試發酵過程中的生物量濃度,將測量的數值通過生物量濃度軟測量值顯示儀顯示。
2、根據權利要求1所述的多模型神經網絡的生物發酵過程軟測量建模方法,其特征是具體步驟如下
1)選擇生物發酵過程對象的控制輸入變量和在線可測變量作為模型的輸入,離線測量的發酵數據作為模型的輸出;
2)先對輸出的數據進行歸一化,然后使用主元分析方法對歸一化后的數據進行預處理;
3)確定聚類數目、允許誤差、群體規模、慣性權重、學習因子以及指數權重;
4)采用基于粒子群優化算法的核模糊C均值聚類算法對輸入變量做聚類分析;
5)根據聚類后的輸入輸出樣本數據建立子神經網絡子模型;
6)對子神經網絡輸出反歸一化處理;
7)根據分類數據建立多模型神經網絡軟測量模型,多模型神經網絡軟測量輸出為各子模型輸出的加權和,權值為隸屬度ui(i=1,2,...,C),要滿足下式
式中C為聚類數目,N為樣本數,U=[μij]C×N是模糊C劃分矩陣,μij為樣本xi對應于第j個聚類的隸屬度值,V=[vj]為C個聚類中心組成的集合,m是影響隸屬度矩陣模糊化程度的指數權重;
權值做如下的處理
則整個模型的輸出可由下式計算出來
式中fi為第i個子NN的輸出值。
3、根據權利要求2所述的多模型神經網絡的生物發酵過程軟測量建模方法,其特征是步驟4)中聚類分析的具體方法為先設定粒子群算法中的各個參數,從中隨機選擇初始粒子集作為聚類中心和定義適應度函數,根據公式計算核矩陣和隸屬度矩陣,再計算每個粒子的適應度值,根據適應度值和粒子群優化算法更新公式修正個體極值和全局極值,最后判斷是否滿足條件,若滿足條件便執行FCM聚類算法實現數據分類,若不滿足條件再重新計算矩陣。
4、一種實現權利要求1的軟儀表,其特征是將用于測量生物發酵易測變量的現場智能儀表連接于生物發酵設備,用于測量操作變量的控制器連接在生物發酵設備和數據預處理模塊之間,存放數據的DCS數據庫模塊連接在現場智能儀表和數據預處理模塊之間,數據預處理模塊的輸出依次連接數據分類模塊、BP神經網絡模型模塊、多模型NN神經網絡軟測量模型和生物量濃度軟測量值顯示儀。
全文摘要
本發明公開了一種多模型神經網絡的生物發酵過程軟測量建模方法及軟儀表,先通過數據預處理模塊用歸一化和主元分析方法對輸入的變量數據進行預處理,然后通過數據預處理模塊對預處理后的主元變量集作聚類劃分,再用BP神經網絡模型模塊對不同的類分別建立子神經網絡,最后建立多模型神經網絡軟測量模型,通過多模型神經網絡軟測量模型在線測試發酵過程中的生物量濃度,將測量的數值通過生物量濃度軟測量值顯示儀顯示,本發明引入基于粒子群算法的核模糊C均值聚類算法結合多模型神經網絡建模方法,所建模型簡單,實現了生物量濃度的在線測量,控制及時、測量精度高且抗干擾能力強。
文檔編號G06N3/00GK101630376SQ20091018430
公開日2010年1月20日 申請日期2009年8月12日 優先權日2009年8月12日
發明者劉國海, 徐海霞, 梅從立, 周大為 申請人:江蘇大學