專利名稱:一種丹參注射液生產濃縮過程密度的軟測量方法
技術領域:
本發明屬中藥生產過程測量方法,涉及一種中藥生產過程的軟測量方法, 尤其是一種丹參注射液濃縮過程濃縮液密度的軟測量方法,包括基于多元線性
回歸(MLR)、主成分回歸(PCR)、偏最小二乘(PLS)以及人工神經網絡(ANN)
多種多變量分析方法的軟測量模型。
背景技術:
中藥制藥過程包含提取、濃縮、醇沉等基本步驟。濃縮工序是中藥生產的 一個重要環節,它將提取工序獲取的藥液進行蒸發濃縮使藥液的密度達到生產 的要求,因此該環節直接關系到中藥產品的質量。傳統的濃縮工序主要依靠人 工觀察的辦法,通過提取藥液與濃縮后藥液比例進行估計,這樣難以保證不同 批次的藥品成份的穩定性。很多制藥企業已將在線密度計用于實時監控濃縮液 的密度。由于密度計是接觸式的傳感器,而濃縮罐是密封的,不利于密度傳感 器的安裝。大多采用從濃縮罐引出一條流通管道,將密度計安裝于管道中。由 于中藥濃縮液是粘稠狀的液體,隨著濃縮液密度的增加,其流動性較差,導致 濃縮液殘留在密度計探頭上,使探頭的靈敏度下降。 一般的解決辦法是定時清 洗,但傳感器拆卸不便,清洗頻次較高,會影響生產中密度的實時測定。
軟測量技術近年來在過程控制和檢測領域涌現出的一種新技術,它主要是 通過間接測量的思路,利用易于獲得的其他測量信息,通過計算機來實現被檢 測量的估計。利用這一技術,我們可以依據易測得的過程變量(溫度、壓力、 進液量等)與密度之間的數學關系,建立密度的軟測量模型。目前國內尚未有 針對注射液濃縮過程的軟測量方面的專利成果。
發明內容
針對上述問題,本發明的目的是提供一種丹參注射液生產濃縮過程密度的 軟測量方法。利用丹參濃縮過程中的歷史數據,從中選取與密度相關程度較高 的易于獲得的過程變量,篩選出具有代表性的數據集,使用多變量分析方法, 包括多元線性回歸(MLR)、主成分回歸(PCR)、偏最小二乘(PLS)以及人 工神經網絡(ANN)方法建立密度的軟測量模型,并利用軟測量模型對密度進 行實時預測,控制濃縮過程。提供了多種基于多變量分析技術的快速的密度軟 測量方法,充分利用了生產過程中得到的歷史數據,有利于丹參注射液生產的質量控制。
本發明通過以下步驟實現 (1 )采集丹參注射液生產濃縮過程中各傳感器及密度計獲取的數據集(AT, D}:首先是采集歷史數據,丹參注射液生產濃縮過程在減壓濃縮蒸發收膏裝置 中進行,使用傳感器在線采集注射液生產濃縮過程6 (6^3)個批次,每個批
次采集&個時刻的樣本a》30),得到歷史數據集(AT, D}。其中,AT為各傳 感器數據,包括加熱器、進液流量、蒸發器真空度、氣相溫度、液相溫度、液 位、緩沖罐壓力和冷卻上水流量,D為濃縮液的實測密度值,使用密度計采集 得到。
(2) 變量選擇和代表性數據篩選從各傳感器數據集(X, D)中選取與密
度D相關程度較高的過程變量,并去除其中的奇異樣本,篩選出具有代表性的 數據集(J^, "},劃分為訓練樣本和預測樣本。選擇主要的過程變量,通過相
關系數法計算各變量與密度D的相關程度,得到主要的過程變量^^ = (7> 7), P,丄),其中7^為氣相溫度、7)為液相溫度、尸為蒸發器真空度和Z為濃縮液 液位;再去除數據集中的奇異樣本,保留具有代表性的數據,將其劃分為訓練 樣本和預測樣本。
(3) 建立軟測量模型分別使用多種多變量分析方法,包括多元線性回 歸(MLR)、主成分回歸(PCR)、偏最小二乘(PLS)以及人工神經網絡(ANN) 方法,將(2)中選取的過程變量作為輸入,密度值作為輸出,使用訓練樣本 訓練建立密度的軟測量模型。以^^ = (&, 7),尸,丄)為自變量,Z)為因變量, 使用訓練數據集{&, AJ建立模型,預測數據集{^^^, }進行模型評 價。
使用預測樣本對模型進行評價;
① 建立密度的MLR軟測量模型如下
Z\ = A^—frZjM^+e =Z>27)+ 63jP+ 其中,e為誤差項。由訓練樣本計算得到回歸系數Z^w-(A^/AT^)"J^/A,, 對預測集未知樣本的模型估計為mw = Xw,e》m^。
② 建立密度的PCR軟測量模型如下-
其中,e為誤差項,T^為主成分分解AT^-7V^V/得到的得分矩陣。計算
可得主成分回歸系數6pa^(7;」/7^)—7V/iV對預測集未知樣本,首先計 算其得分矩陣7V^^;^,^^—,,,然后由回歸系數計算模型估計值為ZV<PCT =③ 建立密度的PLS軟測量模型如下
仏=l」》+e
其中,e為誤差項,^,為主成分分解;^」,7v&iv/得到的得分矩陣,t^由 主成分分解Ar"必/得到。計算可得回歸系數& = /7v一"2v/ f4。由 主成分分解a^""/得可以建立與&之間的關系
對預測集未知樣本,由PLS回歸系數6piS即可計算模型估計值為
二X附j^e"6尸LS0
④ 將J^作為輸入,密度"作為輸出,使用人工神經網絡對訓練樣本建立密度 的軟測量模型。首先選擇網絡類型,常用的用于預測建模的神經網絡類型有
BP神經網絡、RBF神經網絡等。
其次,確定網絡結構及傳遞函數。網絡層數"》3,包括輸入層、隱層和輸 出層。其中,輸入層神經元數目即為^中變量的個數,輸出層神經元數為1 個,隱層數目及隱層包含的神經元個數通過不同的取值來選取最優值,輸入層、 中間隱層、輸出層之間的傳遞函數可選常用的tora/g函數、/ww""函數、 G做m/朋函數、門限函數等。
最后,訓練網絡模型。隨機選取網絡的初始權值,設定學習速率和終止條 件,通過優化學習算法訓練得到網絡連接權值、閾值。使用訓練好的模型對預 測樣本進行評價。
(4)將模型應用于生產線,在線實時采集丹參注射液生產濃縮過程的過 程變量:^ = (7;, 7),尸,£),使用密度軟測量模型實時預測濃縮液的密度值, 實時監控濃縮過程進行質量控制,指導生產。
本發明的特點和有益的效果在于,其原理是通過容易獲得的丹參注射液生 產濃縮過程的過程變量,使用多變量分析方法,構造數學模型,實現對難以在 線實時測量的濃縮液密度的軟測量。所建立的基于MLR的軟測量模型計算簡 單,適用于線性關系好的簡單體系,模型解釋能力強,具有實際物理化學含義; 所建立的基于PCR的軟測量模型可最大利用有用信息,通過忽略那些次要成 分,可抑制噪聲對模型的影響,進一步提高模型的預測能力;所建立的基于PLS 的軟測量模型不僅消除自變量中的噪聲信息,而且去除了因變量中的無用信 息,是多元線性回歸和主成分分析的結合,可顯著提高模型的預測能力;所建立的基于ANN的軟測量模型是非線性模型,具有自學習、自組織、自適應能 力,很強的容錯能力和并行處理信息的功能及高度非線性表達能力,這是其他 傳統方法所不具備的。訓練好的軟測量模型可使用篩選得到的過程變量對密度 值進行預測,為注射液的濃縮過程的優化調控提供更合適的實現技術。該方法 不僅適用于丹參注射液濃縮過程,而且可推廣到其他的制藥過程,具有良好的 應用前景。
附圖1為丹參注射液濃縮過程密度的軟測量方法原理框圖。 附圖2為密度觀測值與PLS軟測量模型預測值的相關性曲線。 附圖3為密度觀測值與神經網絡軟測量模型預測值的相關性曲線。 附圖4為測試集樣本密度的觀測值與神經網絡軟測量模型預測值比較。
具體實施例方式
本發明結合附圖和實施例做進一步的解釋,但本發明不限于此實例。附圖 為本發明的實施例,兩個實施例分別使用線性PLS方法和非線性ANN方法建 立丹參注射液濃縮過程密度的軟測量模型。
實施例l:丹參注射液濃縮過程密度的線性軟測量方法(PLS) 本發明方法的原理參見圖1。
歷史數據集(X, 0}來自某制藥公司丹參注射液生產的濃縮工段,選取3 個批次的數據,每個批次采樣點數為60個,樣本的選取均勻分布整個濃縮過 程。其中,X為生產線容易由傳感器獲得且比較精確的過程變量數據,包括9 個過程變量加熱器(&)、進液流量(AT2)、進液累積量(AT3)、蒸發器真空 度OT4)、氣相溫度OT5)、液相溫度(X6)、液位CV7)、緩沖罐壓力(X8)和 冷卻上水流量(X9); D為濃縮液的實測密度值,使用在線密度計采集得到。 為減少系統誤差,數據進行4點采樣平均處理,得到每個批次的數據的采樣點 數為15個,得到A^(A, AT2, ..., J^)為45x9矩陣,Z)為45xl向量。
根據先驗知識選擇主要的過程變量,并通過相關系數法分別計算9個過程 變量&, X2, ..., X9與密度Z)的相關程度,保留主要的過程變量& = (7;, 7}, 尸,丄),其中&為氣相溫度、r,為液相溫度、尸為蒸發器真空度和丄為濃縮液 液位。其次,去除數據集中的奇異樣本(過程開始階段系統不穩定,應去除), 保留具有代表性的數據,最后得到的數據^為30x4矩陣,A^為30x1向量。
數據集{^^ = (7^, r,,尸,zo, AJ將用于后續軟測量模型的建立。將數據集劃分為訓練樣本和預測樣本,方法如下按照密度值大小排列樣本,等間隔選取 2/3作為訓練集樣本,余下1/3作為預測樣本。使用訓練數據集(J^,, AJ建立
模型,預測數據集(;^,^ iv^進行模型評價。
建立密度的PLS軟測量模型如下
<formula>formula see original document page 9</formula>
其中,(-0.064, 0.121,-0.017, 0.008f為PLS回歸系數。對預測集未知樣本 的模型估計只需將J^^w帶入上式即可。圖2給出了密度觀測值與PLS軟測 量模型預測值的相關性曲線,其中訓練樣本的相關系數R: 0.9542,校正均方 根誤差RMSEC-2.36。/c,預測集樣本的相關系數Rpred = 0.9468,預測均方根 誤差RMSEP二2.75y。。可見,結果相關性較高,均方根誤差均小于3%,符合 工業現場應用要求。
此外,還建立了密度的其他線性軟測量模型
① MLR軟測量模型
Dfr = ATW ,力肌w+e = -0.0167^+ 0.1467) -0.089尸十0.007Z+1,151, 回歸系數6肌k = (-0.016, 0.146, -0.089, 0.007)7",對預測集未知樣本的模型估計只
需將;^^^帶入上式即可。
② PCR軟測量模型
<formula>formula see original document page 9</formula>
其中,r^為主成分分解;^^r^/v/得到的得分矩陣,戶"為載荷矩陣,
6尸o = (-0.024, -0.018,0.133, -0.104f為主成分回歸系數。該模型為主成分數m=4 時的模型,若需要主成分數小于4 (gPw<4)的模型,可將上式中i^^的后幾 列(4-m列)去除,相應的回歸系數&cw的后幾行(4-m行)去除即可。對預 測集未知樣本的模型估計只需將J^』w帶入上式即可。實施例2:丹參注射液濃縮過程密度的非線性軟測量方法(ANN)
歷史數據集(AT, 0}來自某制藥公司丹參注射液生產的濃縮工段,選取5 個批次的數據,每個批次采樣點數為80個,樣本的選取均勻分布整個濃縮過 程。其中,X為生產線容易由傳感器獲得且比較精確的過程變量數據,包括9 個過程變量加熱器(X)、進液流量(X2)、進液累積量(JV3)、蒸發器真空
度(a:4)、氣相溫度o:5)、液相溫度or6)、液位(x7)、緩沖罐壓力o:8)和
冷卻上水流量(AT9); D為濃縮液的實測密度值,使用在線密度計采集得到。 為減少系統誤差,數據進行4點采樣平均處理,得到每個批次的數據的采樣點 數為20個,得到X-(ATp AT2,…,X9)為100x9矩陣,Z)為100x1向量。
根據先驗知識選擇主要的過程變量,并通過相關系數法分別計算9個過程 變量&, X2, ..., A與密度D的相關程度,保留主要的過程變量;^ = (7^, 7}, 尸,丄),其中7^為氣相溫度、7)為液相溫度、P為蒸發器真空度和£為濃縮液 液位。其次,去除數據集中的奇異樣本(過程開始階段系統不穩定,應去除), 保留具有代表性的數據,最后得到的數據&為72x4矩陣,^為72x1向量。 數據集{^ = (7;, 7), P,丄),AJ將用于后續軟測量模型的建立。將數據集劃 分為訓練樣本、驗證樣本和測試樣本,方法如下按照密度值大小排列樣本, 等間隔選取l/2作為訓練樣本,1/4作為驗證樣本,余下的1/4作為測試樣本。 使用訓練數據集(^n), AJ建立模型,驗證和測試數據集(A^』w, A^J進行 模型評價。
網絡類型選擇BP神經網絡,網絡層數"=3,包括輸入層、 一個中間隱層和 輸出層。將J^作為輸入,密度D作為輸出,隨機選取網絡的初始權值,設定 學習速率"=0.8,終止條件為最大訓練次數A^1000,對訓練樣本建立密度的軟 測量模型。模型可用如下函數關系式表示
<formula>formula see original document page 10</formula>其中,輸入層神經元數目即為J^中變量的個數4,輸出層神經元數為1個, 中間隱層的神經元個數通過不同的取值來選取最優值,輸入層、中間隱層、輸 出層之間的傳遞函數分別用tom/g函數和pwe//"函數
<formula>formula see original document page 10</formula>從而上述函數關系式即為
其中,《為輸入變量,W/,為輸入層節點/與隱層節點y'之間的權值,^為隱層節點/的閾值,h^為隱層節點A與輸出層節點之間的權值,"為輸出層節點
的閾值。參數,、m;w、 ~和"均采用誤差反向傳播算法(BP)和 Levevberg-Marquardt學習算法訓練得到。
圖3給出了密度觀測值與神經網絡軟測量模型預測值的相關性曲線,其中 訓練樣本的相關系數R^ 0.9459,校正均方根誤差RMSEC:2.51。/。,驗證集樣 本的相關系數Rva: 0.9135,驗證均方根誤差RMSEV = 3.11%,預測集樣本的 相關系數Rpred: 0.9348,預測均方根誤差RMSEP = 2.75%。可見,結果相關 性較高,均方根誤差均小于4%。圖4給出了 18個樣本的預測結果,準確性較 高,滿足工業現場應用需求。
權利要求
1、一種丹參注射液生產濃縮過程密度的軟測量方法。其特征在于該軟測量方法包括以下步驟(1)采集數據集采集丹參注射液生產濃縮過程中各傳感器及密度計獲取的數據集{X,D};(2)變量選擇和代表性數據篩選從各傳感器數據集{X,D}中選取與密度D相關程度較高的過程變量,并去除其中的奇異樣本,篩選出具有代表性的數據集{Xm,D},劃分為訓練樣本和預測樣本;(3)建立軟測量模型使用多變量分析方法,包括多元線性回歸、主成分回歸、偏最小二乘以及人工神經網絡方法,將(2)中選取的過程變量作為輸入,密度值作為輸出,使用訓練樣本訓練得到密度的軟測量模型,并使用預測樣本對模型進行評價,其中以Xm=(Tg,Tl,P,L)為自變量,D為因變量,使用訓練數據集{Xm_tr,Dtr}建立模型;(4)在線采集過程生產濃縮變量Xm=(Tg,Tl,P,L),使用軟測量模型對密度進行實時預測,控制濃縮過程。
2、 根據權利要求1所述的一種丹參注射液生產濃縮過程密度的軟測量方法,其特征在于,步驟(1)所述數據集采集具體步驟為丹參注射液生產濃縮過程在減壓濃縮裝置中進行,使用傳感器在線采集注射液生產濃縮過程6 (6^3)個批次,每個批次采集A個時刻的樣本a ^30),得到數據集(x, "},其中,x為各傳感器數據,包括加熱器溫度、進液流量、 蒸發器真空度、氣相溫度、液相溫度、濃縮液液位、緩沖罐壓力和冷卻水流量,Z)為濃縮液的實測密度值,使用密度計采集得到。
3、 根據權利要求1所述的一種丹參注射液生產濃縮過程密度的軟測量方法,其特征是,步驟(2)所述數據集篩選具體步驟為篩選數據集(AT, "},根據經驗選擇主要的過程變量,驗證各變量與密度D 的相關程度,保留主要的過程變量& = (7^ ",尸,丄),其中7^為氣相溫度、 T)為液相溫度、尸為蒸發器真空度和丄為濃縮液液位;去除數據集中的奇異樣 本,保留具有代表性的數據,將其劃分為訓練樣本和預測樣本;
4、 根據權利要求1所述的一種丹參注射液生產濃縮過程密度的軟測量方 法,其特征是,步驟(3)所述軟測量模型建立具體步驟為以A = (rg, 7},戶,丄)為自變量,Z)為因變量,使用訓練數據集(J^j,AJ建立模型,預測數據集P^』W, D,J進行模型評價,① 建立密度的MLR軟測量模型如下<formula>formula see original document page 3</formula>其中,e為誤差項。由訓練樣本計算得到回歸系數<formula>formula see original document page 3</formula>對預測集未知樣本的模型估計為<formula>formula see original document page 3</formula>② 建立密度的PCR軟測量模型如下<formula>formula see original document page 3</formula>其中,e為誤差項,r^為主成分分解<formula>formula see original document page 3</formula>得到的得分矩陣,計算可得主成分回歸系數<formula>formula see original document page 3</formula>對預測集未知樣本,首先計算其得分矩陣乙^e^A^』^^w,,然后由回歸系數計算模型估計值為<formula>formula see original document page 3</formula>③ 建立密度的PLS軟測量模型如下-<formula>formula see original document page 3</formula>其中,e為誤差項,7V^為主成分分解<formula>formula see original document page 3</formula>得到的得分矩陣,t^由主成分分解<formula>formula see original document page 3</formula>得到,計算可得回歸系數<formula>formula see original document page 3</formula>由主成分分解A,C4込/得可以建立A,與XM之間的關系<formula>formula see original document page 3</formula>對預測集未知樣本,由PLS回歸系數^^即可計算模型估計值為i^w—PW④ 將J^作為輸入,密度"作為輸出,使用人工神經網絡對訓練樣本建立密度 的軟測量模型,首先選擇網絡類型,常用的用于預測建模的神經網絡類型有 BP神經網絡、RBF神經網絡等,其次,確定網絡結構及傳遞函數。網絡層數"23,包括輸入層、隱層和輸 出層,其中,輸入層神經元數目即為A中變量的個數,輸出層神經元數為1 個,隱層數目及隱層包含的神經元個數通過不同的取值來選取最優值,輸入層、 中間隱層、輸出層之間的傳遞函數可選常用的函數、函數、 Gm/^/朋函數、門限函數等;最后,訓練網絡模型。隨機選取網絡的初始權值,設定學習速率和終止條 件,通過優化學習算法訓練得到網絡連接權值、閾值,使用訓練好的模型對預 測樣本進行評價。
5、根據權利要求1所述的一種丹參注射液生產濃縮過程密度的軟測量方法,其特征在于,步驟(4)所述對濃縮過程密度實時預測具體步驟為將模型應用于生產線,在線實時采集丹參注射液生產濃縮過程的過程變量 xm = (rg, r,,戶,丄),使用步驟(3)軟測量模型預測濃縮液的密度值,實時監 控濃縮過程進行質量控制。
全文摘要
本發明提供一種丹參注射液生產濃縮過程密度的軟測量方法,首先采集丹參濃縮過程中各傳感器及密度計的歷史數據,涉及濃縮液密度值和生產過程在線采集的傳感器數據;從各傳感器數據選取與密度相關程度較高的易于獲得的包括氣相溫度、液相溫度、壓力、濃縮液液位過程變量,篩選代表性的數據集;使用多變量分析方法,建立密度的軟測量模型;在線采集過程變量,使用軟測量模型對密度進行實時預測,控制濃縮過程。本發明針對丹參注射液生產的濃縮過程中密度難以實時監測的問題,提供了一種具有高精度的快速密度軟測量方法,充分利用了生產過程中得到的各傳感器獲取的歷史數據,有利于提高丹參注射液生產的質量控制。
文檔編號G05B19/048GK101673096SQ200910153700
公開日2010年3月17日 申請日期2009年10月26日 優先權日2009年10月26日
發明者方利民, 瞿海斌, 程翼宇 申請人:浙江大學