專利名稱::一種準連續方式的分光波長組合方法
技術領域:
:本發明涉及分光系統設計中的波長優選
技術領域:
,具體涉及一種準連續方式的分光波長組合方法。
背景技術:
:光譜分析是根據物質的光譜來鑒別物質及確定它的化學組成和含量的方法,由于其具有靈敏、迅速的優點。目前應用的光譜分析主要有中紅外光譜分析、紫外可見光譜分析、拉曼光譜分析和近紅外光譜分析(NIRS)等。特別是近紅外光譜分析技術以其簡便快速、非破壞性和易于實時分析等特點已廣泛應用于農業、食品、生物醫學、石油化工等領域。研制全波段通用型分析儀器的技術在國外已經比較成熟,但是有的儀器龐大,價格昂貴(全波段通用型近紅外分析儀器需要50-80萬元左右),因此較適合于實驗室分析,不適合在實際領域中推廣應用,研發低價格小型專用分析儀器(比如濾光片分立型近紅外分析儀器)是非常有必要的。但是,目前在分析模型的波長選擇、小型專用光譜儀器的分光系統設計等方面還存在困難,缺乏特定有效的分光波長組合方法。以近紅外光譜為例,近紅外光譜是通過對樣品進行直接測量得到的,對樣品不需要預處理,也不需要生化試劑,所以近紅外光譜的檢測對象是一個復雜的過程,又因為近紅外光譜重疊嚴重、平坦、沒有明顯的吸收峰,所以不能依靠直接觀察光譜的方法來選擇近紅外分光波長組合,只能通過對不同的波長組合分別建立定標模型,根據模型的預測效果才能夠做出判斷,選擇適合的波長組合。但是近紅外波段的波長數很多,近紅外的波段為780-2526nm,如果波長間隔是0.5nm,那么總波長數有3493個,如果是通過任意隨機組合再分別建模的方式篩選適合的波長,現有的計算機運算速度遠遠不能夠滿足。
發明內容本發明的目的在于克服現有技術的缺點與不足,提供一種準連續方式的分光波長組合方法,本發明方法具有計算量少、應用范圍廣、遴選自由度大、準確度高、效果好的優點,可以有效地篩選出分析模型的波長組合,為小型專用分析儀器中分光系統的設計提出有效的解決方案。本發明的目的通過下述技術方案實現一種準連續方式的分光波長組合方法,包括以下步驟Sl、測試樣品,得到光譜數據和樣品的參考化學值;選擇波長組合所屬的特定波段;S2、設波長組合的點數為N(即波長組合所含有的波長數量),設置波長組合點數的取值范圍,即Nmin《N《Nmax;設波長組合的間隔為G(即波長組合中相鄰兩波長在波段中間隔的波長數,如間隔的波長數為0,即表示波長組合中的波長為連續波段),設置波長組合間隔的取值范圍,即G邁in《G《G邁ax;其中N為正整數,Nmin>1,Nmax《f;G為整數,Gmin>0,Gmax《f_2;f是選定的波3段中含有的總波長數,通過下式計算總波長數=波段長度/波長間隔+1;上式中,波長間隔由用戶設置;S3、波長組合的點數(N)取最小值N^,波長組合的間隔(G)取最小值Gmin;S4、設波長組合的起點為B(即波長組合中第一個波長所在位置),設置波長組合的起點(B)從特定波段內的第一個波長依次變化到最后一個波長;查找所有可能的(B,N,G)參數組合,利用步驟S1的光譜數據和樣品的參考化學值,分別建立定標預測的數學模型;S5、判斷波長組合的間隔G<Gmax是否成立,若是,則增加波長組合的間隔(G),并返回S4,否則G=Gmin,并進入S6;S6、判斷波長組合的點數N<Nmax是否成立,若是,則增加波長組合的點數(N),并返回S4,否則進入S7;S7、求出所有數學模型的評價指標,根據評價指標對所有模型進行評價,選取最佳的數學模型(或者是最適用的數學模型),由最佳的數學模型相應的(B,N,G)參數組合得到對應的波長組合。為更好的實現本發明,所述步驟S7后還包括S8、對步驟S7選出的波長組合做光譜預處理,建立定標預測模型,進一步提高預測效果。優選的,所述S8中,對步驟S7選出的波長組合做光譜預處理,具體是指做光譜平滑化、多元散射校正(MSC)、正交信號校正(0SC)和/或小波變換(WT)等。優選的,所述步驟S1中選擇波長組合所屬的特定波段,該波段可以是全譜波段,也可以是某個部分波段,或者是某些部分波段的組合;選擇特定波段的考慮因素主要包括以下兩方面一是根據檢測對象和檢測指標所對應的物理、化學特征;二是根據分析儀器的限制條件,如根據分析儀器所采用不同的分光材料選擇不同的分光波段。優選的,步驟S2中,所述N^和G^和波長間隔由用戶根據檢測對象的特點、所要設計的分光系統的特點和計算機的運算速度來選取。優選的,步驟S4中,所述數學模型包括多元線性回歸(MLR)模型、偏最小二乘法(PLS)模型、人工神經網絡(ANN)模型中的一種或多種。優選的,步驟S7中,所述求出所有數學模型的評價指標,根據評價指標對所有模型進行評價,選取最佳的數學模型,具體是指,求出所有數學模型的三個評價指標預測均方根偏差(RMSEP)、相對預測均方根偏差(RRMSEP)和預測相關系數(Rp);選擇預測均方根偏差(RMSEP)和相對預測均方根偏差(RRMSEP)較小,預測相關系數(Rp)較大的模型;RMSEP和RRMSEP越小,RP越大,說明模型效果越好。本發明的工作原理本發明通過設置三個參數來選定波長組合波長組合的起點(B)、波長組合的點數(N)、波長組合的間隔(G)。根據分析對象的特點和計算機的運算速度來設置三個參數的取值范圍,將所有可能的(B,N,G)參數組合,即按照等間隔提取波長的方式從選定的波段內任何位置開始,以不同的波長組合間隔、點數來做任意波長組合,分別建立定標預測的數學模型,然后通過模型評價指標選取最適用的模型,根據該模型相應的(B,N,G)參數組合提取波長,即可得到對應的波長組合。本發明相對于現有技術具有如下的優點及效果第一、有效減少了計算量,減少了構建模型的工作量本發明的核心是有效地從全譜范圍內等間隔的提取少數信息波長點,然后通過組合建模并進行評價后,篩選出特定的波長組合,降低了構建模型的復雜度;同時,由于是選取等間隔的波長點,大大減少了計算量,有效的解決了目前在分析模型的波長選擇這一難題,為設計小型專用分析儀器提出有效的方案,并且更容易推廣應用。第二、實現效果好本發明的一種準連續方式的分光波長組合方法是從連續的光譜波段中等間隔提取波長組合構建模型,特別是建立MLR模型,由于是等間隔提取,所以克服了連續波段MLR模型通常會出現的由光譜共線性而造成模型效果下降這一缺點,而同時又保留了MLR模型簡單性的優點。第三、遴選自由度大,準確度高本發明準連續方式的分光波長組合方法中的三個重要參數(波長組合的起點B、波長組合的點數N、波長組合的間隔G)都是可變的,因此遴選自由度很大,范圍廣,可以覆蓋全部波段,提高了準確度,同時也是一種計算機能夠承受的大規模篩選方法。第四、利用本發明準連續方式的分光波長組合方法所得到光譜,它還可以同時應用很多光譜預處理方法,如光譜平滑化、多元散射校正(MSC)、正交信號校正(0SC)和/或小波變換(WT)等,然后建立定標預測模型,進一步提高預測效果。第五、應用范圍廣經過實驗證實,本發明準連續方式的分光波長組合方法應用于土壤養分(有機質、總氮)近紅外光譜分析、人體血清葡萄糖含量分析(近紅外光譜、FTIR/ATR光譜)、人體全血血紅蛋白分析(近紅外光譜、FTIR/ATR光譜)、甘蔗制糖業的原料及中間產品的糖分分析(近紅外光譜、FTIR/ATR光譜)等方面,均可得到比常規的光譜分析方法更優的預測效果。第六、準連續方式當波長組合的間隔大于0時,被采用的波長組合是嚴格的離散分立型的,當波長組合的間隔等于O時,被采用的波長組合形成了連續波段,因此,這種等間隔的波長組合方法實際也包含了連續波段的選擇。圖1是本發明一種準連續方式的分光波長組合方法的工作流程圖;圖2是實施例一中根據參數組合(B=6000cm—、N=5,G=2)選取的等間隔波長組合示意圖。具體實施例方式下面結合實施例及附圖,對本發明作進一步地詳細說明,但本發明的實施方式不限于此。實施例目前小型專用的近紅外分光系統是要求從這么多波長數中找出適當的幾個波長的組合,使得它的近紅外分析模型的預測效果好、穩定性高。近紅外分析模型的預測效果是通過實驗來證實的,一方面是樣品的近紅外光譜測量實驗(采用全波段通用型近紅外分析儀器),另一方面是采用常規生化方法對樣品的分析目標進行定量分析(作為參考化學5值)。首先把樣品劃分為定標集和預測集,利用上述這兩方面的數據建立定標預測模型,根據模型的效果篩選出特定的波長組合。以人體血清中葡萄糖含量的近紅外分析為例,通過血清樣品的葡萄糖常規分析方法測試和近紅外光譜測試,所得數據用于建立相應的定標預測模型,利用本發明找出血清葡萄糖所對應的特有分光波長組合。實施例中,光譜實驗儀器為美國Neco1et公司的5700傅里葉變換型近紅外光譜儀,探測器為銦鎵砷(InGaAs)。用光程2mm的石英比色皿測量光譜,掃描譜區10000cm—1-4000cm—、分辨率4cm—、掃描次數64。本例中,光譜波段的單位為波數(cm—0,光譜的波長間隔為1.93cm—、采用191份人體血清樣品,樣品葡萄糖的含量由全自動生化分析儀測定作為光譜分析的參考化學值。全體化學值范圍3.53mmol/L-6.15mmol/L,均值為4.90mmol/L,標準偏差為0.59mmol/L。按照大約2:1的比例把全部樣品劃分為定標集(131個樣品)和預測集(60個樣品)。如圖1所示,利用本發明準連續方式的分光波長組合方法找出血清葡萄糖所對應的特有分光波長組合SI、通過上面對樣品進行的紅外光譜測量和樣品的生化定量分析,得到相應的光譜數據和樣品的參考化學值后,選擇波長組合所屬的特定波段考慮到在5200cm—\4000cm—1附近吸收強烈,光譜能量低,信息含量差,噪音大,把這兩段(吸光度高于2的波段)光譜數據扣除,選擇的特定波段為10000cn^-5300cm—1和4920cm—1-4160cm—1兩段的組合.設波長間隔為1.93cm—、計算特定波段的總波長數總波長數=波段長度/波長間隔+1,則選擇的特定波段共有2831個波長。S2、根據人體血清葡萄糖的光譜吸收特點和所要設計的近紅外分析儀器的特點,設波長組合的點數為N(即波長組合所含有的波長數量),設置波長組合點數的取值范圍,即1《N《100;設波長組合的間隔為G(即波長組合中相鄰兩波長在波段中間隔的波長數),設置波長組合間隔的取值范圍,即0《G《249;S3、波長組合的點數(N)取最小值1,波長組合的間隔(G)取最小值0;S4、設置波長組合的起點(B)從特定波段內的第一個波長(10000cm—0依次變化到最后一個波長(4160cm—1);查找所有可能的(B,N,G)參數組合,利用它們的光譜數據和樣品的參考化學值,分別建立定標預測的MLR模型;S5、判斷波長組合的間隔G<249是否成立,若是,則增加波長組合的間隔G,并返回S4,否則G=O,并進入S6;S6、判斷波長組合的點數N<100是否成立,若是,則增加波長組合的點數N,并返回S4,否則進入S7;S7、求出所有MLR模型的評價指標,根據模型評價指標對所有模型進行評價,選取最佳的模型和相應的(B,N,G)參數組合,同時得到對應的波長組合;其中模型效果的評價指標主要有三個預測均方根偏差(RMSEP)、相對預測均方根偏差(RRMSEP)和預測相關系數(RP)。S8、對于已經選出的等間隔的波長組合,進一步用光譜平滑化方法做光譜預處理,然后建立定標預測模型,進一步提高預測效果。為了更好的說明本實施例,如圖2所示,上述步驟S4查找到的其中一個參數組合(B=6000cm—、N=5,G=2)中,在波段為10000cm—'-5300cm—1和4920cm—^4160cm—1兩段的組合,由于波長間隔為1.93cm—、所以波長組合的起點從6000cm—1開始,以間隔的波長數為2等間隔提取5個波長,最后得到的等間隔波長組合是6000cm—1,5994cm—1,5988cm—1,5982cm—1,5976cm—、利用這些波長的光譜數據和樣品的參考化學值來建立MLR模型。目前偏最小二乘(PLS)方法是一種應用廣泛而有效的近紅外光譜分析的建模方法,我們用這種方法來建立全譜段的PLS模型,將等間隔波長組合MLR模型與全譜段PLS模型的預測效果作比較,見表一。表一<table>tableseeoriginaldocumentpage7</column></row><table>從表一可以看出,由本發明參數組合(B=5753cm—1,N=22,G=33)建立的MLR模型,其預測均方根偏差(RMSEP)為O.326mmol/L,預測相關系數(RP)為0.841,相對預測均方根偏差(RRMSEP)為6.69%,結果表明,將本發明分光波長組合方法應用于人體血清葡萄糖含量的近紅外光譜分析,只采用22個波長點進行分光組合優化,就得到比全譜段PLS模型(采用2831個波長點)更高的預測精度,同時降低了模型的復雜性,為設計小型專用近紅外分析儀器提供重要依據。根據參數組合(B=5753cm—1,N=22,G=33)建立的等間隔移動窗口MLR模型,所得到的22個波長組合分別是5753cm—'、5818cm—1、5884011—1、5949011—1、6015011—1、6081011—\6146cm—1、6212cm—\6277cm—\6343cm—丄、6408cm—、6474cm—\6540cm—\6605cm—\6671cm—1、6736cm—1、6802cm—1、6867cm—1、6933cm—1、6999cm—1、7064cm—1和7130cm—1。上面是以人體血清中葡萄糖含量的近紅外分析為例,介紹了本發明的效果,實際上,我們在其他的多個實驗中也得到了證實,如土壤養分(有機質、總氮)近紅外光譜分析、人體血清中葡萄糖含量FTIR/ATR光譜分析、人體全血中血紅蛋白分析(近紅外光譜、FTIR/ATR光譜)、甘蔗制糖業的原料及中間產品的糖分分析(近紅外光譜、FTIR/ATR光譜)等方面,均可得到比常規的光譜分析方法更優的預測效果。本實施例以近紅外分析為例,但本發明的實施方式并不受所述實施例的限制,其他的任何未背離本發明的精神實質與原理下所作的改變、修飾、替代、組合、簡化,均應為等效的置換方式,都包含在本發明的保護范圍之內。權利要求一種準連續方式的分光波長組合方法,其特征在于,包括以下步驟S1、測試樣品,得到光譜數據和樣品的參考化學值;選擇波長組合所屬的特定波段;S2、設波長組合的點數為N,設置波長組合中點數的取值范圍,即Nmin≤N≤Nmax;設波長組合的間隔為G,設置波長組合中間隔的取值范圍,即Gmin≤G≤Gmax;其中N為正整數,Nmin≥1,Nmax≤f;G為整數,Gmin≥0,Gmax≤f-2;f是選定的波段中含有的總波長數,通過下式計算總波長數=波段長度/波長間隔+1;上式中,波長間隔由用戶設置;S3、N取最小值Nmin,G取最小值Gmin;S4、設波長組合的起點為B,設置B從特定波段內的第一個波長依次變化到最后一個波長;查找所有B、N和G的參數組合,利用S1的光譜數據和樣品的參考化學值,分別建立定標預測的數學模型;S5、判斷波長組合的間隔G<Gmax是否成立,若是,則增加G,并返回S4,否則G=Gmin,并進入S6;S6、判斷波長組合的點數N<Nmax是否成立,若是,則增加N,并返回S4,否則進入S7;S7、求出所有數學模型的評價指標,根據評價指標對所有模型進行評價,選取最佳的模型,由最佳模型相應的B、N和G參數組合得到對應的波長組合。2.根據權利要求1所述準連續方式的分光波長組合方法,其特征在于,所述步驟S7后還包括58、對步驟S7選出的波長組合做光譜預處理,建立定標預測模型。3.根據權利要求2所述準連續方式的分光波長組合方法,其特征在于,所述S8中,對步驟S7選出的波長組合做光譜預處理,具體是指做光譜平滑化、多元散射校正、正交信號校正和/或小波變換處理。4.根據權利要求1或2所述準連續方式的分光波長組合方法,其特征在于,所述步驟Sl中選擇波長組合所屬的特定波段,該波段是全譜波段、或者是某個部分波段、或者是某些部分波段的組合。5.根據權利要求1或2所述準連續方式的分光波長組合方法,其特征在于,步驟S2中,所述Nmax、Gmax和波長間隔由用戶根據檢測對象的特點、所要設計的分光系統特點和計算機的運算速度來選取。6.根據權利要求1或2所述準連續方式的分光波長組合方法,其特征在于,步驟S4中,所述數學模型包括多元線性回歸模型、偏最小二乘法模型、人工神經網絡模型中的一種或多種。7.根據權利要求1或2所述準連續方式的分光波長組合方法,其特征在于,步驟S7中,所述求出所有數學模型的評價指標,根據評價指標對所有模型進行評價,選取最佳的模型,具體是指,求出所有數學模型的三個評價指標預測均方根偏差、相對預測均方根偏差和預測相關系數;選擇預測均方根偏差和相對預測均方根偏差都較小,預測相關系數較大的模型。全文摘要本發明公開了一種準連續方式的分光波長組合方法,包括以下步驟S1、測試樣品光譜數據和參考化學值;選擇波段;S2、設置波長組合點數N的取值范圍,設置波長組合間隔G的取值范圍;S3、N=Nmin,G=Gmin;S4、設置波長組合起點B從波段內的第一個波長依次變化到最后一個波長;查找所有B、N和G的參數組合,建立模型;S5、判斷G<Gmax是否成立,若是,則增加G,并返回S4,否則G=Gmin,并進入S6;S6、判斷N<Nmax是否成立,若是,則增加N,并返回S4,否則進入S7;S7、求出所有數學模型的評價指標,選取最佳的模型,得到對應的波長組合。本發明具有計算量少、遴選自由度大、效果好的優點。文檔編號G01N21/25GK101788459SQ20101011115公開日2010年7月28日申請日期2010年2月8日優先權日2010年2月8日發明者潘濤申請人:暨南大學