專利名稱:基于子空間重合判斷的混合光譜模式識別方法
技術領域:
本發明涉及一種化學分析和化學計量方法,特別是一種通過對比分析信號、判斷被分析樣品中物質種類歸屬的基于子空間重合判斷的混合光譜模式識別方法,用于物質定性儀器的定性功能拓展。
背景技術:
聚類與分類方法統稱為模式識別方法,模式識別方法是化學計量學研究的重要內容。其中根據測定數據完成物質的定性判斷是典型的模式分析方法應用。光譜模式識別方法是用于判斷物質屬性最廣泛的模式識別方法,同種物質在同類光譜中具有相同或相近的響應值,通過對比已知物和未知物的光譜可以判定物質的種類和屬性。現有的光譜模式識別方法包括峰比對、空間距離、夾角余弦和相關系數等方法。其中,峰比對方法是將物質測量圖譜的波峰或波谷位置進行對比,在紅外、拉曼、核磁共振、質譜等出峰穩定并且顯著的圖譜方法中,峰比對方法可以有效判斷物質所含的成分或結構情況,通過推理或對比,完成判定。但是對于紫外、近紅外等光譜,由于出峰平緩,峰型不典型,另外,即使是出峰顯著的各種圖譜方法中,在混合體系中出峰可能出現的重疊和覆蓋,導致峰值偏移、峰型改變和并合等情形出現,基于峰比對的判斷存在限制。而判斷峰型不顯著的圖譜較多采用基于空間距離的“相似性”判斷,另外夾角余弦和相關系數也是常用的“相似性”度量指標,但是對于混合體系,由于組成含量的變化會導致峰型出現較大變化,因而導致“相似性”判斷不可行。
發明內容
本發明要解決的技術問題是提供一種能夠滿足不典型出峰,且適用于多組分體系中物質定性分析的基于子空間重合判斷的混合光譜模式識別方法。解決上述技術問題的基本原理如下
多組分體系的光譜若采用張量空間描述,每一種物質的光譜可用空間中的一個向量表示,向量的長度(即模量)代表物質含量,而不同光譜特征對應了空間中不同的方向,同一物質的向量在空間中是相同的。如果屬于同一物質的光譜,不論物質量如何,其各自對應的向量夾角等于零,這實際就是夾角余弦和相關系數方法的原理。但是在多種物質混合情況下, 所得到的光譜向量與純物質光譜的夾角與體系的物質含量有關,因此,對于混合體系,夾角余弦和相關系數方法不適用。本發明采用子空間夾角判斷空間中向量的歸屬,實現混合體系光譜中所包含物質的定性。由于在多向量構成的空間中,向量α與其他向量構成的子空間B的夾角定義為a 與召中所有向量力之間的最小銳角
也就是在通過α的空間B法平面內,法平面與空間B的交線和α構成的銳角;或表述為“凈信號”所處向量與α的補角(參見圖2所示)。 根據子空間夾角的定義,如果一個向量處在其所處的子空間內,那么該向量與該子空間的夾角等于零。例如兩個不平行向量可以張成一個平面,此平面就是一個二維子空間,由這兩個向量構成的任意一個向量都處在該平面中,與該平面的夾角為零。本發明基于如下關鍵判斷
待定性混合光譜和標準樣品光譜數據庫中所包含的物質各自構成集合,如果兩個集合是真子集,那么它們之間的子空間夾角等于零,但由于受到噪聲和誤差的影響,該子空間夾角實際是一個很小的正數(即設定值A)。解決上述技術問題的技術方案是一種基于子空間重合判斷的混合光譜模式識別方法,該方法是將物質定性儀器測量單元測量到的待定性混合光譜向量,在物質定性儀器的數據信息處理單元中計算其與已知的多個標準樣品光譜構成的子空間夾角,通過排列、 篩選,判斷出符合夾角小于含有最少標準樣品數目的子空間,若該子空間與待定性混合光譜向量所處的子空間嚴格重合,該子空間內所包含的標準樣品組成即為待定性混合光譜所含的物質成分組成,從而實現待定性混合光譜中所包含的各種物質的定性識別,識別結果作為物質定性儀器的分析結果輸出。本發明的進一步技術方案是該方法的具體步驟包括
Sl 通過物質定性儀器的測量單元測量待定性混合光譜S,調用物質定性儀器存儲單元預存儲的含有已知光譜的標準樣品光譜數據庫L ;
S2:在物質定性儀器的數據信息處理單元中用插值法統一測量所得的待定性混合光譜 S及標準樣品光譜數據庫L的數據,即是將物質定性儀器測量單元輸出的光譜響應值插值到與標準圖譜具有相同的波長或波數刻度;
S3:計算待定性混合光譜S與標準樣品光譜數據庫L之間的子空間夾角θ ; S4:判斷子空間夾角θ是否大于設定值Α,如果是,則進入步驟S5;如果否,則進入步驟S6 ;
S5:判定為待定性混合光譜S中包含了標準樣品光譜數據庫L以外的物質,需擴充標準樣品光譜數據庫L才能完成判斷,操作結束;
56判定為待定性混合光譜S所包含的物質完全存在于標準樣品光譜數據庫L內,進入步驟S7 ;
57依次從標準樣品光譜數據庫L中移出其中的一種物質光譜;
S8:再計算待定性混合光譜S與標準樣品光譜數據庫L之間的子空間夾角θ ; S9:再次判斷子空間夾角θ是否大于設定值Α,如果子空間夾角變大,超出設定值Α,則進入步驟S10;如果子空間夾角θ未大于設定值Α,則直接進入步驟S12;
510判定為待定性混合光譜S中含有標準樣品光譜數據庫L被移出的光譜物質,并將該光譜在標準樣品光譜數據庫L中的序號記錄在數組I中;
511將被移出的光譜物質再移回標準樣品光譜數據庫L,然后再循環執行步驟S7順序移出下一種光譜,直至標準樣品光譜數據庫L中的所有光譜均被執行操作;
512判定為待定性混合光譜S中未含有標準樣品光譜數據庫L被移出的物質,然后再循環執行步驟S7順序移出下一光譜;
513判斷標準樣品光譜數據庫L中的所有光譜是否被執行操作,如果否,則循環執行步驟S7操作;如果是,則進入步驟S14 ;
514讀取數組I中記錄的序號,在標準樣品光譜數據庫L中找出對應的物質,該物質即為待定性混合光譜S中所包含的物質,將識別結果輸出到物質定性儀器的分析結果顯示單元,完成定性;
上述各步驟中所述的設定值A為0. 05 0. 1弧度。由于采用上述技術方案,本發明之基于子空間重合判斷的混合光譜模式識別方法與現有的光譜模式識別方法相比,具有以下有益效果
采用本發明方法是將光譜視為向量,計算待定性混合光譜向量與標準樣品光譜向量張成的子空間夾角,通過排列、篩選,判斷出與待定性混合光譜向量所在的子空間嚴格重合的標準樣品光譜向量張成的子空間,混合光譜中所含的各物質即是標準樣品空間所包含的各物質,從而實現待定性混合光譜中所包含的各種物質定性。因此,在采用本發明的方法進行判斷時,在子空間夾角最小的集合中一定包含了混合物中的所有物質;當子空間未能包含混合物中所有物質時,夾角會出現陡升;而子空間包含混合物所有物質的同時又包含其他物質時,不會導致空間夾角的明顯變化,所以空間夾角最小的集合中元素最少的子集就是所需定性的物質。本發明未采用通常的特征峰參數進行定性判別,因此,能夠滿足不典型出峰的情況,適用于多組分體系中物質定性分析,并且具備有與被物含量組成無關、操作簡便的優點。下面,結合附圖和實施例對本發明之基于子空間重合判斷的混合光譜模式識別方法的技術特征作進一步的說明。
圖1 實施例一所述本發明之基于子空間重合判斷的混合光譜模式識別方法的流程框圖2:子空間夾角示意圖, 圖3:子空間夾角計算示意圖, 圖4 多維空間夾角算法的流程框圖,
圖5 圖9 實施例一所述混合物直接與純物質圖譜的比對圖,其中 圖5 混合物和甲醇光譜的對比圖; 圖6 混合物和乙醇光譜的對比圖; 圖7 混合物和乙二醇光譜的對比圖; 圖8 混合物和丙二醇光譜的對比圖; 圖9 混合物和正丁醇光譜的對比圖。
具體實施例方式實施例一
一種用于判斷混合物物質組成的基于子空間重合判斷的混合光譜模式識別方法,該方法是將物質定性儀器輸出的光譜視為向量,不同物質混合成的混合體系的光譜是各個純物質光譜的混合,混合光譜對應的向量是純物質向量的向量和,存在于各純物質向量張成的子空間內,與該子空間的夾角為零;先將物質定性儀器測量單元測量到的待定性混合光譜向量,在物質定性儀器的數據信息處理單元中計算其與已知的多個標準樣品光譜構成的子空間夾角,通過排列、篩選,判斷出符合夾角小于含有最少標準樣品數目的子空間,若該子
5空間與待定性混合光譜向量所處的子空間嚴格重合,該子空間內所包含的標準樣品組成即為待定性混合光譜所含的物質成分組成,從而實現待定性混合光譜中所包含的各種物質的定性識別,識別結果作為物質定性儀器的分析結果輸出;其具體步驟如下(參見圖1)
51通過物質定性儀器——光譜儀的測量單元測量待定性混合光譜S,調用光譜儀存儲單元預存儲的含有η種已知光譜的標準樣品光譜數據庫L,所述的η種已知光譜分別為 丙二醇、乙二醇、乙醇、甲醇和正丁醇拉曼光譜;
52在物質定性儀器的數據信息處理單元中用插值法統一測量所得的待定性混合光譜 S及標準樣品光譜數據庫L的數據,即是將物質定性儀器測量單元輸出的光譜響應值插值到與標準圖譜具有相同的波長或波數刻度;
S3:計算待定性混合光譜S與標準樣品光譜數據庫L之間的子空間夾角θ ;
S4:判斷子空間夾角θ是否大于設定值Α,如果是,則進入步驟S5;如果否,則進入步驟S6 ;
55判定為待定性混合光譜S中包含了標準樣品光譜數據庫L以外的物質,需擴充標準樣品光譜數據庫L才能完成判斷,操作結束;
56判定為待定性混合光譜S所包含的物質完全存在于標準樣品光譜數據庫L內,并取 i=n,進入步驟S7 ;
57將標準樣品光譜數據庫L中的第i種光譜依次移出;
S8:再計算待定性混合光譜S與標準樣品光譜數據庫L之間的子空間夾角θ ;
S9:再次判斷子空間夾角θ是否大于設定值Α,如果子空間夾角變大,超出設定值Α,則進入步驟S10;如果子空間夾角θ未大于設定值Α,則直接進入步驟S12;
510判定為待定性混合光譜S中含有標準樣品光譜數據庫L被移出的第i種光譜物質,并將該光譜在標準樣品光譜數據庫L中的序號記錄在數組I中;
511將被移出的第i種光譜物質再移回標準樣品光譜數據庫L,然后再循環執行步驟 S7順序移出下一種光譜,即i=i_l,直至標準樣品光譜數據庫L中的所有光譜均被執行操作;
512判定為待定性混合光譜S中未含有標準樣品光譜數據庫L被移出的物質,然后再循環執行步驟S7順序移出下一光譜,即i=i_l ;
513判斷標準樣品光譜數據庫L中的所有光譜是否被執行操作,即判斷i是否等于0, 如果否,則循環執行步驟S7操作,直至標準樣品光譜數據庫L中的所有光譜均被執行操作; 如果是,則進入步驟S14;
514讀取數組I中記錄的序號,在標準樣品光譜數據庫L中找出對應的物質,該物質即為待定性混合光譜S中所包含的物質(參見附表一),即混合物實際由乙醇、乙二醇、丙二醇按體積比5:4:1構成;將識別結果輸出到光譜儀的分析結果顯示單元,完成定性;
上述各步驟中所述的設定值A為0. 08弧度。在上述步驟S2中,所述的插值法為已知技術,這里不再作詳細說明。在上述步驟S3和S8中,所述子空間夾角的計算過程也為已知技術,其主要內容如下(參見圖3,以向量對平面的夾角為例)
向量α和平面B的夾角為α在B上的垂直投影與α的夾角,即Z C0H,通過求取CH 可得到該角的正弦值;在B上建立直角坐標OE丄0D,將α投影到OD得0G,那么α -OG=CG ;再將CG投影到 OE 得到 OF 或 GH,那么 CH=CG-GH。其中,多維空間夾角的算法步驟如下(參見圖4)
5301將子空間B用奇異值分解為正交描述;
5302得到與其維數相等的η個正交向量{bl,…,bi,…,bn};
5303將向量α定義為被投影的初始向量α 1 ;
5304將所有的向量的模量調整為1 ;
5305從i=l開始;
5306將被投影向量、投影到其中一個正交向量bi上,用ai減去投影值,得到下一個被投影向量 ai+Ι,即 α i+l=a i-bi(bi,α i);
5307重復步驟S306進行下一個向量投影;
5308直到所有的正交向量都完成投影計算,即i > η ;
5309得到α與B子空間夾角的正弦值αη/α 1,反正弦即可計算出該子空間夾角θ。作為本實施例一的一種變換,所述的設定值A根據儀器的實際噪聲強度設定,一般取0. 05 0. 1弧度。作為本實施例一的又一種變換,所述的標準樣品光譜數據庫L不限于僅含有丙二醇、乙二醇、乙醇、甲醇、正丁醇光譜的數據庫,而是根據實際需要包含有其余物質光譜和其他類型光譜的數據庫,例如紅外、近紅外、拉曼、紫外等多種類型的分子光譜。在本實施例一中,本發明還將待定性混合光譜S即混合物直接與純物質圖譜比對(參見圖5 圖9),在圖5中,實線為甲醇波形,虛線為混合物波形;圖6中,實線為乙醇波形,虛線為混合物波形;圖7中,實線為乙二醇波形,虛線為混合物波形;圖8中,實線為丙二醇波形,虛線為混合物波形;圖9中,實線為正丁醇波形,虛線為混合物波形;
由上述圖5 圖9可以看出,混合物與乙醇的各個響應峰位置基本對應,因此可以判斷出混合物中含有乙醇;而混合物與乙二醇相比,各個特征可以大致對應,但最大響應峰向后遷移,不能斷定乙二醇存在;混合物與丙二醇的對應關系很差,無法判斷是否含有丙二醇, 因此特征峰響應判斷的方法不適于判斷混合物所含物質的定性。而采用本發明的方法進行判斷,在子空間夾角最小的集合中一定包含了混合物中的所有物質;當子空間未能包含混合物中所有物質時,夾角會出現陡升;而子空間包含混合物所有物質的同時又包含其他物質時,不會導致空間夾角的明顯變化。所以空間角最小的集合中元素最少的子集就是本問題的解,即混合物中包含了 乙醇、乙二醇和丙二醇(見附表一)。
附表一混合物拉曼光譜與純物質圖譜的不同組合構成的子空間的夾角
權利要求
1.一種基于子空間重合判斷的混合光譜模式識別方法,其特征在于該方法是將物質定性儀器測量單元測量到的待定性混合光譜向量,在物質定性儀器的數據信息處理單元中計算其與已知的多個標準樣品光譜構成的子空間夾角,通過排列、篩選,判斷出符合夾角小于含有最少標準樣品數目的子空間,若該子空間與待定性混合光譜向量所處的子空間嚴格重合,該子空間內所包含的標準樣品組成即為待定性混合光譜所含的物質成分組成,從而實現待定性混合光譜中所包含的各種物質的定性識別,識別結果作為物質定性儀器的分析結果輸出。
2.根據權利要求1所述的基于子空間重合判斷的混合光譜模式識別方法,其特征在于該方法的具體步驟包括Sl 通過物質定性儀器的測量單元測量待定性混合光譜S,調用物質定性儀器存儲單元預存儲的含有已知光譜的標準樣品光譜數據庫L ;S2:在物質定性儀器的數據信息處理單元中用插值法統一測量所得的待定性混合光譜 S及標準樣品光譜數據庫L的數據,即是將物質定性儀器測量單元輸出的光譜響應值插值到與標準圖譜具有相同的波長或波數刻度;S3:計算待定性混合光譜S與標準樣品光譜數據庫L之間的子空間夾角θ ;S4:判斷子空間夾角θ是否大于設定值Α,如果是,則進入步驟S5;如果否,則進入步驟S6 ;S5:判定為待定性混合光譜S中包含了標準樣品光譜數據庫L以外的物質,需擴充標準樣品光譜數據庫L才能完成判斷,操作結束;56判定為待定性混合光譜S所包含的物質完全存在于標準樣品光譜數據庫L內,進入步驟S7 ;57依次從標準樣品光譜數據庫L中移出其中的一種物質光譜;58再計算待定性混合光譜S與標準樣品光譜數據庫L之間的子空間夾角θ ;S9:再次判斷子空間夾角θ是否大于設定值Α,如果子空間夾角變大,超出設定值Α,則進入步驟S10;如果子空間夾角θ未大于設定值Α,則直接進入步驟S12;510判定為待定性混合光譜S中含有標準樣品光譜數據庫L被移出的光譜物質,并將該光譜在標準樣品光譜數據庫L中的序號記錄在數組I中;511將被移出的光譜物質再移回標準樣品光譜數據庫L,然后再循環執行步驟S7順序移出下一種光譜,直至標準樣品光譜數據庫L中的所有光譜均被執行操作;512判定為待定性混合光譜S中未含有標準樣品光譜數據庫L被移出的物質,然后再循環執行步驟S7順序移出下一光譜;513判斷標準樣品光譜數據庫L中的所有光譜是否被執行操作,如果否,則循環執行步驟S7操作;如果是,則進入步驟S14 ;514讀取數組I中記錄的序號,在標準樣品光譜數據庫L中找出對應的物質,該物質即為待定性混合光譜S中所包含的物質,將識別結果輸出到物質定性儀器的分析結果顯示單元,完成定性;上述各步驟中所述的設定值A為0. 05 0. 1弧度。
全文摘要
一種基于子空間重合判斷的混合光譜模式識別方法,涉及化學分析和化學計量領域,該方法是將物質定性儀器測量單元測量到的待定性混合光譜向量,在物質定性儀器的數據信息處理單元中計算其與已知的多個標準樣品光譜構成的子空間夾角,通過排列、篩選,判斷出符合夾角小于含有最少標準樣品數目的子空間,若該子空間與待定性混合光譜向量所處的子空間嚴格重合,該子空間內所包含的標準樣品組成即為待定性混合光譜所含的物質成分組成,從而實現待定性混合光譜中所包含的各種物質的定性識別,識別結果作為物質定性儀器的分析結果輸出。本發明能夠滿足不典型出峰波形,具有與被物含量組成無關、操作簡便的優點,適用于光譜分析中多組分體系中的物質定性。
文檔編號G01N21/25GK102262054SQ20111018841
公開日2011年11月30日 申請日期2011年7月6日 優先權日2011年7月6日
發明者姚志湘, 粟暉 申請人:廣西工學院