一種基于模式識別與譜圖映射的油品多類性質的檢測方法
【專利摘要】本發明是一種基于模式識別與譜圖映射的油品多類性質的檢測方法包括:步驟S1:采集未知油品樣本的近紅外光譜,并按照主成份分析法將近紅外光譜圖映射投影到訓練集樣本確定的特征平面上;步驟S2:根據未知油品樣本落在訓練集樣本的特征平面的區域位置,通過樸素貝葉斯分類器將未知油品樣本點歸到訓練集樣本的某類樣本中;步驟S3:在未知油品樣本點所在類樣本點中,選擇并在搜索半徑范圍內,搜索并找到未知油品樣本點的鄰近點;步驟S4:計算未知油品樣本點的鄰近點與該未知油品樣本點的馬氏距離,并將馬氏距離歸一化后作為權值,利用未知油品樣本點鄰近點的性質加權求和計算未知油品樣本點的油品性質,從而得到未知油品樣本點的多類性質。
【專利說明】一種基于模式識別與譜圖映射的油品多類性質的檢測方法
【技術領域】
[0001] 本發明屬于石油石化領域,涉及一種基于模式識別與譜圖映射的油品多類性質的 檢測方法。
【背景技術】
[0002] 汽油、柴油、原油的近紅外譜圖包括了豐富的油品族組成信息,油品的性質如辛烷 值、蒸汽壓、十六烷值、凝點、冷濾點、閃點、餾程等是其族組成綜合作用的結果,每個油品對 應的譜圖是唯一確定的。因此,傳統方法一般把近紅外譜圖特征化后與油品各個性質直接 關聯,采用多元線性回歸(MLR)、逐步回歸(SMR)、主成分分析(PCA)、主成分回歸(PCR)、偏 最小二乘法(PLS)、人工神經網絡(ANN)等方法建立油品性質的檢測模型。其所建立的模型 適應范圍窄、誤差較大,而且對各個性質單獨建立模型,導致建立和維護模型工作量大,很 難滿足工業現場長期、穩定運行的要求。
【發明內容】
[0003] (一)要解決的技術問題
[0004] 為了解決現有技術單獨建立油品每個性質的模型適應范圍窄、誤差較大,而且導 致建立和維護模型工作量大,很難滿足工業現場長期,不能滿足穩定運行的要求的石油石 化眾多先進控制實施的瓶頸問題,為此本發明的目的是提供一種油品性質準確、快速檢測、 基于模式識別與譜圖映射的油品多類性質的檢測方法。
[0005] (二)技術方案
[0006] 本發明是一種基于模式識別與譜圖映射的油品多類性質的檢測方法,實現該方法 的步驟包括:
[0007] 步驟S1 :采集某一未知油品樣本的近紅外光譜,并按照主成份分析法將近紅外光 譜圖映射投影到訓練集樣本確定的特征平面上;
[0008] 步驟S2 :根據未知油品樣本落在訓練集樣本的特征平面的區域位置,通過樸素貝 葉斯分類器將未知油品樣本點歸到訓練集樣本的某類樣本中;
[0009] 步驟S3 :在未知油品樣本點所在類樣本點中,選擇并在搜索半徑范圍內,搜索并 找到未知油品樣本點的鄰近點;
[0010] 步驟S4:計算未知油品樣本點的鄰近點與該未知油品樣本點的馬氏距離,并將馬 氏距離歸一化后作為權值,利用未知油品樣本點鄰近點的性質加權求和計算未知油品樣本 點的油品性質,從而得到未知油品樣本點的多類性質。
[0011] (三)有益效果
[0012] 本發明的方法只需建模一次,就能對模型包含的各類油品的所有性質同時檢測, 速度快。現有技術的油品性質檢測的主流方法是偏最小二乘法,為保證一定的準確度,它需 要對各個油品、各個性質單獨建模,這帶來了浩大的建模工作量與繁雜的模型維護工作量。 另外,本發明是基于局部樣本點對未知油品樣本點進行檢測,準確度也比傳統偏最小二乘 方法高很多。傳統偏最小二乘方法沒有考慮到模型的實時擴充,本發明在對未知油品樣本 進行檢測時,針對界外點的情況進行了相應考慮和處理,便于對模型進行實時擴充,使得模 型在應用中更進一步的完善,進一步提高模型的檢測精度。
【專利附圖】
【附圖說明】
[0013] 圖1示出本發明基于模式識別與譜圖映射的油品多類性質的檢測方法流程圖。
[0014] 圖la示出圖1中步驟S2的具體實施例中。
[0015] 圖2示出了本發明中未知油品樣本點落入特征平面上的情況。
[0016] 圖3示出對圖2中界外點的處理情況。
[0017] 圖4a示出本發明中對落入某類中的未知油品樣本點尋找鄰近點,是直接在所在 類中尋找鄰近點的示意圖。
[0018] 圖4b示出本發明中對落入某類中的未知油品樣本點尋找鄰近點,是先對未知油 品樣本所在的類進行致密化,然后再尋找鄰近點的示意圖;
[0019] 圖5示出本發明與傳統偏最小二乘模型對凝點性質檢測效果的比較。
【具體實施方式】
[0020] 下面結合附圖詳細說明本發明技術方案中所涉及的各個細節問題。應指出的是, 所描述的實施例僅旨在便于對本發明的理解,而對其不起任何限定作用。
[0021] 油品性質準確、快速檢測一直是石油石化眾多先進控制實施的瓶頸,針對該問題 本發明公開一種基于模式識別與譜圖映射的油品各個性質檢測方法包括譜圖映射、判別分 析、尋找未知油品樣本點的鄰近點、對未知油品樣本性質進行檢測過程,步驟如下:首先,對 未知油品樣本性質檢測時,先對未知油品樣本采集近紅外光譜,并投影到訓練集樣本按主 成份分析法、聚類法確定的特征平面上,然后根據未知油品樣本在投影平面上所在的位置 確定屬于哪個類樣本,并在所屬類樣本中找到鄰近點,按照鄰近點與未知油品樣本點不同 大小的馬氏距離用鄰近點的性質計算未知油品樣本的性質。
[0022] 圖1示出基于模式識別與譜圖映射的油品多類性質的檢測方法流程圖,實現該方 法的步驟包括:
[0023] 步驟S1 :采集某一未知油品樣本的近紅外光譜,并按照主成份分析法將近紅外光 譜圖映射投影到訓練集樣本確定的特征平面上;
[0024] 訓練集樣本特征平面的確定用到了 K-means聚類方法和評價聚類效果的統計 量-輪廓系數值。具體實施確定所述特征平面的步驟如下:
[0025] 步驟S11 :首先,對訓練集樣本做主成分分析后,選擇前5個載荷向量兩兩組合分 別作為平面的X軸和Y軸,依次將訓練集樣本投影到每個平面上;步驟S12 :依次在在每個 平面上應用K-means方法對樣本聚類。K-means聚類步驟如下:
[0026] 1、根據樣本在平面的分散情況隨機選取q個樣本點作為初始聚類重心叫,!!^..., IV q是樣本點的種類數;
[0027] 2、對每個樣本點X」,計算該樣本點與各個重心的距離d(Xj,π〇,找出最小距離,如 果 d(x」,1?) = min(d(Xj,1?)),i = 1,2, · · ·,q,1 < 1 < q,j = 1,2, · · ·,η,則把樣本點 Xj 歸入第1類,η是訓練集樣本點個數,i是樣本點,mi是初始聚類重心,j是訓練集樣本點,1 是樣本點的類別;
[0028] 3、重新計算每個聚類的重心;
[0029] 4、重復步驟2, 3,知道所有重心都不再變化。
[0030] 步驟S13 :依次對步驟S12訓練集樣本點聚類完成之后的樣本,根據下邊的公式 (1)計算每個點的輪廓系數值Sj :
[0031]
【權利要求】
1. 一種基于模式識別與譜圖映射的油品多類性質的檢測方法,其特征在于:實現該方 法的步驟包括: 步驟S1 :采集某一未知油品樣本的近紅外光譜,并按照主成份分析法將近紅外光譜圖 映射投影到訓練集樣本確定的特征平面上; 步驟S2 :根據未知油品樣本落在訓練集樣本的特征平面的區域位置,通過樸素貝葉斯 分類器將未知油品樣本點歸到訓練集樣本的某類樣本中; 步驟S3:在未知油品樣本點所在類樣本點中,選擇并在搜索半徑范圍內,搜索并找到 未知油品樣本點的鄰近點; 步驟S4:計算未知油品樣本點的鄰近點與該未知油品樣本點的馬氏距離,并將馬氏距 離歸一化后作為權值,利用未知油品樣本點鄰近點的性質加權求和計算未知油品樣本點的 油品性質,從而得到未知油品樣本點的多類性質。
2. 根據權利要求1所述基于模式識別與譜圖映射的油品多類性質的檢測方法,其特征 在于:所述確定訓練集樣本的特征平面包括如下步驟: 步驟S11 :在主成分分析中,選擇前5個載荷向量兩兩組合分別作為平面的X軸和Y軸, 依次將訓練集樣本投影到每個平面上; 步驟S12 :依次在步驟S11確定的每個平面上應用K-means聚類算法對樣本聚類; 步驟S13 :依次對步驟S12聚類后的樣本計算每個點的輪廓系數值; 步驟S14 :依次根據步驟S13計算出的每個點的輪廓系數值計算每個平面上所有樣本 集的平均輪廓系數值; 步驟S15 :選擇平均輪廓系數最大的平面作為訓練集的特征平面。
3. 根據權利要求1所述基于模式識別與譜圖映射的油品多類性質的檢測方法,其特征 在于:所述將未知油品樣本點歸到訓練集樣本的某類樣本包括如下步驟: 步驟S21 :如果未知油品樣本點落入某類樣本中,直接進入步驟S23,如果未知油品樣 本點落在所有類樣本之外,進入步驟S22 ; 步驟S22 :對未知油品樣本點進行計算,得到未知油品樣本的光譜殘差,用光譜殘差的 F檢驗判斷未知油品樣本是異常點還是正常點,如果是異常點,則剔除異常點,如果是正常 點,進入步驟S23 ; 步驟S23 :根據樸素貝葉斯分類器判斷未知油品樣本點的所屬類別。
4. 根據權利要求1所述基于模式識別與譜圖映射的油品多類性質的檢測方法,其特征 在于:所述搜索并找未知油品樣本點的鄰近點的步驟如下: 步驟S31 :如果未知油品樣本點所在類樣本點,具有多個類樣本點,進入步驟S32,如果 未知油品樣本點所在類樣本點,具有稀疏的類樣本點,則對類樣本點進行譜圖致密化處理, 再進入步驟S32 ; 步驟S32 :以未知油品樣本點位置為中心,以一條長軸和一條短軸為半徑確定一個橢 圓,找到落入橢圓中的點作為未知油品樣本點的鄰近點。
【文檔編號】G06K9/62GK104155245SQ201410374154
【公開日】2014年11月19日 申請日期:2014年7月31日 優先權日:2014年7月31日
【發明者】李澤飛, 寧書貴, 韓鳳義, 張洪強, 尚大軍, 王震, 張春剛, 王瑩, 杜中元 申請人:中國科學院自動化研究所