用于山核桃新鮮度檢測的傳感器陣列優化方法
【專利摘要】本發明公開了一種用于山核桃新鮮度檢測的傳感器陣列優化方法,該方法首先根據山核桃揮發性氣體的GC?MS分析結果選擇氣敏傳感器;接著根據傳感器陣列在所述揮發性氣體中的響應信號挑選傳感器構成初始陣列;通過提取保留傳感器的平均微分值、穩定值及面積值構成初始特征矩陣;然后以特征值為對象,對不同新鮮度山核桃的特征值數據進行均值分析;其次對特征值進行變異系數分析;再以平方Euclidean距離為度量標準,對特征值進行聚類分析,并對各類特征值進行相關性分析;最后對特征矩陣進行方差膨脹因子分析來獲得最終優化特征矩陣及傳感器陣列。本發明依據非搜索性特征選擇策略進行優化,盡可能挑選出有效信息更多的特征值,有利于提高模式識別的正確率。
【專利說明】
用于山核桃新鮮度檢測的傳感器陣列優化方法
技術領域
[0001] 本發明設及食品檢測領域,尤其設及一種用于山核桃新鮮度檢測的傳感器陣列優 化方法。
【背景技術】
[0002] 山核桃因其豐富的營養及獨特的口感深受消費者喜歡,然而其內在油脂易受水 分、光照、氧氣等環境因素的影響而氧化酸敗,從而影響其口感。因此,進行山核桃新鮮度檢 測具有一定的實際意義。
[0003] 山核桃的氣味是其內部果仁和果殼散發的揮發性成分,外在氣味的變化從一定程 度上反映了其內部新鮮度的變化。現有的山核桃新鮮度檢測方法主要為感官評定、微生物 檢測、理化指標測定等,然而上述方法存在主觀性或檢測成本高且耗時的缺點,使得其不能 很好的應用于山核桃新鮮度的快速檢測。電子鼻(人工嗅覺系統)是一種模仿動物嗅覺系統 的仿生儀器,利用具有交叉敏感性的氣敏傳感器構成傳感器陣列對氣體進行檢測,得到指 紋圖譜來進行識別和量化被檢測氣體,可W實現快速準確的山核桃新鮮度檢測。
[0004] 由于山核桃揮發性氣體成分復雜,且不同新鮮度山核桃間的差異性小,為實現準 確的區分不同新鮮度的山核桃,在電子鼻的應用中,需要對傳感器陣列進行篩選優化。在減 少傳感器數量,降低設備研制成本的同時,有效降低樣品數據維度且提高了識別精度,有利 于電子鼻在山核桃新鮮度檢測中的獲得更好的應用。
[0005] 現有的電子鼻傳感器陣列優化方法主要W傳感器個體為對象,即提取傳感器某一 個特征值來表征傳感器的響應信號,采用捜索性或非捜索性特征選擇策略進行優化。如公 布號為CN 104483460 A的《用于肉類檢測的傳感器陣列優化方法》的實施例中,其提取穩定 狀態下40~45秒的信號作為該傳感器的特征值進行相應的優化;王智凝《電子鼻傳感器陣 列優化對豬肉新鮮度法的檢測》一文中,其提取傳感器信號的相對變化值來表征傳感器并 依據非捜索性策略進行優化;周海濤《勁酒電子鼻鑒別分析中傳感器陣列優化方法研究》一 文中其提取傳感器信號的平均微分值構成響應的特征矩陣,并W此進行優化。雖然上述實 例均在實際應用中取得了不錯的區分預測效果,然而由于不同傳感器的不同特征值在模式 識別過程中均具有包含有效信息的可能,且其對模式識別的貢獻率也不盡相同,因此上述 實例得到的傳感器陣列往往為較佳的優化陣列,還存在一定的優化空間。故在傳感器陣列 優化的實際應用中,應盡可能多地提取傳感器響應信號的有效特征值來構成特征矩陣,并 采用捜索性或非捜索性特征選擇策略來選擇出能盡可能多表征傳感器有效信息且對模式 識別貢獻率大的特征值,來獲取最佳的傳感器陣列。
【發明內容】
[0006] 針對現有技術的不足,本發明提供一種用于山核桃新鮮度檢測的傳感器陣列優化 方法,通過篩選優化傳感器陣列,實現在有效提高對不同新鮮度山核桃檢測精度的前提下, 精簡傳感器數量,降低數據維度。
[0007]本發明考慮到不同傳感器的不同特征值在模式識別中均具有包含有效信息的可 能,故W特征值為對象,采用非捜索性特征性選擇方法來選取盡可能多包含有效信息的特 征值,并根據特征值矩陣確定傳感器陣列。具體包括W下步驟:
[000引步驟1:氣敏傳感器的選擇
[0009] 選擇新鮮的山核桃,對山核桃揮發性氣體進行GC-MS分析;根據GC-MS分析結果,針 對揮發性氣體中的主要成分,選擇具有敏感性的氣敏傳感器;
[0010] 步驟2:初始傳感器陣列的構建
[0011] 采用步驟1選擇的傳感器對不同新鮮度的山核桃頂空氣體進行檢測,根據傳感器 對山核桃揮發性氣體的響應曲線,選擇對不同新鮮度山核桃揮發性氣體均具有響應的傳感 器構成初始傳感器陣列;步驟3:構造初始特征矩陣
[0012] 對初始傳感器陣列中各傳感器的響應曲線采用平均微分值法、穩定值法、面積值 法進行特征提取,構成初始特征矩陣;
[OOU] 步驟4:均值分析
[0014] W步驟3提取得到的特征值為對象,進行均值分析,根據優化判別標準,對不同相 對變化率下限值情況下得到的特征矩陣進行模式識別,選取最佳區分效果所對應的相對變 化率下限值,剔除小于相對變化率下限值的特征值;
[0015] 步驟5:變異系數分析
[0016] 計算步驟4保留下來的特征值的變異系數,剔除變異系數大于0.15的特征值;
[0017] 步驟6:基于聚類分析的相關性分析
[0018] 將步驟5保留下來的特征值,W平方Euclidean距離為度量標準,對特征值進行聚 類分析;計算各特征值的Rr值,并根據優化判別標準,對不同Rr上限值情況下得到的特征矩 陣進行模式識別,選取最佳區分效果所對應的Rr上限值,剔除小于化上限值的特征值,W完 成相關性分析;
[0019] 步驟7:方差膨脹因子分析
[0020] 對經步驟6分析保留下來的特征值進行方差膨脹因子分析,剔除VIF值大于10或 VIF值大于20的特征值;并用優化判別標準進行驗證,確定最佳VIF上限值來剔除相應特征 值W降低特征矩陣多重共線性;
[0021] 步驟8:確定優化傳感器陣列
[0022] 根據步驟7保留下來的特征值,選擇對應的傳感器,從而獲得優化后的傳感器陣 列;
[0023] 進一步地,所述平均微分值法為提取響應曲線上相連兩采樣點間直線斜率的平均 值;所述穩定值法為提取傳感器與氣體充分反應后響應曲線的穩定值;所述面積值法為提 取響應曲線與X軸所組成區域的面積。
[0024] 進一步地,所述優化判別標準為主成分分析法。
[0025] 進一步地,所述Rr值為特征值與其他類所有特征值的相關系數絕對值累加和,其 表達式為:
[0026]
[0027]其中P為類數,N為各類中特征值個數,Rmj為該特征值與第m類第j個特征值之間的 系數。
[0028] 與現有技術相比,本發明的有效益果:常用的陣列優化方法多為W傳感器為個體, 采用捜索性或非捜索性特征選擇策略進行優化,往往忽略了傳感器不同特征值在模式識別 中包含有效信息的不同,往往不能獲取較好的優化陣列。本發明基于非捜索性特征選擇算 法W特征值為對象進行優化,更加合理有效,能得到較佳的傳感器陣列。
【附圖說明】
[0029] 圖1為本發明的流程圖;
[0030] 圖2為傳感器的響應曲線圖;
[0031] 圖3為優化前后不同陳化時間山核桃PCA二維得分圖;
[0032] 圖4為均值分析PCA二維得分圖;
[0033] 圖5為聚類分析冰柱圖。
【具體實施方式】
[0034] 下面結合附圖和實施例,對本發明的【具體實施方式】作進一步詳細描述。W下實施 例用于說明本發明,但不用來限制本發明的范圍。
[00對實施例:
[0036] 如圖1所示,本發明W W下具體實施例來進一步說明該發明的實施過程。
[0037] 本實施例中,采用人工陳化山核桃代替自然陳化山核桃。經驗證,新鮮山核桃在30 °C和35%相對濕度環境存放10天和20天后的各項理化指標與在4°C環境下儲藏1年和2年山 核桃的各項理化指標幾乎相同。故挑選大小、顏色大致一致的山核桃置于溫度為35°C、相對 濕度為30%的恒溫恒濕箱中,每隔5天取出一批作為一種新鮮度的山核桃樣品,共計取出3 批,再加上新鮮的山核桃,共計4批山核桃,分別為新鮮、陳化5天、陳化10天、陳化15天。進行 實驗時,從4批樣品中,隨機抽取30組,一共120組,每組20顆。
[0038] 步驟1:氣敏傳感器的選擇
[0039] 根據胡玉霞等人于2011年發表的"頂空固相微萃取與氣質聯用分析山核桃香氣成 分"一文,針對山核桃GC-MS分析結果中含量較多的醒類、締燒控類、醇類、酸類氣體選擇13 只金屬氧化物傳感器,各傳感器具體型號及檢測范圍如表1所示。
[0040] 表1.初選傳感器及其性能
[0041]
[0042]
[0043] 步驟2:初始傳感器陣列的構建
[0044] 本實施例中,采用上述傳感器對山核桃頂空氣體進行檢測,其典型的傳感器響應 曲線如圖2所示。從圖中可知,傳感器TGS2442、TGS813、TGS816響應不明顯,且對于不同陳化 時間的山核桃,各傳感器的響應趨勢大致相同,且傳感器TGS2442、TGS813、TGS816響應均不 明顯,故予W剔除,并選擇剩余的10只傳感器組成初始傳感器陣列。
[0045] 步驟3:構造初始特征矩陣
[0046] 本實施例中,對傳感器陣列的響應曲線采用不同的特征提取方法進行特征提取。 所采用的提取方法如下:(1)平均微分值:相連兩采樣點間直線斜率的平均值;(2)穩定值: 傳感器與氣體充分反應后的響應值。(3)面積值:傳感器響應曲線與X軸所組成區域的面積。 每個測試樣品共提取10 X 3個特征參數,構成30維特征矩陣。特征值和傳感器對應關系如表 2所示。所有測試樣本的特征參數構成120 X 30的特征空間。
[0047] 表2特征編號和傳感器編號的對應關系
[ ^AAyIOl
[(K)加]步驟4:均值分析
[0051 ]本實施例中,采用PCA分析法獲得二維得分圖,初始特征矩陣的二維得分圖,如圖, 3a所示。從圖中可知,陳化10天與陳化15天山核桃存在部分重疊,且4批陳化山核桃的類內 矩較大。W陳化10天于陳化15天山核桃的數據進行均值分析來剔除差異性較小的特征值。 均值分析結果如表3所示。為獲取較好的優化結果,WPCA得分圖的區分結果為判定標準,進 行實際驗證,驗證結果如圖4所示。經驗證,剔除相對變化率小于5 %的特征值,即剔除特征 編號為胖1、51、52、胖5、55、胖6、口7、胖7、57、口8、58、39、胖10、510的特征值。
[0052]表3.陳化10天與陳化15天山核桃樣本特征值均值的相對變化率
[0化3]
[0化4]
[0055] 步驟5:變異系數分析
[0056] 本實施例中,分別計算陳化10天和陳化15天兩批樣品中各特征值的變異系數來分 析特征值的重復性。分析結果如表4所示。故剔除特征編號為P6、PlO的特征值。
[0057] 表4.陳化10天與陳化15天山核桃樣本特征值的變異系數
[0059] 步驟6:基于聚類分析的相關性分析
[0060] 本實施例中,通過SPSS對保留特征值W平方Euclidean距離為度量標準進行聚類 分析,分析結果冰柱圖,如圖5所示。通過實際嘗試的方式,確定將特征值分為6類。并計算各 特征值的Rr,結果如表5所示。故優先考慮第一類中Rr值小于8的特征值,即特征值編號為化、 W8、W9;優先考慮第二類中Rr值小于6的特征值,即特征值編號為?2、?3、?5、?9;其余各類特征 值均保留。
[0061 ] 表5.各特征值的Rr值 L0063」步驟7:方差膨脹因子分析
[0064] 本實施例中,通過SPSS對經步驟6分析保留的特征值進行方差膨脹因子分析,分析 結果如表6所示。并根據表6,剔除VIF值大于20的特征值來實現最終優化,即剔除特征編號 為W2、S3、^的特征值。
[0065] 表6.各特征值方差膨脹因子
[0066]
[0067] 步驟8:確定優化傳感器陣列
[0068] 本實施例中,根據上述步驟的優化,最終得到由特征編號為P2、P3、W4、S4、PS、S6、W8、 P9的特征值構成的特征矩陣,并根據該矩陣確定了最終優化傳感器陣列。其對應關系如表7 所示。
[0069] 表7.優化陣列中傳感器型號、特征值編號及特征值之間的對應關系
[0071]優化后特征矩陣的PCA二維得分圖,如圖3b所示。對比可知,優化后的特征矩陣前 兩個主成分的貢獻率分別為:76. Ol %、14.60%,較優化前的66.36%、13.45 %有所提高。陳 化10天和陳化15天山核桃也得到了明顯的區分,同時各類山核桃的聚集度也明顯提高。
【主權項】
1. 一種用于山核桃新鮮度檢測的傳感器陣列優化方法,其特征在于,該方法包括以下 步驟: 步驟1:氣敏傳感器的選擇 選擇新鮮的山核桃,對山核桃揮發性氣體進行GC-MS分析;根據GC-MS分析結果,針對揮 發性氣體中的主要成分,選擇具有敏感性的氣敏傳感器; 步驟2:初始傳感器陣列的構建 采用步驟1選擇的傳感器對不同新鮮度的山核桃頂空氣體進行檢測,根據傳感器對山 核桃揮發性氣體的響應曲線,選擇不同新鮮度山核桃揮發性氣體均具有響應的傳感器構成 初始傳感器陣列; 步驟3:構造初始特征矩陣 對初始傳感器陣列中各傳感器的響應曲線采用平均微分值法、穩定值法、面積值法進 行特征提取,構成初始特征矩陣; 步驟4:均值分析 以步驟3提取得到的特征值為對象,進行均值分析,根據優化判別標準,對不同相對變 化率下限值情況下得到的特征矩陣進行模式識別,選取最佳區分效果所對應的相對變化率 下限值,剔除小于相對變化率下限值的特征值; 步驟5:變異系數分析 計算步驟4保留下來的特征值的變異系數,剔除變異系數大于0.15的特征值; 步驟6:基于聚類分析的相關性分析 將步驟5保留下來的特征值,以平方Euclidean距離為度量標準,對特征值進行聚類分 析;計算各特征值的Rr值,并根據優化判別標準,對不同Rr上限值情況下得到的特征矩陣進 行模式識別,選取最佳區分效果所對應的Rr上限值,剔除小于Rr上限值的特征值,以完成 相關性分析; 步驟7:方差膨脹因子分析 對經步驟6分析保留下來的特征值進行方差膨脹因子分析,剔除VIF值大于10或VIF值 大于20的特征值;并用優化判別標準進行驗證,確定最佳VIF上限值來剔除相應特征值以降 低特征矩陣多重共線性; 步驟8:確定優化傳感器陣列 根據步驟7保留下來的特征值,選擇對應的傳感器,從而獲得優化后的傳感器陣列。2. 根據權利要求1所述的用于山核桃新鮮度檢測的傳感器陣列優化方法,其特征在于, 所述平均微分值法為提取響應曲線上相連兩采樣點間直線斜率的平均值;所述穩定值法為 提取傳感器與氣體充分反應后響應曲線的穩定值;所述面積值法為提取響應曲線與X軸所 組成區域的面積。3. 根據權利要求1所述的用于山核桃新鮮度檢測的傳感器陣列優化方法,其特征在于: 所述優化判別標準為主成分分析法。4. 根據權利要求1所述的用于山核桃新鮮度檢測的傳感器陣列優化方法,其特征在于: 所述Rr值為特征值與其他類所有特征值的相關系數絕對值累加和,其表達式為:其中P為類數,N為各類中特征值個數,Rmj為該特征值與第m類第j個特征值之間的系數。
【文檔編號】G01N30/02GK105954412SQ201610301315
【公開日】2016年9月21日
【申請日】2016年5月7日
【發明人】王俊, 徐克明
【申請人】浙江大學