本發明涉及一種基于近紅外的煙葉焦油解析方法,屬于煙草工業領域。
背景技術:
:焦油是卷煙成品的一種重要致香物質,其是卷煙香氣的重要組成部分之一;但是卷煙焦油在煙氣的形成中也會對人體形成一定的危害,一般認為卷煙煙氣中的有害成分主要集中在焦油中,國際上一般以焦油量的高低來評價卷煙的安全性,因此焦油檢測在煙草成品的檢測中起到非常重要而且必要的作用。在傳統的焦油檢測中,一般采取抽煙機的檢測形式;抽煙機檢測一般耗時比較長,對卷煙質量的尤其是卷煙的安全性指標的評價比較滯后;更重要的是,在抽煙機的檢測中,抽煙機的檢測結果受卷煙濾嘴,卷煙濾紙等卷煙輔料的影響較大。技術實現要素:本發明的目的在于提供一種基于近紅外的煙葉焦油檢測方法,以快速無損的檢測和評價煙葉中的焦油量。本發明采用了如下技術方案:一種基于近紅外的煙葉焦油解析方法,其特征在于,包括如下步驟:步驟一:獲取不同品種的成品煙絲樣本,掃描煙絲樣本的近紅外光譜,獲取近紅外光譜信息;步驟二:將對應的近紅外光譜信息關聯到抽煙機給出的焦油標準值數據,并建立焦油模型;步驟三:設定校正集樣本數量m組,通過光譜的差異性篩選檢驗集樣本數量n組;步驟四:通過半重數采樣法、蒙特卡洛交叉驗證進行異常樣本的剔除;步驟五:使用一階導數對光譜進行預處理;步驟六:使用遺傳算法篩選光譜波長;步驟七:運用GAPLS(基于遺傳算法的偏最小二乘法)對波長篩選后的光譜與對應的焦油數據進行建模,構建基于近紅外光譜的焦油定量模型;PLS的算法如下:式中,X為校正子集組成的吸光度矩陣,Y為校正子集相對應的化學值矩陣,tk(nX1)為X的第k個主因子的得分,pk(1Xm)為X矩陣的第k個主因子的載荷;f為主因子數,即:T和U分別為X和Y矩陣的得分矩陣,P和Q分別為X和Y矩陣的載荷矩陣,EX和EY分別為X和Y的PLS擬合殘差矩陣。進一步,本發明的基于近紅外的煙葉焦油解析方法,還可以具有這樣的特征:步驟七中,在校正過程中,最初是忽略殘差矩陣E,求出中間的參數后,再返回求殘差矩陣;具體過程如下:X=TPT,左邊乘TT然后右乘P得:T=XP/(PTP);Y=UQT,左邊乘UT然后兩邊同除以QT得:U=Y/QT;取濃度陣Y的某一列作為U的起始迭代值,以U代替T,計算W,方程為:X=UWT,其解為:WT=UTX/(UTU),W為吸光度陣X的權重向量;對權重歸一化后求吸光度陣X的因子得分T,方程為:X=TWT,其解為:T=XW/WTW;以T代替U計算濃度陣Y的載荷Q值,其方程為:Y=TQT;其解為:QT=TTY/(TTT);對載荷Q歸一化后求濃度陣Y的因子得分U,方程為:Y=UQT;其解為:U=YQ/QTQ;再以此U代替T返回最開始計算WT,由WT計算T1,如此反復迭代,若T已收斂(‖T1-T2‖≤10-6‖T1‖),T1為轉入計算收斂后的T,否則返回繼續求吸光度陣X的權重W;收斂后的T求吸光度陣X的載荷向量P,其方程為:X=TPT;其解為:PT=TTY/(TTT);對載荷P歸一化后求標準化X的因子得分T=T‖P‖;標準化權重向量W=W‖P‖;計算T與U之間的內在關系B=UTT/(TTT);再計算殘差陣EX=X-TPT;EY=Y-BTQT;最后以EX代替X,EY代替Y,返回最開始的步驟即求吸光度陣X的權重向量W,以此類推,求出X、Y的主因子的W、T、P、U、Q、B,最后通過交互檢驗法Q2h≤0.0975確定最佳主因子數f時迭代停止。進一步,本發明的基于近紅外的煙葉焦油解析方法,還可以具有這樣的特征:步驟三中,首先將所有的焦油光譜組成一個光譜陣,選取前面m組為校正子集,剩下的n組為驗證集樣本。進一步,本發明的基于近紅外的煙葉焦油解析方法,還可以具有這樣的特征,還包括:步驟八:對步驟七得到的模型進行外部驗證。進一步,本發明的基于近紅外的煙葉焦油解析方法,還可以具有這樣的特征:步驟四中,隨機將焦油的驗證集樣本進行預測誤差計算,正常焦油樣本的預測誤差較小,其均值在零附近,呈正態分布趨勢,異常樣本數據奇異的預測誤差則較大,遠離零點,以焦油預測樣本的均值絕對值為X軸,標準差為Y軸作圖,判斷異常光譜和異常化學值焦油樣本并進行剔除。進一步,本發明的基于近紅外的煙葉焦油解析方法,還可以具有這樣的特征:步驟五中,使用一階導數對光譜進行預處理的具體過程是:使用移動窗口對每個校正集的焦油樣本移動平滑,過濾噪聲。進一步,本發明的基于近紅外的煙葉焦油解析方法,還可以具有這樣的特征:步驟六中,使用遺傳算法篩選光譜波長包括如下步驟:①對焦油校正集樣本的波長進行編碼,形成二進制字符;②將校正集樣本波長進行初始化,隨機選擇80%為初始種群;③選擇近紅外定量回歸模型的預測標準偏差為適應度函數;④選擇近紅外焦油樣本波長點適應度高的個體保留到下一代一起搜索新的波長點組,根據通過適應度函數的波長點出現的頻率來選擇建模的波長點;⑤用留一驗證的方法通過驗證集的預測標準偏差來確定波長點選擇的數目以及主成分數。發明的有益效果本發明的基于近紅外的煙葉焦油解析方法,將焦油量的化學值與近紅外光譜聯系起來,并建立焦油模型,然后通過步驟四到七的處理,使得通過近紅外光譜對焦油量的測定更加準確。附圖說明圖1是近紅外光譜圖;圖2是化學值分布圖;圖3是異常光譜分布圖;圖4是一階導數預處理圖;圖5是波長選擇圖;圖6是根據圖5中選擇的波長點對應的光譜圖;圖7是真實值與預測值對比圖;圖8是真實值與絕對誤差圖;圖9是整體流程圖。具體實施方式以下結合附圖來說明本發明的具體實施方式。圖9是本發明的基于近紅外的煙葉焦油檢測方法的流程圖,如圖9所示,本發明的基于近紅外的煙葉焦油檢測方法包括如下步驟:1)在A卷煙廠獲取具有代表性的75組不同品種的成品煙絲樣本,通過磨粉后掃描得到近紅外光譜,見附圖1,獲取與其相對應的近紅外光譜信息。2)將對應的近紅外光譜信息關聯到抽煙機給出的焦油標準值數據,見附圖2,并建立焦油模型。3)設定校正集樣本數量60組,檢驗集樣本數量15組。具體過程:首先將所有的焦油光譜組成一個光譜陣,選取前面60組為校正子集,剩下的為驗證集樣本數,相對應的選取濃度陣對應的校正集和驗證集。4)通過半重數采樣法、蒙特卡洛交叉驗證法,進行異常光譜分析和異常樣本化學值分析,并剔除異常光譜和異常化學值樣本;具體過程是:隨機將焦油的驗證集樣本進行預測誤差計算,正常焦油樣本的預測誤差一般較小,其均值在零附近,呈正態分布趨勢,異常樣本數據奇異的預測誤差則一般較大,遠離零點,但是焦油樣本光譜奇異點預測誤差分布的方差一般較大,即不同性質的樣本具有不同的分布,以焦油預測樣本的均值絕對值為X軸,標準差為Y軸作圖,可以得到附圖3所示的散點圖,根據圖可以判斷出異常光譜和異常化學值焦油樣本并進行剔除。5)利用一階導數(SG)對光譜進行預處理,其具體過程:使用移動窗口寬度為13對每個校正集的焦油樣本逐步移動平滑,過濾掉無用的噪聲,保留有效的光譜信息,如附圖4;6)利用遺傳算法(GA)進行波長篩選;具體過程:①對焦油校正集樣本的波長進行編碼,形成二進制字符;②將校正集樣本波長進行初始化,隨機選擇80%為初始種群;③選擇近紅外定量回歸模型的預測標準偏差為適應度函數④選擇近紅外焦油樣本波長點適應度高的個體保留到下一代一起搜索新的波長點組,根據通過適應度函數的波長點出現的頻率來選擇建模的波長點;⑤用留一驗證的方法通過驗證集的預測標準偏差來確定波長點選擇的數目以及主成分數。圖5中有三根橫向的直線,自下而上,第一根直線代表選取合適的適應度函數,選擇波長點數高于這個函數的波長點數保留到下一代一起搜索新的波長點組,第二根根據通過適應度函數的波長點出現的頻率來選擇建模的波長點,第三根用留一驗證的方法通過驗證集的預測標準偏差來確定波長點選擇的數目。圖6是根據選擇的波長點數對應的光譜圖。7)運用GAPLS對波長篩選后的光譜與對應焦油數據進行建模;構建基于近紅外光譜的焦油定量模型;見附圖7、附圖8;具體過程:用偏最小二乘法對校正集以及相對應的濃度集進行回歸,采用10個最佳主因子進行建模,可以得到驗證集的模型預測濃度,他們的平均絕對誤差可以通過焦油標準值減去相對應模型預測濃度的絕對值,再求其平均值得到,平均相對誤差可以通過平均絕對誤差分別除以每個驗證集的焦油標準值得到,相關系數可以通過焦油標準值和模型預測值得曲線擬合得到。PLS的算法如下:X=TPT+EX=Σk=1ftkpkT+EX;Y=UQT+EY=Σk=1fukqkT+EY]]>式中,X為校正子集組成的吸光度矩陣,Y為校正子集相對應的化學值矩陣,tk(nX1)為X的第k個主因子的得分,pk(1Xm)為X矩陣的第k個主因子的載荷;f為主因子數,即:T和U分別為X和Y矩陣的得分矩陣,P和Q分別為X和Y矩陣的載荷矩陣,EX和EY分別為X和Y的PLS擬合殘差矩陣。在校正過程中,最初是忽略殘差矩陣E,求出中間的參數后,再返回求殘差矩陣;具體過程如下:X=TPT,左邊乘TT然后右乘P得:T=XP/(PTP);Y=UQT,左邊乘UT然后兩邊同除以QT得:U=Y/QT;取濃度陣Y的某一列作為U的起始迭代值,以U代替T,計算W,方程為:X=UWT,其解為:WT=UTX/(UTU),W為吸光度陣X的權重向量;對權重歸一化后求吸光度陣X的因子得分T,方程為:X=TWT,其解為:T=XW/WTW;以T代替U計算濃度陣Y的載荷Q值,其方程為:Y=TQT;其解為:QT=TTY/(TTT);對載荷Q歸一化后求濃度陣Y的因子得分U,方程為:Y=UQT;其解為:U=YQ/QTQ;再以此U代替T返回最開始計算WT,由WT計算T1,如此反復迭代,若T已收斂(‖T1-T2‖≤10-6‖T1‖),T1為轉入計算收斂后的T,否則返回繼續求吸光度陣X的權重W;收斂后的T求吸光度陣X的載荷向量P,其方程為:X=TPT;其解為:PT=TTY/(TTT);對載荷P歸一化后求標準化X的因子得分T=T‖P‖;標準化權重向量W=W‖P‖;計算T與U之間的內在關系B=UTT/(TTT);再計算殘差陣EX=X-TPT;EY=Y-BTQT;最后以EX代替X,EY代替Y,返回最開始的步驟即求吸光度陣X的權重向量W,以此類推,求出X、Y的主因子的W、T、P、U、Q、B,最后通過交互檢驗法Q2h≤0.0975確定最佳主因子數f時迭代停止。8)對模型進行外部驗證;表1模型的外部驗證表:9)其它化學計量學方法對比列表表2本發明的方法與其它化學計量學方法的對比表方法絕對誤差相對誤差相關系數11.4106357140.1280020440.7391623421.2046557660.109664550.71972844930.8412718890.0774421410.6874861440.8442666670.080178015-0.47882612150.6746269280.0640666570.63370481461.4524546130.135665914-0.313321007當前第1頁1 2 3