一種用近紅外光譜技術預測火炬松松脂產量的方法
【專利摘要】本發明公開了一種利用近紅外光譜技術預測火炬松松脂產量的方法,該方法是采集火炬松生長錐木芯校正集樣品的近紅外光譜數據,對火炬松單株產脂量進行常規測定,將采集得到的校正集樣品光譜數據進行光譜預處理后與火炬松單株產脂量的常規測定數據相關聯,用偏最小二乘法結合交互驗證法擬合建立校正模型;利用外部驗證集樣品對模型進行驗證,獲得預測模型;近紅外光譜掃描待測樣品,將光譜特征代入預測模型,獲得火炬松松脂產量預測值。本發明方法可在火炬松原料林的育種過程中實現對松樹產脂量的快速、準確、無損地測定,預測結果準確可靠,為高產優質火炬松產脂種質資源的快速篩選提供有力科學依據,為高產優質人工脂用原料林的營建提供參考。
【專利說明】一種用近紅外光譜技術預測火炬松松脂產量的方法
【技術領域】
[0001] 本發明涉及一種基于光譜技術預測松樹松脂產量的方法,具體是一種利用近紅外 光譜技術預測火炬松松脂產量的方法。
【背景技術】
[0002] 松脂(Pine oleoresin)是由松屬樹種樹脂道內的分泌脂細胞分泌產生的一種天 然樹脂,是松樹生理代謝的次生產物,主要由松香和松節油組成,其中松節油含量的高低是 衡量松脂品質優劣的主要指標之一。松脂作為一種重要的工業原料,經過簡單處理后可以 加工成松香、松節油等產品,松香和松節油是我國重要的林產化工產品之一,也是重要的出 口產品,更是我國特色的資源產品,可廣泛地應用于造紙、肥皂、飲食、橡膠、塑料、油漆、火 柴、醫藥、農藥、炸藥、紡織、印染等多個領域。
[0003] 近年來由于受到自然災害、大量的砍伐松樹、過度違規采脂等多種因素的影響,我 國松樹資源正在呈現逐年下降的趨勢,適宜并具備采脂條件的松樹資源越來越少,為解決 市場對松脂和松節油供不應求的現狀,發展人工脂用原料林是推動我國松香產業和松節油 產業發展的關鍵途徑和必然趨勢。然而不同樹種、相同樹種的不同類型產脂量差異很大,并 且產脂量還受到較高的遺傳力控制,因此,選育高產脂和高松節油含量的優良松樹種質資 源并加以繁殖利用已迫在眉睫。
[0004] 在高產優質人工脂用原料林育種中,人工割脂法是測定松樹產脂量的傳統方法, 但這一傳統的方法必須破壞樹體或樣品本身,存在成本高、效率低、時間長、誤差大、具破壞 性、易產生污染和重復性差等缺點,不能滿足生產和科研的需要。因此,亟需建立一種分析 松樹產脂量的方法,在原料林的育種過程中實現對松樹產脂量的快速、準確、無損地測定, 從而為高產優質火炬松產脂種質資源的快速篩選提供有力的科學依據,為高產優質人工脂 用原料林的營建提供參考。
[0005] 近年來近紅外光譜技術在林業方面也得到了廣泛的應用,如在木材性質的分析、 林副產品的品質檢測、林木育種材料的篩選和林木種質資源的鑒定等方面,但利用近紅外 光譜技術來預測火炬松松脂產量方面的研究未見報道。
【發明內容】
[0006] 本發明的目的是提供一種用近紅外光譜技術預測火炬松松脂產量的方法,該方法 是通過建立火炬松松脂產量的預測模型,可在火炬松原料林的育種過程中實現對火炬松松 脂產量的快速、準確、無損地預測。
[0007] 本發明所采用的技術方案如下:一種預測火炬松松脂產量的方法,包括以下步 驟: (1)建立校正模型:選擇火炬松單株作為建模研究對象,采用人工割脂法對火炬松單株 產脂量進行常規測定;采集火炬松單株的生長錐木芯樣品,測定生長錐木芯樣品的近紅外 光譜數據;確定校正集和外部驗證集的樣本集;用化學計量學軟件將采集得到的校正集樣 品光譜數據進行光譜預處理和多元回歸統計分析,將預處理后的光譜數據與產脂量的常規 測定相關聯,采用偏最小二乘法結合交互驗證法將預處理后的光譜數據和產脂量數據擬合 起來建立校正模型; (2) 模型的驗證:利用未參與建模的外部驗證集樣品對所建校正模型進行檢驗,S卩:以 近紅外光譜儀掃描驗證集樣品,獲得近紅外光譜圖,將近紅外光譜特征數據輸入校正模型 獲得預測結果,將預測結果和采用人工割脂法對該驗證集樣品測定得到的常規測定值進行 多元回歸統計分析,應用內部交叉驗證法和外部驗證法對模型進行驗證和評價; (3) 用模型來預測待測的火炬松松脂產量:在預測時,對于待測的火炬松,采集其生長 錐木芯樣品,以近紅外光譜儀掃描其近紅外光譜圖,將采集到的特征光譜數據輸入到模型 中,得到該待測火炬松松脂產量預測值; 所述近紅外光譜數據的采集條件如下:測樣方式為漫反射,光斑直徑為3. 5cm,光 譜掃描范圍為950nm-1650nm,分辨率為5nm,環境溫度控制在22-23°C,環境濕度控制在 30%-70%,每一個木芯樣品都采用掃描2次和重復裝樣2次取平均的光譜收集方式; 所述光譜預處理是采用一階導數FD+平滑SG+多元散色校正MSC的組合法。
[0008] 所述近紅外光譜數據進行預處理和多元回歸統計分析優選采用化學計量學軟件 The unscramble 9· 8 進行。
[0009] 所述步驟(1)在利用校正集建立模型時,需對校正集中的異常樣品進行剔除,異常 樣品的確定方法是:利用化學計量學軟件The Unscrambler 9. 8中的杠桿值影響圖和學生 化殘差功能對異常樣品進行判斷,如果一個樣品相對于校正集中其它樣品同時具有較高的 杠桿值和學生化殘差,則確定該樣品為異常樣品,將其從校正集中剔除,之后再利用其余的 樣品通過偏最小二乘法PLS重新建模,如此反復上述操作,直至將所有異常樣品剔除完畢 得到理想的模型為止。
[0010] 所述火炬松單株及火炬松生長錐木芯樣品的采集方法是:在1(Γ15年生火炬松人 工林中選取胸徑16cm以上、所處環境條件基本一致、生長狀況良好、均勻分布的單株火炬 松,在樹高1~1. 5m處使用12mm的樹木生長錐從西南方向垂直于樹干鉆取生長錐木芯,直至 鉆通整個樹干,取出整條木芯后,立即用保鮮膜密封,裝入密封袋并依樹上所做記號進行標 記,待所有木芯樣品鉆取完畢后,在最短時間內放入-20° C冰箱內保存備用。
[0011] 所述生長錐木芯在樣品在進行近紅外光譜測定前的處理方法是:從密封袋中取出 整條生長錐木芯,在其髓心處將其切為兩段,然后選擇東北方向的半段木芯,分別在其首尾 處截斷成:Γ5 cm的兩小段木芯,放入改進的樣品杯,在近紅外光譜儀所處的實驗室放置24 小時以上,再進行近紅外光譜數據的采集。
[0012] 所述人工割脂法對火炬松單株的產脂量進行測定,具體方法是:在樹高1-1. 5m處 使用采脂刀按照生產上的松脂采集規范,采用下降法"V"字型進行采割,每隔一天采割一 次,雨天除外,連續割脂3(Γ35天,在除去比較大的雜物后,對入選火炬松單株所產的松脂 樣品分別進行稱重測量,記錄數據,如此操作連續測定4次,將這4次產脂量測定值的總和 作為火炬松單株的產脂量。
[0013] 本發明具有如下有益效果:本發明提出了采用近紅外光譜技術來實現對火炬松松 脂產量的預測并提供了預測模型和模型的建立方法,克服了現有火炬松松脂產量測定存在 的難題,該方法可在火炬松原料林的育種過程中實現對松樹產脂量的快速、準確、無損地測 定,模型的預測結果準確可靠,從而為高產優質火炬松產脂種質資源的快速篩選提供有力 的科學依據,為高產優質人工脂用原料林的營建提供參考。
[0014] 說明書附圖 圖1火炬松生長錐木芯樣品的NIR原始光譜圖 圖2校正集火炬松單株產脂量分布圖 圖3未剔除異常樣品前火炬松產脂量PLS建模結果 圖4學生化殘差圖 圖5 Y的杠桿值影響圖 圖6 X-Y的杠桿值影響圖 圖7剔除異常樣品后火炬松產脂量PLS建模結果 圖8火炬松產脂量近紅外模型的RMSEV隨主成分數變化圖 圖9火炬松產脂量近紅外校正模型 圖10外部驗證集火炬松產脂量預測結果 圖11子代測定林中270個單株的生長錐木芯光譜圖 圖12子代測定林中270個單株產脂量預測結果的分布直方圖 圖13火炬松核心群體41個單株的生長錐木芯光譜圖 圖14火炬松核心群體41個單株產脂量預測結果的分布直方圖。
【具體實施方式】
[0015] 以下結合實施例來進一步解釋本發明,但實施例并不對本發明做任何形式的限 定。
[0016] 本實施例在建立模型時所使用的火炬松松脂樣品取自:廣東省樂昌市龍山林場的 火炬松人工試驗林;采用以下步驟實現本發明: 1、建立校正模型: (1)火炬松單株及火炬松生長錐木芯樣品的采集:在10-15年生火炬松人工林中選取 胸徑16cm以上、所處環境條件基本一致、生長狀況良好、均勻分布的110株火炬松單株,在 樹高1. 3m處使用12_的樹木生長錐從西南方向垂直于樹干鉆取生長錐木芯,直至鉆通整 個樹干,取出整條木芯后,立即用保鮮膜密封,裝入密封袋并依樹上所做記號進行標記,待 所有木芯樣品鉆取完畢后,在最短時間內放入-20° C冰箱內保存備用。
[0017] (2)采用人工割脂法對入選的火炬松單株產脂量進行常規測定:在樹高1. 3m處使 用采脂刀按照生產上的松脂采集規范,采用下降法"V"字型進行采割,每隔一天采割一次, 雨天除外,連續割脂35天,在除去比較大的雜物后,對入選火炬松單株所產的松脂樣品分 別進行稱重測量,記錄數據,如此操作連續測定4次,將這4次產脂量測定值的總和作為火 炬松單株的產脂量;去除外界因素、數據的完整性等影響,經整理后統計得到92株火炬松 的生長性狀及其產脂量情況如表1所示。
[0018] 表1火炬松生長性狀及其產脂量的統計信息
【權利要求】
1. 一種用近紅外光譜技術預測火炬松松脂產量的方法,其特征在于:包括以下步驟: (1) 建立校正模型:選擇火炬松單株作為建模研究對象,采用人工割脂法對火炬松單株 產脂量進行常規測定;采集火炬松單株的生長錐木芯樣品,測定生長錐木芯樣品的近紅外 光譜數據;確定校正集和外部驗證集的樣本集;用化學計量學軟件將采集得到的校正集樣 品光譜數據進行光譜預處理,再將預處理后的光譜數據與產脂量的常規測定相關聯,采用 偏最小二乘法結合交互驗證法將預處理后的光譜數據和產脂量數據擬合起來建立校正模 型; (2) 模型的驗證:利用未參與建模的外部驗證集樣品對所建校正模型進行檢驗,S卩:以 近紅外光譜儀掃描驗證集樣品,獲得近紅外光譜圖,將近紅外光譜特征數據輸入校正模型 獲得預測結果,將預測結果和采用人工割脂法對該驗證集樣品測定得到的常規測定值進行 多元回歸統計分析,應用內部交叉驗證法和外部驗證法對模型進行驗證和評價; (3) 用模型來預測待測的火炬松松脂產量:在預測時,對于待測的火炬松,采集其生長 錐木芯樣品,以近紅外光譜儀掃描其近紅外光譜圖,將采集到的特征光譜數據輸入到模型 中,得到該待測火炬松松脂產量預測值; 所述近紅外光譜數據的采集條件如下:測樣方式為漫反射,光斑直徑為3. 5cm,光 譜掃描范圍為950nm-1650nm,分辨率為5nm,環境溫度控制在22-23°C,環境濕度控制在 30%-70%,每一個木芯樣品都采用掃描2次和重復裝樣2次取平均的光譜收集方式; 所述光譜預處理是采用一階導數FD+平滑SG+多元散色校正MSC的組合法。
2. 根據權利要求1所述的用近紅外光譜技術預測火炬松松脂產量的方法,其特征 在于:近紅外光譜數據進行預處理和多元回歸統計分析優選采用化學計量學軟件The unscramble 9· 8 進行。
3. 根據權利要求1所述的用近紅外光譜技術預測火炬松松脂產量的方法,其特征在 于:所述步驟(1)在利用校正集建立模型時,需對校正集中的異常樣品進行剔除,異常樣品 的確定方法是:利用化學計量學軟件The Unscrambler 9. 8中的杠桿值影響圖和學生化殘 差功能對異常樣品進行判斷,如果一個樣品相對于校正集中其它樣品同時具有較高的杠桿 值和學生化殘差,則確定該樣品為異常樣品,將其從校正集中剔除,之后再利用其余的樣品 通過偏最小二乘法PLS重新建模,如此反復上述操作,直至將所有異常樣品剔除完畢得到 理想的模型為止。
4. 根據權利要求1所述的近紅外光譜技術預測火炬松松脂產量的方法,其特征在于: 所述火炬松單株及火炬松生長錐木芯樣品的采集方法是:在10-15年生火炬松人工林中選 取胸徑16cm以上、所處環境條件基本一致、生長狀況良好、均勻分布的單株火炬松,在樹高 1-1. 5m處使用12_的樹木生長錐從西南方向垂直于樹干鉆取生長錐木芯,直至鉆通整個 樹干,取出整條木芯后,立即用保鮮膜密封,裝入密封袋并依樹上所做記號進行標記,待所 有木芯樣品鉆取完畢后,在最短時間內放入-20° C冰箱內保存備用。
5. 根據權利要求1或4所述的近紅外光譜技術預測火炬松松脂產量的方法,其特征在 于:所述生長錐木芯樣品在進行近紅外光譜測定前的處理方法是:從密封袋中取出整條生 長錐木芯,在其髓心處將其切為兩段,然后選擇東北方向的半段木芯,分別在其首尾處截斷 成3-5 cm的兩小段木芯,放入改進的樣品杯,在近紅外光譜儀所處的實驗室放置24小時以 上,再進行近紅外光譜數據的采集。
6.根據權利要求1所述的近紅外光譜技術預測火炬松松脂產量的方法,其特征在于: 所述人工割脂法對火炬松單株的產脂量進行測定,具體方法是:在樹高1-1. 5m處使用采脂 刀按照生產上的松脂采集規范,采用下降法"V"字型進行采割,每隔一天采割一次,雨天除 夕卜,連續割脂32-35天,在除去比較大的雜物后,對入選火炬松單株所產的松脂樣品分別進 行稱重測量,記錄數據,如此操作連續測定4次,將這4次產脂量測定值的總和作為火炬松 單株的產脂量。
【文檔編號】G01N21/359GK104142311SQ201410401597
【公開日】2014年11月12日 申請日期:2014年8月15日 優先權日:2014年8月15日
【發明者】黃少偉, 劉天頤, 劉純鑫, 王向南, 祝文娟 申請人:華南農業大學