氣質聯用系統完成; 色譜柱為安捷倫DB-5MS毛細管柱(30mX0. 25mmX0. 25μπι);氦氣作為載氣,流量1.2mL/ min;進樣口溫度300°C,分流比10 :1;程序升溫:初始70°C,保持3分鐘,5°C/min升至 310°C,保持5分鐘。進樣量1μL。EI電離模式(70eV),傳輸線溫度280°C,離子源240°C, 全掃描的質量范圍33-600m/z。GC-MS擬靶標分析方法的建立流程主要包括以下幾個方面, 首先采用Chr〇maT0F(LeC〇)和AMDIS(NIST)軟件對QC樣品的GC-MS全掃描數據進行去卷 積和峰識別,確定輪廓分析的目標化合物,通過計算相鄰化合物的保留時間,對所有待分析 的化合物進行分組,進行組內特征離子的選擇。根據化合物的特征離子、保留時間和分組信 息建立基于GC-MS擬靶標代謝組學分析方法,該方法包括50個分組,319個代謝物。擬靶標 分析方法的其他參數與全掃描模式相同。
[0029] 2. 2代謝組輪廓數據的生成
[0030] 采集的原始代謝組輪廓數據由ChromaTOF (Leco)和AMDIS (NIST)軟件進行去卷積 和峰識別。隨后,采用島津Postrun軟件進行色譜峰的匹配,保留時間窗口設為0. 2min。
[0031] 2. 3構建模型篩選隨機誤差
[0032] 將相鄰兩個QC樣品中代謝物響應強度的比值從小到大排序后,篩選總比值個數 的5%作為離散點,將這5%的離散點平均分配到排序后比值的兩端,從而篩選出隨機誤差 (圖 1)。
[0033] 2. 4構建線性擬合模型校正隨機誤差
[0034] 篩選到隨機誤差后,去除含有隨機誤差的代謝特征,計算不含有隨機誤差的正常 代謝特征在相鄰兩個QC樣品中的比值,并對其進行從小到大排序,
[0035] 然后建立線性擬合模型,獲得擬合模型的公式,將含有隨機誤差的代謝特征j帶 入線性擬合模型的公式中,獲得校正因子
.中AQCnjPAQC\n1}]分別代表特征 j在…中未校正的響應值和在QCυ中校正后的響應值。最后,某一含有隨機誤差的代謝 物j在QCn中響應值為AQnj,其校正后的響應值AQC'nj的可以通過如下公式獲得;
[0036]
[0037] 2. 5與常用的箱圖篩選隨機誤差的計算結果比較
[0038] 將實驗所獲得的GC-MS擬靶標代謝組數據用箱圖篩選隨機誤差,然后隨機地用某 一正常代謝特征的響應值來替代隨機誤差值,經過系統誤差校正后,輸出結果,并對所計算 的結果進行比較。結果發現,與箱圖校正相比,我們建立的篩選和校正離散的方法可以使所 有的QC樣品,展現出較大的皮爾森相關系數、較小的歐式距離和RSD值(附圖2),說明應用 我們建立的校正方法可以使所有的QC樣品在PCA中聚集的更緊密,并顯著地改善QC的重 復性。
[0039]本發明給出了一種通用的代謝組學數據隨機誤差篩選和校正的方法。與傳統的箱 圖篩選隨機誤差并隨機賦值的方法不同,本發明首次采用相鄰兩組QC樣品的比值篩選隨 機誤差,并應用比值的線性擬合校正隨機誤差。采用本發明方法比傳統的箱圖篩選方法具 有更好的校正效果,校正后的QC樣品展示了更好重復性、更短歐式距離和更大皮爾森相關 系數。
【主權項】
1. 一種用于篩選和校正代謝組學數據隨機誤差的方法,首先從所有待測樣品中取出相 同質量樣品,混合后建立質控(QC)樣品,計算相鄰兩個QC樣本中代謝物響應強度的比值, 建立模型篩選隨機誤差,然后利用線性擬合模型對隨機誤差進行校正;其特征在于以下步 驟: (1) 制作QC樣本:分別從所有將進行代謝組學分析的樣本中準確稱量或移取等量樣本 并均勻混合成一個大的樣本,即QC樣本; (2) 獲取代謝組學數據:每5-20個待測樣本插入一個QC樣本,QC樣本和待測樣本按照 完全相同條件進行樣本預處理和基于色譜-質譜方法的代謝組學分析; (3) 獲取相鄰兩個QC樣品中代謝組數據比值:計算同一個代謝物在相鄰兩個QC樣品 中的響應強度的比值; ⑷構建模型篩選隨機誤差:將相鄰兩個QC樣品中代謝物的比值從小到大排序后,篩 選總比值個數的5%作為離散點,將這5%的離散點平均分配到排序后比值的兩端,從而篩 選出隨機誤差; (5)構建模型校正隨機誤差:利用兩個相鄰QC樣品中的正常比值進行線性擬合模型, 校正隨機誤差,具體步驟為: ① 兩個相鄰QC樣品中正常比值的獲取:篩選到隨機誤差后,去除含有隨機誤差的代謝 特征,計算不含有隨機誤差的正常代謝特征在相鄰兩個QC樣品中的比值; ② 線性擬合模型的構建:將正常代謝特征在兩個相鄰QC樣本中的比值,進行從小到大 排序,并進行線性擬合,獲得線性擬合模型的公式,將含有隨機誤差的代謝特征j帶入線性 擬合模型的公式中,獲得校正因子其中AQCn^P AQC^n 1}]分別代表特征 j在QCn中未校正的響應值和在QC υ中校正后的響應值; ③ 隨機誤差的校正:某一含有隨機誤差的代謝物j在QCn中響應值為AQ nj,其校正后的 響應值AQC' nj通過如下公式獲得;
【專利摘要】本發明公開了一種代謝組學數據隨機誤差的篩選和校正方法,首先采用色譜-質譜聯用儀對樣品進行分析得到代謝組輪廓,通過計算相鄰兩個質量控制樣品(QC)中代謝物響應強度的比值,將比值從小到大排序后,篩選總比值個數的5%作為離散點,將這5%的離散點平均分配到排序后比值的兩端,從而建立模型去篩選代謝組數據中的隨機誤差。然后利用比值的線性擬合模型對隨機誤差進行校正。本發明的核心在于通過代謝物在兩個相鄰QC樣品中響應強度的比值構建模型去篩選和校正隨機誤差。本發明可以高效、準確地篩選和校正代謝組數據中的隨機誤差,改善代謝組數據的質量。
【IPC分類】G01N30/02
【公開號】CN105424827
【申請號】CN201510755515
【發明人】林曉惠, 郝志強, 趙燕妮, 許國旺, 路鑫
【申請人】大連理工大學
【公開日】2016年3月23日
【申請日】2015年11月7日