專利名稱:用于校準質譜儀(ms)與其它儀器系統和用于處理ms與其它數據的方法
本專利申請是2003年10月20日提交的美國專利申請序列號No.10/689,313的部分繼續申請,以及要求來自該專利申請的優先權,該專利申請的整個內容在此引用以供參考。
背景技術:
發明領域本發明總的涉及分析儀器領域和質譜儀(MS),更具體地,本發明涉及用于校準這樣的儀器與MS儀器系統以及用于處理相應的數據的方法。
背景技術:
質譜儀(MS)是有100年歷史的技術,它依賴于分子的電離和分裂,分裂離子因它們的質量的擴散、以及在適當的檢測器上離子裂片的正確檢測。有許多方法達到這三個關鍵的MS處理過程中每個過程,它們產生具有不同特性的不同類型的MS儀器。
四種主要類型的電離技術通常用來把較大的分子分裂成許多較小的分子并同時電離它們,以使得它們在質量擴散之前被適當地帶電。這些電離方案包括電噴射電離(ESI)、通過高能電子撞擊的電子撞擊電離(EI)、通過使用其它反應化合物的化學電離(CI)、和基體輔助激光解吸附和電離(MALDI)。ESI和MALDI兩者也可兼用于樣品引入的裝置。
一旦樣品中的分子通過電離被分裂和成為帶電后,每個裂片將具有相應的質荷(m/z)比,它將成為質量擴散的基礎。根據所使用的物理原理,有許多不同的方法來達到質量擴散,導致性質上類似的、但細節不同的質譜數據。幾種通常看到的結構包括磁扇區;四極子;飛行時間(TOF);和傅立葉變換離子-回旋共振(FT ICR)。
磁扇區結構是最直截了當的技術,其中具有不同m/z比的離子在磁場中分離,并以空間上分開的各個位置離開這個場,其中它們將由一個固定的陣列的檢測器單元或由一個可移動的小型檢測器組來檢測,該小型檢測器組可以根據應用被調節來檢測不同的離子。這是一種同時的結構,其中來自樣品的所有的離子在空間上同時地而不是在時間上順序地被分離。
四極子結構或許是最通用的MS結構,其中不同m/z值的離子將由一組(通常4根)平行棒通過操縱加到這些棒對上的RF/DC比值而被濾掉,只有某一m/z值的離子才能經過這些處在給定RF/DC比的棒的旅程而存活下來,導致分裂離子的順序分離和檢測。由于它的順序特性,只需要一個檢測器單元用于檢測。使用離子陷阱的另一個結構可被看作為四極子MS的一個特例。
飛行時間(TOF)結構是另一個順序擴散和檢測方案,它讓分裂離子在電場下加速,然后在檢測前移動通過一個高真空飛行管。不同m/z值的離子在不同的時間到達檢測器,而該到達時間可以通過校準標準與m/z值相關聯。
在傅立葉變換離子-回旋共振(FT ICR)中,在分裂和電離后,所有的離子可被引入到離子回旋加速器,其中不同m/z值的離子被捕獲并在不同的頻率下共振。這些離子可以通過施加射頻(RF)信號而用脈沖送出,以及離子強度作為時間的函數而在檢測器上測量。在測量到時域數據的傅立葉變換后,可得到頻域數據,其中頻率可以通過使用校準標準而與m/z值反向關聯。
離子可以直接通過使用法拉第杯檢測或可以間接通過使用電子倍增管(EMT)/板(EMP)或在把離子變換成光的變換器后通過使用光子倍增管(PMT)而被檢測。圖5A,5B和5C是顯示按照現有技術的、分別以不同的離子強度尺度110,120和130畫出的典型的質譜數據軌跡作為m/z比值的函數的圖。
過去100年已見證了在MS儀器方面作出的巨大的成績,許多不同的風格的儀器得以設計和制造,用于高通過量、高分辨率和高靈敏度的工作。儀器已發展到一個階段,其中單個離子檢測可以在大多數市場上買到的、具有單位質量分辨率的MS系統上常規地完成,該分辨率允許觀察來自不同的同位素的離子分裂。與硬件的精巧性成明顯的反差,在系統地和有效地分析由現代MS儀器產生的大量MS數據方面進展甚微。
在典型的質譜儀上,通常要用戶被要求或被提供具有覆蓋感興趣的質譜m/z范圍的幾種分裂離子的標準材料。受到基線影響,同位素干擾,質量分辨率,和分辨率對于質量的依賴性,幾種離子裂片的峰位置或是根據質心或是通過在峰頂上擬合的低階多項式的峰最大值而確定的。這些峰位置然后通過一階或其它高階多項式擬合到對于這些離子的已知的峰位置,以便校準質量(m/z)軸。
在質量軸校準后,典型的質譜數據軌跡然后要進行峰分析,其中峰(離子)被識別。這個峰檢測的例行程序是高度經驗性的和復合的處理過程,其中要考慮峰肩部、數據軌跡中的噪聲、由于化學背景或污染引起的基線、同位素峰干擾等等。
對于識別的峰,典型地施加被稱為求重心的處理過程,其中試圖計算合并的峰面積和峰位置。由于上述的許多干擾因素以及在存在其它峰和/或基線時確定峰面積時的固有的困難,這是一種受到許多可調節的參數困擾的處理過程,它可以使得同位素峰出現或消失,對求重心的質量沒有客觀的度量。現在將給出傳統的處理質譜數據方法的許多缺點的某些方面的說明。
一個缺點是缺乏質量精度。當前所使用的質量校準通常在傳統的具有單位質量分辨率(觀察到主要的同位素峰存在與否的能力)的MS系統上不提供優于0.1amu(m/z單位)的質量確定精度。為了達到更高的質量精度和減小在諸如用于蛋白質識別的肽映射那樣的分子獨特標志方面的模糊性,必須轉換到以高得多的成本得到的、具有更高分辨率的MS系統,諸如四極子TOF(qTOF)或FT ICR MS。
另一個缺點是大的峰積分誤差。由于質譜峰形狀、它的可變性、同位素峰、基線和其它背景信號和隨機噪聲的影響,當前的峰面積積分不論對強的或弱的質譜峰都具有大的誤差(系統誤差和隨機誤差兩者都有)。
再一個缺點包括在同位素峰方面的困難。當前的方案沒有分離來自各種同位素的影響的良好的方法,這些同位素在傳統的、具有單位質量分辨率的MS系統上會給出局部重疊的質譜峰。所使用的經驗性方法或者忽略來自相鄰的同位素峰的貢獻,或者過分估計它們,導致對于占優勢同位素峰的誤差和對于弱同位素峰的大的偏差或甚至完全忽略較弱的峰。當涉及到多電荷的離子時,由于這時在相鄰的同位素峰之間的m/z質量單位方面減小了的分離,情形甚至變得更壞。
又一個缺點是非線性運算。當前的方案使用在每階段期間具有許多按經驗而調節的參數的多階段不連貫的處理過程。系統誤差(偏差)在每個階段都生成,并且以不可控制的、不可預測的、和非線性的方式向下傳播到后一階段,使得算法不可能報告有意義的統計結果作為數據處理質量和可靠度的度量。
再一個缺點是處于支配地位的系統誤差。在大多數MS應用中,其范圍從工業處理控制和環境監視延伸到識別蛋白質或發現生物標記,儀器靈敏度或檢測極限一直是焦點,并且在許多儀器系統中花費很大力氣來減小儀器誤差或信號中噪聲的影響。不幸地,當前使用的峰處理方案常常產生甚至大于原始數據中的隨機噪聲的系統誤差源,因此變為儀器靈敏度的限制因素。
另外的缺點是數學和統計上的不一致性。當前使用的許多經驗方法使得整個質譜峰處理在數學上或統計上不一致。峰處理的結果在不具有任何隨機噪聲的稍微不同的數據或在具有稍微不同的噪聲的相同的合成數據上會有極大的改變。換句話說,峰處理的結果是不魯棒的,以及根據特定的實驗或數據收集而可以是不穩定的。
而且,另一個缺點是隨各個儀器不同而帶來的變化。由于機械的、電磁的、或環境偏差的變化,通常很難直接比較來自不同MS儀器的原始質譜數據。通過被施加到原始數據的當前的特定的峰處理,它只是對在不同測量時間來自不同MS儀器或相同儀器的結果進行定量比較時增加了困難。另一方面,對于直接的連續質譜數據或來自儀器在不同的時間、不同的儀器、或不同的類型的儀器的峰處理結果進行比較的要求,在雜質檢測和通過在建立的MS庫中的計算機搜索進行蛋白質識別方面變得越來越高。對于在蛋白質、代謝物或脂肪中發現生物標記(在那里,來自不同樣品組的質譜數據要互相進行比較以供差異性分析),則存在甚至更大的需要。
因此,克服現有技術的上述的缺陷和缺點的、用于校準質譜(MS)儀系統和用于處理MS數據的方法是理想的和高度有利的。
發明概要上述的問題以及現有技術的其它有關的問題通過本發明的用于校準質譜儀(MS)和其它儀器系統以及用于處理MS和其它數據的方法而被解決。
按照本發明的一個方面,提供了為了得到用于質譜(MS)儀系統的至少一個校準濾波器的方法。對于給定的校準標準,得到在質譜范圍中測量的同位素峰集群數據。對于給定的校準標準,計算相對同位素豐度和相應于該豐度的同位素的實際的質量位置。規定其中心處在相應的質譜范圍內的質譜目標峰形狀函數。在計算的相對同位素豐度與質譜目標峰形狀函數之間執行卷積運算,以形成計算出的同位素峰集群數據。在測量的同位素峰集群數據與在卷積運算后計算出的同位素峰集群數據之間執行去卷積運算,以得到至少一個校準濾波器。
按照本發明的另一個方面,提供了一種處理原始質譜數據的方法。把一個總的濾波矩陣施加到原始質譜數據,以得到校準的質譜數據。總的濾波矩陣是通過在質譜范圍中為給定的校準標準所得到的測量的同位素峰集群數據而形成的。總的濾波矩陣是還通過為相同的校準標準所計算的相對同位素豐度和相應于該豐度的同位素的實際的質量位置而形成的。總的濾波矩陣是還通過其中心處在質譜范圍內的、被規定的質譜目標峰形狀函數而形成的。總的濾波矩陣是還通過在計算的相對同位素豐度與質譜目標峰形狀函數之間執行卷積運算以形成計算出的同位素峰集群數據而形成的。總的濾波矩陣是還通過在測量的同位素峰集群數據與在卷積運算后計算出的同位素峰集群數據之間執行去卷積運算以得到用于總的濾波矩陣的至少一個校準濾波器而形成的。
按照本發明的又一個方面,提供一種用于分析相應于從質譜(MS)儀系統得到的質譜數據的質譜峰的方法。加權的回歸運算被施加到處在質譜范圍內的質譜峰。回歸系數被報告作為積分的峰面積和相應于標稱質量和估計的實際的質量之一的質量偏差中的一項。
按照本發明的再一個方面,提供一種用于計算用于質譜(MS)儀系統的校準濾波器的方法。從給定的校準標準得到至少一個質譜峰形狀函數。規定其中心處在各個質譜范圍內各中間點的質譜目標峰形狀函數。在得到的至少一個質譜峰形狀函數與質譜目標峰形狀函數之間執行去卷積運算。根據去卷積運算的結果計算至少一個校準濾波器。
按照本發明的再一個方面,提供一種處理原始質譜數據的方法。把總的濾波矩陣施加到原始質譜數據,以得到校準的質譜數據。總的濾波矩陣是通過從給定的校準標準得到至少一個質譜峰形狀函數而形成的。總的濾波矩陣是另外通過規定其中心處在各個質譜范圍內的各中間點的質譜目標峰形狀函數而被形成的。總的濾波矩陣是另外通過在得到的至少一個質譜峰形狀函數與質譜目標峰形狀函數之間執行去卷積運算而被形成。總的濾波矩陣是另外通過從去卷積運算的結果計算至少一個校準濾波器而被形成的。
按照本發明的再一個方面,提供一種更新總的濾波矩陣的方法。把總的濾波矩陣施加到包含至少一個內部標準的原始質譜數據,以得到校準的質譜數據。通過應用前述的校準過程使用校準的質譜數據作為輸入和其中所包含的至少一個內部標準作為標準而形成新的總的濾波矩陣。通過把兩個總的濾波矩陣相乘或通過卷積兩個濾波器而形成更新的總的濾波矩陣,并且將其施加到這個和其它原始質譜數據,以得到外部和內部校準的質譜數據。
該方法還包括通過在檢測之前使用在線和離線混合之一,引入要被測量的內部校準標準與樣品。內部校準標準可以是樣品的預先存在的成分。內部校準過程可以包括執行以上闡述的方法的各個步驟。
本發明還是對在各個位置范圍內包含峰的數據軌跡中的峰寬度進行歸一化的方法,該方法的步驟包括測量峰寬度作為一個峰位置的函數以得到峰寬度的測量值;對測量值進行最小二乘擬合,以確定函數;以及在該范圍內對函數的數學的逆進行積分以得到能用于對峰寬度進行歸一化的變換函數。峰寬度的測量是基于對已知標準進行的測量。函數被使用來歸一化峰寬度。函數的逆可以是函數的倒數。在積分時定義的常數在得到變換函數時被丟棄。如果譜是來自液體色譜法四極子飛行時間質譜儀的質譜,則函數可以包含至少一個對數運算。如果譜是來自傅立葉變換的質譜,則函數可以是對數函數。如果譜是來自飛行時間質譜儀的質譜,則函數可以是平方根函數。如果譜是來自氣體色譜法質譜儀的質譜,則函數可以包含對數函數。如果譜是來自基體輔助的激光解吸附和電離飛行時間質譜儀的質譜,則函數可以是倒數函數。
按照本發明的再一個方面,本發明是一種針對用于校準來自包含多個成分的樣品的數據而不用給樣品施加上內部標準的方法,該方法的步驟包括選擇數據中至少一個峰以作為標準;根據該至少一個選擇的峰導出校準濾波器;和使用校準濾波器來分析數據中的其它峰,以便產生校準的數據。該選擇可包括選擇一個以上的峰,以及該導出可包括導出用于每個選擇的峰的校準濾波器,和進行內插以產生至少一個附加校準濾波器和在選擇的峰之間的位置處用于分析的峰之一。在產生校準濾波器時,至少一個選擇的峰可以用比起原先的峰相對不重要的寬度的已知的函數進行卷積。校準的數據可以被統計分析,以便對測試樣品進行定量、識別和分類中的至少一項。上述的各種方法可以結合本發明的這個方面一起使用。
本發明也是針對用于實踐以上闡述的方法的某些方面的分析儀器系統的,以及具體地,針對許多各種各樣的所有的類型的質譜儀,它們被配置成利用至少一項這里闡述的方法。
按照本發明的再一個實施例,數據存儲媒體可在其上包含計算機可執行的指令,用于使得與分析儀器系統相關聯的計算機執行以上闡述的方法的某些方面,以及特別地,使得許多各種各樣的所有的類型的質譜儀中的一個或多個質譜儀執行至少一項這里闡述的方法。
通過結合附圖閱讀的以下的優選實施例的詳細說明,將明白本發明的這些和其它方面、特性和優點。
附圖簡述
圖1是按照本發明的包括質譜儀的分析系統的框圖。
圖2是具有一維樣品分離的系統和多通道檢測器的框圖。
圖3是具有二維樣品分離的系統和單通道檢測器的框圖。
圖4是執行儀器校準的方式的非常高級別流程圖。
圖5A,5B和5C是顯示按照現有技術分別以不同的離子強度尺度110,120和130作為m/z比值的函數而畫出的典型的質譜數據軌跡的圖。
圖6A和6B是顯示在兩個不同的強度標度上對于離子裂片C3F3的質譜峰數據的圖。
圖7A和7B是分別顯示按照本發明的說明性實施例在預卷積之前和之后測量的同位素集群310的圖。
圖7C和7D是分別顯示按照本發明的說明性實施例的、在預卷積之前和之后計算的同位素集群320的圖。
圖7E和7F是分別顯示按照本發明的說明性實施例的、如此計算而得到的峰形狀函數330和相應的去卷積殘差340的圖。
圖8是顯示按照本發明的說明性實施例的、示例性的去卷積的峰形狀函數410的圖。
圖9是顯示按照本發明的說明性實施例的、基于圖8的去卷積的峰形狀函數410的示例性內插峰形狀函數510的圖。
圖10是顯示按照本發明的說明性實施例的、對于質譜儀校準是優選的兩個示例性目標610,620的圖。
圖11是顯示按照本發明的說明性實施例的、對于一組質量的計算的校準濾波器的集合710的圖。
圖12是顯示按照本發明的說明性實施例的、與內插和質量預對準相組合的濾波器矩陣應用的圖形表示800的圖。
圖13是可執行外部和內部儀器校準的方式的非常高級別流程圖。
圖14A,14B和14C是顯示按照本發明的說明性實施例的、在完全校準之前和之后質譜儀(MS)質譜的第一分段910和第二分段920(圖14A和14B)與方差譜930(圖14C)的圖。
圖15A是包含來自不同于質譜儀的儀器的含噪聲的數據軌跡;圖15B顯示在把校準濾波器施加到圖15A的數據軌跡后的校準的數據軌跡;圖15C顯示圖15B的數據的峰分析的部分結果,其中用豎線表示所有的峰位置和峰面積。
圖16A是顯示按照本發明的說明性實施例的、反映t統計作為對于在質量范圍內可能的質譜峰(根據圖5確定的原始質譜)的精確質量位置的函數(公式10)的豎線質譜1010的圖。
圖16B和16C是顯示按照本發明的說明性實施例的、原始MS譜分段的重疊1020和它的充分校準的版本1030的圖。
圖16D是顯示按照本發明的說明性實施例的、相應的t統計1040和具有在12處的關鍵t值的水平截止線1050的圖。
圖17是顯示按照本發明的說明性實施例的、用于操作質譜(MS)儀系統的方法的圖。
圖18是進一步顯示按照本發明的說明性實施例的、圖17的方法的步驟110H的圖。
圖19是顯示按照本發明的說明性實施例的、用于分析在完全的質譜校準后從MS儀系統得到的質譜儀(MS)質譜的方法的圖。
圖20是顯示按照本發明的說明性實施例的、用于分析在確定峰形狀函數后從MS儀系統得到的質譜儀(MS)質譜的方法的圖。
圖21是進一步顯示按照本發明的說明性實施例的、包括用于校準質譜儀(MS)系統的任選的步驟的圖17的方法的圖;以及圖22是顯示按照本發明的說明性實施例的、用于處理從MS儀系統得到的質譜儀(MS)質譜的方法的圖。
發明詳細說明本發明在主要針對用于校準質譜(MS)儀系統和用于處理MS數據的方法。正如下面指出的,本發明的某些方面在校準其它類型的儀器可以是非常有用的。
應當看到,本發明可以以各種不同的形式的硬件、軟件、固件、專用處理器、和它們的組合被實施。優選地,本發明以硬件和軟件的組合被實施。而且,軟件優選地被實施為明確地體現在程序存儲裝置上的應用程序。應用程序可被上載到包括適當結構的機器和被該機器執行。優選地,機器在具有諸如一個或多個中央處理單元(CPU)、隨機存取存儲器(RAM)和輸入/輸出(I/O)接口的硬件的計算機平臺上被實施。計算機平臺還包括操作系統和微指令代碼。這里描述的各種不同的處理和功能可以是微指令代碼的一部分或是經由操作系統執行的應用程序的一部分(或它們的組合)。另外,各種其它的外圍設備可被連接到計算機平臺,諸如附加數據存儲裝置和打印裝置。
還應當指出,因為在附圖上描繪的某些構成系統的部件和方法步驟優選地以軟件來實施,在系統部件(或處理步驟)之間的實際的連接可能是不同的,這要取決于本發明被編程的方式。在給出了這里的教導后,本領域技術人員將能夠設想本發明的這些和類似的實施方案和結構。
現在參照圖1、圖2和圖3描述其中可以使用本發明的典型的系統。
參照圖1,圖上顯示如上所述的、可用來分析蛋白質或其它分子的、引用本發明的特性的分析系統10的框圖。雖然本發明是參照如圖所示的單個實施例描述的,但應當看到,本發明可以以實施例的許多替換的形式被實施。另外,可以使用任何適當類型的部件。分析系統10具有樣品準備部分12、質譜儀部分14、數據分析系統16、和計算機系統18。樣品準備部分12可包括用來引入包含感興趣的分子的樣品到系統10的樣品引入單元20,諸如由美國,Waltham,MA的ThermoElectron Corporation制造的Finnegan LCQ Deca XP Max。樣品準備部分12還可包括分析物分離單元22,它被使用來執行要被系統10分析的、諸如蛋白質那樣的分析物的初步分離。分析物分離單元22可以是用于液體或氣體色譜分離的色譜塔的任一項,諸如由Bio-RadLabolatories,Inc.,Hercules,CA制造的凝膠分離單元,這在技術上是熟知的。通常,把電壓或PH梯度加到凝膠上,使得諸如蛋白質的分子被分離為一個變量的函數,諸如通過毛細管的遷移速度(分子量,MW)和用于一維分離的等電位聚焦點(Hannesh,S.M.,Electrophoresis 21,1202-1209(2000)),或通過一個以上的這些變量,諸如通過等電位聚焦和通過MW(二維分離)。后者的例子被稱為SDS-PAGE。
質譜儀部分14可以是傳統的質譜儀以及可以是任何一個可得到的質譜儀,但優選地是MALDI-TOF、四極子MS、離子阱MS、或FTICR-MS的任一種、或某些組合,諸如qTOF或三階段四極子(TSQ)。如果它具有MALDI或電噴霧電離離子源,則這樣的離子源也可以提供樣品輸入到質譜儀部分14。通常,質譜儀部分14可包括離子源24;質譜分析儀26,用于分離由離子源24通過質量-電荷比(或簡單地稱為質量)生成的離子;離子檢測部分28,用于檢測來自質譜分析儀26的離子;以及真空系統30,用于保持使質譜儀部分14有效操作的足夠的真空。如果質譜儀部分14是離子遷移率譜儀,則通常不需要真空系統。
數據分析系統16包括數據采集部分32,它可包括一個或一系列模擬-數字轉換器(未示出),用于把來自離子檢測器部分28的信號轉換成數字數據。這個數字數據被提供到實時數據處理部分34,它通過諸如相加和/或取平均那樣的操作來處理數字數據。后處理部分36可用來進行來自實時數據處理部分34的數據的附加處理,包括數據庫搜索、數據存儲、和數據報告。
計算機系統18提供按下面描述的方式對樣品準備部分12、質譜儀部分14、和數據分析系統16的控制。計算機系統18可具有傳統的計算機監視器40,允許在適當的顯示屏幕上輸入數據和顯示所執行的分析的結果。計算機系統18可以是用例如Windows或UNIX操作系統或任何其它適當的操作系統操作的基于任何適當的個人計算機。計算機系統18典型地具有硬盤驅動器42,在其上存儲著操作系統和在下面描述的用于執行數據分析的程序。用于接受CD或軟盤的驅動器44用來把按照本發明的程序裝載到計算機系統18。用于控制樣品準備部分12和質譜儀部分14的程序典型地被下載作為用于系統10的這些部分的固件。數據分析系統16可以是以諸如C++,JAVA或Visual Basic的幾種編程語言書寫的、用來實施下面討論的處理步驟的程序。
圖2是分析系統50的框圖,其中樣品準備部分12包括樣品引入單元20和一維樣品分離設備52。作為例子,設備52可以是一維電泳設備。分離樣品成分由諸如,例如一系列紫外線傳感器或質譜儀那樣的多通道檢測設備54分析。下面討論進行數據分析的方式。
圖3是分析系統60的框圖,其中樣品準備部分12包括樣品引入單元20、第一維樣品分離設備62和第二維樣品分離設備64。作為例子,第一維樣品分離設備62和第二維樣品分離設備64可以是兩個接連的和不同的液體色譜單元,或可以被合并為二維電泳設備。分離的樣品成分由諸如,例如具有245nm帶通濾波器的紫外線(UV)傳感器或灰度凝膠成像器那樣的單通道檢測設備66分析。再次地,下面討論進行數據分析的方式。
參照圖4,通常按照本發明,在70處,獲取原始數據。在72處,執行成為更適當的坐標系統的前向變換,以便補償作為峰位置的函數的峰寬度的變化。然后,按照本發明執行分布和峰位置校準74,正如下面詳細闡述的。在76處,執行數據的后向變換,把數據變換回原先的坐標系統,結果是在78處的經校準的數據。
現在描述處理質譜儀數據的新穎的方法,它把質譜儀校準和質譜峰分析組合成一個完全校準處理過程,以解決以上討論的所有的問題。在質量和峰形狀兩方面的適當的和精確的質譜儀校準將提供用于在下一個階段的質譜數據分析期間的精確的峰識別、分析物定量、和樣品分類的堅實的基礎。
現在描述按照本發明的說明性實施例的質譜校準。質譜校準的說明將包括以下有關內容的說明質譜校準標準;相對同位素豐度的計算;質量預對準;質譜峰形狀函數;峰形狀函數內插;校準濾波器和它們的內插;校準濾波器的應用;和通過校準濾波器的誤差傳播。
不是在不考慮質譜峰形狀和梯度質量依賴性的情況下只校準質量,而是將執行包括所有的這些項的全面的校準作為總的處理過程的一部分。在這個全面的校準處理過程中有幾個關鍵的步驟,將在下面詳細地討論。
現在描述按照本發明的說明性實施例的質譜校準。把質量裂片分布在整個質量范圍的校準標準被選擇來提供質量校準和質譜峰形狀兩方面信息。由于在形成標準分子的元素中存在自然出現的同位素,典型地,對于同一個離子裂片可以觀察到以不同豐度的多個同位素峰。
在氣體色譜-質譜中通常使用的標準是全氟三丁胺(分子式C12F27N,分子量671)。它具有在69,100,119,131,169,219,264,364、414,464,502等處的EI裂片(對于示例的譜,見圖5)。這個標準典型地被嵌入市面上銷售的GC/MS儀器,以使得在校準時分子可以容易地蒸發和通過計算機控制的閥門擴散到MS系統。
在各種各樣的電離方案下的其它標準包括聚合物和合成肽,它們可被分裂成覆蓋感興趣的質量范圍的、多個被很好地表征的離子裂片。在其中實行第二分裂的級聯的MS系統中,例如,由于在這個二次分裂期間(這是用于肽排序的熟知的處理過程)接連的氨基酸的損失,可以得到具有來自母本肽離子的有規則地間隔的質譜峰的質譜。在ESI模式中許多完整無缺的肽將載送多個電荷(z),有時從1到10個或更多,它們將生成覆蓋高達一個數量級大小的或更多的質量(m/z)范圍的質譜峰。
現在描述按照本發明的說明性實施例的相對同位素豐度的計算。對于不提供在不同的同位素峰之間的完全質量分離的質譜儀,必須首先計算相對同位素豐度和它們的精確的質量位置。圖6A和6B顯示在同位素峰之間的這種受限的質量分離。幾種公布的方法可用來根據元素組成、包含在離子分離中的元素的已知的相對豐度、和電荷進行這種理論計算。這些方法的某些方法由Alan Rockwood,in Anal.Chem.,1995,67,2699和由James Yergey,Int.J.Mass Spec. & Ion.Physics,1983,52,237描述,這兩個文獻的公開內容在此引用以供參考。
對于具有AaBbCcDd......形式的離子裂片,同位素分布被給出為
(∑aiAi)a(∑biBi)b(∑ciCi)c(∑diDi)d...
其中a,b,c,d...分別是原子A,B,C,D...的數目,以及其中ai,bi,ci,di,...分別是同位素Ai,Bi,Ci,Di,...的自然豐度。這個表示式可被展開和被重新組織以給出所有的預期的同位素的質量位置和豐度。例如,對于圖2A和2B上的離子裂片,已經知道,它具有為1的電荷和為C3F5的元素組分,C和F的自然豐度由下式給出C12=12.000000,c12=0.9893C13=13.003354,c13=0.0107F19=18.998403,f19=1.0000因此,這個離子裂片的同位素質量(m)和相對豐度(y)可被計算為m=3C12+5F192C12+C13+5F19C12+2C13+5F193C13+5F19=130.992015131.995369132.998723134.002077]]>y=c1233c13c1223c132c12c133=9.6824×10-13.1417×10-23.3979×10-41.2250×10-6]]>這樣的峰信息(質量位置和相對豐度)以后將用于質譜數據的精確的和完全的校準。
現在描述按照本發明的說明性實施例的質量預對準。為了在下一個步驟進行更精確的峰形狀內插,首先必須根據在譜上的可識別的同位素峰集群來預對準或預校準質量標準譜。對于所識別的每個同位素峰集群,質心被計算為如下
m0=y0Tm0y0Tl]]>其中y0是對于所考慮的同位素集群的、包含實際上測量的質譜連續譜數據的列向量,以及上標T表示轉置,即包含與列版本相同的元素的行向量,m0是相應于在其上測量同位素集群的質量軸的列向量(可以具有質量單位或時間單位),以及l是具有與m0或y0相同長度的全一的列向量。類似地,另一個質心根據算出的同位素分布被計算為如下m=yTmyTl]]>因此,通過在測得的質心與使用在質量范圍內可提供的所有的明顯可識別的同位素集群所算出的重心之間的最小二乘線性或非線性擬合,可以建立以下形式的校準關系式m=f(m0)(公式1)請再次注意,m0不一定必須以質量單位計,而可以是任何物理單位,其離子強度被測量為它的函數。在FTMS和TOF中,m0自然以時間單位計,以及在多項式擬合中一階和二階的項對于FTMS和TOF分別成為主要的。
在由于存在化學噪聲或其它粒子(諸如中性粒子),在包含很大的背景信號的MS系統中,只使用在感興趣的質譜峰之前和之后所收集的數據來擬合較低階基線和從y0中減去這個基線的影響以便更精確地確定重心m0可能是有利的。然而,后面將會看到,由于改進是通過完全校準濾波器達到的,在這個階段進行絕對質量校準不是關鍵的。
現在描述按照本發明的說明性實施例的質譜峰形狀函數。對于諸如圖6A和6B所示的那樣所識別的每個質譜峰集群(包括所有的重要的同位素峰),在這個質量下的質譜峰形狀函數可以通過以下的去卷積而得出
y0=yp其中y0是實際測量的同位素峰集群,y是對于圍繞這個質量的特定的離子分離的理論計算的同位素分布,以及p是要計算的峰形狀函數。雖然y0是在給定的質量窗口上連續采樣的實際測量的質譜并且可以通過內插容易地變換到等間隔的質量間隔,但理論計算的同位素分布只被定義在離散的和不規則間隔的質量上,諸如以上顯示的(m,y)。
使得這種去卷積成為可能的關鍵步驟是在去卷積之前對于y0和y進行窄高斯峰的數字卷積,即,(gy0)=(gy)p或y0′=y′p(公式2)這種預卷積允許在同樣的相等間隔的質量間隔上連續采樣y0和y。為了使得通過這種預卷積的噪聲傳播最小化,重要的是使用高斯峰,其峰寬度比起單獨的同位素峰的FWHM小幾倍(例如4倍)。圖7A和7B是分別顯示按照本發明的示例性實施例的、在預卷積之前和之后測量的同位素集群310。圖7C和7D是分別顯示按照本發明的示例性實施例的、在預卷積之前和之后計算的同位素集群320。預卷積可以通過矩陣乘法或具有零填充的快速傅立葉變換(FFT)完成,它們在公開的文獻中有很好地描述,例如,William Press等,“Numerical Recipesin C”(用C的數值方法),2ndEd,1992,Cambridge UniversityPress,p.537,它的整個公開內容在此引用以供參考。
類似于預卷積,從y0’的對y’的去卷積以得到峰函數p可以通過矩陣求逆或FFT除法而完成。由于矩陣的結合(banded)的特性,有效的計算算法從用于矩陣求逆的公開的文獻是可得到的。這樣的算法由Gene Golub等在Matrix Computations(矩陣計算),1989,JohnsHopkins University Press,p.149中進一步描述,它的整個公開內容在此引用以供參考。替換地,有效的去卷積也可通過FFT除法實行。在任一情形下,在該處要具有適當的噪聲濾波以便在去卷積期間控制噪聲傳播是關鍵的。這可以通過以下方法完成在求逆之前在矩陣方法中丟棄小的奇異值,或每當遇到要用很小的數作除法時用內插值替代FFT除法的實部和虛部。小的奇異值的丟棄由Yongdong Wang等在anal.Chem.,1991,63,2750中和由Bruce Kowalski等在J.Chemometries,1991,5,129中進一步描述,二者的公開內容在此引用以供參考。圖7E和7F是分別顯示按照本發明的示例性實施例的、這樣計算而得到的峰形狀函數330和相應的去卷積殘數340。希望在去卷積期間進行適當的噪聲濾波,以使得在去卷積后的殘差具有隨機特性,其幅度與在測量的數據y0中預期的噪聲電平是可相比較的。
在由于存在化學噪聲或其它粒子,諸如中性粒子,因而包含很大的背景信號的MS系統中,只使用在感興趣的質譜峰之前和之后的收集的數據來擬合較低階基線和在預卷積之前從y0中減去這個基線的影響可能是有利的。這種基線校正的目的是保證來自實際測量的基線與理論計算的基線相匹配。
現在描述按照本發明的說明性實施例的峰形狀函數的內插。幾個其它峰形狀函數可以從在來自相同的標準樣品的質譜的質譜峰范圍內其它很好表征的離子裂片類似地被計算。圖8是顯示按照本發明的說明性實施例的、示例性去卷積的峰形狀函數410的圖。為了得到對于在質譜范圍內的感興趣的所有的其它質量的峰形狀函數,需要在幾個計算的峰形狀函數的內插。設計了也允許進行噪聲濾波的、有效的內插算法。代替在原先的質譜空間上的內插,這幾個可得到的質量峰形狀函數將收集在首先通過奇異值分解(SVD)被分解的矩陣P中,P=USVT其中P是其峰形狀函數排列成行的峰形狀函數矩陣,U在它的列中含有左奇異向量,S是在其對角線上有遞減的奇異值的對角線矩陣,以及V在它的列中包含右奇異向量。SVD算法由Gene Golub等在MatrixComputations(矩陣運算),1989,Johns Hopkins University Press,p.427中進一步描述,它的整個公開內容在此引用以供參考。通常,僅僅幾個(諸如3到4)奇異值/向量是重要的,這取決于作為質量函數的峰形狀函數的一致性。例如,如果所有的峰形狀函數是完全相同的且它們之間只有很少的質量偏移,則可以預期只有兩個重要的奇異值/向量。如果所有的峰形狀函數是互相完全相同且沒有質量偏移,則可以預期只有一個奇異值/向量。這說明為什么以上需要預對準步驟以便導致牽涉到最小數目的奇異值/向量的更經濟的分解和內插。
當左奇異向量的元素對于質量作圖時,預期要對質量有平滑的相關性,對于精確的內插有可修正的功能的相關性。三次樣條內插可以容易地施加到矩陣U的頭幾列,以便得到具有更多行數的擴展矩陣U,它們覆蓋全部質譜范圍。包含內插峰形狀函數的擴展的峰形狀函數矩陣P可以經由下式容易地構建P=USVT其中在P中的每行包含在任何內插的質量質心處的一個峰形狀函數。圖9是顯示按照本發明的說明性實施例的、基于圖8的去卷積的峰形狀函數410的示例性內插峰形狀函數510的圖。
應當指出,這里的SVD分解可以用諸如小波分解這樣的其它分解替代,以不同的計算花費達到類似的結果。
現在描述按照本發明的說明性實施例的校準濾波器和它們的內插。根據得到的峰形狀函數,MS儀器系統現在完全是用它的質量軸和它的峰形狀函數來表征的。根據這種表征,現在可以執行完全的質譜校準。這種校準可以以單個操作來實行,其中在不同的質量處的峰形狀函數將被變換成以精確的質量位置為中心的更理想的峰形狀函數(目標峰形狀函數)。雖然在原理上任何以分析或以數字計算的峰形狀函數可以用作為目標峰形狀函數,但希望具有以下特性的目標平滑的峰函數和導數(為了數值穩定性);可分析地計算的函數和導數(為了計算有效性);對稱的非峰形狀(為了在以后的峰檢測中精確的質量確定);與真實的質譜峰形狀相像(為了簡化的校準濾波器);峰寬度(FWHM)稍微大于實際測量的峰寬度(為了計算穩定性和信號平均)。
圖10是顯示按照本發明的說明性實施例的、滿足對于質譜儀校準的優選的要求的兩個示例性目標610,620的圖。兩個示例性目標610,620滿足以上描述的要求。兩個示例性目標610,620分別是高斯函數以及高斯函數與矩形函數的卷積。
對于在給定的質心質量處的每個峰形狀函數p,校準濾波器f可被找到以使得
t=pf (公式3)其中t是以這個給定的質量為中心的目標峰形狀函數。這個卷積實際上把數字計算的峰形狀函數p變換成以這個精確的質量位置為中心的、數學上確定的峰形狀函數,在一次卷積運算中同時完成質量和峰形狀兩者的校準。校準濾波器f的計算可以通過矩陣求逆或具有適當地內置的噪聲濾波的FFT除法,以與峰形狀函數的去卷積類似的方式實行。圖11是顯示按照本發明的說明性實施例的、為一組質量而計算的校準濾波器的集合710的圖。
可以看到,校準濾波器隨質量平滑地變化,類似于峰形狀函數。由于內插比起去卷積運算在計算上通常是更有效的,所以在整個范圍以粗間隔的質量計算校準濾波器(例如,以每1-5amu間隔),然后把校準濾波器內插到細間隔的網格(例如,1/8或1/16amu),在計算上是有利的。對于峰形狀函數的內插,可以應用上述的相同的方法。
替換地,可以全部回避公式2中峰形狀函數的計算,而把公式2和3組合成單個步驟的處理過程(ty)=y0f其中在多個標準質量處的卷積濾波器f可以用矩陣求逆或FFT除法直接計算。這些卷積濾波器的內插將產生在特定的質量處的想要的濾波器(圖11)。
應當指出,這里計算的校準濾波器同時有兩個用途質譜峰形狀和質譜峰位置的校準。由于質量軸已在上面被預校準,濾波器函數的質量校準部分在這種情形下被縮減以達到質量校準的進一步改進,即計及在由公式1給出的最小二乘擬合后的任何殘余質量誤差。
這種完全校準處理過程對于包括離子阱的四極子型MS很適用,其中質譜峰寬度(在半最大值處的全部寬度或FWHM)在工作的質量范圍內預期會大體一致。對于諸如磁扇形、TOF、或FTMS的其它類型的質譜儀系統,質譜峰形狀預期將按照由工作原理和/或特定的儀器設計所規定的關系隨質量而變化。雖然至今描述的同一個依賴于質量的校準程序過程仍舊是可用的,但最好是在峰寬度與質量/位置之間的給定關系是一致的變換的數據空間中執行完全校準。
在TOF的情形下,可以知道質譜峰寬度(FWHM)Δm與質量(m)之間存在以下關系Δm=am]]>其中a是已知的校準系數。換句話說,在質量范圍內測量的峰寬度隨質量的平方根而增加。通過平方根變換,把質量軸變換成新的函數如下m′=m]]>其中在變換的質量軸上測量的峰寬度(FWHM)被給出為Δm2m=a2]]>它在質譜范圍內保持不變。
對于FT MS儀器,另一方面,峰寬度(FWHM)Δm正比于質量m,所以,需要對數變換m′=ln(m)其中在變換的對數空間中測量的峰寬度(FWHM)被給出為ln(m+Δmm)=ln(1+Δmm)≈Δmm]]>它是固定的,與質量無關。典型地在FTMS中,Δm/m可以以10-5的量級被處理,即對于分辨能力m/Δm為105。
對于磁扇儀器,取決于具體的設計,質譜峰寬度和質量采樣間隔通常遵循對質量的已知的數學關系,這可以適用于變換的特定形式,通過該變換,預期的質譜峰寬度變為與質量無關,很像對TOF和TFMS進行的平方根和對數變換的方式。
雖然以上討論的變換對提供增強的校準大大有助,但希望具有更普遍的變換形式以便用于所有的儀器。這是因為例如平方根變換只有有限的可應用性,而為了執行有效的計算,對數變換往往使得在低質量處的峰變得太寬,而在高質量處的峰變得太窄。
按照包括上述更具體方法的這個更一般的技術,第一步驟是通過測量標準或標準混合物而測量峰寬度作為質量的函數,根據它們可以在感興趣的質量范圍上觀察到多個明確定位的峰。這個標準可以與在質譜儀校準中所用的標準是相同的。在諸如單位質量分辨率或更低分辨率這樣的中等分辨率質譜儀的情形下,必須進行上述的去卷積處理過程,在測量峰寬度之前使用同位素豐度計算來達到峰形狀函數。
標準的例子可包括肽混合物;蛋白質混合物;或聚合物,諸如PPG或PEG或聚丙氨酸(氨基酸),它們根據多個單體組合形成在高達2000amu的非常大的質量范圍上具有71amu間隔的峰范圍。在高分辨率系統上,同位素的分布比起儀器峰形狀函數變得更重要。例如,在qTOF質譜儀系統上,在單一同位素峰與來自其它同位素的峰之間的可以有足夠的間隔,這樣,可以直接讀出在測量的單一同位素峰以外的儀器峰形狀函數而不用進行牽涉到同位素分布的去卷積處理過程。在具有低質量分辨率MS系統,諸如來自Fremont,CA的Ciphegen Biosystems的SELDI PBSII系統,標稱地以一個質量單位間隔(單電荷)或1/z質量單位間隔(多電荷z)出現的同位素分布,在高的質量處變為如此不重要,以致可以把觀察的質譜峰作為僅僅來自儀器峰形狀函數來處理,因此消除了上述的去卷積步驟。
在質譜儀上觀察到的峰寬度由質量分析儀(諸如在TOF MS中的飛行管)本身對電離源(進到TOF MS的管道的離子能量的變化導致離開管道的時間變化,或在四極子MS中,進到四極子的離子能量的變化導致離開四極子的離子的空間和/或時間分布)、氣體或液體樣品進到電離源的流速率等等施加影響。在TOF MS的情形下,當考慮到所有的影響因素時,由飛行管道單獨引起的峰寬度的平方根相關性被轉為在原始數據中觀察到的更一般的二次關系。
對觀察到的峰寬度(Δm)對質量(m)的最小二乘擬合可得出峰寬度作為質量的函數Δm(m)的分析表示式。當峰寬度對質量有強烈依賴性時,最好通過某個函數f(m)變換質量軸,以使得在變換軸f(m)上觀察的峰寬度(例如,在半最大值處的全部寬度或FWHM)變為在整個質量范圍內是恒定的,f(m1)-f(m0)=f(m0+Δm)-f(m0)=常數通過臺勞級數展開和其它導數,以上的關系可被變換成 dfdmΔm=d]]>dfdm=dΔm]]>f(m)=∫dΔm(m)dm∝∫1Δm(m)dm]]>其中積分是在質量的整個范圍上進行的,以及其中常數d和積分常數被忽略而不影響變換的用途。
在LC qTOF MS儀器的情形下,存在以下形式的二次關系式Δm=am2+bm+c按照以上的積分的變換被給出為f(m)∝ln|m-r1m-r2|]]>其中r1和r2是以上給出的二次方程式形式的兩個根。在例如由Waters MicroMass制造的qTOF II儀器的更具體的情形下,發現了峰寬度與質量有以下的關系Δm=3.53e-8m2+1.35e-4m+1.32e-2這里r1,2=[-100-3724]
所以,具有以下形式的變換f(m)∝ln(m+100m+3724)]]>變換的某些其它例子FTMSΔm∝m,f(m)∝ln(m)TOF分析儀部分(沒有考慮流和樣品情形)Δm∝m,f(m)∝m]]>低能量電離GC/TOFΔm∝bm+c,f(m)∝ln(bm+c)高能量電離MALDI TOFΔm∝m2,f(m)∝1m]]>在每種情形下,取適當的積分,以及以以上說明的方式得出表達式。例如,在某些LC TOF MS儀器中,二次項可能是不重要的,所以有Δm=bm+c這種形式的基本上線性的關系式,這產生變換ln(bm+c)。在峰寬度正比于質量的平方的儀器中,使用與如上所述的質量的倒數有關的變換可能是適當的。
當預期的質譜峰寬度變為與質量無關時,或者由于適當的變換,諸如在FTMS上的對數變換和在TOF-MS上的平方根變換,或者由于諸如很好地設計和適當地調諧的四極子或離子阱MS的特定儀器的固有特性,通過可應用于全部質譜范圍的單個校準濾波器,將能達到計算時間的極大的節省。這也簡化了對于質譜校準標準的要求為了校準只需要單獨一個質譜峰,而另外的峰(如果存在的話)可以只用作為檢驗或確認,從而為根據在它測量之前加入的或混合入樣品的內部標準對每次掃描的質譜數據實現完整的質譜校準鋪平道路。
現在描述按照本發明的說明性實施例的校準濾波器的應用。
以上計算的校準濾波器可以被排列成以下的結合的對角線濾波器矩陣
F=f1···fi···fn]]>其中在對角線上的每個短的列向量fi是從以上對于相應的中心質量計算的卷積濾波器取得的。fi中的元素是從卷積濾波器的元素以顛倒的次序取得的,即,fi=fi,mfi,m-1···fi,1]]>這個校準矩陣對于以1/8amu數據間隔質量范圍高達1000amu的四極子MS具有8000×8000的大小。然而,由于它的稀疏的特性,典型的存儲要求僅僅約為40×8000,40個元素的有效濾波器長度覆蓋5amu質量范圍。
圖12是顯示按照本發明的說明性實施例的、與內插和質量預對準相組合的濾波器矩陣應用的圖形表示800的圖。完全校準有三個分量預校準矩陣A;校準矩陣F;和后校準矩陣B。
預校準矩陣A取結合的對角線形式,沿對角線的每個非零列執行主要的內插功能。這個內插功能可包括(a)從非均勻間隔的原始MS數據變換成均勻間隔的MS數據;(b)質量軸的預對準;以及(c)對于TOF、FTMS、磁扇區儀器,或按需要對其它儀器的適當的變換。
校準矩陣F是用于執行峰形狀和質量軸校準的結合的對角線矩陣。
類似于預校準矩陣A,后校準矩陣B取結合的對角線形式,沿對角線的每個非零列執行另一個內插功能。這個內插功能可包括(a)從內部均勻間隔變換成均勻或非均勻的輸出間隔;(b)為TOF、FTMS、磁扇區儀器或按需要為其它儀器,變換返回到線性質量空間。
圖12所示的因子分解通過Lagrange內插而成為可能,其中內插可被構建為與在其上進行內插的與y軸無關的濾波操作。Lagrange內插算法在William Press等,“Numerical Recipes in C”(C的數字方法),2ndEd,1992,Cambridge University Press,p.537中描述,它的整個公開內容在此引用以供參考。對于輸出以預定質量間隔的原始質譜的儀器,全部三個矩陣可以作為校準過程的一部分被預先計算,以及事先相乘到總的濾波矩陣中F1=AFB它具有類似于F的結合的結構,但具有不同的元素。在對于所需要的每個質譜運行時,只需要一次稀疏矩陣乘法s0=sF1其中s是包含原始MS數據的行向量以及s0是包含以想要的輸出間隔的完全校準的數據的另一個行向量。這個運算的實時部分預期為是計算上高效的,因為它基本上把原始的未校準的數據濾波成用于輸出的完全校準的MS數據。在某些MS儀器上,每個質譜是以不同的和非均勻的質量間隔被采集的。在這種情形下,預校準矩陣A對每次采集是不同的,僅僅F和B矩陣是固定的,直至下一次執行校準為止。這兩個矩陣可以通過以下的實時運算被預先相乘,s0=sA(FB)它由于對每次采集要額外內插或乘法步驟在計算上是更昂貴的。替換地,可以選擇通過便宜的線性內插對每個掃描在預先規定的質量間隔上進行內插,因此通過從掃描到掃描保持完全校準濾波矩陣F1=AFB不變而提高計算效率。
應當指出,在某些儀器系統中,有可能對在進行的每次單獨的采集實行完全質譜校準。例如,在FTMS或TOF上,在對數或平方根變換后,對于MS峰(內部標準峰),為了通過公式2和3去構建具有沿對角線包含的相同非零元素的新的結合的對角線矩陣F而同時A和B可保持不變,只需要一個去卷積序列。這樣得出的完全校準然后可被應用到相同的原先的MS譜,以便對所有的峰(包括內部標準峰和要被分析的其它未知的峰)實行完全校準。相同的正在進行的校準可用到其它MS系統,其中峰形狀函數實際上是與進行變換或未進行變換的質量無關的,需要位于質量范圍內任何地方的一個MS峰的最小值作為內部標準,在這個標準上得出沿它的對角線具有相同的非零元素的濾波器矩陣F。內部標準是一個選定的具有明確特征的同位素集群的化合物,它可以事先在樣品準備步驟期間成為樣品或流,實時地在線灌注和混合,諸如在LC/MS實驗中經由T接頭在柱上或后柱上注入利血平。為了減小由內部標準造成的離子抑制,可以在混合之前使得內部標準在分開的電離源中從樣品流不斷地電離成離子,諸如來自WatersCorporation,Waltham,MA的多路復用的ESI擴散源或來自AgilentTechnologies,Palo Alto,CA的雙ESI鎖定擴散源。
通過一個更新的算法可以執行這種完全校準的某些部分,以便以計算上有效的方式把外部標準(通過不同的MS獲取)與內部標準(在同一個MS獲取內)相組合。例如,可以根據最近測量的外部標準把上次可用的完全校準應用到包含內部標準峰的未知的樣品。通過在校準后檢驗內部標準的精確質量位置和峰形狀(見下一節,對于峰分析),可以發現峰形狀沒有改變而只存在最小質量位移。結果,FB保持為相同的而只需要矩陣A的小的更新,它完全能夠補償偏移。
通過外部和內部校準的組合的更全面的更新將牽涉到應用外部校準和使用至少一個內部標準通過另一個完全校準程序過程來更新它。對于把外部校準和內部校準兩者組合起來的一個原因是處理固有的儀器漂移。例如,由于溫度改變所造成的尺寸改變、加到質譜儀的各個不同部分的電壓的改變、和各種材料在離子源上的積累,可能發生相對于外部標準的儀器校準方面的變化。校準的這種漂移是按時間的函數而發生的,而且對于不同的物質通常是不同的。這種漂移由于離子計數噪聲可能會大于儀器的理論精度的量級,因此大大地降低了實際的儀器精度,有時達十倍以上。
在數學上,使用外部校準與內部校準的組合的校準可被表示為YEI=(YFE)FIY是其上施加外部校準濾波器FE(具有與來自上面的完全校準濾波器F1相同的形式)的原始數據,內部校準濾波器FI(同樣地具有與來自上面的F1相同的形式)被施加到該結果上,以產生經外部和內部校準的數據YEI。
在運算時,包含至少一個內部標準的樣品數據經受一次外部校準FE,它把原始樣品數據變換成外部校準的數據。這個外部校準的數據軌跡然后被處理為外部標準數據軌跡,經受必須的變換,與內部標準的同位素分布去卷積,以達到實時的和更新的峰形狀函數,內插或僅僅復制以覆蓋整個質譜范圍,另外的去卷積則計算附加的濾波器(FI),以便校正對于外部校準FE規定的目標峰形狀函數的任何偏差,如果必要在濾波器上內插,以及如果必要則變換回到原先的空間。換句話說,整個校準處理過程通過使用外部校準的數據軌跡作為輸入或原始數據再一次被重復,成為這里公開的校準程序過程以達到FI。
圖13類似于圖14,但在圖14上的一般步驟用下標“A”再表示。不同點在于,在70A使用從包含內部標準的樣品獲取的數據(諸如上述的化合物之一)。這個數據經受步驟72A,74A,76A,以便在78A產生外部校準的數據。其結果在70B被用作為輸入,輸入到在72B,74B和76B的內部校準處理過程,其中產生附加校準濾波器,當它與外部校準濾波器相組合時,它把外部和內部校準都考慮在內。在78B,可得到被外部和內部校準的數據,以供使用。
按照本發明的這個方面,變換通過在相同的變換空間中有利地使用相同的關系來實施,就像上述的在確定峰位置和峰形狀中使用的關系一樣。
將會看到,有效地使用這個方法的一種方式是進行外部校準,例如,一天一次(在開始儀器測量之前),或每幾小時一次,取決于儀器漂移的特性。按照內部標準的校準可以更經常完成,在極限情況下,可以在每個樣品運行期間對于每個質譜掃描都執行。
以上公開的方法的優點在于,為實行校準所需的一切只是單獨一個內部標準,因此可以最小程度地引入不是起源于感興趣的樣品的材料。然而,如果在特定的應用中是必要或想要的,則可以使用一個以上的內部校準標準。在某些應用中,內部標準作為樣品的一部分是容易得到的,例如當在LC/MS運行期間分析藥品代謝物時作為內部標準的藥品,其中已知的藥品(或已知的代謝物)和未知的代謝物在停留時間內可以共同淘洗或相互淘洗以作為自然出現的內部標準。
現在按照本發明的說明性實施例描述誤差通過校準濾波器的傳播。
為了適當地識別和定量分析質譜峰,重要的是估計校準的MS數據中的方差。對于大多數MS儀器,在離子強度測量中的隨機誤差是由離子計數發射噪聲占優勢,即,在原始MS數據中的變化正比于離子信號本身。因此校準的MS譜s0的方差譜被給出為σ2∝sF2(公式4)其中F2與F1的尺寸相同,F1中所有的相應的元素被平方。這使得對同一個原始數據進行一次以上的濾波,其中所有的濾波器元素被平方。
圖14A,14B和14C是顯示按照本發明的說明性實施例的、在完全校準之前和之后質譜儀(MS)質譜的第一分段910和第二分段920(圖14A和14B)與方差譜930(圖14C)的圖。
現在按照本發明的說明性實施例描述質譜峰分析。質譜峰分析的說明將包括涉及到以下項目的說明峰矩陣構建;加權多重線性回歸(WMLR);重要峰的檢測;和對于峰分析的改進。
在上述的完全校準后的MS譜理想地適用于有效的、可靠的、和高度靈敏的峰檢測。正如在這一節后面將會看到的,雖然峰分析可以以自然質量單位或以變換的單位來實行(對于FTMS或TOF或其它儀器),但在變換過的空間(這里也稱為“校準的空間”)中執行質譜峰分析,可以達到重大的計算節省,其中峰形狀函數在整個質量范圍內具有相同的寬度。
本發明對于以下操作是特別有用的大范圍質譜校準;以及峰檢測、精確的質量測定(mass assignment)、峰面積積分、和對峰存在的概率、質量精度和峰面積置信度間隔的統計測量。
本發明的兩個方面的原理、特別是本發明處理峰確定或峰檢測(它是在LC、GC、CE、和甚至核磁共振(NMR)中的挑戰性問題)的方面,都可以應用到其它儀器中。
在存在測量噪聲的情形下,可以觀察到以圖15A的形式的數據軌跡。這個數據軌跡可以來自例如用于檢測從液體色譜分離柱分離的蛋白質或肽的以245nm工作的單通道UV檢測器,附著在其上的折射率檢測器,附著在氣體色譜分離柱的火焰離子檢測器,在分離附著有熒光染料的DNA裂片后附著到電泳通道的末端的熒光質檢測器,等等。非常希望在這些應用中具有魯棒的和有效的峰檢測算法,這樣,諸如DNA分段或特定的肽的某些分析物的存在與否可以連同諸如每一個分析物的數量這樣的定量信息,和諸如每個分析物到達檢測器的時間這樣的定性信息一起被評估。X軸不一定必須是時間,作為例子,x軸是諧振頻率的ppm漂移的NMR同樣是可應用的。
圖15A上的固有的峰形狀是不對稱的,它可以隨諸如時間或頻率的x軸變量而變化,就好像在質譜軌跡中質譜峰形狀函數那樣,是不對稱的和隨質量(m/z)而改變。可以優選地把峰形狀函數校準成具以下特性的已知的數學函數,以便利用這里公開的所有精確的計算特性對經由偏移快速計算的對稱峰形狀函數;在整個范圍上均勻的峰形狀函數,用于數字穩定性和最小的誤差傳播。
校準牽涉到運行一個很好地間隔的和很好地區別的化合物的混合物,以便在感興趣的整個范圍內建立一組測得的峰形狀函數,從這組測量的峰形狀函數可以通過使用Lagrange內插、SVD內插、小波內插、或這里提到的所有的任何其它明確地建立的內插方法的內插用數字來計算在任何給定的點的峰形狀函數。這些測得的峰形狀函數然后可以通過這里公開的校準濾波器被變換成想要的目標峰形狀函數,諸如高斯函數或高斯函數與具有每個適當的寬度的矩形函數的卷積。
圖15B顯示在把校準濾波器施加到圖15的數據軌跡后的經校準的數據軌跡。正如可以看到的,通過施加校準濾波器,出現很大程度的噪聲濾波,它也把峰形狀函數變換成在整個范圍內具有相等寬度的對稱峰形狀函數。目標峰形狀寬度的選擇應當是使得目標峰形狀寬度稍微大于測得的峰寬度,以保證良好程度的噪聲濾波與取信號均值,但不應比測得的峰寬度寬得多而造成分辨率明顯惡化。
通過不論是從標準混合物直接測得的、或是在施加校準濾波器后從數學函數算出的峰形狀函數,接著就可以構建峰分量矩陣和如果必要的話以迭代方式應用WMLR(加權多線性回歸),以便對于以后到來的許多未知的樣品進行峰分析,直至下一次通過系統進行校準標準混合物為止。這樣的峰分析的結果是列出以下參數的一個表檢測到的峰、峰位置、峰面積、和有關峰存在或不存在的概率與對于每個峰的置信度間隔的所有的相應的統計量。圖15C顯示峰分析的部分結果,被表示為具有所有的峰位置和峰面積的豎線。
在上述的質譜校準的情形下,可以優選地在執行確定峰形狀和變換之前把時間或頻率軸變換成新的空間,并且可能想對每個樣品加上內部峰標準以允許外部和內部標準達到可能的最高精度。
現在描述按照本發明的說明性實施例的峰矩陣構建。峰分析問題被說明為如下質譜軌跡是標稱地以1/z質量單位隔開的已知的峰形狀的許多峰的線性組合,其峰中心偏差反映質量缺陷。對于帶單個電荷的離子(z=1),標稱間隔相隔1個質量單位,其在正的或負的方向上具有的某些偏差反映物質缺陷。質譜峰分析問題然后用公式表示為多元線性回歸(MLR)s0=cP+e (公式5)其中s0是包含完全校準的MS譜,P是在它的行中包含標稱地間隔的已知的峰函數(每個具有按分析地積分的單位面積)的峰分量矩陣,c是包含對于所有的標稱間隔的峰的、積分的峰強度的行向量,以及e是擬合的殘數。為了計及基線的影響,可以把基線分量,諸如偏移、一階線性項或其它高階非線性函數形式,添加到P矩陣的各行上,它的相應的行向量c被相應的系數所擴增,以表示這些基線分量的影響(如果有的話)。
應當指出,以上描述的完全質譜校準允許分析地計算峰分量矩陣P,其中所有的峰按分析地積分成單位面積,導致c的相應的估值自動報告按分析地積分的面積,通過自動噪聲濾波和信號平均(留在e中的)不受來自位于附近的其它峰(諸如其它同位素峰)的干擾。由于完全相同的原因,也有可能在鄰近的同位素峰之間執行未偏置的同位素比值測量。
而且,峰分量矩陣P的結構可以通過執行以上的總的MS校準,在標稱質量間隔的精確的分數部分(例如在1amu的1/4,1/5,1/8,1/10,1/12,1/16處)輸出校準的MS數據而變成在計算上更加有效。這樣,峰形狀函數對于P中的一行只需要被估計一次,其它的行通過簡單地向前或向后移位這個行就可形成。應當指出,結合本發明的討論所提到的標稱質量間隔對于帶單個電荷的離子是指1個質量單位間隔或對于帶z電荷的離子是指1/z個質量單位間隔。
現在描述按照本發明的說明性實施例的加權多元線性回歸(WMLR)。由于誤差項e在校準部分中表示的質譜范圍內沒有統一的方差,需要執行加權多元線性回歸(WMLR)而不是通常的MLR。
s0diag(w)=cPdiag(w)+e (公式6)其中diag(w)是具有由公式4給出的、沿對角線的權因子的對角線矩陣,w=1/σ2=1/(sF2)其中在所有的質量之間共用的比例常數被丟棄而不影響回歸。
公式6的最小二乘解是c=s0diag(w)PT[Pdiag(w)PT]-1(公式7)以及它的方差被估計為s2{c}=e2diag{[Pdiag(w)PT]-1} (公式8)其中e2是基于加權平方的偏差e2=ediag(w)eT/df其中e由公式5中的擬合殘數給出的,以及df是自由度,被定義為在獨立的質譜數據點的數目與被包括在矩陣P中的行的數目(要被估計的c中的系數的個數)之間的差值。公式6的最小二乘解由JohnNeter等在Applied Linear Regression(應用線性回歸),2ndEd.,Irwin,1989,p.418中進一步描述,該文獻的公開內容在此引用以供參考。
對于具有1/8amu的質量間隔的、達到1000amu的質量范圍的MS儀器,峰分量矩陣P典型地是1000×8000,但它是非常稀疏的,在每個峰行中(基線分量具有在相應的行中所有的非零)有不大于40個非零元素(覆蓋5amu質量范圍)。數據存儲效率可以利用以下事實來加索引(indexing)而得到顯著提高當以標稱質量間隔的確切的分數部分來采樣時峰分量是僅僅互相移位的版本。在計算上,通過稀疏矩陣運算中分開地預先計算s0diag(w)PT和[Pdiag(w)PT],可以得到增益。后一項的預先計算應當導致1000×1000大小的另一個稀疏對稱矩陣,但在以上的例子中具有約120的對角線帶寬(在每行中的非零元素)和約60的半帶寬(考慮對稱性)。
在整個質量范圍內不存在相同的和對稱峰形狀函數的基線分量的情形下,以上的運算導致一個稀疏矩陣[Pdiag(w)PT],它具有可修改用于通過塊循環減小而在計算上有效地求逆得到[Pdiag(w)PT]-1的塊的循環結構。塊的循環減小由Gene Golub等在MatrixComputations(矩陣計算),1989,Johns Hopkins University Press,p.71中進一步描述,它的整個公開內容在此引用以供參考。
即使在存在具有在質量范圍內變化的和非對稱峰形狀函數的基線分量的情形下,稀疏矩陣[Pdiag(w)PT]將具有以下的專門的形式(例如,假設來自偏移、一階、到二階的三個基線分量)×××××××××××××××××××××××××××××××××××××××××××]]>它可以作為塊對角線系統被有效地求解。塊對角線系統由GeneGolub等在Matrix Computations(矩陣計算),1989,Johns HopkinsUniversity Press,p.170中進一步描述,它的整個公開內容在此引用以供參考。
當真實的質譜峰沒有與標稱質量精確相重合時,可以有以下的線性組合方程(這里為了簡化起見,忽略任何基線分量而不失一般性),s0=∑cipi+e=∑cipi(mi)+e其中具有中心質量mi的峰形狀函數pi可通過臺勞級數被展開為一階導數pi(mi)=pi(mi0+Δmi)≈pi(mi0)+Δmidpi(mi0)dm]]>其中pi(mi)是以真實質量位置mi為中心的峰形狀函數,pi(mi0)是以接近于mi的標稱質量位置mi0為中心的峰形狀函數,Δmi是真實的與標稱的質量位置之間的差值(質量缺陷或由于多個電荷造成的離標稱質量的偏差),以及dpi(mi0)/dm是以標稱質量位置mi0為中心的峰形狀函數的分析地計算的一階導數。
考慮到質量缺陷,具有以下的修改的公式s0=Σcipi+e=Σcipi(mi0)+Σ(ciΔmi)dpi(mi0)dm+e=Σcipi(mi0)+Σcn+idpi(mi0)dm+e]]>其中cn+i=ciΔmi和n是所考慮的標稱質量的數目。通過寫回到矩陣形式,可以有s0=cP+e (公式9)其中c和P現在通過在導數項前面的系數和導數項本身被增擴。重要的是指出,因為峰形狀函數被選擇為是對稱的(所以,正交于峰形狀函數本身),把它們的導數包括進來對于峰分量矩陣P的條件沒有有害的影響,而導致可得到的最精確的質量確定和最可重復的峰積分。
上述的相同的WMLR可被應用來求解方程9,以及達到積分的峰面積c1,c2,cn。此外,公式8可用來計算對于這樣得到的每個峰面積的標準偏差,導致對于這些峰面積的精巧的統計測量值。
實際的質量位置的改進的確定可得出如下mi=mi0+Δmi=mi0+cn+i/ci(公式10)其中在Δmi的確定中的相對誤差被給出為|s(Δmi)/Δmi|=|s(ci)/ci|+|s(cn+i)/cn+i|對于ci和ci+n的標準偏差可直接從公式8得出。換句話說,對于移位估值的標準誤差是s(Δmi)=[|s(ci)/ci|+|s(cn+i)/cn+i|]|Δmi|它也是對于在公式10中給出的實際的質量的標準誤差。
現在描述按照本發明的實施例的重要的峰的檢測。根據來自上一節的峰面積估值(公式7)和它的標準偏差計算(公式8),可以計算t-統計值ti=ci/s(ci)fori=1,2,...,n它可以與自由度(df)相組合以統計地檢測濃度估值ci是否明顯地大于零,即質譜峰是否存在。典型地,df是足夠大以致可被認為是無窮大,以及大于3.0的t-統計值或其它用戶選擇的截止值表明在統計上明顯地存在質譜峰。應當指出,考慮到這樣的事實在圖12所示的完全校準后單獨的質譜點在統計上不再是無關的而變為與它的噪聲相關的,因而可能需要高于通常的3.0的數值的t-統計截止值。通過計算機模擬或實際經驗可以建立實際的截止值。
圖16A是顯示按照本發明的說明性實施例的、反映t統計作為對整個質量范圍內可能的質譜峰(從圖5取的原始質譜)的精確質量位置的函數(公式10)的豎線質譜1010的圖。圖16B和16C是顯示按照本發明的說明性實施例的、原始MS譜分段的重疊1020和它的完全校準的版本1030的圖。圖16D是顯示按照本發明的說明性實施例的、相應的t統計1040和2其臨界t值設置在12的水平截止線1050的圖。同時的噪聲濾波/信號平均和峰形狀校準的高度可以在圖16B上清楚地看到,這可以大大方便于實行具有圖16D所示的高度敏感的結果的峰分析,其中檢測將僅僅受制于數據中的隨機噪聲而沒有人工產物或其它系統誤差源。
然后具有大于截止值的t-統計的質譜峰被報告為是統計上顯著的,而低于截止值的這些峰則被報告為是不顯著的。對于具有相應的離子裂片的特定的分子的識別和定量分析,也可以連同t統計一起報告精確的質量位置和積分的峰面積。雖然F統計可能在這里得到更嚴密的應用,但可以相信,由于在峰分量之間的最小互動(小的協方差),臨界的t統計將是足夠的。F-統計在多元共線性上的應用由JohnNeter等在Applied Linear Regression(應用線性回歸),2ndEd.,Irwin,1989,p.300中進一步描述,該文獻的公開內容在此引用以供參考。
現在描述按照本發明的說明性實施例的峰分析的改進。當希望有高的質量精確度時,可以通過處理以上得到的結果作為初始估值而構建迭代峰分析過程,以及通過使用從公式10新計算的實際質量位置來更新峰分量矩陣P。由于更新的質量位置互相將沒有間隔開一個標稱質量單位,在P中每個峰分量和它的導數形式對于所有的重要的峰將需要分開地分析計算(根據上述的t-測試)。通過構建的新的P矩陣,可以算出對c的新的估值,給出實際的質量位置的另一個更新mi(k)=mi(k-1)+Δmi(k)=mi(k-1)+cn+i(k)/ci(k)其中k=1,2...以及mi(0)=mi0(標稱質量位置)。當增量的更新cn+1(k)變得與從公式8預測的標準偏差可比擬時,這種迭代改進就將完成。通過實施的這樣的改進,由于對于這樣的峰可得到的高的信號-噪聲比,對于強的質譜峰,可以達到極高的質量精度,例如對于圖5上質量69處的峰的2ppm質量精度。當峰強度下降時,由于可用于檢測的離子數目減小,質量精度將惡化。換句話說,質量精度僅僅由數據中的隨機噪聲限制,而不受限于其它人工產物或系統誤差源,諸如化學噪聲的存在,來自同位素峰的干擾,不規則的峰形狀,或未知的基線,因為這些人工產物已由這里采取的校準和峰分析方法而完全補償。
現在描述本發明的許多附加的優點和特性的某些部分。本發明提供數學上精確的、統計上完整的和基于物理的、用于處理質譜儀數據的方法。有利地,本發明把噪聲的存在和同位素峰認為是總的方案中附加的有用的信息。本發明把噪聲、同位素分布、多個電荷、基線、峰識別、峰定位、和峰定量分析都全部同時在一個合并的過程中處理。本發明組合偶爾的MS校準與常規的MS數據分析,并可以極大地改進高或低分辨率MS系統的質量精度。在具有單位質量分辨率(FWHM=0.5-0.7amu)的傳統的MS系統中,可以達到1-5ppm級別的質量精度。本發明包括內置的基線確定、噪聲濾波/信號平均、和峰積分。本發明是計算上高效的,這樣,它可被利用來在GC/MS或LC/MS或其它時間有關的MS檢測系統上正在進行的(on-the-fly)數據縮減。本發明具有用于儀器診斷和數據質量控制的輸出統計值。而且,本發明牽涉到具有對于噪聲和其它人工產物的可預測的特性的所有的線性算子。本發明對于強的峰達到高的質量精度和對于弱的峰達到高的靈敏度,具有高的動態范圍。本發明允許所有不同類型的MS儀器的標準化和通用的高度精確的庫搜索。這允許在復雜的基體中以大大地減小的成本作分子印記,即使因可達到的高的質量精度而對于分離沒有需要的話。
雖然以上的質譜校準和峰分析是對于具有至少單位質量分辨率的典型的質譜儀系統而描述的,但應當看到,即使對于不能區分位于單位質量內的峰或1/z質量差值的、低分辨率質譜儀系統而言,以上的質譜校準仍會帶來重大的和固有的優點。在低分辨率質譜儀系統中,由于缺乏譜分辨率,明確的峰識別是不可行的。代替包括峰識別和定量分析的傳統的峰分析,完全的質譜軌跡被用作為多變元統計分析的輸入,以用于通過多變元校準的分析物定量分析或通過集群分析或模式識別的樣品分類。這些多變元統計方法包括主要分量分析(PCA)或主要分量回歸(PCR),正如由Bruse Kowalski等在J.Chemometries,1991,5,129中所描述的,它的公開內容在此引用以供參考。用于這些多變元統計方法的成功的應用的一個關鍵的因素是高的質量精度和在樣品與儀器之間的一致的峰形狀函數,正如在Yongdong Wang等在anal.Chem.,1991,63,2750中所描述的,它的整個公開內容在此引用以供參考。由本發明引入的完整的質譜校準應當正確地對準在不同的樣品或儀器之間的質量軸和質譜峰形狀函數,從而允許進行高度精確的多變元譜比較,以用于分析物定量分析或樣品分類(正如在生物標記發現中使用的)。
圖17是顯示按照本發明的說明性實施例的、用于操作質譜(MS)儀系統的方法的圖。MS儀系統至少在峰形狀和質量軸方面被校準(步驟1110)。應當看到,步驟1110可被分割成下面的步驟1110A-1110G。
還應當看到,步驟1110E-1110H是任選的。如果執行步驟1110E-1110H,則可以在圖17的方法以后執行圖19的方法。然而,如果省略步驟1110E-1110H,則可以在圖17的方法以后執行圖20的方法。
在步驟1110A,對于給定的校準方法,計算同位素的相對豐度和精確的質量位置。
在步驟1110B,根據算出的同位素峰集群和相應于校準標準而測量的同位素峰集群,預對準同位素質量,以便校準MS儀器系統的質量軸。
在步驟1110C,得出相應于計算的和測量的同位素峰集群的峰形狀函數。
在步驟1110D,對相應于得出的峰形狀函數的數據進行內插,得出在想要的質量范圍內的其它的峰形狀函數。每個得出的峰形狀函數和其它峰形狀函數相應于實際測量的質量位置。
在步驟1110E,峰形狀函數和其它峰形狀函數被變換成以想要的質量范圍內確切的中點為中心的目標峰形狀函數。
在步驟1110F,從目標峰形狀函數和計算的峰形狀函數計算校準濾波器。
在步驟1110G,把校準濾波器內插為更細的網格。
在步驟1110H,應用校準濾波器以便校準MS儀器系統。
圖18是進一步顯示按照本發明的說明性實施例的圖17的方法的步驟1110H的圖。步驟1110H包括下面的步驟1210A-1210C。
在步驟1210A,計算預校準矩陣。預校準矩陣的計算包括把非均勻間隔的數據變換成均勻間隔的數據,所述變換包括質量軸的預對準以及任選地包括用于TOF、FTMS、或其它儀器的變換。
在步驟1210B,計算校準矩陣。校準矩陣的計算包括創建一個結合的對角線矩陣,其中在每列中的非零元素取自在移位后以顛倒的次序的卷積濾波器的元素。
在步驟1210C,計算后校準矩陣。后校準矩陣的計算包括從內部間隔到輸出或想要的間隔進行內插,以及把變換過的空間變回原先的質量空間。
圖19是顯示按照本發明的說明性實施例的、用于分析從MS儀系統得到的質譜儀(MS)質譜的方法的圖。
在完全校準后分析MS譜中的峰(步驟1310)。優選地,但不是必須的,在全部質譜范圍內峰形狀函數是相同的。
接收校準的MS數據,該數據具有優選地等于標稱質量間隔(例如,1amu或1/z)的整數的分數部分(例如,1/4,1/5,1/8,1/10,1/12,1/16)的質量間隔(步驟1310A)。
計算全部峰分量矩陣的一對矩陣行,這樣,該對的一行存儲被歸一化到單位峰面積的目標峰形狀函數,而該對的另一行存儲被存儲在該對的該行中的目標峰形狀函數的一階導數,這樣,目標峰形狀函數和它的一階導數兩者都以標稱質量間隔的整數的分數部分被采樣(步驟1310B)。
通過給矩陣加下標以使得行的殘余部分中的峰分量被安排為相應于在全部質譜范圍內的每個標稱質量的互相移位的版本,從而完成該全部峰分量的矩陣(步驟1310C)。
使用質譜方差的倒數作為權因子來計算在全部質譜范圍內所有的標稱質量處的積分的峰面積和質量偏差,從而執行加權多線性回歸(WMLR)運算(步驟1310D)。
對于所有的峰面積和質量偏差計算標準偏差(步驟1310E)。
通過加入計算的質量偏差把標稱質量從相應的標稱質量更新到實際的質量(步驟1310F)。
執行(步驟1310D)、計算(步驟1310E)、和更新(步驟1310F)步驟被重復進行,直至在峰面積或質量偏差中任何遞增的改進量小于相應的標準偏差或其它預置的準則(步驟1310G)。如果在峰面積或質量偏差中的遞增的改進量不小于相應的標準偏差或其它預置的準則,則使用實際的質量來重建全部峰分量矩陣(步驟1310H),以及方法返回到步驟1310D。否則,方法進到步驟1310I。
對于所有的峰面積計算t-統計值(步驟1310I),以得到質譜峰表,它包括峰面積和對于統計上顯著的質量峰的精確的質量(步驟1310J)。
圖20是顯示按照本發明的說明性實施例的、用于分析質譜儀(MS)質譜的方法的圖。
在確定覆蓋全部質譜范圍的峰形狀函數后分析MS譜中的峰(步驟1410)。進行峰形狀內插,以得到在每個標稱質量處一個峰形狀函數(步驟1410A)。
對所有的標稱質量計算峰形狀函數的一階導數(步驟1410B)。把峰形狀函數和相應的一階導數組合成全部峰分量矩陣(步驟1410C)。
使用質譜方差的倒數作為權因子來執行加權多元線性回歸(WMLR)操縱以計算在全部質譜范圍內所有的標稱質量處的積分的峰面積和質量偏差(步驟1410D)。
對所有的峰面積和質量偏差計算標準偏差(步驟1410E)。
通過加入計算的質量偏差而把標稱質量從相應的標稱質量更新為實際的質量(步驟1410F)。
執行(步驟1410D)、計算(步驟1410E)、和更新(步驟1410F)步驟被重復進行,直至在峰面積或質量偏差中任何遞增的改進量小于相應的標準偏差或其它預置的準則(步驟1410G)。如果在峰面積或質量偏差中的遞增的改進量不小于相應的標準偏差或其它預置的準則,則通過使用實際的質量重建全部峰分量矩陣(步驟1410H),以及方法返回到步驟1410D。否則,方法進到步驟1410I。
對所有的峰面積計算t-統計值(步驟1410I),得到質譜峰表,它包括峰面積和對于統計上顯著的質量峰的精確的質量(步驟1410J)。
圖21是顯示按照本發明的說明性實施例的、用于創建用于質譜儀(MS)系統的校準濾波器的方法的流程圖。
選擇一個或多個化合物作為質譜儀(MS)標準(1510)。在MS標準上獲取MS分布數據(步驟1510A)。識別每個離子裂片集群(步驟1510B)。
在步驟1510B后,確定是否存在重要的同位素(步驟1510N)。如果是的話,按精確的質量計算相對同位素豐度(步驟1510C)。執行預校準步驟(步驟1510D)。預校準步驟可包括對原始數據執行與預校準儀器有關的變換,執行預校準質量間隔調節,和/或預校準質譜同位素峰。
然后確定是否想要得到峰形狀函數(步驟1510E)。如果是的話,通過使用具有窄峰寬度的同一個連續函數對算出的相對同位素豐度和測量的同位素峰集群都執行卷積運算,然后在卷積運算后在測量的同位素峰集群與最終得到的測量的同位素峰集群之間執行去卷積運算(步驟1510T),以得到至少一個峰形狀函數(步驟1510P),以及方法進到步驟1510Q。否則,在算出的相對同位素豐度與目標峰形狀函數之間執行卷積運算(步驟1510F),然后在測量的同位素峰集群與在卷積運算后最終得到的同位素峰集群之間執行去卷積運算(步驟1510G),以得到至少一個校準濾波器(步驟1510H)。
還是在步驟1510B后,確定是否存在重要的同位素(步驟1510N)。如果不是的話,執行預校準步驟(步驟1510O)。預校準步驟可包括對原始數據執行與預校準儀器有關的變換,執行預校準質量間隔調節,和/或預校準質譜同位素峰。
這樣得到的峰形狀函數(步驟1510P)在與特定的目標峰形狀函數(步驟1510R)進行去卷積運算(步驟1510S)之前進行內插(步驟1510Q)。
在步驟1510S,在質譜目標峰形狀函數與測量的質譜峰形狀函數和計算的質譜峰形狀函數這兩個函數中的一個函數之間執行去卷積,以把質譜峰形狀函數和至少一個其它質譜峰形狀函數變換成以在由該質譜峰形狀函數和該至少一個其它質譜峰形狀函數覆蓋的各個質量范圍內的中點為中心的質譜目標峰形狀函數。從以在由該質譜峰形狀函數和該至少一個其它質譜峰形狀函數覆蓋的各個質量范圍內的中點為中心的質譜目標峰形狀函數,計算至少一個校準濾波器(步驟1510H)。
在兩個校準濾波器之間執行內插運算,得到在想要的質量范圍內的至少一個其它校準濾波器(步驟1510I)。
從步驟1510H的校準濾波器和從步驟1510I的內插得到的任何校準濾波器,得到完全的校準濾波器組(步驟1510J)。執行后校準步驟(步驟1510K)。后校準步驟可包括執行與后校準儀器有關的變換和/或后校準質量間隔調節。
數據相應于預校準步驟1510O、步驟1510J的完全的校準濾波器組、和后校準步驟1510K而被組合(步驟1510L),以得到完全的校準濾波器組F1和方差濾波器組F2(步驟1510M)。
圖22是顯示按照本發明的說明性實施例的、用于處理質譜儀(MS)數據的方法的框圖。
在測試樣品上獲取MS分布數據(步驟1610)。如果必要,分布數據要進行內插(步驟1610A)。對完全的校準濾波器組F1和/或方差濾波器組F2執行稀疏矩陣乘法(步驟1610B)。然后,如果必要的話,把校準的數據內插到所報告的質量間隔(步驟1610C)。
在每個質量采樣點處報告質譜方差(步驟1610G),以及該方法進到步驟1610H。另外,在步驟1610C后,對質量和峰形狀校準質譜數據(步驟1610D),以及方法進到步驟1610E。
在步驟1610E,確定所使用的MS儀器系統是否具有足夠高的分辨率以便允許質譜峰識別。如果是的話,方法進到步驟1610H,用于質譜峰識別。否則,方法進到步驟1610F,用于直接比較全部質譜數據而不進行顯然的峰識別。
在步驟1610H,執行質譜峰定量分析和精確的質量確定步驟。在步驟1610F,通過多變元校準而執行定量分析或通過使全部質譜響應曲線作為輸入而不進行顯然的質譜峰識別作模式識別/集群分析,從而執行定性分析。
本發明的原理也可用到分析諸如在活體組織或血液中的那樣的非常復雜的蛋白質混合物的情形。在這些情形下,為了研究或診斷,所分析的化合物不一定是純的。即使存在純的化合物,化學分子式或本性也可能是未知的。而且,在這些具有非常復雜的質譜的非常復雜的樣品中,添加標準的校準化合物可能是不利的,這使得復雜的情形甚至更難解譯。最后,有時可能發生錯誤在進行樣品操作之前遺漏放置標準校準化合物。很難或不可能重新放置樣品以重復進行操作。
盡管如此,通過進行相對校準,有可能利用本發明的原理。復雜的生物樣品常常包含提供共同背景的某些化合物。例如,血液通常包含血紅素和BSA(血清白蛋白)。按照本發明的一般性原理,在具有與被分析的樣品相同的一般特性的測試樣品中測得的特定的峰可被選擇為“金標準”。然后在金標準中選定的峰作為被分析樣品中的目標來對待。這些選擇的峰任選地可以與其寬度比起原先的峰是很小的已知函數(諸如高斯函數)進行卷積而形成目標。以上詳細地討論過的變換、濾波、卷積和去卷積都可以執行。卷積濾波器用來作用在被分析的樣品的峰上(就好像它們是計算的峰形狀函數那樣對待),以使得它們可以與金標準進行比較。這可以只用一個峰作為具有被復制的或擴展的卷積濾波器的金標準以便覆蓋范圍內的所有的峰位置而完成。如果選擇金標準的一個以上的峰,則可以對在峰之間的位置執行在峰之間的內插。這些過程對被分析的每個樣品都有利地遵循。
一旦完成這些步驟,就可以對最終得到的數據就進行各種不同的形式的差異分析。可以使用模式識別、判別式分析、集群分析、主要成分分析、局部最小二乘分析、和各種多變元回歸分析。雖然絕對精度不一定得到保證,但這些結果對于預篩選、篩選或醫學診斷是極其有用的。這對于醫學研究或診斷,特別是在診斷可以通過其它的、或許更為侵入式技術被獨立地確認的情形下,可能是特別有價值的。
雖然說明性實施例在這里是參照附圖描述的,但應當看到,本發明不限于這些精確的實施例,以及本領域技術人員可以作出各種其它改變和修改而不背離本發明的范圍或精神。所有的這樣的改變和修改打算被包括在由所附權利要求規定的、本發明的范圍內。
權利要求
1.一種為了得到用于校準質譜(MS)儀系統的至少一個校準濾波器的方法,包括以下步驟對于給定的校準標準,得到在質譜范圍中測量的同位素峰集群數據;對于給定的校準標準,計算相對同位素豐度和相應于該豐度的同位素的實際的質量位置;規定質譜目標峰形狀函數;在計算的相對同位素豐度與質譜目標峰形狀函數之間執行卷積運算,以形成計算出的同位素峰集群數據;以及在測量的同位素峰集群數據與在卷積運算后計算出的同位素峰集群數據之間執行去卷積運算,以得到至少一個校準濾波器。
2.權利要求1的方法,其中所述執行卷積運算和執行去卷積運算的步驟的任一項步驟利用傅立葉變換、矩陣乘法、和矩陣求逆的至少一項。
3.權利要求1的方法,在所述計算步驟以后執行的預校準步驟中,還包括根據在計算的相對同位素豐度的質心質量與測量的同位素峰集群的質心質量之間的最小二乘擬合,來預對準測量的質譜同位素峰的步驟。
4.權利要求1的方法,還包括以下步驟對原始質譜數據執行預校準與儀器有關的變換;以及對相應于測試樣品的計算出的數據組執行后校準與儀器有關的變換。
5.權利要求4的方法,其中所述執行預校準與儀器有關的變換和執行后校準與儀器有關的變換的步驟分別涉及到創建預校準結合的對角線矩陣和后校準結合的對角線矩陣,沿著各個矩陣中的每個矩陣的結合的對角線的每個非零元素用于分別執行相應于與預校準儀器有關的變換和與后校準儀器有關的變換的內插功能,以及所述方法還包括從該至少一個校準濾波器創建用于執行峰形狀和質量軸校準的校準結合的對角線矩陣的步驟。
6.權利要求5的方法,還包括在校準測試樣品之前把預校準結合的對角線矩陣、校準結合的對角線矩陣和后校準結合的對角線矩陣相乘成一個總的濾波矩陣。
7.權利要求6的方法,其中峰形狀和質量軸校準是通過在總的濾波矩陣與原始質譜數據之間的矩陣乘法而實現的,以及所述方法還包括創建另一個結合的對角線矩陣以估計校準的信號的質譜方差的步驟,該另一個結合的對角線矩陣對角上的每個非零元素等于在總的濾波矩陣中的相應的元素的平方。
8.權利要求7的方法,還包括下列步驟對校準的質譜數據施加加權回歸運算,以得到對于質譜峰的積分峰面積、實際的質量和其它質譜峰數據中的至少一項。
9.權利要求8的方法,其中加權回歸運算的權因子正比于質譜方差的倒數。
10.權利要求7的方法,還包括下列步驟對校準的質譜數據施加多元統計分析,以便對測試樣品進行定量、識別和分類中至少一項。
11.權利要求1的方法,還包括以下步驟執行從非均勻間隔的質量采集間隔到均勻間隔的質量間隔的預校準質量間隔調節;以及執行從均勻的間隔的質量間隔到報告的間隔的后校準質量間隔調節。
12.權利要求11的方法,其中所述執行預校準質量間隔調節和后校準質量間隔調節的步驟分別涉及到創建預校準結合的對角線矩陣和后校準結合的對角線矩陣,沿著各個矩陣中的每個矩陣的結合的對角線的每個非零元素用于分別執行相應于預校準質量間隔調節和后校準質量間隔調節的內插功能,以及所述方法還包括從該至少一個校準濾波器創建用于執行峰形狀和質量軸校準的校準結合的對角線矩陣的步驟。
13.權利要求12的方法,還包括下列步驟在校準測試樣品之前把預校準結合的對角線矩陣、校準結合的對角線矩陣和后校準結合的對角線矩陣相乘成總的濾波矩陣。
14.權利要求13的方法,其中峰形狀和質量軸校準是通過在總的濾波矩陣與原始質譜數據之間的矩陣乘法而執行的,以及所述方法還包括創建另一個結合的對角線矩陣以估計校準的信號的質譜方差的步驟,該另一個結合的對角線矩陣的對角上的每個非零元素等于在總的濾波矩陣中的相應的元素的平方。
15.權利要求14的方法,還包括下列步驟對校準的質譜數據施加加權回歸運算,以得到對于質譜峰的積分的峰面積、實際的質量和其它質譜峰數據中的至少一項。
16.權利要求15的方法,其中加權回歸運算的權因子正比于質譜方差的倒數。
17.權利要求14的方法,還包括下列步驟對校準的質譜數據施加多元統計分析,以便對測試樣品執行定量、識別和分類中的至少一項。
18.權利要求1的方法,其中該至少一個校準濾波器包括至少兩個校準濾波器,以及所述方法還包括在至少兩個校準濾波器之間進一步內插以得到在想要的質量范圍內至少一個另外的校準濾波器的步驟。
19.權利要求18的方法,其中所述內插步驟包括以下步驟收集供分解用的該至少兩個校準濾波器作為矩陣中的向量;分解包括該至少兩個校準濾波器的矩陣;在矩陣的分解的向量之間進行內插,以得到內插的向量;以及使用內插的向量重建該至少一個另外的校準濾波器。
20.權利要求19的方法,其中所述分解步驟是通過使用奇異值分解(SVD)和小波分解的至少一項執行的。
21.權利要求1的方法,還包括下列步驟通過連續灌注和在線混合中的至少一項在事先或實時把校準標準加到測試樣品,以便在單獨一次質譜采集中獲取校準數據和測試數據。
22.一種處理原始質譜數據的方法,包括以下步驟把一個總的濾波矩陣施加到原始質譜數據,以得到校準的質譜數據,其中總的濾波矩陣通過以下各項而形成對于在質譜范圍中的給定的校準標準所得到的測量到的同位素峰集群數據;為同一校準標準計算的相對同位素豐度和相應于該豐度的同位素的實際的質量位置;規定的質譜目標峰形狀函數;在計算的相對同位素豐度與質譜目標峰形狀函數之間執行的用于形成計算出的同位素峰集群數據的卷積運算;以及在測量的同位素峰集群數據與在卷積運算后計算出的同位素峰集群數據之間執行去卷積運算以得到用于總的濾波矩陣的至少一個校準濾波器。
23.權利要求22的方法,其中所述施加步驟還包括把原始的質譜數據內插到與由總的濾波矩陣所需要的相同的質量軸的步驟。
24.權利要求22的方法,其中所述施加步驟還包括把校準的質譜數據內插到與由總的濾波矩陣所給出的不同的任何想要的質量軸的步驟。
25.權利要求22的方法,還包括下列步驟對校準的質譜數據施加加權回歸運算,以得到積分的峰面積、實際的質量和用于質譜峰的其它質譜峰數據中的至少一項。
26.權利要求25的方法,其中加權回歸運算的權因子正比于質譜方差的倒數。
27.權利要求22的方法,還包括對校準的質譜數據施加多元統計分析,以便對測試樣品執行定量、識別和分類中的至少一項。
28.一種用于分析相應于從用于執行分析物的分離與分析這兩項中至少一項的儀器系統中所得到的數據的峰的方法,該方法包括以下步驟對在一個范圍內的峰施加加權的回歸運算;以及報告回歸系數作為積分的峰面積和峰位置偏差中的一項,所述峰位置偏差相應于標稱峰位置與估計的實際峰位置這兩者之一。
29.權利要求28的方法,其中所述方法在儀器系統被校準后執行,以使得峰形狀函數由目標峰形狀函數給出。
30.權利要求28的方法,其中加權回歸運算的權因子正比于峰強度方差的倒數。
31.權利要求28的方法,其中所述施加步驟和報告步驟重復進行,直至在積分的峰面積與峰位置偏差的至少一項中的遞增的改進滿足預置的準則。
32.權利要求28的方法,其中所述分析步驟還包括下列步驟根據加權回歸的加權因子計算積分的峰面積與峰位置偏差中的至少一項的標準偏差。
33.權利要求32的方法,其中所述計算步驟還包括下列步驟計算積分的峰面積與峰位置偏差中的至少一項的t-統計值,t-統計值適配于檢驗和報告計算的峰面積與峰位置中的至少一項的統計顯著性,其中統計顯著性表明峰是否存在。
34.權利要求28的方法,還包括創建峰分量矩陣的步驟,包括計算一對矩陣行,該對矩陣行的第一行用于存儲峰形狀函數,以及該對矩陣行的第二行用于存儲被存儲在第一行中的峰形狀函數的一階導數。
35.權利要求34的方法,其中峰形狀函數另外還包括用來考慮到基線分量的線性和非線性函數中的至少一個函數。
36.權利要求34的方法,其中峰形狀函數是目標峰形狀函數與已知儀器的峰形狀函數這兩者之一。
37.權利要求36的方法,其中峰形狀函數和它的一階導數在一個范圍內是相同的,它們都是以標稱峰間隔的同一個整數的分數部分被采樣的。
38.權利要求37的方法,還包括下列步驟完成峰分量矩陣以使得在任何其余的矩陣行中的任何峰形狀函數被安排為相應于在一個位置范圍內的每個標稱位置的互相移位的版本。
39.權利要求34的方法,還包括以下步驟之一通過把報告的偏差加到標稱位置而把在峰分量矩陣中的標稱位置更新為估計的實際位置;以及通過把報告的偏差加到估計的實際位置而把在峰分量矩陣中的估計的實際位置更新為經進一步改進的估計的實際位置。
40.權利要求28的方法,還包括下列步驟對相應于峰形狀函數的數據進行內插,以得到在每個標稱位置處一個另外的峰形狀函數。
41.權利要求40的方法,其中所述內插步驟包括以下步驟收集供分解用的該峰形狀函數作為矩陣中的向量;分解被包括在矩陣中的峰形狀函數;在分解的向量之間進行內插,以得到經內插的向量;以及使用經內插的向量重建在每個標稱位置處的一個另外的峰形狀函數。
42.權利要求41的方法,其中所述分解步驟是通過使用奇異值分解(SVD)和小波分解中的至少一種執行的。
43.權利要求40的方法,還包括計算在每個標稱位置處峰形狀函數的一階導數的步驟。
44.權利要求43的方法,還包括通過組合峰形狀和相應于峰形狀函數的一階導數而創建峰分量矩陣的步驟。
45.權利要求44的方法,還包括以下步驟之一通過把報告的偏差加到標稱位置而把在峰分量矩陣中的標稱位置更新為估計的實際位置;以及通過把報告的偏差加到估計的實際位置而把在峰分量矩陣中的估計的實際位置更新為經進一步改進的估計的實際位置。
46.權利要求44的方法,其中峰分量矩陣另外還包括用來考慮到基線分量的線性和非線性函數中的至少一個函數。
47.權利要求28的方法,其中所述施加步驟還包括執行矩陣求逆和矩陣分解中的至少一項的步驟。
48.權利要求47的方法,其中矩陣求逆和矩陣分解中的至少一項是基于峰分量矩陣的帶狀特性、對稱特性、和循環特性中的至少一項。
49.權利要求47的方法,其中矩陣求逆和矩陣分解中的至少一項的結果在分析測試樣品數據之前被計算和存儲。
50.權利要求28到49的任一項的方法,其中所述儀器系統包括質譜儀和分離設備中的至少一個設備,以及所述在范圍內的位置相應于質量。
51.權利要求28到49的任一項的方法,其中所述儀器系統包括液相色譜和氣相色譜中的至少一項,以及所述在范圍內的位置相應于色峰出現的時間。
52.權利要求28到49的任一項的方法,其中所述儀器系統包括光譜系統,以及所述在范圍內的位置相應于頻率、移位、和波長之一。
53.一種用于計算用于質譜(MS)儀系統的校準濾波器的方法,包括以下步驟從給定的校準標準得到至少一個質譜峰形狀函數,規定質譜目標峰形狀函數,在得到的至少一個質譜峰形狀函數與質譜目標峰形狀函數之間執行去卷積運算,以及根據去卷積運算的結果計算至少一個校準濾波器。
54.權利要求53的方法,其中至少一個質譜峰形狀函數可以從包含來自在所述校準標準中的已知分子的許多同位素中的至少一個同位素的一部分質譜而得到。
55.權利要求53的方法,其中所述得到步驟包括以下步驟對于給定的校準標準,計算相對同位素豐度和相應于該豐度的同位素的實際的質量位置;使用具有窄峰寬度的相同的連續函數來對計算出的相對同位素豐度與測量到的同位素峰集群執行卷積運算;以及在所述卷積運算后,在測量的同位素峰集群與計算的同位素峰集群之間執行去卷積運算,以得到至少一個質譜峰形狀函數。
56.權利要求53的方法,其中該至少一個校準濾波器包括至少兩個校準濾波器,以及所述方法還包括在至少兩個校準濾波器之間進一步內插以得到在想要的質量范圍內至少一個另外的校準濾波器的步驟。
57.權利要求56的方法,其中所述內插步驟包括以下步驟收集供分解用的該至少兩個校準濾波器作為矩陣中的向量;分解包括該至少兩個校準濾波器的矩陣;在矩陣的分解的向量之間進行內插,以得到經內插的向量;以及使用經內插的向量重建該至少一個另外校準濾波器。
58.權利要求57的方法,其中所述分解步驟是通過使用奇異值分解(SVD)和小波分解中的至少一項執行的。
59.權利要求53的方法,其中任何所述執行去卷積運算的步驟利用傅立葉變換和矩陣求逆中的至少一項。
60.權利要求55的方法,其中任何所述執行卷積和去卷積運算的步驟利用傅立葉變換、矩陣乘法、和矩陣求逆中的至少一項。
61.權利要求53的方法,其中所述得到步驟還包括對相應于質譜峰形狀函數的數據進行內插,以得到在想要的質量范圍內至少一個另外的質譜峰形狀函數的步驟。
62.權利要求61的方法,其中所述內插步驟包括以下步驟收集供分解用的質譜峰形狀函數作為矩陣中的向量;分解包括質譜峰形狀函數的矩陣;在矩陣的分解的向量之間進行內插,以得到經內插的向量;以及使用經內插的向量重建該至少一個另外的質譜峰形狀函數。
63.權利要求62的方法,其中所述分解步驟是通過使用奇異值分解(SVD)和小波分解中的至少一項而執行的。
64.權利要求61的方法,其中所述執行步驟包括下列步驟在質譜目標峰形狀函數與測量的質譜峰形狀函數和計算出的質譜峰形狀函數中之一之間執行去卷積運算,以便把測量的質譜峰形狀函數和至少一個另外的質譜峰形狀函數變換成質譜目標峰形狀函數;以及其中所述計算步驟包括從去卷積運算中計算至少一個校準濾波器的步驟。
65.權利要求64的方法,其中該至少一個校準濾波器包括至少兩個校準濾波器,以及所述方法還包括下列步驟在至少兩個校準濾波器之間進一步進行內插,以得到在想要的質量范圍內至少一個另外的校準濾波器。
66.權利要求65的方法,其中所述進一步進行內插的步驟包括以下步驟收集供解用該至少兩個校準濾波器作為矩陣中的向量;分解包括該至少兩個校準濾波器的矩陣;在矩陣的分解的向量之間進行內插,以得到經內插的向量;以及使用經內插的向量重建該至少一個另外的校準濾波器。
67.權利要求66的方法,其中所述分解步驟是通過使用奇異值分解(SVD)和小波分解中的至少一項而執行的。
68.權利要求64的方法,其中所述在質譜目標峰形狀函數與測量的質譜峰形狀函數和計算出的質譜峰形狀函數中之一之間執行去卷積運算的所述步驟要利用傅立葉變換和矩陣求逆中的至少一項。
69.權利要求53的方法,在所述計算步驟以后執行的預校準步驟中,還包括以下步驟根據在計算出的相對同位素豐度的質心質量與測量的同位素峰集群的質心質量之間的最小二乘擬合,對質譜同位素峰進行預對準。
70.權利要求53的方法,還包括以下步驟對原始質譜數據執行與預校準儀器有關的變換;以及對相應于測試樣品的計算出的數據組執行與后校準儀器有關的變換。
71.權利要求70的方法,其中所述執行與預校準儀器有關的變換和執行與后校準儀器有關的變換的步驟分別涉及到創建預校準結合的對角線矩陣和后校準結合的對角線矩陣,沿著各個矩陣中每個矩陣的結合的對角線的每個非零元素用于分別執行相應于與預校準儀器有關的變換和與后校準儀器有關的變換的內插功能,以及所述方法還包括以下步驟從該至少一個校準濾波器創建用于執行峰形狀和質量軸校準的校準結合的對角線矩陣的步驟。
72.權利要求71的方法,還包括下列步驟在校準測試樣品之前把預校準結合的對角線矩陣、校準結合的對角線矩陣和后校準結合的對角線矩陣相乘成總的濾波矩陣。
73.權利要求72的方法,其中峰形狀和質量軸校準是通過在總的濾波矩陣與原始質譜數據之間的矩陣乘法而實現的,以及所述方法還包括創建另一個結合的對角線矩陣以估計校準的信號的質譜方差的步驟,該另一個結合的對角線矩陣對角上的每個非零元素等于在總的濾波矩陣中的相應的元素的平方。
74.權利要求73的方法,還包括下列步驟對校準的質譜數據施加加權回歸運算,以得到對于該質譜峰的積分的峰面積、實際的質量和其它質譜峰數據中的至少一項。
75.權利要求74的方法,其中加權回歸運算的權因子正比于質譜方差的倒數。
76.權利要求73的方法,還包括以下步驟對校準的質譜數據施加多元統計分析,以便對測試樣品進行定量、識別和分類中的至少一項。
77.權利要求53的方法,還包括以下步驟執行從非均勻間隔的質量采集間隔到均勻間隔的質量間隔的預校準質量間隔調節;以及執行從均勻間隔的質量區間隔到報告的間隔的后校準質量間隔調節。
78.權利要求77的方法,其中所述執行預校準質量間隔調節和后校準質量間隔調節的步驟分別涉及到創建預校準結合的對角線矩陣和后校準結合的對角線矩陣,沿著各個矩陣中每個矩陣的結合的對角線的每個非零元素用于分別執行相應于預校準質量間隔調節和后校準質量間隔調節的內插功能,以及所述方法還包括下列步驟從該至少一個校準濾波器創建用于執行峰形狀和質量軸校準的校準結合的對角線矩陣。
79.權利要求78的方法,還包括下列步驟在校準測試樣品之前把預校準結合的對角線矩陣、校準結合的對角線矩陣和后校準結合的對角線矩陣相乘成總的濾波矩陣。
80.權利要求79的方法,其中峰形狀和質量軸校準是通過在總的濾波矩陣與原始質譜數據之間的矩陣乘法而實現的,以及所述方法還包括下列步驟創建另一個結合的對角線矩陣以估計校準的信號的質譜方差,該另一個結合的對角線矩陣對角上的每個非零元素等于在總的濾波矩陣中的相應的元素的平方。
81.權利要求80的方法,還包括下列步驟對校準的質譜數據施加加權回歸運算,以得到對于質譜峰的積分的峰面積、實際的質量和其它質譜峰數據中的至少一項。
82.權利要求81的方法,其中加權回歸運算的權因子正比于質譜方差的倒數。
83.權利要求80的方法,還包括以下步驟對校準的質譜數據施加多元統計分析,以便對測試樣品進行定量、識別和分類中的至少一項。
84.權利要求53的方法,還包括下列步驟通過連續灌注和在線混合的至少一項在事先或實時地把校準標準加到測試樣品,以便在單獨一次質譜采集中獲取校準數據和測試數據。
85.一種處理原始質譜數據的方法,包括以下步驟把總的濾波矩陣施加到原始質譜數據,以得到校準的質譜數據,其中總的濾波矩陣通過以下步驟被形成從給定的校準標準,得到至少一個質譜峰形狀函數;規定質譜目標峰形狀函數;在得到的至少一個質譜峰形狀函數與質譜目標峰形狀函數之間執行去卷積運算;以及從去卷積運算的結果計算至少一個校準濾波器。
86.權利要求85的方法,其中所述施加步驟還包括把原始的質譜數據在與被總的濾波矩陣所需要的相同的質量軸上進行內插的步驟。
87.權利要求85的方法,其中所述施加步驟還包括把校準的質譜數據內插到與由總的濾波矩陣所給出要的不同的任何想要的質量軸的步驟。
88.權利要求85的方法,還包括以下步驟對校準的質譜數據施加加權回歸運算,以得到對于質譜峰的積分的峰面積、實際的質量和其它質譜峰數據中的至少一項。
89.權利要求88的方法,其中加權回歸運算的權因子正比于質譜方差的倒數。
90.權利要求85的方法,還包括對校準的質譜數據施加多元統計分析,以便對測試樣品進行定量、識別和分類中至少一項的步驟。
91.一種用于對包含在位置范圍內的峰的數據軌跡中的峰寬度進行歸一化的方法,包括測量峰寬度作為峰位置的函數,以得到峰寬度的測量值;對測量值進行最小二乘擬合,以確定函數;以及在該范圍內對該函數的數學的逆進行積分,以得到能用于使峰寬度歸一化的變換函數。
92.權利要求91的方法,其中峰寬度的測量是基于相對于已知的標準進行的測量。
93.權利要求91的方法,還包括使用該函數來歸一化峰寬度。
94.權利要求91的方法,其中該函數的逆函數是該函數的倒數。
95.權利要求91的方法,其中在積分時出現的積分常數當獲得變換函數時被丟棄。
96.權利要求91的方法,其中該譜是來自液相色譜四極子飛行時間質譜儀的譜,以及該函數包含至少一個對數運算。
97.權利要求91的方法,其中該譜是來自傅立葉變換質譜儀的譜,以及該函數是對數函數。
98.權利要求91的方法,其中該譜是來自飛行時間質譜儀的譜,以及該函數是平方根函數。
99.權利要求91的方法,其中該譜是來自氣相色譜質譜儀的譜,以及該函數包含對數函數。
100.權利要求91的方法,其中該譜是來自基體輔助的激光解吸附和電離飛行時間質譜儀的譜,以及該函數是倒數函數。
101.一種校準由儀器產生的數據的方法,包括對包含至少一個內部校準標準的數據執行外部校準,以提供外部校準的數據;以及使用外部校準的數據作為用于內部數據校準程序過程的輸入數據。
102.權利要求101的方法,還包括通過在檢測之前使用在線和離線混合之一來引入要測量的內部校準標準與樣品。
103.權利要求101的方法,其中內部校準標準是樣品中預先存在的成分。
104.權利要求101的方法,其中內部校準過程包括執行權利要求1-100的至少一項的步驟。
105.一種用于校準來自包含多個成分的樣品的數據而不用把內部標準加到樣品的方法,包括選擇數據中至少一個峰用作為標準;根據該至少一個選中的峰導出校準濾波器;以及使用校準濾波器來分析數據中的其它峰,以便產生校準的數據。
106.權利要求105的方法,其中所述選擇包括選擇一個以上的峰,以及所述導出包括為每個選擇的峰導出校準濾波器,該方法還包括內插,以產生至少一個在選擇的峰之間的位置處的附加校準濾波器。
107.權利要求105的方法,還包括在產生校準濾波器時,把至少一個選擇的峰同一個其寬度與原先的峰相比較是不重要的已知的函數進行卷積。
108.權利要求105的方法,還包括使得校準的數據被統計分析,以對測試樣品進行定量、識別和分類中的至少一項。
109.權利要求105的方法,還包括執行權利要求1-100的至少一項的步驟。
110.一種計算機可讀媒體,用于一個具有與其相關聯的計算機的質譜儀中,該計算機執行對質譜儀產生的數據的數據分析功能,該媒體具有被置于其上的計算機可讀的程序指令,用于執行權利要求1-27,53-103,或105-108中的任一項所要求的方法。
111.一種計算機可讀媒體,用于一個具有與其相關聯的計算機的儀器系統中,該計算機執行對儀器系統產生的數據的數據分析功能,該媒體具有被置于在其上的計算機可讀的程序指令,用于執行權利要求28-49,或91-108中的任一項所要求的方法。
112.一種質譜儀,具有一個與其相關聯的計算機,該計算機執行由質譜儀產生的數據的數據分析功能,該計算機執行權利要求1-27,53-103,或105-108中的任一項的方法。
113.一種儀器系統,具有一個與其相關聯的計算機,該計算機執行由儀器系統產生的數據的數據分析功能,該計算機執行權利要求28-49或91-108中的任一項的方法。
全文摘要
一種用于得到用于校準質譜(MS)儀系統的至少一個校準濾波器的方法。對于給定的校準標準,得到在質譜范圍中的測量的同位素峰集群數據。對于給定的校準標準計算出相對同位素豐度和相應于該豐度的同位素的實際的質量位置。規定處在各個質譜范圍內的中心的質譜目標峰形狀函數。在計算出的相對同位素豐度與質譜目標峰形狀函數之間執行卷積運算,以形成計算的同位素峰集群數據。在測量的同位素峰集群數據與在卷積運算后計算的同位素峰集群數據之間執行去卷積運算,以得到該至少一個校準濾波器。為歸一化峰寬度、組合內部和外部校準、以及使用選擇的測量峰作為標準采取措施。該方法的各個方面適用于其它分析儀器。
文檔編號G01R35/00GK1898674SQ200480038243
公開日2007年1月17日 申請日期2004年10月20日 優先權日2003年10月20日
發明者Y·王, M·古 申請人:瑟諾生物科學有限責任公司