專利名稱:用于衍生多肽的串聯質譜從頭測序的鎖定質量離子的制作方法
技術領域:
本發明涉及多肽或蛋白質的質譜測序技術,更具體地,涉及用于利用質譜分析進行從頭測序的多肽衍生化技術,以及與此相關的鎖定質量離子技術。
背景技術:
蛋白質組學是蛋白質研究的領域,其研究對生物的蛋白質補足組(complement)進行的大規模或總體分析(Aebersold and Mann,2003,Nature 422198)。蛋白質組學在研究、診斷以及臨床應用中是很重要的,因為來自若干技術學科的信息被與細胞功能及生理聯系了起來,所述技術學科包括化學、遺傳學、細胞成像和基于芯片或微陣列的蛋白質分析或DNA分析。實踐中,蛋白質組學要求在短時間內對大量蛋白質的復雜數據進行詳細分析。對蛋白質和肽的分析在大規模的蛋白質組學分析中是特別有用的。
質譜分析(MS)是蛋白質組學中潛在的有用工具,因為其對質量高度靈敏的測量可以通過氨基酸序列來鑒別出一些蛋白質(Aebersold andGoodlett,Chem.Rev.101269-295,2001;reviewed in Mann,et al.,2001,Ann.Rev.Biochemistry 70437;Kinter and Sherman,Protein sequencing andIdentification Using Tandem Mass Spectrometry,Wiley,NY,2000)。因為每種氨基酸或氨基酸殘基的鏈理論上可以通過對其質量進行的精確測量來檢測出來,因此足夠精確的測量使得可對各種氨基酸進行鑒別。當樣品處理和MS技術都高度精確時,就可以鑒別出形成多肽分子的氨基酸的實際序列。此外,如果用高度精確且可信賴的方法檢測到了與一種氨基酸的已知質量的偏差,這就表示該氨基酸已被修飾。對蛋白質結構修飾的檢測在蛋白質組學研究中極其重要。
質譜分析(MS)涉及在氣相中對經過電離的待分析物進行的分析,其中使用對待分析物進行電離的離子源,測量經過電離的待分析物的質荷比(M/Z)的質量分析儀,以及記錄每個m/z值處離子數目的檢測器。MS裝置還可以與分離裝置耦合,以改進分析復雜混合物的能力。此外,可以將MS儀器進行組合來提高靈敏度和選擇性。近來,已對樣品制備和電離化技術進行了許多改進,其總體而言屬于質譜儀的“離子源”部分。大氣壓電離化技術(Atmospheric Pressure Ionization,API),例如電噴霧電離化(Electrospray,ESI)、大氣壓化學電離化(Atmospheric PressureChemical Ionization,APCI)、大氣壓光化電離化(Atmospheric PressurePhotoionization,APPI)和大氣壓基質輔助激光解吸附/電離化(Atmospheric Pressure Matrix Assisted Laser Desorption/Ionization,APMALDI),目前常用于從流體樣品中產生待分析物離子。上述技術已經通過增加進入質譜分析儀并到達下游檢測器的經電離的待分析物離子的濃度,改進了質譜分析儀系統的靈敏度。
電噴霧源中,來自源裝置(例如液相色譜柱)的待分析物溶液,通過針作為液體流被注入。由噴霧裝置產生的液體流例如噴霧氣體、氣動輔助(pneumatic assist)和超聲波的不穩定性,會導致所述的流被破壞成滴,其中很多都帶有電荷,這是由于針相對于周圍導體來說具有較高的電勢造成的,或者是由于靜電效應。通過蒸發對帶電荷的滴進行解溶劑化,釋放出經過解溶劑化并經過電離的待分析物分子。然后將所述待分析物離子引向質譜分析儀的接口,從所述接口將所述組成分子通過一個或多個下游的真空場所轉移到質量分析儀中。在質量分析儀中,對待分析物離子進行過濾,然后對其進行檢測。
對質量分析技術,例如飛行時間(TOF)和扇形磁場以及傅立葉變換離子回旋共振(FTICR)分析儀的協同改進,已使得1至10ppm(ppm表示“百萬分之一”)的數量級的質量檢測精確度成為可行。然而,這種水平的精確度需要儀器的穩定性和重復性達到一定程度,由于環境溫度、質譜儀腔壓力和施加電壓的波動所導致的“漂移”(drift)使得所需要的穩定性和重復性無法一直都可獲得。為調校此類漂移,用已知的質量來校正儀器,其中使用被稱為質量校正的方法。根據此技術,典型地,使用具有特征性的m/z比率的已知化合物(本文中稱為“鎖定質量”)來與未知化合物的樣品(待分析物)一起進行分析或連續地進行分析。得到的質譜含有一個或多個與所述鎖定質量的m/z比率相應的內部校正峰,然后其可被用作比例尺,通過其來測量與未知化合物相應的峰的質量。對鎖定質量離子的使用可被用于對儀器的直接校正,用于在對某些待分析物的測量中的錯誤檢測,用于對某些待分析物中的特定的峰或強度的比較,以及用于任何定性或定量的質量分析或數據處理步驟。因此,當用質量分析來測量多肽時,譜包括來自鎖定質量離子的峰以及來自肽片段的峰。得到的譜因此可能含有對校正MS儀器、關于多肽待分析物的衍生序列信息,以及協助對待分析物的數學分析有用的信息,這可以獨立進行,或者可以與對儀器的校正一起進行。
在質量校正的傳統方法中,在離子源中進行電離化之前就將鎖定質量與未知樣品相混合。該傳統方法會受污染的影響,因為所述的鎖定質量污染了轉移線以及毛細末梢,抑制了對樣品化合物的電離化效率。在需要對大分子量的化合物(例如多肽)進行區別的高精確度的閾值處,輕微的儀器漂移就可能導致錯誤的結果,需要在大漂移波動產生之前以高通量的速率進行連續的分析。對于高通量的速率,鎖定質量污染成為更為重要的議題,因為從前次分析留下的鎖定質量的殘基可能難于在后續分析進行之前被清除。
外部引入鎖定質量減輕了污染的效果。見美國專利No.6,207,954、歐洲專利EP No.0966022。然而,對于外部引入技術,待分析物樣品以及鎖定質量離子必須來自不同的探針,這會減少溶液中所述鎖定質量及樣品之間的相互作用和探針污染,因此需要兩倍的樣品探針和注射器。
考慮到肽的片段化所固有的復雜性和對MS譜的分析的困難,用于對肽進行化學衍生化的不同方法的組合還未完全發展起來。對蛋白質組學以及對肽的復雜混合物的分析而言,一般公認僅有非常簡單并且極端有效的化學衍生化步驟能與蛋白質組學兼容。如果化學反應引入了任何雜質,那么肽的樣品將變得甚至更為復雜,因此使得MS分析及其后的數據處理復雜化。(Mann and Jensen,Nat.Biotech.21255-261,2003)。因此,雖然化學衍生化法是用于質譜分析的已知工序,但是使用多種不相關的衍生化技術被認為將會向肽的質量分析引入顯著的復雜度和復雜性,使用從頭測序(de novo sequencing)來對肽的線性氨基酸序列進行完全的測定仍然是很困難的。
發明內容
本發明是對用于質譜分析的多肽進行化學衍生化以及在質量分析之前使用內部引入的鎖定質量離子的新穎的手段。本發明既包括方法,又包括物質的組合物;具體而言,本發明包括多種化學衍生物,與引入或制造鎖定質量分子的MS儀器相關的多種衍生物的用途,改進的數據分析技術,所述技術應用于經衍生化的多肽的方法,用于測定經過修飾的肽的氨基酸序列,本發明還包括用于質量分析中上述所有用途的方法和裝置。在某些實施方式中,本發明還包括用于MS數據分析的新技術,其中使用了譜的數據,計算機數據庫以及使用MS數據以鑒別蛋白質、鑒別肽或肽的序列的軟件和算法,以及用對多肽的質量分析以及鎖定質量離子對多肽進行從頭測序的軟件和算法。
在一些實施方式中,本發明包括至少兩個化學反應步驟,其中,每一個都是對多肽中存在的化學基團的衍生化。該方法被稱為多次衍生化,因為使用了至少兩種截然不同的標記方法。實驗室中進行的化學反應步驟可依次或平行地進行于下述環境中,其中,所述的化學反應不干擾對所述肽的修飾,或者不干擾試劑之間的交叉反應,以這樣的方式使得待分析的肽的所述反應和衍生化得到折衷。典型地,衍生化進行于已經或將要被消化以產生多肽片段的樣品上,典型地,其具有至少兩個化學標記步驟在第一個步驟,消化后對多肽進行衍生化,以建立活性末端及獲得第一種衍生物,以協助對單個殘基的鑒別。第一個衍生化步驟的例子是賴氨酸衍生化,例如Peters,et al.(WO 03/056299)所描述的方法。
在第二次衍生化中,已經過第一個衍生化步驟衍生化的多肽,例如賴氨酸(特別是C-末端的賴氨酸)被衍生化的那些,被用于進行第二次化學衍生化,其中會獨特地修飾與第一次衍生化不同的部分。第二次衍生化的一個例子是對羧基的烷基化,例如,對天冬氨酸殘基的羧基進行甲基化。所述開展兩種對肽的部分進行衍生化的方法區別于使用核同位素作為質量標簽或使用兩步化學反應,所述化學反應利用了保護基團保護特定的肽的部分免受單次化學衍生化。對賴氨酸的衍生化可以在對多肽進行的酶消化或化學片段化之后發生。該衍生化步驟可以在對羧基烷基化之前或之后有利地進行,這取決于待分析物或其它的實驗參數。
在一種優選的實施方式中,對多肽或蛋白質樣品進行胰蛋白酶水解之后,接著是第一次衍生化,其優選標記胰蛋白酶水解片段的C-末端殘基,典型地,產生C-末端賴氨酸的咪唑衍生物。第一或單一的經衍生化的多肽與第二衍生化試劑反應,以在羧基處對多肽的酸性殘基側鏈產生額外的衍生化。
本發明的另一應用是鑒別出樣品中存在的蛋白質或多肽待分析物的變異體或修飾。很多重要的生理條件是由對蛋白質或多肽的修飾導致的,所述修飾可于含有來自病人的多肽的生物樣品中檢測到,所述生物樣品例如血液、尿、唾液、腦脊髓、體液、腹水、血漿、細胞或組織樣品或提取物或常用于分析方法的其它物質。采用上述樣品,對蛋白質或多肽待分析物的精確實驗測量允許基于對多肽的測量出的質譜圖案與假定或標準質譜圖案的比較的分析和診斷。所述標準質譜圖案可以代表正常的待分析物,或者代表已知表示疾病狀態或已知的生理條件、或特定的目標基因型的待分析物。在該種實施方式中,實驗獲得的序列被與標準物或參照物進行比較,其差異與標準或參照和病人的待分析物之間存在的特定修飾或改變相關。該測量出的差異因此能鑒別出突變,多態性,剪切重排,缺失,取代或其它翻譯后修飾,例如磷酸化、乙酰化、氧化、甲基化、凝膠化、糖基化等。
在不同的實施方式中,鎖定質量離子的源可以包括不同的結構,以引入鎖定質量分子,其可以包括光電離化、場解吸附電離化、電子電離化和熱電離化裝置。鎖定質量離子可被向內引入到串聯質譜儀中,其中,典型地,所述的串聯質譜儀具有第一質量分析儀場所(stage)、碰撞室和第二質量分析儀場所。所述碰撞室從第一質量分析儀接收經過衍生化的多肽待分析物離子,其包括碰撞氣體,所述氣體對經過衍生化的多肽離子進行片段化,成更小尺寸的經衍生化的子代(daughter)離子。碰撞室中的所述第一質量分析儀場所使得分開的單元結合起來形成單一的裝置。所述電離化可以在將待分析物和鎖定質量分子引入到離子光學器件之前發生,或在離子光學器件中發生。因此,所述鎖定質量離子可在經衍生化的多肽離子的下游途徑中或附近被實質上電離化,使得經過衍生化的多肽離子和鎖定質量離子經過同樣的途徑,同時或實質上同時被進行質量分析。
用于通過串聯質譜分析對多肽待分析物進行質量校正的方法包括使用碰撞室和在碰撞室中制造鎖定質量離子。在該實施方式中,鎖定質量離子被引入到碰撞室中,并在碰撞室中被電離。然而,本領域的技術人員將意識到,電離化可在所述碰撞室之中或之外發生。如上所述,所述鎖定質量離子可在離子光學器件中被制造出來,所述器件是將多肽待分析物子代離子轉移到質量分析儀場所中去的。在該實施方式中,鎖定質量離子或者通過將鎖定質量離子引入到離子光學器件中產生出來,或者通過在所述離子光學器件中對鎖定質量離子進行電離化產生出來。本文中描述的每種方法都包括如下步驟用對鎖定質量離子的檢測和對鎖定質量離子質量分析(單獨進行或與多肽待分析物一起進行),來獨立地校正質量分析儀。
圖1A和圖1B是咪唑標記的肽(SEQ ID NO1)GLQYLLEK的MS/MS譜(MALDI/Q-TOF),其賴氨酸殘基處已被衍生化,羧酸酯基團被進行了甲基化。肽(SEQ ID NO1)GLQYLLEK是從β晶狀體球蛋白(牛眼晶狀體)的胰蛋白酶消化產物中產生的。
圖2A和2B是咪唑標記的肽(SEQ ID NO2)CDENILWLDYK的MS/MS譜(MALDI/Q-TOF),所述的肽產生自丙酮酸激酶(兔肌肉)的胰蛋白酶消化產物。
圖3A和圖3B是咪唑標記的肽(SEQ ID NO1)GLQYLLEK的MS/MS譜,已用咪唑對所述的肽羧基末端的賴氨酸和氨基末端的賴氨酸進行了衍生化,所述的肽產生自β-晶狀體球蛋白(牛眼晶狀體)的胰蛋白酶消化產物。
圖4A和圖4B。Lys-C可被用于消化蛋白質,以增加羧基末端賴氨酸的出現,這可能會增加用于鑒別的蛋白質序列的覆蓋范圍。然而,Lys-C消化之后得到的肽通常具有內部的精氨酸,這使得它們的MS/MS譜難于被解讀,即使是在咪唑衍生化之后,如圖4A所示。對來自細胞色素C(牛心臟)的同樣的肽(SEQ ID NO3)進行連續衍生化之后的MS/MS譜(圖4B)顯示了直到內部精氨酸的長且占據優勢的y-離子系列,使得該肽序列的長段可被讀出。
圖5是本發明的方法的一種實施方式,所述方法包括對質譜數據的分析,以進行從頭的肽序列分析、在后續分析中使用序列數據、以及開展大量需要精確序列信息的肽分析步驟中的任何一種。
圖6是包括有本發明的一種實施方式的質譜分析儀系統的結構圖。
圖7是包括有本發明的一種實施方式的圖6的質譜分析儀系統的結構圖。
圖8展示了圖6的質譜分析儀系統的一種實施方式,其中用同心共軸的輻射燈作為電離化的源。
圖9展示了包括有本發明的串聯質譜分析儀系統(MS/MS)的一種示例性實施方式。
圖10展示了包括有本發明的串聯質譜分析儀系統的一種實施方式。
具體實施例方式
定義本文中使用的術語“烷基化劑”指如本文中所述的能與氨基酸的羧酸酯基團反應以產生烷基衍生物的化合物。
術語“質量分析”指一種方法,其中,對氨基酸殘基的鑒別是通過對質量電荷比(M/Z)的測量來確定的。
“多肽”指包含通過肽鍵相連的氨基酸殘基、相關的天然形成的結構變異體、以及合成的非天然形成的其類似物的聚合物,相關的天然形成的其結構變異體,以及合成的非天然形成的其類似物。術語“多肽”還包括作為較大多肽的切割、消化或片段化產物存在的多個氨基酸,其中,切割、消化或片段化是通過化學、生化、電離化、機械或其它反應發生的。術語“蛋白質”典型地指超過大約20個氨基酸殘基的大多肽。本文中使用的術語“蛋白質”和“多肽”可以互換。術語“肽”典型地指10個至20個殘基的短多肽。
對通過片段化從蛋白質獲得的一組肽而言,獲得對其精確的質量測量的能力使得通過質譜進行的多肽分析容易起來,所述片段化是在使用用于蛋白水解的特異性切割酶之后發生于特定的氨基酸序列上的。對蛋白質進行鑒別的原理假設用規定的蛋白酶水解之后,不同氨基酸序列的蛋白質產生的一組肽構成對特定的蛋白質來說獨一無二的蛋白質質量指紋(fingerprint)。如果用基于實驗中精確觀察到的肽的指紋而選定的質量,來搜索含有該特定蛋白質序列的序列數據庫,用作為外部參照物的鎖定質量離子進行校正,并將該數據庫與蛋白酶的片段化規則聯合起來,就可以期待能夠在該數據庫中正確地鑒別出所述蛋白質來。鎖定質量離子的使用改善了用于單獨譜的分析的定性和定量質量測量,也改善了用于測序或其它肽分析中的數據處理的定性和定量質量測量。
在可獲得的MS設備中,MALDI-MS/MS是常用于肽分析的,雖然其它也可以使用。Aebersold and Goodlett,2001;Cramer and Corless,RapidComm.in Mass Spectrom.152058-2066,2001;其它MS儀器組合見Aebersold and Mann,2003。在MS分析之前對肽的N-末端進行化學修飾已被發現能改進MS分析。用活性N-羥基琥珀酰亞胺酯在N-末端引入季銨基團,增加了MALDI MS的靈敏度(Bartlet-Jones,et al.,Rapid Comm.Mass Spectrom.8737,1994)。Cardenas,et al用N-琥珀酰亞胺-2-(3-吡啶基)乙酸酯與肽進行反應,接著進行液相色譜分離及ESI-MS/MS分析(Cardenas,et al.,Rapid Comm.Mass Spectrum.111271-1278,1997)。該反應修飾了N-末端的氨基酸以及賴氨酸的氨基。Keough et al.報道將磺酸基添加到經胰蛋白酶水解的肽的N末端,會增加片段化的靈敏度,較之天然的肽會產生更高產量的片段離子。(WO 02/08767;2003/0032056;WO02/095419;PNAS 967131-7134,1999;Rapid Commun.Mass Spectrom 152227-2239,2001)。通過對酰胺氮的質子化對酰胺鍵進行去穩定,在MALDI和ESI(AP MALDI與離子阱MS組合)電離化條件下會產生廣泛的片段化。經磺酸化的含有天冬氨酸、谷氨酸和被氧化的甲硫氨酸的肽的MS/MS譜顯示,肽主鏈上的片段化更加一致。此外,Keogh et al.觀察到了脯氨酸殘基上N-末端一側的優先片段化,這增強了對脯氨酸的識別。
在分析之前對肽的C-末端氨基酸進行化學修飾已被發現能形成更長且更穩定的y-離子系列。已有若干種對C-末端進行化學修飾的方法被報道用于賴氨酸。如上所述,通常在通過MS進行的多肽分析中使用胰蛋白酶消化來產生片段化,因為得到的片段會可靠地以精氨酸(R)或賴氨酸(K)結尾,因此建立起C-末端的部分。雖然已知精氨酸會產生異常強的MS信號,但賴氨酸卻難于被檢測到。然而,可對賴氨酸進行化學修飾以增強其信號(見Peters,WO 03/056299)。這種修飾可使賴氨酸的質量與谷氨酰胺的質量區別開。。Cagney和Emili(2002)使用了一種相似的手段,其中對C末端賴氨酸進行差別胍酯化(guanidination),接著進行LC-ESI-MS/MS分析(Cagney and Emili,Nat.Biotech.20163-170,2002)。Gu et al(Gu et al.,J.Am.Soc.Mass Spectrom.141-7,2003)利用了加入氘標記的(重)賴氨酸。
Peters et al.(Peters,et al.,WO 03/056299)描述了一種不同的用于C-末端賴氨酸的化學衍生化方法,其指出,當用一組特別的試劑,例如2-甲氧基-4,5-二氫-1-H-咪唑(稱為“咪唑”)來修飾多肽C-末端的賴氨酸時,得到的MS/MS譜的復雜度將被很大地降低。Peters et al.注意到,對y-離子系列的鑒別會被改進,因此使得對氨基酸序列的檢測更為精確。
通過對肽進行化學衍生化獲得的對MS/MS譜的簡化,額外的鎖定質量離子,以及隨之改善的對氨基酸序列數據進行測量和鑒別的能力,顯示了發展高品質的片段化譜以及獲得完整的b-離子以及尤其是y-離子序列的長的系列的精確測量的潛力,并提供了用于從頭測序的實用手段。改進的從頭質量測量的分辨率和精確的校正增加了序列測定的精確度,也減少了對預測性的蛋白質計算機序列分析的依賴。
通過上述方法進行的蛋白質鑒別涉及一些基本步驟。通過使用對氨基酸序列有特異性的切割試劑來對樣品蛋白質進行消化,以產生肽,使得羧基-或氨基-末端的殘基以合理的確定度被已知。例如,胰蛋白酶在消化片段的羧基末端了留下精氨酸(R)或賴氨酸(K)。因此,經胰蛋白酶消化的肽的N-末端(除了N-最末端的一個)可被鑒別為在蛋白質序列中緊接著K或R殘基的氨基酸。消化之后,在質譜儀中對肽或多肽的質量進行盡可能精確的測量。在計算機中對實驗蛋白質片段的質量數據進行處理,將其與計算機數據庫中的數據進行比較,并且使用用于實驗中所用的蛋白水解方法的規則,以產生一系列理論質量,與測量出的一系列質量進行比較。用算法來對測量出的一系列肽質量與上述對數據庫中每個蛋白質預測的一系列質量進行比較,以及對每一匹配給出一個分數值,該分數值表示了匹配程度的排名。該方法通常被稱為“計算機”消化(″in silico″digestion),通過質量分析對蛋白質進行正確的鑒別取決于測量出的質量與數據庫中含有的相應數據之間的關系。然而,該方法中存在有很多困難。顯然,對待鑒別的蛋白質而言,其序列必須要存在于用于比較的序列數據庫中。另外,蛋白質混合物的消化物對質量分析來說存在一個問題,因為不易明確復雜的肽混合物中哪個肽來自于特定的蛋白質。測量精確度的提高將降低實驗獲得的質量與序列數據庫中相應質量匹配的潛在錯誤,因此將增加數據庫搜索的嚴謹度。
如果對純粹的蛋白質進行消化,將得到的肽的質量與為該蛋白質預測出的一系列肽質量進行比較,典型地,將產生兩種觀察結果。第一種是并非所有預測出的肽都被檢測到。第二種是一些測量出的肽質量并不在從該蛋白質預測出的一系列質量之中。第一個問題,遺漏的質量,通常是由于可能發生于質譜分析之前或期間的很多問題所導致的,例如低溶解度、選擇性吸收、離子抑制、選擇性電離、很短或很長的肽長度、遺漏的或不恰當的蛋白水解切割或其它導致樣品丟失或使特定的肽很少或無法被MS檢測到的人為因素。這是很關鍵的缺陷,因為遺漏的肽質量可能含有很有意義的生物信息。不幸的是,不進行進一步的實驗,就無法區分無甚價值的和有意義的遺漏信息。因此,未被檢出的肽質量是通過質譜進行的蛋白質鑒別的一個重大問題,并且,其可能是錯誤鑒別或遺漏鑒別的唯一的主要來源。
片段離子譜是通過被稱為碰撞誘導裂解(CID)的方法來產生的,所述方法中,肽的酰胺鍵被破壞,之后是對片段離子譜的記錄。對酰胺鍵的切割導致b-離子(含有N-末端)和y-離子(含有C-末端)的產生。經胰蛋白酶水解的肽的高品質的MS/MS譜典型地會顯示顯著的b和y-離子系列。如果對10殘基肽的每個酰胺鍵而言,僅有上述兩種離子產生的話,所述的片段離子譜將含有18個峰。理想地,b或y型占主導地位的長的穩定離子系列將被回收。實際中,肽的片段化是不定的,且取決于基團部分(moiety),這在分析中導致缺口及困難。產生的片段離子的多樣性和不定性使得從肽的MS/MS譜來鑒別肽和測序變得復雜。使對MS/MS譜的解讀變復雜的因素是遺漏的離子集合、內部重排、后續片段化以及多電荷狀況。還需要考慮的是片段離子峰強度與離子系列來源和片段質量之間的關系、氨基酸殘基及其衍生物對相鄰酰胺鍵切割的影響、以及氨基酸組成和中性片段化丟失之間的聯系。
質譜分析可以定義出多肽序列的特征,或者確定蛋白質或多肽序列的兩種形式之間的不同之處。對來自兩種生物學條件,例如來自癌癥與正常細胞的蛋白質表達的比較,可揭示出對應于癌癥狀態的獨一無二的蛋白質或一組蛋白質。在蛋白質組學中用質譜分析來從頭獲得序列信息的能力要求高度精確的MS技術、MS/MS譜的可靠產生、以及解讀肽片段化由此鑒別出大量的特定殘基從而產生真實可靠的序列信息的能力。為達到此目的,必須克服使用MS數據來確定肽的序列的過程中的若干已知的問題。根據本發明,多肽被多次衍生化,以對片段化特征進行控制,使得與未經過如此衍生化及與鎖定質量離子聯合起來用于聯合質量分析的其它多肽相比較,得到的MS/MS譜中的y-離子展現出更加近似相等的強度,且使缺口和非測序數據點最少化。
從頭測序中的重要參數包括多肽片段的片段離子方向性(directionality)氨基(b-離子)或羧基(y-離子)末端上離子電荷保持。一旦片段離子定向的方向性已被指定,就可以通過確定特定氨基酸殘基的質量來從頭獲得肽序列。從頭序列信息能產生相應于整個肽的較大部分的各單個殘基的延長且可靠的鑒別,并從頭數據用于數據庫搜索時增強分析能力。從頭獲得的序列可與通過數據庫搜索發現的序列進行比較,也可用于分析實驗和理論數據之間的差異本身。當從頭序列信息與從數據庫搜索獲得的序列不同時,該差異可以被歸因于一種生物學現象,所述現象可在含有其序列被實驗性測定的多肽的樣品即生物樣品中被鑒別出。該特定的基于肽的分析可以通過任何已知的下述技術來開展,所述技術中,可基于質量本身或與對鎖定質量離子的測量的比較來確定特定的分子形式。可被鑒別出來的分子形式包括磷酸化、乙酰化、氧化、硝化、甲基化、硅化(silation)、糖基化、交聯等。
雖然示出了利用MALDI/Q-TOF的特定序列的實施例,但本領域的技術人員可以認識到,該方法可被延伸到其它的MS接口(舉例而言,電噴霧電離化MS)、另外的MS電離化體系、片段化手段以及質譜儀。如所述實施例所示,甲基化導致被咪唑衍生化的肽中C末端賴氨酸氨基酸側鏈羧基的轉化。去除羧酸酯基團離子化的電荷可能增加在片段化期間破壞鄰近的肽鍵所需要的能量,因此,產生具有改進的y-離子強度分布的MS/MS譜。對樣品進行處理以促進特定的片段化特征的能力和對實驗獲得的質量數據與鎖定離子質量數據的比較,極大地簡化了從頭對序列的鑒別(即,對線型氨基酸序列的“召喚(calling)”)。
本發明改進了對來自本文公開的經過多次衍生化的多肽的肽數據進行的測序后分析。在一些情況下,本發明改進了可被開展的測序后數據分析的品質。在另一些情況下,對譜數據品質的改進使得目前由于肽序列質量分析的開展中所固有的困難而無法實現的新技術變得可行。
雖然本發明公開了具體的衍生化策略,但本領域的技術人員可以知道對酸性殘基側鏈或多肽鏈的其它地方、多個不同的功能基團進行其它化學修飾,以對從頭序列召喚的精確度加以改進。
近來,包括同位素標記和化學衍生化的基于MS/MS的方法,已經提高了MS譜的讀出率(Cagney and Emili,2002評論)。使用16O/18O標記,改進了對y-離子的鑒別,但還降低了信號強度(Munchbach et al.,Anal.Chem.724047-4057,2000;Uttenweiler-Joseph et al.,Proteomics 1668,2001)。另一種方法涉及到對肽中羧基的甲酯化(Hunt,et al.,PNAS 836233,1986;Goodlett,et al.,Rapid Commun.Mass Spectrom.151214,2001)。該反應增加了天冬氨酸和谷氨酸羧基側鏈的質量,還修飾了C-末端的羧基。然而,對同位素標記和甲基化而言,經修飾的譜都應仍與原始的未被衍生的肽的譜進行比較。因此,對肽進行的化學標記可能需要額外的會使高通量測序變慢的實驗及計算機步驟。質譜分析(MS)涉及在氣相中對經過電離的待分析物進行的分析,其中使用對待分析物進行電離的離子源,測量經過電離的待分析物的質荷比(M/Z)的質量分析儀,以及記錄每個m/z值處離子數目的檢測器。MS裝置還可以被耦合到分離裝置(例如色譜柱、芯片分離系統等),以改進分析復雜混合物的能力。
雖然多次衍生化和鎖定質量離子技術被特別地設計來協助使用串聯MS/MS的從頭多肽測序,但其應用還可延伸至其中從多肽的質量所獲得的信息被下述的連續衍生化所改進的任何質譜分析。此外,雖然某些技術被描述為優選的,例如對賴氨酸的衍生化以及對酸性殘基羧基的烷基化,但大量的其它衍生化是可以考慮的。當然,將一種特定的衍生化的順序指定為“第一”或“第二”可以是完全任意的,不排除在反應條件允許的情況下對多肽的兩個不相關的化學部分同時進行標記。
在本發明的描述中,用同位素標簽來產生同位素類似物不被認為是本發明的衍生化步驟,雖然經過多次衍生化的多肽還可用同位素標簽來標記。在一個方面,多次衍生化排除了對帶有保護基團的單一標記種類的使用。在此類情況下,多肽上僅有單一的目標部分被標記,但是保護基團使某些允許基于單一標記的存在而產生定量差異的化學環境被區別開。
相反地,在多次衍生化中,兩種不相關的標記策略被用于對目標多肽的兩個化學基團進行獨立衍生化,優選地,通過對兩種或多種標記來說實質上全部可用的位點進行標記反應。第一次衍生化的一個例子由Peters etal.PCT/US02/35581,WO 03/056299提供,其全文通過引用的方式被特別地包括在本文中。典型地,用能破壞多肽酰胺鍵的化學反應來切割含有完整蛋白質、蛋白質片段或多肽片段或其它多肽待分析物的樣品。
雖然本說明書中為了闡釋的目的使用了胰蛋白酶的消化,但是其它特定的消化也是可能的,其包括但不限于胰凝乳蛋白酶、內蛋白酶、Arg C或Lys C,化學片段化方法,例如溴化氰切割、羥胺切割、BNPS-Skatole等。然而,胰蛋白酶(或內蛋白酶)切割是優選的,因為得到的多肽具有C-末端賴氨酸或精氨酸殘基的特征。USP 5,821,063提供了用于多肽的通用消化方法。當然,賴氨酸殘基的衍生化發生于末端賴氨酸和內部賴氨酸,雖然對末端賴氨酸的標記對于測序的目的來說是特別有用的。
在一個方面,通過連接具有任何如下結構式的咪唑衍生物來對賴氨酸殘基進行衍生化 其中,每個R都是可從下述基團中獨立選擇出的功能基團,所述基團是氫、氘、鹵素、羥基、氰基、可選的被取代的烷基、可選的被取代的烷基氨基甲酰基、可選的被取代的烷氧基、可選的被取代的烷氧基羰基、可選的被取代的芳基、可選的被取代的芳氧基、可選的被取代的芳氧基羰基、可選的被取代的芳基氨基甲酰基、可選的被取代的硅氧烷基(siloxanly)以及親和標簽。
下標“m”是從0-7的整數,其中,連接兩個氮的環表示具有2至12個額外環原子的可選被取代的單環或雙環系統,其中,所述環原子選自碳、氧、氮、硫和硅,其中,前述的環原子可選地可被取代。
在一個方面,所述標記具有如下結構式
其中,R1、R2、R3和R4都是可從下述基團中獨立選擇出的功能基團,所述基團是氫、氘、鹵素、羥基、氰基、可選的被取代的烷基、可選的被取代的烷基氨基甲酰基、可選的被取代的烷氧基、可選的被取代的烷氧基羰基、可選的被取代的芳基、可選的被取代的芳氧基、可選的被取代的芳氧基羰基、可選的被取代的芳基氨基甲酰基以及親和標簽;或在另一種實施方式中,R2、R3和其與之相連的碳,聯合形成了n元碳環、雜環、芳環或芳基雜環,其中n是從大約4至大約8之間的整數。優選地,形成5元或6元環。然而,在某些實施方式中,y是0,其鄰接的碳原子和R1與R2都不存在,以形成4元環。
R5選自氫、鹵素、羥基、可選的被取代的烷基、可選的被取代的烷氧基、可選的被取代的芳基和親和標簽。在結構式I中,下標“y”是0、1或2。
在另一個方面,用如下結構式的化合物來作為衍生化試劑
其中,每個R都各自獨立地選自氫、氘、鹵素、羥基、氰基、可選的被取代的烷基、可選的被取代的烷基氨基甲酰基、可選的被取代的烷氧基、可選的被取代的烷氧基羰基、可選的被取代的芳基、可選的被取代的芳氧基、可選的被取代的芳氧基羰基、可選的被取代的芳基氨基甲酰基、可選的被取代的硅氧烷基以及親和標簽。
下標“m”是從0-7的整數,其中,連接兩個氮的環表示具有2至12個額外環原子的可選被取代的單環或雙環系統,其中,環原子選自碳、氧、氮、硫和硅。結構式II中,LG是離去基團。
在一種實施方式中,所述標記具有如下結構式 其中,R1、R2、R3和R4都是可從下述基團中獨立選擇出的功能基團,所述基團是氫、氘、鹵素、羥基、氰基、可選的被取代的烷基、可選的被取代的烷基氨基甲酰基、可選的被取代的烷氧基、可選的被取代的烷氧基羰基、可選的被取代的芳基、可選的被取代的芳氧基、可選的被取代的芳氧基羰基、可選的被取代的芳基氨基甲酰基以及親和標簽;或在另一種實施方式中,R2、R3和其與之相連的碳,聯合形成了n元碳環、雜環、芳環或芳基雜環,其中n是從大約4至大約8之間的整數。優選地,形成5元或6元環。然而,在某些實施方式中,y是0,其鄰接的碳原子和R1與R2都不存在,以形成4元環。
R5選自氫、鹵素、羥基、可選的被取代的烷基、可選的被取代的烷氧基、可選的被取代的芳基和親和標簽。LG是X-CH3,其中X是雜原子例如O和S。下標“y”是0、1或2。
上述結構式的一種特別的實施方式是2-甲氧基-4,5-二氫-1H-咪唑,上述衍生化的一種實施例會在經胰蛋白酶消化的多肽的C末端賴氨酸殘基處產生咪唑衍生物。
第一次衍生化不僅僅限于那些關于對C-末端殘基進行標記以改進占優勢的y-離子譜的方法。Carderas et al.Rapid Comm.Mass Spectrum.Vol.II,1271-1278(1997)先對肽進行了標記,再經過LC柱及后續的ESI MS/MS分析。衍生化反應在傳統的LC裝置中進行,其中,用經過修飾的胰蛋白酶對蛋白質樣品進行消化,再用N-琥珀酰亞胺-2(3-吡啶基)乙酸酯(SPA)進行嵌入式衍生化。得到的N-末端吡啶乙酰基衍生物和賴氨酸側鏈氨基基團與胰蛋白酶-OH基團的部分標記共同存在。該技術能幫助區分同量異位的殘基和偏向于形成b-離子的CID片段化途徑的改變。
在Bhikhabbai et al.PCT/US02/16247中描述了對肽的N-末端殘基進行額外的功能衍生化,其中,用帶有磺酰部分和經活化的酸部分的酸性試劑進行了水相衍生化。該反應的特征在于由于其趨向于降低MS檢測的靈敏度,因而其需要較大的樣品。在對衍生化反應的選擇方面,從多肽片段的C-末端導致片段化反應以產生能在測序分析中對殘基進行鑒別的y-離子的能力應與此類衍生化會極顯著地降低獲得的質譜的靈敏度這一趨勢相平衡。Bhikhabbai et al.的衍生化可通過與下述步驟組合來實現,所述步驟保護某些特定官能團的反應,否則這些官能團將被衍生化。磺酰部分和經活化的酸的部分的組合將在每個賴氨酸殘基處導致磺化反應。為了保護賴氨酸殘基免受該反應,使用鳥嘌呤化(guanination)反應的保護手段被用于對賴氨酸側鏈進行特別保護,以防止其在衍生化步驟中發生反應。此種保護的基團反應對該種衍生化來說是必要的,特別是使用胰蛋白酶消化因此在肽片段的C-末端產生了多個賴氨酸或精氨酸殘基的時候。將保護基團與經活化的酸的部分和磺酰部分聯合使用,是本文描述的多次衍生化范疇內的單一衍生化步驟。
Keough et al.(WO 00/43792)描述了另一種單一衍生化,其中用,例如磺基或雙磺基衍生物,來獲得用一個或多個pKa值小于2的酸的部分對多肽的N-末端進行的衍生化。該衍生化試圖以電荷位點特異性的方式在多肽的酰胺鍵產生選擇性切割,以使單一系列中僅有y-離子的選擇性檢測可以實現。
如上所述,第二個衍生化步驟幫助解決了存在獨特問題的質量測量問題,并檢測到了在單一衍生化的多肽中的問題。在一個方面,第二個衍生化步驟包含對酸性側鏈羧酸酯基團的烷基化。在一種實施方式中,第二個衍生化步驟改變了被衍生化的肽的片段化特征,以給出具有近似等同的強度的占優勢的y-離子系列。在任何一種上述實施方式中,在質量測量之前引入鎖定質量離子,將其與經過多次衍生化的多肽一起分析。
對谷氨酸和天冬氨酸及其衍生物、類似物的酸性氨基酸側鏈的羧基的烷基化可以按照如下述實施例1中所述的來獲得。對肽中羧基的烷基化幫助區分y離子與存在的其它任何離子(包括化學噪音)。在一個甲基化的實施例中,該反應還增加了多肽片段的質量,每個羧基增加了14個質量單位。天冬氨酸和谷氨酸的酸性側鏈不存在的時候,僅有C-末端的羧基能被觀察到了進行了反應,以及顯示出所述的14個質量單位的變化。
通常,烷基化對羧基進行了標記,以形成帶有直鏈、分支或叔烷基的酯,所述基團如下述結構式所示CH3(-CH2)n其中,n=0-3,所述的烷基種類可以是甲基、乙基、丙基、正丙基、異丙基、丁基、正丁基、異丁基、仲丁基或叔丁基等種類,其中,甲基是優選的。
烷基化反應向蛋白質酸性側鏈的羧基加上了烷基基團,對甲基化而言是加上了14個au。特別地,該反應發生于天冬氨酸、谷氨酸和S-羧甲基化的半胱氨酸。該反應導致了與酸性側鏈數目及被選用的烷基種類相關的質量變化,還對所述的MS/MS譜產生了改進。消化或其它片段化可發生于被衍生化以及未被衍生化的多肽上,以定位酸性殘基。因此,如上所述,典型地,術語“烷基化”或“甲基化”表示形成羧基的烷基酯或甲基酯,然而,該反應可能并不總是導致酯化,所述的烷基化還可能導致羧基周圍電荷分布的改變,這仍然提供了本發明的優點,而不是嚴格地限于形成烷基酯。
如前所述,本發明還包括用于下列過程的方法對肽進行的衍生化、對經過多次衍生化的肽和鎖定質量離子的質量分析、測定經過衍生化的肽的氨基酸序列、序列分析以及其它若干基于使用來自經連續衍生化的肽的數據的特定方法。上述方法中的初始化步驟可以包括為了質量分析來分離和制備待分析物。典型地,該步驟包括獲得含有多肽的樣品,從樣品中分離出所述的多肽(雖然對某些樣品而言,該步可以忽略),以及通過純化、消化或其它方式制備用于衍生化步驟的多肽。然后如上所述,對待分析物進行至少第一次和第二次化學衍生化。如果所述反應不包括競爭,或不妨礙對肽的標記,或不包含待分析物的結構或化學組成,所述步驟可以同時進行。一旦樣品/待分析物已制備好,就可以按照上述那樣引入鎖定質量離子,進行質量分析并獲得譜,其中,用MS/MS來測量多肽片段和鎖定質量離子,并獲得經衍生化的多肽和鎖定質量離子的質量/電荷比率數據。該質譜包括將肽片段的質量/電荷比率與氨基酸序列相關聯的數據,并可以包括以任何形式存在的下述定性或定量的數據,所述數據可與鎖定質量離子測量一起用于判斷所述待分析物的信息,包括測定至少部分氨基酸序列。
除原本的序列數據外,所述的譜還可以含有反映關于基礎(underlying)肽的非序列信息的數據,包括該肽的化學信息,包括糖基化、水合或其它化學修飾。對第一個待分析物的非序列信息可被用于直接確定關于第一個待分析物的信息,或可被用來與第二個待分析物的序列信息或非序列信息、或從中獲得第一個或第二個待分析物的樣品的序列信息或非序列信息進行比較。在蛋白質組學分析中,比較兩種待分析的肽的形式時,該種類型的數據分析是特別有用的。
所述的特定技術包括測量待分析物的實驗或實際質量、測定待分析物的氨基酸序列、引入在系統中被電離的鎖定質量分子使得所述鎖定質量離子與待分析物一起被引入、測量鎖定質量離子的質荷比用作校正或參照值、測量實驗或實際質量與基于組成原子的分子量的理論值之間的差異、以及確定對任何多肽種類而言,獲得的實驗值與理論值或已知的質量數據之間的差異的來源。
質量分析數據或譜可與已知的測序算法一起使用,以產生肽待分析物的氨基酸序列(Taylor and Johnson,Rapid Communications in MassSpectrometry,11,1067-1075m 1997;Chen,et al.,Journal of ComputationalBiology,8(6),571-583,2001;Dancik,et al.,Journal of Computational Biology,6,327-342,1999;Eng,et al.,J.Am.Soc.Spectrom.,5976-989,1994;Mann &Wilm,Anal.Chem.,664390-4399,1994)。上述算法是公知的,并且不考慮質量分析數據的精確度和精確性,其具有一定程度的實用性。由本發明提供的對數據獲取和質譜品質的改進增加了每次質量測量的精確度,增加了測序算法的實用性,并增加了可被精確測定的序列長度和序列信息的精確度。本發明的方法包括將可獲得的測序算法應用到從對經過連續衍生化的多肽的質量分析獲得的序列信息上,以及獲得經過獨特衍生化的多肽或片段的序列信息。
使用用本發明測定出來的精確的氨基酸序列數據,可僅從對部分氨基酸序列的精確測定和對蛋白質數據庫的搜索來進行對部分或全長蛋白質的鑒別。在很多蛋白質組學的研究和基本的生物試驗中,關鍵的測定是對有時存在于生物樣品中的待分析物蛋白質的鑒別。典型地,通過對實驗測定的氨基酸序列與全長蛋白質數據庫中的大量參照氨基酸序列和鑒別出的蛋白質片段進行比對,上述蛋白質組學數據庫得以被執行。很容易認識到,序列信息精確度和多肽待分析物中鑒別出來的序列數量的增加,將改進用參照測序對實驗測定出的多肽片段進行比較或鑒別的實用性。因此,本發明的一個方面是利用從對本文所述的鎖定質量離子和經過衍生化的多肽的質量分析所獲得的序列數據來鑒別蛋白質的用途,所述鑒別是通過如下方式實現的向蛋白質數據庫提交從MS實驗數據測定的氨基酸序列,以鑒別待分析物和/或鑒別作為樣品組分的待分析物。
已經表明,連續的(沒有缺口的連續序列)五個或更多氨基酸的序列可被用于搜索數據庫從而以高度的置信度來鑒別蛋白質(Mann & Wilm,Anal.Chem.,664390-4399,1994)。氨基酸序列的上述長度已被稱為關鍵長度序列標簽。更長的氨基酸序列標簽可以顯著地提高鑒別的精確性,當數據庫中的很多蛋白質共享一定量的進化保守序列時,這是非常有用的。更長的氨基酸序列標簽還可以增加對沒有完全或足夠測序的基因組的生物的蛋白質鑒別的置信度。然而,當在序列標簽中發現缺口時(例如,用三氨基酸標簽加上不定長度的缺口接著是二氨基酸的標簽,來代替五個連續氨基酸的標簽),蛋白質鑒別就變得非常困難。更多的蛋白質可與更小的序列標簽相匹配,而且因為兩個小標簽的方向性也是未知的,蛋白質鑒別就非常不可靠了。Mann和Wilm已經提出對85%置信度的蛋白質鑒別而言,最小的序列標簽應當有至少三個至四個連續的殘基,但是明顯地,更長的序列標簽是有好處的。
如上所述,本發明的技術對蛋白質中的翻譯后修飾進行MS/MS分析是特別有用的。上述修飾被廣義定義為在信使RNA已翻譯成氨基酸序列之后發生的多肽序列或化學上的任何改變。翻譯后修飾在蛋白質組學分析和對與疾病相關的臨床樣品里蛋白質的分析中特別重要。很多類型的翻譯后修飾,例如糖基化以及本文中描述的其它修飾,是已知與特定的疾病狀態一致的,或者其可以表明在對病人的診斷中有臨床上的重要意義的生理條件。在某些情況下,用本發明所述的鎖定質量離子和連續衍生化方法來改進多肽片段的質譜的能力,還使通過對多肽待分析物質量的直接測量和與內部和外部參照值的比較來對特定的翻譯后修飾進行的檢測和鑒別變得可行。在上述情況下,實驗性地開展質量分析,以測量多肽片段和鎖定質量離子的質量,將所述多肽片段的質量與經過或未經過翻譯后修飾的所述多肽片段的期待質量進行比較。例如,加入水分子,作為對多肽片段的翻譯后水合,將增加18的質量,即加入的水分子的質量。當對多肽片段的質量分析產生了與天然多肽相差18個單位的數字時,就鑒別出了翻譯后修飾。可對所有類型的翻譯后修飾進行類似的分析,所述翻譯后修飾中可制造出天然多肽較之被修飾的多肽在質量測量上的差異,并且參照質量的數字是已知的。
類似地,這對于對給定的經歷過翻譯后修飾的肽序列中的特定殘基進行的鑒別也有著相當重要的意義。例如,在擁有超過一個潛在修飾位點的肽中。其中一個例子是具有兩個潛在的磷酸化位點的肽序列。為了鑒別出獨特的修飾位點,通過MS/MS片段化進行的從頭序列分析可以區分兩個潛在的修飾位點,因為MS/MS片段化圖案應當顯示出漂移了磷酰基團的額外質量(80amu)的恰當質量的y-離子,所述額外質量被添加到連接有磷酰基團的氨基酸殘基的質量上。因此,除任何附屬修飾的質量之外,MS/MS譜信息包括鎖定質量離子、取決于氨基芳基質量的漂移。以下是明顯的與已知氨基酸質量不一致的相鄰的y-離子之間的質量漂移可作為修飾(包括已知的和有待被了解的翻譯后修飾)存在情況的判據。
當質量分析中的任何差異都可被歸因于疾病或有臨床意義的任何生理條件時,類似的能力是存在的。例如,當蛋白質突變已知是針對特定疾病狀態的,并且當該突變是已知的及能導致與天然多肽或代表正常或非疾病狀態的多肽的質量差異,通過比較病人樣品中多肽待分析物的質量與天然或非疾病狀態的已知質量,就可以從質量分析來做出臨床診斷。對此種應用而言,僅需要對本發明的方法加以調整,以包括如下步驟在上述連續衍生化之前將所述的多肽待分析物從病人樣品中分離出來。此外,對質量數據或譜的數據處理包括如下步驟確定至少一個包含有病人樣品的一部分的多肽片段的質量,將該結果與非疾病狀態的已知質量相比較。對病人樣品和正常樣品的比較能顯示出疾病狀態是否存在。因為本發明的連續衍生化增強了串聯MS/MS以高通量模式進行從頭肽測序的能力,本發明還增加了用MS/MS技術來進行用于對多肽序列的任何檢測的大規模篩選和臨床診斷的實用性。
本領域的技術人員明顯知道,本發明增加的對多肽測序的實用性還可以轉化為增加的使用多核苷酸數據庫進行基因組分析的實用性。任何時候,只要多肽序列已知,就可以確定出理論多核苷酸序列,可以在已知的數據庫中針對與已知序列的相似性進行搜索,即,通過BLAST或其它已知的技術。在本發明方法的范疇內,在開展基因組分析中對多核苷酸序列進行確定的實用性增加,僅僅需要從對鎖定質量離子和經過衍生化的多肽的質量分析進行到對多肽序列的測定,通過已知技術對理論的多核苷酸序列進行確定,以及使用現有的多核苷酸數據庫來使多肽待分析物的序列與編碼所述多肽片段或含有所述片段的全長多肽的基礎多核苷酸序列關聯起來。
如上述關于蛋白質組學研究的例子所述,在蛋白質樣品中檢測改變(例如突變或翻譯后修飾)的能力可與編碼所述蛋白質的基礎多核苷酸序列聯合起來,以進行基于所述經過衍生化的多肽序列的基因組學研究。在蛋白質組學應用中,來自實驗獲得的多核苷酸序列的數據可被用以分析實驗確定的多核苷酸序列和參照序列之間的差異,所述差異可被鑒別出,并與疾病或其它生理條件相關聯。在每種此類應用中,本發明提供的基本的優點是對經過連續衍生化的多肽的質量分析產生的譜或質量數據與參照值之間的比較,所述參照值或者是關于已知多肽的質量的,或者是關于已知多肽的序列的。因此,對本發明產生的數據的比較可以包含校正或內部或外部參照的測量,對實驗獲得的質量數據與含有參照質量數據的數據庫之間的比較,或者對實驗獲得的序列數據與含有參照序列數據的數據庫之間的比較,或者是上述二者的組合。
實施例八個蛋白質,β-酪蛋白(牛奶)、肌紅蛋白(馬心臟)、細胞色素c(牛心臟)、β-晶狀體球蛋白(牛眼晶狀體)、鈣調蛋白(牛腦)、人血清蛋白、丙酮酸激酶(兔肌肉)和人轉鐵蛋白被單獨溶解于含有8M尿素、100mM NH4HCO3、pH為8.5、終濃度為大約2mg/ml的緩沖液中。每種蛋白質取大約200μg,先用三(2-羧乙基)-鹽酸磷化氫在37℃進行30分鐘的還原,再在室溫用碘代乙酰胺與其進行30分鐘的反應。得到的蛋白質溶液被稀釋四倍,至最終的尿素濃度為2M,以40∶1加入胰蛋白酶,在37℃培養過夜。通過加入少量乙酸來終止消化反應。細胞色素c和轉鐵蛋白按照上面描述的那樣被還原和烷基化。不經稀釋就將Lys-C以100∶1加入到蛋白質溶液中,并在37℃培養過夜,再用乙酸來終止反應。
為了用咪唑來修飾肽羧基末端的賴氨酸,將30μl(-10μg)蛋白質的胰蛋白酶消化產物與20μl 1M的咪唑貯藏液(例如,終濃度為400mM的2-甲氧基-4,5-二氫-1-H-咪唑,終濃度為400mM)混合。在60℃對該反應混合物進行3小時的培養,用5μl的冰醋酸來終止反應。在C18旋轉柱(Pierce)上對肽進行純化,分為兩半并凍干。其中一半被溶于50∶50v/v的甲醇水中,用MALDI-MS/MS加以分析。為衍生化羧酸酯基團,將另一半溶于100μl作為烷基化試劑的2M甲醇HCl中,在室溫培養2小時(Ficarro et al.,Nature Biotechnology,2002,20301-305)。通過凍干來終止該反應。被凍干的肽混合物被重新溶解于50∶50v/v的甲醇∶水中,用MALDI-MS/MS加以分析。用此方法對八種不同的蛋白質分別進行試驗。如本領域的技術人員所知,為增加單個蛋白質的蛋白質序列覆蓋度,或為了分析更為復雜的蛋白質混合物,例如蛋白質復合物,或者甚至是細胞的全部溶解產物,還可通過單獨的或多維的分離技術(例如液相色譜)來對經過衍生化的肽進行分離,然后用合適的質譜方法對其進行分析,例如通過MALDI-MS/MS或在線的電噴霧電離化MS/MS。來自細胞色素、丙酮酸激酶和β-晶狀體球蛋白的有代表性的MS/MS譜被展示出來。
與相應的未經過衍生化的肽(圖1、2、3和4的A圖)相比,經連續衍生化的肽(圖1、2、3和4的B圖)在譜的品質方面取得的改進是很顯著的,從上述的譜中可以容易地確定肽的序列。在所有情況下,較之未經過衍生化的肽,對經過羧酸酯衍生化的肽進行肽片段化需要更高的碰撞能量,這代表著經過穩定化的肽鍵。通過破壞酸性殘基的羧酸酯側鏈產生的y離子不再占據優勢地位,例如圖2中A部分的y2離子所示。并且,通常地,y1離子及其片段不再是MS/MS譜中的優勢特征了。這兩項改進使得更高質量的y離子能被檢測到。總體而言,經過羧酸酯衍生化的肽在MS/MS譜上產生了具有更加完全的y-離子系列和均勻分布的峰強度的片段,這是從頭測序中所期待的特征。
參考圖1A和圖1B,圖1A是從對肽(SEQ ID No1)進行的MALDI/Q-TOF MS分析中獲得的MS/MS數據,所述的肽已用Peters et al(WO 03/056299)描述的技術在賴氨酸殘基處進行了衍生化。如圖1A所示,某些特征在對被測序的氨基酸進行直接譯碼時可能存在問題。所述y離子及其片段,即215.1、170.1和152.1a.m.u.在所述的譜中占據優勢地位,并抑制了其它的y離子,特別是具有較高質量的那些。對系列中其它y離子的抑制增加了對肽中氨基末端殘基錯誤鑒別的可能性。與之相比,圖1B展示了已經過實質性改進的y-離子強度分布和經過改進的鑒別組成序列的能力。
對下述多肽的分析可能導致另外的問題,所述多肽中聯系羧基末端和酸性殘基(例如谷氨酸和天冬氨酸)的肽鍵,在某些序列情況下易于被破壞,導致MS/MS譜僅有少數占據優勢的峰,不足以確定所述肽的全長序列。這可能導致對所述肽中殘基的鑒別被遺漏。圖2A中顯示的對肽(SEQ ID No2)的分析產生的MS/MS譜的數據示例性地說明了這一情況。圖2B顯示了對多肽片段進行甲基化之后譜的品質的改進。
參考圖3A,從其中羧基末端的賴氨酸和氨基末端的甘氨酸都被用咪唑衍生化了的肽(SEQ ID No1)中獲得的MS/MS譜顯示雖然在肽的氨基末端的一級胺通常不與咪唑試劑反應,但是當肽的氨基末端的氨基酸是甘氨酸時,N末端就會以較慢的速率被衍生化。由于y-離子系列不完全以及y、a、b和一些c離子的存在,來自此類雙標記肽的MS/MS譜難于從頭被解讀。當根據本發明對同樣的肽進行連續標記后,y-離子系列變成了所述譜中占據優勢的特征,從頭解讀變得更為容易更為精確,如圖3B所示。
參考圖4,從具有內部精氨酸的肽(SEQ ID No3)獲得的MS/MS譜。Lys-C通常被用于消化蛋白質,以增加羧基末端賴氨酸殘基的出現,這增加了將實驗確定的序列用于蛋白質鑒別的能力。然而,內部的精氨酸殘基使得所述的MS/MS譜難于被解讀,即使是在咪唑衍生化之后,如圖4A所示。圖4B顯示了有所改進的MS/MS譜,其來自對同樣的肽的酸性殘基的羧基進行的烷基化,其顯示了直到內部精氨酸的氨基酸殘基系列,因此允許對長序列標簽的測定。
本發明包括含有用于進行上述衍生化的試劑和說明書的工具包。對每個工具包而言,所述試劑包括但不限于烷基化試劑、特異性甲基化的試劑例如甲醇氯化氫、經活化的咪唑化合物例如2-甲氧基-4,5-二氫-1-H-咪唑、緩沖液、溶劑和容器。鎖定質量離子可以是滿足下述條件的任何化學物質,所述化學物質在減壓和/或高溫條件下可揮發,當暴露于光子或電離化試劑氣體(例如丙酮)時具有化學穩定性及可被電離。例如,具有高達5000Da分子量的有機化學物質,例如,氟化膦嗪、聚乙二醇、烷基胺或氟化羧酸可以使用。上述化學物質以舉例的方式列出,任何數量的其它同樣合適的化學物質也可用于本發明。例如,被共同轉讓給Flanagan的美國專利No.5,872,357(通過全文引用被包括進本文中)中,描述了可被使用于本發明方法中、以避免污染和電荷競爭的其它合適的鎖定質量材料。當使用有機化學物質時,減少分析期間碳同位素C13的作用是有利的,以預防不精確性。典型的用于鎖定質量的有機化學物質具有7.5至12eV的電離勢,大多數具有低于10eV的電離勢,使得上述化學物質特別適用于通過具有此類水平的光子能的紫外照射來進行電離化。所述工具包還可以包括反應管、混合管和顯示化學反應完成程度的指示劑。該工具包包括書面的說明書,以開展如上所述的衍生化反應以及如下所述引入鎖定質量離子,其還可以包括用于分析從本發明的實踐中獲得的質量數據或質量譜的說明書。該工具包還包括用于在質譜分析之前色譜清除反應產物的固相設備。
所述數據分析系統包括用于對質量分析數據進行分析及報告的計算機或數據處理器,顯示質譜的顯示單元(例如視頻監視器)和/或打印機。對序列分析而言,所述計算機/數據處理器包括用于開展序列計算和顯示或打印氨基酸序列的軟件。可用相同的或單獨的計算機/數據處理器來提交序列數據,來進行數據庫分析、蛋白質鑒別或上述的蛋白質組學或基因組學分析。
下述內部質量校正系統的目的是對最后的質量分析儀場所提供鎖定質量,其可被用于修正(校正)所述質量分析儀的質荷比的比例尺。在不同類型的質量分析儀中,使用不同的比例尺。例如,當使用四極分析儀時,對應用的四極電壓和質荷比之間的轉換進行校正。在飛行時間質量分析儀中,對離子漂移時間和質荷比之間的轉換進行校正。鑒于多種因素例如溫度、電壓波動、壓力和腔的長度會影響到校正,而且其影響難于被計算及預測,使用參照鎖定質量是確保通過質譜分析儀檢測和計算得到的質荷比的精確度的有用手段。
圖6顯示了包括本發明的示例性的質譜分析儀系統。用于分析經過多次衍生化的多肽樣品的質量分析儀系統1包括離子源10和質量分析儀5。離子源10被用于對經過衍生化的多肽待分析物分子進行電離,以及將得到的離子導向質量分析儀接口20。可用于本發明的不同類型的離子源包括電噴霧、大氣壓化學電離化、大氣壓光電離化、基質輔助激光解吸附電離化和大氣壓基質輔助激光解吸附電離化的源,以及其它已知的類型。所述的離子源可以實質上處于大氣壓下,但是低于或高于大氣壓的壓力下的源也被認為是在本發明用途的范圍之內的。
為確保足夠數量的經衍生化多肽待分析物離子通過接口20進入到質譜分析儀5中,所述的源10和接口可被保持有電勢差,將所述的待分析物離子推動到孔21中。也可能存在其它結構或者電極(未示出),它們具有電勢差以幫助將待分析物離子推動到孔21中。氣流也可被用于幫助將離子推動到孔21中。圖6中,接口20被顯示為從質譜儀5向著離子源延伸出去的毛細管,但其可以僅僅是一個孔。接口中的孔21可以典型地在200-1000 4m直徑的范圍內,但是更大或更小的直徑是可用的。其它未顯示出來的設備可被包括進質譜分析儀5或接口20,以進一步地協助待分析物離子的解溶劑化。此類設備可以包括加熱的毛細管,其導致了質譜分析儀中轉運待分析物離子期間溶劑的蒸發;和/或加熱的氣體逆流,其在待分析物離子通過接口20進入質譜分析儀之前干燥所述的待分析物離子。以這種方式,與所述溶劑相關的經電離的待分析物以高濃度進入質譜分析儀5。
待分析物離子通過接口20,被吸引至質譜分析儀5的第一真空場所30,其典型地處于大約0.5-5托的壓力下。在第一真空場所30中,待分析物離子通常會經歷自由射流脹大(free jet expansion)。處于第一真空場所下游末端的撇沫器34中止了所述的射流脹大,待分析物離子經過撇沫器34進入到第二真空場所40,其典型地處于大約0.5-5托。需要注意圖6描述的真空場所30、40、50、60是與一個真空泵系統耦合的,這將為本領域技術人員所理解。
當所述待分析物離子進入真空場所30時,所述離子主要被氣流、電極(例如撇沫器34)上的電壓以及其它可能存在的用以協助離子轉運的離子光學元件推動。(此類可能存在于真空場所30中的元件并未在圖6中示出)。通過離子光學器件48,對經過撇沫器34到真空腔40的待分析物離子的運動進行進一步地協助。下文中,離子光學器件48應被解釋為包括了在接口20和質量分析儀75之間的所有離子光學元件,包括撇沫器34和圖6-10中未示出的位于真空場所30的其它元件。
鎖定質量離子的源41與離子光學器件48相鄰。在上下文中“與……相鄰”被定義為包含如下概念中的一個或多個“在……旁邊”、“在……附近”、“圍繞著……的”、“部分圍繞著……的”、“包括……的部分”、“與……相連”以及“與……有功能性的關聯”。源41的功能是在離子光學器件48內的區域47制造離子,或者向該區域提供離子。源41的一部分因此可被置于所述質譜儀真空腔的外面。一個例子可以是激光或紫外照射源,其發射的光通過適當的窗口或光學器件被引向區域47。另一個例子是鎖定質量氣體源,其向系統提供氣體,并因此將鎖定質量分子引入到所述分子可被電離的區域47中。
在一種實施方式中,如圖7所示,從鎖定質量源提供的鎖定質量分子通過入口43以氣相形式被引入到第二真空場所。所述鎖定質量可以是滿足下述條件的任何化學物質,所述化學物質在減壓和/或高溫條件下可揮發,當暴露于光子或電離化試劑氣體(例如丙酮)時具有化學穩定性及可被電離。例如,具有高達5000Da分子量的有機化學物質,例如,氟化膦嗪、聚乙二醇、烷基胺或氟化羧酸可以使用。上述化學物質以舉例的方式給出,任何數量的其它同樣合適的化學物質也可用于本發明。例如,被共同轉讓給Flanagan的美國專利No.5,872,357(通過全文引用被包括進本文中)中,描述了可被使用于本發明方法中、以避免污染和電荷競爭的其它合適的鎖定質量材料。當使用有機化學物質時,減少分析期間碳同位素C13的作用是有利的,以預防不精確性。典型的用于鎖定質量的有機化學物質具有7.5至12eV的電離勢,大多數具有低于10eV的電離勢,使得上述化學物質特別適用于通過具有此類水平的光子能的紫外照射來進行電離化。
在離子光學器件48的離子光學通路49中或與其相鄰之處,將注入到第二真空場所40中的鎖定質量分子流與經過衍生化的多肽待分析物離子混合。在所述離子光學通路49中,所述鎖定質量分子通過鎖定質量電離源45被電離,所述源45照射單個真空場所中的質譜分析儀軸向上的短跨度(或者,電離化區域47)。所述電離化區域47被限制為軸向上的短跨度,以確保鎖定質量離子與待分析物離子具有大約相同的碰撞條件,并在基本恒定的壓力下被產生出來。電離源45與中心軸的徑向距離取決于其提供的輻射強度,但是,一般而言,所述電離源被置于緊接電離化區域47的地方,以對該區域施加最大的照射。電離源45(和電離化區域47)可位于第二真空場所40之中,或者其可位于某下游真空場所例如50、60之中。(關于電離源45碰撞條件和定位的標準在下文中會被討論)。根據一種實施方式,電離源45是真空紫外(VUV)源,例如,等離子燈。產生10至10.6eV范圍內的光子的氪等離子燈,是特別適合鎖定質量電離勢的有關范圍的。或者,可以使用激光電離化技術,例如共振-增強多光子電離化(resonance-enhanced multiphoton ionization,REMPI)。在每一種情況下,109光子/cm2/s范圍內的光子流量可以產生精確檢測所需要的足夠的離子流。電離源45從外部能量源46接收電能。所述電離源通過從鎖定質量分子移除電子來產生正的鎖定質量離子。電離化的其它手段,例如電子碰撞是本領域已知的,也可被使用。或者,可以使用通過電或熱的手段來產生負的鎖定質量離子的電離源。
根據使用光電離源的一種實施方式,鎖定質量電離源45被置于第二真空場所40之中,其位置使得從所述源發射的光子可與離子光學通路49中的鎖定質量分子交叉。為使曝光(exposure)最大化,將鎖定質量氣體以相對于離子向導48的中心軸成直角的方向引入,并以相對于上述兩個方向都成直角的方向來引導電離源的最大強度是有利的。因為能量高于7.5eV的光子在第二真空場所中的壓力下容易被分散,和/或被背景氣體成分吸收,所以將所述電離源45定位于緊靠著離子光學器件是有好處的,例如,在100mm范圍內。然而,電離源45也可被置于真空系統外面。在那種情況下,所述電離化輻射通過合適的光學器件被轉移到電離化區域47中。
圖8展示了根據本發明的質譜分析儀系統的一種實施方式,其中,同心(concentric)VUV燈被用作為所述的電離源。圖8中,同心VUV燈與離子光學器件48的一部分同軸,或圍繞著該部分。如前述實施方式所述,VUV燈44的軸長度被限制為短跨度,以限定相應的電離化區域。
經衍生化的多肽待分析物離子和鎖定質量離子被引導到下游,這是沿著由離子光學器件48界定出的離子光學通路49進行的。所述光學器件可以包括對經過通路49的離子施加靜電和/或RF和/或磁場的電極和電路。典型的合適的光學器件包括多極離子向導,例如八極或六極離子向導。多極向導可與本領域內已知的多種手段組合使用,以產生沿著離子光學通路49的同軸電場。合適的向導包括,例如,離子漏斗,例如,美國專利No.6,107,628中描述的那些。
離子光學器件48執行至少三種功能首先,離子光學器件在離子源和質量分析儀之間以通常為軸向的方向移動離子,并防止離子的徑向損失。通常垂直于離子光學通路49的軸的場用于將離子限制在所述軸旁的區域,而軸向電場(通常結合氣體運動)用于使離子從離子源移動到質量分析儀中;第二,在真空場所,離子光學器件協助去除伴隨離子的氣體以及將離子源中大約是大氣壓的壓力降低至質量分析儀中的大約10-5托或更低。所述光學器件或向導的作用允許在所述離子被約迫沿著光學通路移動的時候,所述氣體逃逸至真空腔中并被泵抽走。典型地,為降低總壓力需要多個真空腔。所述離子光學器件和/或離子向導協助離子在腔間的轉移。腔的確切數目可以變動,其對本發明來說并不重要;第三,所述離子光學器件或向導在轉移期間對離子進行冷卻及聚焦。在通常的質譜分析實踐中,離子與離子向導中背景氣體的碰撞導致沿著向導軸向的離子在徑向和軸向的冷卻和聚焦。(聚焦在上下文中指減少光束的徑向范圍)。發生該作用的區域的背景氣體壓力典型地是毫托或更高。美國專利No.4,963,736中描述了通過碰撞進行的離子冷卻。
對于大多數類型的質量分析儀而言,冷卻和聚焦對獲得高分辨率和靈敏度來說是令人期待的,對于飛行時間質量分析儀來說尤其重要。充分的離子運動調節對TOF分析儀的良好的分辨率來說是必要的,其可以通過在將離子引入分析儀之前對離子碰撞冷卻和聚焦來獲得,這通常與用合適的孔對離子光束進行的“剪切”(“slicing”,降低橫向尺寸和發散度)組合使用。單獨使用離子光學器件(而沒有剪切),通過降低離子發散的速度,尤其是在相對于軸的橫向方向上的速度,來進行的冷卻是無法實現的,這是Liouville定理相空間中顆粒密度守恒的結果。
用三條坐標軸x、y、z和相應的動量分量px、py、pz來描述離子顆粒的運動。一種此類對運動的描述是代表顆粒的點在坐標軸和動量分量的六維空間中的軌道。該空間被稱為顆粒的相空間。用n個此類顆粒的系統,該系統的運動是相空間中顆粒的代表點所采取的一系列軌道(假設所述顆粒之間不發生相互作用)。Liouville定理指出“在可從哈密爾敦函數獲得的力的作用下,一組顆粒的運動是使得適當的相空間中代表點的局部密度在所有地方保持一致的。”由處于離子束外部的宏觀電磁場對離子施加的力落入了該類別中。在描述質譜分析儀系統中離子運動時,通常選用使得x、y、z運動互相獨立的坐標軸。這樣每個相空間的平面(x,p,)、(y,p,)和(z,p,)可被獨立考慮。對這種通常的情況而言,Liouville定理意味著隨著離子運動的進行,被所述離子的代表點占據的上述平面中的每個的區域可改變形狀,但不可改變面積。上述面積的大小只可被非保守力的作用(例如,碰撞)或被將離子移出光束(例如,剪切)所改變。
下文中,“離子的相空間”應被解釋為表示“被離子的代表點占據的相空間平面的區域”。本發明的說明書中提到的特定的相空間平面是與垂直于離子向導或離子光學器件的縱向軸的坐標軸相關的相空間平面。此類垂直的軸也被稱為“橫向(軸)”。
如果鎖定質量離子不以與待分析物離子相同的方式被冷卻和聚焦(即,它們與所述軸橫向的各自的相空間不一致),所述儀器的質量分辨率可能在所述的兩種物質間產生差異。在一些情況下,可能得到錯誤的質量校正。因此,令鎖定質量離子經歷與經衍生化的多肽待分析物離子實質上相同的冷卻和聚焦是很重要的。這伴隨著在顯著的冷卻和聚焦發生之前,即在離子到達適于冷卻的壓力(名義上為大約5毫托或更高)之前,在離子向導中產生鎖定質量離子。因此,在離子光學器件48的特定實施方式中,對鎖定質量分子電離化的最優位置易于被本領域技術人員所確定。
因此,為了在圖6的實施例系統中以類似方式調節鎖定質量離子和經衍生化的多肽待分析物離子,將鎖定質量和待分析物離子引導著經過同樣的離子光學通路49。它們因此被經歷近乎同樣的背景氣體碰撞歷史。在該實施例中,很多碰撞冷卻發生于第三真空場所50前,所述場所50保持于大約5毫托或更低一點的壓力下。為協助冷卻,第三真空場所50可以比其它場所更長,以加長離子光學通路49并因此增加離子和氣體分子間碰撞的可能性。
經衍生化的待分析物和鎖定質量離子從第三真空場所50進入第四高真空場所60,其中壓力降低至小于大約10-4托,或者在某些應用中小于大約10-5托。到含有質量分析儀75的真空腔70的接口65被置于第四真空場所的下游末端。任何類型的質量分析儀都可以使用;例子包括離子阱、四極質量過濾器、扇形磁場、TOF和傅立葉變換離子回旋共振(FTICR)分析儀。對質量分析儀附近或之中的壓力的實際選擇將取決于所用質量分析儀的種類,其將在大于10-4托(在用離子阱分析儀的情況下)至小于10-5托(對FTICR分析儀而言)之間的范圍內變動,中間的值是對四極質量過濾器和TOF分析儀的情況而言的。如果使用TOF分析儀,接口65可以包含用于在離子進入垂直加速腔之前限制其光束橫向范圍的剪切器。經衍生化的多肽待分析物和鎖定質量離子可被選擇,并接著用質量分析儀75中的離子檢測器對其進行檢測。
圖9圖示了串聯質譜分析儀系統200的一種實施方式,其提供了鎖定質量校正和對經衍生化的多肽待分析物的測量。如圖所示,經衍生化的多肽待分析物離子源202將待分析物離子通過孔204引入到真空接口腔205種,所述的孔204處于縱向毛細管206上。待分析物離子流經接口腔205和撇沫器208,進入到真空腔209的第一質量分析儀215中。可選地,離子光學器件210被包括,用于對進入質量分析儀215的待分析物離子進行聚焦和加速。在期待質量范圍內的待分析物離子被選擇出來并經過所述的質量分析儀,余下的離子被濾掉。經過第一質量分析儀215的選出的待分析物離子然后在被加速到適于碰撞離解(dissociation)的動能之后再進入真空腔218中的碰撞室220。在所述碰撞室220中,至少一部分“父代”待分析物離子(通常是長的多肽或蛋白質),通過與氣體的碰撞被片段化成“子代”離子,所述氣體可以是從碰撞氣源230提供并保持于適當壓力下的惰性氣體,例如氮。如本領域所已知,所述碰撞氣體壓力及碰撞室220的長度被選擇,來產生足夠的離解碰撞,以產生需要量的子代離子。所述子代離子(通常是較短的多肽片段)然后通過氣流或通過離子光學器件(未示出)被轉移到真空腔232的第二質量分析儀240中。在一些實施方式中,可以用碰撞室220的DC電場來協助對子代離子的轉移。鎖定質量離子可在碰撞室220中產生,或從與碰撞室220相鄰(此處的“相鄰”按上文所述來理解)的鎖定質量離子源241被引入到碰撞室220。在一些實施方式中,所述鎖定質量離子源241可以包含用于向碰撞室220提供鎖定質量分子的鎖定質量源225,和用于在碰撞室220中電離化鎖定質量分子的鎖定質量電離源235。所述鎖定質量源225,例如,可以是氣體源。所述鎖定質量電離源235例如可以是紫外輻射源或激光。所述鎖定質量離子與待分析物子代離子再次被一起轉移至第二質量分析儀240中,所述轉移是通過氣流、碰撞室220中的DC電場、離子光學器件(未示出)或其組合來進行的。所述離子進入第二質量分析儀240,其選擇鎖定質量離子和待分析物子代離子通過,使它們進入到檢測器245中。隨后可以在數據獲取及處理單元250中進行數據分析,所述單元250與所述檢測器245相連或被包括在其中。
分析儀215和240可以是任何類型的質量分析儀或質量過濾器。一種示例性的實施方式包括了215處的四極質量過濾器和240處的飛行時間質量分析儀。在一些實施方式中,第一分析儀215和碰撞室220可以被組合成具有上述兩項功能(質量選擇和離子片段化)的單個設備。例子包括四極離子阱和線性離子阱。該類型的一種示例性實施方式可以包括在215處的離子阱和在240處的飛行時間質量分析儀,其間有可選的光束調節離子光學器件。這樣單獨的碰撞室將不是必需的。單獨真空腔的實際數目將隨通常,鎖定質量分子可被引入到碰撞室220的任何地方,其可在沿著所述的室的縱向軸上的任何或所有位置被電離。因為鎖定質量離子將具有原本的熱初始動能,它們將不會經歷碰撞離解。對其中在碰撞室220中的場(DC、AC或RF)被用于對待分析物離子進行離解的實施方式而言,在所述室的下游末端處或附近對鎖定質量分子進行電離化是有好處的,其使得鎖定質量離子離開所述的室之前沒有較大部分離子被離解。在其中光束調節離子光學器件被置于碰撞室220下游,所述的室和第二質量分析儀之間的實施方式中,鎖定質量離子可產生于所述光學器件中,而不是碰撞室中。此類實施方式中的一種在圖10中被圖示出來。用于光束調節的離子光學器件222被置于碰撞室220和第二質量分析儀240之間。鎖定質量離子被產生于離子光學器件222,或從與離子光學器件222相鄰的(采用上文中的理解)鎖定質量離子源241引入離子光學器件222。在一些實施方式中,所述的鎖定質量離子源241可以包含用于向離子光學器件222提供鎖定質量分子的鎖定質量源225,和用于在離子光學器件222中電離化鎖定質量分子的鎖定質量電離源235。所述鎖定質量源225,例如,可以是氣體源。所述鎖定質量電離源235例如可以是紫外輻射源或激光。所述鎖定質量離子與待分析物子代離子再次被一起轉移至第二質量分析儀240中,所述轉移是通過氣流、DC電場、離子光學器件222或其組合來進行的。接著,按照上述那樣來進行對所述離子的質量分析。在一些實施方式中,第一質量分析儀215和碰撞室220可以被組合成單件設備,例如如上所述的離子阱。權利要求中術語“碰撞室”的范圍包括在另外的設備或裝置中開展碰撞室功能(例如離子片段化)的實施方式。
已結合上述若干質譜分析儀系統提到了通過內部引入鎖定質量來校正質譜分析儀系統的不同方法。根據第一種方法,鎖定質量分子被引入質譜分析儀系統源后的真空場所,再在待分析物離子下游通路中或附近被電離,使得待分析物離子和鎖定質量離子隨后都經過同樣的下游通路并一起被檢測和分析。在第二種方法中,為對串聯質譜分析儀進行校正,鎖定質量分子被引入,并在待分析物子代離子的通路中被電離。所述鎖定質量離子然后與待分析物子代離子一起被引導轉移,以便檢測和分析。
上述示例性方法中的內部引入鎖定質量的使用優于向離子源的引入。雖然存在可能,但是待分析物樣品和鎖定質量溶液之間的轉換不是必需的,在引入待分析物和鎖定質量樣品之間也不要求清洗的時間,因為所述鎖定質量物質不會污染離子源或其與質譜分析儀的接口。樣品分析的通量和速度因此相應增加。所有類型的離子源都可以使用,而沒有受到鎖定質量電離化需求或污染問題的限制。所述鎖定質量分子不與經衍生化的多肽待分析物反應,也不會為了電離化而競爭。
只要不與本公開矛盾,本說明書中引用的所有文獻和專利申請文件都以參考文獻的方式被包括進本文中,就像每件單獨的文獻或專利申請文件被特別且單獨地指出以參考文獻的方式被包括進來一樣。本說明書還全文引用了2004年7月16日遞交的美國專利申請10/892,870。
雖然為了清楚理解的目的,前述的發明某些細節是通過詳細闡述和實施例的方式來描述的,但是根據本發明的教導,可在不超過所附的權利要求的精神或范圍的情況下,做出某些改變和修改,這對本領域技術人員來說是很明顯的。
序列表<110>安捷倫科技有限公司蒂莫西·H·喬伊斯巴里·E·博伊斯戈登·R·尼古拉劉宏斌<120>用于衍生多肽的串聯質譜從頭測序的鎖定質量離子<130>10040405KTM7374<140>還未轉讓<141>2004-07-16<160>3<170>Patentln version 3.2<210>1<211>8<212>PRT<213>牛<220>
<221>MISC_FEATURE<223>來自β-晶狀體球蛋白(牛眼晶狀體)的肽<400>1Gly Leu Gln Tyr Leu Leu Glu Lys1 5<210>2<211>11<212>PRT<213>兔<220>
<221>MISC_FEATURE<223>來自丙酮酸激酶(兔肌肉)的肽<400>2Cys Asp Glu Asn Ile Leu Trp Leu Asp Tyr Lys1 5 10<210>3<211>11<212>PRT<213>牛<220>
<221>MISC_FEATURE<223>來自細胞色素c(牛心臟)的肽<400>3Gly Glu Arg Glu Asp Leu Ile Ala Tyr Leu Lys1 5 10
權利要求
1.一種對多肽進行質量分析的方法,所述方法包括對多肽待分析物進行第一次衍生化;對多肽待分析物進行第二次衍生化;對鎖定質量分子和經衍生化的多肽待分析物進行電離化;獲得對所述鎖定質量分子和所述經衍生化的多肽待分析物的質量分析。
2.如權利要求1所述的方法,還包括在第一次衍生化之前對所述多肽進行消化的步驟。
3.如權利要求1所述的方法,其中,所述的第一次衍生化包括將所述多肽與咪唑反應。
4.如權利要求1所述的方法,其中所述的第二次衍生化包括將所述多肽待分析物與烷基化試劑反應。
5.如權利要求4所述的方法,其中所述的第二次衍生化產生了谷氨酸或天冬氨酸酸性側鏈上羧基的烷基衍生物。
6.如權利要求1所述的方法,還包括從質量分析來確定經過連續衍生化的多肽的氨基酸序列。
7.如權利要求3所述的方法,其中所述的將所述多肽與咪唑反應的步驟是與2-甲氧基-4,5-二氫-1H-咪唑進行的。
8.如權利要求4所述的方法,其中所述的第二次衍生化包含對羧基進行甲基化。
9.如權利要求4所述的方法,其中所述的將所述多肽與烷基化試劑反應的步驟產生了羧基的烷基衍生物,所述烷基選自由乙基、丙基、正丙基、異丙基、丁基、正丁基、異丁基、仲丁基和叔丁基以及其組合所構成的組。
10.如權利要求1所述的方法,其中所述的對鎖定質量分子和多肽待分析物進行電離化的步驟發生在碰撞室中。
11.如權利要求1所述的方法,其中所述的對鎖定質量分子和經過連續衍生化的多肽進行電離化的步驟是用紫外輻射進行的。
12.一種確定多肽待分析物序列的方法,所述方法包括對多肽待分析物進行第一次衍生化,以產生具有經衍生化的賴氨酸的經過衍生化的多肽待分析物;將所述經過衍生化的多肽待分析物與第二試劑反應以產生經過多次衍生化的多肽待分析物;引入鎖定質量分子;對所述鎖定質量分子和所述經過多次衍生化的多肽進行電離化;以及進行對所述經過多次衍生化的多肽待分析物的質量分析。
13.如權利要求12所述的方法,還包括從所述質量分析來確定所述經過多次衍生化的多肽待分析物的氨基酸序列的步驟。
14.如權利要求13所述的方法,還包括將所述氨基酸序列與參照序列相比較。
15.如權利要求14所述的方法,還包括測定所述氨基酸序列的質量與所述參照序列質量之間的差異。
16.如權利要求15所述的方法,還包括將所述比較與翻譯后修飾關聯起來。
17.如權利要求12所述的方法,還包括在所述第一次衍生化之前對所述多肽待分析物進行消化的步驟。
18.如權利要求12所述的方法,其中,所述對鎖定質量分子和經過多次衍生化的多肽進行電離化的步驟發生于碰撞室中。
19.如權利要求12所述的方法,其中,所述對鎖定質量分子和經過多次衍生化的多肽進行電離化的步驟使用紫外輻射。
20.一種對多肽進行質量分析的方法,所述方法包括對鎖定質量分子和經衍生化的多肽進行電離化,所述多肽包含經咪唑衍生化的賴氨酸基團和經烷基化的羧基;以及獲得對所述鎖定質量分子和所述經衍生化的多肽的質量分析。
全文摘要
本發明公開了通過化學反應對用于質譜分析的待分析物進行的多次衍生化。所述衍生化增強了MS技術對于分析蛋白質樣品的用途,特別是通過串聯MS/MS來確定多肽的序列時。本發明中描述了用于對多肽進行測序以及在蛋白質分析中使用測序數據的精確質量分析技術。本發明還提供了用于對質譜分析儀進行校正的裝置和方法,所述校正是通過在所述質譜分析儀的源后場所內部引入校正質量來實現的。在質量分析之前將鎖定質量離子與經衍生化的多肽待分析物離子混合。
文檔編號C07K1/00GK1766636SQ200510084518
公開日2006年5月3日 申請日期2005年7月18日 優先權日2004年7月16日
發明者蒂莫西·H·喬伊斯, 巴里·E·博伊斯, 戈登·R·尼古拉, 劉宏斌 申請人:安捷倫科技有限公司