專利名稱:對在人類血清中指示人類肺組織的病理學狀態的蛋白質的鑒定的制作方法
技術領域:
本發明主要涉及對人類肺組織的病理學狀態(pathology)的診斷。更具體地,本 發明涉及使用液相色譜-質譜以鑒定在人類血清中存在的蛋白質來診斷非小細胞肺癌和 哮喘,當與正常群體中發現的相同蛋白相比在人類血清中在表達的相對強度方面改變時, 所述蛋白質指示與人類肺組織和人類呼吸系統相關的病理學狀態。通過鑒定與此類病理學 狀態相關的蛋白質,確定代表性的表達強度,并且將這些表達強度與在患者的血清中呈現 的表達強度比較,可以通過簡單的血液測試在其發展早期檢測病理學狀態的存在并且區分 所述病理學狀態。2.相關技術的描述呼吸系統的病理學狀態,例如哮喘和肺癌,影響數以百萬計的美國人。實際上,美 國肺科協會(American Lung Association)報道幾乎2千萬的美國人遭受哮喘痛苦。美國 癌癥協會(American Cancer Society)估計僅在2007年就有229,400例呼吸系統的新的 癌癥病例,164,840例死于呼吸系統的癌癥。因此,當檢測出癌癥盡管仍然為局部時,癌癥病 例的五年存活率為46%,肺癌患者的五年存活率僅為13%。相應地,在肺癌已經擴散前僅 16%的該疾病被發現。基于癌細胞的病理學狀態通常將肺癌分類為兩種主要類型。各類型 以被轉化從而變得癌化的細胞的類型而命名。小細胞肺癌源自在人類肺組織中的小細胞, 而非小細胞肺癌通常包括不是小細胞類型的所有肺癌。因為對于所有的非小細胞類型治療 通常相同,所以將非小細胞肺癌歸類在一起。非小細胞肺癌或NSCLC—起占所有肺癌的約 75%。降低肺癌患者的存活率的主要因素為肺癌難以早期診斷的事實。在人類中診斷肺 癌或鑒定其存在的當前方法局限于采用X-射線、CT掃描和肺的類似掃描以物理上地確定 腫瘤的存在或不存在。因此,肺癌的診斷常常僅應答于已經呈現一段顯著時間的癥狀,并 且在所述疾病已經在人類中呈現足夠長的時間以產生物理上可檢測的團塊(mass)之后進 行。類似地,檢測哮喘的當前方法典型地在癥狀例如反復哮喘、咳嗽和胸悶呈現后長 時間進行。檢測哮喘的當前方法典型地局限于肺功能測試例如肺活量測試或激發測試 (challenge test)。此外,這些測試被醫生命令與許多其它測試一起進行以排除其它病理 學狀態或疾病例如慢性阻塞性肺病(COPD)、支氣管炎、肺炎和充血性心力衰竭。在現有技術中沒有在其發展早期診斷人類肺組織的病理學狀態的簡單可靠的方 法。此外,現在不存在能夠指示特定肺組織病理學狀態的存在的可利用的血液測試。因此期望開發在疾病發展早期確定肺癌的存在的方法。同樣地期望開發在癥狀的出現的最早期 診斷哮喘和非小細胞肺癌和使其相互區分開和與其它肺疾病例如感染區分開的方法。進一 步期望鑒定在人類血液中存在的特定蛋白質,其當在表達的相對強度方面改變時,指示非 小細胞肺癌和/或哮喘的存在。發明概述本發明提供使用液相色譜電噴霧離子化質譜(“LC-ESIMS”),鑒定在人類血清中存 在的蛋白質的新方法,所述蛋白質在正常個體和按照醫生診斷而已知患有非小細胞肺癌和 哮喘的患者之間差異地表達。指示非小細胞肺癌和/或哮喘的蛋白質的選擇通過將質譜數 據,即肽的質量和在一維上隨時間表達的蛋白質強度的圖解表示(graphicalindications) 比較來進行。比較了數以千計的蛋白質,導致11種蛋白質的選擇,所述蛋白質在不患有任 何肺組織病理學狀態的個體的群體、按照醫生診斷患有哮喘的個體的群體和按照醫生診斷 患有非小細胞肺癌的個體的群體之間以基本上不同的強度表達。具體地,人類血清從“正常群體”、“哮喘群體”和“肺癌群體”獲得。本文所用的“正 常群體”旨在定義已知未患有哮喘或肺癌的那些個體。本文所用的“哮喘群體”旨在定義已 知患有哮喘并且被醫生診斷患有哮喘的那些個體。本文所用的“肺癌群體”旨在定義已知 患有非小細胞肺癌并且被醫生診斷患有非小細胞肺癌的那些個體。獲得正常群體、哮喘群體和肺癌群體的血清之后,將各血清試樣分成等分試樣并 且暴露于消化劑(digesting agent)或蛋白酶,即,胰蛋白酶,以將在血清試樣中存在的蛋 白質消化成定義的和可預測的裂解物(cleavages)或肽。通過胰蛋白酶的酶促作用形成 的肽,通常稱為胰蛋白酶肽,然后通過將所述試樣進行離心以使不溶物質沉淀而從不溶物 質分離。包含胰蛋白酶肽的上清液然后進行毛細液相色譜以實現胰蛋白酶肽的時空分離 (tempero-spatial separation)0所述胰蛋白酶肽然后進行LC-ESIMS。各肽通過使所述肽通過疏水性流體的柱來及 時地分離,即,使水、包含0. 體積甲酸的乙腈通過包含Supelcosil ΑΒΖ+5 μ m填充材料 固定相的色譜柱,床長18cm,內徑0.375mm。分離的肽通過柱洗脫液加載。所述柱具有這樣 的終點,從該終點分離的肽然后通過施加高電壓至相對于地面具有正偏壓的柱尖,形成帶 電荷的小滴而電噴霧化,所述帶電荷的小滴通過施加的電場的力向LC-ESIMS的入口加速。 形成的所得噴霧由包含溶解的胰蛋白酶肽的溶劑的小滴組成。所述小滴通過經過電噴霧源 的大氣壓區域然后進入加熱的LC-ESIMS的毛細管入口來去溶劑化。所述小滴的去溶劑化導致帶正電的離子(最典型地為氫)(H+)沉積在所述肽上,給予所述肽以電荷。在氣相中此類帶電荷的肽在本領域描述為“假分子離子 (pseudo-molecular ions) ”。所述假分子離子通過各種電勢被拉入LC-ESIMS的質譜儀,其 中它們在空間和時間上基于質荷比分離。一旦通過質荷比分離,所述假分子離子然后通過 另外的電場梯度導向LC-ESIMS的檢測器,其中所述假分子離子束轉化成通過數據記錄設 備記錄的電脈沖。這樣,使在胰蛋白酶消化物中存在的肽傳遞到在LC-ESIMS中的質譜儀,其中對各 肽測定分子量,在來自樣品的肽從所述柱離開(passout)的整個時間范圍產生重復獲得的 時間增量質譜。質譜讀數通常為通過LC-ESIMS發現的肽的圖解說明,其中χ軸為測定的質 荷比,y軸為所述肽的信號強度。這些質譜然后可以及時地組合成三維顯示,其中χ軸為色譜分離的時間,Z軸為質譜的質量軸,和1軸為質譜信號的強度,其與通過LC-ESIMS檢測的 給定假分子離子的量成比例。接下來,進行比較分析,對于從哮喘群體和肺癌群體測試的各個試樣和從正常群 體測試的各個試樣比較質譜讀數。在哮喘、肺癌和正常病理學狀態方面將與在LC-ESIMS中 檢測出的推定鑒定的蛋白相關的各胰蛋白酶肽假分子離子信號(“峰”)比較。將具有如下 質譜峰強度的肽確定為無意義的并且排除其指示當將哮喘群體或肺癌群體與正常群體比 較時肽的量未基本上改變。通常,所用的排除標準包括將給定蛋白質的至少一半鑒定的特 征肽的肽峰強度在源自來自各病理學狀態的個體患者血清的分析的至少10個數據組方面 做比較。如果源自給定蛋白質的大多數肽峰的強度在強度上是80%的血清數據組至少10 倍,將所述蛋白質分類為在兩種病理學狀態類別之間差異地調節。
作為比較分析的結果,11種蛋白質確定為在哮喘群體,肺癌群體和正常群體之間 一致地差異地表達。該11種蛋白質通過參考蛋白質和肽的已知數據庫或文庫來鑒定。此 類數據庫的實例包括由 NationalCenter for Biotechnology Information “ NCBInr“) 維護的 EntrezProtein、由 Swiss Bioinformatics Institute ( “ SwissProt “)維護 的 ExPASy 禾口 Medical Research Council Clinical Science Center of thelmperial College of London 的 Mass Spectral DatabaseC MSDB")。將來自每一正常、肺癌和哮喘群體的各個試樣的質譜讀數輸入已知的稱為Mascot 的搜索引擎。Mascot為本領域已知的搜索引擎,其使用質譜數據以從四個主要測序數據庫, 即MSDB、NCBInr, SwissProt和dbEST數據庫鑒定蛋白質。將搜索標準和參數輸入Mascot 程序,并且使各個試樣通過Mascot程序運行。Mascot程序然后針對測序數據庫運行輸入的 肽,將各肽的峰強度和質量與已知肽和蛋白質的質量和峰強度比較。然后Mascot產生可能 匹配的候選物列表,對于運行的各肽通常稱為“顯著匹配”。顯著匹配通過Mascot程序通過對于所測試的各個試樣指派稱為“Mowse得分”的 得分來確定。Mowse得分為如下算法,其中所述得分為-10女LOGltl(P),其中P為所觀察的 匹配為隨機事件的概率,其與當P小于0. 05的顯著性ρ值相關,其在科學界為通常承認的 顯著性標準。約55至約66或以上的Mowse得分通常認為是顯著的。由于特定搜索考慮和 數據庫參數而導致顯著性水平稍微變化。對于各肽運行返回所述顯著匹配,產生蛋白質的 候選物列表。然后使所述肽與來自所述顯著匹配的蛋白質匹配以確定在Mascot程序中運行 通過的肽的特征(identity)。對于通過Mascot程序鑒定的各肽和來自所述顯著匹配的 各蛋白質進行手工分析。排除被確定為“噪音”(無論是化學的或是電子的)的結果的 峰強度匹配。使來自質譜讀數的數據與所述顯著匹配交互檢查以驗證原始數據、峰特征 (peak identities)、電荷多重性(charge multiplicities)、同位素分布和側翼電荷狀態 (flanking charge state)。然后進行逆譜庫檢索(reverse search)以將可能已經通過Mascot程序的自動 檢索被漏失的肽添加至候選物列表。添加的肽通過以下來鑒定選擇表示與所比較的肽的 各參數基本上匹配的單一蛋白質的“最佳匹配”,進行計算機(in silico)消化,其中所述 胰蛋白酶肽和其各自的分子質量基于蛋白質的已知氨基酸或基因序列來計算。這些預測 的肽質量然后針對原始質譜數據搜索,并且使鑒定的任何峰如上所述進行檢查和具有資格(qualified)。然后,使包括通過Mascot自動鑒定的和通過手工檢查鑒定的所有的肽進入 由Mascot使用的質量列表。如本文下面所述,然后將細化的(refined)匹配用于推導出細 化的Mowse得分。作為鑒定過程的結果,確定為在哮喘群體、肺癌群體和/或正常群體之間顯 著差異地表達的11種蛋白質鑒定為BAC04615、Q6NSC8、CAF17350、Q6ZUD4、Q8N7P1、 CAC69571、包含FERM結構域的蛋白質4、JC1445蛋白酶體肽鏈內切酶復合物鏈C2長剪接 (JC1445proteasome endopetidase complex chain C2 long splice)、突角蟲融合蛋白 11、 AAK13083 和 AAK130490。BAC04615、Q6NSC8、CAF 17350、Q6ZUD4、Q8N7P1 為由基因測序成果 產生的鑒定的蛋白質。已知包含FERM結構域的蛋白質4參予胞質內蛋白質膜錨定。JC1445 蛋白酶體肽鏈內切酶復合物鏈C2長剪接為已知的蛋白酶體。突觸融合蛋白11在細胞免疫 應答中活躍。BAC04615,AAK13083和AAK130490為主要的組織相容性復合物(“MHC”)相 關蛋白質。
圖1描述顯示蛋白質BAC04615的Mowse得分和顯著匹配的表;圖2描述顯示蛋白質Q6NSC8的Mowse得分和顯著匹配的表;圖3描述顯示蛋白質CAF17350的Mowse得分和顯著匹配的表;圖4描述顯示蛋白質Q6ZUD4的Mowse得分和顯著匹配的表;圖5描述顯示蛋白質Q8N7P1的Mowse得分和顯著匹配的表;圖6描述顯示蛋白質CAC69571的Mowse得分和顯著匹配的表;圖7描述顯示蛋白質包含FERM 4結構域的蛋白質4的Mowse得分和顯著匹配的 表;圖8描述顯示蛋白質JC1445蛋白酶體肽鏈內切酶復合物鏈C2長剪接的Mowse得 分和顯著匹配的表;圖9描述顯示蛋白質突觸融合蛋白11的Mowse得分和顯著匹配的表;圖10描述顯示蛋白質AAK13083和AAK13049的Mowse得分和顯著匹配的表。發明詳述本發明提供使用液相色譜電噴霧離子化質譜,鑒定在人類血清中存在的蛋白質的 方法,所述蛋白質在正常個體和按照醫生診斷已知患有非小細胞肺癌和哮喘的患者之間差 異地表達。通過確定在未患有任何人類肺組織病理學狀態的人的群體、診斷患有哮喘的人 的群體和診斷有非小細胞肺癌的人的群體之間基本上和一致地差異地表達的蛋白質,并且 獲得這些蛋白質的特征,可以在患者中通過鑒定相同的蛋白質并且定量所述蛋白質的表達 水平的血液測試來鑒定所述病理學狀態的存在,以在各疾病的發展的更早期鑒定和診斷哮 喘或非小細胞肺癌。人類血液樣品收集自志愿者。從已知未患有非小細胞肺癌或哮喘的個體收集30 個樣品。已知未患有非小細胞肺癌或哮喘的個體包括,并且在本文中稱為“正常群體”。此 夕卜,如本文所用術語“肺癌”,旨在描述非小細胞肺癌。從已知患有哮喘并且被醫生診斷為患 有哮喘的個體收集28個血液樣品。已知患有哮喘的個體包括,并且在本文中稱為“哮喘群 體”。從已知患有非小細胞肺癌并且被醫生診斷為患有非小細胞肺癌的個體收集30個血液樣品。已知患有非小細胞肺癌的個體包括,并且在本文中稱為“肺癌群體”。通常,如本文所 用,術語“肺癌”旨在指非小細胞肺癌。最后,從已知由于按照醫生記錄的由于吸煙歷史而 具有肺癌風險的個體收集71個血液樣品。這71個樣品為正在進行的研究和試驗的對象, 并且因此未在本文討論。
所述血液樣品使用標準靜脈穿刺技術以IRB批準的實驗方案,遵循知情同意原則 從志愿者收集入無菌的10ml BDVacutainer 玻璃血清紅頂管。所述血液樣品然后在 室溫下不受干擾地靜置30分鐘以使血液凝塊。所述樣品在室溫下以2000rpm在標準臺式 離心機(benchtopcentrifuge)中旋轉10分鐘以將血清從血液樣品分離。然后通過將血清 移液入第二管(secondary tube)來除去各樣品的血清。所述第二管在冰上預冷以通過限 制由于蛋白水解和變性導致的降解而確保各血清試樣的完整性。然后將來自收集的各樣品 的血清試樣分成在冰上在預冷的冷凍管(Cryovial tube)中的1.0ml的等分試樣。將來自 所述血清試樣的等分試樣貯存在至少如零下80攝氏度(-80°C ) 一樣冷的溫度下。從放血 (phlebotomy)到在_80°C下貯存的處理時間不超過1小時。隨機選擇來自各個哮喘群體、正常群體和肺癌群體的8至10個血清試樣以測試。 使來自各個群體的各個血清試樣經受蛋白酶或消化劑(在這種情況下為胰蛋白酶)。胰蛋 白酶用作蛋白酶,并且因為其進行高度特異和高度可預測裂解的能力被期望用作蛋白酶, 這是由于以下事實已知胰蛋白酶在賴氨酸和精氨酸的羧基側裂解肽鏈,除了其中脯氨酸 緊接地存在于賴氨酸或精氨酸后之外。雖然使用胰蛋白酶,可以使用其它蛋白酶或消化劑。 期望使用這樣的蛋白酶,或蛋白酶的混合物,其至少如胰蛋白酶一樣特異地裂解。然后通過使試樣進行離心和毛細管液相色譜從不可溶物質中分離胰蛋白酶肽 (其為通過胰蛋白酶裂解后剩下的肽),其中使用具有0. 甲酸的水性乙腈梯度液,使用 在Eksigent 2D毛細管HPLC上的0. 375X 180mm Supelcosil ABZ+柱以實現產生的胰蛋 白酶肽的色譜分離。所述肽的分離是需要的,因為電噴霧離子化過程經受離子共抑制(ion co-suppression),其中具有更高質子親和力的離子類型將抑制具有較低質子親和性的離 子的離子形成,如果它們同時地從電噴霧發射器洗脫的話,在該情況下電噴霧發射器與 HPLC柱的末端共終端(co-terminal)。該方法允許分離在胰蛋白酶消化中產生的大量肽,并且有助于最小化共抑制問 題,由此最大化假分子離子共抑制的形成的機會,從而最大化離子取樣。各個試樣的胰蛋白 酶肽然后進行LC-ESIMS。所述LC-ESIMS通過使在各個試樣中的肽通過如上所述由水、乙腈 和甲酸組成的溶劑系統的柱及時地分離在各個試樣中的各肽。所述肽然后在電噴霧離子源中噴射以使所述肽離子化并且產生如上所述的肽假 分子離子。使所述肽通過在LC-ESIMS中的質譜儀,其中分子質量就各肽假分子離子進行測 量。在通過LC-ESIMS之后,對于各樣品中存在的肽從=質譜數據,即所述肽的強度、分子量 和洗脫時間產生質譜讀數。質譜讀數通常為通過LC-ESIMS記錄的的肽假分子離子信號的 圖解說明,其中χ軸為測量的質荷比,y軸為所述假分子離子信號的信號強度。然后通過控 制LC-ESIMS的軟件系統處理這些數據并且獲得和貯存所得數據。一旦獲得質譜數據并將其置于質譜讀數上,進行比較分析,其中病理學狀態之間 地(interpathologically)和病理學狀態之內地(intrapathalogically)對于各個群體進 行在LC-ESIMS中測試的各血清試樣的質譜讀數。在正常群體中測試的各個試樣之間比較質譜峰。然后在哮喘群體和肺癌群體中測試的各個試樣之間比較質譜峰。進行病理學狀態 之內地比較后,則進行病理學狀態之間地比較,其中將對于哮喘群體在LC-ESIMS中測試的 各個試樣的質譜讀數與在正常群體中測試的各個試樣進行比較。同樣地,將對于肺癌群體 在LC-ESIMS中測試的各個試樣的質譜讀數與在正常群體中測試的各個試樣進行比較。將具有如下質譜讀數的肽確定為不顯著地并且排除當將哮喘群體或肺癌群體與 正常群體比較時,所述質譜讀數指示肽強度不一致地差異性地病理學狀態之內的表達或基 本上不改變(在強度上低于10倍方差(variance))。通常,所用的排除標準包括對于給 定蛋白質,將至少一半所鑒定的特征肽的肽峰強度在源自來自各病理學狀態的個體患者血 清的分析的至少10個數據組上做比 較。如果源自給定蛋白質的大多數肽峰的強度在強度 上對于80%的血清數據組是至少10倍高,將所述蛋白質分類為在兩種病理學狀態類別之 間差異地調節。然而,產生經觀察被差異性調節的肽的蛋白質的特征是未知的并且需要鑒定。為 了進行所述蛋白質的鑒定,將肽假分子離子信號強度在整個已知數據庫上比較,所述已知 數據庫包含已知蛋白質和肽以及可疑蛋白質和肽的文庫。將來自各個正常、肺癌和哮喘群體的各個試樣的胰蛋白酶消化物的質譜讀數輸入 已知的稱為Mascot的搜索引擎。Mascot為本領域已知的搜索引擎,其使用質譜數據以從四 個主要測序數據庫,即MSDB、NCBInr、SwissProt和dbEST數據庫鑒定蛋白質。這些數據庫 包含已知序列的所有蛋白和基于源自基因序列的特征性蛋白質轉錄起始區域的觀察的所 有推定蛋白方面的信息。對這些數據庫就精度和冗余進行連續地檢查并且進行連續的添加 作為新的蛋白質和基因序列在科學和專利文獻中鑒定和出版。作為比較分析的結果,11種蛋白質被確定為在哮喘群體、肺癌群體和正常群體之 間一致地差異地表達。將搜索標準和參數輸入Mascot程序,并且使來自各個群體質譜讀數 的質譜數據通過Mascot程序運行。輸入Mascot程序的質譜數據用于各病理學狀態的所有 試樣。Mascot程序然后針對測序數據庫運行輸入的肽的質譜數據,將各肽的峰強度和質量 與已知肽和蛋白質的質量和峰強度進行比較。Mascot然后產生搜索結果,其返回可能的蛋 白質鑒定匹配(對于分析的各樣品通常稱為“顯著匹配”)的候選物列表。顯著匹配通過Mascot程序通過對于測試的各個試樣指派稱為“Mowse得分”的得 分來確定。Mowse得分為一種算法,其中所述得分為-10女LOGltl(P),其中P是所觀察的匹 配為隨機事件的概率,其與其中P小于0. 05的顯著性ρ值相關,其在科學界為通常承認的 標準。約55至約66或以上的Mowse得分通常認為是顯著的。由于特定搜索考慮和數據庫 參數導致顯著性水平稍微變化。對于各肽運行返回所述顯著匹配,產生蛋白質的候選物列 表。接下來,進行比較分析,將從哮喘群體和肺癌群體測試的各試樣和從正常群體測 試的各試樣的質譜讀數進行比較。在哮喘、肺癌和正常病理學狀態方面將與在LC-ESIMS中 檢測的推定鑒定蛋白相關的各個胰蛋白酶肽假分子離子信號(峰)進行比較。將具有如下 質譜峰強度的肽確定為無意義的并且排除其指示當將哮喘群體或肺癌群體與正常群體比 較時肽的定量基本上未改變。通常,所用的排除標準包括將給定蛋白質的至少一半鑒定的 特征肽的肽峰強度在源自來自各病理學狀態的個體患者血清的分析的至少10個數據組上 做比較。如果源自給定蛋白質的大多數肽峰的強度在強度上對于80%的血清數據組是至少10倍高,將所述蛋白質分類為在兩種病理學狀態類別之間差異地調節。使來自質譜讀數的數據與所述顯著匹配進行交互檢查以驗證原始數據、峰特性、電荷多重性、同位素分布和側翼電荷狀態。然后進行逆譜庫檢索以將肽添加至候選物列表, 其可能被Mascot程序的自動搜索所錯過。添加的肽通過以下來鑒定選擇表示與所比較的 肽的各參數基本上匹配的單一蛋白質的“最佳匹配”,進行計算機消化,其中所述胰蛋白酶 肽和其各自的分子質量基于蛋白質的已知氨基酸或基因序列進行計算。然后針對原始質譜 數據搜索這些預測的肽質量,并且使鑒定的任何峰如上所述進行檢查和具有資格)。然后, 使包括通過Mascot自動鑒定的和通過手工檢查鑒定的所有的肽進入由Mascot使用的質量 列表。如本文下面所述,然后將細化的匹配用于推導出細化的Mowse得分。參考圖1至圖10,就鑒定為在肺癌群體或哮喘群體與正常群體之間比較差異性表 達的各蛋白質顯示Mascot搜索結果。在各情況中,輸入搜索標準和參數,建立顯著性的可 接受性的Mowse得分閾值。參考圖1,顯示蛋白質BAC04615的Mascot搜索結果。選擇要 搜索的數據庫為NCBInr 10,輸入Mascot程序的試樣的分類設置為智人(Homosapiens) 12。 顯著性的Mowse得分閾值確認為66的Mowse值或大于14。作為Mascot搜索的結果,獲得 121的最高得分,如Mowse得分圖形18所示,所述圖的y軸表示具有特定Mowse得分的鑒定 的蛋白質的數量。仍然參考圖1,如行20所示,對于gi/21755032給出121的最高Mowse得分。121 的Mowse得分是高度顯著的,表示存在匹配是隨機的非常低的可能性。實際上,如第28列所 示,該匹配將隨機出現的預期將通過Mascot程序表示為1. 7X10_°_7。然而,在第22,24和26 行中指示的蛋白質也具有非常高的Mowse得分,表示這3種蛋白質也是顯著匹配。然后進行 手工分析,其中除去非顯著的和/或噪音數據,并且交換檢查原始數據、峰特征、電荷多重 性、同位素分布和側翼電荷狀態。作為手工分析的結果,在第22,24和26行指示的蛋白質為 顯著匹配的可能性顯著地降低,并且因此,將在第22,24和26行指示的蛋白質排除在匹配 之外。在圖1中在第20行指示的蛋白質,gi/21755032,鑒定為通過將質譜數據輸入Mascot 程序所指示的蛋白質,在第20行指示的蛋白質編號,gi/21755032,(其中gi編號有時寫為 “GI”)僅僅是被連續地分配給由NCBI處理的各序列記錄的一系列數字。gi/21755032與蛋 白質BAC04615相對應。參考圖2,顯示蛋白質Q6NSC8的Mascot搜索結果。如在Mowse得分圖形30中通 過Mowse得分條形圖(bar) 36所示,顯著性29的Mowse得分閾值確認Mowse值為64,并且 獲得117的最高Mowse得分。與Mowse得分條形圖36相對應的鑒定的蛋白質為Q6NSC8, 如在第32行中所示。如在圖2中所示,Mowse得分圖形30的陰影線部分34表示如下蛋白 質其被記錄,但其在顯著性的閾值之下,并且因此不予考慮。參考圖3,顯示蛋白質CAF17350的Mascot搜索結果。如在Mowse得分圖形40中 通過Mowse得分條形圖42所示,顯著性38的Mowse得分閾值確認Mowse值為64,并且獲得 152的最高Mowse得分。與Mowse得分條形圖42相對應的鑒定的蛋白質為CAF17350,如在 第46行中所示。如在圖3中所示,Mowse得分圖形40的陰影線部分44表示如下蛋白質 其被記錄,但其在顯著性的閾值之下,并且因此不予考慮。參考圖4,顯示蛋白質Q6ZUD4的Mascot搜索結果。如在Mowse得分圖形50中通 過Mowse得分條形圖52所示,顯著性48的Mowse得分閾值確認Mowse值為64,并且獲得220的最高Mowse得分。與Mowse得分條形圖52相對應的鑒定的蛋白質為Q6ZUD4,如在第 56行中所示。如在圖4中所示,Mowse得分圖形50的陰影線部分54表示如下蛋白質其被 記錄,但其在顯著性的閾值之下,并且因此不予考慮。參考圖5,顯示蛋白質Q8N7P1的Mascot搜索結果。如在Mowse得分圖形60中通 過Mowse得分條形圖62所示,顯著性58的Mowse得分閾值確認Mowse值為66,并且獲得74 的最高Mowse得分。與Mowse得分條形圖62相對應的鑒定的蛋白質為gi/71682143,如在 第64行中所示。與圖1類似,gi/71682143對應于蛋白質Q8N7PI。在第66和68行中指示 的蛋白質也具有非常高的Mowse得分,表示這兩種蛋白質也是顯著匹配。然后進行手工分 析,其中除去非顯著的和/或噪音數據,并且交換檢查原始數據、峰特征、電荷多重性、同位 素分布和側翼電荷狀態。作為手工分析的結果,在第66和68行指示的蛋白質為顯著匹配 的可能性顯著地降低,并且因此,將在第66和68行指示的蛋白質排除在匹配之外。在圖5 中Q8N7PI鑒定為通過將質譜數據輸入Mascot程序而指示的蛋白質。指出在第70處關于 蛋白質Q8NB22的指示,因為其與Q8N7PI為相同的蛋白質。參考圖6,顯示蛋白質CAC69571的Mascot搜索結果。如在Mowse得分圖形74中 通過Mowse得分條形圖76所示,顯著性72的Mowse得分閾值確認Mowse值為64,并且獲得 171的最高Mowse得分。與Mowse得分條形圖76相對應的鑒定的蛋白質為CAC69571,如在 第78行中所示。在第80,82,84和86行中指示的蛋白質也具有非常高的Mowse得分,表示 這4種蛋白質也是顯著匹配。然后進行手工分析,其中除去非顯著的和/或噪音數據,并且 交換檢測原始數據、峰特征、電荷多重性、同位素分布和側翼電荷狀態。作為手工分析的結 果,在第80,82,84和86行指示的蛋白質為顯著匹配的可能性顯著地降低,并且因此,將在 第80,82,84和86行指示的蛋白質排除在匹配之外。在圖6中CAC69571鑒定為通過將質 譜數據輸入Mascot程序而指示的蛋白質。參考圖7,描述包含蛋白質FERM 4結構域的蛋白質4的Mascot搜索結果。如在 Mowse得分圖形90中通過Mowse得分條形圖92所示,顯著性88的Mowse得分閾值確認 Mowse值為64,并且獲得335的最高Mowse得分。與Mowse得分條形圖92相對應的鑒定的 蛋白質為包含FERM 4結構域的蛋白質4,如在第98行中所示。在第100,102,104、106和 108行中指示的蛋白質也具有非常高的Mowse得分,表示這5種蛋白質也是顯著匹配。然后 進行手工分析,其中除去非顯著的和/或噪音數據,并且交換檢查原始數據、峰特征、電荷 多重性、同位素分布和側翼電荷狀態。作為手工分析的結果,在第100,102,104、106和108 行中指示的蛋白質為顯著匹配的可能性顯著地降低,并且因此,將在第100,102,104,106 和108行中指示的蛋白質排除在匹配之外。在圖7中包含FERM 4結構域的蛋白質4鑒定 為通過將質譜數據輸入Mascot程序而指示的蛋白質。參考圖8,描述蛋白質JCC1445蛋白酶體肽鏈內切酶(endop印tidase)復合物鏈 C2長剪接形式(“JCC1445”)的Mascot搜索結果。如在Mowse得分圖形112中通過Mowse 得分條形圖114所示,顯著性110的Mowse得分閾值確認Mowse值為66,并且獲得123的 最高Mowse得分。與Mowse得分條形圖114相對應的鑒定的蛋白質為gi/4506179,如在第 116 行中所示。gi/4506179 對應于蛋白質 JCC1445。在第 118,120,122,124,126 和 128 行 中指示的蛋白質也具有非常高的Mowse得分,表示這6種蛋白質也是顯著匹配。然后進行手 工分析,其中除去非顯著的和/或噪音數據,并且交換檢查原始數據、峰特征、電荷多重性、同位素分布和側翼電荷狀態。作為手工分析的結果,在第118,120,122,124,126和128行 中指示的蛋白質為顯著匹配的可能性顯著地降低,并且因此,將在第118,120,122,124,126 和128行中指示的蛋白質排除在匹配之外。在圖8中JCC1445鑒定為通過將質譜數據輸入 Mascot程序而指示的蛋白質。參考圖9,顯示蛋白質突觸融合蛋白11的Mascot搜索結果。如通過Mowse得分條 形圖134、和第136和138行所示,顯著性130的Mowse得分閾值確認Mowse值為66,并且 兩次獲得127的最高Mowse得分。對于突觸融合蛋白11獲得95的第三Mowse得分,如在 第140行中所示。在圖9中突觸融合蛋白11鑒定為通過將質譜數據輸Mascot程序而指示 的蛋白質。參考圖10,描述兩種蛋白質AAK13083和AAK13049的Mascot搜索結果。如在第 148行和Mowse得分條形圖146所示,顯著性142的Mowse得分閾值確認Mowse值為64,并 且通過蛋白質Q5VY82獲得273的最高Mowse得分。在第150,152和154行中指示的蛋白 質也具有非常高的Mowse得分,表示這3種蛋白質也是顯著匹配。然而,作為進行手工分析 的結果,將在第150和154行中指示的蛋白質排除在可能的匹配之外。Q5VY82經受進一步 的調查和試驗以確認其是否顯著差異地表達。在圖10中如在第152行中所示的AAK13049 和AAK13083都鑒定為通過將質譜數據輸入Mascot程序而指示的蛋白質。圖1至圖10描述進行以鑒定所述11種蛋白質的數據分析,所述11種蛋白質當與 正常群體比較時在哮喘和/或肺癌群體中差異地表達。對于哮喘群體,正常群體和肺癌群 體就11種蛋白質的每一種進行本文所述并且如在圖1至圖10中所示的方法。作為鑒定過程的結果,確定為在哮喘群體肺癌群體和/或正常群體之間顯著差異 地表達的 11 種蛋白質鑒定為 BAC04615、Q6NSC8、CAF17350、Q6ZUD4、Q8N7P1、CAC69571、包 含FERM結構域的蛋白質4、JCC1445蛋白酶體肽鏈內切酶復合物鏈C2長剪接形式、突觸融 合蛋白 11、AAK13083 和 AAK130490。BAC04615、Q6NSC8、CAF 17350、Q6ZUD4、Q8N7P1 為由基 因測序成果產生的鑒定的蛋白質。已知包含FERM結構域的蛋白質4參予胞質內蛋白膜錨 定。JCC1445蛋白酶體肽鏈內切酶復合物鏈C2長剪接形式為已知的蛋白酶體。突觸融合蛋 白11在細胞免疫應答中活躍。BAC04615、AAK13083和AAK130490為主要的組織相容性復 合物(“MHC”)相關蛋白。已經鑒定出在哮喘和肺癌患者中連續差異地表達的11種特定蛋白質,可以通過 以下在所述疾病的發展早期診斷這些病理學狀態使來自患者血清的蛋白質BAC04615、 Q6NSC8、CAF17350、Q6ZUD4、Q8N7P1、CAC69571、包含 FERM 結構域的蛋白質 4、JCC1445 蛋白 酶體肽鏈內切酶復合物鏈C2長剪接形式、突觸融合蛋白11、AAK13083和AAK130490進行 LC-ESIMS,從這些蛋白質獲得質譜數據,并且將該質譜數據與正常群體的質譜數據進行比 較。可以通過將該質譜數據與來自肺癌群體和/或哮喘群體的質譜數據相比較而進行進一 步的分析,以驗證或取消(nullify)給定病理學狀態的存在。當然該分析可以擴展至多個另外的技術,由此可以確定特定的蛋白質濃度,包括 但不限于放射免疫測定,酶聯免疫吸附測定,經由可見光或紫外線的吸光度使用輻射測定 的、光譜測定的檢測的高壓液相色譜,質譜儀定性和定量分析,western印跡,借助于檢測放 射性探針或核酸、抗體的檢測的使用吸收或熒光光度法的1或2維凝膠電泳,通過許多化學 發光報道子系統中的任何的化學發光的定量,酶促測定,免疫沉淀或免疫捕獲測定或許多固相和液相免疫測定中的任何。除了在疾病發展的早期確定肺癌或哮喘的存在之外,本文鑒定為此類病理學狀態 的指示的蛋白質可以在相關方法中使用和應用以有助于治療肺癌和/或哮喘的目的。例 如,可以開發抗體以與這些蛋白質結合。所述抗體可以組裝在生物標記面板中,其中將任何 或所有的抗體組裝在基于單一珠的面板(panel)或試劑盒中以用于基于珠的免疫測定。所 述蛋白質然后可以使用基于珠的技術,例如Luminex' s xMAP技術進行多重免疫測定,和 定量。此外,其它非基于珠的測定可以用于定量蛋白質表達水平。通過定量蛋白質表達水 平,這些定量結果可以與正常群體、哮喘群體、/或肺癌群體的表達水平相比較以進一步驗 證或取消患者中肺癌或哮喘的存在。所述蛋白質也可使用和應用至藥理學領域以評價患者對治療性干預例如藥物治 療、放療/化療或外科手術治療的反應。此外,測定個體蛋白質的試劑盒或蛋白質的面板可 用于患者的例行測試以監視患者的健康狀況,所述患者處于病理學狀態的較高風險中,例 如吸煙者,或具有該病理學狀態的家族史的那些。
最后,本文鑒定的11種蛋白的每一種的氨基酸序列的序列表隨本文提交并且特 別引入以作參考。在序列表中,在SEQ ID NO :1中記載的氨基酸序列為提交本申請之日時 已知的蛋白質BAC04615的一級氨基酸序列。在SEQ ID NO :2中記載的氨基酸序列為提交 本申請之日時已知的蛋白質Q6NSC8的一級氨基酸序列。在SEQ ID NO :3中記載的氨基酸 序列為提交本申請之日時已知的蛋白質CAF17350的一級氨基酸序列。在SEQ ID NO :4中 記載的氨基酸序列為提交本申請之日時已知的蛋白質Q6ZUD4的一級氨基酸序列。在SEQ ID NO 5中記載的氨基酸序列為提交本申請之日時已知的包含FERM結構域的蛋白質4的 一級氨基酸序列。在SEQ ID NO :6中記載的氨基酸序列為提交本申請之日時已知的蛋白質 AAK13083的一級氨基酸序列。在SEQ IDNO 7中記載的氨基酸序列為蛋白質Q8N7P1提交本 申請之日時已知的一級氨基酸序列。在SEQ ID NO :8中記載的氨基酸序列為提交本申請之 日時已知的蛋白質CAC69571的一級氨基酸序列。在SEQ IDNO :9中記載的氨基酸序列為提 交本申請之日時已知的蛋白質JCC1445蛋白酶體肽鏈內切酶復合物鏈C2長剪接的一級氨 基酸序列。在SEQ ID NO :10中記載的氨基酸序列為提交本申請之日時已知的蛋白質突觸 融合蛋白11的一級氨基酸序列。在SEQ ID NO :11中記載的氨基酸序列為在SEQ ID NO 10中記載的氨基酸序列為提交本申請之日時已知的蛋白質AAK13049的一級氨基酸序列。本文和在序列表中所述的氨基酸序列為提交本申請之日時已知的一級氨基酸序 列。應該理解在未來可以對在序列表中列出的序列進行修飾。例如,可以發現翻譯后修飾, 其用列出的蛋白質的加工改變,或可以在體內在其功能的某些點上與所述蛋白質形成功能 性加合物。此外,序列表可以通過剪接差異或發現與命名蛋白質的相同家族的結構上密切 相關的蛋白質而改變。此外,由列出的蛋白質的加工或降解引起的在所有其排列中的蛋白 水解片段可以以親本蛋白以在醫學和藥理學利用開發的所有方式產生可利用的標記片段。 此類修飾被視為在本文所述的本發明的范圍,而無需背離本文所述本發明的范圍。盡管本發明已經參考具體實施方式
描述,該描述不旨以限制意義限制。參考本發 明說明書時,所述實施方式的各種改進,以及本發明的替代實施方式對本領域技術人員而 言是明顯的。因此,認為所附權利要求將包括落入本發明范圍的此類改進。
權利要求
鑒定在人類血清中存在的指示人類肺組織的病理學狀態的蛋白質的方法,當與來自未患有所述病理學狀態的人類的血清中相同的所述蛋白質的表達水平相比時,所述蛋白質具有改變的表達水平,所述方法包括以下步驟第一獲得步驟,從不患有所述人類肺組織的所述病理學狀態的人類群體獲得大量人類血清;第二獲得步驟,從患有哮喘的人類群體獲得大量人類血清;第三獲得步驟,從患有非小細胞肺癌的人類群體獲得大量人類血清;暴露步驟,將在所述第一獲得步驟、所述第二獲得步驟和所述第三獲得步驟中獲得的所述人類血清暴露于消化劑,所述消化劑將在所述人類血清中的所述蛋白質裂解成可預測和定義的肽;分離步驟,從所述人類血清分離所述肽;使用液相色譜質譜儀,將來自在所述第一獲得步驟、所述第二獲得步驟和所述第三獲得步驟中獲得的各個所述大量人類血清的所述肽進行分析,所述質譜儀其中具有疏水性固定相的柱,以及流過所述柱的溶劑系統,所述溶劑系統分離所述肽,以及檢測機構以產生質譜讀數,所述質譜讀數包括所述肽的質量和測量隨著所述肽通過所述柱的時間階段的所述肽的所述強度的圖解說明;第一比較步驟,將來自在所述第一獲得步驟中獲得的所述人類血清的所述質譜讀數與來自在所述第二獲得步驟中獲得的所述人類血清的所述質譜讀數進行比較;第二比較步驟,將來自在所述第一獲得步驟中獲得的所述人類血清的所述質譜讀數與來自在所述第三獲得步驟中獲得的所述人類血清的所述質譜讀數進行比較;第三比較步驟,將來自在所述第二獲得步驟中獲得的所述人類血清的所述質譜讀數與來自在所述第三獲得步驟中獲得的所述人類血清的所述質譜讀數進行比較;選擇步驟,選擇在所述第一比較步驟、所述第二比較步驟和所述第三比較步驟中比較的所述質譜讀數,其中所述質譜讀數指示在以下之間相同的所述肽的基本上變化的所述強度(a).患有所述哮喘的所述人類群體與不患有所述肺組織病的所述病理學狀態的所述人類群體;(b).患有所述非小細胞肺癌的所述人類群體與不患有所述肺組織病的所述病理學狀態的所述人類群體;和(c).患有所述哮喘的所述人類群體與患有所述非小細胞肺癌的所述人類的所述群體;鑒定步驟,通過從在所述選擇步驟期間選擇的所述質譜讀數獲得所述肽的特征,鑒定指示所述人類肺組織的所述病理學狀態的所述蛋白質;和其中所述人類肺組織的所述病理學狀態包括所述哮喘和所述非小細胞肺癌。
2.根據權利要求1所述的鑒定在人類血清中存在的指示人類肺組織的病理學狀態的 蛋白質的方法,其中所述消化劑為胰蛋白酶或其它內切蛋白酶。
3.根據權利要求2所述的鑒定在人類血清中存在的指示人類肺組織的病理學狀態的 蛋白質的方法,其中所述鑒定步驟進一步包括以下步驟分析步驟,通過預定義的計算機程序分析在所述選擇步驟期間選擇的所述質譜讀數, 所述預定義的計算機程序將所述肽的所述質譜讀數與預鑒定的蛋白質的質譜讀數的至少 一個文庫比較,并且將在所述質譜讀數中的所述肽的所述質量和所述強度與所述預鑒定的 蛋白質的質量和強度匹配;和獲得步驟,從所述預定義的計算機程序獲得作為結果的鑒定的蛋白質。
4.根據權利要求2所述的鑒定在人類血清中存在的指示人類肺組織的病理學狀態的 蛋白質的方法,其中所述鑒定步驟進一步包括以下步驟運行步驟,通過預定義的計算機程序運行在所述分析步驟期間選擇的所述質譜讀數, 所述預定義的計算機程序將所述肽的所述質譜讀數與預鑒定的蛋白質的質譜讀數的至少 一個文庫比較,并且將在所述質譜讀數中的所述肽的所述質量和所述強度與所述預鑒定的 蛋白質的候選物列表的質量和強度匹配,所述候選物列表包括具有與所述肽的所述質量和 所述強度基本上類似的所述質量和所述強度的大量所述預鑒定的蛋白質;和確定步驟,從所述候選物列表確定作為結果的鑒定的蛋白質。
5.根據權利要求4所述的鑒定在人類血清中存在的指示人類肺組織的病理學狀態的 蛋白質的方法,其中所述確定步驟包括消除在所述候選物列表中不是所述得到的鑒定的蛋 白質的蛋白質的步驟,包括以下步驟消除步驟,消除在所述候選物列表上的與所述肽的所述強度和質量不是最基本上相似 的所述蛋白質的所述強度和所述質量;和選擇步驟,從所述候選物列表選擇與所述肽的所述強度和質量最基本上相似的所述強 度和所述質量。
6.根據權利要求5所述的鑒定在人類血清中存在的指示人類肺組織的病理學狀態的 蛋白質的方法,其中在所述鑒定步驟中鑒定的所述蛋白質包括CAC69571。
7.根據權利要求5所述的鑒定在人類血清中存在的指示人類肺組織的病理學狀態的 蛋白質的方法,其中在所述鑒定步驟中鑒定的所述蛋白質包括包含FERM結構域的蛋白質 4。
8.根據權利要求5所述的鑒定在人類血清中存在的指示人類肺組織的病理學狀態的 蛋白質的方法,其中在所述鑒定步驟中鑒定的所述蛋白質包括JC1445蛋白酶體肽鏈內切 酶復合物鏈C2長剪接。
9.根據權利要求5所述的鑒定在人類血清中存在的指示人類肺組織的病理學狀態的 蛋白質的方法,其中在所述鑒定步驟中鑒定的所述蛋白質包括突觸融合蛋白11。
10.根據權利要求6所述的鑒定在人類血清中存在的指示人類肺組織的病理學狀態的 蛋白質的方法,其中在所述鑒定步驟中鑒定的所述蛋白質進一步包括包含FERM結構域的 蛋白質4。
11.根據權利要求6所述的鑒定在人類血清中存在的指示人類肺組織的病理學狀態的 蛋白質的方法,其中在所述鑒定步驟中鑒定的所述蛋白質進一步包括JC1445蛋白酶體肽 鏈內切酶復合物鏈C2長剪接。
12.根據權利要求6所述的鑒定在人類血清中存在的指示人類肺組織的病理學狀態的 蛋白質的方法,其中在所述鑒定步驟中鑒定的所述蛋白質進一步包括突觸融合蛋白11。
13.根據權利要求7所述的鑒定在人類血清中存在的指示人類肺組織的病理學狀態的 蛋白質的方法,其中在所述鑒定步驟中鑒定的所述蛋白質進一步包括JC1445蛋白酶體肽 鏈內切酶復合物鏈C2長剪接。
14.根據權利要求7所述的鑒定在人類血清中存在的指示人類肺組織的病理學狀態的 蛋白質的方法,其中在所述鑒定步驟中鑒定的所述蛋白質進一步包括突觸融合蛋白11。
15.根據權利要求8所述的鑒定在人類血清中存在的指示人類肺組織的病理學狀態的 蛋白質的方法,其中在所述鑒定步驟中鑒定的所述蛋白質進一步包括突觸融合蛋白11。
16.根據權利要求10所述的鑒定在人類血清中存在的指示人類肺組織的病理學狀態 的蛋白質的方法,其中在所述鑒定步驟中鑒定的所述蛋白質進一步包括JC1445蛋白酶體 肽鏈內切酶復合物鏈C2長剪接。
17.根據權利要求11所述的鑒定在人類血清中存在的指示人類肺組織的病理學狀態 的蛋白質的方法,其中在所述鑒定步驟中鑒定的所述蛋白質進一步包括突觸融合蛋白11。
18.根據權利要求13所述的鑒定在人類血清中存在的指示人類肺組織的病理學狀態 的蛋白質的方法,其中在所述鑒定步驟中鑒定的所述蛋白質進一步包括突觸融合蛋白11。
19.根據權利要求16所述的鑒定在人類血清中存在的指示人類肺組織的病理學狀態 的蛋白質的方法,其中在所述鑒定步驟中鑒定的所述蛋白質進一步包括突觸融合蛋白11。
20.根據權利要求6,7,8,9,10,11,12,13,14,15,16,17,18或19所述的鑒定在人類血 清中存在的指示人類肺組織的病理學狀態的蛋白質的方法,其中在所述鑒定步驟中鑒定的 所述蛋白質進一步包括選自以下的至少一種蛋白質BAC04615、Q6NSC8、CAF17350、Q6ZVD4 和 Q8N7P1。
21.根據權利要求20所述的鑒定在人類血清中存在的指示人類肺組織的病理學狀態 的蛋白質的方法,其中在所述鑒定步驟中鑒定的所述蛋白質進一步包括選自以下的至少一 種蛋白質BAC04615、AK13083 和 AK13490。
22.在患者中通過鑒定在所述患者的人類血清試樣中改變的蛋白質的表達強度來診斷 人類肺組織的病理學狀態的方法,所述方法包括第一獲得步驟,獲得用于所述蛋白質表達的所述改變的強度的待測試的所述患者血清 試樣;暴露步驟,將所述患者血清試樣暴露于消化劑,所述消化劑將在所述患者血清試樣中 的所述蛋白質裂解成定義的肽;分離步驟,從所述患者血清試樣分離所述肽;使用液相色譜質譜儀,將來自在所述第一獲得步驟中獲得的所述患者血清試樣的所述 肽進行分析,所述質譜儀其中具有疏水性固定相的柱,以及流過所述柱的溶劑系統,所述溶 劑系統分離所述肽,以及檢測機構以產生質譜讀數,所述質譜讀數包括所述肽的質量和測 試隨著所述肽通過所述柱的時間階段的所述肽的所述強度的圖解說明;選擇步驟,從所述人類血清試樣選擇至少一種所述肽以比較所述質譜讀數,所述肽的 所述質譜讀數代表在所述暴露步驟期間從其裂解所述肽的蛋白質的質譜讀數;第二獲得步驟,對于由在所述選擇步驟期間選擇的所述肽代表的各個相同蛋白質獲得 基本上未改變的表達強度的質譜讀數,所述未改變的表達強度從未患有人類肺組織的所述 病理學狀態的人類血清試樣的群體進行確定;第一比較步驟,將來自所述患者血清試樣的在所述選擇步驟期間選擇的所述至少一種 肽的所述質譜讀數與來自未患有所述人類肺組織的所述病理學狀態的人類血清試樣的所 述群體的所述未改變的蛋白質表達的所述質譜讀數進行比較;第一確定步驟,確定所述患者血清試樣的所述蛋白質表達的所述強度是否改變;其中所述蛋白質表達的所述改變的強度指示所述人類肺組織的所述病理學狀態;和其中所述人類肺組織的所述病理學狀態包括非小細胞肺癌和哮喘。
23.根據權利要求22所述的在患者中診斷人類肺組織的病理學狀態的方法,其中所述 消化劑為胰蛋白酶或其它內切蛋白酶。
24.根據權利要求23所述的在患者中診斷人類肺組織的病理學狀態的方法,其中在所 述選擇步驟中選擇的所述蛋白質包括CAC69571。
25.根據權利要求23所述的在患者中診斷人類肺組織的病理學狀態的方法,其中在所 述選擇步驟中選擇的所述蛋白質包括包含FERM結構域的蛋白質4。
26.根據權利要求23所述的在患者中診斷人類肺組織的病理學狀態的方法,其中在所 述選擇步驟中選擇的所述蛋白質包括JC1445蛋白酶體肽鏈內切酶復合物鏈C2長剪接。
27.根據權利要求23所述的在患者中診斷人類肺組織的病理學狀態的方法,其中在所 述選擇步驟中選擇的所述蛋白質包括突觸融合蛋白11。
28.根據權利要求24所述的在患者中診斷人類肺組織的病理學狀態的方法,其中在所 述選擇步驟中選擇的所述蛋白質進一步包括包含FERM結構域的蛋白質4。
29.根據權利要求24所述的在患者中診斷人類肺組織的病理學狀態的方法,其中在所 述選擇步驟中選擇的所述蛋白質進一步包括JC1445蛋白酶體肽鏈內切酶復合物鏈C2長剪 接。
30.根據權利要求24所述的在患者中診斷人類肺組織的病理學狀態的方法,其中在所 述選擇步驟中選擇的所述蛋白質進一步包括突觸融合蛋白11。
31.根據權利要求25所述的在患者中診斷人類肺組織的病理學狀態的方法,其中在所 述選擇步驟中選擇的所述蛋白質進一步包括JC1445蛋白酶體肽鏈內切酶復合物鏈C2長剪接。
32.根據權利要求25所述的在患者中診斷人類肺組織的病理學狀態的方法,其中在所 述選擇步驟中選擇的所述蛋白質進一步包括突觸融合蛋白11。
33.根據權利要求26所述的在患者中診斷人類肺組織的病理學狀態的方法,其中在所 述選擇步驟中選擇的所述蛋白質進一步包括突觸融合蛋白11。
34.根據權利要求28所述的在患者中診斷人類肺組織的病理學狀態的方法,其中在所 述選擇步驟中選擇的所述蛋白質進一步包括JC1445蛋白酶體肽鏈內切酶復合物鏈C2長剪 接。
35.根據權利要求29所述的在患者中診斷人類肺組織的病理學狀態的方法,其中在所 述選擇步驟中選擇的所述蛋白質進一步包括突觸融合蛋白11。
36.根據權利要求31所述的在患者中診斷人類肺組織的病理學狀態的方法,其中在所 述選擇步驟中選擇的所述蛋白質進一步包括突觸融合蛋白11。
37.根據權利要求34所述的在患者中診斷人類肺組織的病理學狀態的方法,其中在所 述選擇步驟中選擇的所述蛋白質進一步包括突觸融合蛋白11。
38.根據權利要求24,25,26,27,28,29,30,31,32,33,34,35,36 或 37 所述的在患者中 診斷人類肺組織的病理學狀態的方法,其中在所述選擇步驟中選擇的所述蛋白質進一步包 括選自以下的至少一種蛋白質BAC04615、Q6NSC8、CAF17350、Q6ZVD4 和 Q8N7P1。
39.根據權利要求38所述的在患者中診斷人類肺組織的病理學狀態的方法,其中在 所述選擇步驟中選擇的所述蛋白質進一步包括選自以下的至少一種蛋白質BAC04615、AK13083 和 AK13490。
40.根據權利要求39所述的在患者中診斷人類肺組織的病理學狀態的方法,進一步包括第三獲得步驟,獲得從來自患有哮喘的人類的人類血清試樣的群體在所述選擇步驟期 間選擇的所述肽代表的各個相同的蛋白質的表達強度的質譜讀數;第二比較步驟,將來自所述患者血清試樣的在所述選擇步驟期間選擇的所述至少一種 肽的所述質譜讀數與從來自患有哮喘的所述人類的人類血清試樣的所述群體的所述質譜 讀數進行比較;第二確定步驟,確定所述患者血清試樣的所述蛋白質表達的所述強度與從來自患有哮 喘的所述人類的人類血清試樣的所述群體的所述蛋白質表達的所述強度是否基本上類似; 禾口其中所述蛋白質表達的所述基本上類似的強度指示哮喘。
41.根據權利要求39所述的在患者中診斷人類肺組織的病理學狀態的方法,進一步包括第四獲得步驟,獲得從來自患有非小細胞肺癌的人類的人類血清試樣的群體在所述選 擇步驟期間選擇的所述肽代表的各個相同的蛋白質的信號強度的質譜讀數;第三比較步驟,將來自所述患者血清試樣的在所述選擇步驟期間選擇的所述至少一種 肽的所述質譜讀數與從來自患有非小細胞肺癌的所述人類的人類血清試樣的所述群體的 所述質譜讀數進行比較;第三確定步驟,確定所述患者血清試樣的所述蛋白質表達的所述強度與從來自患有非 小細胞肺癌的所述人類的人類血清試樣的所述群體的所述蛋白質表達的所述強度是否基 本上類似;和其中所述蛋白質表達的所述基本上類似的強度指示小細胞肺癌。
42.根據權利要求40所述的在患者中診斷人類肺組織的病理學狀態的方法,進一步包括第四獲得步驟,獲得從來自患有非小細胞肺癌的人類的人類血清試樣的群體在所述選 擇步驟期間選擇的所述肽代表的的各個相同的蛋白質的表達強度的質譜讀數;第三比較步驟,將來自所述患者血清試樣的在所述選擇步驟期間選擇的所述至少一種 肽的所述質譜讀數與從來自患有非小細胞肺癌的所述人類的人類血清試樣的所述群體的 所述質譜讀數進行比較;第三確定步驟,確定所述患者血清試樣的所述蛋白質表達的所述強度與從來自患有非 小細胞肺癌的所述人類的人類血清試樣的所述群體的所述蛋白質表達的所述強度是否基 本上類似;和其中所述蛋白質表達的所述基本上類似的強度指示小細胞肺癌。
43.根據權利要求40所述的在患者中診斷人類肺組織的病理學狀態的方法,其中通過 以下從來自患有哮喘的人類的人類血清試樣的所述群體獲得所述蛋白質表達的所述強度 的所述質譜讀數消化來自所述群體的各個人類血清試樣,從各個所述人類血清試樣分離 肽,和使各個所述人類血清試樣的所述肽進行所述液相色譜質譜。
44.根據權利要求41所述的在患者中診斷人類肺組織的病理學狀態的方法,其中通過以下從來自患有非小細胞肺癌的人類的人類血清試樣的所述群體獲得所述蛋白質表達的 所述強度的所述質譜讀數消化來自所述群體的各個人類血清試樣,從各個所述人類血清 試樣分離肽,和將各個所述人類血清試樣的所述肽用于所述液相色譜質譜儀。
45.根據權利要求42所述的在患者中診斷人類肺組織的病理學狀態的方法,其中通過 以下獲得從來自患有非小細胞肺癌的人類的人類血清試樣的所述群體的所述蛋白質表達 的所述強度的所述質譜讀數消化來自所述群體的各個人類血清試樣,從各個所述人類血 清試樣分離肽,和將各個所述人類血清試樣的所述肽經受所述液相色譜質譜儀。
全文摘要
鑒定在人類血清中存在的蛋白質的方法,所述蛋白質在正常個體和按照醫生診斷已知患有非小細胞肺癌和哮喘的患者之間差異地表達。將來自各個群體的人類血清試樣用胰蛋白酶或任何其它合適的內切蛋白酶消化,并且使用液相色譜電噴霧離子化質譜儀進行分析。比較來自各個群體的質譜數據以確定具有在正常、哮喘和肺癌群體之間顯著差異地表達的表達強度的蛋白質。發現11種蛋白質具有在所述群體之間顯著差異地表達的表達強度。最后,通過將所述質譜數據與具有已知蛋白質的質譜數據文庫的已知數據庫比較,獲得11種蛋白質的特征。
文檔編號G01N27/00GK101836106SQ200880113342
公開日2010年9月15日 申請日期2008年9月11日 優先權日2007年9月11日
發明者E·伊茲比卡, R·T·斯特里佩, S·H·貝克 申請人:癌癥預防和治療有限公司