專利名稱:肺癌生物標記及其用途的制作方法
肺癌生物標記及其用途
相關串請
本申請要求于2010年7月9日提交的美國臨時申請系列號61/363,122以及于 2011年2月21日提交的美國臨時申請系列號61/444,947的權益,這兩個臨時申請的題目均為“肺癌生物標記及其用途”。為了所有目的,這些申請每個整體援引加入本文。發明領域
本申請一般涉及個體中生物標記的檢測及癌癥的診斷,更具體地涉及用于診斷個體的癌癥,更特別是肺癌的一種或多種生物標記、方法、裝置、試劑、系統和試劑盒。
背景技術:
下面的描述提供了本申請相關信息的概述,并非承認任何本文提供的信息或者引用的出版物是本申請的現有技術。
肺癌是癌癥相關死亡率的最常見的原因。這對于男性和女性都是如此。2005年在美國,肺癌死亡比乳腺癌、前列腺癌和結腸癌死亡的組合還多。在那一年,107,416名男性和89,271名女性診斷患有肺癌,并且90,139名男性和69,078女性死于肺癌。在美國男性中,肺癌是白人男性、黑人男性、亞裔/太平洋島男性、美國印第安男性/阿拉斯加土著男性以及西班牙裔男性中第二常見的癌癥。在美國女性中,肺癌是白人女性、黑人女性和美國印第安女性/阿拉斯加土著女性中第二常見的癌癥,并且是亞裔/太平洋島女性和西班牙裔女性中第三常見的癌癥。對于不戒煙的人,肺癌死亡率為15%,甚至對于50-59歲的戒煙的人仍為5%以上。僅美國在肺癌上每年保健費用就為950億美元。
91%由吸煙所致的肺癌是非小細胞肺癌(NSCLC),其占所有肺癌的約87%。所有肺癌中剩余的13%是小細胞肺癌,雖然混合細胞肺癌確有發生。因為小細胞肺癌罕見且迅速致死,所以早期檢測機會不大。
NSCLC有三種主要類型鱗狀細胞癌、大細胞癌和腺癌。腺癌是最常見形式的肺癌 (30%-40%,且據報道高達50%),并且是在吸煙者和非吸煙者中最常發現的肺癌。鱗狀細胞癌占所有肺癌的25-30%,并且通常在近端支氣管中發現。早期NSCLC傾向于局部化,如果早期檢測到,其通常可以手術治療,并且結果有利且存活率改善。其他治療選擇包括放療、藥物療法和這些方法的組合。
NSCLC根據腫瘤大小及其在包括淋巴結在內的其他組織中的存在來分期。在隱藏期,癌細胞在痰樣品或灌洗樣品中發現,在肺中檢測不到腫瘤。在O期,僅肺最深的內襯 (lining)表現出癌細胞,腫瘤尚未生長通過內襯。在IA期,癌癥被認為是侵襲性的,并且已生長深入肺組織,但是腫瘤橫向(across)小于3cm。在這個時期,在支氣管或淋巴結中未發現腫瘤。在IB期,腫瘤橫向大于3cm或者已生長入支氣管或胸膜,但是尚未生長入淋巴結。 在IIA期,腫瘤橫向大于3cm,并且已生長入淋巴結。在IIB期,腫瘤在淋巴結中發現并且橫向大于3cm,或者已生長入支氣管或胸膜;或者癌癥不在淋巴結中但是在胸壁、膈、胸膜、 支氣管或圍繞心臟的組織中發現。在IIIA期,癌細胞在肺和支氣管附近的淋巴結中以及肺之間的淋巴結中,但是在腫瘤所位于的胸的一側上。在IIIB期,癌細胞位于胸的腫瘤的對側及在頸中。肺附近的其他器官也可以具有癌細胞,并且在一個肺葉中可以發現多個腫瘤。 在IV期,腫瘤在相同肺或兩個肺的多于一個的肺葉中發現,并且癌細胞在身體其他部分發現。
目前肺癌診斷方法包括測試痰的癌細胞、胸部X-射線、呼吸道的纖維光學評價和低劑量螺旋計算機斷層掃描(CT)。痰細胞學的靈敏性非常低。胸部X-射線也較不靈敏, 要求病灶的大小大于Icrn以可見。支氣管鏡檢查要求腫瘤在支氣管鏡可及的呼吸道內可見。最廣泛認可的診斷方法是CT,但是常與X-射線一起,CT的應用涉及電離輻射,其本身可以導致癌癥。CT還有明顯的限制掃描需要高技術水平以解釋,并且許多觀測的異常事實上不是肺癌,在跟蹤CT發現中產生很大保健花費。最常見伴隨發現是良性肺結節(lung nodule)。
肺結節是較圓的病灶或異常組織區域,其位于肺中且大小可變。肺結節可以是良性或癌性的,但是大多數是良性的。如果小結小于4_,則發病率僅為1.5%,如果小結為 4-8mm,則發病率為約6%,如果超過20mm,則發病率為約20%。對于小和中等大小的小結,建議患者在3個月至I年內重復掃描。對于許多大的小結,患者接受生物活檢(其是侵入性的并且可能導致并發癥),即使大部分小結是良性的。
因此,亟需可以替代或補充CT的診斷方法以減少進行的手術數量及降低手術并發癥的風險。另外,甚至當不存在或未知肺結節時,需要在早期檢測肺癌的方法以改善患者的結局。僅16%的肺癌病例診斷為局部早期癌癥,其中5年存活率為46%,相比之下,在晚期診斷的為84%,其中5年存活率僅為13%。這證實依賴于癥狀診斷是無用的,因為它們中的許多是其他肺疾病常見的。這些癥狀包括久咳、血痰、胸痛和復發性支氣管炎或肺炎。
當存在癌癥早期診斷方法時,益處通常是醫療行業所接受的。廣泛使用篩查方案的癌癥具有最高的5年存活率,如乳腺癌(88%)和結腸癌(65%),相比之下肺癌為16%。但是,如果癌癥在I期通過篩查診斷,則88%的肺癌患者存活10年或更長。這證實明顯亟需可以可靠地檢測早期NSCLC的診斷方法。
從健康狀態發展至疾病伴隨著受影響的組織中蛋白表達的變化。健康和疾病組織中人蛋白質組的比較查詢(interrogation)可以提供對疾病生物學的深入了解,并且導致發現用于診斷的生物標記、治療性干預的新靶標以及鑒定最可能受益于靶向治療的患者。 特定疾病狀態的生物標記的選擇首先涉及鑒定標記,該標記對特定醫療應用在疾病群體中具有與對照群體相比可測量且統計學顯著的差異。生物標記可以包括分泌或脫落(shed) 的分子,其與疾病發展或進程平行,并且容易從肺組織或遠端組織對病灶響應而擴散入血流。鑒定的生物標記或生物標記的集合(set)通常臨床上進行驗證,或者證實為對其所選的原始預期用途是可靠的指示物。生物標記可以包括小分子、肽、蛋白和核酸。影響生物標記鑒定的一些關鍵問題包括可用數據的過擬合(over-fitting)及數據偏差。
已使用各種方法來試圖鑒定生物標記及診斷疾病。對于基于蛋白的標記,這些方法包括二維電泳、質譜和免疫測定方法。對于核酸標記,這些方法包括mRNA表達譜、微RNA 譜、FISH、基因表達系列分析(SAGE)和大規模基因表達陣列。
二維電泳的應用由于如下問題而受限低檢測靈敏度;與蛋白溶解性、電荷及疏水性相關的問題;凝膠再現性;以及單個斑點代表多種蛋白的可能性。對于質譜,取決于所用形式,限制圍繞樣品加工和分離、對低豐度蛋白的靈敏性、信噪比考慮及不能立即鑒定檢測的蛋白而出現。免疫測定方法發現生物標記的限制集中在基于抗體的多重測定不能測量大量分析物。可以簡單地印刷高質量抗體的陣列,并且無需夾心而測量與這些抗體結合的分析物。(這會是使用全基因組核酸序列經雜交測量有機體或細胞中的全部DNA或RNA序列的方式上的等同物。因為雜交可以是同一性的嚴緊測試,所以雜交實驗可行。甚至非常好的抗體在選擇它們的結合配偶體中也并非足夠嚴緊來在血液或甚至是細胞提取物環境中工作,因為那些基質中的蛋白總體(ensemble)具有極其不同的豐度。)因此,必須使用不同的基于免疫測定的方法以發現生物標記-需要使用多重ELISA測定(即夾心)以獲得足夠嚴緊性來同時測量許多分析物從而決定哪些分析物的確是生物標記。夾心免疫測定不放大到高含量,因此使用標準陣列形式不能用嚴緊夾心免疫測定發現生物標記。最后,抗體試劑產生相當大的批次差異和試劑不穩定性。本發明的蛋白生物標記發現平臺克服了這個問題。
許多這些方法依賴或需要在分析前一些類型的樣品的分級。因此進行設計為在一系列良好限定的樣品群體中鑒定/發現統計學相關生物標記的足夠有效的研究所需的樣品制備是極其困難、昂貴和耗時的。在分級期間,大范圍的變異性可能被引入各種樣品。例如,一種潛在的標記可能對于方法是不穩定的,標記的濃度可能變化,不合適的聚集或解聚可能發生,無意的樣品污染可能發生,并因此掩蓋預期的早期疾病中的微小變化。
廣泛接受的是使用這些技術的生物標記發現和檢測方法對于鑒定診斷性生物標記具有嚴重限制。這些限制包括不能檢測低豐度生物標記,不能持續覆蓋蛋白質組的完整動態范圍,樣品加工和分級中的不可再現性,以及方法的整體不可再現性和缺乏穩健性 (robustness)。另外,這些研究在數據中引入了偏差,針對鑒定和驗證靶疾病群體內的生物標記所需的分布和隨機化方面,沒有充分解決包括適當對照在內的樣品群體的復雜性。
盡管意圖發現有效的新生物標記的努力已進行了幾十年,但是這些努力大部分是不成功的。針對各種疾病的生物標記通常在實驗室中鑒定,通常通過進行一些疾病過程的基礎研究時偶然發現。基于所述發現及少量臨床數據,發表的論文提示鑒定了新的生物標記。然而大多數這些建議的生物標記未證實是真實或有用的生物標記,這主要是因為測試的少量臨床樣品對于已確實發現有效的生物標記僅提供弱統計學證據。也就是說,最初的鑒定對于統計學的基本元素是不嚴格的。在1994-2003年的每一年中,檢索科學文獻表明公開了上千篇關于生物標記的參考文獻。然而,在同時期內,FDA—年最多批準3種新蛋白生物標記的診斷應用,并且在若干年中沒有批準新的蛋白生物標記。
基于失敗的生物標記發現努力的歷史,已建議了數學理論以進一步促進通常理解,即針對疾病的生物標記很少且難以發現。基于2D凝膠或質譜的生物標記研究支持這些觀點。通過這些方法鑒定了非常少的有用生物標記。然而,通常忽視2D凝膠和質譜測量血液中存在的約InM或更高濃度的蛋白,這種蛋白的總體很可能是最不可能隨疾病變化的。 除了本發明的生物標記發現平臺,尚不存在能夠精確測量低得多的濃度的蛋白表達水平的蛋白質組生物標記發現平臺。
關于復雜的人生物學的生物化學途徑已知許多。許多生物化學途徑以在病理學內局部發揮作用的分泌的蛋白達到頂點或開始,例如分泌生長因子以刺激病理學中其他細胞的復制,分泌其他因子以避開免疫系統等。盡管許多這些分泌的蛋白以旁分泌方式發揮作用,但是一些在身體的遠端運行。具有生物化學途徑基本了解的本領域技術人員會理解,許多病理學特異性蛋白應當以低于(甚至遠低于)2D凝膠和質譜檢測極限的濃度存在于血液中。在這種相對豐富數目的疾病生物標記的鑒定之前必須有一種蛋白質組平臺,其可以分析低于2D凝膠或質譜可以檢測的濃度的蛋白。
因此,亟需生物標記、方法、裝置、試劑、系統和試劑盒,其允許(a)區分良性肺結節(pulmonary nodule)與惡性肺結節;(b)檢測肺癌生物標記;和(c)診斷肺癌。
為了滿足這種需要,已開發用于發現生物標記的基于適配體的蛋白質組新技術,其能夠從血漿或血清的小樣品體積同時測量上千種蛋白(參見例如, U. S Pub.No.2010/0070191;U. S. Pub. No. 2010/0086948, Ostroff et al.Nature Precedings, http://precedings. nature, com/documents/4537/version/1(2010);Gold et al.Nature Precedings,http://precedings. nature, com/documents/4538/ version/1 (2010))。通過新產生的包含化學修飾的核苷酸的慢解離速率適配體(SOMAmer) 使得能夠進行稱為SOMAscan的這種技術,這大大擴展選擇所述適配體的大隨機化核酸文庫的物理化學多樣性(參見美國專利第7,947,447號)。與SELEX相容的這種修飾將官能團引入適配體,所述適配體常在蛋白-蛋白相互作用、抗體-抗原相互作用以及小分子藥物與它們的蛋白靶標的相互作用中發現。總的來說,這些修飾的使用擴展可能的適配體靶標的范圍,改善它們的結合特性并促進具有慢解離速率的適配體的選擇。
具體地,用將蛋白濃度的特征轉化為相應的DNA適配體濃度的特征然后利用DNA微陣列平臺定量的方法來測量復雜基質如血漿中的蛋白(Goldet al. Nature Precedings, http://precedings. nature, com/documents/4538/version/1 (2010))。該測定借助于平衡結合和動力學攻擊(dynamic challenge)。兩者均在溶液中而不是表面上進行,以便利用結合和解離的更有利的動力學。本質上,該測定利用適配體作為具有明確形狀的折疊結合實體和特異性探針可識別的獨特序列的雙重性。
該測定能夠同時測量血清中低至高豐度的大量蛋白。例如,在長期暴露于煙草的群體中分析來自非小細胞肺癌(NSCLC)的4個獨立研究的1,326個個體的樣品。測量15yL血清中的超過800種蛋白,并且開發了 12-蛋白板,其在訓練組中以91%靈敏度和84%特異性區分NSCLC與對照,在盲的獨立驗證組中以89%靈敏度和83%特異性區分 NSCLC與對照。重要的是,對于早期和晚期NSCLC,表現是相似的(Ostroff et al. Nature Precedings, http://precedings. nature, com/documents/4537/version/1 (2010))。
目前為止,已利用這種方法進行包括肺癌(U. S. Pub. No. 2010/0070191)、卵巢癌 (U. S. Pub. No. 2010/0086948)和慢性腎疾病在內的人疾病的幾種臨床生物標記研究。這些研究已鑒定這些疾病中的每種以及通常癌癥的新的潛在的疾病生物標記。
發明概述
本申請證實新發現的微陣列平臺技術用來鑒定來自組織的疾病相關的生物標記的用途。本申請包括用于檢測和診斷來自組織的癌癥,更特別是肺癌的生物標記、方法、試劑、裝置、系統和試劑盒。本申請的生物標記使用實施例6詳述的基于多重適配體的測定鑒定。通過使用本文所述的基于適配體的生物標記鑒定方法,本申請描述了可用于檢測和診斷肺癌的驚人的大量來自組織的肺癌生物標記。在鑒定這些生物標記中,測量了來自許多個體樣品的超過800種蛋白,其中一些的濃度在低毫微微摩爾(femtomolar)范圍。這比用2D凝膠和/或質譜進行的生物標記發現實驗低約4個數量級。
盡管一些所述肺癌生物標記可單獨用于檢測和診斷肺癌,但是本文所述的方法用于分組用作一組生物標記的肺癌生物標記的多個子集。一旦鑒定了單獨的生物標記或生物標記的子集,則個體中肺癌的檢測或診斷可以用能夠測量生物學樣品中所選生物標記或多個生物標記的水平差異的任何測定平臺或者形式完成。
然而,僅僅通過使用本文所述的基于適配體的生物標記鑒定方法,其中超過800 個單獨的潛在生物標記值從先前已經診斷為患有或不患有肺癌的大量個體中逐個進行了篩查,才可能鑒定本文公開的肺癌生物標記。這種發現方法與從條件培養基或裂解的細胞發現生物標記截然相反,因為其詢問無需翻譯為人病理學的更加患者相關的系統。
因此,本申請一方面提供了一種或多種生物標記以用于單獨或以各種組合來診斷肺癌,特別是非小細胞肺癌(NSCLC),或者允許將肺結節區分診斷為良性或惡性。示例性實施方案包括表18提供的生物標記,如上所述,這些生物標記用實施例I中一般描述并在實施例6中更具體描述的基于多重適配體的測定鑒定。表18提供的標記可以用于區分良性小節與癌性小結。表18提供的標記還可以用于區分無癥狀吸煙者與患有肺癌的吸煙者。在一方面,所述生物標記為MMP-7。在另一方面,所述生物標記為MMP-12。
盡管一些所述肺癌生物標記可以單獨用于檢測和診斷肺癌,但是本文所述的方法還用于分組肺癌生物標記的多個子集,其各自可用作兩個或更多個生物標記的組。因此,本申請的各個實施方案提供了包含N個生物標記的組合,其中N是至少2個生物標記。在其他實施方案中,N選自2-36個生物標記中的任意數。
仍然在其他實施方案中,N選自2-7、2-10、2-15、2-20、2-25、2-30、2-36中的任意數。在其他實施方案中,N選自3-7、3-10、3-15、3-20、3-25、3-30、3-36中的任意數。在其他實施方案中,N選自4-7、4-10、4-15、4-20、4-25、4-30、4-36中的任意數。在其他實施方案中,N選自5-7、5-10、5-15、5-20、5-25、5-30、5-36中的任意數。在其他實施方案中,N選自6-10、6-15、6-20、6-25、6-30、6-36中的任意數。在其他實施方案中,N選自7_10、7_15、7-20、7-25、7-30、7-36中的任意數。在其他實施方案中,N選自8-10、8-15、8-20、8_25、8-30,8-36中的任意數。在其他實施方案中,N選自9-15、9-20、9-25、9-30、9-36中的任意數。在其他實施方案中,N選自10-15、10-20、10-25、10-30、10-36中的任意數。應當理解N 可以選自包含類似但更高級(order)的范圍。
在另一方面,本發明提供了一種診斷個體的肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測至少一個生物標記值,所述至少一個生物標記值對應于選自表18 提供的生物標記的組的至少一個生物標記,其中所述個體基于所述至少一個生物標記值分類為患有肺癌。
在另一方面,本發明提供了一種診斷個體的肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表18所列的生物標記的組的至少N個生物標記之一,其中所述個體患有肺癌的似然性(likelihood)基于所述生物標記值確定。
在另一方面,本發明提供了一種診斷個體的肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表18所列的生物標記的組的至少N個生物標記之一,其中所述個體基于所述生物標記值分類為患有肺癌,并且其中N=2_10。
在另一方面,本發明提供了一種診斷個體的肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表18所列的生物標記的組的至少N個生物標記之一,其中所述個體患有肺癌的似然性基于所述生物標記值確定,并且其中N=2-10。
在另一方面,本發明提供了一種篩查吸煙者的肺癌的方法,所述方法包括在來自吸煙者個體的生物學樣品中檢測至少一個生物標記值,所述至少一個生物標記值對應于選自表18所列的生物標記的組的至少一個生物標記,其中基于所述至少一個生物標記值,所述個體分類為患有肺癌,或者確定所述個體患有肺癌的似然性。
在另一方面,本發明提供了一種篩查吸煙者的肺癌的方法,所述方法包括在來自吸煙者個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表18所列的生物標記的組的至少N個生物標記之一,其中基于所述生物標記值,所述個體分類為患有肺癌,或者確定所述個體患有肺癌的似然性,其中N=2-10。
在另一方面,本發明提供了一種診斷個體不患有肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測至少一個生物標記值,所述至少一個生物標記值對應于選自表 18所列的生物標記的組的至少一個生物標記,其中基于所述至少一個生物標記值,所述個體分類為不患有肺癌。
在另一方面,本發明提供了一種診斷個體不患有肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表18所列的生物標記的組的至少N個生物標記之一,其中基于所述生物標記值,所述個體分類為不患有肺癌,并且其中N=2_10。
在另一方面,本發明提供了一種診斷肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表18所列的生物標記的組,其中所述生物標記值的分類指示所述個體患有肺癌,并且其中N=3-10。
在另一方面,本發明提供了一種診斷肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表18所列的生物標記的組,其中所述生物標記值的分類指示所述個體患有肺癌,并且其中N=3-15。
在另一方面,本發明提供了一種篩查吸煙者的肺癌的方法,所述方法包括在來自吸煙者個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表18所列的生物標記的組,其中基于所述生物標記值,所述個體分類為患有肺癌,或者確定所述個體患有肺癌的似然性,并且其中N=3-10。
在另一方面,本發明提供了一種篩查吸煙者的肺癌的方法,所述方法包括在來自吸煙者個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表18所列的生物標記的組,其中基于所述生物標記值,所述個體分類為患有肺癌,或者確定所述個體患有肺癌的似然性,其中N=3-15。
在另一方面,本發明提供了一種診斷肺癌不存在的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表18所列的生物標記的組,其中所述生物標記值的分類指示所述個體中不存在肺癌,并且其中N=3_10。
在另一方面,本發明提供了一種診斷肺癌不存在的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表18所列的生物標記的組,其中所述生物標記值的分類指示所述個體中不存在肺癌,并且其中N=3-15。
在另一方面,本發明提供了一種診斷個體的肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值對應于選自表18所列的生物標記的組的至少N個生物標記之一,其中基于偏離預定閾值的分類評分,所述個體分類為患有肺癌,并且其中N=2-10。
在另一方面,本發明提供了一種篩查吸煙者的肺癌的方法,所述方法包括在來自吸煙者個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表18所列的生物標記的組,其中基于偏離預定閾值的分類評分,所述個體分類為患有肺癌,或者確定所述個體患有肺癌的似然性,其中 N=3-10。
在另一方面,本發明提供了一種篩查吸煙者的肺癌的方法,所述方法包括在來自吸煙者個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表18所列的生物標記的組,其中基于偏離預定閾值的分類評分,所述個體分類為患有肺癌,或者確定所述個體患有肺癌的似然性,其中 N=3-15。
在另一方面,本發明提供了一種診斷個體中不存在肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值對應于選自表18所列的生物標記的組的至少N個生物標記之一,其中基于偏離預定閾值的分類評分,所述個體分類為不患有肺癌,并且其中N=2-10。
在另一方面,本發明提供了一種指示肺癌的似然性的計算機執行方法。所述方法包括在計算機上檢索個體的生物標記信息,其中所述生物標記信息包括生物標記值,所述生物標記值每個對應于選自表18所列的生物標記的組的至少N個生物標記之一,其中N如上定義;用計算機對每個所述生物標記值進行分類;以及基于多個分類指示所述個體患有肺癌的似然性。
在另一方面,本發明提供了一種將個體分類為患有或不患有肺癌的計算機執行方法。所述方法包括在計算機上檢索個體的生物標記信息,其中所述生物標記信息包括生物標記值,所述生物標記值每個對應于選自表18提供的生物標記的組的至少N個生物標記之一;用計算機對每個所述生物標記值進行分類;以及基于多個分類指示所述個體是否患有肺癌。
在另一方面,本發明提供了一種指示肺癌的似然性的計算機程序產品。所述計算機程序產品包括包含程序代碼的計算機可讀取介質,所述程序代碼可由計算裝置或系統的處理器執行,所述程序代碼包括對歸因于來自個體的生物學樣品的數據進行檢索的代碼, 其中所述數據包括生物標記值,所述生物標記值每個對應于所述生物學樣品中選自表18 所列的生物標記的組的至少N個生物標記之一,其中N如上定義;以及執行分類方法的代碼,所述分類方法指示作為所述生物標記值的函數的所述個體患有肺癌的似然性。
在另一方面,本發明提供了一種指示個體的肺癌狀態的計算機程序產品。所述計算機程序產品包括包含程序代碼的計算機可讀取介質,所述程序代碼可由計算裝置或系統的處理器執行,所述程序代碼包括對歸因于來自個體的生物學樣品的數據進行檢索的代碼,其中所述數據包括生物標記值,所述生物標記值每個對應于所述生物學樣品中選自表 18提供的生物標記的組的至少N個生物標記之一;以及執行分類方法的代碼,所述分類方法指示作為所述生物標記值的函數的所述個體的肺癌狀態。
在另一方面,本發明提供了一種指示肺癌的似然性的計算機執行方法。所述方法包括在計算機上檢索個體的生物標記信息,其中所述生物標記信息包括生物標記值,所述生物標記值對應于選自表18所列的生物標記的組的生物標記;用計算機對所述生物標記值進行分類;以及基于所述分類指示所述個體患有肺癌的似然性。
在另一方面,本發明提供了一種將個體分類為患有或不患有肺癌的計算機執行方法。所述方法包括從計算機檢索個體的生物標記信息,其中所述生物標記信息包括生物標記值,所述生物標記值對應于選自表18提供的生物標記的組的生物標記;用計算機對所述生物標記值進行分類;以及基于所述分類指示所述個體是否患有肺癌。
在另一方面,本發明提供了一種指示肺癌的似然性的計算機程序產品。所述計算機程序產品包括包含程序代碼的計算機可讀取介質,所述程序代碼可由計算裝置或系統的處理器執行,所述程序代碼包括對歸因于來自個體的生物學樣品的數據進行檢索的代碼, 其中所述數據包括生物標記值,所述生物標記值對應于所述生物學樣品中選自表18所列的生物標記的組的生物標記;以及執行分類方法的代碼,所述分類方法指示作為所述生物標記值的函數的所述個體患有肺癌的似然性。
在另一方面,本發明提供了一種指示個體的肺癌狀態的計算機程序產品。所述計算機程序產品包括包含程序代碼的計算機可讀取介質,所述程序代碼可由計算裝置或系統的處理器執行,所述程序代碼包括對歸因于來自個體的生物學樣品的數據進行檢索的代碼,其中所述數據包括生物標記值,所述生物標記值對應于所述生物學樣品中選自表18提供的生物標記的組的生物標記;以及執行分類方法的代碼,所述分類方法指示作為所述生物標記值的函數的所述個體的肺癌狀態。
在本申請的另一實施方案中,示例性實施方案包括表20提供的生物標記,如上所述,這些生物標記用實施例I中一般描述并在實施例6中更具體描述的基于多重適配體的測定鑒定。表20提供的標記可以用于區分良性小節與癌性小結。表20提供的標記還可以用于區分無癥狀吸煙者與患有肺癌的吸煙者。關于表20,N選自2-25個生物標記中的任意數。已確定表20提供的標記可用于組織和血清樣品。
仍然在其他實施方案中,N選自2-7、2-10、2-15、2-20、2-25中的任意數。在其他實施方案中,N選自3-7、3-10、3-15、3-20、3-25中的任意數。在其他實施方案中,N選自4_7、4-10、4-15、4-20、4-25中的任意數。在其他實施方案中,N選自5-7、5-10、5-15、5-20、5_25 中的任意數。在其他實施方案中,N選自6-10、6-15、6-20、6-25中的任意數。在其他實施方案中,N選自7-10、7-15、7-20、7-25中的任意數。在其他實施方案中,N選自8_10、8_15、8-20、8-25中的任意數。在其他實施方案中,N選自9-15、9-20、9-25中的任意數。在其他實施方案中,N選自10-15、10-20、10-25中的任意數。應當理解N可以選自包含類似但更16聞級的范圍。
在另一方面,本發明提供了一種診斷個體的肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測至少一個生物標記值,所述至少一個生物標記值對應于選自表20 提供的生物標記的組的至少一個生物標記,其中所述個體基于所述至少一個生物標記值分類為患有肺癌。
在另一方面,本發明提供了一種診斷個體的肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表20所列的生物標記的組的至少N個生物標記之一,其中所述個體患有肺癌的似然性基于所述生物標記值確定。
在另一方面,本發明提供了一種診斷個體的肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表20所列的生物標記的組的至少N個生物標記之一,其中所述個體基于所述生物標記值分類為患有肺癌,并且其中N=2-10。
在另一方面,本發明提供了一種診斷個體的肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表20所列的生物標記的組的至少N個生物標記之一,其中所述個體患有肺癌的似然性基于所述生物標記值確定,并且其中N=2-10。
在另一方面,本發明提供了一種篩查吸煙者的肺癌的方法,所述方法包括在來自吸煙者個體的生物學樣品中檢測至少一個生物標記值,所述至少一個生物標記值對應于選自表20所列的生物標記的組的至少一個生物標記,其中基于所述至少一個生物標記值,所述個體分類為患有肺癌,或者確定所述個體患有肺癌的似然性。
在另一方面,本發明提供了一種篩查吸煙者的肺癌的方法,所述方法包括在來自吸煙者個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表20所列的生物標記的組的至少N個生物標記之一,其中基于所述生物標記值,所述個體分類為患有肺癌,或者確定所述個體患有肺癌的似然性,其中N=2-10。
在另一方面,本發明提供了一種診斷個體不患有肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測至少一個生物標記值,所述至少一個生物標記值對應于選自表 20所列的生物標記的組的至少一個生物標記,其中基于所述至少一個生物標記值,所述個體分類為不患有肺癌。
在另一方面,本發明提供了一種診斷個體不患有肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表20所列的生物標記的組的至少N個生物標記之一,其中基于所述生物標記值,所述個體分類為不患有肺癌,并且其中N=2_10。
在另一方面,本發明提供了一種診斷肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表20所列的生物標記的組,其中所述生物標記值的分類指示所述個體患有肺癌,并且其中N=3-10。
在另一方面,本發明提供了一種診斷肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表20所列的生物標記的組,其中所述生物標記值的分類指示所述個體患有肺癌,并且其中N=3_15。
在另一方面,本發明提供了一種篩查吸煙者的肺癌的方法,所述方法包括在來自吸煙者個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表20所列的生物標記的組,其中基于所述生物標記值,所述個體分類為患有肺癌,或者確定所述個體患有肺癌的似然性,并且其中N=3-10。
在另一方面,本發明提供了一種篩查吸煙者的肺癌的方法,所述方法包括在來自吸煙者個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表20所列的生物標記的組,其中基于所述生物標記值,所述個體分類為患有肺癌,或者確定所述個體患有肺癌的似然性,其中N=3-15。
在另一方面,本發明提供了一種診斷肺癌不存在的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表20所列的生物標記的組,其中所述生物標記值的分類指示所述個體中不存在肺癌,并且其中N=3-10。
在另一方面,本發明提供了一種診斷肺癌不存在的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表20所列的生物標記的組,其中所述生物標記值的分類指示所述個體中不存在肺癌,并且其中N=3-15。
在另一方面,本發明提供了一種診斷個體的肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值對應于選自表20所列的生物標記的組的至少N個生物標記之一,其中基于偏離預定閾值的分類評分,所述個體分類為患有肺癌,并且其中N=2-10。
在另一方面,本發明提供了一種篩查吸煙者的肺癌的方法,所述方法包括在來自吸煙者個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表20所列的生物標記的組,其中基于偏離預定閾值的分類評分,所述個體分類為患有肺癌,或者確定所述個體患有肺癌的似然性,其中 N=3-10。
在另一方面,本發明提供了一種篩查吸煙者的肺癌的方法,所述方法包括在來自吸煙者個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表20所列的生物標記的組,其中基于偏離預定閾值的分類評分,所述個體分類為患有肺癌,或者確定所述個體患有肺癌的似然性,其中 N=3-15。
在另一方面,本發明提供了一種診斷個體中不存在肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值對應于選自表20所列的生物標記的組的至少N個生物標記之一,其中基于偏離預定閾值的分類評分,所述個體分類為不患有肺癌,并且其中N=2-10。
在另一方面,本發明提供了一種指示肺癌的似然性的計算機執行方法。所述方法包括在計算機上檢索個體的生物標記信息,其中所述生物標記信息包括生物標記值,所述生物標記值每個對應于選自表20所列的生物標記的組的至少N個生物標記之一,其中N如上定義;用計算機對每個所述生物標記值進行分類;以及基于多個分類指示所述個體患有肺癌的似然性。
在另一方面,本發明提供了一種將個體分類為患有或不患有肺癌的計算機執行方法。所述方法包括在計算機上檢索個體的生物標記信息,其中所述生物標記信息包括生物標記值,所述生物標記值每個對應于選自表20提供的生物標記的組的至少N個生物標記之一;用計算機對每個所述生物標記值進行分類;以及基于多個分類指示所述個體是否患有肺癌。
在另一方面,本發明提供了一種指示肺癌的似然性的計算機程序產品。所述計算機程序產品包括包含程序代碼的計算機可讀取介質,所述程序代碼可由計算裝置或系統的處理器執行,所述程序代碼包括對歸因于來自個體的生物學樣品的數據進行檢索的代碼, 其中所述數據包括生物標記值,所述生物標記值每個對應于所述生物學樣品中選自表20 所列的生物標記的組的至少N個生物標記之一,其中N如上定義;以及執行分類方法的代碼,所述分類方法指示作為所述生物標記值的函數的所述個體患有肺癌的似然性。
在另一方面,本發明提供了一種指示個體的肺癌狀態的計算機程序產品。所述計算機程序產品包括包含程序代碼的計算機可讀取介質,所述程序代碼可由計算裝置或系統的處理器執行,所述程序代碼包括對歸因于來自個體的生物學樣品的數據進行檢索的代碼,其中所述數據包括生物標記值,所述生物標記值每個對應于所述生物學樣品中選自表 20提供的生物標記的組的至少N個生物標記之一;以及執行分類方法的代碼,所述分類方法指示作為所述生物標記值的函數的所述個體的肺癌狀態。
在另一方面,本發明提供了一種指示肺癌的似然性的計算機執行方法。所述方法包括在計算機上檢索個體的生物標記信息,其中所述生物標記信息包括生物標記值,所述生物標記值對應于選自表20所列的生物標記的組的生物標記;用計算機對所述生物標記值進行分類;以及基于所述分類指示所述個體患有肺癌的似然性。
在另一方面,本發明提供了一種將個體分類為患有或不患有肺癌的計算機執行方法。所述方法包括從計算機檢索個體的生物標記信息,其中所述生物標記信息包括生物標記值,所述生物標記值對應于選自表20提供的生物標記的組的生物標記;用計算機對所述生物標記值進行分類;以及基于所述分類指示所述個體是否患有肺癌。
在另一方面,本發明提供了一種指示肺癌的似然性的計算機程序產品。所述計算機程序產品包括包含程序代碼的計算機可讀取介質,所述程序代碼可由計算裝置或系統的處理器執行,所述程序代碼包括對歸因于來自個體的生物學樣品的數據進行檢索的代碼, 其中所述數據包括生物標記值,所述生物標記值對應于所述生物學樣品中選自表20所列的生物標記的組的生物標記;以及執行分類方法的代碼,所述分類方法指示作為所述生物標記值的函數的所述個體患有肺癌的似然性。
在另一方面,本發明提供了一種指示個體的肺癌狀態的計算機程序產品。所述計算機程序產品包括包含程序代碼的計算機可讀取介質,所述程序代碼可由計算裝置或系統的處理器執行,所述程序代碼包括對歸因于來自個體的生物學樣品的數據進行檢索的代碼,其中所述數據包括生物標記值,所述生物標記值對應于所述生物學樣品中選自表20提供的生物標記的組的生物標記;以及執行分類方法的代碼,所述分類方法指示作為所述生物標記值的函數的所述個體的肺癌狀態。
在本申請的另一實施方案中,示例性實施方案包括表21提供的生物標記,這些生物標記用實施例I中一般描述并在實施例2和6中更具體描述的基于多重適配體的測定鑒定。表21提供的標記可以用于區分良性小節與癌性小結。表21提供的標記還可以用于區分無癥狀吸煙者與患有肺癌的吸煙者。關于表21,N選自2-86個生物標記中的任意數。表 21中包括的所有生物標記可用于提供在組織和血清樣品中探尋的信息。
仍然在其他實施方案中,N選自2-7、2-10、2-15、2-20、2-25、2-30、2-35、2-40、2-45、2-50、2-55、2-60、2-65、2-70、2-75、2-80或 2-86 中的任意數。在其他實施方案中,N選自 3-7、3-10、3-15、3-20、3-25、3-30、3-35、3-40、3-45、3-50、3-55、3-60、3-65、3-70、3-75、3-80或3-86中的任意數。在其他實施方案中,N選自4-7、4-10、4-15、4-20、4-25、4-30、4-35、4-40、4-45、4-50、4-55、4-60、4-65、4-70、4-75、4-80或 4-86 中的任意數。在其他實施方案中,N選自 5-7、5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80或5-86中的任意數。在其他實施方案中,N選自6-10、6-15、6-20、6_25、6-30、6-35、6-40、6-45、6-50、6-55、6-60、6-65、6-70、6-75、6-80或 6-86 中的任意數。在其他實施方案中,N選自 7-10、7-15、7-20、7-25、7-30、7-35、7-40、7-45、7-50、7-55、7-60、7-65、7-70、7-75、7-80或7-86中的任意數。在其他實施方案中,N選自8-10、8-15、8_20、8-25、8-30、8-35、8-40、8-45、8-50、8-55、8-60、8-65、8-70、8-75、8-80或 8-86 中的任意數。在其他實施方案中,N選自 9-15、9-20、9-25、9-30、9-35、9-40、9-45、9-50、9-55、9-60、9-65、9-70、9-75、9-80或9-86中的任意數。在其他實施方案中,N選自10-15、10-20、10-25、10-30、10-35、10-40、10-45、10-50、10-55、10-60、10-65、10-70、10-75、10-80或 10-86 中的任意數。應當理解N可以選自包含類似但更高級的范圍。
在另一方面,本發明提供了一種診斷個體的肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測至少一個生物標記值,所述至少一個生物標記值對應于選自表21 提供的生物標記的組的至少一個生物標記,其中所述個體基于所述至少一個生物標記值分類為患有肺癌。
在另一方面,本發明提供了一種診斷個體的肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表21所列的生物標記的組的至少N個生物標記之一,其中所述個體患有肺癌的似然性基于所述生物標記值確定。
在另一方面,本發明提供了一種診斷個體的肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表21所列的生物標記的組的至少N個生物標記之一,其中所述個體基于所述生物標記值分類為患有肺癌,并且其中N=2-10。
在另一方面,本發明提供了一種診斷個體的肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表21所列的生物標記的組的至少N個生物標記之一,其中所述個體患有肺癌的似然性基于所述生物標記值確定,并且其中N=2-10。
在另一方面,本發明提供了一種篩查吸煙者的肺癌的方法,所述方法包括在來自吸煙者個體的生物學樣品中檢測至少一個生物標記值,所述至少一個生物標記值對應于選自表21所列的生物標記的組的至少一個生物標記,其中基于所述至少一個生物標記值,所述個體分類為患有肺癌,或者確定所述個體患有肺癌的似然性。
在另一方面,本發明提供了一種篩查吸煙者的肺癌的方法,所述方法包括在來自吸煙者個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表21所列的生物標記的組的至少N個生物標記之一,其中基于所述生物標記值,所述個體分類為患有肺癌,或者確定所述個體患有肺癌的似然性,其中N=2-10。
在另一方面,本發明提供了一種診斷個體不患有肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測至少一個生物標記值,所述至少一個生物標記值對應于選自表 21所列的生物標記的組的至少一個生物標記,其中基于所述至少一個生物標記值,所述個體分類為不患有肺癌。
在另一方面,本發明提供了一種診斷個體不患有肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表21所列的生物標記的組的至少N個生物標記之一,其中基于所述生物標記值,所述個體分類為不患有肺癌,并且其中N=2_10。
在另一方面,本發明提供了一種診斷肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表21所列的生物標記的組,其中所述生物標記值的分類指示所述個體患有肺癌,并且其中N=3-10。
在另一方面,本發明提供了一種診斷肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表21所列的生物標記的組,其中所述生物標記值的分類指示所述個體患有肺癌,并且其中N=3-15。
在另一方面,本發明提供了一種篩查吸煙者的肺癌的方法,所述方法包括在來自吸煙者個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表21所列的生物標記的組,其中基于所述生物標記值,所述個體分類為患有肺癌,或者確定所述個體患有肺癌的似然性,并且其中N=3-10。
在另一方面,本發明提供了一種篩查吸煙者的肺癌的方法,所述方法包括在來自吸煙者個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表21所列的生物標記的組,其中基于所述生物標記值,所述個體分類為患有肺癌,或者確定所述個體患有肺癌的似然性,其中N=3_15。
在另一方面,本發明提供了一種診斷肺癌不存在的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表21所列的生物標記的組,其中所述生物標記值的分類指示所述個體中不存在肺癌,并且其中N=3-10。
在另一方面,本發明提供了一種診斷肺癌不存在的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表21所列的生物標記的組,其中所述生物標記值的分類指示所述個體中不存在肺癌,并且其中N=3-15。
在另一方面,本發明提供了一種診斷個體的肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值對應于選自表21所列的生物標記的組的至少N個生物標記之一,其中基于偏離預定閾值的分類評分,所述個體分類為患有肺癌,并且其中N=2_10。
在另一方面,本發明提供了一種篩查吸煙者的肺癌的方法,所述方法包括在來自吸煙者個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表21所列的生物標記的組,其中基于偏離預定閾值的分類評分,所述個體分類為患有肺癌,或者確定所述個體患有肺癌的似然性,其中 N=3-10。
在另一方面,本發明提供了一種篩查吸煙者的肺癌的方法,所述方法包括在來自吸煙者個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組N個生物標記中的生物標記,其中所述生物標記選自表21所列的生物標記的組,其中基于偏離預定閾值的分類評分,所述個體分類為患有肺癌,或者確定所述個體患有肺癌的似然性,其中 N=3-15。
在另一方面,本發明提供了一種診斷個體中不存在肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值對應于選自表21所列的生物標記的組的至少N個生物標記之一,其中基于偏離預定閾值的分類評分,所述個體分類為不患有肺癌,并且其中N=2-10。
在另一方面,本發明提供了一種指示肺癌的似然性的計算機執行方法。所述方法包括在計算機上檢索個體的生物標記信息,其中所述生物標記信息包括生物標記值,所述生物標記值每個對應于選自表21所列的生物標記的組的至少N個生物標記之一,其中N如上定義;用計算機對每個所述生物標記值進行分類;以及基于多個分類指示所述個體患有肺癌的似然性。
在另一方面,本發明提供了一種將個體分類為患有或不患有肺癌的計算機執行方法。所述方法包括在計算機上檢索個體的生物標記信息,其中所述生物標記信息包括生物標記值,所述生物標記值每個對應于選自表21提供的生物標記的組的至少N個生物標記之一;用計算機對每個所述生物標記值進行分類;以及基于多個分類指示所述個體是否患有肺癌。
在另一方面,本發明提供了一種指示肺癌的似然性的計算機程序產品。所述計算機程序產品包括包含程序代碼的計算機可讀取介質,所述程序代碼可由計算裝置或系統的處理器執行,所述程序代碼包括對歸因于來自個體的生物學樣品的數據進行檢索的代碼, 其中所述數據包括生物標記值,所述生物標記值每個對應于所述生物學樣品中選自表21 所列的生物標記的組的至少N個生物標記之一,其中N如上定義;以及執行分類方法的代碼,所述分類方法指示作為所述生物標記值的函數的所述個體患有肺癌的似然性。
在另一方面,本發明提供了一種指示個體的肺癌狀態的計算機程序產品。所述計算機程序產品包括包含程序代碼的計算機可讀取介質,所述程序代碼可由計算裝置或系統的處理器執行,所述程序代碼包括對歸因于來自個體的生物學樣品的數據進行檢索的代碼,其中所述數據包括生物標記值,所述生物標記值每個對應于所述生物學樣品中選自表 21提供的生物標記的組的至少N個生物標記之一;以及執行分類方法的代碼,所述分類方法指示作為所述生物標記值的函數的所述個體的肺癌狀態。
在另一方面,本發明提供了一種指示肺癌的似然性的計算機執行方法。所述方法包括在計算機上檢索個體的生物標記信息,其中所述生物標記信息包括生物標記值,所述生物標記值對應于選自表21所列的生物標記的組的生物標記;用計算機對所述生物標記值進行分類;以及基于所述分類指示所述個體患有肺癌的似然性。
在另一方面,本發明提供了一種將個體分類為患有或不患有肺癌的計算機執行方法。所述方法包括從計算機檢索個體的生物標記信息,其中所述生物標記信息包括生物標記值,所述生物標記值對應于選自表21提供的生物標記的組的生物標記;用計算機對所述生物標記值進行分類;以及基于所述分類指示所述個體是否患有肺癌。
在另一方面,本發明提供了一種指示肺癌的似然性的計算機程序產品。所述計算機程序產品包括包含程序代碼的計算機可讀取介質,所述程序代碼可由計算裝置或系統的處理器執行,所述程序代碼包括對歸因于來自個體的生物學樣品的數據進行檢索的代碼, 其中所述數據包括生物標記值,所述生物標記值對應于所述生物學樣品中選自表21所列的生物標記的組的生物標記;以及執行分類方法的代碼,所述分類方法指示作為所述生物標記值的函數的所述個體患有肺癌的似然性。
在另一方面,本發明提供了一種指示個體的肺癌狀態的計算機程序產品。所述計算機程序產品包括包含程序代碼的計算機可讀取介質,所述程序代碼可由計算裝置或系統的處理器執行,所述程序代碼包括對歸因于來自個體的生物學樣品的數據進行檢索的代碼,其中所述數據包括生物標記值,所述生物標記值對應于所述生物學樣品中選自表21提供的生物標記的組的生物標記;以及執行分類方法的代碼,所述分類方法指示作為所述生物標記值的函數的所述個體的肺癌狀態。
在本申請的一方面,上述方法的每個中所述選自表21的N個生物標記中的至少一個是選自表20的生物標記。在另一實施方案中,所述選自表20的生物標記為MMP-12。
在另一方面,本發明提供了一種診斷肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組生物標記中的生物標記,所述一組生物標記選自表22-25所列的生物標記的組,其中所述生物標記值的分類指示所述個體患有肺癌。
在另一方面,本發明提供了一種診斷不存在肺癌的方法,所述方法包括在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于一組生物標記中的生物標記,所述一組生物標記選自表22-25提供的生物標記的組,其中所述生物標記值的分類指示所述個體中不存在肺癌。
圖IA是檢測生物學樣品中的肺癌的示例方法的流程圖。
圖IB是用樸素貝葉斯(naiveBayes)分類方法檢測生物學樣品中的肺癌的示例方法的流程圖。
圖2示出單個生物標記SCFsR的ROC曲線,其使用用于檢測無癥狀吸煙者中的肺癌的測試的樸素貝葉斯分類器(classifier)。
圖3示出I至10個生物標記的生物標記組的ROC曲線,其使用用于檢測無癥狀吸煙者中的肺癌的測試的樸素貝葉斯分類器。
圖4示出隨生物標記的數目從I增加到10的分類評分(特異性+靈敏性)的增加,其使用用于良性小結-肺癌組的樸素貝葉斯分類。
圖5示出對于良性小結對照組(實線)和肺癌疾病組(虛線),作為log轉化的 RFU形式的累積分布函數(cdf)的SCFsR的測量的生物標記分布,以及它們的曲線擬合為正態cdf (短劃線),以用于訓練(train)樸素貝葉斯分類器。0124]0125]0126]0127]定。0128]圖6示出與本文所述的各種計算機執行方法一起使用的示例計算機系統。圖7是一實施方案的指示個體患有肺癌的似然性的方法的流程圖。圖8是一實施方案的指示個體患有肺癌的似然性的方法的流程圖。圖9示出可以用于檢測生物學樣品中一個或多個肺癌生物標記的示例適配體測圖10示出從聚集的潛在生物標記的集合使用哪些生物標記來構建分類器以區分 NSCLC與良性小結的頻率的柱狀圖。
圖11示出從聚集的潛在生物標記的集合使用哪些生物標記來構建分類器以區分 NSCLC與無癥狀吸煙者的頻率的柱狀圖。
圖12示出從位點一致(site-consistent)的潛在生物標記的集合使用哪些生物標記來構建分類器以區分NSCLC與良性小結的頻率的柱狀圖。
圖13示出從位點一致的潛在生物標記的集合使用哪些生物標記來構建分類器以區分NSCLC與無癥狀吸煙者的頻率的柱狀圖。
圖14示出從得自聚集和位點一致的標記組合的潛在生物標記的集合使用哪些生物標記來構建分類器以區分NSCLC與良性小結的頻率的柱狀圖。
圖15示出從得自聚集和位點一致的標記組合的潛在生物標記的集合使用哪些生物標記來構建分類器以區分NSCLC與無癥狀吸煙者的頻率的柱狀圖。
圖16示出得自pull-down實驗的凝膠圖像,其示出作為蛋白LBP、C9和IgM的捕獲試劑的適配體的特異性。對于每個凝膠,泳道I是來自鏈霉抗生物素蛋白-瓊脂糖珠的洗脫物,泳道2是最終洗脫物,泳道是MW標記泳道(主要條帶從上至下是110、50、30、15和 3. 5kDa)。
圖17A示出一對柱狀圖,其總結了使用表I第5列(實線)所列的生物標記和隨機標記的集合(虛線)的所有可能的單蛋白樸素貝葉斯分類器評分(靈敏性+特異性)。
圖17B示出一對柱狀圖,其總結了使用表I第5列(實線)所列的生物標記和隨機標記的集合(虛線)的所有可能的二蛋白樸素貝葉斯分類器評分(靈敏性+特異性)。
圖17C示出一對柱狀圖,其 總結了使用表I第5列(實線)所列的生物標記和隨機標記的集合(虛線)的所有可能的三蛋白樸素貝葉斯分類器評分(靈敏性+特異性)。
圖18A示出一對柱狀圖,其總結了使用表I第6列(實線)所列的生物標記和隨機標記的集合(虛線)的所有可能的單蛋白樸素貝葉斯分類器評分(靈敏性+特異性)。
圖18B示出一對柱狀圖,其總結了使用表I第6列(實線)所列的生物標記和隨機標記的集合(虛線)的所有可能的二蛋白樸素貝葉斯分類器評分(靈敏性+特異性)。
圖18C示出一對柱狀圖,其總結了使用表I第6列(實線)所列的生物標記和隨機標記的集合(虛線)的所有可能的三蛋白樸素貝葉斯分類器評分(靈敏性+特異性)。
圖19A示出使用選自完全組( )的2-10個標記的樸素貝葉斯分類器的靈敏性 +特異性評分,以及通過在用于良性小結對照組的分類器產生期間放棄最好的5個(■)、10個(▲)和15個(X)標記獲得的評分。
圖19B示出使用選自完全組( )的2-10個標記的樸素貝葉斯分類器的靈敏性 +特異性評分,以及通過在用于吸煙者對照組的分類器產生期間放棄最好的5個(■ )、10 個(▲)和15個(X)標記獲得的評分。
圖20A示出一組ROC曲線,其從表38和39中的數據對I至5個標記的組建模。
圖20B示出一組ROC曲線,其從對圖19A的I至5個標記的組訓練數據計算。
圖21示出鄰近與遠端組 織之間(圖21A)、腫瘤與鄰近組織之間(圖21B)以及腫瘤與遠端組織之間(圖21C)來自8個NSCLC切除樣品的813種蛋白的蛋白表達的相對變化,其表示為log2中值比例。虛線代表2倍變化(log2=l)。
圖22示出腫瘤組織樣品中蛋白水平的熱圖。將樣品排成列并分為遠端、鄰近和腫瘤樣品。在每種組織類型內,將樣品分為腺癌(AC)和鱗狀細胞癌(SCC)。每列上的數字對應于患者編號。將蛋白按行展示并利用分級群聚(hierarchial clustering)排序。
圖23(A_T)示出與鄰近或遠端組織相比,在腫瘤組織中具有升高水平的蛋白。
圖24(A_P)示出與用于本研究的8個NSCLC樣品的鄰近或遠端組織相比,在腫瘤組織中具有降低水平的蛋白。
圖25示出這個研究中檢測的所選的生物標記在冰凍組織切片上的SOMAmer組織化學。(A)染色瘤巢周圍的纖維膠原基質的血小板反應蛋白_2 (紅色)。(B)用血小板反應蛋白-2S0MAmer (紅色)染色的相應的正常肺標本。(C)染色肺腺癌中的分散巨噬細胞的巨噬細胞甘露糖受體SOMAmer (紅色)。(D)染色正常肺實質切片中的許多肺泡巨噬細胞的巨噬細胞甘露糖受體SOMAmer (紅色)。(E)突出巨噬細胞甘露糖受體SOMAmer染色的細胞形態學分布的多色圖像綠色=細胞角蛋白(AE1/AE3抗體),紅色=⑶31(EP3095抗體),而橙色=S0MAmer。該圖中的所有核用DAPI復染。
圖26示出與血清相比,NSCLC組織中蛋白表達的變化。最上面的兩個圖分別示出源自血清樣品的log2比例(LR)對源自鄰近組織和遠端組織的log比例。下面的4個圖示出圖的顏色所示的上圖的放大部分(綠色為與非腫瘤組織相比減少的表達,紅色為與非腫瘤組織相比增加的表達)。圖23和24所示的分析物已標記,并且關于血清樣品的出版物中提到的分析物如實心紅色標記所示。
圖27示出組織樣品中的血小板反應蛋白_2組織化學鑒定。在單一肺癌標本的連續冰凍切片中鑒定血小板反應蛋白-2,這通過(A)自制的兔多克隆血小板反應蛋白_2 多克隆抗體,(B)來自用來制備自制的多克隆抗體的兔的免疫前血清,(C)商業(Novus)兔多克隆血小板反應蛋白_2抗體,以及(D)血小板反應蛋白-2S0MAmer。然后血小板反應蛋白-2S0MAmer用來染色正常和惡性肺組織的冰凍切片,用標準抗生物素蛋白-生物素-過氧化物酶顯色,以證實不同形態學分布(E)瘤巢周圍的纖維化基質的強染色,與癌細胞的最小染色,(F)粘液腺癌中瘤巢周圍的纖維化基質的強染色,與癌細胞沒有顯著染色,(G) 正常肺組織,顯示支氣管上皮細胞和分散的肺泡巨噬細胞的強胞質染色,以及(H)腺癌強胞質染色,與非纖維化的明顯炎癥性基質沒有顯著染色。
發明詳述
除非另有說明,本文公開的發明的實施采用本領域技術水平內的化學、微生物學、分子生物學和重組DNA技術的常規方法。這類技術在文獻中充分解釋。參見,例如,Sambrook, et al. Molecular Cloning:ALaboratoryManual(Current Edition);DNA Cloning:A Practical Approach,vol. I & II(D. Glover,ed.) ;Oligonucleotide Synthesis (N.Gait, ed. , Current Edition);NucleicAcid Hybridization(B. Hames & S. Higgins, eds., Current Edition);Transcription and Translation (B.Hames & S. Higgins, eds. , Current Edition;Histology for Pathologists (S. E. Mills, Current Edition)。本說明書中引用的所有出版物、公開的專利文件和專利申請指示本發明所屬領域的技術水平。本文引用的所有出版物、公開的專利文件和專利申請援引加入本文,與每個單獨的出版物、公開的專利文件或專利申請具體地和單獨地指明援引加入本文的程度相同。
現在詳細描述本發明的代表性實施方案。雖然本發明結合列舉的實施方案進行描述,但是應理解本發明并不限于這些實施方案。相反,本發明旨在涵蓋可以包括在如權利要求書所限定的本發明范圍內的所有替代、修飾和等價物。
除非特別說明,本文所用的技術和科學術語具有本發明所屬領域技術人員通常理解的相同含義。盡管與本文所述的方法、裝置和材料相似或等價的任何方法、裝置和材料可用于實施或測試本發明,但是現在描述優選的方法、裝置和材料。
如在包括所附權利要求書在內的本申請中所用,除非特別說明,單數形式“一個 (a)”、“一個(an)”和“這個(the) ”包括復數形式,且與“至少一個”和“一個或多個”可以互換使用。因此,提及的“一個適配體”包括適配體的混合物,提及的“探針”包括探針的混合物等。
如本文所用,術語“約”表示數值的不明顯更改或變化,由此該數值所涉及的項目的基本功能未改變。
如本文所用,術語“包含(comprises) ”、“包含(comprising) ”、“包括 (includes) ”、“包括(including) ”、“含有(contains) ”、“含有(containing) ”及它們的任何變體意圖覆蓋非排他的包含,由此包含、包括或含有一個元件或者一系列元件的過程、方法、方法限定產品或組成(composition of matter)不僅包括這些元件,而且可以包括未明確列舉或這樣的過程、方法、方法限定產品或組成固有的其他元件。
本申請包括用于檢測和診斷肺癌的生物標記、方法、裝置、試劑、系統和試劑盒。
在一方面,本發明提供了一種或多種生物標記,其單獨或以各種組合用于診斷肺癌,允許區分診斷肺結節是良性或惡性的,監測肺癌復發或尋址(address)其他臨床指征。 在其他方面,所述生物標記可以用于確定關于個體的肺癌的信息,例如預后、癌癥分類、疾病風險的預測或治療的選擇。如下文詳細描述,示例性實施方案包括表18、20和21提供的生物標記,這些生物標記使用基于多重適配體的測定來鑒定,所述測定在實施例I中,更特別是在實施例2和6中描述。每個生物標記可用于測定如下文定義的任何類型的樣品。
表I第2列列出得自以下分析的發現來自NSCLC癌癥病例的幾百個個體血液樣品以及來自吸煙者和來自診斷為具有良性肺結節的個體的幾百個等價個體血液樣品。吸煙者和良性小結組的設計使得肺癌測試與群體匹配可以具有最大益處。(這些病例和對照得自多個臨床場所以模擬這樣的測試可以應用的真實世界條件的范圍)。潛在的生物標記在單獨的樣品而不是在混合疾病和對照血液中測量;這允許更好地理解與疾病(在這種情況下是肺癌)的存在和不存在相關的表型中個體和組的變化。由于對每個樣品進行800個以上的蛋白測量,并且單獨測量來自每個疾病和對照群體的幾百個樣品,所以表I第2列得自非常大的數據集合的分析。使用本文“生物標記的分類和疾病評分計算”章節中描述的方法分析測量結果。
表I第2列列出了發現可用于區分得自NSCLC個體的樣品與得自吸煙者和良性肺結節個體的“對照”樣品的生物標記。使用本文所述的多重適配體測定,發現了 38個生物標記,其區分得自患有肺癌的個體的樣品與得自吸煙者對照組中個體的樣品(見表I第6 列)。相似地,使用多重適配體測定,發現了 40個生物標記,其區分得自NSCLC個體的樣品與得自具有良性肺結節的人的樣品(見表I第5列)。總之,這兩列38和40個生物標記由 61個獨特的生物標記組成,因為區分NSCLC與良性小結的生物標記的列表和區分NSCLC與不患有肺癌的吸煙者的生物標記的列表之間有相當大的重疊。
表18列出如實施例6所述得自分析診斷患有NSCLC的吸煙者的8個個體組織樣品的發現。所有患者均為47-75歲的吸煙者,并且覆蓋NSCLC1A期至3B期。從每個個體獲得3個樣品腫瘤組織、鄰近健康組織(在腫瘤的Icm內)和遠端無關肺組織。選擇樣品以匹配肺癌診斷測試可以具有最大益處的群體。潛在的生物標記在單獨的樣品而不是在混合疾病和對照組織中測量;這允許更好地理解與疾病(在這種情況下是肺癌)的存在和不存在相關的表型中個體和組的變化。利用Mann-Whitney檢驗分析測量結果。
表18列出發現可用于區分得自NSCLC個體的樣品與得自相同個體的鄰近和遠端無關肺組織的“對照”樣品的生物標記。使用本文所述的多重適配體測定,發現了 36個生物標記,其區分腫瘤組織樣品與得自診斷患有NSCLC的個體的鄰近和遠端肺組織的樣品。關于表I第2列,可以看到這些生物標記中的11個與如實施例2所述在血清樣品中鑒定的生物標記重疊。在原血清譜中未測量的額外的標記MMP-12已被發現是血清和組織中有用的生物標記。表21提供合并的血清和腫瘤組織樣品中鑒定的生物標記的總數(86個)的列表。表20提供鑒定的腫瘤組織樣品獨特的生物標記的列表(25個)。
雖然某些所述肺癌生物標記可單獨用于檢測和診斷肺癌,但是本文還描述了肺癌生物標記的多個子集的分組,其中每個分組或者子集選擇可作為一組三個或更多個生物標記使用,這在本文中互換地稱為“生物標記組”和一組。因此,本申請的各個實施方案提供了包含N個生物標記的組合,其中N是至少2個生物標記。在其他實施方案中,N選自2-86 個生物標記(表21) ;2-36個生物標記(表18)或2-25個生物標記(表20)。在其他實施方案中,N選自2-86(表21),并且所述N個生物標記中至少一個為MMP-12。在其他實施方案中,N選自2-25(表20),并且所述N個生物標記中至少一個為MMP-12。包括MMP-12作為標記之一的2-5個生物標記的代表性組如表22-25所示。
仍然在其他實施方案中,所述生物標記選自表18所列的生物標記,并且N選自2-7、2-10、2-15、2-20、2-25、2-30、2-36中的任意數。在其他實施方案中,N選自3_7、3_10、3-15、3-20、3-25、3-30、3-36中的任意數。在其他實施方案中,N選自 4-7、4-10、4-15、4_20、4-25、4-30、4-36中的任意數。在其他實施方案中,N選自 5-7、5-10、5-15、5-20、5-25、5_30、5-36中的任意數。在其他實施方案中,N選自6-10、6-15、6-20、6-25、6-30、6-36中的任意數。在其他實施方案中,N選自7-10、7-15、7-20、7-25、7-30、7-36中的任意數。在其他實施方案中,N選自8-10、8-15、8-20、8-25、8-30、8-36中的任意數。在其他實施方案中,N選自9-15、9-20、9-25、9-30、9-36中的任意數。在其他實施方案中,N選自10-15、10-20、10-25、10-30、10-36中的任意數。應當理解N可以選自包含類似但更高級的范圍。
仍然在其他實施方案中,所述生物標記選自表20所列的生物標記,并且N選自2-7、2-10、2-15、2-20、2-25中的任意數。在其他實施方案中,N選自3-7、3-10、3-15、3_20、3-25中的任意數。在其他實施方案中,N選自4-7、4-10、4-15、4-20、4-25中的任意數。在其他實施方案中,N選自5-7、5-10、5-15、5-20、5-25中的任意數。在其他實施方案中,N選自6-10、6-15、6-20、6-25中的任意數。在其他實施方案中,N選自7-10、7-15、7-20、7_25中的任意數。在其他實施方案中,N選自8-10、8-15、8-20、8-25中的任意數。在其他實施方案中,N選自9-15、9-20、9-25中的任意數。在其他實施方案中,N選自10-15、10-20、10-25 中的任意數。在其他實施方案中,N選自9-15、9-20、9-25中的任意數。在其他實施方案中, N選自10-15、10-20、10-25中的任意數。應當理解N可以選自包含類似但更高級的范圍。
仍然在其他實施方案中,所述生物標記選自表21所列的生物標記,并且N選自 2-7、2-10、2-15、2-20、2-25、2-30、2-35、2-40、2-45、2-50、2-55、2-60、2-65、2-70、2-75、 2-80或2-86中的任意數。在其他實施方案中,N選自3-7、3-10、3-15、3-20、3-25、3-30、3-35、3-40、3-45、3-50、3-55、3-60、3-65、3-70、3-75、3-80或 3-86 中的任意數。在其他實施方案中,N 選自 4-7、4-10、4-15、4-20、4-25,4-30、4-35,4-40、4-45、4-50、4-55,4-60、4-65,4-70、4-75、4-80或4-86中的任意數。在其他實施方案中,N選自5-7、5-10、5-15、5_20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80或 5-86 中的任意數。在其他實施方案中,N選自 6-10、6-15、6-20、6-25、6-30、6-35、6-40、6-45、6-50、6-55、6-60、6-65、6-70、6-75、6-80或6-86中的任意數。在其他實施方案中,N選自7_10、7_15、7-20、7-25、7-30、7-35、7-40、7-45、7-50、7-55、7-60、7-65、7-70、7-75、7-80或 7-86 中的任意數。在其他實施方案中,N選自 8-10、8-15、8-20、8-25、8-30、8-35、8-40、8-45、8-50、8-55、8-60、8-65、8-70、8-75、8-80或8-86中的任意數。在其他實施方案中,N選自9-15,9-20、9-25、9-30、9-35、9-40、9-45、9-50、9-55、9-60、9-65、9-70、9-75、9-80或 9-86 中的任意數。在其他實施方案中,N 選自 10-15、10-20、10-25、10-30、10-35、10-40、10-45、10-50、10-55、10-60、10-65、10-70、10-75、10-80或10-86中的任意數。應當理解N可以選自包含類似但更高級的范圍。
在一實施方案中,可用于生物標記子集或者組的生物標記的數目基于生物標記值的特定組合的靈敏性和特異性值。本文所用術語“靈敏性”和“特異性”是關于基于在個體的生物學樣品中檢測的一個或多個生物標記值來正確分類個體患有肺癌或不患有肺癌的能力。“靈敏性”指生物標記或多個生物標記關于正確分類患有肺癌的個體的性能。“特異性”指生物標記或多個生物標記關于正確分類不患有肺癌的個體的性能。例如,用于測試一組對照樣品和肺癌樣品的一組標記的85%特異性和90%靈敏性指85%的對照樣品由該組正確分類為對照樣品,并且90%的肺癌樣品由該組正確分類為肺癌樣品。期望或優選的最小值可以如實施例3所述確定。
在一方面,在個體中通過以下方法檢測或診斷肺癌對來自所述個體的生物學樣品進行測定,并檢測生物標記值,所述生物標記值每個對應于生物標記MMP-7、MMP-12或 IGFBP-2中的至少一個和選自表21的生物標記列表的至少N個額外的生物標記,其中N等于2、3、4、5、6、7、8、9、10、11、12、13、14或15。在另一方面,在個體中通過以下方法檢測或診斷肺癌對來自所述個體的生物學樣品進行測定,并檢測生物標記值,所述生物標記值每個對應于生物標記MMP-7、MMP-12或IGFBP-2中的至少一個和選自表21的生物標記列表的至少N個額外的生物標記之一,其中N等于1、2、3、4、5、6、7、8、9、10、11、12或13。在另一方面,在個體中通過以下方法檢測或診斷肺癌對來自所述個體的生物學樣品進行測定,并檢測生物標記值,所述生物標記值每個對應于生物標記MMP-7和選自表21的生物標記列表的至少N個額外的生物標記之一,其中N等于2、3、4、5、6、7、8、9、10、11、12、13、14或15。在另一方面,在個體中通過以下方法檢測或診斷肺癌對來自所述個體的生物學樣品進行測定,并檢測生物標記值,所述生物標記值每個對應于生物標記MMP-12和選自表21的生物標記列表的至少N個額外的生物標記之一,其中N等于2、3、4、5、6、7、8、9、10、11、12、13、14或 15。在另一方面,在個體中通過以下方法檢測或診斷肺癌對來自所述個體的生物學樣品進行測定,并檢測生物標記值,所述生物標記值每個對應于生物標記IGFBP-2和選自表21的生物標記列表的至少N個額外的生物標記之一,其中N等于2、3、4、5、6、7、8、9、10、11、12、 13、14 或 15。
本文鑒定的肺癌生物標記表示較大數目的可用于有效檢測或診斷肺癌的生物標記的子集或組的選擇。期望數目的這類生物標記的選擇取決于所選生物標記的特定組合。 重要的是記住用于檢測或診斷肺癌的生物標記的組還可以包括在表18、20或21中未發現的生物標記,并且包括在表18、20或21中未發現的額外的生物標記可以減少選自表18、20 或21的特定子集或組中的生物標記的數目。如果額外的生物醫學信息與生物標記值聯合用于建立對于給定測定可接受的靈敏性和特異性值,則用于子集或組的來自表18、20或21 的生物標記的數目也可以減少。
可以影響用于生物標記的子集或組的生物標記數目的另一因素是用于從進行肺癌診斷的個體中獲得生物學樣品的方法。在精心控制的樣品獲取環境中,符合期望的靈敏性和特異性值所必需的生物標記的數目會低于在樣品收集、處理和貯存中可以存在更多變化的情況中的數目。在研究表18、20或21所列的生物標記列表中,利用多個樣品收集位點來收集數據以進行分類器訓練。這提供了更穩健的生物標記,其對于樣品收集、處理和貯存中的變化較不敏感,但是如果訓練數據都在非常相似條件下獲得,則還可以要求子集或組中更大的生物標記數目。
本申請的一方面可以參考圖IA和B來一般性描述。生物學樣品獲得自所關注的一個或多個個體。然后測定該生物學樣品以檢測所關注的一個或多個(N個)生物標記的存在,并確定所述N個生物標記的每一個的生物標記值(在圖IB中稱為標記RFU)。一旦檢測生物標記并指定生物標記值,則如本文詳細描述地對每個標記進行評分或者分類。然后組合標記評分以提供總診斷評分,其表示獲取樣品的個體患有肺癌的似然性。
如本文所用,“肺(lung) ”與“肺(pulmonary) ”可互換使用。
如本文所用,“吸煙者”指具有吸煙歷史的個體。
“生物學樣品”、“樣品”和“測試樣品”在本文中可互換使用,指獲得自或以另外的方式源自個體的任何材料、生物液體、組織或者細胞。這包括血液(包括全血、白細胞、外周血單核細胞、血沉棕黃層(buffy coat)、血楽;和血清)、痰、淚液、粘液、洗鼻液(wash)、鼻抽吸物(aspirate)、呼吸物(breath)、尿、精液、唾液、腦膜液(meningeal fluid)、羊水、腺體液(glandularfluid)、淋巴液、乳頭抽吸物、支氣管抽吸物、滑液、關節抽吸物、細胞、細胞提取物和腦脊液。其還包括上述所有材料的實驗分離級分。例如,血液樣品可以分級分離為血清或含有諸如紅細胞或白細胞(white bloodcell)(白細胞(leukocyte))的特定類型血細胞的級分。如果需要,樣品可以是來自個體的樣品的組合,如組織與液體樣品的組合。術語“生物學樣品”還包括含有均質固體材料的材料,如來自糞便樣品、組織樣品或組織活檢樣品的材料。術語“生物學樣品”還包括源自組織培養或者細胞培養的材料。可以使用獲得生物學樣品的任何合適方法;示例性方法包括如靜脈切開放血術、拭子(如口腔拭子)以及細針抽吸活檢方法。易受細針抽吸影響的示例性組織包括淋巴結、肺、肺洗液、BAL (支氣管肺泡灌洗液)、甲狀腺、乳腺和肝。樣品還可以通過顯微切割(如激光捕獲顯微切割(LCM) 或激光顯微切割(LMD))、膀胱沖洗、涂片(如PAP涂片)或導管灌洗收集。獲得自或源自個體的“生物學樣品”包括在獲得自所述個體之后已經通過任何合適方式處理的任何此類樣品O
“組織樣品”或“組織”指上述生物學樣品的某子集。根據這個定義,組織是異質環境中的大分子的集合。如本文所用,組織指單一細胞類型、細胞類型的集合、細胞的聚集體或大分子的聚集體。在結構和組成方面,組織一般是大分子的物理矩陣,其可以是流體或剛性的。胞外基質是結構和組成上更加剛性的組織的實例,而膜雙層在結構和組成上更加流體。組織包括但不限于通常為特定種類的細胞與它們的胞間物質一起的聚集體,其形成通常用來表示給定器官的一般細胞結構(cellular fabric)的結構材料之一,例如腎組織、腦組織、肺組織。組織的4個普通類別為上皮組織、結締組織、神經組織和肌肉組織。鑒定組織靶標的慢解離速率適配體的方法描述于2011年I月13日公開的國際申請公開第 W02011/006075號,其整體援引加入本文。
在這個定義內的組織的實例包括但不限于大分子的異質聚集體,如非細胞的纖維蛋白凝塊;細胞的均質或異質聚集體;包含具有特異性功能的細胞的高級結構,如器官、腫瘤、淋巴結、動脈等;以及單獨的細胞。組織或細胞可以是在它們的天然環境中、分離的或者在組織培養中。組織可以是完整的或修飾的。修飾可以包括許多改變,例如轉化、轉染、激活和亞結構分離,如細胞膜、細胞核、細胞器等。
組織、細胞或亞細胞結構的來源可以得自原核生物以及真核生物。這包括人、動物、植物、細菌、真菌和病毒結構。
此外,應當認識到生物學樣品可以通過從許多個體中取得生物學樣品并將它們混合或混合每個個體的生物學樣品的等份而獲得。混合的樣品可以作為來自單個個體的樣品進行處理,并且如果在混合的樣品中確定癌癥的存在,則可以將每個個體的生物學樣品再進行測試以確定哪個/哪些個體患有肺癌。
為了本說明書的目的,短語“歸因于來自個體的生物學樣品的數據”指所述數據以某種形式源自所述個體的生物學樣品或利用所述個體的生物學樣品產生。數據在產生后可以被重新格式化、修改或以數學方式改變至某種程度,例如通過從一種測量系統中的單位轉變為另一測量系統中的單位;但是應當理解,數據源自所述生物學樣品或利用所述生物學樣品產生。
“靶標”、“靶分子”和“分析物”在本文中可互換使用,指可能存在于生物學樣品中的任何所關注的分子。“所關注的分子”包括特定分子的任何微小變化,如在蛋白的情況下, 例如氨基酸序列的微小變化、二硫鍵形成、糖基化、脂質化、乙酰化、磷酸化或者任何其他操作或修飾,如與基本不改變分子同一性的標記組分偶聯。“靶分子”、“靶標”或“分析物”是一種類型或種類的分子或多分子結構的一組拷貝。“靶分子”、“靶標”和“分析物”指一組以上這樣的分子。示例性靶分子包括蛋白、多肽、核酸、碳水化合物、脂質、多糖、糖蛋白、激素、受體、抗原、抗體、affybodies、抗體模擬物(mimic)、病毒、病原體、毒性物質、底物、代謝物、過渡態類似物、輔因子、抑制劑、藥物、染料、營養素、生長因子、細胞、組織以及前述任何物質的任何片段或部分。
如本文所用,“多肽”、“肽”和“蛋白”在本文中可互換使用,指任何長度的氨基酸聚合物。聚合物可以是線性或支化的,其可以包含修飾的氨基酸,并且其可以被非氨基酸中斷。該術語還涵蓋已經被天然修飾或者通過干預修飾的氨基酸聚合物;例如,二硫鍵形成、 糖基化、脂質化、乙酰化、磷酸化或任何其他操作或修飾,如與標記組分偶聯。該定義還包括例如含有一個或多個氨基酸類似物(包括例如非天然氨基酸等)以及本領域已知的其他修飾的多肽。多肽可以是單鏈或締合(associated)鏈。該定義還包括前蛋白和完整的成熟蛋白;源生自成熟蛋白的肽或多肽;蛋白的片段;剪接變體;蛋白的重組形式;具有氨基酸修飾、缺失或取代的蛋白變體;消化;以及翻譯后修飾,如糖基化、乙酰化、磷酸化等。
如本文所用,“標記”和“生物標記”可互換使用,指指示個體中正常或異常過程或者個體中疾病或其他疾病狀況的跡象或者是個體中正常或異常過程或者個體中疾病或其他疾病狀況的跡象的靶分子。更具體地,“標記”或“生物標記”是與無論正常與否的特定生理狀態或過程的存在相關的解剖學、生理學、生物化學或分子參數,并且如果是異常的,則無論是慢性或急性的。生物標記可以通過各種方法檢測和測量,包括實驗室測定和醫學成像。當生物標記是蛋白時,還可以使用相應基因的表達作為生物學樣品中相應蛋白生物標記的量或存在或不存在或者編碼該生物標記的基因或控制該生物標記表達的蛋白的甲基化狀態的替代測量。
如本文所用,“生物標記值”、“值”、“生物標記水平”和“水平”在本文中可互換使用,指使用任何分析方法來檢測生物學樣品中的生物標記而進行的測量,其示出所述生物學樣品中的生物標記、對于所述生物標記或對應于所述生物標記的存在、不存在、絕對量或濃度、相對量或濃度、效價、水平、表達水平、測量水平的比率等。所述“值”或“水平”的確切性質取決于用于檢測生物標記的特定分析方法的具體設計和組分。
當生物標記表示個體中異常過程或疾病或其他疾病狀況或者是個體中異常過程或疾病或其他疾病狀況的跡象時,該生物標記通常描述為與表示個體中正常過程或不存在疾病或其他疾病狀況或者是個體中正常過程或不存在疾病或其他疾病狀況的跡象的生物標記的表達水平或值相比時是過表達或低表達的。
“上調”、“上調的”、“過表達”、“過表達的”及其任何變體在本文中可互換使用,指生物學樣品中生物標記的值或水平高于通常在來自健康或正常個體的相似生物學樣品中檢測的所述生物標記的值或水平(或者值或水平的范圍)。該術語還可以指生物學樣品中生物標記的值或水平高于在特定疾病的不同階段檢測的所述生物標記的值或水平(或者值或水平的范圍)。
“下調”、“下調的”、“低表達”或“表達低的”及其任何變體在本文中可互換使用,指生物學樣品中生物標記的值或水平低于通常在來自健康或正常個體的相似生物學樣品中檢測的生物標記的值或水平(或者值或水平的范圍)。該術語還可以指生物學樣品中生物標記的值或水平低于在特定疾病的不同階段檢測的所述生物標記的值或水平(或者值或水平的范圍)。
此外,過表達的或低表達的生物標記還可以指與所述生物標記的“正常”表達水平或值相比是“差異表達的”或者具有“不同水平”或“不同值”,所述“正常”表達水平或值表示個體中正常過程或不存在疾病或其他疾病狀況或者是個體中正常過程或不存在疾病或其他疾病狀況的跡象。因此,生物標記的“差異表達”還可以指與所述生物標記的“正常”表達水平不同。
術語“不同的基因表達”和“差異表達”在本文中可互換使用,指在患有指定疾病的對象中基因(或其相應的蛋白表達產物)的表達被激活至相對于其在正常或對照對象中的表達較高或較低的水平。該術語還包括基因(或其相應的蛋白表達產物)的表達在相同疾病的不同階段被激活至較高或較低水平。還應當理解差異表達的基因可以在核酸水平或蛋白水平激活或抑制,或者可以進行可變剪接以獲得不同的多肽產物。這樣的差異可以通過許多改變證實,包括多肽的mRNA水平、表面表達、分泌或其他分配(partitioning)。不同的基因表達可以包括比較兩個或更多個基因或者它們的基因產物之間的表達;或者比較兩個或更多個基因或者它們的基因產物之間的表達的比率;或者甚至比較相同基因的兩種不同加工的產物,其在正常對象與患病對象之間或者在相同疾病的不同階段之間是不同的。差異表達包括在例如正常和患病細胞或者經歷不同疾病事件或疾病階段的細胞中的基因或其表達產物在時間或細胞表達模式中的定量以及定性的差異。
如本文所用,“個體”指測試對象或患者。個體可以是哺乳動物或非哺乳動物。在許多實施方案中,個體是哺乳動物。哺乳動物個體可以是人或非人。在許多實施方案中,個體是人。健康或正常個體是其中通過常規診斷方法不可檢測出所關注的疾病或疾病狀況 (包括例如肺疾病、肺相關疾病或其他肺疾病狀況)的個體。
“診斷(Diagnose) ”、“診斷(diagnosing) ”、“診斷(diagnosis) ”及其變體指基于個體相關的一種或多種跡象、癥狀、數據或其他信息對所述個體的健康狀態或疾病狀況的檢測、確定或識別。個體的健康狀態可以診斷為健康/正常(即診斷為不存在疾病或疾病狀況)或者診斷為患病/異常(即診斷為存在疾病或疾病狀況或者對疾病或疾病狀況的特征的評價)。對于特定疾病或疾病狀況,術語“診斷(diagnose) ”、“診斷(diagnosing) ”、 “診斷(diagnosis)”等涵蓋對疾病的初始檢測;對疾病的表征或分類;疾病的進展、緩解或復發的檢測;以及在給予個體治療或療法后疾病應答的檢測。肺癌的診斷包括區分患有癌癥與不患有癌癥的個體,包括吸煙者和非吸煙者。其還包括區分良性肺結節與癌性肺結節。
“預后(Prognose) ”、“預后(prognosing) ”、“預后(prognosis) ”及其變體指預測患有疾病或疾病狀況的個體中所述疾病或疾病狀況的未來進程(如預測患者存活),這個術語涵蓋在給予個體治療或療法后評價疾病的應答。
“評價(Evaluate) ”、“評價(evaluating) ”、“評價(evaluation) ” 及其變體涵蓋 “診斷”和“預后”,并且還涵蓋對不患病個體的疾病或疾病狀況的未來進程的確定或預測以及確定或預測在表面上已經治愈疾病的個體中所述疾病或疾病狀況復發的似然性。術語 “評價”還包括評價個體對療法的應答,例如預測個體是否可能對治療劑順利地應答,或者不大可能對治療劑應答(或者會例如經歷毒性或其他不期望的副作用);選擇給予個體的治療劑;或者監測或確定個體對已經給予該個體的療法的應答。因此,“評價”肺癌可以包括例如以下任何方面預后個體中肺癌的未來進程;預測表面上已經治愈肺癌的個體中肺癌的復發;或者確定或預測個體對于肺癌治療的應答;或者基于確定源自個體生物學樣品的生物標記值來選擇給予該個體的肺癌治療。
任何如下實例均可以稱作“診斷”或“評價”肺癌最初檢測肺癌的存在或不存在; 確定肺癌的具體階段、類型或亞型或者其他分類或特征;確定肺結節是良性病變或惡性肺腫瘤;或者檢測/監測肺癌進展(如監測肺腫瘤生長或轉移擴散)、緩解或復發。
如本文所用,“額外的生物醫學信息”指除了使用本文所述的任何生物標記之外的對個體所做的與肺癌風險相關的一個或多個評價。“額外的生物醫學信息”包括如下任何方面個體的物理描述(physical descriptor)、通過CT成像觀察到的肺結節的物理描述、個體的身高和/或體重、個體的性別、個體的種族、吸煙史、職業史、暴露于已知致癌物(如暴露于任何石棉、氡氣、化學品、來自火的煙以及空氣污染,這可以包括來自靜止或移動來源的排放物,如工業/工廠或汽車/海運/飛機排放物)、暴露于二手煙、肺癌(或其他癌癥) 家族史、肺結節的存在、小結的大小、小結的部位、小結的形態學(如通過CT成像、磨玻璃影 (GGO)觀察,實體、非實體)、小結的邊界特點(如平滑、分葉、銳利及光滑、針狀、浸潤)等。 吸煙史通常以術語“包年(pack year)”量化,其指一個人吸煙的年數乘以每天吸煙的平均包數。例如,平均每天吸一包煙共35年的人稱作吸煙史為35包年。額外的生物醫學信息可以通過使用本領域已知的常規技術得自個體,如通過使用常規患者問卷調查或健康史問卷調查等得自個體自身,或者得自醫學從業人員等。或者,額外的生物醫學信息可以得自常規成像技術,包括CT成像(如低劑量CT成像)和X-射線檢查。生物標記水平的測試聯合任何額外的生物醫學信息的評價與單獨測試生物標記或單獨評價額外的生物醫學信息的任何特定項目(如單獨的CT成像)相比,可以例如改善檢測肺癌(或其他肺癌相關用途) 的靈敏性、特異性和/或AUC。
術語“曲線下面積”或“AUC”指接受者操作特征(ROC)曲線下的面積,這兩個術語均為本領域所熟知。AUC測量可以用于比較完整數據范圍內的分類器的精確性。具有較大AUC的分類器具有較大的能力來正確分類兩個所關注的組(如肺癌樣品與正常或對照樣品)之間的未知情況。ROC曲線可以用于對特定特征的性能作圖(如本文描述的任何生物標記和/或任何額外的生物醫學信息項目),以在兩個群體之間進行區分(如患有肺癌的病例與無肺癌的對照)。通常,整個群體(如病例與對照)的特征數據基于單個特征的值遞增分類。然后,對于該特征的每個值,計算數據的真陽性率和假陽性率。真陽性率通過計數高于該特征值的病例數,然后除以病例總數而確定。假陽性率通過計數高于該特征值的對照數,然后除以對照總數而確定。盡管這個定義指其中特征在病例中與在對照中相比升高的情況,但是這個定義還適用于其中特征在病例中與在對照中相比降低的情況(在這種情況下,計數低于該特征值的樣品)。ROC曲線可以對單個特征以及其他單個輸出產生,例如兩個或更多個特征的組合可以是數學組合(如加、減、乘等)以提供單個的和值,該單個的和值可以在ROC曲線中繪制。此外,其中組合產生單個輸出值的多個特征的任意組合可以在ROC曲線中繪制。這些特征的組合可以包括測試。ROC曲線是測試的真陽性率(靈敏性)對測試的假陽性率(I-特異性)的作圖。
如本文所用,“檢測”或“確定”生物標記值包括使用觀察和記錄對應于生物標記值的信號所需的設備以及產生該信號所需的材料。在許多實施方案中,生物標記值使用任何合適的方法檢測,包括熒光、化學發光、表面等離子共振、表面聲波、質譜、紅外線光譜、拉曼3光譜、原子力顯微術、掃描隧道顯微術、電子化學檢測方法、核磁共振、量子點等。
“固體支持物”在本文中指具有分子可以直接或間接,通過共價鍵或非共價鍵附著的表面的任何支持物。“固體支持物”可以具有各種物理形式,可以包括例如膜;芯片(如蛋白芯片);玻片(如載玻片或蓋玻片);柱;空心、固體、半固體、有孔或有腔的顆粒,例如珠;凝膠;纖維,包括光學纖維材料;基質;及樣品容器。示例性樣品容器包括樣品孔、管、毛細管、小瓶及能夠容納樣品的任何其他容器、溝槽或凹陷。樣品容器可以包含于多樣品平臺上,如微量滴定板、玻片、微流體裝置等。支持物可以由天然或合成材料、有機或無機材料組成。其上附著捕獲試劑的固體支持物的成分通常取決于附著方法(如共價附著)。其他示例性容器包括微滴和微流體控制的或大量的油/水性乳液,在其中可以進行測定和相關操作。合適的固體支持物包括例如塑料、樹脂、多糖、硅石或基于硅石的材料、官能化玻璃、改性的硅、碳、金屬、無機玻璃、膜、尼龍、天然纖維(例如絲、羊毛和棉)、聚合物等。包含固體支持物的材料可以包含反應基團,例如羧基、氨基或羥基以用于捕獲試劑的附著。聚合固體支持物可以包括如聚苯乙烯、聚對苯二甲酸乙二醇酯、聚乙酸乙烯酯、聚氯乙烯、聚乙烯吡咯烷酮、聚丙烯腈、聚甲基丙烯酸甲酯、聚四氟乙烯、丁基橡膠、苯乙烯丁二烯橡膠、天然橡膠、聚乙烯、聚丙烯、(聚)四氟乙烯、(聚)偏氟乙烯、聚碳酸酯和聚甲基戊烯。可以使用的合適的固體支持物顆粒包括例如編碼的顆粒,如Lummk -型編碼的顆粒、磁性顆粒以及玻璃顆粒。
生物標記的示例性用途
在許多示例性實施方案中,本發明提供了診斷個體的肺癌的方法,所述方法通過檢測對應于個體的肺組織中存在的一個或多個生物標記的一個或多個生物標記值來進行, 并且通過任何數目的分析方法來進行,包括本文所述的任何分析方法。這些生物標記例如在肺癌個體中與在無肺癌個體中差異表達,特別是NSCLC。生物標記在個體中的差異表達的檢測可以用于例如早期診斷肺癌、區分良性與惡性肺結節(例如在計算機斷層(CT)掃描上觀察到的小結)、監測肺癌復發或者用于其他臨床指征,包括確定預后和治療方法。
本文所述的任何生物標記可以用于肺癌的各種臨床指征,包括如下任何方面檢測肺癌(如在高危個體或人群中);表征肺癌(如確定肺癌類型、亞型或階段),如通過區分非小細胞肺癌(NSCLC)與小細胞肺癌(SCLC)和/或區分腺癌與鱗狀細胞癌(或者促進組織病理學);確定肺結節是良性小結或惡性肺腫瘤;確定肺癌預后;監測肺癌進展或緩解; 監測肺癌復發;監測轉移;治療選擇;監測對治療劑或其他治療的應答;對個體的計算機斷層掃描(CT)篩查進行分層(stratification)(如鑒定面臨較高肺癌風險的那些個體,從而最可能得益于螺旋CT篩查,因此增加CT的陽性預測值);將生物標記測試與諸如吸煙史等的額外的生物醫學信息組合,或者與小結大小、形態學等組合(如提供與單獨的CT測試或生物標記測試相比具有增加的診斷性能的測定);促進診斷肺結節為惡性或良性;促進在 CT上觀察到肺結節就做出臨床決定(例如,如果小結被視為低風險的,例如如果基于生物標記的測試是陰性的,有或無小結大小的歸類,則要求重復CT掃描;或者,如果小結被視為中等至高風險的,例如如果基于生物標記的測試是陽性的,有或無小結大小的歸類,則考慮進行活組織檢查);以及促進決定臨床后續處理(如在CT上觀察到未鈣化小結后是否實施重復CT掃描、細針活組織檢查或胸廓切開術)。生物標記測試可以改善單獨的CT篩查的陽性預測值(PPV)。除了聯合CT篩查之外,本文所述的生物標記還可以與用于與肺癌的任何其他成像方式如胸部X-射線檢查聯合使用。此外,所述生物標記還可以用于在通過成像方式或其他臨床相關性檢測肺癌指征之前或者在癥狀出現之前允許這些應用的某一些。
本文所述的任何生物標記可以用于診斷肺癌的示例性方式是未知患有肺癌的個體中一個或多個所述生物標記的差異表達可以表明該個體患有肺癌,從而使得可以在治療最有效的疾病早期檢測肺癌,也許在通過其他方式檢測肺癌之前或者在癥狀出現之前檢測肺癌。肺癌期間一個或多個生物標記的過表達可以指示肺癌的進展,如肺腫瘤生長和/或轉移(因此表示不良預后);而一個或多個生物標記差異表達程度的降低(即在隨后的生物標記測試中,個體中的表達水平趨向或接近“正常”表達水平)可以指示肺癌的緩解,如肺腫瘤縮小(因此提示良好或較好的預后)。相似地,在肺癌治療期間一個或多個生物標記差異表達的程度增加(即在隨后的生物標記測試中,個體中的表達水平進一步遠離“正常”表達水平)可以指示肺癌的進展,并因此表示所述治療是無效的;而在肺癌治療期間一個或多個生物標記的差異表達降低可以指示肺癌的緩解,并因此表示該治療是成功的。此外,在個體看起來已經治愈肺癌之后一個或多個生物標記的差異表達的增加或降低可指示肺癌的復發。在這種情況下,例如可以在早期對個體重新啟動治療(或者如果個體維持治療,則修改治療方案以增加劑量和/或頻率),否則直至晚期還未檢測到肺癌的復發。此外, 個體中一個或多個生物標記的差異表達水平可以預測個體對特定治療劑的應答。在監測肺癌復發或進展中,生物標記表達水平的改變可以指示需要重復成像(如重復CT掃描),例如來確定肺癌活性或確定需要改變治療方案。
本文所述的任何生物標記的檢測可以特別地在肺癌治療后使用或者與肺癌治療聯合使用,如評價治療的成功或者監測治療后肺癌的緩解、復發和/或進展(包括轉移)。 肺癌治療可以包括例如給予個體治療劑、進行手術(如手術切除至少一部分肺腫瘤)、給予放療或本領域所用的任何其他類型肺癌治療方法以及這些治療的任何組合。例如,任何生物標記可以在治療后檢測至少一次,或者可以在治療后檢測多次(如定期檢測),或者可以在治療之前和之后檢測。個體中任何生物標記隨時間的差異表達水平可以指示肺癌的進展、緩解或復發,其實例包括如下方面生物標記的表達水平在治療后與治療前相比增加或降低;生物標記的表達水平在治療后較晚時間點與治療后較早時間點相比增加或降低;以及生物標記的表達水平在治療后的一個時間點與該生物標記的正常水平相比不同。
作為具體的實例,本文所述的任何生物標記的生物標記水平可以在手術前和手術后(例如手術后2-4周)的血清樣品中確定。手術后樣品與手術前樣品相比生物標記表達水平的增加可以指示肺癌的進展(如不成功的手術);而手術后樣品與手術前樣品相比生物標記表達水平的降低可以指示肺癌的消退(如成功除去肺腫瘤的手術)。生物標記水平的相似分析可以在其他形式的治療之前和之后進行,如在放療或者給予治療劑或癌癥疫苗之前和之后進行。
除了作為獨立運行的診斷測試的生物標記水平測試之外,生物標記水平還可以聯合SNP或者指示疾病易感性風險增加的其他遺傳病變或變異性的確定來進行。(參見例如, Amos et al. , Nature Genetics40, 616-622 (2009))。
除了作為獨立運行的診斷測試的生物標記水平測試之外,生物標記水平還可以聯合CT篩查進行。例如,生物標記可以促進實施CT篩查的醫學和經濟理由,例如篩查面臨肺癌風險的大量無臨床癥狀群體(如吸煙者)。例如,生物標記水平的“CT前”測試可以用于分類CT篩查的高危個體,如基于個體生物標記水平來鑒定面臨肺癌最高危險并且應當優先進行CT篩查的那些個體。如果實施CT測試,則可以測量一個或多個生物標記的生物標記水平(如通過血清或血漿樣品的適配體測定來確定),并且可以聯合額外的生物醫學信息來評價診斷評分(如通過CT測試確定腫瘤參數),以增強單獨的CT或生物標記測試的陽性預測值(PPV)。確定生物標記水平的“CT后”適配體組可以用于確定通過CT(或其他成像方式)觀察到的肺結節是惡性或良性的似然性。
本文所述的任何生物標記的檢測可以用于CT后測試。例如,生物標記測試可以顯著消除或降低單獨CT的假陽性測試數目。此外,生物標記檢測可以促進患者的治療。例如, 如果肺結節的大小小于5_,則生物標記測試的結果可以使患者在更早的時間從“觀察和等待”進展至活組織檢查;如果肺結節為5-9_,則生物標記測試可以排除對假陽性掃描使用活組織檢查或胸廓切開術;以及如果肺結節大于10_,則生物標記測試可以排除具有良性小結的這些患者亞群的手術。基于生物標記測試在一些患者中排除活組織檢查的需求是有益的,因為存在與小結活組織檢查相關的顯著發病率以及難以根據小結的位置獲得小結組織。相似地,在一些患者中排除手術的需要,如其小結實際上是良性的那些患者,會避免與手術相關的不必要風險和花費。
除了聯合CT篩查測試生物標記水平之外(如聯合在CT掃描上觀察到的肺結節的大小或其他特征評價生物標記水平),關于生物標記的信息還可以聯合其他類型的數據進行評價,特別是指示個體患有肺癌風險的數據(如患者臨床史、癥狀、癌癥家族史、諸如個體是否是吸煙者的風險因素和/或其他生物標記的狀況等)。這些不同數據可以通過自動化方法評價,如計算機程序/軟件,其可以在計算機或其他設備/裝置中實施。
任何所述生物標記還可以用于成像測試。例如,顯像劑可以與任何所述生物標記偶聯,這可以用于輔助肺癌診斷、監測疾病進展/緩解或轉移、監測疾病復發或者監測對治療的應答等。
生物標記和生物標記值的檢測和確定
本文所述的生物標記的生物標記值可以使用任何已知的分析方法來檢測。在一實施方案中,生物標記值使用捕獲試劑(capture reagent)檢測。如本文所用,“捕獲劑 (capture agent) ”或“捕獲試劑”指能夠特異性結合生物標記的分子。在許多實施方案中,捕獲試劑可以在溶液中暴露于生物標記,或者可以暴露于生物標記,同時該捕獲試劑固定在固體支持物上。在其他實施方案中,捕獲試劑含有與固體支持物上的第二特征反應的特征。在這些實施方案中,捕獲試劑可以在溶液中暴露于生物標記,然后該捕獲試劑上的特征可以聯合固體支持物上的第二特征來將所述生物標記固定在固體支持物上。捕獲試劑基于進行的分析類型加以選擇。捕獲試劑包括但不限于適配體、抗體、adnectin、錨蛋白、其他抗體模擬物(mimetic)及其他蛋白支架、自身抗體、嵌合物、小分子、F(ab’)2片段、 單鏈抗體片段、Fv片段、單鏈Fv片段、核酸、凝集素、配體-結合受體、affybodies、納米抗體(nanobodies)、印跡聚合物(imprinted polymer)、高親合性多聚體(avimer)、肽模擬物 (peptidomimetic)、激素受體、細胞因子受體及合成受體以及這些物質的修飾物和片段。
在一些實施方案中,生物標記值使用生物標記/捕獲試劑復合物來檢測。
在其他實施方案中,生物標記值得自生物標記/捕獲試劑復合物,并且例如作為生物標記/捕獲試劑相互作用之后的反應結果間接檢測,但是依賴于生物標記/捕獲試劑復合物的形成。
在一些實施方案中,生物標記值從生物學樣品中的生物學標記直接檢測。
在一實施方案中,生物標記使用多重形式檢測,這允許在生物學樣品中同時檢測兩個或更多個生物標記。在多重形式的一實施方案中,捕獲試劑直接或間接、共價或非共價地固定在固體支持物上分散的位置。在另一實施方案中,多重形式使用分離的固體支持物, 其中每個固體支持物具有與該固體支持物相關的獨特捕獲試劑,例如量子點。在另一實施方案中,單獨的裝置用于檢測生物學樣品中待檢測的多個生物標記的每一個。可以配置單獨的裝置以允許同時處理生物學樣品中的每個生物標記。例如,可以使用微量滴定板,由此該板中的每個孔用于獨特地分析生物學樣品中待檢測的多個生物標記之一。
在一個或多個前述實施方案中,可以使用熒光標簽(tag)來標記生物標記/捕獲復合物的組分以允許檢測生物標記值。在許多實施方案中,使用已知技術可以將熒光標記 (fluorescent label)與對本文所述的任何生物標記特異性的捕獲試劑偶聯,然后該突光標記可以用于檢測相應的生物標記值。合適的熒光標記包括稀土元素螯合物、熒光素及其衍生物、羅丹明及其衍生物、丹磺酰、別藻藍蛋白、PBXL-3、Qdot605、麗絲胺(Li ssamine)、藻紅蛋白、德克薩斯紅及其他這樣的化合物。
在一實施方案中,突光標記是突光染料分子。在一些實施方案中,突光染料分子包括至少一個取代的吲哚環(indolium ring)體系,其中吲哚環的3-碳上的取代基含有化學反應性基團或偶聯的物質。在一些實施方案中,染料分子包括AlexFluor分子,例如 AlexaFluor488> AlexaFluor532> AlexaFluor647> AlexaFluor680 或 AlexaFluorTOO。在其他實施方案中,染料分子包括第一類型和第二類型的染料分子,如兩種不同的AlexaFluor 分子。在其他實施方案中,染料分子包括第一類型和第二類型的染料分子,并且兩種染料分子具有不同的發射光譜。
熒光可以用與大范圍的測定形式相容的許多儀器測量。例如,已經設計了分光突光計來分析微量滴定板、顯微鏡載玻片、印刷陣列(printedarray)、小杯等。 參見 Principles of Fluorescence Spectroscopy, by J. R. Lakowicz, Springer Science+Business Media,Inc. , 2004;Bioluminescence &Chemiluminescence:Progress & Current Applications;Philip E. Stanley andLarry J. Kricka editors, World Scientific Publishing Company, January2002o
在一個或多個前述實施方案中,化學發光標簽可以任選地用于標記生物標記 /捕獲復合物的組分以允許檢測生物標記值。合適的化學發光材料包括任何草酰氯、 Rodamin6G、Ru (bipy) 32+> TMAE (四三(二甲基氨基)乙烯(tetrakis (dimethylamino) ethylene))、連苯三酌· (1,2,3_ 三輕基苯(I, 2, 3-trihydroxibenzene))、光澤精、過氧草酸酯(peroxyoxalate)、芳基草酸酯、Π丫唳酯(acridinium ester)、二氧雜環丁燒 (dioxetane)等。
仍然在其他實施方案中,檢測方法包括酶/底物組合,其產生對應于生物標記值的可檢測信號。通常,酶催化生色底物的化學改變,這種改變可以使用多種技術測量,包括分光光度法、熒光及化學發光。合適的酶包括例如螢光素酶、螢光素、蘋果酸脫氫酶、脲酶、 辣根過氧化物酶(HRPO)、堿性磷酸酶、β-半乳糖苷酶、葡糖淀粉酶、溶菌酶、葡萄糖氧化酶、半乳糖氧化酶及葡萄糖-6-磷酸脫氫酶、尿酸氧化酶、黃嘌呤氧化酶、乳過氧化物酶、微過氧化物酶等。
仍然在其他實施方案中,檢測方法可以是產生可測量信號的熒光、化學發光、放射性核素或酶/底物組合的組合。多種方式的信號在生物標記測定形式中可以具有獨特且有利的特征。
更特別地,本文所述的生物標記的生物標記值可以使用已知的分析方法來檢測, 包括單重適配體測定、多重適配體測定、單重或多重免疫測定、mRNA表達譜、miRNA表達譜、 質譜分析、組織學/細胞學方法等,這在下文中詳細地描述。
使用基于適配體的測定確定生物標記值
檢測和定量生物學樣品及其他樣品中生理學上有意義的分子的測定在科學研究和衛生保健領域是重要的工具。一類這樣的測定包括使用包含固定在固體支持物上的一個或多個適配體的微陣列。所述適配體各自能夠以高特異性方式和非常高的親和力結合靶分子。參見例如題為“核酸配體”的美國專利第5,475,096號,還參見例如美國專利第 6,242,246號、美國專利第6,458,543號和美國專利第6,503,715號,這些專利的題目均是 “核酸配體診斷生物芯片”。一旦使微陣列與樣品接觸,則適配體結合所述樣品中存在的它們各自的靶分子,從而允許確定對應于生物標記的生物標記值。
如本文所用,“適配體”指對靶分子具有特異性結合親和力的核酸。應當了解到親和相互作用的問題關鍵是程度;然而在本文中,適配體對其靶標的“特異性結合親和力”指適配體通常以與其結合測試樣品中其他組分的親和力相比更高程度的親和力結合其靶標。 “適配體”是一種類型或物種的核酸分子的一系列拷貝,其具有特定的核苷酸序列。適配體可以包含任何合適數目的核苷酸,包括任何數目的化學修飾的核苷酸。“適配體”指多于一個的這種系列的分子。不同的適配體可以具有相同或不同數目的核苷酸。適配體可以是DNA 或RNA或化學修飾的核酸,并且可以是單鏈、雙鏈的或者含有雙鏈區,以及可以包含高級結構。適配體還可以是光適配體(photoaptamer),其中該適配體中包含光反應性或化學反應性官能團以允許其與其對應靶標共價連接。本文公開的任何適配體方法可以包括使用特異性結合相同靶分子的兩種或更多種適配體。如下文進一步描述,適配體可以包含標簽。如果適配體包含標簽,則該適配體的所有拷貝不需要具有相同的標簽。此外,如果不同的適配體各自包含標簽,則這些不同的適配體可以具有相同的標簽或者不同的標簽。
適配體可以使用任何已知方法鑒定,包括SELEX方法。一旦鑒定,則可以根據任何已知方法制備或合成適配體,這些已知方法包括化學合成方法和酶促合成方法。
術語“SELEX”和“SELEX方法”在本文中可互換使用,通常指(I)與(2)的組合,其中(I)是選擇以期望的方式與靶分子相互作用的適配體,例如以高親和力結合蛋白,(2)是擴增那些選擇的核酸。SELEX方法可以用于鑒定對特定靶標或生物標記具有高親和力的適配體。
SELEX通常包括制備核酸的候選混合物;使所述候選混合物與期望的靶分子結合以形成親和復合物;分離所述親和復合物與未結合的候選核酸;使核酸與所述親和復合物分開并分離所述核酸;純化所述核酸;以及鑒定特異性適配體序列。所述方法可以包括多次循環以進一步精制所選適配體的親和力。所述方法可以包括在該方法的一個或多個點的擴增步驟。參見例如題為“核酸配體”的美國專利第5,475,096號。SELEX方法可以用于產生與適配體的靶標共價結合的適配體,以及與適配體的靶標非共價結合的適配體。參見例如題為“通過指數富集的核酸配體的系統進化Chemi-SELEX”的美國專利第5,705,337號。
SELEX方法可以用于鑒定含有修飾的核苷酸的高親和力適配體,所述修飾的核苷酸賦予該適配體改善的特征,例如改善的體內穩定性或改善的遞送特征。此類修飾的實例包括核糖和/或磷酸和/或堿基位置的化學取代。通過SELEX方法鑒定的含有修飾的核苷酸的適配體描述于題為“含有修飾的核苷酸的高親和力核酸配體”的美國專利第5,660,985 號,其描述了含有在嘧啶的5’-和2’-位置處經化學修飾的核苷酸衍生物的寡核苷酸。見上文,美國專利第5,580,737號描述了高特異性適配體,其含有用2’-氨基(2’-NH2)、2’-氟 (2’-F)和/或2’-0_甲基(2’-OMe)修飾的一個或多個核苷酸。還參見題為“SELEX和 PH0T0SELEX”的美國專利申請公開20090098549,其描述了具有擴展的物理和化學性質的核酸文庫及其在SELEX和photoSELEX中的用途。
SELEX還可以用于鑒定具有期望的解離速率(off-rate)特征的適配體。參見題為“產生具有改善的解離速率的適配體的方法”的美國專利申請公開20090004667,其描述了產生可以結合靶分子的適配體的改進SELEX方法。描述了產生與各自的靶分子具有較慢解離速率的適配體和光適配體的方法。所述方法包括使候選混合物與靶分子接觸;允許形成核酸-靶標復合物;以及進行緩慢解離速率富集過程,其中具有快解離速率的核酸-靶標復合物解離并不再形成,而具有慢解離速率的復合物會保持完整。此外,所述方法包括在產生候選核酸混合物中使用修飾的核苷酸,以產生具有改善的解離速率性能的適配體。
這種測定的變化使用包含光反應性官能團的適配體,這允許適配體與其靶分子共價結合或“光交聯”。參見例如題為“核酸配體診斷生物芯片”的美國專利第6,544,776號。 這些光反應性適配體也稱作光適配體。參見例如美國專利第5,763,177號、美國專利第 6,001,577號和美國專利第6,291,184號,所述專利的題目均是“通過指數富集的核酸配體的系統進化核酸配體的光選擇和溶液SELEX”;還參見例如題為“核酸配體的光選擇”的美國專利第6,458,539號。在使微陣列與樣品接觸并使光適配體具有結合其靶分子的機會之后,將該光適配體光激活并洗滌固體支持物以除去任何非特異性結合的分子。可以使用嚴格洗滌條件,因為結合光適配體的靶分子由于該光適配體上光激活的官能團所產生的共價鍵而通常未被除去。在這種方式中,測定允許檢測對應于測試樣品中的生物標記的生物標記值。
在這兩種測定形式中,適配體在與樣品接觸之前固定在固體支持物上。然而,在某些情況下,在與樣品接觸之前固定適配體也許無法提供最佳的測定。例如,預固定適配體可能導致適配體與靶分子在固體支持物表面上的無效混合,這可能導致漫長的反應時間及因此延長的溫育時間以允許適配體與其靶分子有效結合。此外,當光適配體用于測定并且取決于用作固體支持物的材料時,該固體支持物可能趨于分散或吸收用于實現光適配體與其靶分子之間的共價鍵形成的光。此外,根據所用的方法,結合適配體的靶分子的檢測可能不準確,因為固體支持物的表面也可能暴露于且受所用的任何標記劑的影響。最后,適配體固定在固體支持物上通常包括在適配體暴露于樣品之前的適配體制備步驟(即固定),這個制備步驟可能影響適配體的活性或功能性。
還描述了適配體測定,其允許適配體在溶液中捕獲其靶標,然后在檢測之前使用設計為除去適配體-靶標混合物中特定組分的分離步驟(參見題為“測試樣品的多重分析” 的美國專利申請公開20090042206)。所述適配體測定方法允許檢測和定量測試樣品中的非核酸靶標(如蛋白靶標),這通過檢 測和定量核酸(即適配體)進行。所述方法產生核酸替代物(surrogate)(即適配體)以檢測和定量非核酸靶標,由此允許包括擴增在內的許多核酸技術用于包括蛋白靶標在內的更大范圍的期望靶標。
可以構建適配體以促進從適配體生物標記復合物(或光適配體生物標記共價復合物)分離測定組分,以及允許分離適配體以進行檢測和/或定量。在一實施方案中,這些構建體可以包含適配體序列中可裂解或可釋放的元件。在其他實施方案中,可以在適配體中引入額外的官能性,例如標記的或可檢測的組分、間隔組分或者特異性結合標簽或固定元件。例如,適配體可以包含通過可裂解部分與適配體連接的標簽、標記、分隔標記與可裂解部分的間隔組分。在一實施方案中,可裂解元件是光可裂解接頭(linker)。光可裂解接頭可以連接至生物素部分和間隔區段,可以包含NHS基團以用于胺的衍生化,以及可以用于在適配體中弓I入生物素基團,從而允許適配體在測定方法中較晚地釋放。
用溶液中所有測定組分進行的均質測定在檢測信號之前不需要分離樣品與試劑。 這些方法是快速且易于使用的。這些方法基于分子捕獲或與其特異性靶標反應的結合試劑產生信號。對于肺癌,分子捕獲試劑是適配體或抗體等,特異性靶標是表20的肺癌生物標記。
在一實施方案中,一種信號產生方法利用由于熒光團-標記的捕獲試劑與其特異性生物標記靶標的相互作用而導致的各向異性信號改變。當標記的捕獲劑與其靶標反應時,增加的分子量導致附著于該復合物的熒光團的旋轉運動變得更慢,從而改變各向異性值。通過監測各向異性改變,結合事件可以用于定量測量溶液中的生物標記。其他方法包括熒光偏振測定、分子信標方法、時間分辨熒光猝滅法、化學發光、熒光共振能量轉移等。
可以用于檢測對應于生物學樣品中生物標記的生物標記值的基于溶液的示例性適配體測定包括如下步驟(a)通過使所述生物學樣品與適配體接觸來制備混合物,所述適配體包含第一標簽并具有對所述生物標記的特異性親和力,其中當所述樣品中存在所述生物標記時形成適配體親和復合物;(b)使所述混合物暴露于包含第一捕獲元件的第一固體支持物,并且允許所述第一標簽與所述第一捕獲元件結合;(c)除去未與所述第一固體支持物結合的混合物的任何組分;(d)使第二標簽附著于所述適配體親和復合物的生物標記組分;(e)從所述第一固體支持物釋放所述適配體親和復合物;(f)使釋放的適配體親和復合物暴露于包含第二捕獲元件的第二固體支持物,并且允許所述第二標簽與所述第二捕獲元件結合;(g)通過分離未復合的適配體與所述適配體親和復合物來從所述混合物除去任何未復合的適配體;(h)從固體支持物洗脫適配體;以及(i)通過檢測所述適配體親和復合物的適配體組分來檢測所述生物標記。
使用免疫測定確定生物標記值
免疫測定方法基于抗體與其對應靶標或分析物的反應,并且根據特定測定形式可以檢測樣品中的分析物。為了改進基于免疫反應性的測定方法的特異性和靈敏性,通常由于單克隆抗體的特異性表位識別而使用單克隆抗體。多克隆抗體由于其與單克隆抗體相比增加的靶標親和力而成功地用于各種免疫測定。免疫測定已經設計為用于大范圍生物學樣品基質。免疫測定形式已經設計為提供定性、半定量及定量結果。
定量結果通過使用已知濃度的待檢測的特定分析物產生的標準曲線來產生。將來自未知樣品的應答或信號在標準曲線上作圖,并確定該未知樣品中對應于靶標的量或值。
已經設計了許多免疫測定形式。ELISA或EIA可以定量檢測分析物。這種方法依賴于標記對分析物或抗體的附著,標記組分直接或者間接包括酶。ELISA測試可以設計為直接、間接、競爭性或者夾心檢測分析物。其他方法依賴于標記,如放射性同位素(I125)或熒光。其他技術包括例如凝集反應、濁度測定法、比濁法、蛋白印跡、免疫沉淀、免疫細胞化學、免疫組織化學、流式細胞術、Luminex測定等(參見 ImmunoAssay:A PracticalGuide, edited by Brian Law,published by Taylor & Francis, Ltd. , 2005edition)。
示例性測定形式包括酶聯免疫吸附測定(ELISA)、放射性免疫測定、熒光、化學發光以及熒光共振能量轉移(FRET)或時間分辨的-FRET(TR-FRET)免疫測定。檢測生物標記的方法的實例包括生物標記免疫沉淀及隨后允許辨別大小和肽水平的定量方法,如凝膠電泳、毛細管電泳、平面電色譜等。
檢測和/或定量可檢測標記或信號產生材料的方法取決于所述標記的性質。由合適的酶催化的反應產物(其中所述可檢測標記是酶,見上文)可以是但不限于熒光、發光或放射性的,或者它們可以吸收可見光或紫外光。適合于檢測這樣的可檢測標記的檢測儀的實例包括但不限于X光照片、放射性計數器、閃爍計數器、分光光度計、比色計、熒光計、發光計和光密度計。
可以通過允許適當準備、處理和分析反應的任何方式來進行任何檢測方法。這可以例如在多孔測定板(如96孔或者384孔)中進行,或者使用任何合適的陣列或者微陣列進行。可以人工或自動化制備各種試劑的儲液,使用能夠檢測可檢測標記的可商購的分析軟件、機器人技術和檢測儀器自動化進行所有隨后的移液、稀釋、混合、分配、洗滌、溫育、樣品讀取、數據收集和分析。
使用基因表達譜確定生物標記值
測量生物學樣品中的mRNA可以用作檢測該生物學樣品中相應的蛋白水平的替代。因此,本文所述的任何生物標記或生物標記的組還可以通過檢測適當的RNA來檢測。
mRNA表達水平通過逆轉錄定量聚合酶鏈式反應(RT-PCR及隨后的qPCR)測量。 RT-PCR用于從mRNA產生cDNA。cDNA可用于qPCR測定以隨DNA擴增過程的進展而產生熒光。通過與標準曲線比較,qPCR可以產生絕對測量度,如每細胞的mRNA拷貝數。RNA 印跡、微陣列、Invader測定以及與毛細管電泳組合的RT-PCR全部已經用于測量樣品中 mRNA 的表達水平(參見 Gene Expression Profiling:Methods and Protocols, Richard A. Shimkets, editor, Humana Press,2004)。
miRNA分子是小RNA,其不編碼但是可以調節基因表達。適合測量mRNA表達水平的任何方法均可以用于相應的miRNA。最近,許多實驗室已經研究了 miRNA作為疾病的生物標記的用途。許多疾病涉及廣泛的轉錄調節,并且毫不意外地發現miRNA可以作為生物標記。miRNA濃度與疾病之間的關聯通常不如蛋白水平與疾病之間的關聯明確,但是miRNA 生物標記值可能是重要的。當然,隨著疾病期間任何RNA的不同表達,開發體外診斷產品所面臨的問題包括需要miRNA在患病細胞中存活及易于提取以進行分析,或者miRNA被釋放進入血液或其他基質中,在此它們必須存活足夠長的時間以進行測量。蛋白生物標記具有相似的要求,盡管許多潛在的蛋白生物標記以旁分泌方式在疾病期間于病變和功能部位有意地分泌。許多潛在的蛋白生物標記設計為在合成那些蛋白的細胞外起作用。
使用體內分子成像技術檢測分子標記
任何所述的生物標記(見表20)還可以用于分子成像測試。例如,顯像劑可以與任何所述生物標記偶聯,這可以用于輔助肺癌診斷、監測疾病進展/緩解或轉移、監測疾病復發或者監測對治療的應答等。
體內成像技術提供了用于確定個體體內特定疾病狀態的非侵入性方法。例如,身體的所有部分或者甚至整個身體均可以作為三維圖像觀察,從而提供關于身體內形態學和結構的有價值的信息。這樣的技術可以與檢測本文所述的生物標記組合以提供關于個體的癌癥狀態,特別是肺癌狀態的信息。
體內分子成像技術的應用由于該技術的各種進展而得以擴展。這些進展包括新造影劑或標記的開發,如放射性標記和/或熒光標記,其可以在身體內提供強信號;以及開發更強的新成像技術,其可以從身體外部檢測和分析這些信號,并且具有足夠的靈敏性和精確度以提供有用的信息。造影劑可以在適當的成像系統中觀察,從而提供所述造影劑所處位置的身體部分或多個部分的圖像。造影劑可以與捕獲試劑結合或締合,例如適配體或抗體,例如和/或結合或締合肽或蛋白,或寡核苷酸(例如為了檢測基因表達),或者復合物, 所述復合物含有任何這些物質及一種或多種大分子和/或其他顆粒形式。
造影劑還是可以用于成像的放射性原子的特征。對于閃爍照相研究合適的放射性原子包括锝-99m或碘-123。其他易于檢測的部分包括例如磁共振成像(MRI)的自旋標記物’如碘-123、碘-131、銦-111、氟-19、碳-13、氮-15、氧-17、釓、錳或鐵。這樣的標記為本領域熟知,并且可以由本領域技術人員容易地選擇。
標準成像技術包括但不限于磁共振成像、計算機斷層掃描、正電子發射斷層掃描 (PET)、單光子發射計算機斷層掃描(SPECT)等。對于診斷性體內成像,可用的檢測設備的類型是選擇指定造影劑的主要因素,如用于靶標(蛋白、mRNA等)的指定放射性核素和特定生物標記。所選的放射性核素通常具有通過指定類型設備可檢測的衰變類型。此外,當選擇用于體內診斷的放射性核素時,其半衰期應當足夠長以允許在靶組織最大吸收時進行檢測,但是也應當足夠短,以最小化宿主所受的有害輻射。
示例性成像技術包括但不限于PET和SPECT,這是將放射性核素全身 (synthetically)或局部地給予個體的成像技術。隨后,隨時間測量放射性示蹤劑的吸收, 并用于獲得關于靶向的組織與生物標記的信息。由于所用的特定同位素的高能(Y-射線) 發射以及用于檢測它們的設備的靈敏性和完善(sophistication),可以從身體外部推導出放射性的二維分布。
PET中常用的正電子發射核素包括例如碳-11、氮-13、氧-15和氟-18。通過電子捕獲和/或Y-發射衰變的同位素用于SPECT中,并且包括例如碘-123和锝-99m。用锝-99m標記氨基酸的示例性方法是在螯合前體的存在下還原高锝酸鹽離子以形成不穩定的锝-99m-前體配合物,其又與雙官能修飾的趨化肽的金屬結合基團反應,形成锝-99m-趨化肽偶聯物。
抗體常用于這樣的體內成像診斷方法。用于體內診斷的抗體的制備和用途為本領域熟知。特異性結合表20的任何生物標記的標記的抗體可以注入疑似患有某種類型癌癥 (如肺癌)的個體,并根據所用的特定生物標記的可檢測性來診斷或評價所述個體的疾病狀態。如上文所述,使用的標記根據所用的成像形式來選擇。標記的定位允許確定癌癥的擴散。器官或組織內標記的量還允許確定該器官或組織中癌癥的存在與否。
相似地,適配體可以用于這樣的體內成像診斷方法。例如,用于鑒定表20所述的特定生物標記的適配體(并且因此特異性結合該特定生物標記)可以適當地進行標記并注入疑似患有肺癌的個體,并根據該特定生物標記的可檢測性來診斷或評價所述個體的肺癌狀態。如上文所述,使用的標記根據所用的成像形式來選擇。標記的定位允許確定癌癥的擴散。器官或組織內標記的量還允許確定該器官或組織中癌癥的存在與否。適配體定向的顯像劑與其他顯像劑相比可以具有關于組織滲透、組織分布、動力學、消除、效力和選擇性方面獨特且有利的特征。
這樣的技術還可以任選地用標記的寡核苷酸進行,例如通過用反義寡核苷酸成像檢測基因表達。這些方法用于原位雜交,例如用熒光分子或放射性核素作為標記。檢測基因表達的其他方法包括例如檢測報道基因的活性。
另一種常見類型的成像技術是光學成像,其中對象體內的熒光信號通過所述對象體外的光學設備檢測。這些信號可以是由于實際的熒光和/或生物發光。光學檢測設備靈敏性的改進增加了光學成像在體內診斷測定中的應用。
體內分子生物標記成像的用途日益增加,包括臨床試驗,例如在新癌癥療法臨床試驗中更快速地測量臨床效力,和/或避免對諸如多發性硬化的那些疾病的長期安慰劑治療,其中這樣的長期治療可能被認為是存在倫理問題。
關于其他技術的綜述,參見N. Blow, Nature Methods, 6,465-469,2009。
使用組織學/細胞學方法確定生物標記值
對于肺癌的評價,許多組織樣品可用于組織學或細胞學方法。樣品選擇取決于原發腫瘤位置和轉移的部位。例如,支氣管內和經支氣管活組織檢查、細針抽吸、切割針及核心活組織檢查可以用于組織學。支氣管洗滌(washing)和刷檢(brushing)、胸膜抽吸以及痰可以用于細胞學。雖然細胞學分析仍用于診斷肺癌,但是已知組織學方法提供癌癥檢測更好的靈敏性。本文鑒定的在肺癌個體中表現出上調的任何生物標記(見表19)可以用于染色組織學樣本作為疾病的指征。
在一實施方案中,對于相應的生物標記是特異性的一種或多種捕獲試劑用于肺細胞樣品的細胞學評價,并且可以包括如下一個或多個方面收集細胞樣品、固定細胞樣品、 脫水、透明(clearing)、將細胞樣品固定在顯微鏡載玻片上、使細胞樣品透化、分析物檢索處理、染色、脫色、洗滌、封閉以及在緩沖溶液中與一種或多種捕獲試劑反應。在另一實施方案中,細胞樣品從細胞塊(cell block)中產生。
在另一實施方案中,對于相應的生物標記是特異性的一種或多種捕獲試劑用于肺組織樣品的組織學評價,并且可以包括如下一個或多個方面收集組織樣本、固定組織樣品、脫水、透明、將組織樣品固定在顯微鏡載玻片上、使組織樣品透化、分析物檢索處理、染色、脫色、洗滌、封閉、再水合以及在緩沖溶液中與一種或多種捕獲試劑反應。在另一實施方案中,固定和脫水用冷凍代替。
在另一實施方案中,使對于相應的生物標記是特異性的一種或多種適配體與組織學或細胞學樣品反應,并且可以作為核酸擴增方法中的核酸靶標。合適的核酸擴增方法包括例如PCR、q-β復制酶、滾環擴增、鏈置換、解旋酶依賴性擴增、環介導的等溫擴增、連接酶鏈式反應以及限制和環化輔助的滾環擴增。
在一實施方案中,將對于用于組織學或細胞學評價的相應生物標記是特異性的一種或多種捕獲試劑在緩沖溶液中混合,所述緩沖溶液可以包含任何如下成分封閉材料、競爭劑、去污劑、穩定劑、載體核酸、聚陰離子材料等。
“細胞學方案”通常包括樣品收集、樣品固定(fixation)、樣品固定 (immobilization)和染色。“細胞制備”可以包括樣品收集后的一些處理步驟,包括使用一種或多種慢解離速率的適配體來染色制備的細胞。
樣品收集可以包括直接將樣品置于未處理的轉運容器中,將樣品置于含有一些類型介質的轉運容器中,或者將樣品直接置于玻片上(固定)而不進行任何處理或固定。
樣品固定可以通過將一部分收集的樣本涂在用聚賴氨酸、明膠或硅烷處理的載玻片上而改進。玻片可以通過在玻片上涂有薄且均勻的細胞層而制備。通常采取小心操作以使最小化機械扭轉和干燥假象。液體樣本可以通過細胞塊方法處理。或者,液體樣本可以與固定溶液在室溫下1:1混合約10分鐘。
細胞塊可以從剩余的積液、痰、尿液沉淀、胃腸液、細胞刮取物或細針抽吸物中制備。通過離心或膜過濾濃縮或壓實細胞。已經開發了許多細胞塊制備方法。代表性方法包括固定的沉淀、細菌瓊脂或膜過濾方法。在固定的沉淀方法中,將細胞沉淀與諸如鮑音液 (Bouins)、苦味酸或緩沖的福爾馬林的固定劑混合,然后將混合物離心以沉淀固定的細胞。 除去上清,盡可能完全地干燥細胞團塊(pellet)。收集團塊并包在鏡頭紙中,然后置于組織盒(tissue cassette)中。將組織盒置于含其他固定劑的罐子中,作為組織樣品進行處理。 瓊脂方法與上述方法非常相似,只是取出團塊并在紙巾上干燥,然后切成兩半。將切面置于載玻片上一滴熔化的瓊脂中,然后將該團塊用瓊脂包被,保證瓊脂中無氣泡形成。使瓊脂變硬,然后除去任何過多的瓊脂。將其置于組織盒中,完成組織處理。或者,可以將團塊直接懸浮于在65° C的2%液體瓊脂中并離心樣品。使瓊脂細胞團塊在4° C下固化I小時。可以從離心管中取出固體瓊脂并切成兩半。將瓊脂包在濾紙中,然后置于組織盒中。從這點開始的處理與上述方法相同。在任何這些方法中可以用膜過濾代替離心。任何這些方法均可以用于產生“細胞塊樣品”。
細胞塊可以使用專門的樹脂制備,包括Lowicryl樹脂、LR White、LRGold、Unicryl 和MonoSt印。這些樹脂具有低粘度,并且可以在低溫下及用紫外(UV)光聚合。包埋方法依賴于在脫水期間逐漸冷卻樣品,將樣品轉移至樹脂以及于最終低溫下在合適UV波長處聚合細胞塊。
細胞塊切片可以用蘇木精-伊紅染色以進行細胞形態學檢查,而其他切片用于特異性標記檢查。
無論方法是細胞學方法或組織學方法,可以在進一步處理之前將樣品固定以防止樣品降解。這種方法稱作“固定”,并且描述了可以互換使用的許多材料和方法。基于待檢測的靶標和待分析的特定細胞/組織類型,根據經驗最佳地選擇樣品固定方案和試劑。樣品固定依賴于試劑,如乙醇、聚乙二醇、甲醇、福爾馬林或異丙醇。樣品應當盡可能在收集及附著在玻片上后很快固定。然而,選擇的固定劑可以在各種分子靶標中引入結構改變,這使得隨后更難以檢測。固定(fixation)和固定(immobilization)方法及其順序可以改變細胞的外觀,并且這些改變必須是由細胞學技術人員預期及認可的。固定劑可以導致某些類型細胞收縮,并且導致細胞質出現顆粒或網狀物。許多固定劑通過使細胞組分交聯而起作用。這可以破壞或改變特異性表位,產生新表位,導致分子締合以及降低膜通透性。福爾馬林固定是一種最常用的細胞學/組織學方法。福爾馬林在相鄰蛋白之間或在蛋白內形成甲基橋。沉淀或凝固也用于固定,乙醇常用于這種類型的固定。交聯與沉淀的組合也可以用于固定。牢固的固定方法在保留形態學信息方面是最佳的,而較弱的固定方法對于保留分子靶標方面是最佳的。
代表性固定劑是50%無水乙醇、2mM聚乙二醇(PEG)、1. 85%甲醛。這種制劑的變化包括乙醇(50%-95%)、甲醇(20%-50%)以及僅福爾馬林(甲醛)。另一種常用的固定劑是 2%PEG1500、50%乙醇以及3%甲醇。將玻片在室溫下置于固定劑中約10-15分鐘,然后取出并干燥。一旦玻片被固定,可以用諸如PBS的緩沖溶液對其進行漂洗。
許多染料可以用于差異地突出和反差或“染色”細胞、亞細胞和組織特征或形態學結構。蘇木精(hematoylin)用于將核染色為藍色或黑色。橘黃G_6和天青伊紅(Eosin Azure)均將細胞質染色。橘黃G將含有角蛋白和糖原的細胞染成黃色。伊紅Y用于將核仁、纖毛、紅細胞和表面上皮扁平細胞染色。羅曼諾夫斯基(Romanowsky)染色用于空氣干燥的玻片,并且可以用于增強復型及區分細胞外與細胞質內材料。
染色方法可以包括增加細胞對染色的通透性的處理。用去污劑處理細胞可以用于增加通透性。為了增加細胞和組織通透性,可以將固定的樣品用溶劑、皂苷類或者非離子型去污劑進一步處理。酶促消化還可以改進組織樣品中特異性靶標的可接近性。
染色后,使用漸增的醇濃度進行連續醇漂洗將樣品脫水。最終的洗滌使用二甲苯或諸如柑桔萜的二甲苯取代物,其具有接近在載玻片上應用的蓋玻片的折射率。這個最后的步驟稱作透明。一旦使樣品脫水及透明,應用封固劑。所選的封固劑具有接近玻璃的折射率,并且能夠使蓋玻片與載玻片粘合。其還抑制細胞樣品另外的干燥、收縮或褪色。
無論使用的染色或處理,對肺細胞學樣本的最后評價通過一些類型顯微鏡檢查進行以允許通過肉眼觀察形態學并確定標記的存在與否。示例性顯微鏡檢查方法包括明視野顯微鏡、相差顯微鏡、突光顯微鏡和微分干涉相差顯微鏡方法。
如果在檢查后需要對樣品進行次級測試,則可以除去蓋玻片并對載玻片進行脫色。脫色包括使用用于染色該載玻片的最初未加入染料的原始溶劑系統,并以與原始染色程序相反順序進行。脫色還可以通過將該載玻片浸泡在酸醇中直至細胞無色來完成。一旦無色,則將載玻片用水浴充分漂洗并進行第二染色程序。
此外,通過使用特異性分子試劑,如抗體或者核酸探針或適配體,可以將特異性分子區分與細胞形態學分析組合。這改進了診斷細胞學的精確性。顯微切割可以用于分離細胞的子集以進行另外的評價,特別是用于遺傳學評價異常染色體、基因表達或突變。
制備用于組織學評價的組織樣品包括固定、脫水、浸潤(infiltration)、包埋和切片。用于組織學的固定試劑與用于細胞學的固定試劑非常相似或相同,并且在以諸如個體蛋白的分子為代價的情況中具有相同的保持形態學特征的問題。如果組織樣品不進行固定和脫水而是代之以冷凍然后在冷凍時切片可以節省時間。這是更溫和的處理程序,并且可以保留更多的個體標記。然而,冷凍對于組織樣品的長期保存不可接受,因為由于冰晶體的引入引起亞細胞信息喪失。冷凍組織樣品中的冰也妨礙切片過程產生極薄的切片,并且因此可以喪失一些顯微鏡分辨力和亞細胞結構的圖像。除了福爾馬林固定之外,四氧化鋨也用于固定和染色磷脂(膜)。
組織的脫水是通過用漸增濃度的醇連續洗滌來完成。透明使用可以與醇和包埋材料混溶的材料,并且包括從50:50醇澄清試劑開始至100%澄清試劑(二甲苯或二甲苯取代物)的逐步處理過程。浸潤包括將組織與液體形式的包埋劑(溫熱的蠟,硝化纖維溶液) 一起溫育,首先是50:50包埋劑澄清劑,隨后是100%包埋劑。包埋通過將組織置于模具或盒中并充填熔化的包埋劑如蠟、瓊脂或明膠來完成。使包埋劑硬化。然后將硬化的組織樣品切成薄切片以用于染色和隨后的檢查。
在染色之前,將組織切片脫蠟并再水合。用二甲苯使切片脫蠟,可以更換一次或多次二甲苯,并通過在遞減濃度的醇中連續洗滌而再水合。在脫蠟之前,可以將組織切片于約 80° C下在載玻片上熱固定約20分鐘。
激光捕獲顯微切割允許從組織切片分離細胞的子集以進行進一步分析。
在細胞學中,為了增強顯微特征的觀察,可以將組織切片或薄片用各種染色方法染色。許多可商購的染色方法可以用于增強或鑒定特定的特征。
為了進一步增加分子試劑與細胞學/組織學樣品的相 互作用,已經開發了許多 “分析物檢索(analyte retrieval) ”技術。第一種這樣的技術使用高溫加熱固定的樣品。 這種方法也稱作熱誘導的表位檢索或HIER。已經使用了許多加熱技術,包括蒸汽加熱、微波、高壓蒸汽、水浴以及加壓蒸煮或這些加熱方法的組合。分析物檢索溶液包括例如水、檸檬酸鹽和普通鹽水緩沖液。分析物檢索的關鍵是高溫的時間,但是較低溫度進行較長時間也已經成功使用。分析物檢索的另一關鍵是加熱溶液的pH。據發現低pH提供最佳的免疫染色,但是也產生經常需要使用第二組織切片作為陰性對照的背景。無論緩沖液組成,使用高PH溶液通常獲得最一致的益處(增加免疫染色而不增加背景)。對特異性靶標的分析物檢索方法根據經驗對使用加熱的靶標、時間、PH和緩沖液組成的變量加以優化。使用微波分析物檢索方法允許用抗體試劑順序染色不同的靶標。但是在染色步驟之間獲得抗體與酶復合物所需的時間也證實使細胞膜分析物降解。微波加熱方法也改進原位雜交方法。
為了開始分析物檢索過程,首先將切片脫蠟并水合。然后將玻片置于平皿或罐子中的IOmM檸檬酸鈉緩沖液pH6. O中。代表性程序使用1100W微波,以100%功率對玻片微波處理2分鐘,隨后在確保玻片保留覆蓋于液體中之后使用20%功率對玻片微波處理18分鐘。然后使玻片在敞口容器中冷卻,隨后用蒸餾水漂洗。HIER可以與酶促消化組合使用以改進靶標對免疫化學試劑的反應性。
一種這樣的酶促消化方案使用蛋白酶K。201^/1111濃度的蛋白酶1(在5011111^8 堿、ImM EDTA、0. 5%Triton X_100、pH8. O緩沖液中制備。該方法首先包括將切片在更換2次的二甲苯中脫蠟,每次5分鐘。然后將樣品在更換2次的100%乙醇中水合,每次3分鐘,在 95%和80%乙醇中水合,每次I分鐘,然后在蒸餾水中漂洗。將切片用蛋白酶K工作溶液覆蓋,于37° C下在加濕室中溫育10-20分鐘(最佳溫育時間可以根據組織類型和固定程度而變化)。將切片在室溫下冷卻10分鐘,然后在PBS吐溫(Tween) 20中漂洗2次2分鐘。 如果需要,可以將切片封閉以消除來自內源化合物和酶的潛在干擾。然后將切片用在一抗稀釋緩沖液中適當稀釋的一抗在室溫下溫育I小時或者在4° C下溫育過夜。然后將該切片用PBS吐溫20漂洗2次2分鐘。如果需要特定的應用,可以進行另外的封閉,隨后用PBS 吐溫20再漂洗3次2分鐘,然后最后完成免疫染色方案。
在室溫下用1%SDS簡單處理也已經證實改進了免疫組織化學染色。分析物檢索方法已經應用于玻片固定切片(slide mounted section)以及自由浮動切片(free floating section)。另一處理選擇是將玻片置于pH6. O的含有檸檬酸和O.1諾納德(Nonident) P40 的罐子中,并加熱至95° C。然后將該玻片用諸如PBS的緩沖溶液洗滌。
對于組織的免疫學染色,可以通過將切片浸入諸如血清或脫脂奶粉的蛋白溶液中來封閉抗體與組織蛋白的非特異性結合。
封閉反應可包括需要降低內源生物素的水平;消除內源電荷作用;失活內源核酸酶;和/或失活內源酶如過氧化物酶和堿性磷酸酶。內源核酸酶可以通過以下方式失活 用蛋白酶K降解;熱處理;使用螯合劑,如EDTA或EGTA ;引入載體DNA或RNA ;用離液劑處理,如尿素、硫脲、鹽酸胍、硫氰酸胍、高氯酸鋰等或焦碳酸二乙酯。堿性磷酸酶可以通過用 O.1NHCl在室溫下處理5分鐘或用ImM左旋咪唑處理而失活。過氧化物酶活性可以通過用 O. 03%過氧化氫處理來消除。內源生物素可以通過將玻片或切片在室溫下浸入抗生物素蛋白(鏈霉抗生物素蛋白,可以取代中性鏈親和素(neutravidin))溶液中至少15分鐘來封閉。然后將玻片或切片在緩沖液中洗滌至少10分鐘。這個步驟可以重復至少3次。然后將玻片或切片浸入生物素溶液中10分鐘。這個步驟可以重復至少3次,每次使用新鮮的生物素溶液。重復緩沖液洗滌程序。應當減少封閉方案以防止破壞所關注的細胞或組織結構或者靶標或多個靶標,但是可以組合一種或多種這樣的方案以“封閉”玻片或切片, 然后與一種或多種慢解離速率適配體反應。參見BasicMedical Histology: the Biology of Cells, Tissues and Organs, authored byRichard G. Kessel,Oxford University Press, 1998。
使用質譜方法確定生物標記值
許多質譜儀的配制(configuration)可以用于檢測生物標記值。一些類型的質譜儀可以獲得或可以用各種配制生產。通常,質譜儀具有如下主要部件樣品入口、離子源、質量分析儀、檢測儀、真空系統以及設備控制系統和數據系統。樣品入口、離子源和質量分析儀的差異通常限定設備的類型及其能力。例如,入口可以是毛細管柱液體層析源,或者可以是直接探針或鏡臺(stage)如用于基質輔助激光解吸電離中。常用的離子源是例如電噴射,包括納米噴射(nanospray)和微噴射(microspray);或者基質輔助激光解吸電離。常用的質量分析儀包括四極濾質器(quadrupole mass filter)、離子阱質量分析儀和飛行時間質量分析儀。其他質譜方法為本領域熟知(參見Burlingame et al. Anal. Chem. 70:647R-716R(1998);Kinter and Sherman. Protein sequencing and identification using tandem mass spectrometry. NewYork:Wiley-1nterscience(2000) )。
蛋白生物標記和生物標記值可以通過任何如下方式檢測和測量電噴射離子化質譜(ES1-MS)、ES1-MS/MS、ES1-MS/(MS) η、基質輔助激光解吸離子化飛行時間質譜 (MALD1-T0F-MS)、表面增強激光解吸/離子化飛行時間質譜分析(SELD1-T0F-MS)、硅表面解吸/離子化(DIOS)、二次離子質譜(SIMS)、四極飛行時間(Q-TOF)、稱作ultraflex III T0F/T0F的串聯式飛行時間(T0F/T0F)技術、大氣壓化學離子化質譜(APC1-MS)、APC1-MS/ MS、APC1-(MS)n、大氣壓光電離質譜(APP1-MS)、APP1-MS/MS 和 APP1-(MS)N、四極質譜、傅里葉變換質譜(FTMS)、定量質譜以及離子阱質譜。
樣品制備策略用于在對蛋白生物標記進行質譜表征及確定生物標記值之前標記和富集樣品。標記方法包括但不限于用于相對和絕對定量的等量異位標簽(iTRAQ)和在細胞培養中用氨基酸穩定同位素標記(SILAC)。在質譜分析之前用于選擇性富集候選生物標記蛋白樣品的捕獲試劑包括但不限于適配體、抗體、核酸探針、嵌合物、小分子、F(ab’)2片段、單鏈抗體片段、Fv片段、單鏈Fv片段、核酸、凝集素、配體-結合受體、affybodies、納米抗體、錨蛋白、結構域抗體、可變抗體支架(例如雙抗體等)印刷的聚合物、高親合性多聚體、肽模擬物、擬肽、肽核酸、蘇糖核酸、激素受體、細胞因子受體及合成的受體以及這些物質的修飾和片段。
前述測定允許檢測可用于診斷肺癌的方法中的生物標記值,其中所述方法包括在來自個體的生物學樣品中檢測至少N個生物標記值,所述至少N個生物標記值每個對應于選自表18、20或21提供的生物標記的組的生物標記,其中如下文詳述,利用生物標記值的分類指示所述個體是否患有肺癌。雖然某些所述肺癌生物標記可以單獨用于檢測和診斷肺癌,但是本文所述的方法還用于分組肺癌生物標記的多個子集,其各自用作三個或更多個生物標記的組。因此,本申請的各個實施方案提供了包含N個生物標記的組合,其中N是至少三個生物標記。在其他實施方案中,N選自2-86個生物標記中的任意數。應當理解N可以選自任何上述范圍以及相似但更高級范圍中的任意數。根據本文所述的任何方法,可以單獨檢測和分類生物標記值,或者可以共同檢測和分類生物標記值,例如以多重測定形式。
在另一方面,本發明提供了檢測肺癌不存在的方法,所述方法包括在來自個體的生物學樣品中檢測至少N個生物標記值,所述至少N個生物標記值每個對應于選自表18、20 或21提供的生物標記的組的生物標記,其中如下文詳述,生物標記值的分類指示所述個體中不存在肺癌。雖然某些所述肺癌生物標記可以單獨用于檢測和診斷不存在肺癌,但是本文所述的方法還用于分組肺癌生物標記的多個子集,其各自用作三個或更多個生物標記的組。因此,本申請的各個實施方案提供了包含N個生物標記的組合,其中N是至少三個生物標記。在其他實施方案中,N選自2-86個生物標記中的任意數。應當理解N可以選自任何上述范圍以及相似但更高級范圍中的任意數。根據本文所述的任何方法,可以單獨檢測和分類生物標記值,或者可以共同檢測和分類生物標記值,例如以多重測定形式。
生物標記分類及疾病評分計算
給定診斷測試的生物標記“特征”含有標記的集合,每個標記在所關注群體中具有不同水平。在此方面,不同水平可以指針對兩個或更多個組中個體的標記水平的不同平均值(mean),或者兩個或更多個組中的不同的方差,或者這兩者的組合。對于最簡單形式的診斷測試,這些標記可以用于將來自個體的未知樣品分配到兩組中的一組中,疾病組或非疾病組。將樣品分配于兩個或更多個組中的一組稱為分類,用于實現這種分配的程序稱為分類器或分類方法。分類方法也可以稱為評分方法。有許多分類方法可以用于從生物標記值的集合構建診斷分類器。通常,分類方法最容易用監督學習技術進行,其中用獲得自希望區分的兩個(或更多個,對于多個分類狀態)不同組內的個體的樣品收集數據集合。因為每個樣品所屬的類別(組或群體)事先對于每個樣品均是已知的,所以可以訓練分類方法以獲得期望的分類應答。還可以使用無監督學習技術來產生診斷分類器。
開發診斷分類器的常用方法包括決策樹;bagging+boosting+forests ;基于規則推論的學習(rule inference based learning) ;Parzen 窗方法(ParzenWindows); 線性模型;邏輯;神經網絡方法;無監督聚類;K-means ;分級上升/下降(hierarchicalascending/descending);半監督學習;原型方法;近鄰取樣(nearest neighbor);核密度估計(kernel density estimation);支持向量機(support vector machine);隱馬爾可夫模型(hidden Markov model);玻爾茲曼學習(Boltzmann Learning);并且分類器可以簡單組合或者以最小化特定目標函數的方式組合。綜述參見例如Pattern Classification, R. O. Duda, etal. , editors, John ffiley&Sons, 2nd edition, 2001 ;還參見 The Elements ofStatistical Learning-Data Mining,Inference, and Prediction, T. Hastie, et al. , editors, Springer Science+Business Media, LLC, 2nd edition, 2009 ;它們均整體援引加入本文。
為了用監督學習技術產生分類器,獲得稱為訓練數據的樣品集合。在診斷測試的情況下,訓練數據包括來自未知樣品稍后會被分配的不同組(類別)的樣品。例如,收集自對照群體的個體和特定疾病群體的個體的樣品可以組成訓練數據以開發可以分類未知樣品(或者,更特別地,樣品所來自的個體)為患有該疾病或無該疾病的分類器。從訓練數據開發分類器已知為訓練該分類器。分類器訓練的具體細節取決于監督學習技術的性質。作為示例,訓練樸素貝葉斯(na'ive Bayesian)分類器的實例在下文進行描述(參見例如 Pattern Classification, R. 0. Duda, et al. , editors, John Wiley & Sons, 2ndedition, 2001 ;還參見 The Elements of Statistical Learning-Data Mining, Inference,and Prediction,T.Hastie, et al. , editors,Springer Science+BusinessMedia, LLC, 2nd edition, 2009)。
因為通常在訓練集合中存在比樣品多得多的潛在生物標記值,所以必須小心避免過擬合。當統計學模型描述隨機誤差或噪聲而非潛在關系時發生過擬合。過擬合可以由各種方式避免,這包括例如限制開發分類器中使用的標記數目,假設標記應答互相獨立,限制采用的潛在統計學模型的復雜性,以及保證潛在統計學模型符合數據。
使用生物標記的集合開發診斷測試的說明性實例包括應用樸素貝葉斯分類器,這是一種基于貝葉斯(Bayes)定理的簡單或然性分類器,具有生物標記的嚴格獨立處理。每個生物標記由針對每種類別中測量的RFU值或IogRFU (相對熒光單位)值的類別依賴性概率密度函數(pdf)描述。一個類別中的標記的集合的共同pdf (joint pdf)假定為每個生物標記的個體類別依賴性Pdf的積。在此情況下訓練樸素貝葉斯分類器意味著分配參數 (“參數化”)以表征類別依賴性pdf。類別依賴性pdf的任何潛在模型均可以使用,但是模型應該通常符合在訓練集合中觀察的數據。
具體地,測量疾病類別中生物標記i的值Xi的類別依賴性概率寫作p(Xi|d),并且η觀察具有值、的η個標記的整體樸素貝葉斯概率寫作I iO = O Ρ(χ 1-/=Iφ■ wr其中各個Xi是以RFU或log RFU表示的測量的生物標記水平。對于未知的分類分配通過以下方法來促進對于相同測量值,計算與不患病(對照)的概率相比的具有測量的.X'的患病概率#44這些概率的比率通過應用貝葉斯定理從類別依賴Op(c I X) ρ(χ I C)(l — P(d)) ft pdf Tf #, BP-........................."pix......1......J)Pici).......................糾 P(d)細則i式説麵種_ 白勺發病率。對這一比率的兩邊取對數并從以上代入樸素貝葉斯類別依賴性概率,獲得
權利要求
1.一種診斷個體患有或不患有肺癌的方法,所述方法包括 在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表21的至少N個生物標記之一,其中基于所述生物標記值將所述個體分類為患有或不患有肺癌,并且其中N=2-86。
2.權利要求I的方法,其中檢測所述生物標記值包括進行體外測定。
3.權利要求2的方法,其中所述體外測定包括對應于每個所述生物標記的至少一種捕獲試劑,并且還包括從適配體、抗體和核酸探針的組選擇所述至少一種捕獲試劑。
4.權利要求3的方法,其中所述至少一種捕獲試劑為適配體。
5.權利要求2的方法,其中所述體外測定選自免疫測定、基于適配體的測定、組織學或細胞學測定以及mRNA表達水平測定。
6.權利要求I的方法,其中基于預定值或值的預定范圍來評價每個生物標記值。
7.權利要求I的方法,其中所述生物學樣品為肺組織,并且其中所述生物標記值源自所述肺組織的組織學或細胞學分析。
8.權利要求I的方法,其中所述生物學樣品選自全血、血漿和血清。
9.權利要求I的方法,其中所述生物學樣品為血清。
10.權利要求I的方法,其中所述個體為人。
11.權利要求I的方法,其中N=2-15。
12.權利要求I的方法,其中N=2-10。
13.權利要求I的方法,其中N=3-10。
14.權利要求I的方法,其中N=4-10。
15.權利要求I的方法,其中N=5-10。
16.權利要求I的方法,其中所述個體為吸煙者。
17.權利要求I的方法,其中所述個體具有肺結節。
18.權利要求I的方法,其中所述肺癌為非小細胞肺癌。
19.一種指示肺癌的似然性的計算機執行方法,所述方法包括 在計算機上檢索個體的生物標記信息,其中所述生物標記信息包括生物標記值,所述生物標記值每個對應于選自表21的至少N個生物標記之一; 用計算機對每個所述生物標記值進行分類;以及 基于多個分類指示所述個體患有肺癌的似然性,并且其中N=2-86。
20.權利要求19的方法,其中指示所述個體患有肺癌的似然性包括在計算機顯示器上顯示所述似然性。
21.一種指示肺癌的似然性的計算機程序產品,所述計算機程序產品包括 包含程序代碼的計算機可讀取介質,所述程序代碼可由計算裝置或系統的處理器執行,所述程序代碼包括 對歸因于來自個體的生物學樣品的數據進行檢索的代碼,其中所述數據包括生物標記值,所述生物標記值每個對應于選自表21的至少N個生物標記之一,其中所述生物標記在所述生物學樣品中檢測;以及 執行分類方法的代碼,所述分類方法指示作為所述生物標記值的函數的所述個體的肺疾病狀態;并且其中N=2-86。
22.權利要求21的計算機程序產品,其中所述分類方法使用概率密度函數。
23.權利要求22的計算機程序產品,其中所述分類方法使用兩種或更多種類別。
24.—種診斷個體患有或不患有肺癌的方法,所述方法包括 在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表20的至少N個生物標記之一,其中基于所述生物標記值將所述個體分類為患有或不患有肺癌,并且其中N=2-25。
25.權利要求24的方法,其中檢測所述生物標記值包括進行體外測定。
26.權利要求25的方法,其中所述體外測定包括對應于每個所述生物標記的至少一種捕獲試劑,并且還包括從適配體、抗體和核酸探針的組選擇所述至少一種捕獲試劑。
27.權利要求26的方法,其中所述至少一種捕獲試劑為適配體。
28.權利要求25的方法,其中所述體外測定選自免疫測定、基于適配體的測定、組織學或細胞學測定以及mRNA表達水平測定。
29.權利要求24的方法,其中基于預定值或值的預定范圍來評價每個生物標記值。
30.權利要求24的方法,其中所述生物學樣品為肺組織,并且其中所述生物標記值源自所述肺組織的組織學或細胞學分析。
31.權利要求24的方法,其中所述生物學樣品選自全血、血漿和血清。
32.權利要求24的方法,其中所述生物學樣品為血清。
33.權利要求24的方法,其中所述個體為人。
34.權利要求24的方法,其中N=2-15。
35.權利要求24的方法,其中N=2-10。
36.權利要求24的方法,其中N=3-10。
37.權利要求24的方法,其中N=4-10。
38.權利要求24的方法,其中N=5-10。
39.權利要求24的方法,其中所述個體為吸煙者。
40.權利要求24的方法,其中所述個體具有肺結節。
41.權利要求24的方法,其中所述肺癌為非小細胞肺癌。
42.一種指示肺癌的似然性的計算機執行方法,所述方法包括 在計算機上檢索個體的生物標記信息,其中所述生物標記信息包括生物標記值,所述生物標記值每個對應于選自表20的至少N個生物標記之一; 用計算機對每個所述生物標記值進行分類;以及 基于多個分類指示所述個體患有肺癌的似然性,并且其中N=2-25。
43.權利要求42的方法,其中指示所述個體患有肺癌的似然性包括在計算機顯示器上顯示所述似然性。
44.一種指示肺癌的似然性的計算機程序產品,所述計算機程序產品包括 包含程序代碼的計算機可讀取介質,所述程序代碼可由計算裝置或系統的處理器執行,所述程序代碼包括 對歸因于來自個體的生物學樣品的數據進行檢索的代碼,其中所述數據包括生物標記值,所述生物標記值每個對應于選自表20的至少N個生物標記之一,其中所述生物標記在所述生物學樣品中檢測;以及執行分類方法的代碼,所述分類方法指示作為所述生物標記值的函數的所述個體的肺疾病狀態;并且其中N=2-25。
45.權利要求44的計算機程序產品,其中所述分類方法使用概率密度函數。
46.權利要求44的計算機程序產品,其中所述分類方法使用兩種或更多種類別。
47.—種診斷個體患有或不患有肺癌的方法,所述方法包括 在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表18的至少N個生物標記之一,其中基于所述生物標記值將所述個體分類為患有或不患有肺癌,并且其中N=2_36。
48.權利要求47的方法,其中檢測所述生物標記值包括進行體外測定。
49.權利要求48的方法,其中所述體外測定包括對應于每個所述生物標記的至少一種捕獲試劑,并且還包括從適配體、抗體和核酸探針的組選擇所述至少一種捕獲試劑。
50.權利要求49的方法,其中所述至少一種捕獲試劑為適配體。
51.權利要求48的方法,其中所述體外測定選自免疫測定、基于適配體的測定、組織學或細胞學測定以及mRNA表達水平測定。
52.權利要求47的方法,其中基于預定值或值的預定范圍來評價每個生物標記值。
53.權利要求47的方法,其中所述生物學樣品為肺組織,并且其中所述生物標記值源自所述肺組織的組織學或細胞學分析。
54.權利要求47的方法,其中所述生物學樣品選自全血、血漿和血清。
55.權利要求47的方法,其中所述生物學樣品為血清。
56.權利要求47的方法,其中所述個體為人。
57.權利要求47的方法,其中N=2-15。
58.權利要求47的方法,其中N=2-10。
59.權利要求47的方法,其中N=3-10。
60.權利要求47的方法,其中N=4-10。
61.權利要求47的方法,其中N=5-10。
62.權利要求47的方法,其中所述個體為吸煙者。
63.權利要求47的方法,其中所述個體具有肺結節。
64.權利要求47的方法,其中所述肺癌為非小細胞肺癌。
65.一種指示肺癌的似然性的計算機執行方法,所述方法包括 在計算機上檢索個體的生物標記信息,其中所述生物標記信息包括生物標記值,所述生物標記值每個對應于選自表18的至少N個生物標記之一; 用計算機對每個所述生物標記值進行分類;以及 基于多個分類指示所述個體患有肺癌的似然性,并且其中N=2-36。
66.權利要求65的方法,其中指示所述個體患有肺癌的似然性包括在計算機顯示器上顯示所述似然性。
67.一種指示肺癌的似然性的計算機程序產品,所述計算機程序產品包括 包含程序代碼的計算機可讀取介質,所述程序代碼可由計算裝置或系統的處理器執行,所述程序代碼包括 對歸因于來自個體的生物學樣品的數據進行檢索的代碼,其中所述數據包括生物標記值,所述生物標記值每個對應于選自表18的至少N個生物標記之一,其中所述生物標記在所述生物學樣品中檢測;以及 執行分類方法的代碼,所述分類方法指示作為所述生物標記值的函數的所述個體的肺疾病狀態;并且其中N=2-36。
68.權利要求67的計算機程序產品,其中所述分類方法使用概率密度函數。
69.權利要求68的計算機程序產品,其中所述分類方法使用兩種或更多種類別。
70.—種確定關于個體中肺癌的信息的方法,所述方法包括 在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表21的至少N個生物標記之一,其中N=2-86 ;并且其中所述生物標記值提供關于所述個體中肺癌的信息。
71.權利要求70的方法,其中檢測所述生物標記值包括進行體外測定。
72.權利要求71的方法,其中所述體外測定包括對應于每個所述生物標記的至少一種捕獲試劑,并且還包括從適配體、抗體和核酸探針的組選擇所述至少一種捕獲試劑。
73.權利要求72的方法,其中所述至少一種捕獲試劑為適配體。
74.權利要求71的方法,其中所述體外測定選自免疫測定、基于適配體的測定、組織學或細胞學測定以及mRNA表達水平測定。
75.權利要求70的方法,其中基于預定值或值的預定范圍來評價每個生物標記值。
76.權利要求70的方法,其中所述生物學樣品為肺組織,并且其中所述生物標記值源自所述肺組織的組織學或細胞學分析。
77.權利要求70的方法,其中所述生物學樣品選自全血、血漿和血清。
78.權利要求70的方法,其中所述生物學樣品為血清。
79.權利要求70的方法,其中所述個體為人。
80.權利要求70的方法,其中N=2-15。
81.權利要求70的方法,其中N=2-10。
82.權利要求70的方法,其中N=3-10。
83.權利要求70的方法,其中N=4-10。
84.權利要求70的方法,其中N=5-10。
85.權利要求70的方法,其中所述個體為吸煙者。
86.權利要求70的方法,其中所述個體具有肺結節。
87.權利要求70的方法,其中所述肺癌為非小細胞肺癌。
88.權利要求70的方法,其中所述信息包括預后、癌癥分類、疾病風險的預測、或治療的選擇。
89.—種確定關于個體中肺癌的信息的方法,所述方法包括 在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表18的至少N個生物標記之一,其中N=2-36 ;并且其中所述生物標記值提供關于所述個體中肺癌的信息。
90.權利要求89的方法,其中檢測所述生物標記值包括進行體外測定。
91.權利要求90的方法,其中所述體外測定包括對應于每個所述生物標記的至少一種捕獲試劑,并且還包括從適配體、抗體和核酸探針的組選擇所述至少一種捕獲試劑。
92.權利要求91的方法,其中所述至少一種捕獲試劑為適配體。
93.權利要求90的方法,其中所述體外測定選自免疫測定、基于適配體的測定、組織學或細胞學測定以及mRNA表達水平測定。
94.權利要求89的方法,其中基于預定值或值的預定范圍來評價每個生物標記值。
95.權利要求89的方法,其中所述生物學樣品為肺組織,并且其中所述生物標記值源自所述肺組織的組織學或細胞學分析。
96.權利要求89的方法,其中所述生物學樣品選自全血、血漿和血清。
97.權利要求89的方法,其中所述生物學樣品為血清。
98.權利要求89的方法,其中所述個體為人。
99.權利要求89的方法,其中N=2-15。
100.權利要求89的方法,其中N=2-10。
101.權利要求89的方法,其中N=3-10。
102.權利要求89的方法,其中N=4-10。
103.權利要求89的方法,其中N=5-10。
104.權利要求89的方法,其中所述個體為吸煙者。
105.權利要求89的方法,其中所述個體具有肺結節。
106.權利要求89的方法,其中所述肺癌為非小細胞肺癌。
107.權利要求89的方法,其中所述信息包括預后、癌癥分類、疾病風險的預測、或治療的選擇。
108.一種確定關于個體中肺癌的信息的方法,所述方法包括 在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表20的至少N個生物標記之一,其中N=2-25 ;并且其中所述生物標記值提供關于所述個體中肺癌的信息。
109.權利要求108的方法,其中檢測所述生物標記值包括進行體外測定。
110.權利要求109的方法,其中所述體外測定包括對應于每個所述生物標記的至少一種捕獲試劑,并且還包括從適配體、抗體和核酸探針的組選擇所述至少一種捕獲試劑。
111.權利要求110的方法,其中所述至少一種捕獲試劑為適配體。
112.權利要求109的方法,其中所述體外測定選自免疫測定、基于適配體的測定、組織學或細胞學測定以及mRNA表達水平測定。
113.權利要求108的方法,其中基于預定值或值的預定范圍來評價每個生物標記值。
114.權利要求108的方法,其中所述生物學樣品為肺組織,并且其中所述生物標記值源自所述肺組織的組織學或細胞學分析。
115.權利要求108的方法,其中所述生物學樣品選自全血、血漿和血清。
116.權利要求108的方法,其中所述生物學樣品為血清。
117.權利要求108的方法,其中所述個體為人。
118.權利要求108的方法,其中N=2-15。
119.權利要求108的方法,其中N=2-10。
120.權利要求108的方法,其中N=3-10。
121.權利要求108的方法,其中N=4-10。
122.權利要求108的方法,其中N=5-10。
123.權利要求108的方法,其中所述個體為吸煙者。
124.權利要求108的方法,其中所述個體具有肺結節。
125.權利要求108的方法,其中所述肺癌為非小細胞肺癌。
126.權利要求108的方法,其中所述信息包括預后、癌癥分類、疾病風險的預測、或治療的選擇。
127.—種診斷個體患有或不患有肺癌的方法,所述方法包括 在來自個體的生物學樣品中檢測生物標記值,所述生物標記值每個對應于選自表21的至少N個生物標記之一,其中基于所述生物標記值將所述個體分類為患有或不患有肺癌,其中N=2-86,并且其中至少一個所述生物標記選自表20。
128.權利要求127的方法,其中選自表20的至少一個所述生物標記為MMP-12。
129.權利要求127的方法,其中檢測所述生物標記值包括進行體外測定。
130.權利要求129的方法,其中所述體外測定包括對應于每個所述生物標記的至少一種捕獲試劑,并且還包括從適配體、抗體和核酸探針的組選擇所述至少一種捕獲試劑。
131.權利要求130的方法,其中所述至少一種捕獲試劑為適配體。
132.權利要求129的方法,其中所述體外測定選自免疫測定、基于適配體的測定、組織學或細胞學測定以及mRNA表達水平測定。
133.權利要求127的方法,其中基于預定值或值的預定范圍來評價每個生物標記值。
134.權利要求127的方法,其中所述生物學樣品為肺組織,并且其中所述生物標記值源自所述肺組織的組織學或細胞學分析。
135.權利要求127的方法,其中所述生物學樣品選自全血、血漿和血清。
136.權利要求127的方法,其中所述生物學樣品為血清。
137.權利要求127的方法,其中所述個體為人。
138.權利要求127的方法,其中N=2-15。
139.權利要求127的方法,其中N=2-10。
140.權利要求127的方法,其中N=3-10。
141.權利要求127的方法,其中N=4-10。
142.權利要求127的方法,其中N=5-10。
143.權利要求127的方法,其中所述個體為吸煙者。
144.權利要求127的方法,其中所述個體具有肺結節。
145.權利要求127的方法,其中所述肺癌為非小細胞肺癌。
146.一種指示肺癌的似然性的計算機執行方法,所述方法包括 在計算機上檢索個體的生物標記信息,其中所述生物標記信息包括生物標記值,所述生物標記值每個對應于選自表21的至少N個生物標記之一;其中所述N個生物標記中的至少一個選自表20 用計算機對每個所述生物標記值進行分類;以及 基于多個分類指示所述個體患有肺癌的似然性,并且其中N=2-86。
147.權利要求146的方法,其中選自表20的所述生物標記中的至少一個為MMP-12。
148.權利要求146的方法,其中指示所述個體患有肺癌的似然性包括在計算機顯示器上顯示所述似然性。
149.一種指示肺癌的似然性的計算機程序產品,所述計算機程序產品包括 包含程序代碼的計算機可讀取介質,所述程序代碼可由計算裝置或系統的處理器執行,所述程序代碼包括 對歸因于來自個體的生物學樣品的數據進行檢索的代碼,其中所述數據包括生物標記值,所述生物標記值每個對應于選自表21的至少N個生物標記之一,其中所述N個生物標記中的至少一個選自表10,并且其中所述生物標記在所述生物學樣品中檢測;以及 執行分類方法的代碼,所述分類方法指示作為所述生物標記值的函數的所述個體的肺疾病狀態;并且其中N=2-86。
150.權利要求149的計算機程序產品,其中選自表20的所述生物標記中的至少一個為MMP-12。
151.權利要求149的計算機程序產品,其中所述分類方法使用概率密度函數。
152.權利要求149的計算機程序產品,其中所述分類方法使用兩種或更多種類別。
全文摘要
本發明包括用于檢測和診斷肺癌的生物標記、方法、裝置、試劑、系統和試劑盒。在一方面,本申請提供了生物標記,其可以單獨使用或以各種組合使用來診斷肺癌或允許區分診斷肺結節為良性或惡性的。在另一方面,本申請提供了診斷個體的肺癌的方法,其中所述方法包括在來自個體的生物學樣品中檢測至少一個生物標記值,所述至少一個生物標記值對應于選自表18、表20或表21提供的生物標記的組的至少一個生物標記,其中基于所述至少一個生物標記值,所述個體分類為患有肺癌,或者確定所述個體患有肺癌的似然性。
文檔編號G01N33/50GK102985819SQ201180033907
公開日2013年3月20日 申請日期2011年7月11日 優先權日2010年7月9日
發明者S·威爾科克斯, D·艾爾斯, N·亞尼奇, L·戈爾德, M·里爾-米恩, T·賈維斯 申請人:私募蛋白質體公司