用于腫瘤特征和標記物組鑒定,腫瘤分級的方法和用于癌的標記物組的制作方法
【專利說明】用于腫瘤特征和標記物組鑒定,腫瘤分級的方法和用于癌 的標記物組
[0001] 本申請是2010年4月16日提交的同名發明專利申請201080020971. 2的分案申 請。 【技術領域】
[0002] 本發明設及癌生物標記物領域,及它們的鑒定及使用方法。 【【背景技術】】
[0003] 對癌知道越多,可更有效對其進行治療。例如,多數癌患者進行手術。但是,對于 一些患者,用額外的治療可能得到額外的受益。目前無滿意的方法測定哪些患癌患者會受 益于手術后額外治療(例如化學治療)。可用于預后目的的特異于癌細胞的基因和蛋白的 鑒定被認為有幫助。鑒定與用于恢復的差預后關聯的腫瘤的運些基因/蛋白,如果僅通過 手術處理之后是一般標準的護理,稱為差預后生物標記。運些生物標記可用作有價值的工 具,其用于預測癌診斷后存活,鑒定復發的風險足夠低的患者,在缺失手術后化學治療和/ 或放射治療下或僅一般標準的手術后護理治療下患者可能同樣進展或更佳,及用于向導腫 瘤科醫生應如何處理癌,膜獲得最佳結果。
[0004] 類似地,有癌中表達的基因,其在藥物應答中起作用。當臨床決定時,其會具有對 于預測的藥物應答有用的信息。
[0005] 為了提供具有臨床目標的足夠的精確度的篩選工具,優選對于一類癌考慮多標記 物。單基因標記物不提供足夠的水平的特異性和靈敏度。例如,微陣列技術,其可同時測量 多于25, 000基因,提供發現多-標記物的有用的工具。
[0006] 本發明的目的是提供用于鑒定目標腫瘤特征的一組標記物及它們的鑒定及使用 方法。
[0007] 【發明概述】
[0008] 本發明在一實施方式中教導利用基因表達譜基于幾組基因來區別'良性'和'惡 性'腫瘤。如本文所用當說道預估及患者存活時,術語"良性腫瘤"指可能通過手術和僅一 般標準的護理治愈的,無需化學治療或放射治療(即便運是一般標準的護理的一部分)的 腫瘤。如本文所用,術語"惡性腫瘤"指不可能通過手術和僅一般標準的護理(包括化學治 療或放射治療)治愈的腫瘤。如本文所用,如果患者在手術后5或10年內不經歷的腫瘤復 發(或其轉移),則認為腫瘤被"治愈"。
[0009] 可能鑒定表達譜能區別'良性'和'惡性'腫瘤的幾組基因。現有技術公開5種該 基因表達信號組,且運些被開發為用于乳腺癌樣品的生物標記物。各基因表達信號組源于 一組乳腺腫瘤樣品。但是,運5種生物標記物組不可交叉-使用。特別是,現有技術所謂的 "乳腺癌生物標記物"尚未發現當用于另一組乳腺腫瘤樣品時可一致地預測預后。用于其他 類型的癌的生物標記物具有相同的問題。癌是高度異源性的。常對于一類癌,可發現幾個 亞型。之前公開的標記物組對于運些亞型不足夠通用。
[0010] 為了克服運些問題和數據組(樣品)利用度的限制,開發了新方法來發現及使用 組生物標記物。
[0011] 在本發明的一實施方式中,從公開的癌數據組產生隨機練習(training)數據組, 其中包括患者的基因表達譜和臨床信息,W發現穩健的生物標記物組。隨機練習數據組的 基因表達譜與患者存活狀態和篩選生物標記物相關。
[0012] 在本發明的一實施方式中提供了鑒定生物標記物的方法,所述方法包括:
[0013]-自目前可有用的數據組(腫瘤微陣列表征+癌患者的臨床信息)產生隨機練習 數據組
[0014]-針對隨機練習數據組篩選基因表達信號組,W鑒定對預后具有預測力的基因表 達信號組
[0015]-基于它們在基因表達信號組中出現的頻度排序基因,其具有良好的預測力(經 篩選,最后步驟)和由此建造生物標記物組
[0016]-組合使用利用用于預測的3~6個生物標記物組(即,樣品A被全部3個生物 標記物組預測為"良性腫瘤",我們會說樣品A是"良性腫瘤"(低-風險),如果全部說其 是"惡性"的,我們會說其是"惡性"(高-風險),另外,我們說其是中等-風險)
[0017]-使用其他獨立數據組確證標記物
[001引"基因表達信號"是基因(例如mRNA或蛋白)表達的有形的指示物。
[0019] 在本發明的實施方式中提供了用于鑒定腫瘤特征的方法,所述方法包括W下步 驟:
[0020] (1)獲得各預測目標特征的3個不同標記物組;
[0021] 似自腫瘤細胞提取基因表達信號;
[0022] (3)將提取的基因表達信號與3個不同標記物組關聯;
[0023] (4)根據W下順序將值分配給提取的基因表達信號:
[0024] (a)如果全部3個預測性基因表達信號組的關聯預測其具有關注的特征,將其指 定為惡性腫瘤;
[00巧]化)如果全部3個預測性基因表達信號組的關聯預測其缺乏關注的特征,將其指 定為良性腫瘤;
[0026](C)如果全部3個預測性基因表達信號組的關聯不提供相同的預測的臨床結果, 將所述腫瘤指定為"中等"。
[0027] 在一些情況中,關注的特征設及下列之一種或多種:轉移,發炎,細胞周期,免疫學 應答基因,藥物抗性基因,及多-藥物抗性基因。在一些情況中,腫瘤特征負責特定治療或 治療的組合。
[0028] 在一些情況中,腫瘤特征是導致差患者手術后存活的趨勢。
[0029] 在一些情況中,腫瘤特征與患者存活相關,且W上方法的步驟4包括根據W下順 序將值分配給提取的基因表達信號:
[0030] (a)如果全部3個預測性基因表達信號組的關聯預測其為惡性腫瘤,將其指定為 惡性腫瘤,并將建議超過一般標準的護理的更攻擊性的治療;
[0031] 化)如果全部3個預測性基因表達信號組的關聯預測其為良性腫瘤,不建議超過 護理標準的治療,且不建議手術后化學治療或放射治療;
[0032] (c)如果全部3個預測性基因表達信號組的關聯不提供相同的預后,將所述腫瘤 指定為"中等",并建議完全一般標準的護理治療,包括化學治療和/或放射治療。
[0033] 當癌具有多于一種亞型時,其可期望包括預先步驟:
[0034] (a)鑒定待檢查的腫瘤亞型;
[0035] 化)選擇特異于所述腫瘤亞型的標記物組。
[0036] 在一些情況中,目標腫瘤特征是腫瘤響應特定治療,例如化學治療劑或放射的趨 勢。在該情況中,基因表達信號在開發練習組的方法中與腫瘤藥物應答相關。需知,對于特 定藥物的"良性"腫瘤應答在治療后會低于-平均腫瘤存活,而"惡性"應答在治療后會高 于平均腫瘤存活。使用此方法,及依賴于可在用于開發練習組的原腫瘤和臨床數據中有用 的細節,開發不僅用于應答個體藥物或治療,而且治療的組合的標記物是可能的(其中原 始來源中有足夠的數據W允許此)。
[0037] 在本發明的實施方式中提供了測定上述方法中有用的類型的預測性基因表達信 號組的方法,包括W下步驟:
[003引(1)獲得對于目標癌的已知的腫瘤群的目標特征的基因表達信號信息和患者臨床 信息;
[0039] (2)將基因表達信號與有關目標特征的臨床患者信息關聯,W鑒定哪些基因具有 對于臨床結果的預測力;
[0040] (3)創建至少30個自步驟1的隨機練習數據組;
[0041] (4)比較步驟3的鑒定的基因表達信號與一列已知的在癌中活躍的基因;
[0042] (5)選擇對應于已知的癌基因列表上的那些的鑒定的基因表達信號;
[0043] (6)根據它們在生物學過程中的作用將選擇的鑒定的基因表達信號分組;
[0044] (7)自步驟6的選擇的基因表達信號組產生至少25個基因的隨機基因表達信號 組;
[0045] (8)將隨機基因表達信號組與步驟3的隨機練習數據組關聯;
[0046] (9)自對于步驟7的各基因表達信號組的關聯獲得用于存活篩選的P值;
[0047] (10)如果對于多于90 %的隨機練習數據組,用于基因表達信號組的P值小于 0. 05,則保持所述基因表達信號組;
[004引 (11)基于組中基因出現的頻度排序步驟10中保持的隨機基因表達信號組;
[0049] (12)選擇排在前面的至少26個基因作為潛在候選標記物;
[0050] (蝴重復步驟7~12,并產生至少26個基因的另一,獨立,排序組;
[0051] (14)比較自步驟12及步驟13的排在前面的基因;
[0052] (15)如果多于25個基因相同,將所述排在前面的基因保持為標記物組;
[005引 (16)重復兩次步驟7~15,W獲得3個不同標記物組;
[0054] 在本發明的一實施方式中提供了鑒定相比一般標準的護理需求或多或少攻擊性 的治療的患者的方法,所述方法包括:
[0055] ?"基因表達信號"是基因表達(例如mRNA)的有形的指示物(理論上,如果技 術上可行,會代之一測量蛋白表達?或者其他?)。
[0056] 1.個別研究包含腫瘤和臨床患者信息的信息源。將全部報道的細胞內的基因表達 信號與患者存活巧和10年)關聯,W便鑒定哪些基因在該個體信息源之內具有對于預后 的預測力。鑒定發現與患者存活顯著關聯的那些基因表達信號用于進一步檢查。
[0057] 2.將步驟1中鑒定的基因表達信號與一列已知的癌基因比較,并選擇對應于已知 的基因的已知在癌中具有作用的那些基因表達信號用于進一步分析。(此會通常產生一列 幾百到幾千個基因表達信號)
[0058] 3.從步驟1的信息源產生至少30 ( -般30和40之間)個隨機練習數據組。可在 多個隨機練習數據組中出現相同的個體基因表達信號。
[0059] 4.將步驟2中選擇的基因表達信號根據它們在生物學過程中的作用(例如細胞周 期基因,細胞死亡基因,免疫學應答基因,發炎基因等)來分組,GO分析
[0060] 5.產生隨機基因表達信號組(一般約百萬個),各含有約30個基因,自在步驟3 中產生的單組隨機選擇。
[0061] 6.針對各隨機練習數據組得到步驟4的各隨機基因表達信號組的用于存活篩選 的P值,你能對此關聯進行更詳細的描述?
[006引7.對于多于90%的隨機數據組,如果P值小于0. 05,則保持隨機基因組
[0063] 8.基于它們中基因出現的頻度排序自步驟7保持的隨機基因表達信號組
[0064] 9.選擇具有最高預測值(如在步驟8中測定)的排在前面的30個基因(步驟8 中排序的)作為潛在候選體。
[0065] 10.步驟5~9重復,開始于自在步驟3中形成的各組產生隨機基因表達信號組, 及產生是潛在候選體的排在前面的30個基因的另一,獨立,排序的組。
[0066] 11.將步驟10中產生的排在前面的30個基因與自步驟9的排在前面的30個基因 比較。如果30個中25或更多相同,稱其為"穩定的標記",且在篩選患者樣品中有用。如 果少于25/30相同,除去該數據(從兩組潛在候選體)。需要至少25個,由此可使用第1或 第2組潛在候選體。
[0067] 12.再重復兩次步驟5~11,用于其他2組(步驟3的)基因表達信號。由此,會 有3組穩定的標記,各設及自步驟3的不同組。
[006引13.檢查自患者的癌細胞,W評定它們的基因表達活性及其與3個穩定的標記中 的基因表達信號的關聯。一般而言,穩定的標記會指示轉移的似然性,因此匹配該標記的高 患者表達會指示"惡性"腫瘤。但是也可能穩定的標記可指示表達的保護性基因,例如調 亡基因,在該情況中,對于該標記,那些基因表達標記的高患者表達會指示"良性"腫瘤。在 任意情況中,將各穩定的標記與患者樣品比較,及通過各穩定的標記個別預測"良性"或" 惡性"腫瘤。自單穩定的標記指