專利名稱::用于鑒別鼻咽癌中的預后型亞類的基因表達譜的制作方法用于鑒別鼻咽癌中的預后型亞類的基因表達譜本發明總體上涉及評估和/或預測鼻咽癌的狀態和結果的方法,包括測定與這種癌癥相關的基因的表達水平,由此使得可以對這些癌癥患者的結果進行個體化預測或評估。導曰鼻咽癌(NPC)是一種獨特類型的頭頸部癌癥,其與上呼吸消化道的其它惡性腫瘤在流行病學、病理學、臨床表現和對治療的反應方面有所不同1,2。據信NPC的發生與Epstein-Barr病毒(EBV)感染相關3,4。這種類型的癌癥在中國南方地區、臺灣和東南亞地區是地方流行病(25-30/100,000/年)5—8。其是更具侵潤性的頭頸部癌癥之一,可以侵入相鄰器官、侵襲咽后和頸部淋巴結并傳播于遠離部位"1。在過去的三十年期間放射治療的進展得以成功地長期控制NPC12'16。毫無疑問,放療是治療NPC的主要方法。疾病I期和II期患者僅利用放療就可具有較高的治愈率。然而,70%以上的新診斷的NPC患者處于疾病的III期和IV期14,17。這些患者另外需要同時進行化療以改善其治療結果15,16。另外,大約30。/。的疾病m期和IVa/b期NPC患者最后產生遠處轉移14,17,即在NPC的局部區域外的轉移。10-20%的NPC患者在最初診斷時即出現遠處轉移并處于疾病IVc期14,17。在發生遠處轉移之后不久,大多數患者死于該病。遠處轉移通常在III期和IV期NPC患者未出現局部區域復發的情況下發生,是最重要的預后因素。近來的元分析(meta-analysis)表明晚期NPC患者生存期改善可能是同時進行全身性化療而可能防止和控制遠處轉移的結果15,16。考慮到70%以上的NPC患者處于疾病的m期和IV期,及大約30%的這些患者中可發生遠處轉移14,17,因此需要在首發時即成功鑒別具有高遠處轉移風險的患者,從而進一步改善這些患者的生存期。當這種預測變成現實時,就可以應用目前最優的治療方法,然后可以設計臨床試驗測試更新的治療方法,以更有效地防止和控制遠處轉移從而改善總體生存期。已知遠處轉移的風險隨著NPC的更晚期階段而增加14,17,己經使用TNM分級以指導選擇放療和化療的合適組合,以防止遠處轉移及改善長期生存15,16,31。例如,在臺灣臺北辜公亮基金會和信治癌中心對AJCC的III期患者(具有TlN2M0和T2aN2M0疾病的排除在外)已經同時用化療-放療(CCRT)加上兩個周期的順鉑和5-FU的輔助化療進行了治療31。IVa/b患者用CCRT治療,隨后進行2個周期的輔助化療及每周一次用5-FU和甲酰四氫葉酸維持化療共6個月31。盡管許多III期患者對這種治療反應良好并具有極佳的生存期(圖6),但是大約20%的111期患者發生遠處轉移并且生存期不佳。在開始治療的三年內發生遠處轉移的III期患者的總體生存期和無轉移生存期與IVa/b期NPC患者的重疊(圖6)。這些發現提出這樣的問題,即處于發生遠處轉移風險的m期患者是否應該通過新輔助化療、更新或更強的輔助化療和,/或維持化療而更積極地進行治療。對處于發生遠處轉移的IVa/b期NPC患者的治療的適當性也是一個問題(圖6)。所有這些發現強調在診斷時和在開始治療之前鑒別出處于發生遠處轉移風險中的NPC患者的臨床重要性。鑒別這種患者及排除處于低遠處轉移風險中的III期和IVa/b期NPC患者的能力對于進行更有效的臨床試驗非常重要。如先前所報道,微陣列分析已經成功用于鑒別腫瘤分類的分子標記18_22及其臨床特點2>3(),例如預測各種類型惡性腫瘤患者發生遠處轉移的風險及總體生存期。其它研究涉及NPC3、54。也參見2002年10月24日申請的美國專利申請No.60/420,729、2002年10月25日申請的美國專利申請No.60/421,102、2002年10月25日申請的美國專利申請No.60/421,062、2002年11月8日申請的美國專利申請No.60/424,701、2002年11月8日申請的美國專利申請No.60/424,718、2002年11月8日申請的美國專利申請No.60/424,715、2002年11月12日申請的美國專利申請No.60/425,256、2003年2月21日申請的美國專利申請No.60/448,462、2003年2月21日申請的美國專利申請No.60/448,466、2003年3月27日申請的美國專利申請No.60/457,877、2003年3月31日申請的美國專利申請No.60/458,373、2002年ll月12日申請的美國專利申請No.10/291,878、2002年11月12日申請的美國專利申請No.10/291,886、2002年11月12日申請的國際專利申請No.US02/38216、及2002年11月12日申請的國際專利申請No.US02/38222、2004年12月20日申請的美國專利申請No.l1/015,764、2005年3月28日申請的美國專利申請No.11/090,294及2005年3月25日申請的美國臨時申請No.60/665,652的描述,所述文獻中使用的方法學在此并入作參考。發明概述本發明鑒別了NPC患者中的涉及遠處轉移的基因組特征(genomicsignatures)。改良的對NPC患者發生遠處轉移進行預測的方法使得臨床醫生可以鑒別處于高風險中的個體患者,對他們可以選擇合適的治療方法(例如放療和/或化療)以防止和/或改善遠處轉移并改善長期生存率。因此,本發明一方面涉及使NPC患者中的基因表達水平與所述患者中的風險因子和臨床結果相關聯的方法。因此,本發明涉及一種評估鼻咽癌患者發生遠處轉移風險的方法,所述方法包括評估所述患者樣品中下表4和5中列出的至少一個基因的表達譜。優選地,在患者樣品、優選NPC組織樣品中評估表4中列出的基本上全部的、特別是全部52個基因和/或表5中列出的基本上全部的、特別是全部12個基因的表達水平。因此,可以利用表4或5中的兩或多個基因,只要用于概率分析而評估的基因的數目與疾病結果(例如遠處轉移)相關聯即可。在其它實施方案中,對于所述12個基因系列,可以利用其中的3或多個、4或多個、5或多個、6或多個、7或多個、8或多個、9或多個、IO或多個,或者ll或多個基因。對于所述52個基因系列,也可以利用這樣數目的基因,或者12或多個、…、15或多個、…、20或多個、…、25或多個、…、30或多個、…、35或多個、…、40或多個、…、45或多個、…、50或多個、51或多個基因,以及在此未明確表述的其它基因數目。在下文描述的組合方法中也可以利用來自每個系列的所述的基因數目。當然,為了優化結果,通常利用全部或者基本全部的基因。因此,另一方面,前述方法中使用的基因是本文列出的一或多個基因。本發明還涉及在例如介質或試劑盒等中的與遠處轉移相關的這些基因的全部或亞集的集合,并且本發明涉及進行本發明方法使用的相關的方法、介質和試劑盒。根據本發明的另一方面,所分析的患者樣品可以是任何組織,例如血液、腫瘤或細胞等。優選地,所述樣品來自NPC腫瘤。獲得所分析樣品的方法為本領域所已知。本發明提供了與評估或預測NPC患者中的遠處轉移相關的基因集合。這些基因具有與至少一種這種癌癥表型相關的表達模式(即水平表達或無表達)。可以理解NPC中也包含另外的基因。對于本發明,對自具有完整記錄的臨床數據的NPC患者收集的組織活檢樣品進行基因表達模式研究。所有進行研究的活檢樣品均在液氮中貯存。僅對總RNA無明顯降解的樣品進行研究。為了使與操作者相關的變量最小化,在腫瘤樣品的處理和微陣列數據的收集中僅包括兩名經高級培訓的技術人員。他們隨機處理相似數目的具有高和低遠處轉移風險的患者的樣品。對由這兩名技術人員進行和收集的微陣列數據的統計學分析未示出任何統計學偏差(圖7)。在研究過程中還使用相同的流體自動輸送儀(fluidicstation)和相同的掃描儀。為了進一步使得與芯片生產、樣品處理、cRNA的荷載量及芯片處理相關的變量最小化,使用AffymetrixMAS5.0軟件將每個微陣列的基因表達強度數據校正為切尾均值(trimmedmean)500,隨后根據先前在我們實驗室中確定的NPC參考標準對每個探針集的表達強度進行分位數校正。見實施例I所述。這種校正方法的效果通過對比六個隨機選擇的NPC樣品重復測定的GeneChip結果而確認。結果示出在探針水平的分位數(qauntile)校正程序對于校正實驗變量確實有效(圖8)。進行嚴密監視下的分析。如先前所述,在開始治療的三年內未發生遠處轉移的大多數NPC患者具有良好的長期生存率,生存結果不佳的NPC患者通常在首次治療后的三年內發生遠處轉移。這兩組在臨床上處于疾病兩端的患者的活檢組織樣品用于分析中,以鑒別用于預測遠處轉移的更可靠的分子標記。最近報道了采取這種方法發現可靠的分子預測因子(predictor)的益處35。同時,如Simon等"所述,過匹配(overfitting)是從具有高維測量值的有限數目的患者中發現類別預測因子的一個嚴重缺陷。為了克7服過匹配問題,一組用于確證的真正獨立的測試病例被包括進來,并且在這項研究中包含盡可能多的患者。138名符合條件的患者被包括進來。另外,將來自低風險和高風險組的l/3的患者在研究剛開始時隨機分配至一個獨立測試組(testset)以進行確認。重要的臨床變量如年齡、性別、腫瘤階段、隨訪持續時間被考慮以用于隨機化。所有測試組病例均未參與訓練過程中預測基因的選擇和預測規則的確定。本發明的測試組的結果顯示靈敏性、特異性和總精確性與文獻中針對其它類型實體腫瘤報道的結果相當或更好23,24'27'3()。存活的腫瘤細胞和周圍的淋巴/炎癥/介質細胞的數量在不同患者的活檢組織樣品之間可以顯著變化(生物學異質性)。然而,由于可利用的活檢組織的數量非常有限及RNA的不穩定性,因此對用于基因表達譜分析的活檢組織樣品未進行組織學檢驗。同樣,診斷性活檢組織樣品的組織學與預測結果的精確性無關聯,因為用于診斷和GeneChip研究的活檢部位不同。與活檢組織樣品的異質性相關的噪音(noise)會限制預測的精確性。本發明產生了兩項優選的預測規則。見實施例IV和V所示。一項基于52個基因的特征和k-NN分類方法,另一項基于12個基因和邏輯回歸(logisticregression)。在一組中,來自9個不同SOM簇的52個基因被用于進行預測。它們總結于表4。在這52個基因中,根據MAID-DAVIDTools7■mMmT;.gov/iav,,有參與信號轉導(n-9)、mRNA力口工(11=7)、轉錄調節(!1=3)、蛋白質合成(11=4)、核苷酸代謝(n-4)、脂質代謝(11=3)、蛋白質折疊(11=3)、胞質分裂(11=2)、核轉運(!1=2)、蛋白質分解代謝(11=2)、抗細胞凋亡(n4)、ATP合成(r^1)、細胞周期(n=l)、免疫應答(n-l)、胞內蛋白質轉運(11=1)和氨基酸轉運(11=1)的成員。剩余7個基因的功能未知。在高風險組中,這52個基因中有22個基因表達降低,3個基因表達增加。當對比高風險和低風險組的預測基因的表達強度時,注意到在預測的高風險組中幾乎所有參與mRNA加工、核轉運、核苷酸代謝和蛋白質折疊的基因的平均表達水平均更高。相反,在預測處于高遠處轉移風險組中,所有參與轉錄調節和蛋白質分解代謝的基因的表達均降低。對于基于12個基因的預測方法,有6個基因也存在于通過k-NN方法進行預測的所述52個基因中。根據Affymterix探針集ID,其它6個基因不存在于所述52個基因的列表中。這12個基因總結于表5。在這12個基因中,有3個基因參與蛋白質折疊,2個基因參與蛋白質合成,2個基因參與核糖體生物發生(biogenesis),2個基因參與核苷酸代謝,l個基因參與mRNA加工和蛋白質分解代謝。最后一個基因(假設蛋白質FLJ12671)已知具有核仁外切核酸酶基序,其實際功能未知。所有12個基因的功能均顯示出與所述52個基因中的那些基因的功能明顯重疊。注意到未包含在所述52個基因中的6個基因之一(不含POU結構域的蛋白質)實際上與所述52個基因中的不同探針集ID所表示的基因相同。這個基因參與mRNA加工。所述12個基因的組中的3個基因是含有相同伴侶蛋白的t-復合物l(TCP-l)的ot、P、Y亞單位34,它們參與腫瘤細胞增殖。亞單位a和Y的基因既存在于所示12個基因中,也存在于所述52個基因中。亞單位(3的基因僅存在于所述12個基因中。所有這些發現示出這兩組預測基因之間的高度一致性。使用預測規則的結果示出52個基因的預測方法較12個基因的預測方法假陽性率低(14%對28%)。相反,52個基因的預測方法較12個基因的預測方法具有較高的假陰性率(31%對15%)。當所述預測方法用于選擇具有高遠處轉移風險的患者進行臨床試驗時,需要將假陽性和假陰性率降低至最小值,以便保護低風險患者的安全和對高風險患者的正確治療。例如,可以將所述兩種方法組合成為一種方法。僅認可兩種方法的一致結果。不一致的結果被看作是不確定結果(11=8)。見實施例VI所述。通過采取這種方法,假陽性率降低至10%。假陰性率為大約15%。盡管在獨立測試中不確定病例占所有患者的19%(8/42),但是通過組合使用分子預測因子僅將2名臨床高風險患者指定為屬于不確定范疇。以這種方式,以排除15%(2/13)的臨床高風險患者的代價,錯誤地將低風險的患者(goodriskpatient)劃分在高風險患者試驗組中的幾率可被有效最小化。其它15%的臨床高風險患者被錯誤地預測為低風險患者(表6)。然而,至少70%的高風險患者將得以正確鑒別并可以包括在針對高風險患者設計的臨床試驗中。因此,已經鑒別了52個基因和12個基因的可靠分子學特征,以預測處于發生遠處轉移的高風險或低風險狀態的NPC患者。所述預測經42個獨立測試組病例確認。由獨立測試組評估的總精確性對于所述52個基因特征、12個基因特征及其組合特征分別為81%、76%和85%。這些結果與近來公布的也使用獨立測試組進行確認的預測研究結果相當283。據報道預測乳腺癌對新輔助化療反應的準確率為78%28,預測頭頸部鱗狀細胞癌的淋巴結轉移的準確率為86%3()。所述分子特征可用于指導在NPC患者中進行新的新輔助化療、輔助化療、維持化療和/或靶向治療,以用于防止、改善和控制遠處轉移及進一步改善長期生存率。具有遠處轉移的低或高風險的NPC患者的鑒別也可以降低治療過度或不足的比率。NPC轉移相關基因的集合可以是物理集合(physicalcollection)或虛擬集合(virtualcollection)。物理集合包括一群不同的核酸分子,其中NPC癌癥相關基因存在于所述群中,即所述群中有相應于所述集合中的NPC癌癥相關基因的基因組序列,或者更常見地,編碼序列的核酸分子。在許多實施方案中,所述核酸分子的序列與其相應的基因的有義鏈基本相同或相同,或者與其相應的有義鏈互補,通常與其相應的有義鏈在嚴格條件下雜交。雜交條件(即低、中等、或高嚴格條件)的確定為本領域技術人員所己知。嚴格雜交條件的一個例子是在50'C或更高溫度下在0.1SSC(15mM氯化鈉/1.5mM檸檬酸鈉)中雜交。嚴格雜交條件的另一個例子是在42'C在如下溶液中保溫過夜50%甲酰胺,5xSSC(150mMNaCl,15mM擰檬酸三鈉),50mM磷酸鈉(pH7.6),5xDenhardt's溶液,10%硫酸葡聚糖,及20mg/ml變性剪切的鮭精DNA;隨后在大約65'C在0.1xSSC中洗滌濾膜。嚴格雜交條件是至少與上述條件一樣嚴格的雜交條件,其中如果與上述特定嚴格條件至少大約80%、通常至少大約90%—樣嚴格,則認為是至少一樣嚴格的。其它嚴格條件為本領域所已知,也可以用于鑒別本發明這個特殊實施方案的核酸。組成所述物理集合的核酸可以是單鏈或雙鏈核酸。另外,組成所述物理集合的核酸可以是線性或環狀核酸,各個核酸分子除了NPC癌癥相關基因之外還可包括其它序列,例如載體序列。各種不同核酸可以組成所述物理集合,例如庫,如本發明的載體庫,其中不同類型核酸的例子包括但非限于DNA,例如cDNA等,RNA,例如mRNA、cRNA等等。所述物理集合的核酸可以存在于溶液中或者粘附即附著于固體支持物上,如在陣列實施方案中的基質上,關于這種不同實施方案的進一步描述在下文提供。本發明還提供了NPC相關基因的虛擬集合。虛擬集合是指包括集合的基因的序列信息的一或多個數據文件或者其它計算機可讀數據組織元件,其中所述序列信息可以是基因組序列信息,但通常是編碼序列信息。所述虛擬集合可以記錄在任何便利的計算機或處理器可讀存儲介質上。其上存儲了所述集合數據的計算機或處理器可讀存儲介質可以是任何便利的介質,包括CD、DAT、軟盤、RAM、ROM等,所述介質能由裝置的硬件部分讀取。本發明還提供了NPC相關基因的表達譜數據庫。這種數據庫通常包含具有NPC相關表型的各種細胞/組織的表達譜,如NPC的各個階段、陰性表達譜、預后譜等,在下文對這類譜進一步描述。所述表達譜及其數據庫可以提供在各種介質中以便于其應用。"介質"是指含有本發明所述表達譜信息的產品。本發明的數據庫可以記錄在計算機可讀介質例如可以由計算機直接讀取和存取的任何介質上。這種介質包括但非限于磁性存儲介質,如軟盤、硬盤存儲介質及磁帶;光學存儲介質如CD-ROM;電子存儲介質如RAM和ROM;及這些存儲介質的混合物如磁性/光學存儲介質。本領域技術人員可易于意識到目前已知的任何計算機可讀介質可怎樣用于產生包含本發明數據庫信息的產品。"記錄"是指使用本領域已知的任何方法在計算機可讀介質上存儲信息的過程。基于用于存取所存儲信息的方式,可以選擇任何便利的數據存儲結構。可以使用各種數據處理器程序和格式進行存儲,例如文字處理文本文件(wordprocessingtextfile),數據庫豐莫式(databaseformat)等。如本文所用,"基于計算機的系統"是指用于分析本發明信息的硬件、軟件和數據存儲裝置。本發明的基于計算機系統的最小硬件包含一個中央處理器(CPU)、輸入裝置、輸出裝置,及數據存儲裝置。技術人員可易于意識到任一種目前可利用的基于計算機的系統均適用于本發明中。數據存儲裝置可包括任何包含如上述本發明信息的記錄制品,或者可以存取這種制品的記憶存取裝置。可以使用輸入和輸出裝置的許多結構格式以在本發明的基于計算機的系統中輸入和輸出信息。輸出裝置的一種格式是對與參考表達譜具有不同程度相似性的表達譜進行排列(rank)。這種表示為技術人員提供了相似性的排列,并且可以鑒別測試的表達譜中包含的相似性程度。基因表達譜可以在一個時間點測定或者在一段時間的幾個時間點測定。基因的表達水平可以通過本領域已知的任何方法確定(例如定量的聚合酶鏈反應(PCR)、逆轉錄酶/聚合酶PCR)或者通過將開發的可提供關于基因表達的定量信息的方法確定。在另一個實施方案中,基因表達水平是通過量化基因表達產物如蛋白質、多肽或核酸分子(例如mRNA、tRNA、rRNA)而確定的。量化核酸可以通過對核酸進行直接量化或者通過對相應的調節基因或調節序列元件進行量化而進行。另外,可以對基因的變體如剪切變體和多態性變體進行量化。在另一個實施方案中,基囟表達是通過量化從mRNA翻譯的蛋白質或多肽的水平而測定的。量化樣品中蛋白質或多肽的水平并使這種數據與表達水平相關聯的方法為本領域所已知。例如,特異于蛋白質或多肽的多克隆或單克隆抗體可以通過本領域已知的方法獲得,并用于檢測和/或測量樣品或標本中的蛋白質或多肽。在一個優選的實施方案中,基因表達是通過量化樣品或標本中的mRNA水平而測定。這可以通過本領域已知的任何方法進行。在一個實施方案中,將mRNA與包含特異于感興趣的基因的固定的核酸探針的合適微陣列接觸,確定樣品中mRNA與微陣列上探針的雜交程度。這種微陣列也在本發明的范圍內。產生寡核苷酸微陣列的方法的例子在例如WO95/11995中描述。本領域易于獲知其它方法。測定或估定的基因表達值是得自可以測量基因表達水平的裝置的數值。所述數值是得自所述裝置的原始數值,或者是優選經過重定比例、過濾和/或標準化的數值。見例如實施例I所述。已經進行特定嚴格條件處理的樣品的核酸(例如mRNA)與芯片上的探針雜交。分離進行分析的核酸(例如靶核酸)、擴增,在與陣列雜交之前用可檢測的標記物(例如32P或熒光標記物)進行標記。雜交后,將所述陣列插入可以檢測雜交模式的掃描儀中。這些模式通過檢測與所述微陣列附著的標記的靶而進行檢測,例如如果所述耙是熒光標記的,則收集從標記的基團中發射的光作為雜交數據。由于標記的耙在本領域技術人員已知的合適的嚴格條件下與所述微陣列中包含的互補寡核苷酸特異性雜交,及由于已知所述陣列中每個寡核苷酸的序列和位置,因此可以確定應用于所述探針的耙核酸的性質。本發明還提供了一種通過監測本發明的基因表達譜而監測個體中治療方案的效果的方法,例如可以確定個體的基礎基因表達水平,并且可以在治療期間在不同時間點重復確定基因表達譜。基因衣込l首/A與個往tf」^汀結米TO天tf、」諧特父刀與改吾的汩〗了結果相關的譜是治療方案有效的指征,而重復的與不佳治療結果相關的表達譜表示無效的治療方案。在本發明的診斷性應用中,對細胞或其集合例如組織以及包括所述細胞/組織的動物(對象、宿主等,例如哺乳動物如寵物、家畜和人等)進行分析,以確定發生NPC轉移的存在和/或可能性。如此,診斷性分析包括確定這種表型存在的方法。在某些實施方案中,不僅確定了表型的存在,而且還確定了表型的嚴重性或階段。另外,診斷性方法還包括確定發生這種癌癥表型的傾向,由此^J以確定這種癌癥表型不存在但可能發生。在進行所述診斷及其它方法中,對得自或衍生自要被診斷的細胞、組織或對象的核酸樣品進行分析,以產生表達譜,然后進行本發明的方法。如上所述,進行分析以產生表達譜用于所述診斷方法中的樣品是核酸樣品。所述核酸樣品包括多個或一群不同的核酸,所述核酸包含進行診斷的感興趣的細胞或組織的NPC相關基因的表達信息。所述核酸可包括RNA或DNA核酸,例如mRNA、cRNA、cDNA等,只要所述樣品保留其從中獲得的宿主細胞或組織的表達信息即可。所述樣品可以本領域已知的許多不同方式制備,例如通過從細胞中分離mRNA,其中分離的mRNA被擴增,用于制備cDNA、cRNA等,如差異表達領域所已知的那樣進行。所述樣品通常是從待診斷的對象收集的細胞或組織中制備的,例如通過使用標準方案進行組織活檢而收集,其中從中可以產生這種核酸的細胞或組織包括其中存在待確定的NPC表型的表達譜的任何組織,包括但非限于單核細胞、內皮、和/或平滑肌。可以使用任何便利的方案從原始核酸樣品中產生所述表達譜。雖然已知各種不同的產生表達譜的方式,如用于基因差異表達分析領域中的那些方式,但是一種代表性的便利的產生基因表達譜的方案是基于陣列的基因表達譜產生方案。所述應用是雜交分析,其中采用這樣的核酸,所述核酸展示針對待產生的表達譜中的每個被分析的/描繪的基因的"探針"核酸。在這些分析中,首先從進行分析的原始核酸樣品中制備靶核酸樣品,其中制備可包括用標記物(例如信號產生系統的一個成員)標記所述靶核酸。在制備靶核酸樣品后,將樣品與所述陣列在雜交條件下接觸,從而與同所述陣列表面所附著探針序列互補的耙核酸形成復合物。然后定量或定性檢測雜交復合物的存在。可用于產生本發明方法中采用的表達譜的特殊雜交技術包括在如下并入本文作參考的文獻中描述的技術美國專利No:5,143,854、5,288,644、5,324,633、5,432,049、5,470,710、5,492,806、5,503,980、5,510,270、5,525,464、5,547,839、5,580,732、5,661,028、5,800,992,以及WO95/21265、WO96/31622、WO97/10365、WO97/27317、EP373203和EP785280。在這些方法中,將包括其表達被分析的每個NPC相關基因的探針的"探針"核酸陣列與上述耙核酸接觸。在雜交條件例如上述嚴格雜交條件下進行接觸,然后除去未結合的核酸。所得的雜交核酸模式提供了已經探査的每個基因的表達信息,其中所述表達信息是關于所述基因表達與否以及表達的水平,并且通常表達數據即表達譜可為定量和定性的。在一些實施方案中,應用上述獲得的關于所分析的細胞/組織的信息對宿主、對象或患者關于已經發生的疾病的存在、階段或傾向加以診斷、對疾病過程和結果加以預測。例如,在確定進行分析的細胞/組織具有NPC轉移表型的情況中,所述信息可用于診斷從中獲得所述細胞/組織的對象具有癌癥復發的可能性。除了監測特定治療方法的效果之外,本發明可用于篩選潛在的候選藥物在治療NPC轉移可能性中的效果。在這個實施方案中,將用所述候選藥物治療之前和之后的樣品表達譜進行比較,其中經治療的樣品的基因表達譜從不佳治療結果相關的譜向改善的治療結果相關的譜的轉變表示藥物的效果。可以使用常規的方法在體外或者在動物模型中進行這種分析。本發明的NPC相關基因的集合的另一個應用是用于監測或評定給定的治療方案。在這種方法中,使用本文描述的方法監測經歷治療的患者的細胞/組織樣品,其中將獲得的表達譜與一或多種參考表達譜進行比較,以確定給定的治療方案對治療的疾病是否具有希望的影響。例如,在治療期間從患者中定期獲得表達譜,將其與包括各種NPC轉移階段和正常表達譜的一系列參考/對照譜進行比較。在監測的表達譜中觀測到的朝向正常表達譜的轉變表示給定的治療方案以希望的方式起作用。治療劑篩選應用本發明還涵蓋了鑒別具有調節(例如增強或消除)NPC轉移表型能力的物質的方法,所述方法可用于鑒別治療劑。調節這種表型的化合物的鑒別可以使用任何藥物篩選技術實現。本發明的篩選分析通常基于所述物質調節NPC轉移表型決定基因的表達譜的能力。如本文所用,術語"物質(agent)"是指具有調節差異表達的基因產物的生物學活性的能力的任何分子,例如蛋白質、小分子或其它藥物。通常將具有不同物質濃度的多種分析混合物平行運行,以獲得對不同濃度的反應。通常,這些濃度之一作為陰性對照,即為零濃度或者低于檢測水平。候選物質涵蓋了各種化學類別的物質,但其通常是有機分子,優選分子量大于50而小于大約2,500道爾頓的小的有機化合物。候選物質通常包含為與蛋白質在結構上相互作用所必需的功能基團,特別是氫鍵,通常包括至少一個胺基團、羰基、羥基或羧基,優選至少兩個所述化學功能基團。所述候選物質通常包含環狀碳或雜環17結構和/或用一或多個上述功能基團取代的芳香結構或芳香聚合結構。還在生物分子中發現候選物質,包括但非限于肽、糖、脂肪酸、類固醇、嘌呤、嘧啶、衍生物、結構類似物或其組合。候選物質得自各種來源,包括得自合成或天然的化合物。例如,可利用多種方式隨機及直接地合成各種有機化合物和生物分子,包括隨機化的寡核苷酸和寡肽的表達。或者,細菌、真菌、植物和動物提取物(包括人體組織提取物,用以鑒別影響差異表達的基因產物的內源因子)形式的天然化合物文庫是可利用或易于產生的。另外,天然或合成產生的文庫和化合物易于通過常規的化學、物理和生物化學方式加以修飾,可用于產生組合文庫。可以對已知的藥物制劑進行直接或隨機化學修飾,如酰化、烷化、酯化、酰胺化等,以產生結構類似物。特別感興趣的候選物質例如包括但非限于反義多核苷酸、抗體、可溶的受體等。抗體及可溶的受體是特別感興趣的候選物質,其中目標差異表達的基因產物在細胞表面分泌或是表面可及的(accessible)(例如與細胞外膜穩定關聯的受體及其它分子)。篩選分析可以基于本領域技術人員可利用的及已知的各種技術。通常地,所述篩選分析包括將已知具有NPC轉移表型的細胞或組織與候選物質接觸,基于由表型決定基因組成的基因表達譜分析評定對基因表達譜的影響。可以使用任何便利的方法檢測所述作用結果,在許多實施方案中應用上述診斷方案。這種分析通常在體外進行,但是對許多分析可以進行修改以適于體內分析,例如在動物癌癥模型中進行分析。藥物靶向篩選在另一個實施方案中,本發明涉及鑒別本文列出的基因及其產物作為治療靶。在一些方面,這與鑒別具有調節(例如降低或增加)NPC轉移表型的活性的物質的上述分析相反,涉及鑒別特定表型決定基因或其表達產物,以作為治療靶。在這個實施方案中,治療靶是通過檢測可被證實或已經被證實調節NPC表型卩例如抑制或阻抑這種表型)的物質的作用而鑒別的。例如,所述物質可以是特異于所選擇的基因轉錄物的反義寡核苷酸。例如,所述反義寡核苷酸可以具有相應于本文表中列出的基因序列的序列。鑒別治療靶的分析可以利用本領域技術人員熟知的各種方法以各種方式進行。例如,將表達或過表達候選基因例如本文表中列出的基因的測試細胞與已知的NPC藥劑接觸,評估候選基因產物對NPC表型的作用及生物學活性。所述候選基因的生物學活性可以通過檢測例如對編碼候選基因產物的基因表達的調節d列如通過轉錄物水平或多肽水平的增加或減少進行檢測)或者對及基因產物的酶學或其它活性的調節而分析。NPC轉移表型的抑制或阻抑表明所述候選基因產物是一種合適的治療耙。可對本文中描述的和/或本領域已知的分析進行修改以適于鑒別治療靶。通常地,這種分析是在體外進行的,但是可以對許多分析進行修改以適合體內分析,例如在合適的本領域公認的動物模型中進行的分析。試劑與試劑盒本發明還提供了進行上述一或多種方法的試劑及其試劑盒。所述試劑及其試劑盒可以非常不同。感興趣的試劑包括特別設計用于產生上述NPC表型決定基因的表達譜的試劑。一種類型的這種試劑是核酸探針陣列,其中存在感興趣的NPC轉移表型決定基因。本領域已知各種不同的陣列形式,具有多種不同的探針結構、基底成分和附著技術。感興趣的代表性陣列結構包括如下并入作參考的文獻中所描述的那些陣列美國專利No.5,143,854、5,288,644、5,324,633、5,432,049、5,470,710、5,492,806、5,503,980、5,510,270、5,525,464、5,547,839、5,580,732、5,661,028、5,800,992,以及WO95/21265、WO96/31622、WO97/10365、WO97/27317、EP373203禾BEP785280。在許多實施方案中,所述陣列包括本文列出的至少兩個基因的探針。在某些實施方案中,陣列上存在的基因數目為至少5、10、25、50或更多個,包括本文列出的所有基因。所述陣列可僅包括本文列出的那些基因,或者其還可包括本文未列出的其它基因。在某些實施方案中,當所述陣列包括這種其它基因的探針時,存在的其它基因數的百分比不超過大約50%,通常不超過大約25%。在許多實施方案中,當包括這種其它基因時,所述集合中的大多數基因是NPC癌癥表型決定基因,大多數是指至少大約75%,通常為至少大約80%,有時為至少大約85、90、95%或更高,包括所述集合中100%的基因是NPC癌癥表型決定基因的實施方案。在許多實施方案中,所述陣列中代表的至少一種基因是其在功能上不易參與NPC癌癥表型的產生的基因。特別適合產生NPC癌癥表型決定基因的表達譜的另一種類型的試劑是設計為選擇性擴增這種基因的基因特異性引物的集合。基因特異性引物及其使用方法在美國專利No.5,994,076中描述,所述專利在此并入作參考。特別感興趣的是具有本文列出的至少兩種基因的引物的基因特異性引物集合。在某些實施方案中,具有所述集合中的引物的這種基因的數目是至少5、10、25、50或更多種,包括本文列出的所有基因。所述基因特異性引物集合可僅包括本文列出的那些基因,或者可包括本文未列出的其他基因的引物。在所述基因特異性引物集合包括這種另外的基因的情況中,在某些實施方案中所述另外的基因的百分數不超過大約50%,通常不超過大約25%。在許多實施方案中,在包括這種另外的基因的情況中,集合中的大多數基因是NPC表型決定基因,大多數是指至少大約75%,通常為至少大約80%,有時為至少大約85、90、95%或更高,包括其中集合中100%的基因是NPC表型決定基因的實施方案。在許多實施方案中,基因特異性引物集合中代表的至少一種基因是其在功能上不易于參與NPC癌癥表型產生的基因。本發明的試劑盒可包括上述陣列和/或基因特異性引物集合。所述試劑盒可進一步包括用于各種方法中的一或多種另外的試劑,如產生靶核酸、dNTP和域rNTP的引物,它們可以是預先混合的或單獨的,一或多種獨特標記的dNTP和/或rNTP,如生物素酰化的或Cy3或Cy5標記的dNTP,具有不同的散射光譜的金或銀粒子,或者其他合成后標記試劑,如熒光染料的化學活性衍生物,酶如逆轉錄酶,DNA聚合酶,RNA聚合酶等,各種緩沖介質,例如雜交和洗滌緩沖液,預制的探針陣列,標記的探針純化試劑和成分,如離心柱(spincolumns)等,信號產生和檢測試劑,例如鏈霉親和素-堿性磷酸酶結合物,化學熒光或化學發光物等。除了上述成分之外,所述試劑盒進一步包括實踐本發明方法的說明書。這些說明書可以各種形式存在于所述試劑盒中,其中一或多種可存在試劑盒中。這些說明書的一種形式是印刷于合適的介質或基質上,例如試劑盒包裝內或者包裝插入頁等中的印有所述信息的一或多張紙等。另一種方式是計算機可讀介質,例如其上記錄了所述信息的磁盤、CD等。另一種方式是用于通過因特網在遠程位置獲取所述信息的網址。治療NPC轉移的化合物和方法
技術領域:
:本發明還提供了可以減少NPC轉移可能性的方法和組合物。本發明提供了通過調節一或多種靶基因的表達或者其一或多種產物的活性而減輕例如治療這種疾病的方法,其中所述靶基因是一或多種本文列出的NPC表型決定基因。某些NPC疾病至少部分是由基因產物水平過多或者存在顯示異常或過高活性的基因產物而引起的。如此,降低這種基因產物的水平和/或活性將使得疾病的復發得以減少。下文描述了降低靶基因表達水平或靶基因產物活性水平的技術。或者,某些其他NPC疾病階段至少部分是由于缺乏基因表達或基因表達水平降低或者基因產物活性水平降低所致。如此,增加基因表達水平和/或所述基因產物的活性可以改善所述疾病。下文描述了增加靶基因表達水平或靶基因產物活性水平的技術。抑制突變的靶基因的表達、合成或活性的化合物如上所述,參與NPC疾病的靶基因可以通過耙基因活性水平增加而導致所述疾病。在疾病條件下細胞/組織中的基因處于正調節的情況中,可以利用各種技術抑制這種靶基因和/或蛋白質的表達、合成或活性。例如,根據本發明可應用經本發明所述方法鑒別的呈現抑制性活性的那些化合物以改善疾病癥狀。如上所述,所述分子可包括但非限于小的有機分子、肽、抗體等。抑制性抗體技術在下文描述。例如,可給予與內源配體競爭靶基因產物的化合物,其中所述靶基因產物與內源配體結合。所得配體結合的靶基因數目的減少將調節內皮細胞生理學。特別用于這種目的的化合物包括例如可溶的蛋白質或肽,如包含靶基因產物的一或多個胞外結構域或其一部分和/或類似物的肽,包括例如可溶的融合蛋白如具有Ig-尾(Ig-tailed)的融合蛋白(關于產生具有Ig尾的融合蛋白的描述見例如美國專利No.5,116,964.)。或者,結合靶基因產物受體位點但不激活所述蛋白質的化合物如配體類似物或抗體(例如受體-配體拮抗劑)可有效抑制靶基因產物活性。另外,根據本發明也可以應用抑制耙基因表達的反義和核酶分子抑制異常的靶基因活性。這種技術在下文描述。另外,也如下文所描述,可利用三螺旋分子抑制異常的靶基因活性。抑制性反義物、核酶和三螺旋方案顯示降低NPC轉移能力的化合物是反義物、核酶和三螺旋分子。這種分子被設計為降低或抑制突變的靶基因活性。產生和應用這種分子的技術為本領域技術人員所熟知。反義RNA和DNA分子通過與耙mRNA雜交及阻止蛋白質翻譯而直接阻斷mRNA的翻譯。關于反義DNA,優選衍生自翻譯起始位點、例如位于感興趣的革E基因核苷酸序列的-10至+10區域之間的寡脫氧核糖核苷酸。核酶是能催化RNA特異性裂解的酶RNA分子。核酶的作用機制包括核酶分子與互補的靶RNA的序列特異性雜交,隨后經內切核酸酶切割。核酶分子的成分必須包括與耙基因mRNA互補的一或多個序列,以及必須包括mRNA切割所需的熟知的催化序列。為此參見以其全文并入作參考的美國專利No.5,093,246所描述。由此在本發明范圍內的是工程化錘頭狀基序核酶分子,其特異性地和有效地催化編碼靶基因蛋白質的RNA序列的內切核酸酶切割。任何潛在的RNA靶內的特異性核酶切割位點最初是通過掃描包括GUA、GUU和GUC序列的感興趣的分子的核酶切割位點而鑒別。一旦鑒別,則可以評價相應于包含所述切割位點的靶基因區域的15-20個核糖核苷酸的短RNA序列的預測的結構特點,如可導致寡核苷酸序列不合適的二級結構。候選序列的適合性也可以通過使用核糖核酸酶保護分析測試其與互補的寡核苷酸雜交的可能性而評價。在三螺旋構成中用于抑制轉錄的核酸分子應是單鏈的并由脫氧核糖核苷酸組成。這些寡核苷酸的基本成分必須設計為通過Hoogsteen堿基配對原則促進三螺旋形成,這通常需要雙鏈體的一個鏈中存在相當大的一段嘌呤或嘧啶的序列。核苷酸序列可以基于嘧啶,這樣將產生跨越(across)所得三螺旋的三個相關聯鏈的TAT和CGC+三聯體。富含嘧啶的分子提供了與雙鏈體的一個鏈的富含嘌呤區域以與該鏈平行的方向的堿基互補。另外,可以選擇富含嘌呤的核酸分子,例如一段含有G殘基的序列。這些分子與富含GC堿基對的DNA雙鏈體形成三螺旋,其中大部分嘌呤堿基位于靶雙鏈體的一個鏈上,導致GGC三聯體跨越三螺旋中的三個鏈。或者,可被靶向而用于三螺旋形成的潛在序列可通過產生所謂的"switchback"核酸分子而增加。Switchback分子是以交替的5'-3'、3'-5'方式合成的,由此其首先與雙鏈體的一個鏈進行堿基配對,然后與另一個鏈進行堿基配對,從而無需在雙鏈體的一個鏈上存在一段相當大的嘌呤或嘧啶的序列。本文描述的反義物、核酶和/或三螺旋分子可降低或抑制正常及突變的靶基因等位基因產生的mRNA的轉錄(三螺旋)和/或翻譯(反義物、核酶)。為了保證維持靶基因活性的正常水平,可以將編碼和表達呈現正常活性的靶基因多肽的核酸分子通過基因療法導入細胞中,所述基因療法如下文所述那些方法,不包含對應用的反義物、核酶或三螺旋治療易感的序列。為了保證維持靶基因活性在基本正常的水平,可以將編碼和表達呈現正常活性的靶基因多肽的核酸分子通過如下文所述基因療法導入細胞中,所述核酸分子不包含對應用的反義物、核酶或三螺旋處理易感的序列。或者,可優選將正常的靶基因蛋白質共同給予所述細胞或組織中,以維持細胞或組織靶基因活性的必需水平。可以根據本領域己知的合成DNA和RNA分子的任何方法制備本發明的反義RNA和DNA、核酶及三螺旋分子。這些方法包括本領域熟知的化學合成寡脫氧核糖核苷酸和寡核糖核苷酸技術,例如固相膦酰胺(phosphoramidite)化學合成方法。或者,RNA分子可以通過編碼反義RNA分子的DNA序列的體外和體內轉錄而產生。這種DNA序列可以摻入包含合適的RNA聚合酶啟動子如T7或SP6聚合酶啟動子的多種載體中。或者,可以將根據所用啟動子而組成型或誘導型合成反義RNA的反義cDNA構建體穩定導入細胞系中。可以對DNA分子中進行各種熟知的修飾以提高胞內穩定性和半衰期。可能的修飾包括但非限于在所述分子的5,和/或3,末端兩側加入核糖核苷酸或脫氧核糖核苷酸序列,或者在寡脫氧核糖核苷酸主鏈中使用硫代磷酸或者2'O-甲基鍵而不是磷酸二酯鍵。靶基因產物的抗體可以使用特異于靶基因蛋白質并干擾其活性的抗體以抑制耙基因功能。這種抗體可以使用本領域已知的標準技術針對蛋白質自身或者相應于蛋白質一部分的肽而產生。這種抗體包括但非限于多克隆抗體、單克隆抗體、Fab片段、單鏈抗體、嵌合抗體等。在靶基因蛋白質是胞內完整抗體的情況中,可優選內化型抗體(internalizingantibody)。然而,可以使用lipofectin脂質體將所述抗體或結合靶基因表位的Fab區域片段輸送至細胞中。在使用所述抗體的片段的情況中,優選結合靶蛋白質的結合結構域的最小抑制片段。例如,可以使用這樣的肽,其具有相應于結合靶基因蛋白質的抗體可變區的結構域的氨基酸序列。這種肽可以是利用本領域熟知的方法經化學合成的或者通過重組DNA技術產生的(例如見Creighton,1983,如前;及Sambrooketal.,1989,如前所述)。或者,也可以給予結合胞內靶基因表位的單鏈中和抗體。這種單鏈抗體可例如通過在耙細胞群內表達編碼單鏈抗體的核苷酸序列而給予,通過例如Marascoetal.(Marasco,W.etal.,1993,Proc.Natl.Acad.Sci.USA90:7889-7893)所述那些技術進行。在一些情況中,靶基因蛋白質是胞外蛋白質或者是跨膜蛋白質。特異于基因產物的一或多個胞外結構域并干擾其活性的抗體特別適用于治療乳腺癌。由于這種抗體可從血流中直接到達靶區域而特別有效。下文描述的適合給予肽的任何給予技術均可用于將抑制性靶基因抗體有效地給予至其作用部位。恢復靶基因活性的方法導致NPC轉移的耙基因在疾病狀態下可以被低表達。在基因在疾病狀態下被下調或者靶基因產物的活性被消除,導致疾病癥狀產生的情況中,可以應用這樣的方法,其使得靶基因活性水平可以增加至其中NPC疾病癥狀得以改善的水平。基因活性水平可例如通過增加存在的耙基因產物的水平或者通過增加存在的活性靶基因產物的水平而增加。例如,可以給予呈現這種癥狀的患者足以降低NPC轉移的水平的靶基因蛋白質。可利用下文描述的任何技術進行給予。本領域技術人員已知怎樣利用下文描述的那些技術確定正常靶基因蛋白質的有效非毒性劑量濃度。另外,可以將編碼靶基因蛋白質的RNA序列直接給予顯示NPC轉移的患者,所述的RNA序列以足以產生改善這種癥狀的靶基因蛋白質的水平濃度給予。可以利用下文描述的可實現胞內給予化合物的任何技術如脂質體給予法來給予這種RNA分子。所述RNA分子可以例如通過本領域已知的重組技術產生。另外,可以通過基因置換療法治療患者。使用載體可以將正常靶基因的一或多個拷貝或者指導具有靶基因功能的正常靶基因蛋白質產生的基因部分插入細胞中,所述載體除了將DNA導入細胞中的其他微粒如脂質體之外,還包括但非限于腺病毒載體、腺伴隨病毒載體和逆轉錄病毒載體。另外,可利用如上述那些技術將正常靶基因序列導入人體細胞中。然后將含有表達基因序列的正常靶基因的細胞、優選自體細胞導入或者再導入患者一定部位中以改善癥狀。當例如靶基因產物是分泌的胞外基因產物時,優選這種細胞置換技術。藥物制備與給藥方法經鑒別抑制靶基因表達、合成和/或活性的化合物可以治療有效量給予患者,以治療或降低NPC轉移。治療有效量是指足以使得癥狀改善的化合物的量。有效量所述化合物的毒性和治療效果可以通過標準藥物學方法在細胞培養物或實驗動物中確定,例如確定LD50(50%致死量)和ED50(50%治療有效量)。毒性與治療作用之間的劑量比率為治療指數,其可以LD50/ED50比率表示。顯示較高治療指數的化合物是優選的。當使用呈現毒性副作用的化合物時,應仔細設計輸送系統以將這種27化合物靶向受影響組織部位,使得對未受影響的細胞的潛在損害最小化,從而降低副作用。得自細胞培養物分析和動物研究的數據可用于制定用于人體的劑量范圍。這種化合物的劑量優選包括ED50的循環濃度范圍,在所述濃度范圍毒性很低或無毒性。所述劑量根據應用的劑型和給藥途徑而可以在這個范圍內變化。對于本發明方法中使用的任何化合物而言,治療有效量最初可以從細胞培養物分析中估算。可以在動物模型中配制藥劑以達到這樣的循環血漿濃度范圍,其中包括在細胞培養物中確定的IC50(即達到癥狀的半數最大抑制的測試化合物濃度)與相同水平的范圍。這個信息可用于更精確地確定在人體中的有效劑量。血漿中的水平可以例如通過高效液相層析技術測量。配制及應用根據本發明應用的藥物組合物可以使用一或多種生理學可接受的載體或賦形劑以常規方式配制。因此,可以配制所述化合物及其生理學可接受的鹽和溶劑化物,以通過吸入或吹入法(通過口或鼻)或者口服、含服、腸道外或直腸給藥方式給予。對于口服給予方式,藥物組合物可以是例如通過常規方式用藥物學可接受的賦形劑配制的片劑或膠囊,所述賦形劑如結合劑(例如預糊化的玉米淀粉、聚乙烯吡咯垸酮或羥丙基甲基纖維素)、充填劑(例如乳糖、微晶纖維素或磷酸氫鈣)、潤滑劑(例如硬脂酸鎂、滑石或硅石)、崩解劑(例如馬鈴薯淀粉或羧甲淀粉鈉(sodiumstarchglycolate)),或者增濕劑(例如十二垸基硫酸鈉)。片劑可以通過本領域熟知的方法包被。口服的液體制品可以是例如溶液、糖漿或懸浮液形式,或者可以是干品,在使用之前用水或其他合適載體組建。這種液體制品可以通過常規方式用藥物學合適的添加劑制備,所述添加劑如懸浮劑(例如山梨醇糖漿、纖維素衍生物或氫化可食用脂肪)、乳化劑(例如卵磷脂或阿拉伯樹膠)、非水溶液載體(例如杏仁油、油脂、乙醇或分餾的植物油),及防腐劑(例如甲基或丙基-p-對羥苯甲酸酯或山梨酸)。所述制品也可以適當地含有緩沖鹽、調味品、色素和甜味劑。口服制品可以適當配制以控制活性化合物的釋放。對于含服方式給藥,組合物可以是以常規方式配制的片劑或錠劑形式。對于吸入方式給藥,本發明使用的化合物是從加壓包裝或噴霧器中以氣霧形式常規給予的,使用合適的推進劑如二氯二氟甲垸、三氯氟甲烷、二氯四氟乙烷、二氧化碳或其他合適的氣體。在加壓氣霧劑情況中,劑量單位可以通過輸送計量數量的閥門控制而確定。用于吸入器或吹入器中的例如凝膠的藥囊(Capsules)和藥筒(cartridges)可以配制為含有所述化合物及合適的粉末基質如乳糖或淀粉的混合粉末的形式。化合物可以配制為用于通過注射經腸道外給予,例如推注或持續輸注而給予。注射配制品可以單位劑量形式存在,例如存在于具有添加的防腐劑的安瓿或多劑量容器中。組合物可以是油相或水相載體中的懸浮液、溶液或乳狀液形式,可以含有配制劑如懸浮劑、穩定劑和/或分散劑。或者,活性成分可以是在使用之前用合適載體如無菌無熱原水組建的粉末形式。化合物也可以配制為經直腸給藥形式,如栓劑或保留灌腸,例如含有常規的栓劑基質如可可油或其他甘油酯。除了前述的配制品之外,化合物也可以配制為儲庫型(depot)制品。這種長效配制品可以通過植入(例如皮下或肌內)或者通過肌內注射給予。因此,例如化合物可以用合適的聚合物或疏水材料或者離子交換樹脂配制,或者配制為難溶的衍生物,例如難溶的鹽。如果需要,則組合物可以存在于包含含活性成分的一或多個劑量形式的包裝或分配器中。所述包裝可例如包含金屬或塑料薄膜,如鋁塑包裝。所述包裝或分配器可以附帶給藥說明書。附圖簡述結合附圖可以更好地認識到本發明的各種特征及伴隨的優勢,其中不同視圖中相同或相似的部分用類似參考特征標出圖1示出了用于基于mRNA轉錄物譜數據產生和確認分子預測因子的策略概述。圖2示出了使用選自96個訓練組(trainingset)病例的798個基因進行的分層聚類分析(hierarchicalclusteranalysis)。各個基因在左側和右側成排示出。各個病例在上方以柱示出。結果表明基因簇聚于6個組中,在左側以有色條柱示出。圖3示出對通過52個基因特征和k-最近鄰分類方法(k-nearestneighborsclassifyingmethod)預測為低遠處轉移風險和高遠處轉移風險病例進行的無轉移生存概率和總體生存概率的Kaplan-Meier分析。所示結果得自獨立的測試組病例。p值用log-rank檢驗計算。圖4示出對通過12個基因特征和邏輯回歸模型預測為低遠處轉移風險和高遠處轉移風險病例進行的無轉移生存的概率和總體生存的概率的Kaplan-Meier分析。所示結果得自獨立的測試組病例。p值用log-rank檢驗計算。圖5示出根據52個基因和12個基因特征的組合預測結果對無轉移生存的概率和總體生存的概率的Kaplan-Meier分析。在兩種特征之間示出不一致結果的病例被認為是"不確定病例"(表6)。示出一致結果的病例分類為低或高遠處轉移風險的類別。當對比低風險和高風險特征組的無轉移和總體生存期時,p值分別O.OOOl和0.002。不確定組與低風險或高風險'組之間在無轉移生存期(p-0.09和0.05)和總體生存期(p-0.31和0.09)之間無顯著差異。p值用log-rank檢驗計算。圖6示出對有和無遠處轉移的III期或IVa/b期NPC患者之間總體生存期和無轉移生存期的概率的Kaplan-Meier分析。這項研究中包括的大多數患者在1997年至2002年之間根據制定的方案開始接受治療,隨后定期進行。上面一組示出四組患者的總體生存期曲線。有106名III期患者不發生遠處轉移,27名III期患者發生遠處轉移。相似地,有47名IV期患者不發生遠處轉移,35名IV期患者發生遠處轉移。發生和不發生遠處轉移的III期或IV^期患者之間的總體生存期的差異均是顯著的,p值〈0.0001。在發生(p峋.39)或不發生(p《35)遠處轉移的III期和IVa/b期患者之間無顯著差異。下面一組示出最后發生遠處轉移的III期和IVa/b期患者的無轉移生存期的概率。所有III期患者僅用同時的化療-放療和輔助化療治療,而對IVa/b期患者加上維持化療。圖7示出兩個不同操作者之間"存在(present)"的探針集的中位值強度相關性。訓練組中所有NPC樣品均由兩個操作者隨機操作。操作者A操作訓練組中24個無轉移病例和14個陽性轉移病例。操作者B操作35個無轉移病例和18個陽性轉移病例。計算每個操作者操作的病例的每個探針集的標準化表達強度的中位值。結果示出完全的對角線性相關,提示不存在與操作者相關的系統性偏差。圖8示出在探針水平校正實驗偏差的分位數校正(Quantilenormalization)結果。來自6個(I-VI)不同NPC樣品的cRNA樣品分為兩部分,與兩種U133-A基因芯片在不同日期雜交。對于每個病例,在U133-A基因芯片上進行人基因的所有探針集的強度相關性分析,如圖所示。上面一組示出來自未標準化的chp文件的探針集強度的相關性。中間組示出在按比例換算切尾均值為500之后探針集強度的相關性。下面一組示出在將所有人探針集的表達強度經分位數校正為預先確定的標準值之后探針集強度的相關性。結果示出在探針集水平分位數校正有效校正了實驗偏差。不用進一步詳細描述,據信本領域技術人員根據前文描述可以最大程度應用本發明。如下優選的特定實施方案僅是例證了本發明,而無以任何方式限制本發明之意。在前述及如下的實施例中,除非特別指出,則所有溫度均設定為攝氏度,所有部分和百分比均為重量比。在優選的方面中,本發明提供了1.評估鼻咽癌患者發生遠處轉移的風險的方法,所述方法包括評估得自所述患者的樣品中表4禾n5所列基因中的至少一個基因的表達譜。2.如1所述的方法,包括評估表4列出的52個基因中的兩或多個基因的表達譜。3.如1所述的方法,其包括評估表4列出的52個基因的表達譜。4.如3所述的方法,其中對表4所列52個基因的表達的評估是使用表4示出的9個基因簇中的每一個基因簇的回歸模型進行的。5.如4所述的方法,其中洛基分數(logitscore)是針對所述9個基因簇中的每一個基因簇使用表1所示的相應的回歸模型公式產生的。6.如5所述的方法,其中遠處轉移風險的預測規則是通過應用于所述9個基因簇的所述洛基分數的k-最近鄰分類方法而產生的。7.如1所述的方法,包括評估表5列出的12個基因中的兩或多個基因的表達譜。8.如l所述的方法,包括評估表5列出的12個基因的表達譜。9.如8所述的方法,其中表5列出的12個基因的表達的評估是使用邏輯回歸模型進行的。10.如9所述的方法,其中洛基分數是使用表2的回歸模型公式基于所述12個基因的表達譜而產生,所述洛基分數與發生遠處轉移的風險相關聯。11.如IO所述的方法,其中低遠處轉移風險的預測規則是-=1i+e-(洛基分數)12.如6所述的方法,其中將得自所述預測規則的遠處轉移風險與得自第二獨立預測規則的遠處轉移風險進行對比,所述第二預測規則是使用如下公式評估所述風險=1j+e-(洛基分數)其中洛基分數是使用表2的回歸模型公式和表5列出的12個基因的表達譜產生的。13.如12所述的方法,當從這兩種方法中確定的遠處轉移風險均為低或高時,則分別將該風險記錄為低風險或高風險;當所述確定的風險不一致時,則將該風險記錄為不確定。14.如l所述的方法,其中所述表達譜在NPC腫瘤樣品中評估。15.如1所述的方法,其中所述表達譜從mRNA轉錄中產生。16.用于確定鼻咽癌患者中遠處轉移風險的核酸微陣列,其主要由確定下述基因的表達譜的探針組成(a)表4列出的52個基因,(b)表5列出的12個基因或者(c)所述52個及12個基因。17.在介質或試劑盒形式中的集合,其主要由表4列出的所有52個基因和/或表5列出的所有12個基因;和/或所述52個基因的子集或所述12個基因的子集或前述兩個子集組成,在每種情況中所述子集均可有效預測鼻咽癌患者發生遠處轉移的風險。實施例實施例l對在治療之前獲得的原發NPC的138個組織活檢樣品進行mRNA轉錄物譜分析。所述樣品代表NPC患者的兩個相反臨床組在開始治療后三年內發生遠處轉移組(高風險組,n=47)、隨診三年以上的時間內無遠處轉移組(低風險組,n=91)。將138個樣品的2/3隨機確定為訓練組,1/3隨機確定為測試組。進行監督分析(Supervisedanalyses)以揭示訓練組(r^96)中與發生遠處轉移相關的基因表達特征。所揭示的分子預測因子在單獨的42個樣品的測試組中確證。患者選擇和腫瘤組織可利用在臺灣臺北辜公亮基金會和信治癌中心腫瘤庫(KF-SYSCC)于1992年至2004年收集的375名NPC患者的原發腫瘤的新鮮冷凍的活檢組織樣品進行總RNA提取。獲得所有患者的書面知情同意書,并且這項研究獲得倫理委員會的許可。105名患者的RNA嚴重降解,將其從該研究中排除。在剩余的270個樣品中,僅138個樣品符合如下任一標準,選擇用于該研究中。針對留待選用的患者的第一項選擇標準是其未發生遠處轉移及在開始治療的三年或更多年內定期隨診。這組患者(11=91)稱作遠處轉移臨床低風險組。針對留待選用的患者的第二個選擇標準是其在接受首次治療時已經發生遠處轉移或者在開始治療的三年內發生遠處轉移。遠處轉移是指NPC在肺、骨、肝、腎、腦及其他內臟器官中的轉移。經過細針穿刺活檢或者穿刺活檢經組織學檢測證實轉移。這組患者(11=47)稱作遠處轉移臨床高風險組。在1995年至2004年之間收集所有符合條件的患者的原發腫瘤組織活檢樣品,排除在1992年收集的一個樣品。大多數樣品(83%)在1998年至2001年收集。患者年齡在診斷時為11至71歲,中值和平均值分別為44和45歲。在最初診斷和分期后,根據擬定方案對患者進行治療31。后續的治療時間的中值和平均值分別為3.34和3.29年。在后續的治療期間,29名患者死亡,其中28名患者為臨床高風險組成員。根據1997AJCC規定對NPC患者進行分期。mRNA轉錄物譜分析研究使用Trizol試齊U(Invitrogen,Carlsbad,CA),根據廠商指導從于液氮中冷凍的組織中分離總RNA。使用RNAEasyMini試劑盒(Qiagen,Valencia,CA)對分離的RNA進一步純化,在Agilent2100生物分析儀(AgilentTechnologies,Waldbronn,Germany)中通過RNA6000Nano分析定性。用于基因表達譜研究的所有RNA樣品的RNA分子完整性指數(RNAIntegrityNumber,RIN)均在6.0至10.0之間(7.8±1.1,平均值士SD)之間。根據Affymetrix方案從總RNA中制備雜交耙,并與AffymetrixU133A基因芯片雜交。所述U133A基因芯片含有大約13,000個人體基因的22,238個探針集。所述陣列的特征為常見那樣,例如在Affymetrix網站(www.affVmetrix.com/products/arravs)詳細描述。簡而言之,從每個樣品的8嗎總RNA中合成雙鏈cDNA。生物素標記的互補RNA(cRNA)通過從cDNA中體外轉錄而產生。在雜交之前純化所述cRNA并經化學方式片段化。根據生產商的方案組合特定量的片段化cRNA、探針陣列對照、牛血清白蛋白和鯡精DNA以制備混合物。將所述cRNA混合物與寡核苷酸探針在U133A基因芯片上在45'C雜交16小時。在雜交后,使用EukGEWS2v4方案將雜交的探針陣列在Affymetrix基因芯片洗滌工作站400中進行自動洗滌和染色。之后在AffymetrixGeneArray掃描儀2500中掃描U133A基因芯片。微陣列數據的換算與標準化i吏用AffymetrixMicroarrayAnalysisSuite(MAS)5.0軟^牛,通過靶修正均值500換算確定每個基因的表達強度。U133A基因芯片上經換算的所有人體基因的表達強度以基數2進行對數轉換,使用分位數校正方法標準化32。分位數校正的參考標準預先在我們的實驗室中從164個原發NPC、15個正常鼻咽部組織及23個轉移的NPC的U133A基因芯片數據中確定。見2004年12月20日的USSN11/015,764及2004年3月28日的USSN11/090,294所述,所述文獻在此以其全部內容并入作參考。其他U133A基因芯片數據的定性測量數據包括作為"存在"而可察覺的基因的百分比(52.1±5.8%,平均值±SD),及GAPDH3,與5,的比率(0.96士0.18,平均值士SD)。這兩個參數均支持樣品和分析的良好總體質量。實施例II數據的統計學分析應用的統計學分析方法在圖1中概括示出。樣品分為訓練組和測試組在我們的研究所包括的138個NPC病例中,91個病例在開始首次治療后不發生任何遠處轉移并隨診超過三年。這91個病例分類為臨床低遠處轉移風險組。在剩余的47個病例中,在首次治療或者在開始首次治療后的三年內均發生遠處轉移。將其分類為臨床高遠處轉移風險組。對于所有患者,首次診斷日期與首次治療日期之間的平均間隔為20±51天(平均值士SD)。使用SAS軟件(版本9.1)將每個風險組2/3的患者隨機指定為訓練組(SAS軟件可得自SASInstituteInc.,Cary,NC.)。1/3的患者指定為測試組。對低風險組患者根據性別、年齡(^和>45歲)、1997AJCCTNM分期(I和II期對III和IV期)、后續治療時間(^和>4.5年)分出層次。對高風險組患者根據性別、年齡、TNM分期及從首次治療至發生遠處轉移的時間(S和>1.5年)分級。在訓練組中有62個低風險病例和34個高風險病例;在獨立的測試組中有29個低風險病例和13個高風險病例。所述獨立的測試組樣品不參與訓練過程。選擇用于分析的基因僅選擇通過AffymetrixMAS5.0軟件在排除測試組樣品的所有NPC樣品中確定"存在"其表達的探針進行分析。首先使用GeneLinkerPlatinum4,5軟{牛(PredictivePatternsSoftware,Inc.,Irwerary,Canada),對每個基因經標準化和對數轉換的表達數據在低風險組和高風險組之間進行Kruskal-Wallis檢驗分析。選擇p值0.05的798個基因通過自組織映射(SOM)方法(GeneLinkerPlatinum4.5software)進行進一步研究。SOM分析通過SOM分析所述798個基因。SOM分析的參數包括基因方向、距離的Pearson相關系數、及2(高度)X3(寬度)的一維映像(mapdimension)。對于參考向量和算法性質,使用默認值。2X3維數的選擇根據對訓練組病例798個基因的分層聚類分析進行(圖2)。這種方法提供了選擇SOM分析映射范圍的客觀方式。將所有798基因分為六個不同SOM基因簇(I至VI)。使用SPSS9.0軟件(SPSS,Inc.,Chicago,Illinois)通過二元前進法邏輯回歸進一步選擇每個SOM基因簇中的基因。前進法邏輯回歸的入口(Entry)和去除(removal)p值分別為O.05和〉0.1。在邏輯回歸分析之后,選自SOM基因簇II、V和VI的基因數目分別為6、6和5。在邏輯回歸期間,SOM基因簇I、III和IV被完全分離。隨后,對SOM基因簇I、m和IV的基因單獨進行二維SOM分析。SOM基因簇Ia、Ib、IIIa、IIIb、Iva和IVb中選擇的基因的所得數目分別為9、5、8、4、6和3。因此,在九個SOM基因簇中有52個基因。預測方法的確立確立鑒別發生高遠處轉移風險的NPC患者的兩種預測方法。第一種方法基于九個SOM基因簇中的52個基因。針對每個基因簇的基因建立回歸模型。每個回歸模型的公式列于表l。針對每個樣品從每個公式中產生洛基分數(logitscore)。訓練組中每個樣品的九個洛基分數(logitscore)用于產生預測規則,使用SAS9.0軟件通過k-最近鄰(k-NN)分類方法進行。使用訓練組獨立檢驗l、3、5、10和30的"k"值。進行Leave-one-out交叉驗證。根據leave-one-out交叉驗證,檢驗的k值為10時提供最佳結果,選擇其進行預測方法。第二種預測方法基于得自原始SOM基因簇I中197個基因的12個基因。如上所述,在使用前進法選擇分析進行邏輯回歸期間三個SOM基因簇示出完全分離。結果提示這三個SOM基因簇的潛在亭度預測價值。為了鑒別哪個SOM基因簇的基因可以可靠地用于預測,38使用訓練組病例通過二元前進法邏輯回歸(SPSS9.0軟件)從每個SOM基因簇中選擇基因,基因的選擇在發生完全分離之前正確停止。從每個基因簇中選擇的基因用于產生洛基分數(logitscore),將其用于估算概率。概率高于0.5則指定為低遠處轉移風險,概率低于0.5則指定為高遠處轉移風險。結果示出使用訓練組病例從SOM基因簇沖選擇的12個基因產生最佳結果。基于SOM基因簇I中12個基因的回歸模型的公式示于表2。生存期分析使用SAS9.0軟件通過Kaplan-Meierlogrank檢驗進行無轉移生存期和總體生存期分析。生存期解釋為首次治療開始日期至最后一次隨診日期或死亡日期之間的期間。無轉移生存期是指首次治療開始日期至首次診斷遠處轉移的日期之間的期間。實施例III結果概述正如所示出的,確定兩個預測因子鑒別處于發生高遠處轉移風險或低遠處轉移風險中的NPC患者。第一個預測因子基于在九個不同的自組織映射聚類數(selforganizingmapsclusters)中的52個基因和k-最近鄰分類方法。第二個預測因子基于12個基因和邏輯回歸模型。這兩種方法均可強烈預測獨立的測試組病例中短的遠處轉移間隔期和短的總體生存期。這兩種方法在獨立的測試組中估定的總精確率分別為81%和76%。當組合這兩種預測方法時,精確率增加至85%。高風險特征組與低風險特征組之間的估計的發生遠處轉移風險比為ll.l(95%置信區間2,4-52.4,p=0.002)。患者的特征為了鑒別預測處于發生高或低遠處轉移風險并具有不良或良好總體生存期的NPC患者的基因特征,在兩組臨床充分確定的NPC患者之間進行監督分析。已經充分認識到在首次治療后三年內不發生遠處轉移的NPC患者具有良好的長期無轉移生存期和總體生存期31,33。相反,在首次治療時或之后的三年內發生遠處轉移的NPC患者通常死于該疾病及具有不良的生存期。在我們研究的138名患者中,91名患者屬于臨床低風險組,47名患者屬于臨床高風險組。隨機指定2/3的低風險患者和高風險患者為訓練組,1/3的患者為測試組。這些患者的特征示于表3。在低風險組和高風險組訓練組與測試組病例之間列出的臨床特征無顯著差異。另外,訓練組(r^34)和測試組(n-13)的遠處轉移部位的分布為骨50%vs69%,肝50。/。vs54。/。,肺38%vs23%,其他部位15%vs23%。其他部位包括腦、腎、脾和盆腔器官。兩組之間分布相似。實施例IV通過52個基因的特征預測遠處轉移為了鑒別預測基因,進行高度監督分析。這項研究中僅使用在排除測試組病例后所有NPC樣品中通過AffymetrixMAS5.0軟件可以確定為"存在"的基因(4,814個探針集)。然后在訓練組的臨床低風險組和臨床高風險組之間進行Kruskal-Wallis檢驗。選擇示出其表達顯著差異(p<0.05)的798個基因進一步研究。使用選擇的798個基因對訓練組病例進行無人監督的分層聚類分析。結果示出六個主要基因簇(圖2)。基于分層聚類分析結果,選擇2X3的一維映像進行SOM分析。每個SOM簇中的大多數基因聚集在一起,與通過分層聚類分析產生的基因簇平行。所述六個SOM簇的每一基因簇中的基因通過邏輯回歸進一步分析,在訓練組中用前進法選擇低風險和高風險病例。三個SOM簇基因示出完全分離的問題。這三簇中每簇的基因通過SOM針對兩個亞簇進一步分析。從九個SOM基因簇中選擇共52個基因,用于產生針對遠處轉移的預測模型。這52個基因概括示于表4中。用于從每個SOM簇中基因中確定洛基分數(logitscore)的公式示于表l。因此,從每個病例的所述52個基因的表達強度中產生9個洛基分數(logitscore)。訓練組中每個病例的所述9個洛基分數(logitscore)用于通過k-NN分類方法建立預測規則。針對預測規則的Leave-one-out交叉驗證示出預測訓練組病例遠處轉移為高風險的特異性和靈敏性分別為98%(61/62)和88%(30/34)。總精確率為95%(91/96)。當根據確定的預測規則分析獨立的測試組病例(n-42)時,特異性、靈敏性和總精確率分別為86%(25/29)、69%(9/13)和81°/。(34/42)。針對相關性(association)的Fisher,s確切概率法(exacttest)(p-0.0007)證實所述52個基因預測因子的穩健性(robustness)。就遠處轉移和較短總體生存期而言,預測的高風險特征組與低風險特征組之間估計的危險性比(estimatedhazardratio)分別為7.1(p=0.002,95%置信區間2.2-23.5)和5.4(p=0.001,95%置信區間1.5-19.4)。當對比預測為低遠處轉移風險(11=29)或高遠處轉移風險(11=13)測試組中的患者的無轉移生存期和總體生存期時,預測為具有高遠處轉移風險的患者具有顯著較短的無轉移生存期(p-0.0001)和較短的總體生存期(pi.003)(圖3)。實施例V通過12個基因特征預測遠處轉移第二種預測方法基于通過邏輯回歸分析中SOM簇I中的基因中選擇的12個基因。用于計算低遠處轉移風險的概率的公式在表2中概述。所述12個基因列于表5中。當所述12-基因預測規則應用于所述獨立的測試組病例(n-42)時,預測高風險轉移的靈敏性、特異性和總精確性分別為85%(11/13)、72%(21/29)和76%(32/42)。對于這12個基因預測因子,針對相關性的Fisher,s確切概率法(p-0.0008)證實與所述52個基因預測因子的相似穩健性。就遠處轉移和較短的總體生存期而言,預測的高風險和預測的低風險特征組之間估計的危險性比分別為8.2(p=0.006,95%置信區間1.8-37.4)和6.3(p=0.02,95%置信區間1.3-29.7)。當分析通過12個基因預測因子預測為低風險(n-23)或高風險(n49)病例的無轉移生存期和總體生存期時,'結果示出經預測為高遠處轉移風險的患者具有顯著較短的無轉移生存期(p-0.0007)和總體生存期0)=0.007)(圖4)。實施例VI通過組合特征預測遠處轉移當分析實施例IV和V的兩種預測方法的結果在獨立測試組病例中的一致性時,有22例(52%)由這兩種方法均預測為低風險病例及12例(29%)預測為高風險病例(表6)。有8例(19%)在這兩種方法之間不一致,認為是不確定病例。在一致的情況中(11=34),有5例是錯誤預測病例,3例是假陽性及2例是假陰性病例。因此,總精確率為85%(29/34)。就遠處轉移和較短的總體生存期而言,高風險與低風險特征組之間的估計的危險性比分別為U.l(p=0.002,95%置信區間2.4-52.4)和8.5(p=0.009,95%置信區間1.7-42.8)。對經預測為低風險、高風險和不確定的病例進行生存期分析表明高風險病例較經預測為低風險的那些病例具有明顯較差的無轉移生存期和總體生存期(圖5)。低風險和不確定病例之間無轉移生存期與總體生存期之間的差異無統計學意義。實施例VIIIII期和IV期NPC患者之間生存期對比為了認識到確定的預測方法的潛在臨床效果,收集i33個m期和82個Iva和IVb(IVa/b)期NPC患者的臨床資料。在這些患者中,僅90例是上述mRNA轉錄物譜分析研究的一部分。所有患者均已經根據擬定的方案31在1997年至2003年之間進行治療及后續的隨診。將TNMm或IVa/b期患者根據隨后遠處轉移的發生而進一步分為兩組。對比這四組患者的總體生存期和無轉移生存期。結果示出隨后發生遠處轉移的III期NPC患者的總體生存期與無轉移生存期與也發生遠處轉移的IVa/b期患者(n-35)的總體生存期和無轉移生存期相似(圖6)。相反,未發生遠處轉移的III期(i^l06)或IVa/b期(n4:7)患者較發生遠處轉移的那些患者具有較好的總體生存期(圖6)。結果表明在III期或IV^b期患者中存在兩個不同組。一組呈現發生遠處轉移的低風險水平及良好的臨床結果。另一組在開始治療的三年內發生遠處轉移并具有不良的生存結果(圖6)。這些發現支持了這樣的觀點,即對于處于發生高遠處轉移風險中的患者的精確預測不僅具有重要的預知意義,而且還提供了選擇合適患者測試新的治療形式以改善長期治療效果的方式。參考文獻1.Lo,W.K.,To,K.F.&Huang,D.P.Focusonnasopharyngealcarcinoma-CancerCell5,423-428(2004).2.Altun,Metal.Undifferentiatednasopharyngealcancer(UCNT):currentdiagnosticandtherapeuticaspects.Int.J.Radiat.Oncol.Biol.Phys.32:859-877(1995).3.Young,L.S.&Riskinson,A.B.Epsein-Barrvirus:40yearson.NatureRevCancer4:757-768(2004).4.Cohen,J丄Epstein-Barrvirusinfection.NewEngJMed343,481-492(2000).5.Yu,M.C.Nasopharyngealcarcinoma:EpidemiologyandDietaryFactorspp.39-47.Lyon:IARC,(1991)6.Ho,J.Nasopharyngelcarcinoma.Adv.CancerRes.15:59-72(1972)7.Yeh,S.&Cowdry,E.IncidenceofmalignanttumorsinChinese.Cancer7:425-436,1954.8.Yu,M.C.&Henderson,B.E.Nasopharyngealcancer.In:SchottenfieldD,FraumeniJF,eds.Cancerepidemiologyandprevention.2nded.NewYork:OxfordUniv.Press1996:603-18.9.Fandi,A.etal.Nasopharyngealcancer:epidemiology,staging,andtreatment.Semin.Oncol.21:382-397(1994).10.Vikram,B,etal.Patternsoffailureincarcinomaofthenasopharynx:failureatdistantsites.HeadNeckSurg.8:276-279(1986).11,Hung,S.C.Nasopharyngealcancer:areviewof1605paatientstreatedradicallywithcobalt60,Int.J.RadiatOncol.Biol.Phys.6:401-407(1980).12.Geara,F.B.etaLCarcinomaofthenasopharynxtreatedbyradiothera[yalone:determinantsofdistantmetastasisandsurvival.Radiother.Oncol,43:53-61(1997).13.Perez,C.A.etal.Carcinomaofthenasopharynx;factorsaffectingprognosis.Int.J.Radiat.Oncol.Biol.Phys.23:271-280(1992).14.Lee,A.W.M.etal.Retrospectiveanalysisof5037patientswithnasopharyngealcarcinomatreatedduring1976-1985:overallsurvivalandpatternsoffailure.Int.J.Radiat.Oncol.Biol.Phys.23:261-270(1992).15.Agulnik,M&Siu,L丄.State-of-the-artmanagementofnasopharyngealcarcinoma:currentandfuturedirections.Br.J.Cancer92:799-806(2005).16.LangendijkJA,LeemansCR,ButerJ,eta;/Theadditionalvalueofchemotherapytoradiotherapyinlocallyadvancednasopharyngealcarcinoma:ameta-analysisofhepublishedliterature.JClinOncol2004;22:4604-4612.17.Chang,J.T-C.etaLNasopharyngealcarcinomastagingby9180F-fluorodeoxyglucosepositronemissiontomography.Int.J.Radiat.Oncol.Biol.Phys.62:501-507(2005).18.Perou,C,M.etal.Molecularportraitsofhumanbreasttumours.Nature406:747-752(2000).19.AlizadehAA,EisenMB,DavisRE,etal.DistincttypesofdiffUselargeB-celllymphomaidentifiedbygeneexpressionprofiling.Nature2001;405:503-511.20.KhanJ,WeiJS,RingerM,etal.Classificationanddiagnosticpredictionofcancersusinggeneexpressionprofilingandartificialneuralnetworks.NatureMed2001;7;673-679,21.DyrskjotL,ThykjaerT,KruhofferM,etal.Identifyingdistinctclassesofbladdercarcinomausingmicroarrays.NatureGent2003;33:90-96.22.BullingerL,DohnerK,Blaire,etal.Useofgene-expressionprofilingtoidentifyprognosticsubclassesinadultacutemyeloidleukemia.NewEngJMed2004;350:1605-1615.23.van'tVeerLJ,DaiH,vandeVijverMJ,etal:Geneexpressionprofilingpredictsclinicaloutcomeofbreastcancer.Nature2002;415:530-536.24.PomeroySL,TamayoP,GaasenbeekM,etal.Predictionofcentralnervoussystemembryonaltumouroutcomebasedongeneexpression.Nature2002;415:436-442.25.ShippMA,RossKN,TamayoP,etal.DiffUselargeB-celllymphomaoutcomepredictionbygene-expressionprofilingandsupervisedmachinelearning.NatureMed2002;8:68-74.26.RosenwaldA,WrightG,ChanWC,etal.TheuseofmolecularprofilingtopredictsurvivalafterchemotherapyfordiffuselargeB-celllymphoma.NewEngJMed2002;346:1937-1947.27.HuangE,ChengSH,DressmanH,etal.Geneexpressionpredictorsofbreastcanceroutcome.Lancet2003;361:1590-1596.28.AyersM,SymmansWF,StecJ,etal.Geneexpressionprofilespredictcompletepathologicresponsetoneoadjuvantpaditaxelandfluorouracil,doxorubicin,andcyclophosphamidechemotherapyinbreastcancer.JClinOncol2004;22:2284-2293.29.MazzantiC,ZeigerMA,CostourpusN,etal.Usinggeneexpressionprofilingtodifferentiatebenignversusmalignantthyroidtumors.CancerRes2004;64:2898-2903.30.RoepmanP,WesselsLFA,KettelarijN,etal.Anexpressionprofilefordiagnosisoflymphnodemetastasisfromprimaryheadandnecksqua咖ouscellcarcinoma.NatureGenetics2005;37:182-186.31.ChengSH,TsaiSYC,YenKL,etal.Prognosticsignificanceofparapharyngealspacevenousplexusandmarrowinvolvement;potentiallandmarksofdisseminationforsatgeI-IIInasopharyngealcarcinoma.IntJRadiatOncolBiolPhys2005;61:456-465.32.BolstadBM,IrizarryRA,AstrandM,etal.Acomparisonofnormalizationmethodsforhighdensityoligonucleotidearraydatabasedonvarianceandbias.Bioinformatics2003;19:185-193.33.LeeAWM,SzeWM,AuJSK,etal.Treatmentresultsfornasopharyngealcrcinomainthemodernera:thehongKongExperience.IntJRadiatOncolBiolPhys2005;61:1107-1116.34.YokotaS,YamamotoY,ShimizuK,etal.IncreasedexpressionofcytosolicchaperoninCCTinhumanhepatocellularandcoloniccarcinoma.CellStressChaperones2001;6:345-350.35.LiuH,LiJ&WongL.Useofextremepatientsamplesforoutcomepredictionfromgeneexpressiondata.Bioinformatics2005;21:3377-3384.36.SimonR,RadmacherMD,DobbinK,etal.PitfallsintheuseofDNAmicroarraydatafordiagnosticandprognosticclassification.JNCI2003;95:14-18.37.ChangY,LeeTC,LiJC,LaiTL,ChuaHH,ChenCL,DoongSL,ChouCK,SheenTS,TsaiCH.Differentialexpressionofosteoblast鄰ecificfactor2andpolymericimmunoglobulinreceptorgenesinnasopharyngealcarcinoma.HeadNeck.2005Aug3138.FangWY,LiuTF,XieWB,YangXY,WangS,RenCP,DengX,LiuQZ,HuangZX,LiX,DingYQ,YaoKT.Reexploringthepossiblerolesofsomegenesassociatedwithnasopharyngealcarcinomausingmicroarray-baseddetection.ActaBiochimBiophysSin(Shanghai).2005Aug;37(8):541-6.39.LungHL,BangarusamyDK,XieD,CheungAK,ChengY,KumaranMK,MillerL,LiuET,GuanXY,ShamJS,FangY,LiL,WangN,ProtopopovAI,ZabarovskyER,TsaoSW,StanbridgeEJ,LungML.THY1isacandidatetumoursuppressorgenewithdecreasedexpressioninmetastaticnasopharyngealcarcinoma.Oncogene,2005Jun20;[Epubaheadofprint]40,ZhangB,NieX,XiaoB,XiangJ,ShenS,GongJ,ZhouM,ZhuS,ZhouJ,QianJ,LuH,HeX,LiX,HuG,LiG.Identificationoftissue-specificgenesinnasopharyngealepithelialtissueanddifferentiallyexpressedgenesinnasopharyngealcarcinomabysuppressionsubtractivehybridizationandcDNAmicroarray.GenesChromosomesCancer.2003Sep;38(l):80陽90.41.GuoX,LuiWO,QianCN,ChenJD,GraySG,RhodesD,HaabB,StanbridgeE,WangH,HongMH,MinHQ,LarssonC,TehBT.Identifyingcancer-relatedgenesinnasopharyngealcarcinomacelllinesusingDNAandmRNAexpressionprofilinganalyses.IntJOncol.2002Dec;21(6):l197-204.42.HuiAB,LoKW,TeoPM,ToKF,HuangDP.Genomewidedetectionofoncogeneamplificationsinnasopharyngealcarcinomabyarraybasedcomparativegenomichybridization.IntJOncol.2002Mar;20(3):467-73.43.SooR,PuttiT,TaoQ,GohBC,LeeKH,Kwok-SengL,TanL,HsiehWS.Overexpressionofcyclooxygenase-2innasopharyngealcarcinomaandassociationwithepidermalgrowthfactorreceptorexpression.ArchOtolaryngolHeadNeckSurg.2005Feb;l31(2):147-5244.LeeSW,ChoKJ,ParkJH,KimSY,NamSY,LeeBJ,KimSB,ChoiSH,KimJH,AhnSD,ShinSS,ChoiEK,YuE.ExpressionsofKu70andDNA-PKcsasprognosticindicatorsoflocalcontrolinnasopharyngealcarcinoma.IntJRadiatOncolBiolPhys.2005Aug1;62(5):1451-7.45.MaBB,PoonTC,ToKF,ZeeB,MoFK,ChanCM,HoS,TeoPM,JohnsonPJ,ChanAT,Prognosticsignificanceoftumorangiogenesis,Ki67,p53oncoprotein,epidermalgrowthfactorreceptorandHER2receptorproteinexpressioninundifferentiatednasopharyngealcarcinoma—aprospectivestudy.HeadNeck.2003Oct;25(10):864-72.46.FariasTP,DiasFL,LimaRA,Kligerm肌J,deSaGM,BarbosaMM,GoncalvesFBJr.Prognosticfactorsandoutcomefornasopharyngealcarcinoma.ArchOtolaryngolHeadNeckSurg-2003JuI;129(7):794-9.47.HsiaoJR,JinYT,TsaiST,ShiauAL,WuCL,SuWCConstitutiveactivationofSTAT3andSTAT5ispresentinthemajorityofnasopharyngealcarcinomaandco訂elateswithbetterprognosis.BrJCancer.2003Jul21;89(2):344-9.48.ChanAT,LoYM,ZeeB,ChanLY,MaBB,LeungSF,MoF,LaiM,HoS,HuangDP,JohnsonPJ.PlasmaEpstein-BarrvirusDNAandresidualdiseaseafterradiotherapyforundifferentiatednasopharyngealcarcinoma.JNatlCancerInst.2002Nov6;94(21):1614-9.49.MaJ,Nicholas,TerryHA,LinSX,PatelN,MaiHG,HongMH,LuTX,CuiNJ,MinHQ.PrognosticsignificanceofDNAploidyandproliferativeindicesinpatientswithnasopharyngealcarcinoma.AiZheng.2002Jun;21(6):644-50.50.RubioL,BurgosJS,Lopez-GuerreroJA,MoreraC,Vera-SempereFJ.Expressionofp53proteinandtumorangiogenesisasprognosticfactorsinnasopharynge.alcarcinomapatients.PatholResPract.2002;198(2):97-102.51.FujiiM,YamashitaT,IshiguroR,TashiroM,KameyamaK.Significanceofepidermalgrowthfactorreceptorandtumorassociatedtissueeosinophiliaintheprognosisofpatientswithnasopharyngealcarcinoma.AurisNasusLarynx.2002Apr;29(2):175-81.52.oYM,ChanAT,ChanLY,LeungSF,LamCW,HuangDP,JohnsonPJ.MolecularprognosticationofnasopharyngealcarcinomabyquantitativeanalysisofcirculatingEpstein-BarrvirusDNA.CancerRes.2000Dec15;60(24):6878-81.53.HengDM,WeeJ,FongKW,LianLG,SethiVK,ChuaET,YangTL,KhooTanHS,LeeKS,LeeKM,TanT,ChuaEJ.Prognosticfactorsin677patientsinSingaporewithnondisseminatednasopharyngealcarcinoma.Cancer.1999Nov15;86(10):1912-20,54.GuoX,MinHQ,ZengMS,QianCN,HuangXM,ShaoJY,HouJH.nm23-Hlexpressioninnasopharyngealcarcinoma:correlationwithclinicaloutcome.IntJCancer.1998Dec18;79(6):596-600.°魏^殺^鵬姐彩《齡^->1:R菌i射'(woosi!soo凝^愛裕冀44^g《明fp「《w。盈翻頃挲W梨對明啄甚^VNH"i明奪扭貌革點姿挲去竊裕斜奪招紛x!JPm4jv明+^班+厶9厶9'lx(ib—卯oe:OZ)+90£Z/Zx(ib—x—S06乙02)+IS8S7x(ib—99S10Z)=I八丄IDCn—————(沖0Z/S-)x(ib—x一s[aO乙)+(Sl78S.Z.)x(ib—s—z_soiOZ)+(S8£9,Z-)x(ib—s—iZ600乙)=八丄IOCH—————+(86S6'o-)x(ib一s—69乙is乙)+(19wn-)x(ib—x">88nz)+aosr乙-)x(w—hkoz)=q八i丄19cn£0£^乙乙+》6乙1^-)x(1B一8it^9)+88丄£'£x(IB—6S98[乙)+SW乙工(1B—696厶I乙)+(8S"'I-)x(1B、smZ)+(9W"x(ib—n6乙I乙)+(t6l9'乙-)x8AI10乙)=b八I丄IDOl+8WZx(IB—乙si60。+^Or乙x(18—s一S9厶80。+SS6"x(IB—o咖OZ)=qill丄IOCH—_86'厶11-(9092'乙-)x(p:s—£1611乙)+(9Z"卞-)X(1B:s〕乙sl乙)+x(1B:x:sniI乙)+I0£8.Zx(1B:s—86980Z)+(S088'l.)二x—t^S卯Z)+91S6'Ax(ib—s—IOKO乙)+WI6'£x(ib—乙179I0乙)+IS980x(ib—s—£乙o乙)=Bni丄IDOl—————6W9Zl(lW。x(IB—x—I乙)+(£8Wl-)xOlB—s—t^SOZ)+(9厶88.e歷)x(W一s—9厶600乙)=II丄IDCH——A600'6A(926!£-)xx—t6W乙Z)+A0't^丄lB—£厶681乙)+ioii'Zx(IB—s—o厶8U乙)+W00Tx(IB—x—isi"乙)+££W2x(IB—s—%8102)=qi丄IOOl——906^81Z8Zfr.tx(IB—s—ilog^十("外T-)x乙9乙frTx(IB—s—sun^+3027x(IB—/^乙乙i乙)+£[167x(IB—x—66980Z)+Z^(^'Sx(IB—s—>n80。+SW9'£x(IB—"KO乙)+(SZS6'fr-)x(IB—016003)+SW9卞q^OOZ)=bi丄I9CH^否明蔬翁曰回輯盈明図耷明薪菜小翁園耷WOS+Vi封1挲雖,s/a憲法能改£了9Z^008900S表2:用于基于12個基因的表達強度計算洛基分數(logitscore)以估計遠處轉移的風險的公式計算洛基分數的邏輯回歸模型公式:<formula>formulaseeoriginaldocumentpage50</formula>計算低遠處轉移風險的概率的公式<formula>formulaseeoriginaldocumentpage50</formula>7:洛基分數;低遠處轉移風險的概率;《:常數;系數;X:每一探針集的標準化強度括號中的Affymetrix探針集標識數字表示指定探針集的mRNA轉錄的標準化表達強度。從列出的公式計算洛基分數,用于估計低遠處轉移風險的概率。概率>0.5認為是低遠處轉移風險。概率0.5認為是高遠處轉移風險。表3:138名患者的臨床特征<table>tableseeoriginaldocumentpage51</column></row><table>*:所有臨床低風險案例均已經隨診三年以上,未發生遠處轉移。**:所有臨床高風險案例在首次治療后的三年內均已經發生遠處轉移列出的參數在訓練組和測試組患者分布中無統計學顯著差異表4:預測遠處轉移選擇的9個基因簇<table>tableseeoriginaldocumentpage52</column></row><table>表4(續)<table>tableseeoriginaldocumentpage53</column></row><table>表5:通過邏輯回歸法預測遠處轉移的12個基因探針集ID200057sat200842丄at221494—x一at201947—s—at200910—at222011sat基因符號NONO208699xatTKT201892satIMPDH2EPRSEIF3S12CCT2CCT3TCP1基因名稱含有非-POU結構域,八聚體-縛合轉酮酶(Wernicke-Korsakoff綜合癥)IMP(—磷酸肌苷)脫氫酶2谷氨酰-脯氨酰-tRNA合成酶真核翻譯起始因子3,亞基12含有TCP1的伴侶蛋白,亞基2(p)含有TCP1的伴侶蛋白,亞基3(力含有TCP1的伴侶蛋白,亞基l(a)208722—s_atANAPC5后期啟動復合體亞基5201948—atGNL2鳥嘌呤核苷酸結合蛋白質樣2(核仁)218593—atRBM28RNA結合基序蛋白28208114satFLJ12671假設蛋白FLJ12671功能mRNA加工核苷酸代謝,磷酸戊糖途徑核苷酸生物合成蛋白質生物合成蛋白質生物合成蛋白質折疊蛋白質折疊蛋白質折疊遍在蛋白依賴性蛋白質代謝/細胞周期核糖體生源核糖體生源未知加亮的基因在表4中不存在.54表6:基3卩<table>tableseeoriginaldocumentpage55</column></row><table>*:"0"是指低低遠處轉移風險**:"l"是指高遠處轉移風險;***:"9"是指兩種預測方法之間的不一致。本文引用的所有專利申請、專利和出版物的全文在此并入本文作參考。前述實施例可以通過改變本發明在該實施例中所用的一般或特別描述的反應物和/或操作條件而獲得相似的成果。從前文的描述中,本領域技術人員可易于明了本發明的基本特征,在不偏離本發明精神和范圍的前提下,可以對本發明進行各種改變和修改以適應其各種用途和條件。權利要求1.一種評估鼻咽癌患者發生遠處轉移的風險的方法,所述方法包括在來自所述患者的樣品中評估表4列出的52個基因的表達譜,所述評估是使用通過應用于洛基分數(logitscore)的組的k-最近鄰分類方法而產生的預測規則來進行的,所述洛基分數的組是通過使用表1中相應的回歸模型公式針對表4示出的9個基因簇中的每一個基因簇而產生的;使用以下預測規則評估表5中列出的12個基因的表達譜,[低遠處轉移風險的概率]=^_i+e-(洛基分數)其中所述洛基分數(logitscore)是使用表2所示回歸模型公式基于所述12個基因的表達譜而產生;對比得自所述兩個預測規則的遠處轉移風險值,由此當通過這兩種方法確定的遠處轉移風險均為低或高時,則分別記錄為低或高風險,當所述確定的風險不一致時,則記錄為所述風險不確定。全文摘要mRNA轉錄物譜分析可用于闡明原發NPC遠處轉移的分子預測因子。所述預測結果與短的無轉移和總體生存期高度相關。使用基于52個基因和基于12個基因的預測因子(predictor)進行預測。文檔編號C07K14/05GK101313306SQ200680043762公開日2008年11月26日申請日期2006年9月22日優先權日2005年9月22日發明者A·黃,K-j·高申請人:中國合成橡膠股份有限公司