專利名稱:融合基因微陣列的制作方法
融合基因微陣列 背景 癌基因組通常含有融合基因,這些融合基因產生于染色體結構重排之后,例如易 位、缺失和倒位。融合基因通常發(fā)現(xiàn)于血液癌癥。目前已經發(fā)現(xiàn),與檢測到大量的基因組拷 貝數(shù)失衡對比,融合基因僅僅很少地與實體瘤相關。然而,最近報道顯示,可以證實融合轉 錄本通常也對實體瘤的發(fā)生做出貢獻(米特爾曼等人,2007(Mitelman et al. ,2007)、特謝 拉,2006 (Teixeira, 2006)、特姆林斯等人,2005 (Tomlins et al. ,2005))。主要的問題已經 是檢測實體瘤中的融合基因的技術限制。 最近,為了對血液癌癥和一些罕見的實體瘤類型做出鑒別診斷或治療決策而 對某些的融合基因進行了鑒定。目前,實驗室常規(guī)診斷采用繁瑣卻效率低下的分析用 來檢測臨床樣本中的融合基因。這些測試是通常的細胞遺傳學染色體分析(核型分析 (karyotyping)——通常通過吉姆薩(Giemsa)顯帶)和/或對個體新轉錄本中覆蓋了最多 斷裂點的最普遍融合基因進行選擇的逆轉錄聚合酶鏈式反應(RT-PCR)。為了獲得用于核型 分析的中期染色體,大量的新鮮組織材料是必須的,這些組織材料還必須含有活的且正在 分裂的細胞。該方法也是耗時且勞動密集,而成功率僅為約70%。此外,必須請經驗豐富 且稱職的人員對染色體進行視覺的檢測,提供分辨度仍然低的主觀結果。RT-PCR是受到關 注的方法,它能一次對一個或多個候選融合基因在這些基因內預先定義的融合斷點處進行 分析。此方法的主要限制在于,它不是全基因組范圍的,因而得到的陰性結果也無法令人信 服。
背景技術:
已有少數(shù)報道嘗試通過由靶向特異性的連接序列的寡核苷酸微陣列 (oligomicroarrays)來鑒定預定的融合基因。這些依賴于在先一步通過RT-PCR對探針進 行擴增,特異性地靶向預定義的融合基因和該融合基因上的單個連接序列的小的選擇。類 似地,同一基因內的外顯子間的連接寡核苷酸已經被用于檢測選擇性剪接。
那謝德金娜等人,2002(Nasedkina et al. ,2002)利用多重RT-PCR后通過微陣列 來對含有特異性融合轉錄本的PCR產物進行鑒定。他們的微陣列中含有用來對4種已知融 合基因中每一種的最多兩種融合變體進行檢測的探針。PCR擴增是通過特異性引物進行嵌 套的兩輪多重反應完成的。因此,他們設計的方法和微陣列僅能用于鑒定少數(shù)預定的基因 融合。 那謝德金娜等人,2003(Nasedkina et al. ,2003)對上述發(fā)現(xiàn)進行了擴展,從而將 靶向一種額外的融合基因的探針囊括進來,并對247例兒童白血病進行了篩選。作者們目 的仍然僅在于鑒定預定的融合基因,更具體地說,是與兒童白血病有臨床相關性的融合基 因。 史等人,2003(Shi et al. , 2003)利用了多重RT-PCR對7種融合基因進行擴增, 然后用寡核苷酸(oligo)微陣列來鑒定PCT產物,S卩,寡核苷酸靶向每個融合基因上的一個 或兩個位點。與那謝德金娜等人,2002、那謝德金娜等人,2003相似的是,史等人的分析局限于非常少量的已知與白血病有關的預定融合基因。作者聲稱,與那謝德金娜等人,2002、 那謝德金娜等人,2003相反,他們的方法是定量的。而且,史等人,2003在第1069頁上提 到"雖然多重RT-PCR具有10-20個引物對是理想的,但是我們的初步數(shù)據(jù)表明可以通過大 量實驗優(yōu)化的努力而完成引物對超過20個的多重RT-PCR。然而,形成非特異性的PCR產 物和引物二聚體的可能性將隨著引物數(shù)量的增加而增加,這使引物對的最大數(shù)量受到了限 制。"因此,他們意識到了在更高通量的分析中還沒有被滿足的需求,并提出能設計出多于 一個的多重RT-PCR來涵括超過40種融合轉錄本。另外,作者們在第1072頁指出"因為易 位融合剪接位點(translocation fusion splice-junction sites)可以在mRNA上與3'聚 (A)尾部相距數(shù)千堿基對,所以在該階段不能僅使用微陣列進行分析,這是由于逆轉錄酶不 能產生長度足以達到所述融合剪接位點的cDNA。"換而言之,序列特異性的RT-PCR是分析 功能所必需的,而上述理由又反過來限制了該方法的通量。 在例如賓漢等人,2006 (Bingham et al. , 2006)、約翰遜等人2003 (Johnsonet al. ,2003)中,已經在先地描述了寡核苷酸微陣列在前體mRNA(pre-mRNA)剪接模式分析中 的使用。 US 2006/0084105描述了含有多套的用來檢測通過前體mRNA對選擇的基因進行 剪接產生的基因產物的探針的微陣列。該微陣列在含有位于64個基因內的372個剪接位 點。 US 2006/012952和WO 03/014295也涉及了使用微陣列來檢測前體mRNA剪接變 體。 本發(fā)明的詳細描述
圖l為陽性融合基因沖擊(hit)的微陣列數(shù)據(jù)模式。A)它闡述了基因A中內含子2 與基因B中內含子3的序列之間發(fā)生雜交事件的融合基因的實例?;蜷g的外顯子-到-外 顯子連接A2-B4探針(寡核苷酸)對融合轉錄本進行檢測。B)如果基因A和基因B均具 有IO個外顯子,則微陣列需要含有10X10 = 100個探針(寡核苷酸)才能覆蓋全部對于 特定融合基因的外顯子-到-外顯子連接組合。A2-B4探針(寡核苷酸)對來自A部分的
融合轉錄本進行檢測。c)對于各個外顯子和外顯子-到-外顯子連接的基因內探針的縱向
曲線將對融合基因的真事件(true event)提供支持。 圖2為含有TMPRSS2 :ERG融合基因的前列腺癌樣本的微陣列數(shù)據(jù)模式。最左側
的圖顯示了使用嵌合的外顯子-到-外顯子連接探針而得到的結果。該圖中,X軸表示
TMPRSS2基因中的每一個外顯子而Y軸表示了 ERG基因中的每一個外顯子。因此,最左側的 圖顯示了與TMPRSS2的外顯子1和ERG的外顯子4之間的融合轉錄本相對應的嵌合的外顯 子-到-外顯子探針產生了強烈的信號。最右側的圖反應了用基因內探針進行檢測時,ERG 基因內的每一個外顯子的表達水平。 圖3為細胞系RCH-ACV的微陣列數(shù)據(jù),已知RCH-ACV細胞系含有TCF3 :PBX1融合 基因。與圖2相似地,該圖顯示了使用能與TCF3 :PBX1融合基因進行雜交的嵌合的外顯 子-到-外顯子探針而得到的結果(上圖),以及使用分別針對這兩種基因的基因內探針進 行檢測時,TCF3基因和PBX1基因中的各個外顯子的相對表達水平(分別為下方的左圖和右圖)。
發(fā)明內容
本發(fā)明的第一方面提供了一種含有針對融合基因的外顯子-到-外顯子連接的嵌 合探針的微陣列。 本發(fā)明的第二方面為用于融合基因檢測的方法。本發(fā)明的第三方面為含有本發(fā)明 的微陣列的試劑盒。
具體實施例方式
本發(fā)明的第一方面是含有針對融合基因的外顯子-到-外顯子連接的嵌合探針的 微陣列。 特別地,本發(fā)明的微陣列還可以更進一步地包括至少兩個基因內探針,該基因內 探針是針對融合基因的融合基因配偶體(fusion gene partner)的。 包含基因內探針的優(yōu)點在于假陽性結果的可能性得到降低。基因內探針在基因表 達方面提供了外顯子水平數(shù)據(jù),從而能對潛在的融合基因配偶體的疑似斷點的上游和下游 的表達水平進行比較。外顯子表達水平發(fā)生了如圖IC所示變化(shift)的點就是一個融 合基因配偶體與另一個融合基因配偶體發(fā)生融合的點。因此,基因內探針的結果可以用來 確證嵌合探針所發(fā)現(xiàn)的結果,從而減少從嵌合的外顯子_到_外顯子連接探針中挑選出假 陽性的可能性。 使用基因內探針的另一優(yōu)勢在于,這些基因內探針可以用來指示在之前未被鑒定 的融合基因。 特別地,基因內探針可以與融合基因的融合基因配偶體的內-外顯子序列、外顯 子_到_外顯子連接、外顯子_內含子連接和內含子_外顯子連接相對應。這種基因內探 針可以用于測定融合基因和/或融合基因配偶體的表達水平。在一種優(yōu)選的實施方式中, 使用基因內探針來改變獨立部位(s印arate spot)的數(shù)量或長度以協(xié)助進行定量和比較。
在一個具體的實施方式中,至少兩個基因內探針能靶向融合斷點兩側的每一側; 所述融合斷點即一個融合配偶體與另一個融合配偶體在該處進行融合的基因內的點。
具體來說,本發(fā)明的微陣列可以含有至少2個基因內探針,例如,至少3個基因內 探針、或至少4個基因內探針、或至少5個基因內探針、或至少6個基因內探針、或至少7個 基因內探針、或至少8個基因內探針、或至少9個基因內探針、或至少10個基因內探針、或 至少20個基因內探針、或至少30個基因內探針、或至少40個基因內探針、或至少50個基 因內探針、或至少75個基因內探針、或至少100個基因內探針、或至少500個基因內探針、 或至少1000個基因內探針。 特別地,本發(fā)明的微陣列還含有針對融合基因的融合基因配偶體的每一個的至少 兩個基因內探針。如果本發(fā)明的微陣列能夠檢測超過1個融合基因,則所述微陣列可以含 有針對每個融合基因而含有不同數(shù)目的基因內探針。例如,所述微陣列可以包括針對一個 融合基因中的兩個融合基因配偶體的至少兩個基因內探針,以及僅針對另一個融合基因中 的一個融合基因配偶體的至少兩個基因內探針。 具體來說,本發(fā)明的微陣列含有靶向相同的融合基因的嵌合探針和至少兩個基因內探針。更具體地說,本發(fā)明的微陣列可以含有針對各個包括在內的融合基因的至少兩個 基因內探針。更具體地說,本發(fā)明的微陣列可以含有針對各個包括在內的融合基因配偶體 的至少兩個基因內探針。本文中,術語"包括在內的"指的是融合基因或融合基因配偶體, 所述微陣列通過含有針對上述融合基因或融合基因配偶體的嵌合探針而預期能對上述融 合基因或融合基因配偶體進行檢測。 在本發(fā)明的一個實施方式中,本發(fā)明的微陣列含有針對各個包括在內的融合基因 配偶體的基因內探針。具體來說,本發(fā)明的微陣列可以包含3個基因內探針每外顯子,特別 地,所述基因內探針可以耙向外顯子_到_外顯子連接。 優(yōu)選地,所述微陣列含有與該微陣列的各個融合基因配偶體(individual fusion gene partners)的全部外顯子、外顯子_到_外顯子連接、外顯子_內含子連接和內含 子_外顯子連接相對應的基因內探針。 更優(yōu)選地,所述微陣列含有2個、3個、4個或5個與微陣列的各個融合基因配偶體 的每一個外顯子相對應的基因內探針。 本發(fā)明所用的基因內探針指的是能進行序列特異性的堿基配對的核酸或核酸類 似物。基因內探針可以含有或由天然核苷酸或非天然核苷酸組成,例如LNA單體(鎖核酸 單體)、INA單體(嵌合核酸(intercalating皿cleic acid)單體)或PNA單體(肽核酸單 體)。 優(yōu)選地,本發(fā)明的微陣列含有靶向超過1個融合基因的融合基因配偶體的基因內 探針。例如說,本發(fā)明的微陣列可以含有針對至少2個融合基因的基因內探針,例如至少5 個融合基因、或至少10個融合基因、或至少20個融合基因、或至少30個融合基因、或至少 50個融合基因、或至少75個融合基因、或至少100個融合基因、或至少250個融合基因、或 至少500個融合基因、或至少1000個融合基因。因此,在一種優(yōu)選的實施方式中,本發(fā)明的 微陣列包括針對多個表1所列融合基因的基因內探針,選自由至少5個融合基因、至少10 個融合基因、至少20個融合基因、至少30個融合基因、至少40個融合基因、至少50個融合 基因、至少75個融合基因、至少100個融合基因、至少150個融合基因、至少200個融合基 因、至少250個融合基因、至少275個融合基因和至少316個融合基因所組成的組中。
基因內探針可以是與mRNA或雙鏈cDNA進行雜交的反義探針,或是與融合基因的 cDNA進行雜交的正義探針。因此,本文使用的術語"相應于"指的是相同的序列或互補序 列。 微陣列可以含有反義基因內探針和正義基因內探針二者,S卩,該微陣列可以用于 與cDNA和mRNA 二者或者PCR產物的兩條鏈進行雜交。 基因內探針可以是能夠與外顯子序列進行雜交的探針,或者該基因內探針可以能 夠與基因內連接序列(例如外顯子_到_外顯子連接、外顯子_內含子連接或內含子_外 顯子連接)進行雜交。如果基因內探針是針對基因內連接序列的,則優(yōu)選該基因內探針具 有等溫性(isothermic),即,在對微陣列進行雜交所用的條件下與互補DNA序列雜交時,可 以調節(jié)針對連接兩側每一側的基因內連接序列探針的長度以使其具有差異至多2(TC的解 鏈溫度(Tm值)。在其他實施方式中,Tm值的差異分別至多4(TC、35t:、3(rC、25t:、15t:、 和1(TC。等溫探針有助于確保微陣列上的整套探針(寡核苷酸)的良好雜交條件。
此外,優(yōu)選調節(jié)這種基因內連接序列探針的第一部分和第二部分的長度,以使它們在微陣列進行雜交所用條件下具有差異至多l(xiāng)(TC的Tm值。在其他實施方式中,Tm值的 差異至多16。C、14。C、12。C、8。C、6。C和4°C。 按下文所描述與嵌合外顯子_到_外顯子探針有關,可以達到對探針或探針的部 分的Tm值的調節(jié)。 優(yōu)選基因內探針的Tm值可以選自由大于45t:、大于5(rC、大于55t:、大于6(rC、 大于65t:、大于7(TC和大于75t:所組成的組中。 優(yōu)選基因內探針的長度選自由小于60個核苷酸、小于55個核苷酸、小于50個核 苷酸、小于45個核苷酸、小于40個核苷酸和小于35個核苷酸所組成的組中。
特別地,本發(fā)明的微陣列可以用于融合基因的檢測。 所述融合基因可以是任意融合基因。優(yōu)選地,事先已經含有至少一個融合基因配 偶體,該融合基因配偶體作為已經得到證實的融合基因的一部分。更優(yōu)選地,所述融合基因 選自由以下已知融合基因所組成的組中。 表1融合基因,316對融合基因配偶體的每一個帶有恩山姆博基因登錄號 (Ensembl gene ID)
基因A
基因B
ENSG00000009709 ENSG00000010404 ENSG00000015133 ENSG00000015133 ENSG00000023445 ENSG00000029725 ENSG00000047410 ENSG00000047410 ENSG00000047932 ENSG00000054118 ENSG00000066455 ENSG00000066629 ENSG00000067369 ENSG00000067955 ENSG00000069399 ENSG00000071564 ENSG00000071564 ENSG00000071564 ENSG00000072274 ENSG00000072864 ENSG00000073921 ENSG00000077150
ENSG00000150907 ENSG00000197021 ENSG00000113721 ENSG00000134853 ENSG00000172175 ENSG00000113721 ENSG00000105976 ENSG0(3000198400 ENSG00000047936 ENSG00000129204 ENSG00000165731 ENSG00000097007 ENSG00000113721 ENSG00000133392 ENSG00000136997 ENSG00000105619 ENSG00000108924 ENSG00000185630 ENSG00000113916 ENSG00000113721 ENSG00000078403 ENSG00000059377ENSG00000078674
ENSG00000078674
ENSG00000080824
ENSG00000082805
ENSG00000083168
ENSG00000083168
ENSG00000083168
ENSG00000083168
ENSG0000008g280
ENSG00000089280
ENSG00000089280
ENSG00000089280
ENSG00000089280
ENSG00000089280
ENSG00000,280
ENSG00000096384
ENSG00000100345
ENSG00000100503
ENSG00000100815
ENSG00000103522
ENSG00000105662
ENSG00000105810
ENSG00000105810
ENSG00000105810
ENSG00000105810
ENSG00000108091
ENSG00000108091
ENSG00000108821
ENSG00000108821
ENSG00000108946
ENSG00000109220
ENSG00000109471
ENSG00000109906
ENSG00000110092
ENSGQ000CmtD619
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000"0713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000096968
ENSG00000165731
ENSG00000113916
ENSG00000怖731
ENSG00000005339
ENSG00000100393
ENSG00000140396
ENSG00000143970
ENSG00000123268
ENSG00000157554
ENSG00000157613
ENSG00000166986
ENSG00000175197
ENSG00000175197
ENSG00000182158
ENSG00000113916
ENSG00000171094
ENSG00000113721
ENSG00000113721
ENSG00000113916
ENSG00000184384
ENSG00000078403
ENSG00000085276
ENSG00000118058
ENSG00000164438
ENSG00000113721
ENSG00000165731
ENSG00000100311
ENSG00000129204
ENSG00000165731
ENSG00000139083
ENSG00000048462
ENSG00000131759
ENSG00000070404
ENSG00000171094
ENSG00000005073
ENSG00000024862
ENSG00000040633
ENSG00000073614
ENSG00000078399
ENSG00000106031
ENSG00000116132
ENSG00000119335
ENSG00000123364
ENSG00000123388
ENSG00000128713
ENSG00000128714
ENSG00000138698
ENSG00000147548
ENSG00000148700
ENSG00000164985
ENSG00000165671
ENSG00000167157
ENSG00000178105
ENSG00000198900ENSG00000110777
ENSG00000110987
ENSG00000111640
ENSG00000111790
ENSG00000112081
ENSG00000112486
ENSG00000112701
ENSG00000113263
ENSG00000113594
ENSG00000114354
ENSG00000114354
ENSG00000114354
ENSG00000114999
ENSG000001165印
ENSG00000116604
ENSG00000117000
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000"8058
ENSG00000118058
ENSG00000118058
ENSG00000"8058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG0O000"8058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000"8058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000113916 ENSG00000136997 ENSG00000113916 ENSG,00077782 ENSG00000113916 ENSG00000077782 ENSG00000188580 ENSG00000165025 ENSG00000181690 ENSG00000119508 ENSG00000171094 ENSG00000198400 ENSG00000139083 ENSG00000068323 ENSG00000071626 ENSG00000116990 ENSG00000002834 ENSG00000005339 ENSG00000007237 ENSG00000008300 ENSG00000072364 ENSG00000073921 ENSG00000075539 ENSG00000078403 ENSG00000079102 ENSG00000085832 ENSG00000100393 ENSG00000101367 ENSG00000105656 ENSG00000108292 ENSG00000110395 ENSG00000112305 ENSG00000118058 ENSG00000118689 ENSG00000125354 ENSG00000130382 ENSG00000130396 ENSG00000131759 ENSG00000132142 ENSG00000132394 ENSG00000136754 ENSG00000136848 ENSG00000137812 ENSG00000138336 ENSG00000138758 ENSG00000141985 ENSG00000142347 ENSG00000143443 ENSG00000144218 ENSG00000145012 ENSG00000145819 ENSG00000150455 ENSG00000154556 ENSG00000163655 ENSG00000166140ENSG00000118058 ENSG00000118058 ENSG00000118058 ENSG00000118058 ENSG00000118058 ENSG00000118058 ENSG00000118058 ENSG00000118058 ENSG00000"8058 ENSG00000118058 ENSG00000118058 ENSG00000119397 ENSG00000120616 ENSG00000121741 ENSG00000122025 ENSG00000122566 ENSG00000122779 ENSG00000122779 ENSG00000124243 ENSG00000125618 ENSG00000126777 ENSG00000126883 ENSG00000126883 ENSG00000126883 ENSG00000127083 ENSG00000127152 ENSG00000127152 ENSG00000127914 ENSG00000127946 ENSG00000128487 ENSG00000133639 ENSG00000135903 ENSG00000135903 ENSG00000136167 ENSG00000136997 ENSG00000136997 ENSG00000137193 ENSG00000137309 ENSG00000137497 ENSG00000137727 ENSG00000138293 ENSG00000138363 ENSG00000138594 ENSG000Q0138674 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083
ENSG00000168385
ENSG00000171723
ENSG00000171843
ENSG00000172409
ENSG00000172493
ENSG00000184384
ENSG00000184481
ENSG00000184640
ENSG00000184702
ENSG00000187239
ENSG00000196914
ENSG00000077782
ENSG00000112511
ENSG00000077782
ENSG00000139083
ENSG00000006468
ENSG00000077782
ENSG00000131759
ENSGG0000141376
ENSG00000132170
ENSG00000165731
ENSG00000097007
ENSG00000119335
ENSG00000124795
ENSG00000129204
ENSG00000164438
ENSG00000211829
ENSG00000157764
ENSG00000113721
ENSG00000113721
ENSG00000136997
ENSG00,084676
ENSG00Q00150907
ENSG00000113916
ENSG00000110987
ENSG00000133639
ENSG00000113916
ENSG00000112769
ENSG0000Q131759
ENSG00000165288
ENSG00000165731
ENSG00000171094
ENSG00000101977
ENSG00000171094
ENSG00000068078
ENSG00000085276
ENSG00000096968
ENSG00000097007
ENSG00000111816
ENSG00000113721
ENSG00000114999
ENSG00000122025
ENSG00000130675
ENSG00000140538
ENSG00000143322ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000140262 ENSG00000140262 ENSG00000140464 ENSG00000140937 ENSG00000141367 ENSG00000141367 ENSG00000141380 ENSG00000141380 ENSG00000141380 ENSG00000141867 ENSG00000142611 ENSG00000143294 ENSG00000143549 ENSG00000143549 ENSG00000143549 ENSG00000143924 ENSG00000145216 ENSG00000147065 ENSG00000147140 ENSG00000147889 ENSG00000149948 ENSG00000149948 ENSG00000149948 ENSG00000149948 ENSG00000149948 ENSG00000149948 ENSG00000149948 ENSG00000153201 ENSG00000153814 ENSG00000153814 ENSGO0OQO153944 ENSG00000156650 ENSG00000156976 ENSG00000158715 ENSG00000158715 ENSG00000159216 ENSG00000159216 ENSG00000159216 ENSG00000159216 ENSG00000159216 ENSG00000159216 ENSG00000159216 ENSGOOOOO^I 59216 ENSG00000159216 ENSG00000159216
ENSG00000143437 ENSG00000153233 ENSG00000159216 ENSG00000164398 ENSG00000165025 ENSG00000165556 ENSG00000169184 ENSG00000179094 ENSG00000188580 ENSG00000197880 ENSG00000119508 ENSG00000135605 ENSG00000131759 ENSGD0000129204 ENSG00000068323 ENSG00000171094 ENSG00000126752 ENSG00000187754 ENSG00000204645 ENSG,00184507 ENSG00000085276 ENSG00000068323 ENSG00000113721 ENSG,00171094 ENSG00000198400 ENSG00000171094 ENSG00000134853 ENSG00000171094 ENSG00000068323 ENSG00000147889 ENSG00000100814 ENSG00000144476 ENSG00000145012 ENSG00000164919 ENSG00000182185 ENSGOOOO0183722 ENSG00000189283 ENSG00000171094 ENSG00000112511 ENSG00000178691 ENSG00000078399 ENSG00000005339 ENSG00000113916 ENSG00000006468 ENSG00000171656 ENSG00000022556 ENSG0000007謂2 ENSG00000085276 ENSG00000106346 ENSG00000109686 ENSG00000116251 ENSG00000129993 ENSG00000143373 ENSG00000155313 ENSG00000169946ENSG00000159216 ENSG00000159216 ENSG00000162367 ENSG00000162775 ENSG00000163902 ENSG00000164692 ENSG00000165288 ENSG00000167460 ENSG00000168036 ENSG00000168421 ENSG00000柳306 ENSG00000169696 ENSG00000169714 ENSG00000170791 ENSG00000170881 ENSG00000170961 ENSG00000172660 ENSG00000172660 ENSG00000172660 ENSG00000172660 ENSG00000173757 ENSG00000178104 ENSG00000179362 ENSG00000179583 ENSG00000180843 ENSG00000181163 ENSG00000181163 ENSG00000181163 ENSG00000182158 ENSG00000182944 ENSG00000182944 ENSGGOOOCn 82944 ENSG00000"l8—2944 ENSG00000182944 ENSGOOOOCM 82944 ENSG00000182944 ENSG00000182944 ENSG00000182944 ENSG00000182944 ENSG00000182944 ENSG00000182944 ENSG00000182944 ENSG00000182944 ENSG00000182944 ENSG00000184012 ENSG00000184012 ENSG0000Q184012 ENSG00000184012 ENSG00000184402 ENSG00000184507 ENSG0。0001858" ENSG00000186716 ENSG00000186716 ENSG00000186716 ENSG00000186716
ENSG00000198492 ENSG00000206115 ENSG00000123473 ENSG00000196588 ENSG00000085276 ENSG00000181690 ENSG00000137727 ENSG00000171094 ENSG00000181690 ENSG00000113916 ENSG00000198947 ENSG00000068323 ENSG00000129204 ENSG00000181690 ENSG00000189283 ENSG00000181690 ENSG00000119508 ENSGOOOO0126746 ENSG00000128656 ENSG00000135605 ENSG00000131759 ENSG00000113721 ENSG00000006468 ENSG00000113916 ENSG00000171094 ENSG00000131759 ENSG00000171094 ENSG00000178053 ENSG00000132170 ENSG00000006468 ENSG00000100105 ENSG00000118260 ENSG00000119508 ENSG00000123268 ENSG00000126746 ENSG00000135605 ENSG00000151702 ENSG00000157554 ENSG00000163497 ENSG00000166986 ENSG00000175197 ENSG00000175832 ENSG00000184937 ENSG00000204531 ENSG00000006468 ENSG00000157554 ENSG00000171656 ENSG00000175832 ENSG00000126752 ENSG00000141867 ENSG00000113916 ENSG00000077782 ENSG00000096968 ENSG00000097007 ENSG00000134853ENSG00000187735 ENSG00000181690
ENSG00000188580 ENSG00000139083
ENSG00000189283 ENSG00000149948
ENSG00000189283 ENSG00000170881
ENSG00000196092 ENSG000Q0139083
L(X)47」 ENSG00000196531 ENSG00000113916
ENSG00000196535 ENSG00000077782
ENSG00000197323 ENSG00000165731
ENSG00000197711 ENSG00000048544
ENSG00000198339 ENSG00000113916
ENSG00000204691 ENSG00000112561 其中,基因A是融合基因的上游融合基因配偶體,而基因B是融合基因的下游融合 基因配偶體。 此處所用的嵌合探針指的是能進行序列特異性的堿基配對的核酸或核酸類似物, 該嵌合探針包括與第一基因的外顯子相對應的第一序列和與第二基因的外顯子相對應的 第二序列。重要的是,第一基因與第二基因不同,S卩,該探針覆蓋了基因間外顯子_到_外 顯子連接。本文使用的術語外顯子_到_外顯子連接指的是基因間外顯子_到_外顯子連 接。嵌合探針可以含有或者由非天然核苷酸組成,例如LNA單體(鎖核酸單體)、INA單體 (嵌合核酸單體)、或PNA單體(肽核酸單體)。 本文使用的術語融合基因指的是由于基因畸變而產生的結果,例如染色體的易
位、缺失或倒位,這種畸變帶來自兩種不同基因的序列。也就說,融合基因含有至少一個融
合基因的上游基因配偶體外顯子和至少一個融合基因的下游基因配偶體外顯子。 本文的術語融合基因還表示還未經實驗證實的假定融合基因。 例如哈恩等人,2004(Hahn et al, 2004)描述了用來對所述潛在的融合基因進行
鑒定的生物信息學策略??梢栽O想,由本發(fā)明檢測出的融合基因可以成為被Hahn等人,
2004描述的方法或其他能夠鑒定潛在的融合基因的方法所鑒定的候選融合基因。 本文中所用的融合基因配偶體指的是為融合基因貢獻了至少一個外顯子的基因。
上游融合基因配偶體的外顯子位于融合基因中另一個融合基因配偶體的外顯子的上游,反
之亦然。 本發(fā)明所特別關注的是在先已表示出與癌癥有關的融合基因配偶體和融合基因。 表1列舉了優(yōu)選的融合基因,其中基因A為融合基因的上游融合基因配偶體并且基因B為 融合基因的下游融合基因配偶體。 絕大多數(shù)的融合基因配偶體在內含子區(qū)域內發(fā)生融合以產生融合基因(諾沃等 人,2007 (Novo et al. , 2007)),且對前體mRNA融合轉錄本的剪接將連接外顯子,從而在融 合轉錄本內產生基因間外顯子_到_外顯子連接。 當假定的融合基因的兩個融合基因配偶體的外顯子_內含子結構為已知的時候, 能對假定的基因間外顯子_到_外顯子連接進行預測。能從各種基于互聯(lián)網的基因組數(shù)據(jù) 庫(例如麗w. biomart. org)中檢索到潛在的融合基因配偶體的外顯子。
在優(yōu)選的實施方式中,本發(fā)明的微陣列含有針對融合基因的至少20%的全部可能 的外顯子_到_外顯子連接的嵌合探針。 在另一種優(yōu)選的實施方式中,本發(fā)明的微陣列包括針對至少30%的全部可能的外 顯子_到_外顯子連接的嵌合探針,例如針對至少40%、至少50%、至少60%、至少70%、至少80%、或至少90%的全部可能的外顯子-到-外顯子連接的嵌合探針。 在另一種實施方式中,本發(fā)明的微陣列含有針對相同或不同的融合基因的至少20
個外顯子_到_外顯子連接的嵌合探針。 在另一種實施方式中,所述微陣列含有針對相同或不同的融合基因的至少30個 外顯子_到_外顯子連接、至少40個外顯子_到_外顯子連接、至少50個外顯子_到_外 顯子連接、至少60個外顯子_到_外顯子連接、至少70個外顯子_到_外顯子連接、至少 80個外顯子_到_外顯子連接、例如至少100個外顯子_到_外顯子連接的嵌合探針。
本發(fā)明的發(fā)明人意識到,對在先已經進行過表征(經實驗證實)的具有預定外顯 子_到_外顯子連接的融合基因進行測試是不夠的,還需要對特定融合基因的全部可能外 顯子_到_外顯子連接進行測試。非常通常地,外顯子_到_外顯子連接的確切位置并不 是判斷融合基因是否致瘤、或者與癌癥或其它病況有關或者對癌癥或其他病況進行預測的 決定因子。 例如說,最近在前列腺癌中得到鑒定的TMPRSS2-ERG融合基因(Tomlins et al., 2005),已經用在TMPRSS2的外顯子1、2、3、4和5之后且在ERG的外顯子2、3、4、5和6之前 的連接以多種組合測定了融合轉錄本(克拉克等人,2006 (Clark et al. ,2006))。因此,選 擇一個或少數(shù)最普遍的連接將產生相當大的假陰性結果的可能性。該特定的融合基因也是 由于相對較小的染色體片段(3Mbp)發(fā)生缺失,隨后加入了兩個融合基因配偶體而產生的 融合基因的實例。鑒于分辨水平,這種小畸變在細胞遺傳學分析中是無法觀察到的。
致癌性可能簡單地由所述融合基因下游部分的過表達而引起。因此,本發(fā)明的一 個優(yōu)點在于,本發(fā)明不依賴于單個或少數(shù)預定的外顯子_到_外顯子連接,而是能對給定融 合基因的全部可能外顯子_到_外顯子連接進行檢測。 另一個優(yōu)點在于,本發(fā)明不像在背景技術部分中描述的例如核型分析那樣需要新 鮮細胞。此外,對微陣列分析的結果的解釋比對核型分析的結果進行解釋更直觀,后者需要 受過高度訓練的人員。從原則上來說,微陣列上成套的基因間外顯子_到_外顯子連接探 針將僅在相應于融合基因轉錄本內存在外顯子_到_外顯子連接的部位產生強信號。
此外,與細胞遺傳學方法相比,在測量中包括了來自生物學樣本的所有細胞的 RNA,因此本發(fā)明對細胞進行選擇時不存在風險。 在一種優(yōu)選的實施方式中,本發(fā)明的微陣列含有針對融合基因的每一個可能外顯 子_到_外顯子連接的嵌合探針。 優(yōu)選地,本發(fā)明的微陣列含有針對超過1個融合基因的嵌合探針。舉例來說,本發(fā) 明的微陣列可以包括針對至少2個融合基因的嵌合探針,例如至少5個融合基因、或至少10 個融合基因、或至少20個融合基因、或至少30個融合基因、或至少50個融合基因、或至少 75個融合基因、或至少100個融合基因、或至少250個融合基因、或至少500個融合基因、 或至少IOOO個融合基因。因此,在一種優(yōu)選的實施方式中,本發(fā)明的微陣列含有針對多個 列于表1的融合基因的嵌合探針,選自由至少5個融合基因、至少10個融合基因、至少20 個融合基因、至少30個融合基因、至少40個融合基因、至少50個融合基因、至少75個融合 基因、至少100個融合基因、至少150個融合基因、至少200個融合基因、至少250個融合基 因、至少275個融合基因和至少316個融合基因所組成的組中。 在更優(yōu)選的實施方式中,本發(fā)明的微陣列含有針對列于表1的許多個融合基因的每一個可能基因間外顯子_到_外顯子連接的嵌合探針,選自由至少5個融合基因、至少10 個融合基因、至少20個融合基因、至少30個融合基因、至少40個融合基因、至少50個融合 基因、至少75個融合基因、至少100個融合基因、至少150個融合基因、至少200個融合基 因、至少250個融合基因、至少275個融合基因和至少316個融合基因所組成的組。
最優(yōu)選地,本發(fā)明的微陣列含有針對表1所列全部融合基因的每一個可能基因間 外顯子_到_外顯子連接的嵌合探針。甚至更優(yōu)選地,本發(fā)明的微陣列含有嵌合探針和至 少兩個針對表1所列全部融合基因的基因內探針。這種微陣列用于有效地鑒定任意樣本中 的融合基因,并且不要求在例如癌癥類型或患者病史的基礎上事先獲知對特定融合基因的 易感性。 微陣列的嵌合探針的序列含有第一部分和第二部分,其中,所述第一部分與上游 融合基因配偶體的外顯子序列的3'端相對應,第二部分與下游融合基因配偶體的外顯子序 列的5'端相對應,其中,所述嵌合探針是與mRNA或雙鏈cDNA進行雜交的反義探針,或是與 融合基因的cDNA進行雜交的正義探針。因此,本文使用的術語"相應于"指的是相同的序 列或互補序列。 微陣列可以包括針對每個外顯子-到-外顯子連接的反義探針和正義探針,S卩,該 微陣列可以通過cDNA和mRNA或者PCR產物的兩條鏈進行雜交。 優(yōu)選地,所述嵌合探針具有等溫性,即,在對微陣列進行雜交所用的條件下與互 補DNA序列雜交時,可以調整嵌合探針的長度以使它們具有差異至多2(TC的解鏈溫度(Tm 值)。在其他實施方式中,Tm值的差異分別至多40。C、35。C、3(TC、25。C、15。C、和l(TC。等 溫探針有助于使所述微陣列上的整套探針具有良好的雜交條件。 此外,優(yōu)選調整所述嵌合探針的第一部分和第二部分的長度,以使它們在微陣列 進行雜交所用條件下具有差異至多l(xiāng)(TC的Tm值。在一種實施方式中,Tm值的差異至多 16。C、14。C、12。C、8。C、6。C和4°C。 由于Tm值依賴于長度和探針或探針的部分的核苷酸序列中鳥嘌呤和胞嘧啶的百 分比,因此可以實現(xiàn)對探針或探針的部分的Tm值進行調節(jié)??梢詻Q定,嵌合探針應該具有 例如約6『C的Tm值。針對第一部分和第二部分的lO個核苷酸的嵌合探針的Tm值可以使 用作為起始。如果該探針的Tm值低于68°C ,可以以平衡的方式加核苷酸至第一部分和第二 部分二者直到嵌合探針的整體Tm值達到約68t:。因此,如果第一部分比第二部分含有更多 的A、 T或U核苷酸,則需要向第一部分中加入更多的核苷酸。利用寡核苷酸設計算法來執(zhí) 行該操作。 在本發(fā)明的一種優(yōu)選實施方式中,嵌合探針的Tm高于進行雜交所用的溫度,且嵌 合探針的上游和/或下游部分的Tm低于進行雜交所用的溫度。 嵌合探針的Tm值優(yōu)選選自由大于45t:、大于5(TC、大于55t:、大于6(TC、大于 65t:、大于7(TC和大于75t:所組成的組。 嵌合探針的長度優(yōu)選選自由小于60個核苷酸、小于55個核苷酸、小于50個核苷 酸、小于45個核苷酸、小于40個核苷酸和小于35個核苷酸所組成的組。
在另一種優(yōu)選實施方式中,所述微陣列還含有靶向外顯子_到_外顯子連接的單 核苷酸多態(tài)性(SNP)變體的嵌合探針。這種SNP可以從包括表1中全部融合基因配偶體的 基因組數(shù)據(jù)庫(例如麗w.biomart. org)得到。SNP定位于外顯子-到-外顯子連接的側部(flanking)序列中,構成了包含每一個SNP變體的嵌合探針。通過將外顯子_到_外顯子 連接的多態(tài)性變體包含在內,確保了不會由于嵌合探針和外顯子_到_外顯子連接之間核 苷酸序列的錯配而導致融合基因的丟失。 本發(fā)明的微陣列可以商購自多家制造商,例如安捷倫(Agilent)、伊魯米娜 (Illumina)和尼布爾基因(Nimblegen)。微陣列上的正信號通常是通過測量熒光或化學發(fā) 光而檢測得到,這些熒光或化學發(fā)光直接或間接獲得自樣本中mRNA或cDNA被標記的核苷酸。 制備探針或寡核苷酸的方法以及將所述探針應用于微陣列的方法是本領域技術 人員公知的。 外顯子-到-外顯子連接探針的評分相對直觀。這是由于成千上萬的位置中的大 多數(shù)呈陰性,且僅由具有陽性的外顯子_到-外顯子連接探針的特征產生了顯著的正信號。 融合基因的存在使從嵌合探針產生了正信號,這可以由兩個融合基因配偶體的基因內探針 制得的標準縱向表達水平曲線上相應的變化而得到支持。 為了便于對樣本(特別是不知道是否存在融合基因的樣本)進行數(shù)據(jù)分析,可以 計算各個可能的內含子的融合斷點的"融合得分(fusionscore)",且這些融合得分反映了 融合事件的可能性??梢葬槍Ω鱾€嵌合連接探針計算出兩個所述融合得分。這使來自嵌合 探針的值與通過基因內探針獲得的值(即,上游融合基因配偶體或下游融合基因配偶體各 自的縱向曲線)結合起來。按以下公式計算融合得分
[融合得分=嵌合連接得分*p (轉錄本態(tài))*P (外顯子態(tài))] 其中,所述嵌合連接得分是嵌合探針信號的標準化值,P(轉錄本態(tài)) (p (transcript-wise))是在預測融合斷點前后的獨立群體(s印arat印opulations)中融 合基因配偶體的外顯子表達值的概率,以及P(外顯子態(tài))(p(exoniise))是在獨立群體中 緊接著融合基因配偶體上游外顯子和下游外顯子的外顯子表達值的概率。術語"獨立群體" 在本文指的是相同的基因,但是該基因已經與另一基因發(fā)生融合從而導致在所述基因的個 體外顯子的表達水平發(fā)生改變。 對基因內表達值與可能融合斷點的上游和下游得到的值相比,在t-測試的基礎 上計算P(轉錄本態(tài))和(外顯子態(tài)),從而測試在縱向曲線的給定位置上是否存在斷點。
對融合得分的計算提供了一種簡單的方式對給定的外顯子_外顯子連接處發(fā)生 融合事件的可能性的值進行解釋,因此能由非專業(yè)人士對結果進行分析和解釋。為了將數(shù) 值保持在范圍內,需要使用下列閾值。當嵌合探針的標準化值大于10時,可以將它們設定 為10。類似地,當縱向曲線上斷點的概率<0. IO時,可以將所述值設為O. 10。也可以在下 游融合基因配偶體外顯子得到的數(shù)值小于上游融合基因配偶體外顯子得到的數(shù)值時,將概 率設為0. 10。 本發(fā)明的第二方面是檢測融合基因的方法,該方法包括以下步驟 a.提供樣本; b.從所述樣本中分離RNA ; c.用本發(fā)明的微陣列對來自樣本的mRNA的外顯子_到_外顯子連接進行檢測;
d.從而對存在于樣本中的融合基因進行鑒定。 在本發(fā)明的一種實施方式中,該方法可以還包括使用本發(fā)明的微陣列對融合基因的融合基因配偶體的表達水平進行檢測的步驟。該步驟通常在上述方法的步驟c)中進行, 即,在利用本發(fā)明的微陣列對來自樣本的mRNA的外顯子_到_外顯子連接進行檢測的時 候。 因此,更具體地說,步驟c)可以為 c.使用含有針對融合基因的基因間外顯子-到-外顯子里連接的嵌合探針的微陣
列和含有針對所述融合基因的配合基因配偶體的至少兩個基因內探針的微陣列對來自樣 本的mRNA的外顯子_到_外顯子連接進行檢測。 步驟c)的另一種實施方式中,所述嵌合探針和至少兩個基因內探針可以存在于 單個微陣列上,或存在于同一微陣列上。 本發(fā)明的方法還包括使用本發(fā)明的微陣列對嵌合探針檢測的融合基因的外顯 子_到_外顯子連接與基因內探針檢測得到的外顯子_到_外顯子檢測進行比較的步驟。
在本發(fā)明的方法的步驟c)中,對微陣列的圖像進行測量時,可以通過觀察到以下 而對陽性融合基因進行評分 1、針對嵌合融合基因探針的高強度指示了存在特定融合基因,且特定的嵌合外顯 子_到_外顯子連接位于融合轉錄本中。 2、另外,我們可以通過基因內探針發(fā)現(xiàn)通?;驑藴时磉_水平與針對兩個融合基 因配偶體之一或二者的上游和下游部分的轉錄本之間的差別。通常地,基因內探針(也 被稱為縱向探針或寡核苷酸)針對每個包括在內的融合基因配偶體,可以例如包括3個 內_外顯子探針(寡核苷酸)/外顯子,和外顯子_到_外顯子連接探針(寡核苷酸)。通 常地,從這些轉錄本的5'端向3'端移動時,可以發(fā)現(xiàn)上游融合基因配偶體(基因A)的表 達水平下降,且下游融合基因配偶體(基因B)的信號增強。根據(jù)第1點所述,在標準表達 水平中的變化應該發(fā)生于基因內的與陽性基因間/嵌合連接探針(寡核苷酸)相對應的位 置。 3 、此外,可以按以上所描述地對各個嵌合連接探針的"融合得分"進行計算。所述
融合得分結合了嵌合融合基因探針的分數(shù)和基因內探針的分數(shù)。這種融合分數(shù)提供了一種
簡單的方式來表示在融合基因轉錄本內存在特定外顯子_外顯子連接的可能性。 對于具有融合轉錄本的RNA樣本,可以觀察到上述1和2的結合(如圖l至圖3
所示)。然而,本發(fā)明也能預測到將1和3、2和3或者1、2和3的結合。 本方法可以包括使用寡dT引物或隨機引物(如六聚體)從步驟b)中的RNA制備
cDNA。在該實施方式中,在cDNA水平上對外顯子-到-外顯子連接進行檢測。 本發(fā)明的方法還包括對樣品進行標記。對mRNA或cDNA進行標記的方法是本領域
技術人員已知的,根據(jù)實施例2的描述,該方法包括通過夾雜例如花青3 (Cy3)和/或花青
5 (Cy5)修飾的dNTPs對cDNA進行標記。 通常地,本發(fā)明方法的步驟c)中通過使獲得自樣本的mRNA或cDNA與微陣列進行 雜交而對外顯子_外顯子連接進行檢測。使mRNA或cDNA與微陣列進行雜交的方法是本領 域技術人員所公知的。 所述樣本可以為任何生物學材料,例如來自癌癥患者或疑似患有癌癥的人的血液 或骨髓。另一種樣本是獲得自實體瘤的組織。 本發(fā)明的一個特別的優(yōu)點在于,用微陣列對融合基因進行檢測前,本發(fā)明無需要在RNA上進行RT-PCR或無需在步驟b)得到的cDNA上進行PCR就可以進行檢測。
本發(fā)明的第三個方面是含有本發(fā)明的微陣列以及用于cDNA合成的隨機引物和/ 或用于cDNA合成的寡脫氧胸苷酸(oligo-dT)引物的試劑盒。優(yōu)選地,所述試劑盒還含有 逆轉錄酶和合成cDNA所必需的試劑。 在一個具體的實施方式中,所述試劑盒具有包括針對融合基因的基因間外顯 子_到_外顯子連接的嵌合探針的微陣列、含有針對融合基因配偶體的至少兩個基因內探 針的微陣列和用于cDNA合成的隨機引物和/或用于cDNA合成的寡脫氧胸苷酸(oligo-dT) 引物。 所述試劑盒的嵌合探針和至少兩個基因內探針可以存在于單個微陣列上,或者它
們也可以存在于同一微陣列上。
實施例
實施例l 制備連接探針(寡核苷酸)和微陣列 為了產生連接探針(寡核苷酸(oligos)),我們制作了能自動處理公共基因組數(shù) 據(jù)的計算機腳本(computer script)(用中蟒(Python)程序語言編寫)。我們利用www. biomart. org互聯(lián)網入口得到對于全部的基因和它們的轉錄本的外顯子序列。對于每種融 合基因的組合,在全部組合中將全部基因A的外顯子的末端序列(最后30個核苷酸)和全 部基因B的外顯子的起始序列(30nt)結合。接著,使用寡核苷酸計算算法來從這些可能 融合基因外顯子_到_外顯子連接中產生探針(寡核苷酸)。在此,我們使Tm最佳地處于 6『C,并保持連接兩側每一側的Tm相等。在我們的實施例中,我們產生了長度為33-46個 核苷酸的外顯子_到_外顯子連接探針(寡核苷酸)。 通過這種方式設計了針對275個融合基因的47427個連接探針(寡核苷酸)。
為了提高靈敏度和特異性,還設計了基因內探針(縱向寡核苷酸)的。這些是測 量個體融合基因配偶體的沿轉錄本表達水平的成套的探針(寡核苷酸)。得到的三個探針 (寡核苷酸)從內部在起點、中間和末端靶向各個外顯子序列,且還得到了靶向基因內外顯 子-到-外顯子連接的探針(寡核苷酸)。而且由于前體mRNA加工機器可以在除去或引入 順式作用剪接調控序列之后改變剪接模式,因此還可以包括外顯子_到_內含子連接和內 含子-到-外顯子連接。 為了降低探針的"半粘結劑(half-binder)"效應,原型(prototype)中使用的探 針(寡核苷酸)非常短(34-40體(mer)),并且我們將它們構建為在連接兩側的每一側具有 相等的解鏈溫度。由于短序列在連接兩側的每一側,可以使粘結對單核苷酸多態(tài)性(SNP) 變得敏感。因此,在已知的SNP位置處我們制造了用于各個SNP變體的額外的成套的探針。 我們還得到了第二版的陣列,該陣列中探針(寡核苷酸)較長(44-55mer)。
得到了所描述的微陣列,包括靶向275個已知融合基因的全部可能連接序列的嵌 合探針(寡核苷酸)、和針對100個這些基因的基因內探針(縱向探針)。對于7個融合基 因,包括那些作為陽性對照的融合基因,所述嵌合探針(寡核苷酸)包括了一式四份。它們 所屬的融合基因配偶體也在100個基因的列表之中,針對這100種基因制得了基因內探針 (寡核苷酸)??偠灾?,試驗融合基因微陣列包括具有69729個在Nimblegen微陣列載片 上合成的探針(寡核苷酸)的設計,目前在每個微陣列上含有2. 1百萬(million)個不同的寡核苷酸序列。 實施例2 起作用的微陣列 在原理論證的實驗中,我們對已知每個存在一種融合基因的一組陽性對照樣本進 行了分析。試驗樣本包括4份前列腺癌組織樣本,對TMPRSS2 :ERG融合基因陽性和2種白 血病細胞系,已知它們每種攜帶了 TCF3 :PBX1融合基因和ETV6 :RUNX1融合基因中的一種。
對于試驗樣本,通過使用快而精(Qiagen)旋轉離心柱將總RNA進行分離。此外,用 核糖體RNA減少試劑盒(RiboMi皿sTM轉錄分離試劑盒;英杰(Invitrogen))使mRNA富集。 由此,用隨機引物(六聚體)進行第一鏈cDNA合成,接著得到雙鏈cDNA并運輸至尼布爾基 因公司(Nimblegen Inc.)進行標記、雜交、洗滌并對微陣列進行掃描。通過包含Cy3-和 Cy5-修飾的dNTPs而對cDNA進行標記。
結論 為了可視化測量陽性對照基因,我們使用嵌合探針套或基因內(縱向)探針套分 別進行了兩組獨立的路徑。全部六組樣本具有清晰的融合基因圖案進而證實了本發(fā)明想 法。 為了評價給定融合基因的易變性,我們采用前列腺癌中的TMPRSS2 :ERG融合基因 作為模型。這里,我們對來自4個個體腫瘤的惡性前列腺組織樣本進行分析。圖2顯示了從 這些樣本之一得到的結果。圖2最左側的圖反應了與嵌合外顯子_到_外顯子探針進行雜 交得到的結果。單獨的TMPRSS2基因和ERG基因的外顯子分別描繪于X軸和Y軸上,因此 通過陰影密度可以觀察到與嵌合外顯子_到_外顯子探針雜交的樣本的量。從該圖上可以 看出,相應于TMPRSS2外顯子1和ERG外顯子4的嵌合探針產生了高密度。這反映了樣本 材料中TMPRSS2外顯子1和ERG外顯子4之間發(fā)生融合的TMPRSS2 :ERG融合基因的存在。 圖2最右側的圖反應了用基因內ERG探針檢測得到的個體ERG基因外顯子的表達水平。從 圖上可以發(fā)現(xiàn),外顯子l-3的平均表達水平低于外顯子4-ll,這反映ERG基因做為融合基因 被表達并且僅該基因的外顯子4-11包含在融合轉錄本中。因此,通過嵌合探針和基因內探 針得到的結果相符,并且它們的結合有力地證明了前列腺癌樣本含有TMPRSS2 :ERG基因, 其中融合連接位于TMPRSS2外顯子1和ERG外顯子4之間。通過cDNA測序,我們還確認了 在核苷酸水平上這種精確的融合連接(數(shù)據(jù)未示出)。 如圖2所示,用嵌合探針得到的結果也表現(xiàn)出了在其他部位的信號雖然其強度弱 于TMPRSS2外顯子1和ERG外顯子4部位。這些部位是,例如TMPRSS2外顯子1至ERG外 顯子1和TMPRSS2外顯子2至ERG外顯子2。但是,我們發(fā)現(xiàn)這些候選融合連接沒有在ERG 的縱向曲線上得到反映。因此,這說明了包含的基因內探針(寡核苷酸)是如何降低假陽 性評分的可能性的。 圖3反映了得到的結果,且數(shù)據(jù)與圖2所描述的相似。所述通過嵌合探針獲得的 結果顯示于上圖中,而通過基因內探針針對TCF3和PBX1的外顯子得到的結果示于下側的 左圖和右圖中。通過根據(jù)上游融合基因配偶體或下游融合基因配偶體的外顯子數(shù)量所描繪 的它們的強度(下側的左圖和右圖),我們看到的圖與使用嵌合外顯子-到-外顯子探針獲 得的相同(上圖)。縱向曲線(通過基因內探針得到)支持了與嵌合探針所檢測到的存在 同樣的融合斷點,即,該細胞系中的TCF3 :PBX1融合基因含有與PBX1外顯子4-8進行融合的TCF3外顯子1-15。此外,對該細胞系進行的cDNA測序證實了由融合基因微陣列測定的 融合轉錄本斷點直至在單個核苷酸水平上是正確的。 RUNX1是人類白血病中染色體重排頻率最高的靶之一。到目前為止,已經報道 了 21種類型的易位與RUNX1有關,且已經對它的12個配偶體基因進行克隆和鑒定(14)。 在此進行分析的樣品之一REH細胞系攜帶有ETV6 :RUNX1融合基因。通過使用嵌合外顯 子-到-外顯子探針和基因內探針靶向ETV6基因外顯子,與TMPRSS2 :ERG和TCF3 :PBX1基 因描述相似地對其進行檢測。數(shù)據(jù)顯示REH細胞系含有ETV6 :RUNX1融合基因,其中ETV6 基因的外顯子5的末端與RUNX1基因外顯子2的起始端發(fā)生融合。 為了測定我們不需要事先了解它們的存在或身份就能檢測融合基因的能力,我們 還進行了無監(jiān)督數(shù)據(jù)分析,其中,計算全部潛在的融合基因連接發(fā)生融合事件的概率。針對 這些分析,由嵌合探針得到的標準化值計算的融合得分與從它們的縱向曲線觀察到的上游 融合基因配偶體或下游融合基因配偶體的融合斷點的概率相乘。 針對每個在融合配偶體基因的縱向曲線上的外顯子-外顯子連接計算兩個概率。 轉錄本態(tài)概率建立在針對是否來自全部上游外顯子和全部下游外顯子的值能屬于獨立群 體的基礎上的t測試。外顯子態(tài)概率是建立在針對是否來自緊接上游外顯子和下游外顯子 的值能屬于獨立群體的概率的基礎上的t測試。 針對每個嵌合連接探針,計算兩個所述的融合得分。它們是將嵌合探針(寡核苷 酸)得到的值與上游融合基因配偶體或下游融合基因配偶體的縱向曲線得到的值進行結合。[融合得分=嵌合連接得分*P (轉錄本態(tài))*P (外顯子態(tài))] 對于圖2和圖3進行可視化測量的樣品,得到證實的融合事件在試驗數(shù)據(jù)中被查 證的10297份融合轉錄本概率融合得分中最高。 為了將數(shù)值保持在范圍內,需要使用下列閾值。當嵌合探針的標準化值大于10 時,可以將它們設定為10。類似地,當縱向曲線上斷點的概率< 0. 10時,可以將概率設為 0. 10。也可以在下游融合基因配偶體外顯子得到的數(shù)值小于上游融合基因配偶體外顯子得 到的數(shù)值時,將概率也設為0. 10。
參考文獻 賓漢 J,桑德薩拉姆 S和斯里尼瓦桑 S(2006),對人類磷酸二酯酶基因和剪接 異構體的描繪,生物化學與生物物理學研究通訊,350(1) :25-32 (Bingham J, Sudarsanam S, and Srinivasan S (2006). Profiling humanphosphodiesterase genes and splice isoforms. Biochem. Biophys. ResComm皿.,350 (1) :25-32); 克拉克 J,默森 S、吉哈瓦 S、弗洛赫 P、愛德華 S、福斯特 CS、埃里斯 R、 馬丁 FL、菲利普 DH、克朗德威爾 M、克里斯馬斯 T、湯普森 A、費謝爾 C、科瓦奇 G 和庫珀 CS(2006) , TMPRSS2-ERG融合轉錄本在人類前列腺中的多樣性,致癌基因,[收稿 日在印刷前](Clark J, Merson S, Jhavar S, Flohr P, Edwards S, Foster CS, Eeles R, Martin FL, Phillips DH, Cr皿dwell M, Christmas T, Thompson A, Fisher C, Kovacs G, and Cooper CS(2006). Diversity of TMPRSS2-ERG fusiontranscripts in the human prostate. Oncogene, [Epub ahead of print]) 5 約翰遜 JM、卡斯特爾 J、蓋瑞特_恩格爾 P、坎 Z、勒爾希 PM、阿穆爾 CD、桑托斯'R、夏德特'EE、斯托頓*EE和蘇梅克爾'DD(2003),用外顯子連接微陣列進行人類 選擇性前體mRNA剪接的全基因組分析,科學,302 (5653) :2141-2144 (Johnson JM, Castle J, Garrett-Engele P, Kan Z, Loerch PM, Armour CD, Santos R, Schadt EE, Stoughton R, and Shoemaker DD(2003). Genome-wide survey of humanalternative pre-mRNA splicing with exon junction microarrays. Science,302(5653) :2141-2144);
米特爾曼 F、約翰森 B和梅爾騰斯 F(2007),易位和基因融合對癌癥形成的影 口向,自然癌癥綜述,7(4) :233-245(Mitelman F, Johansson B, and Mertens F(2007).The impact of translocations and genefusions on cancer causation. Nat. Rev. Cancer., 7(4) :233-245); 那謝德金娜"T、多摩"P、扎瑞那弗"V、霍伯格"J、雷索夫"Y和米扎貝科
夫 A(2002),通過與寡核苷酸微陣列進行雜交來鑒定白血病中的染色體易位,血液 學 矛艮,87(4) :363—372(Nasedkina T, Domer P, ZharinovV, Hoberg J, Lysov Y, and Mirzabekov A(2002). Identification ofchromosomal translocations in leukemias by hybridization witholigo皿cleotide microarrays. Haematologica. , 87 (4) :363-372)
那謝德金娜 T、扎瑞那弗 V、伊莎伊娃 EA、米塔亞伊娃 0N、尤拉索夫 RN、 蘇華茨基科夫 SA、特瑞金 AY、魯比那 AY、卡拉春斯基 AI、加頓豪斯 RB和米扎貝 科夫 A(2003),通過使用多重聚合酶鏈式反應-微陣列法對兒童白血病中的基因重排進 行臨床篩選,臨床癌癥通訊,9(15) :5620-5629 (Nasedkina TV, Zharinov VS, Isaeva EA, Mityaeva 0N, Yurasov RN, Surzhikov SA, Turigin AY, Rubina AY, Karachunskii AI, Gartenhaus RB,and Mirzabekov AD(2003). Clinical screening of generearrangements in childhood leukemia by using a multiplex polymerasechain reaction-microarray approach. Clin. Cancer Res. ,9(15) :5620-5629); 諾沃 FJ、德蒙蒂比爾 IO和比斯馬諾斯 幾(2007), TICdb :癌癥中易位斷點 映射集,英國醫(yī)學研究理事會基因組學,8 :33(Novo FJ, deMendibil 10, and Vizmanos 幾(2007). TICdb :a collection of m即pedtranslocation breakpoints in cancer. BMC Genomics,8 :33); 史 RZ、莫里西 JM和羅利 JD(2003),對人類白血病中的多重染色體易位的 篩選和定量,臨床化學,49 (7) :1066-1073 (Shi RZ, MorrisseyJM, and Rowley JD(2003). Screening and quantification of multiplechromosome易位s in human leukemia. Clin. Chem. ,49(7) :1066-1073.) 特謝拉,MR(2006),癌癥中的最新融合致癌基因,致癌基因重要通訊,12(3-4): 257-271 (Teixeira MR(2006). Recurrent fusion oncogenes incarcinomas. Critical Rev. Oncogen. , 12(3-4) :257-271); 特姆林斯 SA、羅茲 DR、佩爾奈 S、但漢拿瑟卡蘭 SM、梅拉 R、孫 XW、瓦拉 姆巴利 S、曹 X、欽達 J、庫爾弗 R、李 C、蒙蒂 JE、沙赫 RM、皮耶塔 KJ、魯賓 MA 和秦娜燕 AM(2005),目前對前列腺癌中TMPRSS2和ETS轉錄本因子基因中的融合,科 學,310 (5748) :644-648 (Tomlins SA, Rhodes DR, Per證S, Dhanasekaran SM, Mehra R, S皿XW, Varambally S, Cao X, Tchinda J, Kuefer R, Lee C, Montie JE, Shah RB, Pienta KJ, Rubin MA, and Chi麗iyan AM (2005). Recurrentfusion of TMPRSS2 and ETStranscription factor genes in prostate cancer. Science,310(5748) :644-648);
哈恩 Y、貝拉 TK、葛赫爾豪斯 K、契爾斯 IR、帕斯坦 IH和李 B(2004),通 過分析得到表達的序列數(shù)據(jù)庫對由染色體重排造成的基因融合的發(fā)現(xiàn),美國國家科學院 院刊,101 (36) :13257-13261 (Hahn Y, Bera TK, Gehlhaus K, Kirsch IR, Pastan IH and Lee B (2004). Finding sresulting from chromosome rearrangement by analyzing the expressedsequence databases. PNAS,101 (36) :13257—13261)。
權利要求
一種微陣列,該微陣列含有針對融合基因的基因間外顯子-到-外顯子連接的嵌合探針和至少兩個針對該融合基因的融合基因配偶體的基因內探針。
2. 根據(jù)權利要求1所述的微陣列,其中,所述基因內探針的靶選自由所述融合基因配偶體的內_外顯子序列、外顯子_到_外顯子連接、外顯子_內含子連接或內含子_外顯子連接所組成的組中。
3. 根據(jù)權利要求l所述的微陣列,其中,所述融合基因選自由以下基因所組成的組中基因A基因BENSG00000009709ENSG00000010404ENSG00000015133ENSG00000015133ENSG00000023445ENSG00000029725ENSG00000047410ENSG00000047410ENSG00000047932ENSG00000054118ENSG00000066455ENSG00000066629ENSG00000067369ENSG00000067955ENSG00000069399ENSG00000071564ENSG00000071564ENSG00000071564ENSG00000072274ENSG00000072864ENSG00000073921ENSG00000077150ENSG00000078674ENSG00000078674ENSG00000080824ENSG00000082805ENSG00000083168ENSG00000083168ENSG00000083168ENSG00000083168ENSG00000089280ENSG00000089280ENSG00000089280ENSG00000089280ENSG00000089280ENSG00000089280ENSG00000150907ENSG00000197021ENSG00000113721ENSG00000134853ENSG00000172175ENSG00000113721ENSG00000105976ENSG00000198400ENSG00000047936ENSG00000129204ENSG00000165731ENSG00000097007ENSG00000113721ENSG00000133392ENSG00000136997ENSG00000105619ENSG00000108924ENSG00000185630ENSG00000113916ENSG00000113721ENSG00000078403ENSG00000059377ENSG00000096968ENSG00000165731ENSG00000113916ENSG00000165731ENSG00000005339ENSG00000100393ENSG00000140396ENSG00000143970ENSG00000123268ENSGO0000157554ENSG00000157613ENSG00000166986ENSG00000175197ENSG00000175197ENSG00000089280 ENSG00000096384 ENSG00000100345 ENSG000001叩503 ENSG00000100815 ENSG00000103522 ENSG00000105662 ENSG00000105810 ENSG00000105810 ENSG00000105810 ENSG00000105810 ENSG00000108091 ENSG00000108091 ENSG00000108821 ENSG00000108821 ENSGOOOO0108946 ENSG00000109220 ENSG00000109471 ENSG00000109906 ENSG00000110092 ENSG00000110619 ENSG00000110713 ENSG00000110713 ENSG00000110713 ENSG00000110713 ENSG00000110713 ENSG00000110713 ENSG00000110713 ENSG00000"0713 ENSG00000110713 ENSG00000110713 ENSG00000110713 ENSG00000110713 ENSG00000110713 ENSG00000"0713 ENSG00000110713 ENSG00000110713 ENSG00000"0713 ENSG00000110713 ENSG00000110713 ENSG00000110713 ENSG00000110777 ENSG00000110987 ENSG00000111640 ENSG00000111790 ENSG00000112081 ENSG00000112486 ENSG00000112701 ENSG00000113263 ENSG00000113594 ENSG00000114354 ENSG00000114354 ENSG00000114354 ENSG00000114999 ENSG00000116560ENSG00000182158ENSG00000113916ENSG00000171094ENSG00000113721ENSG00000113721ENSG00000"39化ENSG00000化4384ENSG00000078403ENSG00000085276ENSG00000118058ENSG00000164438ENSG00000113721ENSG00000165731ENSG00000100311ENSG00000129204ENSG00000165731ENSG00000139083ENSG00000048462ENSG00000131759ENSG00000070404ENSG00000171094ENSG00000005073ENSG00000024862ENSG00000040633ENSG00000073614ENSG00000078399ENSG00000106031ENSG00000116132ENSG00000119335ENSG00000123364ENSG00000123388ENSG00000128713ENSG00000128714ENSGOOOO0138698ENSG00000147548ENSG00000148700ENSG00000164985ENSG00000165671ENSG00000167157ENSG00000178105ENSG00000198900ENSG000001139化ENSG00000136997ENSG00000113916ENSG00000077782ENSG00000113916ENSG00000077782ENSG00000188580ENSG00000165025ENSG00000181690ENSG00000119508ENSG00000171094ENSG00000198400ENSG00000139083ENSG00000068323ENSG00000"6604ENSG00000117000ENSG00000118058ENSG00000118058ENSG00000118058ENSG0000Cm8058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000"8058ENSG00000118058ENSG00000"8058ENSG00000"8058ENSGOO0OO"8058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG,D0"8058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000"8058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000"8058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000119397ENSG00000120616ENSG00000121741ENSG00000071626ENSG00000116990ENSG00000002834ENSG00000005339ENSG00000007237ENSG00000008300ENSG00000072364ENSG00000073921ENSG00000。75539ENSG00000078403ENSG00000079102ENSG00000085832ENSG00000100393ENSG00000101367ENSG00000105656ENSG00000108292ENSG00000110395ENSG00000112305ENSG00000118058ENSG00000118689ENSG00000125354ENSG00000130382ENSG00000130396ENSG00000131759ENSG00000132142ENSG00000132394ENSG00000136754ENSG00000136848ENSG00000137812ENSG00000138336ENSG00000138758ENSG00000141985ENSG00000142347ENSGOOOO0143443ENSG00000144218ENSG00000145012ENSG00000145819ENSG00000150455ENSGOOOO0154556ENSG00000163655ENSG00000156140ENSG00000168385ENSG00000171723ENSG00000171843ENSGOOOO0172409ENSG00000172493ENSG00000184384ENSG00000184481ENSGOOOO0184640ENSG00000184702ENSG00000187239ENSG00000196914ENSG00000077782ENSG00000"2511ENSG00000077782ENSG00000122025ENSG00000122566ENSG00000122779ENSG00000122779ENSG00000124243ENSG00000125618ENSG00000126777ENSG00000126883ENSG00000126883ENSG00000126883ENSG00000127083ENSG00000127152ENSG00000127152ENSG00000127914ENSG00000127946ENSG00000128487ENSG00000133639ENSG00000135903ENSG00000135903ENSG00000136167ENSG00000136997ENSG00000136997ENSG00000137193ENSG00000137309ENSG00000137497ENSG00000137727ENSG00000138293ENSG00000138363ENSG0D000138594ENSG00000138674ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000140262ENSG00000140262ENSG00000140464ENSG00000140937ENSG00000139083ENSG00000006468ENSG00000077782ENSG00000131759ENSG00000141376ENSG00000132170ENSG00000165731ENSG00000097007ENSG00000119335ENSG00000124795ENSG00000129204ENSG00000164438ENSG00000211829ENSG00000157764ENSG00000113721ENSG00000113721ENSG00000136997ENSG00000084676ENSG00000150907ENSG00000113916ENSG00000110987ENSG00000133639ENSG00000113916ENSG00000112769ENSG00000131759ENSG00000165288ENSG00000165731ENSG00000171094ENSG00000101977ENSG00000171094ENSG00000068078ENSG00000085276ENSG00000096968ENSG00000097007ENSG00000111816ENSG00000113721ENSG00000114999ENSG00000122025ENSG00000130675ENSG00000140538ENSG00000143322ENSG00000143437ENSG00000153233ENSG00000159216ENSG00000164398ENSG00000165025ENSG00000165556ENSG00000169184ENSG00000179094ENSG00000188580ENSG00000197880ENSG00000119508ENSGOOOO0135605ENSG00000131759ENSG00000129204ENSG00000141367ENSG00000141367ENSG00000141380ENSG00000141380ENSG00000141380ENSG00000141867ENSG00000142611ENSG00000143294ENSG00000143549ENSG00000143549ENSG00000143549ENSG00000143924ENSG00000145216ENSG00000147065ENSG00000147140ENSG00000147889ENSG00000149948ENSG00000149948ENSG00000149948ENSG00000149948ENSG00000149948ENSG00000149948ENSG00000149948ENSG00000153201ENSG00000153814ENSG00000153814ENSG00000153944ENSG00000156650ENSG00000156976ENSG00000158715ENSG00000158715ENSG00000159216ENSG00000159216ENSG00000159216ENSG00000159216ENSG00000159216ENSG00000159216ENSG00000159216ENSG00000159216ENSG00000159216ENSG00000159216ENSG00000159216ENSG00000159216ENSG00000162367ENSG00000162775ENSG00000163902ENSG00000164692ENSG00000165288ENSG00000167460ENSG00000168036ENSG00000168421ENSG00000169306ENSG00000169696ENSG00000169714ENSG00000170791ENSG00000068323ENSG00000171094ENSG00000126752ENSG00000187754ENSG00000204645ENSG00000184507ENSG00000085276ENSG00000068323ENSG00000113721ENSG0D000171094ENSG00000198400ENSG00000171094ENSG00000134853ENSG00000171094ENSG00000068323ENSG00000147889ENSG00000100814ENSG00000144476ENSG00000145012ENSG00000164919ENSG00000182185ENSG00000183722ENSG00000189283ENSG00000171094ENSG00000112511ENSG00000178691ENSG00000078399ENSG00000005339ENSG00000113916ENSG00000006468ENSG00000171656ENSG00000022556ENSG00000079102ENSG00000085276ENSG0000。106346ENSG00000109686ENSG00000116251ENSG00000129993ENSG00000143373ENSG00000155313ENSG00000169946ENSG00000198492ENSG00000206"5ENSG00000123473ENSG00000196588ENSG00000085276ENSG00000181690ENSG00000137727ENSG00000171094ENSG00000181690ENSG00000113916ENSG00000198947ENSG00000068323ENSG00000129204ENSG00000181690ENSG00000170881ENSG00000170961ENSG00000172660ENSG00000172660ENSG00000172660ENSG00000172660ENSG00000173757ENSG00000178104ENSG00000179362ENSG00000179583ENSG00000180843ENSG0000018"63ENSG00000181163ENSG00000181163ENSG00000182158ENSGOOOOO"182944ENSG00000182944ENSG00000182944ENSG00000182944ENSG00000化2944ENSG00000182944ENSG00000182944ENSG00000182944ENSG00000182944ENSG00000182944ENSG00000182944ENSGOOOO0182944ENSG00000182944ENSG00000182944ENSG00000182944ENSG00000184012ENSG00000184012ENSG00000184012ENSG00000184012ENSG00000184402ENSG00000184507ENSG000001858"ENSG00000186716ENSG00000186716ENSG00000186716ENSG00000186716ENSG00000187735ENSG00000188580ENSG00000189283ENSG00000189283ENSG00000196092ENSG00000196531ENSG00000196535ENSG00000197323ENSG00000197711ENSG00000198339ENSG00000204691其中,基因A是所述融合基因的上游融合:融合基因配偶體。ENSG00000189283ENSG00000181690ENSG00000119508ENSG00000126746ENSG00000128656ENSG00000135605ENSG00000131759ENSG00000113721ENSG00000006468ENSG00000113916ENSG00000171094ENSG00000131759ENSG00000171094ENSG00000178053ENSG00000132170ENSG00000006468ENSG00000100105ENSG00000118260ENSG00000119508ENSG00000123268ENSG00000126746ENSG00000135605ENSG00000151702ENSG00000157554ENSG00000163497ENSG00000166986ENSG00000175197ENSG00000175832ENSG00000184937ENSG00000204531ENSG00000006468ENSG00000157554ENSG00000171656ENSG00000175832ENSG00000126752ENSG00000141867ENSG00000113916ENSG00000077782ENSG00000096968ENSG00000097007ENSG00000134853ENSG00000181690ENSG00000139083ENSG00000149948ENSG00000170881ENSG00000139083ENSG00000113916ENSG00000077782ENSG00000165731ENSG00000048544ENSG00000113916ENSG00000112561因配偶體,而基因B是所述融合基因的下游
4. 根據(jù)前述任意一項權利要求所述的微陣列,其中,該微陣列含有針對所述融合基因 的至少20%的可能的基因間外顯子-到-外顯子連接的嵌合探針。
5. 根據(jù)權利要求1或2所述的微陣列,其中,該微陣列含有針對所述融合基因的至少 20個基因間外顯子-到-外顯子連接的嵌合探針。
6. 根據(jù)前述任意一項權利要求所述的微陣列,其中,該微陣列含有針對每一個可能的 所述融合基因的基因間外顯子_到_外顯子連接的嵌合探針。
7. 根據(jù)前述任意一項權利要求所述的微陣列,其中,該微陣列含有至少20個如權利要 求2中所列舉的融合基因。
8. 根據(jù)前述任意一項權利要求所述的微陣列,其中,該微陣列含有如權利要求2中所 列舉的全部融合基因。
9. 根據(jù)前述任意一項權利要求所述的微陣列,其中,所述嵌合探針含有第一部分和第 二部分,其中,所述第一部分與上游融合基因配偶體外顯子的3'端相對應,所述第二部分與 下游融合基因配偶體的5'端相對應,并且其中,所述嵌合探針是與mRNA或cDNA進行雜交 的反義探針,或是與融合基因的cDNA進行雜交的正義探針。
10. 根據(jù)前述任意一項權利要求所述的微陣列,其中,該微陣列同時含有針對每一個基 因間外顯子_到_外顯子連接的反義探針和正義探針。
11. 根據(jù)前述任意一項權利要求所述的微陣列,其中,調節(jié)所述嵌合探針的長度以使它 們具有差異至多5t:的Tm值。
12. 根據(jù)前述任意一項權利要求所述的微陣列,其中,調節(jié)所述嵌合探針的第一部分和 第二部分的長度以使它們具有差異至多5t:的Tm值。
13. 根據(jù)前述任意一項權利要求所述的微陣列,其中,所述嵌合探針的Tm值高于用于 雜交的溫度,并且其中所述嵌合探針的上游部分或下游部分的Tm低于用于雜交的溫度。
14. 根據(jù)前述任意一項權利要求所述的微陣列,其中,該微陣列還含有靶向外顯 子-到-外顯子連接的單核苷酸多態(tài)性(SNP)變體的嵌合探針。
15. —種檢測融合基因的方法,該方法包括以下步驟a. 提供樣本;b. 從所述樣本中分離RNA ;c. 用含有針對所述融合基因的基因間外顯子-到-外顯子連接的嵌合探針的微陣列和 含有針對融合基因配偶體的至少兩個基因內探針的微陣列對來自所述樣本的mRNA或cDNA 的外顯子_到_外顯子連接進行檢測;d. 從而對存在于所述樣本中的融合基因進行鑒定。
16. 根據(jù)權利要求15所述的方法,其中,所述步驟c)中的嵌合探針和至少兩個基因內 探針存在于同一個微陣列上。
17. 根據(jù)權利要求15或16所述的方法,其中,該方法還包括使用寡脫氧胸苷酸引物或 隨機引物來制備cDNA,所述隨機引物為例如隨機六聚體。
18. —種試劑盒,該試劑盒含有包括針對融合基因的基因間外顯子-到-外顯子連接的 嵌合探針的微陣列、含有針對融合基因配偶體的至少兩個基因內探針的微陣列,以及用于 cDNA合成的隨機引物和/或用于cDNA合成的寡脫氧胸苷酸引物。
19. 根據(jù)權利要求18所述的試劑盒,其中,步驟c)中所述嵌合探針和至少兩個基因內探針存在于同一個微陣列上'
全文摘要
本發(fā)明涉及一種微陣列,該微陣列含有針對融合基因的基因間外顯子-到-外顯子連接的嵌合探針和至少兩個針對該融合基因的融合基因配偶體的基因內探針。本發(fā)明還涉及檢測融合基因的方法和適于檢測融合基因的試劑盒。
文檔編號C12Q1/68GK101743323SQ200880022010
公開日2010年6月16日 申請日期2008年6月27日 優(yōu)先權日2007年6月27日
發(fā)明者古羅·E.·林德, 托馬森·加德.O.S., 朗希爾德·A.·洛特, 羅爾夫·I.·舍特海姆, 羅格納斯·托爾比約恩 申請人:奧斯陸大學醫(yī)院Hf