專利名稱:通過同時探查和酶介導檢測的多態性基因座多重分析的制作方法
技術領域:
本發明總體上涉及分子診斷學和遺傳分型或分析(profiling)。本發明涉及用于高度多態性基因的多重分析的方法、過程和探針。本發明還涉及人白細胞抗原(HLA)基因復合物和囊性纖維化跨膜傳導調節蛋白基因(CFTR)的分子分型和分析(profiling),并且涉及與之相關的組合物、方法和設計。
背景技術:
有效、快速且明確地分析目的基因核酸序列多態性的能力在分子診斷方法的發展中起重要作用,它的用途包括遺傳檢測、載體篩查、基因分型或遺傳分析(profiling)以及鑒定試驗。例如,遺傳檢測和載體篩查的目的是確定目的基因中是否存在與一種具體疾病有關的突變。無論多態性基因座是否含有已知致病的突變,對它們的分析通常有利于臨床,例如在藥物基因組基因分型或HLA分子分型中,測定同種異體組織和骨髓移植的移植供體與預期受體的HLA基因座中等位基因的匹配程度。
當希望使大量患者標本的分析容易進行時,多態性的多重分析面臨相當高的復雜性,由于新的多態性、遺傳標記和突變需要被識別并且必須被包括在分析中,這種復雜性將可能增加。需要處理這種多重形式分析中的復雜性,以確保可靠的測定性能、并適應高樣本量,但現有方法對這種復雜性的處理具有局限性,因此需要新的多態性和突變的多重分析方法,這是本發明的主題。例如,用本發明的方法分析編碼囊性纖維化跨膜傳導(CFTR)通道和人白細胞抗原(HLA)的遺傳基因座。囊性纖維化(CF)是白種人中最常見的隱性疾病之一,在美國的發病率為2000個活產兒中有1例。人群中約有4%攜帶一種CF突變。CFTR基因具有高度變異性迄今為止已經鑒定了超過900種突變(參見http//www.genet.sickkids.on.ca/cftr,在此引用作為參考)。CFTR基因的表征通過促進序列特異性探針的發展,提供了CF分子診斷的鑰匙(Rommens等人,1989;Riordan等人,1989;Kerem等人,1989,均在此引用作為參考)。國立衛生研究院(NIH)資助的共同發展會議推薦對具有CF陽性家族史的成人進行CFTR突變的載體篩查(NIH1997)。美國醫學遺傳學學院(ACMG)載體篩查委員會推薦在總人口載體篩查中使用全人種突變組(pan-ethnic mutation panel),其中包括一組2 5種致病CF突變,它們在美國總人口中的等位基因頻率>0.1%(參見http//www.faseb.org/genetics/acmg,在此引用作為參考)。ACMG組中的突變也包括德系猶太人和非洲-美洲人群中最常見的突變。
已經報道了檢測CFTR突變的幾種方法,包括變性梯度凝膠電泳(Devoto等人,1991);單鏈構象多態性分析(Plieth等人,1992);限制性片段長度多態性(RFLP)(Friedman等人,1991);使用等位基因特異性引物(ASPs)的擴增(Gremonesi等人,1992),和使用等位基因特異的寡核苷酸(ASO)探針雜交(Saiki等人,1986)。廣泛使用的一種方法包括PCR擴增,隨后將擴增的靶鏈印跡到膜上,用可匹配正常(“野生型”)或突變構型的寡核苷酸對這些鏈進行探針雜交。具體而言,在這種斑點印跡形式中多重PCR與ASO雜交被聯合使用以篩查12種CF突變(Shuber等人,1993)。在幾種情況下,利用基質固定的寡核苷酸探針陣列以“反向斑點印跡”形式進行對已知基因組DNA序列變異的檢測(Saiki,RK等人,1989)。通過光蝕刻(photolithographic)法原位合成的短寡核苷酸陣列被用來檢測CFTR基因編碼區中的已知突變(Cronin,MT.等人,1996)。已經報告了使用逆轉錄酶的引物延伸作為檢測CFTR中Δ508突變的一種方法(Pastinen,T.,2000)。該方法早在1989年即已報道(Wu,D.Y.等人,Proc.Natl.Acad.Sci.USA.862757-2760(1989),Newton,C.R.等人,Nucleic Acids Res.172503-2506(1989))。如在下文中進一步討論的,盡管在研究實驗室設置中提供了合理的檢測,但是這些方法需要相當的勞動,周轉時間慢,樣本處理能力低,因此每個樣品需要的成本高。
關于點狀微陣列,曾經描述了幾種點樣方法,以及多種固定探針的基質材料和方法。然而,現有方法的點狀陣列不僅顯示顯著的陣列-陣列可變性,而且顯示顯著的斑點-斑點可變性,這是使測定的可靠性和靈敏度受到限制的一個方面。另外,點狀陣列難以小型化到小于目前的斑點大小(一般為500μm的中心上100μm直徑),從而增加了總樣本體積,導致較慢的測定動力學,限制了雜交測定的性能,在點狀陣列上可能需要多達18小時才能完成。此外,點狀陣列的使用包括用高度專業化的聚焦激光掃描裝置讀取數值。在一個替代方法中,描述了用光蝕刻法原位合成的寡核苷酸陣列。然而,制造陣列的復雜性限制了常規定制,費用昂貴,并且在診斷應用中缺乏靈活性。
主要組織相容性復合物(MHC)包括人白細胞抗原(HLA)基因復合物,它位于人6號染色體的短臂上。該區編碼調節作為免疫應答基礎的細胞-細胞相互作用的細胞表面蛋白。不同的HLA I類基因座編碼44,000道爾頓的多肽,它們在細胞表面與β-2微球蛋白結合,介導細胞毒性T淋巴細胞對靶細胞的識別。HLA II類基因座編碼細胞表面的雜二聚體,它由29,000道爾頓和34,000道爾頓的多肽組成,介導輔助T淋巴細胞對靶細胞的識別。HLA抗原通過在“自身”蛋白質中向T細胞呈遞外源致病肽介導免疫應答的啟動。因此,大的肽系統是需要的,因為它提高了宿主的免疫應答能力。另一方面,相應的高度免疫遺傳多態性是異體移植中的顯著難點,HLA基因座的錯配是異體移植物排斥的主要原因之一。供體與預期受體的HLA基因座中等位基因的匹配程度是異體組織和骨髓移植成功的一個主要因素。
HLA I類區的HLA-A、HLA-B和HLA-C基因座以及HLA II類區的HLA-DRB、HLA-DQB、HLA-DQA、HLA-DPB和HLA-DPA基因座具有極高的多態性。迄今為止,WHO的HLA系統因子命名委員會已經命名了225種HLA A等位基因(HLA A*0101,A*0201等),444種HLA-B等位基因,111種HLA-C等位基因,358種HLA-DRB等位基因,22種HLA-DQA等位基因,47種HLA-DQB等位基因,20種HLA-DPA等位基因和96種HLA-DPB等位基因(參見IMGT/HLA序列數據庫,http//www3.ebi.ac.uk80/imgt/hla/index.html和Schreuder,G.M.Th.等人,Tissue Antigens.54409-437(1999),均在此引用作為參考)。
HLA分型是用來測定移植供體免疫遺傳譜的一種常規方法。HLA分型的目的在于以目的基因座內一組指定多態性的分析為基礎,以需要的分辨水平測定患者的等位基因構型。HLA的分子分型日益成為優于傳統血清學分型的選擇方法,因為它不需要活細胞,具有更高的等位基因分辨率,并且將HLA分型擴展到血清學不適用的II類(Erlich,H.A.等人,Immunity.14347-356(2001))。
當前用于臨床HLA分型的一種方法使用聚合酶鏈反應(PCR)和序列特異的寡核苷酸探針(SSO或SSOP),該探針可以與擴增的靶序列雜交,產生一種圖譜,作為HLA分型的基礎。
全部現有HLA等位基因的序列信息允許設計用于表征已知HLA多態性以及雜交測序的序列特異寡核苷酸(SSO)和等位基因特異寡核苷酸(ASO)(Saiki,R.K.Nature 324163-166(1986),Cao,K.等人,RevImmunogenetics,19991177-208)。
在SSO分析(也被稱為“斑點印跡形式”)的一個實施方案中,從患者中提取DNA樣品,擴增,以8×12網格的形式印跡到一組尼龍膜上。向每個膜的每個斑點上添加一種放射性標記的寡核苷酸探針;在雜交后,通過放射自顯影檢查斑點,并評分為陽性(1)或陰性(0)。對于每個患者樣品,通過分析所有膜所構建的1和0的字符串決定了等位基因的構型。“反向斑點印跡形式”的多重SSO分析方式使用固定在平面載體上的幾組寡核苷酸探針(Saiki,R.等人,ImmunologicalRev.167193-199(1989),Erlich,H.A.Eur.J.Immunogenet.1833-55(1991))。
另一種HLA分型方法使用聚合酶催化的序列特異性引物的延伸(SSPs)來辨別等位基因。DNA聚合酶的高度特異性通常使這種方法具有良好的特異性。在SSP方法中,使用對于每種多態性序列基序或基序對特異的引物對和缺乏3′→5′外切核酸酶活性的DNA聚合酶進行PCR擴增,使得只有3’端與模板完全互補(“匹配”)的引物才發生延伸(因而擴增)。相應PCR產物的存在通過凝膠電泳分析確定。高度多態性基因座的一個實例是HLA II類DR基因的280nt DNA片段,其具有多態性發生率高的特征。
以使用序列特異性探針(SSP)為基礎的HLA分型,也被稱為表型分型(phototyping)(Dupont,B.Tissue Antigen.46353-354(1995)),已經發展為一種常規用于I類和II類分型的商品化技術,(Bunce,M.等人,Tissue Antigens.46355-367(1995),Krausa,P和Browning,M.J.,Tissue Antigens.47237-244(1996),Bunce,M.等人,Tissue Antigens.4581-90(1995))。然而,現有技術水平的SSP方法對分別檢測擴增子的廣泛凝膠電泳分析的要求嚴重阻礙了能夠達到高處理量的多重測定形式的實施。而本發明的方法能夠克服這一缺點。
在以前的應用、特別是在多重形式中,沒有考慮到延伸反應中高度多態性基因座,和非指定多態性位點作為干擾性多態位點的作用。因此,需要提供能夠檢測指定位點、并且適應非指定位點的存在而不受這些非指定位點干擾的用于多態性基因座多重分析的方法、組合物和過程。
發明概述本發明提供在非指定多態性位點存在下同時探查多個指定多態性位點而不受這些非指定位點干擾的方法和過程。提供了便于這種同時探查的幾組探針。本發明還提供了識別HLA基因復合物和CFTR基因的多態性的方法、過程和探針。
利用探針延伸或延長的檢測方法,其特異性在本質上優于利用雜交的方法,特別是在多重形式中,因為序列構型的辨別不再依賴于差異性雜交,而是依賴于酶識別的保真度。迄今為止,酶介導分析方法的絕大多數應用都使用單堿基探針延伸。然而,類似于HLA分型SSP方法中所使用的,探針延伸如本文所述為多態性的多重分析提供了幾個優點。例如,容易適用于單核苷酸以及多核苷酸多態性。如此處所述的方法通常僅用單標記物檢測即可實施,適于同時以及連續地探查多態性基因座,并且兼顧探針設計的復雜性。
本發明一方面提供一種用于同時測定一個或多個靶核苷酸序列內多個指定多態性位點的核苷酸組成的方法。該方法包括下列步驟(a)提供一組或多組探針,每個探針都能與一個指定多態性位點附近范圍內的該一個或多個靶核苷酸序列的亞序列退火;(b)使這組探針接觸該一個或多個靶核苷酸序列,形成雜交復合物,使探針序列內的探查位點與該指定多態性位點直接比對(alignment);(c)對于每種雜交復合物,確定探查位點與指定多態性位點之間是匹配還是錯配;和(d)確定該指定多態性位點的組成。
本發明還提供一種用于序列特異地放大在分析生物樣品的目的核酸序列時產生的測定信號的方法。該方法包括下列步驟(a)提供能夠與目的序列形成雜交復合物的一組固定化探針;(b)在可使目的序列與至少一種固定化探針退火形成雜交復合物的條件下,使這組固定化探針接觸含有目的序列的生物樣品;(c)將雜交復合物與一種聚合酶接觸,使雜交復合物內所含的探針延伸或延長;(d)將探針的延伸或延長轉換為光學信號;和(e)實時記錄這組固定化探針發出的光學信號。
本發明還提供一種形成用于同時探查位于一個或多個靶核酸序列內的指定多態性位點的覆蓋探針組的方法。該方法包括下列步驟(a)確定其探查位點能夠與指定多態性位點比對的延長探針的序列;(b)進一步測定一組完全的簡并探針,以適應所有非指定位點以及未選擇的指定多態性位點,同時仍能使探針的探查位點與指定多態性位點比對;和(c)通過除去所有被包容的多態性,降低簡并性程度。
本發明提供識別靶多核苷酸序列內一個或多個指定位點處多態性的方法。該方法包括下列步驟(a)提供一種或多種能夠探查所述指定位點的探針;(b)為每個指定位點賦值,同時適應位于每個這種多態性附近范圍內的非指定多態性位點。
本發明還提供識別靶多核苷酸序列內一個或多個指定位點處多態性的方法。該方法包括為這些指定位點提供一個探針組,并且根據每種探針的末端延伸的起始將該探針組分為不同的探針亞組。
本發明還提供同時探查多個多態性位點的方法,包括通過應用一個或多個溫度循環實現靶標的線性擴增,進行多重延伸測定的步驟。
本發明還提供同時探查多個多態性位點的方法。該方法包括在溫控條件下運用退火和延伸步驟的組合進行多重延伸測定的步驟。
本發明還提供一種用于同時探查一個或多個相鄰靶序列內S個多態性位點處核苷酸組成的方法,Ps={cp(s);1≤s≤S},該方法通過進行下列步驟,給每個cp賦予一組有限可能數值中的一個(a)提供一組指定的固定化寡核苷酸探針(也叫延伸探針),每種探針在優選比對中均能與位于指定多態性位點附近的靶標亞序列退火,這種優選比對使探針序列內的一個探查位點與指定的多態性位點直接并列,該探針還含有能夠啟動延伸或延長反應的末端延伸起始(TEI)區;(b)使一個或多個靶序列與這組固定化寡核苷酸探針退火,形成探針-靶雜交復合物;(c)對于每種探針-靶雜交復合物,確定探查位點與相應指定多態性位點之間組成的匹配或錯配。
結合下述實施方案(僅用于說明目的)的詳細描述,可以更加清楚地理解本發明的其它目的、特征和優點。
附圖簡述
圖1a是設計用來探查HLA-DR中指定位點的探針組和內部參照的圖示。
圖1b是交錯引物設計的圖解。
圖2是基于容錯效應的等位基因結合模式的變化圖示。
圖3是使用連接的引物結構分離錨定序列和多態性檢測序列的圖示。
圖4顯示模擬的由等位基因組合引起的等位基因識別的不確定性。
圖5顯示一種用來降低由等位基因組合引起的等位基因識別的不確定性的方法。
圖6是雜交和延伸組合的圖示。
圖7顯示用合成寡核苷酸作為靶標的一種模型反應。
圖8顯示以eMAP形式檢測真實患者標本獲得的結果。
圖9顯示DR基因座的eMAP引物延伸結果。
圖10顯示DR基因座的eMAP結果。
圖11顯示A基因座外顯子3的eMAP結果。
圖12顯示A基因座外顯子3的eMAP SSP結果,這是非指定多態性的一個包容實例。
圖13是可變突變位點的微珠固定化探針延伸的圖示。
圖14是使用固定于微珠表面的引物進行的PCR的圖示。
圖15是使用組合PCR產物進行的多探針延伸的圖示。
圖16是多重CF突變的探針延伸結果圖示。圖16a是使用合成靶標的探針延伸圖示。圖16b是在PCR反應中使用微珠進行的探針延伸圖示。
圖17是具有溫控循環的一步延伸的結果圖示。
圖18是使用標記的dNTP和其它3種未標記dNTPs的引物延伸圖示。
圖19是使用標記的ddNTP和其它3種未標記dNTPs的引物延伸圖示。
圖20是引物延伸的圖示,其中用4種未標記的dNTPs進行延伸,產物用可與延伸的未標記產物雜交的標記寡核苷酸探針檢測。
圖21是引物延伸的圖示,其中添加一種標記的靶標和4種未標記的dNTPs。該圖表明,在對芯片施以高溫時,只有使用延伸產物才能使微珠保留標記的靶標。
圖22是序列特異性探針所固定的線性擴增的圖示。
圖23是發夾探針的應用圖示。
圖24是本發明用于分析囊性纖維化和德系猶太人疾病突變的說明。
發明詳述本發明提供用于高度多態性基因座多重分析的組合物、方法和設計;高度多態性基因座即特征在于高密度特定的(“指定的”)多態性位點以及干擾性非指定多態性位點的基因座。這些位點的多重分析通常涉及針對同一靶標上相鄰位點的探針序列的顯著重疊,以致為任何特定或指定位點設計的探針通常也覆蓋相鄰的多態性位點。現有技術也沒有解決包括CFTR和HLA在內的重要基因的分析中的干擾。為了舉例說明本發明的方法,分析了HLA基因復合物和CFTR基因。
本發明提供用于平行或多重分析顯示高密度多態性位點的核酸序列中多態性(“MAP”)的組合物和方法。在一個給定的核酸序列中,每個多態性位點包含一個或多個核苷酸的差異。
本發明提供用于同時探查核酸序列內整個一套所指定多態性的方法和組合物。本發明提供用來測定每個這種位點處組成的組合物、方法和設計,從而提供從目的序列的這組可能構型中選擇給定具體樣品的實際構型的必要信息。本發明也用來縮小該樣品中這組可能序列的范圍。因此,在某些實施方案中,通過分配給一個指定位點對應于核苷酸身份的可能的數值之一來確定序列組成是有用的或是必要的。在其它實施方案中,確定與已知參照序列匹配或非匹配的位點組成就足夠了,如在本文的突變分析中對“野生型”或“突變”的指定。由此提供的序列測定的能力在此被稱為確證性測序或重測序。在一個優選實施方案中,本發明提供了對囊性纖維化跨膜傳導調節蛋白(CFTR)基因和人白細胞抗原(HLA)基因復合物的延伸介導的多態性多重分析(eMAP)。
本發明的方法和組合物可用于提高靶區多態性分析的可靠性和精確性,該靶區中除了要探查的多態性位點之外還含有其它多態性位點。這些非指定位點是分析中干擾的來源。根據具體的測定應用,對于同一多態性位點可以涉及一種或多種不同組成的探針,如此處提供的幾個實施例所詳述。本發明的一個具體目的在于提供有效、快速、確定的分析目的基因多態性的組合物和方法。這種分析可用于分子診斷學檢驗,例如為了遺傳學檢測、載體篩查、基因分型或遺傳分析、鑒定實驗、親子鑒定和法醫所設計的實驗。
靶序列的制備可以用本領域公知的方法進行。在一個非限制性實施例中,從患者獲得細胞或組織樣品。然后用標準技術如PCR(例如非對稱PCR)擴增含有靶序列(例如HLA的外顯子2和3)的核酸區。
當所分析的多態性位點的組成與該探針中的比對位點互補(“匹配”)時,用于檢測多態性位點的探針作為聚合酶催化的延伸反應的起點。本發明的探針通常足夠長,以避免與無關的DNA靶序列退火。在某些實施方案中,探針的長度可能約為10-50個堿基,更優選地約15-25個堿基,更優選地18-20個堿基。可以利用本領域公知的方法和組合物將探針通過接頭部分固定于固體載體上。
此處所用的術語“核酸”或“寡核苷酸”是指單鏈或雙鏈形式的脫氧核糖核酸或核糖核酸。該術語也包括具有合成骨架的核酸樣結構。DNA骨架類似物包括磷酸二酯、硫代磷酸酯、二硫代磷酸酯、甲基膦酸酯、氨基磷酸酯、烷基磷酸三酯、氨基磺酸酯、3′-硫縮醛、亞甲基(甲基亞氨基)、3′-N-氨基甲酸、嗎啉代氨基甲酸酯和肽核酸(PNAs)。參見《寡核苷酸和類似物,實用方法》(編者F.Eckstein),牛津大學出版社IRL出版社(1991);《反義策略》,紐約科學院年報,vol.600,編者Baserga和Denhardt(NYAS 1992);Milligan,J.Med.Chem.,vol.36,pp.1923-1937;《反義研究和應用》(1993,CRC Press)。PNAs含有非離子骨架,如N-2(2-氨乙基)甘氨酸單位。硫代磷酸酯鍵在WO 97/03211;WO 96/39159;和Mata,Toxicol.Appl.Pharmacol.144189-197(1997)中有描述。該術語所包括的其它合成骨架包括甲基膦酸酯鍵或交替的甲基膦酸酯鍵和磷酸二酯鍵(Strauss-Soukup,Biochemistry,368692-8698(1997)和芐基膦酸酯鍵(Samstag,Antisense Nucleic Acid Drug Dev.,6153-156(1996))。術語“核酸”包括基因、cDNAs和mRNAs。
如此處所用的術語“雜交”是指一種核酸分子優先與一種特定的核苷酸序列在嚴格條件下結合、形成雙鏈或雜交。術語“嚴格條件”是指探針優先與相應靶序列雜交,而與其它序列很少雜交或者根本不雜交的條件。“嚴格雜交”是依賴于序列的,在不同條件下不同。核酸雜交的詳盡指南可見于例如Tijssen,《生物化學和分子生物學實驗室技術》(Laboratory Techniques in Biochemistry and MolecularBiology),Elsevier,NY(1993)。高度嚴格的雜交和洗滌條件通常選擇為比具體序列在確定離子強度和pH下的熱熔點(Tm)約低5℃。Tm是50%的靶序列與完全匹配的探針雜交時的溫度(在確定的離子強度和pH下)。極嚴格條件的選擇是在等于一種特定探針的Tm的溫度下進行測定。高度嚴格洗滌條件的一個實例是用0.15M NaCl在72℃下洗滌約15分鐘。嚴格洗滌條件的一個實例子是用0.2×SSC在65℃下洗滌15分鐘。參見Sambrook,《分子克隆實驗室手冊》(第二版),vol.1-3(1989)。
如此處所用的術語“指定位點”被定義為一種給定核酸上的目的多態性位點(即準備識別的多態性位點)。術語“非指定位點”是指與指定位點共存的任何多態性位點或給定核酸上非目的位點的位點。
如此處所用的術語“相關指定位點”是指相關存在的多態性位點。一般而言,為了識別這組多態性位點所屬的等位基因,必須識別該組的每個成員。
如此處所用的術語“選擇的指定位點”是指一種給定核酸上也與本發明探針序列的3’端重疊的目的多態性位點。“非選擇的指定位點”是指不與本發明探針序列的3’端重疊的目的多態性位點。
如此處所用的“干擾性非指定位點”是指距離本發明探針序列的3’端1-5個堿基以內的非指定多態性位點。“非干擾性非指定位點”是指距離本發明探針序列的3’端超過5個堿基的非指定位點。非干擾性非指定位點端可能更靠近探針序列的5’端(與3’端相比)。
在某些實施方案中,本發明的探針包含一個“末端延伸起始”區(也被稱為″TEI″區)和一個雙鏈錨定(″DA″)區。TEI區涉及探針序列的一部分,一般是探針的3個或4個3’端位點。TEI區用來與部分靶核酸序列在指定多態性位點處比對,以啟動聚合酶催化的探針延伸。DA區一般包含探針序列內的其它位點,優選地用來與部分靶序列在靠近(3-5個堿基以內)指定多態性的區域內比對。
如此處所用的術語“緊鄰范圍”是指沿給定核酸鏈1-5個堿基的距離。“附近范圍”是指沿給定核酸鏈1-10個堿基的距離。術語“容錯范圍”是指與靶序列雜交的探針的TEI區中仍然允許探針退火和延伸的錯配總數。一般而言,雜交探針TEI區中2個以上的錯配即超出容錯范圍。
術語“微球”、“微粒”、“微珠”和“顆粒”在此可以互換使用。微珠的組成包括但不限于塑料、陶瓷、玻璃、聚苯乙烯、甲基苯乙烯、丙烯酸系聚合物、順磁材料、氧化釷溶膠、碳石墨、二氧化鈦、乳膠或交聯葡聚糖如瓊脂糖、纖維素、尼龍、交聯膠束和特氟隆。參見BangsLaboratories,Fishers IN的《微球檢測指南》。這些顆粒不必是球形的,可以是多孔的。微珠的大小可以由納米級(例如100nm)到毫米級(例如1mm),約0.2微米到約200微米的微珠是優選的,更優選地,約0.5微米到約5微米的微珠是特別優選的。
本發明用于同時探查一條或多條靶鏈內的一組指定多態性位點的方法,包括首先使一組固定的序列特異性寡核苷酸探針與靶核酸鏈退火,通過該組退火的序列特異性固定化寡核苷酸探針的聚合酶催化的延伸,探查指定多態性位點的構型。一種延伸探針通過與一種給定靶標的序列退火,從而形成雜交復合物(“雙鏈體”),來探查指定位點。探針的3’端位于或靠近靶標內的指定位點,如果3’端探針的組成與靶標在探查位點處的組成匹配(即互補),則聚合酶催化的探針延伸啟動。如此處所述,探針可以被設計成以指定位點位于3’端附近范圍內的方式退火。
在本發明的一個實施方案中,一個具體指定位點的探查可以使用一種或兩種探針。設計探針時考慮探查位點和指定多態性位點附近一定范圍內非指定多態性位點處的多態性或突變的可能性。在本文中,術語“多態性”是指核酸序列中的任何變化,而術語“突變”是指與一種表型有關或認為與表型有關的基因序列變化。在一個優選實施方案中,這多種探針序列中包括與附近范圍內的所有位點中的具體靶序列匹配的至少一種探針,以確保延伸。
在某些實施方案中,本發明公開了用一組L≥S個寡核苷酸引物來平行探查選自長度為N的靶序列的S個多態性位點的組合物和方法。
根據具體測定應用的需要,同一多態性位點可以使用一種或多種不同組成的探針,如此處提供的幾個實施例所詳述。
每種指定探針均由長度為M的核苷酸序列組成,該序列在3’端處或附近含有一個探查位點(即,在雜交后與所分析的多態性位點比對)。盡管3’端是優選的,但是也可以使用距3’端3-4個堿基內的位點。引物固定于固相載體上(可以通過接頭序列或其它接頭部分連接),并且根據它與載體的結合來鑒定。探針序列被設計為允許引物與靶標退火,以在探針與靶標之間形成雜交復合物,確保探查位點與指定多態性位點的比對,優選構型在探針的3’端提供一個探查位點,并且3’端與指定多態性位點比對。用特定探查位點組成的指定探針探查指定多態性位點的核苷酸組成,此步驟為該位點分配兩個值中的一個,即匹配的,數字表示為1,或非匹配的,數字表示為0。在HLA分子分型中,獲得的長度為L的二進制串以理想的分型分辨率識別等位基因。
在一個優選實施方案中,探查步驟利用指定探針的延伸。按照反映現有雜交復合物中靶序列的順序向探針序列中添加一個或多個三磷酸核苷,聚合酶催化的這種反應產生延伸的雜交復合物。為了使這種延伸反應繼續進行,長度為M的指定引物必須含有一個長度為M*≤M的末端延伸起始區,在此也被稱為末端延伸起始序列(或TEI序列),該序列含有探查位點。如果指定探查位點的組成與指定多態性位點的組成匹配,則延伸正常進行。
現有技術中對檢測成功延伸的方法已有描述,包括使用標記的脫氧三磷酸核苷(dNTPs)或二脫氧三磷酸核苷(ddNTPs)。本發明也公開了為檢測成功延伸提供光學標簽的新方法,它不需要標記的dNTPs或ddNTPs,這是一種優點,因為現有的聚合酶引入標記的dNTPs或ddNTPs的效率低。
然而,本發明所述高度多態性基因座中多態性位點的密度,使得當與靠近指定多態性位點的靶亞序列退火時,針對所選多態性位點的指定引物可能與相鄰的多態性位點重疊。
也就是說,一種用來探查靶標在所選多態性位點之一處的構型的寡核苷酸探針,為了在與正確的靶亞序列退火中確保特異性和熱穩定性而將其構建為足夠的長度,該探針將與鄰近的其它多態性位點比對。這些干擾性多態性位點可包括非指定位點,以及靶序列內未選擇的指定位點。
在溶液中進行的一種多重SSP反應中,針對選擇的鄰近多態性的指定探針之間的部分重疊可能導致探針之間互相競爭同一靶標。本發明通過探針固定化顯著減少了這種復雜性。
對于多重差異雜交,指定探針與靶標之間一個或多個位點的錯配可能影響雜交復合物的熱穩定性。即,施加于整個反應混合物的任何一組退火條件可以在探針與靶標之間產生不同程度的退火,并且可能影響隨后探針延伸反應的結果,從而使隨后可能需要亞序列重測序的實驗具有不確定性。
緊鄰位于指定探針3’端或其附近的探查位點的非指定多態性位點特別不利于探針TEI序列啟動延伸反應的效率。
鑒于單核苷酸以及多核苷酸多態性,目前可用的催化延伸反應的聚合酶辨別指定引物內探查位點與多態性位點組成之間匹配與錯配的能力取決于從引物的3’端對探查位點的替換。
在一個產生最佳辨別力的優選實施方案中,探查位點位于探針的3’端。假定使用一種長度為M、針對公式PM(S*)={cp(m);1≤m≤M}中的選擇位點s*而設計的探針序列(系數m以引物的5′至3′方向增加),這種構型提供了指定位點s*與探針序列中位點M的比對;對于多核苷酸的多態性,也涉及位點M-1(對于二核苷酸多態性)和M-2(對于三核苷酸多態性)等。
在高度多態性基因座多重分析所預料的情況下,由于與限制SSO分析效力密切相關的“次最佳”退火條件引起的復雜性,使用聚合酶催化延伸反應所帶來的特異性提高的優點大大減少或喪失。
對于任何給定的指定多態性位點具有相同探查位點組成的多重探針序列,其設計的優化應考慮干擾性多態性包容的概念。在不限制普遍性的條件下考慮單核苷酸多態性的例子,s*的比對從3’端向位點M-1、M-2、...、M-m*的位移致使分辨力逐漸減弱。也就是說,當指定多態性位點與內部探針位點m*比對時,延伸反應不再能辨別匹配和錯配。反之,在探查位點位于探針3’端的優選實施方案中,附近的非指定多態性對延伸反應效率的不利影響同樣隨著與3’端的距離而降低。也就是說,與1和m*之間的位點比對的非指定多態性不影響延伸反應。
探針內長度為M-m*+1的末端序列在此被稱為給定引物的TEI序列。通常1<m*<M,TEI序列可能只包含少量的末端探針位點;在某些情況下,m*=1,因此探針序列包含完整的探針序列。
通過在多重探針設計中考慮到干擾性多態性位點的公知序列變異,本發明適應在指定探針序列長度內存在這些干擾性多態性位點。具體而言,由于存在長度為M-m*+1的TEI序列,用于給定探針長度M的備選探針序列構型的數量顯著減少。也就是說,為了確保延伸反應的有效分辨力,使預期的備選探針序列的構型限于TEI序列的長度即足夠。在一個優選實施方案中,預先考慮所有可能的備選序列,這樣這些備選探針序列之一將在所有位點m*、m*+1、...、M-1、M與靶標匹配。
對于每個選擇的多態性位點,如果所有指定探針都是通過與編碼的固相載體單獨結合來分別編碼,則這些具有預期序列的探針的多樣性增加了編碼的復雜性。但是,將這組探針置于常用固相載體上可以減少這種復雜性。也就是說,對于任何指定探針,只有其探查位點的組成被編碼,這一概念在此被稱為TEI序列匯集(pooling)或探針匯集。完全的探針序列匯集使編碼復雜性降低到原始設計的程度,其中沒有預期的探針序列。也可以是部分匯集。
在某些優選實施方案中,探針延伸中使用的聚合酶是缺乏3’-5’外切核酸酶活性的DNA聚合酶。這類聚合酶的實例包括T7 DNA聚合酶、T4 DNA聚合酶、ThermoSequenase和Taq聚合酶。當靶核酸序列是RNA時,可以使用逆轉錄酶。除了聚合酶之外,還添加三磷酸核苷,優選地添加所有4種堿基。例如可以添加dNTPs或類似物。在其它某些實施方案中,可以添加ddNTPs。標記的核苷酸類似物,如Cye3-dUTP,也可以用來進行檢測。
使用標記的脫氧三磷酸核苷(dNTPs)或雙脫氧三磷酸核苷(ddNTPs)來檢測成功延伸的現有技術方法已經被描述。本發明公開了用光學標簽檢測成功延伸的新方法,因而不需要使用標記的dNTPs或ddNTPs。這是有利的,因為現有的聚合酶在應用于標記dNTPs或ddNTPs中效率較低。
本發明提供用于對高度多態性靶區進行精確多態性分析的方法和組合物。在這里,高度多態性序列是指在探針接觸的一部分序列內不僅含有指定或探查的多態性位點,而且含有潛在分析誤差來源的非指定多態性位點的序列。類似的考慮與多重PCR反應的設計、組合物和方法有關。在一個優選實施方案中,由引導和退火亞序列組成的覆蓋(covering)性多組PCR探針在編碼的微粒上展示,通過探針延伸產生微珠展示的擴增子。微珠的裝配可以在擴增之前或之后在平面基質上形成,以實現探針的解碼和成像。
在一個實施方案中,本發明提供含有3’端“引導”亞序列(在此也被稱為末端延伸起始(TEI)區)和退火亞序列(在此也被稱為雙鏈錨定(DA)區)的探針。TEI區一般包含探針序列的3個或4個3’端位點。TEI區用來與指定多態性位點處的部分靶序列比對,以啟動聚合酶催化的探針延伸。探針延伸說明整個TEI區的組成和靶序列的相應部分完全匹配。包含探針序列內其余位點的DA區優選地用來與靠近(3-5個堿基內)指定多態性的區域內的部分靶序列比對。雙鏈錨定區用來確保特異且強的退火,并非用于多態性分析。如此處所述,DA和TEI區可能在探針內彼此直接相鄰,或者可以通過分子鏈(moleculartether)連接。后一種方法使DA區的位置具有靈活性,以避開與指定位點直接相鄰的非指定多態性。選擇DA區的組成和長度,以實現形成穩定的序列特異性雜交復合體(“雙鏈體”),同時適應(即考慮)位于該靶區內的一個或多個非指定多態性的存在。選擇退火亞序列的長度,通過使探針與未選擇靶亞序列之間的序列同源性最小化,使得交叉雜交最小化。退火亞序列的長度通常超過引導亞序列的長度,因此不能形成雙鏈體通常意味著不能產生延伸產物。
延伸反應在檢測位于TEI區內的多態性上具有高特異性。對于DA區中的非指定多態性,延伸反應以相當于或低于某些條件下完全匹配的水平進行。這被稱為延伸反應的容錯效應。如此處實施例所述,在探針設計中利用容錯性來分析指定和非指定的多態性。
本發明某些實施方案所述的高度多態性基因座中多態性位點的密度使得當針對指定多態性位點的探針與靠近指定多態性位點的靶亞序列退火時,能夠與相鄰的多態性位點重疊。也就是說,一種用來探查選擇的指定多態性位點處靶標的構型、并被構建為具有與正確靶亞序列退火中足以確保特異性和熱穩定性的長度的寡核苷酸探針,將與鄰近的多態性位點比對。這些干擾性多態性位點可能包括靶序列中的非指定位點,以及指定的但是未選擇的多態性位點。
具體而言,本發明所預期的非指定多態性可能干擾雙鏈體的形成,從而干擾或完全抑制探針延伸。在一個實施方案中,本發明提供包容這些非指定多態性的覆蓋探針組的設計。一個覆蓋探針組包括用于同時探查核酸序列內指定多個多態性位點的探針。對于每個位點,覆蓋探針組包括至少一種能夠與靶標退火的探針,以便在隨后延伸反應的基礎上,為該位點分配兩個可能的值之一“匹配的”(延伸)或“不匹配的”(不延伸)。
可與每個指定位點結合的覆蓋探針組可以含有在一個或多個位點處不同的兩種或多種探針,在此也被稱為簡并組。在某些實施方案中,探針序列可含有能夠與DNA中遇到的所有核苷酸形成堿基對的通用核苷酸。在某些實施方案中,探針可以附著于編碼的微粒上,特別是,覆蓋組或簡并組中的兩種或多種探針可以附著于同一類型的微粒上。兩種或多種探針與微粒或微珠附著的過程被稱為“探針匯集”。
這里,在遺傳分析的兩個代表性領域描述了與延伸介導的多態性多重分析有關的覆蓋探針組的設計,(1)多個無關的指定多態性和突變的評分,如CF的突變分析和德系猶太人(AJ)疾病載體的篩查,和(2)一組相關多態性的評分,如HLA分子分型。在第一種情況中,用于突變全部多樣性的覆蓋組包括多個亞組,每個亞組與一個指定位點有關。在這種情況下,用兩種或多種探針來確定雜合性。對于普通SNP鑒定和確證性測序,可以使用簡并探針組,對于每個多態性位點該簡并探針組可含有多達4種標記(例如微珠展示的)探針。在第二種情況中,覆蓋組包括如此處詳述的為使組中探針數量最小化而構建的亞組。指定探針組用來根據延伸圖譜識別等位基因特異的序列構型。
這種包容或識別非指定多態性位點的方法尤其可以用于序列特異性探針的多重延伸,也可以與探針的單堿基延伸聯合使用,也被稱為微測序(參見例如Pastinen等人,Genome Res.7606-614(1997),在此引用作為參考)。
與單堿基探針延伸方法不同,本發明的延伸介導的分析方法不僅可以用來檢測SNPs,而且也可以用來檢測其它類型的多態性,如多(例如二、三等)核苷酸多態性,以及在高度多態性基因座如HLA的分型中常見的插入和缺失。在這些復雜系統中,根據本發明方法的序列特異性探針延伸簡化了檢測步驟,因為每個目的多態性靶位點使用兩種或多種探針,并且檢測步驟只用于檢測兩種或多種探針中哪一種被延伸了,而不是象單堿基探針延伸那樣為了辨別兩種延伸的探針而進行檢測。因此,盡管本發明的方法適于在檢測步驟中使用多種熒光團或發色團標記,但是一種通用標記通常足以進行序列特異的探針延伸。這與單堿基延伸方法相反,后者用于多重形式時至少需要兩種熒光團或發色團標記。
DNA甲基化在某些實施方案中,提供了測定DNA甲基化狀態的方法和組合物。胞嘧啶甲基化早已被認為是哺乳動物細胞中基因沉默的一個重要因素。在大量轉錄因子識別位點中的單CpG二核苷酸處,胞嘧啶甲基化足以阻斷結合,并且與幾種疾病有關。eMAP能夠用來測定基因組DNA的甲基化狀態,用于診斷和其它目的。DNA的修飾是通過亞硫酸氫鈉處理將未甲基化的胞嘧啶轉化為尿嘧啶。在除去亞硫酸氫鹽并完成化學轉化后,這種修飾的DNA被用作PCR的模板。設計了一對探針,一個對于目的基因已經甲基化的DNA特異,另外一個對于未甲基化的DNA特異。使用DNA聚合酶、一種標記的dNTP和3種dNTPs或ddNTPs的未標記混合物進行eMAP。特定微珠表面上的延伸產物能夠表示甲基化狀態。
選擇性測序在本發明的其它一些實施方案中,選擇性測序(也被稱為“測序”)用于同時探查核酸序列內整個一組指定多態性,以測定每個位點處的組成。選擇性測序能夠提供必要的信息,用來從目的序列的一組可能構型中選擇具體樣品的實際構型,或者縮小該樣品中可能序列組的范圍。在選擇性測序中,延伸反應使用的探針長度決定了能夠測定的序列長度。對于較長的DNA序列,可以利用交錯探針設計將序列連接在一起。因此,已知的序列組合能夠得到證實,而未知的序列組合能夠被識別為新的等位基因。
囊性纖維化載體篩查本發明的一個實際應用包括對囊性纖維化跨膜傳導(CFTR)基因中一大組非指定突變在內的一組指定突變和多態性的分析。該組中的每個指定突變均與疾病有關,必須獨立評分。在最簡單的點突變中,使用兩種編碼探針以確保它們各自3’端與指定位點的比對,其中一種探針用于野生型,另一種用于改變的(“突變的”)靶序列。
然而,如此處幾個實施例所述,為了確保無論指定位點附近的具體靶序列構型如何都能延伸,也用其它探針來匹配任何可能的構型。在一個優選實施方案中,構建一個覆蓋探針組,其含有展示對應于相應靶亞序列所有已知或可能變異的TEI序列的探針。在位于指定位點附近的其它延伸抑制性非指定多態性的存在下,這確保了延伸。
在某些實施方案中,識別非指定位點中的具體靶構型不是必需的,只要覆蓋組中提供的序列之一與靶序列精確匹配,因而在TEI區內與靶序列匹配以確保延伸即可。在這種情況下,具有相同3’端的所有或某些覆蓋探針可以分配相同的編碼。在一個優選實施方案中,這些探針可以與相同的固相載體結合(“探針匯集”)。探針匯集減少了代表TEI序列必需數量所需的不同固體載體的數量。在一個特別優選的實施方案中,固體載體是一組不同微粒或不同微粒陣列,它們可以原位解碼。為了識別靶區內的其它多態性,覆蓋探針組中包含其它探針是闡明不同群體的單倍型的有用方法。
HLA本發明的另一個應用包括人白細胞抗原(HLA)復合物的遺傳分析,可以識別編碼I類HLA抗原(優選地HLA-A、HLA-B、HLA-C或其任意組合)和II類HLA抗原(優選地包括HLA-DR、HLA-DQ、HLA-DP或其任意組合)的HLA區內的一種或多種等位基因。I類和II類基因座也可以同時分析。
與多個無關指定突變的獨立評分相反,等位基因(或等位基因組)的識別依賴于完整的一組延伸反應的評分。這些反應的每一個包括一種或多種針對選擇的一組指定多態性位點成員的探針。這組延伸反應產生一種特有的延伸信號模式。在一個優選實施方案中,產生一種二進制模式,為匹配(因而延伸的)探針賦值“1”,為未延伸的探針賦值“0”。給定長度的二進制模式(“串”)唯一地確定一種等位基因或一組等位基因。
HLA分型所需的探針總數取決于希望的分辨率。術語“分辨率”在此是指等位基因辨別的程度。優選地,本發明方法可以對足以辨別不同抗原組的HLA等位基因進行分型。例如,A*01和A*03是不同的抗原組,在臨床應用中必須加以辨別。國家骨髓捐贈者計劃(NMDP)為供體的分子分型推薦了一個系列(panel)。NMDP系列所需的低到中分辨的意思是無論何時不同抗原組都應當能夠被辨別。此外,盡管不是所有等位基因都必需被辨別,一組內至少某些等位基因應當被辨別。在某些實施方案中,本發明可以如NMDP標準所定義的(www.NMDPresearch.org)(在此引用作為參考)對HLA等位基因以低到中分辨率分型。
以這樣的分辨率,A*01、A*03等將總是能夠被識別。A*0101和A*0102可能不是總能辨別。對于SSO法,現有的NMDP系列含有30種用于HLA-A的探針;48種用于HLA-B的探針;31種用于HLA-DR-B的探針。高分辨率的HLA分型是指每個組的大多數等位基因都被鑒定的情況。在這種情況下,A*0101和A*0102將被區別。為了達到這種分辨率,I類和II類分型需要約500-1000種探針。在某些實施方案中,本發明方法提供高分辨率的HLA分型,至少達到Cao等人在Rev.Immunogentics,1177-208(1999)(在此引用作為參考)所述的程度。
本發明還提供指定位點和為這些指定位點設計探針組的策略,以便根據延伸反應信號模式產生唯一的等位基因分配。覆蓋探針的設計必須考慮每種探針的TEI和DA區的各自不同的功能。
構建可與給定指定位點結合的覆蓋組探針,其中包括亞組。每個亞組又包括展示相同TEI區的探針。TEI區內一個位點的錯配或DA區內三個或更多位點的錯配將阻礙延伸。因此,組成上具有這種差異的兩種探針的延伸通常產生不同的延伸模式。在平行延伸反應中所有這些探針都可能是多重的,只要它們被分別編碼。在一個優選實施方案中,通過將探針附著于顏色編碼的微珠完成編碼。
展示相同TEI亞序列并展示在不超過2個位點上不同的DA亞序列的探針通常產生延伸反應,其產量(因而信號強度)相當于或低于完全匹配。在顯示錯配包容的第一種情況中,與所述探針匹配的等位基因組將擴展,以包括展示DA區內被包容錯配序列構型的等位基因。在僅顯示部分包容的第二種情況中描述了三種方法,來進一步闡明等位基因匹配模式。在第一種方法中,覆蓋組包括在各自的DA區內展示一個或兩個核苷酸多態性的探針。通過定量比較覆蓋組內不同探針產生的信號強度獲得有關靶序列的信息。在第二種方法中,使用包含通過鏈(tether)連接的分離的TEI和DA區的探針,使DA區更加遠離TEI區,以避免靶多態性。在第三種方法中,探針被任選地匯集,使得匹配的等位基因組僅有限地擴增。
在本發明的某些實施方案中,探針優選地設計為與已知與HLA基因座內等位基因組合有關的某些靶序列互補。已知的多態性是文獻中的或從可搜索的序列數據庫(例如www.NMDProcessing.org)中能夠獲得的多態性。在某些實施方案中,目的HLA基因屬于HLA I類組(例如HLA-A、HLA-B或HLA-C或其組合)。在其它某些實施方案中,目的HLA基因屬于HLA II類組(例如DR、DQ、DP或其組合)。HLA I類和II類基因座可以組合檢查和同時探查。
以前在SSP/凝膠法中使用的探針也可以在本發明中使用。優選地,Bunce等人,Tissue Antigen,46355-367(1995)和/或Bunce等人,Tissue Antigen,4581-90(1995)(均在此引用作為參考)所述的探針可在制備本發明的探針中使用。WO 00/65088;歐洲申請號98111696.5;WO 00/70006;和Erlich等人,Immunity,14347-356(2001)(均在此引用作為參考)提供的探針序列或HLA序列信息可以用于設計本發明的探針。
編碼的微珠陣列的復雜性易于調節,以適應必需的分型分辨率。例如,當4種不同的亞陣列中均使用32種類型的微珠時,可以使用總共128種探針,在多重延伸反應中獲得中等水平的HLA I類和II類分型分辨率。類似地,使用128種微珠和4種亞陣列,或64類微珠和8種亞陣列,可以使用總共512種探針,在多重延伸反應中獲得高分辨率的HLA I類和II類分型。
編碼的微珠陣列形式與高通量分析相適應。例如,本發明的某些實施方案提供一種適應多個樣品的載體,其形式與96孔微孔板的大小相適應,使得樣品分配可以用標準機器人流體處理裝置操作。這種形式能夠適應置于芯片上的多個編碼的微珠陣列,并且允許在一個多芯片載體上同時對多個患者樣品的每個進行多個分型反應。在每名患者檢測128種類型的96孔載體中,能夠以現有SSP或SSO方法無法達到的通量速度測定10,000種以上的基因型。
在本發明的某些實施方案中,延伸反應能夠與隨后的雜交反應相組合,以將同一DNA靶鏈上的不同亞序列關聯起來,這種能力在此被稱為“定相(phasing)”。定相解決了等位基因的不同組合產生特定延伸模式的可能性所引起的等位基因分配的不確定性。類似地,定相可以在單倍體分型(haplotying)中用來將多態性分配給同一DNA鏈或染色體。
在本發明的某些實施方案中,延伸反應的退火和延伸步驟能夠組合為一步反應。此外,產生連續或不連續溫度變化的裝置可以被引入到該系統中來,以適應多重反應中具有不同解鏈溫度的多個探針的多個最佳條件。
在本發明的某些實施方案中,編碼的微珠陣列在固體基質上形成。這些固體基質可以包括任何適宜的固體材料,如具有足夠的機械強度、并且如果需要能夠經受加工步驟的玻璃或半導體。在某些實施方案中,固體基質被分成不連續的單元,稱為“芯片”。包含編碼的微珠陣列的芯片如果被裝載到多芯片載體上,可以單個地或成組地加工。例如,可以使用標準溫度控制方法設定單個芯片或多芯片載體的操作溫度,或者對它們施加預編程的溫度改變順序。此外,也可以利用隨機編碼陣列檢測(“READ”)的直接成像能力分析芯片,如PCT/US01/20179所公開的,其內容在此引用作為參考。使用READ,芯片上整個編碼微珠陣列的多重分析是可能的。此外,在READ形式中,預編程的溫度循環的應用提供了延伸產物的實時芯片上擴增。對于基因組、線粒體或其它DNA,線性芯片上擴增可以不需要測定前的DNA擴增,如PCR,從而顯著縮短完成整個分型實驗所需的時間。因此時間敏感的應用,如尸體的分型成為可能。更重要的是,這種方法消除了多重PCR的復雜性,這是許多遺傳篩查和多態性分析中的限速步驟。在一個優選實施方案中,一種流控盒被用于樣品和試劑注射以及溫度控制。
在一個實施方案中,本發明提供一種多態性分析方法,其中通過使用一個或多個“退火-延伸-檢測-變性”溫度循環,每個靶核酸序列都被用作多延伸反應中的模板。該方法實現了原位檢測延伸產物的線性擴增。這種額外的能力避免了需要序列特異性擴增多核苷酸樣品的第一步。
通過整合測定步驟與循環信號擴增不僅簡化并加快了遺傳分析的完成,而且不需要開發、檢測和進行多重PCR步驟。本發明的方法還提供了一種高通量形式,用于多個患者樣品的同時遺傳分析。
本發明的幾個實施方案用于序列特異性探針的多重延伸,以允許同時評價大量不同的靶標。在某些實施方案中,寡核苷酸探針被固定于固體載體上,在單表面如硅或玻璃表面上產生密集的探針模式。在某些實施方案中,預先合成的寡核苷酸探針被固定于固體載體上,例如括硅、化學修飾的硅、玻璃、化學修飾的玻璃或塑料。這些固體載體可以是微珠的形式。寡核苷酸陣列的分辨率取決于輸送系統的空間分辨率和輸送的核苷酸溶液體積的物理空間需求。[參見Guo等人,Nucleic Acids Res.225456-5465(1994);Fahy等人,Nucleic AcidRes.211819-1826(1993);Wolf等人,Nuc.Acids Res.152911-2926(1987);和Ghosh等人,Nuc.Acids Res.155353-5372(1987).]。
本發明提供多重分析方法。在某些實施方案中,延伸探針組以保持其身份的方式被固定在固相上,例如通過空間上分離不同探針和/或以化學方法編碼探針身份。然后使一種或多種溶液攜帶的靶標在退火和延伸反應中接觸固定化的多種探針。通過固定使探針彼此在空間上分開降低了延伸產物識別中的不確定性。因此,本發明具有優于現有PCR-SSP方法的優點,后者不適于高通量形式,因為(i)每個PCR擴增需要2種探針;(ii)在多重同源反應中,重疊探針之間對高度多態性基因如HLA的競爭;(iii)在這種多重反應中辨別具體產物的困難。
在一個優選實施方案中,探針通過各自的5’端與編碼的微粒(“微珠”)附著,這些微粒具有可以唯一地識別所附著探針的可以區分的化學或物理特征。探針捕獲接觸微珠的溶液中的目的靶序列。在特定微珠上展示的探針的延伸產生可光學檢測的信號或可以轉換為可光學檢測信號的化學信號。在一個多重延伸反應中,每個參與反應的微珠的光學標簽唯一地對應于該珠上展示的探針。探針延伸步驟后,通過顆粒鑒定和檢測,例如通過流式細胞儀,可以確定探針的身份。
在某些實施方案中,在延伸步驟前微珠可以以平面陣列排列于基質上。微珠也可以在平面基質上裝配,以利于延伸步驟后的成像。此處所述的方法和系統提供了一種高通量檢測形式,它允許整個微珠陣列的快速成像,和對多個患者樣品同時進行遺傳分析。
微珠陣列可以是隨機編碼的陣列,其中陣列內微珠的可以區分的化學或物理特征表明與微珠附著的寡核苷酸探針的身份。陣列也可以按照READ形式形成。
微珠陣列可以使用分批方法制備,產生用途特異的基質(例如晶體大小的芯片)。編碼的并與寡核苷酸探針附著的微珠(例如約108微珠/100μl懸液的范圍)與基質(例如硅芯片)結合,在基質指定區域上裝配形成密集陣列。在某些實施方案中,微珠陣列含有4000個直徑為3.2μm的微珠,微珠陣列的大小為300μm×300μm。隨著微珠的大小不同,密度也不同。多個微珠陣列也能夠在同一芯片上的不連續流體區室內同時形成。這些方法在2002年7月9目提交的美國申請系列號10/192,351中公開,在此全文引用作為參考。
微珠陣列可以用通稱為“LEAPS”的方法形成,如美國專利號6,251,691和PCT國際申請號PCT/US00/25466中所述,均在此引用作為參考。
本發明使用的基質(例如芯片)可以是根據LEAPS界面模建(patterning)法模建的平面電極的形式。例如,基質可以用氧化物或其它絕緣材料模建,在施加的交流電場存在下產生希望的阻抗梯度結構。可以設計模式,產生交流電場誘導的流體流動和相應顆粒轉運的希望的結構。利用半導體加工技術,基質可以以晶片大小模建。另外,也可以使基質區室化,方法是澆注可紫外線模建、光學透明的聚合物薄膜,使希望的流體導管和區室的平面固定在基質上。這些導管和區室將流體限定在一個或幾個不連續的區室中,從而適用于一個給定基質上的多個樣品。
微珠陣列可以用LEAPS制備,方法是提供第一個平面電極,它與第二個平面電極基本平行(“夾心”結構),兩個電極通過一個間隙(gap)分開,其中含有可極化的液體介質如電解質溶液。第二個平面電極的表面或內部可以用界面模建法模建。向間隙內加入微珠。當對間隙施加交流電壓時,微珠在第二個電極(例如“芯片”)上形成隨機編碼的陣列。
在LEAPS的另一個實施方案中,微珠陣列可以在光敏電極(例如“芯片”)上形成。優選地,上述夾心結構也使用平面光敏電極和另一種平面電極。同樣,兩個電極用一個間隙分開,其中含有電解質溶液。向間隙內加入功能化和編碼的微珠。在施加交流電壓以及光線后,微珠在光敏電極上形成陣列。
在本發明的某些實施方案中,微珠可能與化學或物理上可以區分的特征關聯。例如,可以用幾組可光學區分的標簽對微珠染色,例如含有一種或多種熒光團或發色團染料的標記,這些染料可以通過激發波長、發射波長、激發態壽命或發射強度辨別。可以用可光學辨別的標簽以特定比例對微珠染色,如Fulwyler,US 4,717,655(Jan 5,1988)所公開的。也可以根據本領域技術人員公知的方法使顆粒膨脹,實現染色(Molday,Dreyer,Rembaum & Yen,J.Mol Biol 64,75-88(1975);L.Bangs,″Uniformlatex Particles,Seragen Diagnostics,1984)。例如,膨脹以及用兩種顏色大量染色可以編碼多達12種類型的微珠,每一類型分別有4個強度水平,以4種標定摩爾比混合。此外,國際申請號PCT/US 98/10719(在此全文引用作為參考)所述的組合顏色編碼方法也能夠用來使微珠陣列具有可光學辨別的標簽。除了化學編碼外,也可以通過PCT/US0/20179所述的方法使微珠具有磁性。
除了用染料化學編碼外,具有某些寡核苷酸引物的微珠也可以在空間上被分開(“空間編碼”),使得微珠的位置提供了關于微珠身份的信息。例如,利用表面附近顆粒的光控電動裝配(LEAPS),能夠在陣列裝配過程中在單一液相內實現空間編碼。根據交變電場和/或投射到基質上的光模式,可以用LEAPS以任何希望的構型裝配平面微珠陣列。
LEAPS可以用來在硅芯片與溶液的界面處產生橫向阻抗梯度,以調節介導陣列裝配的電流體動力。電需要是有限的在兩個平面電極之間的流體間隙(一般為100μm)上施加一般低于10Vpp的低交流電壓。這一裝配過程是快速的,并且是可光學編程的在施加的電場下幾秒鐘之內形成含有幾千個微珠的陣列。在區室化芯片表面上的多個液相中也可以形成多個亞陣列。
陣列在形成后可以被固定化。例如,通過施加直流電壓產生隨機編碼的陣列可以固定微珠陣列。直流電壓一般設定為5-7V(對于2-6μm的微珠和100-150μm的間隙),并以″反偏壓″配線施加<30秒,使得n摻雜的硅基質形成正極,這種直流電壓使陣列被壓縮到實現陣列內相鄰微珠之間接觸的程度,同時使微珠向鄰近電極表面的高電場區域移動。一旦充分緊密地接近,微珠即通過范德華力介導的物理吸附錨定。在微珠表面上提供一群從微珠表面延伸的“鏈”可以實現這一吸附過程;聚賴氨酸和鏈親和素已經被用于這一目的。
在某些實施方案中,顆粒陣列可以通過化學方法固定,例如形成復合的凝膠-顆粒薄膜。在形成這種凝膠復合顆粒薄膜的一個典型方法中,提供了一種微粒懸液,它也含有單體、交聯劑和原位凝膠形成的引發劑。利用LEAPS將顆粒在基質上裝配為一個平面裝配體。在電極之間的流體空隙上施加頻率為幾百到幾千赫茲的1-20Vp-p的交流電壓。在施加的交流電壓存在下,在陣列裝配后,利用紅外(IR)燈將小室加熱到約40-45℃、或者利用汞燈源光加熱引發液相的聚合。產生的凝膠可有效地捕獲顆粒陣列。凝膠可以由單體濃度為20%-5%的丙烯酰胺和雙丙烯酰胺的混合物組成(丙烯酰胺∶雙丙烯酰胺=37.5∶1,摩爾比),但是也可以使用其它任何低粘度水溶性單體或單體混合物。利用該方法制備的化學固定的功能化微粒陣列可用于多種生物測定,例如配體受體結合測定。
在一個實例中,用低濃度的偶氮二異丁脒(azodiisobutyramidine)二鹽酸鹽作為熱引發劑形成熱水凝膠,以確保聚合混合物的總離子強度為約0.1mM到1.0mM。用于紫外線聚合的引發劑是Irgacure2959(2-羥基-4′-羥基乙氧基-2-甲基苯丙酮,Ciba Geigy,Tarrytown,NY)。向單體中加入引發劑,達到1.5重量%溶液。
在某些實施方案中,顆粒陣列可以用機械方法固定。例如,可以用標準半導體加工方法在硅基質的低電阻區產生微孔陣列。顆粒陣列可以用這些結構構成。在某些實施方案中,利用LEAPS介導的水動力學和有質動力轉運并在有孔陣列上積累顆粒。然后切斷交流電場,顆粒被捕獲到微孔內,從而被機械限制。除去過量的微珠,在基質表面上留下一個空間有序的隨機微珠陣列。
基質(例如芯片)能夠被置于一個或多個封閉的間隔內,樣品和試劑可以通過流體相互連接輸入或輸出該間隔。也可以在開放的間隔形式如在微量滴定板上進行反應。試劑可以用機器人液體處理設備轉移到芯片之上,多個樣品可以同時處理。這種形式適用于現有微量滴定板形式的標準樣品處理和液體處理,并集成了樣品處理和陣列檢測。
在本發明的某些實施方案中,編碼的微珠在基質表面而不是在陣列內裝配。例如,通過將微珠懸液點樣到基質的多個區域內,并且使微珠在重力下沉淀,微珠裝配體能夠在基質上形成。與LEAPS形成的微珠陣列相反,這些裝配體通常呈現混亂的低密度結構或非平面結構,包括微珠的堆集(stacking)或聚集(clumping),從而妨礙了受到影響的微珠的成像。然而,通過將化學編碼的微珠混合物點樣到基質上多個不連續位置內所獲得的空間和顏色編碼組合仍然允許多重分析技術(multiplexing)。
在某些實施方案中,利用檢測后的陣列圖像與陣列的解碼圖像比較來揭示化學或物理學上可以區分的特征,以及探針的延長。這種比較能夠用例如具有成像檢測器和計算機化圖像捕獲及分析裝置的光學顯微鏡完成。陣列的檢測圖像被用來檢測表明探針延伸的光學標簽。解碼的圖像被用來確定化學和/或物理學上可以辨別的特征,這些特征能夠唯一地識別微珠表面展示的探針。這樣,陣列中每個顆粒上的探針身份可以根據可辨別的特征識別。
在分析從解碼和檢測圖像獲得的數據時可以使用圖像分析算法。這些算法可以用來獲得陣列內每個微珠的量化數據。分析軟件以陣列的亮視野圖象為模板自動定位微珠的中心,根據類型將微珠分組,為每個微珠分配量化強度,去除如血清標本中不規則形狀的“基質”材料所產生的“疵點”,分析背景強度統計數字,并評價所有微珠類型的背景修正的平均強度以及相應的方差。這些算法的例子如PCT/US01/20179所述。
探針延伸可以用光學標簽的改變表示,或者用可轉換為光學標簽改變的化學信號的改變表示,這些信號例如來源于展示延伸探針的微珠。本領域公知的直接和間接標記方法可用于此目的。直接標記是指延伸產生的光學標簽的改變;間接標記是指延伸引入改變,而該改變需要一個或更多額外步驟來產生可檢測的光學標簽。在某些實施方案中,熒光團或發色團染料可以附著于作為探針延伸成分加入的一種核苷酸上,使得探針延伸改變微珠的光學標簽,這是通過例如改變熒光強度、或者使展示延伸產物的微珠的光學標簽具有其它改變來實現。
實施例通過下列實施例,本發明將被更好地理解。這些實施例應當被理解為只是說明性的,不能被視為以任何方式限制本發明。
實施例1用于多重SSP分析的交錯探針設計用于每種多態性的探針被固定于固相載體上,提供能夠以最小的相互干擾同時進行多個退火和延伸反應的形式。具體而言,該方法提供一種適合重疊探針的設計,如圖1所示。在該實施例中,我們考慮了3個等位基因等位基因A、等位基因B和等位基因C。探針1和2檢測與各自的3’端比對的SNPs,而探針3和4檢測與各自的3’端比對的兩個核苷酸多態性。探針1和2所針對的多態性位點位于探針3和4所針對的多態性位點上游5個核苷酸處。這種設計允許每種探針結合它相應的靶標,當在指定多態性位點處完全匹配時允許進行延長。因此,探針1和3與等位基因A匹配,探針2以及可能是探針3與等位基因B匹配,探針1和4與等位基因C匹配。
實施例2用于HLA分型的探針設計為了設計用來分析DRB基因從堿基106到堿基125的多態區的探針,對于該長20個堿基的片段,DRB數據庫中有22個不同類型的序列。在下表中列出7 DRB1*0101 TTCTTGTGGCAGCTTAAGTT104 DRB1*03011 TTCTTGGAGTACTCTACGTC26DRB1*04011 TTCTTGGAGCAGGTTAAACA1 DRB1*0434 TTCTTGGAGCAGGTTAAACC3 DRB1*07011 TTCCTGTGGCAGGGTAAGTA
1DRB1*07012 TTCCTGTGGCAGGGTAAATA28 DRB1*0801TTCTTGGAGTACTCTACGGG1DRB1*0814TTCTTGGAGTACTCTAGGGG1DRB1*0820TTCTTGGAGTACTCTACGGC1DRB1*0821TTCTTGGAGTACTCTATGGG1DRB1*09012 TTCTTGAAGCAGGATAAGTT2DRB1*10011 TTCTTGGAGGAGGTTAAGTT1DRB1*1122TTCTTGGAGCAGGCTACACA1DRB1*1130TTCTTGGAGTTCCTTAAGTC18 DRB1*15011 TTCCTGTGGCAGCCTAAGAG9DRB3*01011 TTCTTGGAGCTGCGTAAGTC1DRB3*0102TTCTTGGAGCTGTGTAAGTC1DRB3*0104TTCTCGGAGCTGCGTAAGTC16 DRB3*0201TTCTTGGAGCTGCTTAAGTC1DRB3*0212TTCTTGCAGCTGCTTAAGTC6DRB4*01011 TTCTTGGAGCAGGCTAAGTG14 DRB5*01011 TTCTTGCAGCAGGATAAGTA第一列包括共享第三列所列序列的等位基因數,第二列包括等位基因名稱之一。我們選擇20-堿基片段的最后三個堿基作為TEI區,并且根據其TEI區對序列組分類,獲得下列組1 104 DRB1*03011 TTCTTGGAGTACTCTACGTCe11 DRB1*1130TTCTTGGAGTgCctTAaGTC9 DRB3*01011 TTCTTGGAGctgcgTAaGTC1 DRB3*0102TTCTTGGAGctgTgTAaGTC1 DRB3*0104TTCTcGGAGctgcgTAaGTC16 DRB3*0201TTCTTGGAGctgctTAaGTCe21 DRB3*0212TTCTTGcAGctgctTAaGTC
27 DRB1*0101 TTCTTGTGGCAGCTTAAGTT1 DRB1*09012TTCTTGaaGCAGgaTAAGTT2 DRB1*10011TTCTTGgaGGAGgTTAAGTT326 DRB1*04011TTCTTGGAGCAGGTTAAACA1 DRB1*1122 TTCTTGGAGCAGGcTAcACA41 DRB1*0434 TTCTTGGAGCAGGTTAAACC53 DRB1*07011TTCCTGTGGCAGGGTAAGTA14 DRB5*01011TTCtTGcaGCAGGaTAAGTA61 DRB1*07012TTCCTGTGGCAGGGTAAATA728 DRB1*0801 TTCTTGGAGTACTCTACGGGe31 DRB1*0814 TTCTTGGAGTACTCTAgGGG1 DRB1*0821 TTCTTGGAGTACTCTAtGGG81 DRB1*0820 TTCTTGGAGTACTCTACGGC918 DRB1*15011TTCCTGTGGCAGCCTAAGAG10 6 DRB4*01011TTCTTGGAGCAGGCTAAGTG對于同一組的序列,該組第一個序列和其它序列之間的不同以小寫字母標出。用3種探針序列說明我們的探針設計原則的應用。選擇第一組的第一個序列作為探針e1;選擇第一組的第6個序列作為探針e2;選擇第一組的第7個序列作為探針e3。
由于靶標與探針的TEI區需要完全互補,第2組到第10組的序列不產生e1和e2的延伸產物。類似的,除第7組之外,其它組的序列不產生e3的延伸產物。每組的延伸反應模式彼此均不相同。
同一組的序列有兩類情況。例如,e1和e2在退火區內6個位點中有一個核苷酸不同。因此,與e1和e2匹配的靶標將不產生其它序列的延伸產物,e1和e2也是不同的探針。類似的,第1組第2個到第7個序列的靶標將不產生探針e1的延伸產物。
除了與e1匹配的靶標外,其余5個序列僅僅在一個或兩個核苷酸上與e2不同,如下所示1,2..............................M16 DRB3*0201 TTCTTGGAGCTGCTAAGTC e21 DRB1*1130 TTCTTGGAGtTCCTTAAGTC a9 DRB3*01011 TTCTTGGAGCTGCgTAAGTC b1 DRB3*0102 TTCTTGGAGCTGtgTAAGTC c1 DRB3*0104 TTCTcGGAGCTGCgTAAGTC d1 DRB3*0212 TTCTTGcAGCTGCTTAAGTC e這些序列是交叉反應性的。當序列b和e(它們與e2的不同在于分別在位點M-7和M-14處的一個堿基)的靶標與探針e2退火時,退火區中的非指定多態性將被包容,延伸反應將進行,直到與完全匹配的序列基本相同的程度。當序列a、c、d(它們與e2有兩個核苷酸不同)的靶標與探針e2退火時,延伸反應只顯示對非指定多態性的部分包容。改善這種狀況的一個方法是為a、c、d提供不同的探針,然后通過分析信號強度定量分析延伸產物的產量,以識別正確的序列。一個替代方法是向e2探針中添加一個能夠分開退火區與TEI區的物理性接頭(例如鏈),將退火區中的非指定多態性一起跨過。
對于第7組的序列,e3探針部分包容其它兩個序列。可以匯集這3個序列。e2探針將對30種等位基因而不是28種等位基因產生延伸產物。
實施例3利用錯配包容來改變等位基因結合模式用探針DR-13e(GGACATCCTGGAAGACGA)來靶向DRB基因的281-299堿基。包括等位基因DRB1*0103在內的34種等位基因與該序列完全匹配。因此,在結合模式中,13e對于這34種等位基因是陽性的(即,對于這34種等位基因,13e將產生延伸產物)。其它幾個等位基因顯示相同的TEI區,但在各自的退火區中顯示非指定多態性。例如,5種等位基因,如DRB1*0415,在位點4處含有T而不是A,而4種等位基因,如DRB1*1136,在該位點含有C。由于退火區中的錯配包容,與這9種等位基因互補的靶序列將產生類似于完全匹配序列的延伸反應模式。結果在圖2中顯示。T0-3和T0-4是分別與等位基因*0415和*1136完全互補的序列。
DRB1*0103 GACATCCTGGAAGACGA 34種等位基因DRB1*0415 GACTTCCTGGAAGACGA 5種等位基因DRB1*1136 GACCTCCTGGAAGACGA 4種等位基因實施例4用于跨過非指定多態性的探針接頭結構的設計如圖3所示,為了確保特異且強的退火,錨定序列來源于保守序列區。它并非用于多態性檢測。為此,用于多態性檢測的一個較短序列通過一個中性化學接頭與錨定序列連接。用于多態性檢測的序列的較短長度將限制對緊鄰指定位點的非指定多態性的可能干擾,從而減少了為適應這種干擾性多態性所需的可能的序列組合數。該方法在某些情況下避開了高密度的多態性位點。例如,利用考慮到額外多態性的探針,能夠區別實施例3中所列的序列。接頭和序列的說明性設計在下面列出接頭13-5 AGCCAGAAGGAC/間隔區18/間隔區18/GGAAGACGA接頭13-8 AGCCAGAAGGAC/間隔區18/間隔區18/AGACGA接頭13-11 AGCCAGAAGGAC/間隔區18/間隔區18/CGA實施例5定相當兩個或多個等位基因的組合能夠產生相同反應模式時,本發明也可用于減少由此產生的不確定性。在圖4和圖5所示的模擬情況下,與探針1和探針3匹配因而產生延伸產物的等位基因A,和當探針2和探針4存在于同一多重反應中時,與其匹配的等位基因B,它們所產生的總反應模式與匹配探針1和探針2的等位基因C和匹配探針3和探針4的等位基因D的組合所產生的總反應模式相同。利用本發明提供的檢測方法能夠減少或消除這種不確定性,通過用一種標記的檢測探針(其用來靶向與探針3相同的多態性位點)雜交,分析探針1的延伸產物。如果分析結果是陽性的,那么只有一個等位基因組合,即組合1是可能的,因為探針1和探針3與同一等位基因結合。檢測探針可以用本發明公開的或本領域公知的任何方法標記。如果這種識別檢測步驟與多重延伸反應檢測一起進行,如圖5所示的延伸檢測和探針雜交檢測使用不同的標記。
在該方法中,聯合使用延伸和雜交給同一“相位”分配兩個或多個多態性,來解決這種不確定性。對于本領域中設計的其它遺傳學研究的單倍型分析,定相作為一個重要考慮迅速出現。通過與靶標連續反應能,多種探針可以被包括進來,或者多種探針能夠被安排在同一反應中,用不同標記進行檢測。
結合探針延伸與雜交反應的能力在使用來自HLA-B外顯子3的樣品序列的實驗中得到證實。結果顯示在圖6中。探針SB3P在反應中延伸,延伸產物用標記的DNA探針檢測。對于圖6A和圖6B所示的兩種樣品,SB127r和SB3P、SB285r和SB3P分別處于同一相位。
實施例6使用隨機編碼探針陣列的HLA分型模型反應為了說明多態性的辨別,用一種合成單鏈作為靶標進行模型反應。使用直徑為3.2μm的顏色編碼的甲苯磺酰基功能化微珠作為固相載體。利用本領域公知的標準方法(Bangs.L.B.,″Uniform LatexParticles″,Seragen Diagnostics Inc.,p.40),使用藍色染料(吸收/發射419/466nm)和綠色染料(吸收/發射504/511)的不同組合,染色的顆粒產生一組32個可以辨別的顏色代碼。染色的微珠用生物素結合蛋白Neutravidin(Pierce,Rockford,IL)功能化,以介導生物素化探針的固定。在一個典型的小規模偶聯反應中,含有1%微珠的200μl懸液用500μl 100mM磷酸緩沖液/pH 7.4(緩沖液A)洗滌3次,重懸浮于500μl該緩沖液中。向微珠懸液中加入20μl 5mg/mlneutravidin后,密封反應液,在37℃下過夜。偶聯的微珠然后用500μl含有10mg/ml BSA的PBS/pH 7.4(緩沖液B)洗滌1次,重懸浮于500μl該緩沖液中,在37℃下反應1小時,以阻斷微珠表面上的未反應位點。阻斷后,用緩沖液B洗滌微珠3次,貯存于200μl該緩沖液中。
在該模型反應系統中,合成了兩對探針,它們在各自的3’端含有SNPs。各自的序列如下SSP13AAGGACATCCTGGAAGACG;SSP24AAGGACATCCTGGAAGACA;SSP16ATAACCAGGAGGAGTTCCSSP36ATAACCAGGAGGAGTTCG.
探針在5’端生物素化;在生物素與寡核苷酸之間插入一個15碳三乙二醇接頭,使表面固定對隨后反應的破壞作用最小化。對于每種探針,與編碼微珠的偶聯用50μl微珠懸液進行。用500μl 20mMTris/pH 7.4,0.5MNaCl(緩沖液C)洗滌微珠一次,微珠重懸浮于300μ1該緩沖液中。向微珠懸液中加入2.5μl 100μM探針溶液,在室溫下反應30分鐘。然后用20mM Tris/pH7.4,150mM NaCl,0.01%triton洗滌微珠3次,將微珠貯存于20mM Tris/pH 7.4,150mM NaCl中。
提供了下列長度為33個堿基的合成靶標TA16 GTCGAAGCGCAGGAACTCCTCCTGGTTATGGAATA36 GTCGAAGCGCACGAACTCCTCCTGGTTATAGAATA13 GGCCCGCTCGTCTTCCAGGATGTCCTTCTGGCTTA24 GGCCCGCTTGTCTTCCAGGATGTCCTTCTGGCT靶標與4種探針(SSP13,SSP24,SSP16,SSP36)在芯片上反應。向芯片上添加一等份10μl的100nM靶標在退火緩沖液(0.2M NaCl,0.1%Triton X-100,10mM Tris/pH 8.0,0.1mM EDTA)中的溶液,在30℃下反應15分鐘。然后用同一緩沖液洗滌芯片一次,然后用延伸反應混合物覆蓋芯片,延伸反應混合物包含100nM TAMRA-ddCTP(吸收/發射550/580)(PerkinElmerBioscience,Boston,MA),10μM dATP-dGTP-dTTP,ThermoSequenase(Amersham,Piscataway,NJ),溶于廠商提供的結合緩沖液。反應在60℃下進行5分鐘,然后用水洗滌芯片。用具有自動濾光片轉換器(包括分別用于藍色、綠色解碼圖像和測定圖像的羥基香豆素、HQ窄帶GFP和HQ Cy3濾光片)的Nikon熒光E800顯微鏡對芯片進行解碼和測定圖像。Apogee CCDKX85(Apogee Instruments,Auburn,CA)用于采集圖像。在每個反應中,只有完全匹配的靶標才能被延伸生成,對于此處檢測的SNPs,匹配與不匹配靶標之間的區別約為13倍-30倍;圖7對TA13進行了說明。
實施例7患者樣品的HLA-DR分型用標準PCR方案處理從患者中提取的DNA樣品。使用下列引物進行普通DR擴增正向引物GATCCTTCGTGTCCCCACAGCACG反向引物GCCGCTGCACTGTGAAGCTCTC.
PCR方案如下95℃7min 1個循環,95℃30sec,60℃30sec,7 2℃1min 35個循環,72℃7min 1個循環。
長度為287個堿基、覆蓋DR基因座的PCR產物在100℃下變性5分鐘,在冰上冷卻,與如實施例6模型反應所述的退火緩沖液混合。向每個芯片加一等份10μl,在40℃下反應15分鐘。如實施例6所述進行延伸反應以及隨后的圖像采集。
對使用患者樣品產生的PCR產物進行序列特異性探針的多重延伸,產生根據探針設計的結果。在平行測試的4種探針(SSP13,SSP16,SSP24,SSP36)中,SSP13延伸,而SNP探針SSP24只顯示背景結合,無關的SSP16和SSP36探針也只顯示背景結合。如圖8所示,SSP的多重延伸顯著提高了匹配與不匹配SNPs之間的分辨力,從以匹配和不匹配序列特異性寡核苷酸探針雜交為基礎的分析的大約2倍提高到至少20倍。
實施例8組特異性擴增當SSOs多重雜交不能使雜合等位基因組合明確地分配時,組特異性擴增(GSA)的引物最常用。在這種情況下,選擇GSA引物以擴增所選擇的幾組具體等位基因,以消除不確定性,這種不確定性是延誤分析的另一個勞動密集的測定步驟。使用本發明的方法,優選地使用在隨機編碼的微珠陣列上展示探針的實施方案,GSA引物可以作為探針加入多重反應中,從而除去該分析的整個第二步。
實施例9使用細胞系對HLA-DR、-A和-B基因座的分析設計用于延伸介導的HLA-DR、HLA-A和HLA-B多重分析的探針,并用標準細胞系檢測。這些探針來源于以前文獻中報告的SSP探針(Bunce,M.等人,Tissue Antigens.46355-367(1995),Krausa,P和Browning,M.J.,Tissue Antigens.47237-244(1996),Bunce,M.等人,Tissue Antigens.4581-90(1995))。
用于DR的探針是SR2 ACGGAGCGGGTGCGGTTGSR3 GCTGTCGAAGCGCACGGSR11CGCTGTCGAAGCGCACGTTSR19GTTATGGAAGTATCTGTCCAGGTSR23ACGTTTCTTGGAGCAGGTTAAACSR32CGTTTCCTGTGGCAGGGTAAGTATASR33TCGCTGTCGAAGCGCACGASR36CGTTTCTTGGAGTACTCTACGGGSR39TCTGCAGTAGGTGTCCACCASR45CACGTTTCTTGGAGCTGCGSR46GGAGTACCGGGCGGTGAGSR48GTGTCTGCAGTAATTGTCCACCTSR52CTGTTCCAGGACTCGGCGASR57CTCTCCACAACCCCGTAGTTGTASR58CGTTTCCTGTGGCAGCCTAAGASR60CACCGCGGCCCGCGCSR67GCTGTCGAAGCGCAAGTCSR71GCTGTCGAAGCGCACGTANEG AAAAAAAAAAAAAAAAAA某些探針在其各自的3’端有一個SNP位點,例如SR3和SR33(分別是G和A);SR11、SR67和SR71(分別是T、C和A)。另外,相對于SR11、67和71組的探針,探針SR3和33在3’端有一個堿基交錯。
SR3 GCTGTCGAAGCGCACGGSR33TCGCTGTCGAAGCGCACGASR11CGCTGTCGAAGCGCACGTTSR67GCTGTCGAAGCGCAAGTCSR71GCTGTCGAAGCGCACGTA
反應條件如實施例7所示,不同之處在于退火溫度為55℃而不是40℃,延伸溫度為70℃而不是60℃。雙鏈DNA如實施例7一樣使用。在現在的條件下單鏈DNA產生更好的結果。單鏈DNA的產生方法是,只使用一種探針,在同一PCR程序中重新擴增最初的PCR產物。兩種細胞系W51和SP0010的結果在圖9和圖10中顯示。陰性對照NEG與所選類型的微珠偶聯。其它探針的信號強度減去NEG被認為是探針的真實信號,用這些數值繪圖。Y軸單位是實驗所用照相機的信號單位。對于每個樣品,陽性與陰性探針之間的差別是明確的。具體而言,與SSO分析中通常遇到的情況不同,不必與其它樣品進行對比以確測定每種探針的可靠閾值。
用于HLA-A的探針是SAD CACTCCACGCACGTGCCASAF GCGCAGGTCCTCGTTCAASAQ CTCCAGGTAGGCTCTCAASAR CTCCAGGTAGGCTCTCTGSAX GCCCGTCCACGCACCGSAZ GGTATCTGCGGAGCCCGSAAP CATCCAGGTAGGCTCTCAASA8 GCCGGAGTATTGGGACGASA13 TGGATAGAGCAGGAGGGTSA16 GACCAGGAGACACGGAATA圖11和圖12所示的A基因座外顯子3的結果也是明確的。圖12還顯示了非指定多態性的錯配包容的一個實例。即,當在位點M-18處展示為C而不是A的等位基因0201與探針SAAP不完全匹配時,延伸反應仍然進行,因為聚合酶在探針3’端檢測到對指定多態性的完全匹配,并包容位點M-18的錯配。
用于HLA-B的探針是SB220 CCGCGCGCTCCAGCGTGSB246 CCACTCCATGAGGTATTTCCSB229 CTCCAACTTGCGCTGGGASB272 CGCCACGAGTCCGAGGAASB285 GTCGTAGGCGTCCTGGTCSB221 TACCAGCGCGCTCCAGCTSB197 AGCAGGAGGGGCCGGAASB127 CGTCGCAGCCATACATCCASB187 GCGCCGTGGATAGAGCAASB188 GCCGCGAGTCCGAGGACSB195 GACCGGAACACACAGATCTT
使用這些探針對HLA-B外顯子2進行分型的實驗用參照細胞系進行。對于HLA-A,獲得明確的結果(在此未顯示)。
實施例10CF突變分析—用于探針延伸的探針和陣列設計該實施例描述了在顏色編碼的顆粒上展示的平面探針陣列的設計和應用,這些探針被設計成在各自的3’端處或附近展示幾個-最常為2個選擇的堿基組成,并用來與CFTR靶基因內的目的指定區比對。
利用從Genebank(www.ncbi.nlm.nih.gov)獲得的CFTR基因序列設計16-mer探針,用于ACMG-CF突變組中25種CFTR突變的多重分析。利用PROBE 3.0(http//www.genome.wi.mit.edu)設計探針序列,與各自的外顯子序列比對(http//searchlauncher.bcm.tmc.edu/seq-search/alignment.html)。寡核苷酸設計為含有15-21個核苷酸,富含30-50%G+C的堿基組成,合成后含有5’生物素TEG(SynthegenTX);為了處理小的缺失,TEI區的可變序列被置于探針3’端處或距3’端3-5個位點之內。探針組成在下表中列出。
CF突變分析使用17個純藍色或藍綠色染色的微珠的組合。合成長48個堿基的人β-肌動蛋白基因(編號#X00351),在每個反應中作為內部陽性對照。每個陣列上包含長16個堿基的互補探針。為了分析ACMG-CF突變組中的25種CFTR突變,用來自Genebank(www.ncbi.nlm.nih.gov)的CFTR基因序列進行探針設計。探針序列用PROBE 3.0(http//www.genome.wi.mit.edu)設計。每個探針序列與各自的外顯子序列比對(http//searchlauncher.bcm.tmc.edu/seq-search/alignment.html)。合成寡核苷酸使之具有5’生物素TEG(Synthegen TX),在0.5M NaCl存在下將寡核苷酸偶聯到微珠表面。通過LEAPS將微珠固定在芯片表面上。
外顯子突變序列
3G85E CCC CTA AAT ATA AAA AGA TTCG85E-X CCC CTA AAT ATA AAA AGA TTT41148 ATT CTC ATC TCC ATT CCA A1148-X ATT CTC ATC TCC ATT CCA G621+1G>T TGT GTG CAA GGA AGT ATT AC621+1G>T-XTGT GTG CAA GGA AGT ATT AAR117H TAG ATA AAT CGC GAT AGA GCR117H-XTAG ATA AAT CGC GAT AGA GT5711+1G>T TAA ATC AAT AGG TAC ATA CTAA ATC AAT AGG TAC ATA A7R334W ATG GTG GTG AAT ATT TTC CGR334W-XATG GTG GTG AAT ATT TTC CAR347P ATT GCC GAG TGA CCG CCA TGCR347P-XATT GCC GAG TGA CCG CCA TGG1078delT CAC AGA TAA AAA CAC CAC AAA1078delT-X CAC AGA TAA AAA CAC CAC AA1078delT-X-2 CAC AGA TAA AAA CAC CAC A9A455E TCC AGT GGA TCC AGC AAC CGA455E-XTCC AGT GGA TCC AGC AAC CT10 508CAT AGG AAA CAC CAA AGA TI507 CAT AGG AAA CAC CAA AF508 CAT AGG AAA CAC CAA T11 1717-1G>A CTG CAA ACT TGG AGA TGT CC1717-1G>A CTG CAA ACT TGG AGA TGT CT551D TTC TTG CTC GTT GAC551D-X TTC TTG CTC GTT GATR553 TAAAGAAATTCTTGCTCGR553X TAAAGAAATTCTTGCTCAR560 ACCAATAATTAGTTATTCACCR560X ACCAATAATTAGTTATTCACG
G542 GTGTGATTCCACCTTCTC CG542XGTGTGATTCCACCTTCTC AINT-121898 AGG TAT TCA AAG AAC ATA C1898-X AGG TAT TCA AAG AAC ATA T132183deLA TGT CTG TTT AAA AGA TTG T2183deLA-X TGT CTG TTT AAA AGA TTG CINT 14B 2789 CAA TAG GAC ATG GAA TAC2789-X CAA TAG GAC ATG GAA TAC TINT 163120 ACT TAT TTT TAC ATA C3120-X ACT TAT TTT TAC ATA T18D1152ACT TAC CAA GCT ATC CAC ATCD1152ACT TAC CAA GCT ATC CAC ATGINT 193849+10kbC>T-WT1CCT TTC Agg GTG TCT TAC TCG3849+10kbC>T-M1 CCT TTC Agg GTG TCT TAC TCA19R1162AAT GAA CTT AAA GAC TCGR1162-X AAT GAA CTT AAA GAC TCA3659delC-WT1 GTA TGG TTT GGT TGA CTT GG3659delCX-M1 GTA TGG TTT GGT TGA CTT GTA3659delC-WT2 GTA TGG TTT GGT TGA CTT GGT A3659delCX-M2 GTA TGG TTT GGT TGA CTT GT A20W1282ACT CCA AAG GCT TTC CTCW1282-X CT CCA AAG GCT TTC CTT21N1303K TGT TCA TAG GGA TCC AAGN1303K-X TGT TCA TAG GGA TCC AACb β肌動蛋白 AGG ACT CCA TGC CCA G
在0.5M NaCl存在下,探針被附著于純藍色或藍綠色染色的差別編碼的微珠上。利用LEAPS將微珠固定在芯片表面。每個反應均包含合成的48堿基人β-肌動蛋白基因(編號#X00351)作為內部陽性對照。
陣列設計—在一個優選實施方案中,將25種CF突變分為4個不同的組,以使每組成員之間的序列同源性最小。即,將突變歸入不同的組,以使任一組中的探針序列之間的重疊最小,從而使多重分析條件下的交叉雜交最小。顏色編碼的微珠上展示的每一組均裝配為不同的陣列。(這種4-芯片陣列設計的結果在下面的實施例中描述)。在此也公開了替代的加強陣列設計。
實施例11通過使用READ的探針延伸進行多重CF突變分析使用L.McCurdy,Thesis,Mount Sinai School of Medicine,2000所述的方法(在此引用作為參考),在多重PCR(mPCR)反應中,用相應的探針擴增從幾名患者中提取的基因組DNA。該mPCR反應使用在5’端以通用序列標簽的嵌合引物。反義引物在5’端磷酸化(Synthegen,TX)。用Perkin Elmer 9600熱循環儀進行28個擴增循環,每個循環包括變溫48秒、94℃10秒的變性步驟,變溫36秒、60℃10秒的退火步驟,變溫38秒、72℃40秒的延伸步驟,每種反應液(50μl)含有500ng基因組DNA,1×PCR緩沖液(10mM Tris HCL,50mM KCL,0.1%Triton X-100),1.5mM MgCl2,各200μM PCR級dNTPs和5單位Taq DNA聚合酶。測定每個探針對的最佳探針濃度。在擴增后,用可買到的試劑盒(Qiagen)純化產物,除去所有試劑。DNA濃度通過分光光度分析測定。
用反義5’磷酸化引物擴增PCR產物。為了產生單鏈DNA模板,PCR反應產物與2.5單位外切核酸酶在1×緩沖液中37℃溫育20分鐘,隨后加熱到75℃10分鐘滅活酶。在這些條件下,該酶從5’磷酸化末端開始消化雙鏈DNA的一條鏈,釋放5’-磷酸單核苷酸(J.W.Little等人,1967)。單鏈靶標也可以用本領域公知的其它方法產生。
向含有10mM Tris-HCL(pH 7.4),1mM EDTA,0.2M NaCl,0.1%Triton X-100的退火混合物中加入單個或匯集的PCR產物(各20ng)。退火混合物與(實施例10的)微珠展示的CF探針的編碼陣列接觸,在37-55℃下溫育20分鐘。然后加入延伸混合物,其含有3U ThermoSequenase(Amersham Pharmacia Biotech NJ)、1×酶緩沖液,以及熒光素標記的或TAMRA-標記的脫氧核苷酸(dNTP)類似物(NEN LifeSciences),和1μmole每種類型未標記的各種dNTP,延伸反應在60℃進行3分鐘。微珠陣列用去離子無菌水(dsH2O)洗滌5-15分鐘。利用裝備有CCD照相機的熒光顯微鏡記錄包含陣列內每個微珠的熒光信號的圖像。分析圖像,確定每種延伸探針的身份。結果在圖15中顯示。
實施例12覆蓋探針的應用在CFTR基因的外顯子10內已經鑒定了幾個SNPs。外顯子10中的多態性在本實施例的最后列出。已經在Δ508的序列中找到下列9個SNPs,是CFTR基因中最常見的突變(http//snp.cshl.org)dbSNP213450 A/GdbSNP180001 C/TdbSNP1800093 G/T1648 A/GdbSNP100092 C/GdbSNP1801178 A/GdbSNP1800094 A/GdbSNP1800095 G/A探針設計為適合所有可能的SNPs,合成探針,并與顏色編碼的微珠偶聯。考慮到所有可能的SNPs,修飾用于靶擴增的引物(實施例11所述)。PCR擴增的靶標介導末端匹配的探針的延伸。從該分析中收集的信息有兩方面突變和SNPs的識別。
外顯子10的多態性
1 cactgtagct gtactacctt ccatctcctc aacctattcc aactatctga atcatgtgcc61 cttctctgtg aacctctatc ataatacttg tcacactgta ttgtaattgt ctcttttact121 ttcccttgta tcttttgtgc atagcagagt acctgaaaca ggaagtattt taaatatttt181 gaatcaaatg agttaataga atctttacaa ataagaatat acacttctgc ttaggatgat241 aattggaggc aagtgaatcc tgagcgtgat ttgataatga cctaataatg atgggtttta301 tttccagact tcaCttctaa tgAtgattat gggagaactg gagccttcag agggtaaaat361 taagcacagt ggaagaattt cattctgttc tcagttttcc tggattatgc ctggcaccat421 taaagaaaat AtCAtctTtg gtgtttccta tgatgaatat agatacagaa gcgtcatcaa481 agcatgccaa ctagaAgagG taagaaacta tgtgaaaact ttttgattat gcatatgaac541 ccttcacact acccaaatta tatatttggc tccatattca atcggttagt ctacatatat601 ttatgtttcc tctatgggta agctactgtg aatggatcaa ttaataaaac acatgaccta661 tgctttaaga agcttgcaaa cacatgaaat aaatgcaatt tattttttaa ataatgggtt721 catttgatca caataaatgc attttatgaa atggtgagaa ttttgttcac tcattagtga781 gacaaacgtc tcaatggtta tttatatggc atgcatatag tgatatgtgg t實施例13CF突變分析—使用模型系統的微珠上探針延伸圖13提供了檢測CF基因突變T117H的概述。靶標如實施例11所述進行PCR擴增。將3’端可變的兩個17堿基的探針固定在顏色編碼的微珠上。靶核酸序列與TAMRA-標記的dCTP、未標記的dNTPs和熱穩定的DNA聚合酶一起加入。
3’端可變的互補17-mer寡核苷酸探針由商品供應商合成(Synthegen TX),其含有通過一個12-C間隔區連接的5’生物素(生物素-TEG),通過反相HPLC純化。探針固定在顏色編碼的微珠上。探針附著于顏色編碼的微珠上。也提供合成的48-mer寡核苷酸,它在指定可變位點含有A、T、C或G,對應于的囊性纖維化基因外顯子4的更變(R117H)。
向含有10mM Tris-HCL(pH 7.4),1mM EDTA,0.2M NaCl,0.1%Triton X-100的退火混合物中加入1μM合成靶標。退火混合物與編碼的微珠陣列接觸,在37℃下溫育20分鐘。然后加入延伸混合物,其含有3U Thermo Sequenase(Amersham Pharmacia Biotech NJ)、1×酶緩沖液,以及TAMRA-標記的脫氧核苷酸(dNTP)類似物(NEN LifeSciences),和1μM的各類未標記的dNTP,延伸反應在60℃進行3分鐘。然后用dsH2O洗滌微珠陣列5-15分鐘,利用裝備有CCD照相機的熒光顯微鏡記錄包含陣列內每個微珠發出的熒光信號的圖像。分析這些圖像,確定每種延伸探針的身份。如下分析信號用CCD照相機捕獲圖像,比較能用微珠顏色解碼的兩種探針之間的信號強度。野生型探針與加入的靶標完全匹配,因此產生延伸產物,而突變探針未觀察到延伸。結果在圖16a中顯示。
實施例14CF突變分析—使用微珠標簽(Bead-Tagged)引物的PCR和綜合檢測該實施例說明了懸液中微珠表面上的探針延伸,隨后是微珠在芯片表面上的裝配和固定以用于圖像分析。設計對應于CFTR基因突變R117H并含有可變的3’端的寡核苷酸(圖14),合成該寡核苷酸使其含有一個含12C間隔區的5’生物素-TEG(Synthegen,Texas)。探針如下附著于藍色染色的微珠上向1×TE(100mM Tris-HCl,10mM EDTA),500mM NaCl的微珠溶液中加入2μM探針,在室溫下反應45分鐘。用1×TE,150mM NaCl洗滌微珠3次,并將微珠懸浮于50μl相同溶液中。向含有1×緩沖液(100mM Tris-HCl,pH 9.0,1.5mM MgCl2,500mM KCl)的PCR混合物中加入每種類型的微珠各1μl,40μM Cy5-標記的dCTP(Amersham Pharmacia Biotech NJ),80μM其它三種類型的dNTPs,和3U Taq DNA聚合酶(Amersham Pharmacia Biotech NJ)。在擴增前再向PCR混合物中添加野生型互補靶標(40ng)。在PerkinElmer 9600熱循環儀中進行11個循環的PCR擴增,每個循環包括90℃變性30秒,55℃退火30秒,72℃延伸20秒。擴增后,用1×TE緩沖液離心洗滌微珠4次,并置于芯片表面。如以上實施例所述記錄圖像,用WO 01/98765所述的軟件對圖象進行分析。結果顯示與野生型探針偶聯的微珠特異擴增,而與突變探針偶聯的微珠沒有擴增。結果在圖16b中顯示。
該實施例顯示將使用微珠標簽探針的多重PCR與隨后微珠在平面表面上的裝配進行綜合,以進行快速成像分析。在一個優選實施方案中,一種微流體連接的多區室裝置可以用于如此處所述的模板擴增。例如,有多個能夠進行溫度循環并在每個區室中發生一個mPCR反應(產生所有希望的擴增子的一部分)的區室,這些區室可以如下使用(1)在4個區室的每一個中用不同的探針對進行PCR,如本實施例所述使用編碼的微珠-標簽引物;(2)在所有PCR反應完成后,匯集展示擴增子的微珠;(3)裝配隨機陣列;和(4)記錄圖像并分析數據。陣列裝配可以用包括LEAPS在內的幾種現有技術方法之一完成。
實施例15CF突變分析—在溫控反應器中的一步退火和延伸如實施例11所述,在多重PCR(mPCR)反應中使用相應引物擴增從幾名患者中提取的基因組DNA。在擴增后,使用商品試劑盒(Qiagen)純化產物,除去所有試劑。DNA濃度通過分光光度分析測定。向含有10mM Tris-HCL(pH 7.4),1mM EDTA,0.2M NaCl,0.1%Triton X-100的退火混合物中加入單個或匯集的PCR產物(各20ng)。退火混合物與延伸混合物混合,后者含有3U Thermo Sequenase(AmershamPharmacia Biotech NJ),1×酶緩沖液,以及熒光素標記的或TAMRA-標記的脫氧核苷酸(dNTP)類似物(NEN Life Sciences),和1-10μmole每種類型的未標記dNTP,并與顏色編碼的陣列所展示的寡核苷酸探針陣列接觸。寡核苷酸如以上實施例所述設計并合成。退火和延伸反應在溫控循環儀中進行。溫度步驟如下65℃,60℃,55℃,50℃,45℃各3分鐘,溫度之間的變溫不超過30秒。微珠陣列然后用dsH2O洗滌5-15分鐘,用裝備有CCD照相機的熒光顯微鏡記錄包含陣列內每個微珠發出的熒光信號的圖像。分析這些圖像,確定每種延伸探針的身份。典型結果在圖17中顯示。
實施例16覆蓋探針的匯集為了分析指定的多態性,設計具有30-50%G+C堿基組成的20-mer寡核苷酸(Oligo)延伸探針,其在3’端含有一個可變位點(G/T),用來與指定的多態性位點比對。兩個非指定多態性位點預計在位點10(C/A)和位點15(T/G)處。設計概述如下野生型探針序列Oligo 1在位點20為″G″,在位點10為″C″,在位點15為″T″.
Oligo 2在位點20為″G″,在位點10為″C″,在位點15為″G″.
Oligo 3在位點20為″G″,在位點10為″A″,在位點15為″T″.
Oligo 4在位點20為″G″,在位點10為″A″,在位點15為″G″.
突變探針序列Oligo 1在位點20為″T″,在位點10為″C″,在位點15為″T″.
Oligo 2在位點20為″T″,在位點10為″C″,在位點15為″G″.
Oligo 3在位點20為″T″,在位點10為″A″,在位點15為″T″.
Oligo 4在位點20為″T″,在位點10為″A″,在位點15為″G″.
匯集所有探針,使用以上實施例的方案使其附著于一種類型的顏色編碼的微珠上。當向展示匯集探針的這些微珠上添加單鏈靶標時,只要一種探針與指定多態性完全比對就將產生延伸產物。
實施例17雜合與純合構型中的指定多態性為了辨別雜合與純合構型,改進以上實施例的設計,使之含有第二組探針,以識別與探針3’端比對的C/A指定多態性,并可以指出雜合突變還是純合的突變。
在以上實施例中,預計兩個非指定多態性位點位于位點10(C/A)和位點15(T/G)處。設計概述如下第1組Oligo 1在位點20為″C″,在位點10為″C″,在位點15為″T″.
Oligo 2在位點20為″C″,在位點10為″C″,在位點15為″G″.
Oligo 3在位點20為″C″,在位點10為″A″,在位點15為″T″.
Oligo 4在位點20為″C″,在位點10為″A″,在位點15為″G″.
第2組Oligo 5在位點20為″A″,在位點10為″C″,在位點15為″T″.
Oligo 6在位點20為″A″,在位點10為″C″,在位點15為″G″.
Oligo 7在位點20為″A″,在位點10為″A″,在位點15為″T″.
Oligo 8在位點20為″A″,在位點10為″A″,在位點15為″G″.
匯集第1組的寡核苷酸,使用以上實施例的方案將其附著于單一顏色(例如綠色)編碼的微珠上。匯集第2組的寡核苷酸,使用以上實施例的方案將其附著于第二種顏色(例如橙色)編碼的微珠上。如前所述,匯集這些微珠,并固定在芯片表面上。然后,引入靶標,如以上實施例所述進行芯片上的反應。如果只有綠色微珠上的探針延伸,則該個體含有正常的(或野生型)等位基因。如果只有橙色微珠上的探針延伸,則個體的突變是純合的。如果綠色和橙色微珠上的探針均延伸,則該個體的該等位基因是雜合的。這一設計可用于識別已知和未知的突變。
實施例18—確證性測序(“重測序”)本發明的設計能夠用于具體區域的重測序。當芯片上的探針延伸反應需要證實時,可以使用這一試驗,如對于CF突變組中I506V、I507V、F508C和7T的反射檢測(reflex test)。長度為20-30個堿基的所述序列通過所有可變位點的多重探查在芯片上測序。通過為不明確的位置設計特異的探針,以及如實施例16和17所述進行探針匯集來實現測序。
實施例19使用一種標記dNTP和三種未標記dNTPs的延伸通過摻入至少一種標記dNTP,實時檢測所有延伸產物,并根據它們與編碼的固相載體的結合進行識別。使用實施例6和7所述的測定條件,延伸反應中使用四甲基羅丹明-6-dCTP和未標記的dATP、dTTP和dGTP,產生如圖18所示的熒光標記的延伸產物。也可以使用其它的dNTPs染料標記(如BODIPY-標記的dUTP和Cy5-標記的dUTP)。類似地也可以使用其它任何標記的dNTP。延伸產物的長度取決于DNA聚合酶容許的標記dNTP的量。現有的酶通常對鏈修飾的部分(如生物素和洋地黃毒苷)顯示較高的容許量,這些修飾部分然后在第二步中可以與標記的親和素或抗體反應,獲得延伸產物的間接標記。當使用這些小分子時,產生可測定幾百個堿基長度的延伸產物。
實施例20使用一種標記ddNTP和三種未標記dNTPs的延伸為了終止延伸反應,可以摻入TAMRA-標記的ddCTP,如圖19所示。使用TAMRA-標記的ddCTP的芯片反應如實施例6和7所述進行。在含有TAMRA-ddCTP和未標記dTTP、dATP和dGTP的反應混合物中,在靶標與匹配探針退火后,當完成第一種ddCTP的摻入時,延伸反應終止。這可能在摻入第一種堿基時發生,產生單堿基延伸產物,或者可能在摻入一些未標記的dNTPs后發生。
實施例21使用4種未標記dNTPs的延伸,利用標記探針雜交的檢測使用全套4種未標記dNTPs延伸探針,在聚合酶的“原始”條件下產生幾百個堿基長度的延伸產物,其長度只受退火模板長度和芯片上反應條件的限制。高溫變性后,在第二步中通過與標記寡核苷酸探針(序列設計為與延伸產物的一部分互補)雜交來檢測延伸產物。此過程在圖20中顯示。
實施例22使用4種未標記dNTPs的延伸,通過標記的模板檢測對于在多重雜交測定中常規使用的標準方案,通過摻入標記的探針,在PCR過程中能夠將要分析的DNA靶本身標記。在如實施例6和7所述的條件下,標記靶標與探針退火。用未標記的dNTPs延長匹配的探針。在延伸反應完成后,通過將溫度(Tdel)設定為如下的值進行檢測高于靶標與不匹配探針形成的復合物的解鏈溫度(T不匹配),但是低于靶標與匹配因而延伸的探針形成的復合物的解鏈溫度(T匹配))。后一種顯示雙鏈區長片段的復合物,比前者顯著地更加穩定,因此(T不匹配)<T<(T匹配)。T值一般為70-80℃。在這些條件下,只有靶標與被延伸探針形成的復合物才是穩定的,而靶標與不匹配探針形成的復合物以及相應固相載體發出的熒光信號都將失去。也就是說,與其它設計相反,檢測到與不匹配探針相關的信號強度降低,而不是與匹配探針相關的信號強度提高。圖21說明了不需要標記dNTPs或ddNTPs的設計。在本發明的優選實施方案中這是有用的,其中標記dNTPs或ddNTPs能夠被非特異地吸附到編碼顆粒上,從而提高信號背景,并降低測定的分辨力。另外,使用標記的靶標,該方案直接適用于通過序列特異的寡核苷酸雜交進行的多態性分析方法。
實施例23實時芯片上的信號放大以平面幾何形狀使用的一種標準溫控裝置,如圖22所示的裝置,允許對SSPs的多重延伸使用編程的溫度變化。在實施例6和7的條件下,一種特定模板在多次重復的“變性-退火-延伸”循環中的每一次均介導一種探針的延伸。在第一個循環中,靶分子與探針結合,探針延伸或延長。在下一個循環中,靶分子在“變性”階段(一般為95℃)與第一種探針分離,然后在“退火”階段(一般為55℃)與另一種探針分子退火,并且在“延伸”階段(一般為72℃)介導探針的延伸。在N個循環中,每個模板介導N個探針的延伸,該方案對應于線性擴增(圖30)。在本發明的一個優選實施方案中,編碼微珠的平面陣列用來在多重延伸反應中展示探針,對兩個平面、平行基質之間所含的反應混合物施加一系列溫度循環。光可直接及于一種基質,使編碼微珠的整個陣列直接成像。優選的實施方案通過在每個循環完成時立即記錄整個微珠陣列的圖像來提供實時擴增。
基因組、線粒體或其它富集的DNA能夠利用芯片上線性擴增直接檢測,而不需要序列特異性擴增。當樣品中含有足以進行檢測量的DNA時,這是可能的。在微珠陣列形式中,如果檢測每個微珠的信號需要104個熒光團,30個循環的線性擴增將使必要的數量減少到約300個。假定陣列內使用100個所需類型的微珠,必需的熒光團總數將是約105個,這個數字在臨床標本中一般能夠獲得。例如,用于HLA臨床分子分型的典型PCR反應用0.1-1μg基因組DNA進行。1μg人基因組DNA對應于約10-18摩爾,因此是6×105個拷貝的目的基因。小型化微珠陣列平臺和芯片上擴增所需的小量樣品使得PCR前樣品的直接應用成為可能。這不僅簡化了樣品制備,更重要的是消除了多重PCR的復雜性,這種復雜性是多重遺傳分析發展中常見的一個限速步驟。
實施例24為了分析CF突變,構建針對指定和非選擇多態性的探針文庫為了提高延伸探針的特異性,并避免假陽性,設計延伸探針使之適應靶序列中存在的所有已知的多態性。另外,設計PCR引物也要考慮指定和非指定的多態性。
選擇CFTR基因外顯子7上R347P1172處的G/C突變作為指定多態性,該突變是對囊性纖維化的標準人群載體篩查組內的25種突變之一。在對于總人口載體篩查的突變組中包括外顯子7內的3個CF突變(http//www.faseb.org/genetics/acmg)。已經報告了同一位點處的多態性G/T/A(http//www.genet.sickkids.on.ca/cftr),另外,也報告了位點1175、1178、1186、1187和1189處的非指定多態性。所有這些多態性都能夠干擾預期的探針延伸。
下面說明了用于eMAP的一組針對R347P(以粗體G表示)的簡并探針的構建,它的周圍有許多非指定多態性,以大寫字母表示5′3′延伸的正常靶序列 Gca Tgg Cgg tca ctC GgC a簡并延伸探針組Ngt Ycc Ycc agt gaY RcY t3′5′其中N=a,c,g或t;R(嘌呤)=a或g,Y(嘧啶)=c或t,意味著該組有128種簡并性。
用于突變分析的引物匯集-構建簡并組的主要目的是提供至少一種與靶序列足夠匹配的探針序列,以確保探針的退火和延伸。通過提供與指定多態性相關的整個一組可能的探針序列,原則上這總是可以獲得的,在構建覆蓋組的優選模式中,如果為了完全匯集探針而將所有探針都置于一種類型的微珠上,在本實施例中該組的簡并性程度128將導致測定信號強度相應減小兩個數量級。分開的池(pool)通過將探針組分配于多個類型微珠上,將改善這種情況,但是這是以提高陣列的復雜性為代價的。
首先,探針池被分為最少兩個或多個池,對于指定多態性位點的每種可能的組成,每個池在探針位點M處(即探針的3’端)具有互補的組成。在本實施例中,指定的靶組成的陽性識別需要4個這樣的池。然后,以距離指定位點的順序連續檢查非指定多態性位點。其中,TEI區內的位點對于確保延伸特別重要。即,構建每個池,使之含有所有可能的針對TEI區內非指定位點的探針組成。最后,對于可變基因克隆和測序的簡并探針的構建,通過將中性堿基如肌苷置于位于TEI區之外的探針位點內(條件是已知它們永遠不會與靶標中的G并列),使該組的簡并性最小。在該實施例中要考慮探針位點M-16和M-18中的非指定多態性。即,4個池之每一個的最小簡并性將增加到4種,信號強度相應降低。作為經驗,信號降低優選地限于8的因子。
總之,4個池將覆蓋靶序列,其中每一個池唯一地分配給一種微珠類型,并且含有8種簡并探針序列。這些序列類似于以下所示M變量池的序列用于CF突變R347P的探針庫R347P Cgt Acc Gcc agt gaG GgC3′5′池1 Cgt Acc Gcc agt gaG IgICgt Acc Gcc agt gaC IgICgt Acc Ccc agt gaG IgICgt Acc Ccc agt gaC IgICgt Tcc Gcc agt gaG IgICgt Tcc Gcc agt gaC IgICgt Tcc Ccc agt gaG IgICgt Tcc Ccc agt gaC IgI
池2 Ggt Acc Gcc agt gaG IgIGgt Acc Gcc agt gaC IgIGgt Acc Ccc agt gaG IgIGgt Acc Ccc agt gaC IgIGgt Tcc Gcc agt gaG IgIGgt Tcc Gcc agt gaC IgIGgt Tcc Ccc agt gaG IgIGgt Tcc Ccc agt gaC IgI池3 Agt Acc Gcc agt gaG IgIAgt Acc Gcc agt gaC IgIAgt Acc Ccc agt gaG IgIAgt Acc Ccc agt gaC IgIAgt Tcc Gcc agt gaG IgIAgt Tcc Gcc agt gaC IgIAgt TcC Ccc agt gaG IgIAgt Tcc Ccc agt gaC IgI池4 Tgt Acc Gcc agt gaG IgITgt Acc Gcc agt gaC IgITgt Acc Ccc agt gaG IgITgt Acc Ccc agt gaC IgITgt Tcc Gcc agt gaG IgITgt Tcc Gcc agt gaC IgITgt Tcc Ccc agt gaG IgITgt Tcc Ccc agt gaC IgI反義鏈上非指定多態性的類型通常不同于正義鏈,因此為反義鏈構建簡并探針組可能是有利的。對于簡并延伸探針的構建,可以根據類似的原則構建簡并雜交探針組,以使簡并性最小化。
實施例25通過eMAP的“單管”CF突變分析該實施例涉及進行eMAP測定的方法和組合物,其中退火和延伸步驟在一個反應器中發生。該實施方案是有用的,因為它不需要在反應器之間轉移樣品,以及純化或提取步驟,因而簡化了檢測,并且減少了錯誤的可能性。一個非限制性示范方案如下。
使用相應引物通過多重PCR(mPCR)反應擴增從幾名患者中提取的基因組DNA。PCR條件和試劑組成如下。
引物設計合成不含任何修飾的正義引物和5’端含有“磷酸”的反義引物。多重PCR分兩組進行。第一組擴增包括外顯子5、7、9、12、13、14B、16、18和19。第二組擴增包括外顯子3、4、10、11、20、21和內含子19的引物。外顯子5、7、11上的5’磷酸基修飾包含在正向引物上,以使用反義靶標進行探針延伸。而其它所有擴增子使用正義靶標,將磷酸基置于反向引物上。
PCR主混合物組成對于10μl反應液/樣品成分體積(μl)10×PCR緩沖液 1.025mM MgCl20.7dNTPs(2.5mM) 2.0引物混合物(多重性10×) 1.5Taq DNA聚合酶 0.3ddH2O 1.5DNA3.0總共 10PCR循環94℃5min,94℃10sec.,60℃10sec.,72℃40sec,72℃5min,循環數28-35反應體積可以根據實驗需要進行調節。用Perkin Elmer 9600熱循環儀進行擴增。測定每個引物對的最佳引物濃度。擴增后,取出5μl產物進行凝膠電泳。單鏈DNA靶標如下產生向5μl PCR產物中加入2μl外切核酸酶,在37℃下溫育15分鐘,將酶在80℃下變性15分鐘。變性后加入1μl 10×外切核酸酶緩沖液和1μlλ外切核酸酶(5U/μl),在37℃下溫育20分鐘,75℃加熱10分鐘終止反應。
芯片上的延伸將用于26種CF突變的野生型和突變探針偶聯到微珠表面上,并在芯片陣列上裝配。探針也分為兩組。為了反射試驗裝配第三組,包括5T/7T/9T多態性。
第1延伸組,芯片表面上總共31組微珠簇編號 突變1 G85E-WT2 G85E-M3 621+1G>T-WT4 621+1G>T-M5 R117H-WT6 R117H-M7 β肌動蛋白8 I148T-WT9 I148T-M10 508-WT11 F50812 I50713 G542X-WT14 G542X-M15 G551D-WT16 G551D-M17 R553X-WT18 R553X-M19 生物素20 1717-1G>A-WT21 1717-1G>A-M22 R560T-WT23 R560T-M24 3849+10kbT-WT25 3849+10kbT-M26 W1282X-WT27 W1282X-M28 N1303K-WT29 N1303K-M30 OLIGO-C第2延伸組,芯片表面上總共28組簇編號突變
1 711+1G>T-WT2 711+1G>T-M3 R334W-WT4 R334W-M5 1078delT-WT6 1078delT-M7 β肌動蛋白8 R347P-WT9 R347P-M10A455E-WT11A455E-M121898+1G>A-WT131898+1G>A-WT142184delA-WT152184delA-M162789+5G-WT172789+5G-M18生物素193120+1G>A-WT203120+1G>A-WT21R1162X-WT22R1162X-M233659delC-WT243659delC-M25D1152-WT26D1152-M27OLIGO-CmPCR第2組第3延伸組,總共6組簇編號 突變1 β肌動蛋白1 Oligo C2 5T3 7T4 9T5 生物素為了在單次和/或多重靶標延伸測定中使用,優化了延伸反應緩沖液,由Tris-HCl(pH 8.5)1.2mM,EDTA 1μM,DTT 10μM,KCl 1μM,MgCl213μM,2-巰基乙醇10μM,甘油0.5%,Tween-200.05%和Nonidet 0.05%組成。向每個芯片上添加10μl延伸反應混合物,其中含有1×反應緩沖液,0.1μM標記dNTP,1.0μMdNTPs混合物,3UDNA聚合酶和5μl(約5ng)靶DNA(患者標本)。向芯片表面添加反應混合物,在53℃下溫育15分鐘,然后60℃3分鐘。芯片用含有0.01%SDS的洗滌緩沖液洗滌,覆蓋清潔的蓋片,用生物陣列溶液成像系統分析。分析這些圖像確定每種被延伸探針的身份。
實施例26CF突變分析—單管單芯片一步延伸將用于26種CF突變和對照的探針偶聯到51種微珠的表面上。探針偶聯的微珠在單個芯片表面裝配。從幾名患者標本中提取基因組DNA,如以上實施例所述,在多重PCR(mPCR)反應中用相應引物擴增。擴增后,用λ外切核酸酶產生單鏈DNA產物。將一種或匯集的PCR產物(約5ng)加入反應混合物中,混合物中含有反應緩沖液、脫氧核苷酸(dNTP)類似物(NEN Life Sciences),每種未標記的dNTP和DNA聚合酶(Amersham Pharmacia Biotech,NJ)。退火/延伸反應在溫控循環儀中進行。溫度步驟如下53℃20分鐘,60℃3分鐘。微珠陣列然后用含有0.01%SDS的dsH2O洗滌5-15分鐘。用配備有CCD照相機的熒光顯微鏡記錄包含陣列內每個微珠發出的熒光信號的圖像。分析這些圖像,確定每種延伸的探針的身份。
以下列出了含有26種CF突變的微珠芯片的組成。
第4延伸組,總共51組簇編號突變1 β肌動蛋白2 G85E-WT3 G85E-M4 621+1G>T-WT5 621+1G>T-M6 R117H-WT7 R117H-M8 I148T-WT9 I148T-M10711+1G>T-WT11711+1G>T-M12A455E-WT13A455E-M14508-WT15F50816I50717R533-WT
18R533-M19G542-WT20G542-M21G551D-WT22G551D-M23R560-WT24R560-M251898+1G-WT261898+1G-M272184delA-WT282184delA-M292789+5G>A-WT302789+5G>A-M313120+1G-WT323120+1G-WT33D1152-WT34D1152-M35R1162-WT36R1162-M37OLIGO-C38W1282X-WT39W1282-M40N1303K-WT41N1303-M42R334-WT43R334-M441078delT-WT451078delT-M463849-10kb-WT473849-10kb-M491717-1G>A-WT501717-1G>A-WT51生物素實施例27通過eMAP識別三種或更多堿基缺失和/或插入利用延伸反應分析含有3個以上堿基缺失或插入的突變。設計探針,將突變堿基置于3’端3-5個堿基之前。野生型探針設計為包含或者不包含突變堿基(在突變前終止)。以下是ATCTC缺失和/或AGGTA插入所致突變的一個實例。探針設計如下1.WT1-----------------------ATCTCgca2.WT2-----------------------3.M1------------------------gca(僅有缺失)4.M2------------------------AGGTAgca(缺失和插入)將野生型探針偶聯到不同編碼的微珠表面上,或者如本發明所述匯集。將用于突變1(M1缺失)和2(M2插入)的探針偶聯到不同的微珠上。這兩種野生型探針提供類似的信息,而突變探針能夠顯示在具體樣品中識別的突變類型。
實施例28發夾探針在本發明的某些實施方案中,微珠展示的引發探針形成發夾構型。發夾結構可在5’端包含與TEI區和DA序列互補的序列片段,如圖23所示。在競爭性雜交反應中,在DA區優先與靶序列雜交時,發夾結構隨即打開。在此條件下,TEI區將與指定多態性位點比對,并且將發生延伸反應。這種反應的競爭性能夠用來控制探針的容錯水平。
實施例29通過定制微珠陣列上展示的等位基因特異性寡核苷酸的多重延伸,對囊性纖維化和德系猶太人疾病突變進行分析用囊性纖維化突變的ACMG+組,已經評價了用于高通量突變多重分析的一種新型分析法。另外,也開發了德系猶太人疾病組,來檢測已知可引起泰-薩二氏病(Tay-Sachs)、Canavan、高雪氏病(Gaucher)、尼曼氏病(Niemann-Pick)、布盧姆綜合征(BloomSyndrome)、范康尼氏貧血癥(Fancomi Animia),家族性植物神經功能不全(Familial Dysautonomia)和粘脂貯積癥(mucolipodosis)IV型的共同突變。
在延伸介導的多重多態性分析(eMAP)中,含有可變3’端序列的等位基因特異性寡核苷酸(ASO)附著于顏色編碼的微珠上,這些微珠隨后在硅芯片上排列。根據整個陣列發出的熒光信號的瞬時成像同時檢測正常和突變序列的延伸產物。
在該實施例中,用幾百份臨床患者樣本評價ACMG CF微珠芯片。如圖24所示,這種分析對通過標準DNA分析識別的所有突變正確地評分。
總之,包括定制微珠的多重延伸分析被用來研究對應于ACMG+和德系疾病組的突變。定制的微珠可以用于DNA和蛋白質分析。由于以下幾個原因,這些定制的微珠的使用是有利的,包括(1)瞬時成像—該試驗的耗時在2小時之內,(2)自動圖像采集和分析,(3)小型化,這意味著試劑消耗低,(4)利用晶片技術合成微珠芯片,使得需要時能夠大量生產上百萬芯片。
權利要求
1.一種用于同時檢測位于一個或多個靶核苷酸序列內的指定多態性位點的核苷酸組成的方法,該方法包括下列步驟(a)提供一組或多組探針,每種探針都能與位于指定多態性位點附近范圍的所述一個或多個靶核苷酸序列的亞序列退火;(b)使這組探針與所述一個或多個靶核苷酸序列接觸,通過使探針序列內的探查位點與指定多態性位點直接比對,形成雜交復合物;(c)對于每種雜交復合物,檢測探查位點與指定多態性位點之間是否存在匹配或錯配;和(d)確定指定多態性位點的組成。
2.權利要求1的方法,其中所述一種或多種靶核苷酸序列是用一組或多組引物以多重PCR反應合成。
3.權利要求2的方法,其中所述引物組是簡并引物組。
4.權利要求1的方法,其中所述靶標是基因組DNA片段。
5.權利要求1的方法,其中所述靶標是cDNA片段。
6.權利要求1的方法,其中一組或多組探針在基質上空間編碼。
7.權利要求1的方法,其中一組或多組探針被固定在編碼微粒上。
8.權利要求7的方法,其中編碼微粒被裝配成隨機編碼的陣列。
9.權利要求1的方法,其中每個探針含有能夠啟動延伸或延長反應的末端延伸起始區。
10.權利要求9的方法,其中該反應由缺乏3’→5’核酸外切酶活性的聚合酶催化。
11.權利要求1的方法,其中步驟(c)包括添加一種或多種脫氧核苷三磷酸。
12.權利要求11的方法,其進一步包括使用能夠延伸或延長探針的聚合酶。
13.權利要求12的方法,其中所述聚合酶缺乏3’→5’核酸外切酶活性。
14.權利要求11的方法,其中至少一種脫氧核苷三磷酸被標記,以產生與延長產物相關的可光學檢測的信號。
15.權利要求1的方法,其中通過探針與熒光標記的靶標退火形成熒光雜交復合物,使光學標記附著于一種或多種探針。
16.權利要求15的方法,其進一步包括使用一種能夠延伸或延長探針的聚合酶,通過添加一種或多種脫氧核苷三磷酸,形成延長的雜交復合物來展示匹配。
17.權利要求16的方法,其進一步包括通過檢測光學標簽的穩定性識別延長產物,檢測條件是溫度被設定為高于靶標與不匹配探針形成的任何雜交復合物的解鏈溫度、但是低于靶標與延長探針形成的任何延伸雜交復合物的解鏈溫度。
18.權利要求15的方法,其中來自探針組的一種或多種探針被固定于編碼微粒上,并且檢測光學標簽的改變。
19.權利要求15的方法,其中來自探針組的一種或多種探針被固定于以隨機編碼陣列排列的編碼微粒上。
20.權利要求19的方法,其中所述陣列以空間編碼的方式排列。
21.權利要求15的方法,其中檢測光學標簽的改變并確定顆粒的身份。
22.一種序列特異性放大分析生物樣品中目的核酸序列時產生的分析信號的方法,該方法包括下列步驟(a)提供能夠與目的序列形成雜交復合物的一組固定化探針;(b)在可使目的序列與至少一種固定化探針退火形成雜交復合物的條件下,使所述固定化探針組接觸含有所述目的序列的所述生物樣品;(c)使所述雜交復合物接觸一種聚合酶,使所述雜交復合物內所含的探針延伸或延長;(d)將探針的延伸或延長轉換為光學信號;和(e)實時記錄這組固定化探針發出的光學信號。
23.權利要求22的方法,其進一步包括進行一個或多個循環,每個循環都包括“退火-延伸/延長-檢測-變性”步驟,其中每個循環都導致延伸或延長的探針數以算術級數增加。
24.權利要求23的方法,其包括下列步驟(a)設定有利于雜交復合物形成的第一個溫度;(b)設定有利于聚合酶催化延伸的第二個溫度;(c)將延伸或延長轉換為光學信號;(d)記錄/成像所有固定化探針發出的光學信號;和(e)設定第三個溫度,以確保所有雜交復合物的變性。
25.一種形成用于同時探查一種或多種靶核酸序列內的指定多態性位點的覆蓋探針組的方法,該方法包括下列步驟(a)確定其探查位點能夠與指定多態性位點比對的延伸探針的序列;(b)進一步確定一整套簡并探針,以適應所有非指定的以及未選擇的指定多態性位點,而仍然能使探針的探查位點與指定多態性位點比對;和(c)通過除去所有被包容的多態性,降低簡并程度。
26.權利要求25的方法,其中所述覆蓋組含有至少兩種探針,它們對每個指定位點具有不同的探查位點組成。
27.權利要求25的方法,其中步驟(c)中復雜度的降低通過探針匯集實現。
28.一種識別一個或多個靶核苷酸中一個或多個指定位點多態性的方法,該方法包(a)提供一種或多種能夠探查所述指定位點的探針;(b)通過延長用來探查指定位點的一種或多種探針,形成延伸產物;和(c)確定所述兩個或多個位點處的組成。
29.權利要求28的方法,其進一步包括通過使用來探查第二個指定位點的第二種探針與延伸產物退火,形成雜交復合物。
30.一種識別靶多核苷酸序列內一個或多個指定位點多態性的方法,該方法包括(a)提供一種或多種能夠探查所述指定位點的探針;(b)為每個指定位點賦值,同時適應位于每個多態性附近范圍的非指定多態性位點。
31.權利要求30的方法,其中探針與靶序列之間的同源性通過多重技術分析。
32.一種測定靶核苷酸序列的一個或多個指定位點多態性的方法,該方法包括提供一對或多對能夠檢測缺失的探針的步驟,其中缺失被置于探針3’端或距3’端3-5個堿基之內。
33.一種識別靶核苷酸序列內兩個或更多指定位點多態性的方法,該方法包括(a)選擇多個指定多態性位點,以允許等位基因分配;(b)提供兩種或更多種能夠同時探查該多個指定位點的探針;(c)為每個指定位點賦值;和(d)組合這些值以確定等位基因或等位基因組的身份,并適應鄰所述近指定多態性的非指定位點。
34.一種測定靶多核苷酸序列內一個或多個指定位點多態性的方法,該方法包括為該指定位點提供一個探針組,并且根據每個探針的末端延伸起始將該探針組分成不同的探針亞組。
35.權利要求34的方法,其進一步包括以下步驟對所述探針組進行多重分析,在不受探針組內其它探針干擾的情況下測定該探針組中的每個探針,改變靶多核苷酸序列的等位基因匹配模式,以包括探針組包容的等位基因。
36.權利要求35的方法,其中改變靶多核苷酸序列的等位基因匹配模式的步驟包括匯集一個或多個探針組,使之包括匹配的等位基因。
37.權利要求36的方法,其中改變靶多核苷酸序列的等位基因匹配模式的步驟包括比較該探針組產生的信號強度的步驟。
38.權利要求37的方法,其進一步包括分離探針組中末端延伸起始區和雙鏈錨定區的步驟。
39.一種同時探查多個多態性位點的方法,包括通過施加一個或多個溫度循環實現靶標的線性擴增,進行多重延伸測定的步驟。
40.一種同時探查多個多態性位點的方法,包括在溫控條件下運用退火和延伸步驟的組合進行多重延伸測定的步驟。
41.一種同時探查一個或多個相鄰靶序列內S個多態性位點處的核苷酸組成的方法,Ps={cp(s);1<=s<=S},該方法通過進行下列步驟,給每個cp分配一組有限可能數值之一(a)提供一組指定的固定化寡核苷酸探針,也被稱為延伸探針,每種探針在優選比對中均能與位于指定多態性位點附近的靶標亞序列退火,這種優選比對使探針序列內的一個探查位點與指定的多態性位點直接并列,該探針還含有能夠啟動延伸或延長反應的末端延伸起始(TEI)區;(b)使一個或多個靶序列與該組固定化寡核苷酸探針退火,形成探針-靶雜交復合物;(c)對于每種探針-靶雜交復合物,確定探查位點與相應指定多態性位點之間組成的匹配或錯配。
42.權利要求41的方法,其中探針以空間編碼的方式固定于基質上。
43.權利要求41的方法,其中探針固定于編碼的微粒上,隨后在基質上裝配成隨機編碼的陣列。
44.權利要求41的方法,其中確定匹配或錯配的步驟包括使用能夠延伸或延長探針的聚合酶,探針的探查位點組成與靶標內指定多態性位點的組成匹配,通過添加其中之一被標記的一種或多種三磷酸核苷,只有這些探針可以產生可光學檢測的信號。
45.權利要求41的方法,其中通過熒光標記靶標與這些引物退火形成熒光雜交復合物,光學標簽與第一步中所有固定化探針結合,其中第二步包括使用能夠延伸或延長展示末端匹配的探針的聚合酶,通過添加一種或多種三磷酸核苷,只有這些探針形成延伸的雜交復合物,其中在超過任何雜交復合物的解鏈溫度、但不超過任何延伸雜交復合物的解鏈溫度的溫度值下,根據光學標簽的穩定性識別延伸產物。
46.權利要求45的方法,其中探針固定于編碼的微粒上,通過流式細胞儀檢測光學標簽的改變,并確定顆粒的身份。
47.權利要求45的方法,其中探針固定于以隨機編碼陣列排列的編碼微粒上,所述陣列以空間編碼的方式任意排列,通過直接成像檢測光學標簽的改變,確定顆粒的身份。
48.一種序列特異地擴增分析生物樣品中目的核酸序列時產生的測定信號的方法,該方法包括下列步驟(a)提供一種溫控樣品容納裝置,其具有可實時記錄該裝置內產生的光學反應信號的溫控裝置;(b)在所述樣品容納裝置內提供一組能夠與目的序列形成雜交復合物的可辨別的固定化寡核苷酸探針;(c)使序列與這組固定化寡核苷酸探針退火,形成雜交復合物;(d)使所述雜交復合物接觸一種聚合酶,使雜交復合物內所含的匹配探針延伸或延長;(e)提供將匹配探針的延伸或延長轉換為光學反應信號的裝置;(f)提供能夠實時記錄這組固定化探針發出的光學反應信號的光學記錄/成像裝置;(g)進行一個或多個“退火-延伸-檢測-變性”循環,每個循環以算術級數提高延伸或延長的探針數,包括下列步驟(i)設定有利于雜交復合物形成的第一個溫度;(ii)設定有利于聚合酶催化延伸的第二個溫度;(iii)將延伸轉換為光學信號;(iv)記錄/成像所有固定化探針發出的光學信號/光學標簽;和(v)設定第三個溫度,以確保所有雜交復合物的變性。
49.一種同時測定一種或多種靶標內多個指定位點構型的方法,該方法包括為所述靶標的擴增提供引物;提供探針陣列;利用探針陣列進行產生延伸產物的反應;和檢測所述延伸產物。
50.一種測定一種或多種核酸內至少一個指定位點構型的方法,所述方法包括提供一種或多種核酸的多個拷貝,每種所述核酸含有至少一種多態性;(a)選擇至少一種多態性作為指定位點;(b)提供兩種或多種能夠同時探查每個所述指定位點的探針,測定所述每個指定位點的組成,每一類探針均包含i.一個末端延伸起始區,用來與所述指定位點處部分所述核酸比對,并且能夠啟動聚合酶催化的所述探針的延伸,ii.一個可變雙鏈錨定區,用來與所述核酸的不同部分比對,(c)在至少一些探針能夠與所述一種或多種核酸雜交的條件下,使所述探針與所述一種或多種核酸的多個拷貝接觸;(d)進行延伸反應,該反應可延長與所述核酸退火的所述探針組的成員;(e)檢測該延伸反應;和(f)為每個指定位點賦值。
51.根據權利要求50的方法,其進一步包括為了確定每個指定位點的身份而合并數值的步驟。
52.根據權利要求51的方法,其中為所述至少一個指定位點分配的值對應于所述至少一個指定位點處的核苷酸。
53.根據權利要求51的方法,其中如果所述探針與所述核酸完全匹配,則為所述至少一個指定位點分配的值對應于“1”,如果所述探針與所述核酸不完全匹配,則為“0”。
54.根據權利要求51、52或53的方法,其中合并所述值,以確定等位基因或等位基因組的身份。
55.根據權利要求50的分析方法,其中所述末端延伸起始區與所述雙鏈錨定區直接相鄰。
56.根據權利要求50的分析方法,其中所述末端延伸起始區與雙鏈錨定區通過一個分子鏈連接。
57.根據權利要求50的分析方法,其中設計所述探針組中所述探針的雙鏈錨定區時考慮非指定位點的多態性。
58.根據權利要求50的方法,其中所述一種或多種核酸是從CFTR基因中獲得。
59.權利要求58的方法,其中探針與正義或反義DNA鏈的靶序列比對。
60.權利要求59的方法,其中在平行反應中分析探針與靶序列之間的同源性。
61.權利要求50的方法,其中所述至少一種多態性是一個缺失。
62.權利要求50的方法,其中所述至少一種多態性是一個插入。
63.權利要求50的方法,其中所述至少一種多態性是單核苷酸多態性。
64.權利要求62的方法,其中每個探針的一部分被用來檢測缺失,該部分位于3’端或距3’端3-5個堿基內。
65.權利要求50的分析方法,其中所述一種或多種核酸是從HLA基因中獲得。
66.根據權利要求63的分析方法,其中含有相同末端延伸區的探針被分在一起。
67.一種同時探查一種或多種核酸內一組指定多態性的方法,該方法包括(a)提供一種或多種核酸的多個拷貝,所述一種或多種核酸含有一組指定的多態性;(b)使所述一種或多種核酸的多個拷貝接觸多種類型的探針,其中每種所述類型的探針均能夠與所述核酸退火,并且具有與其它類型探針不同的長度;(c)核酸與探針退火;(d)延伸探針;(e)檢測延伸的探針;和(f)確定所述核酸內所述指定多態性的序列。
68.一種測定核酸序列的方法,該方法包括(a)提供一種核酸的多個拷貝,所述核酸具有至少一種多態性;(b)選擇至少一種多態性作為指定位點;(c)提供多種類型的探針,所述每種類型的探針均包含一個用來探查所述指定位點處部分所述核酸的末端延伸起始區,如果所述末端延伸起始區與指定位點完全比對,則能夠啟動所述探針的延伸;一個用來與所述核酸不同部分比對的可變雙鏈錨定區,其中多種類型的探針與一種或多種固體載體偶聯,和進行檢測,以確定所述核酸的序列。
69.根據權利要求68的方法,其中進行測定的步驟包括使所述探針接觸所述核酸,其中所述探針與包含微珠的固體載體連接,所述微珠以平面陣列排列;使至少一種類型的探針與所述核酸退火;延伸與核酸退火的探針;和檢測哪種探針被延伸,以確定所述核酸的所述指定多態性位點的序列。
70.一種測定一種或多種核酸內至少一個指定位點的序列的方法,所述方法包括(1)提供一種緩沖溶液,所述緩沖溶液包含(a)一種或多種核酸的多個拷貝,每種所述核酸均含有多態性位點,選擇至少一個多態性位點作為指定位點;(b)兩種或多種類型的探針,每種所述類型的探針均含有一個末端延伸起始區,用來探查所述指定位點處部分所述核酸,如果所述末端延伸起始區與所述指定位點完全比對,則末端延伸起始區能夠啟動探針延伸;一個用來與所述核酸的不同部分比對的可變雙鏈錨定區;(c)一種聚合酶;(d)多種類型的dNTP,其中至少一種dNTP被標記;(2)加熱所述緩沖溶液至第一個溫度,使所述探針與所述多拷貝的一種或多種核酸退火;(3)加熱所述緩沖溶液至第二個溫度,使所述退火的探針延伸;(4)檢測延伸的探針,確定一種或多種核酸的指定位點的序列。
71.一種測定一種或多種核酸內至少一個指定位點序列的方法,該方法包括提供一種或多種核酸的多個拷貝,每種所述核酸都含有至少一種多態性;選擇每種核酸上的至少一種多態性作為指定位點;提供兩種或多種類型的探針,所述每一類探針均包含一個末端延伸起始區,用來探查所述指定位點處的部分所述核酸,如果所述末端延伸起始區與所述指定位點完全比對,則末端延伸起始區能夠啟動探針延伸;一個用來與所述核酸的不同部分比對的可變雙鏈錨定區;其中所述兩種或多種探針與一種或多種固體載體偶聯,所述探針與所述多個拷貝的一種或多種核酸退火;進行延伸反應,該反應可延長與核酸退火的探針;檢測所述延伸反應;為每個指定位點賦值;和合并這些值,確定每個指定位點的身份。
72.權利要求71的方法,其中所述固體載體是編碼的微珠,并且其中該方法進一步包括在基質上裝配所述編碼的微珠形成陣列的步驟。
73.一種測定核酸序列的方法,所述方法包括提供一種核酸的多個拷貝,所述核酸含有多態性;選擇至少一種多態性作為指定位點;使核酸的多個拷貝接觸多種類型的探針,其中每種探針包含一個末端延伸起始區,用來與所述指定位點處的部分所述核酸比對,并且能夠啟動聚合酶催化的所述探針延伸,還包含一個用來與所述核酸的不同部分比對的可變雙鏈錨定區,并且其中所述探針附著于陣列中的編碼微珠上;在促進所述核酸與所述探針退火的條件下,使所述核酸接觸所述探針;使用至少一種標記的dNTP在所述探針上進行延伸反應;使陣列內每個微珠發出的熒光信號成像,確定所述延伸探針的身份;測定核酸序列。
74.一種測定核酸的指定多態性位點序列的試劑盒,該試劑盒包含多種類型的探針,其中每種探針包含一個末端延伸起始區,用來與在所述指定位點處的部分所述核酸比對,并且能夠啟動所述探針延伸;一個用來與所述核酸的不同部分比對的可變雙鏈錨定區。
75.根據權利要求74的試劑盒,其中探針形成編碼的探針陣列。
76.根據權利要求74的試劑盒,其進一步含有進行所述探針與所述核酸退火的試驗裝置,所述試驗裝置還包括延伸所述退火探針的裝置。
77.根據權利要求74的試劑盒,其進一步包括檢測哪種探針被延伸的裝置。
78.一種同時探查核酸的多個多態性位點的方法,該方法包括提供含有多個多態性位點的核酸;進行一個或多個退火-延伸-檢測循環,每個循環都以算術級數增加被延伸探針的數量,并且包括下列步驟設定有利于雜交復合物形成的第一個溫度;提供能夠與所述核酸序列形成雜交復合物的一組可辨別的固定化寡核苷酸探針;所述核酸與所述固定化寡核苷酸探針組退火,形成包括含匹配探針的一組雜交復合物;設定有利于聚合酶催化延伸的第二個溫度;使所述雜交復合物組接觸一種聚合酶以延伸雜交復合物內所含的匹配探針;將延伸轉換為光學信號;記錄固定化探針組或延伸產物發出的試驗信號;設定第三個溫度,以確保所有雜交復合物變性。
79.權利要求78的方法,其中所述寡核苷酸探針與一種固體載體偶聯。
80.權利要求79的方法,其中所述固體載體包括多個編碼的微珠。
81.權利要求80的方法,其中所述編碼的微珠排列為陣列,所述陣列位于基質上。
82.權利要求81的方法,其中所述基質是一種芯片。
83.一種擴增核酸的方法,所述方法包括提供與多種編碼微珠偶聯的多種探針,其中所述每種探針只與一種編碼微珠偶聯;提供能夠與至少一種探針退火的模板分子進行至少一個擴增循環,所述至少一個循環包括所述模板與所述至少一種探針退火;延伸退火的探針;和使退火的模板變性。
84.一種測定核酸中多態性位點組成的方法,該方法包括提供一種核酸,所述核酸含有多態性位點;選擇至少兩個多態性位點作為指定位點;提供能夠探查指定位點的兩種或多種探針;探查指定位點,以明確兩個或多個這種指定位點的存在,并確定該兩個或多個位點處的組成,其中探查指定位點的步驟包括在第一種探針與所述核酸之間形成雜交復合物;通過延伸所述第一種探針形成延伸產物;和通過延伸產物與用來探查第二個指定位點的第二種探針退火,形成雜交復合物。
85.根據權利要求84的方法,其中雜交步驟之后是在其它指定位點處的一個或多個雜交步驟。
86.一種檢測延伸反應的方法,所述方法包括提供多種探針;將所述探針與允許識別所述探針的編碼微珠偶聯;使所述編碼微珠與含有核酸和dATP、dCTP、dTTP和dGTP的溶液接觸,其中一類所述dNTP包含一種標記;提供一種聚合酶;進行延伸反應;和檢測延伸反應的產物。
87.根據權利要求86的方法,其中所述標記是一種熒光標記。
88.一種檢測延伸反應的方法,所述方法包括提供多種探針;將所述探針與允許識別所述探針的編碼微珠偶聯;使所述編碼微珠與含有一種標記ddNTP和三種dNTP的溶液接觸;提供一種聚合酶;進行延伸反應;和檢測延伸反應的產物。
89.一種檢測延伸反應的方法,該方法包括提供多種探針;將所述探針與允許識別所述探針的編碼微珠偶聯;使所述編碼微珠與含有dATP、dTTP、dGTP和dCTP的溶液接觸;提供一種聚合酶;進行延伸反應,獲得延伸的探針;提供與所述延伸探針的一部分互補的一種標記寡核苷酸探針;使所述探針與所述延伸的探針退火;和檢測所述延伸的探針。
90.一種檢測延伸反應的方法,所述方法包括提供一種標記的靶序列;提供多種類型探針,其中所述類型探針之一與所述標記的靶序列完全互補;將所述探針與允許識別所述探針的編碼微珠偶聯;使所述標記的靶標與所述探針退火;進行延伸反應,獲得延伸的探針;加熱退火的探針至一定溫度,該溫度足以變性含有不匹配的探針但保持對應于完全匹配探針的雙鏈結構;和通過確定加熱后哪種編碼微珠含有結合的靶序列,識別對應于完全匹配探針的延伸產物。
91.一種探針,其選自實施例2中列出的探針。
92.一種探針,其選自實施例3中列出的探針。
93.一種探針,其選自實施例9中列出的探針。
94.一種探針,其選自實施例10中列出的探針。
95.一種探針,其選自實施例12中列出的探針。
全文摘要
本發明提供識別一個或多個指定位點的多態性、而不受鄰近這些指定位點的非指定位點干擾的方法和過程。為了測定每個指定位點的組成,提供了能夠探查這些指定位點的探針。通過本發明的方法,能夠識別CFTR基因和HLA基因復合物內的一個或多個突變。
文檔編號C12P19/34GK1608137SQ02824854
公開日2005年4月20日 申請日期2002年10月15日 優先權日2001年10月15日
發明者艾麗斯·相·李, 格扎拉·哈史米, 邁克爾·休 申請人:生物芯片技術有限公司