專利名稱::靶序列的富集的制作方法靶序列的富集相關申請本申請要求保護2007年8月1日提交的美國臨時申請號60/962,838的利益。上述申請的完整教授內容通過引用的方式并入本文。
背景技術:
:遺傳分析中常遇到的情況要求在極為過量的非變異序列(‘參考序列’)存在時鑒定低百分數的變異DNA序列(‘靶序列’)。這類情況的例子包括(a)在大量過量的正常等位基因存在下鑒定并對少數突變的等位基因測序;(b)遺傳分析中在大量過量的非甲基化等位基因存在下鑒定少數甲基化等位基因(或相反情況);(c)鑒定母體血液中循環的少數胎兒DNA序列并進行基因分型,在所述母體血液中也存在極為過量的母體DNA序列;和(d)在極為過量的野生型等位基因存在下鑒定癌癥患者(或可疑患有癌癥的人)血液中的腫瘤_循環DNA。盡管最近描述了用于種系或高優勢體細胞突變的可靠高通量篩選方法(Thomas,R.K.等人(2007)NatGenet,39,347-351;Chou,L.S.等人(2005)AmJClinPathol,124;330-338;Thomas,R.K.等人(2006)NatMed,12;852_855),檢測具有不均一性、基質雜質的腫瘤或體液中的低優勢體細胞突變仍成問題。另外,鑒定這些突變的臨床意義在幾種情況中重要。例如(a)在肺腺癌中,不能通過常規測序鑒定的低水平EGFR突變可以引起對酪氨酸激酶抑制劑的陽性應答(Paez,J.G.,.等人(2004)Science,304;1497-1500.)或耐藥性(Janne,P.A.等人(2006)ClinCancerRes,12;751-758)(b)血漿中用作早期檢測(Diehl,F.等人(2005)ProcNatlAcadSciUSA,102;16368-16373)或腫瘤治療應答(Kimura,Τ.等人(2004)ArmNYAcadSci,1022;55-60)的生物標記的突變不能使用常規方法測序;并且(c)頻繁具有基質雜質如胰腺或前列腺的腫瘤中的突變可以因野生型等位基因存在被掩蔽,因而要求耗費勞動力的顯微解剖或完全漏掉突變。發明概述本發明涉及用于富集來自樣品的低豐度等位基因的方法、組合物、軟件和裝置。所述方法部分地基于包括在臨界變性溫度或“Tc”保溫反應混合物的的改良核酸擴增方法。通過使用本發明,明顯改善全部基于PCR的技術的現有檢測限。“臨界溫度”或“Tc”指低于參考序列解鏈溫度“Tm”的溫度。在一些實施方案中,Tc低于參考序列和靶序列的Tm。臨界溫度利用雙鏈靶序列或交叉雜交的靶-參考雙鏈DNA雙鏈體的更低Tm,從而先于所述參考/參考同雙鏈體偏好地變性這些雙鏈體。當靶序列和參考序列交叉雜交時,沿著短(例如<200bp)雙鏈DNA序列任意位置處一個或更多單核苷酸錯配的微小序列差異將導致該序列解鏈溫度(Tm)的細微但可預測性改變(Lipsky,R.H.等人(2001)ClinChem,47,635-644;Liew,M.等人(2004)ClinChem,50,1156-1164)。根據錯配的確切序列關系和位置,考慮0.1-20°C的解鏈溫度改變。臨界變性溫度(Tc)是這樣的溫度,在所述溫度以下參考核酸序列的PCR效率劇烈下降。例如,如果PCR變性溫度設在87V,良好地擴增167bpp53序列,如果設在86.5°C,適度地擴增,并且如果PCR變性溫度設在86V或更低,不產生可檢測的產物。因而在本例子中,Tc是大約86.5°C。在第一方面,本發明涉及用于富集可疑具有靶序列和參考序列的核酸樣品中靶序列的方法。該方法包括使擴增反應混合物經歷高于參考序列解鏈溫度“Tm”的第一變性溫度處理。隨后,降低擴增反應混合物的溫度,從而導致單鏈靶序列和參考序列雜交以形成雙鏈分子。因而,該反應包括靶-靶、參考-參考的雜交同雙鏈體和靶鏈-參考鏈的雜交異雙鏈體。就定義而言,異雙鏈體是不完全匹配的雙鏈體,然而它含有維持反應混合物中雙鏈體形式的鏈間足夠同源。就定義而言,同雙鏈體是完全匹配的雙鏈體。反應混合物的溫度隨后提高至Tc,從而導致靶_參考序列雜交雙鏈體的偏好性變性。Tc或臨界溫度低于參考序列的Tm并且可以通過本文所述方法確定。在該Tc上,靶-參考序列雙鏈體(和僅在具有比參考序列更低的Tm時,靶-靶序列雙鏈體)基本上變性,而靶_靶雙鏈體(如果具有等于或大于參考序列Tm的Tm)和參考-參考序列雙鏈體基本上不變性。“基本上”意指在給定的變性或非變性形式中至少60%、優選至少70%、更優選至少80%、甚至更優選至少90%并且最優選至少98%。在偏好地變性靶-參考雙鏈體和靶-靶雙鏈體(比參考序列具有更低Tm的那些雙鏈體)后,向反應混合物施加降低的溫度,從而導致引物對與靶序列復性。復性的引物隨后被延伸,因而相對于樣品中的參考序列富集靶序列。在另一個方面,本發明涉及富集靶序列的又一種方法。在該方法中,通過施加高于參考序列Tm的第一變性溫度使可疑含有每種靶序列和參考序列的核酸樣品變性。其次,靶鏈和參考鏈相互復性,從而形成雙鏈靶-參考序列雙鏈體。該靶-參考序列雙鏈體形式形成并連同雙鏈的靶-靶和參考-參考序列雙鏈體一起存在于反應混合物中。通過施加所述Tc至樣品偏好地使雙鏈靶_參考雙鏈體和靶_參考序列雙鏈體變性。在該Tc上,靶-參考序列雙鏈體(和僅在具有比參考序列更低的Tm時,靶-靶序列雙鏈體)基本上變性,而靶_靶雙鏈體(如果具有等于或大于參考序列Tm的Tm)和參考-參考序列雙鏈體基本上不變性。“基本上”意指在給定的變性或非變性形式中至少60%、優選至少70%、更優選至少80%、甚至更優選至少90%并且最優選至少98%。一對引物隨后與靶序列復性并被延伸,因而相對于樣品中的參考序列增加靶序列的濃度。仍在另一個方面,本發明涉及用于通過實行核酸擴增反應方法而富集靶序列的方法。該擴增反應方案包括第一變性溫度和第二變性溫度。第一變性溫度高于參考序列的Tm并且第二變性溫度低于參考序列的Tm。在另一種方面,本發明涉及通過使擴增反應混合物經歷降低該反應混合物的溫度并延伸引物對的Tc處理而富集靶序列的方法,其中所述靶序列具有比相應參考序列更低的Tm。該擴增反應混合物可疑含有靶序列和參考序列的每一種。該Tc低于參考序列的Tm,因而允許以更低Tm偏好性地變性靶序列。在該Tc上,靶-參考序列雙鏈體和靶-靶序列雙鏈體基本上變性,而參考-參考序列雙鏈體本上不變性。“基本上”意指在給定的變性或非變性形式中至少60%、優選至少70%、更優選至少80%、甚至更優選至少90%并且最優選至少98%。降低反應混合物溫度的步驟導致引物對與靶序列復性。復性的引物隨后由聚合酶延伸,因而相對于參考序列增加樣品中靶序列的量。仍又在另一個方面,本發明涉及通過使擴增反應混合物經歷復性條件和Tc的多個循環而富集靶序列的方法。可疑具有每種靶序列和參考序列的擴增反應混合物首先經歷高于參考序列Tm的第一變性溫度處理。其次,樣品在溫度不同的兩個保溫步驟之間循環。在第一保溫步驟中,降低溫度,從而導致靶序列與參考序列雜交,從而形成雙鏈體。在第二保溫步驟中,提高溫度至低于參考序列Tm的Tc。在該Tc上,靶-參考序列雙鏈體(和僅在具有比參考序列更低的Tm時,靶-靶序列雙鏈體)基本上變性,而靶_靶雙鏈體(如果具有等于或大于參考序列Tm的Tm)和參考-參考序列雙鏈體基本上不變性。“基本上”意指在給定的變性或非變性形式中至少60%、優選至少70%、更優選至少80%、甚至更優選至少90%并且最優選至少98%。隨后重復這些第一和第二步驟一次或更多次。一旦循環保溫步驟結束,降低反應混合物的溫度,從而導致引物對與靶序列復性。這些引物隨后由聚合酶延伸,因而相對于樣品中的參考序列富集靶序列。附圖簡述圖1說明使用第一變性溫度和Tc靶序列的本發明富集方法的一個實施方案。圖2說明使用往復復性/Tc步驟的本發明富集方法的一個實施方案。圖3說明所測試的借助靶序列富集方法富集的p53和Kras突變。圖4說明用靶序列富集方法富集p53突變等位基因。圖5說明用靶序列富集方法富集Kras突變等位基因。圖6說明來自肺腫瘤和結腸腫瘤的臨床樣品中突變等位基因的富集。圖7說明缺少錯配形成步驟的富集方法的實施方案對突變等位基因的富集。圖8A-8D說明在常規實時PCR中或通過以實時模式應用的本發明富集方法的野生型和突變P53外顯子的擴增曲線。(a)顯示常規實時PCR中連續稀釋細胞系的擴增曲線,其中所述細胞系在P53外顯子8突變中含有突變體。(b)顯示以實時PCR模式應用時本發明的富集方法中對連續稀釋的細胞系的擴增曲線,其中所述細胞在P53外顯子8突變中含有突變體。(c)顯示常規實時PCR中4份臨床腫瘤樣品的擴增曲線,其中已知所述臨床腫瘤樣品之一含有P53外顯子8突變(CT20)。(d)顯示以實時PCR模式對所述4份臨床腫瘤樣品應用時本發明富集方法的擴增曲線。圖9A-D說明使用DNA檢測染料(LCGreen)時野生型和突變p53的外顯子8的常規和富集實時PCR擴增曲線。(a)顯示含有突變(SW480、TL6、CT20)和野生型(R27、TL8、TL18、TL81、TL82)p53外顯子8的樣品的常規實時PCR的擴增曲線。(b)顯示以實時模式對含有突變(SW480、TL6、CT20)和野生型(R27、TL8、TL18、TL81、TL82)p53外顯子8的樣品應用時,來自本發明富集方法的擴增曲線。(c)顯示含有突變(SW480、CT7、HCC、CT20)和野生型p53外顯子8的樣品的常規實時PCR的擴增曲線。(b)顯示以實時模式對含有突變(SW480、CT7、HCC、CT20)和野生型p53外顯子8的樣品應用時本發明富集方法的擴增曲線。圖10A-B說明有機溶劑(例如3%DMS0)對靶富集的影響。(a)實時PCR中野生型和突變體P53外顯子8的擴增曲線。(b)以實時模式對突變和野生型p53外顯子8應用時本發明富集方法的擴增曲線。圖11說明AA761EGFR突變的Taql消化之后,使用本發明富集方法的改良限制性片段長度多態性(RFLP)檢測。(a)說明當常規PCR或富集方法后110,000(突變體基因組)稀釋時野生型和突變(AA761)EGFR的檢測。(b)說明通過常規PCR加以分析時野生型EGFR的檢測。發明詳述本發明涉及用于富集來自樣品的低豐度等位基因(例如靶序列)的方法、組合物、軟件和裝置。本發明部分地涉及通過施加臨界變性溫度至反應混合物選擇性地富集靶序列。臨界變性溫度或Tc是低于參考序列解鏈溫度Tm的溫度。該臨界溫度利用雙鏈靶序列或交叉雜交的靶_參考雙鏈DNA雙鏈體的更低Tm,從而先于所述參考/參考同雙鏈體偏好地變性這些雙鏈體。眾多已知突變檢測方法仍可從使用選擇性富集靶序列的本發明受益。在大部分突變和測序反應中利用PCR作為遺傳檢驗的初始步驟。通常,擴增核酸序列(例如基因組DNA/cDNA)作為第一步驟,隨后是雙脫氧測序或突變篩選法(例如SSCP、dHPLC、MALDI-TOF、焦磷酸測序法、高分辨率解鏈法)。因此,如果在篩選之前的PCR步驟期間進行含突變序列(例如靶序列)的富集,則基本上全部突變檢測方法的檢測限將一律受益。如本文中所用,術語“富集靶序列”指相對于樣品中的相應參考序列,增加靶序列的量并提高靶序列的比率。例如,在樣品中靶序列對參考序列的比率初始地是5%至95%的情況下,靶序列可以在擴增反應中被偏好地擴增,從而產生70%靶序列對30%參考序列的比率。因而,存在靶序列相對于參考序列的14倍富集。靶序列的富集導致靶序列相對于富集前的參考序列增加2倍至200倍。靶的富集是優于參考序列的至少2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、25倍、30倍、35倍、40倍、45倍、50倍、60倍、70倍、80倍、90倍、100倍、150倍、200倍或更多倍數富集。靶序列的富集產生與參考序列相比具有10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、80%、90%、95%或更多靶序列的樣品(例如10%靶序列90%參考序列至95%靶序列5%參考序列)。如本文中所用,術語“靶序列”指核酸樣品中比參考序列較不優勢的核酸。靶序列占據樣品中少于50%的參考序列+靶序列的總量。優選地,靶序列相對于參考序列在RNA和/或DNA水平上以110、115、120、125倍、130、135、140、145、150、160、170、180、190、1100、1150、1200倍或更低水平表達。在一個實施方案中,靶序列是突變等位基因。例如,樣品(例如血液樣品)可以含有眾多正常細胞和少數癌細胞。正常細胞含有非突變或野生型等位基因,而少數癌細胞含有體細胞突變。在這種情況下,突變體是靶序列而野生型序列是參考序列。在另一個實施方案中,本發明涉及檢測從母親獲得的核酸樣品中的胎兒DNA。在這個實施方案中,靶序列存在于胎兒DNA中而更優勢的母親DNA含有參考序列。如本文中所用,靶序列意圖包括從妊娠母親獲得的胎兒DNA。如本文中所用,“靶鏈”指靶序列的單核酸鏈。靶序列長約17-2000個核苷酸。在一個實施方案中,靶序列長20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、250、300、350、400、450、500、600、700、800、900個或更多個核苷酸。靶序列與對應的參考序列共有至少50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同源性,不過與該參考序列不同至少一個核苷酸。可以借助PCR,采用與用于參考序列的那些引物對相同的引物對擴增本發明的靶序列。如本文中所用,術語“參考序列,,指核酸樣品中比對應靶序列(例如相同基因,但不同的核酸序列)更優勢的核酸。參考序列占據樣品中超過50%的總體參考序列+靶序列。優選地,參考序列相對于靶序列在RNA和/或DNA水平上以10倍、15倍、20倍、25倍、30倍、35倍、40倍、45倍、50倍、60倍、70倍、80倍、90倍、100倍、150倍、200倍或更高水平表達。在一個實施方案中,參考序列是野生型等位基因。例如,樣品(例如血液樣品)可以含有眾多正常細胞和少數癌細胞。正常細胞含有非突變或野生型等位基因,而少數癌細胞含有體細胞突變。在這種情況下,該野生型序列是參考序列而突變序列是靶序列(例如突變等位基因)。如本文中所用,“參考鏈”指參考序列的單核酸鏈。參考序列長約17-2000個核苷酸。在一個實施方案中,參考序列長20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、250、300、350、400、450、500、600、700、800、900個或更多個核苷酸。參考序列將與對應的靶序列共有至少50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同源性,不過與該靶序列不同至少一個核苷酸。可以通過PCR,采用與用于靶序列的那些引物對相同的引物對擴增本發明的參考序列。術語“等位基因”指基因、其部分或DNA非編碼區的變異形式,其中所述變異形式在核苷酸序列中具有至少一個差異的同源染色體上占據相同基因座或位置。術語“等位基因”可以用來描述來自任意生物的DNA,所述的任意生物包括但不限于細菌、病毒、真菌、原蟲、霉菌、酵母、植物、人、非人動物和古細菌。等位基因可以存在于單個細胞(例如,兩個等位基因,一個等位基因從父親遺傳并且另一個來自母親)或細胞群體內部(例如,來自正常組織的野生型等位基因和來自發病組織的體細胞突變等位基因)。等位基因可以長17-2000個核苷酸。在一個實施方案中,等位基因長20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、250、300、350、400、450、500、600、700、800、900個或更多個核苷酸。等位基因通常將相互共有50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的同源性。可以通過PCR,采用相同的引物對擴增本發明的等位基因。在一個實施方案中,本發明用來富集多態性。任意給定的基因可以沒有、具有一種或多種等位形式(多態性)。產生等位基因的常見突變性改變可以是天然或人工(例如化學致癌原)缺失、添加或替換核苷酸的結果。這些類型的改變的每一種可以單獨或與其余類型組合在給定序列中出現一次或更多次。已經報道了幾種不同類型的多態性。限制性片段長度多態性(RFLP)是DNA序列中變更限制性片段長度的變異(Botstein等人,Am.J.Hum.Genet.32:314_331(1980))。限制性片段長度多態性可以創造或缺失限制性位點,因而改變限制性片段的長度。RFLP已經廣泛地用于人和動物遺傳分析中(見WO90/13668;WO90/11369;Donis-Keller,Cell51319-337(1987);Lander等人,Genetics121:85-99(1989))。當可遺傳性狀可能連鎖于特定的RFLP時,某個體中該RFLP的存在性可以用來預測該個體也將顯示展示該性狀的可能性。RFLP以與本文所述的富集方法聯合使用,從而增強對多態性的檢測。此類方法在本文實施例9中描述。其他多態性采取包含串聯、二、三和四核苷酸重復基序的短串聯重復序列(STR)形式。這些串聯重復序列也稱作可變數目的串聯重復(VNTR)多態性。VNTR已經用于身份和父子關系分析(美國專利號5,075,217;Armour等人,FEBSLett.307113-115(1992);Horn等人,WO91/14003Jeffreys,EP370,719)和大量的遺傳作圖研究中。其他多態性采取相同物種的個體之間單核苷酸變異的形式。此類多態性遠比RFLP、STR(短串聯重復序列)和VNTR(可變數目的串聯重復序列)頻繁。一些單核苷酸多態性出現于編碼蛋白質的序列中,在這種情況下,所述多態性形式之一可以導致缺陷蛋白質或其他變異蛋白質表達并潛在地導致遺傳病。其他單核苷酸多態性出現在非編碼區中。這些多態性中某些也可以導致缺陷蛋白質表達(例如作為缺陷剪接作用的結果)。其他單核苷酸多態性沒有表型效果。其他突變還包括體細胞突變。體細胞突變是DNA中受孕后出現的變異。體細胞突變可以在除生殖細胞(精子和卵子)之外的任何身體細胞中出現并因而不傳遞至兒童。這些變異可能(但不總是)導致癌癥或其他疾病。如本文中所用,術語“野生型”指群體中對于某種基因最常見的多核苷酸序列或等位基因。通常,野生型等位基因將從正常細胞獲得。本文中所用,術語“突變體”指核酸序列中的核苷酸改變(即單個或多個核苷酸替換、缺失或插入)。攜帶突變的核酸具有在序列上不同于對應野生型多核苷酸序列的核酸序列(突變等位基因)。本發明的方法尤其用于選擇性地富集含有1和500個之間核苷酸序列改變的突變等位基因。與對應的野生型等位基因相比,突變等位基因可以具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、200,300,400或500個核苷酸序列改變。優選地,突變等位基因中的突變將含有1和10個之間的核苷酸序列改變并且更優選地含有1和5個之間的核苷酸序列改變。該突變等位基因將與野生型等位基因具有50%,60%,70%,80%,85%,90%,91%,92%,93%,94%,95%,96%、97%、98%、99%或更多的同源性。通常,突變等位基因將從發病的組織或細胞獲得并與疾病狀態相關。如本文中所用,術語“解鏈溫度”或“Tm”指多核苷酸與其互補序列解離的溫度。通常,Tm可以定義為這樣的溫度,在該溫度上雙鏈體核酸分子中的一半Watson-Crick堿基對被破壞或解離(即“解鏈”),而其余一半Watson-Crick堿基對仍完好處于雙鏈構象。換句話說,1定義為兩條互補序列的50%核苷酸復性(雙鏈)且50%核苷酸變性(單鏈)的溫度。Tm因而定義了從雙鏈核酸分子至單鏈核酸分子的轉變過程(或反過來從單鏈核酸分子至雙鏈核酸分子的轉變過程)的中間點。Tm可以通過眾多方法估計,例如按照Wetmur1991(ffetmur,J.G.1991.DNAprobes!applicationsoftheprinciplesofnucleicacidhybridization.CritRevBiochemMolBiol26:227_259,該文獻因而通過引用的方式并入)的最近鄰計算法和借助商用程序,所述商用程序包括01igOTMPrimerDesign和互聯網上可利用的程序。或者,Tm可以通過實際實驗確定。例如,雙鏈DNA結合或嵌入染料溴化乙啶或SYBR-綠(MolecularProbes)可以用在確定核酸實際Tm的解鏈曲線測定法中。用于確定核酸Tm的額外方法是本領域熟知的并且在本文描述。如本文中所用,臨界溫度”或“Tc”指低于參考序列“Tm”的溫度。施加Tc以偏好地變性雙鏈的靶序列雙鏈體或靶序列/參考序列雙鏈的雙鏈體,從而導致擴增反應期間靶序列的選擇性富集。臨界變性溫度(Tc)是這樣的溫度,在所述溫度以下給定核酸序列的PCR效率劇烈下降。例如,如果PCR變性溫度設在87V,良好地擴增167bpp53序列,如果設在86.5°C,適度地擴增,并且如果PCR變性溫度設在86°C或更低,不產生可檢測的產物。因而在本例子中,Tc是大約86.50C。Tc低于參考序列Tm約.1-20°C。更優選地,Tc低于參考序列Tm約·l-10°c、·1-9°C、·l-8°c、·l-7°c、·1-6°C、·2°C_5°C、·3°C-4.5°C、·4-4°C、·5-3.5°C、.5-3°C、.5-3°C、.5-2.5°C、.5_2°C、.5-1.5°C、.5_1°C。在一些實施方案中,Tc低于參考序列和靶序列的Tm。例如,Tc可以低于靶序列1約.1-10°C、.1-90C,.1-8°C1-71-6°C、·2°C_5°C、·3°C-4.5°C、·4-4°C、·5-3.5°C、·5_3°C、·5_3°C、·5-2.5°C、·5_2°C、·5-1.5°C、·5-1°C。如本文中所用,術語“選擇性變性”或“偏好性變性”指偏好地破壞靶序列或靶/參考序列雙鏈體的雙鏈核酸分子中堿基對之間的氫鍵以產生單鏈靶序列。靶序列的選擇性變性通過施加臨界溫度至含有靶序列和參考序列的樣品實現。本文中所用,“引物對”指與靶序列和參考序列的對立鏈復性從而在PCR反應期間形成擴增產物的兩條引物。該引物對如此設計,從而具有該反應Tc的Tm。如本文中所用,術語“交叉雜交”指在相異一個或多個核苷酸的兩個核酸序列之間借助互補性G與C堿基之間和互補性A與T堿基或A與U堿基之間氫鍵形成所產生的雙鏈體。這兩個互補性核酸序列以反平行構象形成氫鍵。在優選施方案中,這兩個核酸序列是靶序列和參考序列。交叉雜交的DNA將在參考序列與靶序列之間差異的位置處含有錯配。所述錯配可以包括多態性、突變、插入、缺失和產生此類差異的其他變異。例如,甲基化。例如,含有一個或多個核苷酸的環和/或單鏈區出現于缺失/插入位點處。交叉雜交一般涉及使靶序列和參考序列變性,例如通過加熱,隨后在導致雜交和雙鏈體形成發生的條件(如溫度)下復性。如本文中所用,“反應混合物”是可疑含有靶序列雙鏈體的混合物,其中所述混合物包含導致靶序列變性的合適緩沖液。如本文中所用,“同一性”或“同源性”指兩個聚合物分子例如兩個多核苷酸或兩個多肽之間的次級單位序列相似性。當這兩個分子中的次級單位位置被相同單體性次級單位占據時,例如,若兩個多肽之每一多肽中的某位置被絲氨酸占據,則這兩個多肽在該位置上相同。兩個序列之間的同一性是匹配數或相同位置的直接函數,例如,如果兩個肽或復合物序列中一半(例如長度10個次級單位的聚合物中的5個位置)位置是相同的,則這兩個序列是50%相同的;如果90%的位置(例如10個位置中9個位置)匹配,則這兩個序列共享90%序列同一性。核苷酸同一性百分數可以通過BLAST的默認參數確定。對于序列比較,一般地一個序列充當檢驗序列與之比較的參考序列。當使用序列比較算法時,將檢驗序列和參考序列輸入計算機,根據需要指定次級序列坐標,并指定序列算法程序參數。可以使用默認程序參數或可以指定備選參數。基于程序參數,序列比較算法隨后相對于參考序列計算檢驗序列的序列同一性百分數。比較窗口包括針對具有任一連續位置數的節段的參考,所述的連續位置數選自由20至600、通常約50至約200、更通常約100至約150的組成的組,其中一個序列可以與具有相同連續位置數的參考序列在這兩個序列最佳比對后進行比較。用于比較的序列比對方法是本領域熟知的。用于比較的最佳序列比對可以這樣進行,例如通過Smith和Waterman,Adv.App1.Math.2482(1981)的局部同源性算法、通過Needleman和Wunsch,J.Mol.Biol.48:443(1970)的同源性比對算法、通過Pearson和Lipman,Proc.Nat‘1.Acad.Sci.USA85:2444(1988)的相似性搜索方法、通過這些算法的計算機化執行(GAP、BESTFIT、FASTA,和TFASTAintheWisconsinGenetics軟件包,GeneticsComputerGroup,575ScienceDr.、Madison、Wis.)或通過手工比對和目視審查(見,例如,CurrentProtocolsinMolecularBiolog(Ausubel等人編著,1995增補))。適用于確定序列同一性和序列相似性百分數的算法例子是BLAST和BLAST2.O算法,它們分別在Altschul等人,Nuc.AcidsRes.25:3389_3402(1977)和Altschul等人,J.Mol.Biol.215=403-410(1990)中描述。用于開展BLAST分析的軟件是通過國家生物技術信息中心((http://www.ncbi.nlm.nih.gov/))可公開獲得的。該算法涉及首先通過查詢序列中長度W的短字鑒定高評分序列對(HSP),其中所述短字與數據庫序列中具有相同長度的字比對時匹配或滿足某些正值閾評分Τ。T稱作鄰居字評分閾值(上文的Altschul等人)。這些初始鄰居字hit充當啟動搜索的種子以發現含有這些種子的更長HSP。所述字hit沿每個序列向兩個方向延伸,只要可以提高累積比對評分。對于核苷酸序列,使用參數M(—對匹配殘基的報酬評分;總是>0)和N(錯配殘基的的懲罰評分;總是<0)計算累積評分。對于氨基酸序列,使用評分矩陣來計算累積評分。字hit在每個方向上的延伸在以下情況時停止累積比對評分從其最大實現值跌落達量X;累積評分因積累一個或更多負評分殘基比對比對結果而達到或低于零;或抵達兩個序列二者之一的末端。BLAST算法參數W、T和X決定比對的靈敏度和速度。BLASTN程序(對于核苷酸序列)使用字長度(W)ll、期望(E)10、M=5、N=-4和兩條鏈的比較作為默認。對于氨基酸序列,BLASTP程序使用字長度(W)11和期望(E)10,以及BL0SUM62評分矩陣(見Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA8910915(1989))、比對結果(B)50、M=5、N=_4和兩條鏈的比較作為默認。BLAST算法也進行兩個序列之間相似性的統計分析(見,例如,Karlin和Altschul,Proc.Nat'1Acad.Sci.USA90:58735787(1993))。由BLAST算法提供的相似性的一種度量是最小總和概率(P(N)),其提供兩個核苷酸序列或氨基酸序列之間的匹配會因偶然發生的概率指示。例如,如果最小總和概率在檢驗核酸與參考核酸的比較中小于約0.2、更優選小于約0.01并且最優選小于約0.001,則將認為核酸相似于參考序列。在第一方面,本發明涉及用于富集可疑具有靶序列和參考序列的核酸樣品中靶序列的方法。參考序列和靶序列可以在本方法中使用之前被擴增。即參考序列和目的靶序列可以在本方法中使用之前在PCR反應中從基因組模板擴增。隨后為用于選擇性富集方法中,轉移來自該PCR反應的等分試樣。或者,參考序列和靶序列無需經歷第一PCR反應,不過可以在選擇性富集方法中以它們的天然形式(例如基因組DNA)使用。靶序列和參考序列可以從包括基因組DNA、cDNA、病毒DNA、哺乳動物DNA、胎兒DNA或細菌DNA的任意核酸序列獲得。在參考序列通常是野生型等位基因而靶序列是突變等位基因的同時,也可以反之亦然。突變等位基因可以包括任意一個或多個核苷酸缺失、插入或改變。在一些實施方案中,突變等位基因是體細胞突變。在其他實施方案中,靶序列是甲基化DNA而參考序列為非甲基化DNA。或者,靶序列為非甲基化DNA而參考序列是甲基化DNA。一般如此設計本發明方法中使用的引物,從而產生大小約17至1000堿基、更優選約25至500堿基和最優選約50至100堿基的參考序列和靶序列擴增產物。該方法包括使擴增反應混合物經歷高于參考序列解鏈溫度“Tm”的第一變性溫度處理。核酸的Tm可以通過實驗確定或通過計算估計。技術人員十分了解用于確定核酸Tm的眾多熟知方法,其中所述方法的某些在本文描述。根據PCR中所用標準方法設置第一變性溫度。因而,第一變性溫度應當足夠地高,從而導致靶序列和參考序列的充分變性(例如96°C)。在一個實施方案中,第一變性溫度高于參考序列Tm約1°C至30°C,參考序列的Tm更優選地高于參考序列Tm約5°C至20°C。隨后,降低擴增反應混合物的溫度,從而導致靶序列和參考序列雜交。在優選施方案中,該雜交溫度或中間溫度(低于第一變性溫度和Tc,但高于引物復性/延伸溫度的溫度,例如約60°C至80°C)高于引物對的Tm,并因而導致靶序列與參考序列雜交而阻止引物對與靶序列和/或參考序列的結合。這個復性步驟導致雙鏈的靶_靶、參考_參考和靶_參考序列的雜交雙鏈體形成。隨后通過提高反應混合物的溫度至所述Tc偏好地變性靶-參考雜交雙鏈體。Tc或臨界溫度低于參考序列的Tm并且可以通過本文所述方法確定。在一個實施方案中,Tc低于參考序列的Tm約.3°C_5°C并且更優選低于約.5°C至1.5°C。通常,Tc將是約70-90°。如果靶序列具有與參考序列相比產生更低Tm的核苷酸序列,靶-靶雜交雙鏈體也可以被偏好地變性。在該Tc上,靶-參考序列雙鏈體(和僅在具有比參考序列更低的Tm時,靶-靶序列雙鏈體)基本上變性,而靶-靶雙鏈體(如果具有等于或大于參考序列Tm的Tm)和參考-參考序列雙鏈體基本上不變性。“基本上”意指在給定的變性或非變性形式中至少60%、優選至少70%、更優選至少80%、甚至更優選至少90%并且最優選至少98%。一般施加該Tc約1秒至5分鐘、更優選2秒至1分鐘并且最優選5秒至30秒。在偏好性地變性靶_參考和/或靶_靶序列雜交雙鏈體后,降低反應混合物的溫度,從而導致引物對與靶序列復性。復性的引物隨后由核酸聚合酶延伸,因而相對于樣品中的參考序列富集靶序列。該方法的所述步驟通常重復多個循環,旨在引起靶序列和參考序列充分擴增。在一個實施方案中,該方法的步驟重復5-40個循環并更優選地重復10-30個循環。最佳循環數可以由本領域普通技術人員確定。優選地,本發明方法在PCR裝置中進行,更優選地在實時反應條件下在實時檢測PCR裝置如SMARTCYCLER實時PCR裝置(C印heid,Sunnyvale,CA)和Mx3005P實時PCR裝置(Stratagene,LaJolla,CA)中進行。在這個實施方案中,反應混合物可以包含用于量化和/或監測該反應的擴增產物的核酸檢測試劑(例如核酸檢測染料如SYBRGreen染料或LC-Green染料或有效偶聯于熒光染料的探針)。一旦靶序列的富集完成,可以進一步加工該樣品(例如以鑒定由該方法富集的任意遺傳變異,例如,經歷測序反應)。富集的參考序列可以由多種方法進一步加工,所述方法包括MALDI-T0F、HR解鏈法、雙脫氧測序、單分子測序、焦磷酸測序、RFLP、數字PCR和定量PCR。仍在另一個方面,本發明涉及用于通過實行核酸擴增反應方法而富集靶序列的方法。該擴增反應方法包括第一變性溫度和第二變性溫度。第一變性溫度高于參考序列的Tm并且第二變性溫度低于參考序列的Tm。該方法包括使擴增反應混合物經歷高于參考序列解鏈溫度“Tm”的第一變性溫度處理。核酸的Tm可以通過實驗確定或通過計算估計。技術人員十分了解用于確定核酸Tm的眾多熟知方法。第一變性溫度通常如一般將選擇PCR反應的變性溫度那樣進行選擇并且應當足夠地高,從而導致靶序列和參考序列的變性。在一個實施方案中,第一變性溫度高于參考序列Tm約1°C至30°C,參考序列的Tm更優選地高于參考序列1約51至20°C。第二變性溫度低于參考序列的Tm并且可以通過本文所述方法確定。在一個實施方案中,Tc低于參考序列的Tm約.3°C_5°C并且更優選低于參考序列的Tm約.5°C至1.5°C。通常,Tc將是約70-90°。一般施加第二變性溫度約1秒至5分鐘、更優選2秒至1分鐘并且最優選5秒至30秒。在另一種方面,本發明涉及通過使擴增反應混合物經歷降低該反應混合物的溫度并延伸引物對的Tc處理而富集靶序列的方法。該擴增反應混合物可疑含有靶序列和參考序列。在這個方面,靶序列具有低于參考序列1的!。該Tc低于參考序列的Tm,因而導致因其核苷酸組成(例如缺失)而具有比參考序列更低的、的靶序列的偏好變性。如同本發明的其他方面,參考序列和靶序列可以在本方法中使用之前擴增。即參考序列和目的靶序列可以在本方法中使用之前在PCR反應中從基因組模板擴增。隨后為用于選擇性富集方法中,轉移來自該PCR反應的等分試樣。或者,參考序列和靶序列無需經歷第一PCR反應,不過可以在選擇性富集方法中以它們的天然形式(例如基因組DNA)使用。所述靶序列和參考序列可以從包括基因組DNA、cDNA、病毒DNA、哺乳動物DNA、胎兒DNA或細菌DNA的任意核酸序列獲得。在參考序列通常是野生型等位基因而靶序列是突變等位基因的同時,也可以反之亦然。突變等位基因可以包括任意一個或多個核苷酸缺失、插入或改變。在一些實施方案中,突變等位基因是體細胞突變。一般如此設計本發明方法中使用的引物,從而產生大小約15至1000堿基、更優選約25至500堿基和最優選約50至100堿基的參考序列和靶序列擴增產物。通過提高反應混合物的溫度至所述Tc偏好地變性靶_靶雜交雙鏈體。Tc或臨界溫度低于參考序列的Tm并且可以通過本文所述方法確定。在一個實施方案中,Tc低于參考序列的Tm約.3°C_5°C并且更優選低于參考序列的Tm約.5°C至1.5°C。通常,Tc將是約70-90°C。一般施加該Tc約1秒至5分鐘、更優選2秒至1分鐘并且最優選5秒至30秒。在該Tc上,靶-參考序列雙鏈體和靶-靶序列雙鏈體基本上變性,而參考_參考序列雙鏈體本上不變性。“基本上”意指在給定的變性或非變性形式中至少60%、優選至少70%、更優選至少80%、甚至更優選至少90%并且最優選至少98%。降低反應混合物溫度的步驟導致引物對與靶序列復性。復性的引物隨后由聚合酶延伸,因而增加樣品中靶序列的量。該方法的所述步驟通常重復多個循環,旨在引起靶序列和參考序列充分擴增。在一個實施方案中,該方法的步驟重復5-40個循環并更優選地重復10-30個循環。最佳循環數可以由本領域普通技術人員確定。優選地,本發明方法在PCR裝置中進行,更優選地在實時反應條件下在實時檢測PCR裝置如SMARTCYCLER實時PCR裝置(Cepheid,Sunnyvale,CA)和Mx3005P實時PCR裝置(Stratagene,Lajolla,CA)中進行。在這個實施方案中,反應混合物可以包含用于量化和/或監測該反應的擴增產物的核酸檢測試劑(例如核酸檢測染料如SYBRGreen染料或LC-Green染料或有效偶聯于熒光染料的探針)。一旦靶序列的富集完成,可以進一步加工該樣品,例如,經歷測序反應。富集的等位基因可以由多種方法進一步加工,所述方法包括MALDI-TOF、HR解鏈法、雙脫氧測序、單分子測序、焦磷酸測序、RFLP、數字PCR和定量PCR。仍又在另一個方面,本發明涉及通過使擴增反應混合物經歷復性條件和通過施加Tc所致變性條件的輪換步驟而富集靶序列的方法。具有每種靶序列和參考序列的擴增反應混合物首先經歷高于參考序列Tm的第一變性溫度處理。如在其余方面那樣,參考序列和靶序列可以在本方法中使用之前被擴增。即參考序列和目的靶序列可以在本方法中使用之前在PCR反應中從基因組模板擴增。隨后為用于選擇性富集方法中,轉移來自該PCR反應的等分試樣。或者,參考序列和靶序列無需經歷第一PCR反應,不過可以在選擇性富集方法中以它們的天然形式(例如基因組DNA)使用。所述靶序列和參考序列可以從包括基因組DNA、cDNA、病毒DNA、哺乳動物DNA、胎兒DNA或細菌DNA的任意核酸序列獲得。在參考序列通常是等位基因而靶序列是突變等位基因的同時,也可以反之亦然。突變等位基因可以包括任意一個或多個核苷酸缺失、插入或改變。在一些實施方案中,突變等位基因是體細胞突變。在其他實施方案中,靶序列是甲基化DNA而參考序列為非甲基化DNA。或者,靶序列為非甲基化DNA而參考序列是甲基化DNA。一般如此設計本發明方法中使用的引物,從而產生大小約15至1000堿基、更優選約25至500堿基和最優選約50至100堿基的參考序列和靶序列擴增產物。核酸的、可以通過實驗確定或通過計算估計。技術人員十分了解用于確定核酸Tffl的眾多熟知方法。第一變性溫度通常如一般將選擇PCR反應的變性溫度那樣進行選擇并且應當足夠地高,從而導致靶序列和參考序列的變性。在一個實施方案中,第一變性溫度高于參考序列Tm約l°c至30°C,參考序列的Tm更優選地高于參考序列Tm約5°C至20°C。其次,樣品在溫度不同的兩個保溫步驟之間循環。在第一保溫步驟中,降低溫度,從而導致靶序列與參考序列雜交。在第二保溫步驟中,提高溫度至低于參考序列Tm的Tc。隨后重復這些第一和第二步驟一次或更多次,更優選3-20次并且最優選5-10次。第一保溫步驟導致靶_靶、參考_參考和靶_參考序列的雜交雙鏈體形成。在優選施方案中,該雜交溫度或中間溫度(低于第一變性溫度和Tc,但高于引物復性/延伸溫度的溫度,例如約60°C至80°C)高于引物對的Tm,并因而導致靶序列與參考序列雜交而阻止引物對與靶序列和/或參考序列的結合。隨后通過在第二保溫步驟中提高反應混合物的溫度至所述Tc偏好地變性靶-參考和靶-靶(只要該靶具有比參考序列更低的TJ雜交雙鏈體。Tc或臨界溫度低于參考序列的Tm并且可以通過本文所述方法確定。在一個實施方案中,Tc低于參考序列的Tm約.3°C_5°C并且更優選低于參考序列的Tm約.5°C至1.5°C。通常,Tc將是約70-90°C。如果靶序列具有與參考序列相比產生更低Tm的核苷酸序列,靶-靶雜交雙鏈體也被偏好地變性。一般施加該Tc約1秒至5分鐘、更優選2秒至1分鐘并且最優選5秒至30秒。一旦循環保溫步驟結束,降低反應混合物的溫度,從而導致一個或多個引物與靶序列復性。這些引物隨后由聚合酶延伸,因而富集靶序列。—旦每個步驟完成,則該反應可以重復多個循環,旨在引起靶序列和參考序列充分擴增。在一個實施方案中,該方法的步驟重復5-40個循環并更優選地重復10-30個循環。最佳循環數可以由本領域普通技術人員確定。優選地,本發明方法在PCR裝置中進行,更優選地在實時反應條件下在實時檢測PCR裝置如SMARTCYCLER實時PCR裝置(C印heid,Sunnyvale,CA)和Mx3005P實時PCR裝置(Stratagene,LaJolla,CA)中進行。在這個實施方案中,反應混合物可以包含用于量化和/或監測該反應的擴增產物的核酸檢測試劑(例如核酸檢測染料如SYBRGreen染料或LC-Green染料或有效偶聯于熒光染料的探針)。一旦靶序列的富集完成,樣品可以經歷其他方法處理。其他方法包括MALDI-TOF、HR解鏈法、雙脫氧測序、單分子測序、焦磷酸測序、RFLP、數字PCR和定量PCR。在另一個實施方案中,本發明的方法可以用來檢測甲基化是否已經出現在靶序列或參考序列中。在又一個實施方案中,所述方法使用基因組DNA來分析甲基化。16甲基化檢測方法包括用于甲基化敏感處理DNA的化學方法或酶方法。化學處理包括將DNA與亞硫酸氫鈉保溫,所述的亞硫酸氫鈉選擇性地將非甲基化胞嘧啶轉換成尿嘧啶。該DNA首先進行熱變性并隨后可以用pH5-7的5M亞硫酸氫鹽處理。在亞硫酸氫鹽處理前使用除去預先存在的尿嘧啶的基因組DNA預處理法。這種預處理法由pH7的5mM羥胺存在下的尿嘧啶糖基化酶處理組成。修飾的DNA現在可以在本發明的方法中使用。因為參考序列或靶序列的甲基化胞嘧啶被轉換成尿嘧啶,故與(靶或參考序列的)對立鏈成雙時,它們現在將在反應的交叉雜交步驟期間形成錯配。在又一個方面,本發明的任意方法用來富集多重反應中的多種不同靶序列。在這個實施方案中,所述方法包括針對額外靶序列的額外組引物對。在另一個方面,本發明涉及計算機可讀取介質,其具有用于開展發明任意方法的程序指令。在又一個方面,本發明涉及用于富集靶序列的PCR系統。該系統包括用于執行計算機可讀取介質的程序指令的存儲器。圖1和圖2說明本發明的兩個不同方面。圖1說明本發明的一個方面,其中所述方法使用具有第一變性溫度和臨界變性溫度或Tc的擴增反應。圖2也說明具有第一變性溫度和Tc的擴增反應,不過還包括在反應的引物復性和延伸相之前往復或重復多次復性及臨界變性溫度步驟。圖1顯示用于富集具有靶序列和參考序列核酸樣品中靶序列的方法。所述靶序列和參考序列可以從包括基因組DNA、cDNA、病毒DNA、哺乳動物DNA、胎兒DNA或細菌DNA的任意核酸序列獲得。在參考序列通常是等位基因而靶序列是突變等位基因的同時,也可以反之亦然。突變等位基因可以包括任意一個或多個核苷酸缺失、插入或改變。在一些實施方案中,突變等位基因是體細胞突變。在其他實施方案中,靶序列是甲基化DNA而參考序列為非甲基化DNA。或者,靶序列為非甲基化DNA而參考序列是甲基化DNA。該方法包括使擴增反應混合物經歷高于參考序列解鏈溫度“Tm”的第一變性溫度(圖1)處理。核酸的、可以通過實驗確定或通過計算估計。技術人員十分了解用于確定核酸Tm的眾多熟知方法,其中所述方法的某些在本文描述。第一變性溫度通常如一般將選擇PCR反應的變性溫度那樣進行選擇并且應當足夠地高(例如94°C),從而導致靶序列和參考序列的充分變性。在一個實施方案中,第一變性溫度高于參考序列Tm約1°C至30°C,參考序列的Tm更優選地高于參考序列Tm約5°C至20°C。隨后,降低擴增反應混合物的溫度,從而導致靶序列和參考序列雜交(圖1B)。這個復性步驟導致靶_靶、參考_參考和靶_參考序列的雜交雙鏈體形成。復性溫度的確定是技術人員熟知的。本發明方法中使用的引物設計成具有這樣的Tm,所述Tm防止所述引物在這個中間溫度與靶序列和參考序列結合,從而這些引物不干擾突變(靶)序列和野生型(參考)序列的交叉雜交。因為靶序列中的突變,故大部分靶序列的結構與參考序列錯配,并因而與參考序列成雙時具有比完全匹配的參考/參考同雙鏈體更低的解鏈溫度。隨后通過提高反應混合物的溫度至所述Tc偏好地變性靶_參考雜交雙鏈體(圖1C)。Tc或臨界溫度低于參考序列的Tm并且可以通過本文所述方法確定。在一個實施方案中,Tc低于參考序列的Tm約.3°C_5°C并且更優選低于參考序列的Tm約.5°C至1.5°C。通常,Tc將是約70-90°。如果靶序列具有與參考序列相比產生更低、的核苷酸序列,靶-靶雜交雙鏈體也可以被偏好地變性。一般施加該Tc約1秒至5分鐘、更優選2秒至1分鐘并且最優選5秒至30秒。在偏好性地變性靶_參考和/或靶_靶序列雜交雙鏈體后,降低反應混合物的溫度,從而導致一種或多種引物對與靶序列復性(圖1D)。復性的引物隨后由核酸聚合酶延伸,因而富集樣品內所含核酸群體中的靶序列。該方法的所述步驟通常重復多個循環,旨在引起靶序列和參考序列充分擴增。在一個實施方案中,該方法的步驟重復5-40個循環并更優選地重復10-30個循環。最佳循環數可以由本領域普通技術人員確定。優選地,本發明方法在PCR裝置中進行,更優選地在實時反應條件下在實時檢測PCR裝置如SMARTCYCLER實時PCR裝置(C印heid,Sunnyvale,CA)和Mx3005P實時PCR裝置(Stratagene,LaJolla,CA)中進行。在這個實施方案中,反應混合物可以包含用于量化和/或監測該反應的擴增產物的核酸檢測試劑(例如核酸檢測染料如SYBRGreen染料或LC-Green染料或有效偶聯于熒光染料的探針)。一旦靶序列的富集完成,可以進一步加工該樣品,例如,經歷測序反應。富集的等位基因可以由多種方法進一步加工,所述方法包括MALDI-TOF、HR解鏈法、雙脫氧測序、單分子測序、焦磷酸測序、RFLP、數字PCR和定量PCR。通過在每個PCR-循環中開展富集方法,突變序列(靶序列)的量先于所述序列(參考序列)逐步富集。純合突變和雜合突變均通過本方法富集。相對于在94°C變性溫度進行常規PCR,富集含有突變的序列10-60倍是尋常的。在給定的臨界變性溫度(Tc),突變富集同時在全部序列位置處發生,盡管以不同效率進行,這取決于序列環境和PCR擴增子的整體大小。使用適宜的DNA解鏈軟件,臨界變性溫度Tc和在任意位置處的預期富集均是可預測的并且可以實驗地驗證。因而取決于突變在何處,可以預期稍微不同的富集,然而在全部情況下,可以實現相當大的富集并且因而改善下游測定法(例如測序反應)的檢測限。圖2說明通過使擴增反應混合物經歷復性和臨界變性溫度的輪換步驟而富集靶序列的方法的實施方案。該實施方案利用在臨界溫度的偏好性變性和在雜交溫度的偏好性交叉雜交。具有每種靶序列和參考序列的擴增反應混合物首先經歷高于參考序列Tm的第一變性溫度處理(圖2A)。其次,樣品在溫度不同的兩個保溫步驟之間循環。在第一保溫步驟中,降低溫度,從而導致靶序列偏好地與參考序列雜交(圖2B)。在第二保溫步驟中,提高溫度至Tc(圖2C)。隨后重復這些第一和第二步驟一次或更多次,更優選3-20次并且最優選5-10次。給定序列的偏好性雜交溫度是野生型等位基因以比含有突變的等位基因更快的速率與自身逆轉雜交的溫度。因為突變的等位基因遠比野生型等位基因少,故野生型等位基因與自身的交叉雜交比突變等位基因與突變等位基因的交叉雜交或突變等位基因與等位基因(后者形成錯配)的交叉雜交更快地進行。因此,當PCR溫度降低至交叉雜交溫度時,突變等位基因的交叉雜交程度不如野生型等位基因的交叉雜交程度。在優選施方案中,該雜交溫度或中間溫度(低于第一變性溫度和Tc,但高于引物復性/延伸溫度的溫度,例如約60°C至80°C)高于引物對的Tm,并因而導致靶序列與參考序列雜交而阻止引物對與靶序列和/或參考序列的結合。其次,提高反應的溫度至Tc,從而引起靶_參考和靶_靶雜交雙鏈體偏好地變性(圖2C)。Tc或臨界溫度低于參考序列的Tm并且可以通過本文所述方法確定。在一個實施18方案中,Tc低于參考序列的1約.3°C_5°C并且更優選低于參考序列的1約.5°C至1.5°C。通常,Tc將是約70-90°。如果靶序列具有與參考序列相比產生更低Tm的核苷酸序列,靶_靶雜交雙鏈體也可以被偏好地變性。一般施加該Tc約1秒至5分鐘、更優選2秒至1分鐘并且最優選5秒至30秒。該過程重復幾次,往復于復性溫度(圖2B)和臨界溫度(圖2C)之間,每次選擇性地產生比單鏈形式序列更多的單鏈形式的突變序列。一旦循環保溫步驟結束,降低反應混合物的溫度,從而導致一個或多個引物與靶序列復性(圖2D)。這些引物隨后由聚合酶延伸,因而富集靶序列。該方法的所述步驟通常重復多個循環,旨在引起靶序列和參考序列充分擴增。在一個實施方案中,該方法的步驟重復5-40個循環并更優選地重復10-30個循環。最佳循環數可以由本領域普通技術人員確定。優選地,本發明方法在PCR裝置中進行,更優選地在實時反應條件下在實時檢測PCR裝置中進行。一旦靶序列的富集完成,樣品可以經歷其他方法處理。其他方法包括MALDI-T0F、HR解鏈法、雙脫氧測序、單分子測序、焦磷酸測序、RFLP、數字PCR和定量PCR。數字PCR可以與富集方法聯合用于超低水平突變的檢測中。在數字PCR中,將DNA樣品稀釋成單個分子,從而在每個PCR反應中起始材料是野生型或突變的。在源自相同起始材料的大量PCR反應后,分離并檢測突變分子。Fluidigm(SouthSanFrancisco,CA)出售多種基于數字PCR的系統,它們可以與本發明一起使用。因此,可以同時在數千個平行富集反應中從單個分子進行實時富集,從而允許鑒定源自突變DNA的PCR反應。這種系統特別用于檢測癌癥基因組中的超低突變。數字PCR與富集方法的組合可以類似地有益于單分子測序應用。核酸擴增反應在一個實施方案中,本發明方法中使用的核酸樣品包含具有靶序列和參考序列的基因組DNA。在另一個實施方案中,本發明方法的核酸樣品包含先前在核酸擴增反應中擴增的靶序列和參考序列。技術人員將理解存在可用于擴增核酸的眾多方法。最流行的方法可能是聚合酶鏈反應(PCR;例如見,美國專利號4,683,195和4,683,202,以及Saiki等人,Science2301350-1354(1985)和Gyllensten等人,PNAS(USA)85:7652_7656(1985))。PCR方法的優選變型是非對稱PCR(例如見Mao等人,Biotechniques27(4):674_678(1999);Lehbein等人,Electrophoresis19(8-9)1381-1384(1998);Lazaro等人,Molec.Cell.Probes6(5)=357-359(1992);和美國專利號6,197,499)。其他擴增方法包括,但不限于鏈置換擴增(SDA)(見,Walker等人,Nuc.AcidsRes.20(7)1691-1696(1992)以及美國專利號5,744,311,5,648,211和5,631,147)、滾環擴增(RCA)(見PCT公開WO97/19193)、基于核酸序列的擴增(NASBA)(見Compton,Nature350:91-92(1991);以及美國專利號5,409,818和5,554,527)、轉錄物介導的擴增(TMA)(見Kwoh等人,PNAS(USA)861173-1177(1989),以及美國專利號5,399,491),自持式序列復制(3SR)(見Guatelli等人,PNAS(USA)871874-1879(1990)和連接酶鏈反應(LCA)(見美國專利號5,427,930禾口5,792,607)。本發明方法使用改良的PCR。PCR如Mullis和Faloona,1987,MethodsEnzymol.,155335中所述進行,所述文獻通過引用的方式并入本文。聚合酶鏈反應(PCR)技術在美國專利號4,683,202,4,683,195和4,800,159中披露。在其最簡單形式下,PCR是使用與對立鏈雜交并分布于靶DNA中目的區域側翼的兩條寡核苷酸引物,用于酶合成特定DNA序列的體外方法。涉及模板變性、引物復性和復性引物由DNA聚合酶延伸的重復系列的反應步驟致其末端由所述引物5'末端定義的特定片段的指數式累積。據報道PCR能夠引起特定DNA序列選擇性富集達IO9倍。PCR方法也在Saiki等人,1985,Science2301350中描述。使用模板DNA(靶序列和參考序列)(至少Ifg;更有用地,Ι-lOOOng)和至少25pmol寡核苷酸引物進行PCR。常見反應混合物包括2μ1的DNA,25pmol寡核苷酸引物,2.5μ1的適合緩沖液,0.4μ1的1.25μMdNTP,2.5單位TaqDNA聚合酶(Stratagene)和去離子水至25μ1總體積。使用可編程熱循環儀進行PCR。根據實際的嚴格性要求調整PCR循環的每個步驟的長度和溫度以及循環數。復性溫度和時間由引物預期與模板復性的效率和待容忍的錯配程度二者決定。優化引物復性條件的嚴格性的能力完全在本領域中等技術人員的知識范圍內。使用30°C與72°C之間的復性溫度。模板分子的初始變性通常在92°C與99°C之間進行4分鐘,隨后是由變性(94-99°C,15秒至1分鐘)、復性(如上文所討論那樣確定的溫度;1-2分鐘)和延伸(72°C,1分鐘)組成的20-40個循環。終末延伸步驟通常在72°C實施4分鐘并且可以后續一個在4°C的無限(0-24小時)步驟。PCR使用核酸聚合酶或催化核苷酸三磷酸聚合的酶。通常,所述酶將在與靶序列復性的引物3'末端啟動合成并將在5'-方向沿模板前進。已知的DNA聚合酶包括例如大腸桿菌(E.coli)DNA聚合酶I、T7DNA聚合酶、嗜熱棲熱菌(Thermusthermophilus)(Tth)DNA聚合酶、嗜熱脂肪芽孢桿菌(Bacillusstearothermophilus)DNA聚合酶、ThermococcuslitoralisDNA聚合酶、水生棲熱菌(Thermusaquaticus)(Taq)DNA聚合酶和強烈熾熱球菌(Pyrococcusfuriosus)(Pfu)DNA聚合酶。術語“核酸聚合酶”也包括RNA聚合酶。如果核酸模板是RNA,則“核酸聚合酶”指RNA依賴性聚合活性,如逆轉錄酶。在本發明的方法中,PCR方法還包括關鍵變性步驟。這些方法在本文充分地描述并在圖1和圖2中說明。優選地,所述富集方法在PCR裝置中進行,更優選地在實時反應條件下在實時PCR裝置中進行。實時反應條件還使用核酸檢測試劑(例如染料或探針)旨在PCR產物產生時測量/檢測之。在一個實施方案中,所述富集方法以多重模式實施。多重PCR是在PCR反應中使用多于一個引物對來檢測多于一種靶序列時的PCR。多重PCR的目標是同時擴增多于一種靶序列并因而節省時間和使開支最小化。它能夠在一個運行中擴增多種靶序列。通常,多重PCR連同本發明一起使用旨在富集同時擴增的全部序列中的少數等位基因,如此設計引物,從而所得的PCR-擴增子全部共有大致相同的Tc(臨界變性溫度)。確定L和TcTm可以定義為這樣的溫度,在該溫度上雙鏈體核酸分子中的一半Watson-Crick堿基對被破壞或解離(即“解鏈”),而其余一半Watson-Crick堿基對仍完好處于雙鏈構象。“臨界溫度”、“臨界變性溫度”或“Tc”指低于參考序列Tm的溫度。施加Tc以選擇性地變性核酸樣品中雙鏈靶序列或靶序列/參考序列雙鏈的雙鏈體,從而導致擴增反應期間靶序列的選擇性富集。給定成對的核酸鏈的Tm指示鏈與鏈結合作用的穩定性并且取決于鏈的互補性、序列長度,GC含量、雙鏈區內部存在或不存在錯配和不太重要的其他因素,例如樣品的鹽濃度(Lewin,GenesV,第5章,OxfordUniversityPressandCellPress:NewYork,(1994)第109-126頁;SantaLucia,1998)。一般通過使樣品經歷溫度的持續增加并且連續測量雜交雙鏈體至單鏈的解離過程而實驗地確定解鏈點溫度。解離過程可以由眾多不同的方法檢測,例如通過UV吸光度轉變、雙鏈DNA結合染料的熒光、通過表面等離子共振或優選地通過熒光檢測。在后者情況下,雜交探針通常用熒光實體標記,并且熒光信號的產生或多或少取決于雜交雙鏈體的形成。Tm可以實驗決地確定或基于本領域普通技術人員已知的充分定義的方法進行估計。觀察和分析核酸變性躍遷的方法包括通過差異性掃描量熱法(DSC)在樣品變性時測量該樣品內部的熵改變(Kulinski等人,NucleicAcidsRes.19(9):2449_2455(1991);PanerφA,Biopolymers29:1715-1734(1990);VolkerφA,Biopolymers50:303-318(1999))、測量共價連接的成對熒光團的熒光(Vamosi和Clegg,Biochemistry3714300-14316(1998))和監測核酸增色度的改變(Haugland,“InVitroApplicationsforNucleicAcidStainsandProbes,,,在HandbookofFluorescentProbesandResearchChemicalss,第6版,MolecularProbesInc,EugeneOR(1996)第161-174頁)。雙鏈核酸的Tm值也可以通過監測與核酸組合的雙鏈DNA-特異性染料的熒光觀察到(Wittwer等人,1996)。雙鏈特異性染料是結合核酸的熒光團。一般,這些染料的熒光在結合至配對的核酸時增加(Wittwer等人,BioTechniques22:176-181(1997))。Ririe等人(1997)證實可以通過解鏈曲線分析,使用雙鏈核酸結合染料SYBRGreenI區分后期PCR產物。SYBRGreenI偏好地與雙鏈核酸結合(Haugland,1996)。用于確定雙鏈核酸Tm的其他合適染料包括SYBRGold、溴化乙啶、吖啶橙、碘化丙啶、PicoGreen、Hoechst33258、Hoechst33342、Hoechst34580、YO-PRO_1和YOYO_1。例如,MolecularProbes(Eugene,Oreg.)目錄第八版HandbookofFluorescentProbesandResearchProducts(2001年5月在CD-ROM上的;該文獻通過引用的方式并入本文)第8章列出可以在本發明中使用的許多染料。如技術人員將理解,任何雙鏈核酸結構的解鏈通常在限定溫度范圍內在巨大比例的相似核酸群中發生并且一般將在該核酸的大致Tm上具有解鏈峰(特別迅速的躍遷)。因而,熒光發射的此類變化峰可以用來計算雙鏈核酸的Tm。解鏈溫度譜可以通過-dF/dT對T作圖以圖示方式描述,其中dF是所測量熒光發射的的改變,dT是該核酸溫度的改變并且和T是該核酸的溫度。這種圖示將顯示熒光最迅速改變發生的溫度峰值,其指示解鏈溫度。用于確定雙鏈核酸Tm的其他方法是本領域已知的,包括在美國專利號7,226,736和6,030,115中描述的那些方法,所述每個專利因而通過引用的方式完整地并入。Tm可以從經驗等式預測。已知Tm依賴于形成互補堿基對(η)的核酸的序列的長度、該序列中的G和C含量、鹽濃度(μ)和樣品溶液中的變性劑(%FA),并且一般遵循經驗等式Tm=81.5+16.61og(y)+0.41(%GC)-500/n_0.61(%FA)。Tm可以通過眾多方法估計,例如按照Wetmurl991(Wetmur,J.G.1991.DNAprobes!applicationsoftheprinciplesofnucleicacidhybridization.CritRevBiochemMolBiol26:227_259,該文獻因而通過引用的方式并入)的最近鄰計算法和借助商用程序,所述商用程序包括01igOTMPrimerDesign和互聯網上可利用的程序。“臨界溫度”或“Tc”指低于參考序列“Tm”的溫度。施加Tc以先于參考/參考序列雙鏈體變偏好地性雙鏈的靶序列雙鏈體或靶序列/參考序列雙鏈的雙鏈體,從而導致擴增反應期間靶序列的選擇性富集。臨界溫度利用雙鏈靶序列或交叉雜交的靶_參考雙鏈DNA雙鏈體的更低Tm。當靶序列和參考序列交叉雜交時,沿著短(例如<200bp)雙鏈DNA序列任意位置處一個或更多單核苷酸錯配的微小序列差異將導致該序列解鏈溫度(Tm)的細微但可預測性改變(Lipsky,R.H.等人(2001)ClinChem,47,635-644;Liew,M.等人(2004)ClinChem,50,1156-1164)。取決于錯配的確切序列關系和位置,0.5-1.5°C的解鏈溫度改變對至多到200bp的序列是常見的。因而,靶-參考序列的復性因錯配將基本上具有比已知等位基因(例如參考序列)更低的Tm。至少部分地,本發明利用完全匹配序列與錯配序列之間的細微Tm差異。因為臨界變性在每個PCR循環中進行,故含有突變的等位基因的差異性富集以指數方式被激勵并導致循環結束時突變等位基因和野生型等位基因之間整體擴增效率的巨大差異。Tc低于參考序列1約.1-20°C。更優選地,Tc低于參考序列Tm約.1-15°C、·1-10°C、·1-9°C、·1-8°C、·1_7°C、·1_6°C、.2C_5°C、.3C—4.5°C、.4_4°C、.5—3.5°C、.5_3°C、·53C-、·52·5C-、·52C-、·51.5C-、·51C-。在一些實施方案中,Tc可以低于參考序列和靶序列的Tm。例如,在一個例子中,野生型序列的Tm是84°C并且突變序列的Tm是83.8°C。當使用快速形式的富集方法時,最佳Tc是83.5°C。在一些優選施方案,如此選擇Tc,從而它低于參考序列和全部可能靶序列的Tm。例如,在一個例子中,野生型序列的Tm是841并且在不同位置處突變(單點突變)的序列的、是83.8°C、83.7°C、83.9°C、83.6°C、83.75°C。當使用快速形式的富集方法時,最佳Tc是83.5"C。臨界變性溫度(Tc)是這樣的溫度,在所述溫度以下給定核酸序列的PCR效率劇烈下降。例如,如果PCR變性溫度設在87V,良好地擴增167bpp53序列,如果設在86.5°C,適度地擴增,并且如果PCR變性溫度設在86°C或更低,不產生可檢測的產物。如同Tm,給定序列的Tc可以實驗地或通過計算確定。為實驗地確定給定PCR產物的Tc,執行嵌入染料(LC-GREEN或SYBR-Green)存在下的實時解鏈曲線以獲得序列的平均解鏈溫度Tm(見關于確定Tm的上文)。低于Tm約0.5-1.5°C溫度通常是導致靶序列富集的適宜臨界變性溫度。也可通過確定DNA序列的ΔΤω估計Tc,其中所述ΔTm因(如在交叉雜交的靶-參考雙鏈體中會存在的)堿基對錯配所致。與完美參考/參考序列匹配相比,這種差異是從約.1°C至約12.5°C。因而,在一個實施方案中,Tc可以由等式Tc=Tm-ATm描述,其中Tm是參考/參考序列雙鏈體的解鏈溫度并且△Tm是因一個或更多堿基對錯配所致參考序列Tm的改變,其中所述堿基對錯配可以在靶/參考序列的交叉雜交期間形成。已經發現ATm取決于靶/參考序列雙鏈體的長度、取決于鳥嘌呤-胞嘧啶百分(%GC)含量并且還取決于雙鏈體中點突變或堿基對錯配的位置。例如,如果錯配位于雙鏈體的任意末端,ΔΤω通常將更低,一般在約.1°C至約8°C范圍內。例如,如果錯配位于雙鏈體的中央,ΔΤω通常相對較高,一般在約.2°C至約irC范圍內。ΔTm通常等于靶_參考交叉雜交雙鏈體中每個堿基錯配百分數約.5°C至約1.5°C。應當理解ΔTm將不僅根據雙鏈體的長度和突變位置變化,還將取決于序列的具體順序。因而,全部此類變化均在本公開的范圍內。本發明的核酸用于本發明中的核酸序列本發明提供富集核酸樣品中靶序列的方法并且也使用引物以擴增模板核酸序列。如本文中所用,術語“核酸”、“多核苷酸”和“寡核苷酸”指待檢測的引物、探針和寡聚物片段,并且上位于聚脫氧核糖核苷酸(含有2-脫氧-D-核糖)、聚核糖核苷酸(含有D-核糖)和任意其他類型的多核苷酸,所述多核苷酸是嘌呤或嘧啶堿基或修飾的嘌呤或嘧啶堿基(包含非堿性部位)的糖苷。在術語“核酸”、“多核苷酸”和“寡核苷酸”之間不存在詳細的有意區分,并且這些將互換使用。這些術語僅指分子的一級結構。因而,這些術語包括雙鏈和單鏈DNA,以及雙鏈和單鏈RNA。寡核苷酸實際上不從任何現存或天然序列物理地衍生,不過可以以任意方式產生,包括化學合成、DNA復制、逆轉錄或其組合。術語“寡核苷酸”或“核酸”意指基因組DNA或RNA、半合成或合成來源的cDNA的多核苷酸,所述多核苷酸因其合成來源或操作而(1)不與自然界中同該多核苷酸聯合的多核苷酸的全部或一部分聯合;和/或(2)連接至自然界中與該多核苷酸連接的多核苷酸不同的多核苷酸。在一個實施方案中,所述方法中使用的核酸含有修飾的核苷酸,從而增加參考/參考序列同雙鏈體與靶/參考序列異雙鏈體之間的變性溫度差異。此類修飾將增強靶序列的富集。可以在富集方法之前或期間摻入修飾或非天然的核苷酸。構思用于本發明方法中的修飾核苷酸包括二氨基_嘌呤類似物(例如2’-0-甲基-2,6-二氨基嘌呤)、尿嘧啶、肽核酸類似物、上述類似的生物素修飾類似物、上述類似的熒光團修飾的類似物、肌苷、7-去氮鳥嘌呤、2'-脫氧-2'-氟-β-D-阿拉伯糖核酸(2’F-ANA)核苷酸、鎖核酸(LNAs)、ENA2'-0,4'-C-乙烯-橋接核酸和其他。修飾的核苷酸可以摻入本發明的任意核酸,包括模板、引物和探針核酸。這些修飾可以增加匹配堿基與和錯配堿基之間的Tm差異并因而提高用本發明方法獲得的富集作用。例如,鎖核酸代表一類構象受限的核苷酸類似物,所述的核苷酸類似物例如在通過參考并入的WO99/14226中描述,提高核酸的解鏈溫度。在Koshkin,Α.Α.等人,Tetrahedron(1998),54:3607_3630)^PObika,S.等人,TetrahedronLett.(1998),395401-5404)中描述含有鎖核苷酸的寡核苷酸,所述兩份文獻通過引用的方式并入。鎖核苷酸導入寡核苷酸改善了針對互補序列的親和力并提高解鏈溫度達幾度(Braasch,D.Α.和D.R.Corey,Chem.Biol.(2001),8:1_7)。本發明可以用本領域已知的任意LNA(例如在WO99/14226和在LatorraD等人,2003.Hum.Mutat.22:79_85中披露的那些LNA)實施。互補性無需是完全的;穩定的雙鏈體可以含有錯配堿基對或不匹配的堿基。核酸
技術領域:
的技術人員可以在考慮眾多變量的情況下經驗地確定雙鏈體穩定性,所述變量例如包括寡核苷酸的長度,寡核苷酸的堿基組成和序列、離子強度和錯配堿基對的發生率。核酸雙鏈體的穩定性由解鏈溫度或“Tm”度量。本發明提供用于擴增模板核酸序列的寡核苷酸弓I物。術語“引物”可以指多于一種引物并且指這樣的寡核苷酸,無論天然存在(如純化的限制性消化產物中)或合成地產生,其中所述寡核苷酸處在催化互補于核酸鏈的引物延伸產物合成的條件下之時,能夠充當沿互補鏈合成的起始點。此類條件包括在適宜緩沖液(“緩沖液”包括作為輔因子或影響PH、離子強度等的取代基)中存在四種不同的脫氧核糖三磷酸核苷和聚合誘導劑如DNA聚合酶或逆轉錄酶和在適合的溫度上。為擴增中的最大效率,引物優選地是單鏈的。根據本發明有用的寡核苷酸引物是與模板核酸序列可雜交并引發核酸鏈的酶合成的單鏈DNA或RNA分子。引物互補于核酸分子匯集物中存在的一部分靶分子。構思通過化學合成或酶合成方法制備本發明的寡核苷酸引物。或者,這種分子或其片段是天然存在的,并從其天然來源分離或從供貨者處購買。寡核苷酸引物的長度是5至100個核苷酸,理想地是17至40個核苷酸,盡管不同長度的引物是有用的。用于擴增的引物優選地長約17-25個核苷酸。也通過解鏈溫度估計方法設計具有特定解鏈溫度(Tm)的根據本發明有用的引物。包括01igo、PrimerDesign和互聯網上可用的程序(包括Primer3和OligoCalculator)的商用程序可以用來計算根據本發明有用的核酸序列的Tm。優選地,根據本發明有用的擴增引物的Tm(如通過例如OligoCalculator計算)優選地在約45°C與65°C之間并更優選地在約50°C與60°C之間。一般,當兩個核酸序列在至少14至25個核苷酸區段范圍內基本上互補(在至少14至25個核苷酸區段范圍內至少約65%互補、優選至少約75%、優選至少約90%互補)時,選擇性雜交出現。見通過引用方式并入本文的Kanehisa,M.,1984,NucleicAcidsRes.12:203。因而,預計在引發部位處容忍某種程度的錯配。這種錯配可以是細微的,如單、二或三核苷酸。或者,錯配區域可以包括環,所述環定義為其中在4個或更多個核苷酸不間斷串聯中存在錯配的區域。在一個實施方案中,富集方法可以與肽核酸(PNA)引物組合使用,從而提高突變富集的靈敏度。PNA僅用來抑制野生型(參考)序列的擴增。在這個實施方案中,可以如此合成引物以區分靶(突變)序列和參考序列。基于PNA的引物以比結合突變序列的引物更高的熱穩定性和特異性識別并結合互補野生型序列。這不僅增加PNA引物-參考核酸與常規引物-靶核酸之的Tm差異,還防止基于PNA的引物被DNA聚合酶延伸,因而引起靶序列進一步富集。此類測定法是本領域已知的并且在Orum等人NucleicAcidsResearch,21(23)5332-5336(1993)中描述。可以在考慮這些的同時設計寡核苷酸弓I物并根據以下方法合成它們。寡核苷酸引物設計策略設計用于測序或PCR目的特定寡核苷酸引物涉及選擇這樣的序列,所述序列能夠識別靶序列,不過具有最少的預測二級結構。寡核苷酸序列可以僅結合于或可以不僅僅結合于靶核酸中的單個位點。另外,通過分析寡核苷酸的長度和GC含量優化該寡核苷酸的Tm。另外,當設計用于擴增基因組DNA的PCR引物時,所選引物序列不顯示與GenBank數據庫(或其他可用數據庫)中序列的明顯匹配。通過使用輕易可用的計算機程序促進設計根據本發明有用的引物,其中開發所述計算機程序以輔助評價上文所述的幾個參數并優化引物序列。此類程序的例子是DNAStar軟件包(DNAStar,Inc.;Madison,WI)的“PrimerSelect”、OLIGO4.0(NationalBiosciences,Inc.)、PRIMER、OligonucleotideSelectionProgram、PGEN禾口Amplify(在Ausubel等人,1995,ShortProtocolsinMolecularBiology,3版,JohnWiley&Sons中描述)O在優選施方案中,如此設計本發明的引物,從而其具有低于靶/參考序列交叉雜交步驟期間所施加溫度的Tm。因而,在這個實施方案中,引物在這個雜交步驟期間不與靶序列或參考序列復性(見圖1)。在一個實施方案中,引物的Tm在交叉雜交復性步驟溫度以下5-10°C。^^使用本領域也熟知的技術合成引物本身。用于制備具有特定序列的寡核苷酸的方法是本領域已知的,并且包括例如克隆和限制酶消化分析適宜序列和直接化學合成。一旦設計,則使用商用自動化寡核苷酸合成儀(市售)或VLSIPS技術,通過合適的化學合成方法(包括例如Narang等人,1979,MethodsinEnzymology,68:90描述的磷酸三酯法、Brown等人,1979,MethodsinEnzymology,68109描述的磷酸二酯法、在Beaucage等人,1981,TetrahedronLetters,221859中披露的二乙基焦磷酰胺法和在美國專利號4,458,066中披露的固體支持物法)或通過其他化學方法制備寡核苷酸。引物也可以用修飾的核酸通過本領域熟知的方法合成。MM如本文中所用,“樣品”指任意物質,其含有或假定含有目的核酸(靶序列和參考序列)或本身是含有或假定含有目的核酸的核酸。術語“樣品”因而包括核酸(基因組DNA、cDNA、RNA)、細胞、生物、組織、流體或物質(其包括但不限于例如血漿、血清、腦脊液、淋巴液、滑膜液、尿、淚、糞便)、皮膚、呼吸道、腸道生殖道的外分泌物、唾液、血液細胞、腫瘤、器官、組織的樣品、體外細胞培養物成分的樣品、天然分離物(如飲用水、海水、固體材料)、微生物標本和已經用核酸示蹤分子“標記”的物體或標本。本發明的核酸序列可以從基因組DNA擴增。基因組DNA可以根據以下方法從組織或細胞分離。或者,本發明的核酸序列可以通過本領域熟知的方法從血液分離。分離特定組織以促進從該組織檢測基因的變異形式。為從哺乳動物組織分離基因組DNA,將組織切碎并冷凍于液氮中。冷凍的組織用預冷的研缽研磨成細粉并且以每IOOmg組織1.2ml消化緩沖液懸浮于消化緩沖液(IOOmMNaCl,IOmMTris-HCl,pH8.0,25mMEDTA,pH8.0,0.5%(w/v)SDS,0.lmg/ml蛋白酶K)。為從哺乳動物組織培養細胞分離基因組DNA,將細胞通過以500xg離心5分鐘沉淀,重懸于I-IOml冰冷的PBS中,以500xg離心5分鐘再沉淀并重懸于1體積的消化緩沖液中。消化緩沖液中的樣品在50°C保溫(伴以振蕩)12-18小時,并隨后用等體積的酚/氯仿/異戊醇提取。如果離心步驟(1700Xg,10分鐘)后相沒有分離,添加另一個體積的消化緩沖液(無蛋白酶K)并重復離心步驟。如果在兩相的界面處濃稠白色物質明顯,則重復有機物提取步驟。在提取上層相后,將水層轉移至一個新管內,向其中添加1/2體積的7.5M乙酸銨和2體積的100%乙醇。核酸通過1700Xg上離心2分鐘沉淀、用70%乙醇洗滌、空氣干燥并以lmg/ml重懸于TE緩沖液(IOmMTris-HCl,pH8.0,ImMEDTA,pH8.0)中。通過在37°C在0.1%SDS和1μg/ml無DNA酶的RNA酶存在保溫樣品1小時并重復提取和乙醇沉淀步驟,除去殘余RNA。根據該方法的基因組DNA的產率預計是大約2mgDNA/lg細胞或組織(上文的Ausubel等人)。按照該方法分離的基因組DNA可以根據本發明使用。也可以從全血提取靶DNA。例如,血液可以通過標準方法抽至收集管,優選地包含硅化玻璃,所述收集管不含抗凝劑以制備血清,或含有EDTA、檸檬酸鈉、肝素或相似的抗凝齊IJ,最優選地含有EDTA,以制備血漿。盡管并非絕對要求,優選方法是血漿或血清應當從全血分離。血漿或血清可以通過離心、優選以300至800Xg溫和離心5至10分鐘從全血分離。因為肝素可能干擾PCR,故肝素化血液的使用可能要求用肝素酶預處理。因而,EDTA是血液標本的優選抗凝劑。可以在本發明方法使用新鮮收集的血漿或血清或冷凍(貯存的)并隨后融化的血漿或血清。貯存的血漿或血清應當保持在_20°C至_70°C,而新鮮收集的血漿或血清保持冷藏或維持在冰上直至使用。DNA可以隨后通過本領域熟知的方法以及本文所述那些方法提取。診斷測定法本發明提供用于從患者樣品富集靶序列以診斷、檢測、監測、評價或治療疾病、尤其動物或人類中腫瘤疾病或增生性疾病的方法。在優選施方案中,核酸從編碼腫瘤基因或其他腫瘤相關DNA的核酸衍生。靶序列的偏好性富集允許進一步分析或操作DNA。例如,可以分析富集的等位基因以定義從中衍生所述DNA的細胞的特征。根據想要的信息,可以幾種方法中任意方法,包括核酸測序、RFLP、數字PCR、光譜法(包括質子NMR光譜法)、生物化學分析和免疫分析。在一個實施方案中,擴增的DNA通過從瓊脂糖凝膠切下突變DNA條帶進行分離、再擴增、克隆至質粒載體例如PGEM-T載體質粒(Promega)并使用商業試劑盒如Sequenase2.0(USB)測序。定義靶DNA特征并因而定義例如腫瘤的分析法提供了廣泛的臨床用途,包括描述、表征或對細胞(例如腫瘤)(無論已知或隱匿)分類,如通過組織源、通過類型(如惡變前或惡變)、表型和基因型并通過描述或表征腫瘤特征、生理學和生物化學,從而獲得對腫瘤侵襲力、轉移嗜好和針對多種療法的敏感性或耐受性的理解,因而允許預測針對現行或計劃療法的反應,并進一步允許評價預后。靶DNA特征與先前活組織檢查或手術標本的比較允許與該標本相比進一步評價腫瘤不均一性或相似性并因而評價腫瘤復發。在靶序列的選擇性富集后,也可以從該DNA轉錄或制造互補性核糖核酸(RNA)。在優選的施方案中,通過在擴增反應中使用帶RNA聚合酶啟動子區的引物進行RNA的轉錄,其中所述RNA聚合酶啟動子連接于針對目的DNA的標準引物序列(步驟3)。隨后從連接的啟動子區轉錄與該DNA互補的RNA。在備選方法中,將擴增的等位基因DNA克隆至表達載體,并轉錄與該DNA互補的RNA。另外,作為任選的優選施方案,在體外翻譯反應中使用互補性RNA來生產腫瘤相關或腫瘤特異性蛋白質。等位基因表征、腫瘤衍生或腫瘤相關性DNA的擴增及互補性RNA的表征、轉錄以及翻譯成腫瘤相關或腫瘤特異性蛋白提供在確定療法和開發腫瘤特異性療法中的重要用途。胞外DNA的測序或互補性RNA的轉錄允許確定或開發反義化合物,包括對胞外DNA適度特異的合成性寡核苷酸和其他反義構建體,如通過構建表達質粒,如通過調整Aoki等人(1995,CancerRes.55=38103816)的方法。類似地,定義腫瘤特征允許確定特異性單克隆抗體或對擴增的DNA適度特異的疫苗療法。相應免疫原性蛋白質的生產可以用于開發腫瘤特異性單克隆抗體。類似地,翻譯的蛋白質可以用于腫瘤特異性疫苗開發。特別有價值的是本發明允許開發和應用這些腫瘤-特異性療法或診斷法,甚至僅存在惡變前腫瘤、早期癌癥或隱匿癌癥時也是如此。因而,在腫瘤負荷低、免疫功能相對完好并且患者未受損害(這些均提高治愈的可能性)時,本發明允許治療性介入。對所富集序列的其他處理本發明方法與MALDI-T0F、高分辨率解鏈或單分子測序的組合將應對突變檢測中3種截然不同的需要快速檢測已知或可疑與臨床結果相關的體細胞突變(MALDI-T0F);對各份患者樣品快速掃描未知體細胞突變(HR-解鏈)、隨后對少數外顯子選擇性測序和對‘苛刻樣品’(來自具有不均一性、基質污染或體液的腫瘤中的樣品)中多種基因的海量平行測序(單分子測序,SMS),在所述樣品中臨床相關突變可以處于0.5-5%水平。質譜法在一個實施方案中,使富集的靶序列經歷MALDI-T0F測序。質譜法(MS)已經形成DNA測序中的一種有力工具。質譜計產生可在飛摩爾和納摩爾范圍內以秒或分鐘獲得的直接質量量值(dirctmassmeasurement)。基質輔助解吸電離(MALDI)時間飛行(TOF)MS已經成功地用于快速DNA測序和有效確定DNA分子大小。MALDI-TOFMS的出現已經使電離完好巨大的DNA分子和測量其質荷比更容易。500核苷酸(nt)長度的單鏈和雙鏈聚合酶鏈反應(PCR)產物已經由MALDI-TOFMS檢測。使用減少DNA片段化的優化基質激光組合,已經以精度士0.5-1%報道了合成性DNA、質粒DNA的限制酶片段和大小至多到2180nt的RNA轉錄物的紅外MALDI質譜。雖然已經通過MALDI-TOFMS檢測了大的寡聚物,不過通常認為現在慣例至多到100聚物。對于幾種基因而言,臨床重要的突變并不在基因組中隨機出現(例如在大部分已知腫瘤基因中出現的增加功能的點突變)。相反,影響相對少數密碼子的改變往往是大部分體細胞突變的原因。則原則上,有限數目的審慎設計的遺傳測定法應當有效地探查巨大比例的臨床相關突變。例如,Garraway及同事(Thomas,R.K.等人(2007)NatGenet,39,347-351)證實RAS、EGFR和BRAF中每個基因16-44個MALDI-TOF測定法捕獲了人惡性腫瘤中迄今對這些基因觀察到的90%-99%突變優勢。因而,提出高通量基因分型可能提供大規模檢測臨床標本中關鍵和/或’可靶向’癌癥突變的有效手段。MALDI-T0F理想地適用于檢測非異質性腫瘤樣品中先前鑒定的突變。然而,盡管關于MALDI-TOF對種系突變或SNP-鑒定的可靠性沒有疑問,然而在檢測體細胞突變方面的經驗是相對新近的。因而,當使用具有<10%突變細胞的異質性樣品(例如胰腺癌、肺癌或前列腺癌)或當準備篩選來自體液的DNA時,MALDI-T0F的可靠性大幅度降低。通過改善靈敏度,本發明的富集方法能夠使MALDI-T0F檢測低水平體細胞突變并還將提供對主流外科腫瘤樣品篩選法為必需的所要求的可靠性。高分辨率解鏈法在另一個實施方案中,使富集的靶序列經歷高分辨率解鏈法。通過突變掃描法而非個體突變基因分型法更容易篩選沿外顯子在眾多位置處含有臨床相關突變的基因,如p53。HR-解鏈法是最近幾年引入的高通量突變掃描技術,具有發現SNP或種系突變的出色能力(Chou,L.S.等人(2005);AmJClinPathol,124,330-338;ffittwer,C.Τ.等人(2003);ClinChem,49,853-860;Reed,G.H.和Wittwer,C.Τ·(2004);ClinChem,50,1748-1754)。在嵌入熒光染料(LCGreen或Sybr-Green)存在下PCR擴增目的基因組區域后,不做任何擴增后處理,即刻通過仔細的解鏈曲線分析和與野生型的比較實時鑒定突變的存在。此外,高分辨率解鏈解鏈分析在使用常規方法時所要求的一部分時間內同時實現基因掃描和突變基因分型(即SNP鑒定),與此同時維持管封閉環境。PCR需要<30分鐘(毛細管)或1.5小時(96-孔或384-孔平板)而解鏈搜索花費每只毛細管1-2分鐘或或每平板5分鐘。然而,如同MALDI-T0F,使用HR-解鏈法的優勢不能對低于大約20%突變體-對-野生型比率的體細胞突變外推,因而不能借助HR-解鏈法可靠地篩選幾個類型的臨床樣品。通過提高檢測限,本發明能夠將HR-解鏈法的便利性和高通量應用于主流外科腫瘤樣品篩選法并且還用于檢測具有基質污染的‘苛刻’臨床樣品或來自體液的DNA中的低水平體細胞突變。單分子測序在另一個實施方案中,使富集的靶序列經歷單分子測序法(Thomas,R.K.等人(2006);NatMed,12,852-855)。單分子測序法的能力也會得益于本發明的并入。例如對于患者樣品中的突變篩選,在啟動第二輪測序前仍需要在常規PCR儀中從基因組DNA中PCR擴增所選的外顯子。另外,檢測臨床樣品中在1-5%突變體-對-野生型比率水平上的突變要求對眾多‘個體事件’重復測序,以獲得可接受的統計值。這最終降低通量能力,并且對于1%水平上的突變,如果所述突變居優勢,僅可以同時篩選10-20個序列,如與大約4,000個序列形成對比(per454LifeSciences,TechnicalService)。通過在單分子測序之前開展本發明,突變的優勢作為總體數目或等位基因的一部分將提高1-2個數量級,因而提高單分子測序法的通量至同等程度。在一個實施方案中,在單分子測序反應的內部乳化階段期間應用選擇性富集方法。在這個實施方案中,使富集的靶序列經歷焦磷酸測序法。引物延伸在另一個實施方案中,使富集的靶序列經歷引物延伸測序反應。在引物延伸中,使用寡核苷酸來相對于序列已知的核酸評估序列中該序列預定位置處的變異。提供作為單鏈分子的樣品寡核苷酸,該單鏈分子與誘導劑、標記的核苷酸和引物混合以形式混合物,其中所述引物具有與分布在預定位置側翼的區域相同的序列,所述混合物基本上缺少由以下堿基構成的核苷酸,所述堿基不同于構成標記核苷酸的堿基。隨后使該混合物經歷這樣的條件,所述條件引起引物與單鏈分子復性并形成摻入標記核苷酸的引物延伸產物,并且對該混合物分析含有標記核苷酸的引物延伸產物的存在性(美國專利號5,846,710)。緩沖液構思在本發明擴增方法中包含有機溶劑以增加錯配和匹配雙鏈體之間的Tm差異。某些有機溶劑的包含可以改善靶序列的富集。例如,包含有機溶劑可以增加參考DNA序列和靶序列之間的變性溫度差異并因而輔助偏好地擴增靶序列。有機溶劑如DMS0、甲酰胺、甜菜堿或甘油(Pomp,D.和Medrano,J.F.,Biotechniques,10,58-59(1991))可以增加錯配(參考/參考)序列與匹配(靶/參考)序列之間的Tm差異。因此,由于本發明的中間雜交步驟(交叉_雜交)形成含有錯配的靶-參考序列,故有利的是包含有機溶劑至它們不抑制聚合酶作用的程度。因而,在一些實施方案中,反應混合物以1-10%體積對體積或優選3-8%體積對體積或最優5-6%體積對體積的水平補充有DMS0、甲酰胺、甜菜堿、甘油或其組合。實施例8說明DMSO在富集方法中的用途。使用有機溶劑的另一個實踐優勢是對給定序列適宜的Tc在反應中使用有機溶劑時改變。因而,在DMSO不存在下,序列的Tc是83.5°C,在3%DMS0存在下,該Tc是80.5°C。因而,通過添加不同量的DMSO或其他溶劑至不同序列,可以確保Tc對于全部序列是相同的。這對于單個PCR儀運行中針對多種序列進行眾多富集反應是有用的,因為變性溫度隨后對全部序列是相同的。實施例實施例1.用于富集靶序列的材料與方法用于確認COLD-PCR的序列為確認本發明,使用一系列在p53外顯子8和Kras外顯子2(密碼子12-13)的不同位置含有突變的基因組DNA和細胞系(圖3)。p53外顯子8突變與肺癌中的不良預后相關并且是癌癥患者血漿中的低優勢突變。類似地,Kras突變在肺腺癌中具有預后意義。富集方法和引物PCR在0.IXLC-Green嵌入染料存在下并按照實時方式在Cepheid儀進行。PCR的實時追蹤并非必需但是方便,因而將其用于全部實驗。對于167bp的p53序列,正常PCR首先進行10個循環旨在產生用于富集方法中的足夠產物。C印heid儀用以下循環參數編程95°C,120秒;(95°C,15秒/55°C熒光讀出ON,30秒/72°C,1分鐘延伸)X10個循環。所得PCR產物隨后11000稀釋并進行以下富集方法處理,所述富集方法也在圖1中說明。95°C,15秒;70°C,120秒;在Tc=86.5°C變性3秒;55°C熒光讀出ON持續30秒;隨后72°C,1分鐘延伸,30個循環。為制備用于Sanger雙脫氧測序法的PCR產物,所述產物用核酸外切酶I和Shrimp堿性磷酸酶處理。以下引物用于所述測序方法中167bp片段5'-GCTTCTCTTTTCCTATCCTG-3'正向;5'-CTTACCTCGCTTAGTGCT-3'反向;對于87bp和210bp的p53片段和135bp的Kras片段,富集方法如上文所述,不過臨界變性溫度分別設在Tc=83.5,87.5和80°C。用于所述測序方法中的引物是5'-TGGTAATCTACTGGGACG—3'正向;5,CGGAGATTCTCTTCCTCT-3'反向(87bpp53外顯子8片段)5'-GCTTCTCTTTTCCTATCCTG-3'正向;5,-TAACTGCACCCTTGGTC-3'反向(210bpp53外顯子8片段)5,-AACTTGTGGTAGTTGGACCT-3,正向;5,-CTCTATTGTTGGATCATATT-3,反向(Kras外顯子2片段)。在3-6個獨立實驗中檢驗全部富集方法的重復性。MMp53外顯子8突變當使用臨界變性溫度Tc=86.5°C的富集方法應用于167bp外顯子8片段時,富集對于所測試的全部突變是明顯的。圖4描述各自結果。例如,在該富集方法后,如通過觀察測序圖色譜圖估計,來自HCC細胞的野生型細胞中初始稀釋降至5%突變體-對-野生型比率的DNA變為約70%突變體-對-野生型比率(即富集達大約14倍)。類似地,在該富集方法后,富集來自SW480細胞(在密碼子273處的純合G>A突變)的10倍稀釋至野生型的DNA達大約7倍。還觀察到CT7樣品(雜合C>A突變)富集達大約12倍并且MDA-MB231樣品((雜合C>T突變)富集達大約6倍。借助富集方法擴增的野生型P53樣品顯示無突變(圖4)。如圖2中所列出,在對于167bp片段研究的全部p53突變范圍內,富集作用變化達5-14倍。富集過程提高含有突變的全部序列的優勢,無論突變在何處。Kras密碼子12/13突變圖5說明來自Kras的135bp片段的結果。所述結果與94°C變性溫度上進行的常規巢式PCR比較并且隨后進行Sanger測序。圖5說明使用Sanger測序,可以明白無誤地檢測到低至3%突變體-對-野生型的突變。實施例2臨床樣品的Sanger測序為使用本發明分析臨床樣品,使先前按照常規PCR測序的20份結腸腫瘤臨床樣品和肺腺癌臨床樣品經歷如實施例1中所述的富集方法和sanger測序。結果顯示借助常規PCR-Sanger測序所鑒定的全部突變也通過所述富集方法、隨后測序而鑒定到。然而,所述富集方法還鑒定到常規測序錯過的突變。圖描述了2臨床樣品TL64和CT20,其中通過p53外顯子8密碼子273的所述富集方法-Sanger測序檢測到低優勢G>A突變,不過所述突變沒有通過測序隨后常規PCR法檢測到。使用基于RFLP的測序法實施突變存在性的獨立驗證。此外,在源自結腸癌癥患者的血漿_循環DNA中通過所述富集方法-Sanger測序法檢測到P53外顯子8(G>A)突變,而通過常規PCR-Sanger測序法沒有檢測到此突變。其次,使用從福爾馬林固定(FFPE)的標本獲得的DNA,也揭示被常規測序法錯過的p53(C>Τ)突變,其中所述標本從非細胞肺癌癥患者(NSCLC)獲得(圖6)。圖6中的底部色譜圖顯示從一位NSCLC患者獲得的另一份FFPE樣品中Kras密碼子12突變的檢測結果。隨后通過RFLP方法獨立地從基因組DNA驗證由所述富集方法鑒定的突變。因而,使用COLD-PCR-測序法,被常規PCR-測序法錯過的相關突變輕易變得可檢測。實施例3._可以在無錯配復性步驟下富集降低L的突變當變性溫度設在臨界溫度(Tc)時,PCR對核苷酸序列的依賴性如此明顯,從而甚至PCR期間不形成錯配的情況下,存在降低Tm的那些突變的富集。因而,當G和A等位基因存在時,A-等位基因將在COLD-PCR期間富集,因為這降低該等位基因的Tm。為證實這一點并且也為檢驗富集過程對所檢驗序列的大小的依賴性,檢驗了含有與P53外顯子8的167bp片段相同的突變的87bp片段和210bp片段(圖3)。如同167bp片段那樣,通過巢式PCR、隨后借助所述富集方法從初始P53外顯子8擴增子擴增這兩個片段。然而,在這種情況下,使用實施例1的擴增方案的縮短形式,不過省去在70°C的錯配形成步驟以及94°C步驟(對于87bp片段,臨界變性溫度Tc=83.5°C并且對于210bp片段,Tc=87.5°C)。因而,在這種形式的富集方法中,PCR僅在臨界變性溫度(Tc)、引物結合步驟(例如55°C)和引物合成步驟(例如72°C)之間循環。圖7A顯示87bp片段的測序色譜圖(根據突變存在87bp序列上哪個地點,進行正向測序或反向測序)。數據顯示使用這種形式的改良富集方法,20-50倍富集87bp片段。例如,在所述富集即大約50倍富集后,SW480DNA的突變體-對-野生型DNA的初始稀釋產生50%突變體-對-野生型。隨后的Sanger測序揭示出‘雜合’序列。在圖7B中描述大小對借助所述縮略富集方法的富集作用的影響。該數據說明富集作用對<IOObp的片段最高,不過對于至多到210bp的片段仍明顯(大約8-10倍)。實施例4-雖然各種癌樣品中遇到的大部分(大約70%)突變降低Tm,然而大約15%的突變提高τω(例如A>G)而大約15%的突變持平Tm(例如G>C)。為能夠富集全部可能的突變,包括G>A和A>G突變和缺失,優選完整的富集程序(圖1)。為展示能夠富集具有提高或降低Tm的突變的靶序列,借助圖1的富集方法擴增具有C或T核苷酸(野生型對HCC細胞系)的167bpp53外顯子8片段。形成兩種混合物,一種混合物少量地具有C等位基因(CT110)并且另一種混合物少量地具有T等位基因(TC110)。在所述富集方法或備選地在常規PCR后,將產物測序。在兩種情況下,均富集少數的等位基因即C或T,這取決于哪種等位基因在擴增前更稀少。假定地,錯配的序列具有比C或T等位基因更低的解鏈溫度,因而通過進行圖1的方案,錯配d序列總是被偏好地變性。因此,通過富集方法期間在中間溫度(大約70°C)形成錯配,總是存在少數等位基因的富集,即便特定核苷酸改變趨向于提高局部Tm。實施例5-MALDI-T0F測序本發明也期望改善大部分其他基于PCR的技術,包括用于體細胞突變檢測的MALDI-T0F。為證實這點,使用實施例1中用于Sanger測序的相同模式來比較富集方法對常規PCR之后的MALDI-T0F,其中所述Sanger測序旨在使用野生型樣品內含有突變的細胞系的連續稀釋物鑒定具體P53外顯子8突變。在所述富集方法或常規PCR后,通過在37°C與0.3Ushrimp堿性磷酸酶(USB)保溫20分鐘隨后在85°C保溫5分鐘以失活該酶而從反應除去過量dNTP。在SNP或插入/缺失范圍內的單引物延伸以終濃度600nM每種延伸引物、50μMd/ddNTP和0.126U熱測序酶(Thermosequenase)(SolisBiodyne)進行并在94°C保溫2分鐘,隨后45個下述循環94°C,5秒;52°C,5秒和72°C,5秒。所用的延伸引物由MALDI-TOFHarvardCoreFacility使用MassArrayAssayDesign軟件3.1.2.2版對所研究的每種p53突變設計。針對每種突變所用的引物是p53_sw480CAGGACAGGCACAAACA;p53_CT7:AGGACAGGCACAAACAC;p53_DU145:ACAGCTTTGAGGTGCGT;KRAS_SW480:TGTGGTAGTTGGACCTG;KRAS_A549:ACTCTTGCCTACGCCAC。隨后通過添加陽離子交換樹脂,隨后混合并離心以沉淀管內容物而將反應物脫鹽。將延伸產物點樣于384孔光譜CHIP,隨后MALDI-T0F質譜儀(Sequenom)上運行。結果在表I中顯示。在表I的第三列中列出突變富集倍數。通過與使用常規PCRMALDI-T0F時獲得的值比較來計算富集作用。對于大部分所研究的突變,獲得10-60富集倍數。當突變體-對-野生型降低時,富集作用增加,這表明富集倍數對突變初始濃度的非線性依賴性。表IPS3突變顯示了多種P53外顯子8突變的%突變或野生型等位基因__MALDI-TOF結果__pS3外顯子8突變=14484G>A___富集-PCR_篩選的細胞系稀釋物_%A突變體%G野生型富集_SW480-野生型比率1:5常規PCR_15_85__SW480-野生型比率1:10常規PCR_5(質譜檢測限)95__SW480-野生型比率1:33常規PCR_O_100__SW480-野生型比率1:10CO.L.D-PCR45_55_-9_SW480-野生型比率1:100CO.L.D-PCR33_67_>10_SW480-野生型比率1:300CO.L.D-PCR31_69_>30_僅野生型,CO.L.D-PCR_0_100_%_MALDI-TOF結果__p53外顯子8突變=14483C>T___CO丄.D-PCR篩選的細胞系稀釋物_%T突變體%C野生型富集_CT7-野生型比率1:5常規PCR_28_72_N/A_CT7-野生型比率1:10常規PCR_18_82_N/A_CT7-野生型比率1:33常規PCR_5(質譜檢測限)95_NM._CT7-野生型比率1:100CO.L.D-PCR45_54_-18_CT7-野生型比率1:200CO.L.D-PCR28_72_-40_CT7-野生型比率1:300CO.L.D-PCR27_73_-60_僅野生型,CO.L.D-PCR_0_100_%_MALDI-TOF結果__p53外顯子8突變=14486G>T__CO.L.D-FCR篩選的細胞系稀釋物_%G突變體%T野生型富集_DU145-野生型比率1:5常規PCR_28_72_NTA_DU145-野生型比率1:10常規PCR_18_82_Ν/Α_DU145-野生型比率1:33常規PCR_0_100_NM._<table>tableseeoriginaldocumentpage33</column></row><table>富集-PCR-MALDI-TOF與常規-PCR-MALDI-TOF的比較。在最末列中列出獲得的突變富集。實施例6-比較基于TAQMAN的常規實時PCR和基于富集的實時PCR進行核酸擴增反應以比較常規實時下的TAQMAN探針測定法和基于富集的實時PCR0比較這兩種實時檢測方法,在野生型序列中的多種稀釋度上分析具有p53外顯子8內G>A突變的基因組DNA和臨床腫瘤樣品。將源自SW480的基因組DNA連續稀釋(13、110、130、1100禾Pl300)至野生型DNA中。具體地,在0.2μΜTaqman探針5,-6-Fam-TTTGAGGTGCATGTTTGTGCC-BHQ_1_3,存在下,在20ng基因組DNA上直接進行實時PCR反應,其中所述Taqman探針完全匹配源自SW480細胞的DNA上含有p53突變的序列。其他試劑的終濃度是1XGoTaqFlexi緩沖液(Promega),1XGoTaq聚合酶(Promega)O.2mM各種dNTP,0.2μΜ正向引物,5'-TGGTAATCTACTGGGACG-3',Ο.2μΜ反向引物,5,-CGGAGATTCTCTTCCTCT-3‘,MgCl23mM,加DNA。PCR擴增子的大小是87bp并且Tc=83.5°C。快速COLD-PCR循環是95°C,120秒;(95°C,15秒;58°C熒光讀數0N,60秒)X25個循環;(83.50C15秒;58°C熒光讀數0N,60秒)X25個循環。對于常規PCR循環,使用相同程序,不過變性溫度在整個PCR期間是95°C。在獨立實驗中重復實驗至少5次。在圖8A和8B中描述擴增曲線,所述擴增曲線說明當應用于源自結腸癌癥細胞系SW480的基因組DNA時常規和富集實時PCR的靈敏度。圖8B證實富集實時PCR可以在1300突變體對野生型等位基因比率上檢測突變的存在。相反,在除Tc步驟之外完全相同的條件下實施的常規實時PCR僅可以在110最大稀釋度上檢測突變體(圖8A)。因而,使用富集方法,該測定法的靈敏度更好30倍。在圖8C和8D中說明具有p53外顯子8突變的臨床腫瘤樣品(已知所述臨床樣品之一含有在P53外顯子8中的一個低水平突變(5%突變體對野生型)CT20)中常規和富集實時PCR的靈敏度的擴增曲線。富集實時PCR輕易地能夠檢測突變(圖8D),而常規PCR不能(圖8C)。已知為野生型樣品的剩余樣品(TL6、TL8和TL18)在相同條件下不擴增(圖8C)。實施例7-借助富集實時PCR的突變掃描產生核酸擴增反應混合物以比較使用DNA檢測染料的常規和富集實時PCR檢測沿P53外顯子8任意位置含有突變的樣品的能力。該方法提供了鑒定未知突變或雜合SNP的快速且便利方法。因而,本發明方法可以由本領域普通技術人員采用以掃描大量基因的種系或體細胞突變用于各種不同的用途(例如在具有發生乳腺/卵巢CA的高風險的群體中掃描BRCA1/2突變,掃描完整遺傳突進以鑒定突變等)。圖9A和9B說明擴增曲線,所述擴增曲線比較在已知含有p53外顯子8內突變的多種細胞系和臨床樣品中使用LC-Green染料的常規和富集實時PCR。數據表明實時常規PCR(圖9A)不能區別突變體(SW480、TL6和CT20)和野生型(R27、TL8、TL18、TL81和TL82)樣品,而富集實時PCR能夠區分(圖9B)。富集方法對于含有突變的樣品提供比野生型樣品更早的閾值檢測。圖9C和9D說明來自與圖9A和9B中所述完全相同的反應條件下制備的擴增反應中的結果,不過所述樣品全部是肺腫瘤。數據表明實時常規PCR(圖9C)不能區別突變樣品和野生型樣品,而富集實時PCR能夠區分(圖9D)。富集方法對于含有突變的樣品提供比野生型樣品更早的閾值檢測。另外,富集檢測方法能夠鑒定樣品TL6中先前未知的C>T突變。實施例8-有機溶齊時曾力D常規,禾Π曾強型實時PCR其月丨旬突變的富集制備核酸擴增反應混合物以評估有機溶劑對常規和富集實時PCR的影響。反應在有機溶劑有機溶劑(3%DMS0)存在或不存在下進行。所用方法與如實施例7中所述和在圖9C和9D中所繪那樣相同,除了添加3%DMSO之外。有機溶劑的存在增強含有突變序列的樣品與含有野生型序列的那些樣品的擴增曲線之間的區分(圖10)。例如,野生型樣品和突變體樣品之間閾值差異從大約5個循環(無DMSO的實時富集,見圖9A)增加至超過10個循環(有DMSO的實時富集,見圖10A)。實施例9-使用與富集PCR組合的RFLP檢測超低水平突變與RFLP-PCR組合的富集PCR可以用與改善超低水平突變的鑒定,例如用于在極早階段即治療前鑒定癌癥基因組中的隨機突變或癌樣品中的抗性突變。例如,用TaqI酶選擇性地消化含有野生型EGFR外顯子19的樣品。隨后使至多到110,000突變體-對-基因組DNA的稀釋物以富集模式(Tc=81.5或81°C)或以常規PCR模式(95°C經歷PCR處理。突變的富集作用由TaqI消化隨后dHPLC量化(圖11)。存在的突變的量通過在約7min停留時間上獨立突變峰的存在進行量化。在富集方法后,突變峰比常規PCR后明顯得多。總之,富集方法明顯地改善借助RFLP-PCR所鑒定的極低水平突變的檢測。本文中引用的全部專利、專利申請和公開的參考文獻因而通過引用的方式完整并入。盡管已經參考本發明的優選實例實施方案具體地顯示和描述了本發明,本領域技術人員會理解可以在其中進行形式和細節方面的多種改變而不脫離由所附權利要求書包括的本發明范圍。權利要求用于富集靶序列的方法,所述方法包括a.使可疑具有所述靶序列和參考序列的反應混合物經歷高于參考序列解鏈溫度(Tm)的第一變性溫度,從而允許所述靶序列和所述參考序列變性,其中所述靶序列至少50%同源于所述參考序列并且是可通過與所述參考序列相同的引物對擴增的;b.降低擴增反應混合物的溫度,從而允許靶鏈/參考鏈雙鏈體的形成;c.使所述擴增反應混合物經歷低于所述參考序列Tm的臨界溫度(Tc),從而允許步驟(b)的所述雙鏈體的偏好性變性以形成變性的靶鏈和參考鏈。d.降低反應混合物的溫度,從而允許所述引物對與所述靶鏈和參考鏈復性;并且e.延伸所述引物對,從而相對于所述參考序列富集所述靶序列。2.用于富集靶序列的方法,所述方法包括a.通過使可疑具有所述靶序列和參考序列的核酸樣品經歷高于所述參考序列解鏈溫度(Tm)的第一變性溫度而變性所述核酸樣品;b.形成靶鏈/參考鏈雙鏈體;c.通過使核酸樣品經歷低于所述參考序列Tm的臨界溫度(Tc)而變性所述靶鏈/參考鏈雙鏈體;d.將所述引物對與所述靶鏈和參考鏈復性;并且e.延伸所述引物對,從而相對于所述參考序列富集所述靶序列。3.用于富集靶序列的方法,所述方法包括使可疑具有所述靶序列和參考序列的核酸樣品經歷第一變性溫度和第二變性溫度,其中所述第一變性溫度高于所述參考序列的Tm,從而引起所述靶序列和參考序列的變性,并且所述第二變性溫度低于所述參考序列的Tm,從而引起靶鏈/參考鏈雙鏈體的偏好性變性,并且使所述的核酸樣品經歷核酸擴增條件,從而相對于所述參考序列富集所述的靶序列。4.用于富集靶序列的方法,所述方法包括執行包含第一變性溫度和第二變性溫度的核酸擴增反應方案,其中所述第一變性溫度高于參考序列的Tm,從而引起所述靶序列和參考序列的變性并且所述第二變性溫度低于所述參考序列的Tm,從而引起靶鏈/參考鏈雙鏈體的偏好性變性。5.用于富集靶序列的方法,所述方法包括a.使可疑具有靶序列和參考序列的反應混合物經歷低于所述參考序列Tm的臨界溫度(Tc),從而偏好地變性所述靶序列;b.降低反應混合物的溫度,從而引起引物對與所述靶序列復性;并且c.延伸所述引物對,從而相對于所述參考序列富集所述靶序列。6.用于富集靶序列的方法,所述方法包括a.使可疑具有靶序列和參考序列的反應混合物經歷高于所述參考序列解鏈溫度(Tm)的第一變性溫度,從而引起所述靶序列和參考序列的變性;b.備選地重復一次或更多次以下步驟i降低反應混合物的溫度,從而引起靶鏈/參考鏈雙鏈體的形成,和ii使所述反應混合物經歷低于所述參考序列Tm的臨界溫度(Tc),從而引起靶鏈/參考鏈雙鏈體的偏好性變性。c.降低反應混合物的溫度,從而引起引物對與所述的靶序列和參考序列復性;并且d.延伸所述引物對,從而相對于所述的參考序列富集所述靶序列。7.用于富集靶序列的方法,所述方法包括a.使可疑具有靶序列和參考序列的反應混合物經歷高于所述參考序列解鏈溫度(Tm)的第一變性溫度,從而引起所述靶序列和參考序列的變性;b.備選地重復一次或更多次以下步驟i降低反應混合物的溫度,從而引起靶鏈/參考鏈雙鏈體的形成,和使所述反應混合物經歷低于所述參考序列Tm并低于相同擴增子中任意靶序列Tm的臨界溫度(Tc)處理,從而引起靶鏈/參考鏈雙鏈體的偏好性變性,c.降低反應混合物的溫度,從而引起引物對與所述靶序列和參考序列復性;并且d.延伸所述引物對,從而相對于所述的參考序列富集所述靶序列。8.權利要求2的方法,其中在進行步驟d之前重復步驟b和c兩次或更多次。9.權利要求1-3和5-8任一項的方法,其中所述靶序列和參考序列首先通過PCR擴增。10.權利要求1-3和5-8任一項的方法,其中所述參考序列是野生型等位基因。11.權利要求10的方法,其中所述靶序列是突變等位基因。12.權利要求11的方法,其中所述突變等位基因包含一個或多個核苷酸缺失。13.權利要求11的方法,其中所述突變等位基因包含一個或多個核苷酸插入。14.權利要求11的方法,其中所述突變等位基因包含一個或多個核苷酸改變。15.權利要求11的方法,其中所述靶序列是體細胞突變。16.權利要求1-3和5-15任一項的方法,其中所述靶序列和參考序列是15至1000個堿基。17.權利要求16的方法,其中所述靶序列和參考序列是25至500個堿基。18.權利要求16的方法,其中所述靶序列和參考序列是50至200個堿基。19.權利要求1-18任一項的方法,其中所述第一變性溫度比所述參考序列Tm高1°C至30"C。20.權利要求19的方法,其中所述第一變性溫度比所述參考序列Tm高5°C至20°C。21.權利要求1、2或5-20任一項的方法,其中所述Tc比所述參考序列Tm低.3°C_5°C。22.權利要求1、2或5-20任一項的方法,其中所述Tc比所述參考序列Tm低.5°C至1.5°C。23.權利要求3或4的方法,其中所述第二變性溫度比所述參考序列Tm低.3°C-5°C。24.權利要求3或4的方法,其中所述第二變性溫度比所述參考序列Tm低.5°C至1.5°C。25.權利要求1-24任意項的方法,其中所述方法重復2個或更多個循環。26.權利要求1-24任意項的方法,其中所述方法重復5-40個循環。27.權利要求1-24任意項的方法,其中所述方法重復10-30個循環。28.權利要求1-24任意項的方法,還包括使所述富集的靶序列經歷進一步處理。29.權利要求1-24任意項的方法,其中所述進一步處理選自由MALDI-TOF、HR解鏈、雙脫氧測序、單分子測序、焦磷酸測序、RFLP、數字PCR和定量PCR組成的組。30.權利要求1-29任一項的方法,其中所述靶序列具有比所述參考序列更低的Tm。31.權利要求1-29任一項的方法,其中所述靶序列具有比所述參考序列更高的Tm。32.權利要求1、2或5-8任一項的方法,其中所述Tc應用1秒-5分鐘。33.權利要求1、2或5-8任一項的方法,其中所述Tc應用2秒-1分鐘。34.權利要求1、2或5-8任一項的方法,其中所述Tc應用5秒-30秒。35.權利要求3或4的方法,其中所述第二變性溫度應用1秒_5分鐘。36.權利要求3或4的方法,其中所述第二變性溫度應用2秒-1分鐘。37.權利要求3或4的方法,其中所述第二變性溫度應用5秒-30秒。38.權利要求1-3或5-22、25-34任一項的方法,其中所述引物對在與所述靶序列復性時具有低于Tc的解鏈溫度。39.權利要求1、2或5-22、25-34任一項的方法,其中所述Tc是70_85°C。40.權利要求3或4的方法,其中所述第二變性溫度是70-85°C。41.權利要求1-40任一項的方法,其中所述靶序列和參考序列是人DNA。42.權利要求1-41任一項的方法,其中所述靶序列是已經用亞硫酸氫鈉處理過的甲基化DNA。43.權利要求1-42任一項的方法,其中參考序列是已經用亞硫酸氫鈉處理過的甲基化DNA。44.權利要求1-43任一項的方法,其中所述反應混合物包含核酸檢測染料。45.權利要求44任一項的方法,其中所述方法在實時PCR裝置中進行。46.計算機可讀取介質,包含用于進行權利要求1-8任一項的方法的程序指令。47.用于富集靶序列的系統,所述系統包含用于執行權利要求46的計算機可讀取介質的程序指令的的存儲器。48.權利要求11的方法,其中所述突變等位基因包含SNP。49.權利要求1的方法,其中所述第一變性溫度是90-99°C并且所述的Tc是65_89°C。50.權利要求1的方法,其中所述第一變性溫度是86-99°C并且所述的Tc是65_85°C。51.權利要求1的方法,其中所述第一變性溫度是80-99°C并且所述的Tc是65_79°C。52.權利要求1-3和5-8任一項的方法,其中所述方法用來富集兩種或更多種不同的靶序列并且所述方法還包括對所述靶序列特異的一個或更多個額外引物對。53.權利要求1、2、5、6-22、25-34、38-39、41-45和48-52任一項的方法,其中所述方法還包括鑒定所述Tc,其中所述Tc允許所述靶序列/參考序列雙鏈體的偏好性變性。54.權利要求3或4的方法,其中所述方法還包括鑒定所述第二變性溫度,其中所述第二變性溫度允許所述靶序列/參考序列雙鏈體的偏好性變性。55.權利要求1的方法,其中所述引物對具有低于步驟(b)中所用溫度的解鏈溫度。56.權利要求6的方法,其中所述引物對具有低于步驟(b)(i)中所用溫度的解鏈溫度。57.權利要求55的方法,其中所述引物對的解鏈溫度低于步驟(b)的溫度至少5°C。58.權利要求56的方法,其中所述引物對的解鏈溫度低于步驟(b)(i)的溫度至少5°C。59.權利要求1-45或48-58任一項的方法,其在實時反應條件下進行。60.權利要求59的方法,其中實時反應條件使用核酸檢測染料。61.權利要求59的方法,其中實時反應條件使用標記的探針。62.權利要求1-45或48-61任一項的方法,其中所述方法在多重測定法中進行。63.權利要求1-45或48-61任一項的方法,其中所述方法在數字PCR平臺中進行。64.權利要求1-3或5-8任一項的方法,其中反應混合物包含修飾的核酸。65.權利要求64的方法,其中修飾的核酸是肽核酸。66.權利要求65的方法,其中修飾的核酸是對參考序列特異的引物。67.權利要求1-45或48-66任一項的方法,其中反應混合物包含有機溶劑。68.權利要求67的方法,其中有機溶劑選自由DMSO、甲酰胺、甜菜堿、甘油或其組合組成的組。69.權利要求1、2、5-22、25-34或38-68的方法,其中所述Tc低于參考序列和靶序列二者的Tm。全文摘要本發明涉及用于富集來自樣品的低豐度等位基因的方法、組合物、軟件和裝置。所述方法部分地基于包括在臨界變性溫度或“Tc”保溫反應混合物的改良核酸擴增方法。通過使用本發明,明顯改善全部基于PCR的技術的現有檢測限。文檔編號C12P19/34GK101815789SQ200880109823公開日2010年8月25日申請日期2008年7月31日優先權日2007年8月1日發明者G·馬克里吉奧古斯申請人:達納-法伯癌癥研究院有限公司