專利名稱:用于證實遺傳身份的方法和測試試劑盒的制作方法
技術領域:
本發明涉及一種用共顯性評分證實確定的種群集合體內的遺傳身份、遺傳多樣性、基因組變異或多態性,特別是等位基因變異,以及生物多樣性的方法和測試試劑盒。該方法和測試試劑盒應用可動因子(ME),而且以使用與固相支持物連接的一組或多組任選成對或平行的寡核苷酸為基礎。每個寡核苷酸序列代表可動因子(ME)的一個插入位點連接點。所述方法和測試試劑盒用于遺傳身份確定、系統發育研究、親子關系鑒定、基因型分析、單倍型分析、譜系分析、法學、人類醫學診斷和植物及動物的繁殖。
背景技術:
已知特定種群內特定個體(例如,人、動物、細菌、植物等)的基因組對于主要部分而言是獨特的,除非高度近親交配或克隆或無性繁殖。特定基因組的獨特性很大程度是由其中所含的DNA序列確定的。假如個體間基因組獨特性的差異可反映DNA序列的差異,那么DNA序列變異可用于把個體彼此區別開來,即基因型分析可區別表型。檢測DNA序列變異可使用各種實驗室過程進行,每個過程都有它們各自固有的限制和優點;在確定所選方法有效性的這兩個極端之間存在著一種平衡。無論使用什么方法,目的都是相同的即為了檢測DNA序列變異并使用該信息把個體彼此區別開來。把一個個體與另外一個個體區別開來的DNA序列變異的圖譜被稱作“DNA指紋”。作為一種技術,DNA指紋具有廣泛的應用范圍,包括但不限制于,法醫鑒定、系統發育研究、親子關系鑒定、法學、人類醫學診斷、譜系分析以及動物和植物繁殖。
例如,傳統的植物繁殖依賴于“繁殖人員眼睛”的專門技術來鑒定,并遵循特定性狀的遺傳,這些特定性狀是通過雜交和回交從供體植物引入到受體種類中的,直到消除供體不需要的遺傳背景。實現此繁殖程序目的所需的回交步驟數通常需要若干年的努力。為了加速繁殖程序,可應用高度選擇性的標記輔助選擇(MAS)和DNA指紋作圖法;這些方法是利用分子生物學技術在實驗室中進行的。DNA指紋分析可用的DNA標記有很多。每個標記都有其自身固有的優點和缺點。
限制性片段長度多態性(RFLP)(Botstein等,Am.J.Hum.Genet.32314-331,1980;WO 90/13668)是其中一種較為先進的標記系統。RFLE的分辨能力可鑒定雜合及純合狀態。換句話說,RFLP是共顯性標記。然而,對于常規標記輔助選擇(MAS)和DNA指紋分析而言,存在很多與使用RFLP有關的顯著缺點。RFLP分析是強度非常大的工作,包括花費較長時間擬定方案和高能放射性同位素的使用,且研究經費高。此外,每次測定可分析的標記數一般僅為1個或2個。
由于RFLP的引入,已經研究出了很多可選擇性的標記,包括單核苷酸多態性(SNP;Kwok等,Genomics 31123-126,1996)、隨機擴增的多態DNA(RAPD;Williams等,Nucl.Acids Res.186531-6535,1990)、簡單序列重復(SSR;Zhao & Kochert,Plant Mol.Biol.21607-614,1993;Zietkiewicz等,Genomics 20176-183,1989)、擴增片段長度多態性(AFLP;Vos等,Nucl.Acids Res.214407-4414,1995)、短串聯重復(STRs)或可變數量的串聯重復(VNTR)以及微衛星(Tautz,Nucl.Acids.Res.176463-6471,1989;Weber和May,Am.J.Hum.Genet.44388-396,1989)。
在應用標記的系統之中,可提及序列-特異性擴增的多態性方法(SSAP;Waugh等,Mol.Gen.Genet.253687-694,1997),逆轉錄轉座子微衛星擴增的多態性(REMAP)系統和間逆轉錄轉座子間的擴增的多態性(IRAP)系統。與常規的RFLP系統相比,REMAP和IRAP(Kalendar等,Theor.Appl.Genet.98704-711,1999)系統耗費的時間明顯更少,應用廣泛,且可提供更多的信息,但應注意的是,REMAP和IRAP不是共顯性標記,因此通常不能用于區別雜合及純合基因型。
基于逆轉錄轉座子的插入多態性(RBIP)(Flavell等,Plant J16643-650,1998)是一種基于逆轉錄轉座子的標記系統。它與微衛星標記系統最為相似,因為每個引物對分析單一位點,且該引物與側翼于可變區的序列相對應,該可變區產生等位基因變異性。因此,RBIP不同于SSAP、IRAP、和REMAP,其用每個PCR擴增反應揭示多個但無名的位點,且不像微衛星系統,其不僅檢測引物間一組簡單序列重復(SSR)中的等位基因變異,而且可檢測該位置是否存在逆轉錄轉座子。上面討論的標記分子和系統在WO 93/06239、WO 00/35418、EP967291、WO 01/27321、US 6,114,116、WO 95/11995和WO 99/67421中公開。
上面所列標記、標記系統以及專利或專利申請是非窮舉的。盡管可獲得或建議的系統有很多,但很明顯每個系統都有其自身固有的優點和缺點,對于所有目的而言,還沒有哪個系統是理想的。應用PCR和基因組因子的標記系統的其中一個問題在于擴增整個基因組因子的能力有時會失敗,導致微小誤差加倍,降低分辨率。因此,仍然需要提供可選擇性的系統,其對于滿足現代繁殖技術的要求足夠有效。
很顯然需要一種可選擇性的標記系統,包括方法和測試試劑盒,其應用廣泛,可使用便宜且技術簡單的檢測系統提供標記模式的強有力、可再現的產生。
發明概述本發明涉及一種用于證實確定的種群集合體內的遺傳身份、遺傳多樣性、基因組變異或多態性,特別是等位基因變異,以及生物多樣性的方法和試劑盒,它們是以檢測種群集合體中的基因型整個范圍內是否存在可動因子(ME)及其各自的插入位點連接點為基礎的。應用與固相支持物連接的寡核苷酸序列的該方法可用于遺傳身份確定、系統發育研究、親子關系鑒定、基因型分析、單倍型分析、譜系分析、法學、人類醫學診斷以及植物和動物繁殖。該方法通過記錄是否存在可動因子(ME)而檢測某一基因組位置的改變。在種群集合體/基因型集合體內得到所期望分辨水平是使用本發明公開的方法和測試試劑盒實現的,其可使用剪切的未標記樣品DNA進行雜交。這表示,不需要特別小心保存DNA樣品。
未標記的樣品DNA用于雜交的事實意味著當樣品DNA本身被標記時,DNA純度并不重要。此外,參考樣品可很容易地維持,且無需像標記DNA那樣特別小心地使用。可更便宜地處理大量樣品DNA,這是因為只需剪切(DNA提取后)。
用于在檢測步驟中檢測雜交寡核苷酸的方法和測試試劑盒對于樣品DNA本身并不特異,但它們以常規方法為基礎,依靠一種或多種方式將雜交形式與未雜交的寡核苷酸形式區別開來。因此,它是標準化和自動化的,與所研究的特定樣品或其質量無關。
由于使用相對簡單,該方法和測試試劑盒可使本發明內部應用,例如,由繁殖者使用。本發明的方法和測試試劑盒為繁殖者提供了一種直接和可行的方法,他們監測并負責他們自己的內部質量控制。
本發明方法和測試試劑盒的特殊優點是它們可用于對給定的目標基因,可靠地區別回交子代的雜合及純合狀態,而無需在回交后,通過回顧性常規篩選相應的(自體受精)后代來確定接合狀態。這樣做具有重要的成本效益,可顯著縮短繁殖程序。
因此,本發明涉及一種方法和測試試劑盒,其可用共顯性評分鑒定確定的種群集合體內的遺傳身份、遺傳多樣性和基因變異,如基因組變異或多態性,特別是等位基因變異,以及生物多樣性。本發明應用可動因子(ME),而且以使用與固相支持物連接的任選成對或平行的寡核苷酸組為基礎。每個寡核苷酸序列代表可動因子(ME)的完全或空整合位點,且由兩部分組成,其或者代表可動因子(ME)的末端,或者代表所述可動因子(ME)的側翼區。檢測完全整合位點的寡核苷酸序列部分包含確定的可動因子(ME)的側翼區,部分包含所述可動因子(ME)的末端,而檢測空整合位點的寡核苷酸序列在整合位點的每一側包含左側翼區和右側翼區。所述方法和測試試劑盒可用于遺傳統一性確定、系統發育研究、親子關系鑒定、基因型分析、單倍型分析、譜系分析、法學、人類醫學診斷,并確保和促進繁殖,特別是提供共顯性評分。
在該方法中,使代表樣品總DNA的未標記、任選斷裂的單鏈寡核苷酸序列與不止一組任選成對或平行的寡核苷酸序列雜交,如上所述它們由兩個因子或部分組成,長度不定。換句話說,每組寡核苷酸代表一個確定的基因組位置或整合位點。
在本發明的優選實施方案中,該方法包括雜交、雜交后處理、雜交的記錄和評分在內的不同步驟都是自動化的。
本發明還涉及一種用共顯性評分證實確定的種群集合體內的遺傳多樣性、遺傳身份、基因組變異或多態性,特別是等位基因變異,以及生物多樣性的測試試劑盒。更具體而言,該測試試劑盒包括固相支持物,它可以是膜、濾器、載玻片、平板、芯片、培養皿等。甚至是微量滴定平板上的微孔也適合作為固相支持物。固相支持物可由下列材料制成,如玻璃、塑料、硝化纖維素、尼龍、聚丙烯酸、硅等。該測試試劑盒可含有任選的試劑,包括標記、洗滌緩沖液、末端保護試劑和/或使用說明。
該測試試劑盒的特征在于包含不止一組任選成對或平行的寡核苷酸序列。因此,在其最簡單的形式中,該測試試劑盒包含兩種不同的單一寡核苷酸,一個是空整合位點,一個是完全整合位點,其中每個寡核苷酸能夠識別可動因子(ME)的特異性、確定的插入位點連接點,以及所述插入位點連接點是否存在可動因子(ME)。然而,本領域的技術人員應認識到,為了獲得有關種群集合體遺傳多樣性的具有足夠信息量的信息,必須提供更為復雜的系統。
因此,在本發明的優選實施方案中,需要更多組寡核苷酸。經計算,為了在具有7對染色體的二倍體生物中獲得最佳的指紋分析或繪圖結果,寡核苷酸組的最小值應為約70-80。對于具有更多染色體的生物而言,需要更多組寡核苷酸。然而,對寡核苷酸組的數量沒有上限。
一對就足夠了,上限由所要鑒定被試者的可獲得特征性DNA序列,特別是可動因子(ME)的存在提供。換句話說,寡核苷酸組數取決于可提供信息的側翼序列DNA對的可獲得性且,就標記輔助的選擇(MAS)而言,取決于序列對相對于已知目標基因的位置。
可利用本發明獲得的信息不僅可通過使用若干組寡核苷酸進一步提高,而且可通過對所要測定的每個可動因子(ME)提供兩組或多組任選平行或成對的寡核苷酸進一步提高。所述任選成對或平行的寡核苷酸組合可被設計如下-左側翼區(FL)+可動因子(ME)的末端組合左側翼區(FL)+右側翼區(FR);-右側翼區(FR)+可動因子(ME)的末端組合左側翼區(FL)+右側翼區(FR);-左側翼區(FL)+可動因子(ME)的末端,右側翼區(FR)+可動因子(ME)的另一末端組合左側翼區(FL)+右側翼區(FR)。
所述寡核苷酸可從任一互補鏈制備,這是因為在進行雜交反應前,DNA樣品的兩條鏈都將以單鏈形式存在。
該測試試劑盒的寡核苷酸序列可任選被末端保護,且當使用可逆的開發和雜交記錄處理時,具有與固相支持物連接的寡核苷酸的測試試劑盒可重新使用。
本發明可使用所述方法和試劑盒,通過任何特定基因組位置中的至少一個可動因子(ME)或任何特定基因組位置中的至少一個側翼區來區別任何生物。還包括使用所述方法和測試試劑盒用于遺傳身份確定、系統發育研究、親子關系鑒定、基因型分析、單倍型分析、譜系分析、法學、人類醫學診斷以及植物和動物繁殖。
附圖簡述
圖1表示不同類型的可動因子(ME)。
圖1A描述DNA-介導的轉座子,其構成所謂的II類因子,并通過切割和粘貼染色體節段到新的位置而移動。II類因子包括自主(自我活動)和非-自主因子;非自主因子包括微型反向重復序列轉座因子(MITEs),它是可動因子(ME)的高度缺失形式。縮寫詞ds,雙鏈。
圖1B描述RNA-介導的轉座因子,逆轉錄轉座子,或I類因子,它不能象II類因子那樣切除,但可使子代拷貝進行逆轉錄,然后被插入到基因組新的基因組位置中。縮寫詞ds,雙鏈;rev.,反向;AAAnA,聚(A)尾部。
圖1C描述長末端重復序列(LTR)逆轉錄轉座子。LTR逆轉錄轉座子代表兩個主要的I類轉座因子組的其中一個。該組包括吉普賽-樣(a)和copia-樣(b)因子,前者在結構和序列方面更象逆轉錄病毒樣。LTR、U3、R和U5的結構域如下所示。縮寫詞PBS,引物結合位點;GAG,衣殼蛋白;AP,天門冬氨酸蛋白酶;IN,整合酶;LTR,長末端重復序列;RT,逆轉錄酶;RH,核糖核酸酶H;PPT,聚嘌呤道。
圖1D描述非-長末端重復序列(非-LTR)逆轉錄轉座子。非-LTR逆轉錄轉座子包括長散布因子(LINE)(a)和短散布因子(SINE)(b)。有關逆轉錄轉座子的種類和它們編碼的產物的詳細描述見Kumar &Bennetzen,Annu Rev.Genet.33479-532,1999。縮寫詞GAG,衣殼蛋白;RT,逆轉錄酶;RH,核糖核酸酶H;UTR,非翻譯區;EN,內切核酸酶,(A)n,3′聚腺苷酸化序列。
圖2示意性說明寡核苷酸的可選擇性排列,該寡核苷酸與經由連接區和固相支持物連接的可動因子(ME)左側翼(FL)和/或右側翼(FR)和/或相應末端相對應。縮寫詞ME,可動因子;FL,左側翼區;FR,右側翼區。值得注意的是,圖中所示的每個寡核苷酸代表許多完全相同的寡核苷酸。
圖2A示意性說明單一寡核苷酸的其中一種可選擇性排列,該寡核苷酸經由連接區與代表基因組DNA中的單一可動因子(ME)插入位點的固相支持物連接(a)。不同類型的寡核苷酸都可使用并在此處提出,有2個寡核苷酸與可動因子(ME)插入位點連接點相對應,其中左側翼或右側翼及可動因子(ME)的相應末端由(b)表示,(c)表示插入連接點具有左側翼和右側翼,但可動因子(ME)的連接點未被占據(c)。
圖2B示意性說明獨立寡核苷酸的排列,該寡核苷酸代表經由獨立連接區與固相支持物連接的左側翼(FL)和/或右側翼(FR)和/或可動因子(ME)相應末端。其中提出了3種排列,2種與可動因子(ME)插入位點連接點相對應(a)和(b),1種代表可動因子(ME)插入位點事件的未被占據位點(c)。即使獨立寡核苷酸之間似乎存在空位,寡核苷酸足夠緊密地定位也是非常必要的,這樣基因組樣品DNA才可與完全或空插入位點情況下的兩種寡核苷酸雜交。
圖2C示意性說明獨立寡核苷酸的排列,該寡核苷酸代表經由互補寡核苷酸延伸區(互補堿基配對)連接的左側翼(FL)和/或右側翼(FR)和/或可動因子(ME)相應末端,該互補寡核苷酸延伸區(互補堿基對)與固相支持物上連接的獨立連接區連接。其中提出了3種排列,2種與可動因子(ME)插入位點連接點相對應(a)和(b),1種代表可動因子(ME)插入位點事件的未被占據位點(c)。
圖3示意性說明包括固相支持物的本發明概念。縮寫詞ME,可動因子;FL,左側翼區;FR,右側翼區。
圖3A示意性說明上面固定了3種寡核苷酸的固相支持物(灰條)。連接區用黑色的橢圓形表示。3種寡核苷酸如實施例所示左側翼/右側翼(FL/FR)(a),左側翼(FL)和右側翼(FR)節段分別用不同條紋模式的陰影表示;左側翼/可動因子(FL/ME)(b),可動因子(ME)由陰影格子表示;和可動因子/右側翼(ME/FR)(c)。寡核苷酸末端的圓圈是加入到寡核苷酸上的一個或多個堿基的延伸,不與側翼序列匹配。固相支持物可以是任何固相支持物,包括珠子,且這3種寡核苷酸無需被固定在同一支持物上。所示的3種寡核苷酸代表一個特定基因組位置的3種寡核苷酸。
圖3B示意性表示總DNA(a;波形曲線);b、c、d和e代表不同的DNA片段,這些不同的DNA片段是從總DNA剪切下來的并代表圖3A所示寡核苷酸的基因組等同物,連同側翼序列(波形曲線)。側翼序列包括由陰影格子表示的內部可動因子(ME)序列。
圖3C示意性表示固相支持物上的寡核苷酸,如圖3A所示,與基因組DNA的片段雜交。在本特殊實施例中,只有空位點[左側翼/右側翼(FL/FR)]寡核苷酸完全匹配基因組DNA(a)。對于含有左側翼/可動因子(FL/ME)的寡核苷酸而言,只有可動因子(ME)匹配剪切基因組DNA的一個特定片段(b);對于可動因子/右側翼(ME/FR)而言,在另外一種情況下,只有右側翼(FR)節段匹配(c)。在其它情況下,不同的模式都要檢測。
圖3D示意性說明進行的洗滌步驟,該洗滌步驟僅除去與固相支持物上連接的寡核苷酸部分雜交的基因組DNA。
圖3E示意性說明進行的檢測步驟。通過雜交DNA延伸而摻入的可檢測標記用黑色圓圈表示。
圖3F示意性表示檢測反應的評分。寡核苷酸左側翼/右側翼(FL/FR)(a)代表空位點,并產生正信號。寡核苷酸左側翼/右側翼(FL/ME)(b)和可動因子/右側翼(ME/FR)(c)代表完全位點,且兩者都沒有產生信號。因此該位點被證實為空的。
圖4表示用于進行比較的、現有技術的基于逆轉錄轉座子的插入多態性(RBIP)方法。該方法依靠檢測特定基因組位置上是否存在可動因子(ME)插入(Flavell等,Plant J.16,643-650,1998)。縮寫詞ME,可動因子;FL,左側翼區;FR,右側翼區。
圖4A證實使用引物,自可動因子(ME)插入區的左側翼(FL)和右側翼(FR),在空位點進行PCR,產生一種產物(下文)。
圖4B證實可動因子(ME)插入后,基因組位置的PCR反應。關于可動因子(ME)的有義方向,左側翼(FL)和右側翼(FR)引物與指向左(L)和右(R)的引物組合。使用組合FL+FR的PCR擴增通常不能產生產物,這是因為在該實例中,由插入的可動因子(ME)大小決定的PCR引物之間的距離較大(N.B.缺少相應的PCR產物時,在下面用虛線表示)。組合FL+L和FR+R可產生該完全基因組位置的產物,而空基因組位置不能產生產物(圖4A)。如文獻所述(Flavell等,Plant J 16643-650,1998),RBIP是通過在瓊脂糖凝膠上分離PCR產物而評分的。可選擇性地,可將PCR反應產物放在適宜的濾器上,然后使用適宜的、源于可動因子(ME)或側翼序列擴增部分的寡核苷酸在獨立反應中雜交。
圖5描述可動因子(ME)插入多態性如何區別雜合與純合狀態。
圖5A表示在同一基因組位置具有一個(雜合狀態)或兩個(純合狀態)可動因子(ME)的同源染色體。
圖5B表示使用引物進行的反向PCR,該引物被設計成鑒定植物基因組DNA序列(虛線)的可動因子(ME),該植物基因組DNA序列直接側翼于可動因子(ME)。應注意的是,在雜合狀態下,其中一個同源染色體上缺少可動因子(ME)。
圖5C表示使用面向內的引物進行的長程PCR,該引物被設計成擴增一個或兩個PCR產物(a或b)的左和右可動因子(ME),這取決于可動因子(ME)是否存在于一個或兩個同源染色體上。
圖5D表示按照大小分離PCR擴增產物的凝膠電泳(在該實施例中,′a′單獨或′a′和′b′),由此分離雜合狀態與純合狀態。
圖6示意性說明包括固相支持物的本發明的改進。該檢測方法不同于圖3所示。縮寫詞ME,可動因子;FL,左側翼區;FR,右側翼區。
圖6A示意性描述上面固定了3種寡核苷酸的固相支持物(灰條)。連接區用黑色橢圓形表示。三種寡核苷酸如實施例所示左側翼/右側翼(FL/FR)(a),左側翼(FL)和右側翼(FR)節段分別用不同條紋樣式的陰影表示;左側翼/可動因子(FL/ME)(b),可動因子(ME)用陰影格子表示;和可動因子/右側翼(ME/FR)(c)。所述固相支持物可以是任何固相支持物,包括珠子,且3種寡核苷酸無需固定在同一支持物上。所示3種寡核苷酸代表一個特定基因組位置的3種寡核苷酸。
圖6B示意性表示總DNA(a;波形曲線);b、c、d和e代表不同的剪切DNA片段,這些片段是從總DNA剪切下來的并代表圖6A所示寡核苷酸的基因組等同物,連同側翼序列(波形曲線)。側翼序列包括由陰影格子表示的內部可動因子(ME)序列。
圖6C示意性表示固相支持物上的寡核苷酸,如圖3A所示,與基因組DNA雜交。在本特殊實施例中,只有空位點[左側翼/右側翼(FL/FR)]寡核苷酸完全匹配基因組DNA(a)。對于含有左側翼/可動因子(FL/ME)的寡核苷酸而言,只有可動因子(ME)匹配基因組DNA的一個特定剪切片段(b);對于可動因子/右側翼(ME/FR)而言,在另外一種情況下,只有右側翼(FR)節段匹配(c)。在其它情況下,不同模式都要檢測。
圖6D示意性描述所進行的檢測步驟。加入標記的雙脫氧核苷酸,其被摻入到寡核苷酸末端,使寡核苷酸與作為模板的基因組DNA雜交。與匹配寡核苷酸的區域相鄰的基因組位置上的核苷酸序列是已知的,且因此所要摻入的特定核苷酸(A、C、G、T或U)是已知的。在所示實施例中,寡核苷酸b和C沒有延伸,這是因為它們缺少雜交的基因組DNA。
圖6E示意性表示檢測反應的評分。示意性說明評分。寡核苷酸左側翼/右側翼(FL/FR)(a)代表空位點,并產生正信號。寡核苷酸左側翼/可動因子(FL/ME)(b)和可動因子/右側翼(ME/FR)(c)代表完全位點,兩者都沒有產生信號。因此,該位點被證實是空的。
圖7表示sb17.seq(SEQ ID NO20)的1767nt序列。在逆轉錄轉座子微衛星擴增多態性(REMAP)方法中,使用引物7286(SEQ IDNO18)和(CTC)9C(SEQ ID NO19),多態帶被鑒定僅存在于春大麥中,而不存在于冬大麥中。該帶是從溴化乙錠染色的瓊脂糖凝膠上切除下來的,被克隆并測序。在BARE-1插入片段的LTR下面加下劃線。它代表與可讀框有義方向相反的LTR末端。由插入產生的預測的5bp同向重復序列,CCACT,用粗斜體字表示。
圖8表示wb17.seq(SEQ ID NO21)的3186nt序列。在逆轉錄轉座子微衛星擴增多態性(REMAP)方法中,使用引物7286(SEQID NO18)和(CTC)9C(SEQ ID NO19),多態帶被鑒定存在于冬大麥中。該帶是從溴化乙錠染色的瓊脂糖凝膠上切除下來的,被克隆并測序。冬大麥在該基因組位置缺少BARE-1插入。該序列與sb17序列(SEQ ID NO20)幾乎完全相同,只是它缺少BARE-1序列。BARE-1在sb17(SEQ ID NO20)中的插入位點用wb17(SEQ ID NO21)序列中的箭頭標記,且位于wb17(SEQ ID NO21)中的核苷酸1511和1512之間。在這些側翼核苷酸下面加下劃線。在sb17(SEQ ID NO20)中形成同向重復序列的5bp序列用粗體字表示。
圖9表示可動因子/左側翼(ME/FL)區如何能夠分別從BARE-1LTR,預測的5bp同向重復序列,和wb17序列預測。
圖9A表示代表反向BARE-1 LTR的前100nt,和對sb17 5′連接區(SEQ ID NO23)預測的約100nt的序列。
圖9B表示以下列方式概括的左側翼和右側翼(FL和RF)及反向可動因子(ME)左側翼(FL)/可動因子(ME)(SEQ ID NO24);右側翼(FR)/可動因子(ME)(SEQ ID NO25)。這些寡核苷酸是合成的、任選末端保護的,并與芯片連接,代表玉米的單一基因組位置。另外50個或更多基因組位置的寡核苷酸是以相似方式衍生并處理的。
發明詳述縮寫詞AFLP擴增片段長度多態性BARE大麥逆轉錄轉座子FL 左側翼區;左側翼FR 右側翼區;右側翼IRAP逆轉錄轉座子間擴增多態性LINE長散布因子LTR 長末端重復序列MAS 標記輔助的選擇ME 可動因子MITE微型反向重復序列轉座因子RAPD隨機擴增的多態DNAREMAP 逆轉錄轉座子微衛星擴增多態性RBIP基于逆轉錄轉座子的插入多態性RFLP限制性片段長度多態性SINE短散布因子SNP 單核苷酸多態性SSR 簡單序列重復SSAP序列特異性擴增多態性STR 短串聯重復
TRIM微型末端重復序列逆轉錄轉座子VNTR可變數量的串聯重復說明書中所用的術語在本說明書中所用的絕大多數術語通常具有與遺傳學、人類醫學診斷、重組DNA技術、分子生物學及植物和動物繁殖領域中相同的含義。然而,有些術語稍有不同,并在下面詳細解釋。
術語″遺傳身份″是指確定的種群集合體內個體的遺傳多樣性、基因組變異或多態性,等位基因變異或遺傳獨特性,其特征在于代表遺傳多樣性的等位基因變異、基因組變異或多態性。種群集合體包括植物,特別是農作物,包括大麥、馬鈴薯、蕓苔等,動物,特別是畜牧動物,包括牛和馬等,或寵物,包括狗、貓等,不排除人類。
術語″多態性″是指以若干不同形式存在的性質或特性。例如,在本說明書中,即雜交模式之間的差異,即″多態性″是指特定位點處是否存在可動因子(ME)或可動因子(ME)與確定的種群集合體中的特定側翼序列相鄰。
術語″共顯性″是指,例如,在二倍體生物中,可將雜合與純合等位基因彼此區別開來。本發明產生的標記是共顯性標記。
在本說明書中,術語″可動因子(ME)″是指遺傳因子,其散布在高等植物和動物以及原核生物的基因組中(Lodish等,Molecular CellBiology,W.H. Freeman and Company,NY,2000)。它們的長度從幾十或幾百到上千個堿基對,且可被復制并通過轉座(逆轉錄轉座子-樣可動因子)被重新插入到基因組新位點中或它們可自我切除并自主或非自主地重新插入到基因組其它處(轉座子)。
可動因子(ME)可分成兩類1)DNA-介導的轉座子(圖1A),其直接轉座為DNA,且通常被稱為轉座子。DNA轉座子包括細菌插入序列(IS因子,例如IS1、IS10),細菌轉座子(例如,Tn9)及真核生物轉座子(例如,源于果蠅的P因子,源于玉米的Ac和Ds因子),2)RNA-介導的轉座因子(圖1B)。所述因子經由RNA中間體轉座,該RNA中間體是通過RNA聚合酶從可動因子轉錄的。此后,它們通過逆轉錄酶轉換成雙鏈DNA。它們被稱作逆轉錄轉座子,這是因為它們的移動與逆轉錄病毒的感染過程類似。逆轉錄轉座子包括病毒-樣逆轉錄轉座子,如長末端重復序列(LTR)逆轉錄轉座子(圖1C)(例如,源于酵母的Ty因子,copia-樣和吉普賽-樣因子)和非病毒-樣逆轉錄轉座子,如非-LTR-逆轉錄轉座子(圖1D)[例如,F和G因子(果蠅),長散布因子(LINE)和短散布因子(SINE)(哺乳動物和植物),(Alu)序列(人)]。非-自主性逆轉錄轉座子還包括微型末端-重復序列逆轉錄轉座子(TRIM)因子(Witte等,Proc Natl Acad Sci9813778-13783,2001)。逆轉錄轉座子不能像DNA轉座子那樣切除,但它們可自我復制,并將它們的重復拷貝重新插入到基因組其它處。因此,逆轉錄轉座子涉及基因組進化,這是因為重復的姐妹拷貝基本隨機插入到基因組中可改變基因組的整個構成。逆轉錄轉座子已經廣泛用于研究繁殖種群的譜系,這是因為每代都有產生新的特殊逆轉錄轉座子分布的一定可能性。
逆轉錄轉座子或DNA轉座子的可動因子(ME)插入產生包括基因組中成百上千堿基對的插入片段(圖1)。當比較兩個基因型的最后共同祖先之前已經發生活動事件時,這些是多態的。對于絕大多數可動因子(ME)而言,在兩個基因組的同一位置很少會出現兩個獨立的插入,因為在平均真核生物基因組中大于109bp。
術語″樣品DNA″是指代表樣品總DNA的多核苷酸,其用于未標記且任選斷裂的形式中,且使其在使用前成為單鏈。樣品DNA可來源于任何樣品或生物,例如,來源于植物、動物、人類、細菌、真菌或它可以是古老的DNA。
術語″寡核苷酸″是指單個核苷酸的任何聚合物,其以單鏈形式用于本發明中,與固相支持物連接,從而證實任何樣品的DNA樣品中的遺傳身份。術語″寡核苷酸″不限于任何特定數量的核苷酸。換句話說,術語″寡核苷酸″是指通常由大約20個核苷酸組成的聚合物,且上限為任何長度,它可使用寡核苷酸合成儀合成。目前的上限約為150bp。自然地,如果提高寡核苷酸合成儀的能力,上限可以更高。即使附圖顯示僅有一個寡核苷酸,但術語寡核苷酸,特別是術語寡核苷酸或寡核苷酸序列是指許多基本相同的寡核苷酸。
術語″標記的寡核苷酸″是指與所連接的寡核苷酸序列完全相對應的標記的多核苷酸。
″寡核苷酸″是單鏈多核苷酸序列。每個寡核苷酸包含不同長度的兩個不同部分,一個部分是側翼于可動因子(ME)的區,另一個部分含有所述可動因子(ME)的末端或位于第一側翼區相反一側上的側翼區。所述寡核苷酸序列具有大約20個核苷酸的大小,更優選至少25,最優選多于30,以便在所連接的寡核苷酸與樣品DNA之間提供足夠穩定的雜交產物。對于每個可動因子(ME)而言,所述寡核苷酸含有3個選擇對象,即左側翼區(FL)組合可動因子(ME)的一個末端,右側翼區(FR)組合可動因子(ME)的另一個末端或左側翼區和右側翼區(FL+FR)的組合,用于檢測可動因子(ME)是否存在。代表側翼區的寡核苷酸可含有與側翼于側翼區的區,以便使雜交更穩定且更容易分辨。
術語″寡核苷酸組″是指許多能夠識別特異性確定的可動因子(ME)或特異性基因組位置是否存在的多核苷酸序列。可使用若干組寡核苷酸,每個可用的可動因子(ME)或基因組位置至少使用一個。可選擇性地,一個可動因子(ME)可與不同的側翼區組合或一個側翼區可與不同的可動因子(ME)組合。用于獲得最佳繪圖或指紋分析結果的寡核苷酸組估計最小值,例如,用于繁殖目的時,對于具有7個染色體的二倍體生物而言至少為70。然而,這不能為使用較小或較大數量寡核苷酸組的本發明方法和測試試劑盒提供阻礙。″寡核苷酸組″可包含用于檢測整合位點是否存在可動因子(ME)的單一寡核苷酸。可選擇性地,該組可包含檢測可動因子(ME)的寡核苷酸以及檢測可動因子(ME)缺乏的另一寡核苷酸。所述兩種類型的寡核苷酸,形成一組成對的寡核苷酸,能夠同時鑒定完全和空整合位點。″寡核苷酸組″還可包含代表相同整合位點的3個或多個平行寡核苷酸,即這3個寡核苷酸檢測可動因子(ME)的左和右末端,以及缺少的可動因子(ME)。當使用互補鏈時,也可獲得其它組的寡核苷酸。所述寡核苷酸的平行組可提供更可靠的結果,這是通過證實可動因子(ME)的兩個末端都存在可達到的。″寡核苷酸組″可與單一固相支持物或含有一個或多個獨立固相支持物的固相支持物連接。″一組寡核苷酸″是代表可動因子(ME)的單寡核苷酸,一對寡核苷酸或平行寡核苷酸。
術語″評分″是指比較可記錄的雜交模式,雜交模式可被記錄,且其中雜交是否存在可分別證實相應的可動因子(ME)插入是否存在。收集評分的結果,并評估為完全、空、衰退或無效等位基因。
術語″完全位點″是指基因組位置或整合位點的含有可動因子(ME)的形式。它可使用與固相支持物連接的寡核苷酸序列加以證實,其包含具有各自側翼序列的可動因子(ME)末端。含有可動因子(ME)的基因組位置的DNA序列與和固相支持物連接的寡核苷酸雜交,所述寡核苷酸由兩個不定長度的獨特序列區組成,其中一個獨特序列區由可動因子(ME)的側翼區、可動因子(ME)另一末端、以及含有可動因子(ME)末端片段的其它部分組成,但不與由兩個相反側翼區組成的寡核苷酸雜交。
術語″空位點″是指基因組位置或整合位點的缺少可動因子(ME)的形式,其可用與固相支持物連接的寡核苷酸序列加以證實,它與不存在或缺失可動因子(ME)的空位點或基因組位置相對應。因此,缺少可動因子(ME)的基因組位置的DNA序列與寡核苷酸序列雜交,與固相支持物連接,該寡核苷酸序列由兩個相等或不定長度的部分組成,其中一個部分包含左側翼區(FL),另一個部分包含缺少可動因子(ME)的右側翼區(FR)。
術語″衰退等位基因″相當于基因組位置的損失,或更準確地說,是與基因組位置雜交能力的損失,并且是空寡核苷酸和完全的寡核苷酸產生非-雜交反應時的得分。術語″衰退等位基因″是指用左側翼/右側翼(FL/FR)寡核苷酸評分為完全,但用左側翼/可動因子(FL/ME)或右側翼/可動因子(FR/ME)寡核苷酸評分為空的等位基因。″衰退等位基因″可由任何一系列原因引起,如充分插入/缺失點突變在側翼的積聚破壞了雜交能力、低質量探針、影響雜交效率或檢測的污染等。
術語″無效等位基因″是″衰退等位基因″的亞組,且相當于基因組位置損害。″無效等位基因″是指含有左側翼(FL)、右側翼(FR)的位點本身,且很可能可動因子(ME)缺少基因組,以致用左側翼/右側翼(FL/FR)寡核苷酸將該位點評分為完全,而用左側翼/可動因子(FL/ME)寡核苷酸或右側翼/可動因子(FR/ME)寡核苷酸將該位點評分為空。″無效等位基因″特別是指由于,例如重組事件導致的側翼缺失。
術語″側翼于可動因子(ME)的區″是指直接側翼于可動因子(ME)的區,其可包括串聯重復、其它可動因子(ME)、基因、啟動子、內含子、外顯子等,但還可包括其它側翼于側翼區的連續區。
術語″可動因子(ME)的末端″是指可動因子(ME)5′-或3′-末端或它們的互補鏈或其任意組合。
術語″位于第一側翼區另一側上的側翼區″是指可動因子(ME)被兩個側翼序列圍繞,整合位點每一側上有一個側翼序列。
術語″固相支持物″是指固相的不含水基質,且可以是膜、濾器、載玻片、平板、芯片、培養皿,由選自玻璃、塑料、硝化纖維素、硅等的材料制成。優選的固相支持物是膜、濾器、載玻片、平板、培養皿、微孔平板。″固相支持物″可由選自玻璃、塑料、硝化纖維素、尼龍、聚丙烯酸、硅等的材料制成。固相支持物連同與它連接的寡核苷酸形成本說明書的測試試劑盒或產物。
術語″雜交狀態的記錄″是指可檢測雜交的任何方法,包括使雜交可見或可以其它方式檢測的任何方法,但該術語還包括需要一定的分析儀器來實現檢測或就該方法的自動化應用而言,可記錄雜交狀態的方法。
術語″記錄″是指使用任何標記和允許記錄雜交狀態的方法測量或檢測每對寡核苷酸序列是否雜交。
術語″雜交″是指通過氫鍵把核酸的兩個互補鏈,即兩個獨立的DNA多核苷酸、寡核苷酸鏈,或一個DNA與一個RNA鏈結合在一起的方法。雜交通常是在適宜的緩沖液中,例如但不限制于6×SSC、0.05%焦磷酸鈉、0.1%SDS、如在常規實驗室操作中規定的(Ausubel等,2001,John Wiley & Sons,Inc.,New York,vol.1,unit 6.4.2.supplement13),在適宜的溫度下進行的,例如但不限制于53℃,通常為12℃,低于雜交體的確定解鏈溫度,考慮雜交緩沖液的鹽濃度。
術語″雜交后處理″是指在不同的嚴格條件下,通過應用洗滌步驟除去未與固相支持物上連接的寡核苷酸序列完全雜交的單鏈樣品DNA,或通過任選的消化處理或使用對單鏈核苷酸序列特異的核酸酶進行酶處理而除去從寡核苷酸伸出的部分雜交的單鏈。洗滌的嚴格條件遵循常規的實驗室操作(Ausubel等,2001,John Wiley & Sons,Inc.,New York),但通常是約60℃,在含有6×SSC的緩沖液中,雖然它可能更高或更低。通常,洗滌是在低于雜交分子解鏈溫度下進行的。
術語″可記錄的標記″是指任何標記或標志,它們可用于指示或追蹤雜交已經發生。它們可以是可見或可檢測的標記,其本身是可記錄的或與其它試劑接觸時,是可檢測或可記錄的。由于它們的電化學或磁性、熒光、發光、它們的紅外吸收、放射性或酶反應而可記錄的標記或標志是特別適宜的,很容易通過自動化手段或儀器記錄的任何示蹤標記都可使用。
優選的可記錄標記是熒光染料或熒光團,如熒光標記可在巰基-反應性染料中找到,如5-(2-((碘乙酰基)氨基)乙基)氨基亞萘基-1-磺酸)(1,5-IEDANS)或熒光素、Bodipy、FTC、Texas紅、藻紅蛋白、若丹明、羧基四甲基若丹明、DAPI、一種indopyras染料,Cascade藍、Oregon綠、曙紅、藻紅素、吡啶基噁唑、苯并噁二唑、氨基亞萘基、芘、馬來酰亞胺、香豆素、Lucifer黃、Propidium碘化物、porhyrin、CY3、CY5、CY9、鑭系元素的穴狀化合物、鑭系元素的螯合物或所述示蹤分子的衍生物或類似物。熒光標記的寡核苷酸特別用于自動化或半-自動化記錄。
術語″樣品DNA的剪切″是指使較長的DNA鏈斷裂的任何化學、機械或物理方法,從而獲得獨立DNA片段上的可動因子(ME)進行記錄。使DNA斷裂的方法包括限制酶處理、超聲處理等。
術語″末端保護″是指保護所連接的寡核苷酸,從而穩定具有固相支持物的測試試劑盒,并避免寡核苷酸受損,從而防止記錄錯誤或偽跡得分。有效的末端保護是用已知方法獲得的,選自5′OH-衍生化,氨基-衍生化等。
術語″測試試劑盒″是指連接了一組或多組任選成對或平行寡核苷酸的固相支持物。成對或平行的寡核苷酸是指代表同一可動因子(ME)的不同寡核苷酸。不言而喻,每組都含有很多基本相同的寡核苷酸。該測試試劑盒可任選與輔助試劑和說明書包裝在一起提供。
術語″半雜交體″是指探針-樣品DNA雜交體,其僅僅是部分雙鏈的,這是因為樣品DNA與探針寡核苷酸不完全同源。術語″完全雜交體″是指探針-樣品DNA雜交體,其是完全雙鏈的。辨別性雜交溫度使全長雜交體,“完全雜交體”保持退火,而半長雜交體,″部分雜交體″將解鏈。本方法的關鍵是區別兩種狀態,″部分雜交體″與″完全雜交體″。這兩種狀態相當于可動因子完全插入位點左側翼/可動因子(FL/ME)的探針與僅含空位點片段左側翼/右側翼(FL/FR)的樣品DNA雜交的情況;在這種情況下,左側翼(FL)節段可雜交,而探針的可動因子(ME)部分不會被與左側翼(FL)相鄰的探針DNA區覆蓋。
發明概述本發明的主要目的是用共顯性評分提供一種可靠的方法和測試試劑盒,用于遺傳身份確定、系統發育研究、親子關系鑒定、基因型分析、單倍型分析、譜系分析、法醫鑒定、人類醫學診斷和/或植物或動物繁殖。在遺傳多樣性的證實中,一種可靠的方法和測試試劑盒應當利用基因組中確定且保守的DNA實體,并以較高頻率對在基因組中擴散的改變進行評分,由此,例如產生密集且良好分布的重組圖。
本說明書的方法和測試試劑盒應用分子標記或實體,它們作為簡單的Mendelian性狀是可遺傳的而且易于評分。該標記允許詳細研究遺傳性和變異性、連鎖圖的構成、以及攜帶特定連鎖基因的個體或譜系的診斷。先前已經使用過的表型和生化(酶)標記傾向于具有限制它們雜交能力的多態性程度較低、基因組位置相對較少的缺點,限制了可產生圖譜的密度,以及環境可變的表達、使評分和基因型的確定復雜。這些已經被基于DNA的方法取代,其產生指紋或分子標記,是所分辨的DNA片段的區別模式,例如,通過在瓊脂糖或丙烯酰胺凝膠中進行電泳而分離,并通過染色或標記而檢測。分子標記實質上是一種與基因組中特定物理位置相對應的核苷酸序列。它的存在或大小應當是多態性的,它充分改變,從而遵循其遺傳模式。
本發明的一般原理是提供一種方法和一種測試試劑盒,其應用含有永久性或非-永久性連接的可評分寡核苷酸序列的固相支持物或芯片,能夠識別基因組中的特定基因組位置。重要的是,應當對基因組中長度適合進行雜交和篩選的任何結構域進行評分。如果在雜交后用內切核酸酶進行消化,應當對這些位點內的多態性進行評分。內切核酸酶可裂解雜交樣品/寡核苷酸對內的不匹配或鼓泡。最終的斷裂導致雜交體不穩定,并釋放那些裂解的片段。
更具體而言,每個基因組位置的寡核苷酸序列可以三種基本不同類型的寡核苷酸存在,即它們可包含左側翼區(FL)組合可動因子(ME)的其中一個末端、右側翼區(FR)組合可動因子(ME)的另外一個末端或圍繞整合位點的左側翼區和右側翼區(FL+FR)的組合(圖2A)。所述寡核苷酸可一個接一個、成對或平行、或組合所有3種寡核苷酸類型使用。優選,每個基因組位置由某些確定的側翼區組合某些確定的可動因子(ME)代表,但因為同一可動因子(ME)可插入到不同的整合位點,還可使每個確定的可動因子(ME)與不同種類的側翼區組合。
本發明所用的寡核苷酸序列含有大約20個核苷酸,更優選至少25個,最優選超過30個核苷酸,以便在連接的寡核苷酸與樣品DNA之間提供足夠穩定的雜交產物。值得注意的是,寡核苷酸由2個獨特序列區組成,因此寡核苷酸應當足夠長,以便能夠與側翼區和可動因子(ME)雜交,或當缺失可動因子(ME)時,與所述可動因子(ME)整合位點兩側上的每個側翼區雜交。在本發明特定的實施方案中,代表側翼區的部分寡核苷酸排列可包含側翼于側翼區,從而使雜交更穩定且分辨度更好的區。因此,來源于寡核苷酸一部分的側翼區長度可大于代表可動因子(ME)末端的長度。每個寡核苷酸的長度是由它應當使所連接的寡核苷酸與樣品DNA之間的雜交產物足夠穩定的事實確定的。自然,兩個部分可以等長。
通常使用不止一組寡核苷酸,每組都能夠識別特異且確定的可動因子(ME)或基因組位置是否存在。優選,每個所要鑒定目標的同源物應當使用不止一個寡核苷酸對。例如,對于具有7個染色體對的二倍體生物而言,可計算出用于獲得最佳繪圖結果至少需要70-80組寡核苷酸對,每組代表特定的基因組位置或可動因子(ME)。對于具有更多染色體的生物而言,需要更多寡核苷酸。下限是一個寡核苷酸對,上限由所述方法和測試試劑盒的期望分辨能力而定。
優選通過任何常規的標記系統在原位記錄雜交,例如應用末端轉移酶和常規的可記錄標記。作為原位標記的一種選擇,雜交的樣品DNA可從固相支持物釋放,隨后與標記多核苷酸序列雜交,該標記多核苷酸序列與固相支持物上連接的每個原始寡核苷酸相對應。雜交任選是可逆的,且固相支持物可恢復至其原始狀態重新使用。
只要寡核苷酸與作為模板的基因組DNA雜交,那么就可將標記的雙脫氧核苷酸摻入到寡核苷酸的末端。與匹配寡核苷酸區相鄰的基因組位置上的核苷酸序列是已知的,因此,要摻入的特定核苷酸(A、C、G、T或U)是已知的(圖6)。
共-顯性評分是用成對的,即兩個,或平行的,即三個或更多寡核苷酸序列獲得的。一組成對的寡核苷酸能夠同時鑒定完全和空整合位點。該寡核苷酸組還可包含代表相同整合位點的三個或更多平行寡核苷酸,即這3個寡核苷酸可檢測可動因子(ME)的左和右末端以及缺少的可動因子(ME)。將所獲得的結果記錄為完全、空的、衰退或無效等位基因,并可用于區別雜合和/或純合基因型。就標記輔助的選擇(MAS)方法的使用而言,可提供信息的側翼序列DNA對的數量取決于序列對圖譜相對于已知目標基因的位置。
提供任選的雜交后處理,包括洗滌和消化是為了除去未與固相支持物上連接的寡核苷酸序列完全雜交的樣品DNA,例如在標記之前和之后進行。是否雜交是利用可記錄雜交狀態的任何方法記錄的。
本發明公開了一種技術,其使用與固相支持物連接的寡核苷酸組,每個寡核苷酸序列的其中一部分含有側翼于可動因子(ME)的區,所述寡核苷酸序列的另一部分含有可動因子(ME)的末端,或如果缺少可動因子(ME),含有相反的側翼位點。
因此,本發明的目的是提供一種檢測基因組變異的方法,該方法是以使用永久性或非永久性連接寡核苷酸的固相支持物檢測基因型集合體的任何已知位置中是否插入可動因子(ME)為基礎的。該方法可鑒定含有可動因子(ME)或缺少可動因子(ME)的基因組位置。目的是在具有較大基因型多樣性的確定種群集合體內提供所期望水平的分辨。該方法可進行共顯性評分,即區別雜合與純合基因型。本發明進一步涉及一種測試試劑盒,它含有一種或多種以可動因子(ME)插入為基礎檢測基因組變異的工具。
可動因子(ME)可以是任何類型的可動遺傳因子,包括DNA轉座子,如真核生物轉座子、細菌插入序列和細菌轉座子、逆轉錄轉座子,包括病毒-樣逆轉錄轉座子,如長末端重復序列(LTR)逆轉錄轉座子,例如吉普賽-樣和copia-樣因子(Kumar和Bennetzen,Amm.Rev.Genet.33479-532,1999),尤其是來源于大麥(BARE-1、BARE-2、BARE-3、Sukkula、Sabrina、Nikita、BAGY-1、BAGY-2等),非-病毒-樣逆轉錄轉座子,如非-LTR逆轉錄轉座子[例如,哺乳動物中的長散布因子(LINE)和短散布因子(SINE)以及人類的(Alu)序列],噬菌體等,非-自主因子,包括微型反向重復序列轉座因子(MITE)(Wessler等,Curr.Opin.Genet.Dev.5814-821,1995),它們是可動因子(ME)的高度缺失形式,或微型末端-重復序列逆轉錄轉座子(TRIM)(Witte等,Proc.Natl.Acad.Sci USA 9813778-13783,2001)。
在本發明的優選實施方案中使用逆轉錄轉座子,它近來已經被開發成滿足理想標記系統眾多需要的分子標記系統。優選逆轉錄轉座子是因為與可活動到位點外的DNA轉座子相比,它們轉座的復制方式可增加基因組位置狀態的穩定性,由此產生更有力的系統發育分辨力。
因此,本發明方法的背離點是將代表未標記總樣品DNA的單鏈寡核苷酸放在固相支持物上,所述支持物可由任何材料制成,攜帶不止一組永久性連接的、未標記的、序列-確定的寡核苷酸,代表,例如,可動因子(ME)和它們的插入位點連接點。
本發明的方法可使未標記的、任選斷裂的樣品總DNA與固相支持物上連接的不止一組寡核苷酸序列雜交,每個寡核苷酸序列由不定長度的兩個部分組成,一個部分含有側翼于可動因子(ME)的區,另一部分含有可動因子(ME)的末端或位于第一側翼區相反那側上的側翼區。
與固相支持物連接的是許多與可動因子(ME)整合位點相對應的寡核苷酸,即在所要測定的基因型有效集合體內被確立為多態的插入位點,從而獲得有意義的繪圖或指紋分析結果以及基因型之間的所需水平分辨力。事實上,這意味著對于在生物中評分的每個同源物,必須鑒定至少一個,優選更多組寡核苷酸。在某些情況下,甚至是單一的多態位點也可分辨各類基因型之間的基本分組。這種情況包括,例如,區別春大麥和冬大麥,細菌或真菌病原體株,或人類種群。
所述任選成對或平行的寡核苷酸序列的每一組都含有與完全位點相應的一個寡核苷酸序列,以及與空位點相應的另一個寡核苷酸序列。完全位點所含的寡核苷酸序列由兩個連續部分組成,其中一個部分含有可動因子(ME)的側翼區,另外一個部分含有可動因子(ME)的一個末端。與空位點相對應的寡核苷酸序列含有由相等或不同長度的兩個部分組成的寡核苷酸序列,其中一個部分是左側翼區(FL),另外一個部分是圍繞缺少可動因子(ME)位點的右側翼區(FR)。左側翼區(FL),例如,與可動因子(ME)的5′末端組合,右側翼區(FR),例如,與可動因子(ME)的3′末端組合,反之亦然。所述寡核苷酸可從兩個鏈制備,且它們可以任意組合的方式使用。它們可與寡核苷酸組合,該寡核苷酸可識別含有左側翼區和右側翼區(FL+FR)的空位點。
更具體而言,每個寡核苷酸序列由相等或不同長度的兩個部分組成,一個部分含有側翼于可動因子(ME)的區,另一部分含有可動因子(ME)的末端,或位于第一側翼區另一側上的側翼區。在可選擇性的實施方案中,代表側翼區的序列要長于代表可動因子(ME)的部分。
重要的是,代表可動因子(ME)的每組寡核苷酸中的3種不同類型的寡核苷酸都可用于本發明中(圖2A)。代表側翼區和可動因子(ME)末端的寡核苷酸可被設計成一個單一的連續序列,其通過連接區與固相支持物連接,且其序列對也被設計成一個單一的連續序列,通過獨立的連接區與固相支持物連接,該序列對含有圍繞整合位點的兩個側翼區并代表空位點。
在可選擇性實施方案中,可將寡核苷酸的側翼區和可動因子(ME)分開放在兩個獨立的連接區上,連接區與彼此靠近的固相支持物連接(圖2B)。含有圍繞整合位點的側翼區的相應序列對也通過其它連接區與固相支持物連接。
上述寡核苷酸的各個部分可用合成制備的延長序列,即一種所謂的莖序列提供(圖2C)。莖序列是與另一寡核苷酸上的相似區互補的區,用于使兩個寡核苷酸共同退火。因此,該莖序列可位于兩個寡核苷酸之間,這樣兩個寡核苷酸可共同與基因組位置的DNA序列雜交。所述部分互補的寡核苷酸通過與雙鏈末端連接的連接區與固相支持物連接。
還可獲得用于構建用于生產測試試劑盒的合成寡核苷酸序列的適宜核苷酸序列,例如,通過篩選細菌人工染色體(BAC)文庫,并對含有可動因子(ME)的區進行測序,或通過序列-特異性擴增的多態性(SSAP)方法獲得PCR產物,其可確定可動因子(ME)在特定基因組中的插入位點。基礎策略是通過被稱作反向-PCR的標準PCR過程或通過被稱作基因組步查的標準方法鑒定逆轉錄轉座子每一側上的側翼序列(Siebert等,Nucl.Acids Res.231087-1088,1995),然后使用獨特的側翼DNA序列使標記顯影。
在特定基因組位置側翼于可動因子(ME)的區可被用作引物,并與可動因子的引物組合,擴增是通過PCR方法進行的。分離所得PCR產物,并長征相應的序列。隨后,所述新的可動因子(ME)可用于鑒定新的側翼區,用于設計測試試劑盒中使用的側翼區PCR引物。當已鑒定了足夠數量的有效可動因子(ME)和側翼區時,它們可被用作生產寡核苷酸序列的模型,該寡核苷酸可用于制造測試試劑盒。
通過重組DNA技術或合成或半-合成產生的寡核苷酸可通過各種方法與固相支持物連接。寡核苷酸不應當空間受限,否則會干擾雜交。寡核苷酸序列任選被末端保護。寡核苷酸的末端保護是通過本身已知的方法進行的,選自,例如5′OH衍生化和氨基-衍生化。
未標記、任選斷裂的樣品總DNA可來源于任何樣品,來源于任何物種和/或來源于任何生物,例如,來源于植物、動物、人類、細菌、真菌和/或古老DNA。任選地,用物理、機械或酶方法,例如用常見切割酶進行酶消化或優選通過超聲處理將代表總DNA的DNA剪切成大約500bp或更小的片段。剪切的目的是物理分離在不同DNA碎片上評分的特定基因組位置,從而增加該方法的效率。通過本身已知的方法,例如在與其它類型雜交所用相似的緩沖液中煮沸,可將樣品DNA分離成單鏈狀態。
固相支持物包括膜、濾器、載玻片、平板、芯片、培養皿,它們可由選自玻璃、塑料、硝化纖維素、或混合組合物或雜交體培養基制成。
雜交反應發生的條件為使任選斷裂的單鏈樣品DNA退火于與固相支持物連接的全長寡核苷酸序列。
雜交通常是在適宜的緩沖液中,例如但不限制于6×SSC,0.05%焦磷酸鈉,0.1%SDS,如在常規實驗室實踐中所規定的(Ausubel等,2001John Wiley Sons,Inc.New York,vol.1.,unit 6.4.2.supplement13),在適宜的溫度下進行的,例如但不限制于53℃,通常為12℃,低于雜交體的確定解鏈溫度,考慮雜交緩沖液的鹽濃度。任選地,可使用緩沖液,如1×PCR緩沖液(50mM KCl、10mM Tris-HCl,pH9(25℃)、0.1%Triton-X 100、1.5mM MgCl2)。
雜交后,可在一定條件下進行任選的雜交后處理,一定條件包括鹽濃度和溫度,釋放未完全或幾乎完全與固相支持物上連接的寡核苷酸序列雜交的所有樣品DNA。任選的雜交后處理包括在不同的嚴格條件下,利用洗滌步驟除去未與固相支持物上連接的寡核苷酸序列完全雜交的單鏈樣品DNA,并進行任選的消化處理,從而除去不與所連接的寡核苷酸序列完全對應的單鏈樣品DNA片段。洗滌通常是利用熟知的培養過程在緩沖液中進行的,所述緩沖液含有,但不限制于6×SSC、0.05%焦磷酸鈉,溫度為65℃,或剛剛高于計算的雜交體解鏈溫度。
在本發明其中一個實施方案中,雜交的基因組片段,它們絕大部分顯著長于寡核苷酸,是通過在雜交之后,加入消化步驟而調整的。在消化步驟中,未雜交的寡核苷酸或部分雜交的單鏈寡核苷酸是通過用酶,如單鏈特異性核酸酶,優選一種外切核酸酶進行酶消化而除去的,在固相支持物上保留雜交的寡核苷酸。這種消化可產生更有效的雜交和更清楚的得分。在這種情況下,重要的是保護寡核苷酸末端免被消化。在洗滌和/或消化步驟結束時,固相支持物應當具有寡核苷酸,在其上面,與特定基因組位置相對應的樣品DNA片段有或沒有雜交。有些寡核苷酸是沒有雜交的,其它是雜交的。
然后按照上面所述檢測這些寡核苷酸,或,相反,可剝離攜帶寡核苷酸的固相支持物上的雜交樣品DNA,然后在固相支持物上與匹配每個原始寡核苷酸的標記寡核苷酸雜交。繼續第二組洗滌,記錄并觀察標記的雜交寡核苷酸。
記錄雜交步驟后,以這種可檢測它們雜交狀態的方式區別雜交和未雜交寡核苷酸。每對寡核苷酸序列是否雜交是利用可記錄雜交狀態的任何方法進行的。
在其中一個實施方案中,利用末端轉移酶的酶作用延伸雜交的DNA,提供與具有標記、永久性連接的寡核苷酸雜交的基因組樣品DNA,并提供選自放射性、熒光、酶、免疫化學、化學和親和標記的標記而記錄(檢測)雜交狀態。化學標記是,例如生物素。然后通過與標記類型相應的常規方法檢測標記的延伸。
在本發明的特定實施方案中,免疫化學標記是一種能夠檢測酶促摻入到與寡核苷酸雜交的DNA中的生物素的抗體,其與催化熒光或顯色反應的酶連接。
在另一實施方案中,雜交狀態是通過使用不與基因組位置相對應的、含有標準化尾部的寡核苷酸,用改進的微型-測序反應檢測的,在反應中,雜交片段可作為在尾部延伸的引物。微型-測序反應可摻入標記核苷酸,然后對它們進行檢測。實質上,可使用區別寡核苷酸雜交與未雜交狀態的任何方法。
在另一特殊實施方案中,將寡核苷酸的一端生物素化,并固定在涂覆了鏈霉抗生物素蛋白的聚苯乙烯珠上。檢測將通過在寡核苷酸序列上加入一個堿基延伸而檢測,所述堿基與基因組序列本身的堿基不同。隨后,將使用具有熒光標記的雙脫氧寡核苷酸的延伸。因為已知寡核苷酸后什么堿基是標準的,因此可以這種方式消除某些背景。左側翼/右側翼(FL/FR)位點所用的寡核苷酸事實上是其它兩個位點的反向寡核苷酸(即,代表另一條鏈)。這樣做是為了降低背景,因為寡核苷酸的左側翼(FL)和右側翼(FR)部分不與左側翼/可動因子(FL/ME)和可動因子/右側翼(ME/FR)中的左側翼(FL)和右側翼(FR)共有。
在另一實施方案中,寡核苷酸依靠在生物合成過程中連接的生物素部分結合。該方法的關鍵在于區別兩種狀態,其中一種狀態是探針-樣品DNA雜交體為完全雙鏈的,另外一種狀態是雜交體為部分雙鏈的,這是因為樣品DNA與探針不完全同源。這兩種狀態相當于可動因子的完全插入位點左側翼/右側翼(FL/ME)的探針與僅含空位點片段左側翼/右側翼(FL/FR)的樣品DNA雜交;在這種情況下,左側翼(FL)節段將雜交,但探針的可動因子(ME)部分不會被與FL相鄰的探針DNA區覆蓋。該寡核苷酸對應于檢測探針和各自完全互補或半長互補的寡核苷酸。實驗中使用可區別的雜交溫度,即可使全長雜交體保持退火,而半長雜交體解鏈的溫度。為了檢測成功解鏈處理、雙鏈的探針/樣品雜交體與單鏈探針之間的差異,使用染料(PicoGreenMolecularProbes,Inc)。按照制造商PicoGreen特別檢測dsDNA。測定混合物很可能在解鏈后,含有ssDNA(單鏈)、dsDNA(雙鏈)、和半-ss-半-dsDNA的混合物。ssDNA-特異性核酸酶處理用于除去ssDNA。
在檢測方法中,如圖3所示,寡核苷酸是用不匹配側翼序列的一個或多個堿基延伸提供的。可檢測標記通過雜交DNA延伸而摻入。圖6顯示,加入了標記的雙脫氧核苷酸,其可被摻入到寡核苷酸末端,提供與作為模板的基因組DNA雜交的寡核苷酸。
含有與基因組中特定基因組位置相應的可評分寡核苷酸的本發明方法及測試試劑盒的概念十分普遍。因此,長度適于雜交和篩選的基因組中任何結構域都可被評分。如果雜交后用內切核酸酶消化,那么可評分這些位點內的多態性。內切核酸酶可裂解雜交樣品/寡核苷酸對內的不匹配或鼓泡。最終的斷裂導致雜交體不穩定,并釋放那些裂解的片段。
分別對可記錄的雜交模式評分,其中是否雜交可表示可動因子(ME)插入是否存在。對每個基因組位置進行共-顯性評分,其中使用側翼序列和側翼/可動因子(ME)寡核苷酸作為任選成對或平行的組,以便能夠對下列待區別的等位基因進行二倍體基因型分析完全、空的、衰退或無效等位基因。對于共-顯性評分而言,構建用于鑒定空和完全位點的寡核苷酸需要至少兩個側翼寡核苷酸序列連同可動因子(ME)序列。當空寡核苷酸和完全寡核苷酸產生非-雜交反應時,評分對應于基因組位置損失或更準確地說,對應于與基因組位置雜交能力損失的無效或衰退等位基因。然后根據常規的共顯性標記系統分析該數據。
將得分記錄為″差分表″,其中,例如,垂直列出目錄,水平列出評分的基因組位置。在表上的每個空格中填入分值,2代表純合的完全/完全,1代表雜合,0代表純合的空/空。衰退或無效被記為遺漏數據(-)。然后利用適合特定問題的方法分析數據。遺傳距離可使用Nei及合作者的方程,從差分表評估(Nei和Li,Proc Natl Acad SciUSA 765269-5273,1979;Saitou和Nei,Mol.Biol.Evol.4406-425,1987)。樹(進化樹)可通過鄰接而構造(Saitou和Nei,Mol.Biol.Evol.4406-425,1987),或統計學差異可用主成分分析或其它標準試驗評估。現有用于此目的的軟件包(Bevan和Houlston,Mol.Biotechnol.1783-89,2001;Tores和Barillot,Bioinformatics17174-179,2001)。
本發明的雜交、洗滌、記錄和評分全部都是自動化的。在其中一個實施方案中,用與樣品DNA雜交的固定寡核苷酸處理固相支持物是在具有自動化處理步驟、為特定目的而制造的腔室內進行的。正如上面所討論的,包括雜交、雜交后處理、雜交狀態記錄和評分在內的步驟都可以是自動化的。
在優選實施方案中,測試試劑盒包括DNA芯片數據收集裝置(DCD)。DNA芯片DCD是一種便攜式半-固體狀態裝置,其中可裝載、掃描和評分DNA芯片。本發明DNA芯片DCD的開發和制造是本領域熟知的(US 5,445,934,US 5,510,270,US 5,744,305,US 5,700,637)。
雜交的樣品DNA是從固相支持物釋放的,隨后與標記的寡核苷酸序列雜交,該標記的寡核苷酸序列相應于固相支持物上連接的每個原始寡核苷酸序列。顯影和觀察的過程可逆很有用,但并不十分重要,在于具有固定寡核苷酸的固相支持物可恢復至其原始狀態并重新使用。
在本發明用于共-顯性評分的優選實施方案中,還包括下列步驟。
寡核苷酸是在含有不止一組任選成對或平行的單鏈寡核苷酸序列的固相支持物上提供的,所述每個寡核苷酸序列都含有一個與完全位點相對應的寡核苷酸序列,和另外一個與空位點相對應的寡核苷酸序列,其中完全位點含有由兩個部分組成的寡核苷酸序列,其中一個部分含有可動因子(ME)的側翼區,另外一個部分含有可動因子(ME)的末端,與空位點相對應的寡核苷酸序列含有由兩個部分組成的寡核苷酸序列,其中一個部分是左側翼區(FL),另外一個部分是圍繞缺失可動因子(ME)的右側翼區(FR)。
在第一步中,用物理、機械或酶方法任選剪切代表樣品總DNA的樣品DNA,從而獲得在不同DNA碎片上區別的生物的可動因子(ME)。
此后,在使樣品DNA退火于全長寡核苷酸序列的條件下,使斷裂的單鏈樣品DNA與固相支持物上連接的單鏈寡核苷酸序列雜交。未雜交或部分雜交的樣品DNA是通過任選的雜交后處理除去的,可包括在不同的嚴格條件下進行的一個或多個洗滌步驟和酶消化,以防止單鏈寡核苷酸序列從相連的探針伸出,干擾標記以及隨后結果的記錄。
雜交狀態是通過提供與具有可記錄標記的相連寡核苷酸序列雜交的樣品DNA而記錄的。
在利用記錄雜交狀態的任何方法記錄每對寡核苷酸序列是否雜交之前,可在不同的嚴格條件下應用任選的洗滌步驟。上述方法可對可記錄的雜交模式評分,其中雜交是否存在可表示插入位點中是否存在可動因子(ME)。該方法是共-顯性的。
本發明將在下列實施例中更加詳細的描述,其中本發明可應用于某些植物。這些實施例不應當被解釋為將本發明范圍限制在所述舉例的生物。本領域的技術人員應當明白,所述方法和測試試劑盒可用于證實任何生物和任何樣品的遺傳多樣性。
實施例實施例1用于設計寡核苷酸的側翼序列的鑒定(a)序列特異性擴增的多態性(SSAP)方法(現有技術)1.SSAP反應是按照上面所述(Waugh等,Mol.Gen.Genet.253687-694,1997),使用Taq或所述其它耐熱聚合酶及試劑,在熱循環儀(Applied Biosystems GeneAmp System 9700)中進行的。引物包括一個被設計與BARE-1的長末端重復序列相對應的引物,BARE-1可能加入了選擇性堿基,如SSAP所述(Waugh等,Mol.Gen.Genet.253687-694,1997),另一個引物是PstI SSAP接頭引物。BARE-1引物與3′末端上具有一個額外A選擇性堿基的因子的前19個堿基互補。PstI接頭引物是GACTGCGTACATGCAG(SEQ ID NO1)。模板DNA是通過對樣品DNA,如大麥DNA進行PstI和MseI消化獲得的。該DNA是使用DNeasy植物微型試劑盒(Qiagen product 69103)通過標準方法產生的。
2.丙烯酰胺測序凝膠是按照標準過程制備的(Ausubel等,CurrentProtocols in Molecular Biology,John Wiley & Sons,Inc.,New York,1995),以匹配標準垂直丙烯酰胺電泳設備(Hoeffer SQ3測序儀,Amersham Pharmacia Biotech目錄號80-6301-16)。電泳分離是按照設備提供的說明書進行的。選擇目錄中的多態帶,即目標帶。自含有目標帶的目錄,從凝膠上將該帶切除下來,然后浸漬在100μl TE緩沖液(Tris-EDTA,10mM Tris-HCl,pH8.0,1mM NaEDTA,pH8.0,Ausubel等,Current Protocols in Molecular Biology,John Wiley & Sons,Inc.,New York,1995)中。
3.目標帶中的DNA,它是從凝膠上切除下來的,并在步驟2中洗脫,是在與步驟1中SSAP所用相同的條件下,按照步驟1所述,用原始引物進行PCR擴增的,其中使用作為模板的提取帶的100μl洗脫物中的0.5μl循環25次。
4.使用商業測序裝置或可選擇性地任何標準測序儀器(AppliedBiosystems ABI Prism 3700 DNA Analyzer)以及制造商的試劑和方案,對切除并提取過的帶的DNA進行測序,以確定與可動因子(ME)的側翼區序列。
5.從側翼區,兩個嵌套引物,它們的位置盡可能遠離可動因子(ME)并具有與可動因子(ME)匹配的解鏈溫度(對于BARE-1而言,它是60-65℃),被設計成向著可動因子(ME)插入的方向擴增。
6.該引物(步驟5中制備的)與PstI消化且與接頭連接的DNA組合使用,該DNA源于缺少從SSAP凝膠所見到的插入的目錄。
7.在進行連續35次PCR循環時,作為引物,首先使用來自側翼區的外引物,然后是來自側翼區的內引物,而作為模板,使用100μl提取帶中的0.5μl。
8.通過在標準瓊脂糖凝膠上進行電泳分離來檢查PCR產物的大小和產率,瓊脂糖的百分比是由預期的大小測定的。高產率帶應當出現在最后的擴增中。按照上面所述對產物進行測序,產生可動因子(ME)整合位點的原始側翼及另一側匹配側翼的序列。通過設計其它側翼的引物并證實缺少SSAP帶目錄的空位點擴增,可知插入是合理的。
9.通過上述步驟獲得的側翼序列可用于設計與固相支持物連接的寡核苷酸。
(b)基因組步行策略(現有技術)該方法主要是遵循Siebert等,Nucl.Acids Res.231087-1088,1995)的方法,使用基因組步行者TM試劑盒(BD BiosciencesClonetech,Palo Alto,USA),按照制造商的說明進行的。
該方法遵循用于測定一個側翼的實施例1a所述的步驟。
該步驟之后,用試劑盒中詳列的限制酶,連接的接頭及接頭-引物以及側翼區引物建立基因組-步行者庫。每個庫主要帶的序列應當與同一位點一致。換言之,側翼序列應當是相同的,在其上面,可動因子(ME)被插入到含有可動因子(ME)的等位基因中。此后,重復實施例1中描述的步驟8和9。
與可動因子(ME)的獨特側翼區相對應的多核苷酸是按照上述方法鑒定的。分別與長末端重復序列(LTR)和側翼區相對應的引物可用于進行基于逆轉錄轉座子的微衛星擴增的多態性(RBIP)擴增,如Flavell等(Plant J.16643-650,1998)所述。對基因型進行RBIP分析,其中所述基因型與很可能要進行分析并根據特定應用加以區別的基因型范圍相對應。選擇可有效區別這些基因型的引物對進行進一步的研究。每種情況下的側翼區是用可動因子(ME)和側翼引物,被測序的區進行PCR擴增的,且多核苷酸是以它們的序列為基礎合成的。
實施例2玉米中基因組變異的檢測本方法用于檢測玉米(Zea mays L.)的多態性,對于近交系BSS53內的22kDa α玉米醇溶蛋白基因簇而言,使用可動因子Zeon-1,核苷酸數據庫登記號AF090447(346296bp),且在Heartbreaker(Hbr)微型反向重復序列轉座因子(MITE)上,一種因子的多態性插入片段以及用作分子標記的用途描述于Zhang等,Proc.Natl.Acad.Sci.USA97(3)1160-1165,2000和Casa等,Proc.Natl.Acad.Sci.USA 97(18)10083-10089,2000。
如Zhang等,Proc.Natl.Acad.Sci.USA 97(3)1160-1165,2000所述,一個Hbr7(登記號AF203730)(SEQ ID NO2)(現有技術)因子在左側上具有基因組側翼序列CGGACGCGCCAGCCAT(SEQ IDNO3),在右側上具有CATCCTTTGCTTTGGT(SEQ ID NO4)(圖5,Zhang等,Proc.Natl.Acad.Sci.USA 97(3)1160-1165,2000),CAT是通過因子插入而產生的末端同向重復序列。
已知這些序列,左側翼/可動因子(FL/ME)寡核苷酸可被設計為5′CGCCAGCCATgggtctgttt3′(SEQ ID NO5)(小寫的Hbr),完全雜交探針的估計Tm為58.4℃,半雜交體的估計Tm分別為37.5℃(FL)和29.0℃(ME)。
可動因子/右側翼(ME/FR)寡核苷酸可被設計為5′aaacagggccCATCCTTTGC 3′(SEQ ID NO6),完全雜交探針的估計Tm為58.5℃(ME),半雜交體的Tm為34.4℃(ME)和30.3℃(FR)。
左側翼/右側翼(FL/FR)寡核苷酸可被設計為5′GCGCCAGCCATCCTTTGC 3′(SEQ ID NO7),在該點為從來沒有先前HbrMITE插入的空位點的情況下,完全雜交體的估計Tm為58.0℃。因為MITE因子被認為按照與DNA轉座子相同的方式切除,因此該基因組位置的第二種形式可在某些植物目錄中存在,反映剩余雙-重復序列″足跡″(用粗體表示)的切除事件。這將是5′GCGCCAGCCATCATCCTTTGC 3′(SEQ ID NO8),并具有62.6℃的Tm。
這些寡核苷酸是合成的、任選末端-保護的,并與芯片(固相支持物)連接,且代表玉米的單一基因組位置。另外50個或更多基因組位置的寡核苷酸是用基于上述側翼和因子測序的方法,針對Heartbreaker或其它微型反向重復序列轉座因子(MITE)衍生的(Zhang等,Proc.Natl.Acad.Sci.USA 97(3)1160-1165,2000;Casa等,Proc.Natl.Acad.Sci.USA 97(18)10083-10089,2000)。
在另一實施例中,從玉米數據庫登記號AF090447(含有包括玉米22kDaα玉米醇溶蛋白簇在內的346296bp連續區),找到了Zeon-1 LTR逆轉錄轉座子。該因子的100bp左側翼(FL)區是SEQ ID NO9且使用BLAST不能產生與玉米重復因子的任何匹配。該因子的100bp左側翼(FL)區是SEQ ID NO10且使用BLAST不能產生與玉米重復因子的任何匹配。
Zeon-1 LTR的左端是5′TGTTGGGGGCCTTCGGCTTCCGAAGGTCCTCAAAAACAAGATTTAACTG3′(SEQ ID NO11),Zeon-1 LTR的右端是5′TGTGTTGCCTTGTTCTTAATTCATAGCATTTGAGAACAAGTCCCCAACA3′(SEQ IDNO12),即加下劃線的LTR內的8bp末端反向重復序列。
該基因組位置上的左側翼/可動因子(FL/ME)連接點是CTAACCTGAAAGGTACTGTTGGGGGC......(SEQ ID NO13),可動因子/右側翼(ME/FR)的連接點是......AAGTCCCCAACAGGTACCCACTGGTAGCCCT(SEQ ID NO14),其中用粗體字表示通過插入產生的同向重復序列,在左和右LTR的末端下面加下劃線,中間插入的Zeon-1序列用圓點表示。
以這些序列為基礎,左側翼/可動因子(FL/ME)寡核苷酸可被設計為5′TGAAAGGTACTGTTGGGGGC3′(SEQ ID NO15),完全雜交寡核苷酸的Tm為54.4℃,左側和右側半雜交體的Tm分別為25.4℃和36.9℃。
可動因子/右側翼(ME/FR)寡核苷酸可被設計為5′GTCCCCAACAGGTACCCACTG3′(SEQ ID NO16),完全寡核苷酸的Tm值為54.7℃,ME半-雜交體為31.5℃,FR半-雜交體為31.2℃。
左側翼/右側翼(FL/FR)寡核苷酸可被設計為5′CTGAAAGGTACCCACTGGTAGC3′(SEQ ID NO17),Tm為53.7℃。應當注意的是,就其它逆轉錄轉座子左側翼/右側翼(FL/FR)寡核苷酸而言,在未間斷天然位點中,插入產生的同向重復序列僅以1個,而不是2個拷貝存在。
這些寡核苷酸是合成、任選末端-保護的,并與芯片連接,代表玉米的單一基因組位置(圖3)。其它LTR逆轉錄轉座子的另外50個或更多基因組位置的寡核苷酸可按照實施例1衍生。
此外,寡核苷酸左側翼/可動因子(FL/ME)(SEQ ID NO26)、右側翼/左側翼(FR/FL)(SEQ ID NO27)和右側翼/可動因子(FR/ME)(SEQ ID NO22s)在圖6提出的方法中使用。選擇這些寡核苷酸,這樣不同的核苷酸將作為雙脫氧延伸中的下一個核苷酸(分別A、G、C和T或U)而摻入。
實施例3樣品DNA的制備DNA是通過CTAB法(Ausubel等,Current Protocols in MolecularBiology,John Wiley & Sons,Inc.,New York,1995)制備的,并按照其中所述進行RNA酶處理。可選擇性地,使用商業制備系統(Qiagen′s試劑盒,DNeasy,或臨床樣品的基因組頂端)。在沒有進行任何制備步驟前,利用超聲裝置對DNA進行超聲處理。超聲處理在高DNA濃度,如10μg/μl下最有效。使用具有20kHz輸出頻率和350瓦最大功率以及針狀探針probel 40 TL(目錄號853 811/5)的適宜設備(B.Braun Biotech International Labsonic)對DNA進行超聲處理。超聲處理是用50%工作循環和大約10-20%的功率水平(″低″),優選在冰上進行的,時間為10-20分鐘,或進行的時間使樣品粘度明顯降低,且DNA片段大小降低至大約500bp或更小。通過任意方法將樣品DNA剪切成小(大約500bp或更小)碎片,包括用常見的(如4-堿基)限制酶或(優選的)超聲處理。剪切的目的是物理分離在DNA不同碎片上評分的特定基因組位置,從而增加該過程的效率。
實施例4記錄雜交雜交記錄步驟遵循,并包括區別雜交和未雜交的寡核苷酸,以這種方式可檢測它們的雜交狀態。在其中一個實施方案中,(圖3E)雜交基因組DNA是通過末端轉移酶的酶作用延伸的,其中使用放射性標記的、熒光、或化學標記的(例如,生物素)寡核苷酸。然后利用與標記類型相應的常規方法檢測標記的延伸。在另一實施方案中,在不與基因組位置相對應的5′末端上,寡核苷酸含有標準化的尾部。然后,雜交片段可作為改進的微型-測序反應中,在尾部按典型的5′-->3′方向擴展的引物。微型-測序反應可摻入標記的寡核苷酸,然后檢測它們。本質上,可區別寡核苷酸雜交和未雜交狀態的任何方法都可使用。有用但并不必要的是顯影和觀察的過程可逆,其中芯片可恢復至其原始狀態并重新使用。
實施例5所記錄雜交模式的評分然后對所記錄的雜交模式進行評分。評分是對每個基因組位置進行的,使用側翼寡核苷酸和側翼/可動因子(ME)寡核苷酸。如此可將下列等位基因區別為完全、空的、和無效或衰退。然后用常規的共顯性標記系統對數據進行分析。將得分記錄為″差分表″,其中,例如,目錄是垂直列出的,且表的水平方向列出評分的基因組位置。在表的每個空格中填入分值,2代表完全/完全,1代表雜合,0代表空/空。衰退或無效被標記為遺漏數據(-)。然后通過適合特定問題的方法分析數據。使用Nei及合作者的方程式根據差分表評估遺傳距離(Nei和Li,Proc.Natl.Acad.Sci.USA 765269-5273,1979;Saitou和Nei,Mol.Biol.Evol.4406-425,1987)。樹(進化樹)可通過鄰接(Saitou和Nei,Mol.Biol.Evol.4406-425,1987)構造,或統計學差異可用主成分分析或其它標準試驗評估。現有用于此目的的軟件包。譜系分析同樣可根據這些數據進行。用于此的方法和軟件在本領域中是已知的,例如Kindred和Gap(Bevan和Houlston,Mol.Biotechnol.Jan;17(1)83-9,2001;Tores和Barillot,Bioinformatics 2001 Feb;17(2)174-9,2001)。
本說明書的雜交、洗滌、記錄和評分所有都是自動化的。在其中一個實施方案中,所述處理是在為特定目的而造的、具有自動化處理步驟的腔室內進行的。
實施例6大麥基因組變異的檢測本方法用于檢測大麥(大麥)的多態性,其中使用可動因子BARE-1。多態性是使用逆轉錄轉座子間擴增多態性(IRAP)和逆轉錄轉座子微衛星擴增的多態性(REMAP)檢測的,利用IRAP和REMAP法及BARE-1 LTR引物篩選春大麥和冬大麥的繁殖植物。
在REMAP中使用引物7286(GGAATTCATAGCATGGATAATAAACGATTATC)(SEQ ID NO18)和(CTC)9C(SEQ ID NO19),經鑒定多態帶只存在于春大麥中而不存在于冬大麥中。該帶是從溴化乙錠染色的瓊脂糖凝膠上切除下來的,并被克隆和測序。1767nt序列sb17(SEQ IDNO20)在圖7中給出。在BARE-1插入的LTR下面加下劃線。它代表與可讀框有義方向相反的LTR末端。通過插入產生的預測5bp同向重復序列CCACT在圖7中用粗斜體字表示。
與該帶相對應的區同樣是從冬大麥克隆的。冬大麥在該基因組位置缺少BARE-1插入。3186nt序列wb17(SEQ ID NO21)在圖8中給出。該序列與上述sb17序列(SEQ ID NO20)幾乎完全相同,區別在于它缺少BARE-1序列。BARE-1在sb17(SEQ ID NO20)中的插入位點是用圖8wb17(SEQ ID NO21)序列中的箭頭標記的,并位于wb17(SEQ ID NO21)的核苷酸1511和1512之間。這些側翼核苷酸下面加了下劃線。在sb17(SEQ ID NO20)中形成同向重復序列的5bp序列在圖8中用粗體字表示。
已知sb17序列(SEQ ID NO20),一個23nt右側翼/可動因子(FR/ME)寡核苷酸可被設計為5′tatttccaacaCCCACTTCCTCG3′(SEQ IDNO22)(小寫的BARE-1),完全雜交探針的估計Tm為57.8℃,半-雜交體的估計Tm分別為38.2℃(FR)和28.6℃(ME)。可動因子/左側翼(ME/FL)側翼于區可以下列方式分別從BARE-1 LTR預測,預測的5bp同向重復序列,和wb17(SEQ ID NO21)序列預測(圖9a)。SEQ IDNO23代表反向BARE-1 LTR的前100nt,和對sb17(SEQ ID NO20)5′連接區預測的大約100nt。側翼和插入的可動因子(ME)在圖9b中給出。
左側翼/可動因子(FL/ME)是GTAAGTGCGGGGCCCACGGCACCACTTGTTGGGGAACGTCGCATGG(SEQ ID NO24),右側翼/可動因子(FR/ME)是CCTCTAGGGCATATTTCCAACACCACTTCCTCGTGCTCCTCCTCAACTTC(SEQ IDNO25)。
這些寡核苷酸是合成、任選末端保護的,并與芯片連接,代表玉米的單一基因組位置。另外50個或更多基因組位置的寡核苷酸是以相似方式衍生并處理的。
寡核苷酸,例如可動因子/右側翼(ME/FR)的一端被生物素化。這樣即可與固相支持物連接。引入剪切DNA,并在″非-許可″溫度下雜交,即半-雜交體不粘著。將熒光標記的、4種ddNTP中的每一種加入到試管中。將與寡核苷酸末端后的下一個堿基相對應的ddNTP摻入到寡核苷酸的末端。另外3個反應是對照組,它們被預測不會產生摻入的ddNTP。這樣可控制識別的特異性。該反應是在循環儀中建立的,且經過大約5個解鏈、退火和延伸的循環,以增加靈敏度。然后,在鏈霉抗生物素蛋白苯乙烯珠上捕獲生物素標記,測量熒光素的熒光。
在該實施方案中,寡核苷酸延伸,以致它不能重新使用,而不是加入的基因組DNA。如此可消除對核酸酶調整步驟的需要,因為寡核苷酸發生雜交,且可使得剪切變得并不必需。
在更復雜的情況中,反應是在具有與平板預-連接的寡核苷酸的微量滴定平板上進行的,每次一個孔。
實施例7雜交狀態的區別寡核苷酸是在生物合成過程中,依靠所連接的生物素部分結合的。該方法的關鍵是區別兩種狀態,其中一種狀態是探針-樣品DNA雜交體為完全雙鏈的,另外一種狀態是雜交體為僅部分雙鏈的,這是因為樣品DNA與探針不完全同源。這兩種狀態對應于可動因子(ME)完全插入位點左側翼/可動因子(FL/ME)的探針與只含空位點片段左側翼/右側翼(FL/FR)的樣品DNA雜交;在這種情況下,左側翼(FL)節段將雜交,但探針的可動因子(ME)部分不會被與左側翼(FL)相連的探針DNA區所覆蓋。
所述寡核苷酸,如下面詳細描述的,與檢測探針相對應,且分別是完全互補或半長互補的寡核苷酸。在實驗中使用區別性雜交溫度,即可使全長雜交體保持退火而半長雜交體解鏈的溫度。
(a)樣品DNA作為樣品DNA,使用寡核苷酸,如下面詳細描述的,它與檢測探針相對應,且分別是完全互補的或半長互補的寡核苷酸。3個不同的單鏈序列代表了樣品DNA的3種不同的基因組狀態,即可動因子(ME)(F0740;SEQ ID NO30),右側翼/可動因子(FR/ME)(F0739;SEQ IDNO29)和右側翼/左側翼(FR/FL)(F0738;SEQ ID NO28),即空位點。
雙鏈□DNA被用作標準品。
*DNA樣品F0738 5′CAC GGC ACC ACT TCC TCG TGC3′ FR/FL SEQ ID NO28F0739 5′GAG GAA GTG GGT GTT GGA AATA3′ FR/ME SEQ ID NO29F0740 5′CTC CTT CAC CCT GTT GGA AATA3′ ME SEQ ID NO30(b)探針兩個單鏈寡核苷酸代表右側翼/左側翼(FR/FL)(E2458;SEQ IDNO27)和右側翼/可動因子(FR/ME)(E2460;SEQ ID NO22)E2458 5′AGC ACG AGG AAG TGG TGC CGT G3′ FR/FL SEQ ID NO27E2460 5′TAT TTC CAA CAC CCA CTT CCT CG3′ FR/ME SEQ ID NO22用作探針的寡核苷酸是生物素化的。
(c)方法雜交是用下列反應混合物進行的。使用不同濃度的(1μg、0.5μg、0.1μg、50pg和25pg)生物素化寡核苷酸(E2458或E2460)和其它寡核苷酸(F0738、F0739或F0740)。調節MQ-水的量,使總反應體積等于50μl。
反應混合物xμg 生物素化的寡核苷酸(E2458或E2460)
xμg 其它寡核苷酸(F0738、F0739或F0740)5μl 10xTE+2000mM NaClxμl MQ-水50μl 總體積*生物素化寡核苷酸與固相支持物的連接使不同濃度,1μg、0.5μg、0.1μg、50pg和25pg的生物素化寡核苷酸(E2458或E2460)與固相支持物連接。將涂覆過鏈霉抗生物素蛋白的平板(DELFIA鏈霉抗生物素蛋白微量滴定平板,Wallac Oy)用作固相支持物。將上述反應混合物中的寡核苷酸及MQ-水吸量到涂覆過鏈霉抗生物素蛋白的平板上,在平板搖動器上振搖30分鐘混合。
*雜交加入相同濃度作為生物素化寡核苷酸的其它寡核苷酸(F0738、F0739或F0740)和1xTE+200mM NaCl。在水浴中加熱反應混合物至65℃,培養30分鐘。培養過后,將反應混合物冷卻至室溫(25℃)。
雜交的寡核苷酸對為1A FR/ME,單獨的ME互補序列(F0740、E2460)1B FR/ME,FR/ME互補序列(F0739、E2460)1C FR/FL,FR/FL互補序列(F0738、E2458)*外切核酸酶T處理雜交后,用外切核酸酶T處理雜交的寡核苷酸對,從而除去游離的ssDNA。所述處理在具有所連接寡核苷酸的平板上的反應混合物中進行。
反應混合物50μl雜交寡核苷酸對(1A、1B或1C)10μl10xNE緩沖液0.2μl 外切核酸酶T(5U/l)39.8μl MQ-水
100μl 總體積反應物在25℃(室溫)培養1小時。將反應物加熱至45℃,培養2分鐘。該溫度對于半-雜交體是非-許可的。
*檢測為了檢測成功解鏈-處理過的、雙鏈探針/樣品雜交體與單鏈探針之間的差異,使用PicoGreen染料(Molecular Probes,Inc)。按照制造商PicoGreen特異性檢測dsDNA。在解鏈之后,測定混合物很肯能含有ssDNA(單鏈)、dsDNA(雙鏈)、和半-ss-半-dsDNA的混合物。不可能從制造商處獲得有關從ssDNA預期有多少熒光的確切信息。在本實驗中,明確的結果只能從解鏈與ssDNA-特異性核酸酶處理相結合除去ssDNA來獲得。
新鮮的PicoGreen工作溶液是通過在來自PicoGreen原液的1xTE中稀釋200-倍而制備的。向每個孔中加入100μl picogreen工作溶液,然后在平板搖動器中混合。將100μl Picogreen工作溶液和100μl 1xTE用作空白。將樣品在黑暗中培養5分鐘。培養過后,測量每份樣品的熒光(激發485nm、發射535nm)。將平板閱讀器的增益設定設置為使信號背景水平最佳化的值。
*結果雜交結果在表1中提出。
表1(平均值-零)和標準差零孔平均244
*結論通過熒光反應的2-到3-倍差異可區別半雜交體(1A)與完全雜交體(1B、1C)。半-雜交體和完全-雜交體的區別是一致的,且足以應用。
實施例8基因組DNA背景中雜交狀態的區別該實驗按照實施例8所述進行,區別在于將與剪切大麥DNA混合的寡核苷酸用作樣品DNA。
(a)樣品DNA使用通過超聲處理的剪切的大麥DNA(繁殖植物Bomi)作為樣品DNA,如下所述,所用的寡核苷酸與檢測探針相對應,且分別是完全互補或半長互補的寡核苷酸。3種不同的單鏈序列代表3種不同的樣品DNA基因組狀態,即可動因子(ME)(F0740;SEQ ID NO30)、右側翼/可動因子(FR/ME)(F0739;SEQ ID NO29)和右側翼/左側翼(FR/FL)(F0738;SEQ ID NO28),即空位點。
將雙鏈□DNA用作標準品。
*DNA-樣品F0738 5′CAC GGC ACC ACT TCC TCG TGC3′FR/FL SEQ ID NO28F0739 5′GAG GAA GTG GGT GTT GGA AATA3′ FR/ME SEQ ID NO29F0740 5′CTC CTT CAC CCT GTT GGA AAT A3′ ME SEQ ID NO30向每種反應物中加入剪切的大麥DNA。
(b)探針兩個單鏈寡核苷酸代表右側翼/可動因子(FR/ME)(E2460;SEQ IDNO22)和右側翼/左側翼(FR/FL)(E2458;SEQ ID NO27)。
E2458 5′AGC ACG AGG AAG TGG TGC CGT G3′ FR/FL SEQ ID NO27E2460 5′TAT TTC CAA CAC CCA CTT CCT CG3′ FR/ME SEQ ID NO22
用作探針的寡核苷酸是生物素化的。
(c)方法雜交是使用下列反應混合物進行的。使用不同濃度(1μg、0.5μg、0.1μg、50pg和25pg)的生物素化寡核苷酸(E2458或E2460)和其它寡核苷酸(F0738、F0739或F0740)。調節MQ-水的量,使總體積等于50μl。
反應混合物xμg生物素化寡核苷酸xμg其它寡核苷酸10ng剪切的大麥DNA5μl10xTE+2000mM NaClxμlMQ-水50μl 總體積*生物素化寡核苷酸與固相支持物的連接使不同濃度,50pg和100pg的生物素化寡核苷酸(E2458或E2460)與固相支持物連接。將涂覆過鏈霉抗生物素蛋白的平板(DELFIA鏈霉抗生物素微量滴定平板,Wallac Oy)用作固相支持物。將上述反應混合物中的寡核苷酸及MQ-水吸量到涂覆過鏈霉抗生物素蛋白的平板上,并通過在平板搖動器上振搖30分鐘而混合。
*雜交使用前,將剪切的大麥DNA加熱至96℃5分鐘,立即在冰上冷卻。將相同濃度作為生物素化寡核苷酸的大麥DNA和其它寡核苷酸(F0738、F0739或F0740)混合,加入1xTE+200mM NaCl。將反應混合物在水浴中加熱至65℃,并培養30分鐘。培養之后,使反應混合物冷卻至室溫(25℃)。
雜交的寡核苷酸對是1A FR/ME,單獨的ME互補序列(F0740、E2460)
1B FR/ME,FR/ME互補序列(F0739、E2460)1C FR/FL,FR/FL互補序列(F0738、E2458)*外切核酸酶T處理雜交后,用外切核酸酶T處理雜交寡核苷酸對,從而除去游離的ssDNA。該處理是在具有所連接的寡核苷酸的平板上進行的。
反應混合物50μl雜交產物(1A、1B或1C)10μl10xNE緩沖液0.2μl 外切核酸酶T(5U/l)39.8μl MQ-水100μl 總體積將反應物在25℃(室溫)培養1小時。然后將反應物加熱至45℃,并培養2分鐘。該溫度對于半-雜交體而言是不許可的。
*檢測新鮮的PicoGreen(Molecular Probes,Inc.)工作溶液是通過在源于PicoGreen原液的1xTE中200-倍稀釋而制備的。向每個孔中加入100μl PicoGreen工作溶液,并在平板搖動器中混合。100μlPicoGreen工作溶液和100μl 1xTE被用作空白對照。在黑暗中培養樣品5分鐘。培養之后,測量每份樣品的熒光(激發485nm、發射535nm)。平板閱讀器的增益設定被設置使信號背景水平最佳化的值。
*結果雜交的結果在表2中給出。
表2
*結論通過熒光反應的2-3倍差異,可區別半-雜交體(1A)與完全雜交體(1B和1C)。100或200倍過量基因組DNA(10ng)的存在不會影響信號;具有和沒有基因組DNA(實施例7)的結果在統計學上沒有差異。這表明部分雜交基因組序列的存在不會干擾溶液中正確的、完全雜交寡核苷酸,發現了其位于固相支持物上的相應靶。在右側翼/可動因子(FR/ME)對的情況下,這是特別重要的,1B,其中基因組中大量的BARE-1 LTR將被預期與全長右側翼/可動因子(FR/ME)競爭結合。
本領域技術人員應當明白,在不背離本發明下列原則的條件下,可對上述本發明優選實施方案的詳細描述進行多種改變。因此,本發明的范圍應僅由下列權利要求確定。
序列表<110>Boreal Plant Breeding Ltd<120>用于證實遺傳身份的方法和測試試劑盒<130>A1435PC<140>
<141>
<150>FI 20020176<151>2002-01-30<160>30<170>PatentIn Ver.2.1<210>1<211>16<212>DNA<213>人工序列<220>
<223>Pst I SSAP接頭引物<400>1gactgcgtac atgcag 16<210>2<211>313<212>DNA<213>玉米(Zea mays)<220>
<223>Heartbreaker(Hbr7)微型反向重復序列轉座因子(MITE)(AF 203730)<400>2gggtctgttt ggttcagctt ttttctgacc agcttttctg aaaatctggc tgtagggaga 60tctggccgtg ggaagaatct gagtatcatt acgattacgt gtggaggaag ataaagttgt 120tcatagggct catgatctag aaagtgacgg attcctacta ttacaacgac tcaaccgatt 180atatgtttat gttaattttg gatggttttt gccccaacga attttataga agctggctga 240
aaagctgagt gtttggcagt ccgcagcagc ttttggtggc cagaagctgt cagaagccga 300aacaaacagg gcc313<210>3<211>16<212>DNA<213>玉米<220>
<223>Hbr7的左側翼(FR)序列<400>3cggacgcgcc agccat 16<210>4<211>16<212>DNA<213>玉米<220>
<223>Hbr7的右側翼(FR)序列<400>4catcctttgc tttggt 16<210>5<211>20<212>DNA<213>人工序列<220>
<223>FL/ME寡核苷酸<220>
<223>11-20 Hbr<400>5cgccagccat gggtctgttt 20<210>6<211>20
<212>DNA<213>人工序列<220>
<223>ME/FR寡核苷酸<220>
<223>1-10 Hbr<400>6aaacagggcc catcctttgc 20<210>7<211>18<212>DNA<213>人工序列<220>
<223>FL/FR寡核苷酸<400>7gcgccagcca tcctttgc 18<210>8<211>21<212>DNA<213>人工序列<220>
<223>MITE基因座的第二種形式<220>
<223>10-14雙重復序列“足跡”<400>8gcgccagcca tcatcctttg c 21<210>9<211>100<212>DNA<213>玉米
<220>
<223>Zeon-1 LTR逆轉錄轉座子的FL區<400>9tgcctatatt tgtactatcg atcatattaa taatagtacg agatagaatg ataacaatac 60acatgactag aatatgttat tttttctaac ctgaaaggta 100<210>10<211>100<212>DNA<213>玉米<220>
<223>Zeon-1 LTR逆轉錄轉座子的FR區<400>10aggtacccac tggtagccct aataataatt ctagtcggtg tagggacaag ttgtgctacg 60gtcaagagag gggaagcaaa atggcctttt atcctgatga 100<210>11<211>49<212>DNA<213>玉米<220>
<223>Zeon-1 LTR的右端<220>
<223>1-8末端反向重復序列<400>11tgttgggggc cttcggcttc cgaaggtcct caaaaacaag atttaactg 49<210>12<211>49<212>DNA<213>玉米<220>
<223>Zeon-1 LTR的右端<220>
<223>42-49末端反向重復序列<400>12tgtgttgcct tgttcttaat tcatagcatt tgagaacaag tccccaaca 49<210>13<211>26<212>DNA<213>玉米<220>
<223>FL/ME連接點<220>
<223>12-16由插入產生的同向重復序列<220>
<223>17-26左LTR的末端<400>13ctaacctgaa aggtactgtt gggggc 26<210>14<211>31<212>DNA<213>玉米<220>
<223>ME/FR連接點<220>
<223>1-12右LTR的末端<220>
<223>13-16由插入產生的同向重復序列<400>14aagtccccaa caggtaccca ctggtagccc t31<210>15<211>20<212>DNA
<213>人工序列<220>
<223>ME/FR寡核苷酸<220>
<223>6-10右LTR的末端<220>
<223>11-20由插入產生的同向重復序列<400>15tgaaaggtac tgttgggggc 20<210>16<211>21<212>DNA<213>人工序列<220>
<223>ME/FR寡核苷酸<220>
<223>1-10右LTR的末端<220>
<223>11-15由插入產生的同向重復序列<400>16gtccccaaca ggtacccact g 21<210>17<211>22<212>DNA<213>人工序列<220>
<223>FL/FR寡核苷酸<220>
<223>7-11由插入產生的同向重復序列<400>17
ctgaaaggta cccactggta gc 22<210>18<211>32<212>DNA<213>人工序列<220>
<223>引物7286<400>18ggaattcata gcatggataa taaacgatta tc 32<210>19<211>28<212>DNA<213>人工序列<220>
<223>(CTC)9C<400>19ctcctcctcc tcctcctcct cctcctcc28<210>20<211>1767<212>DNA<213>大麥(Hordeum vulgare)<220>
<223>sb17,春大麥中存在的多態性片段<220>
<223>1-92 BARE-1插入片段的LTR<220>
<223>93-97由插入產生的預測同向重復序列<400>20ggaattcata gcatggataa taaacgatta tcatgatcta agaaatataa taataactaa 60
tttattattg cctctagggc atatttccaa caccacttcc tcgtgctcct cctcaacttc 120gaggagggag gaagccgccc tcccgccgtc agtgcacttc ctcgtgctcc tcctcaaaat 180cctgtgaggc tttgcttctc cccttcccct ctgttccaca atgttttttg taatttttgc 240ccatgatgtt gcttgcacgg atcaaaaaaa tcatatcatc tgttggtact ttgtccgttg 300tgtgttttga ttttgtgatt ttcagtgcat tgtttcctga ttaacatgaa tttagtttta 360tacatcacct taattttgat taattactga ccatggtgag caagatctaa acaacaagaa 420atgcacttat taacttgaca ttgttaatta aaaaaatttg atgaagcaca gacttatttc 480agcaacagtc tctgcctttg catgtcagtt aatggatctg gcaccttttt gtacaaatca 540atggatatga cacttagtgt tatggatttt atgaacaact cacaaattaa cgtcattgat 600gtgtatgata tgtatgcata cttgaacatt atgatatgcg tgtatactag catggtagta 660acttgaatgc atcagtgttc gtgccataga gttgttttcc gcatccttcc tacgcgcgac 720caaaaaatca acccgctcga gaaaacagtc cactaaaata aaaaatagac ccatgaccca 780cgaacacatg ccccttcctt atcaaaggac aacctcgttc ctcaaaattt tccaaccgaa 840cccaccttcc ttttccgcat gtgccaccca catcgtagcc ctctctcgca cgcatgtgcc 900gctcgtccta gacggttgct accgcctcta tcggttctcg acctcccgaa ggacgcatcc 960atcacgcgcg gtcaaggccc tgccataggc catggttagt gctgccatcc actcatctcc 1020tctatacaac cccttctctc tcggatccag gctggccaac ggtgtcgacc cccaattgaa 1080gtggccccac cttcctttcc tcgtgcgcct cagcgccatt tccaggtacg tatcatagcg 1140caagcgcatg ggctgacagc gtccgtcgcc gagccttctc caaggatggc agtccaccac 1200accgtgtgcc actgcatcga gttggtagcc accatcgccg cccagtccat ctactggtga 1260gacgcgagat ctatccaccc agttctgcat ccatcaggca cccaaccacc aggtatgggc 1320cactgctatt attatatttc tcttctgatt tagtcggaga tgttgctgtt gtgtttgcag 1380tgtgagagag cagaaaggac tgtgagagtg caggggtggt atgatcacga cccaatgtca 1440tggcagtaga ggaggcaaca gatgtcgagg aggaggaaag gcacatgagc tgcggcaggg 1500gaggtcgagg aggaggagga ggagaggtat gtgctcggcg gcaaccgggt cactgtggta 1560ccaagcacaa cctgatccag aacagtctcg cgctctttct gacatgatag acataacctg 1620cacataggtt atatattttt ctaaagatta attttttttc cgacactaat tagaattagc 1680caaaatagcg atcatgtctt attagtctca atattgaatt ttgcatttgt ttcaatatta 1740cacaattcac ttttggtaaa tgcatgc 1767<210>21<211>3186<212>DNA<213>大麥<220>
<223>wb17,缺少BARE-1插入的冬大麥的序列<220>
<223>1511-1512春大麥中BARE-1插入片段的側翼核苷酸<220>
<223>1512-1516由插入產生的同向重復序列<400>21gcatgcagaa aaaaaaaaca aatctggaga aaacgttcag aatgcgacac gatgcggcgg 60ctgaaaacgt gtcaagtgac tacacgtgat agtgatcatt gagaaacttc caaaagagtg 120attgctaact agttgttctc ataagtcact tataatgaaa tggtaactcc cctggccggc 180aatgtcctcc catagccggc ccattagcct gtttccaata gcttgctgtc cctcgtgcat 240ttcaataatt gtgtttggac gctgtaggtc cggttttttc ttatgttgtt caattttttt 300gtcattttcg tttttctttt ctgtgttttt gtttattggt ttttaccggt tatttagtgt 360cactttaatt tcataatttc accatcatat ttttatttat ttttgtcgtt tttatgttct 420tttttaattg ggtgtccttt catattttat tatttttatc attcttattt ttctttacta 480tttcactgct ttccatatgt ttctttggtc tttgggtttc ttcattttgt tttctctttt 540cgttttctct tttcctacac atgtgtacat gctaggacca gtttttatgc atgttttact 600ttgcctaaat acaagacaaa tatttcccta gaatatttgt tattgtacct attttatata 660tattttttgt tttctgtatg caatataaca tctctactat taaagagggg tctgtcgtcg 720tcgtgatggt tcgacttcgt tcgattccct cctagctcct cccttccacg ttctcccacc 780aatttttttt caatcattcg atcccttcga aaaccgctct ctcccattct ctttctccac 840cgcttcgctc accttcaacc cactcccctt cctgctcctc cccgccagat gcaccccctc 900ctccctgccg gatgcacccc ctcctccccg ccagatgcac ccctcctctc ctctcctctg 960ccgcccaccc agaggacaac caccaattcc ttccttcacc tccccttctc gtgccccatc 1020caccaccgga tccgatcatt gcagcaggtg gcccgacgcc cgtgactgca ccgtccatct 1080catctcgcct gtgcaggtac ttcccttatt tcccctccat gccatctctc accaccaatt 1140tccctcacct ctcttaccct atttccagat ctggaccgtc aaccaccttc tcccggaacc 1200accgtgtcct cggaacgagc aggacaagag gagaggaggc aggagtgcga cgtccgccgg 1260cgacctggcc atcctcctgg atctcaccag gggaggatgg agcgagcatg gcaatagtag 1320gagaggtggg aacagggcga cgtctgacgg cgacctgatc atcctcctgg atctcgctgg 1380caacctcctg gaggccgccc gcccaccgtc agtgtggggc ccacgacacc acttcctcgt 1440gctcctcctc aacacggagg agggagaagg gaggaggccg cccgcccgcc gtaagtgcgg 1500ggcccacggc accacttcct cgtgctcctc ctcaacttcg aggaaggagg aagccacccg 1560cccgccgtca gtgcacttcc tcgtgctcct cctcaaaatc ctgtgaggct ttgcttctcc 1620ccttcccctc tgttccacaa tgttttttgt aatttttgcc catgatgttg cttgcacgga 1680tcaaaaaaat catatcatct gttggtactt tgtccgttgt gtgttttgat tttgtgattt 1740tcagtgcatt gtttcctgat taacatgaat ttagttttat acatcacctt aattttgatt 1800aattactgac catggtgagc aagatctaaa caacaagaaa tgcacttatt aacttgacat 1860tgttaattaa aaaaatttga tgaagcacag acttatttca gcaacagtct ctgcctttgc 1920atgtcagtta atggatctgg cacctttttg tacaaatcaa tggatatgac acttagtgtt 1980atggatttta tgaacaactc acaaattaac gtcattgatg tgtatgatat gtatgcatac 2040ttgaacatta tgatatgcgt gtatactagc atggtagtaa cttgaatgca tcagtgttcg 2100tgccatagag ttgttttccg catccttcct acgcgcgacc aaaaaatcaa cccgctcgag 2160aaaacagtcc actaaaataa aaaatagacc catgacccac gaacacatgc cccttcctta 2220tcaaaggaca acctcgttcc tcaaaatttt ccaaccgaac ccaccttcct tttccgcatg 2280tgccacccac atcgtagccc tctctcgcac gcatgtgccg ctcgtcctag acggttgcta 2340ccgcctctat cggttctcga cctcccgaag gacgcatcca tcacgcgcgg tcaaggccct 2400gccataggcc atggttagtg ctgccatcca ctcatctcct ctatacaacc ccttctctct 2460cggatccagg ctggccaacg gtgtcgaccc ccaattgaag tggccccacc ttcctttcct 2520
cgtgcgcctc agcgccattt ccaggtacgt atcatagcgc aagcgcatgg gctgacagcg 2580tccgtcgccg agccttctcc aaggatggca gtccaccaca ccgtgtgcca ctgcatcgag 2640ttggtagcca ccatcgccgc ccagtccatc tactggtgag acgcgagatc tatccaccca 2700gttctgcatc catcaggcac ccaaccacca ggtatgggcc actgctatta ttatatttct 2760cttctgattt agtcggagat gttgctgttg tgtttgcagt gtgagagagc agaaaggact 2820gtgagagtgc aggggtggta tgatcacgac ccaatgtcat ggcagtagag gaggcaacag 2880atgtcgagga ggaggaaagg cacatgagct gcggcagggg aggtcgagga ggaggaggag 2940gagaggtatg tgctcggcgg caaccgggtc actgtggtac caagcacaac ctgatccaga 3000acagtctcgc gctctttctg acatgataga cataacctgc acataggtta tatatttttc 3060taaagattaa ttttttttcc gacactaatt agaattagcc aaaatagcga tcatgtctta 3120ttagtctcaa tattgaattt tgcatttgtt tcaatattac acaattcact tttggtaaat 3180gcatgc3186<210>22<211>23<212>DNA<213>人工序列<220>
<223>FR/ME寡核苷酸<220>
<223>1-11 BARE-1<400>22tatttccaac acccacttcc tcg 23<210>23<211>266<212>DNA<213>人工序列<220>
<223>ME/FL側翼區<220>
<223>112-116由插入產生的同向重復序列<400>23gcccaccgtc agtgtggggc ccacgacacc acttcctcgt gctcctcctc aacacggagg 60agggagaagg gaggaggccg cccgcccgcc gtaagtgcgg ggcccacggc accacttgtt 120ggggaacgtc gcatgggaaa caaaaaaatt cctacgcgca cgaagacctg tcatggtgat 180gtccatctat gagggggatt tcaaatctac gtacccttgt agatcgcata acagaaatgt 240
taataaacgc ggttgatgta gtggaa 266<210>24<211>46<212>DNA<213>人工序列<220>
<223>FL/ME<220>
<223>22-26由插入產生的同向重復序列<400>24gtaagtgcgg ggcccacggc accacttgtt ggggaacgtc gcatgg46<210>25<211>50<212>DNA<213>人工序列<220>
<223>ME/FR<220>
<223>23-27由插入產生的同向重復序列<400>25cctctagggc atatttccaa caccacttcc tcgtgctcct cctcaacttc50<210>26<211>21<212>DNA<213>人工序列<220>
<223>FL/ME寡核苷酸<400>26cacggcacca cttgttgggg a 21
<210>27<211>22<212>DNA<213>人工序列<220>
<223>FR/FL寡核苷酸<400>27agcacgagga agtggtgccg tg 22<210>28<211>21<212>DNA<213>人工序列<220>
<223>人工序列的描述-<220>
<223>FR/FL寡核苷酸<400>28cacggcacca cttcctcgtg c 21<210>29<211>22<212>DNA<213>人工序列<220>
<223>人工序列的描述-<220>
<223>FR/ME寡核苷酸<400>29gaggaagtgg gtgttggaaa ta 22<210>30<211>22<212>DNA
<213>人工序列<220>
<223>人工序列的描述-<220>
<223>ME寡核苷酸<400>30ctccttcacc ctgttggaaa ta 2權利要求
1.一種用于證實確定的種群集合體內的遺傳身份、遺傳多樣性、基因組變異或多態性,等位基因變異和共顯性評分的方法,其特征在于該方法包括下列步驟(a)使代表樣品總DNA的未標記、單鏈、任選斷裂的樣品DNA與一組或多組不同的任選成對或平行的寡核苷酸序列雜交,每個寡核苷酸序列代表至少一個可動因子(ME)的完全或空整合位點,且每個寡核苷酸序列與固相支持物上確定的可識別位置連接;(b)提供任選的雜交后處理,以便除去沒有與固相支持物上連接的任選成對或平行的寡核苷酸序列完全雜交的樣品DNA;和(c)提供具有可記錄標記的雜交產物,所述標記允許記錄雜交模式,并由此評分至少一個可動因子(ME)的完全或空整合位點的存在或缺乏。
2.根據權利要求1所述的方法,其特征在于與固相支持物連接的每個寡核苷酸序列代表可動因子(ME)的至少一個完全整合位點或一個相應的空整合位點中的連接點,其中代表完全整合位點的寡核苷酸序列包含2個相等或不同長度的獨特序列區,其中一個獨特序列區是側翼于所述可動因子(ME)的區,另一個獨特序列區是所述可動因子(ME)的末端,且代表空整合位點的寡核苷酸序列包含2個獨特序列區,每個都由圍繞可動因子(ME)整合位點的側翼區組成。
3.根據權利要求1所述的方法,其特征在于進行共顯性評分時,對種群集合體中所要評分的每個同源物提供至少一組成對或平行的寡核苷酸序列。
4.根據權利要求1所述的方法,其特征在于將對代表完全或空整合位點的寡核苷酸序列記錄的雜交模式用于進行共顯性評分。
5.根據權利要求1所述的方法,其特征在于在代表完全位點的寡核苷酸序列中包含側翼區的獨特序列區要比包含可動因子(ME)末端的獨特序列區長。
6.根據權利要求1所述的方法,其特征在于雜交反應在使未標記、單鏈、任選斷裂的樣品DNA退火于與固相支持物連接的寡核苷酸序列的條件下進行。
7.根據權利要求1所述的方法,其特征在于雜交后處理是在釋放沒有與固相支持物上連接的寡核苷酸序列完全雜交的所有樣品DNA的條件下進行的。
8.根據權利要求1所述的方法,其特征在于雜交模式是通過在雜交和用可記錄標記進行雜交后處理之后提供樣品DNA而記錄的。
9.根據權利要求1所述的方法,其特征在于進行雜交和雜交后處理之后的樣品DNA任選是從固相支持物釋放的,且隨后與和固相支持物連接的每個寡核苷酸序列完全對應的被標記的核苷酸序列雜交。
10.根據權利要求1所述的方法,其特征在于所述記錄是可逆的,且固相支持物可恢復至其原始狀態重新使用。
11.根據權利要求1-10任意一項所述的方法,其特征在于包括雜交、雜交后處理、記錄和評分在內的步驟都是自動化的。
12.根據權利要求1-11任意一項所述的方法,其特征在于該方法包括下列步驟(a)提供含有不止一組任選成對或平行的寡核苷酸序列的固相支持物,其中每組都含有至少一個代表完全整合位點的寡核苷酸序列和一個代表空整合位點的寡核苷酸序列;(b)用物理、機械或酶方法任選剪切代表總DNA的樣品DNA,以便在不同的DNA碎片上獲得可動因子(ME);(c)使所述剪切的樣品DNA成為單鏈,并使所述單鏈樣品DNA片段與固相支持物上連接的單鏈寡核苷酸序列序列雜交;(d)提供任選的雜交后處理,包括利用不同嚴格條件下的洗滌處理除去未與固相支持物上連接的寡核苷酸序列完全雜交的單鏈樣品DNA,和任選的消化處理,從而除去未與所連接的多核苷酸序列完全對應的單鏈樣品DNA片段;(e)利用能夠證實雜交的任何方法記錄每組寡核苷酸序列的雜交模式;(f)對可記錄的雜交模式評分,其中與固相支持物上連接的代表完全整合位點的寡核苷酸序列雜交表示存在至少一個可動因子(ME),與固相支持物上連接的代表空整合位點的寡核苷酸序列雜交表示在相應的整合位點中不存在可動因子(ME),沒有進行雜交則表示缺少整合位點。
13.一種用于證實種群集合體中的遺傳身份、遺傳多樣性、基因組變異或多態性,等位基因變異和共顯性評分的測試試劑盒,其特征在于該測試試劑盒包含不止一組任選成對或平行的單鏈寡核苷酸序列,每個寡核苷酸序列代表至少一個完全整合位點或一個相應的空整合位點中的連接點,其中代表完全整合位點的寡核苷酸序列包含2個相等或不同長度的獨特序列區,其中一個獨特序列區是可動因子(ME)的側翼區,另一個獨特序列區是所述可動因子(ME)的末端,且代表相應的空整合位點的寡核苷酸序列包含2個圍繞所述可動因子(ME)的側翼區。
14.根據權利要求13所述的測試試劑盒,其特征在于代表側翼區的獨特序列區要比代表可動因子(ME)的獨特序列區長。
15.根據權利要求13所述的測試試劑盒,其特征在于對種群集合體中所要評分的每個同源物提供至少一組任選成對或平行的寡核苷酸序列。
16.根據權利要求13所述的測試試劑盒,其特征在于測試試劑盒包含與固相支持物連接的至少一對寡核苷酸序列,其中所述寡核苷酸序列中的一個代表完全位點,且所述寡核苷酸序列中的一個代表空位點,由此進行共顯性評分。
17.根據權利要求13-16任意一項所述的測試試劑盒,其特征在于所述固相支持物包括由選自玻璃、塑料、硝化纖維素、尼龍、聚丙烯酸或硅的材料制成的膜、濾器、載玻片、平板、芯片、培養皿或微孔。
18.根據權利要求13-17任意一項所述的測試試劑盒,其特征在于所述測試試劑盒包括任選的試劑、標記、洗滌緩沖液、末端保護試劑和/或使用說明。
19.根據權利要求13-18任意一項所述的測試試劑盒,其特征在于所述寡核苷酸序列的大小允許在固相支持物連接的寡核苷酸與樣品DNA之間形成穩定的雜交產物。
20.根據權利要求13-19任意一項所述的測試試劑盒,其特征在于所述寡核苷酸序列被任選末端保護。
21.根據權利要求13-20任意一項所述的測試試劑盒,其特征在于所述記錄處理是可逆的,可使固相支持物恢復至其原始狀態重新使用。
22.根據權利要求1-12任意一項所述方法在區別任何特定基因組位置中至少一個可動因子(ME)整合位點的至少一個整合位點不同的任何生物中的用途。
23.根據權利要求1-12任意一項所述的方法在通過證實遺傳身份、遺傳多樣性、基因組變異或多態性,特別是共顯性評分,用于基因型分析、系統發育研究、親子關系鑒定、法學、人類醫學診斷、單倍型分析和譜系分析以及植物和動物繁殖中的用途。
24.根據權利要求1-12任意一項所述的方法用于確保和促進繁殖的用途。
25.根據權利要求13-21任意一項所述的測試試劑盒在區別任何特定基因組位置中至少一個可動因子(ME)的至少一個整合位點不同的任何生物中的用途。
26.根據權利要求13-21任意一項所述的測試試劑盒在通過證實遺傳身份、遺傳多樣性、基因組變異或多態性,特別是共顯性評分,用于基因型分析、鑒定、系統發育研究、親子關系鑒定、法學、人類醫學診斷、單倍型分析和譜系分析以及植物和動物繁殖中的用途。
27.根據權利要求13-21任意一項所述的測試試劑盒用于確保和促進繁殖的用途。
全文摘要
用共顯性評分證實確定的種群集合體內的遺傳身份、遺傳多樣性、基因組變異或多態性,特別是等位基因變異,還有生物多樣性的方法和試劑盒。所述方法和測試試劑盒應用可動因子(ME),如轉座子或逆轉錄轉座子,而且以使用與固相支持物連接的一組或多組任選成對或平行的寡核苷酸為基礎。每個寡核苷酸序列代表可動因子的一個插入位點連接點。本發明還涉及所述方法和試劑盒通過證實遺傳身份、遺傳多樣性、基因組變異或多態性,特別是通過提供共顯性評分,用于系統發育研究、親子關系鑒定、基因型分析、單倍型分析、譜系分析、法學、人類醫學診斷以及植物和動物繁殖的用途。
文檔編號G01N33/566GK1646701SQ03807665
公開日2005年7月27日 申請日期2003年1月29日 優先權日2002年1月30日
發明者A·H·舒爾曼, L·G·波林 申請人:波里爾植物培育有限公司