專利名稱:酶促dna分子的制作方法
技術領域:
本發明涉及核酸酶或催化活性(酶促)DNA分子,它們能夠切割其他核酸分子,尤其是RNA分子。本發明還涉及含有上述酶促DNA分子的組合物以及制備和使用所述酶和組合物的方法。
背景讓催化劑在它們的天然范圍之外仍能發揮活性或者使催化劑能催化非天然發生的反應,這種需要導致“酶工程”技術的發展。“酶工程”中常用的方法是“合理設計”方法,依靠對天然酶的理解來幫助構建新酶。不幸的是,對蛋白質結構和化學領域的熟悉程度還不足以能夠設計出生產新生物催化劑的途徑。
近來,一種不同的方法已經應用于發展新催化劑。這種方法包括構建一個異源的大分子庫并將體外篩選方法用于從庫中分離出能催化預期反應的分子。從大分子庫中篩選催化劑不依賴對它們結構和化學特性的全面了解。因此,該方法被戲稱為“無理設計”(Brenner et al.,Proc.Natl.Acad.Sci.USA,895381-5383,1992)。
迄今為止,在合理設計酶促活性RNA分子或核酶方面的大量努力還未設計出具有全新或催化功能得到根本改進的分子。然而,通過一種我們稱為“引導的分子進化”或“體外進化”的方法把無理設計法投入應用就帶來一種潛在的可能,即能夠生產出一種具有期望的功能性特征的分子,上述“引導的分子進化”或“體外進化”是仿效達爾文的自然進化機制設計的。
這項技術已經應用于溶液中的RNA分子(參考,例如,Mills et al,Proc.Natl.Acad.Sci.USA,58217,1967;Green et al,Nature,347406,1990;Chowrira et al,Nature,354320,1991;Joyce,Gene,8283,1989;Beaudry et al,Science,257635-641,1992;Robertson et al,Nature,344467,1990)以及與吸附到一個固體載體上的配體結合的RNAs(Tuerk et al,Science,249505,1990;Ellington et al.Nature,346818,1990),并獲得了不同程度的成功。另外,它還已經應用到被直接吸附到固體載體上的肽(Lam et al,Nature,35482,1991);以及表達在病毒核衣殼蛋白中多肽表位(Scottet al,Science,249386,1990;Devlin et al,Science,249249,1990;Cwirla et al,Proc.Natl.Acad.Sci.USA,876378,1990)。
從發現催化活性RNA(Kruger et al,Cell,31147-157,1982;Guerrier-Takada et al,Cell,35849-857,1983)至今已有十幾年。已知的天然生成的核酶的數目在不斷地增加((參見,RNA世界,Gesteland & Atkins(編著),pp.239-269,Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY(1993);Pyle,Science,261709-714,1993;Symons,Curr.Opin.Struct.Biol.,4322-330,1994),近年來,通過體外進化方法得到的合成核酶使得該數目進一步擴增。(參見Joyce,Curr.Opin.Struct.Biol.,4331-336,1994;Breaker et al,Trends Biotech.,12268-275,1994;Chapman et al,Curr.Opin.Struct.Biol.,4618-622,1994)。
考慮到DNA含有許多與RNA相同的基團,所以認定DNA也具有酶促活性似乎是合理的。然而,除特定的病毒基因組和復制中間體外,即使排除了DNA采取復雜的二級及三級結構,生物機體中幾乎所有DNA也都是以完整的雙鏈體存在的。因此,實際上還未發現DNA酶也就不足為奇了。
本發明出現之前,能夠切割核苷酸的催化活性DNA分子的設計、合成以及使用還未見公開或報道。因此,此處公開的發現和發明是十分重要的,因為它們強調了體外進化作為效率日益提高的催化活性分子的一種設計手段的可能性,所述催化活性分子包括能切割其他核酸的酶促DNA分子,尤其是RNA。
發明概述本發明描述了一種能夠在特定切割位點切割底物核酸(NA)序列的合成或構建的(即非天然生成的)催化活性(或酶促)DNA分子。本發明還提供了一種具有內切核酸酶活性的酶促DNA分子。
一種優選的催化活性DNA分子的內切核酸酶活性,這種活性針對預先選定的底物核酸序列中被定義為切割位點的核苷酸序列具有特異性。該DNA分子具有第一和第二兩個底物結合區域,位于核心區域的兩側,其中所述的第一底物結合區域有一段序列與上述預先選定的底物核酸序列的第一部分互補,而所述第二底物結合區域有一段序列與上述預先選定的底物核酸序列的第二部分互補。核心區域有一段根據下列通式所述的序列(I.)T(莖)’AGC(莖)”Z,其中(莖)’和(莖)”都是具有以下特征的一種三聯核苷酸即當(莖)’(莖)”雜交配對時形成的3個堿基對中至少包括2個GC對,其中Z=WCGR或WCGAA,W=A或T且R=A或G。在一個優選實施例中,式I為SEQ ID NO 120(8-17)。
還提供了一種核心區域,其中含有一段下列通式代表的序列的(II.)RGGCTAGCXACAACGA(SEQ ID NO 122),其中X=T、C或A,R=A或G。在一個優選實施例中,式I為SEQ ID NO121(10-23)。
在另一個實施例中,內切核酸酶活性是針對底物核酸序列中被定義為切割位點的核苷酸序列的,該切割位點包括單鏈核酸的。在另一個優選變化中,所述的切割位點是雙鏈核酸。同樣,底物核酸序列可能是單鏈、雙鏈、部分單鏈或部分雙鏈、成環或其任一組合。
在提供的另一個實施方案中,底物核酸序列包括一個或多個核苷類似物。在一個變化中,所述底物核酸序列是較大的分子的一部分或被吸附到較大分子上。
在各種實施方案中,這種較大的分子選自RNA、修飾后的RNA、DNA、修飾后的DNA、核苷酸類似物或其組合。在另一個實施例中,這種較大的分子包括由一種由核酸序列和非核酸序列形成的組合。
在另一個實施方案中,本發明提供了包括一個或多個核苷類似物的底物核酸序列。一個進一步的變化中,提供的單鏈核酸包括RNA、DNA、修飾后的RNA、修飾后的DNA、一個或多個核苷類似物或其任一組合體。本發明的一個實施方案中,內切核酸酶活性包括對切割位點上磷酸二酯鍵的水解切割。
在各種優選的實施方案中,本發明的催化活性DNA分子是全序列單鏈或部分單鏈。優選地,這些催化活性DNA分子可以假定為各種與它們的催化活性相吻合的形狀。因此,在一個變化中,本發明的催化活性DNA分子包括一個或多個發夾環結構。在另一個變化中,催化活性DNA分子可以假定為一個類似“錘頭”狀核酶的結構。在另外的其他實施方案中,催化活性DNA分子可以假定為具有類似于嗜熱四膜蟲核酶的構象,例如源自I型內含子的核酶。
類似地,無論底物分子的方向如何,本發明優選的催化活性DNA分子都能表現出位點特異性的內切核酸酶活性。因此,在一個優選的實施方案中,本發明的酶促DNA分子能切割一個與該酶促分子分離的底物核酸序列——即未與該酶促DNA分子連接的底物核酸序列。在另—個優選實施方案中,酶促DNA分子能切割一個吸附的底物核酸序列——即它能完成一個類似于自身切割的反應。
本發明還期望酶促DNA分子(催化活性DNA分子、脫氧核酶或DNAzyme)具有內切核酸酶活性,由此該內切核酸酶活性需要二價陽離子的存在。在各種優選的替代實施方案中,該二價陽離子選自Pb2+、Mg2+、Mn2+、Zn2+、和Ca2+。另一個變化中,期望內切核酸酶活性需要單價陽離子的存在。在這種替代實施方案中,該單價陽離子優選Na+、K+。
在本發明的各種優選實施例中,酶促DNA分子包括一段選自下列序列的核苷酸序列SEQ ID NO 3、SEQ ID NO 14、SEQ ID NO 15、SEQ IDNO 16、SEQ ID NO 17、SEQ ID NO 18、SEQ ID NO 19、SEQ ID NO 20、SEQ ID NO 21和SEQ ID NO 22。在其他優選的實施方案中,本發明的催化活性DNA分子包括一段選自下列序列的核苷酸序列SEQ ID NO 23、SEQ ID NO 24、SEQ ID NO 25、SEQ ID NO 26、SEQ ID NO 27、SEQ IDNO 28、SEQ ID NO 29、SEQ ID NO 30、SEQ ID NO 31、SEQ ID NO 32、SEQ ID NO 33、SEQ ID NO 34、SEQ ID NO 35、SEQ ID NO 36、SEQ IDNO 37、SEQ ID NO 38和SEQ ID NO 39。
另一個優選的實施方案期望本發明的催化活性DNA分子包括一段選自SEQ ID NO 50和SEQ ID NO 51的核苷酸序列。另一個優選實施方案中,本發明的催化活性DNA分子包括一段選自SEQ ID NO 52~101的核苷酸序列。如此處公開的一樣,本發明還提供了包含與本發明公開序列基本相似的序列的催化活性DNA分子。因此,為了生成多種其他有用的酶促DNA分子,可以采用多種取代、缺失、插入、復制和其他突變方法來制備屬于公開范圍內的分子;只要所述分子表現出了此處描述的位點特異性的切割活性,那么它們就屬于本說明書的范圍之內。
在本發明的進一步變化中,本發明的酶促DNA分子優選具有約1μM或更小的底物結合親和力。另一個實施方案中,本發明的酶促DNA分子以小于約0.1μM的KD與底物結合。
本發明還公開了具有有效轉換速度的酶促DNA分子。在一個實施方案,該轉換速度小于5hr-1;在一個優選實施方案中,該速度小于約2hr-1;在一個較優選的實施方案中,該速度效率約1hr-1;在一個更優選的實施方案中,該轉換速度約0.6hr-1或更小。
在另一個實施方案中,本發明的酶促DNA分子表現出有效的轉換速度,其中Kobs小于1min-1,優選小于0.1min-1;較優選小于0.01min-1;更優選小于0.005min-1。在一個變化中,Kobs值約為0.002min-1或更小。
本發明還期望在實施方案中所公開的DNA酶的催化速度得到充分的優化。因此,在各種優選實施方案中,因Mg2+存在而優化的反應的Km約為0.5~20mM,優選約1~10mM,更優選約2~5mM。
本發明還提供了這樣一個實施方案,其中定義為切割位點的核苷酸序列中包含至少1個核苷酸。在各種其他優選的實施方案中,本發明的催化活性DNA分子能識別和切割一段由2個或多個核苷酸組成的定義為切割位點的核苷酸序列。
在各種優選的實施方案中,本發明的酶促DNA分子包括一個保守的核心,以及位于核心兩側的一個或多個底物結合區域。在一個實施方案中,酶促DNA分子包括第一和第二兩個底物結合區域。在一個實施方案中,酶促DNA分子包括2個或多個底物結合區域。
如上所述,本發明優選的催化活性DNA分子還可以包括一個保守的核心。在一個優選的實施方案中,所述的保守核心包括1個或多個保守區域。在其他優選的變化中,上述的保守區域包括一段選自下列序列的核苷酸序列CG;CGA;AGCG;AGCCG;CAGCGAT;CTTGTTT和CTTATTT(參見,例如圖3)。
在本發明的一個實施方案中,本發明的酶促DNA分子進一步包括位于保守核心中保守區域之間的1個或多個可變或間隔核苷酸。在另一個實施方案中,本發明的酶促DNA分子進一步包括位于保守核心和底物結合區域之間的1個或多個可變或間隔核苷酸。
在一個變化中,第一底物結合區域優選包括一段選自下列序列的核苷酸序列CATCTCT;GCTCT;TTGCTTTTT;TGTCTTCTC;TTGCTGCT;GCCAGCTT(SEQ ID NO 40);CTCTATTTCT(SEQ ID NO 41);GTCGGCA;CATCTCTTC;及ACTTCT。在另一個優選的變化中,第二底物結合區域包括一段選自下列序列的核苷酸序列TATGTGACGCTA(SEQ ID NO 42);TATAGTCGTA(SEQ ID NO 43);ATAGCGTATTA(SEQ ID NO 44);ATAGTTACGTCAT(SEQ ID NO 45);AATAGTGAAGTGTT(SEQ ID NO 46);TATAGTGTA;ATAGTCGGT;ATAGGCCCGGT(SEQ ID NO 47);AATAGTGAGGCTTG(SEQ ID NO 48);及ATGNTG。
在本發明的各種實施方案中,底物結合區域的長度是可變的。因此,例如,底物結合區域可以包括1個到多個核苷酸。然而,應該理解的是,底物結合區域長度約3~25個核苷酸,優選約3~15個核苷酸,更優選3~10個核苷酸,這些長度的底物結合區域都是具體優選的。在各種實施方案中,底物結合區域中的單個核苷酸與底物分子中的核苷酸之間能形成互補堿基對;在其他實施方案中,形成的是非互補堿基對。互補堿基對和非互補堿基對的混合物也在本發明公開的實施方案的范圍之內。
在另一個優選的實施方案中,本發明的催化活性DNA分子可以進一步包含一個第三底物結合區域。在一些優選實施方案中,第三底物結合區域包括一段選自下列序列的核苷酸序列TGTT、TGTTA和TGTTAG。本發明的另一個優選實施方案中,酶促DNA分子進一步包括位于1個或多個底物結合區域之間的可變或“間隔”區域。
在另一個公開的實施方案中,本發明期望一個與其他DNA分子及寡核苷酸分離的、純化后的、合成酶促DNA分子,該酶促DNA分子具有內切核酸酶活性,其中所述的內切核酸酶活性針對底物序列中一段被定義為切割位點的核苷酸序列具有特異性,這段序列中包括有單鏈或雙鏈核酸。在一個變化中,公開了一個具有內切核酸酶活性的合成(或構建)的酶促DNA分子,其中所述的內切核酸酶活性針對底物核酸序列中一段被定義為切割位點的核苷酸序列具有特異性,這段序列基本上由單鏈區域或雙鏈區域組成。
在另一個實施方案中,本發明提供了一種包括有催化活性的脫氧核糖核苷聚合物的酶促DNA分子,這種活性能水解含核酸底物產生底物切割產物。在一個變化中,水解反應以點-特異性的方式發生。如上所述,該聚合物可以是單鏈、雙鏈或二者的某一組合。
本發明進一步期望底物中包括一段核酸序列。在各種實施方案中,核酸序列底物包括RNA、修飾后的RNA、DNA、修飾后的DNA、1個或多個核苷類似物或其中任一個的組合體。一個實施方案期望底物包括一段單鏈節段;而另一個實施方案期望底物是雙鏈的。
本發明還期望一個包括脫氧核糖核苷聚合物的酶促DNA分子,該脫氧核糖核苷聚合物能水解含核酸的底物產生切割產物因而具有催化活性。在一個變化中,酶促DNA分子與底物之間具有有效的結合親和力,而對與切割產物之間卻缺乏有效的結合親和力。
在一個優選的實施方案中,本發明公開了一種非天然生成的酶促DNA分子,其中包括一段定義為保守核心的核酸序列,保守核心的兩側排列著識別區、可變區和間隔區。因此,在一個優選的實施方案中,該核酸序列定義為緊鄰或緊靠該分子的5’端的是第一可變區,從此開始往3’端方向依次為第一識別區、第一間隔區、第一保守區、第二間隔區、第二保守區、第二識別區和第二可變區。
在另一個實施方案中,該核酸序列優選定義為緊鄰或緊靠該分子的5’端的是第一可變區,從此開始往3’端方向依次為,第一識別區、第一間隔區、第一保守區、第二間隔區、第二保守區、第二識別區、第二可變區和第三識別區。
在上述實施方案的一個變化中,該分子包括一個保守的核心區,其兩側是兩個底物結合區;在另一個變化中,保守的核心區包括1個或多個保守區域。在其他優選的實施方案中,保守的核心區中進一步包括1個或多個可變或間隔核苷酸。在另一個實施方案中,本發明的酶促DNA分子進一步包括1個或多個間隔區。
本發明進一步期望各種組合物。例如,其中包括一個上述公開和此處期望的酶促DNA分子的組合物。在一個替代實施方案中,根據本發明的組合物包括2個或多個上述的酶促分子,其中每個酶促分子各能切割一個底物中的不同的序列。在另一個變化中,組合物包括2個或多個上述的酶促分子,其中每個酶促分子都能識別一個不同的底物。在各種實施方案中,還優選的是組合物中包括1個單價或二價陽離子。
本發明進一步提供了生產、篩選和分離本發明的酶促DNA分子的方法。在一個變化中,一種篩選能在特定位點切割一段核酸序列(例如,RNA)的酶促分子的方法包括下列步驟(a)得到假定酶促DNA分子的一個群體——該序列是天然生成或合成的——而且優選它們是單鏈DNA分子;(b)將含核苷酸的底物序列與上述DNA分子混合形成混合物;(c)在預定的條件下,保持混合物充足的一段時間,使得上述群體中的DNA分子能夠切割底物從而產生底物切割序列;(d)把上述群體中的DNA分子與底物序列和底物切割序列分開;(e)從上述DNA分子的群體中分離出能在特定位點切割底物核酸序列(例如,RNA)的DNA分子。
在上述方法的一種進一步的變化中,能在特定位點切割底物核酸序列的DNA分子用一種固定試劑標記。在一個實施例中,該試劑包括生物素。
在上述方法的另一種變化中,從篩選一段序列開始——例如,一段預定的“目標”核酸序列——即希望能被為此而構建的酶促DNA切割的序列。因此,在一個實施方案,通過把預選(預定)的“目標”序列吸附或“標記”到一段含有1段或多段隨機序列或節段的脫氧核糖核酸序列上,從而生成一定數目的能在特定位點切割底物核酸序列的DNA分子。在一個變化中,上述隨機序列長約40個核苷酸;在另一個變化中,上述隨機序列長約50個核苷酸。長約1~40核苷酸、40~50核苷酸和50~100個核苷酸的隨機序列也在本發明所期望的范圍之內。
在本發明的一個實施方案中,用于生產酶促DNA分子群體的核苷酸序列選自SEQ ID NO 4、23、50和51。在另一個實施方案中,所述“目標”或“底物”核酸序列包括一段由1個或多個核糖核苷酸組成的序列——參見,例如,SEQ ID NO 4和SEQ ID NO 23的相應部分,以及SEQID NO 49。本發明還期望,一個有用的“目標”或“底物”核酸序列可以包括DNA、RNA或其組合。
本發明還期望上述方法,其中所述的分離步驟進一步包括把標記過的DNA分子暴露于一個其上連接有抗生物素蛋白的固體表面,從而使該標記過的DNA分子吸附到該固體表面上。如上所述,底物可以是RNA、DNA、二者的組合或者一種包括核酸序列的分子。
本發明還期望一種在特定切割位點特異地切割底物核酸序列的方法,其中包括下列步驟(a)提供一種能在特定切割位點切割底物核酸序列的酶促DNA分子;以及(b)讓酶促DNA分子和底物核酸序列接觸從而導致在切割位點對核酸序列進行特異性的切割。在一個變化中,所述的酶促DNA分子是非天然生成的(或合成的)DNA分子。在另一個變化中,所述的DNA分子是單鏈。
在上述方法的另一個變化中,所述底物包括一個核酸分子。在各種實施方案中,所述的底物核酸包括RNA、DNA、修飾后的DNA、1個或多個核苷酸類似物或其任一的組合體。在另一個實施方案中,所述的特異性切割是由酶促DNA分子的內切核酸酶活性引起的。反應條件的改變——例如,pH值、溫度、陽離子百分比、酶的百分比、底物百分比以及產物百分比的調整——也是此處所期望的。
本發明還提供了一種切割磷酸二酯鍵的方法,其中包括(a)將能在特定切割位點切割底物核酸序列的酶促DNA分子與含磷酸二酯鍵的底物混合形成反應混合物;以及(b)在預定的條件下保持混合物,讓酶促DNA分子切割磷酸二酯鍵以導致底物的切割,從而產生一定數目的底物產物。在一個實施方案中,酶促DNA分子能以位點特異性的方式切割磷酸二酯鍵。在另一個實施方案中,該方法進一步包括(c)把上述產物與催化活性DNA分子分開;以及(d)向酶促DNA分子補入底物形成新的反應混合物。
本發明還提供了構建能切割磷酸二酯鍵的酶促DNA分子的方法。一種典型的方法包括下列步驟(a)得到一個單鏈DNA分子的群體;(b)向上述群體中導入遺傳學的變化從而生成一個變異的群體;(c)從上述變異群體中篩選出符合預定篩選標準的個體;(d)把篩選出的個體和上述變異群體的其余部分分開;以及(e)擴增上述篩選出的個體。
附圖簡述
圖1給出了用于分離能夠切割目標RNA磷酸酯的DNAs的選擇擴增方案。如圖所示,通過PCR擴增含50個隨機核苷酸(在該分子頂部用“50N”標示)的雙鏈DNA,使用的引物5’端經過生物素化,3’末端以腺嘌呤核糖核苷酸(rA)結尾。(生物素標記物用1個被圓圈包圍的字母“B”表示)利用Taq DNA聚合酶延伸這種引物,得到含單個嵌入核糖核苷酸的DNA產物。把得到雙鏈DNA固定到一種鏈霉親和素基質上,用0.2N NaOH洗脫出未被生物素化的DNA鏈。用緩沖液將柱重新平衡后,用加有1mM PbOAc的同一溶液洗滌該柱。具有Pb2+依賴性自身切割性能的DNAs被從柱上釋放出來,收集洗脫液,用PCR擴增。然后用PCR產物啟動下面選擇性擴增循環。
圖2中給出的是Pb2+存在的條件下,DNA起始庫(G0)以及第1輪到第5輪選擇(G1~G5)后得到的群體的自身切割活性。符號Pre代表含108個核苷酸的前體DNA(SEQ ID NO 4);Clv代表含28個核苷酸的5,切割產物(SEQ ID NO 5);M代表引物3a(SEQ ID NO 6),其長度相當于5’切割產物。
圖3給出的是從5輪選擇后得到的群體中分離的單個突變體的序列對比。頂部給出的是固定的底物結構域,其中含有一個目標核糖腺苷酸,該目標核糖腺苷酸在圖中用倒三角形標出。用豎框框起來的部分是共同參與了推定的堿基配對相互作用的底物核苷酸。將與50個初始隨機核苷酸對應的序列與底物結構域進行反向平行比較。所有這些突變體3’末端都是一個固定序列5’-CGGTAAGCTTGGCAC-3’(未標出;SEQ ID NO 1)。在圖的左右兩邊指示出的是位于初始隨機區域中被推定與底物之間形成堿基對的核苷酸;每個顯示出的序列中被單獨框起來的部分是酶促DNA分子的推定堿基配對(或底物結合)結構域。居中的兩個大框中給出的是保守區域。
圖4A和4B給出了一個分子間反應中RNA磷酸酯的DNA-催化切割,該反應以催化轉換開始。圖4A是19聚體底物(3’-TCACTATrAGGAAGAGATGG-5’,SEQ ID NO 2)和38聚體DNA酶(5’-ACACATCTCTGAAGTAGCGCCGCCGTATAGTGACGCTA-3’,SEQ ID NO 3)之間形成的復合物的簡圖。底物中包括單個腺嘌呤核糖核苷酸(”rA”,緊靠箭頭),其兩側是脫氧核糖核苷酸。合成DNA酶是圖3中給出的最常發生的突變體的38核苷酸部分。位于推定催化結構域中的高度保守核苷酸被“框了起來”。如圖所示,一個保守區域是“AGCG”,而另一個保守區域是“CG”(按5’-3’的方向閱讀)。
圖4B給出的是用于測定下列反應的Km(負斜率)和Vmax(y軸截距)的Eadie-Hoftstee曲線在與體外選擇相同的條件下,DNA催化切割[5’-32P]標記的底物。測定反應的初始速度,該反應中包括5nM DNA以及0.125μM、0.5μM、1μM、2μM或4μM底物。
圖5給出的是表現選擇的催化活性DNAs的4個家族的特異性內切核糖核酸酶活性的聚丙烯酰胺凝膠照片。Pb2+依賴性家族分子的選擇以并排的方式重復出現作為對照(第1組)。第2組中,使用的陽離子是Zn2+;第3組中,陽離子為Mn2+;第4組中,陽離子為Mg2+;凝膠上第5部分的位置處只有單獨的切割產物作為對照。
如圖所示,上述的4個組中每組都有3個泳道。在每組的3個泳道中,第1泳道顯示的是在不含金屬陽離子條件下選擇的無活性群體,第2泳道顯示的是金屬陽離子存在條件下觀察到的活性,第3泳道顯示的無活性的起始庫(GO)。
圖6A和6B分別提供的是一個“原始”催化活性DNA分子和用本發明公開的選擇擴增方法得到的幾個催化活性DNA分子中的一個的二級結構的圖象。圖6A給出的是來自起始庫的示范分子,該分子表現出了SEQ IDNO 23代表的分子的總體構象。如圖所示,各種互補核苷酸位于隨機區域(N40)的旁側。圖6B圖中顯示的是一個通過此處公開的方法產生的Mg2+依賴性催化活性DNA分子(或“DNAzymes”)。圖6A和6B中,箭頭指示出的是底物核酸中核糖核苷酸的位置。
圖7給出的是基本上按照下面實施例5中描述的方法進行10輪體外選擇擴增的結果中的一部分。如圖所示,有兩個位點和兩個催化劑家族表現出對目標序列的最有效的切割。切割條件基本上同圖7中的顯示,就是,10mM Mg2+、pH7.5和37℃;圖中顯示的是反應進行2小時后收集的數據。相對于代次數目(此處為0~10)繪制出切割率(%)。垂直柱表示的是能夠在指定位點切割底物中目標序列的催化活性DNA分子的數目/普遍性(prevalence),其中條紋柱顯示的是在G↓UAACUAGAGAU處的切割,空白(無陰影)柱顯示的是在GUAACUA↓GAGAU處的切割。
圖8給出的是本發明的兩個催化活性DNA分子——克隆8-17和10-23的核苷酸序列、切割位點以及轉換速度。反應條件如圖所示,也就是,10mM Mg2+、pH7.5和37℃。左邊是鑒定為克隆8-17的DNAzyme,箭頭指示的是RNA底物的切割位點。底物序列(5’-GGAAAAAGUAACUAGAGAUGGAAG-3’)——與DNAzyme分離(即給出的是分子間切割)——如圖標記。類似地,右邊顯示的是此處鑒定為克隆10-23的DNAzyme,箭頭指示的是RNA底物的切割位點。再次列出底物序列。酶8-17的轉換速度為約0.6hr-1;酶10-23的轉換速度為約1hr-1。圓點(·)表示的是非互補的配對,而豎線(|)表示的是互補配對。
圖9進一步給出了本發明的兩個催化活性DNA分子——克隆8-17和10-23的核苷酸序列、切割位點和轉換速度。反應條件如圖所示,也就是,10mM Mg2+、pH7.5和37℃。與圖8中相同,左邊給出的是鑒定為克隆8-17的DNAzyme,箭頭指示的是RNA底物的切割位點。底物序列(5’-GGAAAAAGUAACUAGAGAUGGAAG-3’)——與DNAzyme分離(即給出的是分子間切割)——如圖標記。類似地,右邊顯示的是此處鑒定為克隆10-23的DNAzyme,箭頭指示的是RNA底物的切割位點。再次給出了底物序列。酶8-17的Kobs值為約0.002min-1;酶10-23的Kobs值為約0.01min-1。圓點(·)表示的是非互補的配對,而豎線(|)表示的是互補配對。
圖10是表示催化活性基序8-17和10-23組成的簡圖。通過非特異的互補核苷酸(水平線)之間的互補性的Watson-Crick堿基對,DNA酶(下面的鏈)和RNA底物(上面的鏈)結合在一起。箭頭指示出的是切割發生的位置,其中R=A或G,Y=U或C。
圖11給出的是DNA酶10-23在多次轉換情況下的催化活性,具體描述見實施例6。用反應起初10%的階段測定反應初速度,其中使用的底物濃度是固定的(0.004nM),底物濃度是變化的(0.02~4nM)。用體外轉錄制備與HIV-1gag/聚合酶mRNA對應的17聚體RNA底物。反應條件2mM MgCl2、150mM NaCl、pH7.5、37℃。給出了來自兩個獨立實驗的數據,這些數據滿足Michaelis-Menten方程v=kcat[E]/(Km+[S])。
圖12A和12B包括的兩個板面中給出了本發明的DNA酶中底物結合臂長度變化的影響,具體描述見實施例6。如圖所示,對于第一和第二底物結合區域(臂)來說,互補的底物結合區域的長度范圍為4~13個核苷酸,測定催化活性并用kcat(min-1)和Km(納摩爾[nM])表示出來。
圖13給出了對DNA酶的核苷酸殘基進行修飾的影響,具體描述見實施例6。37℃下將DNA溫育在含10%熱滅活后的胎牛血清的RPMI-1640培養基中,比較未經修飾的DNA(空心圓)、倒轉的胸腺嘧啶(實心圓)、在每條臂上各有5個2’-O-甲基(空心正方形)、核心中含5個P=S殘基(空心三角形)以及在每條臂上各有3個P=S殘基(實心三角形)。
詳述A.定義如此處使用的一樣,“脫氧核酶”一詞用于描述一種具有酶功能的含DNA核酸。在本說明書中,盡管具有內切脫氧核糖核酸酶活性的脫氧核酶是特別優選的,但是“脫氧核酶”一詞可以包括內切核糖核酸酶和內切脫氧核糖核酸酶。此處能夠和脫氧核酶互換使用的其他詞是“酶促DNA分子”、“DNAzyme”或“催化活性DNA分子”,無論這些分子是通過合成制備的或者是來自有機體或其他來源,它們都應該被理解為包括其酶促活性部分。
“酶促分子”一詞還包括在底物結合區與特定寡核苷酸目標或底物形成互補的DNA分子;這樣的分子還具有酶促活性,這種活性有助于特異地切割寡核苷酸底物。在另一種形式中闡明的,酶促分子能以分子間的方式切割寡核苷酸底物。這種互補特性能使酶促DNA分子與底物寡核苷酸充分地雜交,從而在底物上發生分子間的切割。盡管100%的互補是優選的,但是75-100%的互補也是有效的,也是本發明所期望的。
替代地,本發明的酶促DNA分子可以描述為具有核酸酶或核糖核酸酶活性。此處這些詞都可以互換使用。
盡管根據本發明的酶促DNA分子是特別優選的一類酶促活性分子,但是此處使用的“酶促核酸”一詞可以包括酶促RNA分子或酶促DNA分子、酶促RNA-DNA聚合體、及其具有酶促活性的部分或衍生物。
此處使用的“內切脫氧核糖核酸酶”一詞是指一種能切割主要由DNA組成的底物的酶。此處使用的“內切核糖核酸酶”一詞是指一種能切割主要由RNA組成的底物的酶。
盡管知道罕見的A、T、C和G(以及U)的類似物可能有時會參與堿基的配對,但是正如此處使用的那樣,“堿基對”(bp)一詞通常是用來描述腺嘌呤(A)和胸腺嘧啶(T)或尿嘧啶(U)之間的配對,或者胞嘧啶(C)和鳥嘌呤(G)之間的配對。當DNA或RNA采取雙鏈構型時,通常配對的核苷酸在此也可以被稱為“互補堿基對”。
通常“互補核苷酸序列”是指,DNA或RNA的單鏈分子或節段中的一段核苷酸序列與另一條寡核苷酸單鏈的序列充分地互補從而通過氫鍵特異性地雜合在一起。
“核苷酸”通常是指DNA或RNA的單體單元,它由一個糖殘基(sugarmoiety)(戊糖)、一個磷酸基和一個含氮雜環堿基組成。堿基通過糖苷碳原子(戊糖的1’碳原子)與糖殘基連接在一起,堿基和糖的結合體稱為“核苷”。當核苷中含有一個結合到戊糖的3’或5’位上的磷酸基時,該核苷就成為核苷酸。一段任意連接的核苷酸序列在此典型地稱為“堿基序列”或“核苷酸序列”,以及其他的同義詞,在此用一個通式來表示,除另有特別說明外,該通式按照從左到右的方向,即習慣上的從5’端到3’端的方向。
“核苷酸類似物”通常是指結構上有別于A、T、C、G或U但相似程度足以在核酸分子中替代這些常見核苷酸的嘌呤或嘧啶。在此使用,“核苷酸類似物”包括變化的堿基、不同的或“罕見”的糖(即除“常見”戊糖之外的的糖),或二者的結合。下面C.部分中給出了一系列堿基改變了的典型類似物。
“寡核苷酸或多核苷酸”通常是指單鏈或雙鏈的核苷酸聚合體。在此使用,“寡核苷酸”及其同義詞包括所有的核酸。典型意義上,“寡核苷酸”是指一個由線型的核糖核酸鏈組成的核酸分子。確切的大小取決于許多的因素,接下來還取決于最終的使用條件,這一點是本領域技術人員所熟知的。
在此使用的,“生理條件”是指模仿哺乳動物體內,特別是人體內的條件建立的反應條件。溫度、陽離子的獲得程度以及pH范圍等變量的變化情況會在下面做更詳細地描述,“生理條件”通常包括35~40℃的溫度范圍,特別優選37℃;7.0~8.0的pH范圍,特別優選7.5;以及進一步包括陽離子的獲得程度,優選二價陽離子和/或單價陽離子,濃度為約2~15mM的Mg2+以及0~1.0mM的Na+是特別優選的。任選地,此處使用的“生理條件”可以包括游離的核苷輔因子的存在。如上所述,優選的條件將在下面做更詳細地描述。
B.酶促DNA分子在各種實施方案中,本發明的酶促DNA分子中可能結合有包括添加、缺失或取代在內的一種或多種修飾或突變。在替代的技術方案中,可以用產生隨機或特異突變或修飾的方法來產生這些突變或修飾。例如,這些突變可以是改變長度,或改變核苷酸序列、環、間區或識別序列(或結構域)。一個具有催化活性的酶促DNA分子中的一個或多個突變可以與第二個具有催化活性的酶促DNA分子中的突變結合從而產生一種把這兩個分子的突變都包括在內的新的酶促DNA分子。
在其他的優選實施方案中,可以利用為本領域技術人員所熟知的各種方法將隨機突變引入到本發明的酶促DNA分子中。例如,Cadwell等人在PCR方法及應用,228-33,1992一書中描述的方法特別優選用于本發明,下面的實施例中對其作了一些修改。(還參見Cadwell,et al,PCR方法及應用,3(Suppl.)S136-S140,1994)根據這種修飾后的PCR方法,可以將隨機點突變導入克隆基因中。
例如,上述方法已經用于誘變核酶的編碼基因,序列分析測定的結果表明每個位置上的突變機率為0.66%±0.13%(置信區間為95%),并且在堿基取代的類型上未發現任何強偏嗜。這使得可以在本發明的酶促DNA分子的任一位置上導入隨機突變。
Joyce等人在Nucleic Acids Res.,17711-722,1989一文中公開了另一種導入特定或隨機突變的方法。后面的這種方法包括切割雙鏈DNA中的模板(編碼)鏈,重構該模板鏈的同時將誘變的寡核苷酸包括進來,然后轉錄這種部分錯配的模板。這使得通過在選定位置包括含有已知或隨機核苷酸的寡核苷酸,從而在所述分子中的任一位置上導入特定的或隨機的突變。
根據分子的類型和功能的不同,本發明的酶促DNA分子可以相應地具有不同的長度和折疊類型。例如,盡管為了避免因分子本身太長或難以操作使其治療作用受到限制,而優選長度不超過250個核苷酸,但是酶促DNA分子可以長約15~約400個或更多個核苷酸。在各種優選的實施方案中,本發明的酶促DNA分子至少長約20個核苷酸,有效的分子長度可能超過100個核苷酸,但優選的分子的長度通常不多于100個核苷酸。
在各種治療應用中,本發明的酶促DNA分子包括脫氧核酶的酶促活性部分。在各種實施方案中,本發明的酶促DNA分子優選包括不多于200個核苷酸。在其他實施方案中,本發明的脫氧核酶包括不超過100個核苷酸。還有其他優選的實施方案中,本發明的脫氧核酶的長度為約20~75個核苷酸,更優選約20~65個核苷酸。其他優選的酶促DNA分子長約10~50個核苷酸。
其他應用中,酶促DNA分子可能采取與“錘頭”核酶類似的構型。這種酶促DNA分子的長度優選不超過約75~100個核苷酸,特別優選長約20~50個核苷酸。
通常,如果一個人要合成一個用于本發明的分子,那么酶促核酸分子越長,則合成的難度越大。本領域的技術人員當然能體會到此類合成的限制。然而無論怎樣,這種更長的分子仍然屬于本發明的范圍之內。
還應該理解的是,本發明的酶促DNA分子可以包括脫氧核酶的酶促活性部分或者可以包括一種有一處或多處突變的脫氧核酶,例如,帶有一段或多段堿基配對序列,或者間隔區缺失或經過修飾,只要這些缺失、添加或修飾不會反過來影響該分子的酶促活性。
典型地,本發明的酶促DNA分子的識別結構域包括位于催化結構域兩側的兩段核酸序列,并且典型地包含一段至少約3~約30個堿基的序列,優選約6~約15個堿基,這些堿基能夠與底物核酸中的一段互補的堿基雜交,這就賦予了酶促DNA分子高度的序列特異性。通過眾所周知的方法對識別位點進行修飾或突變可以改變酶促核酸分子的序列特異性。(見Joyce et al,Nucleic Acids Res.,17711-712,1989.)本發明的酶促核酸分子還包括具有變化了的識別位點或識別結構域的分子。在各種實施方案中,這些變化了的識別結構域賦予包括這種識別結構域的酶促核酸分子獨一無二的序列特異性。識別結構域中的確切核苷酸可以決定發生切割的堿基序列。底物核酸的切割發生在識別結構域中。這種切割在底物切割序列上留下一個2’、3’或2’,3’-環狀磷酸基,在最初緊靠原始底物中底物切割序列3’端的核苷酸上留下一個5’羥基。通過改變出現在識別序列(內部指導序列)中的堿基,可以將切割重新定向到一個所選擇的位點上。見Murphy et al,Proc.Natl.Acad.Sci.USA,869218-9222,1989。
而且,加入多胺有助于促進酶促DNA分子和它的底物之間的識別和結合。有效的多胺的實例包括亞精胺、腐胺或精胺。在具體實施方案中,亞精胺的有效濃度約為1mM,但是約0.1mM~約10mM濃度范圍也是有作用的。
在各種替代的實施方案中,本發明的酶促DNA分子具有增強了的或優化了的切割核酸底物能力,優選切割RNA底物的能力。正如本領域技術人員理解的那樣,通常,酶催化反應的速度隨底物和酶濃度的改變而改變,在高的底物或酶濃度時這種速度達到水平不再升高。把這些效應考慮進去,就可以用下列定義該反應的術語來描述酶催化反應動力學。
在酶促DNA分子作用下,標記過的RNA底物的量會發生變化,用這種切割反應可以測定出本發明的酶促DNA分子的增強了的或優化了的切割RNA底物的能力。通常用催化速度(kcat)與米氏常數(KM)的比值定義切割底物的能力。符號kcat代表當底物達到一個飽和值的時候酶反應的最大速度。KM表示當酶反應速度達到最大反應速度一半時的底物濃度。
例如,本發明中KM和kcat值可以通過底物濃度[S]大于酶促DNA分子濃度[E]的實驗來測定。對應于一定底物濃度范圍的反應初速度可以從初始的直線階段估算出來,該階段通常為反應的前5%或更短部分。數據點通過最小二乘法都適合于下列方程給出的理論曲線v=-KM(v0/[S]+Vmax)。因此,用反應初速度v0和底物濃度[S]就能測定出kcat和KM。
在各種替代的實施方案中,本發明的酶促DNA分子具有增強了的或優化了的切割核酸底物的能力,優選切割RNA底物的能力。在優選實施方案中,酶促DNA分子的增強了的或優化了的切割RNA底物的能力表現出能使反應速度比未經催化的速度快10~109倍。在更優選實施方案中,本發明的酶促DNA分子能夠以比原始反應類型快約103~107倍的速度切割RNA底物。在另一個更優選的實施方案中,增強了的或優化了的切割RNA底物的能力表現為反應速度比原始反應類型快104~106倍。本領域技術人員能體會到,酶促DNA分子的這種增強了的或優化了的切割核酸底物的能力會隨著本發明體外進化法中的篩選限制(selectionconstraints)的變化而變化。
下面實施例1~3中進一步描述修飾本發明的脫氧核酶,其他酶促DNA分子以及核酸酶的各種優選方法。
C.核苷酸類似物如上所述,此處使用的“核苷酸類似物”一詞通常是指結構上有別于A、T、C、G或U但相似程度足以在核酸分子中替代這些“正常”核苷酸的嘌呤或嘧啶。如此處使用的那樣,“核苷酸類似物”包括改變了的堿基、不同的(或罕見的)糖、改變了的磷酸骨架或這些變體的任一組合。本發明中有用的核苷酸類似物的實例包括下表中列出的那些核苷酸類似物,列出的這些類似物中的大部分都屬于37CFR§1.822的條件下認定的修飾后的堿基(在此引入作為參考)。
表1核苷酸類似物縮寫 描述ac4c 4-乙酰胞苷chm5u5-(羧基羥基甲基)尿苷cm 2’-O-甲基胞苷cmnm5s2u 5-羧甲基氨甲基-2-硫尿苷d 二氫尿嘧啶核苷fm 2’-O-甲基假尿嘧啶核苷galq β,D-半乳糖基queosinegm 2’-O-甲基鳥苷I 次黃嘌呤核苷i6aN6-異戊烯腺苷mla1-甲基腺苷mlf1-甲基假尿嘧啶核苷mlg1-甲基鳥苷ml11-甲基次黃嘌呤苷m22g 2,2-二甲基鳥苷m2a2-甲基腺苷m2g2-甲基鳥苷m3c3-甲基胞苷m5c5-甲基胞苷m6aN6-甲基腺苷m7g7-甲基鳥苷mam5u 5-甲基氨甲基尿苷mam5s2u5-甲氧基氨甲基-2-硫尿核苷manq β,D-甘露糖基甲基尿苷mcm5s2u5-甲氧基羧基甲基尿苷mo5u 5-甲氧基尿苷ms2i6a 2-甲硫基-N6-異戊烯腺苷ms2t6a N-((9-β-D-呋喃核糖基-2-甲硫嘌呤-6-基)氨甲酰基)蘇氨酸mt6a N-((9-β-D-呋喃核糖基嘌呤-6-基)N-甲基-氨甲酰基)蘇氨酸mv 尿苷-5-氧乙酸甲酯o5u尿苷-5-氧乙酸(v)osyw wybutoxosinep 假尿苷q queosines2c2-巰基胞苷s2t5-甲基-2-硫尿核苷s2u2-硫尿核苷s4u4-硫尿核苷t 5-甲基尿苷t6aN-((9-β-D-呋喃核糖基嘌呤-6-基)氨甲酰基)蘇氨酸tm 2’-O-甲基-5-甲基尿苷um 2’-O-甲基尿苷yw wybutosinex 3-(3-氨基-3-羧丙基)尿苷,(acp3)uaraU β,D-阿拉伯糖基araT β,D-阿拉伯糖基其他有用的類似物包括公開于國際申請WO92/20823中的類似物(該申請公開的內容在此引入作為參考)或者根據本發明公開的方法制備的類似物。根據本發明公開的內容,DeMesmaeker et al,Angew.Chem.Iht.Ed.Engl.,33226-229,1994;DeMesmaeker et al,Synlett 733-736(Oct.1993);Nielsen et al,Science,2541497-1500,1991;Idziak et al,和Tetrahedron Letters,345417-5420,1993這些文獻中描述的類似物也是有用的,上述公開內容在此引入作為參考。
D.構建酶促DNA分子的方法本發明還提供了一種生產具有預定活性的核酸分子。在一個優選實施方案中,所述核酸分子是一個酶促DNA分子。在另一個實施方案中,所述活性是一種催化活性。
在一個實施方案中,本發明提供了合成隨后能被“構建”成催化特定或預定反應的酶促DNA分子的方法。此處描述了合成制備酶促DNA分子的方法;見,例如,下面的實施例1~3。在其他實施方案中,可以將本發明的酶促DNA分子構建成能結合小分子或配體的形式,例如結合三磷酸腺苷(ATP)的形式(參見Sassanfar等,Nature,364550-553,1993。)。
在另一個實施方案中,本發明期望,一個酶促DNA分子群體經誘變處理產生一個突變酶促DNA分子的不同群體(替代地可以將其稱為“脫氧核酶”或“DNAzymes”)。隨后,將具有預期特性的酶促DNA分子從群體中篩選并且/或者分離出來,然后對其進行擴增。
替代地,可以通過改變酶促DNA分子識別結構域的長度來將突變導入酶促DNA分子中。酶促DNA分子的識別結構域與底物核酸序列中的互補堿基序列有關。改變識別結構域長度的方法是本領域的已知方法,包括PCR,例如;下面實施例中進一步描述了有用的技術。
改變酶促DNA分子識別結構域的長度可以對該酶促DNA分子的結合特異性產生預期的影響。例如,識別結構域長度的增加可以增強酶促DNA分子和底物中寡核苷酸的互補堿基序列之間的結合特異性,或者可以增強識別雜合底物中的特定序列的能力。另外,識別結構域長度的增加還可以增強該結構域結合底物的親和力。在各種實施方案中,酶促DNA分子中的這些改變了的識別結構域能夠增強該酶促DNA分子與其底物間結合的特異性和親和力。
近來,引起注意的是一些寡核苷酸能結合具有互補序列的寡核苷酸之外的分子。這些寡核苷酸通常被稱為“aptamers”。例如,Ellington等人描述的能結合各種有機顏料的RNA分子(Nature,346818-822,1990),Bock等人描述的結合人凝血酶的單鏈DNA分子(Nature,355564-566,1992)。同樣,Jellinek等人描述了能夠結合堿性成纖維細胞生長因子的RNA配體(Proc.Natl.Acad.Sci.USA,9011227-11231,1993)。因此,此處進一步期望,用本發明公開的方法可以構建本發明的具有催化活性的DNA酶使其表現出與多種典型的與aptamers相關的性能。
因此,本領域的技術人員應該理解,本發明的酶促DNA分子能夠在任何一段核苷酸序列上被改變,例如識別結構域,通過此處公開的包括PCR和3SR(自動維持序列擴增見下面實施例1)的各種方法。例如,用包括附加核苷酸的引物能夠在酶促DNA分子的5’端添加上附加的核苷酸。
通過使用定點誘變等方法,還可以更隨機的方式制備或構建本發明的酶促DNA分子。例如,基本上可以按照Morinaga et al,Biotechnology,2636,1984,中描述的方法進行定點誘變,該方法按照本發明的描述改進后可以應用于脫氧核酶。下面實施例中將進一步描述用于構建酶促DNA分子的方法。
在一個公開的實施方案中,本發明的酶促DNA分子包括一個保守的核心及其兩側的兩個底物結合(或識別)結構域或序列,這些結構域或序列和底物之間通過堿基配對相互作用。在各種實施方案中,保守核心包括一個或多個保守結構域或序列。在另一個變化中,酶促DNA分子進一步包括位于參與堿基配對的區域(或序列)之間的“間隔”區(序列)。還有另一個變化中,保守核心被一個或多個保守程度小得多的可變或“間隔”核苷酸在各種間隔上“間斷”開。
在各種實施方案中,酶促DNA分子的群體由至少兩種不同類型的脫氧核酶分子組成。例如,在一個變化中,這些分子具有不同的序列。在另一個變化中,這些脫氧核酶是一種具有一段能限定出識別結構域的核酸序列的核酸分子,限定出的結構域與該核苷酸序列5’末端相鄰或相靠。在各種替代方案中,本發明的酶促DNA分子進一步包括一個或多個位于識別結構域3’端的間隔區,一個或多個位于識別結構域和/或間隔區3’端的環。在另一些變化中,本發明的脫氧核酶可以包括一個或多個能與同一分子的其他區域雜交的區域。本發明其他部分描述了根據本發明公開的方法生產的具有其他特征的酶促DNA分子。
其他實施方案中,誘變條件包括將特定的或隨機的核苷酸替代物導入到酶促DNA分子中的條件。典型的誘變條件的實例包括在本說明書中其他部分描述的條件以及Joyce et al,Nucl.Acids.Res.,17711-722,1989;Joyce,Gene,8283-87,1989;和Beaudry et al,Science,257635-41,1992這些文獻中描述的方法。
還有其他實施方案中,本發明的突變酶促核酸分子的變化群體中包括至少兩個核苷酸序列不完全相同的核酸分子。在其他變化中,然后根據完成預定活性的能力,將具有預定活性的酶促DNA分子或其他酶促核酸從上述的變化群體中篩選出來。在各種實施方案中,預定活性包括,但不限于,增強了的催化活性、減小了的KM、增強了的底物結合能力、改變了的底物特異性等。
可以被認為是酶各方面性能的其他參數包括催化活性或催化能力、底物結合能力、酶轉換速度、酶對反饋機制的敏感性等。在某些情況下,底物特異性可以被當作是酶性能的一個方面,具體地說是,在酶能識別和結合兩個或多個競爭性底物的情況下,其中的每個競爭性底物都可以影響該酶與其他底物相互作用的性能。
此處使用的底物特異性可以指本發明的酶促核酸分子對一種具體底物的特異性,例如只包括核糖核苷酸的底物、只包括脫氧核糖核苷酸的底物或者二者的組合。底物分子也可以包括某些核苷酸類似物。在各種實施方案中,優選地,本發明的酶促核酸分子可以結合到雜合或非雜合底物的特定區域上。
此處確定的術語或參數“底物特異性”也可以包括序列特異性;即本發明的酶促核酸分子可以“識別”和結合到一種具有一段特定核酸序列的核酸底物上。例如,如果本發明的酶促核酸分子的底物識別結構域只結合具有一連串的一個或兩個核糖核苷酸(例如,rA)的底物分子,那么不識別或結合缺乏這些序列的核酸底物分子。
關于篩選的方法,在各種實施方案中,篩選包括任何一種用物理學手段從突變酶促核酸的變化群體中把具有預定活性的突變酶促核酸分離出來。通常,篩選包括根據大小進行分離,根據有無催化活性進行分離,或者通過突變核酸與另一種核酸、多肽或或其他溶解于溶液中或吸附在固體基質上的分子的雜交來進行分離。
在各種實施方案中,所述預定活性能將其本身的效力賦予具有這種活性的突變酶促核酸。例如,預定活性可以是酶促DNA分子活性,這種活性能使具有這種活性的突變酶促核酸與其底物通過共價鍵連接在一起。然后通過共價鍵的效力將該突變酶促核酸篩選出來。
其他實施方案中,篩選具有預定活性的突變酶促核酸包括突變酶促核酸的擴增(見Joyce,Gene,8283-87,1989;Beaudry et al,Science,257635-41,1992)。實施例部分將描述對具有預定特性或活性的酶促核酸分子的篩選。
E.組合物本發明還提供了含有一種或多種類型或群體的本發明的酶促DNA分子的組合物;例如,不同類型或群體可以識別并切割不同的核苷酸序列。組合物可以進一步包括一種含核糖核酸的底物。如此處討論的那樣,根據本發明組合物可以進一步包括鉛離子、鎂離子或其他二價或單價陽離子。
優選地,酶促DNA分子的濃度為約0.05μM~約2μM。典型地,酶促DNA分子與底物之間的濃度比為約1∶5~約1∶50。更優選地,酶促DNA分子存在于該組合物中的濃度為約0.1μM~約1μM。還有更優選地,組合物中含酶促DNA分子的濃度為約0.1μM~約0.5μM。優選地,組合物中底物濃度為約0.5μM~約1000μM。
本領域技術人員應該理解,含核酸底物有多種來源,其中包括自然發生和合成途徑。合適的底物來源包括,但不限于,各種病毒和反轉錄病毒,包括HIV-1、HIV-2、HTLV-I和HTLV-II。
其他合適的底物包括,但不限于,包含下列病毒的或由下列病毒產生的病毒劑和反轉錄病毒劑小RNA病毒、嗜肝病毒科病毒(例如,HBV、HCV)、乳頭瘤病毒(例如,HPV)、伽馬皰疹病毒科病毒(例如,EB病毒)、淋巴隱病毒(lymphocryptoviruses)、白血病病毒(例如,HTLV-I和HTLV-II)、黃病毒、披膜病毒、皰疹病毒(包括阿爾法皰疹病毒和貝塔皰疹病毒)、巨細胞病毒(CMV)、流感病毒以及引起免疫缺陷病和綜合征的病毒和反轉錄病毒(例如,HIV-1和HIV-2)。此外,合適的底物包括感染非人靈長類動物和其他動物的病毒或反轉錄病毒,所述病毒包括但不限于,猿免疫缺陷病毒、貓免疫缺陷病毒以及牛白血病病毒。
如上所述,鎂離子、鉛離子或另外合適的單價或二價陽離子也可以約1~100mM的濃度范圍存在于組合物中。更優選地,組合物中預定的離子濃度為約2mM~50mM,具體優選的濃度為約5mM。本領域技術人員會理解,離子濃度只受下列兩種因素的限制離子來源(例如鎂離子)在水溶液中的溶解極限以及保證酶促DNA分子以活性構型存在于該組合物中的愿望。
本發明還提供了包括本發明的酶促DNA分子、脫氧核糖核苷酸-核糖核苷酸雜合分子以及以上述濃度存在的鎂離子或鉛離子的組合物。如上所述,可以用其他單價或二價離子(例如,Ca2+)來取代鎂離子。
本發明還提供了含有本發明的酶促DNA分子、含核酸底物(例如,RNA)以及預定濃度大于1毫摩爾的離子,其中所述底物的長度大于所述酶促DNA分子上的識別結構域。
在一個變化中,組合物包括酶促DNA分子-底物復合物,其中酶促DNA分子與其底物之間的堿基對是連續的。在另一個實施方案中,酶促DNA分子與其底物之間的堿基對被一個或多個非互補性的堿基對間斷。在各種替代的實施方案中,本發明的組合物可以進一步包括單價陽離子、二價陽離子或二者的組合。
在另一個變化中,本發明的酶促DNA分子在二價陽離子存在或缺乏的條件下都能有效地發揮作用。在一個變化中,有二價陽離子存在,包括Pb2+、Mg2+、Mn2+、Zn2+或ca2+。替代地,本發明的酶促DNA分子在單價陽離子存在或缺乏的條件下都能有效地發揮作用。如此處公開的那樣,可以預見濃度與此處公開的Pb2+或Mg2+近似的單價或二價陽離子都是有用的。
任選地,單價陽離子還可以與二價陽離子同時存在,或者作為二價陽離子的“替換物”存在。例如,鈉(Na+)或鉀(K+)等單價陽離子可以游離態離子或以NaCl或KCl等可解離化合物的形式存在。
在一個實施方案中,組合物中單價陽離子的濃度為0~1.0M。在另一個實施方案中,單價陽離子的濃度范圍為約0~200mM。在其他實施方案中,單價陽離子的濃度范圍為約1~100mM。替代地,單價陽離子濃度范圍為約2mM~50mM。還有其他的實施方案中,濃度范圍為約2mM~25mM。
F.使用酶促DNA分子的方法如此處描述的那樣,使用酶促DNA分子的方法覆蓋了現有的酶和/或反義寡聚核苷酸的本領域眾所周知的多種不同用途。正如上述討論的那樣,能切割連接相鄰核酸的鍵(例如,磷酸二酯鍵)的分子具有包括多種不同應用的大量用途。例如,具有所公開的性能、結構和/或功能的酶促DNA分子可以用于藥用和醫用產品(例如,用于傷口清創術、血凝塊的溶解等),以及家居用品(例如,洗滌劑、牙齒清潔用品、肉致嫩劑)。為了滅活體外和體內的RNA等目標核酸序列。本發明所公開的化合物、組合物以及方法的工業用途也為本發明提供,并完全落在本發明的范圍之內。
本發明還描述了用于切割任何單鏈、環狀、部分雙鏈或全長雙鏈核酸的方法;這些方法中的多數都使用了本發明的新型酶促活性核酸分子。在各種實施方案中,底物的單鏈核酸節段或單鏈核酸部分包括DNA、修飾后的DNA、RNA、修飾后的RNA或其組合。優選地,核酸底物只需在靠近底物切割序列處為單鏈形式以便本發明的酶促核酸分子能通過該酶識別序列雜交到底物切割序列上。
能被本發明方法切割的核酸底物可以是化學合成的或酶促產生的,或者它可以是從下列來源分離得到的噬菌體、病毒、包括動物細胞、植物細胞、酵母細胞和細菌細胞等在內的原核細胞或者真核細胞。化學合成的單鏈或雙鏈核酸可以從多種來源購買獲得,包括但不限于,Research Genetics(Huntsville,AL)。
還可以根據廠商的提供的方法,利用應用生物系統(Foster City,CA)寡核苷酸合成儀來合成RNA底物。單鏈噬菌體也是核酸底物的一種來源。(見Messing et al,Proc.Natl.Acad.Sci.USA,743642~3646,1977,以及Yanisch-Perron et al,Gene,33103~119,1985)。含單鏈噬菌體的細菌細胞也是合適單鏈核酸底物的一種方便來源。
下列任一種RNA病毒提供都可以提供能被本發明的方法切割的單鏈RNA小RNA病毒、披膜病毒、正粘病毒、副粘病毒、彈狀病毒、冠狀病毒、沙粒病毒或反轉錄病毒等。如上所述,很多種原核細胞或真核細胞也可以是合適核酸底物的極好來源。
本發明的方法可以用于單鏈核酸或者環狀核酸或雙鏈核酸的單鏈部分,含有這些結構的細胞包括真核細胞、原核細胞、植物細胞、動物細胞、酵母細胞或細菌細胞。這些情況下,本發明的酶促核酸分子(例如,酶促DNA分子或脫氧核酶)可以發揮抗病毒劑或基因表達調節因子的作用。下面將進一步描述本發明的酶促DNA分子在這些用途中的實例。
本發明的多數方法中,單鏈核酸的切割發生在預先選定的堿基序列的3’端。典型地,該預定的堿基序列或底物切割序列包括1~10個核苷酸。在其他優選實施方案中,本發明的酶促DNA分子能識別切割位點上游或者上游及下游的核苷酸。在各種實施方案中,酶促DNA分子能識別切割位點上游的約2~10個核苷酸;在其他實施方案中,酶促DNA分子能識別識別位點上游的約2~10個核苷酸以及下游的約2~10個核苷酸。其他優選實施方案提供了一種能識別長度達到約30個核苷酸的核酸序列的酶促DNA分子,還更優選長度達到約20個核苷酸的核酸序列。
本發明公開的方法通過改變酶促DNA分子識別結構域的核苷酸序列,能使切割發生在任意的核苷酸序列上。這使得選定位置不含限制性內切酶位點的單鏈核酸也可以被切割。
通過在合適切割位點處的點特異性水解,可以把本發明的酶促DNA分子同單鏈核酸底物的任一部分中分離開,而底物仍保留有與這種酶促DNA分子結合的能力。把酶促DNA分子同底物(或“切割產物”)分離從而使得該酶促DNA分子能完成另外的切割反應。
通常,在適合核酸切割的條件下,優選在生理條件下,用有效量的本發明的酶促DNA分子處理核酸底物。如果核酸底物中包含DNA,那么切割條件可能包括以約2~10mM濃度存在的二價陽離子。
酶促DNA分子的有效量為切割單鏈核酸中預定堿基序列所需的量。優選地,酶促DNA分子以DNA分子與底物切割位點之間的摩爾比為1~20的量存在。在使用的具體核酸切割條件下,這個比例可以根據處理的長度和具體酶促DNA分子的效率調整。
因此,在一個優選實施方案中,處理過程典型地包括混合,在水溶液中,把含RNA的底物和酶混合形成切割混合物,然后把形成的切割混合物在RNA切割條件下保持足夠長一段時間使得能夠在RNA中的任一段預定的核苷酸序列上切割RNA底物。在各種的實施方案中,需要提供一種來源的離子——即單價或二價陽離子或二者的組合。
在本發明的一個實施方案中,酶促DNA分子切割單鏈核酸所需的時間已經被預先選定。時間的長短為1分鐘到24小時,并可以根據反應物濃度和反應溫度改變。通常,這段時間為約10分鐘到2小時以使該酶促DNA分子可以在任意預定的核苷酸序列上切割單鏈核酸。
本發明進一步提供了核酸切割條件包括一種來源的濃度約2~100mM的二價陽離子(例如,PbOAc)。典型地,核酸切割條件包括濃度為約2mM~10mM二價陽離子,具體優選濃度約5mM。
通過測定在給定的陽離子濃度時被切割的單鏈核酸的量,能夠測定出核酸切割條件應包括的最佳陽離子濃度。本領域技術人員應該理解,該最佳陽離子濃度可以根據使用的具體酶促DNA分子改變。
本發明進一步提供了核酸切割包括一種約6.0~9.0的pH值。一個優選實施方案中,pH值范圍為約pH6.5~pH8.0。在另一個優選的實施方案中,pH值模擬生理條件,即pH值為約7.0~7.8,具體優選pH值為約7.5。
本領域技術人員可以理解的是,只要用于核酸切割的pH值能使酶促DNA分子保持活性構型,本發明的方法可以在一個寬的pH范圍實施。通過在預定核苷酸序列切割單鏈核酸的能力,可以容易地檢測到具有活性構型的酶促DNA分子。
在各種實施方案中,核酸切割條件還包括一個變化的溫度范圍。如上所述,盡管此處也提供了工業應用的溫度范圍,但是特別優選與生理條件一致的溫度范圍。在一個實施方案中,溫度范圍為約15℃~約60℃。另一個變化中,核酸切割條件包括約30℃~約56℃的濃度范圍。還有另一個變化中,核酸切割條件包括約35℃~約50℃的濃度范圍。在一個優選的實施方案中,核酸切割條件包括約37℃~約42℃的濃度范圍。與核酸切割條件一致的溫度范圍只受期望的切割速度和該具體溫度下該種具體酶促DNA分子的穩定性的限制。
在各種方法中,本發明提供了包括多胺存在的核酸切割條件。可用于實施本發明的多胺包括亞精胺、腐胺或精胺等。在一個變化中,多胺的濃度為約0.01mM~約10mM。在另一個變化中,多胺的濃度為約1mM~約10mM。核酸切割條件還可以包括以約2mM~約5mM存在的多胺。在各種優選實施方案中,多胺是亞精胺。
G.載體本發明的特征還在于表達載體,其中包含位于該載體中編碼本發明的酶促DNA分子的一個核酸節段,優選地存在方式為能使該酶促DNA分子在目標細胞(例如,植物細胞或動物細胞)中表達。
因此,通常,根據本發明的載體優選包括質粒、粘粒、噬菌粒、病毒或噬菌體載體。優選,合適的載體包括單鏈DNA(ssDNA)——例如,環狀噬菌粒ssDNA。還應該被理解到的是根據本發明有用的載體不需是環狀的。
在一個變化中,優選地,在另外的酶促DNA分子編碼序列的兩側都提供核酸序列,該序列可以被第一酶促DNA分子識別。該間插序列或旁側序列優選包括至少1個核苷酸;更優選,間插序列或旁側序列長度為約2~20個核苷酸,具體優選長度約5~10個核苷酸的序列。
根據本發明添加一個聚核苷酸尾,可用于保護酶促DNA分子的3’末端。這可以通過使用末端轉移酶結合一個多聚體序列來提供。
根據本發明的一個載體包括兩個或多個酶促DNA分子。在一個實施方案中,第一酶促DNA分子有分子內切割活性,能識別和切割核苷酸序列使其釋放出其他酶促DNA序列;即能夠從該載體中“釋放”出其他酶促DNA分子。例如,優選構建這樣一種載體以便當第一酶促DNA分子被表達時,該第一分子能切割編碼第二酶促DNA分子、第三酶促DNA分子、依此類推的另外核苷酸序列的旁側序列。假定說,第一酶促DNA分子(即,“釋放”分子)能以分子內的方式切割寡核苷酸序列,另外的(例如,第二、第三、等等)酶促DNA分子(即“被釋放”分子)不需要具備與“釋放”分子相同的特征。例如,在一個實施方案中,“被釋放”(即第二、第三、等等)酶促DNA分子能切割特定的RNA序列,第一(“釋放”)酶促DNA分子具有的核酸酶活性使得它能夠解放出那些“被釋放”分子。在另一個實施方案中,“被釋放”酶促DNA分子具有切割酰胺鍵活性,而第一(“釋放”)酶促DNA分子具有核酸酶活性。
替代地,第一酶促DNA分子可以與第二(及第三、第四等)酶促DNA分子分別用一個單獨的載體編碼,并具有分子間切割活性。如此處所述,第一酶促DNA分子可能是自身切割酶促DNA分子(例如,脫氧核酶),第二酶促DNA分子可以是任一期望類型的酶促DNA分子。當一個載體被用來表達來自這些核酸序列的DNA時,在合適的條件下該DNA能切割每個旁側區域,從而釋放出一個或多個拷貝的第二酶促DNA分子。如果需要,也可以將幾個不同的第二酶促DNA分子置于同一個細胞或攜載體中生產不同的脫氧核酶。還提供了,任一個或多個載體包括以“釋放”和“被釋放”酶促核酸分子的任一組合方式存在的一個或多個核酶或脫氧核酶,只要這種組合可以達到預期的結果釋放出能切割預定核酸序列的酶促核酸分子。
本發明還提供了分離和純化酶促DNA分子的方法。除了此處描述的方法以外,也可以采用本領域技術人員知道的各種純化方法(例如,使用HPLC的方法)和層析分離技術。參見,例如,公開的國際申請WO93/23569中描述的方法,本申請的公開的內容在此引入作為參考。
應該理解的是此處描述的實施方案的各種結合都被包括在本發明的范圍內。從上述的描述、下面的實施例和權利要求書中可以清楚地得出本發明的其他特征和優點。
實施例下面實施例是用來說明,而并非限制本發明的。
1.酶促DNA分子的體外進化綜述體外的篩選和分離技術使得能夠在對新的催化劑的組成和結構無任何先驗的了解時就能夠分離到它們。用這些方法可以得到具有新的催化特性的RNA酶。例如,已經從tRNAPhe分子的一個隨機庫中得出了在鉛離子存在的條件下具有自動切割功能的核酶(Pan et al,Biochemistry,313887-3895,1992)。已經分離到的第I類核酶突變體能切割DNA(Beaudry et al,Science,257635-641,1992)或者具有改變了的金屬離子依賴性(Lehman et al,Nature,361182-185,1993)。從一個隨機RNA序列庫開始,已經得到能催化一種聚合酶樣反應的分子(Bartel et al,Science,2611411-1418,1993)。本實施例中,描述了體外進化方法中通過改變選擇性的限制精煉被進化的酶的特異催化性能。
達爾文進化論要求重復操作3個過程(a)遺傳突變體的導入;(b)根據適應標準選擇個體;以及(c)擴增被選擇的個體。這些過程都能夠在體外實現(Joyce,Gene,8283,1989)。基因誘變可以通過化學修飾、隨機誘變寡脫氧核苷酸的引入、或聚合酶的不精確拷貝來實現。(參見Cadwell et al,PCR方法和應用,228-33,1992;Cadwellet al,PCR方法和應用,3(增補)S136-S140,1994;Chu et al,Virology,98168,1979;Shortle et al,Meth.Enzymol.,100457,1983;Myerset al,Science,229242,1985;Matteucci et al,Nucleic AcidsRes.,113113,1983;Wells et al,Gene,34315,1985;Mcneilet al,Mol.Cell.Biol.,53545,1985;Hutchison et al,Proc.Natl.Acad.Sci.USA,83710,1986;Derbyshire et al,Gene,46145,1986;Zakour et al,Nature,295708,1982;Lehtovaara etal,Protein Eng.,263,1988;Leung et al,Techique,111,1989;Zhouet al,Nucl.Acids Res.,196052,1991)。
這些基因產物可以被篩選,例如,通過其結合一個配體或完成一個化學反應的能力來篩選。(見,例如,Joyce,id.,1989;Robertson etal,Nature,344467,1990;Tuerk et al,Science,249505,1990)。與這些基因產物對應的基因可以通過交互引物(reciprocal primer)方法來擴增,例如通過聚合酶鏈反應(PCR)。(見Saiki et al,Science,2301350-54,1985;Saiki et al,Science,239487-491,1988)。
替代地,可以用自動維持序列復制(3SR)進行核酸擴增。(見Guatelli et al,proc.Natl.Acad.Sci USA,871874,1990,該文獻的內容在此引入作為參考。)根據3SR方法,可以用以下3種反轉錄病毒不可缺少的酶在等溫條件下體外指數擴增(復制)目標核酸序列(1)反轉錄酶,(2)核糖核酸酶H,以及(3)DNA依賴性的RNA聚合酶。通過模擬反轉錄病毒利用cDNA中間體復制RNA的策略,該反應積聚了初始目標的cDNA拷貝和RNA拷貝。
總而言之,如果要使一種酶促DNA分子群體進化,可以用一系列連續的反轉錄和轉錄反應通過cDNA中間體復制RNA目標序列。這種設計的關鍵因素有(a)寡聚核苷酸不但對目標具有特異性,而且含有編碼T7RNA聚合酶結合位點的5,突出端,因此得到的這些cDNAs是活性轉錄模板;(b)由于核糖核酸酶H對中間的RNA-DNA雜合體中的RNA模板的降解,因此可以完成cDNA兩條鏈的合成從而實現cDNA的合成;以及(c)反應產物(cDNA和RNA)可以作為隨后步驟的模板,從而保證了指數復制。
如在這些實施例中公開的那樣,如果涉及酶促DNA分子,這種設計的各種關鍵因素會有所不同。例如,(1)寡聚核苷酸對目標具有特異性,并優選以某種方式標記過——例如,通過生物素化——所以得到的活性模板鏈容易識別;以及(2)優選使用的體外篩選方法取決于最有利的釋放機制。
實現達爾文體外進化的一個主要困難是需要將與基因組有關的突變和擴增同與表型相關的篩選有機地結合在一起。在使用核酸酶時,該酶的基因型和表型都體現在同一分子中,從而簡化了該任務。
A.促DNA分子的設計眾所周知,單鏈DNA能夠采取令人感興趣的三級結構。例如,“tDNA”的結構與相應的tRNA的結構非常相似。(參見Paquette et al,Eur.J.Biochem.,189259-265,1990)。而且,將錘頭核酶中的35個核糖核苷酸取代多達31個后,而仍能至少保持一些催化活性,這一點已經能做到。(見Perreault et al,Nature,344565-567,1990;Williams et al,proc.Natl.Acad.Sci.USA,89918-921,1992;Yanget al,Biochemistry,315005-5009,1992)。
已經將體外篩選技術應用到隨機序列DNA的大型群體,使得與目標配體以高度親和活力結合的特異性DNA“aptamer”能夠得以回收(Bocket al,Nature,355564-566,1992;Ellington et al Nature,355850-852,1992;Wyatt et al,Proc,Natl.Acad.Sci.USA,911356-1360,1994)。近來,有兩個組進行了aptamer的第一NMR結構測定,15mer DNA形成了一種G-四合體結構,并能以高度親和力結合凝血酶蛋白(Wang et al,Biochemistry,321899-1904,1993;Macaya etal,Proc.Natl.Acad.Sci.USA,903745-3749,1993)。X-射線晶體學分析確證了這些發現(Padmanabhan et al,J.Biol.Chem.,26817651-17654,1993)。
能夠以高度的親和力和特異性與底物分子結合是一種好的酶的必備條件。此外,酶還必須能利用本身的或輔因子中的位置恰當的(well-positioned)的官能團加速一種特異性的化學轉化。而且,該酶還必須在反應過程中保持不變,并能實現催化轉換。另外的一個要求是,酶應該是一種含有多個亞單位的信息大分子,這些亞單位的特異性排列方式決定催化活性。雖然這些標準在語義背景和化學背景兩個方面都還存在著爭議,但是可以用它們來區分化學速度加快的現象,這些現象包括從單一溶劑的影響到限制底物擴散時生物酶的作用。(Albery et al,Biochemistry,155631-5640,1976)。
如下面更詳細描述的那樣,我們努力發展了一種通用的方法,該方法能從隨機序列開始,快速地獲得DNA催化劑和DNA酶。作為初始目標,我們選擇了一種我們認為DNA能夠很好完成的反應在二價金屬輔因子的幫助下,水解切割RNA磷酸二酯鍵。這與被各種包括錘頭狀和發夾狀基元的自然生成的RNA酶催化的反應相同。(見,例如,Forster et al,Cell,49211-220,1987;Uhlenbeck,Nature,328596-600,1987;Hampel et al,Biochemistry,284929-4933,1989)。
近來表明從tRNA分子的隨機文庫開始,可以得到Pb2+依賴性核酶,這種酶在中性pH值條件下具有位點特異性磷酸酯酶活性(Pan et al,Biochemistry,313887-3895,1992;Pan et al,Nature,358560-563,1992)。這與酵母tRNAPhe的隨機自身切割反應類似(Dirheimer et al,Biochemie,54127-144,1972),這種隨機反應取決于Pb2+在tRNA的特定位點上的配位作用。(見Rubin et al,J.Biomol.Struct.Dgn.,1639-646,1983Brown et al,Biochemistry,244785-4801,1985)。
如此處公開的那樣,我們的目標包括發展能在特定的RNA磷酸酯上實施Pb2+依賴性切割的DNAs,該磷酸酯最初存在于與這種DNA 5’末端相連的短的前導序列中,最后位于一個單獨的分子內,該分子能被以具有快速催化反轉特點的分子間方式切割。如下面所述,這些目標已成功實現。
關于DNA與目標磷酸酯及周圍核苷酸間如何相互作用還沒有任何設想。從一個50聚體隨機序列的約1014的庫開始,按常規方法進行體外篩選。在4天內進行了5次篩選后,該群體整體上都獲得了切割目標磷酸酯的能力,在1mM Pb2+存在的條件下該切割反應的速度為約0.2min-1。這與同樣反應條件下自發切割的速度相比快了約105倍。
從上述群體中分離出個體,測序,并分析其催化活性。根據這一信息,將反應改造成分子間方式,然后將其簡化使得19聚體的底物能夠被38聚體的DNA酶特異性地切割,該反應在23℃、pH7.0以及1mM PbOAc的條件下以1min-1的轉換速度開始。
B.體外篩選方案制造一個含約1014個單鏈DNA分子的初始文庫,其中所有的分子都含有一個5’端生物素組件,隨后依次是一個含有單個核糖核苷酸的固定結構域、一個由50個隨機脫氧核糖核苷酸組成的強的催化結構域,以及3’端的第二固定結構域(圖1)。
從兩側帶有引物結合位點的由50個隨機核苷酸的組成的合成cDNA開始,利用巢式PCR(聚合酶鏈反應)技術構建上述文庫。該巢式PCR使用的合成寡脫氧核苷酸引物的5’端經過生物素化,3’端帶有1個腺嘌呤核糖核苷酸。核糖核苷酸結尾的寡核苷酸能夠有效地引導PCR過程中的模板指導的延伸,這樣就生成了含有單個嵌入核糖核苷酸的延伸產物。
圖1給出了用于分離能夠切割目標RNA磷酸酯的DNAs的選擇性擴增方案。通過PCR擴增含有50個隨機核苷酸的雙鏈DNA,其中使用的引物5’端經過生物素化(例如,引物3——3a或3b),3’末端以腺嘌呤核糖核苷酸(用符號“N”或“rA”代表,其中N和rA都代表腺嘌呤核糖核苷酸)結尾。把得到雙鏈DNA固定到一種鏈霉親和素基質上,用0.2N NaOH洗脫出未被生物素化的DNA鏈。用緩沖液將柱重新平衡后,用加有1mM PbOAc的同一溶液洗滌該柱。具有Pb2+依賴性自身切割性能的DNAs被從柱上釋放出來,收集洗脫液,用PCR擴增。然后用PCR產物啟動下面選擇性擴增循環。
讓PCR產物通過鏈霉親和素親和基質,雙鏈DNA中的5’端生物素化的鏈發生非共價結合。用0.2N NaOH粗洗,移去未被生物素化的DNA鏈,23℃下用含有0.5M NaCl、0.5M KCl、50mM MgCl2和50mM HEPES(pH7.0)的緩沖液平衡結合鏈。接著,在同種緩沖液種加入1mM PbOAc,使得在目標磷酸酯上發生Pb2+依賴性自身切割,從而從鏈霉親和素基質中釋放出DNAs的一個亞單位。原則上,單個DNA可以通過各種方式促進它自身釋放,例如,破壞生物素與鏈霉親和素之間的相互作用或者切斷一個脫氧核糖核苷酸連接。根據這種連接的相對不穩定性,釋放機制最大可能采用的是切斷核糖核苷3’-O-P鍵,Pb2+依賴性水解切割使得釋放能夠以最快的速度地發生。然而,理論上講,體外選擇方法應該采用最佳釋放機制,而且那些個體能最好地實施該機制。
把加入Pb2+時從基質上釋放出的DNA分子收集在洗脫液中,乙醇沉淀濃縮,然后利用巢式PCR擴增。在構建分子的起始文庫時,第一次PCR使用的是位于隨機區域兩側的引物(引物1和2),第二次擴增時使用的是3’末端帶有一個核糖腺苷酸5’端生物素化引物(引物3b),因此再次導入了目標RNA磷酸酯。選擇性擴增反應全程需要3~4個小時。
該方法的每個循環中都通過下列3種途徑來純化這些分子第一,PCR擴增后,用酚抽提兩次,用氯仿/異戊醇抽提一次,然后用乙醇沉淀;第二,將DNA結合到鏈霉親和素上后,在強變性條件下洗去所有未生物素化的分子;以及第三,加Pb2+洗脫后,用乙醇沉淀。由于沒有采用任何凝膠電泳純化步驟,因此沒有任何選擇壓力來把這些分子限制到一種特定長度。
C.選擇催化活性DNA進行連續5輪體外選擇,為了逐漸增強選擇的嚴格性,加入Pb2+后逐漸縮短反應時間。在第1到第3輪中,反應時間是1小時,在第4輪中,反應時間是20分鐘,在第5輪中,是1分鐘。在與體外選擇過程相同的條件下,將單鏈DNAs的起始庫與每輪選擇后得到的分子群體同時進行自身切割活性分析(圖2)。
為了進行這種分析,用5’-32P代替5’生物素組件制備分子,這就使得對起始原料和5’切割產物二者都可以進行檢測。溫育5分鐘后,初始庫(G0)或第1輪和第2輪選擇后得到的群體中都未檢測到任何活性。第3輪(G3)后得到的DNAs表現出一般水平的活性;這種水平穩定增加,第5輪(G5)后得到的DNAs自身切割的比例達到大約50%。即使延長溫育時間后,也只能在目標磷酸酯上檢測到切割。
圖2給出的是DNA起始庫(G0)以及第1輪到第5輪選擇(G1~G5)后得到的群體的自身切割活性。反應混合物包括50mM MgCl2、0.5M NaCl、0.5M KCl、和50mM HEPES(23℃下pH7.0),以及3nM[5’-32P]標記的DNA,在含或不含1mM PbOAc的條件下23℃溫育5分鐘。符號Pre代表含108個核苷酸的前體DNA(SEQ ID NO 4);Clv代表含28個核苷酸的5’切割產物(SEQ ID NO 5);M代表引物3a(SEQ ID NO 6),其長度相當于5’切割產物。
顯示出的含28個核苷酸的5’切割產物優選具有下列序列5’-GGGACGAATTCTAATACGACTCACTATN-3’,其中“N”代表位于3’末端帶有另外的2’,3’-環磷酸的腺苷核糖核苷酸(SEQ ID NO 5)。在替代實施方案中,“N”代表位于分子3’末端帶有另外的2’磷酸或3’磷酸的腺苷核糖核苷酸。
圖2中,“GO”一列中“Pre”條帶包括一種含108個核苷酸的前體DNAs樣品,其中每個分子中都包括50個隨機核苷酸。因此,任何給定的“Pre”樣品都含有各種前體DNAs,每個樣品都可能與前面和后面的樣品不同。“G1到“G5”列的“Pre”中富集的催化活性的DNA分子逐漸增加,但是仍含有大量的不同的DNA序列(即在50個核苷酸的隨機結構域上不同)。圖3給出了來自“G5 Pre”DNA的這些不同序列的一個樣品。
利用鳥槍法克隆技術從G5群體中分離出個體;然后從這些亞克隆中取20個,測定完整的核苷酸序列(見圖3)。(參見Cadwell et al,PCR方法和應用,228-33,1992;Cadwell et al,PCR方法和應用,3(增補)S136-S140,1994)。在這20個序列中,有5個是獨一無二的,兩個只發生了兩次,1個發生了3次,以及1個發生了8次。在DNA的起始庫中已經隨機合成的50個核苷酸的區域中,所有這些單個的突變體都具有共同的序列單元。它們都含有兩個假定的模板結構域,一個與緊靠切割位點上游的一些核苷酸互補,另一個與下游的至少4個核苷酸互補。在這兩個假定的模板結構域之間有一個含1~11個核苷酸的可變結構域,接下來是固定序列5’-AGCG-3’,然后是含3~8個核苷酸的第二可變結構域,最后是固定序列5’-CG-3’或5’-CGA-3’。位于這兩個假定結構域之外的核苷酸在序列和長度兩個方面都是高度可變的。在所有被測序的克隆中,與50個初始-隨機核苷酸對應的區域仍然保持著50個核苷酸的總長度。
圖3給出的是從5輪選擇后得到的群體中分離的單個突變體的序列對比。頂部給出的是固定的底物結構域 (5’-GGGACGAATTCTAATACGACTCACTATrAGGAAGAGATGGCGAC-3’,或5’-GGGACGAATTCTAATACGACTCACTATNGGAAGAGATGGCGAC-3’,其中N代表腺苷核糖核苷酸)(SEQ ID NO 13)。其中帶有一個用倒三角形標出的目標核糖腺苷酸。用豎框框起來的部分是共同參與了推定的堿基配對相互作用的底物核苷酸。將與50個初始隨機核苷酸對應的序列與底物結構域進行反向平行比較。所有這些突變體3’末端都是一個固定序列5’-CGGTAAGCTTGGCAC-3’(SEQ ID NO 1)(“引物位點”;未顯示)。圖的左右兩邊指示出的是位于初始隨機區域中被推定與底物之間形成堿基對的核苷酸;每個顯示出的序列中被單獨框起來的部分是酶促DNA分子的推定堿基配對(或底物結合)結構域。兩個框型柱中顯示的是推定催化結構域中的高度保守核苷酸。
當預見到另外的資料會有助于構建催化結構域的一種有意義的二級結構模型時,我們注意到,如同錘頭核酶和發夾核酶一樣,我們的酶促DNA分子的催化結構域似乎也包含一個兩側各夾有一個底物結合區域的保守核心,這些底物結合區域與底物之間通過堿基對相互作用。與錘頭核酶和發夾核酶類似,催化活性DNAs似乎也需要一小段不配對的底物核苷酸——這種情況下是5’-CGA-3’——位于兩個參與堿基配對的區域之間。
另一個有趣的現象是,注意到這9個不同的突變體表現出的與底物間假定互補形式都各不相同。一些個體中,堿基對是連續的,而另一些中堿基對被一個或多個非互補對間斷。通常趨勢是,與切割位點上游核苷酸之間的相互作用比同下游核苷酸之間的相互作用比更緊密。關于結合的研究和定點誘變分析應該能使我們能夠更深入理解并進一步證實這種推測。
為了獲得對催化功能所需序列的進一步了解,對上述9個突變體中的6個進行自身切割活性測試,并在本發明公開的選擇條件下進化(見圖3)。不出所料,這20種亞克隆中的8個中出現的序列被證明是最有活性的,一級速度穩定在1.4min-1。在自身切割測試中,所有這些受測的突變體都顯示出活性,都產生了與切割目標RNA磷酸酯對應的單鏈5’端標記產物。
在不同的反應條件下,對優勢亞克隆做進一步分析。它的自身切割活性是Pb2+依賴性的,但是如果從反應混合物中省去Mg2+該活性不受影響。還需要一種單價陽離子,可以用Na+和K+來滿足。在0~1.0M(r=0.988)濃度范圍內,反應速度隨著單價陽離子濃度的增加呈線性增加。下面過程中將進一步評估其他可以影響反應的變化因素,例如pH、溫度以及其他二價金屬陽離子。
2.材料和方法A.寡核糖核苷酸和寡核糖核苷酸類似物合成的DNAs以及DNA類似物購自操縱子技術公司(OperonTechnology)。19個核苷酸的底物5’-pTCACTATrAGGAAGAGATGG-3’(或5’-pTCACTATNGGAAGAGATGG-3’,其中N代表腺苷核糖核苷酸)(SEQ ID NO7)是按照以前公開的方法(Breaker et al,Biochemistry,3311980-11986,1994),用5’-CCATCTCTTCCTATAGTGAGTCCGGCTGCA-3’作為模板,通過反轉錄酶催化5’-pTCACTATrA-3’(或5’-pTCACTATN-3’,其中N代表腺苷核糖核苷酸)(SEQ ID NO 8)的延伸獲得的。引物3,5’-GGGACGAATTCTAATACGACTCACTATrA-3’(或5’-GGGACGAATTCTAATACGACTCACTATN-3’,其中N代表腺苷核糖核苷酸)(SEQ ID NO 6)用[γ-32P]ATP和T4聚核苷酸激酶進行5’-端標記(引物3a)或者用[γ-S]ATP和T4聚核苷酸激酶進行5’末端硫代磷酰化,然后用N-碘乙酰基-N’-生物素酰己烯二胺(biotinylhexylenediamine)生物素化(引物3b)。
B.DNA庫的制備用下列合成引物通過PCR擴增制備DNA的起始庫5’-GTGCCAAGCTTACCG-N50-GTCGCCATCTCTTCC-3’(SEQ ID NO 4),其中N為G、A、T和C的等摩爾混合物。把含有隨機寡聚體500pM、引物1(5’-GTGCCAAGCTTACCG-3’,SEQ ID NO 10)1000pM、引物2(5’-CTGCAGAATTCTAATACGACTCACTATAGGAAGAGATGGCGAC-3’,SEQ ID NO 11)500pM、引物3b 500pM、[α-32P]ATP10 Ci以及Taq DNA聚合酶0.2Uμl-1的PCR反應物2ml加入到50mM KCl、1.5mM MgCl2、10mM Tris-HCl(23℃下pH8.3)、0.01%白明膠以及每種dNTP各0.2mM中,92℃溫育1min,50℃溫育1min,72℃溫育2min,然后在下列條件下進行5個循環的擴增92℃、1min,50℃、1min,72℃溫育1min。擴增得到的產物用酚抽提兩次,氯仿/異戊醇抽提一次,然后用乙醇沉淀分離DNA。
C.體外選擇將上述DNA的起始庫重懸在500μL的緩沖液A(1M NaCl和50mMHEPES(23℃下pH7.0))中,并反復通過鏈霉親和素柱(AffiniTip Strep20,Genosys,The Woodlands,TX)。用體積為100μL的緩沖液A洗滌5次,接著用體積為100μL的0.2N NaOH洗滌5次,然后用體積為100μL的緩沖液B(0.5M NaCl、0.5MKCl、50mM MgCl2和50mM HEPES(23℃下pH7.0))平衡5次。在1小時內,用加有1mM PbOAc的緩沖液B20μL洗脫被固定的單鏈DNA 3次。固定和洗脫的全過程均在23℃下完成。把洗脫成分收集在等體積的緩沖液C(50mM HEPES(23℃下pH7.0)和80mMEDTA)中,用乙醇沉淀DNA。
PCR擴增以上得到的DNA,100μL的反應混合物中含有20pM引物1、20pM引物2、Taq DNA聚合酶0.05Uμl-1、50mM KCl、1.5mM MgCl2、10mM Tris-HCl(23℃下pH8.3)、0.01%白明膠以及每種dNTP各0.2mM,在下列條件下擴增30個循環92℃、10sec,50℃、30sec,72℃、30sec。反應產物用酚抽提兩次,氯仿/異戊醇抽提一次,然后用乙醇沉淀回收DNA。取上面擴增的DNA約4pM加入到第二輪、巢式PCR的100μL反應物中,該反應物中含有引物1100pM、引物3b 100pM、[α-32P]ATP20μCi、Taq DNA聚合酶0.1Uμl-1,將總體積200μL反應混合物在下列條件下擴增10個循環92℃、1min,50℃、1min,72℃溫育1min。再一次抽提和沉淀PCR產物,將得到的DNA重懸于50μL的緩沖液A中,然后用其開始下一輪的選擇。
除了第3輪結束時巢式PCR的反應體積為100μL外,按照上述方法進行第2輪和第3輪的擴增。在第4輪中,加入Pb2+后將洗脫時間縮短到20min(2個20μL的洗脫體積),只將回收到的DNA的一半用于第一次PCR,第一次PCR只進行15個溫度循環。在第5輪的過程中,洗脫時間縮短到1min(2個20μL的洗脫體積),只將回收到的DNA的1/4用于第一次PCR,第一次PCR進行15個溫度循環。按照上述方法(Tsang etal,Biochemistry,335966-5973,1994),將第5輪選擇后得到的DNA進行亞克隆和測序。
D.催化活性DNAs的動力學分析在上述條件下,用5’-32P標記物在25μL的反應混合物中通過不對稱PCR制備DNA群體和各種亞克隆個體,該反應混合物中含有引物3a 10pmol、加入的DNA 0.5pM以及Taq DNA聚合酶0.1Uμl-1,在下列條件下擴增10個循環92℃、1min,50℃、1min,72℃溫育1min。將得到的[5’-32P]標記的擴增產物在10%聚丙烯酰胺/8M凝膠上電泳純化。
將DNA置于緩沖液B中溫育10min后,進行自身切割分析。通過加入終濃度為1mM的PbOAc來啟動反應,通過加入等體積的緩沖液C終止反應。用10%聚丙烯酰胺/8M凝膠電泳分離反應產物。多次-轉換情況的動力學分析在緩沖液B中進行,為了防止物質吸附到管壁上在該緩沖液中加入了50μg mL-1的BSA。將底物和酶分子分別置于不含Pb2+的緩沖液中預溫育5min,然后合并,加入終濃度為1mM的PbOAc啟動反應。
3.能夠完成分子間切割的脫氧核酶的進化A.轉變成分子間方式由于突變體的催化結構域和底物結構域之間推定的堿基配對相互作用是可變的,所以覺得將DNA催化的反應轉變成分子間方式應該是相當簡單的。在這種情況下,我們希望簡化催化劑的底物結合區域,以便使其中的每個都能與底物之間形成連續的7~8個堿基對。此外,我們希望提供一種最小的底物,將該底物限制到含兩個堿基配對區域和插入序列5’-GGA-3’(圖4A)。
圖4A和4B給出了一個分子間反應中RNA磷酸酯的DNA-催化切割,該反應以催化轉換開始。圖4A是19聚體底物和38聚體DNA酶之間形成的復合物的簡圖。底物中包括單個腺嘌呤核糖核苷酸(“rA”或“N”,緊靠箭頭),其兩側是脫氧核糖核苷酸。合成DNA酶是圖3中給出的最常發生的突變體的38核苷酸部分。位于推定催化結構域中的高度保守核苷酸被“框了起來”。如圖所示,一個保守區域是“AGCG”,而另一個保守區域是“CG”(按5’-3’的方向閱讀)。
圖4B給出的是用于測定下列反應的Km(負斜率)和Vmax(y軸截距)的Eadie-Hoftstee曲線在與體外選擇相同的條件下,DNA催化切割[5’-32P]標記的底物。測定反應的初始速度,該反應中包括5nM DNA以及0.125μM、0.5μM、1μM、2μM或4μM底物。
在設計催化結構域時,我們主要根據最有活性突變體的組成,在突變體的5’端截去2個核苷酸,3’端截去11個核苷酸。位于兩個模板區域之間的15個核苷酸保持不變,在3’端模板區域中插入一個核苷酸形成能與底物之間堿基配對的一連串核苷酸。將底物簡化成下列序列5’-TCACTATrA·GGAAGAGATGG-3’(或5’-TCACTATN·GGAAGAGATGG-3’,其中“N”代表腺苷核糖核苷酸)(SEQ ID NO 12),其中下劃線部分的核苷酸是參與同催化活性DNA分子堿基配對的兩個區域。
在簡化反應系統中,使用全部由脫氧核糖核苷酸組成的38聚體催化活性DNA分子(催化劑)和包括一個其余全部DNA序列中插入單個核糖核苷酸的19聚體底物,這種簡化的反應系統可以使高效的DNA-催化磷酸酯切割能迅速轉換,該反應系統。在0.01μM催化劑和1μM底物存在的條件下溫育90分鐘后,46%的底物被切割,與催化劑的46次轉換相對應。對該反應進行預先的動力學分析,在多次轉換的條件下評估。DNA催化劑表現出Michaelis-Menten動力學特性,kcat和Km值分別為1min~1和2μM(見圖4B)。Km值明顯地大于基于watson-crick相互作用而預想的催化劑和底物之間的解離常數。在同樣的反應條件下溫育底物(但不含催化劑);得到的kuncat值為4×10-6min-1。這與在0.5mM Pb2+、pH7.0、37℃條件下水解更不穩定的1-硝基苯酚-1,2-丙二醇的報道數值5×10-3min-1(Breslow et al,Proc.Natl.Acad.Sci.USA,884080-4083,1991)一致。
現在,可以進行下述假定核糖核苷2’-羥基攻擊鄰近磷酸,通過這種水解機制啟動磷酸酯切割反應,產生帶有2‘(3’)-環磷酸末端的5’端產物以及末端為5’-羥基的3’端產物。支持這個機制的是,3’切割產物可以用T4寡聚核苷激酶和[γ-32P]ATP有效地磷酸化,這一點和自由的5’-羥基的可獲得法相一致。
B.討論5輪體外選擇后,得到能夠催化目標RNA磷酸酯的高效Pb2+依賴性切割反應的單鏈DNA分子的群體。根據這種群體中分離到的代表性個體的共同特征,構建了催化劑以及底物的簡化型式,生成了分子間快速催化轉換的一種示范。因此,上述38聚體催化結構域提供了DNA酶或者被稱為“脫氧核酶”的一個實例。
一種信息大分子,它能夠促進以快速轉換起始并遵從Michaelis-Menten動力學的反應中的化學轉化,基于這種事實可以把這種分子稱為酶,但這可能不能滿足每個人關于什么是酶的見解。有人可能根據定義堅持酶必須是一種多肽。但是,如果接受RNA酶這個概念,然后接受類似的關于DNA酶的觀點似乎就是順理成章的。如果考慮我們能以多快的速度地從隨機序列DNAs庫中生產出這種分子,我們預料在不遠的將來會有許多其他的合成DNA分子的實例出現。
RNA磷酸酯的Pb2+依賴性切割簡化了配合的Pb2+-羥基的確切定位的要求,從而促進與切割位點鄰接的2’羥基的去質子化,由于RNA磷酸酯的Pb2+依賴性切割是這樣一種簡單的反應,所以選擇它作為研究DNA催化的初始目標。(見Pan et al,in The RNA World,Gesteland & Atkins(eds.),pp.271-302,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,NY(1993)。)眾所周知,Pb2+配合于嘌呤的N7位、鳥嘌呤的O6位、尿嘧啶的O4位和胞嘧啶的N3位(Brown et al,Nature,303543~546,1993)。因此,與RNA在糖組成和構象兩方面的差異看來并不可能阻止DNA形成定義明確的Pb2+-結合口袋。
選擇在其余全部DNA序列中含有單個核糖核苷酸的底物是由于它提供了一個用于切割的獨一無二的優勢位點,并且確保任何一種得到的催化活性都歸DNA所獨有。底物識別好象是依靠兩個催化劑與底物之間堿基配對的區域。然而,位于這兩個區域之間的未配對核苷酸5’-GGA-3’可能在底物識別、金屬離子的配合或者催化功能的其他方面發揮重要的作用。
進一步還預料到了,所有的RNA分子、其他的RNA-DNA復合體以及含一個或多個核苷酸類似物的分子都可能是可接受的底物。如此處公開的那樣,本發明描述的體外進化方法可以成功地用于生產具有期望特性的酶促DNA分子;現在正沿著這些線索進行進一步的分析。
此外,使用本發明描述的方法,測定酶與底物之間的堿基配對相互作用的產生是否與序列有關的研究也在進行當中。此處公開的Pb2+依賴性的脫氧核酶也可能是研究DNA的結構以及酶促活性時值得考慮的模型化合物。
本發明中用于快速生產DNA催化劑的方法有著相當的普遍性,這使得我們能夠使用其他輔因子觸發與潛在催化結構域相連的目標鍵的切割。在這一點上,發展能夠在生理條件下特異性地切割目標RNAs的Mg2+依賴性DNA酶是有意義的,發展能夠在其他陽離子存在的條件下發揮功能的DNA酶也同樣如此(見實施例4)。這些分子將為傳統上特異性滅活目標RNAs的反義方法和核酶方法提供替代方法。
因此,DNA可以與RNA及蛋白質一起加入到能夠展現出酶促活性的生物大分子的行列中。DNA的催化能力的全部范圍還有待探索,但是根據體外選擇方法,例如本研究中使用的方法將會迅速地啟動這些探索。
與其他大分子催化劑相比,DNA酶可以提供幾種重要的特性。首先,它們易于制備,當今許多實驗室都配備了自動DNA合成儀而且DNA亞磷酰胺的成本也很低。其次,與RNA相比,它們是很穩定的化合物,因此會加速它們在生物研究中的應用。第三,我們預料它們能夠適合當前使用不具有切割RNA活性的反義DNAs的治療領域。用DNA類似物也可以進行體外篩選,這些類似物包括具有核酸酶抗性的化合物,例如含有硫代磷酸酯的DNA,只要這些類似物能夠被制備成脫氧核糖核苷5’-三磷酸,并且可以作為DNA依賴性DNA聚合酶的底物。最后,DNA酶為我們理解大分子催化功能的基礎提供了一個新的窗口。例如,對催化同一化學轉化的以蛋白質為基礎的酶、以RNA為基礎的酶以及以DNA為基礎的酶進行比較分析是有意義的。
4.催化活性DNAs其他家族除了DNA的起始庫由包括40個隨機核苷酸的分子組成以外,基本上按照上面實施例2.B.中描述的方法通過PCR制備DNA起始庫。因此,此處描述的DNA起始庫是利用下列合成寡聚體通過PCR制備而成5’-GGG ACG AAT TCT AAT ACG ACT CAC TAT rA GG AAG AGA TGG CGA CATCTC N40GT GAC GGT AAG CTT GGC AC-3’(SEQ ID NO 23),其中N是G、A、T、C的等摩爾混合物,選擇能夠沿著目標rA切割磷酸酯的DNA分子。(見圖6A)。
分別在Pb2+、Zn2+、Mn2+或Mg2+四者之一存在的條件下進行選擇擴增,因此生產出了至少4個家族的催化活性DNA分子。正如圖5中給出的那樣,在不同的陽離子存在的條件下產生的催化活性DNA分子表現出了特異性的活性。
圖5給出的是表現選擇的催化活性DNAs的4個家族的特異性內切核糖核酸酶活性的聚丙烯酰胺凝膠照片。Pb2+依賴性家族分子的選擇以并排的方式重復出現作為對照。在每組的3個泳道中,第1泳道顯示的是在不含金屬陽離子條件下選擇的無活性群體,第2泳道顯示的是金屬陽離子存在條件下觀察到的活性,第3泳道顯示的無活性的起始庫(GO)。現在,觀察到的反應活性順序是Pb2+>Zn2+>Mn2+>Mg2+,反映了相應金屬氫氧化物的pKa。
在預先選擇的二價離子存在的情況下進行5輪(G5)或6輪(G6)選擇性擴增,就可獲得期望的內切核酸酶活性。對Mg2+存在的情況下進行的選擇性擴增的如下描述是用來例舉的。
除用1mM Mg2+代替1mM Pb2+作為二價金屬陽離子外,按照上述實施例2中描述的方法進行6輪體外選擇性擴增。(參見Breaker et al,Chem. & Biol.,1223-229,1994),在此引入作為參考,這些文獻基本上描述的是同一種方法。)6輪以后分離單個克隆,并從這些克隆中取出24個測定核苷酸序列。所有這些序列均以下列序列起始5’-GGG ACG AAT TCT AAT ACG ACTCAC TAT rA GG AAG AGA TGG CGA CA(SEQ ID NO 23的1~44位),以下列序列終止CGG TAA GCT TGG CAC 3’(SEQ ID NO 23的93~107位)。
起始庫中的TCTC N40GTGA(SEQ ID NO 23的45~92位)的中間節段具有下列變化形式(13) CCG CCC ACC TCT TTT ACG AGC CTG TAC GAA ATA GTGCTC TTG TTA GTA T(SEQ ID NO 24)(5) TCT CTT CAG CGA TGC ACG CTT GTT TTA ATG TTG CACCCA TGT TAG TGA(SEQ ID NO 25)(2) TCT CAT CAG CGA TTG AAC CAC TTG GTG GAC AGA CCCATG TTA GTG A(SEQ ID NO 26)(1) CCG CCC ACC TCT TTT ACG AGC CTG TAC GAA ATA GTGTTC TTG TTA GTA T(SEQ ID NO 27)(1) CCG CCC ACC TCT TTT ACG AGC CTG TAC GAA ATA GTGCTC TCG TTA GTA T(SEQ ID NO 28)(1) TCT CAG ACT TAG TCC ATC ACA CTC TGT GCA TAT GCCTGC TTG ATG TGA(SEQ ID NO 29)(1) -CT CTC ATC TGC TAG CAC GCT CGA ATA GTG TCA GTCGAT GTG A(SEQ ID NO 30).
括號中的數目表示具有特定序列的克隆的數目。注意到一些突變(粗體字高亮顯示)發生在初始隨機之外的位置上。
24個克隆中有5個具有上面列出的第二個序列(即SEQ ID NO 25),選擇該序列作為領導(即主要)化合物用于進一步的研究。在pH7.0、23℃以及含有濃度為1mM的下列各種二價金屬離子和1M NaCl的條件下,測量切割活性金屬離子 kobs不含 未做Mg2+2.3×10-3Mn2+6.8×10-3Zn2+4.2×10-2Pb2+1.1×10-2因此,雖然該領導化合物是在Mg2+存在的條件下篩選得到的,但是在所有4種二價全屬離子存在的條件下該領導化合物也具有活性。相反,Mn2+、Zn2+或Pb2+存在條件下篩選出的DNA分子在Mg2+存在條件下卻不表現出任何活性。
此外,在制備全部含硫代磷酸酯DNA類似物時候,Mg2+存在條件下6輪體外選擇得到的DNAs群體表現出Mg2+依賴性的切割活性,觀察到的速度為~10-3min-1。含硫代磷酸酯類似物是酶促制備而成的,所以在每個立體核心(stereocenter)都有Rρ構型。與未經修飾的DNA相比,這種化合物對細胞核酸酶具有一定的抗性。
該領導化合物在40個核苷酸位置(下劃線部分)上是重隨機(re-randomized)的,導入了機率為15%的突變(這3個可能的堿基取代中的每個都是5%。)。對該重隨機群體進行另外7輪體外選擇。在后4輪中,從群體中移去Pb2+存在條件下表現活性的分子以后,讓其余部分接受1mMMg2+存在條件下的反應。在第7輪以后分離單個克隆,并取出這些克隆中的14個測定核苷酸序列。所有這些序列均以下列序列起始5’-GGGACG AAT TCT AAT ACG ACT CAC TAT rA GG AAG AGA TGG CGA CAT CTC(SEQ ID NO 23的1~48位),以下列序列終止GTG ACG GTA AGC TTGGCA C3’(SEQ ID NO 23的89~107位)。
與40部分隨機位置(N40,SEQ ID NO 23的49~88位)對應的中間節段可以下列方式變化(4) TAC AGC GAT TCA CCC TTG TTT AAG GGT TAC ACC CATGTT A(SEQ ID NO 31)(2) ATC AGC GAT TAA CGC TTG TTT CAA TGT TAC ACC CATGTT A(SEQ ID NO 32)(2) TTC AGC GAT TAA CGC TTA TTT TAG CGT TAC ACC CATGTT A(SEQ ID NO 33)(1) ATC AGC GAT TCA CCC TTG TTT TAA GGT TGC ACC CATGTT A(SEQ ID NO 34)(1) ATC AGC GAT TCA CCC TTG TTT AAG CGT TAC ACC CATGTT G(SEQ ID NO 35)(1) ATC AGC GAT TCA CCC TTG TTT TAA GGT TAC ACC CATGTT A(SEQ ID NO 36)(1) ATC AGC GAT TAA CGC TTA TTT TAG CGT TAC ACC CATGTT A(SEQ ID NO 37)(1) ATC AGC GAT TAA CGC TTG TTT TAG TGT TGC ACC CATGTT A(SEQ ID NO 38)(1) ATC AGC GAT TAA CGC TTA TTT TAG CAT TAC ACC CATGTT A(SEQ ID NO 39).
括號中的數目表示具有那種具體序列的克隆的數目。粗體顯示的是那些與領導化合物相比不同的核苷酸。
這些克隆的切割活性的正式分析正在進行。該群體整體上表現出了Mg2+依賴性的切割活性,觀察到的速度為~10-2min-1,與Pb2+存在條件下表現出活性的活性相當。
圖6A和6B分別提供的是一個“原始”催化活性DNA分子和用本發明公開的選擇擴增方法得到的幾個催化活性DNA分子中的一個的二級結構的圖象。圖6A給出的是來自起始庫的示范分子,該分子表現出了SEQ IDNO 23代表的分子的總體構象。如圖所示,各種互補核苷酸位于隨機區域(N40)的旁側。
圖6B圖中顯示的是一個通過此處公開的方法產生的Mg2+依賴性催化活性DNA分子(或“DNAzymes”)。箭頭指示出的是底物核酸中核糖核苷酸的位置。(所顯示的分子包括此處定名為SEQ ID NO 25的序列,以及SEQ ID NO 23的“起始”序列和“終止”序列。)如此處公開的那樣,上述通過體外選擇得到的“家族”的每個成員中的內切核酸酶活性持續增強,所以可以預料用此處公開的原則可以成功地生產出期望特異性逐漸增強的酶促DNA分子。
5.較大的RNA序列的切割作為上述研究的延續,我們已經發展了能夠切割全部由RNA組成的底物的DNA酶,而不是如上所述的在其余全部DNA中插入單個核糖核苷酸的底物。(參見Breaker et al,Chem. & Biol.,1223-229,1994);Breaker et al,Chem. & Biol.,2655-660,1994)。作為目標序列,我們選擇HIV-1 RNA的U5長末端重復序列(LTR)中的共12個高度保守的核苷酸,其序列為5’GUAACUAGAGAU 3’(SEQ ID NO 49)。
根據上述實施例中描述的方法,我們生成了一個1014個具有下列組成的DNA分子的庫5’-GGAAAA r(GUAACUAGAGAU)GGAAGAGATGGCGAC N50CGGTAAGCTTGGCAC-3’(SEQ ID NO 50),此處N是脫氧核糖核苷酸G、A、T和C的等摩爾混合物,鑒定為“r(GUAACUAGAGAU)”的序列由脫氧核糖核苷酸組成。(任選地,可以改變序列起始5’端核苷酸,例如,通過在5’末端核糖核苷酸部分之前的序列中加入1個另外的dA殘基,因此生成了閱讀為“GGAAAAA”的起始序列,并生成了長度為99個殘基的SEQ ID NO 50。顯然,如此處詳細描述的那樣,這僅僅是為了構建特異性的酶促DNA分子而可能做的修飾中的一個實例。)通過以100pmol的5’-GTGCCAAGCTTACCG-N50-GTCGCCATCTCTTCC-3’(N=G、A、T或C)為模板對5’-生物素-d(GGAAAAA)r(GUAACUAGAGAU)d(GGAAGAGATGGCGAC)-3’進行模板-指導延伸來生產起始庫,50μL的反應混合物中包含Superscript II反轉錄酶(RT;Gibco BRL)10Uμl-1、3mM MgCl2、75mM KCl、50mM Tris*HCl(pH8.3)以及每種dNTP各0.2mM。向反應混合物中加入微量的[5’-32P]標記的引物使得延伸效率能得到監察。合并除RT之外的所有成分,在65℃溫育5min,然后在10min中內冷卻到45℃。加入RT,然后將混合物在45℃溫育45min,然后加入Na2EDTA終止反應。加入終濃度為1M的NaCl,通過讓延伸產物重復通過4個鏈霉親和素親和柱(Genosys)而使其固定。
用體積為100μL的洗滌緩沖液(1M NaCl、50mM Tris*HCl(pH7.5)、0.1mM Na2EDTA)洗滌柱5次,接著用體積為100μL的0.1N NaOH洗滌5次,然后用體積為100μL的洗滌緩沖液在37℃下洗滌5次,然后在37℃下1小時內用20μL等量反應緩沖液(10mM MgCl2、1MNaCl、50mM Tris*HCl(pH7.5))洗脫3次。回收洗脫下來的分子,并使用引物5’-生物素-GGAAGAGATGGCGAC-3’和5’-GTGCCAAGCTTACCG-3’進行PCR擴增。按照上述方法,將PCR產物固定在鏈霉親和素親和柱上,用體積為100μL的洗滌緩沖液洗滌5次,用體積為40μL的0.1N NaOH洗脫得到未生物素化的鏈。乙醇沉淀分離到的DNAs,并將其用做引物延伸反應中的模板開始下一輪選擇。除了延伸反應規模減小了5倍和PCR規模減小了2倍外,第2~10輪按照上述方法進行。
根據切割位于插入的RNA目標序列中的磷酸酯的能力,對因此而產生的酶促DNA分子進行篩選。基于酶促DNA分子在10mM MgCl2、pH7.5和37℃的條件下的活性,進行10輪體外選擇擴增。在選擇過程中,競選其中“優選的”切割位點以及在所有這些優選位點都能進行切割的“最佳”催化劑。兩個位點和兩個催化劑家族表現出最有效的切割能力(見圖7)。
圖7給出的是基本上按照此處描述的方法進行10輪體外選擇擴增得到的結果中的一部分。如圖所示,兩個位點和兩個催化劑家族表現出對目標序列的最有效的切割。切割條件基本上同圖7中的顯示,就是,10mM Mg2+、pH7.5和37℃;圖中顯示的是反應進行2小時后收集的數據。相對于代次數目(此處為0~10)繪制出切割率(%)。垂直柱表示的是能夠在指定位點切割底物中目標序列的催化活性DNA分子的數目/普遍性,其中條紋柱顯示的是在G↓UAACUAGAGAU處的切割,空白(無陰影)柱顯示的是在GUAACUA↓GAGAU處的切割。與此處一致,圖7中,箭頭指示的是兩個相鄰核苷酸之間發生切割的位點。
對來自第8輪和第10輪選擇擴增得到的群體的各種個體進行了克隆。然后,對來自第8輪的29個個體和來自第10輪的32個個體測定核苷酸序列(分別見表2和3)。
表2和表3中,標題“核苷酸序列”下方給出的是所有鑒定的克隆中與起始庫中隨機的50個核苷酸(即N50)相對應的部分;因此,通常,一個給定克隆的全長核苷酸序列包括“N50”節段之前,之后的序列以及包括該節段的序列,如果和底物連接在一起,就沒有發生自身切割。例如,(非自身切割)克隆的全序列通常可能包括SEQ ID NO 50的第1~33位殘基,接著是代表隨機N50區域的殘基,再接著是SEQ ID NO 50的第84~98位殘基,或者SEQ ID NO 51的第1~34位殘基,接著是代表隨機N50區域的殘基,再接著是SEQ ID NO 51的第85~99位殘基。然而,可以相信的是,每個克隆的N50(或N40)區域——或其一部分——在確定特定酶促DNA分子的特異性和/或活性中都是特別重要的。在底物與DNAzyme各自為獨立分子的反應中,這一點尤其明顯(見,例如,圖8和圖9)。
第8輪或第10輪后得到的個體分別被定名為8-x或10-x。SEQ ID NOS也被列出,與每個克隆的“N50”區域對應。
表2來自第8輪擴增的克隆個體克隆編號 SEQ ID NO “N50”核苷酸序列(5’-3’)8-2 52 CCA ATA GTG CTA CTG TGT ATC TCA ATG CTGGAA ACA CGG GTT ATC TCC CG8-4 53 CCA AAA CAG TGG AGC ATT ATA TCT ACT CCACAA AGA CCA CTT TTC TCC CG8-5154 ATC CGT ACT AGC ATG CAG ACA GTC TGT CTGCTT TTT CAT TAC TCA CTC CC8-14 55 CAA TTC ATG ATG ACC AAC TCT GTC AAC ACGCGA ACT TTT AAC ACT 6GC A8-17256 CTT CCA CCT TCC GAG CCG GAC GAA GTT ACTTTT TAT CAC ACT ACG TAT TG8-3 57 GGC AAG AGA TGG CAT ATA TTC AGG TAA CTGTGG AGA TAC CCT GTC TGC CA8-6 58 CTA GAC CAT TCA CGT TTA CCA AGC TAT GGTAAG AAC TAG AAT CAC GCG TA8-8 59 CGT ACA CGT GGA AAA GCT ATA AGT CAA GTTCTC ATC ATG TAC CTG ACC GC8-10 60 CAG TGA TAC ATG AGT GCA CCG CTA CGA CTAAGT CTG TAA CTT ATT CTA CC8-22 61 ACC GAA TTA AAC TAC CGA ATA GTG TGG TTTCTA TGC TTC TTC TTC CCT GA8-11 62 CAG GTA GAT ATA ATG CGT CAC CGT GCT TACACT CGT TTT ATT AGT ATG TC8-21 63 CCC TAC AAC ACC ACT GGG CCC AAT TAG ATTAAC GCT ATT TTA TAA CTC G8-12 64 CCA AAC GGT TAT AAG ACT GAA AAC TCA ATC
AAT AGC CCA ATC CTC GCC C8-13 65 CAC ATG TAT ACC TAA GAA ATT GGT CCC GTAGAC GTC ACA GAC TTA CGC CA8-23 66 CAC AAC GAA AAC AAT CTT CCT TGG CAT ACTGGG GAG AAA GTC TGT TGT CC8-40 67 CAC ACG AAC ATG TCC ATT AAA TGG CAT TCCGTT TTT CGT TCT ACA TAT GC8-24 68 CAG AAC GAG GGT CTT GTA AGA CTA CAC CTCCTC AGT GAC AAT AAT CCT G8-26 69 CAC TAC AGC CTG ATA TAT ATG AAG AAC AGGCAA CAA GCT TAT GCA CTG G8-27 70 GGG TAC ATT TAT GAT TCT CTT ATA AAG AGAATA TCG TAC TCT TTT CCC CA8-28 71 CCA AAG TAC ATT CCA ACC CCT TAT ACG TGAAAC TTC CAG TAG TTT CCT A8-29 72 CTT GAA GAT CCT CAT AAG ACG ATT AAA CAATCC ACT GGA TAT AAT CCG GA8-34 73 CGA ATA GTG TCC ATG ATT ACA CCA ATA ACTGCC TGC CTA TCA TGT TTA TG8-35 74 CCA AGA GAG TAT CGG ATA CAC TTG GAA CATAGC TAA CTC GAA CTG TAC CA8-36 75 CCA CTG ATA AAT AGG TAA CTG TCT CAT ATCTGC CAA TCA TAT GCC GTA8-37 76 CCC AAA TTA TAA ACA ATT TAA CAC AAG CAAAAG GAG GTT CAT TGC TCC GC8-39 77 CAA TAA ACT GGT GCT AAA CCT AAT ACC TTGTAT CCA AGT TAT CCT CCC CC1與10-4、10-40相同2與8-20、8-32、8-38、10-1、10-34相同;10-11的1個突變;10-29的3個突變表3來自第8輪擴增的克隆個體克隆編號 SEQ ID NO “N50”核苷酸序列(5’-3’)10-3378 CCG AAT GAC ATC CGT AGT GGA ACC TTG CTTTTG ACA CTA AGA AGC TAC AC10-10 79 CCA TAA CAA ATA CCA TAG TAA AGA TCT GCATTA TAT TAT ATC GGT CCA CC10-12 80 CAG AAC AAA GAT CAG TAG CTA AAC ATA TGGTAC AAA CAT ACC ATC TCG CA10-14 81 CCT TTA GTT AGG CTA GCT ACA ACG ATT TTTCCC TGC TTG GCA ACG ACA C10-15 82 CTC CCT ACG TTA CAC CAG CGG TAC GAA TTTTCC ACG AGA GGT AAT CCG CA10-19 83 CGG CAC CTC TAG TTA GAC ACT CCG GAA TTTTTC CCC10-39 84 CGG CAC CTC TAG TTA GAC ACT CCG GAA TTTTAG CCT ACC ATA GTC CGG T10-23 85 CCC TTT GGT TAG GCT AGC TAC AAC GAT TTTTCC CTG CTT GAA TTG TA10-27486 CCC TTT GGT TAG GCT AGC TAC AAC GAT TTTTCC CTG CTT GAC CTG TTA CGA10-31 87 CCT TTA GTT AGG CTA GCT ACA ACG ATT TTTCCC TGC TTG GAA CGA CAC10-18 88 CAT GGC TTA ATC ATC CTC AAT AGA AGA CTACAA GTC GAA TAT GTC CCC CC10-20 89 CAA CAG AGC GAG TAT CAC CCC CTG TCA ATAGTC GTA TGA AAC ATT GGG CC10-6 90 TAC CGA CAA GGG GAA TTA AAA GCT AGC TGGTTA TGC AAC CCT TTT CGC A10-7 91 CTC GAA ACA GTG ATA TTC TGA ACA AAC GGGTAC TAC GTG TTC AGC CCC C10-8 92 CCA ATA ACG TAA CCC GGT TAG ATA AGC ACTTAG CTA AGA TGT TTA TCC TG10-16 93 CAA TAC AAT CGG TAC GAA TCC AGA AAC ATAACG TTG TTT CAG AAT GGT CC10-21 94 GCA ACA ACA AGA ACC AAG TTA CAT ACA CGTTCA TCT ATA CTG AAC CCC CA10-24 95 CCT TTG AGT TCC TAA ATG CCG CAC GGT AAGCTT GGC ACA CTT TGA CTG TA10-28 96 CAA AGA TCT CAC TTT GGA AAT GCG AAA TATGTA TAT TCG CCC TGT CTG C10-33 97 CCA CGT AGA ATT ATC TGA TTT ATA ACA TAACGC AGG ATA ACT CTC GCC CA10-35 98 CAC AAG AAA GTG TCG TCT CCA GAT ATT TGAGTA CAA GAA ACT ACG CCC10-36 99 CAT GAA GAA ATA GGA CAT TCT ACA GGC TGGACC GTT ACT ATG CCT GTA GG10-37 100 CAT AGG ATA ATC ATG GCG ATG CTT ATG ACGTGT ACA TCT ATA CCT T10-38 101 CAG ATG ATC TTC CTT TAA AGA CTA CCC TTTAAA GAA ACA TAA GGT ACC CC310-5的1個突變410-30的1個突變隨后測量了各種克隆的自身切割活性。發現克隆8-5、8-17和10-3在5’GUAACU↓AGAGAU 3’位點能有效地切割,而克隆10-14、10-19和10-27在5’G↓UAACUAGAGAU 3’位點能有效地切割。當將分子的RNA部分延伸成序列5’GGAAAAAGUAACUAGAGAUGGAAG 3’(SEQ ID NO 51的第1~24位殘基)時,克隆8-17、10-14和10-27保留了全部活性,而克隆8-5、10-3和10-19表現出的活性減弱。隨后,發現克隆10-23在涉及延伸后的RNA結構域的自身切割反應中表現出高水平的活性。
還應該提到的是,如果相關領域的技術人員的興趣有所不同,為了生產出有特定特異性的酶促DNA分子,可以對根據本發明公開的方法構建的聚核苷酸分子中“N50”節段之前的序列或之后的序列,即“N50”區域旁側的底物結合區域采取多種形式的變化,例如改變長度、核苷酸序列、核酸類型等等。例如,盡管此處將SEQ ID NO 51的第1~24位殘基描述為RNA核苷酸,替代地它們可以包括DNA、RNA或其組合。(因此,例如,可以容易地將SEQ ID NO 51改變成第1~7位核酸殘基包括DNA,第8~19為殘基包括RNA,第20~99位殘基包括DNA,等等。)類似地,“N50”區域之前的核苷酸可以包括RNA、DNA或其組合。如此處公開的那樣,“N50”(或“N40”——見實施例4)之前或之后區域的長度也可以改變。而且,N50或N40區域之前的或之后的序列可以被截短、延長或整個缺失。
而且,如上所述,在實施例描述的方法中我們選用HIV RNA的特定區域作為目標序列;這種序列不是可以選做目標的唯一序列。顯然,相關領域的技術人員可以根據我們的教導構建和設計出對于其他目標序列具有特異性的酶促DNA分子。如此處公開的那樣,如SEQ ID NO 50和51顯示的那樣,這樣的目標序列可以被構建成或插入到含有DNA、RNA或其組合的較大序列中。
通過把酶和底物區域分離到單獨的分子中,可以容易地將自身切割反應轉變成分子間切割反應。選擇克隆8-17和10-23作為原型分子。在以多次轉換起始的反應中,二者均表現出能夠作為DNA酶切割單獨的全部-RNA底物(圖8)。隨后,將劃分出切割位點的未配對核苷酸每一側的底物結合臂縮短到7個堿基對(圖9)。
圖8給出的是本發明的兩個催化活性DNA分子——克隆8-17和10-23的核苷酸序列、切割位點以及轉換速度。反應條件如圖所示,也就是,10mM Mg2+、pH7.5和37℃。左邊是鑒定為克隆8-17的DNAzyme,箭頭指示的是RNA底物的切割位點。底物序列(5’-GGAAAAAGUAACUAGAGAUGGAAG-3’)——與DNAzyme分離(即給出的是分子間切割)——如圖標記。類似地,右邊顯示的是此處鑒定為克隆10-23的DNAzyme,箭頭指示的是RNA底物的切割位點。再次列出底物序列。酶8-17的轉換速度為約0.6hr-1;酶10-23的轉換速度為約1hr-1。
如圖8中所示,能切割單個底物分子的克隆8-17催化活性DNA分子的核苷酸序列如下列所示5’-CTTCCACCTTCCGAGCCGGACGAAGTTACTTTTT-3’(SEQ ID NO 56的1~34位殘基)。在同一圖中,能切割單個底物分子的克隆10-23催化活性DNA分子的核苷酸序列如下列所示5’-CTTTGGTTAGGCTAGCTACAACGATTTTTCC-3’(SEQ ID NO 85的3~33位殘基)。
圖9進一步給出了本發明的兩個催化活性DNA分子——克隆8-17和10-23的核苷酸序列、切割位點和轉換速度。反應條件如圖所示,也就是,10mM Mg2+、pH7.5和37℃。與圖8中相同,左邊給出的是鑒定為克隆8-17的DNAzyme,箭頭指示的是RNA底物的切割位點。底物序列(5’-GGAAAAAGUAACUAGAGAUGGAAG-3’)——與DNAzyme分離(即給出的是分子間切割)——如圖標記。類似地,右邊顯示的是此處鑒定為克隆10-23的DNAzyme,箭頭指示的是RNA底物的切割位點。再次給出了底物序列。酶8-17的Kobs值為約0.002min-1;酶10-23的Kobs值為約0.01min-1。
如圖9所示,能切割單個底物分子的克隆8-17催化活性DNA分子的核苷酸序列如下列所示5’-CCACCTTCCGAGCCGGACGAAGTTACT-3’(SEQID NO 56的4~30位殘基)。在同一圖中,能切割單個底物分子的克隆10-23催化活性DNA分子的核苷酸序列如下列所示5’-CTAGTTAGGCTAGCTACAACGATTTTTCC-3’(SEQ ID NO 85的5~33位殘基,在5’末端用“CTA”取代了“TTG”)。
切割RNA的DNA酶的催化速度還沒有被完全優化。如上述公開的以及以前研究中報道的那樣,通過對原型分子進行部分隨機化以及進行附加輪的選擇擴增,我們已經能夠提高催化速度。但是,我們發現在pH7.5和37℃的條件下,8-17和10-23這兩種DNA分子在Mg2+存在時的Km值分別為約5mM和2mM;這確實與分子內切割的情況一致。
6.通用底物酶的制備上述內容表明,本發明的酶能夠催化切割含有預先選定序列的目標核酸。而且,給出了的酶能夠切割純粹為DNA的核酸,或在脫氧核糖核苷酸(即DNA)序列中插入了核糖核苷酸(即RNA組分)的核酸,或純粹為RNA的核酸。另外,底物可以更換,而制備出來的酶可以切割此底物。
根據本發明,提供了一種能夠在生理條件下以高效和特異的動力學方式切割任一目標底物的酶,即包含一段預先選定的長約10~30個核苷酸的核苷酸序列的任一底物。這種酶易于制備且成本低廉,可以用于目標RNA的滅活,具體為信使RNA(mRNA)的滅活,也可以用于探測結構RNA以及用于重組RNA的處理,例如作為序列特異性的內切核糖核酸酶。
就滅活RNAs而言,該酶可以具體地用于目標細胞RNAs的滅活,例如“反義”寡脫氧核糖核苷酸能夠用于阻斷mRNA功能。但是,由于本發明的酶提供了識別和催化兩種功能,所以本發明的酶優于反義反應物,能夠進行催化轉換,而反義分子僅僅提供了等摩爾方式的識別(即非催化方式),而且還必須依靠其他細胞酶來進行RNA滅活反應。
下面部分描述了在上述“10-23”和“8-17”基序的基礎上改進了的酶的制備。這些改進了的酶是通用型的酶,能夠切割任一預先選定的目標序列,正如此處進一步描述的那樣,這種目標特異性只依賴于該酶的底物結合區域序列。
按照上述實施例5中描述的方法,在連續數輪的選擇擴增過程中,對定名為“10-23”和“8-17”的兩個基序進行鑒定,再塑造使其成為分子問切割反應,并且表現出在這種方式下的高效運行。
用如圖9中所示的產生對單個底物分子位點特異性催化切割的反應(即分子間切割)在下列類似生理條件下進行進一步的研究2mMMgCl2、150mM KCl、pH7.5和37℃,速度為約kcat=O.01min-1。
沿著底物的一個未配對的嘌呤核苷酸發生了切割,該核苷酸的旁側是與酶互補的寡核苷酸。5’端和3’端切割產物分別帶有一個2’(3’)環磷酸和5’羥基,表示著涉及攻擊鄰近磷酸上的2 羥基的反應機制。對于8-17和10-23這兩個基序酶而言,只要酶的底物結合臂以互補的方式改變,就能做到改變底物序列而不喪失催化活性。酶8-17對于位于緊靠切割位點的下游處的rG-dt“擺動”配對有著特異性地需求。在這個位置上用Waston-Crick堿基對取代時催化活性消失。酶10-23的底物結合臂與底物之間完全是通過Waston-Crick配對而相互作用的。基序酶8-17和10-23的催化核心位于兩個底物結合臂之間,分別含有13和15個脫氧核苷酸。
為了更精確地定義催化核心的序列要求,每種基序都構建了一個1014個突變體的文庫,在整個核心中的每個核苷酸位置上都導入了機率為25%的突變。每個文庫都用6種不同的體外選擇方法進行處理,包括共52輪的選擇性擴增。為了對與這兩種原型分子有關的序列進行一次徹底的測試,對篩選方法和嚴緊性都進行了改變。對來自所選擇群體的個體進行了克隆,測序,并測定了催化活性。該方法具體操作如下。
在酶8-17和10-23基礎上的重選擇包括對每種基序的6個不同的系統。每個系統需要5~21輪體外篩選,在篩選操作和反應時間上相同。所有切割反應均在下列條件下進行2mM MgCl2、150M NaCl、50mMTris*HCl(pH7.5),37℃。反應時間從早期輪次的60min變化到晚期輪次的1min。模板的每個起始庫都建立在與原型互補序列的基礎之上,該原型分子帶有每個都是7個核苷酸的固定的結合臂和一個每個核苷酸位置上都有機率為25%的隨機性的催化核心。對于基序8-17和10-23而言,模板分別具有以下序列5’-gtgccaagcttaccgagtaactTCG-TCCGGCTCGGRagatgggtcgtctgtccttccATCTCTAGTTACTTTTTC-3’和5’-gttgccaagcttaccg-ggaaaaaTCGTTGTAGCTAGCCtaactaggtcgtctgtccttccATCTCTAGTTACTTTTTC-3’(PCR引物位點用小寫字母表示;下劃線部分是底物結合臂;斜體部分是隨機位置)。該模板引導的延伸中使用的引物的序列如下5’-生物素-r(GGAAAAA-GUAACUAGAGAUGG)d(AAGAGATGGCGAC)-3’。以8-17為基礎的篩選所用的引物為5’-GTGCCAAGCTTACCGAGTAACT-3’和5’-d(GGAAGGACAGACGACC-CATC)rU,以10-23為基礎的篩選所用的引物為5’-GTGCCAAGCTTACCGGGAAAAA-3’和5’-d(GGAAGGACAGACGACCTAGTT)rA。PCR引物中包括結合臂,因此固定了這些序列。每套引物其中1個含有1個3’末端核糖核苷酸,這就使得能夠通過非模板鏈的堿性水解以及隨后的聚丙烯酰胺凝膠電泳純化分離,把模板鏈從雙鏈PCR產物中分離出來。上述系統中的一些使用了以凝膠為基礎的篩選方案。在這些情況下,PCR引物為5’-生物素-GTGCCAAGCTTACCG-3’和5’-GAAAAAGTAACTAG-AGATGGAAGGACAGACGACC-3’,延伸反應是利用引物5’-r(GGAAAAAGUAACUAGAGAUGGAAG)-3’在固體載體上進行的。向反應混合物中加入微量的[α-32P]-dATP標記延伸產物,用堿洗脫延伸產物,并用變性聚丙烯酰胺凝膠純化方法進行了純化,然后用電洗脫回收。然后讓這些分子反應,凝膠電泳分離切割后的分子。
如上所述,初始篩選的第8輪和第10輪以后,對單個分子進行克隆和測序。來自第8輪的第17個克隆(8-17)和來自第10輪的第23個克隆(10-23)分別具有以下序列5’-cacggttcga-atggcGTTATGCATCACACTATTTTTCATTGAAGCAGGCCGAGCCTT CCACCTTCcagcggtag-agaagg-3’和5’-cacggttcgaatggcATGTTAAGTTCGTCCCTTTTTAGCAACATCGATCGGATT-GGTTTCCCcagcggtagagaagg-3’(小寫字母部分為PCR引物位點;下劃線部分是底物結合臂)。對于分子間反應來說,合成的寡脫氧核苷酸是在上述克隆序列的基礎上制備而成的,但不含底物結合臂之外的區域。它們可以用于切割與構建初始文庫所使用的引物序列相同的的全部-RNA的底物(見上述內容)。隨后,DNA酶的底物結合臂被縮短到每個只含7個核苷酸,并且與RNA底物完美地互補。
就酶8-17而言,克隆個體中序列變化表明,催化活性核心由一個內在的短莖-環結構與緊隨其后的含4-5個核苷酸的不配對區域組成(圖10)。莖部分總是包含3個核苷酸,至少其中有2個是G-C。環部分是固定不變的,序列為5’-AGC-3’。莖延長或環序列改變的合成結構都沒有表現出催化活性。不配對區域把莖的3’端的半段與下游底物結合結構域連接起來,該不配對區域的序列為5’-WCGR-3’或5’-WCGAA-3’(W=A或T;R=A或G)。這個區域中序列為5’-TCGAA-3’的突變體表現出的催化活性最強,但是這種在酶8-17適用的改良不適用于其他底物序列。
盡管酶基序10-23的催化核心的第8位核苷酸是T時(原型中就是如此)提供了最高水平的活性,但是該位置上的核苷酸可以變化為T、C或A。對RNA底物與相應的互補DNA酶形成的大量不同的組合的測試發現基序10-23可以適應任一底物序列。
然后,用多次轉換反應測量基序10-23和8-17的突變體的催化活性,典型地,不同的日子進行的同一實驗表現出<20%的偏差。在1次轉換和多次轉換實驗得到的動力學數值是近似的;用合成的RNA底物得到的數值比用體外轉錄的底物得到的數值稍差。從Kobs vs.Kobs/[S]的改良Eadie-Hofstee曲線的最佳擬合線的y軸截距和負斜率中分別測定了kcat和Km的報道值。在持續的Km的[S]范圍內,每條曲線由10個數據點組成,[S]相對于[E]過量10倍。典型地,Kobs值建立在從反應起初的10%階段得到5個數據點的基礎之上。將底物和酶單獨在反應緩沖液中預溫育10min,然后合并啟動反應。為了防止物質吸附到管壁上,所有反應中均加有0.01%十二烷基硫酸鈉。加入50mM 4-(2-羥乙基)-哌嗪-1-丙磺酸。動力學數值不依賴于緩沖液的同一性。用20%的聚丙烯酰胺凝膠電泳分離反應產物,用磷光計(phosphorimager)定量。
切割發生在1個單個未配對核苷酸的3’端一側,優選地該核苷酸是1個后面接1個嘧啶的嘌呤。由A和U圍成的目標位點的切割效率最高,在類似生理條件下的催化速度為約0.1min-1。
一個在A*U位點切割切割RNA的DNA酶能夠被用于以任一mRNA起始密碼子(A*U)為目標。作為實驗,制備了對應于HIV-1 gag/聚合酶(gag/pol)mRNA(5’-GGAGAGAGA*UGGGUGCG)的17mer的合成版本和體外轉錄版本。在一個類似生理條件下進行的以kcat為0.15min-1、Km為0.47nM起始的反應中,這兩種版本的底物都在期望位置被相應的DNA酶10-23切割(催化效率,kcat/Km=3.2×108M-1min-1)(圖11)。在1~250mM的濃度范圍內,催化速度隨著MgCl2濃度的增加而加快,pH7.5和37℃的條件下Mg2+的表觀Km值為180mM。在7.0~8.5的pH范圍內,催化速度以近似對數方式隨著pH的升高而加快,這與被切割的磷酸酯鄰接處的2’羥基的去質子化一致。pH8.0、37℃以及50mM MgCl2存在的條件可以用于RNA的實驗室操作,這種條件下,kcat為3.4min-1且Km為0.76nM。與已知的切割RNA的RNA酶相比,DNA酶10-23的催化效率在生理條件和實驗條件下都有利。與蛋白質酶核糖核酸酶A相比,該DNA酶的kcat降低了104倍而Km優化了105倍。
酶10-23能夠被用于切割各種生物學上相關RNAs。我們制備了與HIV-1的gag/聚合酶、env、vpr、tat、nef IGF-R和E100連接酶的mRNA起始位點周圍的15-17個核苷酸相對應的合成RNA底物。上述每種底物都在預期的位置被合成的DNA酶切割,該酶中包含10-23催化核心及其旁側的每個都由7~12個核苷酸組成的底物結合臂(表4)。類似生理條件下,上述所有情況的催化速度都是約0.1min-1。然而,Km值隨著底物核苷酸組成的不同而不同。對于富含鳥嘌呤核苷的gag/聚合酶底物,當使用的是7個核苷酸的底物結合臂或7個核苷酸的底物結合臂時,Km<1nM。當使用的是7個核苷酸的底物結合臂時,env和vpr底物以效率低得多的Km切割,但是當這些底物結合臂每個上的核苷酸數目增至8個時Km得到充分的優化。
表4類似生理條件下各種RNA底物的DNA-催化下的切割基因SEQ ID N0 目標序列臂長 kcat(min-1) Km(nM)HIV-1gag 102 GGAGAGAGA*UGGGUGCG 8+8 0.10.7gag 103 GAGAGAGA*UGGGUGC 7+7 0.10.9env 104 CAGUGGCAA*UGAGAGUG 8+8 0.04 9env 105 AGUGGCAA*UGAGAGU 7+7 0.03 900vDr 106 GAGGAUAGA*UGGAACAA 8+8 0.120vDr 107 AGGAUAGA*UGGAACA 7+7 0.08 500tat 108 GCAAGAAA*UGGAGCC 7+7 0.04 300nef 109 CUAUAAGA*UGGGUGA 7+7 0.05 900FIVgag 110 UACAGCAACA*UGGGGAAUGG9+100.005 8gag 111 CAUGGGGAA*UGGACAGGG 8+9 0.006 5IGF-R112 CAAAUAAAAGGGA*UGAAGUCUGG 12+10 0.02 20113 AAGGAAUGAAG*UCUGGCUCCG 10+10 0.350114 AUACCGCAAAG*UCUUUGAGAAUU 10+12 0.130115 AAGUCUUUGAGAG*UUUCCUGCAC 12+10 0.05 21116 AACACCACCA*UGUCCAGCC 9+9 0.06 2117 GGCCUUUCACA*UUGUACCGC10+90.110118 UUGUACCGCA*UCGAUAUCCAC 9+110.06 1E100 連接酶119 GAACAUUACAUUA*UAGUGACCAG 12+10 1.080表4中測定并給出的動力學數值是在多次轉換條件下得到的,合成的RNA底物比合成的DNA酶過量10倍以上,使用的反應條件如下2mMMgCl2、150mM NaCl、pH7.5、37℃,在25mM MgCl2存在下得到的。
作為對本發明的DNA酶能夠提供的底物結合區域(臂)的突變體的進一步說明,這些臂的長度系統的變化范圍為4~13個核苷酸殘基,使用表4中所示的HIV-1gag基因起始密碼子目標核苷酸序列。除了臂長進行如圖13所示的變化外,上述制備的每種DNA酶結構的反應都是單獨進行的。與以前一樣,催化活性DNA酶的動力學特性在以下條件下測定的2mM Mg2+、150M NaCl、pH7.5、37℃,并測定了酶的多次轉換。對基序10-23修飾使其能與HIV-1gag基因互補結合后,測量Kcat(min-1)和Km(nM),并顯示于圖13中。
這些結果表明,每個底物結合區域的每個臂中的核苷酸在5~13的全部范圍內觀察到的催化速度都是有效的,而在7~10個核苷酸的優選范圍內是特別有效的。這些結果還表明,對于5~13個核苷酸的臂長而言,達到最大催化速度一半(half maximal cataylsis)時酶的有效濃度為100~0.05納摩爾(nM),7~13個核苷酸的長度特別優選。
把多種修飾摻入到DNA酶10-23中,并測試其在10%的胎牛血清中的穩定性(圖13)。這些修飾包括1)該DNA的3’末端的1個“倒轉的”(3’,3’-連接)胸腺嘧啶;2)兩個底物結合臂的遠端一側的5個2’-O-甲基殘基;3)在兩個底物結合臂的所有位置上的2’-O-甲基殘基;4)催化核心中的5個嘌呤-嘌呤位點上的硫代磷酸酯位點;5)兩個底物結合臂遠端側上的3個硫代磷酸酯。倒轉的胸苷酸提供的保護最好(t1/2>60min)。除核心上的那5個P=S取代以外,與未修飾的DNA相比,所有其他修飾都導致了血清穩定性的增強。所有修飾后的DNA酶都保持了催化活性。
因此,本發明描述了一種具有位點特異性內切核酸酶活性的催化活性DNA分子,該分子可以設計成切割任一預先選定的底物核酸序列。該DNA分子(酶)具有位于核心區域旁側的第一和第二兩個底物結合區域(臂),每個臂上都有一段與目標底物核酸序列中的部分互補的序列,因此第一和第二臂一起限定出了被切割的底物核酸序列。互補意味著底物結合區域與目標序列通過常規的Waston-Crick堿基配對方式結合在一起。
上述臂可以有多種長度。但是,因為看到長度能夠影響催化速度(kcat)和酶的有效濃度(Km),所以優選的臂長為每個臂有5~13核苷酸互補,優選約6~11個核苷酸,更優選長度約7~10個核苷酸。
核心區域具有以下列通式為基礎的多種序列(I.)T(莖)’AGC(莖)”Z,其中所述的(莖)’和(莖)”都是3個連續的核苷酸,以(莖)’∶(莖)”配對雜交時,其中應包括至少2個G∶C對,其中所述的Z=WCGR或WCGAA,W=A或T且R=A或G。這種莖結構如圖10所示,顯示了3個互補的堿基對。具體優選的是圖10所示的基序8-17的核心區域的原型結構,“TCCGAGCCGGACGA”(SEQ ID NO 120)。
在另一個實施方案中,該核心區域能夠具有根據下列通式的序列(II.)RGGCTAGCXACAACGA(SEQ ID NO 122),其中所述的X=T、C或A,R=A或G。具體優選的是圖10所示的基序10-23的核心區域的原型結構,“RGGCTAGCTACAACGA”(SEQ ID NO121)。
如圖12所示,上述設計的DNA酶能夠根據臂的長度不同表現出一定范圍的有用的催化速度和有效催化濃度。生理條件下,典型地,根據基序8-17或10-23的本發明的DNA酶具有約0.005~0.1min-1的催化轉換速度(Kcat),優選約0.01~0.1min-1,更優選約0.03~0.1min-1。一種具體優選的酶的速度為約0.1min-1。在生理條件下,本發明的根據基序8-17或10-23的DNA酶也具有約0.05~1000納摩爾(nM)的催化半數最大有效濃度(half maximal effective concentration)(Km),優選約0.7~900nM,更優選低于約1.0微摩爾(μM),最優選約0.1(μM)。
上述內容還說明,一種優選的DNA酶具有的核苷酸修飾能穩定該DNA酶使其能在生理條件下使用。只要該酶按照此處定義和測量的那樣能保持它的催化活性,那么多種修飾中的任一種都可以選用,因此本發明不只限于一種具體的穩定修飾。優選的修飾能使目標DNA對外源或內源溶核消化(nucleolytic digestion)的敏感性減弱。在一個實施方案中,所述修飾包括摻入1個或多個核苷硫代磷酸酯殘基,這種描述見Zhang etal,Biochem.Pharmacol.,50545-556(1995)或Stein,C.A.,TrendsBiotechnol.,14147-149(1996)。硫代磷酸酯可以出現在臂中或核心中,在一個實施方案中可包括位于核心中的1個二聯嘧啶(dipyrimidine)上的1個殘基。眾所周知并如上述Zhang等人描述的那樣,另一種修飾包括糖核苷酸的核糖或脫氧核糖成分的2’位置上的O-甲基的取代。另外一種修飾是把1個插入的末端核苷酸連接到DNA分子的3’末端上,從而封閉了該3’末端,如同1個自由的5’末端。這種結構能夠阻斷3’內切核酸酶,可以通過在3’末端形成1個3’-3’連接的核苷酸(即一個倒轉的核苷酸)。在3’末端制備1個3’插入核苷酸是眾所周知的,利用寡核苷酸合成中的修飾后的固體載體,該載體以插入的末端3’殘基為起始原料的。一種優選的用于該目的的固體載體材料是Dt-5’-CPG 500,可從Glen Research(標準成分,VA),是一種帶有修飾后殘基的經修飾的可控制孔(Controlled pore)的玻璃樹脂。
上述包括特定的實施方案和實施例的說明書是用來說明本發明的,而并非對本發明的限制。不脫離本發明的實際精神和范圍可以得出大量其他的變化和修改。
序列表(1)一般信息(i)申請人The Scripps Research Institute(ii)發明名稱酶促DNA分子(iii)序列數101(iv)通訊地址(A)收件人The Scripps Research Institute(B)街道10666 North Torrey Pines Road,TPC-8(C)城市La Jolla(D)州加利弗尼亞(E)國家美國(f)郵政編碼92037(v)計算機可讀形式(A)介質類型軟盤(B)計算機IBM PC可兼容機(C)操作系統PC-DOS/MS-DOS(D)軟件PatentIn Release#1.0,Version#1.25(vi)當前申請資料(A)申請號PCT/US95/(B)申請日01-DEC-1995(C)分類號(vii)在先申請資料(A)申請號US 08/472,194
(B)中請日1995-6-07(vii)在先申請資料(A)申請號US 08/349,023(B)申請日1994-12-2(viii)律師/代理人資料(A)姓名Logan,April C.
(B)登記號33,950(C)資料/文檔號463.2 PC(ix)通訊資料(A)電話(619)554-2937(B)傳真(619)554-6312(2)SEQ ID NO1的資料(i)序列特征(A)長度15個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO1CGGTAAGCTT GGCAC 15(2)SEQ ID NO2的資料(i)序列特征(A)長度20個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ii)分子類型DNA(基因組)(ix)特征
(A)名稱/關鍵詞misc_差異(B)位置取代(8,″″)(D)其它資料/標準名=“腺苷核糖核苷酸”(xi)序列描述SEQ ID NO2TCACTATNAG GAAGAGATGG 20(2)SEQ ID NO3的資料(i)序列特征(A)長度38個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO3ACACATCTCT GAAGTAGCGC CGCCGTATAG TGACGCTA 38(2)SEQ ID NO4的資料(i)序列特征(A)長度80個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO4GTGCCAAGCT TACCGNNNNN NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN 60NNNNNGTCGC CATCTCTTCC 80(2)SEQ ID NO5的資料(i)序列特征(A)長度28個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(ix)特征
(A)名稱/關鍵詞misc_特征(B)位置28(D)其它資料/標準名=“2’3’環磷酸”(ix)特征(A)名稱/關鍵詞misc-差異(B)位置取代(28,””)(C)其他資料/標準名=“腺苷核糖核苷酸”(xi)序列描述SEQ ID NO5GGGACGAATT CTAATACGAC TCACTATN 28(2)SEQ ID NO6的資料(i)序列特征(A)長度28個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(ix)特征(A)名稱/關鍵詞misc_差異(B)位置取代(28,″″)(D)其它資料/標準名=“腺苷核糖核苷酸”(xi)序列描述SEQ ID NO6GGGACGAATT CTAATACGAC TCACTATN 28(2)SEQ ID NO7的資料(i)序列特征(A)長度19個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(ix)特征(A)名稱/關鍵詞misc_差異(B)位置取代(8,″″)
(D)其它資料/標準名=“腺苷核糖核苷酸”(xi)序列描述SEQ ID NO7TCACTATNGG AAGAGATGG 19(2)SEQ ID NO8的資料(i)序列特征(A)長度8個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(ix)特征(A)名稱/關鍵詞misc_差異(B)位置取代(8,″″)(D)其它資料/標準名=“腺苷核糖核苷酸”(xi)序列描述SEQ ID NO8TCACTATN 8(2)SEQ ID NO9的資料(i)序列特征(A)長度30個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO9CCATCTCTTC CTATAGTGAG TCCGGCTGCA 30(2)SEQ ID NO10的資料(i)序列特征(A)長度15個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)
(xi)序列描述SEQ ID NO10GTGCCAAGCT TACCG 15(2)SEQ ID NO11的資料(i)序列特征(A)長度43個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO11CTGCAGAATT CTAATACGAC TCACTATAGG AAGAGATGGC GAC 43(2)SEQ ID NO12的資料(i)序列特征(A)長度19個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(ix)特征(A)名稱/關鍵詞misc_差異(B)位置取代(8,″″)(D)其它資料/標準名=“腺苷核糖核苷酸”(xi)序列描述SEQ ID NO12TCACTATNGG AAGAGATGG 19(2)SEQ ID NO13的資料(i)序列特征(A)長度43個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(ix)特征
(A)名稱/關鍵詞misc_差異(B)位置取代(28,″″)(D)其它資料/標準名=“腺苷核糖核苷酸”(xi)序列描述SEQ ID NO13GGGACGAATT CTAATACGAC TCACTATNGG AAGAGATGGC GAC 43(2)SEQ ID NO14的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO14TCACACATCT CTGAAGTAGC GCCGCCGTAT GTGACGCTAG GGGTTCGCCT50(2)SEQ ID NO15的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO15GGGGGGAACG CCGTAACAAG CTCTGAACTA GCGGTTGCGA TATAGTCGTA50(2)SEQ ID NO16的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO16CGGGACTCCG TAGCCCATTG CTTTTTGCAG CGTCAACGAA TAGCGTATTA50
(2)SEQ ID NO17的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO17CCACCATGTC TTCTCGAGCC GAACCGATAC TTACGTCATA CCTCCCGTAT50(2)SEQ ID NO18的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO18GCCAGATTGC TGCTACCAGC GGTACGAAAT AGTGAAGTGT TCGTGACTAT50(2)SEQ ID NO19的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO19ATAGGCCATG CTTTGGCTAG CGGCACCGTA TAGTGTACCT GCCCTTATCG50(2)SEQ ID NO20的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈
(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO20TCTGCTCTCC TCTATTCTAG CAGTGCAGCG AAATATGTCG AATAGTCGGT50(2)SEQ ID NO21的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO21TTGCCCAGCA TAGTCGGCAG ACGTGGTGTT AGCGACACGA TAGGCCCGGT50(2)SEQ ID NO22的資科(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO22TTGCTAGCTC GGCTGAACTT CTGTAGCGCA ACCGAAATAG TGAGGCTTGA50(2)SEQ ID NO23的資料(i)序列特征(A)長度107個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(ix)特征(A)名稱/關鍵詞misc_差異(B)位置取代(28,″″)
(D)其它資料/標準名=“腺苷核糖核苷酸”/標記物=rA(xi)序列描述SEQ ID NO23GGGACGAATT CTAATACGAC TCACTATNGG AAGAGATGGC GACATCTCNN NNNNNNNNNN 60NNNNNNNNNN NNNNNNNNNN NNNNNNNNGT GACGGTAAGC TTGGCAC 107(2)SEQ ID NO24的資料(i)序列特征(A)長度49個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO24CCGCCCACCT CTTTTACGAG CCTGTACGAA ATAGTGCTCT TGTTAGTAT 49(2)SEQ ID NO25的資料(i)序列特征(A)長度48個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO25TCTCTTCAGC GATGCACGCT TGTTTTAATG TTGCACCCAT GTTAGTGA 48(2)SEQ ID NO26的資料(i)序列特征(A)長度46個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO26TCTCATCAGC GATTGAACCACTTGGTGGAC AGACCCATGT TAGTGA 46
(2)SEQ ID NO27的資料(i)序列特征(A)長度49個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO27CCGCCCACCT CTTTTACGAG CCTGTACGAA ATAGTGTTCT TGTTAGTAT 49(2)SEQ ID NO28的資料(i)序列特征(A)長度49個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO28CCGCCCACCT CTTTTACGAG CCTGTACGAA ATAGTGCTCT CGTTAGTAT 49(2)SEQ ID NO29的資料(i)序列特征(A)長度48個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO29TCTCAGACTT AGTCCATCAC ACTCTGTGCA TATGCCTGCT TGATGTGA 48(2)SEQ ID NO30的資料(i)序列特征(A)長度42個堿基對(B)類型核酸(C)鏈型單鏈
(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO30CTCTCATCTG CTAGCACGCT CGAATAGTGT CAGTCGATGT GA42(2)SEQ ID NO31的資料(i)序列特征(A)長度40個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO31TACAGCGATT CACCCTTGTT TAAGGGTTAC ACCCATGTTA 40(2)SEQ ID NO32的資料(i)序列特征(A)長度40個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO32ATCAGCGATT AACGCTTGTT TCAATGTTAC ACCCATGTTA 40(2)SEQ ID NO33的資料(i)序列特征(A)長度40個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO33TTCAGCGATT AACGCTTATT TTAGCGTTAC ACCCATGTTA 40(2)SEQ ID NO34的資料
(i)序列特征(A)長度40個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO34ATCAGCGATT CACCCTTGTT TTAAGGTTGC ACCCATGTTA 40(2)SEQ ID NO35的資料(i)序列特征(A)長度40個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO35ATCAGCGATT CACCCTTGTT TAAGCGTTAC ACCCATGTTG 40(2)SEQ ID NO36的資料(i)序列特征(A)長度40個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO36ATCAGCGATT CACCCTTGTT TTAAGGTTAC ACCCATGTTA 40(2)SEQ ID NO37的資料(i)序列特征(A)長度40個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性
(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO37ATCAGCGATT AACGCTTATT TTAGCGTTAC ACCCATGTTA 40(2)SEQ ID NO38的資料(i)序列特征(A)長度40個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO38ATCAGCGATT AACGCTTGTT TTAGTGTTGC ACCCATGTTA 40(2)SEQ ID NO39的資料(i)序列特征(A)長度40個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO39ATCAGCGATT AACGCTTATT TTAGCATTAC ACCCATGTTA 40(2)SEQ ID NO40的資料(i)序列特征(A)長度10個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO40GCCATGCTTT10(2)SEQ ID NO41的資料(i)序列特征
(A)長度10個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO41CTCTATTTCT10(2)SEQ ID NO42的資料(i)序列特征(A)長度12個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO42TATGTGACGC TA 12(2)SEQ ID NO43的資料(i)序列特征(A)長度10個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO43TATAGTCGTA10(2)SEQ ID NO44的資料(i)序列特征(A)長度11個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)
(xi)序列描述SEQ ID NO44ATAGCGTATT A 11(2)SEQ ID NO45的資料(i)序列特征(A)長度13個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO45ATAGTTACGT CAT13(2)SEQ ID NO46的資料(i)序列特征(A)長度14個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO46AATAGTGAAG TGTT 14(2)SEQ ID NO47的資料(i)序列特征(A)長度11個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO47ATAGGCCCGG T 11(2)SEQ ID NO48的資料(i)序列特征(A)長度14個堿基對
(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO48AATAGTGAGG CTTG 14(2)SEQ ID NO49的資料(i)序列特征(A)長度12個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型RNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO49GUAACUAGAG AU 12(2)SEQ ID NO50的資料(i)序列特征(A)長度98個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(ix)特征(A)名稱/關鍵詞misc差異(B)位置7..18(D)其它資料/注意=“第7~18位是RNA;序列其余部分為DNA”(xi)序列描述SEQ ID NO50GGAAAAGUAA CUAGAGAUGG AAGAGATGGC GACNNNNNNN NNNNNNNNNN NNNNNNNNNN 60NNNNNNNNNN NNNNNNNNNN NNNCGGTAAG CTTGGCAC 98(2)SEQ ID NO51的資料(i)序列特征(A)長度99個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(ix)特征(A)名稱/關鍵詞misc_差異(B)位置1..24(D)其它資料/注意=“第1~24位是RNA;序列其余部分為DNA”(xi)序列描述SEQ ID NO51GGAAAAAGUA ACUAGAGAUG GAAGAGATGG CGACNNNNNN NNNNNNNNNN NNNNNNNNNN 60NNNNNNNNNN NNNNNNNNNN NNNNCGGTAA GCTTGGCAC99(2)SEQ ID NO52的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO52CCAATAGTGC TACTGTGTAT CTCAATGCTG GAAACACGGG TTATCTCCCG50(2)SEQ ID NO53的資料(i)序列特征
(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO53CCAAAACAGT GGAGCATTAT ATCTACTCCA CAAAGACCAC TTTCTCCCG 50(2)SEQ ID NO54的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO54ATCCGTACTA GCATGCAGAC AGTCTGTCTG CTTTTTCATT ACTCACTCCC50(2)SEQ ID NO55的資料(i)序列特征(A)長度49個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO55CAATTCATGA TGACCAACTC TGTCAACACG CGAACTTTTA ACACTGGCA 49(2)SEQ ID NO56的資料
(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO56CTTCCACCTT CCGAGCCGGA CGAAGTTACT TTTTATCACA CTACGTATTG50(2)SEQ ID NO57的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO57GGCAAGAGAT GGCATATATT CAGGTAACTG TGGAGATACC CTGTCTGCCA50(2)SEQ ID NO58的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO58CTAGACCATT CACGTTTACC AAGCTATGGT AAGAACTAGA ATCACGCGTA50
(2)SEQ ID NO59的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO59CGTACACGTG GAAAAGCTAT AAGTCAAGTT CTCATCATGT ACCTGACCGC50(2)SEQ ID NO60的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO60CAGTGATACA TGAGTGCACC GCTACGACTA AGTCTGTAAC TTATTCTACC50(2)SEQ ID NO61的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO61ACCGAATTAA ACTACCGAAT AGTGTGGTTT CTATGCTTCT TCTTCCCTGA50(2)SEQ ID NO62的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO62CAGGTAGATA TAATGCGTCA CCGTGCTTAC ACTCGTTTTA TTAGTATGTC50(2)SEQ ID NO63的資料(i)序列特征(A)長度49個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO63CCCTACAACA CCACTGGGCC CAATTAGATT AACGCTATTT TATAACTCG 49(2)SEQ ID NO64的資料(i)序列特征(A)長度49個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無
(xi)序列描述SEQ ID NO64CCAAACGGTT ATAAGACTGA AAACTCAATC AATAGCCCAA TCCTCGCCC 49(2)SEQ ID NO65的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO65CACATGTATA CCTAAGAAAT TGGTCCCGTA GACGTCACAG ACTTACGCCA50(2)SEQ ID NO66的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO66CACAACGAAA ACAATCTTCC TTGGCATACT GGGGAGAAAG TCTGTTGTCC50(2)SEQ ID NO67的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無
(iv)反義無(xi)序列描述SEQ ID NO67CACACGAACA TGTCCATTAA ATGGCATTCC GTTTTTCGTT CTACATATGC50(2)SEQ ID NO68的資料(i)序列特征(A)長度49個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO68CAGAACGAGG GTCTTGTAAG ACTACACCTC CTCAGTGACA ATAATCCTG 49(2)SEQ ID NO69的資料(i)序列特征(A)長度49個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO69CACTACAGCC TGATATATAT GAAGAACAGG CAACAAGCTT ATGCACTGG 49(2)SEQ ID NO70的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)
(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO70GGGTACATTT ATGATTCTCT TATAAAGAGA ATATCGTACT CTTTTCCCCA50(2)SEQ ID NO71的資料(i)序列特征(A)長度49個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO71CCAAAGTACA TTCCAACCCCTT ATACGTGA AACTTCCAGT AGTTTCCTA 49(2)SEQ ID NO72的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO72CTTGAAGATC CTCATAAGAC GATTAAACAA TCCACTGGAT ATAATCCGGA50(2)SEQ ID NO73的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性
(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO73CGAATAGTGT CCATGATTAC ACCAATAACT GCCTGCCTAT CATGTTTATG50(2)SEQ ID NO74的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO74CCAAGAGAGT ATCGGATACA CTTGGAACAT AGCTAACTCG AACTGTACCA50(2)SEQ ID NO75的資料(i)序列特征(A)長度48個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO75CCACTGATAA ATAGGTAACT GTCTCATATC TGCCAATCAT ATGCCGTA 48(2)SEQ ID NO76的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈
(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO76CCCAAATTAT AAACAATTTA ACACAAGCAA AAGGAGGTTC ATTGCTCCGC50(2)SEQ ID NO77的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO77CAATAAACTG GTGCTAAACC TAATACCTTG TATCCAAGTT ATCCTCCCCC50(2)SEQ ID NO78的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO78CCGAATGACA TCCGTAGTGG AACCTTGCTT TTGACACTAA GAAGCTACAC50(2)SEQ ID NO79的資料(i)序列特征(A)長度50個堿基對(B)類型核酸
(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO79CCATAACAAA TACCATAGTA AAGATCTGCA TTATATTATA TCGGTCCACC50(2)SEQ ID NO80的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO80CAGAACAAAG ATCAGTAGCT AAACATATGG TACAAACATA CCATCTCGCA50(2)SEQ ID NO81的資料(i)序列特征(A)長度49個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO81CCTTTAGTTA GGCTAGCTAC AACGATTTTT CCCTGCTTGG CAACGACAC 49(2)SEQ ID NO82的資料(i)序列特征(A)長度50個堿基對
(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO82CTCCCTACGT TACACCAGCG GTACGAATTT TCCACGAGAG GTAATCCGCA50(2)SEQ ID NO83的資料(i)序列特征(A)長度36個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO83CGGCACCTCT AGTTAGACAC TCCGGAATTT TTCCCC 36(2)SEQ ID NO84的資料(i)序列特征(A)長度49個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO84CGGCACCTCT AGTTAGACAC TCCGGAATTT TAGCCTACCA TAGTCCGGT 49(2)SEQ ID NO85的資料(i)序列特征
(A)長度47個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO85CCCTTTGGTT AGGCTAGCTA CAACGATTTT TCCCTGCTTG AATTGTA 47(2)SEQ ID NO86的資料(i)序列特征(A)長度51個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO86CCCTTTGGTT AGGCTAGCTA CAACGATTTT TCCCTGCTTG ACCTGTTACG A 51(2)SEQ ID NO87的資料(i)序列特征(A)長度48個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO87CCTTTAGTTA GGCTAGCTAC AACGATTTTT CCCTGCTTGG AACGACAC 48(2)SEQ ID NO88的資料
(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO88CATGGCTTAA TCATCCTCAA TAGAAGACTA CAAGTCGAAT ATGTCCCCC 50(2)SEQ ID NO89的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO89CAACAGAGCG AGTATCACCC CCTGTCAATA GTCGTATGAA ACATTGGGCC50(2)SEQ ID NO90的資料(i)序列特征(A)長度49個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO90TACCGACAAG GGGAATTAAA AGCTAGCTGG TTATGCAACC CTTTTCGCA 49
(2)SEQ ID NO91的資料(i)序列特征(A)長度49個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO91CTCGAAACAG TGATATTCTG AACAAACGGG TACTACGTGT TCAGCCCCC 49(2)SEQ ID NO92的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO92CCAATAACGT AACCCGGTTA GATAAGCACT TAGCTAAGAT GTTTATCCTG50(2)SEQ ID NO93的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO93CAATACAATC GGTACGAATC CAGAAACATA ACGTTGTTTC AGAATGGTCC50(2)SEQ ID NO94的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO94GCAACAACAA GAACCAAGTT ACATACACGT TCATCTATAC TGAACCCCCA50(2)SEQ ID NO95的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO95CCTTTGAGTT CCTAAATGCC GCACGGTAAG CTTGGCACAC TTTGACTGTA50(2)SEQ ID NO96的資料(i)序列特征(A)長度49個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無
(xi)序列描述SEQ ID NO96CAAAGATCTC ACTTTGGAAA TGCGAAATAT GTATATTCGC CCTGTCTGC 49(2)SEQ ID NO97的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO97CCACGTAGAA TTATCTGATT TATAACATAA CGCAGGATAA CTCTCGCCCA50(2)SEQ ID NO98的資料(i)序列特征(A)長度48個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO98CACAAGAAAG TGTCGTCTCC AGATATTTGA GTACAAGGAA CTACGCCC 48(2)SEQ ID NO99的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無
(iv)反義無(xi)序列描述SEQ ID NO99CATGAAGAAA TAGGACATTC TACAGGCTGG ACCGTTACTA TGCCTGTAGG50(2)SEQ ID NO100的資料(i)序列特征(A)長度46個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO100CATAGGATAA TCATGGCGAT GCTTATGACG TGTACATCTA TACCTT46(2)SEQ ID NO101的資料(i)序列特征(A)長度50個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(iii)假設無(iv)反義無(xi)序列描述SEQ ID NO101CAGATGATCT TCCTTTAAAG ACTACCCTTT AAAGAAACAT AAGGTACCCC50
權利要求
1.一種具有位點特異性內切核酸酶活性的催化活性DNA分子,這種活性針對預先選定的底物核酸序列中被定義為切割位點的核苷酸序列具有特異性,所述分子具有位于核心區域旁側的第一和第二兩個底物結合區域,其中所述的第一底物結合區域有一段序列與所述預先選定的底物核酸序列中的第一部分互補,所述的第二底物結合區域有一段序列與所述預先選定的底物核酸序列中的第二部分互補,所述核心區域有一段根據下列通式的序列(I.)T(莖)’AGC(莖)”Z,其中(莖)’和(莖)”都是具有以下特征的一種三聯核苷酸即當(莖)’(莖)”雜交配對時形成的3個堿基對中至少包括2個GC對,其中所述的Z=WCGR或WCGAA,W=A或T且R=A或G;或(II)RGGCTAGCXACAACGA(SEQ ID NO 122),其中所述的X=T、C或A,R=A或G。
2.權利要求1中的分子,其中所述的通式I為SEQ ID NO 120(8-17)。
3.權利要求1中的分子,其中所述的通式II為SEQ ID NO 121(10-23)。
4.權利要求1中的分子,其中所述的第一或第二底物結合區域的長度為5~13個核苷酸。
5.權利要求1中的催化活性DNA分子,其中所述的催化活性DNA分子包括脫氧核糖核苷酸(DNA)、修飾后的DNA、核苷酸類似物或其組合。
6.權利要求1中的催化活性DNA分子,其中所述的底物核酸包括RNA、DNA、修飾后的RNA、修飾后的DNA、核苷酸類似物或其組合。
7.權利要求1中的催化活性DNA分子,其中所述的催化活性DNA分子包括一段具有5’和3’末端的單鏈脫氧核糖核酸,其中所述的末端經過具有外切核酸酶抗性的核苷酸的修飾。
8.權利要求7中的催化活性DNA分子,其中所述的具有外切核酸酶抗性的核苷酸包括核苷硫代磷酸酯。
9.權利要求1中的催化活性DNA分子,其中所述的第一或第二底物結合區域包括至少2個硫代磷酸酯核苷。
10.權利要求1中的催化活性DNA分子,其中所述的核心區域包括在所述核心中的二聯嘧啶上有1個硫代磷酸酯核苷。
11.權利要求7中的催化活性DNA分子,其中所述的3’末端包括1個倒轉的(3’,3’-連接)核苷酸。
12.權利要求1中的催化活性DNA分子,其中所述的催化活性DNA分子包括1個2’O-甲基核糖核苷酸。
13.權利要求1中的催化活性DNA分子,其中所述的第一和第二底物結合區域包括一段與選自SEQ ID NOs 102~119的序列互補的核苷酸序列。
14.權利要求1中的催化活性DNA分子,其中所述的分子能夠催化Km值約0.05~1000nM的反應。
15.權利要求1中的催化活性DNA分子,其中所述的催化活性DNA分子以低于約1.0微摩爾的Km與所述底物結合。
16.權利要求1中的催化活性DNA分子,其中所述的催化活性DNA分子以低于約0.1納摩爾的Km與所述底物結合。
17.權利要求1中的催化活性DNA分子,其中所述的分子具有的催化反應轉換速度(kcat)為約0.005~0.1min-1。
18.權利要求1中的催化活性DNA分子,其中所述的內切核酸酶活性因二價陽離子的存在而增強。
19.權利要求18中的催化活性DNA分子,其中所述的二價陽離子選自Pb2+、Mg2+、Mn2+、Zn2+、和Ca2+。
20.權利要求18中的催化活性DNA分子,其中所述的內切核酸酶活性因Mg2+存在而增強。
21.權利要求1中的催化活性DNA分子,其中所述的內切核酸酶活性因單價陽離子的存在而增強。
22.權利要求21中的催化活性DNA分子,其中所述的單價陽離子選自Na+和K+。
23.一種組合物,其中包括根據權利要求1的催化活性DNA分子的兩種或多種群體,其中每種群體中的催化活性DNA分子能切割同一底物中的不同的核苷酸序列。
24.一種組合物,其中包括根據權利要求1的催化活性DNA分子的兩種或多種群體,其中每種群體中的催化活性DNA分子能識別不同的底物。
25.一種切割目標核酸分子的方法,包括a)將根據權利要求1的催化活性DNA分子和具有一段由所述的第一和第二廢物結合區域預篩的底物核酸序列的目標核酸分子混合,形成反應混合物;以及b)在預定的反應條件下,保持所述的混合物使得所述DNA分子能夠切割所述目標核酸分子,從而產生一定數目的底物產物。
26.權利要求25中的方法,其中所述的底物包括RNA。
27.權利要求25中的方法,其中所述的預定的反應條件包括有單價陽離子、二價陽離子或二者的存在。
28.權利要求25中的方法,其中所述的混合包括把所述催化活性DNA分子導入到含目標核酸分子的細胞中。
29.一種構建催化活性DNA分子的方法,該分子能夠切割目標核酸分子中的預定的底物核酸序列,該方法包括以下步驟a)從目標核酸分子中篩選一段長度為10~26個核苷酸的底物核酸序列;以及b)合成一種包括位于核心區域旁側的第一和第二兩個底物結合區域的脫氧核糖核酸分子,其中所述的第一底物結合區域有一段序列與所述預先選定的底物核酸序列中的第一部分互補,所述的第二底物結合區域有一段序列與所述預先選定的底物核酸序列中的第二部分互補,所述核心區域有一段根據下列通式的序列(I.)T(莖)’AGC(莖)”Z,其中(莖)’和(莖)”都是具有以下特征的一種三聯核苷酸即當(莖)’(莖)”雜交配對時形成的3個堿基對中至少包括2個GC對,其中所述的Z=WCGR或WCGAA,W=A或T且R=A或G;或(II.)RGGCTAGCXACAACGA(SEQ ID NO 122),其中所述的X=T、C或A,R=A或G。
30.權利要求29中的方法,其中所述的通式I為SEQ ID NO 120(8-17)。
31.權利要求29中的方法,其中所述的通式II為SEQ ID NO 121(10-23)。
32.權利要求29中的方法,其中所述的第一或第二底物結合區域的長度為5~13個核苷酸。
33.權利要求29中的方法,其中所述的催化活性DNA分子包括脫氧核糖核苷酸(DNA)、修飾后的DNA、核苷酸類似物或其組合體。
34.權利要求29中的方法,其中所述的催化活性DNA分子包括一段具有5’和3’末端的單鏈脫氧核糖核酸,其中所述的末端經過具有外切核酸酶抗性的核苷酸的修飾。
35.權利要求29中的方法,其中所述的具有外切核酸酶抗性的核苷酸包括核苷硫代磷酸酯。
36.權利要求29中的方法,其中所述的第一或第二底物結合區域包括至少2個硫代磷酸酯核苷。
37.權利要求29中的方法,其中所述的核心區域包括在所述核心中的二聯嘧啶上有1個硫代磷酸酯核苷。
38.權利要求34中的方法,其中所述的3’末端包括1個倒轉的(3’,3’-連接)核苷酸。
39.權利要求29中的方法,其中所述的催化活性DNA分子包括1個2’O-甲基核糖核苷酸。
40.權利要求29中的方法,其中所述的第一和第二底物結合區域包括一段與選自SEQ ID NOs 102~119的序列互補的核苷酸序列。
41.權利要求29中的方法,其中所述的分子能夠催化Km值為約0.05~1000nM的反應。
42.權利要求29中的方法,其中所述的分子具有的催化反應轉換速度(kcat)為約0.005~0.1min-1。
43.權利要求29中的方法,其中所述的內切核酸酶活性因二價陽離子的存在而增強。
44.權利要求43中的方法,,其中所述的二價陽離子選自Pb2+、Mg2+、Mn2+、Zn2+、和Ca2+。
45.權利要求29中的方法,其中所述的內切核酸酶活性因單價陽離子的存在而增強。
46.權利要求45中的方法,其中所述的單價陽離子選自Na+和K+。
全文摘要
本發明公開了一種脫氧核糖核酸酶——催化活性DNA分子或酶促DNA分子——這種酶能夠以位點特異性的方式切割核酸序列或核酸分子,尤其是RNA分子,并且還公開了含有這種酶的組合物。本發明還公開了制備及使用本發明中的酶和組合物的方法。
文檔編號C12N9/22GK1261920SQ98806724
公開日2000年8月2日 申請日期1998年4月29日 優先權日1997年4月29日
發明者G·F·喬伊斯, R·R·布雷克 申請人:斯克里普斯研究學院