一種多模塊dna文庫及轉錄激活子樣效應因子核酸酶質粒的構建方法
【專利摘要】本發明公開了一種DNA文庫及轉錄激活子樣效應因子核酸酶質粒的構建方法,一種轉錄激活子樣效應因子連接單元庫,包括16組×n個雙堿基識別模塊和4組×m個單堿基識別模塊,每個雙堿基識別模塊或單堿基識別模塊兩末端均有經二類限制性內切酶酶切形成第一粘性末端和第二粘性末端,n表示每組雙堿基識別模塊的數量,m表示每組單堿基識別模塊的數量;DNA庫包括與Tale連接單元庫的連接單元數量相同的質粒,每個質粒包含一個堿基序列互異的連接單元,連接單元兩末端與原始載體連接處有BsaⅠ酶切位點。采用本發明的DNA庫用于構建轉錄激活子樣效應因子核酸酶質粒,識別模塊的酶切和連接能在一個反應中進行,可實現一步將19-26個識別模塊連接起來,速度快,效率高,操作簡單,材料易于保存,成本低。
【專利說明】一種多模塊DNA文庫及轉錄激活子樣效應因子核酸酶質粒
的構建方法
【技術領域】
[0001]本發明涉及基因工程領域,尤其涉及一種TALE連接單元庫、包含該TALE連接單元庫中所有TALE連接單元的DNA文庫以及轉錄激活子樣效應因子核酸酶質粒的構建方法。
【背景技術】
[0002]按照人類的意愿對基因組進行定向靶向修飾一直是許多科學家的夢想。在內源的基因組上特異地刪除或加入我們需要的序列,一方面可以構建出各種動物模型用于生物學基礎研究和疾病機理研究,另一方面可以生產動物反應器用以廉價生產我們需要的又很難從其他途徑得到的生物組分。人們一直沒有找到簡單高效的方法對基因組進行基因組靶向修飾。傳統的基因打靶技術依賴于細胞內自然發生的同源染色體隨機交換,其打靶效率非常低,通常只有10_6-10_8,這種打靶方法只在小鼠中得到了廣泛了應用,而在其他模式動物及大型哺乳動物中都因效率太低而得不到廣泛應用。
[0003]2009年兩個研究組發現植物病原體Xanthomonas中的一種可以調節植物基因表達的轉錄激活子樣效應因子(transcription activator-like effector,TALE)表現出DNA結合特異性,而其識別密碼具有模塊化和簡單化的特點,為科學家們開發出更簡易的新型基因組祀向修飾技術帶來了新希望。
[0004] TALE與Fokl融合后即形成轉錄激活子樣效應因子核酸酶(transcriptionactivator-like effector nucleases, TALEN)。TALEs 由數十個特異性識別 DNA 的串聯“蛋白模塊”和兩側的N-末端及C-末端序列組成。每個“蛋白模塊”包含34個氨基酸,第12和13位殘基是祀向識別的關鍵位點,被稱作重復可變的d1-residues (RVDs)位點。
[0005]實踐中,TALEN技術大大提高了基因打靶效率,應用范圍和可操作性,但如何把十幾個高度重復的DNA的識別模塊組裝起來成為了 TALEN廣泛應用的一個限制因素。研究者們在怎樣制作TALEN做出了各種各樣的努力。有的采用化學合成的方法,有的采用兩步分子克隆的方法,也有的采用一步分子克隆的方法。但都有各自的缺陷,因為需合成的DNA高度重復的序列化學合成非常困難,成本也非常高;兩步法因為需兩步連接所以材料成本、時間成本、測序成本都較高;現在公開的唯一一個可一步連接的方法最多只能連接14個識別模塊,而自然界中常見的識別模塊的長度為12-23,在實際應用中很多情況需要大于14個識別模塊的TALEN,14個片段長度的限制不止影響此種方法應用,而且不利于TALEN特異性的提高,并且因其需要酶切,純化,再連接造成操作繁瑣,工藝流程復雜,酶切純化后的DNA保存困難,特別是單鏈的尾巴容易降解。
[0006]以前有研究者用單模塊連接TALEN,如連接18個識別模塊,一個反應連接18個片段難度非常大,世界范圍內還沒有人能實現;以前也有建立在雙模炔基礎上的研究,但其只能連接14個識別模塊。
【發明內容】
[0007]本發明還提供一種轉錄激活子樣效應因子(TALE)連接單元庫,利用該連接單元庫可以連接19個以上的識別模塊。
[0008]本發明還提供了利用上述連接單元庫,連接TALENs識別模塊的方法。
[0009]技術方案為:
[0010]1.轉錄激活子樣效應因子核酸酶質粒的構建方法,包括連接TALENs識別模塊的連接,步驟包括:
[0011](I)根據所需識別目的基因靶序列的堿基序列,從多模塊單元庫中選擇對應的連接單元;
[0012]所述的多模塊單元庫包括包括16組Xn個雙堿基連接單元和4組Xm個單堿基識別連接單元,同一組的所有雙堿基連接單元或單堿基連接單元兩端粘性末端的序列互不相同;所需識別的堿基序列長度為2*n+2-m至2*n+l ;優選的,n=10_15, m=3_9 ;本發明的一個優選方式中,n=12, m=7 ;
[0013]所述的單堿基連接單元為識別一個堿基的單堿基識別模塊及兩端經二類限制性內切酶酶切形成的第一粘性末端和第二粘性末端;任意兩組單堿基連接單元的粘性末端堿基序列一一對應相同;對單堿基連接單元進行順序編號,第k個單堿基連接單元I的第二粘性末端與第k+Ι個單堿基連接單元I的第一粘性末端互補,I ^m-1o所述的單堿基識別模塊為編碼SEQ ID N0.1~4所示氨基酸序列的核苷酸。
[0014]所述的雙堿基連接單元為識別雙堿基的雙堿基識別模塊及兩端經二類限制性內切酶酶切形成的第一粘性末端和第二粘性末端;任意兩組雙堿基連接單元的粘性末端堿基序列一一對應相同。所述的雙堿基識別模塊為編碼SEQ ID N0.5~20所示氨基酸序列的核苷酸。
[0015]每組雙堿基連接單元分為兩個部分,第一部分的雙堿基連接單元數量為P個,對第一部分雙堿基連接單元進行順序編號,第i個雙堿基連接單元的第二粘性末端與第i+1個雙堿基連接單元的第一粘性末端互補,I < i ( P-1 ;第二部分的雙堿基連接單元數量為q個,對第二部分雙堿基連接單元進行順序編號為P+2~n+1,第j個雙堿基連接單元的第二粘性末端與第j+Ι個雙堿基連接單元的第一粘性末端互補,P+2 ( j ( n+1。其中,每組第一部分的最后一個雙堿基連接單元(即第P個雙堿基連接單元)的第二粘性末端與編號為第P+1個單堿基連接單元的第一粘性末端互補。每組第二部分的第一個雙堿基連接單元(即編號為P+2的雙堿基連接單元)的第一粘性末端與編號第P+1個單堿基連接單元的第二粘性末端互補,1〈P+1 Sm。各組雙堿基識別模塊的粘性末端堿基序列一一對應相同。優選的,識別4種堿基的第p+1個單堿基識別模塊的核苷酸序列如SEQ ID N0.21~24所示。其中含有酶切位點,在連接后可酶切測序。
[0016](2)將所選的n+1個連接單元依次相連,每個連接單元第二粘性末端與下一個連接單元的第一粘性末端互補。
[0017]具體為,將n+1個連接單元用DNA連接酶連接在一起形成TALENs識別模塊,每個連接單元第二粘性末端與下一個連接單元的第一粘性末端互補。連接單元可以是單堿基連接單元或雙堿基連接單元;TALENs識別模塊的第p+1個連接單元為前述單元庫中第p+1個單堿基連接單元,TALENs識別模塊的第m+1個至最后一個(即第n+l個)連接單元為雙堿基連接單元,TALENs識別模塊的第I至第P位、以及第p+2至第n+1位的連接單元為雙堿基連接單元、單堿基連接單元或者雙堿基連接單元與單堿基連接單元的混合。通過上述方法,所得到的TALENs識別模塊可識別至2*n+2-m至2*n+l個堿基。
[0018]本發明的一個優選方式中,n=12, m=7 ;多模塊單元庫中,雙堿基連接單元數量為12個,分為兩組,編號為I~P和p+2~13,其第一粘性末端和第二粘性末端的堿基序列分別如SEQ ID N0.45~44+2Xp和SEQ ID N0.47+2Xp~70的第9-12個堿基所示。單堿基連接單元為7個,編號為I~7的單堿基連接單元第一粘性末端和第二粘性末端的堿基序列分別如SEQ ID N0.21-34的第9_12個堿基所示。編號為p+1的單堿基連接單元第一粘性末端與編號為P的雙堿基連接單元第二粘性末端互補,第二粘性末端與編號為P+2的雙堿基連接單元第一粘性末端互補。p=2、3、4、5、6或7。
[0019]從單元庫中選擇13個雙堿基或單堿基連接單元,用DNA連接酶連接在一起,相鄰的兩個連接單元之間以粘性末端互補。連接單元可以是單堿基連接單元或雙堿基連接單元;TALENs識別模塊的第p+1個連接單元為前述單元庫中第P+1個單堿基連接單元,TALENs識別模塊的第8個至第13個連接單元為雙堿基連接單元,TALENs識別模塊的第I至第P個、以及第P+2至第7個的連接單元為雙堿基連接單元、單堿基連接單元或者雙堿基連接單元與單堿基連接單元的混合。通過上述方法,可以一次連接識別長度為19-25個堿基的TALENs。再加上TALENs載體上已有的0_2個識別模塊,利用上述的文庫和連接方法可以一次連接能識別19-27個堿基的TALENs。
[0020]I1.或者,轉錄激活子樣效應因子核酸酶質粒的構建方法,包括連接TALENs識別模塊的連接,步驟包括:
[0021](I)根據所需識別目的基因靶序列的堿基序列,從多模塊單元庫中選擇對應的連接單元;
[0022]所述的多模塊單元庫包括:16組X (n+1)個雙堿基連接單元和4組Xm個單堿基識別連接單元,所需識別的堿基序列長度為2*n+2-m至2*n+2 ;n=10-15, m=3_9 ;
[0023]所述的單堿基連接單元為識別一個堿基的單堿基識別模塊及兩端經二類限制性內切酶酶切形成的第一粘性末端和第二粘性末端;任意兩組單堿基連接單元的粘性末端堿基序列一一對應相同;對單堿基連接單元進行順序編號,第k個單堿基連接單元的第二粘性末端與第k+Ι個單堿基連接單元I的第一粘性末端互補,I ^ k ^ m-Ι ;所述的單堿基識別模塊為編碼SEQ ID N0.1~4所示氨基酸序列的核苷酸;
[0024]所述的雙堿基連接單元為識別兩個堿基的雙堿基識別模塊及兩端經二類限制性內切酶酶切形成的第一粘性末端和第二粘性末端;任意兩組雙堿基連接單元的粘性末端堿基序列一一對應相同;所述的雙堿基識別模塊為編碼SEQ ID N0.5~20所示氨基酸序列的核苷酸。
[0025]對每組雙堿基連接單元進行編號,第L個雙堿基連接單元的第二粘性末端與第L+1個雙堿基連接單元的第一粘性末端互補,I ^L^n;
[0026]每個單堿基或雙堿基連接單元的粘性末端有4個堿基,沿5’_3’方向,正義鏈的第一粘性末端的第2~4個堿基編碼亮氨酸,正義鏈的第I個堿基為甘氨酸密碼子的最后一個堿基;正義鏈的最后兩個堿基為甘氨酸密碼子的前兩個堿基?’沿5’ -3’方向,反義鏈的第二粘性末端的第I~3個堿基的互補序列編碼亮氨酸,第4個堿基的互補序列為甘氨酸密碼子的最后一個堿基;反義鏈的前兩個堿基的互補序列為甘氨酸密碼子的前兩個堿基;[0027]同一組的所有雙堿基連接單元或單堿基連接單元兩端粘性末端的序列互不相同;
[0028](2 )用二類限制性內切酶和DNA連接酶,將連接單元重組接入TALENs載體中,用消化線性DNA的酶進行消化處理,得到轉錄激活子樣效應因子核酸酶質粒。
[0029]通過上述方法,可以一次連接識別長度為19-26個堿基的TALENs。再加上TALENs載體上已有的0-2個識別模塊,利用上述的文庫和連接方法可以一次連接能識別19-28個堿基的TALENs。 [0030]優選的,步驟(1)中的多模塊單元庫中,連接單元連接在載體上。體為PMD18-T載體、topo載體、pucl9載體或pucl8。
[0031]優選的,步驟(2)中,同一體系內,用二類限制性內切酶和DNA連接酶,將連接單元重組接入TALENs載體中,用消化線性DNA的酶進行消化處理,得到轉錄激活子樣效應因子核酸酶質粒。優選的,TALENs載體上還可以含有O個、I個或2個識別模塊(所得到的轉錄激活子樣效應因子核酸酶質粒識別的堿基數量比所連連模塊的識別數量多0-2個);并且TALENs載體中帶有DNA切割蛋白基因,以及位于轉錄激活子樣效應因子氨基酸序列框架N端和C端的堿基序列(分別如SEQ ID N0.49和50)所示。
[0032]優選的,所述二類限制性內切酶為Bsa 1、BsmBl、BsmAl、Bbsl,DNA連接酶為T4連接酶,消化線性DNA的酶為Plasmid-Safe核酸酶。
[0033]所述TALEN 載體可選用 pEFla-NLS-TALE backbone-Fokl(R)-pA 或pEFla-NLS-TALE backbone-Fokl (L) -1RES-PURO-ρΑ,所述 DNA 切割蛋白基因即為 Fokl。TALENs載體預先經二類限制性內切酶酶切,酶切產生的兩個粘性末端分別與第I個堿基識別模塊的第一粘性末端以及編號為第n+1個連接單元第二粘性末端互補。
[0034]通過上述操作,各識別模塊之間能夠順序連接;同時,識別模塊之間、識別模塊與載體之間一旦連接上,就無法被二類限制性內切酶(type IIs enzyme)再切開,所以把幾個片斷和載體放在同一體系里,用二類限制性內切酶(type IIs enzyme)和DNA連接酶邊切邊連,即可一步把TALEN連接成功。
[0035]一種轉錄激活子樣效應因子多模塊連接單元庫I,包括16組Xn個雙堿基連接單元和4組Xm個單堿基識別連接單元,同一組的所有雙堿基連接單元或單堿基連接單元兩端粘性末端的序列互不相同;優選的,m=3-9, n=10-15。
[0036]所述的單堿基連接單元為識別一個堿基的單堿基識別模塊及兩端經二類限制性內切酶酶切形成的第一粘性末端和第二粘性末端;任意兩組單堿基連接單元的粘性末端堿基序列一一對應相同;對單堿基連接單元進行順序編號,第k個單堿基連接單元的第二粘性末端與第k+Ι個單堿基連接單元I的第一粘性末端互補,I ^ k^m-l0所述的單堿基識別模塊為編碼SEQ ID N0.1~4所示氨基酸序列的核苷酸。
[0037]所述的雙堿基連接單元為識別雙堿基的雙堿基識別模塊及兩端經二類限制性內切酶酶切形成的第一粘性末端和第二粘性末端;任意兩組雙堿基連接單元的粘性末端堿基序列一一對應相同。所述的雙堿基識別模塊為編碼SEQ ID N0.5~20所示氨基酸序列的核苷酸。
[0038]每組雙堿基連接單元分為兩個部分,第一部分的雙堿基連接單元數量為P個,對第一部分雙堿基連接單元進行順序編號,第i個雙堿基連接單元的第二粘性末端與第i+1個雙堿基連接單元的第一粘性末端互補,I < i ( P-1 ;第二部分的雙堿基連接單元數量為q個,對第二部分雙堿基連接單元進行順序編號為P+2~n+1,第j個雙堿基連接單元的第二粘性末端與第j+Ι個雙堿基連接單元的第一粘性末端互補,P+2 ( j ( n+1。其中,每組第一部分的最后一個雙堿基連接單元(即第P個雙堿基連接單元)的第二粘性末端與編號為第P+1個單堿基連接單元的第一粘性末端互補。每組第二部分的第一個雙堿基連接單元(即編號為P+2的雙堿基連接單元)的第一粘性末端與編號第P+1個單堿基連接單元的第二粘性末端互補,Kp+l m。
[0039]4組單堿基連接單元或單堿基識別模塊所編碼的氨基酸分別識別A、T、C、G四種堿基。雙堿基連接單元或雙堿基識別模塊所編碼的氨基酸分別識別AA、AT、AC、AG、TT、TA、TC、TG、CC、CA、CT、CG、GG、GA、GT、GC。同一組的雙堿基識別模塊或單堿基識別模塊識別同一對堿基或同一個堿基。
[0040]每個連接單元的粘性末端有4個堿基,沿5’_3’方向,正義鏈的第一粘性末端的第2~4個堿基編碼亮氨酸,正義鏈的第I個堿基為甘氨酸密碼子的最后一個堿基;正義鏈的最后兩個堿基為甘氨酸密碼子的前兩個堿基。沿5’ -3’方向,反義鏈的第二粘性末端的第I~3個堿基的互補序列編碼亮氨酸,第4個堿基的互補序列為甘氨酸密碼子的最后一個堿基;反義鏈的前兩個堿基的互補序列為甘氨酸密碼子的前兩個堿基。當相鄰的連接單元通過互補的粘性末端連接到一起時,連接單元之間的正義鏈編碼的氨基酸依次為甘氨酸和亮氨酸。
[0041]優選的,n=12, m=7,即連接單元庫中,每組雙堿基連接單元的數量為12,第一部分雙堿基連接單元的數量為P,編號為I~P ;第二部分雙堿基連接單元的數量為12-P,編號為p+2~13 ;單堿基連接單元的數量為7,編號為I~7 ;編號為p+1的單堿基連接單元第一粘性末端與編號為P的雙堿基連接單元第二粘性末端互補,第二粘性末端與編號為P+2的雙堿基連接單元第一粘性末端互 補。p=2、3、4、5、6或7,本發明的一個優選實施例中,p=4。
[0042]編號為I~P和p+2~13的雙堿基連接單元第一粘性末端和第二粘性末端的堿基序列分別如SEQ ID N0.45~44+2Xp和SEQ ID N0.47+2Xp~70的第9-12個堿基所示。編號為I~7的單堿基連接單元第一粘性末端和第二粘性末端的堿基序列分別如SEQID N0.45~-58的第9_12個堿基所示。
[0043]從文庫中選取13個雙堿基或單堿基連接單元,以互補的粘性末端依次連接在一起,可以一次連接識別長度為19-25個堿基的TALENs。再加上TALENs載體上已有的0_2個識別模塊,利用上述的文庫和連接方法可以一次連接能識別19-27個堿基的TALENs。
[0044]或者,一種轉錄激活子樣效應因子多模塊連接單元庫II,包括16組X (n+1)個雙堿基連接單元和4組Xm個單堿基識別連接單元,同一組的所有雙堿基連接單元或單堿基連接單元兩端粘性末端的序列互不相同,m=3-9, n=10-15 ;
[0045]所述的單堿基連接單元為識別一個堿基的單堿基識別模塊及兩端經二類限制性內切酶酶切形成的第一粘性末端和第二粘性末端;任意兩組單堿基連接單元的粘性末端堿基序列一一對應相同;對單堿基連接單元進行順序編號,第k個單堿基連接單元的第二粘性末端與第k+Ι個單堿基連接單元I的第一粘性末端互補,I ^ k ^ m-Ι ;所述的單堿基識別模塊為編碼SEQ ID N0.1~4所示氨基酸序列的核苷酸;
[0046]所述的雙堿基連接單元為識別雙堿基的雙堿基識別模塊及兩端經二類限制性內切酶酶切形成的第一粘性末端和第二粘性末端;任意兩組雙堿基連接單元的粘性末端堿基序列一一對應相同;對每組雙堿基連接單元進行編號,第L個雙堿基連接單元的第二粘性末端與第L+1個雙堿基連接單元的第一粘性末端互補,I ^ L ^ η ;所述的雙堿基識別模塊為編碼SEQ ID N0.5~20所示氨基酸序列的核苷酸。
[0047]每個連接單元的粘性末端有4個堿基,沿5’_3’方向,正義鏈的第一粘性末端的第2~4個堿基編碼亮氨酸,正義鏈的第I個堿基為甘氨酸密碼子的最后一個堿基;正義鏈的最后兩個堿基為甘氨酸密碼子的前兩個堿基。沿5’ -3’方向,反義鏈的第二粘性末端的第I~3個堿基的互補序列編碼亮氨酸,第4個堿基的互補序列為甘氨酸密碼子的最后一個堿基;反義鏈的前兩個堿基的互補序列為甘氨酸密碼子的前兩個堿基。當相鄰的連接單元通過互補的粘性末端連接到一起時,連接單元之間的正義鏈編碼的氨基酸依次為甘氨酸和亮氨酸。優選的,n=12, m=7 ;編號為I~7的單堿基連接單元第一粘性末端和第二粘性末端的堿基序列分別如SEQ ID N0.45-58的第9_12個堿基所示;編號為I~13的雙堿基連接單元第一粘性末端和第二粘性末端的堿基序列分別如SEQ ID N0.45~70的第9_12個堿基所示。
[0048]由于連接單元本身無法進行很好的保存和擴增,因此將連接單元插入相應的原始載體當中,構成環狀結構,以便于保存和擴增。所述的DNA片段可以是重組質粒,也可以是PCR擴增產物,當選擇為重組質粒時,原始載體可以是PMD18-T載體、topo、puc 19、或puc 18。
[0049]用二類限制性內切酶和DNA連接酶,將連接單元重組接入TALENs載體中,用消化線性DNA的酶進行消化處理,得到轉錄激活子樣效應因子核酸酶質粒。優選的,在TALENs載體上含有O個、I個或2個識別模塊;并且TALENs載體中帶有DNA切割蛋白基因,以及位于轉錄激活子樣效應因子氨基酸序列框架N端和C端的堿基序列。所述的位于轉錄激活子樣效應因子氨基酸序列框架N端和C端的堿基序列分別如SEQ ID N0.49和50所示。
[0050]單個連接單元(識別單堿基或者雙堿基)的結構如圖5所示,粘性末端有4個堿基,沿5’_3’方向,正義鏈的第2~4個堿基編碼亮氨酸,正義鏈的第I個堿基為甘氨酸密碼子的最后一個堿基,正義鏈的最后兩個堿基為甘氨酸密碼子的前兩個堿基,反義鏈的第I~3個堿基的互補序列編碼亮氨酸。
[0051]本發明所述的單堿基識別模塊是指該Tale連接單元編碼的氨基酸能夠識別堿基A、T、C、G0所述的雙堿基識別模塊是指Tale連接單元編碼的氨基酸能夠識別AA、AT、AC、AG、TT、TA、TC、TG、CC、CA、CT、CG、GG、GA、GT、GC。同一組的雙堿基識別模塊或單堿基識別模塊識別同一對堿基或同一個堿基。
[0052]上述連接單元庫I的構建方法為,在單堿基識別模塊和雙堿基識別模塊兩端加上酶切位點。步驟包括:編號為I~m的單堿基連接單元的構建:以含有單堿基識別模塊的載體為模板,以m對引物序列F1A1~Fm/Rm為引物對進行PCR擴增。編號為I~p和p+2~n+1的雙堿基連接單元的構建:以含有雙堿基識別模塊的載體為模板,以η對引物序列F1/R1~Fp/Rp、Fp+2/Rp+2~Fn+1/Rn+1為引物對進行PCR`擴增。
[0053]本發明優選的方案中,m=7, n=12 ;這一單元庫構建方法為,編號為I~7的單堿基連接單元的構建:以7對引物序列F1A1~F7/R7為引物對進行PCR擴增(正向引物F1~F7的核苷酸序列包括:二類限制性內切酶位識別序列、第一粘性末端序列以及與編碼識別模塊核苷酸序列前10~20位堿基互補的核苷酸序列;反向引物R1~R7的核苷酸序列包括:二類限制性內切酶位識別序列、第二粘性末端序列以及與編碼識別模塊核苷酸序列前10~20位堿基互補的核苷酸序列;優選的F1A1~F7/R7為SEQ ID N0.21~34的序列)。每組雙堿基連接單元的構建:編號為I~P和p+2~13的雙堿基連接單元的構建:分別以引物序列F1~Fp和Fp+2~F13為引物對進行PCR擴增(正向引物F1~Fp和Fp+2~F13的核苷酸序列包括:二類限制性內切酶位識別序列、第一粘性末端序列以及與編碼識別模塊核苷酸序列前10~20位堿基互補的核苷酸序列;反向引物R1~Rp和Rp+2~R13的核苷酸序列二類限制性內切酶位識別序列、第二粘性末端序列以及與編碼單堿基識別模塊核苷酸序列前10~20位堿基互補的核苷酸序列,優選的R1~Rp和Rp+2~R13為SEQ ID N0.21~20+2 X P 和 SEQ ID N0.23+2 Xp ~46 的序列)。[0054]每個DNA片段包含一個堿基序列互異的連接單元,連接單元兩末端與DNA片段的其余部分連接處有二類限制性內切酶酶切位點。也就是說,利用二類限制性內切酶(typeHs enzyme)對DNA片段進行酶切,就可以得到所述的Tale連接單元。
[0055]以20ul連接體系計為:載體:40-200ng ;識別模塊:50_200ng/識別模塊;二類限制性內切酶:0.5-2 μ L ;DNA連接酶:0.5_2ul μ L ;DNA連接酶緩沖液:2 μ L ;雙蒸水:補足至20 μ L0
[0056]連接程序優選為:37°C5min ;16°C 10min,20 個循環;80°C,lOmin。
[0057]所述的帶有DNA切割蛋白以及轉錄激活子樣效應因子氨基酸序列框架N端和C端的載體的堿基序列可以如SEQ ID N0.49和50所示。
[0058]步驟(2)中,所述的消化線性質粒的質粒酶可以為Plasmid-Safe核酸酶。因為連接時會有連接不完全現象,只連接上部分片段,這種連接不完全的線性DNA會通過重組的方式降低連接的效率,因此,在轉化之前用可以消化線性DNA的酶Plasmid-Safe?ATP_Dependent DNase (Epicentre,貨號:E3105K)進行消化處理,可以消化線性DNA,提高連接效率。
[0059]本發明以24種識別模塊為基礎,通過設計合適的引物,可以構建得到含有220個連接單元(含有能識別一個或兩個堿基的識別模塊、二類限制性內切酶位點)的DNA文庫;通過該DNA文庫,可以把識別模塊的酶切和連接放在一個反應中進行,避免了識別模塊酶切后的純化、再連接步驟,提高了生產效率,改進了生產工藝,可以實現一步將19-25個識別模塊快速連接起來,得到連接轉錄激活子樣效應因子核酸酶(TALEN)質粒。
[0060]本發明可一次連接能識別19-26個堿基的TALEN,再加上質粒所帶的0_2個識別模塊,所得到的載體可以識別19-28個堿基。
[0061]本發明方法使用的識別單元是質粒或質粒的PCR產物,避免了保存酶切產物中遇到的末端單鏈尾巴破壞和降解的問題,且操作步驟更簡單,更節約成本。
【專利附圖】
【附圖說明】
[0062]圖1為實施例1中,DNA文庫中192個雙堿基連接單元示意圖;
[0063]圖2為實施例1中,DNA文庫中24個單堿基連接單元I和4個單堿基連接單元II示意圖。
[0064]圖3 為最終載體 pEFla-NLS-TALE backbone-Fokl (R)-pA 不意圖。
[0065]圖4 為最終載體 pEFla-NLS-TALE backbone-Fokl (L) -1RES-PURO-ρΑ 示意圖。[0066]圖5為25個識別模塊連接時的連接步驟示意圖。
[0067]圖6為本發明連接單元的結構示意圖。
[0068]圖7為不同數量的識別堿基的相應單雙模的選擇塊示意圖。
[0069]圖8為實施例2中的電泳圖(圈中為酶切正確的克隆);其中,中間為200kb的DNAMarker, marker左面為連接二的酶切圖,右面為連接一的酶切圖。
【具體實施方式】
[0070]以下實施例中所使用的技術,包括PCR擴增與檢測、細胞轉染等分子生物學技術,以及細胞培養、檢測技術等,除非特別說明,均為本領域內的技術人員已知的常規技術;所使用的儀器設備、試劑和細胞系等,除非是本說明書特別注明,均為一般本領域的研究和技術人員可以通過公共途徑獲得的。
[0071]實施例1 TALENs識別模塊之間的連接及重組載體的構建
[0072]本發明的一個優選方式中,n=12,m=7,p=4 ;多模塊單元庫中,雙堿基連接單元數量為12個,分為兩組,編號為I~4和6~13,其第一粘性末端和第二粘性末端的堿基序列分別如SEQ ID N0.45-52和SEQ ID N0.55-70的第9_12個堿基所示。每組單堿基連接單元為7個,編碼的氨基酸序列如編號為I~7的單堿基連接單元第一粘性末端和第二粘性末端的堿基序列分別如SEQ ID N0.45-58的第9_12個堿基所示。編號為5的單堿基連接單元第一粘性末端與編號為4的雙堿基連接單元第二粘性末端互補,第二粘性末端與編號為6的雙堿基連接單元第一粘性末端互補。編號為5的單堿基連接單元中,識別模塊核苷酸序列如SEQ ID N0.41~44所示。
[0073]1、24個識別模塊(modular)的獲得
[0074](1)分別識別4個單堿基八、1\(:、6以及16個雙堿基AA、AT、AC、AG、TA、TT、TC、TG、CA、CT、CC、CG、GA、GT、GC、GG 的 20 個識別模塊 N1、NG、HD、NN、NI5、NG5、HD5、NN5、N1-NI,N1-NG, N1-HD, N1-NN、NG-NI, NG-NG, NG-HD, NG-NN、HD-NI, HD-NG, HD-HD, HD-NN、NN-NI,NN-NG、NN-HD、NN-NN的氨基酸序列如表1,分別如SEQ ID Ν0:1_20所示;編碼識別4個單堿基 A、T、C、G 和 A5、T5、C5、G5 以及 16 個雙堿基 AA、AT、AC、AG、TA、TT、TC、TG、CA、CT、CC、CG、GA、GT、GC、GG 的 20 個識別模塊 N1、NG、HD、NN、N1-NI, N1-NG, N1-HD, N1-NN、NG-N1、NG-NG、NG-HD, NG-NN、HD-N1、HD-NG, HD-HD, HD-NN、NN-N1、NN-NG, NN-HD、NN-NN、NI5、NG5、HD5、NN5的上述模塊的堿基序列見表2,分別如SEQ ID NO: 21-44所示。
`[0075]表1
[0076]
【權利要求】
1.轉錄激活子樣效應因子核酸酶質粒的構建方法,包括連接TALENs識別模塊的連接,步驟包括: (1)根據所需識別目的基因靶序列的堿基序列,從多模塊單元庫中選擇對應的連接單元; 所述的多模塊單元庫包括: 16組Xn個雙堿基連接單元和4組Xm個單堿基識別連接單元,所需識別的堿基序列長度為 2*n+2_m 至 2*n+l ;n=10_15, m=3_9 ; 所述的單堿基連接單元為識別一個堿基的單堿基識別模塊及兩端經二類限制性內切酶酶切形成的第一粘性末端和第二粘性末端;任意兩組單堿基連接單元的粘性末端堿基序列一一對應相同;對單堿基連接單元進行順序編號,第k個單堿基連接單元的第二粘性末端與第k+Ι個單堿基連接單元I的第一粘性末端互補,I≤k≤m-Ι ; 所述的單堿基識別模塊為編碼SEQ ID N0.1~4所示氨基酸序列的核苷酸; 所述的雙堿基連接單元為識別兩個堿基的雙堿基識別模塊及兩端經二類限制性內切酶酶切形成的第一粘性末端和第二粘性末端;任意兩組雙堿基連接單元的粘性末端堿基序列對應相同; 所述的雙堿基識別模塊為編碼SEQ ID N0.5~20所示氨基酸序列的核苷酸; 每組雙堿基連接單元分為兩個部分,第一部分的雙堿基連接單元數量為P個,對第一部分雙堿基連接單元進行順序編號,第i個雙堿基連接單元的第二粘性末端與第i+Ι個雙堿基連接單元的第一粘性末端互補,i^p-1 ;第二部分的雙堿基連接單元數量為q個,對第二部分雙堿基連接單元進行順序編號為P+2~n+1,第j個雙堿基連接單元的第二粘性末端與第j+Ι個雙堿基連接單元的第一粘性末端互補,P+2 ( j ( n+1 ;其中,每組第一部分的最后一個雙堿基連接單元的第二粘性末端與編號為第P+1個單堿基連接單元的第一粘性末端互補;每組第二部分的第一個雙堿基連接單元的第一粘性末端與編號第P+1個單堿基連接單元的第二粘性末端互補,Kp+l ( m ;各組雙堿基識別模塊的粘性末端堿基序列--對應相同; 每個單堿基或雙堿基連接單元的粘性末端有4個堿基,沿5’-3’方向,正義鏈的第一粘性末端的第2~4個堿基編碼亮氨酸,正義鏈的第I個堿基為甘氨酸密碼子的最后一個堿基;正義鏈的最后兩個堿基為甘氨酸密碼子的前兩個堿基?’沿5’ -3’方向,反義鏈的第二粘性末端的第I~3個堿基的互補序列編碼亮氨酸,第4個堿基的互補序列為甘氨酸密碼子的最后一個堿基;反義鏈的前兩個堿基的互補序列為甘氨酸密碼子的前兩個堿基; 同一組的所有雙堿基連接單元或單堿基連接單元兩端粘性末端的序列互不相同; (2)用二類限制性內切酶和DNA連接酶,將連接單元重組接入TALENs載體中,用消化線性DNA的酶進行消化處理,得到轉錄激活子樣效應因子核酸酶質粒。
2.轉錄激活子樣效應因子核酸酶質粒的構建方法,包括連接TALENs識別模塊的連接,步驟包括: (I)根據所需識別目的基因靶序列的堿基序列,從多模塊單元庫中選擇對應的連接單元; 所述的多模塊單元庫包括:16組X (n+1)個雙堿基連接單元和4組Xm個單堿基識別連接單元,所需識別的堿基序列長度為2*n+2-m至2*n+2 ;n=10-15, m=3_9 ;所述的單堿基連接單元為識別一個堿基的單堿基識別模塊及兩端經二類限制性內切酶酶切形成的第一粘性末端和第二粘性末端;任意兩組單堿基連接單元的粘性末端堿基序列一一對應相同;對單堿基連接單元進行順序編號,第k個單堿基連接單元的第二粘性末端與第k+1個單堿基連接單元I的第一粘性末端互補,1≤k≤m-1 ; 所述的單堿基識別模塊為編碼SEQ ID N0.1~4所示氨基酸序列的核苷酸; 所述的雙堿基連接單元為識別兩個堿基的雙堿基識別模塊及兩端經二類限制性內切酶酶切形成的第一粘性末端和第二粘性末端;任意兩組雙堿基連接單元的粘性末端堿基序列對應相同; 所述的雙堿基識別模塊為編碼SEQ ID N0.5~20所示氨基酸序列的核苷酸; 對每組雙堿基連接單元進行編號,第L個雙堿基連接單元的第二粘性末端與第L+1個雙堿基連接單元的第一粘性末端互補,1≤L≤n ; 每個單堿基或雙堿基連接單元的粘性末端有4個堿基,沿5’-3’方向,正義鏈的第一粘性末端的第2~4個堿基編碼亮氨酸,正義鏈的第1個堿基為甘氨酸密碼子的最后一個堿基;正義鏈的最后兩個堿基為甘氨酸密碼子的前兩個堿基?’沿5’ -3’方向,反義鏈的第二粘性末端的第1~3個堿基的互補序列編碼亮氨酸,第4個堿基的互補序列為甘氨酸密碼子的最后一個堿基;反義鏈的前兩個堿基的互補序列為甘氨酸密碼子的前兩個堿基; 同一組的所有雙堿基連接單元或單堿基連接單元兩端粘性末端的序列互不相同; (2)用二類限制性內切酶和DNA連接酶,將連接單元重組接入TALENs載體中,用消化線性DNA的酶進行消化處理,得到轉錄激活子樣效應因子核酸酶質粒。
3.權利要求1所述轉錄激活子樣效應因子核酸酶質粒的構建方法,其特征在于,所述多模塊單元庫中,識別4種堿基的第p+1個單堿基識別模塊的核苷酸序列如SEQ IDN0.41~44所示。
4.權利要求1所述轉錄激活子樣效應因子核酸酶質粒的構建方法,其特征在于,步驟(2)中,將n+1個連接單元用DNA連接酶連接在一起形成TALENs識別模塊,每個連接單元第二粘性末端與下一個連接單元的第一粘性末端互補;連接單元選自單堿基連接單元或雙堿基連接單元;TALENs識別模塊的第p+1個連接單元為所述單元庫中第p+1個單堿基連接單元,TALENs識別模塊的第m+1個至最后一個連接單元為雙堿基連接單元,TALENs識別模塊的第I至第P位、以及第p+2至第n+1位的連接單元為雙堿基連接單元、單堿基連接單元或者雙堿基連接單元與單堿基連接單元的混合。
5.權利要求1或3所述轉錄激活子樣效應因子核酸酶質粒的構建方法,其特征在于,n=12, m=7, p=2、3、4、5、6 或 7。
6.權利要求5所述所述轉錄激活子樣效應因子核酸酶質粒的構建方法,其特征在于,編號為I~7的單堿基連接單元第一粘性末端和第二粘性末端的堿基序列分別如SEQ IDN0.45~58的第9-12個堿基所示;編號為1~p和p+2~13的雙堿基連接單元第一粘性末端和第二粘性末端的堿基序列分別如SEQ ID N0.45~44+2Xp和SEQ ID N0.47+2Xp~70的第9-12個堿基所示。
7.權利要求2所述轉錄激活子樣效應因子核酸酶質粒的構建方法,其特征在于,步驟(2)中,將n+1個連接單元用DNA連接酶連接在一起形成TALENs識別模塊,每個連接單元第二粘性末端與下一個連接單元的第一粘性末端互補;連接單元選自單堿基連接單元或雙堿基連接單元。
8.權利要求2或4所述轉錄激活子樣效應因子核酸酶質粒的構建方法,其特征在于,n=12,m=7 ;編號為I~7的單堿基連接單元第一粘性末端和第二粘性末端的堿基序列分別如SEQ ID N0.45~38的第9_12個堿基所示;編號為I~13的雙堿基連接單元第一粘性末端和第二粘性末端的堿基序列分別如SEQ ID N0.45~70的第9_12個堿基所示。
9.權利要求1或2所述轉錄激活子樣效應因子核酸酶質粒的構建方法,其特征在于,所述二類限制性內切酶為Bsa 1、BsmBl、BsmAl、Bbsl,DNA連接酶為T4連接酶,消化線性DNA的酶為Plasmid-Safe核酸酶。
10.權利要求1或2所述轉錄激活子樣效應因子核酸酶質粒的構建方法,其特征在于,步驟(2)中,所述的TALENs載體上還含有O個、I個或2個識別模塊;并且TALENs載體中帶有DNA切割蛋白基因,以及位于轉錄激活子樣效應因子氨基酸序列框架N端和C端的堿基序列。
11.權利要求1或2所述轉錄激活子樣效應因子核酸酶質粒的構建方法,其特征在于,TALEN 載體 SpEFla-NLS-TALE backbone-Fokl(R)-pA 或 pEFla-NLS-TALEbackbone-Fokl (L)-1RES-PURO-pA,所述DNA切割蛋白基因為Fokl ;所述的位于轉錄激活子樣效應因子氨基酸序列框架N端和C端的堿基序列分別如SEQ ID N0.51和52所示。
12.權利要求1或2所述轉錄激活子樣效應因子核酸酶質粒的構建方法,其特征在于,步驟(1)中,所述的單元庫中,連接單元連接在載體上。
13.一種轉錄激活子樣效應因子連接單元庫,其特征在于,包括16組Xη個雙堿基連接單元和4組Xm個單堿基識別連接單元,同一組的所有雙堿基連接單元或單堿基連接單元兩端粘性末端的序列互不相同,m=3-9, n=10-15 ; 所述的單堿基連接單元為識別一個堿基的單堿基識別模塊及兩端經二類限制性內切酶酶切形成的第一粘性末端和第 二粘性末端;任意兩組單堿基連接單元的粘性末端堿基序列一一對應相同;對單堿基連接單元進行順序編號,第k個單堿基連接單元的第二粘性末端與第k+Ι個單堿基連接單元I的第一粘性末端互補,I≤k≤m-Ι ; 所述的單堿基識別模塊為編碼SEQ ID N0.1~4所示氨基酸序列的核苷酸; 所述的雙堿基連接單元為識別雙堿基的雙堿基識別模塊及兩端經二類限制性內切酶酶切形成的第一粘性末端和第二粘性末端;任意兩組雙堿基連接單元的粘性末端堿基序列--對應相同; 所述的雙堿基識別模塊為編碼SEQ ID N0.5~20所示氨基酸序列的核苷酸; 每組雙堿基連接單元分為兩個部分,第一部分的雙堿基連接單元數量為P個,對第一部分雙堿基連接單元進行順序編號,第i個雙堿基連接單元的第二粘性末端與第i+Ι個雙堿基連接單元的第一粘性末端互補,l^i^p-Ι ;第二部分的雙堿基連接單元數量為q個,對第二部分雙堿基連接單元進行順序編號為P+2~n+1,第j個雙堿基連接單元的第二粘性末端與第j+Ι個雙堿基連接單元 的第一粘性末端互補,P+2 ( j ( n+1 ;其中,每組第一部分最后一個雙堿基連接單元的第二粘性末端與編號為第P+1個單堿基連接單元的第一粘性末端互補;每組第二部分的第一個雙堿基連接單元的第一粘性末端與編號第P+1個單堿基連接單元的第二粘性末端互補,Kp+l ( m ; 每個單堿基或雙堿基連接單元的粘性末端有4個堿基,沿5’-3’方向,正義鏈的第一粘性末端的第2~4個堿基編碼亮氨酸,正義鏈的第I個堿基為甘氨酸密碼子的最后一個堿基;正義鏈的最后兩個堿基為甘氨酸密碼子的前兩個堿基?’沿5’ -3’方向,反義鏈的第二粘性末端的第I~3個堿基的互補序列編碼亮氨酸,第4個堿基的互補序列為甘氨酸密碼子的最后一個堿基;反義鏈的前兩個堿基的互補序列為甘氨酸密碼子的前兩個堿基;同一組的所有雙堿基連接單元或單堿基連接單元兩端粘性末端的序列互不相同。
14.一種轉錄激活子樣效應因子連接單元庫,其特征在于,包括16組X (n+1)個雙堿基連接單元和4組Xm個單堿基識別連接單元,同一組的所有雙堿基連接單元或單堿基連接單元兩端粘性末端的序列互不相同,m=3-9, n=10-15 ; 所述的單堿基連接單元為識別一個堿基的單堿基識別模塊及兩端經二類限制性內切酶酶切形成的第一粘性末端和第二粘性末端;任意兩組單堿基連接單元的粘性末端堿基序列一一對應相同;對單堿基連接單元進行順序編號,第k個單堿基連接單元的第二粘性末端與第k+Ι個單堿基連接單元I的第一粘性末端互補,1≤k≤m-1 ; 所述的單堿基識別模塊為編碼SEQ ID N0.1~4所示氨基酸序列的核苷酸; 所述的雙堿基連接單元為識別雙堿基的雙堿基識別模塊及兩端經二類限制性內切酶酶切形成的第一粘性末端和第二粘性末端;任意兩組雙堿基連接單元的粘性末端堿基序列一一對應相同;對每組雙堿基連接單元進行編號,第L個雙堿基連接單元的第二粘性末端與第L+1個雙堿基連接單元的第一粘性末端互補,1 ≤L≤n; 所述的雙堿基識別模塊為編碼SEQ ID N0.5~20所示氨基酸序列的核苷酸; 每個單堿基或雙堿基連接單元的粘性末端有4個堿基,沿5’-3’方向,正義鏈的第一粘性末端的第2~4個堿基編碼亮氨酸,正義鏈的第I個堿基為甘氨酸密碼子的最后一個堿基;正義鏈的最后兩個堿基為甘氨酸密碼子的前兩個堿基?’沿5’ -3’方向,反義鏈的第二粘性末端的第I~3個堿基的互補序列編碼亮氨酸,第4個堿基的互補序列為甘氨酸密碼子的最后一個堿基;反義鏈的前兩個堿基的互補序列為甘氨酸密碼子的前兩個堿基同一組的所有雙堿基連接單元或單堿基連接單元兩端粘性末端的序列互不相同。
15.權利要求13或14所述轉錄激活子樣效應因子連接單元庫,其特征在于,識別4種堿基的第P+1個單堿基識別模塊的核苷酸序列如SEQ ID N0.41~44所示。
16.權利要求13所述轉錄激活子樣效應因子連接單元庫,其特征在于,n=12,m=7,p=2、3、4、5、6 或 7。
17.權利要求16所述的轉錄激活子樣效應因子連接單元庫,其特征在于,編號為I~7的單堿基連接單元第一粘性末端和第二粘性末端的堿基序列分別如SEQ ID N0.45-58的第9-12個堿基所示;編號為I~P和P~13的雙堿基連接單元第一粘性末端和第二粘性末端的堿基序列分別如SEQ ID N0.45~44+2Xp和SEQ ID N0.47+2Xp~70的第9-12個堿基所示。
18.權利要求14所述轉錄激活子樣效應因子連接單元庫,其特征在于,n=12,m=7。
19.權利要求13或14所述轉錄激活子樣效應因子連接單元庫,其特征在于,所述單堿基或雙堿基連接單元中兩端的第一粘性末端和第二粘性末端通過二類限制性內切酶酶切形成。
20.權利要求19所述多模塊單元庫,其特征在于,所述二類限制性內切酶為Bsa1、BsmBl、BsmAl 或 Bbsl。
21.權利要求16或17所述轉錄激活子樣效應因子連接單元庫的構建方法,其特征在于,步驟包括: 編號為I~7的單堿基連接單元的構建:以7對引物序列F1A1~F7/R7為引物對進行PCR擴增;所述正向引物F1~F7的核苷酸序列包括:二類限制性內切酶位識別序列、第一粘性末端序列以及與編碼識別模塊核苷酸序列前10~20位堿基互補的核苷酸序列;所述反向引物R1~R7的核苷酸序列包括:二類限制性內切酶位識別序列、第二粘性末端序列以及與編碼單堿基識別模塊核苷酸序列前10~20位堿基互補的核苷酸序列;如SEQ IDN0.45~58所示; 雙堿基連接單元的構建:編號為I~13的雙堿基連接單元的構建:分別以引物序列F1/R1~Fp/Rp和Fp+2/Rp+2~F13/R13為引物對進行PCR擴增;所述正向引物F1~Fp和Fp+2~F13的核苷酸序列包括:二類限制性內切酶位識別序列、第一粘性末端序列以及與編碼識別模塊核苷酸序列前10~20位堿基互補的核苷酸序列;所述反向引物R1~Rp和Rp+2~R13的核苷酸序列二類限制性內切酶位識別序列、第二粘性末端序列以及與編碼單堿基識別模塊核苷酸序列前10~20位堿基互補的核苷酸序列。
22.權利要求21所述轉錄激活子樣效應因子連接單元庫的構建方法,其特征在于,所述F1A1~F7/R7的核苷酸序列如SEQ ID N0.45~58所示~Fp/Rp和Fp+2/Rp+2~F13/R13的核苷酸序列如SEQ ID N0.45~24+2 Xp和SEQ ID N0.47+2 Xp~70所示。
23.權利要求18所述轉錄激活子樣效應因子連接單元庫的構建方法,其特征在于,步驟包括: 編號為I~7的單堿基連接單元的構建:以7對引物序列F1A1~F7/R7為引物對進行PCR擴增;所述正向引物F1~F7的核苷酸序列包括:二類限制性內切酶位識別序列、第一粘性末端序列以及與編碼識`別模塊核苷酸序列前10~20位堿基互補的核苷酸序列;所述反向引物R1~R7的核苷酸序列包括:二類限制性內切酶位識別序列、第二粘性末端序列以及與編碼識別模塊核苷酸序列前10~20位堿基互補的核苷酸序列; 雙堿基連接單元的構建:編號為I~13的雙堿基連接單元的構建:分別以引物序列F1/R1~F13/R13為引物對進行PCR擴增;所述正向引物F1~F13的核苷酸序列包括:二類限制性內切酶位識別序列、第一粘性末端序列以及與編碼識別模塊核苷酸序列前10~20位堿基互補的核苷酸序列;所述反向引物Ri~R13的核苷酸序列包括:二類限制性內切酶位識別序列、第二粘性末端序列以及與編碼識別模塊核苷酸序列前10~20位堿基互補的核苷酸序列。
24.權利要求23所述轉錄激活子樣效應因子連接單元庫的構建方法,其特征在于,所述F1A1~F7/R7的核苷酸序列如SEQ ID N0.45~58所示~F13/R13的核苷酸序列如 SEQ ID N0.45 ~70 所示。
25.一種多模塊DNA庫,其特征在于,包括權利要求13~24任一項所述的轉錄激活子樣效應因子連接單元庫的所有連接單元數量相同的DNA片段;每個DNA片段包含一個不同的連接單元;每個連接單元兩末端與DNA片段的其余部分連接處有二類限制性內切酶酶切位點;所述DNA片段為重組質粒或PCR擴增產物。
26.權利要求25所述的單模塊DNA文庫,其特征在于,所述重組質粒的原始載體為PMD18-T 載體、topo 載體、pucl9 載體或 pucl8。
【文檔編號】C12N15/66GK103695452SQ201310659979
【公開日】2014年4月2日 申請日期:2013年12月9日 優先權日:2013年12月9日
【發明者】吳昭, 孫文頁 申請人:上海斯丹賽生物技術有限公司