用于對已知序列兩側未知側翼序列測序的方法
【專利摘要】一種用于對已知序列兩側未知側翼序列測序的方法,包括構建文庫、側翼序列捕獲及測序三部分。采用了定點突變PCR的方法,在已知序列上設計合適的引物(不需有突變位點),以構建的文庫為模板,從文庫中眾多的質粒中篩選到含有已知序列位點的DNA片段,通過PCR方法在質粒庫中篩選出靶位點,進而得到插入序列為2Kb-5Kb,含有已知序列的質粒庫,并依此為靶點得到其兩側側翼序列。本發明提供的測序方法實現了對基因組的全貌獲取,解決了研究人員在對基因進行全面研究時無法對其全貌進行描述,進而無法精確研究其功能的技術限制,有利提高了相關研究的效率。
【專利說明】用于對已知序列兩側未知側翼序列測序的方法
【技術領域】
[0001]本發明涉及一種多聚核苷酸的測序方法,具體涉及一種對已知序列兩側未知側翼序列測序的方法,適用于從基因組文庫中對未知序列進行篩選。
【背景技術】
[0002]近年來測序技術發展迅猛,已成為生物學研究的重要手段。高通量測序技術的興起,使大規模低成本研究DNA序列成為可能。全基因組De novo測序也叫做基因組從頭測序,是指不依賴于任何已知基因組序列信息對某個物種的基因組進行測序,然后應用生物信息學手段對測序序列進行拼接和組裝,最終獲得該物種基因組序列圖譜。但全基因組由于數據龐大,結構復雜,給全序列的拼接和組裝造成了一定的困難。如果研究者感興趣的只是某一特定片段,全基因組測序周期長、費用高、冗余序列過多的問題就十分明顯。
[0003]染色體步移(Chromosome Walking)是一種重要的分子生物學研究技術,使用這種技術可以有效獲取與已知序列相鄰的未知序列。這種方法是從第一個重組克隆插入片段的一端分離出一個片段作為探針從文庫中篩選第二個重組克隆,該克隆插入片段含有與探針重疊順序和染色體的其他順序。從第二個重組克隆的插入片段再分離出末端小片段篩選第三個重組克隆,如此重復,得到一個相鄰的片段。這種方法步驟繁瑣,通量過低,只適用于小量測序要求,面對大批量的樣品和位點則無能為力。
[0004]目前對于已知序列兩側未知側翼的捕獲通常采用cDNA末端快速擴增技術(rapidamplification of cDNA ends, RACE),是基于PCR技術基礎上由已知的一段cDNA片段,通過往兩端延伸擴增從而獲得 完整的3'端和5'端的方法,可從低豐度的轉錄本中快速擴增cDNA的5'和3'末端。此方法利用逆轉錄、TdT加尾和PCR擴增等多步反應,得到5'或3'末端。還可以從兩個有相互重疊序列的3'和5' RACE產物中獲得全長cDNA,或者通過分析RACE產物的3'和5'端序列,合成相應引物來擴增mRNA的反轉錄產物,從而獲得全長cDNA。
[0005]RACE技術主要用于對cDNA的獲取,對于基因組范圍的未知序列捕獲作用有限。此方法步驟繁瑣,實際操作中還會受到多步酶促反應效率的限制,應用范圍有限;只能得到mRNA的序列,對mRNA前后的序列無法捕獲分析;依賴于高質量的反轉錄酶(具有通讀復雜二級結構的能力、具有較高的反應溫度)和高質量的RNA,對樣品要求較高。
[0006]對于全基因組范圍側翼序列捕獲及測序,研究者在進行研究時往往會遇到DNA序列只知道一部分的情況,在對基因進行全面研究時無法對其全貌進行描述,進而無法精確研究其功能。如果有方法能夠得到基因全序列甚至拼接處完整的基因組DNA序列,那么對于研究的進行將會是事半功倍的效用。但是在全基因組范圍內篩選含有已知位點的DNA序列是研究的難點所在。
【發明內容】
[0007]本發明的一個方面在于提供一種用于對已知序列兩側未知側翼序列測序的方法,從基因組文庫中對未知序列進行篩選。
[0008]本發明提供的用于對已知序列兩側未知側翼序列測序的方法,包括構建文庫、側翼序列捕獲及測序三部分。
[0009]文庫構建是將多聚核苷酸制成2Kb_5Kb的片段后,連接到質粒載體,然后轉入第一感受態細胞進行擴大培養,獲得混合質粒庫。
[0010]側翼序列捕獲是在未知序列附近的已知序列上設計PCR引物,并對混合質粒庫進行擴增,并將消化的擴增產物轉化入第二感受態細胞中,培養并獲得克隆。
[0011]測序是對獲得克隆進行測序,并利用生物信息學的手段,捕獲已知序列周圍的側翼序列。
[0012]本發明測序方法,其引物參照點突變引物設計的原則如下:
[0013](I)通常引物長度為25bp~45bp,優選引物長度為30bp~35bp。一般都是以擬突變的目標堿基為中心,在兩側加上一段序列,兩側的長度至少為Ilbp~12bp。若兩邊引物太短,很可能會造成突變實驗失敗,因為引物至少要Ilbp~12bp才能與模板搭上,而這種突變PCR要求引物的兩側都能與模板搭上,所以更優選的,引物兩側各設至少12bp,并且合成一條反向互補的引物。
[0014](2)引物的Tm值達到78°C (GC含量應大于40%)。Tm值計算公式:Tm=0.41 X (%ofGC) - 675/L+81.5,(L:引物堿基數;%of GC:引物 GC 含量)
[0015]一種具體的實 施方式,本發明提供的用于對已知序列兩側未知側翼序列測序的方法,包括以下步驟
[0016]首先,文庫構建:
[0017]I)將多聚核苷酸制成2Kb_5Kb的片段;2)將片段補平后,將平端連接到質粒載體;
3)將載體轉化入電轉感受態細胞;4)對電轉感受態細胞進行活化,在AMP抗性培養基中37°C進行擴大培養;5)將混合菌液庫提取質粒,獲得混合質粒庫。
[0018]其次,側翼序列捕獲:
[0019]I)在未知序列附近的已知序列上設計PCR引物;2)使用兩條引物擴增混合質粒庫;3)將擴增產物進行消化Ih~1.5h ;4)將消化產物轉化入感受態細胞中,涂板;5)過夜
培養后挑克隆。
[0020]最后,對得到的單克隆進行測序并分析測序結果,捕獲已知序列周圍的側翼序列。
[0021]本發明上述列舉的方式不局限所展示的方法。在構建文庫方法、側翼序列捕獲方法(PCR)、測序三個具體步驟的分別操作過程中可采用其他的方式,整體作用和流程不變。例如:構建文庫涉及的多聚核苷酸可為全基因組文庫,也可以是RNA文庫;再如:連接載體可以是PUC19,也可以是pUC18等質粒載體;又如:對擴增產物的消化可選擇使用dpnl酶或其它酶。
[0022]此外,對于最終質粒庫的測序,可以采用常規測序方法,也可以采用構建高通量測序途徑,即通過I)當最終得到的質粒數量較少時,可直接送一代測序得到相應序列;2)最終得到的質粒數量很多時,可將其進行二代高通量測序,得到最終數據。本領域技術人員從實驗條件、成本和效率的角度可以對這兩種方式自由選擇。
[0023]本發明的另一個方面在于提供一種對丹參基因組中已知序列兩側未知側翼序列測序的方法,精確、高效地捕獲丹參已知序列周圍的側翼序列,實現對其未知序列及其功能的探索。
[0024]一種具體的實施方式,本發明提供的用于對丹參基因組中已知序列兩側未知側翼序列測序的方法,包括以下步驟
[0025]首先,文庫構建:
[0026]I)將丹參基因組DNA制成小于5Kb的片段(主要集中在1.5Kb_4Kb) ;2)將片段補平后,將平端連接到質粒載體;3)將載體轉化入電轉感受態細胞;4)對電轉感受態細胞進行活化,在AMP抗性培養基中37 °C進行擴大培養;5)將混合菌液庫提取質粒,獲得混合質粒庫。
[0027]其次,側翼序列捕獲:
[0028]I)在未知序列附近的已知序列上設計PCR正向引物SEQ ID Nol和反向引物SEQID No2 ;2)使用兩條引物擴增混合質粒庫;3)將擴增產物使用dnpl酶進行消化Ih~1.5h ;
4)將消化產物轉化入感受態細胞中,涂板;5)過夜培養后挑克隆。
[0029]最后,對得到的單克隆進行測序并分析測序結果,捕獲已知序列周圍的側翼序列。
[0030]研究者在進行研究時往往會遇到DNA序列只知道一部分的情況,在對基因進行全面研究時無法對其全貌進行描述,進而無法精確研究其功能。如果有方法能夠得到基因全序列甚至拼接處完整的基因組DNA序列,那么對于研究的進行將會是事半功倍的效用。但是在全基因組范圍內篩選含有已知位點的DNA序列是研究的難點所在,本發明采用了定點突變PCR的方法,巧妙的將PCR應用于篩選,最終得到研究者想要的序列。
[0031]本發明采用了定點突變PCR的方法,在已知序列上設計合適的引物(不需有突變位點),以構建的文庫為模板,從文庫中眾多的質粒中篩選到含有已知序列位點的DNA片段,通過PCR方法在質粒庫中篩選出靶位點,進而得到插入序列為2Kb-5Kb,含有已知序列的質粒庫,并依此為靶點得到其兩側側翼序列。
[0032]本發明可以從全基因組文庫中進行篩選,范圍更大更廣闊;對樣品的質量要求不高;避開了多次PCR引入的突變,更加的準確精確;相比其他的技術方案只有一次酶反應過程,減少了酶促反應效率的限制;還可以一次性的對多位點進行檢測,簡潔方便。
[0033]本發明提供的測序方法實現了對基因組的全貌獲取,解決了研究人員在對基因進行全面研究時無法對其全貌進行描述,進而無法精確研究其功能的技術限制,有利提高了相關研究的效率。
【具體實施方式】
[0034]本發明以對丹參基因組中已知序列兩側未知側翼序列測序的方法為例,詳細描述本發明的技術方案。由這些【具體實施方式】,相關技術人員可以采用其它常規技術以實現本發明的發明目的,并作為一個整體包括在本發明的技術方案中。
[0035]丹參文庫的構建:
[0036]1.制取DNA樣品片段
[0037]I)取2 μ g質粒(DNA)于1.5mL離心管中,ddH20調整體積至100 μ L ;·[0038]2)超聲7秒;(注意:要求打斷后的樣品條帶在5Kb以下,主要集中在1.5Kb_4Kb,如果片段還是集中在5K以上,要繼續超聲打斷,打斷時間根據情況而定,一般2秒即可,打斷后的樣品同樣要進行電泳檢測)[0039]3)進行1%凝膠電泳檢測,以DL5000為Marker,進行DNA電泳,鑒定片段的長度。
[0040]I1.片段回收
[0041]1)采用1%瓊脂糖凝膠電泳,以DL5000作Marker,75V電泳至溴酚藍到膠的2/3處,一般電泳2h即可進行切膠回收;(樣品與樣品之間、樣品與Marker之間都要隔一個孔,防止樣品污染)
[0042]2)切膠回收對應Markerl.6k_4k的片段,用新的刀片切膠,每切一個樣品換一個新刀片;
[0043]3 )切下的膠塊放入已稱重后的專用的14mL搖菌管內,做好標記;
[0044]4)膠純化米用 QIAGEN Gel Extraction Kit Protocol 試劑盒;參照 QIAquick GelExtraction Kit Protocol ;
[0045]5)最后洗脫步驟加入43 μ L ddH20進行溶解。
[0046]II1.補平及回收
[0047]I)使用Fermentas的T4 DNA Polymerase, PCR儀16°C反應過夜,反應體系如下:
[0048]
【權利要求】
1.一種用于對已知序列兩側未知側翼序列測序的方法,其特征是包括構建文庫、側翼序列捕獲及測序三部分; 所述的文庫構建是將多聚核苷酸制成2Kb-5Kb的片段后,連接到質粒載體,然后轉入第一感受態細胞進行擴大培養,獲得混合質粒庫; 所述的側翼序列捕獲是在未知序列附近的已知序列上設計PCR引物,并對混合質粒庫進行擴增,并將消化的擴增產物轉化入第二感受態細胞中,培養并獲得克隆; 測序是對獲得克隆進行測序,并利用生物信息學的手段,捕獲已知序列周圍的側翼序列。
2.根據權利要求1所述的用于對已知序列兩側未知側翼序列測序的方法,其特征是所述的文庫構建步驟如下: I)將多聚核苷酸制成2Kb-5Kb的片段;2)將片段補平后,將平端連接到質粒載體;3)將載體轉化入電轉感受態細胞;4)對電轉感受態細胞進行活化,在AMP抗性培養基中37°C進行擴大培養;5)將混合菌液庫提取質粒,獲得混合質粒庫。
3.根據權利要求1所述的用于對已知序列兩側未知側翼序列測序的方法,其特征是所述的側翼序列捕獲步驟如下: I)在未知序列附近的已知序列上設計PCR引物;2)使用兩條引物擴增混合質粒庫;3)將擴增產物進行消化Ih~1.5h ;4)將消化產物轉化入感受態細胞中,涂板;5)過夜培養后挑克隆。
4.根據權利要求3所述的用于對已知序列兩側未知側翼序列測序的方法,其特征是所述的質粒載體為PUC19或pUC18。
5.根據權利要求1所述的用于對已知序列兩側未知側翼序列測序的方法,其特征是所述的消化使用dnpl酶。
6.根據權利要求1所述的用于對已知序列兩側未知側翼序列測序的方法,其特征是所述的多聚核苷酸為全基因組文庫或RNA文庫。
7.根據權利要求1所述的用于對已知序列兩側未知側翼序列測序的方法,其特征是所述的引物以擬突變的目標堿基為中心,在兩側加上一段序列,所述兩側的序列長度至少為Ilbp ~12bp。
8.根據權利要求1所述的用于對已知序列兩側未知側翼序列測序的方法,其特征是所述的引物Tm值達到78 °C。
9.一種用于對丹參基因組中已知序列兩側未知側翼序列測序的方法,包括以下步驟: 首先,文庫構建: I)將丹參基因組DNA制成小于5Kb的片段;2)將片段補平后,將平端連接到PUC19或PUC18質粒載體;3)將載體轉化入電轉感受態細胞;4)對電轉感受態細胞進行活化,在AMP抗性培養基中37°C進行擴大培養;5)將混合菌液庫提取質粒,獲得混合質粒庫; 其次,側翼序列捕獲: I)在未知序列附近的已知序列上設計PCR正向引物SEQ ID N0.1和反向引物SEQ IDN0.2 ;2)使用兩條引物擴增混合質粒庫;3)將擴增產物使用dnpl酶進行消化Ih~1.5h ;4)將消化產物轉化入感受態細胞中,涂板;5)過夜培養后挑克隆; 最后,對得到的單克隆進行測序并分析測序結果,捕獲已知序列周圍的側翼序列。
10.根據權利要求9所述的用于對丹參基因組中已知序列兩側未知側翼序列測序的方法, 其特征是所述的丹參基因組DNA制成的片段為1.5Kb-4Kb。
【文檔編號】C12Q1/68GK103667481SQ201310656384
【公開日】2014年3月26日 申請日期:2013年12月6日 優先權日:2013年12月6日
【發明者】林芹, 李靜, 宋澤世, 任一, 任紅燕 申請人:上海美吉生物醫藥科技有限公司