一種用于擴增子測序的建庫方法
【專利摘要】本發明涉及高通量測序【技術領域】,公開了一種用于擴增子測序的建庫方法,包括以下步驟:(1)PCR擴增富集目標區域:對待測樣品基因組DNA,針對目標區域設計引物序列,引物序列在正向引物和反向引物的5’端設有隨機堿基序列和接頭序列,進行PCR擴增,回收PCR產物;(2)PCR擴增引入測序接頭:將上步所得的PCR產物進行混樣,設計引物序列,引物序列包含與上步中的接頭序列互補的序列,對混樣進行PCR擴增,回收PCR產物,即得到用于擴增子測序的DNA文庫。本發明的建庫方法不但降低了擴增子測序的建庫時間和成本,還能夠降低對測序結果進行生物信息學分析錯誤的發生,提高分析結果的準確性和真實性。
【專利說明】一種用于擴增子測序的建庫方法
【技術領域】
[0001] 本發明涉及分子生物學【技術領域】,特別涉及一種用于擴增子測序的快速建庫方 法。
【背景技術】
[0002] 隨著高通量測序技術的發展,測序成本的降低,使測序技術逐漸成為基礎生物學 研究和醫學檢測的常規實驗方法。從人類基因組計劃構建了第一個基因組圖譜開始,新一 代測序技術通過全基因組測序構建了大量常規物種的基因組圖譜,也促進了測序技術的高 速發展。但全基因組測序結構復雜,數據量大,周期長,費用高,限制了它的發展。
[0003] 同時,有的研究者只對特定的基因組區域感興趣,這時就只需對相應區域進行測 序研究,不需要對全基因組進行測序。擴增子測序(Amplicon Sequencing)就是只對目標區 域進行測序研究的一項測序方法。通過設計感興趣的基因組區域的引物,進行PCR擴增,對 目標區域進行富集,然后針對特定長度的PCR產物或者捕獲的片段進行建庫,高通量測序, 分析序列中的變異。擴增子測序能根據研究者目的,針對目標區域進行高覆蓋度的測序,還 可以檢測到低頻突變。采用擴增子測序,研究者可以對基因組中感興趣的關鍵區域進行重 點研究。這種高針對性的方法可以高效的發現,驗證和篩選關注區域的基因組變異。相比 全基因組測序,擴增子測序對目標區域有更準確快速的研究,適用于大量樣本的特定基因 組區域研究。
[0004] 目前的擴增子測序都是通過常規的建庫方法,在通過PCR擴增富集到目標區域 后,進行混樣,然后進行末端修復和加 A,再加接頭,純化樣品,跑膠回收目的條帶,然后PCR 擴增,最后再跑膠回收主帶,該種常規的建庫方法步驟繁瑣,浪費時間,工作量大,不利于大 量樣品的測序建庫。
【發明內容】
[0005] 本發明的目的在于提供一種適用于擴增子測序的快速建庫方法,以簡化擴增子測 序中建庫步驟的操作過程,降低擴增子測序建庫的時間和成本,同時保證不影響測序質量。
[0006] 本發明所提供的用于擴增子測序的建庫方法包括以下步驟:
[0007] (l)PCR擴增富集目標區域:對待測樣品基因組DNA,針對目標區域設計引物序列, 該引物序列在正向引物和反向引物的5'端設有隨機堿基序列和接頭序列,進行PCR擴增, 回收PCR產物;
[0008] (2)PCR擴增引入測序接頭:將步驟⑴所得到的PCR產物進行混樣,設計引物序 列,該引物序列包含與步驟(1)中的接頭序列互補的序列,對混樣進行PCR擴增,回收PCR 產物,即得到用于擴增子測序的DNA文庫。
[0009] 本發明的用于擴增子測序的建庫方法,在步驟(1)之前還包括提取待測樣品基因 組DNA的步驟,該提取步驟可采用本領域內常規方法進行,例如使用Omega公司的SOIL DNA KIT進行提取;此外,在步驟(2)之后還包括測序并對測序數據進行生物信息學分析的步 驟,本發明建庫后的上機測序可以通過一代測序平臺進行,也可通過高通量測序平臺進行, 例如ABI公司的3730XL測序平臺或Illumina公司的miseq測序平臺等。進行生物信息學 分析的步驟主要是指通過質控和barcode得到優化數據,然后聚OTU,物種注釋,α多樣性 分析(稀釋曲線、shannon曲線、物種累積曲線;chao、simpson等多樣性指數),β多樣性 分析(pea、pcoa聚類;系統進化樹,物種分布、顯著性差異、環境因子梯度分析、各種分組比 較等)。
[0010] 本發明所提供的用于擴增子測序的建庫方法的流程圖如附圖1所示。
[0011] 具體來說,本發明的步驟(1)進行了第一次PCR擴增,以完成富集目標區域的操 作。在針對測序目標區域進行引物設計時:引物總長度<59bp,退火溫度55°C?75°C。在 正向引物和反向引物的5'端設有隨機堿基序列和接頭序列,其中隨機堿基的個數可設計為 1?10個,在本發明的【具體實施方式】部分采用的是1?5個隨機堿基的方案。接頭序列是 與測序儀相配套的序列,例如illumina的"Y"字型的序列。隨機堿基序列和接頭序列的設 計主要達到以下三個方面的目的:(1)引入區分樣本標簽;(2)引入去除嵌合體序列標簽; (3)引入測序接頭,方便測序。最后,回收PCR產物時可采用凝膠電泳法切膠回收目的條帶。
[0012] 本發明的步驟(2)進行了第二次PCR擴增,以完成引入測序接頭、建成文庫的操 作。首先,在將上述第一次PCR的產物進行混樣后,還包括磁珠純化的步驟,采用磁珠純化 比一般的過柱純化速度快,可節省實驗時間。例采用Agencourt AMPure XP進行。磁珠純化 步驟之后,進行設計第二次PCR引物序列和對混樣進行擴增的步驟。在第二次PCR的引物 序列中,在正向引物的5'端帶有P5序列;在反向引物的5'端帶有Index序列和P7序列, 這樣的引物設計為區分每一個文庫引入文庫標簽。在擴增完成之后,進行PCR產物的回收, 回收PCR產物時采用磁珠法或凝膠電泳法,即得到用于擴增子測序的DNA文庫。
[0013] 本發明還提供以上述方法所構建的用于擴增子測序的DNA文庫。
[0014] 本發明采用了兩步法建庫的方法構建擴增子測序文庫,與現有技術相比,具有如 下兩方面的優點:
[0015] 首先,目前現有技術中所采用的擴增子測序的建庫方法和普通的全基因組測序的 建庫方法類似,不但增加了建庫時間和成本,還增加了引入突變的可能。本發明的快速建庫 方法將PCR擴增富集到目標區域后的常規建庫方法改為一次PCR,然后用磁珠法純化PCR產 物,即可得到測序文庫。相比現有技術方案,本發明的整個建庫過程只用了兩次PCR,步驟簡 單,方便操作,使得擴增子建庫的時間由原來的3?4小時,縮短到0. 5小時,同時免去了建 庫試劑盒的成本,大大降低了擴增子測序建庫的時間和成本,提高了效率;且避開了常規建 庫中繁瑣的步驟可能引入的突變,與常規建庫相比兩步法建庫不會影響測序質量,其測序 質量更加準確精確。
[0016] 其次,在現有的擴增子測序建庫過程中,由于PCR的擴增反應,不可避免地形成了 嵌合體,使得在進行生物信息學分析時,在不能識別嵌合體的情況下,使得得到的UTR數據 中含有嵌合體的數據。采用本發明的兩步法建庫,在第一次PCR擴增時引入的特異序列為 嵌合體的識別提供了標簽,在進行生物信息學分析時,通過簡化擴增子測序建庫方法中使 用的標簽,可以識別出引入接頭的PCR擴增過程中產生的嵌合體,排除了由于建庫實驗的 PCR擴增過程產生的嵌合體對真實數據結果的影響,提高生物信息學分析的結果的準確性, 與現有的建庫方法相比,本發明得到的數據能夠降低生物信息學分析錯誤的發生,更加真 實地反應出樣品的實際情況,提高了生物信息學分析結果的準確性和真實性。
【專利附圖】
【附圖說明】
[0017] 圖1是本發明的用于擴增子測序的建庫方法流程圖;
[0018] 圖2是【具體實施方式】中PCR擴增富集目標區域步驟的樣品電泳圖;
[0019] 圖3是【具體實施方式】中PCR擴增引入測序接頭步驟的樣品電泳圖;
[0020] 圖4是以本發明方法所構建的文庫進行測序的結果圖;
[0021] 圖5是以傳統建庫方法所構建的文庫進行測序的結果圖;
[0022] 圖6是以本發明的建庫方法所得文庫的測序結果構建的進化樹;
[0023] 圖7是以傳統建庫方法所得文庫的測序結果構建的進化樹。
【具體實施方式】
[0024] 為使本發明的目的、技術方案和優點更加清楚,下面將結合附圖對本發明的各實 施方式進行詳細的闡述。然而,本領域的普通技術人員可以理解,在本發明各實施方式中, 為了使讀者更好地理解本申請而提出了許多技術細節。但是,即使沒有這些技術細節和基 于以下各實施方式的種種變化和修改,也可以實現本申請各權利要求所要求保護的技術方 案。
[0025] 實施例1
[0026] 首先按照常規方法使用Omega公司的SOIL DNA KIT,提取10個樣品的土壤基因組 DNA,步驟略。
[0027] -、PCR擴增富集目標區域(PCR-1):
[0028] i.引物設計
[0029] 1)測序區域為NF-NR ;
[0030] 2)在引物NF和NR的5'端設計獨特的堿基(N代表堿基序列)、Adapter序列;
[0031] 3)具體引物序列信息見表1 :
[0032] 正向引物 NF :SEQ ID No 1 ;
[0033] 反向引物 NR :SEQ ID No 2。
[0034] 表1 PCR-1擴增引物序列
[0035]
【權利要求】
1. 一種用于擴增子測序的建庫方法,其特征在于,包括以下步驟: (1) PCR擴增富集目標區域:對待測樣品基因組DNA,針對目標區域設計引物序列,所述 引物序列在正向引物和反向引物的5'端設有隨機堿基序列和接頭序列,進行PCR擴增,回 收PCR產物; (2) PCR擴增引入測序接頭:將步驟(1)所得到的PCR產物進行混樣,設計引物序列,所 述引物序列包含與步驟(1)中的接頭序列互補的序列,對混樣進行PCR擴增,回收PCR產 物,即得到用于擴增子測序的DNA文庫。
2. 根據權利要求1所述的用于擴增子測序的建庫方法,其特征在于,在所述步驟(2)之 后還包括測序并對測序數據進行生物信息學分析的步驟。
3. 根據權利要求1所述的用于擴增子測序的建庫方法,其特征在于,在所述步驟(1)之 前還包括提取待測樣品基因組DNA的步驟。
4. 根據權利要求1所述的用于擴增子測序的建庫方法,其特征在于,步驟(1)中回收 PCR產物時采用凝膠電泳法切膠回收目的條帶。
5. 根據權利要求1所述的用于擴增子測序的建庫方法,其特征在于,步驟(2)中在將 PCR產物進行混樣后還包括磁珠純化的步驟。
6. 根據權利要求1所述的用于擴增子測序的建庫方法,其特征在于,步驟(2)中的引物 序列中,在正向引物的5'端帶有P5序列;在反向引物的5'端帶有Index序列和P7序列。
7. 根據權利要求1所述的用于擴增子測序的建庫方法,其特征在于,步驟(2)中回收 PCR產物時采用磁珠法或凝膠電泳法。
8. 根據權利要求2所述的用于擴增子測序的建庫方法,其特征在于,所述測序步驟通 過一代測序平臺或高通量測序平臺進行。
9. 一種用于擴增子測序的DNA文庫,其根據權利要求1至8任一項所述的方法構建得 到。
【文檔編號】C40B50/06GK104153004SQ201410391037
【公開日】2014年11月19日 申請日期:2014年8月11日 優先權日:2014年8月11日
【發明者】林芹, 于丹, 李勝彬, 陳華, 陶曄, 曾亮 申請人:上海美吉生物醫藥科技有限公司