一種甲基化dna高通量測序接頭和引物設計方法
【專利說明】一種甲基化DNA高通量測序接頭和引物設計方法
[0001]
技術領域
[0002]本發明涉及的技術領域是基因組學、生物技術領域,特別涉及的是一種甲基化DNA高通量測序接頭和引物設計方法。具體而言包括:一種甲基化DNA高通量測序接頭和引物設計方法,其特征在于對于是否含酶切位點,非連接端突出結構類型和連接端類型,設計不同的接頭和引物,解決MeDIP與亞硫酸鹽翻轉導致序列改變之間的矛盾,能夠在不影響MeDIP的情況下,經亞硫酸鹽之后成功擴增DNA片段庫并能進行后續的常規建庫。
[0003]
【背景技術】
[0004]在高等真核生物基因組中,DNA甲基化是在不改變DNA堿基種類與數量的前提下使得被修飾DNA的空間結構發生改變導致基因的沉默或過度表達,從而使生物體表型呈現出多樣化。在癌細胞中,這些啟動子發生去甲基化,從而使得這些基因能夠表達。另外,甲基化水平的降低促使了某些基因的表達,會促進從良性擴增到惡性擴增的轉變。
[0005]DNA甲基化對基因表達模式以及基因組穩定性均起著至關重要的作用。鑒于DNA甲基化在人類疾病發生、發展過程中的重要作用,并且DNA甲基化修飾作用于全基因組水平,因此其檢測技術的發展左右著對甲基化的研究與認識,進而在很大程度上影響著研究者們對于人類疾病特別是癌癥相關疾病的研究。
[0006]目前,現有的基于測序儀的DNA甲基化檢測技術主要有直接亞硫酸氫鹽測序、MeDIP測序、MBD測序、酶切-亞硫酸氫鹽測序等幾種方法。
[0007]亞硫酸鹽直接測序法的主要問題在于海量數據分析問題。尤其是對于高等哺乳動物這種龐大基因組的測序數據分析,測序后對海量數據的拼接和重新比對,工作量巨大,工作步驟復雜。其次是測序成本問題。無法適應大多數分子生物學實驗室作為常用實驗技術的要求。
[0008]MeDIP測序和MBD測序法的主要問題在于該技術沒有在測序前進行亞硫酸氫鹽的磺酸化處理,必需對甲基化位點進行鑒定,大大增加了后續的工作量。
[0009]酶切-亞硫酸氫鹽測序的問題主要是酶切識別位點的固定性會導致片段大小的分布差異很大。因此,該方法使部分有生物學意義和功能的DNA甲基化不能被檢測到。
[0010]同時上述方法均都存在一個共同的問題,會致使大量無生物學功能的測序數據的產生。其原因在于在現有的建庫和測序方法中,基因組由大量重復序列組成的異染色質區域數據占據測序數據的很大比例,這是因為在待測基因中含有高甲基化CpG的重復序列區。因此,去除掉重復序列后只對功能區DNA的甲基化片段進行測序可大大節省測序成本。
[0011]無論上述哪種方法,輔助接頭均是在DNA甲基化檢測技術中的重要一環。輔助接頭是指:加入輔助接頭的目的是在DNA在進行MeDIP和亞硫酸鹽磺酸化后能經過PCR反應后使單鏈DNA變成雙鏈,從而能進行常規文庫制備輔助接頭的類型:根據DNA片段化的方法不同以及堿基修飾的不同的分類。目前,甲基化的亞硫酸鹽測序利用的甲基化的接頭。由于該接頭的所有胞嘧啶位點都是甲基化的,DNA片段在連接甲基化的測序接頭后經亞硫酸鹽翻轉之后,接頭的序列不發生改變,PCR之后仍和測序引物匹配。但是甲基化接頭影響了MeDIP實驗中甲基化抗體綁定甲基化片段,因此該接頭不適用于MeDIP后亞硫酸鹽甲基化測序。而如果在MeDIP前連接沒有甲基化的接頭,亞硫酸鹽翻轉會致使接頭序列發生改變而和測序引物不匹配。如果在亞硫酸鹽前不加接頭,雙鏈DNA經MeDIP和亞硫酸鹽之后變成單鏈DNA,并且序列發生改變,常規建庫所用的PairedEndadapter與PairedEndprimer無法在本實驗方法中使用。
[0012]因此本發明引入輔助接頭解決MeDIP與亞硫酸鹽翻轉導致序列改變之間的矛盾,能夠在不影響MeDIP的情況下,經亞硫酸鹽之后成功擴增DNA片段庫并能進行后續的常規建庫。同時在亞硫酸鹽PCR之后要把輔助接頭剪切去掉,以減少測序成本。
[0013]
【發明內容】
[0014]本發明目的是提供一種甲基化DNA高通量測序接頭和引物設計方法,從而解決目前輔助接頭存在的MeDIP與亞硫酸鹽翻轉導致序列改變之間的矛盾,同時在亞硫酸鹽PCR之后要把輔助接頭剪切去掉,以減少測序成本;
本發明是采取以下技術方案實現:
一種甲基化DNA高通量測序接頭和引物設計方法,其特征在于,輔助接頭為下述a-h中的至少一種:
a為不含酶切位點,非連接端為一條鏈突出結構,連接端為粘末端; b為含酶切位點,非連接端為一條鏈突出結構,連接端為粘末端; c為不含酶切位點,非連接端為樹杈結構,連接端為粘末端; d為含酶切位點,非連接端為樹權結構,連接端為粘末端; e為不含酶切位點,非連接端為一條鏈突出結構,連接端為平末端; f為含酶切位點,非連接端為一條鏈突出結構,連接端為平末端; g為不含酶切位點,非連接端為樹杈結構,連接端為平末端; h為含酶切位點,非連接端為樹杈結構,連接端為平末端;
輔助接頭,引物選自下述(ι)-(νι)中的至少一種:
(I)當輔助接頭為a和c時,引物設計成互補于經過亞硫酸氫鹽翻轉處理的輔助接頭的序列,且在5’末端額外連接有限制性內切酶的識別位點,所述的限制性內切酶的識別位點位于引物上,并保證該酶的切割位點位于輔助接頭與待測DNA連接點的上下游5bp的范圍內;與待測DNA片段連接方式為粘性末端連接;
(II)當輔助接頭為b和d時,輔在輔助接頭中靠近輔助接頭與待測DNA連接點的上游5bp內位置設計酶切位點,該酶切位點需符合以下三個特點:1)該酶切位點至少包含一個甲基化胞嘧啶;2)酶切位點內不含有非甲基化的胞嘧啶;3)該酶切位點不含有CpG 二核苷酸位點;與待測DNA片段連接方式為粘性末端連接;
(III)當輔助接頭為e和g時,引物設計成互補于經過亞硫酸氫鹽翻轉處理的輔助接頭的序列,且在5’末端額外連接有限制性內切酶的識別位點,所述的限制性內切酶的識別位點位于引物上,并保證該酶的切割位點位于輔助接頭與待測DNA連接點的上下游5bp的范圍內;與待測DNA片段連接方式為“T-A”連接。當進行酶切時,采用針對所設計的限制性內切酶的酶切位點的酶進行單酶切;
(IV)當輔助接頭為f和h時,在輔助接頭中靠近輔助接頭與待測DNA連接點的上游5bp內位置設計酶切位點,該酶切位點需符合以下三個特點:1)該酶切位點至少包含一個甲基化胞嘧啶;2)酶切位點內不含有非甲