鑒定樣品中微生物種類的方法及其試劑盒的制作方法
【專利說明】鑒定樣品中微生物種類的方法及其試劑盒
[0001] 序列表的納入
[0002] 序列表是ASCII文件夾中的30587_ST25.txt文件,大小19KB,2014年4月24創 建,通過EFS-Web提交到美國專利商標局,在本專利中作為引用文獻納入。
【背景技術】
[0003] 全球近乎103°的微生物基因組,在不同的環境和宿主環境中,微生物群系之間和 系內的多樣性眾所周知(Huseetal.,PLoSGenetics4(11) :el000255(2008))?因為復雜 的多樣性,確定微生物群系的組成對于現有的技術是一個挑戰。首先,自然界中只有很少的 微生物可以成功培養,其次測序條件等也面臨著挑戰。在一個微生物群系中不同的微生物 組成以及它們之間的同源性使確定它們的種類很困難。
[0004] 原核生物的核糖體由兩個亞基組成:30S的小亞基和50S的大亞基,共同組成了 70S的核糖體,其中S是沉降速度單位。30S的小亞基是由16S核糖體RNA和21種蛋白質 組成的,而50S的大亞基包含5S和23S兩種核糖體RNA。16SrRNA基因的超變區序列可以 用來鑒定細菌的種類。16SDNA序列在微生物學研究中普遍用來鑒定原核生物和其他生物 的多樣性及它們之間的進化關系。
[0005] 微生物的16SRNA基因被用來鑒定不同環境比如土壤和胃腸道樣品中的微生物種 類。然而如何提高微生物的檢測,比如提升在少量樣品中微生物的檢測能力,利用16S高保 守和低保守序列鑒定和區分微生物,提高測序的精確性等都是需要解決的問題。
【發明內容】
[0006] 本專利公開的是用來鑒定一個樣品中多個微生物的上游引物組合和下游引物組 合。每個引物組合包括一條或多條引物,至少一個引物組合中是包括多條引物序列的。每 條引物中有域-特異性序列能夠結合到細菌或古生菌核糖體16SDNAV3,V4,或V5附近的 保守結構域域。每條引物同時又是多重引物,這些多重引物之間相互重合并能結合到相同 的保守結構域域,每條引物至少和另一條引物域特性序列的5'端有1-3個核苷酸的移碼, 因此在聚合酶鏈式反應(PCR)中通過上下游引物的組合其產物也是移碼的。
[0007] 同一個引物組合中的每條引物在結構域特異性序列的5'起始點旁邊含有至少一 個隨機堿基。引物組合中的每條引物的結構域特異性序列中包括至少一個簡并堿基。有些 例子中,上游引物和下游引物都有多條相互間有重合的引物。
[0008] 本發明得到的擴增子包括⑴V3-V4區;(ii)V4-V5區;(iii)V4區和(iv)V3,V4, V5區.
[0009] 例如,上游引物組合中每條引物的結構域特異性序列能夠結合在16SDNA的C2結 構域,下游引物組合中每條引物的結構域特異性序列能夠結合在16SDNA的C4結構域。這 些引物組合起來可以擴增出16SDNA的V3-V4區。又如:上游引物組合中每條引物的特異 性序列能夠結合在16SDNA的C3結構域,下游引物組合中每條引物的特異性序列能夠結合 在16SDNA的C5結構域.這些引物組合起來可以擴增出16SDNA的V4-V5區。
[0010] 在這些例子中,為了保證序列的成功測序,本專利公布的引物含有部分接頭序列。 在這些反應當中還含有一對接頭引物能夠和上述引物中的部分接頭序列互補,以及含有一 對通用引物能和接頭引物互補。
[0011] 提供一個例子:第一套上游的互相有重合的引物組,每條引物的結構域特異性序 列能夠結合到16SDNA的C2結構域,第二套上游的互相有重合的引物組,每條引物的結構 域特異性序列能夠結合到16SDNA的C3區;第一套下游的互相有重合的引物組,每條引物 的結構域特異性序列能夠結合到16SDNA的C4結構域,第二套下游的互相有重合的引物 組,每條引物的結構域特異性序列能夠結合到16SDNA的C5結構域。當這些引物結合起來 進行擴增反應,這些移碼擴增產物中有的擴增子能夠覆蓋V4區,有的能夠覆蓋V3-V4區,有 的能夠覆蓋V4-V5區,還有的能夠覆蓋V3-V4-V5區。
[0012] 在另一個例子中,寡聚核苷酸引物的序列可以從SEQIDNO:2到SEQIDNO:20中 選擇。在本例中,可以從SEQIDNOS:2,3,4,5,6,7,8,16,17中選擇2條或多條作為上游引 物,從SEQIDNOS:9,10,11,12,13,14,15,18,19, 20中選擇2條或多條作為下游引物。也 可以從3£〇10勵3:2,3,4,5,16中選擇2條或多條作為上游引物,從3£〇10勵3:9,10,11, 13,18中選擇2條或多條作為下游引物,用來擴增V3-V4區。也可以從SEQIDN0S:6,7,8, 17中選擇2條或多條作為上游引物,從SEQIDNOS: 14,15,19, 20中選擇2條或多條作為 下游引物,用來擴增V4-V5區。
[0013] 本專利公開的是如何鑒定樣品中多個微生物的方法。方法流程如下:(a)利用上 游引物組合和下游引物組合擴增樣品DNA,每個引物組合可以包含一條或多條引物,至少有 一條引物包含多重引物每條引物包括特異性序列,該特異性序列可以結合到細菌和古生菌 16SDNA的V3,V4,V5區旁邊的保守結構域。包含多重引物的引物組合中的引物都是重合 的,都可以結合到同一個保守結構域。引物組合中的每條引物和至少另外一條引物特異性 序列的5'端有1-3個核苷酸的移碼,得到的擴增子序列是移碼的,(b)從擴增的DNA產物 中純化出移碼產物,(c)測序,(d)通過物種特異性16SDNA序列鑒定微生物種類。
[0014] 在本專利中,引物組合的每條含有多重引物的結構域特異性序列5'端含有至少一 個隨機核苷酸,而且引物的結構域特異性序列含有至少一個簡并核苷酸。一些例子中,上游 引物和下游引物都有多條相互重合的引物。
[0015] 本專利公布的擴增步驟(a)包括使用了 4套引物:第一套上游引物互相重合,包含 特異性序列能夠結合到16SDNA的C2結構域,第二套上游引物互相重合,能夠結合到16S DNA的C3結構域,第一套下游引物互相重合,包含特異性序列能夠結合到16SDNA的C4結 構域,第二套上游引物互相重合,能夠結合到16SDNA的C5結構域。方法的第二步,是用這 些引物一起進行擴增,產生移碼的擴增子,有的能覆蓋V4區,有的能覆蓋V3-V4區,有的能 覆蓋V4-V5區,有的能覆蓋V3-V4-V5區。
[0016] 在一個特殊的例子中,擴增步驟(a)還包括(i)使用第一套相互重合的上游引物 和第一套相互重合的下游引物擴增樣品DNA中的一部分得到能夠覆蓋V3和V4區的擴增 子;(ii)使用第二套相互重合的上游引物和第二套相互重合的下游引物擴增樣品DNA中的 另一部分得到能夠覆蓋V4和V5區的擴增子;(iii)將(i)和(ii)的產物混合;(iv)擴增 混合的產物得到移動的擴增子,有的能覆蓋V4區,有的能覆蓋V3-V4區,有的能覆蓋V4-V5 區,有的能覆蓋V3-V4-V5區。
[0017] 在另一個特殊的例子中,每條引物包含至少部分接頭序列。在本例中,接頭引物和 通用引物加入到第(iii)步的反應產物中,然后進行第(iv)步DNA擴增。在另一個特殊的 例子中,DNA擴增步⑴和(ii)包括8-12個PCR循環,DNA擴增步驟(iv)包括5-7個PCR 循環.最后,擴增產物用固相表面測序法測序。
【附圖說明】
[0018]Fig.I. 16SrDNA的保守結構域和可變區示意圖。
[0019]Fig. 2.能夠結合到C2,C3,C4和C5結構域的引物挑選出來,測試對于一個樣品 中微生物基因組的覆蓋度。
[0020] Fig. 3.利用基因特異性引物,接頭引物和通用引物進行擴增。
[0021] Figs. 4A-4D. (A,C)用本發明的引物擴增,產物利用固相高通量方法測序,沒有使 用PhiX高復雜度文庫DNA。(B,D)使用舊的方法進行引物擴增,產物利用固相高通量方法 測序,含有PhiX高復雜度文庫DNA,A和B是QScore分布圖,表明讀長(reads)錯誤率低 (每IO3或1000堿基中錯誤率小于1)。C和D是熱點圖(heatmap),表示測序結果的質量。 所有的例子中,新方法和舊方法的測序數據質量類似,但是新方法不需要浪費深度在高復 雜度文庫DNA上,舊方法需要測序時摻入PhiX高復雜度文庫DNA.
[0022] Figs. 5A-5B本專利公布的新引物和方法與傳統方法使用在樣品VX1344(A)和 VX1345⑶的對比結果。
[0023]Figs. 6A-6B本專利公布的新引物和方法與傳統方法使用在樣品VX1348(A)和 VX1349(B)的對比結果。
[0024]Figs. 7A-7B.本專利公布的新引物和方法與傳統方法使用在樣品VX1346(A)和 VX1347⑶的對比結果。
[0025]Fig. 8?比較使用已有的單引物對(黑色)與新方法和新引物組合(灰色)從樣品 VX1344,VX1345,VX1346,VX1347中得到的分類單位數目。每個樣品,新方法和新引物對得到 的分類數目是已有方法引物的2倍(VX1346,VX1347),3倍(VX1345),甚至4倍(VX1344)。
[0026] 本專利細節
[0027] 本專利公布的是可以鑒定樣品中多個微生物的特殊設計的寡聚核苷酸引物,和能 夠從不同樣品中發現微生物的新方法。
[0028] "樣品"可以是包含一種或多種微生物的任何樣品,或者是需要闡明微生物種類的 某個樣品。樣品可以是生物樣品,比如來自人或動物的臨床樣品,或者環境樣品,比如從水, 土壤,空氣,建筑物和設備得到的樣品。
[0029] 這里的"微生物"包括但不限于,細菌,古生菌,真菌,原生動物等等。
[0030] 本專利公布的方法能夠通過物種特異性的16S核糖體DNA(16SrDNA或16SDNA) 區分和辨別微生物的種類。
[0031]16S測序利用E. coli 16S DNA序列作為標準品。E. coli 16S RNA序列在GenBank 的序列號是J01859,在這里命名為SEQ ID NO :1.
[0032] SEQ ID NO:1
況。E.coli16SDNA序列/SEQIDN0:1中的可變區("V"區)如下:68_ 100( "VI"),137-226( "V2"),440-496( "V3"),590-651 ( "V4"),829-856( "V5"), 1000-1036( "V6"),1119-1156( "V7"),1244-1295( "V8"),和 14351465( "V9")。
[0073] 保守結構域位于可變區/V區的外側,分布位置大概如下:1-67( "C1"), 227-439( "C2"),497-589 ( "C3"),,652-828 ( "C4"),857-999 ( "C5"),1037-1118 ( "C6"), 1157-1243 ("C7"),1296-1434 ("C8"),和 1466-1542 ("C9")。與E.coli16SDNA序類似, 真細菌中下列區域是高度保守的:104-120, 314-368, 505-539,683-707, 764-806,879-893, 909-940,949-964,969-985,1048-1114,和 1177-1197。與£.(:〇11165 0嫩序相似,古細 菌中下列區域也是高度保守的:344-367, 506-547, 779-806,882-936,947-973,1043-1