073, 1094-1111,和 1225-1242(forreview,seeWangetal.,PLOS0NE4:e7401 (2009))〇
[0074] 現在普遍使用的鑒定樣品中微生物種類的方法是設計結合到可變區側翼的保守 結構域的探針和引物,通過擴增和測序可變區的序列,進而鑒定樣品中微生物的種類。通 常,設計的引物對只能擴增單一的可變區,比如V3,V4,或V5。一般一個擴增反應設計一對 引物。
[0075] 本發明公布的是以下組合物,通過特殊設計的引物和引物組合,PCR策略,測序單 個V區或多個V區來提高檢測的敏感性和特異性。設計的引物擴增得到的擴增子包括16S DNA的一個或多個V區。引物和引物組合包括一個或多個特點:能夠產生移碼的擴增子,弓丨 物的結構域特異性序列包括簡并堿基,引物結構域特異性序列的起始端有隨機核苷酸。該 方法包括公布的引物和引物組合,特別適用于高通量測序和鑒定樣品中的微生物。
[0076] 寡核苷酸引物組成
[0077] 本專利公布的組合物包括上游引物組合和下游引物組合,可以鑒定樣品中的微生 物。每條引物有特異性序列能夠結合到與細菌或古生菌16SDNA的V3,V4,或V5區域鄰近 16SDNA序列的保守結構域域。每個引物組合包括一條或多條引物,至少有一個引物組合包 含多條引物。包含多條引物的引物組合,引物之間是相互重合的,能夠結合到特定的保守結 構域。引物組合中,每條引物和引物組中的另外至少一條引物的結構域特異性序列的5'端 移碼了 1-3個核苷酸,當上游引物組合和下游引物組合結合起來擴增核酸,能夠得到閱讀 框移動的擴增子。
[0078] "引物"是能夠結合到目標核酸序列的寡核苷酸,作為DNA合成/擴增的始發點。 引物可以與或不與其它物質結合(比如,熒光基團,染料,磁珠,顆粒,核酸序列等等),用來 檢測,固定化或改造目標核酸序列。"引物組合"包括一條,兩條,三條或多條寡核苷酸結合 到核酸鏈的上游或下游的目標序列。如何設計標記的DNA和RNA探針或引物,結合到目標 核酸序列的退火條件請參照MolecularCloning:ALaboratoryManual,J.Sambrooket al. ,eds. , 2ndedition(ColdSpringHarborLaboratoryPress,1989),Chapters10 和 11,在本專利中作為參考文獻。
[0079] 本專利提供的組合物包括至少一組上游引物組合,一組下游引物組合。"上游"引 物能夠沿5' -3'的方向擴增模板DNA,"下游"引物能夠沿3' -5'的方向擴增模板DNA。一套 上游引物組合和一套下游引物組合一起擴增一個給定的目標序列。通過PCR擴增不斷"復 制"一個核酸分子得到的產物叫"擴增子"。每個引物組合包括一條或多條寡核苷酸引物, 比如 1,2, 3,4, 5,8,10,12,15,18, 20, 25 或多條引物,或者 1-5,6-10,11-15,16-20, 21-25, 26-30,31-35,36-40,41-45,46-50,或50或更多的引物。上游引物組合和下游引物組合中 至少有一組包含多條引物。在一些例子中,上游引物組合和下游引物組合都有多條引物。
[0080] 本專利公布的每條引物都有結構域特異性序列能夠結合到細菌或/和古生菌16S DNA的保守結構域。結構域特異性序列包含10-50個核苷酸,更優的是15-35個核苷酸,最 優的是15-30個核苷酸。當引物和目標核酸序列退火(堿基配對或形成Watson-Crick氫 鍵),引物能夠"互補"結合到目標核酸序列上。在嚴格退火條件下,寡核苷酸引物退火結合 到目標序列。本專利公布的引物和結構域特異性序列至少有70 %,75 %,80 %,85 %,90 %, 95%,98%或99%的同源性,有的引物和區結構域特異性序列同源性達到100% .因為即使 是保守結構域,種類之間也會有一些序列差異。互補可以是和參考序列E.coli16SDNA的 保守結構域,也可以是和其它微生物的16SDNA的保守結構域。
[0081]"嚴格的退火條件"是指在該條件下,核酸序列可以特異性地和目標序列而不是非 目標序列退火,這可以通過實驗驗證。"嚴格的條件"是指在特定的退火條件下核酸引物能 夠和目標序列(比如感興趣的特定核酸序列)。退火,退火條件參考JosephSambrooket al.,MolecularCloning,ALaboratoryManual,ColdSpringHarborLaboratoryPress, ColdSpringHarbor,N.Y. (2001)和Haymes,B.D.,etal.,NucleicAcidHybridization, APracticalApproach,IRLPress,Washington,D.C. (1985).
[0082]引物只能結合到最匹配的序列還是可以允許一個或多個堿基錯配,很大程度上取 決于退火溫度。退火溫度也稱為溶解溫度(Tm),在該溫度下,一半的特定DNA雙鏈解旋為單 鏈DNA。引物-模板DNA雙鏈的穩定性可以通過它們的Tni值衡量。引物的長度和序列是成 功擴增的重要參數。核酸雙鏈的溶解溫度隨著它的長度和GC含量的升高而升高。計算Tm 的公式如下,其中N代表引物的核苷酸個數,Formula1 :!"= 64. 9°C+41°Cx(引物中G和 C的數量-16.4)/N。
[0083] 除了退火溫度,鹽離子濃度(Na+,K+,特別是Mg2+)和其它添加物比如DMS0,甜菜堿 和甘油也會影響引物的特異性。PCR普遍在~50mM單價陽離子條件下進行。包括離子濃 度,計算Tm的公式如下Formula2 :Tm= 81. 5°C+16. 6°Cx(log1Q[Na+] + [K+] + [Mg2+])+0. 41 °Cx(%GC)-675/N
[0084] 總的來說,退火溫度越高,引物越能特異性結合到最匹配的模板上,目標序列被成 功擴增的可能性就越大。溫度越低,目標序列被成功擴增的可能性就越大,導致更多的非目 標序列被擴增。一般退火溫度50°C以上的引物優化于退火溫度低的引物。本專利中,嚴格 的退火條件包括退火溫度從50°C-72°C,53°C-63°C更優,55°C-60°C最優。
[0085] 結構結構域特異性引物和可變區側翼的保守結構域序列互補,側翼是指緊靠保守 結構域或距離目標可變區10, 20, 30,40, 50,或者60個核苷酸。保守結構域可以位于目標 可變區的5'或3'端。比如,V4區側翼的保守結構域位于497-589,包括保守結構域C3(V4 區的5'端)和652-828位,包括保守結構域C4(V4區的3'端)。相似的,V3區側翼的保守 結構域位于227-439,包括保守結構域C2(V3區的5'端)和497-589位,包括保守結構域 C3(V3區的3'端)。V5區側翼的保守結構域位于652-828,包括保守結構域C4(V5區的5' 端)和857-999位,包括保守結構域C5(V5區的3'端)。引物可以互補于保守結構域的任 何位置用來擴增感興趣的可變區。在一個例子中,引物互補于高度保守結構域或高度保守 結構域的一部分,比如C3的515-535位,C4的781-806位,C5的907-939位。
[0086] 對于有多條引物的引物組合,引物間是相互重合的,表明每條引物至少和組合里 面的一條引物不一樣,它們在結構特異性序列的5'端有1-3個核苷酸的移碼,這樣一個擴 增反應就能得到讀框移動的擴增子們。發明人發現一個擴增反應里有多條相互重合的引物 可以提高檢測微生物種類時的敏感性和特異性。
[0087]引物之間"重合"或"讀框移動"的意思是相對于另外一條引物的結構結構域特異 性序列的5'端,這條引物的結構結構域特異性序列的5'端發生了 1-2個核苷酸的移動。重 合的引物退火于相同的區域,但引物的目標序列向3'端移動了 1個或多個核苷酸。例如, 一個核酸序列"ATCGCC. . ? 一條引物是"ATCG. . ? 另外一條重合的引物是"CGCC. . ? 相 互重合的引物因在目標序列上移動1,2,3,4,5,6,7,8,9,10,11,或12個核苷酸而不同。
[0088] 在一些例子中,如果引物組合有2條引物,這2條引物因在5'端會有1,2,3或4 個核苷酸的移碼而不同。當引物組合超過2條引物,移碼是連續的,組合的最后一條引物和 第一條引物之間會有4個或更多(比如4, 5,6, 7,8,9,10或更多)的核苷酸移動。讀框移 動的引物例子,比如引物結合到16S的起始位置在341,343, 347,和349 ;515, 517,和519 ; 802,803,805,和 806 ;和 926,934 和 939.
[0089] 在一個擴增反應中,讀框移動的引物產生讀框移動的擴增子,這些擴增子在5'端 相差1個或多個核苷酸。因為讀框讀框移動引物能夠提高引物退火到低保守序列的幾率, 所以能夠提高對不同微生物種類的檢測敏感性。而且讀框移動的產物能夠更好的適用于二 代測序技術。
[0090] 重合引物提高了對于不同微生物種類的檢測。微生物之間的16SDNA保守結構域 序列不一樣。因此根據保守結構域設計的單條引物不能退火到所有種類的保守結構域。對 于一個給定的保守結構域,有的微生物在其中一段保守性更好而另外的微生物在另外一段 保守性更好。因此引物之間的退火位置在上下游相隔幾個核苷酸,提高了結合到不同序列 保守結構域的幾率,最終提高了檢測不同種類的敏感性和特異性。
[0091] 重合引物的作用是擴增出讀框移動的擴增子。這些擴增子只在5'端相差幾個堿 基,增加了產物文庫的多樣性,提高了相鄰簇的分辨率,最終提高了利用熒光進行高通量測 序的結果(比如Illumina測序平臺)。
[0092] 本發明公布的組合物,引物,和可以用已知的任何測序方法測序得到核苷酸序列 的方法。比如,傳統的Sanger測序或者二代測序都可以用來對本發明得到的擴增子測序。 對于含有大量微生物種類和多樣性的樣品,能夠快速得到大量數據的高通量/二代測序方 法更適合,可以快速而精確地鑒定樣品中的微生物種類。"二代"測序技術能夠同時而密集 地對大量不同的核酸序列進行測序,包括,但不限于,合成法測序(比如Illumina的染料測 序,PacificBiosciences的單分子實時測序),連接法測序(AppliedBiosystems的SOLiD 或Polony測序平臺),焦磷酸測序(RocheDiagnostics的454測序)和離子半導體測序 (LifeTechnologies的IonTorrent測序)。
[0093] 固相核酸擴增比如合成法測序更優,以Illumina測序技術為例。DNA文庫在測序 前先在玻璃片上擴增形成由相同單鏈DNA形成的簇。可逆標記的熒光dNTP通過DNA聚合 酶結合到和ssDNA退火的引物上,一次添加一個堿基。核苷酸的焚光被IlluminaHiSeq或 MiSeq平臺接收(加入即讀取),然后熒光基團被酶切以便下一個核苷酸的添加。每個簇通 過熒光圖像測序。
[0094]固相支持/DNA克隆測序方法比如Illumina面臨的一個挑戰是簇讀取軟件(分辨 一個克隆和另一個克隆的軟件)依賴于簇之間DNA的多樣性來分辨它們。這個軟件需要序 列之間的差異來區分相鄰的簇來確定多個序列。而用簡單的引物對得到的擴增子文庫多樣 性不好。為了解決這個問題,標準方法是加入或者摻入高復雜度文庫DNA來人為增加片段 的多樣性。高復雜度文庫DNA的加入量需要經驗判斷而且高復雜度文庫基因組會浪費40% 的讀數。
[0095]發明人發現,相比于利用一對引物得到的擴增子文庫,多條重合引物的使用不僅 提高了樣品微生物種類分類學上的覆蓋度,得到的讀框移動的多個擴增