專利名稱:通過信號擴展和數據整合進行的核酸測序的制作方法
技術領域:
本方法、組合物及裝置是涉及分子生物學及基因組學領域。更具體地說,本方法及裝置是有關核酸測序。
背景技術:
人類基因組計劃的出現需要發展改良的測序核酸如DNA(脫氧核醣核酸)和RNA(核醣核酸)的方法。許多常見疾病,如癌癥,囊腫性纖維癥及鐮刀狀血球貧血,都至少部份地起因于DNA序列變異。人類基因組的整個3,000,000,000個堿基序列的測定提供了用來鑒別這樣的疾病的遺傳學基礎。然而,要鑒別與每一種疾病相關的遺傳變異還有大量的工作尚待完成。
現有的核酸測序方法是基于對已經按大小分離的標記核酸的檢測,它們所能測序的核酸長度收到限制。一般,一次只能測定核酸序列的500至1,000個堿基。這比DNA的功能單元基因的長度短很多,基因的長度可能為數萬至數十萬個堿基。使用目前的方法完成一個完整基因序列的測定需要制備許多的基因拷貝,將其切成相互交疊的片斷并測序,之后,再將交疊的DNA序列組裝成為一個完全基因。這種方法費工,昂貴,無效率且耗時。
較新的核酸測序方法涉及芯片上特定位置的已知序列的寡核酸苷酸陣列的雜交,它們可用來推出短的核酸序列或檢測樣本中特定核酸的存在性。但是,它們不適合用于鑒別長的核酸序列。
下面的附圖構成了本說明書的一部分,它們在這里被用來進一步說明本發明的具體實施方式
。通過參考這些附圖中的一個或者多個,并結合在此提出的發明的具體實施方式
的詳細描述,可以更好地了解那些實施方式。
圖1顯示了用于對核酸模板200進行測序的示范性裝置100(不按比例)和方法,其是通過確定4個分離的反應室110,120,130,140內隨機標記的核苷酸220之間的距離來進行的。
圖2顯示了以大量互補核酸鏈230,240,250中標記核苷酸之間的測量距離為基礎來構建一種標記核苷酸220的堿基距離圖譜310,320,330,340的示范性方法。標記核苷酸220之間的距離可用來構建各種標記核苷酸的距離圖譜310,320,330,340,如在此所述。圖中顯示了互補鏈230,240,250的序列210以及標記核苷酸220的示范性位置。如260所標示,在相同的核苷酸彼此相鄰的位置,會在那個位置檢測到標記頻率的增加。
圖3顯示了將4份堿基距離圖譜310,320,330,340進行比對而得到互補鏈230,240,250的序列210的示范性方法。模板核酸200為該已測序列210的準確互補。
圖4顯示了構建450標記核苷酸220的距離圖譜310,320,330,340的示范性方法。
圖5顯示了比對520距離圖譜310,320,330,340以獲得互補鏈230,240,250的核酸序列210的示范性方法。
具體實施例方式公開的方法、組合物及裝置100是用于核酸的快速自動測序。在本發明的特定實施方式中,所述方法、組合物及裝置100適合用于獲得非常長的核酸分子的序列210。與現有的核酸測序方法相比,優點包括能夠在單次測序操作中讀出長的核酸序列210,能夠更快速地獲得序列210數據(達每秒3,000,000個堿基),減少測序成本,并且,就產生每單位序列210數據所需的操作時間而言,其效率更高。
下面的詳細說明包括大量的特定細節,以便提供所公開的具體實施方式
一個更加全面的理解。然而,本領域技術人員應明白,沒有這些特定細節,本發明仍然可以實施。在其它例子中,在本領域已知的裝置、方法、程序及個別組件在此將不作詳細描述。
圖1顯示了本發明的特定實施方式。圖1顯示了一種核酸測序方法,其包括放置多個模板核酸200的拷貝于四個反應室110,120,130,140內。這些反應室110,120,130,140中的每一個皆包含合成試劑如DNA聚合酶,與所述模板分子200互補的引物以及核苷酸前體。在本發明的可供選擇的具體實施方式
中,所述引物分子可以被標記,以便檢測用于測量標記核苷酸距離的限定性起點。所述的核苷酸前體應該包括至少一個分子的脫氧腺苷-5′-三磷酸(dATP)、脫氧鳥苷-5′-三磷酸(dGTP)、脫氧胞苷-5′-三磷酸(dCTP)、脫氧胸苷-5′-三磷酸(dTTP)或脫氧尿苷-5′-三磷酸(dUTP),盡管各反應室在正常情況下會含有各種核苷酸前體的許多分子。
另外,各室110,120,130,140將含有一種類型的標記核苷酸前體。例如,第一反應室110可以包含標記dATP,第二反應室120可以包含標記dCTP,第三反應室130可以包含標記dGTP,第四反應室140可以包含標記dTTP。將小量的一種類型的標記核苷酸前體分別添加于這四個反應室110,120,130,140中可以產生隨機標記的互補鏈230,240,250。在各室110,120,130,140中,所有的互補鏈230,240,250都以同種類型的核苷酸來標記。在本發明的一些具體實施方式
中,標記核酸230,240,250在四個反應室110,120,130,140中合成并被分析,合成和分析是在同一室中發生。作為選擇,標記互補鏈230,240,250可在一組容器例如在試管、微量離心管或微過濾管內制備,然后分離掉未整合的核苷酸,并在一組室110,120,130,140內進行分析,所述室與檢測器在操作上偶聯。
在本發明的其它可供選擇的具體實施方式
中,標記核酸230,240,250可以在四個不同的容器中分別合成,其中各容器含有不同類型的標記核苷酸前體。四種標記核酸230,240,250然后可以在單個反應室110,120,130,140內混合以便分析標記核苷酸220距離。這要求各種類型的標記核苷酸220被可區分地標記并能夠檢測。仍在其它可供選擇的具體實施方式
中,標記核酸230,240,250可以在單個室中合成,然后分到四個室110,120,130,140中以檢測標記核苷酸220,每個室都配有檢測器,經調整后可檢測單一類型的獨特的標記核苷酸220。在另一可供選擇的具體實施方式
中,含有所有四種可區分的標記核苷酸220的互補核酸鏈230,240,250在單個容器中合成,然后在單個室110,120,130,140內分析,其中使用了一種能夠識別四種標記核苷酸中的每一種的檢測器。
在本發明的特定具體實施方式
中,四種標記核苷酸前體的每一種都具有獨特且容易看見的光學特征,該特征能將其與未標記的核苷酸和其它類型的標記核苷酸220區分。在本發明的可供選擇的具體實施方式
中,標記核苷酸220可以用大體積基團(bulky groups)來標記,這樣的標記也容易區分。所述具體實施方式
不限于發光標記或大體積基團標記,本領域已知的任何形式的核苷酸標記,如放射性、核磁共振、電子順磁共振、電子旋轉共振等,都可用于所公開的方法的實踐中。
在各種具體實施方式
中,核酸聚合酶每一次添加一個核苷酸前體至引物的3′端。對于每一輪的延長,單個核苷酸前體被整合到互補鏈230,240,250中。核苷酸前體整合成互補鏈230,240,250是由與模板鏈200的Watson-Crick堿基對相互作用來決定的。因此,模板鏈200的序列可以從互補鏈230,240,250的序列210確定。
在本發明的特定具體實施方式
中,在互補鏈230,240,250中的標記核苷酸220上皆附有大體積基團。所述大體積基團可通過交聯或任何本領域已知的其它方法來連接。例如,含有附著的大體積基團的核苷酸前體可以在合成過程中整合成互補核酸鏈230,240,250。作為選擇,可將含有特定的活性基團的核苷酸前體整合成互補鏈230,240,250,在互補鏈230,240,250完成合成之后通過交聯來添加大體積基團。在本發明的特定具體實施方式
中,所述大體積基團可為任何有機物、無機物或金屬基團或任何抗體。在本發明的具體實施方式
中,如果金屬基團附著于標記核苷酸220,則金屬可以為純金屬,如金或銀,或合金。在本發明的特定具體實施方式
中,金屬基團可以為納米顆粒。在本發明的特定具體實施方式
中,納米顆粒的大小約為1納米(nm),盡管也可以使用大約2、3、4、5、6、7、8、9或10nm或甚至更大的納米顆粒。
在本發明特定具體實施方式
中,標記核酸230,240,250可以通過一個或者多個納米孔150。標記核苷酸220通過納米孔150時由檢測單元加以檢測。在非限制性的例子中,納米孔150可以由α溶血素分子形成。α溶血素自組裝成脂質雙層孔,其容許單個DNA分子無阻礙地通過(如,Akeson等,Biophysical J.773227-3233,1999)。在施加有電勢的情況下,通過標記核苷酸220對納米孔內的離子流的影響可以檢測標記DNA通過這樣的納米孔150。要檢測傳導性標記如金屬納米顆粒通過納米孔150,可以利用電檢測器,如電壓計、電阻計或電導率計。在本發明的可供選擇的具體實施方式
中,熒光或發光標記通過納米孔可通過光學檢測器來檢測。在其它可供選擇的具體實施方式
中,檢測單元可以包括掃描探針顯微鏡。在本發明的具體實施方式
中,如果大體積基團已經附著至核苷酸,那么這樣的大體積基團便可利用掃描穿隧顯微術(STM)或原子力顯微術(AFM)來檢測。在這樣的具體實施方式
中,所述檢測單元可以與或者不與納米孔150在操作上相連。作為選擇,用大體積基團來標記的互補核酸230,240,250可以排列在表面上,利用AFM或STM來掃描。在各種具體實施方式
中,檢測單元可以在操作上偶聯至信息處理及控制系統,如計算機,以便記錄標記核苷酸220之間的距離。
各反應室110,120,130,140的關于標記核苷酸220之間的距離的數據可以被收集和分析(圖2)。構建450出各個反應室110,120,130,140的距離圖譜310,320,330,340,比對520所得到的距離圖譜310,320,330,340以產生核酸序列210(圖3)。各反應室110,120,130,140的距離圖譜310,320,330,340可通過標記核苷酸220之間距離的交疊420、頻率430及信號440分析來構建450。通過分析不交疊的數據可將距離圖譜310,320,330,340比對520成為序列210。距離圖譜310,320,330,340可以通過信息處理及控制系統例如計算機來構建450和比對520。
本發明的特定實施方式涉及DNA互補鏈230,240,250的合成。模板鏈200可以為RNA或DNA。使用RNA模板鏈200時,合成試劑為反轉轉錄酶,其例子為本領域所熟知。在使用DNA分子模板鏈200的具體實施方式
中,合成試劑為DNA聚合酶,其例子為本領域所熟知。在本發明的其它具體實施方式
中,互補鏈230,240,250可為RNA分子。這樣需要的合成試劑為RNA聚合酶。在這些的具體實施方式
中并不需要引物。然而,模板鏈200應該包含啟動子以有效地使RNA聚合酶結合并啟動RNA互補鏈230,240,250的轉錄。啟動子的優化為本領域所知。本發明的具體實施方式
并不限制所使用的模板分子200的類型、合成的互補鏈230,240,250的類型,或所使用的聚合酶的類型。實際上,能夠支持與模板鏈200序列210互補的核酸分子230,240,250的合成的任何模板200和任何聚合酶都可使用。
在本發明的特定具體實施方式
中,模板分子200可附著在表面上如功能化玻璃、硅、PDMS(聚二甲基硅氧烷)、金、銀、或鍍有其它金屬的表面、石英、塑料、PTFE(聚四氟乙烯),PVP(聚乙烯吡咯烷酮)、聚苯乙烯、聚丙烯、聚丙烯酰胺、乳膠、尼龍、硝化纖維、玻璃珠、磁珠或本領域所知的任何能附著核酸的材料。在本發明的一些具體實施方式
中,核酸分子可在表面上定向,如下所述。
在本發明的一些具體實施方式
中,功能性基團如標記可以共價連接于交聯劑,以便模板鏈200、互補鏈230,240,250及聚合酶之間可發生相互作用而沒有位置阻礙。作為選擇,所述核酸可利用交聯劑附著于表面。典型的交聯基團包括乙二醇寡聚物及乙二胺。所述附著可以是共價或非共價結合。將核酸分子附著于表面的各種方法是本領域所熟知的,并可以加以應用。
定義 出于本公開的目的,下列術語具有下列的含義。沒有被定義的術語則根據其一般通用的含義來應用。
″抗體″包括多克隆和單克隆抗體及其片斷。抗體也包括重組抗體、化學修飾的抗體及人源化抗體,所有的抗體可以為單鏈或多鏈。
″核酸″表示DNA或RNA,可以是單鏈、雙鏈或三鏈,及DNA或RNA的任何修飾形式或類似物(analog)。″核酸″幾乎可以為任何長度,從10、20、30、40、50、60、75、100、125、150、175、200、225、250、275、300、400、500、600、700、800、900、1000、2000、2500、3000、3500、4000、4500、5000、6000、7000、8000、9000、10,000、100,000、20,000、30,000、40,000、50,000、75,000、100,000、150,000、200,000、500,000、1,000,000、1,500,000、2,000,000、5,000,000或甚至更多的堿基長度,直至染色體DNA分子的全長。
″核苷酸前體″是指未整合進入核酸的核苷酸。在本發明的一些具體實施方式
中,核苷酸前體為核糖核苷三磷酸或脫氧核糖核苷三磷酸。可以了解,只要尚能通過聚合酶整合為互補鏈230,240,250,核苷酸前體的結構便可作各種取代或修飾。例如,在某些具體實施方式
中,核糖或脫氧核糖部分可由其它戊糖或戊糖類似物取代。在其它具體實施方式
中,磷酸酯基團可被例如膦酸酯、硫酸酯或磺酸酯替代。仍在其它具體實施方式
中,只要核苷酸前體整合進入互補鏈230,240,250的順序210能夠反映出模板鏈200的序列,便可修飾嘌呤或嘧啶堿基,或用其它嘌呤或嘧啶或類似物替代。
″標簽(tags)″或″標記(labels)″可交換使用,它們都是指可用來鑒定附著有標記物的核苷酸220的任何原子、分子、化合物或組合物。在本發明的各種具體實施方式
中,這樣的附著可以是共價或非共價的。在非限制性的具體實施方式
中,標記可以是熒光、磷光、發光、電發光、化學發光,或可以顯示出拉曼或其它光譜特征的任何大體積基團。可以料到,實質上可使用任何能夠檢測并識別標記核苷酸220的技術,包括可見光、紫外線及紅外線光譜法、拉曼光譜法、核磁共振、正子發射斷層成像、掃描探針顯微術及其它本領域所知的方法。在特定的具體實施方式
中,核苷酸前體可以于合成互補鏈230,240,250之后、檢測標記核苷酸220之前,用大體積基團作二次標記。
實體前面的術語“一個”(″a″或″an″)表示一個或超過一個實體。
如在此使用的,″操作上偶聯(operably coupled)″是指在裝置100和/或系統的兩個或更多個單元之間有功能性的相互作用。例如,如果計算機可以獲取、處理、儲存和/或傳輸由檢測器檢測到的信號的數據,則所述檢測器″操作上偶聯″至所述計算機。
核酸 模板分子200可通過本領域普通技術人員所知的技術來制備。在本發明的某些具體實施方式
中,模板分子200為自然發生的DNA或RNA分子,例如,染色體DNA或信使RNA(mRNA)。實質上,任何自然發生的核酸都可以通過在此揭露的方法來制備和測序,包括不限于染色體DNA、線粒體DNA或葉綠體DNA,或核糖體RNA、不均一核RNA或信使RNA。將要被測序的核酸可利用本領域已知的標準方法從原核生物或真核生物來源獲得。
制備及分離各種形式的核酸的方法是已知的。(見,例如,1987年紐約Academic Press出版,Berger和Kimmel,″Guide to MolecularCloning Techniques″;及1989年紐約Cold Spring Harbor Press出版,Sambrook,Fritsch和Maniatis,″Molecular CloningA Laboratory Manual,第2版″)。任何已知的制備模板核酸200的方法都可用于在此揭露的方法。
標記的核苷酸前體 各反應室110,120,130,140可以包含一種標記的核苷酸前體,以便產生隨機標記的互補鏈230,240,250。核苷酸前體共價附著于各種標記,如熒光標記,它們可從標準的商業來源獲得(如,MolecularProbes,Inc.,Eugene,OR)。或者,可利用本領域已知的標準技術來制備標記核苷酸前體。任何已知的用以制備標記核苷酸前體的方法都可用于實施本發明所要求保護的主題。
在非限制性的實施例中,添加到反應室110,120,130,140中的標記核苷酸前體的百分率為10%,雖然標記核苷酸前體在反應室110,120,130,140中的量可以占所述室110,120,130,140中同種類型的核苷酸總量的0.5%、1.0%、1.5%、2.0%、2.5%、3%、4%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%或85%。例如,如果反應室110包含標記的腺苷核苷酸前體,室110可以包含10%的標記腺苷核苷酸和90%未標記腺苷核苷酸,以及未標記胞嘧啶、鳥嘌呤及胸腺嘧啶核苷酸。
使用較低百分率的標記核苷酸220可以使信號擴展(stretching)。兩個相鄰核苷酸之間的正常距離為1/3nm。如果10%的核苷酸前體被標記,則在互補核酸230,240,250中兩個相鄰的標記核苷酸220之間的平均距離約為13.6nm。由相鄰的標記核苷酸220之間的這個距離延展開去的距離可以利用如電導率測量、分光光度分析、AFM或STM來檢測。這些方法無法區分相隔1/3nm的標記。標記可利用本領域已知的任何檢測器來檢測,如分光光度計、發光計、NMR(核磁共振)、質譜儀、成像系統、電荷耦合器件(CCD)、CCD照相機、光電倍增管、雪崩光二極體、AFM或STM。
在本發明的各種具體實施方式
中,帶有整合的活性基團和/或半抗原的核苷酸前體可以附著有二次標記物,如抗體。可以使用本領域已知的任何形式的可檢測標記,如,拉曼標簽、熒光團、生色團、放射性同位素、酶標簽、抗體、化學發光、電發光、親和標記等。本領域技術人員會明白這些或其它未提及的已知的標記可用于在此公開的方法。
可使用的標記部份可以是熒光團,如Alexa 350、Alexa 430、AMCA(7-胺基-4-甲基香豆素-3-乙酸)、BODIPY(5,7-二甲基-4-硼-3a,4a-二氮-s-indacene-3-丙酸)630/650、BODIPY 650/665、BODIPY-FL(熒光素)、BODIPY-R6G(6-羧基若丹明)、BODIPY-TMR(四甲基若丹明)、BODIPY-TRX(得克薩斯紅-X)、瀑布藍、Cy2(花青-2)、Cy3、Cy5、5-羧基熒光素、熒光素、6-JOE(2′7′-二甲氧基-4′5′-二氯-6-羧基熒光素)、俄勒岡綠488、俄勒岡綠500、俄勒岡綠5、太平洋藍、若丹明綠、若丹明紅、ROX(6-羧基-X-若丹明)、TAMRA(N,N,N′,N′-四甲基-6-羧基若丹明)、四甲基若丹明、和得克薩斯紅。熒光或發光標記物可從標準的商業來源獲得,如Molecular Probes公司(Eugene,OR)。
在本發明的某些具體實施方式
中,核苷酸可以用大體積基團來標記。非限制性的這樣的大體積基團的例子包括抗體、量子點及金屬基團。抗體可以用可檢測的標記來標記。所述的可檢測的標記可選自酶、順磁材料、抗生物素蛋白、鏈霉抗生物素蛋白或生物素、熒光團、生色團、化學發光團、重金屬和放射性同位素。
用作標記的金屬基團可以組成一種類型的金屬,如金或銀,或金屬混合物。在本發明的特定的實施方式中,金屬基團可以包括納米顆粒。制備納米顆粒的方法是已知的(如,美國專利6,054,495;6,127,120;6,149,868;Lee和Meisel,J.Phys.Chem.863391-3395,1982;Jin等,2001)。納米顆粒也可從商業來源獲得(如,Nanoprobes公司,Yaphank,NY;Polysciences公司,Warrington,PA)。在一些具體實施方式
中,納米顆粒可以在附著于核苷酸之前互相交聯。納米顆粒的交聯方法在本領域是已知的(如,Feldheim,″Assembly of metal nanoparticle arraysusing molecular bridges″,Electrochemical Society Interface,2001年秋,22-25頁)。可以使用的交聯的納米顆粒包括,例如,單體、二聚體、三聚體、四聚體等,以便為不同類型的核苷酸提供可區分的標記。盡管可以期望納米顆粒是任何尺寸,但在本發明的特定具體實施方式
中,納米顆粒的直徑約為0.5至5nm。
用作大體積基團的抗體也可以用納米顆粒來標記。金納米顆粒表面可以帶上馬來酰亞胺功能性,這允許抗體、蛋白及肽經巰基的共價連接。(Monomaleimido NANOGOLD,Integrated DNA Technologies公司,Coralville,Iowa.)。用納米顆粒標記抗體和/或核苷酸的技術是已知的。例如,抗體在使用溫和的還原劑如鹽酸巰乙胺(MEA)還原鉸鏈區的二硫鍵后可用金納米顆粒標記。被還原的抗體與MEA分離后便能與Monomaleimido NANOGOLD反應。可以利用凝膠排阻色譜來將偶聯的抗體與游離的金納米顆粒分離。抗體片斷可以相似的方式標記。金納米粒子也能直接附著于含有巰基的標記的核苷酸前體。
引物 引物可由本領域已知的任何方法獲得。一般,引物的長度在10至20個堿基長度之間,雖然較長的引物也可以使用。在本發明的某些具體實施方式
中,引物是被設計成準確地與模板核酸分子200的已知部份互補。在本發明的一個具體實施方式
中,引物位于靠近模板核酸200的3′端。任何序列的引物的合成方法是已知的,例如,應用亞磷酰胺化學,使用自動核酸合成儀來合成,這樣的設備可從標準的來源獲得,如Applied Biosystems公司(Foster City,CA)或Millipore公司(Bedford,MA)。
本發明的其它具體實施方式
涉及在缺乏已知的引物結合位點的情況下對核酸進行測序。在這樣的情況下,可以使用隨機引物,如隨機的六聚體或7、8、9、10、11、12、13、14、15個堿基或更長的隨機寡聚體,從而啟動互補鏈230,240,250的聚合。為避免單個模板鏈200上具有多個聚合位點,在啟動合成反應之前將在于固定表面的附著位點附近與模板分子200雜交的引物以外的引物利用已知的方法移去。
反應室 在本發明的某些實施方式中,使用四個反應室110,120,130,140來執行測序分析。一個反應室110,標示為″A″,包含標記dATP。第二室120標示為″C″,包含標記dCTP。第三室130標示為″G″,包含標記dGTP。第四室140標示為″T″,包含標記dTTP(或標記dUTP)。各反應室110,120,130,140被設計成能夠在水環境中容納核酸模板200、引物、聚合酶及核苷酸前體。在本發明的一些具體實施方式
中,核酸可以附著在反應室110,120,130,140內的固定表面上。在本發明的某些具體實施方式
中,反應室110,120,130,140被設計為溫度控制,例如,通過整合Pelletier組件或通過利用本領域已知的其它方法。在核酸聚合反應中所使用的控制小容積液體溫度的方法為本領域所知(如,美國專利5,038,853,5,919,622,6,054,263和6,180,372)。
在本發明的某些具體實施方式
中,反應室110,120,130,140可以在操作上偶聯至一個或多個流體信道,例如,提供與分子分配器、廢物孔、模板200進料孔或核苷酸來源的連接。所有這些組件都可以以批量制造方法來制造,如在計算機芯片制造或毛細管芯片制造領域所知的。在本發明的一些具體實施方式
中,反應室110,120,130,140及裝置100的其它組件可制成單個一體化芯片。這樣的芯片的制造方法為本領域所熟知,如光刻法和蝕刻。然而,制造方法并不受限,本領域所知的其它方法可以使用,如激光消蝕、注模、澆鑄或壓印技術。對于本發明的某些具體實施方式
,可以使用納機電系統的制造方法。(見,例如Craighead,Science 29032-36,2000)。微制造的芯片可以作為商品獲得,如購自Caliper Technologies公司(Mountain View,CA)及ACLARA BioSciences公司(Mountain View,CA)。
構成反應室110,120,130,140和裝置100的其它組件的材料可選擇為可以透過在檢測單元所使用的激發和發射頻率處的電磁輻射。玻璃、硅和任何在可見頻率范圍內透明的其它材料都可用來構建裝置100。在本發明的其它具體實施方式
中,裝置100的某些部份和/或附屬器件的設計容許原子力顯微鏡或掃描穿隧顯微鏡的尖端來掃描標記的互補鏈230,240,250,以便測量大體積基團之間的距離。
DNA定向 使用大體積基團220來標記的互補核酸鏈230,240,250在用AFM或STM掃描之前可以先在表面上被定向。表面上定向核酸分子的技術為本領域所知(如,美國專利5,840,862;6,054,327;6,225,055;6,265,153;6,303,296;6,344,319)。在非限制性的例子中,可合成多個標記的核酸鏈230,240,250。表面如硅化的、涂覆有金的或其它衍生化的玻璃片,可以浸入反應室內,并容許標記核酸230,240,250的一端結合于該表面。例如,所使用的引物可以在其5′端共價連接于生物素,而所述表面可以覆有抗生物素蛋白或鏈霉抗生物素蛋白。含有結合的標記核酸230,240,250的表面可以從溶液中緩慢提出。由于空氣液體界面的凹凸性,當結合的核酸230,240,250穿過所述界面時,它們在方向上變得相互平行,這使得標記核苷酸220之間距離可以通過AFM或SPM掃描更準確地確定。
納米孔 在本發明的某些具體實施方式
中,裝置100可以包括一個或者多個納米孔150。在本發明的某些具體實施方式
中,納米孔150的直徑在1至10nm之間。在特定的具體實施方式
中,納米孔150位于脂質雙層膜內。在非限制性的例子中,α溶血素亞基可以自組裝成1.5nm的納米孔150,其形成于脂質雙層內。例如120伏的電勢差可以被施加于所述的脂質雙層,這使得離子可以流過納米孔150。單鏈標記核酸230,240,250通過納米孔時會阻斷離子的流動,這使得可以通過阻斷振幅(blockadeamplitude)或阻斷動力學(blockade kinetics)來確定標記核苷酸220之間的距離。利用Axopatch 200B儀器(Axon Instruments,Foster City,CA)可以測量并記錄通過納米孔150的離子流的波動。數據可以使用pClamp6軟件(Axon Instruments,Foster City,CA)來分析。
本發明的具體實施方式
并不限制納米孔150的類型。在本領域已知的任何納米孔150都可用于在此公開的方法。直徑約為2.6nm的納米孔150容許雙鏈核酸分子230,240,250通過。在用大體積基團來標記核苷酸220的本發明的具體實施方式
中,納米孔150可以較大以容許標記的核酸230,240,250通過。
在本發明的某些具體實施方式
中,可利用下面已知的納米微影術(nanolithography)在固態基質如硅、氧化硅、二氧化硅或鍺芯片上構建納米孔150,其包括但不限于化學蒸汽沉積、電化學沉積、化學沉積、電鍍、熱擴散及蒸發、物理蒸汽沉積、溶膠沉積、聚焦電子束、聚焦離子束、分子束外延(molecular beam epitaxy)、蘸水筆納米微影術(dip-pen nanolithography)、反應離子束蝕刻、化學輔助離子束蝕刻、微波輔助等離子體蝕刻、電氧化、掃描探針方法、化學蝕刻、激光消蝕或任何本領域所知的其它方法(如,美國專利6,146,227)。
在本發明的各種具體實施方式
中,納米孔150可以穿透芯片內的一個或者多個傳感器層。傳感器層可以包括半導體材料,包括但不限于硅、二氧化硅、鍺、砷化鎵和基于金屬的物質(如金屬或金屬氧化物)。在本發明的一些具體實施方式
中,傳感器層可以通過電子束、離子束和/或激光微影術和蝕刻來產生通道、溝或孔。在本發明的其它具體實施方式
中,通道、溝或孔可以涂有有機或無機沉積物以減小所述通道、溝或孔的直徑,或提供特別形式的表面,如親水性表面。含有金屬的電導傳感器層可以沉積在半導體表面上,其可以利用來自掃描穿隧顯微術(STM)或原子力顯微術(AFM)尖端或溶液的場蒸發。可以通過將半導體表面氧化為絕緣物來形成絕緣傳感器層。
在本發明的某些具體實施方式
中,通道或溝可以利用本領域所知的各種技術蝕刻到半導體表面,包括但不限于,在氧化物蝕刻溶液中運用STM/AFM尖端的方法。通道形成后,相對的兩個半導體表面可以產生一個或多個穿透所述半導體的納米孔150。在本發明的其它具體實施方式
中,可以應用掃描探針、化學蝕刻技術和/或微加工在半導體基材中切割出微米或納米尺寸的孔150。
在本發明的一些具體實施方式
中,納米孔150可以利用高通量的電子束微影系統制造(如,http://www.mdatechnology.net/techsearch.asp?articleid=510)。可以使用電子束微影在硅芯片上書寫小至5nm的特征。涂在硅表面上的靈敏抗蝕層如聚甲基丙烯酸酯可以生成圖案而不必使用掩模。電子束陣列可以將場發射器簇與微信道放大器組合起來以增加電子束的穩定性,這容許低電流的操作。在本發明的一些具體實施方式
中,可以使用SoftMaskTM計算機控制系統來控制半導體芯片基材上納米尺寸特征的電子束微影。
在本發明的可供選擇的具體實施方式
中,納米孔150可以使用聚焦原子激光來產生(如,Bloch等,″Optics with an atom laser beam″,Phys.Rev.Lett.87123-321,2001)。聚焦原子激光可以用于微影術,非常類似于標準激光或聚焦電子束。這樣的技術能于芯片上產生微米尺寸或甚至納米尺寸的結構。在本發明的其它可供選擇的具體實施方式
中,使用蘸水筆納米微影來形成納米孔150(如,Ivanisevic等,″Dip-PenNanolithography on Semiconductor Surfaces″,J.Am.Chem.Soc.,1237887-7889,2001)。納米孔150可以通過應用蘸水筆納米微影并結合常規的光蝕刻技術來形成。
在本發明的其它具體實施方式
中,可以使用離子束微影術在芯片上產生納米孔150(如,Siegel,″Ion Beam Lithography″,VLSIElectronics,Microstructure Science,Vol.1 6,Einspruch和Watts,AcademicPress,New York出版,1987)。可以使用精細的聚焦離子束直接在抗蝕層上書寫納米尺寸特征而不使用掩模。作為選擇,可以結合使用寬的離子束和掩模來形成尺寸小至100nm的特征。舉例來說,可使用氫氟酸來進行化學蝕刻,以移除暴露的硅或其它不受抗蝕層保護的芯片材料。技術人員會明白上面公開的技術并不是限制性的,納米孔150可通過本領域所知的其它方法來形成。
檢測單元 本發明的具體實施方式
并不受所使用的檢測單元的類型的限制,任何已知的檢測單元都可用于在此公開的方法和裝置100。
SPM檢測器 在本發明的某些具體實施方式
中,檢測單元可以包括掃描探針顯微鏡(SPM)。在本發明的特定具體實施方式
中,檢測單元可以包括掃描穿隧顯微鏡(STM)。STM的恒電流模式可以測量不規則的表面,如用大體積基團標記的核苷酸220,并可測量和記錄這樣的標記220之間的距離。STM使用削成單原子點的窄金屬尖端來掃描樣本,所述尖端借助于壓電材料與掃描器物理聯系,以容許在原子尺度研究電傳導表面。這由施加小的偏電壓于尖端和樣本之間而實現。如果兩者之間的距離較大,則其間并無電流流動。反之,如果尖端很靠近樣本而無實際接觸,則二者之間有電流流動。尖端和樣本之間的這種電流的測量使得DNA分子表面的原子信息可以被制成圖譜,從而可以在附著有大體積基團的標記核苷酸220通過該尖端時確定所述大體積基團之間的距離。
在本發明的另一具體實施方式
中,檢測單元可以包括原子力顯微鏡(AFM)。使用傳導性AFM時,尖端保持與樣本接觸,應用懸臂偏轉信號(cantilever deflection signal)來維持尖端和樣本之間的恒定力,從而產生拓撲圖像。當施加一個DC偏壓至尖端時,樣本保持為接地電勢,在掃描器頭部的預放大器測量通過尖端和樣本之間的電流,從而產生圖像。如此便容許利用在附著至標記核苷酸220的大體積基團通過尖端時所測量到其間的距離來構建堿基距離圖310,320,330,340。
在本發明的可供選擇的具體實施方式
中,檢測單元可以包括其它SPM,如磁力顯微鏡、側向力顯微鏡、力調制顯微鏡、相位檢測顯微鏡、靜電力顯微鏡、掃描熱顯微鏡、近場掃描光學顯微鏡、脈沖力模式和微熱分析。這樣的檢測單元的使用方法為本領域所熟知。
電檢測器 在本發明的一些具體實施方式
中,電檢測器可以在操作上偶聯至一個或多個電導層、電源和與所述電導層垂直并穿過所述電導層的一個或多個納米孔150。所述檢測器包括電流計、電壓計、電容計和/或電導率計,以測量感生電流、電壓、電阻等。在某些具體實施方式
中,其它電組件如電阻器或電容器可以包括在檢測器的相關電路中。
在本發明的一些具體實施方式
中,反應室110,120,130,140可以填充有低電導率的含水緩沖液。將電勢施加至納米孔150兩側的電導層。如果只有緩沖液在該納米孔150內,電導層之間的電阻是高的。核酸的未標記區域通過納米孔150時會造成納米孔150內的電導率稍微增加。用具有較高電導的標記物如金屬納米顆粒進行標記的核苷酸220通過時會造成電導率大大增加,因而在檢測器上產生可檢測的信號。信號之間的時間間隔可以被測量,從而確定標記核苷酸220之間的距離。
在本發明的特定具體實施方式
中,穿過納米孔150的電流可以轉換成電壓并加以放大,其中可以利用Axopatch 200A(Axon Instruments,Foster City,CA)或Dagan 3900A片鉗放大器(Dagan Instruments,Minneapolis,MN)。使用Frequency Devices(Haverhill,MA)的低通Bessel過濾器過濾信號。使用National Instruments(Austin,TX)AT-MIO-16-X 16位板和LAB WINDOWS/CVI程序將資料數據化。芯片使用鉬金屬盒(Amuneal,Philadelphia,PA)來屏蔽電和磁的噪聲源。
分光光度檢測器 在本發明的可供選擇的具體實施方式
中,附著有發光標記的標記核苷酸220可以用光源和光檢測器加以檢測,如二極管激光發射器和光纖或光敏晶體管檢測器。(如,Sepaniak等,J.Microcol.Separations1155-157,1981;Foret等,Electrophoresis 7430-432,1986;Horokawa等,J.Chromatog.46339-49 1989;美國專利5,302,272)。其它典型的光源包括垂直共振腔表面放射激光、邊射型激光、表面放射激光和量子腔激光(quantum cavity lasers),例如,Continuum公司的Nd-YAG抽運鈦:藍寶石可調固相激光和Lambda Physik的激態原子抽運染料激光。其它的示范性光檢測器包括光二極管、雪崩光二極管、光電倍增管、多陽極光電倍增管、光敏晶體管、真空光二極管、硅光二極管和電荷耦合器件(CCD)。
在本發明的一些具體實施方式
中,光檢測器、光源和納米孔150可以應用已知的N-well Complementary Metal Oxide Semiconductor(CMOS)方法(Orbit Semiconductor,Sunnyvale,CA)制成半導體芯片。在本發明的可供選擇的具體實施方式
中,檢測器、光源和納米孔150可以應用絕緣硅CMOS方法來制作(如,美國專利6,117,643)。在本發明的其它可供選擇的具體實施方式
中,可以將二極管激光發射器和CCD檢測器的陣列置于半導體芯片上(美國專利4,874,492和5,061,067;Eggers等,BioTechniques 17516-524,1994)。
在本發明的特定具體實施方式
中,可以使用高靈敏的冷CCD檢測器。冷CCD檢測器具有達80%的單光子檢測能力、高的空間分辨像素尺寸(5μm)以及從可見光到近紅外線光譜的靈敏性。(Sheppard,Confocal MicroscopyBasic Principles and System Performance inMultidimensional Microscopy,P.C.Cheng等,Springer-Verlag,NewYork,NY出版,1-51頁,1994)。在本發明的另一具體實施方式
中,可以使用線圈圖象增強耦合器件(ICCD)作為實現單光子計數水平的光檢測器(美國專利6,147,198)。少量的光子引起電子雪崩而撞擊到磷屏幕上,從而產生光亮的圖像。此磷光圖象由連接有放大器的CCD芯片經光纖耦合器來感應。在本發明的一些具體實施方式
中,芯片上的CCD檢測器可以感應紫外線、可見光和/或紅外光譜光(美國專利5,846,708)。
在本發明的一些具體實施方式
中,納米孔150可以在操作上偶聯至半導體芯片上的光源和檢測器。在本發明的某些具體實施方式
中,檢測器的位置可以垂直于光源以減少背景光。由發光標記物的激發所產生的光子可以由光纖來收集。收集的光子傳送至CCD檢測器,所述光被檢測并量化。檢測到標記核苷酸220的時間可以被記錄,核苷酸距離圖譜310,320,330,340可以被構建。將光纖置于半導體芯片上并在操作上與CCD檢測器接觸的方法是已知的(美國專利6,274,320)。
在本發明的一些具體實施方式
中,可以制作雪崩光二極管(APD)來檢測較低的光水平。APD方法應用了光二極管陣列以達到電子增倍效應(美國專利6,197,503)。在本發明的其它具體實施方式
中,光源如發光二極管(LED)和/或半導體激光可以整合到半導體芯片(美國專利6,197,503)。使激光或二極管光束成形的衍射光學組件也可以整合到芯片。
在本發明的某些具體實施方式
中,光源產生電磁幅射,其可激發光靈敏性標記,如附著于核酸上的熒光素。在本發明的一些具體實施方式
中,空氣冷卻的氬激光在488nm激發熒光素標記的核酸分子230,240,250。發出的光由收集光學系統來收集,所述的收集光學系統包括光纖、透鏡、成像分光計和0℃熱電泠卻CCD相機。熒光檢測器的另外例子為本領域所知(美國專利5,143,8545)。
核酸序列的確定 在本發明的一些具體實施方式
中,確定互補核酸230,240,250的序列210包括構建450各種類型的標記核苷酸220的距離圖譜310,320,330,340,并將距離圖譜310,320,330,340進行比對520以產生完整的序列210(圖4及圖5)。模板核酸200的序列將會與所述的已確定的序列210準確互補。在示范性的具體實施方式
中,根據圖4的方法來構建450各種類型的標記核苷酸220的距離圖譜310,320,330,340。在互補鏈230,240,250進行隨機的標記,并檢測標記核苷酸220,這樣可以得到被標記220的各鏈230,240,250中核苷酸的百分率分布。標記核苷酸220的百分率會隨著所應用的標記程序和檢測方案而有所變化。在一個具體實施方式
中,互補鏈230,240,250上同一類型的核苷酸中有約10%被標記220,以確保能夠容易地檢測標記核苷酸220之間的距離。標記互補鏈230,240,250合成之后,獲得410標記核苷酸220之間的距離(圖2)。所獲得的標記核苷酸220之間的距離410如圖2所圖示。可利用已獲得的距離410來構建450各種類型標記核苷酸220的距離圖譜310,320,330,340。
在本發明的各種具體實施方式
中,要對所獲得的距離420進行交疊分析(overlap analysis)。如此有助于對所述距離進行比對,這樣互補鏈230,240,250可以在同一位置開始和結束。在一個具體實施方式
中,交疊分析420包括將位置的交疊最大化。因為大量的互補鏈230,240,250被使用,所以序列210中的各核苷酸在不同的互補鏈230,240,250中會被標記許多次。所以,最大化交疊可以比對所獲得的距離420,這樣,各互補鏈230,240,250上標記420核苷酸220的位置便對應起來。為了比對所獲得的距離,作為交疊分析的替代或者補充,還可以應用其它的方法,如獨特地標記互補鏈230,240,250的起始或結束。在所獲得的距離經比對420后,可以進行頻率分析430以確定各標記位置周圍的標記核苷酸220的數目。在一個具體實施方式
中,由于標記和檢測方法中的量大、獨立及均勻的屬性,可以推出,在各互補鏈230,240,250上各位置的標記核苷酸220被標記的概率與在單條鏈上被標記的概率大約相等。如此,在使用了10%的標記核苷酸220的實施例中,如果使用了1000條鏈230,240,250,則在單個位置處的核苷酸被標記220的次數為1000的10%,也就是100次。
應用這種結論,便能確定對于獨立的檢測來說靠得十分接近的標記核苷酸220的數目。例如,標記概率為10%,并使用1000條標記的互補鏈230,240,250,如果在給定的位置有102條鏈230,240,250顯示有標記核苷酸220的話,便可推論該位置被一個標記核苷酸220占據,而并沒有由于靠近而致使檢測錯誤發生的別的標記核苷酸220。另一方面,如果在給定位置處有197條鏈230,240,250顯示有標記核苷酸220的話,便可推論有兩個標記核苷酸220存在,一個在所述的給定位置上,第二個因太接近而無法準確測量。同種類型的標記核苷酸220可以彼此相鄰,或者由一個或多個不同類型的核苷酸間隔開。如果兩個或多個同種類型的核苷酸位于相鄰的位置,便可應用相同的分析。如果相鄰的兩個核苷酸完全相同,則可以預料該位置被標記通常情況下的兩倍,如果三個相鄰核苷酸都是完全相同,便被標記通常情況下的三倍,以此類推。
如果在獨立的測量中確定了兩個或者更多個標記核苷酸220的位置十分接近,便可以進行信號分析440以確定空間關系。例如,由被一個其它核苷酸隔開的兩個標記核苷酸220所產生的信號不同于由兩個相鄰標記核苷酸220所產生的信號,也不同于由被二個其它核苷酸隔開的兩個標記核苷酸220所產生的信號。也可以使用其它的方法來區別間隔靠近的相同核苷酸之間的空間關系。在本發明的特定具體實施方式
中,可以實施頻率分析430來確定標記核苷酸220的相對位置。例如,為了區別排成一行的三個標記核苷酸220與被一個其它核苷酸隔開的兩個標記核苷酸220,其中一種情況的信號的發生通常只有另一種信號的2/3。頻率和信號分析在所要求保護的方法中可按任意順序執行。
如圖4和圖5所公開,可以構建450各種類型標記核苷酸220的距離圖譜310,320,330,340。雖然所有四種類型的核苷酸220都可以被標記并構建出450距離圖譜310,320,330,340,但在本發明的可供選擇的具體實施方式
中,可以只標記并分析四種核苷酸中的三種220。在這樣的具體實施方式
中,第四種類型核苷酸的位置可以通過另外三種類型核苷酸的已比對520的距離圖譜310,320,330,340中的間隙來推導出。可通過比對520不同類型標記核苷酸220的距離圖譜310,320,330,340來確定出完整的核酸序列210。在本發明的某些具體實施方式
中,可以使用非交疊的規則來比對520距離圖譜310,320,330,340。根據那個規則,兩種不同的核苷酸不能占據序列210中的同一位置。
在本發明的一些具體實施方式
中,距離圖譜310,320,330,340可以一次一個地比對520,其中從具有最大數目的標記核苷酸220的距離圖譜310,320,330,340開始。如果超過一個的可能比對被發現,可根據最小序列210長度規則來選擇可產生最短序列210的比對。如果別的距離圖譜310,320,330,340不能夠無交疊地進行比對520,則可以反復評估所述比對直到獲得無交疊的比對為止。如果距離圖譜310,320,330,340的比對不存在以致于無重疊規則被完全觀察到,則反復評估距離圖譜310,320,330,340的另外構建450,直到獲得無交疊的序列210為止。
在本發明的某些具體實施方式
中,該測序方法可針對大部份核酸產生良好比對的序列210,但是一個或者多個短的片斷有交疊發生或者其序列210模糊。操作者可以檢查在分析中任何一個點的數據,并決定是否整個核酸序列必須重序列,或僅是核酸模板200的短的區域必須重序列。序列210分析的結果的這種評估為本領域所熟知,就像熟知現有的核酸測序方法一樣。這種決定可以基于數據的統計分析由計算機自動完成或由使用者作出。
在本發明的另一具體實施方式
中,涉及序列210的距離圖譜310,320,330,340的開始和結束可能是已知的。在這種情況下,比對520可以包括排列所述距離圖310,320,330,340的已知端。
信息處理和控制系統以及數據分析 在本發明的某些具體實施方式
中,測序裝置100可以包括信息處理和控制系統。所述具體實施方式
并不限制所使用的信息處理和控制系統的類型。示范性的信息處理和控制系統可以整合有計算機,其包括用于交流信息的總線和用于處理信息的處理器。在本發明的一個具體實施方式
中,處理器是選自Pentium系列的處理器,包括但不限于Intel公司(Santa Clara,CA)的PentiumII、PentiumIII和Pentium4處理器。在本發明的可供選擇的具體實施方式
中,處理器為Celeron、Itanium、Pentium Xeon或X-級處理器(Intel Corp.,Santa Clara,CA)。在本發明的其它具體實施方式
中,處理器是基于Intel結構,如IntelIA-32或IntelIA-64結構。作為選擇,其它處理器也可以使用。
計算機可以進一步包括隨機存儲器(RAM)或其它動態儲存裝置、只讀存儲器(ROM)和/或其它靜態儲存,以及數據儲存裝置如磁盤或光盤及其驅動。信息處理和控制系統也可以包括其它本領域已知的外圍設備,如顯示設備(如,陰極射線管或液晶顯示器)、字母數字輸入裝置(如,鍵盤)、光標控制裝置(如,鼠標、追蹤球或光標方向鍵)以及通信裝置(如,調制解調器、網絡適配卡或用于偶聯至因特網、令牌網或其它類型網絡的接口設備)。
在本發明的特定實施方式中,檢測單元也可以偶聯至所述總線。來自檢測單元的數據由處理器處理并儲存于主存儲器。處理器可以根據檢測標記核苷酸220的時間間隔計算出標記核苷酸220之間的距離。核苷酸距離可被儲存于主存儲器內,并通過處理器用來構建450各反應室110,120,130,140的距離圖譜310,320,330,340。處理器也可對距離圖譜310,320,330,340進行比對以生成互補核酸序列210,從中可以獲得模板核酸序列200。
可以了解到,其配置不同于上述例子的信息處理和控制系統也可用于特定的實施方式。所以,本發明的不同具體實施方式
中的系統配置可以不同。也應該注意到,雖然在此描述的方法可在程控的處理器控制下執行,在本發明的其它可供選擇的具體實施方式
中,本方法可完全或部分由任何可編程邏輯或硬編碼邏輯,例如,現場可編程序門陣列(FPGA)、TTL邏輯或特定用途集成電路(ASIC),來加以執行。另外,本方法可以通過程控的通用計算機組件和/或定制的硬件組件的任何組合來加以實施。
在本發明的某些具體實施方式
中,可以應用定制的軟件包來分析由檢測單元所獲得的數據。在本發明的可供選擇的具體實施方式
中,可以應用信息處理和控制系統及市售的軟件包來進行數據分析。用于DNA序列210分析的市售軟件的例子包括但不限于PRISMTMDNA測序分析軟件(Applied Biosystems,Foster City,CA)、SequencherTM軟件包(Gene Codes,Ann Arbor,MI)以及經National BiotechnologyInformation Facility,網址www.nbif.org/links/1.4.1.php獲得的各種軟件包。
實施例 下列的實施例是用來說明本發明的特定的具體實施方式
。然而,本領域技術人員應該明白,基于本發明,可以對在此公開的特定細節作出許多改變,它們仍能獲得相同或類似的結果,而不脫離在此所要保護的主題。
實施1DNA測序 用限制性酶消化1.2μg的染色體DNA,以便能夠分離出感興趣的片斷。所述的感興趣的片斷可以大約有400,000個拷貝。可以增加將要被消化的基因組DNA的量以獲得400,000個拷貝。將分離出來的片斷分成四個子樣本(sub-samples),分別以A、G、T和C來表示。在各反應室110,120,130,140內可以約有100,000個拷貝的感興趣的片斷。使各DNA子樣本變性,然后與特定的寡核苷酸引物發生退火,在所述引物的5′端有生物素。向各反應室110,120,130,140添加200μM的dATP、dCTP、dGTP、dTTP和DNA聚合酶。另外,向各反應室110,120,130,140添加20μM的硫醇衍生化的核苷酸前體。例如,第一反應室110包含20μM的巰基-dATP,第二反應室120包含20μM的巰基-dCTP,第三反應室130包含20μM的巰基-dGTP,第四反應室140包含20μM的巰基-dTTP。產生整合有衍生化核苷酸前體的DNA互補鏈230,240,250。將1nm金顆粒與衍生化核苷酸交聯,并利用清洗將與標記核苷酸220交聯的金顆粒與游離的金顆粒分離。
使DNA互補鏈230,240,250與固定在平表面一邊的鏈霉抗生物素蛋白結合。通過分子梳(“molecular combing”)使分子定向,使固定的DNA分子在所述的平表面上固定化(見美國專利5,840,862;6,054,327;6,225,055;6,265,153;6,303,296;6,344,319)。
利用STM或AFM掃描DNA互補鏈230,240,250的金顆粒,并記錄標記核苷酸220上的金顆粒之間的距離。對多條標記核酸230,240,250重復這樣的掃描過程,以獲得在各反應室110,120,130,140內標記核苷酸220的一組有交疊的距離。每一組標記核苷酸220距離代表了對單個標記核酸230,240,250的距離測量。
將從各個反應室110,120,130,140的互補鏈230,240,250測到的標記核苷酸220之間的所有距離組合起來,可以構建450出所述各反應室110,120,130,140的堿基距離圖譜310,320,330,340。使用一種算法來評估所有測量到的距離之間的交疊420、分析信號頻率430和分析信號440本身,從而構建450出距離圖譜310,320,330,340。計算機程序應該通過搜尋來找出所有被掃描的DNA互補鏈230,240,250中最大和最均勻的交疊。
通過比對520四個距離圖譜310,320,330,340并消除交疊,可以組裝出DNA序列210。可以應用計算機程序來完成該功能。當比對520距離圖譜310,320,330,340時,有效的辦法可以是,尋找具有最多數目的堿基的距離圖譜310,320,330,340和具有第二多數目的堿基的距離圖譜310,320,330,340,并對它們進行比對。當比對520所述圖譜310,320,330,340時,應該利用非交疊規則和最小序列210長度規則。計算機應該只找出一個可能的匹配。接著比對520第三個距離圖譜310,320,330,340。利用非交疊規則和最小序列210長度規則來將此距離圖譜310,320,330,340合并到先前合并的圖譜310,320,330,340。以同樣的方式對第四個距離圖譜310,320,330,340進行處理以產生完整的核酸序列210。如果經比對的距離圖譜310,320,330,340導致兩個或者更多個不同類型的核苷酸位于該序列210的相同位置,則利用不同的比對來重復比對過程。如果在產生的序列210中沒有重疊堿基,序列210中也沒有間隙,則完成了數據分析。
所有在此揭露和要求保護的組合物、方法和裝置100都可根據在此公開的內容來制作和執行而無需過度的實驗。雖然公開的組合物、方法和裝置100已用本發明的具體實施方式
加以描述,然而,對于本領域技術人員明顯的是,可以加以改變而不背離在此所要求保護的主題的原理、精神和范圍。更具體地說,顯然,在化學和生理上相關的某些試劑可以取代在此所述的試劑,并能達到相同或相似的結果。對本領域技術人員顯而易見的所有這類類似的替代和修飾均在所附的權利要求所限定的要求保護的主題之內。
權利要求
1.一種方法,包括(a)將模板核酸分成四個樣本,各樣本含有不同類型的標記核苷酸;(b)合成與所述模板核酸序列互補的標記核酸鏈;(c)測量所述標記核苷酸之間的距離;(d)構建各樣本中所述標記核酸鏈的距離圖譜;以及(e)將所述距離圖譜組合成為互補鏈的核酸序列。
2.根據權利要求1的方法,進一步包括通過交疊數據分析和頻率分析來分析所測量到的距離,從而構建出距離圖譜。
3.根據權利要求1的方法,其中所述距離圖譜是通過非交疊數據分析而被組合成為序列。
4.根據權利要求1的方法,進一步包括(i)將所述標記核酸鏈附著至一個表面;以及(ii)將所述標記核酸鏈定向為彼此平行。
5.根據權利要求1的方法,其中所述核苷酸是用大體積基團來標記。
6.根據權利要求5的方法,其中所述大體積基團是在合成互補核酸鏈之前或之后附著至核苷酸。
7.根據權利要求6的方法,其中所述大體積基團選自有機基團、量子點、抗體和金屬基團。
8.根據權利要求7的方法,其中所述金屬基團為納米顆粒。
9.根據權利要求8的方法,其中所述納米顆粒為金或銀,所述納米顆粒的大小為約0.5納米與約5.0納米之間。
10.根據權利要求5的方法,其中大體積基團之間的距離通過掃描探針顯微鏡術來測量。
11.根據權利要求10的方法,其中大體積基團之間的距離通過原子力顯微鏡術或掃描穿隧顯微鏡術來測量。
12.根據權利要求1的方法,其中所述標記核酸鏈的一端附著有生物素,所述生物素結合至含有鏈霉抗生物素蛋白和/或抗生物素蛋白的表面。
13.根據權利要求1的方法,其中各樣本含有約100000個拷貝的模板核酸。
14.根據權利要求1的方法,進一步包括將寡核苷酸引物與所述模板核酸雜交,所述引物的5′端附著有生物素。
15.根據權利要求1的方法,其中所述標記核酸鏈用聚合酶來合成。
16.一種方法,包括(a)將模板核酸分到四個室中,各室含有不同類型的標記核苷酸;(b)合成與所述模板核酸序列互補的標記核酸鏈;(c)移動所述的標記核酸鏈通過納米孔;(d)測量所述標記核苷酸之間的距離;(e)構建各室內標記核酸鏈的距離圖譜;以及(f)將所述距離圖譜組合成為互補核酸鏈的序列。
17.根據權利要求16的方法,進一步包括通過交疊數據分析和頻率分析來分析所測量到的距離,從而構建出距離圖譜。
18.根據權利要求16的方法,其中所述距離圖譜是通過非交疊數據分析而被組合成為序列。
19.根據權利要求16的方法,其中納米孔直徑為1nm到50nm之間。
20.根據權利要求19的方法,其中納米孔直徑為3nm到10nm之間。
21.根據權利要求19的方法,其中選擇納米孔的直徑以容許一次有單條標記核酸鏈通過單個納米孔。
22.根據權利要求21的方法,其中所述標記核酸鏈與模板核酸雜交。
23.根據權利要求16的方法,其中各核酸鏈的至少一端附著有可區分的標記。
24.根據權利要求16的方法,其中各納米孔在操作上偶聯至檢測器。
25.根據權利要求24的方法,其中所述檢測器選自離子通道脂雙層傳感器、光檢測器、電檢測器和質量檢測器。
26.一種裝置,包括(a)至少四個反應室,各室含有不同的標記核苷酸;(b)位于各反應室內的多個納米孔;和(c)與各納米孔在操作上偶聯的檢測器。
27.根據權利要求26的裝置,進一步包括(i)信息處理系統;和(ii)數據庫。
28.根據權利要求26的裝置,其中所述檢測器能夠檢測附著至標記核酸鏈的金屬納米顆粒。
29.根據權利要求26的裝置,其中所述反應室和納米孔為一體化芯片的一部份。
30.根據權利要求26的裝置,其中所述檢測器選自離子通道脂雙層傳感器、光檢測器、電檢測器和質量檢測器。
全文摘要
在此公開的方法及裝置(100)涉及DNA測序。在本發明的一些具體實施方式
中,所述方法包括測量標記核苷酸(220)之間的距離,所述核苷酸例如用大體積基團標記。所述方法進一步包括將相同的模板DNA(200)放入四個反應室(110,120,130,140)中,每一個含有不同標記的核苷酸前體,合成互補鏈(230,240,250)并檢測標記核苷酸(220)。標記核苷酸(220)之間的距離可用來構建(450)各種類型標記核苷酸(220)的距離圖譜(310,320,330,340)。可比對(520)距離圖譜(310,320,330,340)以獲得核酸序列(210)。交疊數據分析和頻率分析可用來構建(450)距離圖譜(310,320,330,340),非交疊數據分析則可用來將所述距離圖譜比對成為序列(210)。
文檔編號C12Q1/68GK1662662SQ03814178
公開日2005年8月31日 申請日期2003年5月15日 優先權日2002年6月17日
發明者X·蘇 申請人:英特爾公司