專利名稱:定量核酸酶保護測序(qNPS)的制作方法
定量核酸酶保護測序(qNPS)本發明在廣義上涉及用于在核酸靶標的鑒定和檢測中進行定量核酸酶保護測序(qNPS)的組合物和方法。更具體地,本發明提供了用于使用測序來分析來自生物樣本的核酸的組合物和方法。本發明提供了一種用于解決測序面臨的幾個難題并改善了研究和診斷應用的新方法——定量核酸酶保護測序(qNPS )。所述方法使用僅需樣本裂解的核酸酶保護測定來產生用于測序的DNA (或其他合成的)探針,所述探針自身可被測序,或者偶聯于(a)基因特異性標簽從而鑒定基因而不必對所述核酸酶保護探針自身測序,和/或(b)實驗特異性標簽從而可將來自不同患者的樣本合并到單次運行中。所公開的qNPS作為一種研究和發現工具以及作為診斷測試使得對固定或不溶的樣本以及其他樣本的測序成為可能且費用較低。還公開了用于在當前系統(例如454、Solexa、S0LID)和下一代平臺(例如單分子測 序)上測序的方法。qNPS提供了目標明確的或者有針對性的用于研究和診斷的測序能力,例如i)成本低/樣本少;ii)高樣本通量;iii)減少測序運行時間并簡化數據分析;iv)允許靶標基因的高效測序而無來自其他基因(例如來自宿主的病原體的基因)的背景干擾;v)提供精確方式來測量基因表達、表達的單核苷酸多態性(SNP)、DNA SNP、DNA甲基化、rRNA、miRNA、突變等的特征集,這些可用作生物標記;vi)使得能夠從所有樣本類型測序,特別是從固定的例如福爾馬林固定的組織或者固定的細胞內染色并分選的樣本測序;以及vii)將被測序的樣本的復雜程度從全基因大大簡化到僅核酸酶保護探針或由所述探針保護的靶標序列。
動物組織和臨床樣本通常通過以石蠟包埋的福爾馬林固定(FFPE)的組織的形式的固定進行保存。因此,組織基因表達和DNA的商業可行的診斷測定必須能夠使用FFPE。此外,幾百萬這類樣本在臨床中心和醫院存檔,并且對應的治療形式和臨床結果是已知的。因此,FFPE樣本代表了用于快速和高效鑒定診斷生物標記并藉此開發和驗證預后和診斷測定的珍貴資源。用于研究和診斷應用的測序面臨幾個難題。所公開的定量核酸酶保護測序(qNPS)方法使用僅涉及裂解方式的核酸酶保護測定來產生用于測序的探針(例如DNA探針),其可被直接測序,或者可偶聯于例如(i)基因特異性標簽從而使得可鑒定所測量的基因序列而無需對所述核酸酶保護探針自身測序,和/或(ii)實驗特異性標簽——一種對于每個獨立樣本都是獨特的標簽,從而使得不同樣本(例如來自不同患者或來自不同治療或實驗的樣本)可合并到單次測序運行中但在測序后仍可被區分。qNPS提供了諸如以下的測序能力i)成本低/樣本少;ii)高樣本通量;iii)減少測序運行時間并簡化數據分析;iv)允許靶標基因的高效測序而無非靶標基因或基因序列的背景干擾,包括例如無宿主組織基因組干擾的宿主組織的病原體基因或者移植組織的測序;v)提供精確方式來測量基因表達、表達的單核苷酸多態性(SNP)、DNA SNP、DNA甲基化、所有RNA包括miRNA、rRNA、突變或其他核苷酸靶標等的特征集,這些可用作生物標記;vi)使得能夠從所有樣本測序,所述樣本包括特別是固定的組織,例如福爾馬林固定的組織或者蘇木素-伊紅(H&E)染色的組織或者戊二醛固定的組織,如固定的細胞內染色并分選的細胞;以及Vii)將被測序的樣本的復雜程度從全基因大大簡化到僅核酸酶保護探針。在一個方面,本發明提供了用于當代測序儀例如454、Solid和Solexa測序儀,以及下一代單分子測序儀和以后的測序儀的探針和方法。雖然這些系統中許多具有允許多個樣本并行測序的多個通道,但每次測序運行的成本為7000-9000美元,并且運行可能持續幾天。單分子測序儀例如PacBio可實現100-200美元/樣本的成本,但這在計入樣本制備成本時仍舊昂貴。降低每樣本成本并增加樣本通量的方法是使用用于鑒定從每次實驗中測序出的分子的可測序“標簽”(稱為“實驗標簽”),在多通道測序儀的每個通道內,在每次測序運行中測試多個樣本。縮短所述序列讀取長度可提高效率。僅對所述核酸酶保護探針測序而不測整個基因或基因片段,或者使用短的獨特基因標簽來鑒定所述靶標序列,實現了在測序被用于確定及定量基因水平或存在(但不鑒定基因序列的未知差異)的應用中的這一效率。基因標簽的使用還簡化了核酸酶保護探針設計,因為能進行測序的末端不必是獨特的。然而,所述核酸酶保護探針或為所述探針所保護的靶標寡核苷酸可不使用基因標簽而直接進行測序。在這種情況下,所述靶標序列中變異的存在一當其導致所述核酸酶 保護探針的SI切斷或部分水解時(形成所產生的部分探針序列的圖譜)或者當對所述靶標寡核苷酸的被保護部分進行測序時一也可被確定。還可設計所述方法以包括確定所述突變。這將在本文做進一步討論。測序對于確定可使人易患某些疾病或者可警示有害藥物代謝的基因組DNA的差異是非常有力的。然而,大量開發仍舊采用可用于診斷的測序方法以確定患者病癥及對治療的預測反應,所述方法要求例如評估臨床相關樣本類型的基因表達、miRNA水平、DNA甲基化狀態和其他突變。基因測序公司在商業探索上尚未關注此領域來提供成本越來越低的基因組測序。從固定的(例如石蠟包埋的福爾馬林固定(FFPE))的組織測序是有問題并困難的,盡管臨床樣本通常以FFPE組織的形式通過固定保存。因此,不管目的是確定假定的生物標記或者疾病及藥物機制,還是開發并繼而作為商業可行的組織基因表達和NDA的診斷測定的基礎進行應用,所述測定都須能夠使用FFPE。此外,幾百萬這類樣本在臨床中心和醫院存檔,并且FFPE供者的相應治療形式和患者的臨床結果是已知的。因此,FFPE及其他固定樣本代表了用于快速高效鑒定藥物靶標、疾病標記和通路以及診斷生物標記,并開發和驗證預后和診斷測定,或者用于鑒定基因以及與疾病進展或藥物活性有關的甲基化狀態或突變表達變化的珍貴資源。對FFPE的DNA和RNA測序不僅在測序上有問題,而且對于基于陣列的方法和PCR也有問題,這很可能出于相同的原因一大部分的基因組DNA以及轉錄組RNA與組織交聯。這種交聯必須逆轉并且必須回收靶標基因用于處理和分析。從FFPE回收的總RNA通常是部分降解的,不管是由于固定還是由于從FFPE提取RNA的過程。在研究環境中,降解太多以至于無法分析的樣本可被簡單地丟棄;但在診斷環境下,丟棄患者的樣本是不允許的。因此,盡管測序的效力是被認識到的,然而在研究環境下或特別是在診斷環境下測序在FFPE的應用面臨相當大的挑戰。從研究角度而言,福爾馬林固定的石蠟包埋的(FFPE)組織的信息內容仍舊鎖在大批歸檔的這些樣本中,等待精確且簡單的分析方法。所有上述內容適用于所有核酸——DNA、RNA、tRNA、rRNA、miRNA等——以及那些序列內的突變。
測序應用面對的另一難題是每樣本的成本。目前,每次測序運行可花費7000-10000美元。不管是需要對不同的患者樣本測序,還是需要對來自不同實驗的樣本測序,各個樣本分別測試(即使在一個設備(例如454或Solexa)的各個通道中測試不同的樣本),每樣本成本約為1000美元。本申請公開的發明提供了使用連接于每分子的實驗標簽,將不同的實驗或患者樣本合并在同一設備通道內的單次運行中的能力。這些標簽被測序以獨特地分別識別出被合并為單個測序樣本的來自各單個實驗或患者樣本的所有分子。例如,通過將100個患者的樣本(來自每患者樣本的qNPS產物,各自以不同的獨特實驗標簽標記)合并在單次例如3天的運行中,每樣本的測序成本僅為約10美元。以測量100基因/樣本的該水平成本,診斷測試以及常規實驗或篩選測定即使在加上處理樣本(例如采集樣本、處理樣本等)的成本后也是容易接受的。使用實驗標簽不僅降低每樣本成本,而且它們可實現高樣本通量,例如,通過使100或1000不同實驗在單個通道內單次運行中被測序。例如,每通道合并100個樣本,8000個樣本可在8通道測序儀的單次運行中被測試。這可實現,例如,覆蓋許多基因靶標/樣本的高通量篩選應用。 qNPS方法的另一優點是其產生的簡化的數據分析。由于僅靶標分子與所述核酸酶保護探針雜交,樣本中其余的基因組DNA和RNA要么被破壞要么不能測序(例如,由于不具有連接在其上的測序銜接體分子),僅留下定量的核酸酶保護探針組或其保護的要測序的靶標寡核苷酸。由于這些探針和靶標的序列是已知的,因此參比序列數據庫僅需由這些序列而非整個基因組組成。此外,如果常規的基因標識標簽組被納入被測序的NPP加合物中,那么測序信息的解卷積會進一步簡化。本質上,序列分析可簡化為“數”每個識別的已知序列或合成核酸酶保護探針的部分序列以及生成的可測序加合物或所述靶標寡核苷酸的數量,以及確定所述靶標寡核苷酸的序列的任何差異。此方法的另一優點是可對稀少的分子測序,或者例如可由宿主組織對例如來自病原體的靶標分子測序而不需繁重地對宿主基因組測序。同樣重要的,當測序用于定量測量表達基因的水平時,重要的是能夠測量以數千拷貝/細胞的水平表達的基因,以及以每細胞僅一個拷貝的水平被測量的基因。通過消除全基因組的背景,并僅關注目的靶標基因,并實際上通過將所述靶標基因本身縮短為較短序列(例如50個堿基的所述核酸酶保護探針),或者縮短為甚至更短的基因標識標簽,提高測序的效率以及擴大豐度極為不同的測量基因的動態范圍。僅對所述核酸酶保護探針測序或使用基因標識標簽還可減少讀取時間,使得可快得多地獲得測序結果。此外,由于qNPS方法利用樣本的裂解,并且不需要提取或反轉錄(例如對于基因表達),因此其可完全并簡單地自動化。這對于高通量篩選是必需的,并且對于診斷測定或常規實驗室測定也是有利的。此外,裂解的樣本含有所有靶標分子,例如所有mRNA和所有miRNA。提取方法經常丟失mRNA和miRNA的一種或另一種的一部分,或者需要將RNA與DNA分離。需要明確的是,qNPS可在任何樣本上進行,包括(例如)純化的RNA、miRNA、DNA或cDNA。所有類型的靶標分子均可通過qNPS測量。實例是DNA、DNA單核苷酸多態性(SNP)、甲基化的DNA水平、mRNA表達、mRNASNP、miRNA水平、rRNA水平、siRNA、tRNA、基因融合或其他突變、蛋白結合的DNA或RNA,以及cDNA等。可與設計后核酸酶保護探針之雜交的任何物質,——即使所述靶標分子自身從未被測序并且通常大多數優選被破壞,——均可通過測序來定量和識別。核酸酶保護探針可保護所述靶標分子不被核酸酶作用以進行測序,并且基因標簽和實驗標簽可連接于靶標分子而非核酸酶保護探針。在兩者中的任一種情況下,如NPP —樣,之后任選地所述靶標分子可有可無。測序本文使用的“測序”是指確定無支鏈的生物多聚體的一級結構(或一級序列)。測序結果是稱為序列的符號線性圖示,其簡明地總結了被測序分子例如多核苷酸或多肽的原子水平結構的大部分信息。當分子是多核苷酸例如RNA或DNA時,測序可用于獲得分子在核苷酸水平上的信息,然后所述信息可用于解密關于所述分子自身和/或由其編碼的多肽的多種二級信息。當所述多核苷酸是RNA分子時,由于所述分子不穩定及其易于被核酸酶(例如RNA 酶)降解,通常優選首先將樣本反轉錄以產生DNA片段,然后可通過本文所述的任意方法測序。這仍是本發明的一個可選實施方案。然而,qNPS避免了對反轉錄的需要,而是通過雜交和核酸酶活性將所述靶標RNA序列轉化為互補DNA探針序列。如本領域理解的,有時需要對RNA分子而非編碼RNA的基因序列測序,因為RNA分子不一定與其DNA模板同線性。并且某些生物體本身就是RNA,例如RNA病毒。例如,內含子切除和剪接是導致所述兩種多核苷酸之間的非線性的兩個事件。在本發明的其他實施方案中,可使用本領域已知的其他方法來分析細胞或組織的全轉錄組。任何測序方法均可用于本發明。DNA測序是確定給定DNA片段的核苷酸順序的方法。到目前為止,已使用鏈終止方法(由Frederick Sanger開發)進行大多數DNA測序。此技術利用使用修飾的核苷酸底物的DNA合成反應的序列特異性終止。在鏈終止物測序中,通過使用在模板DNA上的特異位點與所述模板互補的短的寡核苷酸“引物”在所述位點處引發延伸。使用復制DNA的酶一DNA聚合酶一來延伸寡核苷酸引物。與所述引物和DNA聚合酶一起,還包含四種脫氧核苷酸堿基(DNA構件),以及低濃度的鏈終止核苷酸(最常見為雙脫氧核苷酸)。通過DNA聚合酶有限引入所述鏈終止核苷酸產生僅在使用特定核苷酸的位置處終止的一系列相關DNA片段。然后,在平板聚丙烯酰胺凝膠上,或者現在更常用的,在充滿粘性聚合物的狹窄的玻璃管(毛細管)內,通過電泳按大小分離所述片段。標記引物的另一方法是標記終止物,通常稱為“染料終止物測序”。此方法的主要優點是可在單個反應中進行完全測序組,而不是引物標記方法所需要的四個反應。這通過分別以不同熒光染料一其在不同的波長下發出熒光一標記所述雙脫氧核苷酸鏈終止物的每一種來實現。此方法較所述染料引物方法更加容易、經濟和快速。焦磷酸測序已被例如Biotage (用于低通量測序)和454Life Sciences (用于高通量測序)商業化。后一個平臺可用單個機器在7小時運行中大致測100兆堿基。在基于陣列的方法(被454Life Sciences商業化)中,單鏈DNA與小珠退火并通過EmPCR擴增。然后,將這些DNA結合的小珠連同在ATP的存在下產生光的酶置于纖維光學芯片上的孔中。當將游離核苷酸從此芯片上洗下時,當核苷酸與其互補堿基對結合時產生ATP,隨之產生光。加入一種(或多種)核苷酸導致產生光信號的反應,所述光信號為設備中的CCD照相機所記錄。信號強度與納入單核苷酸流中的核苷酸的數量(例如同聚物延伸長度)成比例。目前的測序儀(SoleXa、454、Solid)將靶標序列捕捉到測序芯片或小珠上,擴增后測序。下一代單分子測序在捕捉后不進行擴增。使用銜接體序列或Poly A尾進行捕捉。或者,可無捕捉步驟。取而代之的是,(例如)捕捉的聚合酶可用于捕捉經過的寡核苷酸并對其測序。454或Solexa的測序通常涉及文庫制備,所述文庫制備通過DNA的隨機片段化,繼而體外連接常用銜接體序列而實現。對于qNPS,DNA隨機片段化的步驟可被繞過,并且銜接體序列可與核酸酶保護探針,或者核酸酶保護探針的基因標簽或實驗標簽體外連接。Shendure and Ji (2008)綜述了測序方法,并且隨后還簡單總結了所述454和Solexa系統。對于454和Solexa,分別使用乳液PCR或橋式PCR產生克隆聚集擴增子用作測序特征。這些方法的共同點是,來自任何給定的單文庫分子的PCR擴增子最終空間聚集到平面基板上的單一位置(Solexa,原位polony,橋式PCR),或到微米級小珠的表面(454,乳液PCR),所述 小珠可回收并排成陣列(乳液PCR)。所述測序過程本身由酶驅動生物化學和基于成像的數據采集的交替循環構成。這些平臺依賴于借助合成的測序,即引發的模板的連續延伸。酶辨識和成像的連續迭代用于為每個陣列特征建立連續的測序讀取結果。數據通過每個循環(例如,通過聚合酶引入熒光標記的核苷酸)的全陣列成像采集。對于454,測序引物與通用銜接體在適當的位置和方向雜交,緊鄰未知序列的起始或qNPS可測序加合物例如核酸酶保護探針或者基因或實驗標簽。測序通過焦磷酸測序進行。將攜帶擴增子的小珠與嗜熱脂肪芽孢桿菌(Bacillus stearothermophilus, Bst)聚合酶和單鏈結合蛋白一起預孵育,然后沉積在皮升級孔的微陣列中,每孔一個小珠,使此生物化學兼容基于陣列的測序。還加入了更小的小珠,攜帶固定化酶也是焦磷酸測序(ATP硫酸化酶和螢光素酶)所需要的。在測序過程中,半有序陣列的一側用作流動槽(flow cell),以引入和除去測序試劑。另一側與用于基于CCD的信號檢測的光學纖維束連接。在每個循環中,引入單一種類的未標記的核苷酸。對于這種引入導致納入的測序,焦磷酸借助ATP硫酸化酶和螢光素酶釋放,對于特異性陣列坐標產生由CCD檢測的突發光。經過多個循環,檢測到的納入事件的模式揭示了各個小珠代表的模板序列。對于Solexa,擴增的測序特征通過橋式PCR產生。正向和反向PCR引物均通過柔性接頭連接于固體基質,從而在擴增過程中從任何單一模板分子產生的所有擴增子保持固定并聚集到陣列上的單一物理位置。所述橋式PCR在依賴于Bst聚合酶的延伸與甲酰胺變性的交替循環方面有些非常規。所產生的“簇(cluster)”各自由約1000個克隆擴增子構成。幾百萬個簇在單流動槽上的八個獨立“泳道”的每一個“泳道”內可被擴增成可辨別位置(從而可在相同設備運行中平行進行8個獨立實驗的測序)。在簇產生后,擴增子是線性化的,并且測序引物與目的區域側翼的通用銜接體序列雜交。每循環的序列辨識(sequenceinterrogation)由使用修飾的DNA聚合酶和四種核苷酸的混合物的單堿基延伸構成。這些核苷酸是“可逆的終止物”,因為在3’羥基位置的化學可裂解部分只允許在每循環中發生單堿基納入,并且四種熒光標記之一——也是化學可裂解的——對應每種核苷酸的身份。在四個通道中單堿基延伸并獲得圖像后,兩基團均化學裂解用于下一循環。目前常規進行最長達36bp的讀取長度。這決定了 qNPS加合物的目標長度(7個測序起始和實驗標簽堿基,10到15個喊基的通用捕捉序列2,以及5個基因標簽喊基)。
其他測序方法正在或將要開發,本領域技術人員可以看到,qNPS探針、基因標簽、實驗標簽和類似的可測序加合物(如下文討論)將適用于這些系統上的測序。qNPSqNPS是與測序根本不同的方法,該方法使用定量的核酸酶保護測定以將組織裂解液中的不穩定的RNA或其他靶標分子(或純化的RNA或DNA),甚至當交聯時,化學計量地轉化為穩定的單鏈DNA靶標(核酸酶保護探針),所述單鏈DNA靶標可在溶液中回收而無需捕捉或分離,所述回收利用核酸酶保護步驟并(視需要)用堿處理以將所述核酸酶保護探針與保護性靶標分子分離,并且對于RNA,水解所述RNA靶標。然后,核酸酶保護探針在SI核酸酶水解后剩余的量通過測序確定,所述測序可包括測序探針自身和檢測所提到的部分探針序列。目前,這種核酸酶保護測定的產品(一般稱為qNPA ,H. T. G.,Inc.,Tucson, AZ 85706)是使用高度敏感的基于陣列的讀取結果測量的,從而提供了每個靶標基因的水平的度量。參見例如US6, 232,066、US 6,238,869、WO 2008-121927,其以引用的方式全文納入本文。大量出版物還描述了 qNPA 的應用(Altar et al, 2208 and2009, Kris et al, Martel etal 2002 and 2004, Roberts et al, Rimsza et al, Sawada et al, and Seligmann et al)。qNPS測定可以以被設計成許多不同的方式,但都利用了這樣的觀念,即產生NPP,其經受核酸酶反應(例如,SI降解)作為被測序的中心加合物,或產生加合物,其部分或全部可被測序以特異性地識別和定量所述NPP或提到的剩余核酸酶保護探針序列,從而識別和定量所述靶標基因。所述方法還會識別靶標基因的一部分中的任何改變的存在,這是由核酸酶保護探針或者在靶向同一基因的多個核酸酶保護探針之間測量的。從用于qNPS測定的樣本產生所述核酸酶保護探針(NPP)如圖I所示進行,與公開的 qNPA 方法相似(Roberts et al, 2007;Martel et al2002 and 2004)。所述測定包含被設計成對每個不同的靶標特異的一種或多種不同的核酸酶保護探針。因此,100個基因的測量需要設計和合成100種不同的核酸酶保護探針(每個基因一種)或者數百種不同的NPP(每個基因數種)。這些NPP最優選由DNA構成,長度可為約10至約100或約200或更多堿基,但更優選20至75堿基,最優選20至50堿基。圖I的步驟I示出了將裂解試劑和大大過量的核酸酶保護探針(NPP)加入樣本。在此圖中,只示出了一種靶標分子(RNA)和核酸酶保護探針,但一個RNA靶標分子被指示為與組織交聯(由“X”指示),另一個為溶解形式。所述測定也可對提取(或純化)的RNA或其他靶標分子進行。所述探針被設計成對所述靶標分子特異,具有類似的Tm但具有足夠獨特的序列,以允許所述探針通過測序區分,或支持基因標簽結合的特異性雜交。優選將所述樣本在約95°C或約105°C加熱約10分鐘以變性所述靶標分子,使其成為單鏈并可進行雜交。使用不同的變性溶液,此變性溫度可以改變,只要溫度和緩沖液組成的組合可導致單鏈靶標DNA或RNA的形成。然后,將所述樣本在規定的溫度孵育一段時間(例如,對于50-mer核酸酶保護探針,60° C下6小時)以允許探針與所述靶標分子雜交。加入一種核酸酶(例如,SI核酸酶)或核酸酶混合物并進行孵育(例如對于50-mer核酸酶保護探針,50°C下60分鐘),在這段時間內核酸酶破壞所有多余的未 與靶標分子雜交(并因此是不受保護的)的核酸酶保護探針、樣本中的所有非靶標分子(例如RNA或DNA)和所述靶標分子的突出單鏈區,并且視需要在不與所述靶標序列配對的堿基處切斷所述探針,留下化學計量量的靶標分子/核酸酶保護探針雙鏈(步驟2)或部分探針雙鏈(其中存在提到的不配對)。見下文。在此圖中,“X”代表由固定發生的靶標分子與組織的交聯。所述核酸酶保護探針與所交聯的靶標分子雜交而無需逆轉交聯。可以選擇條件從而導致非配對堿基的單核苷酸差異不被切斷,或者可使用僅將未配對堿基切斷至雜交的核酸酶保護探針的末端的核酸酶,例如核酸外切酶。核酸酶處理后,所述探針仍可與交聯的靶標分子序列聯結。然而,在步驟3中加入堿基,并將所述樣本加熱到95°C。這離解了所述靶標分子/核酸酶保護探針二聚體,留下單鏈狀態的核酸酶保護探針,對于RNA,還水解所述RNA靶標分子。對于qNPS,這一點后的步驟可能不同,取決于將如何測序所述核酸酶保護探針。由所述NPP形成的不同加合物在連續的圖中示出。如果不使用基因標簽或實驗標簽,那么所述探針可直接與適合所述測序系統的銜接體分子連接(或者可使用例如末端脫氧核糖核酸轉移酶Tdt加上polyA尾巴),并用于測序(圖2A)。圖I (步驟4到8)和圖2示出了在允許雜交的溫度下為每種核酸酶保護探針加入過量的標簽接頭(并與之孵育)。基于標簽接頭的使用,可形成幾種可能的可測序加合物。例如,可將標簽接頭的25個堿基設計成與一種特異的核酸酶保護探針的3’末端互補,從而將與該探針雜交(步驟4)。可設計標簽接頭的 其余部分,使其在加入過量的這些標簽(圖I步驟5)后雜交(并因此在所述核酸酶保護探針的3’端捕捉)基因標簽序列(圖2B)和/或(任選地)實驗標簽序列的通用(或實驗特異序列)部分(圖2C),或僅實驗標簽的通用(或特異)部分(圖2D),然后在允許這些標簽雜交所述標簽接頭的溫度下孵育。注意這些步驟可組合或單獨進行。對于測序儀在要測序的分子一端或每端需要銜接體捕捉序列的情況,所述標簽接頭可延伸所述核酸酶保護探針的全長,并進一步包括與所述(例如,5’)銜接體序列互補的序列。然而,更優選地,加入與核酸酶保護探針的5’端雜交并包含與5’銜接體序列互補的序列的第二銜接體接頭(步驟6),然后再加入所述銜接體序列(步驟7)。在此相同情況下,所述基因標簽或所述實驗標簽,無論哪一種作為3’端末端倒數第二序列,均可以用于測序的3’銜接體序列合成。在所述完整加合物雜交在一起后,可將所述序列使用例如T4DNA連接酶(或非酶化學法,如例如Pinoet al, Lutay et al, Schabarova et al 或 US 7033753 中所描述)連接在一起,如圖 I (步驟8)和圖2中角箭頭所示,以形成完整可測序加合物。在此方法中,所有來自要測序的靶標RNA、DNA等的寡核苷酸都是合成的,通過雜交和(例如酶或非酶)連接裝配,并通過銜接體序列或(例如酶)多聚腺苷酸化制備以捕捉到所述測序芯片上。雖然示出的可測序加合物包含所述NPP,然而本領域技術人員會看到,含標簽接頭的加合物也可制備為要測序的加合物(制備為所述可測序加合物),或者,如果不被破壞,所述靶標寡核苷酸可制備為可測序加合物。如果所述靶標寡核苷酸被測序或包含可測序加合物,那么所述NPP可包含非可測序組件,例如LNA、氨基酸、肽、肽核酸、適體等。可制備在兩端均有銜接體的可測序加合物,從而將其切斷(例如通過第二核酸酶反應),提供兩個可測序加合物。有許多方法將poly-A (或poly-T)捕捉序列連接至所述可測序加合物。一種是酶法(例如,使用脫氧核苷酸轉移酶,Tdt)。另一種是通過雜交和連接。第三種是簡單通過合成到終止所述可測序加合物的3’寡核苷酸上。理想地,只有所述可測序加合物結合于所述測序介質,而副產物被除去。例如,圖3或4中所示的銜接體序列可為poly-A,而清除可通過凝膠或核酸酶(例如SI)。對于核酸酶清除,所述保護性序列包含poly-T。使用實驗標簽是為了將一個樣本與另一個區分開。步驟I到5將在對于每個樣本的不同測定(例如微孔板的不同孔)內進行,但所述標簽接頭已被設計為還捕捉實驗標簽的通用序列(見圖2C),并且所述實驗標簽(例如,還含有所述3’銜接體序列)將在步驟5后加入,然后進行步驟6-8,全部在區分不同實驗或不同患者樣本的不同反應容器進行。本領域技術人員可看到,對于各個實驗標簽能夠合成不同的標簽接頭,所述標簽接頭包含所述特異性實驗標簽的互補序列,而不是加至各個實驗標簽的通用序列,將所述實驗標簽的長度縮短至恰好是所述實驗特異性序列。在連接所述實驗標簽(或基因標簽加實驗標簽)后,可合并不同的樣本,因為實驗標簽的序列會確定測序的加合物來自哪個反應或來自哪個患者,因此對于凝膠純化(或其他純化方法或不需實際分離的清除),每次測序運行只需運行一個凝膠(或清除或純化反應或過程)。用T4DNA連接酶的連接需要5’磷酸基才能工作。通常,合成的寡核苷酸無5’磷酸基,然而,可在合成過程中加入5’磷酸基。因此,如果合成所述銜接體接頭和標簽接頭從而使其對接在一起,但沒有5’磷酸基,它們將不會連接在一起,促進例如隨后的清除。另一種向寡核苷酸加入磷酸基的方法(除合成以外)是使用T4多核苷酸激酶和ATP。可使用其他連接方法,包括非酶方法。然而,連接不是必需的步驟。在NPP與標簽接頭和標簽雜交,或者如果作為核酸酶保護探針的一部分納入的標簽可為互補寡核苷酸所 保護,形成具有核酸酶抗性的或可純化的復合物,不需要連接,因為所述標簽已經納入所述NPP并將反映NPP的量,并因此反映靶標DNA或RNA的量,并且將在測序時識別NPP,并因此識別靶標RNA/DNA,即便其在測序時與所述NPP分離。所有之前的步驟均為試劑添加和孵育,直至凝膠純化或其他分離方法前沒有分離(如果分離是必需的或想要的)。過量的每種試劑仍存在于反應混合物中(如圖I所示的每種正在產生的加合物的左側),以及不完全加合物例如標簽接頭與所述標簽分子但不是所述核酸酶保護探針雜交的產物,或者所述銜接體分子與所述銜接體接頭雜交的產物,但在復合物中也不包括所述核酸酶保護探針。在這一點上,有幾個可能的后續步驟,但只示出了一個(凝膠純化)。優選的下一步驟是在捕捉到所述測序珠或芯片上之前清除所述混合物。如果與所述核酸酶保護探針雜交的銜接體接頭和標簽接頭的序列被幾個堿基隔開(在加合物裝配后通過酶法添加磷酸基的情況下),或者它們不被磷酸化(即使它們互相對接),那么它們不會連接在一起。因此,可將所有實驗或患者樣本的反應混合物合并在一起,加熱或變性以形成單鏈寡核苷酸,并純化可測序加合物,例如通過基于其可觀更長長度的凝膠電泳。也可以使用本領域已知的或從本領域改進的進行清除的其他方式。圖2B到2E示出了具有銜接體序列的加合物的制備。它們也可制備為不具有這些序列,但以一些其他形式捕捉到所述測序芯片上或具有用于測序的制劑。例如,取而代之的,可將Poly-A尾巴合成到所述可測序加合物的3’末端。如果需要互補鏈不是多聚腺苷酸化,那么可以封閉該序列的3’末端,例如通過合成具有3’氨基殘基或具有3’碳(如C3)間隔區的寡核苷酸。這是使用合成序列而不是靶標本身或作為可測序加合物一部分的所述靶標的生物合成衍生物來制備可測序加合物的優點。一些測序系統可直接捕捉可測序加合物,例如通過連接的聚合酶或寡核苷酸結合部分,或者通過化學或電的或電化學方法,從而所述可測序加合物不需要特異性銜接體或捕捉序列或部分。清除所述測序反應產物的優選方法是例如通過再次使用SI核酸酶進行第二核酸酶消化。在一種情況下,在連接前加入將實驗標簽/銜接體序列,并且如果所述銜接體接頭和標簽接頭被設計為彼此對接,其中之一的5’末端被磷酸化,并且加入3’互補實驗標簽/銜接體序列從而其可在與所述實驗標簽/3’銜接體序列雜交后連接于所述標簽接頭,那么含有核酸酶保護探針的加合物和所述接頭/保護性互補序列均會(分別)連接在一起,當所述接頭與所述核酸酶保護探針連接時,形成彼此雜交的兩個完全加合物(圖3A)。在導致所有比這兩個加合物短的加合物解離的溫度下以SI核酸酶處理將破壞所有其他種類(其中一些示于圖3A),只留下含有所述核酸酶保護探針的可測序加合物以及所述接頭加合物。一旦變性,只有具有合適的捕捉銜接體序列的加合物(所述核酸酶保護探針加合物)將被捕捉到所述測序芯片或小珠上,并且含有接頭的加合物將被洗掉。這種“雙SI”方法的優點是,直到所述加合物被捕捉到測序芯片或小株上之前沒有分離步驟。圖4A示出了形成所述可測序NPP加合物的不同方案,其中所述標簽接頭在與所述實驗標簽(ET)可變序列(VS)(在測序時唯一識別所述孔或實驗的序列)互補的殘基處含有肌苷,然后是與3’銜接體(3’Acomp)互補的序列。此相同的含肌苷接頭可用于形成上述可測序加合物(圖I和2),并且其中需要多聚腺苷酸化(而不是使用銜接體序列),或者其中使用凝膠純化或其他分離或純化方法。圖4B示出了使用不需要連接并可通過合成制備的單個合成結合5’銜接體標簽/標簽接頭/3’銜接體互補序列。在使用不需擴增的系統——例如Helic0s單分子測序方法——的情況下,可能需要連接poly-A尾巴。圖4C和D示出了該方法的方案,其可以利用凝膠純化進行清除(例如,在多聚腺苷酸化之前),或者如示出的在多聚腺苷酸化、捕捉和測序之前利用核酸酶步驟進行清除。在這兩種情況下,由于NPP本身并不被測序,只需要標簽接頭來將合適的基因標簽和實驗標簽與所述NPP雜交,從而它們可連接在一起。在核酸酶步驟后,通過酶法將poly-A尾巴合成到3’端上。這可導致poly-A尾巴合成到所述標簽接頭的3’端上,從而它也將被測序,或者如果所述標簽接頭的3’端被封閉,那么所述poly-A尾巴將僅合成到所述含有NPP的加合物上。在所述NPP以其全部或部分被測序以確定所述靶標基因的情況下,所述poly-A尾巴或銜接體(視需要)可以直接或通過所述實驗標簽和/或標簽接頭連接于所述NPP,以實現其測序。在NPP與靶標(例如)DNA雜交并且所述系統利用所述NPP的直接測序的情況下,所述NPP保護的靶標序列(例如DNA)也可被測序,并被修飾以在與NPP相同的時間并以與NPP相同的方式測序。同樣,被構造為形成含有所述NPP的可測序加合物的任何互補接頭,可以以平行的方式處理,也可以轉換成可測序加合物。在這些情況下,兩個互補序列將被檢測、鑒定和計數,對所述方法提供一定水平的冗余。本領域技術人員可以想出在測序之前清除所述反應混合物的其他方法,例如使用 凝膠純化或生物素/抗生物素蛋白捕捉和釋放或毛細管電泳或大量分離或清除方法的任一種。例如,核酸酶保護探針可被生物素化或其它半抗原結合并被捕捉到抗生物素蛋白或抗半抗原包被的小珠或表面,洗滌,然后釋放以進行測序。同樣,連接的核酸酶保護探針加合物可被捕捉到互補的寡核苷酸上,洗滌,然后釋放以進行測序。所述捕捉寡核苷酸不需要具有特別的特異性,因為所述qNPS過程消除了大部分的基因組或轉錄組,僅留下已與靶標雜交的NPP,并且因為特異性將在測序水平上被確定。本領域技術人員還可看到,可清除和測序所述接頭復合物,而不是含有所述核酸酶保護探針的加合物。因此,所述可測序加合物可以是與所述NPP雜交的加合物,或所述NPP衍生的加合物。這些加合物的兩個實例示于圖5,雖然也可配置其他加合物。圖5A示出了使用與之前的圖和討論中相同的NPP的使用,但在這種情況下,加入含有所述3’銜接體、所述NPP的互補序列、以及位于通用序列(其反過來捕捉所述實驗標簽接頭)末端的突出基因標簽序列的寡核苷酸。此實驗標簽接頭反過來捕捉還含有所述5’銜接體序列的實驗標簽。如果使用核酸酶清除,那么需要加入保護性5’銜接體序列探針。在需要poly-A尾巴進行測序的情況下,所述銜接體序列不是必需的,并且不需包括在內。圖5B示出了 3’到5’的核酸酶保護探針的使用。此結構可用于前圖示出的或在之前的討論中描述的以及后面提到的加合物的任一種。可測序寡核苷酸(如接頭)與所述NPP雜交的部分,而不是使用基因標簽來確定基因。本領域技術人員會看到,存在關于探針的這些排布的多種變型和組合,無論是否形成含有所述NPP的用于測序的加合物。可測序加合物包括經歷核酸酶反應仍然存在的產物,或者衍生自所述產物或被用作模板。可測序加合物包括經歷核酸酶反應仍然存在并且是第二核酸酶反應產物的產物,或者衍生自所述產物或被用作模板。可測序加合物是一個或多個核酸酶反應的產物或衍生自所述產物。包含所述可測序加合物或用于裝配所述可測序加合物的合成寡核苷酸可被制備為允許或不允許酶或非酶修飾,例如連接或添加Poly-A序列。它們可以含有天然或非天然的核苷酸(例如,鎖核酸或LNA或者肽核酸或PNA等)。它們可在測序前在溶液中或表面 上進行擴增,或者擴增可在所述核酸酶保護步驟之前進行。對于在454或Solexa平臺上測序,所述可測序加合物必須首先被捕捉和擴增。這通常需要聚合酶反應。用于qNPS的常用裂解緩沖液是一種被設計成變性核酸酶以防止RNA破壞、促進雜交,同時允許SI活性的裂解緩沖液。這種類型的溶液可抑制聚合酶活性,從而抑制擴增,除非先洗滌芯片。洗滌也可用于除去不具有捕捉銜接體序列的核苷酸。在測序利用Poly-A尾巴進行捕捉的情況下,可在清除后使用末端脫氧核苷酸轉移酶(Tdt)—其在3’端延伸所述Poly-A殘基一合成。為防止含有接頭的加合物或不打算測序的加合物的3’末端被poly-A尾巴延伸,所述標簽接頭的3’殘基可被不支持多聚腺苷酸化的殘基或修飾殘基修飾(圖4C和4D)。本領域技術人員可看到,反向測序可以使用合適設計的含有所述核酸酶保護探針和其他含信息序列的加合物;或者,所述核酸酶保護探針的互補序列(某些情況下稱為“接頭”)以及加合物構建體,可以代替含有核酸酶保護探針的加合物被測序,只要所述互補加合物被合適地設計(例如,參見圖5)或者例如如在本申請中對含有核酸酶保護探針的加合物所描述的。于95°C在(例如qNPA)裂解緩沖液中孵育使得RNA可進行雜交,雖然此裂解產物的PCR可導致DNA擴增,表明所述裂解產物中可能有基因組DNA,只是對于NPP雜交沒有充分變性。于105° C孵育使基因組DNA可進行NPP探針雜交。105° C孵育后進行SI (核酸酶)處理會破壞所有未雜交的DNA以及未雜交的RNA和NPP。因為通過使用合適設計的、具有與NPP的3’或5’序列互補的序列的接頭探針,銜接體與所述單鏈NPP雜交并連接,因此未被SI水解的任何(例如,雙鏈)DNA (或相關RNA)不應具有與其連接的銜接體,并因此不會被捕捉到454和Solexa型測序儀使用的測序小珠或芯片上,并不會被測序。在所述NPP互補寡核苷酸被測序的情況下,至少一種銜接體可被直接納入作為所述序列的一部分,因此該銜接體序列不可能與有可能未被SI水解的DNA連接。在凝膠(或其他)純化的情況下,所述DNA可以與連接的加合物分離,從而在測序之前被除去。對于將Poly-A尾巴加入實驗標簽(或者在不使用實驗標簽的情況下加入基因標簽,或在不使用實驗標簽或基因標簽的情況下加入NPP)的單分子測序,任何DNA也可被多聚腺苷酸化,除非它在使用測序加合物的凝膠純化時被先分離(多聚腺苷酸化之前),或者在例如于例如105° C使用裂解,然后進行NPP雜交,然后在合適的條件下進行核酸酶(如SI)步驟的情況下被先破壞。在這個方案中,所述NPP可靶向mRNA的剪接點從而沒有DNA (其可能干擾mRNA的測量)會被測量。也可測量miRNA (或siRNA),雖然在這種情況下所述NPP的長度將僅為(例如)約22堿基以匹配所述miRNA的長度。通過在已經或尚未發生甲基化的位點形成堿基錯配,并且通過恰當地使用互補肌苷殘基,通過使用其他核酸酶或限制性酶來切斷所述錯配的殘基,可以測量DNA和表達的SNP以及DNA甲基化。這些加合物(為所述NPP所保護)的直接測序也是可能的。例如,DNA SNP可通過以下方式被測序使用可能存在SNP的序列的NPP,在所述單堿基錯配不被切斷的條件下用SI處理,然后通過在高于雜交Tm的溫度下孵育繼而加入大大過量的與所述靶標DNA雜交并允許合適地加入銜接體的接頭而使仍然存在的DNA靶標序列可以與所述NPP解離(所離解的NPP會競爭性地防止大大過量的接頭引起的重新解離)等,以形成包括所述靶標DNA自身及(視需要)實驗標簽的可測序加合物。在此 方法的改進中,所述NPP可含有與被保護序列內的SNP位點或多SNP或突變位點互補的肌苷以確保第一核酸酶步驟靶標DNA被保護,并且同樣所述接頭寡核苷酸可含有肌苷以在使用核酸酶清除步驟的情況下確保保護。或者,可使用具有可能突變的堿基的NPP探針。此夕卜,當野生型序列NPP在所述SNP或突變錯配處被核酸酶切斷時,可處理并測序所述NPP的具體序列以確定所述突變的存在情況和位置。在所述NPP用于在任何錯配均不被切斷或水解(例如通過使用核酸外切酶,或在較低嚴格條件下使用核酸內切酶,或通過使用需要多個相鄰錯配進行切斷的核酸酶)的條件下選擇含有突變的靶標(例如DNA)區域的情況下,可處理并測序所述靶標(例如DNA)以精確確定所述突變。也可納入非靶標寡核苷酸序列,所述非靶標寡核苷酸序列可用作允許捕捉到所述測序芯片上的銜接體,或者用作在合成時直接納入所述NPP的基因標簽或實驗標簽。此非靶標序列不會與靶標寡核苷酸雜交,并通常會被核酸酶切斷。然而,如果使所述NPP的這種非靶標序列與互補寡核苷酸雜交(在將所述NPP加入含有靶標寡核苷酸的樣本之前、同時或之后,但在核酸酶步驟之前),那么當以核酸酶處理時,由于每個堿基均與互補堿基雜交,所述非靶標NPP序列將被保護并且所述NPP將保持完整。可改變條件,從而即使在所述核酸靶標序列與所述NPP的非靶標序列之間有單個未雜交的堿基,這也是成立的。此方法可產生可直接測序的NPP加合物,其連接有所需要的銜接體序列,可被捕捉到所述測序芯片上并在不使用任何連接反應的情況下測序。本領域技術人員可設計方法以在測序前清除所述反應,以除去短的非靶標序列/互補序列雙鏈。例如,可在堿中加熱核酸酶處理后樣本以解離所述雙鏈,然后加入過量的與所述NPP的非靶標序列和所述核酸靶標特異性序列的一部分(例如前25個堿基)互補的寡核苷酸。因此,如果在此較長的寡核苷酸可雜交而較短的非靶標序列互補寡核苷酸不可雜交的溫度下進行雜交,那么就得到在第二核酸酶反應后將只含有已與核酸靶標雜交的NPP的配制劑。然后,可將此配制劑加熱以使其解離,然后加至其可通過其銜接體序列被捕捉并被測序的測序芯片。在需要更高敏感性的情況下,可擴增所述靶標寡核苷酸或由其衍生的產物,或者先對所述NPP產物進行PCR或其他形式的酶擴增。然后形成的產物可準備以與所述未擴增的NPP產物相同的方法進行測序,或者在擴增過程中,可納入所述基因標簽和/或實驗標簽和/或銜接體序列,作為例如所述引物和延伸構建體的一部分。即使當不需擴增時,也可進行一個或兩個循環的PCR或酶反應以連接基因標簽和/或實驗標簽和/或銜接體。由所述NPP通過后續生物合成步驟產生的此加合物也可通過雜交反應例如對于產生所述可測序NPP加合物或與所述NPP互補的加合物所描述的那些雜交反應來完成。清除可通過凝膠或其他純化方法,或在充分保護的情況下,通過后續SI (或其他核酸酶)反應或本領域已知的或從本領域改進的其他方式。另一類型的NPP是環形探針,類似于掛鎖(Padlock) (PadP)或環形DNA探針(例如類似于Baner et al or Prins et al描述的構建體)。PadP可測序加合物示于圖9。此PadP構建體可被構建為含有銜接體和標簽,其在探針與樣本中的靶標雜交后使用(例如)核酸外切酶時不會被切斷。例如,所述PadP探針可被合成為含有5’銜接體,以及位于其3’端的與所述靶標雜交的約10到約30或約50或約100或約200個堿基。可存在間隔區,然后是限制性核酸酶位點,然后是5’基因標簽,然后是與所述靶標雜交的PadP探針的剩余部分(另外的約10、約30、約50、約100、約200個堿基),在其5’端磷酸化以支持連接。因此, 當與靶標雜交(步驟I)時,所述PadP的探針的兩部分可連接以形成環形DNA加合物。通過循環,這可被擴增(步驟2)。在連接后,可將混合物加熱至約95° C以使所述環形探針與所述靶標(例如RNA)解離,然后降低溫度從而過量的探針可與在此情況下用作擴增模板的靶標(例如RNA)重新雜交,然后在連接后再次升高溫度,進行約30個循環以產生約30個拷貝的環形探針/靶標模板RNA。在步驟3中,使用核酸外切酶來破壞所有線性DNA (以及例如靶標RNA),包括過量的PadP,只留下所述環形PadP探針。步驟4視需要開始以所述實驗標簽進行標記的過程,首先以限制性酶處理以打開所述環形DNA探針,然后使用標簽接頭來雜交并連接所述實驗標簽。已經描述了用于形成所述PadP探針的實驗條件。NPP構建體可被設計為可直接被測序,一種稱為“直接核酸酶探針測序”(DNPS)的方法。一種這樣的構建體示于圖I。在所述核酸酶保護探針被直接測序并且使用加入用于測序的銜接體序列或加入Poly-A尾巴或其他捕捉分子的目前商業方法的情況下,所述SI產物可被直接測序。然而,當使用接頭將加合物連接在一起時,由于加入銜接體、基因標簽、實驗標簽或其他序列,過量的標簽探針、銜接體或接頭,可能需要在測序前在“清除”步驟中消除。可以使用數種策略。最簡單的策略是在低于將被測序的連接加合物(例如,探針、檢測接頭、實驗標簽、基因標簽和(視需要)銜接體的復合體)的解鏈溫度(Tm)、但高于所述接頭與復合于所述加合物的組分的接頭但不復合于所述完全加合物本身的解鏈溫度的溫度下孵育。以這種方式,它們解鏈分離,并且連同未雜交的接頭、實驗和基因標簽被SI (或其他核酸酶或核酸酶混合物)破壞。然后,破壞(例如)SI活性,例如通過加熱到95° C或通過酶法例如使用蛋白酶K或使用抑制劑。這種“兩階段”核酸酶保護方法可形成這樣的方案,即直至捕捉到所述測序表面上的時點,沒有任何分離步驟只有加入過程。可進行通過測序核酸酶保護探針來測序基因并確定豐度,而無需測序整個核酸酶保護探針。如果選擇所述核酸酶保護探針的3’端使得末端2到約7或約25個堿基的組合對每個測量的基因呈現唯一的序列,那么這是對于確定所述基因需要測序的全部核酸酶保護探針,并且通過計數被測序的這類加合物的數量,可確定樣本中每種基因的量。實驗標簽(對每個實驗不同的標簽)可附加于所述核酸酶保護探針以使得多個實驗的qNPA產物可合并在一起進行測序。
如何測序和量化剪接點、外顯子和突變的實例,以及完成所述核酸酶保護步驟后的結果示于圖6A。如何測序單核苷酸多態性(SNP)和甲基化DNA的實例示于圖6B。這些單堿基修飾是利用其他酶例如RNase的活性來檢測表達的SNP,或者利用亞硫酸氫鹽處理繼而尿嘧啶DNA糖基化酶檢測甲基化DNA位點的結合效應而檢測的。本領域技術人員可以看出如何類似地通過測序檢測和測量DNA SNP。在每種情況下,設計一種對照序列,對靶標基因或所述靶標基因的所有變體都是共同的,還有對(可能突變或甲基化的)目的位點具有特異性的探針。探針還可被設計為與特異性剪接點、可缺失的特異性外顯子或特異性基因融合體雜交。紅色的“x”表示探針序列未被保護并因此被例如SI降解,或者其中所述靶標序列會被切斷并且因此所述核酸酶保護探針會解離并被SI破壞。在只有單個錯配堿基的情況下,可能需要向例如SI中加入其他酶例如RNase,或需要使用切斷所述單堿基的不同酶。本領域技術人員會看出,存在可單獨使用或組合來進行這些切斷的大量酶、修飾酶或具有類似活性的分子。所述核酸酶保護探針可通過(使用本發明他處所述的方法)加入實驗 標簽而被進一步修飾,以使得來自多個實驗的樣本可合并到單次測序運行中。所述測序銜接體可以連接到所述核酸酶保護探針上(或在使用實驗標簽的情況下,如果所述實驗標簽不是以所述銜接體序列在其3’端自身合成的,也可連接至實驗標簽)。可將所述核酸酶保護探針的5’端在其合成過程中磷酸化,然后可使用接頭,所述接頭與所述核酸酶保護探針的5’堿基(例如,25個堿基)雜交并具有與5’銜接體序列雜交的互補序列,從而(例如,使用T4DNA連接酶)使所述銜接體附加于所述核酸酶保護探針的5’端(在這里它們可連接在一起)。或者,加入ATP并使用合適的DNA連接酶(例如,T4DNA連接酶)可自磷酸化并連接。對于3’銜接體,所述銜接體自身可被磷酸化,并且所述接頭被設計為與所述核酸酶保護探針的3’堿基(例如,25個堿基)雜交并包含所述3’銜接體的互補序列,從而其以使其可連接到所述核酸酶保護探針上的方式雜交并添加至所述探針的3’端。在合適的條件下,也可以使用T4多核苷酸激酶和ATP使5’端磷酸化,然后使用T4DNA連接酶連接。在其他合適的條件下,T4DNA連接酶可自磷酸化,然后連接。在需要將Poly A尾巴加至所述核酸酶保護探針的3’端的情況下,可以使用Tdt將其加入。在一種優選方法中,存在一種(或多種)核酸酶保護探針測量靶標基因的序列,所述基因在野生型和突變體之間是同源的,或者在DNA甲基化被測量的情況下不進行甲基化,然后針對所述突變或DNA甲基化的位點設計第二探針。這樣可確定總水平以及突變比例。也可簡單地通過制備針對所述靶標基因的多個區域的探針然后從qNPA反應測序所述探針而使用qNPS來檢測未知的突變。所述探針可納入包括實驗標簽的構建體中,銜接體序列可納入用于測序的加合物中。可以利用一種酶或酶的組合的核酸酶活性來切斷錯配的堿基,并視需要檢測SNP。在那些堿基的位置接近所述核酸酶保護探針的末端的情況下,在切斷溫度下整個短鏈會解離開并被破壞,留下變短的探針序列。如果接近所述探針的中部,那么可常規地設計條件從而所有序列將解鏈解離開并被破壞。或者,如果SNP或多個錯配堿基位于近所述核酸酶保護探針的中間區域,可使用這樣的條件所述核酸酶保護探針被切斷但不解離開,那么測序將識別所述特異性突變位點。通過使用針對相同基因的多個探針,可比較所述探針數量來確定突變在哪里發生。在這種情況下,可以以目前在各自平臺上測序所使用的方式進行所需銜接體的連接。剩余的所述核酸酶保護探針末端的序列不會知曉,因此不能設計銜接體接頭序列。或者,可使用帶有核酸酶保護探針末端雜交肌苷序列
的銜接體-此時不必知道所述核酸酶保護探針的末端的具體組成。或者,可如他處所述
進行所述銜接體修飾過程。所述銜接體將被合適地連接至完整的NPP,并且因此僅這些會被測序。在所有給出的實例中,所述銜接體序列、poly-A序列或完全根據需要的其他所需的捕捉分子可以使用本領域已知的方法加至所述NP或具有基因標簽或實驗標簽的加合物,或者不使用這些實例中多種情況下描述的接頭和方法進行測序。對于單分子測序儀,可測序帶或不帶實驗標簽和基因標簽的核酸酶保護探針或連接有3’捕捉序列的探針,而根本不需要銜接體序列或僅在3’端具有銜接體(或捕捉)序列。對于實驗標識標簽和基因標識標簽的連接,連接步驟可能是必需的(例如,使用T4DNA連接酶),然后是清除,然后在必要時(例如,對于下一代測序儀如Helicos),可能需要只連接一個銜接體序列(例如,在3’端),或者連接或合成poly A尾巴,使用(例如)末端脫氧核苷酸轉移酶(Tdt)在poly A尾巴的3’端延伸,或者連接另一種通用捕捉序列或分子以允許被捕捉到測序芯片上。在本發明的此處和他處描述的構建體均可被制備以在這些設備上進行測序。圖2、4和5示出了為在所述測序儀的同一運行/通道內的多路實驗,以及為使用基因標識標簽來減少所需的讀取長度而設計的構建體。對于標簽的連接,在進行核酸酶保護步驟3-5后進行連接步驟是必需的(例如,使用T4DNA連接酶(lygase)),然后是清除,然后在必要時(例如對于下一代測序儀如Helicos),使用末端脫氧核苷酸轉移酶(Tdt)在polyA尾巴的3’端延伸以允許被捕捉到測序芯片或合適的銜接體分子上。要注意,如果所述裂 解緩沖液抑制這些步驟的任一個,那么可使用允許逆轉錄和PCR的稀釋緩沖液。基于陣列的測定的接頭檢測可用于將實驗標簽連接至所述核酸酶保護探針。然后,使用T4DNA連接酶將所述探針和所述標簽連接在一起。還可納入基因標識標簽,有可能將所述序列讀取降低至10個堿基(正好所述兩個標簽)。或者,通過選擇靶標基因序列區域從而使所述核酸酶保護探針的3’端對每個基因是獨特的(例如,5-7個3’末端堿基的序列是獨特的),僅此區域必須被測序以確定每個測量的基因。可將不與靶標DNA或RNA互補的標簽直接納入所述NPP (例如通過合成),并在核酸酶步驟中由互補的寡核苷酸序列保護,因此其不會被水解,或者其可由耐核酸酶水解但仍可測序的序列構成。通過將所述標簽測序寡核苷酸與所述靶標序列對接起來,可防止核酸酶切斷,只要在所述NPP構建體中沒有未配對的堿基。通過測序進行qNPA測定的檢測步驟的優點包括測序而無需例如從固相例如組織中提取;避免對多個樣本的每一個分別進行檢測操作——全部均可在一個溶液中同時進行;避免例如由于使用高濃度的檢測接頭引起的探針之間的弱交叉反應;增強SNP測定;等
坐寸o在一個實施方案中,本發明提供以下方面方面I :可測序加合物不含有所述靶標寡核苷酸。方面2 :可測序加合物不含有所述靶標寡核苷酸,也不是使用生物合成步驟形成。方面3 :可測序加合物包括經歷核酸酶反應仍然存在的產物,或者衍生自所述產物或用作所述產物的模板。方面4 :可測序加合物包括經歷核酸酶反應仍然存在并且是第二核酸酶反應的產物,或者衍生自所述產物或用作所述產物的模板。方面5 :可測序加合物是一個或多個核酸酶反應的產物或衍生自所述產物。方面6 :可測序加合物通過使用合成寡核苷酸形成。方面7 :可測序加合物通過使用合成寡核苷酸和雜交反應形成。方面8 :如7中的可測序加合物,還由使用包含所述可測序加合物的連接反應形成,或用于裝配所述可測序加合物。方面9 :包含所述可測序加合物或用于裝配所述可測序加合物,基于NPP裝配或通過納入NPP的合成寡核苷酸。方面10 :包含所述可測序加合物或用于裝配所述可測序加合物的合成寡核苷酸,被制備為允許或不允許酶修飾,例如連接或添加Poly-A序列,并且包含或不含非天然核苷 酸(例如鎖核酸或肽核酸等)。方面11 :含有NPP或基于NPP裝配的可測序加合物在測序前在溶液中或在表面上被擴增。方面12 :含有這樣的序列的可測序加合物,即該序列在產生一定量的可測序加合物后被連接,所述量可定量地反映靶標寡核苷酸的量,該靶標寡核苷酸的序列(例如基因標簽)可用于識別所述加合物并因此識別所靶標寡核苷酸。方面13 :含有這樣的序列的可測序加合物,即該序列在產生一定量的可測序加合物后被連接,所述量可定量地反映靶標寡核苷酸的量,(其序列,例如實驗標簽)可用于確定含有所述靶標寡核苷酸的反應,并因此允許合并多個反應并同時測序。
本發明的多個特征和隨之而來的優點將被更充分地理解,當結合附圖考慮時所述特征和優點將被更好地理解,所述附圖中幾幅圖中類似的標識符號表示相同或相似的部分,其中圖I提供從用于定量核酸酶保護測序(qNPS)測定的樣本產生所述核酸酶保護探針(NPP)的示意簡圖。示出了使用接頭(綠色)將基因標簽(或實驗標簽)與任意所需的受體序列(藍色)連接,以及使用另外的接頭(紫色)將銜接體(紅色)加至所述NPP的另一端,最后進行連接。在每種情況下,不僅形成可測序加合物,而且有過量的接頭、銜接體和標簽序列積聚。示出了使用凝膠純化來將所述可測序加合物與其他短序列分離。圖2示出了處理NPP以進行測序。圖2A示出了在后續處理中的兩種可能,包括PoIy-A添加或銜接體序列添加。圖2B到圖2E示出了具有基因標簽、實驗標簽和/或銜接體序列的加合物的制備。圖3概括了用于測序的qNPS探針和標記加合物以及使用核酸酶步驟進行清除。彎箭頭指示連接點。產生了可測序NPP加合物及其互補物。檢索表定義了用于形成所述可測序加合物的不同寡核苷酸。圖4示出了裝配所述可測序加合物的另一種方法。圖4A示出了形成所述可測序NPP加合物的不同方案,其中所述標簽接頭在與所述實驗標簽(ET)可變序列(VS)(在測序時唯一識別所述孔或實驗的序列)互補的殘基處含有肌苷,然后是與3’銜接體互補的序列(3’Acomp)。圖4B示出了使用不需要連接并可通過合成制備的單一合成結合5’銜接體標簽/標簽接頭/3’銜接體互補序列。圖4C和4D示出了可以利用凝膠純化進行清除(例如,在多聚腺苷酸化之前)的這一方法的方案,或者如示出的在多聚腺苷酸化、捕捉和測序之前利用核酸酶步驟進行清理。圖5示出了含有及不含有所述NPP的可測序加合物。圖6提供了如何測序和定量剪接點、外顯子和突變的圖示。圖6A文字說明。用于對基因的所有變體共同的區域上的mRNA進行測量的探針。對于野生型(左側)和刪除了外顯子2的突變體示出了(公共外顯子I)和用于測量兩個外顯子之間的剪接點(外顯子1/2連接點)一其中所述連接點可為外顯子I至外顯子2或外顯子I至外顯子3—或者用于測量外顯子(2和3),其中之一可刪除(外顯子2)。要注意,刪除外顯子2導致SI對用于外顯子2的探針的全部破壞,以及對于外顯子1/2剪接點的探針的外顯子2特異的一半的破壞,由紅色“x” SI指示。如何測序單核苷酸多態性(SNP)和甲基化DNA的實例示于圖6B。圖6B文字說明。示出了用于測量表達SNP (左圖)或甲基化DNA位點(右圖)的探針。對于表達SNP,示出了兩種可能性野生型或SNP。使用了兩種探針,一種用于對照區(1),一種具 有位于探針(2)中間的SNP。用Rnase處理切斷SNP中的錯配,然后所述探針(現在僅每端25個堿基)在用于所述SI反應的50-mer Tm下解離開并被SI破壞。對于甲基化的DNA,使用相同的兩探針策略,但是首先使用亞硫酸氫鹽將未甲基化的C轉化為U,產生錯配,然后使用尿嘧啶DNA糖基化酶切斷所述DNA,從而所述探針將解離開并被SI破壞。圖7示出了成功測序在qNPA方法的最后產生的進入所述裂解和雜交緩沖溶液中的轉錄本。圖7文字說明。使用Sanger測序法,ABI3700。將具有所需測序引物(T7F)的線性DNA樣本(約2. 5kb PCR)提交到亞利桑那大學測序中心。將加有或未加稀釋緩沖液(qDil)的qNPA裂解緩沖液稀釋到2X-20X。I: I加入qDil導致2X稀釋。每個稀釋度重復兩次。相同稀釋度還用反向引物重復(結果未示出)。為進行測序,將2.5iU 50ng/iil的DNA混入總體積15iU的反應混合物中。這相當于6X稀釋度。紅色無序列;淺綠色50-100bp序列;深綠色500-600bp序列。圖8示出了測量匹配的裂解產物相對于提取RNA的PCR結果,以表明CT值的等價性。此處,對從樣本純化的RNA或來自相同樣本的qLysis產物進行PCR以測量一大組不同細胞樣本混合物的三個基因加持家基因GAPDH。每個數據點均是一式三份的平均值。每種混合物均在三個不同實驗中測試。將CT值通過減去GAPDH的CT值標準化。將所述純化RNA相對所述qLysis樣本所需的稀釋因子進行校正,并顯示產生PadP可測序探針所需的步驟的序列。所述基因標簽和5’銜接體,以及限制性內切位點,是原始PadP探針的一部分。所述探針與靶標RNA連接形成環形DNA,然后被打開并且所述實驗標簽和3’銜接體雜交并連接,形成用于測序的加合物。圖9示出了用于產生PadP可測序加合物的代表性示意方法。所述基因標簽和5’銜接體,以及限制性內切位點,是原始線性探針的一部分。所述探針以這樣的方式與所述靶標核酸雜交,即所述探針的5’和3’端與相鄰堿基雜交,從而可在所述核酸模板上連接在一起形成環形探針(例如DNA探針)。然后加入核酸酶(例如核酸外切酶)以破壞未雜交的核酸靶標和過量的線性探針。然后將所述探針與核酸靶標分離(例如在堿中加熱),并破壞所述核酸酶活性。打開環形探針,并且視需要將實驗標簽和視需要的3’銜接體雜交并連接,制備用于測序的加合物。使線性探針與所述核酸靶標雜交、連接以形成環形探針并與所述核酸靶標分離的過程可在多個循環中重復通過循環加熱引起解離。由于線性探針過量,當溫度降低時,線性探針將雜交,繼而可被連接,然后在下一高溫循環下釋放,從而在進行所述核酸酶水解步驟之前擴增環形探針的量。如果沒有進一步的闡述,我們相信,本領域技術人員通過使用前面的描述,可最大限度地利用以下的發明。因此,以下具體的優選實施方案應被視為僅用于舉例說明,而不以任何方式限制本公開的其余部分。實施例I :用于所述qNPA測定的裂解緩沖液被設計成用來滅活酶并防止RNA降解,但在有限稀釋為雜交稀釋緩沖液后,其允許SI活性并有利于以嚴格特異性雜交。然而,所述裂解緩沖液組分可抑制反轉錄和聚合酶活性。因此,抑制聚合酶活性可防止成功PCR,除非除去所述緩沖液或者稀釋掉或中和掉所述抑制活性。可在所述核酸酶測定完成后加入稀釋緩沖液以中和所述裂解和其他緩沖液的抑制活性。圖7示出了成功測序在qNPA方法的最后產生的進入所述裂解和雜交緩沖溶液中的轉錄本。在水中的10倍稀釋使得測序成功。然而,如 果使用中和稀釋緩沖液(qDil)而不是水進行稀釋,那么只需4倍稀釋來產生與在水中測序的轉錄本相同的測序結果(500至600堿基對的讀取長度)。然而,使用中和qDil稀釋緩沖液允許在僅2倍稀釋后測序,但讀取長度減少到50至100個堿基對,因此是成功的,但受到裂解和雜交緩沖液的影響。認識到對于在測序前需要對靶標DNA進行PCR的系統,也可能存在來自所述裂解和雜交緩沖液的干擾,我們使用從細胞制備的cDNA相對于從相同細胞制備并用所述qDil稀釋緩沖液稀釋的裂解產物測試了 PCR效率。測量對GAPDH標準化的三個基因,混合物之間沒有差異(圖8)。相關性為0. 97。實施例2 將NPP設計為對剪接點或外顯子以及靶標基因的其他區域特異,從而在各種情況下所述探針均對僅見于轉錄組中的單個基因中的序列特異。為允許所述核酸酶保護探針或所述探針的一部分的直接測序(直接核酸酶保護探針測序,或DNPS),在理想情況下前5、10,20或30個3’堿基足夠特異從而其測序唯一地確定僅一個基因。在核酸酶反應后,通過將剩余的探針納入含有如前文和下文所述的所需銜接體或捕捉序列或分子的測序加合物,將所述剩余的探針制備用于測序。在另一種方法中,將實驗標簽加至3’端。在又一種方法中,將基因標簽加至3’端從而使所述核酸酶保護探針序列本身不必被測序,并且所述探針的3’端也不必對轉錄組中僅一個基因特異。在再一種方案中,基因標簽和實驗標簽均納入要測序的加合物中。在另一個實例中,通過前文和下文所述的方法制備所述NPP的互補序列和所述可測序加合物。實施例3 含有帶有基因標簽和實驗標簽的加合物的NPP的構建。此方法的一個優點是所述標簽雜交步驟在破壞了所有天然物質(例如RNA)的SI和堿步驟之后,因此特異性僅需確保所述正確的標記與其自身互補序列雜交而不與另一標簽的互補序列雜交。類似地,僅所述核酸酶保護探針需要為靶標特異的。所述探針本身不被測序。相反,基因標簽被納入加合物,所述加合物被全部測序以確定由該特異性核酸酶保護探針——所述基因標簽與之特異性雜交——測量的基因。在用于進行FFPE上的qNPA (3,4)的標準方案后,將樣本在裂解緩沖液中裂解,在核酸酶保護探針混合物的存在下加入蛋白酶K。在于37°C初始孵育30分鐘后,將所述樣本加熱到95°C,然后冷卻并于55°C孵育2小時,以允許所述探針與其各自的靶標mRNA雜交。然后加入SI核酸酶以水解不與靶標雜交的過量探針,以及不與探針雜交的RNA,留下靶標/探針雙鏈。60分鐘孵育后,加入堿并將樣本加熱到95°C 10分鐘,解離探針/RNA雙鏈體并水解所述靶標RNA序列。將所述樣本中和,然后加入3’標簽接頭的混合物,每種接頭具有與一個特異性探針的3’端25個堿基互補的特異性25個堿基序列,并含有對一個基因標識標簽特異的序列。在第二個實例中,所述標簽接頭還含有通用的所述基因標簽序列3’的序列,與一組實驗標簽共同的5’末端序列特異性雜交。所述基因標簽序列可包括若干種設計,但在這種情況下由以下序列組成與所述基因標簽的5’末端序列互補的序列,此序列不被測序,繼而是對每個基因標簽獨特并且是每個基因標簽3’端序列的7喊基標簽序列,此序列被測序以識別每個基因。在所述標簽接頭的3’末端序列也與實驗標簽雜交的情況下,所述實驗標簽的5’互補序列對于每個實驗標簽是相同的。因為加入各自不同的實驗標簽來區分各個實驗核酸酶保護反應(例如,分別測定的樣本),因此不可能存在“錯誤”的實驗標簽雜交。在這種情況下,將各個樣本準備在微孔板的不同孔中并向每孔中加入不同的實驗標簽。雖然加入標簽接頭、基因標簽和實驗標簽可以是順序的,但在此實施例中是一起加入,加入的標簽接頭相對經歷所述SI核酸酶保護反應仍然存在的核酸酶保護探針過剩,但相對加入的基因標簽和加入的實驗標簽的量處于有限濃度,從而所有 標簽接頭被所述標簽序列本身所飽和。所述基因標簽和實驗標簽均被5’端磷酸化。此外,所述實驗標簽還在其3’端包含與所述Solexa測序芯片上的3’端捕捉序列互補的銜接體序列。所述核酸酶保護探針的5’端也被磷酸化。在加入所述3’標簽接頭和標簽的同一時間,加入5’銜接體接頭的混合物,其由含有對每種探針的5’端互補的基因序列和與由所述Solexa測序芯片5’捕捉序列捕捉的5’銜接體序列互補的5’序列的序列構成。同時加入所述5’銜接體序列本身,相對5’銜接體接頭過量。于50°C孵育發生所有合適的雜交后,形成在圖2Exx所示的加合物,然后進行連接反應(使用T4DNA連接酶)。隨后將所述反應混合物跑凝膠,切出高分子量的帶,加載于Solexa芯片,擴增并測序。在此實施例中,所述基因標簽由兩個相同的基因識別序列構成,為識別每個基因提供測序冗余。此外,所述實驗標簽的5’端——用于與標簽接頭雜交——每個其他位置包含LNA,提供對于此序列中的堿基數更高的Tm,并使其盡可能短從而測序所述實驗標簽和基因標簽所需的讀取長度盡可能短。實施例4 進行實施例3中所述的相同方法,除了不使用凝膠純化以外。相反,使用5’磷酸化的銜接體接頭和5’磷酸化的標簽接頭,并向每個反應中加入與加至該反應的實驗標簽以及所述3’銜接體序列互補的寡核苷酸,如圖3所示。因此,當進行此連接步驟時,此短寡核苷酸被連接于所述標簽接頭,因而在完全雜交和連接的加合物中沒有短于100個堿基的序列。然后于65°C用SI核酸酶孵育所述反應混合物,作為“清除”反應。在此孵育溫度下,所述完全加合物的組分的Tm使得沒有部分解離開并被SI水解,而過量標簽接頭與每個標簽(由于所述連接的標簽少于50個堿基)之間以及過量的5’銜接體與銜接體接頭之間的雜交充分解鏈,從而使SI將其水解。然后,將經歷此SI反應存在的加合物加熱至95°C以使其從所述保護接頭上解離并破壞SI的活性,然后使所述加合物捕捉到所述Solexa芯片上,擴增并測序。實施例5
進行了構建用于在利用Poly-A尾巴在測序介質上捕捉所述可測序加合物的系統例如Helicose系統上測序的加合物的實例。構建了圖2C所示的加合物,無3’銜接體。在進行凝膠純化清除后,使用Tdt使此加合物在其3’端多聚腺苷酸化。制備這種相同的加合物并在所述Tdt反應前用SI核酸酶清除,然后測序。或者,構建圖2C所示的加合物,其中Poly-A 3’銜接體被合成作為使用Tdt實驗標簽的部分,并且此產物在測序前通過凝膠純化清除。使用Poly-T互補序列來保護所述poly-A尾巴,在測序前使用SI核酸酶來清除所述加合物。實施例6 使用全血作為樣本進行實驗例4的實驗。將所述全血以I: I與2X (雙倍濃度)裂解緩沖液混合,加熱至95°C 10分鐘,然后在微量離心機中離心除去團塊。然后將上清按實施例4所述進行qNPS。實施例I 使用被病毒感染的人體細胞作為樣本進行實驗例4的實驗。所使用的探針被設計成測量所述病毒基因。作為在其他物種的混合物中測量來自任何物種的基因而沒有不想要的序列信息引起的對測序樣本的干擾和“雜亂”的一個實例,結果表明了在人類基因的背景下選擇性地測量病毒基因的能力。實施例8:使用由來自未分化的Thp-I細胞以及分化并經LPS刺激的Thp-I細胞的裂解產物的混合物構成的一系列樣本進行實驗例4的實驗。實施例9:于95°C裂解并孵育樣本,然后與NPP雜交,用SI處理,加入標簽接頭、基因標簽、實驗標簽,雜交并連接,然后于105°C孵育,然后加入含有LNA的實驗標簽保護序列,于37°C孵育以允許20個或更多堿基的連接加合物互補寡核苷酸序列重新雜交(過量的標簽接頭、基因標簽、實驗標簽和實驗標簽保護序列將仍然存在),然后SI水解,然后多聚腺苷酸化,最終通過凝膠電泳清除,然后測序。測序所述互補DNA (標簽接頭可與其雜交)的僅一個拷貝,并且該拷貝不含實驗或基因標簽。因此,如果測量100個基因,那么僅存在此被測序的互補DNA的100個分子/細胞作為背景,并且這些序列不包含任何基因標簽或實驗標簽序列信肩、O實施例10:合成NPP,除與所述靶標核酸互補的堿基序列以外,其包含可作為用于被捕捉到所述測序芯片上的捕捉銜接體序列的非靶標序列,或者可作為基因標簽的序列,或者可作為實驗標簽的序列,或者包含這些功能中的幾個的序列。將所述NPP與過量的與所述NPP的非靶標序列互補的寡核苷酸合并并孵育從而使其可雜交在一起。然后將此混合物加入含有靶標核酸的樣本中,并在雜交后以SI核酸酶處理,進行常規qNPA方案。由于在所述NPP與所述核酸靶標雜交的部分和與所述非靶標互補寡核苷酸雜交的部分之間所有堿基均具有與其雜交的互補堿基,因此與所述核酸靶標雜交的NPP不被SI核酸酶切斷,而是仍保持完 整,而不與靶標寡核苷酸雜交NPP被水解直至受保護的非靶標序列的點。在堿中加熱后加入跨越所述非靶標序列和所述靶標寡核苷酸序列的一部分的互補寡核苷酸,并使其在僅含有互補核酸酶靶標序列的NPP會雜交而更短的非靶標序列保護寡核苷酸和仍然存在的非序列NPP序列片段均不能雜交的溫度下與NPP競爭性雜交。然后進行第二 SI核酸酶處理,然后可測序仍然存在的NPP,其具有被捕捉到所測序芯片所需的序列。該方案不需結合所述銜接體序列的任何連接,因為其是所述合成NPP加合物的一部分。通過用本發明的一般或具體描述的試劑和/或操作條件替換前述實施例中所用的那些,可以成功地重復前述實施例。從前述描述,本領域技術人員可容易地確定本發明的實質特征,并且可在不背離其精神和范圍的情況下,對本發明進行多種改變和改進,以使其適合不同的用途和條件的發明。所有本文引用的出版物和專利均以引用的方式納入本文。參考文獻 I. Martel, R. R.,I. W. Botros, M. P. Rounseville,J. P. Hinton,R. R. Staples,D. A. Morales,J. B. Farmer,and B. E. Seligmann. Multiplexed screening assay for mRNAcombining nuclease protection with luminescent array detection. Assay and DrugDeyelopnent Technologies. 2002,I(1-1) :61-71.2. Martel. R.,M. P. Rounsevi lie, I. W. Botros, R. Kr i s, S. Felder andB. E. Seligmann. Multiplexed Molecular Prof iling (MMP) Transcription Assay inArayPlates for High-Throughput Measurement of Gene Expression in GeneCloning and Expression Technologies,Q. Lu and M. Weiner, Eds.,Eaton Publishing,Natick(2002).3. Robin Roberts, Costi Sabalos,Ralph Martel, Michael LeBlanc,JosephUnger, Ihab Botros,Bruce Seligmann,Thomas Miller,Thomas Grogan and LisaRimsza(2007) “Quantitative Nuclease Protection Assay in Paraffin-EmbeddedTissue Replicates Prognostic Microarray Gene Expression in Diffuse Large-B-CellLymphoma,,Laboratory Investigation, 87 :979-997.4.Lisa Rimsza,Michael LeBlanc, Joseph Unger, Thomas Miller,ThomasGrogan, Daniel Persky, Ralph Martel, Constantine Sabalos, Bruce Seligmann, RitaBraziel, Elias Campo, Andreas Rosenwald, Joseph Connors, Laurie Sehn, NathalieJohnson, and Randy Gascoyne(2008) “Gene expression predicts overall survivalin paraffin embedded tissues of diffuse large B cell lymphoma treated withR-CH0P” Blood,2008 Oct 15,112(8) :3425-335. pechhold,S.,Stouffer,M.,Walker, G.,Martel R.,Seligmann,B,Hang,Y.,Stein R.,Harlan, DM.,and Pechhold,K. (2009) mRNA analysis ofintracytoplasmically-stained, FACS—purified pancreatic islet cell subsetsusing the quantitative nuclease protection assay. Nature Biotechnology,TR21220A.6. Pino S,Ciciriello F,Costanzo G,and Di Mauro E (2008). Nonenzymatic RNALitgation in Water. Journal of Biological Chemistry, Vol. 283 No. 52 :26494-36503.7.Lutay AV, Chernolovskaya EL, Zenkova MA, Vlassov VV (2006). Thenonenzyatic template-directed ligation of oligonucleotides. Biosciences,3,243-249.
8. Shabarova ZA, Merenkova IN,Oretskaya TS, Sokolova NI,Skripkin EA,Alexeyeva EV,Balakin AG, Bogdanov(1991). Chemical ligation of DNA :the firstnon-enzymatic assembly of a biologically active gene. Nucleic Acids Research,Vol. 19 No. 15 :4247-4251.9.United States Patent 7,033,753. Inventor Kool, Eric T !Assignee :University of Rochester. Compositions and methods for nonenzymatic ligation ofoligonuclotides and detection of genetic polyrmorphisms. April 25,2006.10. Baner J,Isaksson A, Waldenstrom E,Jarvlus J,Landegren U,NilssonM(2003). Parallel gene analysis with allele-specific padlock probes and tagmicroarrays. Nucleic Acids Research 31(17) el03(1-7).
11. Prins TW, vanDi jk JP, Beenen HG,Van Hoef AM,Voorhuijzen MM,SchoenCD,Aarts HJM,Kok EJ(1008). Optimised padlock probe ligation and microarraydetection of multiple (non-authorised)GMOs in single reaction. BMC Genomics 9:584(1-12).
權利要求
1.檢測生物樣本中至少ー種靶標的方法,包括 (i)使所述樣本與至少ー種與所述靶標特異性結合的核酸酶保護探針(NPP)接觸, ( )在有效除去任何未結合的NPP的條件下使所述樣本暴露于ー種或多種試劑, (iii)任選地使結合的NPP與所述靶標分離,以及 (iv)對所述NPP、其互補序列或含所述NPP或互補序列的分子測序。
2.根據權利要求I所述的方法,包括檢測結合或游離形式的所述NPP。
3.根據權利要求I所述的方法,其中所述靶標是固定或交聯或不溶的。
4.根據權利要求I所述的方法,其中所述靶標是核酸。
5.根據權利要求4所述的方法,其中所述核酸分子包括核糖核酸(RNA)分子或脫氧核糖核酸(DNA)分子,或者任選地含有非天然堿基的反義核苷酸。
6.根據權利要求5所述的方法,其中所述RNA是信使RNA(mRNA)、核糖體RNA (rRNA)、轉移 RNA (tRNA)、小 RNA (miRNA)、siRNA 和反義 RNA,或者病毒 RNA (vRNA)。
7.根據權利要求5所述的方法,其中所述DNA是基因組DNA(gDNA)、線粒體DNA (mtDNA)、葉綠體 DNA (cpDNA)或病毒 DNA (vDNA)、cDNA 或轉染 DNA。
8.根據權利要求I所述的方法,其中所述NPP包括可特異性結合所述靶標的核酸。
9.根據權利要求8所述的方法,其中所述NPP包括DNA分子。
10.根據權利要求9所述的方法,其中所述NPP為單鏈(ssDNA)或支鏈DNA(bDNA)分子,或者含有LNA或PNA或包含非天然堿基的多核苷酸。
11.根據權利要求I所述的方法,其中所述NPP是可特異性結合所述靶標的核酸,并且步驟(ii)包括用核酸酶或核酸酶混合物處理以有效除去任何未結合的NPP。
12.根據權利要求11所述的方法,其中所述靶標是核酸。
13.根據權利要求11所述的方法,其中所述靶標是RNA分子、小RNA、siRNA或任選地包含非天然堿基的反義RNA。
14.根據權利要求13所述的方法,其中所述靶標RNA分子與所述完整NPP分子或其一部分雜父。
15.根據權利要求11所述的方法,其中所述NPP為單鏈(ssDNA)或支鏈(bDNA)DNA。
16.根據權利要求11所述的方法,其中所述核酸酶或核酸酶混合物是DNA酶、RNA酶或其組合。
17.根據權利要求11所述的方法,其中所述核酸酶或核酸酶混合物是核酸內切酶、核酸外切酶或其組合。
18.根據權利要求11所述的方法,其中所述NPP是DNA分子并且所述核酸酶或核酸酶混合物是DNA酶和RNA酶。
19.根據權利要求11所述的方法,其中所述核酸酶是SI核酸酶。
20.根據權利要求11所述的方法,其中所述核酸酶或核酸酶混合物是核酸外切酶。
21.根據權利要求I所述的方法,其中所述生物樣本被固定。
22.根據權利要求I所述的方法,其中所述生物樣本包含引起靶標分子交聯的試劑。
23.根據權利要求I所述的方法,其中所述靶標是交聯的。
24.檢測生物樣本中至少ー種核酸靶標的方法,包括 (i)使所述樣本與至少ー種核酸酶保護探針(NPP)接觸,所述NPP是在足以促進所述靶標與所述NPP結合的條件下可特異性雜交于所述核酸靶標的核酸分子, (ii)在有效除去任何未結合的NPP的條件下使所述樣本暴露于ー種或多種核酸酶, (iii)任選地使結合的NPP與所述靶標分離 (V)擴增所述NPP或含有所述NPP的加合物,以及 (V)對所述NPP測序。
25.根據權利要求24所述的方法,其中所述靶標是不溶的或固定的。
26.根據權利要求25所述的方法,其中所述不溶性核酸是交聯的mRNA、miRNA或vRNA。
27.根據權利要求24所述的方法,其中所述NPP是ssDNA或bDNA或適體。
28.根據權利要求24所述的方法,其中所述NPP是DNA并且步驟(ii)中的核酸酶包含DNA酶、RNA酶或其組合。
29.根據權利要求24所述的方法,其中所述NPP是DNA并且步驟(ii)中的核酸酶包含核酸外切酶、核酸內切酶或其組合。
30.根據權利要求24所述的方法,其中步驟(ii)中的核酸酶包含SI核酸酶。
31.根據權利要求24所述的方法,包括Solexa測序、454測序、鏈終止測序、染料終止測序或焦磷酸測序。
32.根據權利要求24所述的方法,包括單分子測序。
33.根據權利要求31所述的方法,包括PCR擴增。
34.根據權利要求I所述的方法,其中無需提取所述靶標分子對其進行檢測。
35.根據權利要求I所述的方法,其中無需溶解所述靶標分子對其進行檢測。
36.根據權利要求I所述的方法,還包括使用所述靶標分子作為模板以生物合成方式產生NPP。
37.根據權利要求I所述的方法,包括將特異性結合所述NPP或其部分的寡核苷酸測序。
38.根據權利要求24所述的方法,包括將特異性結合所述NPP或其部分的寡核苷酸測序。
39.檢測生物樣本中至少ー種靶標的方法,包括 (i)使所述樣本與至少ー種可與所述靶標特異性結合的核酸酶保護探針(NPP)接觸, (ii)在有效除去任何未結合的NPP和未與所述NPP雜交的靶標的條件下使所述樣本暴露于ー種或多種試劑, (iii)任選地使結合的NPP與所述靶標分離, (iv)任選地擴增所述NPP,或者所述NPP的互補序列,或者所述祀標,或者含有所述NPP或靶標或所述NPP的互補序列的加合物,以及 (V)對所述NPP,或者所述祀標,或者所述NPP的互補序列,或者含有所述NPP或所述革巴標或所述NPP的互補序列的加合物測序。
40.根據權利要求39所述的方法,其中所述靶標分子包含核糖核酸(RNA)分子或脫氧核糖核酸(DNA)分子,或者任選地含有非天然堿基的反義核苷酸。
41.根據權利要求39所述的方法,其中所述RNA是信使RNA(mRNA)、核糖體RNA (rRNA)、轉移 RNA (tRNA)、小 RNA (miRNA)、siRNA 和反義 RNA,或者病毒 RNA (vRNA)。
42.根據權利要求39所述的方法,其中所述DNA是基因組DNA(gDNA)、線粒體DNA (mtDNA)、葉綠體 DNA (cpDNA)或病毒 DNA (vDNA)、cDNA 或轉染 DNA。
43.根據權利要求39所述的方法,其中所述NPP包含可特異性結合所述靶標的核酸,或者部分或全部由肽核酸構成,或者部分或全部由LNA或非天然堿基或修飾堿基構成。
44.根據權利要求39所述的方法,其中所述NPP包含不可測序的組分。
45.可測序加合物,包含 包含與生物靶標雜交的多核苷酸序列的核酸酶保護探針(NPP); 第一標簽,其包含從所述NPP的3’端經所述標簽序列的5’端延伸的多核苷酸序列;以及任選, 第二標簽,其包含從所述第一標簽的3’端延伸的多核苷酸序列。
46.根據權利要求45所述的可測序加合物,其還包含銜接體,所述銜接體包含從所述NPP的游離3’端或從含有所述第一和所述第二標簽序列的NPP加合物的3’端延伸的多核苷酸序列,或者包含所述加合物的倒數第二個標簽序列的3’端。
47.根據權利要求45所述的可測序加合物,其中所述第一標簽和所述第二標簽獨立地為基因標簽和實驗標簽。
48.根據權利要求45所述的可測序加合物,包含所述基因標簽和所述銜接體。
49.根據權利要求45所述的可測序加合物,包含所述基因標簽、所述實驗標簽和所述銜接體。
50.根據權利要求45所述的可測序加合物,包含實驗標簽。
51.根據權利要求45所述的可測序加合物,同時包含實驗標簽和所述銜接體。
52.根據權利要求45所述的可測序加合物,其還包含銜接體,所述銜接體包含從在3’端含有一個或多個標簽序列和/或銜接體的所述NPP或NPP加合物的游離5’端延伸的多核苷酸序列。
53.根據權利要求52所述的可測序加合物,包含所述基因標簽和所述銜接體。
54.根據權利要求52所述的可測序加合物,包含所述基因標簽、所述實驗標簽和所述銜接體。
55.根據權利要求52所述的可測序加合物,包含所述實驗標簽和所述銜接體。
56.根據權利要求52所述的可測序加合物,包括同時含有兩個銜接體的加合物。
57.制備權利要求45所述的可測序加合物的方法,包括 使具有所述核酸酶保護探針(NPP)的3'端的互補序列以及所述第一標簽的5’端的互補序列的接頭與所述NPP雜交; 使基因標簽序列或實驗標簽序列與所述互補序列雜交; 任選地使所述第一標簽,以及如果存在的第二標簽,與所述NPP連接以形成可測序加合物。
58.根據權利要求56所述的可測序加合物,其中倒數第二個標簽在其3'末端含有銜接體序列以被捕捉到測序平臺上。
59.制備權利要求45所述的可測序加合物的方法,包括 使具有所述核酸酶保護探針(NPP)3,端的互補序列并且具有所述第一標簽的互補序列和所述第二標簽5’端的互補序列的接頭與所述NPP雜交; 使所述第一標簽序列和第二標簽序列與所述互補序列雜交;任選地使所述第一標簽序列與所述NPP連接并使所述第二標簽序列與所述第一標簽序列連接以形成所述可測序加合物。
60.根據權利要求59所述的可測序加合物,其中倒數第二個標簽在其3'末端含有銜接體序列以被捕捉到測序平臺上。
61.制備權利要求59所述的可測序加合物的方法,還包括 使在5’端具有所述核酸酶保護探針(NPP)的5’端的互補序列并在3’端具有銜接體序列的3’端的互補序列的接頭雜交; 使所述銜接體序列與所述接頭的互補序列雜交; 使所述銜接體序列與所述NPP連接以形成所述可測序加合物。
62.制備權利要求57所述的可測序加合物的方法,還包括 (i)使用所述NPP的第一引物擴增所述NPP或靶標;以及 ( )任選地使第二引物與第一擴增步驟的產物雜交,其中所述第二引物任選地包含銜接體序列,以及 (iii)再擴增(ii)的產物以產生可測序加合物。
63.制備權利要求62所述的可測序加合物的方法,還包含基因標簽序列作為線性NPP的一部分。
64.制備權利要求62所述的可測序加合物的方法,還包含實驗標簽序列作為線性NPP的一部分。
65.制備權利要求62所述的可測序加合物的方法,還包含銜接體序列作為線性NPP的一部分。
66.制備權利要求62所述的可測序加合物的方法,還包含一個或多個標簽序列和/或銜接體序列作為線性NPP的一部分。
67.制備權利要求62所述的可測序加合物的方法,還包含連接到線性NPP上的實驗標簽。
68.制備權利要求62所述的可測序加合物的方法,還包含如下所述NPP,所述NPP具有不與所述靶標互補但在核酸酶步驟中與互補寡核苷酸雜交并因此不從結合于所述靶標的NPP上水解或切斷的序列。
69.制備權利要求62所述的可測序加合物的方法,還包括在連接步驟后用核酸酶或核酸酶混合物純化或孵育以除去所述可測序加合物以外的加合物。
70.檢測生物樣本中至少ー種靶標的方法,包括 (i)使所述樣本與至少ー種線性核酸酶保護探針(NPP)接觸,所述探針的末端特異性地與所述靶標結合從而其5’和3'端與所述靶標的相鄰堿基雜交, ( )連接所述NPP以形成環形寡核苷酸, (iii)任選地解離所述環形NPP,使線性NPP的第二分子與所述靶標雜交,并連接, (iv)任選在連續循環中重復(iv), (v)加入核酸酶以破壞所述樣本中的所有線性單鏈寡核苷酸,以及 (vi)切斷所述環形NPP以線性化所述NPP,以及 (vii)對所述線性NPP測序。
71.檢測生物樣本中至少ー種靶標的方法,包括(i)使所述樣本與至少ー種可與所述靶標特異性結合的核酸酶保護探針(NPP)接觸,( )在有效除去任何未結合的NPP和未與所述NPP雜交的靶標的條件下使所述樣本暴露于ー種或多種試劑, (iii)任選地使結合的NPP與所述靶標分離, (iv)任選地擴增所述NPP,或者所述NPP的互補序列,或者所述祀標,或者含有以下物質的加合物 包含與生物靶標雜交的多核苷酸序列的核酸酶保護探針(NPP); 第一標簽,其包含從所述NPP的3’端經所述標簽序列的5’端延伸的多核苷酸序列;以及任選, 第二標簽,其包含從所述第一標簽的3’端延伸的多核苷酸序列,以及 (V)對所述NPP,或者所述祀標,或者所述NPP的互補序列,或者所述加合物測序。
全文摘要
本發明提供了一種用于解決測序面臨的幾個難題并改善了研究和診斷應用的新方法——定量核酸酶保護測序(qNPSTM)。所述方法使用僅需樣本裂解的核酸酶保護測定來產生用于測序的核酸探針例如DNA探針,所述探針可偶聯基因特異性標簽從而使得可鑒定基因而不必對所述核酸酶保護探針自身測序,和/或可以偶聯實驗特異性標簽,藉此將來自不同患者的樣本可合并到單次運行中。所公開的qNPS作為一種研究和發現工具以及作為診斷測試使得可對固定的或不溶的樣本測序并且費用較低。
文檔編號C12Q1/68GK102712955SQ201080060488
公開日2012年10月3日 申請日期2010年11月3日 優先權日2009年11月3日
發明者B·塞利格曼 申請人:Htg分子診斷有限公司