Oligonucleotide Synthesis:A Practical Approach"(2002)IRL Press, London ;Nelson 和 Cox,Lehninger, Principles of Biochemistry(2000)第 3 版,W.H.Freeman Pub. ,New York,N.Y.;及 Berg,等 人,Biochemistry(2002)第 5 版,W.H.Freeman Pub.,New York,N.Y.中找到,為了所有目 的本文通過引用將所有這些文獻全部并入。
[0067] 注意除非上下文另外清楚地指明,否則如在本文和所附權利要求中使用的,單數 形式"一個(a) "、"一個(an)"和"該(the)"包括復數的所指對象。因此,例如,述及"核酸" 是指一種或多種核酸,而述及"該測定"包括述及本領域技術人員已知的等效步驟和方法, 等等。
[0068] 除非另外定義,本文所用的所有技術和科學術語具有與本發明所屬領域的普通技 術人員通常理解的相同含義。為了描述并公開可與目前描述的發明結合使用的裝置、制劑 和方法學的目的,本文提及的所有出版物被通過引用并入。
[0069] 當提供了一個范圍的值時,應理解在該范圍的上限和下限之間的每個中間值和在 該指定的范圍內的任何其他指定值或中間值包括在本發明內。這些較小范圍的上限和下限 可被獨立地包括在這些較小的范圍內,且也包括在本發明內,服從該指定范圍內任何特別 排除的限值。當指定的范圍包括限值中的一個或兩個時,排除了所包括的那些限值中的任 何一個或兩個的范圍也包括在本發明內。
[0070] 在以下說明中,闡述了許多具體細節以提供對本發明的更透徹的理解。但是,將對 于本領域技術人員明顯的是,沒有這些具體細節中的一個或多個時,可實施本發明。在其他 實例中,未描述本領域技術人員熟知的熟知特征和步驟以避免使本發明難以理解。
[0071] 大體發明
[0072] 本發明的測定系統提供了空間編碼的多重測定,其包含1)能夠用有效的空間編 碼方案高水平地多重檢測的測定;2)能夠根據空間模式遞送試劑的設備;和3)通過本質上 為數字的讀出確定的解碼。本發明的測定系統檢測生物樣品中生物靶或指示生物靶的生物 活性的存在或不存在和相對量以及該生物靶或活性的位置,生物樣品例如布置在支持體例 如顯微鏡載玻片或組織培養皿上的組織切片或其他生物學結構。
[0073] 該測定系統還提供了具有以空間上界定的模式遞送試劑的能力的設備。該設備, 連同軟件、試劑和說明書,為本發明的高度創新的測定系統提供了關鍵組成部分,允許在目 的空間環境中測量許多生物靶或活性,包括基因表達和肽定位。用于這些測定系統中的編 碼方案允許人們在多重測定的產物被從生物樣品中移除并被匯集用于分析之后確定生物 靶或活性在生物樣品中的位置(或其缺乏)。對編碼方案的解碼可通過例如下一代測序進 行,下一代測序容易地以低的成本提供數百萬或數萬億的數據點。然后可將測定結果例如 生物靶的量或活性映射回生物樣品中的特定位置。該測定系統打開了通往生物樣品中細胞 功能和調控的復雜空間模式的新分析窗口。
[0074] 圖1提供了本發明的測定系統100的簡化概述。在步驟110處,提供了附著到支持 體的生物樣品。該生物樣品包含目的生物靶。生物靶可包含任何目的分子,例如核酸(包 括,例如RNA轉錄物、基因組DNA序列、cDNA、擴增子或其他核酸序列)和蛋白質、酶及類似 物。在步驟120處,根據已知的空間模式將編碼探針遞送到生物樣品中。編碼探針包括可 與目的生物靶相互作用的探針和確定被測定的生物靶在樣品中的位置并由此可用來將測 定結果反向連接到樣品中的位置的代碼標簽。大多數實施方式中的代碼標簽是寡核苷酸。 然而,代碼標簽還可以是質量標簽(mass tag)、熒光標記或其他部分。
[0075] 在某些實施方式中,將編碼探針的探針部分和代碼標簽部分在向生物樣品遞送之 前預偶聯。例如,在其中編碼探針是寡核苷酸的實例中,可將探針和代碼標簽序列合成為單 一的寡核苷酸。可選擇地,可合成或單獨獲得編碼探針的探針部分和代碼標簽部分并在向 生物樣品遞送之前組合(例如,可合成兩個單獨的寡核苷酸并通過例如連接來偶聯;或可 單獨地制備抗體和寡核苷酸并在向生物樣品遞送之前共輒)。另外,如圖2-5中描述的,單 獨地合成探針和代碼標簽(在編碼寡核苷酸中)并在測定中的不同步驟將其遞送到生物樣 品(例如,先探針且其后代碼標簽或反之亦然)。
[0076] 在步驟130處,促使編碼探針與生物靶反應或相互作用,即,提供促使例如寡核苷 酸與核酸靶雜交、酶催化與蛋白質靶的反應、抗體結合表位等的條件。在其中生物靶為核酸 的實例中,編碼探針通常是寡核苷酸并與靶核酸雜交。在生物靶為蛋白質的實例中,編碼探 針通常是通過與靶蛋白結合或通過與靶蛋白反應來與靶蛋白相互作用的適體、小分子或寡 核苷酸共輒的蛋白質(也就是,蛋白質中的一種是另一種的底物)。編碼寡核苷酸可經合適 的基團通過共輒、化學或光交聯及類似的手段與探針(蛋白質)偶聯。
[0077] -旦編碼探針與生物靶相互作用,必須在步驟140處將與生物靶相互作用的編碼 探針和未與生物靶相互作用的編碼探針分離。在其中生物靶是核酸且編碼探針是寡核苷酸 的實例中,分離可通過例如從樣品中洗掉未雜交的編碼探針來實現。相似地,對于基于親和 結合的其他測定,包括使用適體、小分子和蛋白質探針的測定,洗滌步驟可用來去除低親和 力的結合劑。在其中探針經與靶相互作用而被轉化的實例中,例如,在經例如蛋白酶裂解或 經激酶磷酸化的肽的實例中,收集所有的編碼探針即與生物靶相互作用并被轉化的編碼探 針和未被轉化的編碼探針二者是方便的。在收集或匯集之后,抗體或其他親和捕獲劑可用 來捕獲通過添加某個部分(例如,磷酸基團)而被轉化的探針。在其中探針已通過裂解而 被轉化的實例中,可通過例如借助于在轉化期間從轉化的探針中去除的標簽(例如,通過 裂解)來捕獲未轉化的探針或通過在裂解位點添加新的標簽來分離轉化的探針。
[0078] -旦反應的(轉化的)或相互作用的編碼探針與未反應的或未相互作用的編碼探 針分離,優選通過測序來測定反應的和/或相互作用的編碼探針的序列。編碼探針的序列 允許將測定結果映射回在生物樣品中的位置。
[0079] 圖2提供了體現出用于編碼空間信息的組合代碼方案的有效實施的本發明的測 定系統的簡化概述。為了該概述的目的,探針是寡核苷酸,但是如其他地方解釋的,也可使 用其他類型的探針。在步驟210中,提供了附著到支持體的生物樣品,例如組織樣品或其他 生物結構。在步驟220中,向該生物樣品遞送一個或多個寡核苷酸探針,其中寡核苷酸探針 能夠與生物樣品中的生物靶雜交。在步驟230中,促使寡核苷酸探針與核酸靶相互作用(雜 交);也就是說,提供其中寡核苷酸探針可與靶核酸雜交的合適條件。
[0080] 在步驟240中,去除未與靶核酸雜交的寡核苷酸探針,并從而與未與靶核酸雜交 的寡核苷酸探針分離。在該實施方式中,分離可通過例如,洗滌樣品去除未雜交的寡核苷酸 探針來實現。接下來,在步驟250中,根據所選擇的空間模式向生物樣品遞送編碼探針(編 碼劑),其中編碼寡核苷酸包含用來編碼生物靶在生物樣品中的位置的代碼標簽。注意與圖 1的測定系統相比,此處在分開的步驟中遞送探針和編碼劑(編碼寡核苷酸)。在步驟260 中,編碼寡核苷酸與寡核苷酸探針偶聯以制備編碼探針。在其中探針是寡核苷酸的實例中, 編碼寡核苷酸可通過例如連接與寡核苷酸探針偶聯。可選擇地,可通過使用DNA聚合酶來 延長起引物作用的探針寡核苷酸而轉移編碼寡核苷酸中的信息,并從而復制和并入編碼寡 核苷酸的序列。
[0081] 在步驟270中,測定了編碼探針中代碼標簽的序列以及探針本身的序列或一部分 序列,并在步驟280中,將靶核酸映射回生物樣品。在某些實施方式中,序列的豐度揭示出 生物靶在該位置的相對量。雖然該實施方式以特定的順序展示了單獨的步驟,但是為了更 好地解釋本發明,這些步驟的精確順序可改變。例如,可組合步驟220和步驟250,以根據所 選擇的空間模式遞送探針與編碼寡核苷酸的混合物。然后可在組合的步驟220和步驟250 之后立即進行或與這兩個步驟同時進行偶聯步驟260。在該實例中,則步驟240將在步驟 260之后發生。因此可理解這一系列的步驟的兩個關鍵結果,即,探針分子的位置特異性編 碼和基于探針分子與相應的靶分子的相互作用的能力分離探針分子可在特定步驟的實施 中以一定靈活性實現。相似地,在代碼方案的設計方面存在極大的靈活性。如下文描述的, 本發明的測定特別適用于組合方法。
[0082] 因此,本發明提供了觀看許多位置中的許多生物靶的能力,提供了以高度并行的 測序數據分析對原位雜交的分辨。在某些實施方式中,被測試的多種生物靶和生物樣品中 的多個位點的和大于20,在其他實施方式中,被測試的多種生物靶和生物樣品中的多個位 點的和大于50,在其他實施方式中,被測試的多種生物靶和生物樣品中的多個位點的和大 于 100、大于 500、1,000、10, 000、25, 000、100, 000、500, 000、1,000, 000。應理解,由于本發 明的空間編碼尺寸,可設想甚至大得多的數字。例如,測定每個位置10, 〇〇〇靶X 10, 〇〇〇 位置將產生IO8種不同的測定,且可容易地設想甚至比這些數更大的數,特別是如果使用具 有單細胞分辨率級別的分辨率的空間位置的話。另外,在其中采用高通量數字測序的實施 方式中,通常并行測定至少1,000個編碼探針的序列。更通常地,使用數字讀出,對于每個 測定期望獲得多個序列讀數(由探針和空間位置碼定義)。取決于實驗的設計和測定的需 要,,期望獲得每個測定至少3拷貝的平均值,且更通常地,每個測定至少10或至少30拷貝 的平均值。對于具有合適動態范圍的量化讀出,每個測定可能期望獲得至少1,〇〇〇個讀數。 因此,如果進行1,〇〇〇, 〇〇〇測定,序列讀數的數字將是十億或更大。對于高通量數字測序, 并考慮到冗余,并行測定至少10, 000編碼探針的序列,或并行測定至少100, 000、500, 000、 1,000, 000、10, 000, 000、100, 000, 000、1,000, 000, 000 或更多的編碼探針的序列。
[0083] 測定
[0084] 本發明的測定系統的測定部分包含下列一般步驟:遞送探針和編碼劑,其中根據 已知的空間模式向樣品遞送編碼劑(在某些實施方式中與探針預偶聯),促使探針與樣品 中的生物靶相互作用或反應,且如果探針和編碼劑未被預偶聯,將編碼劑與探針偶聯。
[0085] 本發明的樣品幾乎包括可附著到支持體或主要以二維方式提供的任何生物樣品 或多個樣品,其中將所測定的生物靶或活性反向系于在生物樣品內的位置的能力是重要 的。示例性的生物樣品包括組織切片(例如,包括完整的動物切片和組織活檢)、載玻片或 組織培養皿上的細胞群及類似物。本發明的測定系統是特別有利的,因為其和許多生物樣 品類型,包括新鮮樣品,例如原代組織切片,和儲藏的樣品包括但不限于冷凍樣品和福爾馬 林固定的(paraformalin-fixed)、石錯包埋的(FFPE)樣品相容。本發明的測定系統的重要 的方面是將生物樣品固定到具有不連續的、可獨立測量的區域的基材表面上。
[0086] 待檢測的生物靶可以是任何生物分子包括但不限于蛋白質、核酸、脂質、碳水化合 物、離子或包含以上任何一種的多組分復合物。亞細胞靶的實例包括細胞器,例如線粒體、 高爾基體、內質網、葉綠體,內吞囊泡、胞吐囊泡、液泡、溶酶體等。
[0087] 在某些特定的實施方式中,使用該測定系統例如通過基因型分型、DNA拷貝數或 RNA轉錄物的定量、定位樣品內的特定轉錄物及類似手段來分析核酸。圖3示出了可用于 本發明的測定系統的用于例如,檢測單核苷酸多態性(SNP)的示例性測定的整體方案。在 圖3中,提供了兩個寡核苷酸探針。每個寡核苷酸探針包含在305和307看到的靶特異性 區域(位于待