專利名稱:空間編碼的生物學測定的制作方法
技術領域:
本發明涉及生物分子的測定,且更具體地涉及用于同時確定大量生物分子在固體樣品中的空間分布的測定。
背景技術:
在以下討論中,將為了背景和介紹的目的描述某些制品和方法。本部分包含的任 何內容都不應被解釋為“承認”是現有技術。申請人明確地保留在適當的時候,根據適用的法律條文證實本文述及的制品和方法不構成現有技術的權利。全面的基因表達分析和蛋白質分析已成為理解生物學機制的有用工具。這些工具的使用已促進參與發育和各種疾病例如癌癥和自身免疫病的基因和蛋白質的鑒定。傳統方法例如不同轉錄物的原位雜交和其他多重檢測已揭示出基因表達的空間模式并已幫助闡明發育和疾病的分子基礎。使得能夠定量分析每個樣品的許多RNA序列的其他技術包括微陣列(參見,Shi,等人,Nature Biotechnology, 24 (9) :1151-61 (2006);及 Slonim和 Yanai, Plos Computational Biology, 5 (10) :el000543 (2009));基因表達的系列分析(SAGE)(參見 Velculescu,等人,Science, 270 (5235) :484-87 (1995))、qPCR 的高通量實現(參見 Spurgeon,等人,Plos ONE,3(2) el662 (2008))和原位 PCR (參見 Nuovo, GenomeRes.,4 :151-67(1995))。盡管這些方法是有用的,但是它們不能在樣品中的許多空間位置同時測量許多基因的表達或多種蛋白質的存在和/或活性。激光捕獲顯微切割已允許在少數位置分析許多基因,但是其非常昂貴、費力且不能很好地調整。雖然某些2D格式的PCR測定保留了空間信息(參見Armani,等人,Lab on a Chip, 9 (24) :3526-34 (2009)),但是這些方法具有低的空間分辨率,因為它們依賴于向孔中物理轉移組織,這還阻止了隨機接近組織樣品和高水平的多重檢測(multiplexing)。目前,不存在以高分辨率同時分析大量的基因、蛋白質或其他生物活性分子的空間表達模式的運行方法。因此存在對組織中的生物分子的可重現的、高分辨率的空間圖譜的需要。本發明解決了該需要。發明概述提供該概述以便以簡化的方式介紹以下在詳述中進一步描述的概念的節選。該概述不旨在確定要求保護的主題的關鍵或必不可少的特征,也不旨在用來限制所要求保護的主題的范圍。從隨后的包括在附圖中示出并在所附權利要求中定義的那些方面的書面詳述中,所要求保護的主題的其他特征、細節、實用性和優點將是明顯的。本發明包括提供組織中生物活性的高分辨率空間圖譜的測定系統。該測定系統包含能夠高水平多重檢測的測定,其中以指定的空間模式為生物樣品提供編碼探針;能夠根據該空間模式控制遞送試劑的設備;和提供本質上為數字的讀出的解碼方案。簡言之,本發明提供了觀看許多位置中的許多生物靶的能力,提供了以高度并行的測序數據分析對原位雜交的分辨。因此,在某些實施方式中,本發明提供了確定多種生物靶在樣品中的多個位點的豐度或活性或兩者的空間模式的測定系統,其中該測定系統進行下列步驟提供附著到支持體的樣品;以已知的空間模式將用于多種生物靶的編碼探針遞送到樣品中的多個位點,其中每個編碼探針包含可與生物靶相互作用的探針區域和確定編碼探針被遞送的位點的位置的代碼標簽(coding tag);促使編碼探針與生物靶相互作用;將與生物靶相互作用的編碼探針和未與生物靶相互作用的編碼探針分離;測定編碼探針的序列的全部或一部分,以及將多種生物靶的豐度或活性或兩者與樣品中的位點的位置相關聯。在本發明特定的方面,生物靶包含核酸且編碼探針是寡核苷酸,且在某些方面,對于多種核酸靶中的每一種存在兩種編碼的探針。在某些方面,多種生物靶包含蛋白質,編碼探針的探針區域是蛋白質且代碼標簽包含寡核苷酸。在某些方面,多種生物靶包含酶。在 某些方面,編碼探針的探針區域包含抗體、適體或小分子。測定系統的某些方面還在分離步驟和測定步驟之間包含擴增步驟。在某些方面,測定步驟通過核酸測序進行,且在優選的方面,測序是高通量數字核酸測序(highthroughput digital sequencing)。在本發明的某些方面,被測定的多種生物靶和樣品中的多個位點的乘積大于20,在某些方面,被測定的多種生物靶和樣品中的多個位點的乘積大于50,在某些方面,被測定的多種生物靶和樣品中的多個位點的乘積大于75、100、150、500、750、I,000、5,000、10,000,25, 000,50, 000,100, 000,500, 000 或 I, 000,000 或更大。在其他方面,并行測定
至少五萬個編碼探針的序列,在其他方面,并行測定至少十萬個編碼探針的序列,在某些方面,并行測定至少五十萬個編碼探針的序列,且在某些方面,并行測定至少一百萬、一千萬、一億、十億、一百億、一千億或更多個編碼探針的序列。在某些方面,已知的空間模式通過樣品的組織學特征確定。還在某些方面,軟件程控的硬件進行遞送步驟、分離步驟、測定步驟和關聯步驟中的至少兩個步驟。在某些方面,編碼探針的探針區域是蛋白質且分離步驟通過用親和捕獲劑捕獲與生物靶相互作用的編碼探針實現。在某些方面,編碼探針的探針區域是核酸且分離步驟通過洗滌樣品實現。在其他實施方式中,提供了測定多種核酸靶在樣品中的多個位點的豐度或活性或兩者的空間模式的測定系統,其中該測定系統進行以下步驟提供附著到支持體的樣品;以已知空間模式將用于多種核酸靶的寡核苷酸探針遞送到樣品中的多個位點;促使寡核苷酸探針與核酸祀雜交;從樣品中洗掉未雜交的編碼寡核苷酸探針;根據已知空間模式將一種或多種編碼劑(encoding agent)遞送到樣品中的多個位點的位置,其中遞送到每個位點的編碼劑的組合是不同的;將編碼劑和寡核苷酸探針偶聯以形成編碼探針;使用高通量測序測定編碼探針的序列的全部或一部分,以及將多種生物靶的豐度或活性或兩者與樣品中多個位點的位置相關聯。本發明的其他實施方式提供了測定多種蛋白質靶在樣品中的多個位點的豐度或活性或兩者的空間模式的測定系統,其中該測定系統進行以下步驟提供附著到支持體的樣品;以已知空間模式將用于多種蛋白質靶的編碼探針遞送到樣品中的多個位點,其中每個編碼探針包含可與蛋白質靶相互作用的蛋白質探針區域和確定編碼探針被遞送的位點的位置的代碼標簽,且代碼標簽是編碼探針的蛋白質探針區域的一部分;促使編碼探針與蛋白質靶相互作用;將與蛋白質靶相互作用的編碼探針和未與蛋白質靶相互作用的編碼探針分離;通過高通量測序測定編碼探針的序列的全部或一部分,以及將多種蛋白質靶的豐度或活性或兩者與樣品中的多個位點的位置相關聯。其他實施方式提供了測定多種生物靶在樣品中的多個位點的豐度或活性或兩者的空間模式的測定系統,其中該測定系統進行以下步驟提供附著到支持體的樣品;以已知空間模式將用于多種生物靶的編碼探針遞送到樣品中的多個位點,其中每個編碼探針包含可與生物靶相互作用的探針區域和確定編碼探針被遞送的位點的位置并鑒定生物靶的代碼標簽;促使編碼探針與生物靶相互作用;測定編碼探針的序列的全部或一部分,以及將多種生物靶的豐度或活性或兩者與樣品中位點的位置相關聯。基于待檢測的分子和該檢測系統所需要的試劑,本發明的測定系統可采用多種檢測機制。以下更詳細地描述了可用于本發明的測定系統的示例性的方法。
圖I提供了本發明的測定系統的簡化概述。圖2提供了用于檢測核酸的本發明的測定系統的一個實施方式的簡化概述。圖3是圖2中概述的測定的一個實施方式的代表性描繪。圖4示出了用于本發明的測定系統的組合編碼方案的一個實施方式的一般機制。圖5提供了圖4中所示的組合編碼方案的實施方式的簡化的、具體的實例。定義本文使用的術語旨在具有本領域普通技術人員所理解的普通且常用的含義。除非特別指明,以下定義旨在幫助讀者理解本發明,而不旨在改變或以其他方式限制這些術語的含義。如本文所用的術語“抗體”旨在表示完整的免疫球蛋白或抗體或能夠特異性結合抗原的免疫球蛋白分子的任何功能片段(抗體和抗原是本文所定義的“結合配偶體(binding partner)”)。如本文所用的“抗體”意在包括完整的抗體以及能夠結合目的抗原或抗原片段的任何抗體片段。這些肽的實例包括完整的抗體分子、抗體片段例如Fab、Fiah1 ) 2、CDR、VL、VH和抗體的能夠特異性結合抗原的任何其他部分。用于本發明的測定的抗體對在本發明的測定中所檢測的蛋白質(即,生物靶)或用于檢測的蛋白質(即,探針)具有免疫反應性或免疫特異性,且因此與它們特異性且選擇性地結合。如本文所用的術語“結合劑”是指特異性結合目的生物分子的任何劑。“互補的”或“基本上互補的(substantially complementary) ”是指核苷酸或核酸之間,諸如例如雙鏈DNA分子的兩條鏈之間或寡核苷酸引物和單鏈核酸上的引物結合位點之間的雜交、或堿基配對或雙鏈體的形成。通常,互補的核苷酸是A和T (或A和U),或C和G。當核苷酸的一條鏈(經最佳比對和比較且具有適當的核苷酸插入或缺失)與另一條鏈的至少約80%,通常至少約90%至約95%,和甚至約98%至約100%配對時,兩條單鏈RNA或DNA分子被表述為是基本上互補的。“雜交”是指其中兩條單鏈多核苷酸非共價地結合形成穩定的雙鏈多核苷酸的過程。所得的(通常)雙鏈的多核苷酸是“雜交體(hybrid)”或“雙鏈體”。“雜交條件”將通常包括約小于1M,通常小于約500mM且可以小于約200mM的鹽濃度。“雜交緩沖液”是緩沖鹽溶液,例如5% SSPE或其他的本領域已知的這類緩沖液。雜交溫度可以低至5°C,但是通常大于22°C,且更通常地大于約30°C,且通常超過37°C。雜交通常在嚴格條件,即在這種條件下引物將與其靶子序列(subsequence)雜交而不會與其他的非互補序列雜交的條件下進行。嚴格條件是序列依賴性的且在不同的環境中是不同的。例如,對于特異性雜交,較長的片段可能需要比短片段高的雜交溫度。因為其他因素可能影響雜交的嚴格性,包括互補鏈的堿基組成和長度、有機溶劑的存在和堿基錯配的程度,所以參數的組合比單獨的任何一個參數的絕對測量更重要。通常嚴格條件被選擇為比在特定的離子強度和PH下特定序列的Tm低約5°C。在約7. O至約8. 3的pH下和至少25°C的溫度下,示例性的嚴格條件包括至少O. OlM至不大于IM的鈉離子濃度(或其他鹽)的鹽濃度。例如,5xSSPE (pH 7. 4下的750mM NaCl、50mM磷酸鈉、5mM EDTA)和約30°C的溫度的條件適合等位基因特異性的雜交,但是合適的溫度取決于雜交區域的長度和/或GC含量。“連接”是指在溫度驅動的反應中在兩種或更多種核酸,例如寡核苷酸和/或多核苷酸的末端之間形成共價鍵或連接(linkage)。鍵或連接的性質可極大地不同且連接可酶 促地或化學地進行。如本文所用的,連接通常酶促地進行以在一個寡核苷酸的5,碳末端核苷酸與另一個核苷酸的3'碳之間形成磷酸二酯連接。本文所用的“核酸”、“寡核苷酸”、“oligo”或語法等價形式通常是指共價連接在一起的至少兩個核苷酸。核酸通常會包含磷酸二酯鍵,但是在某些情況下可包括具有可選骨架,例如亞磷酰胺、二硫代磷酸酯或甲基亞磷酰胺(methylphophoroamidite)連接;或肽核酸骨架和連接的核酸類似物。其他類似物核酸包括具有雙環結構(包括鎖核酸)、剛性骨架(positive backbone)、非離子骨架和非核糖骨架的類似物核酸。可對核糖-磷酸骨架進行修飾以增加分子的穩定性;例如,在某些環境中PNA = DNA雜交體可顯示出更高的穩定性。“引物”是指天然或合成的寡核苷酸,其與多核苷酸模板形成雙鏈體后能夠充當核酸合成的起始點并從其3'端沿模板延伸致使形成延伸的雙鏈體。延伸過程期間添加的核苷酸的序列由模板多核苷酸的序列決定。通常通過DNA聚合酶延伸引物。術語“SNP”或“單核苷酸多態性”指個體之間的遺傳變異;例如,生物體的DNA中可變的單一含氮堿基的位置。發現SNP遍布基因組;個體之間的許多遺傳變異歸因于SNP位點的變異,且通常該遺傳變異引起個體之間的表型變異。用于本發明的SNP及其相應的等位基因可衍生自任意幾種來源,例如公共數據庫(U. C. Santa Cruz Human Genome BrowserGateway(http://genome, ucsc. edu/cgi-bin/hgGateway)或 NCBI dbSNP 網址(http://www. ncbi. nlm. nih. gov/SNP/)或可如美國專利第 6,969, 589 號;和名稱為“Human GenomicPolymorphisms"的美國公布第2006/0188875號中所述經實驗確定。雖然在本文提供的某些實施方式中描述了 SNP的使用,但是將應理解其他雙等位基因或多等位基因遺傳標志也可使用。雙等位基因遺傳標志是具有兩種多態形式或等位基因的遺傳標志。如以上提及的,對于與性狀相關聯的雙等位基因遺傳標志,與對照組相比在實例組的遺傳組成中更豐富的等位基因被稱作“關聯等位基因(associated allele) ”,而其他等位基因可被稱為“非關聯等位基因(unassociated allele)”。因此,對于與特定性狀(例如,疾病或藥物反應)相關聯的每種雙等位基因多態性,存在相應的關聯等位基因。可被用于本文提供的方法的其他雙等位基因多態性包括但不限于多種核苷酸改變、插入、缺失和轉位。還將應理解,本文述及的DNA可包括基因組DNA、線粒體DNA、游離體DNA和/或DNA衍生物例如擴增子、RNA轉錄物、cDNA、 DNA類似物等。在關聯研究中篩選到的多態位點可處于二倍體或單倍體狀態且理想地,將來自遍布基因組的位點。當提及結合配偶體(例如,蛋白質、核酸、抗體或其他親和捕獲劑等等)時,如本文所用的術語“選擇性地結合”、“選擇性的結合”及類似術語是指兩個或更多個結合配偶體的具有高親和力和/或互補性的結合反應以確保在指定的測定條件下的選擇性雜交。通常,特異性結合將是背景信號的標準差的至少三倍。因此,在指定條件下,結合配偶體結合其特有的“靶”分子而不大量地結合樣品中存在的其他分子。“測序”、“序列測定”及類似術語是指與核酸的核苷酸堿基序列相關的信息的測定。該信息可包括核酸的部分以及全部序列信息的鑒定或測定。序列信息可根據不同程度的統計學可信度或置信度確定。在一個方面,該術語包括對核酸中多個連續核苷酸的同一I"生或順序的測定。“高通量數字測序”或“下一代測序(next generation sequencing)”是指使用以本質上并行的方式測定許多(通常數千至數十億)核酸序列的方法測定序列,即,其中不是一次一個地,而是在大批量程序中準備用于測序的DNA模板,且其中優選地并行或可選擇地使用本身可能并行化的超高通量系列程序讀出許多序列。這些方法包括但不限于焦磷酸測序(例如,如由454 LifeSciences, Inc. , Branford, CT商售);通過連接測序(例如,如在 SOLiD technology, Life Technology, Inc.,Carlsbad, CA 商售);通過使用修飾的核苷酸合成測序(例如,在由Illumina, Inc. , San Diego, CA的TruSeq andHiSeq technology、由 Helicos Biosciences Corporation, Cambridge,MA 的 HeliScope 和 Pacific Biosciences of California, Inc. , Menlo Park, CA 的 PacBio RS 商售),通過離子檢測技術測序(Ion Torrent, Inc.,South San Francisco, CA) ;DNA納米球測序(Complete Genomics, Inc. , Mountain View, CA);基于納米孔的測序技術(例如,如由Oxford Nanopore Technologies, LTD, Oxford, UK開發)及類似的高并行化測序方法。術語“Tm”被用來指“熔化溫度”。熔化溫度是一群雙鏈核酸分子被半數解離成單鏈的溫度。用于計算核酸的Tni的多種等式是本領域熟知的。如由標準參考文獻指出的,當核酸在IM NaCl的水溶液中時,對Tm值的簡單估算可通過等式Tm = 81. 5+0. 41 (% G+C)來計算(參見,例如 Anderson 和 Young, Quantitative Filter Hybridization, in Nucleic AcidHybridization(1985))。其他參考文獻(例如,Allawi 和 SantaLucia, Jr. ,Biochemistry,36 :10581-94(1997))包括可選的計算方法,對于Tm的計算這些方法考慮了結構和環境以及序列的特征。發明詳述除非另外指明,本文描述的技術的實踐可采用有機化學的、聚合物技術、分子生物學(包括重組技術)、細胞生物學、生物化學和測序技術的傳統技術和說明,這些都在從事本領域的人員的技術范圍內。這些傳統技術包括聚合物陣列合成、多核苷酸的雜交和連接,以及使用標記檢測雜交。對合適技術的具體闡述可參考本文的實例獲得。然而,當然也可使用其他等效的傳統技術。這些傳統技術及說明可在標準實驗室手冊如 Green,等人,編輯,Genome Analysis A Laboratory Manual Series (第 I-IV卷)(1999) ;ffeiner, Gabriel, Stephens,編輯,Genetic Variation A LaboratoryManual (2007) ;Dieffenbach,Dveksler,編輯,PCR Primer A Laboratory Manual (2003);Bowtell 和 Sambrook, DNA Microarrays A Molecular Cloning Manual(2003) ;Mount,Bioinformatics !Sequence and Genome Analysis(2004) ;Sambrook和Russell,CondensedProtocols from Molecular Cloning A Laboratory Manual(2006);及 Sambrook 和RusselljMolecularCloning A Laboratory Manual (2002)(全部來自 Cold Spring HarborLaboratory Press) ;Stryer,Biochemistry (第 4片反)(1995) W. H. Freeman,New York N. Y.;Gait,“Oligonucleotide Synthesis A Practical Approach,,(2002) IRL Press,London ;Nelson 和 Cox,Lehninger, Principles of Biochemistry(2000)第 3 片反,W. H. FreemanPub. , New York, N. Y.;及 Berg,等人,Biochemistry (2002)第 5 版,W. H. Freeman Pub. , NewYork, N. Y.中找到,為了所有目的本文通過引用將所有這些文獻全部并入。注意除非上下文另外清楚地指明,否則如在本文和所附權利要求中使用的,單數形式“一個(a)”、“一個(an)”和“該(the) ”包括復數的所指對象。因此,例如,述及“核酸”是指一種或多種核酸,而述及“該測定”包括述及本領域技術人員已知的等效步驟和方法,
坐坐 寸寸O除非另外定義,本文所用的所有技術和科學術語具有與本發明所屬領域的普通技術人員通常理解的相同含義。為了描述并公開可與目前描述的發明結合使用的裝置、制劑和方法學的目的,本文提及的所有出版物被通過引用并入。當提供了一個范圍的值時,應理解在該范圍的上限和下限之間的每個中間值和在該指定的范圍內的任何其他指定值或中間值包括在本發明內。這些較小范圍的上限和下限可被獨立地包括在這些較小的范圍內,且也包括在本發明內,服從該指定范圍內任何特別排除的限值。當指定的范圍包括限值中的一個或兩個時,排除了所包括的那些限值中的任何一個兩個的范圍也包括在本發明內。在以下說明中,闡述了許多具體細節以提供對本發明的更透徹的理解。但是,將對于本領域技術人員明顯的是,沒有這些具體細節中的一個或多個時,可實施本發明。在其他實例中,未描述本領域技術人員熟知的熟知特征和步驟以避免使本發明難以理解。大體發明本發明的測定系統提供了空間編碼的多重測定,其包含I)能夠用有效的空間編碼方案高水平地多重檢測的測定;2)能夠根據空間模式遞送試劑的設備;和3)通過本質上為數字的讀出確定的解碼。本發明的測定系統檢測生物樣品中生物靶或指示生物靶的生物活性的存在或不存在和相對量以及該生物靶或活性的位置,生物樣品例如布置在支持體例如顯微鏡載玻片或組織培養皿上的組織切片或其他生物學結構。該測定系統還提供了具有以空間上界定的模式遞送試劑的能力的設備。該設備,連同軟件、試劑和說明書,為本發明的高度創新的測定系統提供了關鍵組成部分,允許在目的空間環境中測量許多生物靶或活性,包括基因表達和肽定位。用于這些測定系統中的編碼方案允許人們在多重測定的產物被從生物樣品中移除并被匯集用于分析之后確定生物靶或活性在生物樣品中的位置(或其缺乏)。對編碼方案的解碼可通過例如下一代測序進行,下一代測序容易地以低的成本提供數百萬或數萬億的數據點。然后可將測定結果例如生物靶的量或活性映射回生物樣品中的特定位置。該測定系統打開了通往生物樣品中細胞功能和調控的復雜空間模式的新分析窗口。
圖I提供了本發明的測定系統100的簡化概述。在步驟110處,提供了附著到支持體的生物樣品。該生物樣品包含目的生物靶。生物靶可包含任何目的分子,例如核酸(包括,例如RNA轉錄物、基因組DNA序列、cDNA、擴增子或其他核酸序列)和蛋白質、酶及類似物。在步驟120處,根據已知的空間模式將編碼探針遞送到生物樣品中。編碼探針包括可與目的生物靶相互作用的探針和確定被測定的生物靶在樣品中的位置并由此可用來將測定結果反向連接到樣品中的位置的代碼標簽。大多數實施方式中的代碼標簽是寡核苷酸。然而,代碼標簽還可以是質量標簽(mass tag)、熒光標記或其他部分。在某些實施方式中,將編碼探針的探針部分和代碼標簽部分在向生物樣品遞送之前預偶聯。例如,在其中編碼探針是寡核苷酸的實例中,可將探針和代碼標簽序列合成為單一的寡核苷酸。可選擇地,可合成或單獨獲得編碼探針的探針部分和代碼標簽部分并在向生物樣品遞送之前組合(例如,可合成兩個單獨的寡核苷酸并通過例如連接來偶聯;或可單獨地制備抗體和寡核苷酸并在向生物樣品遞送之前共軛)。另外,如圖2-5中描述的,單獨地合成探針和代碼標簽(在編碼寡核苷酸中)并在測定中的不同步驟將其遞送到生物樣品(例如,先探針且其后代碼標簽或反之亦然)。
酸與核酸靶雜交、酶催化與蛋白質靶的反應、抗體結合表位等的條件。在其中生物靶為核酸的實例中,編碼探針通常是寡核苷酸并與靶核酸雜交。在生物靶為蛋白質的實例中,編碼探針通常是通過與靶蛋白結合或通過與靶蛋白反應來與靶蛋白相互作用的適體、小分子或寡核苷酸共軛的蛋白質(也就是,蛋白質中的一種是另一種的底物)。編碼寡核苷酸可經合適的基團通過共軛、化學或光交聯及類似的手段與探針(蛋白質)偶聯。一旦編碼探針與生物靶相互作用,必須在步驟140處將與生物靶相互作用的編碼探針和未與生物靶相互作用的編碼探針分離。在其中生物靶是核酸且編碼探針是寡核苷酸的實例中,分離可通過例如從樣品中洗掉未雜交的編碼探針來實現。相似地,對于基于親和結合的其他測定,包括使用適體、小分子和蛋白質探針的測定,洗滌步驟可用來去除低親和力的結合劑。在其中探針經與靶相互作用而被轉化的實例中,例如,在經例如蛋白酶裂解或經激酶磷酸化的肽的實例中,收集所有的編碼探針即與生物靶相互作用并被轉化的編碼探針和未被轉化的編碼探針二者是方便的。在收集或匯集之后,抗體或其他親和捕獲劑可用來捕獲通過添加某個部分(例如,磷酸基團)而被轉化的探針。在其中探針已通過裂解而被轉化的實例中,可通過例如借助于在轉化期間從轉化的探針中去除的標簽(例如,通過裂解)來捕獲未轉化的探針或通過在裂解位點添加新的標簽來分離轉化的探針。一旦反應的(轉化的)或相互作用的編碼探針與未反應的或未相互作用的編碼探針分離,優選通過測序來測定反應的和/或相互作用的編碼探針的序列。編碼探針的序列允許將測定結果映射回在生物樣品中的位置。圖2提供了體現出用于編碼空間信息的組合代碼方案的有效實施的本發明的測定系統的簡化概述。為了該概述的目的,探針是寡核苷酸,但是如其他地方解釋的,也可使用其他類型的探針。在步驟210中,提供了附著到支持體的生物樣品,例如組織樣品或其他生物結構。在步驟220中,向該生物樣品遞送一個或多個寡核苷酸探針,其中寡核苷酸探針能夠與生物樣品中的生物靶雜交。在步驟230中,促使寡核苷酸探針與核酸靶相互作用(雜交);也就是說,提供其中寡核苷酸探針可與靶核酸雜交的合適條件。
在步驟240中,去除未與靶核酸雜交的寡核苷酸探針,并從而與未與靶核酸雜交的寡核苷酸探針分離。在該實施方式中,分離可通過例如,洗滌樣品去除未雜交的寡核苷酸探針來實現。接下來,在步驟250中,根據所選擇的空間模式向生物樣品遞送編碼探針(編碼劑),其中編碼寡核苷酸包含用來編碼生物靶在生物樣品中的位置的代碼標簽。注意與圖I的測定系統相比,此處在分開的步驟中遞送探針和編碼劑(編碼寡核苷酸)。在步驟260中,編碼寡核苷酸與寡核苷酸探針偶聯以制備編碼探針。在其中探針是寡核苷酸的實例中,編碼寡核苷酸可通過例如連接與寡核苷酸探針偶聯。可選擇地,可通過使用DNA聚合酶來延長起引物作用的探針寡核苷酸而轉移編碼寡核苷酸中的信息,并從而復制和并入編碼寡核苷酸的序列。在步驟270中,測定了編碼探針中代碼標簽的序列以及探針本身的序列或一部分 序列,并在步驟280中,將靶核酸映射回生物樣品。在某些實施方式中,序列的豐度揭示出生物靶在該位置的相對量。雖然該實施方式以特定的順序展示了單獨的步驟,但是為了更好地解釋本發明,這些步驟的精確順序可改變。例如,可組合步驟220和步驟250,以根據所選擇的空間模式遞送探針與編碼寡核苷酸的混合物。然后可在組合的步驟220和步驟250之后立即進行或與這兩個步驟同時進行偶聯步驟260。在該實例中,則步驟240將在步驟260之后發生。因此可理解這一系列的步驟的兩個關鍵結果,即,探針分子的位置特異性編碼和基于探針分子與相應的靶分子的相互作用的能力分離探針分子可在特定步驟的實施中以一定靈活性實現。相似地,在代碼方案的設計方面存在極大的靈活性。如下文描述的,本發明的測定特別適用于組合方法。因此,本發明提供了觀看許多位置中的許多生物靶的能力,提供了以高度并行的測序數據分析對原位雜交的分辨。在某些實施方式中,被測試的多種生物靶和生物樣品中的多個位點的和大于20,在其他實施方式中,被測試的多種生物靶和生物樣品中的多個位點的和大于50,在其他實施方式中,被測試的多種生物靶和生物樣品中的多個位點的和大于 100、大于 500、1,000、10,000,25, 000、100,000,500, 000、1,000,000。應理解,由于本發明的空間編碼尺寸,可設想甚至大得多的數字。例如,測定每個位置10,000靶X 10,000位置將產生IO8種不同的測定,且可容易地設想甚至比這些數更大的數,特別是如果使用具有單細胞分辨率級別的分辨率的空間位置的話。另外,在其中采用高通量數字測序的實施方式中,通常并行測定至少1,000個編碼探針的序列。更通常地,使用數字讀出,對于每個測定期望獲得多個序列讀數(由探針和空間位置碼定義)。取決于實驗的設計和測定的需要,,期望獲得每個測定至少3拷貝的平均值,且更通常地,每個測定至少10或至少30拷貝的平均值。對于具有合適動態范圍的量化讀出,每個測定可能期望獲得至少1,000個讀數。因此,如果進行1,000,000測定,序列讀數的數字將是十億或更大。對于高通量數字測序,并考慮到冗余,并行測定至少10,000編碼探針的序列,或并行測定至少100,000、500,000、I, 000,000、10,000,000、100,000,000、1,000,000,000 或更多的編碼探針的序列。測定本發明的測定系統的測定部分包含下列一般步驟遞送探針和編碼劑,其中根據已知的空間模式向樣品遞送編碼劑(在某些實施方式中與探針預偶聯),促使探針與樣品中的生物靶相互作用或反應,且如果探針和編碼劑未被預偶聯,將編碼劑與探針偶聯。本發明的樣品幾乎包括可附著到支持體或主要以二維方式提供的任何生物樣品或多個樣品,其中將所測定的生物靶或活性反向系于在生物樣品內的位置的能力是重要的。示例性的生物樣品包括組織切片(例如,包括完整的動物切片和組織活檢)、載玻片或組織培養皿上的細胞群及類似物。本發明的測定系統是特別有利的,因為其和許多生物樣品類型,包括新鮮樣品,例如原代組織切片,和儲藏的樣品包括但不限于冷凍樣品和福爾馬林固定的(paraformalin-fixed)、石臘包埋的(FFPE)樣品相容。本發明的測定系統的重要的方面是將生物樣品固定到具有不連續的、可獨立測量的區域的基材表面上。待檢測的生物靶可以是任何生物分子包括但不限于蛋白質、核酸、脂質、碳水化合物、離子或包含以上任何一種的多組分復合物。亞細胞靶的實例包括細胞器,例如線粒體、高爾基體、內質網、葉綠體,內吞囊泡、胞吐囊泡、液泡、溶酶體等。在某些特定的實施方式中,使用該測定系統例如通過基因型分型、DNA拷貝數或RNA轉錄物的定量、定位樣品內的特定轉錄物及類似手段來分析核酸。圖3示出了可用于本發明的測定系統的用于例如,檢測單核苷酸多態性(SNP)的示例性測定的整體方案。在圖3中,提供了兩個寡核苷酸探針。每個寡核苷酸探針包含在305和307看到的靶特異性區域(位于待分析的SNP的任何一側)和在301和303看到的連接區域。促使寡核苷酸探針與生物樣品中的靶核酸(未示出)雜交。在步驟302處,寡核苷酸探針之一被延伸以并 入SNP序列并與另一個探針連接以形成包含靶核酸區域309和連接區域301和303的延伸的探針。將包含代碼標簽(在315和317處看到)、連接區域(在311和313處看到)和引物區域(在319和321處看到)的兩種編碼劑在步驟304與延伸的探針相組合并連接以形成編碼的靶特異性寡核苷酸。再次地,與圖I相比,在分開的步驟中遞送探針和編碼劑。這樣做允許使用下文描述的組合實施方式。在優選的實施方式中,一對編碼寡核苷酸內的編碼寡核苷酸與靶序列的一側或另一側(即,靶序列的5'或3'端)特異性連接。另外,通常編碼寡核苷酸和探針的連接區域和引物區域是通用的;也就是,在構建探針和編碼寡核苷酸中使用的連接區域和引物區域的組合是恒定的,且只有探針的靶特異性區域和編碼核苷酸的代碼標簽不同。但是,又在替代實施方式中,連接區域和引物區域不是通用的,并在探針和編碼劑之間不同。連接以后,洗脫、匯集編碼探針,并任選地通過PCR向編碼探針加入測序接頭。在替代實施方式中,測序引物可與編碼寡核苷酸連接,或測序引物序列可被包括作為編碼寡核苷酸的一部分。如圖3中所看到的,每個測序接頭包含與編碼探針上的引物區域319和321相容的引物區域319或321。現在準備將包含第一接頭327、第一引物區域319、第一代碼標簽315、連接區域311和301、靶區域309、連接區域313和303、第二代碼標簽317、第二引物區域325和第二接頭329的最終構建體輸入到數字高通量測序程序中。圖3中例示了延伸反應和連接反應的組合,但是應當理解多種反應可用來偶聯編碼寡核苷酸和靶特異性寡核苷酸,包括僅連接(例如,對于與靶核酸序列的連續部分雜交的寡核苷酸)。可選擇地,可采用使用了另外的寡核苷酸的測定,例如在GOLDENGATE 測定中(參見 Fan,等人,ColdSpring Symp. Quant. Biol. , 68 :69-78 (2003) ; (Illumina,Inc. , San Diego, CA))。在其他實施方式中,本發明的測定系統還可用來分析生物樣品中的肽或蛋白質、抗體的存在、酶活性和其他蛋白質的活性、翻譯后修飾、肽的活性和非活性形式以及肽的異構體(isoform)。因此,探針可包含酶的活性區域、免疫球蛋白的結合結構域、蛋白質的特定結構域、完整的蛋白質、合成的肽、引入突變的肽、適體和類似物。在某些方面,探針是酶或酶原(proenzyme)例如激酶、磷酸酶、酶原(zymogen)、蛋白酶或其片段的底物。在某些方面,探針是用來檢測參與一種或多種信號轉導通路的蛋白質例如激酶或磷酸酶的磷酸化底物。在本發明的另一個特定的方面,探針是僅與單獨的蛋白酶或蛋白酶種類結合的特定蛋白酶底物。在其他方面,探針是酶的不同加工形式、異構體和/或結構域。基于蛋白質的探針通常與寡核苷酸編碼劑共軛或以其他方式與其連接。在該實例中的寡核苷酸編碼劑還將包括促進蛋白質探針鑒定的核苷酸序列組分。在某些方面,本發明提供了用于評價樣品中的不同位置之間和/或樣品之間生物靶的量和/或活性的差異的測定。該方法包括確定來自生物樣品的多個編碼結果和評價生物靶在生物樣品中的每個位置的數量的差異。組合實施方式
為了將編碼效率最大化,可使用在編碼寡核苷酸中利用成對代碼標簽的組合方法。通過將靶特異性信息和編碼標簽去偶聯,所需要的寡核苷酸的數目急劇減少,伴隨成本減少。圖4示出了用于本發明的測定系統的組合編碼方案的一個實施方式的一般機制,其中測定了代表性組織切片中的核酸(在416處示出)。圖4在A處示出了特異性結合目的靶核酸402的兩個靶特異性/編碼寡核苷酸構建體420和422 (例如,在圖3的步驟302和304之間形成)。第一編碼探針420包括與例如用于擴增測定產物的通用引發位點或接頭相關聯的代碼標簽408以使得能夠使用測序技術404鑒定代碼識別劑(coding identifier)。第二編碼探針422包括與例如用于擴增測定產物的通用引發位點或接頭相關聯的代碼標簽406以使得能夠使用測序技術410鑒定編碼識別劑。圖4在B處示出了可用于二十種不同的代碼標簽al到alO (編碼探針420上的代碼標簽406)和bl到blO (編碼探針422上的代碼標簽408)的空間模式。例如代碼標簽al安置在生物樣品上10個離散的區域或斑點(在412中示為第一水平線的斑點)中。代碼標簽a2安置在生物樣品上在412中第二水平線上的10個斑點中。代碼標簽a3安置在生物樣品上在412中第三水平線上的10個斑點中,等等。鑒于“a”標簽安置在10個水平的排中,如414中所示,“b”標簽安置在10個垂直的排中。例如,代碼標簽bl安置在生物樣品上在414的第一垂直排的十個離散的斑點中,代碼標簽b2安置在生物樣品上在414的第二垂直排的十個離散的斑點中,等等。使用該設置允許20個代碼標簽唯一地界定生物樣品上100個不同的位置。圖4在C處示出了與代碼標簽網格418 —致的代表性組織切片416。箭頭表明了“a”代碼標簽和“b”代碼標簽如何安置在與組織切片416 —致的網格418上。如果一旦測序,代碼標簽al和b4例如與靶核酸序列相關聯,那么該靶核酸序列(即,生物靶)呈現在組織切片中的位置al、b4處。圖5提供了用于本發明的測定系統的編碼方案的簡化的特定實例。圖5示出了包含al、a2、a3、a4和bl、b3、b3及b4的編碼寡核苷酸510。在520處示出了靶特異性寡核苷酸(TSO)(探針)1和2。在530處示出了安置或分配方案。如圖4中例示的網格一樣,編碼寡核苷酸al至a4以某種模式(此處,以豎直模式)安置在斑點中,且編碼寡核苷酸bl至b4以某種模式(此處,以水平模式)安置在斑點中。網格雖然被示為具有斑點的正方形,但實際上是在生物樣品(未示出)例如圖4中所示的組織切片416上的安置模式。將靶特異性寡核苷酸遞送到生物樣品中,其中靶特異性寡核苷酸與生物樣品中的靶核酸雜交(如果存在靶核酸的話)。然后通過例如洗滌去除未雜交的靶特異性寡核苷酸。然后根據在530處所示的空間模式,將編碼寡核苷酸遞送到生物樣品中。編碼寡核苷酸與和生物樣品中的靶核酸雜交的任何靶特異 性寡核苷酸連接(或,例如,延伸并連接),然后將連接的構建體從生物樣品中洗脫出來,匯集并通過例如PCR或連接加入測序接頭(如果該序列之前未被包含在編碼寡核苷酸內的話)。通過例如高通量或“下一代”測序對連接的構建體測序。在540 處示出了所得序列的集合(pool)。僅在 a4bl、a4b2、alb3、a2b3、a3b3、a4b3和a4b4(用水平線示出的位置)獲得了靶特異性寡核苷酸I的序列讀出。僅在albl (用豎直線示出的位置)獲得了靶特異性寡核苷酸2的序列讀出。在位置a2bl、a3bl、alb2、a2b2和a3b2處(用交叉影線示出的位置)獲得了靶特異性寡核苷酸I和2的序列讀出。未在alb4、a2b4或a3b4處(無陰影示出的位置)獲得任一個靶特異性寡核苷酸的序列讀出。因此,在進行測定的生物樣品中,在生物樣品的左側的大部分并在底部檢測到第一靶核酸,僅在生物樣品的左上部分檢測到第二靶核酸,且未在生物樣品的右上部分檢測到任何一種靶核酸。現在可將兩種靶核酸的不同表達映射回生物樣品并映射生物樣品的這些位置中的生物結構或細胞類型。除了位置信息,可獲得與編碼標簽的相對豐度相關的信息。例如,如果發現與a4Tlb2序列相比多達十倍的a4Tlbl序列出現在數據組中,這將表明靶核酸序列I在a4Tlbl位置比在a4Tlb2位置豐富十倍。在如圖3所示的核苷酸分析的實例中,通過將代碼標簽與靶特異性寡核苷酸直接連接,對于η個靶僅需要2η個靶特異性寡核苷酸。例如,使用圖2中概括的組合方法,在10, 000個空間位置測定100個不同的靶將需要2 X 100個靶特異性寡核苷酸和2 X 100個編碼寡核苷酸。不計算通用引物,測定寡核苷酸的總數將僅為400(200個靶特異性的和200個編碼的寡核苷酸)。相比之下,如果代碼寡核苷酸未與靶特異性寡核苷酸去偶聯,將需要(η X X個位置代碼)+(η X Y個位置代碼),或在上述實例中,不計算通用引物序列,需要20,000寡核苷酸。此外,雖然圖2-5中所示的實施方式描繪了使用兩種編碼劑(代碼標簽)的組合方案,但是可使用三種、四種或更多種編碼劑和代碼標簽,并通過不同的方法在不同的步驟組合中與探針連接或互相連接。由于本發明的測定系統的空間編碼方面,用甚至數目適中的測定就可產生大量的信息。例如,在樣品中的5個或更多個位置測定的5種或更多種生物靶產生25種或更多種組合。使用數字測序作為讀出,每種組合的序列讀數的最佳數目取決于所需要的靈敏度和動態范圍,并可調整。例如,如果對于每種組合抽出平均100個讀數,對于25種組合的總數是25,000個讀數。如果以平均1,000的取樣深度在1,000個位置測定1,000個靶,則需要IO9個讀數。這些數字,雖然大,但是在本質上并行的數字測序方法的能力之內,這些方法可在合理的時間表中并以每個讀數非常低的成本產生數十億或甚至數萬億讀數的數據集。因此,通過改變待檢測的位置或待測定的生物靶的數目或兩者都改變,并使用數字測序,可獲得大量的信息。在特定的方面,對于兩種或更多種生物分子檢測多個位置。
試劑遞送系統本發明的試劑遞送系統包括允許向生物樣品的離散部分遞送試劑的設備,維持編碼方案的空間模式的完整性。本發明的測定系統的試劑遞送系統包含任選的成像裝置、試劑遞送硬件和控制軟件。試劑遞送可以多種不同的方式實現。應當注意試劑遞送可能一次針對許多不同的生物樣品。本文已例示了單一的組織切片;然而,可同時附著并分析多種生物樣品。例如,可并行分析組織樣品的連續切片并組合數據以建立3D圖譜。對于本發明的測定系統不可缺的是允許試劑到達生物樣品上的空間模式的設備。用于配制并遞送生物分子(例如,寡核苷酸或抗體)和化學試劑(例如,小分子或dNTP)的技術是本領域已知的且這些設備系統的使用是本領域技術人員已知的并容易適用本發明的測定系統。合適的試劑遞送系統的一個實例是Labcyte Echo聲波移液設備(Labcyte Echo acoustic liquid handler),其可用來以高的準確度和重復性遞送包含生物分子的納升(nanoliter)尺度的小滴。使用軟件來具體說明試劑應被遞送的位置,本領域技術人員 可以將該試劑遞送裝置集成到整個系統中。可用于將劑和/或代碼識別劑安置到生物樣品上的其他設備包括但不限于噴墨點涂(inkjet spotting);通過大頭針、筆或毛細管的機械點涂;微接觸印刷;光化學或光刻方法;及類似方法。對于多種應用,將生物樣品的某些區域分割或隔離成用于不同的試劑分布和/或生物靶測定的一個或多個測定區域可能是優選的。可使用屏障或管道將這些測定區域物理地分隔開。在一個示例性的方面,試劑遞送系統可以是基于流的系統(flow based system)。在本發明中用于試劑遞送的基于流的系統可包括例如一個或多個泵、閥、流體貯池(fluidreservoir)、管道和/或試劑儲存池的設備。試劑遞送系統被設置成使流體移動以接觸生物樣品的離散部分。這些試劑的移動可由布置在例如,流體試劑下游的泵來驅動。泵可將每種流體試劑驅送到(并經過)反應區室。可選擇地,可通過重力驅使試劑穿過流體。美國公布第20070166725和20050239192號公開了可用于本發明的測定系統的某些一般目的的應用流體學(fluidics)工具,允許用相對簡單的硬件精確地操縱氣體、液體和固體以完成非常復雜的分析操作。在更具體的實例中,一個或多個流通池(flow cell)可與來自上文的附著基材的生物樣品連接。流通池可包括與其連接的入口管和出口管并且任選地,外部泵用來將試劑遞送到流通池并經過生物樣品。流通池被設置為僅將試劑遞送到生物樣品的某些部分,限制遞送到生物樣品的任何具體部分的試劑的量和類型。在另一個方面,可將微流體系統集成到其上布置生物樣品的基材中或從外部附接到基材的頂部。用于容納并攜帶流體的微流體管道可通過與基材鄰接的應用流體層形成在平面基材上和/或其上方。可根據選擇性地開放和關閉布置在試劑池之間的閥來選擇和遞送流體試劑。泵通常包括用于移動流體和/或設置在流體中的試劑的任何機構。在某些實例中,泵可被設置成使流體和/或試劑移動經過具有小體積的管道(即,微流體結構)。除了其他方法外,泵可通過對流體和/或攜帶流體的結構施加正壓或負壓來機械地操作,或通過電場的適當應用來電動地操作,或兩者兼有。示例性的機械泵可包括注射泵、蠕動泵、旋轉泵、加壓氣體、移液器等。機械泵可被微型機械化、模制等。示例性的電動泵可包括電極且可通過電泳、電內滲(electroendoosmosis)、電毛細管、雙向電泳(包括其行波形式)和/或類似的方法操作。閥通常包括用于調控流體通過管道的任何機構。閥可包括例如,可被選擇性地變形以部分或完全地關閉管道的可變形的構件,可選擇性地延伸進入通道以部分或完全地堵塞管道的可移動的突出部,電毛細管結構和/或類似的結構。開口墊圈可與生物樣品的頂部附接并可將樣品和試劑注射到墊圈中。合適的墊圈材料包括但不限于氯丁橡膠、腈和硅橡膠。可選擇地,防水反應室可由夾在基材上的生物樣品和化學上惰性的防水材料例如但不限于黑色電鍍鋁、熱塑性塑料(例如,聚苯乙烯、聚碳酸酯等)、玻璃等之間的墊圈形成。在可選的實施方式中,測定系統包括確定目的生物樣品的特征和組織的成像裝置。所獲得的圖像例如可用來設計試劑的安置模式。成像裝置是任選的,因為人們可使用例如顯微鏡來代替觀察生物樣品,分析生物樣品的組織并具體說明遞送測定試劑的空間模式。遞送系統(如果包括的話)可包含微電路構造,所述微電路構造包括成像器例 如基于CCD或IGFET(例如,基于CMOS)的成像器和例如通過引用并入本文的美國公布第20090197326號中描述的用于試劑遞送的超聲噴霧器。另外,應注意雖然圖4和5使用x,y網格構型闡述,可使用其他構型,諸如,例如遵循組織樣品的拓撲學;靶向組織中的某些組的細胞、細胞層和/或細胞類型,及類似的構型。在又一個替代方案中,試劑遞送系統使用半導體技術例如掩蔽和噴涂控制試劑遞送到生物樣品表面上的具體模式。通過使用掩蔽物保護特定區域免于暴露,可避免生物樣品的特定區域暴露于試劑。可使用傳統技術例如噴涂或流體流將試劑引入到生物樣品。掩蔽遞送的使用促成基材表面上模式化的遞送方案。在本發明的優選的方面,試劑遞送的設備基于噴墨印刷技術。存在多種不同的噴墨機制(例如,熱式、壓電式)且已顯示與含水墨制劑和有機墨制劑的相容性。數組獨立驅動的噴嘴可用來同時遞送多種試劑,并達到非常高的分辨率。為了靶向特定的目的位點,待測定的生物樣品的信息圖像可用來輔助試劑遞送方法及相關的編碼方案。可使用圖像處理(例如,通過免疫組織化學或其他染色化學方法區分的細胞類型的圖像)結合測定系統的其他特征來鑒定生物樣品的取樣區域。在某些方面,使用軟件將圖像信息自動翻譯成試劑遞送模式。因此非常準確地記錄并比對生物樣品的試劑遞送的機構(mechanism)是本發明的測定系統的重要組成部分。機構例如在載玻片上的基準標志(fiducial marker)和/或其他非常精準的物理定位系統的使用可適用于該目的。本發明優選地包括一整套適合該測定系統的軟件。任選地,寡核苷酸設計軟件用來設計待進行特定測定的編碼核苷酸(且在其中測定核酸的實施方式中,為靶特異性寡核苷酸)并可被集成為該系統的一部分。還任選地,可將用于試劑遞送和數據分析(即,序列分析)的算法和軟件集成在一起以確定測定結果。集成數據分析是特別有用的,因為由于規模的結果,所產生的數據組的類型可能是巨大的。為分析通過該測定系統產生的空間上關聯的數據而專門設計的算法和軟件工具,包括模式分析軟件和可視工具增強了由該測定系統所產生的數據的價值。在某些方面,該測定系統包含用于進行和實施試劑質量控制例如,寡核苷酸庫的完整性和序列保真性的程序。特別地,根據例如揮發性、在關鍵溫度下的穩定性及化學相容性的因素配制試劑以與試劑遞送設備相容并可通過集成在測定系統內的設備來分析這些試劑。測序許多方法可用來鑒定本發明的測定系統的編碼探針中的代碼標簽和探針序列。可使用例如質譜(例如,LC-MS/MS的Maldi-Τ)、核磁共振成像或優選地,核酸測序的技術來檢測代碼標簽。用于對本發明的代碼標簽解碼的技術的實例可在例如通過引用并入本文的美國公布第20080220434號中找到。例如,代碼標簽可以是寡核苷酸質量標簽(0ΜΤ或質量標簽)。例如,在通過引用整體并入本文的美國公布第20090305237號中描述了這些標簽。在又一個替代方案中,可擴增編碼探針并與微陣列雜交。這將需要進行單獨的擴增反應,其中每次擴增是對特定的空間代碼或代碼的子集特異的,通過使用代碼特異性引物來實現。每次擴增還將并入不同的可分辨標記(例如,熒光團)。雜交后,可通過可分辨標記的相對豐度測定映射到樣品中不同的空間位置的特定靶的相對量。在一個特別優選的方面,所得的根據該測定系統的代碼標簽是高通量、下一代 測序的底物,并使用高并行下一代測序方法來確認代碼標簽的序列,例如用SOLiD 技術(Life Technologies, Inc.)或 Genome Ananlyzer (Illumina, Inc·)。該下一代測序方法可使用例如一輪測序(one passsequencing)方法或使用雙末端測序進行。下一代測序方法包括但不限于諸如在例如Drmanac美國專利第6,864,052 ;6,309,824 ;和6,401,267號;和Drmanac等人,美國專利公布2005/0191656中公開的基于雜交的方法;通過合成測序(sequencing-by-synthesis)的方法,例如美國專利第 6, 210, 891 ;6, 828, 100 ;6,969,488 ;6,897,023 ;6,833,246 ;6,911,345 ;6,787,308 ;7,297,518 ;7,462,449 和7,501,245 號;美國公布申請第 20110059436 ;20040106110 ;20030064398 和 20030022207號;Ronaghi,等人,Science, 281 :363-365 (1998);和 Li,等人,Proc. Natl. Acad. Sci.,100 414-419(2003);基于連接的方法,例如美國專利第5,912, 148和6,130,073號;和美國專利申請第20100105052、20070207482和20090018024號;納米孔測序例如美國專利申請第20070036511 ;20080032301 ;20080128627 ;20090082212 號;和 Soni和 Meller, Clin Chem53 =1996-2001(2007)),以及其他方法,例如美國專利申請第20110033854 ;20090264299 ;20090155781 和 20090005252 號;還參見 McKernan,等人,Genome Res. , 19 :1527-41(2009)和Bentley,等人,Nature 456 :53-59 (2008),為了所有目的將所有這些文獻通過引用整體并入本文。測定系統的應用在閱讀本公開內容后將對于本領域技術人員明顯的是存在將受益于可同時測量生物靶在生物樣品中的量和空間位置的高通量多重測定系統的許多重要的生物研究、診斷和藥物開發的領域。例如,組合估計不同RNA轉錄物的相對豐度的能力和重新構建遍及許多位置的豐度的空間模式的圖像(可能和組織中的單個細胞一樣小或甚至比它還小)的能力使得許多不同的基礎研究領域成為可能。以下是示例性的用途且絕不意味著在范圍上是限制性的。在一個實例中,以與CT掃描中的重新構建圖像的方式相似的方式通過分析一系列的組織切片確定基因表達的3維模式。該方法可用來測量疾病病理中例如在癌性組織和/或經損傷、炎癥或感染的組織中基因表達的變化。通過本發明的測定系統,獲得了關于復雜組織中的基因表達和蛋白質定位的更詳細的信息,導致對正常和疾病狀態中的功能和調控的新認識,并提供了可被檢驗的新假設。例如,本發明的測定系統可使得從許多單獨的研究和較大的項目如 ENCODE (Birney,等人,Nature, 447 :799-816 (2007))和 modENCODE 獲得的認識能夠在組織水平上整合。該測定系統還輔助計算機嘗試來模仿系統生物學領域基因表達的相互作用網絡。該測定系統還提供了分析體細胞變異例如癌癥中的體細胞突變或響應于受感染的生物體的變異性的新方法。例如,腫瘤通常是高度異質性的,包含癌細胞以及在異常局部環境中的遺傳學上正常的細胞。癌細胞進行突變和選擇,且在該過程中形成局部克隆并不是不常見的。在腫瘤環境中鑒定相對稀少的體細胞突變可使得研究關鍵突變在克隆變異體的選擇中的作用成為可能。可分析在癌細胞和遺傳學上正常的細胞中與血管生成、炎癥或其他癌相關過程有關的轉錄模式以獲得對癌癥生物學的認識并有助于開發用于治療癌癥的新型治療劑。在另一個實例中,個體對感染性生物體具有不同的敏感性,且本發明的測定系統可用來研究微生物與組織或組織內的多種細胞類型之間的相互作用。
重要的是,因為在任何給定的反應中由于只測定了少數位置,信噪比(signal tonoise)可急劇增加,所以除了提供空間上相關的信息,本發明允許檢測稀少突變的靈敏性大幅增加。在對混合的樣品中的稀有突變的典型測定中,批量處理該樣品,即,將核酸從許多細胞提取到單一的池中。因此,如果突變存在于10,000個細胞中的一個細胞內,必須針對來自 10,000個細胞的正常DNA的背景檢測該突變。相比之下,通過本發明的測定系統,可分析許多細胞,但是單獨的細胞或少數幾組細胞將被空間代碼系統鑒定。因此,在本發明的測定系統中,背景成數量級地減少,極大地增加了靈敏性。此外,可觀察突變細胞的空間組織,這對于在癌癥組織切片中檢測關鍵突變可能是特別重要的。已有的分子組織學分析正在產生對癌癥生物學的認識,且可能具有用于診斷的潛力。本發明的技術有希望極大地增加這些方法的力量。實施例提供以下實施例以給本領域普通技術人員提供如何實施和使用本發明的完整公開和描述,且這些實施例不意在限制發明人所認為的其發明的范圍,這些實施例也不意在代表或意味著以下實驗是所進行的全部實驗或僅有的實驗。本領域技術人員應理解可如具體實施方式
中展現的那樣對本發明進行許多改變和/或修改而不偏離寬泛地描述的本發明的精神或范圍。因此,無論在哪個方面,應認為該實施方式是說明性而不是限制性的。已經進行努力以確保關于所使用的數字(例如,量、溫度等)的準確性但是應考慮某些實驗誤差和偏差。除非另外指明,份是以重量計的份,分子量是重均分子量,溫度以攝氏度計,且壓力是處于或接近大氣壓。實施例I :編碼方案概念的初步驗證作為概念的初步驗證,使用微陣列開發模型系統來闡釋工作的單重測定(workingsingle-plex assay)。基礎設計證實了該測定的概念,并在解決涉及分析更復雜的生物樣品的問題之前建立了工作的測定。使用傳統測序作為這種概念驗證的讀出。使用微陣列作為組織切片的代用品。充分地說明了微陣列的靶序列,以致于靶的組成是已知的并可系統地改變。合成的寡核苷酸模板通過5’氨基修飾與玻璃載玻片附接。每個載玻片具有單一的寡核苷酸模板序列,且所進行的測定可采用連接或延伸然后連接,因為這在測定某些多態性中可能是有用的。一旦該測定的原位部分完成,洗脫反應產物并通過qPCR分析以確定產物的存在或不存在并估算收率,并通過傳統測序來確定所測定產物的結構。所測試的單重測定包括合適的陽性和陰性對照,和檢驗區分單堿基變體的能力的單核苷酸變體(SNV)。實施例2:可擴展性增加測定系統的復雜性以確定該測定用于高通量研究的可擴展性。空間編碼和測定系統的可擴展性通過使用微陣列模型系統進行24-重X 24-位點測定來闡釋。生物靶,此處為DNA靶序列在每一個測定位置的量在微陣列基材上系統地變化。例如,在具有50微米斑點尺寸(中心到中心)的微陣列上,Imm2面積包含 400個斑點。每個位點周圍的區域任選地被缺乏這些斑點的區域占據以允許靶序列各自的可分辨性。可選擇地,斑點可簇集起來,兩個或更多個直接相鄰的斑點被缺乏靶序列的區域圍繞或與之相 鄰。為了表明空間編碼是準確的,這些位點包含不同的靶組成以顯示測定讀出與每個位點的預期組成匹配。用24個靶序列制備簡單的數字模式,每個位點具有12個靶存在和12個靶不存在的不同集合以制備二進制代碼(O =不存在,I =存在)。然后確定測定讀出以表明空間解碼后所檢測的區域與預期信號匹配。在這個特別的實例中,代碼空間是足夠大的(224)以致于即使幾個誤差也不會導致不同的代碼被混淆。此外,該設計允許誤差的確定且允許不僅估計空間編碼準確性而且估計宣稱靶序列的存在或不存在的準確性。通過對在24位點測定中的每個位點進行的24個測定中的每一個產生劑量反應曲線來評價檢測定量差異的能力。這允許對檢測限、動態范圍和貫穿該范圍檢測給定倍數變化的能力的估計。在一個方面,通過改變對于每個靶的特征的數目,使用拉丁方設計代表不同比例的單個靶。換句話說,對于某位點內的多個斑點,分配到24個靶序列中的每一個上的斑點的數目可改變,且24個位點中的每一個可具有不同的組成。1X3英寸的微陣列對于允許多個重復是足夠大的。這種較大的24個序列的組將需要去卷積,且這使用高通量技術例如下一代測序技術(例如,SOLiD 技術(Life Technologies, Inc. , Carlsbad, CA)或 GenomeAnalyzer (Illumina, Inc. , San Diego, CA))來實現。使用24重測定證實了空間編碼與解碼的準確性和該測定系統的定量反應。實施例3 該測定對儲藏的樣品的適應。測定基因組DNA作為用于測定RNA的概念的驗證,因為它提供了建立單拷貝參考信號的一種方式。一旦發展用于FFPE樣品的運行的測定,其適用于RNA測定。為了這個目的,測定了測定寡核苷酸的濃度以確保與高度多重檢測的相容性。假定細胞直徑為10微米,并向單個細胞遞送10微米直徑的試劑小滴,小滴的體積將是 500 μ I且在I μ M濃度下可包含 3Χ IO11個分子。為測定10,000個細胞中的1,000個靶序列,在一個小滴中將需要 2,000個靶向寡核苷酸。所以,每個小滴可包含 160,000,000拷貝的每個測定oligo,大大超過細胞內的幾千個靶序列。增強對從非常少或受損的樣品產生的絕對數量少的產物分子的處理以應對回收效率低的組織;也就是說,洗脫是有效的并避免了由表面對分子的吸收導致的損失。解決后一個問題的方法是必須包括載體材料,例如糖原或載體核酸。實施例4 使該測定適應生物樣品。將對照RNA模板固定到固體支持體以制備人工系統。使用T4DNA連接酶進行測定,T4DNA連接酶可修復DNA/RNA雜交體中的切口。在相匹配的載玻片或相同載玻片的不同切片上進行測定,其中在一個實例中,測定gDNA而在另一個實例中,測定RNA。當測定gDNA時,可用RNA酶預處理載玻片且當測定RNA時,用DNA酶預處理載玻片。通過提取gDNA或RNA并分別通過PCR或RT-qPCR量化相對量來確認測定結果。為了使組織切片RNA測定盡可能多地提供信息,在測定設計中使用了關于特定組織中跨越一定豐度范圍的靶轉錄物的表達水平的已存在的信息。高豐度轉錄物以及某些中豐度和低豐度轉錄物被靶向以使得對測定的定量性能特征的初步評價成為可能。以上僅闡釋了本發明的原理。應理解,本領域技術人員將能夠設計本文雖未清楚地描述或展現,但是體現了本發明的原理并被包含在其精神和范圍內的多種方案。此外,本 文提到的所有實例和條件性語言原則上意在幫助讀者理解本發明的原理和發明人為深化本領域所貢獻的概念,且將應解釋為不局限于這些具體提及的實例和條件。此外,本文提及本發明的原理、方面和實施方式以及其具體實例的所有聲明意在包括其結構和功能等價物。另外,期望這些等價物包括目前已知的等價物和未來開發的等價物,即不管結構如何,表現同樣的功能的開發的任何元件。因此,不期望本發明的范圍局限于本文展現和描述的示例性實施方式。更確切地,本發明的范圍和精神通過所附權利要求來體現。在隨附的權利要求中,除非使用了術語“手段”,否則根據35U. S. C. § 112,1|6,其中所提及的任何特征或元件都不應解釋為手段加功能(means-plus-function)限制。
權利要求
1.一種測定樣品中在多個位點的多種生物靶的豐度或活性或兩者的空間模式的測定系統,其中所述測定系統進行下列步驟 提供附著到支持體的樣品; 以已知的空間模式將用于所述多種生物靶的編碼探針遞送到所述樣品中的所述多個位點,其中每個編碼探針包含可與所述生物靶相互作用的探針區域和確定所述編碼探針被遞送的位點的位置的代碼標簽; 促使所述編碼探針與所述生物靶相互作用; 將與所述生物靶相互作用的編碼探針和未與所述生物靶相互作用的編碼探針分離; 測定所述編碼探針的序列的全部或一部分,以及 將所述多種生物靶的豐度或活性或二者與所述樣品中所述位點的位置相關聯。
2.根據權利要求I所述的測定系統,其中所述生物靶是核酸且所述編碼探針是寡核苷酸。
3.根據權利要求2所述的測定系統,其中對于多種核酸靶中的每一種存在兩種編碼探針。
4.根據權利要求I所述的測定系統,其中所述多種生物靶是蛋白質,所述編碼探針的所述探針區域是蛋白質且所述代碼標簽包含寡核苷酸。
5.根據權利要求4所述的測定系統,其中所述多種生物靶包含酶。
6.根據權利要求I所述的測定系統,其中所述編碼探針的探針區域包含抗體。
7.根據權利要求I所述的測定系統,其中所述編碼探針的所述探針區域是適體。
8.根據權利要求I所述的測定系統,其中所述編碼探針的所述探針區域是小分子。
9.根據權利要求I所述的測定系統,還在所述分離步驟和所述測定步驟之間包含擴增步驟。
10.根據權利要求I所述的測定系統,其中所述測定步驟通過核酸測序進行。
11.根據權利要求10所述的測定系統,其中所述測序是高通量數字核酸測序。
12.根據權利要求I所述的測定系統,其中被測定的所述多種生物靶與所述樣品中的所述多個位點的乘積大于20。
13.根據權利要求12所述的測定系統,其中被測定的所述多種生物靶與所述樣品中的所述多個位點的乘積大于50。
14.根據權利要求13所述的測定系統,其中被測定的所述多種生物靶與所述樣品中的所述多個位點的乘積大于75。
15.根據權利要求14所述的測定系統,其中被測定的所述多種生物靶與所述樣品中的所述多個位點的乘積大于100。
16.根據權利要求15所述的測定系統,其中被測定的所述多種生物靶與所述樣品中的所述多個位點的乘積大于1,000。
17.根據權利要求16所述的測定系統,其中被測定的所述多種生物靶與所述樣品中的所述多個位點的乘積大于10,000。
18.根據權利要求17所述的測定系統,其中被測定的所述多種生物靶與所述樣品中的所述多個位點的乘積大于100,000。
19.根據權利要求18所述的測定系統,其中被測定的所述多種生物靶與所述樣品中的所述多個位點的乘積大于1,000,000。
20.根據權利要求11所述的測定系統,其中至少十萬個編碼探針的序列被并行測定。
21.根據權利要求20所述的測定系統,其中至少五十萬個編碼探針的序列被并行測定。
22.根據權利要求21所述的測定系統,其中至少一百萬個編碼探針的序列被并行測定。
23.根據權利要求I所述的測定系統,其中所述已知的空間模式通過所述樣品的組織學特征確定。
24.根據權利要求I所述的測定系統,其中軟件程控的硬件進行所述遞送步驟、所述分離步驟、所述測定步驟和所述關聯步驟中的至少兩個步驟。
25.根據權利要求I所述的測定系統,其中所述編碼探針的所述探針區域是蛋白質且所述分離步驟通過用親和捕獲劑捕獲與所述生物靶相互作用的編碼探針實現。
26.根據權利要求I所述的測定系統,其中所述編碼探針的所述探針區域是核酸且所述分離步驟通過洗滌所述樣品實現。
27.一種測定樣品中在多個位點的多個核酸靶的豐度或活性或兩者的空間模式的測定系統,其中所述測定系統進行下列步驟 提供附著到支持體的樣品; 以已知的空間模式將用于多個核酸靶的寡核苷酸探針遞送到所述樣品中的所述多個位點; 促使所述寡核苷酸探針與所述核酸靶雜交; 從所述樣品中洗掉未雜交的編碼寡核苷酸探針; 根據已知的空間模式將一種或多種編碼劑遞送至所述樣品中的所述多個位點的位置,其中遞送到每個位點的編碼劑的組合是不同的; 將所述編碼劑與所述寡核苷酸探針偶聯以形成編碼探針; 使用高通量測序測定所述編碼探針的序列的全部或一部分,以及 將所述多種生物靶的豐度或活性或二者與所述樣品中多個位點的位置相關聯。
28.根據權利要求27所述的測定系統,其中被測定的所述多種生物靶與所述樣品中的所述多個位點的乘積大于20。
29.根據權利要求28所述的測定系統,其中被測定的所述多種生物靶與所述樣品中的所述多個位點的乘積大于50。
30.根據權利要求29所述的測定系統,其中被測定的所述多種生物靶與所述樣品中的所述多個位點的乘積大于75。
31.根據權利要求30所述的測定系統,其中被測定的所述多種生物靶與所述樣品中的所述多個位點的乘積大于10,000。
32.根據權利要求31所述的測定系統,其中被測定的所述多種生物靶與所述樣品中的所述多個位點的乘積大于100,000。
33.根據權利要求32所述的測定系統,其中被測定的所述多種生物靶與所述樣品中的所述多個位點的乘積大于1,000,000。
34.根據權利要求33所述的測定系統,其中至少十萬個編碼探針的序列被并行測定。
35.根據權利要求34所述的測定系統,其中至少一百萬個編碼探針的序列被并行測定。
36.根據權利要求27所述的測定系統,其中對于所述多種核酸靶中的每一種遞送兩種寡核苷酸探針。
37.根據權利要求27所述的測定系統,其中所述偶聯步驟通過連接進行。
38.根據權利要求27所述的測定系統,其中所述偶聯步驟通過延伸然后連接進行。
39.根據權利要求27所述的測定系統,還在所述偶聯步驟和所述測定步驟之間包含擴增步驟。
40.一種測定樣品中在多個位點的多種蛋白質靶的豐度或活性或兩者的空間模式的測定系統,其中所述測定系統進行下列步驟 提供附著到支持體的生物樣品; 以已知的空間模式將用于多種蛋白質靶的編碼探針遞送到所述樣品中的所述多個位點,其中每個編碼探針包含可與所述蛋白質靶相互作用的蛋白質探針區域和確定所述編碼探針被遞送的位點的位置的代碼標簽,且所述代碼標簽是所述編碼探針的所述蛋白質探針區域的一部分; 促使所述編碼探針與所述蛋白質靶相互作用; 將與所述蛋白質靶相互作用的編碼探針和未與所述蛋白質靶相互作用的編碼探針分離; 通過高通量測序測定所述編碼探針的序列的全部或一部分,以及 將所述多種蛋白質靶的豐度或活性或二者與所述樣品中的所述多個位點的位置相關聯。
41.根據權利要求40所述的測定系統,其中被測定的所述多種生物靶與所述樣品中的所述多個位點的乘積大于20。
42.根據權利要求41所述的測定系統,其中被測定的所述多種生物靶與所述樣品中的所述多個位點的乘積大于50。
43.根據權利要求42所述的測定系統,其中被測定的所述多種生物靶與所述樣品中的所述多個位點的乘積大于75。
44.根據權利要求43所述的測定系統,其中被測定的所述多種生物靶與所述樣品中的所述多個位點的乘積大于100。
45.根據權利要求44所述的測定系統,其中被測定的所述多種生物靶與所述樣品中的所述多個位點的乘積大于500。
46.根據權利要求45所述的測定系統,其中被測定的所述多種生物靶與所述樣品中的所述多個位點的乘積大于1000。
47.根據權利要求46所述的測定系統,其中至少一萬個編碼探針的序列被并行測定。
48.根據權利要求40所述的測定系統,其中至少十萬個編碼探針的序列被并行測定。
49.根據權利要求48所述的測定系統,其中至少一百萬個編碼探針的序列被并行測定。
50.根據權利要求40所述的測定系統,還在所述偶聯步驟和所述測定步驟之間包含擴增步驟。
51.根據權利要求40所述的測定系統,其中所述蛋白質靶是酶,且所述編碼探針的所述探針區域是酶的底物、推定底物或兩者。
52.根據權利要求40所述的測定系統,其中所述編碼探針的所述探針區域是親和捕獲劑。
53.根據權利要求52所述的測定系統,其中所述編碼探針的所述探針區域是抗體。
54.根據權利要求52所述的測定系統,其中所述編碼探針的所述探針區域是適體。
55.根據權利要求40所述的測定系統,其中將與所述蛋白質靶相互作用的編碼探針和未與所述蛋白質靶相互作用的編碼探針分離通過親和捕獲劑實現,所述親和捕獲劑區分與所述蛋白質靶相互作用的編碼探針和未與所述蛋白質靶相互作用的編碼探針。
56.根據權利要求36所述的測定系統,其中所述代碼標簽是寡核苷酸。
57.一種測定樣品中在多個位點的多種生物靶的豐度或活性或兩者的空間模式的測定系統,其中所述測定系統進行下列步驟 提供附著到支持體的樣品; 以已知的空間模式將用于所述多種生物靶的編碼探針遞送到所述樣品中的所述多個位點,其中每個編碼探針包含可與所述生物靶相互作用的探針區域和確定所述編碼探針被遞送的位點的位置并鑒定所述生物靶的代碼標簽; 促使所述編碼探針與所述生物靶相互作用; 測定所述編碼探針的序列的全部或一部分,以及 將所述多種生物靶的豐度或活性或二者與所述樣品中的所述位點的位置關聯。
全文摘要
本發明提供了用于空間編碼的生物學測定的測定及測定系統。本發明提供了包含如下的測定系統能夠高水平地多重檢測的測定,其中以特定的空間模式給生物樣品提供試劑;能夠根據該空間模式控制遞送試劑的設備;和提供本質上是數字的讀出的解碼方案。
文檔編號C12Q1/68GK102834526SQ201180017696
公開日2012年12月19日 申請日期2011年4月5日 優先權日2010年4月5日
發明者馬克·S·奇 申請人:普羅格諾西斯生物科學公司