染色體構象劃分產物捕獲的制作方法
【專利說明】染色體構象劃分產物捕獲
[0001] 相關申請的交叉引用
[0002] 本申請要求于2014年2月13日提交的美國臨時申請61/939,565號的優先權,該文 的全部內容通過引用納入本文用于所有目的。
【背景技術】
[0003] 用于研究染色體體內構象的技術已經掲示了大量關于基因調控機制的信息。例 如,染色體構象研究可掲示通過遠程DNA序列元件對基因的遠程調控。一種用于確定染色體 的體內構象的廣泛使用的方法被稱為染色體構象捕獲,或3C。其它技術延伸3CW提供其它 信息或能夠進行更高通量的分析。運類技術包括,例如,伯、5(:、6(:、化-(:、化1?-環和化1八-PET。
[0004] -般而言,染色體構象捕獲技術包括固定染色質的Ξ維組織的交聯步驟、內切核 酸酶消化步驟、連接步驟和生成核酸分子文庫的反交聯步驟。該文庫含有核酸分子,其中由 于交聯事件之前的Ξ維染色質結構而鄰近的序列元件在反交聯事件之后在一級結構水平 上鄰近。然后可采用各種擴增、測序或其它核酸檢測方法來鑒定Ξ維空間上鄰近的序列元 件。
[000引連接步驟可能需要廣泛優化W提供合適的核酸分子文庫。例如,連接交聯的元件 使得它們存在于同一核酸分子上的分子內連接事件一般有利。相反,不交聯的序列元件連 接的分子間連接事件一般需要避免或最小化。作為另一個示例,確保在反交聯之后沒有發 生連接是重要的。作為另一個示例,不充分的連接可能產生提供很少信息的分子文庫。
【發明內容】
[0006] 本申請提供了使用劃分產物進行染色體構象捕獲的改進方法。在一些情況中,該 方法不需要連接步驟。在一些情況中,該方法改善了連接步驟的效率、完成度或保真性或其 組合。
[0007] 在一些實施方式中,本發明提供了一種檢測在細胞或完整核中相近的染色體DNA 序列元件的方法,包括:a)交聯細胞或完整核中的染色體DNA,從而形成交聯的DNA產物,其 中在細胞中相近的染色體DNA序列交聯;b)得到交聯的DNA產物;C)用內切核酸酶消化交聯 的DNA產物W形成含多種交聯的DNA消化片段的混合物;d)劃分交聯的DNA消化片段W產生 多個劃分產物;并且e)檢測單個劃分產物中就基因組的一級序列而言彼此遠離的2個或更 多個DNA序列元件的存在,其中在單個劃分產物中檢測到2個或更多個DNA序列元件表明所 述2個或更多個DNA序列在細胞或完整核中相近。
[0008] 在一些實施方式中,本發明提供了一種檢測在細胞或完整核中相近的核酸序列元 件的方法,包括:a)交聯細胞或完整核中的染色體DNA,從而形成交聯的DNA產物,其中在細 胞中相近的核酸序列交聯;b)得到交聯的DNA產物;C)用內切核酸酶消化交聯的DNA產物W 形成含多種交聯的DNA消化片段的混合物;d)劃分交聯的DNA消化片段W產生多個劃分產 物;并且f)檢測單個劃分產物中就基因組的一級序列而言彼此遠離的2個或更多個核酸序 列元件的存在,其中在單個劃分產物中檢測到2個或更多個核酸序列元件表明所述2個或更 多個核酸序列在細胞或完整核中相近。
[0009] 在一些方面中,劃分交聯的DNA消化片段,使得各劃分產物中交聯的DNA消化片段 的平均數量為約1或更低。在一些情況中,劃分交聯的DNA消化片段W產生多個劃分產物包 括產生至少1000、至少10000、至少20000、至少100000、或至少1000000個劃分產物。在一些 情況中,劃分產物在體積上小于約10化L、小于約10化或小于約InL。
[0010] 在一些方面中,該方法還包括反交聯,從而從劃分產物中交聯的DM消化片段中生 成2個反交聯的DNA消化片段。在一些情況中,在消化交聯的DNA的步驟之后進行反交聯。
[0011] 在一些方面中,檢測包括檢測劃分產物中反交聯的DNA消化片段,其中在單個劃分 產物中檢測到2個反交聯的DNA消化片段表明運2個反交聯的DNA消化片段曾交聯,由此檢測 到在核中相近的染色體DNA序列元件。在一些情況中,反交聯包括將劃分產物加熱至至少約 55°C、至少約65°C、或至少約95°C。在一些情況中,反交聯包括用蛋白酶,如蛋白酶K解育劃 分產物。
[001引在一些方面中,檢測包括檢測劃分產物中反交聯的同時含有DNA和RNA的DNA消化 片段,其中在單個劃分產物中檢巧蝴2個反交聯的DNA消化片段表明運2個反交聯的DNA消化 片段曾交聯,由此檢測在核中相近的DNA和/或RNA序列元件。在一些情況中,反交聯包括將 劃分產物加熱至至少約55°C、至少約65°C、或至少約95°C。在一些情況中,反交聯包括用蛋 白酶,如蛋白酶K解育劃分產物。在一些情況中,檢測包括逆轉錄。
[0013]在一些方面中,多個劃分產物中的全部、幾乎全部或一部分含有核酸條碼。在一些 情況中,核酸條碼連接到固體支持物。
[0014] 在一些方面中,檢測包括DM擴增。在一些情況中,DNA擴增包括PCR。在一些情況 中,DNA擴增包括祀向基因座擴增(TLA)。在一些情況中,DNA擴增包括逆轉錄或RT-PCR。在任 意前述的實施方式、方面或情況中,檢測步驟可包括核酸測序。
[0015] 在一些方面中,交聯完整核中的染色體DNA包括用交聯劑解育細胞。在一些方面 中,交聯完整核中的染色體DNA包括用交聯劑解育完整核。
[0016] 在一些實施方式中,可在多個完整核或含完整核的多個細胞上進行任意前述方 法。在一些情況中,該方法還包括對2個或更多個核酸(例如,DNA)序列元件的交聯頻率進行 定量,從而對運2個或更多個核酸(例如,DNA)序列元件在完整核群中相近的頻率進行定量。
[0017] 在一些實施方式中,本發明提供了包含劃分產物的組合物,所述劃分產物含有交 聯的DNA消化片段。在一些實施方式中,本發明提供了包含劃分產物的組合物,所述劃分產 物含有交聯的DNA消化片段,該消化片段含有DNA和RNA。在一些實施方式中,本發明提供了 包含劃分產物的組合物,所述劃分產物含有反交聯的DNA消化片段,其中反交聯的DNA消化 片段是下述過程的產物:交聯完整核中DNA、用核酸內切酶消化DNA、形成含有消化的和交聯 的DNA的劃分產物并反交聯。在一些方面中,劃分產物含有反交聯的DNA消化片段和反交聯 的RNA或cDNA。在一些方面中,劃分產物還包含DNA擴增試劑或核酸測序試劑。在一些情況 中,DNA擴增試劑或核酸測序試劑包含寡核巧酸引物或DNA聚合酶。在一些情況中,組合物還 包含至少1000、至少10000、至少20000、或至少100000個劃分產物。在一些情況中,劃分產物 在體積上小于約10化L、小于約10化或小于約InL。
[001引在一些情況中,檢測劃分產物中2個或更多個核酸(例如,DNA、cDNA或RNA)序列元 件的存在可包括檢測各虛擬劃分產物中的運類元件。例如,檢測到2個或更多個具有相同條 碼的核酸序列元件可表示運2個或更多個核酸序列元件位于相同的劃分產物中并因此在細 胞或完整核中相近。替代地,劃分產物中的檢測可指檢測物理劃分產物。
【附圖說明】
[0019] 圖1顯示了進行基于劃分產物的染色體捕獲分析的方法的幾個實施方式。
[0020] 圖2顯示了進行基于劃分產物的染色體捕獲分析的方法的一個實施方式。在該實 施方式中,雙鏈銜接子寡核巧酸偶聯到固體支持物顆粒上并被劃分。銜接子寡核巧酸可含 有對各固體支持物顆粒獨特的條碼。銜接子寡核巧酸也可含有用于測序和/或擴增的一個 或多個限制性位點和引物結合位點。可用限制性酶消化交聯的DNA劃分產物并且劃分成條 碼化的劃分產物。可用限制性酶(例如,熱穩定限制性酶)消化銜接子寡核巧酸W生成與交 聯的DNA片段的一個或多個末端相容并連接到交聯的DNA片段的粘性末端。可合并劃分產 物,并且DNA片段任選地去交聯并擴增W生成擴增子。然后可對擴增子進行測序W分析染色 體構象。
[0021] 圖3顯示了進行基于劃分產物的染色體捕獲分析的方法的一個實施方式。在該實 施方式中,單鏈引物寡核巧酸與固體支持物顆粒偶聯或整合到凝膠支持物顆粒中并被劃 分。該引物寡核巧酸可含有對于各固體支持物顆粒獨特的條碼,和可與交聯的DNA雜交的雜 交區。雜交區域可W是,例如所示的隨機六聚體。可用限制性酶消化交聯的DNA劃分產物并 且劃分成條碼化的劃分產物。可通過例如加熱溶解固體或凝膠支持物。交聯的DNA可去交聯 并通過來自單鏈引物寡核巧酸的隨機引物擴增來生成擴增子。然后劃分產物可被合并。然 后可對擴增子進行測序W分析染色體構象。
[0022] 圖4顯示了進行基于劃分產物的染色體捕獲分析的方法的幾個實施方式。在該實 施方式中,交聯的DNA被劃分,并且在一個或多個下游加工步驟中將額外的試劑注射到劃分 產物中。
[0023] 定義
[0024] 除非另外定義,本文中使用的所有技術和科學術語具有本領域普通技術人員通常 所理解的同樣含義。參見例如Lackie,DICTIONARY OF CELLAND MOLECULAR BI0L0GY(《細胞 和分子生物學詞典》),埃爾斯威爾出版社化Isevier)(第4版2007);Sambrook等,MOLECULAR 化0NING,A LABORATORY MANUAL(《分子克隆,實驗室手冊》),冷泉港實驗室出版社(冷泉港, 紐約1989)。術語"一個"或"一種"意在表示"一個(種)或多個(種Γ。當術語"包含"及其各種 變體例如"包括"和"含有"位于敘述步驟或要素之前的時候,是用來表示添加其它的步驟或 要素是任選的,并且是非排它性的。本發明的實踐中可W使用與本文所述類似或等價的任 何方法、裝置和材料。本文提供的定義是用來幫助理解本文經常用到的某些術語,不對本發 明的范圍構成限制。
[002引本文所用術語"劃分"或"劃分的"指將樣品分為多個部分或"劃分產物"。劃分產物 可W是固體或流體。在一些實施方式中,劃分產物是固體劃分產物,例如微通道。在一些實 施方式中,劃分產物是流體劃分產物,例如液滴。在一些實施方式中,流體劃分產物(如液 滴)是不互溶的流體(如水和油)的混合物,或乳液。在一些實施方式中,流體劃分產物(如液 滴)是水性液滴,其被不互溶的運載體流體(如油)包圍。在其它實施方式中,液體劃分產物 是與相鄰水性液滴在物理或化學上分開的水性液滴,使得一個液滴的內容物不會擴散到相 鄰液滴中。
[0026] 術語"探針"指與目標分子特異性相互作用或特異性結合目標分子的分子(例如蛋 白質、核酸、適體等)。與目標分子特異性相互作用或特異性結合目標分子的分子的非限制 性示例包括核酸(如寡核巧酸)、蛋白質(如抗體、轉錄因子、鋒指蛋白、非抗體蛋白支架等) 和適體。
[0027] 術語"染色體"是指細菌或真核染色體。
[0028] 本文所用的染色體結構包括一級、二級、Ξ級和四級結構。一級染色體結構,或一 級結構是指染色體的核巧酸序列。二級結構可W指較高水平的結構組織,如雙鏈DNA的雙螺 旋結構,與核小體結合的雙鏈染色體DNA的11-nm纖維(例如,一串上的珠子),或層疊和折疊 的11-nm纖維的30-nm纖維。Ξ級結構是指將30-nm纖維折疊成環、轉角、假結、結構域或其它 Ξ級結構元件。在一些情況中,Ξ級染色體結構可使在染色體的一級序列中彼此遠離的DNA 序列元件相近。四級結構是指2個或更多個不同的染色體的分子間組織。在一些情況中,四 級染色體結構可使在物理上不相連的DNA序列元件相近。本文所用術語"染色質"用于指代 與蛋白質或其它核酸結合的一個或多個染色體。例如,染色質可與組蛋白、轉錄因子、抑制 因子、增強子、聚合酶、修復酶、甲基化酶、去甲基化酶、非編碼RNA分子等結合。本文所用術 語"染色體"涵蓋染色質。
[0029] 用于核中2個核酸序列元件之間的距離時,術語"鄰近"是指在Ξ維空間中運2個核 酸序列元件之間的距離。如此,染色體中在一級序列上接近(例如,在約10、50、100、150、 200、或25化P或更多W內)的DNA序列元件總是彼此相近。在一些情況中,在染色體的一級序 列中彼此遠離(例如,隔開超過約200、250、300、400、500、1000、1500、2000、5000、10000、 25000、50000、100000、250000、500000 或 lOOOOOObp)的 DNA序列元件可能由于染色體的 Ξ 級 或四級結構而彼此相近。在一些