專利名稱:利用單倍切割確定單倍型的方法
技術領域:
本發明通常涉及遺傳學、分子細胞生物學領域,更具體而言,本發明涉及單倍型確定的方法。
背景技術:
正常人體體細胞是二倍體(即,具有兩個拷貝的基因組每個細胞核中有一套父本染色體和一套母本染色體)。每個個體中,這兩套染色體在多個基因座處具有不同的核苷酸序列(單核苷酸多態性(SNP))。傳統的基因型分型測定分析這兩套染色體的混合物,這導致不確定性和復雜性。例如,對于都是雜合的任意兩個SNP基因座,這兩個SNP之間具有四種可能的單倍型。然而,由于當用傳統平臺進行單個SNP基因型分型時,消除了相信息, 因此不能排除這四種可能單倍型中的任何一種可能。解決該問題的一種方法是尋找重建或收回相信息的可靠的方法。另一種方法是在進行基因型分型之前提取相信息。本領域技術人員使用各種統計學算法來重建相信息。這些算法包括Clark算法、 期望最大化(EM)算法、基于聯合的算法(pseudo-Gibbs取樣器和完美/非完美的系統發生)以及由完全的貝葉斯模型(單倍型)或由EM(PLEM)實施的分區-連接算法(Liu N, et al. ,Advances in Genetics, 60 =325-405,2008) 基于非定相的基因型數據統計的單倍型構型通常給出大量不確定的單倍型,這顯著降低了其在遺傳學應用中的能力。此外,對于是否應當將構建的單倍型看成這些研究中基因型和表現型的客觀觀察數據,仍存在爭議。盡管來自家庭成員的基因型通常能幫助確定單倍型,但由家庭數據所推斷的單倍型常受缺少信息價值的數據或數據缺失的限制。此外,對大多數常見的人類疾病的晚期侵襲可以排除從前幾代收集DNA樣品。因此,這些方法不適于未來個性化用藥中的分子診斷。平行地,一些研究者開發了在基因型分型之前提取基因組DNA樣品中的相信息的實驗方法。這些方法全部都基于基因型分型之前兩條同源基因組DNA的物理分離。挑戰在于如何分離二倍體細胞中兩個幾乎相同的染色體拷貝。已經開發出了將二倍體樣品分離為其單倍體組分的數種策略/技術,例如,1)長距離等位基因特異性基因組 PCR(Michalatos-Beloin S, et al.,Nucleic Acids Res 24 :4841_4843,1996 ;和 YuCE, et al.,Genomics 84 :600-612,2004) ;2)單倍型特異性分離(HSE) (NagyM, et al., TissueAntigens 69 176-180,2007) ;3)體單倍體細胞的產生,例如GMP轉化(Douglas JA, et al. ,Nat Genet 28 :361-364,2001) ;4)Polony(Mitra et al. ,Proc Natl Acad Sci US AlOO :5926-5931,2003 ;Zhang K,et al.,Nat Genet 38 :382-387, 2006) ;5)基于克隆的系統單倍型分型(CSH) (Burgtorf C,et al.,Genome Res 13 :2717-2724,2003) ;6)單分子稀釋法(SMD) (Ding C, et al.,Proc Natl Acad Sci U S A 100 :7449-7453,2003);以及 7) 精子分型。
長距離等位基因特異性基因組PCR使用專門設計的PCR引物以僅從姐妹染色體之一選擇性地擴增靶區。通過設計引物使其3'端與等位基因之一匹配/錯配來實現選擇性擴增。因此,引物不能有效地擴增未匹配的染色體DNA模板。隨后在擴增產物上進行基因型分型。由于這些PCR產物僅獲自染色體之一,因此沿著這些PCR產物的不同SNP的等位基因顯示出單倍型。在本方法中,通過DNA制備中PCR能達到的最大長度和染色體完整性來確定單倍型中遺傳標記的最大距離。因此,單倍型長度受PCR的能力限制,其對于長PCR約為401Λ。 該方法在技術上通常是有挑戰性的,并且對于每個引物對都需要大量地優化PCR條件,以提高長PCR的擴增效率。通常推薦數個引物對和緩沖液的不同組合以優化PCR條件。然而, 該方法不適用于單倍型的高通量分析。單倍型特異性分離(HSE)使用專門設計的探針以僅從姐妹染色體之一選擇性地捕獲片段。通過設計特異性識別SNP的一個等位基因的探針來實現選擇性結合。如果個體是雜合子,當將該探針添加至變性的基因組DNA樣品時,所述探針將搜索并只與含有它的靶等位基因的基因組DNA片段結合。因此,通過固定化的磁珠捕獲探針結合的DNA片段,并且帶有該SNP另一個等位基因的未結合的DNA片段將被洗掉。目前將二倍體狀態的基因組 DNA縮減為單倍體狀態,并準備用于所有隨后的分析包括基因型分型/單倍型。由于在兩條親本染色體之間總是存在明顯的多態差異,因此HSE能區分和分離任何染色體片段的兩親本拷貝。在本方法中,通過DNA制備中染色體完整性和DNA變性來確定單倍型中遺傳標記的最大距離。目前該方法能解決<501Λ距離中的單倍型。如果需要超過延伸距離的分子單倍型,則必須進行多重的單倍型分離。GMP轉化技術建立在來自活的人細胞(通常為淋巴細胞或成纖維細胞)和嚙齒動物細胞系的細胞雜種構建的基礎上。由于這些雜種細胞僅保留了人染色體的子集,因此對于每對人染色體他們可以是零染色體的、單染色體的或二染色體的。那些單染色體的細胞是相應染色體的單倍體,并準備用于隨后的用于單倍型確定的基因型分型測定。在本技術中,將細胞電融合,然后在選擇性條件下進行增殖,例如使用HPRTl/ HAT (次黃嘌呤、氨蝶呤和胸腺嘧啶核苷)系統。生長2-4周之后,收獲融合的克隆,并制備用于分析的DNA。通過對每條染色體少量高度多態的標記進行基因型分型來鑒定單染色體克隆,其最低限度要求單個的雜合基因型。但是,基于轉化的單倍型分型仍存在一些技術挑戰,包括低DNA濃度、優先擴增和染色體片段的插入或缺失(Douglas JAet al, Nat Genet 28 :361-364,2001)。已經觀察到在雜種細胞中通常保留的是全染色體而非染色體片段(同上Douglas 2001)。因此,本方法對單倍型中的SNP距離沒有任何限制。GMP轉化技術的應用受限于非常有限的個體數量和染色體區域數量,這是因為融合和選擇條件的低效和變化。每個個體需要多個細胞系。基于轉化的單倍型分型仍非常浪費時間且非常昂貴。Polony技術使用聚丙烯酰胺凝膠處理染色體DNA的原位單條分子。在本技術中, 最初將來自個體的基因組DNA稀釋至非常低的濃度,然后與丙烯酰胺混合并在玻璃顯微鏡載玻片上展開以形成薄的含有DNA的聚丙烯酰胺凝膠。由于DNA濃度非常低,因此DNA分子彼此良好分開。然后直接在該凝膠上進行凝膠內的PCR,用兩對PCR引物從單條DNA分子擴增目的SNP的兩個基因座。由于丙烯酰胺基質限制線性DNA分子的擴散,因此PCR產物在它們擴增模板周圍積累形成兩個重疊的PCR集落(polony)。通過分別地對這兩個SNP 的單堿基延伸(SBE)測定,原位確定這兩個SNP的基因型,然后通過激光掃描儀讀取凝膠。 在疊加這兩個SBE圖像之后,同一斑點所觀察到的等位基因指示該患者樣品這兩個SNP的等位基因組合(單倍型)。在丙烯酰胺聚合之前、期間或之后通過DNA斷裂或降解來確定Polony的最大單倍型長度。據報道,目前為止本方法已經檢測了長至451Λ的單倍型(Mitra,et al.,PNAS USA 100 :5926-5931,2003 ;Zhang K, et al.,Nat Genet 38 :382-387,2006)。在Polony方法中有數條內在的警告事項。Polony單倍型分型的一個主要局限是不能有效地放大SNP的數量。但是通常需要對染色體大量(100-10,000)的SNP進行單倍型分型。第二,DNA分子可能在凝膠中重疊。因此,DNA濃度和鋪板條件是重要的。第三, PCR共擴增效率低(對于來自頰粘膜棉簽的樣品為4-15%,對于來自其他收集方法的樣品為15-34% )。在熱循環和DNA斷裂或降解期間,共擴增效率與Polony凝膠中非凝膠化的丙烯酰胺的存在有關。可能需要進行技術優化(諸如脫氣和聚合條件)。最后,本技術需要中期細胞。基于克隆的系統單倍型分型(CSH)使用fosmid/黏粒克隆從二倍體染色體分離單拷貝。由于每個載體分子僅能容納一個插入分子,來自成功的載體-插入連接體的每個集落會僅容納單倍體染色體片段。通過篩查集落文庫,獲得含有靶染色體片段的集落用于隨后的單倍型分型分析。由于載體不能成功地接收超過它們最大克隆能力的非常大尺寸的插入子,因此CSH能分離約501Λ的單倍體片段。此外,本方法非常浪費時間且昂貴。單分子稀釋法(SMD)建立在單分子一定是單倍體片段的概念的基礎上,這是由于二倍體染色體是一對拷貝且需要兩個DNA分子組成二倍體。為了在每個反應管中獲得單分子,將基因組DNA樣品稀釋至相當低的濃度。我們已經了解人類的每個二倍體基因組約為 6. 7pg,所以如果管中僅含有約3. 3pg的基因組DNA,則它一定有一些染色體區域的單分子, 這是因為DNA量不足以使每個染色體區域在那個管中有兩個拷貝。通過連續稀釋達到該非常低的DNA濃度。連續稀釋之后,對于任何給定的染色體片段,每管可以不含DNA、含有該區域的一個DNA分子或含有該區域的兩個DNA分子。然后對這些管中的微量DNA樣品進行擴增和基因型分型;將事先鑒定的該個體雜合SNP基因座處的等位基因缺失用來篩出“單分子”管用于下一步的實驗。本方法的警告事項是它依賴于單DNA分子的統計學分離,所以對于它的成功沒有實驗保證。本方法中,由于連續稀釋中頻繁的剪切,基因組DNA被斷裂。目前報道的最大距離是約 24kb 的單倍型分型距離(Ding C, et al.,PNAS USAlOO :7449-7453,2003)。精子分型建立在精子是減數分裂的產物且僅含有單倍體基因組的事實上。盡管精子是單倍體,但是精子單倍型并不簡單地等于贈與者的單倍型。精子單倍體基因組并不是該個體任何親本染色體之一。然而,通過對來自一個個體的數個精子進行基因型分型,然后分析這些精子的單倍型數據,可以推斷該個體的單倍型。因此,由于精子分型不是直接的單倍型分型,其與上述的分子單倍型分型方法不同。在減數分裂重組中,不同的精子經歷不同的交換事件,所以來自同一個體的精子具有不同的單倍型。在交換中,兩條染色單體交換它們的染色體端臂;人類該染色體末端僅交換一次,有時兩次或更多次。因此,假設在研究的精子中僅發生一次交換事件,則可能從多個精子推斷出最初患者的單倍型。然而,由于精子分型僅限于男性,程序冗長且昂貴, 并且單倍型是推斷的結果而不是直接的觀察;因此精子分型不能廣泛應用于分子單倍型分型。總之,當前可用的染色體分離的實驗方法常引起染色體斷裂,所以它們不能獲得長范圍的單倍型。此外,由于它們相當浪費時間且是勞動密集的,所以它們在研究工作實驗室和臨床實際上是不可行的。仍存在低成本快速進行單倍型分型方法的需要。發明_既述公開了對個體進行分子單倍型分型的方法。所述方法包括在個體多個裂解的二倍體細胞的每一個細胞中隨機選擇一組染色體;將從所述多個細胞選擇的染色體收集進多個樣品管中,其中每個樣品管含有選自一個或多個細胞的染色體;對每個樣品管中的基因組DNA進行基因型分型;以及基于來自基因型分型數據的等位基因核苷酸序列信息和相應的核苷酸信號強度來確定等位基因的單倍型。在一個實施方案中,確定等位基因單倍型的步驟包括下述步驟從基因型分型數據提取等位基因核苷酸序列信息和相應的核苷酸信號強度;計算每個雜合基因座處兩個等位基因的核苷酸信號強度比(等位基因強度比);以及確定等位基因的單倍型。在另一個實施方案中,計算等位基因強度比的步驟包括計算純合基因座處核苷酸A、C、G和T的相對比,確定每種核苷酸的k值,進而將它們的信號強度調到相同的水平; 使用k值調整雜合基因座處的核苷酸信號強度;以及計算雜合基因座處的等位基因強度比。在另一個實施方案中,所述確定步驟還包括下述步驟通過等位基因強度比對每個基因座處的等位基因順序進行整理;將較高強度等位基因保持在第一欄而將較低強度等位基因保持在第二欄;確定每條染色體中是否有斷點,如果在染色體中沒有斷點,用第一欄中的等位基因形成一個單倍型,且用第二欄中的等位基因形成另一個單倍型,如果在染色體中有斷點,使用來自其他染色體收集管中的結果搭接所述斷點。在相關的實施方案中,細胞是外周血淋巴細胞。在另一個相關的實施方案中,將來自2-10個隨機選擇的細胞的染色體收集進樣品管中,并且一共收集4-8個樣品管。在另一個相關的實施方案中,所述基因型分型步驟包括擴增基因組DNA。還公開了對個體進行分子單倍型分型的另一種方法。所述方法包括從個體分離一個或多個單個的二倍體細胞;對每個分離的單個的二倍體細胞進行裂解以產生一個或多個單細胞裂解物;將每個單細胞裂解物分成兩等份;對每等份中的基因組DNA進行基因型分型;創建來自所有等份的基因型分型數據的目錄;以及基于所述目錄確定個體的染色體單倍型。在相關的實施方案中,所述分離步驟包括從個體分離4-12個單個的二倍體細胞。在另一個相關的實施方案中,所述分離步驟包括從個體分離6-10個單個的二倍體細胞。在另一個相關的實施方案中,所述分離步驟包括從個體分離8個單個的二倍體細胞。
還公開了對個體進行分子單倍型分型的另一種方法。所述方法包括從個體分離單個的二倍體細胞;對分離的單個的二倍體細胞進行裂解和染色以展示染色體;通過激光顯微切割從單細胞收集一組染色體;對所收集的染色體中的基因組DNA進行基因型分型; 對來自相同個體的一個或多個完整的二倍體細胞的基因組DNA進行基因型分型;以及確定染色體收集組中的染色體的單倍型,其中所述染色體以單倍體形式存在于所述染色體收集組中。在相關的實施方案中,分離并裂解多個單個的二倍體細胞。收集多組染色體;從同一個體不同的單細胞收集每組染色體。收集組的數量足夠大,以便個體基因組中的每條染色體以大于99%的概率存在于單倍體形式中。在相關的實施方案中,所述個體是真核有機體。在相關的實施方案中,所述真核有機體是動物或植物。在另一個相關的實施方案中,所述動物是哺乳動物。本發明的另一方面涉及具有用于實施上述方法的計算機執行指令的計算機可讀介質。本發明的另一方面涉及用于單倍切割的測定試劑盒。在一個實施方案中,所述測定試劑盒含有用于細胞收集試劑和細胞發生染色的試劑,以及用于基因組DNA擴增和基因組基因型分型的試劑。在另一個實施方案中,所述試劑盒還包含具有計算機執行指令的計算機可讀介質,用于基于基因型分型數據確定單倍型。附圖簡要說明
圖1用圖表說明通過將失調引入染色體比的單倍切割方法實施方案的一般原理。圖2是顯示單倍切割方法實施方案的流程圖。圖3是使用Leica AS LMD計算機指導的激光顯微切割進行的染色體收集的圖。收集收集區域內的染色體用于單倍型分型。圖4是顯示用于確定以單倍型為基礎的基因型分型數據的方法實施方案的流程圖。圖5是顯示使用單細胞裂解物的單倍切割方法的另一個實施方案的流程圖。圖6是說明單細胞單倍型分割原理的簡圖。圖7是說明使用單細胞切割的單倍切割方法進行單倍型分型的原理簡圖。圖8是顯示單細胞切割方法步驟和一些單倍型分型結果的流程簡圖。通過他們的親本來源顯示單倍型(Fa,父親;Mo,母親)。發明的詳細描述除非另有所指,下面進一步詳細描述的實施方案的實施將使用本領域內常規的遺傳學方法、基因組分子生物學方法、細胞生物學方法、診斷學方法和生物信息學方法。文獻中對這類技術有充分地說明。無論是上文還是下文中本文所引用的所有公開、專利和專利申請,都通過引用將其全部內容并入本文。本發明一方面涉及對個體進行分子單倍型分型的方法。在下文中將該方法稱為 “單倍切割(HaploDissection)”方法。如下文更詳細的描述,所述新方法克服了單倍型長度的瓶頸,并且對SNP數量或樣品數量沒有限制。本發明滿足了遺傳研究、基因組研究和表觀基因組研究,尤其在全基因組關聯研究(GWAS)、基因表達的長順式調節相互作用以及染色質重塑形研究中精確單倍型的需要。精確單倍型是解釋這些結果并將其轉化為臨床實踐所必須的。圖1圖示了單倍切割方法的一個實施方案。簡單而言,單倍切割方法保持待進行基因型分型的個體DNA樣品的相信息,但該保持并非基于兩染色體拷貝的分開或單拷貝的分離。所述方法通過將相對少量的染色體收入每個樣品管簡單地在兩條親本染色體數量上穩定的1 1比中引入失調。因此,雖然基因型/等位基因信息仍保留在DNA樣品中,并且可應用于高通量基因型分型平臺,但是將相信息記錄在兩等位基因的數量比中。這些等位基因的相對比實際上是所有這些基因型分型平臺的輸出之一,但在基因型分型說明中,它們常被忽略。單倍切割方法將讀取等位基因讀數和等位基因強度讀數的輸出信息。然后通過專門設計的算法分析基因型分型信息和相信息,從而確定個體的單倍型。在一個實施方案中,隨后通過專門設計的被稱為“HapReader”的軟件分析基因型分型信息和相信息。由于單倍切割方法在引入等位基因在數量上的失調時保護染色體的完整性,因此由該方法獲得的單倍型將在完整的染色體范圍變化,或不受距離限制。單倍切割方法的實施方案顯示在圖2中。在該實施方案中,方法100包括在個體多個裂解的細胞的每一個細胞中選擇(110) —組染色體;將從所述多個細胞選擇的染色體收集(120)進多個樣品管中,其中每個樣品管含有選自一個或多個細胞的染色體;對每個樣品管中的基因組DNA進行基因型分型(130);以及基于來自基因型分型數據的等位基因核苷酸序列信息和相應的核苷酸信號強度來確定(140)等位基因的單倍型。可從任何類型的細胞選擇染色體。在一個實施方案中,細胞是從個體血液樣品分離的外周血淋巴細胞。用于分離外周血淋巴細胞的方法在本領域內是公知的。在一個實施方案中,將分離的外周血淋巴細胞培養于生長培養基中直至它們開始增殖。能誘導增殖的生長介質在本領域內是公知的。在一個實施方案中,所述生長培養基是含有15% FBS和 100單位/ml青霉素/鏈霉素的RPMI 1640。可以將諸如植物凝集素(PHA)的促分裂原添加至培養基以刺激細胞增殖,且可以添加諸如秋水仙胺的有絲分裂抑制劑使細胞停止在中期。然后使用公知的細胞遺傳學方法收獲正在增殖的外周血淋巴細胞,將其裂解、染色以展示染色體。隨機選擇并收集了一組染色體用于進一步的分析,所述一組染色體通常約為裂解的細胞中染色體的一半。圖3顯示了使用計算機指導的激光顯微切割從用于收集的單個細胞選擇染色體的實例。收集標記區域內的染色體。如早期所指出的,隨機選擇染色體用于收集。將來自隨機選擇的細胞的隨機選擇的染色體收集進多個樣品管中。每管含有從多個細胞收集的染色體。在一個實施方案中,每管含有從2-20個,優選2-10個隨機選擇的細胞收集的染色體。對于每個個體,總共收集2-12個,優選4-8個樣品管。使用保持染色體完整性的技術收集所選擇的染色體。在一個實施方案中,使用計算機指導的激光顯微切割收集染色體。在下一步驟中,對每個樣品管中所收集的染色體進行基因型分型。在一個實施方案中,使用均衡的全基因組擴增(WGA)方法通過PCR對收集的DNA進行擴增。然后將擴增的DNA進行全基因組基因型分型。對于每個個體,用2-4管樣品進行基因型分型,以確保高的基因組覆蓋度并實現精確復制。在一個實施方案中,包括了基因組DNA樣品用于全基因組基因型分型。
9
使用將測序信息相信息與整合的方法分析來自基因型分型的輸出數據集,從而確定個體的單倍型,所述相信息反映在每個基因座處測序信號的強度上。簡單而言,從基因型分型數據提取等位基因核苷酸序列信息和相應的核苷酸信號強度,所述基因型分型數據來自每個樣品管中收集的染色體。計算染色體每個基因座的兩等位基因的核苷酸信號強度比 (等位基因強度比),并將其用于確定等位基因的單倍型。圖4是顯示基于等位基因的核苷酸序列信息和相應的核苷酸信號強度確定等位基因單倍型的方法的實施方案的流程圖。在該實施方案中,方法200包括從基因型分型數據提取(210)等位基因核苷酸序列信息和相應的信號強度;計算(220)純合基因座處核苷酸A、C、G和T的相對比;確定(230)每個核苷酸的k值,從而對于給定的具體實驗將它們的信號強度調整至同等水平;使用k值調整(MO)雜合基因座處的核苷酸信號強度,計算 (250)每個基因座處兩等位基因的信號強度比(等位基因強度比);通過等位基因強度比對每個基因座處的等位基因順序進行整理O60),將較高強度等位基因保持在第一欄而將較低強度等位基因保持在第二欄;確定(270)每條染色體中是否有斷點,如果在染色體中沒有斷點,用形成單倍型的第一欄中的等位基因形成(觀0) —個單倍型,且用第二欄中的等位基因形成另一個單倍型,如果在染色體中有斷點,使用(四0)來自其他染色體收集管中的結果搭接所述斷點。在一個實施方案中,使用專門開發用于單倍切割技術的“HapReader”軟件進行分析。實施例中對所述軟件有更詳細的描述。單倍切割方法的另一個實施方案基于來自單個細胞裂解物的單倍體基因組的分開。在所有當前的分子單倍型分型方法中,二倍體至單倍體的縮減是從不確定的和大量的染色體拷貝中完成。本發明方法建立在每個體細胞精確地具有每條染色體的兩個拷貝的事實上。該精確的數量提供了分開兩條染色體的非常簡單的方法。簡單而言,所述方法在單細胞基礎上分開染色體。該新起點使分開比以前的發明更容易,由于該起點處僅有每條染色體的兩個拷貝。此外,所述方法克服了其他方法的主要缺點-短單倍型距離。因此,該新方法開啟了通過簡單而有效的方法獲得長距離單倍型的大門。如圖5所示,方法300包括下述步驟從個體分離(310) —個或多個單個的二倍體細胞;對來自個體的每個單個的二倍體細胞進行裂解(320)以產生一個或多個單細胞裂解物;將每個單細胞裂解物分成(330)兩等份;對每等份中的基因組DNA進行基因型分型 (340);創建(350)來自所有等份基因型分型數據的目錄;以及基于所述目錄確定(360)個體的染色體單倍型。二倍體細胞可以是來自個體的頰粘膜細胞、淋巴細胞或任何其他細胞類型。在一個實施方案中,從個體收集人頰粘膜細胞。頰粘膜細胞是口或臉頰的內膜上的細胞。它們常規性地蛻落并由新細胞取代。當老細胞死亡時,它們在口的唾液中積累,并能通過用漱口劑的簡單方法容易地將它們收集。通過棉簽、細胞刷、漱口劑以及諸如FTA或IsoCode卡的處理過的卡可以容易地收集頰粘膜細胞。然后,分離單個的細胞并保存在單獨的管中。這可以通過能分離單個細胞而保留細胞基因組DNA的任何方法來進行。這類方法的實例包括但不限于,激光顯微切割或流式細胞術。在一個實施方案中,使用激光顯微切割或諸如細胞分類的任何其他方法實施單個細胞的分離。激光顯微切割是允許從組織樣品精確地切除目的細胞或在直接的顯微鏡顯示下通過激光束進行涂片的顯微操作方法。在計算機監測下標記目的區域,然后通過計算機控制將其切下。可以通過顯微鏡下的檢查模式立即對收集管中的單個細胞進行檢查,以確保成功的分離。在細胞分離期間所用的染色方案不應當干擾隨后的DNA擴增和等位基因確定。優選的染色方法不包括任何固定步驟,并且不基于腐蝕性化學試劑的使用。在一個實施方案中,使用巴氏(Papanicolaou)對細胞進行染色。在另一個實施方案中,用蘇木精和曙紅 (HE)對細胞進行染色。然后將通過顯微切割收集的單個細胞進行細胞裂解。多種技術可用于細胞破碎, 包括物理方法和基于去垢劑的方法。所選的用于細胞破碎的技術必須考慮與預期的下游應用一基因型分型和單倍型分型的兼容性。因此,細胞裂解方法不應當侵略性地連接DNA 分子和將染色體斷裂為小的碎片。可以選擇任何基因組DNA保護劑,有效的、簡單的以及低成本的方法。選擇細胞裂解方案還應當考慮細胞或組織來源。物理裂解方法和基于去垢劑的裂解方法都可以用于細胞破碎。優選的細胞裂解方法包括低滲裂解和蛋白酶K裂解。然后,將單細胞裂解物平均分成兩管。為了確保收集了任何給定染色體的單倍體拷貝,收集多個單細胞裂解物和相應的分割部分。在一個實施方案中,收集了 4-12個單細胞裂解物。在其他的實施方案中,收集了 6-10個單細胞裂解物。在仍然其他的實施方案中, 收集了8個單細胞裂解物。如圖6所示,二倍體細胞含有每條染色體的兩個拷貝(一拷貝來自父本,一拷貝來自母本)。當將含有染色體的兩個拷貝的溶液平均分成兩管時,兩個拷貝可能同時進入管1 或管2,或者它們中的每一個可能進入不同的管中。可以容易地監測存在于這些兩個分割管中的染色體的方式。如果一管不含該染色體,則另一管一定含有該染色體的兩個拷貝。如果兩管都含有該染色體,則它們一定是每管含有一個拷貝。對于一次分割操作,獲得任意給定染色體的單倍體拷貝的概率是成功概率=失敗概率=1/4+1/4 = 0. 50。如果收集了 η個單細胞,并按上述將分割進行η次(每個單細胞一次),則這些管對沒有一個具有給定染色體的單倍體拷貝(對于該給定染色體,所有的管都是二倍體或異倍體)的概率是失敗概率=1/2η。成功概率=1-1/2η。因此,如果收集了 8個單細胞(S卩,η = 8)并分成16等份,則在這些分割部分中獲得任意特定染色體的單倍體拷貝的可能性是1-1/28 = 0 . 9961。這意味著有99. 61%的機會這些16個分割管至少之一將含有靶染色體的單倍體拷貝。因此,如果樣品大小是1000個人個體,從每個個體收集8個細胞,在第一輪分割操作中,996個個體將成功地獲得用于分子單倍型分型的任何染色體的單倍體拷貝。分割之后,一管可能含有一條染色體的單倍體拷貝;然而,它可能含有另一條染色體的兩個拷貝。如果一管含有染色體A的單倍體拷貝、染色體B的兩個拷貝和不含染色體C,則該管仍可理想地用于染色體A的隨后分析(諸如單倍型確定)。存在染色體B的兩個拷貝和缺失染色體C將不干擾對染色體A的結果。有相當罕見的情況,其中來自一個單個的體細胞的單倍型不代表相同個體的單倍型。該罕見情況是發生在體細胞中的有絲分裂交換。已知有絲分裂交換可能發生在一些無性繁殖的真菌和人類癌細胞中。因此,用于對罹患癌癥的個體進行單倍型分型,有必要注意并獲得多個細胞。實際上,通過單細胞分割策略可容易地測定該種情況。具體地,如果來自個體的細胞含有某染色體的多于兩個拷貝,則在兩個分割的管中都存在那條染色體將不能表明每個管中都具有單倍體染色體。例如,如果有3拷貝的染色體,當兩管都含有該染色體時,一管將有一個拷貝,另一管將有兩個拷貝。有兩個拷貝的管在一些多態位點將顯示雜合基因型。因此,我們的方法可以測定拷貝數多態現象。然后對每管中的基因組DNA進行擴增用于基因型分型。可以使用均衡的全基因組擴增(WGA)的任何方法。與旨在擴增特定序列的聚合酶鏈式反應(PCR)不同,WGA旨在無偏愛性地擴增全部基因組。全面的WGA需要保真地復制30億堿基而不丟失或畸變任何特定的基因座或等位基因。這類方法的實例包括但不限于,多重置換擴增(MDA,GE Healthcare GenomiPhi和 Qiagen R印li_g)、引物延伸預擴增(PEP)、改進的引物延伸預擴增(iPEP)、簡并寡聚核苷酸引物PCR(D0P,Sigma GenomePlex)。市場中當前的WGA方法有下述不同(i)擴增能力和產量;( )保真性;(iii)擴增產物長度;(iv)可擴展性以及(ν)擴增包括單細胞的少量起始材料的能力。例如,R印li-g和GenomiPhi產生約101Λ大小的產物,而SigmaGenomePlex 產生約數百個堿基對的產物。由于本發明的分子單倍型分型方法能解決的距離不依賴于擴增產物的長度,因此WGA方法的長度特征不是本發明的關鍵特征。相反,擴增能力和潛在的等位基因偏愛和基因座偏愛是本發明的關鍵。之前通過使用人類精子的遺傳學研究已經很好地說明了從單倍體染色體進行擴增的可行性。對單個精子進行基因型分型的能力最初在1988年報道(Li HH, et al,Nature 335:414-417,1988)。目前法醫科學家已經廣泛地使用對來自單個精子細胞(單倍體)的 DNA 樣品進行基因型分型(Di Martino D, et al. Forensic SciInt 146 增刊S151-153, 2004)。已經顯示通過I1aqGold DNA聚合酶可以擴增高達10. 4pg的DNA,用于可靠的STR (短串聯重復,與SNP平行的遺傳學多態現象類型)譜。除了單個精子細胞,使用WGA-多重置換擴增(MDA)方法已經成功地實現單淋巴細胞(二倍體)或單卵裂球(二倍體)的擴增。普遍關注的WGA是在雜合基因座處的等位基因缺失,這是在一個多態基因座處兩個等位基因中偏愛的不對稱擴增的結果。等位基因缺失將使雜合個體在基因型分型中顯示為純合個體。因此,當觀察到純合基因型時,這理論上仍是可能是假純合基因型;它可能來源于WGA中的等位基因缺失。當使用用于分子單倍型分型的細胞-分割方法時,由于有單拷貝的單倍體,如果在特定的基因座沒有基因座偏愛,則在隨后的基因型分型測定中等位基因讀數將代表那個相應的單倍型上的等位基因。因此,沒有必要注意區分等位基因缺失和真正的純合子。如上面所討論的,如果來自8個單細胞的16個分割管是從一個個體收集的,則 99. 6%會有一些管含有任何給定染色體的單倍體拷貝。其它管可能含有相同染色體的二倍體拷貝或無相同染色體拷貝(異倍體)。每管可能含有某種染色體的單倍體拷貝、其它染色體的二倍體拷貝,以及沒有其它染色體拷貝。因此,有必要為每管創建關于它的內容的目錄,用于包括單倍型確定在內的隨后分析。可以通過能檢測DNA存在的任何方法編目錄。例如,PCR可以用來檢測DNA片段的存在。如果將PCR設計為覆蓋足夠數量的代表所有基因組染色體的區域,然后它可以用來創建基因組范圍的目錄。還可以將PCR設計為僅覆蓋研究課題的靶基因組區。此外,還可以使用全基因組瓦片陣列創建該目錄,但是是以更加系統和高通量的形式。如果分割對的兩管都含有染色體A,則將具有染色體A的單倍體拷貝的兩管用于單倍型確定。基于用于隨后分析的該目錄選擇具有任何特定染色體的單倍體拷貝的管。可以將來自該方法的樣品用作常規的DNA樣品,并直接進行各種高通量基因型分型測定。在單倍型確定中,將來自單倍體樣品的基因型與來自相同個體用作質量對照的的二倍體樣品進行比較。通過該比較將容易地檢測任何假-單倍體管。單倍切割方法的另一個實施方案允許確定來自單細胞某染色體的單倍型。所述方法包括從個體分離單個的二倍體細胞,對分離的單個的二倍體細胞進行裂解和染色以展示染色體,通過激光顯微切割從單細胞收集一組染色體,對所收集的染色體中的基因組DNA 進行基因型分型,對來自相同個體的另一個完整的單細胞的基因組DNA進行基因型分型, 確定染色體收集組中的染色體的單倍型,其中所述染色體以單倍體形式存在于所述染色體收集組中。如圖7所示,當沿著虛線切割細胞并收集右半細胞時,所收集的染色體包含僅為染色體2、3和5的單拷貝(單倍體)、染色體1的兩個拷貝(二倍體)和沒有染色體4拷貝 (異倍體)。因此,從傳統基因型分型平臺對該半個細胞的基因型讀取(genotype calls) 將直接返回染色體2、3和5的單倍型,而對于染色體1將仍是二倍體基因型,對于染色體4 沒有基因型讀取。如早期所討論的,對于每條給定的染色體,如果所收集的一組染色體含有單個的二倍體細胞染色體總數的約一半,則有50%的機會收集單倍體拷貝。當從多個單細胞收集多組染色體時,概率會顯著增加。例如,如果從8個單細胞收集8組染色體,并且每組收集的染色體含有單細胞染色體總數的約一半,則有大于99. 6%的機會收集給定染色體的單倍體拷貝。因此,使用8個半個細胞可以高概率(大于99. 6%)實現對來自個體的完整染色體組進行單倍型分型。因此,在相關的實施方案中,分離并裂解多個單個的二倍體細胞。收集多組染色體;從不同的單細胞收集每組染色體。收集組的數量足夠大,以便個體基因組中的每條染色體以大于99%的概率存在于單倍體形式中。將上述的單倍切割方法應用于任何真核有機體中。在某些實施方案中,所述個體是動物或植物。在其他的實施方案中,所述個體是哺乳動物。在其他的實施方案中,所述個體是人。本發明的另一方面涉及具有用于實施本發明方法的計算機執行指令的計算機可讀介質。本發明的另一方面涉及用于單倍切割的測定試劑盒。在一個實施方案中,所述測定試劑盒含有用于細胞收集、細胞裂解和任選地細胞發生染色的試劑,以及用于基因組DNA 擴增和基因組基因型分型的試劑。在另一個實施方案中,所述試劑盒還包含具有計算機執行指令的計算機可讀介質,用于基于基因型分型數據確定單倍型。在另一個實施方案中,所述試劑盒還包含專門設計的用于從單細胞或少量細胞收集一組染色體用于單倍型讀取和染色體生物檢查的裝置。在一個實施方案中,將單倍切割方法用在產前診斷學中,用于檢測胎兒的重要基因型缺陷。已經了解到一些胎兒細胞在母體外周血中循環。因此,可以從懷孕的母體血液收集胎兒細胞。使用上述的方法可以對這些細胞進行單倍型分析。由于通常是單倍型(不同基因型等位基因的組合)引起疾病,通過單倍型確定的產前診斷會比基因型確定的產前診斷更精確。本發明的單細胞特性為母體血液中胎兒細胞的單倍型確定提供可行性。在另一個實施方案中,將單倍切割方法用在個性化用藥中。個性化用藥是醫生基于人具體的遺傳變異定制治療的實踐。例如,服用同一抗高血壓藥物的兩人可能有截然不同的反應。一名可能具有嚴重的,甚至威脅生命的副作用,而另一名經歷較少甚至沒有副作用,并且似乎順利通過了所述治療。兩人對同一藥物會有如此大不同反應的原因在于他們的基因。人們遺傳他們的基因中變異,并且即使微小的變異都可能會對人患有的同一疾病亞型以及人對某些藥物如何響應產生深遠的影響。在個性化用藥中,臨床中目前的方法開始改變。在患者服用單一劑量的藥物之前, 可以對患者進行血液化驗以確定遺傳變異。所述化驗可以表明該患者的可能對某一藥物具有不利影響的變異。醫生可以決定藥物處方和劑量,以便與患者的遺傳學匹配。因此,特有的遺傳譜能幫助醫生對患者進行個性化地治療,改善藥物開發以及降低醫療成本。目前廣泛接受多-SNP單倍型比單-SNP基因型更能精確地代表人類的基因型。然而,沒有直接讀取單倍型的簡單、廉價且高通量的實驗方法。統計的單倍型構型引起諸多歧義。該技術瓶頸不僅限制發現引起常見疾病的遺傳基礎的努力,而且它還限制遺傳檢驗在臨床實踐中的應用。單倍切割方法可以解決該技術瓶頸。例如,在患者服用任何藥物之前,從他的口中收集少量細胞,并通過使用本方法確定那些疾病突變的單倍型。醫生將開出與患者特有的遺傳譜相匹配的某劑量的藥物,以進行個性化治療。在另一個實施方案中,將單倍切割方法用在法醫檢驗中。在法醫研究中、在性侵犯和其他犯罪的任何情況以及親子鑒定中,準確的單倍型分型比單個SNP基因型分型提供更高的精確度。在諸多法醫檢驗的情況中,可用的樣本量非常有限。由于我們發明的單細胞特性以及本技術得出的準確的單倍型結果,使得單倍切割方法會通式增加敏感度和精確度。通過下面實施例進一步說明了本發明,不應當將下面實施例理解為限制。通過引用將本申請所引用的所有參考文獻、專利和公開的專利申請的內容,以及圖形和表格并入本文。
實施例實施例1 細胞的制備I.樣品收集從人體收集血液并分離淋巴細胞。II.細胞培養將淋巴細胞培養于含15% FBS和100單位/ml青霉素/鏈霉素的RPMI1640培養基中。III.細胞裂解1.在增殖階段,將植物凝集素添加至細胞培養物。2.在植物凝集素(PHA)處理48小時后收獲細胞。3.將溴化乙錠(16. 7 μ g/ml)和 Act-D (6. 7 μ g/ml)添加至細胞。4.于37°C孵育0. 5小時。0.5小時之后,將秋水仙胺(0. 083 μ g/ml)添加至細胞并于37°C孵育1小時。5.于 IOOOrpm 離心 10 分鐘。6.吸去所有上清僅留0. 3ml上清,輕輕重懸細胞團。添加預熱的0. 075mol/L KCl 輕輕渦旋,確保KCl與細胞團混勻。7.處于37°C 20分鐘,并再處于室溫5分鐘。于IOOOrpm離心10分鐘。并移除上清。8.添加冷的固定劑(甲醇乙酸為3 1),通過顛倒管輕輕混合。9.固定和離心3次后,將細胞滴加至載玻片,并用吉姆薩(geimesa)染色20分鐘。10.使載玻片在通風櫥中風干20分鐘。IV.染色體分離1.打開激光,顯微鏡(Leica,ASLMD)和計算機。將收集器中的PCR管置于固定架上。2.將載玻片置于支架上。3.來到計算機屏幕。點擊LEICAADMINISTRATOR開啟程序。4.將物鏡設至IOX找到細胞,然后調至40 X。5.收集染色體隨機地從每個細胞切下并選擇不超過30條染色體。收集4-8個樣品。每個樣品含有來自約7-11個細胞的染色體。6.退出 LBICA ADMINISTRATOR 程序。7.依次關掉計算機、顯微鏡和激光。實施例2 全基因組DNA擴增單細胞裂解和斷裂1.使用激光捕捉顯微切割、細胞分選或其他方法將單細胞分離進準備進行PCR的管中。如果已分選,則緩沖液應該是低離子強度的,諸如Tris EDTA(TE)緩沖液,并且是最小的分選體積。2.將充足體積的水添加至單細胞樣品,使最終體積為9mL。3.通過將2mL的蛋白酶K溶液添加至32mL的10單細胞裂解&斷裂緩沖液,并完全渦旋來制備工作裂解和斷裂緩沖液。4.將ImL新鮮制備的蛋白酶K溶液-10'單細胞裂解&斷裂緩沖液添加至單細胞樣品,并完全混合。5.將DNA混合物于50°C孵育1小時,然后加熱至99°C,精確地持續4分鐘。注意所述孵育是十分時間敏感的,且任何偏差都可能改變結果。冰上冷卻。在進行文庫制備之前降速旋轉樣品。文庫制備
15
6.將2mL的1個單細胞文庫制備緩沖液添加至每個樣品。7.添加ImL的文庫穩定溶液。8.完全混合并置于熱循環儀中于95°C持續2分鐘。9.將樣品于冰上冷卻,通過離心合并樣品,并重新放在冰上。10.添加ImL文庫制備酶,完全混合,并短暫離心。11.將樣品置于熱循環儀中,并按下述孵育16°C持續20分鐘持續20分鐘;37°C持續20分鐘;75°C持續5分鐘;并于 4°C保存。12.將樣品移出熱循環儀并短暫離心。可以立即對樣品進行擴增或于-20°C保存 3天。擴增13.將下面試劑添加至全部14M1反應7. 5mL 10'擴增 Master Mix ;48. 5mL 無核酸酶的水;以及 5. OmL WGADNA 聚合酶。14.完全混合,短暫離心,并開始熱循環。下面參數已優化用于PE9700或同等的熱循環儀于95 °C預變性3分鐘。按下述進行35個循環于94°C變性30秒;于65°C退火/延伸5分鐘;并于4°C保存。當完成循環后,將反應液保持于4°C或保存于_20°C直至準備分析或純化。WGADNA 的穩定性與基因組相當。將DNA保存在同等條件下。實施例3 全基因組基因型分型將擴增的DNA進行諸如Hap3000K和其他的Illumina高通量全基因組基因型分型。對于每人,用2-4管樣品進行基因型分型,以確保高的基因組覆蓋度并實現精確復制。 包括了基因組DNA樣品用于全基因組基因型分型。也可以用其他高通量基因型分型平臺進行本步驟。實施例4:單倍型確定從Illumina人CNV370_Duo芯片獲得全基因組基因型分型數據。使用hfmium.
測定,該芯片含量覆蓋超過370,000個標記。掃描之后,將所有的數據上傳進BeacKtudio, 并使用BeacKtudio基因型分型模塊的版本3進行分析。在嚴格的過濾去除缺失基因型的 SNP之后,剩余的SNP可用于分析。將Illumina基因型分型輸出中的θ、R、X和Y值用來確定每個SNP兩等位基因的相對比。通過沿著染色體的等位基因比構建單倍型。使用專門開發用于該技術的軟件“HapReader”進行單倍型構建。其基本程序和算法如下1)在個體水平,一個人接一個人地進行所述分析。沒有來自不同個體數據表的組合。 2)每人會有3-5張基因型分型數據表,一個數據表如果來自基因組DNA,則其他數據表來自染色體收集管。從每張Illumia輸出數據表提取等位基因讀取(allele calls) 和它們相應的信號強度。
3)基于來自基因組DNA樣品的數據表,選擇該人的純合基因座。計算這些基因座處A、C、G和T平均數的相對比。確定A、C、G、T的k值,以對于給定特定實驗將它們的強度調至相同的水平。4)使用這些k值,調整雜合基因座.5)對于每個基因座,計算兩等位基因的比。6)對于每個基因座,通過它們的等位基因強度比對那些兩個等位基因的順序進行整理,以相同的方式對所有基因座進行整理,且將較高強度等位基因保持在A欄而將較低強度等位基因保持在B欄。7)沿著染色體檢查并比較比值,以確定每條染色體中是否有斷點。8)如果在步驟7)中沒有斷點,A欄中的等位基因形成單倍型,且B欄中的等位基因會形成該人的另一個單倍型。如果在步驟7)中有斷點,使用來自其他染色體收集管中的結果搭接所述斷點。本發明的一方面在于本步驟。通過使用LeicaASLMD激光顯微切割系統的顯微切割將染色體收集進PCR管。本步中,不是所有的染色體都從一個細胞收集;相反,僅僅一部分(約一半)染色體從任意單個裂解的細胞收集(圖幻。對于任何裂解的細胞染色體的選擇是隨機的。考慮該隨機收集來自5-11個隨機選擇的細胞。將來自這些5-11個顯微切割細胞的所有染色體收集進一管中。每人收集4-8管。在該步驟中,通過在計算機上選擇激光切割界限保持染色體完整性,所以確保了染色體完整性。使用Sigma GenomePlex WGA-4試劑盒對每個PCR管中收集的DNA樣品擴增20_24 個循環。實際上,可以使用任何均衡的全基因組擴增(WGA)方法進行該步驟。這些方法包括但不限于,多重置換擴增(MDA,GEHealthcase GenomiPhi和Qiagen R印li_g)、引物延伸預擴增(PEP)、改進的引物延伸預擴增(iPEP)和簡并寡聚核苷酸引物PCR (DOP,Sigma GenomePlex),Repli-g 禾口 GenomiPhi 產生約 IOkb 大小的產物,而 Sigma GenomePlex 產生約數百個堿基對的產物。實施例5 使用單細胞裂解物法確定單倍型使用Leica AS LDM激光顯微切割系統(Leica Microsystems,Germany)從來自人個體的新鮮細胞刷-棉簽頰粘膜細胞分離單細胞。簡單而言,將頰粘膜細胞涂在帶箔的載玻片(固定在標準顯微鏡載玻片邊緣的矩形的可用于UV切割的箔片)上,風干5分鐘,然后進行非常短暫的染色。在顯微鏡下檢查該部分,選擇單細胞,并用激光顯微切割系統將其從帶箔的載玻片切下。將單細胞收集進每管有10 μ 1細胞裂解緩沖液的管中。然后將每管中的單細胞裂解物平均分成兩管。將每管中的基因組DNA WGA擴增用于基因型分型。使用基因型分型數據創建基因組范圍的目錄。使用所述目錄進行單倍型確定。實施例6 使用單細胞切割方法確定單倍型染色體顯微切割將淋巴細胞培養于含15% FBS和100單位/ml青霉素/鏈霉素的RPMI 1640培養基中。運用植物凝集素(PHA)刺激細胞48小時,接著添加溴化乙錠 (16. 7 μ g/ml)和放射菌素D (6. 7 μ g/ml),并于37°C孵育30分鐘。將秋水仙胺(0. 083 μ g/ ml)添加至細胞,并于37°C孵育1小時。通過在1,OOOrpm離心10分鐘收集細胞,重懸,在預熱的0. O75mol/LKC1中于37°C孵育20分鐘,然后于室溫5分鐘。用冷的固定劑(甲醇 乙酸為3 1)固定后,將細胞滴加至載玻片破裂細胞核,隨后用吉姆薩染色20分鐘。使用激光顯微切割顯微鏡(ASLMD,Leica,Germany)收集一個細胞的染色體的一半。全基因組擴增(WGA)通過Sigma GenomePlex WGA4試劑盒按照制造商的說明書對收集的染色體進行擴增。簡單而言,將樣品在裂解和斷裂緩沖液中于50°C孵育1小時,然后加熱至99°C持續4分鐘。然后將單細胞文庫制備緩沖液和文庫穩定溶液添加至樣品于 95°C孵育2分鐘。用下面循環制備文庫16°C持續20分鐘、24°C持續20分鐘、37°C持續20 分鐘、75°C持續5分鐘。通過95°C預變性3分鐘,隨后94°C /30秒和65°C /5分鐘進行35 個循環對DNA進行擴增。通過QIAquick PCR純化試劑盒純化擴增的DNA。基因型分型使用Illumina人CNV370-Quad芯片進行基因型分型。該芯片含有包括SNP和拷貝數變異(CNV)標記在內的約370,000個標記。將用Qiagen試劑盒提取的三個獨立的顯微切割的樣品和一個基因組樣品進行基因型分型實驗。掃描之后,將所有的數據上傳進BeacKtudio,并使用BeacKtudio基因型分型模塊的版本3進行分析。無讀取閾值設置為默認值(0. 15)。數據分析從國際人類基因組單倍型圖計劃數據庫(International HapMap Project database)(階段(Phase) 2 公開發行(Public Release) #22 和階段 3 公開發行 #1, 階段2+3發行#27)檢索到GM 10847和他父母的非定相的基因型(GM和GM)。還從Illumina 數據庫檢索到GM10847的非定相的基因型。通過按照孟德爾遺傳定律確定每個等位基因的親本來源來用GM10847的親本基因型計算地重建GM10847的單倍型。在數據分析中,僅將 GM10847的那些雜合基因座進行單倍型確定。排除了純合基因座,因為它們沒有單倍型分型問題(已知相)。排除了 Illumina基因型分型輸出中兩個等位基因強度都在1,000以下的等位基因讀取。從UCSC基因組瀏覽器(UCSC Genome Browser)(人類2006三月組裝)檢索基因組范圍的ItepeatMasker檢測。用SAS9. 1進行所有的數據整合。通過三組獨立的實驗用HapMap計劃(國際人類基因組單倍型圖協作組2003)招募的個體GM10847檢驗單倍型分型方法。接著上述程序之后,我們將顯微切割樣品的基因型讀取與基因組DNA的基因型讀取以及從國際人類基因組單倍型圖計劃數據庫(階段2公開發行#2 下載數據的基因型讀取進行比較。通過染色體范圍的雜合讀取是否轉變為顯微切割樣品中的純合讀取來指示每個樣品中每條染色體的單染色體狀態、二染色體狀態和零染色體狀態(圖8)。發現樣品1成功地以染色體2、4、6、15、16、17、18和20為單倍型;樣品2以染色體lq、3、4、5、10、16、17、18、20和21為單倍型;樣品3以染色體3、7、9和20為單倍型。共定相了 24,481個雜合基因座。通過復制并與使用孟德爾遺傳定律下的三重結構從非定相的基因型所決定的單倍型(HapMap階段2公開發行#22)進行比較來確定本方法的精確度(Hodge SE, et al,Nat Genet, 21 (4) :360-1 ; 1999)。在用我們的7DDNA單倍型分型方法成功定相的那些M,245個 SNP基因座之中,464個SNP基因座沒有被HapMap階段2基因型數據覆蓋,4,744個SNP由于全部3倍雜合子沒有來自HapMap基因型的明確的單倍型,并且142個SNP由于HapMap2 中丟失的數據沒有被定相。所以我們在我們的單倍型和HapMap2來源的單倍型之間比較了 18,895個SNP基因座。當與通過HapMap三重結構所決定的單倍型比較時,有18,625個 SNP (98. 57%)顯示出一致的等位基因相。在那些270個不一致的SNP基因座中,45個SNP 基因座是由于與階段3基因型讀取比較HapMap階段2基因型分型錯誤,并且103個基因座有如ItepeatMasker所檢測的各種重復。除了由ItepeatMasker所識別的那些之外其他的不一致性可潛在地歸于全基因組擴增錯誤、基因型分型錯誤或的未評注部分的復制。通過 2,089次復制直接地進一步確定精確度,其中2,065個SNP表現出一致的結果,它們中沒有不一致的單倍型,且盡管整個染色體表現出不一致性(表基因座在復制物之一中具有二倍體等位基因讀取,估計有98. 85%的精確率。
表1通過數據再現估計精確率
權利要求
1.對個體進行分子單倍型分型的方法,所述方法包括在所述個體多個裂解的二倍體細胞的每一個細胞中隨機選擇一組染色體; 將從所述多個細胞選擇的染色體收集進多個樣品管中,其中每個樣品管含有選自一個或多個細胞的染色體;對每個樣品管中的基因組DNA進行基因型分型;和基于來自基因型分型數據的等位基因核苷酸序列信息和相應的核苷酸信號強度來確定等位基因的單倍型。
2.如權利要求1所述的方法,其中所述確定步驟包括從基因型分型數據提取等位基因核苷酸序列信息和相應的核苷酸信號強度; 計算每個雜合基因座處兩個等位基因的核苷酸信號強度比(等位基因強度比);和確定等位基因的單倍型。
3.如權利要求2所述的方法,其中所述計算步驟包括 計算純合基因座處核苷酸A、C、G和T的相對比。確定每種核苷酸的k值,以將它們的信號強度調到相同的水平; 使用所述k值調整雜合基因座處的核苷酸信號強度;和計算雜合基因座處的等位基因強度比。
4.如權利要求3所述的方法,所述方法還包括通過等位基因強度比對每個基因座處的等位基因順序進行整理; 將較高強度等位基因保持在第一欄而將較低強度等位基因保持在第二欄;和確定每條染色體中是否有斷點,如果在染色體中沒有斷點,用第一欄中的等位基因形成一個單倍型,且用第二欄中的等位基因形成另一個單倍型,如果在染色體中有斷點,使用來自其他染色體收集管中的結果搭接所述斷點。
5.如權利要求1所述的方法,其中將來自2-10個隨機選擇的細胞的染色體收集進每個樣品管中。
6.如權利要求5所述的方法,其中一共收集了4-8個樣品管。
7.如權利要求1所述的方法,其中所述基因型分型步驟包括擴增基因組DNA。
8.如權利要求1所述的方法,其中所述個體是哺乳動物。
9.如權利要求8所述的方法,其中所述哺乳動物是人。
10.對個體進行分子單倍型分型的方法,其包括 從所述個體分離一個或多個單個的二倍體細胞;對來自個體的每個分離的單個的二倍體細胞進行裂解以產生一個或多個單細胞裂解物;將每個單細胞裂解物分成兩等份; 對每等份中的基因組DNA進行基因型分型; 創建來自所有等份的基因型分型數據的目錄;和基于所述目錄確定所述個體的染色體單倍型。
11.如權利要求10所述的方法,其中所述分離步驟包括從所述個體分離4-12個單個的二倍體細胞。
12.如權利要求11所述的方法,其中所述分離步驟包括從所述個體分離6-10個單個的二倍體細胞。
13.如權利要求12所述的方法,其中所述分離步驟包括從所述個體分離8個單個的二倍體細胞。
14.如權利要求10所述的方法,所述基因型分型步驟包括擴增基因組DNA。
15.如權利要求10所述的方法,其中所述個體是哺乳動物。
16.如權利要求15所述的方法,其中所述哺乳動物是人。
17.對個體進行分子單倍型分型的方法,所述方法包括 從所述個體分離單個的二倍體細胞;對所述分離的單個的二倍體細胞進行裂解和染色以展示染色體; 通過激光顯微切割從單細胞收集一組染色體; 對所收集的染色體中的基因組DNA進行基因型分型;對來自相同個體的一個或多個完整的二倍體細胞的基因組DNA進行基因型分型;和確定染色體收集組中的染色體的單倍型,其中所述染色體以單倍體形式存在于所述染色體收集組中。
18.如權利要求17所述的方法,其中重復所述分離步驟、裂解步驟和收集步驟一次或多次,以確定所述個體每條染色體的單倍型。
19.如權利要求18所述的方法,其中重復所述分離步驟、裂解步驟和收集步驟足夠多的次數,以便所述個體基因組中的每條染色體以大于99%的概率存在于單倍體形式中。
20.如權利要求17所述的方法,所述基因型分型步驟包括擴增基因組DNA。
21.如權利要求17所述的方法,其中所述個體是哺乳動物。
22.如權利要求21所述的方法,其中所述哺乳動物是人。
23.用于單倍切割的測定試劑盒,其包含 用于細胞收集和細胞發生染色的試劑;和用于基因組DNA擴增和基因組基因型分型的試劑。
24.如權利要求23所述的測定試劑盒,其還包含操作手冊。
25.如權利要求23所述的測定試劑盒,其還包含具有計算機執行指令的計算機可讀介質,用于基于基因型分型數據確定單倍型。
26.用于實施權利要求1的方法的具有計算機執行指令的計算機可讀介質。
27.用于實施權利要求10的方法的具有計算機執行指令的計算機可讀介質。
28.用于實施權利要求17的方法的具有計算機執行指令的計算機可讀介質。
全文摘要
公開了對個體進行分子單倍型分型的方法。所述方法包括在個體多個裂解的二倍體細胞的每一個細胞中隨機選擇一組染色體;將從所述多個細胞選擇的染色體收集進多個樣品管中,其中每個樣品管含有選自一個或多個細胞的染色體;對每個樣品管中的基因組DNA進行基因型分型;以及基于來自基因型分型數據的等位基因核苷酸序列信息和相應的核苷酸信號強度來確定等位基因的單倍型。還公開了使用單細胞裂解物或單細胞顯微切割進行分子單倍型分型的其他方法。
文檔編號C12Q1/68GK102203285SQ200980141955
公開日2011年9月28日 申請日期2009年6月18日 優先權日2008年10月21日
發明者宋清, 肖燕, 馬麗 申請人:莫爾豪斯醫學院