專利名稱:基因座的拷貝數分析的制作方法
基因座的拷貝數分析相關申請本申請要求保護2009年11月12日提交的美國臨時申請No. 61Λ60,804的利益和優先權,將所述臨時申請的完整內容通過引用并入本文。序列表本說明書參考序列表(2010年11月12日以稱為〃SeqListing. txt〃的.txt文件電子提交的)。所述.txt文件于2010年11月12日產生,大小為61Λ。將序列表的完整內容通過引用并入本文。背景存在于個體的每一個細胞中的基因拷貝數可具有重要的臨床意義。例如,具有常染色體基因的少于兩個正常拷貝數的個體可能處于增加的產生疾病的風險中和/或為疾病的攜帶者。因此,基因拷貝數估值可具有改變生活的結果。例如,確定疾病攜帶者狀態的基因拷貝數估值可影響夫婦擁有孩子的決定。發明概述本發明包括承認用于測定基因座的拷貝數的診斷工具可通過生物測定法與生物測定測量的質量和/或拷貝數調用(copy number call)的統計置信度的全面性評估的組合來進行改進。因此,本發明,除其它以外,提供了與基因座的異常拷貝數相關的疾病、病癥或病況或其攜帶者的更準確可靠的診斷方法,顯著地降低了假陽性率。因此,在一個方面,本發明提供了分析目標基因座的拷貝數的方法,包括(a)提供多個生物樣本,每一個單個生物樣本包含目標基因座和一個或多個具有已知拷貝數的參照基因座;(b)實施多個生物測定,其中每一個單個生物測定分析每一個單個生物樣本的所述目標基因座和所述一個或多個參照基因座并且產生可檢測的信號,以便目標基因座和一個或多個參照基因座的可檢測信號的水平與它們各自的拷貝數相關;(c)基于多個生物測定來確定針對一個或多個參照基因座標準化的目標基因座的多個拷貝數估值;和(d)評估拷貝數估值的質量和/或拷貝數調用的統計置信度,從而確定是否能產生目標基因座的拷貝數調用。在一些實施方案中,目標基因座包含基因或其部分。在一些實施方案中,目標基因座包含運動神經元生存蛋白I(SMNl)的外顯子或其部分。在一些實施方案中,SMN 1的外顯子為外顯子7。在一些實施方案中,一個或多個參照基因座選自SMARCC1和SUPT5H。在一些實施方案中,上述步驟(b)中的生物測定法是實時PCR(RT-PCR)測定法,其擴增目標基因座和一個或多個參照基因座。在一些實施方案中,可檢測信號是熒光信號,在RT-PCR的每一個擴增循環檢測目標基因座或一個或多個參照基因座的熒光信號的水平。在一些實施方案中,上述步驟(C)包括如下步驟(i)確定每一個單個生物樣本中目標基因座與一個或多個參照基因座達到預定熒光信號水平所需的循環次數之間的差異(ACti) ;(ii)產生反映正常目標基因座與一個或多個參照基因座之間的差異的校準器
(calibrator) (Δ&);和(iii)通過將步驟⑴中確定的循環次數的差異Δ Cti針對校準器(AC t)標準化確定每一個單個生物樣本中目標基因座的拷貝數估值。在一些實施方
案中,步驟(i)包括首先測量每一個目標基因座和一個或多個參照基因座達到預定的熒光
信號水平所需的循環次數(Cti)。在一些實施方案中,校準器(Λ(%·0由多個生物樣本的目
標基因座與一個或多個參照基因座之間的ACti的修剪均數(trimmed mean)(例如,80%修剪均數)來確定。在一些實施方案中,在線性標度上確定每一個單個生物樣本中的目標基因座的拷貝數估值。在一些實施方案中,在對數標度上確定每一個單個生物樣本中的目標基因座的拷貝數估值。在一些實施方案中,基于對于一個或多個參照基因座產生的數據的質量評估目標基因座的拷貝數估值的質量。在一些實施方案中,通過確定測量置信度和/或調用置信度(call confidence)來評估統計置信度。在一些實施方案中,重復上述步驟(b)中進行的生物測定。在一些實施方案中,通過計算重復生物測定的測量置信度和基于多個拷貝數估值的調用置信度來確定拷貝數調用的統計置信度。在一些實施方案中,上述步驟(d)包括,如果調用置信度小于預定閾值,則確定不能產生目標基因座的拷貝數調用。在另一個方面,本發明提供了檢測與目標基因的異常拷貝數相關的疾病或其攜帶者的方法,所述方法包括(a)提供包含至少一個獲自目標個體的生物樣本的多個生物樣本;(b)對多個生物樣本的每一個進行多個重復生物測定以分析目標基因和一個或多個具有已知拷貝數的參照基因,其中多個重復生物測定的每一個產生可檢測信號,以便目標基因與一個或多個參照基因的可檢測信號的水平與它們各自的拷貝數相關;(c)確定針對一個或多個參照基因標準化的目標基因的拷貝數估值;和(d)評估目標個體的拷貝數估值的質量和/或拷貝數調用的統計置信度,從而確定個體的目標基因的拷貝數調用是否能產生。在一些實施方案中,本發明的發明方法還包括確定個體具有疾病還是處于發生所述疾病的風險中,或個體是否是疾病的攜帶者的步驟。在一些實施方案中,所述疾病為脊髓性肌萎縮(SMA)。在一些實施方案中,目標基因為運動神經元生存蛋白1 (SMNl)。在一些實施方案中,在上述步驟(b)中進行的生物測定法為實時PCR測定法。在一些實施方案中,上述步驟(b)包括進行擴增至少SMNl的外顯子7的部分的實時PCR測定。在一些實施方案中,由生物測定產生的可檢測信號為熒光信號,在RT-PCR的每一個擴增循環上檢測目標基因或一個或多個參照基因的熒光信號水平。在一些實施方案中,上述步驟(C)包括步驟(i)確定為達到預定的熒光信號水平,每一個單個重復測定中目標基因與一個或多個參照基因之間的循環次數差異(ACti);
(ii)產生反映正常目標基因與一個或多個參照基因之間的背景差異的校準器(AG);和
(ill)通過針對校準器(Δ^ )將步驟(i)中確定的循環次數差異ACti標準化來產生基于每一個單個重復測定的拷貝數估值。在一些實施方案中,在線性標度上確定基于每一個單個重復測定的目標基因的拷貝數估值。在一些實施方案中,在對數標度上確定基于每一個單個重復測定的目標基因的拷貝數估值。在一些實施方案中,評估拷貝數估值的質量包括產生基于循環次數測量及其針對一個或多個參照基因產生的擴增曲線斜率的質量控制度量。在一些實施方案中,評估拷貝數估值的質量包括測定多個重復生物測定之間的變化系數(coefficient of variation).在一些實施方案中,評估拷貝數調用的統計置信度包括確定測量置信度和/或調用置信度。在一些實施方案中,通過計算多個重復生物測定的測量置信度和基于多個拷貝數估值的調用置信度來確定拷貝數調用的統計置信度。在一些實施方案中,測量置信度被確定為圍繞拷貝數估值的最大正態置信區間(normal confidence interval),所述最大正態置信區間是通過多個重復測定中的拷貝數估值的平均值和符合預定拷貝數限度內的平均值標準誤差定義的。在一些實施方案中,上述步驟(d)包括如果測量置信度不超過預定置信度閾值,則確定不能產生拷貝數調用。在一些實施方案中,調用置信度確定來自鄰近拷貝數分布的拷貝數估值的t檢驗的P值。在一些實施方案中,步驟(d)包括確定如果調用置信度小于預定置信度閾值,則不能產生拷貝數調用。在一些實施方案中,本發明的發明方法還包括平行地分析一個或多個具有預定的目標基因拷貝數的對照樣品。在一些實施方案中,在多孔平板(例如,96孔或384孔平板)上進行對多個生物樣本和一個或多個對照樣品的生物測定。在一些實施方案中,本發明的發明方法還包括基于一個或多個對照樣品的質量控制和統計分析確定平板質量控制度量。在一些實施方案中,如果一個或多個對照樣品中的任何樣品未通過質量控制或統計置信度評估之一或者如果任何單個對照樣品的估值不等于預定拷貝數,則舍棄平板。在一些實施方案中,適合用于本發明的生物樣本包含來自細胞、組織、全血、血漿、血清、尿、糞便、唾液、臍帶血、絨膜絨毛取樣、絨膜絨毛取樣培養物、羊水、羊水培養物或經子宮頸洗出液(transcervical lavage fluid)的核酸。在一些實施方案中,適合用于本發明的生物樣本為出生前樣品。在另一個方面,本發明提供了用于分析目標基因座的拷貝數的系統,如本文中所描述的。在一些實施方案中,根據本發明的系統包括a)接收多個生物樣本的工具,其中每一個單個生物樣本包含目標基因座和一個或多個具有已知拷貝數的參照基因座;b)進行多個生物測定的工具,其中每一個單個生物測定分析每一個單個生物樣本的目標基因座和一個或多個參照基因座并且產生可檢測信號,以便目標基因座和一個或多個參照基因座的可檢測信號的水平與其各自拷貝數相關;c)經配置用以檢測來自每一個單個生物樣本的可檢測信號并確定所述可檢測信號的水平的確定模塊;d)經配置用以存儲來自確定模塊的信號信息的存儲設備;e)計算模塊,其經改造適合(i)基于存儲設備上存儲的信號信息計算針對一個或多個參照基因座標準化的目標基因座的拷貝數估值和(ii)確定拷貝數估值的質量和/或拷貝數調用的統計置信度;和f)為用戶顯示部分基于計算內容和數據分析結果的顯示模塊,其中內容包括目標基因座的拷貝數調用和/或表示質量控制或統計置信度分析的任一個是否未通過的信號。在一些實施方案中,目標基因座包括運動神經元生存蛋白I(SMNl)的外顯子或其部分。在一些實施方案中,生物測定法為實時PCR測定法。在一些實施方案中,所述確定模塊經配置用以確定每一個擴增循環上的可檢測信號的水平并且所述可檢測信號為熒光信號。在一些實施方案中,所述計算模塊經改造適合按照下列步驟計算目標基因座的拷貝數估值(i)確定為達到預定的熒光信號水平,每一個單個樣本中目標基因座與一個或多個參照基因座之間的循環次數差異(ACti) ; (ii)產生反映正常目標基因座與一個或多
個參照基因座之間的背景差異的校準器(ΔΓ );和(iii)通過針對校準器(Afi)標準化在
步驟(i)測定的循環次數差異ACti來確定每一個單個生物樣本中的目標基因座的拷貝數估值。在一些實施方案中,所述計算模塊經改造以適合通過至少產生基于循環次數測量及其針對一個或多個參照基因產生的擴增曲線斜率的質量控制度量(metrics)來確定拷貝數估值的質量。在一些實施方案中,所述計算模塊經改造以適合通過至少確定樣品變化系數來確定拷貝數估值的質量。在一些實施方案中,所述計算模塊經改造以適合通過至少確定測量置信度并將確定的測量置信度與預定閾值限度相比較來確定拷貝數調用的統計置信度。在一些實施方案中,所述計算模塊經改造以適合通過至少確定調用置信度并將確定的調用置信度與預定閾值限度相比較來確定拷貝數調用的統計置信度。在一些實施方案中,進一步改造所述計算模塊以確定是否有對照樣品未通過。在另一個方面,本發明提供了計算機可讀介質,其上記錄有計算機可讀指令以定義包括用于在計算機上執行本文中描述的方法的計算模塊和顯示模塊的軟件模塊。在一些實施方案中,所述方法包括a)利用計算模塊進行計算,(i)基于存儲在存儲設備上的實時PCR數據,針對一個或多個參照基因座標準化的目標基因座的拷貝數估值和(ii)拷貝數估值的質量和/或拷貝數調用的統計置信度;和b)為用戶顯示部分基于計算和數據分析結果的內容,其中所述內容包括目標基因座的拷貝數調用和/或信號標示是否未通過質量控制或統計置信度分析的任一個。在一些實施方案中,目標基因座包含SMNl的外顯子7或其部分。在另一個但相關的方面,本發明提供了使用本文中描述的組合物和方法用于檢測與基因座的異常拷貝數或等位基因變體相關的疾病、病癥或病況或者其攜帶者的診斷試劑盒。在一些實施方案中,根據本發明的發明試劑盒適合用于診斷脊髓性肌萎縮(SMA)或其攜帶者。在一些實施方案中,根據本發明的試劑盒包括(a)用于擴增SMNl的外顯子7或其部分的一種或多種試劑;(b)用于擴增一個或多個具有已知拷貝數的參照基因座的一種或多種試劑;和(c)本文中描述的計算機可讀介質。在本申請中,除非另外指出,否則“或”的使用表示“和/或”。如本申請中所使用的,術語“包含”和所述術語的變型例如“包括”和“含有”無意排除其它添加物、組分、整體或步驟。如本文中所使用的,術語“約”和“大約”是等同使用的。本申請中使用的具有或不具有約/大約的任何數字意指包括相關領域中的技術人員理解的任何正常波動。在某些實施方案中,除非另外指出或根據上下文很明顯的(除了其中這樣的數字超過可能值的100%的情況外),否則術語“大約”或“約”是指以任一方向(大于或小于)落在提及的參照值的 25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更小內的值的范圍。
本發明的其它特征、目的和有利方面示于隨后詳細的描述、附圖和權利要求中。然而,應當理解,詳細描述、附圖和權利要求,當表示本發明的實施方案時,僅通過舉例說明而非限定的方式給出。本發明的范圍內的各種改變和變化對于本領域技術人員來說將是顯然的。附圖概述附圖僅用于舉例說明目的,而非用于限制。
圖1描述了包含外顯子7的SilNl基因的一部分的基因組序列。編碼外顯子7的序列以粗體標示。顯示了可用于TAQMAN 分析的示例性引物和探針(加陰影的)。還描述了示例性測序引物(SMNFUP1和SMNRIP1)(加陰影的)。小寫字母表示單核苷酸多態型。圖2描述了示例性平板形式,其中顯示了包含2-拷貝對照、混合物(例如試劑與緩沖液的)空白對照和一式兩份的樣品的孔。圖3A和;3B是舉例說明可包括在分析系統中的計算裝置的實施方案的方塊圖。圖4為舉例說明分析系統的實施方案的方塊圖。圖5A為舉例說明用于從384孔平板上重復G個重復,每一個重復96個樣本)進行的TAQMAN 實時PCR實驗的Ct數據獲得一組樣本的拷貝數估值的方法的某些實施方案的概述的流程圖。圖5B是舉例說明用于進行平板質量控制的方法的實施方案的流程圖。圖5C是舉例說明用于進行樣本質量控制的方法的實施方案的流程圖。圖6A-B是描述用于顯示樣本和平板統計數字以及平板和樣本質量控制的結果的版面設計(layout)的實施方案的屏幕截圖。定義為了使本發明更容易理解,下面首先定義某些術語。下列術語和其它術語的附加定義示于說明書中說明。如本文中所使用的,短語“等位基因”可與“等位基因變體”互換使用并且是指基因座或基因的變體。在一些實施方案中,基因座或基因的特定等位基因與特定表型相關,例如,改變的發生疾病或病況的風險,進展至特定疾病或病況階段的可能性,對特定療法的順從性,對感染的易感性,免疫功能等。如本文中所使用的,短語“生物樣本”可與“生物樣品”互換使用并且可稱為“樣本”或“樣品”。如本文中所使用的短語“生物樣本”是指獲自任何活細胞或機體的,由所述活細胞或機體排泄或分泌的任何固體或液體(或其組合)樣品。在某些實施方案中,生物樣本包括核酸。生物樣本的非限定性實例包括細胞、組織、全血、血漿、血清、尿、糞便、唾液、臍帶血、絨膜絨毛取樣、羊水和經子宮頸洗出液。任何生物樣本的細胞培養物也可用作生物樣本,例如絨膜絨毛取樣的培養物和/或羊水培養物例如羊水細胞培養物。生物樣本還可以是例如獲自任何器官或組織的樣品(包括活檢組織或尸體解剖樣本),可包括細胞(無論原代細胞還是培養的細胞),被任何細胞條件化的培養基,組織或器官,組織培養物。在一些實施方案中,可測定相同樣本的重復。(參見下文中的“重復”)。如本文中所使用的,短語“攜帶者”是指具有基因突變或等位基因變體但未顯示與所述基因突變或等位基因變體相關的疾病的癥狀的個體。然而攜帶者通常能夠將基因突變或等位基因變體傳遞至他們的后代,然后所述后代可以表達突變的基因或等位基因變體。通常,該現象是許多基因的隱性性質的結果。在某些實施方案中,攜帶者具有的突變或等位基因變體易于產生或與特定表型相關,例如改變的發生疾病或病況的風險,進展至特定疾病或病況階段的可能性,對特定療法的順從性,對感染的易感性,免疫功能等。不受限制,攜帶者可具有減少的或增加的基因或基因的部分的拷貝數。攜帶者還可在基因內具有突變(例如,點突變、多態型、缺失、插入或易位等)。“攜帶者”在本文中也稱為“基因攜帶者”。如本文中所使用的,短語“拷貝數”,當用于指基因座時,是指每基因組或基因組等同物存在的這樣的基因座的拷貝數。“正常拷貝數”,當用于指基因時,是指正常個體中存在的正常或野生型等位基因的拷貝數。在某些實施方案中,拷貝數的范圍為0至2,包括0和2。在某些實施方案中,拷貝數的范圍為0至3個拷貝(包括0和3個拷貝)、0至4個拷貝(包括0和4個拷貝)、0至6個拷貝(包括0和6個拷貝)、0至7個拷貝(包括0和7個拷貝)或0至超過7個拷貝(包括0和超過7的拷貝在內)。在其中基因座的拷貝數在群體的個體間變化較大的實施方案中,估算的中位拷貝數可被當作“正常拷貝數”以用于計算和/或比較目的。如本文中所使用的,術語“基因”是指負責離散細胞(例如,細胞內或細胞外)產物和/或功能的離散核酸序列。更具體地,術語“基因”是指核酸,所述核酸包括編碼蛋白質的部分以及任選地包括調控序列例如啟動子、增強子、終止子等,所述調控序列參與由目標基因編碼的蛋白質的表達的調控。如本文中所使用的,術語“基因”還可包括不編碼蛋白質但卻提供用于功能性RNA分子例如tRNA、rRNA等的轉錄的模平板的核酸。可選擇地,基因可確定特定事件/功能的基因組定位,例如蛋白質和/或核酸結合位點。術語“個體”和“受試者”在本文中可互換使用。如本文中所使用的,它們是指可患有疾病或病癥(例如,脊髓性肌萎縮)或對所述疾病或病癥易感但可以顯示或可以不顯示所述疾病或病癥的癥狀的人或另一種哺乳動物(例如,小鼠、大鼠、兔子、狗、貓、牛、豬、綿羊、馬或靈長類動物)。在許多實施方案中,受試者是人類。在許多實施方案中,受試者是患者。除非另有所指,否則術語“個體”和“受試者”不表示具體年齡,從而包括成年人、兒童(例如,幼兒或新生兒)和未出生嬰兒。如本文中所使用的,術語“基因座”是指特定DNA序列在染色體上的特定位置。如本文中所使用的,特定DNA序列可具有任何長度(例如,1、2、3、10、15或更多個核苷酸)。在一些實施方案中,基因座為或包含基因或基因的部分。在一些實施方案中,基因座為或包含基因的外顯子或外顯子的部分。在一些實施方案中,基因座為或包含基因的內含子或內含子的部分。在一些實施方案中,基因座為或包含基因的調控元件或調控元件的部分。在一些實施方案中,基因座與疾病、病癥和/或病況相關。例如,基因座上的突變(包括缺失、插入、剪接突變、點突變等)可與疾病、病癥和/或病況相關。如本文中所使用的,術語“正常”,當用于修飾術語“拷貝數”或“基因座”或“基因”或“等位基因”時,是指以最高百分比存在于群體中的基因座、基因或等位基因(例如野生型數目或等位基因)的拷貝數。當用于修飾術語“個體”或“受試者”時,它們是指攜帶以最高百分比存在于群體中的基因座、基因或等位基因的拷貝數的個體或個體的組,例如野生型個體或受試者。通常,正常“個體”或“受試者”不具有特定的疾病或病況并且也不是所述疾病或病況的攜帶者。術語“正常”在本文中也用于定性從正常或野生型個體或受試者分離的生物樣本或樣品,例如“正常生物樣品”。
如本文中所使用的,術語“探針”,當用于指核酸的探針時,是指具有可結合或與目標核酸雜交的特定核苷酸序列(例如,RNA或DNA)的核酸分子。通常,探針通過一個或多個類型的化學鍵(通常通過氫鍵形成)與互補序列或大體上互補的序列的核酸特異性結合(或特異性雜交)。在一些實施方案中,探針可在實時PCR反應中結合DNA擴增子的核酸。如本文中所使用的,術語“重復”,當用于指生物測定時,是指進行以提高可靠性、容錯性或有利于統計分析的一式二份測定或重復測定。在一些實施方案中,術語“重復”可與短語“重復測定”或“重復生物測定”互換使用。通常,使用來自相同或相似的采自相同個體的生物樣本的材料進行重復測定。即,多個樣本可獲自特定的個體,和/或來自特定個體的單個樣本可被分成部分(每一個部分用于重復測定或貯存以待以后使用)。在一些實施方案中,視預定統計閾值而定或任經驗選擇所使用的重復測定的次數。在一些實施方案中,使用一式兩份、一式三份、一式四份、一式五份、一式六份、一式七份、一式八份、一式九份、一式十份或超過10個重復。在一些實施方案中,使用一式四份。如本文中所使用的,術語“信號”是指可檢測和/或可測量的實體。在某些實施方案中,信號可通過人眼檢測,例如可見的。例如,信號可能與或可與可見光譜中顏色的強度和/或波長相關。這樣的信號的非限定性實例包括因化學反應例如酶促反應而引起的著色沉淀物和著色可溶性產物。在某些實施方案中,信號可使用裝置來檢測。在一些實施方案中,信號產生自當激發時發射熒光的熒光基團,其中光可利用熒光檢測器來檢測。在一些實施方案中,信號為光(例如,可見光和/或紫外光)或與其相關,所述光可通過分光光度計檢測。例如,由化學發光反應產生的光可用作信號。在一些實施方案中,信號為輻射或與其相關,例如由放射性同位素發射的輻射、紅外輻射等。在某些實施方案中,信號為物理實體的性質的直接或間接指示劑。例如,信號可用作生物樣品中和/或反應容器中核酸的的量和/或濃度的指示劑。詳述本發明提供了更準確可靠的用于分析基因座的方法。除其它以外,本發明提供了通過組合生物測定與全面性質量控制和統計置信度評估來分析基因座(特別地,正常基因座)的拷貝數的方法。如實施例部分所描述的,本申請的發明人已成功地開發了有效且高效地組合生物和統計分析的系統和方法。在一些實施方案中,本發明利用通過計算機系統執行的算法,該算法通過確定例如生物測定的測量置信度和拷貝數調用的統計置信度來評估拷貝數估值的質量。在一些實施方案中,本文中公開的發明方法使用相同的生物測定法(例如,實時PCR)分析目標基因座和一個或多個具有已知拷貝數的參照基因座,以幫助進行質量控制和/或統計置信度評估。許多基因座牽涉遺傳病,并且這類基因座可使用本文中公開的方法來分析。因此,本文中公開的方法可有助于攜帶者的檢測、患者的診斷、出生前診斷和/或用于植入的胚胎的基因分型等。如本領域技術人員所理解的,與目標基因座相關的遺傳病可遵從許多遺傳模式(包括例如,常染色體隱性、常染色體顯性、伴性顯性以及伴性隱性模式)的任一種。在一些實施方案中,對基因座進行拷貝數分析,所述基因座的部分或全部的缺失牽涉疾病。目標基因座上的缺失包括但不限于少于20個堿基對(bp),20bp至IOObp (包括 20bp 和 IOObp), IOObp 至 200bp (包括 IOObp 和 200bp), 200bp 至 500bp (包括 200bp 和500bp),500bp 至 Ikp (包括 500bp 和 lkp), Ikb 至 2kb (包括 Ikb 和 2kb),2kb 至 5kb (包括 2kb 和 5kb), 5kb 至 IOkb (包括 5kb 和 IOkb), IOkb 至 20kb (包括 IOkb 和 20kb), 20kb 至30kb (包括201Λ和301Λ)和大于301Λ的大小的缺失。在一些實施方案中,對目標基因座進行拷貝數分析,所述目標基因座的一個或多個點突變和/或插入突變牽涉疾病。在這些情況下,可設計生物測定以檢測存在于目標基因座上的正常序列或等位基因的拷貝數。例如,可使用區分突變與正常核苷酸序列的引物改造方法例如實時PCR,以便只有當正常序列存在時擴增才發生。本發明的不同方面詳細地描述于下列部分。部分的使用無意限定本發明。每一個部分可用于本發明的任何方面。在本申請中,除非另有所指,否則“或”的用途意指“和/或”。I.目標基因座和相關遺傳病、病癥和病況根據本發明的發明方法適合用于分析任何目標基因座的拷貝數。在某些實施方案中,目標基因座與疾病、病癥或病況相關。例如,目標基因座上或其內的突變或等位基因變異可與改變的(例如,增加的或減少的)發生疾病、病癥或病況的風險和/或其攜帶者的狀態相關。在一些實施方案中,目標基因座上或其內的突變或等位基因變異與疾病、病癥或病況或攜帶者狀態之間存在因果關系。在一些實施方案中,目標基因座上或其內的突變或等位基因變異可與疾病、病癥或病況共分離,但不直接促成所述疾病、病癥或病況的發生。在一些實施方案中,可根據本發明分析的目標基因座包括基因或其部分(例如,外顯子、內含子、啟動子或其它調控區)。表1列出了這類基因的非限定性實例和相關遺傳病、病癥或病況。如本領域技術人員所理解的,基因可以具有超過一個名稱。表1的列表不排除可與特定疾病相關的另外的基因的存在。本發明包括那些另外的基因,包括在將來被發現與每一個特定疾病相關的那些基因。表1 與遺傳病、病癥或病況相關的示例性基因
權利要求
1.分析目標基因座的拷貝數的方法,所述方法包括(a)提供多個生物樣本,每一個單個生物樣本包含目標基因座和一個或多個具有已知拷貝數的參照基因座;(b)進行多個生物測定,其中每一個單個生物測定分析每一個單個生物樣本中的目標基因座和一個或多個參照基因座并產生可檢測信號,以便目標基因座與一個或多個參照基因座的可檢測信號的水平與它們各自的拷貝數相關;(c)基于多個生物測定來確定針對一個或多個參照基因座標準化的目標基因座的多個拷貝數估值;和(d)評估拷貝數估值的質量和/或拷貝數調用的統計置信度,從而確定是否能產生目標基因座的拷貝數調用。
2.權利要求1的方法,其中所述目標基因座包括基因或其部分。
3.權利要求2的方法,其中所述基因或其部分包括運動神經元生存蛋白I(SMNl)的外顯子。
4.權利要求1的方法,其中一個或多個參照基因座選自由SMARCC1和SUPT5H組成的組。
5.權利要求3的方法,其中SMNl的外顯子為外顯子7。
6.前述權利要求的任一項的方法,其中步驟(b)的生物測定是擴增目標基因座和一個或多個參照基因座的實時PCR測定。
7.權利要求6的方法,其中所述可檢測信號為熒光信號,并且其中在每一個擴增循環檢測所述目標基因座或一個或多個參照基因座的熒光信號水平。
8.權利要求7的方法,其中步驟(c)包括步驟(i)確定每一個單個生物樣本中目標基因座與一個或多個參照基因座達到預定的熒光信號水平所需的循環次數的差異(ACti);( )產生反映正常目標基因座與一個或多個參照基因座之間的差異的校準器 (ACt);和(ill)通過將在步驟(i)中確定的循環次數的差異ACti針對校準器(ΔGO標準化確定每一個單個生物樣本中目標基因座的拷貝數估值。
9.權利要求8的方法,其中步驟(i)包括首先測量目標基因座和一個或多個參照基因座的每一個達到預定熒光信號水平所需的循環次數(Cti)。
10.權利要求8的方法,其中所述校準器(Afi)是通過多個生物樣本的目標基因座與一個或多個參照基因座之間的ACti的修剪均數定義的。
11.權利要求8-10的任一項的方法,其中每一個單個生物樣本的目標基因座的拷貝數估值是在線性標度上確定的。
12.權利要求8-10的任一項的的方法,其中每一個單個生物樣本的目標基因座的拷貝數估值是在對數標度上確定的。
13.前述權利要求任一項的方法,其中目標基因座的拷貝數估值的質量是基于針對一個或多個參照基因座產生的數據的質量來評估的。
14.前述權利要求任一項的方法,其中所述統計置信度是通過確定測量置信度和/或調用置信度來評估的。
15.權利要求1的方法,其中在步驟(b)中進行的生物測定是重復的。
16.權利要求15的方法,其中拷貝數調用的統計置信度是通過計算重復生物測定的測量置信度和基于多個拷貝數估值的調用置信度來確定的。
17.權利要求15的方法,其中步驟(d)包括如果調用置信度小于預定閾值,則確定不能產生目標基因座的拷貝數調用。
18.檢測與目標基因的異常拷貝數相關的疾病或其攜帶者的方法,所述方法包括(a)提供多個包含至少一個獲自目標個體的生物樣本的生物樣本;(b)對多個生物樣本的每一個進行多個重復生物測定以分析目標基因和一個或多個具有已知拷貝數的參照基因,其中多個重復生物測定的每一個產生可檢測信號,以便目標基因與一個或多個參照基因的可檢測信號的水平與它們各自的拷貝數相關;(c)確定針對一個或多個參照基因標準化的目標基因的拷貝數估值;和(d)評估目標個體的拷貝數估值的質量和/或拷貝數調用的統計置信度,從而確定是否能產生個體的目標基因的拷貝數調用。
19.權利要求18的方法,其還包括確定個體是否患有或處于發生疾病的風險中,或個體是否為所述疾病的攜帶者。
20.權利要求18或19的方法,其中所述疾病為脊髓性肌萎縮(SMA)。
21.權利要求20的方法,其中所述目標基因為運動神經元生存蛋白1(SMN1)。
22.權利要求21的方法,其中步驟(b)中進行的生物測定法為實時PCR測定法。
23.權利要求22的方法,其中步驟(b)包括進行擴增至少SMNl的外顯子7的部分的實時PCR測定。
24.權利要求22或23的方法,其中所述可檢測信號是熒光信號,且在每一個擴增循環上檢測目標基因或一個或多個參照基因的熒光信號水平。
25.權利要求18-24的任一項的方法,其中步驟(c)包括步驟(i)確定每一個單個重復測定中目標基因與一個或多個參照基因之間達到預定的熒光信號水平所需的循環次數的差異(ACti) ; (ii)產生反映正常目標基因與一個或多個參照基因之間的背景差異的校準器(ΛΓ )丨和(iii)通過將在步驟(i)中確定的循環次數的差異ACti針對校準器(A^f)標準化來產生基于每一個單個重復測定的拷貝數估值。
26.權利要求25的方法,其中每一個單個生物樣本的目標基因座的拷貝數估值是在線性標度上確定的。
27.權利要求25的方法,其中其中每一個單個生物樣本的目標基因座的拷貝數估值是在對數標度上確定的。
28.權利要求22-27的任一項的方法,其中評估拷貝數估值的質量包括產生基于循環次數測量及其針對一個或多個參照基因產生的擴增曲線斜率的質量控制度量。
29.權利要求18-28的任一項的方法,其中評估拷貝數估值的質量包括確定多個重復生物測定之間的變化系數。
30.權利要求18-29的任一項的的方法,其中評估拷貝數調用的統計置信度包括確定測量置信度和/或調用置信度。
31.權利要求18的方法,其中拷貝數調用的統計置信度通過計算多個重復生物測定的測量置信度和基于多個拷貝數估值的調用置信度來確定。
32.權利要求30的方法,其中所述測量置信度被確定為圍繞拷貝數估值的最大正態置信區間,所述最大正態置信區間是通過多個重復測定間的拷貝數估值的平均值和符合預定拷貝數限度的平均值標準誤差定義的。
33.權利要求32的方法,其中步驟(d)包括如果測量置信度不超過預定置信度閾值,則確定不能產生拷貝數調用。
34.權利要求30的方法,其中所述調用置信度測定來自鄰近拷貝數分布的拷貝數估值的t檢驗的ρ值。
35.權利要求34的方法,其中步驟(d)包括如果調用置信度小于預定置信度閾值,則確定不能產生拷貝數調用。
36.前述權利要求任一項的方法,其中所述方法還包括平行地分析一個或多個具有預定的目標基因拷貝數的對照樣品。
37.權利要求36的方法,其中在多孔平板上進行生物測定。
38.權利要求37的方法,其中所述方法還包括基于一個或多個對照樣品的質量控制和統計分析確定平板質量控制度量。
39.權利要求38的方法,其中如果一個或多個對照樣品中的任何樣品未通過質量控制或統計置信度評估之一或如果任何單個對照樣品的估值不等于預定拷貝數,則舍棄平板。
40.權利要求18-39的任一項的方法,其中所述至少一種獲自目標個體的生物樣本包含來自細胞、組織、全血、血漿、血清、尿、糞便、唾液、臍帶血、絨膜絨毛取樣、絨膜絨毛取樣培養物、羊水、羊水培養物或經子宮頸洗出液的核酸。
41.權利要求18-40的任一項的方法,其中獲自目標個體的至少一種生物樣本為出生前樣品。
42.用于分析目標基因座的拷貝數的系統,其包括a)接收多個生物樣本的工具,其中每一個單個生物樣本包含目標基因座和一個或多個具有已知拷貝數的參照基因座;b)進行多個生物測定的工具,其中每一個單個生物測定分析每一個單個生物樣本的目標基因座和一個或多個參照基因座并且產生可檢測信號,以便目標基因座和一個或多個參照基因座的可檢測信號的水平與其各自拷貝數相關;c)經配置用以檢測來自每一個單個生物樣本的可檢測信號和確定可檢測信號的水平的確定模塊;d)經配置用以存儲來自確定模塊的信號信息的存儲設備;e)計算模塊,其經改造適合(i)基于存儲設備上存儲的信號信息計算針對一個或多個參照基因座標準化的目標基因座的拷貝數估值和(ii)確定拷貝數估值的質量和/或拷貝數調用的統計置信度;和f)為用戶顯示部分基于計算的內容和數據分析結果的顯示模塊,其中所述內容包括目標基因座的拷貝數調用和/或表示質量控制或統計置信度分析的任一個是否未通過的信號。
43.權利要求42的系統,其中所述生物測定法為實時PCR測定法。
44.權利要求42的系統,其中所述生物測定法為基于陣列的比較型基因組雜交(aCGH)。
45.權利要求42的系統,其中所述生物測定為高通量測序。
46.權利要求43的系統,其中所述確定模塊經配置用以確定每一個擴增循環上的可檢測信號水平且其中所述可檢測信號為熒光信號。
47.權利要求45或46的系統,其中所述計算模塊經改造以適合按照下列步驟計算目標基因座的拷貝數估值(i)確定每一個單個樣本中目標基因座與一個或多個參照基因座達到預定的熒光信號水平所需的循環次數之間的差異(ACti);( )產生反映正常目標基因座與一個或多個參照基因座之間的背景差異的校準器(ACt);和(iii)通過針對校準器(Λ^)標準化在步驟(i)測定的循環次數的差異ACti來計算每一個單個生物樣本中的目標基因座的拷貝數估值。
48.權利要求43-47的任一項的系統,其中所述計算模塊經改造以適合通過至少產生基于循環次數測量及其針對一個或多個參照基因產生的擴增曲線斜率的質量控制度量來確定拷貝數估值的質量。
49.權利要求43-48的任一項的系統,其中所述計算模塊經改造以適合通過至少測定樣品變化系數來確定拷貝數估值的質量。
50.權利要求43-49的任一項的系統,其中所述計算模塊經改造以適合通過至少確定測量置信度并將確定的測量置信度與預定閾值限度相比較來確定拷貝數調用的統計置信度。
51.權利要求43-50的任一項的系統,其中所述計算模塊經改造適合通過至少確定調用置信度并將確定的調用置信度與預定閾值限度相比較來確定拷貝數調用的統計置信度。
52.權利要求43-51的任一項的系統,其中進一步改造計算模塊以確定任何對照樣品是否未通過。
53.權利要求42-52的任一項的系統,其中所述目標基因座包括運動神經元生存蛋白1 (SMNl)的外顯子。
54.一種計算機可讀介質,其將計算機可讀指令記錄在其上以定義軟件模塊,包括用于在計算機上執行方法的計算模塊和顯示模塊,所述方法包括a)利用計算模塊進行計算,(i)基于存儲在存儲設備上的實時PCR數據,針對一個或多個參照基因座標準化的目標基因座的拷貝數估值和(ii)拷貝數估值的質量和/或拷貝數調用的統計置信度;和b)為用戶顯示部分基于計算和數據分析結果的內容,其中所述內容包括目標基因座的拷貝數調用和/或信號標示是否未通過質量控制或統計置信度分析的任一個。
55.權利要求M的計算機可讀介質,其中所述目標基因座包含SMNl的外顯子7或其部分。
56.用于診斷脊髓性肌萎縮(SMA)或其攜帶者的試劑盒,其包括(a)用于擴增SMNl的外顯子7或其部分的一種或多種試劑;(b)用于擴增一個或多個具有已知拷貝數的參照基因座的一種或多種試劑;和(c)根據權利要求55的計算機可讀介質。
全文摘要
用于分析目標基因座的拷貝數、檢測與目標基因的異常拷貝數相關的疾病或其攜帶者的系統及方法。
文檔編號G01N33/48GK102597272SQ201080051034
公開日2012年7月18日 申請日期2010年11月12日 優先權日2009年11月12日
發明者B·亨德里克森, T·肖勒, V·R·埃克麥弗 申請人:艾索特里克斯遺傳實驗室有限責任公司