[0015] 可選地,本發明的實施方式所提供的基因組拷貝數不穩定性的檢測裝置,統計分 析單元對待檢樣本每個基因組窗口的拷貝數變異值進行統計,分析待檢樣本是否存在基因 組拷貝數不穩定性的步驟為:選取待檢樣本i個絕對值最大的拷貝數變異值,對該i個拷貝 數變異值的絕對值進行統計運算,得到ZM值,對ZM值設定閾值進行比較,得出待檢樣本是 否存在基因組拷貝數不穩定性的結論,其中,i為自然數。在該種統計方法中,對該i個拷 貝數變異值的絕對值進行統計運算的方式可以為求和、取平均值或取乘積等。
[0016] 可選地,本發明的實施方式所提供的基因組拷貝數不穩定性的檢測裝置,統計分 析單元對待檢樣本每個基因組窗口的拷貝數變異值進行統計,分析待檢樣本是否存在基因 組拷貝數不穩定性的步驟也可以為:計算待檢樣本所有基因組窗口的拷貝數變異值分布的 標準差ZS值,對ZS值設定閾值進行比較,得出待檢樣本是否存在基因組拷貝數不穩定性的 結論。
[0017] 可選地,本發明的實施方式所提供的基因組拷貝數不穩定性的檢測裝置,統計分 析單元對待檢樣本每個基因組窗口的拷貝數變異值進行統計,分析待檢樣本是否存在基因 組拷貝數不穩定性的步驟還可以為:對待檢樣本所有基因組窗口的拷貝數變異值的絕對值 進行加和,得到ZA值,對ZA值設定閾值進行比較,得出待檢樣本是否存在基因組拷貝數不 穩定性的結論。
[0018] 上述提供了三種對待檢樣本每個基因組窗口的拷貝數變異值進行統計,分析待檢 樣本是否存在基因組拷貝數不穩定性的方法,這三種方法的最終的目的均是通過對待檢樣 本基因組窗口的拷貝數變異值的選擇和統計,確定待檢樣本的基因組拷貝數不穩定性,由 此判別癌癥狀況。這三種方法中,ZM值考慮了變異程度最高的i個窗口,ZS值考慮了所有 窗口的變異程度波動,而ZA值考了所有窗口的變異程度,從不同方面對基因組拷貝數不穩 定性進行評價。
[0019] 進一步優選地,本發明的實施方式所提供的基因組拷貝數不穩定性的檢測裝置的 測序單元中,還包括質檢模塊,其在對待檢者血漿中的游離DNA進行全基因組測序之前,進 行DNA濃度和片段大小的質檢。更進一步優選地,本發明的實施方式所提供的基因組拷貝 數不穩定性的檢測裝置的測序單元中,還包括數據優化模塊和/或數據正態化模塊,其對 測序數據進行優化和/或正態化處理。例如利用正態化模塊對測序數據去除串聯重復序列 干擾、并對GC含量進行校準;以及利用數據優化模塊將經過質檢流程的測序條數與人類參 考基因組進行比對,通過設定單位序列允許錯配個數、是否只留unique序列等。上述增設 質檢模塊、數據優化模塊和/或數據正態化模塊的目的,均是希望提高測序數據用于后續 的計算和統計分析過程中的準確性和可靠性。
[0020] 還進一步優選地,本發明的實施方式所提供的基因組拷貝數不穩定性的檢測裝置 的計算單元中,對每一個基因組窗口分別匹配權重,在計算待檢樣本每個基因組窗口的拷 貝數變異值時,根據所述權重進行校正。對各個基因組窗口權重的分配,可以根據該基因組 窗口的GC含量高低、是否含有基因、是否存在拷貝數變異、是否存在重復序列、有多少單核 苷酸多態性(SNP)位點以及是否存在已知的癌癥相關基因等特點來進行衡量和分配;通過 不同的權重匹配,可增強那些對于篩查癌癥至關重要的基因組窗口的測序數據在后續計算 和統計分析過程中的影響力,使得最終得出的基因組拷貝數不穩定性的顯著性和說明力更 好。
[0021] 此外,本發明的實施方式所提供的基因組拷貝數不穩定性的檢測裝置,還可以進 一步包含樣本制備單元,其用于從待檢者靜脈抽取外周血,并分離得到血漿中的游離DNA。 上述的樣本制備單元可包含靜脈采血針、真空采血管、血液抗凝劑EDTA、血細胞保護劑和血 漿游離DNA純化試劑盒。樣本制備單元的增設,可使本發明的基因組拷貝數不穩定性的檢 測裝置在結構組成和功能上更為完整全面。
[0022] 綜上所述,本發明提供了一種基因組拷貝數不穩定性的檢測裝置,并首次提出了 一個用來篩查癌癥的理想指標:基因組拷貝數不穩定性。本裝置基于分子生物學測序技術 和后續的生物信息學分析,通過檢測血漿中的染色體結構和拷貝數變異,用來判別待檢者 罹患癌癥的風險。只要是符合本篩查裝置的檢測流程(通過抽血、檢測血液中的游離DNA, 以染色體結構和拷貝數變異為指標,來識別是否有癌癥發生),無論是否采用高通量測序技 術或基因芯片技術、是否采用本專利描述的生物信息學分析方法中用到的參數,都應該受 到本專利的保護。
【附圖說明】
[0023] 圖1是實施例3中對抽提后的DNA樣品進彳丁質檢的峰圖;
[0024] 圖2是實施例3中15名待檢者的Zn分布情況統計圖;
[0025] 圖3是實施例3中15名待檢者的ZA值統計圖;
[0026] 圖4是實施例4中15名待檢者的ZM值統計圖;
[0027] 圖5是實施例5中15名待檢者的ZS值統計圖。
【具體實施方式】
[0028] 為使本發明的目的、技術方案和優點更加清楚,下面將結合附圖對本發明的各實 施方式進行詳細的闡述。然而,本領域的普通技術人員可以理解,在本發明各實施方式中, 為了使讀者更好地理解本申請而提出了許多技術細節。但是,即使沒有這些技術細節和基 于以下各實施方式的種種變化和修改,也可以實現本申請各權利要求所要求保護的技術方 案。
[0029] 實施例1基于高通量測序的基因組拷貝數不穩定性的檢測裝置
[0030] 一種基因組拷貝數不穩定性的檢測裝置,包括樣本制備單元、測序單元、計算單元 和統計分析單元,其中:
[0031 ] 樣本制備單元包括一次性靜脈采血針、一次性真空采血管、血液抗凝劑EDTA、血細 胞保護劑、血漿游離DNA純化試劑盒,用于從待檢者靜脈抽取外周血,并分離得到其血漿中 的游離DNA ;
[0032] 測序單元包括質檢模塊、高通量測序模塊以及數據優化模塊,且高通量測序模塊 包括建庫試劑盒和高通量測序試劑盒。質檢模塊用于對待檢者血漿中的游離DNA進行全基 因組測序之前,進行DNA濃度和片段大小的質檢;高通量測序模塊用于對待檢血漿樣本中 的游離DNA進行全基因組高通量測序,得到每個基因組窗口的測序條帶數;數據優化模塊 用于對高通量測序數據進行優化;
[0033] 計算單元包括,包括數據庫模塊和計算模塊,數據庫模塊提供:以一組健康人群血 漿中的游離DNA作為對照樣本群,以所述測序單元相同的方法對所述對照樣本群進行全基 因組測序,所得到對照樣本群每個基因組窗口的平均測序條數占對照樣本群所有基因組窗 口的平均總測序條數的百分比數和對照樣本群每個基因組窗口的平均測序條數占對照樣 本群所有基因組窗口的平均總測序條數的百分比數的標準差。(其中,"對照樣本群每個基 因組窗口的平均測序條數"是指:在對照樣本群的各個不同個體中,某一個基因組窗口的測 序條數的平均值;"對照樣本群所有基因組窗口的平均總測序條數"是指:對照樣本群的各 個不同個體中,所有基因組窗口的總測序條數的平均值。)計算模塊用于:將待檢樣本每個 基因組窗口的測序條數,與數據庫模塊所提供的數據進行比較計算,得出待檢樣本每個基 因組窗口的拷貝數變異值;
[0034] 統計分析單元,對待檢樣本每個基因組窗口的拷貝數變異值進行統計,分析待檢 樣本是否存在基因組拷貝數不穩定性,由此判斷待檢者罹患癌癥的風險。
[0035] 實施例2基于基因芯片的基因組拷貝數不穩定性的檢測裝置
[0036] 本實施例中涉及的基因組拷貝數不穩定性的檢測裝置,其結構組成與實施例1中 的基因組拷貝數不穩定性的檢測裝置基本相同,也包括樣本制備單元、測序單元、計算單元 和統計分析單元,不同之處在于:本實施例的裝置在測序單元中,以基因芯片模塊替代了實 施例1中的高通量測序模塊,且基因芯片模塊包括基因芯片和熒光信號檢測器;所述基因 芯片模塊對待檢血漿樣本中的游離DNA進行雜交測序,并通過熒光信號檢測器檢測每個基 因組窗口的熒光信號強弱值,從而定量出每個基因組窗口的測序條帶數。
[0037] 實施例3采用實施例1裝置進行癌癥篩查的試驗例(統計ZA值)
[0038] 本實施例涉及采用實施例1的基于高通量測序的基因組拷貝數不穩定性的檢測 裝置進行癌癥篩查的試驗例。
[0039] -、對數據庫模塊進行數據庫搭建
[0040] 1.將人類基因組參考序列GRCh38切割成首位相連且不重疊的基因組