構建可變區測序文庫的方法及確定可變區核酸序列的方法
【技術領域】
[0001] 本發明涉及生物技術領域,具體的,本發明涉及構建可變區測序文庫的方法及確 定可變區核酸序列的方法。
【背景技術】
[0002] 淋己細胞腫瘤是由淋己細胞惡性克隆性增值引起的嚴重危害人體健康的惡性疾 病,其中包括淋己細胞白血病,骨髓瘤及各種淋己瘤。隨著診療技術水平的增高,淋己細胞 腫瘤的診療水平方面得到了質的飛躍。其中微小殘留的檢測在淋己細胞腫瘤的分層、評判 療效、估計患者預后、指導治療方案的制定、提高患者生存治愈方面起到了關鍵的作用。
[0003] 微小殘留病(M畑,Minimal resi化al disease)是指經誘導化療獲得完全緩解 (CR,Complete Remission)后或是骨髓移植治療后體內殘留的微量腫瘤細胞。隨著化療、 特異祀向治療、造血干細胞移植技術的不斷提高,淋己細胞腫瘤的治療效果日益改善,然而 復發仍是困擾送類疾病治愈的一個難題,微小殘留病是復發的主要根源。因此,對患者進行 定期MRD檢測,具有重要臨床意義。
[0004] 然而,目前對于MRD檢測的手段仍有待改進。
【發明內容】
[0005] 本發明旨在至少解決現有技術中存在的技術問題之一。為此,根據本發明的實施 例,本發明提出了用于構建測序文庫的方法W及確定可變區核酸序列的方法,其能夠有效 用于MRD檢測。
[0006] 在本發明的第一方面,本發明提出了一種構建可變區測序文庫的方法。根據本發 明的實施例,該方法包括;W含有編碼所述可變區的核酸樣本作為模板,擴增編碼所述可變 區的核酸,W便獲得第一擴增產物;在所述第一擴增產物的兩個末端至少之一添加測序接 頭,W便獲得所述可變區測序文庫,其中,所述擴增采用下列引物:第一引物,所述第一引物 包括至少一個特異性識別V區的框架區編碼序列的核酸分子;W及第二引物,所述第二引 物包括至少一個特異性識別J區或C區編碼序列的核酸分子。由此,利用根據本發明實施例 的方法,能夠有效地構建核酸樣本中所包含的可變區的測序文庫,不需要設計特異性的PCR 引物或者探針,節省了人力、時間等。
[0007] 根據本發明的實施例,所述第一引物和所述第二引物進一步含有適于擴增測序接 頭的核酸序列。由此,可W便于通過擴增引入測序接頭,從而提高了構建測序文庫的效率。
[0008] 根據本發明的實施例,所述含有編碼所述可變區的核酸樣本為從動物外周血或骨 髓中提取的全基因組DNA或總RNA的至少一部分。由此,可W有效地針對動物個體構建其 可變區測序文庫。
[0009] 根據本發明的實施例,所述動物為血液癌癥患者或者曾經患有血液癌癥的人。由 此,可W有效地通過監控可變區組成的變化,監控癌癥病人尤其是血液癌癥病人的病情發 展。
[0010] 根據本發明的實施例,所述核酸樣本包括全基因組DM或總RNA的至少一部分,對 于RNA樣品,在進行所述擴增之前,預先利用第Η引物對所述總RNA的至少一部分進行反轉 錄處理,其中,所述第Η引物包括至少一個特異性識別恒定區編碼序列的核酸分子。根據本 發明的實施例,所述恒定區為BCR或TCR的恒定區。由此,可W有效地確定個體表達的可變 區的序列。需要說明的是,在本文中所使用的術語"BCR"表示Β細胞受體,"TCR"表示Τ細 胞受體。
[0011] 根據本發明的實施例,所述可變區為BCR或TCR的可變區。
[0012] 根據本發明的實施例,在所述第一擴增產物的兩個末端至少之一添加測序接頭是 通過下列進行的:將所述第一擴增產物進行末端修復,W便獲得經過末端修復的第一擴增 產物;W及將所述經過末端修復的第一擴增產物與含有測序接頭序列的寡核巧酸連接,W 便獲得具有接頭的第一擴增產物。由此,可W有效地提高構建測序文庫的效率。
[0013] 根據本發明的實施例,所述含有測序接頭序列的寡核巧酸進一步包括標簽序列。 由此,可W有效地針對多個不同的樣本構建測序文庫,在后續測序中可W同時進行測序,可 W通過標簽非常方便地對樣本來源進行區分。
[0014] 根據本發明的實施例,對所述具有接頭的第一擴增產物進行二次擴增,W便獲得 第二擴增產物,其中,所述第二擴增產物構成所述測序文庫。
[0015] 根據本發明的實施例,在所述第一擴增產物的兩個末端至少之一添加測序接頭是 通過下列進行的;采用含有測序接頭序列的引物對所述第一擴增產物進行二次擴增,W便 獲得具有接頭的第二擴增產物,其中,所述第二擴增產物構成所述測序文庫。
[0016] 根據本發明的實施例,所述含有測序接頭序列的引物進一步含有標簽序列。由此, 可W有效地針對多個不同的樣本構建測序文庫,在后續測序中可W同時進行測序,可W通 過標簽非常方便地對樣本來源進行區分。
[0017] 根據本發明的實施例,編碼所述可變區的核酸為Τ細胞受體目鏈,所述第一引物 包括SEQ ID NO :1-32所示核酸序列,所述第二引物包括SEQ ID NO :33-45所示核酸序列。 具體序列如下表所示:
[0018]
[0019]
[0020] 根據本發明的另一些實施例,編碼所述可變區的核酸為人類免疫球蛋白重鏈,所 述第一引物包括SEQ ID NO :46-57所示核酸序列,所述第二引物為SEQ ID NO ;58所示核酸 序列。具體序列如下表所示:
[0021]
[0022]
[002引在本發明的第二方面,本發明提出了一種確定可變區核酸序列的方法。根據本發 明的實施例,該方法包括:根據前面所述的構建可變區測序文庫的方法,構建可變區測序文 庫;W及對所述可變區測序文庫進行測序,W便確定可變區核酸序列。由此,利用該方法,能 夠有效地確定可變區核酸序列,且不需要設計特異性的PCR引物或者探針,節省了人力、時 間等。并且,當確定的可變區核酸序列來源于TCR或BCR的可變區時,利用獲得的可變區核 酸序列,能夠有效確定TCR或BCR的V-J譜多樣性、TCR或BCR的克隆頻率,進而W可變區 核酸序列中豐度超過健康群體的最高克隆豐度的克隆為標志物,可W根據患者不同階段的 可變區核酸序列中的標志物的情況,有效實現對患者進行MRD檢測,確定患者的預后效果, 實現動態監控患者的免疫系統的變化和重建情況,且靈敏度高,適用性廣,操作簡便,易于 標準化。
[0024] 根據本發明實施例的確定可變區核酸序列的方法還可W包括W下附加技術特 征:
[0025] 根據本發明的實施例,所述測序為高通量測序。
[0026] 根據本發明的實施例,所述高通量測序是利用選自化369、11369、454、50^0、1〇11 Torrent W及CG測序平臺的至少之一進行的。
[0027] 根據本發明的實施例,所述可變區為TCR或BCR的可變區。
[0028] 根據本發明的實施例,進一步包括:基于所述可變區核酸序列,確定TCR或BCR的 V-J譜多樣性。
[0029] 根據本發明的實施例,所述V-J譜多樣性是通過分別確定各種V基因和J基因的 頻率W及各種V-J組合的頻率來確定的。
[0030] 根據本發明的實施例,針對患者,確定可變區核酸序列,并且確定各克隆的豐度, 選擇豐度超過預定闊值的克隆作為標志物,所述豐度是通過下列公式確定的:
[0031] 每個克隆的相對豐度=該克隆的reads數/所有克隆的總reads數。其中,需要 說明的是,在本文中所使用的術語"克隆"是指確定為可變區的核酸序列。
[0032] 根據本發明的實施例,所述預定闊值是基于健康群體確定的。
[0033] 根據本發明的實施例,所述預定闊值是基于健康人群外周血或骨髓中存在的最高 克隆豐度確定的。由此,當標志物克隆的頻率低于預定闊值時,可W確定所述患者的免疫重 建情況和預后效果好;反之,則可W確定所述患者的免疫重建情況和預后效果差。根據本發 明的一個具體示例,所述預定闊值為5%,送是因為,健康個體的抗原受體基因圖譜一般情 況下多樣性非常高,不會出現某種基因頻率高于5%的情況。
[0034] 根據本發明的實施例,進一步包括:確定患者不同階段的可變區核酸序列,并且對 不同階段的可變區核酸序列中的標志物進行分析。由此,有效實現對患者進行MRD檢測,實 現動態監