本發明涉及生物技術領域中單核苷酸多態性rs149308743在篩查麻風患者中的應用。
背景技術:
麻風,又名Hansen’s病,是一種由麻風分枝桿菌(M.Leprae)引起的傳染性疾病,主要侵犯皮膚和周圍神經。2014年,全球有213,889例新發病例。盡管目前存在有效的治療方法,但在一些國家,特別是發展中國家,麻風仍是致畸和導致一些社會問題的主要原因。為了解麻風易感性的遺傳學基礎,麻風的全基因組關聯分析(GWAS)定位了17個常見變異位點,揭示了固有免疫與適應性免疫在麻風發病中的作用。然而,這些常見的風險變異位點大部分位于非編碼區,僅能夠部分解釋麻風的發病風險。目前,還沒有對蛋白編碼區域的變異,特別是低頻變異和罕見變異,進行系統研究。而這些變異已證實與一些疾病的遺傳易感性相關。
技術實現要素:
本發明所要解決的技術問題是如何篩查麻風患者與檢測麻風易感性。
為解決上述技術問題,本發明首先提供了下述任一用途:
A1)檢測人基因組中rs149308743的多態性(即等位基因)或基因型的物質在制備篩查麻風患者產品中的應用;
A2)檢測人基因組中rs149308743的多態性(即等位基因)或基因型的物質在制備檢測麻風易感性產品中的應用;
A3)檢測人基因組中rs149308743的多態性(即等位基因)或基因型的物質在制備檢測與麻風相關的單核苷酸多態性的產品中的應用;
A4)檢測人基因組中rs149308743的多態性(即等位基因)或基因型的物質在制備鑒定或輔助鑒定與麻風相關的單核苷酸多態性的產品中的應用;
B1)人基因組中rs149308743的多態性(即等位基因)或基因型在制備篩查麻風患者產品中的應用;
B2)人基因組中rs149308743的多態性(即等位基因)或基因型在制備檢測麻風易感性產品中的應用;
B3)檢測人基因組中rs149308743的多態性(即等位基因)或基因型的物質在篩查麻風患者中的應用;
B4)檢測人基因組中rs149308743的多態性(即等位基因)或基因型的物質在檢測麻風易感性中的應用;
B5)檢測人基因組中rs149308743的多態性(即等位基因)或基因型的物質在檢測與麻風相關的單核苷酸多態性的中的應用;
B6)檢測人基因組中rs149308743的多態性(即等位基因)或基因型的物質在鑒定或輔助鑒定與麻風相關的單核苷酸多態性的中的應用;
B7)人基因組中rs149308743的多態性(即等位基因)或基因型在篩查麻風患者中的應用;
B8)人基因組中rs149308743的多態性(即等位基因)或基因型在檢測麻風易感性中的應用。
rs149308743是人染色體9q34.3上的一個二等位多態性的SNP位點,屬于罕見突變(MAF=0.5%),位于CARD9基因的外顯子中,該變異是轉換(C/T,在其互補鏈上則為G/A)。所述rs149308743基因型是CC、TC或TT。所述CC是rs149308743位點為C的純合型,所述TT是rs149308743位點為T的純合型,所述TC是rs149308743位點為C和T的雜合型。所述檢測人基因組中rs149308743的多態性(即等位基因)或基因型具體可為檢測rs149308743的核苷酸種類。
上述用途中,所述檢測人基因組中rs149308743的多態性或基因型的物質可為擴增包括rs149308743在內的基因組DNA片段的PCR引物和/或單堿基延伸引物。所述產品可包括所述PCR引物和/或所述單堿基延伸引物。
上述用途中,所述TC基因型的個體在麻風患者群體中的比例高于對應的基因型在正常人群體中的比例。
上述用途中,所述麻風具體可為中國人群麻風。
為解決上述技術問題,本發明還提供了含有檢測人基因組中rs149308743的多態性或基因型的物質的產品。
本發明所提供的含有檢測人基因組中rs149308743的多態性或基因型的物質的產品,為a)-d)中的任一種產品:
a)檢測與麻風相關的單核苷酸多態性(即等位基因)或基因型的產品;
b)鑒定或輔助鑒定與麻風相關的單核苷酸多態性(即等位基因)或基因型的產品;
c)篩查麻風患者產品;
d)檢測麻風易感性產品。
上述產品中,所述檢測人基因組中rs149308743的多態性或基因型的物質可為擴增包括rs149308743在內的基因組DNA片段的PCR引物和/或單堿基延伸引物。
上述產品中,所述麻風具體可為中國人群麻風。
為解決上述技術問題,本發明還提供了下述M1)或M2)的方法:
M1)篩查麻風患者的方法,包括:檢測待測對象基因組中rs149308743位點的基因型,如rs149308743位點的基因型為TT基因型,所述待測對象為或候選為麻風患者;如rs149308743位點的基因型為TC基因型,所述待測對象為或候選為麻風患者;如rs149308743位點的基因型為CC基因型,所述待測對象為或候選為非麻風患者;
M2)檢測麻風易感性的方法,包括:檢測待測對象基因組中rs149308743位點的基因型,如rs149308743位點的基因型為TT基因型,所述待測對象易感或候選易感麻風;如rs149308743位點的基因型為TC基因型,所述待測對象易感或候選易感麻風;如rs149308743位點的基因型為CC基因型,所述待測對象不易感或候選不易感麻風。
上述方法中,所述麻風具體可為中國人群麻風。
上述方法中,檢測待測對象基因組中rs149308743位點的基因型可采用所述檢測rs149308743的多態性或基因型的物質進行。
實驗證明,rs149308743的風險等位基因為T,該等位基因在麻風患者群體中的比例比該等位基因在正常健康人群中的比例高816.67%。rs149308743的P值是2.09×10-8,且rs149308743的相對危險度是4.75,說明rs149308743是與麻風相關的單核苷酸多態性。rs149308743的三個基因型中,TC基因型的個體在麻風患者群體中的比例高于對應的基因型的個體在正常人群體中的比例,CC基因型的個體在麻風患者群體中的比例低于該基因型的個體在正常人群體中的比例。
本發明在實際應用中,可將檢測rs149308743的多態性(即等位基因)或基因型的物質與其它物質(如檢測其它的與麻風相關的單核苷酸多態性或基因型的物質)聯合在一起制備篩查麻風患者的產品。
其中,檢測人基因組中rs149308743的多態性或基因型的物質可為通過下述至少一種方法確定rs149308743的多態性或基因型所需的試劑和/或儀器:DNA測序、限制性酶切片段長度多態性、單鏈構象多態性、變性高效液相色譜、SNP芯片、TaqMan探針技術和Sequenom MassArray技術。其中,利用Sequenom MassArray技術確定rs149308743的多態性或基因型所需的試劑和/或儀器包括PCR引物對、基于單堿基延伸反應的延伸引物、磷酸酶、樹脂、芯片、MALDI-TOF(matrix-assisted laser desorption/ionization–time of fligh,基質輔助激光解吸附電離飛行時間質譜)和/或Sequenom MassArray技術所需要的其他試劑和儀器;利用TaqMan探針技術確定rs149308743的多態性或基因型所需的試劑和/或儀器包括TaqMan探針、PCR引物對、定量PCR儀、進行基因分型的模塊和/或TaqMan探針技術所需要的其他試劑;SNP芯片包括基于核酸雜交反應的芯片、基于單堿基延伸反應的芯片、基于等位基因特異性引物延伸反應的芯片、基于“一步法”反應的芯片、基于引物連接反應的芯片、基于限制性內切酶反應的芯片、基于蛋白DNA結合反應的芯片和/或基于熒光分子DNA結合反應的芯片。在本發明的一個實施例中,利用的是Illumina公司的Infinium Human Exome BeadChip芯片。
所述產品可為試劑或試劑盒,還可為由試劑或試劑盒和儀器組成的系統,如由引物和DNA測序儀組成的系統,由PCR試劑和DNA測序試劑和DNA測序儀組成的系統,由TaqMan探針、PCR引物對、定量PCR儀和進行基因分型的模塊以及TaqMan探針技術所需要的其他試劑組成的系統,由探針、PCR引物對以及連接酶檢測反應(LDR)所需要的其他試劑和儀器組成的系統,由PCR引物對、單堿基延伸引物、芯片、PCR儀、進行基因分型的模塊和/或Sequenom MassArray技術所需要的其他試劑和儀器組成的系統。
采用PCR引物擴增包括rs149308743在內的基因組DNA片段,以得到的PCR擴增產物為模板,采用單堿基延伸引物進行單堿基延伸反應,對得到的延伸產物的序列進行檢測,確定rs149308743的多態性(即等位基因)和基因型。所述PCR引物在序列上沒有特殊要求,只要能擴增出包括rs149308743在內的基因組DNA片段即可。所述延伸引物根據人基因組中rs149308743上游(不包括該SNP位點)設計,所述延伸引物的最后1位核苷酸對應于人基因組中rs149308743的前1位核苷酸。所述延伸引物也可根據人基因組中rs149308743下游(不包括該SNP位點)設計,所述延伸引物的第1位核苷酸對應于人基因組中rs149308743的后1位核苷酸。
本發明中,所述PCR引物可由rs149308743-F和rs149308743-R組成;
所述rs149308743-F是如下a1)至a4)中的任一種單鏈DNA:
a1)序列表中序列4所示的單鏈DNA;
a2)在a1)的5′端和/或3′端添加一個或幾個核苷酸得到的單鏈DNA;
a3)與a1)或a2)限定的單鏈DNA具有85%以上的同一性的單鏈DNA;
a4)在嚴格條件下與a1)或a2)限定的單鏈DNA雜交的單鏈DNA;
所述rs149308743-R是如下b1)至b4)中的任一種單鏈DNA:
b1)序列表中序列5所示的單鏈DNA;
b2)在b1)的5′端和/或3′端添加一個或幾個核苷酸得到的單鏈DNA;
b3)與b1)或b2)限定的單鏈DNA具有85%以上的同一性的單鏈DNA;
b4)在嚴格條件下與b1)或b2)限定的單鏈DNA雜交的單鏈DNA。
所述單堿基延伸引物(rs149308743-E)可為如下c1)至c4)中的任一種單鏈DNA:
c1)序列表中序列6所示的單鏈DNA;
c2)在c1)的5′端和/或3′端添加一個或幾個核苷酸得到的單鏈DNA;
c3)與c1)或c2)限定的單鏈DNA具有85%以上的同一性的單鏈DNA;
c4)在嚴格條件下與c1)或c2)限定的單鏈DNA雜交的單鏈DNA。
a2)所述在a1)的5′端和/或3′端添加一個或幾個核苷酸得到的單鏈DNA為在序列4所示的單鏈DNA的5′端和/或3′端添加一至十個核苷酸得到的單鏈DNA。b2)所述在b1)的5′端和/或3′端添加一個或幾個核苷酸得到的單鏈DNA為在序列5所示的單鏈DNA的5′端和/或3′端添加一至十個核苷酸得到的單鏈DNA。c2)所述在c1)的5′端和/或3′端添加一個或幾個核苷酸得到的單鏈DNA為在序列6所示的單鏈DNA的5′端和/或3′端添加一至十個核苷酸得到的單鏈DNA。
這里使用的術語“同一性”指與天然核酸序列的序列相似性。“同一性”包括與本發明的序列4、序列5或序列6所示的核苷酸序列具有85%或更高,或90%或更高,或95%或更高同一性的核苷酸序列。同一性可以用肉眼或計算機軟件進行評價。使用計算機軟件,兩個或多個序列之間的同一性可以用百分比(%)表示,其可以用來評價相關序列之間的同一性。
所述嚴格條件是在2×SSC,0.1%SDS的溶液中,在68℃下雜交并洗膜2次,每次5min,又于0.5×SSC,0.1%SDS的溶液中,在68℃下雜交并洗膜2次,每次15min;或,0.1×SSPE(或0.1×SSC)、0.1%SDS的溶液中,65℃條件下雜交并洗膜。
上述85%以上同一性,可為85%、90%或95%以上的同一性。
在本發明的實施例中,rs149308743應用SEQUENOM基因分型平臺即分子量陣列技術,Sequenom檢測過程結合多重PCR技術、MassARRAY iPLEX單堿基延伸技術,和基質輔助激光解吸附電離飛行時間質譜分析質譜技術(matrix-assisted laser desorption/ionization–time of flight,MALDI-TOF)進行分型檢測。將包含SNP位點區域的DNA模板通過PCR技術擴增,再使用特異的延伸引物與PCR產物進行單堿基延伸反應。由于多態性位點堿基不同,延伸產物不同的末端堿基將導致延伸后的產物分子量的差異,因此由SNP多態性引起的堿基差異通過分子量的差異而體現,通過基質輔助激光解吸附電離飛行時間質譜分析質譜技術,檢測延伸產物分子量的大小,應用專用的分析軟件,通過判斷分子量的差異而進行SNP分型檢測。
本發明在一個來自中國人群的樣本(7048例麻風患者和14398例健康者)中發現rs149308743是與麻風相關的單核苷酸多態性。可將檢測rs149308743的多態性(即等位基因)或基因型的物質與其它物質(如檢測其它的與麻風相關的單核苷酸多態性(即等位基因)或基因型的物質)聯合在一起制備篩查麻風患者的產品。
附圖說明
圖1為應用固定效果模型對所有樣本(7,048例病例和14,398例健康對照)進行meta分析的結果。
具體實施方式
下面結合具體實施方式對本發明進行進一步的詳細描述,給出的實施例僅為了闡明本發明,而不是為了限制本發明的范圍。
下述實施例中的實驗方法,如無特殊說明,均為常規方法。
下述實施例中所用的材料、試劑等,如無特殊說明,均可從商業途徑得到。
實施例1、rs145562243、rs149308743、rs76418789、rs146466242、rs55882956、rs780668和rs181206是與麻風相關的單核苷酸多態性
方法:發明人通過三個階段對中國人群中的7,048例麻風患者及14,398例正常對照進行蛋白編碼區域的全基因組關聯分析研究。首先,通過外顯子芯片對1,648例麻風患者和2,318例正常對照的40,491個編碼區域的SNP位點(MAF>0.1%)進行分析(第一階段)。然后在中國北方人群(3,169例麻風患者和9,814例正常對照)中對34個候選SNP位點進行驗證(第二階段)。最后在另外選取的中國南方人群(2,231例麻風患者和2,266例正常對照)以及第一、二階段的所有樣本中對8個候選位點進行驗證(第三階段)。
研究對象
外顯子芯片發現階段(第一階段)的研究對象為中國北方地區的1,670例麻風患者和2,321例正常對照。驗證階段(第二階段)將39個變異位點在中國北方地區的另外的3,169例麻風患者和9,814例正常對照中進行驗證。最終對篩選出的8個變異位點的重復驗證階段(第三階段)選擇的研究對象為中國南方地區的三個獨立樣本以及第一、二階段的所有樣本:(1)四川省906例麻風患者和878例正常對照;(2)云南省829例麻風患者和589例正常對照;(3)貴州省496例麻風患者和799例正常對照。麻風患者和正常對照均為中國漢族人群,并且在地域上是相匹配的。研究對象的臨床信息見表1。
表1、研究對象信息
其中,麻風患者的診斷標準是符合下述4條中的2條或2條以上,或符合第3條者確立診斷:1、皮損伴有感覺障礙及閉汗,或有麻木區;2、周圍神經受累,表現為神經干粗大伴相應功能障礙;3、皮損組織切片或組織液涂片查到麻風桿菌;4、病理可見特征性改變。
正常對照(正常健康人)的診斷標準:無麻風史且無麻風的家族史(包括麻風患者的一級、二級和三級親屬);無其他傳染病病史;無其他自身免疫性疾病病史、系統性疾病病史及家族史。
本研究已通過山東省醫學科學院、山東省皮膚病性病防治研究所倫理審查委員會批準。
分型與質控
選用Illumina公司的Infinium Human Exome BeadChip芯片對1,670例麻風患者及2,321例正常對照進行分型,芯片上共有對1,998例中國人樣本進行全外顯子組測序鑒定出的27,089個(在>1例樣本中存在)非同義編碼區域變異。排除非編碼區變異和MAF<0.1%的變異,對40,491個編碼區域變異進行關聯分析。在驗證階段和重復驗證階段,選用Sequenom MassARRAY system(Agena Bioscience),QuantStudioTM12K Flex Real-Time PCR(Applied Biosystems)和7900HT Fasr Real-Time PCR System(Applied Biosystems)進行分型研究。質控過濾標準如下:排除不確定群體的變異、檢出率<90%且不符合Hardy-Weinberg平衡定律(P<1×10-3)、樣本檢出率<95%的情況。
統計學分析
在第一階段,通過GMMAT-v0.7進行表型和單個變異基因型之間的關聯性分析。在第二、三階段,通過PLINK中的線性回歸模型對MAF>1%的SNPs進行關聯性分析,利用PLINK中Fisher's確切概率法對MAF<1%的SNPs進行關聯分析。利用固定效果模型(通過META-v7.0軟件對MAF>1%的SNPs采用逆方差法,對MAF<1%的SNPs采用z-統計量組合方法進行分析)。對發現階段、驗證階段、重復驗證階段三部分結合起來的數據進行meta分析。同時符合p<1.23×10-6(0.05/40,491)的變異為有統計學意義的外顯子組的變異。對于第二和第三階段的關聯分析,p<0.05并且和發現階段具有相同效應的變異為具有統計學意義的位點。利用Cochran’s Q檢驗對獨立樣本的異質性進行分析,p<0.05認為具有統計學意義。
外顯子組發現階段分析
對1,670例麻風患者和2,321例正常對照的273,028個變異位點進行分型。通過主成分分析確定所有樣本均為中國血統,并且發現在麻風患者和正常對照中具有較好的基因型的匹配。經過一系列樣本和變異位點的過濾,共發現40,491個MAF>0.1%的編碼區變異位點(38,068個非同義突變和2,423個同義突變),后將其在1,648例麻風患者和2,318例健康對照中進行分析。
全外顯子分析發現在MHC區域內有較強的關聯性。去除MHC區域內的所有變異位點后,剩余SNP位點的Q-Q圖符合零分布,表明將人群混雜因素導致的外顯子關聯分析結果的可能性降到最低(lambda value=0.99)。同時,對不同MAF閾值(MAF>0.5%,MAF>1%和MAF>5%)的SNP位點進行Q-Q圖的分析,與上述結果一致。
通過研究發現,五個提示有關聯性(P<1.0×10-3)的編碼區域的變異位點(四個常見變異和一個低頻變異)也包括在之前報道的GWAS發現的位點內。四個常見變異位點與之前報道的SNP位點有較強的連鎖不平衡,僅有低頻變異(IL-23R基因rs76418789)為獨立的。另外,Q-Q圖(去除MHC區域內SNP位點)尾端分布與標準零分布的Q-Q圖存在偏差,表明存在新的關聯位點,有38個新的編碼區域內的變異位點被發現具有關聯性(P<1.0×10-3)。
為進一步研究低頻變異和罕見變異的作用,通過SKAT-O和berden-test的方法對排除MHC區域內的變異位點及已知位點中的5個編碼區域的變異位點和38個新的編碼區域內的變異位點(P<1.0×10-3)后的SNP位點進行分析。兩種方法均證明基因關聯性并非偶然。
驗證階段分析
在中國北方區域內的3,169例麻風患者和9,814例健康對照中對38個新發現的編碼區域的變異位點及之前GWAS發現的一個低頻編碼區域的變異位點進行分型。有34個變異位點可成功分型,其中15個位點在發現階段和驗證階段是一致的(在驗證階段,P<0.05,OR值的效應與發現階段一致),6個位點在發現階段和驗證階段均具有外顯子組分析的統計學意義(P<1.23×10-6)且沒有遺傳異質性,這6個位點分別為:NCKIPSD基因rs145562243(P=1.44×10-8,OR=4.35),CARD9基因rs149308743(P=4.99×10-10,OR=4.75),IL23R基因rs76418789(P=6.28×10-9,OR=1.37),FLG基因rs146466242(P=1.44×10-10,OR=1.45),SLC29A3基因rs780668(P=2.89×10-7,OR=1.14)和IL27基因rs181206(P=5.92×10-7,OR=0.83)(表3)。
另外,兩個編碼區域的變異位點:TYK2基因rs55882956(P=2.75×10-5,OR=1.29)和USP49基因rs75746803(P=3.45×10-6,OR=1.28)在發現階段和驗證階段與麻風均具有一致性和關聯性,但僅剛剛達到外顯子組分析的統計學意義(P<5.0×10-5)(表3)。
其中,對rs145562243、rs149308743、rs76418789、rs146466242、rs55882956、rs780668和rs181206分型采用Sequenom MassARRAY system(Agena Bioscience),QuantStudioTM 12K Flex Real-Time PCR(Applied Biosystems)和7900HT Fasr Real-Time PCR System(Applied Biosystems)進行,具體方法如下:
1.rs181206、rs780668、rs76418789、rs149308743、rs145562243和rs55882956 的分型
rs181206、rs780668、rs76418789、rs149308743、rs145562243和rs55882956這6個SNP應用SEQUENOM基因分型平臺即分子量陣列技術,Sequenom檢測過程結合多重PCR技術、MassARRAY iPLEX單堿基延伸技術,和基質輔助激光解吸附電離飛行時間質譜分析質譜技術(matrix-assisted laser desorption/ionization–time of flight,MALDI-TOF)進行分型檢測。將包含SNP位點區域的DNA模板通過PCR技術擴增,再使用特異的延伸引物與PCR產物(表2)進行單堿基延伸反應。由于多態性位點堿基不同,延伸產物不同的末端堿基將導致延伸后的產物分子量的差異,因此由SNP多態性引起的堿基差異通過分子量的差異而體現,通過基質輔助激光解吸附電離飛行時間質譜分析質譜技術,檢測延伸產物分子量的大小,應用專用的分析軟件,通過判斷分子量的差異而進行SNP
分型檢測。
表2、6個SNP分型引物
操作步驟如下:
6個SNP采用Sequenom MassArray(San Diego,USA)平臺驗證,每個樣本約用到15ngDNA。首先提取外周血的基因組DNA,標準化后,樣本DNA經多重PCR反應擴增包括SNP位點在內的基因組DNA片段,擴增產物進行SNP位點特異性單一鏈的延伸,延伸產物脫鹽并轉移到384孔的芯片上。質譜儀(MALDI-TOF MS)進行等位基因的檢測,采用Sequenom MassARRAY分型軟件對檢測結果進行分析。
1.1、全血標本采集
在知情同意,并簽署書面同意書的情況下采集研究對象外周靜脈血5ml,放置于EDTANa2抗凝管中,置-80℃冰柜儲存備用。
1.2、DNA濃度標準化包括如下步驟:
1)利用NanoDrop-1000濃度測試儀準確測定每一份需要標準化的樣本DNA濃度和OD比值(A260/A280、A260/A230)。
2)建立電子表格,排定每個樣本孔需要加入的DNA編號。
進行Sequenom MassArray分型的樣本,在每96孔板上留有空白對照和重復樣本對照。
3)按照電子表格的順序,加入已測定濃度的DNA。
對于進行Sequenom MassArray分型的樣本要求實驗濃度為12-30ng/μl,一般以18ng/μl為佳。并且A260/A280比值介于1.5-2.0之間、A260/230介于1.5-2.3,如DNA濃度高于18ng/μl則加入適量FG3,將濃度標化至18ng/μl;如DNA濃度低于12ng/μl,則重新從血液提取合格的DNA。濃度在12-18ng/μl間直接加入。
離心后貼上粘性錫箔紙,并用標記筆標上樣本板標號、樣本類型、來源地等信息。
4)在平板離心機上,3000g離心3分鐘,存放于-20℃備用。
1.3、利用各SNP的正向引物和反向引物進行多重PCR
1.4、SNP位點特異性單一鏈的延伸反應
其中,延伸引物根據人基因組中SNP位點上游(不包括該SNP位點)設計,所述延伸引物的最后1位核苷酸對應于人基因組中該SNP位點的前1位核苷酸。
1.5、數據質量控制
1)對分型的SNP進行call rate計算,去除call rate<95%的SNP或等位基因頻率<0.01的SNPs;
2)對SNP進行遺傳平衡檢驗,去除偏離遺傳平衡定律的SNP(對照樣本中Hardy-Weinberg平衡檢驗的P≦0.001)。
3)在Sequenom MassArray系統中查看SNP的分型聚類圖,去除聚類圖分堆不清的SNP。
4)樣本質控:直接去除分型失敗的樣本。
將通過質控的樣本和SNP進行統計分析。
1.6、數據統計分析
利用Plink 1.07軟件對分型成功并通過質控的SNP在病例組和對照組做基因表型相關性分析,用Cochran-Armitage trend檢驗每個樣本的基因型和表型的關聯性,然后用Cochran-Mantel-Haenszel綜合分析所有樣本的基因型和表型的相關性。用Q檢驗來評價個體間的異質性,本次實驗中,以p<0.05作為檢驗水準。多重logistic回歸分析用于檢測區域內的信號的獨立性。檢驗水準α以0.05除以通過質量控制的SNP數目為檢驗水準。Q檢驗用于評估遺傳異質性的顯著性,對SNP校正檢測后P值小于0.05者視為有顯著遺傳異質性。
2.rs146466242的分型
rs146466242應用7900HT/Taqman基因分型系統進行SNP分型。
引物及探針序列為:
正向引物rs146466242-F:CCACATAAACCTGGGTCCTTATTAA(序列19)
反向引物rs146466242-R:GGAAAGATCTGATATCTGTAAAGCAAGTG(序列20)
探針1rs146466242-P1:CTTGGATGATCTTTAC(序列21),5′端由報告熒光染料FAM標記,3′端由淬滅熒光染料NFQ標記
探針2rs146466242-P2:CTTGGATGATCTTAAC(序列22),5′端由報告熒光染料VIC標記,3′端由淬滅熒光染料NFQ標記
操作步驟如下:
分別抽取每個對象的外周靜脈血5ml,提取基因組DNA,分別基因組DNA(DNA濃度均在50-100ng/微升之間)。
實時熒光定量PCR反應的反應體系為:基因組DNA 1μL、2×TaqMan GT master mix(Life technology公司)2.5μL、20×TaqMan探針混合物0.65μL、去離子水0.85μL。將上述反應體系加入96孔PCR板中,采用ABI 7900實時熒光定量PCR儀(Applied Biosystems公司)進行反應。反應條件為:95℃變性30秒,60℃退火1分鐘,40個循環。
上述反應體系中,20×TaqMan探針混合物包括擴增包括rs146466242在內的基因組DNA片段的PCR引物對和成套探針,其中PCR引物對由上述正向引物和反向引物組成,成套探針由探針1和探針2組成。
反應結束后,采用7900System SDS software進行基因型分型,確定各研究對象rs146466242位點的基因型。
重復驗證分析
為了進一步驗證8個非同義變異位點(6個外顯子組分析具有統計學意義的位點和2個提示可能相關的位點)是否具有關聯性,又在中國南方區域選取三個獨立樣本共2,231例麻風患者和2,266例正常對照。然后對所有樣本(7,048例病例和14,398例健康對照)進行分型,其中,對rs145562243、rs149308743、rs76418789、rs146466242、rs55882956、rs780668和rs181206分型采用的具體方法同驗證階段。
然后應用固定效果模型對所有樣本(7,048例病例和14,398例健康對照)進行meta分析。7個編碼突變顯示了三個階段中的一致性關聯,無異質性證據,并且在所有樣本中有外顯子的顯著性差異(P<0.05/40,491=1.23×10-6):兩個罕見突變,位于3p21.31的NCKIPSD基因rs145562243(MAF=0.4%,P=1.71×10-9,OR=4.35)和位于9q34.3的CARD9基因rs149308743(MAF=0.5%,P=2.09×10-8,OR=4.75);三個低頻變異,位于1p31.3的IL23R基因rs76418789(MAF=4.32%,P=1.03×10-10,OR=1.36),位于1q21.3的FLG基因rs146466242(MAF=3.54%,P=3.39×10-12,OR=1.45)和位于19p13.2的TYK2基因rs55882956(MAF=3.63%,P=1.04×10-6,OR=1.30);兩個常見變異,位于10q22.1的SLC29A3基因rs780668(MAF=42%,P=2.17×10-9,OR=1.14)和位于16p11.2的IL27基因rs181206(MAF=15%,P=1.08×10-7,OR=0.83)。雖然在所有獨立性樣本分析中,位于6p21.1的USP49基因rs75746803顯示出一致性,但該位點低于外顯子顯著性水平(MAF=4.8%,P=3.57×10-6,OR=1.25)(表3和圖1)。
7個SNP在7048例麻風患者和14398例正常對照中的基因型頻率如表4和表5所示。結果表明:rs145562243的三個基因型中,TC基因型的個體在麻風患者群體中的比例高于對應的基因型的個體在正常人群體中的比例,CC基因型的個體在麻風患者群體中的比例低于該基因型的個體在正常人群體中的比例;
rs149308743的三個基因型中,TC基因型的個體在麻風患者群體中的比例高于對應的基因型的個體在正常人群體中的比例,CC基因型的個體在麻風患者群體中的比例低于該基因型的個體在正常人群體中的比例;
rs76418789的三個基因型中,AA基因型的個體和AG基因型的個體在麻風患者群體中的比例分別高于對應的基因型的個體在正常人群體中的比例,GG基因型的個體在麻風患者群體中的比例低于該基因型的個體在正常人群體中的比例;
rs146466242的三個基因型中,AA基因型的個體和AT基因型的個體在麻風患者群體中的比例分別高于對應的基因型的個體在正常人群體中的比例,TT基因型的個體在麻風患者群體中的比例低于該基因型的個體在正常人群體中的比例;
rs55882956的三個基因型中,AA基因型的個體和AG基因型的個體在麻風患者群體中的比例分別高于對應的基因型的個體在正常人群體中的比例,GG基因型的個體在麻風患者群體中的比例低于該基因型的個體在正常人群體中的比例;
rs780668的三個基因型中,TT基因型的個體和TC基因型的個體在麻風患者群體中的比例分別高于對應的基因型的個體在正常人群體中的比例,CC基因型的個體在麻風患者群體中的比例低于該基因型的個體在正常人群體中的比例;
rs181206的三個基因型中,AA基因型的個體在麻風患者群體中的比例高于對應的基因型的個體在正常人群體中的比例,GG基因型和AG基因型的個體在麻風患者群體中的比例分別低于對應基因型的個體在正常人群體中的比例。
表4、SNP在麻風患者和正常群體中的基因型個體數
表5、SNP在麻風患者和正常群體中的基因型頻率
表6、SNP在麻風患者群體中的等位基因頻率(%)和與對照相比的變化量
注表4和表5中,rs145562243的基因型中,A1*A1表示CC,A1*A2表示TC,A2*A2表示TT;
rs149308743的基因型中,A1*A1表示CC,A1*A2表示TC,A2*A2表示TT;
rs76418789的基因型中,A1*A1表示AA,A1*A2表示AG,A2*A2表示GG;
rs146466242的基因型中,A1*A1表示AA,A1*A2表示AT,A2*A2表示TT;
rs55882956的基因型中,A1*A1表示AA,A1*A2表示AG,A2*A2表示GG;
rs780668的基因型中,A1*A1表示TT,A1*A2表示TC,A2*A2表示CC;
rs181206的基因型中,A1*A1表示GG,A1*A2表示AG,A2*A2表示AA。
利用二分類的logistic回歸模型(log-additive模型)計算麻風患者群體和正常人群體中基因頻率差異性P值,確定SNP有無顯著性意義,其中基因型采用可加模型進行統計。結果發現,rs145562243、rs149308743、rs76418789、rs146466242、rs55882956、rs780668和rs181206的各等位基因的基因頻率在正常人群體和麻風患者群體中均有顯著性差異。
由表6可知,rs145562243的風險等位基因為T,該等位基因在麻風患者中的基因頻率為0.0039,在正常對照中的基因頻率為0.0004,與正常對照相比,該等位基因在麻風患者中增加了875.00%;rs149308743的風險等位基因為T,該等位基因在麻風患者中的基因頻率為0.0055,在正常對照中的基因頻率為0.0006,與正常對照相比,該等位基因在麻風患者中增加了816.67%;rs76418789的風險等位基因為A,該等位基因在麻風患者中的基因頻率為0.0610,在正常對照中的基因頻率為0.0432,與正常對照相比,該等位基因在麻風患者中增加了41.20%;rs146466242的風險等位基因為A,該等位基因在麻風患者中的基因頻率為0.0558,在正常對照中的基因頻率為0.0354,與正常對照相比,該等位基因在麻風患者中增加了57.63%;rs55882956的風險等位基因為A,該等位基因在麻風患者中的基因頻率為0.0529,在正常對照中的基因頻率為0.0363,與正常對照相比,該等位基因在麻風患者中增加了45.73%;rs780668的風險等位基因為T,該等位基因在麻風患者中的基因頻率為0.4648,在正常對照中的基因頻率為0.4213,與正常對照相比,該等位基因在麻風患者中增加了10.33%;rs181206的風險等位基因為A,該等位基因在麻風患者中的基因頻率為0.8829,在正常對照中的基因頻率為0.8503,與正常對照相比,該等位基因在麻風患者中增加了3.83%。
實驗結果表明,rs145562243、rs149308743、rs76418789、rs146466242、rs55882956、rs780668和rs181206的多態性或基因型或等位基因頻率可用于麻風患者的篩查。
另外,通過對樣本中年齡和性別信息進行聯合檢驗,分析了年齡和性別比例的影響。兩個常見突變和三個低頻突變SNPs中的(年齡和性別)未調整和調整的ORs非常相似(表7),揭示了這些SNPs的關聯性分析中,性別和年齡有較小的作用。
表7、性別和年齡對兩個常見突變和三個低頻突變SNP影響的分析結果
次等位基因/主等位基因;
OR,OR根據次等為基因計算;
(f)指固定效應模型。
<110> 山東省皮膚病性病防治研究所
<160> 22
<170> PatentIn version 3.5
<210> 1
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 1
acgttggatg accactccca gaggccatca 30
<210> 2
<211> 29
<212> DNA
<213> 人工序列
<220>
<223>
<400> 2
acgttggatg ttcccagatc ccaccacag 29
<210> 3
<211> 17
<212> DNA
<213> 人工序列
<220>
<223>
<400> 3
ttcaccacag cctcgcc 17
<210> 4
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 4
acgttggatg cctgcggtag ttctcaaaac 30
<210> 5
<211> 29
<212> DNA
<213> 人工序列
<220>
<223>
<400> 5
acgttggatg ttcccccttc tccaggacg 29
<210> 6
<211> 20
<212> DNA
<213> 人工序列
<220>
<223>
<400> 6
gctcaaaact ctctttgagg 20
<210> 7
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 7
acgttggatg tcaggcaaca tgacttgcac 30
<210> 8
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 8
acgttggatg gaggaagtga cctacctctt 30
<210> 9
<211> 18
<212> DNA
<213> 人工序列
<220>
<223>
<400> 9
ctatgtaggt gagcttcc 18
<210> 10
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 10
acgttggatg atcttccaag ccatgggcac 30
<210> 11
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 11
acgttggatg tggtgacaga gtacgtggag 30
<210> 12
<211> 20
<212> DNA
<213> 人工序列
<220>
<223>
<400> 12
atgtttggct gcggagggag 20
<210> 13
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 13
acgttggatg gccatcttca tggtgataac 30
<210> 14
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 14
acgttggatg tgaggatcac catgcagaca 30
<210> 15
<211> 16
<212> DNA
<213> 人工序列
<220>
<223>
<400> 15
gtgaaggtgg acactt 16
<210> 16
<211> 28
<212> DNA
<213> 人工序列
<220>
<223>
<400> 16
acgttggatg ccctgggtcc ccagccct 28
<210> 17
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 17
acgttggatg gagcgtctct gcttcatctc 30
<210> 18
<211> 15
<212> DNA
<213> 人工序列
<220>
<223>
<400> 18
agcccttcca tgccc 15
<210> 19
<211> 25
<212> DNA
<213> 人工序列
<220>
<223>
<400> 19
ccacataaac ctgggtcctt attaa 25
<210> 20
<211> 29
<212> DNA
<213> 人工序列
<220>
<223>
<400> 20
ggaaagatct gatatctgta aagcaagtg 29
<210> 21
<211> 16
<212> DNA
<213> 人工序列
<220>
<223>
<400> 21
cttggatgat ctttac 16
<210> 22
<211> 16
<212> DNA
<213> 人工序列
<220>
<223>
<400> 22
cttggatgat cttaac 16