本發(fā)明涉及生物技術(shù)領(lǐng)域中單核苷酸多態(tài)性rs780668在篩查麻風(fēng)患者中的應(yīng)用。
背景技術(shù):
麻風(fēng),又名Hansen’s病,是一種由麻風(fēng)分枝桿菌(M.Leprae)引起的傳染性疾病,主要侵犯皮膚和周圍神經(jīng)。2014年,全球有213,889例新發(fā)病例。盡管目前存在有效的治療方法,但在一些國(guó)家,特別是發(fā)展中國(guó)家,麻風(fēng)仍是致畸和導(dǎo)致一些社會(huì)問(wèn)題的主要原因。為了解麻風(fēng)易感性的遺傳學(xué)基礎(chǔ),麻風(fēng)的全基因組關(guān)聯(lián)分析(GWAS)定位了17個(gè)常見(jiàn)變異位點(diǎn),揭示了固有免疫與適應(yīng)性免疫在麻風(fēng)發(fā)病中的作用。然而,這些常見(jiàn)的風(fēng)險(xiǎn)變異位點(diǎn)大部分位于非編碼區(qū),僅能夠部分解釋麻風(fēng)的發(fā)病風(fēng)險(xiǎn)。目前,還沒(méi)有對(duì)蛋白編碼區(qū)域的變異,特別是低頻變異和罕見(jiàn)變異,進(jìn)行系統(tǒng)研究。而這些變異已證實(shí)與一些疾病的遺傳易感性相關(guān)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問(wèn)題是如何篩查麻風(fēng)患者與檢測(cè)麻風(fēng)易感性。
為解決上述技術(shù)問(wèn)題,本發(fā)明首先提供了下述任一用途:
A1)檢測(cè)人基因組中rs780668的多態(tài)性(即等位基因)或基因型的物質(zhì)在制備篩查麻風(fēng)患者產(chǎn)品中的應(yīng)用;
A2)檢測(cè)人基因組中rs780668的多態(tài)性(即等位基因)或基因型的物質(zhì)在制備檢測(cè)麻風(fēng)易感性產(chǎn)品中的應(yīng)用;
A3)檢測(cè)人基因組中rs780668的多態(tài)性(即等位基因)或基因型的物質(zhì)在制備檢測(cè)與麻風(fēng)相關(guān)的單核苷酸多態(tài)性的產(chǎn)品中的應(yīng)用;
A4)檢測(cè)人基因組中rs780668的多態(tài)性(即等位基因)或基因型的物質(zhì)在制備鑒定或輔助鑒定與麻風(fēng)相關(guān)的單核苷酸多態(tài)性的產(chǎn)品中的應(yīng)用;
B1)人基因組中rs780668的多態(tài)性(即等位基因)或基因型在制備篩查麻風(fēng)患者產(chǎn)品中的應(yīng)用;
B2)人基因組中rs780668的多態(tài)性(即等位基因)或基因型在制備檢測(cè)麻風(fēng)易感性產(chǎn)品中的應(yīng)用;
B3)檢測(cè)人基因組中rs780668的多態(tài)性(即等位基因)或基因型的物質(zhì)在篩查麻風(fēng)患者中的應(yīng)用;
B4)檢測(cè)人基因組中rs780668的多態(tài)性(即等位基因)或基因型的物質(zhì)在檢測(cè)麻風(fēng)易感性中的應(yīng)用;
B5)檢測(cè)人基因組中rs780668的多態(tài)性(即等位基因)或基因型的物質(zhì)在檢測(cè)與麻風(fēng)相關(guān)的單核苷酸多態(tài)性的中的應(yīng)用;
B6)檢測(cè)人基因組中rs780668的多態(tài)性(即等位基因)或基因型的物質(zhì)在鑒定或輔助鑒定與麻風(fēng)相關(guān)的單核苷酸多態(tài)性的中的應(yīng)用;
B7)人基因組中rs780668的多態(tài)性(即等位基因)或基因型在篩查麻風(fēng)患者中的應(yīng)用;
B8)人基因組中rs780668的多態(tài)性(即等位基因)或基因型在檢測(cè)麻風(fēng)易感性中的應(yīng)用。
rs780668是人染色體10q22.1上的一個(gè)二等位多態(tài)性的SNP位點(diǎn),屬于常見(jiàn)變異(MAF=42%),位于SLC29A3基因的外顯子中,該變異是轉(zhuǎn)換(T/C,在其互補(bǔ)鏈上則為A/G)。所述rs780668基因型是TT、TC或CC。所述TT是rs780668位點(diǎn)為T的純合型,所述CC是rs780668位點(diǎn)為C的純合型,所述TC是rs780668位點(diǎn)為T和C的雜合型。所述檢測(cè)人基因組中rs780668的多態(tài)性(即等位基因)或基因型具體可為檢測(cè)rs780668的核苷酸種類。
上述用途中,所述檢測(cè)人基因組中rs780668的多態(tài)性或基因型的物質(zhì)可為擴(kuò)增包括rs780668在內(nèi)的基因組DNA片段的PCR引物和/或單堿基延伸引物。
上述用途中,所述TT和所述TC基因型的個(gè)體在麻風(fēng)患者群體中的比例分別高于對(duì)應(yīng)的基因型在正常人群體中的比例。所述產(chǎn)品可包括所述PCR引物和/或所述單堿基延伸引物。
上述用途中,所述麻風(fēng)具體可為中國(guó)人群麻風(fēng)。
為解決上述技術(shù)問(wèn)題,本發(fā)明還提供了含有檢測(cè)人基因組中rs780668的多態(tài)性或基因型的物質(zhì)的產(chǎn)品。
本發(fā)明所提供的含有檢測(cè)人基因組中rs780668的多態(tài)性或基因型的物質(zhì)的產(chǎn)品,為a)-d)中的任一種產(chǎn)品:
a)檢測(cè)與麻風(fēng)相關(guān)的單核苷酸多態(tài)性(即等位基因)或基因型的產(chǎn)品;
b)鑒定或輔助鑒定與麻風(fēng)相關(guān)的單核苷酸多態(tài)性(即等位基因)或基因型的產(chǎn)品;
c)篩查麻風(fēng)患者產(chǎn)品;
d)檢測(cè)麻風(fēng)易感性產(chǎn)品。
上述產(chǎn)品中,所述檢測(cè)人基因組中rs780668的多態(tài)性或基因型的物質(zhì)可為擴(kuò)增包括rs780668在內(nèi)的基因組DNA片段的PCR引物和/或單堿基延伸引物。
上述產(chǎn)品中,所述麻風(fēng)具體可為中國(guó)人群麻風(fēng)。
為解決上述技術(shù)問(wèn)題,本發(fā)明還提供了下述M1)或M2)的方法:
M1)篩查麻風(fēng)患者的方法,包括:檢測(cè)待測(cè)對(duì)象基因組中rs780668位點(diǎn)的基因型,如rs780668位點(diǎn)的基因型為TT基因型,所述待測(cè)對(duì)象為或候選為麻風(fēng)患者;如rs780668位點(diǎn)的基因型為TC基因型,所述待測(cè)對(duì)象為或候選為麻風(fēng)患者;如rs780668位點(diǎn)的基因型為CC基因型,所述待測(cè)對(duì)象為或候選為非麻風(fēng)患者;
M2)檢測(cè)麻風(fēng)易感性的方法,包括:檢測(cè)待測(cè)對(duì)象基因組中rs780668位點(diǎn)的基因型,如rs780668位點(diǎn)的基因型為TT基因型,所述待測(cè)對(duì)象易感或候選易感麻風(fēng);如rs780668位點(diǎn)的基因型為TC基因型,所述待測(cè)對(duì)象易感或候選易感麻風(fēng);如rs780668位點(diǎn)的基因型為CC基因型,所述待測(cè)對(duì)象不易感或候選不易感麻風(fēng)。
上述方法中,所述麻風(fēng)具體可為中國(guó)人群麻風(fēng)。
上述方法中,檢測(cè)待測(cè)對(duì)象基因組中rs780668位點(diǎn)的基因型可采用所述檢測(cè)rs780668的多態(tài)性或基因型的物質(zhì)進(jìn)行。
實(shí)驗(yàn)證明,rs780668的風(fēng)險(xiǎn)等位基因?yàn)門,該等位基因在麻風(fēng)患者群體中的比例比該等位基因在正常健康人群中的比例高10.33%。rs780668的P值是2.17×10-9,且rs780668的相對(duì)危險(xiǎn)度是1.14,說(shuō)明rs780668是與麻風(fēng)相關(guān)的單核苷酸多態(tài)性。rs780668的三個(gè)基因型中,TT基因型的個(gè)體和TC基因型的個(gè)體在麻風(fēng)患者群體中的比例分別高于對(duì)應(yīng)的基因型的個(gè)體在正常人群體中的比例,CC基因型的個(gè)體在麻風(fēng)患者群體中的比例低于該基因型的個(gè)體在正常人群體中的比例。
本發(fā)明在實(shí)際應(yīng)用中,可將檢測(cè)rs780668的多態(tài)性(即等位基因)或基因型的物質(zhì)與其它物質(zhì)(如檢測(cè)其它的與麻風(fēng)相關(guān)的單核苷酸多態(tài)性或基因型的物質(zhì))聯(lián)合在一起制備篩查麻風(fēng)患者的產(chǎn)品。
其中,檢測(cè)人基因組中rs780668的多態(tài)性或基因型的物質(zhì)可為通過(guò)下述至少一種方法確定rs780668的多態(tài)性或基因型所需的試劑和/或儀器:DNA測(cè)序、限制性酶切片段長(zhǎng)度多態(tài)性、單鏈構(gòu)象多態(tài)性、變性高效液相色譜、SNP芯片、TaqMan探針技術(shù)和Sequenom MassArray技術(shù)。其中,利用Sequenom MassArray技術(shù)確定rs780668的多態(tài)性或基因型所需的試劑和/或儀器包括PCR引物對(duì)、基于單堿基延伸反應(yīng)的延伸引物、磷酸酶、樹(shù)脂、芯片、MALDI-TOF(matrix-assisted laser desorption/ionization–time of fligh,基質(zhì)輔助激光解吸附電離飛行時(shí)間質(zhì)譜)和/或Sequenom MassArray技術(shù)所需要的其他試劑和儀器;利用TaqMan探針技術(shù)確定rs780668的多態(tài)性或基因型所需的試劑和/或儀器包括TaqMan探針、PCR引物對(duì)、定量PCR儀、進(jìn)行基因分型的模塊和/或TaqMan探針技術(shù)所需要的其他試劑;SNP芯片包括基于核酸雜交反應(yīng)的芯片、基于單堿基延伸反應(yīng)的芯片、基于等位基因特異性引物延伸反應(yīng)的芯片、基于“一步法”反應(yīng)的芯片、基于引物連接反應(yīng)的芯片、基于限制性內(nèi)切酶反應(yīng)的芯片、基于蛋白DNA結(jié)合反應(yīng)的芯片和/或基于熒光分子DNA結(jié)合反應(yīng)的芯片。在本發(fā)明的一個(gè)實(shí)施例中,利用的是Illumina公司的Infinium Human Exome BeadChip芯片。
所述產(chǎn)品可為試劑或試劑盒,還可為由試劑或試劑盒和儀器組成的系統(tǒng),如由引物和DNA測(cè)序儀組成的系統(tǒng),由PCR試劑和DNA測(cè)序試劑和DNA測(cè)序儀組成的系統(tǒng),由TaqMan探針、PCR引物對(duì)、定量PCR儀和進(jìn)行基因分型的模塊以及TaqMan探針技術(shù)所需要的其他試劑組成的系統(tǒng),由探針、PCR引物對(duì)以及連接酶檢測(cè)反應(yīng)(LDR)所需要的其他試劑和儀器組成的系統(tǒng),由PCR引物對(duì)、單堿基延伸引物、芯片、PCR儀、進(jìn)行基因分型的模塊和/或Sequenom MassArray技術(shù)所需要的其他試劑和儀器組成的系統(tǒng)。
采用PCR引物擴(kuò)增包括rs780668在內(nèi)的基因組DNA片段,以得到的PCR擴(kuò)增產(chǎn)物為模板,采用單堿基延伸引物進(jìn)行單堿基延伸反應(yīng),對(duì)得到的延伸產(chǎn)物的序列進(jìn)行檢測(cè),確定rs780668的多態(tài)性(即等位基因)和基因型。所述PCR引物在序列上沒(méi)有特殊要求,只要能擴(kuò)增出包括rs780668在內(nèi)的基因組DNA片段即可。所述延伸引物可根據(jù)人基因組中rs780668上游(不包括該SNP位點(diǎn))設(shè)計(jì),所述延伸引物的最后1位核苷酸對(duì)應(yīng)于人基因組中rs780668的前1位核苷酸。所述延伸引物也可根據(jù)人基因組中rs780668下游(不包括該SNP位點(diǎn))設(shè)計(jì),所述延伸引物的第1位核苷酸對(duì)應(yīng)于人基因組中rs780668的后1位核苷酸。
本發(fā)明中,所述PCR引物可由rs780668-F和rs780668-R組成;
所述rs780668-F是如下a1)至a4)中的任一種單鏈DNA:
a1)序列表中序列13所示的單鏈DNA;
a2)在a1)的5′端和/或3′端添加一個(gè)或幾個(gè)核苷酸得到的單鏈DNA;
a3)與a1)或a2)限定的單鏈DNA具有85%以上的同一性的單鏈DNA;
a4)在嚴(yán)格條件下與a1)或a2)限定的單鏈DNA雜交的單鏈DNA;
所述rs780668-R是如下b1)至b4)中的任一種單鏈DNA:
b1)序列表中序列14所示的單鏈DNA;
b2)在b1)的5′端和/或3′端添加一個(gè)或幾個(gè)核苷酸得到的單鏈DNA;
b3)與b1)或b2)限定的單鏈DNA具有85%以上的同一性的單鏈DNA;
b4)在嚴(yán)格條件下與b1)或b2)限定的單鏈DNA雜交的單鏈DNA。
所述單堿基延伸引物(rs780668-E)可為如下c1)至c4)中的任一種單鏈DNA:
c1)序列表中序列15所示的單鏈DNA;
c2)在c1)的5′端和/或3′端添加一個(gè)或幾個(gè)核苷酸得到的單鏈DNA;
c3)與c1)或c2)限定的單鏈DNA具有85%以上的同一性的單鏈DNA;
c4)在嚴(yán)格條件下與c1)或c2)限定的單鏈DNA雜交的單鏈DNA。
a2)所述在a1)的5′端和/或3′端添加一個(gè)或幾個(gè)核苷酸得到的單鏈DNA為在序列13所示的單鏈DNA的5′端和/或3′端添加一至十個(gè)核苷酸得到的單鏈DNA。b2)所述在b1)的5′端和/或3′端添加一個(gè)或幾個(gè)核苷酸得到的單鏈DNA為在序列14所示的單鏈DNA的5′端和/或3′端添加一至十個(gè)核苷酸得到的單鏈DNA。c2)所述在c1)的5′端和/或3′端添加一個(gè)或幾個(gè)核苷酸得到的單鏈DNA為在序列15所示的單鏈DNA的5′端和/或3′端添加一至十個(gè)核苷酸得到的單鏈DNA。
這里使用的術(shù)語(yǔ)“同一性”指與天然核酸序列的序列相似性?!巴恍浴卑ㄅc本發(fā)明的序列13、序列14或序列15所示的核苷酸序列具有85%或更高,或90%或更高,或95%或更高同一性的核苷酸序列。同一性可以用肉眼或計(jì)算機(jī)軟件進(jìn)行評(píng)價(jià)。使用計(jì)算機(jī)軟件,兩個(gè)或多個(gè)序列之間的同一性可以用百分比(%)表示,其可以用來(lái)評(píng)價(jià)相關(guān)序列之間的同一性。
所述嚴(yán)格條件是在2×SSC,0.1%SDS的溶液中,在68℃下雜交并洗膜2次,每次5min,又于0.5×SSC,0.1%SDS的溶液中,在68℃下雜交并洗膜2次,每次15min;或,0.1×SSPE(或0.1×SSC)、0.1%SDS的溶液中,65℃條件下雜交并洗膜。
上述85%以上同一性,可為85%、90%或95%以上的同一性。
在本發(fā)明的實(shí)施例中,rs780668應(yīng)用SEQUENOM基因分型平臺(tái)即分子量陣列技術(shù),SequenomSNP檢測(cè)過(guò)程結(jié)合多重PCR技術(shù)、MassARRAY iPLEX單堿基延伸技術(shù),和基質(zhì)輔助激光解吸附電離飛行時(shí)間質(zhì)譜分析質(zhì)譜技術(shù)(matrix-assisted laser desorption/ionization–time of flight,MALDI-TOF)進(jìn)行分型檢測(cè)。將包含SNP位點(diǎn)區(qū)域的DNA模板通過(guò)PCR技術(shù)擴(kuò)增,再使用特異的延伸引物與PCR產(chǎn)物進(jìn)行單堿基延伸反應(yīng)。由于多態(tài)性位點(diǎn)堿基不同,延伸產(chǎn)物不同的末端堿基將導(dǎo)致延伸后的產(chǎn)物分子量的差異,因此由SNP多態(tài)性引起的堿基差異通過(guò)分子量的差異而體現(xiàn),通過(guò)基質(zhì)輔助激光解吸附電離飛行時(shí)間質(zhì)譜分析質(zhì)譜技術(shù),檢測(cè)延伸產(chǎn)物分子量的大小,應(yīng)用專用的分析軟件,通過(guò)判斷分子量的差異而進(jìn)行SNP分型檢測(cè)。
本發(fā)明在一個(gè)來(lái)自中國(guó)人群的樣本(7048例麻風(fēng)患者和14398例健康者)中發(fā)現(xiàn)rs780668是與麻風(fēng)相關(guān)的單核苷酸多態(tài)性??蓪z測(cè)rs780668的多態(tài)性(即等位基因)或基因型的物質(zhì)與其它物質(zhì)(如檢測(cè)其它的與麻風(fēng)相關(guān)的單核苷酸多態(tài)性(即等位基因)或基因型的物質(zhì))聯(lián)合在一起制備篩查麻風(fēng)患者的產(chǎn)品。
附圖說(shuō)明
圖1為應(yīng)用固定效果模型對(duì)所有樣本(7,048例病例和14,398例健康對(duì)照)進(jìn)行meta分析的結(jié)果。
具體實(shí)施方式
下面結(jié)合具體實(shí)施方式對(duì)本發(fā)明進(jìn)行進(jìn)一步的詳細(xì)描述,給出的實(shí)施例僅為了闡明本發(fā)明,而不是為了限制本發(fā)明的范圍。
下述實(shí)施例中的實(shí)驗(yàn)方法,如無(wú)特殊說(shuō)明,均為常規(guī)方法。
下述實(shí)施例中所用的材料、試劑等,如無(wú)特殊說(shuō)明,均可從商業(yè)途徑得到。
實(shí)施例1、rs145562243、rs149308743、rs76418789、rs146466242、rs55882956、rs780668和rs181206是與麻風(fēng)相關(guān)的單核苷酸多態(tài)性
方法:發(fā)明人通過(guò)三個(gè)階段對(duì)中國(guó)人群中的7,048例麻風(fēng)患者及14,398例正常對(duì)照進(jìn)行蛋白編碼區(qū)域的全基因組關(guān)聯(lián)分析研究。首先,通過(guò)外顯子芯片對(duì)1,648例麻風(fēng)患者和2,318例正常對(duì)照的40,491個(gè)編碼區(qū)域的SNP位點(diǎn)(MAF>0.1%)進(jìn)行分析(第一階段)。然后在中國(guó)北方人群(3,169例麻風(fēng)患者和9,814例正常對(duì)照)中對(duì)34個(gè)候選SNP位點(diǎn)進(jìn)行驗(yàn)證(第二階段)。最后在另外選取的中國(guó)南方人群(2,231例麻風(fēng)患者和2,266例正常對(duì)照)以及第一、二階段的所有樣本中對(duì)8個(gè)候選位點(diǎn)進(jìn)行驗(yàn)證(第三階段)。
研究對(duì)象
外顯子芯片發(fā)現(xiàn)階段(第一階段)的研究對(duì)象為中國(guó)北方地區(qū)的1,670例麻風(fēng)患者和2,321例正常對(duì)照。驗(yàn)證階段(第二階段)將39個(gè)變異位點(diǎn)在中國(guó)北方地區(qū)的另外的3,169例麻風(fēng)患者和9,814例正常對(duì)照中進(jìn)行驗(yàn)證。最終對(duì)篩選出的8個(gè)變異位點(diǎn)的重復(fù)驗(yàn)證階段(第三階段)選擇的研究對(duì)象為中國(guó)南方地區(qū)的三個(gè)獨(dú)立樣本以及第一、二階段的所有樣本:(1)四川省906例麻風(fēng)患者和878例正常對(duì)照;(2)云南省829例麻風(fēng)患者和589例正常對(duì)照;(3)貴州省496例麻風(fēng)患者和799例正常對(duì)照。麻風(fēng)患者和正常對(duì)照均為中國(guó)漢族人群,并且在地域上是相匹配的。研究對(duì)象的臨床信息見(jiàn)表1。
表1、研究對(duì)象信息
其中,麻風(fēng)患者的診斷標(biāo)準(zhǔn)是符合下述4條中的2條或2條以上,或符合第3條者確立診斷:1、皮損伴有感覺(jué)障礙及閉汗,或有麻木區(qū);2、周圍神經(jīng)受累,表現(xiàn)為神經(jīng)干粗大伴相應(yīng)功能障礙;3、皮損組織切片或組織液涂片查到麻風(fēng)桿菌;4、病理可見(jiàn)特征性改變。
正常對(duì)照(正常健康人)的診斷標(biāo)準(zhǔn):無(wú)麻風(fēng)史且無(wú)麻風(fēng)的家族史(包括麻風(fēng)患者的一級(jí)、二級(jí)和三級(jí)親屬);無(wú)其他傳染病病史;無(wú)其他自身免疫性疾病病史、系統(tǒng)性疾病病史及家族史。
本研究已通過(guò)山東省醫(yī)學(xué)科學(xué)院、山東省皮膚病性病防治研究所倫理審查委員會(huì)批準(zhǔn)。
分型與質(zhì)控
選用Illumina公司的Infinium Human Exome BeadChip芯片對(duì)1,670例麻風(fēng)患者及2,321例正常對(duì)照進(jìn)行分型,芯片上共有對(duì)1,998例中國(guó)人樣本進(jìn)行全外顯子組測(cè)序鑒定出的27,089個(gè)(在>1例樣本中存在)非同義編碼區(qū)域變異。排除非編碼區(qū)變異和MAF<0.1%的變異,對(duì)40,491個(gè)編碼區(qū)域變異進(jìn)行關(guān)聯(lián)分析。在驗(yàn)證階段和重復(fù)驗(yàn)證階段,選用Sequenom MassARRAY system(Agena Bioscience),QuantStudioTM12K Flex Real-Time PCR(Applied Biosystems)和7900HT Fasr Real-Time PCR System(Applied Biosystems)進(jìn)行分型研究。質(zhì)控過(guò)濾標(biāo)準(zhǔn)如下:排除不確定群體的變異、檢出率<90%且不符合Hardy-Weinberg平衡定律(P<1×10-3)、樣本檢出率<95%的情況。
統(tǒng)計(jì)學(xué)分析
在第一階段,通過(guò)GMMAT-v0.7進(jìn)行表型和單個(gè)變異基因型之間的關(guān)聯(lián)性分析。在第二、三階段,通過(guò)PLINK中的線性回歸模型對(duì)MAF>1%的SNPs進(jìn)行關(guān)聯(lián)性分析,利用PLINK中Fisher's確切概率法對(duì)MAF<1%的SNPs進(jìn)行關(guān)聯(lián)分析。利用固定效果模型(通過(guò)META-v7.0軟件對(duì)MAF>1%的SNPs采用逆方差法,對(duì)MAF<1%的SNPs采用z-統(tǒng)計(jì)量組合方法進(jìn)行分析)。對(duì)發(fā)現(xiàn)階段、驗(yàn)證階段、重復(fù)驗(yàn)證階段三部分結(jié)合起來(lái)的數(shù)據(jù)進(jìn)行meta分析。同時(shí)符合p<1.23×10-6(0.05/40,491)的變異為有統(tǒng)計(jì)學(xué)意義的外顯子組的變異。對(duì)于第二和第三階段的關(guān)聯(lián)分析,p<0.05并且和發(fā)現(xiàn)階段具有相同效應(yīng)的變異為具有統(tǒng)計(jì)學(xué)意義的位點(diǎn)。利用Cochran’s Q檢驗(yàn)對(duì)獨(dú)立樣本的異質(zhì)性進(jìn)行分析,p<0.05認(rèn)為具有統(tǒng)計(jì)學(xué)意義。
外顯子組發(fā)現(xiàn)階段分析
對(duì)1,670例麻風(fēng)患者和2,321例正常對(duì)照的273,028個(gè)變異位點(diǎn)進(jìn)行分型。通過(guò)主成分分析確定所有樣本均為中國(guó)血統(tǒng),并且發(fā)現(xiàn)在麻風(fēng)患者和正常對(duì)照中具有較好的基因型的匹配。經(jīng)過(guò)一系列樣本和變異位點(diǎn)的過(guò)濾,共發(fā)現(xiàn)40,491個(gè)MAF>0.1%的編碼區(qū)變異位點(diǎn)(38,068個(gè)非同義突變和2,423個(gè)同義突變),后將其在1,648例麻風(fēng)患者和2,318例健康對(duì)照中進(jìn)行分析。
全外顯子分析發(fā)現(xiàn)在MHC區(qū)域內(nèi)有較強(qiáng)的關(guān)聯(lián)性。去除MHC區(qū)域內(nèi)的所有變異位點(diǎn)后,剩余SNP位點(diǎn)的Q-Q圖符合零分布,表明將人群混雜因素導(dǎo)致的外顯子關(guān)聯(lián)分析結(jié)果的可能性降到最低(lambda value=0.99)。同時(shí),對(duì)不同MAF閾值(MAF>0.5%,MAF>1%和MAF>5%)的SNP位點(diǎn)進(jìn)行Q-Q圖的分析,與上述結(jié)果一致。
通過(guò)研究發(fā)現(xiàn),五個(gè)提示有關(guān)聯(lián)性(P<1.0×10-3)的編碼區(qū)域的變異位點(diǎn)(四個(gè)常見(jiàn)變異和一個(gè)低頻變異)也包括在之前報(bào)道的GWAS發(fā)現(xiàn)的位點(diǎn)內(nèi)。四個(gè)常見(jiàn)變異位點(diǎn)與之前報(bào)道的SNP位點(diǎn)有較強(qiáng)的連鎖不平衡,僅有低頻變異(IL-23R基因rs76418789)為獨(dú)立的。另外,Q-Q圖(去除MHC區(qū)域內(nèi)SNP位點(diǎn))尾端分布與標(biāo)準(zhǔn)零分布的Q-Q圖存在偏差,表明存在新的關(guān)聯(lián)位點(diǎn),有38個(gè)新的編碼區(qū)域內(nèi)的變異位點(diǎn)被發(fā)現(xiàn)具有關(guān)聯(lián)性(P<1.0×10-3)。
為進(jìn)一步研究低頻變異和罕見(jiàn)變異的作用,通過(guò)SKAT-O和berden-test的方法對(duì)排除MHC區(qū)域內(nèi)的變異位點(diǎn)及已知位點(diǎn)中的5個(gè)編碼區(qū)域的變異位點(diǎn)和38個(gè)新的編碼區(qū)域內(nèi)的變異位點(diǎn)(P<1.0×10-3)后的SNP位點(diǎn)進(jìn)行分析。兩種方法均證明基因關(guān)聯(lián)性并非偶然。
驗(yàn)證階段分析
在中國(guó)北方區(qū)域內(nèi)的3,169例麻風(fēng)患者和9,814例健康對(duì)照中對(duì)38個(gè)新發(fā)現(xiàn)的編碼區(qū)域的變異位點(diǎn)及之前GWAS發(fā)現(xiàn)的一個(gè)低頻編碼區(qū)域的變異位點(diǎn)進(jìn)行分型。有34個(gè)變異位點(diǎn)可成功分型,其中15個(gè)位點(diǎn)在發(fā)現(xiàn)階段和驗(yàn)證階段是一致的(在驗(yàn)證階段,P<0.05,OR值的效應(yīng)與發(fā)現(xiàn)階段一致),6個(gè)位點(diǎn)在發(fā)現(xiàn)階段和驗(yàn)證階段均具有外顯子組分析的統(tǒng)計(jì)學(xué)意義(P<1.23×10-6)且沒(méi)有遺傳異質(zhì)性,這6個(gè)位點(diǎn)分別為:NCKIPSD基因rs145562243(P=1.44×10-8,OR=4.35),CARD9基因rs149308743(P=4.99×10-10,OR=4.75),IL23R基因rs76418789(P=6.28×10-9,OR=1.37),F(xiàn)LG基因rs146466242(P=1.44×10-10,OR=1.45),SLC29A3基因rs780668(P=2.89×10-7,OR=1.14)和IL27基因rs181206(P=5.92×10-7,OR=0.83)(表3)。
另外,兩個(gè)編碼區(qū)域的變異位點(diǎn):TYK2基因rs55882956(P=2.75×10-5,OR=1.29)和USP49基因rs75746803(P=3.45×10-6,OR=1.28)在發(fā)現(xiàn)階段和驗(yàn)證階段與麻風(fēng)均具有一致性和關(guān)聯(lián)性,但僅剛剛達(dá)到外顯子組分析的統(tǒng)計(jì)學(xué)意義(P<5.0×10-5)(表3)。
其中,對(duì)rs145562243、rs149308743、rs76418789、rs146466242、rs55882956、rs780668和rs181206分型采用Sequenom MassARRAY system(Agena Bioscience),QuantStudioTM 12K Flex Real-Time PCR(Applied Biosystems)和7900HT Fasr Real-Time PCR System(Applied Biosystems)進(jìn)行,具體方法如下:
1.rs181206、rs780668、rs76418789、rs149308743、rs145562243和rs55882956的分型
rs181206、rs780668、rs76418789、rs149308743、rs145562243和rs55882956這6個(gè)SNP應(yīng)用SEQUENOM基因分型平臺(tái)即分子量陣列技術(shù),SequenomSNP檢測(cè)過(guò)程結(jié)合多重PCR技術(shù)、MassARRAY iPLEX單堿基延伸技術(shù),和基質(zhì)輔助激光解吸附電離飛行時(shí)間質(zhì)譜分析質(zhì)譜技術(shù)(matrix-assisted laser desorption/ionization–time of flight,MALDI-TOF)進(jìn)行分型檢測(cè)。將包含SNP位點(diǎn)區(qū)域的DNA模板通過(guò)PCR技術(shù)擴(kuò)增,再使用特異的延伸引物與PCR產(chǎn)物(表2)進(jìn)行單堿基延伸反應(yīng)。由于多態(tài)性位點(diǎn)堿基不同,延伸產(chǎn)物不同的末端堿基將導(dǎo)致延伸后的產(chǎn)物分子量的差異,因此由SNP多態(tài)性引起的堿基差異通過(guò)分子量的差異而體現(xiàn),通過(guò)基質(zhì)輔助激光解吸附電離飛行時(shí)間質(zhì)譜分析質(zhì)譜技術(shù),檢測(cè)延伸產(chǎn)物分子量的大小,應(yīng)用專用的分析軟件,通過(guò)判斷分子量的差異而進(jìn)行SNP
分型檢測(cè)。
表2、6個(gè)SNP分型引物
操作步驟如下:
6個(gè)SNP采用Sequenom MassArray(San Diego,USA)平臺(tái)驗(yàn)證,每個(gè)樣本約用到15ngDNA。首先提取外周血的基因組DNA,標(biāo)準(zhǔn)化后,樣本DNA經(jīng)多重PCR反應(yīng)擴(kuò)增包括SNP位點(diǎn)在內(nèi)的基因組DNA片段,擴(kuò)增產(chǎn)物進(jìn)行SNP位點(diǎn)特異性單一鏈的延伸,延伸產(chǎn)物脫鹽并轉(zhuǎn)移到384孔的芯片上。質(zhì)譜儀(MALDI-TOF MS)進(jìn)行等位基因的檢測(cè),采用Sequenom MassARRAY分型軟件對(duì)檢測(cè)結(jié)果進(jìn)行分析。
1.1、全血標(biāo)本采集
在知情同意,并簽署書面同意書的情況下采集研究對(duì)象外周靜脈血5ml,放置于EDTANa2抗凝管中,置-80℃冰柜儲(chǔ)存?zhèn)溆谩?/p>
1.2、DNA濃度標(biāo)準(zhǔn)化包括如下步驟:
1)利用NanoDrop-1000濃度測(cè)試儀準(zhǔn)確測(cè)定每一份需要標(biāo)準(zhǔn)化的樣本DNA濃度和OD比值(A260/A280、A260/A230)。
2)建立電子表格,排定每個(gè)樣本孔需要加入的DNA編號(hào)。
進(jìn)行Sequenom MassArray分型的樣本,在每96孔板上留有空白對(duì)照和重復(fù)樣本對(duì)照。
3)按照電子表格的順序,加入已測(cè)定濃度的DNA。
對(duì)于進(jìn)行Sequenom MassArray分型的樣本要求實(shí)驗(yàn)濃度為12-30ng/μl,一般以18ng/μl為佳。并且A260/A280比值介于1.5-2.0之間、A260/230介于1.5-2.3,如DNA濃度高于18ng/μl則加入適量FG3,將濃度標(biāo)化至18ng/μl;如DNA濃度低于12ng/μl,則重新從血液提取合格的DNA。濃度在12-18ng/μl間直接加入。
離心后貼上粘性錫箔紙,并用標(biāo)記筆標(biāo)上樣本板標(biāo)號(hào)、樣本類型、來(lái)源地等信息。
4)在平板離心機(jī)上,3000g離心3分鐘,存放于-20℃?zhèn)溆谩?/p>
1.3、利用各SNP的正向引物和反向引物進(jìn)行多重PCR
1.4、SNP位點(diǎn)特異性單一鏈的延伸反應(yīng)
其中,延伸引物根據(jù)人基因組中SNP位點(diǎn)上游(不包括該SNP位點(diǎn))設(shè)計(jì),所述延伸引物的最后1位核苷酸對(duì)應(yīng)于人基因組中該SNP位點(diǎn)的前1位核苷酸。
1.5、數(shù)據(jù)質(zhì)量控制
1)對(duì)分型的SNP進(jìn)行call rate計(jì)算,去除call rate<95%的SNP或等位基因頻率<0.01的SNPs;
2)對(duì)SNP進(jìn)行遺傳平衡檢驗(yàn),去除偏離遺傳平衡定律的SNP(對(duì)照樣本中Hardy-Weinberg平衡檢驗(yàn)的P≦0.001)。
3)在Sequenom MassArray系統(tǒng)中查看SNP的分型聚類圖,去除聚類圖分堆不清的SNP。
4)樣本質(zhì)控:直接去除分型失敗的樣本。
將通過(guò)質(zhì)控的樣本和SNP進(jìn)行統(tǒng)計(jì)分析。
1.6、數(shù)據(jù)統(tǒng)計(jì)分析
利用Plink 1.07軟件對(duì)分型成功并通過(guò)質(zhì)控的SNP在病例組和對(duì)照組做基因表型相關(guān)性分析,用Cochran-Armitage trend檢驗(yàn)每個(gè)樣本的基因型和表型的關(guān)聯(lián)性,然后用Cochran-Mantel-Haenszel綜合分析所有樣本的基因型和表型的相關(guān)性。用Q檢驗(yàn)來(lái)評(píng)價(jià)個(gè)體間的異質(zhì)性,本次實(shí)驗(yàn)中,以p<0.05作為檢驗(yàn)水準(zhǔn)。多重logistic回歸分析用于檢測(cè)區(qū)域內(nèi)的信號(hào)的獨(dú)立性。檢驗(yàn)水準(zhǔn)α以0.05除以通過(guò)質(zhì)量控制的SNP數(shù)目為檢驗(yàn)水準(zhǔn)。Q檢驗(yàn)用于評(píng)估遺傳異質(zhì)性的顯著性,對(duì)SNP校正檢測(cè)后P值小于0.05者視為有顯著遺傳異質(zhì)性。
2.rs146466242的分型
rs146466242應(yīng)用7900HT/Taqman基因分型系統(tǒng)進(jìn)行SNP分型。
引物及探針序列為:
正向引物rs146466242-F:CCACATAAACCTGGGTCCTTATTAA(序列19)
反向引物rs146466242-R:GGAAAGATCTGATATCTGTAAAGCAAGTG(序列20)
探針1rs146466242-P1:CTTGGATGATCTTTAC(序列21),5′端由報(bào)告熒光染料FAM標(biāo)記,3′端由淬滅熒光染料NFQ標(biāo)記
探針2rs146466242-P2:CTTGGATGATCTTAAC(序列22),5′端由報(bào)告熒光染料VIC標(biāo)記,3′端由淬滅熒光染料NFQ標(biāo)記
操作步驟如下:
分別抽取每個(gè)對(duì)象的外周靜脈血5ml,提取基因組DNA,分別基因組DNA(DNA濃度均在50-100ng/微升之間)。
實(shí)時(shí)熒光定量PCR反應(yīng)的反應(yīng)體系為:基因組DNA 1μL、2×TaqMan GT master mix(Life technology公司)2.5μL、20×TaqMan探針混合物0.65μL、去離子水0.85μL。將上述反應(yīng)體系加入96孔PCR板中,采用ABI 7900實(shí)時(shí)熒光定量PCR儀(Applied Biosystems公司)進(jìn)行反應(yīng)。反應(yīng)條件為:95℃變性30秒,60℃退火1分鐘,40個(gè)循環(huán)。
上述反應(yīng)體系中,20×TaqMan探針混合物包括擴(kuò)增包括rs146466242在內(nèi)的基因組DNA片段的PCR引物對(duì)和成套探針,其中PCR引物對(duì)由上述正向引物和反向引物組成,成套探針由探針1和探針2組成。
反應(yīng)結(jié)束后,采用7900System SDS software進(jìn)行基因型分型,確定各研究對(duì)象rs146466242位點(diǎn)的基因型。
重復(fù)驗(yàn)證分析
為了進(jìn)一步驗(yàn)證8個(gè)非同義變異位點(diǎn)(6個(gè)外顯子組分析具有統(tǒng)計(jì)學(xué)意義的位點(diǎn)和2個(gè)提示可能相關(guān)的位點(diǎn))是否具有關(guān)聯(lián)性,又在中國(guó)南方區(qū)域選取三個(gè)獨(dú)立樣本共2,231例麻風(fēng)患者和2,266例正常對(duì)照。然后對(duì)所有樣本(7,048例病例和14,398例健康對(duì)照)進(jìn)行分型,其中,對(duì)rs145562243、rs149308743、rs76418789、rs146466242、rs55882956、rs780668和rs181206分型采用的具體方法同驗(yàn)證階段。
然后應(yīng)用固定效果模型對(duì)所有樣本(7,048例病例和14,398例健康對(duì)照)進(jìn)行meta分析。7個(gè)編碼突變顯示了三個(gè)階段中的一致性關(guān)聯(lián),無(wú)異質(zhì)性證據(jù),并且在所有樣本中有外顯子的顯著性差異(P<0.05/40,491=1.23×10-6):兩個(gè)罕見(jiàn)突變,位于3p21.31的NCKIPSD基因rs145562243(MAF=0.4%,P=1.71×10-9,OR=4.35)和位于9q34.3的CARD9基因rs149308743(MAF=0.5%,P=2.09×10-8,OR=4.75);三個(gè)低頻變異,位于1p31.3的IL23R基因rs76418789(MAF=4.32%,P=1.03×10-10,OR=1.36),位于1q21.3的FLG基因rs146466242(MAF=3.54%,P=3.39×10-12,OR=1.45)和位于19p13.2的TYK2基因rs55882956(MAF=3.63%,P=1.04×10-6,OR=1.30);兩個(gè)常見(jiàn)變異,位于10q22.1的SLC29A3基因rs780668(MAF=42%,P=2.17×10-9,OR=1.14)和位于16p11.2的IL27基因rs181206(MAF=15%,P=1.08×10-7,OR=0.83)。雖然在所有獨(dú)立性樣本分析中,位于6p21.1的USP49基因rs75746803顯示出一致性,但該位點(diǎn)低于外顯子顯著性水平(MAF=4.8%,P=3.57×10-6,OR=1.25)(表3和圖1)。
7個(gè)SNP在7048例麻風(fēng)患者和14398例正常對(duì)照中的基因型頻率如表4和表5所示。結(jié)果表明:rs145562243的三個(gè)基因型中,TC基因型的個(gè)體在麻風(fēng)患者群體中的比例高于對(duì)應(yīng)的基因型的個(gè)體在正常人群體中的比例,CC基因型的個(gè)體在麻風(fēng)患者群體中的比例低于該基因型的個(gè)體在正常人群體中的比例;
rs149308743的三個(gè)基因型中,TC基因型的個(gè)體在麻風(fēng)患者群體中的比例高于對(duì)應(yīng)的基因型的個(gè)體在正常人群體中的比例,CC基因型的個(gè)體在麻風(fēng)患者群體中的比例低于該基因型的個(gè)體在正常人群體中的比例;
rs76418789的三個(gè)基因型中,AA基因型的個(gè)體和AG基因型的個(gè)體在麻風(fēng)患者群體中的比例分別高于對(duì)應(yīng)的基因型的個(gè)體在正常人群體中的比例,GG基因型的個(gè)體在麻風(fēng)患者群體中的比例低于該基因型的個(gè)體在正常人群體中的比例;
rs146466242的三個(gè)基因型中,AA基因型的個(gè)體和AT基因型的個(gè)體在麻風(fēng)患者群體中的比例分別高于對(duì)應(yīng)的基因型的個(gè)體在正常人群體中的比例,TT基因型的個(gè)體在麻風(fēng)患者群體中的比例低于該基因型的個(gè)體在正常人群體中的比例;
rs55882956的三個(gè)基因型中,AA基因型的個(gè)體和AG基因型的個(gè)體在麻風(fēng)患者群體中的比例分別高于對(duì)應(yīng)的基因型的個(gè)體在正常人群體中的比例,GG基因型的個(gè)體在麻風(fēng)患者群體中的比例低于該基因型的個(gè)體在正常人群體中的比例;
rs780668的三個(gè)基因型中,TT基因型的個(gè)體和TC基因型的個(gè)體在麻風(fēng)患者群體中的比例分別高于對(duì)應(yīng)的基因型的個(gè)體在正常人群體中的比例,CC基因型的個(gè)體在麻風(fēng)患者群體中的比例低于該基因型的個(gè)體在正常人群體中的比例;
rs181206的三個(gè)基因型中,AA基因型的個(gè)體在麻風(fēng)患者群體中的比例高于對(duì)應(yīng)的基因型的個(gè)體在正常人群體中的比例,GG基因型和AG基因型的個(gè)體在麻風(fēng)患者群體中的比例分別低于對(duì)應(yīng)基因型的個(gè)體在正常人群體中的比例。
表4、SNP在麻風(fēng)患者和正常群體中的基因型個(gè)體數(shù)
表5、SNP在麻風(fēng)患者和正常群體中的基因型頻率
表6、SNP在麻風(fēng)患者群體中的等位基因頻率(%)和與對(duì)照相比的變化量
注表4和表5中,rs145562243的基因型中,A1*A1表示CC,A1*A2表示TC,A2*A2表示TT;
rs149308743的基因型中,A1*A1表示CC,A1*A2表示TC,A2*A2表示TT;
rs76418789的基因型中,A1*A1表示AA,A1*A2表示AG,A2*A2表示GG;
rs146466242的基因型中,A1*A1表示AA,A1*A2表示AT,A2*A2表示TT;
rs55882956的基因型中,A1*A1表示AA,A1*A2表示AG,A2*A2表示GG;
rs780668的基因型中,A1*A1表示TT,A1*A2表示TC,A2*A2表示CC;
rs181206的基因型中,A1*A1表示GG,A1*A2表示AG,A2*A2表示AA。
利用二分類的logistic回歸模型(log-additive模型)計(jì)算麻風(fēng)患者群體和正常人群體中基因頻率差異性P值,確定SNP有無(wú)顯著性意義,其中基因型采用可加模型進(jìn)行統(tǒng)計(jì)。結(jié)果發(fā)現(xiàn),rs145562243、rs149308743、rs76418789、rs146466242、rs55882956、rs780668和rs181206的各等位基因的基因頻率在正常人群體和麻風(fēng)患者群體中均有顯著性差異。
由表6可知,rs145562243的風(fēng)險(xiǎn)等位基因?yàn)門,該等位基因在麻風(fēng)患者中的基因頻率為0.0039,在正常對(duì)照中的基因頻率為0.0004,與正常對(duì)照相比,該等位基因在麻風(fēng)患者中增加了875.00%;rs149308743的風(fēng)險(xiǎn)等位基因?yàn)門,該等位基因在麻風(fēng)患者中的基因頻率為0.0055,在正常對(duì)照中的基因頻率為0.0006,與正常對(duì)照相比,該等位基因在麻風(fēng)患者中增加了816.67%;rs76418789的風(fēng)險(xiǎn)等位基因?yàn)锳,該等位基因在麻風(fēng)患者中的基因頻率為0.0610,在正常對(duì)照中的基因頻率為0.0432,與正常對(duì)照相比,該等位基因在麻風(fēng)患者中增加了41.20%;rs146466242的風(fēng)險(xiǎn)等位基因?yàn)锳,該等位基因在麻風(fēng)患者中的基因頻率為0.0558,在正常對(duì)照中的基因頻率為0.0354,與正常對(duì)照相比,該等位基因在麻風(fēng)患者中增加了57.63%;rs55882956的風(fēng)險(xiǎn)等位基因?yàn)锳,該等位基因在麻風(fēng)患者中的基因頻率為0.0529,在正常對(duì)照中的基因頻率為0.0363,與正常對(duì)照相比,該等位基因在麻風(fēng)患者中增加了45.73%;rs780668的風(fēng)險(xiǎn)等位基因?yàn)門,該等位基因在麻風(fēng)患者中的基因頻率為0.4648,在正常對(duì)照中的基因頻率為0.4213,與正常對(duì)照相比,該等位基因在麻風(fēng)患者中增加了10.33%;rs181206的風(fēng)險(xiǎn)等位基因?yàn)锳,該等位基因在麻風(fēng)患者中的基因頻率為0.8829,在正常對(duì)照中的基因頻率為0.8503,與正常對(duì)照相比,該等位基因在麻風(fēng)患者中增加了3.83%。
實(shí)驗(yàn)結(jié)果表明,rs145562243、rs149308743、rs76418789、rs146466242、rs55882956、rs780668和rs181206的多態(tài)性或基因型或等位基因頻率可用于麻風(fēng)患者的篩查。
另外,通過(guò)對(duì)樣本中年齡和性別信息進(jìn)行聯(lián)合檢驗(yàn),分析了年齡和性別比例的影響。兩個(gè)常見(jiàn)突變和三個(gè)低頻突變SNPs中的(年齡和性別)未調(diào)整和調(diào)整的ORs非常相似(表7),揭示了這些SNPs的關(guān)聯(lián)性分析中,性別和年齡有較小的作用。
表7、性別和年齡對(duì)兩個(gè)常見(jiàn)突變和三個(gè)低頻突變SNP影響的分析結(jié)果
次等位基因/主等位基因;
OR,OR根據(jù)次等為基因計(jì)算;
(f)指固定效應(yīng)模型。
<110> 山東省皮膚病性病防治研究所
<160> 22
<170> PatentIn version 3.5
<210> 1
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 1
acgttggatg accactccca gaggccatca 30
<210> 2
<211> 29
<212> DNA
<213> 人工序列
<220>
<223>
<400> 2
acgttggatg ttcccagatc ccaccacag 29
<210> 3
<211> 17
<212> DNA
<213> 人工序列
<220>
<223>
<400> 3
ttcaccacag cctcgcc 17
<210> 4
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 4
acgttggatg cctgcggtag ttctcaaaac 30
<210> 5
<211> 29
<212> DNA
<213> 人工序列
<220>
<223>
<400> 5
acgttggatg ttcccccttc tccaggacg 29
<210> 6
<211> 20
<212> DNA
<213> 人工序列
<220>
<223>
<400> 6
gctcaaaact ctctttgagg 20
<210> 7
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 7
acgttggatg tcaggcaaca tgacttgcac 30
<210> 8
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 8
acgttggatg gaggaagtga cctacctctt 30
<210> 9
<211> 18
<212> DNA
<213> 人工序列
<220>
<223>
<400> 9
ctatgtaggt gagcttcc 18
<210> 10
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 10
acgttggatg atcttccaag ccatgggcac 30
<210> 11
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 11
acgttggatg tggtgacaga gtacgtggag 30
<210> 12
<211> 20
<212> DNA
<213> 人工序列
<220>
<223>
<400> 12
atgtttggct gcggagggag 20
<210> 13
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 13
acgttggatg gccatcttca tggtgataac 30
<210> 14
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 14
acgttggatg tgaggatcac catgcagaca 30
<210> 15
<211> 16
<212> DNA
<213> 人工序列
<220>
<223>
<400> 15
gtgaaggtgg acactt 16
<210> 16
<211> 28
<212> DNA
<213> 人工序列
<220>
<223>
<400> 16
acgttggatg ccctgggtcc ccagccct 28
<210> 17
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 17
acgttggatg gagcgtctct gcttcatctc 30
<210> 18
<211> 15
<212> DNA
<213> 人工序列
<220>
<223>
<400> 18
agcccttcca tgccc 15
<210> 19
<211> 25
<212> DNA
<213> 人工序列
<220>
<223>
<400> 19
ccacataaac ctgggtcctt attaa 25
<210> 20
<211> 29
<212> DNA
<213> 人工序列
<220>
<223>
<400> 20
ggaaagatct gatatctgta aagcaagtg 29
<210> 21
<211> 16
<212> DNA
<213> 人工序列
<220>
<223>
<400> 21
cttggatgat ctttac 16
<210> 22
<211> 16
<212> DNA
<213> 人工序列
<220>
<223>
<400> 22
cttggatgat cttaac 16