專利名稱:用于電泳的dna夾住的基因座匹配的標準物的制作方法
背景技術:
發明領域本發明一般涉及用電泳系統測量未知脫氧核糖核酸(DNA)片段的長度,更具體地說涉及制造和使用夾住的成對DNA標準物,該標準物與待測DNA位點在序列上密切相關并且優選為其衍生物。
定義Caskey等人的美國專利US5364759對生物技術中使用的一些術語,具體地說對屬于短串聯重復多態性的術語做了簡要的定義。US5364759的全部內容在此引入作為參考。以下提供的定義有助于為本發明提供清楚并一致的理解。
等位基因與一種DNA片段相關的遺傳突變體,即位于一個遺傳基因座的同一多態性區域上的DNA序列的兩種或多種不同形式的其中之一。
等位序列梯(ladder)由擴增后的來自多態性區域的等位基因組成的標準大小參照物。
生化命名本發明使用的是標準生化命名,其中核苷酸堿基定名為腺嘌呤,A;胸腺嘧啶,T;鳥嘌呤,G;以及胞嘧啶,C。相應的核苷酸是,例如,脫氧鳥苷酸-5’三磷酸(dGTP)等。
偏差多態性DNA片段的已知(預期)長度與通過各種DNA標準標記物共電泳校準在凝膠電泳上實際測量得到的長度之間的差別。
差異標記意味著每種延伸產物都能與全部其他產物中區別開來,因為它帶有一種不同的標記物,該標記物連接于其上,和/或它具有不同的大小和/或它結合到一種特異的標記寡核苷酸上。本領域普通技術人員會認識到多種標記物都是可行的。不同因素會影響標記物的選擇。這些因素包括標記物對引物與DNA的雜交和結合率的影響,標記物的敏感性,制備標記引物、探針或延伸產物的容易程度,自動化能力,現有裝置,方便程度等延伸產物是指從寡核苷酸引物3’末端開始合成的核苷酸序列,它互補于結合寡核酸引物的模板鏈。
側翼序列是指遺傳位點多態性區域中被擴增部分的任意一側的核苷酸序列?!疤赜袀纫硇蛄小敝竷H在基因組內一個位置發現的那些側翼序列。
基因座(或遺傳基因座)染色體上的特定位置。一個基因座上的等位基因位于同源染色體的同一位置上。
基因座匹配標記物為用于凝膠電泳測定多態性遺傳基因座DNA片段長度而制備的一種DNA標準標記物,它是通過對該基因座的真實或無效等位基因的側翼序列的長度進行修飾而得到的?;蜃ヅ錁擞浳飿嫵杀旧暾埫枋龅陌l明的一部分。
基因座特異性STR標記物為用于凝膠電泳測定多態性遺傳基因座DNA片段長度而制備的一種DNA標準標記物,這些DNA片段是通過加減串聯重復單元制備而成的比所有已知或通常真實等位基因更長或更短新等位基因?;蜃禺愋許TR標記物構成本申請描述的發明的另一部分。
基因座特異性引物一種能與所述基因座特有的側翼序列的一部分或其互補鏈特異性地雜交的引物,至少針對該基因座的一個等位基因,并且在擴增方法使用的條件下不能與其他DNA序列有效地雜交。
多重聚合酶鏈反應(mPCR)是指一種變化的PCR,包括對兩種以上不同序列同時進行PCR擴增的方法。mPCR中,形成兩個互補單鏈后,加入多對標記后的配對寡核苷酸引物,其中每對引物都特異性地針對一種不同序列。每個引物對中的一個引物基本上互補于正義鏈的一部分,而該引物對中的另一個引物則基本上與互補的反義鏈中同一序列的不同部分互補。多個配對引物與它們互補序列之間發生退火,同時從每個引物對中的每個引物開始延伸。然后,延伸產物作為每對引物中的另一引物的模板。
多態性是指在被擴增的遺傳位點的部分中發現的遺傳多樣性。
聚合酶鏈反應(PCR)這項技術包括由變性、引物退火和DNA聚合酶延伸三個步驟組成的多個循環,經過這些循環擴增使目的DNA序列的拷貝數增加了106倍以上。有關PCR方法的更詳細的描述見美國專利US4683195和US4683202,這兩個專利在此引入作為參考。
引物兩個單鏈的寡核苷酸或DNA片段,它們能與一個基因座的反向鏈雜交,從而使得該引物的3’末段處于最緊密的接近度。
引物對是指其中包括能與被擴增的DNA序列5’末端雜交的向5’方向延伸的引物以及能與被擴增的DNA序列3’末段雜交的向3’方向延伸引物的一套引物。
引物位點目標DNA中與引物雜交的區域。
遷移時間是指DNA片段在電場中遷移通過一定長度的凝膠或其他基質并到達一種指示劑時所需要的時間。
突變等位基因一個遺傳基因座的人工制備的STR等位基因,其中包括其多態性的重復單元或核心重復單元,由于重復單元數目的變化使其長度大于或小于該基因座的所有等位基因或共同等位基因。現有技術描述電泳測定DNA片段大小的經典方法是將未知的樣品DNA片段與序列完全不同但長度已知的DNA片段進行比較來實現的。通常測大小的標準品是用限制性內切酶消化質粒或噬菌體DNA或者通過PCR擴增已知模板制備而成的。但是當大量使用時,這些方法就暴露出了以下弊端DNA序列的不同可能會產生獨特的DNA構象動力學,這樣就導致長度相等的片段的遷移率不同。因此,長度相等的標準品DNA片段和樣品DNA片段可能在凝膠電泳中表現出不同的大小。
變性后的DNA的電泳遷移率主要決定于片段的長度。但是,包括下列因素在內的幾種因素會影響遷移率電泳介質的類型(溶液相對于凝膠)、減速分子的類型、濃度、聚合和交連、緩沖液、電場強度以及溫度。由于在不同電泳條件下DNA遷移率的固有可變性,以及在同一種表觀電泳條件下,泳道和泳道之間以及每次電泳之間都存在著差別,所以為了給長度未知樣品DNA提供參考校準,在每次電泳時都需要使用已知長度的標準DNA片段一起共電泳。
有些情況下,將電泳后染色了的樣品條帶與共電泳的標準片段進行簡單的肉眼比較就可以足以對未知樣品做出鑒定。現在,自動DNA測序儀的出現能夠將只有1個核苷酸(1個核苷酸)差異的DNA片段識別開來,這些儀器中可以同時使用外置及內置兩種DNA標準物,繪制出標準曲線,自動讀出樣品片段的長度。
通常,用局部Southern標定公式或相關公式能夠將電泳遷移率轉化成片段長度(見,Elder和Southern,“單維限制性內切片段凝膠電泳的電腦輔助分析”,bishop,m.J.,rawlings,c.j.(編著),核酸及蛋白質序列分析,IRL Press,Oxford,1987)。它使用了以夾住未知樣品的最臨近的標準品標記物限定的標準曲線的局部節段來產生一種比用全部曲線更精確的計算。Elder和Southern還報道了序列相關的DNA提供的校準比異源序列更精確。
Schumm等人的美國專利US5599666從總體上討論了等位序列梯,并具體討論了短串聯重復(STR)基因座中的等位序列梯,該專利的全部內容在此引入作為參考。如上述專利中解釋的那樣,等位序列梯方面的早期工作涉及下述內容將從幾個個體(即獨立的基因組DNA樣品)中擴增出來的等位基因混合,并對它們進行電泳分離。用熒光引物標記分離后的等位基因,該引物可以用熒光檢測器來檢測。Schumm的專利中,來自一個特定基因座中DNA的STR序列可以通過使用含有與該基因座中的兩個或多個已知等位基因等長的核苷酸片段的STR等位序列梯來檢測。另外,在Schumm的專利中,用序列分析可以檢測出等位序列梯的組成。組成等位序列梯的片段在大小和序列上與從樣品材料中鑒定的擴增后的等位基因都是相同的,因此,不論電泳分離使用的凝膠系統如何,都具有與待測片段相等的大小和序列依賴性的電泳遷移率。
T細胞受體(TCR)在免疫系統識別微生物中發揮著重要的作用。它發揮如此作用的分子基礎在于它的α(A)鏈和β(B)鏈上的多態性CDR3區域形成的環,該環與結合于組織相容性分子形成的槽中的抗原性片段直接接觸。TCR基因不僅在微生物免疫中發揮著核心作用,而且在腫瘤免疫、自身免疫、同種免疫以及免疫缺陷中也同樣如此。因此,上述這些免疫狀態中涉及的TCR基因的識別是至關重要的。
TCR CD3區域在序列和長度上都是高度可變的,位于TCR基因的5’端可變(V)區與3’端恒定(C)區之間,由高變區D和交連區J的核苷酸以及B鏈中的N核苷酸和A鏈中的J區和N核苷酸組成?,F有50多個A鏈已知和45個B鏈已知的TCRV區基因。根據V基因區中的序列同源性,它們分組為32A鏈家族(見,moss等,歐洲免疫學雜志231153-1159(1992))以及25B鏈家族或亞家族(見,rowen等科學2721755-1762,1996)。
為了擴增出它們CDR3區域中的TCR基因,當這些來自多克隆T淋巴細胞群體的基因的家族用PCR擴增時,使用的側翼引物雜交在V和C區上,已發現它們一系列長度為0~60個核苷酸的多態性CDR3系列(見,liu等,免疫學方法雜志,187139-150(1995))。當變性的條件下用聚丙烯酰胺測序凝膠電泳時,不同的基因片段分辨為因多個3個核苷酸不同的峰值,在CDR3長度對應為1個氨基酸的差異。所以,為了精確地將分離的克隆后的TCRA和B鏈基因片段與它們的原始群體聯系起來,電泳測量的偏差應該小于1.5個核苷酸。由于目前使用的是異源DNA標準品,所以通常這一目標是無法實現的。
電泳精確鑒定DNA片段長度需要測量含有STR序列多態性遺傳基因座。STR位點含有長度為2~7個堿基對(bp)的串聯重復序列單元,只要富含穩定的、可遺傳的、多態性標記,這種多態性的出現是由于重復基序的拷貝數不同引起的。在人基因組中每隔15kb便出現3和4聚體的STRs,形成高達200,000個單個基因座(見beckman和weber,genomics,12627-631(1992))?,F已證明STRs可以用于人類鑒定、親子測試以及親緣關系分析,并且由于具有操作容易及可重復的優點,這些應用中優選使用STRs。例如,Sheffield等,人類分子遺傳學41837-1844,1991,這篇文獻中已經描述了在構建基因組范圍的人連鎖圖譜中使用2000多個這樣的基因座。帶有大重復單元的小衛星基因座以及帶有2bp重復單元的STR基因座表現出與其他STR基因座類似的特性,但是由于技術原因使得分析更難。一些STR基因座,尤其是含有四核苷酸重復單元的STR基因座,表現出了大小上僅差1或2個個核苷酸的不完整的等位基因(見,puers等科學2721755-1762(1993))。由于等位基因設計圍繞最近的核苷酸,因此,對于STR等位基因檢測需要使偏差小于0.5個核苷酸。
用PCR從基因組DNA中擴增STR多態性使用的是特異性引物序列,其序列可與序列的5’端和3’端側翼序列雜交,這種方式類似于擴增多態性CDR3區域時使用TCR基因側翼V和C區特異性引物的方式。用于不同的STR基因座的引物對通常為4~8個,往往與多重PCR結合在一起。
當電泳測定片段長度時,通過擴增區域中包含的重復序列拷貝數目的不同可以將STR基因座的等位形式區分開來,并可以根據重復單元的數目對等位基因的形式進行計數。等位PCR片段的鑒定通常在板狀凝膠上電泳來實施,電泳使用異源DNA片段作為校準標準物,標準物可以加入到泳道內或者在泳道內和泳道外都使用(內部標準物為把標準物與樣品加入到同一個泳道內進行電泳;外部標準物為將標準物加入到與樣品泳道相鄰的泳道內進行電泳)。用于毛細管電泳的標準物往往是在同一種凝膠上電泳,但不同時電泳,在未知樣品之前或者之后。由非基因座特異性DNA構成的更可靠的標準物是由20~50基序單元組成的串聯體,這些串聯體互相之間長度上差1個單元,這類標準物已經開發成功(見,vanier等,genomics 411-9,1997)。在決定電泳遷移率的序列上,這些均聚物相互之間表現出最小的差異性。
在泳道外標記物中,最可靠的梯度就是由該等位基因本身組合而成的(見,sprecher et al.,bio techniques 20266-277,1996),因為它們與待測DNA樣品等位基因片段具有相同的序列。但是,等位序列梯難以用作泳道內標準物,因為它們和未知DNA片段遷移到了凝膠上的同一位置,從而無法加以檢測。盡管存在這種弊端,moscetti et al.,electrophoresis 161875-1880,1995,這篇文獻中在重迭等位基因用與未知樣品同樣的熒光標記時使用了樣品峰值信號加強來作為檢測的方法。Smith,bio techniques 18122-128,1995,這篇文獻中為了說明在泳道中等位序列梯是優于異源DNA標準物的,在同一STR基因座內使用了三種不同的熒光。能量轉化熒光已經被用于等位并且非基因座特異性標準物與未知樣品中。它們用共同的激光器來激發,但是產生非重疊的可檢測發射信號(見wang et al.,anal.Chem.671197-1203,1995;wang et al.,electrophoresis 171485-1490)。
發明概述本發明的一個目的是提供一種能夠生產夾住樣品的、與基因座匹配的或特異性的長度和序列已知的DNA標準物,該標準物可以用于多種用途,其中具體包括用于測量TCRA和TCRB基因多態性CDR3區域。
本發明的另一目的是提供一種能夠生產從待測基因座衍生出來的DNA標準物,該標準物與多態性DNA樣品共電泳,作為夾住樣品的、與基因座匹配的或特異性的DNA標準物,既可以泳道內使用也可以泳道外使用。
本發明還有另一個目的是提供制備和使用基因座特異性STR標記物的方法,用于測定DNA片段的長度。
根據本發明,構建用于遺傳基因座片段長度多態性分析的與序列匹配的或特異性DNA標記物的目標是做到緊緊夾住但不重迭,電泳分離時該基因座的幾個或所有已知等位基因的長度。因為它們與它們目的遺傳基因座的等位基因之間在序列和片段長度上緊密相關,夾住等位基因的與基因座匹配的標記物與來自該基因座的樣品等位基因共電泳于同一泳道中,這樣就為樣品片段長度的測定提供了精確的校定標準物。本發明的另一個目的是為使夾住等位基因的基因座特異性標準物其側翼序列有足夠的長度而提供成對的PCR模板片段。這些模板對可以使用用于該基因座的PCR引物與基因組樣品DNA一起共擴增。共擴增可以產生PCR反應的陽性對照,以及用于該基因座的夾住等位基因的內置標準物。共擴增還為夾住等位基因的標記物與樣品DNA通過TagDNA聚合酶在其3’末端附加額外核苷酸提供了同等的機會。
另外,本發明的另一個目的是,通過添加或減去串聯重復單元制備出相應地比所有已知或共有的真正等位基因更長或更短的新等位基因,從而制備出多態性遺傳基因座的基因座特異性STR標準物。這些基因座特異性STR參照物可以用于電泳測定該多態性遺傳基因座的DNA片段的長度。
附圖簡述從下面參照附圖對本發明的優選實施例所做的詳細描述中,可以更好地理解上述以及其他的目的、方面和優點。這些附圖具體如下
圖1是表明實施本發明所用策略的簡圖;附2是表明實施本發明所用的另一策略的簡圖;圖3是表明實施本發明所用的另一策略的簡圖;圖4是表明實施本發明所用的另一策略的簡圖;圖5a-b是與實施例1有關的聚丙烯酰胺電泳凝膠泳道的電腦Fragment managerTM掃描圖,其中顯示出用于TCRAV7基因多態性CDR3區域的與基因座匹配的夾住等位基因的標記物;圖6是與實施例2有關的聚丙烯酰胺電泳凝膠泳道的FragmentmanagerTM掃描圖,其中顯示出用于TCRBV16基因多態性CDR3區域的與基因座匹配的夾靠式標記物;圖7a-c是與實施例3有關的聚丙烯酰胺電泳凝膠的泳道FragmentmanagerTM掃描圖,其中顯示的是通過修飾側翼序列制備的用于STR基因座CSF10PO、FESFPS和F13A01的與基因座匹配的夾靠式標記物;圖8a-c是與實施例6有關的聚丙烯酰胺電泳凝膠的泳道FragmentmanagerTM掃描圖,其中顯示的是通過減少或增加多態性區域中串聯重復單元的數目制備的用于STR基因座F13A01的基因座特異性夾靠式標記物,以及通過Taq DNA聚合酶添加不同數目額外核苷酸對DNA片段峰的影響;
圖9是與實施例6有關的聚丙烯酰胺電泳凝膠的泳道FragmentmanagerTM掃描圖,其中顯示的是在與來自3個不同基因組DNA樣品的F13A01基因座共擴增后,每個樣品都與較短突變等位基因夾靠式標記物一起共擴增,通過Taq DNA聚合酶添加不同數目額外核苷酸對DNA片段峰的影響。
圖10是瓊脂糖凝膠電泳的掃描圖,其中顯示的為泳道1中是DNA校準標準標記物;用反向引物F13A01 rev251-Eam-1和來自5’側翼序列的正向F13A01 fwd配對從基因組DNA的F13A01基因座中擴增出來的延伸側翼區域(泳道2)以及用正向F13A01 fwd 248-Eam-2與來自3’側翼序列的F13A01 rev 628配對擴增的產物(泳道3);用典型F13A01基因座特異性引物對從其連接產物(泳道2+3)擴增的275bp短的F13A01變異等位基因(泳道4)。
本發明優選實施例詳述本發明的系統提供了一種快速、非同位素方法,該方法可以用于評估微量(例如,lng)的人DNA。該優選方法包括在通過變性介質電泳分離時,使用熒光發射檢測熒光標記的、擴增后的、與基因座匹配的長度多態性DNA產物。也可以在使用任一現有凝膠或粘性基質電泳或者其他根據大小分離的手段中,使用放射性標記物和各種顏料或染料標記變性或原初DNA來檢測DNA片段。
構建用于遺傳基因座片段長度多態性分析的與序列匹配的DNA標記物的目標是在電泳分離時做到緊緊夾住但不與該基因座的幾個或所有已知等位基因重迭。因為它們與它們目的遺傳基因座的等位基因之間在序列和片段長度上緊密相關,所以將夾住等位基因的與基因座匹配的標記物與來自該基因座的樣品等位基因在同一泳道中共電泳,能夠為樣品片段長度測定提供精確的校準標準物。
緊緊夾住等位基因的與基因座匹配的標記物的制備涉及幾個概括性步驟,其中包括獲得DNA樣品、克隆及測序、擴增、分離及檢測。在這些步驟的基礎上,可以制備出夾住等位基因的與基因座匹配的標記物。下面將逐個討論上述概括性步驟。
獲得DNA樣品-選擇幾個個體用于DNA分離。用標準方法(puregene,genta systems,minneapolis,MN)直接從血液、組織或組織培養細胞中提取DNA。分光光度法測定出DNA濃度。K562對照DNA購自promega(madison,WI)。
用密度沉降(LSM,organon teknika,durham,NC)從10ml全血或我們實驗室培養的人淋巴細胞克隆中獲得2-3×106外周血單核細胞(PBMC),并從中提取RNA(RNAzol B,Tel-Test,friendswood,TX)??梢杂门cDNA相同的裝置測定RNA濃度。用第一鏈cDNA試劑盒(pharmacia,piscataway,NJ)從1.0μg全RNA中合成第一鏈cDNA(33μl)。
克隆及測序-利用在微量滴定孔中的原代培養物建立T細胞克隆,培養在有限稀釋條件(0.7個細胞-孔)下進行,有PHA、IL-2存在并以105自體同源放射標記(5000拉德)PBMC作為飼養細胞。用PCR-script amp SK(+)克隆試劑盒(stratagene,lajolla,CA)對平端TCR PCR產物進行分子克隆。用fmolDNA循環測序系統(promega)和A.L.F.自動DNA測序儀(pharmacia)對克隆的TCR片段進行循環測序。
擴增-用特異于每個基因座的引物和溫控循環條件對DNA樣品進行PCR擴增。表1給出的是基因座特異性引物對的序列。
表1寡核苷酸的序列和定位
<
1引物5’端用Cy5標記。
2引物5’端用Cy5或熒光素標記。
3引物5’端用熒光素標記。
4下劃線核苷酸與基因組序列不互補。
a序列參考人CSF-1受體的c-fms原癌基因。
Genebank登錄號X14720NID。
b序列參考人凝集因子XIIIα亞基基因,5’側翼;Genbank登錄號M21986 J03834 NID g 182293。
c序列參考人c-fes/fps原癌基因。Genbank登錄號X06292M14209M14589 NID。
參考文獻liu et al.-本發明中出現的資料Genevee,C.,歐洲免疫學雜志(Eur.J.Immun.)221261-1269(1992)Choi,Y.,美國國家科學院院報(Proc.Natl.Acad.Sci.)868941-8945(1989)Robinson,M.,免疫學雜志(J.Immunol.)146(12)4392-4397(1991)Hammond,H.,人類遺傳學雜志(J.Hum.Genet.,)55175-189(1994)Puers,C.,基因組學(Genomics)23260-264(1994)下面的實施例提供了與每個基因座相關的特定方法的細節?;蜃禺愋砸锇ù罅亢塑账?,在雜交所用條件下,其數目足以能與待擴增的該基因座等位基因之間發生雜交且基本上不與其它基因座的等位基因進行雜交。寡核苷酸引物由Operon技術公司(Alameda,CA)提供。Simons的美國專利US5192659更加充分地描述了位點特異性引物,該專利在此引入作為參考。
在本發明的一個實施例中,選擇TCR A和B基因CDR3多態性來進行DNA片段長度測定。與5’側的恒定區(VA)或(VB)片段雜交的引物用作正向引物,與3’側的恒定區(CA)或(CB)雜交的引物用作反向引物(見,例如,liu et al.,j.Immuno.Meth.187139-150,1995)。每個PCR反應系統由下列物質組成1.0μl正向和反向引物(各為3μM)、0.15μl Tag DNA聚合酶、0.15μl 10μM dNTPs,1.0μl cDNA以及補足終體積至10.0μl的水。反應條件為94℃下變性45s,55℃下退火45s,72℃下延伸45s,共進行30個循環,最后一個循環后72℃下延伸10min。
在另一個實施例中,含有熒光素標記的等位序列梯和來自3個單獨基因座的引物的3 STR試劑盒購自Promega(Gene print fluorescentSTR system,promega,madison,WI)CSF1PO、FESFPS和F13AO1。TaqDNA聚合酶和10×緩沖液購自Boehringer Mannheim(Indianapolis,IN)。用perkin-elmer 480 DNA熱循環儀,按照Promega公司1996年2月技術手冊中的操作方法8進行PCR擴增。用STR基因座特異性引物(Promega)擴增STR樣品DNA,該引物與串聯重復區域5’和3’側翼的基因座特異性序列(表1)雜交。內置用的DNA標準物梯度為50~500bp,購自Pharmacia公司。
DNA片段的分離和檢測-電泳分離擴增產物,例如通過變性聚丙烯酰胺凝膠電泳。電泳采用0.5mm厚的6%變性聚丙烯酰胺預混式凝膠和TBE緩沖液(Gel-Mix 6和Gel-Mix Running Mate,GIBCOBRL,Gaithersburg,MD),在自動DNA測序儀A.L.F.和A.L.F.顯示屏(pharmacia)上進行。根據廠商提供的方法,對于A.L.F./A.L.F.顯示屏的操作條件是電壓1500V/1500V;電流38mA/60mA;功率3mW/3mW;溫度42℃/55℃。
為了能使所有待分析DNA片段中都有1條鏈被加以標記,用合適的熒光團(A.L.F.用熒光素,A.L.F.顯示屏用Cy5)對每個PCR引物對中的一個成員進行標記。在下述條件下用Fragment managerTM1.2軟件(pharmacia)對數據進行處理峰寬10、峰高0.5、以及聚集敏感度(clustersensitivity)0。將樣品在凝膠上的電泳遷移率與同一泳道(內置參照物)和/或不同泳道(外置參照物)中的已知大小的標記物進行比較,在此基礎上該軟件自動測定出片段長度。調整每個凝膠泳道中的PCR產物上樣量,以使每種片段都能形成有別于相鄰峰的單峰。與基因座匹配的夾靠式標記物的制備與基因座匹配的夾靠式標記物的制備使用具有如下特征的PCR引物針對用于擴增的遺傳基因座多態性區域的特有側翼序列具有特異性。在優選實施例中,該引物是一種單鏈寡脫氧核苷酸,在有一種誘導劑存在下其長度足以啟動從一段特異性序列到延伸產物的合成反應。用模板DNA的一種給定樣品,通過引物長度和序列的獨特性可以測定出寡核苷酸引物的敏感度和特異性。本發明中,寡核苷酸引物通常大于15聚體,在優選實施例中為約20~30聚體或更長。
每對引物都被選擇來檢測不同遺傳基因座的部分。本發明中選擇的每個引物對中的每個引物都基本上在待擴增的每個特異性遺傳序列的側翼序列上與不同的鏈互補。因此,每個引物對中有一個引物互補程度足以能與正向鏈的部分序列雜交,而另一個引物的互補程度足以能與反向鏈的同一序列的不同部分雜交。盡管引物序列不需要反映模板的確切序列,但是3’末端反映該確切序列越嚴密,退火階段就結合的越好。
在一個實施方案中,當與其他經典側翼序列引物在PCR反應中聯用時,引物針對經典位點5’和3’端側翼序列位點,從而擴增到比經典產物更長或更短的擴增產物。那么,在電泳場中新的擴增產物就會比經典產物遷移的更快或更慢,從而可以用作經典產物定位的夾靠式標記物。
在另一個實施方案中,新設計的引物可以結合到與用于擴增給定多態性區域的經典引物對部分等同的位點上,不同之處僅在于比經典引物更長或更短。短引物在遠離目標多態性基因座的一端被截短,以便產生出更短的擴增引物。長引物則是在遠離目標基因座的一端被加長,以便產生出更長的擴增引物。如果與來自相對的特有側翼序列的經典的基因座特異性引物配對使用,那么它們將會分別擴增到更長或更短的DNA片段,那么這些片段在電泳分析片段長度時就可以從兩側把傳統擴增產物夾住。
在一個優選實施方案中,這類修飾過的基因座特異性引物用于通過從多態性區域擴增預期長度的選定等位基因,從而制備出標準電泳標記物。用一個截短引物將來自一個遺傳基因座的多態性區域的最短等位基因或短的罕見等位基因縮短,從而制備出一種短的夾住標記,該標記的電泳遷移率比任意一種等位基因或該多態性區域的任意一種共同的等位基因都更大。用一個加長引物將來自一個遺傳基因座的多態性區域的最長等位基因或長的罕見等位基因加長,從而制備出一種長的夾住標記物,該標記物的電泳遷移率比任意一種等位基因或該多態性區域的任意一種共同的等位基因都更小。
在另一個實施方案中,為了制備出比任一天然生成或任一常見等位基因更長或更短的變異等位基因,設計多套引物對去改變多態性區域本身,而不是改變其特有的側翼序列。在本申請中,針對常規用于擴增多態性區域的引物具有特異性的同一側翼序列用于擴增不同等位基因,從而制備出成對的緊密夾住的擴增產物,這些產物分別具有比該多態性基因座的任一等位基因或常見等位基因更小或更大的電泳遷移率。因此,上述夾靠式的不同等位基因可以和被分析的樣品等位基因一起用同一個PCR反應擴增。
圖1簡要地顯示了本發明的一個實施方案,其中的脫氧核糖核酸片段來自關注的遺傳基因座,通常具有被鑒定為以5’端開始的正義鏈和被鑒定為以3’端結尾的反義鏈。其多態性區域“P”使用正向引物1和反向引物2通過PCR擴增,這兩引物與它的側翼序列雜交。引物3和4設計成與反向引物2一樣能與同一正義鏈雜交,其雜交位點分別位于引物2雜交位點的5’側或3’側。同樣,引物3和4也可以設計成與引物1一樣能與同一反義鏈雜交,其雜交位點分別相應位于引物1雜交位點的5’側或3’側。
在該優選實施方案中,反向引物2、3和4每個都用一種標記物標記,例如熒光團、放射性測量標記或其他任意一種可檢測和鑒定的適當試劑。替代地,可以標記正向引物1,而不標記引物2、3和4,或者標記所有引物。圖1所示的實施方案中,用引物2、3和4制備不同長度的延伸產物。在進行PCR時,制備出以引物1開始并以引物2、3和4結尾的片段。這些片段可以用電泳分離,分別用反向引物3和4制備出的較短或較長延伸產物就會把用反向引物2制備出的延伸產物夾住。這種情況下,由于在與5’端和3’端為引物1和2的經典片段分享的區域內,該夾住的延伸產物與該經典片段具有同樣的序列,所以它們在電泳介質(例如凝膠)中具有近似的遷移率。此外,因為用引物3和4從已知模板中擴增出來的夾靠式延伸產物的長度可以從該模板序列中精確地獲得,所以用上述夾靠式延伸產物作為長度校準標記物,可以將用引物1和2擴增的未知樣品中的等位區域的長度容易地測定出來。而且,引物選擇的是引物3和4,不會與被擴增的多態性區域重疊在一起,所以可以容易地識別出它們的夾靠式延伸產物。
圖2顯示的是圖1所示方法制備出的不同產物。具體地說,基因組基因座的多態性區域通過反義鏈上的正向引物5和正義鏈上的反向引物6’、6”和6限定。該反向引物優選用熒光素或放射性標記物標記且它選自核苷酸序列6。然而,應該理解的是本發明實施中可以標記引物5。最長引物6’構成核苷酸序列6的全長或大部分。引物6”優選是用于該基因組基因座的經典已知引物,除引物6’中出現的另外附加的已知數目核苷酸外,引物6”和引物6’是相同的。引物6是最短引物。引物6具有引物6”的5’端的全部核苷酸,而不含3’的那幾個核苷酸。
在進行PCR時,生產出標記片段,這些片段都在5’末端具有引物5,而在3’末端則為標記的引物6’、6”和6。電泳時,由于這些片段具有同一構象,所以這些片段都具有同樣的相對遷移率,以6’和6結尾的片段將夾住以6”結尾的片段。因為夾住片段核苷酸數目已知,所以參照用引物6’和6擴增的已知片段,可以容易地測定出用引物6”擴增的未知片段的長度。
圖3顯示的是本發明的一個實施方案,該方案可以制備出用于短串聯重復(STR)基因座的與基因座匹配的夾住標記物。使用側翼序列P1和P2,可以從含有STR基因座的基因組DNA的多個樣品中制備出包含N個長度不同等位基因的等位序列梯。將PCR擴增得到的等位基因克隆到質粒載體中,然后將重組載體轉化到細菌中。分離最短和最長等位基因或常見等位基因。這些等位基因每個都是在5’末端以與引物P1相同的核苷酸側翼序列結尾,在3’末端以與引物P2相同的核苷酸側翼序列結尾。
引物P1用熒光素、放射性或其他合適標記物標記。因此,當正義鏈與反義鏈分開時,正義鏈被標記。
引物P2是該STR基因座的反向引物。修飾引物P2,添加一定數目(X)核苷酸得到較長的P2引物,或者去除一定數目(Y)核苷酸得到較短的P2引物。添加或去除核苷酸的數目優選是相等的。此外,最優選添加或去除的數目與該STR基因座重復單元中所含核苷酸數目相等,因此生產出的夾靠式標記物比該STR區域更長或更短,具有固定重復數的核苷酸。
如圖3所示,較短的P2引物與最短等位基因雜交,較長的P2引物與最長的等位基因雜交。用較短和較長的等位基因作模板,以較短的P2引物和較長的P2引物分別與標記后的P1正向引物配對使用,擴增出延伸產物。從圖3中可以看出,帶有較短P2引物的延伸產物不含Y部分,而Y這部分在未經修飾的P2引物中卻存在,帶有較長P2引物的延伸產物包含X部分,而X這部分在未經修飾的P2引物中卻不存在。因此,與用未經修飾的引物P1和P2制備出的延伸產物相比,這些延伸產物具有增加或減少了已知數目的核苷酸,并且這些產物把用未經修飾的引物P1和P2制備出的延伸產物緊緊地夾在中間。
因為(從添加的X和刪減的Y)可以知道所述夾住標記物的確切長度,所以在電泳過程中它們具有與用未經修飾的引物P1和P2制備出的PCR等位基因產物近似的遷移率,而且由于它們不會與該遺傳基因座的已知或常見等位基因重疊,所以這些夾靠式、與基因座匹配的標記物能確保精確地測定出該STR基因座的長度。
圖4顯示的是下述設計方案為了制備出比任一天然生成等位基因或常見等位基因更長或更短的各種等位基因,所以不在獨特的側翼序列上,而在多態性區域自身內部刪減或插入重復單元。用一對經典STR引物正向引物5和反向引物6’從基因組DNA擴增出的經典PCR產物,可以從重復區域分為兩部分。經典產物的5’部分用經典的正向引物5與反向引物7和7’分別配對從重復區域中擴增出來。反向引物7’含有較短變異等位基因中重復單元的一半。反向引物7”則含有產生較長變異等位基因所必需的重復單元的一半。經典產物的3’部分用經典的反向引物6”與正向引物8’和8”分別配對從重復區域中擴增出來。正向引物8’含有用于制備較短等位基因的重復單元的一半。正向引物8”則含有用于制備較長等位基因的重復單元的另一半。這4個來自所述重復區域的引物在5’末端都是以幾個額外核苷酸開始,接下來是重復單元核苷酸,其3’端以側翼序列核苷酸結尾,其中所述的5’末端核苷酸可以被Eam 1104 I等無傷痕(seamless)限制性內切酶識別。PCR擴增后,得到的4個片段每個都可以用一種無傷痕限制性內切酶(例如Eam 1104I)消化,而且用T4 DNA連接酶連接成為2個片段。用引物對7’和5擴增到的片段與用引物對8’和6”擴增到的片段連接形成較短的等位基因或最短的相同等位基因。用引物對7”和5擴增到的片段與用引物對8”和6”擴增到的片段連接形成較長的等位基因或最長的等位基因。電泳分離時,最短和最長的常見等位基因會將天然生成“共有”等位基因被夾在中間,從而確??梢詼y定出精確長度。實施例給出的以下實施例是為了說明本發明的優點,幫助本領域普通技術人員實施和利用本發明。但是,這些實施例不應該被理解用于限制本發明公開的和所附權利要求闡述的范圍。實施例1制備可以用于測量來自TCRA基因座的V7家族基因的多態性CDR3區域長度的與基因座匹配的夾靠式標記物。
在淋巴細胞增殖過程中,每個TCRA基因都是通過體細胞重組從50多個AV節段基因和63個AJ節段基因中各取1個與單個AC節段基因組裝而成(見,Davis et al.,nature 334394-402,1988;以及moss etal.,Eur.J.Immunol.231153-1159,1993)。位于AV和AC節段之間的多態性CDR3區域的長度和序列用下述手段制備的在AJ節段的可變區刪減和添加核苷酸。TCRA CDR3區域的長度范圍為0-17aa(liu,D.,Dau,p.,美國專利US08/559205,在此引入作為參考)。根據序列同源性,可以將TCRA基因分為32個家族,它們的多態性CDR3區域可以用家族特異性AV節段正向引物和共同的AC節段反向引物來擴增。因此,這些基因節段可以作為用于分析每個特定TCRAV基因家族的CDR3片段長度多態性的側翼序列。
因為在擴增所有TCRAV家族中的CDR3片段長度多態性中,用共同AC節段引物與下游側翼序列雜交,所以為了擴增出能在電泳時將經典擴增片段夾在中間的較短和較長DNA片段,將另外2個AC節段引物制備成能與位于經典AC節段引物結合位點5’和3’側的AC序列雜交。
因為可以將同一種下游側翼AC節段引物與特異于每個家族的不同AV上游側翼引物配合用于擴增多態性CDR3區域,所以上述方法的原理適用于所有AV家族。然而,新設計的AC引物必須和與其配對的每個家族特異性AV引物在溫度和序列上是匹配的。由于使用的是同源性PCR模板,溫度相容性是一種無關緊要的因素,這就保證了除任一對之間的序列不相容性外,下面討論的同一個新設計的AC節段引物能與所有的28個AV節段引物配對。可以重新設計不相容引物對使之能與不同的AV或AC特異性序列結合,直到為每個AV家族都發現一個相容性引物對為止。
用單獨的(separate)PCR反應擴增來自T細胞克隆No.263的cDNA,每個反應使用特異于29個TCRAV家族中的一個的正向引物(genevee et al.,eur.J.Immunol.221261-1269,1993)與一個共同AC129反向引物配對,該引物可以擴增出側翼AC節段5’末端的前129個核苷酸。T細胞克隆從唯一一個反應中生產出一種特異性產物。通過測序凝膠電泳上片段長度測定或通過測序把非特異性產物排除。發現用AV7-AC129引物對擴增的cDNA是單克隆的,具有長為27個核苷酸的CDR3區域,表達AJ26基因節段的核苷酸,片段全長349個核苷酸。此外,分子克隆(No.147)是從AV7-AC129的分子克隆中衍生出的,AV7-AC129是從來自PBMC多克隆cDNA擴增而來的。使用pCR-Script SK(+)克隆試劑盒(stratagene,la jolla,CA)克隆得到的平端PCR產物。測序時,M147含有長為30個核苷酸的CDR3,表達AJ5基因節段,片段長度為352個核苷酸。
由于經典的AC節段反向引物擴增的是AC節段5’端的57個核苷酸,設計出的較短和較長的反向AC節段引物擴增的分別是AC節段5’端的27個核苷酸和87個核苷酸,因而制備出的產物比經典產物短或長30個核苷酸。因此,用克隆No.147 DNA作模板,這些夾住標記物中將包括0~60個核苷酸的CDR3區域,從而將樣品TCRA DNA中期望長度的CDR3包括進去。
3個TCRAC節段引物全部用熒光檢測的Cy5進行了5’端標記。圖5a-b給出的是當用3個AC節段引物與AV7節段引物在分離PCR反應中配合使用時,這些AC引物生產出差距60個核苷酸的PCR產物。圖5a顯示克隆No.147具有長為250、280和310bp的相應片段。圖5b顯示克隆No.263具有長為247、277和307bp的相應片段,CDR3區域縮短了3個核苷酸。
來自這些克隆的DNA,外加PCR擴增的AV7家族特異性DNA,用電泳片段分析對它們進行了測量,該AV7家族特異性DNA來自另外15個已經測序并用AV7/AC57引物對擴增的克隆,電泳分析使用基因座無關的100/350bp和200/350bp標記物以及上述CA27和CA87與基因座匹配的標記物作為夾住的標準物。將電泳分析結果與測序測定的長度比較。當在A.L.F.顯示屏上使用的是247-307bp夾住的標記物對時,測量的最大偏差為0.3個核苷酸(平均0.10±0.13個核苷酸),這完全符合數值小于1.5個核苷酸的要求。對于200/350bp夾住的標記物對而言,偏差高出0.6個核苷酸(平均0.25±0.15個核苷酸),反映出了這兩對AV7家族特異性夾住標記物之間CDR3區域的序列異源性。用100/350bp基因座無關標記物得到相對于實際片段長度大得多的偏差值(4.25±0.23個核苷酸)。當使用200/350bp無關標準標記物時,平均偏差值減小到1.08±0.11個核苷酸,這顯示了100和200bp標準標記物之間序列異源性的效果以及夾住的標準物相對于樣品DNA的緊密性。實施例2
制備可以用于測量來自TCRB基因座的V16家族基因的多態性CDR3區域長度的與基因座匹配的夾住標記物。
在淋巴細胞增殖過程中,每個TCRB基因都是通過體細胞重組從45個TRCBV節段基因、2個BD節段基因、13個BJ節段基因和2個BC節段基因中各取1個組裝而成(見,Davis et al.,Nature 334395-402,(1988);以及Rowen et al.,Science 2721755-1762(1996))。長度和序列多態性CDR3區域位于BV和BC節段之間,由BD和BJ節段可變區通過刪減核苷酸和添加N核苷酸制備而成。根據序列同源性,可以將TCRB基因分為25個家族或亞家族,它們的多態性CDR3區域可以用不同家族特異性BV節段正向引物和共同的BC節段反向引物來擴增。因此,這些基因節段可以作為用于分析每個特定TCRBV基因家族的CDR3片段長度多態性的側翼序列。
為了將共同BC節段引物夾在中間,將另外2個BC節段引物制備成能與位于經典BC節段引物結合位點5’和3’側的BC序列雜交,這兩個引物與BV家族特異性引物配合使用擴增出較短和較長的DNA片段。這些擴增到的DNA片段長度能在電泳時將經典擴增片段夾在中間。原理上,這種技術適用于任一BV家族,因為它們相同或高度近似的BC節段使得可以將共同的3’側翼BC引物與它們的5’側翼家族特異性BV引物結合用于擴增所有BV基因的多態性CDR3區域。然而,新設計的AC引物必須和與其配對的每個家族特異性BV引物在溫度和序列上是相容的。由于使用的是高度純化的PCR模板,所以溫度相容性無關緊要,這就確保了除任一對之間的序列不相容性外,下面討論的同一個新設計的BC節段家族特異性引物能與所有25個BV節段家族特異性引物配對。可以重新設計不相容引物對,使之能與不同的BV或BC特異性序列雜交,直到為每個BV家族都發現一個相容性引物對為止。
用T細胞克隆No.296的cDNA作為25個分離PCR反應的模板,每個反應使用特異于25個TCRBV家族其中一個的正向引物(參見Liu等,免疫學方法雜志,187139-150(1995))與一個共同BC54反向引物配對,該引物可以擴增出側翼BC節段5’末端的前54個核苷酸。只用BV16家族特異性引物,可以從T細胞克隆中生產出一種特異性產物。通過在自動聚丙烯酰胺測序凝膠電泳時測定產物是否落在BV家族正確的長度范圍內,或者通過在同一裝置上進行DNA循環測序測定其確切序列,從而把非特異性產物排除。
序列測定發現,用BV7-BC168引物擴增的cDNA是單克隆的,長為363 bp。其CDR3區域長為30個核苷酸,而且它使用的是BJ1.2基因節段。因為經典BC節段反向引物擴增的是BC節段5’端的54個核苷酸,短反向引物擴增的是BC節段5’端的24個核苷酸,長反向引物擴增的是BC節段5’端的92個核苷酸。這3個BC節段引物的一套是用熒光素標記生產的,另一個用Cy5標記。
家族特異性BV16引物與經典BC54反向引物配對擴增出一段TCR特異性片段,該片段中包含V節段的3’末端區域、完整的CDR3區域、完整的J區域以及C基因節段5’端到54位核苷酸。該片段序列長為249bp。用BC24或BC92引物取代CB54引物,重復PCR反應擴增出另外的DNA片段。這種情況下,擴增出長為219bp和287bp的TCRBV16特異性片段,除它們的BC節段3’端延伸出的長度外,這些片段具有與249bp片段相同的基因座特異性序列。
圖6顯示的是把249bp經典產物夾在中間的219bp產物和287bp產物的分離圖。當在A.L.F.裝置上電泳時,用這些與基因座匹配的標記物測量時,上述249bp片段出現的偏差為-0.3個核苷酸。在同一泳道中共電泳的100/300bp基因座中性標準物不能可靠地鑒定249bp產物,測量偏差為-1.5個核苷酸。對另外12個BV16特異性T細胞克隆進行鑒定,將這些TCR CDR3區域與克隆No.296的TCR CDR3區域一起進行測量。使用219/287bp這對基因座特異性夾住的標準物對時,出現的平均絕對偏差為0.52±0.38個核苷酸。偏差范圍為-0.3~+0.8個核苷酸,這反映出CDR3區域與夾住的基因座匹配標記物的J片段之間的序列與單個克隆之間的部分序列不匹配性,以及它們BC節段長度不同。在同一泳道中用100/300bp夾住的無關標準物對共電泳時,測量得到的平均絕對偏差為0.81±0.49個核苷酸。
為了測試出電泳條件的不同,主要是增加溫度對這些結果的影響,在A.L.F.顯示屏上重復該實驗。使用與基因座匹配的夾住標準物時,絕對測量偏差減小到0.17±0.21個核苷酸,但是使用基因座無關標準物在同一泳道中共電泳時,絕對測量偏差增大到3.31±0.74個核苷酸。這些結果表明與無關標準物相比,基因座相容性標準物在電泳條件改變時對偏差變化具有相對抗性。位點無關標準物與位點特異性DNA之間更大的序列及長度不相容性使得不同電泳條件會增加它們的不同遷移率,這反過來會產生更大的測量偏差。A.L.F.和A.L.F.顯示裝置之間,在凝膠聚合體、電泳采用的緩沖液以及遷移路徑長度上都是相同的。
總之,這些結果表明與使用夾住的基因座無關內置式標準物相比,使用夾住的與基因座匹配的泳道內置標準物進行電泳測量TCR基因片段時,在小于1.5個核苷酸的需要數值范圍內偏差值增加更穩定。當電泳測定TCR片段長度時,測量誤差之間的差異變得很重要,這是因為通過多個3個核苷酸的變化導致CDR3區域中氨基酸添加或刪減從而使它們的長度發生變化。因此,如果誤差小于1.5個核苷酸,那么就能可靠地將多態性CDR3片段相互之間區分開來。實施例3通過修飾側翼序列,制備可以用于STR基因座CSF1PO、FESFPS和F13A01的基因座相容性夾住的標記物。
在來自每個基因座的長或短等位基因的末端添加或刪減核苷酸,制備基因座相容性夾住的標記物。為了制備出電泳遷移率近似于被測STR分子的夾住的標記物,通過下述方法在從Promega等位基因梯度中所能獲得的最長等位基因一端添加或在所能獲得的最短等位基因一端刪減4個核苷酸。
第一步,為了將每個梯度中出現的最短和最長等位基因分離出來,將來自Promega Corp.CSF1PO、FESFPS和F13A01的3個等位序列梯克隆到質粒載體中,并轉化到細菌內(PCR-Script amp SK(+)克隆試劑盒,stratagene)。
第二步,設計用于上述3個STR基因座其中之一的2個反向引物。這些反向引物顯示于表1,是通過下述方法制備而成的在初級引物序列的5’端刪減4個核苷酸基因組序列或者添加4個核苷酸重復或基因組DNA序列。
第三步,在其5’端用熒光素標記正向引物,在公開的引物序列(見表1)基礎上不做任何序列改變。
第四步,用從上述3個基因座其中之一分離到的最短等位基因作為PCR反應的模板,使用它們的截短反向引物與它們的熒光素標記正向引物配對。最長的等位基因則是通過它們自己的加長反向引物與它們的熒光素標記正向引物配對使用擴增出來的。
將制備好的用于每個基因座的夾靠式標準物與它們的基因座特異性等位序列梯加入到聚丙烯酰胺凝膠的同一泳道內,并用A.L.F.自動DNA測序儀進行電泳。圖7a-c顯示出,用于STR基因座CSF1PO、FESFPS和F13A01的基因座相容性夾靠式標記物把它們的初始等位基因緊緊地夾靠在中間。實施例4在校準的電泳遷移率中驗證與基因座匹配的夾靠式STR標記物將與基因座匹配的夾靠式STR標記物以內置或外置方式,與內置式標準物共電泳,校定它們的基因座中的等位基因的測量結果,并與使用標準基因座無關夾靠式標記物以及使用來自每個基因座的等位基因梯度中的最短或最長真實等位基因作為標記物進行比較。對于每個數據點來說,在5個聚丙烯酰胺測序凝膠每個上各取至少3個分散泳道對3個STR基因座都做了測定。不同的成套外置式或內置式標記物總是在同一凝膠泳道中共電泳。然后,計算出每次測量數值與期望數值之間的絕對偏差。結果見表2。
表2校準
>*平均值±SD(核苷酸)由基因座無關標準梯度或等位序列梯組成的外置式標準參照物是同樣不理想的。由于區分四聚體串聯重復等位基因需要測量誤差小于2個核苷酸,所以它們無法可靠地區分這3個基因座任一個中的等位基因。
標準基因座無關參照物當作內置夾靠式標準物使用時效果較好,但是同時用于所有3個STR基因座,它們就會產生比與基因座匹配的夾靠式標準物高5.6倍的偏差。由于與人工制備的與基因座匹配的夾靠式標準物相比,較短和較長的真實等位基因的序列與被測等位基因之間的匹配性更大,所以這些較短和較長的真實等位基因產生的偏差比修飾后的等位基因更小。
將標準基因座無關外置式梯度與標準基因座無關內置夾靠式參照物配合使用后,在偏差上與單獨使用標準基因座無關內置夾靠式參照物相比并無任何改善。使用等位外置式標準物加上外置式夾靠式基因座匹配標記物,矯正了與內置夾靠式與基因座匹配的標記物相關的偏差,使其低于使用內置式等位基因作為夾靠式參照物時的偏差水平。
然后,用與基因座匹配的夾靠式標準物測量樣品DNA等位基因和K562對照樣品的長度,該樣品DNA等位基因取自2個核心家庭中的7個個體。測量偏差幾乎與表2中所示的使用STR等位序列梯時得到的數值相同CSR1PO 0.28±0.12;FESFPS 0.26±0.15和F13AO1 0.22±0.18。
在測量真實等位基因時,內置式與基因座匹配的夾靠式標準物顯示出低標準偏差。這一發現表明,由于它們的電泳遷移率與它們的來源等位基因高度近似,所以在不同泳道之間以及不同的凝膠電泳條件下,它們的遷移率與它們所測量等位基因一起以疊合精確的方式變化,因此保證了測量偏差相對恒定。實施例5用運行時間測量DNA片段長度用較短(sb)和較長(lb)夾靠式與基因座匹配的或特異性標記物以及被夾靠的未知(u)樣品等位基因的運行時間,可以計算出該未知片段的長度。CSF1PO、FESFPS和F13AO1基因座的所有未知(u)樣品等位基因的長度,可以利用等式I和II,從A.L.F.裝置上顯示出的它們的運行時間計算出來。在每個基因座的側翼反向PCR引物上添加或去除4個核苷酸的基因組DNA序列,在這種條件下制備出用于每個基因座的sb和lb參照物。
EQ1速率(min/nt)=RTlb-RT/Llb-LsbEQ2Lu=RTu-RTsb/速率+Lsb從對于每個基因座的測量片段長度計算出的平均偏差和SDs很小,顯示如下CSF1PO 0.09±0.07個核苷酸;FESFPS 0.18±0.18個核苷酸和F13AO1 0.17±0.20個核苷酸。
利用來自與基因座匹配的標準物的夾靠式F13AO1測量的A.L.F.和A.L.F.顯示系統與利用Fragment ManagerTM軟件(0.16和0.14個核苷酸)或RTs(0.16和0.12個核苷酸)測量片段長度之間,在低平均等位基因偏差上幾乎沒有差異。然而,當使用基因座無關標準標記物時,這兩個系統之間的平均偏差就會因這兩個裝置而變得更大,用A.L.F.是用A.L.F.顯示系統的2倍(1.25和0.60個核苷酸,1.25和0.60個核苷酸)。
這一結果又一次表明,與基因座匹配的標準物和樣品等位基因的相對遷移率變化的阻力服從于不同操作條件。在進行這些計算中使用RTs使得它們可以被精確設計的計算機軟件利用來鑒定樣品等位基因。在用固定時間而非使用RTs比較條帶遷移距離的其他電泳系統中,也可以類似于使用RTs時的方式利用與基因座匹配的或特異性標記物,通過使用一種精確設計的電腦程序來計算遷移距離。實施例6通過改變位于被擴增STR多態性區域內的串聯重復單元的數目,制備基因座特異性夾靠式標準物,以及它們的驗證作為用于電泳校準的夾靠式標準標記物。
可以通過在STR等位基因的多態性(重復)區域中添加或刪減串聯重復單元,制備可以用作夾靠式參照物的突變等位基因,與通過在等位DNA片段的3’或5’添加或刪減核苷酸制備成的與基因座匹配的標記物相比,它們具有更強的基因座特異性。在非單元性的重復序列的情況下,通常采用添加或刪減核心重復單元?;蜃鵉13A01含有一個由4-16個重復單元組成的等位區域,因側翼序列截短每個單元包括3.2個等位基因,下面以基因座F13A01為例來解釋如何制備這些參照物。
第一步,從重復區域(表1,F13A01 rev251-Eam-1,F13A01rev275-Eam-9,F13A01 fwd268-Eam-2以及F13A01 fwd248-Eam-9)中設計兩個反向引物(短和長)和兩個正向引物(短和長)。在每個引物的5’端并入可以被限制性酶Eam1104識別的6個核苷酸,隨后是期望數目的重復單元,然后在3’端以一段特異性側翼序列結尾。
第二步,在分離PCR中,分別將來自重復區域的2個反向引物與經典F13A01正向引物各自配對,擴增實施例3第1步中的克隆后的較長等位基因或者基因座F13A01中的任一符合下述要求的等位基因含有足夠數目用于結合引物的重復單元。
第三步,用Eam1104(stratagene)消化第2步中的每個PCR產物,然后在2% NuSieve(FMC Bioproducts)mini-凝膠上電泳。從NuSieve凝膠上回收具有預期長度的消化后PCR產物,并用QLAEX(Qiagen Inc.,Chatsworth,CA)純化。
第四步,用F13A01 rev251-Eam-1反向引物與正向引物F13A01fwd190配對以及用F13A01 fwd268-Eam-2正向引物與反向引物F13A01 rev484-Eam-9配對制備出較短的PCR產物,消化后,按照廠商提供的說明書用T4 DNA連接酶將消化后的產物連接成具有2個重復單元的較短的基因座特異性夾靠式標記物。用F13A01 rev275-Eam-9反向引物與正向引物F13A01 fwd190配對以及用F13A01 fwd248-Eam-2正向引物與反向引物F13A01 rev484配對制備出較長的PCR產物,消化后,按照廠商提供的說明書用T4 DNA連接酶將消化后的產物連接成具有17個重復單元的較短的基因座特異性夾靠式標記物。測序驗證這兩個連接產物。
第五步,用基因座特異性引物擴增較短和較長的基因座特異性夾靠式標記物,并利用PCR-script amp SK(+)克隆試劑盒(stratagene)將其直接克隆到質粒DNA中用于復制。
另外還有幾種其他可以用于制備基因座特異性突變等位基因的已知技術,這些技術是本領域技術人員眾所周知的。
優選制備的突變等位基因只是通過出現或缺失1-2個重復單元而有別于它們的相鄰等位基因,因此賦予了它們與其相鄰等位基因之間如同真實等位基因彼此間一樣的關系。在不同的情況下,例如在出現不完整等位基因的情況下,優選突變等位基因的重復數目只是通過部分或多個重復單元而有別于它們的最鄰近等位基因。然后,用突變等位基因作為校準標記物對每個真實等位基因的RT進行鑒定,因為它的作為夾靠式多態性區域的長度與它的部分RT間隔成正比,該部分RT間隔是由較短標記物的RT間隔減去從較短突變等位基因到較長突變等位基因的總運行時間間隔得到的。
上述制備的突變等位夾靠式參標記的另一個重要優勢是可以利用PCR引物試劑盒擴增它們的模板DNA,該試劑盒被設計為通過結合到同一側翼區域來擴增多態性基因組基因座。因為突變等位參照物在它們的模板中并入了與真實等位基因相同或更長側翼序列,所以可以在擴增來自該基因座的未知基因組DNA等位基因的PCR中使用基因座特異性引物,對它們進行共擴增。
電泳時,將共擴增的標記物和樣品DNA一起加入到同一泳道中。由于標記物和樣品DNA具有同樣可區分(same differential)標記物,并且電泳遷移不重疊,所以它們可以容易地檢測出來。夾靠式標記物不僅可以精確地測量出未知DNA片段的長度,而且可以在樣品分析PCR步驟中作為陽性對照。
圖8a-c顯示的是F13A01特異性較短和較長夾靠式標記物的電泳掃描圖,該標記物與基因組DNA樣品STR103(8a)、對照DNAK562以及F13A01等位序列梯分別在同一PCR試管中共擴增。將3個非與基因座匹配的標準標記物(250,300和350個核苷酸)加入到各個泳道中用于比較。根據每個等位基因中重復單元的數目,通過它們的等位數目設計較短和較長突變等位基因以及真實等位基因。在圖8c中由于重疊,300個核苷酸標準標記物遮蓋了等位基因8。每組PCR產物在3個不同泳道上電泳。用夾靠式標準標記物(250/350,pharmacia)和夾靠式基因座特異性標記物(275/335,較短和較長)測量時的平均變異以及標準偏差,對于來自樣品DNA的等位基因3.2和6是1.32±0.39個核苷酸和-0.20±0.05個核苷酸,對于來自對照DNAK562是-1.17±0.40個核苷酸和-0.05±0.07個核苷酸,以及對于該等位序列梯的所有等位基因是-0.47±0.31個核苷酸和-0.02±0.08個核苷酸。
在同一PCR管中共擴增基因座特異性夾靠式參照物和樣品DNA的另一個優點是,夾靠式標記物和樣品DNA兩者的PCR產物都具有與通過Taq DNA聚合酶向它們3’末端添加的額外核苷酸相同的部分。如果校準標準DNA的不同部分在不同的PCR擴增中并入額外核苷酸,或者校準用的標準DNA不是一種PCR產物或是一種非-Taq相關PCR產物,那么通過DNA聚合酶向樣品DNA的一部分中添加額外核苷酸就是計算誤差產生的來源。而且,在共擴增條件下,Taq DNA聚合酶似乎從基因組中產生較少非特異性產物,包括斷斷續續的峰。
圖9顯示在每個泳道中的200和300個核苷酸標準DNA參照物具有無明顯額外核苷酸添加的對稱峰。用F13A01基因座特異性引物從基因組DNA樣品K562中擴增較短突變等位基因和2個真實等位基因,由于這些片段大部分添加了額外核苷酸,這些擴增產物的峰表現為向右移動。從基因組DNA樣品108中擴增的較短突變等位基因只在片段小部分添加了額外核苷酸,所以不足以使峰發生移動。從基因組DNA樣品109中擴增的較短突變等位基因和兩個真實等位基因,由于它們的DNA片段約一半通過Taq DNA聚合酶添加了額外核苷酸,這些擴增產物顯示出雙相峰。
在無論何種原因需要對經典引物對進行修飾的情況下,可以把夾靠式基因座特異性標記物越過經典引物對結合位點延伸到側翼區域以產生延伸的PCR模板。例如,來自重復區域的反向引物F13A01rev251-Eam-1不與經典引物對中的一個引物配對,而是與正向引物F13A01 fwd 1(表1)配對,在PCR擴增時可以在經典正向引物的上游產生出額外的189個核苷酸。類似地,來自重復區域的正向引物F13A01fwd248-Eam-2與反向引物F13A01 rev 628(表1),在經典反向引物的下游產生出額外的146個核苷酸。
圖10顯示的是fwd 1和Eam-1配對擴增的260bp(泳道2)PCR產物以及Eam-2和rev 628配對擴增的369 bp(泳道3)PCR產物。用Eam1104消化后,將2個DNA片段用T4 DNA連接酶連接起來,用經典引物對進行再擴增。圖10中的泳道4顯示的是從延伸后的模板中擴增得到的275 bp較短夾靠式標記物。圖10中顯示的所有樣品DNA產物都已通過測序驗證。因此,延伸并連接后的DNA片段(F13A01 fwd 1-rev 628)可以用作模板,利用根據未知DNA樣品5’和3’側翼序列設計的引物對與未知DNA樣品共擴增。
用于與基因座匹配的夾靠式標記物、基因座特異性STR標記物以及基因座特異性突變等位基因的PCR或mPCR共擴增以及共電泳的試劑盒可以包括下述物質的全部或其中的任一種1)用于擴增對于每個待測基因座的較短及較長特異性夾靠式標記物的DNA模板,2)與每個基因座的5’和3’側翼序列結合的PCR引物,3)三磷酸脫氧核糖核苷酸(dNTPs)和適用于PCR的緩沖液,4)適用于PCR的熱穩定DNA聚合酶,以及5)用于樣品DNA提取和定量的說明書和試劑,定量以確保樣品DNA的量與預先配制的模板DNAs相匹配。用于從全血中提取DNA的經典試劑包括NH4Cl、醋酸鉀、Rnase A、異丙醇、乙醇、EDTA、SDS和NaOH??梢栽O計出電腦軟件通過用夾靠式與基因座匹配的或特異性標記物校準計算出樣品片段長度。與基因座匹配的夾靠式標記物或基因座特異性STR標記物與含有基因座未知等位基因的樣品DNA在PCR和mPCR中共擴增和共電泳,可以用于鑒定(基因分型),而且在對2~20遺傳基因座進行操作時效果特好。
雖然用優選實施例對本發明進行描述,但是本領域技術人員應該認識到在所附權利要求的實質和范圍內本發明可以改進實施。
權利要求
1.能夠生產與基因座匹配的標記物的配套引物,其中的標記物用于測定遺傳基因座的多態性區域的DNA片段長度,所述配套引物包括初級正向和初級反向引物,它們分別與DNA樣品遺傳基因座的多態性區域的上游和下游側翼序列雜交,所述初級正向和初級反向引物中至少有1個包括一種第一可被檢測的標記物,所述初級正向引物與所述DNA樣品的DNA反義鏈雜交,所述初級反向引物與所述DNA樣品的DNA正義鏈雜交,所述初級正向和初級反向引物位于所述DNA樣品中包括所述多態性區域在內的第一部分的兩側;以及第一和第二次級反向引物,它們分別在第一和第二部位與所述DNA正義鏈雜交,這兩個部位都位于所述多態性區域的下游,所述第一部位位于所述DNA樣品的所述第一部分內,所述第二部位位于所述第一部分的下游。
2.權利要求1所述的配套引物,其中進一步還包括在所述第一和第二次級反向引物上分別帶有第二和第三可被檢測的標記物。
3.權利要求1所述的配套引物,其中所述的第一和第二次級反向引物分別具有比所述初級反向引物短或長的選定數目的核苷酸。
4.能夠生產與基因座匹配的標記物的配套引物,該標記物用于測定遺傳基因座的多態性區域的DNA片段長度,所述配套引物包括初級正向和初級反向引物,它們分別與DNA樣品遺傳基因座中多態性區域的上游和下游側翼序列雜交,所述初級正向和反向引物中至少有1個包括一種第一可被檢測的標記物,所述初級正向引物與所述DNA樣品的DNA反義鏈雜交,所述初級反向引物與所述DNA樣品的DNA正義鏈雜交,所述初級正向和初級反向引物位于所述DNA樣品中包括所述多態性區域在內的第一部分的兩側;以及第一和第二次級正向引物,它們分別在第一和第二部位與所述DNA反義鏈雜交,這兩個部位都位于所述多態性區域的上游,所述第一部位位于所述DNA樣品的所述第一部分內,所述第二部位位于所述第一部分的上游。
5.權利要求3的配套引物,其中進一步還包括在所述第一和第二次級正向引物上分別帶有第二和第三可被檢測的標記物。
6.權利要求4所述的配套引物,其中所述的第一和第二次級反向引物分別具有比所述初級正向引物短或長的選定數目的核苷酸。
7.一種用于測定遺傳基因座多態性區域DNA片段長度的方法,其中包括以下步驟制備在第一和第二部位上與DNA正義鏈結合的第一和第二次級反向引物,所述的兩個部位都位于遺傳基因座多態性區域的下游;將所述第一和第二次級反向引物與初級正向和初級反向引物配合使用,通過聚合酶鏈反應擴增與所述多態性區域的等位基因的較短和較長基因座匹配的夾靠式標記物,所述初級正向及初級反向引物分別與所述多態性區域的上游和下游側翼序列雜交,所述初級正向引物與DNA的反義鏈雜交,所述初級反向引物與DNA的正義鏈雜交,所述初級正向和反向引物位于所述DNA樣品中包括所述多態性區域在內的第一部分的兩側,所述第一次級反向引物雜交到位于所述第一部分內的部位上,所述第二次級反向引物雜交到位于所述第一部分下游的部位上;以及檢測與每個等位基因的較短和較長基因座匹配的標記物。
8.權利要求7所述的方法,其中所述檢測步驟包括利用電泳分離所述與較短和較長基因座匹配的夾靠式標記物。
9.用于測定多態性遺傳基因座中DNA片段長度的與基因座匹配的標記物,該標記物是用下述方法生產的擴增分別與DNA樣品多態性區域的上游和下游側翼序列雜交的初級正向和初級反向引物,所述初級正向和初級反向引物中至少有1個包括一種第一可被檢測的標記物,所述初級正向引物與所述DNA樣品的DNA反義鏈雜交,所述初級反向引物與所述DNA樣品的DNA正義鏈雜交,所述初級正向和初級反向引物位于所述DNA樣品中包括所述多態性區域在內的第一部分的兩側;第一和第二次級反向引物分別在第一和第二部位與所述DNA正義鏈結合,這兩個部位都位于所述多態性區域的下游,所述第一部位位于所述DNA樣品的所述第一部分內,所述第二部位位于所述第一部分的下游;以及從上述擴增步驟中獲得較短和較長的與基因座匹配的夾靠式標記物,該標記物分別比所述第一部分更短及更長。
10.一種制備用于測定多態性遺傳基因座中DNA片段長度的與基因座匹配的標記物的方法,該方法包括以下步驟擴增分別與DNA樣品多態性區域的上游和下游側翼序列雜交的初級正向和初級反向引物,所述初級正向和初級反向引物中至少有1個包括一種第一可被檢測的標記物,所述初級正向引物與所述DNA樣品的DNA反義鏈雜交,所述初級反向引物與所述DNA樣品的DNA正義鏈雜交,所述初級正向和初級反向引物位于所述DNA樣品中包括所述多態性區域在內的第一部分的兩側;第一個和第二個次級反向引物分別在第一和第二部位與所述DNA正義鏈雜交,這兩個部位都位于所述多態性區域的下游,所述第一部位位于所述DNA樣品的所述第一部分內,所述第二部位位于所述第一部分的下游;以及從上述擴增步驟中獲得較短和較長的與基因座匹配的夾靠式標記物,該標記物分別比所述第一部分更短及更長。
11.用于測定多態性遺傳基因座中DNA片段長度的與基因座匹配的標記物,該標記物是用下述方法生產的擴增分別與DNA樣品多態性區域的上游和下游側翼序列雜交的初級正向和初級反向引物,所述初級正向和初級反向引物中至少有1個包括一種第一可被檢測的標記物,所述初級正向引物與所述DNA樣品的DNA反義鏈雜交,所述初級反向引物與所述DNA樣品的DNA正義鏈雜交,所述初級正向和初級反向引物位于所述DNA樣品中包括所述多態性區域在內的第一部分的兩側;第一和第二次級正向引物分別在第一和第二部位與所述DNA反義鏈雜交,這兩個部位都位于所述多態性區域的上游,所述第一部位位于所述DNA樣品的所述第一部分內,所述第二部位位于所述第一部分的上游;以及從上述擴增步驟中獲得較短和較長的與基因座匹配的夾靠式標記物,該標記物分別比所述第一部分更短及更長。
12.一種用于測定遺傳基因座多態性區域DNA片段長度的方法,其中包括以下步驟制備在第一和第二部位上與DNA反義鏈雜交的第一和第二次級正向引物,所述的兩個部位都位于遺傳基因座多態性區域的上游;將所述第一和第二次級正向引物與初級正向和初級反向引物配合使用,通過聚合酶鏈反應擴增較短和較長與基因座匹配的夾靠式標記物,所述初級正向及初級反向引物分別與所述多態性區域的上游和下游側翼序列雜交,所述初級正向引物與DNA的反義鏈雜交,所述初級反向引物與DNA的正義鏈雜交,所述初級正向和初級反向引物位于所述DNA樣品中包括所述多態性區域在內的第一部分的兩側,所述第一次級反向引物雜交到位于所述第一部分內的部位上,所述第二次級反向引物雜交到位于所述第一部分上游的部位上;以及檢測與每個等位基因的較短和較長基因座匹配的標記物。
13.一種制備與基因座匹配的標記物的方法,該標記物針對于包含遺傳基因座的短串聯重復(STR),所述方法包括下述步驟把從包含遺傳基因座的STR中擴增到的等位序列梯或基因組DNA克隆到質粒載體中,所述等位序列梯是用針對于包括所述STR基因座的基因組序列的初級正向和初級反向引物制備而得的;將質粒載體轉化到宿主中;分離所述等位序列梯或基因組DNA中的較短及較長的等位基因;標記初級正向引物以產生一種帶標記的初級正向引物;通過從所述初級反向引物中刪減掉第一批已知數目的核苷酸,以及通過給所述初級反向引物添加上第二批已知數目的核苷酸,分別制備出針對STR基因座的較短和較長的次級反向引物;用所述較短等位基因作為PCR反應中的模板,該PCR反應使用所述的帶標記的初級正向引物以及所述的較短次級反向引物;以及用所述較長等位基因作為PCR反應中的模板,該PCR反應使用所述的帶標記的初級正向引物以及所述的較長次級反向引物。
14.用于產生基因座特異性短串聯重復標記物的配套引物,所述標記物用于測定包含短串聯重復(STR)序列的多態性遺傳基因座中等位基因的DNA片段長度,所述配套引物包括初級正向引物和初級反向引物,它們分別與包含STR核苷酸序列的DNA樣品多態性區域的上游和下游側翼序列雜交;兩個與所述DNA樣品的DNA正義鏈雜交的次級反向引物;兩個與所述DNA樣品的DNA反義鏈雜交的次級正向引物,所述的兩個次級反向引物和所述的兩個次級正向引物與所述多態性區域內的寡核苷酸序列雜交。
15.一種用于測定多態性遺傳基因座中等位基因的DNA片段長度的方法,所述遺傳基因座中包含短串聯重復(STR)序列,所述方法包括以下步驟制備兩個與DNA的正義鏈雜交的次級反向引物以及兩個與含STR核苷酸序列的DNA反義鏈雜交的次級正向引物,所述的兩個次級反向引物和所述的兩個次級正向引物與含所述STR序列的所述DNA的多態性區域中的核苷酸序列雜交;將所述的兩個次級反向引物與一個同所述多態性區域的上游側翼序列雜交的初級正向引物配合使用,以及將所述的兩個次級正向引物與一個同所述多態性區域下游側翼序列雜交的初級反向引物配合,通過聚合酶鏈反應從所述多態性區域中擴增出PCR產物,所述擴增步驟產生了兩個較短和兩個較長的PCR產物,所述的兩個較短PCR產物中的第一產物在其一端上具有所述的兩個次級反向引物中的第一引物而且在其另一端具有所述初級正向引物,所述的兩個較短PCR產物中的第二產物在其一端上具有所述的兩個次級正向引物中的第一引物而且在其另一端具有所述初級反向引物,所述的兩個較長PCR產物中的第一產物在其一端上具有所述的兩個次級反向引物中的第二引物而且在其另一端具有所述初級正向引物,所述的兩個較長PCR產物中的第二產物在其一端上具有所述的兩個次級正向引物中的第二引物而且在其另一端具有所述初級反向引物;連接上述的兩個較短PCR產物以形成一個較短的變異等位基因標記物;連接上述的兩個較長PCR產物以形成一個較長的變異等位基因標記物;檢測所述的較短和較長變異等位基因標記物。
16.用于測定遺傳基因座的STR多態性區域中DNA片段長度的基因座特異性短串聯重復(STR)標記物,該標記物是用下述方法制備而成的用與DNA樣品中的STR多態性區域的上游及下游側翼序列雜交的初級正向和初級反向引物、與所述DNA樣品中DNA正義鏈雜交的兩個次級反向引物和與所述DNA樣品中DNA反義鏈雜交的兩個次級正向引物,擴增出至少兩個較短和兩個較長的DNA產物,其中所述的兩個次級反向引物和所述的兩個次級正向引物與所述多態性區域內的核苷酸雜交;將上述的兩個較短DNA產物連接以形成一個較短的變異等位基因標記物;以及將上述的兩個較長DNA產物連接以形成一個較長的變異等位基因標記物。
17.一種制備基因座特異性短串聯重復標記物的方法,該標記物用于測定含短串聯重復(STR)序列的多態性遺傳基因座中DNA片段的長度,所述方法包括以下步驟用與DNA樣品中STR多態性區域的上游及下游側翼序列雜交的初級正向和初級反向引物、與所述DNA樣品中DNA正義鏈雜交的兩個次級反向引物和與所述DNA樣品中DNA反義鏈雜交的兩個次級正向引物,擴增出至少兩個較短和兩個較長的DNA產物,其中所述的兩個次級反向引物和所述的兩個次級正向引物與所述多態性區域內的核苷酸雜交;將上述的兩個較短DNA產物連接以形成一個較短的變異等位基因標記物;以及將上述的兩個較長DNA產物連接以形成一個較長的變異等位基因標記物。
18.用于與基因座匹配的夾靠式標記物、基因座特異性STR標記物以及基因座特異性變異等位基因的PCR或多重PCR共擴增以及共電泳的試劑盒,該試劑盒包括用于至少一個待測基因座的較短和較長基因座特異性夾靠式標記物的DNA模板。
19.權利要求18所述的試劑盒,其中包括用于多個待測基因座的DNA模板。
20.權利要求18所述的試劑盒,其中進一步包括至少一種下列物質適用于PCR的dNTP和緩沖液,適用于PCR的熱穩定性DNA聚合酶,以及用于樣品DNA提取和定量的說明和試劑,以確保樣品DNA的量與預先制備的模板DNA相匹配。
全文摘要
本發明涉及一種分析系統、試劑盒和方法,它們可以用于在粘性介質中電泳時利用夾靠式與基因座匹配的或特異性校準DNA參照物檢測遺傳基因座多態性區域的長度。
文檔編號C12Q1/68GK1270638SQ98809255
公開日2000年10月18日 申請日期1998年9月17日 優先權日1997年9月18日
發明者彼得·C·道, 劉德邦 申請人:奧利戈生物工程技術有限公司