專利名稱::一種基于dna分子標簽技術和dna不完全打斷策略的pcr測序方法
技術領域:
:本發明涉及核酸測序
技術領域:
,特別是PCR測序
技術領域:
。另一方面,本發明還涉及PCR-index/barcode
技術領域:
。本發明的方法特別適用于第二代測序技術,尤其是第二代測序技術中的Pair-end測序技術,還可以用于HLA基因分型。
背景技術:
:PCR測序(PCRsequencing)方法是通過PCR的方法得到目的基因DNA片段,再通過對所得到的目的基因DNA片段進行DNA序列檢測,從而得到目的基因DNA序列信息的一種技術,其具有直觀、準確的特點,長久以來廣泛應用于基因突變檢測以及基因分型等領域。PCR-index/barcode技術,通過在PCR引物的5,末端添加引物標簽(primerindex)序列,可在PCR過程中對每個樣本引入獨特的引物標簽,使樣本在利用第二代DNA測序技術(以IlluminaGA,Roche454,ABISolid等測序儀為代表的可大規模,高通量,單分子測序的測序儀)檢測過程中,除PCR環節必須逐個樣本處理外,其它實驗環節可把多個樣本混在一起同時處理,最終每個樣本的檢測結果可以通過其獨特的引物標簽序列找回;該方法具有成本低,通量大和可同時檢測大量樣本的多個不同基因位點的特點。第二代DNA測序技術與第一代(Sanger法)DNA測序技術相比,其可連續測序的長度較短。以IlluminaGA(Illumina公司的GenomeAnalyzer測序儀,簡稱IlluminaGA)為例,當前IlluminaGA的最大測序長度為200bp,當PCR產物的長度大于200bp,利用IlluminaGA測序,直接采取PCR測序的方法,不能把整個PCR產物測通,得不到被檢測PCR產物的全部DNA序列信息的。短的測序讀長限制了第二代測序技術的應用,除了通過逐步改進測序技術來獲得更長的實際測序讀長外,開發可克服第二代DNA測序儀現有測序讀長在PCR測序應用領域不足的新技術也成為當務之急。
發明內容當前利用第二代測序技術,對大量樣本中的特定基因相關序列同時進行測序分析時,一般會采用PCR測序的策略,直接利用引物標簽+二代測序技術的組合。當所用測序儀的測長可以覆蓋整個PCR產物的長度時,上述技術就足夠滿足要求了。但當所用測序儀的測長不夠覆蓋整個PCR產物的長度時,要么更換具有更長測長的第二代測序儀(如用Roche454GS-FLX)替代IlluminaGA,如果測長還不滿足要求的話,只能犧牲成本和通量,改用第一代測序儀。現實情況是,IlluminaGA具有超高測序通量,但其測長才200bp;Roche454GS-FLX的測長雖然可以達到500bp,但其測序成本較高,通量較小;第一代測序儀的測長雖然可以達到IOOObp以上,但其通量和成本沒法和第二代測序儀相比。有沒有能夠兼顧成本和通量,能提高測序儀可以測通的PCR產物長度的技術呢?本專利中的引物標簽+DNA不完全打斷策略+二代測序技術的組合能在充分利用第二代測序儀高通量、低成本特點的同時,使測序儀能夠測通的PCR產物長度達到測序儀本身測長以上,大大擴大了其適用范圍。其中,本發明的所采用的二代測序技術包括第二代測序技術中的Pair-end測序技術,以及針對PCR模板有DNA參考序列(DNAReferenceSequence)的PCR測序技術。本發明提供了用于PCR測序的方法,通過所述方法減少了自身測序讀長較短造成的限制,擴大了第二代DNA測序技術在PCR測序應用領域的應用。引物標簽的設計根據所應用的實驗平臺不同而不同,考慮IlluminaGA測序平臺本身的特點,本發明在設計引物標簽時主要考慮了以下幾點1引物標簽序列中避免3個以上(包括3個)單堿基重復序列,2:所有引物標簽的同一位點中堿基A和堿基C的總含量占所有堿基含量的30%-70%之間,3引物標簽序列本身的GC含量在40-60%之間,4引物標簽之間序列差異度大于4個堿基,5引物標簽序列中避免出現與IlluminaGA測序引物相似度高的序列,6減少引物標簽序列添加到PCR引物上后,對PCR引物造成的嚴重發卡(hairpin),二聚體(dimer)情況的出現。本發明通過PCR反應在PCR產物兩端各引入一個引物標簽(引物標簽序列可以相同也可以不同),使PCR產物任何一端的引物標簽都可以特異的標記PCR產物的樣本信息。所得PCR產物經過經不完全打斷。所謂不完全打斷,指打斷終產物中包含完整的未被打斷的PCR產物和局部打斷的PCR產物。所述打斷方法包括但不限于化學打斷方法(例如酶切)和物理打斷方法,所述物理打斷方法包括超聲波打斷方法或機械打斷方法等。打斷的DNA經2%瓊脂糖電泳,割膠純化回收從測序儀最大讀取長度到測序儀可適用的最長DNA長度范圍之間的所有DNA條帶(IlluminaGA測序儀可適用的最長DNA為700bp,此長度為原始DNA長度,沒有包括文庫接頭序列長度)。純化回收方法包括但不限于電泳割膠回收,也可以是磁珠回收等。回收的DNA片段再按照第二代測序儀測序文庫構建的流程構建測序文庫,然后進行測序,優選為采用PCR-FREE測序文庫構建的流程構建測序文庫,測序方法優選采用Pair-End方法測序。PCR-Free測序文庫構建的流程按照本領域技術人員已知方法構建。在得到測序總數據中,通過引物標簽序列可以找到所有所測樣本的序列信息,利用BWA把各個測序序列定位到PCR產物的相應DNA參考序列(ReferenceSequence)上,再通過測序序列之間的重疊和連鎖關系拼接出PCR產物的完整序列(圖1)。此處連鎖是指由Pair-End測序特點決定的pair-end連鎖關系。“接頭(adapter)”或“文庫接頭(libraryadapter)”標簽技術是指通過對多個測序文庫添加不同文庫接頭(不同文庫接頭的組成序列不同,序列不同的部分稱為接頭標簽(adapterindex)),構建標簽測序文庫,從而可實現多個不同標簽測序文庫混合測序,且最終各個標簽測序文庫的測序結果可相互區分的一種文庫標簽技術。基于DNA分子標簽技術和DNA不完全打斷策略的PCR測序方法的使用可在不增加引物標簽數目的情況下,大大提高可唯一標記的樣本數目。結合文庫接頭標簽技術的PCR-FREE的文庫構建方法,是指將文庫接頭直接連接至測序文庫中的DNA片段兩端,文庫接頭的導入過程因為沒有PCR的參與,因此稱作PCR-Free文庫構建。其中接入方法可以采用DNA連接酶進行連接。其整個文庫構建過程中無PCR的參與,避免了在高序列相似度的PCR產物混合(pooling)文庫的構建過程中,由PCR引入錯誤而導致最后結果的不準確性。在本發明中,通過對正反PCR引物添加引物標記,結合DNA不完全打斷策略,使第二代測序技術應用于PCR測序領域時,實際可測得的PCR產物長度超過測序儀的最大測序長度。在本發明的一個方面中,提供了一組引物標簽(primerindex),其包括表1所示95對引物標簽中的至少10對,或至少20對,或至少30對,或至少40對,或至少50對,至少60對,或至少70對,或至少80對,或至少90對,或95對(或者所述一組引物標簽由表1所示95對引物標簽中的10-95對(例如10-95對,20-95對,30-95對,40-95對,50-95對,60-95對,70-95對,80-95對,90-95對,或95對)組成),并且所述一組引物標簽優選地至少包括表1所示95對引物標簽中的PI-I至PI-10,或PI-Il至PI-20,或PI-21至PI-30,或PI-31至PI-40,或PI-41至PI-50,或PI-51至PI-60,或PI-61至PI-70,或PI-71至PI-80,或PI-81至PI-90,或PI-91至PI-95,或者它們任何兩個或者多個的組合。根據本發明另一方面,還提供了所述的引物標簽用于PCR測序方法的用途,其中特別是,每一對引物標簽與用于擴增待測目的序列的PCR引物對組合成一對標簽引物,正反PCR引物的5’端分別具有(或者任選通過連接序列連接)正向引物標簽和反向引物標簽。在本發明的一個具體實施方式中,所述PCR引物是用于擴增HLA的特定基因的PCR引物,優選是用于擴增HLA-A/B2,3,4號外顯子和HLA-DRB12號外顯子的PCR引物,優選的所述PCR引物如表2所示。本發明另一方面中,提供了上文所述一組引物標簽與用于擴增待測目的序列的PCR引物對組合成的一組標簽引物,其中每一對引物標簽與PCR引物對組合成一對標簽引物,正反PCR引物的5’端分別具有(或者任選通過連接序列連接)正向引物標簽和反向引物標簽。在本發明的一個具體實施方式中,上文所述標簽引物中的PCR引物是用于擴增HLA的特定基因的PCR引物,優選是用于擴增HLA-A/B2,3,4號外顯子和HLA-DRB12號外顯子的PCR引物,優選的所述PCR引物如表2所示。在本發明的另一個具體實施方式中,所述的標簽引物用于PCR測序方法。本發明另一方面中,提供了一種測定樣品中目的核酸的核苷酸序列的方法,其包括1)提供η個樣品,η為大于等于1的整數,所述樣品優選地來自哺乳動物,更優選是人,特別是人的血樣;可選地,將待分析的η個樣品分成m個小組,m為整數且η>m>1;2)擴增對于每一個樣品,使用一對標簽引物,在存在來自該樣品的模板時,在適于擴增目的核酸的條件下進行PCR擴增,其中,每一對標簽引物由包含引物標簽的正向標簽引物和反向標簽引物(均可以是簡并引物)構成,其中正向標簽引物和反向標簽引物所包含的引物標簽可以相同或者不同;不同樣品所用標簽引物對中的引物標簽彼此不同;3)打斷將所得的PCR產物文庫進行不完全打斷;4)測序將回收的DNA混合物利用二代測序技術,優選的是Pair-End技術(例如IlluminaGA,IlluminaHiseq2000)進行測序,獲得打斷后的DNA的序列;5)拼接基于每個樣品獨特的引物標簽將獲得的測序結果與樣品一一對應,利用比對程序(例如Blast,BffA程序)把各個測序序列定位到PCR產物的相應DNA參考序列上,通過序列重疊和連鎖關系,從打斷后的DNA的序列拼接出完整的目的核酸。本發明另一方面,提供了一種測定樣品中目的核酸的核苷酸序列的方法,其包括1)提供η個樣品,η為大于等于1的整數,所述樣品優選地來自人,特別是人的血樣;可選地,將待分析的η個樣品分成m個小組,m為整數且η>m彡1;2)擴增對于每一個樣品,使用一對標簽引物,在存在來自該樣品的模板時,在適于擴增目的核酸的條件下進行PCR擴增,其中,每一對標簽引物由包含引物標簽的正向標簽引物和反向標簽引物(均可以是簡并引物)構成,其中正向標簽引物和反向標簽引物所包含的引物標簽可以相同或者不同;不同樣品所用標簽引物對中的引物標簽彼此不同;3)混合將各樣品的PCR擴增產物混合在一起,獲得PCR產物文庫;4)打斷將所得的PCR產物文庫進行不完全打斷;5)建庫將打斷后的PCR產物文庫構建PCR-Free測序文庫,回收位于所用測序儀最大讀長長度到所用測序儀適用的最長DNA長度范圍之間的所有DNA條帶,可以對文庫添加不同的文庫接頭(adapter)以區分不同的PCR-Free測序文庫;6)測序將回收的DNA混合物利用二代測序技術,優選的是Pair-End技術(例如IlluminaGA,IlluminaHiseq2000)進行測序,獲得打斷后的DNA的序列;7)拼接基于各個文庫不同的文庫接頭序列和每個樣品獨特的引物標簽將獲得的測序結果與樣品一一對應,利用比對程序(例如Blast,BWA程序)把各個測序序列定位到PCR產物的相應DNA參考序列上,通過序列重疊和連鎖關系,從打斷后的DNA的序列拼接出完整的目的核酸。在本發明的一個具體實施方式中,在上文所述的測序方法中,每一對引物標簽與PCR引物對組合成一對標簽引物,正反PCR引物的5’端分別具有(或者任選通過連接序列連接)正向引物標簽和反向引物標簽。在本發明的一個具體實施方式中,在上文所述的測序方法中,所述PCR引物是用于擴增HLA的特定基因的PCR引物,優選是用于擴增HLA-A/B的2,3,4號外顯子以及HLA-DRB12號外顯子的PCR引物,優選的所述PCR引物如表2所示。在本發明的一個具體實施方式中,在上文所述的測序方法中,所述引物標簽針對PCR引物進行設計,優選針對用于擴增HLA的特定基因的PCR引物進行設計,更優選針對用于擴增HLA-A/B的2,3,4號外顯子以及HLA-DRB12號外顯子的PCR引物,特別是如表2所示的PCR引物進行設計,所述引物標簽特別是包括表1所示95對引物標簽中的至少10對,或至少20對,或至少30對,或至少40對,或至少50對,至少60對,或至少70對,或至少80對,或至少90對,或95對(或者所述一組引物標簽由表1所示95對引物標簽中的10-95對(例如10-95對,20-95對,30-95對,40-95對,50-95對,60-95對,70-95對,80-95對,90-95對,或95對)組成),并且所述一組引物標簽優選地至少包括表1所示95對引物標簽中的PI-I至PI-10,或PI-Il至PI-20,或PI-21至PI-30,或PI-31至PI-40,或PI-41至PI-50,或PI-51至PI-60,或PI-61至PI-70,或PI—71至PI—80,或PI—81至PI—90,或PI—91至PI-95,或者它們任何兩個或者多個的組合。在本發明的一個具體實施方式中,在上文所述的測序方法中,所述DNA打斷包括化學打斷方法和物理打斷方法,其中所述化學方法包括酶切方法,所述物理打斷方法包括超聲波打斷方法或機械打斷方法。所述DNA打斷后,分離450-750bp長度的片段。本發明另一方面中,提供了一種HLA分型方法,包括使用上文所述的測序方法對來自患者的樣品(特別是血樣)進行測序,以及將測序結果與HLA數據庫(如IMGTHLA專業數據庫)中的標準序列數據比對,序列比對結果100%匹配的即為對應樣本的HLA基因型別。圖1為引物標簽標記,DNA打斷和DNA測序后,序列拼接圖示。第N號樣本的PCR產物兩端引入了正反引物標簽序列Index-N-F/R(l),PCR產物經物理方法打斷后的產物中包括一端帶有引物標簽序列的產物,兩端都不帶引物標簽序列的產物,完全未被打斷的產物,割膠純化回收位于測序儀最大讀長長度到測序儀適用的最長DNA長度范圍之間的所有DNA條帶用于測序(2),利用Index-N-F/R在測序結果中找回屬于第N號樣本的PCR產物的測序結果,利用PCR產物已知的參考序列信息定位各個測序序列相對參考的位置,并根據測序序列之間的重疊和連鎖關系組裝成完整的PCR產物的測序結果(3,4)。圖2為1號樣本HLA-A/B/DRB1相應外顯子PCR產物電泳結果,從電泳圖上看,PCR產物為一系列片段大小300bp-500bp的單一條帶,其中泳道M是分子量標記物(DL2000,Takara公司),泳道1-7為1號樣本的HLA-A/B/DRB1各外顯子(A2、A3、A4、B2、B3、B4、DRB1-2)PCR擴增產物,陰性對照(N)無擴增條帶。其它樣品的結果與此類似。圖3為HLA-Mix打斷后DNA電泳情況(割膠前后),割膠區域為450_750bp區域。其中泳道M是分子量標記物(NEB-50bpDNALadder),泳道1是割膠前HLA-Mix的電泳情況,泳道2是割膠后HLA-Mix的膠圖。圖4:1號樣本的一致性(consensus)序列構建程序截圖,示例說明了根據引物標簽和DNA片段之間的重疊關系拼接出PCR產物的完整序列。具體實施例方式下面將結合實施例對本發明的實施方案進行詳細描述,但是本領域技術人員將會理解,下列實施例僅用于說明本發明,而不應視為限定本發明的范圍。在本發明的實施例中,通過采取引物標簽+DNA不完全打斷策略+IllumiaGA測序儀Pair-End100測序技術的組合對95個樣本的HLA-A/B2,3,4號外顯子以及HLA-DRB12號外顯子的基因分型(PCR產物長度大小處于290bp-500bp之間),證明該策略可以在充分發揮第二代測序儀高通量、低成本特點的同時,可以實現對超過測序儀本身測長以上的基因片段的分型。原理將待分析的樣本,通過PCR反應在HLA-A/B2,3,4號外顯子以及HLA-DRB12號外顯子的PCR產物兩端引入引物標簽,使其特異的標記PCR產物的樣本信息。將各組內樣品的HLA-A/B/DRB1三個位點的PCR擴增產物混合在一起,獲得PCR產物文庫;所得PCR產物文庫經過超聲不完全打斷后,構建PCR-Free測序文庫,測序文庫經2%低熔點瓊脂糖電泳,割膠純化回收位于450bp-750bp長度范圍之間的所有DNA條帶(PCR-Free測序文庫的構建過程中在DNA片段的兩端都添加上了文庫接頭,使DNA片段在電泳圖上體現的長度比實際長度大了250bp左右,因此,此處回收450bp-700bp的片段,實際上相當于回收原長度為200bp-500bp的DNA片段)。回收的DNA經IlluminaGAPE-100測序。通過引物標簽序列可以找到所有所測樣本的序列信息,再通過已知DNA片段的參考序列信息和DNA片段序列之間的重疊和連鎖關系組裝出整個PCR產物的序列,再通過與HLA-A/B/DRB1相應外顯子的標準數據庫的比對結果可組裝出原PCR產物的全序列,實現HLA-A/B/DRB1的基因分型。實施例1樣本提取使用KingFisher自動提取儀(美國Thermo公司)從95份已知HLA-SBT分型結果的血樣(中國造血干細胞捐獻者資料庫(以下稱“中華骨髓庫”))中提取DNA。主要步驟如下取出6個Kingfisher自動提取儀配套的深孔板及1個淺孔板,根據說明書分別加入一定量配套的試劑并做好標記,將所有已加好試劑的孔板按要求置于相應的位置,選定程序“Bioeasy_200ulBloodDNA_KF.msz”程序,按下“star”執行該程序進行核酸提取。程序結束后收集plateElution中的IOOul左右的洗脫產物即為提取的DNA。實施例2PCR擴增通過合成在5’末端具有不同引物標簽的PCR引物制作不同的PCR標簽引物,這樣不同的PCR標簽引物可以用于不同的樣本,所述PCR引物是針對HLA-A/B的2,3,4號外顯子以及HLA-DRB12號外顯子的PCR引物。其后通過PCR反應在PCR產物兩端引入引物標簽,從而特異地標記了來自不同樣本的PCR產物。以95套PCR標簽引物來分別擴增95份DNA樣本,每套PCR標簽引物由一對雙向引物標簽(表1)和用于擴增HLA-A/B的2,3,4號外顯子以及HLA-DRB12號外顯子的PCR引物(表2)組成,其中每個正向PCR引物的5’末端上連接一對引物標簽的正向引物標簽,而反向PCR引物的5’末端上連接一對引物標簽的反向引物標簽。引物標簽在引物合成時直接添加在PCR引物的5’末端。把實施例1的樣本提取步驟中所得的95份DNA,依次編號1_95,PCR反應在96孔板中進行,共7板,編號分別為HLA-P-A2、HLA-P-A3、HLA-P-A4、HLA-P-B2、HLA-P-B3、HLA-P-B4以及HLA-P-DRBl-2(A2/3/4,B2/B3/B4,DRB1-2表示擴增的位點),板內設置一個不添加模板的陰性對照,陰性對照所用引物與模板1的對應引物相同。實驗的同時,記錄下每對引物標簽對應的樣本編號信息。表1,引物標簽的相關信息表2,未添加引物標簽前用于擴增HLA-A/B/DRB1相應外顯子的PCR引物D2-F1,D2-F2,D2-F3,D2-F4,D2-F5,D2-F6,D2-F7為擴增HLA-DRB12號外顯子的正向引物,D2-R為擴增HLA-DRB12號外顯子的反向引物。HLA-A/B/DRB1的PCR程序如下96"C2min95°C30s—60°C30s—72°C20s(32cycles)15°C⑴HLA-A/B的PCR反應體系如下所有試劑均購自普洛麥格(北京)生物技術有限公司(Promega)HLA-DRBl的PCR反應體系如下其中PInf-A/B/D2-F1/2/3/4/5/6/7表示引物5’末端帶有第η號正向引物標簽序列(表1)的HLA-A/B/DRB1的F引物,PInf-A/B/D2-R2/3/4表示引物5’末端帶有第η號反向引物標簽序列的HLA-A/B/DRB1的R引物(此處η<95),其它依次類推。且每個樣本對應特定的一套PCR引物(PInf-A/B/D2-F1/2/3/4/5/6/7,PInf_A/B/D2_R2鋪)。PCR反應在Bio-Rad公司的PTC-200PCR儀上運行。PCR完成后,取2ulPCR產物經的瓊脂糖凝膠電泳檢測。圖2顯示了1號樣本HLA-A/B/DRB1相應外顯子PCR產物電泳結果,DNA分子標記為DL2000(Takara公司),膠圖上有一系列片段大小為300bp_500bp單一條帶,表明1號樣本的HLA-A/B/DRB1各外顯子(A2、A3、A4、B2、B3、B4、DRB1-2)PCR擴增成功,陰性對照(N)無擴增條帶。其它樣品的結果與此類似實施例3PCR產物混合和純化從96孔板HLA-P-A2剩余的PCR產物中(陰性對照除外)各取20ul混合在一個3ml的EP管中,標記為HLA-A2-Mix,對其它6個96孔板進行同樣的操作,分別標記為HLA-A3-Mix、HLA-A4-Mix,HLA_B2_Mix、HLA_B3_Mix、HLA-B4-Mix和HLA_D2_Mix,震蕩混勻,從HLA-A2-Mix、HLA_A3_Mix、HLA_A4_Mix、HLA_B2_Mix、HLA_B3_Mix、HLA_B4_Mix和HLA-D2-Mix中各取200ul混合在一個3ml的EP管中,標記為HLA-Miχ,從HLA-Mix中取500ulDNA混合物經QiagenDNAPurificationkit試劑盒(QIAGEN公司)過柱純化(具體純化步驟詳見說明書),純化所得的200ulDNA,經Nanodrop8000(ThermoFisherScientific公司)測定HLA-MixDNA濃度為48ng/ul。實施例4PCR產物的打斷,以及IlluminaGAPCR-Free測序文庫的構建1.DNA打斷從純化后的HLA-Miχ中取總量5ug的DNA用帶AFA纖維扣蓋的Covaris微管在CovarisS2DNA打斷儀(Covaris公司)上打斷。打斷條件如下頻率掃描(frequencysweeping)2.打斷后純化將HLA-Mix的所有打斷產物用QIAquickPCRPurificationKit回收純化,分別溶于37.5ul的EB(QIAGENElutionBuffer)中;3.末端修復反應對打斷后純化的HLA-Mix進行DNA末端修復反應,體系如下(試劑均購自Enzymatics公司)反應條件為恒溫混勻器(Thermomixer,Eppendorf公司)20°C溫浴30min。反應產物經QIAquickPCRPurificationKit回收純化,溶于34μ1的^(QIAGENElutionBuffer)中。4.3,末端加A反應上一步回收DNA的3’末端加A反應,體系如下(試劑均購自Enzymatics公司)反應條件為恒溫混勻器(Thermomixer,Eppendorf公司)37°C溫浴30min。反應產物經MiniElutePCRPurificationKit(QIAGEN公司)回收純化,溶于13μ1的EB溶液(QIAGENElutionBuffer)中。5.連接IlluminaGAPCR-Free文庫接頭(adapter)術語“PCR-Free文庫接頭(adapter)”是指經設計的一段堿基,其主要作用是輔助固定DNA分子在測序芯片上以及提供通用測序引物的結合位點,PCR-Free文庫接頭可以通過DNA連接酶將其直接連接至測序文庫中的DNA片段兩端,文庫接頭的導入過程因為沒有PCR的參與,因此稱作PCR-Free文庫接頭。加A后的產物連接IlluminaGAPCR-Free文庫接頭,體系如下(試劑均購自Illumina公司)反應條件為恒溫混勻器(Thermomixer,Eppendorf公司)20°C溫浴15min。反應產物經AmpureBeads(BeckmanCoulterGenomics)純化后溶于50ul去離子水,經熒光定量PCR(QPCR)檢測到DNA濃度結果如下6.割膠回收取30μLHLA-Mix用2%低熔點瓊脂糖膠進行回收。電泳條件為100V,IOOmin0DNAmarker為NEB公司的50bpDNAmarker。割膠回收450_750bp長度范圍的DNA片段(附圖3)。膠回收產物經QIAquickPCRPurificationKit(QIAGEN公司)回收純化,純化后體積為32ul,經熒光定量PCR(QPCR)檢測到DNA濃度結果為10.16nM。實施例5IlluminaGA測序根據QPCR檢測結果,取IOpmolDNA用IlluminaGAΡΕ-100程序測序,具體操作流程詳見IlluminaGA操作說明書(IlluminaGAIIχ)。實施例6結果分析IlluminaGA產出的測序結果是一系列DNA序列,通過查找測序結果中的正反引物標簽序列和引物序列,建立各個引物標簽對應樣本HLA-A/B/DRB1各外顯子PCR產物測序結果的數據庫。通過BWA(Burrows-WheelerAligner)把各外顯子的測序結果定位在相應外顯子的參考序列上(參考序列來源http://WWW.ebi.ac.uk/imgt/hla/)同時,構建各個數據庫的一致性(consensus)序列,再對數據庫中DNA序列進行篩選和測序錯誤校正。校正后的DNA序列通過序列重疊(overlap)和連鎖(Pair-End連鎖)關系可組裝成HLA-A/B/DRBl各外顯子相應的序列。所得DNA序列利用與MGTHLA專業數據庫中HLA-A/B/DRB1相應各外顯子的序列數據庫比對,序列比對結果100%匹配的即為對應樣本的HLA-A/B/DRB1基因型別。可參考圖4示例說明的1號樣品的HLA-A位點的2號外顯子一致性序列構建程序的截圖。所有95個樣本,得到的分型結果與原已知分型結果完全相符,其中1-32號樣本的具體結果如下樣本編號原HLA-A/B/DRB1型別0111]1A~k02:03A女11:01B~k38:02B-k48:01DRBl-k1454DRBl-k15010112]2A女01:01A女30:01B女08:01B-k13:02DRBl-k0301DRBl-k07010113]3A女01:01A女02:01B女15:11B-k47:01DRBl-k1302DRBl-k15010114]4A女24:08A女26:01B女40:01B-k51:01DRBl-k0404DRBl-k09010115]5A女01:01A女24:02B女54:01B-k55:02DRBl-k0405DRBl-k09010116]6A女01:01A女03:02B女15:11B-k37:01DRBl-k1001DRBl-k14540117]7A女11:01A女30:01B女13:02B-k15:18DRBl-k0404DRBl-k07010118]8A女01:01A女02:01B女35:03B-k81:01DRBl-k1101DRBl-k15010119]9A女02:06A女31:01B女27:07B-k40:02DRBl-k0301DRBl-k13020120]10A女01:01A女66:01B女37:01B-k49:01DRBl-k1001DRBl-k13020121]11A女01:01A女03:01B女35:01B-k52:01DRBl-k0101DRBl-k15020122]12A女11:01A女11:01B女15:01B-k15:05DRBl-k0406DRBl-k15010123]13A女01:01A女11:02B女07:02B-k15:02DRBl-k0901DRBl-k15010124]14A女01:01A女02:01B女52:01B-k67:01DRBl-k1502DRBl-k16020125]15A女01:01A女02:05B女15:17B-k50:01DRBl-k0701DRBl-k15010126]16A女01:01A女11:01B女37:01B-k40:02DRBl-k1001DRBl-k12020127]17A女24:07A-k32:01B女35:05B-k40:01DRBl-k0301DRBl-k04050128]18A女11:01A-k24:02B女13:01B-k35:01DRBl-k1602DRBl-k16020129]19A女11:01A女11:01B女4016:02B-k55:12DRBl-k0405DRBl-k150120A-k0211A2402Bk4001Bk4006DRBlk1101DRBlk150121A-k0101Ak0206Bk5101Bk5701DRBlk0701DRBlk120122A-k0101Ak2901Bk0705Bk1501DRBlk0405DRBlk070123A-k0101Ak0207Bk3701Bk4601DRBlk0403DRBlk100124A-k2485Ak3001Bk1302Bk5502DRBlk0701DRBlk150125A-k1101Ak3101Bk0706Bk5101DRBlk1202DRBlk140526A-k0101Ak1101Bk4601Bk5701DRBlk0701DRBlk080327A-k0101Ak0201Bk1518Bk3701DRBlk0401DRBlk150128A-k0101Ak2402Bk3701Bk4601DRBlk0901DRBlk100129A-k2601Ak6601Bk4040Bk4102DRBlk1201DRBlk150130A-k0201Ak2902Bk1302Bk4501DRBlk0301DRBlk120231A-k0101Ak1103Bk1501Bk5701DRBlk0701DRBlk150132A-k1101Ak2601Bk3503Bk3801DRBlk1103DRBlk1404樣本編號測得的ffiJV-A/B/DRBl型別1A-k0203Ak1101B-k3802B-k4801DRBlk1454DRBlk15012A-k0101Ak3001Bk0801Bk1302DRBlk0301DRBlk07013A-k0101Ak0201Bk1511Bk4701DRBlk1302DRBlk15014A-k2408Ak2601Bk4001Bk5101DRBlk0404DRBlk09015A-k0101Ak2402Bk5401Bk5502DRBlk0405DRBlk09016A-k0101Ak0302Bk1511Bk3701DRBlk1001DRBlk14547A-k1101Ak3001Bk1302Bk1518DRBlk0404DRBlk07018A-k0101Ak0201Bk3503Bk8101DRBlk1101DRBlk15019A-k0206Ak3101Bk2707Bk4002DRBlk0301DRBlk130210A-k0101Ak6601Bk3701Bk4901DRBlk1001DRBlk130211A-k0101Ak0301Bk3501Bk5201DRBlk0101DRBlk150212A-k1101Ak1101Bk1501Bk1505DRBlk0406DRBlk150113A-k0101Ak1102Bk0702Bk1502DRBlk0901DRBlk150114A-k0101Ak0201Bk5201Bk6701DRBlk1502DRBlk160215A-k0101Ak0205Bk1517Bk5001DRBlk0701DRBlk150116A-k0101Ak1101Bk3701Bk4002DRBlk1001DRBlk120217A-k2407Ak3201Bk3505Bk4001DRBlk0301DRBlk040518A-k1101Ak2402Bk1301Bk3501DRBlk1602DRBlk160219A-k1101Ak1101Bk4002Bk5512DRBlk0405DRBlk150120A-k0211Ak2402Bk4001Bk4006DRBlk1101DRBlk150121A-k0101Ak0206Bk5101Bk5701DRBlk0701DRBlk120122A-k0101Ak2901Bk0705Bk1501DRBlk0405DRBlk070123A-k0101Ak0207Bk3701Bk4601DRBlk0403DRBlk100124A-k2485Ak3001Bk1302Bk5502DRBlk0701DRBlk150125A-k1101Ak3101Bk0706Bk5101DRBlk1202DRBlk140526A-k01::01A-k11::01B-k46:01B-k57::01DRBl-k07:01DRBl女08:0327A-k01::01A-k02::01B-k15:18B-k37::01DRBl-k04:01DRBl*15:0128A-k01::01A-k24::02B-k37:01B-k46::01DRBl-k09:01DRBl*10:0129A-k26::01A-k66::01B-k40:40B-k41::02DRBl-k12:01DRBl*15:0130A-k02::01A-k29::02B-k13:02B-k45::01DRBl-k03:01DRBl*12:0231A-k01::01A-k11::03B-k15:01B-k57::01DRBl-k07:01DRBl*15:0132A-k11::01A-k26::01B-k35:03B-k38::01DRBl-k11:03DRBl*14:04注::HLA--DRBl型別中的DRBl-k1201不排除]DRBl女1206/121C1/1217的可能性,DRBl^1454不排除DRBl^1401的可能性,因為上述等位基因在HLA-DRB12號外顯子的序列完全相同。盡管本發明的具體實施方式已經得到詳細的描述,本領域技術人員將會理解。根據已經公幵的所有教導,可以對那些細節進行各種修改和替換,這些改變均在本發明的保護范圍之內。本發明的全部范圍由所附權利要求及其任何等同物給出。參考文獻[1].http://www.ebi.ac.uk/imgt/hla/stats,html[2].TiercyJΜ.MolecularbasisofHLApolymorphismamplicationsinclinicaltransplantation.[J].TransplImmunol,2002,9:173-180.[3].C.Antoine,S.Miiller,A.Cant,etal.Long-termsurvivalandtransplantationofhaemopoieticstemcellsforimmunodeficiencies:reportoftheEuropeanexperience.1968-99.[J].TheLancet,2003,9357:553_560·[4].H.A.Erlich,G.Opelz,J.Hansen,etal.HLADNATypingandTransplantation.[J].Immunity,2001,14:347-356.[5].LilloR,BalasA,VicarioJL,etal.TwonewHLAclassallele,DPBl女02014,bysequence-basedtyping.[J].TissueAntigens,2002,59:47_48·[6].A.Dormoy,N.Froelich.Leisenbach,etal.Mono-allelicamplificationofexons2-4usingallelegroup-specificprimersforsequence-basedtyping(SBT)oftheHLA-A,-Band~Cgenes!Preparationandvalidationofready-to-usepre-SBTmini-kits.[J].TissueAntigens,2003,62:201_216·[7].ElaineR.Mardis.Theimpactofnext-generationsequencingtechnologyongenetics.[J].TrendsinGenetics.2008,24:133_14L[8].ChristianHoffmann1,NanaMinkahl,JeremyLeipzig.DNAbarcodingandpyrosequencingtoidentifyrareHIVdrugresistancemutations.[J].NucleicAcidsResearch,2007,1-8.[9].ShannonJ.Odelberg,RobertB.Weiss,AkiraHata.Template-switchingduringDNAsynthesisbyThermusaquaticusDNApolymeraseI.[J].NucleicAcidsResearch.1995,23:2049_2057.[10].SayerD,WhidborneR,BrestovacB.HLA-DRBlDNAsequencingbasedtyping:anapproachsuitableforhighthroughputtypingincludingunrelatedbonemarrowregistrydonors.[J].TissueAntigens.2001,57(1)46-54.[11],IwankaKozarewa,ZeminNing,MichaelAQuail.Amplification-freeIlluminasequencing-librarypreparationfacilitatesimprovedmappingandassemblyof(G+C)-biasedgenomes.[J].NatureMethods.2009,6:291_295。權利要求一種測定樣品中目的核酸的核苷酸序列的方法,其包括1)提供n個樣品,n為大于等于1的整數,所述樣品優選地來自哺乳動物,更優選是人,特別是人的血樣;可選地,將待分析的n個樣品分成m個小組,m為整數且n≥m≥1;2)擴增對于每一個樣品,使用一對或多對標簽引物,在存在來自該樣品的模板時,在適于擴增目的核酸的條件下進行PCR擴增,其中,每一對標簽引物由包含引物標簽的正向標簽引物和反向標簽引物(均可以是簡并引物)構成,其中正向標簽引物和反向標簽引物所包含的引物標簽可以相同或者不同;不同樣品所用標簽引物對中的引物標簽彼此不同;3)混合當n>1時,將各樣品的PCR擴增產物混合在一起;4)打斷將所得的擴增產物進行不完全打斷,并進行純化回收;5)測序將回收的DNA混合物利用二代測序技術,優選的是PairEnd技術(例如IlluminaGA、IlluminaHiseq2000)進行測序,獲得打斷后的DNA的序列;和6)拼接基于每個樣品獨特的引物標簽將獲得的測序結果與樣品一一對應,利用比對程序(例如Blast,BWA程序)把各個測序序列定位到PCR產物的相應DNA參考序列上,通過序列重疊和連鎖關系,從打斷后的DNA的序列拼接出完整的目的核酸。2.權利要求1所述的方法,其中每一對引物標簽與PCR引物對組合成一對標簽引物,正反PCR引物的5’端分別具有(或者任選通過連接序列連接)正向引物標簽和反向引物標簽。3.權利要求1所述的方法,其中所述PCR引物是用于擴增HLA-A/B的2,3,4號外顯子以及HLA-DRB12號外顯子的PCR引物,優選的所述PCR引物如表2所示。4.權利要求1所述的方法,其中所述引物標簽針對PCR引物進行設計,優選針對用于擴增HLA的特定基因的PCR引物進行設計,更優選是用于擴增HLA-A/B的2,3,4號外顯子以及HLA-DRB12號外顯子的PCR引物,特別是如表2所示的PCR引物進行設計,所述引物標簽特別是包括表1所示95對引物標簽中的至少10對,或至少20對,或至少30對,或至少40對,或至少50對,至少60對,或至少70對,或至少80對,或至少90對,或95對(或者所述一組引物標簽由表1所示95對引物標簽中的10-95對(例如10-95對,20-95對,30-95對,40-95對,50-95對,60-95對,70-95對,80-95對,90-95對,或95對)組成),并且所述一組引物標簽優選地至少包括表1所示95對引物標簽中的PI-I至PI-10,或PI-Il至PI-20,或PI-21至PI-30,或PI-31至PI-40,或PI-41至PI-50,或PI-51至PI-60,或PI-61至PI-70,或PI-71至PI-80,或PI-81至PI-90,或PI-91至PI-95,或者它們任何兩個或者多個的組合。5.權利要求1所述的方法,其中所述DNA打斷包括化學打斷方法和物理打斷方法,其中所述化學方法包括酶切方法,所述物理打斷方法包括超聲波打斷方法或機械打斷方法。6.權利要求1所述的方法,其中所述DNA打斷后,純化回收從測序儀最大讀取長度到測序儀可適用的最長DNA長度范圍之間的所有DNA條帶,其中所述純化回收方法包括但不限于電泳割膠回收,也可以是磁珠回收。7.權利要求1所述的方法,其中所述方法還可以包括權利要求1所述的步驟1)_4),以及如下步驟5)建庫將打斷后的PCR產物文庫構建PCR-Free測序文庫,可以對文庫添加不同的文庫接頭(adapter)以區分不同的PCR-Free測序文庫,純化回收位于所用測序儀最大讀長長度到所用測序儀適用的最長DNA長度范圍之間的所有DNA條帶,優選地是450-750bp長度范圍的DNA片段;6)測序將回收的DNA混合物利用二代測序技術,優選的是Pair-End技術(例如IlluminaGA,IlluminaHiseq2000)進行測序,獲得打斷后的DNA的序列;7)拼接基于各個文庫不同的文庫接頭序列和每個樣品獨特的引物標簽將獲得的測序結果與樣品一一對應,利用比對程序(例如Blast,BWA程序)把各個測序序列定位到PCR產物的相應DNA參考序列上,通過序列重疊和連鎖關系,從打斷后的DNA的序列拼接出完整的目的核酸。8.權利要求1-7中任一項所述的方法用于HLA分型的用途,其特征在于包括使用權利要求1-7中任一項的方法對來自患者的樣品(特別是血樣)進行測序,以及將測序結果與HLA數據庫(如IMGTHLA專業數據庫)中HLA-DRB12號外顯子的序列數據比對,序列比對結果100%匹配的即為對應樣本的HLA-DRBl基因型別。9.一組引物標簽,其包括表1所示95對引物標簽中的至少10對,或至少20對,或至少30對,或至少40對,或至少50對,至少60對,或至少70對,或至少80對,或至少90對,或95對(或者所述一組引物標簽由表1所示95對引物標簽中的10-95對(例如10-95對,20-95對,30-95對,40-95對,50-95對,60-95對,70-95對,80-95對,90-95對,或95對)組成),并且所述一組引物標簽優選地至少包括表1所示95對引物標簽中的PI-I至PI-10,或PI-Il至PI-20,或PI-21至PI-30,或PI-31至PI-40,或PI-41至PI-50,或PI-51至PI-60,或PI-61至PI-70,或PI-71至PI-80,或PI-81至PI-90,或PI-91至PI-95,或者它們任何兩個或者多個的組合。10.權利要求9所述的一組引物標簽用于PCR測序方法的用途,其中特別是,每一對引物標簽與用于擴增待測目的序列的PCR引物對組合成一對標簽引物,正反PCR引物的5’端分別具有(或者任選通過連接序列連接)正向引物標簽和反向引物標簽。11.權利要求10所述的用途,其中PCR引物是用于擴增HLA的特定基因的PCR引物,優選是用于擴增HLA-A/B的2,3,4號外顯子以及HLA-DRB12號外顯子的PCR引物,優選的所述PCR引物如表2所示。12.權利要求9的一組引物標簽與用于擴增待測目的序列的PCR引物對組合成的一組標簽引物,其中每一對引物標簽與PCR引物對組合成一對標簽引物,正反PCR引物的5’端各具有(或者任選通過連接序列連接)一個引物標簽。13.權利要求12所述的標簽引物,其中所述PCR引物是用于擴增HLA的特定基因的PCR引物,優選是用于擴增HLA-A/B的2,3,4號外顯子以及HLA-DRB12號外顯子的PCR引物,優選的所述PCR引物如表2所示。14.權利要求12所述的標簽引物用于PCR測序方法的用途。全文摘要本發明提供了一種PCR測序方法,通過本發明中的引物標簽+DNA不完全打斷策略+二代測序技術(Pair-End測序技術)的組合在充分利用第二代測序儀高通量、低成本特點的同時,使測序儀能夠測通的PCR產物長度超過測序儀本身測長以上,大大擴大了其適用范圍。同時,本發明還提供了用于上述PCR測序方法的引物標簽,以及該方法用于基因分型,特別是HLA分析的用途。文檔編號C12N15/11GK101921840SQ20101021371公開日2010年12月22日申請日期2010年6月30日優先權日2010年6月30日發明者劉濤,張現東,李劍,趙美茹申請人:深圳華大基因科技有限公司