NA樣品耳聾基因是否存 在突變的試劑盒。根據本發明實施例,所述試劑盒設置有前面所述的一組標簽PCR引物。由 此,利用該試劑盒,能夠方便地利用本發明的DNA標簽和PCR引物構建標簽PCR引物,進而 利用標簽PCR引物,根據本發明的確定多種DNA樣品耳聾基因是否存在突變的方法,一次性 最多能夠實現95種DNA樣品的耳聾基因突變檢測。
[002引根據本發明實施例,所述耳聾基因為GJB2、GJB3、SLC26A4和12SrRNA的至少一 種。
[0023] 根據本發明的又一方面,本發明還提供了一種確定DM樣品耳聾基因是否存在突 變的系統。根據本發明實施例,該系統包括:文庫構建裝置,所述文庫構建裝置用于根據前 面所述的方法構建所述DNA樣品的核酸測序文庫:測序裝置,所述測序裝置與所述文庫構 建裝置相連,用于對所述核酸測序文庫進行測序,W便獲得測序結果;分析裝置,所述分析 裝置與所述測序裝置相連,用于基于所述測序結果確定所述DNA樣品耳聾基因是否存在突 變,其中,所述測序結果包括所述DNA樣品耳聾基因的序列信息。
[0024] 根據本發明實施例,所述耳聾基因為GJB2、GJB3、SLC26A4和12SrRNA的至少一 種。
[0025] 根據本發明實施例,所述分析裝置進一步包括比對單元,所述比對單元中設置有 參考數據庫,用于:將所述DNA樣品的核酸測序文庫的序列信息與參考數據庫進行比對;基 于比對結果,確定所述DNA樣品耳聾基因是否存在突變。由此,可W準確、高效的獲得突變 位點,進而精確的判斷DNA樣品耳聾基因是否存在突變。
[0026] 根據本發明實施例,當所述DNA樣品為多種,所述多種為2-95種時,所述文庫構建 裝置用于針對所述多種DNA樣品的每一種,分別獨立地根據前面所述的方法構建所述DNA 樣品的核酸測序文庫,并將所述多種DNA樣品的核酸測序文庫進行混合,W便獲得核酸測 序文庫混合物,其中,不同的DNA樣品采用相互不同的DNA標簽;所述測序裝置用于對所述 核酸測序文庫混合物進行測序,W便獲得測序結果,所述測序結果包括多種DNA樣品的核 酸測序文庫的序列信息W及所述DNA標簽的序列信息;W及所述分析裝置用于基于所述 DNA標簽的序列信息對所述多種DNA樣品的核酸測序文庫的序列信息進行分類,W便確定 所述多種DNA樣品的每一種的核酸測序文庫的序列信息,并基于所述多種DNA樣品每一種 核酸測序文庫的序列信息,分別確定所述多種DNA樣品耳聾基因是否存在突變。由此,利用 該系統,能夠同時構建多種DNA樣品的用于耳聾基因突變檢測的核酸測序文庫,從而可W 通過將來源于不同樣品的核酸測序文庫進行混合,同時進行測序,基于DNA標簽對DNA樣品 的核酸測序文庫的序列信息進行分類,獲得多種DNA樣品的核酸測序文庫的序列信息。從 而可W充分利用高通量的測序技術,例如利用Solexa、S0LID、和454測序技術的至少一種, 同時對多種DNA進行測序和耳聾基因突變檢測,從而提高了檢測的效率和通量。
[0027] 根據本發明實施例,所述分析裝置進一步包括比對單元,所述比對單元用于:將所 述多種DNA樣品的每一種的核酸測序文庫的序列信息,分別與參考數據庫進行比對;W及 基于比對結果,分別確定所述多種DNA樣品耳聾基因是否存在突變。由此,可W準確、高效 的獲得突變位點,進而精確的判斷多種DNA樣品耳聾基因是否存在突變。
【附圖說明】
[0028] 本發明的附加方面和優點將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發明的實踐了解到。
[0029] 圖1為根據本發明實施例的確定多種DNA樣品耳聾基因是否存在突變的方法的流 程TK意圖;
[0030]圖2為根據本發明實施例的確定多種DNA樣品耳聾基因是否存在突變的系統的結 構示意圖。
【具體實施方式】
[0031] 下面詳細描述本發明的實施例。下面描述的實施例是示例性的,僅用于解釋本發 明,而不能理解為對本發明的限制。
[0032] 為了更好地理解本發明,下面提供相關術語的定義和解釋。
[0033] 如本文中所使用的,術語"PCR"是指聚合酶鏈式反應。
[0034] 如本文中所使用的,術語"Solexa測序法"是指近幾年開發的新一代DNA測序法, 也稱為第二代測序法。Solexa測序法與傳統測序法(例如,Sanger測序法)的不同之處在 于,其采用邊合成邊測序的原理進行DNA序列分析。Solexa測序法具有下述優點;1)成本 低,僅為傳統測序成本的1% ;2)通量高,可W同時對多個樣品進行測序,并且進行一次的 Solexa測序法可W產生大約500億巧OG)個堿基的數據;3)準確性高(高于98. 4% ),有 效的解決了多聚重復序列的讀取問題。另一方面,高測序通量在進行測序的序列的數目確 定的情況下,又反過來提高了序列的測序深度(例如,針對每個序列,可W進行多次測序), 從而確保了測序結果的可靠性。如本文所使用的,術語"測序深度"是指一段DNA序列在測 序數據中集中出現的次數。測序深度可W通過將測序量除W基因組長度來計算,例如測序 深度為10,表示測了 10次的整個基因組。
[0035]Solexa測序法的應用十分廣泛。其可W用于基因組測序,基因分型,基因多態性研 究等等。本發明的方法將Solexa測序法用于檢測耳聾基因;通過對待分析的樣品進行針對 耳聾基因的的測序,然后使用本領域已知的比對程序,例如BLAST和SOAP,將所得的測序結 果與耳聾基因數據庫進行比對,從而實現對樣品的耳聾基因突變檢測。本文中使用的耳聾 基因突變數據庫包含本領域已知的耳聾基因突變位點及突變類型,所述突變位點和突變類 型可見于例如公共數據庫,例如HGMD和ht1:p://deafnessva;riationdat油ase.com/。
[0036] 如本文中可互換使用的,術語"DM標簽"、"標簽(index)"或"核酸標簽"是指添 加在PCR引物5'末端的一小段堿基序列,其通過PCR擴增可W用于標記PCR產物,從而辨 別不同模板來源的PCR產物的混合物中各個PCR產物的模板來源。通過在引物的5'末端 添加標簽,可W對PCR產物進行標記,從而可W將多個不同的PCR產物混合成一個文庫,用 于進一步的分析和處理。文庫中各個不同的PCR產物各自具有獨特的標簽,從而根據各個 PCR產物中獨特的標簽,可W將各個不同的PCR產物互相區分開來,并將其與PCR模板一一 對應。例如,當需要對多個樣品進行測序時,可W在用于各個樣品的引物的5'末端添加不 同的標簽,然后用添加了標簽的引物分別對各個樣品進行PCR反應,從而對各個樣品(即, PCR產物)進行標記。PCR反應后,可W將來自各個樣品的帶有不同標簽的PCR產物混合在 一起組成一個文庫,然后應用高通量的Solexa測序法同時對文庫中的各個PCR產物進行測 序。最終,在所得的測序數據中,通過獨特的標簽,可W將測序結果與各個PCR產物(樣品 模板) 對應。
[0037] 可W僅在用于PCR擴增的引物對的一條引物中引入標簽,也可W在引物對的兩條 引物中都引入標簽。當在引物對的兩條引物中都引入標簽時,每個PCR引物對與一對標簽 組合成一對標簽引物,其中正向和反向PCR引物的5'端分別具有正向標簽和反向標簽,并 且正反標簽和正反引物序列是對應的,且正向標簽和反向標簽可W是相同的,或不同的。
[0038] 設計標簽時需要考慮多種因素,包括;1)標簽序列中應當避免3個或3個W上的 單堿基重復序列;2)所有標簽的同一位點中堿基A和堿基C的總含量應在所有堿基含量的 30% -70%之間,例如,當設計100條不同的標簽序列時,每一條標簽序列的第二個堿基(即 所謂的同一位點)中A和C占該100條序列第二個堿基總量的30% -70% ;3)標簽序列本 身的GC含量應在40-60%之間;4)標簽之間的序列差異應大于4個堿基;5)標簽序列中應 避免出現與用于測序的引物相似度高的序列;6)當標簽序列添加到PCR擴增引物上后,應 避免PCR擴增引物形成發卡結構和二聚體等二級結構。
[0039] 如本文中所使用的,術語"標簽PCR引物"是指帶有DNA標簽的引物,其包含2個 部分,標簽部分和引物部分,其中標簽部分用于在PCR擴增反應中標記PCR產物,而引物部 分與模板堿基互補配對,用于擴增模板,并且其中標簽部分,連接至引物部分的5'端。
[0040] 根據本發明的一個方面,本發明提供了一組DNA標簽。根據本發明實施例的一組 DNA標簽,其選自SEQ ID NO :1-95所示的核巧酸。具體序列如下表所示:
[0041]表1
[0042]
[0043]
[0045]
[0046] 本發明的一組DM標簽能夠用于構建核酸測序文庫,W精確地對核酸測序文庫進 行區分。利用上述DNA標簽(在本文中有時也稱為"核酸標簽"),通過將DNA標簽與DNA 或其等同物相連,可W精確地表征DNA的樣品來源。由此,利用上述DNA標簽,可W同時構 建多種DNA樣品的用于測序的核酸測序文庫(在本文中,有時也稱為DNA標簽文庫),從而 可W通過將來源于不同樣品的核酸測序文庫進行混合,同時進行測序,基于DNA標簽對獲 得的測序序列進行分類,獲得多種DNA樣品的序列信息。從而可W充分利用高通量的測序 技術,例如利用Solexa測序技術,同時對多種DNA進行測序,從而提高DNA測序的效率和通 量。
[0047] 根據本發明的另一方面,本發明還提供了一組PCR引物。根據本發明實施例的一 組PCR引物,其選自SEQIDNO=96-119所示的核巧酸。各突變基因及其突變位點,W及各 突變位點對應的引物序列如表2所示:
[0048]表 2
[0049]<