一種樣本組合分析核酸序列的方法
【技術領域】
[0001] 本發明屬于生物技術領域,尤其涉及一種通過組合方法大幅度減少分析樣品數, 分析特定核酸序列片段的方法。
【背景技術】
[0002] 人類基因組計劃和各種模式生物基因組計劃的開展和完成,使人類步入了后基因 時代,對當代的生物學研究和醫學研究產生了巨大的影響,分子生物學相關學科得到了迅 猛的發展。從基因水平上認識生命的差異,疾病發生、發展的規律,以及藥物與生命體的相 互作用將成為可能。就基因序列分析而言,后基因時代的重點已由全基因組序列測定轉移 到了對基因組中個體遺傳差異及物種間遺傳差異的比較。在基礎研究方面,DNA的序列分析 是進一步研究和改造目的基因的基礎,研究疾病基因的遺傳規律,克隆致病基因;在應用方 面,直接尋找疾病的易感基因突變位點,通過對某一特定疾病的基因組樣本中突變基因型 進行大規模鑒定和檢測,可以獲得有關與該疾病相關基因型的信息。越來越多核酸分析技 術的出現為樣本檢測提供操作簡單、價格便宜的方法成為可能。盡管如此,但對于涉及一類 大樣本中陽性樣本只有比例很少的分析對象而言,如果每個單個樣本都進行檢測,則分析 成本過高、時間耗用過長。如對100個人中的某個突變位點的分析,按照"突變"定義意味著 這100個人中絕大多數樣本為野生型,可能只有少數幾個、甚至也可能不存在突變型的樣 本。但如果不對每個樣本進行分析則又不可能對樣本進行分型;又比如區分感冒發熱病人 與某種禽流感患者、或者從體檢的人群中篩查艾滋病患者等等。這些相對于陰性樣本占有 絕大多數、陽性樣本只占有很少比例的分析對象而言,一方面檢測是必要的,另一方面,實 施單個樣本的檢測費用又相對過高、耗時太長,有時還會因為費用、或者耗時而不得不選擇 放棄某些必需要檢測項目,給個人、社會帶來經濟上的損失、甚至生命的危害。
[0003] 針對某個特定核酸序列的定性分析而言,如果分析樣本中存在這段核酸序列 (有),可以稱為陽性樣本;如果不存在這段核酸序列(無),則可以稱為陰性樣本。因此,現行 對單個樣本實施分析這段核酸序列的結果只能給出"有(陽性)"或者"無(陰性)"的信息,而 且兩者必為其一。同樣地,對一個由若干個樣本混合的樣品實施分析,在檢測限范圍內,它 同樣可以給出"陽性"或者"陰性"的信息,而且兩者必為其一。很明顯,如果這個混合樣本分 析的結果是"陰性",那么無論這個混合樣本由多少個樣本混合而來,都可以從這一單個結 果判斷出這些所有的樣本全部為"陰性"。對于分析像點突變這樣的核酸序列而言,如果假 定100個樣本中含有一個"陽性"樣本(很明顯,根據"點突變"的定義,這一假設是合乎實際 情況的),如果將這100個樣本分成10組,每組由10個樣本均勻混合,那么這10組的分析結果 一定是9組結果為"陰性",1組結果為"陽性"。因而,我們通過10組混合樣品的分析,可以確 定100個樣本中其中的90個樣本為"陰性"。而對于那1組結果為"陽性"的10個樣本而言,則 無法分辨出其中的哪一個屬于"陽性"樣本,即這10個樣本均是"陽性"樣本可能者。
[0004] 組合分析方法為從那1組結果為"陽性"的10個樣本中分辨出其中的一個"陽性"樣 本、或者至少為減少可能"陽性"樣本數目,為下一步的分析減少分析的數目提供了可能。
[0005] 很明顯,對100個樣本進行有效分析,無論是單個分析、或者是組合分析,一定需要 有100個獨立的信息與之對應,即每個樣本均對應一個獨立的信息。對于一組混合樣品而 言,它分析的信息同樣歸屬于(混合的)所有單個樣本的信息。這10組獨立的信息無法通過 組合的辦法獲得新的獨立的信息。因此,雖然從它的"陰性"結果可以知曉所有單個樣本的 信息均為"陰性",但從它的"陽性"結果則無法推知單個樣本的信息的具體信息。為了獲得 單個樣本的信息,很明顯需要繼續增加獨立的信息。如果每個樣本在不同混合樣本組中被 測定2次、且僅為2,那么一個"陽性"樣本所歸屬的這兩個不同的混合組中(在檢測限內)就 一定能夠獲得"陽性"的分析結果。這種情況下,根據每個組分析結果,其每組結果的組合方 式就可以提供比組數目更多的獨立信息。要得到每個樣本的具體信息,其實驗得到的獨立 信息數就必須大于或者等于分析的總樣本數。一個樣本被分配到兩個不同的組分析兩次, 其組數Μ和能夠提供的不同信息數X之間根據組合原理有如下關系:X= Μ(Μ-1)/2。樣本分 析的最大數目N與X之間的關系為:X2N。每組混合最多樣本數為(M-1)、最少為1。當然,當陽 性樣本超過1個時,則陽性樣品組會超過兩組,這種情況下會出現不能確定的陽性樣本,需 要對這些不能確定的陽性樣本進一步分析。類似地,一個樣本被分配到y個不同的組中分析 y次,其組數Μ和能夠提供的不同信息數X之間根據組合原理有如下關系:X= [M(M-l) (M-2)~(M-y)]/[y(y-l)(y-2)…X2X1。同樣地,根據這些組的分析結果信息,并將其信息進 行組合,在有y組、且只有y組為陽性結果的情況下可以完全確定單個樣本的信息;而當陽性 結果的組數大于y時,則可以確定可能的陽性樣本、并通過對可能的陽性樣本進一步的分析 確定其耽擱樣本的具體信息。因此,原理上,在組數固定的情況下,樣本被分析的次數越多, 每組能夠組合的樣本數目也就隨之增加。但在實際的分析中,需要考慮陽性樣本不斷被稀 釋的檢測靈敏度,樣本組合操作過程復雜程度,選擇合適的分組方式。
[0006] 本發明提出一種基于一個樣本被析兩次的樣本組合分析核酸序列的方法,其目的 是針對多樣本中只有極少數樣本中含有單個指標的特征核酸片段序列提供一種快速、準 確、低成本的分析方法,從而實現對大樣本的分析、并確定其單個樣本的具體信息分析,或 者完成對大樣本的初篩分析。
【發明內容】
[0007] 本發明所解決的技術問題是: 提供一種基于樣本組合方法分析核酸序列的檢測方法,快速、準確、低成本實施對大樣 本的分析、并確定其單個樣本的具體分析信息。
[0008] 為了解決上述技術問題,本發明所采用的技術方案是: 一種基于樣本組合分析核酸序列的方法,將需要分析的N個樣本(N>3)按照特定的樣品 組合方式分成Μ組,然后每組按照一個分析樣品實施對特征核酸序列片段分析,含有特征核 酸序列片段為陽性、不含有特征核酸序列片段為陰性,最后根據Μ組樣品的分析結果,組合 判斷Ν個樣本中每個具體樣本的分析結果,包括如下步驟: a. Ν個樣本的分組,即:樣本分組的數目Μ通過分析的樣本數Ν、每個樣本被分析的次數 y來確定的(y2 2),組數Μ與N、y的關系滿足:[M(M-l) (M-2)"_(M-y)]/[y(y-l)(y-2)~X2 X1SN,對每個樣本設唯一編號,對每組樣品設唯一的編號、由若干不同樣本等量混勻組 成,在選定分析方法的檢測限內,每組樣品包含的樣本數最多為yN/M、最少為1,使得同一樣 本必須分在不同的y組、且只能分在不同的y個組中,即所有樣本均需在不同的y組樣品中被 分析y次; b.對每組混合樣品進行分析; C.確定每個樣本的信息,每個樣本的信息是指根據Μ組樣品得到Μ個分析結果按照如下 方法進行確定: c-1. Μ個分析結果無一組樣品為陽性結果:Ν個樣本均為陰性; c-2. Μ個分析結果中有y組樣品為陽性結果:則Ν個樣本中只有有1個陽性標本,其具體 樣本編號為樣品陽性信息的y組所共有的樣本編號; c-3. Μ個分析結果中有P(y<P<M)組樣品為陽性結果:N個樣本中有(P-1)個陽性,其 具體樣本通過陽性信號兩組的共有樣本編號找出(P-l) + (P_2) + (P-3)+…+3+2+1個可能的 樣本。
[0009] 其中,所述特征核酸序列為陽性樣本含有、陰性樣本不含有的核酸序列片段,核酸 序列片段可以是包括點突變、甲基化、插入、缺失等單個堿基的變化,也可以是多個堿基的 變化、或者樣本外的表征另一物種、傳統物種中混入的轉基因物種、特定環境中的某個微生 物的特征序列,特征核酸序列在N個樣本中陰性樣本占絕大多數,陽性樣本占少數。
[0010] 本發明的有益效果是: 提供了一種基于樣本組合方法分析核酸序列的檢測方法。通過將需要分析的多個樣本 按照特定的組合方式分成若干組,并確保每個樣本在不同的兩組、且僅為兩組中被分析兩 次,然后每組按照一個分析對象實施對核酸序列分析,最后根據若干組的分析結果,組合判 斷具體樣本的分析結果。該方法針利用組合方式,通過遠小于樣本數的分析對象確定樣本 分析信息,可以顯著分析的數量、大幅度降低分析成本和節省分析時間。與傳統的核酸序列 分析相比,本方法不僅可以大幅度減少分析的樣品數目、節約時間,提高分析效率;同時也