本申請要求于2013年11月27日提交的序列號為61/909,779的美國臨時申請的優先權。序列號為61/909,779的美國臨時申請的全部內容通過引用并入本文。
技術領域:
本發明涉及應用已知技術對患有CHD的新生兒和其它個體中DNA的胞嘧啶核苷酸組分的化學結構相比于正常(“未受影響的”、“對照”)案例(即未患有CHD)的差異(所謂的DNA甲基化)進行鑒定和定量以確定所測試的個體患有CHD的風險和可能性。由于在人類細胞和組織中和細胞外普遍存在DNA而不存在于體液中,產前和出生后的任何時間可以對任何這些來源的DNA應用該技術以對個體患有如上所述的風險或可能性進行評估,本發明還適用于由受到破壞的細胞釋放的DNA,所謂的游離細胞的DNA(cfDNA),并且其在個體的體液中發現。所描述的化學變化-所謂的“DNA甲基化”涉及胞嘧啶組分核苷酸加入了額外的碳原子(-C-),這是一種已知的構建DNA分段(block)。在CHD組和非-CHD組或CHD群體和非-CHD群體之間比較整個DNA的多個基因座或位點處的胞嘧啶核苷酸甲基化方面的差異對比。當將經過測試的個體的甲基化水平與這兩種群體組中相應的基因座進行比較時可以確定CHD的可能性。假如采用適當的參考群體,任何來源的DNA都可以用于甲基化研究以在產前或產后生活的任何階段預測CHD風險。
背景技術:
:在美國,先天缺陷,即在胎兒期發展并在出生時存在的異常,是嬰兒死亡(定義為出生一年內死亡)的主要原因。先天性心臟缺陷出現的頻率為每1,000名活產兒中有8至9例。CHD是嚴重先天缺陷中最常見的一類且就住院治療而言最昂貴。新生兒中高達25%的主要患有CHD的案例在出院前沒有被診斷出。先天性主動脈瓣狹窄(AVS),定義為瓣膜孔的不完全梗阻,是結構性心臟缺陷的重要類別,且在3%至6%的這種案例中出現。梗阻的位點和梗阻的嚴重性均存在可變性。將梗阻的位點下位分類為瓣膜、瓣膜下和瓣膜上。約半數患有嚴重AVS的嬰兒需要手術治療。難以在產前生活中檢測輕度主動脈瓣狹窄,然而嚴重的主動脈瓣狹窄可以導致伴隨心內膜彈力纖維增生癥、左心房擴張和主動脈根變窄的左心室心肌功能障礙。這些變化可能是形成左心室發育不全綜合征的前奏。基于新生兒中診斷不出主要CHD的高百分比,建議在所有新生兒中對組織氧水平“脈搏血氧飽和度”進行測量和監測以檢測低組織氧水平,其可能是主要CHD存在的標志。明確需要發展篩選試驗和其它標記物以在新生兒和產后生活的后期階段中對普通群體CHD進行準確預測。胚胎期和胎兒期的心臟發育需要大量不同基因的協調和編排。已知較小比例的CHD案例與基因突變有關,基因突變是正常序列的變化,正常序列中的基本構建分段(“核苷酸”)排列在該基因的DNA中。這種突變導致對正常心臟發育來說很重要的基因的故障或非功能(即量的改變,或形成異常類型的蛋白質)。在最近的六十年里,已經發現并深入研究了稱為“表觀遺傳學”的用于控制基因功能的重要機理。表觀遺傳學被定義為可遺傳(即傳遞給后代)的基因表達的變化,這種變化并不是由于基因中核苷酸的遺失或獲得的突變(即基因中核苷酸序列的改變)。當然,表觀遺傳是通過各種其它潛在機制對基因表達可逆的調控。目前最廣泛研究的一種這樣的機制為DNA甲基化。其它機制包括:DNA的3維結構的變化、組蛋白修飾或微小RNA抑制性活性。胞嘧啶甲基化是化學穩定的且可以在來自任何來源的DNA,其包括新鮮組織的DNA、儲存組織的DNA或存檔組織的DNA(如保存在病理學玻片中或福爾馬林固定的石蠟塊中的DNA)中進行測量。此外,也可以對由破壞的細胞釋放的和體液中存在的DNA,即cfDNA,就胞嘧啶甲基化進行測試。已知基因中,特別是所述基因的啟動子區域(其控制基因表達)中的胞嘧啶核苷酸的甲基化為控制整個基因活性的機制。經典地,胞嘧啶的甲基化與抑制基因轉錄相關聯。然而,在某些基因中,已知胞嘧啶甲基化具有逆轉作用,即促進基因轉錄。常用的用于測量胞嘧啶甲基化的技術包括但不限于基于亞硫酸氫鹽的甲基化試驗。將亞硫酸氫鹽添加至DNA使未甲基化的胞嘧啶轉化,這導致胞嘧啶的甲基化(即將額外的碳原子添加至胞嘧啶核苷酸的六角環結構的#5位)且其最后轉化為核苷酸尿液嘧啶。尿液嘧啶具有與DNA序列中的硫胺素相似的結合性質。之前已經甲基化的胞嘧啶當暴露于亞硫酸氫鹽時不進行該化學轉化。由此亞硫酸氫鹽試驗可以用于區別之前已經甲基化的胞嘧啶和未甲基化的胞嘧啶。因此,整個DNA的胞嘧啶的甲基化狀態可以說是表明了整個基因組的多個基因的相對表達狀態。因此該技術允許同時分析直接或間接參與心臟發育的多個基因的相對激活水平,因為外部物質的作用機制和對細胞的影響主要是通過它們對基因功能的影響,全基因組DNA甲基化還表明了對參與心臟發育的許多基因的大量外部(產前酒精和煙草暴露、抗葉酸代謝產物等)和內部影響的綜合作用。因此整體來說,通過將CHD組和正常組中的胞嘧啶甲基化水平與適當的參考標準進行比較,它們的胞嘧啶甲基化的差異可以用于評估個體中CHD的風險和預測個體中CHD的可能性。盡管CHD的頻率和重要性,但是沒有對于對胚胎、胎兒、新生兒或產后生活的后期就CHD進行常規群體篩查的實驗室測試。非常需要有助于對患有CHD的新生兒和其他個體進行早期鑒別、醫療監控和治療的篩查測試。技術實現要素:發明人已經表明,當將患有常見CHD的案例與正常未受影響的案例相比時,分布于整個基因組的個體的胞嘧啶核苷酸的甲基化的比例和水平方面存在統計學高度顯著的差異。顯示甲基化差異的胞嘧啶分布于和CpG島和基因的內部和外部。本發明提供了用于將各個類別的CHD和全部CHD從正常案例中區分出來的甲基化標記物。特別的方面提供了一組胞嘧啶標記物,其用于將各個類別的常見CHD從正常案例中區分出來并且還用于將CHD作為一個組從未患有CHD的正常案例中區分出來。本發明涉及在產后生活的任何時間或時期的風險評估。本發明的其它方面涉及測量胞嘧啶甲基化及其在將常見類別的CHD彼此區分出來的應用。另外的方面包含統計算法的應用和用于基于信息性胞嘧啶基因座處的甲基化水平評估個體患CHD的風險的方法。在一個實施方式中,本發明提供了一種用于基于對個體DNA中各種鑒別出的基因座中的胞嘧啶核苷酸的甲基化頻率或百分比進行的測量而預測先天性心臟缺陷的方法。在一些實施方式中,該方法包括以下步驟:A)從患者獲得樣品;B)從血液樣本提取DNA;C)進行試驗以確定整個基因組中基因座處的胞嘧啶的甲基化百分比;D)將該患者的胞嘧啶甲基化水平與正常組和先天性心臟缺陷組的充分表征群體進行比較;和E)基于整個基因組中不同位點處的胞嘧啶甲基化水平對個體患先天性心臟缺陷的風險進行計算。在一些實施方式中,樣品選自由血液、血漿、血清、尿液、唾液、羊水組成的組。在一些實施方式中,以許多不同組合的方式使用甲基化位點以計算個體中先天性心臟缺陷的幾率。在一些實施方式中,患者為胚胎或胎兒。在一些實施方式中,患者為新生兒。在一些實施方式中,患者為小兒患者。在一些實施方式中,本發明還包括確定出生后生活的任何時期的任何時間患先天性心臟缺陷的風險或傾向。在一些實施方式中,DNA是從細胞獲得的。在一些實施方式中,DNA是無細胞的。在一些實施方式中,DNA是從產婦的體液或胎盤組織獲得的胎兒DNA。在一些實施方式中,DNA是從出生時獲得的羊水、胎兒血或臍帶血獲得的。在一些實施方式中,獲取并儲存樣品以進行病理學檢查。在一些實施方式中,將樣品儲存為玻片、組織塊,或將樣品冷凍。在一些實施方式中,先天性心臟缺陷為主動脈瓣狹窄(AVS)、左心發育不良綜合征(HLHS)、室間隔缺損(VSD)、法洛四聯癥(TOF)、主動脈縮窄(Coarct)、房間隔缺損(ASD)或肺動脈瓣狹窄(PS)。在一些實施方式中,先天性心臟缺陷為VSD且不同的位點為表1中鑒別出的兩個以上基因座;先天性心臟缺陷為ASD且不同的位點為表2中鑒別出的兩個以上基因座;先天性心臟缺陷為PS且不同的位點為表3中鑒別出的兩個以上基因座;先天性心臟缺陷為主動脈縮窄且不同的位點為表4中鑒別出的兩個以上基因座;先天性心臟缺陷為TOF且不同的位點為表5中鑒別出的兩個以上基因座;先天性心臟缺陷為HLHS且不同的位點為表6中鑒別出的兩個以上基因座。在一些實施方式中,采用基因測序技術或全基因組測序技術獲得對胞嘧啶核苷酸的甲基化頻率或百分比的測量。在一些實施方式中,試驗為基于亞硫酸氫鹽的甲基化試驗。在一些實施方式中,本發明提供了一種方法,通過該方法可以測量體液(產婦或受影響個體)中的由所描述基因轉錄的蛋白質并用于檢測和區分不同類型的CHD。在另一個實施方式中,對組織或體液中的由受影響的基因產生的mRNA進行測量并可以定量mRNA的水平以確定所述基因的活性且該mRNA的水平可以用于評估CHD的可能性。在一些實施方式中,該方法還包括使用全基因組芯片的mRNA以測量用于對組織(包含胎盤)或體液(包含血液、羊水和唾液)進行篩選的全基因組基因的基因活性。在一些實施方式中,可以對孕婦或受影響個體的體液或組織中的由相關基因轉錄的蛋白質進行測量和定量。具體實施方式本發明的各方面采用商業上廣泛使用的用于將甲基化胞嘧啶從未甲基化胞嘧啶區分出來的基于亞硫酸氫鹽的試驗證實了患有常見類別的CHD的個體和正常組中整個基因組中的胞嘧啶核苷酸的甲基化百分比方面的高度顯著的差異。用于本發明分析的胞嘧啶并不限于CpG島或不限于特定基因,而包括CpG島以外和基因以外的胞嘧啶基因座。為了該特別發明的目的,僅報道了與已知基因相關聯的胞嘧啶基因座。不但在特定類別(一共6類)的CHD和正常研究組之間而且在組合的CHD組和正常組之間以及最終在兩個常見類別的CHD之間均觀察到了整個基因組中胞嘧啶甲基化基因座中的顯著性差異。特別的方面提供了多組整個基因組中已知的和已經鑒別出的胞嘧啶基因座,其甲基化水平(表示為百分數)對于將CHD從正常案例中區分出來是有用的。另外的方面描述了能夠將包括但不限于家族史、葉酸代謝酶的突變和母體暴露于各種毒素(如酒精和煙草)(在相關妊娠期間)的其它公認的CHD風險因素與胞嘧啶甲基化數據結合以預測CHD的能力。多個個體胞嘧啶基因座表明了CHD相對于正常案例(FDRq-值1.0×10-3至1.0×10-35)中它們的甲基化程度方面高度顯著的差異,參見下文。在所呈現的特定的分析中,將8例左心發育不良(HLH)、8例室間隔缺損(VSD)、來自肺動脈瓣狹窄(PS)、房間隔缺損(ASD)和主動脈縮窄(Coarct)的類別各12例,以及14例法洛四聯癥(TOF)各自作為單獨的組與32例正常對照的合并組進行比較。將所有6個單獨類別的CHD(一共64例)合并形成一個組并與32例正常的合并組進行比較以確定是否可以將作為整體的CHD案例從非-CHD或正常案例區別出來。當將各個單獨的CHD類別與正常組進行比較時,鑒別出了胞嘧啶基因座中甲基化水平的高度顯著的差異(表1至6)。將CHD案例作為一個組與合并的正常組進行比較(表7)。表格限于位于已知基因中的胞嘧啶。我們發現了胞嘧啶甲基化水平方面高度顯著的差異。對于各個類別的CHD,在CHD案例和正常案例之間顯示出多個胞嘧啶甲基化位點中的高度顯著的差異。這些甲基化基因座的組合為單個CHD和組合CHD的非常敏感的預測因子(表8至19)。定義:室間隔缺損(VSD)是指將心臟的兩個泵室或心臟的左心室和右心室分開的壁中的一個或多個孔。這導致來自這兩個心室的具有高氧含量血液和低氧含量血液的混合。法洛四聯癥為發現了心臟和起源于心臟的血管的許多結構異常的心臟缺陷。這些異常包括主動脈至肺(肺動脈)的變窄、室間隔缺損(見上文),主動脈跨位(稱為主動脈的源于心臟的主要血管之一的移位,從而導致其跨坐在間壁或左心室和右心室之間的“隔膜”上)。最后,發生右心室的肌肉增厚或“肥大”。左心發育不良綜合征(HLH)是心臟的左側,更具體地左心室(或心臟的左“泵”室)嚴重不發育的癥狀。結果心臟不能將含有高水平的氧氣的血液泵至對大腦和身體的其它部位。房間隔缺損是將心臟的兩個心房或接收室分隔開的壁上異常孔的癥狀。這些心房通常接收來自肺以及身體其它部位的血液并將血液推送進泵室或心室。主動脈縮窄代表主動脈變窄,該主動脈是心臟的兩個主要血管之一,且其將含氧血從心臟的左側帶至大腦和身體的其它部位。最后,肺動脈瓣狹窄是存在將低氧含量的血液從心臟的右側帶至肺的血管(肺動脈)變窄的癥狀。變窄通常在確保肺動脈中的血液向前流動的肺動脈瓣的水平發生,肺動脈變窄限制了血液從心臟向肺的流動的適當氧合作用。這些代表了六種常見的和臨床重要的CHD。它們經常需要外科手術來阻止嚴重的并發癥和死亡。胞嘧啶是指構建DNA的四個構建分段“核苷酸”的組的成員之一。DNA中發現的其它核苷酸或構建分段為硫胺素、腺嘌呤和鳥嘌呤核苷。胞嘧啶的化學結構為六面六角環或嘧啶環的形式。術語甲基化是指將“甲基基團”或單個碳原子酶促添加至胞嘧啶的嘧啶環的#5位,這導致將胞嘧啶轉化為5-甲基-胞嘧啶。如所描述的胞嘧啶的甲基化通過稱為DNA甲基轉移酶(DNMT's)的酶家族的作用來完成。當形成5-甲基-胞嘧啶時,其易于突變或由原始的胞嘧啶化學轉化以形成胸腺嘧啶。5-甲基胞嘧啶占正常基因組中全部核苷酸堿基的約1%。術語高甲基化是指當將來自感興趣的個體或組的樣本與正常組或對照組進行比較時,在特定的胞嘧啶基因座處提高頻率或百分比的甲基化。胞嘧啶通常與沿DNA單鏈的線性序列中的鳥嘌呤(另一核苷酸)配對以形成CpG對。“CpG”是指胞嘧啶-磷酸鹽-鳥嘌呤核苷化學鍵,其中磷酸鹽將兩個核苷酸連接在一起。在哺乳動物中,在約70-80%的這些CpG對中,胞嘧啶被甲基化(ChatterjeeR,VinsonC.BiochemicaetBiophisicaActa2012;1819:763-70)。術語“CpG島”是指基因組中具有高濃度的CG二核苷酸對或CpG位點的區域。常常在與哺乳動物DNA接近的基因中發現“CpG島”。CpG島所占據DNA的長度通常為300-3000個堿基對。CG集群在相同的DNA單鏈上。CpG島由各種標準限定,包括占據DNA至少200bp且片段的CG含量至少為50%以及觀察到的/預期的CpG的比應該大于60%的事實的重復CG二核苷酸對的長度。人類中,基因啟動子區域約70%具有高CG含量。CG二核苷酸對可以存在于基因的其它位置或特定基因外并且未知與該特定基因相關。哺乳動物基因的啟動子區域約40%(控制基因轉爐和活化的基因區域)(FatemiM等人.FootprintsofmammalianCpGDNAmethyltransferasesrevealingnucleosomepositionsatasinglemoleculelevel.NucleicAcidsRes2005;33:e176)與CpG島相關且這些啟動子區域的四分之三具有高CpG濃度。總的來說,分散于整個DNA中的大多數CpG位點中,胞嘧啶核苷酸被甲基化。相比之下,位于基因的啟動子區域的CpG島中的CpG位點中,胞嘧啶沒有被甲基化,這表明了CpG島中的胞嘧啶的甲基化狀態在基因轉錄和活性中的作用。與基因相關或位于基因中的胞嘧啶的甲基化經典地與抑制基因轉錄相關。然而在一些基因中,增加的甲基化具有相反的作用并導致基因活化或增加基因轉錄。解釋后面的現象的一種可能機制可能為通過基因抑制元件的抑制作用由此由抑制作用釋放基因。包括DNA甲基化的表觀遺傳修飾是這樣的機制,即通過該機制例如含有相同DNA的細胞能夠激活不同的基因并導致分化成獨特的組織,諸如心臟或腸。表觀遺傳被定義為細胞的基因表達中可遺傳的(即傳遞給后代)變化,其不是主要由于基因中核苷酸(腺嘌呤、硫胺素、鳥嘌呤和胞嘧啶)序列突變或變化。當然,表觀遺傳是通過幾種潛在機制可逆調控基因表達。最廣泛研究的一種這樣的機制為DNA甲基化。其它機制包括DNA的3維結構的變化、組蛋白修飾或微小-RNA抑制性活性。受試者工作特征(ROC)曲線是描繪靈敏度的圖-在此設置中Y軸定義為在特定胞嘧啶基因座處具有陽性試驗或異常胞嘧啶甲基化水平的CHD案例的百分比而X軸定義了假陽性率(1-特異性)-即在相同基因座處具有異常胞嘧啶甲基化的正常非CHD案例的數目。特異性被定義為在感興趣的基因座處具有正常甲基化水平正常案例或陰性試驗的百分比。假陽性率是指錯誤地發現具有陽性試驗(即異常甲基化水平)的正常個體的百分比。ROC曲線下的區域(AUC)表明從異常案例中鑒別出正常案例的試驗的準確性(HanleyJA,McNeilBJ.Radiology1982;143:29-36)。AUC為ROC曲線下從該曲線至從X軸和Y軸的交叉點且傾斜角為45°的對角線的區域。受試者工作特征(ROC)曲線下的區域越大,預測感興趣的癥狀的試驗的準確性越高。區域ROC=1.0表示完美的試驗,其在所有患有病癥的案例中是陽性的(異常的)且在所有正常案例(沒有病癥)下是陰性的。甲基化試驗是指用于區分DNA中甲基化相對于未甲基化的胞嘧啶基因座的大量為市售可得的試驗。甲基化試驗多種定量甲基化試驗是可用的。這些包括采用甲基化敏感限制性內切核酸酶、凝膠電泳和基于標記的雜交探針的檢測的COBRATM(ZiongandLaird,NucleicAcidRes199725;2532-4)。另一個可用的技術為用于擴增感興趣的DNA片段的甲基化特異性PCR(MSP)。甲基化異性PCR在胞嘧啶的亞硫酸氫鈉轉化后采用甲基化敏感性探針來進行。基于定量的甲基化試驗的MethyLightTM采用基于熒光的PCR(Eads等人,CancerRes1999;59:2302-2306)。采用的另一種方法為定量甲基化(QMTM)試驗,其將PCR擴增與設計以結合至推定甲基化位點的熒光探針相結合。MS-SNuPETM是用于確定CpG位點中甲基化水平的差異的定量技術。與其它技術一樣,首先進行亞硫酸氫鹽處理,這導致未甲基化的胞嘧啶向尿液嘧啶轉化而甲基胞嘧啶不受影響。將特異于亞硫酸氫鹽轉化的DNA的PCR引物用于擴增感興趣的靶序列。將擴增的PCR產物分離并用于定量感興趣的CpG位點的甲基化狀態(GonzalgoandJonesNucleiAcidsRes1997;25:252-31)。測量胞嘧啶甲基化的優選方法為Illumina法。Illumina法對于DNA甲基化試驗,采用Illumina人類甲基化450芯片檢測全基因組定量甲基化圖譜。簡言之,從細胞(這本案例中從存檔的血斑)提取基因組DNA,對于此,DNA的原始來源為白血細胞。采用貿易中眾所周知的技術,用市售試劑盒將基因組DNA分離。使用蛋白酶K將蛋白質和其它污染物從DNA中移除。采用可用的方法(如有機萃取、鹽析或將DNA結合至固相載體)將DNA從溶液中移除。亞硫酸氫鹽轉化如在檢測甲基化步驟指南中所描述,用亞硫酸氫鈉處理DNA,其將未甲基化的胞嘧啶轉換為尿液嘧啶,而甲基化的胞嘧啶保持不變。然后,亞硫酸氫鹽轉化的DNA變性并中和。然后擴增經過變性的DNA。全基因組應用過程將DNA的量增加高達數千倍。下一步采用酶促方法使DNA片段化。接下來使用異丙醇使片段化的DNA沉淀并離心分離。接下來將分離的DNA懸浮在雜交緩沖液中。然后將片段化的DNA雜交至共價限于特異于基因組中感興趣的胞嘧啶核苷酸的基因座處的50mer的核苷酸片段的珠子。共有特異性設計以退火至特定的胞嘧啶所處的基因座的超過500,000種珠類型。將這些珠結合至硅基陣列。存在為各個基因座設計的兩種珠類型,一種珠類型代表設計以與胞嘧啶核苷酸保持不變的甲基化基因座匹配的探針。另一種珠類型對應于起初未甲基化而在亞硫酸氫鹽處理后轉化為硫胺素核苷酸的胞嘧啶。將未雜交(未退火到珠)的DNA洗去僅留下結合至適當的珠且含有感興趣的胞嘧啶的DNA片段。結合寡聚體的珠在退火至相應的患者的DNA序列之后,繼而采用超出患者DNA序列中感興趣的胞嘧啶的懸突體作為延伸的模板而用熒光標記的核苷酸進行單堿基延伸。如果感興趣的胞嘧啶為未甲基化的,那么其優選地與未甲基化的探針或“U”型珠探針配對。這使得能夠用熒光標記的核苷酸探針進行單堿基延伸并形成針對那種珠探針可以以自動化方式來讀取的熒光信號。如果胞嘧啶是甲基化的,會發生與“U”型珠探針寡聚體的單堿基錯配。然而珠寡聚體上不發生進一步核苷酸延伸,由此防止熒光標記的核苷酸摻入珠上。這會導致由珠“U”型珠的低熒光信號。“M”或甲基化的珠探針會發生逆轉。用激光激發結合至用于序列延伸的單堿基的熒光基團。通過將甲基化的珠的熒光強度與未甲基化的珠相比確定各個胞嘧啶基因座處的甲基化水平。將胞嘧啶甲基化水平表示為“β”,其為甲基化的-珠探針信號與那個基因座處的總信號強度的比。先前已經描述了用于確定胞嘧啶甲基化的這些技術且其廣泛用于商業用途。本發明描述了使用市售可用的甲基化技術以涵蓋整個基因組中包括約16,000個基因和500,000個胞嘧啶核苷酸的高達99%RefSeq基因低至單核苷酸水平(Infinium人類甲基化450BeachChip試劑盒)。將一組CHD案例相比于對照組的單個核苷酸的酸胞嘧啶甲基化的頻率用于估計CHD的風險或幾率。采用這種技術分析的胞嘧啶核苷酸包括CpG島中的胞嘧啶以及CpG島外部較遠距離處(即位于“CpG島岸(CpGshores)”和“CpG島架(CpGshelves)”)以及甚至位于更遠離GpC島的所謂的“CpG海域(CpGseas)”的那些胞嘧啶。鑒別特異性胞嘧啶核苷酸文件“CpGLociIdentification.AguidetoIllumina'smethodforunambiguousCpGlociidentificationandtrackingfortheandInfiniumTmassaysforMethylation”中已經詳細說明了(Illumnia)對分布于整個基因組中的特定胞嘧啶基因座進行可靠的鑒別。簡要總結如下。Illumina公司已經開發了基于胞嘧啶所處的核苷酸的實際序列或前后序列,指定胞嘧啶基因座的獨特的CpG基因座標識符。其采用與NCBI'sreSNPIPS(rs#)所用的類似的策略并基于感興趣的胞嘧啶側翼的序列。由此,將獨特的CpG基因座集群ID號分配給各個進行評估的胞嘧啶。據報道該系統是一致的且不受公共數據庫和基因組裝配的變化的影響。將CG基因座的60個堿基5'和3'的側翼序列(即一共122個堿基序列)用于鑒別基因座。由此,將獨特的“CpG集群號”或cg#分配給含有感興趣的CpG的122bp的序列。因此只有CpG集群中的122bp是相同的,才存在分配給相同的編號并位于基因組中超過一個位置處的基因座的風險。利用三個獨立的標準以基于該獨特的ID系統來追蹤各個CpG基因座。建立染色體號、基因組坐標和基因組。將CpG中兩個坐標“C”或“G”的較小者用于獨特的CG基因座鑒別。還指定CG基因座與含有“A”(腺嘌呤)至“T”(硫胺素)中的任何一個的第一“明確的”核苷酸對有關。如果這些核苷酸中的一個為CG的5'端,那么排列為指定的TOP,且如果該核苷酸為3'端,其為指定的BOT。另外,將正向或反向的DNA鏈表示為被評價的胞嘧啶的位置。假設特定的染色體區域內的胞嘧啶堿基的甲基化狀態是同步的(EckhartF,LewinJ,CorteseR等人:DNAmethylationprofilingofhumanchromosome6,20和22.NatGent.38,1379-85.2006)。方法描述從生物樣本庫重新獲取保存在濾紙上的單一新生兒干血斑,該樣本是作為為檢測代謝紊亂而確立的密歇根新生兒篩查項目的一部分而收集的,并由密歇根蘭辛的密歇根社區衛生部門(MDCH)儲存。通常在平均出生后2天由足跟原始獲得血液并將血液放置在濾紙上。室溫下儲存樣品。采用臨床試驗完成后未鑒別的殘留血斑。通過由MDCH標準化方法獲得IRB批準。目前研究所用的試樣是在1998和2003年之間采集的。將患有染色體異常或其它已知的或可疑的遺傳綜合征的案例(包括缺失染色體#22的部分小臂的稱為DiGeorge綜合征的癥狀)排除在外。除了感興趣的CHD之外,將存在的與初步診斷無關的其它心臟或心外異常或伴隨存在的重大先天缺陷排除在外。對一共8例HLH,8例VSD,ASD、主動脈縮窄、肺動脈瓣狹窄各12例,以及14例TOF,與一共32例對照一起進行分析。對照例為正常的非CHD新生兒和非異常新生兒。將各個CHD類別與正常組進行比較并將比較的所有CHD案例組合在一起(CHD組)與作為整體的正常組進行比較。將兩個常見的CHD類別(VSD和TOF)彼此進行比較。從血斑提取血液按照2009年4月出版的第四版theDNAInvestigatorHandbook,SampleandAssayTechnologies,QIAGEN中所述進行DNA提取。提供了DNA提取法的簡要總結。將兩個6毫米直徑的圓(或四個3毫米直徑的圓)沖壓出儲存在濾紙上的干血斑并用于DNA提取。該圓包含約5μL全血的白血細胞的DNA。將該圓轉移至2毫升的樣品管。一共使用190μL稀釋的緩沖液G2(1:1比例的G2緩沖液:蒸餾水按)以將DNA從濾紙上洗脫。添加另外的緩沖液直到試管中剩余的樣品體積為190μL,因為濾紙會吸收一定體積的緩沖。添加10μL蛋白酶K并將混合物渦旋10s且快速旋轉。然后將混合物在56℃、900rpm下孵育15分鐘。在95℃、900rpm下進一步孵育5分鐘以增加DNA從濾紙上的產率。進行快速旋轉。然后如所描述的將樣品在EZ1進階(Trace,Tip-Dance)步驟上運行。該步驟用于從混合物中分離總DNA。含有于50μL水中的凈化DNA的洗脫管現在可用于進一步的分析。InfiniumDNA甲基化試驗甲基化分析-將Illumina'sInfinium人類甲基化450珠芯片系統用于全基因組甲基化分析。采用用于Infinium的標準方案用EZ-96甲基化試劑盒(ZymoResearch)對DNA(500ng)進行亞硫酸氫鹽轉化以使未甲基化的胞嘧啶脫去氨基形成尿液嘧啶。將DNA以酶促方式進行片段化并雜交至Illumina珠芯片。珠芯片含有基因座特異性寡聚體且是成對的,一個對甲基化的胞嘧啶基因座是特異性的且另一個對未甲基化的基因座是特異性的。進行單堿基延伸以并入生物素標記的ddNTP。熒光染色和洗滌后,對珠芯片進行掃描并采用BeadStudio軟件(Illumina)確定各個基因座的甲基化狀態。采用具有靶向移除、染色、雜交、延伸、亞硫酸氫鈉轉化、特異性的樣品依賴性對照組和樣品非依賴性對照組,陰性對照組和非多態對照組的控制面板對實驗質量進行評估。甲基化狀態為甲基化探針信號相對于甲基化和未甲基化探針的總和的比。產生的比值表明基因座是未甲基化(0)的還是全甲基化的(1)。采用Illumina自定義模型確定不同的甲基化位點并根據采用0.05作為閾值的P值對其進行過濾。Illumina'sInfinium人類甲基化450珠芯片系統,一種更新的試驗方法,其涵蓋多個基因的啟動子區域中的CpG位點(含有胞嘧啶),大約~16880個。此外,該試驗中表述了整個基因組和基因外部,以及CpG島的內部或外部的其它胞嘧啶基因座。采用ROC曲線用于預測CHD風險的胞嘧啶甲基化為了確定特定胞嘧啶基因座的甲基化水平對CHD預測的準確性,采用位點處的不同甲基化閾值水平(諸如10%、≥20%、≥30%、≥40%等)以計算CHD預測的靈敏度和特異性。因此,例如在特定的cg基因座處采用≥10%的甲基化,認為甲基化水平高于該閾值的案例具有陽性檢驗而將低于該閾值的那些解釋為陰性甲基化試驗。在該特定的胞嘧啶基因座處10%的甲基化的該示例中,具有陽性試驗的CHD案例的百分比可等于試驗的靈敏度。可認為該基因座處甲基化水平<10%的正常非CHD案例的百分比為特異性的試驗。在這里將假陽性率定義為具有(錯誤)異常試驗結果的正常案例的數量并將靈敏度定義為具有(正確)異常試驗結果(即該特定的cg基因座處10%的甲基化水平)的CHD案例的數量。對一系列的閾值甲基化值(諸如≥1/10、≥1/20、≥1/30等)進行評估,且用于對各個基因座產生一系列成對的靈敏度和假陽性值。產生了受試者工作特征(ROC)曲線,其為Y軸具有靈敏度值且X軸具有假陽性率的數據點的圖。這種方法可以用于對各個胞嘧啶基因座形成ROC曲線,該ROC曲線顯示了各案例與CHD組之間的顯著甲基化差異。進行了標準統計試驗,該標準統計試驗采用p-值來表示CHD試樣和對照DNA試樣之間在給定的基因座處觀察到胞嘧啶甲基化之間的差異的概率。還進行了采用假發現率(FDR)的更加嚴格的測試。當采用多重比較進行多重假設試驗時,FDR給出了陽性結果是由于偶然性的概率。在本發明的一個實施方式中,采用先前所描述的針對全基因組甲基化研究的IlluminaInfinium試驗,當與正常組相比時,以及當將所有的CHD類別合并成一個單一組(“CHD組”)并與正常組進行比較時,在各個CHD(VSD、ASD、HLH、主動脈縮窄、PS和TOF)組中表明了與特定基因相關的特異性胞嘧啶核苷酸的甲基化的頻率(水平或百分數)方面的顯著性差異。胞嘧啶甲基化水平方面的差異非常顯著且具有足夠的強度以將各個不同的CHD組與正常組準確區分。因此,可以將本發明用作在CHD和正常案例的混合群體中對CHD案例進行篩選的試驗。根據個體因素(飲食、種族、年齡、性別、藥物、毒素、環境暴露、其它并發的醫療疾病等),胞嘧啶甲基化的程度可能變化。總的來說,盡管有這些潛在來源的可變性,整個基因組甲基化的研究鑒別出了某些基因內(和外部)的特異性位點并可以相比于正常案例對易患不同類別的CHD或患不同類別的CHD的風險增加的個體的組進行區分且因此可以用作有用的篩選試驗以相比于正常案例對易患不同類別的CHD或患不同類別的CHD的風險增加的個體的組進行鑒別。本發明的另一個實施方式在于,既然除極少例外(成熟的紅細胞和成熟的血小板)的細胞含有核以及因此含有DNA,本發明可以采用DNA從除以上指出的兩種細胞之外的任何細胞來篩選CHD。另外,來自受到破壞且可以從體液中重新獲取的細胞的無細胞DNA可以用于該篩選。細胞和來自任何含有DNA的生物樣品的DNA可以用于本發明的目的。用于試驗的樣品可以獲自活的或死亡的組織以及含有細胞或組織的考古試樣。可以用于獲取DNA以基于本發明進行CHD篩選的生物試樣的示例包括:體液(諸如血液、唾液、生殖器分泌物、尿液液)、皮膚、毛發、毛囊/根、粘膜(臉頰又名頰的刮屑或舌頭的刮屑)、身體內部組織,或出生時獲得的臍帶血。本發明的另一個實施方式為利用DNA中胞嘧啶甲基化的全基因組差異以在產前和產后生活的任何階段篩選CHD以及確定CHD的風險和可能性。這些階段包括胚胎、胎兒、新生兒期(出生后頭28天)、嬰兒期(直到1歲的年齡)、兒童(直到10歲)、青春期(11至21歲的年齡)和成年期(即>21歲的年齡)。本發明所呈現的結果證實了基于CHD和正常案例之間的整個人類全基因組的胞嘧啶位點的甲基化水平的差異可以確定患CHD的傾向和風險。對甲基化差異的解釋為CHD的形成引起或導致多個基因的異常表達,其中許多基因直接或間接地影響或控制心臟的發育。異常的基因功能包括基因功能的抑制(這些基因的活性對正常的心臟發育非常重要)或相反地基因的激活(通常抑制這些基因的功能以允許心臟的正常發育)。此外,影響形成CHD的物質(例如酒精)可以獨立地對與心臟發育無關但是基于“酒精作用”形成甲基化異常的其它基因產生影響。由此,全基因組胞嘧啶甲基化研究提供了關于對參與心臟的正常和異常發育的多個基因和基因網絡進行協調廣泛激活和抑制的信息。這種方法不需要心臟發育中特定基因的作用或基因功能的改變導致CHD的機制的先驗知識。此外,對包括數千基因的成百上千的胞嘧啶基因座同時并以無偏性方式進行評估且因此可以用于準確評估CHD的風險。更重要的是這一事實,即基因外部的胞嘧啶基因座還可以控制基因功能,因此位于基因外部的基因座的甲基化水平進一步有助于預測CHD。本發明證實了相比于心臟正常發育的個體,受不同形式CHD影響的個體的整個基因組的多個胞嘧啶基因座處發生胞嘧啶核苷酸的甲基化模式畸變或改變。本發明的其它方面提供了用于基于整個基因組的多個DNA位點處的胞嘧啶甲基化的差異來預測或評估CHD風險的技術和方法。目前,不存在可靠的臨床可用的采用細胞、組織或體液用于預測或評估群體中個體的CHD風險的生物學方法。對包括主動脈瓣狹窄(AVS)、左心發育不良心臟綜合征(HLHS)、室間隔缺損(VSD)、法洛四聯癥(TOF)、主動脈縮窄(Coarct.)、房間隔缺損(ASD)和肺動脈狹窄的幾種常見類別的CHD進行檢測。將CHD類別與正常組進行比較并鑒別出了在整個基因組中甲基化狀態方面顯示出統計學顯著性差異的胞嘧啶核苷酸。由于胞嘧啶核苷酸的延伸覆蓋,一些不同的甲基化的胞嘧啶位于CpG島的外部或已知基因的外部。本發明根據考慮的特定胞嘧啶基因座,采用嚴格的陰性發現率(FDR)分析,報道了整個基因組中大量胞嘧啶位點處的胞嘧啶甲基化狀態之間的強相關,其中q-值<0.05且其中許多q-值低至<1×10-30,(表1至7)。對一共64例CHD和32例正常對照進行了評估。在與正常組進行比較的所有六個類別的待測CHD中以及在作為整體與正常組進行比較的CHD案例中發現了整個DNA中的多個基因座處甲基化模式的顯著性差異。公開的特定胞嘧啶位于已知基因。這些發現與相比于對照組的CHD案例中的多個基因改變的表達相一致。所報道的胞嘧啶甲基化標記物使用于基于整個基因組中胞嘧啶甲基化來預測和檢測CHD的群體篩選研究能夠進行。它們還允許例如通過采用基因本體論分析對胞嘧啶甲基化數據進行評估增進對形成CHD的理解。本申請中評估的胞嘧啶包括但不限于位于基因的啟動子區域中的CpG島中的胞嘧啶。靶向和測量的其它區域包括遠離CpG島達2000個堿基對的所謂的CpG島岸和針對DNA區域側翼島岸指定的所謂的CpG島架。甚至對距離CpG島更遠的區域所謂的“海域”進行了針對胞嘧啶甲基化差異的分析。因此,對胞嘧啶甲基化進行了全面的和全基因組分析。統計分析本發明的一方面描述了用于對個體患特定類型的CHD的風險進行評估的方法。這種估計可以基于導致在已知與增加CHD的風險有關的大量可能的預測因子(即甲基化基因座)中重要的獨立預測因子的鑒別的邏輯回歸分析。不同基因座處的胞嘧啶甲基化水平可以自身或與已知與增加本申請中所描述的特定類型的CHD的風險有關的其它已知的風險預測因子(如產前暴露于毒素-“是”或“否”(諸如酒精或母體吸煙、母體糖尿液病、家族史和單個或多個基因座中的甲基化水平))組合使用。基于邏輯回歸可以從概率方程推導出受影響個體的概率:PCHD=1/1+e-(B1x1+B2x2+B3x3...Bnxn)其中‘x’是指特定預測因子的大小或數量(諸如特定基因座處的甲基化水平)以及“β”或β-系數是指針對特定預測因子(x)水平改變的各個單元,結果(特定類型的CHD)的概率變化的大小,B值源于邏輯回歸分析的結果。這些B值源于受影響和未受影響的個體的大量群體的多變量邏輯回歸分析。在此案例下代表不同胞嘧啶基因座處的甲基化百分比的x,1,x2,x3等的值可源于所測試的個體而β-值可源于所提及的受影響(CHD)和未受影響的案例的大量參考群體的邏輯回歸分析。基于這些值,可以定量評估個體患CHD類型的概率。概率閾值用于定義高風險的個體(諸如≥1/100的CHD的概率可以用于定義觸發如以下一種或多種:出生時超聲心動圖、脈搏血氧測量等進行進一步評估的高風險的個體,而風險<1/100的個體不需要進一步跟進)。其它因素中所用的閾值會基于診斷的靈敏度(正確鑒別的CHD案例的數目)、特異性(正確鑒別為正常的非CHD案例的數目)、ECHO心動圖的風險和成本以及根據指定個體為CHD“高風險”和這些因素的相關干預。眾所周知邏輯回歸分析是疾病篩選中用于評估個體具有紊亂的風險的方法(RoystonP,ThompsonSG.Model-basedscreeningbyriskwithapplicationinDown'ssyndrome.StatMed1992;11:257-68.)。基于重疊的高斯分布或多變量高斯分布的方法通過利用各個有差別的胞嘧啶基因座處自身的甲基化百分數(報道為β-系數)或利用基因座的不同組合也可以計算個體患CHD的風險(WaldNJ,CuckleHS,DeusemJW等人(1988)Maternalserumscreeningfordownsyndromeinearlypregnancy.BMJ297,883-887.),其中變量為所謂的特定(或多個)基因座處的甲基化水平/甲基化百分比。可選地,如果甲基化百分數或β-系數不是正態分布(即非高斯),如果必要的話通過這些百分數的對數轉換會獲得正態高斯分布。作為示例,針對CHD群體和正常群體中特定基因座處的甲基化,得到兩個高斯分布曲線。然后計算了平均值、標準差和兩個曲線之間的重疊程度。在給定的甲基化水平處分布曲線的高度比會給出似然比或因素,根據該似然比或因素,在給定的基因座處在特定的甲基化水平患CHD的風險增加(或降低)。似然比(LR)值可以乘以普通群體的CHD的背景風險(針對特定類型的CHD或針對全部CHD)并由此基于選定的cg位點處的甲基化水平給出個體的CHD風險。新生群體中CHD的背景群體風險的信息可以從幾種來源獲得(一個這樣的示例為HoffmanJL等人AmHeartJ2004;147:425-439)。類似的信息可用于產前和后來的產后生活。演化計算自1950年代以來出現了演化計算。這些計算方法是用于由復雜的、大量的數據預測結果的工具。演化計算包括大量的方法,如遺傳算法。后者廣泛用于問題解決并利用自然進化的三個原則:選擇、突變和重組(Penza-ReyesCA,SipperM.Evolutionarycomputationinmedicine2000;19:1-23.ArtifIntellMed2000;19:1-23;WhitleyD.Anoverviewofevolutionaryalgorithms:practicalissuesandcommonpitfalls.InfoSoftwareTech2001;43:87-31)。申請從化學、經濟學、工程學、藥物延伸到代謝組學。Goodcare(GoodcareR.Makingsenseofthemetabolomeusingevolutionarycomputing:seeingthewoodwiththetrees.JExpBot2005;56:245-54.)概述了對由新的分析平臺(如代謝組學)產生的海量數據進行分析的嚴峻挑戰。他用了一個示例,分析250個生化標記物(表觀遺傳分析中每個患者非常合理數量的數據點)以區分耐干旱的植物與正常對照植物。用于確定特定的代謝物是否包含于模型中的完全搜索需要2250或1.8×1075次計算。超高速計算機需要超過估計的3×1062年以執行所需的計算。演化計算是在更短的時間內用于由大量的數據提供好的解決方案或預測感興趣的結果的自動的方法。演化計算選擇最適合“生存”意味著預測感興趣的結果的“染色體”(其為“串(string)”或不同代謝物及它們濃度的組合)。各個可變的預測因子(諸如代謝物)代表該‘染色體’串上的基因。各個染色體存活的適合性為計算機程序分配的從0至1的數值。適合性表明參數的這種組合在多大程度上確保‘進化存活’或者提供了對問題的最好解答(GoodcareR.Makingsenseofthemetabolomeusingevolutionarycomputing:seeingthewoodwiththetrees.JExpBot2005;56:245-54)。‘染色體’和‘適合性’的組合代表‘個體’(MirandaV,SrinivasanD,ProencaLM.Evolutionarycomputationinpowersystems.ElecPowerEnergSys1998;20:89-981)。這些‘個體’的群體代表‘第一代’有機體。根據它們的適合性將‘個體’排列。這開始了進化過程。通過從第一代中挑選最適合的具有最好的‘存活’機會(即預測感興趣的結果)的個體而選擇操縱基因創造下一代。此外,通過與無規重排的‘染色體’的片段交叉(即形成‘基因’序列的‘染色體’片段與其組成性預測因子的串(代謝生物標記物)發生改變)改變創造了第二代的新‘個體’。最后,個體中引入變化的地方產生突變。突變可以意味著在它們的數量上(濃度)有變化或沒有任何變化的組成性預測因子或輸入變量(代謝標記物)的變化。因此,遺傳算法采取高性能的‘個體’并對它們進行選擇、使它們‘突變’以及將它們與其它高適合性或高性能的‘個體’進行‘重組’以最終實現‘基因’的最佳組合或在‘染色體’上輸入預測感興趣的結果的預測因子。與公認的進化原則的相似性是顯然的。包括遺傳算法的演化計算通過不斷地重新評估和調整逐步形成對問題更好的解決方案(Penza-ReyesCA,SipperM.Evolutionarycomputationinmedicine2000;19:1-23.ArtifIntellMed2000;19:1-23.)。該方法鑒別出形成了大量的數據集以達到最高的預測準確度關鍵的組分和類型。該方法快速、自動且不需要有關輸入變量或感興趣的結果的任何統計或其它假設。其不受缺失的數據的影響,不受背景噪音的影響且不需要參數分布。總體而言,認為它優于回歸分析和神經網絡且同樣處理小的和非常大的數據集。考慮到分析的大量的甲基化位點,每個患者DNA樣品約450000個案例和各個CHD類別中相對少量的案例,遺傳編程(演化計算的分支)為數據分析的主要方法。將TheGmax計算機程序版本11.09.23用于演化計算分析。用于計算對胞嘧啶基因座的靈敏度和特異性的邏輯回歸分析的使用限于全部CHD組(組合的6個類別的CHD)因為案例數目不足且因此各個CHD子類的效能不足以進行回歸分析。示例示例1將來自針對代謝紊亂進行常規篩查的新生兒的血斑采集在濾紙上。采集時新生兒的平均年齡為2天。將不用于代謝測試的完全未用于鑒別(對研究人員而言)的殘余血斑室溫儲存在密歇根蘭辛的密歇根社區衛生部門設備中。如本申請中先前所述的從濾紙上的單一血斑中提取并純化DNA,并采用如早前所述的Illumina'sInfinium人類甲基化450珠芯片系統確定不同CPG島的甲基化水平。在8例VSD類型的CHD相對于32例正常案例中比較了整個DNA的多個胞嘧啶處的甲基化水平或百分比。表1示出了位于已知基因中的與VSD案例和正常案例之間的甲基化的顯著性差異相關的6個胞嘧啶基因座。與用于整體預測VSD案例相對于正常非心臟病案例的各特定胞嘧啶基因座的分布(邊際貢獻)一起提供了基因ID號和基因符號、基因所位于的染色體號、呈現不同甲基化的胞嘧啶基因座的位置和DNA鏈(反向或向前)。極低的假發現率(FDR)值表明VSD案例相對于對照組中這些特異性胞嘧啶之間甲基化百分比的高度顯著性差異。示例2將來自針對代謝紊亂進行常規篩查的新生兒的血斑采集在濾紙上。采集時新生兒的平均年齡為2天。將不用于代謝測試的完全未用于鑒別(對研究人員而言)的殘余血斑室溫儲存在密歇根蘭辛的密歇根社區衛生部門設備中。如本申請中先前所述的從濾紙上的單一血斑中提取并純化DNA,并采用如早前所述的Illumina'sInfinium人類甲基化450珠芯片系統確定不同CPG島的甲基化水平。在12例ASD類型的CHD相對于32例正常案例中比較了整個DNA的多個胞嘧啶基因座處的甲基化水平或百分比。表2示出了位于已知基因中的與ASD案例和正常案例之間的甲基化的顯著性差異相關的7個胞嘧啶基因座。與用于整體預測ASD案例相對于正常非心臟病案例的各特定胞嘧啶基因座的分布(邊際貢獻)一起提供了基因ID號和基因符號。極低的FDR值表明VSD案例相對于對照組中這些特異性胞嘧啶之間甲基化百分比的高度顯著性差異。示例3將來自針對代謝紊亂進行常規篩查的新生兒的血斑采集在濾紙上。采集時新生兒的平均年齡為2天。將不用于代謝測試的完全未用于鑒別(對研究人員而言)的殘余血斑室溫儲存在密歇根蘭辛的密歇根社區衛生部門設備中。如本申請中先前所述的從濾紙上的單一血斑中提取并純化DNA,并采用如早前所述的Illumina'sInfinium人類甲基化450珠芯片系統確定不同CPG島的甲基化水平。在12例肺動脈瓣狹窄(PS)類型的CHD相對于32例正常案例中比較了整個DNA的多個胞嘧啶處的甲基化水平或百分比。表3示出了位于已知基因中的與PS案例和正常案例之間的甲基化的顯著性差異相關的6個胞嘧啶基因座。與用于整體預測PS案例相對于正常非心臟病案例的各特定胞嘧啶基因座的分布(邊際貢獻)一起提供了基因ID號和基因符號。極低的FDR值表明PS案例相對于對照組中這些特異的胞嘧啶之間甲基化百分比的高度顯著性差異。示例4將來自針對代謝紊亂進行常規篩查的新生兒的血斑采集在濾紙上。采集時新生兒的平均年齡為2天。將不用于代謝測試的完全未用于鑒別(對研究人員而言)的殘余血斑室溫儲存在密歇根蘭辛的密歇根社區衛生部門設備中。如本申請中先前所述的從濾紙上的單一血斑中提取并純化DNA,并采用如早前所述的Illumina'sInfinium人類甲基化450珠芯片系統確定不同CPG島的甲基化水平。在12例主動脈縮窄(“coarct.”)類型的CHD相對于32例正常案例中比較了整個DNA的多個胞嘧啶處的甲基化水平或百分比。表4示出了位于已知基因中的與主動脈縮窄案例和正常案例之間的甲基化的顯著性差異相關的7個胞嘧啶基因座。與用于整體預測主動脈縮窄案例和正常非心臟病案例的各特定胞嘧啶基因座的分布(邊際貢獻)一起提供了基因ID號和基因符號。極低的FDR值表明主動脈縮窄案例相對于對照組中這些特異性胞嘧啶之間甲基化百分比的高度顯著性差異。示例5將來自針對代謝紊亂進行常規篩查的新生兒的血斑采集在濾紙上。采集時新生兒的平均年齡為2天。將不用于代謝測試的完全未用于鑒別(對研究人員而言)的殘余血斑室溫儲存在密歇根蘭辛的密歇根社區衛生部門設備中。如本申請中先前所述的從濾紙上的單一血斑中提取并純化DNA,并采用如早前所述的Illumina'sInfinium人類甲基化450珠芯片系統確定不同CPG島的甲基化水平。在14例法洛四聯癥(TOF)類型的CHD相對于32例正常案例中比較了整個DNA的多個胞嘧啶處的甲基化水平或百分比。表5示出了位于已知基因中的與TOF案例和正常案例之間的甲基化的顯著性差異相關的8個胞嘧啶基因座。與用于整體預測TOF案例相對于正常的非心臟病案例的各特定胞嘧啶基因座的分布(邊際貢獻)一起提供了基因ID號和基因符號。極低的FDR值表明TOF案例相對于對照組中這些特異性胞嘧啶之間甲基化百分比的高度顯著性差異。示例6將來自針對代謝紊亂進行常規篩查的新生兒的血斑采集在濾紙上。采集時新生兒的平均年齡為2天。將不用于代謝測試的完全未用于鑒別(對研究人員而言)的殘余血斑室溫儲存在密歇根蘭辛的密歇根社區衛生部門設備中。如本申請中先前所述的從濾紙上的單一血斑中提取并純化DNA,并采用如早前所述的Illumina'sInfinium人類甲基化450珠芯片系統確定不同CPG島的甲基化水平。在8例左心發育不良心臟綜合征(HLHS)類型的CHD相對于32例正常案例中比較了整個DNA的多個胞嘧啶處的甲基化水平或百分比。表6示出了位于已知基因中的與HLHS案例和正常案例之間的甲基化的顯著性差異相關的4個胞嘧啶基因座。與用于整體預測HLHS案例相對于正常的非心臟病案例的各特定胞嘧啶基因座的分布(邊際貢獻)一起提供了基因ID號和基因符號。極低的FDR值表明HLHS案例相對于對照組中這些特異性胞嘧啶之間甲基化百分比的高度顯著性差異。示例7將來自針對代謝紊亂進行常規篩查的新生兒的血斑采集在濾紙上。采集時新生兒的平均年齡為2天。將不用于代謝測試的完全未用于鑒別(對研究人員而言)的殘余血斑室溫儲存在密歇根蘭辛的密歇根社區衛生部門設備中。如本申請中先前所述的從濾紙上的單一血斑中提取并純化DNA,并采用如早前所述的Illumina'sInfinium人類甲基化450珠芯片系統確定不同CPG島的甲基化水平。在66例CHD的整體組(組合的所有CHD類別)相對于32例正常案例中比較了整個DNA的多個胞嘧啶處的甲基化水平或百分比。表7示出了位于已知基因中的與CHD案例和正常案例之間的甲基化的顯著性差異相關的8個胞嘧啶基因座。與用于整體預測全部CHD相對于正常的非心臟病案例的各特定胞嘧啶基因座的分布(邊際貢獻)一起提供了基因ID號和基因符號全部CHD。極低的FDR值表明全部CHD案例現對于對照組中這些特異性胞嘧啶之間甲基化百分比的高度顯著性差異。示例8我們還評估了胞嘧啶基因座處的甲基化狀態是否可以用于將常見類別的CHD彼此區分出來。在該特定分析中,我們將8例單獨的VSD從14例TOF案例中區分了出來。將來自針對代謝紊亂進行常規篩查的新生兒的血斑采集在濾紙上。采集時新生兒的平均年齡為2天。將不用于代謝測試的完全未用于鑒別的殘余血斑室溫儲存在密歇根蘭辛的密歇根社區衛生部門設備中。如本申請中先前所述的從濾紙上的單一血斑中提取并純化DNA,并采用如早前所述的Illumina'sInfinium人類甲基化450珠芯片系統確定不同CPG島的甲基化水平。在8例單獨的VSD相對于14例法洛四聯癥(TOF)類型的CHD中比較了整個DNA的多個胞嘧啶處的甲基化水平或百分比。表8示出了位于已知基因中的與VSD案例和正常案例之間的甲基化的顯著性差異相關的2個胞嘧啶基因座。極低的FDR值表明單獨的VSD相對于TOF案例中這些特異性胞嘧啶之間甲基化百分比的高度顯著性差異。示例9用于CHD檢測的甲基化標記物和人口學特征的診斷準確性僅有有限的人口統計信息可以從患者的出生證明獲得以及由密歇根社區衛生部門(MDCH)提供。根據內部審查委員會(IRB)的條款,所有信息是完全匿名的且排除圖表審查。人口學特征為新生兒的性別、出生體重、分娩時胎齡、產婦年齡、出生的時間間隔和樣品采集(小時)、以及試樣采集和分子分析之間的時間(年)。而這些可能除了種族放入因素對影響CHD的形成是未知的,它們各自有可能影響DNA甲基化水平且因此在預測和檢測CHD中與胞嘧啶甲基化狀態一起被考慮。當與用于CHD預測的人口學特征組合時研究了胞嘧啶甲基化標記物的最佳組合。只有在TOF案例中,人口學特征當與甲基化標記物組合時確實對診斷價值做出了有意義的貢獻,如圖9所示。所有的案例和對照具有白人種族以使與種族有關的DNA甲基化中潛在的變異性最小化。除了TOF,發現這些因素中沒有一個顯著影響兒童發育CHD的風險。此外,似乎不太可能的是血斑儲存的長度在CHD案例和對照之間的甲基化水平中具有顯著性差異。對于表1至9,與用于整體預測各個特定的CHD類別的各特定胞嘧啶基因座的分布(邊際貢獻)一起提供了基因ID號和基因符號。用于CHD檢測的DNA甲基化標記物的診斷靈敏度和特異性圖10至18示出了用于檢測不同類別CHD的甲基化標記物的診斷靈敏度和特異性。總體來說,采用有限數量的甲基化標記物獲得了高靈敏度和特異性。示例10基于邏輯回歸分析用于檢測全部CHD組的甲基化標記物的診斷準確性如前所述,可以利用邏輯回歸分析并基于該計算的靈敏度和特異性值評估個體患CHD的風險。由于各個CHD類別的CHD案例數量小,研究效能不足以計算各個CHD類別的靈敏度和特異性值。因此,這種特定分析限于整體(組合的)CHD組相對于正常案例。表19a示出了用于從正常對照組中預測全部CHD的兩個胞嘧啶基因座的組合。示出了用于預測全部CHD的靈敏度和特異性。此外,提供了證實ROC曲線下的區域對將全部CHD從正常案例中區分出來的統計學顯著性的該區域和p-值。增加人口學信息不影響或增進CND預測。表19b提供了關于感興趣的胞嘧啶基因座的特異性詳情。DNA甲基化測試在將個體CHD案例從正常案例中區分出來方面是高度準確的。示例11參與形成先天主動脈瓣狹窄(AVS)的DNA甲基化鑒別基因的改變我們進行了對患有AVS的新生兒的全基因組DNA甲基化模式進行檢查的研究以鑒別含有與疾病相關的基因的基因組區域和可能有助于CHD病理生理學的表觀遺傳變異。該研究的重要目的為鑒別未來可能用于AVS的風險評估和檢測的DNA甲基化生物標記物、血清分子。利用市售DNA提取試劑盒(Qiagen)按照制造商的方案從新生兒的干燥血斑獲得基因組DNA。血斑試樣為密歇根州的密歇根社區衛生部門(MDCH)運行的的強制執行的新生兒篩查和治療項目而而預先采集的。所有試樣是在出生后24和79小時之間采集的。威廉博蒙特(WilliamBeaumont)醫院和MDCH的機構審查委員會均批準了該項研究。在血液采集時通報了家長/法定監護人,臨床測試后殘余的血斑可以用于研究MDCH請求的等待候審的該研究。針對各個受試者可以獲得包括樣品采集的數據、母體年齡和和種族、分娩時胎齡和新生兒性別以及CHD異常的類型的有限的人口學信息。將疑似或確診未知AVS案例排除在外。不受影響的正常對照沒有報道的醫療紊亂且與出生體重、分娩時胎齡,種族、出生年份和試樣采集到測試的間隔相匹配。我們的組群包括24名AVS受試者和24名對照。通過去除其它受保護的健康信息而未對所有的試樣進行鑒別,且研究人員戴面具進行鑒別。表20中可以獲得控制群組的案例詳情。采用人類甲基化450進行全基因組甲基化分析:采用含有485,577個甲基化位點且僅需要500ng基因組DNA的用于甲基化的人類甲基化450,Illumina’sHD珠芯片試驗(Illumina有限公司,加利福尼亞,美國)對48名個體(24名AVS受試者和24名對照)進行全基因組甲基化分析。這些位點均勻分布在基因組中且代表每個包括啟動子區域、5’UTR區域、編碼區域和3’UTR區域的被覆蓋的基因區域的96%的RefSeq基因、95%的CpG島和平均17個CpG位點。采用IlluminaInfinium技術用外周血淋巴細胞進行的DNA甲基化圖譜已經用于鑒別與疾病狀態相關的CpG位點。利用EZDNA直接甲基化試劑盒(ZymoResearch,Orange,CA)按照制造商的方案對DNA樣品進行亞硫酸氫鹽轉化。通過Illumina反掃描對熒光染色的珠芯片進行成像。在詳細的生物信息學和統計學分析之前進行數據預處理和質量控制,包括檢查受影響的陰性對照(甲基化和未甲基化的信號)和甲基化和未甲基化的信號強度的比的背景信號強度。處理完全按照制造商的方案進行且99%的CpG基因座為明確確定的。統計學和生物信息學分析利用基因組工作室甲基化分析程序包(Illumina)對全基因組、基因-特異性DNA甲基化進行檢查。隨后進行上述預處理,將DNA甲基化β-值指定給各個CpG位點。通過將AVS受試者和對照組之間的各個CpG位點處的各個核苷酸的β-值進行比較而對差異甲基化進行評估。如前所述對針對案例和正常組之間各個基因座處的甲基化差異的β-值進行計算。將針對β-值的過濾條件設置為<0.05以及<0.01以鑒別出最與眾不同的胞嘧啶。用或不用針對多重測試(Benjamini-Hochberg測試)的假發現率(FDR)校正對β-值進行計算。為了潛在的生物學顯著性對差異性甲基化的基因進行進一步分析。對受試者工作特征(ROC)曲線和ROC曲線下的面積進行了計算以確定將AVS從對照組區分出來的特異性胞嘧啶基因座的診斷準確性。采用控制歸一化方法對數據進行歸一化。基因本體論分析和功能豐富將發現為差異性甲基化的基因(FDRp-值<0.01處=上傳到基于網絡的功能注釋工具DAVIDV67(DAVID/EASE,WebGestalt)以進行包括基因ID轉換、生物通路分析以及甲基化和未甲基化區域的分子功能在內的基因本體論分析。使用Chilibot對感興趣的基因名稱和關鍵詞的同現進行文獻數據挖掘。僅對可以獲得Entrez標識符的基因進行進一步地分析。利用獨創性通路分析(獨創性系統)進行通路分析。對過度表達的標準通路、生物過程和分子過程進行鑒別。出生時胎齡(周):AVS受試者中平均值(SD)為38.75(1.42)相對于對照組中平均值(SD)為38.88(1.19)(p=0.743),生產后試樣采集時間(小時),AVS受試者中平均值(SD)為31.042(11.86)相對對照組中平均值(SD)為32.46(8.62)(p=0.638)均沒有差異。母體年齡沒有差異,AVS受試者中為29.87(4.56)歲相對于對照組中為29.87(4.56)歲(p值為1.0)。最后,母體種族和新生兒性別與分析相匹配。在該研究中,通過對AVS受試者的篩查群組進行全基因組甲基化分析,我們鑒別出位于1835個不同基因中的3346個CpG甲基化位點。在所鑒別出的1835個基因中,分層聚類分析表明~110個通常被甲基化且其甲基化與AVS個體中改變的基因表達有關的新型主要候選基因。基于FDR-校正的p-值,表21A和21B列出了前100個差異性甲基化CpG位點。將甲基化狀態表示為針對樣品中給定探針的百分比甲基化。正的‘%m變化’值表明相比于對照樣品AVS受試者中甲基化狀態的平均增加。類似地,負的‘%m變化’值表明相比于對照AVS受試者中甲基化狀態的平均減少。p-值表明差異性甲基化水平的顯著性。表21A和21B中示出了由Illumina提供的加州大學圣克魯茲分校(UCSC)CG二核苷酸和染色體中的C的基因名稱和其所處的基因組位置。由標準通路和生物過程的DAVID通路和基因本體論過度表達分析獲得的結果分別示于表22和23中。由于相對較小的基因列表,采用多種計算工具進行的基因集富集分析顯示沒有顯著的功能性富集。因此獲得了列表中給出的所有基因的基因本體信息并對其進行了分類。采用DAVID通路分析軟件以在AVS受試者和對照組之間鑒別出與具有差異性甲基化的CpG位點的基因相關的分子通路。基于未經校正的p-值對具有至少一個差異性甲基化的CpG位點的基因進行了分析。鑒別出34種通路,包括細胞黏附、移植物抗宿主疾病、I型糖尿液病、MAPK信號轉導和擴張型心肌病中涉及的通路。這些胰島素信號轉導通路具有顯著的一部分具有甲基化變化的基因。對這些基因的生物過程和代謝功能的確定示于表24。根據基因的基因本體論-特征性功能對其進行進一步分組。鑒別出了四個具有細胞分化功能的基因(ANAPC2、BMP8B、FOXK1和SEMA4B),知道了七個具有蛋白結合功能的基因(FASN、FOXK1、MUS81、PKHD1、PLXNA2、PPIE和TNIK)以及知道了為內在膜蛋白的12個基因(ANO10、ATP9B、C6orf10、FAM26F、GRAMD1B、KHDC1、MMEL1、OMA1、PKHD1、SDK1、SEMA4B和TMC3)。與表明甲基化狀態的FDRp-值組合,ROC曲線下的區域可以用于將AVS受試者從正常對照組中區分出來。一共57個CpG位點具有≥0.75的ROCAUC,另外333個CpG位點具有≥0.70但<0.75的ROCAUC。在各個基因座處,針對AVS受試者和對照組之間的甲基化差異的FDRp-值為高度顯著差異的。在我們的研究中,通路過表達分析中出現的參與胰島素信號轉導的基因和多個胰島素受體基因在AVS形成中發揮了重要作用。鼠科動物模型中的研究表明糖尿液病小鼠的胎兒的心臟的心臟基因表達的顯著變化。發現在心臟發育中參與包括細胞凋亡、增殖、遷移和分化在內的分子信號轉導通路的基因被差異性表達。我們的研究中鑒別出的與AVS有關的34種通路中,胰島素信號轉導為最顯著的過表達通路,其中基因NR2F2、IRS1和IRS4顯示出甲基化變化。NR2F2和IRS1均位于染色體15q26.2-q26.3區域。而且,這兩個基因位于2.64-Mb區域,其中NR2F2的3'端和IGF1R的5'區域被2.3-Mb分開。因此,這些基因代表顯示出與糖尿液病以及本研究中與AVS相關的染色體15q26.2上的基因簇的兩個成員。參與胰島素信號轉導通路顯示出改變的甲基化的另外兩個基因為染色體2q36.3上的胰島素受體底物1(IRS1,OMIM147545)和染色體Xq22.3上的胰島素受體底物4(IRS4,OMIM300904)。在多個胰島素-響應性細胞和組織中發現的IRS1參與調控心臟中的腎素-血管緊張素系統,其對于保護心肌細胞免受缺血性損傷來說非常重要并與胰島素耐藥和糖尿液病的形成有關。通過基因本體論分析鑒別出的其它重要的差異性甲基化的基因為VI型膠原α-1(COL6A1,MIM120220)亞單元和VI型膠原α-2(COL6A2,MIM120240)亞單元。COL6A1/COL6A2基因簇被比對至染色體21q22.3區域并編碼廣泛表達的細胞外基質蛋白。多個報道表明COL6A1/COL6A2基因參與綜合征性和非綜合征性先天性心臟缺陷。眾所周知,細胞外基質在薄膜胚胎發育中發揮了發揮了至關重要的作用。膠原纖維是包含瓣膜的心臟中細胞外基質內的主要細胞外結構。已經報道了包括類型VI在內的幾種不同的膠原類型分隔在了胚胎心臟瓣膜的不同隔間且在閥瓣葉和支撐結構中具有不同的功能。已經證明在未成熟的細胞外基質中膠原基因是高度表達的且當心臟瓣膜重建時表達的水平后來在胚胎形成中下降。因此,膠原基因的異常轉錄可能導致先天性瓣膜畸形。編碼plexin蛋白的PLXNA2(OMIM601054)也被差異性甲基化。這種蛋白在胚胎發育過程中在心臟神經嵴遷移中發揮作用。神經嵴細胞自身在心臟發育中發揮關鍵作用。在我們的研究中還發現染色體18q23區域上的ATP9B(OMIM614446)基因被差異性甲基化。我們已經證明了AVS中不同基因中的多個CpG位點中的顯著甲基化差異。利用這些單個CpG位點的甲基化水平來計算ROC曲線下的面積,作為假定診斷測量的準確性的衡量,其中57個CpG位點具有≥0.75的ROCAUC以及333個CpG位點具有≥0.7的ROCAUC。這就提高了可以使用大量不同的標記物組合以有效檢測AVS的可能性。表1:甲基化標記物以及從正常組檢測單獨的VSD:GMAX分析表2:甲基化標記物以及從正常組檢測ASD:GMAX分析表3:甲基化標記物以及從正常組檢測肺動脈瓣狹窄:GMAX分析表4:甲基化標記物以及從正常組檢測主動脈縮窄:GMAX分析表5:用于從正常組檢測法洛四聯癥的甲基化標記物:GMAX分析表6:用于從正常組檢測左心發育不良心臟綜合征的甲基化標記物:GMAX分析基因座基因ID基因符號染色體#位置鏈FDR邊際貢獻(%)cg00256081NM_000512GALNS1688901299F2-02E-3633.00cg02091607NM_000294PHKG21630760815F2-02E-3625.00cg00238468NM_000122ERCC32128049602F2-02E-3625.00cg01510380NM_000744CHRNA42061981518R2-02E-3616.67表7:甲基化標記物以及從正常組檢測全部CHD*:GMax分析*CHD-ASD、VSD、主動脈縮窄、肺動脈瓣狹窄、左心發育不良心臟綜合征和法洛四聯癥表8:用于從VSD(VSD作為參照組)檢測法洛四聯癥的甲基化標記物:G-Max分析表9:組合的甲基化標記物以及人口學特征-從正常組預測TOF:G-max分析基因座基因ID基因符號染色體#位置鏈邊際貢獻嬰兒年齡--57.48cg01655658NR_027822HLA-L630227583F17.38cg00095677NM_174954ATP2A3173833739R8.02cg03052502NR_001553FAM197Y2Y9193029F6.68男性--4.01cg00045070NM_174936PCSK9155504649R2.67NB(9例TOF案例中8例為男性)幼兒年齡-出生和血樣采集之間的小時數表10:用于從正常組檢測VSD的組合的甲基化標記物:GMAX分析靈敏度(%)特異性(%)AUCP-值100.093.750.9844<0.000001組合的甲基化標記物(對于各個標記物,參見表1)表11:用于從正常組檢測ASD的組合的甲基化標記物:GMAX分析靈敏度特異性AUCP-值100.096.880.9952<0.000001表12:組合的甲基化標記物以及從正常組檢測肺動脈瓣狹窄:GMAX分析靈敏度(%)特異性(%)AUCP-值91.6796.880.974<0.000001對于各個甲基化標記物,參見表3。表13:組合的甲基化標記物以及從正常組檢測主動脈縮窄:GMAX分析靈敏度(%)特異性(%)AUCP-值100.093.750.974<0.000001對于各個甲基化標記物,參見表4。表14.用于從正常組檢測法洛四聯癥的組合的甲基化標記物:GMAX靈敏度特異性AUCP-值70.093.750.9190.00014*對于各個甲基化標記物,參見表5。表15:甲基化標記物以及相對于正常組檢測左心發育不良心臟綜合征:GMAX分析靈敏度特異性AUCP-值100.093.750.98440.000001*組合的甲基化標記物(對于各個甲基化標記物,參見表6)表16:甲基化標記物以及從對照組檢測全部CHD**:GMAX分析靈敏度特異性AUCP-值82.8178.130.8535<0.000001*組合的甲基化標記物(對于各個甲基化標記物,參見表7)**CHD:ASD、VSD、主動脈縮窄、肺動脈瓣狹窄、左心發育不良心臟綜合征和法洛四聯癥表17:甲基化標記物以及從VSD案例檢測法洛四聯癥:G-Max分析靈敏度特異性AUCP-值100.0100.01.00.000023*對于采用的甲基化基因座,參見表8。表18:用于從正常組檢測法洛四聯癥的甲基化標記物:GMAX分析靈敏度特異性AUCP-值88.89100.000.9821<0.000001表19a:用于從正常組檢測全部CHD*的甲基化和人口學*標記物:邏輯回歸分析全部CHD:ASD、VSD、主動脈縮窄、肺動脈瓣狹窄、左心發育不良心臟綜合征和法洛四聯癥。*不顯著的人口學標記物表19b:顯示出差異性甲基化的胞嘧啶基因座:從正常組檢測全部CHD*表20:該分析中采用的AVS受試者群組和對照組的詳情表21A:顯著甲基化區域的染色體和基因位置(AVS)表21B:對于各個甲基化的基因(AVS)具有靶ID、基因ID、染色體位置和FDRp-值的差異性甲基化的基因表22:基于DAVID通路和基因本體分析的過度表達的標準通路(AVS)表23:基于DAVID通路和基因本體分析的過度表達的基因本體分子功能類別(AVS)表24:針對采用DAVID通路和基因本體分析確定的過度表達通路的生物過程和代謝功能類別(AVS)表25:具有表明甲基化狀態的顯著FDRp-值且ROCAUC>0.75似乎很有可能作為用于AVS的診斷標記物的CpG位點當前第1頁1 2 3