專利名稱::冠狀動脈疾病風險的測定的制作方法
技術領域:
:本發明涉及基于標志物表達測量測定冠狀動脈疾病(CAD)風險程度的預測模型,涉及它們的使用方法,并且涉及用于其實現的計算機系統和軟件。_4]相關技術的i兌明CAD和心肌梗死(MI)引起的死亡率和發病率是全球主要的健康負擔。目前CAD可能性的主要決定因素是性別、年齡和胸痛類型U。其它風險因素例如糖尿病、吸煙、血脂異常和家族史與未來的心臟血管事件風險有關3。此外,動脈粥樣硬化具有全身性的炎癥成分包括免疫細胞活化和遷移到血管壁內4’5。實際上,由于這些細胞源于循環血并與循環血相互作用,因此循環血細胞基因表達的定量測量反映CAD的程度6’7。這些觀察很可能反映細胞類型分布的變化(這對于心臟血管事件具有預后價值8)和特定細胞類型或譜系內的基因表達變化。用于檢測CAD的“金標準”是侵入性冠狀動脈造影;但是,這種檢測費用大,而且可能給患者帶來風險。血管造影之前,可使用例如心肌灌注顯像(MPI)和CT血管造影的非侵入性診斷模式,然而這些模式具有并發癥,包括射線暴露、造影劑敏感性,且對于阻塞性CAD的鑒別只適度地增加9’1(1。未滿足的臨床和科學需要能可靠地鑒別具有CAD的患者的非侵入性的血液測試將具有顯著的臨床實用性。像這樣,對抗動脈粥樣硬化的大的進步是開發可有助于診斷和評估患者的CAD程度的非侵入性診斷測試。此處描述為此目的使用標志物表達和臨床因素(例如,年齡和性別)的算法的開發和驗證。發明概述本發明披露一種計算機實施的用于對來自受試者的第一樣品評分的方法,包括獲得與所述第一樣品有關的第一數據集,其中所述第一數據集包括選自項目I、項目2、項目3、項目4、項目5、項目6和項目7的標志物組中的至少一個標志物組的定量表達數據;其中項目I包括標志物I、標志物2和標志物3,其中標志物I包括AF161365,其中標志物2包括HNRPF或ACBD5,和其中標志物3包括TFCP2或DDX18;其中項目2包括標志物4、標志物5和標志物6,其中標志物4包括AF289562或⑶248,其中標志物5包括HNRPF或ACBD5,和其中標志物6包括TFCP2或DDX18;其中項目3包括標志物7、標志物8、標志物9和標志物10,其中標志物I包括⑶79B或⑶19,其中標志物8包括SPIB或BLK,其中標志物9包括⑶3D或LCK,和其中標志物10包括TMC8或CCT2;其中項目4包括標志物11、標志物12、標志物13和標志物14,其中標志物11包括S100A12或MMP9,其中標志物12包括CLEC4E或AL0X5AP,其中標志物13包括S100A8或NAMPT,和其中標志物14包括RPL28或SSRPl;其中項目5包括標志物15、標志物16、標志物17、標志物18和標志物19,其中標志物15包括S100A12或MMP9,其中標志物16包括CLEC4E或AL0X5AP,其中標志物17包括S100A8或NAMPT,其中標志物18包括AQP9或GLTlDl,和其中標志物19包括NCF4或NCF2;其中項目6包括標志物20、標志物21、標志物22、標志物23、標志物24、標志物25和標志物26,其中標志物20包括CASP5或H3F3B,其中標志物21包括IL18RAP或TXN,其中標志物22包括TNFAIP6或PLAUR,其中標志物23包括IL8RB或BCL2A1,其中標志物24包括TNFRSF10C或PTAFR,其中標志物25包括KCNE3或LAMP2,和其中標志物26包括TLR4或TYROBP;以及其中項目7包括標志物27、標志物28、標志物29以及標志物30,其中標志物27包括SLAMF7或CX3CR1,其中標志物28包括KLRC4或⑶8A,其中標志物29包括⑶3D或LCK,和其中標志物30包括TMC8或CCT2;以及通過計算機處理器使用解釋函數從所述第一數據集確定第一評分,其中所述第一評分預測所述受試者的CAD。在一個實施方式中,所述第一數據集包括選自項目I、項目2、項目3、項目4、項目5、項目6和項目7中的標志物組的至少兩個標志物組的定量表達數據。在一個實施方式中,所述第一數據集包括選自項目I、項目2、項目3、項目4、項目5、項目6和項目7中的標志物組的至少三個標志物組的定量表達數據。在一個實施方式中,所述第一數據集包括選自項目I、項目2、項目3、項目4、項目5、項目6和項目7中的標志物組的至少四個標志物組的定量表達數據。在一個實施方式中,所述第一數據集包括選自項目I、項目2、項目3、項目4、項目5、項目6和項目7中的標志物組的至少五個標志物組的定量表達數據。在一個實施方式中,所述第一數據集包括選自項目I、項目2、項目3、項目4、項目5、項目6和項目7中的標志物組的至少六個標志物組的定量表達數據。在一個實施方式中,所述第一數據集包括項目I、項目2、項目3、項目4、項目5、項目6和項目7中的標志物組的定量表達數據。在一個實施方式中,所述解釋函數基于預測模型。在一個實施方式中,所述預測模型選自偏最小二乘法模型、邏輯回歸模型、線性回歸模型、線性判別分析模型、嶺回歸模型和基于樹的遞歸分割模型。在一個實施方式中,所述預測模型性能的特征是曲線下面積(AUC)為0.68-0.70。在一個實施方式中,所述預測模型性能的特征是AUC為0.70-0.79。在一個實施方式中,所述預測模型性能的特征是AUC為0.80-0.89。在一個實施方式中,所述預測模型性能的特征是AUC為0.90-0.99。在一個實施方式中,所述第一數據集進一步包括臨床因素。在一個實施方式中,所述臨床因素選自年齡、性別、胸痛類型、嗜中性粒細胞計數、種族、疾病持續時間、舒張血壓、收縮血壓、家族史參數、醫療史參數、醫學癥狀參數、身高、體重、人體質量指數、靜息心率以及吸煙者/非吸煙者狀態。在一個實施方式中,所述獲得與所述第一樣品有關的第一數據集包括獲得所述第一樣品以及處理所述第一樣品以實驗測定所述第一數據集。在一個實施方式中,獲得與所述第一樣品有關的第一數據集包括從已處理所述第一樣品以實驗測定所述第一數據集的第三方接收所述第一數據集。在一個實施方式中,所述方法包括根據所述第一評分對所述第一樣品進行分類。在一個實施方式中,所述分類預測所述受試者中CAD的存在或缺乏。在一個實施方式中,所述分類預測所述受試者中CAD的程度。在一個實施方式中,所述分類預測所述受試者中CAD的風險。在一個實施方式中,所述方法包括基于所述第一評分對CAD風險評級。在一個實施方式中,所述第一樣品包括外周血細胞。在一個實施方式中,所述外周血細胞包括白細胞。在一個實施方式中,所述第一樣品包括提取自外周血細胞的RNA。在一個實施方式中,所述定量表達數據源于雜交數據。在一個實施方式中,所述定量表達數據源于聚合酶鏈反應數據。在一個實施方式中,所述定量表達數據源于抗體結合分析。在一個實施方式中,所述第一數據集獲得和存儲在存儲器上。在一個實施方式中,所述受試者是人。在一個實施方式中,所述受試者具有穩定的胸痛。在一個實施方式中,所述受試者具有典型心絞痛或非典型心絞痛或心絞痛等同癥狀。在一個實施方式中,所述受試者之前沒有心肌梗死(MI)的診斷。在一個實施方式中,所述受試者未接受過血管重建過程。在一個實施方式中,所述受試者未患糖尿病。在一個實施方式中,所述受試者不具有炎性狀況或傳染性狀況。在一個實施方式中,所述受試者當前未服用類固醇、免疫抑制劑或化學治療劑。本發明還描述一種計算機實施的用于對從受試者獲得的第一樣品評分的方法,包括獲得與所述第一樣品相關的第一數據集,其中所述第一數據集包括選自AF161365、HNRPF,ACBD5、TFCP2、DDX18、AF289562、CD248、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、AL0X5AP、S100A8、NAMPT、RPL28、SSRP1、AQP9、GLTlDl、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR,IL8RB、BCL2A1、TNFRSF10C、PTAFR、KCNE3、LAMP2、TLR4、TYROBP,SLAMF7、CX3CR1、KLRC4和CD8A中的至少兩個標志物的定量表達數據;以及通過計算機處理器使用解釋函數從所述第一數據集確定第一評分,其中所述第一評分預測所述受試者的CAD。在一個實施方式中,所述第一數據集包括臨床因素。在一個實施方式中,所述臨床因素是年齡和/或性別。在一個實施方式中,所述臨床因素選自年齡、性別、胸痛類型、嗜中性粒細胞計數、種族、疾病持續時間、舒張血壓、收縮血壓、家族史參數、醫療史參數、醫學癥狀參數、身高、體重、人體質量指數、靜息心率以及吸煙者/非吸煙者狀態。在一個實施方式中,所述第一數據集包括至少三個標志物的定量表達數據。在一個實施方式中,所述第一數據集包括至少四個標志物的定量表達數據。在一個實施方式中,所述第一數據集包括至少五個標志物的定量表達數據。在一個實施方式中,所述第一數據集包括至少六個標志物的定量表達數據。在一個實施方式中,所述解釋函數基于預測模型。在一個實施方式中,所述預測模型選自偏最小二乘法模型、邏輯回歸模型、線性回歸模型、線性判別分析模型、嶺回歸模型和基于樹的遞歸分割模型中。在一個實施方式中,所述預測模型性能的特征是曲線下面積(AUC)為0.68-0.70。在一個實施方式中,所述預測模型性能的特征是AUC為0.70-0.79。在一個實施方式中,所述預測模型性能的特征是AUC為0.80-0.89。在一個實施方式中,所述預測模型性能的特征是AUC為0.90-0.99。在一個實施方式中,所述獲得與所述第一樣品有關的第一數據集包括獲得所述第一樣品以及處理所述第一樣品以實驗測定所述第一數據集。在一個實施方式中,所述獲得與所述第一樣品有關的第一數據集包括從已處理所述第一樣品以實驗測定所述第一數據集的第三方接收所述第一數據集。在一個實施方式中,所述方法包括根據所述第一評分對所述第一樣品進行分類。在一個實施方式中,所述分類是預測所述受試者中CAD的存在或缺乏。在一個實施方式中,所述分類是預測所述受試者中CAD的程度。在一個實施方式中,所述分類是預測所述受試者中CAD的風險。在一個實施方式中,所述方法包括基于所述第一評分對CAD風險評級。在一個實施方式中,所述第一樣品包括外周血細胞。在一個實施方式中,所述外周血細胞包括白細胞。在一個實施方式中,所述第一樣品包括提取自外周血細胞的RNA。在一個實施方式中,所述定量表達數據源于雜交數據。在一個實施方式中,所述定量表達數據源于聚合酶鏈反應數據。在一個實施方式中,所述定量表達數據源于抗體結合分析。在一個實施方式中,所述第一數據集獲得并存儲在存儲器上。在一個實施方式中,所述受試者是人。在一個實施方式中,所述受試者具有穩定的胸痛。在一個實施方式中,所述受試者具有典型心絞痛或非典型心絞痛或心絞痛等同癥狀。在一個實施方式中,所述受試者之前沒有心肌梗死(MI)的診斷。在一個實施方式中,所述受試者未接受過血管重建過程。在一個實施方式中,所述受試者未患糖尿病。在一個實施方式中,所述受試者不具有炎性狀況或傳染性狀況。在一個實施方式中,所述受試者當前未服用類固醇、免疫抑制劑或化學治療劑。本發明還描述一種用于預測受試者的CAD的系統,所述系統包括存儲器,其用于存儲與從所述受試者獲得的樣品相關的數據集,其中所述第一數據集包括選自項目I、項目2、項目3、項目4、項目5、項目6和項目7的標志物組中的至少一個標志物組的定量表達數據;其中項目I包括標志物I、標志物2和標志物3,其中標志物I包括AF161365,其中標志物2包括HNRPF或ACBD5,和其中標志物3包括TFCP2或DDX18;其中項目2包括標志物4、標志物5和標志物6,其中標志物4包括AF289562或⑶248,其中標志物5包括HNRPF或ACBD5,和其中標志物6包括TFCP2或DDX18;其中項目3包括標志物7、標志物8、標志物9和標志物10,其中標志物7包括⑶79B或⑶19,其中標志物8包括SPIB或BLK,其中標志物9包括⑶3D或LCK,和其中標志物10包括TMC8或CCT2;其中項目4包括標志物11、標志物12、標志物13和標志物14,其中標志物11包括510(^12或麗9,其中標志物12包括0^(4£或AL0X5AP,其中標志物13包括S100A8或NAMPT,和其中標志物14包括RPL28或SSRPl;其中項目5包括標志物15、標志物16、標志物17、標志物18和標志物19,其中標志物15包括S100A12或MMP9,其中標志物16包括CLEC4E或AL0X5AP,其中標志物17包括S100A8或NAMPT,其中標志物18包括AQP9或GLT1D1,和其中標志物19包括NCF4或NCF2;其中項目6包括標志物20、標志物21、標志物22、標志物23、標志物24、標志物25和標志物26,其中標志物20包括CASP5或H3F3B,其中標志物21包括IL18RAP或TXN,其中標志物22包括TNFAIP6或PLAUR,其中標志物23包括IL8RB或BCL2A1,其中標志物24包括TNFRSF10C或PTAFR,其中標志物25包括KCNE3或LAMP2,和其中標志物26包括TLR4或TYROBP;以及其中項目7包括標志物27、標志物28、標志物29和標志物30,其中標志物27包括SLAMF7或CX3CR1,其中標志物28包括KLRC4或⑶8A,其中標志物29包括⑶3D或LCK,和其中標志物30包括TMC8或CCT2;以及與所述存儲器通訊偶聯的處理器,其使用解釋函數確定評分,其中所述評分預測受試者的CAD。本發明還描述一種存儲計算機可執行程序代碼的計算機可讀存儲介質,所述程序代碼包括用于存儲與從所述受試者獲得的樣品相關的數據集的程序代碼,其中所述第一數據集包括選自項目I、項目2、項目3、項目4、項目5、項目6和項目7的標志物組中的至少一個標志物組的定量表達數據;其中項目I包括標志物I、標志物2和標志物3,其中標志物I包括AF161365,其中標志物2包括HNRPF或ACBD5,和其中標志物3包括TFCP2或DDX18;其中項目2包括標志物4、標志物5和標志物6,其中標志物4包括AF289562或⑶248,其中標志物5包括HNRPF或ACBD5,和其中標志物6包括TFCP2或DDX18;其中項目3包括標志物7、標志物8、標志物9和標志物10,其中標志物7包括⑶79B或⑶19,其中標志物8包括SPIB或BLK,其中標志物9包括⑶3D或LCK,和其中標志物10包括TMC8或CCT2;其中項目4包括標志物11、標志物12、標志物13和標志物14,其中標志物11包括S100A12或MMP9,其中標志物12包括CLEC4E或ALOX5AP,其中標志物13包括S100A8或NAMPT,和其中標志物14包括RPL28或SSRPl;其中項目5包括標志物15、標志物16、標志物17、標志物18和標志物19,其中標志物15包括S100A12或MMP9,其中標志物16包括CLEC4E或ALOX5AP,其中標志物17包括S100A8或NAMPT,其中標志物18包括AQP9或GLT1D1,和其中標志物19包括NCF4或NCF2;其中項目6包括標志物20、標志物21、標志物22、標志物23、標志物24、標志物25和標志物26,其中標志物20包括CASP5或H3F3B,其中標志物21包括IL18RAP或TXN,其中標志物22包括TNFAIP6或PLAUR,其中標志物23包括IL8RB或BCL2A1,其中標志物24包括TNFRSF10C或PTAFR,其中標志物25包括KCNE3或LAMP2,和其中標志物26包括TLR4或TYROBP;以及其中項目7包括標志物27、標志物28、標志物29和標志物30,其中標志物27包括SLAMF7或CX3CR1,其中標志物28包括KLRC4或⑶8A,其中標志物29包括⑶3D或LCK,和其中標志物30包括TMC8或CCT2;以及使用解釋函數確定評分的程序代碼,其中所述評分預測受試者的CAD。本發明還描述一種用于預測受試者的CAD的方法,包括從受試者獲得樣品,其中所述樣品包括多個分析物;將所述樣品與試劑接觸;產生所述試劑和所述多個分析物的多個復合物;檢測該多個復合物以獲得與所述樣品相關的數據集,其中所述第一數據集包括選自項I、項目2、項目3、項目4、項目5、項目6和項目7的標志物組中的至少一個標志物組的定量表達數據;其中項I包括標志物I、標志物2和標志物3,其中標志物I包括AF161365,其中標志物2包括HNRPF或ACBD5,和其中標志物3包括TFCP2或DDX18;其中項目2包括標志物4、標志物5和標志物6,其中標志物4包括AF289562或CD248,其中標志物5包括HNRPF或ACBD5,和其中標志物6包括TFCP2或DDX18;其中項目3包括標志物7、標志物8、標志物9和標志物10,其中標志物7包括⑶79B或⑶19,其中標志物8包括SPIB或BLK,其中標志物9包括⑶3D或LCK,和其中標志物10包括TMC8或CCT2;其中項目4包括標志物11、標志物12、標志物13和標志物14,其中標志物11包括S100A12或MMP9,其中標志物12包括CLEC4E或AL0X5AP,其中標志物13包括S100A8或NAMPT,和其中標志物14包括RPL28或SSRPl;其中項目5包括標志物15、標志物16、標志物17、標志物18和標志物19,其中標志物15包括S100A12或MMP9,其中標志物16包括CLEC4E或AL0X5AP,其中標志物17包括S100A8或NAMPT,其中標志物18包括AQP9或GLT1D1,和其中標志物19包括NCF4或NCF2;其中項6包括標志物20、標志物21、標志物22、標志物23、標志物24、標志物25和標志物26,其中標志物20包括CASP5或H3F3B,其中標志物21包括IL18RAP或TXN,其中標志物22包括TNFAIP6或PLAUR,其中標志物23包括IL8RB或BCL2A1,其中標志物24包括TNFRSF10C或PTAFR,其中標志物25包括KCNE3或LAMP2,和其中標志物26包括TLR4或TYROBP;以及其中項目7包括標志物27、標志物28、標志物29和標志物30,其中標志物27包括SLAMF7或CX3CR1,其中標志物28包括KLRC4或⑶8A,其中標志物29包括⑶3D或LCK,和其中標志物30包括TMC8或CCT2;以及使用解釋函數確定從所述數據集確定評分,其中所述評分預測受試者的CAD。本發明還描述一種用于預測受試者的CAD的試劑盒,包括一組試劑,其包括用于從受試者獲得的樣品測定選自項目I、項目2、項目3、項目4、項目5、項目6和項目7的標志物組中的至少一個標志物組的定量表達數據多個試劑;其中項目I包括標志物I、標志物2和標志物3,其中標志物I包括AF161365,其中標志物2包括HNRPF或ACBD5,和其中標志物3包括TFCP2或DDX18;其中項目2包括標志物4、標志物5和標志物6,其中標志物4包括AF289562或⑶248,其中標志物5包括HNRPF或ACBD5,和其中標志物6包括TFCP2或DDX18;其中項目3包括標志物7、標志物8、標志物9和標志物10,其中標志物7包括⑶79B或⑶19,其中標志物8包括SPIB或BLK,其中標志物9包括⑶3D或LCK,和其中標志物10包括TMC8或CCT2;其中項目4包括標志物11、標志物12、標志物13和標志物14,其中標志物11包括S100A12或MMP9,其中標志物12包括CLEC4E或AL0X5AP,其中標志物13包括S100A8或NAMPT,和其中標志物14包括RPL28或SSRPl;其中項目5包括標志物15、標志物16、標志物17、標志物18和標志物19,其中標志物15包括S100A12或MMP9,其中標志物16包括CLEC4E或AL0X5AP,其中標志物17包括S100A8或NAMPT,其中標志物18包括AQP9或GLTlDl,和其中標志物19包括NCF4或NCF2;其中項目6包括標志物20、標志物21、標志物22、標志物23、標志物24、標志物25和標志物26,其中標志物20包括CASP5或H3F3B,其中標志物21包括IL18RAP或TXN,其中標志物22包括TNFAIP6或PLAUR,其中標志物23包括IL8RB或BCL2A1,其中標志物24包括TNFRSF10C或PTAFR,其中標志物25包括KCNE3或LAMP2,和其中標志物26包括TLR4或TYROBP;以及其中項目7包括標志物27、標志物28、標志物29和標志物30,其中標志物27包括SLAMF7或CX3CR1,其中標志物28包括KLRC4或⑶8A,其中標志物29包括⑶3D或LCK,和其中標志物30包括TMC8或CCT2;以及使用所述多個試劑測定所述樣品的定量數據的說明書,其中所述說明書包括從所述數據集確定評分的說明,其中所述評分預測受試者的CAD。在一個實施方式中,所述說明書包括用于進行微陣列分析的說明書。在一個實施方式中,所述說明書包括用于進行聚合酶鏈反應分析的說明書。本發明還描述一種用于預測受試者的CAD的系統,所述系統包括存儲器,其用于存儲與從所述受試者獲得的樣品有關的數據集,其中所述數據集包括選自AF161365、HNRPF,ACBD5、TFCP2、DDX18、AF289562、CD248、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、AL0X5AP、S100A8、NAMPT、RPL28、SSRPl、AQP9、GLTlDl、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2A1、TNFRSF10C,PTAFR,KCNE3、LAMP2、TLR4、TYROBP,SLAMF7、CX3CR1、KLRC4和CD8A中的至少兩個標志物的定量表達數據;以及與所述存儲器通訊偶聯的處理器,其使用解釋函數確定評分,其中所述評分預測受試者的CAD。本發明還描述一種存儲計算機可執行程序代碼的計算機可讀存儲介質,所述程序代碼包括用于存儲與從所述受試者獲得的樣品相關的數據集的程序代碼,其中所述數據集包括選自AF161365、HNRPF,ACBD5、TFCP2、DDX18、AF289562、CD248、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、SIOOA12、MMP9、CLEC4E、AL0X5AP、S100A8、NAMPT、RPL28、SSRPI、AQP9、GLTlDl、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2A1、TNFRSFIOC,PTAFR、KCNE3、LAMP2、TLR4、TYROBP、SLAMF7、CX3CR1、KLRC4和CD8A中的至少兩個標志物的定量表達數據;以及使用解釋函數確定評分的程序代碼,其中所述評分預測受試者的CAD。本發明還描述一種用于預測受試者的CAD的方法,包括從受試者獲得樣品,其中所述樣品包括多個分析物;將所述樣品與試劑接觸;產生所述試劑和所述多個分析物的多個復合物;檢測該多個復合物以獲得與所述樣品相關的數據集,其中所述數據集包括選自AF161365、HNRPF、ACBD5、TFCP2、DDX18、AF289562、CD248、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、AL0X5AP、S100A8、NAMPT、RPL28、SSRPl、AQP9、GLTlDl、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2A1、TNFRSF10C、PTAFR、KCNE3、LAMP2、TLR4、TYROBP,SLAMF7、CX3CR1、KLRC4和CD8A中的至少兩個標志物的定量表達數據;以及使用解釋函數從所述數據集確定評分,其中所述評分預測受試者的CAD。本發明還描述一種用于預測受試者的CAD的試劑盒,包括一組試劑,其包括用于從受試者獲得的樣品測定選自AF161365、HNRPF,ACBD5、TFCP2、DDX18、AF289562、CD248、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、AL0X5AP、S100A8、NAMPT、RPL28、SSRPl、AQP9、GLTlDl、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2A1、TNFRSF10C,PTAFR、KCNE3、LAMP2、TLR4、TYROBP,SLAMF7、CX3CR1、KLRC4和⑶8A中至少兩個標志物的定量表達數據的多個試劑;以及使用所述多個試劑從所述樣品測定定量數據的說明書,其中所述說明書包括所述數據集確定評分的說明,其中所述評分預測受試者的CAD。附圖簡述結合下面的描述以及附圖,本發明的這些和其它特征、方面和優點將變得更好理解,其中圖I-基因發現、算法開發以及驗證患者和邏輯流程示意圖。最初的基因發現(CATHGEN儲庫)包括糖尿病和非糖尿病患者。來自PersonalizedRiskEvaluationandDiagnosisintheCoronaryTree(PREDICT)的基因發現涉及配對的微陣列分析中的非糖尿病患者,其產生與來自CATHGEN陣列的那些共同的655個重要基因。對于RT-PCR,選擇113個基因并在640個PREDICT患者樣品上測試,由其衍生并鎖定最終的算法,然后在PREDICT驗證群組(N=526)中進行驗證。圖2-來自CATHGEN微陣列分析的糖尿病對非糖尿病重要基因的RT-PCR分析。示出了選自非糖尿病(ND)和糖尿病(D)患者中的CATHGEN微陣列群組的單個基因的重要性。對來自各個子集中CAD邏輯回歸分析的性別/年齡調節的P值繪圖(對數標度)。顯著性P值(<0.05)以紅色指示基因符號(左上四分之一和右下四分之一),非顯著性的P值以黑色示出(右上四分之一)。圖3-微陣列的維恩圖、RT-PCR和算法基因源。鑒別了總計7718個基因,2438個和5935個分別來自CATHGEN和PREDICT微陣列分析,具有655個基因的交叉。對于113個RT-PCR基因,52個來自PREDICT,22個來自CATHGEN,29個來自兩者;10個是標準化的基因或者來自早先的研究7。最終的算法包含20個信息基因10個同時來自兩項微陣列研究,8個單獨來自PREDICT,2個單獨來自CATHGEN。圖4-PREDICT算法開發群組中測量的113個PCR基因的PCR基因表達對淋巴細胞部分(y_軸)和嗜中性粒細胞部分(X-軸)的相關性。相關性的范圍最高至0.6,總共42個基因與嗜中性粒細胞部分以>0.2相關,而在相同閾值下39個基因與淋巴細胞計數相關。使用表2中的編號方案識別基因。圖5-算法結構和基因的示意圖。所述算法包括男性和女性的基因表達函數與對于前者的性別特異性線性年齡函數和對于后者的非線性年齡函數的重疊。對于所述基因表達成分,4個項目中的16/23個基因與性別無關項目I-嗜中性粒細胞激活和凋亡;項目3-NK細胞活化對T細胞比率;項目4,B對T細胞比率;以及項目5-對TFCP2和HNRPF標準化的AF289562表達。此外,項目2由3個與性別無關的嗜中性粒細胞/先天免疫基因(S100A8、S100A12、CLEC4E)組成,其對于女性的整體嗜中性粒細胞基因表達(AQP9、NCF4)標準化及對于男性的RPL28(淋巴細胞)標準化。最終的男性特異性項目是TSPAN16的標準化表達。算法評分定義為I.821-755X項目I-.406X項目3_.308X項目2X性別-137X項目4'548X項目2X(I-性別)-246X項目5'481X項目6X性別+.851X性別+.045X性別X年齡+.123X(I-性別)Xmax(0,年齡-55),其中性別表示為0/1的性別指示,0=女性、I=男性,年齡以年表示,并如所述的進行計算(下文的方法部分)。圖6-交叉驗證估計和獨立驗證之間的算法性能的比較。相對于0.50的AUC(點線),示出了所述算法的交叉驗證(虛線)和獨立驗證(實線)的ROC曲線。95%的置信區間由實心區表示。AUC值為對于交叉驗證為0.77(95%Cl,0.73-0.81),對于獨立驗證群組為0.70(95%CI,0.65-0.75,p=1(T16)。圖7-來自用于算法開發和驗證的PREDICT試驗的患者的分配。在總共1569個符合該研究的選擇/排除標準的受試者中,226個用于基因發現。如所示的,剩余的1343個分成用于算法開發(694)和驗證¢49)的獨立群組;在這些群組中94%的患者來自相同的中心。對于算法開發,使用總共640個患者樣品;由于不完全數據(DiamondGA,ForresterJS.Analysisofprobabilityasanaidintheclinicaldiagnosisofcoronary-arterydisease.NEnglJMed.1979;300(24):1350-8.),不充足的血量(StanglV,WitzelV,BaumannG,StanglK.Currentdiagnosticconceptstodetectcoronaryarterydiseaseinwomen.EurHeartJ.2008;29(6):707-17.),實驗和臨床記錄之間的性別失配(GibbonsRJ,AbramsJ,ChatterjeeK,等人ACC/AHA2002guidelineupdateforthemanagementofpatientswithchronicstableangina—summaryarticleareportoftheAmeticanCollegeofCardioIogy/AmericanHeartAssociationTaskForceonpracticeguidelines(CommitteeontheManagementofPatientsWithChronicStableAngina).JAmCollCardiol.2003;41(I):159-68.),或者統計離群值評估(CookNR,RidkerPM.Advancesinmeasuringtheeffectofindividualpredictorsofcardiovascularrisktheroleofreclassificationmeasures.AnnInternMed.2009;150(11):795-802.),54個被排除。對于驗證群組,基于不充足的血量或RNA產量(43)、基因組DNA的嚴重污染(78)或者指定前的統計離群值評估(2),總共123個樣品被排除。圖8-用于診斷的凈效益曲線,隨閾概率pt變化,其表示假陽性和假陰性之間的折中。所述曲線定量在Pt的可能值的范圍上的所述凈效益,按照評分>Pt=陽性的決策規則。參考線反映a)所有陽性受試者(較低曲線)或b)所有陰性受試者(凈效益=O的線)的凈效益。所述基因表達算法的凈效益曲線顯示為頂部曲線,且在臨床相關Pt范圍上比任一參考線更大。圖9-算法和臨床變量的驗證群組性能的ROC分析。算法性能通過Diamond-Forrester增加到臨床因素。示出了ROC分析中D-F評分和算法評分(重實線)的組合與單獨D-F評分(一)的比較。AUC=0.50線(輕實線)示為參考。526個驗證群組患者中共計525個具有可用于計算D-F評分的信息。所述兩個ROC曲線的AUC為0.721±0.023和0.663±0.025,p=0.003。圖10-算法評分對驗證群組中%最大狹窄(MaximumStenosis)的相關性。通過QCA最大%狹窄定量每位患者的疾病程度并分組成5個類別無可測量的疾病、1_24%、25-49%在彡I血管中、I血管彡50%,以及>I血管彡50%。示出了各組的平均算法評分;誤差棒對應于95%的置信區間。發明詳述通常,用于權利要求書和說明書中的術語意于解釋為具有本領域普通技術人員理解的平常的意義。一些術語定義如下以使得更加清楚。在平常的意義和給出的定義之間沖突的情況下,使用給出的定義。術語“急性冠狀動脈綜合征”包括所有形式的不穩定的冠狀動脈疾病。術語“冠狀動脈疾病”或“CAD”包括所有形式的影響冠狀動脈的動脈粥樣硬化疾病。術語“Ct”是指周期閾值并被定義為其中熒光值高于設定閾值的PCR循環數。因此,低Ct值對應高水平的表達,而高Ct值對應低水平的表達。術語“Cp”是指交叉點并被定義為實時PCR儀器(例如,如LightCycler)中標準的擴增曲線對數-線性部分的最佳擬合和所述噪聲頻帶(根據背景熒光測量設定)的交叉。術語“FDR”表示錯誤發現率。FDR可以通過在給定的P值閾值下分析隨機改變序列的數據集和對基因的平均數制表來估計。術語“GL”、“GM”和“⑶”分別指算法開發數據集中該基因的第I百分位數、中位數和第99百分位數的Cp。術語“標志物”或“多個標志物”包括但不限于脂質、脂蛋白、蛋白質、細胞因子、趨化因子、生長因子、肽、核酸、基因和寡核苷酸、以及它們的相關復合物、代謝產物、突變、變異體、多態性、修飾、片段、亞單元、降解產物、元件和其它分析物或樣品產生的測量。標志物還可以包括突變蛋白質、突變核酸、拷貝數的變異和/或轉錄物變異體,在其中這些突變、拷貝數的變異和/或轉錄物變異體用于產生預測模型,或者用在使用相關標志物(例如,所述蛋白或核酸的非突變形式、替代轉錄物等)開發的預測模型的情況下。術語“聞度相關的基因表達”或“聞度相關的標志物表達”指的是基因或標志物表達值,其具有足夠的相關度以允許它們在冠狀動脈疾病的預測模型中互換使用。例如,如果具有表達值X的基因X用于構建預測模型,具有表達值Y的高度相關的基因y可以以對于本領域普通技術人員來說顯而易見以及有益于本申請的直接方式代入所述預測模型中。假定基因X和y的表達值之間為近似線性的關系,由此Y=a+bX,那么X可以被代入具有(Y-a)/b的預測模型中。對于非線性相關性,可以使用相似的數學轉換,有效地將基因y的表達值轉化成基因X的相應的表達值。術語“高度相關的標志物”或“高度相關的替代標志物”指的是可以基于例如上述標準被代入和/或添加到預測模型中的標志物。高度相關的標志物可以以至少兩種方式使用(1)通過高度相關的標志物替換最初標志物并產生用于預測CAD風險的新模型;或者(2)通過高度相關的標志物替換用于預測CAD風險的現有模型中的最初標志物。術語“哺乳動物”包括人類和非人類,且包括但不限于人類、非人類的靈長類、犬科動物、貓科動物、鼠科動物、牛、馬和豬。術語“元基因(metagene)”指的是它們的表達值組合以產生單一值的一組基因,該單一值可以用作預測模型中的成分(Brunet,J.P.,等人Proc.Natl.Acad.Sciences2004;101(12):4164-9)。術語“心肌梗死”指的是缺血性心肌壞死。這通常是流向心肌(心臟的肌肉組織)段的冠狀動脈血流量突然降低的結果。心肌梗死可以分類為ST-段抬高型和非ST-段抬高型MI(也稱作不穩定型心絞痛)。心肌壞死引起任一類別。ST-段抬高型或非ST-段抬高型類別的心肌梗死是不穩定形式的動脈粥樣硬化性心血管疾病。術語“樣品”可以包括來自受試者的單細胞或多細胞或細胞的片段或體液等分試樣,通過包括靜脈穿刺術、排泄、射精、按摩、活組織檢查、針吸取、灌洗樣品、擦拭、外科切口或介入的方法或其它本領域已知的方法。術語“受試者”包括細胞、組織或有機體,人類或非人類,不論體內、活體外或者體夕卜,男性或女性。術語“獲得與樣品有關的數據集”包括獲得一組從至少一個樣品測定的數據。獲得數據集包括獲得樣品,以及處理所述樣品以實驗測定所述數據。所述詞語還包括接收一組數據,例如從已處理所述樣品以實驗測定所述數據集的第三方。此外,所述詞語包括來自至少一個數據集或至少一個出版物或數據集和出版物的結合的挖掘數據。數據集可以由本領域的技術人員通過多種包括存儲在存儲器上的已知方法獲得。術語“臨床因素”指的是受試者的狀況的測量,例如疾病活躍度或嚴重度。“臨床因素”包括受試者健康狀況的所有標志物,包括受試者的非樣品標志物和/或其它特征,例如但不限于年齡和性別。臨床因素可以是從來自受試者或測定條件下的受試者的樣品(或樣品群)的評估獲得的評分、數值或數值組。臨床因素還可以通過標志物和/或其它參數(例如基因表達替代)預測。必須注意的是,本說明書和所附的權利要求中使用的,單數形式“一個”、“一種”或“該”包括復數指代,除非上下文清楚地指出其它情況。方法標志物和臨床因素本發明的一個或多個標志物的量可以表示為值。值可以是在一定條件下評估樣品獲得的一個或多個數值。所述值可以例如通過在實驗室中進行的測定從樣品實驗地獲得測量結果,或者可選擇地從例如實驗室的服務提供者,或者從數據庫或數據集存儲于其上(例如,在存儲器上)的服務器獲得。在一個實施方式中,一個或多個標志物的量可以是一個或多個與下述的表達水平有關的數值AF161365、HNRPF,ACBD5、TFCP2、DDX18、AF289562、CD248、HNRPF,ACBD5、TFCP2、DDX18、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、AL0X5AP、S100A8、NAMPT、RPL28、SSRPl、SIOOAl2、MMP9、CLEC4E、ALOX5AP、S100A8、NAMPT、AQP9、GLTlDl、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2A1、TNFRSF10C,PTAFR、KCNE3、LAMP2、TLR4、TYROBP,SLAMF7、CX3CR1、KLRC4、CD8A、CD3D、LCK、TMC8或CCT2;從一定條件下樣品的評估獲得。根據HumanGenomeOrganisation(HUGO)GeneNomenclatureCommittee(HGNC)提供的指南,該命名法用于指人類基因。進一步的關于各人類基因的信息(例如登錄號和別名)可以通過在HGNCSearchgenenames.org網站上的檢索頁面中輸入所述基因的名字來查找。例如,在2010年6月I日將術語“⑶3D”輸入到HGNC網站的簡單檢索域中得到⑶3D的核準的基因名(⑶3d分子,5(⑶3-TCR復合物)),CD3D的序列登錄號ID(X01451;NM_000732),以及CD3D的以前的代號(T3D)。進一步的人類基因名稱提供在下面的實施例部分中。在一個實施方式中,一定條件可以包括一個臨床因素或多個臨床因素。在一個實施方式中,臨床因素可以包括在數據集中。數據集可以包括一個或更多、兩個或更多、三個或更多、四個或更多、五個或更多、六個或更多、七個或更多、八個或更多、九個或更多、十個或更多、i^一個或更多、十二個或更多、十三個或更多、十四個或更多、十五個或更多、十六個或更多、十七個或更多、十八個或更多、十九個或更多、二十個或更多、二i^一個或更多、二十二個或更多、二十三個或更多、二十四個或更多、二十五個或更多、二十六個或更多、二十七個或更多、二十八個或更多、二十九個或更多或者三十個或更多重疊的或不同的臨床因素。臨床因素可以是例如受試者處于疾病存在或不存在情況下的狀況。可選擇地,或者另外地,臨床因素可以是受試者的健康狀態。可選擇地,或者另外地,臨床因素可以是年齡、性別、胸痛類型、嗜中性粒細胞計數、種族、疾病持續時間、舒張血壓、收縮血壓、家族史參數、醫療史參數、醫學癥狀參數、身高、體重、人體質量指數、靜息心率以及吸煙者/非吸煙者狀態。臨床因素可以包括是否所述受試者有穩定的胸痛,是否所述受試者有典型的心絞痛,是否所述受試者有非典型的心絞痛,是否所述受試者有心絞痛等同癥狀,是否所述受試者之前被診斷有MI,是否所述受試者已經接受過血管重建過程,是否所述受試者患有糖尿病,是否所述受試者具有炎癥狀況,是否所述受試者具有傳染性狀況,是否所述受試者正在服用類固醇,是否所述受試者正在服用免疫抑制劑和/或是否所述受試者正在服用化學治療劑。其它的臨床因素的實例列于表和附圖中。在一個實施方式中,標志物的相關值可以包括在與從受試者獲得的樣品有關的數據集中。數據集可以包括兩個或更多、三個或更多、四個或更多、五個或更多、六個或更多、七個或更多、八個或更多、九個或更多、十個或更多、i^一個或更多、十二個或更多、十三個或更多、十四個或更多、十五個或更多、十六個或更多、十七個或更多、十八個或更多、十九個或更多、二十個或更多、二i^一個或更多、二十二個或更多、二十三個或更多、二十四個或更多、二十五個或更多、二十六個或更多、二十七個或更多、二十八個或更多、二十九個或更多或者三十個或更多標志物的標志物表達值。例如,數據集可以包括AF161365、HNRPF,ACBD5;AF161365、HNRPF;或者AF161365、ACBD5的表達值。其它組合更加詳細地描述在下面的實施例部分中。在一個實施方式中,一個或更多標志物可以分成項目。項目可以包括一個標志物,但是通常包括三個或更多標志物。項目可以包括在與從受試者獲得的樣品有關的數據集中。所述數據集可以包括一個或更多項目、兩個或更多項目、三個或更多項目、四個或更多項目、五個或更多項目、六個或更多項目、七個或更多項目、八個或更多項目、九個或更多項目、或者十個或更多項目。在一個實施方式中,項目可以包括一個或更多、兩個或更多、三個或更多、四個或更多、五個或更多、六個或更多、七個或更多、八個或更多、九個或更多、十個或更多、i^一個或更多、十二個或更多、十三個或更多、十四個或更多、十五個或更多、十六個或更多、十七個或更多、十八個或更多、十九個或更多、二十個或更多、二i^一個或更多、二十二個或更多、二十三個或更多、二十四個或更多、二十五個或更多、二十六個或更多、二十七個或更多、二十八個或更多、二十九個或更多或者三十個或更多標志物。在一個實施方式中,所述標志物分成7個不同的項目項目I、項目2、項目3、項目4、項目5、項目6和項目7。在一個實施方式中,項目I可以包括標志物I、標志物2和標志物3,其中標志物I包括AF161365,其中標志物2包括HNRPF或ACBD5,和其中標志物3包括TFCP2或DDX18。在一個實施方式中,項目2可以包括標志物4、標志物5和標志物6,其中標志物4包括AF289562或⑶248,其中標志物5包括HNRPF或ACBD5,和其中標志物6包括TFCP2或DDX18。在一個實施方式中,項目3可以包括標志物7、標志物8、標志物9和標志物10,其中標志物7包括⑶79B或⑶19,其中標志物8包括SPIB或BLK,其中標志物9包括⑶3D或LCK,和其中標志物10包括TMC8或CCT2。在一個實施方式中,項目4可以包括標志物11、標志物12、標志物13和標志物14,其中標志物11包括S100A12或MMP9,其中標志物12包括CLEC4E或ALOX5AP,其中標志物13包括S100A8或NAMPT,和其中標志物14包括RPL28或SSRPl。在一個實施方式中,項目5可以包括標志物15、標志物16、標志物17、標志物18和標志物19,其中標志物15包括S100A12或MMP9,其中標志物16包括CLEC4E或ALOX5AP,其中標志物17包括S100A8或NAMPT,其中標志物18包括AQP9或GLT1D1,和其中標志物19包括NCF4或NCF2。在一個實施方式中,項目6可以包括標志物20、標志物21、標志物22、標志物23、標志物24、標志物25和標志物26,其中標志物20包括CASP5或H3F3B,其中標志物21包括IL18RAP或TXN,其中標志物22包括TNFAIP6或PLAUR,其中標志物23包括IL8RB或BCL2A1,其中標志物24包括TNFRSF10C或PTAFR,其中標志物25包括KCNE3或LAMP2,和其中標志物26包括TLR4或TYROBP。在一個實施方式中,項目7可以包括標志物27、標志物28、標志物29和標志物30,其中標志物27包括SLAMF7或CX3CR1,其中標志物28包括KLRC4或⑶8A,其中標志物29包括⑶3D或LCK,和其中標志物30包括TMC8或CCT2。在另一實施方式中,本發明包括獲得與受試者有關的樣品,其中所述樣品包括一個或多個標志物。所述樣品可以由所述受試者或由第三方(例如,醫學專業人員)獲得。醫學專業人員的實例包括內科醫師、急救醫學技術人員、護士、第一急救者、心理學家、醫學物理學人員、開業護士、外科醫生、牙科醫生以及本領域技術人員已知的任何其他明顯的醫學專業人員。樣品可以包括外周血細胞、分離的白細胞或者從外周血細胞或分離白細胞提取的RNA。所述樣品可以從任何體液獲得,例如,羊水、眼房水、膽汁、淋巴、乳汁、細胞間液、血液、血漿、耵聹(耳垢)Xowper液體(射精前液體)、乳糜、食糜、女性射出液、月經、粘液、唾液、尿、嘔吐物、眼淚、引道潤滑液、汗液、血清、精液、皮脂、膿汁、胸膜液、腦脊液、滑液、細胞內液和玻璃狀液。在一個實例中,所述樣品從抽取的血液獲得,其中所述醫學專業人員從受試者抽取血液,例如通過注射器。然后可以檢測所述體液以使用分析測定一個或多個標志物的值。然后所述一個或多個標志物的值可以由相同的一方使用本發明的方法進行評估,或者發送給第三方使用本發明的方法進行評估。解釋函數在一個實施方式中,解釋函數可以是預測模型產生的功能。解釋函數還可以由多個預測模型產生。在一個實施方式中,解釋函數可以包括項目NormpNorm2、NKup>Tcell>Bcell,Neut,Nup,Ndown,SCA1,AF2,TSPAN、SEX和INTERCEPT。在相關的實施方式中,Norm1=RPL28、Norm2=(5XHNRPF+.5XTFCP2)、NKup=(5XSLAMF7+.5XKLRC4)、Tcell=(5XCD3D+.5XTMC8)、Bcell=(2/3XCD79B+1/3XSPIB)、Neut=(5XAQP9+.5XNCF4)、Nup=(1/3XCASP5+1/3XIL18RAP+1/3XTNFAIP6),Ndown=(.25XIL8RB+.25XTNFRSFIOC+.25XTLR4+.25XKCNE3)、SCA1=(1/3XS100A12+1/3XCLEC4E+1/3XS100A8)、AF2=AF289562.如果(AF161365_Norm2>6.27或AF161365=NoCall)TSPAN=I、否貝Ij=O、對于男性SEX=1,對于女性=O。在相關的實施方式中,對于男性,INTERCEPT=Interc印t+SEX+MAGEXAge,年齡以年表示,對于女性,INTERCEPT=截距+0FAGE2Xmax(0,Age-60),年齡以年表示。在相關的實施方式中,系數截距=I.82120871、SEX=0.851181、0FAGE2=0.123283、MAGE=0.044868、TSPAN=-0.48182、AF2=—0.24592、Bcell=-0.13717、SCAlM=-0.30754、NeutF=-0.54778、Nupdown=-0.75514,以及NK=-0.40579。在相關的實施方式中,評分根據INTERCEPT-NupdownX(Nup-NdoJ-NKX(NKup-Tcell)-SCAlMXSEXX(SCA1-Norm1)-BcellX(Bcell-Tcell)-NeutFX(1-SEX)X(SCA1-Neut)-TSPANcoefXSEXX(TSPAN)-AF2X(AF2-Norm2)進行測定。在一個實施方式中,解釋函數可以包括任何年齡、性別(例如,性)以及一個或多個項目的線性組合。在一個實施方式中,預測模型可以包括偏最小二乘法模型、邏輯回歸模型、線性回歸模型、線性判別分析模型、嶺回歸模型和基于樹的遞歸分割模型。在一個實施方式中,預測模型還可以包括支持向量機、二次判別分析或LASSO回歸模型。參見ElementsofStatisticalLearning,Springer2003,Hastie,Tibshirani,Friedman;對于全部目的,其全部內容通過引用的方式并入到本申請中。預測模型性能的特征可以由曲線下面積(AUC)表征。在一個實施方式中,預測模型性能的特征是AUC為0.68-0.70。在一個實施方式中,預測模型性能的特征是AUC為0.70-0.79。在一個實施方式中,預測模型性能的特征是AUC為0.80-0.89。在一個實施方式中,所述預測模型性能的特征是AUC為0.90-0.99。分近用于一個或多個標志物的分析的實例包括DNA分析、微陣列、聚合酶鏈反應(PCR)、RT-PCR>Southern印跡法、Northern印跡法、抗體結合分析、酶聯免疫吸附分析(ELISA)、流式細胞分析、蛋白質分析、Western印跡法、池度測定法、比池法、色譜法、質譜法、免疫分析,包括(僅為舉例,但不限于)RIA、免疫熒光、免疫化學發光、免疫電化學發光或競爭免疫分析、免疫沉淀以及下面的實施例部分中描述的分析。來自所述分析的信息可以是定量的并發送到本發明的計算機系統。所述信息還可以是定性的,例如觀察模式或熒光,其可以由用戶或者由閱讀儀或計算機系統自動地翻譯成定量的測量結果。在一個實施例中,所述受試者還可以給計算機系統提供分析信息以外的信息,例如種族、身高、體重、年齡、性別、眼色、毛發顏色、家族醫療史和可以對于用戶有用的任何其它信息,例如上述的臨床因素。信肩、標志物組除了本申請中通過名稱、登錄號或序列確認的特定的、示例性的標志物之外,包括在本發明范圍內的是所有可操作的CAD的預測模型和使用它們評分及任選地使用與示例序列具有至少90%或至少95%或至少97%或更大的同一性的變體序列或者與示例基因或序列編碼的蛋白質具有至少90%或至少95%或至少97%或更大的同一性的該編碼蛋白的表達值對樣品分類的方法。序列同一性的百分數可以使用本領域普通技術人員公知的算法確定,包括例如St印henF.Altschul等人,J.Mol.Biol.215=403-410(1990)中描述的BLASTn和BLASTp,其可在國立衛生研究院維護的NationalCenterforBiotechnologyInformation網站上獲得。根據本發明的實施方式,如下所述的是所有可操作的預測模型及其使用標志物表達測量在評分和任選地對樣品分類中使用的方法,除該示例標志物表達值之外或者替代該示例標志物表達值,所述標志物表達測量現在已知或隨后被發現與該示例標志物表達值的表達高度相關。為了本發明的目的,這些高度相關基因包括在要求保護的發明的文字范圍之內或者可選擇地作為示例性標志物的等效物包括在內。具有與示例性標志物的表達值高度相關的表達值的標志物的鑒別,以及使用它們作為預測模型的成分在本領域普通技術人員的技術水平內。下面的實施例部分提供了多個用于鑒別高度相關的標志物并在CAD的預測模型中用它們替代算法標志物的方法以及使用它們評分和任選地給樣品分類的方法的實施例。計算機實現在一個實施方式中,計算機包括至少一個與芯片組偶聯的處理器。與所述芯片組偶聯的還有內存、存儲設備、鍵盤、圖形適配器、定點設備和網絡適配器。顯示器與所述圖形適配器偶聯。在一個實施方式中,所述芯片組的功能性是由存儲控制器集線器和1/0控制器集線器提供。在另一實施方式中,所述內存與所述處理器直接偶聯而不是所述芯片組偶聯。所述存儲設備是任何能夠保持數據的設備,像硬盤驅動器、光盤只讀存儲器(CD-ROM)、DVD或固態存儲設備。所述內存保持所述處理器使用的指令和數據。所述定點設備可以是鼠標、軌跡球或其它類型的定點設備,并與將數據輸入到所述計算機系統的鍵盤組合使用。所述圖形適配器在所述顯示器上顯示影像和其它信息。所述網絡適配器將所述計算機系統偶聯到局域網或廣域網。如本領域已知的,除了先前描述的那些之外,計算機可以具有不同和/或其它組件。此外,所述計算機可以缺少某些組件。而且,所述存儲設備可以處于所述計算機本地和/或是遠程的(例如體現在存儲域網(SAN)內)。如本領域已知的,計算機適合執行計算機程序模塊以提供此處描述的功能。此處使用的術語“模塊”指的是用于提供指定功能的計算機程序邏輯。因此,模塊可以在硬件、固件和/或軟件內實現。在一個實施方式中,程序模塊存儲在存儲設備上,載入內存中,并由處理器執行。在兩個或更多核酸或多肽序列的情況下,術語百分“同一性”指的是當比較和比對以獲得最大對應時具有指定百分數的相同核苷酸或氨基酸殘基的兩個或更多序列或子序列,如使用下面描述的序列比較算法的一種(例如,技術人員可獲得的BLASTP和BLASTN或其它算法)或通過目測檢查所測量的。取決于應用,所述百分“同一性”可以存在于進行比較的序列的區域,例如,在功能域上,或者可選擇地,存在于待進行比較的兩個序列的全長上。對于序列比較,通常一個序列充當測試序列與其進行比較的參比序列。當使用序列比較算法時,將測試和參比序列輸入計算機,需要時指定子序列坐標,以及指定序列算法程序參數。然后在所述指定的程序參數基礎上,所述序列比較算法計算所述測試序列相對于所述參比序列的百分序列同一性。用于比較的序列的最佳以對可以例如通過Smith&Waterman,Adv.Appl.Math.2482(1981)的局部同源算法,通過Needleman&Wunsch,J.Mol.Biol.48:443(1970)的同源比對算法,通過Pearson&Lipman,Proc.Nat'I.Acad.Sci.USA85:2444(1988)的相似性檢索方法,通過這些算法(GAP,BESTFIT,FASTA和TFASTA,在WisconsinGeneticsSoftwarePackage中,GeneticsComputerGroup,575ScienceDr.,Madison,Wis.)的計算機化實施,或者通過目測檢查(一般地參見Ausubel等人,見下文)進行。一個適合測定百分序列同一性和序列相似性的算法的實例是BLAST算法,其描述在Altschul等人,J.Mol.Biol.215=403-410(1990)中。進行BLAST分析的軟件可以通過NationalCenterforBiotechnologyInformation而公開獲得。此處描述的對象的實施方式除了此處描述的之外可以包括其它和/或不同模塊。此外,構成所述模塊的功能可以通過其它實施方式中的其它或不同的模塊進行。此外,為了清楚和方便的目的,本說明書偶爾省略了術語“模塊”。實施例下面是用于實施本發明的具體實施方式的實例。提供所述實施例僅用于說明的目的,而不意圖以任何方式限制本發明的范圍。關于使用的數字(例如,數量、溫度等),已努力確保其準確性,但是當然應當允許一些實驗誤差和偏差。除非另有說明,本發明的實踐將使用本領域技術內的蛋白質化學、生物化學、重組DNA技術和藥理學的常規方法。這些技術在文獻中被充分地解釋。參見,例如T.E.Creighton,Proteins!StructuresandMolecularProperties(ff.H.FreemanandCompany,1993);A.L.Lehninger,Biochemistry(WorthPublishers,Inc.,currentaddition);Sambrook等人,MolecularCloningALaboratoryManual(2ndEdition,1989);MethodsInEnzymology(S.ColowickandN.Kaplaneds.,AcademicPress,Inc.)!Remington'sPharmaceuticalSciences,18thEdition(Easton,PennsylvaniaMackPublishingCompany,1990);Carey和SundbergAdvancedOrganicChemistry3rdEd.(PlenumPress)VolsA和B(1992)。材料和方法一般研究設計總體的研究設計示于圖I中。該研究有四個獨立的、連續的階段。PREDICT臨床試驗注冊信息可以在2010年5月28日以NCT00500617在clinicaltrials.gov網站上獲得。階段I-CATHGEN發現階段I是來自DukeUniversityCATHGEN登記的InitialGeneDiscovery,一種追溯性血液儲存庫n。簡言之,在2004年8月和2005年11月間將該儲存庫的198位受試者(88個病例,110個對照)納入研究中。臨床入組和排除標準如前所述,并包括糖尿病和非糖尿病患者7。所有CATHGEN患者給予書面知情同意書,且研究方案由DukeUniversityIRB批準。進行微陣列來鑒別CAD敏感基因,選擇亞組基因用于RT-PCR復制。假定階段I的發現的情況下,隨后僅包括非糖尿病受試者。階段Il-預測發現階段2是使用來自PREDICT研究的受試者的預期基因發現階段,其中198位患者(99個病例對照對,年齡和性別匹配)經過微陣列分析以鑒別差異表達的基因。階段III-預測開發階段3是使用640位患者(210個病例,430個對照)進行的預期算法開發以確定臨床因素、血細胞計數、基因表達和CAD之間的相關性。階段IV-預測駘證階段III完成之后,在526位患者的獨立群組(192個病例,334個對照)中預測性地驗證鎖定的算法。來自PREDICT的受試者是合格的,如果他們具有胸痛的歷史、可疑的心絞痛等同癥狀、或者沒有已知MI、血管重建或CAD情況下的CAD高風險。已經描述了詳細的入組/排除標準12。糖尿病狀態通過臨床鑒別、血糖(非禁食>200或禁食>126)、rorhemoglobinAlc(^6.5)或糖尿病醫學描述定義。從所有患者獲得具有差別的全血計數。PREDICT患者給予書面知情同意書,研究方案由WesternInstitutionalReviewBoard批準。血液收集、RNA鈍化和RT-PCR冠狀血管造影術之前,根據制造商的說明將全血樣品收集在PAXgene管中,然后在-20°C冷凍。對于CATHGEN樣品,如所述的(PreAnalytix,FranklinLakes,NJ)純化RNA,接著定量分析(Ribogreen,MolecularProbes,Eugene,OR)。對于PREDICT樣品,使用AgencourtRNAdvance系統的自動化方法。微陣列樣品加標簽并使用制造商的方案與41KHumanWholeGenomeArray(Agilent,PN#G4112A)雜交。對于PREDICT微陣列,所有匹配的對加標簽并一起雜交以使得微陣列批效應最小化。微陣列數據集保留在GE0(GSE20686)。如前所述進行擴增子設計、cDNA合成和RT-PCR7’12。所有PCR反應重復三次進行并將中值用于分析。引物和探針示于下面的非正式序列表中。標志物CD3D的引物和探針從AppliedBiosystems,Inc.商購獲得(AssayIDHs00174158_ml;PartNo.4331182)。用于細胞類型特異件基因表汰測量的全血細胞的分級分離對EDTA管中收集的新鮮血進行細胞分級分離。將合并自四個不同供體的120ml血液按照I:I用IXPBS稀釋。T細胞、B細胞、NK細胞和單核細胞分級分離之前,15%的血液用于通過密度離心法的粒細胞分離,85%的血液用于PBMC分離。外周血單核細胞(PBMC)分離通過密度離心法分離PBMC。在50ml圓錐管中,將20ml稀釋血液在20mlHistopaque1077(SigmaCatNo.10771)上成層,并在室溫下以400Xg離心30分鐘。將PBMC層小心地吸入到新試管中并用IX的磷酸緩沖鹽水(PBS)洗滌兩次,以200Xg離心10分鐘。將洗過的PBMC再次懸浮在冷的緩沖液I(IXPBS,0.1%BSA和2mMEDTA)中并存儲在冰中。5%的細胞在RLT緩沖液(QiagenRNeasyMinikit,CatNo.74104)中溶解用于預選RNA分離。粒細朐分離使用兩種不同的密度介質通過密度離心法純化粒細胞(嗜中性粒細胞、嗜酸性粒細胞、嗜堿性粒細胞)。在15ml的圓錐管中,將3mlHisopaque1077在3mlHistopaque1119(SigmaCatNo.11191)上成層,然后將6ml的稀釋血液在Histopaque1077上成層。將所述試管在室溫(RT)下以700Xg離心30分鐘。然后將粒細胞層吸入新試管中并洗滌兩次。將細胞團再次懸浮在RLT緩沖液中用于粒細胞RNA分離。使用磁珠的陽性細胞分離后續的細胞類型(T細胞、B細胞、天然殺傷(NK)細胞、單核細胞)從PBMC陽性選擇,使用下述試劑和推薦方法。Q)8+T細胞-Dynal⑶8陽性分離試劑盒(InvitrogenCat.No.113.33D)CD3+T細胞-DynabeadsCD3(InvitrogenCat.No.111.51D)CD19+B細胞-DynabeadsCD19panB(InvitrogenCat.No.111.43D)CD14+單核細胞-DynabeadsCD14(單核細胞/巨噬細胞)(InvitrogenCat.No.111.49D)CD56+NK細胞-DynabeadsPanMouseIgG(InvitrogenCat.No.110.41),與小鼠抗人CD56抗體(BDbioscienceCatNo.556325)交聯。簡言之,將PBMC與抗體偶聯的磁珠在4°C下孵育20分鐘并在磁體上用緩沖液I洗滌3次。然后將選擇的細胞再次懸浮在RLT緩沖液中用于RNA分離。RNA分離按照制造商的說明書,使用QiagenRNeasyMini試劑盒純化RLT緩沖液中的RNA樣品。冠狀血管造影分析和病例對照定義所有患者在臨床上依賴于血管造影術并在本地、建立方案的基礎上進行血管造影。對于CATHGEN患者,臨床血管造影解釋定義病例為在一個主要血管中>75%的最大狹窄或者在兩個血管中彡50%,且對照為在所有主要血管中<25%狹窄。對于PREDICT患者,中心實驗室QCA讀數(CardiovascularResearchFoundationNewYork)用于病例對照分類。病例在至少一個主要冠狀血管中具有彡50%狹窄,而對照在所有主要血管中具有<50%狹窄。基因表汰和細胞類型分布之間的相關件與全血計數的相關性和數據庫基因表達分析(SymAtlas)用于鑒別高度細胞類型選擇基因。此外,在特定細胞部分上進行通過密度離心法或陽性抗體選擇的全血細胞分級分離,然后進行RT-PCR。統計方法所有統計學方法使用R軟件包進行。所使用的統計方法在下面更詳細地描述并指明。陣列標準化將Agilent處理的陣列標準化的信號值放大成100的截尾均值,然后進行log2轉化。標準陣列QC度量(目前的百分數、配對的相關性和信號強度)用于質量評估,結果198個CATHGEN中的3個和210個PREDICT中的12個樣品被排除。陣列分析對于CATHGEN陣列,邏輯回歸(未調整的和性別/年齡調整的)用于評估與病例對照狀態有關的基因表達。對于PREDICT陣列,給定配對設計,使用條件邏輯回歸。假發現率用于解釋多重比較。GOEAST用于確定基因本體論(GO)項的過度代表性(overrepresentation)。某因詵擇基于顯著性、倍數變化、路徑分析和文獻支持選擇用于RT-PCR的基因。基于基因基因相關性的層次聚類確保RT-PCR基因代表多個簇。基于低差異、中等至高表達及與病例對照狀態、性別、年齡或細胞計數的非顯著關聯性選擇標準化基因。PCR統計分析使用單變量和多變量邏輯回歸,評估臨床/人口統計因素的CAD關聯性。通過穩健邏輯回歸(未調整的和性別/年齡調整的)評估與CAD和其它臨床/人口統計因素的基因表達關聯性。算法開發和驗證使用相關性截止值,層次聚類用于給基因分組。基于相關性結構、已知生物學和細胞計數相關性,將族縮減為兀基因(meta-gene)14和標準化基因。對于具有聞相關性和相反疾病調節的元基因,定義比率項目(對數標度上的差異)。通過LASSO方法選擇與結果獨立地相關的元基因,與性別獨立地相關的元基因通過變量選擇過程中允許的元基因相互作用選擇15O最終算法使用嶺回歸擬合16,其中結果變量為病例對照狀態且預測元是LASSO-選擇的元基因和性別特異性年齡項。性別是二元預測元,且年齡對于男性、女性>60和女性<60是具有獨立斜率的線性預測元。基因表達項罰分基于交叉驗證和先前證據。使用留一法交叉驗證估計模型性能。算法性能使用ROC分析作為主要端點在獨立患者群組中驗證。算法計算和轉換數據預處理和QC步驟I)對于各算法基因/樣品,計算重復三次的孔的中值a.如果一個孔沒有調用,采用兩個剩余孔的中值b.如果兩個或三個孔沒有調用,所述算法基因對于該樣品接受無調用。2)如果AF161365(TSPAN16)接受無調用,輸入值38作為該基因的中值3)如果AF161365之外任何算法基因接受無調用,所述樣品對于MissingGeneCp.是無效的。在算法開發中640個樣品中沒有樣品對該度量無效。4)計算所述算法基因SD(不包括AF161365)的中值。如果該值大于.15,所述樣品對于HighReplicateSD是無效的。5)對于各算法基因i,通過用GLi替換小于GLi的值來為所述CP值打底(floor)。該值表示算法開發集中該基因的Cp的第I百分位數。6)對于各算法基因i,通過用OTi替換大于⑶i數值來為所述CP值做頂(ceiling)。該值表示算法開發集中該基因的Cp的第99分位數。7)對于各算法基因i,計算它的CP值和GMi之間差異的絕對值,其中GMi表示算法開發集中該基因的中值Cp。合計算法基因(不包括AF161365)的該值。如果總和大于27.17,所述樣品對于ExpressionProfileOutofRange是無效的。27.17表示所述算法開發集中該度量的最大值。在某些情況下,對于受試者不計算算法評分。其理由包括低PAXgene試管血量、實驗室QC失敗等。雖然這些受試者將不包括在分析組中,但是這些失敗的出現頻率將被制表。丟失DiamondForrester評分的受試者將不包括在分析組中。算法計算I)定義Norm1=RPL282)定義Norm2=(5XHNRPF+.5XTFCP2)3)定義NKup=(5XSLAMF7+.5XKLRC4)4)定義Tcell=(5XCD3D+.5XTMC8)5)定義Bcell=(2/3XCD79B+1/3XSPIB)6)定義Neut=(5XAQP9+.5XNCF4)7)定義Nup=(1/3XCASP5+1/3XIL18RAP+1/3XTNFAIP6)8)定義Ndown=(25XIL8RB+.25XTNFRSFIOC+.25XTLR4+.25XKCNE3)9)定義SCA1=(1/3XS100A12+1/3XCLEC4E+1/3XS100A8)10)定義AF2=AF28956211)定義TSPAN=1,如果(AF161365-Norm2>6.27或者AF161365=無調用),否則=012)定義對于男性SEX=1,對于女性=013)定義截距a.對于男性,INTERCEPT=2.672+0.0449X年齡b.對于女性,INTERCEPT=1.821+0.123X(年齡-60),如果為負數,則設置為014)定義評分=INTERCEPT-0.755X(Nup-Ndown)-0.406X(NKup-Tcell)-0.308XSEXX(SCA1-Norm1)-0.137X(Bcell-Tcell)-0.548X(1-SEX)X(SCA1-Neut)-0.482XSEXX(TSPAN)-0.246X(AF2-Norm2)評分轉換使用原始算法評分進行規定的端點分析。為了臨床報告目的以及呈現方便性,原始評分可以轉換成如下的具有為了臨床使用方便設計的等級的轉換評分輸入的是原始評分如果原始評分<-2.95,設置原始分數=-2.95如果原始評分>I.57,設置原始分數=I.57原始評分=2.95+原始分數最終評分=原始分數X40/4.52最終評分向上取整至最接近整數如果最終評分大于40,設置為40如果最終評分小于1,設置為I得到的值為所述最終轉換評分評分變異性的估計從大的PAXgene血液庫測試總共41個重復樣品。這些重復的原始評分的標準差為.13。然后給定的原始評分的置信區間為所述原始評分加或減I.96X.13。這些置信區間的上界和下界線性轉換為040的等級,然后使用上述的似然函數的評分轉化為可能性的置信區間。_6]實施例I:人口統計學數據所述CATHGEN注冊和PREDICT研究患者群組的基線人口學特征示于表I中。大體上,CAD病例更常見地為男性、年長者、具有較高的SBP,以及更高的血脂異常。實施例2:階段I:最初基因發現(CATHGEN)在195個受試者病例對照分析中,總共2438個基因顯示顯著的CAD關聯性(p<0.05)(圖I)。基因表達的臨床和人口統計學因素分析顯示糖尿病為最顯著的(p=0.0006,表3)。基于統計顯著性和生物學關聯,在這些相同的樣品上選擇88個基因(表4)用于RT-PCR分析。非糖尿病和糖尿病子集(N分別=124和71)中的CAD-基因表達分析分別顯示42和12個顯著基因(p<0.05),沒有交叉(圖2)。由此進一步的工作限于非糖尿病患者。我們觀察到CATHGEN群組中對于CAD風險的強烈的糖尿病-基因表達相互作用效應,并由此限制算法開發為PREDICT非糖尿病。CATHGEN糖尿病受試者包括多種疾病嚴重度和多種藥物治療,它們中的一些調節基因表達并影響心血管疾病17。實施例3:階段II:非糖尿病基因發現(PREDICT)210個PREDICT患者樣品的微陣列CAD基因發現使用配對的病例對照試驗設計,以減少年齡、性別和微陣列批處理的混雜效應。QC排除后的99個病例對照對的CAD分析產生5935個顯著基因(p<0.05),其中655個基因與所述CATHGEN結果相同(圖3,表5)。發現基因的涂徑分析這655個基因的基因本體論(GO)分析確認189個顯著的生物學過程項(p<0.05,表6),主要反映炎癥、細胞和應激反應、細胞死亡和細胞凋亡。細胞和分子本體論分別顯示32和49項的富集,包括線粒體功能、細胞凋亡蛋白酶激活劑活性和抗原結合。基因詵擇通過統計顯著性、生物學關聯以及與CAD和在PREDICT開發群組中通過RT-PCR測量的基因表達的在先關聯性選擇總計113個基因(表2)。還表示了已知的細胞類型特異性標志物,PREDICT中與細胞計數有關的那些,以及候選標準化基因。實施例4:階段III:預期的算法開發(PREDICT)算法使用RT-PCR和臨床數據從PREDICT開發群組推導。對于CAD:基因表達關聯性的最顯著臨床因素為年齡、性別、胸痛類型和嗜中性粒細胞計數。年齡和性別是CAD的獨立風險因素(表I)并顯示顯著的基因表達相關性。胸痛類型也是顯著的獨立風險因素(P=0.005),但是與基因表達無關。嗜中性粒細胞計數顯著地與113個RT-PCR基因中的93個的表達相關(正相關或負相關),并且與男性的CAD顯著相關(p=0.049),但是不與女性的CAD顯著相關(p=0.77)。計算所有基因與嗜中性粒細胞和淋巴細胞分數的基因表達相關性(圖4)。>0.2的相關性截止值產生39個與淋巴細胞有關的基因和42個與嗜中性粒細胞有關的基因。與嗜中性粒細胞相關的基因同時顯不上調和下調CAD狀態,而與淋巴細胞有關的基因通常下調。存在嗜中性粒細胞相關基因的顯著性別特異性調節(男性40/42基因上調,女性41/42下調),而淋巴細胞基因下調與性別無關。113個PCR基因的層次聚類導致18個相關的簇(表2),在淋巴細胞和嗜中性粒細胞相關基因內具有更精細的相關子結構。存在3個代表T細胞(簇1、2、3)、B細胞(簇3)和NK細胞(簇12)的淋巴細胞亞組。還鑒別出三個嗜中性粒細胞亞組之前描述的嗜中性粒細胞基因(IL8RB,S100A8,S100A12,TXN,BCL2A1;簇13,16);最近鑒別的上調的嗜中性粒細胞基因(CLEC4E,CASP5,TNFAIP6;簇16)和下調的嗜中性粒細胞基因(KCNE3,TLR4,TNFRSFIOC;簇13,14)7。簇4_11中的29個基因不具有清楚的細胞類型關聯性。算法推導基于所述相關性和細胞類型分析,15個元基因和3個標準化基因確定為用于模型變量選擇的輸入。通過LASSO方法的選擇和通過嶺回歸的加權罰分形成最終的、鎖定的算法,包括6個元基因中的20個CAD相關的基因和3個標準化基因(圖5)。所述算法評分定義為預測回歸模型值。總結PCR算法開發集充分地提供動力以研究CAD、臨床因素和基因表達之間的關系。對于CAD,最顯著的獨立臨床風險因素是年齡、性別和胸痛類型,CAD可能性Diamond-Forrester風險模型的成分\支持它用作基準來評估算法性能12。年齡、性別、CAD和基因表達之間的關系是復雜的。年齡增大和男性性別是公知的CAD的風險因素,其影響循環細胞中的基因表達18’19。在該研究中通過RT-PCR測定的多數基因與淋巴細胞或嗜中性粒細胞分數相關(圖4;r>0.2,分別對于39和42個基因)。嗜中性粒細胞相關組中的基因包括許多我們之前鑒別的(簇6、13、14;表2)7。淋巴細胞組基因包括已知在T細胞(CD3,TMC8)、B細胞(SPIB,CD79B)和NK細胞(SLAMF7,KLRC4)中表達的那些(分別為簇1、3和12)。淋巴細胞相關的基因表達以性別獨立方式隨著CAD減少,這與減少的淋巴細胞計數與增加的心臟血管風險相關的情況一致8。相反,嗜中性粒細胞相關的基因顯示在具有CAD的情況下顯著的性別特異性表達差別在男性中,95%的嗜中性粒細胞基因為上調,而在女性中,98%為下調,這與男性中增加的粒細胞計數與更高的CAD風險相關而在女性中具有更小的影響的情況一致2°。算法頂目的牛物學重要件對于所述算法,相關的元基因作為構件塊的使用是基因表達細胞類型特異性的重要反映。所述算法基因在包括嗜中性粒細胞、NK細胞、B和T淋巴細胞的多個類型的循環細胞中選擇性表達21,從而支持動脈粥樣硬化中適應性的和天生的免疫反應的作用4。在嗜中性粒細胞中優先表達的算法項目I基因(圖5)可以反映嗜中性粒細胞的凋亡,因為半胱天冬酶-5隨著CAD增加,而TNFRSF10C(TRAIL的抗細胞凋亡誘餌受體)減少22。隨CAD上調的項目2基因很可能同時反映天生免疫活化(S100A8和S100A12)23和細胞壞死反應(CLEC4E)24。S100A8和S100A12在慢性炎癥狀態下被上調,或許反映更普通的病理生理信號,這在例如類風濕關節炎的病癥中與增加的CAD—致25’26。項目2以性別特異性方式標準化。在男性中,相對RPL28(其在淋巴細胞中強烈表達)的標準化反映嗜中性粒細胞與淋巴細胞的比率,其對于CAD人群的死亡或MI是預兆性的。在女性中,相對于AQP9和NCF4(兩個CAD非敏感嗜中性粒細胞基因)的標準化允許評估SlOOs和CLEC4E的嗜中性粒細胞的上調。項目3由2個NK細胞受體(SLAMF7和KLRC4)組成,其相對于T細胞特異性基因(TMC8和CD3D)標準化。SLAMF7可以特異性激活NK細胞功能,同時抑制B和T細胞27。KLRC4也可能涉及NK細胞激活28。NK細胞與小鼠模型和人中的動脈粥樣硬化相關,并降低與心臟事件有關的淋巴細胞計數8’29。項目4是B/T細胞比率的基于基因表達的測量。T細胞的作用是復雜的,而B細胞在小鼠模型中已顯示為動脈粥樣化保護的3°’31。在該研究中,明顯的B細胞特異性基因的上調與CAD相關,也許表明對疾病的免疫應答。最后兩項目,基于AF289562(AF2)和TSPAN16,是具有未知功能的基因。實施例5:階段IV:預期算法駘證(PREDICT)在PREDICT開發集中,ROC分析中的估計的交叉驗證算法AUC為0.77(95%Cl0.730.81);在526個患者(192個病例,334個對照)的獨立PREDICT驗證集中的預期驗證產生的AUC為0.70(95%Cl=0.650.75)(圖6)。對于階段III和IV中的算法開發,我們使用穩健的途徑,其通過使用元基因作為構件塊將任何單一基因的效應最小化14’32。處罰逐步邏輯回歸(LASSO)從大大超過候選變量(15個元基因)的數目的640個患者數據集中選擇重要的元基因,從而降低過度擬合的可能性。進一步,為了使得單個項目的過度加權最小化,使用嶺回歸處罰元基因系數。交叉驗證模型AUC為0.77(95%Cl0.73至0.81),暗示算法評分是顯著的CAD預測元,且驗證群組AUC為0.70,具有重疊的置信區間(95%Cl=0.65至0.75)。這一適度的減少可以反映過于樂觀的交叉驗證估計,因為在各迭代中我們沒有再次選擇項目。因此,使用一系列的微陣列和RT-PCR數據集,包括超過1,500個患者,我們推導并驗證算法,由23個基因的表達水平、性別和年齡組成,其評估非糖尿病患者中阻塞性CAD的可能性。實施例6:上沭實施例的總結這一研究呈現了基于全血源的RT-PCR的基因表達算法用于評估非糖尿病患者中阻塞性CAD可能性的算法的開發和驗證,并包括幾個關鍵發現。第一,區別患有或不患有CAD的糖尿病患者的基因表達模式與用于研究不具有糖尿病的患者的基因表達模式大大不同。在最初的基因發現群組中,2438個基因在病例中與對照中差異地表達。在第二非糖尿病患者的PREDICT基因發現群組中,5935個基因差異表達,且655個與最初的基因發現基因重疊。基于整體相關性和生物學重要性,選擇這655個基因中的113個用于獨立算法開發群組中的RT-PCR分析(階段III),其還鑒別臨床因素、細胞計數和基因表達之間的相關性。包括23個基因表達水平、年齡和性別的算法源自這些數據并被鎖定。然后預期地顯示在階段IV(預期PREDICT驗證群組)中具有顯著的診斷準確度,AUC為0.70(95%Cl=0.65至0.75;p=1(T16)。我們認為我們的結果是穩健的,這歸于至少兩個因素。第一,我們使用精心設計的、系列的、四階段研究,包括>1,500位患者,在獨立患者中通過定量RT-PCR測量確認最初的基于微陣列的基因發現。第二,我們使用QCA來定義CAD病例和對照,從而產生更加準確的金標準。實施例7:從算法中移除一個項目在下面的系列實施例(7-47)中,我們檢驗算法的靈敏度和算法開發過程在項目、標志物和統計方法中的差異。各實施例遵遁相同的一般程序I)鑒別似乎可能的替代模型途徑(例如,更少的項目、替代標志物等);2)基于該替代途徑重建算法,包括適當地對所述項目和/或標志物重新加權;以及3)評估新的模型是否保持顯著的預測準確性。評估在所述七個項目缺少一個時所述算法測定CAD的可能性的能力。單一項目從所述算法中連續移除而同時保持其它項目和年齡和性別的臨床因素。例如,項目I從所述算法中移除,而項目2-7和臨床因素(年齡和性別)保留在所述算法中。項目1-7中的標志物示于下表中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于所有分析,ROC曲線下的面積(AUC)為使用的主要準確度度量。使用交叉驗證計算AUC。例如,當項目I從所述算法移除時,改變的算法如下算法計算(嶺回歸;移除項目I)I)定義Norm1=RPL282)定義Norm2=(5XHNRPF+.5XTFCP2)3)定義NKup=(5XSLAMF7+.5XKLRC4)4)定義Tcell=(5XCD3D+.5XTMC8)5)定義Bcell=(2/3XCD79B+1/3XSPIB)6)定義Neut=(5XAQP9+.5XNCF4)7)定義Nup=(1/3XCASP5+1/3XIL18RAP+1/3XTNFAIP6)8)定義Nd_=(25XIL8RB+.25XTNFRSFIOC+.25XTLR4+.25XKCNE3)9)定義SCA1=(1/3XS100A12+1/3XCLEC4E+1/3XS100A8)10)定義AF2=AF28956211)定義對于男性SEX=1,對于女性=012)定義截距a.對于男性,INTERCEPT=0.70+0.044X年齡b.對于女性,INTERCEPT=0.38+0.126X(年齡-60),如果為負數,則設置為013)定義評分=INTERCEPT-0.39X(Nup-Ndown)-0.26X(NKup-Tcell)-0.33XSEXX(SCA1-Norm1)-0.06X(Bcell-Tcell)-0.07X(1-SEX)X(SCA1-Neut)-0.26X(AF2-Norm2)相似的算法開發過程用于在此實施例以及下面的實施例中順序移除其它項目。各個計算的總結統計以及結果的均值和標準差示于表7中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著地好于DF模型。參見表8。所有測試的6個項目組顯著地好于DF模型,表明所述算法甚至在移除一個項目之后仍然保持預測CAD的可能性。項目~標志物項目IAF161365,HNRPF,TFCP2項目2AF289562,HNRPF,TFCP2項目3ICD79B,SPIB,CD3D,TMC8項目4S100A12,CLEC4E,S100A8,RPL28項目5S100A12,CLEC4E,S100A8,AQP9,NCF4項目6CASP5,IL18RAP,TNFAIP6,IL8RB,TNFRSF10C,KCNE3,TLR4項目標志物項目7SLAMF7,KLRC4,CD3D,TMC8實施例8:從所述算法移除兩個項目評估在所述七個項目缺少兩個時所述算法確定CAD的可能性的能力。兩個不同的項目從所述算法中移除而保持其它項目和臨床因素年齡和性別。例如,項目6-7從所述算法中移除而項目1-5和臨床因素保留在所述算法中。評估所有可能的五個項目的組合。兩種統計方法用于評估邏輯回歸和嶺回歸。對于所有分析,ROC曲線下面積(AUC)為使用的主要準確度度量。使用交叉驗證計算AUC。各個計算的總結統計以及結果的均值和標準差不于表9中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于DF模型。參見表8。所有測試的5個項目組顯著地好于DF模型,表明所述算法甚至在移除兩個項目之后仍然保持預測CAD的可能性。實施例9:從所述算法中移除三個項目評估在所述七個項目缺少三個時所述算法確定CAD的可能性的能力。三個不同的項目從所述算法中移除而保持其它項目和臨床因素年齡和性別。例如,項目5-7從所述算法中移除,而項目1-4和臨床因素保留在所述算法中。評估所有可能的四個項目的組合。兩種統計方法用于評估邏輯回歸和嶺回歸。對于所有分析,ROC曲線下的面積(AUC)為使用的主要準確度度量。使用交叉驗證計算AUC。各個計算的總結統計以及結果的均值和標準差不于表10中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于DF模型。參見表8。所有測試的4個項目組顯著好于DF模型,表明所述算法甚至在移除三個項目之后仍然保持CAD可能性的預測。實施例10:從所述算法中移除四個項目評估在所述七個項目缺少四個時所述算法確定CAD的可能性的能力。四個不同的項目從所述算法中移除而保持其它項目和臨床因素年齡和性別。例如,項目4-7從所述算法中移除而項目1-3和臨床因素保留在所述算法中。評估所有可能的三個項目的組合。兩種統計方法用于評估邏輯回歸和嶺回歸。對于所有分析,ROC曲線下的面積(AUC)為使用的主要準確度度量。使用交叉驗證計算AUC。各個計算的總結統計以及結果的均值和標準差不于表11中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于DF模型。參見表8。所有測試的3個項目的組顯著地好于DF模型,表明所述算法甚至在移除四個項目之后仍然保持對CAD可能性的預測。實施例11:從所述算法中移除五個項目評估在所述七個項目缺少五個時所述算法確定CAD的可能性的能力。五個不同的項目從所述算法中移除而保持其它項目和臨床因素年齡和性別。例如,項目3-7從所述算法中移除而項目1-2和臨床因素保留在所述算法中。評估所有可能的兩個項目的組合。兩種統計方法用于評估邏輯回歸和嶺回歸。對于所有分析,ROC曲線下的面積(AUC)為使用的主要準確度度量。使用交叉驗證計算AUC。各個計算的總結統計以及結果的均值和標準差不于表12中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于DF模型。參見表8。所有測試的2個項目的組顯著地好于DF模型,表明所述算法甚至在移除五個項目之后仍然保持CAD可能性的預測。實施例12:從所述算法中移除六個項目評估在所述七個項目缺少六個時所述算法確定CAD的可能性的能力。六個不同的項目從所述算法中移除而保持其它項目和臨床因素年齡和性別。例如,項目2-7從所述算法中移除而項目I和臨床因素保留在所述算法中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于所有分析,ROC曲線下的面積(AUC)為使用的主要準確度度量。使用交叉驗證計算AUC。各個計算的總結統計以及結果的均值和標準差示于表13中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于DF模型。參見表8。所有測試的I個項目的組顯著地好于DF模型,表明所述算法甚至在移除六個項目之后仍然保持CAD可能性的預測。實施例13:從所述算法中移除所有七個項目評估在所述七個標志物表達項目缺少七個時所述算法確定CAD的可能性的能力。七個不同的項目從所述算法中移除而保持臨床因素年齡和性別。兩種統計方法用于評估邏輯回歸和嶺回歸。對于所有分析,ROC曲線下的面積(AUC)為使用的主要準確度度量。使用交叉驗證計算AUC。各個計算的總結統計數值示于表14中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表8。年齡加性別加測試的零標志物表達項目組顯著地好于DF模型,表明所述算法甚至在移除所有七個標志物表達項目之后仍然保持CAD可能性的預測。這表明所述算法中性別和年齡的加權優于DF模型中臨床因素的加權。實施例14:用高度相關的替代標志物代替S100A12對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別(參見表Ib和表2)。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關性值,然后我們挑選具有與目標算法標志物最大相關性的替代標志物。該替代物是具有與所述算法標志物最高相關性的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,MMP9代替所述算法的所有相關項目中的S100A12,這里MMP9代替項目4和5中的S100A12。例如,當S100A12在所述算法中被MMP9代替時,改變的算法如下算法計算(邏輯回歸MMP9代替S100A12)I)定義Norm1=RPL282)定義Norm2=(5XHNRPF+.5XTFCP2)3)定義NKup=(5XSLAMF7+.5XKLRC4)4)定義Tcell=(5XCD3D+.5XTMC8)5)定義Bcell=(2/3XCD79B+1/3XSPIB)6)定義Neut=(5XAQP9+.5XNCF4)7)定義Nup=(1/3XCASP5+1/3XIL18RAP+1/3XTNFAIP6)8)定義Nd_=(25XIL8RB+.25XTNFRSFIOC+.25XTLR4+.25XKCNE3)9)定義SCA1=(1/3XS100A12+1/3XCLEC4E+1/3XS100A8)10)定義AF2=AF28956211)定義如果(AF161365-Norm2>6.27或者AF161365=無調用),TSPAN=1,否則=012)定義對于男性SEX=1,對于女性=013)定義截距a.對于男性,INTERCEPT=5.28+0.047X年齡b.對于女性,INTERCEPT=4.44+0.120X(Age-60),如果為負數,設置為014)定義評分=INTERCEPT-1.05X(Nup-Ndown)-0.56X(NKup-Tcell)-0.35XSEXX(SCA1-Norm1)-0.30X(Bcell-Tcell)-O.89X(1-SEX)X(SCA1-Neut)-0.87XSEXX(TSPAN)-0.38X(AF2-Norm2)相似的算法開發過程用于下面的實施例中。所述計算的總結統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于DF模型。參見表16的DFAUC0所述具有替代標志物的算法保持顯著地好于DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持CAD可能性的預測。實施例15:用高度相關的替代標志物代替CLEC4E對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關性的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,AL0X5AP代替所述算法的所有相關項目中的CLEC4Eo所述計算的總結統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表16的DFAUC0所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持CAD可能性的預測。實施例16:用高度相關的替代標志物代替S100A8對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,NAMPT代替所述算法的所有相關項目中的S100A8。所述計算的總結統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表16的DFAUC。所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持CAD可能性的預測。實施例17:用高度相關的替代標志物代替CASP5對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,H3F3B代替所述算法的所有相關項目中的CASP5。所述計算的總結統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表16的DFAUC。所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持CAD可能性的預測。實施例18:用高度相關的替代標志物代替IL18RAP對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,TXN代替所述算法的所有相關項目中的IL18RAP。所述計算的總結統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表16的DFAUC。所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持CAD可能性的預測。實施例19:用高度相關的替代標志物代替TNFAIP6對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,PLAUR代替所述算法的所有相關項目中的TNFAIP6。所述計算的總結統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表16的DFAUC0所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持CAD可能性的預測。實施例20:用高度相關的替代標志物代替AQP9對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,GLTlDl代替所述算法的所有相關項目中的AQP9。所述計算的總結統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表16的DFAUC。所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持CAD可能性的預測。實施例21:用高度相關的替代標志物代替NCF4對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于所有分析,ROC曲線下面積(AUC)為最初的準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,NCF2代替所述算法的所有相關項目中的NCF4。所述計算的總結統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表16的DFAUC。所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持CAD可能性的預測。實施例22:用高度相關的替代標志物代替CD3D對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算每次替換一個基因的模型的準確度。在該實施例中,LCK代替所述算法的所有相關項目中的CD3D。所述計算的主要統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表16的DFAUC0所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持CAD可能性的預測。實施例23:用高度相關的替代標志物代替TMC8對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,CCT2代替所述算法的所有相關項目中的TMC8。所述計算的主要統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表16的DFAUC。所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持CAD可能性的預測。實施例24:用高度相關的替代標志物代替CD79B對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,CD19代替所述算法的所有相關項目中的CD79B。所述計算的主要統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表16的DFAUC。所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持CAD可能性的預測。實施例25:用高度相關的替代標志物代替SPIB對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,BLK代替所述算法的所有相關項目中的SPIB。所述計算的主要統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表16的DFAUC0所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持CAD可能性的預測。實施例26:用高度相關的替代標志物代替HNRPF對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,ACBD5代替所述算法的所有相關項目中的HNRPF。所述計算的主要統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表16的DFAUC。所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持預測CAD的可能性。實施例27:用高度相關的替代標志物代替TFCP2對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,DDX18代替所述算法的所有相關項目中的TFCP2。所述計算的總結統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表16的DFAUC。所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持預測CAD的可能性。實施例28:用高度相關的替代標志物代替RPL28對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,SSRPl代替所述算法的所有相關項目中的RPL28。所述計算的總結統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表16的DFAUC。所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持CAD可能性的預測。實施例29:用高度相關的替代標志物代替AF289562對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,CD248代替所述算法的所有相關項目中的AF289562。所述計算的總結統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表16的DFAUC0所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持CAD可能性的預測。實施例30:用高度相關的替代標志物代替SLAMF7對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,CX3CR1代替所述算法的所有相關項目中的SLAMF7。所述計算的總結統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表16的DFAUC0所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持CAD可能性的預測。實施例31:用高度相關的替代標志物代替KLRC4對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,CD8A代替所述算法的所有相關項目中的KLRC4。所述計算的總結統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表16的DFAUC。所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持CAD可能性的預測。實施例32:用高度相關的替代標志物代替IL8RB對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,BCL2A1代替所述算法的所有相關項目中的IL8RB。所述計算的總結統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著的好于所述DF模型。參見表16的DFAUC。所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持CAD可能性的預測。實施例33:用高度相關的替代標志物代替TNFRSF10C對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,PTAFR代替所述算法的所有相關項目中的TNFRSF10C。所述計算的總結統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表16的DFAUC0所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持CAD可能性的預測。實施例34:用高度相關的替代標志物代替KCNE3對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,LAMP2代替所述算法的所有相關項目中的KCNE3。所述計算的總結統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表16的DFAUC。所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持CAD可能性的預測。實施例35:用高度相關的替代標志物代替TLR4對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。這一具體替換的相關值示于表15中。兩種統計方法用于評估邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次替換一個基因的模型的準確度。在該實施例中,TYROBP代替所述算法的所有相關項目中的TLR4。所述計算的總結統計示于表15中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。參見表16的DFAUC。所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所述算法標志物之后仍然保持CAD可能性的預測。實施例36:用五個不同的、高度相關的替代標志物隨機代替五個算法標志物對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。所述高度相關的替代標志物參見表15。兩種統計方法用于分析邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次用五個高度相關的標志物隨機替換五個不同的算法標志物的模型的準確度。對于所述隨機標志物替換,進行各100個重復,并計算均值和標準差。所述計算的總結統計示于表16中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用五個高度相關的替代標志物代替五個算法標志物之后仍然保持CAD可能性的預測。實施例37:用十個不同的、高度相關的替代標志物隨機代替十個算法標志物對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。所述高度相關的替代標志物參見表15。兩種統計方法用于分析邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次用十個高度相關的標志物隨機替換十個不同的算法標志物的模型的準確度。對于所述隨機標志物替換,進行各100個重復,并計算均值和標準差。所述計算的總結統計示于表16中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用十個高度相關的替代標志物代替十個算法標志物之后仍然保持CAD可能性的預測。實施例38:用十五個不同的、高度相關的替代標志物隨機代替十五個算法標志物對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。所述高度相關的替代標志物參見表15。兩種統計方法用于分析邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次用十五個高度相關的標志物隨機替換十五個不同的算法標志物的模型的準確度。對于所述隨機標志物替換,進行各100個重復,并計算均值和標準差。所述計算的總結統計示于表16中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用十五個高度相關的替代標志物代替十五個算法標志物之后仍然保持CAD可能性的預測。實施例39:用二十個不同的、高度相關的替代標志物隨機代替二十個算法標志物對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。所述高度相關的替代標志物參見表15。兩種統計方法用于分析邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次用二十個高度相關的標志物隨機替換二十個不同的算法標志物的模型的準確度。對于所述隨機標志物替換,進行各100個重復,并計算均值和標準差。所述計算的總結統計示于表16中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用二十個高度相關的替代標志物代替二十個算法標志物之后仍然保持預測CAD的可能性。實施例40:用不同的、高度相關的替代標志物隨機代替所有算法標志物對于各算法標志物,高度相關的、非算法替代標志物從上述的階段IIIPCR數據集中鑒別。對于各個標志物,計算該標志物和所有其它標志物之間的Pearson相關值,然后我們挑選具有與感興趣的算法標志物最大相關的替代標志物。該替代物是具有與所述算法標志物最高相關的標志物,受到該限制替代標志物在所述算法的項目中使用不超過一次。所述高度相關的替代標志物參見表15。兩種統計方法用于分析邏輯回歸和嶺回歸。對于該分析,ROC曲線下面積(AUC)為主要準確度度量。使用交叉驗證計算AUC。計算一次用高度相關的標志物隨機替換所有算法標志物的模型的準確度。對于所述隨機標志物替換,進行各100個重復,并計算均值和標準差。所述計算的總結統計示于表16中。AUC大于DiamondForrester(DF)的AUC的置信區間的上限被認為是顯著好于所述DF模型。所述具有替代標志物的算法仍然顯著地好于所述DF模型,表明所述算法甚至用高度相關的替代標志物代替所有算法標志物之后仍然保持CAD可能性的預測。實施例41:從頂目I中移除標志物順序從所述算法移除項目I算法標志物和高度相關的替代標志物以確定是否所述算法在它們缺失下將仍保持CAD可能性的預測。從所述算法中移除所有其它的項目和與它們有關的標志物,由此在該分析中,各項目就其本身考慮。所述模型的各項目為δ項目,n_i標志物在所述δ項目的左側和m_i標志物在所述δ項目的右側。我們檢驗兩標志物“簡化項目”,其中僅一個所述n_i左手側標志物和一個可能的m_i右手側標志物用于所述項目中。因此存在!!」※!!!」可能的兩標志物簡化項目。我們還檢驗了通過從所述算法標志物以及所述替代標志物的全項目中相繼移除標志物產生的“簡化項目”。對于各個簡化項目,包括性別、年齡和所述簡化項目的模型進行擬合,估計交叉驗證的AUC。這些交叉驗證的AUC與包括性別、年齡和全項目的模型的AUC比較。對于各個簡化項目,我們測試是否仍然存在所述項目的統計學上顯著的預測效果,即是否AUC的降低足以賦予在CAD的預測中無益處的標志物簡化組。對于所有簡化的標志物組重復相同的過程,其中相關的替換標志物用于替代最初的算法標志物。我們發現該分析中產生的所有簡化項目仍然保持CAD的預測。參見表17。實施例42:從項目2中移除標志物順序從所述算法移除項目2算法標志物和高度相關的替代標志物以確定是否所述算法在它們缺失下將仍保持CAD可能性的預測。從所述算法中移除所有其它的項目和與它們有關的標志物,由此在該分析中,各項目就其本身考慮。所述模型的各項目為δ項目,n_i標志物在所述δ項目的左側,m_i標志物在所述δ項目的右側。我們檢驗兩標志物“簡化項目”,其中僅一個所述n_i左手側標志物和一個可能的m_i右手側標志物用于所述項目中。因此存在!!」※!!!」可能的兩標志物簡化項目。我們還檢驗了通過從所述算法標志物以及所述替代標志物的全項目中相繼移除標志物產生的“簡化項目”。對于各個簡化項目,包括性別、年齡和所述簡化項目的模型進行擬合,估計交叉驗證的AUC。這些交叉驗證的AUC與包括性別、年齡和全項目的模型的AUC比較。對于各個簡化項目,我們測試是否仍然存在所述項目的統計學上顯著的預測效果,即是否AUC的簡化足以賦予在CAD的預測中無益處的標志物簡化組。對于所有簡化的標志物組重復相同的過程,其中相關的替換標志物用于替代最初的算法標志物。我們發現該分析中產生的所有簡化項目仍然保持CAD的預測。參見表18。實施例43:從項目3中移除標志物順序從所述算法移除項目3算法標志物和高度相關的替代標志物以確定是否所述算法在它們缺失下將仍保持CAD可能性的預測。從所述算法中移除所有其它的項目和與它們有關的標志物,由此在該分析中,各項目就其本身考慮。所述模型的各項目為δ項目,n_i標志物在所述δ項目的左側,m_i標志物在所述δ項目的右側。我們檢驗兩標志物“簡化項目”,其中僅一個所述n_i左手側標志物和一個可能的m_i右手側標志物用于所述項目中。因此存在!!」※!!!」可能的兩標志物簡化項目。我們還檢驗了通過從所述算法標志物以及所述替代標志物的全部項目中相繼移除標志物產生的“簡化項目”。對于各個簡化項目,包括性別、年齡和所述簡化項目的模型進行擬合,估計交叉驗證的AUC。這些交叉驗證的AUC與包括性別、年齡和全項目的模型的AUC比較。對于各個簡化項目,我們測試是否仍然存在所述項目的統計學上顯著的預測效果,即是否AUC的簡化足以賦予在CAD的預測中無益處的標志物簡化組。對于所有簡化的標志物組重復相同的過程,其中相關的替換標志物用于替代最初的算法標志物。此外,對于所述兩標志物簡化組,再次重復相同的過程,其中一個相關的替換標志物與一個最初的算法標志物一起使用。我們發現除了LCK/CCT2/CD19/BLK、LCK/CD19/BLK、CCT2/CD19/BLK、LCK/CCT2/CD19、LCK/CD19、CCT2/CD19、CD3D/CD19、LCK/CD19和CCT2/CD19外,該分析中產生的所有簡化項目仍然保持CAD的預測。參見表19。當使用嶺回歸計算AUC時而不使用邏輯回歸計算AUC時,TMC8/CD19為CAD預測的。參見表19。實施例44:從項目4中移除標志物順序從所述算法移除項目4算法標志物和高度相關的替代標志物以確定是否所述算法在它們缺失下將仍保持CAD的可能性。從所述算法中移除所有其它的項目和與它們有關的標志物,由此在該分析中,各項目就其本身考慮。所述模型的各項目為δ項目,n_i標志物在所述δ項目的左側,m_i標志物在所述δ項目的右側。我們檢驗兩個標志物“簡化項目”,其中僅一個所述n_i左手側標志物和一個可能的m_i右手側標志物用于所述項目中。因此存在!!」※!!!」可能的兩標志物簡化項目。我們還檢驗了通過從所述算法標志物以及所述替代標志物的全項目中相繼移除標志物產生的“簡化項目”。對于各個簡化項目,包括性別、年齡和所述簡化項目的模型進行擬合,估計交叉驗證的AUC。這些交叉驗證的AUC與包括性別、年齡和全項目的模型的AUC比較。對于各個簡化項目,我們測試是否仍然是所述項目的統計學上顯著的預測效果,即是否AUC的簡化足以賦予在CAD的預測中無益處的標志物簡化組。對于所有簡化的標志物組重復相同的過程,其中相關的替換標志物用于替代最初的算法標志物。我們發現該分析中產生的所有簡化項目仍然保持CAD的預測。參見表20。實施例45:從項目5中移除標志物順序從所述算法移除項目5算法標志物和高度相關的替代標志物以確定是否所述算法在它們缺失下將仍保持CAD可能性的預測。從所述算法中移除所有其它的項目和與它們有關的標志物,由此在該分析中,各項目就其本身考慮。所述模型的各項目為δ項目,n_i標志物在所述δ項目的左側,m_i標志物在所述δ項目的右側。我們檢驗兩標志物“簡化項目”,其中僅一個所述n_i左手側標志物和一個可能的m_i右手側標志物用于所述項目中。因此存在!!」※!!!」可能的兩標志物簡化項目。我們還檢驗了通過從所述算法標志物以及所述替代標志物的全項目中相繼移除標志物產生的“簡化項目”。對于各個簡化項目,包括性別、年齡和所述簡化項目的模型進行擬合,估計交叉驗證的AUC。這些交叉驗證的AUC與包括性別、年齡和全項目的模型的AUC比較。對于各個簡化項目,我們測試是否仍然是所述項目的統計學上顯著的預測效果,即是否AUC的簡化足以賦予在CAD的預測中無益處的標志物簡化組。對于所有簡化的標志物組重復相同的過程,其中相關的替換標志物用于替代最初的算法標志物。此外,對于所述兩標志物簡化組,再次重復相同的過程,其中一個相關的替換標志物與一個最初的算法標志物一起使用。我們發現除了MMP9/AL0X5AP/GLT1D1/NCF2、MMP9/AL0X5AP/NAMPT/NCF2、MMP9/GLT1D1/NCF2、MMP9/AL0X5AP/NCF2、MMP9/NAMPT/NCF2、MMP9/GLT1D1、AL0X5AP/NCF2、MMP9/NCF2、AL0X5AP/AQP9和AL0X5AP/NCF2外,該分析中產生的所有簡化項目仍然保持CAD的預測。參見表21。當使用嶺回歸計算AUC時而不使用邏輯回歸計算AUC時,AL0X5AP/NCF4為CAD預測的。參見表21。實施例46:從項目6中移除標志物順序從所述算法移除項目6算法標志物和高度相關的替代標志物測定是否所述算法在它們缺失下將仍保持CAD可能性的預測。從所述算法中移除所有其它的項目和與它們有關的標志物,由此在該分析中,各項目就其本身考慮。所述模型的各項目為δ項目,η_i標志物在所述δ項目的左側,m_i標志物在所述δ項目的右側。我們檢驗兩標志物“簡化項目”,其中僅一個所述n_i左手側標志物和一個可能的m_i右手側標志物用于所述項目中。因此存在!!」※!!!」可能的兩標志物簡化項目。我們還檢驗了通過從所述算法標志物以及所述替代標志物的全項目中相繼移除標志物產生的“簡化項目”。對于各個簡化項目,包括性別、年齡和所述簡化項目的模型進行擬合,估計交叉驗證的AUC。這些交叉驗證的AUC與包括性別、年齡和全項目的模型的AUC比較。對于各個簡化項目,我們測試是否仍然是所述項目的統計學上顯著的預測效果,即是否AUC的簡化足以賦予在CAD的預測中無益處的標志物簡化組。對于所有簡化的標志物組重復相同的過程,其中相關的替換標志物用于替代最初的算法標志物。此外,對于所述兩個標志物簡化組,再次重復相同的過程,其中一個相關的替換標志物與一個最初的算法標志物一起使用。我們發現除了H3F3B/TXN/BCL2A1/LAMP2/TYR0BP、H3F3B/TXN/BCL2A1/LAMP2、H3F3B/TXN/BCL2AI/TYROBP、TXN/PLAUR/BCL2AI/TYROBP,H3F3B/TXN/PLAUR/BCL2AI、H3F3B/BCL2AI/TYROBP、TXN/BCL2AI/TYROBP、H3F3B/TXN/BCL2A1、H3F3B/TXN/TYR0BP、TXN/PLAUR/BCL2A1、TXN/PLAUR/BCL2A1、H3F3B/BCL2A1、H3F3B/TYR0BP、TXN/BCL2A1、TXN/TYROBP、TXN/IL8RB和TXN/TNFRSFIOC,該分析中產生的所有簡化項目仍然保持CAD的預測。參見表22。實施例47:從項目7中移除標志物順序從所述算法移除項目7算法標志物和高度相關的替代標志物以確定是否所述算法在它們缺失下將仍保持CAD可能性的預測。從所述算法中移除所有其它的項目和與它們有關的標志物,由此在該分析中,各項目就其本身考慮。所述模型的各項目為δ項目,n_i標志物在所述δ項目的左側,m_i標志物在所述δ項目的右側。我們檢驗兩標志物“簡化項目”,其中僅一個所述n_i左手側標志物和一個可能的m_i右手側標志物用于所述項目中。因此存在!!」※!!!」可能的兩標志物簡化項目。我們還檢驗了通過從所述算法標志物以及所述替代標志物的全項目中相繼移除標志物產生的“簡化項目”。對于各個簡化項目,包括性別、年齡和所述簡化項目的模型進行擬合,估計交叉驗證的AUC。這些交叉驗證的AUC與包括性別、年齡和全項目的模型的AUC比較。對于各個簡化項目,我們測試是否仍然是所述項目的統計學上顯著的預測效果,即是否AUC的簡化足以賦予在CAD的預測中無益處的標志物簡化組。對于所有簡化的標志物組重復相同的過程,其中相關的替換標志物用于替代最初的算法標志物。此外,對于所述兩個標志物簡化組,再次重復相同的過程,其中一個相關的替換標志物與一個最初的算法標志物一起使用。我們發現除了LCK/CCT2/CX3CR1/CD8A、LCK/CX3CR1/CD8A、CCT2/CX3CR1/CD8A、LCK/CCT2/CD8A、LCK/CD8A、CCT2/CD8A、TMC8/CD8A和CD3D/CD8A外,該分析中產生的所有簡化項目仍然保持CAD的預測。參見表23。實施例48:用于評估非糖尿病患者中CAD的算法的診斷準確度的驗證此處我們報告用于阻塞性CAD可能性的基因表達算法的最初預期驗證,定義為在具有可疑CAD的非糖尿病患者中引起>50%腔的直徑狹窄的一種或更多冠狀粥樣硬化病變。方法一般研究設計和研究人群2007年7月到2009年4月之間,受試者編入到PREDICT,39中心(US)前瞻性研究中。所述研究在所有參與中心和所有患者給予書面知情同意的情況下由機構評審委員會批準。涉及診斷冠狀血管造影術的受試者是合格的,只要他們具有胸痛的歷史、可疑的心絞痛等同癥狀、或者CAD的高風險,且先前沒有已知心肌梗死(MI)、血管重建或阻塞性CAD。如果在導管插入時,受試者具有急性MI、高風險不穩定型心絞痛、嚴重的非冠脈心臟病(充血性心力衰竭、心肌病或瓣膜疾病)、全身感染或炎性狀況或者正在服用免疫抑制或化學治療齊U,它們是不合格的。從2418個入組的符合選擇標準的受試者,606個糖尿病患者被排除,因為該初始算法開發和驗證集中在非糖尿病患者。剩余的1812個患者中,237個具有不適合QCA的血管造影影像,6個具有不可用的血樣。對于剩余的1569個受試者,226個用于基因發現(ElashoffMR,WingroveJA,BeinekeP,等人DevelopmentofaBlood-basedGeneExpressionAlgorithmforAssessmentofObstructiveCoronaryArteryDiseaseinNon-DiabeticPatients,submitted.CirculationCardiovascularGenetics.2010);剩余的1343個基于入組日期順序分成獨立算法開發和驗證群組(圖7)。臨床評估和定暈冠狀血■管造影術由調查研究協調者在研究場所使用標準化數據收集方法獲得預定的臨床數據,包括人口統計數據、藥物治療、病歷和報告,以及MPI結果,且數據由獨立的研究監督員核實。通過計算機輔助的QCA分析冠狀動脈造影照片。特別地,將根據現場方案進行的臨床指示的冠狀動脈造影照片數字化、去標識和使用CardiovascularResearchFoundation,NewYork,NY(LanskyAJ,PopmaJJ.QualitativeandquantitativeangiographyPhiladelphia,PASaunders;1998TextBookofInterventionalCardiology))驗證的定量方案,進行分析。受過訓練的技師(不知曉臨床和基因表達數據)在直徑>I.5mm的血管中目視鑒別所有病變>10%直徑狹窄(DS)。使用CMSMedis系統(Medis,version7.I,Leiden,theNetherlands),技師跟蹤最近的近端和遠端的非患病的位置之間病變的血管腔。然后計算最小管腔直徑(MLD)、參考管腔直徑(RLD=病變的正常段近端和遠端的平均直徑)和%DS(%DS=(l-MLD/RLD)xlOO)。預期選擇所述Diamond-Forrester(D-F)風險評分(包括年齡、性別和胸痛類型)來評估基因表達評分對臨床因素的附加價值(DiamondGA,ForresterJS.Analysisofprobabilityasanaidintheclinicaldiagnosisofcoronary-arterydisease.NEnglJMed.1979;300(24):1350-8)。基于受試者的會晤指定胸痛類型(典型性心絞痛、非典型性心絞痛和非心絞痛胸痛)的D-F分類(DiamondGA,ForresterJS.Analysisofprobabilityasanaidintheclinicaldiagnosisofcoronary-arterydisease.NEnglJMed.1979;300(24):1350-8),以及指定D-F評分(ChaitmanBR,BourassaMG,DavisK等人Angiographicprevalenceofhigh-riskcoronaryarterydiseaseinpatientsubsets(CASS).Circulation.1981;64(2):360-7)。不具有胸痛癥狀的受試者分類為非心絞痛胸痛。根據本地方案,如臨床指示地進行MPI,且由有權使用臨床數據而非基因表達或插管數據的本地閱讀者解釋。MPI定義為如果報告與阻塞性CAD—致的>I的可逆或固定缺陷,則MPI為陽性。不確定或中間缺陷被認為是陰性。阻塞件CAD和疾病組定義具有阻塞性CAD的患者(N=192)預期定義為在主要冠狀動脈(彡I.5mm腔的直徑)中具有>I動脈粥樣硬化塊的患者,導致通過QCA引起>50%腔直徑的狹窄;非阻塞性CAD(N=334)沒有>50%的損害。血樣冠狀血管造影術之前,將靜脈血樣收集在PAXgeneRNA保存試管中。根據制造商的說明書處理樣品,然后冷凍于-20V。RNA純化和RT-PCR使用AgencourtRNAdvance系統的全血樣品的自動化RNA純化、cDNA合成以及RT-PCR如描述的進行(ElashoffMR,WingroveJA,BeinekeP等人DevelopmentofaBlood-basedGeneExpressionAlgorithmforAssessmentofObstructiveCoronaryArteryDiseaseinNon-DiabeticPatients,submitted.CirculationCardiovascularGenetics.2010)。全部PCR反應重復進行三次,中值用于分析。通過相對TFCP2和HNRPF的表達值標準化的跨剪切接頭和內含子AD0RA3測定的表達值的比較檢測基因組DNA污染。進行RPS4Y1分析以驗證所有患者的性別;如果與臨床數據存在明顯失配,將患者排除。預定義樣品QC度量和取舍標準并在如所述評估結果前應用(ElashoffMR,WingroveJA,BeinekeP,等人DevelopmentofaBlood-basedGeneExpressionAlgorithmforAssessmentofObstructiveCoronaryArteryDiseaseinNon-DiabeticPatients,submitted.CirculationCardiovascularGenetics.2010.)。統計方法對于表24的分析使用SAS版本9.I(SASInstituteInc,Cary,NC,USA)。所有其它分析使用R版本2.7(RFoundationforStatisticalComputing,Vienna,Austria)進行。除非另有指定,連續變量的單變量比較采用t檢驗,分類變量采用卡方檢驗。所有報告的P值是雙側的。基因表達算法評分在驗證研究之前鎖定算法。在所有統計分析中對于如描述和使用的23個算法基因、年齡和性別從中位表達值計算原始算法評分;評分線性轉換為用于報告方便的0-40等級。ROC估計和AUC比較估計ROC曲線用于a)基因表達算法評分、b)D_F風險評分、c)算法評分和D-F風險評分的組合模型、d)MPl^Pe)算法評分和MPI的組合模型。標準方法(NewsonR.ConfidenceintervalsforrankstatisticsSomers/Dandextensions.StataJournal.2006;6309-334.)用于估計經驗ROC曲線和相關的AUC和AUC標準誤。Z檢驗用于檢驗AUC對隨機(AUC=·50)。配對AUC比較i)基因表達算法評分加D-F風險評分對D-F風險評分,以及ii)基因表達算法評分加MPI對MPI;通過引導程序(bootstrap)進行。對于各個比較,進行10,000個引導程序重復,計算觀察的AUC差異。所述中值引導程序的AUC差異用于估計AUC差異,使用引導程序的AUC差異的經驗分布估計P值(即,在經驗分布中觀察的OAUC差異的分位數)。邏輯回歸一系列的邏輯回歸模型進行擬合,以疾病狀態作為二元因變量,并使用套式模型之間的似然比檢驗進行比較。比較為i)基因表達算法評分加D-F風險評分對單獨的D-F風險評分;ii)基因表達算法評分加MPI對單獨的MPI;iii)基因表達算法評分對所述基因表達算法評分的人口統計學成分。算法評分與最大百分狹窄的相關性算法評分和作為連續變量的百分最大狹窄之間的相關性通過線性回歸進行評估。將狹窄值分組到5個漸增的類中(無可測量的疾病,1_24%,在>I血管中25-49%,I血管彡50%,以及>I血管彡50%),ANOVA用于檢驗類間算法評分中的線性趨勢。疾病狀杰的重新分類基因表達算法評分和D-F風險評分定義為低(0%<20%)、中(彡20%,<50%)和高風險(彡50%)阻塞性CAD可能性。MPI結果分類為陰性(無缺損/可能的固定或可逆缺損)或陽性(固定或可逆缺損)。對于D-F風險評分分析,重新分類的受試者定義為i)D-F中度風險對低或高算法評分,ii)D-F高風險對算法低風險,或者iii)D-F低風險對算法高風險。對于MPI分析,重新分類的受試者包括i)MPI陽性對基于算法評分的低風險;或者ii)MPI陰性對基于算法評分的高風險。如在(PencinaMJ,D'AgostinoRB,Sr.,D'AgostinoRB,Jr.,VasanRS.EvaluatingtheaddedpredictiveabilityofanewmarkerfromareaundertheROCcurvetoreclassificationandbeyond.StatMed.2008;27(2):157-72;discussion207-12.)中描述的,計算基因表達算法評分(和相關的P值)相對于D-F風險評分或MPI的凈重新分類改善(NRI)。NRI為重新分類臨床益處的測量,并對重新分類的分數和準確度敏感。NRI公式NRI作為陽性重新分類考慮他們的分類沿“正確”的方向移動(患病受試者移向更高的風險分類,和非患病受試者移向更低的風險分類)的那些患者。相似地,NRI作為陰性重新分類考慮他們的分類沿“錯誤”的方向移動(患病受試者移向更低的風險分類,和非患病受試者移向更高的風險分類)的那些患者。然后,NRI公式是陽性重新分類的分數和陰性重新分類的分類的差。NRI=(P上,事件-P下,事件)_(P上,非事件-P下,非事件)其中P上,事件=#上移事件/#事件P下,事件=#下移事件/#事件P上,非事件=#上移非事件/#非事件P下,非事件=#下移非事件/#非事件用于顯著性檢驗,z=NRI/(ve+vne)1/2其中Ve=(P上,事件+p下,事件)/#事件Vne=(P上,非事件+P下,非事件)/#非事件(公式來自{Pencina等人,2008})回歸分析D-F風險評分模型模型項目優勢比95%ClP值模型AICD-F風險評分I.018I.012I.023<.001652.53基因表達算法評分+D-F風險評分模型項目優勢比95%ClP值模型AICD-F風險評分I.012I.007I.018<.001基因表達算法評分1764I.37I.96<.001622.3MPI模型權利要求1.一種計算機實施的用于對從受試者獲得的第一樣品評分的方法,包括獲得與所述第一樣品有關的第一數據集,其中所述第一數據集包括選自項目I、項目.2、項目3、項目4、項目5、項目6和項目7中的標志物組中的至少一個標志物組的定量表達數據;其中項目I包括標志物I、標志物2和標志物3,其中標志物I包括AF161365,其中標志物2包括HNRPF或ACBD5,且其中標志物3包括TFCP2或DDX18;其中項目2包括標志物4、標志物5和標志物6,其中標志物4包括AF289562或⑶248,其中標志物5包括HNRPF或ACBD5,且其中標志物6包括TFCP2或DDX18;其中項目3包括標志物7、標志物8、標志物9和標志物10,其中標志物7包括⑶79B或⑶19,其中標志物8包括SPIB或BLK,其中標志物9包括⑶3D或LCK,且其中標志物10包括TMC8或CCT2;其中項目4包括標志物11、標志物12、標志物13和標志物14,其中標志物11包括S100A12或MMP9,其中標志物12包括CLEC4E或ALOX5AP,其中標志物13包括S100A8或NAMPT,且其中標志物14包括RPL28或SSRPl;其中項目5包括標志物15、標志物16、標志物17、標志物18和標志物19,其中標志物15包括S100A12或MMP9,其中標志物16包括CLEC4E或ALOX5AP,其中標志物17包括S100A8或NAMPT,其中標志物18包括AQP9或GLTlDl,且其中標志物19包括NCF4或NCF2;其中項目6包括標志物20、標志物21、標志物22、標志物23、標志物24、標志物25和標志物26,其中標志物20包括CASP5或H3F3B,其中標志物21包括IL18RAP或TXN,其中標志物22包括TNFAIP6或PLAUR,其中標志物23包括IL8RB或BCL2A1,其中標志物24包括TNFRSF10C或PTAFR,其中標志物25包括KCNE3或LAMP2,且其中標志物26包括TLR4或TYROBP;以及其中項目7包括標志物27、標志物28、標志物29和標志物30,其中標志物27包括SLAMF7或CX3CR1,其中標志物28包括KLRC4或⑶8A,其中標志物29包括⑶3D或LCK,且其中標志物30包括TMC8或CCT2;以及通過計算機處理器,使用解釋函數由第一數據集確定第一評分,其中所述第一評分預測所述受試者的CAD。2.根據權利要求I所述的方法,其中,所述第一數據集包括選自項目I、項目2、項目3、項目4、項目5、項目6和項目7中的標志物組的至少兩個標志物組的定量表達數據。3.根據權利要求I所述的方法,其中,所述第一數據集包括選自項目I、項目2、項目3、項目4、項目5、項目6和項目7中的標志物組的至少三個標志物組的定量表達數據。4.根據權利要求I所述的方法,其中,所述第一數據集包括選自項目I、項目2、項目3、項目4、項目5、項目6和項目7中的標志物組的至少四個標志物組的定量表達數據。5.根據權利要求I所述的方法,其中,所述第一數據集包括選自項目I、項目2、項目3、項目4、項目5、項目6和項目7中的標志物組的至少五個標志物組的定量表達數據。6.根據權利要求I所述的方法,其中,所述第一數據集包括選自項目I、項目2、項目3、項目4、項目5、項目6和項目7中的標志物組的至少六個標志物組的定量表達數據。7.根據權利要求I所述的方法,其中,所述第一數據集包括項目I、項目2、項目3、項目.4、項目5、項目6和項目7中的標志物組的定量表達數據。8.根據權利要求I所述的方法,其中,所述解釋函數基于預測模型。9.根據權利要求8所述的方法,其中,所述第一數據集進一步包括臨床因素。10.根據權利要求9所述的方法,其中,所述臨床因素選自年齡、性別、胸痛類型、嗜中性粒細胞計數、種族、疾病持續時間、舒張血壓、收縮血壓、家族史參數、醫療史參數、醫學癥狀參數、身高、體重、人體質量指數、靜息心率以及吸煙者/非吸煙者狀態。11.根據權利要求8所述的方法,其中,所述預測模型選自偏最小二乘法模型、邏輯回歸模型、線性回歸模型、線性判別分析模型、嶺回歸模型和基于樹的遞歸分割模型。12.根據權利要求I所述的方法,其中,獲得與所述第一樣品有關的第一數據集包括獲得所述第一樣品以及處理所述第一樣品以實驗測定所述第一數據集。13.根據權利要求I所述的方法,其中,獲得與所述第一樣品有關的第一數據集包括從已處理所述第一樣品以實驗測定所述第一數據集的第三方接收所述第一數據集。14.根據權利要求I所述的方法,進一步包括根據所述第一評分對所述第一樣品進行分類。15.根據權利要求14所述的方法,其中,所述分類預測所述受試者中CAD的存在或缺乏。16.根據權利要求14所述的方法,其中,所述分類預測所述受試者中CAD的程度。17.根據權利要求14所述的方法,其中,所述分類預測所述受試者中CAD的風險。18.根據權利要求I所述的方法,進一步包括基于所述第一評分對CAD風險評級。19.根據權利要求I所述的方法,其中,所述預測模型性能的特征是曲線下面積(AUC)為O.68-0.70。20.根據權利要求I所述的方法,其中,所述預測模型性能的特征是AUC為O.70-0.79。21.根據權利要求I所述的方法,其中,所述預測模型性能的特征是AUC為O.80-0.89。22.根據權利要求I所述的方法,其中,所述預測模型性能的特征是AUC為O.90-0.99。23.根據權利要求I所述的方法,其中,所述第一樣品包括外周血細胞。24.根據權利要求23所述的方法,其中,所述外周血細胞包括白細胞。25.根據權利要求I所述的方法,其中,所述第一樣品包括提取自外周血細胞的RNA。26.根據權利要求I所述的方法,其中,所述定量表達數據源于雜交數據。27.根據權利要求I所述的方法,其中,所述定量表達數據源于聚合酶鏈反應數據。28.根據權利要求I所述的方法,其中,所述定量表達數據源于抗體結合分析。29.根據權利要求I所述的方法,其中,所述第一數據集獲得和存儲在存儲器中。30.根據權利要求I所述的方法,其中,所述受試者是人。31.根據權利要求I所述的方法,其中,所述受試者具有穩定的胸痛。32.根據權利要求I所述的方法,其中,所述受試者具有典型心絞痛或非典型心絞痛或心絞痛等同癥狀。33.根據權利要求I所述的方法,其中,所述受試者之前沒有心肌梗死(MI)的診斷。34.根據權利要求I所述的方法,其中,所述受試者未接受過血管重建過程。35.根據權利要求I所述的方法,其中,所述受試者未患糖尿病。36.根據權利要求I所述的方法,其中,所述受試者不具有炎性狀況或傳染性狀況。37.根據權利要求I所述的方法,其中,所述受試者當前未服用類固醇、免疫抑制劑或化學治療劑。38.一種計算機實施的對從受試者獲得的第一樣品評分的方法,包括獲得與所述第一樣品相關的第一數據集,其中所述第一數據集包括臨床因素和選自AF161365、HNRPF、ACBD5、TFCP2、DDX18、AF289562、CD248、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、AL0X5AP、S100A8、NAMPT、RPL28、SSRP1、AQP9、GLTlDl、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2AI、TNFRSFIOC、PTAFR、KCNE3、LAMP2、TLR4、TYROBP,SLAMF7、CX3CR1、KLRC4和CD8A中的至少兩個標志物的定量表達數據;以及通過計算機處理器使用解釋函數由所述第一數據集確定第一評分,其中所述第一評分預測所述受試者的CAD。39.根據權利要求38所述的方法,其中,所述第一數據集包括至少三個標志物的定量表達數據。40.根據權利要求38所述的方法,其中,所述第一數據集包括至少四個標志物的定量表達數據。41.根據權利要求38所述的方法,其中,所述第一數據集包括至少五個標志物的定量表>達數據。42.根據權利要求38所述的方法,其中,所述第一數據集包括至少六個標志物的定量表達數據。43.根據權利要求38所述的方法,其中,所述解釋函數基于預測模型。44.根據權利要求43所述的方法,其中,所述臨床因素是年齡和/或性別。45.根據權利要求43所述的方法,其中,所述臨床因素選自年齡、性別、胸痛類型、嗜中性粒細胞計數、種族、疾病持續時間、舒張血壓、收縮血壓、家族史參數、醫療史參數、醫學癥狀參數、身高、體重、人體質量指數、靜息心率以及吸煙者/非吸煙者狀態。46.根據權利要求43所述的方法,其中,所述預測模型選自偏最小二乘法模型、邏輯回歸模型、線性回歸模型、線性判別分析模型、嶺回歸模型和基于樹的遞歸分割模型。47.根據權利要求38所述的方法,其中,獲得與所述第一樣品有關的第一數據集包括獲得所述第一樣品以及處理所述第一樣品以實驗測定所述第一數據集。48.根據權利要求38所述的方法,其中,獲得與所述第一樣品有關的第一數據集包括從已處理所述第一樣品以實驗測定所述第一數據集的第三方接收所述第一數據集。49.根據權利要求38所述的方法,進一步包括根據所述第一評分對所述第一樣品進行分類。50.根據權利要求49所述的方法,其中,所述分類是預測所述受試者中CAD的存在或缺乏。51.根據權利要求49所述的方法,其中,所述分類預測所述受試者中CAD的程度。52.根據權利要求49所述的方法,其中,所述分類預測所述受試者中CAD的風險。53.根據權利要求38所述的方法,進一步包括基于所述第一評分對CAD風險評級。54.根據權利要求38所述的方法,其中,所述預測模型性能的特征是AUC為·O.68-0.70。55.根據權利要求38所述的方法,其中,所述預測模型性能的特征是AUC為O.70-0.79ο56.根據權利要求38所述的方法,其中,所述預測模型性能的特征是AUC為O.80—O.89ο57.根據權利要求38所述的方法,其中,所述預測模型性能的特征是AUC為O.90_0·99ο58.根據權利要求38所述的方法,其中,所述第一樣品包括外周血細胞。59.根據權利要求58所述的方法,其中,所述外周血細胞包括白細胞。60.根據權利要求38所述的方法,其中,所述第一樣品包括提取自外周血細胞的RNA。61.根據權利要求38所述的方法,其中,所述定量表達數據源于雜交數據。62.根據權利要求38所述的方法,其中,所述定量表達數據源于聚合酶鏈反應數據。63.根據權利要求38所述的方法,其中,所述定量表達數據源于抗體結合分析。64.根據權利要求38所述的方法,其中,所述第一數據集獲得和存儲在存儲器中。65.根據權利要求38所述的方法,其中,所述受試者是人。66.根據權利要求38所述的方法,其中,所述受試者具有穩定的胸痛。67.根據權利要求38所述的方法,其中,所述受試者具有典型心絞痛或非典型心絞痛或心絞痛等同癥狀。68.根據權利要求38所述的方法,其中,所述受試者之前沒有MI的診斷。69.根據權利要求38所述的方法,其中,所述受試者未接受過血管重建過程。70.根據權利要求38所述的方法,其中,所述受試者未患糖尿病。71.根據權利要求38所述的方法,其中,所述受試者不具有炎性狀況或傳染性狀況。72.根據權利要求38所述的方法,其中,所述受試者當前未服用類固醇、免疫抑制劑或化學治療劑。73.一種用于預測受試者中CAD的系統,所述系統包括存儲器,其用于存儲與從所述受試者獲得的樣品相關的數據集,其中所述數據集包括選自項目I、項目2、項目3、項目4、項目5、項目6和項目7中的標志物組中的至少一個標志物組的定量表達數據;其中項目I包括標志物I、標志物2和標志物3,其中標志物I包括AF161365,其中標志物2包括HNRPF或ACBD5,和其中標志物3包括TFCP2或DDX18;其中項目2包括標志物4、標志物5和標志物6,其中標志物4包括AF289562或⑶248,其中標志物5包括HNRPF或ACBD5,和其中標志物6包括TFCP2或DDX18;其中項目3包括標志物7、標志物8、標志物9和標志物10,其中標志物7包括⑶79Β或⑶19,其中標志物8包括SPIB或BLK,其中標志物9包括⑶3D或LCK,和其中標志物10包括TMC8或CCT2;其中項目4包括標志物11、標志物12、標志物13和標志物14,其中標志物11包括S100A12或ΜΜΡ9,其中標志物12包括CLEC4E或AL0X5AP,其中標志物13包括S100A8或ΝΑΜΡΤ,和其中標志物14包括RPL28或SSRPl;其中項目5包括標志物15、標志物16、標志物17、標志物18和標志物19,其中標志物15包括S100A12或ΜΜΡ9,其中標志物16包括CLEC4E或AL0X5AP,其中標志物17包括S100A8或ΝΑΜΡΤ,其中標志物18包括AQP9或GLT1D1,和其中標志物19包括NCF4或NCF2;其中項目6包括標志物20、標志物21、標志物22、標志物23、標志物24、標志物25和標志物26,其中標志物20包括CASP5或H3F3B,其中標志物21包括IL18RAP或ΤΧΝ,其中標志物22包括TNFAIP6或PLAUR,其中標志物23包括IL8RB或BCL2A1,其中標志物24包括TNFRSFIOC或PTAFR,其中標志物25包括KCNE3或LAMP2,和其中標志物26包括TLR4或TYROBP;以及其中項目7包括標志物27、標志物28、標志物29和標志物30,其中標志物27包括SLAMF7或CX3CR1,其中標志物28包括KLRC4或⑶8A,其中標志物29包括⑶3D或LCK,和其中標志物30包括TMC8或CCT2;以及與所述存儲器通訊偶聯的處理器,其使用解釋函數確定評分,其中所述評分預測受試者的CAD。74.一種存儲計算機可執行程序代碼的計算機可讀存儲介質,所述程序代碼包括用于存儲與從所述受試者獲得的樣品相關的數據集的程序代碼,其中所述數據集包括選自項目I、項目2、項目3、項目4、項目5、項目6和項目7的標志物組中的至少一個標志物組的定量表達數據;其中項目I包括標志物I、標志物2和標志物3,其中標志物I包括AF161365,其中標志物2包括HNRPF或ACBD5,和其中標志物3包括TFCP2或DDX18;其中項目2包括標志物4、標志物5和標志物6,其中標志物4包括AF289562或⑶248,其中標志物5包括HNRPF或ACBD5,和其中標志物6包括TFCP2或DDX18;其中項目3包括標志物7、標志物8、標志物9和標志物10,其中標志物7包括⑶79B或⑶19,其中標志物8包括SPIB或BLK,其中標志物9包括⑶3D或LCK,和其中標志物10包括TMC8或CCT2;其中項目4包括標志物11、標志物12、標志物13和標志物14,其中標志物11包括S100A12或MMP9,其中標志物12包括CLEC4E或AL0X5AP,其中標志物13包括S100A8或NAMPT,和其中標志物14包括RPL28或SSRPl;其中項目5包括標志物15、標志物16、標志物17、標志物18和標志物19,其中標志物15包括S100A12或MMP9,其中標志物16包括CLEC4E或AL0X5AP,其中標志物17包括S100A8或NAMPT,其中標志物18包括AQP9或GLT1D1,和其中標志物19包括NCF4或NCF2;其中項目6包括標志物20、標志物21、標志物22、標志物23、標志物24、標志物25和標志物26,其中標志物20包括CASP5或H3F3B,其中標志物21包括IL18RAP或TXN,其中標志物22包括TNFAIP6或PLAUR,其中標志物23包括IL8RB或BCL2A1,其中標志物24包括TNFRSF10C或PTAFR,其中標志物25包括KCNE3或LAMP2,和其中標志物26包括TLR4或TYROBP;以及其中項目7包括標志物27、標志物28、標志物29和標志物30,其中標志物27包括SLAMF7或CX3CR1,其中標志物28包括KLRC4或⑶8A,其中標志物29包括⑶3D或LCK,和其中標志物30包括TMC8或CCT2;以及使用解釋函數確定評分的程序代碼,其中所述評分預測受試者的CAD。75.一種用于預測受試者的CAD的方法,包括從所述受試者獲得樣品,其中所述樣品包括多個分析物;將所述樣品與試劑接觸;產生多個所述試劑與所述多個分析物的復合物;檢測該多個復合物以獲得與所述樣品相關的數據集,其中所述數據集包括選自項目I、項目2、項目3、項目4、項目5、項目6和項目7的標志物組中的至少一個標志物組的定量表達數據;其中項目I包括標志物I、標志物2和標志物3,其中標志物I包括AF161365,其中標志物2包括HNRPF或ACBD5,和其中標志物3包括TFCP2或DDX18;其中項2包括標志物·4、標志物5和標志物6,其中標志物4包括AF289562或⑶248,其中標志物5包括HNRPF或ACBD5,和其中標志物6包括TFCP2或DDX18;其中項目3包括標志物7、標志物8、標志物9和標志物10,其中標志物7包括⑶79B或⑶19,其中標志物8包括SPIB或BLK,其中標志物·9包括⑶3D或LCK,和其中標志物10包括TMC8或CCT2;其中項目4包括標志物11、標志物·12、標志物13和標志物14,其中標志物11包括310(^12或麗9,其中標志物12包括CLEC4E或ALOX5AP,其中標志物13包括S100A8或NAMPT,和其中標志物14包括RPL28或SSRPl;其中項目5包括標志物15、標志物16、標志物17、標志物18和標志物19,其中標志物15包括S100A12或MMP9,其中標志物16包括CLEC4E或ALOX5AP,其中標志物17包括S100A8或NAMPT,其中標志物18包括AQP9或GLTlDl,和其中標志物19包括NCF4或NCF2;其中項目6包括標志物20、標志物21、標志物22、標志物23、標志物24、標志物25和標志物26,其中標志物20包括CASP5或H3F3B,其中標志物21包括IL18RAP或TXN,其中標志物22包括TNFAIP6或PLAUR,其中標志物23包括IL8RB或BCL2A1,其中標志物24包括TNFRSF10C或PTAFR,其中標志物25包括KCNE3或LAMP2,和其中標志物26包括TLR4或TYROBP;以及其中項目7包括標志物27、標志物28、標志物29和標志物30,其中標志物27包括SLAMF7或CX3CR1,其中標志物28包括KLRC4或⑶8A,其中標志物29包括⑶3D或LCK,和其中標志物·30包括TMC8或CCT2;以及使用解釋函數從所述數據集確定評分,其中所述評分預測受試者的CAD。76.一種用于預測受試者的CAD的試劑盒,包括一組試劑,包括用于從所述受試者獲得的樣品測定選自項目I、項目2、項目3、項目4、項目5、項目6和項目7的標志物組中的至少一個標志物組的定量表達數據的多個試劑;其中項I包括標志物I、標志物2和標志物3,其中標志物I包括AF161365,其中標志物2包括HNRPF或ACBD5,和其中標志物3包括TFCP2或DDX18;其中項目2包括標志物4、標志物5和標志物6,其中標志物4包括AF289562或⑶248,其中標志物5包括HNRPF或ACBD5,和其中標志物6包括TFCP2或DDX18;其中項目3包括標志物7、標志物8、標志物9和標志物10,其中標志物7包括⑶79B或⑶19,其中標志物8包括SPIB或BLK,其中標志物9包括⑶3D或LCK,和其中標志物10包括TMC8或CCT2;其中項目4包括標志物11、標志物12、標志物13和標志物14,其中標志物11包括S100A12或MMP9,其中標志物12包括CLEC4E或AL0X5AP,其中標志物13包括S100A8或NAMPT,和其中標志物14包括RPL28或SSRPl;其中項目5包括標志物15、標志物16、標志物17、標志物18和標志物19,其中標志物15包括S100A12或MMP9,其中標志物16包括CLEC4E或AL0X5AP,其中標志物17包括S100A8或NAMPT,其中標志物18包括AQP9或GLTlDl,和其中標志物19包括NCF4或NCF2;其中項目6包括標志物20、標志物21、標志物22、標志物23、標志物24、標志物25和標志物26,其中標志物20包括CASP5或H3F3B,其中標志物21包括IL18RAP或TXN,其中標志物22包括TNFAIP6或PLAUR,其中標志物23包括IL8RB或BCL2A1,其中標志物24包括TNFRSF10C或PTAFR,其中標志物25包括KCNE3或LAMP2,和其中標志物26包括TLR4或TYROBP;以及其中項目7包括標志物27、標志物28、標志物29和標志物30,其中標志物27包括SLAMF7或CX3CR1,其中標志物28包括KLRC4或⑶8A,其中標志物29包括⑶3D或LCK,和其中標志物·30包括TMC8或CCT2;以及使用所述多個試劑從所述樣品測定定量數據的說明書,其中所述說明書包括從所述數據集確定評分的說明,其中所述評分預測受試者的CAD。77.根據權利要求76所述的試劑盒,其中,所述說明書包括用于進行微陣列分析的說明。78.根據權利要求76所述的試劑盒,其中,所述說明書包括用于進行聚合酶鏈反應分析的說明。79.一種用于預測受試者的CAD的系統,所述系統包括存儲器,其用于存儲與從所述受試者獲得的樣品相關的數據集,其中所述數據集包括臨床因素和選自AF161365、HNRPF、ACBD5、TFCP2、DDX18、AF289562、CD248、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、AL0X5AP、S100A8、NAMPT、RPL28、SSRPl、AQP9、GLTlDl、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2A1、TNFRSFIOC、PTAFR、KCNE3、LAMP2、TLR4、TYROBP,SLAMF7、CX3CR1、KLRC4和CD8A中的至少兩個標志物的定量表達數據;以及與所述存儲器通訊偶聯的處理器,其使用解釋函數確定評分,其中所述評分預測受試者的CAD。80.一種存儲計算機可執行程序代碼的計算機可讀存儲介質,所述程序代碼包括用于存儲與從所述受試者獲得的樣品相關的數據集的程序代碼,其中所述數據集包括臨床因素和選自AF161365、HNRPF、ACBD5、TFCP2、DDX18、AF289562、CD248、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、AL0X5AP、S100A8、NAMPT、RPL28、SSRPl、AQP9、GLTlDl、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2A1、TNFRSF10C、PTAFR、KCNE3、LAMP2、TLR4、TYROBP,SLAMF7、CX3CR1、KLRC4和CD8A中的至少兩個標志物的定量表達數據;以及使用解釋函數確定評分的程序代碼,其中所述評分預測受試者的CAD。81.一種用于預測受試者的CAD的方法,包括從所述受試者獲得樣品,其中所述樣品包括多個分析物;將所述樣品與試劑接觸;產生所述試劑與所述多個分析物的多個復合物;檢測該多個復合物以獲得與所述樣品相關的數據集,其中所述數據集包括臨床因素和選自AF161365、HNRPF、ACBD5、TFCP2、DDX18、AF289562、CD248、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、AL0X5AP、S100A8、NAMPT、RPL28、SSRPl、AQP9、GLTlDl、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2A1、TNFRSF10C,PTAFR、KCNE3、LAMP2、TLR4、TYROBP、SLAMF7、CX3CR1、KLRC4和CD8A中的至少兩個標志物的定量表達數據;以及使用解釋函數從所述數據集確定評分,其中所述評分預測受試者的CAD。82.一種用于預測受試者的CAD的試劑盒,包括一組試劑,包括用于從所述受試者獲得的樣品測定選自下組中至少兩個標志物的定量表達數據的多個試劑AF161365、HNRPF,ACBD5、TFCP2、DDX18、AF289562、CD248、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、AL0X5AP、S100A8、NAMPT、RPL28、SSRPl、AQP9、GLTlDl、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2A1、TNFRSF10C,PTAFR、KCNE3、LAMP2、TLR4、TYROBP,SLAMF7、CX3CR1、KLRC4和⑶8A;以及使用所述多個試劑從所述樣品測定定量數據的說明書,其中所述說明書包括從所述數據集和臨床因素確定評分的說明,其中所述評分預測受試者的CAD。全文摘要本發明提供用于評估受試者冠狀動脈疾病的標志物和方法,以及用于測量它們表達的試劑盒。本發明還提供基于所述標志物的預測模型,以及計算機系統和給樣品評分和任選分類的模型的軟件實施方式。文檔編號G01N33/00GK102803951SQ201080036171公開日2012年11月28日申請日期2010年6月15日優先權日2009年6月15日發明者S·羅森伯格,M·R·埃拉肖夫,P·貝尼克,J·A·文羅弗,W·G·汀利,S·E·達內爾斯申請人:心臟Dx公司