專利名稱:醫學分析系統的制作方法
技術領域:
本發明涉及一種醫學分析系統。特別地,本發明涉及對應的方法和對應的計算機
程序產品。
背景技術:
乳腺癌是由多個分子改變的積累驅動的復雜遺傳性疾病。最近的在高通量基因 組、轉錄組學和表觀基因組技術方面的分子進展已經使得能夠集中于乳腺癌的分子復雜性 并且幫助指導癌癥預測和治療預測。Perou等人證實乳腺癌可以基于它們的基因表達譜分類成不同的組。雌激素 受體陽性(ER+)組的特征在于典型地由乳腺腔上皮細胞表達的一組基因的較高表達 (‘luminal,癌癥)。ER分支包括三個腫瘤亞型1)過表達ERBB2 (HER2) ;2)表達乳腺基底 細胞特征性的基因(基底樣癌癥);和幻正常樣樣品。臨床重要性是ER+腫瘤典型地顯示 良好的預后和基底樣和HER2腫瘤具有差的預后。基因表達譜化也導致兩種基因表達分析-Oncotype Dx和MammaPrint-的發展,其 對于早期淋巴結陰性乳腺癌決定患者乳腺癌復發的風險。Oncotype Dx分析21個基因的表 達并且計算復發分數以確定患者癌癥復發的可能性和他們從化療可能得到的益處的評估。 MammaPrint分析70個基因的表達并且允許將具有早期乳腺癌的患者(<61歲)分類為具 有高或低遠處轉移風險。高風險患者然后可以用更攻擊性的治療進行管理。很多其它分子譜化(molecular profiling)技術被用于解決類似的臨床問題。代 表性寡聚核苷酸微陣列分析(ROMA)檢測基因組增殖和刪除并且已經使得能夠檢測某些拷 貝數變異圖案(copy number variation patterns)并測量它們與患者存活的相關性。在癌癥診斷例如乳腺癌和局部化的癌癥的初步治療之后,醫生具有很多治療選 擇。如何能夠做出“正確的”治療決定?傳統地,診斷成像通過表征腫瘤的位置、形態和擴 散在癌癥治療選擇中發揮了關鍵作用。癌癥與DNA內的變化及其調控潛力相關,患者腫瘤 細胞分子譜的特定特征能夠將臨床醫生引導到“正確的”治療。今天,分子測試基于單基因測試如前述ER、PR和HER2基因表達分類患者。但是, 對于使用DNA甲基化和基因表達的改進的測試,在具有類似臨床分類和范圍的腫瘤內仍然 存在顯著的治療響應變化。DNA甲基化影響基因調節而沒有遺傳密碼的改變。異常的DNA 甲基化譜與疾病如癌癥相關。基因表達譜化在整個基因組的水平評價基因活性。數個小團體和大公司在分子治療規劃領域努力,例如Agendia (MammaPrint 是預 后測試)和Genomic Health (Oncoype Dx)。這些公司的目標領域是對于乳腺癌患者的子 集,化療的患者分層(例如具有淋巴結陰性、ER陽性腫瘤的患者)。此外,是Adjuvant !,其 致力于使用臨床因素例如年齡、腫瘤大小、節狀況、等級而提供決策支持和治療規劃服務。但是,分子分類的進一步細化(refinement)能夠導致不一致的臨床意義。因此, 存在對分子譜化方案的臨床需要,其中該方案將提供改進的診斷、預后、響應預測以提供正 確的化療,以及后續措施(follow-up)來監控癌癥復發。
因此,改進的醫療決策工具或系統將是有利的,并且特別地更有效和/或可靠的 系統將是有利的
發明內容
因此,本發明優選尋求單獨地或以任何組合減輕、緩解或消除一個或多個上面提 到的缺點。特別地,作為本發明的一個目標,可以看到提供一種醫學分析系統,該系統解決 了上面提到的現有技術中存在的問題,以快速和/或可靠的方式為一名或多名患者找出合 適治療。因此,本發明的一個目標涉及患者的有效診斷和在治療規劃中輔助臨床醫生。特 別地,本發明的一個目標是提供一種醫學分析系統,該系統在實現該目標和其它目標時解 決了上面提到的現有技術中存在的問題。因此,本發明的第一方面涉及用于對從至少一名患者獲得的數據進行臨床前 (pre-clinical)和/或臨床分析的醫學分析系統,該系統包括內部數據庫(IDB),該數據庫包括數據、分析結果、流程定義(flow definitions) 和工具定義(tool definitions)的集合,以及用于利用數據庫倉庫(database repository)的工具的其他相關數據,數據庫訪問單元(database access unit,DA),該單元適于提供對所述內部數據 庫的訪問,流程定義單元(flow definition unit,FD),該單元提供可配置分析流程 (configurable flow of analysis)的執行以及多個數據模態(data modalities)的可視 化,所述多個數據模態包括第一生物分子模態,包括與所述患者有關的生物分子數據,和第二臨床模態,包括與所述患者有關的臨床數據,工具執行引擎(TEE),具有所述系統的界面,以配置和啟動(instantiate)工作于 一個或多個所述數據模態的一個或多個工具,工具倉庫(tool r印ository),該倉庫包括所述系統被配置來執行的工具的集合, 所述工具遵守一組規則以便使其能在圖形用戶界面(GUI)中可視化它們的執行,一個或多個相關聯的外部數據庫(EDB),所述一個或多個外部數據庫代表存儲在 所述系統本身中的數據或存儲在不同于所述內部數據庫(IDB)的數據庫中的數據,和圖形用戶界面(GUI),所述界面同時可視化數據、分析結果、和一個或多個工具執 行的結果,并且其中所述界面進一步適于同時可視化1)所述第一生物分子模態的結果,和2)所述第二臨床模態的結果。本發明特別地,但并非排他地,有利于獲得用于設計個人化治療的多模態方法 (multimodal approach) 0因此,本發明推動了完全集成的基因組設計和分析工具箱,其使 得能夠訪問關于患者的臨床信息以及有關的分子信息(例如,基因表達以及差異化DNA甲 基化)。此外,本發明推動了多種機器學習工具(machine learningtools)的集成,所述機 器學習工具專用于a)基因表達譜化,b)DNA甲基化譜化,c)組合臨床參數與分子水平信息,d)組合臨床、生物學知識和分子數據,和/或d)通過統計工具集成分子模態。本發明允許可配置的生物信息工具執行流程,便于使用先進方式分析多個模態的 數據和瀏覽來自印鑒發現(signature-discovery)方法的數據和結果。其向新的和現有的 工具的(動態組)提供精簡接口(lightweight interface)并使它們能夠在改變很少或不 改變的情況下執行。該方案的優點在于分析過程的快速實行和執行,并且容易將方法和結果傳達給臨 床醫生和其他感興趣方。根據第一方面的系統可應用在處于臨床前情形的至少一個患者。一個優點是關于 所述患者的數據和信息可被所述系統使用來發現生物分子印鑒。這樣做的另一個優點是所 述系統可在系統中集成所述患者的數據以擴展可用數據。根據第一方面的系統還可被應用于一組患者。根據第一方面的系統可應用于處于臨床情形的一個患者。因此,所述系統使得醫 師能夠鑒別出患者數據中的任何生物分子/臨床印鑒,從而輔助對患者的診斷和進一步的 治療。按照前述內容,根據第一方面的系統還可以作為臨床決策支持系統(CDS)。根據第一方面的系統還可被配置為使得所述第一生物分子模態和所述第二臨床 模態是可通過機器學習算法集成的,所述集成的結果在所述圖形用戶界面中是可視化的。 這種設置的主要優點是其使得能夠在非常大和復雜的數據收集中發現復雜的生物分子印鑒。進一步地,根據第一方面的系統還可被配置成使得所述第一生物分子模態和所述 第二臨床模態是可通過統計算法集成的,所述集成的結果在所述圖形用戶界面中是可視化 的。根據第一方面的系統還可被配置為使得所述第一生物分子模態和所述第二臨床 模態是基于它們各自的基因組注釋(genomic annotation)可集成的,所述集成的結果在所 述圖形用戶界面中是可視化的。在一個另外的實施方式中,根據第一方面的系統可被配置為使得所述第一生物分 子模態是基于高通量數據采樣模態的。所述系統因此使得能夠在包括其他模態數據的環境 中分析高通量的數據。根據第一方面的系統可被配置為使得由所述高通量數據采樣模態提供的樣本包 括關于至少100. 000個參數/物種(species)的數據。根據第一方面的系統還可被配置為使得所述第一生物分子模態選自于由高通量 基因表達譜化、DNA甲基化狀態譜化、比較基因組雜交分析所組成的組。這些模態生成大且 復雜的數據集,其可被應用于所述系統并用來鑒別所述模態的生物分子印鑒。在根據第一方面的系統的一個特定版本中,所述流程定義單元(FD)包括至少一 個另外的生物分子模態。該版本的系統集成了更多的生物分子模態。在根據第一方面的系統的一個另外的版本中,所述另外的生物分子模態選自于由 高通量基因表達譜化、DNA甲基化狀態譜化、比較基因組雜交分析、和SNP譜所組成的組。在根據第一方面的系統中,所述患者可具有臨床病癥(clinical condition),選 自于由癌癥、心血管疾病、代謝性疾病、胃腸疾病、神經系統疾病所組成的組。該系統的一個優點是其使得能夠使用所述系統來發現與具體病癥相關的生物分子和臨床印鑒,以及接著 將所述系統和印鑒應用于臨床設定中。在第二方面中,本發明涉及用于發現與具體臨床病癥相關的生物分子或臨床印鑒 的方法,包括使用根據本發明第一方面的醫學分析系統。本發明特別地,但并非排他地,有利于用于發現與臨床病癥有關的生物分子或臨 床印鑒,所述臨床病癥選自于由癌癥、心血管疾病、代謝性疾病、胃腸疾病、神經系統疾病所 組成的組。更特別地,但并非排他地,有利的是本方法可以發現與乳腺癌或結腸癌有關的生 物分子或臨床印鑒。已知乳腺癌和結腸癌與異常的基因表達譜/DNA甲基化譜相關聯。進一步地,根據第二方面的方法可以用于發現印鑒,所述印鑒選自于由基因表達 印鑒、DNA甲基化狀態印鑒、比較基因組雜交印鑒、和SNP印鑒所組成的組。這些模態典型 地生成大量數據,其需要高容量系統來顯示任何生物分子存在。在第三方面,本發明涉及用于臨床決策支持的方法,包括使用根據本發明第一方 面的醫學分析系統。本發明還提供了,患者數據被應用于所述系統用于鑒別與臨床病癥相關的生物分 子或臨床印鑒。該實施方式的優點是所述生物分子/臨床印鑒的應用可被用來指示患者是 否可能患上與所述印鑒相關的臨床病癥。在第四方面,本發明涉及計算機程序產品,該計算機程序產品適于使得計算機系 統能夠控制根據本發明第二方面的分析方法,其中所述計算機系統包括至少一部具有與之 相關的數據存儲裝置的計算機。本發明的這一方面是特別地,但并非排他地,有利的,因為本發明可通過使得計算 機系統能夠實施本發明第二方面操作的計算機程序產品來實現。因此,設想的是一些已知 的醫學分析系統可通過在控制所述醫學分析系統的計算機系統上安裝計算機程序產品而 變成根據本發明運行。這種計算機程序產品可以在任何種類的計算機可讀介質上提供,例 如,基于磁或光的介質,或是通過基于計算機的網絡,如互聯網提供。本發明的第一、第二、第三和第四方面每個都可以與任何其他方面進行組合。本發 明的這些及其他方面從后面描述的實施方案將來看將是顯而易見的并且將參照后面描述 的實施方式進行闡釋。
本發明現在將參考附圖,僅以實施例的方式進行解釋說明,其中圖1顯示出所述系統的體系結構。圖2顯示出數據訪問、分析、和臨床決策的概念性流程方案(conceptual flow scenario)。圖3顯示出所述系統關于分析環境(analysis context)和視覺顯示的狀態。圖4顯示出本發明系統的主屏幕的一個實例。圖5顯示出從數據庫下載患者信息的一個實例。圖6顯示出與組織病理模態(histopathological modahty)有關的屏幕的一個實 例。
圖7顯示出與比較基因組雜交(CGH)模態有關的屏幕的一個實例。圖8顯示出與基因表達模態有關的屏幕的一個實例。圖9顯示出與DNA甲基化模態有關的屏幕的一個實例。圖10顯示出與兩組基因表達印鑒探察有關的屏幕的一個實例,一個只使用基因 表達數據,而另一個使用基因表達數據連同DNA甲基化數據。圖11顯示出用于基因表達印鑒的特征瀏覽器的一個實例。圖12顯示出用于基因表達印鑒的基因卡(Genecard)鏈接的一個實例。圖13顯示出與DNA甲基化印鑒探察有關的屏幕的一個實例。圖14顯示出用于DNA甲基化標志的特征瀏覽器的一個實例。圖15顯示出用于甲基化印鑒的臨床決策支持(⑶S)屏幕的一個實例。圖16顯示出與遺傳算法概括工具(genetic algorithm summary tool)有關的屏 幕的一個實例。圖17顯示出與兩個遺傳算法概括工具輸出壓縮有關的拆分屏幕的一個實例。圖18顯示出與基因同時出現(co-occurrence)工具有關的屏幕的一個實例。圖19顯示出與甲基結合位點工具有關的屏幕的一個實例。圖20顯示出與從上到下分級分選(top down hierarchical sorting,TDHS)有關 的屏幕的一個實例。圖21顯示出與基因表達過濾工具有關的屏幕的一個實例。圖22顯示出與多模態相關特征分析一圖形輸出有關的屏幕的一個實例。圖23和M顯示出與多模態相關特征分析一文本輸出有關的屏幕的一個實例。圖25顯示出用于基因表達的⑶S屏幕的一個實例。圖沈顯示出基于遺傳算法(GA)工具的四種可能的輸出,該工具被設計為自動演 化(evolve)最佳預測樣品的基礎真實印鑒標記化(ground truth labeling)的特征子集。圖27顯示出發現的所有候選特征子集與在后處理分析中發現有意義的特征子集 的性能值的比較。圖觀顯示出可視化多個特征的基因表達印鑒的特征瀏覽器的一個實例。圖四顯示出描述產生基因印鑒元數據(meta-data)可視化方法的流程圖。圖30顯示出呈現基因印鑒元數據分布的一個實例。圖31顯示出從上到下分級分選(TDHS)的一個實例。圖32顯示出基因表達和DNA甲基化數據的相關性的一個實例。現在,本發明將在接下來進行更加詳細地介紹。
具體實施例方式特別是在現今的癌癥護理中,存在著對基于分子生物信息學的翻譯臨床工具 (translational clinical tools)的需求。發明人利用本發明公開了一種用于臨床決策的 工具,使得臨床決策依賴于基因組和表觀基因組測量模態以及臨床參數例如組織病理學結 果和存活信息。本發明的一個目標是促進發現臨床病癥的分子譜并使得它們能夠用于臨床設定 中。本發明描述了新技術以從組織樣品獲得基因組信息并輔助診斷、決定適當療法、及后續措施。^BJAWPhysician Accessible Preclinical Analytics Application(PAPAyA) 集成了強大的統計和機器學習工具組,其可以對不同模態間的連接起到杠桿作用。所述 系統可容易地擴展和重新配置以支持將已有研究方法和工具集成在強大數據分析流水線 中。PAPAyA使得能夠對來自臨床研究的數據進行分析,設計新的臨床假設,并且通過為臨 床醫生提煉分子譜而有助于臨床決策支持。帶有其關于乳腺癌分子譜的表現的實例的當前 PAPAyA配置被用于呈現工作中的所述系統。發明人提出一種用于設計個人化療法的多模態分子方法。特別地,所述方法聚焦 于腫瘤亞型化并且鑒別將最有可能響應化療(如Here印tin)的患者亞群,產生預言性的診 斷測試。發明人提供了一種基因組設計和分析工具箱的原型,其改進表征乳房和卵巢癌癥 患者活組織檢查樣本的分子譜的臨床前發現。發明人還提供了來自決策分析工具組的結 果,其有助于患者分層并預測治療響應。本發明的系統提供了一種可配置平臺,其使得能夠基于高通量分子測量對臨床研 究結果進行分析和詮釋。本發明的系統組合了生物信息學軟件方法,以用于翻譯研究、臨床 前,并部分用于臨床應用。本發明的系統覆蓋以下方面一多模態的集成分析以推斷關于最重要的基因/位點(loci)的關聯信息,其可能 有助于結果和患者狀態(并將被用于治療應答)。除了臨床參數,如組織等級、結(node)、 ERA3R狀態和結果外,發明人還提供了加入來自基因表達和DNA甲基化的患者信息。一組合各種機器學習工具來分析該數據(在文獻中對這些工具的介紹之外)一使用這種集成的分析用于診斷、預后、治療應答、及后續措施。發明人提供了來自決策分析工具組的結果,以瀏覽患者信息和基因印鑒,并單獨 地分析基因表達譜以及差異化的DNA甲基化譜,并基于相關性和同時出現做出推論。這些 工具依賴于高通量基因表達譜化以及基于患者信息比如腫瘤尺寸、激素和組織病理參數的 其他臨床預測和預后指數。發明人使用基因組設計和分析工具箱(Genomic Design and Analysis Toolbox, GDAT),稱為Papaya,提供了這些工具和結果,其包含幫助乳腺癌和卵巢癌階段臨床前發現 的方法。具體地,這些工具包括特征子集選擇、分類、聚類(clustering)方法和從上到下分 級分選以及決策分析,加入關于蛋白質-DNA相互作用、臨床預后指數、DNA甲基化和基因表 達譜化數據的生物學知識。我們呈現來自杠桿化多個分子模態,例如高通量基因表達譜化 和DNA甲基化譜化的GDAT的結果,從而進一步改進診斷。本發明的系統通過組合所發現的分子印鑒和成像及額外的臨床信息提供了全面 的視角。此外,所述系統可被用作形成診斷、選擇治療方向(例如,激素或化療)并適當地 監視疾病的發展和后續情況中的輔助工具。所述系統還可用于提供分子信息包(例如,組 合的分子印鑒和對應的元數據),作為對臨床醫生或第三方決策支持系統的服務。另外,所 述系統可被用于開發和提供分子一藥物一增強的臨床指南,其可根據患者的分子譜進行定 制。高通量基因組數據分析的一些挑戰在于與克服高測量和生物噪聲,大量的特征 和有限的患者樣本。本發明提供利用多個分子模態和臨床信息的統計學上嚴密的方法,這可能消除許多偽信號(spurious signals),因此我們可以聚焦于疾病的根本生物學 (underlying biology)。將更多傳統臨床結果預測因子與從腫瘤本身得到的分子信息(例如,甲基化和基 因表達)融合被認為是有用的,但是學習如何詮釋概率信息并將結果與醫師和患者交流是 一個主要挑戰。本發明提供了該問題的解決方案。本系統可輔助個人化醫學在臨床中的應用。存在著對將患者的臨床、組織病理、和分子譜考慮在內的集成決策支持系統的清 晰臨床需求。這樣的系統將提供一站式解決方案,來幫助腫瘤會診委員會(tumor board) (放射科醫師、病理醫師、外科醫生、放射治療醫師和腫瘤醫師)做出有足夠信息的決策。上面的介紹主要是用于臨床研究的臨床前實施方式。在另一實施方式中,本發明 可以像臨床應用那樣類似地使用。系統本系統的結構體系具有以下組件,還可參照圖IA ;⑶I 圖形用戶界面組合了同步顯示數據、分析結果、以及工具執行結果的組件。數據訪問(DA)提供對研究信息、測量、和分析結果的數據庫的訪問。流程定義(FD)提供基因組數據分析和臨床/分子數據瀏覽步驟的可配置流程的 執行。工具執行引擎(TEE)提供應用界面,以無縫配置和啟動來自各種平臺的工具。這 允許應用擴展,新工具容易地無需改動或改動很少增加到所述配置和流程中。內部數據庫(IDB)研究數據、分析結果、流程和工具定義的集合,以及用于利用 數據庫倉庫的外部工具的任何其他數據。工具“倉庫” (TR)本申請被配置來執行的工具的集合。這些工具服從基礎規則組 以便可以可視化它們的執行。外部數據庫(EDB)外部工具使用的所有數據及其他文件的集合,存儲在文件系 統的某些位置,或存儲在不同于IDB的數據庫中。本發明系統的輕微改動的結構體系在圖IB中示出,其中圖IA的流程定義(FD) 和數據訪問(DA)被組合到圖IB的流程控制中。類似地,通用用戶界面(general user interface,⑶I)被細分成圖IB中所示的用戶界面、顯示和操作模塊。如圖IB中所示,下 方的結構也被小小地改動,其中數據庫管理系統與模塊“工具”和“外部數據”一起示出。因此,本發明的一個方面涉及用于對從至少一名患者獲得的數據進行臨床前和/ 或臨床分析的醫學分析系統,該系統包括內部數據庫(IDB),該數據庫包括數據、分析結果、流程定義和工具定義的集合,以 及用于利用數據庫倉庫的工具的其他相關數據,數據庫訪問單元(DA),該單元適于提供對所述內部數據庫的訪問,流程定義單元(FD),該單元提供可配置分析流程的執行以及多個數據模態的可視 化,所述多個數據模態包括第一生物分子模態,包括與所述患者有關的生物分子數據,和第二臨床模態,包括與所述患者有關的臨床數據,工具執行引擎(TEE),具有所述系統的界面,以配置和啟動工作于一個或多個所述數據模態的一個或多個工具,工具倉庫,該倉庫包括所述系統被配置來執行的工具的集合,所述工具遵守一組 規則以便使其能在圖形用戶界面(GUI)中可視化它們的執行,一個或多個相關聯的外部數據庫(EDB),所述一個或多個外部數據庫代表存儲在 所述系統本身中的數據或存儲在不同于所述內部數據庫(IDB)的數據庫中的數據,和圖形用戶界面(GUI),所述界面同時可視化數據、分析結果、和一個或多個工具執 行的結果,并且其中所述界面進一步適于同時可視化1)所述第一生物分子模態的結果,和2)所述第二臨床模態的結果。在一個實施方式中,該醫學分析系統被應用于至少一個在臨床前情形 (pre-clinical situation)中的患者。在另一個實施方式中,該醫學分析系統被應用于一 組患者。在又一個實施方式中,該醫學分析系統在臨床情形中被應用于一個患者。在又一 個實施方式中,該醫學分析系統起臨床決策支持系統(CDS)的作用。在所述臨床前情形中,患者數據可被應用于所述系統以擴展數據和/或用于鑒別 與癌癥、心血管疾病、代謝性疾病、胃腸疾病、或神經系統疾病范圍中的臨床病癥相關的生 物分子或臨床印鑒。在本發明的一個實施方式中,本發明的系統是作為輔助個人化療法設計的多模態方法。所述系統提供一完全集成的基因組設計和分析工具箱,其使得能夠訪問關于患者的臨床信息以 及關聯的分子信息(例如,基因表達以及差異性DNA甲基化)一多種機器學習工具的集成,所述機器學習工具專用于a)基因表達譜化,b)DNA 甲基化譜化,c)組合臨床參數與分子水平信息,d)組合臨床、生物學知識和分子數據,d)通 過統計工具集成分子模態本發明允許生物信息工具的可配置執行流程,便于以先進方式來瀏覽數據和來自 印鑒發現過程的結果。其向現有工具(的動態組)提供了精簡接口并使它們能夠改變很少或不改變而被 執行。該方案的優點在于分析過程的快速實行和執行,并且容易將方法和結果傳達給臨 床醫生和其他感興趣方。模態在本發明的一個實施方式中,根據在前權利要求任一項所述的醫學分析系統,其 中所述第一生物分子模態和所述第二臨床模態是可通過機器學習算法集成的,所述集成的 結果在圖形用戶界面中是可視化的。在本發明的第二實施方式中,根據在前權利要求任一項所述的醫學分析系統,其 中所述第一生物分子模態和所述第二臨床模態是可通過統計算法集成的,所述集成的結果 在圖形用戶界面中是可視化的。在本發明的第三實施方式中,根據在前權利要求任一項所述的醫學分析系統,其 中所述第一生物分子模態是基于高通量數據采樣模態的。
11
在本發明情況下高通量分析指的是解決生物或臨床問題的生物數據的大規模分 析,在提交本申請的時候使用傳統方法是難以實現的。高通量進一步由生成分析數據的模 態限定。高通量基因表達分析典型地涉及對表達譜的分析,包括每個樣本數千表達產物的 數據。來自單個微陣列實驗的基因表達數據可追蹤數量范圍從幾千到幾十萬的基因在幾百 種刺激下的活動。高通量DNA甲基化狀態譜化(比如高通量差異性甲基化雜交(DMH)微陣列或MOMA 微陣列)包括每樣本100,000個CpG位點/島(sites/islands)的數據。質譜蛋白質組學典型地涉及在測量裝置(measurement setup)中同時測量蛋白質 肽的100,000個質荷比(m/z)值,其包括一個或多個質譜儀和額外的步驟以聚焦生物樣本 中的一種特定蛋白質子集。因此,在一個實施方式中,高通量被定義為在單個測量(例如,在微陣列上)中從 100, 000到幾百萬范圍的這種測試。具體地,基因表達數據典型地測量10,000個基因表達 譜,DNA甲基化測量CpG島中100,000個碎片的甲基化狀態,質譜蛋白質組學典型地測量 100,000 個 m/z 值。在另一實施方式中,高通量指的是適用于所有模態的區分水平,將是它們的使得 數百萬生化、遺傳、或藥理測試能夠快速同步執行的性能。在一個實施方式中,由所述高通量數據采樣模態所提供的樣本包括關于至少 100. 000個參數/物種的數據。本發明的系統使得能夠集成寬范圍的模態,包括但不限于高通量模態。在一個實施方式中,所述第一生物分子模態選自于由高通量基因表達譜化、DNA甲 基化狀態譜化、比較基因組雜交分析、質譜蛋白質組學、單核苷酸多態性(SNP)及其他全基 因組測序模態所組成的組。在另一實施方式中,第一生物分子模態選自于由組織學模態,比如免疫組織學、 ELISA、酶活性、PCR如Q-PCR、RT-PCR所組成的組。在一個實施方式中,第二臨床模態包括與患者有關的臨床數據,涉及的數據比如 是年齡、性別、來自患者體檢的信息以及其他由臨床醫生收集的信息(例如,來自詢問患者 的數據)。除了第一生物分子模態,所述系統使得能夠集成多個生物分子模態。因此,在一個 另外的實施方式中,流程定義單元(FD)包括至少一個另外的生物分子模態。所述額外的一個或多個生物分子模態或模態組可以是本文描述的任意生物分子 模態。因此,在一個實施方式中,所述另外的生物分子模態選自于由高通量基因表達譜化、 DNA甲基化狀態譜化、比較基因組雜交分析、和SNP譜所組成的組。在一個另外的實施方式中,第一生物分子模態和所述第二臨床模態的集成是基于 它們各自的基因組注釋可集成的,其中所述集成的結果在圖形用戶界面中是可視化的。所 述基因組注釋可以是基因名稱、功能、通路信息、Gene Onto 1 ogy。系統中的流程、狀態和處理圖2提供了一種非限定性的概念性流程方案。為了實施該系統,在本實施方式中 定義出五種屏幕類型
患者屏幕目的論證驗證患者(樣本)如何與印鑒數據庫匹配。數據樣本(包括甲基化/表達譜、和既往病史、臨床指數)、印鑒。工具與印鑒匹配,有關的(匹配的)印鑒的概括。控制下載患者;擴展印鑒;選擇印鑒概括(例如,基因等級、通路、……);決策支持。印鑒屏幕目的示出印鑒的內容和性能(任選地在樣品或一組印鑒的環境中)數據印鑒(一組或多組基因/位點)、注釋(到額外資源的鏈接,如NCBI)。工具匹配、有關的(匹配的)印鑒的概括(統計數據概括)。控制導航到“分析”或導航到分析中的早期步驟,改變視圖從而強調或去掉視覺 元素(或甚至完全地改變視圖一例如,從順序的基因列表到熱圖)。工具1對工具2屏幕目的提供同時顯示2個工具輸出的方式,為對比目的和多模態數據集成具有從 工具1 “驅動”工具2的選項。數據任何數據一取決于工具工具任意工具。實施例1)工具1 =分級聚類vs.工具2 =從上到下的分級分選。實施例2)關 于基因表達數據的工具Ivs.關于甲基化數據的工具1。控制提供參數并驅動工具2。導航返回被調用的地方。工具屏幕目的在預定義的環境信息(例如,當前樣品、當前印鑒、當前來自其他工具的輸 出)內執行工具數據任何數據一取決于工具工具任意工具。控制基礎(Rudimentary)參數輸入。應使用默認參數,并且如果需要的話可以在 扉頁(fly)上改變。為后續工具調用取得一些流程環境并更新環境。導航返回被調用的地 方。導航到類似工具。導航到在線路中位于其前方的工具。CDS 屏幕目的可視化關于如何可以將患者樣本匹配結果翻譯成CDS類輸出的一種或多種
相法ο數據基于分析和注釋的數據(Sata)工具無。僅給出信息。例如,臨床指數、療程規劃控制一些數據可含有到外部資源的超鏈接(例如PubMed出版物、通路信息)。導 航返回被調用的地方。在本發明的一個實施方式中,所述流程是使用狀態和可能的轉換(動作)定義的, 如圖3中的實例中那樣。每個狀態還具有與之相關聯的屏幕類型。為了實施允許的轉換, 在該實施方式中我們具體規定一來源狀態轉換起源的狀態
一到達狀態得到的狀態一介紹動作的自定義文本(free-text description)介紹一動作類型工具調用(將調用外部工具);常規(將執行內部定義的動作);按 鈕(將從屏幕上提供的按鈕調用外部工具)一工具如果可用的話,是對要調用的工具的介紹的指示器。一現有限制(constraint)需要通過先前的動作設置或解除記號(flag)以便允 許該動作發生。一設置限制該動作將設置的記號。一解除限制該動作將解除的記號。應用從初始狀態開始。一旦輸入狀態,所述應用查詢轉換表并基于輸入的狀態以 及系統中的設置和解除的限制編譯所有可能的轉換的子集。流程定義單元使用該規范在用 戶瀏覽數據和工具時維持系統的狀態。以下的數據結構定義了流程、鏈接到所述流程的工具以及其參數流程定義
。-。…,.、‘‘state_from當前狀態Type工具執行操作;內部轉換;...Description自定義文本介紹Action工具名(previous slide);初始化;內部動作constraint—e用戶定義的變量,其可以被^置成定義限制。例如甲基化模態活 性vs. ■ 模態活性;分析模式vs.決策支持模式;等constraint—sconstraintustate—to下一狀態 工具定義
權利要求
1.用于對從至少一名患者獲得的數據進行臨床前和/或臨床分析的醫學分析系統,該 系統包括內部數據庫(IDB),該數據庫包括數據、分析結果、流程定義和工具定義的集合,以及用 于利用數據庫倉庫的工具的其他相關數據,數據庫訪問單元(DA),該單元適于提供對所述內部數據庫的訪問, 流程定義單元(FD),該單元提供可配置分析流程的執行以及多個數據模態的可視化, 所述多個數據模態包括第一生物分子模態,包括與所述患者有關的生物分子數據,和 第二臨床模態,包括與所述患者有關的臨床數據,工具執行引擎(TEE),具有所述系統的界面,以配置和啟動工作于一個或多個所述數據 模態的一個或多個工具,工具倉庫,該倉庫包括所述系統被配置來執行的工具的集合,所述工具遵守一組規則 以便使其能在圖形用戶界面(GUI)中可視化它們的執行,一個或多個相關聯的外部數據庫(EDB),所述一個或多個外部數據庫代表存儲在所述 系統本身中的數據或存儲在不同于所述內部數據庫(IDB)的數據庫中的數據,和圖形用戶界面(GUI),所述界面同時可視化數據、分析結果、和一個或多個工具執行的 結果,并且其中所述界面進一步適于同時可視化1)所述第一生物分子模態的結果,和2)所述第二臨床模態的結果。
2.根據權利要求1所述的醫學分析系統,其中所述的醫學分析系統被應用于至少一名 處于臨床前情形的患者。
3.根據權利要求1所述的醫學分析系統,其中所述的分析系統被應用于一組患者。
4.根據權利要求1所述的醫學分析系統,其中所述的分析系統被應用于一名處在臨床 情形的患者。
5.根據權利要求1所述的醫學分析系統,其中所述的醫學分析系統作為臨床決策支持 系統(⑶S)起作用。
6.根據權利要求1所述的醫學分析系統,其中所述第一生物分子模態和所述第二臨 床模態是能夠通過機器學習算法集成的,所述集成的結果能夠在所述圖形用戶界面中可視 化。
7.根據權利要求1所述的醫學分析系統,其中所述第一生物分子模態和所述第二臨床 模態是能夠通過統計算法集成的,所述集成的結果能夠在所述圖形用戶界面中可視化。
8.根據權利要求1所述的醫學分析系統,其中所述第一生物分子模態和所述第二臨床 模態是能夠基于它們各自的基因組注釋集成的,所述集成的結果能夠在所述圖形用戶界面 中可視化。
9.根據權利要求1所述的醫學分析系統,其中所述第一生物分子模態基于高通量數據 采樣模態。
10.根據權利要求9所述的醫學分析系統,其中由所述高通量數據采樣模態提供的樣 本包括關于至少100.000個參數/物種的數據。
11.根據權利要求1所述的醫學分析系統,其中所述第一生物分子模態選自于由高通量基因表達譜、DNA甲基化狀態譜、比較基因組雜交分析所組成的組。
12.根據權利要求1所述的醫學分析系統,其中所述流程定義單元(FD)包括至少一個 另外的生物分子模態。
13.根據前述權利要求任一項所述的醫學分析系統,其中所述另外的生物分子模態選 自于由高通量基因表達譜、DNA甲基化狀態譜、比較基因組雜交分析、和SNP譜所組成的組。
14.根據權利要求13所述的醫學分析系統,其中所述患者具有選自癌癥、心血管疾病、 代謝性疾病、胃腸疾病、神經系統疾病的臨床病癥。
15.用于發現與具體臨床病癥相關的生物分子或臨床印鑒的方法,包括使用權利要求 1所述的醫學分析系統。
16.根據權利要求15所述的方法,其中所述臨床病癥選自于由癌癥、心血管疾病、代謝 性疾病、胃腸疾病、神經系統疾病所組成的組。
17.根據權利要求16所述的方法,其中所述癌癥是乳腺癌或結腸癌。
18.根據權利要求1所述的方法,其中所述印鑒是基因表達印鑒、DNA甲基化狀態印鑒、 比較基因組雜交印鑒和SNP印鑒。
19.用于臨床決策支持的方法,包括使用根據權利要求1所述的醫學分析系統。
20.根據權利要求19所述的方法,其中患者的數據被應用于所述系統來鑒別與臨床病 癥相關的生物分子或臨床印鑒。
21.計算機程序產品,該程序產品適于使得計算機系統能夠控制根據權利要求1所述 的醫學分析系統,其中所述計算機系統包括具有與之相關的數據存儲裝置的至少一部計算 機。
全文摘要
本發明涉及患者的有效診斷以及治療規劃中的輔助臨床醫生。特別地,本發明提供了一種使得能夠細化分子分類的醫學分析系統。所述系統提供了一種分子譜化方案,其將允許改進的診斷、預后、應答預測從而提供正確的化療,以及后續措施以監測癌癥復發。
文檔編號G06F19/00GK102084366SQ200980117341
公開日2011年6月1日 申請日期2009年5月6日 優先權日2008年5月12日
發明者A·I·D·布庫爾, A·J·賈尼夫斯基, J·J·A·范利尤文, N·巴納吉, N·迪米特羅瓦, S·卡馬拉卡蘭, V·V·瓦拉丹, Y·H·阿爾薩法迪 申請人:皇家飛利浦電子股份有限公司