專利名稱:基于蛋白質網絡的藥物靶標確定和/或藥物功能確定方法
技術領域:
本發明涉及一種新的確定藥物靶標和/或確定藥物新功能的方法,即 基于蛋白質相互作用網絡的藥物靶標確定和/或藥物功能確定方法。
背景技術:
近些年來,雖然在藥物開發中投入的經費越來越多,但每年由美國食品及藥物管理局(FDA)批準的新藥物個數一直沒有增加。不僅如此,人類基因組的全部測序也沒有像預期那樣給藥物開發帶來一個飛躍,每年只有2 3個新的基因被確定為藥物的靶標,而大多數的藥物還都是針對已有的藥物靶標基因而設計。同時,每年又都會有很多藥物因臨床上出現的各種各樣非預期的問題被回收。這種高投入,低產出的問題一直是新藥物開發中的一個難題。針對已有的知識對藥物潛在的靶標進行預測是解決這一難題的一個很好途徑。通過對藥物潛在的靶標進行定位,我們可以深入理解藥物作用的機制,預測藥物的潛在功能、 副作用等關鍵信息,并為我們研發新藥物提供幫助。以往對藥物靶標進行預測的研究主要可以分為兩類。一類是基于藥物的藥理作用或治療作用,簡稱藥物作用;另一類是基于藥物本身的化學結構特點。基于藥物作用的方法認為如果藥物具有相似的作用,那它們可能有相同的靶標,從而通過已有靶標的藥物來推斷未知靶標的藥物。基于結構的方法認為藥物如果結構類似,那么它們有可能與相似的蛋白質綁定、有相似的靶標。目前研究的局限主要在于1.以上兩種假設并不是總是成立。眾多研究已經發現,藥物可能會由于干預相同信號轉導通路(pattway)的不同功能蛋白而產生相似的作用。因而,簡單認為具有相似的作用就有相同的靶標是不完全合理的。而基于結構的預測方法也有局限,因為已知某些藥物雖然結構差異很大,但作用機理和靶標完全相似。2.以往的研究往往是將這兩種預測思路分開,而沒有同時利用藥物作用和結構信肩、ο3.更重要的是,以上研究只能在小規模上展開,而且沒有充分利用藥物靶標的相互作用等多種信息。本發明人的前期研究工作發現利用基因在生物網絡上的距離能夠有效地解釋疾病表型的相似性,在此基礎上通過建立特定的回歸模型,能夠實現在全基因組水平上對于致病基因的大規模預測,并達到了目前最高的致病基因預測精度(發章發表于mi X, Jiang R, Zhang MQ, Li S. Network-based global inferenceof human disease genes. Molecular Systems Biology 2008 ;4 :189)。本論文發表后在國際上取得了較大影響,例如Nature出版集團的四個領域選為重要文章,NatureChina作為亮點專題報道;美國醫學信息學會“轉化生物信息學(TranslationalBioinformatics) 2009峰會”將本文作為年度選評論文之一,評價本成果“基于分子數據,創建了一種新的疾病分類方法(create a new classification of diseasebased on molecular (1已七8),,,等。
以上研究積累,為我們突破當前藥物靶標研究的局限,提出并建立新的藥物靶標確定、藥物功能發現方法,奠定了很好的基礎。
發明內容
根據本發明的一個方面,提供了一種藥物靶標確定方法,其特征在于包括確定一個已知藥物集中的一個第一藥物和一個第一蛋白質之間的相互作用關系評價指標,所述評價指標綜合了所述第一藥物和所述第一蛋白質之間在藥物作用相似度的權重系數估計值和和藥物結構相似度的權重系數估計值;所述第一藥物到所述藥物集中的其他所有藥物的作用相似度的分布;所述第一藥物到所述藥物集中的其他所有藥物的結構相似度的分布;所述蛋白質到所述藥物集中的所有藥物的親近度的分布。
圖1顯示了一個ATC編碼樹狀示例的結構示意圖。圖2示意顯示了藥物-蛋白質的親近度9W。
具體實施例方式本發明人在研究中發現1.具有相似治療作用的藥物,它們在靶標上的相關性可以體現在存在同一條生物通路的基因產物、或者在蛋白質網絡(即蛋白質相互作用網絡,Protein-Protein Interaction Network,簡稱為PPI網絡)中緊密聯系的蛋白等。正是由于它們靶標在生物過程中的相關性及模塊性,導致了它們治療作用上的相似性。2.結構上相似的藥物可能會作用于具有相似4級結構的蛋白質上。而這種三維中的蛋白結構的相似性往往與其功能的相關性有直接的關系,例如在蛋白質相互作用網絡上具有緊密聯系。基于以上分析,本發明人認為,藥物治療作用的相似性(TherapeuticSimilarity, 下文簡稱為TS)以及藥物化學結構上的相似性(Chemical Similarity,下文簡稱為CS),以上二者是與藥物作用的靶標在PPI網絡中的模塊性相關的。這種“模塊性”可以體現為PPI 網絡中的緊密連接的子聚團,或者為最短距離非常接近的多個蛋白質。基于這個理解,本發明人建立了一種基于蛋白質相互作用網絡的藥物靶標預測方法,稱之為drugCIPHER。根據本發明的一個實施例的基于蛋白質網絡的藥物靶標預測方法(drugCIPHER) 包括1.提出新的衡量藥物作用相似性的方法——基于語義網絡的藥物作用相似性衡量,用于計算藥物作用相似性(TS);2.綜合藥物作用相似性、化學結構相似性,構成藥物相似性網絡,同時利用藥物靶標所構成的靶標網絡,建立藥物網絡與靶標網絡這兩層網絡關聯的回歸模型,從而利用靶標網絡的相互作用信息來解釋藥物的相似性。如果某一靶標在網絡中的相互作用信息,與藥物的相似性信息吻合的越好,那么這個靶標就越可能是這個藥物作用的靶標。本發明的藥物靶標確定方法可以對這種吻合程度進行量化(即下文公式4定義的“親近度Φ^”),從而確定藥物的靶標,如果出現親近度很高的靶標,而這個靶標目前并沒有報道,則成為藥物的新靶標。3.利用藥物靶標所組成的特征向量的相似性,發現藥物的新功能或副作用。按照該方法,發明人對7 種藥物組成的一個藥物集中的所有藥物靶標進行了預測。同時,發明人發現將藥物作用信息和自身的化學結構信息結合起來能夠起到更好的效果,并能夠預測出藥物的新功能和副作用。本方法適用于藥物靶標預測、藥物新功能發現、 組合藥物發現、藥物副作用發現等多個領域。值得注意的是,本方法不僅限于將藥物作用相似度(TS)和結構相似度(CS)作為輸入的實施例中。用drugBank等其它各種數據庫中記載的有關藥物治療作用、藥理作用、毒理作用、副作用等信息,都可以用于本方法計算相似度的依據,也均屬于本專利的保護范圍。藥物作用的相似度(TS)為了衡量藥物作用上的相似度,發明人利用了世界衛生組織藥物統計中心編制的解剖-治療-化學的藥物分類編碼系統(Anatomic Therapeutic Chemicalclassification system,下文簡稱 ATC。見http://www. whocc. no/atcddd/)。ATC 分類系統是一個 5 層的編碼系統,各稱為大類碼、亞類碼、一級次亞類碼、二級次亞類碼和品名碼。其中大類碼按解剖學分類方法進行分類,亞類碼和一級次亞類碼按治療學分類方法進行分類,二級次亞類碼則按化學品和治療學混合分類法進行分類。藥品ATC碼分別記錄了藥物不同層次的特點。 每一個藥物被分配給一個或多個ATC編碼,而同一個ATC編碼又有可能對應多個藥物。ATC 編碼共有5部分,分別記錄了對應ATC分類系統的5層信息。例如,ATC編碼為A10BA02代表著如表1所示的含義。表IATC編碼示例
權利要求
1.藥物靶標確定方法,其特征在于包括確定一個已知藥物集中的一個第一藥物(d)和一個第一蛋白質(P)之間的相互作用關系評價指標,所述評價指標綜合了 所述第一藥物(d)和所述第一蛋白質(P)之間在藥物作用相似度(化)的權重系數估計值(《W)和和藥物結構相似度(CS)的權重系數估計值(^piO;所述第一藥物(d)到所述藥物集中的其他所有藥物的作用相似度(TSd)的分布;所述第一藥物(d)到所述藥物集中的其他所有藥物的結構相似度(CSd)的分布;所述蛋白質(P)到所述藥物集中的所有藥物的親近度(φρ)的分布。
2.根據權利要求1所述的方法,其特征在于所述作用相似度0 )由作用相似度向量 (TSd= ITSddl,TSdd2...TSddnD表征,所述作用相似度向量的每個分量為所述第一藥物與另一藥物所對應的ATC編碼的一個相似度的最大值。
3.根據權利要求2所述的方法,其特征在于所述ATC編碼的相似度為所述第一藥物與所述另一藥物所分別對應ATC編碼的兩個葉節點(i,j)在所述藥物集中分別出現的頻率和它們最長前綴出現的頻率的函數,該函數可以由下式表征
4.根據權利要求2或3所述的方法,其特征在于所述結構相似度(CSd)由結構相似度向量為(C&= ICSddl,CSdd2... CSddnD表征,該結構相似度向量的每個分量為所述第一藥物與另一藥物的分子子結構的交集與這兩個藥物子結構的并集之比。
5.根據權利要求4所述的方法,其特征在于所述親近度(Φρ)由所述蛋白質(ρ)到所述藥物集中的所有藥物的親近度向量為
6.根據權利要求5所述的方法,其特征在于所述親近度((Py)由下式表征
7.根據權利要求6的方法,其特征在于藥物作用相似度(TS)的權重系數估計值彳《W) 和藥物結構相似度(CS)的權重系數估計值(^pO是從回歸模型
8.根據權利要求1的方法,其特征在于為了將( 式簡化,根據本發明的一個實施例,那些對所述式( 貢獻最大的藥物能夠很好地擬合下式的情況下
9.根據權利要求8的方法,根據(7)式,任意一個藥物都得到一個對應所有蛋白質的特征向量,即藥物靶標特征向量。利用這一藥物靶標特征向量的相似度,可以進行藥物新功能和副作用的預測。
全文摘要
藥物靶標確定方法,其特征在于包括確定一個已知藥物集中的一個第一藥物(d)和一個第一蛋白質(p)之間的相互作用關系評價指標,所述評價指標綜合了所述第一藥物(d)和所述第一蛋白質(p)之間在藥物作用相似度(TS)的權重系數估計值和和藥物結構相似度(CS)的權重系數估計值所述第一藥物(d)到所述藥物集中的其他所有藥物的作用相似度(TSd)的分布;所述第一藥物(d)到所述藥物集中的其他所有藥物的結構相似度(CSd)的分布;所述蛋白質(p)到所述藥物集中的所有藥物的親近度(Φp)的分布。以上藥物靶標確定方法還可有效發現藥物的新功能或副作用。
文檔編號G06F19/18GK102298674SQ201010218468
公開日2011年12月28日 申請日期2010年6月25日 優先權日2010年6月25日
發明者李梢, 趙世文 申請人:清華大學