專利名稱:一種藥物在atc系統解剖學層中分類的預測方法
技術領域:
本發明屬于藥物分類技術研究領域,尤其涉及一種藥物在ATC系統解剖學層中分類的預測方法。
背景技術:
傳統的技術路線研發新藥,不僅周期很長而且耗資巨大。有統計表明,一個新藥從研發到上市,大約需要15年,花費超過10億美元,其中相當大的一部分研發費用花在了新藥的早期篩選和毒性實驗中,大約有90%的候選分子因不能通過早期實驗和毒性評估而終止。因此,深入研究已獲批準的藥物,充分發掘已有藥物的新用途(drug repurposing),或者說對藥物進行重定位(drug repositioning), —直受到生物醫藥產業的廣泛重視。因為批準上市的藥物已經歷了數期臨床試驗,其毒副作用已經通過了嚴格的評估,安全性有保障,因此,這些藥物的新用途更容易獲得藥品監管部門的批準,從而可大大降低研發風險,縮減研發費用,節省研發時間,盡早應用于臨床,開拓新的市場。傳統對藥物新用途 的研究方法為:首先構建已獲批準的藥物庫(libraries ofapproved drugs),利用高通量的篩選技術平臺大規模地篩查潛在的藥靶,篩查出藥物潛在的新用途,該方法工作量巨大,嚴重制約了藥物新用途的研究速度。根據Chen L, Zeng WM, Cai YD, Feng KY, Chou KC: PredictingAnatomical Therapeutic Chemical (ATC) Classification of Drugs by IntegratingChemical-Chemical Interactions and Similarities.PLoS ONE 2012, 7 (4):e35254.的研究結果,通過對藥物分子結構信息的篩選,在ATC系統中刪除沒有包含INTERACTION和SIMULATION信息的藥物后,確定ATC所有有代表性藥物的種類為3883種,這為舊藥新用途研究提供了一個較好的研究基礎。ATC系統由世界衛生組織藥物統計方法整合中心(The WHO CollaboratingCentre for Drug Statistics Methodology)所制定,第一版在 1976 年發布。1996 年,ATC系統成為國際標準。現在ATC系統已經發布2006版。ATC代碼共有7位,其中第1、3、4位為字母,第2、5、6、7位為數字。ATC系統將藥物分為5個級別。第一級ATC代碼為一位字母,表示解剖學上的分類,共有14個組別。
發明內容
本發明要解決的技術問題是提供一種藥物在ATC系統解剖學層中分類的預測方法,旨在通過對藥物分子結構特征的提取,較準確地預測藥物所屬ATC類別,將藥物的分子結構和療效聯系起來,解決舊藥新用途研究速度慢、效率低、成本高等問題。為解決以上技術問題,本發明的技術方案是:一種藥物在ATC系統解剖學層中分類的預測方法,其特征在于包括以下步驟:
第一步、提取藥物的分子結構信息;
第二步、基于化合物-化合物交互信息方法獲取藥物的化合物-化合物交互成分第三步、基于化合物-化合物相似信息方法獲取藥物的化合物-化合物相似信息成分:
第四步、基于分子指紋方法獲取藥物的化合物-化合物指紋信息成分:…尤14) 第五步、將前面三個步驟獲取的藥物信息融合,生成藥物特征向量:
( = cU =…=ctl4 = %= %; = --= %4=Λ = Λ: = -Λ 4> ;
第六步、基于藥物特征向量建立3883*42維矩陣,然后利用SVM對藥物特征向量進行計算,便可以得到藥物ATC系統解剖學層分類的預測器。所述藥物的化合物-化合物交互成分的獲取公式為:
C(d;) = [ca: c;i14 J (i = Ll-.n)
c., = max{0.(d,.d,).Vrfr.ec.} ( / = 12,....14;i = L2.. ..1 )
1 \ 1- Λ ^ -ΛJ--—--Jf
其中%指藥物化合物-化合物交互成分中的第一個成分,Cu是第二個成分,C、:
是第j個成分,瞧為)指藥物d;和4的交互成分。所述所述藥物的化合物-化合物相似成分的獲取公式為:
£(ii.) 一 |^i|.-,.— - ^*'241" C* 1: -m- — ;: = max {O, (d,.d.).Vrf ;.ec.) (J = 12., ..14:f =
其中Sa指藥物化合物-化合物相似成分中的第一個成分,&是第二個成分,氣;是
第j個成分,Si(4=4)指藥物和dk的相似成分。所述藥物的分子指紋成分的獲取公式為:
Fid) = Zl= Al -…Zl41 C1' = != 2= -= w)
/ ^ = max {Old,.d-.)Sid-.e c:,-! C/ = l-2—」4u.= 12…j )
4 t % I % £ * 1 ^a%fc/- - *■- .Js
其中/a指藥物分子指紋成分中的第一個成分,fi2是第二個成分,f:;是第j個成分,指藥物4和4的相似性或距離的指標。所述的獲取公式為:
權利要求
1.一種藥物在ATC系統解剖學層中分類的預測方法,其特征在于包括以下步驟: 第一步、提取藥物的分子結構信息; 第二步、基于化合物-化合物交互信息方法獲取藥物的化合物-化合物交互成分 第三步、基于化合物-化合物相似信息方法獲取藥物的化合物-化合物相似信息成分:
2.根據權利要求1所述的預測方法,其特征在于:所述藥物的化合物-化合物交互成分的獲取公式為:
3.根據權利要求1所述的預測方法,其特征在于:所述所述藥物的化合物-化合物相似成分的獲取公式為:
4.根據權利要求1所述的預測方法,其特征在于:所述藥物的分子指紋成分的獲取公式為:
5.根據權利要求4所述的預測方法,其特征在于:所述的獲取公式為:
6.根據權利要求1所述的預測方法,其特征在于:所述藥物的分子結構信息包括藥物分子間交互信息特征、分子間相似信息特征、分子指紋相似特征。
全文摘要
本發明提供一種藥物在ATC系統解剖學層中分類的預測方法,本發明的理論基礎是建立在具有相似物理化學屬性的化合物有相似的生物活性,并在世界衛生組織對藥品的官方分類系統-解剖學治療學及化學分類系統ATC得到驗證。本發明通過對藥物分子間交互信息、相似信息,藥物分子指紋相似信息的融合,通過編碼模型將藥物分子轉換成一個數字序列,再基于支持向量機建立3883*42維矩陣,對該矩陣進行歸一化,使用SVM進行預測器學習,進而分析其序列特征在ATC系統解剖學層中的類別,該方法具有準確率高、成本較低、操作簡便、結果直觀的特點,為舊藥新用途的研究提供了一個新的方法,具有廣闊的應用空間。
文檔編號G06F19/00GK103246824SQ201310195449
公開日2013年8月14日 申請日期2013年5月24日 優先權日2013年5月24日
發明者程翔 申請人:景德鎮陶瓷學院