虛擬篩選裝置及虛擬篩選方法

            文檔序號:6478865閱讀:3320來源:國知局
            專利名稱:虛擬篩選裝置及虛擬篩選方法
            技術領域
            本發明涉及虛擬篩選裝置及虛擬篩選方法。
            背景技術
            目前,存在由試劑提供公司等出售的醫藥品相應化合物及試劑化合物等化合物。 另外,作為與化合物相互作用的高分子,存在通過以質譜分析為主的各種實驗等確認的高 分子及通過收錄于例如以Nature及Science為代表的雜志的文獻等而被社會認知的高分 子等這樣的、與研制的醫藥品等化合物相互作用而治愈動植物的疾病狀態及患病狀態、減 輕癥狀或維持現狀等的藥物目標蛋白、藥物目標核酸、藥物目標糖質及藥物目標脂質等目 標高分子。在進行對目標高分子的低分子化合物對接和虛擬篩選時,目前,使收納有大量如 上所述的醫藥品候選化合物等化合物的化合物數據庫的各化合物與例如以蛋白為主體的 目標高分子蛋白進行對接相互作用,確定相當于現實存在的幾十萬個化合物的化合物與目 標蛋白直接相互作用的坐標配置(構象),獲得相互作用能量及與其相當的分值。而且,將 該分值作為穩定性的指標,從大到小排列,確定化合物_藥物目標蛋白的相互作用的順序。例如,在Kuntz 等的 Dock(參照 Ewing 等人著 J Comput AidedMol Des. 2001 15(5)411-28)、Goodsell 等的 AutoDock(參照 Goodsell 等人著 J. Mol. Recognit 1996 9 1-5)、Gareth 等的 GOLD (參照 Jones 等人著 J. Mol. Biol. 1997 267,727-748)、Rarey 等的 FlexX、Nicolas等的Flagment Potential等現有方法中,為了計算上述分值,在各個方法 中,使用作為目標高分子的目標蛋白的配體結合環境的網格信息、及重視化合物和目標高 分子間的向量的化合物的多點信息進行計算。即,即使在目標蛋白的生物學環境等方面下一些功夫,也基于網格信息及多點信 息等信息,由化合物的原子和構成目標高分子蛋白的原子的經典物理學的原子間勢式計算 相互作用能量等,通過分值確定關于化合物的構象及相互作用的鍵的強度的順序。另外,為 了確定相互作用的順序,對相互作用的各種化合物的構象使用聚類等方法來確定順序等。但是,在現有的虛擬篩選方法中,著眼于精度良好地預測蛋白_配體復合物,具有 與直接選出眾多“中的”(hit)化合物不一致的問題點。另外,在現有的虛擬篩選方法中,使用經典物理學的勢函數進行非經驗性的預測, 存在不能進行將生物化學實驗等的信息考慮在內的預測效率高的篩選的問題。本發明是鑒于上述情況而完成的發明,其目的在于,提供虛擬篩選裝置及虛擬篩 選方法,所述虛擬篩選裝置及虛擬篩選方法可精度良好地預測蛋白和化合物的結合,并且 可選出眾多“中的”化合物,另外,還可提高預測效率。

            發明內容
            本申請發明人鑒于在公開數據庫中注冊有通過X射線分析、NMR、電子射線分析、 高分辨率電子顯微鏡照片等實驗得到的顯示化合物和目標高分子的相互作用的龐大的三
            6維坐標信息、及近年來的計算機的性能提高和生物信息學的進步等,得到如下構思代之以 現有的通常進行的經典物理學的虛擬篩選方法,利用結合于目標高分子蛋白的各種化合物 的集體擬合狀態等生物信息學信息,可實施以人工的智慧為基礎的半經驗的化合物虛擬篩 選。本發明是基于上述構思通過本申請發明人的潛心研究而完成的,其為篩選結合于目標蛋白的候選化合物的虛擬篩選裝置,其至少具備存儲部和控制 部,其特征在于, 所述存儲部具備化合物數據庫,■所述化合物數據庫通過提取每個所述候選化合物的包含原子類型和原子間結 合規則的化學描述符而制成,■所述化學描述符作為聯系化合物中多個原子的化合物指紋而被提取; 所述控制部具備■化合物指紋制作裝置,其將結合化合物的三維坐標與所述化合物指紋一同提取 而制作結合化合物指紋集, 所述結合化合物已知結合于立體結構與所述目標蛋白相同或類似的家族蛋白, 所述結合化合物的三維坐標是已轉換到所述目標蛋白的坐標系的三維坐標,和■最優化裝置,其計算使所述候選化合物與所述目標蛋白的相互作用分值最優化 的所述候選化合物的立體結構, 所述候選化合物存儲于所述化合物數據庫中, 所述候選化合物與所述目標蛋白的相互作用分值以所述化合物指紋單元的均 方偏差為基礎, 所述化合物指紋單元的均方偏差以所述結合化合物指紋集的所述三維坐標為
            基礎計算。即,根據本發明,可精度良好地預測蛋白和化合物的結合,并且可選出眾多“中的” 化合物,另外,可進行將生物化學實驗等的信息考慮在內的半經驗篩選,進而,還可提高預 測效率。如上所述,本發明在使使用三維化合物指紋集的生物信息學技術發揮與使用經典 物理學能量方法的低分子化合物和高分子蛋白的對接相同的性能方面,與現有方法不同。 尤其是考慮X射線分析、NMR、電子射線分析、高分辨率電子顯微鏡分析等技術的飛快進步 時,可預測結合于目標高分子蛋白的化合物的分子數龐大地增加,因此,本發明發揮很大的 效果。另外,本發明為根據上述的虛擬篩選裝置,其特征在于, 所述虛擬篩選裝置與蛋白數據庫裝置連接,所述蛋白數據庫裝置存儲結合于化 合物的蛋白的立體結構及氨基酸序列; 所述控制部還具備同一性檢索裝置,所述同一性檢索裝置基于所述目標蛋白與 所述氨基酸序列的同一性,從所述蛋白數據庫裝置檢索所述家族蛋白及所述結合化合物; 所述化合物指紋制作裝置將所述結合化合物的三維坐標與所述化合物指紋一 同提取而制作所述結合化合物指紋集,■所述結合化合物結合于利用所述同一性檢索裝置檢索得到的所述家族蛋白,
            7CN 101855392 A ■所述結合化合物的三維坐標是已轉換到所述目標蛋白的坐標系的三維坐標。其中,作為本發明的一例,例示具體例,本發明在作為提取在類似于目標高分子 中的目標蛋白的立體結構的家族高分子集中結合有各種低分子化合物的集體構象時的 條件,在取出家族高分子集時,將該目標蛋白的序列設定為查詢(查詢)序列,通過利用 PSI-Blast等的同一性檢索進行檢測。而且,本發明在檢測過的蛋白中,檢索為符合的蛋 白-配體復合物(Protein-Ligand complex)含有低分子配體時,使用CE (不在意原子的種 類的蛋白之間的結構的擬合操作)等,與目標蛋白擬合。而且,本發明在表示其結構的相似 性的Z-Score為所定值(例如3.7以上)時,可與配體坐標一同,將檢索到的結合于類似蛋 白的配體從類似蛋白的坐標系轉換到目標蛋白的坐標系,僅挑選出配體。其中,CE進行不在意原子的種類的蛋白之間的結構的擬合操作,也可用具有同樣 的功能的程序將其代替。另外,本發明在將該目標蛋白的序列設定為查詢(查詢)序列,通 過利用PSI-Blast等的同一性檢索僅得到具有高同一性的序列時,也可使用在意原子的種 類的蛋白之間的結構的擬合操作的程序。另外,本發明在同一性檢索中,不限于PSI-Blast, 也可將序列設定為查詢進行同一性檢索,作為可定量評價序列相似性的軟件程序,可適用 任意的同一性檢索程序。另外,本發明為根據上述的虛擬篩選裝置,其特征在于,所述化合物指紋制作裝置 通過所述家族蛋白和所述目標蛋白的結構擬合,將結合于該家族蛋白的所述結 合化合物的所述三維坐標轉換到所述目標蛋白的坐標系,并 將經轉換的所述三維坐標與所述化合物指紋一同提取而制作所述結合化合物 指紋集。另外,本發明為根據上述的虛擬篩選裝置,其特征在于,所述化合物指紋制作裝置 還具備新化合物指紋追加裝置,所述新化合物指紋追加裝置眷參照與所述結合化合物不同的其它所述化合物進行結構擬合,并眷提取跨越該結合化合物原子間和該其它所述化合物原子間的所述化合物指紋 而追加到所述結合化合物指紋集。作為本發明的一例,例示具體例時,作為結合化合物指紋集的具體例,可以結合 于類似于目標高分子中的目標蛋白的立體結構的家族高分子蛋白集的各種低分子化合物 數據庫艮口 ‘‘CElib,,(FP (fingerprint) set extracted from collected ligands in the binding site(從結合位點的配體集提取的化合物指紋集))構成。在該CElib中含有目標 蛋白的坐標系中的坐標和Sybyl原子類型(atom-type)及單鍵、雙鍵、芳香環鍵等鍵合規則 信息。其中,本發明還可根據對目標蛋白的低分子化合物的搜索的目標的必要,在CElib中 加入任意的FP (fingerprint 指“化合物指紋”。下同。)即,相比從集體結合于類似于現有的目標蛋白的立體結構的家族高分子集的各種 低分子化合物提取FP,在本發明中,在保持普通的一般存在的化合物分子和FP的相似性狀 態,替換各種低分子化合物中原子的種類。而且,本發明使用“circle”等可評價穩定性的程 序計算與目標蛋白的相互作用能量,得到使相互作用更穩定的結構稍微不同的“Modified FP”(經修飾FP)。而且,本發明使用相對目標蛋白局部能量穩定的經修飾FP,如從作為蛋白 之間的結構的擬合操作的結果得到的集體結合的各種低分子化合物獲得的FP那樣捕獲, 將其作為新的FP,如在上述發明中進行的那樣,在FP的擬合中用作其對象FP。
            8
            在上述發明中,在蛋白和配體的對接中,代替目前使用的物理化學相互作用函數, 得到使用包含三維坐標的化合物指紋集的生物信息學的配體構象。而且,在本發明中,代替 從集體結合于類似于現有的目標蛋白的立體結構的家族高分子蛋白集的各種低分子化合 物提取FP,參照各種低分子化合物中不同的分子化合物,制作類似于普通的一般存在的分 子的FP的多種化合物結合三維化合物指紋集。而且,本發明如從作為蛋白之間的結構的 擬合操作的結果得到的集體結合的各種低分子化合物獲得的FP那樣捕獲制得的化合物指 紋,將其作為新的FP,如在上述發明中進行的那樣,在FP的擬合中用作其對象FP。S卩,上述發明將集體結合于家族高分子集的各種低分子化合物完全分解,代替目 前的以物理學公式為基礎的對接計算,以分散的各種低分子化合物FP作為對接的基礎。本 發明是對從集體結合于類似于現有的目標蛋白的立體結構的家族高分子蛋白集的各種低 分子化合物的構象的存在接近于與目標蛋白的家族蛋白相互作用的最穩定結構的事實進 行深思熟慮而產生的發明,與現有方法不同,具有大的效果,是有用的。另外,本發明為根據上述的虛擬篩選裝置,其特征在于,所述化合物指紋制作裝置 還具備新化合物指紋追加裝置,所述新化合物指紋追加裝置 對基于Tanimoto系數與所述結合化合物類似的所述化合物,替換該結合化合 物原子間和該化合物原子間的原子種類, 計算與所述目標蛋白的相互作用能量,并 制作與該結合化合物的所述化合物指紋相比,局部能量更穩定的所述化合物指 紋而追加到所述結合化合物指紋集。作為本發明的一例,例示具體例時,本發明由CElib對與目標蛋白家族高分子蛋 白集結合的各種低分子化合物,將各種家族高分子蛋白和配體的復合物設定為對象,以與 配體的相互作用穩定的方式利用Circle程序等相互作用計算程序。本發明對指紋(fp)單 元、即化學描述符單元改良變更原子的種類及結合的種類,將其作為新的指紋(fp)單元、 即化學描述符單元,將其作為新的FP,如在上述發明中進行的那樣,在FP的擬合中用作其 對象FP。另外,在目標高分子中,結合于類似于目標蛋白的立體結構的家族高分子蛋白集 的各種低分子化合物數據庫即CElib的FP對確定對接score (分值)有很大貢獻。因此, 在本發明中,在上述發明中結合于目標高分子蛋白的理想的低分子配體的對接結構實驗性 地分析結束時,在其鍵中將理想的低分子配體作為先導化合物,以相互作用能量變好的方 式附加各種取代基,或在發現作為化合物指紋的定量化函數的Tanimoto系數與理想的低 分子配體非常相似、即接近于1的任意的低分子配體時,將FP區域限定于所述實驗性地分 析結束的理想的低分子配體的周圍的區域(例如4或5埃)。由此,本發明可容易地計算這 些化學結構相似的Tanimoto系數非常相似的化合物的對接結構和其score (分值)。這為 結合化合物的先導物最優化(leadoptimization)或化合物的新(de novo)設計,在與上述 發明中的FP的作用的組合中,與現有方法不同,具有大的效果,是有用的。另外,目前,通常,在目標蛋白中結合作為各種低分子化合物的一部分的苯環等官 能團,得到物理學上穩定的部分結構,并由它們的結果計算目標蛋白和含有許多分子內自 由旋轉的各種低分子化合物的相互作用時,減少所述對接構象的產生。在本發明中,使用作 為生物信息學的方法的“circle”這樣的可評價穩定性的程序計算與目標蛋白的相互作用能量,制作經修飾FP。關于這一點,文獻等公知物未發現,并且沒有報道有像本發明那樣在 采用FP的擬合作為對接的計算的基礎時,以對接的計算的經修飾FP為基礎的現有方法,本 發明與現有方法不同,具有大的效果,是有用的。另外,本發明為根據上述的虛擬篩選裝置,其特征在于,所述結合化合物為利用公 知的對接算法預測為對所述目標蛋白具有穩定構象的化合物。作為本發明的一例,例示具體例時,在本發明中,采用使用作為目前一般實施的 方法的氫鍵、疏水性相互作用及靜電相互作用等物理勢函數的第一原理方法(Ab-initio Approach) 0例如,本發明追加從使用保證利用隱藏正確結構的盲試(blind test)可以 rmsd2. 0以下預測正確結構的比例的DOCK、AutoDock及GOLD等現有的對接軟件預測為在 對接計算中具有穩定構象高的分值的低分子化合物的三維坐標中提取的FP (指紋)。另外,本發明可將通過目標蛋白和各種低分子化合物的相互作用的分值化而得到 的構象用作DOCK、AutoDock及GOLD等現有的對接軟件的初期構象。由此,在上述發明中, 在簡便地獲得得到的初期構象的基礎上,重現實驗的精度高,因此,利用與其它的軟件程序 的組合,可得到有用的結果。另外,本發明為根據上述的虛擬篩選裝置,其特征在于,所述最優化裝置還具備相 互作用分值計算裝置,所述相互作用分值計算裝置基于考慮以下因素的函數計算所述相互 作用分值 所述化合物指紋單元中以所述均方偏差為基礎的所述候選化合物與所述目標 蛋白的沖突程度、 所述候選化合物在所述目標蛋白的相互作用區域中的存在比例、及 所述候選化合物與所述目標蛋白的直接相互作用比例。另外,本發明為根據上述的虛擬篩選裝置,其特征在于,所述最優化裝置通過下法 使所述相互作用分值最優化 基于Metropolis法判定所述相互作用分值, 根據判定結果變更、增加或減少成為所述候選化合物的基礎的所述化合物指紋。作為本發明的一例,例示具體例時,本發明的Metropolis判定,如果這次的分值 比前次的分值大,則采用候選配體的結構;如果這次的分值比前次的分值小,則可計算采用 概率Paccept,根據Pacc印t確定放棄或采用。另外,本發明為根據上述的虛擬篩選裝置,其特征在于, 所述最優化裝置還具備結構變換裝置,所述結構變換裝置■在所述相互作用分值的最優化過程中,反復改變所述候選化合物的構象,■基于模擬退火法,按照該候選化合物的各所述構象將該候選化合物作為剛體反 復并行或旋轉; 所述最優化裝置計算經所述結構變換裝置并行或旋轉的各所述構象的所述候 選化合物的所述相互作用分值。作為本發明的一例,例示具體例時,為了在包含結合于與目標蛋白的立體結構類 似的家族高分子集的各種低分子化合物的幾個三維坐標信息的FP中從虛擬化合物庫將 庫低分子化合物與目標蛋白對接并搜索相互作用最佳的構象,重復利用蒙特卡羅模擬退火(simulatedannealing)進行數學計算以使分值為最高。更具體而言,首先,本發明通過隨機變更候選配體的可旋轉的二面角而使構象變 化,使用所述構象變化了的候選配體的坐標。然后,本發明從來自結合于目標蛋白的家族蛋 白的結合化合物集的FP帶隨機地選擇10個FP。然后,本發明從選擇的fp帶隨機地選擇候 選配體及從庫配體隨機地選擇FP原子坐標集。然后,本發明將該狀態設定為指紋(FP)比 對,以其對應關系進行最小二乘擬合。本發明使用此時的擬合的均方偏差(rmsd)和擬合后 的候選配體的原子坐標計算相互作用分值。然后,本發明在第二次以后存儲前次的狀態,保 持配體原子的構象的情況下,即進行剛體并行、旋轉。然后,本發明進行一個FP的增加、減 少及原子坐標集的對應關系的變更、追加。本發明進行例如10000次該步驟。其中,模擬退 火的溫度可從30K開始,下降至0. 07K。這樣,本發明計算一個構象的分值的最大值,對初期 產生的1000個構象進行比較,將分值最大的結構預測為蛋白-配體復合物結構并輸出。此 時,按該分值給1000個構象賦序的過程可通過使用遺傳算法等,在計算時間及最大值的搜 索中下功夫。另外,本發明為根據上述的虛擬篩選裝置,其特征在于,所述最優化裝置基于以下 的數學式(1)計算所述相互作用分值數1FPAScore = F(aligned_fp, fp_rmsd, molecule)其中, 所述FPAScore表示所述相互作用分值, 所述F(aligned_fp,fp_rmsd, molecule)為將以下因素作為變量的函數■所述結合化合物和所述候選化合物間的所述化合物指紋單元的比對度、及所述 均方偏差、以及■將所述候選化合物對所述目標蛋白的所述立體結構; 所述BaseScore(aligned_fp,fp_rmsd)為表示所述化合物指紋單元的一致度 及密集度的指標; 所述fp_volume (molecule)為表示以下因素的指標■所述候選化合物占由所述結合化合物指紋集的所述三維坐標構成的空間的比 例、及■所述候選化合物與所述目標蛋白的沖突程度;眷所述fp_contact_surface (molecule)為表示以下因素的指標■所述候選化合物與所述目標蛋白的接觸度、及■所述候選化合物對所述結合化合物指紋集的所述三維坐標的歸屬度。如上所述,這些上述敘述的發明中的數學計算,在用現有的物理學的相互作用函 數計算目標蛋白和虛擬化合物庫低分子化合物的相互作用時,使用生物信息學的信息進行 半經驗計算,其在這一方面與現有方法不同,結構預測的成功率進一步優于被世界認可的 對接軟件程序,發揮決不會差的大的效果。另外,對于信息的積累,由于將半經驗生物信息
            =BaseScore (aligned_fp, fp_rmsd) Xfp_volume(molecule) Xfp_contact_surface(molecule)
            11學方法的相互作用計算的結果向良好的方向引導,因此,與現有方法不同,是有用的。另外,本發明為根據上述的虛擬篩選裝置,其特征在于, 所述數學式(1)中的所述BaseSCOre(aligned_fp,fp_rmsd)基于以下的數學式 ⑵計算,數2
            其中,■所述RawScore (aligned_fp)為基于在所述結合化合物和所述候選化合物間比 對的所述化合物指紋中的原子數的指標,■所述fp_rmsd為所述均方偏差; 所述fp_V0lume (molecule)基于以下的數學式(6)計算,數3
            其中,■所述nafp為所述候選化合物的所述三維坐標所占的固有網格點區域的網格點 數,所述固有網格點區域基于所述結合化合物指紋集的所述三維坐標,■所述nap為所述候選化合物的所述三維坐標所屬的所述目標蛋白的所述立體 結構中原子的固有網格點區域的網格點數,所述k2及k3為任意常數; 所述 fp_contact_surface (molecule)基于以下的數學式(7)計算。數4
            其中,■所述n為所述候選化合物的原子數,■所述atom⑴為所述候選化合物的第i個原子的所述三維坐標,■所述denSity_0f_at0m(at0m(i))為當該原子的所述三維坐標屬于所述結合化 合物指紋集的所述化合物指紋時,返回以下數之和的函數 以所定距離與該化合物指紋的所述原子接觸的所述目標蛋白的原子數、和 屬于該化合物指紋的同一網格點的所述結合化合物的原子數,■所述 total_density_of_atom(molecule)為將按降序重排的所述 density_of_ atom分布依次累加所述候選化合物的原子數項的數。作為本發明的一例,例示具體例時,本發明為了明確上述內容中k2、k3的值,對EGFR及VEGFR等固有的目標蛋白搜索已知活性化合物,將k2、k3最優化。然后,本發明為在 EGFR的抑制劑的虛擬篩選中進行其值例如為k2 = 2. 0、k3 = 1. 0的虛擬篩選的方法。利 用上述發明的虛擬篩選可靠地列舉適合于EGFR及VEGFR等固有的目標蛋白的化合物將直 接關系到抗癌劑的新藥開發,因此,與現有方法不同,具有大的效果,是有用的。目前,GOLD這樣的對接軟件程序以參與生物學上重要的氫鍵的原子作為點或向 量,在基因算法中,在選擇好的集合方面下功夫。這樣的點或向量與上述發明中記載的作為 提取在類似于目標蛋白的立體結構的家族高分子集中結合有各種低分子化合物的集體構 象時的條件的部件(即三維化學描述符)的FP不同。本發明的特征在于,在上述發明中, 在相互作用的構象中取入構成生物學上重要的氫鍵等的原子點或向量的集時,如果將fp_ rmsd值設定為以下的式子,則可不與上述發明矛盾地含有參與生物學上重要的氫鍵或疏水 鍵或范德華相互作用的原子。艮口,在本發明中,可將fp_rmsd+distance rmsd indicative atom setcomposed of important points vectors 的式子擴展為 fp_rmsd ~k -k kl+distance_rmsd 女女 k4(女女 kl << * * k4為FP的貢獻小* * kl >> * * k4為重視FP的貢獻)的形式,也可設定 為distance_rmsd * ± k4。其中,distance_rmsd如下定義在目標蛋白和對接的低分子化 合物的相互作用中,配體原子在目標蛋白的配體結合位點中進行生物學上重要的氫鍵或疏 水鍵或范德華相互作用時,目標蛋白的配體結合位點中的理想坐標和由目標蛋白的生物學 上重要的原子或其附近的原子產生的向量的終點坐標的最小二乘誤差。另外,在本發明中,在各種低分子化合物中,大部分化合物為連接有氨基酸殘基的 肽時,由于肽基多,fp的對應關系復雜,因此,在分值的計算過程中過小評價,在關于上述發 明中的RawScore的上述數學式中,可將相當于肽的部分的FP的式子的部分設定為零等過 小評價的數字。S卩,本發明以FP為基礎,在計算目標蛋白和對接的低分子化合物的相互作用的方 法中,進行作為目標高分子的目標蛋白的配體結合環境的網格信息、重視化合物和目標高 分子間的向量的化合物的多點信息、從表示目標蛋白的生物學環境的化合物朝向目標蛋白 的向量等的研究。其中基礎上,本發明為包含由化合物的各種原子和構成目標高分子蛋白 的各種原子的經典物理學的原子間勢式計算相互作用能量等的方法并使其融合的上述發 明的擴展發明,關于由分值確定與化合物的構象及相互作用的鍵的強度有關的順序,與現 有方法不同,具有大的效果,是有用的。另外,本發明為虛擬篩選方法,其在至少具備存儲部和控制部的虛擬篩選裝置中 實施,所述方法篩選結合于目標蛋白的候選化合物,其特征在于, 所述存儲部具備化合物數據庫,■所述化合物數據庫由提取每個上述候選化合物的包含原子類型和原子間結合 規則的化學描述符而制成,■所述化學描述符作為聯系化合物中多個原子的化合物指紋而被提取; 所述方法包括在所述控制部中實施的以下步驟■化合物指紋制作步驟,將結合化合物的三維坐標與所述化合物指紋一同提取而 制作結合化合物指紋集, 所述結合化合物已知結合于立體結構與所述目標蛋白相同或類似的家族蛋白,
            13
            所述結合化合物的三維坐標是已轉換到所述目標蛋白的坐標系的三維坐標;■最優化步驟,計算使所述候選化合物與所述目標蛋白的相互作用分值最優化的 所述候選化合物的立體結構, 所述候選化合物存儲于所述化合物數據庫中, 所述候選化合物與所述目標蛋白的相互作用分值以所述化合物指紋單元的均 方偏差為基礎, 所述化合物指紋單元的均方偏差以所述結合化合物指紋集的所述三維坐標為
            ■石出。以上,根據本發明,可精度良好地預測蛋白和化合物的鍵合,并且可選出眾多“中 的”化合物,另外,還可進行將生物化學的實驗等信息考慮在內的半經驗篩選,發揮可提高 預測效率的效果。附圖簡述

            圖1是表示本發明適用的本虛擬篩選裝置的構成的一例的框圖;圖2是表示虛擬篩選裝置100的處理的一例的流程圖;圖3是表示利用有效地使用現有的對接軟件和蛋白-配體復合物的多個X射線結 構或NMR結構的生物信息學的本實施例所述的對接方法的狀況圖;圖4是本實施例(ChooseLD)的蛋白-配體對接的原理構成圖;圖5是表示FP(指紋)的制作方法的一例的圖;圖6是表示本實施例中使用的原子的字符串列表;圖7是表示利用Tanimoto系數的化合物間的相似性計算方法的示意圖;圖8是表示在目標蛋白的結合位點上對接配體時的FP的一例的示意圖;圖9是表示從搜索路徑得到原子坐標并注冊于FP帶的過程的一例的圖;圖10是表示本實施例中的FP帶的壓縮工序(method step of shrinking fingerprint band)的一{列的圖;圖11是表示對坐標向量之間賦予對應關系的過程的一例的示意圖;圖12是使用原子數為31的配體表示nafp和nap的具體例的圖;圖13是表示目標蛋白的活性位點附近的來自FP庫的配體的位置的一例的圖;圖14是表示模擬退火過程的一例的概念圖;圖15是示意性地表示用于計算FPAScore的FP比對及最小二乘擬合的圖;圖16是表示EGFR虛擬篩選中的計算時間的分布的圖;圖17是表示基準的概要的一例的圖;圖18是表示對PDB的注冊數的年度分布的圖;圖19是概括預測和實驗結果間的rmsd的表;圖20是85集的預測成功率一覽(kl和Tc范 的關系)表;圖21是表示可在rmsd2. 0以下預測至10位的比例的圖表;圖22是表示可在rmsd2. 5(Close)以下預測至10位的比例的圖表;圖23是表示在與視為成功的正確結構的rmsd在2.0人之外進行時的圖表;圖24是表示與ChooseLD相比、Dock、AutoDock及GOLD的基準的結果的圖表;圖25是表示85集中的與FPAScore的預測結構和實驗結構的rmsd為2.0人以下的各個目標蛋白的沖突個數的分布的圖;圖26是表示85集基準中的預測成功結構的個數分布的圖;圖27是表示各靶標的總10次對接嘗試中的成功個數的圖;圖28是表示133集的基準中的DOCK、AutoDock、GOLD預測結構的rmsd分布的結 果和ChooseLD法的結果的圖;圖29是表示133集的基準中的DOCK、AutoDock、GOLD預測結構的rmsd分布的結 果和ChooseLD法的結果的圖;圖30是表示各靶標中的總10次的對接嘗試中的成功個數的圖;圖31是表示各靶標中的總10次的對接嘗試中的成功個數的圖;圖32是表示在Tc范圍限定的FP庫中在根據FPAScore賦序的分布內得到與實驗 結構的rmsd為2.0人以下的結構的概率的圖;圖33是表示在Tc范圍限定的FP庫中在根據FPAScore賦序的分布內得到與實驗 結構的rmsd為2.0人以下的結構的概率的圖;圖34是表示預測成功結構的沖突個數的分布的圖;圖35是表示進一步降低用于FP庫的配體的Tc范圍的上限值,并在0. 16,0. 24、 0. 36使下限值為0. 08時的性能,及上述Tc范圍即上限值為0. 56,0. 76,0. 96、下限值為 0. 08的預測成功率的圖;圖36是表示對1DR1預測的蛋白-配體結構的圖;圖37是表示對4EST預測的蛋白-配體結構的圖;圖38是表示GOLD失敗但ChooseLD預測成功的靶標的關于1⑶G的圖;圖39是表示GOLD失敗但ChooseLD預測成功的靶標的關于1DR1的圖;圖40是表示GOLD失敗但ChooseLD預測成功的靶標的關于1LDM的圖;圖41是表示GOLD失敗但ChooseLD預測成功的靶標的關于4EST的圖;圖42是表示133集中的90靶標的預測成功率的圖表;圖43是用TcCTanimoto系數)計算對接軟件間的預測成功的目標蛋白的PDBID 類似度的圖表;圖44是表示各對接軟件對90靶標中的一個目標蛋白的預測的成功與否分布的圖 表;圖45是表示DOCK失敗但ChooseLD預測成功的靶標的關于1HYT的圖46是表示DOCK失敗但ChooseLD預測成功的靶標的關于1PHG的圖47是表示DOCK失敗但ChooseLD預測成功的靶標的關于1TMN的圖48是表示不僅1位、而且至10位可采取rmsd2. 0的結構的比例的圖49是表示不僅1位、而且至10位可采取rmsd2. 5(Close)的結構的比例的圖
            圖50是表示使定義為成功的rmsd變化時的圖表;
            圖51是表示利用本實施例的處理的結果的圖表;
            圖52是表示來自EGFR的細胞內信號轉導通路的圖53是表示EGFR的氨基酸序列的比對的圖54是表示構建的EGFR模型的圖55是表示得到的11個抑制劑的平面結構的圖56是表示將由FPAScore定義的k2值在0. 5 5. 0的范圍變更時的收獲率折 線圖的圖;圖57是表示將FPAScore中的k3值在0. 5 2. 0的范圍變更時的收獲率折線圖 的圖;圖58是表示將Tc上限值設定為1. 00、使Tc下限值的范圍設定為0. 08 0. 32, 以0. 08刻度變化時的各Tc范圍中的虛擬篩選的結果的圖;圖59是表示注冊于PDB的蛋白-配體復合物結構已知的PDBID和其配體的排列 順序的圖;圖60是將圖59的配體ID和化合物名相對應起來的圖;圖61是表示利用Kinase的虛擬篩選的壓縮的結果的上10位的蛋白-配體復合 物的圖;圖62是從其它角度觀察圖61的圖;圖63是表示TGF-a結合域附近的圖; 64^^^^jiffiMDL Comprehensive Medicinal Chemistry(MDL CMC)Library 的EGFR的TGF-a結合域的虛擬篩選的結果的圖;圖65是表示使用MDL A⑶Library的同一虛擬篩選的結果的圖;圖66是表示KRN633 (IC50 = 1. 16nm/L)的平面結構的圖;圖67是表示KRN951 (IC50 = 0. 16nm/L)的平面結構的圖;圖68是表示在對KRN633的VEGFR2活性位點附近的對接所使用的屬于FP庫的配 體中用于對接的配體的上位10個的圖;圖69是與VEGFR2的活性位點附近的立體結構一同表示對KRN633實行10次 ChooseLD法并預測的10個結構的圖;圖70是表示在對KRN951的VEGFR2活性位點附近的對接中使用的屬于FP庫的配 體中用于對接的配體的上位10個的圖;圖71是與VEGFR2的活性位點附近的立體結構一同表示對KRN951實施10次 ChooseLD法并預測的10個結構的圖;圖72是對于將由使用133集的ChooseLD法的對接性能試驗的結果得到的Tc下 限值固定在0. 08、并使Tc上限值變化時的預測成功率,將橫軸設定為Tc上限值、縱軸設定 為成功率的圖; 圖73是表示烯酰基載體蛋白的立體結構的圖; 74 ^^^jiffi MDL Comprehensive Medicinal Chemistry (MDL CMC) Library 進行烯酰基載體蛋白的虛擬篩選的結果的FPAScore的上位10個結構的圖;圖75是表示AMPKhomoGAMMAl和2V9J_E的氨基酸序列的比對的圖;圖76是表示配體結合于全部受體的CMC醫藥品的結果列表的圖;圖77是將1位 10位的對2V9J_E受體的結合狀態圖示的圖。
            具體實施例方式下面,基于附圖對本發明的虛擬篩選裝置及虛擬篩選方法的實施方式進行詳細說 明。需要說明的是,本發明不受該實施方式限定。
            1本發明的概要下面,對本發明的概要進行說明,其后,對本發明的構成及處理等進行詳細說明。目前,PDB (Protein Data Bank)中注冊有利用X射線分析、匪R實驗、電子射線分 析實驗、高分辨率電子顯微鏡照片等實驗表示肽或低分子化合物或金屬等各種化合物與目 標高分子進行直接相互作用的狀態的至約4萬的數目的三維坐標。另外,隨著計算機的性 能和生物信息學的進步,結合有各種化合物的立體結構與目標高分子蛋白類似的家族高分 子蛋白集可利用在SC0P等網站或CASP中顯示優異的成績的本申請人制作的程序等容易地 得到并提取。根據該狀態,本申請發明人獲得以下構思如果可代替由利用對目前一般經典物 理學確定的目標高分子蛋白的直接結合的該化合物的構象或此時得到的分值的該相互作 用能量的結果確定化合物的虛擬篩選的順序的方法,利用結合于目標高分子蛋白的各種化 合物的集體擬合狀態代用生物信息學,則應該可由利用以人的智慧為基礎的化合物的構象 或此時得到的分值的相互作用能量的結果,根據化合物的虛擬篩選確定順序。本發明是基于上述構思、通過本申請發明人的潛心研究而完成的,其概略地具有 以下的基本特征。即,本發明為虛擬篩選裝置,其至少具備存儲部和控制部,其進行結合于 目標蛋白的候選化合物的篩選,其特征在于,所述存儲部具備化合物數據庫,所述化合物數 據庫通過提取每個上述候選化合物的包含原子類型和原子間結合規則的化學描述符而制 成,其中所述化學描述符作為聯系化合物中多個原子的化合物指紋而被提取。其中,所謂“化合物指紋”(指紋FP),更具體而言,為包含化合物中的原子2個、3 個或4個等的原子的原子類型和原子間結合規則的化學描述符。作為“原子類型”的一例, 為Sybyl原子類型(atom-type)或化合價類型(Valence-type)等。“原子間結合規則”表 示原子間的化學結合的狀態,例如,表示單鍵、雙鍵或芳香環鍵合等鍵合規則或利用分子軌 道法進行的分類等。接著,本發明的篩選裝置將結合化合物的三維坐標與所述化合物指紋一同提取而 制作結合化合物指紋集,所述結合化合物已知結合于立體結構與所述目標蛋白相同或類似 的家族蛋白,所述結合化合物的三維坐標是已轉換到所述目標蛋白的坐標系的三維坐標。 即,在目標蛋白的坐標系中收集結合于其立體結構的化合物集體的集體構象,對應于三維 坐標提取化合物指紋。其中,“立體結構和目標蛋白相同或類似的家族蛋白”可為目標蛋白本身,也可為 與目標蛋白的一部分結構(例如活性位點或配體結合位點等)相同或類似的蛋白,可分析 目標蛋白的立體結構而不指定活性位點地使用相同或類似的蛋白。為了使穩定構象具有高 的分值,在使用現有的DOCK、AutoDock或GOLD等現有的對接軟件的對接計算中,需要預先 分析該目標蛋白的立體結構,指定活性位點。但是,在本發明中,與這些相比,與現有方法不 同,具有大的效果,不需要通過文獻等的學習指定活性位點,因此,是有用的。另外,可將目標蛋白的氨基酸序列設定為查詢序列,由存儲結合于化合物的蛋白 的立體結構及氨基酸序列的蛋白數據庫等進行同一性檢索,將利用與目標蛋白的結構擬合 表示結構的相似性的指標為一定值以上的蛋白設定為家族蛋白。另外,其中,“已知結合于 蛋白的結合化合物”可為利用X射線結構分析或NMR結構分析等實驗性地確認蛋白-化合 物復合物的立體結構的化合物。另外,結合化合物僅已知結合于蛋白即可,可為利用公知的
            17對接算法(D0CK、AutoDoCk或GOLD等)或任意的坐標產生程序(Corina等)等預測為相對 目標蛋白具有穩定的構象的化合物。另外,其中,為了將結合化合物的三維坐標轉換到目標蛋白的坐標系,本虛擬篩選 裝置可進行家族蛋白和目標蛋白的結構擬合操作,將結合于家族蛋白的結合化合物與結合 化合物的坐標一同,從家族蛋白的坐標系轉換到目標蛋白的坐標系。例如,結構擬合操作可 利用不考慮原子的種類的蛋白之間的結構的擬合算法(CE等)實施,也可在目標蛋白和家 族蛋白的同一性高的情況下,進行考慮了原子的種類的結構擬合。另外,化合物指紋的提取不限于從結合化合物直接提取,也可根據對目標蛋白的 候選化合物的搜索的目標的需要加入任意的化合物指紋。例如,可參照與結合化合物不同 的其它化合物進行結構擬合,制作聯系結合化合物和其它上述化合物的原子間的新的化合 物指紋并加入到結合化合物指紋集,對基于Tanimoto系數與結合化合物類似的化合物,替 換結合化合物和該化合物的原子間原子的種類,使用可評價穩定性的程序(“circle”等) 計算相對于目標蛋白的相互作用能量,重新制作局部能量比結合化合物的化合物指紋更穩 定的化合物指紋作為“經修飾化合物指紋(Modified FP)”,并追加于結合化合物指紋集。 即,將與目標蛋白結合的理想的低分子化合物作為先導化合物,附加各種取代基,以使相互 作用能量變好,或在發現作為化合物指紋的定量化函數的Tanimoto系數與理想的低分子 化合物非常類似、即接近于1的任意的低分子化合物時,將化合物指紋區域限定于實驗性 地分析完的理想的低分子化合物的周圍的區域即4或5埃。由此,可容易地計算這些化學 結構相似的Tanimoto系數非常相似的化合物的對接結構和其相互作用分值。接著,本發明的虛擬篩選裝置對存儲于化合物數據庫的候選化合物,運算候選化 合物的相對于目標蛋白的立體結構,以使以將坐標固定的結合化合物指紋集的三維坐標作 為基礎計算的化合物指紋單元的均方偏差(rmsd :root-mean-square-deviation)為基礎 的相互作用分值最優化。S卩,在該最優化過程中,作為一例,本虛擬篩選裝置使候選化合物的構象反復變 化,按照候選化合物的各構象將候選化合物作為剛體反復并行或旋轉,基于Metropolis法 判定以均方偏差為基礎計算的相互作用分值,根據判定結果使候選化合物的化合物指紋變 更、增加或減少。其中,可隨機提取幾個化合物指紋,選擇成為基礎的坐標固定的結合化合 物指紋集。另外,也可代替通過隨機地變更候選化合物的可旋轉的二面角而使構象變化,而 像基因算法等那樣存儲以前的構象,使候選化合物的結構變化。另外,作為上述最優化過程中的相互作用分值的計算的一例,基于將在化合物指 紋單元中以均方偏差為基礎的候選化合物與目標蛋白的沖突程度、候選化合物在目標蛋白 的相互作用區域中的存在比例及候選化合物與目標蛋白的直接相互作用比例考慮在內的 函數而計算。更具體而言,相互作用分值基于以下的數學式(1)計算。數5FPAScore = F(aligned_fp, fp_rmsd, molecule)= BaseScore (aligned_fp, fp_rmsd)X fp_volume (molecule)X fp_contact_surface(molecule)(1)(其中,
            FPAScore為相互作用分值; F(aligned_fp, fp_rmsd, molecule)為將以下因素作為變量的函數■結合化合物和候選化合物間的化合物指紋單元的比對度及均方偏差、以及■候選化合物對目標蛋白的立體結構; BaseScore(aligned_fp, fp_rmsd)為表示化合物指紋單元的一致度及密集度 的指標; fp_volume (molecule)為表示以下因素的指標■候選化合物占由結合化合物指紋集的三維坐標構成的空間的比例、及■候選化合物與目標蛋白的沖突程度; fp_contact_surface (molecule)為表示以下因素的指標■候選化合物與目標蛋白的接觸度、及■候選化合物對結合化合物指紋集的三維坐標的歸屬度。)以上為本發明的處理的概要。如上所述,可基于根據最優化方法計算的相互作用 分值,確定候選化合物對目標蛋白的相互作用的順序,由化合物數據庫推定有效的候選化 合物,因此,可精度良好地預測蛋白和化合物的結合,并且可選出眾多“中的”化合物,另外, 可進行將生物化學實驗等的信息考慮在內的半經驗篩選,可提高預測效率。S卩,本發明為考察集體結合于與目標蛋白的立體結構相同或類似的家族蛋白的各 種低分子化合物(結合化合物)的構象接近于與目標蛋白相互作用的最穩定結構而完成的 發明。進而,本發明在對比結合化合物和候選化合物時,以容易操作的化合物指紋為單元, 進行適當的相互作用分值的記分而進行最優化,由此,可進行預測效率比現有方法提高了 的半經驗虛擬篩選。虛擬篩選裝置的構成首先,對本虛擬篩選裝置的構成進行說明。圖1是表示應用本發明的本虛擬篩選 裝置的構成的一例的框圖,該構成中,僅概念性地表示與本發明有關的部分。在圖1中,虛擬篩選裝置100概略地具備以下結構而構成 綜合控制虛擬篩選裝置100整體的CPU等控制部102、 與連接于通信線路等的路由器等通信裝置(未圖示)連接的通信控制接口部 104、 連接于輸入裝置112或輸出裝置114的輸入輸出控制接口部108、及 保存各種數據庫及表等的存儲部106,上述各部以經由任意的通信路線以可通信方式連接。進而,該虛擬篩選裝置100以經由路由器等通信裝置及專用線等有線或無線的通 信線路與網絡300以可通信方式連接。保存在存儲部106的各種數據庫及表(候選化合物DB106a 醫藥品化合物 DB106c)為硬盤裝置等存儲裝置,其保存用于各種處理的各種程序、表、文件、數據庫及網頁寸。在這些存儲部106的各構成要素中,候選化合物DB106a為對每個成為虛擬篩選的 候選的化合物(稱為“候選化合物”。)提取化合物指紋而制成的候選化合物數據庫裝置。另外,結合化合物指紋集106b為存儲對已知結合于立體結構和目標蛋白相同或類似的蛋白(稱為“家族蛋白”。)的化合物(稱為“結合化合物”。)、與轉換到目標蛋白的 坐標系的三維坐標一同提取化合物指紋而制成的結合化合物指紋集的結合化合物指紋存
            儲裝置。另外,醫藥品化合物DB106c為存儲對已知的醫藥品化合物提取化合物指紋而制 成的醫藥品化合物指紋集的MDL CMC Library等醫藥品化合物數據庫。S卩,醫藥品化合物 DB106C是以下述情況為目的而使用的為了使用醫藥品數據庫提取化合物信息,以藥物吸 收、藥物代謝、藥物排泄或藥物毒性等為指標,使用作為化合物指紋的整理的基礎的基礎數 據單元,制作預先整理好的藥物吸收、藥物代謝、藥物排泄或藥物毒性特殊化了的結合化合 物指紋集106b。另外,在圖1中,通信控制接口部104進行虛擬篩選裝置100和網絡300(或路由 器等通信裝置)之間的通信控制。即,通信控制接口部104具有經由和通信線路和其他終 端通信數據的功能。另外,在圖1中,輸入輸出控制接口部108進行輸入裝置112或輸出裝置114的控 制。其中,作為輸出裝置114,除監控器(包含家用電視機)之外,還可使用揚聲器(需要說 明的是,以下,有時將輸出裝置114稱為監控器)。另外,作為輸入裝置112,可使用鍵盤、鼠 標、記錄介質讀取裝置等。經由該輸入裝置112,輸入成為虛擬篩選的對象的目標蛋白或候 選化合物。另外,在圖1中,控制部102具有OS(操作系統)等控制程序、規定各種處理步驟 等的程序及用于保存所需數據的內部存儲器,利用這些程序等,進行用于實施各種處理的 信息處理。控制部102功能概念性地具備化合物指紋制作部102a、最優化部102b、篩選結 果輸出部102c、同一性檢索部102d而構成。化合物指紋制作部102a為從候選化合物、結合化合物或醫藥品化合物等化合物 中提取化合物指紋的化合物指紋制作裝置。例如,化合物指紋制作部102a對經由輸入裝 置112輸入的候選化合物提取化合物指紋,制作候選化合物指紋集,并保存于候選化合物 DB106a。另外,化合物指紋制作部102a從得到的醫藥品化合物中提取化合物指紋,制作醫 藥品化合物指紋集,并保存于醫藥品化合物DB106C。另外,化合物指紋制作部102a對已知結合于家族蛋白的結合化合物,將原子的三 維坐標轉換到目標蛋白的坐標系,與轉換成的三維坐標一同,提取化合物指紋,制作結合化 合物指紋集106b。即,化合物指紋制作部102a在目標蛋白的坐標系中,收集結合于其立體 結構的化合物集體的集體構象,對應附加于三維坐標,提取化合物指紋。換言之,化合物指 紋制作部102a伴隨化合物描述符的三維坐標,盡可能多地從結合于目標蛋白的化合物集 體提取被稱為化合物指紋的包含原子2個、3個或4個等原子的原子類型和原子間的結合規 則的化合物描述符,并將它們作成數據庫的表保存在存儲部106中,由此,制作結合化合物 指紋集106b。其中,為了將結合化合物的三維坐標轉換到目標蛋白的坐標系,化合物指紋制作 部102a可進行家族蛋白和目標蛋白的結構擬合操作,將結合于家族蛋白的結合化合物的 三維坐標(從家族蛋白的坐標系)轉換到目標蛋白的坐標系。例如,化合物指紋制作部102a 可利用不考慮原子的種類的蛋白之間(目標蛋白和家族蛋白)的結構擬合算法(CE等)進 行結構擬合操作,在目標蛋白和家族蛋白的同一性高的情況下,還可進行考慮原子的種類的結構擬合。另外,化合物指紋制作部102a不限于從結合化合物直接提取化合物指紋,其還可 根據對目標蛋白的候選化合物的搜索的目標的需要將任意的化合物指紋加入到結合化合 物指紋集106b。其中,化合物指紋制作部102a如圖1所示,具備新化合物指紋追加部102e 而構成。即,新化合物指紋追加部102e為制作從結合化合物直接提取的化合物指紋以外的 新化合物指紋并追加于結合化合物指紋集106b的新化合物指紋追加裝置。例如,新化合物 指紋追加部102e可參照與結合化合物不同的其它化合物進行結構擬合,制作跨越結合化 合物和其它上述化合物的原子間的新的化合物指紋,并加入到結合化合物指紋集106b中。 另外,新化合物指紋追加部102e可對基于Tanimoto系數與結合化合物類似的化合物,替換 結合化合物和該化合物的原子間原子的種類,使用可評價穩定性的程序(“circle”等)計 算針對目標蛋白的相互作用能量,重新制作局部能量比結合化合物的化合物指紋穩定的化 合物指紋作為“經修飾化合物指紋(Modified FP)”,并追加于結合化合物指紋集106b。最優化部102b為最優化裝置,其對存儲在候選化合物DB106a的候選化合物,運算 該候選化合物的相對于目標蛋白的立體結構,以使將存儲在結合化合物指紋集106b的化 合物指紋的三維坐標作為基礎計算化合物指紋單元的均方偏差(rmsd)并以該均方偏差為 基礎的相互作用分值最優化。例如,最優化部102b對每個生成的候選化合物的該構象及相 對于目標蛋白的三維坐標,基于Metropolis法判定以均方偏差為基礎計算的相互作用分 值,根據判定結果使候選化合物的化合物指紋變更、增加或減少。其中,最優化部102b也可 從結合化合物指紋集106b隨機提取幾個化合物指紋,選擇成為基礎的坐標固定的結合化 合物指紋集。其中,如圖1所示,最優化部102b具備相互作用分值計算部102f、結構變換部 102g而構成。相互作用分值計算部102f為在利用最優化部102b進行最優化過程中,基于將在 化合物指紋單元中以均方偏差為基礎的候選化合物與目標蛋白的沖突程度、候選化合物在 目標蛋白的相互作用區域中的存在比例及候選化合物與目標蛋白的直接相互作用比例考 慮在內的函數而計算相互作用分值的相互作用分值計算裝置。需要說明的是,對于利用相 互作用分值計算部102f的相互作用分值的計算的具體例,在以下的處理的說明中詳細敘 述。另外,結構變換部102g為在利用最優化部102b進行的最優化過程中,使候選化合 物的構象反復變化,并基于模擬退火法,按照該候選化合物的各構象將該候選化合物作為 剛體反復并行或旋轉的結構變換裝置。另外,結構變換部102g還可代替通過隨機地變更候 選化合物的可旋轉的二面角而使構象變化,而像基因算法等那樣,存儲以前的構象,使候選 化合物的結構變化。篩選結果輸出部102c為基于利用最優化部102b進行最優化的相互作用分值而確 定候選化合物對目標蛋白的相互作用順序,并輸出虛擬篩選結果的結果輸出裝置。同一性檢索部102d為基于與目標蛋白的氨基酸序列的同一性,由蛋白數據庫裝 置檢索家族蛋白及結合化合物的同一性檢索裝置。即,同一性檢索部102d為了得到結合化 合物,將目標蛋白的氨基酸序列設定為查詢序列,通過對外部系統200等蛋白數據庫進行 查詢,進行同一性檢索,得到結合于相對目標蛋白具有同一性的蛋白的結構已知的結合化 合物。
            如圖1所示,本虛擬篩選裝置100可經由網絡300和提供與氨基酸序列信息或蛋 白立體結構信息有關的外部數據庫、或進行序列或立體結構的比對等的外部程序等的外部 系統200以可通信方式連接而構成。需要說明的是,網絡300具有相互連接虛擬篩選裝置 100和外部系統200的功能,例如為因特網等。S卩,在圖1中,外部系統200經由網絡300與虛擬篩選裝置100相互連接,具有 提供與氨基酸序列信息或蛋白立體結構信息有關的蛋白數據庫等外部數據庫(PDB或 PSI-Blast等)、或進行序列或立體結構的比對等的外部程序等的功能。其中,蛋白數據庫 不限于利用X射線結構分析或NMR結構分析等實驗性地確認蛋白-化合物復合物的立體結 構的數據庫,其也可保存已知僅結合于蛋白的化合物。此時,上述化合物指紋制作部102a 利用公知的對接算法(D0CK、AutoDoCk或GOLD等)或任意的坐標產生程序(Corina等)等, 預測相對目標蛋白具有穩定的構象的結合化合物的結構,并應用于結合化合物指紋集106b 的制作。虛擬篩詵裝置100的處理接著,下面,參照圖2對這樣構成的本實施方式中的本虛擬篩選裝置100的處理的 一例進行詳細說明。圖2是表示虛擬篩選裝置100的處理的一例的流程圖。如圖2所示,首先,同一性檢索部102d基于經由輸入裝置112輸入的目標蛋白的 氨基酸序列,由外部系統200等的蛋白數據庫對與特定的化合物(結合化合物)結合的立 體結構已知的家族蛋白進行同一性檢索(步驟SA-1)。然后,化合物指紋制作部102a使目標蛋白的結構和伴隨結合化合物的家族蛋白 的結構擬合(步驟SA-2)。其中,化合物指紋制作部102a可進行不考慮原子的種類的蛋白 之間的結構擬合,在目標蛋白和家族蛋白的同一性為規定值以上的高的情況下,也可進行 考慮原子的種類的結構擬合。然后,化合物指紋制作部102a將結合化合物的三維坐標從家族蛋白的坐標系轉 換到目標蛋白的坐標系(步驟SA-3)。然后,化合物指紋制作部102a與轉換到目標蛋白的坐標系的結合化合物的三維 坐標一同,從結合化合物提取化合物指紋,并保存于存儲部106,由此,制作結合化合物指紋 集106b(步驟SA-4)。其中,新化合物指紋追加部102e可根據對目標蛋白的候選化合物的 搜索的目標的需求加入任意的化合物指紋(“Modified FP”)。另外,化合物指紋制作部 102a可通過求出存儲在結合化合物指紋集106b中的化合物指紋集和存儲在醫藥品化合物 DB106C中的化合物指紋集的交集,進行與醫藥品化合物相似的結構的壓縮。然后,最優化部102b對存儲于候選化合物DB106a的候選化合物,從結合化合物指 紋集106b中選出成為計算相互作用分值的基礎的坐標固定的化合物指紋(步驟SA-5)。然后,最優化部102b對候選化合物運算候選化合物的相對于目標蛋白的立體結 構,以使將選出的化合物指紋的坐標固定的三維坐標作為基礎而計算化合物指紋單元的均 方偏差并進行最小二乘擬合的以該均方偏差為基礎的相互作用分值最優化(步驟SA-6)。 即,最優化部102b通過相互作用分值計算部102f的處理,計算從結合化合物指紋集106b 中任意選擇的、以目標蛋白的坐標固定的化合物指紋作為基礎以化合物指紋之間的三維坐 標的均方偏差為基礎的相互作用分值。而且,最優化部102b以相互作用分值為指標,實施 以Metropolis法為基本的模擬退火法,以使通過結構變換部102g的處理而變換的候選化
            22合物的構象及相對于目標蛋白的結構最優化。而且,篩選結果輸出部102c基于利用最優化部102b進行最優化的相互作用分值, 確定候選化合物DB106a中的候選化合物的相對于目標蛋白的相互作用順序,將虛擬篩選 的結果輸出到輸出裝置114(步驟SA-7)。例如,篩選結果輸出部102c利用最優化部102b 對每個候選化合物得到的最高點的相互作用分值,按降序重排候選化合物群而輸出。以上,虛擬篩選裝置100的處理結束。相互作用分倌的計算接著,以下說明利用相互作用分值計算部102f的相互作用分值的計算方法的一 例。相互作用分值計算部102f基于將在化合物指紋單元中以均方偏差為基礎的候選化合 物與目標蛋白的沖突程度、候選化合物在目標蛋白的相互作用區域中的存在比例及候選化 合物與目標蛋白的直接相互作用比例考慮在內的函數,計算相互作用分值。更具體而言,相 互作用分值基于以下的數學式(1)計算。數6FPAScore = F(aligned_fp, fp_rmsd, molecule)(其中, FPAScore為相互作用分值; F(aligned_fp, fp_rmsd, molecule)為將以下因素作為變量的函數■結合化合物和候選化合物間的化合物指紋單元的比對度及均方偏差、以及■候選化合物對目標蛋白的立體結構; BaseScore(aligned_fp, fp_rmsd)為表示化合物指紋單元的一致度及密集度 的指標; fp_volume (molecule)為表示以下因素的指標■候選化合物占由結合化合物指紋集的三維坐標構成的空間的比例、及■候選化合物與目標蛋白的沖突程度; fp_contact_surface (molecule)為表示以下因素的指標■候選化合物與目標蛋白的接觸度、及■候選化合物對結合化合物指紋集的三維坐標的歸屬度。)更具體而言,上述數學式(1)中的各項在本實施方式中基于以下的數學式計算。<BaseScore (aliRned fp,fp rmsd)工貢 >該項為考慮化合物指紋單元的一致度及密集度的函數。數7

            =BaseScore (aligned_fp, fp_rmsd) Xfp_volume(molecule) Xfp_contact_surface(molecule) (其中,
            RawScore (aligned_fp)為基于在結合化合物和候選化合物間比對的化合物指紋 中的原子數的指標,fp_rmsd為均方偏差。)上式的RawScore (alignecLfp)具體利用以下的數學式(3)計算。數8
            (其中,aSSigned_SCOre(i)為預先賦予第i個比對的化合物指紋的基于以下的式 子的分值。)更詳細而言,assigned_score(i)由以下的數學式(4)求出。數9
            (其中,total_atom(i)為構成該第i個比對的化合物指紋的原子數,例如由4個原子構成 的化合物指紋時為4。Casel_S、Case2_S、Case3_S為滿足下述敘述的條件時賦予的標量值。n_neighbor_atom(i)為后述接近于第i個原子集的屬于相同化合物指紋的原子 數。)例如,關于Casel_S,對存在于結合化合物指紋集的一個結合化合物,進行深度優 先搜索(d印th-first search)(參照“C 7 ;i 3"丨J丈A全科基礎眾b v y -i ^ t ^ ISBN4-7649-0239-7近代科學社”)至個4原子(例如C. ar-N. ar_C. ar_C. ar等化合物指 紋)。在本實施方式中,至4個原子時結束搜索,因此,不考慮環結構的數。g卩,不區別苯環 和萘環。搜索成功時,對構成化合物指紋的各原子賦予分值(Casel_S)。其中,將每個原子 的標量值設定為5. 0。S卩,由4個原子構成的化合物指紋為20. 0,如果為3個原子,則賦予 15. 0。另外,Case2_S為使用由Casel得到的化合物指紋制作新的化合物指紋時即選擇 以某一定的距離擬合的任意的兩個化合物指紋并用虛擬的鍵連結原子而制作新的化合物 指紋時各原子具有的一定的分值的情況。默認值可使用2.5。另外,Case3_S為利用生物化學信息或能量計算在有可能存在原子的情況下賦予 的任意的標量值。其中,(^%3_5在使用訓練集的驗證計算中不采用。其中,在上述Casel_S、Case2_S的制作過程中得到的化合物指紋必需屬于由可識 別結合規則信息和原子類型的已知醫藥品數據庫得到的化合物指紋集。另外,在Casel_S和Case2_S、Case3_S的制作過程中,在屬于相同化合物指紋的坐標間,將原子坐標集和其 它原子的距離在dist (默認值為1.0人)以內的原子的個數的自然對數加在fp的坐標的分 值中。需要說明的是,在結合化合物中,化合物的大部分為連接有氨基酸殘基的肽時,肽基 多且化合物指紋的對應關系復雜,因此,在相互作用分值的計算過程中過小評價其對應關 系,在關于RawScore的上述數學式中,可使對應于肽的部分的化合物指紋的數學式(3)的 部分為零等過小評價的數字。上述數學式(2)的右邊分母由以下的數學式(5)求出。數101. 0+ln(fp_rmsd**kl+l. 0)(5)(其中,In為自然對數。kl使用4. 0作為最優化的結果。fp_rmsd為最小二乘擬合時的rmsd。kl為確定使fp的擬合的精度絕對有多嚴密的比例因子,為其大時rmsd大(差)、 即使數學式(3)的RawScore (分值)變小的常數。)<fp volume (molecule)項〉該項為評價候選化合物占由結合化合物指紋集的三維坐標構成的空間的比例、即 以怎樣的程度充滿由結合化合物指紋集得到的化合物指紋構成的空間及與目標蛋白的沖 突的函數。數11
            (其中,nafp (覆蓋指紋的配體原子數,Number of Ligand Atom coveringFingerprint) 為在基于結合化合物指紋集的三維坐標的固有網格點區域中候選化合物的三維坐標所占 的網格點數,nap (覆蓋蛋白的配體原子數,Number of Ligand Atom coveringProtein)為在目 標蛋白的立體結構中的原子的固有網格點區域中候選化合物的三維坐標所屬的網格點數,k2及k3分別為系數,為可根據目標蛋白的生物化學信息、誘導契合的程度等而變 更的任意的常數,在本實施方式中,默認值使用1.0。)〈fp contact surface (molecule)項>該項為考慮候選化合物與目標蛋白的接觸度及對結合化合物指紋集的三維坐標 的歸屬度的函數。數12
            (其中,n為候選化合物的原子數,atom(i)為候選化合物的第i個原子的三維坐標,density_of_atom(atom(i))為在該原子的三維坐標屬于結合化合物指紋集的化 合物指紋時返回以所定距離與化合物指紋的原子接觸的目標蛋白的原子數和屬于化合物 指紋的同一網格點的結合化合物的原子數之和的函數,total_density_of_atom(molecule)為將按降序重排的所述 density_of_atom 分 布依次累加所述候選化合物的原子數項的數。)更詳細而言,density_of_atom(atom(i))用以下的數學式(8)表示。數13
            在該式中,如果構成候選化合物的原子的坐標不屬于來自結合化合物指紋集的化 合物指紋的情況為0,則屬于的情況按照上述的式子計算分值。g卩,nfpcontact為以某種一定的距離(默認值為3. 8)與屬于化合物指紋的原子 接觸的候選化合物的原子的個數。另外,natom為構成來自屬于同一網格點的結合化合物 集的化合物的原子數。對為相同的結合化合物且PDB的ID代碼不同的情況,可適當變更, 但在本實施方式中允許重復而計算。另外,hi是特別是有重要的生物化學信息的情況時使 用的,默認值使用0。S卩,由利用“Circle”等3D-1D法表明與目標蛋白穩定接觸時導入的 Modified FP(經修飾FP)產生。接著,對total_density_of_atom(molecule)的數學式進行以下描述。數14
            (其中,total為化合物的原子(molecule的atom)數。另外,sort_density_of_atom是從大到小依次重排density_of_atom的分布。艮口, 分子大時,加上大的數值,因此,total_density_of_atom變大。)以上,完成了利用相互作用計算部102f的相互作用分值的計算方法的一例的說明。利用樽擬退火的相互作用分倌的最大化接著,對基于利用上述的相互作用分值的計算方法計算所得的相互作用分值,并 按照利用最優化部102b的模擬退火將候選化合物的構象及配置最優化的處理的一例進行 以下說明。首先,結構變換部102g通過隨機地變更候選化合物的可旋轉的二面角而使構象 變化。在本實施方式中,構象變化進行1000次。該數目越多,可得到越好的結果,但需要對虛擬的候選化合物DB106a中所含的許多低分子化合物進行對接計算,因此認為,需要設定 為有限的次數大小,即使依賴于候選化合物的旋轉自由度,預計算中該次數也足夠。需要說 明的是,初期的構象可設定為注冊于候選化合物DB106a中的相對于家族蛋白的結合構象。 最優化部102b對每個該變化的構象,在以下的處理中使用候選化合物的坐標。然后,最優化部102b從結合化合物指紋集106b的化合物指紋帶(fp bands)隨機 地選擇10個化合物指紋。需要說明的是,不足10個時,使用化合物指紋帶的最大數的一 半。更具體而言,從選擇的化合物指紋帶隨機地選擇候選化合物及結合化合物指紋集106b 的化合物指紋的原子坐標。將該狀態稱為指紋比對(fingerprint alignment)。而且,以其 對應關系進行最小二乘擬合,使用此時的擬合的均方偏差(rmsd)和擬合后的候選化合物 的原子坐標,利用上述的式子計算相互作用分值。然后,結構變換部102g在重復第二次以后將前次的狀態存儲于存儲部106,保持 候選化合物的構象、即將候選化合物作為剛體進行并行、旋轉,進行一個化合物指紋的增 加、減少及原子坐標集的對應關系的變更、追加。在本實施方式中,進行10000次該工序。在該過程中,最優化部102b進行Metropolis (Metropolis)判定。S卩,最優化部 102b與前次的相互作用分值相比,如果這次的相互作用分值大,則采用(accept)該候選化 合物的配置,相反,如果相互作用分值小,則基于以下的數學式計算采用概率(Paccept)。數15A分值=分值(這次)-分值(前次) BP,由于采用概率Paccept的范圍為0 < Paccept ( 1,因此,最優化部102b此時 使0彡r彡1的范圍的均勻隨機數同時產生,如果為r < Pacc印t,則也采用相互作用分值 比前次小的情況。需要說明的是,在模擬退火(退火)過程中,T(溫度)從30K開始,下降 到 0. 07K。這樣,最優化部102b計算一個構象的相互作用分值的最大值,對初期產生的1000 個構象進行比較,將相互作用分值最大的結構預測為最佳的目標蛋白-候選化合物復合物 (Protein-Ligand complex)結構。此時,在對1000個構象賦序的過程中,可通過代替隨機 地產生構象而利用遺傳算法等,存儲以前的構象,用某些算法改變配體結構,在計算時間或 最大值的搜索中下功夫。在1000次的計算過程中,為了確定配體構象的順序,使用GOLD程 序中采用的基因算法等,可得到具有計算時間縮短或配體構象更接近于真實的可能性的最 小分值。以上,完成了利用模擬退火的相互作用分值的最大化的說明。[Tanimoto 才旨數在制作化合物指紋集時,作為衡量化合物間的類似的尺度,例如,可使用Tanimoto 系數(Tc)為0. 08以上的低分子化合物集。由Sybyl原子類型之類的各種化合物的化合物 指紋即化學描述符確定化合物指紋(fp)時,Tanimoto系數(Tc)如下所述進行計算。數16
            (其中,a為化合物指紋存在于結合化合物和候選化合物兩者的FP帶(fpbands)的個數,b、c為fp僅存在于單側FP帶的個數。)對相同情況使用集合(assembly)進行說明時,如果將A、B設定為各個FP帶具有 的化合物指紋的集合,則也可說為以下的式子。數17

            (其中,number_of_fp(集合)為屬于某集合(assembly)的化合物指紋的數。)以上,完成了 Tanimoto指數的說明。實施例實施例1接著,參照以下的圖3 圖29對應用本發明的本實施方式的實施例1進行詳細說 明。需要說明的是,在以下的實施例中,有時用“CElib” (FP(fingerprint) set extracted from collected ligands in the bindingsite)這樣的名稱稱呼結合化合物指紋集106b。半經駘地,詵擇關干配體對梓的牛物學信肩、的方法的開發(Developmentof choosing biological information semi-empirically onthe LiRand Docking)]近年來,伴隨計算機的速度的提高,在醫藥品開發的領域中,蛋白的立體結構預 測法及其立體結構的評價參考文獻Terashi G,Takeda-Shitaka M, Kanou K, Iwadate M, Takaya D, Hosoi A, OhtaK, Umeyama HProteins 2007,69 (S8) :98_107得到改良。 例如,作為蛋白的立體結構的預測法之一的同源模建(Homology Modeling)利用注冊 T PDB(Protein Data Bank)# # t ■ :Westbrook et alNucleic Acids Res. 2003 Jan 1 ;31(1) :489-91的結構的增加和除去膜蛋白進行參照的模型(Template)的增 加及CASP(蛋白結合預測技術的臨界評估,the Critical Assessment of Techniques for ProteinStructure Prediction)中的盲試(blind test),其預測精度提高參考 文獻Takeda-Shitaka, M. , Terashi, G. , Takaya, D, Kanou, K. , Iwadate, M. , Umeyama, H. Protein structure prediction in CASP6using CHIMERA and FAMS. Proteins 61, 122-127(2005)。而且,該同源模建的立體結構預測法的應用范圍被擴大至突變 (mutation)的影響引起的活性變化的預測參考文獻中町祐司、河野誠司、矩口真理 子、野口依子、木下承皓、加納和彥、寺師玄記、竹田一志鷹真由子、近藤信一、熊谷俊一、 P04-08“Ala54Thr及Ala249Glu突變抗凝血酶的計算機 建模分析”、藥物設計參考文獻 Takede-Shitaka, M.,Takaya, D.,Chiba, C.,Tanaka, H.,& Umeyama, H. Curr. Med. Chem. 11, 551-558(2004)等方面。另外,與注冊于PDB的蛋白的立體結構的增加同時,蛋白-配體復合物 (Protein-Ligand complex)的X射線結構分析結果也增加,在一個家族蛋白內,也常存在 分析完的多個X射線結構參考文獻Edgar R.Wood et al CANCER RESEARCH 2004 64 6652-6659,參考文獻 Jennifer et al J. Bio. Chem. 2002 Vol. 277,No. 48,46265-46272。另外,在上述CASP中,進行預測蛋白的結合位點(binding site)的殘基的試驗等參考文 獻:Lopez, G, Rojas, A, Tress, M, Valencia, A Proteins, 2007,69 (S8) : 165—174、蛋白-配 體復合物(Protein-Ligand complex)的預測精度的提高的重要性也正在升高。另一方面,近年來,盛行通過實驗確定病原蛋白(參考文獻Nature等),抑制所述 蛋白的抑制劑的設計的必要性正在逐漸升高。作為用于抑制劑的設計的有力的方法,有基于目標蛋白的立體結構的抑制劑設計 (SBDD),目前正在進行使用蛋白-配體復合物(Protein-Ligand complex)預測軟件(所謂 的對接軟件)的虛擬(In-silico)篩選。其中,圖3是表示利用有效地使用現有的對接軟 件和蛋白_配體復合物的多個X射線結構或NMR結構的生物信息學的本實施例所述的對接 方法的狀況圖。如圖3所示,在已知的對接軟件中,AutoDock參考文獻Goodsellet al J. Mol. Recognit 1996 91-5、DOCK參考文獻Ewing et al JComput Aided Mol Des. 2001 15(5)411-28、GOLD參考文獻Gareth et al J Mol. Biol. 1997 267,727-748等采 用使用氫鍵、疏水性相互作用、靜電相互作用之類的經典物理學勢函數的第一原理方法 (Ab-initio Approach) 0利用各種各樣的驗證,這些現有的軟件可以良好的精度進行對接 (例如利用隱藏正確結構的盲試(blind test)驗證可在正確結構中以rmsd2.0以下預測 的比例)參考文獻0noderaet al J Chem. Inf. Model. 2007,47,1609-1618,參考文獻 Michael etal J. Med. Chem. 2007,50,726—741。另外,為了精度良好地對接可旋轉的鍵多的化合物,也研究在配體結合位點 (ligand binding site)預先采用勢函數配置化合物的片段這樣的方法參考文獻Budin et al Biol Chem. 2001 382(9),1365-72。為了使用現有的對接軟件,向目標蛋白對接抑制劑候選化合物,并預測蛋白-配 體復合物(Protein-Ligand complex)的結構后,從虛擬化合物庫中選擇“中的”化合物 (Hit Compound),也報道有許多以下嘗試由已知的蛋白-配體復合物(Protein-Ligand complex)的結構進行蛋白和配體間的距離、經典物理學能量的計算等,提取相互作用信 息,進行用于選擇眾多“中的”化合物的再評價參考文獻Sukumaran et al Eur. J. Med. Chem. 2007,42,966-976,參考文獻Zhan et al J. Med. Chem. 2004,47,337-344。但是,上述一系列的研究表明,雖然現有的對接軟件可以良好的精度預測蛋 白-配體復合物(Protein-Ligand complex),但是,該情況是指,與直接從虛擬化合物庫中 選擇眾多“中的”化合物(HitCompoimd)不一致(沒有直接聯系)。BP,目前,雖然可精度良好地預測蛋白-配體復合物(Protein-Ligand complex) 的結構,但還必需要求開發出可從虛擬庫檢測出許多“中的”化合物(Hit Compound)的系 統,這在制藥中是必不可少的。在這種狀況下,本申請發明人開發出下述的系統ChooseLD(CH00se information Semi-Empirically on the Ligand Docking)在蛋白-配體復合物(Protein-Ligand complex)相互作用的評價中不使用經典物理學的勢函數,而由注冊于PDB的相互作用已 知的蛋白-配體復合物(Protein-Ligand complex)的生物化學信息有效地選出有效的信 息,進行對接并預測蛋白-配體復合物(Protein-Ligandcomplex)的結構,且可檢測出許 多“中的”化合物(Hit Compound) 0另外,利用本申請發明人的方法,在蛋白-配體復合物
            29(Protein-Ligandcomplex)的相互作用中不使用經典物理學勢函數。因此,本發明的方法期 待在不能稱之為相互作用的物理學能量得到最優化的蛋白-配體復合物(Protein-Ligand complex)結構的最優化中作為物理方法的CHARMM參考文獻Brooks,R. B, Bruccoleri, E. R. , Olafson, D. B. , States, J. D. , Swaminathan, S. & Karplus, M. CHARMM Aprogram for macromolecular energy, minimization, and dynamicsealculations J. Comp. Chem. 4 187-217(1983),AMBER參考文獻Case,A.D.,Cheatham III, E. T. , Darden, T.,Gohlke, H. , Luo, R. , Merz Jr. , M. K. , Onufriev, A. , Simmerling, C. , Wang, B. & Woods, J. R. The Amber Biomolecular Simulation Programs JComput Chem 26 1668-1688 (2005)]及量子 化學參考文獻Fedorov, G. D. & Kitaura, K. Extending the Power of Quantum Chemistry toLarge Systems with the Fragment Molecular Orbital Method J. Phys. Chem. Ill 6904-6914 (2007)有效地發揮作用。本實施例1的概要其中,下面,使用圖4對本實施例的概要進行說明。圖4是利用本實施例 (ChooseLD)的蛋白-配體對接的原理構成圖。其中,在本實施例中,庫配體(LIBRARY LIGANDS)相當于結合化合物的集合,CELib相當于結合化合物指紋集106b。其中,在圖4中,各圓柱表示數據的集合,橢圓表示輸入信息,長方形表示輸出結 構。平行四邊形為作為化學描述符的化合物指紋(FP fingerprint)。由于全部的過程在 計算機(虛擬篩選裝置100)上進行,因此,輸入的信息為作為電子信息的文件。即,虛擬以 PDB形式所代表的形式記載的目標蛋白的三維坐標文件、對接的配體的三維坐標文件。在圖4中,箭頭主要是指數據的集合的壓縮或輸入信息的修飾等變換操作,變換 操作可指定詳細的條件。但是,這些變換操作規定既定的值,如果輸入信息以文件形式且輸 入的蛋白的坐標在物理化學上為正常,則可以全自動地得到輸出。即,如果輸入目標蛋白 的三維坐標文件和對接的候選配體的三維坐標文件,則輸出蛋白_配體復合物結構的三維 坐標文件。蛋白的三維坐標及氨基酸序列作為用于同源性檢索、相當于結合化合物指紋集 106b的FP庫的構建、對接計算的蛋白立體結構的三維坐標而被使用,目標的候選配體相當 于候選化合物,其用于候選蛋白特異性FP帶、配體的三維構象搜索。S卩,如圖4所示,首先,本實施方式所述的虛擬篩選裝置100通過同一性檢索部 102d的處理,對于目標蛋白,對PDB等蛋白結構數據庫進行同一性檢索,通過化合物指紋制 作部102a的處理,利用相同的蛋白和結構比對進行擬合(fitting),與轉換到目標蛋白的 坐標系的三維坐標一同,提取化合物指紋,制作相當于結合化合物指紋集106b的目標蛋白 定向性配體群(C)。然后,虛擬篩選裝置100向相當于醫藥品化合物DB106c的醫藥品(druggable)FP 數據庫⑶查詢目標蛋白定向性配體群(C),以交集(c) A⑶得到目標蛋白特異性FP帶 (L)。其中,目標蛋白定向性配體群(C)可通過新化合物指紋追加部102e的處理,追加經修 飾的FP等虛擬FP。接著,虛擬篩選裝置100從虛擬配體庫或基準集的目標蛋白和進行對接的配體 (對接的配體)即候選配體提取化合物指紋,制作相當于候選化合物DB106a的候選配體的 FP 帶(R)。然后,虛擬篩選裝置100通過結構變換部102g的處理,使候選配體的構象變化,在目標蛋白定向性配體(C)和候選配體的FP帶(R)間進行FP比對。然后,虛擬篩選裝置100通過最優化部102b的處理,使用相互作用分值函數在目 標蛋白的結合位點對接候選配體時,一邊使用模擬退火(SA)法使相互作用分值最優化,一 邊進行目標蛋白-候選配體復合物的三維結構預測。以上為本實施例的概要。庫配體所謂庫配體(LIBRARY LIGANDS),相當于結合化合物的集合。即,虛擬篩選裝 置 100 在通過利用 PSI-Blast參考文獻Altschul et alNucleic Acids Res. 1997 27(17)3389-402的同一性(Homology)檢索檢測所得的蛋白中,所述蛋白為蛋白-配體 復合物(Protein-Ligandcomplex)時,使用作為立體結構比對產生程序的CE參考文獻 Shindyalov et al Protein Engineering 1998 11 (9) 739-747進行目標蛋白和同源蛋白 間的比對,利用最小二乘法(least square fitting)與目標蛋白擬合。然后,利用所述最 小二乘擬合的Z-Score為3. 7以上時,庫配體將結合配體轉換到目標蛋白的坐標系,僅提取 結合配體。需要說明的是,在本實施例中,Z-Score低于3. 7時,不用作結合化合物。該數值的 根據是,依據 CE 時,“3. 7 4. 0-twilight zone wheresome similarities of biological significance can be seen ; ”(呈現具有生物學意義的相似性的中間區域),因此,采用 3.7以上。同源性檢索的最低同源性在本實施例中設定為同一性(Homology)0. 以上。 即,用同源性檢索檢測出的類似蛋白的大部分利用CE進行擬合。FP的定義及FP帶的構津對FP帶(fp band)的制作方法,以下參照圖5進行詳細說明。其中,在定義本 實施例中使用的化合物指紋(fp fingerprint)之前,對化合物指紋的解釋進行說明。化 合物指紋(fingerprint,以下稱為“FP”。)是在化學信息學領域中用于計算表示化合物 的特征的向量或化合物間的相似性而使用的計算機上的表現法之一(Swamidass,S. J. & Baldi, P. Mathematical Correction for Fingerprint SimilarityMeasures to Improve Chemical Retrieval J. Chem. Inf. Model. 47,952—964(2007))。在本實施例中,不以FP的正確的解釋為目的,為了避免混亂,下述的用語統一。用 要素中具有考慮原子類型(或原子類型)、原子結合的順序等的組合的向量表現一個分子 時,將向量的要素設定為“FP”,將向量設定為“FP向量”。在本實施例中,有時在向量的要 素中僅附加原子類型的字符串表述以上的信息,所述附加信息也解釋為表現分子的特征之 一,是指其向量的要素時,也設定為“FP”,將要素中具有所述FP的向量與通常的“FP向量” 區別,設定為“FP帶”。該情況是指“FP帶”也同時具有“FP向量”中的各要素為原子類型 的性質。其中,圖5是表示FP(指紋)的制作方法的一例的圖。在本實施例的ChooseLD法中,以使用相互作用已知的蛋白_配體復合物結構、以 滿足自由能的最小化的方式預測對接的未知的配體結構為目的,為了實現該目的,由相互 作用已知的配體定義作為保持有部分的結合自由能的部件的FP (指紋)。圖5中作為一例 表示的化學物質的物質名為AZD2171 (Cancer Res 2005 ;65 (10), May 15,2005) 如圖5所 示,通過使用給予的結合規則信息搜索原子而制作FP。搜索的原子數為2、3、4個(該數是 有理由的,因此在后面敘述)。各個包圍的線是指計算的FP。a表示的FP為搜索到2個原 子的情況,b表示的FP為搜索到3個原子的實例。c和d表示的FP分別為4個的情況,該情況允許經過相同的原子。e表示的FP搜索到坐標不同但相同的原子種類,且加上后述的 相互作用分值函數的FP的重復度。g卩,圖5的化合物的包圍鍵上的線的部分是指在ChooseLD法及化合物的相似性的 比較中也使用的FP的原子類型表述。以化合物上的任意的原子為基點,使用深度優先搜 索法(Chiba et al C algorithmZENKA 1995 ISBN4-7649-0239-7),按照給予的配體的原 子間結合信息經過原子,經過的鍵的數設定為1、2、3。即,由苯環和萘環構建的原子類型表 述相同,區別不出環結構差異。一個原子使用Sybyl原子類型(Tripos Inc. , 1699 South Han ley Road, St Louis, M063144-2913,USA (http: //www. tripos, com))表現,其中定義以 AMBER99 (J. Comput. Chem. 26,1668-1688(2005))為參考的原子量、原子半徑、可鍵合數。在 該時刻僅考慮FP的原子類型,不考慮經過的原子坐標。其中,圖6為表示本實施例中使用 的原子的字符串列表。利用Tanimoto系數的化合物間的相似件計算下面,對利用Tanimoto系數的化合物間的相似性計算方法進行說明。其中,圖7 是表示利用Tanimoto系數的化合物間的相似性計算方法的示意圖。在本實施例中,為了計算化合物間的相似性而導入Tanimoto系數(以下稱為Tc) (J. Chem Inf. Comput. Sci. 40,163-166 (2000))。一般而言,Tc 為將由兩位即 0 或 1 構成的 向量的類似度數值化而得的值。如圖7所示,在本實施例中,對成為對象的一個低分子化合 物,使用由上述導入的FP構建法制作FP向量,如果存在向量上定義的FP,則賦予1,如果不 存在,則賦予0。由此制得的長度相同且對應的成分由表示相同FP的兩個向量評價化合物 間的相似性。Tc利用下述的數學式計算。其中,兩個向量對應的位同時為on時,在a上加算1, 如果僅一個向量位為on,則在b或c上加算1。S卩,不加上相互off時的d,在Tc計算中不 考慮。例如,在圖7所示的2個位列間,為& = 9^+0 = 7,!^ = 9/(9+7) = 0.5625。數I8
            在本實施例中,FP帶(fp bands)由屬于結合化合物的庫配體(LIBRARAY LIGANDS)的低分子化合物的集合得到,比較來自形成集合的低分子化合物的某兩個FP帶 (fp bands)時,Tanimoto系數(Tc)必需為0. 08以上。換言之,在上述數學式中,a為FP 存在于兩個 FP 帶中的個數(the number of fp existing in each fp bands)。另夕卜,b、c 為 FP 僅存在于一個 FP 帶的個數(the number of fp existingin the other fp band)。使用集合(assembly)說明相同的情況時,如果將A、B設定為具有各個帶的FP的 集合,則如下表示。數19
            其中,number_of_fp (集合)為屬于某集合assembly的fp的數。FP庫的構建
            所謂FP庫,相當于結合化合物的集合,為本實施例的ChooseLD法中使用的FP的 原子類型表述的來源,而且為成為注冊于構建的FP的原子坐標的起源的配體群。通常,從 目標蛋白的一級結構、即由將氨基酸序列設定為查詢序列的同源性檢索等檢測的家族蛋白 收集,但不限于家族蛋白,即使是被認為結合于目標蛋白的活性位點等目標位點的配體或 蛋白、肽等,只要需要,就可追加。在本實施例的ChooseLD法中,主要由家族蛋白構建FP庫。在通過利用 PSI-Blast (Nucleic Acids Res. 27,3398-3402 (1997))的同源性檢索檢測得到的三維 坐標結構已知的蛋白中,為蛋白-配體復合物時,使用CE(Protein Engineering 11, 739-747 (1998)),進行目標蛋白和家族蛋白的立體結構比對。CE為安裝有將兩個蛋白與氨 基酸序列相似性無關地使用立體結構類似的部分進行比對的算法的程序,在其它立體結構 比對的程序中,存在 Dali (J. Mol. Biol. 233,123-138 (1993)),T0P0FIT (Protein Science 13,1865-1874(2004))等。描述這些主要的差異時,CE通過從N末端依次擬合氨基酸序列 等的改良,可快速地得到結果,但在對象蛋白中存在結構域交換等時,難以精度良好地進行 比對,此時,使用進行不依賴于氨基酸序列的順序的比對的Dali等的一方精度好。在本實施例的ChooseLD法中,主要擬合由PSI-Blast檢測的家族蛋白,因此,使用 計算時間短的CE。使用CE輸出的比對,利用最小二乘擬合來與目標蛋白擬合。CE的比對 的Z-Score為3. 7以上時,將結合配體轉換到目標蛋白的坐標系,僅提取結合配體。即,在 本實施例中,僅將結構上與目標蛋白類似的蛋白用作家族蛋白。FP帶的構津FP帶作為附加信息,為附加關聯有一個或多個原子坐標的FP的向量,由屬于FP庫 的結合配體的集合得到。在屬于得到的集合(FP庫)的結合庫中,包含目標蛋白的坐標系 中的坐標及用Sybyl原子類型(Atom Type)表示的原子類型及單鍵、雙鍵、芳香環鍵等鍵合 規則信息。其中,圖8為表示在目標蛋白的結合位點上對接配體時的FP的一例的示意圖。 在圖8中,由幾個幾何圖形(長方形、菱形或橢圓)構成的半透明的部分表示各種FP。“分子內FP(圖8的長方形)”為僅使用配體分子內的信息而構建的FP,為使用僅 由屬于FP庫的一個配體的內部得到的原子類型信息和結合信息而制成的FP。一個FP以配 體分子內的一個原子為起點,基于上述的FP的原子類型表述的構建法,經過1、2或3次結 合的原子,構成圖8那樣的沒有分支的最大4個的原子。在本實施例中,最小的FP由2個 原子構成。在一次FP構建的嘗試中,一次搜索的原子在其嘗試中沒有經過兩次,沒有經過 的鍵時,將此刻的FP的原子類型表述和原子坐標注冊于FP帶。不排除其FP已經注冊于FP 帶的情況,在一個FP中注冊多個原子坐標。其中,圖9是表示將從搜索路徑得到原子坐標 并注冊于FP帶的過程的一例的圖。在圖9中,下面的矩陣是指原子坐標,其行數表現構成FP的原子的個數。例如,如 果為由4行3列構成的矩陣,則表示在其FP中含有4個原子坐標。“經修飾的FP”(圖8的菱形)是將與給予的結合信息接近的原子之間假定為虛擬 的鍵而制成的FP。如果存在結合的原子、及存在實際上沒有結合但沒有特別指定的情況下 在1人以內原子,則判定為虛擬的鍵,經過1、2或3次鍵合,構建由沒有分支的最大4個原子 構成的FP。在本實施例中,最小的FP由2個原子構成。在與“分子內FP”的構建的操作同 樣,嘗試一次FP制作時,一次搜索的原子沒有經過兩次,沒有經過的鍵時,將此刻的FP的原
            33子類型表述和原子坐標注冊于FP帶。由此,在配體分子內的鍵的基礎上,制作含有配體分 子間的鍵的FP,因此,得到實際上不存在的FP。即認為,構建了物理化學上不能存在的鍵的 FP (例如 N. am, N. am, N. am, N. am 之類的 FP)。因此,在本實施例中,由作為物理化學上存在的醫藥品的三維坐標數據庫的MDL Comprehensive Medicinal Chemistry (MDL CMC) Library (相當于醫藥品化合物 DB106c。) 制作類藥的FP向量,與由FP庫得到的FP帶的FP向量部分比較,使兩者中所含的FP的原子 類型表述殘存于目標蛋白特異性FP帶。在使用任意的FP (fingerprint)的計算的過程中, 使用醫藥品數據庫或化合物數據庫提取化合物信息,由此,對成為該基礎的數據庫,以藥物 吸收或藥物代謝或藥物排泄或藥物毒性等為指標,使用將(fingerprint) FP等作為整理的 基礎的基礎數據單元,制作預先整理好的對藥物吸收或藥物代謝或藥物排泄或藥物毒性特 殊化了的醫藥品數據庫或化合物數據庫,進行相同的一系列操作。具體而言,通過求出來自配體庫的FP向量和來自醫藥品庫的FP向量的交集,僅將 存在于醫藥品化合物DB106c的FP注冊于FP帶,在本實施例中忽略醫藥品化合物DB106c 中不存在的FP,由此構建結合化合物指紋集106b。其中,圖10是表示本實施例中的FP帶 的壓縮步驟(壓縮指紋帶的方法步驟,method step of shrinking fingerprintband)的 一例的圖。如圖10所示,比較由MDL CMC Library得到的FP帶(A)和由目標蛋白定向性配 體群得到的FP帶⑶,除在兩者中存在FP的情況之外,從(A)或⑶的FP帶除掉(用圖 10的X記號表示)。其結果,來自庫配體的FP (Library Ligand FP) 一定存在坐標。以上,完成了本實施例中的FP帶的構建方法的說明。需要說明的是,在本實施例 中,在全部的FP帶構建的過程中,允許一個原子屬于多個FP。另外,如果在FP帶中得到的 FP已經注冊,則追加FP的坐標,不存在時,在FP帶中追加新的FP并追加坐標。另外,允許 一個原子屬于多個FP。對成為對接的目標的候選配體(對接的配體)也進行同樣的操作, 制作來自候選配體的FP帶(對接的配體的fp帶)。FP帶的比對在FP帶中附加關聯有原子集的坐標,比較兩個FP帶時,不僅使用原子類型,也使 用附加關聯的坐標。即,FP帶的比對是指進行由候選配體得到的FP帶和由結合配體的FP 庫得到的FP帶的比較。比較經過以下的(1)、(2)的過程而進行。(1)構成FP的原子類型表述的字符串完全一致的比較在由對接的候選配體得到的來自FP帶的FP向量(位列(1))和由含有結合化合 物的FP庫得到的來自FP帶的FP向量(位列(2))中,將FP的有無進行位化,選擇兩者的 位為on的組合(參照圖7)。(2)對注冊于選擇的FP的原子的坐標向量之間賦予對應關系的過程圖11是表示對坐標向量之間賦予對應關系的過程的一例的示意圖。一個FP由來 自對接的候選配體分子的原子坐標向量(1)和來自FP庫的結合配體的原子坐標向量(2) 構成,對該原子坐標間賦予對應關系。進行這兩個過程(1)、(2)即為本實施例中的FP的比對。另外,所謂“FP比對不 同”,是指1.兩個位同時為on的FP的總數
            2.對應的FP的種類3. FP內部的坐標的對應關系中的至少一個不同。即,所謂“使FP比對變化”,是指使其中的至少一個變化。“至 少一個”是因為,FP的原子類型變化時,變化前的FP的坐標的對應關系消失,在變更后的FP 中重新賦予對應關系,因此,坐標的對應關系也必然變化。相互作用分倌(FPAScore)下面,對本實施例中的相互作用分值FPAScore進行詳細說明。FPAScore (指紋比 對分值)在本實施例中如下定義基于FP為部分結合自由能的集合的ChooseLD法的假設, FPAScore越高,越滿足相互作用已知的家族蛋白-結合配體復合物結構。FPAScore同時考 慮FP的擬合的精度和用于比對的FP的數、FP的密集度及蛋白-配體復合物相互作用,評 價目標蛋白-候選配體復合物結構。在本實施例中,通過搜索由上述操作得到的FP帶的最 佳的比對,預測最佳的目標蛋白-候選配體復合物。S卩,在本實施例中,相互作用分值FPAScore以以下的數學式定義。其中,aligned_fp 是指比對的 FP,fp_rmsd是指利用使用所述比對的最小二乘擬合計算所得的rmsd,molecule是指候選配體與目標蛋白對接后的復合物的坐標。下面,對各項進行詳細說明。數20FPA Score = F(aligned_fp, fp_rmsd, molecule coordinate.)= BaseScore (fp_rmsd, aligned_fp)*fp_volume (molecule)*fp_contact_surface(molecule)<1. BaseScore (fp rmsd, aligned fp)工貢 >該項是以考慮FP的一致度及密集度的函數定義的項,即,為評價已知的FP的使用 強度的函數,用以下的數學式表示。數21
            其中,In為自然對數(自然對數)。另外,kl為確定使FP的擬合的精度絕對有多嚴密的比例因子。比對的FP的擬合 的rmsd大時,分母變得越大,BaseScore變得越小。是指排除即使FP的一致度大、表示注 冊于所述FP的FP的原子坐標的擬合的精度的rmsd也大(差)的情況。在本實施例中,將 kl設定為4. 0。fp_rmsd是利用使用所述比對的最小二乘擬合計算的rmsd。aligned_fp為 此時的fp的對應關系、即比對的FP。其中,在上述數學式中,raW_SCOre(aligned_fp)用以下的式子表示。其中,assinged_score(i)為預先賦予第i個比對的FP的分值。n為比對的FP的總數。所謂比 對的FP,是指目標蛋白特異性FP帶中的原子類型和原子坐標的集(參照上述“FP帶的比 對”及圖11)。S卩,在FP的比對中,即使FP為相同原子類型,如果原子坐標不同,則也是指 不同的FP。數22
            其中,在上述數學式中,aSSigned_SCOre(i)為預先賦予第i個比對的FP的分值, 用以下的數學式表示。該分值相對由CElib等配體庫得到的FP,如下所述賦予。數23(total_atom( E Casel_S+ln(N+l). . . easel(j = 0assinged_score (i) = {(total_atom( E Case2_S+ln(Neighbor_atom+l). . . case2 其中,上述數學式的Total_atom(i)表示構成FP的原子坐標的個數。Casel_S、 Case2_S、Case3_S (上面未敘述)為預先賦予構成FP的原子的分值,分別在下述的情況下使用。Casel_S為在構成上述“分子內FP”時賦予各原子的分值。沒有特別指定的情況, 使用5. 0。例如,搜索成功時,對構成FP的各原子賦予分值Casel_S (使用默認值5. 0),對
            由4個原子構成的FP賦予20. 0,如果為3個原子,則賦予15. 0分。接著,對Case2_S進行敘述。其為在構建上述“經修飾的FP”時賦予各原子的分 值。沒有特別指定的情況,使用2. 5。最后,對Case3_S進行描述時,其為在通過生物化學信息或能量計算(“circle” 等)有可能存在原子時賦予的任意的標量值。本實施例中不使用,不在使用基準 集的對接性能(結合模式預測性能)驗證計算及虛擬篩選性能中使用。在本實施例中,在Casel_S、Case2_S、Case3_S之和的分值的基礎上,在分值中加 入屬于FP庫的原子的密集度的自然對數值。其在FP的分值上加上屬于FP的原子坐標集 的原子和在1.0人以內的屬于其它FP的原子坐標集的原子個數(n_neighb0r_at0m(i))的 自然對數,該項可說是優化密集的FP的項。S卩,在Casel和Case2中,在屬于同一 FP的坐 標間,在FP的坐標的分值上加上距離位于dist (默認值1.0人)以內的原子坐標集的原子 個數(Neighbor_atom)的自然對數。<2. fp volume (molecule)項 >該項為在使用比對的FP將候選配體與目標蛋白對接后評價其復合物結構的函
            36數。即,為評價對接后的候選配體的分子坐標占由FP庫的結合配體得到的FP構成的空間 的個數(即以怎樣的程度充滿由來自FP庫的FP構成的空間)和目標蛋白的沖突的函數, 用以下的數學式表示。其中,molecule表示候選配體的對接后的原子坐標。數24
            其中,nafp(覆蓋指紋的配體原子數,Number of Ligand Atomcovering Fingerprint)為在使用構成庫配體(LIBRARAY LIGAND)的低分子的原子制成的固有網格 點區域中分子(molecule)的坐標所占的個數、即候選配體占有使用構成FP庫的結合配體 原子制成的固有網格點區域的坐標的個數。利用nafp表示候選配體分子(molecule)滿足 多少坐標固定的FP(指紋)。nap(覆蓋蛋白的配體原子數,Numberof Ligand Atom covering Protein)為在由目標蛋白的原子坐標制成的固有網格點區域中molecule (對接后的候選 配體分子)的坐標所屬的數,表現與目標蛋白的構成原子的沖突程度。另外,k2、k3分別為系數,在沒有特別指定的情況(默認值)下,分別使用1.0, 但可分別根據目標蛋白的生物化學信息、誘導契合的程度而變更。即,k2為重視占有其目 標蛋白的家族蛋白的結合配體集體的空間的區域的常數,如果系數增大,則大的配體可得 到大的分值。k2值具有根據目標蛋白的結合域的大小也可成組化的可能性。另外,k3為 候選配體沖突其目標蛋白所占的區域的允許度因子,為重視候選配體原子和目標蛋白原子 的沖突的系數。如果k3變大,則不允許目標蛋白和候選配體沖突。關于k3,具有可將蛋白 (protein)的活性位點的柔韌度等成組化的可能性。其中,圖12是使用原子數為31的配體 表示nafp和nap的具體例的圖。如圖12所示,在候選配體中與目標蛋白沖突的原子數為10個,在來自FP庫的網 格點中原子所屬21個,如果k2值、k3值為1.0,則fp_volume (molecule)項為In (22/11) =0. 693這樣的值。在該項的函數的性質方面,nafp為31 30、即沖突的個數為0個 1 個的變化率最大。另外,配體原子的近一半發生沖突時,成為負值,因此,非常難以采用。即, 在FPAScore中,以對應于表現作為經驗性物理函數的分子間引力-排斥項的倫納德-瓊斯 勢的分值定義。需要說明的是,在關于將EGFR用作目標蛋白的虛擬篩選性能的項中,在后 面敘述k2值、k3值的最優化的一例的結果。<3. fp contact surface (molecule)項>接著,fp_c0ntact_surface項為考慮相對候選配體的對接后的結構其原子坐 標對目標蛋白的接觸度及其坐標對FP庫的歸屬度的函數,用以下的數學式表示。其中, molecule是指候選配體的對接后的原子坐標,atom(i)為該對接后的第i個原子坐標,n是 指原子數。即,該式子與上述fp_V0lume的數學式同樣,為對候選配體對接于目標蛋白后 的復合物結構進行計算、考慮候選配體原子坐標與目標蛋白的表面的接觸度及相對于由FP 庫得到的FP原子的候選配體原子坐標的歸屬度的函數。數邪
            37
            在上述數學式中,density_of_atom用以下的數學式表示。其中,nfpcontact為 以沒有特別指定時(為默認值)為3.8人以下與屬于FP庫的FP的原子坐標接觸的目標蛋 白的原子的個數,natom為屬于同一網格點的來自FP庫的結合配體化合物的原子數。此 時,相同原子類型的配體分子可存在多個,對為相同配體分子且PDB的ID代碼不同的情況, 也全部包含在本實施例中。hi為有特別重要的化學信息的情況下使用的變量,沒有特別指 定的情況下(為默認值)使用0,假定利用CIRCLE(Terashi G,Takeda-Shitaka M,Kanou K, IwadateM, Takaya D, Hosoi A, Ohta K, Umeyama H Proteins, 2007,69 (S8) 98-107)等 3D-1D分值、放入不依賴于家族蛋白的FP(經修飾的FP或創建性FP等)時使用。下述的數 學式在配體原子坐標x不屬于由FP庫得到的FP (在3.8人以下不接觸)的情況為0,屬于的 情況按照上述的式子計算分值。數洸density_of_atom (x) = 0 或 In(nhpcontact+natom+hi)圖13是表示目標蛋白的活性位點附近的來自FP庫的配體的位置的一例的圖。如 圖13所示,由于在目標蛋白附近被橢圓(點劃線的圓)所包圍的附近的FP接近于目標蛋 白,因此,優化nfpcontact。而且,黑圓附近密集有來自FP庫的結合配體原子,優化natom。 即,對接的候選配體的原子坐標接近這些部分時,利用上述數學式優化分值。另夕卜,在上述 fp_contact_surface 的數學式中,total_dense_of_atom (molecule) 用以下的數學式表示。其中,total為候選配體分子的原子數。另外,S0rt_denSity_0f_ atom從大到小依次重排上述數學式的denSity_0f_at0m的標量值的分布。即,候選配體分 子大時,total_dense_of_atom 變大。數27
            以上,完成了本實施例中的相互作用分值FPAScore的說明。接著,為了將如上所述定義的FPAScore函數最大化,參照圖14對本實施例中的 模擬退火(以下稱為“SA”。)的實施方法進行說明(J. Mol. Graphics Mod. 18. 258-272, 305-306(2000))。圖14是表示模擬退火過程的一例的概念圖。首先,由候選配體的構象變化,對至得到其結構中的FPAScore為最大的對接結構的步驟1 3的1個循環進行敘述。< 步驟 1>首先,通過隨機地變更存在于成為對接對象的候選配體(對接的配體)的可旋轉 的二面角,使構象變化。在本實施例中,候選配體原子的范德華半徑使用以AMBER99為參考 的值。< 步驟 2>將構象變化了的候選配體用作剛體,使其與配體結合位點(thebinding site)對 接。以下的并行旋轉對步驟1中產生的一個構象進行。首先,從上述的FP帶隨機地選擇10個FP的原子類型。不足10個的情況,使用FP 帶的FP向量的尺寸的最大數的一半。而且,隨機地選擇注冊于選擇的FP的原子坐標集。將 其設定為比對的FP,按其對應關系進行最小二乘擬合,計算候選配體的原子坐標和來自FP 庫的原子坐標間的rmsd,使此時得到的并行及旋轉矩陣對目標配體進行作用,得到一個目 標蛋白_候選配體復合物結構。然后,使用比對的FP、rmsd、目標蛋白-候選配體復合物結 構計算FPAScore。其中,圖15是示意性地表示用于計算FPAScore的FP比對及最小二乘擬 合的圖。如圖15所示,在FP帶的比對項中如上述所述在(D)、(E)的各FP的每個類型的坐 標矩陣之間進行FP比對,<1>在來自配體庫的FP向量⑶和來自候選配體的FP向量(E) 中,選擇兩者的位為on的組合。從比對中除去在該選擇過程中不一致的FP。<2>然后,在 一個FP中,進行來自候選配體分子的原子坐標向量(1)和來自FP庫的結合配體的原子坐 標向量(2)的坐標間的對應附加,基于最小二乘擬合計算相互作用分值。模擬退火引起的狀態變化為FP的變更、增加、減少過程。即,該狀態變化通過重復 從來自對接的候選配體的FP及來自配體庫的FP選擇屬于所述FP的坐標的過程來進行。 然后,模擬退火相對比對的FP,增加或保持一個FP的原子類型,進行注冊于FP的原子坐標 集的對應關系的變更或追加和FP的減少,改變比對并將FPAScore最大化。從一個FP選 擇一個以上原子坐標集或即使有坐標FPA分值也減少的情況,進行Metropolis判定,如果 采用,則保持狀態。即,在SA過程中,進行Metropolis判定,與前次的分值相比,如果這次 的分值大,則采用,不是這樣的情況時,基于以下的數學式計算采用概率Paccept。此時,使 0彡r彡1的范圍的均勻隨機數同時產生,如果!" < Pacc印t,則采用分值低的情況。在本 實施例中,T (溫度)從30.0K開始,下降到0.07K。由此,對一個構象計算FPAScore的最大 值。數28A分值=分值(這次)_分值(前次)Paccept = exp ( A Score/T)使用由此得到的FP帶,利用SA法將FPAScore最優化。需要說明的是,在本實施 例中,SA進行10,000次。< 步驟 3>將對一個構象的由上述工序2得到的最大的FPAScore與其結構一同保存于存儲 部的結構庫。以上為用于一個構象的FPAScore最大化的1個循環的處理。
            < 步驟 4>在本實施例中,由于設定為進行1000次構象的變化,因此,不足1000次時,以再嘗 試上述工序1 3的方式進行控制。需要說明的是,構象產生次數越多,可得到越好的結 果,但需要對虛擬的化合物數據庫中所含的許多低分子化合物進行對接計算,因此,必需止 于有限的次數的大小,即使依賴于化合物的旋轉自由度,在本實施例的預計算中該次數也 足夠。分別對產生的1000個構象計算相互作用分值FPAScore的最大值時,結束循環 的重復處理,對保存于結構庫的1000個構象的最大FPAScore進行比較,將分值最大的對 接結構作為該候選配體的最佳構象并輸出目標蛋白-候選配體復合物(Protein-Ligand complex)的預測結構。結果和考察(材料)、方法相關對本實施例,下面敘述“結果和考察(材料)”。在本實施例描述的FP庫的構建中, 組合 Perl (http //www, perl, com/)、Ruby (http: //www. ruby~lanR. orR/0、bash (http: // www.gnu.org/software/bash/)等命令解釋程序、腳本語言進行開發。另外,改變用本實 施例的方法描述的對接的候選配體的構象,用C/C++描述搜索使FPAScore最大化的蛋 白_配體復合物結構的算法。編譯器使用Intel (注冊商標)C++Compilerl0. 0。對使用的 計算機的構成進行敘述時,使用最多200臺0S為Red Hat Linux、ScientificLinux、CPU 為Pentium4、Core2Duo、Opteron、內存為512M、1024M、2048M的計算機的構成不同的內存 非共有型計算機集群。參考性地描述計算時間時,相對后述的EGFR的激酶區域,進行MDL AvailableChemicals Directory (MDL ACD)Library(Symyx Technologies, Inc. Corporate Address 3100 Central Expressway, Santa Clara, CA95051)的 20,000 化合物的虛擬篩選 時,每對一個目標蛋白對接一個候選配體的1CPU的計算時間的中位值為10. 2分鐘,平均值 為18. 6分鐘。最小計算時間為4. 8分鐘,最長計算時間為1077分鐘。其中,圖16是表示 EGFR虛擬篩選中的計算時間的分布的圖。如圖16的EGFR虛擬篩選中的計算時間的分布所示,根據對接的配體的不同,有時 非常耗費時間。其原因之一被認為是對接難以搜索避免內部沖突的構象的配體的情況,隨 機選擇可旋轉的鍵是原因,可知,需要以難以引起分子內沖突的方式旋轉。另外,本實施例 的ChooseLD的計算時間依賴于目標蛋白的大小、FP庫中所含的配體數及配體的分子量、候 選配體的分子量、可旋轉的鍵的數,如果壓縮目標蛋白的配體結合位點,并進行FP庫的壓 縮,則可更快地得到預測結構。在本實施例中,為了考察ChooseLD的對接性能,從Protein DataBank(Nucleic Acids Res. 31,489-491(2003))得到蛋白-配體復合物結構。對所使用的基準參照圖17及 圖18進行說明。圖17是表示基準的概要的一例的圖。另外,圖18是表示向PDB的注冊數 的年度分布的圖。如圖17所示,所用的基準集的數為分別具有配體的218種蛋白。85種PDB結構 (圖17的左)用于制作分值方程式(Score equation)。另外,133種PDB結構(圖17的 右)用于與其它對接法(DOCK、AUT0D0CK、GOLD等)進行比較(以下表示PDBID)。85 PDB 結構1G9V 1GKC 1GM8 1GPK 1HNN 1HP0 1HQ2 1HVY 1HWI 1HWW 1IA1 1IG3 1J3J 1JD0 1JJE 1JLA 1K3U 1KE51KZK 1L2S 1L7F 1LPZ 1LRH 1M2Z 1MEH1MMV 1MZC
            401N1M1N2J1N2V1N46 1NAV 10F1 10F610PK 10Q5 10WE 10YT 1P2Y1P621PMN1Q1G1Q411Q4G1R1H1R55 1R58 1R90 1S191S3V 1SG0 1SJ0 1SQ5 1SQN1T401T461T9B1T0W1TT11TZ81U1C1U4D 1UML 1UNL1U0U 1V0P 1V48 1V4S 1VCJ1W1P1W2G1X8X1XM61X0Q1X0Z1Y6B 1YGC 1YQY 1YV3 1YVF 1YWR 1Z95 2BM2 2BR1 2BSM
            133 PDB 結構1AAQ 1ABE 1ACJ1ACK 1ACM 1AC0 1AEC 1AHA1APT1ASE1ATL1AZM1BAF1BBP1BLH 1BMA 1BYB 1CBS1CBX 1CDG 1CIL 1C0M 1C0Y’1CPS 1CTR1DBB1DBJ1DID1DIE1DR1 1DWD 1EAP1EED1EPB 1ETA 1ETR 1FEN 1FKG1FKI1FRP1GHB1GLP1GLQ1HDC1HDY 1HEF 1HFC 1HRI1HSL 1HYT 1ICN 1IDA 1IGJ1IMB1IVE1LAH1LCP1LDM1LIC1LM0 1LNA1LPM 1LST 1MCR 1MDR 1MMQ 1MRG 1MRK1MUP1NC01NIS1PBD1PHA1PHD1PHG1P0C 1RDS 1RNE 1R0B1SLT 1SNC 1SRJ 1STP 1TDB1TKA1TMN1TNG1TNI1TNL1TPH1TPP 1TRK 1TYL 1UKZ1ULB 1WAP 1XID1XIE 2ADA2AK32CGR2CHT2CMD2CTC2DBL 2GBP 2LGS 2MCP 2MTH2PHH 2PK4 2PLV 2R07 2SIM2YHX3AAH3CLA3CPA3GCH3HVT3PTB 3TPI 4CTS 4DFR4EST 4FAB 4PHV 5P2P 6ABP6RNT6RSA7TIM8GCH
            圖17的兩個圓是根據每個蛋白-配體復合物的特征對PDBID進行分類的圓,其表
            示全部的PDBID。圖中的右圓的集合可成為醫藥品開發的目標蛋白,結合的配體為醫藥品化 合物、肽、糖鏈等,富于多樣性。另一方面,左圓的PDBID與右圓同樣地選擇成為醫藥品開發 的目標的蛋白,但其與右圓的PDBID不同,由醫藥品的配體構成。更詳細地進行描述時,右 圓的集合為使用配體的分子結構、最終手動選定以是否滿足雜原子的有無、氫供體、受體及 疏水基等的有無、里賓斯基五規則(Adv Drug Deliv Rev 46 (1-3), 3-26)這樣的判定基準 判定為作為醫藥品的配體的物質的集合(J. Med. Chem. 50,726-741 (2007))。即,對于這些基準集的明細,85基準集為匯集有從自2000年8月11日后注冊于 PDB的目標蛋白中選擇成為制藥的目標的目標蛋白、最終手動選定以要對接的配體是否也 具有雜原子、是否具有氫供體、受體及疏水基等、是否滿足里賓斯基五規則這樣的判定基準 判定為醫藥品的配體的物質的集合。另外,另一方面,理化研究基準參考文獻0nOdera et al J. Chem. Inf. Model. 2007. 47. 1609-1618使用 GOLD參考文獻:Gareth et al J. Mol. Biol. 1997 267,727-748的基準。如上所述,該基準使用在2000年8月以前注冊于PDB的 目標蛋白。但是,在該基準中,除GOLD之外,將AutoDocKDOCK進行比較,因此,與該基準的 結果進行比較,認為,知道ChooseLD的對接軟件中的位置安排是非常有用的。在上述的兩 個基準中,PDB ID沒有重復。因此,以85集進行ChooseLD的默認參數的確定,以理化研究 基準進行其參數中的ChooseLD的性能評價。其中,圖18為橫軸標繪有注冊了在85集(左 圓)及133集(右圓)中提出的PDB ID的年、縱軸標繪有該年的合計注冊數的圖。對這些基準集的注冊年如圖18所示進行分布。對表示圖18的2個基準集的 蛋白-配體復合物的集體的顏色的情況進行描述時,圖的左側的峰為目標蛋白為醫藥品 (druggable 是指可成為藥劑開發的對象的目標蛋白),配體表示為各種低分子化合物時 的注冊年的分布(Green plane 133 benchmark set Gold Benchmark (Jones et al. J. Mol. Biol.1997,267,727-748)(Onodera et al. J. Chem. Inf.Model. 2007. 47,1609-1618))。另 外,圖的右側的峰表示目標蛋白和配體同時為醫藥品(druggable)化合物時的注冊年的分 布(Blue plane :85benchmark set (Hartshorn et al. J. Chem. 2007,50,726—741))。黑線表示各自的平均PDB數,對于平均值,綠色為9. 5、藍色為14. 2 (Black line average of number of PDB of each (green, blue) plane. Average value are 9. 5 and 14. 2 for the green and blue plane, respectively.)。其中,圖19為概括預測和實驗結果間的rmsd的表(Table. Summary of r. m. s deviation between predictions and experimentalresults)。為了評價結合模式予頁測結 構的精度,計算預測結構和實驗結構的rmsd。rmsd大的情況,是指預測結構和實驗結構相 差較大,即是指預測失敗。因此,設定將預測結構視為正確的rmsd的上限值。圖19的表表 示Jones等進行的結合模式預測結構和實驗結構的rmsd和人的感覺、即良好(Good)、接近 (Close)、誤差(Errors)、錯誤(Wrong)的關系。如果rmsd為2.0人以下,則預測結構與實驗 結構相比為良好,即為Good。如果rmsd為2.5人以下,則含有接近于實驗結構的預測結構、 且含有好的預測結構。即為Close。因此,將得到rmsd為2.0人以下的預測結構的情況定 義為預測成功。如果rmsd為2.0人以上2. 5以下,則為視覺上的評價G00d、Cl0Se、Err0rS、 Wrong (從 Jones et al. J. Mol. Biol. 1997 267,727-748 中選出)。即,如果 rmsd 為2.0人 以下,則以配體模型與正解相比,為良好。如果rmsd為2.5人以下,則包含以配體模型與正 解相比為接近(Close)和良好(Good)兩者。結果和考察(1) :FPA函數中的kl最優化(Optimized kl inFPA Score function)]如上所述,FPAScore的kl值為調節注冊于FP庫的原子坐標和候選配體的原 子坐標的一致度的系數。kl值可根據目標而變更,對大量的目標蛋白進行虛擬篩選時 或考慮被其它研究者使用時,確定最佳的參數成為采用本方法的判斷因素之一,因此,在 ChooseLD法的對接性能試驗中,對于最佳值,使用85集參考文獻Michael et al J. Med. Chem. 2007,50,726-741 確定 FPAScore 函數的 kl 的最佳值。85集匯集有許多類藥的目標蛋白,進行GOLD參考文獻Garethet al J. Mol. Biol. 1997 267,727-748的性能評價。這是因為,由于85集的PDBID不與133集重復, 即,在該最優化的過程中,85集不使用133集的信息。另外,85集僅實施GOLD的基準, 使Corina的結構與目標蛋白對接時,GOLD的成功率為75. 2 士0. 4 %,使用實驗結構的配 體結構將結合位點定義為6人時,為80. 5士0. 5%,使用實驗結構的配體結構將結合位點定 義為4人時,為86. 9士0. 3%,含有存在于X射線晶體結構中的結晶水時,為98. 6士0. 1 % (J. Med. Chem. 50,726-741 (2007))。S卩,僅進行GOLD的評價時,無法知道現有的對接軟件中 的ChooseLD的位置安排,因此,85集用于kl值的最優化。其中,進行用FPA分值(Score) 描述的kl的最優化。對接的條件如下所述。由于與其它基準同樣地具有縮小配體結合位點的搜索范 圍等的優點,因此,定義配體結合位點。即,ChooseLD的對接性能試驗的基準不是預測蛋白 的配體結合位點的氨基酸殘基,而是考察配體結合位點中的候選配體的構象的正確性。結 合位點(binding site)的大小根據蛋白-配體復合物(Protein-Ligandcomplex)的正確
            結構的配體的各原子設定為4人。另外,為了考察對與FP庫中所含的配體的候選配體的相似 性帶來的影響,計算與屬于FP庫的配體的Tc,限定FP庫中所含的配體。使用類藥FP (Drug LikeFingerprint)計算對接的配體和屬于庫配體(LIBRARAY LIGANDS)的配體的Tanimoto系數,fp帶的Tc范圍的最大值設定為0. 96,0. 76、及0. 56,將最小值設定為0. 08。初期構象使用使二面角隨機地旋轉、使從初期配體開始rmsd最大的結構充分遠 離結合位點(binding site)的構象。使用該配體,對一個目標進行10次對接。在85集中, 可對接84集。其中,圖20是表示85集中的預測成功率的一覽(kl和Tc范圍的關系)表。圖20的表的kl為FPAScore中敘述的系數。其下的數值為進行計算的kl值。 Tc范圍的最大值設定為0. 96,0. 76、及0. 56,將最小值設定為0. 08。柱中的數值為成功率
            ),平均(average)為上述范圍的平均值。其結果,kl = 4. 0時的平均值最高,成功率最高為62. 1 %,接著,成績的良好的排 序依次為6. 0,3. 0,5. 0,2. 0。kl值為1. 0時,在全部的Tc范圍中,比其它的kl值的成功率 差。kl值為4. 0和6. 0時,為大致相等,以稍稍超過平均值的4. 0作為最佳值,133種參考 文獻0nodera et al J. Chem. Inf. Model. 2007,47,1609-1618的基準使用該數值。其中,圖21是表示可在rmsd2. 0以下預測至10位的比例的圖表。圖21的右圖為 標繪有此時的成功率的圖,其表明隨著使采用的FPAScore的順序增加,得到預測成功結 構的概率上升。即,不使用一個FPAScore上位的預測結構而使用多個時,得到接近于正確 的結構的概率會上升。即,認為,最好將FPAScore上位的預測結構多數用于利用分子動力 學計算或量子化學計算的復合物結構的最優化中的初期結構。將與視為成功的實驗結構的 rmsd設定為2.01時,顯示至10位成功預測率最大為82. 9%。另外,圖22是表示可在rmsd2. 5(Close)以下預測至10位的比例的圖表。如圖 22所示,將與視為成功的實驗結構的rmsd設定為2.5人時,顯示至川位成功預測率最大為 87. 6%。另外,圖23是表示在與視為成功的正確結構的rmsd在2.0人之外進行時的圖表。 圖23的右圖為橫軸標繪與視為成功的實驗結構的rmsd、縱軸標繪有預測成功率的圖。如上所述,為2.5人時,為約7成成功,但表明為了得到由作為85集基準中的 GOLD的預測成功率之一的Corina產生的配體、即與不使用實驗結構的構象時的結合模式 預測的成功率 75. 2% (參考文獻(Michael et al J. Med. Chem. 2007,50,726-741))相同的 成功率,Tc范圍為0. 56 0. 08時需要使用3. 2 3. 3、為0. 76 0. 08時需要使用2. 8、 為0. 96 0. 08時需要使用2. 6 2. 7。需要說明的是,在將作為一般的共價鍵長的
            定義為成功時,約4成的預測成功。在接近于范德華相互作用的臨界值的3.5人以內,約8 成的預測成功。其中,圖24是與ChooseLD相比、表示Dock、AutoDock及GOLD的基準的結 果的圖表。圖24是表示除去了以Onodera等人參考文獻0nodera et al J. Chem. Inf. Model. 2007,47,1609-1618的基準在Corina的坐標上不產生的目標、在DOCK或GOLD中失 敗的目標的116種PDBID的結果的圖。圖24的成功率(success rate)表示rmsd 2.0人或 比其好的結構的比例。其中,對接方法(Docking method)是指各對接軟件(Docking soft)的名 稱。ChooseLD 對 3 個 Tc 范圍進行性能評價。GOLDGOLDScoreSTD,GOLDScoreLib、GOLD ChemScoreSTD、AutoDock、以及DOCK的值設定為Corina和MINI的平均值,在各對接軟件的
            成功率中用細棒表示標準偏差。
            43
            如圖24的圖所示,對于本實施例的ChooseLD的預測rmsd為2.0人或比其好的結 構的性能(成功率),Tc范圍為0. 96 0. 08時,與GOLD大致相等。Tc范圍為0. 76 0. 08 時,與GOLD大致相等或稍差。Tc范圍為0. 56 0. 08時,不及GOLD、但比DOCK、AutoDock好。其中,圖25是表示與85集中的FPAScore的預測結構和實驗結構的rmsd為2.0人 以下的各個目標蛋白的沖突個數的分布的圖。沖突0個的結構為75.0%,沖突1個的結構 為17. 3%,因此,合計為92. 3%,所以表明,FPAScore的沖突判定函數作為相當于經驗性物 理函數的倫納德_瓊斯勢型函數的沖突判定的函數起作用。圖26及圖27是記錄各目標的總10次對接嘗試中的成功個數的圖,圖26是表示 85集基準中的預測成功結構的個數分布的圖。需要說明的是,圖26的“* 1”表示預測成 功個數為5 10個的PDBID的個數占總體的比例。在全部的Tc范圍內,10次成功和10次 失敗的比例大。另外,10次中5次成功的目標為62.7 65.5%。另外,縮小Tc范圍的上 限值時,顯示10次都失敗的個數增加的傾向。這被認為是由于,ChooseLD法依賴于作為FP 庫已知的蛋白-配體復合物結構,所以,屬于FP庫的配體減少時,精度下降。結果和考察(2) (Result and Discussion (2)) :133種基準的結果根據Onodera 等人參考文獻:0nodera et al J. Chem. Inf. Model. 2007,47, 1609-1618,在接近于提供各對接軟件的狀態下進行基準。由此,對于目標蛋白,用于GOLD參考文獻Gareth et al J. Mol. Biol. 1997 267,727-748的基準的蛋白-配體復合物 (Protein-Ligandcomplex)使用除去了 133種中不能通過G0LD、D0CK進行對接的目標及不 能由Corina產生三維坐標的目標的合計116種。需要說明的是,被除去的PDBID為1TPH、 1TRK、1XID、4FAB、6RSA、1BBP、1CTR、1HYT、1PHG、1P0C、1SNC、1TMN、1CDG、1DR1、1LDM、4CTS、 4EST (Virtual Screening J. Chem. Inf. Model. 47,1609-1618(2007))。各個對接軟件的參數使用由各個對接軟件提供的參數,并未將參數最優化而用于 目標。認為如果進行參數的最優化,則顯然成功率發生變化,這在ChooseLD中也相同,在 ChooseLD法中,也根據目標蛋白定義可變更參數kl、k2、k3值,所以,留有最優化的余地。因 此,ChooseLD的性能評價使用在方法項中敘述的值和在85集中進行了最優化的kl值、即 4. 0。其中,ChooseLD所使用的對接的條件在各目標中如下確定。1.結合位點(bindinR site)結合位點(binding site)設定為類似于現有的基準參考文獻Anodera et al J Chem. Inf. Model. 2007,47,1609-1618并存在于距天然(Native)的蛋白-配體復合物 (Protein-Ligand complex)的配體(ligand)的各原子半徑5.0人以內的距離的蛋白的原 子的球。2.配體的構象變化在133集的基準中準備3個對接的配體。即,為由Corina產生的配體、由Corina 產生的配體中的能量最小結構(以下稱為MINI)的配體和注冊于PDB的狀態的結構這3 個,將它們分別相對116種目標蛋白進行1000個預測(Virtual Screening J. Chem. Inf. Model. 47,1609-1618 (2007))。在ChooseLD法的對接性能試驗中,使用使構象隨機地變化 而為從實驗結構的蛋白_配體復合物的配體起rmsd最大的結構且充分遠離上述定義的配
            44體結合位點的狀態的配體。即,不直接使用實驗結構而對116種目標蛋白進行10次預測, 在與使用133集的基準大致相同的條件下進行。在這些過程中,除去在配體中存在有氫的 情況。3.與配體的Tanimoto系數的范圍對于所使用的庫配體(LIBRARY LIGAND),在候選配體(對接的配體)和Tc的范圍 內,作為其最大值的0. 96,0. 76及0. 56分別相當于存在與對接配體非常相似的化合物的庫 配體、存在相似的化合物的庫配體、存在稍微相似的化合物的庫配體。因此,使用在Tc的范 圍內相當于0. 96 0. 08 (即不包含答復)、0. 76 0. 08及0. 56 0. 08的庫配體。4. Onodera等人對一個配體進行1000次對接參考文獻:0noderaet al J. Chem. Inf. Model. 2007,47,1609-1618。在這次的ChooseLD的性能評價中,對接10次候選配 體(對接的配體)。即,在各個Tc范圍中進行1160次對接,進行合計3480次對接。如果 在一次對接嘗試中預測的對接結構和天然的蛋白-配體復合物(NativeProtein-Ligand complex)的配體的rmsd為2.0A或比其好,則成功。圖28及圖29是表示133集的基準中的DOCK、AutoDock、GOLD預測結構的rmsd 分布的結果和ChooseLD法的結果的圖。對接方法是指各對接軟件的名稱。ChooseLD 對3個Tc范圍進行性能評價。GOLD是GOLDScoreSTD (用GOLDScore的“標準默認設 置”(‘Standard default Settings' with GOLDScore))、G0LDScoreLib (用 GOLDScore 的 “庫篩選設置,,(‘Library Screening Settings'withGOLDScore)) .GOLD ChemScoreSTD(用 ChemScore 的“標準默認設置”(‘Standard Default Settings'with ChemScore))這 3 個 參數(Virtual Screening J. Chem. Inf. Model. 47,1609-1618 (2007) ),AutoDock 及 DOCK 的 值設定為Corina和MINI的平均值。對于由該圖預測ChooseLD的rmsd為2.0人以下的結 構的性能,如果Tc范圍為0. 96 0. 08,則與GOLD大致相同。如果Tc范圍為0. 76 0. 08, 則與GOLD大致相同或稍差,如果Tc范圍為0. 56 0. 08,則比DOCK、AutoDock好。圖30及圖31是表示各目標的總10次對接嘗試中的成功個數的圖。需要說明的 是,圖30中的“ ★ 1”表示預測成功個數為5 10個的PDBID個數占總體的比例。與85集 同樣,表明發生10次成功和10次失敗的比例的兩極化,但10次失敗的數最多。另外,與 85集相比,10次成功率下降近20%。根據這些情況,認為,133集與85集相比,含有許多難 以對接的目標。這被認為是由于,85集的醫藥品化合物的分子量、可旋轉的鍵數、氫供體、氫 受體的數受里賓斯基五規則等限定,所以,因其壓縮的影響而含有許多容易對接的化合物。圖32及圖33是表示在Tc范圍限定的FP庫中、在依據FPAScore賦序的分布內得 到與實驗結構的rmsd為2.0人以下的結構的概率的圖。即,順序為1的情況,與和上述的其 它對接軟件的比較的成功率一致。該結果也與85集同樣,整體的成功率下降。圖34是表示預測成功結構的沖突個數的分布的圖,表示與133集中的預測結構和 實驗結構的rmsd為2.0人以下的結構中的各個目標蛋白的沖突個數的分布。沖突0個的結 構為56. 0%,沖突1個的結構為28. 7%,合計為84. 6%,表明FPAScore的沖突判定函數 作為相當于經驗性物理函數的倫納德_瓊斯勢型函數的沖突判定的函數起作用。從85集、 133集均顯示同樣的傾向考慮,認為沖突判定充分發揮作用。圖35是表示進一步降低用于FP庫的配體的Tc范圍的上限值、在0. 16,0. 24、 0. 36使下限值為0. 08時的性能及上述Tc范圍、即上限值為0. 56,0. 76,0. 96、下限值
            45為0.08的預測成功率的圖。表明降低Tc的上限值時,在0.24 0.08內為與133集 基準中的DOCK (21. )同程度的預測精度,在0.36 0.08內為與133集基準中的 AutoDock(26.6% )同程度的預測精度。(與GOLD的比較)下面表示2例根據理化研究基準GOLD失敗、但通過本申請發明人的方法可進行對 接且rmsd為2.0以下的實例。其中,圖36是表示對1DR1預測的蛋白-配體結構的圖 (Predictedprotein-ligand complex structure for 1DR1)。圖36中的條件或值等如下所述。PDBID :1DR1標題雞肝二氫葉酸還原酶對接的配體NADPRMSD: 1.743FPA :Score 1295. 553青色(CYAN)(圖中央的青色(淺藍色))實驗(X射線結晶分析)結構(Answer) (以下也相同。)綠色(GREEN)(圖中央的深綠色)預測的配體結構(Predictedligand Structure)(以下也相同。)The other(其它)結合位點(the binding site)(以下也相同。)g卩,圖36表示相對于PDBID :IDR1的本實施例的預測結構。其為GOLD預測失敗的 目標蛋白、即從133集的基準排除在外的目標(Virtual Screening J. Chem. Inf. Model. 47, 1609-1618(2007))。本實施例的ChooseLD中,預測結構和實驗結構的rmsd為1.74人,預測 成功。這認為是由于,在FP庫中也含有許多存在于配體中的環結構。另外,圖37是表示對4EST預測的蛋白-配體結構的圖 (Predictedprotein-ligand complex structure for 4EST)。圖37中的條件或值等如下所述。PDBID :4EST標題由肽基a,a - 二氟-酮基酰胺與豬胰彈性蛋白酶形成的共價復合物在 1.78人解析度下的晶體結構對接的配體抑制劑ACE- * ALA- * PRO- * VAL- * 二氟-* N- *苯乙烯乙酰胺RMSD: 1.729FPASC0RE 451. 291即,圖37表示相對于PDBID :4EST的本實施例的預測結構,其為GOLD預測失敗的 目標蛋白,即從133集的基準排除在外的目標(Virtual Screening J. Chem. Inf. Model. 47, 1609-1618(2007))。ChooseLD中,預測結構和實驗結構的rmsd為1.73人,預測成功。這被 認為是由于,對接的配體有時為肽性配體,主要使用FP庫中所含的肽性配體的主鏈的碳、
            氮、氧。結果和考察(2)(Result and Discussion(2. 1))預測的結構結果(result of predicted structure)
            表示4個現有的對接軟件(GOLD,DOCK)失敗的全部對接的實例。其中,圖38 圖41是表示GOLD失敗但ChooseLD預測成功的目標的圖。圖38中的條件等如下所述。1CDG標題來自環狀芽孢桿菌株251的環糊精葡萄糖基轉移酶的核苷酸序列和取決于 麥芽糖的晶型的X-射線結構另外,圖39中的條件等如下所述。1DR1與NADP+和生物蝶呤復合的雞肝二氫葉酸還原酶的2.2人晶體結構另外,圖40中的條件等如下所述。1LDM角鯊M4脫乳酸脫氫酶的細化的晶體結構另外,圖41中的條件等如下所述。4EST標題由肽基a,a - 二氟-酮基酰胺與豬胰彈性蛋白酶形成的共價復合物在 1.78A解析度下的晶體結構(含有GLIDE的比較)Glide (J. Med. Chem. 47,(2004) 1739-1749)為柔性配體對接軟件,在本實施例的方 法中進行與GOLD等的預測精度的比較。圖42是表示133集中的90目標中的預測成功率的 圖表。但是,上表的預測成功率的算法因各對接軟件而不同。即,GOLD為對各目標進行20 次利用遺傳算法進行的最優化時的結果(the best of GA 20 run) (http://www. ccdc. cam. ac.uk/products/life sciences/validate/gold validation/value, html),ChooseLD 對 各目標進行10次對接,選擇2個FPAScore上位,選擇最好的結構。在Glide的對接性能的 驗證中沒有記載,因此認為,以GOLD為標準。在133集的基準的結果中,GOLD的預測成功 率為45%左右,由此認為,根據對接條件及預測結構的選擇法,預測成功大幅度地變動。(預測成功目標蛋白的分布)圖43是用TcCTanimoto系數)計算對接軟件間的預測成功的目標蛋白的PDBID 類似度的圖表。其中,關于133集中的90集內的各個目標蛋白,兩者的對接軟件預測成功 時,加上Tc計算式的a,如果僅一個預測成功,則加上b或c。如圖43 所示,Glide、GOLD、FlexXG.Mol. Biol. 261,470-489(1996)))間的 Tc 為 0. 61 0. 65,相對于此,在ChooseLD和其它對接軟件間,為0. 47 0. 55左右。也認為預 測成功率在GOLD、Glide、ChooseLD間沒有顯著的差別時,ChooseLD與其它對接軟件相比, 表明在預測成功的目標蛋白的分布上有獨特性。另外,圖44是相對于90目標中的一個目標蛋白的各對接軟件的預測的成功與否 分布的圖表。存在許多一個對接軟件可預測的目標,但根據現狀可說,沒有成功預測全部 目標蛋白的對接軟件。基于這樣的背景,大多進行以下研究,即,不以使用多數對接軟件為 前提,并根據對接軟件的分值選擇預測結構,而由預測的目標蛋白-配體復合物結構,使用 氫鍵等與蛋白的相互作用信息,選擇更接近于實驗結構的預測結構(European Journal of Medicinal Chemistry 42,966-976(2007)、J. Med. Chem. 47,337-344(2004))。
            其中,圖45 圖47是表示DOCK失敗但ChooseLD預測成功的目標的圖。其中,圖45中的條件等如下所述。1HYT芐基琥珀酸與嗜熱菌蛋白酶的復合物及其相關與羧肽酶A的復合物的再測定和 再優化(RE-DETERMINATION AND REFINEMENTOF THE COMPLEX OF BENZYLSUCCINIC ACID WITHTHERMOLYSIN AND ITS RELATION TO THE COMPLEX ffITHCARBOXYPEPTIDASE A)另外,圖46中的條件等如下所述。1PHG細胞色素P450-CAM的美替拉酮(和苯基咪唑)抑制的復合物的晶體結構 (CRYSTAL STRUCTURES OF METYRAPONE-ANDPHENYLIMIDAZOLE-INHIBITED COMPLEXES 0FCYT0CHR0ME P450-CAM)另外,圖47中的條件等如下所述。1TMN通過X-射線晶體學測定的N-羧甲基二肽抑制劑與嗜熱菌蛋白酶的結 合。新類型狀態轉換鋅肽酶類似物(BINDING 0FN-CARB0XYMETHYL DIPEPETIDE INHIBITORS T0THERM0LYSIN DETERMINED BY X-RAYCRYSTALLOGRAPHY. A NOVEL CLASS 0FTRANSITI0N-STATE AN AL0GUES FOR ZINC PEPTIDASES)結果和考察(3)(Result and Discussion(3))接警的 rankrange 的結果 (result of accepted rankranRe)圖48是表示不僅1位、而且至10位可采取rmsd2. 0的結構的比例的圖。如圖48 所示,采取至10位時,6成以上可在rmsd2.0以下對接。另外,圖49是表示不僅1位、而且至10位可采取rmsd2. 5 (接近(Close))的結構 的比例的圖。結果和者察(4)(Result and Discussion (4))視為成功的 rmsd 的結果(result rmsd regard as suceess)]使定義為成功的rmsd變化。在與理化研究基準比較時,將與定義為成功的預測結 構的正確結構的rmsd設定為2.0人,表示其它的數值(1. 5、2. 5,3. 0、以及3. 5)。這是因為, 只要為3.5人,就認為其預測配體結構大致存在于配體結合位點的附近,可將其結構用作 分子動力學、量子化學計算的初期結構。圖50是表示使定義為成功的rmsd變化時的圖表。如圖50所示,在3.5人以內可預測的結構在Tc范圍0. 56 0. 08 (即庫中存在稍 微相似的配體的情況)中為68.9%。即是指,只要存在類似的化合物的實驗結構,就可以該 精度在至少配體結合位點附近預測對接結構。另外表明,在Tc范圍0.96 0.08 (即庫中存在非常相似的配體的情況)中,7成 左右存在于配體結合位點。其中,作為對接的成功的定義的rmsd2.0這樣的數值為各種基準參考文獻: Gareth et al J Mol. Biol. 1997 267,727-748參考文獻Michael et al J. Med. Chem. 2007,50,726-741參考文獻0nodera et al J Chem. Inf. Model. 2007,47, 1609-1618等中的基本的評價基準。但是,實際上,即使在rmsd大于2. 0的情況下,如果進 行MD、QM的最優化,則也可精度良好地預測蛋白-配體復合物(Protein-Ligand Complex)的結構。即,表示這些定義為成功的rmsd在MD、QM研究者選擇用于復合物結構的最優化的 初期結構時為有用的數據。S卩,認為,成為預計最優化所花費的時間(短時間lOOps,長時間 Ins等)或最優化的配體結合位點的范圍(5人,10 A等)時的參考。結果和考察(5)(Result and Discussion(5))理想的方法(method ideal)]下面,再參照圖8,主要對考察(Discussion)進行描述。S卩,在本實施例中,建立以作為配體的一部分的FP的構象相互作用的結構最穩定 的假定。所謂本實施例的FP的與目標蛋白的相互作用,將位于距蛋白較近的FP解釋為疏 水性相互作用、氫鍵相互作用及范德華相互作用這樣的焓相互作用,另外,將距蛋白較遠的 FP解釋為與溶劑的相互作用這樣的焓相互作用。S卩,在本實施例中,最終使用FP的構象、采用化合物(ChemicalCompound)最穩定 的對接結構作為基礎時,假定相當于在蛋白配體相互作用中采用最穩定的自由能的情況。S卩,從擬合好的來自類似蛋白的結合配體(ligand)群提取的FP配置含有與蛋白 的相互作用的自由能。其中,存在一個目標蛋白時,為了匯集許多配體,利用同源性或e-value低的類似 蛋白,但是顯然認為,不被這些功能分類束縛的廣義的家族蛋白的活性位點附近伴隨稍微 的結構變化和氨基酸殘基的變化,具有從家族蛋白提取的FP也不滿足自由能穩定的假定 的可能性。因此,需要彌補該缺點,將從家族蛋白中提取的FP變更為在與目標蛋白的相互作 用中自由能更穩定的FP,設定為“經修飾的FP”,作為可靠性稍降低的FP采用。其中,經修 飾3D-1D法的程序進行對應。如果對目標蛋白進行該經修飾的FP的制作,則相當于考慮了 還未發現的新骨架的配體的情況,有可能發現活性比結合于目標蛋白的已知的配體高的化 合物。另一方面,認為,多種結合化合物的原子的相互作用的公共區域的FP重視與家族 蛋白相似的多種化合物結合的擬合,可得到利用生物化學信息或能量計算有可能存在原子 時賦予的與“創建性FP,,相比反映了實驗信息的FP。其它方法(MD,QM)的蛋白_配體復合物的最優化(Protein-Li肪ndComplex Optimize for other method(MD,QM))相對利用現有的經典物理學能量預測的蛋白-配體復合物(Protein-Ligand Complex)的結構,使用已知的蛋白-配體復合物(Protein-Ligand Complex)的結構的 信息,進行由上述方法得到的對接結構的順序添加、聚類參考文獻Zhan et al J. Med. Chem. 2004,47,337-344。這些情況是指,利用現有的對接軟件進行的輸出而輸出沒有可靠 地反映實驗信息的結構。另一方面,也進行了將預測的蛋白-配體復合物(Protein-LigandComplex) 的結構用使用了 AMBER、CHARMM的MD (參考文獻分別為Case,A. D.,Cheatham HI, E. T. , Darden, T. , Gohlke, H. , Luo, R. , Merz Jr. , M. K. , Onufriev, A. , Simmerling, C. , Wang, B. & Woods, J. R. The Amber Biomolecular SimulationPrograms J Comput Chem 26 1668-1688(2005),Brooks, R. B, Bruccoleri, E.R.,Olafson, D.B.,States, J. D. , Swaminathan, S. & Karplus, M. CHARMM :A program for macromolecular energy, minimization, and dynamics calculations J. Comp. Chem. 4 187-217 (1983))或 QM (參考
            49文獻(Kamiya K, Sugawara Y,UmeyamaH. J. Comput. Chem. 2003,24,826-841)進行最優化的 嘗試。在這些MD或QM等方法中,由于進行對接或虛擬篩選時計算量過大,因此,需要由天 然(為稱為Native的意思)的蛋白-配體復合物(Protein-Ligand Complex)的結構在一 定程度的近的位點對接配體,將其做為初期結構。為了得到其初期結構而使用現有的對接軟件,但是,由于以前面敘述的物理能量 為主體,因此,必需重復進行利用物理能量的最優化。另一方面,本實施例的方法主要使用已知的蛋白-配體復合物(Protein-Ligand Complex)的信息,可考慮生物信息學的觀點和利用物理能量的觀點,另外,本實施例中使用 的PDB的結構信息等生物信息學信息是每年積累的,因此認為,通過許多研究者對醫學上 有興趣的蛋白-配體復合物(Protein-Ligand Complex)的研究,對這些預測結構的最優化 也是有用的。結論(Conclusion)本方法的件能圖51是表示利用本實施例進行的處理的結果的圖表。如圖51所示,如果使用本實 施例的方法,則將T85集相對醫藥品蛋白(Druggable-protein),對接類藥配體(Drugglike ligand)時,Tc范圍為0. 56 0. 08,0. 76 0. 08,0. 96 0. 08時,得到“良好”的結構的 概率分別為58. 9,62. 1、以及65. 2%,得到“接近”的結構的概率分別為68. 6,72. 1、以及 72. 4%。另外,對于相對醫藥品目標蛋白(Druggable-Target protein)對接各種各樣的 配體(ligand)時的性能,Tc范圍為0. 56 0. 08,0. 76 0. 08,0. 96 0. 08時,得到“良 好”的結構的概率分別為40. 1,44. 8、以及46. 4%,得到“接近”的結構的概率分別為53. 2、 57. 8、以及59. 3%。而且表明,這些性能為與現有的對接軟件大致相同的性能。由目標蛋白和配體同時含有醫藥品(Druggable)化合物的訓練計算的結果來看, 如果考察目標蛋白和任意配體的相互作用分值至第10的構象,則發現一個相對目標蛋白 總體的83% (圖21的0. 96 0. 08、至10位的值)含有對正解賦予良好的模型的2.0人的 范圍的答復的配體結構,因此,有目視搜索良好的結構的價值。另一方面,如果考察目標蛋白和任意配體的相互作用分值至第10的構象,則發現 一個相對目標蛋白總體的88% (圖22的0. 96 0. 08、至10位的值)含有對正解賦予與 良好的模型相似的模型的2.5人的范圍的答復的配體結構,因此,有目視搜索良好的結構或 相似的模型結構的價值。另外,目標蛋白為醫藥品(Druggable)蛋白,從配體含有各種低分子化合物的訓 練計算的結果來看,如果考察目標蛋白和任意配體的相互作用分值至第10的構象,則發現 一個相對目標蛋白總體的65% (圖48的0. 96 0. 08、至10位的值)含有對正解賦予良 好的模型的2.0人的范圍的答復的配體結構,因此,有目視搜索良好的結構的價值。另一方面,如果考察目標蛋白和任意配體的相互作用分值至第10的構象,則發現 一個相對目標蛋白總體的76% (圖49的0. 96 0. 08、至10位的值)含有對正解賦予與 良好的模型相似的模型的2.5人的范圍的答復的配體結構,因此,有目視搜索良好的結構或 相似的模型結構的價值。目前,用物理學相互作用函數計算該目標蛋白和虛擬化合物庫低分子化合物的 相互作用時,本實施例在使用生物信息學的信息半經驗地進行計算方面與現有方法不同,進而,結構預測的成功率與世界公認的對接軟件程序GOLD相比也具有優異的大的效果,另 外,每年增加的信息的積累將半經驗性的生物信息學方法的該相互作用計算結果引導至良 好的方面,因此,有用性也大,發揮與現有方法不同的效果。另外,本實施例可將通過目標蛋白和各種低分子化合物的相互作用的分值化得到 的構象用作包含分子動力學計算式的對接程序的D0CK、AUtODOCk或GOLD、或作為分子動力 學計算程序的Amber或Charm等現有的對接軟件的初期構象。其不僅可簡便地得到本實施 例中得到的初期構象,而且重現實驗的精度高,因此,通過與其它軟件程序的組合,可得到 有用的結果。另外,本實施例可設定為以作為結合于類似于目標蛋白的立體結構的家族高分 子蛋白集上的各種低分子化合物數據庫的CElib(FP (fingerprint) set extracted from collected ligands in the binding site)(從結合位點的配體集提取的化合物指紋集) 為基礎,在使用任意的FP (指紋)的計算過程中不需要分析目標蛋白的立體結構并指定活 性位點的方法。在現有方法中,為了具有穩定構象高的分值,需要在使用D0CK、AUtODOCk或 GOLD等現有的對接軟件的對接計算中預先分析目標蛋白的立體結構而指定活性位點,與其 相比,本實施例具有與現有方法不同的大的效果,不需要通過文獻等的學習而指定活性位 點,是有用的。結論從生物信息學的觀點來考慮,本實施例的方法在使用定義已知的蛋白_配體復合 物(Protein-Ligand Complex)的相互作用信息的分值并可靠地反映于對接模擬方面是成 功的。目前,也進行通過將已知現有的對接軟件的輸出的蛋白-配體復合物 (Protein-Ligand Complex)的信息加入到對接模擬來提高精度的嘗試,這些方法依賴于研 究者的智慧和實踐,沒有普遍性。本實施例的方法自動進行同一性(Homology)檢索及立體結構擬合,進而,通過使 用本方法提出的分值函數,可精度良好地得到對接結構。 由此,可不需要許多研究者的介入地廣泛使用。另外,本方法提出的分值函數也可 與現有的對接軟件組合。即,本實施例的方法在下述的三點中是非常有用的。從生物信息學的觀點來考慮,本實施例的方法可將已知的蛋白-配體復合物 (Protein-Ligand Complex)的相互作用信息可靠地反映于對接模擬,這點與現有方法不 同。進而,本實施例的方法發揮考慮與受體的互補性及已知配體的構象及原子種類而可在 配體中自動地附加適當的物理量、距離限制等參數這樣的大的效果,當然,由于新醫學、生 物學上重要的目標蛋白和配體的相互作用的生物學信息學信息每年都在積累,因此,這些 情況對新骨架醫藥品或類似骨架的搜索是非常有用的。而且,隨著定制(Tailor-made)醫 療時代的到來,需要實驗信息豐富的目標蛋白的藥物設計(Drug Design),因此,本實施例 的方法是非常有用的。實施例2作為實施例2,下面,對將EGFR(表皮生長因子受體,Epidermalgrowth factor receptor)用作目標蛋白時的k2和k3的最優化和虛擬篩選進行說明。其中,圖52是表示來自EGFR的細胞內信號轉導通路的圖。在上述實施例1的ChooseLD法中定義的FPAScore分值的k2、k3值根據目 標蛋白以可最優化的系數定義。因此,對目標蛋白進行是否有效地起作用的驗證。作 為表皮生長因子受體家族的EGFR在癌癥治療中為重要的抑制目標(J. Biol. Chem. 277 46265-46272(2002),Cell 125 1137-1149(2006))。因此,將 EGFR用作目標蛋白,進行虛擬 蹄選。(EGFR的立體結構構津)EGFR 的氨基酸序列使用 NCBI (Wheeler, D. L. et al.,NucleicAcids Res. (2007) Nov 27)ACCESSION ID P00533,將模型設定為PDBID 1M17的A鏈。比對使用圖53所示的 比對。圖53是表示EGFR的氨基酸序列的比對的圖。同源性約為99%,與其以預測立體結構為目的,倒不如以彌補1M17的C末端的殘 基缺損為目的。使用上述比對并使用同源模建軟件FAMS Ligand & Complex (Proteins, Suppl 7 122-127(2005))構建模型。其中,圖54是表示構建的EGFR模型的圖。CIRCLE 分值(Terashi,G. et al. Proteins, (2007))為 71. 367。需要說明的是,模 型的1M17_A的分值為82. 110。CIRCLE分值為由屬于由PDB等得到的實驗結構坐標數據庫 的蛋白的X射線結構獲得的統計勢,分值在正的方向越大,越滿足已知的蛋白X射線結構的 環境,即,可說為接近于X射線結構的模型。(EGFR特異的FP庫的構津)用作按照實施例2的ChooseLD法得到的FP庫的配體的PDBID如下所述。1AD5,1AGW,1BYG,1E9H,1FGI,1FIN,1FPU,1FVV,1GAG,1H1P,1H1Q,1H24,1H25, 1H26,1H27,1144,1IEP,1IR3,1JPA,1JQH,1K3A,1KSW,1M17,1M52,1MP8,1MQB,10EC,10GU, 1019,10IU,10PJ,10PK,10PL,1PF8,1PKG,1QCF,1QMZ,1QPC,1QPD,1QPE,1QPJ,1R0P,1RQQ, 1SM2,1SNU,1T46,1U4D,1U54,1U59,1UWH,1UWJ,1VYW,1XBB,1XBC,1XKK,1Y57,1Y6A,1Y6B, 1YKR,1Y0L,1Y0M,1YVJ,1YWN,2B54,2B7A,2BDF,2BDJ,2BKZ,2BPM,2C0I,2C00,2C0T,2C4G, 2C5N,2C50,2C5P,2C5T,2C5V,2C5X,2DQ7,2E2B,2ETM,2EVA,2EXM,2F4J, 2FB8,2FGI,2F00, 2G1T, 2G2F,2G2H,2G2I,2G9X,2GNF,2GNG,2GNH,2GNI,2GQG,2GS6,2GS7,2H8H,2HCK,2HEN, 2HIW,2HK5,2HW0,2HWP,2HYY,2HZ0,2HZ4,2HZI,2HZN,2I0V,2I0Y,2I1M,2140,2ITN,2IT0, 2ITP,2ITQ,2ITT,2ITU,2ITV,2ITW,2ITX,2ITY,2ITZ,2IVS,2IVT,2IVU,2IVV,2IW6,2IW8, 2IW9,2J0J,2J0K,2J0L,2J0M,2J5F,2J6M,2NRU,2NRY,20F2,20F4,20FU,20FV,20G8,20IQ, 20J9,2008,20SC,20Z0,2P0C,2P2H,2P2I,2P4I,2SRC,2UUE(IC50已知化合物的獲得)從BI0M0L (http //www, biomol. com/)的網站競爭性地抑制 EGFR,得到 11 個 IC50 值已知的化合物的平面結構。圖55是表示得到的11個抑制劑的平面結構的圖。在圖55中, 對應附加于其化合物的平面結構,表示IC50值。這些化合物的三維坐標使用采用Chem3D 使立體結構產生后進行了 Chem3D附屬的能量最小化計算的三維坐標。(將用于EGFR的虛擬篩選的k2、k3倌最優化)在 0. 5 5. 0 的范圍內變更 FPAScore 的 k2 值,將 MDLComprehensive Medicinal Chemistry (MDL CMC)Library(SymyxTechnologies,Inc. Corporate Address 3100 Central Expressway, Santa Clara, CA 95051)假定為對EGFR沒有活性的虛擬化合物,進行與這些
            52化合物相比、已知的抑制劑按順序排列于上位的實驗。圖56是表示將由FPAScore定義的k2值變更為0. 5 5. 0的范圍時的收獲率折線 圖的圖。此時,k3值設定為1.0。隨機的直線為從母集體隨機地選擇化合物時得到已知抑 制劑的推定順序的直線,如果在比該折線更靠下的位置描繪折線,則在依據FPAScore的排 列順序中可在上位檢測抑制劑的能力高,即是指虛擬篩選的性能好。k2值為0. 5,1. 0,5. 0 時,化合物的出現順序從6開始折線開始上升。將k2值為2. 0,3. 0的折線進行比較時,在 9、10位,2. 0的線的收獲率更好。因此,將k2值設定為2. 0。圖57是表示將FPAScore中的k3值變更為0. 5 2. 0的范圍時的收獲率折線圖 的圖。此時,k2值設定為1.0。無論哪個k3值,均得到大概同樣的直線,但k3值為0.5、2.0 時,在10、11位,折線上升,因此,將k3值1. 0設定為最佳值。(Tc的下限倌的最優化)設定FP庫中所含的配體的Tc的下限值。通過限定Tc的下限值,可將不類似于對 接配體的化合物排除在外。確定收獲率折線為最佳的Tc下限值。圖58是表示將Tc上限值設定為1. 00、使Tc下限值的范圍從0. 08至0. 32以0. 08 刻度變化時的各個Tc范圍中的虛擬篩選的結果的圖,活性已知化合物的出現個數為橫軸, 依據FPAScore的順序為縱軸。在Tc下限值為0. 24的情況下,出現個數為1 6個時,為 貼近x軸的良好的折線,因此,將該值設定為最佳的Tc下限值。需要說明的是,Tc下限值 為0. 32時的折線從出現個數2個附近急劇地上升。這被認為是由于,通過Tc下限值的壓 縮,將應該用于FP庫的配體排除在外,認為是指,在虛擬篩選中,即使設定為僅含有具有與 僅對接配體類似的FP的配體,也沒有成功。圖59是表示注冊于PDB的蛋白-配體復合物結構已知的PDBID和其配體的排列 順序的圖。圖60是對應附加圖59的配體ID和化合物名的圖。如圖59所示,在進行賦序 的配體中也包含EGFR抑制劑。由于這些配體包含在FP庫中,因此,來自它們的FP主要在 FP比對時使用,認為,FPAScore升高、排序在上位。在Tc下限值為0. 24的虛擬篩選中,與 0. 08的情況比較,這些配體出現順序分散,但相對于蛋白-配體復合物結構不清楚的EGFR 的IC50已知的化合物在Tc下限值為0. 24時描繪良好的收獲率曲線,因此認為,Tc下限值 0. 24為最佳。(虛擬篩選的結果)下面,表示k2 = 2.0、1^3值=1.0、1\3下限值=0. 24時的EGFR虛擬篩選的結果。 在上位100個結構中,97結構為含有磷酸原子的ATP衍生物。因此,進行下述壓縮。(1)將分子量350以上800以下的分子、含有磷的分子排除在外(2)將不進行重要的氫鍵合的分子排除在外(MET的主鏈的氮)(3)將存在蛋白原子和配體原子的沖突2.0人以下的對接配體分子排除在外圖61及圖62是表示利用激酶的虛擬篩選的壓縮的結果的上位10位的蛋白-配 體復合物的圖。需要說明的是,圖62是從其它角度觀察圖61的圖。滿足激酶(Kinase)區 域的空間內的立體結構的互補性、且滿足相互作用重要的氫鍵的結構存在于依據FPAScore 的排序中,表明,本實施例的ChooseLD法對利用虛擬篩選的抑制劑搜索也是有用的。需要 說明的是,這些試劑可購入,可測定活性值。但是,依據FPAScore的排列順序不是直接表示 目標蛋白的活性抑制的強度的分值,因此認為,不是依賴于FP構建法統一給予賦予FP的分
            53值,也可對也能夠反映結合常數的大小的分值進行改良。應用例下面,表示對各種目標蛋白應用上述實施例1、2所述的ChooseLD法的結果。這些 結果需要利用實驗來證明。第一例是關于EGFR的二聚物形成抑制劑搜索的例子。第二例 關于對VEGF2的KRN633、KRN951的復合物結構的預測,蛋白-配體復合物結構的預測需要 利用X射線結構分析來證明。第三例關于對瘧疾的虛擬篩選,這也需要利用結合實驗來證 明。(EGFR的TGF_ a結合域抑制劑的虛擬篩詵)如圖52所示,已知EGFR通過形成二聚物來傳遞信號(Nat. Rev. Cancer. 4, 361-370(2004))。作為配體結合于EGFR的轉化生長因子a (TGF- a )是EGFR形成復合物所 需要的肽。即,EGFR的TGF-a結合域的抑制劑開發為制藥的目標。因此,使用ChooseLD法 進行對EGFR的TGF- a結合域的虛擬篩選。EGFR的立體結構使用PDBID :1M0X。在TGF- a 結合域附近將 TGF 類似物的肽使用 FAMS Ligand& Complex (Proteins 61,122-127 (2005)) 進行建模,截取其側鏈。圖63是表示TGF-a結合域附近的圖,黃色為從TGF a類似物的肽僅截取側鏈的 圖,將其用作ChooseLD法的FP庫。其是以防止肽性的抑制劑在FPAScore上位出現的目的 而進行的。
            64^^^^jiffiMDL Comprehensive Medicinal Chemistry(MDL CMC)Library 的EGFR的TGF- a結合域的虛擬篩選的結果的圖,圖65是表示使用有MDL A⑶Library的 同一虛擬篩選的結果的圖。由此表明,利用實施例,可進行使用蛋白_蛋白相互作用的信息 的對接。對(VEGFR2(血管內皮生長因子受體-2))的KRN633、KRN951的復合物結構的預測VEGFR2是與血管新生有關的激酶(Kinase),是在肺癌等癌發病時異常表達的蛋 白之一,特異性地抑制該蛋白的化合物為癌的治療藥。作為抑制劑,已知有KRN633(Mol. Cancer. Ther. 3,1639-1649 (2004))、KRN951 (Cancer Res. 66,9134-9142 (2006))。但是,這 些復合物結構在2007年12月時沒有進行X射線晶體結構分析。因此,預測VEGFR2和KRN633 的復合物及VEGFR2和KRN951的復合物結構。其中,圖66是表示KRN633 (IC50 = 1. 16nm/ L)的平面結構的圖,圖67是表示KRN951 (IC50 = 0. 16nm/L)的平面結構的圖。VEGFR2的立體結構使用PDBID 2P2H的A鏈。記載關于KRN633、KRN951的對接的 條件時,用于FP庫的配體通過利用PSI-Blast的同源性檢索得到,用于對接的FP庫的上位 10 個在KRN633 中為 PDBID :2HZN_A、1YWN_A、2J5F_A、2IVU_A、2H8H_A、20H4_A、1GAG_A、1FPU_ A、2C0I_A、2P4I_A,在 KRN951 中為 2I0V_A、2HZN_A、20H4_A、1FGI_A、1YWN_A、1FPU_A、20FU_ A、2C0I_A、2H8H_A、2FGI_A。圖68 圖71是表示VEGFR2的活性附近的立體結構的圖。蛋白側的紅色的帶是 指a-螺旋,青色的帶是指0折疊。圖68表示在用于對KRN633的VEGFR2活性位點附近 的對接的屬于FP庫的配體中用于對接的配體的上位10個的集合,圖70同樣地表示在用 于KRN951的FP庫的屬于FP庫的配體中用于對VEGFR2活性位點附近的對接的配體的上位 10個的集合。圖69與VEGFR2的活性位點附近的立體結構同時表示對KRN633實施10次 ChooseLD法并預測的結構10個。在FP庫的配體中與KRN633的類似度使用Tc時,最高值為0. 45。在10次嘗試中,可得到大致同樣的結構。圖71同樣地與VEGFR2的活性位點附 近的立體結構同時表示對KRN951實施10次ChooseLD法并預測的結構10個。預測結構的 10個中8個為大致相同的結構。在FP庫的配體中與KRN951的類似度使用Tc時,最高值為 0. 29。(VEGFR-2的對接預測成功率的計算)為了評價KRN633、KRN951的預測復合物結構的可靠性,使用FP庫中所含的對接配 體的Tc最大值,計算由133集計算的統計成功率。圖72是對將由使用133集的ChooseLD 法的對接性能試驗的結果得到的Tc下限值固定在0. 08、使Tc上限值變化時的預測成功率, 將橫軸設定為Tc上限值、縱軸設定為成功率的圖的圖。S卩,通過在圖中嵌入Tc上限值,可統計計算應用ChooseLD法時的預測成功精度。 但是,該統計的預測成功率不考慮目標蛋白的立體結構、氨基酸序列。在KRN633的對接中 使用的FP庫中所含的配體中,Tc為最大的配體為0. 45,因此,使用0. 36和0. 56時的預測 成功率嵌入預測成功率時,為34. 7%。KRN951也同樣地根據0. 24和0. 36時的預測成功率, 推定預測成功率為24.3%。在133集中的預測成功率中預測成功率最高的GOLD Score STD 為 46. 0%,D0CK 為 21. 1%, AutoDock 為 26. 6%,KRN633 比 AutoDock 好,可以不及 GOLD 的 精度預測,關于KRN951,認為可以與AutoDock同程度的精度預測。(相對于惡件瘧原蟲(Plasmodiumfalciparum)烯酰基載體蛋白還原酶的低分子 (NAD)插入的狀杰下的對接)惡性瘧原蟲的烯酰基載體蛋白是瘧疾的病原蛋白之一,是與脂質合成有關的 蛋白,該脂質合成通路不存在于人體內,因此認為,抑制該蛋白的功能與瘧疾治療有關 (J. Biol. Chem. 277,13106—13114 (2002))。圖73是表示烯酰基載體蛋白的立體結構的圖。另外,如圖73所示,作為抑制該蛋 白的化合物,存在三氯生等,進行與多數抑制劑的X射線晶體結構分析(J. Biol. Chem. 277, 13106-13114(2002))。這些抑制劑經由NAD結合。通過將它們用作FP庫,實施用于新抑制 劑的先導化合物搜索的虛擬篩選。
            74 ^^^jiffi MDL Comprehensive Medicinal Chemistry (MDL CMC) Library 進行烯酰基載體蛋白的虛擬篩選的結果的FPAScore的上位10個結構的圖。被上側的圓包 圍的部分為利用虛擬篩選的結果,進行考慮用下側的圓表示的NAD所占的空間的對接。需 要說明的是,對MDL Available Chemicals Directory (MDL ACD) Library 也實施虛擬篩選, 可表明,根據本實施例的ChooseLD法,可進行考慮了存在于NAD或H20等目標蛋白的活性 位點附近的低分子的對接。(結論)在本實施例中,開發了使用用模擬退火將新定義的FPAScore進行最優化的方法 的基于生物信息學的配體對接和虛擬篩選法、ChooseLD法。另外,通過進行85集中的kl值 的最優化,將假定用于高通量篩選等的最佳值確定為4. 0。在使用該kl值的情況下,在133 集中,將rmsd為2.0人以下且可預測實驗結構的比例設定為指標時,本實施例的ChooseLD 法的對接性能為與使用現有的經典物理函數進行對接的GOLD同程度,Tc上限值低時,與 DOCK、AutoDock為同程度。該情況表明,利用由來自家族蛋白的配體構建的FP庫中所含的 配體通過FP構建法得到的FP為自由能變低的坐標的假定正確。
            但是,由于目前現有的對接軟件不一定能夠搜索自由能最小的結構,因此,也表明 現有方法還有改良的余地。另外,在133集中,從預測成功的PDBID的分布的觀點考慮,將 ChooseLD法和Glide、GOLD、FlexX進行比較,利用Tc計算PDBID的分布的類似度,結果表 明,預測成功的目標具有獨特性,通過本實施例的ChooseLD法和現有法的并用,虛擬篩選 的精度可能上升。進而,如上所述,在本實施例2中,將EGFR的激酶區域用作目標蛋白,表 示FPAScore的k2值、k3值根據目標蛋白可最優化的變量。根據這些結果認為,本實施例 2的ChooseLD法中的FPAScore的kl、k2、k3值根據目標蛋白進行最優化,對更多的抑制劑 及先導化合物進行虛擬篩選。實施例3下面,對實施例3進行說明。在實施例3中,以開發AMPKhomoGAMMAl酶的抑制劑 (拮抗劑)以及激動劑(激動劑)的目的進行虛擬篩選。首先,將AMPKhomoGAMMAl酶作為目標蛋白,進行其氨基酸序列的同一性檢索,將 具有99. 7%的同源性的2V9J_E(2V9J的E鏈)作為模型含有以下的配體,使用FAMS Ligand 建模AMPKhomoGAMMAl。其中,圖75是表示AMPKhomoGAMMAl和2V9J_E的氨基酸序列的比 對的圖。其結果,結合配體為2V8Q_E的3個配體AMP_E_1327、AMP_E_1328、AMP_E_1329、 2V92_E 的 3 個配體 ATP_E_1327、ATP_E_1328、AMP_E_1329、2V9J_E 的 3 個配體和 2 個鎂 ATP_ E_1327、ATP_E_1328、AMP_E_1329、MG_E_1330、MG_E_1331、2QRE_E 的 1 個配體 AMZ_E_1002。接著,2V9J_E以外的配體以利用CE的擬合(不在意原子的種類的蛋白之間的結構 擬合)與2V9J_E的坐標系擬合。從2V9J_E模型的3處ATP(AMP)結合位點中縮小至不依 賴于MG離子的AMP_E_1329位點,實施抑制劑及激動劑的篩選。在實施本實施例的ChooseLD時,從AMP_E_1329的結合位點截取18人以內的氨
            基酸殘基,做成2V9J_E的受體模型。另外,在ChooseLD篩選時,受體結合位點以外的配體 和MG離子作為輔助因子(Cofactor)包含在受體中。另外,在本實施例的ChooseLD的FP 中,使用從受體結合位點的配體分子除去了磷酸基(P03)的3個腺苷和1-(5_氨基-4-羧 酰胺-1H-咪唑-基)-核糖,磷酸基部分不朝向候選化合物的官能團。因此,不是直接使磷 酸為FP,而是計算與磷酸基的氧原子進行氫鍵合的Hisl51和His298 (在模型蛋白的2V9J_ E中為Hisl50和His297)對的相對距離,用⑶T_TS( 0.5A、l.OA, 1.5人、2.0入)計算 結構的偏差,為70%以上(可變更)OTT_TS的殘基對,從殘基對將存在于3.0人以內(可 變更)的配體從95%NR_PDB以HETATM提取。需要說明的是,此時,也可不是2個氨基酸殘 基而指定3個氨基酸殘基。OTT_TS表示相對天然結構在X人以下擬合的殘基的比例。其結果,可提取1061個 配體。通過對這些配體確認與2V9J_E受體的沖突,將18個配體或配體的一部分追加于FP, 利用合計 22 個FP進行 CMC (Comprehensive Medicinal Chemistry, 2006. l,Elseviwr MDL) 數據庫的篩選。進行以下設定受體側和配體的原子沖突(2.0A1原子以下、2.2 A3原子以下、 2.4人5原子以下)、配體分子量200 500、配體LogP-l 5、配體的環的數、氫供給原子、 氫接收原子分別為0 5等。其中,圖76是表示配體結合于整個受體的CMC醫藥品的結果 列表的圖。
            其中,圖77是集合地表示對其中的1位 10位的2V9J_E受體的結合狀態的圖。 綠色的球棒模型表示2個HIS殘基,黃色的棒狀模型表示3個腺苷和1- (5-氨基-4-羧酰 胺-1H-咪唑-基)-核糖。在其間對接10個醫藥品。進而,也可在3個腺苷和1-(5_氨 基-4-羧酰胺-1H-咪唑-基)_核糖的基礎上,將用CMC篩選得到的醫藥品化合物27個 作為指紋,使用合計 31 個 FP 進行 ACD (Available ChemicalsDirectory, 2008. l,Elseviwr MDL)的篩選,得到AMPKhomoGAMMAl酶的抑制劑(拮抗劑)以及激動劑(激動劑)的候選化 合物。其他實施方式至此對本發明的實施方式進行了說明,但本發明除上述的實施方式之外,還可在 上述權利要求的范圍及本申請發明的概要記載的技術思想的范圍內以各種不同的實施方 式實施。例如,將虛擬篩選裝置100以獨立的方式進行處理的情況作為一例進行了說明, 但虛擬篩選裝置100可以根據來自由其它框體構成的客戶終端的要求進行處理并將其處 理結果返回到該客戶終端的方式構成。另外,在實施方式中說明的各處理中,也可手動地進行作為自動地進行的處理說 明的處理的全部或一部分,或者也可用公知的方法自動地進行作為手動地進行的處理說明 的處理的全部或一部分。此外,對含有上述文獻中或附圖中所示的處理步驟、控制步驟、具體名稱、各處理 的注冊數據或檢索條件等參數的信息、畫面例、數據庫構成,除特別記載的情況之外,可任 意地進行變更。另外,關于虛擬篩選裝置100,圖示的各構成要素為功能概念的構成要素,不一定 需要如物理圖示那樣構成。例如,對虛擬篩選裝置100的各裝置具備的處理功能、特別是由控制部102進行的 各處理功能,可用CPU (中央處理單元,CentralProcessing Unit)及通過該CPU解釋執行 的程序實現其全部或任意的一部分,或者也可作為利用接線邏輯的硬件實現。另外,外部系 統200可作為TOB服務器或ASP服務器等構成,其硬件構成可由一般市售的工作站、個人電 腦等信息處理裝置及其附屬裝置構成。另外,外部系統200的各功能利用外部系統200的 硬件構成中的CPU、盤裝置、存儲裝置、輸入裝置、輸出裝置、通信控制裝置等及控制它們的 程序等實現。另外,程序記錄于后述的記錄介質,根據需要在虛擬篩選裝置100中機械地讀取。 即,ROM或HD等存儲部106等作為0S (操作系統)協動,對CPU下命令,記錄用于進行各種 處理的計算機程序。該計算機程序通過載入RAM而執行,與CPU協動而構成控制部。另外, 該計算機程序可存儲于相對虛擬篩選裝置100經由任意的網絡300連接的外部系統200等 應用程序服務器,也可根據需要下載其全部或一部分。另外,也可將本發明所述的程序保存于計算機可讀取的記錄介質。其中,所謂該 “記錄介質”,為如經由軟盤、光磁盤、1 0113 1 0113£ 1 011、0)-1 01^0、0乂0等任意的“可移動 物理介質”或LAN、WAN、因特網所代表的網絡發送程序時的通信線路或載波那樣,含有短期 保持程序的“通信介質”的記錄介質。另外,所謂“程序”,為用任意的言語或描述方法描述的數據處理方法,與源代碼或二進制碼等形式無關。需要說明的是,“程序”不一定限于單一構成的程序,也包含以多個 模塊或庫分散構成的程序或與OS (操作系統)所代表的另外的程序協動而實現其功能的程 序。需要說明的是,對在實施方式所示的各裝置中用于讀取記錄介質的具體的構成、讀取步 驟或讀取后的安裝步驟等,可使用眾所周知的構成或步驟。保存于存儲部106的各種數據庫等是RAM、ROM等存儲裝置、硬盤等硬盤裝置、軟 盤、光盤等存儲裝置,其保存用于各種處理或網站提供的各種程序、表、數據庫或網頁用文 件等。另外,虛擬篩選裝置100可通過連接已知的個人電腦、工作站等信息處理裝置,在 該信息處理裝置中安裝實現本發明的方法的軟件(包含程序、數據等)來實現。進而,裝置的分散、組合的具體方式不限于圖示的方式,其可將其全部或一部分以 對應各種負荷等的任意的單元功能性或物理性地分散、組合而構成。工業實用件哪種該化合物與目標高分子蛋白有效地相互作用并對接的信息為新醫藥品開發 的關鍵,另外,定制醫療至少對應于一個氨基酸殘基的取代而進行目前所不知的醫藥品的 開發,因此,結合于目標高分子蛋白的化合物的信息在實驗確定完的化合物數中其數量豐 富,可使新藥開發加速,因此,本申請發明中敘述的虛擬篩選裝置及虛擬篩選方法的工業上 的可利用性非常大。
            權利要求
            篩選結合于目標蛋白的候選化合物的虛擬篩選裝置,其至少具備存儲部和控制部,其特征在于,●所述存儲部具備化合物數據庫,■所述化合物數據庫通過提取每個所述候選化合物的包含原子類型和原子間結合規則的化學描述符而制成,■所述化學描述符作為聯系化合物中多個原子的化合物指紋而被提取;●所述控制部具備■化合物指紋制作裝置,其將結合化合物的三維坐標與所述化合物指紋一同提取而制作結合化合物指紋集,◆所述結合化合物已知結合于立體結構與所述目標蛋白相同或類似的家族蛋白,◆所述結合化合物的三維坐標是已轉換到所述目標蛋白的坐標系的三維坐標,和■最優化裝置,其計算使所述候選化合物與所述目標蛋白的相互作用分值最優化的所述候選化合物的立體結構,◆所述候選化合物儲存于所述化合物數據庫中,◆所述候選化合物與所述目標蛋白的相互作用分值以所述化合物指紋單元的均方偏差為基礎,◆所述化合物指紋單元的均方偏差以所述結合化合物指紋集的所述三維坐標為基礎計算。
            2.權利要求1的虛擬篩選裝置,其特征在于, 所述虛擬篩選裝置與蛋白數據庫裝置連接,所述蛋白數據庫裝置存儲結合于化合物 的蛋白的立體結構及氨基酸序列; 所述控制部還具備同一性檢索裝置,所述同一性檢索裝置基于所述目標蛋白與所述 氨基酸序列的同一性,從所述蛋白數據庫裝置檢索所述家族蛋白及所述結合化合物; 所述化合物指紋制作裝置將所述結合化合物的三維坐標與所述化合物指紋一同提 取而制作所述結合化合物指紋集,■所述結合化合物結合于利用所述同一性檢索裝置檢索得到的所述家族蛋白, ■所述結合化合物的三維坐標是已轉換到所述目標蛋白的坐標系的三維坐標。
            3.權利要求1的虛擬篩選裝置,其特征在于,所述化合物指紋制作裝置眷通過所述家族蛋白和所述目標蛋白的結構擬合,將結合于該家族蛋白的所述結合化 合物的所述三維坐標轉換到所述目標蛋白的坐標系,并 將經轉換的所述三維坐標與所述化合物指紋一同提取而制作所述結合化合物指紋集。
            4.權利要求1的虛擬篩選裝置,其特征在于,所述化合物指紋制作裝置還具備新化合 物指紋追加裝置,所述新化合物指紋追加裝置眷參照與所述結合化合物不同的其它所述化合物進行結構擬合,并 眷提取跨越該結合化合物原子間和該其它所述化合物原子間的所述化合物指紋而追 加到所述結合化合物指紋集。
            5.權利要求1的虛擬篩選裝置,其特征在于,所述化合物指紋制作裝置還具備新化合 物指紋追加裝置,所述新化合物指紋追加裝置 對基于Tanimoto系數與所述結合化合物類似的所述化合物,替換該結合化合物原 子間和該化合物原子間的原子種類,眷計算與所述目標蛋白的相互作用能量,并眷制作與該結合化合物的所述化合物指紋相比,局部能量更穩定的所述化合物指紋而 追加到所述結合化合物指紋集。
            6.權利要求1的虛擬篩選裝置,其特征在于,所述結合化合物為利用公知的對接算法 預測為對所述目標蛋白具有穩定構象的化合物。
            7.權利要求1的虛擬篩選裝置,其特征在于,所述最優化裝置還具備相互作用分值計 算裝置,所述相互作用分值計算裝置基于考慮以下因素的函數計算所述相互作用分值 所述化合物指紋單元中以所述均方偏差為基礎的所述候選化合物與所述目標蛋白 的沖突程度、 所述候選化合物在所述目標蛋白的相互作用區域中的存在比例、及 所述候選化合物與所述目標蛋白的直接相互作用比例。
            8.權利要求1的虛擬篩選裝置,其特征在于,所述最優化裝置通過下法使所述相互作 用分值最優化 基于Metropolis法判定所述相互作用分值, 根據判定結果變更、增加或減少成為所述候選化合物的基礎的所述化合物指紋。
            9.權利要求1的虛擬篩選裝置,其特征在于, 所述最優化裝置還具備結構變換裝置,所述結構變換裝置■在所述相互作用分值的最優化過程中,反復改變所述候選化合物的構象,■基于模擬退火法,按照該候選化合物的各所述構象將該候選化合物作為剛體反復并 行或旋轉; 所述最優化裝置計算經所述結構變換裝置并行或旋轉的各所述構象的所述候選化 合物的所述相互作用分值。
            10.權利要求1的虛擬篩選裝置,其特征在于,所述最優化裝置基于以下的數學式(1) 計算所述相互作用分值數1FPAScore = F(aligned—fp,fp—rmsd,molecule) =BaseScore (aligned_fp, fp—rmsd) X fp—volume (molecule) Xfp_contact_surface(molecule) (1)其中, 所述FPAScore表示所述相互作用分值, 所述F(aligned_fp,fp_rmsd, molecule)為將以下因素作為變量的函數■所述結合化合物和所述候選化合物間的所述化合物指紋單元的比對度、及所述均方 偏差、以及■所述候選化合物對所述目標蛋白的所述立體結構; 所述BaseScore (aligned_fp,fp_rmsd)為表示所述化合物指紋單元的一致度及密 集度的指標; 所述fp_volume (molecule)為表示以下因素的指標■所述候選化合物占由所述結合化合物指紋集的所述三維坐標構成的空間的比例、及■所述候選化合物與所述目標蛋白的沖突程度; 所述fp_contact_surface (molecule)為表示以下因素的指標■所述候選化合物與所述目標蛋白的接觸度、及■所述候選化合物對所述結合化合物指紋集的所述三維坐標的歸屬度。
            11.權利要求10的虛擬篩選裝置,其特征在于,所述數學式(1)中,基于以下的數學式(2)計算,數2
            其中,■所述RawScoreblignecLfp)為基于在所述結合化合物和所述候選化合物間比對的 所述化合物指紋中的原子數的指標, ■所述fp_rmsd為所述均方偏差, 所述fp_volume (molecule)基于以下的數學式(6)計算,數3fip _ volume{molecule) = In !力 + m^ 其中,■所述nafp為所述候選化合物的所述三維坐標所占的固有網格點區域的網格點數, 所述固有網格點區域基于所述結合化合物指紋集的所述三維坐標,■所述nap為所述候選化合物的所述三維坐標所屬的所述目標蛋白的所述立體結構 中原子的固有網格點區域的網格點數,所述k2及k3為任意常數; 所述fp_contact_Surface (molecule)基于以下的數學式(7)計算,數4
            Z density of—atom{atom{i))fp _ contact _ surface{molecule)=———---一一total_density_of _atom(molecule) (γ)其中,■所述η為所述候選化合物的原子數,■所述atom(i)為所述候選化合物的第i個原子的所述三維坐標, ■所述density_0f_at0m(at0m(i))為當該原子的所述三維坐標屬于所述結合化合物 指紋集的所述化合物指紋時,返回以下數之和的函數 以所定距離與該化合物指紋的所述原子接觸的所述目標蛋白的原子數、和 屬于該化合物指紋的同一網格點的所述結合化合物的原子數, ■所述 total_density_of_atom(molecule)為將按降序重排的所述 density_of_atom 分布依次累加所述候選化合物的原子數項的數。
            12.虛擬篩選方法,其在至少具備存儲部和控制部的虛擬篩選裝置中實施,所述方法篩 選結合于目標蛋白的候選化合物,其特征在于, 所述存儲部具備化合物數據庫,■所述化合物數據庫由提取每個上述候選化合物的包含原子類型和原子間結合規則 的化學描述符而制成,■所述化學描述符作為聯系化合物中多個原子的化合物指紋而被提取; 所述方法包括在所述控制部中實施的以下步驟■化合物指紋制作步驟,將結合化合物的三維坐標與所述化合物指紋一同提取而制作 結合化合物指紋集, 所述結合化合物已知結合于立體結構與所述目標蛋白相同或類似的家族蛋白, 所述結合化合物的三維坐標是已轉換到所述目標蛋白的坐標系的三維坐標; ■最優化步驟,計算使所述候選化合物與所述目標蛋白的相互作用分值最優化的所述 候選化合物的立體結構, 所述候選化合物存儲于所述化合物數據庫中, 所述候選化合物與所述目標蛋白的相互作用分值以所述化合物指紋單元的均方偏 差為基石出, 所述化合物指紋單元的均方偏差以所述結合化合物指紋集的所述三維坐標為基礎。
            全文摘要
            本發明提供虛擬篩選裝置,其特征在于,具備對每個候選化合物提取化合物中的多個原子的化合物指紋而制成的化合物的數據庫,對已知結合于立體結構和目標蛋白相同或類似的家族蛋白的結合化合物,與轉換到目標蛋白的坐標系的三維坐標一同,提取化合物指紋,制作結合化合物指紋集,對存儲于化合物數據庫的候選化合物,運算該候選化合物的相對于目標蛋白的所述立體結構,使以將結合化合物指紋集的三維坐標作為基礎計算的化合物指紋單元的均方偏差為基礎的相互作用分值最優化。
            文檔編號G06F19/00GK101855392SQ20088011549
            公開日2010年10月6日 申請日期2008年11月12日 優先權日2007年11月12日
            發明者加納和彥, 寺師玄記, 小松克一郎, 志鷹真由子, 梅山秀明, 高谷大輔 申請人:電子虛擬生物科技株式會社
            網友詢問留言 已有0條留言
            • 還沒有人留言評論。精彩留言會獲得點贊!
            1
            婷婷六月激情在线综合激情,亚洲国产大片,久久中文字幕综合婷婷,精品久久久久久中文字幕,亚洲一区二区三区高清不卡,99国产精品热久久久久久夜夜嗨 ,欧美日韩亚洲综合在线一区二区,99国产精品电影,伊人精品线视天天综合,精品伊人久久久大香线蕉欧美
            亚洲精品1区 国产成人一级 91精品国产欧美一区二区 亚洲精品乱码久久久久久下载 国产精品久久久久久久伊一 九色国产 国产精品九九视频 伊人久久成人爱综合网 欧美日韩亚洲区久久综合 欧美日本一道免费一区三区 夜夜爽一区二区三区精品 欧美日韩高清一区二区三区 国产成人av在线 国产精品对白交换绿帽视频 国产视频亚洲 国产在线欧美精品 国产精品综合网 国产日韩精品欧美一区色 国产日韩精品欧美一区喷 欧美日韩在线观看区一二 国产区精品 欧美视频日韩视频 中文字幕天天躁日日躁狠狠躁97 视频一二三区 欧美高清在线精品一区二区不卡 国产精品揄拍一区二区久久 99久久综合狠狠综合久久aⅴ 亚洲乱码视频在线观看 日韩在线第二页 亚洲精品无码专区在线播放 成人亚洲网站www在线观看 欧美三级一区二区 99久久精品免费看国产高清 91麻豆国产在线观看 最新日韩欧美不卡一二三区 成人在线观看不卡 日韩国产在线 在线亚洲精品 亚洲午夜久久久久中文字幕 国产精品成人久久久久久久 精品国产一区二区在线观看 欧美精品国产一区二区三区 中文在线播放 亚洲第一页在线视频 国产午夜精品福利久久 九色国产 精品国产九九 国产永久视频 久久精品人人做人人综合试看 国产一区二区三区免费观看 亚洲精品国产电影 9999热视频 国产精品资源在线 麻豆久久婷婷国产综合五月 国产精品免费一级在线观看 亚洲国产一区二区三区青草影视 中文在线播放 国产成人综合在线 国产在线观看色 国产亚洲三级 国产片一区二区三区 久久99精品久久久久久牛牛影视 亚洲欧美日韩国产 四虎永久免费网站 国产一毛片 国产精品视频在 九九热在线精品 99精品福利视频 色婷婷色99国产综合精品 97成人精品视频在线播放 精品久久久久久中文字幕 亚洲欧美一区二区三区孕妇 亚洲欧美成人网 日韩高清在线二区 国产尤物在线观看 在线不卡一区二区 91网站在线看 韩国精品福利一区二区 欧美日韩国产成人精品 99热精品久久 国产精品免费视频一区 高清视频一区 精品九九久久 欧美日韩在线观看免费 91欧美激情一区二区三区成人 99福利视频 亚洲国产精品91 久热国产在线 精品久久久久久中文字幕女 国产精品久久久久久久久99热 成人自拍视频网 国产精品视频久久久久久 久久影院国产 国产玖玖在线观看 99精品在线免费 亚洲欧美一区二区三区导航 久久久久久久综合 国产欧美日韩精品高清二区综合区 国产精品视频自拍 亚洲一级片免费 久久久久久九九 国产欧美自拍视频 视频一区二区在线观看 欧美日韩一区二区三区久久 中文在线亚洲 伊人热人久久中文字幕 日韩欧美亚洲国产一区二区三区 欧美亚洲国产成人高清在线 欧美日韩国产码高清综合人成 国产性大片免费播放网站 亚洲午夜综合网 91精品久久一区二区三区 国产无套在线播放 国产精品视频网站 国产成人亚洲精品老王 91在线网站 国产视频97 欧美黑人欧美精品刺激 国产一区二区三区免费在线视频 久久久国产精品免费看 99re6久精品国产首页 久久精品91 国产成人一级 国产成人精品曰本亚洲 日本福利在线观看 伊人成综合网 久久综合一本 国产综合久久久久久 久久精品成人免费看 久久福利 91精品国产91久久久久久麻豆 亚洲精品成人在线 亚洲伊人久久精品 欧美日本二区 国产永久视频 国产一区二 一区二区福利 国产一毛片 亚洲精品1区 毛片一区二区三区 伊人久久大香线蕉综合影 国产欧美在线观看一区 亚洲国产欧洲综合997久久 国产一区二区免费视频 国产91精品对白露脸全集观看 久久亚洲国产伦理 欧美成人伊人久久综合网 亚洲性久久久影院 久久99国产精一区二区三区! 91精品国产欧美一区二区 欧美日韩亚洲区久久综合 日韩精品一二三区 久久久夜色精品国产噜噜 国产在线精品福利91香蕉 久久久久久久亚洲精品 97se色综合一区二区二区 91国语精品自产拍在线观看性色 91久久国产综合精品女同我 日韩中文字幕a 国产成人亚洲日本精品 久久国产精品-国产精品 久久国产经典视频 久久国产精品伦理 亚洲第一页在线视频 国产精品久久久久三级 日韩毛片网 久久免费高清视频 麻豆国产在线观看一区二区 91麻豆国产福利在线观看 国产成人精品男人的天堂538 一区二区三区中文字幕 免费在线视频一区 欧美日韩国产成人精品 国产综合网站 国产资源免费观看 亚洲精品亚洲人成在线播放 精品久久久久久中文字幕专区 亚洲人成人毛片无遮挡 国产一起色一起爱 国产香蕉精品视频在 九九热免费观看 日韩亚洲欧美一区 九九热精品在线观看 精品久久久久久中文字幕专区 亚洲欧美自拍偷拍 国产精品每日更新 久久久久国产一级毛片高清板 久久天天躁狠狠躁夜夜中文字幕 久久精品片 日韩在线毛片 国产成人精品本亚洲 国产成人精品一区二区三区 九九热在线观看 国产r级在线观看 国产欧美日韩精品高清二区综合区 韩国电影一区二区 国产精品毛片va一区二区三区 五月婷婷伊人网 久久一区二区三区免费 一本色道久久综合狠狠躁篇 亚洲综合色站 国产尤物在线观看 亚洲一区亚洲二区 免费在线视频一区 欧洲精品视频在线观看 日韩中文字幕a 中文字幕日本在线mv视频精品 91精品在线免费视频 精品国产免费人成在线观看 精品a级片 中文字幕日本在线mv视频精品 日韩在线精品视频 婷婷丁香色 91精品国产高清久久久久 国产成人精品日本亚洲直接 五月综合视频 欧美日韩在线亚洲国产人 精液呈暗黄色 亚洲乱码一区 久久精品中文字幕不卡一二区 亚洲天堂精品在线 激情婷婷综合 国产免费久久精品久久久 国产精品亚洲二区在线 久久免费播放视频 五月婷婷丁香综合 在线亚洲欧美日韩 久久免费精品高清麻豆 精品久久久久久中文字幕 亚洲一区网站 国产精品福利社 日韩中文字幕免费 亚洲综合丝袜 91精品在线播放 国产精品18 亚洲日日夜夜 伊人久久大香线蕉综合影 亚洲精品中文字幕乱码影院 亚洲一区二区黄色 亚洲第一页在线视频 一区二区在线观看视频 国产成人福利精品视频 亚洲高清二区 国内成人免费视频 精品亚洲性xxx久久久 国产精品合集一区二区三区 97av免费视频 国产一起色一起爱 国产区久久 国产资源免费观看 99精品视频免费 国产成人一级 国产精品九九免费视频 欧美91精品久久久久网免费 99热国产免费 久久精品色 98精品国产综合久久 久久精品播放 中文字幕视频免费 国产欧美日韩一区二区三区在线 精品久久蜜桃 国产小视频精品 一本色道久久综合狠狠躁篇 91在线免费观看 亚洲精品区 伊人成综合网 伊人热人久久中文字幕 伊人黄色片 99国产精品热久久久久久夜夜嗨 久久免费精品视频 亚洲一区二区三区高清不卡 久久久久国产一级毛片高清板 国产片一区二区三区 久久狠狠干 99久久婷婷国产综合精品电影 国产99区 国产精品成人久久久久 久久狠狠干 青青国产在线观看 亚洲高清国产拍精品影院 国产精品一区二区av 九九热在线免费视频 伊人久久国产 国产精品久久久久久久久久一区 在线观看免费视频一区 国产精品自在在线午夜区app 国产精品综合色区在线观看 国产毛片久久久久久国产毛片 97国产免费全部免费观看 国产精品每日更新 国产尤物视频在线 九九视频这里只有精品99 一本一道久久a久久精品综合 久久综合给会久久狠狠狠 国产成人精品男人的天堂538 欧美一区二区高清 毛片一区二区三区 国产欧美日韩在线观看一区二区三区 在线国产二区 欧美不卡网 91在线精品中文字幕 在线国产福利 国内精品91久久久久 91亚洲福利 日韩欧美国产中文字幕 91久久精品国产性色也91久久 亚洲性久久久影院 欧美精品1区 国产热re99久久6国产精品 九九热免费观看 国产精品欧美日韩 久久久久国产一级毛片高清板 久久国产经典视频 日韩欧美亚洲国产一区二区三区 欧美亚洲综合另类在线观看 国产精品自在在线午夜区app 97中文字幕在线观看 视频一二三区 精品国产一区在线观看 国产欧美日韩在线一区二区不卡 欧美一区二三区 伊人成人在线观看 国内精品91久久久久 97在线亚洲 国产在线不卡一区 久久久全免费全集一级全黄片 国产精品v欧美精品∨日韩 亚洲毛片网站 在线不卡一区二区 99re热在线视频 久久激情网 国产毛片一区二区三区精品 久久亚洲综合色 中文字幕视频免费 国产视频亚洲 婷婷伊人久久 国产一区二区免费播放 久久99国产精品成人欧美 99国产在线视频 国产成人免费视频精品一区二区 国产不卡一区二区三区免费视 国产码欧美日韩高清综合一区 久久精品国产主播一区二区 国产一区电影 久久精品国产夜色 国产精品国产三级国产 日韩一区二区三区在线 久久97久久97精品免视看 久久国产免费一区二区三区 伊人久久大香线蕉综合电影网 99re6久精品国产首页 久久激情网 亚洲成人高清在线 国产精品网址 国产成人精品男人的天堂538 香蕉国产综合久久猫咪 国产专区中文字幕 91麻豆精品国产高清在线 久久国产经典视频 国产精品成人va在线观看 国产精品爱啪在线线免费观看 日本精品久久久久久久久免费 亚洲综合一区二区三区 久久五月网 精品国产网红福利在线观看 久久综合亚洲伊人色 亚洲国产精品久久久久久网站 在线日韩国产 99国产精品热久久久久久夜夜嗨 国产综合精品在线 国产区福利 精品亚洲综合久久中文字幕 国产制服丝袜在线 毛片在线播放网站 在线观看免费视频一区 国产精品久久久精品三级 亚洲国产电影在线观看 最新日韩欧美不卡一二三区 狠狠综合久久综合鬼色 日本精品1在线区 国产日韩一区二区三区在线播放 欧美日韩精品在线播放 亚洲欧美日韩国产一区二区三区精品 久久综合久久网 婷婷六月激情在线综合激情 亚洲乱码一区 国产专区91 97av视频在线观看 精品久久久久久中文字幕 久久五月视频 国产成人福利精品视频 国产精品网址 中文字幕视频在线 精品一区二区三区免费视频 伊人手机在线视频 亚洲精品中文字幕乱码 国产在线视频www色 色噜噜国产精品视频一区二区 精品亚洲成a人在线观看 国产香蕉尹人综合在线 成人免费一区二区三区在线观看 国产不卡一区二区三区免费视 欧美精品久久天天躁 国产专区中文字幕 久久精品国产免费中文 久久精品国产免费一区 久久无码精品一区二区三区 国产欧美另类久久久精品免费 欧美精品久久天天躁 亚洲精品在线视频 国产视频91在线 91精品福利一区二区三区野战 日韩中文字幕免费 国产精品99一区二区三区 欧美成人高清性色生活 国产精品系列在线观看 亚洲国产福利精品一区二区 国产成人在线小视频 国产精品久久久久免费 99re热在线视频 久久久久久久综合 一区二区国产在线播放 成人国产在线视频 亚洲精品乱码久久久久 欧美日韩一区二区综合 精品久久久久免费极品大片 中文字幕视频二区 激情粉嫩精品国产尤物 国产成人精品一区二区视频 久久精品中文字幕首页 亚洲高清在线 国产精品亚洲一区二区三区 伊人久久艹 中文在线亚洲 国产精品一区二区在线播放 国产精品九九免费视频 亚洲二区在线播放 亚洲狠狠婷婷综合久久久久网站 亚洲欧美日韩网站 日韩成人精品 亚洲国产一区二区三区青草影视 91精品国产福利在线观看 国产精品久久久久久久久99热 国产一区二区精品尤物 久碰香蕉精品视频在线观看 亚洲日日夜夜 在线不卡一区二区 国产午夜亚洲精品 九九热在线视频观看这里只有精品 伊人手机在线视频 91免费国产精品 日韩欧美中字 91精品国产91久久久久 国产全黄三级播放 视频一区二区三区免费观看 国产开裆丝袜高跟在线观看 国产成人欧美 激情综合丝袜美女一区二区 国产成人亚洲综合无 欧美精品一区二区三区免费观看 欧美亚洲国产日韩 日韩亚州 国产欧美日韩精品高清二区综合区 亚洲午夜国产片在线观看 精品久久久久久中文字幕 欧美精品1区 久久伊人久久亚洲综合 亚洲欧美日韩精品 国产成人精品久久亚洲高清不卡 久久福利影视 国产精品99精品久久免费 久久久久免费精品视频 国产日产亚洲精品 亚洲国产午夜电影在线入口 精品无码一区在线观看 午夜国产精品视频 亚洲一级片免费 伊人久久大香线蕉综合影 国产精品久久影院 久碰香蕉精品视频在线观看 www.欧美精品 在线小视频国产 亚洲国产天堂久久综合图区 欧美一区二区三区不卡 日韩美女福利视频 九九精品免视频国产成人 不卡国产00高中生在线视频 亚洲第一页在线视频 欧美日韩在线播放成人 99re视频这里只有精品 国产精品91在线 精品乱码一区二区三区在线 国产区久久 91麻豆精品国产自产在线观看一区 日韩精品成人在线 九九热在线观看 国产精品久久不卡日韩美女 欧美一区二区三区综合色视频 欧美精品免费一区欧美久久优播 国产精品网址 国产专区中文字幕 国产精品欧美亚洲韩国日本久久 日韩美香港a一级毛片 久久精品123 欧美一区二区三区免费看 99r在线视频 亚洲精品国产字幕久久vr 国产综合激情在线亚洲第一页 91免费国产精品 日韩免费小视频 亚洲国产精品综合一区在线 国产亚洲第一伦理第一区 在线亚洲精品 国产精品一区二区制服丝袜 国产在线成人精品 九九精品免视频国产成人 亚洲国产网 欧美日韩亚洲一区二区三区在线观看 在线亚洲精品 欧美一区二区三区高清视频 国产成人精品男人的天堂538 欧美日韩在线观看区一二 亚洲欧美一区二区久久 久久精品中文字幕首页 日本高清www午夜视频 久久精品国产免费 久久999精品 亚洲国产精品欧美综合 88国产精品视频一区二区三区 91久久偷偷做嫩草影院免费看 国产精品夜色视频一区二区 欧美日韩导航 国产成人啪精品午夜在线播放 一区二区视频在线免费观看 99久久精品国产自免费 精液呈暗黄色 久久99国产精品 日本精品久久久久久久久免费 精品国产97在线观看 99re视频这里只有精品 国产视频91在线 999av视频 亚洲美女视频一区二区三区 久久97久久97精品免视看 亚洲国产成人久久三区 99久久亚洲国产高清观看 日韩毛片在线视频 综合激情在线 91福利一区二区在线观看 一区二区视频在线免费观看 激情粉嫩精品国产尤物 国产成人精品曰本亚洲78 国产成人精品本亚洲 国产精品成人免费视频 国产成人啪精品视频免费软件 久久精品国产亚洲妲己影院 国产精品成人久久久久久久 久久大香线蕉综合爱 欧美一区二区三区高清视频 99热国产免费 在线观看欧美国产 91精品视频在线播放 国产精品福利社 欧美精品一区二区三区免费观看 国产一区二区免费视频 国产午夜精品一区二区 精品视频在线观看97 91精品福利久久久 国产一区福利 国产综合激情在线亚洲第一页 国产精品久久久久久久久久久不卡 九色国产 在线日韩国产 黄网在线观看 亚洲一区小说区中文字幕 中文字幕丝袜 日本二区在线观看 日本国产一区在线观看 欧美日韩一区二区三区久久 欧美精品亚洲精品日韩专 国产日产亚洲精品 久久综合九色综合欧美播 亚洲国产欧美无圣光一区 欧美视频区 亚洲乱码视频在线观看 久久无码精品一区二区三区 九九热精品免费视频 久久99精品久久久久久牛牛影视 国产精品成久久久久三级 国产一区福利 午夜国产精品视频 日本二区在线观看 99久久网站 国产亚洲天堂 精品国产一区二区三区不卡 亚洲国产日韩在线一区 国产成人综合在线观看网站 久久免费高清视频 欧美在线导航 午夜精品久久久久久99热7777 欧美久久综合网 国产小视频精品 国产尤物在线观看 亚洲国产精品综合一区在线 欧美一区二区三区不卡视频 欧美黑人欧美精品刺激 日本福利在线观看 久久国产偷 国产手机精品一区二区 国产热re99久久6国产精品 国产高清啪啪 欧美亚洲国产成人高清在线 国产在线第三页 亚洲综合一区二区三区 99r在线视频 99精品久久久久久久婷婷 国产精品乱码免费一区二区 国产在线精品福利91香蕉 国产尤物视频在线 五月婷婷亚洲 中文字幕久久综合伊人 亚洲精品一级毛片 99国产精品电影 在线视频第一页 久久99国产精品成人欧美 国产白白视频在线观看2 成人精品一区二区www 亚洲成人网在线观看 麻豆91在线视频 色综合合久久天天综合绕视看 久久精品国产免费高清 国产不卡一区二区三区免费视 欧美国产中文 99精品欧美 九九在线精品 国产中文字幕在线免费观看 国产一区中文字幕在线观看 国产成人一级 国产精品一区二区制服丝袜 国产一起色一起爱 亚洲精品成人在线 亚洲欧美精品在线 国产欧美自拍视频 99精品久久久久久久婷婷 久99视频 国产热re99久久6国产精品 视频一区亚洲 国产精品视频分类 国产精品成在线观看 99re6久精品国产首页 亚洲在成人网在线看 亚洲国产日韩在线一区 久久国产三级 日韩国产欧美 欧美在线一区二区三区 国产精品美女一级在线观看 成人午夜免费福利视频 亚洲天堂精品在线 91精品国产手机 欧美日韩视频在线播放 狠狠综合久久综合鬼色 九一色视频 青青视频国产 亚洲欧美自拍一区 中文字幕天天躁日日躁狠狠躁97 日韩免费大片 996热视频 伊人成综合网 亚洲天堂欧美 日韩精品亚洲人成在线观看 久久综合给会久久狠狠狠 日韩精品亚洲人成在线观看 日韩国产欧美 亚洲成aⅴ人片在线影院八 亚洲精品1区 99久久精品免费 国产精品高清在线观看 国产精品久久久免费视频 在线亚洲欧美日韩 91在线看视频 国产精品96久久久久久久 欧美日韩国产成人精品 91在线亚洲 热久久亚洲 国产精品美女免费视频观看 日韩在线毛片 亚洲永久免费视频 九九免费在线视频 亚洲一区网站 日本高清二区视频久二区 精品国产美女福利在线 伊人久久艹 国产精品久久久久三级 欧美成人精品第一区二区三区 99久久精品国产自免费 在线观看日韩一区 国产中文字幕一区 成人免费午夜视频 欧美日韩另类在线 久久99国产精品成人欧美 色婷婷中文网 久久天天躁夜夜躁狠狠躁2020 欧美成人伊人久久综合网 国产精品福利资源在线 国产伦精品一区二区三区高清 国产精品亚洲综合色区韩国 亚洲一区欧美日韩 色综合视频 国语自产精品视频在线区 国产高清a 成人国内精品久久久久影 国产在线精品香蕉综合网一区 国产不卡在线看 国产成人精品精品欧美 国产欧美日韩综合精品一区二区三区 韩国电影一区二区 国产在线视频www色 91中文字幕在线一区 国产人成午夜免视频网站 亚洲综合一区二区三区 色综合视频一区二区观看 久久五月网 九九热精品在线观看 国产一区二区三区国产精品 99久热re在线精品996热视频 亚洲国产网 在线视频亚洲一区 日韩字幕一中文在线综合 国产高清一级毛片在线不卡 精品国产色在线 国产高清视频一区二区 精品日本久久久久久久久久 亚洲国产午夜精品乱码 成人免费国产gav视频在线 日韩欧美一区二区在线观看 欧美曰批人成在线观看 韩国电影一区二区 99re这里只有精品6 日韩精品一区二区三区视频 99re6久精品国产首页 亚洲欧美一区二区三区导航 欧美色图一区二区三区 午夜精品视频在线观看 欧美激情在线观看一区二区三区 亚洲热在线 成人国产精品一区二区网站 亚洲一级毛片在线播放 亚洲一区小说区中文字幕 亚洲午夜久久久久影院 国产自产v一区二区三区c 国产精品视频免费 久久调教视频 国产成人91激情在线播放 国产精品欧美亚洲韩国日本久久 久久亚洲日本不卡一区二区 91中文字幕网 成人国产在线视频 国产视频91在线 欧美成人精品第一区二区三区 国产精品福利在线 久久综合九色综合精品 欧美一区二区三区精品 久久国产综合尤物免费观看 久久99青青久久99久久 日韩精品免费 久久国产精品999 91亚洲视频在线观看 国产精品igao视频 色综合区 在线亚洲欧国产精品专区 国产一区二区三区在线观看视频 亚洲精品成人在线 一区二区国产在线播放 中文在线亚洲 亚洲精品第一国产综合野 国产一区二区精品久久 一区二区三区四区精品视频 99热精品久久 中文字幕视频二区 国产成人精品男人的天堂538 99精品影视 美女福利视频一区二区 久久午夜夜伦伦鲁鲁片 综合久久久久久久综合网 国产精品国产欧美综合一区 国产99视频在线观看 国产亚洲女在线精品 婷婷影院在线综合免费视频 国产亚洲3p一区二区三区 91成人爽a毛片一区二区 亚洲一区二区高清 国产欧美亚洲精品第二区首页 欧美日韩导航 亚洲高清二区 欧美激情观看一区二区久久 日韩毛片在线播放 亚洲欧美日韩高清中文在线 亚洲日本在线播放 国产精品一区二区制服丝袜 精品国产一区二区三区不卡 国产不卡在线看 国产欧美网站 四虎永久在线观看视频精品 国产黄色片在线观看 夜夜综合 一本色道久久综合狠狠躁篇 欧美亚洲综合另类在线观看 国产91在线看 伊人久久国产 欧美一区二区在线观看免费网站 国产精品久久久久三级 久久福利 日韩中文字幕a 亚洲午夜久久久久影院 91在线高清视频 国产亚洲一区二区三区啪 久久人精品 国产精品亚洲午夜一区二区三区 综合久久久久久 久久伊人一区二区三区四区 国产综合久久久久久 日韩一区精品视频在线看 国产精品日韩欧美制服 日本精品1在线区 99re视频 无码av免费一区二区三区试看 国产视频1区 日韩欧美中文字幕一区 日本高清中文字幕一区二区三区a 亚洲国产欧美无圣光一区 国产在线视频一区二区三区 欧美国产第一页 在线亚洲欧美日韩 日韩中文字幕第一页 在线不卡一区二区 伊人久久青青 国产精品一区二区在线播放 www.五月婷婷 麻豆久久婷婷国产综合五月 亚洲精品区 久久国产欧美另类久久久 99在线视频免费 伊人久久中文字幕久久cm 久久精品成人免费看 久久这里只有精品首页 88国产精品视频一区二区三区 中文字幕日本在线mv视频精品 国产在线精品成人一区二区三区 伊人精品线视天天综合 亚洲一区二区黄色 国产尤物视频在线 亚洲精品99久久久久中文字幕 国产一区二区三区免费观看 伊人久久大香线蕉综合电影网 国产成人精品区在线观看 日本精品一区二区三区视频 日韩高清在线二区 久久免费播放视频 一区二区成人国产精品 国产精品免费精品自在线观看 亚洲精品视频二区 麻豆国产精品有码在线观看 精品日本一区二区 亚洲欧洲久久 久久中文字幕综合婷婷 中文字幕视频在线 国产成人精品综合在线观看 91精品国产91久久久久福利 精液呈暗黄色 香蕉国产综合久久猫咪 国产专区精品 亚洲精品无码不卡 国产永久视频 亚洲成a人片在线播放观看国产 一区二区国产在线播放 亚洲一区二区黄色 欧美日韩在线观看视频 亚洲精品另类 久久国产综合尤物免费观看 国产一区二区三区国产精品 高清视频一区 国产精品igao视频 国产精品资源在线 久久综合精品国产一区二区三区 www.五月婷婷 精品色综合 99热国产免费 麻豆福利影院 亚洲伊人久久大香线蕉苏妲己 久久电影院久久国产 久久精品伊人 在线日韩理论午夜中文电影 亚洲国产欧洲综合997久久 伊人国产精品 久草国产精品 欧美一区精品二区三区 亚洲成人高清在线 91免费国产精品 日韩精品福利在线 国产一线在线观看 国产不卡在线看 久久99青青久久99久久 亚洲精品亚洲人成在线播放 99久久免费看国产精品 国产日本在线观看 青草国产在线视频 麻豆久久婷婷国产综合五月 国产中文字幕一区 91久久精品国产性色也91久久 国产一区a 国产欧美日韩成人 国产亚洲女在线精品 一区二区美女 中文字幕在线2021一区 在线小视频国产 久久这里只有精品首页 国产在线第三页 欧美日韩中文字幕 在线亚洲+欧美+日本专区 精品国产一区二区三区不卡 久久这里精品 欧美在线va在线播放 精液呈暗黄色 91精品国产手机 91在线免费播放 欧美视频亚洲色图 欧美国产日韩精品 日韩高清不卡在线 精品视频免费观看 欧美日韩一区二区三区四区 国产欧美亚洲精品第二区首页 亚洲韩精品欧美一区二区三区 国产精品视频免费 在线精品小视频 久久午夜夜伦伦鲁鲁片 国产无套在线播放 久热这里只精品99re8久 欧美久久久久 久久香蕉国产线看观看精品蕉 国产成人精品男人的天堂538 亚洲人成网站色7799在线观看 日韩在线第二页 一本色道久久综合狠狠躁篇 国产一区二区三区不卡在线观看 亚洲乱码在线 在线观看欧美国产 久久福利青草精品资源站免费 国产玖玖在线观看 在线亚洲精品 亚洲成aⅴ人在线观看 精品91在线 欧美一区二三区 日韩中文字幕视频在线 日本成人一区二区 日韩免费专区 国内精品在线观看视频 久久国产综合尤物免费观看 国产精品系列在线观看 一本一道久久a久久精品综合 亚洲免费播放 久久精品国产免费 久久人精品 亚洲毛片网站 亚洲成a人一区二区三区 韩国福利一区二区三区高清视频 亚洲精品天堂在线 一区二区三区中文字幕 亚洲国产色婷婷精品综合在线观看 亚洲国产成人久久笫一页 999国产视频 国产精品香港三级在线电影 欧美日韩一区二区三区四区 日韩国产欧美 国产精品99一区二区三区 午夜国产精品理论片久久影院 亚洲精品中文字幕麻豆 亚洲国产高清视频 久久免费手机视频 日韩a在线观看 五月婷婷亚洲 亚洲精品中文字幕麻豆 中文字幕丝袜 www国产精品 亚洲天堂精品在线 亚洲乱码一区 国产日韩欧美三级 久久999精品 伊人热人久久中文字幕 久热国产在线视频 国产欧美日韩在线观看一区二区三区 国产一二三区在线 日韩国产欧美 91精品国产91久久久久 亚洲一区小说区中文字幕 精品一区二区免费视频 国产精品视频免费 国产精品亚洲综合色区韩国 亚洲国产精品成人午夜在线观看 欧美国产日韩精品 中文字幕精品一区二区精品