一種通過量子化學方法構建定量構效關系模型來預測有機化合物急性毒性的方法
【專利摘要】本發明公開了一種通過量子化學方法構建定量構效關系模型來預測有機化合物急性毒性的方法,是運用Gaussian程序對化合物結構進行幾何全優化,得出分子的體積、相對分子質量、最高占據軌道能、最低空軌道能、前線軌道能級差、偶極矩、溶劑化能、電子能等量子化學參數,將它們和疏水性參數作為結構描述符,結合毒性數據,通過編寫的基于偏最小二乘逐步線性回歸的程序,建立各種結構描述符與毒性之間的定量關系方程,得到方程的復相關系數,F-檢驗值和殘差平方和,然后驗證模型,以保證其外部預測能力。由此,可以快捷、有效的預測所要研究的有機化合物的毒性,為化學品的風險評價和監管提供必要的基礎數據。
【專利說明】一種通過量子化學方法構建定量構效關系模型來預測有機化合物急性毒性的方法
【技術領域】
[0001]本發明涉及一種通過量子化學方法構建定量構效關系模型來預測有機化合物急性毒性的方法,屬于生態風險評價測試策略領域。
【背景技術】
[0002]定量結構-活性相關(QSAR),最初作為定量藥物設計的一個研究分支,是為了適應合理設計生物活性分子的需要而發展起來的。所謂定量構效關系,就是定量的描述和研究有機物的結構和活性之間的相互關系。定量構效關系分析是指利用理論計算和各種統計分析工具來研究同系列化合物(包括二維分子結構、三維分子結構和電子結構)與其效應(如遺傳毒性和生物活性等)之間的定量關系,即采用數字模型、借助理化參數或結構參數來描述有機小分子化合物(藥物、底物、抑制劑等)與有機大分子化合物(酶、輔酶或有機分子)或組織(受體、細胞、動物)之間的相互作用關系。目前,許多環境科學研究者通過QSAR建立了很多具有預測能力的環境模型,如大連理工大學發明的專利“一種通過定量構效關系模型預測有機物液相蒸汽壓的方法”(中國專利申請號201110410088.0)和“通過定量構效關系和溶劑化模型預測不同溫度下的正辛醇空氣分配系數Km的方法”(中國專利申請號201210505935.6)。這對已經進入環境的污染物及尚未投放市場的各種各樣的新化合物的生物活性、毒性乃至環境行為進行了成功的預測、評價和篩選,顯示出QSAR極其廣闊的應用前景。
[0003]隨著現代化學工業的飛速發展,已有數以萬計的新的化學物質進入了人類生產和生活。據估計,人類目前常用的化學品已達8萬種之多,并且這個數字正以每年近千種的速度增加。截止2007年末,美國化學文摘(CAS)登記的化學品已達3300多萬種,其中絕大多數是有機化合物。而很多有機化合物會對人類和其他生物的健康,生長,發育等造成不同等級的危害。因此獲得有機化合物危險性質,如急性毒性,致癌性等對于危險物質的風險評估,管理控制,工程應用等具有重要的理論和實際意義。傳統的生態風險評價包括下列四個步驟:危害識別,劑量-反應評價,暴露評價,風險表征。進行生態風險評價,需要首先獲得大量的數據:化合物對生物或人體的毒性,在環境中的遷移和轉化等。這些數據的獲取要通過實驗獲得,而面對這么多已存在的和即將生產和使用的有機化合物,其工作量之大,是可想而知的。因此僅僅依靠實驗來完成積累數據并進行生態風險評價,是不可能的,而且在時間上是永遠滯后的。具有強大預測功能的QSAR方法為有機物的生態風險評價提供了一個重要的、必不可少的手段。可以說,QSAR的理論研究具有重要的理論價值和實際意義,是污染防治的理論基礎,是可持續發展的技術前提。利用QSAR方法檢測并篩選出具有潛在危害的化學品,可以節省大量的毒性試驗工作及昂貴費用。
【發明內容】
[0004]本發明的目的是發展一種簡單、快捷、高效預測有機化合物毒性的方法。該方法可以根據化合物結構預測出其毒性,從而為化學品風險評價和環境監管提供必要的基礎數據。
[0005]本發明的原理是對已知毒性的有機化合物,運用Gaussian程序進行幾何全優化,得出相關的分子結構參數。結合毒性數據,通過編寫的基于偏最小二乘逐步線性回歸的程序,得到各個參數的偏回歸平方和,估計的標準偏差,各個回歸系數的標準偏差,復相關系數,F-檢驗值,殘差平方和及規格化的相關系數,建立各種結構描述符與毒性之間的定量關系。由此,可以快捷、有效的預測有機化合物的毒性。
[0006]分子結構參數的選用的好壞是QSAR成功與否的關鍵。描述分子結構方面的參數已經達200多個。一般可分為三類:間接結構參數(理化參數)、分子幾何結構方面的特征參數(如分子拓撲指數)和電子構型方面的特征參數(如某些量子化學參數)。常用的間接結構參數是以代表物質結構的某種性質作為基礎,從而間接地表示物質在該方面的結構特點。最經常采用的是辛醇一水分配系數,用以表示物質的極性或者憎水性。幾何結構參數包括分子的長度、體積、表面積、價鍵角度、立體空間結構及分子拓撲指數。分子的電子構型包括原子的種類、價鍵的類型、偶極矩、軌道構型、電子云密度、氫鍵、官能團及其他量子化學參數等。各種結構參數分別用于描述污染物在宏觀、中觀及微觀層次上的分子結構,形成了基于經驗的宏觀性理論、基于污染物官能團性質的分子片理論、基于污染物幾何構型的幾何結構里理論、基于有機物分子分支圖形的拓撲學理論、基于污染物分子的價鍵和電子躍遷的量子理論等等。
[0007]Hansch認為,有機物的生物活性與分子的疏水性、立體效應、電子效應呈良好的相關性。生物中毒可分為兩個過程,首先是有機物分子透過生物膜進入機體內,其次是有機物分子與機體內“靶位”(如蛋白酶、DNA等)發生作用.這兩個過程可分別用化合物的親脂性參數(1gP),以及分子的立體效應參數和電子效應參數來描述。而Abernethy提出的“體積理論”則表明,溶解的毒物可使神經細胞膜的雙層磷脂層的體積膨脹,而對機體產生毒性。
[0008]大量研究成果都證明了物質的親脂性參數能夠描述污染物在環境中的分布和遷移特性,能夠描述污染物質在生物體內的富集和累積,以及污染物質分子本身的聚合和卷曲等特性,是目前應用最廣的宏觀特性參數之一。而分子的釋質子能力越大,親電能力越大,毒性也越大。
[0009]線性自由能相關理論則認為:對于一定范圍內的系列化合物與同一種受體發生反應時,化合物與受體之間的作用方式相類似,從而使得化合物-受體反應的自由能變化AG與化合物本身的反應活性之間存在線性相關關系。
[0010]基于以上基礎理論的分析,本發明提供了一種通過量子化學方法構建定量構效關系模型來預測有機化合物急性毒性的方法,步驟如下:
[0011]I)通過進行毒性試驗或者通過查閱毒性數據庫和相關文獻,獲得所要研究的有機化合物的急性毒性數據:半數致死劑量LD5tl或半數致死濃度LC5tl ;
[0012]2)利用量子化學軟件Gaussian對所要研究的有機化合物進行幾何結構優化,獲得量子化學參數:分子體積MV、相對分子質量MW、分子最高占據軌道能Eraro、分子最低空軌道能Emsra、前線軌道能級差AE、分子偶極矩y、分子的溶劑化能Estjl、分子的電子能匕、分子的最正原子凈電荷Q+、分子的最負原子凈電荷Q-、分子的最正氫原子凈電荷Qh,同時加入源于SciFinder數據庫的疏水性參數1gP,共同作為結構描述符;[0013]3)將得到的毒性數據按其毒性大小抽取1/4~1/5作為驗證集數據,其余為訓練集數據,訓練集用來構建預測模型,驗證集用來驗證模型的預測能力;
[0014]4)以通過量子化學計算所得訓練集有機化合物的逐個量子化學參數為自變量,有機化合物對生物毒性數據為因變量,編寫基于偏最小二乘逐步線性回歸的程序,得到各個參數的復相關系數、F-檢驗值、殘差平方和,建立各種結構描述符與毒性之間的定量關系模型;在此過程中觀察各參數的相關性,以減少多元統計分析中的共線性,當兩參數的相關性大于0.7時,剔除其中之一,最后獲得回歸方程,回歸方程的復相關系數R2大于0.7時,預示建立的模型擬合效果良好,R2越大,擬合效果越好;
[0015]5)將驗證集數據帶入獲得的回歸方程,得到其預測值,然后根據外部預測能力評價系數Q2rart的值判定外部預測能力的好壞;當Q2rait大于0.7時,預示建立的模型具有良好的外部預測能力,Q2ext越大,外部預測能力越好。
[0016]其中,上述外部預測能力評價系數Q2ext如公式(I)所示:
【權利要求】
1.一種通過量子化學方法構建定量構效關系模型來預測有機化合物急性毒性的方法,步驟如下: 1)通過進行毒性試驗或者通過查閱毒性數據庫和相關文獻,獲得所要研究的有機化合物的急性毒性數據:半數致死劑量LD5tl或半數致死濃度LC5tl ; 2)利用量子化學軟件Gaussian對所要研究的有機化合物進行幾何結構優化,獲得量子化學參數:分子體積MV、相對分子質量MW、分子最高占據軌道能Eraro、分子最低空軌道能EmH)、前線軌道能級差AE、分子偶極矩y、分子的溶劑化能Estjl、分子的電子能匕、分子的最正原子凈電荷Q+、分子的最負原子凈電荷Q-、分子的最正氫原子凈電荷Qh,同時加入源于SciFinder數據庫的疏水性參數logP,共同作為結構描述符; 3)將得到的毒性數據按其毒性大小抽取1/4?1/5作為驗證集數據,其余為訓練集數據,訓練集用來構建預測模型,驗證集用來驗證模型的預測能力; 4)以通過量子化學計算所得訓練集有機化合物的逐個量子化學參數為自變量,有機化合物對生物毒性數據為因變量,編寫基于偏最小二乘逐步線性回歸的程序,得到各個參數的復相關系數、F-檢驗值、殘差平方和,建立各種結構描述符與毒性之間的定量關系模型;在此過程中觀察各參數的相關性,以減少多元統計分析中的共線性,當兩參數的相關性大于0.7時,剔除其中之一,最后獲得回歸方程,回歸方程的復相關系數R2大于0.7時,預示建立的模型擬合效果良好,R2越大,擬合效果越好; 5)將驗證集數據帶入獲得的回歸方程,得到其預測值,然后根據外部預測能力評價系數Q2rart的值判定外部預測能力的好壞;當Q2rait大于0.7時,預示建立的模型具有良好的外部預測能力,Q2ext越大,外部預測能力越好。
2.如權利要求1所述通過量子化學方法構建定量構效關系模型來預測有機化合物急性毒性的方法,其特征在于:步驟I)所述有機化合物是苯胺衍生物或齒代苯衍生物。
【文檔編號】G06F19/00GK103646180SQ201310705921
【公開日】2014年3月19日 申請日期:2013年12月19日 優先權日:2013年12月19日
【發明者】張慶竹, 吳秀超, 孫孝敏 申請人:山東大學