專利名稱:基于smile化學表達式生成含能化合物分子組合庫的方法
技術領域:
本發明涉及一種新型的基于smile化學表達式的生成含能化合物分子組 合庫的方法。適用于根據單環化合物分子結構信息生成一系列二環、三環、 及多環化合物分子,并在活性位點進行取代基取代。
背景技術:
自十九世紀含能化合物面世以來,新型含能化合物的設計一直沿用設計 人員憑借經驗大量設計,合成人員大量合成,再從中篩選性能優異的含能化 合物這一模式。開發新型含能化合物既費時、費力,又缺少必要的理論依據, 具有一定的盲目性。以上因素決定了當前的含能化合物設計開發缺乏創新 性,也難以滿足目前武器彈藥對新型含能化合物的需求。因此如何利用功能 強大的計算機技術來代替或部分代替設計人員的工作,利用高通量篩選,快 速、準確的設計出新型含能化合物分子,指導新型含能化合物設計,并方便 科研人員使用成為亟待解決的重要研究課題。
發明內容
本發明的目的是利用強大的計算機技術,提供一種適合含能化合物分子 自動生成及高通量篩選,從而產生一定數量由smile表達式所構成的含能化 合物分子組合庫的方法。
為了實現上述任務,本發明采取如下的技術解決方案
一種基于smile化學表達式生成含能化合物分子組合庫的方法,其特征 在于,該方法根據單環化合物分子smile式加和模型,進行生成二環、三環、 或多環含能化合物分子,使用0++模塊生成含能化合物分子組合庫,包括:
a、對于加和模型生成的二環含能化合物分子,選擇用smile式表達的單環a與用smile式表達的單環b的一部分進行加和,生成bicyclo 二元環; 進而可以與用smile式表達的單環c環的一部分進行加和,生成tricyclo三
元環的方式進行表征;
b、 對于加和模型生成的三環含能化合物分子,選擇用smile式表達的 單環a環與用smile式表達的單環b環進行全加和,生成tricyclo三元環, 進而可以與用smile式表達的單環c進行全加和,生成更大的多元環,從而 在生成的多元環上進行不同的取代基取代的方式進行表征;或
c、 對于加和模型生成的多環含能化合物分子,選擇用smile式表達的 單環a環與用smile式表達的單環b環進行全加和,生成籠形分子,即類似 于立方烷結構的多環含能化合物分子,從而在生成的多元環上進行不同的取 代基取代的方式進行表達。
上述加和模型生成含能化合物分子的方法是
二環含能化合物分子使用smi (c) =smi (a) +smi (b)的廣義模型 來描述兩個單環分子進行加和生成多元環;其中,smi (c)表述的是加和之 后生成的多元環的smile式,smi (a)表述的是單環分子a的smile式,smi (b)表述的是單環分子b的全部或部分的smile式;
三環含能化合物分子:使用smi (d) =smi (a) +smi (b) +smi (c)的 廣義模型描述三個單環分子進行加和生成多元環;其中,smi (d)表述的是 加和之后生成的多元環的smile式,smi (a)表述的是單環分子a的全部或 部分的smile式,smi (b)表述的是單環分子b的全部或部分的smile式, smi (c)表述的是單環分子c的全部或部分的smile式。
上述步驟a的方法是
用smile式表達的單環a與用smile式表達的單環b的一部分進行加和, 生成bicyclo 二元環的關系可以表述為al+bl+a2, al+b2+a2,其中al、 a2 表述的是存在于加和之后生成的二元環的smile式中的單環分子a的兩部分,bl、 b2表述的是存在于加和之后生成的二元環的smile式中的單環分子 b的兩部分;二元環與用smile式表達的單環b環的一部分進行加和,生成 比化^10三元環表述為31+ (bl) +a2, al+ (b2) +a2;其中al、 a2表述的是 存在于加和之后生成的三元環smile式中的二元環分子a的兩部分,(bl )、
(b2)表述的是存在于加和之后生成的三元環smile式中的單環分子b的兩 部分分別作為二元環分子a的一條支鏈處理。 上述步驟b的方法是
用smile式表達的單環a與用smile式表達的單環b進行全加和,生成 tricyclo三元環表述為al+ (bl) (b2) +a2,其中al、 a2表述的是存在于 加和之后生成的三元環smile式中的單環分子a的兩部分,(bl) (b2)表述 的是存在于加和之后生成的三元環smile式中的單環分子b的兩部分作為二 元環分子a的兩條支鏈處理;三元環與用smile式表達的單環b環進行全加 和,生成tricyclo五元環表述為al+ (bl) (b2) +a2,其中al、 a2表述的 是存在于加和之后生成的五元環smile式中的三環分子a的兩部分,(bl) (b2)表述的是存在于加和之后生成的五元環smile式中的單環分子b的兩 部分作為三元環分子a的兩條支鏈處理。并在存在標記的活性位點進行取代 基取代。
上述步驟c的方法是-
用smile式表達的單環a與用smile式表達的單環b進行全加和,生成 籠形分子,類似于立方垸結構的多環分子表述為a+b,其中a表述的是存 在于加和之后生成的籠形分子smile式中的單環分子a的部分,b表述的是 存在于加和之后生成的籠形分子smile式中的單環分子b的部分,并在存在 標記的活性位點進行取代基取代。
本發明的通過采用新型的基于smile化學表達式的加和方法,對現有的 單環分子結構進行分析和操作,加和形成一系列二環、三環、及多環化合物分子,并在活性位點進行取代基取代而達到的。經驗證該方法具有快速、 準確生成含能化合物分子組合庫的特點,通過使用0++語言開發該方法的應 用程序,可以快速、準確地生成相應的多環化合物分子,在含能化合物分子 高通量篩選中具有良好的應用前景,尤其適用于先期預測尚未合成的含能化 合物的爆轟性能,輔助研究人員選擇爆轟性能較好的化合物進行合成及相關 測試,從而大大減少人力、物力的浪費,提高含能材料分子研發的效率。
圖1表示二環含能化合物分子生成的程序流程; 圖2表示三環含能化合物分子生成的程序流程; 圖3表示多環含能化合物分子生成的程序流程; 圖4是圖1的一個具體實施例; 圖5是圖2的一個具體實施例; 圖6是圖3的一個具體實施例。
以下結合附圖和實施例對本發明作進一步的詳細說明。
具體實施例方式
本發明的基于smile化學表達式生成含能化合物分子組合庫的方法,根 據單環化合物分子smile式加和模型,進行生成二環、三環、或多環含能化 合物分子,使用0++模塊生成含能化合物分子組合庫,包括
a、 對于加和模型生成的二環含能化合物分子,選擇用smile式表達的 單環a與用smile式表達的單環b的一部分進行加和,生成bicyclo 二元環; 進而可以與用smile式表達的單環c環的一部分進行加和,生成tricyclo三 元環的方式進行表征;
b、 對于加和模型生成的三環含能化合物分子,選擇用smile式表達的 單環a環與用smile式表達的單環b環進行全加和,生成tricyclo三元環, 進而可以與用smile式表達的單環c進行全加和,生成更大的多元環,從而在生成的多元環上進行不同的取代基取代的方式進行表征;或
c、對于加和模型生成的多環含能化合物分子,選擇用smile式表達的 單環a環與用smile式表達的單環b環進行全加和,生成籠形分子,即類似 于立方烷結構的多環含能化合物分子,從而在生成的多元環上進行不同的取 代基取代的方式進行表達。
對于加和模型生成的二環含能化合物分子,使用smi (c) =smi (a) +smi (b)的廣義模型來描述兩個單環分子進行加和生成多元環;其中,smi (c) 表述的是加和之后生成的多元環的smile式,smi (a)表述的是單環分子a 的smile式,smi (b)表述的是單環分子b的全部或部分的smile式。以下 結合附圖1說明其生成的程序流程
啟動程序,讀入包含單環smile式的文本文件,通過循環隨機選出兩個 單環a和b的smile式字符串,分別在a環和b環上隨機選出兩點c、 d和e、 f點,如果四個點對應的原子滿足相應原子類型和雜化類型的要求,那么繼 續操作,否則返回循環繼續選點直到四個點均滿足要求為止。接著如果a環 上的c點和b環上的e點,a環上的d點和b環上的f點分別對應的原子類 型一致,或a環上的c點和b環上的f點,a環上的d點和b環上的e點分 別對應的原子類型一致,那么繼續操作,否則返回循環繼續選點直到四個點 均滿足要求為止。接著依據表達式al+M+a2, al+b2+a2,選取相應的函數 將a環smile式的全部與b環smile式以e、 f點分割的兩部分smile式分別 進行加和,從而生成二元環的smile式。接著在從單環smile式的文本文件 中通過循環隨機選出一個單環c環,分別在二元環a環和單環c環上隨機選 出兩點g、 h和i、 j點,如上一步的要求類似,依據表達式al+ (cl) +a2, al+ (c2) +a2,將c環上以i、 j點分割的兩部分smile式作為二元環的支鏈 與a環進行加和,從而生成三元環的smile式。
圖4是一個具體的實施例隨機選取單環a環,smile式為C1CCNCC1;單環b環,smile式為 NlCCCCl 。方式為單環a的全部與單環b的兩個部分分別進行加和。a環上 選取c、 d兩點,b環上選取e、 f兩點,四點均滿足原子類型、雜化類型的 要求,可以作為活性位點繼續連接支鏈,而且3[(:]=1)[£^^&&&間=15[6]=(:, 故按照al+bl/b2+a2,將a環分別與b環由e、 f點分割的兩部分smile式進 行加和,得到兩個二元環abl和ab2, smile式分別為C1N2CCC1CC2, C1CN2CCC1CC2。繼續隨機讀入單環c, smile式為CI CCCCl ,在abl上選 取g、h兩點,c環上選取兩點i、j,四點均滿足原子類型、雜化類型的要求, 可以作為活性位點繼續連接支鏈,而且同時滿足a[c]=b[e]=C && a[d]=b[f]=C; a[c]=b[f]=C && a[d]=b[e]=C,故按照al+cl/c2+a2,將abl環分 別與c環由i、 j點分割的兩部分smile式進行加和,得到四個三元環ablcl 和ablcl、 , ablc2和ablc2、, smile式分別為C1N2C3C(C3)C1CC2, C1N2C3C (C3) C1CC2, C1N2C3C (CC3) C1CC2, C1N2C3C (CC3) C1CC2。同 理,ab2與abl類似,也可得到四個smile式,分別為C1CN2C3C(C3)C1CC2, C1CN2C3C (C3) C1CC2, C1CN2C3C (CC3) C1CC2, C1CN2C3C (CC3) C1CC2,八個三元環的smile式除去重復的,最后留有四個smile式,分別 為C1N2C3C (C3) C1CC2, C1N2C3C (CC3) C1CC2, C1CN2C3C (C3) C1CC2, C1CN2C3C (CC3) C1CC2。
對于加和模型生成的三環含能化合物分子,使用smi (d) =smi (a) +smi (b) +smi (c)的廣義模型描述三個單環分子進行加和生成多元環;其中, smi (d)表述的是加和之后生成的多元環的smile式,smi (a)表述的是單 環分子a的全部或部分的smile式,smi (b)表述的是單環分子b的全部或 部分的smile式,smi (c)表述的是單環分子c的全部或部分的smile式。
用smile式表達的單環a與用smile式表達的單環b進行全加和,生成 tricyclo三元環表述為al+ (bl) (b2) +a2,其中al、 a2表述的是存在于
10加和之后生成的三元環smile式中的單環分子a的兩部分,(bl) (b2)表述 的是存在于加和之后生成的三元環smile式中的單環分子b的兩部分作為二 元環分子a的兩條支鏈處理;三元環與用smile式表達的單環b環進行全加 和,生成tricyclo五元環表述為al+ (bl) (b2) +a2,其中al、 a2表述的 是存在于加和之后生成的五元環smile式中的三環分子a的兩部分,(bl)
(b2)表述的是存在于加和之后生成的五元環smile式中的單環分子b的兩 部分作為三元環分子a的兩條支鏈處理。并在存在標記的活性位點進行取代 基取代。以下結合圖2說明其生成程序流程
啟動程序,讀入包含單環smile式的文本文件,通過循環隨機選出兩個 單環a和b的smile式字符審,分別在a環和b環上隨機選出兩點c、 d和e、 f點,如果四個點均為大寫A標記的原子(代表sp3雜化碳)則繼續操作, 否則返回循環繼續選點直到四個點均滿足要求為止。接著依據表達式al+
(bl) (b2) +a2,選取相應的函數將a環smile式的全部與b環smile的全 部進行加和,從而生成三元環的smile式,并在標記A (代表sp3雜化碳')、 B (代表sp2雜化碳)、T (代表sp3雜化氮)活性原子上進行取代基取代。 同時也可再讀入單環smile式的文本文件,通過循環隨機選出單環c的smile 式字符串,分別在二元環a環和單環c環上隨機選出兩點g、 h和i、 j點, 如上一步的要求類似,依據表達式aH (cl) (c2) +a2,選取相應的函數將 二元環a的smile式的全部與b環smile的全部進行加和,從而生成五元環 的smile式> 并在剩余的標記A (代表sp3雜化碳)、B (代表sp2雜化碳)、 T (代表sp3雜化氮)活性原子上進行取代基取代。 圖5是一個具體的實施例
隨機選取單環a環,smile式為A1CTAB=C1;單環b環,smile式為 A1ACAAC1。方式為單環a的全部與單環b的全部smile式進行全加和。a 環上選取c、 d兩點,b環上選取e、 f兩點,a[c]=b[f]=a[d]=b[e]=A (sp3雜化碳),a環上一個sp2雜化碳和一個sp3雜化氮分別用大寫的B和T標記, 表示可以作為活性位點進行取代。按照&1+ (bl) (b2) +a2,將a環與b環 由e、 f點分割的兩部分smile式作為支鏈進行加和,得到兩個三元環,并且 兩個三元環結構相同,接著在活性位點A、 A、 B進行碳取代,取代基為 (-N02), T上進行氮取代,取代基為(-F),得到ab三元環smile式C1C (F) C (C (N (=0) =0) C2) (CC (N (=0) =0) 3) C (N (=0) =0) =CC123。同時也可讀入單環c, smile式為A1CCACC1,在ab上選取g、 h 兩點,c環上選取兩點i、 j, a[g]=b[i]=a[h]=b[j]=A (sp3雜化碳),按照al+ (cl) (c2)+a2,將ab環與c環由i、 j點分割的兩部分smile式作為支鏈進 行加和,得到五元環abc,并在B、 T進行取代,abc的smile式為C1C (F) C (C45C2) (CC (CC4) (CC5) 3) C (N (=0) =0) =CC123。
對于加和模型生成的多環含能化合物分子,用smile式表達的單環a與 用smile式表達的單環b進行全加和,生成籠形分子,類似于立方烷結構的 多環分子表述為a+b,其中a表述的是存在于加和之后生成的籠形分子smile 式中的單環分子a的部分,b表述的是存在于加和之后生成的籠形分子smile 式中的單環分子b的部分,并在存在標記的活性位點進行取代基取代。以下 結合圖3說明其生成程序流程-
啟動程序,讀入包含單環smile式的文本文件,分別為包括三個活性位 點、四個活性位點、五個活性位點的smile式庫文件,在每個不同的文件中, 通過循環隨機選出兩個單環a和b的smile式字符串,按照字符串中活性原 子A (代表sp3雜化碳、sp2雜化碳)、T (代表sp3雜化氮)的順序,依據 表達式a + b,選取相應的函數將a環smile式的全部與b環smile的全部進 行加和,從而生成籠形分子,類似于立方垸結構的多環分子smile式,進而 在標記有*的原子上進行取代基取代。 圖6是一個具體的實施例
12隨機選取單環a環,smile式為A1ATA*C1;單環b環,smile式為 A1A*TA1,兩個均為具有四個活性位點的單環smile式。方式為單環a的全 部與單環b的全部smile式進行全加和。a環上三個sp3雜化碳和一個sp3 雜化氮分別用大寫的A和T標記,表示可以作為生成籠形分子的活性位點。 B環,同理。按照字符串中活性原子A、 T的順序,依據表達式a + b,生成 籠形分子,并在標記有*的位置進行取代,取代基為(-N02),最終ab籠形 分子的smile式為C1C2 (N (=0) =0) N3C4C1C1C4 (N (=0) =0) N3C12。
權利要求
1、一種基于smile化學表達式生成含能化合物分子組合庫的方法,其特征在于,該方法根據單環化合物分子smile式加和模型,進行生成二環、三環、或多環含能化合物分子,使用C++模塊生成含能化合物分子組合庫,包括a、對于加和模型生成的二環含能化合物分子,選擇用smile式表達的單環a與用smile式表達的單環b的一部分進行加和,生成bicyclo二元環;進而可以與用smile式表達的單環c環的一部分進行加和,生成tricyclo三元環的方式進行表征;b、對于加和模型生成的三環含能化合物分子,選擇用smile式表達的單環a環與用smile式表達的單環b環進行全加和,生成tricyclo三元環,進而可以與用smile式表達的單環c進行全加和,生成更大的多元環,從而在生成的多元環上進行不同的取代基取代的方式進行表征;或c、對于加和模型生成的多環含能化合物分子,選擇用smile式表達的單環a環與用smile式表達的單環b環進行全加和,生成籠形分子,即類似于立方烷結構的多環含能化合物分子,從而在生成的多元環上進行不同的取代基取代的方式進行表達。
2、 如權利要求1所述的方法,其特征在于,所述的加和模型生成含能 化合物分子的方法是二環含能化合物分子使用smi (c) =smi (a) +smi (b)的廣義模型 來描述兩個單環分子進行加和生成多元環;其中,smi (c)表述的是加和之 后生成的多元環的smile式,smi (a)表述的是單環分子a的smile式,smi (b)表述的是單環分子b的全部或部分的smile式;三環含能化合物分子使用smi (d) =smi (a) +smi (b) +smi (c)的 廣義模型描述三個單環分子進行加和生成多元環;其中,smi (d)表述的是加和之后生成的多元環的smile式,smi (a)表述的是單環分子a的全部或 部分的smile式,smi (b)表述的是單環分子b的全部或部分的smile式, smi (c)表述的是單環分子c的全部或部分的smile式。
3、 如權利要求l所述的方法,其特征在于,所述的步驟a的方法是-用smile式表達的單環a與用smile式表達的單環b的一部分進行加和,生成bicyclo二元環的關系可以表述為al+bl+a2, al+b2+a2,其中al、 a2 表述的是存在于加和之后生成的二元環的smile式中的單環分子a的兩部 分,bl、 b2表述的是存在于加和之后生成的二元環的smile式中的單環分子 b的兩部分;二元環與用smile式表達的單環b環的一部分進行加和,生成 tricyclo三元環表述為al+ (bl) +a2, al+ (b2) +a2;其中al、 a2表述的是 存在于加和之后生成的三元環smile式中的二元環分子a的兩部分,(bl )、(b2)表述的是存在于加和之后生成的三元環smile式中的單環分子b的兩 部分分別作為二元環分子a的一條支鏈處理。
4、 如權利要求l所述的方法,其特征在于,所述步驟b的方法是-用smile式表達的單環a與用smile式表達的單環b進行全加和,生成 tricyclo三元環表述為al+ (bl) (b2) +a2,其中al、 a2表述的是存在于 加和之后生成的三元環smile式中的單環分子a的兩部分,(bl) (b2)表述 的是存在于加和之后生成的三元環smile式中的單環分子b的兩部分作為二 元環分子a的兩條支鏈處理;三元環與用smile式表達的單環b環進行全加 和,生成tricyclo五元環表述為al+ (bl) (b2) +a2,其中al、 a2表述的 是存在于加和之后生成的五元環smile式中的三環分子a的兩部分,(bl) (b2)表述的是存在于加和之后生成的五元環smile式中的單環分子b的兩 部分作為三元環分子a的兩條支鏈處理。并在存在標記的活性位點進行取代 基取代。
5、 如權利要求l所述的方法,其特征在于,所述步驟c的方法是用smile式表達的單環a與用smile式表達的單環b進行全加和,生成 籠形分子,類似于立方烷結構的多環分子表述為a+b,其中a表述的是存 在于加和之后生成的籠形分子smile式中的單環分子a的部分,b表述的是 存在于加和之后生成的籠形分子smile式中的單環分子b的部分,并在存在 標記的活性位點進行取代基取代。
全文摘要
本發明涉及一種新型的基于smile化學表達式生成含能化合物分子組合庫的方法,該方法根據單環化合物分子結構信息生成一系列二環、三環及多環化合物分子,并可在活性位點進行取代基取代。該方法中,單環分子及取代基基團均用基于smile的表達式進行描述。經驗證該方法具有良好的生成含能化合物分子組合庫的效果。通過使用C++語言開發該方法的應用程序,可以快速、準確地生成相應的多環化合物分子,在含能化合物分子高通量篩選中具有良好的應用前景,尤其適用于先期預測尚未合成的含能化合物的爆轟性能,輔助研究人員選擇爆轟性能較好的化合物進行合成及相關測試,從而大大減少人力、物力的浪費,提高含能材料分子研發的效率。
文檔編號C40B50/02GK101503827SQ20091002160
公開日2009年8月12日 申請日期2009年3月19日 優先權日2009年3月19日
發明者鵬 廉, 張琦軍, 張鑫賁, 朱維良, 寧 李, 來蔚鵬, 王伯周, 肖建峰, 葛忠學, 珍 龔 申請人:西安近代化學研究所