專利名稱:病原微生物模擬表位的生物信息學篩選方法
技術領域:
本發明涉及到對已知基因/基因組序列的生物信息學分析,以快速獲得未知基因組或抗原性信息病源微生物的保護性抗原模擬表位,即病原微生物模擬表位的生物信息學篩選方法。
背景技術:
疫苗的出現為人類和養殖生物的健康做出了巨大貢獻。隨著科技的發展,疫苗研制的技術水平也在不斷提高。最早發明的滅活疫苗直到今天仍得到廣泛的使用,它最大的缺陷在于激發的免疫應答不完善,難以提供有效的免疫保護作用,而減毒疫苗存在較嚴重的安全性問題,很大程度上制約了它的應用。當此情形,第三代亞單位疫苗和第四代的核酸疫苗研制技術應運而生,尤其是后者,因其能夠誘導全面的體液和免疫應答,再加上生產制備和貯存都相當便利,因此成為當前疫苗研制的熱點。
無論是亞單位疫苗或是核酸疫苗,其核心均在于對能夠介導保護性免疫效應的抗原蛋白和抗原決定簇的界定。當前所采用的抗原蛋白和抗原決定簇篩選方法,主要可分為兩大類。一類是通過病源微生物的培養,收集純化蛋白質,然后經過一系列的生物分析直至氨基酸序列的測定,最終以重組蛋白質的形式通過克隆表達來檢驗其免疫原性和免疫反應性。其二,利用噬菌體展示肽庫或蛋白質芯片技術,根據已知抗原蛋白質的序列建立數以千計乃至萬計的重疊肽庫,通過數輪生物淘洗,最終分離鑒定所需的模擬表位。上述方法都存在費時、冗長和人力物力耗費巨大的缺點;同時在鑒定過程中需要大量的特殊試劑和儀器,難以為絕大多數實驗室接受,這也是當前病源微生物抗原蛋白質分析研究進展緩慢的主要原因。
然而,基因組學研究的突破性進展為反向免疫遺傳學研究的快速發展提供了可能。基因、基因組測序目前都已成為實驗室的常規技術,快捷、簡便。利用基因、基因組所含信息推測編碼蛋白的性質就成為抗原蛋白及其表位識別與鑒定的捷徑。目前在國際上的三大核酸序列數據庫GenBank、DDBJ和EMBL累計的核酸序列超過億條,堿基數超過100億bp,并且仍在迅速的增加。
發明內容
本發明的目的是充分利用豐富的核酸和蛋白質序列資源,通過特定的生物信息學分析方法快速捕獲未知病源微生物抗原蛋白的模擬表位,即病原微生物模擬表位的生物信息學篩選方法。
本發明以淋巴囊腫病毒不同分離株(LCDV-1、LCDV-cn)作為模式生物,通過生物信息學篩選模擬表位,然后用免疫學方法加以驗證以判別生物信息學方法的有效性。基本的技術路線是利用已測定的LCDV-1(淋巴囊腫病毒歐洲分離株)的基因組序列,以基因組及抗原蛋白未知的LCDV-cn(中國分離株,與LCDV-1的同源性約為77%)為對象,通過對LCDV-1的生物信息學分析預測LCDV-cn的保護性抗原編碼基因及其模擬表位。
本方法所依據的原理主要在于生命現象高度的一致性,特別是所有生物構成遺傳信息載體核酸與生理功能載體蛋白質的基本單元(脫氧核糖核苷酸、核糖核苷酸、氨基酸)在結構、組成上沒有差異,而且在基因表達的功能單位遺傳密碼子的組成與編碼功能上也無二致。
本方法利用已知核酸和蛋白質序列,根據蛋白質家族特有的特征結構域推測僅含部分基因或基因組序列信息而其編碼的蛋白質生物學功能未知的近緣病原微生物抗原蛋白模擬表位,并加以免疫學驗證。本方法雖然僅以通過已知基因組序列的LCDV-1為生物信息學分析對象,推測基因組與相關基因序列未知的LCDV-cn保護性抗原模擬表位,但是基于上述核酸、蛋白質結構功能的一致性,因此本方法普適于其它已知或未知基因、基因組序列的病原微生物模擬表位的篩選。
圖1是模擬表位29B的競爭性抑制酶聯免疫測定法檢驗免疫原性的數據圖其中,A-F分別是單抗YpH4A1、3、4、7、9、10;G-H分別是單抗YpH4B1、5。
YpH4A1-10為LCDV-cn特異性單抗,YpH4B1、5為無關單抗。
圖中所示反應中的多肽(模擬表位)為29B(其余未列出)。
圖中橫坐標BC空白對照組;NCa陰性對照組(加入多肽,不加相應單抗);NCb陰性對照組(以小鼠IgG代替單抗);PC組陽性對照(只加相應單抗,不加多肽)。100,50,10,1對應于多肽濃度,單位為μg/ml。
圖中縱坐標酶標儀測定波長450nm的光密度值,單位為OD。
圖中所示的柱狀部分為實驗組的平均值和標準差(柱圖上方短橫線所示)。
所用單抗、抗體濃度均為100μg/ml。
ELISA反應程序抗原(LCDV-cn0.5μg包被96孔板4℃過夜,洗板3次,對照組加樣同常規方法,實驗組設8個復孔,每個濃度的多肽先與單抗等體積37℃孵育1hr,然后加到96孔板中37℃孵育1hr。加入辣根過氧化物酶羊抗鼠酶標二抗和TMB(四甲基聯苯胺),2M H2SO4終止,微孔板計數儀(BioRad,Microplate Reader,Model550)測量450nm OD值。
具體實施例方式
本方法以淋巴囊腫病毒不同分離株(LCDV-1、LCDV-cn)作為模式生物,首先對LCDV-1基因組序列進行了BLAST比對,從中篩選得到兩個保護性抗原蛋白候選基因TK和ORF29;然后分別對兩個基因表達的蛋白質結構和性質進行了疏水和親水性、抗原性和跨膜結構分析,綜合上述結構性質分析結果,最后通過綜合性抗原指數的計算推定未知的LCDV-cn相應的模擬表位。
將上述獲得的模擬表位進行人工合成,通過競爭性酶聯免疫吸附分析檢驗各種模擬表位的免疫反應性。
具體方式如下1、抗原蛋白的BLAST檢索分析通過對LCDV-1進行BLAST分析(http//www.ncbi.nlm.nih.gov/blast,參數取默認值)和蛋白質功能鑒定(AACompSimhttp//www.expasy.ch/tools/aacsim/,PROPSEARCHhttp//www.embl-heidelberg.de/prs.html)初步篩選LCDV-cn(中國分離株)保護性抗原編碼基因。經過核酸序列的同源性分析和表達蛋白的功能分析,確定以虹彩病毒科中高度保守的TK基因以及LCDV-1囊膜蛋白編碼基因ORF29為抗原決定簇分析與篩選的侯選基因。
2、生物信息學推導抗原蛋白模擬表位對LCDV-1的TK和ORF29的編碼蛋白以相同的方法進行了生物信息學分析,模擬表位的推定方法包括以下兩部分2.1抗原蛋白的區域性結構分析
目前有多種方法進行蛋白質結構分析,本方法選擇性地采用了以下十二種生物信息學分析方法。利用這些方法對兩種抗原蛋白的分析結果列于表1,置信區間均為95%。
表1 抗原蛋白TK、ORF29的結構與性質分析方法及其結果
2.2綜合抗原性分析基于蛋白質結構的復雜性考慮,以及表1中基本方法數據采集方式的不同,本發明對上述12種不同的蛋白質結構、性質分析方法所取得的數據加以整合,本發明給出統一的綜合性抗原指數I。綜合性抗原指數I的計算公式如下I=Σ{aixj‾xm‾(njΣ(xim-xm)2)/[(nm-1)Σ(xij-xj‾)2]}]]>其中I=綜合性抗原指數,a=蛋白質結構分析方法系數,i=序號,nj=區域氨基酸數,nm=蛋白質中氨基酸總數。I<0,非抗原區域;I>0時,抗原性顯著,I值越高,抗原性越顯著。依此,推定LCDV-cn的3個模擬表位,即表2中的TK3、29A和29B。
為了進一步的免疫學驗證,特地分別從基因TK和ORF29中反向推測各一個非模擬表位作為對照,見表2中的TK2和29C。
表2 模擬表位與對照序列的生物信息學預測
3模擬表位的免疫學分析與鑒定根據生物信息學分析獲得的模擬表位及對照和參照序列,合成了6條相應的多肽,乙酰化封閉NH2-末端,用抗LCDV-cn的特異性單抗進行了競爭性抑制ELISA實驗,以檢驗模擬表位的免疫反應性。結果(如圖1所示)表明,抗原性指數最高的29B與所檢單抗YpH4A1、YpH4A3、YpH4A7和YpH4A10均產生顯著的抑制效應,P<0.0001。其它模擬表位和對照、參照序列與供檢單抗間無明顯的競爭效應。對照抗體(小鼠IgG和無關單抗YpH4B1、B5)即不存在競爭效應,也未見交叉反應,說明供檢單抗具有LCDV-cn特異性。這一結果說明,從陰性結果來看,參照序列(如不經過抗原的加工和提呈過程會因自身產生的二級結構封閉其表位)和對照序列如預期未產生競爭性抑制效應,其原因有待深入分析以確認其真陰性。受檢的另外兩條模擬表位(TK3、29A)未出現陽性結果的原因有二,A、預測序列不是模擬表位,B、供檢單抗未覆蓋該表位。根據結果分析,后者的可能性更大,因為供檢的6種單抗中有4種均與29B發生強烈的競爭性抑制,不同的反應強度說明它們具有重疊表位,因此不可能與其它序列無關的線性表位發生反應。
陽性結果明確說明利用生物信息學分析LCDV-1基因組推測出的的模擬表位能夠有效封閉針對LCDV-cn的特異性單抗所識別的表位,由于多種單抗均能與29B產生顯著的相互抑制作用,可以推斷,該表位應當是保護性抗原中的線性抗原決定簇。
本發明采用的模擬表位生物信息學分析和預測方法經免疫學檢驗證明是可行的,它不僅適用于對已知基因或基因組序列進行抗原性分析,同時還可用于近緣間保守程度較高物種的未知基因/基因組抗原性分析。本方法可以在一定程度上取代目前模擬表位篩選中常用的傳統蛋白質分離鑒定以及近期發展起來的噬菌體展示肽庫甚至蛋白質芯片技術,能夠節約大量的人力、物力,同時快捷、高效的獲取抗原蛋白及其抗原決定簇。
權利要求
1.病原微生物模擬表位的生物信息學篩選方法,首先對LCDV-1基因組序列進行了BLAST比對,從中篩選得到兩個保護性抗原蛋白候選基因TK和ORF29;然后分別對兩個基因表達的蛋白質進行了疏水和親水性、抗原性和跨膜結構分析,綜合12種結構性質分析結果,最后通過綜合性抗原指數的計算公式(I),其中,將I>O的序列推定為未知的LCDV-cn模擬表位。
2.病原微生物模擬表位的生物信息學篩選方法,其特征是上述的綜合性抗原指數I,I的計算公式如下I=Σ{aixj‾/xm‾(njΣ(xim-xm)2)/[(nm-1)Σ(xij-xj‾)2]}]]>其中I=綜合性抗原指數,a=蛋白質結構分析方法系數,i=序號,nj=區域氨基酸數,nm=蛋白質中氨基酸總數。
全文摘要
一種病原微生物模擬表位的生物信息學篩選方法。本方法首先對LCDV-1基因組序列進行了BLAST比對,從中篩選得到保護性抗原蛋白候選基因TK和ORF29;然后分別對兩個基因表達的蛋白質進行了疏水和親水性、抗原性和跨膜結構分析,綜合12種結構性質分析結果,最后通過綜合性抗原指數的計算公式(I),其中,將I>O的序列推定未知的LCDV-cn相應的模擬表位。再將上述獲得的模擬表位進行人工合成,通過競爭性酶聯免疫吸附分析檢驗各種模擬表位的免疫反應性。本發明充分利用豐富的核酸和蛋白質序列資源,通過特定的生物信息學分析方法快速捕獲未知病源微生物抗原蛋白的模擬表位。
文檔編號C12Q1/68GK1772921SQ20051001806
公開日2006年5月17日 申請日期2005年9月30日 優先權日2005年9月30日
發明者吳謖琦, 孫修勤, 張進興, 鄭鳳榮, 洪旭光, 曲凌云 申請人:國家海洋局第一海洋研究所