免疫原性組合物的制作方法

文檔序號：1038019閱讀：2563來源：國知局

專利名稱：免疫原性組合物的制作方法
技術領域：
本發明涉及作為免疫融合伴侶表達增強子的融合伴侶，優選涉及具有雙重功能的融合伴侶。本發明還涉及含有融合伴侶的融合蛋白，及其制造方法，和其在疫苗中的應用和在制藥中的應用。特別的，提供了含有所謂的膽堿結合域的融合伴侶，例如包括來源于肺炎鏈球菌屬的LytA，或肺炎球菌噬菌體CP1溶菌酶(CPL1)的融合物，其中所述的膽堿結合域被修飾包括異源的T-輔助表位。這類融合伴侶被顯示能提高其附著的異源蛋白的表達水平，并且被發現當與免疫原性較弱的蛋白或肽融合時將特別有效，可作為疫苗抗原。更特別的，這類融合伴侶在包含自身抗原，如腫瘤特異性或組織特異性抗原的構建體中非常有效。
背景技術：
肺炎鏈球菌合成了N乙酰-L-丙氨酸酰胺酶，LytA，一種特異性降解細胞壁肽聚糖骨架并最終導致細胞溶解的自溶素。其多肽鏈具有兩個域。其N-末端域具有催化活性，而LytA的C-末端具有吸附膽堿并錨定至細胞壁的作用。已知其C-末端域可與膽堿或膽堿類似物結合，并且也可與叔胺，如常用于層析中的DEAE(二乙基氨基乙基)相結合。
LytA是長318個氨基酸的蛋白，其C-末端部分包括由六個20或21氨基酸的不完全重復序列組成的串聯排列結構和一短COOH-末尾結構。所述的重復序列位于如下位置R1177-191R2192-212R3213-234R4235-254R5255-275R6276-298據預測，這類重復序列呈β-轉角構象。C-末端負責結合膽堿。同樣的，CPL1的C-末端負責結合親合性，重復結構中的芳香基團有助于這種結合。這類蛋白可被用作親和標記從而允許快速純化(SanchezPuelles，Eur J Biochem.1992，203，153-9)。
肺炎鏈球菌屬中的具有膽堿結合域的其他蛋白也被進行了研究。
其中的一種PspA(或肺炎球菌表面蛋白A)是一種毒力因子(Yother J & Briles(1992)J Bacteriol 174(2)p 601)。該蛋白具有抗原和免疫原性。它具有由10個與LytA重復序列同源的20個氨基酸的重復序列組成的C-末端域。
CbpA(或膽堿結合蛋白A)涉及肺炎球菌對人細胞的吸附(Rosenow等(1997)Mol Microbiol 25(5)p 819)。顯示在C-末端結合域中的10個20氨基酸的重復序列幾乎與PspA中的完全一致。
LytB和LytC與上述蛋白具有不同的模塊組織，其分別由15個和11個重復結構組成的膽堿結合域位于N-末端，而不是C-末端(GarciaP Mol Microbiol(1999)31(4)p1275和Garcia P等(1999)Mol Microbiol33(1)p128)。序列比較顯示LytB具有氨基葡萄糖苷酶活性。LytC顯示在體外具有溶菌酶活性。此外，1995年克隆得到了被命名為PepA，PepB和PepC的三個基因。雖然其功能未知，這些基因同樣也具有數目不等的與LytA中的重復結構同源的重復序列。
在其感染周期中，噬菌體合成了胞壁質水解酶，這有助于其進入細菌中。這些水解酶具有膽堿結合域。
噬菌體Cp-1的CPL1溶菌酶已進行了詳細的研究。研究表明C-末端的6個20氨基酸的重復序列涉及膽堿的特異性識別(Garica J.L.J.Virol 61(8)p2573-80；(1987)和Garcia E Prol Natl Acad Sci(1988)p914)。對于LytA和CPL1重復序列的比較表明這些重復序列大致相同。
噬菌體Dp-1的胞壁質水解酶(Garcia P等(1983)J Gen Microbiol129(2)p489，Cpl-9(Garcia P等(1989)Biochem Biophys Res Commun158(1)p251，HB-3 Romero等1990 J Bacteriol 172(9)p5064-5070)和EJ-1 Diaz(1992)J Bacteriol 174(17)p5516)同樣顯示出膽堿結合域的特性。
由肺炎球菌噬菌體CP-1編碼的溶菌酶同樣也具有這種特性。WO99/10375中記載了人乳頭瘤病毒蛋白E6，或E7與His標記和LytA的C-末端部分(即C-LytA)結合，和通過不同的親和色譜對蛋白的純化。WO 99/40188中記載了包含MAGE抗原和His尾及分子N-末端的C-LytA部分的融合蛋白。
令人驚奇的發現，本發明中的融合伴侶在與異源蛋白融合時，能增強其附著的異源蛋白的免疫原性。同時還發現可提高其附著的異源蛋白的表達水平。相應的在一優選實施例中，本發明還提供了一種能作為表達增強子的改進的免疫融合伴侶。
發明簡述相應的，本發明包括一融合伴侶分子，其包含膽堿結合域、或其片段、或其類似物，和異源通用(promiscuous)T輔助表位，優選通用MHC II類T-表位。所述的融合伴侶顯示出可作為免疫融合伴侶，或作為表達增強子的能力，并且優選的具有作為免疫伴侶和表達增強子的雙重能力。通用T-輔助表位是與多于一種的MHC II類等位基因，優選的與多于3種的MHC II類等位基因結合的表位。優選地，這種表位可在大量表達不同MHC單倍型的個體中引發輔助T細胞應答。可選的，所述融合蛋白可保留其結合膽堿的能力。
在一優選實施方案中，所述的膽堿結合部分來源于LytA的C末端。優選的，所述C-LytA或其衍生物包括至少4個如

圖1所示的R1至R6重復序列(SEQ ID NO1-6)中的任意重復序列。在一最優選實施方案中，C-LytA包括177-298氨基酸，其包括第一重復序列的一部分和其他的完整的5個重復序列。
在本發明的進一步的方面，提供如本文所定義的進一步包括異源蛋白的融合伴侶。所述的異源蛋白既可以是化學偶聯，也可以是與融合伴侶融合。優選的所述異源蛋白是腫瘤相關抗原或其免疫片段。
本發明的進一步的方面，提供了一種編碼如本文所定義的蛋白的核酸序列。還提供了包括所述核酸的表達載體，和采用所述核酸或載體轉化的宿主細胞。
在本發明的進一步的方面，提供了一種免疫原性組合物，其包括如本文所述的蛋白或核酸序列、和藥學上可接受的賦形劑、稀釋劑或載體。優選地所述免疫原性組合物進一步包括Th-1誘導佐劑。
在進一步的實施例中，本發明提供了免疫原性組合物或蛋白和核酸用于醫藥應用。特別的，提供了一種本發明所述的蛋白或核酸，用于制備在病人中引發免疫應答的、或用于治療或預防傳染病或癌癥的藥物。
本發明進一步提供了一種通過施用安全和有效量的本文所述的組合物或核酸，從而來治療患有傳染病或癌癥，尤其是乳腺癌、肺癌(特別是非小細胞肺癌)、結腸直腸癌、卵巢癌、前列腺癌、胃癌和其他GI(胃腸的)癌的病人的方法。
另外，本發明的進一步的實施例提供了一種通過將本發明所述的核酸或蛋白與藥學上可接受的賦形劑、稀釋劑或載體混合，從而來生產如本文所述的免疫原性組合物的方法。
發明詳述如本文所述，在本發明的一實施例中，修飾的膽堿結合域(融合伴侶)具有作為表達增強子的能力，所得到的融合蛋白與未融合蛋白相比，在宿主細胞中具有更高的表達量，優選的具有高出約100％(2倍以上)或150％或更多的表達量，所述表達量通過SDS-PAGE，隨后經考馬斯亮藍染色或銀染，可選的經凝膠掃描來測定。本發明所述的修飾的膽堿結合域還具有免疫伴侶的能力，其與異源蛋白融合的融合蛋白與未融合的異源蛋白相比在宿主中具有更大的免疫原性。
在本發明的另一實施例中，修飾的膽堿結合域具有免疫融合伴侶的能力，與單獨的異源蛋白相比，融合蛋白能獲得增強的免疫應答。
在一優選實施例中，修飾的膽堿結合域具有雙重功能，具有作為免疫融合伴侶和作為表達增強子的能力。
在一優選實施例中，膽堿結合部分來源于LytA的C末端。優選C-LytA或其衍生物包含至少兩個重復序列，優選至少四個重復序列。在本文上下文中，C-LytA衍生物是指本發明所述的C-LytA的變異體，也就是說是指那些保留了既作為免疫伴侶又作為表達增強子的能力的變異體。優選變異體包括，例如，包含與如圖1所示的R1至R6(SEQID NO1至6)中的任意重復序列具有至少85％同一性，優選至少90％同一性，更優選至少95％同一性，最優選至少97-99％同一性的氨基酸序列的肽，或包含如圖1(SEQ ID NO1至8)所示的氨基酸序列中的至少15，20，30，40，50或100個連續氨基酸的肽。
因此，本發明一方面提供了包含修飾的膽堿結合域和異源通用T輔助表位的融合伴侶蛋白，其中所述的膽堿結合域選自包含如下的組a) 如SEQ ID NO7所示的LytA的C-末端域；b) SEQ ID NO8所示的序列；c) 包含與SEQ ID NO1至6中任意序列具有至少85％同一性，優選至少90％同一性，更優選至少95％同一性，最優選至少97-99％同一性的氨基酸序列的肽序列；d) 包括SEQ ID NO7或SEQ ID NO8的氨基酸序列中的至少15，20，30，40，50或100個連續氨基酸的氨基酸序列的肽序列。
在一最優選實施方案中，C-LytA包括177-298氨基酸，其含有第一重復序列的一部分和另外五個完整的重復序列，如圖1所示。
融合伴侶的第二組分，異源T-細胞表位，優選地選自這樣一組表位，所述表位能與在人體中表達多于一種MHC II類分子的許多個體結合。例如，特別考慮的表位為來源于破傷風類毒素的P2和P30表位，Panina-Bordignon Eur.J.Immunol 19(12)，2237(1989)。在一優選實施例中異源T-細胞表位為來源于破傷風毒素的P2或P30。
P2表位具有QYIKANSKFIGITE序列，并且相應于破傷風毒素830-843位的氨基酸。P30表位(破傷風毒素的947-967位殘基)具有FNNFTVSFWLRVPKVSASHLE序列。可選的，可缺失FNNFTV序列。其他通用T表位可來源于惡性瘧原蟲的環子孢子蛋白，特別是具有DIEKKIAKMEKASSVFNVVNS序列的378-398區域(Alexander J，(1994)Immunity 1(9)，p751-761)。另一表位來源于麻疹病毒融合蛋白的具有LSEIKGVIVHRLEGV序列的288-302位殘基(PartidosCD，1990，J.Gen.Virol 71(9)2099-2105)。另一表位來源于肝炎B病毒表面抗原，特別是具有FFLLTRILTIPQSLD序列的氨基酸。另一組表位來源于白喉毒素。這些肽圖譜(氨基酸271-290，321-340，331-350，351-370)中的4個位于毒素片段B的T域中，并且剩下的2個圖譜位于R域(411-430，431-450)PVFAGANYAAWAVNVAQVIVHHNTEEIVAQSIALSSLMVQSIALSSLMVAQAIPLVGELVDIGFAAYNFVESIINLFQV
QGESGHDIKITAENTPLPIAGVLLPTIPGKLDVNKSKTHI(Raju R.，Navaneetham D.，Okita D.，Diethelm-Okita B.，McCormick D.，Conti-Fine B.M.(1995)Eur.J.Immunol.253207-14.)異源T-表位優選的與含有至少4個重復序列，優選包含2-5個重復序列的C-LytA融合。一個或多個隨后的重復序列可選的與T-表位的C-末端融合。可選的，異源T-表位優選的插入含有總共至少4個重復序列的C-LytA的兩個連續重復序列之間，或插入含有總共至少4個重復序列的C-LytA的1個重復序列中。更優選，C-LytA含有6個重復序列，并且異源表位插入C-LytA的第六個重復序列之中或者其起始位置。
在另外的方面，本發明進一步提供了一種包含上述多肽中的至少一種的融合蛋白，以及編碼這種融合蛋白的多核苷酸，典型的以藥物組合物的形式，如，包含生理學上可接受的載體和/或免疫刺激劑的疫苗組合物。
因此，自身蛋白或其他免疫原性較弱的蛋白可與獲得的融合伴侶的N-末端或C-末端融合。可選的，自身蛋白或免疫原性較弱的蛋白可被插入融合伴侶中。在另一優選實施例中，組氨酸標記或至少4個，優選多于6個的組氨酸殘基可與免疫原性較弱蛋白的任意末端融合。這樣可允許所述蛋白經親和層析步驟來純化，因為典型的包括至少4個、優選6個或更多殘基的組氨酸尾結構可與金屬離子結合，并且因此適合于金屬固相化金屬離子親和層析法(IMAC)。
從而典型的構建體包括-免疫原性較弱蛋白-C-LytA重復序列1-4-P2表位(插入或替換C-LytA重復序列5)-C-LytA重復序列6-C-LytA重復序列1-4-P2表位(插入或替換C-LytA重復序列5)-C-LytA重復序列6-免疫原性較弱蛋白-免疫原性較弱蛋白-C-LytA重復序列2-5-P2表位(插入C-LytA重復序列6)-C-LytA重復序列2-5-P2表位(插入C-LytA重復序列6)-免疫原性較弱蛋白-免疫原性較弱蛋白C-LytA重復序列1-5-P2表位-插入C-LytA重復序列6-C-LytA重復序列1-5-P2表位-插入C-LytA重復序列6-免疫原性較弱蛋白-免疫原性較弱蛋白-P2表位插入C-LytA重復序列1-C-LytA重復序列2-5-P2表位插入C-LytA重復序列1-C-LytA重復序列2-5-免疫原性較弱蛋白-免疫原性較弱蛋白-P2表位插入C-LytA重復序列1-C-LytA重復序列2-6-P2表位插入C-LytA重復序列1-C-LytA重復序列2-6-免疫原性較弱蛋白-免疫原性較弱蛋白-C-LytA重復序列1-P2表位插入C-LytA重復序列2-C-LytA重復序列3-6-C-LytA重復序列1-P2表位插入C-LytA重復序列2-C-LytA重復序列3-6-免疫原性較弱蛋白其中“插入”是指位于所述重復中的任意位置，例如在殘基1和2之間，或位于2和3之間等。
通用T輔助表位可被插入重復區域中，如C-LytA重復序列2-5-C-LytA重復序列6a-P2表位-C-LytA重復序列6b，其中P2表位被插入第六個重復序列中(見圖2)。
在其他優選實施例中，CPL1的C-末端(C-CPL1)可被用作C-LytA的一種替換。
可選的，上述構建體中的P2表位可被其他通用T表位替換，如P30。在本發明一具體實施例中，兩個或更多的通用表位為融合構建體的一部分。不過，優選的使融合伴侶盡可能的小，從而限制了潛在的干涉CD8+和B表位的數目。因此，融合伴侶優選的不大于100-140個氨基酸，進一步優選不大于120個氨基酸，典型的為約100個氨基酸。
與融合伴侶融合的抗原可來源于細菌、病毒、原生動物、真菌或哺乳動物，包括人來源。
本發明的融合伴侶優選的與自身抗原，如那些前列腺癌、胸腺癌、結腸直腸癌、肺癌、胰腺癌、卵巢癌、腎臟癌、黑素瘤等的腫瘤相關或組織特異性抗原融合。特意考慮將所述自身或腫瘤抗原的片段與本發明的融合伴侶融合。典型的，所述片段含有全長序列的至少20，優選50，更優選100個連續的氨基酸。典型的這類片段將缺乏一個或多個穿膜結構域或具有約3，5，8，10，15，20，28，33，50，54個氨基酸的N-末端或C-末端缺失。當以適當的方式呈遞時，這類片段將能產生識別全長蛋白的免疫應答。本發明特別闡釋的多肽包括與融合伴侶融合的腫瘤相關或組織特異性蛋白的至少10個，優選20，更優選30，40，50，60，70，80，90，100，110，120，130，140，150，160，170，180個相連的氨基酸。
本發明的多肽具有免疫原性，也就是，它們在免疫測定中(如ELISA或T-細胞刺激檢測)，以可檢測的量與來源于患有cripto表達癌癥的病人的抗血清和/或T-細胞反應。可采用本領域熟練技術人員已知的技術來進行免疫活性篩選。例如，可采用那些在Harlow & Lane，AntibodiesA Laboratory Manual，Cold Spring Harbor Laboratory，1988中記載的方法來進行篩選。在一示例實施例中，多肽可固定于固相支持物上并與病人血清接觸，從而允許血清中的抗體與固定的多肽相結合。隨后可移去未固定的血清，如采用125I-標記的蛋白A來檢測結合的抗體。正如本領域熟練技術人員可理解的那樣，腫瘤相關或腫瘤特異性抗原的免疫原性部分也包含在本發明的范圍內。本文所采用的“免疫原性部分”，是指一片段，其自身可與B-細胞和/或識別多肽的T-細胞表面抗原受體發生免疫反應(也就是，特異性結合)。通常采用已知的技術，如那些在Paul，Fundamental Immunology，3rd ed.，243-247(Raven Press，1993)中概述的技術來鑒別免疫原性部分，該文獻在此引入參考。這類技術包括篩選那些能與抗原特異性抗體、抗血清和/或T-細胞系或克隆反應的多肽。如本文所采用的，如果它們能特異性結合抗原(也就是在ELISA或其他免疫測定中與所述蛋白反應，并且不與無關蛋白可檢測量的發生反應)，則抗血清和抗體具有“抗原特異性”。這類抗血清和抗體可采用常規技術如本文所述進行制備。在一優選實施例中，多肽的免疫原性部分是指那些以基本上不低于全長多肽的反應水平的水平與抗血清和/或T-細胞反應的部分(如，在ELISA和/或T-細胞反應檢測中)。優選，免疫原性部分的免疫原性水平至少約為全長多肽免疫性的約50％，優選至少約為70％，最優選大于約90％。在一些實施例中，優選鑒別那些免疫活性水平高于相應的全長多肽的部分，例如，具有高于約100％或150％或更高的免疫活性。
在某些其他實施例中，示例性的免疫原性部分可包括其中N-末端前導肽序列和/或穿膜結構域缺失的肽。其他示范性的免疫原性部分可包含相對于成熟蛋白的小的N-和/或C-末端缺失(如，約1-50個氨基酸，優選約1-30個氨基酸，更優選約5-15氨基酸)。
示范性的抗原或其片段可包括MAGE 1，Mage 3和MAGE 4或其他如WO 99/40188中所公開的MAGE抗原，PRAME(WO 96/10577)，BAGE，RAGE，LAGE 1(WO 98/32855)，LAGE 2(也稱為NY-ESO-1，WO 98/14464)，XAGE(Liu等，Cancer Res，2000，604752-4755；WO 02/18584)，SAGE，和HAGE(WO 99/53061)或GAGE(Robbins&Kawakami，1996，Current Opinions in Immunology 8，pps 628-636；Van den Eynde等，International Journal of Clinical & LaboratoryResearch(submitted 1997)；Correale等(1997)，Journal of the NationalCancer Institute 89，p293。事實上，這類抗原在廣泛的腫瘤類型范圍內表達，如黑素瘤、肺癌、肉瘤和膀胱癌中。
在一優選實施例中采用了前列腺抗原，如前列腺特異抗原(PSA)，PAP，PSCA(PNAS 95(4)1735-1740 1998)，PSMA或已知作為前列腺酶的抗原。
在一特定優選實施例中，前列腺抗原為P501S或其片段。P501S，也被命名為prostein(Xu etal.，Cancer Res.61，2001，1563-1568)，為W098/37814中的SEQ ID NO.113，并且為一553個氨基酸的蛋白。免疫原性片段或其部分包括至少20，優選50，更優選100個連續的如上文所述參考專利申請并經本發明特別指出的氨基酸。優選片段為WO98/50567(PS108抗原)中公開的片段和前列腺癌相關蛋白(WO99/67384中的SEQ ID NO9)。其他優選片段為全長P501S蛋白的51-553，34-553或55-553位氨基酸。特別是，特意考慮設計了構建體1，2和3(參見圖2，SEQ ID NOs.27-32)，其可在酵母系統中表達，例如編碼這類多肽的DNA序列可在酵母系統中表達。
前列腺酶是一種前列腺特異性絲氨酸蛋白酶(胰蛋白酶類似物)，長254個氨基酸，具有保守絲氨酸蛋白酶催化三聯體H-D-S和具有潛在分泌功能的氨基末端前前肽序列(P.Nelson，Lu Gan，C.Ferguson，P.Moss，R.linas，L.Hood & K.Wand，″Molecular cloning andcharacterisation of prostase，an androgen-regulated serine protease withprostate restricted expression”，In Proc.Natl.Acad.Sci.USA(1999)96，3114-3119)，并描述了一假設的糖基化位點。其預測的結構與其他已知的絲氨酸蛋白酶非常類似，顯示出成熟多肽折疊成為單結構域。成熟蛋白長224個氨基酸，并具有一顯示出經天然加工的A2表位。前列腺酶核苷酸序列和推導的多肽序列和同源序列在Ferguson，等(Proc.Natl.Acad.Sci.USA 1999，96，3114-3119)中，和國際專利申請No.WO98/12302(和其相應的授權專利US 5,955,306)，WO 98/20117(和其相應的授權專利US 5,840,871和US 5,786,148)(前列腺酶特異性激肽釋放酶)和WO 00/04149(P703P)中有公開。
其他前列腺特異性抗原見于W098/37418，和WO/004149。另外一種為STEAP(PNAS96 14523 14528 7-12 1999)。
本發明上下文中所采用的其他腫瘤相關抗原包括Plu-1 JBiol.Chem 274(22)15633-15645，1999，HASH-1，HASH-2(Alders，M.等，Hum.Mol.Genet.1997，6，859-867)，Cripto(Salomon等Bioessays199，2161-70，US專利5654140)，CASB616(WO 00/53216)，Criptin(US 5,981,215)。另外，用于癌癥治療中的疫苗特定相關的抗原還包括酪氨酸酶、端粒酶、P53、NY-Br1.1(WO 01/47959)及其片段，如在WO 00/43420中所公開的，B726(WO00/60076，SEQ ID nos 469和463；WO 01/79286，SEQ ID nos 474和475)，P510(WO 01/34802SEQ ID nos 537和538)以及存活素。
當與乳腺癌抗原，如Her-2/neu，乳腺珠蛋白(US專利5,668,267)，B305D(WO 00/61753 SEQ ID nos299，304，305和315)，和那些WO00/52165，WO 99/33869，WO 99/19479，WO 98/45328中記載的抗原聯用時，本發明也非常有效。Her-2/neu抗原在US專利5,801,005中公開。優選Her-2/neu包括完整的胞外域(包括約1-645個氨基酸)或其片段，和至少其免疫原性部分或約C末端580個氨基酸的完整胞外域。特別是，細胞內部分應當包括磷酸化域或其片段。WO 00/44899公開了這類構建體。一已知的特別優選的構建體為ECD-PhD，第二個為ECD δ PhD(參見WO 00/44899)。本文所采用的Her-2/neu來源于大鼠、小鼠或人。
某些腫瘤抗原為小肽抗原(即小于約50個氨基酸)。這類抗原可經化學方法偶聯至本發明的修飾的膽堿結合蛋白上。
示范性肽包括粘蛋白(Mucin)衍生的肽如，MUC-1(參見US5,744,144；US 5,827,666；WO 88/05054，US 4,963,484)。特別設計的為MUC-1來源的肽，其包括MUC-1肽的至少一個重復單元，優選至少兩個能被SM3抗體(US 6,054,438)識別的重復序列。其他粘蛋白來源的肽包括來源于MUC-5的肽。
可選的，所述抗原為白介素，如優選IL13和IL14。或者所述抗原可以是一種自身肽激素，例如全長促性腺激素釋放激素(GnRH，WO95/20600)，短的10個氨基酸長的肽，其可用于治療多種癌癥，或用于免疫去勢。
適合于與本發明中的修飾的膽堿結合蛋白結合的其他腫瘤特異性抗原包括，但不限于腫瘤特異性神經節苷脂，如GM2，和GM3。
可通過本領域常用方法來使所述肽與修飾的膽堿結合蛋白共價結合。因此，例如，為了直接共價結合，利用常用的商業化可得的異雙功能接頭，如CDAP和SPDP(按照制造商的說明)，采用碳二亞胺、戊二醛或(N-[γ-馬來酰亞胺氧化丁酰]琥珀酰亞胺酯來進行。在聯接反應后，通過透析方法、凝膠過濾方法、分餾方法等途徑可很容易的分離和純化免疫原。
抗原還可來源于對人類致病的來源，如人類免疫缺陷病毒HIV-1(如tat，nef，反轉錄酶，gag，gp120和gp160)，人單皰疹病毒，如gD或其衍生物，或者立即早期蛋白，如來源于HSV1或HSV2的ICP27，巨細胞病毒(尤其是人類的)(如gB或其衍生物)，輪狀病毒(包括活減毒病毒)，EB病毒(如gp350或其衍生物)，水痘帶狀皰疹病毒(如gpI，II和IE63)，或者來源于肝炎病毒，如肝炎B病毒(如肝炎B表面抗原或其衍生物)，肝炎A病毒，肝炎C病毒，和肝炎E病毒，或來源于其他病毒病原體，如副粘病毒呼吸道合胞體病毒(如F和G蛋白或其衍生物)，副流感病毒，麻疹病毒，流行性腮腺炎病毒，人乳頭瘤病毒(如HPV6，11，16，18，…)，黃病毒(如，黃熱病毒，登革熱病毒，蜱傳播的腦炎病毒，日本腦炎病毒)，或流感病毒(全活或失活病毒，培養于卵黃或MDCK細胞中的裂解的流行性感冒病毒，或完整的流感病毒顆粒(如R.Gluck，Vaccine，1992，10，915-920所述)，或其純化或重組蛋白，如HA，NP，NA，或M蛋白或其組合物)，或者來源于細菌病原體，如奈瑟氏菌屬(Neisseria spp)，其包括淋病奈瑟氏菌(N.gonorrhoea)和腦膜炎奈瑟氏菌(N.meningitidis)(例如囊膜多糖和其偶聯物，轉鐵蛋白結合蛋白，乳鐵蛋白結合蛋白，PiIC，粘結素)；化膿鏈球菌(S.pyogenes)(如M蛋白或其片段，C5A蛋白酶，脂磷壁酸)，無乳鏈球菌(S.agalactiae)，變異鏈球菌(S.mutans)；杜克雷嗜血桿菌(H.ducreyi)；莫拉氏菌(Moraxella spp)，包括粘膜炎莫拉氏菌(M catarrhalis)，其也被稱為粘膜炎布蘭漢氏球菌(Branhamella catarrhalis)(例如高和低分子量的粘結素和侵襲素)；博代氏桿菌(Bordetella spp)，其包括百日咳博代氏桿菌(B.pertussis)(例如百日咳桿菌粘著素，百日咳毒素或其衍生物，絲狀凝血素，腺苷酸環化酶，菌毛)，副百日咳博德特菌(B.parapertussis)和支氣管炎博德特菌(B.bronchiseptica)；分枝桿菌，包括結核分枝桿菌(例如ESAT6，抗原85A，-B或-C)，牛分枝桿菌，麻風分枝桿菌，鳥分枝桿菌，副結核分枝桿菌，恥垢分枝桿菌；軍團菌，包括侵肺軍團菌；埃希氏菌，包括腸毒素大腸埃希菌(例如，克隆化因子，熱不穩定毒素或其衍生物，熱穩定毒素或其衍生物)，腸出血大腸埃希菌，腸致病性大腸埃希菌(例如志賀氏毒素類毒素或其衍生物)；弧菌，包括霍亂弧菌(例如霍亂毒素或其衍生物)；志賀氏菌，包括索氏志賀氏菌，痢疾志賀氏菌，弗氏志賀氏菌；耶爾森氏菌，包括小腸結腸炎耶爾森氏菌(例如Yop蛋白)，鼠疫耶爾森氏菌，假結核耶爾森氏菌；彎曲桿菌，包括空腸彎曲桿菌(例如毒素，粘結素和侵襲素)和大腸彎曲桿菌；沙門氏菌，包括傷寒沙門氏菌，副傷寒沙門氏菌，豬霍亂沙門氏菌，腸炎沙門氏菌；李斯特氏菌，包括單核細胞增生李斯特氏菌；螺桿菌，包括幽門螺桿菌(例如脲酶，過氧化氫酶，空泡毒素)；假單胞菌，包括銅綠假單胞菌；葡萄球菌，包括金黃葡萄球菌，表皮葡萄球菌；腸球菌，包括糞腸球菌，屎腸球菌；梭菌，包括破傷風梭菌(例如破傷風毒素和其衍生物)，肉毒梭菌(例如肉毒桿菌毒素和其衍生物)，艱難梭菌(例如梭菌毒素A或B及其衍生物)；芽孢桿菌，包括炭疽芽孢桿菌(例如肉毒桿菌毒素及其衍生物)；棒桿菌，包括白喉棒桿菌(例如白喉毒素及其衍生物)；疏螺旋體，包括布氏疏螺旋體(例如OspA，OspC，DbpA，DbpB)，嘎氏疏螺旋體(例如OspA，OspC，DbpA，DbpB)，阿氏疏螺旋體(例如OspA，OspC，DbpA，DbpB)，B.andersonii(例如OspA，OspC，DbpA，DbpB)，赫氏蜱疏螺旋體；埃里希氏體，包括馬埃里希氏體和人粒細胞埃立克體病的病原；立克次氏體，包括立氏立克次氏體；衣原體，包括砂眼衣原體(例如MOMP，肝素結合蛋白)，肺炎衣原體(例如MOMP，肝素結合蛋白)，鸚鵡熱衣原體；鉤端螺旋體，包括問號鉤端螺旋體；密螺旋體，包括蒼白密螺旋體(例如稀有外膜蛋白)，齒垢密螺旋體，豬痢疾密螺旋體；或者來源于寄生蟲，如瘧原蟲，包括惡性瘧原蟲；弓形蟲，包括剛地弓形蟲(例如SAG2，SAG3，Tg34)；阿米巴，包括溶組織內阿米巴；巴貝斯蟲屬，包括巴貝斯原蟲；岡比亞錐蟲，包括枯氏錐蟲；賈第鞭毛蟲，包括藍氏賈第鞭毛蟲；利什曼原蟲，包括碩大利什曼原蟲；肺孢子蟲，包括卡氏肺孢子蟲；毛滴蟲，包括陰道毛滴蟲；血吸蟲，包括曼氏血吸蟲，或來源于酵母，例如念珠菌，包括白色念珠菌；隱球菌，包括新生隱球菌。
結核分枝桿菌的其他優選特異性抗原為，如Tb Ra 12，Tb H9，Tb Ra35，Tb38-1，Erd 14，DPV，MTI，MSL，mTTC2和hTCC1(WO99/41748)。結核分枝桿菌的蛋白還包括融合蛋白及其突變體，其中至少兩個，優選三個結核分枝桿菌的多肽與一較大蛋白融合。優選的融合體包括Ra12-TbH9-Ra35，Erd14-DPV-MTI，DPV-MTI-MSL，Erd14-DPV-MTI-MSL-mTCC2，Erd14-DPV-MTI-MSL，DPV-MTI-MSL-mTCC2，TbH9-DPV-MTI(WO99/51748)。
衣原體最優選的抗原包括，例如，高分子量蛋白(HWMP)(WO99/17741)，ORF3(EP 366 412)，和假定膜蛋白(Pmps)。疫苗制劑的其他衣原體抗原可選自WO 99/28475中所記載的抗原組。
優選的細菌抗原來源于鏈球菌，包括肺炎鏈球菌(例如囊膜多糖和其偶聯物PsaA，PspA，鏈球菌融血素，膽堿結合蛋白)和蛋白抗原肺炎球菌自融酶(Biochem Biophys Acta，1989，67，1007；Rubins等，Microbial Pathogenesis，25，337-342)，及其去毒突變體衍生物(WO90/06951；WO 99/03884)。其他優選的細菌抗原來源于嗜血桿菌，包括B流感嗜血桿菌(例如PRP及其偶聯物)，非可分型流感嗜血桿菌，例如OMP26，高分子量粘合素，P5，P6，蛋白D和脂蛋白D，和絲束蛋白和絲束蛋白衍生肽(US 5,843,464)或多拷貝變異體或其融合蛋白。
本領域已知肝炎B表面抗原的各種衍生物，其包括，那些在歐洲專利申請EP-A-414 374；EP-A-0304578，和EP198-474中所記載的PreS1，PreS2 S抗原。一優選方面，所述HBV抗原為HBV聚合酶(JiHoon Jeong等，1996，BBRC 223，264-271；Lee H.J.等，Biotechnol.Lett.15，821-826)。在另一優選方面，融合體中的抗原為HIV-1抗原，gp120，特別是那些在CHO細胞中表達的。在一進一步的實施例中，抗原包括如本文上文中所定義的gD2t。
在本發明的優選實施例中，所述融合體包括來源于人乳頭瘤病毒的抗原(HPV 6a，6b，11，16，18，31，33，35，39，45，51，52，56，58，59和68)，尤其是那些被認為與生殖疣相關的HPV血清型(HPV 6或HPV 11和其他)，以及那些被認為與宮頸癌相關的HPV病毒(HPV16，HPV18和其他)。
合適的HPV抗原為E1，E2，E4，E5，E6，E7，L1和L2。生殖疣預防、或治療融合體的特別優選形式包括L1顆粒或衣殼體，并且融合蛋白包括一個或多個選自HPV 6和HPV 11蛋白E6，E7，L1和L2的抗原。
融合蛋白最優選的形式為如WO 96/26277中所述的L2E7，和如GB 9717953.5(PCT/EP98/05285)中所述的蛋白D(1/3)-E7。
優選的HPV宮頸感染或癌癥，預防或治療的疫苗組合物可包括HPV 16或18抗原。例如，L1或L2抗原單體，或L1或L2抗原以病毒樣顆粒(VLP)的形式一起存在，或單一的L1蛋白單獨的在VLP或衣殼體結構中存在。這種抗原、病毒樣顆粒和衣殼體其本身是已知的。例如，參見WO94/00152，WO94/20137，WO94/05792和WO93/02184。
另外的早期蛋白可包括單一或融合蛋白，例如E7，E2或優選E5。其特別優選的實施例包括包含L1E7融合蛋白的VLP(WO 96/11272)。特別優選HPV 16抗原包含早期蛋白E6或E7，其與蛋白D載體融合，從而形成來源于HPV16的蛋白D-E6或E7融合體，或其組合物；或者E6或E7與L2的組合物(WO 96/26277)。
可選的，HPV 16或18早期蛋白E6和E7，可以單一分子的形式存在，優選的為蛋白D-E6/E7融合體。其他融合體可選的含有HPV18中的E6和E7中的任意一種或全部，優選的呈蛋白D-E6或蛋白D-E7融合蛋白，或者蛋白D E6/E7融合蛋白的形式。融合體中可包含來源于其他HPV株的抗原，優選地來源于HPV 31或33株。
本發明的融合體包括來源于導致瘧疾的寄生蟲的抗原。例如，優選來源于惡性瘧原蟲的抗原，包括RTS，S和TRAP。RTS是雜合蛋白，其包括惡性瘧原蟲環子孢子(CS)蛋白的基本上全部C-末端部分，該蛋白通過肝炎B表面抗原的preS2部分的四個氨基酸與肝炎B病毒表面(S)抗原連接。公開號為WO 93/10152并要求UK專利申請No.9124390.7的優先權的國際專利申請No.PCT/EP92/02591公開了其完整結構。當在酵母中表達時，RTS以脂蛋白顆粒的形式產生，并且當其與來源于HBV的S抗原共表達時，其產生了一種RTS，S的混合顆粒。公開號為WO 90/01496的國際專利申請No.PCT/GB89/00895中記載了TRAP抗原。本發明優選實施例為一種融合體，其中抗原制劑包括RTS，S和TRAP的組合物。可作為融合體組分的可能候選的其他瘧原蟲抗原為惡性瘧原蟲(P.Faciparum)MSP1，AMA1，MSP3，EBA，GLURP，RAP1，RAP2，鉗合蛋白(Sequestrin)，PfEMP1，Pf332，LSA1，LSA3，STARP，SALSA，PfEXP1，Pfs25，Pfs28，PFS27/25，Pfs16，Pfs48/45，Pfs230和其在瘧原蟲屬的類似物。
本發明還提供了編碼本發明融合伴侶的多核苷酸。本發明進一步涉及與本文圖1(SEQ ID NO9至16)所示的多核苷酸序列雜交的多核苷酸。在這一點上，本發明特別涉及在嚴謹條件下與本文所述的多核苷酸雜交的多核苷酸。如本文所應用的，術語“嚴謹條件”和“嚴謹雜交條件”是指僅在序列間存在至少95％，優選至少97％的同一性的情況下，雜交才會發生。嚴謹雜交條件的特定實施例為，在如下溶液中42℃培養過夜50％甲酰胺，5×SSC(150mMNaCl，15mM檸檬酸三鈉)，50mM磷酸鈉(pH7.6)，5×Denhardt′s溶液，10％硫酸右旋糖酐，和20微克/毫升的變性、剪切的鮭魚精DNA，隨后在65℃在0.1×SSC中漂洗雜交載體。雜交和漂洗的條件是本領域已知的，并且在Sambrook等，Molecular CloningA Laboratory Manual，SecondEdition，Cold Spring Harbor，N.Y.，(1989)，特別是Chapter 11中進行了舉例說明。雜交溶液也可與本發明所述的多核苷酸一起使用。
本發明還提供了編碼包括與腫瘤相關抗原或其片段融合的、本發明所述的融合伴侶的多肽的多核苷酸。特別是，本發明提供編碼融合伴侶蛋白的多核苷酸序列，其中所述蛋白包括膽堿結合域和異源通用T輔助表位，優選其中膽堿結合域來源于LytA的C末端。在一更優選實施例中，本發明所述的多核苷酸的C-LytA部分包括SEQ ID NO.9-14中任一序列的至少四個重復序列，更優選包括SEQ ID NO.15序列，更進一步優選SEQ ID NO.16序列。在其他相關實施例中，本發明提供了與本文SEQ ID NOs9-16所公開的序列具有基本上同一性的多核苷酸變異體，例如所述的序列包括與本發明所述的多核苷酸序列的至少70％序列同一性，優選至少75％，80％，85％，90％，95％，96％，97％，98％，或99％或更高，序列同一性比較采用常規方法，例如采用標準參數的BLAST分析。在更進一步的實施例中，如權利要求所要求包含的多核苷酸進一步還包括異源蛋白。
這種多核苷酸序列可被插入適當的表達載體中，并在適當的宿主中表達。可采用這樣的載體，其可編碼本發明所述的修飾的膽堿結合蛋白，并且其含有合適的限制酶切位點，從而編碼含量極少的免疫蛋白的DNA可被插入以產生融合蛋白。在本發明的另外實施例中，編碼本發明所述的多肽融合體的多核苷酸序列或其片段可在重組DNA分子中應用，從而在適當的宿主細胞中引導所述多肽的表達。由于遺傳密碼子的固有簡并性，可采用編碼實質上相同或功能等同的氨基酸序列的其他DNA序列，并且這類序列可被用于克隆和表達特定的多肽。
如本領域熟練技術人員能理解的那樣，在某些情況中，產生使用非自然發生的密碼子的多肽編碼核酸序列是十分有利的。DNA編碼采用4字母(A，T，C，和G)，并且利用其拼出物種基因編碼得到的蛋白質中的氨基酸的三字母的“密碼子”。沿著DNA分子的密碼子的線性序列被轉錄成由這些基因編碼的蛋白質中的氨基酸的線性序列。編碼具有高度的簡并性，61個密碼子用于編碼20種天然氨基酸，同時3個密碼子表示“終止”信號。因此，絕大多數氨基酸由多于一個的密碼子來編碼，事實上許多是由4種或更多的不同密碼子來編碼的。
當多于一個的密碼子用于編碼一種特定的氨基酸時，可以觀察到物種中的密碼子使用模式具有高度的隨機性。不同的物種在其密碼子選擇方面具有不同的偏好性，此外，在單一物種中的高和低水平表達的基因之間的密碼子選用可顯著不同。在病毒、植物、細菌和哺乳動物細胞中這種偏好不同，并且一些物種比其他的物種顯示出更強的隨機密碼子選擇偏好性。例如，人和其他哺乳動物比細菌或病毒表現出更少一些的偏好性。基于這種原因，很有可能在E.Coli中表達的哺乳動物基因或在哺乳動物細胞中表達的病毒基因將具有對于高效表達不合適的密碼子分布。可以認為當在其表達發生的宿主中很少觀察到的密碼子簇的異源DNA序列存在時，可以預計宿主中的低異源表達水平。
其結果是，特定的原核(例如E.Coli或酵母)或真核宿主優選的密碼子可被優化，其被選擇用于提高蛋白的表達率，從而產生具有理想特性的重組RNA轉錄產物，例如，比天然產生的序列獲得的轉錄產物的半衰期更長的半衰期，或者用于優化人體內的免疫應答。密碼子優化的過程可包括任何序列，可通過手工或計算機軟件來產生，其中天然序列的一些或全部密碼子被修飾。已經公開了許多方法(Nakamura等，Nucleic Acids Research 1996，24214-215；W098/34640)。本發明的優選方法為Syngene法，一種Calcgene法的改進方法(R.S.Hale和G Thompson(Protein Expression andPurification Vol.12 pp.185-188(1998))。
相應的在一優選實施例中，蛋白質的DNA序列具有至少0.65的RSCU(相對同義密碼子使用值(也稱作密碼子指數CI))，并且與相對的野生型區域相比具有小于85％的同一性。
這種密碼子優化的處理和獲得的構建體十分有用，其可能具有如下的一些或全部的益處1)通過采用更常用的密碼子來替換稀有或不常用的密碼子可提高基因產物的表達；2)除去或包含限制性酶切位點從而有助于隨后的克隆和3)降低DNA載體中的插入序列和基因組序列間的同源重組可能和4)通過增加抗目的抗原的細胞和/或抗體應答(優選兩種應答)來提高免疫應答。本發明的序列非常有效的降低了重組的可能性，但是其表達至少與野生型序列在同一水平上。由于用于產生密碼子優化序列的SynGene程序中應用的算法的特性，可能會產生具有類似功能的、非常多數量的不同的密碼子優化序列。簡單的說，密碼子采用統計方法來賦值，從而產生一種具有更接近于在高效表達的E.coli和人基因中發現的天然密碼子頻率的密碼子頻率的合成基因。簡單的說，密碼子采用統計方法來賦值，從而產生一種具有更接近于在高效表達的人基因，如P-Actin中發現的天然密碼子頻率的密碼子頻率的合成基因。非限定性的，舉例來說，合適的密碼子優化序列如SEQ ID NOs19-22和SEQ ID NOs24-26所示。
在本發明的多核苷酸中，密碼子的使用模式從典型的目的抗原轉變為更接近于表現在目的有機體中高效表達的基因，如人β-肌動蛋白的密碼子偏好性。“密碼子使用系數”是特定多核苷酸序列密碼子模式如何接近于表現目的種類的密碼子模式的測量。密碼子頻率可來源于許多物種的高效表達基因的文獻資料(參見，如Nakamura等NucleicAcids Research 1996，24214-215)。61種密碼子的每一種的密碼子頻率(表現為每1000個選擇的基因類型的密碼子的事件發生的數目)在20種天然氨基酸的每一種中被標準化，從而每種氨基酸的最常用的密碼子的值被設定為1，較少常用的密碼子的頻率被度量為0到1之間。從而為了在目的物種中高效表達基因，61種密碼子中的每一種被賦值為1或更低。為了計算特定多核苷酸的密碼子使用系數，相對于該物種中的高效表達基因來說，記錄特定多核苷酸的每一密碼子的度量值，并且取全部這些值的幾何平均值(通過采用這些值的自然對數和來除以密碼子的總數并取反對數來獲得)。系數具有介于0和1之間的值，并且系數越高，則多核苷酸中的密碼子為越常用的密碼子。如果多核苷酸序列具有值為1的密碼子使用系數，則所有的密碼子均為“最常用”的密碼子用于在目的物種中高效表達基因。
根據本發明，多核苷酸的密碼子使用模式優選的排除表示用于特定氨基酸的＜10％的密碼子的密碼子。相對同義密碼子使用值為觀察到的密碼子的數目除以假設所有的氨基酸密碼子使用頻率相等得到的預期數目。本發明的多核苷酸優選的除去那些在目的有機體的高效表達基因中RSCU值小于0.2的密碼子。本發明的多核苷酸通常具有大于0.6的高效表達人基因的密碼子使用系數，優選大于0.65，最優選大于0.7。也可在Genbank中查閱密碼子使用表。
經比較，高效表達的β-肌動蛋白基因具有0.747的RSCU值。
用于智人屬(homo sapiens)的密碼子使用表(表1)如下
表1.人(高效表達的)基因1/24/91的密碼子使用(human_high.cod)氨基酸密碼子數目 /1000分數GlyGGG905.0018.760.24GlyGGA525.0010.880.14GlyGGT441.009.14 0.12GlyGGC1867.00 38.700.50GluGAG2420.00 50.160.75GluGAA792.0016.420.25AspGAT592.0012.270.25AspGAC1821.00 37.750.75ValGTG1866.00 38.680.64ValGTA134.002.78 0.05ValGTT198.004.10 0.07ValGTC728.0015.090.25AlaGCG652.0013.510.17AlaGCA488.0010.120.13AlaGCT654.0013.560.17AlaGCC2057.00 42.640.53ArgAGG512.0010.610.18ArgAGA298.006.18 0.10SerAGT354.007.34 0.10SerAGC1171.00 24.270.34LysAAG2117.00 43.880.82LysAAA471.009.76 0.18AsnAAT314.006.51 0.22AsnAAC1120.00 23.220.78MetATG1077.00 22.321.00IleATA88.00 1.82 0.05IleATT315.006.53 0.18IleATC1369.00 28.380.77
ThrACG405.008.400.15ThrACA373.007.730.14ThrACT358.007.420.14ThrACC1502.00 31.13 0.57TrpTGG652.0013.51 1.00EndTGA109.002.260.55CysTGT325.006.740.32CysTGC706.0014.63 0.68EndTAG42.00 0.870.21EndTAA46.00 0.950.23TyrTAT360.007.460.26TyrTAC1042.00 21.60 0.74LeuTTG313.006.490.06LeuTTA76.00 1.580.02PheTTT336.006.960.20PheTTC1377.00 28.54 0.80SerTCG325.006.740.09SerTCA165.003.420.05SerTCT450.009.330.13SerTCC958.0019.86 0.28ArgCGG611.0012.67 0.21ArgCGA183.003.790.06ArgCGT210.004.350.07ArgCGC1086.00 22.51 0.37GlnCAG2020.00 41.87 0.88GlnCAA283.005.870.12HisCAT234.004.850.21HisCAC870.0018.03 0.79LeuCTG2884.00 59.78 0.58LeuCTA166.003.440.03LeuCTT238.004.930.05LeuCTC1276.00 26.45 0.26
ProCCG482.009.990.17ProCCA456.009.450.16ProCCT568.0011.77 0.19ProCCC1410.00 29.23 0.48編碼本發明的融合蛋白或修飾的膽堿結合蛋白的DNA序列可采用標準的DNA合成技術來合成，如通過如D.M.Roberts等，在Biochemistry 1985，24，5090-5098中所述的酶聯反應，或通過，如利用熱穩定聚合酶的PCR技術，或通過這類技術的組合。
利用DNA聚合酶，如DNA聚合酶I(Klenow片段)或Taq聚合酶，在含有必須的核苷三磷酸dATP，dCTP，dGTP和dTTP的適當緩沖液，在10-37℃下，通常以50μl或更少的體積，可在體外進行DNA酶聚合反應。DNA片段的酶連接反應可采用DNA連接酶，如T4 DNA連接酶在適當的緩沖液，如0.05M Tris(pH 7.4)，0.01M MgCl2，0.01M二巰基蘇糖醇，1mM亞精胺，1mM ATP和0.1mg/ml牛血清白蛋白，在4℃孵育，一般以50μl或更少的體積進行。DNA聚合體或片段的化學合成可通過傳統的磷酸三酯、磷酸酯或亞磷酰胺化學方法，利用如“Chemical and Enzymatic Synthesis of Gene Fragments-A LaboratoryManual”(ed.H.G.Gassen和A.Lang)，Verlag Chemie，Weinheim(1982)，或其他的科技出版物，如M.J.Gait，H.W.D.Matthes，M.Singh，B.S.Sproat，和R.C.Titmas，Nucleic Acids Research，1982，10，6243；B.S.Sproat，和W.Bannwarth，Tetrahedron Letters，1983，24，5771；M.D.Matteucci和M.H.Caruthers，TetrahedronLetters，1980，21，719；M.D.Matteucci和M.H.Caruthers，Journal ofthe Anerican Chemical Society，1981，103，3185；S.P.Adams等，Journalof the American Chemical Society，1983，105,661；N.D.Sinha，J.Biernat，J.McMannus，和H.Koester，Nucleic Acids Research，1984，12，4539；和H.W.D.Matthes等，EMBO Journal，1984，3，801中所述的固相技術來合成。
本發明的過程可按如Maniatis等，Molecular Cloning-ALaboratory Manual；Cold Spring Harbor，1982-1989中所述的傳統重組技術來進行。
特別是，所述過程可包括如下步驟i)制備可復制或整合的表達載體，所述載體能在宿主細胞中表達包含編碼所述蛋白或其衍生物的核酸序列的DNA聚合體ii)采用所述載體轉化宿主細胞iii)在允許所述的DNA聚合體表達產生所述蛋白質的條件下培養所述轉化的宿主細胞；和iv)回收所述蛋白質本文所采用的術語“轉化”是指向宿主細胞中導入外源DNA。這可利用如Genetic Engineering；Eds.S.M.Kingsman和A.J.Kingsman；Blackwell Scientific Publications；Oxford，England，1988中所述的傳統技術，通過采用適當的質粒或病毒載體，進行轉化、轉染或感染來實現。術語“被轉化的”或“轉化子”將隨后用于得到的含有和表達感興趣的外源基因的宿主細胞。
所述的表達載體也是新的，同時也形成了本發明的一部分。
可按本發明所述來制備可復制的表達載體通過酶切與宿主細胞相容的載體獲得含有完整復制子的線性DNA片段，和在連接條件下將所述線性片段與一個或多個DNA分子結合，其中所述DNA分子與所述線性片段一起編碼目的產物，如編碼本發明的蛋白質或其衍生物的DNA聚合體。
因此，可根據需要，在構建載體的過程中獲得或形成DNA聚合體。
載體的選擇部分地由宿主細胞來決定，所述的宿主細胞可以是原核或真核的，但是優選E.Coli、酵母或CHO細胞。合適的載體包括質粒、噬菌體、粘粒和重組病毒。表達和克隆載體優選含有選擇性標記，從而只有表達了標記的宿主細胞才能在選擇性條件下存活。選擇性基因包括，但不局限于，具有抗氨芐青霉素、四環素或卡那霉素抗性的編碼蛋白質。表達載體還可含有與指定宿主相容的調控序列。例如，用于E.Coli，和更通用的用于原核生物的表達調控序列包括啟動子和核糖體結合位點。啟動子序列可天然存在，如β-內酰胺酶(青霉素酶)(Weissman 1981，In Interferon 3(ed.L.Gresser)，乳糖(lac)(Chang等Nature，1977，1981056)，和色氨酸(trp)(Goeddel等Nucl.AcidsRes.1980，8，4057)和λ-來源的PL啟動子系統。此外，非天然存在的合成啟動子同時也具有細菌啟動子的功能。這種情況存在，如來源于trp和lac啟動子序列的tac合成雜交啟動子(De Boer等，Proc.NatlAcad Sci.USA 1983，80，21-26)。該系統特別適合E.Coli。
酵母相容載體也可攜帶允許選擇成功轉化子的標記，所述標記可使營養缺陷型突變體變為原養型，或具有針對對野生型有害的重金屬的抗性。酵母載體的表達調控序列包括糖酵解的啟動子(Hess等，J.Adv.Enzyme Reg.1968，7，149)，編碼酸性磷酸酶的PHO5基因，CUP1基因，ARG3基因，GAL基因啟動子和合成啟動子序列。在酵母表達系統中有用的其他調控元件為終止子和mRNA前導序列。由于其典型的編碼由疏水氨基酸組成的引導蛋白從細胞中分泌的信號肽，因此5’端編碼序列特別有用。合適的信號序列可由分泌型酵母蛋白的基因來編碼，如酵母轉化酶基因和a-因子基因，酸性磷酸酶，殺手毒素，α-配對因子基因，以及最近來源于克魯維酵母(Kluyveromycesmarxianus)INU1A基因的異源菊粉酶信號序列。已經開發出了用于在畢赤酵母(Pichia pastoris)和釀酒酵母(Saccharomyces cerevisiae)中表達的合適的載體。
可根據各種可誘導的或基本啟動子來獲得酵母表達載體的變體(Cereghino和Cregg，FEMS Microbiol.Rev.2000，2445-66)。為了生產細胞內和分泌性蛋白，最常用的畢赤酵母(P.pastoris)含有非常強和緊密調控的乙醇氧化酶(AOX1)啟動子。該載體還含有畢赤酵母組氨醇脫氫酶(HIS4)基因用于在his4宿主中進行選擇。外源蛋白的分泌需要信號序列的存在，并且釀酒酵母前原α-配對因子已在畢赤酵母表達系統中廣泛和成功的應用了。表達載體被整合至畢赤酵母基因組從而使表達菌株的穩定性最大化。與釀酒酵母中一樣，在宿主基因組剪切序列內部的畢赤酵母表達載體的酶切片段(AOX1或HIS4)刺激了同源重組發生，從而有效的使載體靶向整合至基因組部位。一般來說，含有多個表達盒整合拷貝的重組菌株與單拷貝菌株相比可產生更多的異源蛋白。獲得高拷貝數目轉化子的最有效的方法需要通過球形原生質體技術(Cregg等1985，Mol.Cell.Biol.53376-3385)來轉化畢赤酵母受體菌株。
一般可采用用于DNA酶切、聚合和連接的合適的酶，采用如上文所引用的Maniatis等中記載的方法來制備可復制的表達載體。
根據本發明，采用在轉化條件下得到的本發明的可復制的表達載體來轉化宿主細胞，從而制備重組宿主細胞。適當的轉化條件是常規的，并記載于上文引用的Maniatis等中，或″DNA Cloning′Vol.II，D.M.Glover ed.，IRL Press Ltd，1985中。
根據待轉化的宿主細胞的選擇來選擇轉化條件。例如，體內轉化是采用活的病毒載體作為本發明所述的多核苷酸的轉化介質。通過經CaCl2溶液處理宿主(Cohen等，Proc.Nat.Acad.Sci.，1973，69，2110)或采用包含氯化銣(RbCl)、MnCl2、醋酸鉀和甘油混合物的溶液處理，然后采用3-[N-嗎啉]-丙烷-磺酸，RbCl和甘油處理后直接吸收多核苷酸(可以是含有目的序列的表達載體)，或經電轉化，可實現宿主，如E.coli的細菌轉化。可采用，如Hinnen等(Proc.Natl.Acad.Sci.1978，751929-1933)的方法來實現低等真核生物如酵母細胞在培養基中通過直接吸收而發生的轉化。可采用磷酸鈣與載體DNA共沉淀至細胞的方法來轉化培養基中的哺乳動物細胞(Graham & Van der Eb，Virology 1978，52，546)。向哺乳動物細胞導入多核苷酸的其他方法包括右旋糖酐介導的轉染、多聚季銨鹽介導的轉染、原生質融合、電穿孔、多核苷酸在脂質體中的包被、和向細胞核中直接進行多核苷酸顯微注射。
本發明還包括采用編碼本發明的蛋白的核酸或本發明的可復制的表達載體轉化的宿主細胞。
依照如上文所引用的Maniatis等和“DNA Cloning”中所述的方法，在允許DNA聚合物表達的條件下常規的培養轉化的宿主細胞。因此，優選細胞在添加營養素的情況下在低于50℃的溫度下，優選介于25℃至42℃之間，更優選介于25℃和35℃之間，最優選30℃下培養。所述的培養時間將根據經SDS-PAGE或Western blot測定的多肽在細菌細胞中的比例，從幾分鐘到幾小時不等。
可根據宿主細胞和根據表達產物的定位(細胞內或分泌至培養介質或分泌至細胞周質)，通過常規方法回收產物。因此，當宿主細胞為細菌，如E.coli時，可經物理的、化學的或酶學方法來溶解，并從獲得的溶解產物中分離蛋白產物。當宿主細胞為哺乳動物時，產物通常可從營養培養基或細胞游離提取物中分離。當宿主為酵母，如釀酒酵母或畢赤酵母時，產物通常可從溶解的細胞或從培養基中分離，并隨后采用常規技術純化。可經western blot或通過利用直接抗感興趣的多肽的抗體的ELISA方法來測定表達系統的特異性。
常規的蛋白分離技術包括選擇性沉淀、吸附層析、和包括單克隆抗體親和柱的親和層析。當本發明的蛋白質與組氨酸尾(His標記)共表達時，其可以很容易的采用利用離子金屬親和層析柱(IMAC)的親和層析來進行純化。所述的金屬離子可以是任何合適的離子，如鋅、鎳、鐵、鎂或銅，但是優選鋅或鎳。優選IMAC緩沖液含有去垢劑、優選陰離子去垢劑，如SDS，更優選非離子去垢劑，如Tween 80，或兩性離子去垢劑如Empigen BB，這將使終產物內僅存在較低水平的內毒素。
進一步的層析步驟包括，如Q-Sepharose步驟，其可在IMAC柱層析步驟之前或之后進行。優選的pH在7.5到10的范圍內，更優選7.5到9.5，最佳的介于8和9之間。
本發明的蛋白隨后可根據如下方案來純化。裂解細胞后，將含有蛋白的細胞提取物溶解在含有尿素(例如8.0M)，和SDS(例如從0.5％至1％)的pH 8.5的Tris緩沖液中。離心后，得到的上清液隨后被加樣至經pH 8.5 Tris緩沖液平衡過的IMAC(鎳)Sepharose FF柱中。隨后采用含有緩沖液的高鹽溶液漂洗(例如，0.75-1.5mNaCl，15mM pH 8.5 Tris緩沖液)。隨后，可選的采用無鹽的磷酸緩沖液漂洗層析柱。采用含咪唑的緩沖溶液從柱中洗脫本發明的蛋白。隨后，可將該蛋白經另一層析步驟處理，如陰離子交換層析柱(例如QSepharose)。
本發明的蛋白既可以溶于液體的形式，又可以優選的冷凍干燥的形式保存。一般希望每一人體劑量包括1至1000μg的蛋白，優選30-300μg。所述的純化過程還可包括羧基酰胺化步驟，其中所述蛋白首先在谷胱甘肽存在的情況下被還原，并隨后在碘代乙酰胺存在的條件下被羧甲基化。該步驟有利于控制分子之間或與宿主細胞蛋白污染物間通過二硫鍵共價橋接形成氧化聚集。
本發明還提供包含在藥學上可接受的賦形劑中的本發明的蛋白的藥物和免疫原性組合物。優選的疫苗組合物包含至少一種本發明的蛋白。所述的蛋白，優選的，具有封閉的硫醇基團并且經高度純化，例如，具有少于5％的宿主細胞污染物。這種疫苗可優選的含有一種或多種其他的腫瘤相關抗原和衍生物。例如，合適的其他相關抗原包括，前列腺酶、PAP-1、PSA(前列腺特異抗原)、PSMA(前列腺特異膜抗原)、PSCA(前列腺干細胞抗原)、STEAP。
在另一實施例中，示例性的免疫原性組合物，如本發明的疫苗組合物，包含編碼一個或多個上文所述的融合多肽，如原位產生的融合多肽的DNA。如上文所指出的那樣，所述的多核苷酸可采用本領域熟練技術人員已知的各種傳遞系統中的任意一種進行施用。實際上，本領域已知多種基因傳遞技術，如那些在Rolland，Crit.Rev.Therap.Drug Carrier Systems 15143-198，1998中所記載的，在此作為參考文獻引用。毫無疑問，適當的多核苷酸表達系統包含在病人中表達必須的調控DNA調節子序列(如適當的啟動子和終止信號)。可選的，細菌傳遞系統涉及施用細菌(如卡介苗)，其可在其細胞表面表達多肽的免疫原性部分或分泌這種表位。
因此，在特定實施例中，編碼本文所述的免疫原性多肽的多核苷酸可通過已知的眾多以病毒基礎的系統中的任意一種被導入適當的哺乳動物宿主細胞中進行表達。在示例性實施例中，逆轉錄病毒為基因傳遞系統提供了方便和有效的平臺。選擇的編碼本發明的多核苷酸的核苷酸序列可經本發明公知的方法，被插入載體中并被包裝成逆轉錄病毒顆粒。隨后，分離重組病毒并遞送給受試者。目前已公開了多個示例性的逆轉錄病毒系統(例如，U.S.Pat.No.5219740；Miller和Rosman(1989)BioTechniques 7980-990；Miller，A.D.(1990)HumanGene Therapy 15-14；Scarpa等(1991)Virology 180849-852；Burnsetal.(1993)Proc.Natl.Acad.Sci.USA 908033-8037；和Boris-Lawrie& Temin(1993)Cur.Opin.Genet.Develop.3102-109)。
此外，還記載了許多示例性的基于腺病毒的系統。與整合至宿主基因組的逆轉錄病毒不同，腺病毒保持獨立于染色體之外，從而最小化了插入突變造成的風險(Haj-Ahmad & Graham(1986)J.Virol.57267-274；Bett等(1993)J.Virol.675911-5921；Mittereder等(1994)Human Genc Therapy 5717-729；Seth等(1994)J.Virol.68933-940；Barr等(1994)Gene Therapy 151-58；Berkner，K.L.(1988)BioTechniques 6616-629；和Rich等(1993)Human Gene Therapy4461-476)。由于人常常受到常見的人腺病毒血清型，如AdHu5的感染，因此很大比例的人群產生抗腺病毒的中和抗體應答，其容易對重組疫苗系統中的異源抗原產生免疫應答。非人類的靈長目腺病毒載體，如黑猩猩腺病毒68(AdC68，Fitzgerald等(2003)J.Immunol 170(3)1416-22)可作為一種可選擇的沒有之前存在的中和抗體應答缺陷的腺病毒系統。
各種腺相關病毒(AAV)載體系統也被開發用于多核苷酸傳遞。AAV載體可采用本領域已知的技術很容易的構建得到。參見，例如，U.S.Pat.Nos.5,173,414和5,139,941；國際公布Nos.WO 92/01070和WO 93/03769；Lebkowski等(1988)Molec.Cell.Biol.83988-3996；Vincent等(1990)Vaccines 90(Cold Spring Harbor Laboratory Press)；Carter，B.J.(1992)Current Opinionin Biotechnology 3533-539；Muzyczka，N(1992)Current Topics in Microbiol.and Immunol.15897-129；Kotin，R.M.(1994)Human Gene Therapy 5793-801；Shelling和Smith(1994)Gene Therapy 1165-169；和Zhou等(1994)J.Exp.Med.1791867-1875。
通過基因傳遞，用于傳遞編碼本發明的多肽的核酸分子的另外的病毒載體包括那些來源于痘病毒科的病毒，如痘苗病毒和禽痘病毒。舉例來說，表達新分子的痘苗病毒重組體按照如下方法構建。首先將編碼多肽的DNA插入適當的載體中，從而它與痘苗啟動子相鄰，并與痘苗DNA序列側接，例如編碼胸腺激酶(TK)的序列。隨后采用該載體轉染細胞，并同時用痘苗感染該細胞。同源重組發生，痘苗啟動子和編碼感興趣多肽的基因被插入病毒基因組中。通過在5-溴脫氧尿嘧啶核苷存在下培養細胞并挑選病毒抗性空斑來篩選TK.sup.(-)重組體。
基于牛痘的感染/轉染系統可方便地用于在有機體的宿主細胞中發生本發明所述的一個或多個多核苷酸的可誘導的瞬時表達或共表達。在該特定系統中，首先采用編碼噬菌體T7RNA聚合酶的痘苗病毒重組體在體外感染細胞。該聚合酶顯示出精確的特異性，僅轉錄帶有T7啟動子的模板。感染后，采用在T7啟動子調控下的感興趣的多核苷酸來轉染細胞。牛痘病毒重組體將轉染的DNA轉錄成為RNA，并隨后通過宿主翻譯機制翻譯成為多肽，從而聚合酶在細胞質中表達。該方法提供了大量RNA和其翻譯產物的高水平、瞬時的、細胞質生產方法。參見，例如，Elroy-Stein和Moss，Proc.Natl.Acad.Sci.USA(1990)876743-6747；Fuerst等Proc.Natl.Acad.Sci.USA(1986)838122-8126。
可選的，禽痘病毒，如禽痘病毒和金絲雀痘病毒，也可被用于傳遞感興趣的編碼序列。已知當給予非禽類物種時，表達哺乳動物病原體免疫原的重組鳥痘病毒可產生保護性免疫反應。在人類和其他哺乳動物物種中使用禽痘病毒載體是非常理想的，因為禽痘病毒屬的成員僅能在易感染的鳥類物種中產生復制，從而在哺乳動物細胞中不具有傳染性。生產重組鳥痘病毒的方法是本領域已知的方法，并且如上文所述關于牛痘病毒的生產可采用遺傳重組方法。參見，例如，WO91/12882；WO 89/03429；和WO 92/03545。
眾多α病毒載體中的任意一種也可被用于傳遞本發明的多核苷酸組合物，如那些在美國專利Nos.5,843,723；6,015,686；6,008,035和6,015,694中所述的載體。某些基于委內瑞拉馬腦炎病毒(VEE)的載體也可被使用，其具體的例子可參見美國專利Nos.5,505,947和5,643,576。
可通過許多途徑，如肌內的、皮下的、腹膜內的或靜脈內的方式來傳遞本發明的組合物。
本發明的另一實施例中，多核苷酸以“裸露”DNA的方式施用/傳遞，例如，如Ulmer等，Science 2591745-1749，1993和Cohen，Science2591691-1692，1993中所述。通過將DNA包裹至有效的轉移至細胞內的生物可降解珠粒表面可增加裸露DNA的吸收。特別是，所述組合物通過基因槍(特別是粒子轟擊)施用技術的途徑進行傳遞，所述技術涉及將載體包裹至珠粒(例如金)表面，并在高壓下施用至表皮中；例如，如Haynes等J Biotechnology 4437-42(1996)中所述。
在示例性實施例中，氣體驅動的顆粒的加速可采用由PowderjectPharmaceutical PLC(Oxford，UK)和Powderject Vaccines Inc.(Madison，WI)公司制造的裝置來實現，所述裝置的例子可參見美國專利Nos.5,846,796；6,010,478；5,865,796；5,584,807；和歐洲專利No.0500 799的記載。該方法提供了一種無需針的傳遞方式，其中顯微顆粒，如多核苷酸，的干粉制劑，可在由手持裝置產生的氦氣噴射流中被加速至很高速度，氦氣推動顆粒至感興趣的靶組織，典型的為皮膚中。所述的顆粒優選為0.4-4.0μm的金粒，更優選0.6-2.0μm的直徑，并且將DNA偶聯物包裹至顆粒表面，并隨后將其裝入藥筒或藥盒中用于置于“基因槍”內。
在相關實施例中，其他可用于本發明組合物的無針氣體驅動注射的裝置和方法包括由Bioject，Inc.(Portland，OR)所提供的裝置和方法，其具體記載于美國專利Nos.4,790,824；5,064,413；5,312,335；5,383,851；5,399,163；5,520,639和5,993,412中。
包含編碼抗原肽的核苷酸序列的免疫原組分可通過一次性的或重復的進行施用，例如介于1到7次之間，優選的介于1到4次之間，其施用間隔介于1天至約18個月。不過，這種治療方案將根據病人的體積、待治療/預防的疾病、施用的核苷酸序列的量、施用途徑、和對熟練醫師來說非常明顯的其他因素的不同而顯著不同。
因此，本發明的另一方面涉及本發明所述的編碼所述蛋白的DNA或蛋白在制備用于引起病人中免疫應答的免疫原性組合物中的應用。優選的免疫應答通過如下施用順序引發i)所述蛋白，接著是所述DNA序列；或ii)所述DNA序列，接著是所述蛋白。更優選，所述DNA序列被包裹至生物可降解珠粒表面，或通過粒子轟擊途徑傳遞。更進一步優選所述蛋白添加佐劑，優選的添加TH-1誘導劑，更優選基于CpG/QS21的佐劑。
包含編碼抗原肽的核苷酸序列的載體以預防或治療有效的劑量進行施用。施用的劑量一般在1皮克至16毫克之間，對于顆粒介導的傳遞優選每劑量1皮克至10微克，對于核酸的其他施用途徑優選每劑量10微克至16毫克之間。確切的量將根據待免疫的病人的體重和施用方式的變化而大不相同。
用于向病人中導入裸露的多核苷酸或載體的合適的技術還包括通過適當的載體進行的局部施用。所述核酸可局部施用至皮膚，或粘膜表面，例如通過鼻內的、口腔的、陰道內的或直腸內施用。所述的裸露的多核苷酸或載體可與藥學上可接受的賦形劑，如磷酸緩沖鹽溶液(PBS)共同施用。還可通過使用促進劑，如布比卡因，以與DNA制劑分開或包括在其內部的方式來進一步促進DNA的吸收。對受體直接施用所述核酸的其他方法包括超聲波、電刺激、電穿孔和記載于US5,697,901中的顯微植入法。
核酸構建體的攝取可通過許多已知轉染技術來增強，例如那些包括使用轉染劑的方法。這些試劑的例子包括陽離子劑，例如，磷酸鈣和DEAE-右旋糖酐及脂質轉染劑，例如lipofectam和transfectam。施用的核酸的劑量是可變的。
本發明中的融合蛋白和編碼的多肽可配制成藥用/免疫原性組合物的形式，例如，作為疫苗。因此，本發明還提供了包含在藥學上可接受的賦形劑中的本發明的融合蛋白的藥用/免疫原性組合物。因此，還提供了一種制備本發明的免疫原性組合物的方法，其包括將本發明的融合蛋白或編碼的多核苷酸與合適的佐劑，稀釋劑或其他的藥學上可接受的載體混合。
如SDS PAGE結果所顯示的那樣，本發明的融合蛋白優選地呈至少80％的純度，更優選90％的純度。優選地在SDS PAGE中，所述的蛋白呈單一條帶。
疫苗的制備方法常規的記載于Vaccine Design(″The subunit andadjuvant approach″(eds.Powell M.F.& Newman M.J).(1995)PlenumPress New Vork)中。采用脂質體包裹的方法由Fullerton在美國專利4,235,877進行了記載。
在本發明的疫苗制劑中，本發明的融合蛋白和編碼的多核苷酸優選的添加了佐劑。特定的佐劑是商業化可購得的，例如，Freund′s不完全佐劑和完全佐劑(Difco Laboratories，Detroit，MI)；Merck佐劑65(Merck & Company，Inc.，Rahway，NJ)；AS-2(SmithKlineBeecham，Philadelphia，PA)；鋁鹽，如氫氧化鋁凝膠(明礬)或磷酸鋁；鈣鹽，鐵鹽或鋅鹽；酰化酪氨酸的不溶懸浮顆粒；酰化糖；陽離子或陰離子的衍生多糖；含磷氮鏈聚合物；生物可降解的微球體；單磷酰脂A和quil A。細胞因子，如GM-CSF，白介素-2，-7，-12，和其他類似的生長因子也可用作佐劑。
在本發明的特定實施例中，佐劑組合物優選的為主要能引起Th1型免疫應答的物質。高水平的Th1-型細胞因子(例如，IFN-γ，TNFα，IL-2和IL-12)有助于誘導產生針對施用抗原的細胞介導的免疫應答。與之相對，高水平的Th2-型細胞因子(例如，IL-4，IL-5，IL-6和IL-10)有助于誘導產生體液免疫應答。施用了如本文所述的疫苗后，病人將經歷包括Th1-和Th2-型應答的免疫應答。在免疫應答主要為Th1-型的優選實施例中，Th1-型細胞因子水平將增至遠超過Th2-型細胞因子的水平。采用標準的檢測方法可以很容易的檢測這類細胞因子的水平。對于細胞因子家族的相關內容，參見Mosmann & Coffman，Ann.Rev.Immunol.7145-173，1989。
優選TH-1誘導佐劑選自如下的一組佐劑3D-MPL，QS21，QS21和膽固醇的混合物，和CpG寡核苷酸或兩種或更多所述佐劑的混合物。主要引起Th1-型應答的特別優選的佐劑包括，例如，單磷酰脂質A，優選3-脫-O-酰化單磷酰脂質A與鋁鹽的組合物。MPL佐劑購于Corixa Corporation(Seattle，WA；參見，如美國專利Nos.4,436,727；4,877,611；4,866,034和4,912,094)。含CpG-寡核苷酸(其中CpG二核苷酸未甲基化)也能主要誘導Th1應答。這種寡核苷酸是已知的，并且記載于，如WO 96/02555，WO 99/33488和美國專利Nos.6,008,200和5,856,462。免疫刺激DNA序列還記載于，例如，Sato等，Science273352，1996。其他優選的佐劑包括皂甙，如Quil A，或其衍生物，包括QS21和QS7(Aquila Biopharmaceuticals Inc.，Framingham，MA)；七葉樹溶血皂角素；洋地黃皂甙；或滿天星(Gypsophila)或美洲土荊芥(Chenopodium quinoa)皂甙。其他優選的制劑包括在本發明的佐劑組合物中存在一種以上的皂甙，例如，如下組中的至少兩種物種的組合QS21，QS7，Quil A，β-七葉樹溶血皂角素，或洋地黃皂甙。
可選的，所述的皂甙制劑可與其他疫苗載體聯合使用，所述載體包括殼聚糖或其他多聚陽離子聚合物，聚交酯和聚交酯共乙交酯顆粒，幾丁質(poly-N-acetyl glucosamine-based)聚合物基質，由多糖或化學修飾的多糖組成的顆粒，脂質體和脂類顆粒，由甘油單酯組成的顆粒等。還可在膽固醇存在的條件下配制皂甙從而形成微粒結構，如脂質體或ISCOMs。此外，皂甙還可與聚氧化乙烯醚或酯一起配制而成，呈一種非微粒溶液或懸浮液的形式，或呈微粒結構的形式，如paucilamelar脂質體或ISCOM。皂甙還可與賦形劑，如CarbopolR一起配制來增加粘性，或與粉末賦形劑如乳糖一起配制成干粉形式。
在一優選實施例中，所述的佐劑系統包括單磷酰脂質A和皂甙衍生物的組合物，如記載于WO 94/00153中的QS21與3D-MPL佐劑的組合物，或一更少反應原性組合物，如WO 96/33739中所述，其中QS21的作用被膽固醇猝滅。其他優選的制劑包括水包油乳劑和生育酚。另外特別優選的佐劑制劑采用了呈水包油乳劑的QS21，3D-MPL佐劑和生育酚，其記載于WO 95/17210。
另一增強的佐劑系統涉及含CpG-寡核苷酸和皂甙衍生物的組合物，尤其是如WO 00/09159和WO 00/62800中所述的CpG和QS21的組合物。優選所述制劑另外還包含水包油乳劑和生育酚。
在進一步的實施例中，本發明提供了免疫原性組合物，所述組合物包含本發明的融合蛋白，并進一步包含D3-MPL，一種皂甙，優選QS21和CpG寡核苷酸，可選的配制成水包油乳劑的形式。
用于本發明的藥物組合物的另外的示例性的佐劑包括MontanideISA 720(Seppic，France)，SAF(Chiron，California，United States)，ISCOMS(CSL)，MF-59(Chiron)，SBAS系列佐劑(如SBAS-2或SBAS-4，購于SmithKline Beecham，Rixensart，Belgium)，Detox(Enhanzyn)(Corixa，Hamilton，MT)，RC-529(Corixa，Hamilton，MT)和其他的氨基烷基氨基葡萄糖苷4-磷酸酯(AGPs)，如在本文中整體作為參考的美國待決專利申請Nos.08/853,826和09/074,720中所述的，以及如WO99/52549 A1中所述的聚氧化乙烯醚。
其他優選的佐劑包括具有如下通式(I)的佐劑分子HO(CH2CH2O)n-A-R，其中，n為1-50，A為結合鍵或-C(O)-，R為C1-50烷基或苯基C1-50烷基。本發明的一實施例包括由具有通式(I)的聚氧化乙烯醚構成的疫苗制劑，其中n介于1和50之間，優選4-24，最優選9；R組分為C1-50，優選C4-C20烷基，最優選C12烷基，同時A為結合鍵。聚氧化乙烯醚的濃度應當在0.1-20％，優選在0.1-10％之間，最優選在0.1-1％的范圍內。優選聚氧化乙烯醚選自如下組聚氧化乙烯-9-月桂醚，聚氧化乙烯-9-硬酯醇(steoryl)醚，聚氧化乙烯-8-高醚，聚氧化乙烯-4-月桂醚，聚氧化乙烯-35-月桂醚，和聚氧化乙烯-23-月桂醚。聚氧化乙烯醚，如聚氧化乙烯月桂醚記載于Merck索引(12th版目錄7717)。這些佐劑分子記載于WO 99/52549中。如上文所述的具有通式(I)的聚氧化乙烯醚，理想的與其他佐劑聯合使用。例如，優選的佐劑組合物，更可取的與如待決英國專利申請GB9820956.2中所述的CpG聯合使用。
在本發明一實施例中，本發明的包括核酸載體的所述抗原與免疫刺激劑一起使用。優選的所述免疫刺激劑與本發明的抗原一起施用，并且在一優選實施例中，二者被配成制劑施用。在本發明的另一實施例中，所述的抗原和免疫刺激劑(或反之亦然)按先后順序施用至相同或鄰近的位點，其相隔0-100小時之間的間隔。這類免疫刺激劑包括，但不限于合成的咪唑喹啉，如咪喹莫特(imiquimod)[S-26308，R-837]，(Harrison等，Vaccine 191820-1826，2001)；和瑞西喹漠(resiquimod)[S-28463，R-848](Vasilakos等，Cellular immunology20464-74，2000)；在抗原呈遞細胞和T-細胞表面按組成表達的羰基席夫堿和胺，如妥卡雷瑣(tucaresol)(Rhodes，J.等，Nature 37771-75，1995)，細胞因子，化學活性因子和可為蛋白或肽的共刺激分子，其包括前炎細胞因子，如干擾素，GM-CSF，IL-1α，IL-1β，TGF-α，FGF-β，Th1誘導劑，如干擾素γ，IL-2，IL-12，IL-15，IL-18和IL-21，Th2誘導劑如，IL-4，IL-5，IL-6，IL-10和IL-13，以及其他的化學活性因子和共刺激基因，如MCP-1，MIP-1α，MIP-1β，RANTES，TCA-3，CD80，CD86和CD40L，其他免疫刺激靶配體，如CTLA-4和L-selectin，凋亡刺激蛋白和肽，如Fas，(49)，合成脂質佐劑，如vaxfectin(Reyes等，Vaccine 193778-3786，2001)，角鯊烯，α-生育酚，聚山梨醇酐脂肪酸酯80，DOPC和膽固醇，內毒素，[LPS]，(Beutler，B.，Current Opinion in Microbiology 323-30，2000)；CpG寡核苷酸和二核苷酸(Sato，Y.等，Science 273(5273)352-354，1996；Hemmi，H.etal.，Nature 408740-745，2000)和其他引發Toll受體產生Th1細胞因子的可能的配體，如合成的分枝桿菌脂蛋白，分枝桿菌蛋白p19，肽聚糖，磷壁酸和脂質A。
其他適當的佐劑包括CT(霍亂毒素，亞單位A和B)和LT(來源于E.coli的熱不穩定腸毒素亞單位A和B)，熱休克蛋白家族(H SPs)，和LLO(listeriolysin O；WO 01/72329)。
當免疫刺激劑為蛋白質時，該免疫刺激劑既可以蛋白形式，又可以編碼蛋白的多核苷酸的形式施用。
其他合適的傳遞系統包括微球體，其中抗原材料摻入或結合至生物可降解的聚合體/微球體上，從而抗原材料可與適當的藥物載體混合并且作為疫苗使用。術語“微球體”一般用于描述大體上呈球狀、并且具有10nm至2mm直徑的膠質顆粒。由各種天然和合成聚合體制備的微球體被發現廣泛的應用于生物醫藥應用領域。該傳遞系統特別適合那些在體內具有很短半衰期從而需要多次治療以達到效果，或者那些在生物液體中不穩定，或者那些由于其相對較高的分子量從而經腸胃途徑不能完全吸收的蛋白。許多聚合物被記載作為蛋白釋放的基質。合適的聚合物包括明膠，膠原，藻酸鹽，右旋糖酐。優選的傳遞系統包括生物可降解的聚合(DL-乳酸)(PLA)，聚乳酸-甘醇酸共聚物(PLG)，聚(甘醇酸)(PGA)，聚(ε-己內酯)(PCL)，和共聚物聚(DL-乳糖-共聚-甘醇酸)(PLGA)。其他優選的系統包括異源水凝膠，如聚(醚酯)多嵌段共聚物，其含有重復的嵌段親水的聚乙烯基乙二醇(PEG)和疏水的聚對苯二甲酸丁二醇酯(PBT)，或聚乙烯基乙二醇-對苯二酸酯/聚對苯二甲酸丁二醇酯(PEGT/PBT)(Sohier等Eur.J.Pharm and Biopharm，2003，55，221-228)。優選那些能持續釋放1至3個月的系統，如PLGA，PLA和PEGT/PBT。
免疫原性或疫苗組合物可一次性施用，或優選的按所需的次數進行重復施用，例如，1至7次，優選的1至4次，其間隔介于約1天至約18個月之間，優選1個月。可選的，可按照在病人的剩余生命階段在介于1到12個月的固定間隔內按劑量施用。在一優選實施例中，病人通過“基礎加強接種”方案接受不同形式的抗原。因此，例如，所述抗原，融合蛋白首先以蛋白佐劑制劑的形式施用，并隨后以DNA疫苗的形式施用。這種施用模式是優選的。優選的佐劑是含CpG寡核苷酸和皂甙衍生物的組合物，特別是如WO 00/09159和WO 00/62800中所述的CpG和QS21的組合物。通過將DNA包裹至能有效的轉移至細胞內的生物可降解珠粒表面，可增加裸露DNA的攝取。可選的，所述DNA可經粒子轟擊途徑來傳遞，例如，利用由如本文所述的PowderiectPharmaceutical PLC(Oxford，UK)和Powderject Vaccines Inc.(Madison，WI)公司生產的裝置，進行的氣體驅動的顆粒加速。該途徑提供了一種無需針的傳遞途徑，其中顯微顆粒的干粉制劑，如多核苷酸或多肽顆粒在手持裝置所產生的氦氣體噴射流中被加速至高速，其中氦氣推動顆粒到達感興趣的靶組織。
在另一優選實施例中，首先施用DNA疫苗，然后施用蛋白佐劑制劑。另一實施例涉及DNA構建體通過特定的傳遞載體的傳遞，優選的通過病毒系統的途徑，最優選通過腺病毒系統的途徑。其他DNA傳遞的合適的病毒系統包括逆轉錄病毒，慢病毒，腺相關病毒，皰疹病毒和痘苗病毒系統。
在另一優選實施例中，蛋白佐劑制劑和DNA疫苗可在鄰近或重疊的位點共同施用。根據DNA疫苗制劑的特性，這可通過在施用前混合DNA和蛋白佐劑制劑，或通過按順序施用DNA和蛋白佐劑制劑來實現。
根據涉及的病人的體積和種類、核酸疫苗的量和/或施用的蛋白組合物、施用途徑、所采用的任意佐劑化合物的效能和劑量、以及對于熟練的藥劑師來說非常顯而易見的其他因素的不同，所述的治療方法也將顯著變化。
進一步的方面，本發明提供了一種刺激病人產生免疫應答，優選在人類病人中產生T細胞免疫應答的方法，其包括施用如本文所述的藥物組合物。所述病人可能患有肺癌、結腸癌或結腸直腸癌或乳腺癌，在這種情況下，該方法提供了對疾病，或者對被認為具有患這類可進行預防性治療的疾病的風險的病人的治療。
進一步的方面，本發明提供抑制病人中的癌癥發展的方法，其包括對病人施用如上文所述的藥物組合物。所述病人可能患有，如肉瘤、前列腺癌、卵巢癌、膀胱癌、肺癌、結腸癌、結腸直腸癌或乳腺癌，在這種情況下，該方法提供了對疾病，或者對被認為具有患這類可進行預防性治療的疾病的風險的病人的治療。
另外的方面，本發明進一步提供了從生物樣品中除去腫瘤細胞的方法，其包括將生物樣品同與本發明的多肽發生特異性反應的T細胞接觸，其中所述的接觸步驟在允許將表達所述蛋白的細胞從樣品中除去的條件下和足夠的時間下進行。
在相關的方面，本發明提供了抑制病人的癌癥發展的方法，其包括對病人施用如上文所述進行處理的生物樣品。
在其他方面，本發明進一步提供了刺激和/或擴增本發明多肽特異性T細胞的方法，其包括在允許刺激和/或擴增T細胞的條件和足夠的時間下，將T細胞與一種或多種如下物質接觸(i)如上文所述的多肽；(ii)編碼所述多肽的多核苷酸；和/或(iii)表達這種多肽的抗原呈遞細胞。同時，本發明還提供了按照如上文所述方法制備的包括T細胞的T細胞類群。
在進一步的方面，本發明提供了抑制病人癌癥發展的方法，其包括對病人施用有效量的如上文所述的T細胞類群。
本發明進一步提供了抑制病人癌癥發展的方法，其包括如下步驟(a)將從病人中分離的CD4+和/或CD8+T細胞與一種或多種如下物質共培養(i)如本文所述的多肽；(ii)編碼所述多肽的多核苷酸；和(iii)表達這種多肽的抗原呈遞細胞；和(b)給病人施用有效量的增殖的T細胞，從而抑制了病人中的癌癥發展。在給病人施用前，增殖的細胞可以，但不是必須進行克隆。
根據本發明的另一實施例，本文所述的免疫原性組合物通過抗原呈遞細胞(APCs)，如樹突細胞、巨噬細胞、B細胞、單核細胞和可被工程改造成為有效的APCs的其他細胞，傳遞至宿主中。這類細胞可以，但不是必須的，經遺傳修飾以增加呈遞抗原的能力，從而提高和/或保持T細胞應答的活性，從而具有自身抗腫瘤效果和/或與受體具有免疫相容性(即匹配的HLA單體型)。APCs一般可從任何的各類生物液體和器官中分離，包括腫瘤和腫瘤周圍組織，并且可以是自體固有的、同種異體的、同源的或異源的細胞。
本發明的特定的優選實施例采用樹突細胞或其前體作為抗原呈遞細胞。樹突細胞是非常有效的APCs(Banchereau & Steinman，Nature392245-251，1998)，其顯示出是一種非常有效的生理佐劑用于引起預防性或治療性的抗腫瘤免疫(參見Timmerman & Levy，Ann.Rev.Med.50507-529，1999)。一般而言，可根據其典型形狀(通過體外標記細胞質方法(樹突)在原位呈星狀)，其高效攝取，處理和呈遞抗原的能力，和其活化未經抗原刺激的T細胞應答的能力來鑒定樹突細胞。毫無疑問，樹突細胞可經工程改造用于表達那些通常不存在于體內或體外樹突細胞中的特定細胞表面受體或配體，并且這種修飾的樹突細胞也由本發明構思得到。作為樹突細胞的一種選擇，可在疫苗中使用攜帶分泌泡抗原的樹突細胞(稱為外泌小體)(參見Zitvogel等，NatureMed.4594-600，1998)。
樹突細胞和前體可從外周血、骨髓、腫瘤浸潤細胞、腫瘤周圍組織浸潤細胞、淋巴結、脾臟、皮膚、臍帶血和任何其他合適的組織或體液中分離得到。例如，樹突細胞可通過向從外周血中收獲的單核細胞培養物中添加細胞因子的混合物，如GM-CSF，IL-4，IL-13和/或TNFα來分化得到。可選的，從外周血、臍帶血或骨髓中收獲的CD34陽性細胞可通過向培養物培養基中添加GM-CSF，IL-3，TNFα，CD40配體，LPS，flt3配體和/或其他誘導樹突細胞分化、成熟和增殖的化合物來分化成為樹突細胞。
樹突細胞可分為“不成熟”和“成熟”細胞，這允許通過一種簡單的方式來區分兩種特征明確的表型。不過，這種命名法則不應當被理解為排除了全部可能的分化中間狀態。免疫樹突細胞具有能很好的攝取和加工抗原的APC的特征，這與Fcγ受體和甘露糖受體的高水平表達相關。成熟類型典型地具有這些標記的較低水平表達，但引起T細胞活化的細胞表面分子，如MHC I和II類分子，粘附分子(例如，CD54和CD11)和協同刺激分子(例如，CD40，CD80和4-1BB)則高表達。
一般可采用本發明的多核苷酸(或其部分或其他變體)來轉染APCs，從而其編碼的多肽，或其免疫原性部分在細胞表面表達。這種轉染可在體外發生，并且包括這種轉染的細胞的藥物組合物可隨后用于治療目的，如本文所述的。可選的，靶向樹突或其他抗原呈遞細胞的基因傳遞載體可被施用至病人，導致在體內發生轉染。樹突細胞的體內和體外轉染，例如，一般可采用本發明已知的任何方法來進行，如那些記載于WO 97/24447中的方法，或者采用由Mahvi等，Imnunology and cell Biology 75456-460，1997中記載的基因槍途徑。通過將樹突細胞或其前體細胞與腫瘤多肽、DNA(裸露的或存在質粒載體中的)或RNA；或與抗原表達重組細菌或病毒(如痘苗病毒、禽痘病毒、腺病毒或慢病毒載體)一起培養，可使樹突細胞攜帶抗原。在攜帶前，所述的多肽可與提供T細胞輔助(例如，載體分子)的免疫伴侶共價結合。可選的，樹突細胞可與非結合的免疫伴侶，單獨的或在多肽存在的情況下進行脈沖電擊。
定義本發明還提供了用于分析特征序列或序列串，尤其是基因序列或編碼的蛋白序列的方法。優選的序列分析方法包括，例如，序列同一性分析方法，如同一性和類似性分析，DNA、RNA和蛋白結構分析，序列組合，支序分析，序列基元分析，開放閱讀框確定，核酸堿基確定，密碼子使用分析，核酸堿基微調，和序列色譜峰分析。
提供了一種基于計算機的方法來進行同一性確定。該方法包括如下步驟以計算機可讀形式提供包括本發明的多核苷酸序列的第一多核苷酸序列；和將所述的第一多核苷酸序列與至少一條第二多核苷酸或多肽序列來比較以確定同一性。還提供了一種基于計算機的方法來進行同一性確定，所述方法包括如下步驟以計算機可讀形式提供包括本發明的多核苷酸序列的第一多核苷酸；和將所述的第一多核苷酸序列與至少一種第二多核苷酸和多肽序列來比較以確定同一性。
“同一性”，如本領域所知的那樣，視情況而定，為通過序列比較確定的，兩個或多個多肽序列或兩個或多個多核苷酸序列之間的關系。在本領域中，“同一性”視情況而定，還表示通過所述序列串間比較來確定的多肽或多核苷酸序列間的序列相關程度。“同一性”可很容易的通過已知方法來計算得到，所述方法包括，但不僅限于那些在Computational Molecular Biology，Lesk，A.M.，ed.，OxfordUniversity Press，New York，1988；BiocomputingInformatics andGenome Projects，Smith，D.W.，ed.，Academic Press，New York，1993；Computer Analysis of Sequence Data，Part I，Griffin，A.M.，& Griffin，H.G.，eds.，Humana Press，New Jersey，1994；SequenceAnalvsis in Molecular Biology，von Heine，G.，Academic Press，1987；和Sequence Analysis Primer，Gribskov，M.& Devereux，J.，eds.，M Stockton Press，New York，1991；和Carillo，H.，and Lipman，D.，SIAMJ.Applied Math.，481073(1988)中所述的方法。確定同一性的方法被設計在測試的序列間產生最大程度的配對。此外，在公眾可獲得的計算機程序中編寫確定同一性的方法。用于確定兩序列間同一性的計算機程序方法包括，但不限于GCG程序軟件包中的GAP程序(Devereux，J.，等，Nucleic Acids Research12(1)387(1984))，BLASTP，BLASTN(Altschul，S.F.等，J.Molec.Biol.215403-410(1990)，和FASTA(Pearson & Lipman Proc.Natl.Acad.Sci.USA 85；2444-2448(1988)。公眾可從NCBI和其他來源獲得BLAST類程序(BLAST Manual，Altschul，S.，等，NCBI NLM NIH Bethesda，MD 20894；Altschul，S.，等，J.Mol.Biol.215403-410(1990))。著名的Smith Waterman算法也可被用于確定同一性。
多肽序列比較的參數包括如下算法Needleman & Wunsch，J.Mol Biol.48443-453(1970)比較矩陣來源于Henikoff和Henikoff的BLOSSUM62，Proc.Natl.Acad.Sci.USA.8910915-10919(1992)空位罰分8空位長度罰分2采用這類參數的程序為一種公眾可獲得的、來源于GeneticsComputer Group，Madison WI的“gap”程序。上述參數為肽序列比較的缺省參數(同時末端空位不罰分)。
多核苷酸比較參數包括如下算法Needleman & Wunsch，J.Mol Biol.48443-453(1970)比較矩陣配對＝+10，錯配＝0空位罰分50空位長度罰分3可獲得于來源于Genetics Computer Group，MadisonWl的“gap”程序。這些為核酸比較的缺省參數。
多核苷酸和多肽的“同一性”的優選含義，視情況而定，如下文(1)和(2)所述。
(1)多核苷酸實施方案進一步包括分離的多核苷酸，所述的多核苷酸包含的多核苷酸序列與SEQ ID NO9至SEQ ID NO16參考序列中的任意一種具有至少50，60，70，80，85，90，95，97或100％的同一性，其中所述多核苷酸序列可與SEQ ID NO9至SEQ ID NO16參考序列中的任意一種完全相同，或與參考序列相比可包括一定整數目的核酸變更，其中所述的變更選自如下組至少一個核苷酸的缺失、取代，包括轉換和顛換，或插入，并且所述的變更可發生在參考核酸序列的5’或3’末端，或在這些末端位置中的任意位置，其既可單獨分布在參考序列中的核苷酸之間，又可在參考序列中的一個或多個連續的基團之間分布，并且所述的核苷酸變更的數目由SEQ ID NO9至SEQ ID NO16任意序列中的總核苷酸數目乘以同一性百分比中的整數值并除以100，并從所述SEQ ID NO9至SEQ ID NO16任意序列核酸總數目中減去該乘積，或nn≤xn-(xn·y)其中nn為核苷酸變更的數目，xn為SEQ ID NO9至SEQ ID NO16任意序列中核苷酸的總數，y為表示50％的0.50，表示60％的0.60，表示70％的0.70，表示80％的0.80，表示85％的0.85，表示90％的0.90，表示95％的0.95，表示97％的0.97，或表示100％的1.00，并且·表示乘號，并且在被從xn中減去之前，xn和y的非整數乘積被下舍入最接近的整數。編碼SEQ ID NO1至SEQ ID NO8的任意多肽的多核苷酸序列變更可能在編碼序列中產生無義、錯義或讀框移碼突變，從而改變由如下的變更多核苷酸編碼的多肽。
舉例來說，本發明的多核苷酸序列可與SEQ ID NO9至SEQ IDNO16中的任意參考序列一致，即可以是100％的一致，或其可能包括與參考序列相比，一定整數目的核酸變更，從而同一性百分比小于100％。所述的變更選自如下組至少一個核苷酸的缺失、取代，包括轉換和顛換，或插入，并且所述的變更可發生在參考多核苷酸序列的5’或3’末端，或在這些末端位置之間的任意位置，其既可單獨分布在參考序列中的核苷酸之間，又可在參考序列中的一個或多個連續的基團之中分布。特定百分比同一性的核酸變更的數目由SEQ ID NO9至SEQ ID NO16任意序列中的總核酸數目乘以同一性百分比中的整數值并除以100，并從所述SEQ ID NO9至SEQ ID NO16任意序列核酸總數中減去該乘積，或nn≤xn-(xn·y)其中nn為核苷酸變更的數目，xn為SEQ ID NO9至SEQ ID NO16任意序列中核苷酸的總數，例如，y為表示70％的0.70，表示80％的0.80，表示85％的0.85等，并且·表示乘號，并且在被從xn中減去之前，xn和y的非整數乘積被下舍入最接近的整數。
(2)多肽實施例進一步包括分離的多肽，所述分離的多肽包括與SEQ ID NO1至SEQ ID NO8任意參考序列的多肽具有至少50，60，70，80，85，90，95，97或100％同一性的多肽，其中所述多肽序列可與SEQ ID NO1至SEQ ID NO8參考序列中的任意一種完全相同，或與參考序列相比可包括一定整數目的氨基酸變更，其中所述的變更選自如下組至少一個氨基酸的缺失、取代，包括保守和非保守的取代，或插入，并且所述的變更可發生在參考多肽序列的氨基或羧基末端的位置，或在這些末端位置之間的任意位置，其既可單獨分布在參考序列中的多肽之間，又可在參考序列中的一個或多個連續的基團之中分布，并且所述的氨基酸變更的數目由SEQ ID NO1至SEQ IDNO8任意序列中的總氨基酸數目乘以同一性百分比中的整數值并除以100，并從所述SEQ ID NO1至SEQ ID NO8任意序列氨基酸總數目中減去該乘積，或na≤xa-(xa·y)其中na為氨基酸變更的數目，xa為SEQ ID NO2中氨基酸總數，y為表示50％的0.50，表示60％的0.60，表示70％的0.70，表示80％的0.80，表示85％的0.85，表示90％的0.90，表示95％的0.95，表示97％的0.97，或表示100％的1.00，并且·表示乘號，并且在被從xa中減去之前，xa和y的任何非整數乘積被下舍入最接近的整數。
舉例來說，本發明的多肽序列可與SEQ ID NO1至SEQ ID NO8中的任意參考序列一致，即可以是100％的一致，或其可能包括與參考序列相比，一定整數目的氨基酸變更，從而同一性百分比小于100％。所述的變更選自如下組至少一個氨基酸的缺失、取代，包括保守和非保守的取代，或插入，并且所述的變更可發生在參考多肽序列的氨基或羧基末端，或在這些末端位置之間的任意位置，其既可單獨的在參考序列中的氨基酸之間，又可在參考序列中的一個或多個連續的基團之中分布。一特定％同一性的氨基酸變更的數目由SEQ ID NO1至SEQ ID NO8任意序列中的總氨基酸數目乘以同一性百分比中的整數值并除以100，并從所述SEQ ID NO1至SEQ ID NO8任意序列氨基酸總數中減去該乘積，或na≤xa-(xa·y)其中na為氨基酸變更的數目，xa為SEQ ID NO1至SEQ ID NO8任意序列中氨基酸的總數，例如，y為表示70％的0.70，表示80％的0.80，表示85％的0.85等，并且·表示乘號，并且在被從xa中減去之前，xa和y的非整數乘積被下舍入最接近的整數。
附圖簡述圖1C-LytA的序列信息。采用如下序列對比程序，在基于多個序列對比和第二結構預測的基礎上可定義每一重復序列1)MatchBox(Depiereux E等(1992)Comput Applic Biosci 8501-9)；2)ClustalW(Thompson JD等(1994)Nucl Acid Res 224673-80)；3)Block-Maker(Henikoff S等(1995)Gene 163gc17-26)圖2CPC和天然構建體(SEQ ID NOs.27-36)
圖3在釀酒酵母(S.cerevisiae)中表達的CPC-p501 His融合蛋白的圖解結構圖4CPC-P501 His融合蛋白(SEQ ID NO.41)的一級結構圖5CPC P501 His(pRIT15201)(SEQ ID NO.42)的核苷酸序列圖6質粒pRIT 15201的生產的克隆策略圖7pRIT15201的質粒圖譜圖8CPC P501和P501在釀酒酵母(S.cerevisiae)菌株DC5中的比較表達圖9CPC-P501S HIS(Y1796)的小規模生產。圖9A表示了通過SDS-PAGE及銀染估計的抗原生產率；圖9B表示了通過western blot估計的抗原產率。
圖10Y1796產生的CPC-P501-His的純化方案。
圖11CPC P501 His純化蛋白的電泳圖譜(4-12％的Novex Nu-Page聚丙烯酰胺預制凝膠)。
圖12天然全長P501S序列(SEQ ID NO17)。
圖13JNW735的CPC-P501S表達盒序列(SEQ ID NO18)。
圖14兩個密碼子優化的P501S序列(SEQID NO19-20)。
圖15再工程化的密碼子優化序列19(SEQ ID NO21)。
圖16再工程化的密碼子優化序列20(SEQ ID NO22)。
圖17CPC優化的起始序列(SEQ ID NO23)。
圖18代表密碼子優化的CPC序列(SEQ ID NO24-25)。
圖19改造的CPC密碼子優化序列(SEQ ID NO26)。
圖20P501S CPC融合候選構建體和序列(SEQ ID NOs.37-40&45-48)。
圖21當采用P501S(JNW680)，CPC-P501S(JNW735)，對照空載體瞬時轉染后，進行的CHO細胞Western blot分析。
圖22當在第0，21，和42天采用pVAC-P501S(JNW680，小鼠B1-9)或空載體(pVAC，小鼠A1-6)進行免疫后，抗P501S抗體的應答。在一1天進行預先放血。隨后在第28天和第49天(鼠A1-3，B1-3)和第56天(鼠A4-6，B4-9)進行放血。所有的血清在1/100稀釋后進行檢測。將pVAC免疫小鼠的結果進行平均。個體pVAC-P501S免疫小鼠的結果列于圖表中。作為陽性對照，來源于腺-P501S免疫小鼠的血清(Corixa Corp，稀釋1/100)也包括在內。
圖23采用在第0，21，42，和70天通過pVAC-P501S(JNW680)免疫的C57BL/6小鼠進行肽文庫篩選。所有的肽均在50μg/ml的終濃度下使用。購于Corixa的肽1-50重疊15-20鏈節。從Mimotopes(UK)定購的肽51-70預測8-9鏈節Kb和Db表位。樣品71-72和73-78分別為DMSO對照和無肽對照。圖A表示IFN-γ應答，而圖B表示IL-2應答。被選擇用于隨后的免疫分析的肽以黑色表示。
圖24在第0，21，42，和70天采用pVAC-P501S(JNW680，B6-9)和pVAC空(A4-6)進行PMID免疫后在第77天通過ELISPOT測定的細胞應答。肽18，22，和48以50μg/ml的濃度使用。CPC-P501S蛋白在20μg/ml的濃度下使用。圖A表示IFN-γ應答，而圖B表示IL-2應答。
圖25P501S和CPC-P501S的比較。采用肽22(10μg/ml)在第28天通過IL-2 ELISPOT來檢測細胞應答。通過PMID在第0和21天，采用pVAC空載體(對照)，pVAC-P501S(JNW680)和CPC-P501S(JNW735)來免疫小鼠。
圖26當采用CPC-P501S進行蛋白免疫后的免疫應答(脾細胞淋巴增殖)。
圖27對不同CPC-P501S構建體的免疫應答評價。通過IL-2ELISPOT在第28天檢測細胞應答。通過PMID在第0，和21天采用p7313-即空載體(對照)，JNW735和CPC-P501S構建體(JNW770，771和773)來免疫小鼠。
圖28MUC-1 CPC序列(SEQ ID NOs.49&50)圖29ss-CPC-MUC-1序列(SEQ ID NOs.51&52)通過參考如下實施例，將進一步詳述本發明實施例1表達含有C-LytA-P2-C-LYtA(CPC)作為融合伴侶的P501融合蛋白的重組酵母菌株Y1796的制備1.-蛋白設計圖3中描述了在釀酒酵母中表達的融合蛋白C-P2-C-p501(還可稱為CPC-P501)的結構。該融合蛋白含有基因LytA(殘基187至306)的C-末端區域，其中破傷風毒素的P2片段(殘基830-843)被插入。P2片段被置于C-Lyt-A的277和278殘基之間。含有P2插入的C-lytA片段之后為P501(氨基酸殘基51至553)和His尾結構。
獲得的融合蛋白的一級結構具有如圖4所述的序列，并且相應于上述蛋白設計的編碼序列如圖5所示。
2.-生產表達CPC-P501(51-553)-His融合蛋白的酵母質粒的克隆策略●起始材料為酵母載體pRIT15068(UK專利申請0015619.0)。
●該載體含有酵母Cup1啟動子，酵母α前原信號編碼序列和相應于P501S的55至553殘基的編碼序列之后為His尾結構。
●圖6所概述的克隆策略包括如下步驟a)第一步為P2序列(已進行酵母表達的密碼子優化)按閱讀框插入C-lytA編碼序列內部。質粒pRIT 14662(PCT/EP99/00660)攜帶C-lytA編碼序列。用由兩個命名為P21和P22的互補寡核苷酸形成的適配子插入預先采用Ncol酶切切開的質粒pRIT 14662。
P21和P22的序列為P21 5′catgcaatacatcaaggctaactctaagttcattggtatcactgaaggcgt 3′P22 3′gttatgtagttccgattgagattcaagtaaccatagtgacttccgcagtac 5′在連接和E.coli轉化和轉化子鑒定后，即獲得了命名為pRIT15199的質粒。
b)第二步為通過PCR擴增來制備C-lytA-P2-C-lytA DNA片段。采用pRIT15199作為模板進行擴增，并且所述寡核苷酸命名為C-LytANOTATG和C-LytA-aa55。兩個寡核苷酸的序列為C-LytANOTATG＝5′aaaaccatggcggccgcttacgtacattccgacggctcttatccaaaagacaag 3′C-LytA-aa55＝5′aaacatgtacatgaacttttctggcctgtctgccagtgttc 3′采用限制性內切酶Ncol和AflIII來處理擴增的片段并分別產生粘性末端。
c)下一步為將上述片段與載體pRIT15068(經Ncol處理后的最大片段)連接，從而產生完全融合蛋白的編碼序列。在連接和E.coli轉化后，獲得了命名為pRIT15200的質粒。在該質粒中，剩下的唯一Ncol位點含有ATG用作起始密碼子。
d)在下一步驟中，從質粒PRIT 15202中制備含有CUP1啟動子的Ncol片段和2μ質粒序列的一部分。質粒pRIT 15202為一含有在ATG處有Ncol位點(ATG序列AAACC ATG)的CUP1啟動子的酵母2μ衍生物。
e)將從pRIT 15202中分離的Ncol片段按照正確的方向與預先采用Ncol酶切切開的pRIT15200連接，在這種方式中pCUP1啟動子在編碼序列的5’端。這導致了命名為pRIT15201的最終表達載體的產生(參見圖7)。
3.-重組酵母菌株Y1796(RIX4440)的制備質粒pRIT 15201用于轉化釀酒酵母(S.cerevisiae)菌株DC5(ATCC 20820)。在含有質粒pRIT 15201的酵母轉化子篩選和鑒定后，獲得了命名為Y1796的表達CPC-P501-His融合蛋白的重組酵母菌株。通過親和層析(IMAC)和隨后的陰離子交換層析(Q SepharoseFF)，可分離和純化得到經還原和羧基酰胺化的蛋白。
實施例II利用其中描述的相應的DNA序列，可表達如圖2所示的類似的蛋白構建體。特別是，酵母菌株SC333(構建體2)相應于Y1796菌株，但是表達缺乏CPC融合伴侶的P50155-553。酵母菌株Y1800(構建體3)相應于Y1796菌株，但是還包括P501S(aa1-aa34)的天然序列信號，而酵母菌株Y1802(構建體4)包括α前信號序列上游CPC-P501S序列。酵母菌株Y1790(構建體5)表達缺乏CPC并具有α前原信號序列的P501S構建體。
實施例III純化CPC-P501的制備1.-CPC-P501S HIS(Y1796)的小規模生產對于Y1796，在添加有組氨酸的基本培養基中，可通過在對數期添加100至500μM范圍的CuSO4，并在30℃保持培養的條件下誘導表達。在誘導后8或24小時后收獲細胞。僅在使用前加入銅，并且其不能事先與培養基混合。
為了進行SDS PAGE分析，在檸檬酸磷酸鹽緩沖液pH4.0+130mM NaCl中進行酵母細胞提取。采用玻璃珠進行小細胞量的提取，采用高壓細胞均質機(French press)進行較大細胞量的提取，并隨后與樣品緩沖液混合并進行SDS-PAGE分析。圖8中描述了不同構建體的SDS PAGE比較分析結果，并將其總結于下表2中。
如下表表1所示，與表達相應的不含CPC伴侶P501S-His的親本菌株SC333的表達水平相比，Y1796菌株的培養物的表達水平更高。同樣的，信號序列(α前體)的存在也不影響上述討論的結果與表達相應的不含CPC伴侶P501S-His的菌株Y1790的表達水平相比，Y1802菌株的培養物的表達水平更高。
表2
CPC＝clyta P2 clytaND＝即使采用western blot也無法檢測到+＝采用western blot可檢測到+++/++++＝采用western blot可檢測到，并且在銀染色凝膠中肉眼可見2.-Y1796(RIX4440)的大規模發酵將100μl的工作種子接種于固體培養基上，并在30℃下培養約24小時。該固體預培養物隨后被用于接種置于搖動燒瓶中的液體預培養基中。
該液體預培養物在30℃下培養20小時，然后轉移至20L的發酵罐中。連續分批式發酵包括約44小時的生長期和約22小時的誘導期。
通過連續添加的方式將碳源(葡萄糖)補充至培養物中。為了使發酵產生的乙醇的量最小化，使殘留的葡萄糖濃度保持較低水平(≤50mg/L)。這可通過限制葡萄糖添加速率從而限制微生物的增殖來實現。
為了生產抗原，在生長期的末尾，通過添加CuSO4來誘導CUP1啟動子。
通過將106細胞接種至添加有制霉菌素的標準TSB和THI小瓶中，并分別在20-25℃和30-35℃下培養14天來檢測污染物的去除。如所預計的那樣，沒有觀察到細菌生長。
3.-抗原鑒定和生產利用高壓細胞均質機(French press)處理在誘導期的不同時間收獲的發酵樣品來制備細胞勻漿，并通過SDS-PAGE和Western Blot來進行分析。結果顯示，感興趣的蛋白的主要部分定位于來源于離心后的細胞勻漿的不溶部分。采用來源于這些細胞勻漿離心后的沉淀來進行如下圖中顯示的SDS-PAGE和Western Blot分析。
圖8A和B顯示了培養物PRO127在誘導期的抗原產生的動力學曲線。其顯示在生長期，沒有抗原表達發生。特異性抗原的產生大致在誘導期開始至第6小時持續增加，并隨后保持穩定直至誘導期結束。但是，由于在該相同時間段觀察到生物量積累，其體積產量以1.5到2的系數增加。通過比較純化的參考抗原和原始提取物在采用銀染(圖9A)的SDS-PAGE中的結果和利用抗-P501S抗體(一種在1/1000倍稀釋下使用的，直接抗P501S aa439-aa459的小鼠腹水)進行的WB分析結果，可估計抗原產生率約為500mg每升發酵培養基。
實施例IV由Y1796產生的CPC-P501(51-553)-His融合蛋白的純化當細胞破裂后，所述蛋白與顆粒部分結合。在該過程中，為了解決分子之間或分子與宿主細胞蛋白污染物通過二硫鍵共價橋接發生氧化聚集的問題，可在處理中引入分子脲基甲基化作用。同時，為了保持該蛋白的疏水特性(預測存在12個穿膜結構域)，還需要使用去垢劑。
用于1L培養物OD(光密度)120規模的純化方案記載于圖10中。所有的操作均在室溫下進行(RT)。
根據DOC TCA BCA蛋白檢測，普遍的純化產量為30-70mg純化的抗原/L培養物OD 120。該產量與培養物表達水平相關，同時，當與表達未融合的P501S-His的親本菌株的純化產量相比時，其產量更高。
按如下步驟進行蛋白分析首先采用TCA(三氯乙酸)在DOC(脫氧膽酸)存在的條件下沉淀蛋白，然后在SDS存在的條件下將其溶于堿性介質中。然后蛋白與BCA(雙金雞納酸)(Pierce)反應，從而形成一可溶的紫色絡合物，其在562nm下有高吸收值，并且所述絡合物與樣品中存在的蛋白的量成比例。
在還原和非還原條件下，3份純化的SDS-PAGE分析(圖11)顯示沒有區別(將2，3，4道與5，6，7相比較)。電泳圖譜由位于70kDa的主帶，模糊的更高MW的微弱的降解帶組成。所有的帶均通過特異性抗P501 S的單克隆抗體來檢測。
實施例V采用CPC-P501S His蛋白來制備疫苗實施例3或4中的蛋白可被配制成呈水油乳劑形式的含QS21和3D-MPL的疫苗。
1.-疫苗制備按照實施例1-3的方法制備抗原C-LytA-P2-P501S His。作為佐劑，所述制劑包括呈油/水乳劑形式的3去氧酰化單磷酰脂A(3D-MPL)和QS21。在WO 95/17210中記載了佐劑系統SBAS2。
3D-MPL是一種來源于革蘭氏陰性細菌明尼蘇達沙門氏菌(Salmonella minnesota)脂多糖(LPS)的免疫刺激劑。MPL被去酰化，并在脂質A部分缺失磷酸基團。該化學處理顯著降低了毒性并保持了其免疫刺激性(Ribi，1986)。Ribi lmmunochemistry生產并且向SB-Biologicals提供MPL。在Smith Kline Beecham Biologicals進行的實驗顯示與各種賦形劑結合的3D-MPL顯著的增強了體液和TH1型的細胞免疫。
QS21是一種從南美洲樹木Quillaja saponaria Molina皂樹樹皮中提取的皂甙分子。純化技術被發展用于從樹皮粗提物中分離皂甙單體，該技術允許分離特定的皂甙，QS21，這是一種與親本化合物相比顯示出較強佐劑活性和較低毒性的三萜糖苷。QS21顯示出對一些亞單位抗原的MHC I類限制性CTL的活化，以及刺激Ag特異性淋巴細胞增殖(Kensil，1992)。Aquila(正式名稱為Cambridge BiotechCorporation)生產和向SB-Biologicals提供QS21。在Smith KlineBeecham Biologicals進行的實驗顯示在體液和TH1型細胞免疫應答的誘導中MPL和QS21的聯合使用具有明確的協同效應。
水/油乳劑包括由2種油(生育酚和角鯊烯)制成的有機相，和含Tween 80作為乳化劑的PBS的水相。所述的乳劑含有5％角鯊烯、5％生育酚、0.4％Tween 80，并且還包括平均顆粒大小為180nm并被稱為SB62的物質(參見WO 95/17210)。
在SmithKline Beecham Biologicals進行的實驗證實這種O/W乳劑向3D-MPL/QS21(SBAS2)中的添加可進一步增加后者抗各種亞單位抗原的免疫刺激性。
2.-乳劑SB62的制備(2倍濃縮物)將Tween 80溶于磷酸緩沖鹽溶液(PBS)中從而獲得在PBS中的2％的溶液。為了制備100ml的2倍濃縮液，5g的DLα生育酚和5ml的角鯊烯被加入，并振蕩從而徹底混合。將得到的乳劑通過一注射器，并最終采用M110S微流體機使其微流體化。獲得的油滴具有約180nm的大小。
3.-制劑一種呈油/水乳劑形式，并含有3D-MPL和QS21的典型制劑采用如下步驟制備在連續的加入SB62(50μl)，MPL(20μg)，QS21(20μg)后，將20μg-25μg C-LytA P2-P501S稀釋于10倍濃縮的PBS pH6.8和水中，可選的包括CpG寡核苷酸(100μg)和1μg/ml作為防腐劑的柳硫汞。每一組分的量可根據需要改變。所有的誘導在室溫下攪拌進行。
實施例VI.密碼子優化的P501S序列1.-對照重組質粒的生產將全長P501S序列克隆至pVAC(Thomsen，Immunology，1998；95510P105)，產生表達質粒JNW680。SEQ ID NO17表示質粒JNW680中的人P501S表達盒，其結構示于圖12中。SEQ ID NO17的蛋白序列以單字母的形式表示，其起始和終止密碼子以粗體顯示。Kozak序列以混雜符號表示。人P501S序列(SEQ ID NO17)的密碼子使用指數為0.618，其通過SynGene程序來計算。
SynGene程序基本上，密碼子通過統計方法來賦值，從而使合成基因具有接近于在高效表達的E.coli中和人基因中天然發現的密碼子頻率。
SynGene是被稱作Calcgene的Visual Basic的更新版，其由R.S.Hale和G Thompson編寫(Protein Expression and Purification Vol.12pp.185-188(1998)。對于原始序列中的每一氨基酸殘基，根據其出現在高效表達的E.coli基因中的頻率來賦值密碼子。從作者處可獲得在Microsoft Windows 3.1環境下運行的Calcgene程序的詳細信息。由于該程序采用統計方法來賦值合成基因的密碼子，因此不是所有的獲得的密碼子都是在目標有機體中最常用的。而是，通過在適當的比例中賦值密碼子來在合成序列中反映靶有機體的常用和不常用密碼子。不過，由于在將一特定密碼子賦值于序列中的特定位置方面沒有嚴格而牢固的規則，因此每次運行該程序時將產生一種不同的合成基因，雖然每次均具有相同的密碼子使用模式，并且每次都編碼相同的氨基酸序列。如果針對特定的氨基酸序列和特定的靶有機體來多次運行該程序，將產生許多不同的核酸序列，這些序列在數目、類型和限制性內切酶位點的位置、內含子結合信號等方面將不同，其中某些序列是不理想的。本領域的熟練技術人員在這些特征的基礎上能選擇適當的序列用于表達多肽。
此外，由于密碼子在統計基礎上隨機賦值，因此可能出現(雖然也許不太可能)兩個或多個在靶有機體中相對較少使用的密碼子聚集在相近的位置上。可以認為這種聚集將可能妨礙轉錄機制，并特別導致較低的表達率，從而為了避免稀有密碼子偶然的選擇發生聚集，在優化基因中選擇密碼子的算法將排除那些對于高效表達基因來說RSCU值小于0.2的任何密碼子。然后，根據高效表達的E.coli的頻率來分配剩下的密碼子的分布，從而在典型的這類基因(系數＝0.85)和高效表達的人基因(系數＝0.50)的合成基因中整體分布。
Syngene(Peter Ertl，未發布)，Calcgene程序的更新版，允許排除優選的稀有密碼子，并且也根據高效表達的人基因的密碼子頻率模式來用于分配密碼子。
從載體pRIT15201(參見圖7)中將CPC-P501S表達盒序列克隆至pVAC中，從而產生質粒JNW735，其序列示于SEQ ID NO18，且如圖13所示。除了除去了His尾結構和添加Kozak序列(GCCACC)和適當的限制性內切酶位點外，該序列與pRIT15201序列完全一致。SEQ ID NO18的氨基酸序列以單字母形式表示，起始和終止密碼子以粗體表示。方框標明的殘基為破傷風毒素的P2輔助表位。下劃線的殘基為Clyta純化標簽。Kozak序列采用混雜符號標明。
2.-具有P501S密碼子優化序列的重組質粒的產生雖然P501S的天然序列的密碼子系數指數(CI)已經很高(0.618)，但還可進一步增加CI值。這將具有兩種潛在的優點提高抗原表達和/或免疫原性并且減少P501S載體和基因組序列的重組可能性。
采用Syngene程序，獲得了密碼子優化的序列(SEQ ID NO19至SEQ ID NO20)(圖14)。下表3顯示了起始P501S序列與兩個典型的密碼子優化序列的密碼子系數指數的比較結果，所述的優化序列是基于合適的限制性內切酶位點圖譜和好的CI指數的基礎上篩選得到的。
表3-兩個密碼子優化P501S基因的密碼子系數指數比較
3.密碼子優化序列的進一步評價序列SEQ ID NO19雖然SEQ ID NO19具有好的CI指數(0.725)，但是在氨基酸位置202和203上其含有成對的稀有密碼子。通過將DNA序列從TTGTTG改為CTGCTG，這些密碼子被人工替換為更常用的密碼子。為了有助于克隆和表達，添加了限制性酶切位點和Kozak序列。最終改造的序列(SEQ ID NO21)示于圖15中。Syngene程序用于將該序列片段化成為具有最小重疊為19-20堿基的寡核苷酸。因此，圖15顯示了重新工程改造的P501S密碼子優化序列SEQ ID NO.19。用下劃線標明了限制性內切酶酶切位點，用粗體表示Kozak序列，除去稀有密碼子成對物的重新工程改造的DNA序列被用方框標出。
采用兩步PCR方法，利用PCR合成方法(如下詳述)，首先采用由Syngene程序產生的重疊引物進行合成。合成反應產生各種不同的片段。采用PCR回收方法和末端引物來回收/擴增正確的全長片段。從瓊脂糖凝膠中切下得到的PCR片段，進行純化，采用Nhel和Xhol進行限制性酶切，并克隆至pVAC中。采用限制性內切酶分析鑒定陽性克隆子，并通過雙鏈測序來驗證。這將產生質粒JNW766，該質粒由于PCR過程的出錯傾向的性質，含有一單個沉默突變(在SEQ IDNO21的360位置上C突變為T)。
1.合成反應-PCR條件，通用方法反應混合物(總體積＝50μl)-1×反應緩沖液(Pfx或Proofstart)-1μl寡核苷酸(所有重疊的寡核苷酸等量混合)-0.5mM dNTPs-DNA聚合酶(Pfx或Proofstart，2.5-5U)-+/-1mM MgSO4-+/-1×增強溶液(Pfx增強劑或Proofstart緩沖液Q)1. 94℃，120秒(僅Proofstart應用)2. 94℃，30秒3. 40℃，120秒4. 72℃，10秒5. 94℃，15秒6. 40℃，30秒7. 72℃，20秒+3秒/循環8.循環至步驟5，25次9.在4℃保持2.回收反應-PCR條件(通用方法)反應混合物(總體積＝50μl)-1×反應緩沖液(Pfx或Proofstart)-5-10μl合成反應混合物-0.3-0.75mM dNTPs-50pmol引物(5’末端引物，有義方向)-50pmol引物(3’末端引物，反義方向)-DNA聚合酶(Pfx或Proofstart，2.5-5U)-+/-1mM MgSO4-+/-1×增強溶液(Pfx增強劑或Proofstart緩沖液Q)1. 94℃，120秒(僅Proofstart應用)
2. 94℃，45秒3. 60℃，30秒4. 72℃，120秒5.循環至步驟2，25次6. 72℃，240秒7.在4℃保持序列SEQ ID NO20雖然SEQ ID NO20具有非常好的CI指數(0.755)，但是可注意到在氨基酸位置131和132上其含有成對的稀有密碼子。通過將DNA序列從TTGTTG改為CTGCTG，這些密碼子被人工替換為更常用的密碼子。為了有助于克隆，通過突變G至C，可將一內部的BamHI位點除去(參見圖16中的雙下劃線核苷酸)。為了有助于克隆和表達，添加了限制性酶切位點和Kozak序列。最終改造的序列(SEQ IDNO22)示于圖16中。Syngene程序用于將該序列片段化成為具有最小重疊為19-20堿基的寡核苷酸。
因此，圖16顯示了重新工程改造的P501S密碼子優化序列20(SEQID NO.22)。用下劃線標明了限制性內切酶酶切位點，用粗體表示Kozak序列，除去稀有密碼子成對物的重新工程改造的DNA序列被用方框標出，并用雙下劃線標明了除去BamHI位點的沉默點突變的位置。
采用與上文所述的類似兩步PCR方法，可擴增全長P501S片段并克隆至pVAC。采用限制性內切酶分析鑒定陽性克隆，并通過雙鏈測序來驗證。這將產生質粒JNW764，編碼表達盒的P501S的序列示于圖16中(SEQ ID NO22)。
DNA序列相似性通過ClustalV(加權的)方法進行的成對距離隨后序列比較(Pairdistances following alignment)示于下表3中。下表4顯示了起始人P501S序列和選擇的用于進一步研究的兩條密碼子優化序列SEQ IDNO21和22之間的百分比相似性。該數據證實密碼子優化的DNA序列與原始P501S序列具有約80％的相似性。
表4
實施例VII.密碼子優化CPC序列1.-獲得途徑由于原始CPC序列最初設計用于優化在酵母中的表達，本部分記載了用于在人中表達的密碼子優化過程。
2.-序列設計用于優化CPC的起始序列示于圖17中(SEQ ID NO23)。其完全來源于pRIT15201，其含有CPC的完整編碼序列加上P501 S的四個氨基酸從而有助于下游克隆。采用Syngene程序得到了一種密碼子優化序列的選擇，其中典型序列示于圖18中(SEQ ID NO24-25)。下表5顯示了起始CPC序列和兩條典型密碼子優化序列的密碼子系數指數的比較結果。
表5.兩條CPC優化序列的密碼子系數指數
除了密碼子優化外，還篩選了所有序列的限制性酶切克隆位點。在最高CI值和最佳限制性酶切位點圖譜的基礎上，篩選得到SEQ IDNO24用于構建。為了有助于克隆和表達，添加了5’和3’克隆位點，并在初始ATG起始密碼子的5’端插入Kozak序列(GCCACC)。這種工程改造的序列如圖19所示(SEQ ID NO26)。該序列包括P501S的4個氨基酸(用方框標明)，限制性酶切克隆位點(Nhel和Xhol，下劃線標明)，Kozak序列(粗體)，終止密碼子(斜體表示)和4bp的側接無關DNA從而有助于克隆。
Syngene程序用于將該序列片段化成為具有18-20堿基的最小重疊的50-60鏈節的寡核苷酸。
采用與上文所述類似的兩步PCR方法，將正確的片段回收/擴增和克隆至pVAC。采用限制性內切酶分析和序列驗證來鑒別陽性克隆，并產生載體JNW759。
3.-DNA序列相似性成對距離隨后序列比較ClustalV(加權的)(Pair distances followingalignment ClustalV(Weighted))示于下表6中。該表顯示CPC起始序列和密碼子優化序列間在DNA水平上的百分比相似性，并且證實了密碼子優化序列與原始CPC序列具有約80％的相似性。
表6
實施例VIII.P501S融合候選物的構建下圖所示的所有候選物均進行了密碼子優化，并通過重疊PCR方法，以質粒JNW764和JNW759作為模板(分別為SEQ ID NO22和SEQ ID NO26)，并克隆至表達載體，即p7313。
下圖所示的4個候選物均以CPC-P501S為基礎。密碼子優化的CPC-P501S為構建體A。候選物B、C、D還包括編碼P501S N末端50個氨基酸的序列，其可以位于CPC-P501S(構建體D)的N末端，CPC-P501S(構建體C)的C末端，或位于CPC和P501S之間(構建體B)。表示構建體的圖表示于圖20中。
四個構建體的每一種的核酸和蛋白序列示于SEQ ID NO37-40表示核酸序列，和SEQ ID NO.45-48表示相應的多肽序列。在構建體A、C和D中，下劃線標明的密碼子優選的編碼酪氨酸(TAC或TAT)，但是可改變核酸序列使其編碼蘇氨酸(ACA，ACC，ACG或ACT)。在構建體B中，下劃線標明的密碼子優選的編碼蘇氨酸(ACA，ACC，ACG或ACT)，但也可改變核酸序列使其編碼酪氨酸(TAC或TAT)。在所有的構建體中，編碼序列兩側均有適當的限制性內切酶克隆位點(在本實施例中為NotI和BamHI)，并且在起始ATG的直接上游存在一Kozak序列。下表7表示上述構建體的質粒鑒定表7
在第0天通過PMID進行初次免疫，和分別在第21，42和70天進行3次加強免疫后，通過ELISPOT來檢測經p7313-即(空載體)，pVAC-P501 S(JNW735)，JNW770，JNW771和JNW773免疫的細胞應答。在加強免疫后的7天進行檢測。圖27顯示，在用JNW770，JNW771和JNW773免疫的小鼠中可檢測到良好的IL-2ELISPOT應答。
實施例IX.采用顆粒介導的皮內遞送(PMID)進行的免疫實驗研究當全長P501S通過顆粒介導的皮內傳遞系統(PMID)來進行傳遞時，將產生好的抗體和細胞應答。這些數據標明PMID是一種非常有效的傳遞途徑。此外，通過肽ELISPOT進行P501 S和CPC-P501 S的比較證實CPC-P501 S誘導更強的免疫應答。
1.-材料和方法1.1 皮膚基因槍免疫采用氯化鈣和亞精胺將質粒DNA沉淀至2μm直徑的金粒上。將裝載了DNA的珠粒按文獻所述(Eisenbraum等，1993；Pertmer et al，1996)的方法覆蓋至Tefzel管上。采用Accell基因傳遞系統(PCT WO95/19799)進行粒子轟擊。對于每一種質粒，雌性C57BL/6鼠分別在第0，21，42和70天進行免疫。每次施用由兩次DNA/金轟擊組成，并且總劑量為約4-5μg質粒。
1.2對P501S基因產物的T細胞應答的ELISPOT分析a)脾細胞的制備脾來源于加強免疫后的7-14天的免疫動物。通過在玻片間進行研磨來處理脾組織從而產生細胞懸浮液。通過氯化銨處理來裂解紅細胞，同時除去細胞碎片從而獲得好的脾細胞懸浮液。細胞以8×106/ml的濃度重懸于RPMI不完全培養基中用于ELISPOT檢測。
b)肽文庫篩選覆蓋了大部分的P501S序列的肽文庫來源于Corixa Corp公司。該文庫中含有50條重疊4-11氨基酸的15-20鏈節長的肽。這些肽被編號為1-50。此外，一預測程序(H-G.Rammensee等Immunogenetics，1999，50213-219)(http//svfpeithi.bmi-heidelberg.com/)被用于預測P501S序列的Kb和Db表位。從Mimotopes(UK)定購了10個最好的Kb和Db表位，并包括在本文庫中(肽51-70)。為了進行肽文庫篩選，按照如下所述的方法，所述肽在IFNγ和IL-2 ELISPOTS中以50μg/ml(約25-50μM)的終濃度使用。對于IFNγ ELISPOTS，IL-2以10ng/ml的濃度加入檢測中。用于篩選的脾細胞是在第84天，從分別在第0，21，42和70天免疫的C57BL/6鼠中分離得到的。從文庫篩選中確定了3條肽-肽18(HCRQAYSVYAFMISLGGCLG)，22(GLSAPSLSPHCCPCRARLAF)和48(VCLAAGITYVPPLLLEVGV)。這些肽隨后用于ELISPOT檢測。
c)ELISPOT檢測采用15μg/ml(溶于PBS)的大鼠抗小鼠IFNγ或大鼠抗小鼠IL-2(Pharmingen)來包被檢測板。檢測板在+4℃下包被過夜。在使用前，采用PBS洗板三次。脾細胞以4×105細胞/孔的濃度加入到檢測板中。重新向Genemed Synthesis定購在文庫篩選中確定的肽，并在50μg/ml的終濃度下使用。CPC-P501S蛋白(GSKBio)在檢測中以20μg/ml的濃度使用。在存在IL-2(10ng/ml)，IL-7(10ng/ml)，或不存在細胞因子的情況下進行ELISPOT檢測。每孔中的總體積為200μl。含有肽刺激的細胞的檢測板在潮濕的37℃培養箱中培養16個小時。
e)ELISPOT檢測板的建立通過用水漂洗一次(浸泡10分鐘從而保證細胞裂解)和采用PBS漂洗三次，從檢測板中除去細胞。與生物素結合的大鼠抗小鼠IFNg或IL-2(Phamingen)溶于PBS在1μg/ml的濃度下添加。檢測板在室溫下震蕩溫育2小時。在添加1/1000倍稀釋的鏈霉菌抗生物素蛋白堿性磷酸酶(Caltag)之前，采用PBS洗板三次。在采用PBS洗滌三次后，通過采用BCICP(Biorad)底物溫育15-45分鐘來顯現結合點。用水洗去底物，并讓檢測板晾干。
采用Brian Hayes，Asthma Cell Biology unit，GSK設計的圖象分析系統來對結合點計數。
1.3.P501 S基因產物的抗體的ELISA分析通過靜脈穿刺術，在第-1，28，49和56天從動物中獲取血清樣品，并進行抗P501S抗體存在的檢測分析。在4℃下，采用溶于碳酸鈉緩沖液中的0.5μg/ml的CPC-P501S蛋白(GSKBio)過夜包被Nunc Maxisorp檢測板，利用上述檢測板進行ELISA檢測。經TBS-Tween(Tris-緩沖鹽，含有0.05％的Tween 20，pH 7.4)漂洗后，采用封閉緩沖液(3％BSA溶于TBS-Tween緩沖液)在室溫下將檢測板封閉2小時。所有的血清以1∶100的稀釋度稀釋于封閉緩沖液中，并在室溫下溫育1小時。采用以1∶2000稀釋度在封閉緩沖液中稀釋的HRP-結合的兔抗鼠免疫球蛋白(#P0260，Dako)來檢測抗體的結合。再次洗板，并采用快速OPD顏色試劑(Sigma，UK)來檢測結合。通過添加3M硫酸來終止反應，并通過檢測490nm處的光吸收來定量OPD產物。
1.4.瞬時轉染檢測通過質粒向CHO(中國倉鼠卵巢細胞)細胞瞬時轉染，以及隨后的針對總細胞蛋白的Western blotting分析，可分析各種DNA構建體中的人P501 S的表達。采用轉染劑(Promega)，按照制造商的說明可進行瞬時轉染。簡單的說，將細胞以5×104CHO細胞每孔的量接種于含有1 ml DMEM完全培養基(DMEM，10％FCS，2mM L-谷氨酸鹽，青霉素1001U/ml，鏈霉素100μg/ml)的24孔組織培養板中，并在37℃下培養16小時。將0.5μg DNA加入25μl的0.3M的NaCl(每孔足量的)中，并將2μl的轉染劑加入25μl的Milli-Q中。將DNA和轉染劑溶液輕微混合并在室溫下孵育15分鐘。在該孵育步驟中，細胞采用PBS漂洗一次，并采用150μl的不含血清的培養基(DMEM，2mML-谷氨酸鹽)來覆蓋。DNA轉染劑溶液逐滴加入細胞中，將培養板輕輕搖動并在37℃下培養4-6小時。加入500μl的DMEM完全培養基，并在37℃下進一步培養48-72小時。
2.采用P501S質粒瞬時轉染的CHO細胞的Western blot分析瞬時轉染的CHO細胞采用PBS來漂洗，并采用Versene(1∶5000)/0.025％胰蛋白酶溶液來處理從而將細胞轉移至懸浮液中。經胰蛋白酶消化后，沉淀CHO細胞并重懸于50μl的PBS中。加入等體積的2×NP40裂解緩沖液并在冰上溫育細胞30分鐘。加入100μl的含50mMDTT的2×TRIS-甘氨酸SDS樣品緩沖液(Invitrogen)，并將該溶液在95℃下加熱5分鐘。將1-20μl的樣品加樣至4-20％TRIS-甘氨酸凝膠1.5mm(Invitrogen)中，并在1×TRIS-甘氨酸緩沖液(Invitrogen)中在穩定電壓下(125V)電泳90分鐘。預染的寬范圍的分子量標記(NewEngland Biolabs，#P7708S)用于確定樣品分子的大小。在凝膠電泳后，采用XcellIII Blot Module(Invitrogen)，和含有20％甲醇的1×轉移緩沖液(Invitrogen)，在25V穩定電壓下電泳90分鐘，從而將樣品轉移至預先采用甲醇浸濕的Immobilon-P PVDF膜(Millipore)上。將膜在4℃下，置于含3％的脫脂奶粉(Marvel)的TBS-Tween(Tris-緩沖鹽，含0.05％的Tween 20，pH 7.4)中封閉過夜。以1∶1000的比例稀釋一抗(10E3)，并在室溫下與膜孵育1小時。在用TBS-Tween漂洗后，將二抗(HRP結合的兔抗小鼠免疫球蛋白(#P0260，Dako))以1∶2000的比例稀釋于含3％脫脂奶粉的TBS-Tween中，并與膜在室溫下一起溫育1小時。漂洗后，膜與Supersignal West Pico化學發光底物(Pierce)一起溫育5分鐘。除去多余的液體，并將膜密封于兩張粘性膜之間，暴露于Hyperfilm ECL膜(Amersham-PharmaciaBiotech)1-30分鐘。
3.全長人P501S表達盒的產生P501S表達盒構建的起始點為質粒pcDNA3.1-P501S(CorixaCorp)，其以pcDNA3.1為主鏈(Invitrogen)，并含有克隆于EcoRI和NotI位點之間的全長人P501S cDNA表達盒。該載體同樣被命名為JNW673。通過熒光測序證實了P501S的存在。cDNA表達盒的序列來源于NCBI/Genbank序列(登錄號AY033593)。從JNW673模板DNA經PCR擴增獲得人P501 S，并采用XbaI和SalI進行限制性酶切，并將其克隆至pVAC的NheI/XhoI位點，從而產生載體JNW680。通過PCR和DNA序列測定來確定片段相對于CMV啟動子的正確方向。表達盒的序列示于圖12中(SEQ ID NO17)。
為了構建CPC-P501 S表達盒，從載體pRIT15201(參見7)中經PCR擴增獲得CPC-P501 S，并通過XbaI和SalI的限制性酶切克隆至pVAC的NheI和XhoI位點，從而產生質粒JNW735。通過PCR和DNA序列測定來確定正確的插入方向。CPC-P501 S表達盒的序列示于圖13中(SEQ ID NO18)。
4.質粒JNW680和JNW735的人P501S的表達P501S表達質粒被瞬時轉染至CHO細胞中，并按上文所述的方法制備完全細胞裂解產物。完全細胞裂解產物的Western blot分析從分別用JNW680和JNW735轉染的樣品中鑒定出約55kDa和62kDa的單條帶(圖21)。這與預測的P501S和CPC-P501S的分子量59.3kDa和63.3kDa相一致。CPC標簽的添加沒有對P501S的表達產生不利影響。
5.結果5.1.PMID免疫后對人P501S的抗體應答在經PMID在第0天進行初次免疫，和在第21天和第42天和第70天進行3次加強免疫后，通過ELISA方法檢測了經pVAC(空載體)和pVAC-P501S(JNW680)免疫后的抗體應答。圖22顯示了分別從第-1天，第28天和第49天(小鼠A1-3，B1-3)和第56天(小鼠A4-6，B4-9)取樣的血清中檢測到的抗體應答。雖然對pVAC空載體存在非特異性應答，在9只小鼠中有5只觀察到對P501 S構建體的特異性應答。
5.2.通過篩選P501S肽文庫從C57BL/6小鼠的人P501S中鑒定新的T細胞表位用JNW680(pVAC-P501S)經PMID在第0天免疫及在第21天和第42天和第70天進行3次加強免疫，在第84天進行ELISPOT檢測。來源于P501 S文庫的肽以50μg/ml的終濃度進行檢測。從該初步篩選中，發現3種肽能刺激IFNγ和/或IL-2分泌。為肽18，22和48(圖23)。這些肽用于隨后的細胞分析。
5.3.PMID免疫后的對pVAC-P501S(JNW680)的細胞應答經PMID在第0天免疫，和在第21，42和70天進行三次加強免疫后，通過ELISPOT檢測用pVAC(空載體)和pVAC-P501 S進行免疫后的細胞應答。在加強免疫后的第7天進行檢測。采用了兩種不同的檢測條件1)從肽文庫篩選中鑒定得到的肽18，22和48在50μg/ml的終濃度下使用；和2)CPC-P501S蛋白在20μg/ml的終濃度下使用。圖24A顯示，雖然對于空載體(A4-6)不產生P501 S特異性應答，但pVAC-P501 S構建體在所有小鼠(B6-9)中均誘導針對肽18和22的特異性IFN-γ應答，不過還有一只鼠(B7)中還顯示出針對肽48的IFN-γ應答。圖24B表明，所有的小鼠均顯示出針對肽18，22和48的特異性IL-2應答。此外，pVAC-P501S免疫小鼠(B6-9)還顯示出針對CPC-P501S的中度的IL-2應答，其中采用空載體免疫的小鼠(A4-6)不產生應答。
5.4.經PMID免疫后的針對P501S和CPC-P501S的細胞應答比較在經PMID在第0天初次免疫及在第21和第42天加強免疫后，通過ELISPOT可檢測經pVAC(空載體)、pVAC-P501S(JNW680)和CPC-P501S(JNW735)免疫后的細胞應答。所述檢測在加強免疫后的第7天開始進行。采用了兩種不同的檢測條件1)從肽文庫篩選中鑒定得到的肽18，22和48在50μg/ml的終濃度下使用；和2)CPC-P501S蛋白在20μg/ml的終濃度下使用。圖25顯示，在第28天，CPC-P501S誘導針對10μg/ml的肽22的良好的IL-2應答，然而針對空載體或pVAC-P501S均不存在P501S-特異應答。在采用CPC-P501 S蛋白再次免疫脾細胞時還可觀察到這種結果。在第49天(在第二次加強免疫后)，由P501S和CPC-P501S誘導的應答是相等的。這些數據表明，CPC標簽的添加提高了針對P501 S應答的動力學和/或數量。
實施例IX.在小鼠中采用P501S蛋白+佐劑進行免疫原性實驗的研究1.實驗設計和佐劑的配制用與佐劑一起配制的重組純化的CPC-P501S蛋白進行疫苗接種而誘導的免疫應答通過用小鼠進行實驗來表征。采用10μg的與不同佐劑系統一起配制的CPC-P501S蛋白以2星期的時間間隔進行肌肉內注射2-6次，從而對5到10組，8周大的C57BL6鼠進行免疫。其施用量相當于人劑量的1/10(50μl)。
采用如Gerard，c.等，2001，Vaccine 19，2583-2589中所述的標準方法，對最后一次免疫后6-14天的脾細胞進行了血清學(總Ig應答)和細胞應答的分析。
代表性實驗的數據如下文所示。其包括5組每組8只分別在第0，14，28和42天接受4次肌肉內CPC P501(10μg)+佐劑(A，B，C)注射的C57BI/6小鼠。實施例5提供了如何配制制劑的方法。簡單的，所示的佐劑制劑按如下方法配制(定量為100μl每劑量)-佐劑AQS21(10μg)，MPL(10μg)和CPG7909(100μg)按照WO 00/62800中所公開的方法制備；-佐劑BQS21(20μg)，MPL(20μg)，CPG7909(100μg)和50μl SB62水包油乳劑(WO 95/17210)配成的制劑；-佐劑CQS21(10μg)，MPL(10μg)，CpG7909(100μg)和10μl SB62水包油乳劑(WO 99/12565)配成的制劑。
2.血清學采用CPC-P501或RA12-P501(C末端來源于如Skeiky等，Infectionand Immun.(1999)673998-4007所述的MTB32A抗原，所述的C末端是P501蛋白的截短形式，其相應于在其N末端與TB衍生蛋白RA12-Ra12融合的蛋白的C末端)，經ELISA方法來檢測接種誘導的總Ig應答。
在免疫后，添加了佐劑的CPC-P501 S蛋白產生了良好的抗體應答。
3.細胞應答3.1.淋巴細胞增殖最后一次免疫后7天，在個別脾細胞中出現了淋巴細胞增殖現象。將2.10e5脾細胞以一式四份的方式加入含1％正常鼠血清的RPMI培養基的96孔微孔板中。在用不同濃度的免疫原(CPC-P501)或截短蛋白(RA12 P501)重新刺激后72小時，加入1μCi 3H胸腺嘧啶(Amersham5Ci/ml)。16小時后，將細胞收集于過濾板上。采用β計數器來計量合并的放射性。結果通過CPM或刺激指數*來表現(在含有抗原的培養物中的幾何平均數CPM/在不含抗原的培養物中的幾何平均數CPM)。
作為陽性對照的采用ConA(2μg/ml)進行重新刺激也包括在內作為陽性對照。
如圖26所示，在采用由另外的表達系統(E coli)制備的免疫原或其他的P501蛋白在體外重新刺激后，所有接受了佐劑配制的蛋白的小鼠脾臟中均觀察到P501特異性淋巴細胞增殖現象，這表明通過疫苗接種在體內誘導了T細胞。
3.2.通過脾細胞細胞內染色檢測IFNg生產從在存在GMCSF的條件下培養的小鼠PBL的7天培養物中獲取骨髓樹突細胞(BMDC)。
在最后一次疫苗接種后7天，收集脾或PBL并制備細胞懸浮物。將10e6細胞(每組混合在一起)與10e5 BMDC一起培養+/-18小時，并在10μg/ml的CPCp501蛋白或RA12的刺激下過夜。
在經2.4.G.2抗體處理后，采用熒光抗CD4和CD8抗體(抗CD4-APC和抗CD8PerCP)染色脾細胞。在滲透和固定步驟后，采用熒光抗IFNg-FITC抗體染色細胞。
在經與不同佐劑配合使用的CPC P501疫苗接種的小鼠中，CD4和CD8 T細胞均顯示出產生針對采用在E coli中制備的免疫原或C-末端p501刺激的DC而產生的IFNg(如脾和PBLs的細胞內染色所示)。與單獨的蛋白相比，在接受了添加佐劑的CPC-P501S的組中，在產生這種細胞因子的細胞％方面存在4-10×的增加，同時0.1-10％的CD4或CD8 T細胞顯示出產生IFNg。
總的來說，從這些數據中能得出這樣的結論添加佐劑的CPC-P501蛋白在小鼠中具有免疫原性。
在采用添加佐劑的CPC P501進行數次肌肉內疫苗接種后，包括由CD4和CD8 T細胞產生的IFNg的P501特異性體液和細胞應答均可檢測到。
實施例X.CPC-MUC-1構建體和其序列CPC序列來源于核苷酸SEQ ID NO.28。
MUC1序列可從Genbank數據庫獲得(登錄號NM_002456)1.MUC1-CPC構建體由于轉錄后將被切除的信號序列存在于MUC1中，CPC基元序列被置于C末端。獲得的MUC1-CPC DNA序列如SEQ ID NO.xx(圖28A)所示，并且相應的MUC1-CPC蛋白序列如SEQ ID NO.yy(圖28B)所示。
2.ss-CPC-MUC1構建體由于翻譯后將被切除的信號序列存在于MUC1中，MUC1信號序列被異源前導肽序列(來源于人免疫球蛋白的重鏈)所取代，并且CPC基元序列被插入異源前導肽序列和MUC1序列之間，從而產生如圖29所示的被命名為ss-CPC-MUC1的序列。
序列表<110>GlaxosmithKline Biologicals saGlaxo Group Ltd<120>免疫原性組合物<130>B45311<160>52<170>Windows版本4.0 FastSEQ<210>1<211>15<212>PRT<213>肺炎鏈球菌<400>1Gly Trp Gln Lys Asn Asp Thr Gly Tyr Trp Tyr Val His Ser Asp1 5 10 15<210>2<211>21<212>PRT<213>肺炎鏈球菌<400>2Gly Ser Tyr Pro Lys Asp Lys Phe Glu Lys Ile Asn Gly Thr Trp Tyr1 5 10 15Tyr Phe Asp Ser Ser20<210>3<211>22<212>PRT<213>肺炎鏈球菌<400>3Gly Tyr Met Leu Ala Asp Arg Trp Arg Lys His Thr Asp Gly Asn Trp1 5 10 15Tyr Trp Phe Asp Asn Ser20<210>4<211>20<212>PRT<213>肺炎鏈球菌<400>4Gly Glu Met Ala Thr Gly Trp Lys Lys Ile Ala Asp Lys Trp Tyr Tyr1 5 10 15Phe Asn Glu Glu20<210>5
<211>21<212>PRT<213>肺炎鏈球菌<400>5Gly Ala Met Lys Thr Gly Trp Val Lys Tyr Lys Asp Thr Trp Tyr Tyr1 5 10 15Leu Asp Ala Lys Glu20<210>6<211>23<212>PRT<213>肺炎鏈球菌<400>6Gly Ala Met Val Ser Asn Ala Phe Ile Gln Ser Ala Asp Gly Thr Gly1 5 10 15Trp Tyr Tyr Leu Lys Pro Asp20<210>7<211>142<212>PRT<213>肺炎鏈球菌<400>7Gly Trp Gln Lys Asn Asp Thr Gly Tyr Trp Tyr Val His Ser Asp Gly1 5 10 15Ser Tyr Pro Lys Asp Lys Phe Glu Lys Ile Asn Gly Thr Trp Tyr Tyr20 25 30Phe Asp Ser Ser Gly Tyr Met Leu Ala Asp Arg Trp Arg Lys His Thr35 40 45Asp Gly Asn Trp Tyr Trp Phe Asp Asn Ser Gly Glu Met Ala Thr Gly50 55 60Trp Lys Lys Ile Ala Asp Lys Trp Tyr Tyr Phe Asn Glu Glu Gly Ala65 70 75 80Met Lys Thr Gly Trp Val Lys Tyr Lys Asp Thr Trp Tyr Tyr Leu Asp85 90 95Ala Lys Glu Gly Ala Met Val Ser Asn Ala Phe Ile Gln Ser Ala Asp100 105 110Gly Thr Gly Trp Tyr Tyr Leu Lys Pro Asp Gly Thr Leu Ala Asp Arg115 120 125Pro Glu Phe Thr Val Glu Pro Asp Gly Leu Ile Thr Val Lys130 135 140<210>8<211>112<212>PRT<213>肺炎鏈球菌<400>8Tyr Val His Ser Asp Gly Ser Tyr Pro Lys Asp Lys Phe Glu Lys Ile1 5 10 15Asn Gly Thr Trp Tyr Tyr Phe Asp Ser Ser Gly Tyr Met Leu Ala Asp20 25 30Arg Trp Arg Lys His Thr Asp Gly Asn Trp Tyr Trp Phe Asp Asn Ser35 40 45
Gly G1u Met Ala Thr Gly Trp Lys Lys Ile Ala Asp Lys Trp Tyr Tyr50 55 60Phe Asn Glu Glu Gly Ala Met Lys Thr Gly Trp Val Lys Tyr Lys Asp65 70 75 80Thr Trp Tyr Tyr Leu Asp Ala Lys Glu Gly Ala Met Val Ser Asn Ala85 90 95Phe Ile Gln Ser Ala Asp Gly Thr Gly Trp Tyr Tyr Leu Lys Pro Asp100 105 110<210>9<211>45<212>DNA<213>肺炎鏈球菌<400>9ggctggcaga agaatgacac tggctactgg tacgtacatt cagac 45<210>10<211>63<212>DNA<213>肺炎鏈球菌<400>10ggctcttatc caaaagacaa gtttgagaaa atcaatggca cttggtacta ctttgacagt60tca 63<210>11<211>66<212>DNA<213>肺炎鏈球菌<400>11ggctatatgc ttgcagaccg ctggaggaag cacacagacg gcaactggta ctggttcgac60aactca 66<210>12<211>60<212>DNA<213>肺炎鏈球菌<400>12ggcgaaatgg ctacaggctg gaagaaaatc gctgataagt ggtactattt caacgaagaa60<210>13<211>63<212>DNA<213>肺炎鏈球菌<400>13ggtgccatga agacaggctg ggtcaagtac aaggacactt ggtactactt agacgctaaa60gaa 63<210>14<211>69<212>DNA<213>肺炎鏈球菌<400>14ggcgccatgg tatcaaatgc ctttatccag tcagcggacg gaacaggctg gtactacctc60
aaaccagac 69<210>15<211>429<212>DNA<213>肺炎鏈球菌<400>15ggctggcaga agaatgacac tggctactgg tacgtacatt cagacggctc ttatccaaaa 60gacaagtttg agaaaatcaa tggcacttgg tactactttg acagttcagg ctatatgctt 120gcagaccgct ggaggaagca cacagacggc aactggtact ggttcgacaa ctcaggcgaa 180atggctacag gctggaagaa aatcgctgat aagtggtact atttcaacga agaaggtgcc 240atgaagacag gctgggtcaa gtacaaggac acttggtact acttagacgc taaagaaggc 300gccatggtat caaatgcctt tatccagtca gcggacggaa caggctggta ctacctcaaa 360ccagacggaa cactggcaga caggccagaa ttcacagtag agccagatgg cttgattaca 420gtaaaataa 429<210>16<211>336<212>DNA<213>肺炎鏈球菌<400>16tacgtacatt ccgacggctc ttatccaaaa gacaagtttg agaaaatcaa tggcacttgg 60tactactttg acagttcagg ctatatgctt gcagaccgct ggaggaagca cacagacggc 120aactggtact ggttcgacaa ctcaggcgaa atggctacag gctggaagaa aatcgctgat 180aagtggtact atttcaacga agaaggtgcc atgaagacag gctgggtcaa gtacaaggac 240acttggtact acttagacgc taaagaaggc gccatggtat caaatgcctt tatccagtca 300gcggacggaa caggctggta ctacctcaaa ccagac 336<210>17<211>1674<212>DNA<213>人類<400>17gccaccatgg tccagaggct gtgggtgagc cgcctgctgc ggcaccggaa agcccagctc 60ttgctggtca acctgctaac ctttggcctg gaggtgtgtt tggccgcagg catcacctat 120gtgccgcctc tgctgctgga agtgggggta gaggagaagt tcatgaccat ggtgctgggc 180attggtccag tgctgggcct ggtctgtgtc ccgctcctag gctcagccag tgaccactgg 240cgtggacgct atggccgccg ccggcccttc atctgggcac tgtccttggg catcctgctg 300agcctctttc tcatcccaag ggccggctgg ctagcagggc tgctgtgccc ggatcccagg 360cccctggagc tggcactgct catcctgggc gtggggctgc tggacttctg tggccaggtg 420tgcttcactc cactggaggc cctgctctct gacctcttcc gggacccgga ccactgtcgc 480caggcctact ctgtctatgc cttcatgatc agtcttgggg gctgcctggg ctacctcctg 540cctgccattg actgggacac cagtgccctg gccccctacc tgggcaccca ggaggagtgc 600ctctttggcc tgctcaccct catcttcctc acctgcgtag cagccacact gctggtggct 660gaggaggcag cgctgggccc caccgagcca gcagaagggc tgtcggcccc ctccttgtcg 720ccccactgct gtccatgccg ggcccgcttg gctttccgga acctgggcgc cctgcttccc 780cggctgcacc agctgtgctg ccgcatgccc cgcaccctgc gccggctctt cgtggctgag 840ctgtgcagct ggatggcact catgaccttc acgctgtttt acacggattt cgtgggcgag 900gggctgtacc agggcgtgcc cagagctgag ccgggcaccg aggcccggag acactatgat 960gaaggcgttc ggatgggcag cctggggctg ttcctgcagt gcgccatctc cctggtcttc 1020tctctggtca tggaccggct ggtgcagcga ttcggcactc gagcagtcta tttggccagt 1080gtggcagctt tccctgtggc tgccggtgcc acatgcctgt cccacagtgt ggccgtggtg 1140acagcttcag ccgccctcac cgggttcacc ttctcagccc tgcagatcct gccctacaca 1200ctggcctccc tctaccaccg ggagaagcag gtgttcctgc ccaaataccg aggggacact 1260ggaggtgcta gcagtgagga cagcctgatg accagcttcc tgccaggccc taagcctgga 1320gctcccttcc ctaatggaca cgtgggtgct ggaggcagtg gcctgctccc acctccaccc 1380gcgctctgcg gggcctctgc ctgtgatgtc tccgtacgtg tggtggtggg tgagcccacc 1440gaggccaggg tggttccggg ccggggcatc tgcctggacc tcgccatcct ggatagtgcc 1500
ttcctgctgt cccaggtggc cccatccctg tttatgggct ccattgtcca gctcagccag 1560tctgtcactg cctatatggt gtctgccgca ggcctgggtc tggtcgccat ttactttgct 1620acacaggtag tatttgacaa gagcgacttg gccaaatact cagcgtaggt cgag 1674<210>18<211>1947<212>DNA<213>人工序列<220>
<223>肺炎鏈球菌C-LytA，P2 T輔助表位和人P501S之間的雜交基因<400>18gccaccatgg cggccgctta cgtacattcc gacggctctt atccaaaaga caagtttgag 60aaaatcaatg gcacttggta ctactttgac agttcaggct atatgcttgc agaccgctgg 120aggaagcaca cagacggcaa ctggtactgg ttcgacaact caggcgaaat ggctacaggc 180tggaagaaaa tcgctgataa gtggtactat ttcaacgaag aaggtgccat gaagacaggc 240tgggtcaagt acaaggacac ttggtactac ttagacgcta aagaaggcgc catgcaatac 300atcaaggcta actctaagtt cattggtatc actgaaggcg tcatggtatc aaatgccttt 360atccagtcag cggacggaac aggctggtac tacctcaaac cagacggaac actggcagac 420aggccagaaa agttcatgta catggtgctg ggcattggtc cagtgctggg cctggtctgt 480gtcccgctcc taggctcagc cagtgaccac tggcgtggac gctatggccg ccgccggccc 540ttcatctggg cactgtcctt gggcatcctg ctgagcctct ttctcatccc aagggccggc 600tggctagcag ggctgctgtg cccggatccc aggcccctgg agctggcact gctcatcctg 660ggcgtggggc tgctggactt ctgtggccag gtgtgcttca ctccactgga ggccctgctc 720tctgacctct tccgggaccc ggaccactgt cgccaggcct actctgtcta tgccttcatg 780atcagtcttg ggggctgcct gggctacctc ctgcctgcca ttgactggga caccagtgcc 840ctggccccct acctgggcac ccaggaggag tgcctctttg gcctgctcac cctcatcttc 900ctcacctgcg tagcagccac actgctggtg gctgaggagg cagcgctggg ccccaccgag 960ccagcagaag ggctgtcggc cccctccttg tcgccccact gctgtccatg ccgggcccgc 1020ttggctttcc ggaacctggg cgccctgctt ccccggctgc accagctgtg ctgccgcatg 1080ccccgcaccc tgcgccggct cttcgtggct gagctgtgca gctggatggc actcatgacc 1140ttcacgctgt tttacacgga tttcgtgggc gaggggctgt accagggcgt gcccagagct 1200gagccgggca ccgaggcccg gagacactat gatgaaggcg ttcggatggg cagcctgggg 1260ctgttcctgc agtgcgccat ctccctggtc ttctctctgg tcatggaccg gctggtgcag 1320cgattcggca ctcgagcagt ctatttggcc agtgtggcag ctttccctgt ggctgccggt 1380gccacatgcc tgtcccacag tgtggccgtg gtgacagctt cagccgccct caccgggttc 1440accttctcag ccctgcagat cctgccctac acactggcct ccctctacca ccgggagaag 1500caggtgttcc tgcccaaata ccgaggggac actggaggtg ctagcagtga ggacagcctg 1560atgaccagct tcctgccagg ccctaagcct ggagctccct tccctaatgg acacgtgggt 1620gctggaggca gtggcctgct cccacctcca cccgcgctct gcggggcctc tgcctgtgat 1680gtctccgtac gtgtggtggt gggtgagccc accgaggcca gggtggttcc gggccggggc 1740atctgcctgg acctcgccat cctggatagt gccttcctgc tgtcccaggt ggccccatcc 1800ctgtttatgg gctccattgt ccagctcagc cagtctgtca ctgcctatat ggtgtctgcc 1860gcaggcctgg gtctggtcgc catttacttt gctacacagg tagtatttga caagagcgac 1920ttggccaaat actcagcgta ggtcgag 1947<210>19<211>1662<212>DNA<213>人工序列<220>
<223>密碼子優化的人P501S<400>19atggtgcagc ggctctgggt gagccgcctc ctgcggcatc gcaaggccca gctcctgctg 60gtgaatctgc tcacattcgg cctggaggtg tgcctggccg ccggcatcac ctacgtgccc 120cccctcctgc tggaggtggg agtcgaggag aagttcatga ccatggtgct gggcattggg 180cccgtcctgg gcctcgtgtg cgtgcctctc ctcggcagcg cttccgacca ttggcgcggc 240
cggtatggcc gcaggagacc cttcatctgg gctctgagtc tcggcatcct gctgagcctg 300ttcctgatcc ctcgggccgg ctggctggcc gggctgctgt gccccgatcc tcggcccctg 360gagctggccc tgctgatcct cggcgtgggc ctgctggact tctgcggcca ggtgtgcttc 420acgcccctgg aggcactgct gagcgacctg ttccgggacc ccgaccattg ccgccaggcg 480tacagcgtgt acgccttcat gatctccctg ggaggctgcc tgggctacct gctccccgcc 540atcgattggg acaccagcgc actcgccccc tatctcggaa cacaggagga atgcctgttc 600ggattgttga cgctcatctt cctcacgtgc gtcgcggcca ccctgttggt ggccgaggag 660gccgccctgg ggcccaccga gccggccgag ggactgagcg ccccgagcct gagtccacac 720tgctgccctt gccgggcccg cctggccttc cgtaatctgg gcgccctcct gcctcggctc 780catcagctgt gttgcagaat gcctaggacg ctgcggcgcc tgttcgtcgc tgagttgtgc 840tcctggatgg ctctcatgac cttcaccctg ttttatacgg acttcgtcgg ggagggcctg 900taccaggggg tgccgcgcgc cgagcccggg acagaggcgc gccgccacta cgacgaggga 960gtgcgtatgg gctccctggg cctcttcttg cagtgcgcca tcagtctggt tttctctctg 1020gtcatggaca ggctggtgca gcgcttcgga acccgggcgg tgtacctggc gagcgtggcc 1080gccttccccg tggctgccgg cgccacctgc ctctctcact cggtggccgt ggtcaccgcc 1140agcgccgccc tgaccgggtt caccttctct gccctgcaga ttctgcctta caccctggcc 1200agcctgtacc atcgcgagaa acaggtgttt ctccccaagt acagaggcga caccgggggc 1260gcctccagcg aggacagcct catgacctcc ttcctgcctg gccccaagcc cggcgcccct 1320ttccccaacg ggcacgtggg cgccggcggg agtgggctcc tgcccccccc tcctgcgctg 1380tgcggggcca gcgcctgcga cgtgagcgtg cgcgtggtgg tgggcgagcc caccgaggcc 1440cgcgtggtgc cgggcagagg catttgtctg gacctggcca tcctcgactc cgccttcctc 1500ctcagccagg tggccccgtc cctcttcatg ggctctatcg tccagctgtc tcagagcgtc 1560accgcttaca tggtgtccgc tgctggactg ggcttggtgg ctatttattt cgccacccag 1620gtggtgttcg acaagagcga cctggccaaa tactccgcct ga1662<210>20<211>1662<212>DNA<213>人工序列<220>
<223>密碼子優化的人P501S<400>20atggtgcagc ggctgtgggt gtcccggctg ctgcgccata gaaaggccca gttgctgctg 60gtgaacctgc tgactttcgg actggaggtg tgcctggctg ccgggatcac gtacgtgccc 120cccctgctgc tggaggtggg cgtggaggag aagttcatga caatggtgct gggcatcggc 180cccgtcctgg gcctcgtgtg tgtgcccctc ctcgggagtg cgtccgatca ttggcggggc 240cgctacggcc gccgcagacc gttcatctgg gccctgagcc tggggatcct gctctctctc 300ttcctgatcc cccgggccgg ctggctggcc ggcctgctgt gtcccgaccc ccgccctctg 360gagctggccc tcctgatcct gggcgtgggc ttgttggact tctgcggcca ggtgtgtttc 420actcccctgg aggctctgct ctccgacctc ttccgcgacc ccgaccactg taggcaggct 480tacagcgtgt acgccttcat gatcagtctg gggggatgcc tgggctatct gctgcccgct 540atcgactggg acaccagcgc cctggccccc tacctgggga ctcaggagga gtgcctgttc 600ggcctgctca ccttgatctt cctgacgtgc gtcgccgcca ccctgctggt ggccgaggag 660gcggccctgg ggcccaccga gcccgccgag ggcctgagcg ctcccagcct gagcccccat 720tgctgcccgt gcagggctag gctcgccttc aggaatctgg gcgctttgct gccccgcctg 780catcagctgt gctgtcgcat gcctcgcacc ctgcgccgcc tgttcgtcgc tgagctctgt 840tcctggatgg ccctgatgac gttcaccctc ttctacaccg acttcgtggg ggagggcctg 900taccagggcg tgcccagggc cgagcccggc accgaggcta ggcgccatta cgacgagggc 960gtcaggatgg gctctctggg cctcttcctg cagtgcgcca tcagtctggt gttctctctg 1020gtgatggacc ggctggtgca gcgcttcggc acccgggccg tgtacctcgc ctctgtggcg 1080gctttccccg tcgccgccgg cgcgacctgc ctgtctcatt ctgtcgccgt ggtgaccgcc 1140agcgccgccc tgaccggctt caccttcagt gcgctccaga ttctgcccta caccctggcg 1200tctctgtacc atcgcgagaa gcaggtgttc ctgcccaagt accgcgggga cacaggggga 1260gcttcctctg aggacagcct gatgaccagc ttcttgcccg gccccaagcc gggggcccct 1320ttccccaacg gccatgtcgg ggcgggcggc agcggcctgc tccctccccc ccccgccctg 1380tgcggcgcta gtgcctgcga cgtgagcgtg cgggtggtgg tgggggagcc caccgaggct 1440agggtcgtgc ctggccgggg gatctgcctg gacctggcca tcctcgactc cgccttcctg 1500ctctcccagg tggcgcccag cctgttcatg ggcagtatcg tgcagctgag ccagagcgtg 1560accgcctaca cggtgagcgc cgccggcctg gggttggtgg ccatctactt tgccacccag 1620
gtcgtgttcg acaagagcga tctcgccaagtatagcgcct ga 1662<210>21<211>1688<212>DNA<213>人工序列<220>
<223>密碼子優化的人P501S<400>21gacggctagc gccaccatgg tgcagcggct ctgggtgagc cgcctcctgc ggcatcgcaa 60ggcccagctc ctgctggtga atctgctcac attcggcctg gaggtgtgcc tggccgccgg 120catcacctac gtgccccccc tcctgctgga ggtgggagtc gaggagaagt tcatgaccat 180ggtgctgggc attgggcccg tcctgggcct cgtgtgcgtg cctctcctcg gcagcgcttc 240cgaccattgg cgcggccggt atggccgcag gagacccttc atctgggctc tgagtctcgg 300catcctgctg agcctgttcc tgatccctcg ggccggctgg ctggccgggc tgctgtgccc 360cgatcctcgg cccctggagc tggccctgct gatcctcggc gtgggcctgc tggacttctg 420cggccaggtg tgcttcacgc ccctggaggc actgctgagc gacctgttcc gggaccccga 480ccattgccgc caggcgtaca gcgtgtacgc cttcatgatc tccctgggag gctgcctggg 540ctacctgctc cccgccatcg attgggacac cagcgcactc gccccctatc tcggaacaca 600ggaggaatgc ctgttcggac tgctgacgct catcttcctc acgtgcgtcg cggccaccct 660gttggtggcc gaggaggccg ccctggggcc caccgagccg gccgagggac tgagcgcccc 720gagcctgagt ccacactgct gcccttgccg ggcccgcctg gccttccgta atctgggcgc 780cctcctgcct cggctccatc agctgtgttg cagaatgcct aggacgctgc ggcgcctgtt 840cgtcgctgag ttgtgctcct ggatggctct catgaccttc accctgtttt atacggactt 900cgtcggggag ggcctgtacc agggggtgcc gcgcgccgag cccgggacag aggcgcgccg 960ccactacgac gagggagtgc gtatgggctc cctgggcctc ttcttgcagt gcgccatcag 1020tctggttttc tctctggtca tggacaggct ggtgcagcgc ttcggaaccc gggcggtgta 1080cctggcgagc gtggccgcct tccccgtggc tgccggcgcc acctgcctct ctcactcggt 1140ggccgtggtc accgccagcg ccgccctgac cgggttcacc ttctctgccc tgcagattct 1200gccttacacc ctggccagcc tgtaccatcg cgagaaacag gtgtttctcc ccaagtacag 1260aggcgacacc gggggcgcct ccagcgagga cagcctcatg acctccttcc tgcctggccc 1320caagcccggc gcccctttcc ccaacgggca cgtgggcgcc ggcgggagtg ggctcctgcc 1380cccccctcct gcgctgtgcg gggccagcgc ctgcgacgtg agcgtgcgcg tggtggtggg 1440cgagcccacc gaggcccgcg tggtgccggg cagaggcatt tgtctggacc tggccatcct 1500cgactccgcc ttcctcctca gccaggtggc cccgtccctc ttcatgggct ctatcgtcca 1560gctgtctcag agcgtcaccg cttacatggt gtccgctgct ggactgggct tggtggctat 1620ttatttcgcc acccaggtgg tgttcgacaa gagcgacctg gccaaatact ccgcctgact 1680cgaggcag 1688<210>22<211>1688<212>DNA<213>人工序列<220>
<223>密碼子優化的人P501S<400>22gacggctagc gccaccatgg tgcagcggct gtgggtgtcc cggctgctgc gccatagaaa 60ggcccagttg ctgctggtga acctgctgac tttcggactg gaggtgtgcc tggctgccgg 120gatcacgtac gtgccccccc tgctgctgga ggtgggcgtg gaggagaagt tcatgacaat 180ggtgctgggc atcggccccg tcctgggcct cgtgtgtgtg cccctcctcg ggagtgcgtc 240cgatcattgg cggggccgct acggccgccg cagaccgttc atctgggccc tgagcctggg 300catcctgctc tctctcttcc tgatcccccg ggccggctgg ctggccggcc tgctgtgtcc 360cgacccccgc cctctggagc tggccctcct gatcctgggc gtgggcctgc tggacttctg 420cggccaggtg tgtttcactc ccctggaggc tctgctctcc gacctcttcc gcgaccccga 480ccactgtagg caggcttaca gcgtgtacgc cttcatgatc agtctggggg gatgcctggg 540ctatctgctg cccgctatcg actgggacac cagcgccctg gccccctacc tggggactca 600ggaggagtgc ctgttcggcc tgctcacctt gatcttcctg acgtgcgtcg ccgccaccct 660
gctggtggcc gaggaggcgg ccctggggcc caccgagccc gccgagggcc tgagcgctcc 720cagcctgagc ccccattgct gcccgtgcag ggctaggctc gccttcagga atctgggcgc 780tttgctgccc cgcctgcatc agctgtgctg tcgcatgcct cgcaccctgc gccgcctgtt 840cgtcgctgag ctctgttcct ggatggccct gatgacgttc accctcttct acaccgactt 900cgtgggggag ggcctgtacc agggcgtgcc cagggccgag cccggcaccg aggctaggcg 960ccattacgac gagggcgtca ggatgggctc tctgggcctc ttcctgcagt gcgccatcag 1020tctggtgttc tctctggtga tggaccggct ggtgcagcgc ttcggcaccc gggccgtgta 1080cctcgcctct gtggcggctt tccccgtcgc cgccggcgcg acctgcctgt ctcattctgt 1140cgccgtggtg accgccagcg ccgccctgac cggcttcacc ttcagtgcgc tccagattct 1200gccctacacc ctggcgtctc tgtaccatcg cgagaagcag gtgttcctgc ccaagtaccg 1260cggggacaca gggggagctt cctctgagga cagcctgatg accagcttct tgcccggccc 1320caagccgggg gcccctttcc ccaacggcca tgtcggggcg ggcggcagcg gcctgctccc 1380tccccccccc gccctgtgcg gcgctagtgc ctgcgacgtg agcgtgcggg tggtggtggg 1440ggagcccacc gaggctaggg tcgtgcctgg ccgggggatc tgcctggacc tggccatcct 1500cgactccgcc ttcctgctct cccaggtggc gcccagcctg ttcatgggca gtatcgtgca 1560gctgagccag agcgtgaccg cctacatggt gagcgccgcc ggcctggggt tggtggccat 1620ctactttgcc acccaggtcg tgttcgacaa gagcgatctc gccaagtata gcgcctgact 1680cgaggcag 1688<210>23<211>435<212>DNA<213>人工序列<220>
<223>肺炎鏈球菌C-LytA，P2 T輔助表位和人P501S的5′末端的一小部分之間的雜交基因<400>23atggcggccg cttacgtaca ttccgacggc tcttatccaa aagacaagtt tgagaaaatc 60aatggcactt ggtactactt tgacagttca ggctatatgc ttgcagaccg ctggaggaag 120cacacagacg gcaactggta ctggttcgac aactcaggcg aaatggctac aggctggaag 180aaaatcgctg ataagtggta ctatttcaac gaagaaggtg ccatgaagac aggctgggtc 240aagtacaagg acacttggta ctacttagac gctaaagaag gcgccatgca atacatcaag 300gctaactcta agttcattgg tatcactgaa ggcgtcatgg tatcaaatgc ctttatccag 360tcagcggacg gaacaggctg gtactacctc aaaccagacg gaacactggc agacaggcca 420gaaaagttca tgtac 435<210>24<211>435<212>DNA<213>人工序列<220>
<223>肺炎鏈球菌C-LytA，P2 T輔助表位和人P501S的5′末端的一小部分之間的雜交基因-優化密碼子<400>24atggccgccg cctacgtgca tagcgacggg agctacccca aggacaagtt cgagaagatc 60aacgggacat ggtactactt cgactcctcc ggctacatgc tcgccgaccg ctggcggaag 120cacaccgacg gcaactggta ctggttcgat aactcgggag agatggccac cggctggaag 180aagatcgcgg acaagtggta ctatttcaac gaggagggcg ccatgaagac cggctgggtg 240aagtataagg acacctggta ctacctcgac gccaaggagg gcgccatgca gtatatcaag 300gccaacagca agttcatcgg catcaccgag ggagtgatgg tcagcaacgc ctttatccag 360agcgccgacg gcaccggatg gtactacttg aagccggacg gcaccctcgc ggatcggccc 420gagaagttca tgtac 435<210>25<211>435
<212>DNA<213>人工序列<220>
<223>肺炎鏈球菌C-LytA，P2 T輔助表位和人P501S的5′末端的一小部分之間的雜交基因-優化密碼子<400>25atggccgccg cctacgtgca cagcgacggg tcctacccaa aggacaagtt cgagaagatc 60aacggcacgt ggtactattt cgacagcagc ggctacatgc tcgccgatcg ctggcgcaag 120cacaccgacg ggaactggta ctggttcgac aactctggcg agatggctac ggggtggaag 180aagatcgccg acaagtggta ctacttcaac gaggagggcg ccatgaagac cgggtgggtg 240aagtacaagg acacctggta ctacctggac gctaaggagg gcgccatgca gtacatcaag 300gccaactcga agttcatcgg gatcaccgag ggcgtgatgg tcagtaacgc tttcatccag 360agcgcggacg gcacaggctg gtattacctg aagcccgatg gcaccctggc ggacagacct 420gagaaattca tgtac 435<210>26<211>464<212>DNA<213>人工序列<220>
<223>肺炎鏈球菌C-LytA，P2 T輔助表位和人P501S的5′末端的一小部分之間的雜交基因-優化密碼子<400>26gacggctagc gccaccatgg ccgccgccta cgtgcatagc gacgggagct accccaagga 60caagttcgag aagatcaacg ggacatggta ctacttcgac tcctccggct acatgctcgc 120cgaccgctgg cggaagcaca ccgacggcaa ctggtactgg ttcgataact cgggagagat 180ggccaccggc tggaagaaga tcgcggacaa gtggtactat ttcaacgagg agggcgccat 240gaagaccggc tgggtgaagt ataaggacac ctggtactac ctcgacgcca aggagggcgc 300catgcagtat atcaaggcca acagcaagtt catcggcatc accgagggag tgatggtcag 360caacgccttt atccagagcg ccgacggcac cggatggtac tacttgaagc cggacggcac 420cctcgcggat cggcccgaga agttcatgta ctgactcgag gcag 464<210>27<211>652<212>PRT<213>人工序列<220>
<223>肺炎鏈球菌C-LytA，P2 T輔助表位和人P501S的51-553氨基酸之間的雜交蛋白-優化密碼子<400>27Met Ala Ala Ala Tyr Val His Ser Asp Gly Ser Tyr Pro Lys Asp Lys1 5 10 15Phe Glu Lys Ile Asn Gly Thr Trp Tyr Tyr Phe Asp Ser Ser Gly Tyr20 25 30Met Leu Ala Asp Arg Trp Arg Lys His Thr Asp Gly Asn Trp Tyr Trp35 40 45Phe Asp Asn Ser Gly Glu Met Ala Thr Gly Trp Lys Lys Ile Ala Asp50 55 60Lys Trp Tyr Tyr Phe Asn Glu Glu Gly Ala Met Lys Thr Gly Trp Val65 70 75 80Lys Tyr Lys Asp Thr Trp Tyr Tyr Leu Asp Ala Lys Glu Gly Ala Met85 90 95
Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Gly Val100 105 110Met Val Ser Asn Ala phe Ile Gln Ser Ala Asp Gly Thr Gly Trp Tyr115 120 125Tyr Leu Lys Pro Asp Gly Thr Leu Ala Asp Arg Pro Glu Lys Phe Met130 135 140Tyr Met Val Leu Gly Ile Gly Pro Val Leu Gly Leu Val Cys Val Pro145 150 155 160Leu Leu Gly Ser Ala Ser Asp His Trp Arg Gly Arg Tyr Gly Arg Arg165 170 175Arg Pro Phe Ile Trp Ala Leu Ser Leu Gly Ile Leu Leu Ser Leu Phe180 185 190Leu Ile Pro Arg Ala Gly Trp Leu Ala Gly Leu Leu Cys Pro Asp Pro195 200 205Arg Pro Leu Glu Leu Ala Leu Leu Ile Leu Gly Val Gly Leu Leu Asp210 215 220Phe Cys Gly Gln Val Cys Phe Thr Pro Leu Glu Ala Leu Leu Ser Asp225 230 235 240Leu Phe Arg Asp Pro Asp His Cys Arg Gln Ala Tyr Ser Val Tyr Ala245 250 255Phe Met Ile Ser Leu Gly Gly Cys Leu Gly Tyr Leu Leu Pro Ala Ile260 265 270Asp Trp Asp Thr Ser Ala Leu Ala Pro Tyr Leu Gly Thr Gln Glu Glu275 280 285Cys Leu Phe Gly Leu Leu Thr Leu Ile Phe Leu Thr Cys Val Ala Ala290 295 300Thr Leu Leu Val Ala Glu Glu Ala Ala Leu Gly Pro Thr Glu Pro Ala305 310 315 320Glu Gly Leu Ser Ala Pro Ser Leu Ser Pro His Cys Cys Pro Cys Arg325 330 335Ala Arg Leu Ala Phe Arg Asn Leu Gly Ala Leu Leu Pro Arg Leu His340 345 350Gln Leu Cys Cys Arg Met Pro Arg Thr Leu Arg Arg Leu Phe Val Ala355 360 365Glu Leu Cys Ser Trp Met Ala Leu Met Thr Phe Thr Leu Phe Tyr Thr370 375 380Asp Phe Val Gly Glu Gly Leu Tyr Gln Gly Val Pro Arg Ala Glu Pro385 390 395 400Gly Thr Glu Ala Arg Arg His Tyr Asp Glu Gly Val Arg Met Gly Ser405 410 415Leu Gly Leu Phe Leu Gln Cys Ala Ile Ser Leu Val Phe Ser Leu Val420 425 430Met Asp Arg Leu Val Gln Arg Phe Gly Thr Arg Ala Val Tyr Leu Ala435 440 445Ser Val Ala Ala Phe pro Val Ala Ala Gly Ala Thr Cys Leu Ser His450 455 460Ser Val Ala Val Val Thr Ala Ser Ala Ala Leu Thr Gly Phe Thr Phe465 470 475 480Ser Ala Leu Gln Ile Leu Pro Tyr Thr Leu Ala Ser Leu Tyr His Arg485 490 495Glu Lys Gln Val Phe Leu Pro Lys Tyr Arg Gly Asp Thr Gly Gly Ala500 505 510Ser Ser Glu Asp Ser Leu Met Thr Ser Phe Leu Pro Gly Pro Lys Pro515 520 525Gly Ala Pro Phe Pro Asn Gly His Val Gly Ala Gly Gly Ser Gly Leu530 535 540Leu Pro Pro Pro Pro Ala Leu Cys Gly Ala Ser Ala Cys Asp Val Ser545 550 555 560Val Arg Val Val Val Gly Glu Pro Thr Glu Ala Arg Val Val Pro Gly565 570 575Arg Gly Ile Cys Leu Asp Leu Ala Ile Leu Asp Ser Ala Phe Leu Leu
580 585 590Ser Gln Val Ala Pro Ser Leu Phe Met Gly Ser Ile Val Gln Leu Ser595 600 605Gln Ser Val Thr Ala Tyr Met Val Ser Ala Ala Gly Leu Gly Leu Val610 615 620Ala Ile Tyr Phe Ala Thr Gln Val Val Phe Asp Lys Ser Asp Leu Ala625 630 635 640Lys Tyr Ser Ala Gly Gly His His His His His His645 650<210>28<211>1959<212>DNA<213>人工序列<220>
<223>編碼肺炎鏈球菌C-LytA，P2 T輔助表位和人P501S的51-553氨基酸之間的雜交蛋白的DNA<400>28atggcggccg cttacgtaca ttccgacggc tcttatccaa aagacaagtt tgagaaaatc 60aatggcactt ggtactactt tgacagttca ggctatatgc ttgcagaccg ctggaggaag 120cacacagacg gcaactggta ctggttcgac aactcaggcg aaatggctac aggctggaag 180aaaatcgctg ataagtggta ctatttcaac gaagaaggtg ccatgaagac aggctgggtc 240aagtacaagg acacttggta ctacttagac gctaaagaag gcgccatgca atacatcaag 300gctaactcra agttcattgg tatcactgaa ggcgtcatgg tatcaaatgc ctttatccag 360tcagcggacg gaacaggctg gtactacctc aaaccagacg gaacactggc agacaggcca 420gaaaagttca tgtacatggt gctgggcatt ggtccagtgc tgggcctggt ctgtgtcccg 480ctcctaggct cagccagtga ccactggcgt ggacgctatg gccgccgccg gcccttcatc 540tgggcactgt ccttgggcat cctgctgagc ctctttctca tcccaagggc cggctggcta 600gcagggctgc tgtgcccgga tcccaggccc ctggagctgg cactgctcat cctgggcgtg 660gggctgctgg acttctgtgg ccaggtgtgc ttcactccac tggaggccct gctctctgac 720ctcttccggg acccggacca ctgtcgccag gcctactctg tctatgcctt catgatcagt 780cttgggggct gcctgggcta cctcctgcct gccattgact gggacaccag tgccctggcc 840ccctacctgg gcacccagga ggagtgcctc tttggcctgc tcaccctcat cttcctcacc 900tgcgtagcag ccacactgct ggtggctgag gaggcagcgc tgggccccac cgagccagca 960gaagggctgt cggccccctc cttgtcgccc cactgctgtc catgccgggc ccgcttggct 1020ttccggaacc tgggcgccct gcttccccgg ctgcaccagc tgtgctgccg catgccccgc 1080accctgcgcc ggctcttcgt ggctgagctg tgcagctgga tggcactcat gaccttcacg 1140ctgttttaca cggatttcgt gggcgagggg ctgtaccagg gcgtgcccag agctgagccg 1200ggcaccgagg cccggagaca ctatgatgaa ggcgttcgga tgggcagcct ggggctgttc 1260ctgcagtgcg ccatctccct ggtcttctct ctggtcatgg accggctggt gcagcgattc 1320ggcactcgag cagtctattt ggccagtgtg gcagctttcc ctgtggctgc cggtgccaca 1380tgcctgtccc acagtgtggc cgtggtgaca gcttcagccg ccctcaccgg gttcaccttc 1440tcagccctgc agatcctgcc ctacacactg gcctccctct accaccggga gaagcaggtg 1500ttcctgccca aataccgagg ggacactgga ggtgctagca gtgaggacag cctgatgacc 1560agcttcctgc caggccctaa gcctggagct cccttcccta atggacacgt gggtgctgga 1620ggcagtggcc tgctcccacc tccacccgcg ctctgcgggg cctctgcctg tgatgtctcc 1680gtacgtgtgg tggtgggtga gcccaccgag gccagggtgg ttccgggccg gggcatctgc 1740ctggacctcg ccatcctgga tagtgccttc ctgctgtccc aggtggcccc atccctgttt 1800atgggctcca ttgtccagct cagccagtct gtcactgcct atatggtgtc tgccgcaggc 1860ctgggtctgg tcgccattta ctttgctaca caggtagtat ttgacaagag cgacttggcc 1920aaatactcag cgggtggaca ccatcaccat caccattaa1959<210>29<211>507<212>PRT<213>人工序列
<220>
<223>與6個組氨酸殘基融合的人P501S(氨基酸55-553)<400>29Met Val Leu Gly Ile Gly Pro Val Leu Gly Leu Val Cys Val Pro Leu1 5 10 15Leu Gly Ser Ala Ser Asp His Trp Arg Gly Arg Tyr Gly Arg Arg Arg20 25 30Pro Phe Ile Trp Ala Leu Ser Leu Gly Ile Leu Leu Ser Leu Phe Leu35 40 45Ile Pro Arg Ala Gly Trp Leu Ala Gly Leu Leu Cys Pro Asp Pro Arg50 55 60Pro Leu Glu Leu Ala Leu Leu Ile Leu Gly Val Gly Leu Leu Asp Phe65 70 75 80Cys Gly Gln Val Cys Phe Thr Pro Leu Glu Ala Leu Leu Ser Asp Leu85 90 95Phe Arg Asp Pro Asp His Cys Arg Gln Ala Tyr Ser Val Tyr Ala Phe100 105 110Met Ile Ser Leu Gly Gly Cys Leu Gly Tyr Leu Leu Pro Ala Ile Asp115 120 125Trp Asp Thr Ser Ala Leu Ala Pro Tyr Leu Gly Thr Gln Glu Glu Cys130 135 140Leu Phe Gly Leu Leu Thr Leu Ile Phe Leu Thr Cys Val Ala Ala Thr145 150 155 160Leu Leu Val Ala Glu Glu Ala Ala Leu Gly Pro Thr Glu Pro Ala Glu165 170 175Gly Leu Ser Ala Pro Ser Leu Ser Pro His Cys Cys Pro Cys Arg Ala180 185 190Arg Leu Ala Phe Arg Asn Leu Gly Ala Leu Leu Pro Arg Leu His Gln195 200 205Leu Cys Cys Arg Met Pro Arg Thr Leu Arg Arg Leu Phe Val Ala Glu210 215 220Leu Cys Ser Trp Met Ala Leu Met Thr Phe Thr Leu Phe Tyr Thr Asp225 230 235 240Phe Val Gly Glu Gly Leu Tyr Gln Gly Val Pro Arg Ala Glu Pro Gly245 250 255Thr Glu Ala Arg Arg His Tyr Asp Glu Gly Val Arg Met Gly Ser Leu260 265 270Gly Leu Phe Leu Gln Cys Ala Ile Ser Leu Val Phe Ser Leu Val Met275 280 285Asp Arg Leu Val Gln Arg Phe Gly Thr Arg Ala Val Tyr Leu Ala Ser290 295 300Val Ala Ala Phe Pro Val Ala Ala Gly Ala Thr Cys Leu Ser His Ser305 310 315 320Val Ala Val Val Thr Ala Ser Ala Ala Leu Thr Gly Phe Thr Phe Ser325 330 335Ala Leu Gln Ile Leu Pro Tyr Thr Leu Ala Ser Leu Tyr His Arg Glu340 345 350Lys Gln Val Phe Leu Pro Lys Tyr Arg Gly Asp Thr Gly Gly Ala Ser355 360 365Ser Glu Asp Ser Leu Met Thr Ser Phe Leu Pro Gly Pro Lys Pro Gly370 375 380Ala Pro Phe Pro Asn Gly His Val Gly Ala Gly Gly Ser Gly Leu Leu385 390 395 400Pro Pro Pro Pro Ala Leu Cys Gly Ala Ser Ala Cys Asp Val Ser Val405 410 415Arg Val Val Val Gly Glu Pro Thr Glu Ala Arg Val Val Pro Gly Arg420 425 430Gly Ile Cys Leu Asp Leu Ala Ile Leu Asp Ser Ala Phe Leu Leu Ser435 440 445
Gln Val Ala Pro Ser Leu Phe Met Gly Ser Ile Val Gln Leu Ser Gln450 455 460Ser Val Thr Ala Tyr Met Val Ser Ala Ala Gly Leu Gly Leu Val Ala465 470 475 480Ile Tyr Phe Ala Thr Gln Val Val Phe Asp Lys Ser Asp Leu Ala Lys485 490 495Tyr Ser Ala Gly Gly His His His His His His500 505<210>30<211>1524<212>DNA<213>人工序列<220>
<223>與6個組氨酸殘基融合的人P501S(氨基酸55-553)<400>30atggtgctgg gcattggtcc agtgctgggc ctggtctgtg tcccgctcct aggctcagcc 60agtgaccact ggcgtggacg ctatggccgc cgccggccct tcatctgggc actgtccttg 120ggcatcctgc tgagcctctt tctcatccca agggccggct ggctagcagg gctgctgtgc 180ccggatccca ggcccctgga gctggcactg ctcatcctgg gcgtggggct gctggacttc 240tgtggccagg tgtgcttcac tccactggag gccctgctct ctgacctctt ccgggacccg 300gaccactgtc gccaggccta ctctgtctat gccttcatga tcagtcttgg gggctgcctg 360ggctacctcc tgcctgccat tgactgggac accagtgccc tggcccccta cctgggcacc 420caggaggagt gcctctttgg cctgctcacc ctcatcttcc tcacctgcgt agcagccaca 480ctgctggtgg ctgaggaggc agcgctgggc cccaccgagc cagcagaagg gctgtcggcc 540ccctccttgt cgccccactg ctgtccatgc cgggcccgct tggctttccg gaacctgggc 600gccctgcttc cccggctgca ccagctgtgc tgccgcatgc cccgcaccct gcgccggctc 660ttcgtggctg agctgtgcag ctggatggca ctcatgacct tcacgctgtt ttacacggat 720ttcgtgggcg aggggctgta ccagggcgtg cccagagctg agccgggcac cgaggcccgg 780agacactatg atgaaggcgt tcggatgggc agcctggggc tgttcctgca gtgcgccatc 840tccctggtct tctctctggt catggaccgg ctggtgcagc gattcggcac tcgagcagtc 900tatttggcca gtgtggcagc tttccctgtg gctgccggtg ccacatgcct gtcccacagt 960gtggccgtgg tgacagcttc agccgccctc accgggttca ccttctcagc cctgcagatc 1020ctgccctaca cactggcctc cctctaccac cgggagaagc aggtgttcct gcccaaatac 1080cgaggggaca ctggaggtgc tagcagtgag gacagcctga tgaccagctt cctgccaggc 1140cctaagcctg gagctccctt ccctaatgga cacgtgggtg ctggaggcag tggcctgctc 1200ccacctccac ccgcgctctg cggggcctct gcctgtgatg tctccgtacg tgtggtggtg 1260ggtgagccca ccgaggccag ggtggttccg ggccggggca tctgcctgga cctcgccatc 1320ctggatagtg ccttcctgct gtcccaggtg gccccatccc tgtttatggg ctccattgtc 1380cagctcagcc agtctgtcac tgcctatatg gtgtctgccg caggcctggg tctggtcgcc 1440atttactttg ctacacaggt agtatttgac aagagcgact tggccaaata ctcagcgggt 1500ggacaccatc accatcacca ttaa1524<210>31<211>685<212>PRT<213>人工序列<220>
<223>與6個組氨酸殘基融合的人P5 01S(氨基酸1-34與氨基酸55-553融合)<400>31Met Ala Ala Val Gln Arg Leu Trp Val Ser Arg Leu Leu Arg His Arg1 5 10 15Lys Ala Gln Leu Leu Leu Val Asn Leu Leu Thr Phe Gly Leu Glu Val20 25 30
Cys Leu Ala Ala Ala Tyr Val His Ser Asp Gly Ser Tyr Pro Lys Asp35 40 45Lys Phe Glu Lys Ile Asn Gly Thr Trp Tyr Tyr Phe Asp Ser Ser Gly50 55 60Tyr Met Leu Ala Asp Arg Trp Arg Lys His Thr Asp Gly Asn Trp Tyr65 70 75 80Trp Phe Asp Asn Ser Gly Glu Met Ala Thr Gly Trp Lys Lys Ile Ala85 90 95Asp Lys Trp Tyr Tyr Phe Asn Glu Glu Gly Ala Met Lys Thr Gly Trp100 105 110Val Lys Tyr Lys Asp Thr Trp Tyr Tyr Leu Asp Ala Lys Glu Gly Ala115 120 125Met Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Gly130 135 140Val Met Val Ser Asn Ala Phe Ile Gln Ser Ala Asp Gly Thr Gly Trp145 150 155 160Tyr Tyr Leu Lys Pro Asp Gly Thr Leu Ala Asp Arg Pro Glu Lys Phe165 170 175Met Tyr Met Val Leu Gly Ile Gly Pro Val Leu Gly Leu Val Cys Val180 185 190Pro Leu Leu Gly Ser Ala Ser Asp His Trp Arg Gly Arg Tyr Gly Arg195 200 205Arg Arg Pro Phe Ile Trp Ala Leu Ser Leu Gly Ile Leu Leu Ser Leu210 215 220Phe Leu Ile Pro Arg Ala Gly Trp Leu Ala Gly Leu Leu Cys Pro Asp225 230 235 240Pro Arg Pro Leu Glu Leu Ala Leu Leu Ile Leu Gly Val Gly Leu Leu245 250 255Asp Phe Cys Gly Gln Val Cys Phe Thr Pro Leu Glu Ala Leu Leu Ser260 265 270Asp Leu Phe Arg Asp Pro Asp His Cys Arg Gln Ala Tyr Ser Val Tyr275 280 285Ala Phe Met lle Ser Leu Gly Gly Cys Leu Gly Tyr Leu Leu Pro Ala290 295 300Ile Asp Trp Asp Thr Ser Ala Leu Ala Pro Tyr Leu Gly Thr Gln Glu305 310 315 320Glu Cys Leu Phe Gly Leu Leu Thr Leu Ile Phe Leu Thr Cys Val Ala325 330 335Ala Thr Leu Leu Val Ala Glu Glu Ala Ala Leu Gly Pro Thr Glu Pro340 345 350Ala Glu Gly Leu Ser Ala Pro Ser Leu Ser Pro His Cys Cys Pro Cys355 360 365Arg Ala Arg Leu Ala Phe Arg Asn Leu Gly Ala Leu Leu Pro Arg Leu370 375 380His Gln Leu Cys Cys Arg Met Pro Arg Thr Leu Arg Arg Leu Phe Val385 390 395 400Ala Glu Leu Cys Ser Trp Met Ala Leu Met Thr Phe Thr Leu Phe Tyr405 410 415Thr Asp Phe Val Gly Glu Gly Leu Tyr Gln Gly Val Pro Arg Ala Glu420 425 430Pro Gly Thr Glu Ala Arg Arg His Tyr Asp Glu Gly Val Arg Met Gly435 440 445Ser Leu Gly Leu Phe Leu Gln Cys Ala Ile Ser Leu Val Phe Ser Leu450 455 460Val Met Asp Arg Leu Val Gln Arg Phe Gly Thr Arg Ala Val Tyr Leu465 470 475 480Ala Ser Val Ala Ala Phe Pro Val Ala Ala Gly Ala Thr Cys Leu Ser485 490 495His Ser Val Ala Val Val Thr Ala Ser Ala Ala Leu Thr Gly Phe Thr500 505 510Phe Ser Ala Leu Gln Ile Leu Pro Tyr Thr Leu Ala Ser Leu Tyr His
515 520 525Arg Glu Lys Gln Val Phe Leu Pro Lys Tyr Arg Gly Asp Thr Gly Gly530 535 540Ala Ser Ser Glu Asp Ser Leu Met Thr Ser Phe Leu Pro Gly Pro Lys545 550 555 560Pro Gly Ala Pro Phe Pro Asn Gly His Val Gly Ala Gly Gly Ser Gly565 570 575Leu Leu Pro Pro Pro Pro Ala Leu Cys Gly Ala Ser Ala Cys Asp Val580 585 590Ser Val Arg Val Val Val Gly Glu Pro Thr Glu Ala Arg Val Val Pro595 600 605Gly Arg Gly Ile Cys Leu Asp Leu Ala Ile Leu Asp Ser Ala Phe Leu610 615 620Leu Ser Gln Val Ala Pro Ser Leu Phe Met Gly Ser Ile Val Gln Leu625 630 635 640Ser Gln Ser Val Thr Ala Tyr Met Val Ser Ala Ala Gly Leu Gly Leu645 650 655Val Ala Ile Tyr Phe Ala Thr Gln Val Val Phe Asp Lys Ser Asp Leu660 665 670Ala Lys Tyr Ser Ala Gly Gly His His His His His His675 680 685<210>32<211>2058<212>DNA<213>人工序列<220>
<223>編碼與6個組氨酸殘基融合的人P501S(氨基酸1-34與氨基酸55-553融合)的DNA<400>32atggcggccg tgcagaggct atgggtatcg agactgctaa gacaccgcaa agctcagttg 60ttgttggtta acttgttgac cttcgggctg gaagtctgtt tggcggccgc ttacgtacat 120tccgacggct cttatccaaa agacaagttt gagaaaatca atggcacttg gtactacttt 180gacagttcag gctatatgct tgcagaccgc tggaggaagc acacagacgg caactggtac 240tggttcgaca actcaggcga aatggctaca ggctggaaga aaatcgctga taagtggtac 300tatttcaacg aagaaggtgc catgaagaca ggctgggtca agtacaagga cacttggtac 360tacttagacg ctaaagaagg cgccatgcaa tacatcaagg ctaactctaa gttcattggt 420atcactgaag gcgtcatggt atcaaatgcc tttatccagt cagcggacgg aacaggctgg 480tactacctca aaccagacgg aacactggca gacaggccag aaaagttcat gtacatggtg 540ctgggcattg gtccagtgct gggcctggtc tgtgtcccgc tcctaggctc agccagtgac 600cactggcgtg gacgctatgg ccgccgccgg cccttcatct gggcactgtc cttgggcatc 660ctgctgagcc tctttctcat cccaagggcc ggctggctag cagggctgct gtgcccggat 720cccaggcccc tggagctggc actgctcatc ctgggcgtgg ggctgctgga cttctgtggc 780caggtgtgct tcactccact ggaggccctg ctctctgacc tcttccggga cccggaccac 840tgtcgccagg cctactctgt ctatgccttc atgatcagtc ttgggggctg cctgggctac 900ctcctgcctg ccattgactg ggacaccagt gccctggccc cctacctggg cacccaggag 960gagtgcctct ttggcctgct caccctcatc ttcctcacct gcgtagcagc cacactgctg 1020gtggctgagg aggcagcgct gggccccacc gagccagcag aagggctgtc ggccccctcc 1080ttgtcgcccc actgctgtcc atgccgggcc cgcttggctt tccggaacct gggcgccctg 1140cttccccggc tgcaccagct gtgctgccgc atgccccgca ccctgcgccg gctcttcgtg 1200gctgagctgt gcagctggat ggcactcatg accttcacgc tgttttacac ggatttcgtg 1260ggcgaggggc tgtaccaggg cgtgcccaga gctgagccgg gcaccgaggc ccggagacac 1320tatgatgaag gcgttcggat gggcagcctg gggctgttcc tgcagtgcgc catctccctg 1380gtcttctctc tggtcatgga ccggctggtg cagcgattcg gcactcgagc agtctatttg 1440gccagtgtgg cagctttccc tgtggctgcc ggtgccacat gcctgtccca cagtgtggcc 1500gtggtgacag cttcagccgc cctcaccggg ttcaccttct cagccctgca gatcctgccc 1560tacacactgg cctccctcta ccaccgggag aagcaggtgt tcctgcccaa ataccgaggg 1620gacactggag gtgctagcag tgaggacagc ctgatgacca gcttcctgcc aggccctaag 1680
cctggagctc ccttccctaa tggacacgtg ggtgctggag gcagtggcct gctcccacct 1740ccacccgcgc tctgcggggc ctctgcctgt gatgtctccg tacgtgtggt ggtgggtgag 1800cccaccgagg ccagggtggt tccgggccgg ggcatctgcc tggacctcgc catcctggat 1860agtgccttcc tgctgtccca ggtggcccca tccctgttta tgggctccat tgtccagctc 1920agccagtctg tcactgccta tatggtgtct gccgcaggcc tgggtctggt cgccatttac 1980tttgctacac aggtagtatt tgacaagagc gacttggcca aatactcagc gggtggacac 2040catcaccatc accattaa 2058<210>33<211>671<212>PRT<213>人工序列<220>
<223>與酵母α前原信號序列下游的6個組氨酸殘基融合的人P501S(氨基酸55-553)融合的P2 T輔助表位融合的肺炎鏈球菌C-LytA部分<400>33Met Ala Ala Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala1 5 10 15Ser Ser Ala Leu Ala Ala Ala Tyr Val His Ser Asp Gly Ser Tyr Pro20 25 30Lys Asp Lys Phe Glu Lys Ile Asn Gly Thr Trp Tyr Tyr Phe Asp Ser35 40 45Ser Gly Tyr Met Leu Ala Asp Arg Trp Arg Lys His Thr Asp Gly Asn50 55 60Trp Tyr Trp Phe Asp Asn Ser Gly Glu Met Ala Thr Gly Trp Lys Lys65 70 75 80Ile Ala Asp Lys Trp Tyr Tyr Phe Asn Glu Glu Gly Ala Met Lys Thr85 90 95Gly Trp Val Lys Tyr Lys Asp Thr Trp Tyr Tyr Leu Asp Ala Lys Glu100 105 110Gly Ala Met Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr115 120 125Glu Gly Val Met Val Ser Asn Ala Phe Ile Gln Ser Ala Asp Gly Thr130 135 140Gly Trp Tyr Tyr Leu Lys Pro Asp Gly Thr Leu Ala Asp Arg Pro Glu145 150 155 160Lys Phe Met Tyr Met Val Leu Gly Ile Gly Pro Val Leu Gly Leu Val165 170 175Cys Val Pro Leu Leu Gly Ser Ala Ser Asp His Trp Arg Gly Arg Tyr180 185 190Gly Arg Arg Arg Pro Phe Ile Trp Ala Leu Ser Leu Gly Ile Leu Leu195 200 205Ser Leu Phe Leu Ile Pro Arg Ala Gly Trp Leu Ala Gly Leu Leu Cys210 215 220Pro Asp Pro Arg Pro Leu Glu Leu Ala Leu Leu Ile Leu Gly Val Gly225 230 235 240Leu Leu Asp Phe Cys Gly Gln Val Cys Phe Thr Pro Leu Glu Ala Leu245 250 255Leu Ser Asp Leu Phe Arg Asp Pro Asp His Cys Arg Gln Ala Tyr Ser260 265 270Val Tyr Ala Phe Met Ile Ser Leu Gly Gly Cys Leu Gly Tyr Leu Leu275 280 285Pro Ala Ile Asp Trp Asp Thr Ser Ala Leu Ala Pro Tyr Leu Gly Thr290 295 300Gln Glu Glu Cys Leu Phe Gly Leu Leu Thr Leu Ile Phe Leu Thr Cys305 310 315 320Val Ala Ala Thr Leu Leu Val Ala Glu Glu Ala Ala Leu Gly Pro Thr
325 330 335Glu Pro Ala Glu Gly Leu Ser Ala Pro Ser Leu Ser Pro His Cys Cys340 345 350Pro Cys Arg Ala Arg Leu Ala Phe Arg Asn Leu Gly Ala Leu Leu Pro355 360 365Arg Leu His Gln Leu Cys Cys Arg Met Pro Arg Thr Leu Arg Arg Leu370 375 380Phe Val Ala Glu Leu Cys Ser Trp Met Ala Leu Met Thr Phe Thr Leu385 390 395 400Phe Tyr Thr Asp Phe Val Gly Glu Gly Leu Tyr Gln Gly Val Pro Arg405 410 415Ala Glu Pro Gly Thr Glu Ala Arg Arg His Tyr Asp Glu Gly Val Arg420 425 430Met Gly Ser Leu Gly Leu Phe Leu Gln Cys Ala Ile Ser Leu Val Phe435 440 445Ser Leu Val Met Asp Arg Leu Val Gln Arg Phe Gly Thr Arg Ala Val450 455 460Tyr Leu Ala Ser Val Ala Ala Phe Pro Val Ala Ala Gly Ala Thr Cys465 470 475 480Leu Ser His Ser Val Ala Val Val Thr Ala Ser Ala Ala Leu Thr Gly485 490 495Phe Thr Phe Ser Ala Leu Gln Ile Leu Pro Tyr Thr Leu Ala Ser Leu500 505 510Tyr His Arg Glu Lys Gln Val Phe Leu Pro Lys Tyr Arg Gly Asp Thr515 520 525Gly Gly Ala Ser Ser Glu Asp Ser Leu Met Thr Ser Phe Leu Pro Gly530 535 540Pro Lys Pro Gly Ala Pro Phe Pro Asn Gly His Val Gly Ala Gly Gly545 550 555 560Ser Gly Leu Leu Pro Pro Pro Pro Ala Leu Cys Gly Ala Ser Ala Cys565 570 575Asp Val Ser Val Arg Val Val Val Gly Glu Pro Thr Glu Ala Arg Val580 585 590Val Pro Gly Arg Gly Ile Cys Leu Asp Leu Ala Ile Leu Asp Ser Ala595 600 605Phe Leu Leu Ser Gln Val Ala Pro Ser Leu Phe Met Gly Ser Ile Val610 615 620Gln Leu Ser Gln Ser Val Thr Ala Tyr Met Val Ser Ala Ala Gly Leu625 630 635 640Gly Leu Val Ala Ile Tyr Phe Ala Thr Gln Val Val Phe Asp Lys Ser645 650 655Asp Leu Ala Lys Tyr Ser Ala Gly Gly His His His His His His660 665 670<210>34<211>2477<212>DNA<213>人工序列<220>
<223>編碼與酵母α前原信號序列下游的6個組氨酸殘基融合的人P501S(氨基酸55-553)融合的P2 T輔助表位融合的肺炎鏈球菌C-LytA部分的DNA<400>34tacgtacatt ccgacggctc ttatccaaaa gacaagtttg agaaaatcaa tggcacttgg 60tactactttg acagttcagg ctatatgctt gcagaccgct ggaggaagca cacagacggc 120aactggtact ggttcgacaa ctcaggcgaa atggctacag gctggaagaa aatcgctgat 180aagtggtact atttcaacga agaaggtgcc atgaagacag gctgggtcaa gtacaaggac 240
acttggtact acttagacgc taaagaaggc gccatgcaat acatcaaggc taactctaag 300ttcattggta tcactgaagg cgtcatggta tcaaatgcct ttatccagtc agcggacgga 360acaggctggt actacctcaa accagacgga acactggcag acaggccaga aatggcggcc 420agatttcctt caatttttac tgcagtttta ttcgcagcat cctccgcatt agcggccgct 480tacgtacatt ccgacggctc ttatccaaaa gacaagtttg agaaaatcaa tggcacttgg 540tactactttg acagttcagg ctatatgctt gcagaccgct ggaggaagca cacagacggc 600aactggtact ggttcgacaa ctcaggcgaa atggctacag gctggaagaa aatcgctgat 660aagtggtact atttcaacga agaaggtgcc atgaagacag gctgggtcaa gtacaaggac 720acttggtact acttagacgc taaagaaggc gccatgcaat acatcaaggc taactctaag 780ttcattggta tcactgaagg cgtcatggta tcaaatgcct ttatccagtc agcggacgga 840acaggctggt actacctcaa accagacgga acactggcag acaggccaga agctggtatt 900acttacgttc caccattgtt gttggaagtt ggtgttgaag aaaagttcat gtacatggtg 960ctgggcattg gtccagtgct gggcctggtc tgtgtcccgc tcctaggctc agccagtgac 1020cactggcgtg gacgctatgg ccgccgccgg cccttcatct gggcactgtc cttgggcatc 1080ctgctgagcc tctttctcat cccaagggcc ggctggctag cagggctgct gtgcccggat 1140cccaggcccc tggagctggc actgctcatc ctgggcgtgg ggctgctgga cttctgtggc 1200caggtgtgct tcactccact ggaggccctg ctctctgacc tcttccggga cccggaccac 1260tgtcgccagg cctactctgt ctatgcttca tgatcagtct tgggggctgc ctgggctacc 1320tcctgcctgc cattgactgg gacaccagtg ccctggcccc ctacctgggc acccaggagg 1380agtgcctctt tggcctgctc accctcatct tcctcacctg cgtagcagcc acactgctgg 1440tggctgagga ggcagcgctg ggccccaccg agccagcaga agggctgtcg gccccctcct 1500tgtcgcccca ctgctgtcca tgccgggccc gcttggcttt ccggaacctg ggcgccctgc 1560ttccccggct gcaccagctg tgctgccgca tgccccgcac cctgcgccgg ctcttcgtgg 1620ctgagctgtg cagctggatg gcactcatga ccttcacgct gttttacacg gatttcgtgg 1680gcgaggggct gtaccagggc gtgcccagag ctgagccggg caccgaggcc cggagacact 1740atgatgaagg cgttcggatg ggcagcctgg ggctgttcct gcagtgcgcc atctccctgg 1800tcttctctct ggtcatggac cggctggtgc agcgattcgg cactcgagca gtctatttgg 1860ccagtgtggc agctttccct gtggctgccg gtgccacatg cctgtcccac agtgtggccg 1920tggtgacagc ttcagccgcc ctcaccgggt tcaccttctc agccctgcag atcctgccct 1980acacactggc ctccctctac caccgggaga agcaggtgtt cctgcccaaa taccgagggg 2040acactggagg tgctagcagt gaggacagcc tgatgaccag cttcctgcca ggccctaagc 2100ctggagctcc cttccctaat ggacacgtgg gtgctggagg cagtggcctg ctcccacctc 2160cacccgcgct ctgcggggcc tctgcctgtg atgtctccgt acgtgtggtg gtgggtgagc 2220ccaccgaggc cagggtggtt ccgggccggg gcatctgcct ggacctcgcc atcctggata 2280gtgccttcct gctgtcccag gtggccccat ccctgtttat gggctccatt gtccagctca 2340gccagtctgt cactgcctat atggtgtctg ccgcaggcct gggtctggtc gccatttact 2400ttgctacaca ggtagtattt gacaagagcg acttggccaa atactcagcg ggtggacacc 2460atcaccatca ccattaa2477<210>35<211>595<212>PRT<213>人工序列<220>
<223>與酵母α前原信號序列下游的6個組氨酸殘基融合的人P501S(氨基酸55-553)<400>35Met Ser Phe Leu Asn Phe Thr Ala Val Leu Phe Ala Ala Ser Ser Ala1 5 10 15Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln Ile20 25 30Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Lsu Glu Gly Asp Phe Asp35 40 45Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu Phe50 55 60Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val Ser65 70 75 80Leu Glu Lys Arg Glu Ala Glu Ala Met Val Leu Gly Ile Gly Pro Val
85 90 95Leu Gly Leu Val Cys Val Pro Leu Leu Gly Ser Ala Ser Asp His Trp100 105 110Arg Gly Arg Tyr Gly Arg Arg Arg Pro Phe Ile Trp Ala Leu Ser Leu115 120 125Gly Ile Leu Leu Ser Leu Phe Leu Ile Pro Arg Ala Gly Trp Leu Ala130 135 140Gly Leu Leu Cys Pro Asp Pro Arg Pro Leu Glu Leu Ala Leu Leu Ile145 150 155 160Leu Gly Val Gly Leu Leu Asp Phe Cys Gly Gln Val Cys Phe Thr Pro165 170 175Leu Glu Ala Leu Leu Ser Asp Leu Phe Arg Asp Pro Asp His Cys Arg180 185 190Gln Ala Tyr Ser Val Tyr Ala Phe Met Ile Ser Leu Gly Gly Cys Leu195 200 205Gly Tyr Leu Leu Pro Ala Ile Asp Trp Asp Thr Ser Ala Leu Ala Pro210 215 220Tyr Leu Gly Thr Gln Glu Glu Cys Leu Phe Gly Leu Leu Thr Leu Ile225 230 235 240Phe Leu Thr Cys Val Ala Ala Thr Leu Leu Val Ala Glu Glu Ala Ala245 250 255Leu Gly Pro Thr Glu Pro Ala Glu Gly Leu Ser Ala Pro Ser Leu Ser260 265 270Pro His Cys Cys Pro Cys Arg Ala Arg Leu Ala Phe Arg Asn Leu Gly275 280 285Ala Leu Leu Pro Arg Leu His Gln Leu Cys Cys Arg Met Pro Arg Thr290 295 300Leu Arg Arg Leu Phe Val Ala Glu Leu Cys Ser Trp Met Ala Leu Met305 310 315 320Thr Phe Thr Leu Phe Tyr Thr Asp Phe Val Gly Glu Gly Leu Tyr Gln325 330 335Gly Val Pro Arg Ala Glu Pro Gly Thr Glu Ala Arg Arg His Tyr Asp340 345 350Glu Gly Val Arg Met Gly Ser Leu Gly Leu Phe Leu Gln Cys Ala Ile355 360 365Ser Leu Val Phe Ser Leu Val Met Asp Arg Leu Val Gln Arg Phe Gly370 375 380Thr Arg Ala Val Tyr Leu Ala Ser Val Ala Ala Phe Pro Val Ala Ala385 390 395 400Gly Ala Thr Cys Leu Ser His Ser Val Ala Val Val Thr Ala Ser Ala405 410 415Ala Leu Thr Gly Phe Thr Phe Ser Ala Leu Gln Ile Leu Pro Tyr Thr420 425 430Leu Ala Ser Leu Tyr His Arg Glu Lys Gln Val Phe Leu Pro Lys Tyr435 440 445Arg Gly Asp Thr Gly Gly Ala Ser Ser Glu Asp Ser Leu Met Thr Ser450 455 460Phe Leu Pro Gly Pro Lys Pro Gly Ala Pro Phe Pro Asn Gly His Val465 470 475 480Gly Ala Gly Gly Ser Gly Leu Leu Pro Pro Pro Pro Ala Leu Cys Gly485 490 495Ala Ser Ala Cys Asp Val Ser Val Arg Val Val Val Gly Glu Pro Thr500 505 510Glu Ala Arg Val Val Pro Gly Arg Gly Ile Cys Leu Asp Leu Ala Ile515 520 525Leu Asp Ser Ala Phe Leu Leu Ser Gln Val Ala Pro Ser Leu Phe Met530 535 540Gly Ser Ile Val Gln Leu Ser Gln Ser Val Thr Ala Tyr Met Val Ser545 550 555 560Ala Ala Gly Leu Gly Leu Val Ala Ile Tyr Phe Ala Thr Gln Val Val565 570 575
Phe Asp Lys Ser Asp Leu Ala Lys Tyr Ser Ala Gly Gly His His His580 585 590His His His595<210>36<211>1788<212>DNA<213>人工序列<220>
<223>編碼與酵母α前原信號序列下游的6個組氨酸殘基融合的人P501S(氨基酸55-553)的DNA<400>36atgagtttcc tcaattttac tgcagtttta ttcgcagcat cctccgcatt agctgctcca 60gtcaacacta caacagaaga tgaaacggca caaattccgg ctgaagctgt catcggttac 120tcagatttag aaggggattt cgatgttgct gttttgccat tttccaacag cacaaataac 180gggttattgt ttataaatac tactattgcc agcattgctg ctaaagaaga aggggtatct 240ctcgagaaaa gagaggctga agccatggtg ctgggcattg gtccagtgct gggcctggtc 300tgtgtcccgc tcctaggctc agccagtgac cactggcgtg gacgctatgg ccgccgccgg 360cccttcatct gggcactgtc cttgggcatc ctgctgagcc tctttctcat cccaagggcc 420ggctggctag cagggctgct gtgcccggat cccaggcccc tggagctggc actgctcatc 480ctgggcgtgg ggctgctgga cttctgtggc caggtgtgct tcactccact ggaggccctg 540ctctctgacc tcttccggga cccggaccac tgtcgccagg cctactctgt ctatgccttc 600atgatcagtc ttgggggctg cctgggctac ctcctgcctg ccattgactg ggacaccagt 660gccctggccc cctacctggg cacccaggag gagtgcctct ttggcctgct caccctcatc 720ttcctcacct gcgtagcagc cacactgctg gtggctgagg aggcagcgct gggccccacc 780gagccagcag aagggctgtc ggccccctcc ttgtcgcccc actgctgtcc atgccgggcc 840cgcttggctt tccggaacct gggcgccctg cttccccggc tgcaccagct gtgctgccgc 900atgccccgca ccctgcgccg gctcttcgtg gctgagctgt gcagctggat ggcactcatg 960accttcacgc tgttttacac ggatttcgtg ggcgaggggc tgtaccaggg cgtgcccaga 1020gctgagccgg gcaccgaggc ccggagacac tatgatgaag gcgttcggat gggcagcctg 1080gggctgttcc tgcagtgcgc catctccctg gtcttctctc tggtcatgga ccggctggtg 1140cagcgattcg gcactcgagc agtctatttg gccagtgtgg cagctttccc tgtggctgcc 1200ggtgccacat gcctgtccca cagtgtggcc gtggtgacag cttcagccgc cctcaccggg 1260ttcaccttct cagccctgca gatcctgccc tacacactgg cctccctcta ccaccgggag 1320aagcaggtgt tcctgcccaa ataccgaggg gacactggag gtgctagcag tgaggacagc 1380ctgatgacca gcttcctgcc aggccctaag cctggagctc ccttccctaa tggacacgtg 1440ggtgctggag gcagtggcct gctcccacct ccacccgcgc tctgcggggc ctctgcctgt 1500gatgtctccg tacgtgtggt ggtgggtgag cccaccgagg ccagggtggt tccgggccgg 1560ggcatctgcc tggacctcgc catcctggat agtgccttcc tgctgtccca ggtggcccca 1620tccctgttta tgggctccat tgtccagctc agccagtctg tcactgccta tatggtgtct 1680gccgcaggcc tgggtctggt cgccatttac tttgctacac aggtagtatt tgacaagagc 1740gacttggcca aatactcagc gggtggacac catcaccatc accattaa 1788<210>37<211>1955<212>DNA<213>人工序列<220>
<223>編碼與肺炎鏈球菌C-LytA P2輔助表位C-Lyta融合的密碼子優化的人P501S(氨基酸51-553)的DNA<400>37gcggccgcgc caccatggcc gccgcctacg tgcatagcga cgggagctac cccaaggaca 60agttcgagaa gatcaacggg acatggtact acttcgactc ctccggctac atgctcgccg 120
accgctggcg gaagcacacc gacggcaact ggtactggtt cgataactcg ggagagatgg 180ccaccggctg gaagaagatc gcggacaagt ggtactattt caacgaggag ggcgccatga 240agaccggctg ggtgaagtat aaggacacct ggtactacct cgacgccaag gagggcgcca 300tgcagtatat caaggccaac agcaagttca tcggcatcac cgagggagtg atggtcagca 360acgcctttat ccagagcgcc gacggcaccg gatggtacta cttgaagccg gacggcaccc 420tcgcggatcg gcccgagaag ttcatgtaca tggtgctggg catcggcccc gtcctgggcc 480tcgtgtgtgt gcccctcctc gggagtgcgt ccgatcattg gcggggccgc tacggccgcc 540gcagaccgtt catctgggcc ctgagcctgg gcatcctgct ctctctcttc ctgatccccc 600gggccggctg gctggccggc ctgctgtgtc ccgacccccg ccctctggag ctggccctcc 660tgatcctggg cgtgggcctg ctggacttct gcggccaggt gtgtttcact cccctggagg 720ctctgctctc cgacctcttc cgcgaccccg accactgtag gcaggcttac agcgtgtacg 780ccttcatgat cagtctgggg ggatgcctgg gctatctgct gcccgctatc gactgggaca 840ccagcgccct ggccccctac ctggggactc aggaggagtg cctgttcggc ctgctcacct 900tgatcttcct gacgtgcgtc gccgccaccc tgctggtggc cgaggaggcg gccctggggc 960ccaccgagcc cgccgagggc ctgagcgctc ccagcctgag cccccattgc tgcccgtgca 1020gggctaggct cgccttcagg aatctgggcg ctttgctgcc ccgcctgcat cagctgtgct 1080gtcgcatgcc tcgcaccctg cgccgcctgt tcgtcgctga gctctgttcc tggatggccc 1140tgatgacgtt caccctcttc tacaccgact tcgtggggga gggcctgtac cagggcgtgc 1200ccagggccga gcccggcacc gaggctaggc gccattacga cgagggcgtc aggatgggct 1260ctctgggcct cttcctgcag tgcgccatca gtctggtgtt ctctctggtg atggaccggc 1320tggtgcagcg cttcggcacc cgggccgtgt acctcgcctc tgtggcggct ttccccgtcg 1380ccgccggcgc gacctgcctg tctcattctg tcgccgtggt gaccgccagc gccgccctga 1440ccggcttcac cttcagtgcg ctccagattc tgccctacac cctggcgtct ctgtaccatc 1500gcgagaagca ggtgttcctg cccaagtacc gcggggacac agggggagct tcctctgagg 1560acagcctgat gaccagcttc ttgcccggcc ccaagccggg ggcccctttc cccaacggcc 1620atgtcggggc gggcggcagc ggcctgctcc ctcccccccc cgccctgtgc ggcgctagtg 1680cctgcgacgt gagcgtgcgg gtggtggtgg gggagcccac cgaggctagg gtcgtgcctg 1740gccgggggat ctgcctggac ctggccatcc tcgactccgc cttcctgctc tcccaggtgg 1800cgcccagcct gttcatgggc agtatcgtgc agctgagcca gagcgtgacc gcctacatgg 1860tgagcgccgc cggcctgggg ttggtggcca tctactttgc cacccaggtc gtgttcgaca 1920agagcgatct cgccaagtat agcgcctgag gatcc1955<210>38<211>2045<212>DNA<213>人工序列<220>
<223>編碼與肺炎鏈球菌C-LytA P2輔助表位C-Lyta融合的密碼子優化的人P501S(氨基酸1-553)的DNA<400>38gcggccgcgc caccatggcc gccgcctacg tgcatagcga cgggagctac cccaaggaca 60agttcgagaa gatcaacggg acatggtact acttcgactc ctccggctac atgctcgccg 120accgctggcg gaagcacacc gacggcaact ggtactggtt cgataactcg ggagagatgg 180ccaccggctg gaagaagatc gcggacaagt ggtactattt caacgaggag ggcgccatga 240agaccggctg ggtgaagtat aaggacacct ggtactacct cgacgccaag gagggcgcca 300tgcagtatat caaggccaac agcaagttca tcggcatcac cgagggagtg atggtcagca 360acgcctttat ccagagcgcc gacggcaccg gatggtacta cttgaagccg gacggcaccc 420tcgcggatcg gcccgagatg gtgcagcggc tgtgggtgtc ccggctgctg cgccatagaa 480aggcccagtt gctgctggtg aacctgctga ctttcggact ggaggtgtgc ctggctgccg 540tggtgctggg catcggcccc gtcctgggcc tcgtgtgtgt gcccctcctc gggagtgcgt 600ccgatcattg gcggggccgc tacggccgcc gcagaccgtt catctgggcc ctgagcctgg 660gcatcctgct ctctctcttc ctgatccccc gggccggctg gctggccggc ctgctgtgtc 720ccgacccccg ccctctggag ctggccctcc tgatcctggg cgtgggcctg ctggacttct 780gcggccaggt gtgtttcact cccctggagg ctctgctctc cgacctcttc cgcgaccccg 840accactgtag gcaggcttac agcgtgtacg ccttcatgat cagtctgggg ggatgcctgg 900gctatctgct gcccgctatc gactgggaca ccagcgccct ggccccctac ctggggactc 960aggaggagtg cctgttcggc ctgctcacct tgatcttcct gacgtgcgtc gccgccaccc 1020tgctggtggc cgaggaggcg gccctggggc ccaccgagcc cgccgagggc ctgagcgctc 1080ccagcctgag cccccattgc tgcccgtgca gggctaggct cgccttcagg aatctgggcg 1140
ctttgctgcc ccgcctgcat cagctgtgct gtcgcatgcc tcgcaccctg cgccgcctgt 1200tcgtcgctga gctctgttcc tggatggccc tgatgacgtt caccctcttc tacaccgact 1260tcgtggggga gggcctgtac cagggcgtgc ccagggccga gcccggcacc gaggctaggc 1320gccattacga cgagggcgtc aggatgggct ctctgggcct cttcctgcag tgcgccatca 1380gtctggtgtt ctctctggtg atggaccggc tggtgcagcg cttcggcacc cgggccgtgt 1440acctcgcctc tgtggcggct ttccccgtcg ccgccggcgc gacctgcctg tctcattctg 1500tcgccgtggt gaccgccagc gccgccctga ccggcttcac cttcagtgcg ctccagattc 1560tgccctacac cctggcgtct ctgtaccatc gcgagaagca ggtgttcctg cccaagtacc 1620gcggggacac agggggagct tcctctgagg acagcctgat gaccagcttc ttgcccggcc 1680ccaagccggg ggcccctttc cccaacggcc atgtcggggc gggcggcagc ggcctgctcc 1740ctcccccccc cgccctgtgc ggcgctagtg cctgcgacgt gagcgtgcgg gtggtggtgg 1800gggagcccac cgaggctagg gtcgtgcctg gccgggggat ctgcctggac ctggccatcc 1860tcgactccgc cttcctgctc tcccaggtgg cgcccagcct gttcatgggc agtatcgtgc 1920agctgagcca gagcgtgacc gcctacatgg tgagcgccgc cggcctgggg ttggtggcca 1980tctactttgc cacccaggtc gtgttcgaca agagcgatct cgccaagtat agcgcctgag 2040gatcc 2045<210>39<211>2105<212>DNA<213>人工序列<220>
<223>編碼與人P501S(氨基酸1-50)融合的人P501S(氨基酸51-553)融合的肺炎鏈球菌C-LytA P2輔助表位C-Lyta的DNA-優化的密碼子<400>39gcggccgcgc caccatggcc gccgcctacg tgcatagcga cgggagctac cccaaggaca 60agttcgagaa gatcaacggg acatggtact acttcgactc ctccggctac atgctcgccg 120accgctggcg gaagcacacc gacggcaact ggtactggtt cgataactcg ggagagatgg 180ccaccggctg gaagaagatc gcggacaagt ggtactattt caacgaggag ggcgccatga 240agaccggctg ggtgaagtat aaggacacct ggtactacct cgacgccaag gagggcgcca 300tgcagtatat caaggccaac agcaagttca tcggcatcac cgagggagtg atggtcagca 360acgcctttat ccagagcgcc gacggcaccg gatggtacta cttgaagccg gacggcaccc 420tcgcggatcg gcccgagaag ttcatgtaca tggtgctggg catcggcccc gtcctgggcc 480tcgtgtgtgt gcccctcctc gggagtgcgt ccgatcattg gcggggccgc tacggccgcc 540gcagaccgtt catctgggcc ctgagcctgg gcatcctgct ctctctcttc ctgatccccc 600gggccggctg gctggccggc ctgctgtgtc ccgacccccg ccctctggag ctggccctcc 660tgatcctggg cgtgggcctg ctggacttct gcggccaggt gtgtttcact cccctggagg 720ctctgctctc cgacctcttc cgcgaccccg accactgtag gcaggcttac agcgtgtacg 780ccttcatgat cagtctgggg ggatgcctgg gctatctgct gcccgctatc gactgggaca 840ccagcgccct ggccccctac ctggggactc aggaggagtg cctgttcggc ctgctcacct 900tgatcttcct gacgtgcgtc gccgccaccc tgctggtggc cgaggaggcg gccctggggc 960ccaccgagcc cgccgagggc ctgagcgctc ccagcctgag cccccattgc tgcccgtgca 1020gggctaggct cgccttcagg aatctgggcg ctttgctgcc ccgcctgcat cagctgtgct 1080gtcgcatgcc tcgcaccctg cgccgcctgt tcgtcgctga gctctgttcc tggatggccc 1140tgatgacgtt caccctcttc tacaccgact tcgtggggga gggcctgtac cagggcgtgc 1200ccagggccga gcccggcacc gaggctaggc gccattacga cgagggcgtc aggatgggct 1260ctctgggcct cttcctgcag tgcgccatca gtctggtgtt ctctctggtg atggaccggc 1320tggtgcagcg cttcggcacc cgggccgtgt acctcgcctc tgtggcggct ttccccgtcg 1380ccgccggcgc gacctgcctg tctcattctg tcgccgtggt gaccgccagc gccgccctga 1440ccggcttcac cttcagtgcg ctccagattc tgccctacac cctggcgtct ctgtaccatc 1500gcgagaagca ggtgttcctg cccaagtacc gcggggacac agggggagct tcctctgagg 1560acagcctgat gaccagcttc ttgcccggcc ccaagccggg ggcccctttc cccaacggcc 1620atgtcggggc gggcggcagc ggcctgctcc ctcccccccc cgccctgtgc ggcgctagtg 1680cctgcgacgt gagcgtgcgg gtggtggtgg gggagcccac cgaggctagg gtcgtgcctg 1740gccgggggat ctgcctggac ctggccatcc tcgactccgc cttcctgctc tcccaggtgg 1800cgcccagcct gttcatgggc agtatcgtgc agctgagcca gagcgtgacc gcctacatgg 1860tgagcgccgc cggcctgggg ttggtggcca tctactttgc cacccaggtc gtgttcgaca 1920
agagcgatct cgccaagtat agcgccatgg tgcagcggct gtgggtgtcc cggctgctgc 1980gccatagaaa ggcccagttg ctgctggtga acctgctgac tttcggactg gaggtgtgcc 2040tggctgccgg gatcacgtac gtgccccccc tgctgctgga ggtgggcgtg gaggagtgag 2100gatcc 2105<210>40<211>2105<212>DNA<213>人工序列<220>
<223>編碼與人P501S(氨基酸51-553)融合的肺炎鏈球菌C-LytAP2輔助表位C-Lyta融合的人P501S(氨基酸1-50)的DNA-優化的密碼子<400>40gcggccgcgc caccatggtg cagcggctgt gggtgtcccg gctgctgcgc catagaaagg 60cccagttgct gctggtgaac ctgctgactt tcggactgga ggtgtgcctg gctgccggga 120tcacgtacgt gccccccctg ctgctggagg tgggcgtgga ggagatggcc gccgcctacg 180tgcatagcga cgggagctac cccaaggaca agttcgagaa gatcaacggg acatggtact 240acttcgactc ctccggctac atgctcgccg accgctggcg gaagcacacc gacggcaact 300ggtactggtt cgataactcg ggagagatgg ccaccggctg gaagaagatc gcggacaagt 360ggtactattt caacgaggag ggcgccatga agaccggctg ggtgaagtat aaggacacct 420ggtactacct cgacgccaag gagggcgcca tgcagtatat caaggccaac agcaagttca 480tcggcatcac cgagggagtg atggtcagca acgcctttat ccagagcgcc gacggcaccg 540gatggtacta cttgaagccg gacggcaccc tcgcggatcg gcccgagaag ttcatgtaca 600tggtgctggg catcggcccc gtcctgggcc tcgtgtgtgt gcccctcctc gggagtgcgt 660ccgatcattg gcggggccgc tacggccgcc gcagaccgtt catctgggcc ctgagcctgg 720gcatcctgct ctctctcttc ctgatccccc gggccggctg gctggccggc ctgctgtgtc 780ccgacccccg ccctctggag ctggccctcc tgatcctggg cgtgggcctg ctggacttct 840gcggccaggt gtgtttcact cccctggagg ctctgctctc cgacctcttc cgcgaccccg 900accactgtag gcaggcttac agcgtgtacg ccttcatgat cagtctgggg ggatgcctgg 960gctatctgct gcccgctatc gactgggaca ccagcgccct ggccccctac ctggggactc 1020aggaggagtg cctgttcggc ctgctcacct tgatcttcct gacgtgcgtc gccgccaccc 1080tgctggtggc cgaggaggcg gccctggggc ccaccgagcc cgccgagggc ctgagcgctc 1140ccagcctgag cccccattgc tgcccgtgca gggctaggct cgccttcagg aatctgggcg 1200ctttgctgcc ccgcctgcat cagctgtgct gtcgcatgcc tcgcaccctg cgccgcctgt 1260tcgtcgctga gctctgttcc tggatggccc tgatgacgtt caccctcttc tacaccgact 1320tcgtggggga gggcctgtac cagggcgtgc ccagggccga gcccggcacc gaggctaggc 1380gccattacga cgagggcgtc aggatgggct ctctgggcct cttcctgcag tgcgccatca 1440gtctggtgtt ctctctggtg atggaccggc tggtgcagcg cttcggcacc cgggccgtgt 1500acctcgcctc tgtggcggct ttccccgtcg ccgccggcgc gacctgcctg tctcattctg 1560tcgccgtggt gaccgccagc gccgccctga ccggcttcac cttcagtgcg ctccagattc 1620tgccctacac cctggcgtct ctgtaccatc gcgagaagca ggtgttcctg cccaagtacc 1680gcggggacac agggggagct tcctctgagg acagcctgat gaccagcttc ttgcccggcc 1740ccaagccggg ggcccctttc cccaacggcc atgtcggggc gggcggcagc ggcctgctcc 1800ctcccccccc cgccctgtgc ggcgctagtg cctgcgacgt gagcgtgcgg gtggtggtgg 1860gggagcccac cgaggctagg gtcgtgcctg gccgggggat ctgcctggac ctggccatcc 1920tcgactccgc cttcctgctc tcccaggtgg cgcccagcct gttcatgggc agtatcgtgc 1980agctgagcca gagcgtgacc gcctacatgg tgagcgccgc cggcctgggg ttggtggcca 2040tctactttgc cacccaggtc gtgttcgaca agagcgatct cgccaagtat agcgcctgag 2100gatcc 2105<210>41<211>652<212>PRT<213>人工序列<220>
<223>與人P501S融合的肺炎鏈球菌C-LytA P2輔助表位C-Lyta
<400>41Met Ala Ala Ala Tyr Val His Ser Asp Gly Ser Tyr Pro Lys Asp Lys1 5 10 15Phe Glu Lys Ile Asn Gly Thr Trp Tyr Tyr Phe Asp Ser Ser Gly Tyr20 25 30Met Leu Ala Asp Arg Trp Arg Lys His Thr Asp Gly Asn Trp Tyr Trp35 40 45Phe Asp Asn Ser Gly Glu Met Ala Thr Gly Trp Lys Lys Ile Ala Asp50 55 60Lys Trp Tyr Tyr Phe Asn Glu Glu Gly Ala Met Lys Thr Gly Trp Val65 70 75 80Lys Tyr Lys Asp Thr Trp Tyr Tyr Leu Asp Ala Lys Glu Gly Ala Met85 90 95Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Gly Val100 105 110Met Val Ser Asn Ala Phe Ile Gln Ser Ala Asp Gly Thr Gly Trp Tyr115 120 125Tyr Leu Lys Pro Asp Gly Thr Leu Ala Asp Arg Pro Glu Lys Phe Met130 135 140Tyr Met Val Leu Gly Ile Gly Pro Val Leu Gly Leu Val Cys Val Pro145 150 155 160Leu Leu Gly Ser Ala Ser Asp His Trp Arg Gly Arg Tyr Gly Arg Arg165 170 175Arg Pro Phe Ile Trp Ala Leu Ser Leu Gly Ile Leu Leu Ser Leu Phe180 185 190Leu Ile Pro Arg Ala Gly Trp Leu Ala Gly Leu Leu Cys Pro Asp Pro195 200 205Arg Pro Leu Glu Leu Ala Leu Leu Ile Leu Gly Val Gly Leu Leu Asp210 215 220Phe Cys Gly Gln Val Cys Phe Thr Pro Leu Glu Ala Leu Leu Ser Asp225 230 235 240Leu Phe Arg Asp Pro Asp His Cys Arg Gln Ala Tyr Ser Val Tyr Ala245 250 255Phe Met Ile Ser Leu Gly Gly Cys Leu Gly Tyr Leu Leu Pro Ala Ile260 265 270Asp Trp Asp Thr Ser Ala Leu Ala Pro Tyr Leu Gly Thr Gln Glu Glu275 280 285Cys Leu Phe Gly Leu Leu Thr Leu Ile Phe Leu Thr Cys Val Ala Ala290 295 300Thr Leu Leu Val Ala Glu Glu Ala Ala Leu Gly Pro Thr Glu Pro Ala305 310 315 320Glu Gly Leu Ser Ala Pro Ser Leu Ser Pro His Cys Cys Pro Cys Arg325 330 335Ala Arg Leu Ala Phe Arg Asn Leu Gly Ala Leu Leu Pro Arg Leu His340 345 350Gln Leu Cys Cys Arg Met Pro Arg Thr Leu Arg Arg Leu Phe Val Ala355 360 365Glu Leu Cys Ser Trp Met Ala Leu Met Thr Phe Thr Leu Phe Tyr Thr370 375 380Asp Phe Val Gly Glu Gly Leu Tyr Gln Gly Val Pro Arg Ala Glu Pro385 390 395 400Gly Thr Glu Ala Arg Arg His Tyr Asp Glu Gly Val Arg Met Gly Ser405 410 415Leu Gly Leu Phe Leu Gln Cys Ala Ile Ser Leu Val Phe Ser Leu Val420 425 430Met Asp Arg Leu Val Gln Arg Phe Gly Thr Arg Ala Val Tyr Leu Ala435 440 445Ser Val Ala Ala Phe Pro Val Ala Ala Gly Ala Thr Cys Leu Ser His450 455 460
Ser Val Ala Val Val Thr Ala Ser Ala Ala Leu Thr Gly Phe Thr Phe465 470 475 480Ser Ala Leu Gln Ile Leu Pro Tyr Thr Leu Ala Ser Leu Tyr His Arg485 490 495Glu Lys Gln Val Phe Leu Pro Lys Tyr Arg Gly Asp Thr Gly Gly Ala500 505 510Ser Ser Glu Asp Ser Leu Met Thr Ser Phe Leu Pro Gly Pro Lys Pro515 520 525Gly Ala Pro Phe Pro Asn Gly His Val Gly Ala Gly Gly Ser Gly Leu530 535 540Leu Pro Pro Pro Pro Ala Leu Cys Gly Ala Ser Ala Cys Asp Val Ser545 550 555 560Val Arg Val Val Val Gly Glu Pro Thr Glu Ala Arg Val Val Pro Gly565 570 575Arg Gly Ile Cys Leu Asp Leu Ala Ile Leu Asp Ser Ala Phe Leu Leu580 585 590Ser Gln Val Ala Pro Ser Leu Phe Met Gly Ser Ile Val Gln Leu Ser595 600 605Gln Ser Val Thr Ala Tyr Met Val Ser Ala Ala Gly Leu Gly Leu Val610 615 620Ala Ile Tyr Phe Ala Thr Gln Val Val Phe Asp Lys Ser Asp Leu Ala625 630 635 640Lys Tyr Ser Ala Gly Gly His His His His His His645 650<210>42<211>1959<212>DNA<213>人工序列<220>
<223>編碼與人P501S融合的肺炎鏈球菌C-LytA P2輔助表位C-Lyta的DNA(加his標簽)<400>42atggcggccg cttacgtaca ttccgacggc tcttatccaa aagacaagtt tgagaaaatc 60aatggcactt ggtactactt tgacagttca ggctatatgc ttgcagaccg ctggaggaag 120cacacagacg gcaactggta ctggttcgac aactcaggcg aaatggctac aggctggaag 180aaaatcgctg ataagtggta ctatttcaac gaagaaggtg ccatgaagac aggctgggtc 240aagtacaagg acacttggta ctacttagac gctaaagaag gcgccatgca atacatcaag 300gctaactcta agttcattgg tatcactgaa ggcgtcatgg tatcaaatgc ctttatccag 360tcagcggacg gaacaggctg gtactacctc aaaccagacg gaacactggc agacaggcca 420gaaaagttca tgtacatggt gctgggcatt ggtccagtgc tgggcctggt ctgtgtcccg 480ctcctaggct cagccagtga ccactggcgt ggacgctatg gccgccgccg gcccttcatc 540tgggcactgt ccttgggcat cctgctgagc ctctttctca tcccaagggc cggctggcta 600gcagggctgc tgtgcccgga tcccaggccc ctggagctgg cactgctcat cctgggcgtg 660gggctgctgg acttctgtgg ccaggtgtgc ttcactccac tggaggccct gctctctgac 720ctcttccggg acccggacca ctgtcgccag gcctactctg tctatgcctt catgatcagt 780cttgggggct gcctgggcta cctcctgcct gccattgact gggacaccag tgccctggcc 840ccctacctgg gcacccagga ggagtgcctc tttggcctgc tcaccctcat cttcctcacc 900tgcgtagcag ccacactgct ggtggctgag gaggcagcgc tgggccccac cgagccagca 960gaagggctgt cggccccctc cttgtcgccc cactgctgtc catgccgggc ccgcttggct 1020ttccggaacc tgggcgccct gcttccccgg ctgcaccagc tgtgctgccg catgccccgc 1080accctgcgcc ggctcttcgt ggctgagctg tgcagctgga tggcactcat gaccttcacg 1140ctgttttaca cggatttcgt gggcgagggg ctgtaccagg gcgtgcccag agctgagccg 1200ggcaccgagg cccggagaca ctatgatgaa ggcgttcgga tgggcagcct ggggctgttc 1260ctgcagtgcg ccatctccct ggtcttctct ctggtcatgg accggctggt gcagcgattc 1320ggcactcgag cagtctattt ggccagtgtg gcagctttcc ctgtggctgc cggtgccaca 1380tgcctgtccc acagtgtggc cgtggtgaca gcttcagccg ccctcaccgg gttcaccttc 1440tcagccctgc agatcctgcc ctacacactg gcctccctct accaccggga gaagcaggtg 1500
ttcctgccca aataccgagg ggacactgga ggtgctagca gtgaggacag cctgatgacc 1560agcttcctgc caggccctaa gcctggagct cccttcccta atggacacgt gggtgctgga 1620ggcagtggcc tgctcccacc tccacccgcg ctctgcgggg cctctgcctg tgatgtctcc 1680gtacgtgtgg tggtgggtga gcccaccgag gccagggtgg ttccgggccg gggcatctgc 1740ctggacctcg ccatcctgga tagtgccttc ctgctgtccc aggtggcccc atccctgttt 1800atgggctcca ttgtccagct cagccagtct gtcactgcct atatggtgtc tgccgcaggc 1860ctgggtctgg tcgccattta ctttgctaca caggtagtat ttgacaagag cgacttggcc 1920aaatactcag cgggtggaca ccatcaccat caccattaa1959<210>43<211>553<212>PRT<213>人類<400>43Met Val Gln Arg Leu Trp Val Ser Arg Leu Leu Arg His Arg Lys Ala1 5 10 15Gln Leu Leu Leu Val Asn Leu Leu Thr Phe Gly Leu Glu Val Cys Leu20 25 30Ala Ala Gly Ile Thr Tyr Val Pro Pro Leu Leu Leu Glu Val Gly Val35 40 45Glu Glu Lys Phe Met Thr Met Val Leu Gly Ile Gly Pro Val Leu Gly50 55 60Leu Val Cys Val Pro Leu Leu Gly Ser Ala Ser Asp His Trp Arg Gly65 70 75 80Arg Tyr Gly Arg Arg Arg Pro Phe Ile Trp Ala Leu Ser Leu Gly Ile85 90 95Leu Leu Ser Leu Phe Leu Ile Pro Arg Ala Gly Trp Leu Ala Gly Leu100 105 110Leu Cys Pro Asp Pro Arg Pro Leu Glu Leu Ala Leu Leu Ile Leu Gly115 120 125Val Gly Leu Leu Asp Phe Cys Gly Gln Val Cys Phe Thr Pro Leu Glu130 135 140Ala Leu Leu Ser Asp Leu Phe Arg Asp Pro Asp His Cys Arg Gln Ala145 150 155 160Tyr Ser Val Tyr Ala Phe Met Ile Ser Leu Gly Gly Cys Leu Gly Tyr165 170 175Leu Leu Pro Ala Ile Asp Trp Asp Thr Ser Ala Leu Ala Pro Tyr Leu180 185 190Gly Thr Gln Glu Glu Cys Leu Phe Gly Leu Leu Thr Leu Ile Phe Leu195 200 205Thr Cys Val Ala Ala Thr Leu Leu Val Ala Glu Glu Ala Ala Leu Gly210 215 220Pro Thr Glu Pro Ala Glu Gly Leu Ser Ala Pro Ser Leu Ser Pro His225 230 235 240Cys Cys Pro Cys Arg Ala Arg Leu Ala Phe Arg Asn Leu Gly Ala Leu245 250 255Leu Pro Arg Leu His Gln Leu Cys Cys Arg Met Pro Arg Thr Leu Arg260 265 270Arg Leu Phe Val Ala Glu Leu Cys Ser Trp Met Ala Leu Met Thr Phe275 280 285Thr Leu Phe Tyr Thr Asp Phe Val Gly Glu Gly Leu Tyr Gln Gly Val290 295 300Pro Arg Ala Glu Pro Gly Thr Glu Ala Arg Arg His Tyr Asp Glu Gly305 310 315 320Val Arg Met Gly Ser Leu Gly Leu Phe Leu Gln Cys Ala Ile Ser Leu325 330 335Val Phe Ser Leu Val Met Asp Arg Leu Val Gln Arg Phe Gly Thr Arg340 345 350Ala Val Tyr Leu Ala Ser Val Ala Ala Phe Pro Val Ala Ala Gly Ala355 360 365
Thr Cys Leu Ser His Ser Val Ala Val Val Thr Ala Ser Ala Ala Leu370 375 380Thr Gly Phe Thr Phe Ser Ala Leu Gln Ile Leu Pro Tyr Thr Leu Ala385 390 395 400Ser Leu Tyr His Arg Glu Lys Gln Val Phe Leu Pro Lys Tyr Arg Gly405 410 415Asp Thr Gly Gly Ala Ser Ser Glu Asp Ser Leu Met Thr Ser Phe Leu420 425 430Pro Gly Pro Lys Pro Gly Ala Pro Phe Pro Asn Gly His Val Gly Ala435 440 445Gly Gly Ser Gly Leu Leu Pro Pro Pro Pro Ala Leu Cys Gly Ala Ser450 455 460Ala Cys Asp Val Ser Val Arg Val Val Val Gly Glu Pro Thr Glu Ala465 470 475 480Arg Val Val Pro Gly Arg Gly Ile Cys Leu Asp Leu Ala Ile Leu Asp485 490 495Ser Ala Phe Leu Leu Ser Gln Val Ala Pro Ser Leu Phe Met Gly Ser500 505 510Ile Val Gln Leu Ser Gln Ser Val Thr Ala Tyr Met Val Ser Ala Ala515 520 525Gly Leu Gly Leu Val Ala Ile Tyr Phe Ala Thr Gln Val Val Phe Asp530 535 540Lys Ser Asp Leu Ala Lys Tyr Ser Ala545 550<210>44<211>644<212>PRT<213>人工序列<220>
<223>與人P501S融合的肺炎鏈球菌C-LytA P2輔助表位C-Lyta<400>44Met Ala Ala Ala Tyr Val His Ser Asp Gly Ser Tyr Pro Lys Asp Lys1 5 10 15Phe Glu Lys Ile Asn Gly Thr Trp Tyr Tyr Phe Asp Ser Ser Gly Tyr20 25 30Met Leu Ala Asp Arg Trp Arg Lys His Thr Asp Gly Asn Trp Tyr Trp35 40 45Phe Asp Asn Ser Gly Glu Met Ala Thr Gly Trp Lys Lys Ile Ala Asp50 55 60Lys Trp Tyr Tyr Phe Asn Glu Glu Gly Ala Met Lys Thr Gly Trp Val65 70 75 80Lys Tyr Lys Asp Thr Trp Tyr Tyr Leu Asp Ala Lys Glu Gly Ala Met85 90 95Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Gly Val100 105 110Met Val Ser Asn Ala Phe Ile Gln Ser Ala Asp Gly Thr Gly Trp Tyr115 120 125Tyr Leu Lys Pro Asp Gly Thr Leu Ala Asp Arg Pro Glu Lys Phe Met130 135 140Tyr Met Val Leu Gly Ile Gly Pro Val Leu Gly Leu Val Cys Val Pro145 150 155 160Leu Leu Gly Ser Ala Ser Asp His Trp Arg Gly Arg Tyr Gly Arg Arg165 170 175Arg Pro Phe Ile Trp Ala Leu Ser Leu Gly Ile Leu Leu Ser Leu Phe180 185 190Leu Ile Pro Arg Ala Gly Trp Leu Ala Gly Leu Leu Cys Pro Asp Pro
195 200 205Arg Pro Leu Glu Leu Ala Leu Leu Ile Leu Gly Val Gly Leu Leu Asp210 215 220Phe Cys Gly Gln Val Cys Phe Thr Pro Leu Glu Ala Leu Leu Ser Asp225 230 235 240Leu Phe Arg Asp Pro Asp His Cys Arg Gln Ala Tyr Ser Val Tyr Ala245 250 255Phe Met Ile Ser Leu Gly Gly Cys Leu Gly Tyr Leu Leu Pro Ala Ile260 265 270Asp Trp Asp Thr Ser Ala Leu Ala Pro Tyr Leu Gly Thr Gln Glu Glu275 280 285Cys Leu Phe Gly Leu Leu Thr Leu Ile Phe Leu Thr Cys Val Ala Ala290 295 300Thr Leu Leu Val Ala Glu Glu Ala Ala Leu Gly Pro Thr Glu Pro Ala305 310 315 320Glu Gly Leu Ser Ala Pro Ser Leu Ser Pro His Cys Cys Pro Cys Arg325 330 335Ala Arg Leu Ala Phe Arg Asn Leu Gly Ala Leu Leu Pro Arg Leu His340 345 350Gln Leu Cys Cys Arg Met Pro Arg Thr Leu Arg Arg Leu Phe Val Ala355 360 365Glu Leu Cys Ser Trp Met Ala Leu Met Thr Phe Thr Leu Phe Tyr Thr370 375 380Asp Phe Val Gly Glu Gly Leu Tyr Gln Gly Val Pro Arg Ala Glu Pro385 390 395 400Gly Thr Glu Ala Arg Arg His Tyr Asp Glu Gly Val Arg Met Gly Ser405 410 415Leu Gly Leu Phe Leu Gln Cys Ala Ile Ser Leu Val Phe Ser Leu Val420 425 430Met Asp Arg Leu Val Gln Arg Phe Gly Thr Arg Ala Val Tyr Leu Ala435 440 445Ser Val Ala Ala Phe Pro Val Ala Ala Gly Ala Thr Cys Leu Ser His450 455 460Ser Val Ala Val Val Thr Ala Ser Ala Ala Leu Thr Gly Phe Thr Phe465 470 475 480Ser Ala Leu Gln Ile Leu Pro Tyr Thr Leu Ala Ser Leu Tyr His Arg485 490 495Glu Lys Gln Val Phe Leu Pro Lys Tyr Arg Gly Asp Thr Gly Gly Ala500 505 510Ser Ser Glu Asp Ser Leu Met Thr Ser Phe Leu Pro Gly Pro Lys Pro515 520 525Gly Ala Pro Phe Pro Asn Gly His Val Gly Ala Gly Gly Ser Hly Leu530 535 540Leu Pro Pro Pro Pro Ala Leu Cys Gly Ala Ser Ala Cys Asp Val Ser545 550 555 560Val Arg Val Val Val Gly Glu Pro Thr Glu Als Arg Val Val Pro Gly565 570 575Arg Gly Ile Cys Leu Asp Leu Ala Ile Leu Asp Ser Ala Phe Leu Leu580 585 590Ser Gln Val Ala Pro Ser Leu Phe Met Gly Ser Ile Val Gln Leu Ser595 600 605Gln Ser Val Thr Ala Tyr Met Val Ser Ala Ala Gly Leu Gly Leu Val610 615 620Ala Ile Tyr Phe Ala Thr Gln Val Val Phe Asp Lys Ser Asp Leu Ala625 630 635 640Lys Tyr Ser Ala<210>45<211>644
<212>PRT<213>人工序列<220>
<223>融合于人P501S(氨基酸51-553)的肺炎鏈球菌C-LytA P2輔助表位C-Lyta的密碼子優化的雜交蛋白<400>45Met Ala Ala Ala Tyr Val His Ser Asp Gly Ser Tyr Pro Lys Asp Lys1 5 10 15Phe Glu Lys Ile Asn Gly Thr Trp Tyr Tyr Phe Asp Ser Ser Gly Tyr20 25 30Met Leu Ala Asp Arg Trp Arg Lys His Thr Asp Gly Asn Trp Tyr Trp35 40 45Phe Asp Asn Ser Gly Glu Met Ala Thr Gly Trp Lys Lys Ile Ala Asp50 55 60Lys Trp Tyr Tyr Phe Asn Glu Glu Gly Ala Met Lys Thr Gly Trp Val65 70 75 80Lys Tyr Lys Asp Thr Trp Tyr Tyr Leu Asp Ala Lys Glu Gly Ala Met85 90 95Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Gly Val100 105 110Met Val Ser Asn Ala Phe Ile Gln Ser Ala Asp Gly Thr Gly Trp Tyr115 120 125Tyr Leu Lys Pro Asp Gly Thr Leu Ala Asp Arg Pro Glu Lys Phe Met130 135 140Tyr Met Val Leu Gly Ile Gly Pro Val Leu Gly Leu Val Cys Val Pro145 150 155 160Leu Leu Gly Ser Ala Ser Asp His Trp Arg Gly Arg Tyr Gly Arg Arg165 170 175Arg Pro Phe Ile Trp Ala Leu Ser Leu Gly Ile Leu Leu Ser Leu Phe180 185 190Leu Ile Pro Arg Ala Gly Trp Leu Ala Gly Leu Leu Cys Pro Asp Pro195 200 205Arg Pro Leu Glu Leu Ala Leu Leu Ile Leu Gly Val Gly Leu Leu Asp210 215 220Phe Cys Gly Gln Val Cys Phe Thr Pro Leu Glu Ala Leu Leu Ser Asp225 230 235 240Leu Phe Arg Asp Pro Asp His Cys Arg Gln Ala Tyr Ser Val Tyr Ala245 250 255Phe Met Ile Ser Leu Gly Gly Cys Leu Gly Tyr Leu Leu Pro Ala Ile260 265 270Asp Trp Asp Thr Ser Ala Leu Ala Pro Tyr Leu Gly Thr Gln Glu Glu275 280 285Cys Leu Phe Gly Leu Leu Thr Leu Ile Phe Leu Thr Cys Val Ala Ala290 295 300Thr Leu Leu Val Ala Glu Glu Ala Ala Leu Gly Pro Thr Glu Pro Ala305 310 315 320Glu Gly Leu Ser Ala Pro Ser Leu Ser Pro His Cys Cys Pro Cys Arg325 330 335Ala Arg Leu Ala Phe Arg Asn Leu Gly Ala Leu Leu Pro Arg Leu His340 345 350Gln Leu Cys Cys Arg Met Pro Arg Thr Leu Arg Arg Leu Phe Val Ala355 360 365Glu Leu Cys Ser Trp Met Ala Leu Met Thr Phe Thr Leu Phe Tyr Thr370 375 380Asp Phe Val Gly Glu Gly Leu Tyr Gln Gly Val Pro Arg Ala Glu Pro385 390 395 400Gly Thr Glu Ala Arg Arg His Tyr Asp Glu Gly Val Arg Met Gly Ser405 410 415
Leu Gly Leu Phe Leu Gln Cys Ala Ile Ser Leu Val Phe Ser Leu Val420 425 430Met Asp Arg Leu Val Gln Arg Phe Gly Thr Arg Ala Val Tyr Leu Ala435 440 445Ser Val Ala Ala Phe Pro Val Ala Ala Gly Ala Thr Cys Leu Ser His450 455 460Ser Val Ala Val Val Thr Ala Ser Ala Ala Leu Thr Gly Phe Thr Phe465 470 475 480Ser Ala Leu Gln Ile Leu Pro Tyr Thr Leu Ala Ser Leu Tyr His Arg485 490 495Glu Lys Gln Val Phe Leu Pro Lys Tyr Arg Gly Asp Thr Gly Gly Ala500 505 510Ser Ser Glu Asp Ser Leu Met Thr Ser Phe Leu Pro Gly Pro Lys Pro515 520 525Gly Ala Pro Phe Pro Asn Gly His Val Gly Ala Gly Gly Ser Gly Leu530 535 540Leu Pro Pro Pro Pro Ala Leu Cys Gly Ala Ser Ala Cys Asp Val Ser545 550 555 560Val Arg Val Val Val Gly Glu Pro Thr Glu Ala Arg Val Val Pro Gly565 570 575Arg Gly Ile Cys Leu Asp Leu Ala Ile Leu Asp Ser Ala Phe Leu Leu580 585 590Ser Gln Val Ala Pro Ser Leu Phe Met Gly Ser Ile Val Gln Leu Ser595 600 605Gln Ser Val Thr Ala Tyr Met Val Ser Ala Ala Gly Leu Gly Leu Val610 615 620Ala Ile Tyr Phe Ala Thr Gln Val Val Phe Asp Lys Ser Asp Leu Ala625 630 635 640Lys Tyr Ser Ala<210>46<211>694<212>PRT<213>人工序列<220>
<223>與人P501S(氨基酸1-553)融合的肺炎鏈球菌C-LytA P2輔助表位C-Lyta-優化的密碼子<400>46Met Ala Ala Ala Tyr Val His Ser Asp Gly Ser Tyr Pro Lys Asp Lys1 5 10 15Phe Glu Lys Ile Asn Gly Thr Trp Tyr Tyr Phe Asp Ser Ser Gly Tyr20 25 30Met Leu Ala Asp Arg Trp Arg Lys His Thr Asp Gly Asn Trp Tyr Trp35 40 45Phe Asp Asn Ser Gly Glu Met Ala Thr Gly Trp Lys Lys Ile Ala Asp50 55 60Lys Trp Tyr Tyr Phe Asn Glu Glu Gly Ala Met Lys Thr Gly Trp Val65 70 75 80Lys Tyr Lys Asp Thr Trp Tyr Tyr Leu Asp Ala Lys Glu Gly Ala Met85 90 95Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Gly Val100 105 110Met Val Ser Asn Ala Phe Ile Gln Ser Ala Asp Gly Thr Gly Trp Tyr115 120 125Tyr Leu Lys Pro Asp Gly Thr Leu Ala Asp Arg Pro Glu Met Val Gln130 135 140Arg Leu Trp Val Ser Arg Leu Leu Arg His Arg Lys Ala Gln Leu Leu
145 150 155 160Leu Val Asn Leu Leu Thr Phe Gly Leu Glu Val Cys Leu Ala Ala Gly165 170 175Ile Thr Tyr Val Pro Pro Leu Leu Leu Glu Val Gly Val Glu Glu Lys180 185 190Phe Met Thr Met Val Leu Gly Ile Gly Pro Val Leu Gly Leu Val Cys195 200 205Val Pro Leu Leu Gly Ser Ala Ser Asp His Trp Arg Gly Arg Tyr Gly210 215 220Arg Arg Arg Pro Phe Ile Trp Ala Leu Ser Leu Gly Ile Leu Leu Ser225 230 235 240Leu Phe Leu Ile Pro Arg Ala Gly Trp Leu Ala Gly Leu Leu Cys Pro245 250 255Asp Pro Arg Pro Leu Glu Leu Ala Leu Leu Ile Leu Gly Val Gly Leu260 265 270Leu Asp Phe Cys Gly Gln Val Cys Phe Thr Pro Leu Glu Ala Leu Leu275 280 285Ser Asp Leu Phe Arg Asp Pro Asp His Cys Arg Gln Ala Tyr Ser Val290 295 300Tyr Ala Phe Met Ile Ser Leu Gly Gly Cys Leu Gly Tyr Leu Leu Pro305 310 315 320Ala Ile Asp Trp Asp Thr Ser Ala Leu Ala Pro Tyr Leu Gly Thr Gln325 330 335Glu Glu Cys Leu Phe Gly Leu Leu Thr Leu Ile Phe Leu Thr Cys Val340 345 350Ala Ala Thr Leu Leu Val Ala Glu Glu Ala Ala Leu Gly Pro Thr Glu355 360 365Pro Ala Glu Gly Leu Ser Ala Pro Ser Leu Ser Pro His Cys Cys Pro370 375 380Cys Arg Ala Arg Leu Ala Phe Arg Asn Leu Gly Ala Leu Leu Pro Arg385 390 395 400Leu His Gln Leu Cys Cys Arg Met Pro Arg Thr Leu Arg Arg Leu Phe405 410 415Val Ala Glu Leu Cys Ser Trp Met Ala Leu Met Thr Phe Thr Leu Phe420 425 430Tyr Thr Asp Phe Val Gly Glu Gly Leu Tyr Gln Gly Val Pro Arg Ala435 440 445Glu Pro Gly Thr Glu Ala Arg Arg His Tyr Asp Glu Gly Val Arg Met450 455 460Gly Ser Leu Gly Leu Phe Leu Gln Cys Ala Ile Ser Leu Val Phe Ser465 470 475 480Leu Val Met Asp Arg Leu Val Gln Arg Phe Gly Thr Arg Ala Val Tyr485 490 495Leu Ala Ser Val Ala Ala Phe Pro Val Ala Ala Gly Ala Thr Cys Leu500 505 510Ser His Ser Val Ala Val Val Thr Ala Ser Ala Ala Leu Thr Gly Phe515 520 525Thr Phe Ser Ala Leu Gln Ile Leu Pro Tyr Thr Leu Ala Ser Leu Tyr530 535 540His Arg Glu Lys Gln Val Phe Leu Pro Lys Tyr Arg Gly Asp Thr Gly545 550 555 560Gly Ala Ser Ser Glu Asp Ser Leu Met Thr Ser Phe Leu Pro Gly Pro565 570 575Lys Pro Gly Ala Pro Phe Pro Asn Gly His Val Gly Ala Gly Gly Ser580 585 590Gly Leu Leu Pro Pro Pro Pro Ala Leu Cys Gly Ala Ser Ala Cys Asp595 600 605Val Ser Val Arg Val Val Val Gly Glu Pro Thr Glu Ala Arg Val Val610 615 620Pro Gly Arg Gly Ile Cys Leu Asp Leu Ala Ile Leu Asp Ser Ala Phe625 630 635 640
Leu Leu Ser Gln Val Ala Pro Ser Leu Phe Met Gly Ser Ile Val Gln645 650 655Leu Ser Gln Ser Val Thr Ala Tyr Met Val Ser Ala Ala Gly Leu Gly660 665 670Leu Val Ala Ile Tyr Phe Ala Thr Gln Val Val Phe Asp Lya Ser Asp675 680 685Leu Ala Lys Tyr Ser Ala690<210>47<211>694<212>PRT<213>人工序列<220>
<223>與人P50lS(氨基酸1-50)融合的人P50lS(氨基酸51-553)融合的肺炎鏈球菌C-LytA P2輔助表位C-Lyta-優化的密碼子<400>47Met Ala Ala Ala Tyr Val His Ser Asp Gly Ser Tyr Pro Lys Asp Lys1 5 10 15Phe Glu Lys Ile Asn Gly Thr Trp Tyr Tyr Phe Asp Ser Ser Gly Tyr20 25 30Met Leu Ala Asp Arg Trp Arg Lys His Thr Asp Gly Asn Trp Tyr Trp35 40 45Phe Asp Asn Ser Gly Glu Met Ala Thr Gly Trp Lys Lys Ile Ala Asp50 55 60Lys Trp Tyr Tyr Phe Asn Glu Glu Gly Ala Met Lys Thr Gly Trp Val65 70 75 80Lys Tyr Lys Asp Thr Trp Tyr Tyr Leu Asp Ala Lys Glu Gly Ala Met85 90 95Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Gly Val100 105 110Met Val Ser Asn Ala Phe Ile Gln Ser Ala Asp Gly Thr Gly Trp Tyr115 120 125Tyr Leu Lys Pro Asp Gly Thr Leu Ala Asp Arg Pro Glu Lys Phe Met130 135 140Tyr Met Val Leu Gly Ile Gly Pro Val Leu Gly Leu Val Cys Val Pro145 150 155 160Leu Leu Gly Ser Ala Ser Asp His Trp Arg Gly Arg Tyr Gly Arg Arg165 170 175Arg Pro Phe Ile Trp Ala Leu Ser Leu Gly Ile Leu Leu Ser Leu Phe180 185 190Leu Ile Pro Arg Ala Gly Trp Leu Ala Gly Leu Leu Cys Pro Asp Pro195 200 205Arg Pro Leu Glu Leu Ala Leu Leu Ile Leu Gly Val Gly Leu Leu Asp210 215 220Phe Cys Gly Gln Val Cys Phe Thr Pro Leu Glu Ala Leu Leu Ser Asp225 230 235 240Leu Phe Arg Asp Pro Asp His Cys Arg Gln Ala Tyr Ser Val Tyr Ala245 250 255Phe Met Ile Ser Leu Gly Gly Cys Leu Gly Tyr Leu Leu Pro Ala Ile260 265 270Asp Trp Asp Thr Ser Ala Leu Ala Pro Tyr Leu Gly Thr Gln Glu Glu275 280 285Cys Leu Phe Gly Leu Leu Thr Leu Ile Phe Leu Thr Cys Val Ala Ala290 295 300Thr Leu Leu Val Ala Glu Glu Ala Ala Leu Gly Pro Thr Glu Pro Ala305 310 315 320
Glu Gly Leu Ser Ala Pro Ser Leu Ser Pro His Cys Cys Pro Cys Arg325 330 335Ala Arg Leu Ala Phe Arg Asn Leu Gly Ala Leu Leu Pro Arg Leu His340 345 350Gln Leu Cys Cys Arg Met Pro Arg Thr Leu Arg Arg Leu Phe Val Ala355 360 365Glu Leu Cys Ser Trp Met Ala Leu Met Thr Phe Thr Leu Phe Tyr Thr370 375 380Asp Phe Val Gly Glu Gly Leu Tyr Gln Gly Val Pro Arg Ala Glu Pro385 390 395 400Gly Thr Glu Ala Arg Arg His Tyr Asp Glu Gly Val Arg Met Gly Ser405 410 415Leu Gly Leu Phe Leu Gln Cys Ala Ile Ser Leu Val Phe Ser Leu Val420 425 430Met Asp Arg Leu Val Gln Arg Phe Gly Thr Arg Ala Val Tyr Leu Ala435 440 445Ser Val Ala Ala Phe Pro Val Ala Ala Gly Ala Thr Cys Leu Ser His450 455 460Ser Val Ala Val Val Thr Ala Ser Ala Ala Leu Thr Gly Phe Thr Phe465 470 475 480Ser Ala Leu Gln Ile Leu Pro Tyr Thr Leu Ala Ser Leu Tyr His Arg485 490 495Glu Lys Gln Val Phe Leu Pro Lys Tyr Arg Gly Asp Thr Gly Gly Ala500 505 510Ser Ser Glu Asp Ser Leu Met Thr Ser Phe Leu Pro Gly Pro Lys Pro515 520 525Gly Ala Pro Phe Pro Asn Gly His Val Gly Ala Gly Gly Ser Gly Leu530 535 540Leu Pro Pro Pro Pro Ala Leu Cys Gly Ala Ser Ala Cys Asp Val Ser545 550 555 560Val Arg Val Val Val Gly Glu Pro Thr Glu Ala Arg Val Val Pro Gly565 570 575Arg Gly Ile Cys Leu Asp Leu Ala Ile Leu Asp Ser Ala Phe Leu Leu580 585 590Ser Gln Val Ala Pro Ser Leu Phe Met Gly Ser Ile Val Gln Leu Ser595 600 605Gln Ser Val Thr Ala Tyr Met Val Ser Ala Ala Gly Leu Gly Leu Val610 615 620Ala Ile Tyr Phe Ala Thr Gln Val Val Phe Asp Lys Ser Asp Leu Ala625 630 635 640Lys Tyr Ser Ala Met Val Gln Arg Leu Trp Val Ser Arg Leu Leu Arg645 650 655His Arg Lys Ala Gln Leu Leu Leu Val Asn Leu Leu Thr Phe Gly Leu660 665 670Glu Val Cys Leu Ala Ala Gly Ile Thr Tyr Val Pro Pro Leu Leu Leu675 680 685Glu Val Gly Val Glu Glu690<210>48<211>694<212>PRT<213>人工序列<220>
<223>與人P501S(氨基酸51-553)融合的肺炎鏈球菌C-LytA P2輔助表位C-Lyta融合的人P501S(氨基酸1-50)-優化的密碼子<400>48
Met Val Gln Arg Leu Trp Val Ser Arg Leu Leu Arg His Arg Lys Ala1 5 10 15Gln Leu Leu Leu Val Asn Leu Leu Thr Phe Gly Leu Glu Val Cys Leu20 25 30Ala Ala Gly Ile Thr Tyr Val Pro Pro Leu Leu Leu Glu Val Gly Val35 40 45Glu Glu Met Ala Ala Ala Tyr Val His Ser Asp Gly Ser Tyr Pro Lys50 55 60Asp Lys Phe Glu Lys Ile Asn Gly Thr Trp Tyr Tyr Phe Asp Ser Ser65 70 75 80Gly Tyr Met Leu Ala Asp Arg Trp Arg Lys His Thr Asp Gly Asn Trp85 90 95Tyr Trp Phe Asp Asn Ser Gly Glu Met Ala Thr Gly Trp Lys Lys Ile100 105 110Ala Asp Lys Trp Tyr Tyr Phe Asn Glu Glu Gly Ala Met Lys Thr Gly115 120 125Trp Val Lys Tyr Lys Asp Thr Trp Tyr Tyr Leu Asp Ala Lys Glu Gly130 135 140Ala Met Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu145 150 155 160Gly Val Met Val Ser Asn Ala Phe Ile Gln Ser Ala Asp Gly Thr Gly165 170 175Trp Tyr Tyr Leu Lys Pro Asp Gly Thr Leu Ala Asp Arg Pro Glu Lys180 185 190Phe Met Tyr Met Val Leu Gly Ile Gly Pro Val Leu Gly Leu Val Cys195 200 205Val Pro Leu Leu Gly Ser Ala Ser Asp His Trp Arg Gly Arg Tyr Gly210 215 220Arg Arg Arg Pro Phe Ile Trp Ala Leu Ser Leu Gly Ile Leu Leu Ser225 230 235 240Leu Phe Leu Ile Pro Arg Ala Gly Trp Leu Ala Gly Leu Leu Cys Pro245 250 255Asp Pro Arg Pro Leu Glu Leu Ala Leu Leu Ile Leu Gly Val Gly Leu260 265 270Leu Asp Phe Cys Gly Gln Val Cys Phe Thr Pro Leu Glu Ala Leu Leu275 280 285Ser Asp Leu Phe Arg Asp Pro Asp His Cys Arg Gln Ala Tyr Ser Val290 295 300Tyr Ala Phe Met Ile Ser Leu Gly Gly Cys Leu Gly Tyr Leu Leu Pro305 310 315 320Ala Ile Asp Trp Asp Thr Ser Ala Leu Ala Pro Tyr Leu Gly Thr Gln325 330 335Glu Glu Cys Leu Phe Gly Leu Leu Thr Leu Ile Phe Leu Thr Cys Val340 345 350Ala Ala Thr Leu Leu Val Ala Glu Glu Ala Ala Leu Gly Pro Thr Glu355 360 365Pro Ala Glu Gly Leu Ser Ala Pro Ser Leu Ser Pro His Cys Cys Pro370 375 380Cys Arg Ala Arg Leu Ala Phe Arg Asn Leu Gly Ala Leu Leu Pro Arg385 390 395 400Leu His Gln Leu Cys Cys Arg Met Pro Arg Thr Leu Arg Arg Leu Phe405 410 415Val Ala Glu Leu Cys Ser Trp Met Ala Leu Met Thr Phe Thr Leu Phe420 425 430Tyr Thr Asp Phe Val Gly Glu Gly Leu Tyr Gln Gly Val Pro Arg Ala435 440 445Glu Pro Gly Thr Glu Ala Arg Arg His Tyr Asp Glu Gly Val Arg Met450 455 460Gly Ser Leu Gly Leu Phe Leu Gln Cys Ala Ile Ser Leu Val Phe Ser465 470 475 480Leu Val Met Asp Arg Leu Val Gln Arg Phe Gly Thr Arg Ala Val Tyr
485 490 495Leu Ala Ser Val Ala Ala Phe Pro Val Ala Ala Gly Ala Thr Cys Leu500 505 510Ser His Ser Val Ala Val Val Thr Ala Ser Ala Ala Leu Thr Gly Phe515 520 525Thr Phe Ser Ala Leu Gln Ile Leu Pro Tyr Thr Leu Ala Ser Leu Tyr530 535 540His Arg Glu Lys Gln Val Phe Leu Pro Lys Tyr Arg Gly Asp Thr Gly545 550 555 560Gly Ala Ser Ser Glu Asp Ser Leu Met Thr Ser Phe Leu Pro Gly Pro565 570 575Lys Pro Gly Ala Pro Phe Pro Asn Gly His Val Gly Ala Gly Gly Ser580 585 590Gly Leu Leu Pro Pro Pro Pro Ala Leu Cys Gly Ala Ser Ala Cys Asp595 600 605Val Ser Val Arg Val Val Val Gly Glu Pro Thr Glu Ala Arg Val Val610 615 620Pro Gly Arg Gly Ile Cys Leu Asp Leu Ala Ile Leu Asp Ser Ala Phe625 630 635 640Leu Leu Ser Gln Val Ala Pro Ser Leu Phe Met Gly Ser Ile Val Gln645 650 655Leu Ser Gln Ser Val Thr Ala Tyr Met Val Ser Ala Ala Gly Leu Gly660 665 670Leu Val Ala Ile Tyr Phe Ala Thr Gln Val Val Phe Asp Lys Ser Asp675 680 685Leu Ala Lys Tyr Ser Ala690<210>49<211>1971<212>DNA<213>人工序列<220>
<223>編碼與肺炎鏈球菌C-LytA P2輔助表位C-Lyta融合的人MUC-1的DNA<400>49atgacaccgg gcacccagtc tcctttcttc ctgctgctgc tcctcacagt gcttacagtt 60gttacaggtt ctggtcatgc aagctctacc ccaggtggag aaaaggagac ttcggctacc 120cagagaagtt cagtgcccag ctctactgag aagaatgctg tgagtatgac cagcagcgta 180ctctccagcc acagccccgg ttcaggctcc tccaccactc agggacagga tgtcactctg 240gccccggcca cggaaccagc ttcaggttca gctgccacct ggggacagga tgtcacctcg 300gtcccagtca ccaggccagc cctgggctcc accaccccgc cagcccacga tgtcacctca 360gccccggaca acaagccagc cccgggctcc accgcccccc cagcccacgg tgtcacctcg 420gccccggaca ccaggccgcc cccgggctcc accgcccccc cagcccacgg tgtcacctcg 480gccccggaca ccaggccgcc cccgggctcc accgcgcccg cagcccacgg tgtcacctcg 540gccccggaca ccaggccggc cccgggctcc accgcccccc cagcccatgg tgtcacctcg 600gccccggaca acaggcccgc cttggcgtcc accgcccctc cagtccacaa tgtcacctcg 660gcctcaggct ctgcatcagg ctcagcttct actctggtgc acaacggcac ctctgccagg 720gctaccacaa ccccagccag caagagcact ccattctcaa ttcccagcca ccactctgat 780actcctacca cccttgccag ccatagcacc aagactgatg ccagtagcac tcaccatagc 840acggtacctc ctctcacctc ctccaatcac agcacttctc cccagttgtc tactggggtc 900tctttctttt tcctgtcttt tcacatttca aacctccagt ttaattcctc tctggaagat 960cccagcaccg actactacca agagctgcag agagacattt ctgaaatgtt tttgcagatt 1020tataaecaag ggggttttct gggcctctcc aatattaagt tcaggccagg atctgtggtg 1080gtacaattga ctctggcctt ccgagaaggt accatcaatg tccacgacgt ggagacacag 1140ttcaatcagt ataaaacgga agcagcctct cgatataacc tgacgatctc agacgtcagc 1200gtgagtgatg tgccatttcc tttctctgcc cagtctgggg ctggggtgcc aggctggggc 1260atcgcgctgc tggtgctggt ctgtgttctg gttgcgctgg ccattgtcta tctcattgcc 1320
ttggctgtct gtcagtgccg ccgaaagaac tacgggcagc tggacatctt tccagcccgg 1380gatacctacc atcctatgag cgagtacccc acctaccaca cccatgggcg ctatgtgccc 1440cctagcagta ccgatcgtag cccctatgag aaggtttctg caggtaatgg tggcagcagc 1500ctctcttaca caaacccagc agtggcagcc acttctgcca acttgatggc ggccgcttac 1560gtacattccg acggctctta tccaaaagac aagtttgaga aaatcaatgg cacttggtac 1620tactttgaca gttcaggcta tatgcttgca gaccgctgga ggaagcacac agacggcaac 1680tggtactggt tcgacaactc aggcgaaatg gctacaggct ggaagaaaat cgctgataag 1740tggtactatt tcaacgaaga aggtgccatg aagacaggct gggtcaagta caaggacact 1800tggtactact tagacgctaa agaaggcgcc atgcaataca tcaaggctaa ctctaagttc 1860attggtatca ctgaaggcgt catggtatca aatgccttta tccagtcagc ggacggaaca 1920ggctggtact acctcaaacc agacggaaca ctggcagaca ggccagaatg a 1971<210>50<211>656<212>PRT<213>人工序列<220>
<223>與肺炎鏈球菌C-LytA P2輔助表位C-Lyta融合的人MUC-1<400>50Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr1 5 10 15Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly20 25 30Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser35 40 45Thr Glu Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His50 55 60Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu65 70 75 80Ala Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln85 90 95Asp Val Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser Thr Thr100 105 110Pro Pro Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro Ala Pro115 120 125Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr130 135 140Arg Pro Pro Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser145 150 155 160Ala Pro Asp Thr Arg Pro Pro Pro Gly Ser Thr Ala Pro Ala Ala His165 170 175Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala180 185 190Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Asn Arg Pro Ala Leu195 200 205Ala Ser Thr Ala Pro Pro Val His Asn Val Thr Ser Ala Ser Gly Ser210 215 220Ala Ser Gly Ser Ala Ser Thr Leu Val His Asn Gly Thr Ser Ala Arg225 230 235 240Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile Pro Ser245 250 255His His Ser Asp Thr Pro Thr Thr Leu Ala Ser His Ser Thr Lys Thr260 265 270Asp Ala Ser Ser Thr His His Ser Thr Val Pro Pro Leu Thr Ser Ser275 280 285Asn His Ser Thr Ser Pro Gln Leu Ser Thr Gly Val Ser Phe Phe Phe290 295 300Leu Ser Phe His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu Asp
305 310 315 320Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser Glu Met325 330 335Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn Ile340 345 350Lys Phe Arg Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala Phe Arg355 360 365Glu Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr370 375 380Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser385 390 395 400Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala Gly Val405 410 415Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu Val Ala420 425 430Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala Val Cys Gln Cys Arg Arg435 440 445Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro Ala Arg Asp Thr Tyr His450 455 460Pro Met Ser Glu Tyr Pro Thr Tyr His Thr His G1y Arg Tyr Val Pro465 470 475 480Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu Lys Val Ser Ala Gly Asn485 490 495Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro Ala Val Ala Ala Thr Ser500 505 510Ala Asn Leu Met Ala Ala Ala Tyr Val His Ser Asp Gly Ser Tyr Pro515 520 525Lys Asp Lys Phe Glu Lys Ile Asn Gly Thr Trp Tyr Tyr Phe Asp Ser530 535 540Ser Gly Tyr Met Leu Ala Asp Arg Trp Arg Lys His Thr Asp Gly Asn545 550 555 560Trp Tyr Trp Phe Asp Asn Ser Gly Glu Met Ala Thr Gly Trp Lys Lys565 570 575Ile Ala Asp Lys Trp Tyr Tyr Phe Asn Glu Glu Gly Ala Met Lys Thr580 585 590Gly Trp Val Lys Tyr Lys Asp Thr Trp Tyr Tyr Leu Asp Ala Lys Glu595 600 605Gly Ala Met Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr610 615 620Glu Gly Val Met Val Ser Asn Ala Phe Ile Gln Ser Ala Asp Gly Thr625 630 635 640Gly Trp Tyr Tyr Leu Lys Pro Asp Gly Thr Leu Ala Asp Arg Pro Glu645 650 655<210>51<211>2037<212>DNA<213>人工序列<220>
<223>編碼與人MUC-1融合的肺炎鏈球菌C-LytA P2輔助表位C-Lyta的DNA<400>51atgggatgga gctgtatcat cctcttcttg gtagcaacag ctacaggtgt ccactcccag 60gtccaaatgg cggccgctta cgtacattcc gacggctctt atccaaaaga caagtttgag 120aaaatcaatg gcacttggta ctactttgac agttcaggct atatgcttgc agaccgctgg 180aggaagcaca cagacggcaa ctggtactgg ttcgacaact caggcgaaat ggctacaggc 240tggaagaaaa tcgctgataa gtggtactat ttcaacgaag aaggtgccat gaagacaggc 300tgggtcaagt acaaggacac ttggtactac ttagacgcta aagaaggcgc catgcaatac 360
atcaaggcta actctaagtt cattggtatc actgaaggcg tcatggtatc aaatgccttt 420atccagtcag cggacggaac aggctggtac tacctcaaac cagacggaac actggcagac 480aggccagaaa tgacaccggg cacccagtct cctttcttcc tgctgctgct cctcacagtg 540cttacagttg ttacaggttc tggtcatgca agctctaccc caggtggaga aaaggagact 600tcggctaccc agagaagttc agtgcccagc tctactgaga agaatgctgt gagtatgacc 660agcagcgtac tctccagcca cagccccggt tcaggctcct ccaccactca gggacaggat 720gtcactctgg ccccggccac ggaaccagct tcaggttcag ctgccacctg gggacaggat 780gtcacctcgg tcccagtcac caggccagcc ctgggctcca ccaccccgcc agcccacgat 840gtcacctcag ccccggacaa caagccagcc ccgggctcca ccgccccccc agcccacggt 900gtcacctcgg ccccggacac caggccgccc ccgggctcca ccgccccccc agcccacggt 960gtcacctcgg ccccggacac caggccgccc ccgggctcca ccgcgcccgc agcccacggt 1020gtcacctcgg ccccggacac caggccggcc ccgggctcca ccgccccccc agcccatggt 1080gtcacctcgg ccccggacaa caggcccgcc ttggcgtcca ccgcccctcc agtccacaat 1140gtcacctcgg cctcaggctc tgcatcaggc tcagcttcta ctctggtgca caacggcacc 1200tctgccaggg ctaccacaac cccagccagc aagagcactc cattctcaat tcccagccac 1260cactctgata ctcctaccac ccttgccagc catagcacca agactgatgc cagtagcact 1320caccatagca cggtacctcc tctcacctcc tccaatcaca gcacttctcc ccagttgtct 1380actggggtct ctttcttttt cctgtctttt cacatttcaa acctccagtt taattcctct 1440ctggaagatc ccagcaccga ctactaccaa gagctgcaga gagacatttc tgaaatgttt 1500ttgcagattt ataaacaagg gggttttctg ggcctctcca atattaagtt caggccagga 1560tctgtggtgg tacaattgac tctggccttc cgagaaggta ccatcaatgt ccacgacgtg 1620gagacacagt tcaatcagta taaaacggaa gcagcctctc gatataacct gacgatctca 1680gacgtcagcg tgagtgatgt gccatttcct ttctctgccc agtctggggc tggggtgcca 1740ggctggggca tcgcgctgct ggtgctggtc tgtgttctgg ttgcgctggc cattgtctat 1800ctcattgcct tggctgtctg tcagtgccgc cgaaagaact acgggcagct ggacatcttt 1860ccagcccggg atacctacca tcctatgagc gagtacccca cctaccacac ccatgggcgc 1920tatgtgcccc ctagcagtac cgatcgtagc ccctatgaga aggtttctgc aggtaatggt 1980ggcagcagcc tctcttacac aaacccagca gtggcagcca cttctgccaa cttgtag2037<210>52<211>678<212>PRT<213>人工序列<220>
<223>與人MUC-1融合的肺炎鏈球菌C-LytA P2輔助表位C-Lyta<400>52Met Gly Trp Ser Cys Ile Ile Leu Phe Leu Val Ala Thr Ala Thr Gly1 5 10 15Val His Ser Gln Val Gln Met Ala Ala Ala Tyr Val His Ser Asp Gly20 25 30Ser Tyr Pro Lys Asp Lys Phe Glu Lys Ile Asn Gly Thr Trp Tyr Tyr35 40 45Phe Asp Ser Ser Gly Tyr Met Leu Ala Asp Arg Trp Arg Lys His Thr50 55 60Asp Gly Asn Trp Tyr Trp Phe Asp Asn Ser Gly Glu Met Ala Thr Gly65 70 75 80Trp Lys Lys Ile Ala Asp Lys Trp Tyr Tyr Phe Asn Glu Glu Gly Ala85 90 95Met Lys Thr Gly Trp Val Lys Tyr Lys Asp Thr Trp Tyr Tyr Leu Asp100 105 110Ala Lys Glu Gly Ala Met Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile115 120 125Gly Ile Thr Glu Gly Val Met Val Ser Asn Ala Phe Ile Gln Ser Ala130 135 140Asp Gly Thr Gly Trp Tyr Tyr Leu Lys Pro Asp Gly Thr Leu Ala Asp145 150 155 160Arg Pro Glu Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu165 170 175
Leu Leu Thr Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser180 185 190Thr Pro Gly Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val195 200 205Pro Ser Ser Thr Glu Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu210 215 220Ser Ser His Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp225 230 235 240Val Thr Leu Ala Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr245 250 255Trp Gly Gln Asp Val Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly260 265 270Ser Thr Thr Pro Pro Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys275 280 285Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala290 295 300Pro Asp Thr Arg Pro Pro Pro Gly Ser Thr Ala Pro Pro Ala His Gly305 310 315 320Val Thr Ser Ala Pro Asp Thr Arg Pro Pro Pro Gly Ser Thr Ala Pro325 330 335Ala Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly340 345 350Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Asn Arg355 360 365Pro Ala Leu Ala Ser Thr Ala Pro Pro Val His Asn Val Thr Ser Ala370 375 380Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His Asn Gly Thr385 390 395 400Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser405 410 415Ile Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala Ser His Ser420 425 430Thr Lys Thr Asp Ala Ser Ser Thr His His Ser Thr Val Pro Pro Leu435 440 445Thr Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr Gly Val Ser450 455 460Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe Asn Ser Ser465 470 475 480Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile485 490 495Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu500 505 510Ser Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln Leu Thr Leu515 520 525Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe530 535 540Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser545 550 555 560Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly565 570 575Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val580 585 590Leu Val Ala Leu Ala Ile Val Tyr Leu Ils Ala Leu Ala Val Cys Gln595 600 605Cys Arg Arg Lye Asn Tyr Gly Gln Leu Asp Ile Phe Pro Ala Arg Asp610 615 620Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr His Gly Arg625 630 635 640Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu Lys Val Ser645 650 655Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro Ala Val Ala
660 665 670Ala Thr Ser Ala Asn Leu67權利要求
1.一種融合伴侶蛋白，其包含膽堿結合域和異源通用T輔助表位。
2.一種如權利要求1所述的融合伴侶蛋白，其中所述的膽堿結合域來源于LytA的C末端。
3.一種如權利要求2所述的融合伴侶蛋白，其中C-LytA或其衍生物包含SEQ ID NO1至6中任意序列的至少4個重復。
4.一種如權利要求1至3中任意一項所述的融合伴侶蛋白，其中膽堿結合域選自包含如下的組a)如SEQ ID NO7所示的LytA的C-末端域；或b)SEQ ID NO8的序列；或c)包括與SEQ ID NO1至6中任意序列具有至少85％同一性，優選至少90％同一性，更優選至少95％同一性，最優選至少97-99％同一性的氨基酸序列的肽序列；或d)包括SEQ ID NO7或SEQ ID NO8的氨基酸序列中的至少15，20，30，40，50或100個連續氨基酸的氨基酸序列的肽序列。
5.如權利要求1至4中任意一項所述的融合伴侶蛋白，其還進一步包括異源蛋白。
6.如權利要求5所述的融合蛋白，其中所述的異源蛋白與融合伴侶化學結合。
7.如權利要求5或6所述的融合蛋白，其中所述的異源蛋白來源于選自如下的有機體人免疫缺陷性病毒HIV-1，人單純皰疹病毒，巨細胞病毒，輪狀病毒，EB病毒，水痘帶狀皰疹病毒，肝炎病毒如肝炎B病毒，肝炎A病毒，肝炎C病毒和肝炎E病毒，呼吸道合胞體病毒，副流感病毒，麻疹病毒，流行性腮腺炎病毒，人乳頭瘤病毒，黃病毒或流感病毒，奈瑟氏菌屬，莫拉氏菌屬，博代氏桿菌屬，分枝桿菌屬，包括結核分枝桿菌；埃希氏菌屬，包括腸毒素大腸埃希菌；沙門氏菌屬，李斯特氏菌屬，螺桿菌屬，葡萄球菌屬，包括金黃葡萄球菌，表皮葡萄球菌；疏螺旋體屬，衣原體，包括砂眼衣原體，肺炎衣原體；瘧原蟲，包括惡性瘧原蟲；弓形蟲，念珠菌。
8.一種如權利要求5或6所述的融合蛋白，其中所述異源蛋白為腫瘤相關蛋白或組織特異性蛋白或其免疫原性片段。
9.一種如權利要求8所述的融合蛋白，其中所述的異源蛋白或其片段選自MAGE 1，MAGE3，MAGE 4，PRAME，BAGE，LAGE 1，LAGE2，SAGE，HAGE，XAGE，PSA，PAP，PSCA，prostein，P501S，HASH2，Cripto，B726，NY-BR1.1，P510，MUC-1，前列腺酶，STEAP，酪氨酸酶，端粒酶，存活素，CASB616，P53，或her 2 neu。
10.如權利要求6至9中任意一項所述的融合蛋白，其進一步包括具有至少4個組氨酸殘基的親和標簽。
11.編碼如權利要求1至10所述的蛋白的核酸序列。
12.包含權利要求11的核酸序列的表達載體。
13.用權利要求11所述的核酸序列或權利要求12所述的表達載體轉化的宿主。
14.一種免疫原性組合物，其包括如權利要求1至10中任意一項所述的蛋白或權利要求11所述的DNA序列和藥學上可接受的賦形劑。
15.如權利要求14所述的免疫原性組合物，其另外還包括TH-1誘導佐劑。
16.一種如權利要求15所述的免疫原性組合物，其中所述的TH-1誘導佐劑選自包含如下的佐劑組3D-MPL，QS21，QS21和膽固醇的混合物，CpG寡核苷酸或兩種或多種所述佐劑的混合物。
17.制備如權利要求14至16中任意一項所述的免疫原性組合物的方法，其包括將權利要求6至10中任意一項所述的融合蛋白或權利要求11所述的編碼的多核苷酸與合適的佐劑、稀釋劑或其他藥學上可接受的載體混合。
18.一種生產如權利要求1至10中任意一項所述的融合蛋白的方法，其包括在足夠所述融合蛋白產生的條件下培養宿主細胞和從培養基中回收融合蛋白。
19.如權利要求1至10中任意一項所述的蛋白或如權利要求11所述的DNA序列，其用于藥物。
20.如權利要求1至10中任意一項所述的蛋白或如權利要求11所述的DNA序列在生產能在病人中引起免疫應答的免疫原性組合物中的應用。
21.如權利要求20所述的應用，其中所述的免疫應答通過順序施用如下物質而引發i)所述的蛋白，隨后為所述的DNA序列；或ii)所述的DNA序列，隨后為所述的蛋白。
22.如權利要求21所述的應用，其中所述的DNA序列被覆蓋至生物可降解的珠粒上或經粒子轟擊途徑來傳遞。
23.如權利要求21或權利要求22所述的應用，其中所述的蛋白中添加了佐劑。
24.如權利要求1至10中任意一項所述的蛋白或如權利要求11所述的DNA序列在生產用于免疫治療患有癌癥或易患癌癥的病人的免疫原性組合物中的應用。
25.如權利要求24所述的應用，其中所述的癌癥為前列腺癌，結腸癌，肺癌，乳腺癌或黑素瘤。
26.通過施用安全和有效量的如權利要求12所述的組合物來治療患有癌癥的病人的方法。
27.如權利要求26所述的方法，其中所述的癌癥為前列腺癌，結腸直腸癌，肺癌，乳腺癌或黑素瘤。
全文摘要
本發明涉及作為免疫融合伴侶、表達增強子的融合伴侶，優選涉及具有雙重功能的融合伴侶。特別的，所述融合伴侶含有所謂的膽堿結合域，例如所述的融合物包含來源于肺炎鏈球菌屬的LytA，或肺炎球菌噬菌體CP1溶菌酶(CPL1)，其中所述的膽堿結合域被修飾包括異源的T－輔助表位，并且與抗原融合，特別是那些免疫原性較弱的抗原，如自身抗原、如腫瘤特異性或組織特異性抗原。本發明還涉及含有融合伴侶的融合蛋白，及其制造方法，和其在免疫原性組合物和疫苗中的應用和其在制藥中的應用。
文檔編號A61K38/16GK1675237SQ03819487
公開日2005年9月28日申請日期2003年6月6日優先權日2002年6月11日
發明者T·E·V·卡韋松西爾瓦, J·H·艾利斯, C·M·G·格拉爾, P·A·漢布林, R·M·帕爾曼捷, C·維納爾斯Y德巴索爾斯申請人:葛蘭素史密絲克萊恩生物有限公司, 葛蘭素集團有限公司

完整全部詳細技術資料下載