專利名稱:腫瘤特異性動物蛋白的制作方法
技術領域:
本發明涉及用于誘導針對腫瘤相關抗原的免疫應答的藥用組合物和方法。更具體地說,本發明涉及多核苷酸(本文稱為CASB7439多核苷酸)、由它們編碼的多肽(本文稱為CASB7439多肽)、用于生產它們的重組材料和方法。另一方面,本發明涉及這樣的多肽和多核苷酸的使用方法,包括治療癌癥、更特別是結腸直腸癌和自身免疫病和其它相關病癥的療法。另一方面,本發明涉及含有CASB7439多肽和多核苷酸的藥用組合物、涉及這種組合物的生產方法及其在醫藥領域的應用。再一方面,本發明涉及用本發明提供的材料鑒定激動劑和拮抗劑/抑制劑的方法以及用所鑒定的化合物治療與CASB7439多肽不平衡相關的病癥的方法。又一方面,本發明涉及用于檢測與不適當CASB7439多肽活性或水平相關的疾病的診斷分析。
背景技術:
本發明的多肽和多核苷酸被認為是針對腫瘤的專一性預防性或治療性免疫接種的重要免疫原,因為與在正常細胞中的表達相比,它們在腫瘤中特異性表達或高度過量表達,因此可以通過抗原特異性免疫機制靶向它們,導致破壞腫瘤細胞。它們還可以用于診斷腫瘤細胞的存在。此外,它們在某些情況下不適當的表達可以引起誘導自身免疫、即不適當的免疫應答,通過用所述多肽或多核苷酸適當地接種疫苗可能矯正所述不適當的免疫應答。在這方面,對我們的目的而言,最重要的生物活性是本發明多肽的抗原活性和免疫原性活性。本發明的一種多肽還可能表現出一種CASB7439多肽的至少一種其它生物活性,它可能被看作是不同于與所述免疫應答相關的治療性或預防性干涉的治療性或預防性干涉的靶。
發明內容
第一方面,本發明涉及CASB7439多肽。這種肽包括分離的多肽,所述多肽包含的一段氨基酸序列在SEQ ID NO2、SEQ ID NO3、SEQID NO7、SEQ ID NO10、SEQ ID NO11、SEQ ID NO12或SEQ IDNO14的全長上分別與SEQ ID NO2、SEQ ID NO3、SEQ ID NO7、SEQ ID NO10、SEQ ID NO11、SEQ ID NO12或SEQ ID NO14的氨基酸序列具有至少70%同一性、優選至少80%同一性、更優選至少90%同一性、再更優選至少95%同一性、最優選至少97-99%同一性,前提是所述分離的多肽不是SEQ ID NO2、SEQ ID NO12或SEQ IDNO14。這種多肽包括含SEQ ID NO3、SEQ ID NO7、SEQ ID NO10和SEQ ID NO11的氨基酸的多肽。
本發明的其它肽包括分離的多肽,其中所述氨基酸序列在SEQ IDNO2、SEQ ID NO3、SEQ ID NO7、SEQ ID NO10、SEQ ID NO11、SEQ ID NO12或SEQ ID NO14的全長上分別與SEQ ID NO2、SEQ IDNO3、SEQ ID NO7、SEQ ID NO10、SEQ ID NO11、SEQ ID NO12或SEQ ID NO14的氨基酸序列具有至少70%同一性、優選至少80%同一性、更優選至少90%同一性、再更優選至少95%同一性、最優選至少97-99%同一性,前提是所述分離的多肽不是SEQ ID NO2、SEQID NO12或SEQ ID NO14。這種多肽包括SEQ ID NO3、SEQ IDNO7、SEQ ID NO10和SEQ ID NO11的多肽。
優選上述多肽通過重組產生。最優選按照本發明的多肽是經純化的,并且基本上不含任何其它蛋白或污染性宿主來源的材料。
本發明的其它肽包括由包含在SEQ ID NO1中所含序列的多核苷酸編碼的分離的多肽。
本發明也提供CASB7439多肽的免疫原性片段,即CASB7439多肽的一個連續部分,所述免疫原性片段具有與包含下述氨基酸序列的多肽相同或相似的免疫原性特性SEQ ID NO2、SEQ ID NO3、SEQID NO7、SEQ ID NO10、SEQ ID NO11、SEQ ID NO12或SEQ IDNO14。也就是說,所述片段(如有必要,與載體偶聯或作為較大融合蛋白的一部分)能夠產生識別所述CASB7439多肽的免疫應答。這樣的免疫原性片段可以包括例如缺乏N-末端前導序列、跨膜結構域或C-末端錨著結構域的CASB7439多肽。在一個優選的方面,按照本發明的CASB7439免疫原性片段包含多肽的基本上全部的胞外結構域,所述多肽在SEQ ID NO2、SEQ ID NO3、SEQ ID NO7、SEQ ID NO10、SEQ ID NO11、SEQ ID NO12或SEQ ID NO14的全長上分別與SEQID NO2、SEQ ID NO3、SEQ ID NO7、SEQ ID NO10、SEQ ID NO11、SEQ ID NO12或SEQ ID NO14的氨基酸序列具有至少70%同一性、優選至少80%同一性、更優選至少90%同一性、再更優選至少95%同一性、最優選至少97-99%同一性。按照本發明的免疫原性片段最好包含至少一個表位。
摻入CASB7439表位的肽片段通常包含得自SEQ ID NO2的至少7個、優選9個或10個連續氨基酸。優選的表位示于SEQ ID NO16至SEQ ID NO33中。
摻入這些表位的肽構成本發明的一個優選方面。與這些表位的特征相同的模擬表位(mimotope)和包含這些模擬表位、產生與在CASB7439分子環境中的表位有交叉反應的免疫應答的免疫原,也構成本發明的一部分。
因此,本發明包括包含這些表位本身及其任何模擬表位的分離的肽。模擬表位的含義被定義為與天然CASB7439表位足夠相似、以致能夠被識別所述天然分子的抗體識別的實體;(Gheysen,H.M.等,1986,Synthetic peptides as antigens.Wiley,Chichester,Ciba foundationsymposium 119,第130-149頁;Gheysen,H.M.,1986,MolecularImmunology,23,7,709-715);或者當與合適載體偶聯時能夠產生抗體的實體,其中所述抗體與所述天然分子有交叉反應。
以上所鑒定的表位的肽模擬表位可以通過添加、缺失或取代選定氨基酸,設計為供特定目的使用。因而,可以對本發明的肽進行修飾,以便易于與蛋白質載體綴合。例如,對于某些化學綴合方法,可能理想的是所述表位包括一個末端半胱氨酸。另外,對于與蛋白質載體綴合的肽,可能理想的是包括一個遠離所述肽的綴合末端的疏水性末端,以便所述肽的游離未綴合的末端保留與所述載體蛋白質的表面締合。這降低了所述肽的構象自由度,因而增加了以與在所述完整分子的情況下存在的肽構象最為類似的構象呈遞所述肽的機率。例如,所述肽可以被改變成具有一個N-端半胱氨酸和一個C-端疏水性酰胺化尾。另一方面,可以進行一個或多個所述氨基酸的D-立體異構體形式的添加或取代,以產生有益的衍生物,例如增強所述肽的穩定性。本領域技術人員會認識到,這種經修飾的肽或模擬表位可以是全部或部分非肽模擬表位,其中所述組成殘基不一定限于20種天然存在的氨基酸。另外,可以通過本領域已知的技術將其環化,以將所述肽限制在密切類似所述肽序列在完整分子環境中的形狀的構象。將肽環化的一個優選方法包括添加一對半胱氨酸殘基,以允許形成一個二硫橋。
此外,本領域技術人員會認識到,本發明的模擬表位或免疫原可以比上述鑒定的表位大,因此可以包含本文公開的序列。因此,本發明的模擬表位可以包括在一個末端或兩個末端添加許多其它天然殘基的N和/C端延伸。所述肽模擬表位也可以是天然序列的反序列(retrosequence),因為所述序列方向是相反的;或者所述序列可以全部或至少部分由D-立體異構體氨基酸(倒位序列(inverso sequence))構成。另外,所述肽序列可以在特征上是反-倒位的(retro-inverso),因為所述序列方向是相反的,并且所述氨基酸為D-立體異構體形式。這樣的反-倒位肽的優點是非自身的,因此可以克服免疫系統中的自體耐受的問題。
另一方面,采用諸如噬菌體展示技術(EP 0 552 267 B1)的多種技術,使用其自身能夠與本發明的表位結合的抗體可以鑒定肽模擬表位。該技術產生大量的模擬天然肽結構的肽序列,因此能夠與抗天然肽抗體結合,但不一定自身與所述天然肽共享顯著的序列同源性。該方法可能是非常有利的,因為使得有可能鑒定免疫原性特性增強的肽,或者可以克服任何潛在的可能與應用所述天然肽序列相關的自身抗原耐受問題,另外,鑒于其在所識別肽模擬表位序列中有共享的化學特性,該技術使得能夠鑒定各種天然肽的識別模式。
可以用本領域眾所周知的方法使所述肽與免疫原性載體進行共價偶聯。因此,例如,對于直接共價偶聯,有可能利用碳二亞胺、戊二醛或(N-[γ-馬來酰亞胺基丁酰氧基]琥珀酰亞胺酯,利用普通市售的雜雙官能接頭例如CDAP和SPDP(采用生產商的說明))。在偶聯反應后,所述免疫原可以容易地通過透析法、凝膠過濾法、分級分離法等進行分離和純化。
本發明免疫原中所用的載體類型是本領域技術人員容易知道的。所述載體的功能是提供細胞因子輔助,以便幫助誘導針對所述肽的免疫應答。可用于本發明的載體的非竭盡性一覽表包括匙孔血藍蛋白(KLH)、血清白蛋白例如牛血清白蛋白(BSA)、滅活細菌毒素(例如破傷風毒素或白喉毒素(TT和DT))或其重組片段(例如,TT的片段C的結構域1或DT的易位結構域)或結核菌素的純化蛋白衍生物(PPD)。另一方面,所述模擬表位或表位可以直接與脂質體載體綴合,所述脂質體載體另外包含能夠提供T-細胞輔助的免疫原。模擬表位與載體之比最好約為1∶1至20∶1,每個載體最好應該攜帶3-15個肽。
在本發明的一個實施方案中,一種優選的載體是流感嗜血菌(Haemophilus influenzae)的D蛋白(EP 0 594 610 B1)。D蛋白是一種得自流感嗜血菌的IgD結合蛋白,并且Forsgren(WO 91/18926,授權公告號(granted)EP 0 594 610 B1)已獲得專利權。在某些情況下,例如在重組免疫原表達系統中,可能最好利用D蛋白的片段,例如D蛋白的三分之一(包含D蛋白N-末端100-110個氨基酸(GB 9717953.5))。
呈遞本發明肽的另一優選的方法是在重組融合分子的環境中呈遞。例如,EP 0 421 635 B描述了應用嵌合嗜肝DNA病毒核心抗原顆粒呈遞病毒樣顆粒中的外源肽序列。因此,本發明的免疫原可以包含在由乙型肝炎核心抗原構成的嵌合顆粒中呈遞的肽。另外,所述重組融合蛋白可以包含本發明的模擬表位和一種載體蛋白,例如流感病毒的NS1。對于構成本發明部分的任何重組表達的蛋白,編碼所述免疫原的核酸也構成本發明的一個方面。
本發明中所用的肽可以通過本領域眾所周知的固相方法容易地合成。適宜的合成可以通過利用“T-boc”或“F-moc”方法來進行。環肽可以利用眾所周知的“F-moc”方法和全自動裝置中的聚酰胺樹脂通過固相方法來合成。或者,本領域技術人員會知道人工進行所述方法必需的實驗室方法。固相合成的技術和方法描述于E.Atherton和R.C.Sheppard的“Solid Phase Peptide SynthesisA Practieal Approach”,OxfordUniversity Press的IRL出版(1989)。或者,所述肽可以通過重組方法產生,包括在細菌或哺乳動物細胞系中表達編碼所述模擬表位的核酸分子,然后純化所表達的模擬表位。肽和蛋白的重組表達技術是本領域已知的,并且描述于Maniatis,T.,Fritsch,E.F.和Sambrook等,Molecular cloning,a laboratory manual,第二版;Cold Spring HarborLaboratory Press,Cold Spring Harbor,New York(1989)。
在本發明的再一實施方案中提供本文所述多肽的制備方法。本發明的方法可以通過常規重組技術來進行,所述常規重組技術例如描述于Maniatis等,Molecular Cloning-A Laboratory Manual;Cold SpringHarbor(1982-1989)中。因此,提供制備按照本發明多肽的方法,所述方法包括在足以產生所述多肽的條件下培養宿主細胞,從所述培養基中回收所述多肽。具體地說,本發明的方法可能最好包括下列步驟
i)制備能夠在宿主細胞中表達DNA聚合物的復制型或整合型表達載體,所述DNA聚合物包含編碼所述蛋白或其免疫原性衍生物的核苷酸序列;
ii)用所述載體轉化宿主細胞;
iii)在允許表達所述DNA聚合物的條件下培養所述轉化的宿主細胞,以產生所述蛋白;和
iv)回收所述蛋白。
本發明的多肽或免疫原性片段可以是“成熟”蛋白形式,或者可以是更大的蛋白如前體蛋白或融合蛋白的一部分。包括包含以下序列的額外氨基酸序列通常是有利的分泌序列或前導序列、原序列(pro-sequences)、有助于純化的序列如多組氨酸殘基、或在重組生產過程中有利于穩定性的其它序列。此外,也考慮添加外源多肽或脂質尾或多核苷酸序列,以增加最終分子的免疫原性潛能。
一方面,本發明涉及遺傳工程可溶性融合蛋白,所述融合蛋白包含本發明的多肽或其片段,以及不同亞類的免疫球蛋白(IgG、IgM、IgA、IgE)重鏈或輕鏈的恒定區的不同部分。作為免疫球蛋白,優選的是人類IgG(特別是IgG1)的重鏈的恒定部分,其中在絞鏈區發生融合。在一個特定實施方案中,可以通過加入可用凝血因子Xa切除的切割序列就可除去Fc部分。此外,本發明涉及通過遺傳工程制備這些融合蛋白的方法,以及這些融合蛋白在藥物篩選、診斷和治療中的應用。本發明的一個特別優選的方面涉及應用多肽或多核苷酸生產免疫治療性治療患有或易患癌癥、尤其是結腸癌或其它結腸相關性腫瘤或疾病的患者的疫苗。本發明的再一方面還涉及編碼這樣的融合蛋白的多核苷酸。在國際專利申請號WO94/29458和WO94/22914中可以找到融合蛋白技術的實例。
所述蛋白可以化學綴合或作為重組融合蛋白表達,以使得與未融合的蛋白相比,在表達系統中產生的水平提高。所述融合配偶體可以協助提供T輔助細胞表位(免疫融合配偶體)、最好是被人類識別的T輔助細胞表位,或者所述融合配偶體有助于以比天然重組蛋白更高產量表達所述蛋白(表達增強子)。最好所述融合配偶體既是免疫融合配偶體,又是表達增強配偶體。
融合配偶體包括流感嗜血菌B的D蛋白以及流感病毒的非結構蛋白NS1(血凝素)。另一種免疫融合配偶體是稱為LYTA的蛋白。最好使用所述分子的C-末端部分。Lyta得自肺炎鏈球菌(Streptococcuspneumoniae),它合成N-乙酰-L-丙氨酸酰胺酶-酰胺酶LYTA(由lytA基因編碼{Gene,43(1986)第265-272頁}),即特異性降解肽聚糖骨架中某些鍵的自溶素。LYTA蛋白的C-末端結構域負責對膽堿或一些膽堿類似物如DEAE的親和性。已經利用該特性開發可用于表達融合蛋白的大腸桿菌C-LYTA表達質粒。已經描述了在其氨基端包含C-LYTA片段的雜種蛋白的純化{Biotechnology10,(1992)第795-798頁}。可利用存在于Lyta分子C-末端的起始于殘基178的重復序列部分,例如殘基188-305。
本發明也包括前述多肽的異種形式(也稱為直向同源物形式),所述異種形式是指與人類抗原(也稱為自身抗原)具有大致序列同一性的抗原,所述抗原用作來源于不同的非人類物種的參比抗原。在該方面,所述大致同一性是指當序列在本領域已知的眾多序列比對蛋白中的任一種中以最佳序列比對排列時一個氨基酸序列與另一個氨基酸序列或者一個多核苷酸序列與另一個多核苷酸序列的一致性。所謂的大致同一性是指比較序列之間的序列同一性至少為70-95%、優選至少85-95%、最優選至少90-95%。因此,按照本發明,異種CASB7439多肽將是對于人CASB7439為異種的CASB7439多肽,換句話說,異種CASB7439多肽從非人類的物種中分離出來。在一個優選的實施方案中,所述多肽從小鼠、大鼠、豬或恒河猴中分離,最優選分離自小鼠或大鼠。因此,本發明也提供在人體內誘導針對人CASB7439的免疫應答的方法,所述方法包括給予所述受治療者有效劑量的包含如本文中所述的所述人CASB7439的異種形式的組合物,所述人CASB7439的氨基酸序列如序列SEQ ID NO2、SEQ ID NO3、SEQ ID NO7、SEQID NO10或SEQ ID NO11中的任一序列所示。一個優選的實施方案是使用從小鼠、大鼠、豬或恒河猴中分離的異種CASB7439誘導針對人CASB7439的免疫應答的方法。按照本發明誘導免疫應答的另一種優選方法是使用包括表達所述異種抗原的活病毒表達系統的抗原組合物。優選的異種CASB7439多肽的序列示于SEQ ID NO12(小鼠)或SEQ ID NO14(大鼠)中。
分離的異種CASB7439多肽通常共享大致序列相似性,包括包含在SEQ ID NO12或SEQ ID NO14的全長上與SEQ ID NO12或SEQID NO14的氨基酸序列具有至少70%同一性、優選至少80%同一性、更優選至少90%同一性、再更優選至少95%同一性、最優選至少97-99%同一性的氨基酸序列的分離多肽。因此,所述異種多肽包含SEQ IDNO12或SEQ ID NO14的多肽的免疫原性片段,其中所述免疫原性片段的免疫原性活性基本上與SEQ ID NO12或SEQ ID NO14的多肽相同。另外,所述異種CASB7439多肽可以是這樣的片段選自SEQ IDNO12或SEQ ID NO14中所示的氨基酸序列的至少約20個連續氨基酸、優選約30個、更優選約50個、再更優選約100個、最優選約150個連續氨基酸。更具體地說,異種CASB7439片段會保留SEQ ID NO12或SEQ ID NO14中所示的較大分子的某些功能特性、最好是免疫活性,并且可用于本文所述的方法中(例如可用于藥用組合物或疫苗組合物、診斷學中等)。具體地說,所述片段能夠引起針對人類對應物的免疫應答,例如產生與任一SEQ ID NO2所示的自身人類CASB7439形式反應的交叉反應性抗體。在一個具體的實施方案中,本發明的異種多肽可以是較大融合物的一部分,所述融合物包含異種CASB7439多肽或其片段以及如上所述的用作融合配偶體的異源蛋白或蛋白部分。
本發明還包括前述多肽的變異體,即通過保守氨基酸取代、從而一個殘基被另一個具有相似特性的殘基取代而與參比物不同的多肽。通常這樣的取代發生在Ala、Val、Leu和Ile之間;Ser和Thr之間;酸性殘基Asp和Glu之間;Asn和Gln之間;以及堿性殘基Lys和Arg之間;或芳香族殘基Phe和Tyr之間。特別優選其中若干個、5-10個、1-5個、1-3個、1-2個或1個氨基酸以任何組合發生取代、缺失或添加的變異體。
可以以任何合適的方式制備本發明的多肽。這樣的多肽包括分離的天然存在的多肽、重組產生的多肽、合成產生的多肽或通過這些方法的組合產生的多肽。用于制備這樣的多肽的方法是本領域眾所周知的。
另一方面,本發明涉及CASB7439多核苷酸。這樣的多核苷酸包括含編碼多肽的核苷酸序列的分離的多核苷酸,所述多肽在SEQ IDNO2、SEQ ID NO3、SEQ ID NO7、SEQ ID NO10或SEQ ID NO11的全長上分別與SEQ ID NO2、SEQ ID NO3、SEQ ID NO7、SEQ IDNO10或SEQ ID NO11的氨基酸序列具有至少70%同一性、優選至少80%同一性、更優選至少90%同一性、再更優選至少95%同一性。在這一方面,高度優選具有至少97%同一性的所編碼多肽,而更高度優選具有至少98-99%同一性的所編碼多肽,最高度優選具有至少99%同一性的所編碼多肽。
本發明的其它多核苷酸包括分離的多核苷酸,所述多核苷酸包含的一段核苷酸序列在完整編碼區上與編碼SEQ ID NO2、SEQ IDNO3、SEQ ID NO7、SEQ ID NO10或SEQ ID NO11的多肽的核苷酸序列具有至少70%同一性、優選至少80%同一性、更優選至少90%同一性、再更優選至少95%同一性。在這一方面,高度優選具有至少97%同一性的多核苷酸,而更高度優選具有至少98-99%同一性的多核苷酸,最高度優選具有至少99%同一性的多核苷酸。
本發明的其它多核苷酸包括分離的多核苷酸,所述多核苷酸包含的一段核苷酸序列在所述序列的全長上與SEQ ID NO1、SEQ IDNO4、SEQ ID NO5、SEQ ID NO6、SEQ ID NO8或SEQ ID NO9或者在SEQ ID NO1、SEQ ID NO4、SEQ ID NO5、SEQ ID NO6、SEQ ID NO8或SEQ ID NO9的所述編碼序列的全長上與SEQ IDNO1、SEQ ID NO4、SEQ ID NO5、SEQ ID NO6、SEQ ID NO8或SEQ ID NO9的編碼序列具有至少70%同一性、優選至少80%同一性、更優選至少90%同一性、再更優選至少95%同一性。在這一方面,高度優選具有至少97%同一性的多核苷酸,而更高度優選具有至少98-99%同一性的多核苷酸,最高度優選具有至少99%同一性的多核苷酸。這樣的多核苷酸包括含SEQ ID NO1、SEQ ID NO4、SEQ IDNO5、SEQ ID NO6、SEQ ID NO8或SEQ ID NO9多核苷酸的多核苷酸以及SEQ ID NO1、SEQ ID NO4、SEQ ID NO5、SEQ ID NO6、SEQ ID NO8、SEQ ID NO9的多核苷酸或者SEQ ID NO1、SEQ IDNO4、SEQ ID NO5、SEQ ID NO6、SEQ ID NO8或SEQ ID NO9的編碼區。
本發明還提供編碼本發明的前述異種蛋白的核酸及其在醫藥領域的應用。在一個優選的實施方案中,用于藥用組合物的異種CASB7439多核苷酸的序列示于SEQ ID NO13(小鼠)或SEQ ID NO15(大鼠)。按照本發明的分離的異種CASB7439多核苷酸可以是單鏈(編碼鏈或反義鏈)或雙鏈的,并且可以是DNA分子(基因組分子、cDNA分子或合成分子)或RNA分子。其它的編碼序列或非編碼序列可以但不一定存在于本發明的多核苷酸中。在其它相關實施方案中,本發明提供多核苷酸變異體,所述多核苷酸變異體與SEQ ID NO13或SEQ ID NO15中本文公開的序列有大致同一性,例如采用本文所述的方法(例如使用標準參數的BLAST分析)與本發明的多核苷酸序列相比包含至少70%序列同一性、優選至少75%、80%、85%、90%、95%、96%、97%、98%或99%或更高序列同一性的多核苷酸變異體。在一個相關實施方案中,本發明的分離的異種多核苷酸包含編碼在SEQ ID NO12或SEQID NO14的全長上與SEQ ID NO12或SEQ ID NO14的氨基酸序列具有至少90%、最好是95%和95%以上同一性的多肽的核苷酸序列或者與所述分離的多核苷酸互補的核苷酸序列。
本發明還提供與所有上述多核苷酸互補的多核苷酸。
可以將所述多核苷酸插入到合適的質粒、重組微生物載體或活的重組微生物中,并且可以供免疫接種使用(參見例如Wolff等,Science2471465-1468(1990);Corr等,J.Exp.Med.1841555-1560(1996);Doe等,Proc.Natl.Acad.Sci.938578-8583(1996))。因此,本發明提供了包含如上定義的所述多核苷酸的表達載體或活的重組微生物。
本發明還提供CASB7439多核苷酸的片段,其中當給予受治療者時所述片段的免疫原性特性與以下的多核苷酸的免疫原性特性相同SEQ ID NO1、SBQ ID NO4、SEQ ID NO5、SEQ ID NO6、SEQ IDNO8、SEQ ID NO9、SEQ ID NO13或SEQ ID NO15。
本發明還提供編碼如前面定義的CASB7439多肽的免疫性片段的多核苷酸。
所述片段的免疫原性活性水平為SEQ ID NO2、SEQ ID NO3、SEQ ID NO7、SEQ ID NO10或SEQ ID NO11、SEQ ID NO12或SEQID NO14中所示的多肽序列或者由SEQ ID NO1、SEQ ID NO4、SEQID NO5、SEQ ID NO6、SEQ ID NO8、SEQ ID NO9、SEQ ID NO13或SEQ ID NO15中所示的多核苷酸序列編碼的多肽序列的免疫原性活性水平的至少約50%、優選至少約70%、更優選至少約90%。
按照本發明的多肽片段最好包含至少約5個、10個、15個、20個、25個、50個或100個連續氨基酸或者100個以上的連續氨基酸,包括所有居中長度的本文所示的多肽組合物,例如SEQ ID NO2、SEQID NO3、SEQ ID NO7、SEQ ID NO10、SEQ ID NO11、SEQ ID NO12或SEQ ID NO14中所示的多肽組合物,或者由SEQ ID NO1、SEQ IDNO4、SEQ ID NO5、SEQ ID NO6、SEQ ID NO8、SEQ ID NO9、SEQ ID NO13或SEQ ID NO15的序列中所示的多核苷酸序列編碼的多肽組合物。
SEQ ID NO1的核苷酸序列是包含編碼193個氨基酸的多肽即SEQ ID NO2的多肽的多肽編碼序列(核苷酸545-1126)的cDNA序列。編碼SEQ ID NO2的多肽的核苷酸序列可以與在SEQ ID NO1中所含的多肽編碼序列相同,或者它可以是不同于在SEQ ID NO1中所含的多肽編碼序列的序列,由于遺傳密碼的豐余性(簡并性),所述核苷酸序列也編碼SEQ ID NO2的多肽。SEQ ID NO2的多肽在結構上與achaete scute家族的其它蛋白相關,并且也命名為“人Achaete Scute同源物2”(HASH2)(登記號NP_005161和AAB86993)。
人Achaete Scute同源物2(HASH2)基因—正式命名為人ASCL2(Achaete Scute復合物樣2)是果蠅屬(Drosophila)Achaete和Scute基因的同源物。人ASCL2僅在發育中的胎盤的滋養層外絨毛(extravillustrophoblast)中表達,并且作圖至染色體11p15上靠近IGF2和H19。小鼠achaete-scute同系物-2基因(MASH2)編碼在滋養層的發育中起作用的轉錄因子。Mash2基因在小鼠中是父性遺傳的,并且在非惡性水泡狀(單雌生殖(andorgenetic))胎塊中缺乏人ASCL2的表達,表明人Ascl2也在人類中遺傳。
Ascl2基因是轉錄因子的堿性螺旋-環-螺旋(BHLH)家族的成員。它們通過與E框(5’-CANNTG-3’)結合而激活轉錄。與其它BHLH蛋白二聚體化是有效DNA結合所需的。它們在黑腹果蠅(Drosophilamelanogaster)以及可能在哺乳動物中參與決定周圍神經系統和中樞神經系統中的神經元前體。
SEQ ID NO1核苷酸序列的互補鏈是SEQ ID NO6的多核苷酸序列。該鏈也包含兩種其它多肽編碼序列。第一種多肽編碼序列(SEQ IDNO1的核苷酸1184-399,SEQ ID NO6的核苷酸608-1393)編碼一種262個氨基酸的多肽,即SEQ ID NO3的多肽。第二種多肽編碼序列(SEQ ID NO1的核苷酸840-262,SEQ ID NO6的核苷酸952-1530)編碼一種193個氨基酸的多肽,即SEQ ID NO11的多肽。編碼SEQ IDNO3和SEQ ID NO11的多肽的核苷酸序列可以與在SEQ ID NO6中所含的多肽編碼序列相同,或者它可以是不同于在SEQ ID NO6中所含的多肽編碼序列的序列,由于遺傳密碼的豐余性(簡并性),所述核苷酸序列也編碼SEQ ID NO3和SEQ ID NO11的多肽。SEQ IDNO3的多肽在結構上與剪接輔激活蛋白家族的其它蛋白相關,與人(Homo sapiens)剪接輔激活蛋白亞基srm300(Genbank登記號AAF21439)具有同源性和/或結構相似性。SEQ ID NO11的多肽與任何已知的蛋白不相關。SEQ ID NO3和SEQ ID NO11中所示的多肽序列以及SEQ ID NO6中所示的多核苷酸序列是新的序列,并且也構成本發明的一部分。
預期本發明的優選多肽和多核苷酸除了別的以外,與其同源多肽和多核苷酸的生物功能/特性相似。此外,本發明優選的多肽、免疫性片段和多核苷酸具有SEQ ID NO1、SEQ ID NO2、SEQ ID NO3或SEQ ID NO11的適當的至少一種活性。
本發明還涉及部分或其它不完全的多核苷酸序列和多肽序列,所述序列是在測定SEQ ID NO1、SEQ ID NO2、SEQ ID NO3和SEQ IDNO11的相應全長序列之前首先鑒定的。
因此,再一方面,本發明提供分離的多核苷酸,所述多核苷酸
(a)包含在SEQ ID NO4和SEQ ID NO5的全長上與SEQ ID NO4和SEQ ID NO5具有至少70%同一性、優選至少80%同一性、更優選至少90%同一性、再更優選至少95%同一性、甚至更優選至少97-99%同一性的核苷酸序列;
(b)具有在SEQ ID NO4和SEQ ID NO5的全長上分別與SEQ IDNO1或SEQ ID NO6具有至少70%同一性、優選至少80%同一性、更優選至少90%同一性、再更優選至少95%同一性、甚至更優選至少97-99%同一性的核苷酸序列;
(c)SEQ ID NO4和SEQ ID NO5的多核苷酸;或
(d)編碼多肽的核苷酸序列以及SEQ ID NO4和SEQ ID NO5的多核苷酸,所述多肽在SEQ ID NO2和SEQ ID NO7的全長上分別與SEQ ID NO2和SEQ ID NO7的氨基酸序列具有至少70%同一性、優選至少80%同一性、更優選至少90%同一性、再更優選至少95%同一性、甚至更優選至少97-99%同一性。
本發明還提供這樣的多肽,所述多肽
(a)包含在SEQ ID NO2或SEQ ID NO7的全長上與SEQ ID NO2和SEQ ID NO7的氨基酸序列具有至少70%同一性、優選至少80%同一性、更優選至少90%同一性、再更優選至少95%同一性、最優選至少97-99%同一性的氨基酸序列;
(b)具有在SEQ ID NO2或SEQ ID NO7的全長上與SEQ ID NO2或SEQ ID NO7的氨基酸序列具有至少70%同一性、優選至少80%同一性、更優選至少90%同一性、再更優選至少95%同一性、最優選至少97-99%同一性的氨基酸序列;
(c)包含SEQ ID NO2或SEQ ID NO7的氨基酸;和
(d)是SEQ ID NO7的多肽;
以及本發明還提供由包含在SEQ ID NO4和SEQ ID NO5中所含的序列的多核苷酸編碼的多肽。
可以采用標準克隆和篩選技術,從人結腸癌細胞中的mRNA衍生的cDNA文庫中獲得本發明的多核苷酸,(例如Sambrook等,MolecularCloningA Laboratory Manual,第二版,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.(1989))。本發明的多核苷酸也可以得自諸如基因組DNA文庫的天然來源,或者可以采用眾所周知的在商業上可獲得的技術進行合成。
當用本發明的多核苷酸重組生產本發明的多肽時,所述多核苷酸可以包括成熟多肽的編碼序列本身;或在讀框中還有其它編碼序列的成熟多肽的編碼序列,所述其它編碼序列例如編碼前導序列或分泌序列、前蛋白(pre-protein)序列或原蛋白(pro-protein)序列、或前原蛋白(prepro-protein)序列或其它融合肽部分的序列。例如,可以編碼有利于純化所融合的多肽的標記序列。在本發明該方面的某些優選的實施方案中,所述標記序列為在pQE載體(Qiagen,Inc.)中提供并在Gentz等,Proc Natl Acad Sci USA(1989)86821-824中描述的六組氨酸肽,或者是HA標記。所述多核苷酸也可以含有5’和3’非編碼序列,例如轉錄但不翻譯的序列、剪接信號和聚腺苷酸化信號、核糖體結合位點和穩定mRNA的序列。
本發明的其它實施方案包括編碼多肽變異體的多核苷酸,所述多肽變異體包含SEQ ID NO2、SEQ ID NO3、SEQ ID NO7、SEQ IDNO11、SEQ ID NO13或SEQ ID NO15的氨基酸序列,其中若干個、例如5-10個、1-5個、1-3個、1-2個或1個氨基酸以任何組合發生取代、缺失或添加。
與SEQ ID NO1或SEQ ID NO6中所含的核苷酸序列相同或足夠相同的多核苷酸可以用作cDNA和基因組DNA的雜交探針或者用作核酸擴增(PCR)的引物,以分離編碼本發明多肽的全長cDNA和基因組克隆,以及分離與SEQ ID NO1或SEQ ID NO6具有高度序列相似性的其它基因(包括編碼來源于人的共生同源物和來源于除人類以外的物種的直向同源物和共生同源物的基因)的cDNA和基因組克隆。通常,這些核苷酸序列與參比物的序列有70%相同、優選80%相同、更優選90%相同、最優選95%相同。所述探針或引物總的來講包含至少15個核苷酸、最好是至少30個核苷酸,并且可以具有至少50個核苷酸。特別優選的探針具有30-50個核苷酸。特別優選的引物具有20-25個核苷酸。具體地說,從同種動物來源序列獲得的多肽或多核苷酸可以用作免疫原,以獲得與人基因有交叉反應的免疫應答。
編碼本發明多肽包括來自除人以外的物種的同系物在內的多核苷酸,可以通過這樣的方法獲得所述方法包括在嚴格雜交條件下,用具有SEQ ID NO1或SEQ ID NO6的序列或其片段的標記探針,篩選合適的文庫;并且分離含有所述多核苷酸序列的全長cDNA和基因組克隆的步驟。這樣的雜交技術是本領域技術人員眾所周知的。優選的嚴格雜交條件包括在包含以下組分的溶液中于42℃保溫過夜50%甲酰胺、5x SSC(150mM NaCl、15mM檸檬酸三鈉)、50mM磷酸鈉(pH7.6)、5x Denhardt氏溶液、10%葡聚糖硫酸酯和20微克/ml變性剪切的鮭精DNA;然后在0.1x SSC中在約65℃下洗滌濾膜。因此,本發明也包括在嚴格雜交條件下,用具有SEQ ID NO1或SEQ ID NO6的序列或其片段的標記探針,通過篩選合適的文庫可獲得的多核苷酸。
技術人員知道,在許多情況下,分離的cDNA序列是不完全的,因為所述多肽的編碼區在所述cDNA的5’端較短。
對于本領域技術人員而言,有數種獲得全長cDNA或延伸短cDNA的方法可利用并且是眾所周知的,例如基于cDNA末端快速擴增(RACE)方法的那些方法(參見例如Frohman等,PNAS USA 85,8998-9002,1988)。例如以MarathonTM技術(Clontech Laboratories Inc.)為例的最新改進的該技術已大大簡化了對較長cDNA的搜索。在MarathonTM技術中,用從選定組織中提取的mRNA制備cDNA,并將“接頭”序列連接到每個末端。然后使用基因特異性寡核苷酸引物和接頭特異性寡核苷酸引物的組合,進行核酸擴增(PCR),以擴增所述cDNA“缺失的”5’端。然后使用“嵌套”引物重復所述PCR反應,“嵌套”引物即是設計在所擴增的產物內退火的引物(通過是在接頭序列中更遠的3’退火的接頭特異性引物和在已知的基因序列中更遠的5’退火的基因特異性引物)。然后可以通過DNA測序分析該反應的產物,隨后通過使所述產物直接連接到現有cDNA而產生完整的序列,或者使用新的序列信息設計5’引物來進行一個獨立的全長PCR,構建全長cDNA。
通過本領域眾所周知的方法,可以用包含表達系統的遺傳工程改造的宿主細胞制備本發明的重組多肽。因此,再一方面,本發明涉及包含本發明多核苷酸的表達系統,涉及用這樣的表達系統遺傳工程改造的宿主細胞,還涉及通過重組技術產生本發明的多肽。也可以采用衍生自本發明的DNA構建體的RNA,使用無細胞翻譯系統生產這樣的蛋白質。
為了重組生產,可以遺傳工程改造宿主細胞以摻入本發明多核苷酸的表達系統或其部分。可以采用許多標準實驗室手冊中介紹的方法,實現將多核苷酸導入宿主細胞,所述實驗室手冊例如Davis等,Basic Methods in Molecular Biology(1986)和Sambrook等,MolecularCloningA Laboratory Manual,第二版,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.(1989)。優選的這類方法包括例如磷酸鈣轉染、DEAE-葡聚糖介導的轉染、轉位、微注射、陽離子脂質介導的轉染、電穿孔、轉導、擦傷加樣(scrape loading)、基因槍引入(ballisticintroduction)或感染。
本發明的蛋白最好與反式硫氧還蛋白(TIT)共表達。優選反式與順式硫氧還蛋白共表達,以保持抗原無硫氧還蛋白,而不需要蛋白酶。硫氧還蛋白共表達使本發明的蛋白易于溶解。硫氧還蛋白共表達還對蛋白純化得率、對純化蛋白的溶解度和質量產生顯著影響。
合適宿主的代表性實例包括細菌細胞,如鏈球菌(Streptococci)、葡萄球菌(Staphylococci)、大腸桿菌、鏈霉菌屬(Streptomyces)和枯草芽孢桿菌(Bacillus subtilis)細胞;真菌細胞,例如酵母細胞和曲霉屬(Aspergillus)的細胞;昆蟲細胞,例如果蠅屬(Drosophila)S2細胞和貪夜蛾(Spodoptera)Sf9細胞;動物細胞,例如CHO、COS、HeLa、C127、3T3、BHK、HEK 293和Bowes黑素瘤細胞;和植物細胞。
可以使用各種各樣的表達系統,例如染色體衍生的系統、附加體衍生的系統和病毒衍生的系統,例如衍生自以下的載體細菌質粒、噬菌體、轉座子、酵母附加體、插入元件、酵母染色體元件;衍生自以下病毒的載體桿狀病毒、乳多空病毒(如SV40)、痘苗病毒、腺病毒、禽痘病毒、假狂犬病病毒和反轉錄病毒;以及衍生自其組合的載體,例如衍生自質粒和噬菌體遺傳元件的那些載體,諸如粘粒和噬菌粒。所述表達系統可以包含調節以及產生表達的控制區。一般而言,可以使用能夠在宿主中維持、繁殖或表達多核苷酸以產生多肽的任何系統或載體。可以通過多種眾所周知的常規技術中的任何一種,將合適的核苷酸序列插入表達系統中,所述常規技術例如Sambrook等,Molecular CloningA Laboratory Manual(參見上文)所介紹的技術。為了讓翻譯的蛋白分泌到內質網腔、壁膜間隙或胞外環境中,可以將合適的分泌信號摻入到所需的多肽中。這些信號對于所述多肽可以是內源的,或者它們可以是異源信號。
所述表達系統也可以是活的重組微生物,例如病毒或細菌。可以將感興趣的基因插入活的重組病毒或細菌的基因組中。用該活的載體接種和體內感染,將使所述抗原在體內表達并誘導免疫應答。
因此,在某些實施方案中,采用眾多已知基于病毒的系統中的任一系統,將編碼本發明免疫原性多肽的多核苷酸導入用于表達的合適哺乳動物宿主細胞中。在一個說明性的實施方案中,反轉錄病毒提供用于基因傳遞系統的便利有效的平臺。采用本領域已知的技術,可以將編碼本發明多肽的選定核苷酸序列插入到載體中,然后在反轉錄病毒顆粒中包裝。然后可以分離所述重組病毒,將其給予受治療者。許多說明性的反轉錄病毒系統已有介紹(例如美國專利第5,219,740號;Miller和Rosman(1989)BioTechniques 7980-990;Miller,A.D.(1990)Human Gene Therapy 15-14;Scarpa等(1991)Virology 180849-852;Burns等(1993)Proc.Natl.Acad.Sci.USA 908033-8037;和Boris-Lawrie和Temin(1993)Cur.Opin.Genet.Develop.3102-109)。
另外,許多說明性的基于腺病毒的系統也有介紹。與整合到宿主基因組中的反轉錄病毒不同,腺病毒一直位于染色體外,因而將與插入誘變相關的危險減至最小(Haj-Ahmad和Graham(1986)J.Virol.57267-274;Bett等(1993)J.Virol.675911-5921;Mittereder等(1994)Human Gene Therapy 5717-729;Seth等(1994)J.Virol.68933-940;Barr等(1994)Gene Therapy 151-58;Berkner,K.L.(1988)BioTechniques6616-629;和Rich等(1993)Human Gene Therapy 4461-476)。
還開發出各種腺伴隨病毒(AAV)載體系統用以傳遞多核苷酸。采用本領域眾所周知的技術,可以容易地構建AAV載體。參見,例如,美國專利第5,173,414號和第5,139,941號;國際公布號WO 92/01070和WO 93/03769;Lebkowski等(1988)Molec.Cell.Biol.83988-3996;Vincent等(1990)Vaccines 90(Cold Spring Harbor Laboratory Press);Carter,B.J.(1992)Current Opinion in Biotechnology 3533-539;Muzyczka,N.(1992)Current Topics in Microbiol.and Immunol.15897-129;Kotin,R.M.(1994)Human Gene Therapy 5793-801;Shelling和Smith(1994)Gene Therapy 1165-169;和Zhou等(1994)J.Exp.Med.1791867-1875。
可用于通過基因傳移傳遞編碼本發明多肽的核酸分子的其它病毒載體包括衍生自痘病毒科(例如痘苗病毒和禽痘病毒)的病毒載體。作為實例,可以如下構建表達所述新分子的痘苗病毒重組體。首先將編碼多肽的DNA插入到合適的載體中,使得它鄰接一個痘苗病毒啟動子和側翼痘苗病毒DNA序列,例如編碼胸苷激酶(TK)的序列。然后用該載體轉染同時用痘苗病毒感染的細胞。同源重組使痘苗病毒啟動子加上編碼感興趣的多肽的基因插入到病毒基因組中。通過在5-溴脫氧尿苷存下下培養細胞,然后挑出抗性病毒空斑,可以選擇所產生的TK.sup.(-)重組體。
可以方便地用基于痘苗病毒的感染/轉染系統在某一生物的宿主細胞內提供本文所述的一種或多種多肽的誘導型瞬時表達或共表達。在這一特定系統中,首先在體外用編碼噬菌體T7RNA聚合酶的痘苗病毒重組體感染細胞。該聚合酶表現出靈敏的特異性,因為它只轉錄帶有T7啟動子的模板。感染后,細胞用由T7啟動子驅動的一種或多種感興趣的多核苷酸轉染。來自痘苗病毒重組體在胞質內表達的聚合酶將轉染的DNA轉錄成RNA,然后通過宿主翻譯機器將其翻譯成多肽。所述方法可供用于高水平、瞬時、胞質內生產大量的RNA及其翻譯產物。參見,例如,Elroy-Stein和Moss,Proc.Natl.Acad.Sci.USA(1990)876743-6747;Fuerst等,Proc.Natl.Acad.Sci.USA(1986)838122-8126。
或者,也可用諸如禽痘病毒(fowlpox virus)和金絲雀痘病毒的禽痘病毒(avipoxvirus)傳遞感興趣的編碼序列。已知表達得自哺乳動物病原體的免疫原的重組禽痘病毒(avipox virus)當給予非禽類物種時提供保護性免疫。在人和其它哺乳動物物種中應用禽痘病毒載體是特別理想的,這是由于禽痘病毒屬的成員僅可以在易感的禽類物種中生產性地復制,因此它們在哺乳動物細胞內是沒有感染力的。制備重組禽痘病毒的方法在本領域是已知的,并且使用如上所述的關于制備痘苗病毒的遺傳重組。參見,例如,WO 91/12882;WO 89/03429和WO92/03545。
還可以用眾多甲病毒載體中的任一種傳遞本發明的多核苷酸組合物,例如在美國專利號5,843,723、6,015,686、6,008,035和6,015,694中介紹的那些載體。也可以使用基于委內瑞拉馬腦炎(VEE)病毒的某些載體,其說明性的實例可以在美國專利第5,505,947號和第5,643,576號中找到。
此外,還可以使用Michael等J.Biol.Chem.(1993)2686866-6869和Wagner等Proc.Natl.Acad.Sci.USA(1992)896099-6103中介紹的諸如腺病毒嵌合載體的分子綴合載體來進行本發明的基因傳遞。
有關這些和其它已知的基于病毒的傳遞系統的其它說明性資料可以在以下的文獻中找到例如Fisher-Hoch等,Proc.Natl.Acad.Sci.USA86317-321,1989;Flexner等,Ann.N.Y. Acad.Sci.56986-103,1989;Flexner等,Vaccine 817-21,1990;美國專利號4,603,112、4,769,330和5,017,487;WO 89/01973;美國專利號4,777,127;GB 2,200,651;EP0,345,242;WO 91/02805;Berkner,Biotechniques 6616-627,1988;Rosenfeld等,Science 252431-434,1991;Kolls等,Proc.Natl.Acad.Sci.USA 91215-219,1994;Kass-Eisler等,Proc.Natl.Acad.Sci.USA9011498-11502,1993;Guzman等,Circulation 882838-2848,1993;和Guzman等,Cir.Res.731202-1207,1993。
上述活的重組微生物可以是有毒力的,或者是以各種方式減毒以獲得活疫苗。這樣的活疫苗也構成本發明的一部分。
在某些實施方案中,可以將多核苷酸整合到靶細胞的基因組中。這種整合可以在特定位置以特定方向通過同源重組進行(基因置換),或者它可以在隨機、非特定位置內整合(基因擴增)。在另外一些實施方案中,所述多核苷酸可以在細胞內作為獨立的附加型DNA區段穩定地保持。這樣的多核苷酸區段或“附加體”編碼的序列足以允許其保持并且獨立于宿主細胞周期進行復制或者與宿主細胞周期同步復制。表達構建體傳遞至細胞的方式以及所述多核苷酸保持在所述細胞內的位置取決于所用的表達構建體的類型。
在本發明的另一實施方案中,例如如在Ulmer等,Science2591745-1749,1993中的描述和Cohen,Science 2591691-1692,1993的綜述,多核苷酸作為“裸”DNA給予/傳遞。通過將裸DNA包被到被有效地轉運到細胞內的生物可降解的微珠上,可以增加所述DNA的攝入。
在再一實施方案中,本發明的組合物可以通過粒子轟擊法傳遞,其中許多方法已有介紹。在一個說明性的實施例中,用諸如PowderjectPharmaceuticals PLC(Oxford,UK)和Powderject Vaccines Inc.(Madison,WI)生產的裝置可以實現氣動粒子加速,其中某些實施例描述于美國專利號5,846,796、6,010,478、5,865,796、5,584,807和歐洲專利號0500799。該方法提供一種無針傳遞方法,其中諸如多核苷酸或多肽粒子的微粒干粉制劑在由hand held deviee產生的氦氣噴射流中被加速至高速,推動所述粒子到達感興趣的靶組織。
在一個相關實施方案中,可以用于氣動無針注射本發明組合物的其它裝置和方法包括Bioject,Inc.(Portland,OR)提供的裝置和方法,其中某些實施例描述于美國專利號4,790,824、5,064,413、5,312,335、5,383,851、5,399,163、5,520,639和5,993,412。
通過眾所周知的方法,可以從重組細胞培養物中回收并純化本發明的多肽,所述方法包括硫酸銨沉淀或乙醇沉淀、酸提取、陰離子交換層析或陽離子交換層析、磷酸纖維素層析、疏水作用層析、親和層析、羥基磷灰石層析和凝集素層析。最優選使用離子金屬親和層析(IMAC)進行純化。當所述多肽在胞內合成、分離和/或純化過程中變性時,可以使用熟知的重折疊蛋白技術重建活性構象。
本發明的另一重要方面涉及誘導、加強或調節哺乳動物體內免疫應答的方法,所述方法包括用足以產生抗體和/或T細胞免疫應答的本發明的完整多肽或多核苷酸或其片段接種哺乳動物,用于免疫預防或用于治療性治療癌癥、更特別是結腸直腸癌和自身免疫病及相關病癥。本發明的再一方面涉及誘導、加強或調節哺乳動物體內免疫應答的方法,所述方法包括通過在體內指導表達所述多核苷酸和編碼所述多肽的載體或細胞來傳遞本發明的多肽,以便誘導這樣的免疫應答,以產生預防或治療所述動物免患疾病的免疫應答。
本發明的再一方面涉及免疫制劑/疫苗制劑(組合物)及其在醫藥領域的應用。當所述組合物被引入哺乳動物宿主后,在該哺乳動物體內誘導、加強或調節針對本發明多肽的免疫應答,其中所述組合物包含如本文前面所限定的本發明的多肽或多核苷酸或其免疫學片段。更具體地說,按照本發明的免疫原性組合物包含安全有效量的CASB7439多肽或其免疫原性片段,其中所述CASB7439多肽選自SEQ ID NO2、SEQ ID NO3、SEQ ID NO7、SEQ ID NO10、SEQ ID NO11、SEQ IDNO12或SEQ ID NO14。在另一個實施方案中,所述免疫原性組合物包含安全有效量的編碼CASB7439的多核苷酸或其片段,其中所述編碼CASB7439的多核苷酸選自SEQ ID NO1、SEQ ID NO4、SEQ IDNO5、SEQ ID NO6、SEQ ID NO8、SEQ ID NO9、SEQ ID NO13或SEQ ID NO15。
按照本發明的疫苗制劑還可以包含一種合適的載體,即藥學上可接受的載體。由于多肽可能在胃中分解,因此它們最好是胃腸外給予(例如皮下注射、肌內注射、靜脈內注射或皮內注射)。適合于胃腸外給藥的制劑包括水性和非水無菌注射液,所述注射液可以包含抗氧化劑、緩沖劑、抑菌劑和使得所述制劑與受體血液等滲的溶質;以及可以包含懸浮劑或增稠劑的水性和非水無菌懸浮液。所述制劑可以盛裝在單位劑量容器或多劑量容器(例如密封安瓿和管形瓶)中,并且可以在凍干條件下保存,只需要在臨用前加入無菌液體載體即可。
本發明的再一方面涉及采用來自哺乳動物免疫系統的細胞,在體外誘導針對本發明的完整多肽或多核苷酸或其片段的免疫應答或者是針對包含本發明多肽或多核苷酸的分子的免疫應答,并且將這些活化免疫細胞回輸給所述哺乳動物以治療疾病。通過與本發明完整多肽或多核苷酸或者包含本發明多肽或多核苷酸的分子在有或無各種免疫調節分子的情況下體外孵育,達到活化來自所述免疫系統的所述細胞。本發明的再一方面涉及通過給予抗原呈遞細胞免疫哺乳動物,所述抗原呈遞細胞通過在體外加載本發明的完整多肽或其部分或者包含本發明多肽的分子而被修飾,然后以免疫原性方式將所述抗原呈遞細胞給予體內。或者,可以用含有本發明的完整多核苷酸或其片段或者包含本發明多核苷酸的分子的載體,體外轉染抗原呈遞細胞,例如以表達相應的多肽,然后以免疫原性方式將所述抗原呈遞細胞給予體內。因此,本發明的藥用組合物包含有效量的抗原呈遞細胞和藥學上有效的載體,所述抗原呈遞細胞通過在體外加載CASB7439多肽而被修飾或者在體外經遺傳修飾而表達CASB7439多肽。
按照另一個實施方案,除本發明的免疫原性多核苷酸、多肽、抗體、T細胞和/抗原呈遞細胞(APC)組合物外,本文所述的藥用組合物/免疫原性組合物還包含一種或多種免疫刺激劑。因此,本文提供生產所述免疫原性組合物的方法,所述方法包括將CASB7439多肽或編碼CASB7439的多核苷酸與合適的佐劑/免疫刺激劑、稀釋劑或其它藥學上可接受的載體混合。免疫刺激劑實質上是指提高或增強對外源性抗原的免疫應答(抗體和/細胞介導)的任何物質。一種優選類型的免疫刺激劑包括佐劑。許多佐劑含有設計周以保護抗原免遭快速分解的物質,例如氫氧化鋁或礦物油,以及含有免疫應答的刺激劑,例如脂質A,百日咳博德特氏菌(Bortadella pertussis)或結核分枝桿菌(Mycobacterium tuberculosis)源性蛋白。某些佐劑是市售的,例如弗氏不完全佐劑和弗氏完全佐劑(Dffco Laboratories,Detroit,MI);Merck佐劑65(Merck and Company,Inc.,Rahway,NJ);AS-2(SmithKlineBeecham,Philadelphia,PA);諸如氫氧化鋁凝膠(明礬)或磷酸鋁的鋁鹽;鈣鹽、鐵鹽或鋅鹽;酰化酪氨酸的不溶性懸浮劑;酰化糖;陽離子或陰離子衍生化的多糖;聚磷腈;生物可降解的微球體;單磷脂酰脂質A和quil A。諸如GM-CSF、白介素-2、白介素-7、白介素-12的細胞因子和其它類似的生長因子也可以用作佐劑。
在本發明的某些實施方案中,所述佐劑組合物最好是主要誘導Th1型免疫應答的佐劑組合物。高水平的Th1型細胞因子(例如IFN-γ、TNFα、IL-2和IL-12)往往促進誘導針對所給予抗原的細胞介導的免疫應答。相反,高水平的Th2型細胞因子(例如IL-4、IL-5、IL-6和IL-10)往往促進誘導體液免疫應答。應用本文提供的疫苗后,患者將支持包括Th1型和Th2型應答的免疫應答。在應答主要為Th1型的一個優選實施方案中,Th1型細胞因子的水平比Th2型細胞因子的水平增加的程度更大。采用標準測定可以容易地評價這些細胞因子的水平。有關細胞因子家族的綜述,請參見Mosmann和Coffman,Ann.Rev.Immunol.7145-173,1989。
供誘導主要為Th1型應答的某些優選佐劑包括例如單磷脂酰脂質A、最好是3-脫-O-酰化單磷脂酰脂質A與鋁鹽一起的組合。MPL佐劑可得自Corixa Corporation(Seattle,WA;參見,例如,美國專利號4,436,727、4,877,611、4,866,034和4,912,094)。含CpG的寡核苷酸(其中CpG二核苷酸未被甲基化)也誘導主要為Th1型的應答。這樣的寡核苷酸是眾所周知的,描述于例如WO 96/02555、WO99/33488和美國專利號6,008,200和5,856,642。免疫刺激DNA序列也描述于例如Sato等,Science 273352,1996。另一優選的佐劑包含諸如Quil A的皂苷或其衍生物,包括QS21和QS7(Aquila Biopharmaceuticals Inc.,Framingham,MA);七葉皂苷;毛地黃皂苷;或絲石竹屬(Gypsophila)或Chenopodium quinoa皂苷。在本發明的佐劑組合中,其它優選的制劑包括一種以上的皂苷,例如以下至少兩種的組合QS21、QS7、QuilA、β-七葉皂苷或毛地黃皂苷。
或者,可以將皂苷制劑與由脫乙酰殼多糖或其它聚陽離子聚合物、聚交酯和聚丙交酯-乙交酯共聚物顆粒、基于聚-N-乙酰葡糖胺的聚合物基質、由多糖或經化學修飾的多糖組成的顆粒、脂質體和基于脂質的顆粒、由甘油單酯組成的顆粒等組成的疫苗載體混合。皂苷也可以在膽固醇存在下進行配制,以形成顆粒性結構,例如脂質體或ISCOM。此外,皂苷可以與聚氧乙烯醚或酯一起在非顆粒性溶液或懸浮液或在諸如paucilamelar脂質體或ISCOM的顆粒性結構中進行配制。皂苷也可以與諸如CarbopolR的賦形劑一起配制,以增加粘度,或者可以以干粉形式與諸如乳糖的粉狀賦形劑一起配制。
在一個優選的實施方案中,所述佐劑系統包括單磷脂酰脂質A和皂苷衍生物的組合,例如在WO 94/00153中描述的QS21和3D-MPL佐劑的組合或者在WO 96/33739中描述的其中QS21用膽固醇猝滅的反應原性較低的組合物。其它優選的制劑包含水包油乳劑和生育酚。WO 95/17210中描述了使用QS21、3D-MPL佐劑和生育酚的水包油乳劑的另一特別優選的佐劑制劑。
另一增強的佐劑系統包括含CpG寡核苷酸和皂苷衍生物的組合、尤其是WO 00/09159中公開的CpG和QS21的組合。所述制劑最好另外包含水包油乳劑和生育酚。
可供用于本發明藥用組合物中的其它說明性佐劑包括MontanideISA 720(Seppic,法國)、SAF(Chiron,Califomia,美國)、ISCOMS(CSL)、MF-59(Chiron)、SBAS系列的佐劑(例如SBAS-2或SBAS-4,可得自SmithKline Beecham,Rixensart,比利時)、Detox(Enhanzyn)(Corixa,Hamilton,MT)、RC-529(Corixa,Hamilton,MT)和其它氨烷基氨基葡糖苷4-磷酸酯(AGP),例如待審的美國專利申請順序號08/853,826和09/074,720中描述的佐劑(所述專利申請的公開內容通過引用全部結合到本文中)以及聚氧乙烯醚佐劑,例如WO 99/52549A1中描述的佐劑。
其它優選的佐劑包括通式(I)的佐劑分子
HO(CH2CH2O)n-A-R
其中n為1-50,A為一個鍵或-C(O)-,R為C1-50烷基或苯基C1-50烷基。
本發明的一個實施方案包括含通式(I)的聚氧乙烯醚的疫苗制劑,其中n為1-50、優選為4-24、最優選為9;R組分為C1-50烷基、優選為C4-20烷基、最優選為C12烷基;A為一個鍵。聚氧乙烯醚的濃度范圍應該為0.1-20%、優選為0.1-10%、最優選為0.1-1%。優選的聚氧乙烯醚選自以下組聚氧乙烯9-十二烷基醚、聚氧乙烯-9-硬脂酰基醚、聚氧乙烯-8-硬脂酰基醚、聚氧乙烯-4-十二烷基醚、聚氧乙烯-35-十二烷基醚和聚氧乙烯-23-十二烷基醚。諸如聚氧乙烯十二烷基醚的聚氧乙烯醚在Merck index(第12版entry 7717)中有描述。這些佐劑分子在WO 99/52549中有描述。
如果需要,按照上述通式(I)的聚氧乙烯醚可以與另一佐劑組合。例如一種優選的佐劑組合最好是與待審的英國專利申請GB 9820956.2中描述的CpG組合。
按照本發明的疫苗組合物中最好還存在一種載體。所述載體可以是水包油乳劑,或者是一種鋁鹽,例如磷酸鋁或氫氧化鋁。
優選的水包油乳劑包含一種可代謝的油,例如角鯊烯、α-生育酚和吐溫80。在一個特別優選的方面,按照本發明疫苗組合物中的抗原與這種乳劑中的QS21和3D-MPL混合。另外,所述水包油乳劑可以含有span 85和/或卵磷脂和/或三辛酰甘油酯。
給予人時,通常疫苗中的QS21和3D-MPL含量范圍為每劑1μg-200μg、例如10μg-100μg、最好是10μg-50μg。而水包油乳劑通常包含2-10%角鯊烯、2-10%α-生育酚和0.3-3%吐溫80。角鯊烯α-生育酚的比例最好等于或小于1,因為這樣的比例提供更穩定的乳劑。Span 85的含量也可以為1%。在某些情況下,本發明的疫苗另外含有一種穩定劑可能是有利的。
無毒的水包油乳劑最好在含水載體中含有一種無毒的油例如角鯊烷或角鯊烯,以及一種乳化劑例如吐溫80。所述含水載體可以是例如磷酸緩沖鹽溶液。
WO 95/17210中描述了一種特別有效的佐劑制劑,該制劑為包含QS21、3D-MPL和生育酚的水包油乳劑。
本發明也提供多價疫苗組合物,所述多價疫苗組合物包含本發明疫苗制劑以及其它抗原,尤其是可用于治療癌癥、更特別是結腸直腸癌、自身免疫病和相關病癥的抗原。這樣的多價疫苗組合物可以包括如上文所述的TH-1誘導佐劑。
按照本發明的另一個實施方案,將本文所述的免疫原性組合物通過抗原呈遞細胞(APC)傳遞至宿主,所述抗原呈遞細胞(APC)例如樹突細胞、巨噬細胞、B細胞、單核細胞和其它可以被工程改造以成為有效的APC的細胞。這類細胞可以但不一定被遺傳修飾,以增加呈遞抗原的能力、改進T細胞應答的活化和/或保持、本身具有抗腫瘤效應和/或與受體在免疫學上是相容的(即匹配HLA單倍型)。APC一般可以從各種各樣的生物體液或器官(包括腫瘤和腫瘤周圍組織)的任一種中分離出來,或可以是自體細胞、同種異體細胞、同種同基因細胞或異種細胞。
本發明的某些優選的實施方案使用樹突細胞或其祖細胞作為抗原呈遞細胞。樹突細胞是非常有效的APC(Banchereau和Steinman,Nature392245-251,1998),并且已表明作為誘導預防性或治療性抗腫瘤免疫的生理佐劑是有效的(參見Timmerman和Levy,Ann.Rev.Med.50507-529,1999)。一般而言,樹突細胞可能根據其典型的形狀(原位為星狀,體外可見明顯的胞質突(樹突))、其攝入、突起和以高效率呈遞抗原的能力以及其活化原初T細胞應答的能力來鑒定。當然,可以對樹突細胞進行工程改造,以表達通常在體內或離體樹突細胞上不存在的特異性細胞表面受體或配體,本發明考慮了這類經修飾的樹突細胞。作為樹突細胞的替代物,在疫苗中可以使用加載分泌型小泡抗原的樹突細胞(稱為外來體)(參見Zitvogel等,Nature Med 4.594-600,1998)。
樹突細胞和祖細胞可以從外周血、骨髓、腫瘤浸潤細胞、腫瘤周圍組織浸潤細胞、淋巴結、脾、皮膚、臍帶血或任何其它合適的組織或體液獲得。例如,可以通過將細胞因子例如GM-CSF、IL-4、IL-13和/或TNFα的組合加到從外周血收獲的單核細胞培養物中,使樹突細胞離體分化。或者,可以通過將GM-CSF、IL-3、TNFα、CD40配體、LPS、flt3配體和/或其它誘導樹突細胞分化、成熟和增殖的化合物加入到所述培養基中,使從外周血、臍帶血或骨髓收獲的CD34陽性細胞分化成樹突細胞。
樹突細胞常規分為“未成熟”細胞和“成熟”細胞,可用簡單的方式將兩種充分表征的表型區分開來。然而,這種命名不應該解釋為排除所有可能的中間分化階段。未成熟樹突細胞的特征為與Fcγ受體和甘露糖受體高表達相關的抗原攝入和加工能力高的APC。成熟表型通常的特征在于這些標記的表達較低,但負責T細胞活化的細胞表面分子(例如I類MHC和II類MHC)、粘著分子(例如CD54和CD11)和共同刺激分子(例如CD40、CD80、CD86和4-1BB)的表達高。
一般可以用本發明的多核苷酸(或其部分或其它變異體)轉染APC,使得所編碼的多肽或其免疫原性部分在所述細胞表面表達。可以離體進行這樣的轉染,然后包含這樣的轉染細胞的藥用組合物可以用于本文所述的治療目的。或者,可以將靶向樹突細胞或其它抗原呈遞細胞的基因傳遞載體給予患者,導致在體內發生轉染。一般而言,采用本領域已知的任何方法,例如WO 97/24447中介紹的方法或Mahvi等,Immunology and cell Biology 75456-460,1997介紹的基因槍方法,可以進行例如樹突細胞的體內和離體轉染。通過將樹突細胞或祖細胞與腫瘤多肽、DNA(裸DNA或在質粒載體內的DNA)或RNA一起孵育;或者與表達抗原的重組細菌或病毒(例如痘苗病毒、禽痘病毒、腺病毒或慢病毒屬載體)一起孵育,可以達到樹突細胞的抗原加載。在加載前,可以將多肽與提供T細胞輔助的免疫配偶體(例如載體分子)共價綴合。或者,樹突細胞可以單獨地或在所述多肽存在下用未綴合的免疫配偶體脈沖處理。
在本發明藥用組合物中可以使用本領域技術人員已知的任何合適載體的情況下,載體類型通常隨給藥模式而變。本發明的組合物可以配制用于任何合適的給藥方式,包括例如局部、口服、鼻腔、粘膜、靜脈內、顱內、腹膜內、皮下和肌內給藥。
供這類藥用組合物使用的載體是生物相容的,并且也可是生物可降解的。在某些實施方案中,所述制劑最好提供以相對恒定水平釋放有效成分。然而,在其它實施方案中,可能需要在給藥后以更加快的速率立即釋放有效成分。采用已知技術配制這類組合物是在本領域技術人員的知識范圍內。可用于該方面的說明性載體包括聚丙交酯-乙交酯共聚物、聚丙烯酸酯、膠乳、淀粉、纖維素、葡聚糖的微粒等。其它說明性延遲釋放的載體包括超分子生物載體,它包含不流動的親水核心(例如交聯多糖或寡糖)以及任選的包含兩親化合物的外層(例如磷脂)(參見例如,美國專利第5,151,254號和PCT申請WO 94/20078、WO 94/23701和WO 96/06638)。在緩釋制劑中所含的活性化合物的量取決于植入部位、釋放的速率和預期持續時間以及待治療或預防的病癥性質。
在另一個說明性實施方案中,生物可降解的微球體(例如聚乳酸酯聚乙醇酸酯)用作本發明組合物的載體。合適的生物可降解的微球體公開于例如美國專利號4,897,268;5,075,109;5,928,647;5,811,128;5,820,883;5,853,763;5,814,344,5,407,609和5,942,252。經修飾的乙型肝炎核心蛋白載體系統,例如WO/99 40934和其中引用的參考文獻中描述的載體系統,也可用于許多應用中。另一說明性載體/傳遞系統使用包含顆粒性蛋白復合物的載體,例如在美國專利第5,928,647號中描述的載體,所述載體能夠在宿主體內誘導I類限制的細胞毒性T淋巴細胞應答。
本發明的藥用組合物通常還包含一種或多種緩沖劑(例如中性緩沖鹽溶液或磷酸緩沖鹽溶液)、糖類(例如葡萄糖、甘露糖、蔗糖或葡聚糖)、甘露醇、蛋白質、多肽或氨基酸(例如甘氨酸)、抗氧化劑、抑菌劑、螯合劑(例如EDTA)或谷胱甘肽、佐劑(例如氫氧化鋁)、使制劑與受體的血液等滲、低滲或弱高滲的溶質、懸浮劑、增稠劑和/或防腐劑。或者,本發明組合物可以配制為凍干制劑。
本文所述的藥用組合物可以盛裝在單位劑量容器或多劑量容器(例如密封安瓿或管形瓶)中。這類容器通常的密封方式使得保持所述制劑在使用之前的無菌和穩定性。一般而言,制劑可以作為油性或水性溶媒中的混懸劑、溶液劑或乳劑保存。或者,藥用組合物可以在冷凍-干燥條件下保存,只需要在臨用前加入無菌液體載體即可。
對于在各種各樣的治療方案中使用本文所述的特定組合物而言,合適給藥方案和治療方案(包括例如口服、胃腸外、靜脈內、鼻內和肌內給藥和所用制劑)的開發是本領域眾所周知的,為了說明,下文將扼要地論述其中的某些方案。
在某些應用中,可以將本文公開的藥用組合物通過口服給藥傳遞至動物。因此,這些組合物可以與惰性稀釋劑或與可吸收的食用載體一起配制,或者它們可以包封在硬殼明膠膠囊或軟殼明膠膠囊內,或者它們可以擠壓成片劑,或者它們可以直接摻入到膳食的食物中。
所述活性化合物甚至可能與賦形劑一起摻入,以可食用的片劑、口含片、錠劑、膠囊劑、酏劑、混懸劑、糖漿、糯米紙囊劑形式等使用(參見,例如,Mathiowitz等,Nature 1997年3月27日;386(6623)410-4;Hwang等,Crit Rev Tjer Drug Carrier Syst 1998;15(3)243-84;美國專利5,641,515;美國專利5,580,579和美國專利5,792,451)。片劑、錠劑、丸劑、膠囊劑等也可以含有許多額外組分中的任一種,可以加入例如粘合劑,例如西黃蓍膠、阿拉伯樹膠、玉米淀粉或明膠;賦形劑,例如磷酸二鈣;崩解劑,例如玉米淀粉、馬鈴薯淀粉、藻酸等;潤滑劑,例如硬脂酸鎂;和甜味劑,例如蔗糖、乳糖或糖精或者矯味劑,例如薄荷、冬青油或櫻挑矯味劑。當劑量單位形式為膠囊時,除上述類型物質以外它還可以含有液體載體。各種其它物質可能作為包衣劑存在,或者在其它方面改進劑量單位的物理形式。例如,片劑、丸劑或膠囊劑可以用蟲膠、糖或者同時用蟲膠和糖包衣。當然,在制備任何劑量單位形式中所用的任何材料都應該是藥學純的并且在所使用的量內基本上是無毒的。另外,所述活性化合物可以摻入到緩釋制劑中。
通常,這些制劑含有至少約0.1%活性化合物或更高劑量的活性化合物,當然盡管有效成分的百分率可以變化,但是可能常規為總制劑重量或體織的約1%或2%至約60%或70%或更高。當然,在可能制備的每種治療上有效的組合物中活性化合物的用量的方式使得以所述化合物的任何給定單位劑量獲得合適的劑量。在制備這種藥用制劑時,本領域技術人員會考慮諸如溶解性、生物利用度、生物半壽期、給藥途徑、制品貯藏期的諸多因素以及其它藥理學考慮,因此各種各樣的劑量和治療方案可能都是理想的。
另一方面,對于口服給藥,本發明的組合物可以在漱口藥、潔牙劑、口含片、口腔噴霧劑或舌下口服給藥制劑形式中摻入一種或多種賦形劑。或者,可以將所述有效成分摻入到口服溶液例如含有硼酸鈉、甘油和碳酸氫鈉的口服溶液中,或者在潔牙劑中分散,或以治療有效量加入到可能包括水、粘合劑、磨擦劑、矯味劑、起泡劑和潤濕劑的組合物中。或者,所述組合物可以精加工成可以放入舌下或者在口腔內溶解的片劑或溶液形式。
在某些情況下,理想的是胃腸外、靜脈內、肌內、或者甚至腹膜內給予本文公開的藥用組合物。這樣的方法是本領域技術人員熟知的,其中某些方法進一步描述于例如美國專利5,543,158;美國專利5,641,515和美國專利5,399,363。在某些實施方案中,在水中適當與表面活性劑(例如羥丙基纖維素)混合,可以制備所述活性化合物作為游離堿或藥理學上可接受的鹽的溶液。在甘油、液體聚乙二醇及其混合物和在油中也可以制備分散劑。在通常的貯藏和使用條件下,這些制劑一般含有防腐劑,以防止微生物的生長。
適合于注射用的說明性藥物形成包括無菌的水溶液或分散劑和用于臨時制備無菌的注射液或分散液的無菌粉末(例如,參見美國專利5,466,468)。在所有情況下,,所述形式必須是無菌的且在易于注射方面必須是液體。在生產和貯藏的條件下它必須是穩定的且必須防止微生物(例如細菌和真菌)的污染作用。所述載體可以是溶劑或含有例如水、乙醇、多元醇(例如甘油、丙二醇和液體聚乙二醇等)、它們的適宜混合物和/或植物油的分散介質。例如通過利用諸如卵磷脂的包衣劑,在分散的情況下通過保持所需顆粒大小和/或利用表面活性劑,可以保持適當的流動性。可以利用各種抗細菌劑或抗真菌藥(例如,對羥基苯甲酸酯類、三氯叔丁醇、苯酚、山梨酸、硫柳汞等)防止微生物的作用。在許多情況下,最好包括等滲劑,例如糖或氯化鈉。注射組合物的延長吸收可以通過在組合物中使用延遲吸收的藥劑,例如單硬脂酸鋁和明膠來實現。
在一個實施方案中,對于胃腸外給予水溶液,必要時所述溶液應該進行適當緩沖,所述液體稀釋劑首先用足量的鹽水或葡萄糖使其等滲。這些特定的水溶性尤其適合于靜脈內、肌內、皮下和腹膜內給藥。在這一方面,根據本發明的公開內容,可以使用的無菌水性介質對于本領域技術人員是已知的。例如,可以將一個劑量溶于1ml等滲氯化鈉溶液中,然后或者加入到1000ml皮下灌注用液體或者在建議的輸注部位注射(參見例如,“Remington’s Pharmaceutical Sciences”,第15版,第1035-1038頁和第1570-1580頁)。根據待治療的受治療者的病癥,劑量的某些變化是必需的。此外,對于人類給藥,當然制劑最好符合無菌、無熱原并且依照FDA Office of Biologics標準所要求的一般性安全和純度標準。
在本發明的另一個實施方案中,本文公開的組合物可以配制成中性形式或鹽形式。說明性的藥學上可接受的鹽包括酸加成鹽(與蛋白質的游離氨基生成的),并且與諸如鹽酸或磷酸的無機酸或者與諸如乙酸、草酸、酒石酸、扁桃酸等的有機酸生成的酸加成鹽。與游離羧基形成的鹽也可衍生自無機堿,例如氫氧化鈉、氫氧化鉀、氫氧化銨、氫氧化鈣或氫氧化鐵;和有機堿,例如異丙胺、三乙胺、組氨酸、普魯卡因等。在配制時,溶液給予的方式需與給藥制劑相容,而給予的劑量為治療有效量。
所述載體還可以包含任何和所有的溶劑、分散介質、溶媒、包衣劑、稀釋劑、抗細菌劑和抗真菌藥、等滲劑和吸收延遲劑、緩沖劑、載體溶液、混懸劑、膠體等。供藥用活性物質使用的這類介質和藥劑是本領域眾所周知的。除在任何常規介質和藥劑與有效成分不相容的情況外,考慮其在治療組合物中的應用。也可以將補充的有效成分摻入到所述組合物中。短語“藥學上可接受的”是指當給予人類時不產生變態反應或相似的不想要的反應的分子實體和組合物。
在某些實施方案中,所述藥用組合物可以通過鼻內噴霧、吸入和/或其它氣霧劑傳遞載體來傳遞。將基因、核酸和肽組合物通過鼻氣霧劑噴霧直接給予肺部的方法描述于例如美國專利5,756,353和美國專利5,804,212。同樣,采用鼻內微粒樹脂(Takenaga等,J Controlled Release1998年3月2日;52(1-2)81-7)和溶血磷脂酰甘油化合物(美國專利5,725,871)給藥也是制藥領域眾所周知的。同樣,聚四氟乙烯支持體骨架形式的說明性的經粘膜給藥在美國專利5,780,045中有描述。
在某些實施方案,使用脂質體、納米囊、微粒、脂質顆粒、小泡等將本發明的組合物引入合適的宿主細胞/生物中。具體地說,本發明的組合物可以配制成用于在脂質顆粒、脂質體、小泡、納米球或納米粒子等中包囊傳遞。或者,本發明的組合物可以與這樣的載體表面或者共價結合或者非共價結合。
脂質體和脂質體樣制劑作為潛在藥物載體的制備和應用對于本領域技術人員一般是已知的(參見例如,Lasic,Trends Biotechnol 1998年7月;16(7)307-21;Takakura,Nippon Rinsho 1998年3月;56(3)691-5;Chandran等,Indian J Exp Biol.1997年8月;35(8)801-9;Margalit,CritRev Ther Drug Carrier Syst.1995;12(2-3)233-61;美國專利5,567,434;美國專利5,552,157;美國專利5,565,213;美國專利5,738,868和美國專利5,795,587;每個文獻具體地通過引用全部結合到本文中)。
脂質體已成功地與許多通常難以通過其它方法轉染的細胞類型一起使用,包括T細胞混懸劑、原代肝細胞培養物和PC 12細胞(Renneisen等,J Biol Chem.1990年9月25日;265(27).16337-42;Muller等,DNA Cell Biol.1990年4月;9(3)221-9)。另外,脂質體沒有基于病毒給藥系統中通常的DNA長度限制。脂質體已有效地用來將基因、各種藥物、放射治療藥、酶、病毒、轉錄因子、別構效應劑等導入各種各樣的培養細胞系和動物中。此外,看來脂質體的應用與系統給藥后自身免疫性應答或不可接受的毒性無關。
在某些實施方案中,脂質體由在水性介質中分散的磷脂形成并且自動形成多層同心雙層小泡(也稱為多層脂質體(MLV))。
另一方面,在其它實施方案中,本發明提供本發明組合物的藥學上可接受的納米囊制劑。納米囊一般可以以穩定和可重現的方式包封化合物(參見,例如,Quintanar-Guerrero等,Drug Dev Ind Pharm.1998年12月;24(12)1113-28)。為了避免由于胞內聚合物負荷過多引起的副作用,這樣的超微顆粒(大小約0.1μm)可以采用能夠體內降解的聚合物來設計。這樣的顆粒可以按下述文獻所述進行制備例如Couvreur等,Crit Rev Ther Drug Carrier Syst.1988;5(1)1-20;zur Muhlen等,Eur JPharm Biopharm.1998年3月;45(2)149-55;Zambaux等,J ControlledRelease.1998年1月2日;50(1-3)31-40;和美國專利5,145,684。
本發明也涉及得自本發明多核苷酸的引物形式的多核苷酸和特異性針對本發明多肽的抗體或試劑形式的多肽作為診斷試劑的用途。
鑒定能夠檢測出癌發生途徑中極早期變化的血液或組織中遺傳標記或生化標記,將有助于確定用于患者的最佳療法。可以使用諸如多核苷酸表達的替代腫瘤標記,診斷不同形式和病期的癌癥。對本發明多核苷酸表達水平的鑒定既可用于癌性疾病的病期分類,又可用于癌性組織的性質分級。病期分類方法監測癌癥的進展,并且根據在活組織檢查區內是否存在惡性腫瘤組織來確定。本發明的多核苷酸可以有助于通過鑒定癌癥攻擊力的標記、例如在機體不同部位中的存在來完善所述病期分類方法。癌癥的分級描述腫瘤與其相同類型的正常組織多么密切相似,并且通過其細胞形態和其它分化標記進行評價。本發明的多核苷酸可用于確定腫瘤級別,因為它們可能有助于確定腫瘤細胞的分化狀態。
通過包括確定得自受治療者樣品中多肽或mRNA水平的異常減少或增加在內的方法進行診斷,所述診斷分析提供一種用于診斷癌癥、自身免疫病和相關病癥或確定對所述病癥的易感性的方法。該診斷方法稱為差異表達。比較患病組織和正常組織中特定基因的表達。所比較的這兩種組織中所述多核苷酸相關基因、mRNA或蛋白之間的差異,例如在分子量、氨基酸序列或核苷酸序列或相對豐度方面的差異,表明在懷疑患病的人的組織中所述基因或調節它的基因的變化。
可以在RNA水平上測定表達的減少或增加。首先從這兩種組織中分離出PolyA RNA,然后由對應于差異表達的本發明多核苷酸的基因編碼的mRNA的檢測可以通過以下方法進行檢測例如組織切片的原位雜交、反轉錄酶-PCR、使用含PolyA+mRNA的RNA印跡或任何其它直接或間接RNA檢測方法。與正常組織相比給定RNA在患病組織中表達的增加或減少,提示所述轉錄物和/或所表達的蛋白在所述疾病中起作用。因此,檢測出相對應于SEQ ID NO1的mRNA水平比正常水平高或低,表明所述患者患有癌癥。
樣品中的mRNA表達水平可以通過從所述樣品產生已表達序列標志(EST)的文庫來確定。可以用EST在所述文庫中的相對表現度,評價所述基因轉錄物在原始樣品中的相對表現度。然后可以將所述測試的EST分析與參比樣品的EST分析進行比較,從而測定感興趣的多核苷酸的相對表達水平。
可以采用基因表達的連續分析(SAGE)方法(Velculescu等,Science(1995)270484)、差異展示法(例如,US 5,776,683)或依賴于核苷酸相互作用專一性的雜交分析,進行其它mRNA分析。
另一方面,可以在蛋白質水平上進行比較。使用抗體檢測來自所述兩種組織中的蛋白提取物的蛋白質印跡中的多肽,可以對兩種組織中的蛋白質大小進行比較。使用抗相應蛋白的抗體,還可以在免疫學上檢測表達水平和亞細胞定位。可以用來測定得自宿主的樣品中的蛋白質水平(例如本發明的多肽水平)的其它分析技術,對于本領域技術人員而言是熟知的。在患病組織中多肽表達水平與正常組織中相同蛋白表達水平相比升高或降低,表明所表達的蛋白可能與所述疾病有關。
在本發明的測定中,通過檢測由SEQ ID NO1中所示的至少一種序列編碼的基因產物的表達水平,可以確定所述診斷。也可以用患病組織與正常組織中的mRNA水平或蛋白質水平的比較,來跟蹤疾病的發展或緩解。
采用多核苷酸陣列,可以分析樣品中的許多多核苷酸序列。這些多核苷酸可以用來檢測基因的差異表達,從而確定基因的功能。例如,可以用多核苷酸序列SEQ ID NO1的陣列來確定所述多核苷酸的任一種是否在正常細胞和癌癥細胞間有差異表達。在本發明的一個實施方案中,可以構建一個包含SEQ ID NO1核苷酸序列或其片段的寡核苷酸探針的陣列,以進行例如遺傳突變的有效篩選。陣列技術方法是眾所周知的并且具有普遍的可應用性,可以用來解決分子遺傳學方面的各種各樣的問題,包括基因表達、遺傳連鎖和遺傳變異性(參見例如M.Chee等,Science,第274卷,第610-613頁(1996))。
本文所用的“診斷”包括確定受治療者對疾病的易感性、確定受治療者目前是否患有所述疾病,還可以對受所述疾病影響的受治療者作預后。
本發明還涉及用于進行診斷分析的診斷試劑盒,所述試劑盒包括
(a)一種本發明的多核苷酸或其片段,所述多核苷酸最好是SEQID NO1的核苷酸序列;
(b)一種與(a)的核苷酸序列互補的核苷酸序列,最好是SEQ IDNO6的核苷酸序列;
(c)一種本發明的多肽或其片段,所述多肽最好是SEQ ID NO2或SEQ ID NO3的多肽;或
(d)一種抗本發明多肽的抗體,最好是抗SEQ ID NO2或SEQ IDNO3多肽的抗體。
對于染色體定位而言,本發明的核苷酸序列也是有價值的。所述序列特異性地靶向人單個染色體上的特定位置,并且可以與其雜交。按照本發明將有關序列作圖至染色體上,在使那些序列與基因相關疾病發生聯系中是重要的第一步。一旦將序列作圖至染色體上的精確位置,就可以使所述序列在所述染色體上的物理位置與基因圖譜數據相聯系。這樣的數據可以在例如V.McKusick,Mendelian Inheritance inMan(可通過Johns Hopkins University Welch Medical Library在線得到)中找到。然后通過連鎖分析(物理上相鄰的基因的共遺傳)鑒定已作圖至同一染色體區的基因和疾病之間的關系。也可以確定受影響個體和未受影響個體之間的cDNA序列或基因組序列中的差別。
本發明的多肽或其片段或其類似物、或表達它們的細胞還可以用作免疫原,以產生抗本發明多肽的免疫專一性抗體。術語“免疫專一性”是指所述抗體對本發明多肽的親和性比它們對現有技術中其它相關多肽的親和性高得多。
再一方面,本發明提供如上文所限定的按照本發明多肽的免疫專一性抗體或其免疫學片段。所述抗體最好是單克隆抗體。
采用常規方法,通過將所述多肽或攜帶表位的片段、類似物或細胞給予動物、最好是非人類動物,可以獲得針對本發明多肽產生的抗體。為了制備單克隆抗體,可以使用提供由連續細胞系培養物生產的抗體的任何技術。實例包括雜交瘤技術(Kohler,G.和Milstein,C.,Nature(1975)256495-497)、trioma技術-人B細胞雜交瘤技術(Kozbor等,Immunology Today(1983)472)和EBV雜交瘤技術(Cole等,MonoclonalAntibodies and Cancer Therapy,77-96,Alan R.Liss,Inc.,1985)。
產生單鏈抗體的技術,例如在美國專利第4,946,778號中描述的技術,可能也適用于產生抗本發明多肽的單鏈抗體。另外,可以用轉基因小鼠或其它生物(包括其它哺乳動物)表達人源化抗體。
可以使用上述抗體分離或鑒定表達所述多肽的克隆、或者通過親和層析純化所述多肽。也可以使用本發明的抗體預防或治療癌癥、尤其是結腸直腸癌、自身免疫病和相關病癥。
本發明的另一方面涉及誘導或調節哺乳動物體內免疫應答的方法,所述方法包括用足以產生抗體和/或T細胞免疫應答的本發明多肽接種所述哺乳動物,以保護或改善所述疾病的癥狀或進程。本發明的再一方面涉及誘導或調節哺乳動物體內免疫應答的方法,所述方法包括通過在體內指導表達所述多核苷酸并編碼所述多肽的載體傳遞本發明的多肽,以便誘導產生抗體的這種免疫應答,從而保護所述動物免患疾病。
因此人們會認識到,本發明提供治療與CASB7439多肽活性的存在、過量表達或表達不足有關的異常病癥例如癌癥和自身免疫病、尤其是結腸直腸癌的方法。本發明試圖治療的其它與CASB7439表達有關的異常病癥是慢性淋巴細胞白血病和生殖細胞腫瘤。
本發明還提供篩選化合物以鑒定刺激或抑制CASB7439多肽功能的那些化合物的方法。一般而言,對于上文所提到的這類疾病,為了治療和預防目的可以使用激動劑或拮抗劑。可以從各種來源例如細胞、無細胞制備物、化學文庫以及天然產物的混合物來鑒定化合物。根據具體情況,如此鑒定的這類激動劑、拮抗劑或抑制劑可以是所述多肽的天然或經修飾的底物、配體、受體、酶等,或者也可以是它們的結構模擬物或功能模擬物(參見Coligan等,Current Protocols inImmunology 1(2)第5章(1991))。篩選方法是本領域技術人員已知的。其它篩選方法還可以在例如D.Bennett等,J Mol Recognition,852-58(1995);和K.Johanson等,J Mol Biol,270(16)9459-9471(1995)以及其中的參考文獻中找到。
因此,本發明提供鑒定刺激或抑制本發明多肽功能的化合物的篩選方法,所述方法包括一種選自以下的方法
(a)利用直接或間接結合候選化合物的標記,測定所述候選化合物與所述多肽(或與攜帶所述多肽的細胞或細胞膜)或與其融合蛋白的結合;
(b)在標記競爭物的存在下,測定候選化合物與所述多肽(或與攜帶所述多肽的細胞或細胞膜)或與其融合蛋白的結合;
(c)使用適合于攜帶所述多肽的細胞或細胞膜的檢測系統,測試所述候選化合物是否引起由于所述多肽的活化或抑制而產生的信號;
(d)將候選化合物與含權利要求1多肽的溶液混合,形成混合物,然后測定所述混合物中所述多肽的活性,并且將所述混合物的活性與標準品的活性進行比較;或
(e)采用例如ELISA測定,檢測候選化合物對在細胞中編碼所述多肽的mRNA和所述多肽的產生的影響。
通過本領域已知的標準受體結合技術,本發明的多肽還可用來鑒定膜結合受體或可溶性受體(如果有的話)。還可以用眾所周知的篩選方法鑒定與本發明多肽競爭與其受體結合的本發明多肽的激動劑和拮抗劑(如果有的話)。
因此,另一方面,本發明涉及用于鑒定本發明多肽的激動劑、拮抗劑、配體、受體、底物、酶等;或者減少或增加這類多肽產生的化合物的篩選試劑盒,所述試劑盒包含
(a)一種本發明的多肽;
(b)一種表達本發明多肽的重組細胞;
(c)一種表達本發明多肽的細胞膜;或
(d)抗本發明多肽的抗體;
所述多肽最好是SEQ ID NO2或SEQ ID NO3的多肽。
本領域技術人員會容易地認識到,本發明的多肽還可以用于基于結構設計所述多肽的激動劑、拮抗劑或抑制劑的方法中,使用方法包括
(a)首先確定所述多肽的三維結構;
(b)推導激動劑、拮抗劑或抑制劑可能的活性部位或結合部位的三維結構;
(c)合成預測與推導的結合部位或活性部位結合或反應的候選化合物;和
(d)測試所述候選化合物是否是真正的激動劑、拮抗劑或抑制劑。
還可以使用基因治療實現由受治療者體內的有關細胞內源性產生CASB7439多肽。有關基因治療的綜述,參見Human Molecular Genetics,第20章,基因治療和其它基于分子遺傳學的治療方法(Gene Therapyand other Molecular Genetic-based Therapeutic Approaches),T Strachan和A P Read,BIOS Scientific Publishers Ltd(1996)(和其中引用的參考文獻)。
在Pharmaceutical Biotechnology,第61卷,疫苗設計一亞單位和佐劑方法(Vaccine Design-the subunit and adjuvant approach),Powell和Newman編著,Plenurn Press,1995。New Trends and Developments inVaccines,Voller等編著,University Park Press,Baltimore,Maryand,U.S.A.1978中全面描述了疫苗制劑。用脂質體包封描述于例如Fullerton的美國專利4,235,877。蛋白質與大分子綴合公開于例如Likhite的美國專利4,372,945和Armor等的美國專利4,474,757。
每種疫苗劑量中的蛋白質量選定為在典型的疫苗中誘導免疫保護性應答而無明顯毒副作用的量。這樣的量隨所使用的特定免疫原而變化。一般而言,預期每個劑量包含1-1000μg蛋白、優選2-100μg蛋白、最優選4-40μg蛋白。通過包括觀察受治療者體內抗體效價和其它反應的標準研究,可以確定特定疫苗的最佳量。初次疫苗接種后,受治療者還可以在大約4周內接受一次加強接種。
“分離的”是指從天然狀態“人為”改變的。如果一種“分離的”組合物或物質在自然界中存在,那么它的原始環境已改變或從其原始環境中取出、或兩者兼而有之。作為本文使用的此術語,例如在活的動物中天然存在的多核苷酸或多肽并不是“分離的”,但與其天然狀態共存的物質分開的所述相同多核苷酸或多肽是“分離的”。
“多核苷酸”一般是指任何多核糖核苷酸或多脫氧核糖核苷酸,它們可以是包括單鏈區和雙鏈區的未修飾的RNA或DNA或者經修飾的RNA或DNA。
“變異體”是指與參比多核苷酸或多肽不同的但保留基本特性的多核苷酸或多肽。典型多核苷酸變異體在核苷酸序列上與另一參比多核苷酸不同。所述變異體核苷酸序列的變化可能改變或不改變參比多核苷酸編碼的多肽的氨基酸序列。如下文所論述,核苷酸的改變可能導致參比序列編碼的多肽的氨酸取代、添加、缺失、融合和截短。典型的多肽變異體在氨基酸序列上與另一參比多肽不同。一般而言,差異是有限的,致使參比多肽和變異體的序列在總體上非常相似并在許多區是相同的。變異體和參比多肽可能由于任何組合的一個或多個取代、添加、缺失而氨基酸序列不同。取代或插入的氨基酸殘基可以是或不是由遺傳密碼編碼的氨基酸殘基。多核苷酸或多肽的變異體可以是天然存在的變異體如等位基因變異體,或者所述變異體可以是已知非天然存在的變異體。可以通過誘變技術或通過直接合成,制備多核苷酸和多肽的非天然存在的變異體。
“同一性”正如本領域所知的,是指通過比較序列而確定的兩種或兩種以上多肽序列、或兩種或兩種以上多核苷酸序列之間的關系。在本領域中,根據具體情況,“同一性”也指根據多肽或多核苷酸序列的字符串之間的匹配而確定的多肽或多核苷酸序列之間的序列相關性程度。采用已知方法可以容易地計算出“同一性”和“相似性”,所述方法包括但不限于以下文獻中描述的方法Computational MolecularBiology,Lesk,A.M.編著,Oxford University Press,New York,1988;BiocomputingInformatics and Genome Projects,Smith,D.W.編著,Academic Press,New York,1993;Computer Analysis of Sequence Data,第I部分,Griffin,A.M.和Griffin,H.G.編著,Humana Press,New Jersey,1994;Sequence Analysis in Molecular Biology,von Heinje,G.,AcademicPress,1987;和Sequence Analysis Primer,Gribskov,M.和Devereux,J.編著,M Stockton Press,New York,1991;和Carillo,H.和Lipman,D.,SIAM J.Applied Math.,481073(1988)。設計測定同一性的優選方法用以給出所測試序列之間的最大匹配。測定同一性和相似性的方法已編纂成公眾可得到的計算機程序。用于測定兩個序列之間的同一性和相似性的優選計算機程序方法包括但不限于GCG程序包(Devereux,J.等,Nucleic Acids Research 12(1)387(1984))、BLASTP、BLASTN和FASTA(Atschul,S.F.等,J.Molec.Biol.215403-410(1990))。公眾可從NCBI和其它來源得到BLAST X程序(BLAST Manual,Altschul,S.等,NCBINLM NIH Bethesda,MD 20894;Atschul,S.等,J.Mol.Biol.215403-410(1990))。也可以使用眾所周知的Smith Waterman算法測定同一性。
所用的優選算法是FASTA。運用該算法進行多肽或多核苷酸序列比較的優選參數包括以下參數
Gap Penalty(空位罰分)12
Gap extension penalty(空位拓展罰分)4
Word size(字串大小)2,最大為6
用其它方法比較多肽序列的優選參數包括以下參數
1)算法Needleman和Wunsch,J.Mol Biol.48443-453(1970)
Comparison matrix(比較矩陣)Hentikoff和Hentikoff的BLOSSUM62,Proc.Natl.Acad.Sci.USA.8910915-10919(1992)
Gap Penalty12
Gap Length penalty(空位長度罰分)4
可使用這些參數的程序為“gap”程序,公眾可從Genetics ComputerGroup,Madison WI獲得。上面所提到的參數是進行多肽比較的缺省參數(同時對末端空位沒有罰分)。
用于多核苷酸比較的優選參數包括以下參數
1)算法Needleman和Wunsch,J.Mol Biol.48443-453(1970)Comparison matrixmatches(匹配)=+10,mismatch(錯配)=0Gap Penalty50
Gap Length penalty3
可使用這些參數的程序為“gap”程序,公眾可從Genetics ComputerGroup,Madison WI獲得。上面所提到的參數是進行多核苷酸比較的缺省參數。
作為實例,本發明的多核苷酸序列可與SEQ ID NO1的參比序列相同,也就是100%相同,或者它可以包括與所述參比序列相比,多至某一整數的核苷酸改變。這樣的改變選自至少一個核苷酸缺失、取代(包括堿基轉換和堿基顛換)或插入,并且其中所述改變可以發生在所述對比核苷酸序列的5’或3’末端位置或這兩個末端位置間的任何地方,或者各自單獨散置于參比序列的核苷酸中,或者散置于參比序列的一個或多個連續組中。核苷酸改變的數目如下確定SEQ ID NO1核苷酸總數乘以相應的同一性百分率的數值百分率(除以100),隨后從所述SEQ ID NO1核苷酸總數減去該乘積,或
nn≤xn-(xn·y),
其中nn是核苷酸改變的數目,xn是SEQ ID NO1核苷酸總數,y例如是0.70(70%)、0.80(80%)、0.85(85%)、0.90(90%)、0.95(95%)等,并且其中將xn和y的任何非整數乘積從xn減去之前,將該乘積舍入到最近的整數。編碼SEQ ID NO2多肽的多核苷酸序列的改變可能在該編碼序列中產生無義、錯義或移碼突變,從而在這樣的改變后改變由所述多核苷酸編碼的多肽。
同樣,本發明的多肽序列可與SEQ ID NO2的參比序列相同,也就是100%相同,或者它可以包括與所述參比序列相比,多至某一整數的氨基酸改變,以致同一性百分率小于100%。這樣的改變選自至少一個氨基酸缺失、取代(包括保守取代和非保守取代)或插入,并且其中所述改變可以發生在所述參比多肽序列的氨基末端或羧基末端位置或這兩個末端位置間的任何地方,或者各自單獨散置于參比序列的氨基酸中,或者散置于參比序列的一個或多個連續組中。對于特定的同一性百分率如下確定所述氨基酸改變的數目SEQ ID NO2氨基酸總數乘以相應的同一性百分率的數值百分率(除以100),隨后從所述SEQ IDNO2氨基酸總數減去該乘積,或
na≤xa-(xa·y),
其中na是氨基酸改變的數目,xa是SEQ ID NO2氨基酸總數,y例如是0.70(70%)、0.80(80%)、0.85(85%)等,并且其中將xa和y的任何非整數乘積從xa減去之前,將該乘積舍入到最近的整數。
“同系物”是本領域所用的一個類別的術語,是指具有與主題序列高度序列相關性的多核苷酸序列或多肽序列。這樣的相關性可以通過確定如上所述的所比較序列之間的同一性程度和/或相似性程度而定量。屬于該類別術語范圍內的是術語“直向同源物”和共生同源物”,“直向同源物”是指作為一種多核苷酸或多肽在另一物種中的功能等同物的多核苷酸或多肽,而“共生同源物”是指在同一物種內被認為功能上相似的序列。
圖1顯示采用Taqman探針的實時PCR數據。所述說明如下腎上腺Ad_Gl;膀胱Bl;骨髓Bo_Ma;宮頸Ce;結腸Co;輸卵管Fa_Tu;回腸Il;肝Li;肺Lu;淋巴結Ly_No;食管Oe;甲狀旁腺Pa_Thy;胎盤Pl;前列腺Pr;直腸Re;皮膚Sk;骨骼肌Sk_Mu;小腸Sm_In;脾Sp;睪丸Te;甲狀腺Thy;氣管Tr。
圖2顯示采用Sybr方案的實時PCR表達。所述說明如下腎上腺Ad_Gl;膀胱Bl;骨髓Bo_Ma;宮頸Ce;結腸Co;淋巴結Ly_No;食管Oe;甲狀旁腺Pa_Thy;胎盤Pl;前列腺Pr;直腸Re;皮膚Sk;骨骼肌Sk_Mu;小腸Sm_In;脾Sp;睪丸Te;甲狀腺Thy;氣管Yr;心臟He。
圖3顯示得自表達CASB7439的菌株的細胞提取物的孝馬斯藍染色的SDS PAGE。泳道1顯示分子量標準參照物,泳道2顯示于39℃誘導5小時的細胞提取物;泳道3顯示所誘導的細胞提取物的上清液;泳道4顯示所誘導的細胞提取物的沉淀。
圖4顯示NS1-CASB7439表達蛋白的蛋白質印跡分析。將表達CASB7439的菌株的細胞提取物加樣至該凝膠,并且用抗NS1單克隆抗體揭示。
圖5顯示CASB7439在純化后的考馬斯藍染色的SDS-PAGE。泳道1和泳道5代表分子量標準參照物;泳道2、3、4分別加入2μl、4μl和6μl純化蛋白。
圖6顯示根據抗多聚組氨酸單克隆抗體揭示的CASB7439在純化后的蛋白質印跡。
實施例
實施例1
實時RT-PCR分析
使用實時RT-PCR(U.Gibson.1996.Genome Research6,996)比較來自多個患者的配對的腫瘤結腸組織和正常結腸組織中候選抗原的mRNA轉錄物的豐度。另外,通過該方法評價一組正常組織中所述候選基因的mRNA水平。
使用TriPure試劑(Boehringer),從速凍活檢組織中提取正常結腸和腫瘤結腸的總RNA。正常組織的總RNA購自InVitrogen或者使用TriPure試劑從速凍活檢組織中提取。使用寡脫氧胸苷酸磁珠(Dynal),從經DNA酶處理后的總RNA中純化Poly-A+mRNA。使用SybrII染料(Molecular Probes),通過分光熒光測定法(VersaFluor,BioRad)進行mRNA的定量。采用TaqMan擴增條件的缺省選項,用Perkin-ElmerPrimer Express軟件設計用于實時PCR擴增的引物。
每次反應使用2ng純化mRNA,按照標準PCR方法進行實時反應。為了實時檢測,以終稀釋度1/75000加入SybrI染料(MolecularProbes)。采用常規儀器設定值,在Perkin-Elmer Biosystems PE7700系統中進行擴增(40個循環)和實時檢測。使用PE7700Sequence Detector軟件計算Ct值。對于每個樣品得到若干個Ct值對于患者樣品,候選TAA上的腫瘤Ct(CtT)值和配對的正常結腸Ct(CtN)值,而對于該組正常組織樣品,每個正常組織XY的CtXY。對于所有樣品也計算肌動蛋白基因的另一Ct(CtA),作為所有樣品的內部參照物。另一方面,可以采用Taqman探針監測實時PCR擴增。采用常規儀器設定值,在Perkin-Elmer Biosystems PE7700系統中進行擴增(40個循環)和實時檢測。使用PE7700 Sequence Detector軟件計算Ct值。從每個組織樣品獲得靶mRNA(CtX)和肌動蛋白mRNA(CtA)的Ct值。
因為在普通實驗條件下的PCR擴增效率接近于理論擴增效率,所以2(CtN/T/XY-CtA)值是所述樣品的相對TAA轉錄水平的估計值,即相對于肌動蛋白轉錄水平進行標準化的值。因此,數值為1表示候選抗原和肌動蛋白的表達水平相同。
首先對來自12個患者的活檢組織的腫瘤結腸和配對的正常結腸進行實時PCR反應。然后在總共18個患者的更全面的數據集上進行反應(前12個患者的數據集包括在內)。在該數據集中這18個患者中的6個患者的數據以復份制成。還測試了其它6個患者,結果與前18個患者的數據合并。對最終合并值進行的統計學分析結果示于表3中,并且在圖1中加以說明。
也依照相同方法測試代表29種不同組織的一系列48個正常組織樣品(所分析的正常組織示于表3中)。如上所述計算TAA轉錄水平。也根據該數據集計算出過量表達候選抗原的患者的比例以及相對于正常組織的轉錄物過量表達平均值。結果示于圖1中。
表1CASB7439實時PCR表達結果12個患者的數據集
表2CASB7439實時PCR表達結果18個患者的數據集
表3CASB7439實時PCR表達結果24個患者的數據集
也采用Taqman方法(如上所述),對來自6個患者活檢組織的腫瘤結腸和相鄰的正常結腸進行實時PCR反應。對于每個樣品采用三個復份測定,用平均值進行進一步的計算。結果示于圖1中。此外,也依照相同方法測試代表28種不同組織的36個正常組織樣品(參見表5)。結果示于圖2中。
表4采用Taqman探針的CASB7439實時PCR表達結果
結果清楚地表明,與相鄰的正常結腸和所有的上述正常組織相比,CASB7439轉錄物在結腸直腸腫瘤中過量表達。與相鄰的正常結腸相比,90%以上的所述患者的腫瘤中CASB7439轉錄物強過量表達。所述腫瘤中的平均過量表達倍數至少為100。此外,與其它正常組織相比,90%以上的所述患者的結腸腫瘤中CASB7439轉錄物過量表達,其中過量表達CASB7439轉錄物的所述患者中的60%以上的過量表達倍數為至少10倍。
表5用于CASB7439轉錄物表達分析的正常組織一覽表
實施例2
cDNA陣列的示差篩選
通過示差篩選完成對扣除cDNA文庫中的腫瘤相關基因的鑒定。
從100μl過夜培養物中提取細菌總DNA。用異硫氰酸胍裂解細菌,使用磁性玻璃(Boehringer)對細菌DNA進行親和純化。通過Advantage PCR擴增(Clontech)從細菌DNA回收質粒插入片段。采用Biomek 96 HDRT工具(Beekman),將PCR產物點樣至兩個尼龍膜上,產生高密度cDNA陣列。斑點狀cDNA經UV照射與膜共價結合。將第一張膜與從單個患者的腫瘤制備的混合cDNA探針雜交。將第二張膜與等量的從相同患者的正常結腸制備的混合cDNA探針雜交。如上所述通過PCR擴增制備探針cDNA,并且采用AlkPhos Direct System(Amersham)將其標記。雜交條件和嚴格洗滌如AlkPhos Direct試劑盒所述。雜交探針用化學發光進行檢測。通過薄膜光密度測定法或直接測定法(BioRad Fluor-S Max)測定兩個印跡上的每種cDNA片段的雜交強度。計算每個基因的腫瘤雜交強度與正常雜交強度的比率(T/N),以評價腫瘤中的過量表達程度。對在結腸腫瘤中顯著過量表達的基因進行跟蹤研究。顯著性任意地定義為T/N頻率分布的一個標準偏差。采用來自多個患者供體(>18)的RNA,重復示差篩選實驗,以估計在該患者群體中過量表達的腫瘤的頻率。另外,將DNA陣列與來自除結腸以外的正常組織(參見上文一覽表)的混合cDNA探針雜交,以測定所述候選基因在這些組織中的表達水平。
實施例3
DNA微陣列
用DNA微陣列檢測多個樣品中基因大集合物的mRNA表達分布型。用該信息補充通過實時PCR獲得的數據,并且提供在腫瘤組織和正常組織中基因表達水平的獨立測量。
目前用于產生DNA微陣列的技術的實例包括1)Affymetrix“GeneChip”陣列,其中采用光刻法通過固相化學合成在所述芯片的表面合成寡核苷酸,2)DNA點樣(spotting)技術,其中由機器人將小體積DNA溶液沉積到固相(例如玻璃)的表面,然后將其固定化。在這兩種情況下,將所述芯片與從目標組織(例如正常組織、腫瘤等……)提取并且用放射性或者用熒光報道分子標記的cDNA或cRNA雜交。使標記材料與所述芯片雜交,然后使用特殊掃描儀,測定與所述芯片上每一序列結合的探針量。所述實驗可以用單一熒光報道分子(或放射性)建立,或者可以用兩種熒光報道分子進行。在后一種情況下,所述兩個樣品中的每個用其中一種報道分子標記。然后將這兩個已標記的樣品與所述DNA芯片上的序列競爭性雜交。確定所述芯片上每一序列的兩種熒光信號的比例。用該比例計算所述兩個樣品中所述轉錄物的相對豐度。詳細方案可得自許多來源,包括“DNA微陣列一種實用方法(DNA MicroarraysA practical approach)。Schena M.Oxford UniverstyPress1999”和萬維網(http//cmgm.stanford.edu/pbrown/protocols/index.html),http//arrayit.com/DNA-Microarray-Protocols/)和許多專業銷售商(例如Affymetrix)。
實施例5
RNA-DNA印跡分析
通過Advantage PCR(參見上文)擴增有限量的混合的腫瘤結腸cDNA和配對的正常結腸cDNA。也使用相同方法擴增來自多個正常組織的信使RNA。將所擴增的cDNA(1μg)在1.2%瓊脂糖凝膠上電泳,然后轉移至尼龍膜上。將所述膜與用候選TAA cDNA片段制備的探針雜交(AlkPhos Direct System)。RNA-DNA印跡分析提供有關腫瘤組織和正常組織中轉錄物大小、是否存在剪接變異體以及轉錄物豐度的信息。
實施例6
RNA印跡分析
按照標準方法使用1μg poly A+mRNA產生RNA印跡。采用Ready-to-Go系統(Pharmacia)制備放射性探針。
實施例7
全長cDNA序列的實驗鑒定
采用Lambda ZapII系統(Stratagene)從5μg poly A+mRNA構建結腸腫瘤cDNA文庫。采用所提供的方案,只是使用SuperscriptII(LifeTechnologies)進行反轉錄步驟。構建寡聚dT引物文庫和隨機引物文庫。對于文庫的每次篩選,平板接種約1.5×106個獨立噬菌體。將噬斑轉移至尼龍濾膜上,并且采用用AlkPhos Direct標記的cDNA探針雜交。通過化學發光檢測陽性噬菌體。將陽性噬菌體從瓊脂板上切下,在500μl SM緩沖液中洗脫,通過基因特異性PCR進行證實。通過體內移除將洗脫的噬菌體轉變成單鏈M13噬菌體。然后通過大腸桿菌的感染,將所述噬菌體轉變成雙鏈質粒DNA。將受感染細菌平板接種,然后用所述cDNA探針進行第二輪篩選。從陽性細菌克隆純化出質粒DNA,然后對兩條鏈測序。
當全長基因不能直接從cDNA文庫中獲得時,采用RACE技術(Marathon Kit,ClonTech)分離丟失序列。該方法依賴于將mRNA反轉錄成雙鏈cDNA,將接頭與cDNA的兩個末端連接,采用基因特異性引物和接頭寡核苷酸的特異性引物擴增cDNA的所需端。將MarathonPCR產物克隆到質粒(pCRII-TOPO,InVitrogen)中,然后測序。
使用該方法獲得SEQ ID NO1的多核苷酸。
實施例8.
EST分布型
實驗抗原組織表達表征的一種互補方法是搜索人EST數據庫。EST(“已表達序列標志”)是從特定組織或細胞系提取的mRNA集合物制備的cDNA的小片段。目前這樣的數據庫提供來自數千種cDNA組織文庫(包括來自各種類型和病期的疾病的腫瘤組織)的大量的人EST(2 106)。借助于信息工具(Blast),進行CASB7439序列的比較搜索,以便更加深入地了解組織表達。
CASB7439的EST分布
這些EST與CASB7439完美匹配。該表包括9個來自4個不同腫瘤結腸文庫的EST、1個來自1個正常結腸文庫的EST、3個來自1個腫瘤生殖細胞文庫的EST、1個來自1個慢性淋巴細胞白血病細胞文庫的EST、2個來自2個混合腫瘤文庫的EST、2個來自未知類型文庫的EST。這清楚地表明,同預期的一樣,與正常組織相比,CASB7439在腫瘤組織中過量表達,尤其是在結腸直腸腫瘤組織中過量表達。
實施例9
9.1腫瘤特異性抗原的表達和純化
采用在微生物宿主中表達或者在體外轉錄/翻譯,產生用于疫苗目的本發明抗原以及產生蛋白片段或完整蛋白,用于快速純化以及產生通過免疫組織化學法鑒定天然已表達蛋白或者純化跟蹤所需的抗體。
可以在兩種微生物宿主-大腸桿菌和酵母(例如釀酒酵母(Saccharomyces cerevisiar)或巴斯德畢赤酵母(Pichia pastoris))中表達重組蛋白。這允許選擇具有最佳特征的表達系統,以供生產該特定抗原。一般而言,讓重組抗原在大腸桿菌中表達,而讓試劑蛋白在酵母中表達。
表達策略首先包括設計重組抗原的一級結構。一般將表達融合配偶體(EFP)置于N末端,以提高表達水平,所述表達融合配偶體也可以包括一個可用于調節所述抗原免疫原性特性的區域一免疫融合配偶體(IFP)。另外,在C-末端包括可用于有助于進一步純化的親和融合配偶體(AFP)。
如上所述,可以對若干個構建體進行比較評價
對于快速表達和純化以及產生針對CASB7439的抗體,建議在大腸桿菌中產生具有NS1作為EFP和組氨酸尾作為AFP的全長CASB7439蛋白。
因此,提出兩種構建體
構建體1與NS1 cDNA(作為EFP)以及組氨酸尾編碼cDNA(作為AFP)融合的全長野生型CASB7439 cDNA(SEQ ID NO8)。所編碼的融合蛋白序列為SEQ ID NO10。
構建體2與NS1 cDNA(作為EFP)以及組氨酸尾編碼cDNA(作為AFP)融合的全長突變型CASB7439 cDNA(SEQ ID NO9)。建議在該構建體中具有被大腸桿菌密碼子選擇特異性的密碼子取代天然CASB7439cDNA的前50個密碼子,以增強CASB7439在其大腸桿菌宿主中的表達潛力。所編碼的融合蛋白序列為SEQ ID NO10。
所述CASB7439蛋白設計如下所示
“NS1”是流感病毒蛋白NS1的N-端片段(80個氨基酸)。“HIS”是多聚組氨酸尾。
所用的重組菌株是AR58衍生于N99和cI857的隱蔽性λ溶原體,N99是gal E∷Tn 10,Δ-8(chlD-pgl,Δ-H1(cro-chlA),N+(Proc.Natl.Acad.Sci.USA第82卷,第88-92頁,1985年1月Biochemistry)。
當重組菌株可得到時,通過評價表達水平并且通過分析粗提物的行為進一步預測所述蛋白的溶解度來表征重組產物。
在合適培養基上生長并且誘導重組蛋白表達后,通過SDS-PAGE分析總提取物。使重組蛋白在染色凝膠上顯現,然且使用特異性抗體通過蛋白質印跡分析進行鑒定。
質粒
名稱TCM 281 pRIT..15143
復制子pMB1
選擇Kan
啟動子PL long
插入片段NS1-C74-39-His用構建體1表達重組蛋白
讓細菌在LB培養基+50μg/ml Kan中于30℃生長
當培養物達到OD=0.5(620nm)時,將培養物加熱到至多39℃,
誘導5小時后,收獲細胞
提取物的制備
細胞濃度.50X..在緩沖液PBS+完全…中
破碎弗氏壓碎器3X
離心于14000t 30分鐘
備注在細胞提取物的上清液中>90%
將細胞提取物在12.5%SDS PAGE上電泳,隨后用考馬斯藍染色。也使用市售的針對多聚組氨酸尾的單克隆抗體(Quiagen)進行蛋白質印跡分析。所得凝膠(圖3和圖4)顯示該蛋白被表達,并且在細胞提取物上清液中顯現。
純化方案采用基于重組蛋白中組氨酸親和性尾存在的經典方法。在一個典型實驗中,過濾破碎的細菌,然后將無細胞提取物加樣到特異性地保留所述重組蛋白的離子金屬親和層析柱(IMAC;Ni++NTA,得自Qiagen)上。在磷酸鹽緩沖液中,用0-500mM咪唑梯度(可能在去垢劑存在下)洗脫所述保留的蛋白。
將得自收獲培養物的上清液在6M尿素、100mM NaH2PO4、10mMTris、pH8中變性,然后在以下條件下上樣到層析柱IMAC Qiagen NTANi++
平衡緩沖液NaH2PO4 100mMpH8
Tris10mM
尿素6M
樣品尿素6M、100mM NaH2PO4、10mM Tris中的上清液
洗滌緩沖液1)NaH2PO4100mM pH8
Tris10mM
尿素6M
咪唑25mM
2)NaH2PO4100mM pH8
Tris10mM
尿素6mM
咪唑50mM
洗脫緩沖液NaH2PO4 100mM pH5.5
Tris10mM
尿素6M
咪唑500mM
在500mM咪唑+6M尿素中的洗脫蛋白在以下條件下透析
-PBS PH 7.2+sarkosyl 0.5%+4M尿素
-同前,于2M尿素2小時
-同前,于0M尿素2小時
將最終的物質冷凍保存。蛋白質含量采用Lowry蛋白測定來定量(0.9mg/1.2ml)。通過用考馬斯藍染色的12.5%PAGE SDS評價純度(圖5),通過蛋白質印跡、采用抗多聚組氨酸單克隆抗體檢查重組蛋白的存在(圖6)。
對不同形式的所表達抗原的比較評價,將使得能夠選擇出最有前途的候選物,然后將其用于進一步純化和免疫學評價。
9.2抗體的產生和免疫組織化學
可以用少量相對純化的蛋白產生免疫學工具,以便
a)在正常或癌癥組織切片中通過免疫組織化學檢測所述表達;
b)檢測所述表達,并且在純化過程期間跟蹤所述蛋白(ELISA/蛋白質印跡);或
c)鑒定/定量所述純化蛋白(ELISA)。
9.2.1多克隆抗體
免疫
兔子用100μg配制在佐劑3D-MPL/QS21中的蛋白以3周間隔肌內(I.M.)免疫3次。每次免疫后3周,抽取血樣,然后使用所述蛋白作為包被抗原,根據標準方法,通過ELISA,估計所述血清中的抗體效價。
ELISA
將96孔微量培養板(maxisorb Nunc)用5μg蛋白于4℃包被過夜。用1%PBS NCS 1%于37℃飽和1小時后,于37℃加入連續稀釋的兔血清(起始于1/10)達1小時30分鐘。用PBS吐溫洗滌3次后,加入抗兔生物素化抗血清(Amersham)(1/5000)。洗滌培養板,然后于37℃加入過氧化物酶偶聯鏈霉抗生物素蛋白(1/5000)達30分鐘。洗滌后,加入50μl TMB(BioRad)達7分鐘,然后用0.2M H2SO4終止反應。可以在450nm測定OD,并且用SoffmaxPro計算中點稀釋度。
9.2.2單克隆抗體
免疫
用5μg純化蛋白對5只BALB/c小鼠以3周間隔免疫3次。第2次免疫后14天以及第3次免疫后1周進行放血。用純化蛋白作包被抗原,通過Elisa測試所述血清。根據這些結果(中點稀釋度>10000),選擇1只小鼠用于融合。
融合/HAT選擇
按照標準方法,使用40%PEG和5%DMSO,將脾細胞與SP2/0骨髓瘤細胞融合。然后以2.5×104-105細胞/孔將細胞接種于96孔板,然后在HAT培養基中選擇抗性克隆。測試這些雜交瘤上清液中特異性抗體的含量,當雜交瘤上清液為陽性時,將其進行2個循環的有限稀釋。經過2輪篩選后,選擇3個雜交瘤用于腹水生產。
9.2.3免疫組織化學
當抗體可得到時,對正常組織切片或癌組織切片進行免疫染色,以便確定
◇相對于正常組織而言癌組織中本發明抗原的表達水平或
◇表達所述抗原的某一類型癌的比例
◇是否其它癌類型也表達所述抗原
◇在一種癌組織中表達所述抗原的細胞比例
組織樣品制備
解剖后,將組織樣品用OCT化合物固定在軟木盤上,然后在先前已在液氮(-160℃)中過冷的異戊烷中快速冷凍。使用之前一直將所述冷凍塊在-70℃保存。7-10μm切片在恒冷切片機室(-20,-30℃)中完成。
染色
將組織切片在室溫(RT)下干燥5分鐘,室溫下在丙酮中固定10分鐘,再次干燥,然后用PBS 0.5%BSA 5%血清飽和。于室溫下30分鐘后,用抗原特異性抗體進行直接或間接染色。直接染色產生特異性更好但強度較低的染色,而間接染色產生強度較高但特異性較低的染色。
9.3針對本發明抗原的人細胞免疫應答的分析
通過在體外使人T細胞接觸抗原,可以評價本發明抗原的免疫相關性。所有T細胞淋巴細胞系和樹突細胞均來源于健康供體(優選為HLA-A2亞型)的PBMC(外周血單核細胞)。HLA-A2.1/Kb轉基因小鼠模型也用來篩選HLA-A2.1肽。
通過每周體外刺激,產生并維持新發現的抗原特異性CD8+T細胞系。采用標準方法,測試所述CD8+系應答所述抗原或抗原衍生肽的裂解活性和γ-IFN的產生。
使用兩種策略來產生所述CD8+T細胞系一種基于肽的方法和一種基于完整基因的方法。兩種方法均要求將新發現抗原正確讀框的全長cDNA或者在合適傳遞系統中克隆或者用來預測HLA結合肽的序列。
基于肽的方法
概述地說,用含佐劑的HLA-A2肽免疫轉基因小鼠,不能誘導CD8+應答(根據肽脈沖處理的自身脾細胞有效裂解來確定)的那些肽在人系統中進一步分析。
人樹突細胞(按照Romani等所述方法培養)用肽進行脈沖處理,并且用來刺激CD8+分類的T細胞(通過Facs)。通過數次每周刺激后,首先在肽脈沖處理的自身BLCL(EBV-B轉化細胞系)上測試所述CD8+系。為了確證在體內正確加工所述肽,在cDNA轉染的腫瘤細胞(HLA-A2轉染的LnCap、Skov3或CAMA腫瘤細胞)上測試所述CD8+系。
基于完整基因的方法
使CD8+T細胞系接觸抗原,然后用基因槍轉染的樹突細胞、反轉錄病毒轉導的B7.1轉染的成纖維細胞、重組痘病毒或腺病毒感染的樹突細胞刺激。病毒感染的細胞非常有效地呈遞抗原肽,因為所述抗原以高水平表達,而且可以只使用一次,以避免病毒T細胞系的過度生長。
改變刺激后,如上所述,在cDNA轉染的腫瘤細胞上測試所述CD8+系。測定肽特異性和同一性以證實免疫學檢驗。
CD4+T細胞應答
同樣,也可以評價CD4+T細胞免疫應答。采用加載用以刺激T細胞的重組純化蛋白或肽的樹突細胞產生特異性CD4+T細胞。
預測結合HLA等位基因的表位(九聚體和十聚體)
根據Parker算法(Parker,K.C.,M.A.Bednarek和J.E.Coligan.1994.根據個別肽單鏈的獨立結合將潛在的HLA-A2結合肽分等級的方案J.Immunol.152163和http//bimas.dcrt.nih.gov/molbio/hla_bind)或Rammensee方法(Rammensee,Friede,Stevanovic,MHC配體和肽基序第一列表,Immunogenetics 41,178-228,1995;Rammensee,Bachmann,StevanovicMHC配體和肽基序。Landes Bioscience 1997和http//134.2.96.221/scripts/hlaserver.dll/home.htm),預測HLAI類結合肽序列。然后在HLA-A2.1/Kb轉基因小鼠模型(Vitiello等)中篩選肽。
運用Tepitope算法,用截止計分設置為6(Stumiolo,Hammer等,Nature Biotechnology.1999.17;555-561),預測HLA II類結合肽序列。
下表搜集了I類和II類預測的表位序列
°含有所述亞序列的分子解離半衰期的估計。
°含有所述亞序列的分子解離半衰期的估計。
°含有所述亞序列的分子解離半衰期的估計。
°含有所述亞序列的分子解離半表期的估計。
°含有所述亞序列的分子解離半衰期的估計。
°含有所述亞序列的分子解離半衰期的估計。
序列信息
SEQ ID NO1
GTACCTTGCTTTGGGGGCGCACTAAGTACCTGCCGGGAGCAGGGGGCGCACCGGGAACTCGCAGATTTCGCC
AGTTGGGCGCACTGGGGATCTGTGGACTGCGTCCGGGGGATGGGCTAGGGGGACATGCGCACGCTTTGGGCC
TTACAGAATGTGATGGCGCGAGGGGGAGGGCGAAGCGTGGCGGGAGGGCGAGGCGAAGGAAGGAGGGCGTGA
GAAAGGCGACGGCGGCGGCGCGGAGGAGGGTTATCTATACATTTAAAAACCAGCCGCCTGCGCCGCGCCTGC
GGAGACCTGGGAGAGTCCGGCCGCACGCGCGGGACACGAGCGTCCCACGCTCCCTGGCGCGTACGGCCTGCC
ACCACTAGGCCTCCTATCCCCGGGCTCCAGACGACCTAGGACGCGTGCCCTGGGGAGTTGCCTGGCGGCGCC
GTGCCAGAAGCCCCCTTGGGGCGCCACAGTTTTCCCCGTCGCCTCCGGTTCCTCTGCCTGCACCTTCCTGCG
GCGCGCCGGGACCTGGAGCGGGCGGGTGGATGCAGGCGCGatggacggcggcacactgcccaggtccgcgcc
ccctgcgccccccgtccctgtcggctgcgctgcccggcggagacccgcgtccccggaactgttgcgctgcag
ccggcggcggcgaccggccaccgcagagaccggaggcggcgcagcggccgtagcgcggcgcaatgagcgcga
gcgcaaccgcgtgaagctggtgaacttgggcttccaggcgctgcggcagcacgtgccgcacggcggcgccag
caagaagctgagcaaggtggagacgctgcgctcagccgtggagtacatccgcgcgctgcagcgcctgctggc
cgagcacgacgccgtgcgcaacgcgctggcgggagggctgaggccgcaggccgtgcggccgtctgcgccccg
cgggccgccagggaccaccccggtcgccgcctcgccctcccgcgcttcttcgtccccgggccgcgggggcag
ctcggagcccggctccccgcgttccgcctactcgtcggacgacagcggctgcgaaggcgcgctgagtcctgc
ggagcgcgagctactcgacttctccagctggttagggggctactgaGCGCCCTCGACCTATGAGCCTCAGCC
CCGGAAGCCGAGCGAGCGGCCGGCGCGCTCATCGCCGGGGAGCCCGCCAGGTGGACCGGCCCGCGCTCCGCC
CCCAGCGAGCCGGGGACCCACCCACCACCCCCCGCACCGCCGACGCCGCCTCGTTCGTCCGGCCCAGCCTGA
CCAATGCCGCGGTGGAAACGGGCTTGGAGCTGGCCCCATAAGGGCTGGCGGCTTCCTCCGACGCCGCCCCTC
CCCACAGCTTCTCGACTGCAGTGGGGCGGGGGGCACCAACACTTGGAGATTTTTCCGGAGGGGAGAGGATTT
TCTAAGGGCACAGAGAATCCATTTTCTACACATTAACTTGAGCTGCTGGAGGGACACTGCTGGCAAACGGAG
ACCTATTTTTGTACAAAGAACCCTTGACCTGGGGCGTAATAAAGATGACCTGGACCCCTGCCCCCACTATCT
GGAGTTTTCCATGCTGGCCAAGATCTGGACACGAGCAGTCCCTGAGGGGCGGGGTCCCTGGCGTGAGGCCCC
CGTGACAGCCCACCCTGGGGTGGGTTTGTGGGCACTGCTGCTCTGCTAGGGAGAAGCCTGTGTGGGGCACAC
CTCTTCAAGGGAGCGTGAACTTTATAAATAAATCAGTTCTGTTTAAAAAAAAAAAAAAAAAA
SEQ ID NO-2
MDGGTLPRSAPPAPPVPVGCAARRRPASPELLRCSRRRRPATAETGGGAAAVARRNERERNRVKLVNLGFQA
LRQHVPHGGASKKLSKVETLRSAVEYIRALQRLLAEHDAVRNALAGGLRPQAVRPSAPRGPPGTTPVAASPS
RASSSPGRGGSSEPGSPRSAYSSDDSGCEGALSPAERELLDFSSWLGGY
SEQ ID NO3
MSAPAARSASGAEAHRSRALSSPLTSWRSRVARAPQDSARLRSRCRPTSRRNAGSRAPSCPRGPGTKKRGR
ARRRPGWSLAAGAQTAARPAASALPPARRCARRRARPAGAAARGCTPRLSAASPPCSASCWRRRAARAAAA
PGSPSSPASRGCARAHCAALRPLRRLRSLRWPVAAAGCSATVPGTRVSAGQRSRQGRGAQGARTWAVCRRP
SRLHPPARRSRRAAGRCRQRNRRRRGKLWRPKGASGTAPPGNSPGHAS
SEQ ID NO4
GTACCTTGCTTTGGGGGCGCACTAAGTACCTGCCGGGAGCAGGGGGCGCACCGGGAACTCGCAGATTTCGCC
AGTTGGGCGCACTGGGGATCTGTGGACTGCGTCCGGGGGATGGGCTAGGGGGACATGCGCACGCTTTGGGCC
TTACAGAATGTGATCGCGCCGAGGGGGAGGGCCGAAGCGTGGCGGGAGGGCGAGGCGAAGGAAGGAGGGCGT
GAGAAAGGCGACGGCGGCGGCGCGGAGGAGGGTTATCTATACATTTAAAAACCAGCCGCCTGCGCCGCGCCT
GCGGAGACCTGGGAGAGTCCGGCCGCACGCGCGGGACACGAGCGTCCCACGCTCCCTGGCGCGTACGGCCTG
CCACCACTAGGCCTCCTATCCCCGGGCTCCAGACGACCTAGGACGCGTGCCCTGGGGAGTTGCCTGGCGGCG
CCGTGCCAGAAGCCCCCTTGGGGCGCCACAGTTTTCCCCGTCGCCTCCGGTTCCTCTGCCTGCACCTTCCTG
CGGCGCGCCGGGACCTGGAGCGGGCGGGTGGATGCAGGCGCGatggacggcggcacactgcccaggtccgcg
ccccctgcgccccccgtccctgtcggctgcgctgcccggcggagacccgcgtccccggaactgttgcgctgc
agccggcggcggcgaccggccaccgcagagaccggaggcggcgcagcggccgtagcgcggcgcaatgagcgc
gagcgcaaccgcgtgaagctggtgaacttgggcttccaggcgctgcggcagcacgtgccgcacggcggcgcc
agcaagaagctgagcaaggtggagacgctgcgctcagccgtggagtacatccgcgcgctgcagcgcctgctg
gccgagcacgacgccgtgcgcaacgcgctggcgggagggctgaggccgcaggccgtgcggccgtctgcgccc
cgcgggccgccagggaccaccccggtcgccgcctcgccctcccgcgcttcttcgtccccgggccgcgggggc
agctcggagcccggctccccgcgttccgcctactcgtcggacgacagcggctgcgaaggcgcgctgagtcct
gcggagcgcgagctactcgacttctccagctggttagggggctactgaGCGCCCTCGACCTAATAAGCCTCA
AGCCCCGGAAACCCGAGCGAACGGGCCGGCGCGCTTCATCGCCGGGGAAGCCCGCCAAGGTGGACCGGGCCC
GCGCTCCGCCCCCAGCGAGCCGGGGACCCACCCACCACCCCCCGCACCGCCGACGCCGCCTCGTTCGTCCGG
CCCAGCCTGACCAATGCCGCGGTGGAAACGGGCTTGGAGCTGGCCCCATAAGGGCTGGCGGCTTCCTCCGAC
GCCGCCCCTCCCCACAGCTTCTCGACTGCAGTGGGGCGGGGGGCACCAACACTTGGAGATTTTTCCGGAGGG
GAGAGGATTTTCTAAGGGCACAGAGAATCCATTTTCTACACATTAACTTGAGCTGCTGGAGGGACACTGCTG
GCAAACGGAGACCTATTTTTGTACAAAGAACCCTTGACCTGGGGCGTAATAAAGATGACCTGGACCCCTGCC
CCCACTATCTGGAGTTTTCCATGCTGGCCAAGATCTGGACACGAGCAGTCCCTGAGGGGCGGGGTCCCTGGC
GTGAGGCCCCCGTGACAGCCCACCCTGGGGTGGGTTTGTGGGCACTGCTGCTCTGCTAGGGAGAAGCCTGTG
TGGGGCACACCTCTTCAAGGGAGCGTGAACTTTATAAATAAATCAGTTCTGTTTAAAAAAAAAAAAAAAAAA
AAAACCGAGGGGGGGCCCGGAGCCAACAAA
SEQ ID NO5
GGTAAACAGAACTGATTTATTTATAAAGTTCACGCTCCCTTGAAGAGGTGTGCCCCACACAGGCTTCTCCC
TAGCAGAGCAGCAGTGCCCACAAACCCACCCCAGGGTGGGCTGTCACGGGGGCCTCACGCCAGGGACCCCG
CCCCTCAGGGACTGCTCGTGTCCAGATCTTGGCCAGCATGGAAAACTCCAGATAGTGGGGGCAGGGGTCCA
GGTCATCTTTATTACGCCCCAGGTCAAGGGTTCTTTGTACAAAAATAGGTCTCCGTTTGCCAGCAGTGTCC
CTCCAGCAGCTCAAGTTAATGTGTAGAAAATGGATTCTCTGTGCCCTTAGAAAATCCTCTCCCCTCCGGAA
AAATCTCCAAGTGTTGGTGCCCCCCGCCCCACTGCAGTCGAGAAGCTGTGGGGAGGGGCGGCGTCGGAGGA
AGCCGCAGCCCATTATGGGGCCAGCTCCAAGCCCGTTTCCACCGCGGCATTGGTCAGGCTGGGCGGACGAA
CGAGGCGGCGTCGGCGGTGCGGGGGGTGGTGGGTGGGTCCCCGGCTCGCTGGGGGCGGAGCAGCGGGCCGG
TCCACCTGGCGGGCTCCCC
SEQ ID NO6
TTTTTTTTTTTTTTTTTTTAAACAGAACTGATTTATTTATAAAGTTCACGCTCCCTTGAAGAGGTGTGCCCC
ACACAGGCTTCTCCCTAGCAGAGCAGCAGTGCCCACAAACCCACCCCAGGGTGGGCTGTCACGGGGGCCTCA
CGCCAGGGACCCCGCCCCTCAGGGACTGCTCGTGTCCAGATCTTGGCCAGCATGGAAAACTCCAGATAGTGG
GGGCAGGGGTCCAGGTCATCTTTATTACGCCCCAGGTCAAGGGTTCTTTGTACAAAAATAGGTCTCCGTTTG
CCAGCAGTGTCCCTCCAGCAGCTCAAGTTAATGTGTAGAAAATGGATTCTCTGTGCCCTTAGAAAATCCTCT
CCCCTCCGGAAAAATCTCCAAGTGTTGGTGCCCCCCGCCCCACTGCAGTCGAGAAGCTGTGGGGAGGGGCGG
CGTCGGAGGAAGCCGCCAGCCCTTATGGGGCCAGCTCCAAGCCCGTTTCCACCGCGGCATTGGTCAGGCTGG
GCCGGACGAACGAGGCGGCGTCGGCGGTGCGGGGGGTGGTGGGTGGGTCCCCGGCTCGCTGGGGGCGGAGCG
CGGGCCGGTCCACCTGGCGGGCTCCCCGGCGATGAGCGCGCCGGCCGCTCGCTCGGCTTCCGGGGCTGAGGC
TCATAGGTCGAGGGCGCTCAGTAGCCCCCTAACCAGCTGGACAAGTCGAGTAGCTCGCGCTCCGCAGGACTC
AGCGCGCCTTCGCAGCCGCTGTCGTCCGACGAGTAGGCGGAACGCGGGGAGCCGGGCTCCGAGCTGCCCCCG
CGGCCCGGGGACGAAGAAGCGCGGGAGGGCGAGGCGGCGACCGGGGTGGTCCCTGGCGGCCCGCGGGGCGCA
GACGGCCGCACGGCCTGCGGCCTCAGCCCTCCCGCCAGCGCGTTGCGCACGGCGTCGTGCTCGGCCAGCAGG
CGCTGCAGCGCGCGGATGTACTCCACGGCTGAGCGCAGCGTCTCCACCTTGCTCAGCTTCTTGCTGGCGCCG
CCGTGCGGCACGTGCTGCCGCAGCGCCTGGAAGCCCAAGTTCACCAGCTTCACGCGGTTGCGCTCGCGCTCA
TTGCGCCGCGCTACGGCCGCTGCGCCGCCTCCGGTCTCTGCGGTGGCCGGTCGCCGCCGCCGGCTGCAGCGC
AACAGTTCCGGGGACGCGGGTCTCCGCCGGGCAGCGCAGCCGACAGGGACGGGGGGCGCAGGGGGCGCGGAC
CTGGGCAGTGTGCCGCCGTCCATCGCGCCTGCATCCACCCGCCCGCTCCAGGTCCCGGCGCGCCGCAGGAAG
GTGCAGGCAGAGGAACCGGAGGCGACGGGGAAAACTGTGGCGCCCCAAGGGGGCTTCTGGCACGGCGCCGCC
AGGCAACTCCCCAGGGCACGCGTCCTAGGTCGTCTGGAGCCCGGGGATAGGAGGCCTAGTGGTGGCAGGCCG
TACGCGCCAGGGAGCGTGGGACGCTCGTGTCCCGCGCGTGCGGCCGGACTCTCCCAGGTCTCCGCAGGCGCG
GCGCAGGCGGCTGGTTTTTAAATGTATAGATAACCCTCCTCCGCGCCGCCGCCGTCGCCTTTCTCACGCCCT
CCTTCCTTCGCCTCGCCCTCCCGCCACGCTTCGCCCTCCCCCTCGCGCGATCACATTCTGTAAGGCCCAAAG
CGTGCGCATGTCCCCCTAGCCCATCCCCCGGACGCAGTCCACAGATCCCCAGTGCGCCCAACTGGCGAAATC
TGCGAGTTCCCGGTGCGCCCCCTGCTCCCGGCAGGTACTTAGTGCGCCCCCAAAGCAAGGTAC
SEQ ID NO7
MCRKWILCALRKSSPLRKNLQVLVPPAPLQSRSCGEGRRRRKPPALMGPAPSPFPPPHWSGWAGRTRRRRR
CGGWWVGPRLAGGGARARSTLAGFPGDEARRPVRSGFRGLRLIRSRALSSPLTSWRSRVARAPQDSARLRS
RCRPTSRRNAGSRAPSCPRGPGTKKRGRARRRPGWSLAARGACTAARPAASALPPARCARRRARPAGAAAR
GCTPRLSAASPPCSASCWRPRAARAAAAPGSPSSPASRGCARAHCAALRPLRRLRSLRWPVAAAGCSATVP
GTRVSAGQRSRQGRGAQGARTWAVCRRPSRLHPPARSRSRRAAGRCRQRNRRRRGKLWRPKGASGTAPPGN
SPGHAS
SEQ ID NO8
ATGGATCCAAACACTGTGTCAAGCTTTCAGGTAGATTGCTTTCTTTGGCATGTCCGCAAACGAGTTGCAGAC
CAAGAACTAGGTGATGCCCCATTCCTTGATCGGCTTCGCCGAGATCAGAAATCCCTAAGAGGAAGGGGCAGC
ACcCTcGGTCTGGACATCGAGACAGCCACACGTGCTGGAAAGCAGATAGtGGAGCGGAttctGAAAGAAGAA
TCCGATGAGGCACTTAAAATGACCATGGACGGCGGCACACTGCCCAGGTCCGCGCCCCCTGCGCCCCCCGTC
CCTGTCGGCTGCGCTGCCCGGCGGAGACCCGCGTCCCCGGAACTGTTGCGCTGCAGCCGGCGGCGGCGACCG
GCCACCGCAGAGACCGGAGGCGGCGCAGCGGCCGTAGCGCGGCGCAATGAGCGCGAGCGCAACCGCGTGAAG
CTGGTGAACTTGGGCTTCCAGGCGCTGCGGCAGCACGTGCCGCACGGCGGCGCCAGCAAGAAGCTGAGCAAG
GTGGAGACGCTGCGCTCAGCCGTGGAGTACATCCGCGCGCTGCAGCGCCTGCTGGCCGAGCACGACGCCGTG
CGCAACGCGCTGGCGGGAGGGCTGAGGCCGCAGGCCGTGCGGCCGTCTGCGCCCCGCGGGCCGCCAGGGACC
ACCCCGGTCGCCGCCTCGCCCTCCCGCGCTTCTTCGTCCCCGGGCCGCGGGGGCAGCTCGGAGCCCGGCTCC
CCGCGTTCCGCCTACTCGTCGGCGACAGCGGCTGCGAAGGCGCGCTGAGTCCTGCGGAGCGCGAGCTACTC
GACTTCTCCAGCTGGTTAGGGGGCTACactagtggccaccatcaccatcaccattaa
SEQ ID NO9
TTGGATCCAAACACTGTGTCAAGCTTTCAGGTAGATTGCTTTCTTTGGCATGTCCGCAAACGAGTTGCAGA
CCAAGAACTAGGTGATGCCCCATTCCTTGATCGGCTTCGCCGAGATCAGAAATCCCTAAGAGGAAGGGGCA
GCACCCTCGGTCTGGACATCGAGACAGCCACACGTGCTGGAAAGCAGATAGTGGAGCGGATTCTGAAAGAA
GAATCCGATGAGGCACTTAAAATGACCATGGACGGCGGCACCCTGCCGCGTTCCGCGCCGCCGGCGCCGCC
AGTTCCGGTTGGCTGCGCTGCCCGTCGCCGTCCCGCGTCCCCGGAACTGCTGCGCTGCAGCCGTCGCCGTC
GCCCGGCCACCGCAGAGACCGGAGGCGGCGCAGCGGCCGTAGCGCGGCGCAATGAGCGCGAGCGCAACCGC
GTGAAGCTGGTGAACTTGGGCTTCCAGGCGCTGCGGCAGCACGTGCCGCACGGCGGCGCCAGCAAGAAGCT
GAGCAAGGTGGAGACGCTGCGCTCAGCCGTGGAGTACATCCGCGCGCTGCAGCGCCTGCTGGCCGAGCACG
ACGCCGTGCGCAACGCGCTGGCGGGAGGGCTGAGGCCGCAGGCCGTGCGGCCGTCTGCGCCCCGCGGGCCG
CCAGGGACCACCCCGGTCGCCGCCTCGCCCTCCCGCGCTTCTTCGTCCCCGGGCCGCGGGGGCAGCTCGGA
GCCCGGCTCCCCGCGTTCCGCCTACTCGTCGGACGACAGCGGCTGCGAAGGCGCCCTGAGTCCTGCGGAGC
GCGAGCTACTCGACTTCTCCAGCTGGTTAGGGGGCTACACTAGTGGCCACCATCACCATCACCATTAA
SEQ ID NO10
MDPNTVSSFQVDCFLWHVRKRVADQELGDAPFLDRLRRDQKSLRGRGSTLGLDIETATRAGKQIVERILKEE
SDEALKMTMDGGTLPRSAPPAPPVPVGCAARRRPASPELLRSSRRRRPATAETGGGAAAVARRNERERNRVK
LVNLGFQALRQHVPHGGASKKLSKVETLRSAVEYIRALQRLLAEHDAVRNALAGGLRPQAVRPSAPRGPPGT
TPVAASPSRASSSPGRGGSSEPGSPRSAYSSDDSGCEGALSPAERELLDFSSWLGGYTSGHHHHHH
SEQ ID NO11
MYSTAERSVSTLLSFLLAPPCGTCCRSAWKPKFTSFTRLRSRSLRRATAAAPPPVSAVAGRRRRLQRNSSG
DAGLRRAAQPTGTGGAGGADLGSVPPSIAPASTRPLQVPARRRKVQAEEPEATGKTVAPQGGFWHGAARQL
PRARVLGRLEPGDRRPSGGRPYAPGSVGRSCPARAAGLSQVSAGAAQAAGF
SEQ ID NO12
MEAHLDWYGVPGLQEASDACPRESCSSALPEAREGANVHFPPHPVPREHFSCAAPELVAGAQGLNASLMDG
GALPRLMPTSSGVAGACAARRRQASPELLRCSRRRRSGATEASSSSAAVARRNERERNRVKLVNLGFQALR
QHVPHGGANKKLSKVETLRSAVEYIRALQRLLAEHDAVRAALAGGLLTPATPPSDECAQPSASPASASLSC
ASTSPSPDRLGCSEPTSPRSAYSSEESSCEGELSPMEQELLDFSSWLGGY
SEQ ID NO13
GCCCGGAGCATGGAAGCACGTCAGCTAGGCCATGAACTGCACCCGGGAGGGGTGGGGGTGGAAGCGCACGG
TGTCAGCTTTGCAGAATGTGTACACCAAGGGGAGGGCGAGGCGAAGGAAGGAGGGCGTAAGAAAGGAGGCG
GTGGCGGGGCGGAGGAGATTATCTATACTTTTTAAAAAAAAGGAGCCTCTTAGCCGCGTAAAGGAGACTTG
GGGAGCGCCTGACAGCACGCGCGGGACACGAGAGTACCACGCTTCCCTACTCTTTTCAGACCTTGACTGGT
ACGGGGTCCCAGGACTGCAGGAGGCCAGCGACGCSTGCCCTAGGGAGTCCTGCAGCAGTGCCCTGCCTGAG
GCCCGTGAAGGTGCAAACGTCCACTTCCCACCGCACCCGGTTCCTCGCGAGCACTTTTCCTSTGCCGCACC
AGAACTCGTAGCAGGGGCCCAGGGGCTGAATGCAAGCTTGATGGACGGCGGCGCGCTGCCCAGACTCATGC
CCACCTCGTCTGGAGTCGCTGGAGCCTGCGCTGTCCGGCGGAGACAAGCGTCTCCGGAATTGCTGCGCTGC
AGCCGGCGGCGGCGATCTGGAGCAACCGAGGCCAGCAGCAGCTCGGCGTCCGTGGCACGCCGCAATGAGCG
CGAGCGCAACCGCGTAAAGCTGGTAAACTTGGGCTTCCAGGCGCTGCGGCAGCACGTGCCGCACGGCGGCG
CCAACAAGAAGCTGAGTAAGGTGGAGACGCTGCGCTCCGCGGTAGAGTACATTCGTGCGCTGCAGCGGCTG
CTCGCAGAGCACGACACGGTGCGGCCGGNGCTCGCTGGGGGGCTGTTAACACCCGCTACTCCGCCGTCCGA
TGAGTGCACGCAGCCCTCTGCCTCCCCTGCCAGCGGGTCTCTGTCCTGCGCCTCTACGTCTCCGTCCCGGA
CCCTGGGCTGCTCTGAGCCTACCTCCCCGCGCTCCGCCTACTCGTCGGAGGAAAGCAGCTGCGAGGGAGAG
CTAAGCCCGATGGAGCAGGAGCTGCTTGACTTTTCCAGTTGGTTAGGGGGCTACTGA
SEQ ID NO14
MESHFNWYGVPRLQKASDACPRESCSSALPEAREGANVHFPPHPVPREHFSCGAPKPVAGAPALNASLMDG
GALPRLVPTSSGVAGACTARRRPPSPELLRCSRRRRSGATEASSSSAAVARRNERERNRVKLVNLGFQALR
QRVPHGGANKKLSKVETLRSAVEYIRALQRLLAEHDAVRAALSGGLLTPATRPSDVCTQPSASPASASLSC
TSTSPDRLGCSEPASPRSAYSSEDSSCEGETYPMGQMFDFSNWLGGY
SEQ ID NO15
TTCACCCGGCTGCAAGCGCTAGGTGTACGGAGACCTGGCAGCTCTTGGGGCTTAAGGACTGAGCRCCAGAG
CCGGTGGAGGTTCCTGTGGAGTACATTCGGACCCTCTCACAGCCCCCGAGAGTGCGGGACGTGCGGAGCGC
AGTTCGGGATCTGCACTCGAGGACTTGTCGAGGACGCATTAAGCTAAGCATCTGCTCGGAGCATGGAATCG
CACTTTAACTGGTACGGGGTCCCAAGGCTCCAGAAGGCTAGCGACGCGTGCCCTAGGGAATCCTGCAGCAG
TGCCCTGCCTGAGGCCCGTGGAAGGTGCGAACGTCCACTTCCCACCGCACCCGGTTCCTCGCGAGCCTTTT
CCTGTGGCGCACCGAAACCCGTAGCGGGGGCCCCGGCGCTGAATGCAAGCTTGATGGACGGCGGCGCGCTG
CCCAGACTCGTGCCCACCTCGTCTGGAGTCGCTGGAGCCTGCACTGCTCGGCGGAGACCCCCGTCCCCGGA
ACTGCTTCGCTGCAGCCGACGGCGGCGATCGGGAGCAACCGAGGCCAGCAGCAGCTCGGCGGCCGTGGCAC
GCCGCAATGAGCGTGAGCGCAACCGCGTAAAGCTGGTAAACTTGGGCTTCCAGGCGCTGCGGCAGCACGTG
CCGCACGGCGGCGCCAACAAGAAGCTGAGTAAGGTGGAGACGCTGCGCTCCGCGGTAGAGTACATCCGTGC
GCTGCAGCGGCTGCTAGCAGAGCACGACGCGGTGCGTGCTGCGCTCTCTGGGGGTCTATTAACACCCGCTA
CTCGGCCGTCCGATGTGTGCACGCAGCCCTCCGCCTCCCCTGCCAGCGCGTCTCTGTCCTGCACCTCTACA
TCCCCAGACCGCCTAGGCTGCTCCGAGCCHCCTCTCCGCGCTCCGCCTTACTCGTCGGAGGACAGCAGCTG
CGAGGGAGAGACTTACCCGATGGGGCAGATGTTTHACTTTTCCAATTGGTTAGGGGGCTACTGAGCACCCC
ACACCCCTAAGCTGCGTCCCTGGGTGTCCCCTGGTGGACCTACCTGCGTTTCTTGCCCAGGAAACCTGGGC
CCATGCCTTACCCATGCTGTCTAGTGCAGCCTGACCAAATGCCAAGTACTGACCTCTGCTCGGCCTCCACG
CCGCGGAATGACATCTTCCATCTCCCAGTCCTTGCCGAACCAGGACTTGGAAATTTCTCAGGAGAAAGAAT
TTTACAATGACAATCTGCTTTTTATCAATTAACTTGAACTGCTGGAGGACTCTGCTGAAAATATGAAGAAT
TATTTTTATACAAAGGATCCTTAAGCTTGGAGCACAATAAAGATGACCTCTGTCTCTCACCCCCACTGTCT
AGAACTTTCCAACCTGGCCAAAGTGTGGACGGGTCGGGCCCTGAGGGCAAGATGCCTGGCTGCACCCTTCT
TCCTCTTCCGAAGCCTATCCTGACGCTGATGTTTGGCCAGTGTGGGAACCCTGCTATTGCAAAGTGTACTA
TTCTATAAAAGTTGTTTTTCATTGGAAAGGAATTC
SEQ ID NO16
KLVN1GFQAL
SEQ ID NO17
ELLDFSSWL
SEQ ID NO18
RLLAEHDAV
SEQ ID NO19
KLVNLGFQA
SEQ ID NO20
EYIRALQRL
SEQ ID NO21
EYIRALQRLL
SEQ ID NO22
AVRNALAGGL
SEQ ID NO23
SEPGSPRSAY
SEQ ID NO24
VETLRSAVEY
SEQ ID NO25
IRALQRLLA
SEQ ID NO26
LRPQAVRPS
SEQ ID NO27
LRQHVPHGG
SEQ ID NO28
LGFQALRQH
SEQ ID NO29
VRNALAGGL
SEQ ID NO30
YIRALQRLL
SEQ ID NO31
LVNLGFQAL
SEQ ID NO32
VEYIRALQR
SEQ ID NO33
LLRCSRRRR
<110>史密絲克萊恩比徹姆生物有限公司
(SmithKline Beecham Biologicals s.a.)
<120>新化合物
<130>BC45300
<160>33
<170>FastSEQ for Windows Version 3.0
<210>1
<211>1791
<212>DNA
<213>人類
<400>1
gtaccttgct ttgggggcgc actaagtacc tgccgggagc agggggcgca ccgggaactc 60
gcagatttcg ccagttgggc gcactgggga tctgtggact gcgtccgggg gatgggctag 120
ggggacatgc gcacgctttg ggccttacag aatgtgatcg cgcgaggggg agggcgaagc 180
gtggcgggag ggcgaggcga aggaaggagg gcgtgagaaa ggcgacggcg gcggcgcgga 240
ggagggttat ctatacattt aaaaaccagc cgcctgcgcc gcgcctgcgg agacctggga 300
gagtccggcc gcacgcgcgg gacacgagcg tcccacgctc octggcgcgt acggcctgcc 360
accactaggc ctcctatccc cgggctccag acgacctagg acgcgtgccc tggggagttg 420
cctggcggcg ccgtgccaga agcccccttg gggcgccaca gttttccccg tcgcctccgg 480
ttcctctgcc tgcaccttcc tgcggcgcgc cgggacctgg agcgggcggg tggatgcagg 540
cgcgatggac ggcggcacac tgcccaggtc cgcgccccct gcgccccccg tccctgtcgg 600
ctgcgctgcc cggcggagac ccgcgtcccc ggaactgttg cgctgcagcc ggcggcggcg 660
accggccacc gcagagaccg gaggcggcgc agcggccgta gcgcggcgca atgagcgcga 720
gcgcaaccgc gtgaagctgg tgaacttggg cttccaggcg ctgcggcagc acgtgccgca 780
cggcggcgcc agcaagaagc tgagcaaggt ggagacgctg cgctcagccg tggagtacat 840
ccgcgcgctg cagcgcctgc tggccgagca cgacgccgtg cgcaacgcgc tggcgggagg 900
gctgaggccg caggccgtgc ggccgtctgc gccccgcggg ccgccaggga ccaccccggt 960
cgccgcctcg ccctcccgcg cttcttcgtc cccgggccgc gggggcagct cggagcccgg1020
ctccccgcgt tccgcctact cgtcggacga cagcggctgc gaaggcgcgc tgagtcctgc1080
ggagcgcgag ctactcgact tctccagctg gttagggggc tactgagcgc cctcgaccta1140
tgagcctcag ccccggaagc cgagcgagcg gccggcgcgc tcatcgccgg ggagcccgcc1200
aggtggaccg gcccgcgctc cgcccccagc gagccgggga cccacccacc accccccgca1260
ccgccgacgc cgcctcgttc gtccggccca gcctgaccaa tgccgcggtg gaaacgggct1320
tggagctggc cccataaggg ctggcggctt cctccgacgc cgcccctccc cacagcttct1380
cgactgcagt ggggcggggg gcaccaacac ttggagattt ttccggaggg gagaggattt1440
tctaagggca cagagaatcc attttctaca cattaacttg agctgctgga gggacactgc1500
tggcaaacgg agacctattt ttgtacaaag aacccttgac ctggggcgta ataaagatga1560
cctggacccc tgcccccact atctggagtt ttccatgctg gccaagatct ggacacgagc1620
agtccctgag gggcggggtc cctggcgtga ggcccccgtg acagcccacc ctggggtggg1680
tttgtgggca ctgctgctct gctagggaga agcctgtgtg gggcacacct cttcaaggga1740
gcgtgaactt tataaataaa tcagttctgt ttaaaaaaaa aaaaaaaaaa a 1791
<210>2
<211>193
<212>PRT
<213>人類
<400>2
Met Asp Gly Gly Thr Leu Pro Arg Ser Ala Pro Pro Ala Pro Pro Val
1 5 10 15
Pro Val Gly Cys Ala Ala Arg Arg Arg Pro Ala Ser Pro Glu Leu Leu
20 25 30
Arg Cys Ser Arg Arg Arg Arg Pro Ala Thr Ala Glu Thr Gly Gly Gly
35 40 45
Ala Ala Ala Val Ala Arg Arg Asn Glu Arg Glu Arg Asn Arg Val Lys
50 55 60
Leu Val Asn Leu Gly Phe Gln Ala Leu Arg Gln His Val Pro His Gly
65 70 75 80
Gly Ala Ser Lys Lys Leu Ser Lys Val Glu Thr Leu Arg Ser Ala Val
85 90 95
Glu Tyr Ile Arg Ala Leu Gln Arg Leu Leu Ala Glu His Asp Ala Val
100 105 110
Arg Asn Ala Leu Ala Gly Gly Leu Arg Pro Gln Ala Val Arg Pro Ser
115 120 125
Ala Pro Arg Gly Pro Pro Gly Thr Thr Pro Val Ala Ala Ser Pro Ser
130 135 140
Arg Ala Ser Ser Ser Pro Gly Arg Gly Gly Ser Ser Glu Pro Gly Ser
145 150 155 160
Pro Arg Ser Ala Tyr Ser Ser Asp Asp Ser Gly Cys Glu Gly Ala Leu
165 170 175
Ser Pro Ala Glu Arg Glu Leu Leu Asp Phe Ser Ser Trp Leu Gly Gly
180 185 190
Tyr
<210>3
<211>262
<212>PRT
<213>人類
<400>3
Met Ser Ala Pro Ala Ala Arg Ser Ala Ser Gly Ala Glu Ala His Arg
1 5 10 15
Ser Arg Ala Leu Ser Ser Pro Leu Thr Ser Trp Arg Ser Arg Val Ala
20 25 30
Arg Ala Pro Gln Asp Ser Ala Arg Leu Arg Ser Arg Cys Arg Pro Thr
35 40 45
Ser Arg Arg Asn Ala Gly Ser Arg Ala Pro Ser Cys Pro Arg Gly Pro
50 55 60
Gly Thr Lys Lys Arg Gly Arg Ala Arg Arg Arg Pro Gly Trp Ser Leu
65 70 75 80
Ala Ala Arg Gly Ala Gln Thr Ala Ala Arg Pro Ala Ala Ser Ala Leu
85 90 95
Pro Pro Ala Arg Cys Ala Arg Arg Arg Ala Arg Pro Ala Gly Ala Ala
100 105 110
Ala Arg Gly Cys Thr Pro Arg Leu Ser Ala Ala Ser Pro Pro Cys Ser
115 120 125
Ala Ser Cys Trp Arg Arg Arg Ala Ala Arg Ala Ala Ala Ala Pro Gly
130 135 140
Ser Pro Ser Ser Pro Ala Ser Arg Gly Cys Ala Arg Ala His Cys Ala
145 150 155 160
Ala Leu Arg Pro Leu Arg Arg Leu Arg Ser Leu Arg Trp Pro Val Ala
165 170 175
Ala Ala Gly Cys Ser Ala Thr Val Pro Gly Thr Arg Val Ser Ala Gly
180 185 190
Gln Arg Ser Arg Gln Gly Arg Gly Ala Gln Gly Ala Arg Thr Trp Ala
195 200 205
Val Cys Arg Arg Pro Ser Arg Leu His Pro Pro Ala Arg Ser Arg Ser
210 215 220
Arg Arg Ala Ala Gly Arg Cys Arg Gln Arg Asn Arg Arg Arg Arg Gly
225 230 235 240
Lys Leu Trp Arg Pro Lys Gly Ala Ser Gly Thr Ala Pro Pro Gly Asn
245 250 255
Ser Pro Gly His Ala Ser
260
<210>4
<211>1830
<212>DNA
<213>人類
<400>4
gtaccttgct ttgggggcgc actaagtacc tgccgggagc agggggcgca ccgggaactc 60
gcagatttcg ccagttgggc gcactgggga tctgtggact gcgtccgggg gatgggctag 120
ggggacatgc gcacgctttg ggccttacag aatgtgatcg cgccgagggg gagggccgaa 180
gcgtggcggg agggcgaggc gaaggaagga gggcgtgaga aaggcgacgg cggcggcgcg 240
gaggagggtt atctatacat ttaaaaacca gccgcctgcg ccgcgcctgc ggagacctgg 300
gagagtccgg ccgcacgcgc gggacacgag cgtcccacgc tccctggcgc gtacggcctg 360
ccaccactag gcctcctatc cccgggctcc agacgaccta ggacgcgtgc cctggggagt 420
tgcctggcgg cgccgtgcca gaagccccct tggggcgcca cagttttccc cgtcgcctcc 480
ggttcctctg cctgcacctt cctgcggcgc gccgggacct ggagcgggcg ggtggatgca 540
ggcgcgatgg acggcggcac actgcccagg tccgcgcccc ctgcgccccc cgtccctgtc 600
ggctgcgctg cccggcggag acccgcgtcc ccggaactgt tgcgctgcag ccggcggcgg 660
cgaccggcca ccgcagagac cggaggcggc gcagcggccg tagcgcggcg caatgagcgc 720
gagcgcaacc gcgtgaagct ggtgaacttg ggcttccagg cgctgcggca gcacgtgccg 780
cacggcggcg ccagcaagaa gctgagcaag gtggagacgc tgcgctcagc cgtggagtac 840
atccgcgcgc tgcagcgcct gctggccgag cacgacgccg tgcgcaacgc gctggcggga 900
gggctgaggc cgcaggccgt gcggccgtct gcgccccgcg ggccgccagg gaccaccccg 960
gtcgccgcct cgccctcccg cgcttcttcg tccccgggcc gcgggggcag ctcggagccc1020
ggctccccgc gttccgccta ctcgtcggac gacagcggct gcgaaggcgc gctgagtcct1080
gcggagcgcg agctactcga cttctccagc tggttagggg gctactgagc gccctcgacc1140
taataagcct caagccccgg aaacccgagc gaacgggccg gcgcgcttca tcgccgggga1200
agcccgccaa ggtggaccgg gcccgcgctc cgcccccagc gagccgggga cccacccacc1260
accccccgca ccgccgacgc cgcctcgttc gtccggccca gcctgaccaa tgccgcggtg1320
gaaacgggct tggagctggc cccataaggg ctggcggctt cctccgacgc cgcccctccc1380
cacagcttct cgactgcagt ggggcggggg gcaccaacac ttggagattt ttccggaggg1440
gagaggattt tctaagggca cagagaatcc attttctaca cattaacttg agctgctgga1500
gggacactgc tggcaaacgg agacctattt ttgtacaaag aacccttgac ctggggcgta1560
ataaagatga cctggacccc tgcccccact atctggagtt ttccatgctg gccaagatct1620
ggacacgagc agtccctgag gggcggggtc cctggcgtga ggcccccgtg acagcccacc1680
ctggggtggg tttgtgggca ctgctgctct gctagggaga agcctgtgtg gggcacacct1740
cttcaaggga gcgtgaactt tataaataaa tcagttctgt ttaaaaaaaa aaaaaaaaaa1800
aaaaccgagg gggggcccgg agccaacaaa 1830
<210>5
<211>587
<212>DNA
<213>人類
<400>5
ggtaaacaga actgatttat ttataaagtt cacgctccct tgaagaggtg tgccccacac 60
aggcttctcc ctagcagagc agcagtgccc acaaacccac cccagggtgg gctgtcacgg 120
gggcctcacg ccagggaccc cgcccctcag ggactgctcg tgtccagatc ttggccagca 180
tggaaaactc cagatagtgg gggcaggggt ccaggtcatc tttattacgc cccaggtcaa 240
gggttctttg tacaaaaata ggtctccgtt tgccagcagt gtccctccag cagctcaagt 300
taatgtgtag aaaatggatt ctctgtgccc ttagaaaatc ctctcccctc cggaaaaatc 360
tccaagtgtt ggtgcccccc gccccactgc agtcgagaag ctgtggggag gggcggcgtc 420
ggaggaagcc gcagcccatt atggggccag ctccaagccc gtttccaccg cggcattggt 480
caggctgggc ggacgaacga ggcggcgtcg gcggtgcggg gggtggtggg tgggtccccg 540
gctcgctggg ggcggagcag cgggccggtc cacctggcgg gctcccc 587
<210>6
<211>1791
<212>DNA
<213>人類
<400>6
tttttttttt ttttttttta aacagaactg atttatttat aaagttcacg ctcccttgaa 60
gaggtgtgcc ccacacaggc ttctccctag cagagcagca gtgcccacaa acccacccca 120
gggtgggctg tcacgggggc ctcacgccag ggaccccgcc cctcagggac tgctcgtgtc 180
cagatcttgg ccagcatgga aaactccaga tagtgggggc aggggtccag gtcatcttta 240
ttacgcccca ggtcaagggt tctttgtaca aaaataggtc tccgtttgcc agcagtgtcc 300
ctccagcagc tcaagttaat gtgtagaaaa tggattctct gtgcccttag aaaatcctct 360
cccctccgga aaaatctcca agtgttggtg ccccccgccc cactgcagtc gagaagctgt 420
ggggaggggc ggcgtcggag gaagccgcca gcccttatgg ggccagctcc aagcccgttt 480
ccaccgcggc attggtcagg ctgggccgga cgaacgaggc ggcgtcggcg gtgcgggggg 540
tggtgggtgg gtccccggct cgctgggggc ggagcgcggg ccggtccacc tggcgggctc 600
cccggcgatg agcgcgccgg ccgctcgctc ggcttccggg gctgaggctc ataggtcgag 660
ggcgctcagt agccccctaa ccagctggag aagtcgagta gctcgcgctc cgcaggactc 720
agcgcgcctt cgcagccgct gtcgtccgac gagtaggcgg aacgcgggga gccgggctcc 780
gagctgcccc cgcggcccgg ggacgaagaa gcgcgggagg gcgaggcggc gaccggggtg 840
gtccctggcg gcccgcgggg cgcagacggc cgcacggcct gcggcctcag ccctcccgcc 900
agcgcgttgc gcacggcgtc gtgctcggcc agcaggcgct gcagcgcgcg gatgtactcc 960
acggctgagc gcagcgtctc caccttgctc agcttcttgc tggcgccgcc gtgcggcacg1020
tgctgccgca gcgcctggaa gcccaagttc accagcttca cgcggttgcg ctcgcgctca1080
ttgcgccgcg ctacggccgc tgcgccgcct ccggtctctg cggtggccgg tcgccgccgc1140
cggctgcagc gcaacagttc cggggacgcg ggtctccgcc gggcagcgca gccgacaggg1200
acggggggcg cagggggcgc ggacctgggc agtgtgccgc cgtccatcgc gcctgcatcc1260
acccgcccgc tccaggtccc ggcgcgccgc aggaaggtgc aggcagagga accggaggcg1320
acggggaaaa ctgtggcgcc ccaagggggc ttctggcacg gcgccgccag gcaactcccc1380
agggcacgcg tcctaggtcg tctggagccc ggggatagga ggcctagtgg tggcaggccg1440
tacgcgccag ggagcgtggg acgctcgtgt cccgcgcgtg cggccggact ctcccaggtc1500
tccgcaggcg cggcgcaggc ggctggtttt taaatgtata gataaccctc ctccgcgccg1560
ccgccgtcgc ctttctcacg ccctccttcc ttcgcctcgc cctcccgcca cgcttcgccc1620
tccccctcgc gcgatcacat tctgtaaggc ccaaagcgtg cgcatgtccc cctagcccat1680
cccccggacg cagtccacag atccccagtg cgcccaactg gcgaaatctg cgagttcccg1740
gtgcgccccc tgctcccggc aggtacttag tgcgccccca aagcaaggta c 1791
<210>7
<211>361
<212>PRT
<213>人類
<400>7
Met Cys Arg Lys Trp Ile Leu Cys Ala Leu Arg Lys Ser Ser Pro Leu
1 5 10 15
Arg Lys Asn Leu Gln Val Leu Val Pro Pro Ala Pro Leu Gln Ser Arg
20 25 30
Ser Cys Gly Glu Gly Arg Arg Arg Arg Lys Pro Pro Ala Leu Met Gly
35 40 45
Pro Ala Pro Ser Pro Phe Pro Pro Arg His Trp Ser Gly Trp Ala Gly
50 55 60
Arg Thr Arg Arg Arg Arg Arg Cys Gly Gly Trp Trp Val Gly Pro Arg
65 70 75 80
Leu Ala Gly Gly Gly Ala Arg Ala Arg Ser Thr Leu Ala Gly Phe Pro
85 90 95
Gly Asp Glu Ala Arg Arg Pro Val Arg Ser Gly Phe Arg Gly Leu Arg
100 105 110
Leu Ile Arg Ser Arg Ala Leu Ser Ser Pro Leu Thr Ser Trp Arg Ser
115 120 125
Arg Val Ala Arg Ala Pro Gln Asp Ser Ala Arg Leu Arg Ser Arg Cys
130 135 140
Arg Pro Thr Ser Arg Arg Asn Ala Gly Ser Arg Ala Pro Ser Cys Pro
145 150 155 160
Arg Gly Pro Gly Thr Lys Lys Arg Gly Arg Ala Arg Arg Arg Pro Gly
165 170 175
Trp Ser Leu Ala Ala Arg Gly Ala Gln Thr Ala Ala Arg Pro Ala Ala
180 185 190
Ser Ala Leu Pro Pro Ala Arg Cys Ala Arg Arg Arg Ala Arg Pro Ala
195 200 205
Gly Ala Ala Ala Arg Gly Cys Thr Pro Arg Leu Ser Ala Ala Ser Pro
210 215 220
Pro Cys Ser Ala Ser Cys Trp Arg Arg Arg Ala Ala Arg Ala Ala Ala
225 230 235 240
Ala Pro Gly Ser Pro Ser Ser Pro Ala Ser Arg Gly Cys Ala Arg Ala
245 250 255
His Cys Ala Ala Leu Arg Pro Leu Arg Arg Leu Arg Ser Leu Arg Trp
260 265 270
Pro Val Ala Ala Ala Gly Cys Ser Ala Thr Val Pro Gly Thr Arg Val
275 280 285
Ser Ala Gly Gln Arg Ser Arg Gln Gly Arg Gly Ala Gln Gly Ala Arg
290 295 300
Thr Trp Ala Val Cys Arg Arg Pro Ser Arg Leu His Pro Pro Ala Arg
305 310 315 320
Ser Arg Ser Arg Arg Ala Ala Gly Arg Cys Arg Gln Arg Asn Arg Arg
325 330 335
Arg Arg Gly Lys Leu Trp Arg Pro Lys Gly Ala Ser Gly Thr Ala Pro
340 345 350
Pro Gly Asn Ser Pro Gly His Ala Ser
355 360
<210>8
<211>849
<212>DNA
<213>流感病毒和人類
<400>8
atggatccaa acactgtgtc aagctttcag gtagattgct ttctttggca tgtccgcaaa 60
cgagttgcag accaagaact aggtgatgcc ccattccttg atcggcttcg ccgagatcag 120
aaatccctaa gaggaagggg cagcaccctc ggtctggaca tcgagacagc cacacgtgct 180
ggaaagcaga tagtggagcg gattctgaaa gaagaatccg atgaggcact taaaatgacc 240
atggacggcg gcacactgcc caggtccgcg ccccctgcgc cccccgtccc tgtcggctgc 300
gctgcccggc ggagacccgc gtccccggaa ctgttgcgct gcagccggcg gcggcgaccg 360
gccaccgcag agaccggagg cggcgcagcg gccgtagcgc ggcgcaatga gcgcgagcgc 420
aaccgcgtga agctggtgaa cttgggcttc caggcgctgc ggcagcacgt gccgcacggc 480
ggcgccagca agaagctgag caaggtggag acgctgcgct cagccgtgga gtacatccgc 540
gcgctgcagc gcctgctggc cgagcacgac gccgtgcgca acgcgctggc gggagggctg 600
aggccgcagg ccgtgcggcc gtctgcgccc cgcgggccgc cagggaccac cccggtcgcc 660
gcctcgccct cccgcgcttc ttcgtccccg ggccgcgggg gcagctcgga gcccggctcc 720
ccgcgttccg cctactcgtc ggacgacagc ggctgcgaag gcgcgctgag tcctgcggag 780
cgcgagctac tcgacttctc cagctggtta gggggctaca ctagtggcca ccatcaccat 840
caccattaa 849
<210>9
<211>849
<212>DNA
<213>流感病毒和人類
<400>9
atggatccaa acactgtgtc aagctttcag gtagattgct ttctttggca tgtccgcaaa 60
cgagttgcag accaagaact aggtgatgcc ccattccttg atcggcttcg ccgagatcag 120
aaatccctaa gaggaagggg cagcaccctc ggtctggaca tcgagacagc cacacgtgct 180
ggaaagcaga tagtggagcg gattctgaaa gaagaatccg atgaggcact taaaatgacc 240
atggacggcg gcaccctgcc gcgttccgcg ccgccggcgc cgccagttcc ggttggctgc 300
gctgcccgtc gccgtcccgc gtccccggaa ctgctgcgct gcagccgtcg ccgtcgcccg 360
gccaccgcag agaccggagg cggcgcagcg gccgtagcgc ggcgcaatga gcgcgagcgc 420
aaccgcgtga agctggtgaa cttgggcttc caggcgctgc ggcagcacgt gccgcacggc 480
ggcgccagca agaagctgag caaggtggag acgctgcgct cagccgtgga gtacatccgc 540
gcgctgcagc gcctgctggc cgagcacgac gccgtgcgca acgcgctggc gggagggctg 600
aggccgcagg ccgtgcggcc gtctgcgccc cgcgggccgc cagggaccac cccggtcgcc 660
gcctcgccct cccgcgcttc ttcgtccccg ggccgcgggg gcagctcgga gcccggctcc 720
ccgcgttccg cctactcgtc ggacgacagc ggctgcgaag gcgcgctgag tcctgcggag 780
cgcgagctac tcgacttctc cagctggtta gggggctaca ctagtggcca ccatcaccat 840
caccattaa 849
<210>10
<211>282
<212>PRT
<213>流感病毒和人類
<400>10
Met Asp Pro Asn Thr Val Ser Ser Phe Gln Val Asp Cys Phe Leu Trp
1 5 10 15
His Val Arg Lys Arg Val Ala Asp Gln Glu Leu Gly Asp Ala Pro Phe
20 25 30
Leu Asp Arg Leu Arg Arg Asp Gln Lys Ser Leu Arg Gly Arg Gly Ser
35 40 45
Thr Leu Gly Leu Asp Ile Glu Thr Ala Thr Arg Ala Gly Lys Gln Ile
50 55 60
Val Glu Arg Ile Leu Lys Glu Glu Ser Asp Glu Ala Leu Lys Met Thr
65 70 75 80
Met Asp Gly Gly Thr Leu Pro Arg Ser Ala Pro Pro Ala Pro Pro Val
85 90 95
Pro Val Gly Cys Ala Ala Arg Arg Arg Pro Ala Ser Pro Glu Leu Leu
100 105 110
Arg Cys Ser Arg Arg Arg Arg Pro Ala Thr Ala Glu Thr Gly Gly Gly
115 120 125
Ala Ala Ala Val Ala Arg Arg Asn Glu Arg Glu Arg Asn Arg Val Lys
130 135 140
Leu Val Asn Leu Gly Phe Gln Ala Leu Arg Gln His Val Pro His Gly
145 150 155 160
Gly Ala Ser Lys Lys Leu Ser Lys Val Glu Thr Leu Arg Ser Ala Val
165 170 175
Glu Tyr Ile Arg Ala Leu Gln Arg Leu Leu Ala Glu His Asp Ala Val
180 185 190
Arg Asn Ala Leu Ala Gly Gly Leu Arg Pro Gln Ala Val Arg Pro Ser
195 200 205
Ala Pro Arg Gly Pro Pro Gly Thr Thr Pro Val Ala Ala Ser Pro Ser
210 215 220
Arg Ala Ser Ser Ser Pro Gly Arg Gly Gly Ser Ser Glu Pro Gly Ser
225 230 235 240
Pro Arg Ser Ala Tyr Ser Ser Asp Asp Ser Gly Cys Glu Gly Ala Leu
245 250 255
Ser Pro Ala Glu Arg Glu Leu Leu Asp Phe Ser Ser Trp Leu Gly Gly
260 265 270
Tyr Thr Ser Gly His His His His His His
275 280
<210>11
<211>193
<212>PRT
<213>人類
<400>11
Met Tyr Ser Thr Ala Glu Arg Ser Val Ser Thr Leu Leu Ser Phe Leu
1 5 10 15
Leu Ala Pro Pro Cys Gly Thr Cys Cys Arg Ser Ala Trp Lys Pro Lys
20 25 30
Phe Thr Ser Phe Thr Arg Leu Arg Ser Arg Ser Leu Arg Arg Ala Thr
35 40 45
Ala Ala Ala Pro Pro Pro Val Ser Ala Val Ala Gly Arg Arg Arg Arg
50 55 60
Leu Gln Arg Asn Ser Ser Gly Asp Ala Gly Leu Arg Arg Ala Ala Gln
65 70 75 80
Pro Thr Gly Thr Gly Gly Ala Gly Gly Ala Asp Leu Gly Ser Val Pro
85 90 95
Pro Ser Ile Ala Pro Ala Ser Thr Arg Pro Leu Gln Val Pro Ala Arg
100 105 110
Arg Arg Lys Val Gln Ala Glu Glu Pro Glu Ala Thr Gly Lys Thr Val
115 120 125
Ala Pro Gln Gly Gly Phe Trp His Gly Ala Ala Arg Gln Leu Pro Arg
130 135 140
Ala Arg Val Leu Gly Arg Leu Glu Pro Gly Asp Arg Arg Pro Ser Gly
145 150 155 160
Gly Arg Pro Tyr Ala Pro Gly Ser Val Gly Arg Ser Cys Pro Ala Arg
165 170 175
Ala Ala Gly Leu Ser Gln Val Ser Ala Gly Ala Ala Gln Ala Ala Gly
180 185 190
Phe
<210>12
<211>263
<212>PRT
<213>小鼠
<400>12
Met Glu Ala His Leu Asp Trp Tyr Gly Val Pro Gly Leu Gln Glu Ala
1 5 10 15
Ser Asp Ala Cys Pro Arg Glu Ser Cys Ser Ser Ala Leu Pro Glu Ala
20 25 30
Arg Glu Gly Ala Asn Val His Phe Pro Pro His Pro Val Pro Arg Glu
35 40 45
His Phe Ser Cys Ala Ala Pro Glu Leu Val Ala Gly Ala Gln Gly Leu
50 55 60
Asn Ala Ser Leu Met Asp Gly Gly Ala Leu Pro Arg Leu Met Pro Thr
65 70 75 80
Ser Ser Gly Val Ala Gly Ala Cys Ala Ala Arg Arg Arg Gln Ala Ser
85 90 95
Pro Glu Leu Leu Arg Cys Ser Arg Arg Arg Arg Ser Gly Ala Thr Glu
100 105 110
Ala Ser Ser Ser Ser Ala Ala Val Ala Arg Arg Asn Glu Arg Glu Arg
115 120 125
Asn Arg Val Lys Leu Val Asn Leu Gly Phe Gln Ala Leu Arg Gln His
130 135 140
Val Pro His Gly Gly Ala Asn Lys Lys Leu Ser Lys Val Glu Thr Leu
145 150 155 160
Arg Ser Ala Val Glu Tyr Ile Arg Ala Leu Gln Arg Leu Leu Ala Glu
165 170 175
His Asp Ala Val Arg Ala Ala Leu Ala Gly Gly Leu Leu Thr Pro Ala
180 185 190
Thr Pro Pro Ser Asp Glu Cys Ala Gln Pro Ser Ala Ser Pro Ala Ser
195 200 205
Ala Ser Leu Ser Cys Ala Ser Thr Ser Pro Ser Pro Asp Arg Leu Gly
210 215 220
Cys Ser Glu Pro Thr Ser Pro Arg Ser Ala Tyr Ser Ser Glu Glu Ser
225 230 235 240
Ser Cys Glu Gly Glu Leu Ser Pro Met Glu Gln Glu Leu Leu Asp Phe
245 250 255
Ser Ser Trp Leu Gly Gly Tyr
260
<210>13
<211>1051
<212>DNA
<213>小鼠
<400>13
gcccggagca tggaagcacg tcagctaggc catgaactgc acccgggagg ggtgggggtg 60
gaagcgcacg gtgtcagctt tgcagaatgt gtacaccaag gggagggcga ggcgaaggaa 120
ggagggcgta agaaaggagg cggtggcggg gcggaggaga ttatctatac tttttaaaaa 180
aaaggagcct cttagccgcg taaaggagac ttggggagcg cctgacagca cgcgcgggac 240
acgagagtac cacgcttccc tactcttttc agaccttgac tggtacgggg tcccaggact 300
gcaggaggcc agcgacgcgt gccctaggga gtcctgcagc agtgccctgc ctgaggcccg 360
tgaaggtgca aacgtccact tcccaccgca cccggttcct cgcgagcact tttcctgtgc 420
cgcaccagaa ctcgtagcag gggcccaggg gctgaatgca agcttgatgg acggcggcgc 480
gctgcccaga ctcatgccca cctcgtctgg agtcgctgga gcctgcgctg ctcggcggag 540
acaagcgtct ccggaattgc tgcgctgcag ccggcggcgg cgatctggag caaccgaggc 600
cagcagcagc tcggcgtccg tggcacgccg caatgagcgc gagcgcaacc gcgtaaagct 660
ggtaaacttg ggcttccagg cgctgcggca gcacgtgccg cacggcggcg ccaacaagaa 720
gctgagtaag gtggagacgc tgcgctccgc ggtagagtac attcgtgcgc tgcagcggct 780
gctcgcagag cacgacacgg tgcggccggn gctcgctggg gggctgttaa cacccgctac 840
tccgccgtcc gatgagtgca cgcagccctc tgcctcccct gccagcgggt ctctgtcctg 900
cgcctctacg tctccgtccc ggaccctggg ctgctctgag cctacctccc cgcgctccgc 960
ctactcgtcg gaggaaagca gctgcgaggg agagctaagc ccgatggagc aggagctgct1020
tgacttttcc agttggttag ggggctactg a 1051
<210>14
<211>260
<212>PRT
<213>大鼠
<400>14
Met Glu Ser His Phe Asn Trp Tyr Gly Val Pro Arg Leu Gln Lys Ala
1 5 10 15
Ser Asp Ala Cys Pro Arg Glu Ser Cys Ser Ser Ala Leu Pro Glu Ala
20 25 30
Arg Glu Gly Ala Asn Val His Phe Pro Pro His Pro Val Pro Arg Glu
35 40 45
His Phe Ser Cys Gly Ala Pro Lys Pro Val Ala Gly Ala Pro Ala Leu
50 55 60
Asn Ala Ser Leu Met Asp Gly Gly Ala Leu Pro Arg Leu Val Pro Thr
65 70 75 80
Ser Ser Gly Val Ala Gly Ala Cys Thr Ala Arg Arg Arg Pro Pro Ser
85 90 95
Pro Glu Leu Leu Arg Cys Ser Arg Arg Arg Arg Ser Gly Ala Thr Glu
100 105 110
Ala Ser Ser Ser Ser Ala Ala Val Ala Arg Arg Asn Glu Arg Glu Arg
115 120 125
Asn Arg Val Lys Leu Val Asn Leu Gly Phe Gln Ala Leu Arg Gln His
130 135 140
Val Pro His Gly Gly Ala Asn Lys Lys Leu Ser Lys Val Glu Thr Leu
145 150 155 160
Arg Ser Ala Val Glu Tyr Ile Arg Ala Leu Gln Arg Leu Leu Ala Glu
165 170 175
His Asp Ala Val Arg Ala Ala Leu Ser Gly Gly Leu Leu Thr Pro Ala
180 185 190
Thr Arg Pro Ser Asp Val Cys Thr Gln Pro Ser Ala Ser Pro Ala Ser
195 200 205
Ala Ser Leu Ser Cys Thr Ser Thr Ser Pro Asp Arg Leu Gly Cys Ser
210 215 220
Glu Pro Ala Ser Pro Arg Ser Ala Tyr Ser Ser Glu Asp Ser Ser Cys
225 230 235 240
Glu Gly Glu Thr Tyr Pro Met Gly Gln Met Phe Asp Phe Ser Asn Trp
245 250 255
Leu Gly Gly Tyr
260
<210>15
<211>1526
<212>DNA
<213>大鼠
<400>15
ttcacccggc tgcaagcgct aggtgtacgg agacctggca gctcttgggg cttaaggact60
gagcrccaga gccggtggag gttcctgtgg agtacattcg gaccctctca cagcccccga 120
gagtgcggga cgtgcggagc gcagttcggg atctgcactc gaggacttgt cgaggacgca 180
ttaagctaag catctgctcg gagcatggaa tcgcacttta actggtacgg ggtcccaagg 240
ctccagaagg ctagcgacgc gtgccctagg gaatcctgca gcagtgccct gcctgaggcc 300
cgtgaaggtg cgaacgtcca cttcccaccg cacccggttc ctcgcgagca cttttcctgt 360
ggcgcaccga aacccgtagc gggggccccg gcgctgaatg caagcttgat ggacggcggc 420
gcgctgccca gactcgtgcc cacctcgtct ggagtcgctg gagcctgcac tgctcggcgg 480
agacccccgt ccccggaact gcttcgctgc agccgacggc ggcgatcggg agcaaccgag 540
gccagcagca gctcggcggc cgtggcacgc cgcaatgagc gtgagcgcaa ccgcgtaaag 600
ctggtaaact tgggcttcca ggcgctgcgg cagcacgtgc cgcacggcgg cgccaacaag 660
aagctgagta aggtggagac gctgcgctcc gcggtagagt acatccgtgc gctgcagcgg 720
ctgctagcag agcacgacgc ggtgcgtgct gcgctctctg ggggtctatt aacacccgct 780
actcggccgt ccgatgtgtg cacgcagccc tccgcctccc ctgccagcgc gtctctgtcc 840
tgcacctcta catccccaga ccgcctaggc tgctccgagc ctgcctctcc gcgctccgcc 900
tactcgtcgg aggacagcag ctgcgaggga gagacttacc cgatggggca gatgtttgac 960
ttttccaatt ggttaggggg ctactgagca ccccacaccc ctaagctgcg tccctgggtg1020
tcccctggtg gacctacctg cgtttcttgc ccaggaaacc tgggcccatg ccttacccat1080
gctgtctagt gcagcctgac caaatgccaa gtactgacct ctgctcggcc tcaacgccgc1140
ggaatgacat cttccatctc ccagtccttg ccgaaccagg acttggaaat ttctcaggag1200
aaagaatttt acaatgacaa tctgcttttt atcaattaac ttgaactgct ggaggactct1260
gctgaaaata tgaagaatta tttttataca aaggatcctt aagcttggag cacaataaag1320
atgacctctg tctctcaccc ccactgtcta gaactttcca acctggccaa agtgtggacg1380
ggtcgggccc tgagggcaag atgcctggct gcacccttct tcctcttccg aagcctatcc1440
tgacgctgat gtttggccag tgtgggaacc ctgctattgc aaagtgtact attctataaa1500
agttgttttt cattggaaag gaattc 1526
<210>16
<211>10
<212>PRT
<213>人類
<400>16
Lys Leu Val Asn Leu Gly Phe Gln Ala Leu
1 5 10
<210>17
<211>9
<212>PRT
<213>人類
<400>17
Glu Leu Leu Asp Phe Ser Ser Trp Leu
1 5
<210>18
<211>9
<212>PRT
<213>人類
<400>18
Arg Leu Leu Ala Glu His Asp Ala Val
1 5
<210>19
<211>9
<212>PRT
<213>人類
<400>19
Lys Leu Val Asn Leu Gly Phe Gln Ala
1 5
<210>20
<211>9
<212>PRT
<213>人類
<400>20
Glu Tyr Ile Arg Ala Leu Gln Arg Leu
1 5
<210>21
<211>10
<212>PRT
<213>人類
<400>21
Glu Tyr Ile Arg Ala Leu Gln Arg Leu Leu
1 5 10
<210>22
<211>10
<212>PRT
<213>人類
<400>22
Ala Val Arg Asn Ala Leu Ala Gly Gly Leu
1 5 10
<210>23
<211>10
<212>PRT
<213>人類
<400>23
Ser Glu Pro Gly Ser Pro Arg Ser Ala Tyr
1 5 10
<210>24
<211>10
<212>PRT
<213>人類
<400>24
Val Glu Thr Leu Arg Ser Ala Val Glu Tyr
1 5 10
<210>25
<211>9
<212>PRT
<213>人類
<400>25
Ile Arg Ala Leu Gln Arg Leu Leu Ala
1 5
<210>26
<211>9
<212>PRT
<213>人類
<400>26
Leu Arg Pro Gln Ala Val Arg Pro Ser
1 5
<210>27
<211>9
<212>PRT
<213>人類
<400>27
Leu Arg Gln His Val Pro His Gly Gly
1 5
<210>28
<211>9
<212>PRT
<213>人類
<400>28
Leu Gly Phe Gln Ala Leu Arg Gln His
1 5
<210>29
<211>9
<212>PRT
<213>Human
<400>29
Val Arg Asn Ala Leu Ala Gly Gly Leu
1 5
<210>30
<211>9
<212>PRT
<213>人類
<400>30
Tyr Ile Arg Ala Leu Gln Arg Leu Leu
1 5
<210>31
<211>9
<212>PRT
<213>人類
<400>31
Leu Val Asn Leu Gly Phe Gln Ala Leu
1 5
<210>32
<211>9
<212>PRT
<213>人類
<400>32
Val Glu Tyr Ile Arg Ala Leu Gln Arg
1 5
<210>33
<211>9
<212>PRT
<213>人類
<400>33
Leu Leu Arg Cys Ser Arg Arg Arg Arg
1 權利要求
1.一種免疫原性組合物,所述組合物包含安全有效量的CASB7439多肽或其免疫原性片段以及藥學上可接受的載體,其中所述CASB7439多肽為SEQ ID NO2。
2.一種免疫原性組合物,所述組合物包含安全有效量的編碼CASB7439的多核苷酸或其片段以及藥學上可接受的載體,其中所述編碼CASB7439的多核苷酸為SEQ ID NO1的核苷酸545-1126的多肽編碼序列。
3.一種權利要求1或2的免疫原性組合物,所述組合物還包含TH-1誘導型佐劑。
4.一種權利要求3的免疫原性組合物,其中所述TH-1誘導型佐劑選自以下的佐劑3D-MPL、QS21、QS21和膽固醇的混合物、CpG寡核苷酸、或者兩種或兩種以上所述佐劑的混合物。
5.一種免疫原性組合物,所述組合物包含有效量的抗原呈遞細胞和藥學上的有效載體,所述抗原呈遞細胞通過在體外加載CASB7439多肽而被修飾,或者在體外經遺傳修飾以表達CASB7439多肽。
6.一種分離的多肽,所述多肽包含的一段氨基酸序列在SEQ IDNO2的全長上與SEQ ID NO2中所示氨基酸序列具有至少70%同一性。
7.一種權利要求6的分離的多肽,其中所述氨基酸序列與SEQ IDNO2具有至少95%同一性。
8.權利要求7的多肽,所述多肽包含SEQ ID NO2的氨基酸序列。
9.SEQ ID NO2的分離的多肽。
10.一種包含權利要求6-9中任一項的多肽的免疫原性片段的多肽,其中所述免疫原性片段的免疫原性活性與SEQ ID NO2的多肽的免疫原性活性基本上相同。
11.SEQ ID NO2的免疫原性片段,其中所述片段包含SEQ IDNO16至SEQ ID NO33中的一個或多個的序列。
12.一種權利要求6-11中任一項的多肽,其中所述多肽是一種較大融合蛋白的一部分。
13.一種權利要求6-11中任一項的多肽,所述多肽與一種載體蛋白化學綴合。
14.一種分離的多核苷酸,所述多核苷酸編碼權利要求6-12中任一項的多肽。
15.權利要求14的分離的多核苷酸,所述多核苷酸包含SEQ IDNO1的核苷酸545-1126的序列。
16.一種包含編碼一種多肽的核苷酸序列的分離的多核苷酸,所述多肽在SEQ ID NO2的全長上與SEQ ID NO2的氨基酸序列具有至少70%同一性。
17.一種權利要求14-16中任一項的分離的多核苷酸,其中所述同一性為至少95%。
18.一種分離的多核苷酸,所述多核苷酸選自
(a)包含編碼SEQ ID NO2的多肽的核苷酸序列的多核苷酸;
(b)SEQ ID NO1的核苷酸545-1126的多肽編碼序列。
19.一種表達載體或一種活的重組微生物,所述載體或微生物包含權利要求14-18中任一項的分離的多核苷酸。
20.一種宿主細胞,所述宿主細胞包含權利要求19的表達載體或權利要求14-18任一項的分離的多核苷酸。
21.一種生產權利要求1-5中任一項的免疫原性組合物的方法,所述方法包括將CASB7439多肽或編碼CASB7439多肽的多核苷酸與合適的佐劑、稀釋劑或其它藥學上可接受的載體混合。
22.一種生產權利要求6-12中任一項的一種多肽的方法,所述方法包括在足以生產所述多肽的條件下培養權利要求20的宿主細胞,然后從培養基中回收所述多肽。
23.一種權利要求6-13和14-18中任一項的多肽或多核苷酸的用途,所述多肽或多核苷酸用于生產免疫治療性治療患有或易患癌癥的患者的疫苗。
24.一種權利要求6-13和14-18中任一項的多肽或多核苷酸的用途,所述多肽或多核苷酸用于生產免疫治療性治療患有或易患結腸癌或其它結腸相關腫瘤或疾病的患者的疫苗。
25.一種免疫專一性抗體,所述抗體對于權利要求6-13中任一項要求保護的多肽或免疫學片段具有免疫專一性。
26.一種篩選方法,所述方法用以鑒定刺激或抑制權利要求6-13中任一項的多肽的功能的化合物,所述方法包括選自以下的一種方法
(a)利用直接或間接結合候選化合物的標記,測定所述候選化合物與所述多肽(或與攜帶所述多肽的細胞或細胞膜)或與所述多肽融合蛋白的結合;
(b)在標記競爭物的存在下,測定候選化合物與所述多肽(或與攜帶所述多肽的細胞或細胞膜)或與所述多肽融合蛋白的結合;
(c)使用適合于攜帶所述多肽的細胞或細胞膜的檢測系統,測試所述候選化合物是否引起由于所述多肽的活化或抑制而產生的信號;
(d)將候選化合物與含權利要求6-13中任一項的多肽的溶液混合,形成混合物,然后測定所述混合物中所述多肽的活性,并且將所述混合物的活性與標準品的活性進行比較;或
(e)采用例如ELISA測定,檢測候選化合物對在細胞中編碼所述多肽的mRNA和所述多肽的產生的影響。
27.一種針對權利要求6-13的多肽的激動劑或拮抗劑。
28.一種用于治療的化合物,所述化合物是
(a)一種針對權利要求6-13的多肽的激動劑或拮抗劑;
(b)權利要求14-18的分離的多核苷酸;或
(c)一種調節編碼權利要求6-13中任一項的多肽的核苷酸序列的表達的核酸分子。
29.一種診斷方法,所述方法用于診斷受試者與權利要求6-13中任一項的多肽的表達或活性有關的疾病或對所述疾病的易感性,所述方法包括分析得自所述受試者的樣品中的所述多肽的存在或含量。
30.一種診斷方法,所述方法用于診斷受試者與權利要求14-18中任一項的多核苷酸的表達或活性有關的疾病或對所述疾病的易感性,所述方法包括分析得自所述受試者的樣品中的所述多核苷酸的存在或含量。
31.一種診斷方法,所述方法用于診斷受試者與權利要求6-13中任一項的多肽的表達或活性有關的結腸直腸癌的存在或對所述結腸直腸癌的易感性,所述方法包括分析得自所述受試者的樣品中的所述多肽的存在或含量。
32.一種診斷方法,所述方法用于診斷受試者與權利要求14-18中任一項的多核苷酸的表達或活性有關的結腸直腸癌的存在或對所述結腸直腸癌的易感性,所述方法包括分析得自所述受試者的樣品中的所述多核苷酸的存在或含量。
全文摘要
本發明公開了CASB7439多肽和多核苷酸、包含它們的免疫原性組合物以及通過重組技術生產這樣的多肽的方法。也公開了CASB7439多肽和多核苷酸在診斷學上的使用方法以及用于預防性和治療性治療癌癥,尤其是結腸直腸癌、自身免疫病和相關病癥的疫苗。
文檔編號C07K17/00GK1840178SQ200610068150
公開日2006年10月4日 申請日期2001年2月16日 優先權日2000年2月23日
發明者T·E·V·卡貝宗-斯爾瓦, J·-P·卡薩特, T·科徹, S·R·J·-T·高利斯, Y 德巴索爾斯 C·維納爾斯 申請人:史密絲克萊恩比徹姆生物有限公司