專利名稱:基因表達抑制相關性dna分子和新的蛋白質的制作方法
技術領域:
本發明涉及與基因表達的抑制有關的DNA分子和新的蛋白質。特別是,本發明涉及一種來源于I型人類T細胞白血病病毒的DNA分子和一種含有該DNA分子的質粒,該DNA分子具有基因表達抑制的功能。本發明還涉及一種蛋白質,其與I型人類T細胞白血病病毒基因LTRU5區上的轉錄抑制區結合;一種編碼該蛋白質的結構基因;一種含有該基因的表達載體;一種導入了該表達載體的轉化體;以及一種利用上述轉化體的方法,該方法用于制備與I型人類T細胞白血病病毒基因LTRU5區上轉錄抑制區結合的蛋白質。此外,本發明還涉及一種含該蛋白質的抗病毒制劑和一種以該蛋白質表達作為指標的癌癥檢測方法。
背景技術:
1980年,發現了人類第一種逆轉錄病毒,即I型人類T細胞白血病病毒(HTLV-I)。研究結果顯示,該病毒感染引起多種疾病,例如成人T細胞白血病(ATL)、HTLV-I相關性脊髓病(HAM)和熱帶痙攣性下肢輕癱(TSP);研究結果還顯示,此病毒感染人體后經過長時間才出現疾病的癥狀,平均潛伏期約40~50年。然而,對于其隱性感染和其導致疾病發作的機理知之甚少。
如同動物逆轉錄病毒,HTLV-I基因含gag區、pol區和env區三個區,但除此之外,HTLV-I基因還有一個tax/rex區。tax/rex區位于env區的下游,被認為在病毒基因的表達和ATL的發病中起重要作用。HTLV-I基因的初級轉錄本需經兩次剪接才產生tax/rex mRNA,該mRNA含有兩個重疊的開放閱讀框。其中一個開放閱讀框翻譯后產生稱之為Tax的蛋白質,分子量為40kD,其除作用于細胞多種基因的啟動子而激活轉錄外,還作用于病毒本身的LTR。另一個開放閱讀框經翻譯后產生27kD稱為Rex的蛋白質,其控制轉錄后細胞核內病毒RNA的處理,并對未經剪接的mRNA轉運至細胞漿起促進作用。
在編碼Rex蛋白的同一個開放閱讀框內,還有另一個起始密碼子,從此密碼子起始翻譯,產生一種21kD的蛋白質,稱之為p21X。發明者發現,p21X是由p21XmRNA翻譯而來,而p21XmRNA是HTLV-I基因轉錄時只經一次剪接產生的mRNA,沒有第二外顯子(Orita等,《FEBS通訊》(FEBS Lett.),295卷,127頁-134頁(1991))。然而,該蛋白質的功能不明。發明者進一步發現,p21xmRNA表達于HTLV-I感染細胞系中的一種突變的前病毒,該前病毒在包括gag、pol和env區的一個廣泛區域內有缺失(Orita等,《核酸研究》(NucleicAcids Res.),21卷,3799頁-3807頁(1993))。此外,發明者還發現,p21XmRNA也表達于HTLV-I感染病人的外周血淋巴細胞中的上述突變型前病毒。另一方面,已知來自完整前病毒的tax/rexmRNA卻罕見表達于HTLV-I感染病人的外周血,而且只有用超敏感的逆轉錄-聚合酶鏈式反應檢測法才能在體內檢測到。然而,一旦將HTLV-I感染病人外周血淋巴細胞轉至體外培養體系,其表達則增高而易于檢測(Kiyodawa等,《美國國立科學院進展》(Proc.Natl.Acad.Sci.USA.),82卷,8359頁-8363頁(1985))。而且,也已經發現,p21X mRNA在前述的HTLV-I感染病人外周血淋巴細胞中的表達,無論是培養前還是培養后,均處于相同的水平(Orita等,《普通病毒學雜志》(J.Gen.Virol.),73卷,2283頁-2289頁(1992))。因此,可以認為,在體內p21XmRNA的表達不受抑制,而tax/rex mRNA的表達被抑制。
據認為,HTLV-I和另一種RNA病毒即人類免疫缺陷病毒(HIV)通過將DNA序列內的剪接信號變為非最佳信號而使剪接反應延遲,從而為HTLV-I的Rex蛋白或HIV的Rev蛋白抑制剪接反應提供時間(Chang,D.D.和Sharp,P.A.《科學》(Science),249卷,614頁-615頁(1990))。據認為,Rex蛋白和Rev蛋白只有表達量足夠并聚集在細胞核內時,才能發生聚合,之后,它們才能發揮功能,即促使含有RXE(Rex反應元件)或RRE(Rev反應元件)的病毒mRNA剪接的抑制和加速mRNA向細胞漿的轉運,從而觸發病毒復制(結構蛋白的表達)(Inoue等,《美國國立科學院進展》(Proc.Natl.Acad.Sci.USA),84卷,3653頁-3657頁(1987);Hidaka等,《EMBO雜志》(EMBOJ.),7卷,519頁-523頁(1988);Seiki等,《美國國立科學院進展》(Proc.Natl.Acad.Sci.USA.),85卷,7124頁-7128頁(1988);和Hanly等,《基因進展(Genes Dev.),3卷,1534頁-1544頁(1989))。
以上描述表明,作為HTLV-I特征的pX區經翻譯產生至少兩種調控因子,即Tax和Rex蛋白,并且這些因子為HTLV-I的復制所必需。Tax是一種轉錄激活因子,其作用于LTR(長末端重復序列),也作用于多種細胞基因使它們激活。Tax還具有使某些類型培養細胞發生轉化的能力。因此提示Tax有參與HTLV-I所致細胞癌變過程的可能性。
已知在非顯性感染期HTLV-I基因表達量很低,甚至在ATL發病后其表達量仍很低。因此,為了闡明HTLV-I隱性感染的機理,研究病毒基因表達抑制的機理顯得很重要。已知HTLV-I基因的表達控制主要由HTLV-I的LTR實施。LTR區可進一步分為三個區,稱為U3、R和U5。U3區除含有細胞轉錄激活因子CREB、ETS、APl等作用的序列外,還有一個Tax作用的序列。R區已知含有YB-1結合序列,YB-1與之結合而激活轉錄過程(Kashanchi等,《病毒學雜志》(J.Virol.),68卷1期561頁-565頁(1994))。而且,R和U5區含有在轉錄水平或轉錄后水平對HTLV-I基因表達起抑制作用的一個區(Xu等,《分子細胞生物學》(Mol.Cell.Biol.),14卷8期5371頁-5383頁(1994);和Seiki等,《病毒學》(Virology),176卷81頁-86頁(1990))。此外,發明者最近發現一新的轉錄抑制序列(U5抑制性元件;U5RE),并報道有三種分子量分別為110kD、80kD和70kD的蛋白質能特異地與U5RE結合(Okumura等,《FEBS通訊》(FEBSLet.)356卷94頁-100頁(1994))。發明內容為了闡明I型人類T細胞白血病病毒的基因表面抑制機理,發明者對與表達抑制相關的基因序列和蛋白質進行了研究。
首先,發明者預測,具有病毒基因表達抑制作用的區域存在于I型人類T細胞白血病病毒(HTLV-I)的完整前病毒基因組某個區域中,但在表達p21X mRNA的突變型前病毒中該區域丟失。因此,發明者將病毒基因組的一部分DNA序列插入到一種質粒中并對其進行了研究,研究采用以CAT基因表達為指標的檢測系統。結果,發明者發現在pol區有兩個基因表達抑制性區域。
因此,根據本發明之一方面,提供了一種DNA分子,該DNA分子來源于I型人類T細胞白血病病毒、具有基因表達抑制的功能,該DNA分子存在于完整前病毒基因組中的一個區域,而該區域在表達p21XmRNA的突變型前病毒中缺失;本發明還提供了一種含有該DNA分子的質粒。
根據本發明,具有基因表達抑制功能的DNA分子包含一段至少400個鄰接核苷酸的DNA序列,該段DNA序列包含在序列表中1#序列2268位胞嘧啶~4080位胸腺嘧啶的DNA序列中;或者一段與該段DNA序列具有約59%或59%以上同源性的DNA序列。
在一個優選實施方案中,該DNA分子是一段至少400個鄰接核苷酸的DNA序列,該段DNA序列包含在序列表中1#序列2268位胞嘧啶~4080位胸腺嘧啶的DNA序列中;或者是一段與該段DNA序列具有約59%或59%以上同源性的DNA序列。
在一個優選實施方案中,該DNA分子包含序列表中1#序列2268位胞嘧啶~3182位鳥嘌呤的一段DNA序列,或者一段與該段DNA序列具有約59%或59%以上同源性的DNA序列。
在一個優選實施方案中,該DNA分子包含序列表中1#序列3368位腺嘌呤~3780位腺嘌呤的一段DNA序列,或者一段與該段DNA序列具有約59%或59%以上同源性的DNA序列。
在一個優選實施方案中,該DNA分子包含序列表中1#序列3165位腺嘌呤~4080位胸腺嘧啶的一段DNA序列,或者,一段與該段DNA序列具有約59%或59%以上同源性的DNA序列。
根據本發明的一種質粒包含一段在宿主細胞內具有活性的啟動子序列,上述DNA分子之一以及RRE或RXE序列。
在一個優選實施方案中,該質粒還包含一治療基因序列。
在一個優選實施方案中,該質粒包括一啟動子序列,其能增高病毒感染細胞中的表達效率。
在一個優選實施方案中,該質粒中的啟動子是LTR。
在一個優選實施方案中,該質粒中的治療基因序列是對宿主細胞具有毒性的一段基因序列或能夠阻止病毒復制的一段基因序列。
根據本發明的一種DNA分子可用于抑制基因的表達或治療病毒感染性疾病。
在一個優選實施方案中,病毒感染性疾病是人類T細胞白血病和HIV感染性疾病,特別是愛滋病。
發明者進一步對與U5RE特異結合的蛋白質進行了多項研究,結果,分離到編碼其中一種蛋白質的新的cDNA。發明者利用大腸桿菌使此基因表達,發現其表達產物是一種蛋白質,該蛋白質含有一種DNA結合蛋白的Kruppel型鋅指結構域和一種Kruppel型轉錄抑制因子共有的結構域,這些結構域據認為參與轉錄抑制過程。此外,發明者發現該蛋白質與U5RE結合,并且參與轉錄抑制過程;發明者將此蛋白質命名為TRP-1(轉錄抑制蛋白-1),至此完成了本發明。
因此,根據本發明之另一方面,提供了一種蛋白質,與現有的蛋白質不同,這種蛋白質能與U5RE特異性結合,U5RE存在于I型人類T細胞白血病病毒基因LTR的U5區。特別是,本發明提供了一種蛋白質,這種蛋白質含有一個Kruppel型轉錄抑制因子所共有的結構域和四個半Kruppel型鋅指結構域。根據本發明之又一方面,本發明提供了一種編碼該蛋白質的結構基因;一種含有該基因的表達載體;一種導入了該表達載體的轉化體;和一種利用上述轉化體的方法,該方法用于制備一種蛋白質,該蛋白質能與存在于I型人類T細胞白血病病毒基因LTRU5區中的轉錄抑制區結合。
根據本發明,與I型人類T細胞白血病病毒基因LTRU5區中轉錄抑制區結合的蛋白質(TRP-1)含有一個Kruppel型轉錄抑制因子所共有的結構域和四個半Kruppel型鋅指結構域。
在一個優選實施方案中,該蛋白質所含Kruppel型轉錄抑制因子共有的結構域是一段氨基酸序列,即序列表中15#序列196位上的纈氨酸~261位色氨酸,或與此序列相似的序列;而該蛋白質所含的四個半Kruppel型鋅指結構域是序列表中15#序列518位酪氨酸~648位組氨酸的一段氨基酸序列,或與此序列相似的一段序列。
在一個優選實施方案中,該蛋白質還包括序列表中15#序列154位亮氨酸~185位亮氨酸的一段氨基酸序列、序列表中15#序列403位脯氨酸~443位脯氨酸的一段氨基酸序列和序列表中15#序列470位精氨酸~503位甘氨酸的一段氨基酸序列,或者與這些氨基酸序列相似的序列。
在一個優選實施方案中,該蛋白質包括序列表中15#序列1位蛋氨酸~668位丙氨酸的一段氨基酸序列,或者與此序列相似的一段序列。
根據本發明的一種DNA分子編碼上述蛋白質之一。
在一個優選實施方案中,該DNA分子包括序列表中15#序列724位鳥嘌呤~921位鳥嘌呤的一段堿基序列,以及序列表中15#序列1690位胸腺嘧啶~2082位胞嘧啶的一段堿基序列。
在一個優選實施方案中,該DNA分子還包括序列表中15#序列598位胞嘧啶~693位鳥嘌呤的一段堿基序列,序列表中15#序列1345位胞嘧啶~1467位鳥嘌呤的一段堿基序列和序列表中15#序列1546位胞嘧啶~1647位鳥嘌呤的一段堿基序列。
在一個優選實施方案中,該DNA分子包括序列表中15#序列139位腺嘌呤~2202位胞嘧啶的一段堿基序列。
在一個優選實施方案中,該DNA分子包括序列表中15#序列1位胞嘧啶~3776位腺嘌呤的一段堿基序列。
根據本發明的一種表達載體,其含有上述DNA分子之一。
根據本發明的一種轉化體,其制備方法是將該表達載體導入宿主中。
在一個優選實施方案中,該宿主是大腸桿菌。
根據本發明的一種I型人類T細胞白血病病毒基因LTRU5區轉錄抑制區結合蛋白的制備方法,包括對上述轉化體進行培養和從培養液中回收所產生的蛋白質的步驟。
本發明還提供了一種含該蛋白質作為有效成分的抗病毒制劑。根據本發明,這種抗病毒制劑對HTLV-I,以及人類免疫缺陷病毒和巨細胞病毒均有效。
本發明還提供了一種癌癥檢測方法。根據本發明,這種方法利用該蛋白質的表達作為檢測指標。
附圖簡述
圖1(a)為HTLV-I基因組各區的示意圖。圖1(b)示質粒圖,質粒的構建方法為,將HTLV-I基因組的各區插入到pRC/CMV-CAT載體上編碼CAT基因區和牛生長激素多聚腺苷酸信號(BGHpA)之間。
圖2為HTLV-I基因組R1~R5五個區的DNA序列分別插入pRC/CMV-CAT質粒,將此質粒轉染HeLa細胞,對其CAT活性進行檢測的薄層層析圖。
圖3為HTLV-I基因組R6~R9及R21五個區的DNA序列分別插入pRC/CMV-CAT質粒,以此質粒轉染HeLa細胞,對其CAT活性進行檢測的薄層層析圖。
圖4示HTLV-I基因組R7~R9三個區的DNA序列分別插入pRC/CMV-CAT質粒,以此質粒轉染HeLa細胞,Northern印跡分析的結果。分析所用探針系以CAT基因為模板制備。
圖5為以質粒轉染HeLa細胞后檢測其CAT活性的薄層層析圖。質粒的構建方法是,先將HTLV-I基因組R7、R8、R21區的DNA序列分別插入pRC/CMV-CAT質粒,再在所插入DNA序列的3′端下游以正義(+)或反義(-)方向插入RXEs。
圖6示以質粒轉染HeLa細胞后的Northern印跡分析結果。質粒的構建方法是,先將HTLV-I基因組R7、R8、R21區的DNA序列分別插入pRC/CMV-CAT質粒,再在所插入DNA序列的3′端下游以正義(+)或反義(-)方向插入RXEs。分析所用探針系以CAT基因為模板制備。
圖7為轉染了質粒的HeLa細胞CAT活性曲線圖。質粒的構建方法是,對HTLV-I基因組R8區自5′端或3′端起進行缺失突變,將如此獲得的缺失突變區DNA序列分別插入pRC/CMV-CAT質粒。
圖8為轉染了質粒的HeLa細胞CAT活性薄層層析圖。質粒的構建方法是,將C413或N413以正義或反義方向插入pRC/CMV-CAT質粒。
圖9是一示意圖,示作為HIV感染性疾病(如愛滋病)基因治療的質粒的構成單位。
圖10是一示意圖,示本發明中的TRP-1蛋白的結構域。
圖11示本發明中的TRP-1蛋白鋅指結構域氨基酸序列中保守序列的比較。
圖12示本發明之TRP-1蛋白和Kid-1的KRAB-A及KRAB-B結構域氨基酸序列的比較。
圖13示通過凝膠遷移率改變試驗分析本發明之TRP-1蛋白結合特異性的電泳結果。TRP-1蛋白在大腸桿菌中表達。
圖14示本發明之TRP-1 mRNA在多種培養細胞中表達的Northern印跡分析電泳結果。
圖15示本發明之TRP-1 mRNA在多種培養細胞中表達的Northern印跡分析電泳結果。
圖16(A)和(B)示本發明之TRP-1 mRNA在各種組織中表達的Northern印跡分析電泳結果。
圖17示本發明之TRP-1蛋白的功能性分析結果。方法是以CAT試驗分析TRP-1蛋白對U5RE的作用。
實施本發明的最佳方式(I)定義本發明所用術語解釋如下。
“Kruppel型鋅指結構域”指的是蛋白質內部的一種結構區域,由多肽鏈在鋅原子周圍折疊形成。這種結構域一般見于DNA結合蛋白,被認為參與蛋白質和DNA之間的結合(Witzgall等,《分子細胞生物學》(Mol.Cell.Biol.),13卷3期1933頁-1942頁(1993);Constantinou-Deltas等,《基因學》(Cenomics),12卷3期581頁-589頁(1992);及Numoto等,《核酸研究》(Nucl.Acids.Res.),21卷16期3767頁-3775頁(1993))。例如,根據本發明的蛋白(TRP-1)含有四個半Kruppel型鋅指結構域,該蛋白質與I型人類T細胞白血病病毒基因LTR U5區內的轉錄抑制區(U5RE;U5抑制性元件)結合。
“Kruppel型轉錄抑制因子共有結構域”是指在Kruppel型轉錄抑制蛋白中通常見到的一種結構區域,據認為其參與DNA轉錄的抑制過程(Witzgall等,《美國國立科學院進展》(Proc.Natl.Acad.Sci.USA.),91卷1O期4514頁-4518頁(1994);及Margolin等,《美國國立科學院進展》(Proc.Natl.Acad.Sci.USA),91卷10期4509頁-4513頁(1994))。在本說明書中,此種結構域稱為KRAB-A、B結構域(Kruppel相關性盒-A、B結構域)。
與某一氨基酸序列或DNA序列“相似的序列”并非限定于任一特定序列,而是定義為本領域技術人員所知的替換、插入、缺失等修飾的一種序列,如此其編碼的蛋白質的功能或活性基本上處于相同的水平。或者,只要該蛋白質的功能或活性基本上處于相同的水平,其可以包含化學或生物化學修飾,或者非天然或衍生氨基酸或堿基。例如,優選,上述TRP-1蛋白與其天然型具有約50%或50%以上的相似性,或者約35%或35%以上的同源性。更優選,此TRP-1蛋白與其天然型具有約70%或70%以上的相似性,或者約50%或50%以上的同源性。更加優選,此TRP-1蛋白與其天然型具有約80%或80%以上的相似性,或者約65%或65%以上的同源性。其中,“相似性”是指一條相似序列內所含與參照序列相同的氨基酸的比率(%),這里,氨基酸分為以下A~E五個組,同一組內的氨基酸視為相同。A組丙氨酸、絲氨酸、蘇氨酸、脯氨酸和甘氨酸;B組天冬酰胺、天冬氨酸、谷氨酸和谷氨酰胺;C組組氨酸、精氨酸和賴氨酸;D組蛋氨酸、亮氨酸、異亮氨酸和纈氨酸;E組苯丙氨酸、酪氨酸和色氨酸。“同源性”是指一條相似序列內所含與參照序列相同的氨基酸的比率(%),這里,只有完全一致的氨基酸才視為相同。此外,DNA序列的“同源性”并非限定于任一特定序列,而是定義為本領域技術人員所知的替換、插入、缺失等修飾的一種序列,特別是,如此該DNA序列的功能如HTLV-I基因表達抑制功能基本上仍處于相同的水平。(II)可用于本發明的方法本領域技術人員所熟悉的方法,例如《分子克隆第二版》(Maniatis等,冷泉港實驗室,紐約(1989))一書中描述的那些方法,可作為常規的生物化學實驗程序和分子生物學實驗程序(DNA電泳、已經凝膠電泳分離的DNA回收方法、連接、宿主的轉化、重組宿主的培養、質粒DNA的制備、限制性酶對DNA的切割、DNA放射性標志等),應用于本發明的各步驟中。A.HTLV-I來源、具有基因表達抑制功能的DNA分子的研究(1)含HTLV-I基因組各區質粒的構建除ATL病人外周血白細胞外,一些HTLV-I感染細胞系如MT-1、MT-2、MT-4、TL-Su和H582也被用于本研究。這些經培養或未經培養細胞總RNA的提取采用酸性異硫氰酸胍-酚-氯仿抽提方法。在用隨機六核苷酸引物退火后,所抽提的RNA在含逆轉錄酶的體系中反應,如此制備出cDNA。
首先,用對應于所需區域合適的合成引物對,以HTLV-I基因組DNA作模板,通過大家熟知的PCR方法,即可制備含適當長度不同區域(如圖1(a)中所示R1等區)的DNA序列。為便于進一步亞克隆,在引物的5′端可以加上一個限制性酶切位點,如Not I酶切點、Hind III酶切點、Apa I酶切點、Xba I酶切點等。HTLV-I基因組上各區域可經化學或生物化學修飾,或者,含非天然或衍生堿基。本發明也提供了含有非天然存在DNA序列的重組DNA序列。本發明還提供了天然DNA序列的替代類型DNA序列,包括但并非僅限于那些通過缺失、插入或替換一個或多個堿基而獲得的DNA序列。優選,這些DNA序列與天然型具有59%或59%以上的同源性。
含經PCR方法擴增的各區的DNA序列,在通過凝膠分離回收及用限制性酶在所需切點酶切后,可插入到合適的表達載體中。這種表達載體已經含有或隨后可以插入一個啟動子、一段表達可被調控的基因序列等。優選表達載體可設計為含一個啟動子、一個HTLV-I的表達抑制區、RXE或RRE等。更優選,表達載體可設計為含一個啟動子、一段治療基因序列、一個HTLV-I的表達抑制區、RXE或RRE等。根據目的,這些DNA序列可插入到啟動子的5′端上游,或以反義方向插入到適當的位置。
表達載體方面,本發明使用了真核表達載體。由于哺乳動物細胞(如HeLa細胞、Jurkat細胞、COS細胞和CHO細胞)是作為轉染這些表達載體的優選細胞,因此利用了能在這些所選細胞系中表達的載體。哺乳動物細胞表達載體,如SV40來源的載體、牛乳頭狀瘤病毒載體、皰疹病毒載體、腺病毒載體、痘苗病毒載體和逆轉錄病毒載體均可應用。優選用逆轉錄病毒載體轉染Jurkat細胞。
啟動子方面,任一已知的啟動子均可應用。能增強病毒感染細胞中基因表達效率的啟動子為優選。例如,能在哺乳動物細胞中表達的啟動子包括巨細胞病毒即時早期啟動子(CMV)、病毒LTR(長末端重復序列;如HTLV-ILTR、Rous肉瘤病毒LTR、HIV-LTR)、SV40早期啟動子和單純皰疹病毒酪氨酸激酶啟動子。優選病毒LTR和CMV,最優選病毒LTR。
表達可被調控的基因序列方面,根據具體的目的,多種基因序列中的任何一種均可采用。例如,為了檢測HTLV-I基因組各區基因表達抑制活性的目的,可采用這樣一些基因,其序列編碼的蛋白質可被表達并易于檢測,如可用氯霉素乙酰轉移酶(CAT)基因、蟲熒光素酶(Luc)基因等。為了攻擊受感染細胞或阻止病毒復制的目的,可采用能在受感染細胞(受感染宿主的細胞)內發揮預期生物學活性的基因序列。在本領域內,對受感染細胞具有毒性或能阻止病毒復制的基因序列通稱為治療基因。對受感染細胞具有毒性的基因序列包括毒性基因,如白喉毒素A片段(DT-A)基因和單純皰疹胸苷激酶(HSTK)基因。能阻止病毒復制的基因序列包括諸如反義核酸、核酶、誘餌核酸和反式顯性突變體。
如下文所述,根據本發明,RXE和RRE是這樣一些區域,這些區域能抵消HTLV-I中基因表達抑制區的功能。Rex或Rev蛋白作用于這些區域,而Rex或Rev蛋白表達于HTLV-I或HIV-I感染的細胞中;在這些病毒感染細胞中,一種抵消機理可用于解釋基因表達抑制機理,因而使上述治療基因的表達成為可能。另外,RXE和RRE并非必定分別來源于HTLV-I和HIV-I,其也可以是來源于HTLV-II、HIV-II等的RXE、RRE等。
此外,可在載體中引入聚A信號使多聚腺苷酸加在mRNA的3′未端。例如,可用牛生長激素的聚A信號(BGHpA)或SV40的聚A信號(SV40pA)。
根據研究目的,如在HTLV-I基因組中尋找抑制性區域,也可從商品化的載體中選擇含上述序列如啟動子的表達載體。例如,為了在HTLV-I基因組中尋找抑制性區域,可用pRC/CMV-CAT載體(Invitrogen Inc.產品)。質粒的構建方法是,利用DNA連接試劑盒(Takara Shuzo Co.,Ltd.產品)將HTLV-I基因組的各區插入到這種pRC/CMV-CAT表達載體,如插入到圖1(b)所示Not I酶切位點處。所獲得的各質粒是否為預期的質粒,可通過用T7測序試劑盒(Pharmacia Biotech產品)檢查其堿基序列而得以證實。這些質粒的純化方法是,先以質粒轉化大腸桿菌JM109株并培養擴增,而后以諸如氯化銫密度梯度離心法進行質粒純化。(2)DNA轉染從上述(1)所獲得的各種質粒按以下方法轉染合適的細胞。例如,以上述質粒和含蟲熒光素酶(Luc)基因的pRC/CMV-Luc載體(CMV-Luc)的混合物轉染HeLa細胞或Jurkat細胞,可采用眾所周知的方法(如lipofectin(GIBCO BRL產品)方法)。轉染細胞在經培養后,制備細胞裂解物并離心收獲上清。由于CMV-Luc質粒使上清中存在的蟲熒光素酶活性,可采用已知的方法檢測(如運用Lumat model LB9501儀(Berthold產品)以PicaGene試劑盒(Toyo Ink Co.,Ltd產品)的檢測方法)。所得結果可用于標化轉染效率。(3)CAT試驗當以含氯霉素乙酰轉移酶基因的質粒進行轉染時,上述(2)中所獲得上清的CAT活性可用本領域眾所周知的方法檢測(Fordis等,《酶學方法》(Methods in Enzymology),151卷,382頁-397頁(1987))。例如,將14C標記的氯霉素和乙酰輔酶A加入上清中并孵育,之后,經乙酸乙酯抽提后,濃縮上清并點樣于薄層層析(TLC)板上。層析板在充滿含氯仿∶甲醇=95∶5的展層液的展層容器中展層,而后印至X光膠片上,印X光膠片的方法為將其緊貼顯像板1小時,顯像板與生物影像分析儀(Fujix Co.,Ltd.產品)連接。如此,可測定所表達的CAT對氯霉素乙酰化的速率。由于乙酰化氯霉素比氯霉素脂溶性高,其在常相TLC板上的Rf值大。此法所顯示的CAT活性越高表示插入區域的表達抑制活性越低,而CAT活性低則表示表達抑制活性高。(4)自HTLV-I基因組轉錄的RNA量的確定含HTLV-I基因組各區的質粒,其轉錄的RNA量可通過下述Northern印跡法分析。各質粒轉染合適的細胞,提取總RNA。然后,RNA在瓊脂糖-甲醛凝膠上進行電泳,并轉印至膜上(如尼龍膜或硝酸纖維素膜)。例如,含CAT基因的質粒可以32P等放射性核素標記的探針進行雜交,探針是以CAT基因作為模板制備,如此,CAT RNA的量便可用X光膠片檢測。如果CAT RNA量大,則表示抑制不發生在轉錄水平。(5)含缺失突變區的質粒的構建為了研究顯示出高抑制活性的區域中具有抑制活性的主要部分,構建了自該區5′端和3′端雙向缺失的質粒,所得的即是含這種所謂亞區的質粒。首先,為了使該區從5′端缺失,可以在如Not I位上進行酶切,切割后將末端補平,再在該區內的EcoN I位上進行酶切,而后用缺失試劑盒(Takara Shuzo Co.,Ltd.產品)使此段缺失。另一方面,自3′端的缺失可以通過用Apa I和Xba I進行酶切,然后用缺失試劑盒進行操作。如此獲得的缺失突變區域逐個分別插入到載體中,檢測所得質粒的CAT活性即可篩選出抑制CAT活性所必需的最小區域。因為由此部分缺失而導致CAT活性去抑制,即可知該區域中起抑制作用的主要部分。(6)基因表達抑制機理的闡明下文的實施例將清楚地表明,來源于HTLV-I、具有基因表達抑制功能的DNA序列存在于這樣的一個區域,該區域在表達p21X mRNA的突變型前病毒中缺失,但存在于完整前病毒的基因組中。HTLV-I來源的基因表達抑制區通過抑制機體內病毒基因的表達,而能夠使病毒感染的細胞逃避免疫系統的清除,因此在HTLV-I的隱性感染機理中起重要作用。此外,基因表達抑制功能被認為在病毒有效復制的機理方面也起重要作用,因為足夠量的Rex蛋白表達可使基因表達抑制功能喪失。B. HTLV-I基團轉錄抑制區結合蛋白的研究(1)編碼TRP-1 cDNA的克隆TRP-1是本發明所提供的蛋白質,下文將舉例說明包含編碼TRP-1 DNA之DNA片段的克隆及測序方法。確定這種DNA片段的序列,可以通過比如篩選Molt-4細胞、Jurkat細胞、CEM細胞等(這些細胞系來源于急性淋巴細胞白血病病人的外周血)的cDNA文庫,所用探針為數個U5RE連接在一起的DNA。對經DNA測序篩選所得到的DNA做進一步分析。(1.1)DNA探針的制備本發明提供的蛋白質即TRP-1與U5RE結合,因此,相當于U5RE的DNA序列可作為South Western方法篩選TRP-1的探針。探針的制備方法舉例說明如下首先,人工合成含有U5RE的DNA片段,對此DNA片段進行純化,熱變性處理,此后制備成雙鏈DNA。第二步,將所得的雙鏈DNA相互連接,如此得到含數個U5RE連接在一起的雙鏈DNA序列。將此序列插入合適的質粒(如pSL1180、pUC118或pU19),其便可作為PCR擴增的模板,加入32P-dCTP作為放射性標記進行PCR反應,即可獲得用于South-Western方法的探針。(1.2)文庫的篩選作為篩選編碼TRP-1 DNA的文庫,多種細胞的文庫可供應用,如Molt-4細胞、Jurkat細胞、CEM細胞等,這些細胞系來源于急性淋巴細胞白血病病人外周血。例如,人急性淋巴細胞白血病細胞系Molt-4的pSport1 cDNA文庫可按下法制備首先,用異硫氰酸胍方法(Chomczynski等,《分析生物化學》(Anal.Biochem.),162卷,156頁-159頁(1987))從Molt-4細胞中提取RNA。從此RNA中制備mRNA,方法可采用譬如Oligotex(Takara Shuzo Co.,Ltd產品)或Oligo dT瓊脂糖柱。由此mRNA可制備cDNA,方法采用譬如Superscript cDNA合成系統(BRL產品)。將此cDNA插入合適的表達載體,一個cDNA文庫的制備即告完成。
然后,將所得到的cDNA文庫導入合適的宿主,如大腸桿菌,并接種到培養皿上與適當的膜如硝酸纖維素膜接觸,之后進行培養以讓蛋白質表達。由如此制備的cDNA產生的蛋白質固定在硝酸纖維素膜上,利用上述探針與蛋白質的結合活性作為篩選指標即可進行cDNA文庫的篩選。
此外,該cDNA文庫可通過菌落雜交,空斑雜交等方法進行篩選,雜交所用探針為通過上述篩選所獲得的cDNA克隆制備的cDNA片段。(1.3)克隆堿基序列的確定通過篩選文庫獲得的克隆,其插入片段的堿基序列的確定可用雙脫氧法(Sanger,《科學》(Science),214卷,1205頁-1210頁(1981))。分析這些克隆所得到TRP-1的DNA序列和氨基酸序列見序列表中15#序列。(2)重組TRP-l的表達及其與U5RE結合的分析根據本發明,將編碼TRP-1的基因插入適當的載體如pRSET、pAM82或pCDM8,即構建成表達TRP-1的表達載體。
將該表達載體導入細菌、酵母、昆蟲細胞或動物細胞等,由此制備轉化體。根據本發明,通過培養該轉化體即可制備TRP-1。
例如,根據本發明,含TRP-1基因的表達載體的構建方法是將該基因插入到pRSET的KpnI-NotI切點。將此載體導入大腸桿菌BL12株即制備成轉化體。該轉化體可表達一種融合蛋白,其氨基端含寡聚組氨酸。如此獲得含TRP-1的培養產物可經親和層析柱等方法純化。
TRP-1和U5RE之間的結合分析舉例說明如下32P標記的U5REDNA與上述純化的重組TRP-1之間的反應,在含多聚d(I-C)的結合反應緩沖液中進行;將反應溶液進行聚丙烯酰胺凝膠電泳;凝膠置濾紙上干燥,之后,即可通過放射自顯影分析它們之間的結合。(3)TRP-1組織分布的確定確定TRP-1的組織分布可以通過,譬如,分析mRNA的表達或TRP-1的表達。用cDNA進行Northern印跡分析即可確定mRNA的表達。在制備抗TRP-1抗體后,便可通過Western印跡分析確定TRP-1的表達。(4)TRP-1的功能性分析由于TRP-1被認為通過與U5RE結合而參與轉錄抑制,其功能性分析可按下法進行例如,一種表達載體能表達TRP-1,另一種表達載體中既插入了U5RE基因還插入了一個作為表達指示劑的基因,將這兩種載體同時導入合適的細胞。對這種細胞進行培養并檢測指示基因的表達,便可證實TRP-1是否通過U5RE抑制表達。
能作為指示劑的基因,其編碼的蛋白質的表達應易于檢測,例如氯霉素乙酰轉移酶(CAT)基因、蟲熒光素酶(Luc)基因等。
實施例〔實施例1〕(1)構建質粒以分析HTLV-I基因組各區有否基因表達抑制作用如圖1所示,HTLV-I基因組的以下區域被分析有否基因表達抑制作用R1(序列表中1#序列1351位~3182位)、R2(序列表中1#序列3165位~4984位)、R3(序列表中1#序列4951位~6635位)、R4(序列表中1#序列2268位~4078位)、R5(序列表中1#序列4061位~5782位)、R6(序列表中1#序列1351位~2268位)、R7(序列表中1#序列2268位~3182位)、R8(序列表中1#序列3165位~4080位)和R9(序列表中1#序列4061位~4984位)。R21區(序列表中1#序列7302位~8201位)用作陰性對照,因其在突變型前病毒中無丟失發生,故認為其不具有任何抑制作用。至于核苷酸的堿基數目和堿基組成,采用的是已發表的HTLV-I ATK克隆的資料(Seiki等,《美國國立科學院進展》(Proc.Natl.Acad.Sci.USA.),80卷,3618頁-3622頁(1983))。圖1(a)為HTLV-I基因組各區的示意圖。以長方形表示的部分代表HTLV-I的LTRs和各結構基因,代表剪接供者信號,▲代表剪接受者信號,圖1(b)是pRC/CMV-CAT質粒的示意圖,這種質粒用于檢測基因表達抑制作用。PCMV代表CMV啟動子,BGHpA代表牛生長激素聚A信號,圖1(b)中虛線表示在此位置可插入HTLV-I基因組的基因序列。
人工合成下面表1所示的引物,用這些引物并以HTLV-I感染的細胞系TL-Su的基因組DNA作為模板進行PCR,如此便獲得了HTLV-I基因組的各區。為便于以后亞克隆,在每一引物的5′端加上了Not I酶切點序列。
表1
為了擴增HTLV-I基因組的每一區域,按下法進行PCR反應首先,在試管中加入0.5μg HTLV-I感染T細胞系TL-Su的基因組DNA、100pmol/管各引物、10μl 10×PCR反應緩沖液、5單位AmpliTaq DNA聚合酶和終濃度為200μM的dNTPs,最后以無菌蒸餾水補足100μl。先在94℃進行反應5分鐘,然后進入反應循環即94℃1分鐘、50℃1分鐘、72℃2分鐘,循環30次后,在72℃繼續反應7分鐘。經瓊脂糖凝膠電泳分離,切下含每一擴增區域的凝膠條,用TakaraShuzo Co.,Ltd.生產的SuPREC-01試劑盒回收DNA。來源于各區域經純化的DNA片段以Not I限制性酶(Takara Shuzo Co.,Ltd.產品)進行酶切,之后,用DNA連接試劑盒(Takara Shuzo Co.,Ltd.產品)將DNA片段插入pRC/CMV-CAT載體(Invitrogen Inc.產品;以下簡稱CMV-CAT)的NotI位點,如此,構建了含上面表1所示各個區域DNA序列的質粒(這些質粒分別稱為CMV-CAT-R1、CMV-CAT-R2、CMV-CAT-R3、CMV-CAT-R4、CMV-CAT-R5、CMV-CAT-R6、CMV-CAT-R7、CMV-CAT-R9和CMV-CAT-R21)。CMV-CAT-R8是含R8區DNA序列的質粒,其構建方法是用Xba I酶(Takara Shuzo Co.,Ltd嚴品)對約位于R2中部的Xba I切點(序列表中1#序列4080位堿基)和CMV-CAT上緊挨Not I切點3′端的Xba I切點進行切割,這樣將R2區3′端的約1/2的區域去掉,隨后進行自身連接。
質粒(CMV-CAT-R7-RXE、CMV-CAT-R8-RXE和CMV-CAT-R21-RXE)為在緊挨R7、R8和R21的3′端下游插入RXEs(Rex反應元件)而構建成的質粒。它們的構建方法為,通過PCR方法用TL-Su細胞基因組DNA作為模板制備RXE(序列表中1#序列319~620位堿基)(Toyoshima等,《病毒學雜志》(J.Virol.),64卷,2825頁-2832頁(1990)),將所得RXE插入CMV-CAT-R7、CMV-CAT-R8和CMV-CAT-R21的Apa I切點或XbaI切點,即構建了上述質粒。為獲得pRC/CMV-蟲熒光素酶(以下稱之為CMV-Luc),以pGV-C載體質粒(Toyo Ink Mfg.Co.,Ltd.產品)作為模板經PCR方法制備蟲熒光素酶基因,將此基因插入到pRC/CMV載體的Hind III切點。此外,將rex cDNA插入pCD-SRα載體(Orita等,《普通病毒學雜志》(J.Gen Virol.),73卷,2283頁-2289頁(1992))便構建了SRα-rex質粒。
用T7測序試劑盒(Pharmacia Biotech產品)對每一質粒的堿基序列進行測定,由此證實其為所需質粒。每種含各質粒的大腸桿菌JM109轉化體于200ml 2YT培養基中在37℃培養16小時,以常規方法純化后,再經兩次氯化銫密度梯度離心純化。(2)關于基因組每一區域有否基因表達抑制活性的CAT試驗研究在試管中加入2μg作為親本載體的CMV-CAT和等摩爾的上述(1)所獲得的各質粒。將1μg CMV-Luc和pBluescript載體加入每一試管,以使各試管中質粒的量相等。然后,加入Opti-MEM培養液(GIBCO BRL,Inc.產品)至終體積100μl。再于試管中加入15μlLipofectin(GIBCO BRL,Inc.產品)和85μl Opti-MEM培養液的混合物,置室溫中15分鐘。將此混合溶液加至培養在6孔板(均為3mlOpti-MEM培養液)的HeLa細胞(3×105/孔)或Jurkat細胞(3×105/孔)進行轉染。HeLa細胞經6小時而Jurkat細胞經16小時后,培養液換為普通含血清培養液(即E-MEM+10%熱滅活胎牛血清用于培養HeLa細胞,RPMI+10%熱滅活胎牛血清用于培養Jurkat細胞),繼續培養48小時。之后,收集每種細胞并用300μl Reporter裂解緩沖液(Stratagene,Inc.產品)制備細胞裂解物。這些細胞裂解物經12000rpm離心5分鐘,收獲上清。一定量的上清用于檢測CMV-Luc所產生的蟲熒光素酶活性,方法采用PicaGene試劑盒(Toyo Ink Co,Ltd.產品)以Lumat model儀(Bertho1d產品)測定。
根據所獲得的結果,對轉染效率進行校正,以此確定CAT活性測定所需用的上清量。然后,將所確定量的上清加入試管中,以×1 Reproter裂解緩沖液補足終體積122μl。加入14C-氯霉素(New EnglandNuclear Inc.產品)和20μl乙酰輔酶A(4mM)混勻后置37℃1小時。之后,以500μl乙酸乙酯抽提,經離心蒸發器濃縮后點樣至TLC板(DC-Alufolien Keiselgel 60F254,MERCK G Co.,Inc.產品)。TLC板在充滿含氯仿∶甲醇=95∶5的展層液的展層容器中展層,而后,TLC板緊貼于連接生物影像分析儀(Fujix Co.,Ltd.產品)的顯像板上1小時,結果印至X-光膠片上(XAR5,Eastman Kodak Co.產品)。如此,根據氯霉素和乙酰化氯霉素相應的放射性Rf值即可算出乙酰化率。
首先,對R1~R5五個區有否基因表達抑制活性進行了研究。這五個區基本上對應于在表達p21X mRNA的HTLV-I感染細胞系中缺失型病毒所丟失的區域。試驗系統用HeLa細胞,以CAT基因的表達作為檢測指標。結果見圖2,各道代表轉染了各質粒的HeLa細胞的CAT活性CMV-CAT-R1(第1道)、CMV-CAT-R2(第2道)、CMV-CAT-R3(第3道)、CMV-CAT-R4(第4道)、CMV-CAT-R5(第5道)和CMV-CAT(C道),轉染所用質粒的摩爾數與2μg CMV-CAT相同。圖下方的數字表示乙酰化氯霉素的比率(百分數)。結果顯示CMV-CAT-R1、CMV-CAT-R2和CMV-CAT-R4轉染的HeLa細胞CAT活性明顯低下,因此,R1、R2和R4區具有強抑制活性。R3區表現出中等程度抑制活性。
因此,進一步將包含R1、R2和R4的區域分為R6~R9四個區(參見圖1(a)),并對這四個區的抑制活性進行了研究。結果見圖3,各道代表轉染了各質粒的HeLa細胞的CAT活性CMV-CAT-R6(第1道)、CMV-CAT-R7(第2道)、CMV-CAT-R8(第3道)、CMV-CAT-R9(第4道)、CMV-CAT-R21(第5道)和CMV-CAT(C道),轉染所用質粒的摩爾數與2μg CMV-CAT相同。圖下方數字表示乙酰化比率(百分數)。結果發現CMV-CAT-R7和CMV-CAT-R8轉染的HeLa細胞具有低CAT活性,也即R7和R8區表現出強抑制活性。而R21區及R6和R9區均顯示無或非常弱的抑制活性,R21區在此作為陰性對照,其轉錄產生p21XmRNA。
因此證明,R1區的抑制活性源自R7區,R2區的抑制活性源自R8區,R4區的抑制活性源自R7區和R8區。以HTLV-I的宿主細胞,即來源于T細胞的Jurkat細胞進行類似實驗,得到相似結果,由此證實R1、R2、R4、R7和R8區發揮抑制作用。從而發現兩個病毒基因表達區(R7和R8)位于pol區內。〔實施例2〕R7和R8區基因表達抑制活性機理的研究(1)翻譯后影響的研究以Northern印跡法分析CMV-CAT-R7和CMV-CAT-R8轉錄CAT RNA的量對R7和R8區的基因表達抑制活性機理研究如下生長在培養皿(φ10cm)中的HeLa細胞(1.5×106/皿)以質粒轉錄,即18.30μg CMV-CAT-R7、18.24μg CMV-CAT-R8、18.34μg CMV-CAT-R9和16μg CMV-CAT,40小時后用ISOGEN試劑(Nippon Gene Co.,Ltd產品)提取總RNA。然后,每種RNA取15μg在1%或1.5%瓊脂糖凝膠上電泳,配制凝膠的緩沖液為MOPS緩沖液(20mM MOPS〔3-(N-嗎啉代)丙磺酸〕pH7.0,5mM乙酸鈉和0.5mM EDTA)并含有0.66M甲醛。之后用20×SSC通過毛細管轉移法使RNA印跡到尼龍膜(Hybond-N+;Amersham.Inc.產品)上。按常規方法進行堿固定。用32P標記的探針在68℃進行雜交反應2小時,標記探針的制備方法是以CAT基因作為模板用多引物標記試劑盒(Amersham,Inc.產品)進行制備,快速雜交試劑(Stratagene,Inc.產品)用作雜交溶液。洗膜方法為,首先在室溫下以2×SSC、0.1%SDS溶液洗兩次,每次15分鐘;然后在60℃以0.1×SSC,0.1%SDS溶液洗一次,30分鐘。雜交信號的檢測方法為,用Eastman Kodak Co.生產的X-光膠片XAR5加上增感屏于-80℃曝光40小時。
結果見圖4,各道代表轉染了各質粒的HeLa細胞Northern印跡結果,所轉染的質粒是CMV-CAT-R7(第1道)、CMV-CAT-R8(第2道)、CMV-CAT-R9(第3道)和CMV-CAT(C道),膜雜交所用探針以CAT基因作為模板制備。GAPDH所示的條帶為以GAPDH(3-磷酸甘油醛脫氫酶)基因為模板制備探針所做雜交的結果,據此可以檢驗膜上RNA的量是否一致。M道為未經轉染的HeLa細胞的RNA。在以基本等摩爾的質粒轉染的HeLa細胞中,以CMV-CAT-R7和CMA-CAT-R8轉染者未測到CAT RNA(預計大小約2.3kb),表明CAT RNA的量很少。然而,以含R9區的CMV-CAT-R9轉染者能檢測到CAT RNA(預計大小約2.3kb),在實施例1中R9區顯示幾無抑制作用。以對照質粒CMV-CAT轉染者也可檢測到CAT RNA(預計大小約1.3kb)。因此,結果顯示R7和R8區的抑制作用發生在RNA水平或在此之前,而不是發生在翻譯后。(2)轉錄水平的研究有兩種可能機理引起RNA表達量減少,分述如下一種機理是,R7和R8區作為轉錄抑制子以順式作用方式發揮功能,抑制CMV啟動子啟動的轉錄水平。另一種機理是,引起RNA表達量降低的原因是由于包括R7和R8區在內的RNA穩定性差,而CMV啟動子啟動的轉錄水平無改變。一般說來,轉錄抑制子對于其與啟動子之間的距離、所處的位置或正義方向還是反義方向均無關緊要。因此,所構建用于檢測的質粒是將R1、R2和R4區以正義或反義方向緊挨CMV啟動子的5′端上游插入。結果,在這些情況下均觀察不到抑制活性。因此認為,RNA表達量降低不是發生在轉錄水平。(3)轉錄后影響的研究已知HTLV-I Rex與病毒mRNA上的RXE結合并在轉錄后發揮功能,即抑制病毒mRNA剪接及促進病毒mRNA自細胞核向細胞漿的轉運。據此,對Rex的轉錄后作用對R7和R8區的抑制作用的影響進行了研究。為此目的,將RXE以正義(+)或反義(-)方向緊挨基因組區的3′端下游插入CMV-CAT-R7、CMV-CAT-R8和CMV-CAT-R21,如此構建了質粒(CMV-CAT-R7-RXE(+或-)、CMV-CAT-R8-RXE(+或-)和CMV-CAT-R21-RXE(+或-)),這些質粒用于轉錄生成RNA。
用這些質粒和表達Rex的SRα-rex質粒共轉染HeLa細胞,并測定其CAT活性。結果見圖5。圖中方括號表示的各組(每組由兩道組成)顯示經質粒轉染的HeLa細胞的CAT活性。轉染方法為以1.5μg pCD-SRα-rex(Rex+)或1.5μg pCD-SRα(Rex-)與2μg下述各質粒共轉染CMV-CAT-R7-RXE(+)(A組)、CMV-CAT-R8-RXE(+)(B組)、CMV-CAT-R21-RXE(+)(C組)、CMV-CAT-R7-RXE(-)(D組)、CMV-CAT-R8-RXE(-)(E組)或CMV-CAT-R21-RXE(-)(F組)。圖下方數字表示氯霉素乙酰化率(百分數)。如圖5所示,以CAT活性的恢復作為指標,只有當RXE以正義方向插入并有rex(Rex+)存在的情況下,R7和R8區的抑制作用才被明顯抑制,如A組和B組結果所見。因此,結果表明,Rex通過與RXE結合的轉錄后作用能有效地消除R7和R8區的抑制作用。
然后,HeLa細胞以6μg CMV-CAT-R7-RXE(+)、6μgCMV-CAT-R8-RXE(+)或6μgCMV-CAT-R21-RXE(+)與9μg pCD-SRα-rex(Rex+)或9μg pCD-SRα(Rex-)共轉染,轉染40小時后提取總RNA。這些RNA經1.5%的醛變性凝膠電泳后,進行Northem印跡。膜用以CAT基因作模板制備的探針進行雜交(圖6),之后,還用以GAPDH基因作模板制備的探針再雜交,據此可驗證膜上RNA量是否一致(GAPDH所示的帶)。圖6中SRα-rex表示的那一道代表HeLa細胞僅轉染了9μg SRα-rex。雜交結果與前述CAT活性測定結果一致。
此外,還證實了HTLV-I tax對R7和R8區的抑制作用無影響,已知HTLV-I tax以反式作用方式激活HTLV-I的LTR而促進轉錄。上述結果可以表明,R7和R8區的抑制作用主要發生在轉錄之后。〔實施例3〕基因表達抑制活性區域的研究(1)含缺失突變區的質粒的構建在R7和R8這兩個具有抑制活性的區域中,R8區顯示出更強的抑制活性。為了研究R8區中具有抑制活性的主要部分,CMV-CAT-R8中的R8區自5′端和3′端雙向缺失,如此構建了含有這種亞區的質粒。首先,為了使R8從5′端缺失,用Not I(Takara Shuzo Co.,Ltd.產品)對CMV-CAT-R8進行酶切,隨后用DNA補平試驗盒(TakaraShuzo Co.,Ltd.產品)將末端補平。再在R8區內的EcoN I切點(序列表中1#序列3362位堿基)進行酶切。而后用適用于長序列的缺失試劑盒(Takara Shuzo Co.,Ltd.產品)使此段序列缺失。另一方面,為了使R8自3′端缺失,用Apa I(Takara Shuzo Co.,Ltd.產品)和XbaI(Takara Shuzo Co,Ltd.產品)對CMV-CAT-R8進行酶切,而后用適用于長序列的缺失試劑盒使此段序列缺失。缺失的程度通過利用T7測序試劑盒(Pharmacia Biotech.產品)確定。(2)含缺失突變區的質粒CAT活性測定對上述(1)中所獲得的含缺失突變區的質粒CAT活性進行了測定,結果見圖7。使R8區自5′端(□)或3′端(○)缺失便獲得這些質粒。從圖7所示結果可以看出,R8具有活性的主要部分是一個由413bp組成的區域(c413)。圖7縱軸代表CAT活性,而橫軸代表R8區。結果發現,隨著缺失增加,CAT活性從由于R8區而處于的低活性狀態逐漸恢復。因此,可以認為,R8區要完全發揮其抑制活性需要一個大區域或一個大區域散布著多個小活性中心。
此外,由于缺失5′端區域(R8區與R7區的3′端重疊的一個區域)之后仍能保留強的抑制活性,顯然R7和R8區是兩個獨立的基因表達抑制區。
位于中央部分的413bp(序列表中1#序列3368位堿基~3780位堿基,以下稱C413)的缺失導致CAT活性的明顯恢復,故對其抑制活性進行了檢測。結果見圖8。結果示HeLa細胞轉染摩爾數相當于2μg CMV-CAT的各不同質粒之間CAT活性的比較CMV-CAT-C413正義(第1道)、CMV-CAT-C413反義(第2道)、CMV-CAT-N413(第3道)。圖下方數字表示氯霉素乙酰化率(百分數)。與CMV-CAT-N413比較,含C413的CMV-CAT-C413強烈抑制CAT活性;CMV-CAT-N413作為對照質粒,含R21區中一個413bp的區域(序列表中1#序列7302位堿基~7714位堿基,以下稱N413)。進一步發現,當C413以正義方向插入質粒時,其顯示更強的抑制活性。這再一次表明,R8區的抑制作用發生在轉錄之后。如此,既然具有強烈抑制作用的區需要其中一個相對較長的區域才能充分發揮其抑制作用,且該區域以反義方向表達時能使抑制作用減弱,因此,可以認為,抑制作用是一種轉錄后調節機制,其要求起抑制作用的區域被轉錄而且具有某一高級結構。(3)具有基因表達抑制活性的區域同源性研究HTLV-I是逆轉染病毒中的一種致瘤病毒。已知與之關系相近的病毒有I型猿猴T細胞白血病病毒(STLV-I)、HTLV-II和牛白血病病毒(BLV)(Weiss等,《RNA腫瘤病毒腫瘤病毒的分子生物學》(RNA TUMOR VIRUSESMolecular Biology of Tumorvirses),第2版,405頁-485頁,Cold Spring Harbor Laboratory(1985))。另一方面,HIV也是逆轉錄病毒,但屬于慢病毒,因此從分類學上來說關系疏遠。已知STLV-I、HTLV-II和BLV同HTLV-I一樣,引起宿主終身慢性感染,而且病毒基因在機體內的表達受到強烈抑制。發明者已在STLV-I、HTLV-II或BLV感染的細胞中發現具有與HTLV-Ip21X mRNA相同特性的mRNA(Orita等,《病毒基因》(VIRUS GENES),7卷,197頁-204頁(1993))。因此,可以預料STLV-I、HTLV-II和BLV也包含具有基因表達抑制活性的DNA序列。因而,對全序列已知的病毒與HTLV-I基因表達抑制序列(2260位~4080位)的同源性進行分析,這些全序列已知的病毒是HTLV-II(Shimotohno等,《美國國立科學院進展》(Proc.Natl.Acad.Sci.USA),82卷,3101頁-3105頁(1985))、BLV(Sagata等,《美國國立科學院進展》(Proc.Natl.Acad.Sci.USA.), 82卷,677頁-681頁(1985)),HIV作為陰性對照(Adachi等,《病毒病雜志》(J.Virol),59卷,284頁-291頁(1986))。分析方法采用DNA最高同源性分析軟件DNASIS(Hitachi SoftwareEngineering Co.,Ltd.產品)和GenBank作為數據庫。
作為同源性分析的結果,HTLV-II和BLV在pol基因區分別顯示65%和59%的同源性,pol基因區對應于HTLV-I來源的基因表達抑制區。另一方面,HIV在一些相當的區域并不顯示高同源性。因此,可以認為,對于一條具有與HTLV-I基因表達抑制區相似活性的序列,59%的同源性作為優選。〔實施例4〕RRE依賴性Rev對HTLV-I來源的基因表達抑制活性的消除對于HTLV-I,Rex與RXE之間的關系已經明了。同樣地,對于HIV、Rev與RRE之間的關系也已經清楚。因此,按照實施例2中(3)的描述,但將RXE換成RRE,即將RRE以正義(+)或反義(-)方向緊挨各基因組后的3′端下游插入CMV-CAT-R7、CMV-CAT-R8和CMV-CAT-R21,如此構建了質粒(CMV-CAT-R7-RRE(+或-)、CMV-CAT-R8-RRE(+或-)和CMV-CAT-R21-RRE(+或-)),這些質粒用于轉錄RNA。以2μg這些質粒與1.5μg表達Rev蛋白的SRα-rex質粒或1.5μg不表達Rev蛋白的pCD-SRα質粒共轉染HeLa細胞,并測定其CAT活性。結果見表2。
表2質粒 Rev CAT活性(%)誘導倍數(Rev+/Rev-)CMV-CAT-R7-RRE(+) + 13.110.0- 1.3CMV-CAT-R7-RRE(-) + 1.5 1.3- 1.2CMV-CAT-R8-RRE(+) + 2.9 5.0- 0.58CMV-CAT-R8-RRE(-) + 0.481.10.42CMV-CAT-R21-RRE(+)+ 42.61.6- 26.5CMV-CAT-R21-RRE(-)+ 33.90.74- 45.7如表2所示,不管RRE以何種方向插入質粒中,R7和R8區都強烈地抑制CAT基因表達。根據誘導倍數可對抑制效果進行比較,誘導倍數是由Rev+情況下的CAT活性除以Rev-情況下的CAT活性所得的值。如此,結果顯示,只有當RRE以正義方向插入質粒時Rev蛋白才能發揮其作用。此結果與實施例2中(3)的結果相似。〔實施例5〕TRP-1 cDNA的克隆U5RE是存在于U5中的轉錄抑制序列,為了分離與其結合的因子,以South-Western方法對Molt-4 cDNA文庫進行了篩選,用含八個相互連接之U5REs的DNA作為探針。
為了制備用于South-Western方法篩選的探針,人工合成了對應于U5RE雙鏈的寡核苷酸(序列表中16#序列和17#序列)。將所合成的DNA以300V電壓進行電泳2小時,電泳用含19%丙烯酰胺、1%雙丙烯酰胺和7M尿素的凝膠。之后,切下含有所需的合成DNA的凝膠,凝膠于37℃以TE緩沖液(10mM Tris-HCl,pH7.4,1mM EDTA)浸泡16小時,如此從凝膠中將DNA洗脫出來。洗出液通過用TE緩沖液飽和的DE52層析柱(Pharmacia Biotech.產品)以吸附DNA。然后,用0.5ml TNE緩沖液(10mM Tris-HCl,pH 7.4,1mMEDTA和1.5M NaCl)進行洗脫。將1ml乙醇加入DNA溶液中使DNA沉淀,如此對合成的DNA進行純化。經純化的合成DNA溶于TE緩沖液中。將每種DNA加至溶液中使其終濃度為10μg/μl,而后于65℃熱變性10分鐘后逐漸冷卻,如此形成雙鏈DNA。然后,于1μg雙鏈DNA中加入100單位連接酶(Nippon Gene Co.,Ltd.產品),使其在12℃反應16小時,如此將八個U5REs連接在一起。用10單位連接酶于12℃經16小時連接反應將所得DNA(8×U5RE)插入質粒pSl1180(Pharmacia Biotech.產品)的BamHI和BglII切點間。
以上述8×U5RE作模板在α32P-dCTP存在的條件下進行PCR,即可擴增用于South-Western方法的探針。PCR反應液為2μl 10×PCR緩沖液(100mM Tris-HCl,pH 8.3,500mM KCl,15mMMgCl2,0.1%明膠)、1μl dNTPs(4mM dATP、4mM dGTP、4mM dTTP、0.8mM dCTP)、0.5μl Taq聚合酶(Takara ShuzoCo.,Ltd.產品, 5單位/μl),1μl各合成引物(pSL F序列表中18#序列;pSL R序列表中19#序列。濃度為10pmol/μl)、12.5μlα32P-dCTP,于其中加入1μl 8×U5RE-pSL1180(1ng/μl),并以無菌蒸餾水補至20μl。用Thermal Sequencer TSR-300(Iwaki GlassCo.,Ltd.產品)進行PCR。先在94℃進行反應60秒,然后進入反應循環,即94℃45秒、55℃45秒、72℃45秒,循環35次后,在72℃連續反應60秒。
以pSport 1為載體的人急性淋巴細胞白血病細胞系Molt-4的cDNA文庫構建方法如下首先,于109Molt-4細胞加入1ml 4M異硫氰酸胍,之后加入1ml水飽和酚進行抽提。抽提物再用1ml異丙醇抽提即獲得總RNA。用Oligotex,從100μg總RNA中可獲得10μgmRNA。用Superscript cDNA合成系統(GIBCO-BRL Inc.產品)即可從這10μg mRNA中制備cDNA,然后構建成cDNA文庫(pSPORT-1(BRL Inc.產品))。
下一步,將Molt-4 cDNA文庫導入大腸桿菌DH5α,并將細菌按每平皿50,000個菌落接種,如此總共篩選了2,000,000個菌落。讓所接種的菌落與硝酸纖維素膜(Millipor Ltd.產品)接觸1分鐘。硝酸纖維素膜于37℃在含1mM IPTG(GIBCO-BRL Inc.產品)的培養基中溫育3小時,以使蛋白質表達。如此制備的固定于硝酸纖維素膜上的cDNA所產生的蛋白質與上述探針進行反應,以蛋白質的cDNA結合活性作為指標進行文庫篩選。
此外,從所得的cDNA克隆制備cDNA片段,以這些DNA片段作為探針通過菌落雜交對106Molt-4 cDNA文庫進行篩選。細菌培養于瓊脂培養基,37℃過夜,將菌落轉移至Colony/PlaqueScreen Plus濾紙(Du Pont Ltd.產品),之后將濾紙浸泡于0.5M NaOH、1.5M NaCl溶液1分鐘,0.5M Tris-HCl、1.5M NaCl溶液5分鐘,及2×SSC5分鐘,然后于通風處晾干濾紙。用多引物標記試劑盒(Amersham,Inc.產品)將探針標記上α32P-dCTP。雜交按下法進行先以6×SSPE(0.9M NaCl、0.06M磷酸鈉、6mM EDTA,pH7.4)、10%愛爾蘭乳油(R&A BAILEYS Inc.產品)、1%SDS和50%甲酰胺于42℃預雜交6小時,預雜交時不加探針。之后,加入探針于42℃進行雜交16小時。濾紙以1×SSC 0.5%SDS于室溫下洗10分鐘,再以0.2×SSC 0.5%SDS于65℃洗兩次,每次30分鐘。雜交信號的檢測方法為,用X-光膠片(Eastman Kodak Co.產品;XAR5)加上增感屏于-80℃曝光16小時,然后進行顯影。
結果,獲得了一個陽性克隆,含有約3.8kb的cDNA插入片段。用Sequenase DNA測序試劑盒(U.S.B.Inc.產品)按雙脫氧法(Sanger,見前述文獻出處)確定所得cDNA克隆的堿基序列。所確定的DNA序列和氨基酸序列示于序列表中15#序列。分析這一cDNA片段,根據其堿基序列可推斷出氨基酸序列,進一步對所推斷的氨基酸序列進行分析(DNASIS(Hitachi Software Engineering Co.,Ltd.))。計算機分析結果發現此基因是一新基因,其最長的開放閱讀框可翻譯成一條688個氨基酸的氨基酸序列。如圖10所示,發現這條氨基酸序列在其羧基端有四個半鋅指樣結構域,在其氨基端有一對KRAB-A、B樣結構域;前者是Kruppel型DNA結合區,而后者是轉錄調節區。此外,根據氨基酸序列推測分子量為76 kDa,表明在分子量和特征性結構域方面與已知的U5RE特異結合蛋白(110kDa、80kDa和70kDa)顯然不同。
此外,通過相似性分析發現,氨基酸序列具有最高相似性的基因是Kid-1(Witzgall等,《分子細胞生物學》(Mol.Cell.Biol.),13卷3期1933頁-1942頁(1993),見前述文獻出處)。如圖11所示,根據氨基酸序列水平的比較,其鋅指結構域(相當于TRP-1的518位~648位氨基酸及Kid-1的407位~529位氨基酸)顯示61.0%的相似性和53.7%的同源性。如圖12所示,KRAB-A、B結構域(TRP-1的196位~261位氨基酸和Kid-1的12位~53位氨基酸)顯示48.5%相似性和34.9%同源性。
除上述外,還發現以下特征性序列富含亮氨酸結構域,含34.4%亮氨酸,位于154位~185位氨基酸;富含脯氨酸/谷氨酰胺結構域,含65.9%脯氨酸/谷氨酰胺,位于403位~443位氨基酸;以及富含甘氨酸結構域,含58.8%甘氨酸,位于470位~503位氨基酸。已知富含脯氨酸/谷氨酰胺結構域參與蛋白與蛋白之間的相互作用,但其它結構域的功能尚未明了。〔實施例6〕重組TRP-1的表達及其性質分析為了表達TRP-1,構建了pRSET-TRP-1載體,即通過表達的克隆化而獲得cDNA克隆,對此克隆的DNA以Kpn I和NotI進行酶切而獲得一段3.8kb的DNA片段,將此DNA片段插入到表達載體pRSET(Invitrogen Inc.產品)的Kpn I-NotI切點上。將如此構建的pRSET-TRP-1導入大腸桿菌BL12株,該菌便能表達一融合蛋白,其氨基端含寡聚組氨酸。將細菌于2L LB培養基中在30℃培養過夜,之后加入IPTG至終濃度為1mM,繼續培養6小時。用plate bond resin(Invitrogen Inc.)按柱層析方法對此融合蛋白進行純化,再通過用Prep-cell(BIO-RAD Inc.產品)進行電泳將此融合蛋白分離而獲得最終純化產物。
TRP-1和U5RE之間的結合分析按下法進行首先,1ng32P標記的U5RE DNA和上述重組TRP-1于結合反應緩沖液(20mMTris-HCl,1mM EDTA,50mM NaCl,1mM DTT和5%甘油)中室溫下進行反應30分鐘,反應體系中還含有1μg聚d(I-C)。然后,對反應溶液進行5%聚丙烯酰胺凝膠電泳,電泳后凝膠置濾紙上干燥,之后,通過放射自顯影進行分析。
TRP-1和U5RE之間結合分析結果見圖13,圖13中第一道代表自大腸桿菌表達的TRP-1與U5RE探針之間結合反應的結果;第2道代表于第1道的反應溶液中加入非標記U5RE所得結果,非標記U5RE加入量為相當于U5RE探針摩爾數的100倍;第3道同第2道,但加入的不是非標記的U5RE,而是非特異性DNA片段,加入量相當于U5RE探針摩爾數的100倍。結果表明,這種重組TRP-1能與32P標記的U5REDNA結構。此外,進行了針對U5RE DNA探針對競爭性反應,所用競爭物為非標記的URE DNA或長度一樣而堿基序列與U5RE DNA無關的DNA,結果顯示只有非標記的U5RE具有競爭作用。因此,發現這種TRP-1能特異地結合U5RE DNA。〔實施例7〕TRP-1 mRNA表達的組織分布為了檢查不同組織中TRP-1表達的分布情況,用Northern印跡分析法對人類細胞系(28種)和組織(16個部位)的RNA進行了檢測。
首先,自各種細胞分離聚(A)+RNA,3μg聚(A)+RNA加樣到含0.66M甲醛的1%瓊脂糖凝膠上進行電泳,緩沖液為MOPS緩沖溶液(20mM MOPS,pH 7.0,5mM乙酸鈉,0.5mM EDTA),之后用20×SSC通過毛細管轉移法將RNA轉移至尼龍膜(Gene ScreenPlus,Du Pont Ltd.產品),尼龍膜于通風處晾干。對此濾膜及印跡有各種人類組織mRNA的商品化濾膜(Clontech Inc.產品)進行雜交,所用探針為用多引物標記試劑盒(Amersham,Inc產品)制備的α32P-dCTP標記TRP-1 cDNA(通過表達克隆化獲得的cDNA片段,其5′端950個堿基長度的序列用作探針),雜交緩沖液為(6×SSPE,1%SDS,10%愛爾蘭乳油(R&A BAILEYS Inc.產品),和50%甲酰胺),濾膜于室溫用1×SSC 0.5%SDS洗10分鐘。再于65℃用0.2×SSC 0.5%SDS洗兩次,每次30分鐘。雜交信號的檢測用X-光膠片(Eastman Kodak Co.產品;XAR5)加上增感屏于-80℃曝光16小時,隨后進行顯影。
圖14和圖15示各種細胞系的檢測結果。圖14示HL60(急性髓性白血病)、HeLa細胞S3(宮頸癌)、K-562(慢性髓性白血病)、Molt-4(急性淋巴細胞白血病)、Raji(Burkitt淋巴瘤)、SW480(結腸腺癌)、A549(肺癌)和G361(黑色素瘤)各細胞系的Northern印跡結果。圖15示GEM、HPB、Jurkat、Molt-4、PND4.1(這些細胞系均來源于急性淋巴細胞白血病)、CAK II(腎癌)、KATO III(胃癌)、A549(肺癌)、A673和RD(兩者均來源于橫紋肌肉瘤)、IMR32、SKN SH、TGW和NB9(這些均來源于神經母細胞瘤)各細胞系的Northern印跡結果。如圖15箭頭所示,這些細胞系表達一個4.0kb的轉錄本,不管它們是HTLV-I感染細胞系還是非感染細胞系均有表達。TRP-1基因的表達見于本實驗所檢測的所有細胞系。4種神經母細胞瘤細胞中的2種(TGW和NBQ)表達水平比其它神經母細胞瘤細胞和其它細胞高出5~10倍。此外,還檢測了神經母細胞瘤細胞系GOTO、CHP 134、NB 19、NB 16,以及神經膠質瘤細胞系A2781、U251和T98G的表達情況,發現GOTO和NB 19高表達(資料未列)。因此,發現本研究檢測的8種神經母細胞瘤細胞系中,4種細胞系顯示TRP-1 mRNA高表達。
另外,圖16(A)和(B)示各種組織的檢測結果。結果發現,除睪丸表達量極低外,其它組織的表達水平都基本恒定。因此,既然正常腦組織的TRP-1 mRNA表達水平與其它組織比較并不顯示出特別高,神經母細胞瘤細胞系顯示的高表達結果提示,在某種程度上與神經細胞的癌變有密切關系。〔實施例8〕TRP-1的功能性分析TRP-1的功能性分析按下法進行。構建表達載體pEF-HA-TRP-1、報道質粒TK-CAT和TK-3×U5RE-CAT;pEF-HA-TRP-1是經對EF-BOS載體進行基因工程改造而獲得,其表達HA-TRP-1融合蛋白,該融合蛋白為在TRP-1的N末端加上流感病毒HA標簽;TK-CAT質粒中HSV TK(一個最小啟動子區)連接到CAT(氯霉素乙酰轉移酶)基因的上游;而TK-3×U5RE-CAT質粒中三個U5REs插入TK和CAT基因之間。TK-3×U5RE-CAT含與TRP-1結合的序列即U5REs,而TK-CAT不含結合序列。用Lipofectin(GIBCO-BRL Inc產品)將表達載體pEF-HA-TRP1和報道質粒TK-CAT或TK-3×U5RE-CAT同時導入HeLa細胞。經48小時培養后,收獲細胞,對細胞進行勻漿化處理并離心,對上清中的蛋白質進行定量。于100μg蛋白的上清中加入4μl〔14C〕氯霉素(Amersham,Inc.產品)和10μl4mM乙酰輔酶A(Sigma,Inc.產品),37℃溫育1小時后,加入0.5ml乙酸乙酯,攪拌混勻后,以10,000rpm離心10秒,收獲乙酸乙酯層。使乙酸乙酯層干燥后,重新溶解于20μl乙酸乙酯,并點樣于薄層層析硅膠板上(DC-Alufolien Kiesel gel60F254,MERCK& Co,Inc.產品),層析板置薄層室中以氯仿-甲醇(95∶5)溶劑展層。此經展層的薄層層析硅膠板的乙酰化率檢測方法是,用生物影像分析儀(Fujix Ltd.產品)測定所存在的CAT活性。
結果見圖17。用培養48小時后收獲的細胞提取物進行分析,分析結果示于圖17中以下各道第1道~第3道用2μg TK-3×U5RE-CAT作報道基因,第4道~第6道用2μg TK-CAT作報道基因。此外,作為效應基因,第1道和第4道用10μg pEF-BOS-TRP-1;第2道和第5道用5μg pEF-BOS-TRP-1+5μg pEF-BOS;第3道和第6道用10μg pEF-BOS,各基因導入HeLa細胞。換句話說,由pEF-HA-TRP-1和TK-3×U5RE-CAT組成的一對載體或由pEF-HA-TRP-1和TK-CAT組成的一對載體導入HeLa細胞,以便分析TRP-1是否通過U5RE發揮其功能。結果,TK-3×U5RE-CAT的CAT活性降低了35%,且與pEF-HA-TRP-1質粒的濃度有關,呈濃度依賴性;而pEF-HA-TRP-1對TK-CAT的CAT活性無影響。因此,結果表明TRP-1通過U5RE發揮其轉錄抑制活性。工業應用本發明提供與基因表達抑制功能相關的DNA分子和蛋白質。
根據本發明,具有基因表達抑制功能的DNA分子來源于HTLV-I,其能通過抑制機體內病毒基因的表達而使病毒感染的細胞逃避免疫系統的清除,如此在HTLV-I的隱性感染機理中起重要作用。可以預期,通過成功地利用這種基因表達抑制作用和Rex蛋白對這種抑制的抵消作用,有可能人工調控基因表達,這種基因表達的人工調控可應用于基因治療等的細胞特異性基因表達的調控。
還可以預期,本發明可應用于HIV感染性疾病(如愛滋病)的基因治療,即利用包含本發明中具有基因表達抑制功能的DNA序列的質粒,該DNA序列包含如圖9所示的構成單位。例如,如圖9所示的構成單位可以插入逆轉錄病毒載體,而后導入感染或非感染細胞。在導入非感染細胞的情況下,基因表達抑制性DNA序列發揮功能,而使治療基因的表達受到抑制。此外,通過除去剪接供者(SD)信號和剪接受者(SA)信號,治療基因等可經剪切被清除,如此,治療基因的表達進一步受抑制。另一方面,在導入感染細胞的情況下,HIV基因表達Rev蛋白,它通過RRE消除基因表達抑制序列的抑制活性,如此促進治療基因的表達。此外,用HIV LTR作為啟動子,可以通過HIV Tat蛋白的轉錄增強功能進一步促進治療基因的表達。
還可以預期,本發明中具有基因表達抑制功能的DNA分子以及含這些DNA分子的質粒可以有效地闡明一些疾病的發病機理,例如成人T細胞白血病(ATL)、HTLV-I相關性脊髓病(HAM)和熱帶痙攣性下肢輕癱(TSP),以及據此建立有效的治療方法。
根據本發明TRP-1是一種特異性與U5RE結合的DNA結合蛋白,并具有轉錄抑制活性。因此可以認為其也能影響具有相似序列的基因的表達抑制,例如人類免疫缺陷病毒的基因、巨細胞病毒基因或細胞基因。因此,其可能具有抗病毒活性,可以用于抗病毒制劑的開發。
自大鼠腎臟分離出來的Kid-1與TRP-1有較高的相似性,而已知在腎臟的發育過程中,局部缺血時或葉酸治療后腎組織的重建過程中,Kid-1 mRNA的表達增高而抑制轉錄。因此,既然TRP-1在大多數組織或細胞系中均表達,可以認為其具有與轉錄抑制有關的重要的生理活性。也即,根據本發明,該蛋白可用作抗病毒制劑的有效成分。
此外,TRP-1在半數神經母細胞瘤細胞系中超乎尋常地高表達,提示其與神經細胞的癌變機理有關聯。因此,研究TRP-1有助于神經細胞癌變機理的闡明、診斷和治療。換句話說,根據本發明該蛋白在組織中的表達可以作為檢測指標用于癌變的檢測。此外,本發明中的該蛋白或本發明中編碼該蛋白的DNA分子的反義鏈可以用作癌癥治療制劑。
序列表序列編號 1序列長度9045序列類型核酸鏈型單鏈拓撲結構線性分子類型基因組DNA初始來源生物人特征名稱/關鍵詞LTR位置1..757鑒定方法S名稱/關鍵詞聚A信號位置8584..8589鑒定方法S名稱/關鍵詞LTR位置8278..9032鑒定方法S序列TGACAATGAC CATGAGCCCC AAATATCCCC CGGGGGCTTA GAGCCTCCCA GTGAAAAACA 60TTTCCGAGAA ACAGAAGTCT GAAAAGGTCA GGGCCCAGAC TAAGGCTCTG ACGTCTCCCC 120CCGGAGGGCA GCTCAGCACC GGCTCGGGCT AGGCCCTGAC GTGTCCCCCT GAAGACAAAT 180CATAAGCTCA GACCTCCGGG AAGCCACCAA GAACCACCCA TTTCCTCCCC ATGTTTGTCA 240AGCCGTCCTC AGGCGTTGAC GACAACCCCT CACCTCAAAA AACTTTTCAT GGCACGCATA 300TGGCTCAATA AACTAGCAGG AGTCTATAAA AGCGTGGAGA CAGTTCAGGA GGGGGCTCGC 360ATCTCTCCTT CACGCGCCCG CCGCCCTACC TGAGGCCGCC ATCCACGCCG GTTGAGTCGC 420GTTCTGCCGC CTCCCGCCTG TGGTGCCTCC TGAACTGCGT CCGCCGTCTA GGTAAGTTTA 480AAGCTCAGGT CGAGACCGGG CCTTTGTCCG GCGCTCCCTT GGAGCCTACC TAGACTCAGC 540CGGCTCTCCA CGCTTTGCCT GACCCTGCTT GCTCAACTCT ACGTCTTTGT TTCGTTTTCT 600GTTCTGCGCC GTTACAGATC GAAAGTTCCA CCCCTTTCCC TTTCATTCAC GACTGACTGC 660CGGCTTGGCC CACGGCCAAG TACCGGCGAC TCCGTTGGCT CGGAGCCAGC GACAGCCCAT 720CCTATAGCAC TCTCAGGAGA GAAATTTAGT ACACAGTTGG GGGCTCGTCC GGGATACGAG 780CGCCCCTTTA TTCCCTAGGC AATGGGCCAA ATCTTTTCCC GTAGCGCTAG CCCTATTCCG 840CGACCGCCCC GGGGGCTGGC CGCTCATCAC TGGCTTAACT TCCTCCAGGC GGCATATCGC 900CTAGAACCCG GTCCCTCCAG TTACGATTTC CACCAGTTAA AAAAATTTCT TAAAATAGCT 960TTAGAAACAC CGGCTCGGAT CTGTCCCATT AACTACTCCC TCCTAGCCAG CCTACTCCCA 1020AAAGGATACC CCGGCCGGGT GAATGAAATT TTACACATAC TCATCCAAAC CCAAGCCCAG 1080ATCCCGTCCC GTCCCGCGCC ACCGCCGCCG TCATCCCCCA CCCACGACCC CCCGGATTCT 1140GATCCACAAA TCCCCCCTCC CTATGTTGAG CCTACGGCCC CCCAAGTCCT TCCAGTCATG 1200CATCCACATG GTGCTCCTCC TAACCATCGC CCATGGCAAA TGAAAGACCT ACAGGCCATT 1260AAGCAAGAAG TCTCCCAAGC AGCCCCTGGG AGCCCCCAGT TTATGCAGAC CATCCGGCTT 1320GCGGTGCAGC AGTTTGACCC CACTGCCAAA GACCTCCAAG ACCTCCTGCA GTACCTTTGC 1380TCCTCCCTCG TGGCTTCCCT CCATCACCAG CAGCTAGATA GCCTTATATC AGAGGCCGAA 1440ACCCGAGGTA TTACAGGTTA TAACCCATTA GCCGGTCCCC TCCGTGTCCA AGCCAACAAT 1500CCACAACAAC AAGGATTAAG GCGAGAATAC CAGCAACTCT GGCTCGCCGC CTTCGCCGCC 1560CTGCCGGGGA GTGCCAAAGA CCCTTCCTGG GCCTCTATCC TCCAAGGCCT GGAGGAGCCT 1620TACCACGCCT TCGTAGAACG CCTCAACATA GCTCTTGACA ATGGGCTGCC AGAAGGCACG 1680CCCAAAGACC CCATCTTACG TTCCTTAGCC TACTCCAATG CAAACAAAGA ATGCCAAAAA 1740TTACTACAGG CCCGAGGACA CACTAATAGC CCTCTAGGAG ATATGTTGCG GGCTTGTCAG 1800ACCTGGACCC CCAAAGACAA AACCAAAGTG TTAGTTGTCC AGCCTAAAAA ACCCCCCCCA 1860AATCAGCCGT GCTTCCGGTG CGGGAAAGCA GGCCACTGGA GTCGGGACTG CACTCAGCCT 1920CGTCCCCCCC CCGGGCCATG CCCCCTATGT CAAGACCCAA CTCACTGGAA GCGAGACTGC 1980CCCCGCCTAA AGCCCACTAT CCCAGAACCA GAGCCAGAGG AAGATGCCCT CCTATTAGAC 2040CTCCCCGCTG ACATCCCACA CCCAAAAAAC TTCATAGGGG GGGAGGTTTA ACCTCCCCCC 2100CCACATTACA GCAAGTCCTT CCTAACCAAG ACCCAGCATC TATTCTGCCA GTTATACCGT 2160TAGATCCCGC CCGTCGGCCC GTAATTAAAG CCCAGGTTGA CACCCAGACC AGCCACCCAA 2220AGACTATCGA AGCTTTACTA GATACAGGAG CAGACATGAC AGTCCTTCCG ATAGCCTTGT 2280TCTCAAGTAA TACTCCCTCA AAAATACATC CGTATTAGGG GCAGGGGGCC AAACCCAAGA 2340TCACTTTAAG CTCACCTCCC TTCCTGTGCT AATACGCCTC CCTTTCCGGA CAACGCCTAT 2400TGTTTTAACA TCTTGCCTAG TTGATACCAA AAACAACTAG GCCATCATAG GTCGTGATGC 2460CTTACAACAA TGCCAAGGCG TCCTGTACCT CCCTGAGGCA AAAAGGCCGC CTGTAATCTT 2520GCCAATACAG GCGCCAGCCG TCCTTGGGCT AGAACACCTC CCAAGGCCCC CCGAAATCAG 2580CCAGTTCCCT TTAAACCAGA ACGCCTCCAG GCCTTGCAAC ACTTGGTCCG GAAGGCCCTG 2640GAGGCAGGCC ATATCGAACC CTACACCGGG CCAGGGAATA ACCCAGTATT CCCAGTTAAA 2700AAGGCCAATG GAACCTGGCG ATTCATCCAC GACCTGCGGG CCACTAACTC TCTAACCATA 2760GATCTCTCAT CATCTTCCCC CGGGCCCCCT GACTTGTCCA GCCTGCCAAC CACACTAGCC 2820CACTTGCAAA CTATAGACCT TAGAGACGCC TTTTTCCAAA TCCCCTTACC TAAACAGTTC 2880CAGCCCTACT TTGCTTTCAC TGTCCCACAG CAGTGTAACT ACGGCCCCGG CACTAGATAC 2940GCCTGGAAAG TACTACCCCA AGGGTTTAAA AATAGTCCCA CCCTGTTCGA AATGCAGCTG 3000GCCCATATCC TGCAGCCCAT TCGGCAAGCT TTCCCCCAAT GCACTATTCT TCAGTACATG 3060GATGACATTC TCCTAGCAAG CCCCTCCCAT GAGGACCTAC TACTACTCTC AGAGGCCACA 3120ATGGCTTCCC TAATCTCCCA TGGGTTGCCT GTGTCCGAAA ACAAAACCCA GCAAACCCCT 3180GGAACAATTA AGTTCCTAGG GCAGATAATT TCACCCAATC ACCTCACTTA TGATGCAGTC 3240CCCACGGTAC CTATACGGTC CCGCTGGGCG CTACCTGAAC TTCAAGCCCT ACTTGGCGAG 3300ATTCAGTGGG TCTCCAAAGG AACTCCTACC TTACGCCAGC CCCTTCACAG TCTCTACTGT 3360GCCTTACAAA GGCATACTGA TCCCCGAGAC CAAATATATT TAAATCCTTC TCAAGTTCAA 3420TCATTAGTGC AGCTGCGGCA GGCCCTGTCA CAGAACTGCC GCAGTAGACT AGTCCAAACC 3480CTGCCCCTCC TAGGGGCTAT TATGCTGACC CTCACTGGCA CCACTACTGT AGTGTTCCAG 3540TCCAAGGAGC AGTGGCCACT TGTCTGGCTA CATGCCCCCC TACCCCACAC TAGCCAGTGC 3600CCCTGGGGGC AGCTACTTGC CTCAGCTGTG TTATTACTCG ACAAATACAC CTTGCAATCC 3660TATGGGCTGC TCTGCCAAAC CATACATCAT AACATCTCCA CCCAAACCTT CAACCAATTC 3720ATTCAAACAT CTGACCACCC CAGTGTTCCT ATCTTACTCC ACCACAGTCA CCGATTCAAA 3780AATTTAGGTG CCCAAACTGG AGAACTTTGG AACACTTTTC TTAAAACAGC TGCCCCATTG 3840GCTCCTGTGA AAGCCCTCAT GCCAGTGTTT ACTCTTTCCC CGGTGATTAT AAACACCGCC 3900CCCTGCCTGT TTTCAGACGG ATCTACCTCC CGGGCAGCCT ATATTCTCTG GGACAAGCAA 3960ATATTGTCAC AAAGATCATT CCCCCTTCCG CCACCGCACA AGTCGGCCCA ACGGGCCGAA 4020CTTCTCGGAC TTTTGCATGG CCTCTCCAGC GCCCGTTCGT GGCGCTGTCT CAACATATTT 4080CTAGACTCCA AGTATCTTTA TCATTACCTT CGGACCCTTG CCCTGGGCAC CTTCCAAGGC 4140AGGTCCTCTC AGGCCCCCTT TCAGGCCCTT CTGCCCCGCT TACTATCGCG TAAGGTCGTC 4200TATTTGCACC ACGTTCGCAG CCATACCAAT CTACCTGATC CCATCTCCAG GCTCAACGCT 4260CTCACAGATG CCCTACTAAT CACCCCTGTC CTGCAGCTCT CTCCTGCAGA ACTACACAGT 4320TTCACCCATT GCGGACAGAC GGCCCTCACA TTGCAAGGGG CAACCACAAC TGAGGCTTCC 4380AATATCCTGC GCTCTTGCCA CGCCTGCCGC GGAGGCAACC CACAACATCA GATGCCTCGG 4440GGACACATCC GCCGTGGCCT ACTTCCTAAC CACATCTGGC AAGGCGACAT TACCCATTTC 4500AAATATAAAA ATACGCTGTA TCGCCTTCAT GTATGGGTAG ACACCTTTTC AGGAGCCATC 4560TCAGCTACCC AAAAGAGAAA AGAAACAAGC TCAGAAGCTA TTTCCTCTTT GCTTCAGGCC 4620ATTGCCCATC TAGGCAAGCC TAGCTACATA AACACAGACA ACGGCCCTGC CTATATTTCC 4680CAAGACTTCC TCAATATGTG TACCTCCCTT GCTATTCGCC ATACCACCCA TGTCCCCTAC 4740AATCCAACCA GCTCAGGACT TGTAGAACGC TCTAATGGCA TTCTTAAAAC CCTATTATAT 4800AAGTACTTTA CTGACAAACC CGACCTACCC ATGGATAATG CTCTATCCAT AGCCCTATGG 4860ACAATCAACC ACCTGAATGT GTTAACCAAC TGCCACAAAA CCCGATGGCA GCTTCACCAC 4920TCCCCCCGAC TCCAGCCGAT CCCAGAGACA CGTTCCCTCA GCAATAAACA AACCCATTGG 4980TATTATTTCA AGCTTCCTGG TCTTAATAGC CGCCAGTGGA AAGGACCACA GGAGGCTCTC 5040CAAGAAGCTG CCGGCGCTGC TCTCATCCCG GTAAGCGCTA GTTCTGCCCA GTGGATCCCG 5100TGGAGACTCC TCAAGCGAGC TGCATGCCCA AGACCCGTCG GAGGCCCCGC CGATCCCAAA 5160GAAAAAGACC TCCAACACCA TGGGTAAGTT TCTCGCCACT TTGATTTTAT TCTTCCAGTT 5220CTGCCCCCTC ATCTTCGGTG ATTACAGCCC CAGCTGCTGT ACTCTCACAA TTGGAGTCTC 5280CTCATACCAC TCTAAACCCT GCAATCCTGC CCAGCCAGTT TGTTCGTGGA CCCTCGACCT 5340GCTGGCCCTT TCAGCAGATC AGGCCCTACA GCCCCCCTGC CCTAACCTAG TAAGTTACTC 5400CAGCTACCAT GCCACCTATT CCCTATATCT ATTCCCTCAT TGGACTAAGA AGCCAAACCG 5460AAATGGCGGA GGCTATTATT CAGCCTCTTA TTCAGACCCT TGTTCCTTAA AGTGCCCATA 5520CCTGGGGTGC CAATCATGGA CCTGCCCCTA TACAGGAGCC GTCTCCAGCC CCTACTGGAA 5580GTTTCAACAC GATGTCAATT TTACTCAAGA AGTTTCACGC CTCAATATTA ATCTCCATTT 5640TTCAAAATGC GGTTTTCCCT TCTCCCTTCT AGTCGACGCT CCAGGATATG ACCCCATCTG 5700GTTCCTTAAT ACCGAACCCA GCCAACTGCC TCCCACCGCC CCTCCTCTAC TCCCCCACTC 5760TAACCTAGAC CACATCCTCG AGCCCTCTAT ACCATGGAAA TCAAAACTCC TGACCCTTGT 5820CCAGTTAACC CTACAAAGCA CTAATTATAC TTGCATTGTC TGTATCGATC GTGCCAGCCT 5880CTCCACTTGG CACGTCCTAT ACTCTCCCAA CGTCTCTGTT CCATCCTCTT CTTCTACCCC 5940CCTCCTTTAC CCATCGTTAG CGCTTCCAGC CCCCCACCTG ACGTTACCAT TTAACTGGAC 6000CCACTGCTTT GACCCCCAGA TTCAAGCTAT AGTCTCCTCC CCCTGTCATA ACTCCCTCAT 6060CCTGCCCCCC TTTTCCTTGT CACCTGTTCC CACCCTAGGA TCCCGCTCCC GCCGAGCGGT 6120ACCGGTGGCG GTCTGGCTTG TCTCCGCCCT GGCCATGGGA GCCGGAGTGG CTGGCGGGAT 6180TACCGGCTCC ATGTCCCTCG CCTCAGGAAA GAGCCTCCTA CATGAGGTGG ACAAAGATAT 6240TTCCCAGTTA ACTCAAGCAA TAGTCAAAAA CCACAAAAAT CTACTCAAAA TTGCGCAGTA 6300TGCTGCCCAG AACAGACGAG GCCTTGATCT CCTGTTCTGG GAGCAAGGAG GATTATGCAA 6360AGCATTACAA GAACAGTGCC GTTTTCCGAA TATTACCAAT TCCCATGTCC CAATACTACA 6420AGAAAGACCC CCCCTTGAGA ATCGAGTCCT GACTGGCTGG GGCCTTAACT GGGACCTTGG 6480CCTCTCACAG TGGGCTCGAG AGGCCTTACA AACTGGAATC ACCCTTGTTG CGCTACTCCT 6540TCTTGTTATC CTTGCAGGAC CATGCATCCT CCGTCAGCTA CGACACCTCC CCTCGCGCGT 6600CAGATACCCC CATTACTCTC TTATAAAACC TGAGTCATCC CTGTAAACCA AGCACGCAAT 6660TATTGCAACC ACATCGCCTC CAGCCTCCCC TGCCAATAAT TAACCTCTCC CATCAAATCC 6720TCCTTCTCCT GCAGCAACTT CCTCCGTTCA GCCTCCAAGG ACTCCACCTC GCCTTCCAAC 6780TGTCTAGTAT AGCCATCAAT CCCCAACTCC TGCATTTTTT CTTTCCTAGC ACTATGCTGT 6840TTCGCCTTCT CAGCCCCTTG TCTCCACTTG CGCTCACGGC GCTCCTGCTC TTCCTGCTTC 6900CTCCTAGCGA CGTCAGCGGC CTTCTTCTCC GCCCGCCTCC TGCGCCGTGC CTTCTCCTCT 6960TCCTTCCTTT TCAAATACTC AGCGGTCTGC TTTTCCTCCT CTTTCTCCCG CTCTTTTTTT 7020CGCTTCCTCT TCTCCTCAGC CCGTCGCTGC CGATCACGAT GCGTTTCCCC GCGAGGTGGC 7080GCTTTCTCCC CTGGAGGGCC CCGTCGCAGC CGGCCGCGGC TTTCCTCTTC TAAGGATAGC 7140AAACCGTCAA GCACAGCTTC CTCCTCCTCC TTGTCCTTTA ACTCTTCCTC CAAGGATAAT 7200AGCCCGTCCA CCAATTCCTC CACCAGCAGG TCCTCCGGGC ATGACACAGG CAAGCATCGA 7260AACAGCCCTG CAGATACAAA GTTAACCATG CTTATTATCA GCCCACTTCC CAGGGTTTGG 7320ACAGAGTCTT CTTTTCGGAT ACCCAGTCTA CGTGTTTGGA GACTGTGTAC AAGGCGACTG 7380GTGCCCCATC TCTGGGGGAC TATGTTCGGC CCGCCTACAT CGTCACGCCC TACTGGCCAC 7440CTGTCCAGAG CATCAGATCA CCTGGGACCC CATCGATGGA CGCGTTATCG GCTCAGCTCT 7500ACAGTTCCTT ATCCCTCGAC TCCCCTCCTT CCCCACCCAG AGAACCTCTA AGACCCTCAA 7560GGTCCTTACC CCGCCAATCA CTCATACAAC CCCCAACATT CCACCCTCCT TCCTCCAGGC 7620CATGCGCAAA TACTCCCCCT TCCGAAATGG ATACATGGAA CCCACCCTTG GGCAGCACCT 7680CCCAACCCTG TCTTTTCCAG ACCCCGGACT CCGGCCCCAA AACCTGTACA CCCTCTGGGG 7740AGGCTCCGTT GTCTGCATGT ACCTCTACCA GCTTTCCCCC CCCATCACCT GGCCCCTCCT 7800GCCCCACGTG ATTTTTTGCC ACCCCGGCCA GCTCGGGGCC TTCCTCACCA ATGTTCCCTA 7860CAAGCGAATA GAAGAACTCC TCTATAAAAT TTCCCTCACC ACAGGGGCCC TAATAATTCT 7920ACCCGAAGAC TGTTTGCCCA CCACCCTTTT CCAGCCTGCT AGGGCACCCG TCACGCTAAC 7980AGCCTGGCAA AACGGCCTCC TTCCGTTCCA CTCAACCCTC ACCACTCCAG GCCTTATTTG 8040GACATTTACC GATGGCACGC CTATGATTTC CGGGCCCTGC CCTAAAGATG GCCAGCCATC 8100TTTAGTACTA CAGTCCTCCT CCTTTATATT TCACAAATTT CAAACCAAGG CCTACCACCC 8160CTCATTTCTA CTCTCACACG GCCTCATACA GTACTCTTCC TTTCATAGTT TACATCTCCT 8220GTTTGAAGAA TACACCAACA TCCCCATTTC TCTACTTTTT AACGAAAAAG AGGCAGATGA 8280CAATGACCAT GAGCCCCAAA TATCCCCCGG GGGCTTAGAG CCTCCCAGTG AAAAACATTT 8340CCGAGAAACA GAAGTCTGAA AAGGTCAGGG CCCAGACTAA GGCTCTGACG TCTCCCCCCG 8400GAGGGCAGCT CAGCACCGGC TCGGGCTAGG CCCTGACGTG TCCCCCTGAA GACAAATCAT 8460AAGCTCAGAC CTCCGGGAAG CCACCAAGAA CCACCCATTT CCTCCCCATG TTTGTCAAGC 8520CGTCCTCAGG CGTTGACGAC AACCCCTCAC CTCAAAAAAC TTTTCATGGC ACGCATATGG 8580CTCAATAAAC TAGCAGGAGT CTATAAAAGC GTGGAGACAG TTCAGGAGGG GGCTCGCATC 8640TCTCCTTCAC GCGCCCGCCG CCCTACCTGA GGCCGCCATC CACGCCGGTT GAGTCGCGTT 8700CTGCCGCCTC CCGCCTGTGG TGCCTCCTGA ACTGCGTCCG CCGTCTAGGT AAGTTTAAAG 8760CTCAGGTCGA GACCGGGCCT TTGTCCGGCG CTCCCTTGGA GCCTACCTAG ACTCAGCCGG 8820CTCTCCACGC TTTGCCTGAC CCTGCTTGCT CAACTCTACG TCTTTGTTTC GTTTTCTGTT 8880CTGCGCCGTT ACAGATCGAA AGTTCCACCC CTTTCCCTTT CATTCACGAC TGACTGCCGG 8940CTTGGCCCAC GGCCAAGTAC CGGCGACTCC GTTGGCTCGG AGCCAGCGAC AGCCCATCCT 9000ATAGCACTCT CAGGAGAGAA ATTTAGTACA CATAGTTGGA GGTAG 9045序列編號2序列長度29序列類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸人工合成DNA序列CCAGCGGCCG CGACCTCCAA GACCTCCTG 29序列編號3序列長度29序列類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸人工合成DNA序列AAAGCGGCCG CCCGATAGCC TTGTTCTCA 29序列編號4序列長度29序列類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸 人工合成DNA序列TTTGCGGCCG CAACCCAGCA AACCCCTGG 29序列編號5序列長度29序列類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸人工合成DNA序列TTAGCGGCCG CGGCGCTGTC TCAACATAT 29序列編號6序列長度29序列類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸 人工合成DNA序列AAAGCGGCCG CCGTTCCCTC AGCAATAAA 29序列編號7序列長度29序列類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸 人工合成DNA序列AAAGCGGCCG CGAAGGACTG TCATGTCTG 29序列編號8序列長度29序列類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸 人工合成DNA序列ACTGCGGCCG CCCAGGGGTT TGCTGGGTT 29序列編號9序列長度29序列類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸 人工合成DNA序列TTAGCGGCCG CATATGTTGA GACAGCGCC 29序列編號10序列長度29序列類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸 人工合成DNA序列AAAGCGGCCG CAATACCAAT GGGTTTGTT 29序列編號11序列長度29序列類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸 人工合成DNA序列AATGCGGCCG CCTCGAGGAT GTGGTCTAG 29序列編號12序列長度29序列類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸 人工合成DNA序列AAAGCGGCCG CACTCAGGTT TTATAAGAG 29序列編號13序列長度29序列類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸 人工合成DNA序列ATAGCGGCCG CCCCACTTCC CAGGGTTTG 29序列編號14序列長度29序列類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸 人工合成DNA序列TATGCGGCCG CAGGAAGAGT ACTGTATGA 29序列編號15序列長度3776序列類型核酸鏈型雙鏈拓撲結構線性分子類型cDNA→mRNA初始來源生物人特征名稱/關鍵詞CDS位置139..2205鑒定方法P序列CACGCGTCCG GCCGCCGAAG GGGACTGTTT GCTCCTACGG GCTGTAGATG GAGCTGTCCG 60GCCCCGGAGA GGGGGAAGGC GCCTGGAAAA CGTTCTTCTT CTCCCTGGCC GACCCGAGCG 120GGGAACAGCA CTCCCAGG ATG CAG TTT GTG TCA ACA CGG CCG CAG CCT CAG171Met Gln Phe Val Ser Thr Arg Pro Gln Pro Gln1 5 10CAG CTG GGC ATC CAG GGC CTG GGG CTG GAC AGC GGG AGC TGG AGC TGG219Gln Leu Gly Ile Gln Gly Leu Gly Leu Asp Ser Gly Ser Trp Ser Trp15 20 25GCC CAG GCT CTG CCC CCG GAG CAG GTC TGC CAC CAG GAG CCG GCG CTG267Ala Gln Ala Leu Pro Pro Glu Gln Val Cys His Gln Glu Pro Ala Leu30 35 40CGC GGG GAA ATG GCC GAG GGA ATG CCG CCC ATG CAG GCT CAA GAA TGG315Arg Gly Glu Met Ala Glu Gly Met Pro Pro Met Gln Ala Gln Glu Trp45 50 55GAC ATG GAC GCC CGG CGG CCA ATG CCT TTT CAG TTC CCA CCC TTT CCA363Asp Met Asp Ala Arg Arg Pro Met Pro Phe Gln Phe Pro Pro Phe Pro60 65 70 75GAT AGG GCA CCT GTC TTC CCC GAC CGC ATG ATG CGA GAG CCC CAG TTG411Asp Arg Ala Pro Val Phe Pro Asp Arg Met Met Arg Glu Pro Gln Leu80 85 90CCC ACA GCA GAG ATC TCA CTC TGG ACT GTG GTG GCT GCC ATT CAG GCT459Pro Thr Ala Glu Ile Ser Leu Trp Thr Val Val Ala Ala Ile Gln Ala
95 100 105GTG GAG AGG AAG GTG GAT GCC CAG GCC AGC CAG CTG CTG AAC CTG GAG507Val Glu Arg Lys Val Asp Ala Gln Ala Ser Gln Leu Leu Asn Leu Glu110 115 120GGG CGC ACG GGG ACA GCC GAG AAG AAG CTG GCC GAC TGT GAA AAG ACG555Gly Arg Thr Gly Thr Ala Glu Lys Lys Leu Ala Asp Cys Glu Lys Thr125 130 135GCC GTG GAA TTT GGG AAC CAC ATG GAG AGC AAG TGG GCC GTG CTG GGG603Ala Val Glu Phe Gly Asn His Met Glu Ser Lys Trp Ala Val Leu Gly140 145 150 155ACC CTG CTG CAG GAG TAC GGG CTG CTG CAG AGG CGG CTG GAG AAC TTG651Thr Leu Leu Gln Glu Tyr Gly Leu Leu Gln Arg Arg Leu Glu Asn Leu160 165 170GAG AAC TTG CTG CGC AAC AGG AAC TTC TGG GTC CTG CGG CTG CCC CCG699Glu Asn Leu Leu Arg Asn Arg Asn Phe Trp Val Leu Arg Leu Pro Pro175 180 185GGC AGC AAG GGG GAG GCC CCC AAG GTT CCA GTG ACT TTT GTC GAC ATT747Gly Ser Lys Gly Glu Ala Pro Lys Val Pro Val Thr Phe Val Asp Ile190 195 200GCT GTG TAC TTC TCC GAA GAC GAG TGG AAG AAC TTG GAC GAA TGG CAG795Ala Val Tyr Phe Ser Glu Asp Glu Trp Lys Asn Leu Asp Glu Trp Gln205 210 215AAG GAG CTT TAT AAC AAC CTT GTT AAG GAG AAC TAC AAA ACC CTC ATG843Lys Glu Leu Tyr Asn Asn Leu Val Lys Glu Asn Tyr Lys Thr Leu Met220 225 230 235TCC CTG GAC GCG GAG GGC TCA GTC CCC AAG CCA GAT GCT CCA GTC CAG891Ser Leu Asp Ala Glu Gly Ser Val Pro Lys Pro Asp Ala Pro Val Gln240 245 250GCT GAG CCC AGG GAA GAA CCT TGT GTG TGG GAG CAG CGC CAC CCC GAA939Ala Glu Pro Arg Glu Glu Pro Cys Val Trp Glu Gln Arg His Pro Glu255 260 265GAG AGA GAA ATC CCA ATG GAT CCC GAA GCA GGA GCA GAG CCC CTG GTG987Glu Arg Glu Ile Pro Met Asp Pro Glu Ala Gly Ala Glu Pro Leu Val270 275 280CCT GCG CAG GAT GCG TCC TCC CAG GTG AAG CGT GAG GAC ACC CTG TGT 1035Pro Ala Gln Asp Ala Ser Ser Gln Val Lys Arg Glu Asp Thr Leu Cys285 290 295GTC CGG GGT CAG CGG GGC CTG GAG GAA AGA GCC ATC CCT ACG GAA TCC 1083Val Arg Gly Gln Arg Gly Leu Glu Glu Arg Ala Ile Pro Thr Glu Ser300 305 310 315ATT ACC GAC TCC CCA ATT TCT GCC CAG GAC CTC TTG TCC CGG ATT AAA 1131Ile Thr Asp Ser Pro Ile Ser Ala Gln Asp Leu Leu Ser Arg Ile Lys320 325 330CAG GAG GAG CAT CAG TGC GTG TGG GAT CAG CAG GAT TTG GCA GAC AGA 1179Gln Glu Glu His Gln Cys Val Trp Asp Gln Gln Asp Leu Ala Asp Arg335 340 345GAT ATT CCC ACG GAT CCC AAT TCA GAG TCT CTC ATC TCA GCA CAT GAC 1227Asp Ile Pro Thr Asp Pro Asn Ser Glu Ser Leu Ile Ser Ala His Asp350 355 360ATT TTG TCA TGG ATC AAG CAG GAG GAG CAG CCA TAC CCA TGG GGA CCA 1275Ile Leu Ser Trp Ile Lys Gln Glu Glu Gln Pro Tyr Pro Trp Gly Pro365 370 375CGC GAC TCA ATG GAC GGA GAG CTT GGA TTA GAC TCT GGC CCT AGT GAC 1323Arg Asp Ser Met Asp Gly Glu Leu Gly Leu Asp Ser Gly Pro Ser Asp380 385 390 395AGC CTG CTG ATG GTG AAG AAC CCA CCC CCG GCC CCG CCA CAG CCC CAG 1371Ser Leu Leu Met Val Lys Asn Pro Pro Pro Ala Pro Pro Gln Pro Gln400 405 410CCC CAG CGC CAG CCA CCG CAG CCG CAG CTG CAG TCG CAG CCC CAG CCC 1419Pro Gln Arg Gln Pro Pro Gln Pro Gln Leu Gln Ser Gln Pro Gln Pro415 420 425CAG AGC CTG CCC CCC ATC GCG GTG GCC GAG AAC CCG GGC GGC CCC CCG 1467Gln Ser Leu Pro Pro Ile Ala Val Ala Glu Asn Pro Gly Gly Pro Pro430 435 440AGC CGA GGG CTG CTG GAC GAC GGT TTC CAG GTG CTG CCC GGG GAG CGT 1515Ser Arg Gly Leu Leu Asp Asp Gly Phe Gln Val Leu Pro Gly Glu Arg445 450 455GGC TCC GGC GAG GCG CCG CCG GGT GGG GAC CGC AGC ACC GGG GGC GGC 1563Gly Ser Gly Glu Ala Pro Pro Gly Gly Asp Arg Ser Thr Gly Gly Gly460 465 470 475GGG GGC GAT GGG GGC GGT GGG GGC GGC GGC GCG GAG GCG GGG ACG GGG 1611Gly Gly Asp Gly Gly Gly Gly Gly Gly Gly Ala Glu Ala Gly Thr Gly480 485 490GCA GGC GGC GGC TGT GGC AGC TGC TGC CCT GGC GGG CTG CGG CGG AGC 1659Ala Gly Gly Gly Cys Gly Ser Cys Cys Pro Gly Gly Leu Arg Arg Ser495 500 505CTC CTC CTG CAC GGC GCC CGC AGC AAG CCC TAC TCG TGC CCC GAG TGC 1707Leu Leu Leu His Gly AAa Arg Ser Lys Pro Tyr Ser Cys Pro Glu Cys510 515 520GGC AAG AGC TTC GGC GTG CGC AAG AGC CTC ATC ATC CAC CAC CGC AGC 1755Gly Lys Ser Phe Gly Val Arg Lys Ser Leu Ile Ile His His Arg Ser525 530 535CAC ACC AAG GAG CGG CCC TAC GAG TGC GCT GAG TGC GAG AAG AGC TTC 1803His Thr Lys Glu Arg Pro Tyr Glu Cys Ala Glu Cys Glu Lys Ser Phe540 545 550 555AAC TGC CAC TCG GGC CTC ATC CGC CAC CAG ATG ACG CAC CGC GGC GAG 1851Asn Cys His Ser Gly Leu Ile Arg His Gln Met Thr His Arg Gly Glu560 565 570CGG CCC TAC AAG TGC TCG GAG TGC GAG AAG ACC TAC AGC CGT AAG GAG 1899Arg Pro Tyr Lys Cys Ser Glu Cys Glu Lys Thr Tyr Ser Arg Lys Glu575 580 585CAC CTG CAG AAC CAC CAG CGG CTG CAC ACG GGC GAG CGG CCT TTC CAA 1947His Leu Gln Asn His Gln Arg Leu His Thr Gly Glu Arg Pro Phe Gln590 595 600TGT GCA CTG TGC GGC AAG AGC TTC ATC CGC AAG CAG AAC CTG CTC AAG 1995Cys Ala Leu Cys Gly Lys Ser Phe Ile Arg Lys Gln Asn Leu Leu Lys605 610 615CAC CAG CGC ATC CAC ACG GGC GAG CGC CCC TAC ACG TGC GGC GAG TGC 2043His Gln Arg Ile His Thr Gly Glu Arg Pro Tyr Thr Cys Gly Glu Cys620 625 630 635GGC AAG AGC TTC CGC TAC AAG GAG TCG CTC AAG GAC CAC CTG CAG TGC 2091Gly Lys Ser Phe Arg Tyr Lys Glu Ser Leu Lys Asp His Leu Gln Cys640 645 650ACA GCG GCG GCC CGG GCC CCG GCG CCC CAC GGC AGC TCC CGC CGC CTC 2139Ala Arg Ala Pro Ala Pro His Gly Ser Ser Arg Arg Leu Leu Ser Glu655 660 665CTG AGC GAG ACT AGG GCT GGG CTG GGG GAG GGC AGG GCC GGA CGG AGT 2187Thr Arg Ala Gly Thr Ala Ala Leu Gly Glu Gly Arg Ala Gly Arg Ser670 675 680GGA TCG GGG GCG GCC TGAGCACCAA CCACCTTGCC GGGTGTCCTC AGCCACCGTC 2242Gly Ser Gly Ala Ala685TGGAAATCGG CAACAGGCAT TGCACTCCGG TTGGGGGTCC CCCAGGGTGG GGCAGGGATC 2302CCCCAGATCT GTCTGGTCTG AATGGACGCC CAGCTCATCT AGGGTGGACC CAGCTGCTGG 2362GGAAGAGCCA GGGGGACCGC GAGGAGCCGA GCGTCCTCGG GCACCGCCCT CACACCTCCT 2422CGAGTGCCCT GGGACCACTG GGCCACAGAT GGTCATCAGG GGAAGCCACC AGGGAGTCCC 2482GAAGCCCTTC TGAGATCAGG AAATCAGGTC CCAAGGTTAG GAGACGCCCT GAAAAAAAGT 2542GAAGGCCGAG GGATGTGCTA AGGGTAACAC CTTCATGATG ACAACACTGC CTCGCGTTTC 2602AATAGCGCTT TATACTTTTT TAAGTGTTTT CTATCCGTTA TCCATTTCAC CCTTGGCCTA 2662TCCCTCTCAG ATAGGTGGGG TAGGATTTTC CTGGTGACCG AGTAAAGTGA GAGGCAGGTG 2722AGACGGTTCA CCCAATCACA CGGGAAGGGG CGCGCGCTGC CCAACCGCGC TCTCCGCCTA 2782CCTCGCTGCT CGGGAAGCTG CTGGCCTGGC CCTCCTGGTC TCTCTTCCTT TCTGGTCTCT 2842CTTCCTTTCC TTGCTCTCAC CCACGGATAA AACCAGAAGC GACAGGAGGC CAGCTCCTGG 2902GGTTCCTGGG ACCGGGAACA GATTGGCTAC GGAACGCCCC AGGTTGTACA TTCAGAGGGC 2962TCTTTCTCCA TGGGAGCTCC TGGTGCCGCC TTCGGCCCCA GCCTGTCCCC AGCCCCTCAA 3022TCTGGTGCAG CAGCATCTTG TCACTGCACA ACAGTGGCCT GGTCCCCCAC AGGCAGTTAG 3082GGCCCCAGGT CAGACCTCAC CATGATGATT TGTTCCAGTT CTCCCAGGGC AGAGGGGCGA 3142GGGAGAGGCT TTTGCTGTGA GAGTAGCCGT CACGTGTCTC TTCCCAGCAG CGCCGGGCAA 3202GTGGGTGCTA GAGTCTGAGC CTCAGGCTCT CCTGCCCTGG GCCTCCCAAT TGGTGCTATC 3262TGTTACTGCC CGTGCTCACG GACATGGATA CAGACCCTGC TGTGCTCCAC ACCCTGCAGG 3322CGCCTCGGGA AGCGCCCAAA GGATTCCCCT TCACGTTGGT GCACCTGCTC CATAGCTCCG 3382GGCGCTGCGT CCCGAGGGGC CACAGTCTCC ATTTCAGCGT CTTGCATGGC CTGGCACCGG 3442GTGGGGTGGT ATGCCCCCTT GTTTGTGTCA AAAATGACTT TCCCTGCCCT TGCCGTGGGT 3502CCGGCGTTCC TCCCAGCCGG GATCACAGTG GGCAGCCGGC ACCCGGCACC ACTTTGGCGA 3562GCGTCCTGCT TCCGCCCTCG CCCTCATCTA CGCTGCTCCG CTTTCCTCAG ACCCCTTTTT 3622GCCGTGCAAA GGAATTCTTG ACATTAAATA AAAGGTATCC AGATTGCAGA CTGCATGTTC 3682ACAGAGCTGG GGGTTCTCCA GCTTGCCTAC AGTAAAGCCT CAATGAACTG GAAAAAAAAA 3742AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAA 3776序列編號16序列長度32序列類型核酸鏈型單鏈拓撲結構線性分子類型人工合成DNAGATCTAAGTT CCACCCCTTT CCCTTTCATT CG 32序列編號17序列長度32序列類型核酸鏈型單鏈拓撲結構線性分子類型人工合成DNAGATCCGAATG AAAGGGGAAAG GGGTGGAACT TA 32序列編號18序列長度20序列類型核酸鏈型單鏈拓撲結構線性分子類型人工合成DNACCTGAGGTAA TTATAACCCG 20序列編號19序列長度20序列類型核酸鏈型單鏈拓撲結構線性分子類型人工合成DNACGCTGATATC GATCGCGCGC 20
權利要求
1.一種具有基因表達抑制功能的DNA分子,包括一段至少400個鄰接核苷酸的DNA序列,該序列包含在序列表中1#序列2268位胞嘧啶~4080位胸腺嘧啶的DNA序列中,或者一段與該段DNA序列具有約59%或59%以上同源性的DNA序列。
2.一種具有基因表達抑制功能的DNA分子,是一段至少400個鄰接核苷酸的DNA序列,該段序列包含在序列表中1#序列2268位胞嘧啶~4080位胸腺嘧啶的DNA序列中,或者是一段與該段DNA序列具有約59%或59%以上同源性的DNA序列。
3.權利要求1或2的DNA分子,包括序列表中1#序列2268位胞嘧啶~3182位鳥嘌呤的一段DNA序列,或者一段與該段DNA序列具有約59%或59%以上同源性的DNA序列。
4.權利要求1或2的DNA分子,包括序列表中1#序列3368位腺嘌呤~3780位腺嘌呤的一段DNA序列,或者一段與該段DNA序列具有約59%或59%以上同源性的DNA序列。
5.權利要求1或2的DNA分子,包括序列表中1#序列3165位腺嘌呤~4080位胸腺嘧啶的一段DNA序列,或者一段與該段DNA序列具有約59%或59%以上同源性的DNA序列。
6.一種包含一段在宿主細胞內具有活性的啟動子序列、權利要求1~5之任一項的DNA分子以及一段RRE或RXE序列的質粒。
7.權利要求6的質粒,進一步包含一段治療基因序列。
8根據權利要求6或7的質粒,其中啟動子是一種在病毒感染細胞中能提高表達效率的啟動子。
9.根據權利要求8的質粒,其中啟動子是LTR。
10.根據權利要求7的質粒,其中治療基因序列是對宿主細胞具有毒性的一段基因序列或能阻止病毒復制的一段基因序列。
11.權利要求1~5之任一項的DNA分子在基因表達抑制中的應用。
12.權利要求1~5之任一項的DNA分子在病毒感染性疾病治療中的應用。
13.根據權利要求12的應用,其中病毒感染性疾病是人類T細胞白血病和HIV感染性疾病。
14.一種與轉錄抑制區結合的蛋白質,該轉錄抑制區存在于I型人類T細胞白血病病毒基因LTR的U5區,該蛋白質包含一個Kruppel型轉錄抑制因子共有的結構域和四個半Kruppel型鋅指結構域。
15.權利要求14的蛋白質,其分子量約76 kDa。
16.權利要求14的蛋白質,其中Kruppel型轉錄抑制因子共有的結構域是序列表中15#序列196位纈氨酸~261位色氨酸的一段氨基酸序列,或與此序列相似的一段序列;而四個半Kruppel型鋅指結構域是序列表中15#序列518位酪氨酸~648位組氨酸的一段氨基酸序列,或與此序列相似的一段序列。
17.權利要求16的蛋白質,進一步包含序列表中15#序列154位亮氨酸~185位亮氨酸的一段氨基酸序列,序列表中15#序列403位脯氨酸~443位脯氨酸的一段氨基酸序列和序列表中15#序列470位精氨酸~503位甘氨酸的一段氨基酸序列,或與這些氨基酸序列相似的序列。
18.權利要求14的蛋白質,包含序列表中15#序列1位蛋氨酸~688位丙氨酸的一段氨基酸序列,或與此序列相似的一段序列。
19.一種編碼權利要求14~18之任一項的蛋白質的DNA分子。
20.權利要求19的DNA分子,包括序列表中15#序列724位鳥嘌呤~921位鳥嘌呤的一段堿基序列和序列表中15#序列1690位胸腺嘧啶~2082位胞嘧啶的一段堿基序列。
21.權利要求20的DNA分子,進一步包括序列表中15#序列598位胞嘧啶~693位鳥嘌呤的一段堿基序列、序列表中15#序列1345位胞嘧啶~1467位鳥嘌呤的一段堿基序列以及序列表中15#序列1546位胞嘧啶~1647位鳥嘌呤的一段堿基序列。
22.權利要求19的DNA分子,包括序列表中15#序列139位腺嘌呤~2202位胞嘧啶的一段堿基序列。
23.權利要求22的DNA分子,包括序列表中15#序列1位胞嘧啶-3776位腺嘌呤的一段堿基序列。
24.一種包含權利要求19~23之任一項的DNA分子的表達載體。
25.一種將權利要求24的表達載體導入一種宿主內可得的轉化體。
26.根據權利要求25的轉化體,其中的宿主是大腸桿菌。
27.一種制備權利要求14~18之任一項的蛋白質的方法,包括下列步驟培養權利要求25的轉化體,以及從培養基中回收所產生的蛋白質。
28.一種含有權利要求14~18之任一項的蛋白質作為有效成分的抗病毒制劑。
29.一種癌癥檢測方法,其中利用權利要求14~18之任一項的蛋白質表達作為檢測指標。
全文摘要
本發明提供了一種DNA分子,其來源于Ⅰ型人類T細胞白血病病毒(HTLV-Ⅰ),具有基因表達抑制功能。該DNA分子存在于這樣一個區域,該區域在表達p21X mRNA的突變型前病毒中丟失,但在完整前病毒的基因組中該區域存在。本發明還提供了含有此DNA分子的一種質粒。此外,還提供了一種新的蛋白質(TRP-1)和編碼此蛋白的結構基因,該蛋白質特異地結合U5RE,其可能有助于闡明轉錄抑制活性和神經細胞癌變機理,這其中有轉錄抑制區(U5RE)參與,而U5RE位于Ⅰ型人類T細胞白血病病毒基因LTR的U5區中。此外,還提供了一種含有此基因的表達載體、一種導入了該表達載體的轉化體以及一種利用該轉化體制備TRP-1蛋白的方法。
文檔編號C12N15/48GK1184506SQ96193920
公開日1998年6月10日 申請日期1996年3月19日 優先權日1995年3月24日
發明者雑賀昭彥, 織田聡, 五十嵐久永, 奧村晃市, 阪口岳 申請人:鹽野義制藥株式會社