專利名稱:一種新的人基因編碼序列、其編碼的多肽及制備方法
技術領域:
本發明涉及基因工程領域,具體地,本發明涉及一種新的人基因核苷酸序列。更具體地說,本發明涉及人hCAF1的cDNA序列,該蛋白是鼠mCAF1的同系物。本發明還涉及由該核苷酸序列編碼的多肽,這些多核苷酸和多肽的應用,以及所述多核苷酸和所述多肽的生產方法。
CCR4復合物是酵母中一類轉錄調控復合物。已知的該復合物的組成成分有CCR4(Malvar T,et al,Genetics,1992,Vol132951-956),yCAF1,DBF1,NOT(LiuY.H.et al,EMBO Journal,1998,Vol 17,No.41096-1106),DHH1(Hata H,et al,Genetics,1998,Vol 148,No.2571-579)。CCR4復合物作為整體在調控轉錄過程的作用尚無深入研究。
酵母yCAF1(POP2)(CCR4-associated factor l,即CCR4相關因子1)最初是由Sakai A.等人從釀酒酵母中分離得到。此基因編碼的49.7kDa的蛋白含有與轉錄相關的三個富谷氨酸序列、一個富脯氨酸區和一個富絲/蘇氨酸區但沒有DNA結合區域。yCAF1缺陷引起諸多表型,包括(1)溫度敏感生長。(2)抑制一些酶如異檸檬酸裂解酶、蔗糖酶在葡萄糖去阻遏(glucose derepression)條件下的表達,特別地,可以抑制由于Spt6或Spt10突變造成的乙醇脫氫酶(ADHII)表達的增強。(3)不能利用除葡萄糖以外的其他碳源。(4)使純合二倍體不能產生孢子。(5)磷酸甘油酸激酶(PGK)表達的增強(Sakai A et al,Nucleic Acids Research,1992,Vol 20,No 236227-6233)。Draper M.P.等人的進一步研究發現,完整的酵母yCAF1基因是與LexA結合的激活因子發揮最大活性所必須的,并且當其與LexA融合后可以活化報告基因的轉錄。這一切表明CAF1蛋白是多種基因的轉錄調控因子,不僅調控與碳源利用相關基因的表達還可以調控其他基因的表達,不僅存在正調控作用還存在負調控作用。(Draper M.P.et al,Molecular and Cellular Biology,1995,Vol 15,No73487-3495)1997年,發現了CCR4復合物的另一成分,一個受細胞周期調控的蛋白激酶DBF2,由此推測yCAF1也有相似的功能。同年,Liu H.Y.等證明了酵母yCAF1在細胞周期的調控中也發揮作用,yCAF1缺失影響有絲分裂后期的進行,導致有絲分裂后期細胞比例的增加。(Liu H.Y.et al,EMBO Journal,1997,Vol 16,No 175289-5298)。
1995年,Draper M.P.等從小鼠中分離了酵母yCAF1的同源基因mCAF1。用此基因取代酵母yCAF1的C端形成的融合蛋白仍可在酵母雙雜交系中激活報告基因的表達,這顯示了CAF1在真核生物中的結構和功能的保守性(Draper M.P.et al,Molecular and Cellular Biology,1995,Vol 15,No 73487-3495)。1998年,Rouault J.P.等發現mCAF1與Btg家族成員Btg1和Btg2發生作用。Btg1和Btg2與細胞生長控制有關,Btg2在胚胎干細胞中的失活可中斷DNA受損引起的G2/M期細胞滯育(Rouault J.P.Journal of Biological Chemistry,1998,Vol 272,No.3522563-22569)。特別是Moser M.J.等在mCAF1蛋白中發現了具有校讀功能的核酸外切酶活性區(Moser M.J.et al,Nucleic Acid Research,1997,Vol 255110-5118),提示mCAF1與Btg1,Btg2作用,并可能參與了DNA修復過程。
CCR4復合物的另一組分CCR4蛋白也是一轉錄調控因子。與yCAF1類似,CCR4蛋白參與調控包括ADH2在內的多種基因的表達,其氨基酸序列中的亮氨酸重復區被認為是與CCR4復合物的其他蛋白成員相互作用的區域(Denis C.L.,et alGenetics,1984,Vol.108833-844;Malvar T.et al,Genetics,1992,Vol.132951-962)。此外,NOT蛋白也被證明是CCR4復合物的成分之一,NOT復合物曾被認為對多種基因的表達起負調控作用(Liu Y.H.et al,EMBO Journal,1998,Vol 17,No.41096-1106)。
在本發明之前沒有人發現或公開過人的hCAF1基因。
本發明的一個目的是提供一種新的多核苷酸,該多核苷酸編碼CAF1家族的一個新成員,本發明的CAF1家族成員被命名為人CCR4相關因子I(簡稱為hCAF1)。
本發明的另一個目的是提供一種CAF1家族新的人的成員,該蛋白被命名為hCAF1。
本發明的再一個目的是提供一種利用重組技術生產所述的CAF1家族新的人的成員的方法。
本發明還提供了這種CAF1家族人的成員hCAF1多核苷酸和多肽的應用。
在本發明的一個方面,提供了一種分離出的DNA分子,它包括編碼具有人hCAF1蛋白活性的多肽的核苷酸序列,所述的核苷酸序列與SEQ ID NO.3中從核苷酸38-895位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度嚴緊條件下與SEQ ID NO.3中從核苷酸38-895位的核苷酸序列雜交。較佳地,所述的序列編碼一多肽,該多肽具有SEQ ID NO.4所示的序列。更佳地,該序列具有SEQ ID NO.3中從核苷酸38-895位的核苷酸序列。
在本發明的另一方面,提供了一種分離的hCAF1蛋白多肽,它包括具有SEQID NO.4氨基酸序列的多肽、或其活性片段,或其活性衍生物。較佳地,該多肽是具有SEQ ID NO.4序列的多肽。
在本發明的另一方面,提供了一種載體,它含有上述分離出的DNA。
在本發明的另一方面,提供了一種所述載體轉化的宿主細胞。
在本發明的另一方面,提供了一種產生具有hCAF1蛋白活性的多肽的方法,該方法包括(a)將編碼具有hCAF1蛋白活性的多肽的核苷酸序列可操作地連于表達調控序列,形成hCAF1蛋白表達載體,所述的核苷酸序列與SEQ ID NO.3中從核苷酸38-895位的核苷酸序列有至少70%的同源性;(b)將步驟(a)中的表達載體轉入宿主細胞,形成hCAF1蛋白的重組細胞;(c)在適合表達hCAF1蛋白多肽的條件下,培養步驟(b)中的重組細胞;(d)分離出具有hCAF1蛋白活性的多肽。
在本發明的一個具體實施方案中,本發明的分離的多核苷酸全長為978個核苷酸,其詳細序列見SEQ ID NO.3,其中開放讀框位于38-895位核苷酸。
在本發明中,“分離的”、“純化的”或“基本純的”DNA是指,該DNA或片段已從天然狀態下位于其兩側的序列中分離出來,還指該DNA或片段已經與天然狀態下伴隨核酸的組份分開,而且已經與在細胞中伴隨其的蛋白質分開。
在本發明中,術語“hCAF1蛋白(或多肽)編碼序列”指編碼具有hCAF1蛋白活性的多肽的核苷酸序列,如SEQ ID NO.3中38-895位核苷酸序列及其簡并序列。該簡并序列是指,位于SEQ ID NO.3序列的編碼框38-895位核苷酸中,有一個或多個密碼子被編碼相同氨基酸的簡并密碼子所取代后而產生的序列。由于密碼子的簡并性,所以與SEQ ID NO.3中38-895位核苷酸序列同源性低至約70%的簡并序列也能編碼出SEQ ID NO.4所述的序列。該術語還包括能在中度嚴緊條件下,更佳地在高度嚴緊條件下,與SEQ ID NO.3中從核苷酸38-895位的核苷酸序列雜交的核苷酸序列。還術語還包括與SEQ ID NO.3中從核苷酸38-895位的核苷酸序列的同源性至少70%,較佳地至少80%,更佳地至少90%的核苷酸序列。
該術語還包括能編碼具有與人hCAF1相同功能的蛋白的、SEQ ID NO.3序列中38-895位的變異形式。這些變異形式包括(但并不限于)若干個(通常為1-90個,較佳地1-60個,更佳地1-20個,最佳地1-10個)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加數個(通常為60個以內,較佳地為30個以內,更佳地為10個以內,最佳地為5個以內)核苷酸。
在本發明中,“基本純的”蛋白質或多肽是指其至少占樣品總物質的至少20%,較佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或濕重計)。純度可以用任何合適的方法進行測量,如用柱層析、PAGE或HPLC法測量多肽的純度。基本純的多肽基本上不含天然狀態下的伴隨其的組分。
在本發明中,術語“hCAF1蛋白多肽”指具有hCAFI蛋白活性的SEQ ID NO.4序列的多肽。該術語還包括具有與人高效淋巴細胞趨化因子相同功能的、SEQ IDNO.4序列的變異形式。這些變異形式包括(但并不限于)若干個(通常為1-50個,較佳地1-30個,更佳地1-20個,最佳地1-10個)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一個或數個(通常為20個以內,較佳地為10個以內,更佳地為5個以內)氨基酸。例如,在本領域中,用性能相近或相似的氨基酸進行取代時,通常不會改變蛋白質的功能。又比如,在C末端和/或N末端添加一個或數個氨基酸通常也不會改變蛋白質的功能。該術語還包括hCAF1蛋白的活性片段和活性衍生物。
該多肽的變異形式包括同源序列、等位變異體、天然突變體、誘導突變體、在高或低的嚴謹度條件下能與hCAF1 DNA雜交的DNA所編碼的蛋白、以及利用抗hCAF1多肽的抗血清獲得的多肽或蛋白。本發明還提供了其他多肽,如包含hCAF1多肽或其片段的融合蛋白。除了幾乎全長的多肽外,本發明還包括了hCAF1多肽的可溶性片段。通常,該片段具有hCAF1多肽序列的至少約10個連續氨基酸,通常至少約30個連續氨基酸,較佳地至少約50個連續氨基酸,更佳地至少約80個連續氨基酸,最佳地至少約100個連續氨基酸。
發明還提供hCAF1蛋白或多肽的類似物。這些類似物與天然hCAF1多肽的差別可以是氨基酸序列上的差異,也可以是不影響序列的修飾形式上的差異,或者兼而有之。這些多肽包括天然或誘導的遺傳變異體。誘導變異體可以通過各種常規技術得到,如通過輻射或暴露于誘變劑而產生隨機誘變,還可通過定點誘變法或其他已知分子生物學的技術。類似物還包括具有不同于天然L-氨基酸的殘基(如D-氨基酸)的類似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的類似物。應理解,本發明的多肽并不限于上述例舉的代表性的多肽。
修飾(通常不改變一級結構)形式包括體內或體外的多肽的化學衍生形式如乙酰化或羧基化。修飾還包括糖基化,如那些在多肽的合成和加工中或進一步加工步驟中進行糖基化修飾而產生的多肽。這種修飾可以通過將多肽暴露于進行糖基化的酶(如哺乳動物的糖基化酶或去糖基化酶)而完成。修飾形式還包括具有磷酸化氨基酸殘基(如磷酸酪氨酸,磷酸絲氨酸,磷酸蘇氨酸)的序列。還包括被修飾從而提高了其抗蛋白水解性能或優化了溶解性能的多肽。
本發明還包括hCAF1多肽編碼序列的反義序列。這種反義序列可用于抑制細胞內hCAF1的表達。
本發明還包括一種探針分子,該分子通常具有hCAF1多肽編碼序列的8-100個,較佳地15-50個連續核苷酸。該探針可用于檢測樣品中是否存在編碼hCAF1的核酸分子。
本發明還包括檢測hCAF1核苷酸序列的方法,它包括用上述的探針與樣品進行雜交,然后檢測探針是否發生了結合。較佳地,該樣品是PCR擴增后的產物,其中PCR擴增引物對應于hCAF1多肽的編碼序列,并可位于該編碼序列的兩側或中間。引物長度一般為20-50個核苷酸。
在本發明中,可選用本領域已知的各種載體,如市售的載體。
在本發明中,術語“宿主細胞”包括原核細胞和真核細胞。常用的原核宿主細胞的例子包括大腸桿菌、枯草桿菌等。常用的真核宿主細胞包括酵母細胞、昆蟲細胞、和哺乳動物細胞。較佳地,該宿主細胞是真核細胞,如CHO細胞、COS細胞等。
另一方面,本發明還包括對hCAF1 DNA或是其片段編碼的多肽具有特異性的多克隆抗體和單克隆抗體,尤其是單克隆抗體。這里,“特異性”是指抗體能結合于hCAF1基因產物或片段。較佳地,指那些能與hCAF1基因產物或片段結合但不識別和結合于其它非相關抗原分子的抗體。本發明中抗體包括那些能夠結合并抑制hCAF1蛋白的分子,也包括那些并不影響hCAF1蛋白功能的抗體。本發明還包括那些能與修飾或未經修飾形式的hCAF1基因產物結合的抗體。
本發明不僅包括完整的單克隆或多克隆抗體,而且還包括具有免疫活性的抗體片段,如Fab’或(Fab)2片段;抗體重鏈;抗體輕鏈;遺傳工程改造的單鏈Fv分子(Ladner等人,美國專利No.4,946,778);或嵌合抗體,如具有鼠抗體結合特異性但仍保留來自人的抗體部分的抗體。
本發明的抗體可以通過本領域內技術人員已知的各種技術進行制備。例如,純化的hCAF1基因產物或者其具有抗原性的片段,可被施用于動物以誘導多克隆抗體的產生。與之相似的,表達hCAF1或其具有抗原性的片段的細胞可用來免疫動物來生產抗體。本發明的抗體也可以是單克隆抗體。此類單克隆抗體可以利用雜交瘤技術來制備(見Kohler等人,Nature 256;495,1975;Kohler等人,Eur.J.Immunol.6511,1976;Kohler等人,Eur.J.Immunol.6292,1976;Hammerling等人,In Monoclonal Antibodies and T Cell Hybridomas,Elsevier,N.Y.,1981)。本發明的抗體包括能阻斷hCAF1功能的抗體以及不影響hCAF1功能的抗體。本發明的各類抗體可以利用hCAF1基因產物的片段或功能區,通過常規免疫技術獲得。這些片段或功能區可以利用重組方法制備或利用多肽合成儀合成。與hCAF1基因產物的未修飾形式結合的抗體可以用原核細胞(例如E.Coli)中生產的基因產物來免疫動物而產生;與翻譯后修飾形式(如糖基化或磷酸化的蛋白或多肽)結合的抗體,可以用真核細胞(例如酵母或昆蟲細胞)中產生的基因產物來免疫動物而獲得。
在附圖中,
圖1為本發明的人hCAF1與小鼠mCAF1的核酸序列的同源比較圖。其中,相同的核苷酸用“|”標出。在序列上方的“.”用于標出編號為10的倍數的核苷酸。
圖2為本發明的人hCAF1與小鼠mCAF1的氨基酸序列的同源比較圖。其中,相同的氨基酸在兩個序列之間用“|”標出,相似的氨基酸用“.”標出。在序列上方的“.”用于標出編號為10的倍數的氨基酸。
在本發明中,人hCAF1的cDNA核苷酸序列是如此獲得的,以人肝臟λgt11cDNA文庫(購自Clontech公司)為模板,用兩對寡核苷酸為引物——A15’-TTGATGCTTGGCATC TAGACTCC-3’(SEQ ID NO1)為正向引物,寡核苷酸A25’-TTGTTCGAGGGATTCAACCAGAG-3’(SEQ ID NO2)為反向引物,進行PCR。測序后得到SEQ ID NO.3的全長cDNA序列。
由于本發明的人hCAF1基因同小鼠mCAF1基因極高的同源性,可以推測本發明的人hCAF1蛋白是人體中重要的轉錄調控因子,調節多種基因的轉錄并參與控制包括細胞周期在內的多種細胞生理過程。又由于本發明的人hCAF1蛋白包含有核酸外切酶活性區,所以本發明蛋白可能涉及DNA修復。鑒于此,本發明提供了對體內基因表達調控和DNA修復過程研究的新途徑。
由于作為CCR4轉錄調控復合物組分之一的CAF1在真核生物中有保守性,這暗示在其他真核生物中存在CCR4類似復合物,鑒于此,本發明提供了分離、鑒定包括人在內的其他真核生物中CCR4類似復合物及其多種組成成分的新途徑。
下面結合具體實施例,進一步闡述本發明。應理解,這些實施例僅用于說明本發明而不用于限制本發明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規條件如Sambrook等人,分子克隆實驗室手冊(New YorkCold Spring HarborLaboratory Press,1989)中所述的條件,或按照制造廠商所建議的條件。
實施例1hCAF1的cDNA序列的克隆和測定1.引物擴增以人肝臟λgt11cDNA文庫(購自Clontech公司)為模板,用一對寡核苷酸為引物——A15’-TTG ATG CTT GGC ATC TAG ACT CC-3’(SEQ ID NO1)為正向引物,寡核苷酸A25’-TTG TTC GAG GGA TTC AAC CAG AG-3’(SEQ IDNO2)為反向引物,進行PCR。A1/A2的PCR條件為93℃4分鐘,隨之以93℃1分鐘、68℃1分鐘和72℃1分鐘進行35個循環,最后72℃延伸5分鐘。電泳檢測得到約1K的目的片段。
2.PCR產物的測序將這段PCR擴增產物A1/A2與pGEM-TTM載體(Promega)連接,轉化大腸桿菌JM103,用QIAprep Plasmid試劑盒(QIAGEN)提取質粒,用雙鏈嵌套式缺失試劑盒(Pharmacia)對插入片段進行定向系列缺失,然后用PCR對缺失子進行快速鑒定及排序。用SequiTherm EXCELTMDNA測序試劑盒(Epicentre Technologies)對依次截短的缺失子進行測序,最后用電腦軟件拼接順序,獲得全長cDNA序列,共978bp,詳細序列見SEQ ID NO3,其中開放讀框位于38-895位核苷酸。
根據得到的全長cDNA序列推導出hCAF1的氨基酸序列,共285個氨基酸殘基,其氨基酸序列詳見SEQ ID NO4。
實施例2同源比較用本發明的hCAF1的全長cDNA序列及其編碼蛋白在Non-redundantGenBank+EMBL+DDBJ+PDB數據庫及Non-redundant GenBank CDStranslations+PDB+SwissProt+Spupdate+PIR數據庫中用BLAST軟件進行核酸和蛋白同源檢索,發現小鼠mCAF1基因(Genebank accession No.21855)與本發明的人的hCAF1基因具有極高的同源度,兩者核苷酸序列同一性為91%(圖1),氨基酸序列同一性及相似性均為99%(圖2),只有三個氨基酸的差別。此外酵母yCAF1、線蟲cCAF1基因與本發明的人hCAF1基因也有較高的同源性。
由于本發明的人hCAF1基因同小鼠mCAF1基因極高的同源性,而小鼠mCAF1已被證明具有調節基因轉錄的功能,因此本發明的人hCAF1蛋白是人體中重要的轉錄調控因子,調節多種基因的轉錄。HCAF1基因缺失或表達異常會導致細胞無法健康正常的生長。因此,本發明的hCAF1蛋白可用于治療因hCAF1表達異常或缺失而導致的疾病。又由于人hCAF1在酵母中的同源基因yCAF1已被證明通過影響有絲分裂后期的進行對細胞周期進行調控,因此可以推測人hCAF1可能參與控制包括細胞周期在內的多種細胞生理過程。又由于本發明的人hCAF1蛋白包含有核酸外切酶活性區,所以本發明蛋白可能涉及DNA修復。鑒于此,本發明提供了對體內基因表達調節、細胞周期調控和DNA修復過程研究的新途徑。
由于作為CCR4轉錄調控復合物組分之一的CAF1在真核生物中有保守性,這暗示在其他真核生物中存在CCR4復合物類似物,鑒于此,本發明提供了分離、鑒定包括人在內的其他真核生物中CCR4復合物類似物及其多種組成成分的新途徑。
本發明的hCAF1除了可作為該家族一員用于進一步的功能研究,還可用于與其他蛋白一起產生融合蛋白,比如與免疫球蛋白一起產生融合蛋白。此外,本發明hCAF1還可以與該家族的其他成員進行融合或交換片段,以產生新的蛋白,如將本發明hCAF1的N端與鼠mCAF1的N端進行交換,以產生新的活性更高或具有新特性的蛋白。
針對本發明hCAF1的抗體,用于篩選該家族的其他成員,或者用于親和純化相關蛋白(如該家族的其他成員)。
實施例3hCAF1在大腸桿菌中的表達在該實施例中,將編碼hCAF1的cDNA序列用對應于該DNA序列的5′和3′端的PCR寡核苷酸引物進行擴增,獲得hCAF1 cDNA作為插入片段。
PCR反應中使用的5′寡核苷酸引物序列為5′-TCAGGGATCCATGCCAGCGGAACTTGTAG-3′(SEQ ID NO.5),該引物含有BamHI限制性內切酶的酶切位點,在該酶切位點之后是由起始密碼子開始的hCAF1編碼序列的19個核苷酸;
3′端引物序列為5’-TTGGGTCGACTCATGACTGCTTGTTGGCT-3’(SEQID NO.6),該引物含有SalI限制性內切酶的酶切位點、翻譯終止子和hCAF1的部分編碼序列。
引物上的限制性內切酶的酶切位點對應于細菌表達載體pQE-9(Qiagen Inc.,Chatsworth,CA)上的限制性內切酶酶切位點,該質粒載體編碼抗生素抗性(Ampr)、一個細菌復制起點(ori)、一個IPTG-可調啟動子/操縱子(P/O)、一個核糖體結合位點(RBS)、一個6-組氨酸標記物(6-His)以及限制性內切酶克隆位點。
用BamHI和SalI消化pQE-9載體,隨后將插入片段連接到pQE-9載體并保持開放讀框在細菌RBS起始。隨后用連接混合物轉化購自Qiagen,商品名為M15/rep4的E.coli菌株,M15/rep4含有多拷貝的質粒pREP4,其表達lacI阻遏物并攜帶卡那霉素抗性(Kanr)。在含有Amp和Kan的LB培養皿上篩選轉化子,抽提質粒,測序驗證hCAF1的cDNA片段已正確插入了載體。
在補加Amp(100μg/ml)和Kan(25μg/ml)的LB液體培養基中過夜培養(O/N)含所需構建物的陽性轉化子克隆。過夜(O/N)培養物以1∶100-1∶250的稀釋率稀釋,然后接種到大體積培養基中,培養細胞生長至600光密度(OD600)為0.4-0.6時,加入IPTG(“異丙基硫代-β-D-半乳糖苷”)至終濃度為1mM。通過使laeI阻遏物失活,IPTG誘導啟動P/O導致基因表達水平提高。繼續培養細胞3-4小時,隨后離心(6000×g,20分鐘)。超聲裂解包涵體,收集細胞并將細胞沉淀溶于6M的鹽酸胍中。澄清后,通過在能使含6-His標記物蛋白緊密結合的條件下,用鎳-螯合柱層析從溶液中純化溶解的hCAF1。用6M鹽酸胍(pH5.0)從柱中洗脫hCAF1。可用幾種方法從鹽酸胍中變性沉淀蛋白。或者,使用透析步驟除去鹽酸胍,或者從鎳-螯合柱中分離出的純化蛋白。純化后的蛋白質被結合到第二個柱中,該柱中具有遞減的線性鹽酸胍梯度。在結合到該柱時蛋白質變性,隨后用鹽酸胍(pH5.0)洗脫。最后,將可溶的蛋白質用PBS進行透析,然后將蛋白質保存在終濃度為10%(w/v)甘油的貯存液中。
用12%的SDS-PAGE膠進行電泳,鑒定表達蛋白的分子量大小為約33KDa。
此外,用常規方法對達蛋白的N端和C端各10個氨基酸長度的氨基酸進行測序,發現與SEQ ID NO.4的序列一致。
實施例4hCAF1在真核細胞(CHO細胞株)中的表達在該實施例中,將編碼hCAF1的cDNA序列用對應于該DNA序列的5′和3′端的PCR寡核苷酸引物進行擴增,獲得hCAF1 cDNA作為插入片段。
PCR反應中使用的5′寡核苷酸引物序列為5′-TCAGGGATCCATGCCAGCGGAACTTGTAG-3′(SEQ ID NO.5)該引物含有BamHI限制性內切酶的酶切位點,在該酶切位點之后是由起始密碼子開始的hCAF1編碼序列的19個核苷酸;3′端引物序列為5’-TTGGACTAGTTCATGACTGCTTGTTGGCT-3’(SFQ ID NO.7)該引物含有SpeI限制性內切酶的酶切位點、一個翻譯終止子和hCAF1的部分編碼序列。
引物上的限制性內切酶的酶切位點對應于CHO細胞表達載體pcDNA3上的限制性內切酶酶切位點,該質粒載體編碼抗生素抗性(Ampr和Neor)、一個噬菌體復制起點(fl ori)、一個病毒復制起點(SV40 ori)、一個T7啟動子、一個病毒啟動子(P-CMV)、一個Sp6啟動子、一個SV40啟動子、一個SV40加尾信號和相應的polyA順序、一個BGH加尾信號和相應的polyA順序。
用BamHI和XbaI消化pcDNA3載體,隨后將插入片段連接到pcDNA3載體。隨后用連接混合物轉化E.coli DH5α菌株。在含有Amp的LB培養皿上篩選轉化子,在補加Amp(100μg/ml)的LB液體培養基中過夜培養(O/N)含所需構建物的克隆。抽提質粒,并測序驗證hCAF1的cDNA片段已正確插入了載體。
質粒轉染CHO細胞是采用脂轉染法,用Lipofectin(GiBco Life)進行的。轉染48小時后,經2-3周的持續G418加壓篩選,收集細胞及細胞上清測定表達蛋白酶活力。去G418,連續傳代培養;對混合克隆細胞極限稀釋,選擇具有較高蛋白活性的細胞亞克隆。按常規方法大量培養上述陽性亞克隆。48小時后,開始收集細胞及上清,用超聲裂解方法破碎細胞。以含0.05%Triton的50mMTris·HCl(pH7.6)溶液為平衡液及洗脫液,用經預平衡的Superdex G-75柱收集上述蛋白的活性峰。再用50mMTris·HCl(pH8.0)平衡的DEAE-Sepharose柱,以含0-1M NaCl的50mMTris·HCl(pH8.0)溶液為洗脫液進行梯度洗脫,收集上述蛋白的活性峰。然后以PBS(pH7.4)為透析液對表達蛋白溶液進行透析。最后凍干保存。
用12%的SDS-PAGE膠進行電泳,鑒定表達蛋白的分子量大小為33KDa。
此外,用常規方法對達蛋白的N端和C端各10個氨基酸長度的氨基酸進行測序,發現與SEQ ID NO.4的序列一致。
實施例5制備抗體將實施例3和4中獲得的重組蛋白用來免疫動物以產生抗體,具體方法如下。重組分子用層析法進行分離后備用。也可用SDS-PAGE凝膠電泳法進行分離,將電泳條帶從凝膠中切下,并用等體積的完全Freund’s佐劑乳化。用50-100μg/0.2ml乳化過的蛋白,對小鼠進行腹膜內注射。14天后,用非完全Freund’s佐劑乳化的同樣抗原,對小鼠以50-100μg/0.2ml的劑量進行腹膜內注射以加強免疫。每隔14天進行一次加強免疫,至少進行三次。獲得的抗血清的特異反應活性用它在體外沉淀hCAF1基因翻譯產物的能力加以評估。
在本發明提及的所有文獻都在本申請中引用作為參考,就如同每一篇文獻被單獨引用作為參考那樣。此外應理解,在閱讀了本發明的上述講授內容之后,本領域技術人員可以對本發明作各種改動或修改,這些等價形式同樣落于本申請所附權利要求書所限定的范圍。
序列表(1)一般信息(i)申請人上海新黃浦復旦基因工程有限公司(ii)發明名稱一種新的人基因編碼序列、其編碼的多肽及制備方法(iii)序列數目7(2)SEQ ID NO.1的信息(i)序列特征(A)長度23堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO.1TTGATGCTTG GCATCTAGAC TCC 23(2)SEQ ID NO.2的信息(i)序列特征(A)長度23堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO2TTGTTCGAGG GATTCAACCA GAG 23(2)SEQ ID NO.3的信息(i)序列特征(A)長度978bp
(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO.31 TTGATGCTTG GCATCTAGAC TCCCTTGTGC CCTCACTATG CCAGCGGAAC TTGTAGATCA61 TAGCCAAAGA ATTTGTGAAG TTTGGGCTTG CAACTTGGAT GAAGAGATGA AGAAAATTCG121 TCAAGTTATC CGAAAATATA ATTACGTTGC TATGGACACC GAGTTTCCAG GTGTGGTTGC181 AAGACCCATT GGAGAATTCA GGAGCAATGC TGACTATCAA TACCAACTAT TGCGGTGTAA241 TGTAGACTTG TTAAAGATAA TTCAGCTAGG ACTGACATTT ATGAATGAGC AAGGAGAATA301 CCCTCCAGGA ACTTCAACTT GGCAGTTTAA TTTTAAATTT AATTTGACGG AGGACATGTA361 TGCCCAGGAC TCTATAGAGC TACTAACAAC ATCTGGTATC CAGTTTAAAA AACATGAGGA421 GGAAGGAATT GAAACCCAGT ACTTTGCAGA ACTTCTTATG ACTTCTGGAG TGGTCCTCTG481 TGAAGGGGTC AAATGGTTGT CATTTCATAG CGGTTACGAC TTTGGCTACT TAATCAAAAT541 CCTAACCAAC TCTAACTTGC CTGAAGAAGA ACTTGACTTC TTTGAGATCC TTCGATTGTT601 TTTTCCTGTC ATTTATGATG TGAAGTACCT CATGAAGAGC TGCAAAAATC TCAAAGGTGG661 ATTACAGGAG GTGGCAGAAC AGTTAGAGCT GGAACGGATA GGACCACAAC ATCAGGCAGG721 ATCTGATTCA TTGCTCACAG GAATGGCCTT TTTCAAAATG AGAGAAATGT TCTTTGAAGA781 TCATATTGAT GATGCCAAAT ATTGTGGTCA TTTGTATGGC CTTGGTTCTG GTTCATCCTA841 TGTACAGAAT GGCACAGGGA ATGCATATGA AGAGGAAGCC AACAAGCAGT CATGACATGA901 AATAGTCCTT TTATTTTTAT TTCGAGCTAC ACACATGCTT GTATATAGGT TTTATCTCTG961 GTTGAATCCC TCGAACAA(2)SEQ ID NO.4的信息(i)序列特征(A)長度285個氨基酸(B)類型氨基酸(D)拓撲結構線性(ii)分子類型多肽(xi)序列描述SEQ ID NO.41 Met Pro Ala Glu Leu Val Asp His Ser Gln Arg Ile Cys Glu Val16 Trp Ala Cys Asn Leu Asp Glu Glu Met Lys Lys Ile Arg Gln Val31 Ile Arg Lys Tyr Asn Tyr Val Ala Met Asp Thr Glu Phe Pro Gly46 Val Val Ala Arg Pro Ile Gly Glu Phe Arg Ser Asn Ala Asp Tyr61 Gln Tyr Gln Leu Leu Arg Cys Asn Val Asp Leu Leu Lys Ile Ile76 Gln Leu Gly Leu Thr Phe Met Asn Glu Gln Gly Glu Tyr Pro Pro91 Gly Thr Ser Thr Trp Gln Phe Asn Phe Lys Phe Asn Leu Thr Glu106 Asp Met Tyr Ala Gln Asp Ser Ile Glu Leu Leu Thr Thr Ser Gly121 Ile Gln Phe Lys Lys His Glu Glu Glu Gly Ile Glu Thr Gln Tyr136 Phe Ala Glu Leu Leu Met Thr Ser Gly Val Val Leu Cys Glu Gly151 Val Lys Trp Leu Ser Phe His Ser Gly Tyr Asp Phe Gly Tyr Leu166 Ile Lys Ile Leu Thr Asn Ser Asn Leu Pro Glu Glu Glu Leu Asp181 Phe Phe Glu Ile Leu Arg Leu Phe Phe Pro Val Ile Tyr Asp Val196 Lys Tyr Leu Met Lys Ser Cys Lys Asn Leu Lys Gly Gly Leu Gln211 Glu Val Ala Glu Gln Leu Glu Leu Glu Arg Ile Gly Pro Gln His226 Gln Ala Gly Ser Asp Ser Leu Leu Thr Gly Met Ala Phe Phe Lys241 Met Arg Glu Met Phe Phe Glu Asp His Ile Asp Asp Ala Lys Tyr256 Cys Gly His Leu Tyr Gly Leu Gly Ser Gly Ser Ser Tyr Val Gln271 Asn Gly Thr Gly Asn Ala Tyr Glu Glu Glu Ala Asn Lys Gln Ser(2)SEQ ID NO.5的信息(i)序列特征(A)長度29堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO.5TCAGGGATCC ATGCCAGCG GAACTTGTAG 29(2)SEQ ID NO.6的信息(i)序列特征
(A)長度29堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO.6TTGGGTCGAC TCATGACTGC TTGTTGGCT 29(2)SEQ ID NO.7的信息(i)序列特征(A)長度29堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO.7TTGGACTAGT TCATGACTGC TTGTTGGCT 29
權利要求
1.一種分離出的DNA分子,其特征在于,它包括編碼具有人hCAF1蛋白活性的多肽的核苷酸序列,所述的核苷酸序列與SEQ ID NO.3中從核苷酸38-895位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度嚴緊條件下與SEQ ID NO.3中從核苷酸38-895位的核苷酸序列雜交。
2.如權利要求1所述的DNA分子,其特征在于,所述的序列編碼一多肽,該多肽具有SEQ ID NO.4所示的序列。
3.如權利要求1所述的DNA分子,其特征在于,該序列具有SEQ ID NO.3中從核苷酸38-895位的核苷酸序列。
4.一種分離的hCAF1蛋白多肽,其特征在于,它包括具有SEQ ID NO.4氨基酸序列的多肽、或其活性片段,或其活性衍生物。
5.如權利要求4所述的多肽,其特征在于,該多肽是具有SEQ ID NO.4序列的多肽。
6.一種載體,其特征在于,它含有權利要求1所述的DNA。
7.一種用權利要求6所述載體轉化的宿主細胞。
8.一種產生具有hCAF1蛋白活性的多肽的方法,其特征在于,該方法包括(a)將編碼具有hCAF1蛋白活性的多肽的核苷酸序列可操作地連于表達調控序列,形成hCAF1蛋白表達載體,所述的核苷酸序列與SEQ ID NO.3中從核苷酸38-895位的核苷酸序列有至少70%的同源性;(b)將步驟(a)中的表達載體轉入宿主細胞,形成hCAF1蛋白的重組細胞;(c)在適合表達hCAF1蛋白多肽的條件下,培養步驟(b)中的重組細胞;(d)分離出具有hCAF1蛋白活性的多肽。
9.如權利要求8所述的方法,其特征在于,該序列為SEQ ID NO.3中從核苷酸38-895位。
10.一種能與權利要求4所述的hCAF1蛋白多肽特異性結合的抗體。
11.一種核苷酸分子,其特征在于,它是權利要求1所述DNA分子的反義序列。
12.一種探針分子,其特征在于,它含有權利要求1所述的DNA分子中8-100個連續核苷酸。
全文摘要
本發明提供了一種新的人hCAF1的cDNA序列,該序列編碼的蛋白是鼠mCAF1的同系物。本發明還涉及由該核苷酸序列編碼的多肽,這些多核苷酸和多肽的應用,以及所述多核苷酸和所述多肽的生產方法。
文檔編號C07K14/435GK1248625SQ98119760
公開日2000年3月29日 申請日期1998年9月22日 優先權日1998年9月22日
發明者余龍, 趙勇, 張宏來, 傅強, 趙壽元 申請人:上海新黃浦復旦基因工程有限公司