專利名稱:一種新的人基因序列、其編碼的多肽及制法和用途的制作方法
技術領域:
本發明涉及基因工程領域,具體地,本發明涉及一種新的人基因核苷酸序列。更具體地說,本發明涉及人E16H的cDNA序列。本發明還涉及由該核苷酸序列編碼的多肽,這些多核苷酸和多肽的應用,以及所述多核苷酸和所述多肽的生產方法。
E16是人活化的淋巴細胞中發現的一個基因,它與TA1被認為是細胞透性酶,與細胞吸收代謝物有關(J.Biol.Chem.267(16)11267-11273,1992)。在分化細胞中E16表達量極低,而在未分化細胞中則高得多,提示其與癌細胞有密切聯系(Cancer Research 551152-1159,1995)。
E16于1992年被Gaugitsch等人發現(J.Biol.Chem.26711267-11273,1992)。1995年,Sang等人從大鼠肝癌細胞中克隆E16的大鼠同源基因TA1(CancerResearch 551152-1159,1995)。1997年Spindler等人從非洲爪蟾(Xenopus laevis)A6腎細胞中分離到一個TA1/E16的同源基因ASUR4(Pflugers Arch-Eur J.Physiol.434323-331,1997)。這三個基因被認為與細胞活化、肝臟發育、癌形成等有關。然而,在本發明之前,尚沒有任何人公開過本申請中涉及的人E16H蛋白。
本發明的一個目的是提供一種新的多核苷酸序列,該多核苷酸序列編碼與大鼠E16同源的蛋白,本發明的E16同源基因被命名為人E16H。
本發明的另一個目的是提供一種新的蛋白,該蛋白被命名為E16H蛋白。
本發明的再一個目的是提供一種利用重組技術生產所述的新的人E16H蛋白的方法。
本發明還提供了這種人E16H基因序列和多肽的應用。
在本發明的一個方面,提供了一種分離出的DNA分子,它包括編碼具有人E16H蛋白活性的多肽的核苷酸序列,所述的核苷酸序列與SEQ ID NO.3中從核苷酸118-1251位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度嚴緊條件下與SEQ ID NO.3中從核苷酸118-1251位的核苷酸序列雜交。較佳地,所述的序列編碼一多肽,該多肽具有SEQ ID NO.4所示的序列。更佳地,該序列具有SEQ ID NO.3中從核苷酸118-1251位的核苷酸序列。
在本發明的另一方面,提供了一種分離的E16H蛋白多肽,它包括具有SEQID NO.4氨基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物。較佳地,該多肽是具有SEQ ID NO.4序列的多肽。
在本發明的另一方面,提供了一種載體,它含有上述分離出的DNA。
在本發明的另一方面,提供了一種所述載體轉化的宿主細胞。
在本發明的另一方面,提供了一種產生具有E16H蛋白活性的多肽的方法,該方法包括(a)將編碼具有E16H蛋白活性的多肽的核苷酸序列可操作地連于表達調控序列,形成E16H蛋白表達載體,所述的核苷酸序列與SEQ ID NO.3中從核苷酸118-1251位的核苷酸序列有至少70%的同源性;(b)將步驟(a)中的表達載體轉入宿主細胞,形成E16H蛋白的重組細胞;(c)在適合表達E16H蛋白多肽的條件下,培養步驟(b)中的重組細胞;(d)分離出具有E16H蛋白活性的多肽。
在本發明的一個具體實施方案中,本發明的分離的多核苷酸全長為1273個核苷酸,其詳細序列見SEQ ID NO.3,其中開放讀框位于118-1251位核苷酸。
在本發明中,“分離的”、“純化的”或“基本純的”DNA是指,該DNA或片段已從天然狀態下位于其兩側的序列中分離出來,還指該DNA或片段已經與天然狀態下伴隨核酸的組份分開,而且已經與在細胞中伴隨其的蛋白質分開。
在本發明中,術語“E16H蛋白(或多肽)編碼序列”指編碼具有人E16H蛋白活性的多肽的核苷酸序列,如SEQ ID NO.3中118-1251位核苷酸序列及其簡并序列。該簡并序列是指,位于SEQ ID NO.3序列的編碼框118-1251位核苷酸中,有一個或多個密碼子被編碼相同氨基酸的簡并密碼子所取代后而產生的序列。由于密碼子的簡并性,所以與SEQ ID NO.3中118-1251位核苷酸序列同源性低至約70%的簡并序列也能編碼出SEQ ID NO.4所述的序列。該術語還包括能在中度嚴緊條件下與SEQ ID NO.3中從核苷酸118-1251位的核苷酸序列雜交的核苷酸序列該術語還包括能編碼具有與人E16H相同功能的蛋白的、SEQ ID NO.3的開放閱讀框序列的變異形式。這些變異形式包括(但并不限于)若干個(通常為1-90個,較佳地1-60個,更佳地1-20個,最佳地1-10個)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加數個(通常為60個以內,較佳地為30個以內,更佳地為10個以內,最佳地為5個以內)核苷酸。
在本發明中,“基本純的”蛋白質或多肽是指其至少占樣品總物質的至少20%,較佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或濕重計)。純度可以用任何合適的方法進行測量,如用柱層析、PAGE或HPLC法測量多肽的純度。基本純的多肽基本上不含天然狀態下的伴隨其的組分。
在本發明中,術語“E16H蛋白或多肽”指具有E16H蛋白活性的SEQ ID NO.4序列的多肽。該術語還包括具有與人E16H蛋白相同功能的、SEQ ID NO.4序列的變異形式。這些變異形式包括(但并不限于)若干個(通常為1-50個,較佳地1-30個,更佳地1-20個,最佳地1-10個)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一個或數個(通常為20個以內,較佳地為10個以內,更佳地為5個以內)氨基酸。例如,在本領域中,用性能相近或相似的氨基酸進行取代時,通常不會改變蛋白質的功能。又比如,在C末端和/或N末端添加一個或數個氨基酸通常也不會改變蛋白質的功能。該術語還包括E16H蛋白的活性片段和活性衍生物。
該多肽的變異形式包括同源序列、保守性變異體、等位變異體、天然突變體、誘導突變體、在高或低的嚴謹度條件下能與E16H DNA雜交的DNA所編碼的蛋白、以及利用抗E16H多肽的抗血清獲得的多肽或蛋白。本發明還提供了其他多肽,如包含E16H多肽或其片段的融合蛋白。除了幾乎全長的多肽外,本發明還提供了E16H多肽的可溶性片段。通常,該片段具有E16H多肽序列的至少約10個連續氨基酸,通常至少約30個連續氨基酸,較佳地至少約50個連續氨基酸,更佳地至少約80個連續氨基酸,最佳地至少約100個連續氨基酸。
發明還提供E16H蛋白或多肽的類似物。這些類似物與天然E16H多肽的差別可以是氨基酸序列上的差異,也可以是不影響序列的修飾形式上的差異,或者兼而有之。這些多肽包括天然或誘導的遺傳變異體。誘導變異體可以通過各種技術得到,如通過輻射或暴露于誘變劑而產生隨機誘變,還可通過定點誘變法或其他已知分子生物學的技術。類似物還可以包括具有不同于天然L-氨基酸的殘基(如D-氨基酸)的類似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的類似物。應理解,本發明的多肽并不限于上述例舉的代表性的多肽。
修飾(通常不改變一級結構)形式包括體內或體外的多肽的化學衍生形式如乙酰化或羧基化。修飾還包括糖基化,如那些在多肽的合成和加工中或進一步加工步驟中進行糖基化修飾而產生的多肽。這種修飾可以通過將多肽暴露于進行糖基化的酶(如哺乳動物的糖基化酶或去糖基化酶)而完成。修飾形式還包括具有磷酸化氨基酸殘基(如磷酸酪氨酸,磷酸絲氨酸,磷酸蘇氨酸)的序列。還包括被修飾從而提高了其抗蛋白水解性能或優化了溶解性能的多肽。
在本發明中,“E16H保守性變異多肽”指與SEQ ID No.4的氨基酸序列相比,有至多10個,較佳地至多8個,更佳地至多5個氨基酸被性質相似或相近的氨基酸所替換而形成多肽。這些保守性變異多肽最好根據表1進行替換而產生。
表1
本發明還包括E16H多肽編碼序列及其片段的反義序列。這種反義序列可用于抑制細胞內E16H的表達。
本發明還包括一種可用作探針的核酸分子,該分子通常具有E16H多肽編碼序列的8-100個,較佳地15-50個連續核苷酸。該探針可用于檢測樣品中是否存在編碼E16H的核酸分子。
本發明還包括檢測E16H核苷酸序列的方法,它包括用上述的探針與樣品進行雜交,然后檢測探針是否發生了結合。較佳地,該樣品是PCR擴增后的產物,其中PCR擴增引物對應于E16H多肽的編碼序列,可位于該編碼序列的兩側或中間。引物長度一般為20-50個核苷酸。
在本發明中,可選用本領域已知的各種載體,如市售的載體。比如,選用市售的載體,可以將編碼具有E16H蛋白活性的多肽的核苷酸序列可操作地連于表達調控序列,形成E16H蛋白表達載體。
如本文所用,“可操作地連于”指這樣一種狀況,即線性DNA序列的某些部分能夠影響同一線性DNA序列其他部分的活性。例如,如果信號肽DNA作為前體表達并參與多肽的分泌,那么信號肽(分泌前導序列)DNA就是可操作地連于多肽DNA;如果啟動子控制序列的轉錄,那么它是可操作地連于編碼序列;如果核糖體結合位點被置于能使其翻譯的位置時,那么它是可操作地連于編碼序列。一般,“可操作地連于”意味著相鄰,而對于分泌前導序列則意味著在閱讀框中相鄰。
在本發明中,術語“宿主細胞”包括原核細胞和真核細胞。常用的原核宿主細胞的例子包括大腸桿菌、枯草桿菌等。常用的真核宿主細胞包括酵母細胞,昆蟲細胞、和哺乳動物細胞。較佳地,該宿主細胞是真核細胞,如CHO細胞、COS細胞等。
另一方面,本發明還包括對E16H DNA或是其片段編碼的多肽具有特異性抗體,尤其是單克隆抗體。這里,“特異性”是指抗體能結合于E16H基因產物或片段。較佳地,指那些能與E16H基因產物或片段結合但不識別和結合于其它非相關抗原分子的抗體。本發明中抗體包括那些能夠結合并抑制E16H蛋白的分子,也包括那些并不影響E16H蛋白功能的抗體。本發明還包括那些能與修飾或未經修飾形式的E16H基因產物結合的抗體。
本發明不僅包括完整的單克隆或多克隆抗體,而且還包括具有免疫活性的抗體片段,如Fab′或(Fab)2片段;抗體重鏈;抗體輕鏈;遺傳工程改造的單鏈Fv分子(Ladner等人,美國專利No.4,946,778);或嵌合抗體,如具有鼠抗體結合特異性但仍保留來自人的抗體部分的抗體。
本發明的抗體可以通過本領域內技術人員已知的各種技術進行制備。例如,純化的E16H基因產物或者其具有抗原性的片段,可被施用于動物以誘導多克隆抗體的產生。與之相似的,表達E16H或其具有抗原性的片段的細胞可用來免疫動物來生產抗體。本發明的抗體也可以是單克隆抗體。此類單克隆抗體可以利用雜交瘤技術來制備(見Kohler等人,Nature 256;495,1975;Kohler等人,Eur.J.Immunol.6511,1976;Kohler等人,Eur.J.Immunol.6292,1976;Hammerling等人,InMonoclonal Antibodies and T Cell Hybridomas,Elsevier,N.Y.,1981)。本發明的抗體包括能阻斷E16H功能的抗體以及不影響E16H功能的抗體。本發明的各類抗體可以利用E16H基因產物的片段或功能區,通過免疫技術獲得。這些片段或功能區可以利用重組方法制備或利用多肽合成儀合成。與E16H基因產物的未修飾形式結合的抗體可以用原核細胞(例如E.Coli)中生產的基因產物來免疫動物而產生;與翻譯后修飾形式結合的抗體(如糖基化或磷酸化的蛋白或多肽),可以用真核細胞(例如酵母或昆蟲細胞)中產生的基因產物來免疫動物而獲得。
本發明的人E16H核苷酸序列全長序列或其片段通常可以用PCR擴增法、重組法或人工合成的方法獲得。對于PCR擴增法,可根據本發明所公開的有關核苷酸序列,尤其是開放閱讀框序列來設計引物,并用市售的cDNA庫或按已知方法制備的cDNA庫作為模板,擴增而得有關序列。當序列較長時,常常需要進行兩次或多次PCR擴增,然后再將各次擴增出的片段按正確次序拼接在一起。
一旦獲得了有關的序列,就可以用重組法來大批量地獲得有關序列。這通常是將其克隆入載體,再轉入細胞,然后通過常規方法從增殖后的宿主細胞中分離得到有關序列。
此外,還可用人工合成的方法來合成有關序列,尤其是片段長度較短時。通常,通過先合成多個小片段,然后再進行連接可獲得序列很長的片段。
在本發明的一個實施例中,人E16H的cDNA核苷酸序列是如此獲得的,以人睪丸λgt11cDNA文庫(購自Clontech公司)為模板,合成正向引物A5′-CTGCCAATCTGCTTATTG CTCCTC-3′和反向引物B5′-TCTCACCACCCACACCAAAGTCC-3′,進行PCR,獲得1273bp的目的片段。測序后得到SEQ ID NO.3的全長cDNA序列。
E16、TA1被認為是細胞透性酶,與細胞吸收代謝物有關。根據同源比較,它們與線蟲及其它低等生物中的透性酶高度同源(Cancer Research 565012-5022,1996),這種進化上的同源性提示該蛋白在生物學功能上的重要性,TA1基因在胎肝和肝癌細胞中被表達,而在成熟肝細胞中無表達。這種表達模式說明了肝癌細胞未完全分化或非正確表達胚胎抗原的性質。該基因對肝癌形成的具體作用尚在研究之中,但至少可以作為診斷肝癌的標志物之一(Cancer Research 551152-1159,1995)。另外,E16/TA1被發現在結直腸癌、乳腺癌等癌細胞中表達,猜測其透性酶活力可能幫助癌細胞吸收代謝物質(Cancer Research 565012-5022,1996),因此該種基因的研究可以為抗腫瘤治療提供一條新途徑。
在附圖中,
圖1為本發明的人E16H與人E16的核酸序列(E16HN和E16N)的同源比較圖。其中,相同的核苷酸用“|”標出。
圖2為本發明的人E16H與人E16的氨基酸序列(E16HP和E16P)的同源比較圖。其中,相同的氨基酸在兩個序列之間用“|”標出,相似的氨基酸用“·”標出。相似的氨基酸是A,S,T;D,E;N,Q;R,K;I,L,M,V;F,Y,W。
圖3為本發明的人E16H與人E16的氨基酸序列(E16HP和ASURP)的同源比較圖。其中,相同的氨基酸在兩個序列之間用“|”標出,相似的氨基酸用“·”標出。相似的氨基酸是A,S,T;D,E;N,Q;R,K;I,L,M,V;F,Y,W。
下面結合具體實施例,進一步闡述本發明。應理解,這些實施例僅用于說明本發明而不用于限制本發明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規條件,例如Sambrook等人,分子克隆實驗室手冊(New YorkColdSpring Harbor Laboratory Press,1989)中所述的條件,或按照制造廠商所建議的條件。
實施例1E16H的cDNA序列的克隆和測定1.引物擴增以人睪丸λgt11cDNA文庫(購自Clontech公司)為模板,用一對寡核苷酸為引物——A5′-CTGCCAATCTGCTTATTGCTCCTC-3′(SEQ ID NO1)為正向引物,寡核苷酸B5′-TCTCACCACCCACACCAAAGTCC-3’(SEQ ID NO2)為反向引物,進行PCR。PCR條件為93℃4分鐘,隨之以93℃1分鐘、68℃1分鐘和72℃1分鐘進行35個循環,最后72℃延伸5分鐘。電泳檢測得到的PCR片斷,目的片段長度為1273bp的目的片段。
2.PCR產物的測序將PCR擴增產物與pGEM-T載體(Promega)連接,轉化大腸桿菌JM103,用QIAprep Plasmid試劑盒(QIAGEN)提取質粒,用雙鏈嵌套式缺失試劑盒(Pharmacia)對插入片段進行定向系列缺失,然后用PCR對缺失子進行快速鑒定及排序。用SequiTherm EXCELTMDNA測序試劑盒(Epicentre Technologies)對依次截短的缺失子進行測序,最后用電腦軟件拼接順序,獲得全長cDNA序列,共1273bp,詳細序列見SEQ ID NO.3,其中開放讀框位于118-1251位核苷酸。
根據得到的全長cDNA序列推導出E16H的氨基酸序列,共377個氨基酸殘基,其氨基酸序列詳見SEQ ID NO.4。
實施例2同源比較用本發明的人E16H的全長cDNA編碼序列及其編碼蛋白,在Non-redundantGenBank+EMBL+DDBJ+PDB數據庫及Non-redundant GenBank CDStranslations+PDB+SwissProt+Spupdate+PIR數據庫中,用BLAST軟件進行核酸和蛋白同源檢索。結果發現本發明的人E16H與已報道的人E16和非洲爪蟾ASUR4基因及其編碼蛋白具有極高同源性,用PCGENE軟件比較發現,人E16H和人E16在核酸水平上的同一性達到了83.2%,在蛋白水平上的同一性達到了44.4%,并另有17.4%的氨基酸相似(圖1和2);人E16H和非洲爪蟾ASUR4在核酸水平上的同一性達到了69.8%,在蛋白水平上的同一性達到了36.1%,并另有11.9%的氨基酸相似(圖3)。同時,E16H與大鼠TA1又有著一定同源性。這表明它們屬于同一個家族,而且E16H具有相同或相似的功能。
E16、TA1被認為是細胞透性酶,與細胞吸收代謝物有關。E16蛋白分子含有六個穿膜區,其氨基端與羧基端都位于細胞內部。這些結構特性與A型的鉀離子通道蛋白很相似(J.Biol.Chem.267(16)11267-11273,1992)。根據同源比較,它們與線蟲及其它低等生物中的氨基酸透性酶高度同源(Cancer Research 565012-5022,1996),這種進化上的同源性提示該蛋白在生物學功能上的重要性。E16基因在成人的各器官中都未檢測出有表達,而在各種細胞株系中均有表達,這種廣泛的在迅速分裂細胞中存在的表達特性表明E16蛋白和細胞分裂過程直接相關。當外周血淋巴細胞被激活后,E16基因被迅速開啟表達,隨后其mRNA又被迅速降解,這種特點和外周血淋巴細胞的細胞因子相類似,它們可能都參與了細胞活化后的最早期變化(J.Biol.Chem.267(16)11267-11273,1992)。E16/TA1對外源活化信號的迅速響應為研究細胞生長和分化的調節機制提供了極大的幫助(CancerResearch 551152-1159,1995)。TA1基因在胎肝和肝癌細胞中被表達,而在成熟肝細胞中無表達。這種表達模式說明了肝癌細胞未完全分化或非正確表達胚胎抗原的性質。該基因對肝癌形成的具體作用尚在研究之中,但至少可以作為診斷肝癌的標志物之一。在無限擴張的癌細胞中,TA1基因的表達水平被提高至一個較高程度,提示TA1基因可能和癌形成過程,如侵入、代謝物運送、血管形成等的表型特征相關(CancerResearch 551152-1159,1995)。另外,E16/TA1被發現在結直腸癌、乳腺癌等癌細胞中表達,猜測其透性酶活力可能幫助癌細胞吸收代謝物質(Cancer Research 565012-5022,1996),因此該種基因的研究可以為抗腫瘤治療提供一條新途徑。
與E16、TA1等基因的高度同源性暗示,本發明的E16H與細胞透性有密切聯系,而且與癌癥細胞也有緊密相關。E16H的過度表達可能是導致癌癥的因素之一,和/或是癌癥癥狀的一種標志。
本發明的人E16H除了可作為該家族一員用于進一步的功能研究尤其是癌癥方面的研究,還可用于與其他蛋白一起產生融合蛋白,比如與免疫球蛋白一起產生融合蛋白。此外,本發明人E16H還可以與該家族的其他成員進行融合或交換片段,以產生新的蛋白。例如將本發明人E16H的N端與人E16的N端進行交換,以產生新的活性更高或具有新特性的蛋白。
針對本發明人E16H的抗體,用于篩選該家族的其他成員,或者用于親和純化相關蛋白(該家族的其他成員,如人E16)。
此外,本發明的人E16H核酸(編碼序列或反義序列及其片段)可以被引入細胞,以提高人E16H的表達水平或者抑制人E16H的過度表達。本發明的人E16H蛋白或其活性多肽片段可以施用于病人,以治療或減輕因人E16H缺失、無功能或異常而導致的有關病癥。此外,還可以用基于本發明的核酸序列或抗體進行有關的診斷或預后判斷。
實施例3E16H在大腸桿菌中的表達在該實施例中,將編碼E16H的cDNA序列用對應于該DNA序列的5′和3′端的PCR寡核苷酸引物進行擴增,獲得E16H cDNA作為插入片段。
PCR反應中使用的5′寡核苷酸引物序列為5′-TTCAGGATCCATGGGGATTGTACAGATAT-3′(SEQ ID NO.5),該引物含有BamHI限制性內切酶的酶切位點,在該酶切位點之后是由起始密碼子開始的E16H編碼序列的19個核苷酸;3′端引物序列為5’-AGGTGTCGACCTACCACTGCCTGACAAAA-3’(SEQ ID NO.6),該引物含有SalI限制性內切酶的酶切位點、翻譯終止子和E16H的部分編碼序列。
引物上的限制性內切酶的酶切位點對應于細菌表達載體pQE-9(Qiagen Inc.,Chatsworth,CA)上的限制性內切酶酶切位點,該質粒載體編碼抗生素抗性(Ampr)、一個細菌復制起點(ori)、一個IPTG-可調啟動子/操縱子(P/O)、一個核糖體結合位點(RBS)、一個6-組氨酸標記物(6-His)以及限制性內切酶克隆位點。
用BamHI和SalI消化pQE-9載體和插入片段,隨后將插入片段連接到pQE-9載體并保持開放讀框在細菌RBS起始。隨后用連接混合物轉化購自Qiagen,商品名為M15/rep4的E.coli菌株,M15/rep4含有多拷貝的質粒pREP4,其表達lacI阻遏物并攜帶卡那霉素抗性(Kanr)。在含有Amp和Kan的LB培養皿上篩選轉化子,抽提質粒,測序驗證E16H的cDNA片段已正確插入了載體。
在補加Amp(100μg/ml)和Kan(25μg/ml)的LB液體培養基中過夜培養(O/N)含所需構建物的陽性轉化子克隆。過夜(O/N)培養物以1∶100-1∶250的稀釋率稀釋,然后接種到大體積培養基中,培養細胞至600光密度(OD600)為0.4-0.6,隨后加入IPTG(“異丙基硫代-β-D-半乳糖苷”)至終濃度為1mM。通過使lacI阻遏物失活,IPTG誘導啟動P/O導致基因表達水平提高。繼續培養細胞3-4小時,隨后離心(6000×g,20分鐘)。超聲裂解包涵體,收集細胞并將細胞沉淀溶于6M的鹽酸胍中。澄清后,通過在能使含6-His標記物蛋白緊密結合的條件下,用鎳-螯合柱層析從溶液中純化溶解的E16H。用6M鹽酸胍(pH5.0)從柱中洗脫E16H。可用幾種方法從鹽酸胍中變性沉淀蛋白。首先,使用透析步驟除去鹽酸胍,或者從鎳-螯合柱中分離出的純化蛋白可以結合到第二個柱中,該柱中具有遞減的線性鹽酸胍梯度。在結合到該柱時蛋白質變性,隨后用鹽酸胍(pH5.0)洗脫。最后,將可溶的蛋白質對含PBS進行透析,然后將蛋白質保存在終濃度為10%(w/v)甘油的貯存液中。
用12%的SDS-PAGE膠進行電泳,鑒定表達蛋白的分子量大小為約42KDa。
此外,用常規方法對表達蛋白的N端和C端各10個氨基酸長度的氨基酸進行測序,發現與SEQ ID NO.4的序列一致。
實施例4E16H在真核細胞(CHO細胞株)中的表達在該實施例中,將在實施例1中獲得的片段用對應于該DNA序列的5′和3′端的PCR寡核苷酸引物進行擴增,獲得E16H cDNA作為插入片段。
PCR反應中使用的5′寡核苷酸引物序列為5′-TTCAGGATCCATGGGGATTGTACAGATAT-3′(SEQ ID NO.5)該引物含有BamHI限制性內切酶的酶切位點,在該酶切位點之后是由起始密碼子開始的E16H編碼序列的19個核苷酸;
3′端引物序列為5’-AGTCGGATCCCTACCACTGCCTGACAAAA-3’(SEQ ID NO.7)該引物含有BamHI限制性內切酶的酶切位點、一個翻譯終止子和E16H的部分編碼序列。
引物上的限制性內切酶的酶切位點對應于CHO細胞表達載體pcDNA3上的限制性內切酶酶切位點,該質粒載體編碼抗生素抗性(Ampr和Neor)、一個噬菌體復制起點(f1 ori)、一個病毒復制起點(SV40 ori)、一個T7啟動子、一個病毒啟動子(P-CMV)、一個Sp6啟動子、一個SV40啟動子、一個SV40加尾信號和相應的polyA順序、一個BGH加尾信號和相應的polyA順序。
用BamHI消化pcDNA3載體和插入片段,隨后將插入片段連接到pcDNA3載體。隨后用連接混合物轉化E.coli DH5α菌株。在含有Amp的LB培養皿上篩選轉化子,在補加Amp(100μg/ml)的LB液體培養基中過夜培養(O/N)含所需構建物的克隆。抽提質粒,用KpnI酶切鑒定插入片段大小及方向,并測序驗證E16H的cDNA片段已正確插入了載體。
質粒轉染是采用脂轉染法,用Lipofectin試劑盒(GiBco Life)進行的。轉染48小時后,經2-3周的持續G418加壓篩選,收集細胞及細胞上清測定表達蛋白酶活力。去G418,連續傳代培養;對混合克隆細胞極限稀釋,選擇具有較高蛋白活性的細胞亞克隆。按常規方法大量培養上述陽性亞克隆。48小時后,開始收集細胞及上清,用超聲裂解方法破碎細胞。以含0.05%Triton的50mMTris·HCl(pH7.6)溶液為平衡液及洗脫液,用經預平衡的Superdex G-75柱收集上述蛋白的活性峰。再用50mMTris·HCl(pH8.0)平衡的DEAE-Sepharose柱,以含0-1M NaCl的50mMTris.HCl(pH8.0)溶液為洗脫液進行梯度洗脫,收集上述蛋白的活性峰。然后以PBS(pH7.4)為透析液對表達蛋白溶液進行透析。最后凍干保存。
用12%的SDS-PAGE膠進行電泳,鑒定表達蛋白的分子量大小為42KDa。
此外,用常規方法對表達蛋白的N端和C端各10個氨基酸長度的氨基酸進行測序,發現與SEQ ID NO.4的序列一致。
實施例5制備抗體將實施例3和4獲得的重組蛋白用來免疫動物以產生抗體,具體如下。重組分子用層析法進行分離備用。也可用SDS-PAGE凝膠電泳法進行分離,將電泳條帶從凝膠中切下,并用等體積的完全Freund’s佐劑乳化。用50-100μg/0.2ml乳化過的蛋白,對小鼠進行腹膜內注射。14天后,用非完全Freund’s佐劑乳化的同樣抗原對小鼠以50-100μg/0.2ml的劑量進行腹膜內注射以加強免疫。每隔14天進行一次加強免疫,至少進行三次。獲得的抗血清的特異反應活性用它在體外沉淀人E16H基因翻譯產物的能力加以評估。結果發現,抗體可特異性地與本發明蛋白特異性地發生沉淀。
在本發明提及的所有文獻都在本申請中引用作為參考,就如同每一篇文獻被單獨引用作為參考那樣。此外應理解,在閱讀了本發明的上述講授內容之后,本領域技術人員可以對本發明作各種改動或修改,這些等價形式同樣落于本申請所附權利要求書所限定的范圍。
序列表(1)一般信息(i)申請人上海新黃浦復旦基因工程有限公司(ii)發明名稱一種新的人基因序列、其編碼的多肽及制法和用途(iii)序列數目7(2)SEQ ID NOl的信息(i)序列特征(A)長度24堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO1CTGCCAATCT GCTTATTGCT CCTC 24(2)SEQ ID NO2的信息(i)序列特征(A)長度23堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO2TCTCACCACC CACACCAAAG TCC 23(2)SEQ ID NO.3的信息(i)序列特征
(A)長度1273bp(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO.3CTGCCAATCT GCTTATTGCT CCTCACATGG GTCAACTGTT CCAGTGTGCG GTGGGCCACC 60CGGGTTCAAG ACATCTTCAC AGTCGGGAAG CTCCTGGCCT TGGCCCTGAT TATCATCATG 120GGGATTGTAC AGATATGCAA AGGAGAGTAC TTCTGGCTGG AGCCAAAGAA TGCATTTGAG 180AATTTCCAGG AACTCGACAT CGGCCTCGTC GCACTGGCTT TCCTTCAGGG CTCCTTTGCC 240TATGGAGGCT GGAACTTTCT GAATTACGTG ACTGAGGAGC TTGTTGATCC CTACAAGAAC 300CTTCCCAGAG CCATCTTCAT CTCCATCCCA CTGGTCACAT TTGTGTATGT CTTTGCCAAT 360GTCGCTTATG TCACTGCAAT GTCCCCCCAG GAGCTGCTGG CATCGAACGC CGTCGCTGTG 420ACTTTTGGAG AGAAGCTCCT AGGAGTCATG GCCTGGATCA TGCCCATTTC TGTTGCCCTG 480TCCACATTTG GAGGAGTTAA TGGGTCTCTC TTCCACCTCC TCTCGGCTGT TCTTCGCTGG 540AGCCCGAGAG GCACCCTTCC CAGTGTGTTG GCCATGATCC ACGTGAAGCG CTGCACCCCA 600ATCCCAGCCC TGCTCTTCAC ATGCATCTCC ACCCTGCTGA TGCTGGTCAC CAGCGACATG 660TACACACTCA TCAACTACGT GGGCTTCATC AACTACCTCT TCTATGGGGT CACGGTTGCT 720GGACAGATAG TCCTTCGCTG GAAGAAGCCT GATATCCCCC GCCCCATCAA GATCAACCTG 780CTGTTCCCCA TCATCTACTT GCTGTTCTGG GCCTTCCTGC TGGTCTTCAG CCTGTGGTCA 840GAGCCGGTGG TGTGTGGCAT TGGCCTGGCC ATCATGCTGA CAGGAGTGCC TGTCTATTTC 900CTGGGTGTTT ACTGGCAACA CAAGCCCAAG TGTTTCAGTG ACTTCATTGA GCTGCTAACC 960CTGGTGAGCC AGAAGATGTG TGTGGTCGTG TACCCCGAGG TGGAGCGGGG CTCAGGGACA 1020GAGGAGGCTA ATGAGGACAT GGAGGAGCAG CAGCAGCCCA TGTACCAACC CACTCCCACG 1080AAGGACAAGG ACGTGGGCGG GGCAGCCCCA GCCCTTGAGG GACCACCATT TCCCTGGGCT 1140ACTTTCTTCC TTTCCTTCCC CTTTTTATTC CTACCTCCCT GCCTTTGGGT CCTGCCAAAC 1200ACATGCGAGT ACACACACAC CCCTCTCTCT GCTTTTGTCA GGCAGTGGTA GGACTTTGGT 1260GTGGGTGGTG AGA1273(2)SEQ ID NO.4的信息(i)序列特征(A)長度377個氨基酸
(B)類型氨基酸(D)拓撲結構線性(ii)分子類型多肽(xi)序列描述SEQ ID NO.4Met Gly Ile Val Gln Ile Cys Lys Gly Glu Tyr Phe Trp Leu Glu 15Pro Lys Asn Ala Phe Glu Asn Phe Gln Glu Leu Asp Ile Gly Leu 30Val Ala Leu Ala Phe Leu Gln Gly Ser Phe Ala Tyr Gly Gly Trp 45Asn Phe Leu Asn Tyr Val Thr Glu Glu Leu Val AsD Pro Tyr Lys 60Asn Leu Pr0 Arg Ala Ile Phe Ile Ser Ile Pro Leu Val Thr Phe 75Val Tyr Val Phe Ala Asn Val Ala Tyr Val Thr Ala Met Ser Pro 90Gln Glu Leu Leu Ala Ser Asn Ala Val Ala Val Thr Phe Gly Glu 105Lys Leu Leu Gly Val Met Ala Trp Ile Met Pro Ile Ser Val Ala 120Leu Ser Thr Phe Gly Gly Val Asn Gly Ser Leu Phe His Leu Leu 135Ser Ala Val Leu Arg Trp Ser Pro Arg Gly Thr Leu Pro Ser Val 150Leu Ala Met Ile His Val Lys Arg Cys Thr Pro Ile Pro Ala Leu 165Leu Phe Thr Cys Ile Ser Thr Leu Leu Met Leu Val Thr Ser Asp 180Met Tyr Thr Leu Ile Ash Tyr Val Gly Phe Ile Asn Tyr Leu Phe 195Tyr Gly Val Thr Val Ala Gly Gln Ile Val Leu Arg Trp Lys Lys 210Pro Asp Ile Pro Arg Pro Ile Lys Ile Asn Leu Leu Phe Pro Ile 225Ile Tyr Leu Leu Phe Trp Ala Phe Leu Leu Val Phe Ser Leu Trp 240Ser Glu Pro Val Val Cys Gly Ile Gly Leu Ala Ile Met Leu Thr 255Gly Val Pro Val Tyr Phe Leu Gly Val Tyr Trp Gln His Lys Pro 270Lys Cys Phe Ser AsD Phe Ile Glu Leu Leu Thr Leu Val Ser Gln 285Lys Met Cys Val Val Val Tyr Pro Glu Val Glu Arg Gly Ser Gly 300Thr Glu Glu Ala Asn Glu Asp Met Glu Glu Gln Gln Gln Pro Met 315Tyr Gln Pro Thr Pro Thr Lys Asp Lys Asp Val Gly Gly Ala Ala 330Pro Ala Leu Glu Gly Pro Pro Phe Pro Trp Ala Thr Phe Phe Leu 345Ser Phe Pro Phe Leu Phe Leu Pro Pro Cys Leu Trp Val Leu Pro 360Asn Thr Cys Glu Tyr Thr His Thr Pro Leu Ser Ala Phe Val Arg 375Gln Trp 377(2)SEQ ID NO5的信息(i)序列特征(A)長度29堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO5TTCAGGATCC ATGGGGATTG TACAGATAT 29(2)SEQ ID NO6的信息(i)序列特征(A)長度29堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO6AGGTGTCGAC CTACCACTGC CTGACAAAA 29(2)SEQ ID NO7的信息(i)序列特征(A)長度29堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO7AGTCGGATCC CTACCACTGC CTGACAAAA 29
權利要求
1.一種分離出的DNA分子,其特征在于,它包括編碼具有人E16H蛋白活性的多肽的核苷酸序列,所述的核苷酸序列與SEQ ID NO.3中從核苷酸118-1251位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度嚴緊條件下與SEQ ID NO.3中從核苷酸118-1251位的核苷酸序列雜交。
2.如權利要求1所述的DNA分子,其特征在于,所述的序列編碼一多肽,該多肽具有SEQ ID NO.4所示的序列。
3.如權利要求1所述的DNA分子,其特征在于,該序列具有SEQ ID NO.3中從核苷酸118-1251位的序列。
4.一種分離的E16H蛋白多肽,其特征在于,它包括具有SEQ ID NO.4氨基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物。
5.如權利要求4所述的多肽,其特征在于,該多肽是具有SEQ ID NO.4序列的多肽。
6.一種載體,其特征在于,它含有權利要求1所述的DNA。
7.一種用權利要求6所述載體轉化的宿主細胞。
8.如權利要求7所述的宿主細胞,其特征在于,該細胞是大腸桿菌。
9.如權利要求7所述的宿主細胞,其特征在于,該細胞是真核細胞。
10.一種產生具有E16H蛋白活性的多肽的方法,其特征在于,該方法包括(a)將編碼具有E16H蛋白活性的多肽的核苷酸序列可操作地連于表達調控序列,形成E16H蛋白表達載體,所述的核苷酸序列與SEQ ID NO.3中從核苷酸118-1251位的核苷酸序列有至少70%的同源性;(b)將步驟(a)中的表達載體轉入宿主細胞,形成E16H蛋白的重組細胞;(c)在適合表達E16H蛋白多肽的條件下,培養步驟(b)中的重組細胞;(d)分離出具有E16H蛋白活性的多肽。
11.如權利要求10所述的方法,其特征在于,該序列為SEQ ID NO.3中從核苷酸118-1251位。
12.一種能與權利要求4所述的E16H蛋白多肽特異性結合的抗體。
13.一種核苷酸分子,其特征在于,它是權利要求1所述DNA分子的反義序列。
14.一種探針分子,其特征在于,它含有權利要求1所述的DNA分子中約8-100個連續核苷酸。
全文摘要
本發明提供了一種新的人基因核苷酸序列。本發明提供了人E16H的cDNA序列及由該核苷酸序列編碼的多肽。人E16H是與人E16蛋白高度同源的蛋白。本發明還提供了E16H多核苷酸和多肽的應用,以及所述多核苷酸和所述多肽的生產方法。
文檔編號C12N15/12GK1252446SQ98121960
公開日2000年5月10日 申請日期1998年10月22日 優先權日1998年10月22日
發明者余龍, 傅強, 趙勇, 劉擎, 趙壽元 申請人:上海新黃浦復旦基因工程有限公司