專利名稱:一種新的人基因序列、其編碼的多肽及制備方法
技術領域:
本發明涉及基因工程領域,具體地,本發明涉及一種新的人基因和蛋白。更具體地說,本發明涉及了一種新的sec1基因家族的成員HSly1。本發明提供了該人HSly1的cDNA編碼序列、該序列編碼的多肽,以及利用重組技術生產所述的新的人HSly1的方法。本發明還提供了這種新人HSly1的應用。
在真核細胞中,高爾基體是細胞內大分子運輸的一個主要的交通樞紐。由內質網合成的蛋白質、脂類在高爾基體中被加工、分類與包裝,然后分別運送到細胞特定的部位或分泌到細胞外。高爾基體的分泌途徑主要分兩類在固有性分泌途徑中,通過連續的胞吐作用將蛋白質和磷脂運送到細胞表面;在調節性分泌途徑中,分泌泡成熟后暫時儲存在細胞質中,在外來信號刺激下,分泌泡內含物向細胞外釋放(《細胞生物學》,(1995),高等教育出版社,翟中和主編)。目前發現在兩種途徑的運輸中都涉及膜的轉運和融合,并與膜上的受體有關。由幾個相關的基因家族,共同指導囊泡出芽、定向移動和不同區室間發生的融合。突觸融合蛋白(syntaxin)和sec1就是這樣的兩個基因家族。
突觸融合蛋白基因家族編碼一族囊泡運輸過程中膜上的受體,與兩類分泌途徑中膜的轉運均有關。該家族的成員包括哺乳動物細胞中突觸融合蛋白1A,1B,2,3A-3E,4,5,6和酵母中的Pep12p,Sso1/2p和Sed5p等(Dascher C et al,J.Biol.Chem,1994,269(47),29363-29366)。其中,突觸融合蛋白1A/B、2、3、4均為細胞膜上的停靠受體,與囊泡上的膜蛋白識別并結合,促進囊泡膜與細胞膜的融合和內含物的釋放。(Bennett MK et al,Proc.Natl.Acad.Sci.U.S.A,1993,90,2559-2563)。而突觸融合蛋白5是在高爾基體區域中發現的,它是將內質網合成的產物運至高爾基體囊堆的囊泡運輸過程中必須的蛋白質(Dascher C et al,J.Biol.Chem,1994,269(47),29363-29366)。穩定狀態下,突觸融合蛋白5主要與高爾基體內側的活動有關,它在內質網和前高爾基體或高爾基體內側之間的區室中被迅速地循環利用(Walch-Solimena C et al.,J.Cell.Biol,1995,128,637)。突觸融合蛋白5的過度表達會導致前高爾基體中間物在細胞中的積累。此外,突觸融合蛋白5還可能與前高爾基體中間物的形成和成熟有關。突觸融合蛋白5存在下,中間體才能正常的生成,形成高爾基體內側的網絡,為高爾基體的成熟提供基礎(Presley JFet al.,Nature,1997,389,81)。
sec1基因家族的成員包括神經元中特有的Munc-18/n-Sec1/rb-Sec1、酵母中的Sly1、Vps33、Vps45和在哺乳動物中廣泛表達的同種型Munc-18等(William EB etal.,J Biol.Chem.(1996)Vol 271(27),15866-15869)。該家族成員在囊泡運輸過程中具體的作用機制尚不詳,但由于它們都能與功能已知的突觸融合蛋白家族、ras家族的成員形成復合物,影響后者的功能,所以可以推測sec1家族的成員在囊泡運輸中必定有著非常重要的功能。其中,酵母Sly1可以與突觸融合蛋白基因家族的不同成員如Sed5、突觸融合蛋白1、2、3、4分別形成復合物,還可與真核細胞細胞中分泌途徑必須的調控因子Ypt1形成復合物(Ossig R et al.,Mol.Cell.Biol,1991,Vol11(6),2980-2993)。Ypt1是ras基因超家族的一個成員,是小的GTP結合蛋白。因為有些蛋白在結合GTP或GDP時,在分泌途徑中囊泡出芽或不同區室間發生融合等事件中表現出不同的活性,不同分泌途徑中胞內運輸和囊泡內蛋白分選的特異性最終取決于許多不同部位的GTP結合蛋白,包括Ypt1、Sec4p、ARF1、ARF2等。缺少Ypt1將引起內質網至高爾基體運輸路線的阻斷。Sly1的點突變能抑制Ypt1的功能缺失(Dascher MR et al.,Mol Cell.Biol,1991,Vol11,872-885)。Sly1基因的產物在分泌途徑早期發揮作用,實驗觀察到,缺少Sly1的細胞中將積累內質網,無法正常分泌蛋白。1995年Peterson MR等人首先在鼠的肝臟中發現哺乳動物中Sly1的同源基因,命名為rSly1。其蛋白產物可以與突觸融合蛋白5形成復合物,調控突觸融合蛋白5在內質網到高爾基體運輸中的功能(Peterson MR et al,Gene,(1996),169,293-294)。在本發明之前還沒有公開或發表過人體中的Sly1的同源基因。
本發明的一個目的是提供一種新的多核苷酸,該多核苷酸編碼sec1基因家族的一個新成員,本發明新的人sec1家族的基因被命名為HSly1。
本發明的另一個目的是提供一種新的sec1蛋白家族成員,該蛋白被命名為HSly1蛋白。
本發明的再一個目的是提供一種利用重組技術生產所述的新的人HSly1的方法。
本發明還涉及這種人HSly1基因序列和多肽的應用。
在本發明的一個方面,提供了一種分離出的DNA分子,它包括編碼具有人HSly1蛋白活性的多肽的核苷酸序列,所述的核苷酸序列與SEQ ID NO.5中從核苷酸35-1888位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度嚴緊條件下與SEQ ID NO.5中從核苷酸35-1888位的核苷酸序列雜交。較佳地,所述的序列編碼一多肽,該多肽具有SEQ ID NO.6所示的序列。更佳地,該序列具有SEQ ID NO.5中從核苷酸35-1888位的核苷酸序列。
在本發明的另一方面,提供了一種分離的HSly1蛋白多肽,它包括具有SEQID NO.6氨基酸序列的多肽、或其活性片段,或其活性衍生物。較佳地,該多肽是具有SEQ ID NO.6序列的多肽。
在本發明的另一方面,提供了一種載體,它含有上述分離出的DNA。
在本發明的另一方面,提供了一種所述載體轉化的宿主細胞。
在本發明的另一方面,提供了一種產生具有HSly1蛋白活性的多肽的方法,該方法包括(a)將編碼具有HSly1蛋白活性的多肽的核苷酸序列可操作地連于表達調控序列,形成HSly1蛋白表達載體,所述的核苷酸序列與SEQ ID NO.5中從核苷酸35-1888位的核苷酸序列有至少70%的同源性;(b)將步驟(a)中的表達載體轉入宿主細胞,形成HSly1蛋白的重組細胞;(c)在適合表達HSly1蛋白多肽的條件下,培養步驟(b)中的重組細胞;(d)分離出具有HSly1蛋白活性的多肽。
在本發明的一個具體實施方案中,本發明的分離的多核苷酸全長為583個核苷酸,其詳細序列見SEQ ID NO.5,其中開放讀框位于35-1888位核苷酸。
在本發明中,“分離的”、“純化的”或“基本純的”DNA是指,該DNA或片段已從天然狀態下位于其兩側的序列中分離出來,還指該DNA或片段已經與天然狀態下伴隨核酸的組份分開,而且已經與在細胞中伴隨其的蛋白質分開。
在本發明中,術語“HSly1蛋白(或多肽)編碼序列”指編碼具有HSly1蛋白活性的多肽的核苷酸序列,如SEQ ID NO.5中35-1888位核苷酸序列及其簡并序列。該簡并序列是指,位于SEQ ID NO.5序列的編碼框35-1888位核苷酸中,有一個或多個密碼子被編碼相同氨基酸的簡并密碼子所取代后而產生的序列。由于密碼子的簡并性,所以與SEQ ID NO.5中35-1888位核苷酸序列同源性低至約70%的簡并序列也能編碼出SEQ ID NO.6所述的序列。該術語還包括能在中度嚴緊條件下,更佳地在高度嚴緊條件下,與SEQ ID NO.5中從核苷酸35-1888位的核苷酸序列雜交的核苷酸序列。此外,該術語還包括與SEQ ID NO.5中從核苷酸35-1888位的核苷酸序列的同源性至少70%,較佳地至少80%,更佳地至少90%的核苷酸序列。
該術語還包括能編碼具有與人HSly1相同功能的蛋白的、SEQ ID NO.5中開放閱讀框序列的變異形式。這些變異形式包括(但并不限于)若干個(通常為1-90個,較佳地1-60個,更佳地1-20個,最佳地1-10個)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加數個(通常為60個以內,較佳地為30個以內,更佳地為10個以內,最佳地為5個以內)核苷酸。
在本發明中,“基本純的”蛋白質或多肽是指其至少占樣品總物質的至少20%,較佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或濕重計)。純度可以用任何合適的方法進行測量,如用柱層析、PAGE或HPLC法測量多肽的純度。基本純的多肽基本上不含天然狀態下的伴隨其的組分。
在本發明中,術語“HSly1蛋白多肽”指具有HSly1蛋白活性的SEQ ID NO.6序列的多肽。該術語還包括具有與人HSly1蛋白相同功能的、SEQ IDNO.6序列的變異形式。這些變異形式包括(但并不限于)若干個(通常為1-50個,較佳地1-30個,更佳地1-20個,最佳地1-10個)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一個或數個(通常為20個以內,較佳地為10個以內,更佳地為5個以內)氨基酸。例如,在本領域中,用性能相近或相似的氨基酸進行取代時,通常不會改變蛋白質的功能。又比如,在C末端和/或N末端添加一個或數個氨基酸通常也不會改變蛋白質的功能。該術語還包括HSly1蛋白的活性片段和活性衍生物。
該多肽的變異形式包括同源序列、等位變異體、天然突變體、誘導突變體、在高或低的嚴謹度條件下能與HSly1 DNA雜交的DNA所編碼的蛋白、以及利用抗HSly1多肽的抗血清獲得的多肽或蛋白。本發明還提供了其他多肽,如包含HSly1多肽或其片段的融合蛋白。除了幾乎全長的多肽外,本發明還提供了HSly1多肽的可溶性片段。通常,該片段具有HSly1多肽序列的至少約10個連續氨基酸,通常至少約30個連續氨基酸,較佳地至少約50個連續氨基酸,更佳地至少約80個連續氨基酸,最佳地至少約100個連續氨基酸。
發明還提供HSly1蛋白或多肽的類似物。這些類似物與天然HSly1多肽的差別可以是氨基酸序列上的差異,也可以是不影響序列的修飾形式上的差異,或者兼而有之。這些多肽包括天然或誘導的遺傳變異體。誘導變異體可以通過各種技術得到,如通過輻射或暴露于誘變劑而產生隨機誘變,還可通過定點誘變法或其他已知分子生物學的技術。類似物還可以包括具有不同于天然L-氨基酸的殘基(如D-氨基酸)的類似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的類似物。應理解,本發明的多肽并不限于上述例舉的代表性的多肽。
修飾(通常不改變一級結構)形式包括體內或體外的多肽的化學衍生形式如乙酰化或羧基化。修飾還包括糖基化,如那些在多肽的合成和加工中或進一步加工步驟中進行糖基化修飾而產生的多肽。這種修飾可以通過將多肽暴露于進行糖基化的酶(如哺乳動物的糖基化酶或去糖基化酶)而完成。修飾形式還包括具有磷酸化氨基酸殘基(如磷酸酪氨酸、磷酸絲氨酸、磷酸蘇氨酸)的序列。還包括被修飾從而提高了其抗蛋白水解性能或優化了溶解性能的多肽。
本發明還包括HSly1多肽編碼序列的反義序列。這種反義序列可用于抑制細胞內HSly1的表達。
本發明還包括一種可用作探針或引物的核苷酸分子。該探針分子通常具有HSly1核苷酸序列的8-100個,較佳地15-50個連續核苷酸。該探針可用于檢測樣品中是否存在編碼HSly1的核酸分子。
本發明還包括檢測HSly1核苷酸序列的方法,它包括用上述的探針與樣品進行雜交,然后檢測探針是否發生了結合。較佳地,該樣品是PCR擴增后的產物,其中PCR擴增引物對應于HSly1多肽的編碼序列,可位于該編碼序列的兩側或中間。引物長度一般為20-50個核苷酸。
在本發明中,可選用本領域已知的各種載體,如市售的載體。
在本發明中,術語“宿主細胞”包括原核細胞和真核細胞。常用的原核宿主細胞的例子包括大腸桿菌、枯草桿菌等。常用的真核宿主細胞包括酵母細胞,昆蟲細胞、和哺乳動物細胞。較佳地,該宿主細胞是真核細胞,如CHO細胞、COS細胞等。
另一方面,本發明還包括對HSly1 DNA或是其片段編碼的多肽具有特異性抗體,尤其是單克隆抗體。這里,“特異性”是指抗體能結合于HSly1基因產物或片段。較佳地,指那些能與HSly1基因產物或片段結合但不識別和結合于其它非相關抗原分子的抗體。本發明中抗體包括那些能夠結合并抑制HSly1蛋白的分子,也包括那些并不影響HSly1蛋白功能的抗體。本發明還包括那些能與修飾或未經修飾形式的HSly1基因產物結合的抗體。
本發明不僅包括完整的單克隆或多克隆抗體,而且還包括具有免疫活性的抗體片段,如Fab′或(Fab)2片段;抗體重鏈;抗體輕鏈;遺傳工程改造的單鏈Fv分子(Ladner等人,美國專利No.4,946,778);或嵌合抗體,如具有鼠抗體結合特異性但仍保留來自人的抗體部分的抗體。
本發明的抗體可以通過本領域內技術人員已知的各種技術進行制備。例如,純化的HSly1基因產物或者其具有抗原性的片段,可被施用于動物以誘導多克隆抗體的產生。與之相似的,表達HSly1或其具有抗原性的片段的細胞可用來免疫動物來生產抗體。本發明的抗體也可以是單克隆抗體。此類單克隆抗體可以利用雜交瘤技術來制備(見Kohler等人,Nature 256;495,1975;Kohler等人,Eur.J.Immunol.6511,1976;Kohler等人,Eur.J.Immunol.6292,1976;Hammerling等人,In Monoclonal Antibodies and T Cell Hybridomas,Elsevier,N.Y.,1981)。本發明的抗體包括能阻斷HSly1功能的抗體以及不影響HSly1功能的抗體。本發明的各類抗體可以利用HSly1基因產物的片段或功能區,通過免疫技術獲得。這些片段或功能區可以利用重組方法制備或利用多肽合成儀合成。與HSly1基因產物的未修飾形式結合的抗體可以用原核細胞(例如E.Coli)中生產的基因產物來免疫動物而產生;與翻譯后修飾形式結合的抗體(如糖基化或磷酸化的蛋白或多肽),可以用真核細胞(例如酵母或昆蟲細胞)中產生的基因產物來免疫動物而獲得。
本發明的HSly1核苷酸序列全長序列或其片段通常可以用PCR擴增法、重組法或人工合成的方法獲得。對于PCR擴增法,可根據本發明所公開的有關核苷酸序列,尤其是開放閱讀框序列來設計引物,并用市售的cDNA庫或按已知方法制備的cDNA庫作為模板,擴增而得有關序列。當序列較長時,常常需要進行兩次或多次PCR擴增,然后再將各次擴增出的片段按正確次序拼接在一起。
一旦獲得了有關的序列,就可以用重組法來大批量地獲得有關序列。這通常是將其克隆入載體,再轉入細胞,然后通過常規方法從增殖后的宿主細胞中分離得到有關序列。
此外,還可用人工合成的方法來合成有關序列,尤其是片段長度較短時。當然,通過先合成多個小片段,然后再進行連接而獲得序列很長的片段。
在本發明的一個實施方案中,本發明的多核苷酸全長為1992個核苷酸,其詳細序列見SEQ ID NO.5,其中開放讀框位于35-1888位核苷酸。該多核苷酸是如此獲得的,以人腦λgt11cDNA文庫(購自Clontech公司)為模板,合成正向引物A5′-TATTCGGGAAAGGCAGACAGTGG-3′(SEQ ID NO.1)、正向引物C5’-TTGGACATATCAAGCATTGGTGC-3’(SEQ ID NO.3)和反向引物B5′-AACAGCTGATG TTAGCTTAGCGG-3′(SEQ ID NO.2)、反向引物D5’-TTAGGACACTGTTACAG AGAAGG-3’(SEQ ID NO.4)進行兩次PCR,獲得1992bp的目的片段。測序后得到SEQ ID NO.5的全長cDNA序列。
根據同源比較的結果,本發明的核苷酸序列及其編碼的蛋白質序列與不同來源的sec1家族成員顯示了顯著的同源性,因此,這表明它是sec1家族的一個新成員,并且具有sec1家族蛋白的一些重要功能。
HSly1是人體細胞中蛋白分泌機制的重要組成,在囊泡運輸(尤其是從內質網到高爾基體的囊泡運輸)中有著重要的功能,還可能與高爾基體的成熟及功能正常行使有關。當細胞受到外來壓力時,HSly1能夠改變生化合成的方向,顯著提高特定蛋白的產量并促進蛋白的釋放。
在附圖中,
圖1為本發明的人HSly1核酸序列(HSLY1N)與鼠RSLY1的核酸序列(RSLY1N)的同源比較圖。其中,相同的核苷酸用“|”標出。
圖2為本發明的人HSly1蛋白(HSLY1P)與鼠RSLY1蛋白(RSLY1P)的氨基酸序列的同源比較圖。其中,相同的氨基酸在兩個序列之間用“|”標出,相似的氨基酸用“·”標出。相似氨基酸是A,S,T;D,E;N,Q;R,K;I,L,M,V;F,Y,W。
下面結合具體實施例,進一步闡述本發明。應理解,這些實施例僅用于說明本發明而不用于限制本發明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規條件如Sambrook等人,分子克隆實驗室手冊(New YorkCold Spring HarborLaboratory Press,1989)中所述的條件,或按照制造廠商所建議的條件。
實施例1HSly1的cDNA序列的克隆和測定1.引物擴增以人腦λgt11cDNA文庫(購自Clontech公司)為模板,用兩對寡核苷酸為引物——A5′-TATTCGGGAAAGGCAGACAGTGG-3′(SEQ ID NO.1)和C5’-TTGGACATATCAAGCATTGGTGC-3’(SEQ ID NO.3)為正向引物,寡核苷酸B5′-AACAG CTGATGTTAGCTTAGCGG -3′(SEQ ID NO.2)和D5’-TTAGGACACTGTTACAGAGAAGG-3’(SEQ ID NO.4)為反向引物,進行PCR。A/B引物對和C/D引物對的PCR條件均為93℃4分鐘,隨之以93℃1分鐘、67℃1分鐘和72℃1分鐘進行35個循環,最后72℃延伸5分鐘。電泳檢測得到的PCR片斷分別為1117、1211bp的目的片段。
2.PCR產物的測序將如上獲得的兩段PCR擴增產物分別與pGEM-T載體(Promega)連接,轉化大腸桿菌JM103,用QIAprep Plasmid試劑盒(QIAGEN)提取質粒,用雙鏈嵌套式缺失試劑盒(Pharmacia)對插入片段進行定向系列缺失,然后用PCR對缺失子進行快速鑒定及排序。用SequiTherm EXCELTMDNA測序試劑盒(Epicentre Technologies)對依次截短的缺失子進行測序,最后用電腦軟件拼接順序,獲得全長cDNA序列,共1992bp,詳細序列見SEQ ID NO.5,其中開放讀框位于35-1888位核苷酸。
根據得到的全長cDNA序列推導出HSly1的氨基酸序列,共617個氨基酸殘基,其氨基酸序列詳見SEQ ID NO.6。
實施例2同源比較用HSly1的全長cDNA序列及其編碼蛋白在Non-redundant GenBank+EMBL+DDBJ+PDB數據庫及Non-redundant GenBank CDS translations+PDB+SwissProt+Spupdate+PIR數據庫中用BLAST進行核酸和蛋白同源檢索。發現它們與sec1基因家族的成員具有較高的同源性,其中與鼠的rSly1基因在核酸水平上達到85.5%相同(圖1),在蛋白水平上達到96%相同,98%相似(圖2)。因而可以認為我們所找到的基因是rSly1的同源基因,是sec1基因家族的一個新成員。
rSly1與酵母的Sly1是同源基因(核酸的同源性為30%),它的開放閱讀框編碼了一個分子量為72~73kD的親水蛋白。該蛋白可以與突觸融合蛋白5形成復合物,正調控突觸融合蛋白5在內質網到高爾基體運輸中的功能。可能的調控機制是rSly1與突觸融合蛋白5的結合可以促進停靠-融合復合物的形成。突觸融合蛋白5的過度表達將用竭內源性的rSly1,未形成復合物的突觸融合蛋白5將阻礙囊泡停靠和融合過程中正常的蛋白質復合物的形成。僅當rSly1表達相當于或過量于突觸融合蛋白5時,突觸融合蛋白5才能正常的行使功能。而過量表達的rSly1本身對內質網到高爾基體的運輸無顯著負效應。(William EB et al.,J Biol.Chem.(1996)Vol 271(27),15866-15869)。rSly1與sec1家族其他成員一樣,沒有穿膜區。已經在鼠的八個不同組織中發現了rSly1的表達,其中在腦中和肺中最多。rSly1的廣泛表達暗示rSly1可能在所有組織中的內質網到高爾基體的運輸中發揮作用(Peterson MR et al,Gene(1996),169,293-294)。
迄今所進行的研究都表明,蛋白分泌機制中的必要組成在進化中是高度保守的。由對HSly1的序列分析和同源性比較的結果,可以推測,HSly1是人體細胞中蛋白分泌機制的重要組成,在囊泡運輸(尤其是從內質網到高爾基體的囊泡運輸)中有著重要的功能,還可能與高爾基體的成熟及功能正常行使有關。由于,高爾基體在內膜系統中處于中介地位,許多重要的大分子的運輸和分泌都要通過高爾基體,如腺體細胞的分泌顆粒、血細胞的細胞質顆粒和精細胞的頂體。高爾基體還與新的細胞質膜、細胞壁的形成和蛋白質的改造有關。高爾基體和蛋白分泌途徑的異常將使細胞發生病理性的變化,或發生分化程度的改變,引起骨節炎等病癥。
在另一項研究中發現,rSly1(在此項研究中該基因的蛋白產物又被命名為RA410,Matsuo N et al.,J.Biol.Chem.,1997,Vol272(26),16438)與后高爾基體的蛋白加工和運輸有關,當星形膠質細胞因局部缺血而缺氧后重新給氧時,RA410在細胞中的表達量會明顯增加。這意味著RA410很可能是星形膠質細胞受到外來壓力時進行的蛋白質運輸的主要功能組成。星形膠質細胞在中樞神經系統中有非常重要的功能,與血腦屏障的維持和興奮性神經遞質的移動均有關系。星形膠質細胞能夠生成細胞因子,如白介素IL-1,IL-6和干擾素等。已經證實,星形膠質細胞局部缺血后重新給氧時,會生成IL-6。但如果RA410的表達被抑制,IL-6將無法正常生成。可見,RA410在缺氧后重新得氧的星形膠質細胞中為IL-6提供了最優化的運輸。可以推測,在人體中發現的Sly1的同源基因產物也可能與RA410有類似的功能,即當細胞受到外來壓力時能夠改變生化合成的方向,顯著提高特定蛋白的產量并促進蛋白的釋放。
對HSly1的結構和序列的了解,不僅有助于對其功能的進一步研究,更有助于進一步闡明細胞內物質運輸的分子機制,為相關疾病的治療提供理論依據。
本發明的人HSly1除了可作為該家族一員用于進一步的功能研究,還可用于與其他蛋白一起產生融合蛋白,比如與免疫球蛋白一起產生融合蛋白。此外,本發明人HSly1還可以與該家族的其他成員進行融合或交換片段,以產生新的蛋白。例如將本發明人HSly1的N端與鼠RSly1的N端進行交換,以產生新的活性更高或具有新特性的蛋白。
針對本發明人HSly1的抗體,用于篩選該家族的其他成員,或者用于親和純化相關蛋白(如該家族的其他成員)。
此外,本發明人HSLY1核酸(編碼序列或反義序列)可以被引入細胞,以提高人HSLY1的表達水平或者抑制人HSLY1的過度表達。本發明的人HSLY1蛋白或其活性多肽片段可以施用于病人,以治療或減輕因人HSLY1缺失、無功能或異常而導致的有關病癥。此外,還可以用基于本發明的核酸序列或抗體進行有關的診斷或預后判斷。
實施例3HSly1在大腸桿菌中的表達在該實施例中,將在實施例1中獲得的兩個片段分別用Xmn I酶切,混合并加入連接酶連接,連接完成后走電泳,鑒定并回收正確連接的全長片段。將編碼HSly1的DNA序列作為模板,用對應于該DNA序列的5’,3’端的PCR寡核苷酸引物進行擴增,獲得HSly1的cDNA作為插入片段。
5′寡核苷酸引物序列為5′-GCATGGATCCATGTTGAATTTCAATGTGC-3′(SEQ ID NO.7),該引物含有BamHI限制性內切酶的酶切位點,接之是由起始密碼子開始的HSly1編碼序列的19個核苷酸;3’寡核苷酸引物序列為5’-ACAGGTCGACTTACTTTTGTCCAAGTTGT-3’(SEQ ID NO.8),該引物含有SalI限制性內切酶的酶切位點,一個翻譯終止子和HSly1的編碼序列。
限制性內切酶的酶切位點對應于細菌表達載體pQE-9(Qiagen Inc.,Chatsworth,CA)上的限制性內切酶酶切位點,該質粒載體編碼抗生素抗性(Ampr)、一個細菌復制起點(ori)、一個IPTG-可調啟動子/操縱子(P/O)、一個核糖體結合位點(RBS)、一個6-組氨酸標記物(6-His)以及限制性內切酶克隆位點。
用BamHI和SalI消化pQE-9載體及插入片段,隨后將插入片段連接到pQE-9載體并保持開放讀框在細菌RBS起始。隨后用連接混合物轉化購自Qiagen,商品名為M15/rep4的E.coli菌株,M15/rep4含有多拷貝的質粒pREP4,其表達lacI阻遏物并攜帶卡那霉素抗性(Kanr)。在含有Amp和Kan的LB培養皿上篩選轉化子,在補加Amp(100μg/ml)和Kan(25μg/ml)的LB液體培養基中過夜培養(O/N)含所需構建物的陽性轉化子克隆。抽提質粒,用HindIII酶切鑒定插入片段大小及方向,測序驗證結果表明HSly1的cDNA插入片段已正確裝入載體。
過夜(O/N)培養物以1∶100-1∶250的稀釋率稀釋,然后接種到大體積培養基中,培養細胞生長至600光密度(OD600)為0.4-0.6時,加入IPTG(“異丙基硫代-β-D-半乳糖苷”)至終濃度為1mM。通過使lacI阻遏物失活,IPTG誘導啟動P/O導致基因表達水平提高。繼續培養細胞3-4小時,隨后離心(6000×g,20分鐘)。超聲裂解包涵體,收集細胞并將細胞沉淀溶于6M的鹽酸胍中。澄清后,通過在能使含6-His標記物蛋白緊密結合的條件下,用鎳-螯合柱層析從溶液中純化溶解的HSly1。用6M鹽酸胍(pH5.0)從柱中洗脫HSly1。可用幾種方法從鹽酸胍中變性沉淀蛋白。首先,使用透析步驟除去鹽酸胍,或者從鎳-螯合柱中分離出的純化蛋白可以結合到第二個柱中,該柱中具有遞減的線性鹽酸胍梯度。在結合到該柱時蛋白質變性,隨后用鹽酸胍(pH5.0)洗脫。最后,將可溶的蛋白質用PBS進行透析,然后將蛋白質保存在終濃度為10%(w/v)甘油的貯存液中。
用12%的SDS-PAGE膠進行電泳,鑒定表達蛋白的分子量大小為70KDa。
此外,用常規方法對表達蛋白的N端和C端各10個氨基酸長度的氨基酸進行測序,發現與SEQ ID NO.6的序列一致。
實施例4HSly1在真核細胞(CHO細胞株)中的表達在該實施例中,將在實施例1中獲得的兩個片段分別用Xmn I酶切,混合并加入連接酶連接,連接完成后走電泳,鑒定并回收正確連接的全長片段。將編碼HSly1的DNA序列作為模板,用對應于該DNA序列的5’,3’端的PCR寡核苷酸引物進行擴增,獲得HSly1的cDNA作為插入片段。
PCR反應中使用的5′寡核苷酸引物序列為5′-GCATGGATCCATGTTGAATTTCAATGTGC-3′(SEQ ID NO.9),該引物含有BamHI限制性內切酶的酶切位點,接之是由起始密碼子開始的HSly1編碼序列的19個核苷酸;3′端引物序列為5’-ACAGGAATTCTTACTTTTGTCCAAGTTGT-3’(SEQ ID NO.10)該引物含有EcoRI限制性內切酶的酶切位點、一個翻譯終止子和HSly1的編碼序列。
引物上的限制性內切酶的酶切位點對應于CHO細胞表達載體pcDNA3上的限制性內切酶酶切位點,該質粒載體編碼抗生素抗性(Ampr和Neor)、一個噬菌體復制起點(f1 ori)、一個病毒復制起點(SV40 ori)、一個T7啟動子、一個病毒啟動子(P-CMV)、一個Sp6啟動子、一個SV40啟動子、一個SV40加尾信號和相應的polyA順序、一個BGH加尾信號和相應的polyA順序。
用BamHI和EcoRI消化pcDNA3載體及插入片段,隨后將插入片段連接到pcDNA3載體。隨后用連接混合物轉化E.coli DH5α菌株。在含有Amp的LB培養皿上篩選轉化子,在補加Amp(100μg/ml)的LB液體培養基中過夜培養(O/N)含所需構建物的克隆。抽提質粒,測序驗證結果表明HSly1的cDNA插入片段已正確裝入載體。
質粒轉染是采用脂轉染法,用Lipofectin試劑盒(GiBco Life)進行的。轉染48小時后,經2-3周的持續G418加壓篩選,收集細胞及細胞上清測定表達蛋白酶活力。去G418,連續傳代培養;對混合克隆細胞極限稀釋,選擇具有較高蛋白活性的細胞亞克隆。按常規方法大量培養上述陽性亞克隆。48小時后,開始收集細胞及上清,用超聲裂解方法破碎細胞。以含0.05%Triton的50mM Tris·HCl(pH7.6)溶液為平衡液及洗脫液,用經預平衡的Superdex G-75柱收集上述蛋白的活性峰。再用50mM Tris·HCl(pH8.0)平衡的DEAE-Sepharose柱,以含0-1M NaCl的50mMTris·HCl(pH8.0)溶液為洗脫液進行梯度洗脫,收集上述蛋白的活性峰。然后以PBS(pH7.4)為透析液對表達蛋白溶液進行透析。最后凍干保存。
用12%的SDS-PAGE膠進行電泳,鑒定表達蛋白的分子量大小為70KDa。
此外,用常規方法對表達蛋白的N端和C端各10個氨基酸長度的氨基酸進行測序,發現與SEQ ID NO.6的序列一致。
實施例5制備抗體將實施例3和4中獲得的重組蛋白用來免疫動物以產生抗體,具體如下。重組蛋白用層析法進行分離后備用。也可用SDS-PAGE凝膠電泳法進行分離,將電泳條帶從凝膠中切下,并用等體積的完全Freund’s佐劑乳化。用50-100μg/0.2ml乳化過的蛋白,對小鼠進行腹膜內注射。14天后,用非完全Freund’s佐劑乳化的同樣抗原對小鼠以50-100μg/0.2ml的劑量進行腹膜內注射以加強免疫。每隔14天進行一次加強免疫,至少進行三次。獲得的抗血清的特異反應活性用它在體外沉淀HSly1基因翻譯產物的能力加以評估。
在本發明提及的所有文獻都在本申請中引用作為參考,就如同每一篇文獻被單獨引用作為參考那樣。此外應理解,在閱讀了本發明的上述講授內容之后,本領域技術人員可以對本發明作各種改動或修改,這些等價形式同樣落于本申請所附權利要求書所限定的范圍。
序列表(1)一般信息(i)申請人上海新黃浦復旦基因工程有限公司(ii)發明名稱一種新的人基因序列、其編碼的多肽及制備方法(iii)序列數目10(2)SEQ ID NO.1的信息(i)序列特征(A)長度23堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO.1TATTCGGGAA AGGCAGACAG TGG 23(2)SEQ ID NO.2的信息(i)序列特征(A)長度23堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO.2AACAGCTGAT GTTAGCTTAG CGG 23(2)SEQ ID NO.3的信息(i)序列特征
(A)長度23堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO.3TTGGACATAT CAAGCATTGG TGC 23(2)SEQ ID NO.4的信息(i)序列特征(A)長度23堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO.4TTAGGACACT GTTACAGAGA AGG 23(2)SEQ ID NO.5的信息(i)序列特征(A)長度1992bp(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO.51 TATTCGGGAA AGGCAGACAG TGGCTTTGAA GCGTATGTTG AATTTCAATG TGCCTCATAT61 TAAAAACAGC ACAGGAGAAC CAGTATGGAA GGTACTCATT TATGACAGAT TTGGCCAAGA121 TATAATCTCT CCTCTGCTAT CTGTGAAGGA GCTAAGAGAC ATGGGAATCA CTCTGCATCT181 GCTTTTACAC TCTGATCGAG ATCCTATTCC AGATGTTCCT GCAGTATACT TTGTAATGCC241 AACTGAAGAA AATATTGACA GAATGTGCCA GGATCTTCGA AATCAACTAT ATGAATCATA301 TTATTTAAAT TTTATTTCTG CTATTTCAAG AAGTAAACTG GAAGATATTG CAAATGCAGC361 GTTAGCAGCT AGTGCAGTAA CACAAGTAGC CAAGGTTTTT GACCAATATC TCAATTTTAT421 TACTTTGGAA GATGATATGT TTGTATTATG TAATCAAAAT AAGGAGCTTG TTTCATATCG481 TGCCATTAAC AGGCCAGATA TCACAGACAC GGAAATGGAA ACTGTTATGG ACACTATAGT541 TGACAGCCTC TTCTGCTTTT ATGGTACTCT GGGTGATGTT CCTATAATCA GATGTTCAAG601 AGGAACAGCA GCAGAAATGG TAGCAGTGAA ACTAGACAAG AAACTTCGAG AAAATCTAAG661 AGATGCAAGA AACAGTCTTT TTACAGGTGA TACACTTGGA GCTGGCCAAT TCAGCTTCCA721 GAGGCCCTTA TTAGTCCTTG TTGACAGAAA CATAGATTTG GCAACTCCTT TACATCATAC781 TTGGACATAT CAAGCATTGG TGCACGATGT ACTGGATTTC CATTTAAACA GGGTTAATTT841 GGAAGAATCT TCAGGAGTGG AAAACTCTCC AGCTGGTGCT AGACCAAAGA GAAAAAACAA901 GAAGTCTTAT GATTTAACTC CGGTTGATAA ATTTTGGCAA AAACATAAAG GAAGTCCATT961 CCCAGAAGTT GCAGAATCAG TTCAGCAAGA ACTAGAATCT TACAGAGCAC AGGAAGATGA1021 GGTCAAACGA CTTAAAAGCA TTATGGGACT AGAAGGGGAA GATGAAGGAG CCATAAGTAT1081 GCTTTCTGAC AATACCGCTA AGCTAACATC AGCTGTTAGT TCTTTGCCAG AACTCCTTGA1141 GAAAAAAAGA CTTATTGATC TCCATACAAA TGTTGCCACT GCTGTTTTAG AACATATAAA1201 GGCAAGAAAA TTGGATGTAT ATTTTGAATA TGAAGAAAAA ATAATGAGCA AAACTACTCT1261 GGATAAATCT CTTCTAGATA TAATATCAGA CCCTGATGCA GGAACTCCAG AAGATAAAAT1321 GAGGTTGTTT CTTATCTATT ATATAAGCAC ACAGCAAGCA CCTTCTGAGG CTGATTTGGA1381 GCAATATAAA AAAGCTTTAA CTGATGCAGG ATGCAACCTT AATCCTTTAC AATATATCAA1441 ACAGTGGAAG GCTTTTACCA AGATGGCCTC AGCTCCGGCC AGCTATGGCA GCACTACCAC1501 TAAACCAATG GGTCTTTTAT CACGAGTCAT GAATACAGGA TCACAGTTTG TGATGGAAGG1561 AGTGAAGAAC CTGGTTTTGA AACAGCAAAA TCTACCTGTT ACTCGTATTT TGGACAATCT1621 TATGGAGATG AAGTCAAACC CCGAAACTGA TGACTATAGA TATTTTGATC CCAAAATGCT1681 GCGGGGCAAT GACAGCTCAG TTCCCAGAAA TAAAAATCCA TTCCAAGAGG CCATTGTTTT1741 TGTGGTGGGA GGAGGCAACT ACATTGAATA TCAGAATCTT GTTGACTACA TAAAGGGGAA1801 ACAAGGCAAA CACATTTTAT ATGGCTGCAG TGAGCTTTTT AATGCTACAC AGTTCATAAA1861 ACAGTTGTCA CAACTTGGAC AAAAGTAACA CAGAAGAACC TTACTATGAT AATCTACTTG1921 GAATGTGGAT AAATGTAAAA AGAAGAAAAG TTAGAAGAGC AATATGTTTC CTTCTCTGTA1981 ACAGTGTCCT AA(2)SEQ ID NO.6的信息(i)序列特征(A)長度617個氨基酸(B)類型氨基酸(D)拓撲結構線性(ii)分子類型多肽(xi)序列描述SEQ ID NO.61 Met Leu Asn Phe Asn Val Pro His Ile Lys Asn Ser Thr Gly Glu16 Pro Val Trp Lys Val Leu Ile Tyr Asp Arg Phe Gly Gln Asp Ile31 Ile Ser Pro Leu Leu Ser Val Lys Glu Leu Arg Asp Met Gly Ile46 Thr Leu His Leu Leu Leu His Ser Asp Arg Asp Pro Ile Pro Asp61 Val Pro Ala Val Tyr Phe Val Met Pro Thr Glu Glu Asn Ile Asp76 Arg Met Cys Gln Asp Leu Arg Asn Gln Leu Tyr Glu Ser Tyr Tyr91 Leu Asn Phe Ile Ser Ala Ile Ser Arg Ser Lys Leu Glu Asp Ile106 Ala Asn Ala Ala Leu Ala Ala Ser Ala Val Thr Gln Val Ala Lys121 Val Phe Asp Gln Tyr Leu Asn Phe Ile Thr Leu Glu Asp Asp Met136 Phe Val Leu Cys Asn Gln Asn Lys Glu Leu Val Ser Tyr Arg Ala151 Ile Asn Arg Pro Asp Ile Thr Asp Thr Glu Met Glu Thr Val Met166 Asp Thr Ile Val Asp Ser Leu Phe Cys Phe Tyr Gly Thr Leu Gly181 Asp Val Pro Ile Ile Arg Cys Ser Arg Gly Thr Ala Ala Glu Met196 Val Ala Val Lys Leu Asp Lys Lys Leu Arg Glu Asn Leu Arg Asp211 Ala Arg Asn Ser Leu Phe Thr Gly Asp Thr Leu Gly Ala Gly Gln226 Phe Ser Phe Gln Arg Pro Leu Leu Val Leu Val Asp Arg Asn Ile241 Asp Leu Ala Thr Pro Leu His His Thr Trp Thr Tyr Gln Ala Leu256 Val His Asp Val Leu Asp Phe His Leu Asn Arg Val Asn Leu Glu271 Glu Ser Ser Gly Val Glu Asn Ser Pro Ala Gly Ala Arg Pro Lys286 Arg Lys Asn Lys Lys Ser Tyr Asp Leu Thr Pro Val Asp Lys Phe301 Trp Gln Lys His Lys Gly Ser Pro Phe Pro Glu Val Ala Glu Ser316 Val Gln Gln Glu Leu Glu Ser Tyr Arg Ala Gln Glu Asp Glu Val331 Lys Arg Leu Lys Ser Ile Met Gly Leu Glu Gly Glu Asp Glu Gly346 Ala Ile Ser Met Leu Ser Asp Asn Thr Ala Lys Leu Thr Ser Ala361 Val Ser Ser Leu Pro Glu Leu Leu Glu Lys Lys Arg Leu Ile Asp376 Leu His Thr Asn Val Ala Thr Ala Val Leu Glu His Ile Lys Ala391 Arg Lys Leu Asp Val Tyr Phe Glu Tyr Glu Glu Lys Ile Met Ser406 Lys Thr Thr Leu Asp Lys Ser Leu Leu Asp Ile Ile Ser Asp Pro421 Asp Ala Gly Thr Pro Glu Asp Lys Met Arg Leu Phe Leu Ile Tyr436 Tyr Ile Ser Thr Gln Gln Ala Pro Ser Glu Ala Asp Leu Glu Gln451 Tyr Lys Lys Ala Leu Thr Asp Ala Gly Cys Asn Leu Asn Pro Leu466 Gln Tyr Ile Lys Gln Trp Lys Ala Phe Thr Lys Met Ala Ser Ala481 Pro Ala Ser Tyr Gly Ser Thr Thr Thr Lys Pro Met Gly Leu Leu496 Ser Arg Val Met Asn Thr Gly Ser Gln Phe Val Met Glu Gly Val511 Lys Asn Leu Val Leu Lys Gln Gln Asn Leu Pro Val Thr Arg Ile526 Leu Asp Asn Leu Met Glu Met Lys Ser Asn Pro Glu Thr Asp Asp541 Tyr Arg Tyr Phe Asp Pro Lys Met Leu Arg Gly Asn Asp Ser Ser556 Val Pro Arg Asn Lys Asn Pro Phe Gln Glu Ala Ile Val Phe Val571 Val Gly Gly Gly Asn Tyr Ile Glu Tyr Gln Asn Leu Val Asp Tyr586 Ile Lys Gly Lys Gln Gly Lys His Ile Leu Tyr Gly Cys Ser Glu601 Leu Phe Asn Ala Thr Gln Phe Ile Lys Gln Leu Ser Gln Leu Gly616 Gln Lys(2)SEQ ID NO.7的信息(i)序列特征(A)長度29堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO.7GCATGGATCC ATGTTGAATT TCAATGTGC 29(2)SEQ ID NO.8的信息(i)序列特征(A)長度29堿基
(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO.8ACAGGTCGAC TTACTTTTGT CCAAGTTGT 29(2)SEQ ID NO.9的信息(i)序列特征(A)長度29堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO.9GCATGGATCC ATGTTGAATT TCAATGTGC C 29(2)SEQ ID NO.10的信息(i)序列特征(A)長度29堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO.10ACAGGAATTC TTACTTTTGT CCAAGTTGT 29
權利要求
1.一種分離出的DNA分子,其特征在于,它包括編碼具有人HSly1蛋白活性的多肽的核苷酸序列,所述的核苷酸序列與SEQ ID NO.5中從核苷酸35-1888位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度嚴緊條件下與SEQ ID NO.5中從核苷酸35-1888位的核苷酸序列雜交。
2.如權利要求1所述的DNA分子,其特征在于,所述的序列編碼一多肽,該多肽具有SEQ ID NO.6所示的序列。
3.如權利要求1所述的DNA分子,其特征在于,該序列具有SEQ ID NO.5中從核苷酸35-1888位的核苷酸序列。
4.一種分離的HSly1蛋白多肽,其特征在于,它包括具有SEQ ID NO.6氨基酸序列的多肽、或其活性片段,或其活性衍生物。
5.如權利要求4所述的多肽,其特征在于,該多肽是具有SEQ ID NO.6序列的多肽。
6.一種載體,其特征在于,它含有權利要求1所述的DNA。
7.一種用權利要求6所述載體轉化的宿主細胞。
8.如權利要求7所述的宿主細胞,其特征在于,該細胞是大腸桿菌。
9.如權利要求7所述的宿主細胞,其特征在于,該細胞是真核細胞。
10.一種產生具有HSly1蛋白活性的多肽的方法,其特征在于,該方法包括(a)將編碼具有HSly1蛋白活性的多肽的核苷酸序列可操作地連于表達調控序列,形成HSly1蛋白表達載體,所述的核苷酸序列與SEQ ID NO.5中從核苷酸35-1888位的核苷酸序列有至少70%的同源性;(b)將步驟(a)中的表達載體轉入宿主細胞,形成HSly1蛋白的重組細胞;(c)在適合表達HSly1蛋白多肽的條件下,培養步驟(b)中的重組細胞;(d)分離出具有HSly1蛋白活性的多肽。
11.如權利要求10所述的方法,其特征在于,該序列為SEQ ID NO.5中從核苷酸35-1888位。
12.一種能與權利要求4所述的HSly1蛋白多肽特異性結合的抗體。
13.一種核苷酸分子,其特征在于,它是權利要求1所述DNA分子的反義序列。
14.一種探針分子,其特征在于,它含有權利要求1所述的DNA分子中約8-100個連續核苷酸。
全文摘要
本發明提供了一種新的secl基因家族的成員HSyl1。本發明提供了該人HSyc1的cDNA編碼序列、該序列編碼的多肽,以及利用重組技術生產所述的新的人HSly1的方法。本發明還提供了這種新人HSly1基因和多肽的應用。
文檔編號C12N15/11GK1250095SQ98120920
公開日2000年4月12日 申請日期1998年10月6日 優先權日1998年10月6日
發明者余龍, 趙勇, 傅強, 張宏來, 趙壽元 申請人:上海新黃浦復旦基因工程有限公司