專利名稱::一種人羧肽酶蛋白及其編碼序列的制作方法
技術領域:
:本發明涉及分子生物學、酶學、生理學以及基因工程等領域。具體地,本發明涉及一種在人類樹突狀細胞中表達的hCBPaseC蛋白及其核酸序列。本發明還涉及該蛋白和核酸序列的制備方法和用途。羧肽酶(Carboxypeptidase,CBPase)參與蛋白肽鏈C端的加工處理,生理作用極為重要。(J.Biochem.126,1-6,1999)。臨床上,羧肽酶是急性胰腺炎(acutepancreatitis)的血清標志,與急性胰腺炎的病癥密切相關。(BiolChem1998Feb;379(2)149-55)。本發明中,我們在人類樹突狀細胞中克隆到大麥CBPaseC基因的同源基因hCBPaseC。在本發明被公布之前,尚未有任何公開或報道過本專利申請中提及的人類hCBPaseC蛋白序列及其核酸序列。本發明的第一目的就是提供一種新的人基因hCBPaseC(GenbankAccessionNo.AF265441),該基因是一個人hCBPaseC蛋白基因。本發明的第二目的是提供一種新的人蛋白hCBPaseC。本發明的第三目的是提供一種利用重組技術生產上述的新的人hCBPaseC蛋白和核酸序列的方法。本發明還提供了這種人hCBPaseC蛋白多肽和編碼序列的應用。在本發明的一個方面,提供了一種分離出的DNA分子,該分子包括編碼具有人hCBPaseC蛋白質活性的多肽的核苷酸序列,所述的核苷酸序列與SEQIDNO.6中從核苷酸第218-805位DNA分子的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度嚴緊條件下與SEQIDNO.6中從核苷酸第218-805位的核苷酸序列雜交。較佳地,所述的序列編碼具有SEQIDNO.7所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQIDNO.6中從核苷酸第218-805位的核苷酸序列。在本發明的另一方面,提供了一種分離出的人hCBPaseC蛋白質多肽,它包括具有SEQIDNO.7氨基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物。較佳地,該多肽是具有SEQIDNO.7序列的多肽。在本發明的另一方面,還提供了一種載體,它包含上述的DNA分子。在本發明的另一方面,還提供了一種用上述載體轉化的宿主細胞。在一個實例中該宿主細胞是大腸桿菌;在另一實例中,該宿主細胞是真核細胞。在本發明的另一方面,還提供了一種產生具有人hCBPaseC蛋白質活性的多肽的方法,其步驟如下(1)將編碼具有人hCBPaseC蛋白活性的多肽的核苷酸序列可操作地連于表達調控序列,形成人hCBPaseC蛋白表達載體,所述的核苷酸序列與SEQIDNO.6中從核苷酸第218-805位的核苷酸序列有至少70%的同源性;(2)將步驟(1)中的表達載體轉入宿主細胞,形成人hCBPaseC蛋白的重組細胞;(3)在適合表達人hCBPaseC蛋白多肽的條件下,培養步驟(2)中的重組細胞;(4)分離出具有人hCBPaseC蛋白活性的多肽。較佳地,在該方法中使用的核酸序列具有SEQIDNO.6中第218-805位的序列。本發明還提供了與hCBPaseC蛋白多肽特異性結合的抗體。在本發明中,“分離的”、“純化的”或“基本純的”DNA是指,該DNA或片段已從天然狀態下位于其兩側的序列中分離出來,還指該DNA或片段已經與天然狀態下伴隨核酸的組份分開,而且已經與在細胞中伴隨其的蛋白質分開。在本發明中,術語“人hCBPaseC蛋白(或多肽)編碼序列”指編碼具有人hCBPaseC蛋白活性的多肽的核苷酸序列,如SEQIDNO.6中第218-805位核苷酸序列及其簡并序列。該簡并序列是指,位于SEQIDNO.6序列的編碼框第218-805位核苷酸中,有一個或多個密碼子被編碼相同氨基酸的簡并密碼子所取代后而產生的序列。由于密碼子的簡并性,所以與SEQIDNO.6中第218-805位核苷酸序列同源性低至約70%的簡并序列也能編碼出SEQIDNO.7所述的序列。該術語還包括能在中度嚴緊條件下,更佳的在高度嚴緊條件下與SEQIDNO.6中從核苷酸第218-805位的核苷酸序列雜交的核苷酸序列。該術語還包括與SEQIDNO.6中從核苷酸第218-805位的核苷酸序列的同源性至少70%,較佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。該術語還包括能編碼具有與天然的人hCBPaseC相同功能的蛋白的、SEQIDNO.6中開放閱讀框序列的變異形式。這些變異形式包括(但并不限于)若干個(通常為1-90個,較佳地1-60個,更佳地1-20個,最佳地1-10個)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加數個(通常為60個以內,較佳地為30個以內,更佳地為10個以內,最佳地為5個以內)核苷酸。在本發明中,“基本純的”蛋白質或多肽是指其至少占樣品總物質的至少20%,較佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或濕重計)。純度可以用任何合適的方法進行測量,如用柱層析、PAGE或HPLC法測量多肽的純度。基本純的多肽基本上不含天然狀態下的伴隨其的組分。在本發明中,術語“人hCBPaseC蛋白或多肽”指具有人hCBPaseC蛋白活性的SEQIDNO.7序列的多肽。該術語還包括具有與天然人hCBPaseC相同功能的、SEQIDNO.7序列的變異形式。這些變異形式包括(但并不限于)若干個(通常為1-50個,較佳地1-30個,更佳地1-20個,最佳地1-10個)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一個或數個(通常為20個以內,較佳地為10個以內,更佳地為5個以內)氨基酸。例如,在本領域中,用性能相近或相似的氨基酸進行取代時,通常不會改變蛋白質的功能。又比如,在C末端和/或N末端添加一個或數個氨基酸通常也不會改變蛋白質的功能。該術語還包括人hCBPaseC蛋白的活性片段和活性衍生物。本發明的人hCBPaseC多肽的變異形式包括同源序列、保守性變異體、等位變異體、天然突變體、誘導突變體、在高或低的嚴緊條件下能與人hCBPaseCDNA雜交的DNA所編碼的蛋白、以及利用抗人hCBPaseC多肽的抗血清獲得的多肽或蛋白。本發明還提供了其他多肽,如包含人hCBPaseC多肽或其片段的融合蛋白。除了幾乎全長的多肽外,本發明還包括人hCBPaseC多肽的可溶性片段。通常,該片段具有人hCBPaseC多肽序列的至少約10個連續氨基酸,通常至少約30個連續氨基酸,較佳地至少約50個連續氨基酸,更佳地至少約80個連續氨基酸,最佳地至少約100個連續氨基酸。在本發明中,“人hCBPaseC保守性變異多肽”指與SEQIDNO.7的氨基酸序列相比,有至多10個,較佳地至多8個,更佳地至多5個氨基酸被性質相似或相近的氨基酸所替換而形成多肽。這些保守性變異多肽最好根據表1進行替換而產生。表1<tablesid="table1"num="001"><table>最初的殘基代表性的取代優選的取代Ala(A)Val;Leu;IleValArg(R)Lys;Gln;AsnLysAsn(N)Gln;His;Lys;ArgGlnAsp(D)GluGluCys(C)SerSerGln(Q)AsnAsnGlu(E)AspAspGly(G)Pro;AlaAla</table></tables><tablesid="table2"num="002"><table>His(H)Asn;Gln;Lys;ArgArgIle(I)Leu;Val;Met;Ala;PheLeuLeu(L)Ile;Val;Met;Ala;PheIleLys(K)Arg;Gln;AsnArgMet(M)Leu;Phe;IleLeuPhe(F)Leu;Val;Ile;Ala;TyrLeuPro(P)AlaAlaSer(S)ThrThrThr(T)SerSerTrp(W)Tyr;PheTyrTyr(Y)Trp;Phe;Thr;SerPheVal(V)Ile;Leu;Met;Phe;AlaLeu</table></tables>發明還包括人hCBPaseC蛋白或多肽的類似物。這些類似物與天然人hCBPaseC多肽的差別可以是氨基酸序列上的差異,也可以是不影響序列的修飾形式上的差異,或者兼而有之。這些多肽包括天然或誘導的遺傳變異體。誘導變異體可以通過各種技術得到,如通過輻射或暴露于誘變劑而產生隨機誘變,還可通過定點誘變法或其他已知分子生物學的技術。類似物還包括具有不同于天然L-氨基酸的殘基(如D-氨基酸)的類似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的類似物。應理解,本發明的多肽并不限于上述例舉的代表性的多肽。修飾(通常不改變一級結構)形式包括體內或體外的多肽的化學衍生形式如乙酰化或羧基化。修飾還包括糖基化,如那些在多肽的合成和加工中或進一步加工步驟中進行糖基化修飾而產生的多肽。這種修飾可以通過將多肽暴露于進行糖基化的酶(如哺乳動物的糖基化酶或去糖基化酶)而完成。修飾形式還包括具有磷酸化氨基酸殘基(如磷酸酪氨酸,磷酸絲氨酸,磷酸蘇氨酸)的序列。還包括被修飾從而提高了其抗蛋白水解性能或優化了溶解性能的多肽。在本發明中,可選用本領域已知的各種載體,如市售的載體,包括質粒,粘粒等。在生產本發明的人hCBPaseC多肽時,可以將人hCBPaseC編碼序列可操作地連于表達調控序列,從而形成人hCBPaseC蛋白表達載體。如本文所用,“可操作地連于”指這樣一種狀況,即線性DNA序列的某些部分能夠影響同一線性DNA序列其他部分的活性。例如,如果信號肽DNA作為前體表達并參與多肽的分泌,那么信號肽(分泌前導序列)DNA就是可操作地連于多肽DNA;如果啟動子控制序列的轉錄,那么它是可操作地連于編碼序列;如果核糖體結合位點被置于能使其翻譯的位置時,那么它是可操作地連于編碼序列。一般,“可操作地連于”意味著相鄰,而對于分泌前導序列則意味著在閱讀框中相鄰。在本發明中,術語“宿主細胞”包括原核細胞和真核細胞。常用的原核宿主細胞的例子包括大腸桿菌、枯草桿菌等。常用的真核宿主細胞包括酵母細胞、昆蟲細胞和哺乳動物細胞。較佳地,該宿主細胞是真核細胞,如CHO細胞、COS細胞等。本發明還提供了對人hCBPaseC特異性結合的抗體,包括多克隆抗體和單克隆抗體。在本發明中,可以使用一系列本領域已知的方法來制備針對人hCBPaseC特異的抗體。例如,將提純的人hCBPaseC基因產物或它的抗原片段注射入動物體內以產生多克隆抗體。同樣,表達人hCBPaseC或它的抗原片段的細胞也可以用來對動物致免疫而產生抗體。根據本發明制備的抗體也可以是單克隆抗體,這些單克隆抗體可以用雜交瘤技術制備(例如,Kohleretal.,Nature256495,1975;Kohleretal.,Eur.J.Immunol.6511,1976;Kohleretal.,Eur.J.Immunol.6292,1976)。本發明的抗體包括可以阻抑人hCBPaseC功能的抗體,也可以是不影響人hCBPaseC功能的抗體。每一類抗體都可以通過對人hCBPaseC基因產物的片段或功能域致免疫而產生,而人hCBPaseC基因產物及其片段可以用重組方法產生或用多肽合成儀進行合成。與非修飾形式的人hCBPaseC基因產物結合的抗體,可以通過用在原核細胞例如E.coli中產生的基因產物來免疫動物而得到。與翻譯后修飾形式如糖基化或磷酸化蛋白或多肽結合的抗體,可以通過用在真核細胞如酵母或昆蟲細胞中產生的基因產物的來免疫動物而得到。本發明的人hCBPaseC抗體可以用來鑒定表達人hCBPaseC蛋白或多肽的細胞,如JurkatT細胞。例如,可以用一種可檢測的分子例如熒光素異硫氰酸(FITC)來標記人hCBPaseC特異抗體,然后讓人hCBPaseC特異抗體與細胞樣品接觸,再用熒光顯微鏡或流式細胞儀檢測出與人hCBPaseC特異抗體結合的細胞。除了在細胞表面檢測人hCBPaseC外,還可以用Western印跡技術分析該蛋白質。細胞裂解液可以從培養細胞或取自病人的組織標本如樹突狀細胞中提取,并溶解在含有去污劑的裂解緩沖液中。然后用SDS聚丙烯酰胺凝膠電泳分離細胞提取物(同時將提純的人hCBPaseC多肽作為陽性對照),接著通過電泳雜交將其轉移到硝酸纖維素上。為了用Western印跡免疫探測人hCBPaseC多肽,可以使用典型的抗體結合檢測方法,例如放射自顯影或堿性磷酸酶檢測方法。并可使用免疫接種血清或不相關的單克隆抗體作為非特異反應的對照。還可用Nothern印跡法技術分析人hCBPaseC基因產物的表達,即分析人hCBPaseC的RNA轉錄物在細胞中的存在與否和數量。人hCBPaseCDNA的Nothern印跡分析和人hCBPaseC特異抗體的Western印跡分析可以聯合使用,以證實人hCBPaseC在生物樣本中的表達。人hCBPaseCDNA還可以用于Southern印跡分析或原位雜交分析,以將該基因定位于染色體上,并可進行遺傳連鎖分析以找出其它可能的疾病相關基因。此外,本發明還提供了一種可用作探針的核酸分子,該分子通常具有人hCBPaseC核苷酸編碼序列的8-100個連續核苷酸,較佳地具有15-50個連續核苷酸。該探針可用于檢測樣品中是否存在編碼人hCBPaseC的核酸分子。本發明還提供了檢測樣品中是否存在人hCBPaseC核苷酸序列的方法,它包括用上述的探針與樣品進行雜交,然后檢測探針是否發生了結合。較佳地,該樣品是PCR擴增后的產物,其中PCR擴增引物對應于人hCBPaseC核苷酸編碼序列,并可位于該編碼序列的兩側或中間。引物長度一般為15-50個核苷酸。此外,根據本發明的人hCBPaseC核苷酸序列和氨基酸序列,可以在核酸同源性或表達蛋白質的同源性基礎上,篩選人hCBPaseC同源基因或同源蛋白。為了得到與人hCBPaseC基因相關的人cDNAs或基因組DNAs的點陣,可以用DNA探針篩選人cDNA或基因組DNA文庫,這些探針是在低嚴緊條件下,用32P對人hCBPaseC的全部或部分做放射活性標記而得的。最適合于篩選的cDNA文庫是來自人樹突狀細胞的文庫。來自參與內分泌的其它人體組織或特定人體細胞株的cDNA文庫也可用于篩選目的。構建來自感興趣的細胞或者組織的cDNA文庫的方法是分子生物學領域眾所周知的。另外,許多這樣的cDNA文庫也可以購買到,例如購自Clontech,PaloAlto,Cal.。這種篩選方法可以識別與人hCBPaseC相關的基因家族的核苷酸序列。根據核苷酸相似性篩選人hCBPaseC同源物可以按如下方法完成。人體樹突狀細胞cDNA文庫,例如ClontechCat.#74XX(Clontech,PaloAlto,Cal.)可以使用一段包含人hCBPaseC基因序列的全部或部分的隨機引物化DNA探針篩選。要完成對與人hCBPaseC序列至少有70%同源性的DNA插入序列的克隆的鑒定,可以使用雜交溫度為55℃的雜交液,然后用0.5×SSC和0.1%SDS清洗。用這種方法識別的克隆的DNA插入序列可以進一步用DNA限制性內切酶分析和DNA測序來評價它與人hCBPaseC基因的相似性。組織表達的分布可以用上述的Northern印跡法技術分析。人hCBPaseC同源物也可以用針對人hCBPaseC蛋白或多肽的抗體來識別。例如,可以用標準的方法對商品化的或者用已知方法構建的,來自細胞或者組織例如樹突狀細胞的表達文庫進行篩選。將文庫倒入平皿,菌落轉移到一張硝化纖維素膜上,使表達的重組蛋白結合到膜上。然后就可以用特異性的人hCBPaseC抗體進行典型的抗體結合和檢測。用這種方法所識別出克隆中的DNA插入序列,可以進一步用DNA限制性內切酶分析和DNA測序進行分析以評價它與人hCBPaseC基因的相似性。新識別的基因的組織表達分布可以同樣地按上述方法進行分析。本發明的人hCBPaseC核苷酸全長序列或其片段通常可以用PCR擴增法、重組法或人工合成的方法獲得。對于PCR擴增法,可根據本發明所公開的有關核苷酸序列,尤其是開放閱讀框序列來設計引物,并用市售的cDNA庫或按本領域技術人員已知的常規方法所制備的cDNA庫作為模板,擴增而得有關序列。當序列較長時,常常需要進行兩次或多次PCR擴增,然后再將各次擴增出的片段按正確次序拼接在一起。一旦獲得了有關的序列,就可以用重組法來大批量地獲得有關序列。這通常是將其克隆入載體,再轉入細胞,然后通過常規方法從增殖后的宿主細胞中分離得到有關序列。此外,還可用人工化學合成的方法來合成有關序列。在本申請之前,現有技術已完全可以通過先合成多個多核苷酸小片段,然后再進行連接而獲得編碼本發明人hCBPaseC蛋白的核酸序列。然后,可將該核酸序列引入本領域中各種現有的DNA分子(如載體)和細胞中。此外,還可通過化學合成將突變引入本發明蛋白序列中。除了用重組法產生之外,本發明蛋白的片段還可用固相技術,通過直接合成肽而加以生產(Stewart等人,(1969)Solid-PhasePeptideSynthesis,WHFreemanCo.,SanFrancisco;MerrifieldJ.(1963)J.AmChem.Soc852149-2154)。在體外合成蛋白質可以用手工或自動進行。例如,可以用AppliedBiosystems的431A型肽合成儀(FosterCity,CA)來自動合成肽。可以分別化學合成本發明蛋白的各片段,然后用化學方法加以連接以產生全長的分子。本發明蛋白的編碼序列可用于基因定位。例如,通過熒光原位雜交技術(FISH),將cDNA克隆與分裂中期的染色體進行雜交,可以準確地進行染色體定位。該技術可以使用短至約500bp的cDNA;也可以使用長至約2000bp或者更長的cDNA。對于該技術,可參見Verma等人,HumanChromosomesAManualofBasicTechniques,PergamonPress,NewYork(1988)。一旦序列被定位于染色體上的某個精確位置,將可以將序列在染色體上的物理位置與遺傳圖譜數據相關聯。這些遺傳圖譜數據是可以獲得的,例如通過孟德爾(Mendelian)人遺傳數據庫(可通過JohnsHopkinsUniversityWelchMedicalLibrary在網上獲得)。然后,通過連鎖分析來鑒定基因與已定位于同一染色體區域的疾病之間的相關性。接著,有必要確定患病個體和健康個體之間的cDNA或基因組序列方面的差異。如果某一突變存在于部分或全部患病個體但不存在于正常個體,那么該突變可能就是該疾病的致病因素。利用本發明的人hCBPaseC蛋白,通過各種常規篩選方法,可篩選出與人hCBPaseC發生相互作用的物質,或者受體、抑制劑或拮抗劑等。本發明人hCBPaseC蛋白及其抗體、抑制劑、拮抗劑或受體等,當在治療上進行施用(給藥)時,可提供不同的效果。通常,可將這些物質配制于無毒的、惰性的和藥學上可接受的水性載體介質中,其中pH通常為約5-8,較佳地pH約為6-8,盡管pH值可隨被配制物質的性質以及待治療的病癥而有所變化。配制好的藥物組合物可以通過常規途徑進行給藥,其中包括(但并不限于)肌內、腹膜內、皮下、皮內、或局部給藥。以本發明的人hCBPaseC蛋白為例,可以將其與合適的藥學上可接受的載體聯用。這類藥物組合物含有治療有效量的蛋白質和藥學上可接受的載體或賦形劑。這類載體包括(但并不限于)鹽水、緩沖液、葡萄糖、水、甘油、乙醇、及其組合。藥物制劑應與給藥方式相匹配。本發明的人hCBPaseC蛋白可以被制成針劑形式,例如用生理鹽水或含有葡萄糖和其他輔劑的水溶液通過常規方法進行制備。諸如片劑和膠囊之類的藥物組合物,可通過常規方法進行制備。藥物組合物如針劑、溶液、片劑和膠囊宜在無菌條件下制造。活性成分的給藥量是治療有效量,例如每天約1微克/千克體重-約5毫克/千克體重。此外,本發明的多肽還可與其他治療劑一起使用。當本發明的人hCBPaseC蛋白多肽被用作藥物時,可將治療有效劑量的該多肽施用于哺乳動物,其中該治療有效劑量通常至少約10微克/千克體重,而且在大多數情況下不超過約8毫克/千克體重,較佳地該劑量是約10微克/千克體重-約1毫克/千克體重。當然,具體劑量還應考慮給藥途徑、病人健康狀況等因素,這些都是熟練醫師技能范圍之內的。表2為本發明的人hCBPaseC蛋白與大麥CBPaseC蛋白的氨基酸序列(GenPeptAccessionNo.A35275)的同源比較(FASTA)表。其中,相同的氨基酸在兩個序列之間用氨基酸單字符標出,相似的氨基酸用“+”標出。下面結合具體實施例,進一步闡述本發明。應理解,這些實施例僅用于說明本發明而不用于限制本發明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規條件,例如Sambrook等人,分子克隆實驗室手冊(NewYorkColdSpringHarborLaboratoryPress,1989)中所述的條件,或按照制造廠商所建議的條件。實施例1人hCBPaseC基因的克隆1.組織分離(樹突狀細胞isolation)樹突狀細胞來源于5個正常成年男性供體,在死后四小時內取出樹突狀細胞,立即置于液氮中冷凍保存。2.mRNA的分離(mRNAisolation)取出組織,用研缽研碎,加入盛有裂解液的50ml管,充分振蕩后,再移入玻璃勻漿器內。勻漿后移至50ml新管,抽提總RNA(TRIzolReagents,Gibco,NY,USA)。用甲醛變性膠電泳鑒定總RNA質量。用帶Oligod(T)的纖維素柱分離總RNA中的mRNA,定量。3.cDNA文庫的構建(ConstructionofcDNAlibrary)以mRNA為模板,合成雙鏈cDNA,反轉錄引物見SEQIDNO.1。補平末端后,加含EcoRI切點的接頭,接頭序列分別見SEQIDNO.2和3。磷酸化EcoRI末端后,用XhoI限制性內切酶消化1.5小時,再進行片段分離。過柱篩選長度>500bp的片段,用酚-氯仿抽提,乙醇沉淀,無菌水溶解,連接至Uni-ZAPXR載體(Stratagene,CA9203,USA),以Zap-cDNAGigapackⅢGoldCloningKit(Stratagene,CA9203,USA)進行包裝,宿主菌使用XL1-BlueMRF(Stratagene,CA9203,USA)細菌。涂板并測定滴度。4.測序及數據庫建立(SeqencingandDatabaseConstructing)挑選文庫中有外源片段插入的克隆,擴增后抽提質粒(Qiagen,Germany),用T3和T7作為3’端和5’端的通用引物,采用終止物熒光標記(Big-Dye,Perkin-Elmer,USA)的方法,在ABI377測序儀(Perkin-Elmer,USA)上進行EST大規模測序。測序結果用FACTURA軟件去除載體序列,傳輸到SUNUltra450Server上進行下一步的處理。所有的序列信息再用GCG軟件包(Wisconsingroup,USA)中的BLAST和FASTA軟件搜索已有的數據庫(Genebank+EMBL),將無同源性或同源性低于95%的序列視為新基因建立數據庫。5.基因的全長克隆(CloningofFull-lengthcDNA)在得到的新基因片段序列信息基礎上,進行cDNA全長克隆,分兩階段進行(1)“電子克隆”(ElectronicCloning)以新基因片段序列作為探針搜尋dbEST數據庫,將重疊序列>50bp,同源性在98%以上的表達序列標簽(ExpressedSequenceTag,簡稱“EST”)序列認為同一序列(consensussequence),取出并用AUTOASSEMBLER軟件進行拼接,部分EST可以延伸探針序列。再用STRIDER軟件分析被延伸的序列是否具有完整的開放閱讀框架(OpenReadingFrame,ORF),用BLAST搜尋Genbank或SwissProt以確定該序列在核苷酸和氨基酸水平上是否與其他物種有同源性,以幫助判別所得到的基因全長完整性如何。通過電子克隆的方法,通常可獲取人hCBPaseC基因的全長序列。(2)cDNA末端快速擴增(RapidAmplificationofcDNAEnds,RACE)如果通過“電子克隆”方法仍未得到完整的cDNA全長,則在已有序列的5’或3’端設計引物,在人類樹突狀細胞Marathon-ReadycDNA文庫(ClontechLab,Inc,USA)中進行長距離PCR反應。然后對PCR產物克隆、測序。用AUTOASSEMBLER及STRIDER軟件分析被延長的序列有無完整的ORF,如無,重復上述過程直至獲得全長。(3)RT-PCR對于5’和3’端已知的序列,如果中間尚有一段間隙(gap)無法從已有的公共數據庫或自身數據庫獲得,可考慮采用RT-PCR的方法。在序列5’端設計引物,3’端引物采用Oligo-dT,在樹突狀細胞總RNA庫中進行擴增。然后對產物進行克隆、測序。最后拼接并獲得全長。通過組合使用上述3種方法,獲得了候選的人hCBPaseC蛋白的全長編碼序列。在拼接得到全長(至少包含完整的開放讀框)的基礎上,進一步設計引物R15’-GAGGGACCCATAAAGTGCAA-3’(SEQIDNO.4)為正向引物,寡核苷酸R25’-CCTGGGAAGGGGGTATACAG-3’(SEQIDNO.5)為反向引物,以樹突狀細胞的總RNA為模板,進行RT-PCR擴增,R1/R2的PCR條件為94℃5分鐘,隨之以94℃30秒、60℃30秒和72℃1分鐘進行35個循環,最后以72℃延伸5分鐘。電泳檢測PCR擴增產物,獲得擴增片段長度為1161bp。然后按常規方法以PCR擴增產物進行克隆、測序,獲得SEQIDNO.6所示的序列。實施例2人hCBPaseC基因的序列信息與同源性分析本發明新的人hCBPaseC全長cDNA(GenBankAccessionNo.AF265441。在本申請之前未公開過)的長度為1161bp,詳細序列見SEQIDNO.6,其中開放讀框位于218-805位核苷酸。根據全長cDNA推導出人hCBPaseC的氨基酸序列,共195個氨基酸殘基,分子量22385.91,pI為6.10。詳細序列見SEQIDNO.7。將hCBPaseC的蛋白質序列用BLAST程序在Non-redundantGenBankCDStranslations+PDB+SwissProt+Superdate+PIR數據庫中進行蛋白質同源性檢索,結果發現它與大麥的CBPaseC基因存在一定的同源性。在氨基酸水平上,它與大麥CBPaseC蛋白(GenPeptAccessionNo.A35275)的第275-410位氨基酸殘基有32.1%的相同性和59.1%的相似性(附表3)。由上可見,hCBPaseC基因與大麥CBPaseC基因在蛋白水平上存在較高的同源性,可以認為兩者在功能上也有很高相似性。本發明的人hCBPaseC除了可作為該家族一員用于進一步的功能研究,還可用于與其他蛋白一起產生融合蛋白,比如與免疫球蛋白一起產生融合蛋白。此外,本發明的人hCBPaseC還可以與該家族的其他成員進行融合或交換片段,以產生新的蛋白。例如將本發明的人hCBPaseC蛋白的N端與大麥CBPaseC蛋白的N端進行交換,以產生新的活性更高或具有新特性的蛋白。針對本發明人hCBPaseC的抗體,用于篩選該家族的其他成員,或者用于親和純化相關蛋白(如該家族的其他成員)。此外,本發明人hCBPaseC核酸(編碼序列或反義序列)可以被引入細胞,以提高人hCBPaseC的表達水平或者抑制人hCBPaseC的過度表達。本發明的人hCBPaseC蛋白或其活性多肽片段可以施用于病人,以治療或減輕因人hCBPaseC缺失、無功能或異常而導致的有關病癥。此外,還可以用基于本發明的核酸序列或抗體進行有關的診斷或預后判斷。由于本發明的人hCBPaseC蛋白具有源自人的天然氨基酸序列,因此,與來源于其他物種(如大麥)的同族蛋白相比,預計在施用于人時將具有更高的活性和/或更低的副作用(例如在人體內的免疫原性更低或沒有)。實施例3人hCBPaseC蛋白的結構和功能研究1.將人hCBPaseC蛋白的氨基酸序列在blocks數據庫(網址為http//www.blocks.fhcrc.org)中檢索結構域,得到以下結果1MIIEQNTDGVNFYNILTKSTPTSTMESSLEFTQSHLVCLCQRHVRHLQRD51ALSQLMDGPIRKKLKIIPEDQSWGGQATNVFVNMEEDFMKPVISIVDELL101EAGINVTVYNGQLDLIVDTMGQEAWVRKLKWPELPKFSQLKWKALYSDPK151SLETSAFVKSYKNLAFYWILKAGHMVPSDQGDMALKMMRLVTQQE(1)在氨基酸序列中,存在以下結構域區加框區(104-129,156-192)絲氨酸羧肽酶蛋白功能模塊(Serinecarboxypeptidases,serineproteins)(2)功能分析在該基因氨基酸序列中存在絲氨酸羧肽酶蛋白功能模塊(Serinecarboxy-peptidases,serineproteins),因而可預見其的確具有相應功能。實施例4人hCBPaseC基因的組織表達譜電子Northern表達譜。按TonC.等人的方法(TonCetal.,BiochemBiophysResCommun1997Dec18;241(2)589-594;HwangDM,etal.,Circulation1997Dec16;96(12)4146-4203),將人hCBPaseCcDNA序列在GCG軟件包中的humanEST數據庫中做BLAST檢索,在得到的人類EST中,概率值<10e-10、相同性>95%的EST有數十個,可視為該基因在組織中的轉錄表達本,由此得出表達該基因的組織譜,發現其在腎臟、骨髓、胎盤、肺、胎兒脾臟、睪丸、胎腦等等組織中有表達,表明它在人體這些組織器官中發揮著重要作用。實施例5人hCBPaseC多肽的制備和提純在該實施例中,將全長的人hCBPaseC編碼序列或片段構建入商品化的蛋白質融合表達載體之中,以表達和提純重組蛋白。將人hCBPaseC多肽以GST融合蛋白的形式在大腸桿菌中進行原核表達。原核表達載體的構建,以及轉化大腸桿菌根據人hCBPaseC的全長編碼序列(SEQIDNO.6),設計擴增出完整編碼閱讀框的引物(分別對應于編碼序列5’和3’端的約20個以上核苷酸),并在正反引物上分別引入限制性內切酶位點(這根據選用的pGEX-2T載體而定),以便構建表達載體。以實施例1中獲得的擴增產物為模板,經PCR擴增后,將人hCBPaseC基因在保證閱讀框正確的前提下克隆至pGEX-2T載體(Pharmacia,Piscataway,NJ)。鑒定好的表達載體利用CaCl2方法轉入大腸桿菌DH5α,篩選鑒定得到含有pGEX-2T-hCBPaseC表達載體的工程菌DH5α-pGEX-2T-hCBPaseC。表達GST-hCBPaseC重組蛋白的工程菌的分離鑒定挑取單菌落的DH5α-pGEX-2T-hCBPaseC工程菌于3ml含100μg/ml氨芐青霉素的LB培養基中振搖培養過夜,按1∶100的濃度吸取培養液于新的LB培養基(含100μg/ml氨芐青霉素)中培養約3小時,至OD600達0.5后,加入IPTG至終濃度1mmol/L繼續于37℃分別培養0,1,2,3小時。取培養時間不同的1ml菌液離心,在細菌沉淀物中加入裂解液(2×SDS上樣緩沖液50μl,蒸餾水45μl,二巰基乙醇5μl),混懸細菌沉淀,沸水浴中煮5分鐘,10000rpm離心1分鐘,上清加入12%SDS-PAGE膠中電泳。染色后觀察預期分子量大小的蛋白量隨IPTG誘導時間增加而增加的菌株即為表達GST-hCBPaseC融合蛋白的工程菌。GST-hCBPaseC融合蛋白的提取純化按上述方法誘導表達GST-hCBPaseC融合表達蛋白的工程菌DH5α-pGEX-2T-hCBPaseC。誘導后的細菌離心沉淀,按每400ml菌加入20mlPBS重懸細菌,超聲破碎細菌。破菌完全的超聲液按每毫升加入20微升的量加入PBS飽和的50%谷胱苷肽Sepharose4B,37℃振搖結合30分鐘,10000rpm離心10分鐘沉淀結合了GST-hCBPaseC的谷胱苷肽Sepharose4B,棄上清。按每毫升超聲液所得沉淀加入100μlPBS的量清洗兩次,而后按每毫升超聲液所得沉淀加入10μl還原型谷胱苷肽洗脫液,室溫置10分鐘,10000rpm離心10分鐘,上清即為洗脫的融合蛋白。重復洗脫兩次。洗脫的上清保存于-80℃,并進行SDS-PAGE電泳,檢測純化效果。在22kDa處的蛋白質條帶即為人hCBPaseC蛋白。實施例6人hCBPaseC蛋白或多肽在昆蟲細胞中進行真核細胞表達1.人hCBPaseC桿狀病毒表達載體的構建及轉染Sf9昆蟲細胞株根據人hCBPaseC的全長編碼序列(SEQIDN0.6),設計擴增出完整編碼閱讀框的引物,并在正反引物上分別引入限制性內切酶位點(這可視選用的載體而定),以便構建表達載體。以實施例1中獲得的擴增產物為模板,經PCR擴增后,將人hCBPaseCcDNA在保證閱讀框架的前提下克隆至pVL1392載體(Invitrogen,Carlsbad,CA)。鑒定好的表達載體3μg,野生型線性桿狀病毒DNA(BaculoGoldTMACMNPVDNA,Pharmingen,SanDiego,CA)1μg和Lipofection(Gibco-BRL,NY)25μl,加入1ml無血清的昆蟲培養基中,振蕩15秒混勻,室溫孵育15分鐘備用。取1ml(2×106)Sf9昆蟲細胞懸液于60mm組織培養板中,貼壁1小時后換轉染培養基,室溫孵育15分鐘后棄培養基,加入前面制備好的DNA載體轉染混合物,Parafilm密封培養板,于室溫27℃振搖培養4小時,而后換完全培養基培養3天,收集上清備用。2.轉入重組表達載體的昆蟲細胞株的篩選鑒定轉染3天后的昆蟲細胞用新鮮培養基制成細胞懸液(2×106/1ml),取1ml細胞懸液置于60mm組織培養皿中,加入3ml培養基,100μl收集的培養上清,貼壁1小時,棄2ml培養基,繼續室溫培養1小時,棄去所有的培養基,加入預熱的含20μl4%X-gal的3ml半固體培養基,培養5-7天后挑取白色細胞克隆于96孔培養板中培養3-5天,而后吸取上清感染Sf9昆蟲細胞。收集感染的細胞進行Western鑒定。將細胞裂解后進行SDS-PAGE電泳,電泳后的膠于Pharmacia的MultiphorⅡ半干電轉移儀中將蛋白質轉印到硝酸纖維膜上,將硝酸纖維膜置于封閉液中封閉1小時,而后于抗人hCBPaseC的抗體溶液中封閉1小時,TBS液振搖清洗5分鐘共2次,而后將膜置于生物素標記的抗人hCBPaseC一抗的第二抗體溶液中振搖1小時,TBS清洗,加入親和素-堿性磷酸酶復合物反應30分鐘,TBS清洗2次,加入新鮮配制的顯色液顯色觀察蛋白條帶。挑取高表達人hCBPaseC的Sf9細胞克隆。3.人hCBPaseC蛋白的提取純化用高表達人hCBPaseC的Sf9細胞克隆的上清大量感染Sf9細胞,感染48小時后收集細胞,PBS洗滌。每2×108細胞加入20ml細胞裂解液(0.5%TritonX-100,20mMNa3PO4(磷酸鈉,pH7.8),500mMNaCl,1mMNa3VO4(釩酸鈉),1mMPefabloc,1μg/ml胃蛋白酶抑制劑,亮抑蛋白酶肽和抑蛋白酶肽)破細胞,12000×g離心20min去除細胞碎片,上清按每2×108的細胞加入2mlNTA-瓊脂糖(Qiagen,Germany),4℃吸附1小時。而后用含100nM咪唑的His緩沖液洗滌兩次,用含20mMN,N’-二哌嗪,500mMNaCl,300mM咪唑的緩沖液洗脫以得到純化的蛋白。洗脫液保存于4℃,并進行SDS-PAGE電泳檢測提取的人hCBPaseC蛋白的純度。在22kDa處的蛋白質條帶即為人hCBPaseC蛋白。實施例7抗人hCBPaseC抗體的制備1.免疫小鼠和脾細胞的制備將實施例5和實施例6中獲得的人hCBPaseC蛋白用層析法進行分離后備用,也可以用SDS-PAGE凝膠電泳法進行分離,將電泳條帶從凝膠中割下,并用等體積的完全Freund’s佐劑乳化。取6-8周齡Balb/C雌鼠,用50-100μg/0.2ml乳化過的蛋白,對小鼠進行腹膜內注射。14天后,用非完全Freund’s佐劑乳化的同樣抗原對小鼠以50-100μg/0.2ml的劑量再加強免疫一次,3-5天后用于融合。其中,脾細胞制備見鄂征主編,《組織培養和分子細胞學技術》,北京出版社,第210頁。2.按《組織培養和分子細胞學技術》(同上),第371頁中的方法,制備飼養細胞。3.按《組織培養和分子細胞學技術》(同上),第213頁中的方法,進行細胞融合。4.抗體的檢測在細胞融合10-15天后,需逐孔進行檢查,一旦發現旺盛的雜交細胞集落生長,就應用人hCBPaseC蛋白做抗體活性的初步篩選,常用的方法有免疫熒光試驗、發射免疫試驗(RIA)、酶聯免疫吸附試驗(ELISA)。檢查出抗體活性的孔后,立刻進行克隆培養,并分離出抗體。本發明涉及的序列及記號分列如下(1)SEQIDNO.1的信息(ⅰ)序列特征(A)長度50bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ⅱ)分子類型寡核苷酸(ⅲ)序列描述SEQIDNO.1GAGAGAGAGAGAGAGAGAGAACTAGTCTCGAGTTTTTTTTTTTTTTTTTT50(2)SEQIDNO.2的信息(ⅰ)序列特征(A)長度13bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ⅱ)分子類型寡核苷酸(ⅲ)序列描述SEQIDNO.2AATTCGGCACGAG13(3)SEQIDNO.3的信息(ⅰ)序列特征(A)長度9bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ⅱ)分子類型寡核苷酸(ⅲ)序列描述SEQIDNO.3GCCGTGCTC(4)SEQIDNO.4的信息(ⅰ).序列特征(A)長度20bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ⅱ).分子類型寡核苷酸(ⅲ).序列描述SEQIDNO.4GAGGGACCCATAAAGTGCAA20(5)SEQIDNO.5的信息(ⅰ).序列特征(A)長度20bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ⅱ).分子類型寡核苷酸(ⅲ).序列描述SEQIDNO.5CCTGGGAAGGGGGTATACAG20(6)SEQIDNO.6的信息(ⅰ)序列特征(A)長度1161bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ⅱ)分子類型核苷酸(ⅲ)序列描述SEQIDNO.61GAGGGACCCATAAAGTGCAACTTTGCGGGGGTTGCCTTGGGTGATTCCTG51AATCTCCCCTGTTGATTCGGTGCTCTCCTGGGGACCTTACCTGTACAGCA101TGTCTCTTTCTCGAAGACAAAGGTCTGGCAGAGGTGTCTAAGGTTGCAGA151GCAAGTACTGAATGCCGTAAATAAGGGGCTCTACAGAGAGGCCACAGAGC201TGTGGGGGAAAGCAGAAATGATCATTGAACAGAACACAGATGGGGTGAAC251TTCTATAACATCTTAACTAAAAGCACTCCCACGTCTACAATGGAGTCGAG301TCTAGAATTCACACAGAGCCACCTAGTTTGTCTTTGTCAGCGCCACGTGA351GACACCTACAACGAGATGCCTTAAGCCAGCTCATGGATGGCCCCATCAGA401AAGAAGCTCAAAATTATTCCTGAGGATCAATCCTGGGGAGGCCAGGCTAC451CAACGTCTTTGTGAACATGGAGGAGGACTTCATGAAGCCAGTCATTAGCA501TTGTGGACGAGTTGCTGGAGGCAGGGATCAACGTGACGGTGTATAATGGA551CAGCTGGATCTCATCGTAGATACCATGGGTCAGGAGGCCTGGGTGCGGAA601ACTGAAGTGGCCAGAACTGCCTAAATTCAGTCAGCTGAAGTGGAAGGCCC651TGTACAGTGACCCTAAATCTTTGGAAACATCTGCTTTTGTCAAGTCCTAC701AAGAACCTTGCTTTCTACTGGATTCTGAAAGCTGGTCATATGGTTCCTTC751TGACCAAGGGGACATGGCTCTGAAGATGATGAGACTGGTGACTCAGCAAG801AATAGGATGGATGGGGCTGGAGATGAGCTGGTTTGGCCTTGGGGCACAGA851GCTGAGCTGAGGCCGCTGAAGCTGTAGGAAGCGCCATTCTTCCCTGTATC901TAACTGGGGCTGTGATCAAGAAGGTTCTGACCAGCTTCTGCAGAGGATAA951AATCATTGTCTCTGGAGGCAATTTGGAAATTATTTCTGCTTCTTAAAAAA1001ACCTAAGATTTTTTAAAAAATTGATTTGTTTTGATCAAAATAAAGGATGA1051TAATAGATATTATTTTTTCTTATGACAGAAGCAAATGATGTGATTTATAG1101AAAAACTGGGAAATACAGGTACCCAAAGAGTAAATCAACATCTGTATACC1151CCCTTCCCAGG(7)SEQIDNO.7的信息(ⅰ)序列特征(A)長度195氨基酸(B)類型氨基酸(C)鏈性單鏈(D)拓撲結構線性(ⅱ)分子類型多肽(ⅲ)序列描述SEQIDNO.71MIIEQNTDGVNFYNILTKSTPTSTMESSLEFTQSHLVCLCQRHVRHLQRD51ALSQLMDGPIRKKLKIIPEDQSWGGQATNVFVNMEEDFMKPVISIVDELL101EAGINVTVYNGQLDLIVDTMGQEAWVRKLKWPELPKFSQLKWKALYSDPK151SLETSAFVKSYKNLAFYWILKAGHMVPSDQGDMALKMMRLVTQQE表2h.pep人hCBPaseC蛋白氨基酸序列b.pep大麥CBPaseC蛋白氨基酸序列(GenBankAccessionNo.A35275)權利要求1.一種分離出的DNA分子,其特征在于,它包括編碼具有人hCBPaseC蛋白質活性的多肽的核苷酸序列,而且所述的核苷酸序列與SEQIDNO.6中從核苷酸第218-805位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度嚴緊條件下與SEQIDNO.6中從核苷酸第218-805位的核苷酸序列雜交。2.如權利要求1所述的DNA分子,其特征在于,所述的序列編碼具有SEQIDNO.7所示的氨基酸序列的多肽。3.如權利要求1所述的DNA分子,其特征在于,該序列具有SEQIDNO.6中從核苷酸第218-805位的核苷酸序列。4.一種分離出的人hCBPaseC蛋白多肽,其特征在于,它包括具有SEQIDNO.7氨基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物。5.如權利要求4所述的多肽,其特征在于,該多肽是具有SEQIDNO.7序列的多肽。6.一種載體,其特征在于,它包含權利要求1所述的DNA。7.一種用權利要求6所述載體轉化的宿主細胞,其特征在于它包括原核細胞和真核細胞。8.一種產生具有人hCBPaseC蛋白質活性的多肽的方法,特征在于其步驟如下(1)將編碼具有人hCBPaseC蛋白活性的多肽的核苷酸序列可操作地連于表達調控序列,形成人hCBPaseC蛋白表達載體,所述的核苷酸序列與SEQIDNO.6中從核苷酸第218-805位的核苷酸序列有至少70%的同源性;(2)將步驟(1)中的表達載體轉入宿主細胞,形成人hCBPaseC蛋白的重組細胞;(3)在適合表達人hCBPaseC蛋白多肽的條件下,培養步驟(2)中的重組細胞;(4)分離出具有人hCBPaseC蛋白活性的多肽。9.一種能與權利要求7所述的人hCBPaseC蛋白多肽特異性結合的抗體,其特征在于它包括多克隆抗體和單克隆抗體。10.一種核酸分子,其特征在于,它包含權利要求1所述的DNA分子中8-100個連續核苷酸。11.一種用于檢測樣品中是否存在人hCBPaseC核苷酸序列的方法,其特征在于它包括用權利要求10所述探針與樣品進行雜交,然后檢測探針是否發生了結合,該樣品是PCR擴增后的產物,其中PCR擴增引物對應于人hCBPaseC核苷酸編碼序列,并可位于該編碼序列的兩側或中間,引物長度為15~50個核苷酸。全文摘要本發明提供了一種在人體樹突狀細胞中表達的新的人hCBPaseC蛋白及其編碼序列,本發明還提供了該蛋白和核酸序列的制備方法,以及在樣品中檢測人hCBPaseC核酸序列和多肽的方法。文檔編號C12N15/63GK1281042SQ00116789公開日2001年1月24日申請日期2000年6月27日優先權日2000年6月27日發明者許相儒,錢斌治,楊義生,顧彥杰,陳竺,韓澤廣申請人:國家人類基因組南方研究中心