專利名稱:耐高溫ctp合成酶基因及其編碼的多肽和制備方法
技術(shù)領(lǐng)域:
本發(fā)明涉及突變或遺傳工程,尤其涉及一種耐高溫CTP合成酶基因序列及編碼的多肽和制備方法。
背景技術(shù):
胞苷三磷酸合成酶(CTP synthetase)(EC 6.3.4.2,UTPammonia ligase(ADP-forming)),是pyrG基因的產(chǎn)物。這個(gè)酶的主要作用是負(fù)責(zé)CTP的生物合成。它催化依賴于ATP的由UTP形成CTP的反應(yīng),氮源是氨水或谷氨酰胺。當(dāng)谷氨酰胺是底物時(shí),需要GTP作為變構(gòu)效應(yīng)物促進(jìn)催化作用(Bearne SL,2001)。由GTP激活依賴于谷氨酰胺的反應(yīng)是CTP合成酶反應(yīng)的一個(gè)普遍特征。
由尿嘧啶核苷酸轉(zhuǎn)變?yōu)榘奏ず塑账崾窃赨TP的水平上進(jìn)行的。尿嘧啶、尿嘧啶核苷和尿嘧啶核苷酸都不能氨基化變成相應(yīng)的胞嘧啶化合物,只有UTP才能氨基化生成CTP。在細(xì)菌中UTP可以直接與氨作用,動(dòng)物組織則需要由谷氨酰胺供給氨基(沈同《生物化學(xué)》)。
由pyrG基因的核酸序列可以知道大腸桿菌CTP合成酶的氨基酸序列。通過(guò)測(cè)序得知的氮端氨基酸的序列,預(yù)測(cè)出了一個(gè)有544個(gè)氨基酸的亞基。CTP合成酶的谷氨酰胺氨基轉(zhuǎn)移位點(diǎn)有3個(gè)保守區(qū)域,這些保守區(qū)域與GMP合成酶,氨基苯甲酸鹽合成酶,p-aminobenzoate合成酶和carbamoyl-P合成酶的保守區(qū)域相似(Weng M,1986)。
CTP合成酶在細(xì)胞的生理學(xué)以及細(xì)胞的生長(zhǎng)中起著重要的作用。CTP是DNA,RNA和膜磷脂的前體,而CTP合成酶催化從UTP和ATP到CTP的合成反應(yīng)。這樣,CTP合成酶的活動(dòng)調(diào)節(jié)了CTP的水平,進(jìn)而調(diào)節(jié)核酸和磷脂的合成。因?yàn)槎嗵堑暮铣尚枰肬TP,而這個(gè)酶也利用UTP,所以它的活動(dòng)也會(huì)調(diào)節(jié)多糖的合成(A.PAPPAS,)。
Pappas A等(1999)研究表明,CTP也可以利用dUTP作為底物來(lái)合成dCTP。這種依賴于dUTP的活性與時(shí)間和酶的濃度成線性關(guān)系。
Steen L.等人(2001)研究了Lactococcus lactis subsp.Cremoris的CTP合成酶,也發(fā)現(xiàn)CTP可以利用dUTP作為底物來(lái)合成dCTP。Lactococcal的這個(gè)酶是一個(gè)四聚體,但和以前大多數(shù)的其他的已鑒定出的酶不同,這個(gè)四聚體即使在較稀的濃度下也很穩(wěn)定。L.lactis的酶與大腸桿菌,酵母,大鼠和人的酶的一個(gè)最大區(qū)別就是,在缺少M(fèi)g2+,ATP,和UTP,酶濃度較低的情況下仍保持四聚體。大多數(shù)的已鑒定出的CTP合酶在相似的情況下這兩個(gè)核苷中至少有一個(gè)與Mg2+一起,對(duì)于四聚體化是必須的。
Zhai C.等(1995)從中國(guó)倉(cāng)鼠的肺細(xì)胞V79中克隆了CTP合成酶的cDNA。通過(guò)與已發(fā)表的其他物種的CTP合成酶比較氨基酸順序,發(fā)現(xiàn)CTP合成酶在哺乳動(dòng)物中是高度保守的穩(wěn)定的基因,但在原核與真核細(xì)胞中CTP合成酶的順序有很大的不同。這種現(xiàn)象說(shuō)明酶的催化模型在器官中可能也有些不同。
騰沖嗜熱厭氧菌(Thermoanaerobacter tangcongensis),是生活在我國(guó)云南省騰沖縣的熱泉中的一種微生物,是一種嗜熱的真細(xì)菌(eubacteria),最適生長(zhǎng)溫度為75攝氏度,厭氧生長(zhǎng),革蘭氏染色反應(yīng)呈陽(yáng)性。它由中國(guó)科學(xué)院微生物所首先發(fā)現(xiàn)并進(jìn)行了分類學(xué)上的分析。菌種保存在中國(guó)微生物保存中心MB4T(Chinese collection of microorganisms AS 1.2430T=JCM 11007T)。該嗜熱厭氧菌是我國(guó)特有的一個(gè)物種,其體內(nèi)所具有的耐高溫CTP合成酶也具有自己特有的結(jié)構(gòu)。
發(fā)明內(nèi)容
本發(fā)明的目的之一是提供一種分離的,編碼具有耐高溫CTP合成酶活性的多肽的核苷酸序列。
本發(fā)明的目的之二是提供一種分離的,具有耐高溫CTP合成酶活性多肽。
本發(fā)明的目的還提供了嗜熱厭氧菌的CTP合成酶重組載體、含有重組載體的宿主細(xì)胞,以及生產(chǎn)蛋白的方法。
本發(fā)明一方面提供一種能編碼具有耐高溫CTP合成酶活性的多肽的核苷酸序列。所說(shuō)的核苷酸序列編碼具有SEQ ID NO.2中的氨基酸序列的多肽或所述多肽的修飾形式,該修飾形式功能上相當(dāng)或與CTP合成酶相關(guān)。核苷酸序列具有SEQ ID N0.1的多核苷酸序列以及它的突變形式,突變類型包括缺失、無(wú)義、插入、錯(cuò)義。
本發(fā)明另一方面提供了一種耐高溫CTP合成酶活性的多肽。該多肽具有SEQ ID No.2中的氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物。
生產(chǎn)耐高溫CTP合成酶的方法為1)分離出編碼耐高溫CTP合成酶的核苷酸序列SEQ ID NO.1;2)構(gòu)建含SEQ ID NO.1核苷酸序列的表達(dá)載體;3)將步驟2)中表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成能生產(chǎn)耐高溫CTP合成酶的重組細(xì)胞;4)培養(yǎng)步驟3)中的重組細(xì)胞;5)分離、純化得到耐高溫CTP合成酶。
本發(fā)明涉及嗜熱厭氧菌的耐高溫CTP合成酶基因的分離及表達(dá)。以騰沖嗜熱厭氧菌全基因組測(cè)序與分析為基礎(chǔ),克隆分離了耐高溫CTP合成酶基因。該基因?qū)τ谥苽溆糜谏a(chǎn)耐高溫CTP合成酶的轉(zhuǎn)基因微生物或動(dòng)植物,并回收獲得該基因編碼的酶有用。另外,本發(fā)明還提供了具有耐高溫CTP合成酶活性的多肽的氨基酸序列及功能等同體。同時(shí),本發(fā)明還提供了制備,分離,純化具有耐高溫CTP合成酶活性的多肽的方法。
圖1是測(cè)序文庫(kù)構(gòu)建步驟流程圖;圖2是測(cè)序與數(shù)據(jù)分析流程圖;圖3部分Cosmid末端測(cè)序結(jié)果示意圖;圖4是正反向測(cè)序結(jié)果分析示意圖;具體實(shí)施方式
首先,本發(fā)明提供了分離的,編碼耐高溫CTP合成酶活性的多肽的多聚核苷酸分子,該核苷酸分子是通過(guò)對(duì)騰沖嗜熱厭氧菌全基因組測(cè)序與分析而獲得的,具有SEQ.ID NO.1的核苷酸序列,它編碼具有537氨基酸閱讀框的多肽,推測(cè)分子量為60602道爾頓。
本發(fā)明還涉及一種重組載體,該載體包含本發(fā)明的分離的核苷酸分子,以及包含有重組載體的宿主細(xì)胞。同時(shí),本發(fā)明包括構(gòu)建該重組載體和宿主細(xì)胞的方法,以及用重組工程技術(shù)生產(chǎn)耐高溫CTP合成酶的方法。
本發(fā)明進(jìn)一步地提供了一種分離的耐高溫CTP合成酶或多肽,其特征在于具有SEQ.IDNO.2氨基酸序列,或至少70%相似,更佳地,至少具有90%,95%,99%的相同。
在本發(fā)明中,“分離的”DNA是指該DNA或片斷已從天然狀態(tài)下位于其兩側(cè)的序列中分離出來(lái),還指該DNA或片斷已經(jīng)與天然狀態(tài)下伴隨核酸的組份分開,而且已經(jīng)與在細(xì)胞中伴隨其的蛋白質(zhì)分開。
在本發(fā)明中,“耐高溫CTP合成酶基因”指編碼具有耐高溫CTP合成酶活性的多肽的核苷酸序列,如SEQ.ID NO.1的核苷酸序列及其簡(jiǎn)并序列。該簡(jiǎn)并序列是指該序列中有一個(gè)或多個(gè)密碼子被編碼相同氨基酸的簡(jiǎn)并密碼子所取代后而產(chǎn)生的序列。由于公知的密碼子的簡(jiǎn)并性,所以與SEQ ID NO.1核苷酸序列同源性低至約70%的簡(jiǎn)并序列也能編碼出SEQ ID NO.2所述的氨基酸序列。該術(shù)語(yǔ)還包括能在中度嚴(yán)謹(jǐn)條件下,更佳地在高度嚴(yán)謹(jǐn)條件下與SEQ IDNO.1的核苷酸序列雜交的核苷酸序列。該術(shù)語(yǔ)還包括與SEQ ID NO.1核苷酸序列同源性至少70%,較佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
在本發(fā)明中,“分離的”蛋白的多肽是指其至少占樣品總物質(zhì)的至少20%,較佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或濕重計(jì))。純度可以用任何合適的方法進(jìn)行測(cè)量,如用柱層析,PAGE或HPLC法測(cè)量多肽的純度。分離的多肽基本上不含天然狀態(tài)下的伴隨其的組份。
在本發(fā)明中,“耐高溫CTP合成酶”指具有耐高溫CTP合成酶活性的SEQ ID NO.2序列的多肽。該術(shù)語(yǔ)還包括SEQ ID NO.2序列的變異體,這些變異體具有與天然耐高溫CTP合成酶相同的功能。這些變異體包括(但不限于)若干個(gè)氨基酸的缺失,插入和/或取代,以及在C末段和/或N末端添加一個(gè)或數(shù)個(gè)氨基酸,也可以是不影響序列的修飾形式上的差異。例如,為本領(lǐng)域所公知的,用性能相近或相似的氨基酸進(jìn)行取代時(shí),通常不會(huì)改變蛋白質(zhì)的功能。又比如,在C末段和/或N末端添加一個(gè)或數(shù)個(gè)氨基酸通常也不會(huì)改變蛋白質(zhì)的功能。該術(shù)語(yǔ)還包括耐高溫CTP合成酶的活性片斷和活性衍生物。
在本發(fā)明中,可選用本領(lǐng)域已知的各種載體,如市售的各種質(zhì)粒,粘粒,噬菌體及反轉(zhuǎn)錄病毒等。在生產(chǎn)本發(fā)明的耐高溫CTP合成酶時(shí),可以將耐高溫CTP合成酶基因序列可操作低連于表達(dá)調(diào)控序列,從而形成耐高溫CTP合成酶表達(dá)載體。表達(dá)載體含有復(fù)制起始點(diǎn)和表達(dá)調(diào)控序列,啟動(dòng)子,增強(qiáng)子和必要的加工信息位點(diǎn)。表達(dá)載體還必須含有可供選擇的標(biāo)記基因,如a)提供對(duì)抗生素或其它毒性物質(zhì)(氨芐青霉素,卡那霉素,氨甲蝶呤等)的抗性的蛋白質(zhì)或b)互補(bǔ)營(yíng)養(yǎng)缺陷型蛋白質(zhì)或c)提供復(fù)合培養(yǎng)基中沒(méi)有的必需營(yíng)養(yǎng)成分的蛋白質(zhì)。各種不同宿主的合適標(biāo)記基因是本領(lǐng)域中所熟知或生產(chǎn)廠商說(shuō)明書著名的。這些表達(dá)載體可以用本領(lǐng)域技術(shù)人員公知的重組DNA技術(shù)制備,如可參考Sambrook等人,1989或Ausubel等人,1992。
重組表達(dá)載體可以用本領(lǐng)域熟知的方法引入宿主細(xì)胞,這些方法包括電轉(zhuǎn)化法,氯化鈣法,基因槍法等。將外源重組載體導(dǎo)入宿主細(xì)胞的過(guò)程稱為“轉(zhuǎn)化”。通過(guò)培養(yǎng)宿主細(xì)胞,誘導(dǎo)所需蛋白的表達(dá),并通過(guò)本領(lǐng)域所熟知的蛋白分離技術(shù),如柱層析等得到所需的蛋白質(zhì)。也可采用固相技術(shù)等人工合成該蛋白質(zhì)。
在本發(fā)明中,術(shù)語(yǔ)“宿主細(xì)胞”包括原核細(xì)胞和真核細(xì)胞。常用的原核細(xì)胞如大腸桿菌,枯草桿菌等。常用的真核細(xì)胞如酵母細(xì)胞,或各種動(dòng)植物細(xì)胞。
本發(fā)明的耐高溫CTP合成酶基因全長(zhǎng)序列或其片斷通??梢杂肞CR擴(kuò)增法,重組法,或人工合成的方法獲得。對(duì)于PCR擴(kuò)增法,可根據(jù)本發(fā)明所公開的有關(guān)核苷酸序列來(lái)設(shè)計(jì)引物,用本領(lǐng)域技術(shù)人員已知的常規(guī)方法制備的嗜熱厭氧菌全基因組DNA為模板,擴(kuò)增而得到有關(guān)序列。一旦獲得了有關(guān)序列,就可以將其克隆入有關(guān)載體,再轉(zhuǎn)入宿主細(xì)胞,然后通過(guò)常規(guī)方法從增殖后的宿主細(xì)胞中分離得到大批量的有關(guān)序列。
下面結(jié)合具體實(shí)施例,進(jìn)一步闡述本發(fā)明。應(yīng)理解,這些實(shí)施例僅用于說(shuō)明本發(fā)明而不用于限制本發(fā)明的范圍。下列實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法,通常按照常規(guī)條件,例如Sambrook等人,分子克隆實(shí)驗(yàn)室手冊(cè)(New YorkCold Spring Harbor LaboratoryPress,1989)中所述的條件,或按照制造廠商所建議的條件。
實(shí)施例1構(gòu)建測(cè)序文庫(kù)測(cè)序文庫(kù)的構(gòu)建采用全基因組霰彈法(shotgun)進(jìn)行。首先培養(yǎng)騰沖嗜熱厭氧菌,培養(yǎng)方法按(Yanfen Xue,2000)改進(jìn)的MB培養(yǎng)基(Balch et al.,1979),按Marmur(1961)方法收集細(xì)菌,提取總DNA。為了保證測(cè)序文庫(kù)構(gòu)建的隨機(jī)性,最大程度地避免產(chǎn)生斷裂熱點(diǎn)的問(wèn)題,采用多種方法、不同條件的建庫(kù)原則。先采用物理剪切方法(包括超聲波法及用HydroshearMachine進(jìn)行剪切),其次根據(jù)該菌基因組特征選用AluI進(jìn)行隨機(jī)部分酶切。物理剪切時(shí)采用不同強(qiáng)度處理樣品,酶切時(shí)通過(guò)設(shè)置酶量梯度處理樣品。處理后的樣品經(jīng)平末端處理后,采用電泳分部收集1.5-4kb DNA片段,與去磷酸化的經(jīng)SmaI酶切的pUC18進(jìn)行連接,連接產(chǎn)物通過(guò)電轉(zhuǎn)化E.coli DH5α構(gòu)建了隨機(jī)測(cè)序的文庫(kù)。同時(shí),為了便于以后長(zhǎng)片斷(contig)的搭接還構(gòu)建了長(zhǎng)插入片段(10kb左右)的測(cè)序文庫(kù)(將基因組DNA以Sau3AI隨機(jī)部分酶切,電泳收集10kb左右的片段,與去磷酸化的經(jīng)BamHI酶切的pUC18進(jìn)行連接、構(gòu)建文庫(kù))。該文庫(kù)經(jīng)兩個(gè)末端的測(cè)序在完成圖(finishing)的過(guò)程中可以得到contig之間的關(guān)系,并可以解決較大的gap對(duì)補(bǔ)洞造成的困難。建庫(kù)流程如(見圖1)。
實(shí)施例2基因組測(cè)序在完成騰沖嗜熱厭氧菌基因組的測(cè)序時(shí),主要使用了兩種全自動(dòng)測(cè)序儀ABI377和MegaBACE 1000。這兩種測(cè)序儀都是利用電泳原理進(jìn)行測(cè)序(見圖2),每次可完成96個(gè)樣品。ABI377是PE公司的產(chǎn)品,是ABI系列的一種。它屬于平板凝膠電泳測(cè)序儀。MegaBACE 1000是法瑪西亞公司的產(chǎn)品,屬于毛細(xì)管凝膠電泳測(cè)序儀。
實(shí)施例3Basecalling和測(cè)序質(zhì)量監(jiān)控所謂Basecalling是指從測(cè)序儀上得到的原始數(shù)據(jù)文件中得到正確的堿基序列的過(guò)程。由于測(cè)序儀上得到的是A,T,G,C四種堿基對(duì)應(yīng)的不同波長(zhǎng)的光的強(qiáng)度變化軌跡(trace),需要用計(jì)算機(jī)采取一定的算法從中正確識(shí)別出不同的軌跡對(duì)應(yīng)的堿基。我們使用的是Phred軟件(Ewing B,Hillier L,1998),原因是其結(jié)果更可靠,并且其結(jié)果輸出更便于同一軟件包中的其他程序進(jìn)行進(jìn)一步的分析。
Phred進(jìn)行Basecalling的算法原理,是根據(jù)軌跡中各個(gè)峰的形狀,間距,以及信噪比等因素,判斷堿基類型,同時(shí)對(duì)這個(gè)堿基給出可信度信息,即堿基的測(cè)序質(zhì)量。在大規(guī)模測(cè)序中,測(cè)序質(zhì)量的監(jiān)控是十分重要的,它直接影響對(duì)測(cè)序的決策,包括文庫(kù)的構(gòu)建,覆蓋率的大小。同時(shí)對(duì)測(cè)序?qū)嶒?yàn)中可能出現(xiàn)的失誤能及時(shí)反饋。
實(shí)施例4序列拼接所謂序列拼接,就是把全基因組霰彈法,又稱鳥槍法隨機(jī)測(cè)序得到的樣品序列組裝成連續(xù)的長(zhǎng)片斷(contig),主要利用它們之間的重疊序列作參考。考慮到測(cè)序中存在載體的影響,需要先對(duì)樣品序列進(jìn)行去載體處理。這里所用的軟件cross_match和后面拼接所用的軟件Phrap都是美國(guó)Washington大學(xué)的軟件(Gordon D,Abajian C,1998),其基本原理為Swith-Waterman算法(Waterman MS,1990)。這是一種動(dòng)態(tài)算法,在考慮了兩兩序列之間的比較之后,可以得到一組序列的公有序列(consensus sequence)。去除載體后的樣品序列再用Phrap進(jìn)行拼接。在拼接時(shí),堿基的測(cè)序質(zhì)量也被考慮了,所得到的公有序列各堿基的可信度,由組成該公有序列的樣品的測(cè)序質(zhì)量計(jì)算得到。
實(shí)施例5基因注釋在大體得到基因組的大部分序列(完成工作框架圖)后,就需要對(duì)基因組進(jìn)行注釋,包括進(jìn)行開讀框架(Open Reading Frame,ORF)的預(yù)測(cè),基因功能的預(yù)測(cè),以及特殊RNA片斷的分析等。
第一步采用缺省參數(shù)的GLIMMER2.0(Delcher,A.L.,Harmon,D.1999)和ORPHEUS(Frishman,D.1998)軟件預(yù)測(cè)基因編碼序列,然后所有預(yù)測(cè)的開讀框和非編碼區(qū)(intergenicregion)都用BLAST軟件(Altschul,S.F.et al.1997)與NCBI的無(wú)冗余蛋白數(shù)據(jù)庫(kù)(non-redundant protein database)比較來(lái)發(fā)現(xiàn)可能漏掉的基因。在判斷一個(gè)基因的起始點(diǎn)時(shí),將參考各種相關(guān)信息,如序列同源性,核糖體結(jié)合位點(diǎn),可能的信號(hào)肽序列和啟動(dòng)子序列等。如果在一個(gè)開讀框內(nèi)出現(xiàn)多個(gè)啟動(dòng)子時(shí),一般采用第一個(gè)啟動(dòng)子作為基因的起始點(diǎn)。采用TransTerm軟件(Ermolaeva,M.D.2000)在非編碼區(qū)預(yù)測(cè)不依賴于Rho(ρ)因子的轉(zhuǎn)錄終止子。如果該終止子位于一個(gè)基因的下游區(qū)的太遠(yuǎn)處,則可能暗示一個(gè)小基因的丟失或測(cè)序錯(cuò)誤人為地縮短了該基因,可作為進(jìn)一步分析的參考。在確定移框突變和點(diǎn)突變時(shí),主要根據(jù)與數(shù)據(jù)庫(kù)中的蛋白質(zhì)的相似性來(lái)判斷。如果出現(xiàn)一個(gè)蛋白質(zhì)對(duì)應(yīng)于兩個(gè)彼此相鄰的編碼序列的情況,則被認(rèn)為是一個(gè)無(wú)活性基因(假基因pseudogenes),因?yàn)檫@說(shuō)明這兩個(gè)編碼序列之間由于突變而產(chǎn)生異常中止現(xiàn)象,進(jìn)而使基因失去活性。所有分析結(jié)果再用Artemissequence viewer軟件(Rutherford,K.et al.2000)進(jìn)行手工分析。一些明顯與其它編碼序列有重疊的開讀框,長(zhǎng)度小于150堿基對(duì)并且在已有數(shù)據(jù)庫(kù)中沒(méi)有同源性和其中沒(méi)有明顯的啟動(dòng)子或終止區(qū)域的開讀框?qū)⒈蝗コ?br>
蛋白質(zhì)的功能片斷(motif)和功能區(qū)域(domain)分別采用與Pfam、PRINTS、PROSITE、ProDom和SMART數(shù)據(jù)庫(kù)進(jìn)行比對(duì)分析,結(jié)果再用InterPro數(shù)據(jù)庫(kù)(Apweiler,R.et al.2001)進(jìn)行匯總分析。根據(jù)NCBI的COGs數(shù)據(jù)庫(kù)(Tatusov,R.L.et al.2001)并且參照其他數(shù)據(jù)庫(kù)的查詢結(jié)果來(lái)確定蛋白質(zhì)在COGs分類中的功能分類和可能的代謝途徑。用TMHMM軟件(Krogh,A.et al.2001)來(lái)確認(rèn)膜蛋白、ABC轉(zhuǎn)運(yùn)蛋白和跨膜功能域。采用革蘭氏陰性菌為參數(shù),用SIGNALP2.0軟件(Nielsen,H.et al.1999)分析信號(hào)肽區(qū)域。(4)補(bǔ)洞在完成基因組的工作框架圖之后,就要進(jìn)行更加困難的補(bǔ)洞工作,即完成整個(gè)基因組100%的測(cè)序,得到一個(gè)環(huán)形基因組。主要工作就是把前面得到的contig連接起來(lái)。這是一項(xiàng)十分具體而又繁雜的工作。主要方法包括A.利用測(cè)序中的正反向測(cè)序樣品信息在測(cè)序過(guò)程中,我們有意對(duì)某些樣品進(jìn)行了雙向測(cè)序,即同時(shí)測(cè)序某個(gè)插入片斷的兩端,再將所得序列與其他序列一起進(jìn)行拼接。由于這一對(duì)序列在基因組上的關(guān)系一定,其之間的距離大致已知,根據(jù)這一信息,一可以確認(rèn)某段contig是否可靠,二是當(dāng)這一對(duì)序列分別位于不同的contig上時(shí),可以確定這兩個(gè)contig的方向關(guān)系和位置關(guān)系,為進(jìn)一步設(shè)計(jì)實(shí)驗(yàn)提供參考(見圖3)。
B.長(zhǎng)插入片斷及Cosmid末端測(cè)序基于同樣的原理,我們可以構(gòu)建不同長(zhǎng)度的插入片斷文庫(kù),只對(duì)其兩端測(cè)序,然后拼接,分析其具體位置。這些文庫(kù)包括長(zhǎng)度為9-12Kb的長(zhǎng)插入片斷庫(kù)和20-40Kb左右的Cosmid文庫(kù)。具體分析方法同上所述。圖4所示為部分Cosmid末端測(cè)序結(jié)果。
C.PCR和末端延伸Walking實(shí)驗(yàn)根據(jù)A和B所提供的contig方向和位置關(guān)系,進(jìn)一步的生物化學(xué)實(shí)驗(yàn)就可以進(jìn)行了。如設(shè)計(jì)一對(duì)引物進(jìn)行PCR擴(kuò)增,或以某一contig末端序列合成引物進(jìn)行末端延伸(Walking)來(lái)補(bǔ)洞等。
實(shí)施例6CTP合成酶的制備和提純根據(jù)實(shí)施例中基因注釋得到的CTP合成酶全長(zhǎng)編碼序列(SEQ ID NO.1),設(shè)計(jì)能擴(kuò)增出完整編碼閱讀框的引物,并在正反引物上分別引入限制性內(nèi)切酶位點(diǎn),以便構(gòu)建表達(dá)載體。以實(shí)施例1中獲得的測(cè)序文庫(kù)的質(zhì)粒DNA為模板,經(jīng)PCR擴(kuò)增后,在保證閱讀框正確的前提下重組至pGEX-2T載體(Pharmacia,Piscataway,NJ)。再將重組載體轉(zhuǎn)化入大腸桿菌DH5α中(轉(zhuǎn)化方法為CaCL2法或電轉(zhuǎn)化法)。篩選鑒定的到含有表達(dá)載體的工程菌DH5α-pGEX-2T-PyrG。
挑取單菌落的工程菌DH5α-pGEX-2T-PyrG于3ml含100μg/ml氨芐青霉素的LB培養(yǎng)基中振搖培養(yǎng)37℃過(guò)夜,按1∶100的濃度吸取培養(yǎng)液于新的LB培養(yǎng)基(含100μg/ml氨芐青霉素)中培養(yǎng)約3小時(shí),至OD600達(dá)0.5后,加入IPTG至終濃度1mmol/L,繼續(xù)于37℃分別培養(yǎng)0,1,2,3小時(shí)。取培養(yǎng)時(shí)間不同的1ml菌液離心,在細(xì)菌沉淀物中加入裂解液(2×SDS上樣緩沖液50μl,蒸餾水45μl,二巰基乙醇5μl),混懸細(xì)菌沉淀,沸水浴中煮5分鐘,10000rpm離心1分鐘,上清加入12%SDS-PAGE膠中電泳。染色后觀察預(yù)期分子量大小的蛋白量隨IPTG誘導(dǎo)時(shí)間增加而增加的菌株即為表達(dá)所需蛋白的工程菌。
按上述方法誘導(dǎo)表達(dá)所需蛋白的工程菌后,將細(xì)菌離心沉淀,按每400ml菌加入20ml PBS飽和的50%谷胱苷肽Sepharose 4B,37℃振搖結(jié)合30分鐘,10000rpm離心10分鐘沉淀結(jié)合了所需蛋白的谷胱苷肽Sepharose 4B,棄上清。按每毫升超聲液所得沉淀加入100μl還原型谷胱苷肽洗脫液,室溫置10分鐘,上清即為洗脫的蛋白。重復(fù)洗脫兩次。洗脫的上清保存于-80℃,并進(jìn)行SDS-PAGE電泳,檢測(cè)純化效果。在60602道爾頓處的蛋白質(zhì)條帶即為CTP合成酶。
序列表1.SEQ ID NO.1(1)序列特征a.長(zhǎng)度1614堿基對(duì)b.類型DNAc.鏈型雙鏈d.幾何結(jié)構(gòu)線性(2)分子類型核苷酸(3)序列描述atggcaaagtatatttttgtaacaggaggagtagtctcctctttaggtaaaggcataactgctgcatcattgggaaggctactaaaaagccgcgggctttctgttgctatgcagaaatttgacccgtatataaacatagaccctgggacaatgagcccttatcagcatggagaagtatttgtaacagaggacggagcagaaacggacctggatttggggcattatgaaagattcatagatgtaaatctgactaaaaacagcaatgtcactgcgggcaaaatatactggtctgttatcacaaaagaaagaaaaggagattatctcggcgctactgttcaggtaataccccacattactgatgaaataaaagaaagagtgtacagagtagcaaaagaaaaaaatgtagatgtggttataacagaaattggtggaacagtaggagacatagaaagccttcctttcttggaggcaataaggcaggtggctattgaacagggaagagaaaatgttatgttcattcacgtaacgcttgttccacatctgggcaacacaggtgaactgaaaacaaagcctacacagcacagcgtaaaagaattaaggtccataggtattcagccggacatgatagtctgtagaactgagcttccacttcctcaggaattgagagaaaaaattgctctattctgcaatgtaagtgtagaagcggtcattgagaatagagatgtagaatcgatctatcaagttcctctggaacttgaaaggcagaaagtagacgaatatgtgataaaaaggctgaatttaccccttgggcagtctgatttaaaagagtggagagaatacgttgaaaaagagaaaaatcctgaacatcaggtagaggtagcacttgtaggcaaatatgtcgacctacatgatgcctatataagcgttgtagaagctttaaaacatgcaggggtttatcacaaaacagctgtcaacatccgatgggttaatgcagaaaaagtaaatgacaaaacagttgatgaacttttaaaaggtgcagatggaatacttgttcccggcggctttggcgacagaggaatagaaggaaagataagggcaattcagtacgcaagggaaaataagattccctatctggggctgtgtcttggaatgcagtgtgcggtcatagaatttgcgagaaatgtggcagggcttaaaggggccaattccaccgaatttgaccccaatacccctcatccagtaattgacctcatgcccgaacaaaaagacatagatgaaaaaggcggcacaatgagactgggagtatacccttgtaaagtcattgaaggaacaaaggcatatgaagtatacaaagatgagctagtttatgaaaggcacaggcacaggtatgaatttaacaaccagtacagagagcttttaacctcaaaagggcttgtaatctcaggcctttctccagatgagaggcttgttgaaataatagagttaaaagaccatccttattttgtagcaacccaatttcatccagaattcaaatcaagacctttaaacccacaccctcttttcagagattttgtaaaggcaatgcttaacttaaaaataaataatgcagagtaa2.SEQ ID NO.2(1)序列特征a.長(zhǎng)度537氨基酸b.類型多肽c.鏈型單鏈d.幾何結(jié)構(gòu)立體(2)分子類型蛋白質(zhì)(3)序列描述MAKYIFVTGGVVSSLGKGITAASLGRLLKSRGLSVAMQKFDPYINIDPGTMSPYQHGEVFVTEDGAETDLDLGHYERFIDVNLTKNSNVTAGKIYWSVITKERKGDYLGATVQVIPHITDEIKERVYRVAKEKNVDVVITEIGGTVGDIESLPFLEAIRQVAIEQGRENVMFIHVTLVPHLGNTGELKTKPTQHSVKELRSIGIQPDMIVCRTELPLPQELREKIALFCNVSVEAVIENRDVESIYQVPLELERQKVDEYVIKRLNLPLGQSDLKEWREYVEKEKNPEHQVEVALVGKYVDLHDAYISVVEALKHAGVYHKTAVNIRWVNAEKVNDKTVDELLKGADGILVPGGFGDRGIEGKIRAIQYARENKIPYLGLCLGMQCAVIEFARNVAGLKGANSTEFDPNTPHPVIDLMPEQKDIDEKGGTMRLGVYPCKVIEGTKAYEVYKDELVYERHRHRYEFNNQYRELLTSKGLVISGLSPDERLVEIIELKDHPYFVATQFHPEFKSRPLNPHPLFRDFVKAMLNLKINNAE
權(quán)利要求
1.一種分離的DNA分子,其特征在于它是編碼具有耐高溫CTP合成酶蛋白活性的多肽的核苷酸序列。
2.如權(quán)利要求1所述的DNA分子,其特征在于所說(shuō)的核苷酸序列編碼具有SEQ.ID NO.2中的氨基酸序列的多肽或所述多肽的修飾形式,該修飾形式功能上相當(dāng)或與耐高溫CTP合成酶相關(guān)。
3.如權(quán)利要求1所述的DNA分子,其特征在于所說(shuō)的核苷酸序列具有SEQID NO.1的多核苷酸序列以及它的突變形式,突變類型包括缺失、無(wú)義、插入、錯(cuò)義。
4.一種分離出的多肽,其特征在于它具有耐高溫CTP合成酶活性。
5.如權(quán)利要求4所述的多肽,其特征在于它具有SEQ ID No.2中的氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物。
6.一種載體,其特征在于它含有權(quán)利要求1中之DNA。
7.一種宿主細(xì)胞,其特征在于它是用權(quán)利要求6所述載體轉(zhuǎn)化的原核細(xì)胞或真核細(xì)胞。
8.一種制備耐高溫CTP合成酶的方法,其特征在于該方法包括1)分離出編碼耐高溫CTP合成酶基因的核苷酸序列SEQ ID NO.1;2)構(gòu)建含SEQ ID NO.1核苷酸序列的表達(dá)載體;3)將步驟2)中表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成能生產(chǎn)耐高溫CTP合成酶的重組細(xì)胞;4)培養(yǎng)步驟3)中的重組細(xì)胞;5)分離、純化得到耐高溫CTP合成酶。
全文摘要
本發(fā)明涉及編碼具有活性或其功能等同變異體的分離的DNA和利用重組DNA技術(shù)以所述分離的DNA生產(chǎn)具有耐高溫CTP合成酶活性的多肽或其功能等同變異體。以騰沖嗜熱厭氧菌全基因組測(cè)序與分析為基礎(chǔ),克隆分離了耐高溫CTP合成酶基因。該基因?qū)τ谥苽溆糜谏a(chǎn)耐高溫CTP合成酶的轉(zhuǎn)基因微生物或動(dòng)植物,并回收獲得該基因編碼的酶有用。另外,本發(fā)明還提供了具有耐高溫CTP合成酶活性的多肽的氨基酸序列及功能等同體。同時(shí),本發(fā)明還提供了制備,分離,純化具有耐高溫CTP合成酶活性的多肽的方法。
文檔編號(hào)C12N15/11GK1420172SQ01135068
公開日2003年5月28日 申請(qǐng)日期2001年11月19日 優(yōu)先權(quán)日2001年11月19日
發(fā)明者田宇清, 包其郁, 林霞, 李蔚, 于軍 申請(qǐng)人:杭州華大基因研發(fā)中心