專利名稱:耐高溫鳥苷酸激酶基因及其編碼的多肽和制備方法
技術(shù)領(lǐng)域:
本發(fā)明涉及突變或遺傳工程,尤其涉及一種耐高溫鳥苷酸激酶基因序列及編碼的多肽和制備方法。
背景技術(shù):
鳥苷酸激酶(Guanylate kinase,GUK)是核苷合成過程中的一種臨界酶。它催化下列反應(yīng)(d)GMP+ATP=>(d)GDP+ADP。這個(gè)步驟在恢復(fù)環(huán)GMP以及調(diào)節(jié)細(xì)胞中的ATP和GMP平衡中有重要的作用。因此,鳥苷酸激酶被認(rèn)為在第二信使信息傳導(dǎo)中是基礎(chǔ)蛋白酶,是核苷酸新陳代謝,以及催化末端磷?;酆衔飶腁TP到ADP的可逆反應(yīng)的核心蛋白酶。
cGMP和氮的氧化物信號以及與促尿鈉排泄性多肽和鳥苷蛋白結(jié)合型信號相關(guān),cGMP的胞內(nèi)靶細(xì)胞包括cGMP依賴性蛋白酶、循環(huán)性核苷離子通道、以及cGMP聯(lián)合性磷酸二酯酶。組織水平的cGMP由鳥苷酸激酶決定,鳥苷酸激酶可以把GMP轉(zhuǎn)化恢復(fù)成為cGMP,這個(gè)過程通過鳥苷?;呋痗GMP的結(jié)構(gòu),以及環(huán)狀核苷PDEs催化cGMP的分解。鳥苷酸激酶是GTP以及dGTP的生物合成臨界酶,而且它在核苷新陳代謝中的作用是它成為癌癥化學(xué)療法的靶細(xì)胞。小鼠的鳥苷酸激酶結(jié)構(gòu)包括一個(gè)N-末端的ATP聯(lián)合物和相鄰的鳥苷酸激酶信號序列(GKSS)。這個(gè)鳥苷酸激酶的低分子量胞質(zhì)結(jié)構(gòu),例如gmk以及guk1,相互聯(lián)系于鳥嘌呤核苷供給調(diào)節(jié)到細(xì)胞信號路徑,而鳥苷酸激酶中的相關(guān)高分子量家族以及膜聯(lián)合性結(jié)構(gòu),例如MAGUK,CASK,SAP102,ZO-1,以及MAGI-1,在細(xì)胞結(jié)締組織以及調(diào)節(jié)中起到一定的作用。
在干燥以及濕潤條件下對向日葵基因表達(dá)影響的調(diào)查中,用RT-PCR微分顯示器將一個(gè)假定的鳥苷酸激酶碎片進(jìn)行分離獲得全長為1547bp的cDNA,這種cDNA可以解碼382個(gè)氨基酸(已知是42kDa),用快速擴(kuò)增cDNA末端法(RACE)進(jìn)行克隆。數(shù)據(jù)庫的研究顯示,派生的氨基酸和鳥苷酸激酶具有高度的相似性。從其他鳥苷酸激酶的研究數(shù)據(jù)中可以知道,向日葵的鳥苷酸激酶有六個(gè)高度保守的激活位點(diǎn)區(qū)域(例如,三個(gè)酶區(qū)域和三個(gè)核苷粘合性區(qū)域)。
尿苷酸激酶催化末端磷?;Y(jié)合物ATP到受體分子GMP的不可逆轉(zhuǎn)化。由于缺少基因數(shù)據(jù),這種蛋白酶在實(shí)驗(yàn)室的詳細(xì)的功能分析受到了限定。利用以酵母(Saccharomycescerevisiae)蛋白酶中氨基酸序列為基礎(chǔ)得到的寡核苷酸GUK1基因已被分離以及鑒別。這種基因出現(xiàn)在單克隆以及五號染色體圖中。GUK1中的插入性突變點(diǎn)導(dǎo)致了退性行致命性突變,顯示這種酶在細(xì)胞生長中是必需的。利用可誘導(dǎo)性表達(dá)體系,鳥苷酸激酶大量產(chǎn)生于S.酵母以及E coli中。
雖然鳥苷酸激酶的催化機(jī)理已經(jīng)知道,但是關(guān)于它的功能和結(jié)構(gòu)方面的數(shù)據(jù)與其它的核苷酸單磷酰基酶相比還是很少的。與酵母中的鳥苷酸激酶相比,在人類和小鼠中,它具有相同的催化效率,AGUK(Arabidopsis thaliana guanylate kinase)顯示了大量的結(jié)構(gòu)和反應(yīng)動(dòng)力學(xué)方面的不同。和鳥苷酸激酶的其它類型不同,AGUK攜帶了未知功能的環(huán)繞在鳥苷酸激酶中心領(lǐng)域的N-以及C-末端的延伸。這種純化的全長AGUK1以及鳥苷酸激酶區(qū)域的活動(dòng)性比酵母蛋白酶小100倍(100-fold)。N-以及C-末端刪節(jié)看起來對蛋白酶的催化沒有調(diào)節(jié)性的影響。因?yàn)榻Y(jié)構(gòu)的相似性,植物蛋白酶可以表示出小鳥苷酸激酶和較大的膜關(guān)聯(lián)性鳥苷酸激酶(MAGUKs)的進(jìn)化。MAGUKs是膜細(xì)胞骨架蛋白,它由1-3個(gè)PDZ區(qū)域,SH3區(qū)域,以及C-末端GK區(qū)域組成,具有和來自于哺乳動(dòng)物的鳥苷酸激酶33%-37%的同一性。當(dāng)從E.coli中純化,MAGUK的GK區(qū)域蛋白SAP97以及Hcask顯示,沒有可測量的鳥苷酸激酶活性以及不能補(bǔ)充GUK1-缺乏型酵母應(yīng)變的退行性致命因子表型。GK區(qū)域顯示,在微分子聯(lián)合體中已經(jīng)進(jìn)化。這個(gè)觀點(diǎn)的支持是,最近在新蛋白家族中的發(fā)現(xiàn)(GKAP以及SAPAPs),這種新蛋白在這個(gè)區(qū)域中有特異性的相互作用。用鈉電噴射質(zhì)量光譜測定法直接觀察幾個(gè)內(nèi)部作用的嘌呤核苷蛋白配基,測定其為SAP97-GK配基。在所有嘌呤嘧啶核苷的測定中,GMP顯示出和GK的高度相似性。利用分析紫外離心機(jī)(analytical ultracentrifugation),測定了在SH3以及SAP97的GK區(qū)域之間的特殊內(nèi)部作用。這種超分子的內(nèi)部作用在單體的SAP97-SH3/GK結(jié)構(gòu)中占主導(dǎo)作用,而且可以被至少兩個(gè)內(nèi)部作用區(qū)域調(diào)節(jié)。根據(jù)這個(gè)GMP有一個(gè)結(jié)合了SH3區(qū)域中配基的受動(dòng)器分子,可以調(diào)節(jié)SAP97-SH3/GK中的超分子內(nèi)部作用。這個(gè)超分子調(diào)節(jié)可能會(huì)影響GK區(qū)域中的捆綁物。
鳥苷酸激酶作為氨基酸代謝和生物體信號傳導(dǎo)途徑中的一個(gè)重要的酶,在生命活動(dòng)中起著非常重要的作用。對鳥苷酸激酶的研究在氨基酸合成、細(xì)胞分裂以及腫瘤細(xì)胞的形成方面具有重要的意義。
騰沖嗜熱厭氧菌(Thermoanaerobacter tangcongensis),是生活在我國云南省騰沖縣的熱泉中的一種微生物,是一種嗜熱的真細(xì)菌(eubacteria),最適生長溫度為75攝氏度,厭氧生長,革蘭氏染色反應(yīng)呈陽性。它由中國科學(xué)院微生物所首先發(fā)現(xiàn)并進(jìn)行了分類學(xué)上的分析。菌種保存在中國微生物保存中心MB4T(Chinese collection of microorganisms AS 1.2430T=JCM 11007T)。該嗜熱厭氧菌是我國特有的一個(gè)物種,其體內(nèi)所具有的耐高溫鳥苷酸激酶也具有自己特有的結(jié)構(gòu)。
發(fā)明內(nèi)容
本發(fā)明的目的之一是提供一種分離的,編碼具有耐高溫鳥苷酸激酶活性的多肽的核苷酸序列。
本發(fā)明的目的之二是提供一種分離的,具有耐高溫鳥苷酸激酶活性多肽。
本發(fā)明的目的還提供了嗜熱厭氧菌的鳥苷酸激酶重組載體、含有重組載體的宿主細(xì)胞,以及生產(chǎn)蛋白的方法。
本發(fā)明一方面提供一種能編碼具有耐高溫鳥苷酸激酶活性的多肽的核苷酸序列。所說的核苷酸序列編碼具有SEQ ID NO.2中的氨基酸序列的多肽或所述多肽的修飾形式,該修飾形式功能上相當(dāng)或與鳥苷酸激酶相關(guān)。核苷酸序列具有SEQ ID NO.1的多核苷酸序列以及它的突變形式,突變類型包括缺失、無義、插入、錯(cuò)義。
本發(fā)明另一方面提供了一種耐高溫鳥苷酸激酶活性的多肽。該多肽具有SEQ ID No.2中的氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物。
生產(chǎn)耐高溫鳥苷酸激酶的方法為;1)分離出編碼耐高溫鳥苷酸激酶的核苷酸序列SEQ ID NO.1;2)構(gòu)建含SEQ ID NO.1核苷酸序列的表達(dá)載體;3)將步驟2)中表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成能生產(chǎn)耐高溫鳥苷酸激酶的重組細(xì)胞;4)培養(yǎng)步驟3)中的重組細(xì)胞;5)分離、純化得到耐高溫鳥苷酸激酶。
本發(fā)明涉及嗜熱厭氧菌的耐高溫鳥苷酸激酶基因的分離及表達(dá)。以騰沖嗜熱厭氧菌全基因組測序與分析為基礎(chǔ),克隆分離了耐高溫鳥苷酸激酶基因。該基因?qū)τ谥苽溆糜谏a(chǎn)耐高溫鳥苷酸激酶的轉(zhuǎn)基因微生物或動(dòng)植物,并回收獲得該基因編碼的酶有用。另外,本發(fā)明還提供了具有耐高溫鳥苷酸激酶活性的多肽的氨基酸序列及功能等同體。同時(shí),本發(fā)明還提供了制備,分離,純化具有耐高溫鳥苷酸激酶活性的多肽的方法。
圖1是測序文庫構(gòu)建步驟流程圖;圖2是測序與數(shù)據(jù)分析流程圖;圖3部分Cosmid末端測序結(jié)果示意圖;圖4是正反向測序結(jié)果分析示意圖;具體實(shí)施方式
首先,本發(fā)明提供了分離的,編碼耐高溫鳥苷酸激酶活性的多肽的多聚核苷酸分子,該核苷酸分子是通過對騰沖嗜熱厭氧菌全基因組測序與分析而獲得的,具有SEQ.ID NO.1的核苷酸序列,它編碼具有206氨基酸閱讀框的多肽,推測分子量為23804道爾頓。
本發(fā)明還涉及一種重組載體,該載體包含本發(fā)明的分離的核苷酸分子,以及包含有重組載體的宿主細(xì)胞。同時(shí),本發(fā)明包括構(gòu)建該重組載體和宿主細(xì)胞的方法,以及用重組工程技術(shù)生產(chǎn)耐高溫鳥苷酸激酶的方法。
本發(fā)明進(jìn)一步地提供了一種分離的耐高溫鳥苷酸激酶或多肽,其特征在于具有SEQ.IDNO.2氨基酸序列,或至少70%相似,更佳地,至少具有90%,95%,99%的相同。
在本發(fā)明中,“分離的“DNA是指該DNA或片斷已從天然狀態(tài)下位于其兩側(cè)的序列中分離出來,還指該DNA或片斷已經(jīng)與天然狀態(tài)下伴隨核酸的組份分開,而且已經(jīng)與在細(xì)胞中伴隨其的蛋白質(zhì)分開。
在本發(fā)明中,“耐高溫鳥苷酸激酶基因”指編碼具有耐高溫鳥苷酸激酶活性的多肽的核苷酸序列,如SEQ.ID NO.1的核苷酸序列及其簡并序列。該簡并序列是指該序列中有一個(gè)或多個(gè)密碼子被編碼相同氨基酸的簡并密碼子所取代后而產(chǎn)生的序列。由于公知的密碼子的簡并性,所以與SEQ ID NO.1核苷酸序列同源性低至約70%的簡并序列也能編碼出SEQ ID NO.2所述的氨基酸序列。該術(shù)語還包括能在中度嚴(yán)謹(jǐn)條件下,更佳地在高度嚴(yán)謹(jǐn)條件下與SEQ IDNO.1的核苷酸序列雜交的核苷酸序列。該術(shù)語還包括與SEQ ID NO.1核苷酸序列同源性至少70%,較佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
在本發(fā)明中,“分離的”蛋白的多肽是指其至少占樣品總物質(zhì)的至少20%,較佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或濕重計(jì))。純度可以用任何合適的方法進(jìn)行測量,如用柱層析,PAGE或HPLC法測量多肽的純度。分離的多肽基本上不含天然狀態(tài)下的伴隨其的組份。
在本發(fā)明中,“耐高溫鳥苷酸激酶”指具有耐高溫鳥苷酸激酶活性的SEQ ID NO.2序列的多肽。該術(shù)語還包括SEQ ID NO.2序列的變異體,這些變異體具有與天然耐高溫鳥苷酸激酶相同的功能。這些變異體包括(但不限于)若干個(gè)氨基酸的缺失,插入和/或取代,以及在C末段和/或N末端添加一個(gè)或數(shù)個(gè)氨基酸,也可以是不影響序列的修飾形式上的差異。例如,為本領(lǐng)域所公知的,用性能相近或相似的氨基酸進(jìn)行取代時(shí),通常不會(huì)改變蛋白質(zhì)的功能。又比如,在C末段和/或N末端添加一個(gè)或數(shù)個(gè)氨基酸通常也不會(huì)改變蛋白質(zhì)的功能。該術(shù)語還包括耐高溫鳥苷酸激酶的活性片斷和活性衍生物。
在本發(fā)明中,可選用本領(lǐng)域已知的各種載體,如市售的各種質(zhì)粒,粘粒,噬菌體及反轉(zhuǎn)錄病毒等。在生產(chǎn)本發(fā)明的耐高溫鳥苷酸激酶時(shí),可以將耐高溫鳥苷酸激酶基因序列可操作低連于表達(dá)調(diào)控序列,從而形成耐高溫鳥苷酸激酶表達(dá)載體。表達(dá)載體含有復(fù)制起始點(diǎn)和表達(dá)調(diào)控序列,啟動(dòng)子,增強(qiáng)子和必要的加工信息位點(diǎn)。表達(dá)載體還必須含有可供選擇的標(biāo)記基因,如a)提供對抗生素或其它毒性物質(zhì)(氨芐青霉素,卡那霉素,氨甲蝶呤等)的抗性的蛋白質(zhì)或b)互補(bǔ)營養(yǎng)缺陷型蛋白質(zhì)或c)提供復(fù)合培養(yǎng)基中沒有的必需營養(yǎng)成分的蛋白質(zhì)。各種不同宿主的合適標(biāo)記基因是本領(lǐng)域中所熟知或生產(chǎn)廠商說明書著名的。這些表達(dá)載體可以用本領(lǐng)域技術(shù)人員公知的重組DNA技術(shù)制備,如可參考Sambrook等人,1989或Ausubel等人,1992。
重組表達(dá)載體可以用本領(lǐng)域熟知的方法引入宿主細(xì)胞,這些方法包括電轉(zhuǎn)化法,氯化鈣法,基因槍法等。將外源重組載體導(dǎo)入宿主細(xì)胞的過程稱為“轉(zhuǎn)化”。通過培養(yǎng)宿主細(xì)胞,誘導(dǎo)所需蛋白的表達(dá),并通過本領(lǐng)域所熟知的蛋白分離技術(shù),如柱層析等得到所需的蛋白質(zhì)。也可采用固相技術(shù)等人工合成該蛋白質(zhì)。
在本發(fā)明中,術(shù)語“宿主細(xì)胞”包括原核細(xì)胞和真核細(xì)胞。常用的原核細(xì)胞如大腸桿菌,枯草桿菌等。常用的真核細(xì)胞如酵母細(xì)胞,或各種動(dòng)植物細(xì)胞。
本發(fā)明的耐高溫鳥苷酸激酶基因全長序列或其片斷通常可以用PCR擴(kuò)增法,重組法,或人工合成的方法獲得。對于PCR擴(kuò)增法,可根據(jù)本發(fā)明所公開的有關(guān)核苷酸序列來設(shè)計(jì)引物,用本領(lǐng)域技術(shù)人員已知的常規(guī)方法制各的嗜熱厭氧菌全基因組DNA為模板,擴(kuò)增而得到有關(guān)序列。一旦獲得了有關(guān)序列,就可以將其克隆入有關(guān)載體,再轉(zhuǎn)入宿主細(xì)胞,然后通過常規(guī)方法從增殖后的宿主細(xì)胞中分離得到大批量的有關(guān)序列。
下面結(jié)合具體實(shí)施例,進(jìn)一步闡述本發(fā)明。應(yīng)理解,這些實(shí)施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法,通常按照常規(guī)條件,例如Sambrook等人,分子克隆實(shí)驗(yàn)室手冊(New YorkCold Spring Harbor LaboratoryPress,1989)中所述的條件,或按照制造廠商所建議的條件。
實(shí)施例1構(gòu)建測序文庫測序文庫的構(gòu)建采用全基因組霰彈法(shotgun)進(jìn)行。首先培養(yǎng)騰沖嗜熱厭氧菌,培養(yǎng)方法按(Yanfen Xue,2000)改進(jìn)的MB培養(yǎng)基(Balch et al.,1979),按Marmur(1961)方法收集細(xì)菌,提取總DNA。為了保證測序文庫構(gòu)建的隨機(jī)性,最大程度地避免產(chǎn)生斷裂熱點(diǎn)的問題,采用多利方法、不同條件的建庫原則。先采用物理剪切方法(包括超聲波法及用HydroshearMachine進(jìn)行剪切),其次根據(jù)該菌基因組特征選用AluI進(jìn)行隨機(jī)部分酶切。物理剪切時(shí)采用不同強(qiáng)度處理?xiàng)U品,酶切時(shí)通過設(shè)置酶量梯度處理樣品。處理后的樣品經(jīng)平末端處理后,采用電泳分部收集1.5-4kb DNA片段,與去磷酸化的經(jīng)SmaI酶切的pUC18進(jìn)行連接,連接產(chǎn)物通過電轉(zhuǎn)化E.coli DH5α構(gòu)建了隨機(jī)測序的文庫。同時(shí),為了便于以后長片斷(contig)的搭接還構(gòu)建了長插入片段(10kb左右)的測序文庫(將基因組DNA以Sau3AI隨機(jī)部分酶切,電泳收集10kb左右的片段,與去磷酸化的經(jīng)BamHI酶切的pUC18進(jìn)行連接、構(gòu)建文庫)。該文庫經(jīng)兩個(gè)末端的測序在完成圖(finishing)的過程中可以得到contig之間的關(guān)系,并可以解決較大的gap對補(bǔ)洞造成的困難。建庫流程如(見圖1)。
實(shí)施例2基因組測序在完成騰沖嗜熱厭氧菌基因組的測序時(shí),主要使用了兩種全自動(dòng)測序儀ABI377和MegaBACE 1000。這兩種測序儀都是利用電泳原理進(jìn)行測序(見圖2),每次可完成96個(gè)樣品。ABI377是PE公司的產(chǎn)品,是ABI系列的一種。它屬于平板凝膠電泳測序儀。MegaBACE 1000是法瑪西亞公司的產(chǎn)品,屬于毛細(xì)管凝膠電泳測序儀。
實(shí)施例3Basecalling和測序質(zhì)量監(jiān)控所謂Basecalling是指從測序儀上得到的原始數(shù)據(jù)文件中得到正確的堿基序列的過程。由于測序儀上得到的是A,T,G,C四種堿基對應(yīng)的不同波長的光的強(qiáng)度變化軌跡(trace),需要用計(jì)算機(jī)采取一定的算法從中正確識別出不同的軌跡對應(yīng)的堿基。我們使用的是Phred軟件(Ewing B,Hillier L,1998),原因是其結(jié)果更可靠,并且其結(jié)果輸出更便于同一軟件包中的其他程序進(jìn)行進(jìn)一步的分析。
Phred進(jìn)行Basecalling的算法原理,是根據(jù)軌跡中各個(gè)峰的形狀,間距,以及信噪比等因素,判斷堿基類型,同時(shí)對這個(gè)堿基給出可信度信息,即堿基的測序質(zhì)量。在大規(guī)模測序中,測序質(zhì)量的監(jiān)控是十分重要的,它直接影響對測序的決策,包括文庫的構(gòu)建,覆蓋率的大小。同時(shí)對測序?qū)嶒?yàn)中可能出現(xiàn)的失誤能及時(shí)反饋。
實(shí)施例4序列拼接所謂序列拼接,就是把全基因組霰彈法,又稱鳥槍法隨機(jī)測序得到的樣品序列組裝成連續(xù)的長片斷(contig),主要利用它們之間的重疊序列作參考??紤]到測序中存在載體的影響,需要先對樣品序列進(jìn)行去載體處理。這里所用的軟件cross_match和后面拼接所用的軟件Phrap都是美國Washington大學(xué)的軟件(Gordon D,Abajian C,1998),其基本原理為Swith-Waterman算法(Waterman MS,1990)。這是一種動(dòng)態(tài)算法,在考慮了兩兩序列之間的比較之后,可以得到一組序列的公有序列(consensus sequence)。去除載體后的樣品序列再用Phrap進(jìn)行拼接。在拼接時(shí),堿基的測序質(zhì)量也被考慮了,所得到的公有序列各堿基的可信度,由組成該公有序列的樣品的測序質(zhì)量計(jì)算得到。
實(shí)施例5基因注釋在大體得到基因組的大部分序列(完成工作框架圖)后,就需要對基因組進(jìn)行注釋,包括進(jìn)行開讀框架(Open Reading Frame,ORF)的預(yù)測,基因功能的預(yù)測,以及特殊RNA片斷的分析等。
第一步采用缺省參數(shù)的GLIMMER2.0(Delcher,A.L.,Harmon,D.1999)和ORPHEUS(Frishman,D.1998)軟件預(yù)測基因編碼序列,然后所有預(yù)測的開讀框和非編碼區(qū)(intergenicregion)都用BLAST軟件(Altschul,S.F.et al.1997)與NCBI的無冗余蛋白數(shù)據(jù)庫(non-redundant protein database)比較來發(fā)現(xiàn)可能漏掉的基因。在判斷一個(gè)基因的起始點(diǎn)時(shí),將參考各種相關(guān)信息,如序列同源性,核糖體結(jié)合位點(diǎn),可能的信號肽序列和啟動(dòng)子序列等。如果在一個(gè)開讀框內(nèi)出現(xiàn)多個(gè)啟動(dòng)子時(shí),一般采用第一個(gè)啟動(dòng)子作為基因的起始點(diǎn)。采用TransTerm軟件(Ermolaeva,M.D.2000)在非編碼區(qū)預(yù)測不依賴于Rho(ρ)因子的轉(zhuǎn)錄終止子。如果該終止子位于一個(gè)基因的下游區(qū)的太遠(yuǎn)處,則可能暗示一個(gè)小基因的丟失或測序錯(cuò)誤人為地縮短了該基因,可作為進(jìn)一步分析的參考。在確定移框突變和點(diǎn)突變時(shí),主要根據(jù)與數(shù)據(jù)庫中的蛋白質(zhì)的相似性來判斷。如果出現(xiàn)一個(gè)蛋白質(zhì)對應(yīng)于兩個(gè)彼此相鄰的編碼序列的情況,則被認(rèn)為是一個(gè)無活性基因(假基因pseudogenes),因?yàn)檫@說明這兩個(gè)編碼序列之間由于突變而產(chǎn)生異常中止現(xiàn)象,進(jìn)而使基因失去活性。所有分析結(jié)果再用Artemissequence viewer軟件(Rutherford,K.et al.2000)進(jìn)行手工分析。一些明顯與其它編碼序列有重疊的開讀框,長度小于150堿基對并且在已有數(shù)據(jù)庫中沒有同源性和其中沒有明顯的啟動(dòng)子或終止區(qū)域的開讀框?qū)⒈蝗コ?br>
蛋白質(zhì)的功能片斷(motif)和功能區(qū)域(domain)分別采用與Pfam、PRINTS、PROSITE、ProDom和SMART數(shù)據(jù)庫進(jìn)行比對分析,結(jié)果再用InterPro數(shù)據(jù)庫(Apweiler,R.et al.2001)進(jìn)行匯總分析。根據(jù)NCBI的COGs數(shù)據(jù)庫(Tatusov,R.L.et al.2001)并且參照其他數(shù)據(jù)庫的查詢結(jié)果來確定蛋白質(zhì)在COGs分類中的功能分類和可能的代謝途徑。用TMHMM軟件(Krogh,A.et al.2001)來確認(rèn)膜蛋白、ABC轉(zhuǎn)運(yùn)蛋白和跨膜功能域。采用革蘭氏陰性菌為參數(shù),用SIGNALP2.0軟件(Nielsen,H.et al.1999)分析信號肽區(qū)域。(4)補(bǔ)洞在完成基因組的工作框架圖之后,就要進(jìn)行更加困難的補(bǔ)洞工作,即完成整個(gè)基因組100%的測序,得到一個(gè)環(huán)形基因組。主要工作就是把前面得到的contig連接起來。這是一項(xiàng)十分具體而又繁雜的工作。主要方法包括A.利用測序中的正反向測序樣品信息在測序過程中,我們有意對某些樣品進(jìn)行了雙向測序,即同時(shí)測序某個(gè)插入片斷的兩端,再將所得序列與其他序列一起進(jìn)行拼接。由于這一對序列在基因組上的關(guān)系一定,其之間的距離大致已知,根據(jù)這一信息,一可以確認(rèn)某段contig是否可靠,二是當(dāng)這一對序列分別位于不同的contig上時(shí),可以確定這兩個(gè)contig的方向關(guān)系和位置關(guān)系,為進(jìn)一步設(shè)計(jì)實(shí)驗(yàn)提供參考(見圖3)。
B.長插入片斷及Cosmid末端測序基于同樣的原理,我們可以構(gòu)建不同長度的插入片斷文庫,只對其兩端測序,然后拼接,分析其具體位置。這些文庫包括長度為9-12Kb的長插入片斷庫和20-40Kb左右的Cosmid文庫。具體分析方法同上所述。圖4所示為部分Cosmid末端測序結(jié)果。
C.PCR和末端延伸Walking實(shí)驗(yàn)根據(jù)A和B所提供的contig方向和位置關(guān)系,進(jìn)一步的生物化學(xué)實(shí)驗(yàn)就可以進(jìn)行了。如設(shè)計(jì)一對引物進(jìn)行PCR擴(kuò)增,或以某一contig末端序列合成引物進(jìn)行末端延伸(Walking)來補(bǔ)洞等。
實(shí)施例6鳥苷酸激酶的制備和提純根據(jù)實(shí)施例中基因注釋得到的鳥苷酸激酶全長編碼序列(SEQ ID NO.1),設(shè)計(jì)能擴(kuò)增出完整編碼閱讀框的引物,并在正反引物上分別引入限制性內(nèi)切酶位點(diǎn),以便構(gòu)建表達(dá)載體。以實(shí)施例1中獲得的測序文庫的質(zhì)粒DNA為模板,經(jīng)PCR擴(kuò)增后,在保證閱讀框正確的前提下重組至pGEX-2T載體(Pharmacia,Piscataway,N.J)。再將重組載體轉(zhuǎn)化入大腸桿菌DH5α中(轉(zhuǎn)化方法為CaCL2法或電轉(zhuǎn)化法)。篩選鑒定的到含有表達(dá)載體的工程菌DH5α-pGEX-2T-Gmk。
挑取單菌落的工程菌DH5α-pGEX-2T-Gmk于3ml含100μg/ml氨芐青霉素的LB培養(yǎng)基中振搖培養(yǎng)37℃過夜,按1∶100的濃度吸取培養(yǎng)液于新的LB培養(yǎng)基(含100μg/ml氨芐青霉素)中培養(yǎng)約3小時(shí),至OD600達(dá)0.5后,加入IPTG至終濃度1mmol/L,繼續(xù)于37℃分別培養(yǎng)0,1,2,3小時(shí)。取培養(yǎng)時(shí)間不同的1ml菌液離心,在細(xì)菌沉淀物中加入裂解液(2×SDS上樣緩沖液50μl,蒸餾水45μl,二巰基乙醇5μ1),混懸細(xì)菌沉淀,沸水浴中煮5分鐘,10000rpm離心1分鐘,上清加入12%SDS-PAGE膠中電泳。染色后觀察預(yù)期分子量大小的蛋白量隨IPTG誘導(dǎo)時(shí)間增加而增加的菌株即為表達(dá)所需蛋白的工程菌。
按上述方法誘導(dǎo)表達(dá)所需蛋白的工程菌后,將細(xì)菌離心沉淀,按每400ml菌加入20ml PBS飽和的50%谷胱苷肽Sepharose 4B,37℃振搖結(jié)合30分鐘,10000rpm離心10分鐘沉淀結(jié)合了所需蛋白的谷胱苷肽Sepharose 4B,棄上清。按每毫升超聲液所得沉淀加入100μl還原型谷胱苷肽洗脫液,室溫置10分鐘,上清即為洗脫的蛋白。重復(fù)洗脫兩次。洗脫的上清保存于-80℃,并進(jìn)行SDS-PAGE電泳,檢測純化效果。在23804道爾頓處的蛋白質(zhì)條帶即為鳥苷酸激酶。
序列表1.SEQ ID NO.1(1)序列特征a.長度621堿基對b.類型DNAc.鏈型雙鏈d.幾何結(jié)構(gòu)線性(2)分子類型核苷酸(3)序列描述ttgtcaataaaaaagcaagggcttttaatagtaatatctggtccttctggggcaggaaaaggcaccatctgcaaagccttaatagaaaaagaaaaagatttaaaattgagcatatctgctactacgcgtcagccgcgggcaggagaagttgatggtaaaaactactttttcaagtcagaagaagagttcaaaaggatgattgaagaggacgcctttttggaatgggcaaaagtttatgaccattactacggcactccgaaagaatttgttttaaagaatttagaagaaggaaatgatgttgttttagaaattgacattcaaggggcgcttaaggtaaaggaaaaatttcctgaaggagtctttatcttcattctccctccttctatggaagaattgaggaacaggataaagaaaagaggcactgaaagtgaagaggaaataataaagagatttaaaagtgcctatgaagaacttaattacgtgtccaagtacaattatgtagtgataaatgacgatgtggatagagcagtagaaaaaattcgtgctataattatagcggagaagtgccgtgtggacagaaataaagacctgtacctaaagataagggaggaatccgtatga2.SEQ ID NO.2(2)序列特征a.長度206氨基酸b.類型多肽c.鏈型單鏈d.幾何結(jié)構(gòu)立體(2)分子類型蛋白質(zhì)(3)序列描述LSIKKQGLLIVISGPSGAGKGTICKALIEKEKDLKLSISATTRQPRAGEVDGKNYFFKSEEEFKRMIEEDAFLEWAKVYDHYYGTPKEFVLKNLEEGNDVVLEIDIQGALKVKEKFPEGVFIFILPPSMEELRNRIKKRGTESEEEIIKRFKSAYEELNYVSKYNYVVINDDVDRAVEKIRAIIIAEKCRVDRNKDLYLKIREESV
權(quán)利要求
1.一種分離的DNA分子,其特征在于它是編碼具有耐高溫鳥苷酸激酶蛋白活性的多肽的核苷酸序列。
2.如權(quán)利要求1所述的DNA分子,其特征在于所說的核苷酸序列編碼具有SEQ.ID NO.2中的氨基酸序列的多肽或所述多肽的修飾形式,該修飾形式功能上相當(dāng)或與耐高溫鳥苷酸激酶相關(guān)。
3.如權(quán)利要求1所述的DNA分子,其特征在于所說的核苷酸序列具有SEQ ID NO.1的多核苷酸序列以及它的突變形式,突變類型包括缺失、無義、插入、錯(cuò)義。
4.一種分離出的多肽,其特征在于它具有耐高溫鳥苷酸激酶活性。
5.如權(quán)利要求4所述的多肽,其特征在于它具有SEQ ID No.2中的氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物。
6.一種載體,其特征在于它含有權(quán)利要求1中之DNA。
7.一種宿主細(xì)胞,其特征在于它是用權(quán)利要求6所述載體轉(zhuǎn)化的原核細(xì)胞或真核細(xì)胞。
8.一種制備耐高溫鳥苷酸激酶的方法,其特征在于該方法包括1)分離出編碼耐高溫鳥苷酸激酶基因的核苷酸序列SEQ ID NO.1;2)構(gòu)建含SEQ ID NO.1核苷酸序列的表達(dá)載體;3)將步驟2)中表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成能生產(chǎn)耐高溫鳥苷酸激酶的重組細(xì)胞;4)培養(yǎng)步驟3)中的重組細(xì)胞;5)分離、純化得到耐高溫鳥苷酸激酶。
全文摘要
本發(fā)明涉及編碼具有活性或其功能等同變異體的分離的DNA和利用重組DNA技術(shù)以所述分離的DNA生產(chǎn)具有耐高溫鳥苷酸激酶活性的多肽或其功能等同變異體。以騰沖嗜熱厭氧菌全基因組測序與分析為基礎(chǔ),克隆分離了耐高溫鳥苷酸激酶基因。該基因?qū)τ谥苽溆糜谏a(chǎn)耐高溫鳥苷酸激酶的轉(zhuǎn)基因微生物或動(dòng)植物,并回收獲得該基因編碼的酶有用。另外,本發(fā)明還提供了具有耐高溫鳥苷酸激酶活性的多肽的氨基酸序列及功能等同體。同時(shí),本發(fā)明還提供了制備,分離,純化具有耐高溫鳥苷酸激酶活性的多肽的方法。
文檔編號C12N9/00GK1420171SQ0113506
公開日2003年5月28日 申請日期2001年11月19日 優(yōu)先權(quán)日2001年11月19日
發(fā)明者于軍, 李蔚, 張麗敏, 胡松年, 田宇清 申請人:杭州華大基因研發(fā)中心