專利名稱:耐高溫蘇氨酸合成酶基因及其編碼的多肽和制備方法
技術(shù)領(lǐng)域:
本發(fā)明涉及突變或遺傳工程,尤其涉及一種耐高溫蘇氨酸合成酶基因序列及編碼的多肽和制備方法。
背景技術(shù):
蘇氨酸合成酶(Threonine synthase,EC 4.2.99.2)催化反應(yīng)L-高絲氨酸磷酸鹽+水=蘇氨酸+無機(jī)磷酸鹽在微生物中,蘇氨酸的合成是多分支生物合成路徑起始的一部分,起始合成天門冬氨酸,賴氨酸,甲硫氨酸,異亮氨酸。蘇氨酸合成酶是一種PLP(吡哆醛-5-磷酸鹽)依賴性酶,催化蘇氨酸生物合成的最后一步,催化L-高絲氨酸磷酸鹽(HSerP)生成蘇氨酸和無機(jī)磷酸鹽。在這個PLP-依賴β,γ-置換反應(yīng)中,酶作用的低物形成Schiff和酶結(jié)合因子PLP,接著β,γ-proton被吸收,一個a-炭負(fù)離子類似的穩(wěn)定的結(jié)構(gòu)形成。第一個去離子作用后,β-pro-S-hydrogen原子的立體定向的轉(zhuǎn)移。接著,非水解地除去,γ-取代的發(fā)生似無機(jī)磷酸鹽。β,γ-不飽和吡哆醛醌型的乙烯谷氨酸的γ-亞甲基集團(tuán)結(jié)合溶劑一個質(zhì)子,這樣產(chǎn)生E-氨基丙烯酸鹽的PLP衍生物。增加的水和最終的反轉(zhuǎn)醛亞胺作用產(chǎn)生機(jī)構(gòu)保持的L-蘇氨酸。
有關(guān)于蘇氨酸合成酶除合成以外的功能目前沒有報道。蘇氨酸是人的必需氨基酸。同時,蘇氨酸可防止皮膚老化并激活皮膚機(jī)能。在飼養(yǎng)業(yè),蘇氨酸是飼料的必需成分。所以,可以利用微生物進(jìn)行人工的氨基酸合成。
騰沖嗜熱厭氧菌(Thermoanaerobacter tangcongensis),是生活在我國云南省騰沖縣的熱泉中的一種微生物,是一種嗜熱的真細(xì)菌(eubacteria),最適生長溫度為75攝氏度,厭氧生長,革蘭氏染色反應(yīng)呈陽性。它由中國科學(xué)院微生物所首先發(fā)現(xiàn)并進(jìn)行了分類學(xué)上的分析。菌種保存在中國微生物保存中心MB4T(Chinese collection of microorganisms AS 1.2430T=JCM 11007T)。該嗜熱厭氧菌是我國特有的一個物種,其體內(nèi)所具有的耐高溫蘇氨酸合成酶也具有自己特有的結(jié)構(gòu)。
發(fā)明內(nèi)容
本發(fā)明的目的之一是提供一種分離的,編碼具有耐高溫蘇氨酸合成酶活性的多肽的核苷酸序列。
本發(fā)明的目的之二是提供一種分離的,具有耐高溫蘇氨酸合成酶活性多肽。
本發(fā)明的目的還提供了嗜熱厭氧菌的蘇氨酸合成酶重組載體、含有重組載體的宿主細(xì)胞,以及生產(chǎn)蛋白的方法。
本發(fā)明一方面提供一種能編碼具有耐高溫蘇氨酸合成酶活性的多肽的核苷酸序列。所說的核苷酸序列編碼具有SEQ ID NO.2中的氨基酸序列的多肽或所述多肽的修飾形式,該修飾形式功能上相當(dāng)或與蘇氨酸合成酶相關(guān)。核苷酸序列具有SEQ ID NO.1的多核苷酸序列以及它的突變形式,突變類型包括缺失、無義、插入、錯義。
本發(fā)明另一方面提供了一種耐高溫蘇氨酸合成酶活性的多肽。該多肽具有SEQ ID No.2中的氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物。
生產(chǎn)耐高溫蘇氨酸合成酶的方法為1)分離出編碼耐高溫蘇氨酸合成酶的核苷酸序列SEQ ID NO.1;2)構(gòu)建含SEQ ID NO.1核苷酸序列的表達(dá)載體;3)將步驟2)中表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成能生產(chǎn)耐高溫蘇氨酸合成酶的重組細(xì)胞;4)培養(yǎng)步驟3)中的重組細(xì)胞;5)分離、純化得到耐高溫蘇氨酸合成酶。
本發(fā)明涉及嗜熱厭氧菌的耐高溫蘇氨酸合成酶基因的分離及表達(dá)。以騰沖嗜熱厭氧菌全基因組測序與分析為基礎(chǔ),克隆分離了耐高溫蘇氨酸合成酶基因。該基因?qū)τ谥苽溆糜谏a(chǎn)耐高溫蘇氨酸合成酶的轉(zhuǎn)基因微生物或動植物,并回收獲得該基因編碼的酶有用。另外,本發(fā)明還提供了具有耐高溫蘇氨酸合成酶活性的多肽的氨基酸序列及功能等同體。同時,本發(fā)明還提供了制備,分離,純化具有耐高溫蘇氨酸合成酶活性的多肽的方法。
圖1是測序文庫構(gòu)建步驟流程圖;圖2是測序與數(shù)據(jù)分析流程圖;圖3部分Cosmid末端測序結(jié)果示意圖;圖4是正反向測序結(jié)果分析示意圖;具體實施方式
首先,本發(fā)明提供了分離的,編碼耐高溫蘇氨酸合成酶活性的多肽的多聚核苷酸分子,該核苷酸分子是通過對騰沖嗜熱厭氧菌全基因組測序與分析而獲得的,具有SEQ.ID NO.1的核苷酸序列,它編碼具有351氨基酸閱讀框的多肽,推測分子量為37628道爾頓。
本發(fā)明還涉及一種重組載體,該載體包含本發(fā)明的分離的核苷酸分子,以及包含有重組載體的宿主細(xì)胞。同時,本發(fā)明包括構(gòu)建該重組載體和宿主細(xì)胞的方法,以及用重組工程技術(shù)生產(chǎn)耐高溫蘇氨酸合成酶的方法。
本發(fā)明進(jìn)一步地提供了一種分離的耐高溫蘇氨酸合成酶或多肽,其特征在于具有SEQ.IDNO.2氨基酸序列,或至少70%相似,更佳地,至少具有90%,95%,99%的相同。
在本發(fā)明中,“分離的”DNA是指該DNA或片斷已從天然狀態(tài)下位于其兩側(cè)的序列中分離出來,還指該DNA或片斷已經(jīng)與天然狀態(tài)下伴隨核酸的組份分開,而且已經(jīng)與在細(xì)胞中伴隨其的蛋白質(zhì)分開。
在本發(fā)明中,“耐高溫蘇氨酸合成酶基因”指編碼具有耐高溫蘇氨酸合成酶活性的多肽的核苷酸序列,如SEQ.ID NO.1的核苷酸序列及其簡并序列。該簡并序列是指該序列中有一個或多個密碼子被編碼相同氨基酸的簡并密碼子所取代后而產(chǎn)生的序列。由于公知的密碼子的簡并性,所以與SEQ ID NO.1核苷酸序列同源性低至約70%的簡并序列也能編碼出SEQ IDNO.2所述的氨基酸序列。該術(shù)語還包括能在中度嚴(yán)謹(jǐn)條件下,更佳地在高度嚴(yán)謹(jǐn)條件下與SEQID NO.1的核苷酸序列雜交的核苷酸序列。該術(shù)語還包括與SEQ ID NO.1核苷酸序列同源性至少70%,較佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
在本發(fā)明中,“分離的”蛋白的多肽是指其至少占樣品總物質(zhì)的至少20%,較佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或濕重計)。純度可以用任何合適的方法進(jìn)行測量,如用柱層析,PAGE或HPLC法測量多肽的純度。分離的多肽基本上不含天然狀態(tài)下的伴隨其的組份。
在本發(fā)明中,“耐高溫蘇氨酸合成酶”指具有耐高溫蘇氨酸合成酶活性的SEQ ID NO.2序列的多肽。該術(shù)語還包括SEQ ID NO.2序列的變異體,這些變異體具有與天然耐高溫蘇氨酸合成酶相同的功能。這些變異體包括(但不限于)若干個氨基酸的缺失,插入和/或取代,以及在C末段和/或N末端添加一個或數(shù)個氨基酸,也可以是不影響序列的修飾形式上的差異。例如,為本領(lǐng)域所公知的,用性能相近或相似的氨基酸進(jìn)行取代時,通常不會改變蛋白質(zhì)的功能。又比如,在C末段和/或N末端添加一個或數(shù)個氨基酸通常也不會改變蛋白質(zhì)的功能。該術(shù)語還包括耐高溫蘇氨酸合成酶的活性片斷和活性衍生物。
在本發(fā)明中,可選用本領(lǐng)域已知的各種載體,如市售的各種質(zhì)粒,粘粒,噬菌體及反轉(zhuǎn)錄病毒等。在生產(chǎn)本發(fā)明的耐高溫蘇氨酸合成酶時,可以將耐高溫蘇氨酸合成酶基因序列可操作低連于表達(dá)調(diào)控序列,從而形成耐高溫蘇氨酸合成酶表達(dá)載體。表達(dá)載體含有復(fù)制起始點和表達(dá)調(diào)控序列,啟動子,增強(qiáng)子和必要的加工信息位點。表達(dá)載體還必須含有可供選擇的標(biāo)記基因,如a)提供對抗生素或其它毒性物質(zhì)(氨芐青霉素,卡那霉素,氨甲蝶呤等)的抗性的蛋白質(zhì)或b)互補(bǔ)營養(yǎng)缺陷型蛋白質(zhì)或c)提供復(fù)合培養(yǎng)基中沒有的必需營養(yǎng)成分的蛋白質(zhì)。各種不同宿主的合適標(biāo)記基因是本領(lǐng)域中所熟知或生產(chǎn)廠商說明書著名的。這些表達(dá)載體可以用本領(lǐng)域技術(shù)人員公知的重組DNA技術(shù)制備,如可參考Sambrook等人,1989或Ausubel等人,1992。
重組表達(dá)載體可以用本領(lǐng)域熟知的方法引入宿主細(xì)胞,這些方法包括電轉(zhuǎn)化法,氯化鈣法,基因槍法等。將外源重組載體導(dǎo)入宿主細(xì)胞的過程稱為“轉(zhuǎn)化”。通過培養(yǎng)宿主細(xì)胞,誘導(dǎo)所需蛋白的表達(dá),并通過本領(lǐng)域所熟知的蛋白分離技術(shù),如柱層析等得到所需的蛋白質(zhì)。也可采用固相技術(shù)等人工合成該蛋白質(zhì)。
在本發(fā)明中,術(shù)語“宿主細(xì)胞”包括原核細(xì)胞和真核細(xì)胞。常用的原核細(xì)胞如大腸桿菌,枯草桿菌等。常用的真核細(xì)胞如酵母細(xì)胞,或各種動植物細(xì)胞。
本發(fā)明的耐高溫蘇氨酸合成酶基因全長序列或其片斷通??梢杂肞CR擴(kuò)增法,重組法,或人工合成的方法獲得。對于PCR擴(kuò)增法,可根據(jù)本發(fā)明所公開的有關(guān)核苷酸序列來設(shè)計引物,用本領(lǐng)域技術(shù)人員已知的常規(guī)方法制備的嗜熱厭氧菌全基因組DNA為模板,擴(kuò)增而得到有關(guān)序列。一旦獲得了有關(guān)序列,就可以將其克隆入有關(guān)載體,再轉(zhuǎn)入宿主細(xì)胞,然后通過常規(guī)方法從增殖后的宿主細(xì)胞中分離得到大批量的有關(guān)序列。
下面結(jié)合具體實施例,進(jìn)一步闡述本發(fā)明。應(yīng)理解,這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規(guī)條件,例如Sambrook等人,分子克隆實驗室手冊(New YorkCold Spring Harbor LaboratoryPress,1989)中所述的條件,或按照制造廠商所建議的條件。
實施例1構(gòu)建測序文庫測序文庫的構(gòu)建采用全基因組霰彈法(shotgun)進(jìn)行。首先培養(yǎng)騰沖嗜熱厭氧菌,培養(yǎng)方法按(Yanfen Xue,2000)改進(jìn)的MB培養(yǎng)基(Balch et al.,1979),按Marmur(1961)方法收集細(xì)菌,提取總DNA。為了保證測序文庫構(gòu)建的隨機(jī)性,最大程度地避免產(chǎn)生斷裂熱點的問題,采用多種方法、不同條件的建庫原則。先采用物理剪切方法(包括超聲波法及用HydroshearMachine進(jìn)行剪切),其次根據(jù)該菌基因組特征選用AluI進(jìn)行隨機(jī)部分酶切。物理剪切時采用不同強(qiáng)度處理樣品,酶切時通過設(shè)置酶量梯度處理樣品。處理后的樣品經(jīng)平末端處理后,采用電泳分部收集1.5-4kb DNA片段,與去磷酸化的經(jīng)SmaI酶切的pUC18進(jìn)行連接,連接產(chǎn)物通過電轉(zhuǎn)化W.coli DH5α構(gòu)建了隨機(jī)測序的文庫。同時,為了便于以后長片斷(contig)的搭接還構(gòu)建了長插入片段(10kb左右)的測序文庫(將基因組DNA以Sau3AI隨機(jī)部分酶切,電泳收集10kb左右的片段,與去磷酸化的經(jīng)BamHI酶切的pUC18進(jìn)行連接、構(gòu)建文庫)。該文庫經(jīng)兩個末端的測序在完成圖(finishing)的過程中可以得到contig之間的關(guān)系,并可以解決較大的gap對補(bǔ)洞造成的困難。建庫流程如(見圖1)。
實施例2基因組測序在完成騰沖嗜熱厭氧菌基因組的測序時,主要使用了兩種全自動測序儀ABI377和MegaBACE 1000。這兩種測序儀都是利用電泳原理進(jìn)行測序(見圖2),每次可完成96個樣品。ABI377是PE公司的產(chǎn)品,是ABI系列的一種。它屬于平板凝膠電泳測序儀。MegaBACE 1000是法瑪西亞公司的產(chǎn)品,屬于毛細(xì)管凝膠電泳測序儀。
實施例3Basecalling和測序質(zhì)量監(jiān)控所謂Basecalling是指從測序儀上得到的原始數(shù)據(jù)文件中得到正確的堿基序列的過程。由于測序儀上得到的是A,T,G,C四種堿基對應(yīng)的不同波長的光的強(qiáng)度變化軌跡(trace),需要用計算機(jī)采取一定的算法從中正確識別出不同的軌跡對應(yīng)的堿基。我們使用的是Phred軟件(Ewing B,Hillier L,1998),原因是其結(jié)果更可靠,并且其結(jié)果輸出更便于同一軟件包中的其他程序進(jìn)行進(jìn)一步的分析。
Phred進(jìn)行Basecalling的算法原理,是根據(jù)軌跡中各個峰的形狀,間距,以及信噪比等因素,判斷堿基類型,同時對這個堿基給出可信度信息,即堿基的測序質(zhì)量。在大規(guī)模測序中,測序質(zhì)量的監(jiān)控是十分重要的,它直接影響對測序的決策,包括文庫的構(gòu)建,覆蓋率的大小。同時對測序?qū)嶒炛锌赡艹霈F(xiàn)的失誤能及時反饋。
實施例4序列拼接所謂序列拼接,就是把全基因組霰彈法,又稱鳥槍法隨機(jī)測序得到的樣品序列組裝成連續(xù)的長片斷(contig),主要利用它們之間的重疊序列作參考??紤]到測序中存在載體的影響,需要先對樣品序列進(jìn)行去載體處理。這里所用的軟件cross match和后面拼接所用的軟件Phrap都是美國Washington大學(xué)的軟件(Gordon D,Abajian C,1998),其基本原理為Swith-Waterman算法(Waterman MS,1990)。這是一種動態(tài)算法,在考慮了兩兩序列之間的比較之后,可以得到一組序列的公有序列(consensus sequence)。去除載體后的樣品序列再用Phrap進(jìn)行拼接。在拼接時,堿基的測序質(zhì)量也被考慮了,所得到的公有序列各堿基的可信度,由組成該公有序列的樣品的測序質(zhì)量計算得到。
實施例5基因注釋在大體得到基因組的大部分序列(完成工作框架圖)后,就需要對基因組進(jìn)行注釋,包括進(jìn)行開讀框架(Open Reading Frame,ORF)的預(yù)測,基因功能的預(yù)測,以及特殊RNA片斷的分析等。
第一步采用缺省參數(shù)的GLIMMER2.0(Delcher,A.L.,Harmon,D.1999)和ORPHEUS(Frishman,D.1998)軟件預(yù)測基因編碼序列,然后所有預(yù)測的開讀框和非編碼區(qū)(intergenicregion)都用BLAST軟件(Altschul,S.F.et al.1997)與NCBI的無冗余蛋白數(shù)據(jù)庫(non-redundant protein database)比較來發(fā)現(xiàn)可能漏掉的基因。在判斷一個基因的起始點時,將參考各種相關(guān)信息,如序列同源性,核糖體結(jié)合位點,可能的信號肽序列和啟動子序列等。如果在一個開讀框內(nèi)出現(xiàn)多個啟動子時,一般采用第一個啟動子作為基因的起始點。采用TransTerm軟件(Ermolaeva,M.D.2000)在非編碼區(qū)預(yù)測不依賴于Rho(ρ)因子的轉(zhuǎn)錄終止子。如果該終止子位于一個基因的下游區(qū)的太遠(yuǎn)處,則可能暗示一個小基因的丟失或測序錯誤人為地縮短了該基因,可作為進(jìn)一步分析的參考。在確定移框突變和點突變時,主要根據(jù)與數(shù)據(jù)庫中的蛋白質(zhì)的相似性來判斷。如果出現(xiàn)一個蛋白質(zhì)對應(yīng)于兩個彼此相鄰的編碼序列的情況,則被認(rèn)為是一個無活性基因(假基因pseudogenes),因為這說明這兩個編碼序列之間由于突變而產(chǎn)生異常中止現(xiàn)象,進(jìn)而使基因失去活性。所有分析結(jié)果再用Artemissequence viewer軟件(Rutherford,K.et al.2000)進(jìn)行手工分析。一些明顯與其它編碼序列有重疊的開讀框,長度小于150堿基對并且在已有數(shù)據(jù)庫中沒有同源性和其中沒有明顯的啟動子或終止區(qū)域的開讀框?qū)⒈蝗コ?br>
蛋白質(zhì)的功能片斷(motif)和功能區(qū)域(domain)分別采用與Pfam、PRINTS、PROSITE、ProDom和SMART數(shù)據(jù)庫進(jìn)行比對分析,結(jié)果再用InterPro數(shù)據(jù)庫(Apweiler,R.et al.2001)進(jìn)行匯總分析。根據(jù)NCBI的COGs數(shù)據(jù)庫(Tatusov,R.L.et al.2001)并且參照其他數(shù)據(jù)庫的查詢結(jié)果來確定蛋白質(zhì)在COGs分類中的功能分類和可能的代謝途徑。用TMHMM軟件(Krogh,A.et al.2001)來確認(rèn)膜蛋白、ABC轉(zhuǎn)運蛋白和跨膜功能域。采用革蘭氏陰性菌為參數(shù),用SIGNALP2.0軟件(Nielsen,H.et al.1999)分析信號肽區(qū)域。(4)補(bǔ)洞在完成基因組的工作框架圖之后,就要進(jìn)行更加困難的補(bǔ)洞工作,即完成整個基因組100%的測序,得到一個環(huán)形基因組。主要工作就是把前面得到的contig連接起來。這是一項十分具體而又繁雜的工作。主要方法包括A.利用測序中的正反向測序樣品信息在測序過程中,我們有意對某些樣品進(jìn)行了雙向測序,即同時測序某個插入片斷的兩端,再將所得序列與其他序列一起進(jìn)行拼接。由于這一對序列在基因組上的關(guān)系一定,其之間的距離大致已知,根據(jù)這一信息,一可以確認(rèn)某段contig是否可靠,二是當(dāng)這一對序列分別位于不同的contig上時,可以確定這兩個contig的方向關(guān)系和位置關(guān)系,為進(jìn)一步設(shè)計實驗提供參考(見圖3)。
B.長插入片斷及Cosmid末端測序基于同樣的原理,我們可以構(gòu)建不同長度的插入片斷文庫,只對其兩端測序,然后拼接,分析其具體位置。這些文庫包括長度為9-12Kb的長插入片斷庫和20-40Kb左右的Cosmid文庫。具體分析方法同上所述。圖4所示為部分Cosmid末端測序結(jié)果。
C.PCR和末端延伸Walking實驗根據(jù)A和B所提供的contig方向和位置關(guān)系,進(jìn)一步的生物化學(xué)實驗就可以進(jìn)行了。如設(shè)計一對引物進(jìn)行PCR擴(kuò)增,或以某一contig末端序列合成引物進(jìn)行末端延伸(Walking)來補(bǔ)洞等。
實施例6蘇氨酸合成酶的制備和提純根據(jù)實施例中基因注釋得到的蘇氨酸合成酶全長編碼序列(SEQ ID NO.1),設(shè)計能擴(kuò)增出完整編碼閱讀框的引物,并在正反引物上分別引入限制性內(nèi)切酶位點,以便構(gòu)建表達(dá)載體。以實施例1中獲得的測序文庫的質(zhì)粒DNA為模板,經(jīng)PCR擴(kuò)增后,在保證閱讀框正確的前提下重組至pGEX-2T載體(Pharmacia,Piscataway,NJ)。再將重組載體轉(zhuǎn)化入大腸桿菌DH5α中(轉(zhuǎn)化方法為CaCL2法或電轉(zhuǎn)化法)。篩選鑒定的到含有表達(dá)載體的工程菌DH5α-pGEX-2T-ThrC。
挑取單菌落的工程菌DH5α-pGEX-2T-ThrC于3ml含100μg/ml氨芐青霉素的LB培養(yǎng)基中振搖培養(yǎng)37℃過夜,按1∶100的濃度吸取培養(yǎng)液于新的LB培養(yǎng)基(含100μg/ml氨芐青霉素)中培養(yǎng)約3小時,至OD600達(dá)0.5后,加入IPTG至終濃度lmmol/L,繼續(xù)于37℃分別培養(yǎng)0,1,2,3小時。取培養(yǎng)時間不同的1ml菌液離心,在細(xì)菌沉淀物中加入裂解液(2×SDS上樣緩沖液50μl,蒸餾水45μl,二巰基乙醇5μl),混懸細(xì)菌沉淀,沸水浴中煮5分鐘,10000rpm離心1分鐘,上清加入12%SDS-PAGE膠中電泳。染色后觀察預(yù)期分子量大小的蛋白量隨IPTG誘導(dǎo)時間增加而增加的菌株即為表達(dá)所需蛋白的工程菌。
按上述方法誘導(dǎo)表達(dá)所需蛋白的工程菌后,將細(xì)菌離心沉淀,按每400ml菌加入20ml PBS飽和的50%谷胱苷肽Sepharose 4B,37℃振搖結(jié)合30分鐘,10000rpm離心10分鐘沉淀結(jié)合了所需蛋白的谷胱苷肽Sepharose 4B,棄上清。按每毫升超聲液所得沉淀加入100μl還原型谷胱苷肽洗脫液,室溫置10分鐘,上清即為洗脫的蛋白。重復(fù)洗脫兩次。洗脫的上清保存于-80℃,并進(jìn)行SDS-PAGE電泳,檢測純化效果。在37628道爾頓處的蛋白質(zhì)條帶即為蘇氨酸合成酶。
序列表1.SEQ ID NO.1(1)序列特征a.長度1056堿基對b.類型DNAc.鏈型雙鏈d.幾何結(jié)構(gòu)線性(2)分子類型核苷酸(3)序列描述atggcgtacgaaggaattataaaagcttatagagagtttttgcctcctataagagatgaaaatattgtcacgttaaaagagggcaacacacctttaattgaagcttttaacctccaaagaaaatatttgccgggtataagggtgtatctaaaatacgaagggctaaatcccacaggttcttttaaggacagggggatgacggtagcggtatctcaagcaaagcaagaagggtctaatgccgtcgtatgcgcctcaacaggcaacacttctgcttctgcagcagcctatgcagcaaaagcaggccttaaaagtgtggtattaattcctggcggtaaaattgctctggggaaactcgcacaggcaattgcttatggggcagaggttattgcggtagatggcaattttgatgacgctttaaggcttgtgagagaaatttcgcagaaattcccgattactttggtaaattctataaacccctatcgcctggaaggccaaaaaacggcagcttttgaaatatgtgatgctttgggagaagtaccagactatgtctctcttcctgtgggcaatgcaggaaatataactgcttactggatgggatttaaagaatactaccggaaggggaagataaaaaagcttcccaaaatgcttggctttcaggcggcaggagcggctcctattgtggaaggaagagtaatagaaaatcccgagacgattgccacggctataagaattggcaaccctgccagctggcagaaggcagtggctgcaagagatgagtcgggggggataattgacaaagttacggatgaggaaatactggaggcttattcaattttggcaaaaacagaggggatttttgcagagccagcctctgcagcctccatagcgggtgtgataaagaagtacaaagaaggattttttaaagaaggagattctgtggtgtgtatccttacggggaatggtttaaaagaccctgatactgctgttaaactagggggagaggtaaagagaatacagccaaatctaaaggaattggaggaagttttgtatggatag2.SEQ ID NO.2(2)序列特征a.長度351氨基酸b.類型多肽c.鏈型單鏈d.幾何結(jié)構(gòu)立體(2)分子類型蛋白質(zhì)(3)序列描述MAYEGIIKAYREFLPPIRDENIVTLKEGNTPLIEAFNLQRKYLPGIRVYLKYEGLNPTGSFKDRGMTVAVSQAKQEGSNAVVCASTGNTSASAAAYAAKAGLKSVVLIPGGKIALGKLAQAIAYGAEVIAVDGNFDDALRLVREISQKFPITLVNSINPYRLEGQKTAAFEICDALGEVPDYVSLPVGNAGNITAYWMGFKEYYRKGKIKKLPKMLGFQAAGAAPIVEGRVIENPETIATAIRIGNPASWQKAVAARDESGGIIDKVTDEEILEAYSILAKTEGIFAEPASAASIAGVIKKYKEGFFKEGDSVVCILTGNGLKDPDTAVKLGGEVKRIQPNLKELEEVLYG
權(quán)利要求
1.一種分離的DNA分子,其特征在于它是編碼具有耐高溫蘇氨酸合成酶蛋白活性的多肽的核苷酸序列。
2.如權(quán)利要求1所述的DNA分子,其特征在于所說的核苷酸序列編碼具有SEQ.ID NO.2中的氨基酸序列的多肽或所述多肽的修飾形式,該修飾形式功能上相當(dāng)或與耐高溫蘇氨酸合成酶相關(guān)。
3.如權(quán)利要求1所述的DNA分子,其特征在于所說的核苷酸序列具有SEQ ID NO.1的多核苷酸序列以及它的突變形式,突變類型包括缺失、無義、插入、錯義。
4.一種分離出的多肽,其特征在于它具有耐高溫蘇氨酸合成酶活性。
5.如權(quán)利要求4所述的多肽,其特征在于它具有SEQ ID No.2中的氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物。
6.一種載體,其特征在于它含有權(quán)利要求1中之DNA。
7.一種宿主細(xì)胞,其特征在于它是用權(quán)利要求6所述載體轉(zhuǎn)化的原核細(xì)胞或真核細(xì)胞。
8.一種制備耐高溫蘇氨酸合成酶的方法,其特征在于該方法包括1)分離出編碼耐高溫蘇氨酸合成酶基因的核苷酸序列SEQ ID NO.1;2)構(gòu)建含SEQ ID NO.1核苷酸序列的表達(dá)載體;3)將步驟2)中表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成能生產(chǎn)耐高溫蘇氨酸合成酶的重組細(xì)胞;4)培養(yǎng)步驟3)中的重組細(xì)胞;5)分離、純化得到耐高溫蘇氨酸合成酶。
全文摘要
本發(fā)明涉及編碼具有活性或其功能等同變異體的分離的DNA和利用重組DNA技術(shù)以所述分離的DNA生產(chǎn)具有耐高溫蘇氨酸合成酶活性的多肽或其功能等同變異體。以騰沖嗜熱厭氧菌全基因組測序與分析為基礎(chǔ),克隆分離了耐高溫蘇氨酸合成酶基因。該基因?qū)τ谥苽溆糜谏a(chǎn)耐高溫蘇氨酸合成酶的轉(zhuǎn)基因微生物或動植物,并回收獲得該基因編碼的酶有用。另外,本發(fā)明還提供了具有耐高溫蘇氨酸合成酶活性的多肽的氨基酸序列及功能等同體。同時,本發(fā)明還提供了制備,分離,純化具有耐高溫蘇氨酸合成酶活性的多肽的方法。
文檔編號C12N15/64GK1420175SQ0113507
公開日2003年5月28日 申請日期2001年11月19日 優(yōu)先權(quán)日2001年11月19日
發(fā)明者包其郁, 楊煥明, 盧小羽, 胡松年, 劉斯奇 申請人:杭州華大基因研發(fā)中心