專利名稱:表達超熱穩定蛋白的系統的制作方法
技術領域:
本發明涉及一種在工業應用中作為酶使用的超熱穩定蛋白酶,編碼該酶的基因以及通過遺傳工程技術產生該酶的方法。
背景技術:
蛋白酶是一種切割蛋白中肽鍵的酶。許多上述酶已在動物、植物和微生物中發現。蛋白酶可作為實驗室使用的試劑和作為藥物以及在工業領域,如作為添加劑用于去垢劑,用于處理食品及用于利用逆反應進行化學合成。因此,可以說該蛋白酶是工業上極其重要的酶。由于用于工業領域的蛋白酶需要高度的物理和化學穩定性,在其它酶類中熱穩定酶是優選使用的。因為芽孢桿菌屬的細菌產生的蛋白酶表現為相對高的熱穩定性,它們主要作為工業用途的蛋白酶。然而,在尋找更為優異的酶中,想方設法從高溫下生長的微生物中獲得該酶,例如,從芽孢桿菌屬的嗜熱細菌或超嗜熱菌中獲得。
例如,熟知的超嗜熱菌激烈熱球菌產生一種蛋白酶(應用環境微生物學,561992-1998(1990);FEMS微生物學通訊,7117-20(1990);遺傳微生物學雜志,1371193-1199(1991))。
此外,據報道嗜熱菌熱球菌屬菌株KOD1產生一種硫醇基蛋白酶(半胱氨酸蛋白酶)(應用環境微生物學,604559-4566(1994))。也已知超嗜熱菌熱球菌屬、葡萄嗜熱菌屬、棲熱擬芽孢桿菌屬產生蛋白酶(應用微生物學生物技術,34715-719(1991))。
如上面描述的來自嗜熱菌的蛋白酶具有高度熱穩定性。因此,可預計它們可用于代替目前正使用的熱穩定蛋白酶或用于還未考慮使用蛋白酶的領域。
然而,大部分產生這些酶的微生物僅在高溫下生長。例如,激烈熱球菌需要在90-100℃培養。在上述高溫下培養從能量消耗的角度著是不利的。此外,來自超嗜熱菌的蛋白酶生產力比常規微生物蛋白酶的生產力低。所以,工業上從超嗜熱菌產生蛋白酶的方法存在問題。
另外,用遺傳工程技術通過分離目的酶的基因并將其導入到容易培養的宿主微生物中產生該酶的方法,是本領域目前的常規方法。然而,該酶的基因導入到宿主中并不總是如預期的那樣有效地表達。據信主要原因是導入基因的GC含量或密碼子使用與宿主的基因不同。
因此,需要對導入的每個基因和/或每個宿主優化表達方法,以便達到符合設計用途的酶的合適生產力。
本發明的目的本發明的目的是提供工業使用有利的來自超嗜熱菌的蛋白酶,從該超嗜熱菌中分離編碼該蛋白酶的基因和提供利用該基因通過遺傳工程技術產生超熱穩定性蛋白酶的方法,以便解決上面所述的問題。
本發明概述由超嗜熱菌產生的蛋白酶中,一些種類根據其氨基酸序列的同源性分類為枯草桿菌蛋白酶型堿性蛋白酶。當編碼該蛋白酶的基因被導入到枯草芽孢桿菌中時(枯草芽孢桿菌一般通過遺傳工程技術用于生產),該酶的生產力比由枯草芽孢桿菌內源產生的蛋白的生產力更低。
本發明者經深入的研究并發現,通過把編碼來源于枯草桿菌蛋白酶信號肽的基因(信號序列)置于來源于超嗜熱菌待表達的蛋白酶基因的上游,然后修飾切割位點周圍的氨基酸序列,該目的基因將在枯草芽孢桿菌中高效表達。此外,還發現通過把來源于目的超嗜熱菌的蛋白酶基因中酶活性非必需的部分缺失、可增加所述的酶的表達水平。至此,完成了本發明。
本發明概括如下。本發明的第一個發明是一種具有由序列表SEQ IDNO1給出的氨基酸序列的熱穩定蛋白酶和一種具有如下氨基酸序列及熱穩定蛋白酶活性的蛋白酶,在該氨基酸序列中,一個或幾個氨基酸殘基被缺失、替換、插入或添加到序列表SEQ ID NO1給出的氨基酸序列中形成。
本發明的第二個發明是一種編碼第一個發明的熱穩定蛋白酶的基因和一種能與該基因雜交的熱穩定蛋白酶基因。
本發明的第三個發明是通過遺傳工程技術將來源于超嗜熱菌的基因用于生產熱穩定蛋白酶,其特征是該基因編碼如通式I表示的氨基酸序列SIG-Ala-Gly-Gly-Asn-PRO[I]其中,SIG代表來源于枯草桿菌蛋白酶信號肽的氨基酸序列,PRO代表待表達的蛋白的氨基酸序列。優選地是,SIG是由序列表SEQ IDNO3給出的氨基酸序列。優選地是,PRO是來源于超嗜熱菌的超熱穩定蛋白酶的氨基酸序列,更優選地是,來源于激烈熱球菌的蛋白酶的氨基酸序列。
本發明的第四個發明涉及一種通過遺傳工程技術產生蛋白質的方法,其特征在于該方法包括培養已導入第三個發明的基因的芽孢桿菌屬細菌,然后從培養物中收集目的蛋白。
本發明的第五個發明是用于通過遺傳工程技術生產蛋白的一種質粒,其特征在于第三個發明的基因已插入到質粒中。
在氨基酸序列中一個至幾個氨基酸殘基諸如缺失、替換、插入或添加的突變,可在天然產生的蛋白及由本發明披露的蛋白中產生。上述突變可能由于編碼該蛋白的基因的多態性或突變產生,或者由于蛋白的體內修飾或合成后純化過程中產生。不過,已知上述突變蛋白表現的生理學和生物學活性與未突變的蛋白相等。這可用于如下蛋白中,在該蛋白中上述突變已人為地導入到其氨基酸序列中,在該情況下,可能產生大量的各種突變。例如,眾所周知的在人白介素-2(IL-2)的氨基酸序列中的半胱氨酸殘基被絲氨酸殘基替換的多肽仍保持白介素-2的活性(科學,2241431(1984))。因此,具有在本發明披露的氨基酸序列中一個或幾個氨基酸殘基缺失、替換、插入或添加而形成的氨基酸序列及其蛋白酶活性與本發明的蛋白酶相等的蛋白酶也在本發明的范圍之內。
至于本文所用的“(與特定的基因)雜交的基因”是一種具有的堿基序列與特定基因的序列相似的基因。有可能具有的堿基序列與特定基因的序列相似的基因編碼一種具有氨基酸序列的蛋白,其功能與由特定基因編碼的蛋白相似。基因堿基序列的相似性可通過在嚴格條件下確定基因或其部分互相之間是否形成雜交體(雜交)而檢查出來。通過使用該方法,能獲得所編碼的蛋白與特定基因編碼的蛋白具有相似功能的基因。這就是說具有與本發明的基因的堿基序列相似的基因可通過使用本發明獲得的基因或其部分作為探針,按照熟知的方法進行雜交而獲得。雜交可按如下方法進行,例如,T.Maniatis等編著,分子克隆實驗室手冊第二版,冷泉港實驗室出版,1989,書中所描述的方法。更具體而言,雜交在下列條件下進行。簡言之,固定有DNAs的雜交膜在含有0.5%SDS,0.1%牛血清白蛋白(BSA),0.1%聚乙烯吡咯烷酮,0.1%Ficoll 400,0.01%變性鮭精DNA的6×SSC(1×SSC表示為0.15MNaCl,0.015M檸檬酸鈉,pH 7.0)中,和探針在50℃溫育12-20小時。溫育后,洗滌雜交膜直到固定的DNAs信號與背景能區別為止,開始洗滌在含0.5%SDS的2×SSC中37℃下進行,然后降低SSC濃度至0.1×和提高溫度至50℃。
另外,作為雜交的替代方法,可應用基因擴增方法(如,PCR方法),該法用本發明獲得的基因的部分堿基序列作為引物。因此所獲得的基因是否編碼具有目的功能的蛋白,能通過利用合適的宿主和合適的表達系統表達該基因,然后檢查所得到蛋白的活性的方法確定。
附圖簡述
圖1是質粒pSTC 3的限制性酶圖譜。
圖2比較了蛋白酶PFUS、蛋白酶TCES和枯草桿菌蛋白酶的氨基酸序列。
圖3比較了蛋白酶PFUS、蛋白酶TCES和枯草桿菌蛋白酶的氨基酸序列。
圖4比較了蛋白酶PFUS、蛋白酶TCES和枯草桿菌蛋白酶的氨基酸序列。
圖5比較了蛋白酶PFUS、蛋白酶TCES和枯草桿菌蛋白酶的氨基酸序列。
圖6是質粒pSNP 1的限制性酶切圖譜。
圖7是質粒pPS 1的限制性酶切圖譜。
圖8是質粒pNAPS 1的限制性酶切圖譜。
發明詳述根據本發明的超熱穩定蛋白酶包括來自各種超嗜熱菌的蛋白酶。例如,WO 95/34645描述的來自激烈熱球菌和速生熱球菌的蛋白酶。
來自激烈熱球菌DSM 3638的蛋白酶基因是從該菌株的基因組DNA文庫中,根據表達熱穩定蛋白酶活性而分離得到。含有該基因的質粒被命名為質粒pTPR 12。用該質粒轉化的大腸桿菌JM 109被命名并且表示為大腸桿菌JM 109/pTPR 12,于1994年5月24日(最初保藏日期)根據布達佩斯條約保藏在日本茨城縣筑波市東1丁目1番3號,通商產業省工業技術院生命工學和人體技術研究所,登記號FERM BP-5103。
該蛋白酶下文命名為蛋白酶PFUL。蛋白酶PFUL是一種具有高度熱穩定性并且甚至在95℃下也表現蛋白酶活性的蛋白酶。
已經測定了來源于激烈熱球菌插入到質粒pTPR 12的DNA片段的堿基序列。在該DNA片段中以2個DraI位點為邊界大約4.8kb的部分堿基序列插入到質粒pTPR 12中,在序列表SEQ ID NO5中顯示。此外,根據堿基序列推導的基因產物的氨基酸序列在序列表SEQ IDNO6中顯示。換言之,在序列表SEQ ID NO6中顯示的氨基酸序列是蛋白酶PFUL的氨基酸序列。如在序列中顯示的那樣,蛋白酶PFUL由1398個氨基酸殘基組成,是一種超過150,000的高分子量蛋白酶。
將序列表SEQ ID NO6中顯示的蛋白酶PFUL的氨基酸序列與熟知的來源于微生物的蛋白酶的氨基酸序列進行比較顯示,蛋白酶PFUL的第一個半部分的氨基酸序列與以枯草桿菌蛋白酶為代表的系列堿性絲氨酸蛋白酶有同源性(蛋白工程,4719-737(1991)),所存在的大約4個氨基酸殘基的極其高度同源性據信對蛋白酶的催化活性是重要的。
如上所述,發現來源于嗜溫菌的蛋白酶中的共同區域在由超嗜熱菌激烈熱球菌產生的蛋白酶PFUL的氨基酸序列中是保守的。因此,可預期由不是激烈熱球菌的超嗜熱菌產生的同源蛋白酶也具有該區域。
例如進行PCR能篩選出編碼超熱穩定蛋白酶的基因,用來自各種超嗜熱菌的染色體DNA作為模板,寡核苷酸PRO-1F、PRO-2F、PRO-2R和PRO-4R的組合作為引物。根據在蛋白酶PFUL基因中編碼顯示為與枯草桿菌蛋白酶高度同源的區域的堿基序列或蛋白酶PFUL的氨基酸序列之間相似的序列,合成這些寡核苷酸。寡核苷酸PRO-1F、PRO-2F、PRO-2R和PRO-4R的堿基序列分別在序列表SEQ ID NOS7、8、9和10中顯示。
由于根據本發明的蛋白酶來源于超嗜熱菌,能用屬于激烈熱球菌屬、熱球菌屬、葡萄嗜熱菌屬、熱擬芽孢桿菌屬等細菌。至于屬于熱球菌屬的細菌,例如能用速生熱球菌DSM 2476。該菌株可從DeutscheSammlung Von Mikroorganismen und Zellkulturen GmbH得到。當用來源于速生熱球菌DSM 2476的染色體DNA作為模板和寡核苷酸PRO-1F和PRO-2R或寡核苷酸PRO-2F和Pro-4R的組合作為引物進行PCR時,能擴增出特異的DNA片段,表明存在蛋白酶基因。此外,通過該DNA片段被插入到合適的質粒載體中創造重組質粒,然后用雙脫氧法測定該插入DNA片段的堿基序列,能推導出由該片段編碼的氨基酸序列。結果證明上述的DNA片段編碼的氨基酸序列與蛋白酶PFUL和來自各種微生物的堿性絲氨酸蛋白酶的氨基酸序列同源,以及PCR擴增的DNA片段是從蛋白酶基因作為模板擴增的。
下一步,用該PCR-擴增的DNA片段或如上所述的寡核苷酸作為探針,篩選來自超嗜熱菌的基因文庫,能得到編碼超熱穩定蛋白酶的基因(例如,由速生熱球菌產生的編碼超熱穩定蛋白酶的基因)。
例如,用PCR-擴增的DNA片段作為探針,針對文庫進行噬菌斑雜交,能獲得含有目的基因的噬菌體克隆。通過把λGEM-11載體(Promega)和來自速生熱球菌DSM 2476用限制性酶Sau 3AI部分消化的染色體DNA的DNA片段連接起來,然后用體外包裝方法將它們包裝到λ噬菌體顆粒中,產生上述的文庫。
通過分析由此獲得的一個噬菌體克隆中含有的DNA片段,發現蛋白酶基因存在于大約1.9kb的SacI片段中。此外,還發現通過測定其堿基序列該片段缺乏蛋白酶基因的5′區。用盒和盒引物(Takara Shuzo基因技術產物指導,1994-1995,pp.250-251)用PCR能獲得5′區。因此,能獲得包括超熱穩定蛋白酶5′區的DNA片段,在質粒pTCS 6中缺乏5′區。此外,來源于速生熱球菌的整個超熱穩定蛋白酶基因的堿基序列能從2個DNA片段的堿基序列確定。
在測定過的堿基序列中找到的可讀框的堿基序列在序列表的SEOID NO11中顯示,并且從該堿基序列推導的氨基酸序列在序列表的SEQ ID NO12中顯示。因而確定了來源于速生熱球菌編碼超熱穩定蛋白酶基因的堿基序列和該蛋白酶的氨基酸序列。該蛋白酶被命名為蛋白酶TCES。
可構建表達載體,在該載體中通過把2個DNA片段結合在一起重組整個蛋白酶TCES基因。然而,當用大腸桿菌作為宿主時,目的表達質粒導入其中的轉化體沒有得到,可能由于在細胞中來自基因表達的產物的產生對大腸桿菌可能是有害的或致死的。在上述情況下,例如,可用枯草芽孢桿菌作為宿主,使蛋白酶分泌到細胞外,然后測定其活性。
至于枯草芽孢桿菌菌株,可用枯草芽孢桿菌DB 104,它是在“基因”83215-233(1989)描述過的熟知的菌株。至于克隆載體,用質粒pUB 18-P43,它由Calgary大學Sui-Lam Wong博士饋贈。該質粒含有的卡那霉素抗性基因作為選擇標志。
在質粒載體pUB 18-P43中P43啟動子的下游插入蛋白酶TCES基因所形成的重組質粒被命名為質粒pSTC 3。用該質粒轉化的枯草芽孢桿菌DB 104被命名并表示為枯草芽孢桿菌DB 104/pST 3,于1995年12月1日(最初的保藏日期)根據布達佩斯條約保藏在通產省工業技術院生命工學和人體技術研究所,日本,茨城縣筑波市東1丁目1番3號,登記號為FERM BP-5635。
質粒pSTC 3的限制性酶圖譜在圖1顯示。在圖1中,粗線表示插入到質粒載體pUB 18-P43中的DNA片段。
熱穩定蛋白酶活性可在枯草芽孢桿菌DB 104/pSTC 3的培養物上清液中和細胞抽提液中找到。
從轉化體培養物中得到的蛋白酶粗酶制備物的主要特性如下(1)作用降解酪蛋白和明膠而產生短鏈多肽。
水解琥珀酰-L-亮氨酰-L-亮氨酰-L-纈氨酰-L-酪氨酸-4-甲基香豆素-7-酰胺(Suc-Leu-Leu-Val-Tyr-MCA)產生熒光物質(7-氨基-4-甲基香豆素)。
水解琥珀酰-L-丙氨酰-L-丙氨酰-L-脯氨酰-L-苯丙氨酸-對-硝基酰苯胺(Suc-Ala-Ala-Pro-Phe-p-NA)產生黃色物質(對硝基苯胺)。
(2)最適溫度在37-95℃下表現為酶活性,最適溫度為70-80℃。
(3)最適pH在pH5.5-9下表現為酶活性,最適pH為pH7-8。
(4)熱穩定性在80℃處理3小時后仍保持90%或更高的酶活性。
當把蛋白酶PFUL、蛋白酶TCES和枯草桿菌蛋白酶(枯草桿菌蛋白酶BNP′;核酸研究,117911-7925(1983))排列在一起,使同源區互相配對如在圖2-5顯示的那樣時,發現蛋白酶PFUL的同源區之間和C-末端存在的序列,在蛋白酶TCES或枯草桿菌蛋白酶中未找到。根據這些結果,在激烈熱球菌中,除了蛋白酶PFUL外可能存在具有的分子量比蛋白酶PFUL更低并與蛋白酶TCES或枯草桿菌蛋白酶相似的蛋白酶。
因此,用來自同源區的DNA探針進行針對從激烈熱球菌制備的染色體DNA的Southern雜交,并觀察到除蛋白酶PFUL基因外的信號,這表明存在另一種蛋白酶基因。
這種新型的蛋白酶基因通過下列方法分離。
例如,通過合適的限制性酶消化來自激烈熱球菌的染色體DNA,然后按上面所述的方法對消化過的DNA進行Southern雜交,可獲得含有編碼新蛋白酶基因的DNA片段。測定該DNA片段的堿基序列,以確認該堿基序列編碼的氨基酸序列與上面提到的蛋白酶同源。如果該DNA片段不含有整個目的基因,剩余的部分可通過逆向PCR法或相似的方法進一步獲得。
例如,當用限制性酶SacI和SpeI(Takara Shuzo)消化來自激烈熱球菌的染色體DNA然后用于Southern雜交時,觀察到大小大約為0.6kb的信號。該大小的DNA片段被重新得到,插入到質粒載體pBluescriptSK(-)(Stratagene)中的SpeI-SacI位點之間,然后用產生的重組質粒轉化大腸桿菌JM 109。用相同的探針,按上述Southern雜交所用的方法進行集落雜交,從轉化體中能獲得目的片段插入其中的克隆。從獲得的克隆含有的質粒是否擁有編碼所述的蛋白酶的序列,能用測定插入到質粒中的DNA片段的堿基序列確定。因而確認了在該質粒中存在蛋白酶基因。該質粒被命名為質粒pSS 3。
發現從插入到質粒pSS 3中的DNA片段的堿基序列推導的氨基酸序列與枯草桿菌蛋白酶、蛋白酶PFUL、蛋白酶TCES等的序列具有同源性。與蛋白酶PFUL基因不同的該蛋白酶基因的產物,其部分最近按上述的方法從激烈熱球菌中得到,被命名為蛋白酶PFUS。編碼該蛋白酶的N-末端和C-末端區的區域能用逆向PCR法獲得。
用于逆向PCR的引物可根據插入在質粒pSS 3中的DNA片段的堿基序列制備。用合適的限制性酶消化來自激烈熱球菌的染色體DNA,然后將產生的DNA片段進行分子內連接反應。通過用反應混合物作模板和上述提到的引物進行PCR,能獲得在質粒pSS 3中含有的該蛋白酶基因片段側翼區相應的DNA片段。由這些區域編碼的酶蛋白的氨基酸序列可通過分析所獲得的DNA片段的堿基序列而推導出來。此外,用來自激烈熱球菌的染色體DNA為模板可制備能擴增整個蛋白酶PFUS基因的引物。可設計引物NPF-4和NPR-4。引物NPF-4擁有的堿基序列緊鄰于蛋白酶PFUS基因的啟動密碼子上游處,能把BamHI 5′位點引入到該序列上。引物NPR-4擁有的序列與蛋白酶PFUS基因3′部分互補,可把SphI 5′位點引入到該序列上。
引物NPK-4和NPR-4的堿基序列在序列表的SEQ ID NOS13和14中顯示。用來自激烈熱球菌的染色體DNA為模板,這2個引物可用于擴增整個蛋白酶PFUS的基因。
與蛋白酶TCES一樣,蛋白酶PFUS能在作為宿主的枯草芽孢桿菌中表達。表達蛋白酶PFUS的質粒可按用于蛋白酶TCES的表達質粒pSTC 3構建。具體來說,通過把質粒pSTC 3中的蛋白酶TCES基因用含有整個蛋白酶PFUS基因的DNA片段取代,可構建表達蛋白酶PFUS的質粒,所述的DNA片段用上述的引物由PCR擴增得到。因而所構建的表達質粒被命名為質粒pSNP 1。用該質粒轉化的枯草芽孢桿菌DB 104被命名為枯草芽孢桿菌DB 104/pSNP 1,并于1995年12月1日(最初保藏的日期)根據布達佩斯條約,保藏在通產省工業技術院生命工學和人體技術研究所,日本,茨城縣筑波市東1丁目1番3號,登記號為FERMBP-5634。質粒pSNP1的限制性酶圖譜在圖6顯示。
在編碼蛋白酶PFUS基因中與可讀框相應的堿基序列以及從該堿基序列推導的蛋白酶PFUS的氨基酸序列分別在序列表的SEQ ID NOS15和16中顯示。
熱穩定蛋白酶活性在來自枯草芽孢桿菌DB 104/pSNP 1培養物的上清液中和細胞抽提液中發現。即,部分表達的蛋白酶PFUS被分泌到培養物上清液中。
從轉化體培養物中獲得的蛋白酶的主要特性如下(1)作用降解酪蛋白和膠原以產生短鏈多肽。
水解琥珀酰-L-亮氨酰-L-亮氨酰-L-纈氨酰-L-酪氨酸-4-甲基香豆素-7-酰胺(Suc-Leu-Leu-Val-Tyr-MCA)產生熒光物質(7-氨基-4-甲基香豆素)。
水解琥珀酰-L-丙氨酰-L-丙氨酰-L-脯氨酰-L-苯丙氨酸-對-硝基酰替苯胺(Suc-Ala-Ala-Pro-Phe-p-NA)產生黃色物質(對硝基苯胺)。
(2)最適溫度在41-110℃下表現為酶活性,最適溫度為80-95℃。
(3)最適pH在pH5-10下表現酶活性,最適pH為pH6-8。
(4)熱穩定性在95℃處理8小時后仍有90%或更高的酶活性。
(5)pH穩定性在pH5-11,95℃下處理60分鐘后仍保持95%或更高的酶活性。
(6)分子量在SDS-PAGE上出現的分子量大約為45kDa。
使用獲得蛋白酶TCES基因和蛋白酶PFUS基因相似的方法,與蛋白酶TCES基因和蛋白酶PFUS基因同源的蛋白酶基因能從不是激烈熱球菌和速生熱球菌的超嗜熱菌中得到。
可制備大約1kb的DNA片段,該片段編碼在序列表SEQ ID NO6中顯示的蛋白酶PFUL的氨基酸序列從殘基323位至殘基650的序列,用該片段作探針,針對來自海葡萄嗜熱菌和解蛋白熱擬桿菌DSM 5265的染色體DNAs進行基因組Southern雜交。結果,用PstI(TakaraShuzo)消化的來自海葡萄嗜熱菌染色體DNA大約4.8kb的位置和用XbaI消化的來自解蛋白熱擬桿菌染色體DNA大約3.5kb的位置觀察到信號。
根據這些結果,證明從海葡萄嗜熱菌和解蛋白熱擬桿菌來的染色體DNAs存在編碼蛋白酶PFUL、蛋白酶PFUS和蛋白酶TCES等基因同源的序列。用分離和鑒別編碼蛋白酶TCES和蛋白酶PFUS基因相似的方法,檢測DNA片段,可分離和鑒定在海葡萄嗜熱菌和解蛋白熱擬桿菌中編碼超熱穩定蛋白酶的基因。
一般來說,為了通過遺傳工程技術大量制備蛋白,認為應用在宿主中有效地起作用的啟動子而不用編碼目的蛋白的基因內部結合的啟動子是有利的。盡管用于構建蛋白酶TCES和蛋白酶PFUS表達系統的P43啟動子是來自枯草芽孢桿菌的啟動子,它不能足夠有效地表達這2種蛋白酶。
因此,為了增加表達水平,可利用在枯草芽孢桿菌中高水平表達的基因,尤其是編碼分泌蛋白的基因。可用編碼α-淀粉酶或各種細胞外蛋白酶的基因。例如,可預期應用枯草桿菌蛋白酶基因的啟動子和編碼信號肽區可增加蛋白酶PFUS的表達水平。
具體而言,通過把整個蛋白酶PFUS基因置于編碼枯草桿菌蛋白酶基因信號肽及包括啟動子區的區域下游,這樣2個基因的翻譯框能互相匹配,在枯草桿菌蛋白酶的啟動子控制下蛋白酶PFUS能作為融合蛋白表達。
例如,編碼枯草桿菌蛋白酶E的基因能用作枯草桿菌蛋白酶基因,用在本發明中。可使用把枯草桿菌蛋白酶E基因的啟動子和編碼信號肽的區域插入到質粒pKW 2中,該質粒在“細菌學雜志”1712657-2665(1989)中描述。包括啟動子序列的5′上游區的堿基序列在該參考文獻(同上)中描述而編碼枯草桿菌蛋白酶區的堿基序列在“細菌學雜志”158411-418(1984)中描述。
根據這些序列,合成引入EcoRI位點位于該基因啟動子序列上游的引物SUB 4和引入BamHI位點位于編碼枯草桿菌蛋白酶E的信號肽區下游的引物BmR1。引物SUB4和BmR1的堿基序列分別在序列表SEQID NOS17和18中顯示。用質粒pKWZ作模板,經PCR用引物SUB4和BmR1擴增出大約0.3kb的DNA片段,該片段含有枯草桿菌蛋白酶E基因的啟動子和編碼信號肽區。
置于該DNA片段下游的蛋白酶PFUS基因,可通過PCR法從激烈熱球菌的染色體DNA中獲得。引物NPF-4能用作和該基因5′區雜交的引物。根據該基因終止密碼子下游的堿基序列設計的引物NPM-1擁有SphI位點,能用作和該基因3′區雜交的引物。引物NPM-1的序列在序列表的SEQ ID NO19中顯示。
存在于基因中的一個BamHI位點在所述的方法中會產生問題,在該方法中,BamHI位點是用于連接蛋白酶PFUS基因和0.3kb DNA片段。依據在序列表SEQ ID NO15中顯示的蛋白酶PFUS基因的堿基序列,能制備經PCR-誘變法消除BamHI位點的引物mutRR和mutFR。引物mutRR和mutFR的堿基序列分別在序列表SEQ ID NOS20和21中顯示。當用這些引物消除BamHI位點時,由該位點編碼的氨基酸殘基即甘氨酸,由于引入該位點的堿基替換,被纈氨酸所替換,所述的位點在序列表SEQ ID NO16中顯示的蛋白酶PFUS氨基酸序列中560位。
用這些引物能獲得連接有枯草桿菌蛋白酶E的啟動子和編碼信號肽區的蛋白酶PFUS基因。具體而言,用來自激烈熱球菌的染色體DNA作模板及配對引物mutRR和NPF-4或配對引物mutFR和NPM-1,進行2次PCRs。此外,用各自PCR擴增的DNA片段作模板和引物NPF-4和NPM-1混合形成異源雙鏈,進行第二輪PCR。因此,能擴增出不含有內部BamHI位點大約2.4kb的整個蛋白酶PFUS基因。
分離用BamHI和SphI消化的PCR擴增的DNA片段獲得大約2.4kb的一個DNA片段,用該片段取代含有蛋白酶PFUS基因的質粒pSNP 1中的BamHI-SphI片段。由此構建的表達載體被命名為質粒pPS 1。用該質粒轉化的枯草芽孢桿菌DB 104命名為枯草芽孢桿菌DB 104/pPS1。觀察含有質粒pSNP 1的轉化體,發現在該轉化體培養物的上清液和抽提液中相似的蛋白酶活性,這表明該氨基酸替換不影響酶活性。質粒pPS 1的限制性酶圖譜在圖7中顯示。
含有枯草桿菌蛋白酶E基因的啟動子和編碼信號肽區的大約0.3kbDNA片段用EcoRI和BamHI消化,用于取代在質粒pPS 1中含有的P43啟動子和核糖體結合位點的EcoRI-BamHI片段。由此構建的表達質粒被命名為pNAPS 1。用該質粒轉化的枯草芽孢桿菌DB 104被命名為枯草芽孢桿菌DB 104/pNAPS 1。熱穩定蛋白酶活性在該轉化體培養物的上清液和細胞抽提液中找到,與枯草芽孢桿菌DB 104/pSNP 1相比較增加了表達水平。質粒pNAPS 1的限制性酶圖譜在圖8中顯示。
從該轉化體表達的蛋白酶表現的酶學特性與上述的由枯草芽孢桿菌DB 104/pSNP 1表達的蛋白酶的那些特性相等。純化了由該轉化體表達的蛋白酶。分析純化蛋白酶N-末端氨基酸序列提出的氨基酸序列在序列表SEQ ID NO22中顯示。該序列與在序列表SEQ ID NO15中顯示的蛋白酶PFUS的氨基酸序列從133位至144位的序列相同,表明成熟的蛋白酶PFUS是從該部分開始的多肽所組成的酶。根據這些結果呈現的成熟蛋白酶PFUS的氨基酸序列在序列表SEQ ID NO4中顯示。
盡管與枯草芽孢桿菌DB 104/pSNP 1(FERM BP-5634)產生的蛋白酶量相比較,由枯草芽孢桿菌DB 104/pNAPS 1產生的蛋白酶量增加,仍需要更高的生產力。通過修飾枯草芽孢桿菌信號肽和蛋白酶PFUS之間由pNAPS 1編碼的融合肽結合部分,以更有效地移去信號肽,預計能增加該蛋白酶的表達水平。在質粒pNAPS 1中,由3個氨基酸殘基Ala-Gly-Ser組成的肽插入在序列表SEQ ID NO3中顯示的枯草桿菌蛋白酶E信號肽的C-末端氨基酸殘基(Ala)和蛋白酶PFUS的N-末端氨基酸殘基(Met)之間。通過把突變導入到質粒pNAPS 1中編碼該肽的DNA中然后檢查已導入突變質粒的轉化體的蛋白酶生產性,能獲得具有增加蛋白酶表達水平的轉化體。
首先,制備突變質粒,其中在質粒pNAPS 1中編碼融合蛋白,枯草桿菌蛋白酶E-蛋白酶PFUS的基因中3個氨基酸肽中編碼Ser的部分被修飾,這樣該部分的堿基序列編碼隨機的2個氨基酸殘基。上述突變質粒可用PCR法產生。例如,具有用隨機的6個堿基替換編碼Ser密碼子(TCC)-的序列的引物SPOFO和SPORO(引物SPOFO和SPORO的堿基序列分別在序列表SEQ ID NOS24和25中顯示)和根據該區周圍的堿基序列制備的引物SUB 3和NPR-10,用于進行PCR以獲得一個DNA片段,在與編碼Ser密碼子(Ser)相應的部位的定向突變已引入了該DNA片段中。由得到的片段取代在質粒pNAPS 1中相應的區域能獲得含有導入突變的蛋白酶基因的突變質粒。
通過由此獲得的突變質粒導入到合適的宿主如枯草芽孢桿菌DB 104中,然后測定由轉化體表達的蛋白酶水平,那么就能獲得具有增加表達水平的轉化體。由測定所分離的轉化體獨立培養物中的活性確定蛋白酶的表達水平。另外,具有增加表達水平的轉化體可用含基質的瓊脂平板方便地選出。
具體來說,突變質粒導入其中的轉化體生長在含有脫脂乳的瓊脂平板上。然后,平板培養在蛋白酶PFUS能表現其活性的溫度下,如在70℃下。在表達蛋白酶的轉化體集落周圍的脫脂乳被降解而變得清亮。蛋白酶的表達水平能從清亮區的大小估計出來。
與枯草芽孢桿菌DB 104/pNAPS 1相比較由此得到的一種表達高水平蛋白酶活性的轉化體,被命名為枯草芽孢桿菌DB 104/pSPO 124。制備含有該轉化體的質粒(該質粒被命名為pSPO 124)。分析該質粒的堿基序列顯示編碼Ser的部分轉變成堿基序列GGGAAT,那就是說,由該質粒編碼的是一種Ser已轉變為Gly-Asn的蛋白。
因此,通過把由4個氨基酸殘基Ala-Gly-Gly-Asn組成的肽置于枯草桿菌蛋白酶信號肽的下游,將其與目的蛋白的N-末端融合,然后表達融合蛋白,證明目的蛋白的表達水平能在作為宿主的芽孢桿菌屬細胞中增加。除了用于本發明的枯草桿菌蛋白酶E(來自枯草芽孢桿菌)外,來自解淀粉枯草桿菌的枯草桿菌蛋白酶BPN′(核酸研究,117911-7925(1983))、來自地衣枯草桿菌的枯草桿菌蛋白酶Carlsberg(核酸研究,138913-8926(1985))等都是熟知的由芽孢桿菌屬細菌產生的枯草桿菌蛋白酶。來自它們的信號肽能優選地用于本發明,盡管它們的氨基酸序列互相間稍有不同。在芽孢桿菌屬細菌中起作用的各種啟動子能用在本發明為控制表達所用的來自枯草桿菌蛋白酶E基因的啟動子的部位。
關于被表達的蛋白沒有限制。只要獲得編碼蛋白的基因就可應用本發明通過遺傳工程技術高水平地表達該蛋白。根據分類學上與芽孢桿菌屬細菌不同的激烈熱球菌的蛋白可高水平表達的事實,顯然本發明能用于表達不是本發明宿主的生物來源的蛋白。通過遺傳工程技術,本發明優選地用于生產蛋白酶PFUL、蛋白酶TCES以及結構上與蛋白酶PFUS相似,來源于海葡萄嗜熱菌和解蛋白熱擬桿菌的蛋白酶。
依據和枯草桿菌蛋白酶的同源性,可考慮將蛋白酶PFUS表達為具有信號肽和前肽的前體蛋白,然后進行加工以產生成熟的酶。此外,根據成熟蛋白酶PFUS酶的N-末端氨基酸序列分析的結果,可以設定該成熟酶是一種在序列表SEQ ID NO4中所示的氨基酸序列組成的酶。然而,純化的成熟蛋白酶PFUS的分子量大約為45kDa,比根據氨基酸序列計算的分子量更小,表明也進行其C-末端肽的加工后,作為前肽表達的蛋白酶PFUS轉變成成熟的蛋白酶。
如果由加工過程移去的C-末端肽對酶活性或酶蛋白折疊成合適的結構是非必需的,預期通過從該基因中缺失編碼該部分的區域然后表達蛋白酶,也可增加蛋白酶PFUS的表達水平。
從枯草芽孢桿菌DB 104/pNAPS 1獲得的成熟蛋白酶PFUS的分子量例如可用質子光譜儀精確地測定。根據測定的分子量和按上述方法確定的成熟蛋白酶PFUS的N-末端氨基酸序列,發現該蛋白酶是一種與序列表SEQ ID NO15中所示的氨基酸序列133位Ala至552位Thr相應的肽。此外,通過把終止密碼子導入到在質粒pNAPS 1含有的蛋白酶PFUS基因中編碼552位Thr部分的附近區域,能構建表達缺乏對其酶活性非必需的多肽的蛋白酶PFUS的質粒。具體而言,用引物NPR 544和引物NPFE 81經PCR獲得具有所設計的終止密碼子引入其中的堿基序列的DNA片段,引物NPR 544是在質粒pNAPS 1中的蛋白酶PFUS基因從起始密碼子至第544位氨基酸殘基編碼密碼子的C-末端側(Ser)導入一個終止密碼子(TGA)(引物NPR 544的堿基序列在序列表的SEQ ID NO28中顯示),而引物NPFE 81擁有在該基因中從NspV位點上游區的堿基序列(引物NPFE 81的堿基序列在序列表的SEQ ID NO29中顯示)。然后用該片段取代質粒pNAPS 1的相應區域能獲得含有目的突變導入蛋白酶基因中的突變質粒。該質粒命名為質粒pNAPSΔC。用該質粒轉化的枯草芽孢桿菌DB 104被命名為枯草芽孢桿菌DB 104/pNAPSΔC。
該轉化體表達蛋白酶活性,具有的特性與蛋白酶PFUS相同,其表達水平比枯草芽孢桿菌DB 104/pNAPS 1更高。
因此,可以發現在質粒pNAPSΔC中含有的蛋白酶PFUS基因擁有表達該酶活性的足夠區域。在質粒中存在的編碼蛋白酶PFUS區的堿基序列在序列表的SEQ ID NO2中顯示。由該堿基序列編碼的氨基酸序列在序列表的SEQ ID NO2中顯示。
此外,通過把在質粒pNAPSΔC中相似的突變導入到質粒pSPO 124的蛋白酶PFUS基因中,能表達缺乏其C-末端肽的蛋白酶PFUS。
具體而言,通過用NspV和SphI消化質粒pNAPSΔC獲得的大約13kb的DNA片段和已被NspV和SphI消化的質粒pSPO 124混合并連接,而構建該目的質粒。該質粒被命名為質粒pSO124ΔC。用該質粒轉化的枯草芽孢桿菌DB 104被命名并表示為枯草芽孢桿菌DB 104/pSO124ΔC,于1997年5月16日(最初的保藏日期)根據布達佩斯條約保藏在通產省工業技術院生命工學和人體技術研究所,日本,茨城縣筑波市東1丁目1番3號,登記號為FERM BP-6294。該轉化體的蛋白酶表達水平與枯草芽孢桿菌DB 104/pNAPS 1相比增加。
由轉化體枯草芽孢桿菌DB 104/pNAPSΔC和枯草芽孢桿菌DB 104/pSPO124ΔC產生的蛋白酶的酶學特性以及物理和化學特性,似乎與由枯草芽孢桿菌DB 104/pSNP 1產生的蛋白酶的那些特性相同。從該2個轉化體中的培養物中獲得的蛋白酶的主要特性如下(1)作用降解酪蛋白和膠原產生短鏈多肽。
水解琥珀酰-L-亮氨酰-L-亮氨酰-L-纈氨酰-L-酪氨酸-4-甲基香豆素-7-酰胺(Suc-Leu-Leu-Val-Tyr-MCA)產生熒光物質(7-氨基-4-甲基香豆素)。
水解琥珀酰-L-丙氨酰-L-丙氨酰-L-脯氨酰-L-苯丙氨酸-對-硝基酰替苯胺(Suc-Ala-Ala-Pro-Phe-p-NA)產生黃色物質(對硝基苯胺)。
(2)最適溫度在40-110℃下表現酶活性,最適溫度為80-95℃。
(3)最適pH在pH5-10下表現酶活性,最適pH為pH6-8。
(4)熱穩定性在95℃下處理8小時后保留90%或更高的酶活性。
(5)pH穩定性在95℃,pH5-11下處理60分鐘后保留95%或更高的酶活性。
(6)分子量在SDS-PAGE上表現的分子量大約45kDa。
因此,提供了具有高熱穩定性的蛋白酶和其基因。此外,本發明披露了表達蛋白的新系統,該系統使蛋白酶大量表達。用遺傳工程技術將該表達系統用于生產本發明的蛋白酶及各種蛋白。
下列的實施例更詳細地說明本發明,但不能解釋為限制本發明的范圍。
實施例1(1)從激烈熱球菌中制備染色體DNA按下列條件培養激烈熱球菌DSM 3638。
含有1%蛋白胨,0.5%酵母抽提物,1%可溶性淀粉,3.5% Jamarine S固體物(Jamarine實驗室),3.5% Jamarine S液體物(Jamarine實驗室),0.003% MgSO4,0.001% NaCl,0.0001% FeSO4·7H2O,0.0001%CoSO4,0.0001% CaCl2·7H2O,0.0001% ZnSO4,0.1ppm CuSO4·5H2O,0.1ppm H3BO3,0.1ppm KAl(SO4)2,0.1ppm Na2MoO4·2H2O,0.25ppmNiCl2·H2O的培養基放在2L的培養瓶中,120℃滅菌20分鐘,用氮氣充泡以移去溶解的氧氣,然后將菌株接種到培養基中,在95℃下非振蕩條件培養16小時。培養后,通過離心收集細胞。
然后得到的細胞懸浮在4ml含有25%蔗糖的50mM Tris-HCl(pH 8.0)中。加2ml的0.2M EDTA和0.8ml溶菌酶(5mg/ml)到懸液中。混合液在20℃下溫育1小時。然后往混合液中加入24ml的SET溶液(150mM NaCl,1mM EDTA,20mM Tris-HCl,pH8.0),4ml的5% SDS和400μl的蛋白酶K(10mg/ml)。繼續在37℃下溫育1小時。反應通過用苯酚-氯仿抽提混合物而終止。然后,進行乙醇沉淀獲得大約3.2mg的染色體DNA。
實施例2(1)為構建質粒pNSP 1的引物合成為了合成用于擴增整個蛋白酶PFUS基因的引物,含有該整個基因的質粒pSNP 1從枯草芽孢桿菌DB 104/pSNP1(FERM BP-5634)中分離,然后測定所獲得區域的堿基序列。根據該堿基序列,合成引入BamHI位點緊鄰于蛋白酶PFUS基因起始密碼子上游的引物NPF-4和能與該基因3′區雜交并含有SphI識別位點的引物NPM-1。引物NPF-4和NPM-1的堿基序列分別在序列表SEQ ID NOS13和19中顯示。
也合成移去BamHI位點的引物mutRR和mutFR,該BamHI位點位于蛋白酶PFUS基因中自起始密碼子下游大約1.7kb處。引物mutRR和mutFR的堿基序列分別在序列表的SEQ ID NOS20和21中顯示。
(2)制備質粒pPS 1制備2套LA-PCR反應混合液,然后進行94℃ 30秒-55℃ 1分鐘-68℃ 3分鐘的30個循環反應,每套LA-PCR反應混合液含有來自激烈熱球菌的染色體DNA為模板和引物NPF-4和mutRR的組合或引物mutFR和NPM-1的組合。用LA PCR試劑盒Ver.2(TakaraShuzo)制備LA-PCR反應混合液。等份的反應混合物進行瓊脂糖凝膠電泳,分別觀察到用引物NPF-4和mutRR擴增出一條大約1.8kb的DNA片段而用引物mutFR和NPM-1擴增出一條大約0.6kb的DNA片段。
用SUPREC-02(Takara Shuzo)從2套PCR反應混合液中移去引物以制備擴增的DNA片段。制備含有這2種擴增的DNA片段但不含有引物或LA Taq的LA-PCR反應混合液,94℃下熱變性10分鐘,在30分鐘內冷卻至30℃,然后在30℃溫育15分鐘以形成異源雙鏈。接著,把LA Taq(Takara Shuzo)加到反應混合液中,72℃下反應30分鐘。然后把引物NPF-4和NPM-1加到反應混合液中,然后該反應混合液進行94℃ 30分鐘-55℃ 1分鐘-68℃ 3分鐘的25個循環反應。在反應混合液中觀察到擴增出一條大約2.4kb的DNA片段。
大約2.4kb的該DNA片段用BamHI和SphI(兩者均來自TakaraShuzo)消化。該片段和已被BamHI和SphI消化過移去整個蛋白酶PFUS基因的質粒pSNP1混合并連接,然后導入到枯草芽孢桿菌DB 104中。從產生的卡那霉素抗性的轉化體中制備質粒,選出其中僅大約2.4kb片段一個分子插入的質粒,并且命名為質粒pPS 1。用該質粒pPS 1轉化的枯草芽孢桿菌DB 104被命名為枯草芽孢桿菌DB 104/pPS 1。
質粒pPS 1的限制性酶圖譜在圖7中顯示。
(3)對枯草桿菌蛋白酶E基因的啟動子-編碼信號肽區擴增DNA片段為獲得枯草桿菌蛋白酶E基因的啟動子-編碼信號肽區而合成引物。首先,根據在細菌學雜志,1712657-2665(1989)所描述的枯草桿菌蛋白酶E基因啟動子區的堿基序列合成引物SUB 4,該引物能與該區上游序列雜交并含有1個EcoRI位點(引物SUB 4的堿基序列在序列表的SEQ ID NO17中顯示)。根據在細胞學雜志,158411-418(1984)中所描述的枯草桿菌蛋白酶E基因的堿基序列,合成能引入1個BamHI位點緊鄰于編碼信號肽區下游的引物BmR1(引物BmR1的堿基序列在序列表的SEQ ID NO18中顯示)。
制備含有在細菌學雜志,1712657-2665中所描述的枯草桿菌蛋白酶E基因的質粒pKWZ作模板及引物SUB 4和BmR1的PCR反應混合液,然后進行94℃ 30秒-55℃ 1分鐘-68℃ 2分鐘的30個循環反應。等份的反應混合液進行瓊脂糖凝膠電泳,并觀察到擴增出一條大約0.3kb的DNA片段。
(4)構建蛋白酶表達質粒pNAPS 1用EcoRI(Takara Shuzo)和BamHI消化上述大約0.3kb的DNA片段,用實施例3中所述的方法已被EcoRI和BamHI消化的質粒pPS1與DNA片段混合并連接,然后導入到枯草芽孢桿菌DB 104中。從產生的卡那霉素抗性的轉化體中制備質粒,然后挑選出僅大約0.3kb的片段一個分子插入的質粒,命名為質粒pNAPS 1。用該質粒pNAPS 1轉化的枯草芽孢桿菌DB 104被命名為枯草芽孢桿菌DB 104/pNAPS 1。
質粒pNAPS 1的限制性酶圖譜在圖8中顯示。
(5)構建質粒pSNP 2為引入BamHI位點位于在上面提到的質粒pNAPS 1中的枯草桿菌蛋白酶E基因的編碼信號肽區上游,合成引物SUB17R(引物SUB17R的堿基序列在序列表的SEQ ID NO23中顯示)。制備含有質粒pNAPS1作模板及引物SUB17R和SUB4的PCR反應混合液,進行94℃ 30秒-55℃ 1分鐘-72℃ 1分鐘的25個循環反應。用EcoRI和BamHI消化擴增的大約0.21kb的DNA片段,以獲得一條大約0.2kb的DNA片段,該片段含有枯草桿菌蛋白酶E基因的啟動子和SD序列。該片段和已被EcoRI和BamHI消化過的質粒pNAPS1混合并連接。用該反應混合液轉化枯草芽孢桿菌DB 104。從產生的卡那霉素抗性的轉化體中制備質粒,然后挑選出大約0.2kb的DNA片段插入的質粒,命名為質粒pSNP 2。
(6)產生高水平表達蛋白酶的突變質粒為把位于質粒pNAPS 1中枯草桿菌蛋白酶E基因的編碼信號肽區和蛋白酶PFUS基因的起始密碼子之間的編碼氨基酸殘基Ser的序列(堿基序列TCC)用編碼2個隨機氨基酸殘基的序列替換,合成引物SPOFO和SPORO(引物SPOFO和SPORO的堿基序列分別在序列表的SEQ ID NOS24和25中顯示)。合成引入的BamHI位點緊鄰于質粒pNAPS 1的枯草桿菌蛋白酶E基因中編碼信號肽的上游的引物SUB3和在蛋白酶PFUS編碼區中含有SpeI位點的引物NP取-10(引物SUB3和NPR-10的堿基序列分別在序列表的SEQ ID NOS26和27中顯示)。
制備PCR反應混合液,每種混合液含有以質粒pNAPS 1作模板和引物SPOFP和NPR-10組合或引物SUB3和SPORO的組合,將反應混合液進行94℃ 30秒-50℃ 1分鐘-72℃ 1分鐘的20個循環反應。在2個反應混合液中擴增出的大約0.13kb和大約0.35kb的DNA片段混合在一起,在94℃變性10分鐘,逐漸冷卻到37℃以形成異源雙鏈。然后用Taq聚合酶(Takara Shuzo)的方法從異源雙鏈產生雙鏈DNA。制備含有由上獲得的雙鏈DNA作模板及引物SUB3和NPR-10的PCR反應混合液,進行94℃ 30秒-50℃ 1分鐘-72℃ 1分鐘的25個循環反應。用BamHI和SpeI消化擴增的大約0.43kb的DNA片段所獲得的一條DNA片段和用BamHI和SpeI消化過的質粒pSNP 2混合并連接。用反應混合液轉化枯草芽孢桿菌DB 104。
將產生的卡那霉素抗性的轉化體接種在脫脂乳的平板上(用于高溫培養的LB-瓊脂培養基含有10μg/ml的卡那霉素和1%脫脂乳)以形成集落。接著,平板培養在70℃下,根據在集落周圍的脫脂乳的降解程度,檢查由各個轉化體表達的蛋白酶活性。結果,分離到一個表達特別高活性的克隆,從該克隆制備命名為質粒pSPO 124的質粒。用該質粒轉化的枯草芽孢桿菌DB 104被命名為枯草芽孢桿菌DB 104/pSPO 124。分析質粒pSPO 124的堿基序列,發現在質粒pNAPS 1中編碼Ser的堿基序列被堿基序列GGGAAT所替換,那就是說所編碼的蛋白中,Ser被轉換為2個氨基酸殘基Gly-Asn。另外,證明與蛋白酶PFUS基因的Pro(CCA)相應的從起始密碼子計算的第25位密碼子轉變為編碼Leu的密碼子(CTA),這是與上面所述的突變同時發生的。
(7)構建蛋白酶表達質粒pNAPSΔC1個終止密碼子被導入在質粒pNAPS 1中從蛋白酶PFUS基因的起始密碼子算起的第544位氨基酸殘基的C-末端側,以構建表達從該位點起缺乏下游區的蛋白酶的質粒。合成引物NPR 544,該引物在該基因中編碼第544位氨基酸殘基的密碼子C-末端側導入一個終止密碼子(堿基序列TGA)和有一個SphI位點(引物NPR 544的堿基序列在序列表的SEQ ID NO28中顯示)。此外,根據在該基因中從NspV位點上游部分的堿基序列,合成引物NPFE 81(引物NPFE 81的堿基序列在序列表的SEQ ID NO29中顯示)。
制備含有質粒pNAPS 1作模板及引物NPFE 81和NPR 544的PCR反應混合液,然后進行94℃ 30秒-50℃ 1分鐘-72℃ 1分鐘的20個循環反應。擴增出的大約0.61kb的DNA片段用NspV(Takara Shuzo)和SpeI消化,以獲得一條含有終止密碼子的大約0.13kb的DNA片段。該DNA片段和已被限制性酶NspV和SphI消化過的質粒pNAPS 1混合并連接。用反應混合液轉化枯草芽孢桿菌DB 104。從產生的卡那霉素抗性的轉化體中制備質粒,選出大約0.13kb的DNA片段插入其中的質粒,該質粒被命名為質粒pNAPSΔC。用該質粒pNAPSΔC轉化的枯草芽孢桿菌DB 104被命名為枯草芽孢桿菌DB 104/pNAPSΔC。
(8)構建蛋白酶表達質粒pSPO124ΔC用NspV和SphI消化質粒pNAPSΔC分離得到一條大約1.3kb的DNA片段,然后該片段與已被NspV和SphI消化過的質粒pSPO 124混合并連接。用反應混合液轉化枯草芽孢桿菌DB 104。從產生的卡那霉素抗性轉化體中制備質粒,挑選出大約1.3kb的DNA片段插入的質粒,并被命名為質粒pSPO124ΔC。用該質粒pSPO124ΔC轉化的枯草芽孢桿菌DB 104被命名為枯草芽孢桿菌DB 104/pSPO124ΔC。
實施例3(1)用含蛋白酶PFUS基因的質粒轉化的枯草芽孢桿菌的培養和制備粗酶溶液用實施例2所述的方法將含有蛋白酶PFUS基因的質粒pNAPS 1導入到枯草芽孢桿菌DB 104中出現的枯草芽孢桿菌DB 104/pNAPS 1,在2ml含有10μg/ml卡那霉素的LB培養基(蛋白胨10g/L,酵母抽提物5g/L,NaCl 5g/L,pH7.2)中,37℃下培養24小時。離心培養物以得到培養上清液(制備物1-S)和細胞。
把細胞懸浮在100μl的50mM Tris-HCl,pH7.5中,加2mg溶菌酶(Sigma)后37℃消化45分鐘。消化過的樣品在95℃熱處理10分鐘,然后通過離心收集上清液以獲得無細胞的抽提液(制備物1-L)。
相似地,從含有質粒pSPO 124的枯草芽孢桿菌DB 104/pSPO 124、含有質粒pNAPSΔC的枯草芽孢桿菌DB 104/pNAPSΔC或含有質粒pSPO124ΔC的枯草芽孢桿菌DB 104/pSPO124ΔC中,獲得培養物上清液和無細胞的抽提液。來自枯草芽孢桿菌DB 104/pSPO 124的培養物上清液和無細胞抽提液分別稱為124-S和124-L。來自枯草芽孢桿菌DB 104/pNAPSΔC的培養物上清液和無細胞抽提液分別稱為ΔC-S和ΔC-L。來自枯草芽孢桿菌DB 104/pSPO124ΔC的培養物上清液和無細胞抽提液分別稱為124ΔC-S和124ΔC-L。用這些制備物測定蛋白酶活性并測定在每個制備物中含有的蛋白酶濃度。
(2)比較蛋白酶的生產力用Suc-Ala-Ala-Pro-Phe-p-NA(Sigma)作底物光譜法測定酶水解反應中產生的p-硝基苯胺的量確定蛋白酶PFUS的活性。簡言之,適當稀釋待測定其酶活性的酶制備液。50μl在100mM磷酸鹽緩沖液pH7.0中的1mM Suc-Ala-Ala-Pro-Phe-p-NA被加到50μl稀釋過的樣品溶液中。然后,使反應在95℃進行30分鐘。通過在冰上冷卻終止反應后,測定在405nm的吸收值以計算出產生的對硝基苯胺的量。該酶的一個單位被定義為95℃每1分鐘產生1μmol對硝基苯胺的酶量。假定比活性為9.5單位/mg蛋白酶PFUS蛋白,根據所測定的酶活性計算在培養物上清液或細胞中表達的酶蛋白的量。
測定在實施例3-(1)制備的每種酶制備物的蛋白酶活性。根據測定結果計算的每種轉化體每1L培養物的蛋白酶PFUS的生產力在表1顯示。
在枯草芽孢桿菌DB 104/pSPO 124中,在細胞中的蛋白酶PFUS的生產力比枯草芽孢桿菌DB 104/pNAPS1增加了3.6倍。在枯草芽孢桿菌DB 104/pNAPSΔC中,蛋白酶PFUS的生產力分別在培養物上清液中增加2.4倍而在細胞中增加2.2倍。此外,在枯草芽孢桿菌DB 104/pSPO124ΔC中,蛋白酶PFUS的生產力分別在培養物上清液中增加2倍而在細胞中增加2.4倍。每種細胞的生產力也增加。
在培養物上清液和細胞中產生的蛋白酶PFUS的總量,與枯草芽孢桿菌DB 104/pNAPS1相比,分別在枯草芽孢桿菌DB 104/pSPO 124中增加2.1倍,在枯草芽孢桿菌DB 104/pNAPSΔC中增加2.1倍及在枯草芽孢桿菌DB 104/pSPO124ΔC中增加2.2倍。
表1蛋白酶PFUS的生產力(mg/L的培養物)
實施例4(1)制備純化的成熟蛋白酶PFUS的酶制備物按實施例2中所述的方法將編碼本發明的超熱穩定蛋白酶的基因導入枯草芽孢桿菌DB 104中出現的2種菌株,枯草芽孢桿菌DB 104/pNAPS 1和枯草芽孢桿菌DB 104/pSPO124ΔC,分別接種到含有10μg/ml卡那霉素的5ml LB培養基中,37℃振蕩培養7小時。5ml的培養物接種到5L錐形瓶中500ml含10μg/ml卡那霉素的TM培養基(大豆粉末5g/L,聚胨10g/L,肉膏5g/L,酵母抽提物2g/L,葡萄糖10g/L,FeSO4·7H2O 10mg/L,MnSO4·4H2O 10mg/L,ZnSO4·7H2O 1mg/L,pH7.0)中,30℃振蕩培養3天。超聲處理所產生的培養物,在95℃熱處理30分鐘,然后離心收集上清液。加過硫酸銨到上清液中至25%的飽和度,然后由下一步離心獲得的上清液上樣到用含25%飽和過硫酸銨的25mM Tris-HCl緩沖液平衡過的微量制備甲基HIC柱(Bio-Rad)上。用相同的緩沖液洗滌凝膠后,吸附到柱上的蛋白酶PFUS用含40%乙醇的25mM Tris-HCl緩沖液(pH7.6)用分步洗脫法洗脫下來。由此獲得的含有蛋白酶PFUS的級分用NAP-25柱進行凝膠過濾,該NAP-25柱預先用含20%乙腈的0.05%三氟乙酸平衡,在變性蛋白酶PFUS的同時脫鹽,然后獲得純化的蛋白酶PFUS的制備物。從枯草芽孢桿菌DB 104/pNAPS 1和枯草芽孢桿菌DB 104/pSPO124ΔC中得到的制備物分別稱為NAPS-1和SPO-124ΔC。
2種純化的酶制備物在0.1% SDS-10%聚丙烯酰胺凝膠上電泳,然后用考馬斯亮藍R-250染色,結果顯示2種純化的酶制備物NAPS-1和SPO-124ΔC為單一的泳帶,估測的分子量大約為45kDa。
(2)成熟蛋白酶PFUS的N-末端氨基酸序列的分析用G1000A蛋白測序儀(Hewlett-Packard),通過自動Edman法分析純化的酶制備物NAPS-1和SPO-124ΔC的N-末端氨基酸序列。2種純化的酶制備物的2個N-末端氨基酸序列在序列表的SEQID NO22中顯示。該序列與在序列表的SEQ ID NO15中所示的蛋白酶PFUS氨基酸序列從133位至144位的序列重合,表明NAPS-1和SPO-124ΔC二者是從該部分開始的多肽所組成的酶。
(3)成熟蛋白酶PFUS的質譜法分析對純化的酶制備物NAPS-1和SPO-124ΔC的質譜法分析用API300四極三質子分光儀(Perkin-Elmer Sciex)進行。根據NAPS-1的估測分子量,43,744Da,說明由枯草芽孢桿菌DB 104/pNAPS 1產生的成熟蛋白酶PFUS是一種在序列表SEQ ID NO15中所示的蛋白酶氨基酸序列從133位Ala至552位Thr的多肽組成的酶。此外,根據SPO-124ΔC的估測分子量42,906Da,說明由枯草芽孢桿菌DB 104/pSPO124ΔC產生的成熟蛋白酶PFUS是一種由這樣的一種多肽組成的酶,該多肽為在序列表SEQ ID NO15中所示的蛋白酶PFUS從133位Ala至544位Ser的氨基酸序列,即是序列表SEQ ID NO2中所示的氨基酸序列。
序列表申請人名稱TAKARA SHUZO CO.,LTD發明題目表達超熱穩定蛋白的系統參考/摘要號660782目前申請號目前申請日在先申請號151969/1997在先申請日1997,6月10日序列數29SEQ ID NO1的資料長度412類型氨基酸鏈型單鏈拓撲結構線性分子類型肽序列描述Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala5 10 15Thr Tyr Val Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile20 25 30Gly Ile Ile Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln35 40 45Gly Lys Val Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr50 55 60Pro Tyr Asp Asp His Gly His Gly Thr His Val Ala Ser Ile Ala65 70 75
Ala Gly Thr Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala80 85 90Pro Gly Ala Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly95 100 105Ser Gly Ser Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val110 115 120Asp Asn Lys Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu125 130 135Gly Ser Ser Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala140 145 150Val Asn Ala Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala155 160 165Gly Asn Ser Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala170 175 180Ala Ser Lys Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val185 190 195Ile Thr Ser Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu200 205 210Lys Pro Glu Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg215 220 225Ala Ser Gly Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr230 235 240Ala Ala Pro Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile245 250 255Ala Ala Leu Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys260 265 270
Val Lys Thr Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp275 280 285Glu Ile Ala Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr290 295 300Lys Ala Ile Asn Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly305 310 315Tyr Val Ala Asn Lys Gly Ser Gln Thr His Gln Phe Val Ile Ser320 325 330Gly Ala Ser Phe Val Thr Ala Thr Leu Tyr Trp Asp Asn Ala Asn335 340 345Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Gln Val350 355 360Asp Tyr Ser Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr365 370 375Tyr Asn Pro Thr Asp Gly Thr Trp Thr Ile Lys Val Val Ser Tyr380 385 390Ser Gly Ser Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser395 400 405Leu Ser Gln Pro Gly Ser Ser410SEQ ID NO2的資料長度1236類型核酸鏈型雙鏈拓撲結構線性分子類型基因組DNA
原始來源生物激烈熱球菌菌株DSM 3638序列描述GCAGAATTAG AAGGACTGGA TGAGTCTGCA GCTCAAGTTA TGGCAACTTA CGTTTGGAAC 60TTGGGATATG ATGGTTCTGG AATCACAATA GGAATAATTG ACACTGGAAT TGACGCTTCT120CATCCAGATC TCCAAGGAAA AGTAATTGGG TGGGTAGATT TTGTCAATGG TAGGAGTTAT180CCATACGATG ACCATGGACA TGGAACTCAT GTAGCTTCAA TAGCAGCTGG TACTGGAGCA240GCAAGTAATG GCAAGTACAA GGGAATGGCT CCAGGAGCTA AGCTGGCGGG AATTAAGGTT300CTAGGTGCCG ATGGTTCTGG AAGCATATCT ACTATAATTA AGGGAGTTGA GTGGGCCGTT360GATAACAAAG ATAAGTACGG AATTAAGGTC ATTAATCTTT CTCTTGGTTC AAGCCAGAGC420TCAGATGGTA CTGACGCTCT AAGTCAGGCT GTTAATGCAG CGTGGGATGC TGGATTAGTT480GTTGTGGTTG CCGCTGGAAA CAGTGGACCT AACAAGTATA CAATCGGTTC TCCAGCAGCT540GCAAGCAAAG TTATTACAGT TGGAGCCGTT GACAAGTATG ATGTTATAAC AAGCTTCTCA600AGCAGAGGGC CAACTGCAGA CGGCAGGCTT AAGCCTGAGG TTGTTGCTCC AGGAAACTGG660ATAATTGCTG CCAGAGCAAG TGGAACTAGC ATGGGTCAAC CAATTAATGA CTATTACACA720GCAGCTCCTG GGACATCAAT GGCAACTCCT CACGTAGCTG GTATTGCAGC CCTCTTGCTC780CAAGCACACC CGAGCTGGAC TCCAGACAAA GTAAAAACAG CCCTCATAGA AACTGCTGAT840ATCGTAAAGC CAGATGAAAT AGCCGATATA GCCTACGGTG CAGGTAGGGT TAATGCATAC900AAGGCTATAA ACTACGATAA CTATGCAAAG CTAGTGTTCA CTGGATATGT TGCCAACAAA960GGCAGCCAAA CTCACCAGTT CGTTATTAGC GGAGCTTCGT TCGTAACTGC CACATTATAC 1020TGGGACAATG CCAATAGCGA CCTTGATCTT TACCTCTACG ATCCCAATGG AAACCAGGTT 1080GACTACTCTT ACACCGCCTA CTATGGATTC GAAAAGGTTG GTTATTACAA CCCAACTGAT 1140GGAACATGGA CAATTAAGGT TGTAAGCTAC AGCGGAAGTG CAAACTATCA AGTAGATGTG 1200GTAAGTGATG GTTCCCTTTC ACAGCCTGGA AGTTCA 1236
SEQ ID NO3的資料長度29類型氨基酸鏈型單鏈拓撲結構線性分子類型肽序列描述Met Arg Ser Lys Lys Leu Trp Ile Ser Leu Leu Phe Ala Leu Thr5 10 15Leu Ile Phe Thr Met Ala Phe Ser Asn Met Ser Ala Gln Ala20 25SEQ ID NO4的資料長度522類型氨基酸鏈型單鏈拓撲結構線性分子類型肽特征其它資料在428位的Xaa是Gly或Val序列描述Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala5 10 15Thr Tyr Val Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile20 25 30Gly Ile Ile Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln35 40 45Gly Lys Val Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr50 55 60
Pro Tyr Asp Asp His Gly His Gly Thr His Val Ala Ser Ile Ala65 70 75Ala Gly Thr Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala80 85 90Pro Gly Ala Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly95 100 105Ser Gly Ser Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val110 115 120Asp Asn Lys Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu125 130 135Gly Ser Ser Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala140 145 150Val Asn Ala Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala155 160 165Gly Asn Ser Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala170 175 180Ala Ser Lys Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val185 190 195Ile Thr Ser Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu200 205 210Lys Pro Glu Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg215 220 225Ala Ser Gly Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr230 235 240Ala Ala Pro Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile245 250 255
Ala Ala Leu Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys260 265 270Val Lys Thr Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp275 280 285Glu Ile Ala Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr290 295 300Lys Ala Ile Asn Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly305 310 315Tyr Val Ala Asn Lys Gly Ser Gln Thr His Gln Phe Val Ile Ser320 325 330Gly Ala Ser Phe Val Thr Ala Thr Leu Tyr Trp Asp Asn Ala Asn335 340 345Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Gln Val350 355 360Asp Tyr Ser Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr365 370 375Tyr Asn Pro Thr Asp Gly Thr Trp Thr Ile Lys Val Val Ser Tyr380 385 390Ser Gly Ser Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser395 400 405Leu Ser Gln Pro Gly Ser Ser Pro Ser Pro Gln Pro Glu Pro Thr410 415 420Val Asp Ala Lys Thr Phe Gln Xaa Ser Asp His Tyr Tyr Tyr Asp425 430 435Arg Ser Asp Thr Phe Thr Met Thr Val Asn Ser Gly Ala Thr Lys
440 445 450Ile Thr Gly Asp Leu Val Phe Asp Thr Ser Tyr His Asp Leu Asp455 460 465Leu Tyr Leu Tyr Asp Pro Asn Gln Lys Leu Val Asp Arg Ser Glu470 475 480Ser Pro Asn Ser Tyr Glu His Val Glu Tyr Leu Thr Pro Ala Pro485 490 495Gly Thr Trp Tyr Phe Leu Val Tyr Ala Tyr Tyr Thr Tyr Gly Trp500 505 510Ala Tyr Tyr Glu Leu Thr Ala Lys Val Tyr Tyr Gly515 520SEQ ID NO5的資料長度4765類型核酸鏈型雙鏈拓撲結構線性分子類型基因組DNA原始來源生物激烈熱球菌菌株DSM 3638序列描述TTTAAATTAT AAGATATAAT CACTCCGAGT GATGAGTAAG ATACATCATT ACAGTCCCAA60AATGTTTAAT ATTGGAACGC AGTGAATATA CAAAATGAAT ATAACCTCGG AGGTGACTGT 120AGAATGAATA AGAAGGGACT TACTGTGCTA TTTATAGCGA TAATGCTCCT TTCAGTAGTT 180
CCAGTGCACT TTGTGTCCGC AGAAACACCA CCGGTTAGTT CAGAAAATTC AACAACTTCT240ATACTCCCTA ACCAACAAGT TGTGACAAAA GAAGTTTCAC AAGCGGCGCT TAATGCTATA300ATGAAAGGAC AACCCAACAT GGTTCTTATA ATCAAGACTA AGGAAGGCAA ACTTGAAGAG360GCAAAAACCG AGCTTGAAAA GCTAGGTGCA GAGATTCTTG ACGAAAATAG AGTTCTTAAC420ATGTTGCTAG TTAAGATTAA GCCTGAGAAA GTTAAAGAGC TCAACTATAT CTCATCTCTT480GAAAAAGCCT GGCTTAACAG AGAAGTTAAG CTTTCCCCTC CAATTGTCGA AAAGGACGTC540AAGACTAAGG AGCCCTCCCT AGAACCAAAA ATGTATAACA GCACCTGGGT AATTAATGCT600CTCCAGTTCA TCCAGGAATT TGGATATGAT GGTAGTGGTG TTGTTGTTGC AGTACTTGAC660ACGGGAGTTG ATCCGAACCA TCCTTTCTTG AGCATAACTC CAGATGGACG CAGGAAAATT720ATAGAATGGA AGGATTTTAC AGACGAGGGA TTCGTGGATA CATCATTCAG CTTTAGCAAG780GTTGTAAATG GGACTCTTAT AATTAACACA ACATTCCAAG TGGCCTCAGG TCTCACGCTG840AATGAATCGA CAGGACTTAT GGAATACGTT GTTAAGACTG TTTACGTGAG CAATGTGACC900ATTGGAAATA TCACTTCTGC TAATGGCATC TATCACTTCG GCCTGCTCCC AGAAAGATAC960TTCGACTTAA ACTTCGATGG TGATCAAGAG GACTTCTATC CTGTCTTATT AGTTAACTCC 1020ACTGGCAATG GTTATGACAT TGCATATGTG GATACTGACC TTGACTACGA CTTCACCGAC 1080GAAGTTCCAC TTGGCCAGTA CAACGTTACT TATGATGTTG CTGTTTTTAG CTACTACTAC 1140GGTCCTCTCA ACTACGTGCT TGCAGAAATA GATCCTAACG GAGAATATGC AGTATTTGGG 1200TGGGATGGTC ACGGTCACGG AACTCACGTA GCTGGAACTG TTGCTGGTTA CGACAGCAAC 1260AATGATGCTT GGGATTGGCT CAGTATGTAC TCTGGTGAAT GGGAAGTGTT CTCAAGACTC 1320TATGGTTGGG ATTATACGAA CGTTACCACA GACACCGTGC AGGGTGTTGC TCCAGGTGCC 1380CAAATAATGG CAATAAGAGT TCTTAGGAGT GATGGACGGG GTAGCATGTG GGATATTATA 1440GAAGGTATGA CATACGCAGC AACCCATGGT GCAGACGTTA TAAGCATGAG TCTCGGTGGA 1500AATGCTCCAT ACTTAGATGG TACTGATCCA GAAAGCGTTG CTGTGGATGA GCTTACCGAA 1560AAGTACGGTG TTGTATTCGT AATAGCTGCA GGAAATGAAG GTCCTGGCAT TAACATCGTT 1620GGAAGTCCTG GTGTTGCAAC AAAGGCAATA ACTGTTGGAG CTGCTGCAGT GCCCATTAAC 1680GTTGGAGTTT ATGTTTCCCA AGCACTTGGA TATCCTGATT ACTATGGATT CTATTACTTC 1740
CCCGCCTACA CAAACGTTAG AATAGCATTC TTCTCAAGCA GAGGGCCGAG AATAGATGGT 1800GAAATAAAAC CCAATGTAGT GGCTCCAGGT TACGGAATTT ACTCATCCCT GCCGATGTGG 1860ATTGGCGGAG CTGACTTCAT GTCTGGAACT TCGATGGCTA CTCCACATGT CAGCGGTGTC 1920GTTGCACTCC TCATAAGCGG GGCAAAGGCC GAGGGAATAT ACTACAATCC AGATATAATT 1980AAGAAGGTTC TTGAGAGCGG TGCAACCTGG CTTGAGGGAG ATCCATATAC TGGGCAGAAG 2040TACACTGAGC TTGACCAAGG TCATGGTCTT GTTAACGTTA CCAAGTCCTG GGAAATCCTT 2100AAGGCTATAA ACGGCACCAC TCTCCCAATT GTTGATCACT GGGCAGACAA GTCCTACAGC 2160GACTTTGCGG AGTACTTGGG TGTGGACGTT ATAAGAGGTC TGTACGCAAG GAACTCTATA 2220CCTGACATTG TCGAGTGGCA CATTAAGTAC GTAGGGGACA CGGAGTACAG AACTTTTGAG 2280ATCTATGCAA CTGAGCCATG GATTAAGCCT TTTGTCAGTG GAAGTGTAAT TCTAGAGAAC 2340AATACCGAGT TTGTCCTTAG GGTGAAATAT GATGTAGAGG GTCTTGAGCC AGGTCTCTAT 2400GTTGGAAGGA TAATCATTGA TGATCCAACA ACGCCAGTTA TTGAAGACGA GATCTTGAAC 2460ACAATTGTTA TTCCCGAGAA GTTCACTCCT GAGAACAATT ACACCCTCAC CTGGTATGAT 2520ATTAATGGTC CAGAAATGGT GACTCACCAC TTCTTCACTG TGCCTGAGGG AGTGGACGTT 2580CTCTACGCGA TGACCACATA CTGGGACTAC GGTCTGTACA GACCAGATGG AATGTTTGTG 2640TTCCCATACC AGCTAGATTA TCTTCCCGCT GCAGTCTCAA ATCCAATGCC TGGAAACTGG 2700GAGCTAGTAT GGACTGGATT TAACTTTGCA CCCCTCTATG AGTCGGGCTT CCTTGTAAGG 2760ATTTACGGAG TAGAGATAAC TCCAAGCGTT TGGTACATTA ACAGGACATA CCTTGACACT 2820AACACTGAAT TCTCAATTGA ATTCAATATT ACTAACATCT ATGCCCCAAT TAATGCAACT 2880CTAATCCCCA TTGGCCTTGG AACCTACAAT GCGAGCGTTG AAAGCGTTGG TGATGGAGAG 2940TTCTTCATAA AGGGCATTGA AGTTCCTGAA GGCACCGCAG AGTTGAAGAT TAGGATAGGC 3000AACCCAAGTG TTCCGAATTG AGATCTAGAC TTGTACCTTT ATGACAGTAA AGGCAATTTA 3060GTGGCCTTAG ATGGAAACCC AACAGCAGAA GAAGAGGTTG TAGTTGAGTA TCCTAAGCCT 3120GGAGTTTATT CAATAGTAGT ACATGGTTAC AGCGTCAGGG ACGAAAATGG TAATCCAACG 3180ACAACCACCT TTGACTTAGT TGTTCAAATG ACCCTTGATA ATGGAAACAT AAAGCTTGAC 3240AAAGACTCGA TTATTCTTGG AAGCAATGAA AGCGTAGTTG TAACTGCAAA CATAACAATT 3300
GATAGAGATC ATCCTACAGG AGTATACTCT GGTATCATAG AGATTAGAGA TAATGAGGTC 3360TACCAGGATA CAAATACTTC AATTGCGAAA ATACCCATAA CTTTGGTAAT TGACAAGGCG 3420GACTTTGCCG TTGGTCTCAC ACCAGCAGAG GGAGTACTTG GAGAGGCTAG AAATTACACT 3480CTAATTGTAA AGCATGCCCT AACACTAGAG CCTGTGCCAA ATGCTACAGT GATTATAGGA 3540AACTACACCT ACCTCACAGA CGAAAACGGT ACAGTGACAT TCACGTATGC TCCAACTAAG 3600TTAGGCAGTG ATGAAATCAC AGTCATAGTT AAGAAAGAGA ACTTCAACAC ATTAGAGAAG 3660ACCTTCCAAA TCACAGTATC AGAGCCTGAA ATAACTGAAG AGGACATAAA TGAGCCCAAG 3720CTTGCAATGT CATCACCAGA AGCAAATGCT ACCATAGTAT CAGTTGAGAT GGAGAGTGAG 3780GGTGGCGTTA AAAAGACAGT GACAGTGGAA ATAACTATAA ACGGAACCGC TAATGAGACT 3840GCAACAATAG TGGTTCCTGT TCCTAAGAAG GCCGAAAACA TCGAGGTAAG TGGAGACCAC 3900GTAATTTCCT ATAGTATAGA GGAAGGAGAG TACGCCAAGT ACGTTATAAT TACAGTGAAG 3960TTTGCATCAC CTGTAACAGT AACTGTTACT TACACTATCT ATGCTGGCCC AAGAGTCTCA 4020ATCTTGACAC TTAACTTCCT TGGCTACTCA TGGTACAGAC TATATTCACA GAAGTTTGAC 4080GAATTGTACC AAAAGGCCCT TGAATTGGGA GTGGACAACG AGACATTAGC TTTAGCCCTC 4140AGCTACCATG AAAAAGCCAA AGAGTACTAC GAAAAGGCCC TTGAGCTTAG CGAGGGTAAC 4200ATAATCCAAT ACCTTGGAGA CATAAGACTA TTACCTCCAT TAAGACAGGC ATACATCAAT 4260GAAATGAAGG CAGTTAAGAT ACTGGAAAAG GCCATAGAAG AATTAGAGGG TGAAGAGTAA 4320TCTCCAATTT TTCCCACTTT TTCTTTTATA ACATTCCAAG CCTTTTCTTA GCTTCTTCGC 4380TCATTCTATC AGGAGTCCAT GGAGGATCAA AGGTAAGTTC AACCTCCACA TCTCTTACTC 4440CTGGGATTTC GAGTACTTTC TCCTCTACAG CTCTAAGAAG CCAGAGAGTT AAAGGACACC 4500CAGGAGTTGT CATTGTCATC TTTATATATA CCGTTTTCTC AGGATTAATC TTTAGCTCAT 4560AAATTAATCC AAGGTTTACA ACATCCATCC CAATTTCTGG GTCGATAACC TCCTTTAGCT 4620TTTCCAGAAT CATTTCTTCA GTAATTTCAA GGTTCTCATC TTTGGTTTCT CTCACAAACC 4680CAATTTCAAC CTGCCTGATA CCTTCTAACT CCCTAAGCTT GTTATATATC TCCAAAAGAG 4740TGGCATCATC AATTTTCTCT TTAAA4765
SEQ ID NO6的資料長度1398類型氨基酸鏈型單鏈拓撲結構線性分子類型肽序列描述Met Asn Lys Lys Gly Leu Thr Val Leu Phe Ile Ala Ile Met Leu5 10 15Leu Ser Val Val Pro Val His Phe Val Ser Ala Glu Thr Pro Pro20 25 30Val Ser Ser Glu Asn Ser Thr Thr Ser Ile Leu Pro Asn Gln Gln35 40 45Val Val Thr Lys Glu Val Ser Gln Ala Ala Leu Asn Ala Ile Met50 55 60Lys Gly Gln Pro Asn Met Val Leu Ile Ile Lys Thr Lys Glu Gly65 70 75Lys Leu Glu Glu Ala Lys Thr Glu Leu Glu Lys Leu Gly Ala Glu80 85 90Ile Leu Asp Glu Asn Arg Val Leu Asn Met Leu Leu Val Lys Ile95 100 105Lys Pro Glu Lys Val Lys Glu Leu Asn Tyr Ile Ser Ser Leu Glu110 115 120Lys Ala Trp Leu Asn Arg Glu Val Lys Leu Ser Pro Pro Ile Val125 130 135Glu Lys Asp Val Lys Thr Lys Glu Pro Ser Leu Glu Pro Lys Met140 145 150
Tyr Asn Ser Thr Trp Val Ile Asn Ala Leu Gln Phe Ile Gln Glu155 160 165Phe Gly Tyr Asp Gly Ser Gly Val Val Val Ala Val Leu Asp Thr170 175 180Gly Val Asp Pro Asn His Pro Phe Leu Ser Ile Thr Pro Asp Gly185 190 195Arg Arg Lys Ile Ile Glu Trp Lys Asp Phe Thr Asp Glu Gly Phe200 205 210Val Asp Thr Ser Phe Ser Phe Ser Lys Val Val Asn Gly Thr Leu215 220 225Ile Ile Asn Thr Thr Phe Gln Val Ala Ser Gly Leu Thr Leu Asn230 235 240Glu Ser Thr Gly Leu Met Glu Tyr Val Val Lys Thr Val Tyr Val245 250 255Ser Asn Val Thr Ile Gly Asn Ile Thr Ser Ala Asn Gly Ile Tyr260 265 270His Phe Gly Leu Leu Pro Glu Arg Tyr Phe Asp Leu Asn Phe Asp275 280 285Gly Asp Gln Glu Asp Phe Tyr Pro Val Leu Leu Val Asn Ser Thr290 295 300Gly Asn Gly Tyr Asp Ile Ala Tyr Val Asp Thr Asp Leu Asp Tyr305 310 315Asp Phe Thr Asp Glu Val Pro Leu Gly Gln Tyr Asn Val Thr Tyr320 325 330Asp Val Ala Val Phe Ser Tyr Tyr Tyr Gly Pro Leu Asn Tyr Val335 340 345
Leu Ala Glu Ile Asp Pro Asn Gly Glu Tyr Ala Val Phe Gly Trp350 355 360Asp Gly His Gly His Gly Thr His Val Ala Gly Thr Val Ala Gly365 370 375Tyr Asp Ser Asn Asn Asp Ala Trp Asp Trp Leu Ser Met Tyr Ser380 385 390Gly Glu Trp Glu Val Phe Ser Arg Leu Tyr Gly Trp Asp Tyr Thr395 400 405Asn Val Thr Thr Asp Thr Val Gln Gly Val Ala Pro Gly Ala Gln410 415 420Ile Met Ala Ile Arg Val Leu Arg Ser Asp Gly Arg Gly Ser Met425 430 435Trp Asp Ile Ile Glu Gly Met Thr Tyr Ala Ala Thr His Gly Ala440 445 450Asp Val Ile Ser Met Ser Leu Gly Gly Asn Ala Pro Tyr Leu Asp455 460 465Gly Thr Asp Pro Glu Ser Val Ala Val Asp Glu Leu Thr Glu Lys470 475 480Tyr Gly Val Val Phe Val Ile Ala Ala Gly Asn Glu Gly Pro Gly485 490 495Ile Asn Ile Val Gly Ser Pro Gly Val Ala Thr Lys Ala Ile Thr500 505 510Val Gly Ala Ala Ala Val Pro Ile Asn Val Gly Val Tyr Val Ser515 520 525Gln Ala Leu Gly Tyr Pro Asp Tyr Tyr Gly Phe Tyr Tyr Phe Pro530 535 540
Ala Tyr Thr Asn Val Arg Ile Ala Phe Phe Ser Ser Arg Gly Pro545 550 555Arg Ile Asp Gly Glu Ile Lys Pro Asn Val Val Ala Pro Gly Tyr560 565 570Gly Ile Tyr Ser Ser Leu Pro Met Trp Ile Gly Gly Ala Asp Phe575 580 585Met Ser Gly Thr Ser Met Ala Thr Pro His Val Ser Gly Val Val590 595 600Ala Leu Leu Ile Ser Gly Ala Lys Ala Glu Gly Ile Tyr Tyr Asn605 610 615Pro Asp Ile Ile Lys Lys Val Leu Glu Ser Gly Ala Thr Trp Leu620 625 630Glu Gly Asp Pro Tyr Thr Gly Gln Lys Tyr Thr Glu Leu Asp Gln635 640 645Gly His Gly Leu Val Asn Val Thr Lys Ser Trp Glu Ile Leu Lys650 655 660Ala Ile Asn Gly Thr Thr Leu Pro Ile Val Asp His Trp Ala Asp665 670 675Lys Ser Tyr Ser Asp Phe Ala Glu Tyr Leu Gly Val Asp Val Ile680 685 690Arg Gly Leu Tyr Ala Arg Asn Ser Ile Pro Asp Ile Val Glu Trp695 700 705His Ile Lys Tyr Val Gly Asp Thr Glu Tyr Arg Thr Phe Glu Ile710 715 720Tyr Ala Thr Glu Pro Trp Ile Lys Pro Phe Val Ser Gly Ser Val
725 730 735Ile Leu Glu Asn Asn Thr Glu Phe Val Leu Arg Val Lys Tyr Asp740 745 750Val Glu Gly Leu Glu Pro Gly Leu Tyr Val Gly Arg Ile Ile Ile755 760 765Asp Asp Pro Thr Thr Pro Val Ile Glu Asp Glu Ile Leu Asn Thr770 775 780Ile Val Ile Pro Glu Lys Phe Thr Pro Glu Asn Asn Tyr Thr Leu785 790 795Thr Trp Tyr Asp Ile Asn Gly Pro Glu Met Val Thr His His Phe800 805 810Phe Thr Val Pro Glu Gly Val Asp Val Leu Tyr Ala Met Thr Thr815 820 825Tyr Trp Asp Tyr Gly Leu Tyr Arg Pro Asp Gly Met Phe Val Phe830 835 840Pro Tyr Gln Leu Asp Tyr Leu Pro Ala Ala Val Ser Asn Pro Met845 850 855Pro Gly Asn Trp Glu Leu Val Trp Thr Gly Phe Asn Phe Ala Pro860 865 870Leu Tyr Glu Ser Gly Phe Leu Val Arg Ile Tyr Gly Val Glu Ile875 880 885Thr Pro Ser Val Trp Tyr Ile Asn Arg Thr Tyr Leu Asp Thr Asn890 895 900Thr Glu Phe Ser Ile Glu Phe Asn Ile Thr Asn Ile Tyr Ala Pro905 910 915
Ile Asn Ala Thr Leu Ile Pro Ile Gly Leu Gly Thr Tyr Asn Ala920 925 930Ser Val Glu Ser Val Gly Asp Gly Glu Phe Phe Ile Lys Gly Ile935 940 945Glu Val Pro Glu Gly Thr Ala Glu Leu Lys Ile Arg Ile Gly Asn950 955 960Pro Ser Val Pro Asn Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Ser965 970 975Lys Gly Asn Leu Val Ala Leu Asp Gly Asn Pro Thr Ala Glu Glu980 985 990Glu Val Val Val Glu Tyr Pro Lys Pro Gly Val Tyr Ser Ile Val99510001005Val His Gly Tyr Ser Val Arg Asp Glu Asn Gly Asn Pro Thr Thr101010151020Thr Thr Phe Asp Leu Val Val Gln Met Thr Leu Asp Asn Gly Asn102510301035Ile Lys Leu Asp Lys Asp Ser Ile Ile Leu Gly Ser Asn Glu Ser104010451050Val Val Val Thr Ala Asn Ile Thr Ile Asp Arg Asp His Pro Thr105510601065Gly Val Tyr Ser Gly Ile Ile Glu Ile Arg Asp Asn Glu Val Tyr107010751080Gln ASp Thr Asn Thr Ser Ile Ala Lys Ile Pro Ile Thr Leu Val108510901095Ile Asp Lys Ala Asp Phe Ala Val Gly Leu Thr Pro Ala Glu Gly
110011051110Val Leu Gly Glu Ala Arg Asn Tyr Thr Leu Ile Val Lys His Ala111511201125Leu Thr Leu Glu Pro Val Pro Asn Ala Thr Val Ile Ile Gly Asn113011351140Tyr Thr Tyr Leu Thr Asp Glu Asn Gly Thr Val Thr Phe Thr Tyr114511501155Ala Pro Thr Lys Leu Gly Ser Asp Glu Ile Thr Val Ile Val Lys116011651170Lys Glu Asn Phe Asn Thr Leu Glu Lys Thr Phe Gln Ile Thr Val117511801185Ser Glu Pro Glu Ile Thr Glu Glu Asp Ile Asn Glu Pro Lys Leu119011951200Ala Met Ser Ser Pro Glu Ala Asn Ala Thr Ile Val Ser Val Glu120512101215Met Glu Ser Glu Gly Gly Val Lys Lys Thr Val Thr Val Glu Ile122012251230Thr Ile Asn Gly Thr Ala Asn Glu Thr Ala Thr Ile Val Val Pro123512401245Val Pro Lys Lys Ala Glu Asn Ile Glu Val Ser Gly Asp His Val125012551260Ile Ser Tyr Ser Ile Glu Glu Gly Glu Tyr Ala Lys Tyr Val Ile126512701275Ile Thr Val Lys Phe Ala Ser Pro Val Thr Val Thr Val Thr Tyr128012851290
Thr Ile Tyr Ala Gly Pro Arg Val Ser Ile Leu Thr Leu Asn Phe129513001305Leu Gly Tyr Ser Trp Tyr Arg Leu Tyr Ser Gln Lys Phe Asp Glu131013151320Leu Tyr Gln Lys Ala Leu Glu Leu Gly Val Asp Asn Glu Thr Leu132513301335Ala Leu Ala Leu Ser Tyr His Glu Lys Ala Lys Glu Tyr Tyr Glu134013451350Lys Ala Leu Glu Leu Ser Glu Gly Asn Ile Ile Gln Tyr Leu Gly135513601365ASp Ile Arg Leu Leu Pro Pro Leu Arg Gln Ala Tyr Ile Asn Glu137013751380Met Lys Ala Val Lys Ile Leu Glu Lys Ala Ile Glu Glu Leu Glu138513901395Gly Glu GluSEQ ID NO7的資料長度35類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸(合成的DNA)序列描述GGWWSDRRTG TTRRHGTHGC DGTDMTYGAC ACBGG 35SEQ ID NO8的資料長度32類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸(合成的DNA)序列描述KSTCACGGAA CTCACGTDGC BGGHACDGTT GC 32SEQ ID NO9的資料長度33類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸(合成的DNA)序列描述ASCMGCAACH GTKCCVGCHA CGTGAGTTCC GTG 33SEQ ID NO10的資料長度34類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸(合成的DNA)序列描述CHCCGSYVAC RTGBGGAGWD GCCATBGAVG TDCC 34SEQ ID NO11的資料長度1977類型核酸鏈型雙鏈拓撲結構線性分子類型基因組DNA原始來源生物速生熱球菌菌株DSM 2476序列描述ATGAAGAGGT TAGGTGCTGT GGTGCTGGCA CTGGTGCTCG TGGGTCTTCT GGCCGGAACG 60GCCCTTGCGG CACCCGTAAA ACCGGTTGTC AGGAACAACG CGGTTCAGCA GAAGAACTAC120GGACTGCTGA CCCCGGGACT GTTCAAGAAA GTCCAGAGGA TGAACTGGAA CCAGGAAGTG180GACACCGTCA TAATGTTCGG GAGCTACGGA GACAGGGACA GGGCGGTTAA GGTACTGAGG240CTCATGGGCG CCCAGGTCAA GTACTCCTAC AAGATAATCC CTGCTGTCGC GGTTAAAATA300AAGGCCAGGG ACCTTCTGCT GATCGCGGGC ATGATAGACA CGGGTTACTT CGGTAACACA360AGGGTCTCGG GCATAAAGTT CATACAGGAG GATTACAAGG TTCAGGTTGA CGACGCCACT420TCCGTCTCCC AGATAGGGGC CGATACCGTC TGGAACTCCC TCGGCTACGA CGGAAGCGGT480GTGGTGGTTG CCATCGTCGA TACGGGTATA GACGCGAACC ACCCCGATCT GAAGGGCAAG540GTCATAGGCT GGTACGACGC CGTCAACGGC AGGTCGACCC CCTACGATGA CCAGGGACAC600GGAACCCACG TTGCGGGTAT CGTTGCCGGA ACCGGCAGCG TTAACTCCCA GTACATAGGC660GTCGCCCCCG GCGCGAAGCT CGTCGGCGTC AAGGTTCTCG GTGCCGACGG TTCGGGAAGC720GTCTCCACCA TCATCGCGGG TGTTGACTGG GTCGTCCAGA ACAAGGACAA GTACGGGATA780AGGGTCATCA ACCTCTCCCT CGGCTCCTCC CAGAGCTCCG ACGGAACCGA CTCCCTCAGT840CAGGCCGTCA ACAACGCCTG GGACGCCGGT ATAGTAGTCT GCGTCGCCGC CGGCAACAGC900GGGCCGAACA CCTACACCGT CGGCTCACCC GCCGCCGCGA GCAAGGTCAT AACCGTCGGT960GCAGTTGACA GCAACGACAA CATCGCCAGC TTCTCCAGCA GGGGACCGAC CGCGGACGGA 1020AGGCTCAAGC CGGAAGTCGT CGCCCCCGGC GTTGACATCA TAGCCCCGCG CGCCAGCGGA 1080ACCAGCATGG GCACCCCGAT AAACGACTAC TACACCAAGG CCTCTGGAAC CAGCATGGCC 1140ACCCCGCACG TTTCGGGCGT TGGCGCGCTC ATCCTCCAGG CCCACCCGAG CTGGACCCCG 1200GACAAGGTGA AGACCGCCCT CATCGAGACC GCCGACATAG TCGCCCCCAA GGAGATAGCG 1260GACATCGCCT ACGGTGCGGG TAGGGTGAAC GTCTACAAGG CCATCAAGTA CGACGACTAC 1320GCCAAGCTCA CCTTCACCGG CTCCGTCGCC GACAAGGGAA GCGCCACCCA CACCTTCGAC 1380GTCAGCGGCG CCACCTTCGT GACCGCCACC CTCTACTGGG ACACGGGCTC GAGCGACATC 1440
GACCTCTACC TCTACGACCC CAACGGGAAC GAGGTTGACT ACTCCTACAC CGCCTACTAC 1500GGCTTCGAGA AGGTCGGCTA CTACAACCCG ACCGCCGGAA CCTGGACGGT CAAGGTCGTC 1560AGCTACAAGG GCGCGGCGAA CTACCAGGTC GACGTCGTCA GCGACGGGAG CCTCAGCCAG 1620TCCGGCGGCG GCAACCCGAA TCCAAACCCC AACCCGAACC CAACCCCGAC CACCGACACC 1680CAGACCTTCA CCGGTTCCGT TAACGACTAC TGGGACACCA GCGACACCTT CACCATGAAC 1740GTCAACAGCG GTGCCACCAA GATAACCGGT GACCTGACCT TCGATACTTC CTACAACGAC 1800CTCGACCTCT ACCTCTACGA CCCCAACGGC AACCTCGTTG ACAGGTCCAC GTCGAGCAAC 1860AGCTACGAGC ACGTCGAGTA CGCCAACCCC GCCCCGGGAA CCTGGACGTT CCTCGTCTAC 1920GCCTACAGCA CCTACGGCTG GGCGGACTAC CAGCTCAAGG CCGTCGTCTA CTACGGG 1977SEQ ID NO12的資料長度659類型氨基酸鏈型單鏈拓撲結構線性分子類型肽序列描述Met Lys Arg Leu Gly Ala Val Val Leu Ala Leu Val Leu Val Gly5 10 15Leu Leu Ala Gly Thr Ala Leu Ala Ala Pro Val Lys Pro Val Val20 25 30Arg Asn Asn Ala Val Gln Gln Lys Asn Tyr Gly Leu Leu Thr Pro35 40 45Gly Leu Phe Lys Lys Val Gln Arg Met Asn Trp Asn Gln Glu Val50 55 60Asp Thr Val Ile Met Phe Gly Ser Tyr Gly Asp Arg Asp Arg Ala65 70 75
Val Lys Val Leu Arg Leu Met Gly Ala Gln Val Lys Tyr Ser Tyr80 85 90Lys Ile Ile Pro Ala Val Ala Val Lys Ile Lys Ala Arg Asp Leu95 100 105Leu Leu Ile Ala Gly Met Ile Asp Thr Gly Tyr Phe Gly Asn Thr110 115 120Arg Val Ser Gly Ile Lys Phe Ile Gln Glu Asp Tyr Lys Val Gln125 130 135Val Asp Asp Ala Thr Ser Val Ser Gln Ile Gly Ala Asp Thr Val140 145 150Trp Asn Ser Leu Gly Tyr Asp Gly Ser Gly Val Val Val Ala Ile155 160 165Val Asp Thr Gly Ile Asp Ala Asn His Pro Asp Leu Lys Gly Lys170 175 180Val Ile Gly Trp Tyr Asp Ala Val Asn Gly Arg Ser Thr Pro Tyr185 190 195Asp Asp Gln Gly His Gly Thr His Val Ala Gly Ile Val Ala Gly200 205 210Thr Gly Ser Val Asn Ser Gln Tyr Ile Gly Val Ala Pro Gly Ala215 220 225Lys Leu Val Gly Val Lys Val Leu Gly Ala Asp Gly Ser Gly Ser230 235 240Val Ser Thr Ile Ile Ala Gly Val Asp Trp Val Val Gln Asn Lys245 250 255Asp Lys Tyr Gly Ile Arg Val Ile Asn Leu Ser Leu Gly Ser Ser260 265 270
Gln Ser Ser Asp Gly Thr Asp Ser Leu Ser Gln Ala Val Asn Asn275 280 285Ala Trp Asp Ala Gly Ile Val Val Cys Val Ala Ala Gly Asn Ser290 295 300Gly Pro Asn Thr Tyr Thr Val Gly Ser Pro Ala Ala Ala Ser Lys305 310 315Val Ile Thr Val Gly Ala Val Asp Ser Asn Asp Asn Ile Ala Ser320 325 330Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu Lys Pro Glu335 340 345Val Val Ala Pro Gly Val Asp Ile Ile Ala Pro Arg Ala Ser Gly350 355 360Thr Ser Met Gly Thr Pro Ile Asn Asp Tyr Tyr Thr Lys Ala Ser365 370 375Gly Thr Ser Met Ala Thr Pro His Val Ser Gly Val Gly Ala Leu380 385 390Ile Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys Val Lys Thr395 400 405Ala Leu Ile Glu Thr Ala Asp Ile Val Ala Pro Lys Glu Ile Ala410 415 420Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Val Tyr Lys Ala Ile425 430 435Lys Tyr Asp Asp Tyr Ala Lys Leu Thr Phe Thr Gly Ser Val Ala440 445 450
Asp Lys Gly Ser Ala Thr His Thr Phe Asp Val Ser Gly Ala Thr455 460 465Phe Val Thr Ala Thr Leu Tyr Trp Asp Thr Gly Ser Ser Asp Ile470 475 480Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Glu Val Asp Tyr Ser485 490 495Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr Tyr Asn Pro500 505 510Thr Ala Gly Thr Trp Thr Val Lys Val Val Ser Tyr Lys Gly Ala515 520 525Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser Leu Ser Gln530 535 540Ser Gly Gly Gly Asn Pro Asn Pro Asn Pro Asn Pro Asn Pro Thr545 550 555Pro Thr Thr Asp Thr Gln Thr Phe Thr Gly Ser Val Asn Asp Tyr560 565 570Trp Asp Thr Ser Asp Thr Phe Thr Met Asn Val Asn Ser Gly Ala575 580 585Thr Lys Ile Thr Gly Asp Leu Thr Phe Asp Thr Ser Tyr Asn Asp590 595 600Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Leu Val Asp Arg605 610 615Ser Thr Ser Ser Asn Ser Tyr Glu His Val Glu Tyr Ala Asn Pro620 625 630Ala Pro Gly Thr Trp Thr Phe Leu Val Tyr Ala Tyr Ser Thr Tyr635 640 645
Gly Trp Ala Asp Tyr Gln Leu Lys Ala Val Val Tyr Tyr Gly650 655SEQ ID NO13的資料長度28類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸(合成的DNA)序列描述AGAGGGATCC ATGAAGGGGC TGAAAGCT 28SEQ ID NO14的資料長度28類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸(合成的DNA)序列描述AGAGGCATGC GCTCTAGACT CTGGGAGAGT 28SEQ ID NO15的資料長度1962類型核酸鏈型雙鏈拓撲結構線性分子類型基因組DNA原始來源生物激烈熱球菌菌株DSM 3638
序列描述ATGAAGGGGC TGAAAGCTCT CATATTAGTG ATTTTAGTTC TAGGTTTGGT AGTAGGGAGC60GTAGCGGCAG CTCCAGAGAA GAAAGTTGAA CAAGTAAGAA ATGTTGAGAA GAACTATGGT 120CTGCTAACGC CAGGACTGTT CAGAAAAATT CAAAAATTGA ATCCTAACGA GGAAATCAGC 180ACAGTAATTG TATTTGAAAA CCATAGGGAA AAAGAAATTG CAGTAAGAGT TCTTGAGTTA 240ATGGGTGCAA AAGTTAGGTA TGTGTACCAT ATTATACCCG CAATAGCTGC CGATCTTAAG 300GTTAGAGACT TACTAGTCAT CTCAGGTTTA ACAGGGGGTA AAGCTAAGCT TTCAGGTGTT 360AGGTTTATCC AGGAAGACTA CAAAGTTACA GTTTCAGCAG AATTAGAAGG ACTGGATGAG 420TCTGCAGCTC AAGTTATGGC AACTTACGTT TGGAACTTGG GATATGATGG TTCTGGAATC 480ACAATAGGAA TAATTGACAC TGGAATTGAC GCTTCTCATC CAGATCTCCA AGGAAAAGTA 540ATTGGGTGGG TAGATTTTGT CAATGGTAGG AGTTATCCAT ACGATGACCA TGGACATGGA 600ACTCATGTAG CTTCAATAGC AGCTGGTACT GGAGCAGCAA GTAATGGCAA GTACAAGGGA 660ATGGCTCCAG GAGCTAAGCT GGCGGGAATT AAGGTTCTAG GTGCCGATGG TTCTGGAAGC 720ATATCTACTA TAATTAAGGG AGTTGAGTGG GCCGTTGATA ACAAAGATAA GTACGGAATT 780AAGGTCATTA ATCTTTCTCT TGGTTCAAGC CAGAGCTCAG ATGGTACTGA CGCTCTAAGT 840CAGGCTGTTA ATGCAGCGTG GGATGCTGGA TTAGTTGTTG TGGTTGCCGC TGGAAACAGT 900GGACCTAACA AGTATACAAT CGGTTCTCCA GCAGCTGCAA GCAAAGTTAT TACAGTTGGA 960GCCGTTGACA AGTATGATGT TATAACAAGC TTCTCAAGCA GAGGGCCAAC TGCAGACGGC 1020AGGCTTAAGC CTGAGGTTGT TGCTCCAGGA AACTGGATAA TTGCTGCCAG AGCAAGTGGA 1080ACTAGCATGG GTCAACCAAT TAATGACTAT TACACAGCAG CTCCTGGGAC ATCAATGGCA 1140ACTCCTCACG TAGCTGGTAT TGCAGCCCTC TTGCTCCAAG CACACCCGAG CTGGACTCCA 1200GACAAAGTAA AAACAGCCCT CATAGAAACT GCTGATATCG TAAAGCCAGA TGAAATAGCC 1260GATATAGCCT ACGGTGCAGG TAGGGTTAAT GCATACAAGG CTATAAACTA CGATAACTAT 1320GCAAAGCTAG TGTTCACTGG ATATGTTGCC AACAAAGGCA GCCAAACTCA CCAGTTCGTT 1380ATTAGCGGAG CTTCGTTCGT AACTGCCACA TTATACTGGG ACAATGCCAA TAGCGACCTT 1440GATCTTTACC TCTACGATCC CAATGGAAAC CAGGTTGACT ACTCTTACAC CGCCTACTAT 1500
GGATTCGAAA AGGTTGGTTA TTACAACCCA ACTGATGGAA CATGGACAAT TAAGGTTGTA 1560AGCTACAGCG GAAGTGCAAA CTATCAAGTA GATGTGGTAA GTGATGGTTC CCTTTCACAG 620CCTGGAAGTT CACCATCTCC ACAACCAGAA CCAACAGTAG ACGCAAAGAC GTTCCAAGGA 1680TCCGATCACT ACTACTATGA CAGGAGCGAC ACCTTTACAA TGACCGTTAA CTCTGGGGCT 1740ACAAAGATTA CTGGAGACCT AGTGTTTGAC ACAAGCTACC ATGATCTTGA CCTTTACCTC 1800TACGATCCTA ACCAGAAGCT TGTAGATAGA TCGGAGAGTC CCAACAGCTA CGAACACGTA 1860GAATACTTAA CCCCCGCCCC AGGAACCTGG TACTTCCTAG TATATGCCTA CTACACTTAC 1920GGTTGGGCTT ACTACGAGCT GACGGCTAAA GTTTATTATG GC 1962SEQ ID NO16的資料長度654類型氨基酸鏈型單鏈拓撲結構線性分子類型肽序列描述Met Lys Gly Leu Lys Ala Leu Ile Leu Val Ile Leu Val Leu Gly5 10 15Leu Val Val Gly Ser Val Ala Ala Ala Pro Glu Lys Lys Val Glu20 25 30Gln Val Arg Asn Val Glu Lys Asn Tyr Gly Leu Leu Thr Pro Gly35 40 45Leu Phe Arg Lys Ile Gln Lys Leu Asn Pro Asn Glu Glu Ile Ser50 55 60Thr Val Ile Val Phe Glu Asn His Arg Glu Lys Glu Ile Ala Val65 70 75Arg Val Leu Glu Leu Met Gly Ala Lys Val Arg Tyr Val Tyr His80 85 90
Ile Ile Pro Ala Ile Ala Ala Asp Leu Lys Val Arg Asp Leu Leu95 100 105Val Ile Ser Gly Leu Thr Gly Gly Lys Ala Lys Leu Ser Gly Val110 115 120Arg Phe Ile Gln Glu Asp Tyr Lys Val Thr Val Ser Ala Glu Leu125 130 135Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala Thr Tyr Val140 145 150Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile Gly Ile Ile155 160 165Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln Gly Lys Val170 175 180Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr Pro Tyr Asp185 190 195Asp His Gly His Gly Thr His Val Ala Ser Ile Ala Ala Gly Thr200 205 210Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala Pro Gly Ala215 220 225Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly Ser Gly Ser230 235 240Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val Asp Asn Lys245 250 255Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu Gly Ser Ser260 265 270Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala Val Asn Ala275 280 285Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala Gly Asn Ser
290 295 300Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala Ala Ser Lys305 310 315Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val Ile Thr Ser320 325 330Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu Lys Pro Glu335 340 345Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg Ala Ser Gly350 355 360Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr Ala Ala Pro365 370 375Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile Ala Ala Leu380 385 390Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys Val Lys Thr395 400 405Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp Glu Ile Ala410 415 420Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr Lys Ala Ile425 430 435Asn Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly Tyr Val Ala440 445 450Asn Lys Gly Ser Gln Thr His Gln Phe Val Ile Ser Gly Ala Ser455 460 465Phe Val Thr Ala Thr Leu Tyr Trp Asp Asn Ala Asn Ser Asp Leu470 475 480
Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Gln Val Asp Tyr Ser485 490 495Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr Tyr Asn Pro500 505 510Thr Asp Gly Thr Trp Thr Ile Lys Val Val Ser Tyr Ser Gly Ser515 520 525Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser Leu Ser Gln530 535 540Pro Gly Ser Ser Pro Ser Pro Gln Pro Glu Pro Thr Val Asp Ala545 550 555Lys Thr Phe Gln Gly Ser Asp His Tyr Tyr Tyr Asp Arg Ser Asp560 565 570Thr Phe Thr Met Thr Val Asn Ser Gly Ala Thr Lys Ile Thr Gly575 580 585Asp Leu Val Phe Asp Thr Ser Tyr His Asp Leu Asp Leu Tyr Leu590 595 600Tyr Asp Pro Asn Gln Lys Leu Val Asp Arg Ser Glu Ser Pro Asn605 610 615Ser Tyr Glu His Val Glu Tyr Leu Thr Pro Ala Pro Gly Thr Trp620 625 630Tyr Phe Leu Val Tyr Ala Tyr Tyr Thr Tyr Gly Trp Ala Tyr Tyr635 640 645Glu Leu Thr Ala Lys Val Tyr Tyr Gly650
SEQ ID NO17的資料長度25類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸(合成的DNA)序列描述TCTGAATTCG TTCTTTTCTG TATGG 25SEQ ID NO18的資料長度20類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸(合成的DNA)序列描述TGTACTGCTG GATCCGGCAG 20SEQ ID NO19的資料長度25類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸(合成的DNA)序列描述AGAGGCATGC GTATCCATCA GATTTTTGAG30SEQ ID NO20的資料長度20類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸(合成的DNA)序列描述AGTGAACGGA TACTTGGAAC 20SEQ ID NO21的資料長度20類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸(合成的DNA)序列描述GTTCCAAGTA TCCGTTCACT 20SEQ ID NO22的資料長度12類型氨基酸鏈型單鏈拓撲結構線性分子類型肽序列描述Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln5 10SEQ ID NO23的資料長度24類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸(合成的DNA)
序列描述TCATGGATCC ACCCTCTCCT TTTA 24SEQ ID NO24的資料長度26類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸(合成的DNA)序列描述GTCTGCGCAG GCTGCCGGAN NNNNNATGAA GGGGCTGAAA GCTCTC 26SEQ ID NO25的資料長度29類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸(合成的DNA)序列描述GAGAGCTTTC AGCCCCTTCA TNNNNNNTCC GGCAGCCTGC GCAGACATG29SEQ ID NO26的資料長度27類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸(合成的DNA)序列描述AGAGGGGGAT CCGTGAGAAG CAAAAAA 27
SEQ ID NO27的資料長度20類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸(合成的DNA)序列描述GATGACTAGT AAGTCTCTAA 20SEQ ID NO28的資料長度20類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸(合成的DNA)序列描述AAGCCTGAGG TTGTTGCTCC 20SEQ ID NO29的資料長度29類型核酸鏈型單鏈拓撲結構線性分子類型其它核酸(合成的DNA)序列描述GGGCATGCTC ATGAACTTCC AGGCTGTGA 29
權利要求
1.一種編碼由通式I所示的氨基酸序列的基因SIG-Ala-Gly-Gly-Asn-PRO [I]其中SIG表示來源于枯草桿菌蛋白酶的信號肽的氨基酸序列,PRO表示被表達的蛋白的氨基酸序列。
2.根據權利要求1的基因,其中SIG是由序列表SEQ ID NO3表示的氨基酸序列。
3.根據權利要求1的基因,其中PRO是一種來源于超嗜熱菌的超熱穩定蛋白酶的氨基酸序列。
4.根據權利要求3的基因,其中PRO是一種來源于激烈熱球菌的蛋白酶的氨基酸序列。
5.根據權利要求4的基因,其中PRO包括序列表SEQ ID NO1表示的氨基酸序列,或包括由如下氨基酸序列組成并具有熱穩定蛋白酶活性的蛋白酶的氨基酸序列,在該氨基酸序列中,一個或多個氨基酸殘基從由序列表SEQ ID NO4表示的氨基酸序列的C-末端缺失。
6.根據權利要求5的基因,它包含在選自pSPO124或pSPO124ΔC的質粒中。
7.根據權利要求1的基因,其中PRO包括序列表SEQ ID NO1表示的氨基酸序列。
8.一種產生蛋白的方法,包括培養導入了根據權利要求1至7中任一項的基因的芽孢桿菌屬細菌,并從該培養物中收集目的蛋白。
9.根據權利要求8產生蛋白的方法,其中芽孢桿菌屬細菌是枯草芽孢桿菌。
10.根據權利要求8產生蛋白的方法,其中借助于質粒載體把根據權利要求1至7中任一項的基因導入到芽孢桿菌屬的細菌中。
11.根據權利要求10產生蛋白的方法,其中選自pSPO124或pSPO124ΔC的質粒被導入到芽孢桿菌屬細菌中。
12.根據權利要求11產生蛋白的方法,包括培養枯草芽孢桿菌DB104/pSPO124ΔC FERM P-16227,并從該培養物中收集目的蛋白。
13.一種把根據權利要求1至7中任一項的基因插入其中的質粒載體。
14.根據權利要求13的質粒載體,它選pSPO124或pSPO124ΔC。
全文摘要
一種具有由序列表SEQ ID NO1表示的氨基酸序列或經缺失、替換、插入或添加一個至幾個氨基酸殘基從其產生的序列的超熱穩定蛋白酶,一種編碼該超熱穩定蛋白酶的基因和一種制備該蛋白酶的方法,目的是通過遺傳工程技術提供一種有利于工業應用的超熱穩定的蛋白酶。
文檔編號C12N15/75GK1657614SQ200410101968
公開日2005年8月24日 申請日期1998年6月4日 優先權日1997年6月10日
發明者高蔵晃, 森下美緒, 下條智子, 淺田起代蔵, 加藤郁之進 申請人:寶生物工程株式會社