本申請要求2014年5月13日提交的美國臨時申請系列號61/992,794的優先權,其公開通過引用以其整體并入本文。
技術領域
本文公開了從十二酰-[acp]生物合成己二酰-[acp]和己酸的方法和從辛酰-[acp]生物合成己二酰-[acp]的方法。使用具有庚二酰-[acp]合酶活性的多肽和例如具有醛脫氫酶活性的多肽,如在表達一種或多種此類多肽的重組宿主細胞中生物合成該產物。本文還公開了使用具有脫氫酶,還原酶,單加氧酶,轉氨酶,N-乙酰轉移酶,脫酰基酶或硫酯酶活性的一種或多種分離的多肽,或使用表達一種或多種此類多肽的重組宿主細胞將己二酰-[acp]和/或己酸轉化為C6單體,如己二酸,6-氨基己酸,六亞甲基二胺,6-羥基己酸,己內酰胺或1,6-己二醇(下文稱為“C6結構單元”(buiding blocks))的方法。
發明背景
尼龍是聚酰胺,其有時通過二胺與二羧酸的縮聚(condensation polymerization)合成。類似地,尼龍可通過內酰胺的縮聚生成。一種普遍存在的尼龍是尼龍6,6,其通過六亞甲基二胺(HMD)和己二酸的反應生成。尼龍6可通過己內酰胺的開環聚合生成。因此,己二酸,六亞甲基二胺和己內酰胺是尼龍的生產中的重要中間體(Anton&Baird,Polyamides Fibers,Encyclopedia of Polymer Science and Technology,2001)。
工業上,己二酸和己內酰胺通過環己烷的空氣氧化生產。環己烷的空氣氧化在一系列的步驟中產生環己酮(K)和環己醇(A)的混合物,命名為KA油。KA油的硝酸氧化產生己二酸(Musser,Adipic acid,Ullmann’s Encyclopedia of Industrial Chemistry,2000)。己內酰胺由環己酮經它的肟重排和隨后的酸重排制備(Fuchs,Kieczka and Moran,Caprolactam,Ullmann’s Encyclopedia of Industrial Chemistry,2000)。
工業上,通過將C6結構單元氫氰化成己二腈,然后氫化成HMD來制備六亞甲基二胺(HMD)(Herzog and Smiley,Hexamethylenediamine,Ullmann’s Encyclopedia of Industrial Chemistry,2012)。
鑒于對石油化學原料的依賴;生物技術提供了通過生物催化的替代方法。生物催化是使用生物催化劑如酶來進行有機化合物的生物化學轉化。
生物衍生的原料和石油化工原料兩者都是生物催化工藝的可行起始材料。
因而,針對此背景,明顯的是需要用于生產己二酸、己內酰胺、6-氨基己酸、6-羥基己酸、六亞甲基二胺和1,6-己二醇(下文稱為“C6結構單元”)的可持續的方法,其中所述方法是基于生物催化的(Jang等,Biotechnol.Bioeng.,2012,109(10),2437–2459)。
然而,無野生型的原核生物或真核生物天然地過度生產或分泌C6結構單元到細胞外環境。但是,己二酸和己內酰胺的代謝已有報道(Ramsay等,Appl.Environ.Microbiol.,1986,52(1),152–156;以及Kulkarni和Kanekar,Current Microbiology,1998,37,191–194)。
一些細菌和酵母將二羧酸,己二酸作為碳源通過β-氧化高效轉化為中心代謝產物。CoA己二酸至3-氧代己二酸的β-氧化促進經由與例如芳香族底物降解相關的鄰位裂解途徑的。由幾種細菌和真菌將3-氧代己二酰-CoA轉化為乙酰-CoA和琥珀酰-CoA的分解代謝已經全面表征(Harwood和Parales,Annual Review of Microbiology,1996,50,553–590)。己二酸和6-氨基己酸都是己內酰胺的分解代謝中的中間物,最終經3-氧代己二酰-CoA降解為中心代謝產物。
已經提出了由生物質-糖生產己二酸的潛在的代謝途徑:(1)以生物化學的方式通過鄰位裂解芳香族降解途徑從葡萄糖轉化成順式,順式-粘康酸,然后化學催化成己二酸;(2)通過琥珀酰-CoA和乙酰-CoA的縮合的可逆己二酸降解途徑和(3)組合β-氧化、脂肪酸合成酶和ω-氧化。然而,沒有報道過使用這些策略的信息(Jang等,Biotechnology&Bioengineering,2012,109(10),2437–2459)。
最優性原理指出,微生物調節它們的生物化學網絡來支持最大生物質(biomass)生長。超出在宿主生物體中表達異源性途徑的需要,將碳通量引導至充當碳源的C6結構單元而非生物質生長組分與最優性原理矛盾。例如,將1-丁醇途徑從梭菌屬物種轉移至其它生產菌株中,其與天然生產者(native producer)的生產性能相比,經常缺乏一個數量級(Shen等,Appl.Environ.Microbiol.,2011,77(9),2905–2915)。
在C6脂族主鏈上形成末端官能團如羧基、胺或者羥基之前,作為中心前體的六碳脂族主鏈的高效合成是合成C6結構單元中的關鍵考慮因素。
發明簡述
本申請至少部分地基于以下發現:可構建用于生產六碳鏈式脂族主鏈前體的生物化學途徑,在其中可形成一個或兩個官能團,即羧基、胺或者羥基,導致以下一種或者多種物質的合成:己二酸、6-氨基己酸、六亞甲基二胺、6-羥基己酸、己內酰胺或1,6-己二醇(下文稱為“C6結構單元”)。己二酸和己二酸鹽(酯),乙酸和乙酸鹽(酯),6-羥基己酸和6-羥基己酸鹽(酯),6-氨基己酸和6-氨基己酸鹽(酯)在本文中可替換使用,指代以其任意中性或離子化形式的化合物,包括其任意的鹽形式。本領域的技術人員應當理解具體的形式將依賴于pH。本文描述的這些途徑、代謝工程和培養策略依賴于脂肪酸合成酶或類似酶或和多肽,其具有接受C8或C12酰基-[acp]底物并氧化切割所述底物的C6和C7碳之間的C-C鍵的能力,以在當辛酰基-[acp]是底物時產生6-氧己酰-[acp]和乙醛或當十二酰基-[acp]是底物時產生6-氧己酰-[acp]和己醛。具有接受C8或C12酰基-[acp]底物并氧化切割所述底物的C6和C7碳之間的C-C鍵的能力的多肽(本文稱為庚二酰-[acp]合酶)可以與由來自枯草芽孢桿菌(bacillus subtilis)的bioI編碼的野生型庚二酰-[acp]合酶具有至少70%的序列同一性。野生型庚二酰-[acp]合酶通常氧化切割酰基-[acp]底物的C7和C8碳之間的C-C鍵。
面對最優性原理,令人驚訝地發現,可將適當的非天然途徑、原料、宿主微生物、對宿主的生物化學網絡的弱化策略和培養策略組合起來,從而高效地生產一種或多種C6結構單元。
在一些實施方案中,用于轉化為C6結構單元的C6脂族主鏈可以從脂肪酸合成中產生的十二酰基-[acp]或辛酰基-[acp]形成。見圖1。
在一些實施方案中,可以使用具有硫酯酶活性的多肽或具有醛脫氫酶活性的多肽酶促形成末端羧基。見圖2。
在一些實施方案中,可以使用具有ω-轉氨酶活性的多肽或具有二胺轉氨酶活性的多肽酶促形成末端胺基。見圖3,圖4,圖5和圖6。與己內酰胺相關的酰胺鍵是首先在直鏈碳鏈上具有末端羧基和末端胺基以形成鍵的結果。
在一些實施方案中,可以使用具有烷烴1-單加氧酶活性或具有醇脫氫酶活性的多肽酶促形成末端羥基。見圖7和圖8。
在一個方面,本申請特征在于在重組宿主中生物合成己二酰-[acp]的方法。所述方法包括使用具有庚二酰-[acp]合酶活性的多肽在宿主中將十二酰基-[acp]酶轉化為己二酰-[acp]和己酸,其中具有庚二酰-[acp]合酶活性的多肽接受十二酰基-[acp]作為底物并氧化切割底物的C6和C7碳之間的C-C鍵;或使用具有庚二酰-[acp]合酶活性的多肽在宿主中將辛酰基-[acp]酶促轉化成己二酰-[acp]和乙酸,其中具有庚二酰-[acp]合酶活性的多肽接受辛酰基-[acp]并氧化切割底物的C6和C7碳之間的C-C鍵。具有庚二酰-[acp]合酶活性的多肽可以與SEQ ID NO:23所示的氨基酸序列具有至少70%,至少80%或至少90%的序列同一性。該方法可以包括使用具有醛脫氫酶活性的多肽以將具有庚二酰-[acp]合酶活性的多肽的切割產物轉化為(i)己二酰-[acp]和己酸或(ii)己二酰-[acp]和乙酸酯。具有醛脫氫酶活性的多肽可以分類在EC 1.2.1.4或EC 1.2.1.3下。
本文公開的方法還可以包括使用至少一種具有選自醛脫氫酶,烷烴1-單加氧酶,硫酯酶,ω-轉氨酶,羧酸還原酶,N-酰基轉移酶,脫酰基酶,和醇脫氫酶的活性的多肽,酶促轉化己二酰-[acp]或己酸為選自下組的產物:己酸,己內酰胺,6-羥基己酸,6-氨基己酸,六亞甲基二胺和1,6-己二醇。
例如,該方法進一步可以包括使用具有硫酯酶活性的多肽將己二酰-[acp]酶促轉化為己二酸。具有硫酯酶活性的多肽可以與SEQ ID NO:1或SEQ ID NO:2中列出的氨基酸序列具有至少70%的序列同一性。
例如,本文所述的任何方法還可以包括使用至少一種具有選自(i)烷烴1-單加氧酶;(ii)醇脫氫酶;和(iii)醛脫氫酶的活性的多肽,將己酸酶促轉化為己二酸。具有醛脫氫酶活性的多肽可以分類在EC 1.2.1.3,EC 1.2.1.16,EC 1.2.1.20,EC 1.2.1.63或EC 1.2.1.79下和/或具有醇脫氫酶活性的多肽可以分類在EC 1.1.1.2或EC 1.1.1.258下。
例如,本文所述的任何方法還可以包括使用至少一種具有選自下組活性的多肽將己酸酶促轉化成6-氨基己酸:(i)烷烴1-單加氧酶;(ii)醇脫氫酶;和(iii)ω-轉氨酶。
例如,本文所述的任何方法還可以包括使用至少一種具有選自以下的活性的多肽將己二酸酶促轉化為6-氨基己酸:(i)羧酸還原酶;和(ii)ω-轉氨酶。
例如,本文所述的任何方法還可以包括使用至少一種具有選自以下的活性的多肽將己二酸或6-氨基己酸酶促轉化為六亞甲基二胺:(i)羧酸還原酶;和(ii)ω-轉氨酶。
例如,本文所述的任何方法還可以包括使用至少一種具有選自以下的活性的多肽將6-氨基己酸酶促轉化為六亞甲基二胺:(i)N-乙酰轉移酶;(ii)羧酸還原酶;(iii)ω-轉氨酶;和(iv)脫酰基酶。
例如,本文所述的任何方法還可以包括使用具有烷烴1-單加氧酶活性的多肽將己酸酶促轉化成6-羥基己酸。具有烷烴1-單加氧酶活性的多肽可以與SEQ ID NO:16-18中任一項所示的氨基酸序列具有至少70%的序列同一性。
例如,本文所述的任何方法還可以包括使用至少一種具有選自下組的活性的多肽將己二酸酶促轉化為6-羥基己酸:(i)羧酸還原酶;和(ii)醇脫氫酶。
例如,本文所述的任何方法還可以包括使用至少一種具有選自下組的活性的多肽將6-羥基己酸酶促轉化為六亞甲基二胺:(i)羧酸還原酶;(ii)ω-轉氨酶;和(iii)醇脫氫酶。
例如,本文所述的任何方法還可以包括使用至少一種具有選自下組的活性的多肽將6-羥基己酸酶促轉化為1,6-己二醇:(i)羧酸還原酶和(ii)醇脫氫酶。
例如,本文所述的任何方法還可以包括使用具有羧酸還原酶活性的多肽將己二酸酶促轉化為己二酸半醛。
例如,本文所述的任何方法還可以包括使用具有醇脫氫酶活性的多肽將6-羥基己酸酶促轉化為己二酸半醛。
例如,本文所述的任何方法還可包括使用至少一種具有選自(i)羧酸還原酶和(ii)轉氨酶的活性的多肽將己二酸半醛酶促轉化為六亞甲基二胺。
在任何所述方法中,具有羧酸還原酶活性的多肽可以與SEQ ID NO:3-7中中任一項所示的氨基酸序列具有至少70%的序列同一性,或者具有ω-轉氨酶活性的多肽可以具有與SEQ ID NO:8-13中中任一項所示的氨基酸序列具有至少70%的序列同一性。
在一些是實施方案中,生物原料可以是或源自單糖,二糖,木質纖維素、半纖維素、纖維素、木質素、乙酰丙酸和甲酸、甘油三酯、甘油、脂肪酸、農業廢物、濃縮酒糟(condensed distillers'solubles)或城市廢物。
在一些實施方案中,非生物原料可以是或可以源自天然氣、合成氣、CO2/H2、甲醇、乙醇、苯甲酸鹽(酯)、非揮發性殘留物(NVR)或來自環己烷氧化過程的堿洗液(caustic wash)廢物流、或對苯二甲酸/異酞酸混合物廢物流。
本文所述途徑的反應可以在一種或多種細胞(例如宿主細胞)株中進行,所述細胞株(a)天然表達一種或多種相關酶,(b)經遺傳工程化而表達一種或多種相關酶,或(c)天然表達一種或多種相關酶并經遺傳工程化而表達一種或多種相關酶。或者,可以從以上任意類型的宿主細胞中提取相關酶,并以純化或半純化形式使用。提取的酶可選地固定在固體基質上,例如適合的反應容器的底和/或壁。此外,這些提取物包括可以作為相關酶來源使用的裂解物(如細胞裂解物)。在本申請提供的方法中,所有步驟可以在細胞(例如宿主細胞)中進行,所有步驟可以使用提取的酶進行,或一些步驟可以在細胞中進行,而其它步驟可以使用提取的酶進行。
本文所述的多種酶催化可逆反應,并且感興趣的反應可以是所述反應的反向。圖1-8所示的示意性途徑闡明了對于每種中間物感興趣的反應。
在一些實施方案中,經由在選擇性環境中的連續培養改善所述宿主對高濃度一種或多種C6結構單元的耐受性。
在一些實施方案中,弱化或增強所述宿主的內源性生物化學網絡,來(1)保證乙酰-CoA和丙二酰-CoA的細胞內可用度,(2)創造NADH不平衡,其僅可通過脂肪酸合成和一種或多種C6結構單元的形成平衡,(3)阻止通向并包括C6結構單元的中心代謝物和中心前體的降解和(4)保證從細胞的高效流出。
在一些實施方案中,培養策略需要達到需氧或微氧的培養條件。
在一些實施方案中,培養策略需要經由氮,磷酸鹽或氧限制的營養限制。
在一些實施方案中,培養策略需要防止脂肪酸摻入脂質體或其它碳儲存單元中。
在一些實施方案中,使用例如發酵策略,通過單一類型的微生物,例如含有一種或多種外源核酸的重組宿主,產生一種或多種C6結構單元。
本申請的特征還在于包含至少一種編碼具有庚二酰-[acp]合酶活性的多肽的外源核酸的重組宿主,所述宿主產生:(a)己二酰-[acp]和己酸,其中所述具有庚二酰-[acp]合酶活性的多肽接受十二酰基-[acp]作為底物并氧化切割底物的C6和C7碳之間的CC鍵;或[b]己二酰-[acp],其中具有庚二酰-[acp]合酶活性的多肽接受辛酰基-[acp]作為底物,并氧化切割底物的C6和C7碳之間的C-C鍵。具有庚二酰-[acp]合酶活性的多肽可以與SEQ ID NO:23所示的氨基酸序列具有至少70%,至少80%或至少90%的序列同一性。
宿主還可以包括具有醛脫氫酶活性的外源多肽。
宿主還可以包括一種或多種具有選自烷烴1-單加氧酶,硫酯酶,醇脫氫酶和醛脫氫酶的活性的外源多肽,所述宿主產生己二酸。
宿主還可以包括具有羧酸還原酶活性的外源多肽和具有ω-轉氨酶活性的外源多肽,所述宿主產生6-氨基己酸。
產生6-氨基己酸的重組宿主還可以包括具有水解酶活性的外源多肽,所述宿主產生己內酰胺。
宿主還可以包括一種或多種具有選自烷烴1-單加氧酶,硫酯酶,羧酸還原酶和醇脫氫酶的活性的外源多肽,所述宿主產生6-羥基己酸。
宿主還可以包括至少一種具有選自烷烴1-單加氧酶,硫酯酶,羧酸還原酶和醇脫氫酶的活性的外源多肽,所述宿主產生己二酸半醛。宿主還可以包括至少一種具有ω-轉氨酶活性的外源多肽,所述宿主產生六亞甲基二胺。
宿主還可以包括至少一種具有選自N-乙酰轉移酶和脫酰基酶的活性的外源多肽,所述宿主產生六亞甲基二胺。
宿主可以包括(i)至少一種具有烷烴1-單加氧酶活性的外源多肽,至少一種具有醇脫氫酶活性的外源多肽,至少一種具有ω-轉氨酶活性的外源多肽和至少一種具有羧酸還原酶活性的多肽或(ii)至少一種具有硫酯酶活性的外源多肽,至少一種具有羧酸還原酶活性的多肽和至少一種具有ω-轉氨酶活性的外源多肽,宿主產生六亞甲基二胺。
宿主可以包括(i)至少一種具有羧酸還原酶活性的外源多肽,至少一種具有醇脫氫酶活性的外源多肽和至少一種具有烷烴1-單加氧酶活性的多肽,或(ii)至少一種具有羧酸還原酶活性的多肽,至少一種具有醇脫氫酶活性的外源多肽和至少一種具有硫酯酶活性的外源多肽,所述宿主產生1,6己二醇。
在任何方法或宿主中,具有硫酯酶活性的多肽可以與SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列具有至少70%的序列同一性。
在任何方法或宿主中,具有烷烴1-單加氧酶活性的多肽可以與SEQ ID NO:16-18中中任一項所示的氨基酸序列具有至少70%的序列同一性。
在任何方法或宿主中,具有羧酸還原酶活性的多肽與SEQ ID NO:3-7中中任一項所示的氨基酸序列具有至少70%的序列同一性。
在任何方法或宿主中,具有ω-轉氨酶活性的多肽可以與SEQ ID NO:8-13中中任一項所示的氨基酸序列具有至少70%的序列同一性。
任何重組宿主可以是原核生物,如來自選自下組的屬的原核生物:埃希氏菌屬(Escherichia);梭菌屬(Clostridia);棒狀桿菌屬(Corynebacteria);貪銅菌屬(Cupriavidus);假單胞菌屬(Pseudomonas);代爾夫特菌屬(Delftia);芽孢桿菌屬(Bacilluss);乳桿菌屬(Lactobacillus);乳球菌屬(Lactococcus);和紅球菌屬(Rhodococcus)。例如,所述原核生物可以選自下組:大腸桿菌(Escherichia coli)、楊氏梭菌(Clostridium ljungdahlii)、自產乙醇梭菌(Clostridium autoethanogenum)、克魯佛梭菌(Clostridium kluyveri)、谷氨酸棒狀桿菌(Corynebacterium glutamicum)、鉤蟲貪銅菌(Cupriavidus necator)、耐金屬貪銅菌(Cupriavidus metallidurans)、熒光假單胞菌(Pseudomonas fluorescens)、惡臭假單胞菌(Pseudomonas putida)、食油假單胞菌(Pseudomonas oleavorans)、食酸代爾夫特菌(Delftia acidovorans)、枯草芽胞桿菌(Bacillus subtillis)、德氏乳桿菌(Lactobacillus delbrueckii)、乳酸乳球菌(Lactococcus lactis)、和馬紅球菌(Rhodococcus equi)。此類原核生物也可以是構建能夠生成C6結構單元的本文中描述的重組宿主細胞的基因來源。
任何宿主可以是真核生物,例如來自選自下組的屬的真核生物:曲霉屬(Aspergillus)、酵母屬(Saccharomyces)、畢赤氏酵屬(Pichia)、耶羅維亞酵母屬(Yarrowia)、伊薩酵母屬(Issatchenkia)、德巴利酵母屬(Debaryomyces)、Arxula、和克魯維酵母菌屬(Kluyveromyces)。例如,所述真核生物可以選自下組:黑曲霉(Aspergillus niger)、釀酒酵母(Saccharomyces cerevisiae)、巴斯德畢赤酵母(Pichia pastoris)、解脂耶羅維亞酵母(Yarrowia lipolytica)、東方伊薩酵母(Issathenkia orientalis)、漢遜德巴利酵母(Debaryomyces hansenii)、Arxula adenoinivorans、和乳酸克魯維酵母菌(Kluyveromyces lactis)。此類真核生物也可以是構建能夠生成C6結構單元的本文中描述的重組宿主細胞的基因來源。
本文所述任何宿主還可以包含一種或多種以下酶的弱化:聚羥基烷酸酯(polyhydroxyalkanoate)合酶,形成乙酸的磷酸乙酸轉移酶,乙酸激酶,乳酸脫氫酶,形成乙醇的醇脫氫酶,丙糖磷酸異構酶,NADH消耗型轉氫酶,NADH特異性谷氨酸脫氫酶,和NADH/NADPH利用型谷氨酸脫氫酶。
本文所述任何宿主還可以過表達編碼以下的一種或多種基因:乙酰-CoA合成酶,6-磷酸葡萄糖酸脫氫酶;轉酮醇酶;吡啶(puridine)核苷酸轉氫酶;甘油醛-3P-脫氫酶;蘋果酸酶;葡萄糖-6-磷酸脫氫酶;葡萄糖脫氫酶;果糖1,6二磷酸酶;L-丙氨酸脫氫酶;L-谷氨酸脫氫酶;甲酸脫氫酶;L-谷氨酰胺合成酶;二胺轉運體;二羧酸轉運體;和/或多藥物轉運體。
此外,本文描述了包含具有庚二酰-[acp]合酶活性的多肽和十二烷酰基-[acp]的生物化學網絡,其中具有庚二酰-[acp]合酶活性的多肽將十二酰基-[acp]酶促轉化為己醛或6-氧代己酰-[acp]。生物化學網絡可以進一步包括具有醛脫氫酶活性的多肽,其中具有醛脫氫酶活性的多肽進一步將己醛和6-氧代己酰-[acp]分別轉化成己酸和己二酰-[acp]。
此外,本文描述了包含具有庚二酰基-[acp]合酶活性的多肽和辛酰基-[acp]的生物化學網絡,其中具有庚二酰基-[acp]合酶活性的多肽將辛酰基-[acp]酶促轉化為乙醛和6-氧代己酰基-[acp]。生物化學網絡可以進一步包括具有醛脫氫酶活性的多肽,其中具有醛脫氫酶活性的多肽進一步分別將乙醛和6-氧代己酰基-[acp]轉化為乙酸和己二酰基-[acp]。
任何生物化學網絡可進一步包括具有醛脫氫酶活性的多肽,具有單加氧化酶活性的多肽,具有硫酯酶活性的多肽,具有ω-轉氨酶活性的多肽,具有羧酸還原酶活性的多肽,具有二胺轉氨酶活性的多肽,具有N-乙酰轉移酶活性的多肽,具有賴氨酸N-乙酰轉移酶活性,具有脫酰酶活性的多肽或具有醇脫氫酶多肽活性的多肽,其中所述具有醛脫氫酶活性的多肽,所述具有單加氧酶活性的多肽,所述具有硫酯酶活性德多肽,所述具有ω-轉氨酶活性的多肽,所述具有羧酸還原酶活性的多肽,具有二胺轉氨酶活性的多肽,具有N-乙酰轉移酶活性的多肽,具有賴氨酸N-乙酰轉移酶活性的多肽,具有脫酰基酶活性的多肽或具有醇脫氫酶活性的多肽將己二酰-[acp]和/或己酸酶轉化為己二酸,6-氨基己酸,己內酰胺,六亞甲基二胺,6-羥基己酸和1,6-己二醇中的至少一種。
此外,本文描述了使用具有庚二酰基-[acp]合酶的多肽獲得己醛和6-氧己酰基-[acp]的手段(means)。該手段還可以包括將己醛和6-氧己酰基-[acp]分別轉化為己酸和己二酰-[acp]的手段。
此外,本文描述了使用具有庚二酰-[acp]合酶活性的多肽獲得乙醛和6-氧己酰基-[acp]的手段。該手段還可以包括將乙醛和6-氧代己酰基-[acp]分別轉化成乙酸和己二酰基-[acp]的手段。
所述方法可以包括使用具有醛脫氫酶活性的多肽。該方法還可以包括將己二酰-[acp]或己酸轉化成己二酸,6-氨基己酸,己內酰胺,六亞甲基二胺,6-羥基己酸和1,6-己二醇中的至少一種的手段。所述手段可以包括具有醛脫氫酶活性的多肽,具有單硫氧化酶活性的多肽,具有硫酯酶活性的多肽,具有ω-轉氨酶活性的多肽,具有羧酸還原酶活性的多肽,具有二胺轉氨酶活性的多肽,具有N-乙酰轉移酶活性的多肽,具有賴氨酸N-乙酰轉移酶活性的多肽,具有脫酰基酶活性的多肽或具有醇脫氫酶活性的多肽
此外,本文描述的是使用具有庚二酰基-[acp]合酶活性的多肽獲得己二酰-[acp]或己酸的步驟。
另一方面,本申請的特征在于包含己醛和6-氧代己酰基-[acp]和具有庚二酰基-[acp]合酶活性的多肽的組合物。另一方面,本申請的特征在于包含乙醛和6-氧代己酰基-[acp]和具有庚二酰基-[acp]合酶活性的多肽的組合物。
組合物可以是無細胞的或細胞的。所述組合物還可包括具有醛脫氫酶活性的多肽,具有單加氧酶活性的多肽,具有硫酯酶活性的多肽,具有ω-轉氨酶活性的多肽,具有羧酸還原酶活性的多肽,具有二胺轉氨酶活性的多肽,具有N-乙酰轉移酶活性的多肽,具有賴氨酸N-乙酰轉移酶活性的多肽,具有脫酰基酶活性的多肽或具有醇脫氫酶活性的多肽和己二酸,6-氨基己酸,己內酰胺,六亞甲基二胺,6-羥基己酸和1,6-己二醇中的至少一種。
本申請還描述了用于生產生物衍生的己二酰-[acp],己酸,己二酸,己內酰胺,6-羥基己酸,6-氨基己酸,六亞甲基二胺或1,6-己二醇的方法,其包括在條件下培養或生長本文所述的任何重組宿主足夠的時間段以產生生物衍生的己二酰-[acp],己酸,己二酸,己內酰胺,6-羥基己酸,6-氨基己酸,六亞甲基二胺或1,6-己二醇。
在另一方面,本文特征為包含生物衍生的己二酰-[acp],己二酸,己內酰胺,6-羥基己酸,6-氨基己酸,六亞甲基二胺或1,6-己二醇的培養基,其中生物衍生的己二酰-[acp],己二酸,己內酰胺,6-羥基己酸,6-氨基己酸,六亞甲基二胺或1,6-己二醇具有反映大氣二氧化碳攝取來源的碳-12,碳-13和碳-14同位素比率。可以從重組宿主分離培養基。
本申請的特征還在于生物衍生的己二酰-[acp],己二酸,己內酰胺,6-羥基己酸,6-氨基己酸,六亞甲基二胺或1,6-己二醇,其具有反映大氣二氧化碳攝取源的碳-12,碳-13和碳-14同位素比率,優選通過生長本文所述的重組宿主生產。生物衍生的己二酰-[acp],己二酸,己內酰胺,6-羥基己酸,6-氨基己酸,六亞甲基二胺或1,6-己二醇可具有至少80%,至少85%,至少90%,至少95%或至少98%的Fm值。
在另一方面,本申請特征在于組合物,其包含生物衍生的己二酰-[acp],己二酸,己內酰胺,6-羥基己酸,6-氨基己酸,六亞甲基二胺或1,6-己二醇和不同于生物來源的己二酰-[acp],己二酸,己內酰胺,6-羥基己酸,6-氨基己酸,六亞甲基二胺或1,6-己二醇的化合物。不同于生物衍生的己二酰-[acp],己二酸,己內酰胺,6-羥基己酸,6-氨基己酸,六亞甲基二胺或1,6-己二醇的化合物可以是痕量的本文所述重組宿主的細胞部分。
本申請特征還在于包含本文所述的生物衍生的己二酸,己內酰胺,6-羥基己酸,6-氨基己酸,六亞甲基二胺或1,6-己二醇的生物基聚合物(biobased polymer)以及通過模制(molding)生物基聚合物獲得的模制產品。
本申請特征還在于了包含本文所述的生物衍生的己二酸,己內酰胺,6-羥基己酸,6-氨基己酸,六亞甲基二胺或1,6-己二醇的生物基樹脂以及通過模制生物基樹脂獲得的模制產品。
在另一方面,本申請的特征在于生產生物基聚合物的方法,其包括使生物衍生的己二酸,己內酰胺,6-羥基己酸,6-氨基己酸,六亞甲基二胺或1,6-己二醇與其自身或另一種化合物在聚合物生成反應中起化學反應。
在另一方面,該文獻的特征在于生產生物基樹脂的方法,其包括使生物衍生的己二酸,己內酰胺,6-羥基己酸,6-氨基己酸,六亞甲基二胺或1,6-己二醇與其自身或另一種化合物在樹脂生成反應中起化學反應。
除非另有定義,否則本文使用的所有技術和科學術語具有與本發明所屬領域的普通技術人員通常理解的相同的含義。盡管與本文所述的方法和材料類似或等同的方法和材料可用于實施本發明,但下文描述了合適的方法和材料。本文提及的所有出版物,專利申請,專利和其它參考文獻通過引用以其整體并入。在沖突的情況下,以本說明書包括定義為準。此外,材料,方法和實施例僅僅是說明性的,而不是限制性的。
在附圖和下面的描述中闡述了本發明的一個或多個實施例的細節。本發明的其它特征,目的和優點將從說明書和附圖以及權利要求書中顯而易見。根據專利法中的標準實踐,權利要求中的詞語“包括”可以被“基本上由...組成”或由“由...組成”替代。
附圖簡述
圖1是使用十二酰基-[acp]作為示例性長鏈脂肪酸中心代謝物導致己二酰-[acp]和己酸的示例性生物化學途徑的示意圖,以及使用辛酰基-[acp]作為示例性長鏈脂肪酸中心代謝物導致己二酰-[acp]和乙酸的示例性生物化學途徑的示意圖。
圖2是使用己二酰-[acp]或己酸作為中心前體導致己二酸的示例性生物化學途徑的示意圖。
圖3是使用己二酰-[acp]或己酸作為中心前體導致6-氨基己酸的示例性生物化學途徑的示意圖。圖3還包含從6-氨基己酸產生己內酰胺的示意圖。
圖4是使用6-氨基己酸或己二酸半醛(也稱為6-氧代己酸)作為中心前體導致六亞甲基二胺的示例性生物化學途徑的示意圖。
圖5是使用6-氨基己酸作為中心前體導致六亞甲基二胺的示例性生物化學途徑的示意圖。
圖6是使用6-羥基己酸作為中心前體的導致六亞甲基二胺的示例性生物化學途徑的示意圖。
圖7是使用己二酰-[acp]或己酸作為中心前體導致6-羥基己酸的示例性生物化學途徑的示意圖。
圖8是使用6-羥基己酸作為中心前體導致1,6-己二醇的示例性生物化學途徑的示意圖。
圖9是總結20分鐘后在340nm處的吸光度變化的柱狀圖,其是相對于僅酶對照(無底物)的NADPH的消耗和羧酸還原酶的活性的量度。
圖10是20分鐘后340nm處吸光度變化的柱狀圖,其是相對于空載體對照的NADPH的消耗和羧酸鹽還原酶將己二酸轉化為己二酸半醛的活性的量度。
圖11是20分鐘后340nm處吸光度變化的柱狀圖,其是相對于空載體對照的NADPH的消耗和將6-羥基己酸轉化為6-羥基己醛的羧酸還原酶的活性的量度。
圖12是20分鐘后在340nm處的吸光度變化的柱狀圖,其是相對于空載體對照的NADPH的消耗和將N6-乙酰基-6-氨基己酸轉化為N6-乙酰基-6-氨基己醛的羧酸還原酶的活性的量度。
圖13是20分鐘后340nm處吸光度變化的柱狀圖,其是相對于空載體對照的NADPH的消耗和將己二酸半醛轉化為己二醛的羧酸還原酶的活性的量度。
圖14是總結了4小時后丙酮酸轉化為L-丙氨酸的轉化百分比(mol/mol)的柱狀圖,作為僅酶對照(無底物)的ω-轉氨酶活性的量度。
圖15是24小時后丙酮酸鹽轉化為L-丙氨酸后的轉化百分比(mol/mol)的柱狀圖,作為相對于空載體對照的將6-氨基己酸轉化為己二酸半醛的ω-轉氨酶活性的量度。
圖16是4小時后L-丙氨酸轉化為丙酮酸的轉化百分比(mol/mol)的柱狀圖,作為相對于空載體對照,將己二酸半醛轉化為6-氨基己酸的ω-轉氨酶活性的量度。
圖17是4小時后丙酮酸轉化為L-丙氨酸的轉化百分比(mol/mol)的柱狀圖,作為相對于空載體對照,將六亞甲基二胺轉化為6-氨基己醛的ω-轉氨酶活性的量度。
圖18是4小時后丙酮酸轉化為L-丙氨酸的轉化百分比(mol/mol)的柱狀圖,作為相對于空載體對照,將N6-乙酰基-1,6-二氨基己烷轉化為N6-乙酰基-6-氨基己醛的ω-轉氨酶活性的量度。
圖19是4小時后丙酮酸轉化為L-丙氨酸的轉化百分比(mol/mol)的柱狀圖,作為相對于空載體對照,將6-氨基己醇轉化為6-氧代己醇的ω-轉氨酶活性的量度。
圖20是如通過LC-MS測定的6-羥基己酸的峰面積變化的柱狀圖,作為相對于空載體對照,將己酸轉化為6-羥基己酸的單加氧酶活性的量度。
圖21含有短乳桿菌硫酯酶(參見GenBank登錄號ABJ63754.1,SEQ ID NO:1),植物乳桿菌硫酯酶(參見GenBank登錄號CCC78182.1,SEQ ID NO:2),海分枝桿菌羧酸還原酶(參見Genbank登錄號ACC40567.1,SEQ ID NO:3),恥垢分枝桿菌羧酸還原酶(參見Genbank登錄號ABK71854.1,SEQ ID NO:4),Segniliparus rugosus羧酸還原酶(參見Genbank登錄號EFV11917.1,SEQ ID NO:5),馬賽分枝桿菌(Mycobacterium massiliense)羧酸還原酶(參見Genbank登錄號EIV11143.1,SEQ ID NO:6),Segniliparus rotundus羧酸還原酶(參見Genbank登錄號ADG98140.1,SEQ ID NO:7),紫色色桿菌ω-轉氨酶(參見Genbank登錄號AAQ59697.1,SEQ ID NO:8),銅綠假單胞菌ω-轉氨酶(參見Genbank登錄號AAG08191.1,SEQ ID NO:9),丁香假單胞菌ω-轉移酶(參見Genbank登錄號AAY39893.1,SEQ ID NO:10),球形紅細菌ω-轉移酶(參見Genbank登錄號ABA81135.1,SEQ ID NO:11),大腸桿菌ω-轉移酶(參見Genbank登錄號AAA57874.1,SEQ ID NO:12),河流孤菌ω-轉移酶(參見Genbank登錄號AEA39183.1,SEQ ID NO:13),枯草芽孢桿菌磷酸泛酰巰基乙胺基轉移酶(參見Genbank登錄號CAA44858.1,SEQ ID NO:14),諾卡氏菌屬物種NRRL 5646磷酸泛酰巰基乙胺基轉移酶(參見Genbank登錄號ABI83656.1,SEQ ID NO:15),單胞菌屬物種JS666單加氧酶(參見Genbank登錄號ABE47160.1,SEQ ID NO:16),分枝桿菌屬物種HXN-1500單加氧酶(參見Genbank登錄號CAH04396.1,SEQ ID NO:17),南非分支桿菌(Mycobacterium austroafricanum)單加氧酶(參見Genbank登錄號ACJ06772.1,SEQ ID NO:18),單胞菌屬物種JS666氧化還原酶(參見Genbank登錄號ABE47159.1,SEQ ID NO:19),分枝桿菌屬物種HXN-1500氧化還原酶(參見Genbank登錄號CAH04397.1,SEQ ID NO:20),單胞菌屬物種JS666鐵氧還原蛋白(參見Genbank登錄號ABE47158.1,SEQ ID NO:21),分枝桿菌屬物種HXN-1500鐵氧還蛋白(參見Genbank登錄號CAH04398.1,SEQ ID NO:22)和由bioI編碼的枯草芽孢桿菌庚二酰-[acp]合酶(參見Genbank登錄號AAB17462.1,SEQ ID NO:23)。
發明詳述
本文描述了酶、非天然途徑、培養策略、原料、宿主微生物和對宿主的生物化學網絡的弱化,從中心代謝產物生成六碳鏈式脂族主鏈,在所述六碳鏈式脂族主鏈中可形成一個或兩個末端官能團,導致己二酸、6-氨基己酸、6-羥基乙酸、六亞甲基二胺、己內酰胺或1,6-己二醇(本文稱為“C6結構單元”)的合成。如本文所使用的,術語“中心前體”用于表示本文所示的導致C6結構單元合成的任意代謝途徑中的任意代謝產物。術語“中心代謝產物”用于本文表示在所有微生物中生產以支持生長的代謝產物。
本文所述的宿主微生物可以包括能夠操作,使得能生產一種或多種C6結構單元的內源性途徑。在內源性途徑中,所述宿主微生物天然表達催化所述途徑中反應的所有酶。含有工程化途徑的宿主微生物不天然表達催化所述途徑中反應的所有酶,但已經過工程化使得所述途徑中的所有的酶在所述宿主中表達。
如本文中提及核酸(或蛋白質)和宿主使用的,術語“外源”指不像其在自然界中被發現一樣存在于特定類型細胞中(并且不能從特定類型細胞獲得)的核酸或由所述核酸編碼的蛋白質。如此,非天然存在的核酸一旦在宿主中即視為對于宿主而言外源的。重要的是注意非天然存在的核酸可含有在自然界中發現的核酸序列的核酸亞序列或片段,只要該核酸作為整體不存在于自然界中。例如,表達載體內含有基因組DNA序列的核酸分子是非天然存在的核酸,如此一旦導入宿主中對于宿主細胞而言是外源的,因為該核酸分子作為整體(基因組DNA加載體DNA)不存在于自然界中。如此,作為整體不存在于自然界中的任何載體、自主復制的質粒或病毒(例如逆轉錄病毒、腺病毒、或皰疹病毒)視為非天然存在的核酸。由此得出結論通過PCR或限制內切性核酸酶處理產生的基因組DNA片段以及cDNA也視為非天然存在的核酸,因為它們作為未見于自然界的分開的分子存在。由此還得出結論任何以未見于自然界中的排布含有啟動子序列和多肽編碼序列(例如cDNA或基因組DNA)的任何核酸也是非天然存在的核酸。天然存在的核酸可以是對于特定宿主微生物而言外源的。例如,從酵母x的細胞分離的完整染色體一旦將該染色體導入酵母y的細胞中就酵母y細胞而言是外源核酸。
比較而言,如本文中提及核酸(例如基因)(或蛋白質)和宿主使用的,術語“內源的”指就像其在自然界中被發現一樣的確存在于特定宿主中(并且可以從特定宿主獲得)的核酸(或蛋白質)。此外,“內源表達”核酸(或蛋白質)的細胞就像其在自然界中被發現時相同特定類型的宿主那樣表達所述核酸(或蛋白質)。此外,“內源生成”核酸、蛋白質、或其它化合物的宿主就像其在自然界中被發現時相同特定類型的宿主那樣生成所述核酸、蛋白質、或化合物。
例如,根據宿主和由宿主產生的化合物,除了具有庚二酰-[acp]合酶活性的多肽之外,還可以在宿主中表達一種或多種以下多肽:具有醛脫氫酶活性的多肽,具有烷烴1-單加氧酶活性的多肽,具有硫酯酶活性的多肽,具有ω-轉氨酶活性的多肽,具有羧酸還原酶活性的多肽,具有水解酶活性的多肽,具有二胺轉氨酶活性的多肽,具有N-乙酰轉移酶活性的多肽,具有賴氨酸N-乙酰轉移酶活性的多肽,具有脫酰基酶活性的多肽,或具有醇脫氫酶活性的多肽。在表達具有羧酸還原酶活性的多肽的重組宿主中,也可以具有磷酸泛酰巰基乙胺基轉移酶活性的多肽,因為它增強羧酸還原酶活性的活性。在表達具有單加氧酶活性的多肽的重組宿主中,還可以表達電子轉移鏈蛋白,如具有氧化還原酶活性的多肽或鐵氧還蛋白多肽。
例如,重組宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽并產生6-氧代己酰-[acp]和己醛或乙醛,這取決于十二酰基-[acp]或辛酰基-[acp]是否是具有庚二酰-[acp]合酶活性的多肽的底物。
例如,重組宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽和具有醛脫氫酶活性的外源多肽,并且產生(i)己二酰-[acp]和己酸或(ii)己二酰-[acp]和乙酸,這取決于十二酰基-[acp]或辛酰基-[acp]是否是具有庚二酰-[acp]合酶活性的多肽的底物。在其中十二酰基-[acp]是重組宿主中具有庚二酰-[acp]合酶活性的多肽的底物的實施方案中,可以產生己二酰基-[acp]和己酸。在其中辛酰基-[acp]是重組宿主中具有庚二酰-[acp]合酶活性的多肽的底物的實施方案中,可以產生己二酰-[acp]和乙酸。
例如,重組宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脫氫酶活性的外源多肽和具有硫酯酶活性的外源多肽,并產生己二酸。參見例如圖2。
例如,重組宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脫氫酶活性的外源多肽,以及至少一種選自下組的多肽:(i)具有烷烴1-單加氧酶活性的外源多肽,(ii)具有醇脫氫酶活性的外源多肽和(iii)具有醛脫氫酶活性的多肽并產生己二酸。在一些實施方案中,宿主包括具有不同醛脫氫酶活性的兩種或更多種外源多肽。參見例如圖2。
例如,重組宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脫氫酶活性的外源多肽,以及至少一種選自下組的多肽(i)具有烷烴1-單加氧酶活性的外源多肽,(ii)具有醇脫氫酶活性的外源多肽,(iii)具有硫酯酶活性的外源多肽,并產生己二酸。在一些實施方案中,宿主包括具有不同醛脫氫酶活性的兩種或更多種外源多肽。參見例如圖2。
例如,重組宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脫氫酶活性的外源多肽,具有烷烴1-單加氧酶活性的外源多肽和具有醇脫氫酶活性的外源多肽,并產生己二酸半醛。參見例如圖2。
例如,重組體可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脫氫酶活性的外源多肽,具有硫酯酶活性的外源多肽和具有羧酸還原酶活性的外源多肽,并產生己二酸半醛。參見例如圖3。
例如,重組宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脫氫酶活性的外源多肽,以及至少一種選自下組的外源多肽:具有硫酯酶活性的外源多肽,具有羧酸還原酶活性的外源多肽,和具有ω-轉氨酶活性的多肽,并產生6-氨基己酸。例如,重組宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脫氫酶活性的外源多肽,具有硫酯酶活性的外源多肽,具有羧酸還原酶活性的外源多肽和具有ω-轉氨酶活性的外源多肽,并產生6-氨基己酸。參見圖3。
例如,重組宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脫氫酶活性的外源多肽和至少一種選自下組的外源多肽:具有烷烴1-單加氧酶活性的多肽,具有醇脫氫酶活性的多肽,具有ω-轉氨酶活性的多肽,并產生6-氨基己酸。參見圖3。
例如,重組宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脫氫酶活性的外源多肽,以及至少一種選自下組的外源多肽:具有烷烴1-單加氧酶活性的多肽,具有醇脫氫酶活性的多肽,具有ω-轉氨酶活性的多肽,具有硫酯酶活性的外源多肽和具有羧酸還原酶活性的外源多肽,并產生6-氨基己酸。例如,重組宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脫氫酶活性的外源多肽,具有烷烴1-單加氧酶活性的外源多肽,具有醇脫氫酶活性的外源多肽,具有硫酯酶活性的外源多肽,具有羧酸還原酶活性的多肽,以及具有ω-轉氨酶活性的外源多肽,并產生6-氨基己酸。參見圖3。
例如,產生6-氨基己酸的重組宿主還可以包括具有酰胺水解酶(amidohydrolase)活性的外源多肽并產生己內酰胺。參見圖3。
例如,產生6-氨基己酸的重組宿主可包括具有羧酸還原酶活性的外源多肽和具有ω轉氨酶活性的外源多肽,并產生六亞甲基二胺。具有羧酸還原酶活性的外源多肽可以是具有羧酸還原酶活性的第二外源多肽。第二外源羧酸還原酶可以與第一外源羧酸還原酶相同或不同。具有ω轉氨酶活性的外源多肽可以是具有ω轉氨酶活性的第二外源多肽。具有ω轉氨酶活性的第二外源多肽可以與具有ω轉氨酶活性的第一外源多肽相同或不同。參見圖4。
例如,產生己二酸半醛的重組宿主還可以包括具有羧酸還原酶活性的外源多肽和具有轉氨酶活性的外源多肽,并產生六亞甲基二胺。具有羧酸還原酶活性的外源多肽可以是具有羧酸還原酶活性的第二外源多肽。第二外源羧酸還原酶可以與具有羧酸還原酶活性的第一外源多肽相同或不同。具有ω轉氨酶活性的外源多肽可以是具有ω轉氨酶活性的第二外源多肽。第二外源ω轉氨酶可以與第一外源ω轉氨酶相同或不同。參見圖4。
例如,產生6-氨基己酸的重組宿主還可以包括具有N-乙酰轉移酶活性的外源多肽,具有羧酸還原酶活性的外源多肽,具有轉氨酶活性的外源多肽,具有脫酰基酶活性的外源多肽,并產生六亞甲基二胺。具有羧酸還原酶活性的多肽可以是具有羧酸還原酶活性的第二外源多肽。第二外源羧酸還原酶可以與具有羧酸還原酶活性的第一外源多肽相同或不同。具有ω轉氨酶活性的外源多肽可以是具有ω轉氨酶活性的第二外源多肽。第二外源ω轉氨酶可以與第一外源ω轉氨酶相同或不同。參見圖5。
例如,重組宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脫氫酶活性的外源多肽和至少一種選自下組的外源多肽:具有烷烴1-單加氧酶活性的外源多肽,具有硫酯酶活性的外源多肽,具有羧酸還原酶活性的外源多肽和具有醇脫氫酶活性的外源多肽,并產生6-羥基己酸。參見圖7。
例如,產生己酸的重組宿主還可以包括具有烷烴1-單加氧酶活性的外源多肽,并產生6-羥基己酸。參見圖7。
例如,產生己二酰-[acp]的重組宿主還可以包括具有硫酯酶活性的外源多肽,具有羧酸還原酶活性的外源多肽和具有醇脫氫酶活性的外源多肽,并產生6-羥基己酸。參見圖7。
例如,產生6-羥基己酸的重組宿主可以進一步包括至少一種選自下組的外源酶:具有羧酸還原酶活性的外源多肽,具有轉氨酶活性的外源多肽和具有醛脫氫酶活性的外源多肽,并產生六亞甲基二胺。具有羧酸還原酶活性的外源多肽可以是具有羧酸還原酶活性的第二外源多肽。第二外源羧酸還原酶可以與具有羧酸還原酶活性的第一外源多肽相同或不同。具有醇脫氫酶活性的外源多肽可以是具有醇脫氫酶活性的第二外源多肽。第二外源醇脫氫酶可以與第一外源醇脫氫酶相同或不同。參見圖6。
在一些實施方案中,產生6-羥基己酸的重組宿主可以進一步包括具有羧酸還原酶活性的外源多肽和具有醇脫氫酶活性的外源多肽,并產生1,6己二醇。具有羧酸還原酶活性的外源多肽可以是具有羧酸還原酶活性的第二外源多肽。第二外源羧酸還原酶可以與具有羧酸還原酶活性的第一外源多肽相同或不同。具有醇脫氫酶活性的外源多肽可以是具有醇脫氫酶活性的第二外源多肽。第二外源醇脫氫酶可以與第一外源醇脫氫酶相同或不同。參見圖8。
本文所述的可用于生產一種或多種C6結構單元的任何酶可以與對應的野生型酶具有至少70%的序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%)。應當理解,可以基于成熟酶(例如,除去任何信號序列)或基于未成熟酶(例如,包括任何信號序列)確定序列同一性。還應當理解,起始甲硫氨酸殘基可以存在于或可以不存在于本文所述的任何酶序列上。
例如,本文描述的具有硫酯酶活性的多肽可以與短乳桿菌硫酯酶的氨基酸序列(參見GenBank登錄號ABJ63754.1,SEQ ID NO:1)或植物乳桿菌硫酯酶的氨基酸序列(參見GenBank登錄號CCC78182.1,SEQ ID NO:NO:2)具有至少70%的序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%)。參見圖21。
例如,本文所述的具有羧酸還原酶活性的多肽可以與海分枝桿菌羧酸還原酶(參見Genbank登錄號ACC40567.1,SEQ ID NO:3),恥垢分枝桿菌羧酸還原酶(參見Genbank登錄號ABK71854.1,SEQ ID NO:4),Segniliparus rugosus羧酸還原酶(參見Genbank登錄號EFV11917.1,SEQ ID NO:5),馬賽分枝桿菌羧酸還原酶(參見Genbank登錄號EIV11143.1,SEQ ID NO:6)或Segniliparus rotundus羧酸還原酶(參見Genbank登錄號ADG98140.1,SEQ ID NO:7)的氨基酸序列具有至少70%的序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%)。參見圖21。
例如,本文描述的具有ω-轉氨酶活性的多肽可以與紫色色桿菌ω-轉氨酶(參見Genbank登錄號AAQ59697.1,SEQ ID NO:8),銅綠假單胞菌ω-轉氨酶(參見Genbank登錄號AAG08191.1,SEQ ID NO:9),丁香假單胞菌ω- 轉移酶(參見Genbank登錄號AAY39893.1,SEQ ID NO:10),球形紅細菌ω-轉移酶(參見Genbank登錄號ABA81135.1,SEQ ID NO:11),大腸桿菌ω-轉移酶(參見Genbank登錄號AAA57874.1,SEQ ID NO:12),或河流孤菌ω-轉移酶(參見Genbank登錄號AEA39183.1,SEQ ID NO:13)的氨基酸序列具有至少70%的序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%)。參見圖21。
例如,本文所述的具有磷酸泛酰巰基乙胺基轉移酶活性的多肽可以與枯草芽孢桿菌磷酸泛酰巰基乙胺基轉移酶(參見Genbank登錄號CAA44858.1,SEQ ID NO:14)或諾卡氏菌屬物種NRRL 5646磷酸泛酰巰基乙胺基轉移酶(參見Genbank登錄號ABI83656.1,SEQ ID NO:15)的氨基酸序列具有至少70%的序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%)。參見圖21。
例如,本文所述的具有烷烴1-單加氧酶活性的多肽可以與單胞菌屬物種JS666單加氧酶(參見Genbank登錄號ABE47160.1,SEQ ID NO:16),分枝桿菌屬物種HXN-1500單加氧酶(參見Genbank登錄號CAH04396.1,SEQ ID NO:17)或南非分枝桿菌單加氧酶(參見Genbank登錄號ACJ06772.1,SEQ ID NO:18)的氨基酸序列具有至少70%的序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%)。參見圖21。
例如,本文所述的具有氧化還原酶活性的多肽可以與單胞菌屬物種JS666氧化還原酶(參見Genbank登錄號ABE47159.1,SEQ ID NO:19)或分枝桿菌屬物種HXN-1500氧化還原酶(參見Genbank登錄號CAH04397.1,SEQ ID NO:20)的氨基酸序列具有至少70%的序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%)。參見圖21。
例如,本文所述的鐵氧還蛋白多肽可以與單胞菌屬物種JS666鐵氧還原蛋白(參見Genbank登錄號ABE47158.1,SEQ ID NO:21)或分枝桿菌屬物種HXN-1500鐵氧還蛋白(參見Genbank登錄號CAH04398.1,SEQ ID NO:22)的氨基酸序列具有至少70%的序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%)。參見圖21。
例如,本文所述的具有庚二酰-[acp]合酶活性的多肽可以與枯草芽孢桿菌庚二酰-[acp]合酶(參見Genbank登錄號AAB17462.1,SEQ ID NO:23)的氨基酸序列具有至少70%的序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%)。參見圖21。
可以如下測定兩種氨基酸序列間的百分比同一性(同源性)。首先,使用來自含有BLASTP第2.0.14版的單機版BLASTZ的BLAST 2Sequences(Bl2seq)程序比對氨基酸序列。此單機版BLASTZ可以獲自Fish&Richardson的網站(例如www.fr.com/blast/)或美國政府國立生物技術信息中心網站(www.ncbi.nlm.nih.gov)。解釋如何使用Bl2seq程序的用法說明可以參見伴隨BLASTZ的自述文件。Bl2seq使用BLASTP算法實施兩種氨基酸序列之間的比較。為了比較兩種氨基酸序列,如下設置Bl2seq的選項:-i設置為含有要比較的第一氨基酸序列的文件(例如C:\seq1.txt);-j設置為含有要比較的第二氨基酸序列的文件(例如C:\seq2.txt);-p設置為blastp;-o設置為任何期望的文件名稱(例如C:\output.txt);并且所有其它選項保持為其缺省設置。例如,可以使用以下命令來產生含有兩種氨基酸序列間的比較的輸出文件:C:\Bl2seq–i c:\seq1.txt–j c:\seq2.txt–p blastp–o c:\output.txt。如果兩種比較序列共享同源性(同一性),那么指定的輸出文件會呈現那些同源性區作為比對序列。如果兩種比較序列不共享同源性(同一性),那么指定的輸出文件不會呈現比對序列。可以對核酸序列遵循相似的規程,只是使用blastn。
一旦比對,通過計算相同氨基酸殘基在這兩種序列中呈現的位置的數目確定匹配數目。通過用匹配數目除以全長多肽氨基酸序列的長度,接著將所得的數值乘以100來確定百分比同一性(同源性)。注意到百分比同一性(同源性)值被四舍五入到最近的十分位。例如,78.11、78.12、78.13、和78.14被向下四舍五入到78.1,而78.15、78.16、78.17、78.18、和78.19被向上四舍五入到78.2。還注意到長度值會總是整數。
應當領會,許多核酸可以編碼具有特定氨基酸序列的多肽。遺傳密碼的簡并性是本領域中公知的;即對于許多氨基酸,存在有超過一種充當氨基酸密碼子的核苷酸三聯體。例如,可以修飾給定酶的編碼序列中的密碼子,從而獲得特定物種(例如細菌或真菌)中的最佳表達,這使用適合于所述物種的密碼子偏愛表進行。
也可以在本文件的方法中使用本文中描述的任何酶的功能性片段。如本文中使用的,術語“功能性片段”指具有至少25%(例如至少30%;40%;50%;60%;70%;75%;80%;85%;90%;95%;98%;99%;100%;或甚至大于100%)的相應的成熟、全長、野生型蛋白質活性的蛋白質的肽片段。功能性片段一般但不總是可以由蛋白質的連續區構成,其中該區具有功能性活性。
此文件還提供了(i)本文件的方法中使用的酶的功能性變體和(ii)上文描述的功能性片段的功能性變體。相對于相應的野生型序列,酶和功能性片段的功能性變體可以含有添加、缺失、或取代。具有取代的酶一般會具有不超過50(例如不超過1、2、3、4、5、6、7、8、9、10、12、15、20、25、30、35、40、或50)處氨基酸取代(例如保守取代)。這適用于本文中描述的任何酶和功能性片段。保守取代是用一種氨基酸取代具有相似特征的另一種。保守取代包括下列組內的取代:纈氨酸、丙氨酸和甘氨酸;亮氨酸、纈氨酸、和異亮氨酸;天冬氨酸和谷氨酸;天冬酰胺和谷氨酰胺;絲氨酸、半胱氨酸、和蘇氨酸;賴氨酸和精氨酸;和苯丙氨酸和酪氨酸。非極性疏水性氨基酸包括丙氨酸、亮氨酸、異亮氨酸、纈氨酸、脯氨酸、苯丙氨酸、色氨酸和甲硫氨酸。極性中性氨基酸包括甘氨酸、絲氨酸、蘇氨酸、半胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺。帶正電荷的(堿性)氨基酸包括精氨酸、賴氨酸和組氨酸。帶負電荷的(酸性)氨基酸包括天冬氨酸和谷氨酸。上文提及的極性、堿性或酸性組的一種成員被相同組的另一種成員的任何取代可以視為保守取代。比較而言,非保守取代是用一種氨基酸取代具有不同特征的另一種。
缺失變體可以缺乏1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20個氨基酸的區段(具有兩種或更多種氨基酸)或非連續的單一氨基酸。添加(添加變體)包括融合蛋白,其含有:(a)本文中描述的任何酶或其片段;和(b)內部或末端(C或N)無關或異源氨基酸序列。在此類融合蛋白的背景中,術語“異源氨基酸序列”指與(a)不同的氨基酸序列。異源序列可以是例如用于純化重組蛋白的序列(例如FLAG、多組氨酸(例如六組氨酸)、凝集素(HA)、谷胱甘肽-S-轉移酶(GST)、或麥芽糖結合蛋白(MBP))。異源序列也可以是可用作可檢測標志物的蛋白質,例如螢光素酶、綠色熒光蛋白(GFP)、或氯霉素乙酰基轉移酶(CAT)。在一些實施方案中,融合蛋白含有來自另一種蛋白質的信號序列。在某些宿主細胞(例如酵母宿主細胞)中,可以經由使用異源信號序列提高靶蛋白的表達和/或分泌。在一些實施方案中,融合蛋白可以含有可用于例如引發免疫應答以生成抗體的載體(例如KLH)或ER或高爾基體保留信號。異源序列可以是不同長度的,并且在一些情況中可以是比與異源序列附接的全長靶蛋白質更長的序列。
在一些實施方案中,如下實現十二酰基-[acp]或辛酰基-[acp]氧化切割成一種或多種C6脂族主鏈:通過在特定宿主中酰基載體蛋白的蛋白質工程化,建立由BioI編碼的庚二酰-[acp]合酶內的碳-6和碳-7位置的底物排列(alignment)。
在一些實施方案中,如下實現十二酰基-[acp]或辛酰基-[acp]氧化切割成一種或多種C6脂族主鏈:通過在特定宿主中合成酰基載體蛋白和脂肪酸之間的修飾的磷酸泛酰巰基乙胺接頭,建立由BioI編碼的庚二酰-[acp]合酶內的碳-6和碳-7位置的底物排列。
在一些實施方案中,如下實現十二酰基-[acp]或辛酰基-[acp]氧化切割成一種或多種C6脂肪族主鏈:通過由BioI編碼的庚二酰-[acp]合酶(SEQ ID NO:23)的酶工程化,建立用于氧化切割的酶中的碳-6和碳-7位置的底物排列。
本文所述途徑的反應可以在一種或多種細胞(例如宿主細胞)株中進行,所述細胞株(a)天然表達一種或多種相關酶,(b)經遺傳工程化而表達一種或多種相關酶,或(c)天然表達一種或多種相關酶并經遺傳工程化而表達一種或多種相關酶。或者,可以從以上任意類型的宿主細胞中提取相關酶,并以純化或半純化形式使用。此外,這些提取物包括可以作為相關酶來源使用的裂解物(如細胞裂解物)。在本申請提供的方法中,所有步驟可以在宿主細胞中進行,所有步驟可以使用提取的酶進行,或者一些步驟可以在細胞中進行,其它步驟可以使用提取的酶進行。如本文所述,重組宿主可包括核酸,該核酸編碼如下文更詳細描述的具有合酶活性的多肽,具有脫氫酶活性的多肽,具有還原酶活性的多肽,具有單加氧酶活性的多肽,具有硫酯酶活性的多肽,具有脫酰基酶活性的多肽,具有轉移酶活性的多肽,或具有轉氨酶活性的多肽的一種或多種。
另外,可以使用本文中描述的分離的酶,使用來自宿主微生物的裂解物(例如細胞裂解物)作為酶來源,或者使用來自不同宿主微生物的多種裂解物作為酶來源體外進行一種或多種C6結構單元的產生。
產生用于轉化為C6結構單元的C6脂族主鏈的酶
用于轉化為一種或多種C6結構單元的C6脂肪族主鏈可以自使用乙酰CoA和丙二酰CoA作為中心代謝物的脂肪酸生物合成,和具有用于十二酰基-[acp]或辛酰基-[acp]前體的氧化切割的庚二酰-[acp]合酶活性的多肽形成。適合的庚二酰-[acp]合酶具有接受C8或C12酰基-[acp]底物,并氧化切割底物的C6和C7碳之間的C-C鍵的能力,以產生6-氧代己酰-[acp]和乙醛(當辛酰基-[acp]是底物時)或6-氧代己酰-[acp]和己醛(當十二酰基-[acp]是底物時),并且可以與由來自枯草芽孢桿菌的bioI編碼的野生型庚二酰-[acp]合酶具有至少70%的序列同一性。野生型庚二酰-[acp]合酶分類在EC 1.14.15.12下,并且通常氧化切割酰基-[acp]底物的C7和C8碳之間的C-C鍵。參見Green等,J.Biol.Inorg.Chem.,2001,6,523-533;Cryle and De Voss,Chem.Commun.(Camb.),2004,7,86-87;Cryle and Schlichting,Proc.Natl.Acad.Sci.USA,2008,105,15696–15701。
在一些實施方案中,由具有庚二酰-[acp]合酶活性(例如,與SEQ ID NO:23所示的氨基酸序列具有70%的序列同一性)的多肽產生的半醛產物通過具有醛脫氫酶活性的多肽轉化為它們相應的羧酸。參見圖1。
在一些實施方案中,醛脫氫酶歸類在EC 1.2.1.3或EC 1.2.1.4下。參見圖1。
在C6結構單元的生物合成中產生末端羧基的酶
如圖1和圖2中描繪,可以使用具有硫酯酶活性的多肽或具有醛脫氫酶活性的多肽來酶促形成末端羧基。
在一些實施方案中,導致C6結構單元合成的第一或第二末端羧基通過歸類在EC 1.2.1.-(例如,EC 1.2.1.3,EC 1.2.1.4,EC 1.2.1.16,EC 1.2.1.20,EC 1.2.1.63或EC 1.2.1.79)下的醛脫氫酶酶促形成。例如,第一末端羧基可以由分類在EC 1.2.1.4(Ho&Weiner,Journal of Bacteriology,2005,187(3),1067–1073)或分類為EC 1.2.1.3(Guerrillot&Vandecasteele,Eur.J.Biochem.,1977,81,185–192)下的醛脫氫酶酶促形成。例如,導致己二酸合成的第二末端羧基可以通過分類在EC 1.2.1.-(例如EC 1.2.1.3,EC 1.2.1.16,EC 1.2.1.20,EC 1.2.1.63或EC 1.2.1.79)下的醛脫氫酶,如CpnE,ChnE或ThnG的基因產物酶促形成(參見例如Iwaki等,Appl.Environ.Microbiol.,1999,65(11),5158–5162;或López-Sánchez等,Appl.Environ.Microbiol.,2010,76(1),110-118)。ThnG的基因產物是7-氧代庚酸脫氫酶。ChnE的基因產物是6-氧代己酸脫氫酶。
在一些實施方案中,導致己二酸合成的第二末端羧基由歸類在EC 3.1.2.-下的硫酯酶,如fatB,tesA的基因產物,或具有SEQ ID NO:1或SEQ ID NO:2中所示的氨基酸序列的硫酯酶酶促形成(參見例如Jing等,BMC Biochemistry,2011,12,44;Cantu等,Protein Science,2010,19,1281–1295;Zhuang等,Biochemistry,2008,47(9),2789–2796;或Naggert等,J.Biol.Chem.,1991,266(17),11044–11050)。
在C6結構單元的生物合成中產生末端胺基的酶
如圖3、圖4、圖5和圖6中描繪,可以使用具有ω-轉氨酶活性的多肽或具有脫酰基酶活性的多肽酶促形成末端胺基。
在一些實施方案中,末端氨基可以由歸類于例如EC 2.6.1.-,例如EC 2.6.1.18、EC 2.6.1.19、EC 2.6.1.29、EC 2.6.1.48或EC 2.6.1.82下的ω-轉氨酶(如獲得自紫色色桿菌(GenBank登錄號AAQ59697.1,SEQ ID NO:8))、銅綠假單胞菌(GenBank登錄號AAG08191.1,SEQ ID NO:9)、丁香假單胞菌(GenBank登錄號AAY39893.1,SEQ ID NO:10)、球形紅細菌(GenBank登錄號ABA81135.1,SEQ ID NO:11)、河流弧菌(GenBank登錄號AEA39183.1,AEA39183.1,SEQ ID NO:13)、灰色鏈霉菌(Streptomyces griseus)或Clostridium viride)酶促形成。參見圖3。
可用于本文所述的方法和宿主中的另外的ω-轉氨酶來自大腸桿菌(GenBank登錄號AAA57874.1,SEQ ID NO:12)。一些歸類于例如EC 2.6.1.29或EC 2.6.1.82下的ω-轉氨酶是二胺ω-轉氨酶。
在一些實施方案中,導致6-氨基己酸合成的第一末端胺基由歸類于2.6.1.18下的ω-轉氨酶(如獲得自河流弧菌(SEQ ID NO:13)或紫色色桿菌(SEQ ID NO:8)),歸類于EC 2.6.1.19下(如獲得自灰色鏈霉菌),或分類于EC 2.6.1.48下(如獲得自梭菌屬)酶促形成。還可以使用具有SEQ ID NO:9,10,和11中所示的氨基酸序列的ω-轉氨酶。
來自紫色色桿菌的可逆ω-轉氨酶已經表明接受6-氨基己酸作為氨基供體,從而在己二酸半醛中形成第一末端胺基的類似活性(Kaulmann等,Enzyme and Microbial Technology,2007,41,628-637)。
來自灰色鏈霉菌的可逆的4-氨基丁酸:2-氧代戊二酸轉氨酶已經表明用于將6-氨基己酸轉化為己二酸半醛的類似活性(Yonaha等,Eur.J.Biochem.,1985,146,101-106)。
來自Clostridium viride的可逆的5-氨基戊酸轉氨酶已經表明用于將6-氨基己酸轉化為己二酸半醛的類似活性(Barker等,The Journal of Biological Chemistry,1987,262(19),8994-9003)。
在一些實施方案中,導致六亞甲基二胺合成的第二末端胺基由歸類于EC 2.6.1.29或歸類于EC 2.6.1.82下的二胺轉氨酶,如YgjG的基因產物酶促形成。可以使用具有SEQ ID NO:8-13所示的氨基酸序列的ω-轉氨酶可以用于生物合成六亞甲基二胺。
YgjG的基因產物接受寬范圍的二胺碳鏈長度底物,諸如腐胺,尸胺和亞精胺(Samsonova等,BMC Microbiology,2003,3:2)。
來自大腸桿菌菌株B的二胺轉氨酶已經表明對1,6-二氨基己烷的活性(Kim,The Journal of Chemistry,1963,239(3),783-786)。
在一些實施方案中,通過分類于例如EC 3.5.1.17下的脫酰基酶,如酰基賴氨酸脫酰基酶,在N 6-乙酰基-1,6-二氨基己烷中酶促形成第二末端胺基,其導致庚二胺的形成。
在C6結構單元的生物合成中產生末端羥基的酶
如圖7和圖8中描繪,可以使用具有烷烴1-單加氧酶活性的多肽或具有醇脫氫酶活性的多肽來酶促形成末端羥基。
在一些實施方案中,導致合成C6結構單元的第一末端羥基通過烷烴1-單加氧酶(如由alkBGT編碼)或細胞色素P450(如來自CYP153家族(如CYP153A)酶促形成(參見,例如Van Beilen&Funhoff,Current Opinion in Biotechnology,2005,16,308–314;Koch et al.,Appl.Environ.Microbiol.,2009,75(2),337-344;or Nieder and Shapiro,Journal of Bacteriology,1975,122(1),93-98)。見例如SEQ ID NO.16-18。
CYP153A家族的末端烷烴1-單加氧酶和alkB單加氧酶的底物特異性已經成功地擴大(Koch等,2009,同上)。盡管在體外觀察到CYP153A6的非末端羥基化,但在體內僅發生1-羥基化(Funhoff等,Journal of Bacteriology,2006,188(14),5220–5227)。
在一些實施方案中,導致6-羥基己酸合成的末端羥基通過歸類在EC 1.1.1.-(例如EC 1.1.1.2)下的醇脫氫酶,如YMR318C,cpnD或gabD的基因產物,或分類在EC 1.1.1.258下,如ChnD的基因產物酶促形成。分類在EC 1.1.1.258下的醇脫氫酶是6-羥基己酸脫氫酶。
在一些實施方案中,導致1,6己二醇合成的第二末端羥基通過分類在EC 1.1.1.-(例如EC 1.1.1.1,EC 1.1.1.2,EC 1.1.1.21,或EC 1.1.1.184)下的醇脫氫酶,如YMR318C或YqhD的基因產物或具有GenBank登錄號CAA81612.1的蛋白酶促合成。
生物化學途徑
使用長鏈酰基-[acp]脂肪酸合成中間物作為前體,導致C6脂族主鏈,己二酰-[acp]和己酸的途徑
在一些實施方案中,如下從十二酰基-[acp]合成己二酰-[acp]和己酸:通過具有庚二酰-[acp]合酶活性的多肽(例如,與BioI的基因產物具有至少70%的序列同一性,參見Genbank登錄號AAB17462.1,SEQ ID NO:23),將十二酰基-[acp]轉化成蘇型-6,7-二羥基十二酰基-[acp];然后通過具有庚二酰-[acp]合酶活性的多肽(例如,與BioI的基因產物具有至少70%的序列同一性,參見Genbank登錄號AAB17462.1,SEQ ID NO:23)轉化為6-氧代己酰-[acp]和己醛;然后通過分類在例如EC 1.2.1.4或EC 1.2.1.3下的醛脫氫酶轉化為己二酰-[acp]和己酸。參見例如圖1。
在一些實施方案中,如下從辛酰基-[acp]合成己二酰-[acp]和乙酸:通過具有庚二酰基-[acp]合酶活性的多肽(例如,與BioI的基因產物具有至少70%的序列同一性,參見Genbank登錄號AAB17462.1,SEQ ID NO:23)將辛酰基-[acp]轉化成蘇型-6,7-二羥基辛酰基-[acp];隨后通過具有庚二酰基-[acp]合酶活性的多肽(例如,與BioI的基因產物具有至少70%的序列同一性,參見Genbank登錄號AAB17462.1,SEQ ID NO:23)轉化為6-氧代己酰-[acp]和乙醛;然后通過歸類在例如EC 1.2.1.4或EC 1.2.1.3下的醛脫氫酶轉化為己二酰-[acp]和乙酸。參見例如圖1。
使用己酸或己二酰-[acp]中心前體到己二酸的途徑
在一些實施方案中,如下從中心前體己酸合成己二酸:通過烷烴1-單加氧酶如alkBor或來自CYP153A家族,如單胞菌屬物種JS666單加氧酶(參見Genbank登錄號ABE47160.1,SEQ ID NO:16),分枝桿菌屬物種HXN-1500單加氧酶(參見Genbank登錄號CAH04396.1,SEQ ID NO:17),或南非分枝桿菌單加氧酶(參見Genbank登錄號ACJ06772.1,SEQ ID NO:18)將己酸轉化為6-羥基己酸;隨后通過醇脫氫酶(例如,分類在EC 1.1.1.2或EC 1.1.1.258下)如YMR318C,cpnD,gabD或ChnD的基因產物將6-羥基己酸轉化為己二酸半醛;隨后通過醛脫氫酶(例如,分類在EC 1.2.1.-,EC 1.2.1.3,EC 1.2.1.16,EC 1.2.1.20,EC 1.2.1.63或EC 1.2.1.79下)如ThnG,ChnE或CpnE的基因產物將己二酸半醛轉化為己二酸。參見圖2。
由YMR318C編碼的醇脫氫酶具有廣泛的底物特異性,包括C6醇的氧化。
在一些實施方案中,如下從中心前體己二酰-[acp]合成己二酸:通過硫酯酶(例如,分類在EC 3.1.2.-下),如來自短乳桿菌(參見GenBank登錄號ABJ63754.1,SEQ ID NO:1),植物乳桿菌(參見GenBank登錄號CCC78182.1,SEQ ID NO:2),或fatB或tesA的基因產物將己二酰-[acp]轉化為己二酸。參見圖2。
使用己二酰-[acp]或己酸作為中心前體到6-氨基己酸的途徑
在一些實施方案中,如下從中心前體己酸合成6-氨基己酸:通過烷烴1-單加氧酶,如alkB或來自CYP153A家族,如單胞菌屬物種JS666單加氧酶(參見Genbank登錄號ABE47160.1,SEQ ID NO:16),分枝桿菌屬物種HXN-1500單加氧酶(參見Genbank登錄號CAH04396.1,SEQ ID NO:17),或南非分枝桿菌單加氧酶(參見Genbank登錄號ACJ06772.1,SEQ ID NO:18)將己酸轉化為6-羥基己酸;隨后通過醇脫氫酶(例如,分類在EC 1.1.1.2或EC 1.1.1.258下),如YMR318C,cpnD,gabD或ChnD的基因產物將6-羥基己酸轉化為己二酸半醛;隨后通過ω-轉氨酶(例如,分類在EC 2.6.1.-下),如來自紫色色桿菌(Genbank登錄號AAQ59697.1,SEQ ID NO:8),銅綠假單胞菌(Genbank登錄號AAG08191.1,SEQ ID NO:9),丁香假單胞菌(Genbank 登錄號AAY39893.1,SEQ ID NO:10),球形紅細菌酶(Genbank登錄號ABA81135.1,SEQ ID NO:11),或河流孤菌(Genbank登錄號AEA39183.1,SEQ ID NO:13)將己二酸半醛轉化為6-氨基己酸。參見圖3。
在一些實施方案中,如下從中心前體己二酰-[acp]合成6-氨基己酸:通過硫酯酶(例如分類在EC 3.1.2.-分類下),如來自短乳桿菌(參見GenBank登錄號ABJ63754.1,SEQ ID NO:1),植物乳桿菌(參見GenBank登錄號CCC78182.1,SEQ ID NO:2),或fatB或tesA的基因產物將己二酰-[acp]轉化為己二酸;隨后通過例如分類在例如EC 1.2.99.6下的羧酸還原酶例如car的基因產物(例如來自Segniliparus rugosus,Genbank登錄號EFV11917.1,SEQ ID NO:5或來自Segniliparus rotundus,Genbank登錄號ADG98140.1,SEQ ID NO:7,與磷酸泛酰巰基乙胺基轉移酶增強劑(例如,由來自枯草芽孢桿菌的sfp基因(SEQ ID NO:14)或來自諾卡氏菌屬的npt基因(SEQ ID NO:15)編碼)組合或來自灰色鏈霉菌的GriC和GriD的基因產物將己二酸轉化為己二酸半醛(Suzuki等人,J.Antibiot.,2007,60(6),380-387);隨后通過ω-轉氨酶,如來自紫色色桿菌(Genbank登錄號AAQ59697.1,SEQ ID NO:8),銅綠假單胞菌(Genbank登錄號AAG08191.1,SEQ ID NO:9),丁香假單胞菌(Genbank登錄號AAY39893.1,SEQ ID NO:10),球形紅細菌(Genbank登錄號ABA81135.1,SEQ ID NO:11),或河流孤菌(Genbank登錄號AEA39183.1,SEQ ID NO:13)轉化為6-氨基己酸。見圖3。
在一些實施方案中,通過分類在EC 3.5.2.-下的酰胺水解酶將6-氨基己酸轉化為己內酰胺。
使用6-氨基己酸作為中心前體到六亞甲基二胺的途徑
在一些實施方案中,如下從中心前體6-氨基己酸合成六亞甲基二胺:通過羧酸還原酶(例如,分類在EC 1.2.99.6下),如car的基因產物(例如,SEQ ID NO:3-7)與npt(SEQ ID NO:15)或sfp(SEQ ID NO:14)的基因產物的組合將6-氨基己酸轉化為6-氨基己醛,或者備選可以使用GriC&GriD的基因產物(Suzuki等人,2007,同上)代替car的基因產物;隨后通過ω-轉氨酶(例如,分類在EC 2.6.1.18,EC 2.6.1.19,EC 2.6.1.48,EC 2.6.1.29或EC 2.6.1.82下),如來自紫色色桿菌(Genbank登錄號AAQ59697.1,SEQ ID NO:8),銅綠假單胞菌(Genbank登錄號AAG08191.1,SEQ ID NO:9),丁香假單胞菌(Genbank登錄號AAY39893.1,SEQ ID NO:10),球形紅細菌酶(Genbank登錄號ABA81135.1,SEQ ID NO:11),大腸桿菌(參見Genbank登錄號AAA57874.1,SEQ ID NO:12),或河流孤菌(Genbank登錄號AEA39183.1,SEQ ID NO:13)將6-氨基己醛轉化為六亞甲基二胺。見圖4。
由car和增強劑npt的基因產物編碼的羧酸還原酶具有廣泛的底物特異性,包括末端雙官能的C4和C5羧酸(Venkitasubramanian等,Enzyme and Microbial Technology,2008,42,130–137)。
在一些實施方案中,如下從中心前體6-氨基己酸合成六亞甲基二胺:通過N-乙酰基轉移酶,如賴氨酸N-乙酰轉移酶(其分類在例如EC 2.3.1.32下),將6-氨基己酸轉化為N6-乙酰基-6-氨基己酸;隨后通過分類在例如EC 1.2.99.6下的羧酸還原酶,如來自Segniliparus rugosus(參見Genbank登錄號EFV11917.1,SEQ ID NO:5),馬賽分枝桿菌(參見Genbank登錄號EIV11143.1,SEQ ID NO:6)或Segniliparus rotundus(Genbank登錄號ADG98140.1,SEQ ID NO:7)的羧酸還原酶與磷酸泛酰巰基乙胺基轉移酶增強劑(例如,由來自枯草芽孢桿菌的sfp基因或來自諾卡氏菌屬的npt基因編碼)組合將N6-乙酰基-6-氨基己酸轉化為N6-乙酰基-氨基己醛,或者備選可以使用來自灰色鏈霉菌的GriC和GriD的基因產物(Suzuki等人,2007,同上)代替car的基因產物;隨后通過分類在例如EC 2.6.1.-下的ω-轉氨酶,如來自紫色色桿菌(Genbank登錄號AAQ59697.1,SEQ ID NO:8),銅綠假單胞菌(Genbank登錄號AAG08191.1,SEQ ID NO:9),丁香假單胞菌(Genbank登錄號AAY39893.1,SEQ ID NO:10),球形紅細菌酶(Genbank登錄號ABA81135.1,SEQ ID NO:11),大腸桿菌(參見Genbank登錄號AAA57874.1,SEQ ID NO:12),或河流孤菌(Genbank登錄號AEA39183.1,SEQ ID NO:13)將N6-乙酰基-氨基己醛轉化為N6-乙酰基-1,6-二氨基己烷;隨后通過例如分類在EC 3.5.1.17下的脫酰基酶將N6-乙酰基-1,6-二氨基己烷轉化為六亞甲基二胺。見圖5。
使用己二酸半醛作為中心前體到六亞甲基二胺的途徑
在一些實施方案中,如下從中心前體己二酸半醛合成六亞甲基二胺:通過羧酸還原酶(例如分類在EC 1.2.99.6下),如來自Segniliparus rotundus(參見Genbank登錄號ADG98140.1,SEQ ID NO:7)與磷酸泛酰巰基乙胺轉移酶增強劑(例如由來自枯草芽孢桿菌的sfp基因或來自諾卡氏菌屬的npt基因編碼)的組合將己二酸半醛轉化為1,6-己二醛,或者來自灰色鏈霉菌的GriC和GriD的基因產物(Suzuki等人,2007,同上)可以用于替換car的基因產物;隨后通過分類在例如EC 2.6.1.18,EC 2.6.1.19,EC 2.3.1.29,EC 2.6.1.48或EC 2.3.1.82下的轉氨酶將1,6-己二醛轉化為6-氨基己醛;隨后通過例如分類在EC 2.6.1.18,EC 2.6.1.19,EC 2.6.1.48,EC 2.6.1.29或EC 2.6.1.82下的ω-轉氨酶,如來自紫色色桿菌(Genbank登錄號AAQ59697.1,SEQ ID NO:8),銅綠假單胞菌(Genbank登錄號AAG08191.1,SEQ ID NO:9),丁香假單胞菌(Genbank登錄號AAY39893.1,SEQ ID NO:10),球形紅細菌酶(Genbank登錄號ABA81135.1,SEQ ID NO:11),大腸桿菌(參見Genbank登錄號AAA57874.1,SEQ ID NO:12),或河流孤菌(Genbank登錄號AEA39183.1,SEQ ID NO:13)將6-氨基己醛轉化為六亞甲基二胺。見圖4。
使用6-羥基己酸作為中心前體到六亞甲基二胺的途徑
在一些實施方案中,如下從中心前體6-羥基己酸合成六亞甲基二胺:通過羧酸還原酶(分類在例如EC 1.2.99.6下),如來自海分枝桿菌(參見Genbank登錄號ACC40567.1,SEQ ID NO:3),恥垢分枝桿菌(參見Genbank登錄號ABK71854.1,SEQ ID NO:4),Segniliparus rugosus(參見Genbank登錄號EFV11917.1,SEQ ID NO:5),馬賽分枝桿菌(參見Genbank登錄號EIV11143.1,SEQ ID NO:6),或Segniliparus rotundus(參見Genbank登錄號ADG98140.1,SEQ ID NO:7)(例如與磷酸泛酰巰基乙胺基轉移酶增強劑(如,由來自枯草芽孢桿菌的sfp基因或來自諾卡氏菌屬的npt基因編碼)組合),或者來自灰色鏈霉菌的GriC和GriD的基因產物(Suzuki等人,2007,同上)將6-羥基己酸轉化為6-羥基己醛;隨后通過分類在例如EC 2.6.1.-下的ω-轉氨酶,如來自紫色色桿菌(Genbank登錄號AAQ59697.1,SEQ ID NO:8),銅綠假單胞菌(Genbank登錄號AAG08191.1,SEQ ID NO:9),丁香假單胞菌(Genbank登錄號AAY39893.1,SEQ ID NO:10),球形紅細菌酶(Genbank登錄號ABA81135.1,SEQ ID NO:11),大腸桿菌(參見Genbank登錄號AAA57874.1,SEQ ID NO:12),或河流孤菌(Genbank登錄號AEA39183.1,SEQ ID NO:13)將6-羥基己醛轉化為6-氨基己醇;隨后通過分類在例如EC 1.1.1.1下的醇脫氫酶(例如來自嗜熱脂肪地芽孢桿菌的具有GenBank登錄號CAA81612.1或由YMR318C或YqhD編碼的蛋白)將6-氨基己醇轉化為6-氨基己醛;隨后通過分類在例如EC 2.6.1.-下的ω-轉氨酶,如來自紫色色桿菌(Genbank登錄號AAQ59697.1,SEQ ID NO:8),銅綠假單胞菌(Genbank登錄號AAG08191.1,SEQ ID NO:9),丁香假單胞菌(Genbank登錄號AAY39893.1,SEQ ID NO:10),球形紅細菌酶(Genbank登錄號ABA81135.1,SEQ ID NO:11),大腸桿菌(參見Genbank登錄號AAA57874.1,SEQ ID NO:12),或河流孤菌(Genbank登錄號AEA39183.1,SEQ ID NO:13)將6-氨基己醛轉化為六亞甲基二胺。見圖6。
使用己二酰-[acp]或己酸作為中心前體到1,6-己二醇的途徑
在一些實施方案中,如下從中心前體己酸合成6-羥基己酸:通過烷烴1-單加氧酶,如alkB或來自CYP153A家族,如單胞菌屬物種JS666單加氧酶(參見Genbank登錄號ABE47160.1,SEQ ID NO:16),分枝桿菌屬物種HXN-1500單加氧酶(參見Genbank登錄號CAH04396.1,SEQ ID NO:17),南非分枝桿菌單加氧酶(參見Genbank登錄號ACJ06772.1,SEQ ID NO:18)將己酸轉化為6-羥基己酸。見圖7。
在一些實施方案中,如下從中心前體己二酰-[acp]合成6-羥基己酸:通過硫酯酶(例如,分類在EC 3.1.2.-下),如來自短乳桿菌(參見GenBank登錄號ABJ63754.1,SEQ ID NO:1)或植物乳桿菌(參見GenBank登錄號CCC78182.1,SEQ ID NO:2),或fatB或tesA的基因產物將己二酰-[acp]轉化為己二酸;隨后通過羧酸還原酶(例如,分類在EC 1.2.99.6下),如來自Segniliparus rugosus(參見Genbank登錄號EFV11917.1,SEQ ID NO:5)或來自Segniliparus rotundus(參見Genbank登錄號ADG98140.1,SEQ ID NO:7)與磷酸泛酰巰基乙胺基轉移酶增強劑(例如,由來自枯草芽孢桿菌的sfp基因編碼)或GriC&GriD的基因產物轉化為己二酸半醛;隨后通過醇脫氫酶(例如,分類在EC 1.1.1.2或EC 1.1.1.258下),如YMR318C,ChnD,cpnD或gabD的基因產物轉化為6-羥基己酸。見圖7。
在一些實施方案中,如下從中心前體6-羥基己酸合成1,6-己二醇:通過羧酸還原酶(例如分類在EC 1.2.99.6下),如來自海分枝桿菌(參見Genbank登錄號ACC40567.1,SEQ ID NO:3),恥垢分枝桿菌(參見Genbank登錄號ABK71854.1,SEQ ID NO:4),Segniliparus rugosus(參見Genbank登錄號EFV11917.1,SEQ ID NO:5),馬賽分枝桿菌(參見Genbank登錄號EIV11143.1,SEQ ID NO:6),或Segniliparus rotundus(參見Genbank登錄號ADG98140.1,SEQ ID NO:7)(例如與例如由來自枯草芽孢桿菌的sfp基因或來自諾卡氏菌屬的npt基因編碼的磷酸泛酰巰基乙胺基轉移酶增強劑組合),或者GriC&GriD的基因產物將6-羥基己酸轉化為6-羥基己醛;隨后通過醇脫氫酶(例如分類在EC 1.1.1.-下如EC 1.1.1.1,EC 1.1.1.2,EC 1.1.1.21或EC 1.1.1.184),如由YMR318C或YqhD編碼或具有GenBank登錄號CAA81612.1的蛋白將6-羥基己醛轉化為1,6己二醇(Liu等,Microbiology,2009,155,2078-2085)。見圖8。
培養策略
在一些實施方案中,使用厭氧,需氧或微需氧培養條件在重組宿主中生物合成一種或多種C6結構單元。在一些實施方案中,培養策略需要營養限制,例如氮,磷酸鹽或氧限制。
在一些實施方案中,可以采用使用例如陶瓷膜的細胞保留策略來實現并維持補料分批或連續發酵期間的高細胞密度。
在一些實施方案中,在一種或多種C6結構單元的合成中對發酵補料的主要碳源可以源自生物或非生物原料。
在一些實施方案中,生物原料可以是或可以源自單糖,二糖,木質纖維素,半纖維素,纖維素,木質素,乙酰丙酸和甲酸,甘油三酯,甘油,脂肪酸,農業廢物,濃縮的酒糟,或城市廢物。
已經在幾種微生物,如大腸桿菌、鉤蟲貪銅菌、食油假單胞菌、惡臭假單胞菌和解脂耶羅維亞酵母中證明了對來自生物柴油生產的粗制甘油的有效分解代謝(Lee等,Appl.Biochem.Biotechnol.,2012,166:1801-1813;Yang等,Biotechnology for Biofuels,2012,5:13;Meijnen等,Appl.Microbiol.Biotechnol.,2011,90:885-893)。
已經在幾種生物體,如鉤蟲貪銅菌和惡臭假單胞菌中證明了在經由前體丙酰基-CoA合成3-羥基戊酸中對木質纖維素衍生的乙酰丙酸的有效分解代謝(Jaremko and Yu,Journal of Biotechnology,2011,155,2011,293-298;Martin and Prather,Journal of Biotechnology,2009,139,61-67)。
已經在幾種微生物,如惡臭假單胞菌、鉤蟲貪銅菌中證明了對木質素衍生的芳香族化合物諸如苯甲酸類似物的有效分解代謝(Bugg等,Current Opinion in Biotechnology,2011,22,394-400;Pérez-Pantoja等,FEMS Microbiol.Rev.,2008,32,736-794)。
已經在幾種微生物,包括解脂耶羅維亞酵母中證明了對農業廢物,如橄欖磨坊廢水的有效利用(Papanikolaou等,Bioresour.Technol.,2008,99(7):2419–2428)。
已經對幾種微生物,如大腸桿菌、谷氨酸棒狀桿菌和德氏乳桿菌和乳酸乳球菌證明了可發酵糖類,如源自纖維素、半纖維素、甘蔗和甜菜糖蜜、木薯、玉米和其它農業來源的單糖和二糖的有效利用(參見例如Hermann等,Journal of Biotechnology,2003,104,155-172;Wee等,Food Technol.Biotechnol.,2006,44(2),163-172;Ohashi等,Journal of Bioscience and Bioengineering,1999,87(5),647–654)。
已經對鉤蟲貪銅菌證明了源自多種農業木質纖維素來源的糠醛的有效利用(Li等,Biodegradation,2011,22:1215-1225)。
在一些實施方案中,非生物原料可以是或者可以源自天然氣、合成氣、CO2/H2、甲醇,乙醇,苯甲酸甲酯,非揮發性殘留物(NVR)或來自環己烷氧化過程的堿洗液(caustic wash)廢物流,或對苯二甲酸/間苯二甲酸混合物廢物流。
已經對甲基營養型酵母巴斯德畢赤酵母證明了甲醇的有效分解代謝。
已經對克氏梭菌證明了乙醇的有效分解代謝(Seedorf等,Proc.Natl.Acad.Sci.USA,2008,105(6)2128-2133)。
已經對鉤蟲貪銅菌證明了CO2和H2(其可以源自天然氣和其它化學和石油化學來源)的有效分解代謝(Prybylski等,Energy,Sustainability and Society,2012,2:11)。
已經對多種微生物,如楊氏梭菌和自產乙醇梭菌(Clostridium autoethanogenum)證明了合成氣的有效分解代謝(等,Applied and Environmental Microbiology,2011,77(15):5467-5475)。
已經對多種微生物,如食酸代爾夫特菌和鉤蟲貪銅菌證明了來自環己烷過程的非揮發性殘留物廢物流的有效分解代謝(Ramsay等,Applied and Environmental Microbiology,1986,52(1):152-156)。
在一些實施方案中,宿主微生物可以是原核生物。例如,原核生物可以是來自以下的細菌:埃希氏菌屬如大腸桿菌;梭菌屬如楊氏梭菌、自產乙醇梭菌或者克魯佛梭菌;棒狀桿菌屬如谷氨酸棒狀桿菌;貪銅菌屬如鉤蟲貪銅菌或者耐金屬貪銅菌;假單胞菌屬如熒光假單胞菌、惡臭假單胞菌或者食油假單胞菌;代爾夫特菌屬如食酸代爾夫特菌;芽孢桿菌屬如枯草芽胞桿菌;乳桿菌屬如德氏乳桿菌;或者乳球菌屬如乳酸乳球菌。此類原核生物也可以是構建能夠生成一種或多種C6結構單元的本文中描述的重組宿主細胞的基因來源。
在一些實施方案中,宿主微生物可以是真核生物。例如,真核生物可以是絲狀真菌,例如來自曲霉屬如黑曲霉的。或者,真核生物可以是酵母,例如來自酵母屬如釀酒酵母;來自畢赤氏酵屬如巴斯德畢赤酵母;來自耶羅維亞酵母屬如解脂耶羅維亞酵母;來自伊薩酵母屬如東方伊薩酵母;來自德巴利酵母屬如漢遜德巴利酵母;來自Arxula屬如Arxula adenoinivorans;或者來自克魯維酵母菌屬如乳酸克魯維酵母菌。此類真核生物也可以是構建能夠生成一種或多種C6結構單元的本文中描述的重組宿主細胞的基因來源。
代謝工程
本申請提供方法,其涉及少于對上述所有途徑描述的所有的步驟。此類方法可以涉及例如此類步驟中的一,二,三,四,五,六,七,八,九,十,十一,十二或者更多個。在此類方法包括少于所有步驟的情況下,第一個,并且在一些實施方案中唯一的,步驟可為所列步驟中的任何步驟。
此外,本文中描述的重組宿主可以包括上述酶中的任何組合,使得所述步驟中的一個或者多個,例如此類步驟中的一,二,三,四,五,六,七,八,九,十或者更多個可以在重組宿主內實施。本申請提供了所列出的任何屬和種的宿主細胞,并且經遺傳工程化以表達一種或多種(例如,二,三,四,五,六,七,八,九,10,11,12或更多種)本文所述的任何酶的重組形式。因此,例如,宿主細胞可以含有編碼酶的外源核酸,所述酶催化本文所述的任何途徑的一個或多個步驟。
另外,本申請認識到,在酶已經被描述為接受CoA活化的底物的情況下,存在與[acp]結合底物相關的類似酶活性,其不一定為相同的酶種類。
此外,本文件認識到,在酶已經被描述為接受底物的(R)-對映異構體的情況下,存在與底物的(S)-對映異構體相關的類似酶活性,其不一定為相同的酶種類。
本申請還認識到,在已經顯示酶接受特定輔因子如NADPH或者共底物如乙酰基-CoA的情況下,許多酶在催化特定酶活性中在接受大量不同輔因子或者共底物方面是泛宿主性的(promiscuous)。此外,本申請認識到,在酶對例如特定輔助因子如NADH具有高特異性的情況下,對輔助因子NADPH具有高特異性的具有相似或者相同活性的酶可為不同的酶種類。
在一些實施方案中,本文所述的途徑中的酶是經由非直接的酶工程或者合理的酶設計方法的結果,目的在于改善活性、改善特異性、降低反饋抑制、降低阻抑(repression)、改善酶溶解度、改變立體特異性,或者改變輔助因子特異性。
在一些實施方案中,可以將本文概述的途徑中的酶經由附加型或者染色體整合方法基因給予(即,通過在宿主生物體中具有多個拷貝的基因來過表達)至所得的遺傳修飾的生物體中。
在一些實施方案中,使用基因組級別(genome-scale)系統生物學技術如通量平衡分析來設計用于將碳流量引導至C6結構單元的基因組級別的弱化或者敲除策略。
弱化策略包括但不限于使用轉座子,同源重組(雙交叉方法),誘變,酶抑制劑和RNAi干擾。
在一些實施方案中,使用通量組(fluxomic)、代謝物組(metabolomic)和轉錄物組(transcriptomal)數據來告知或者支持基因組級別的系統生物學技術,由此在將碳流量導向C6結構單元中設計基因組級別的弱化或者敲除策略中。
在一些實施方案中,通過在選擇性環境中連續培養,改善了宿主微生物對高濃度C6結構單元的耐受性。
在一些實施方案中,宿主微生物的生物化學網絡被弱化或增強以(1)保證乙酰-CoA和丙二酰-CoA的細胞內可用度,(2)創造NADPH不平衡,其僅可以通過C6結構單元的形成來平衡,(3)阻止通向和包括一種或多種C6結構單元的中心代謝物或中心前體的降解,和/或(4)保證從細胞的高效流出。
在一些要求乙酰-CoA的細胞內可用度用于C6結構單元的合成的實施方案中,可以弱化產生乙酸的內源性磷酸轉乙酰酶,例如pta(Shen等,Appl.Environ.Microbiol.,2011,77(9):2905–2915)。
在一些要求乙酰-CoA的細胞內可用度用于C6結構單元的合成的實施方案中,可以弱化乙酸合成途徑中編碼乙酸激酶的內源性基因,例如ack。
在一些要求乙酰-CoA和NADH的細胞內可用度用于C6結構單元的合成的實施方案中,可以弱化編碼催化丙酮酸降解為乳酸的酶的內源性基因,例如由ldhA編碼的乳酸脫氫酶(Shen等,Appl.Environ.Microbiol.,2011,77(9),2905-2915)。
在一些要求乙酰-CoA的細胞內可用度用于C6結構單元的合成的實施方案中,可以弱化編碼催化磷酸烯醇丙酮酸降解為琥珀酸的酶的內源基因,例如frdBC(見Shen等,2011,見上文)。
在一些要求乙酰-CoA的細胞內可用度用于C6結構單元的合成的實施方案中,可以弱化編碼催化乙酰-CoA降解為乙醇的酶的內源性基因,例如由adhE編碼的醇脫氫酶(Shen等,2011,見上文)。
在一些要求乙酰-CoA的細胞內可用度用于C6結構單元的合成的實施方案中,可以在微生物中過表達重組乙酰-CoA合成酶,如acs的基因產物(Satoh等,J.Bioscience and Bioengineering,2003,95(4):335–341)。
在一些實施方案中,通過弱化內源性葡萄糖-6-磷酸異構酶(EC 5.3.1.9),可以將碳通量導入戊糖磷酸循環中。
在一些實施方案中,在C6結構單元合成中途徑需要過量的NADPH輔因子的情況下,可以在宿主生物體中過表達編碼吡啶核苷酸轉氫酶的基因例如UdhA(Brigham等,Advanced Biofuels and Bioproducts,2012,Chapter 39,1065-1090)。
在一些實施方案中,在C6結構單元合成中途徑需要過量的NADPH輔因子的情況下,可以在宿主生物體中過表達重組甘油醛-3-磷酸-脫氫酶基因,例如GapN(Brigham等,2012,見上文)。
在一些實施方案中,在C6結構單元合成中途徑需要過量的NADPH輔因子的情況下,可以在宿主生物體中過表達重組蘋果酸酶基因,如maeA或maeB(Brigham等,2012,見上文)。
在一些實施方案中,在C6結構單元合成中途徑需要過量的NADPH輔因子的情況下,可以在宿主生物體中過表達重組葡萄糖-6-磷酸脫氫酶基因,例如zwf(Lim等,Journal of Bioscience and Bioengineering,2002,93(6),543-549)。
在一些實施方案中,在C6結構單元合成中途徑需要過量的NADPH輔因子的情況下,可以在宿主生物體中過表達重組果糖1,6-二磷酸酶基因,例如fbp(Becker et al.,Journal of Biotechnology,2007,132,99-109)。
在一些實施方案中,在C6結構單元合成中途徑需要過量的NADPH輔因子的情況下,可以弱化編碼磷酸丙糖異構酶(EC 5.3.1.1)的內源基因。
在一些實施方案中,在C6結構單元合成中途徑需要過量的NADPH輔因子的情況下,可以在宿主生物體中過表達重組葡萄糖脫氫酶,如gdh的基因產物(Satoh等,2003,見上文)。
在一些實施方案中,弱化編碼促進NADPH轉化為NADH的酶的內源基因,如可以歸類于EC 1.4.1.2(NADH特異性)和EC 1.4.1.4(NADPH特異性)下的谷氨酸脫氫酶的相互轉化產生的NADH生成循環;或轉氫酶。
在一些實施方案中,可以弱化編碼使用NADH和NADPH兩者作為輔因子的谷氨酸脫氫酶(EC 1.4.1.3)的內源基因。
在一些實施方案中,膜結合的烷烴1-單加氧酶通過將P450錨定到內質網的N末端區域的截短而增溶(Scheller等,J.Biol.Chem.,1994,269(17),12779-12783)。
在一些使用天然積累聚羥基鏈烷酸酯的宿主的實施方案中,可以在宿主菌株中弱化編碼聚合物合酶的內源基因。
在使用天然積累脂質體的宿主的一些實施方案中,可以在宿主菌株中弱化編碼合酶的相關基因。
在一些實施方案中,弱化降解導致并包括C6結構單元的中心代謝物和中心前體的β-氧化酶。
在一些實施方案中,弱化編碼通過CoA酯化活化C6結構單元的酶的內源基因,如CoA連接酶。
在一些實施方案中,通過遺傳工程化改造對細胞膜的結構修飾或者提高C6結構單元的任何關聯轉運蛋白活性增強或放大C6結構單元穿過細胞膜到胞外介質的流出。
六亞甲基二胺的流出可以通過過表達廣泛底物范圍多藥物轉運體來提高或放大,如來自枯草芽孢桿菌的Blt(Woolridge等,1997,J.Biol.Chem.,272(14):8864–8866);來自大腸桿菌的AcrB和AcrD(Elkins&Nikaido,2002,J.Bacteriol.,184(23),6490–6499)或來自金黃色葡萄球菌的NorA(Ng等,1994,Antimicrob Agents Chemother,38(6),1345–1355)或來自枯草芽孢桿菌的Bmr(Neyfakh,1992,Antimicrob Agents Chemother,36(2),484–485)。
6-氨基己酸和六亞甲基二胺的流出可以通過過表達溶質轉運體來提高或放大,如來自于谷氨酸棒狀桿菌的lysE轉運體(Bellmann等,2001,Microbiology,147,1765–1774)。
己二酸的流出可以通過過表達二羧酸轉運體來提高或放大,如來自于谷氨酸棒狀桿菌的SucE轉運體(Huhn等,Appl.Microbiol.&Biotech.,89(2),327–335)。
使用重組宿主生產C6結構單元
通常,可以通過提供宿主微生物并且用含有如上文描述的合適碳源的培養基培養提供的微生物生成一種或多種C6結構單元。一般地,培養基和/或培養條件可以使得微生物生長至足夠的密度,并且有效生成C6結構單元。對于大規模生產工藝,可以使用任何方法,諸如那些在別處描述的(Manual of Industrial Microbiology and Biotechnology,2nd Edition,Editors:A.L.Demain and J.E.Davies,ASM Press;and Principles of Fermentation Technology,P.F.Stanbury and A.Whitaker,Pergamon)。簡言之,用特定的微生物接種含有合適培養基的大罐(例如,100加侖,200加侖,500加侖,或更大的罐)。在接種后,溫育微生物以容許生成生物量。一旦達到期望的生物量,可以將含有微生物的培養液轉移到第二個罐。此第二個罐可以是任何大小。例如,第二個罐可以比/與第一個罐大、小或相同大小。通常,第二個罐大于第一個,從而可以對來自第一個罐的培養液添加額外的培養基。另外,此第二個罐內的培養基可以與第一個罐中使用的培養基相同或不同。
一旦轉移,可以溫育微生物以容許生成C6結構單元。一旦生成,可以使用任何方法來分離C6結構單元。例如,可以經由吸附方法從發酵液選擇性回收C6結構單元。在己二酸和6-氨基己酸的情況中,所得的洗脫液可以經由蒸發進一步濃縮,經由蒸發和/或冷卻結晶來結晶,并且經由離心回收晶體。在六亞甲基二胺和1,6-己二醇的情況中,可以采用蒸餾來實現期望的產物純度。
本發明在以下實施例中進一步描述,所述實施例不限制權利要求書中描述的本發明范圍。
實施例
實施例1
在形成6-羥基己酸中使用己酸作為底物的CYP153單加氧酶的酶活性
將編碼HIS標簽的核苷酸序列添加到單胞菌屬物種JS666,分支桿菌屬物種HXN-1500和南非分支桿菌基因,其分別編碼(1)單加氧酶(SEQ ID NO:16-18),(2)相關的鐵氧還原蛋白還原酶配偶體(SEQ ID NO:19-20)和物種的鐵氧還原蛋白(SEQ ID NO:21-22)。對于南非分枝桿菌單加氧酶,使用分支桿菌屬物種HXN-1500氧化還原酶和鐵氧還原蛋白配偶體。將編碼蛋白配偶體的三種經修飾的核酸序列克隆到pgBlue表達載體中,在雜交體pTac啟動子下。將每種表達載體轉化到BL21[DE3]大腸桿菌宿主中。將每種所得重組大腸桿菌菌株在含有50mL LB培養基和抗生素選擇壓力的500mL搖瓶培養物中在37℃下培養。使用1mM IPTG在28℃下誘導每種培養物24小時。
通過離心收集來自每個誘導的搖瓶培養物的團粒。將每個團粒重懸浮,并使用Y-perTM溶液(ThermoScientific,Rockford,IL)在室溫下通透細胞20分鐘。將經通透的細胞在Y-perTM溶液中保持在0℃。
在由最終濃度為25mM磷酸鉀緩沖液(pH=7.8),1.7mM MgSO4,,2.5mM NADPH和30mM己酸鹽組成的緩沖液中進行酶活性測定。通過將懸浮在Y-perTM溶液中的固定質量的濕細胞重量的通透細胞加入到含有庚酸鹽的測定緩沖液中起始每個酶活性測定反應,然后在加熱塊振蕩器中在28℃下以1400rpm振蕩溫育24小時。通過LC-MS定量7-羥基庚酸的形成。
如針對空載體對照所確認的,SEQ ID NO 16-18的單加氧酶基因產物連同還原酶和鐵氧還原蛋白配偶體,接受己酸作為底物(見圖20)并合成6-羥基己酸作為反應產物。
實施例2
使用己二酸半醛作為底物并且形成6-氨基己酸的ω-轉氨酶的酶活性
將編碼His標簽的核苷酸序列添加至分別編碼SEQ ID NO:8、9、10、11和13的ω-轉氨酶的來自紫色色桿菌、銅綠假單胞菌、丁香假單胞菌、球形紅桿菌、和河流弧菌的基因(見圖12),使得可以產生N-末端有HIS標簽的ω-轉氨酶。將每種所得的經修飾基因克隆到pET21a表達載體中在T7啟動子的控制下,并且將每種表達載體轉化入BL21[DE3]大腸桿菌宿主中。將所得重組大腸桿菌菌株在含有50mL LB培養基和抗生素選擇壓力的250mL搖瓶培養物中在37℃下培養,以230rpm振蕩。使用1mM IPTG于16℃誘導每種培養物過夜。
經由離心收獲來自每個經誘導的搖瓶培養物的團粒。重懸每個團粒粒并經由超聲處理裂解。經由離心分開細胞碎片與上清液,并且立即在酶活性測定法中使用無細胞提取物。
在緩沖液中實施逆向(即6-氨基己酸至己二酸半醛)的酶活性測定法,所述緩沖液由終濃度為50mM HEPES緩沖液(pH=7.5)、10mM 6-氨基己酸、10mM丙酮酸和100μM吡哆(pyridoxyl)5’磷酸鹽組成。通過添加ω-轉氨酶基因產物或空載體對照的無細胞提取物到含有6-氨基己酸的測定緩沖液啟動每個酶活性測定反應,并在以250rpm振蕩的情況下于25℃溫育24小時。經由RP-HPLC量化從丙酮酸形成L-丙氨酸。
每種沒有6-氨基己酸的僅酶對照表明丙酮酸至L-丙氨酸的低基線轉化。參見圖14。如相對于空載體對照所確認的,SEQ ID NO 8、SEQ ID NO 10、SEQ ID NO 11和SEQ ID NO 13的基因產物接受6-氨基己酸作為底物。見圖15。
對SEQ ID NO 8、SEQ ID NO 9、SEQ ID NO 10、SEQ ID NO 11和SEQ ID NO 13的轉氨酶確認正向(即己二酸半醛至6-氨基己酸)的酶反應。在緩沖液中實施酶活性測定法,所述緩沖液由終濃度50mM HEPES緩沖液(pH=7.5)、10mM己二酸半醛、10mM L-丙氨酸和100μM吡哆5’磷酸鹽組成。通過添加ω-轉氨酶基因產物或空載體對照的無細胞提取物到含有己二酸半醛的測定緩沖液啟動每個酶活性測定反應,并在以250rpm振蕩的情況下于25℃溫育4小時。經由RP-HPLC量化丙酮酸的形成。
如相對于空載體對照所確認的,SEQ ID NO 8、SEQ ID NO 9、SEQ ID NO 10、SEQ ID NO 11和SEQ ID NO 13的轉氨酶接受己二酸半醛作為底物。參 見圖16。確認了ω-轉氨酶活性的可逆性,證明了SEQ ID NO 8、SEQ ID NO 9、SEQ ID NO 10、SEQ ID NO 11和SEQ ID NO 13的ω-轉氨酶接受己二酸半醛作為底物,并且合成6-氨基己酸作為反應產物。
實施例3
羧酸還原酶使用己二酸作為底物并形成己二酸半醛的酶活性
將編碼HIS標簽的核苷酸序列添加至分別編碼SEQ ID NO:5和7的羧酸還原酶的來自Segniliparus rugosus和Segniliparus rotundus的基因(參見圖21),使得可以生成N-末端有HIS標簽的羧酸還原酶。將每種經修飾的基因與編碼有HIS標簽的來自枯草芽孢桿菌的磷酸泛酰巰基乙胺基轉移酶的sfp基因一起克隆入pET Duet表達載體中,兩者都在T7啟動子下。將每種表達載體轉化入BL21[DE3]大腸桿菌宿主,并且于37℃在含有50mL LB培養基和抗生素選擇壓力的250mL搖瓶培養物中在以230rpm振蕩的情況中培養所得的重組大腸桿菌菌株。使用自誘導培養基于37℃誘導每種培養物過夜。
經由離心收獲來自每個經誘導的搖瓶培養物的團粒。重懸每個團粒和經由超聲處理裂解,并經由離心分離細胞碎片與上清液。使用Ni-親和層析從上清液中純化羧酸還原酶和磷酸泛酰巰基乙胺基轉移酶,以10倍稀釋入50mM HEPES緩沖液(pH=7.5)中,并經由超濾濃縮。
在緩沖液中一式三份實施酶活性測定法(即從己二酸至己二酸半醛),所述緩沖液由終濃度50mM HEPES緩沖液(pH=7.5)、2mM己二酸、10mM MgCl2、1mM ATP和1mM NADPH組成。通過添加純化的羧酸還原酶和磷酸泛酰巰基乙胺基轉移酶基因產物或空載體對照至含有己二酸的測定緩沖液起始每個酶活性測定反應,然后于室溫溫育20分鐘。通過于340nm的吸光度監測NADPH的消耗。每種沒有己二酸的僅酶對照表明NADPH的低基線消耗。見圖9。
如相對于空載體對照所確認的,SEQ ID NO 5和SEQ ID NO 7的基因產物,由sfp的基因產物增強,接受己二酸作為底物(參見圖10),并且合成己二酸半醛。
實施例4
羧酸還原酶使用6-羥基己酸作為底物并形成6-羥基己醛的酶活性
將編碼His標簽的核苷酸序列添加至分別編碼SEQ ID NO:3-7的羧酸還原酶的來自海分枝桿菌、恥垢分枝桿菌、恥垢分枝桿菌、Segniliparus rugosus、馬賽分枝桿菌和Segniliparus rotundus的基因(見圖21),使得可以生成N-末端有HIS標簽的羧酸還原酶。將每種經修飾的基因與編碼有His標簽的來自枯草芽孢桿菌的磷酸泛酰巰基乙胺基轉移酶的sfp基因一起克隆入pET Duet表達載體中,兩者都在T7啟動子下。將每種表達載體轉化入BL21[DE3]大腸桿菌宿主中。于37℃在含有50mL LB培養基和抗生素選擇壓力的250mL搖瓶培養物中在以230rpm振蕩的情況中培養所得的每種重組大腸桿菌菌株。使用自誘導培養基于37℃誘導每種培養物過夜。
經由離心收獲來自每個經誘導的搖瓶培養物的團粒。重懸每個團粒,并經由超聲處理裂解。經由離心分離細胞碎片與上清液。使用Ni-親和層析從上清液中純化羧酸還原酶和磷酸泛酰巰基乙胺基轉移酶,以10倍稀釋入50mM HEPES緩沖液(pH=7.5)中,并經由超濾濃縮。
在緩沖液中一式三份實施酶活性測定法(即從6-羥基己酸至6-羥基己醛),所述緩沖液由終濃度50mM HEPES緩沖液(pH=7.5)、2mM 6-羥基己醛、10mM MgCl2、1mM ATP和1mM NADPH組成。通過添加純化的羧酸還原酶和磷酸泛酰巰基乙胺基轉移酶或空載體對照至含有6-羥基己酸的測定緩沖液啟動每個酶活性測定反應,然后于室溫溫育20分鐘。通過于340nm的吸光度監測NADPH的消耗。每種沒有6-羥基己酸的僅酶對照表明NADPH的低基線消耗。參見圖9。
如相對于空載體對照確認的,SEQ ID NO 3-7的基因產物,由sfp的基因產物增強,接受6-羥基己酸作為底物(參見圖11),并合成6-羥基己醛。
實施例5
ω-轉氨酶對于6-氨基己醇,形成6-氧代己醇的酶活性
將編碼N-末端His標簽的核苷酸序列添加至分別編碼SEQ ID NO:8-13的ω-轉氨酶的來自紫色色桿菌、銅綠假單胞菌、丁香假單胞菌、球形紅桿菌、大腸桿菌和河流弧菌基因(參見圖21),使得可以產生N-末端有HIS標簽的ω-轉氨酶。將經修飾基因克隆至pET21a表達載體中,在T7啟動子下。將每種表達載體轉化入BL21[DE3]大腸桿菌宿主中。于37℃在含有50mL LB培養基和抗生素選擇壓力的250mL搖瓶培養物中在以230rpm振蕩的情況中培養每種所得的重組大腸桿菌菌株。使用1mM IPTG于16℃誘導每種培養物過夜。
經由離心收獲來自每種經誘導的搖瓶培養物的團粒。重懸每個團粒,并經由超聲處理裂解。經由離心分離細胞碎片與上清液,并且立即在酶活性測定法中使用無細胞提取物。
在緩沖液中實施逆向(即6-氨基己醇至6-氧代己醇)的酶活性測定法,所述緩沖液由終濃度50mM HEPES緩沖液(pH=7.5)、10mM 6-氨基己醇、10 mM丙酮酸和100μM吡哆5’磷酸鹽組成。通過添加ω-轉氨酶基因產物或空載體對照的無細胞提取物到含有6-氨基己醇的測定緩沖液啟動每個酶活性測定反應,并在以250rpm振蕩的情況下于25℃溫育4小時。經由RP-HPLC量化L-丙氨酸形成。
每個沒有6-氨基己醇的僅酶對照具有丙酮酸至L-丙氨酸的低基線轉化。參見圖14。
如相對于空載體對照所確認的,SEQ ID NO 8-13的基因產物接受6-氨基己醇作為底物,并合成6-氧代己醇作為反應產物。鑒于ω-轉氨酶活性的可逆性(參見實施例2),可以推斷SEQ ID 8-13的基因產物接受6-氨基己醇作為底物,并形成6-氧代己醇。
實施例6
ω-轉氨酶使用六亞甲基二胺作為底物并形成6-氨基己醛的酶活性
將編碼N-末端His標簽的核苷酸序列添加至分別編碼SEQ ID NO:8-13的ω-轉氨酶的紫色色桿菌、銅綠假單胞菌、丁香假單胞菌、球形紅桿菌、大腸桿菌、和河流弧菌基因(參見圖21),使得可以產生N-末端有HIS標簽的ω-轉氨酶。將經修飾的基因克隆至pET21a表達載體中,在T7啟動子下。將每種表達載體轉化入BL21[DE3]大腸桿菌宿主中。于37℃在含有50mL LB培養基和抗生素選擇壓力的250mL搖瓶培養物中在以230rpm振蕩的情況中培養每種所得的重組大腸桿菌菌株。使用1mM IPTG于16℃誘導每種培養物過夜。
經由離心收獲來自每個經誘導的搖瓶培養物的團粒。重懸每個團粒,并經由超聲處理裂解。經由離心分離細胞碎片與上清液,并且立即在酶活性測定法中使用無細胞提取物。
在緩沖液中實施逆向(即六亞甲基二胺至6-氨基己醛)的酶活性測定法,所述緩沖液由終濃度50mM HEPES緩沖液(pH=7.5)、10mM六亞甲基二胺、10mM丙酮酸和100μM吡哆5’磷酸鹽組成。通過添加ω-轉氨酶基因產物或空載體對照的無細胞提取物到含有六亞甲基二胺的測定緩沖液起始每個酶活性測定反應,并在以250rpm振蕩的情況下于25℃溫育4小時。經由RP-HPLC量化L-丙氨酸的形成。
每個沒有六亞甲基二胺的僅酶對照具有丙酮酸至L-丙氨酸的低基線轉化。參見圖14。
如相對于空載體對照所確認的,SEQ ID NO 8-13的基因產物接受六亞甲基二胺作為底物(參見圖17),并合成6-氨基己醛作為反應產物。鑒于ω-轉氨酶活性的可逆性(參見實施例2),可以推斷SEQ ID 8–13的基因產物接受6-氨基己醛作為底物,并形成六亞甲基二胺。
實施例7
羧酸還原酶對于N6-乙酰-6-氨基己酸,形成N6-乙酰-6-氨基己醛的酶活性
一式三份在緩沖液中測定用于將N6-乙酰-6-氨基己酸轉化成N6-乙酰-6-氨基己醛的N末端有His標簽的SEQ ID NO:5-7的羧酸還原酶的活性(參見實施例4,和圖21),所述緩沖液由終濃度50mM HEPES緩沖液(pH=7.5)、2mM N6-乙酰-6-氨基己酸、10mM MgCl2、1mM ATP、和1mM NADPH組成。通過添加純化的羧酸還原酶和磷酸泛酰巰基乙胺基轉移酶或空載體對照至含有N6-乙酰-6-氨基己酸的測定緩沖液起始測定,然后于室溫溫育20分鐘。通過于340nm的吸光度監測NADPH的消耗。每種沒有N6-乙酰-6-氨基己酸的僅酶對照表明NADPH的低基線消耗。參見圖9。
如相對于空載體對照所確認的,SEQ ID NO 5-7的基因產物,由sfp的基因產物增強,接受N6-乙酰-6-氨基己酸作為底物(參見圖12),并合成N6-乙酰-6-氨基己醛。
實施例8
ω-轉氨酶使用N6-乙酰-1,6-二氨基己烷并形成N6-乙酰-6-氨基己醛的酶活性
在緩沖液中測定用于將N6-乙酰-1,6-二氨基己烷轉化成N6-乙酰-6-氨基己醛的N末端有His標簽的SEQ ID NO:8-13的ω-轉氨酶的活性(參見實施例6,及圖21),所述緩沖液由終濃度50mM HEPES緩沖液(pH=7.5)、10mM N6-乙酰-1,6-二氨基己烷、10mM丙酮酸和100μM吡哆5’磷酸鹽組成。通過添加ω-轉氨酶或空載體對照的無細胞提取物至含有N6-乙酰-1,6-二氨基己烷的測定緩沖液起始每個酶活性測定反應,然后在250rpm振蕩的情況下于25℃溫育4h。經由RP-HPLC量化L-丙氨酸的形成。
每個沒有N6-乙酰-1,6-二氨基己烷的僅酶對照表明丙酮酸至L-丙氨酸的低基線轉化。參見圖14。
如相對于空載體對照所確認的,SEQ ID NO:8–13的基因產物接受N6-乙酰-1,6-二氨基己烷作為底物(參見圖18),并合成N6-乙酰-6-氨基己醛作為反應產物。
鑒于ω-轉氨酶活性的可逆性(參見實施例2),SEQ ID NO:8-13的基因產物接受N6-乙酰-6-氨基己醛作為底物,形成N6-乙酰-1,6-二氨基己烷。
實施例9:羧酸還原酶使用己二酸半醛作為底物并形成己二醛的酶活性
使用己二酸半醛作為底物測定N-末端有His標簽的SEQ ID NO 7的羧酸還原酶(參見實施例4和圖21)。一式三份在緩沖液中實施酶活性測定法,所述緩沖液由終濃度50mM HEPES緩沖液(pH=7.5)、2mM己二酸半醛、10mM MgCl2、1mM ATP和1mM NADPH組成。通過添加純化的羧酸還原酶和磷酸泛酰巰基乙胺基轉移酶或空載體對照至含有己二酸半醛的測定緩沖液起始測定,然后于室溫溫育20分鐘。通過340nm的吸光度監測NADPH的消耗。每種沒有己二酸半醛的僅酶對照表明NADPH的低基線消耗。參見圖9。
如相對于空載體對照所確認的,SEQ ID NO 7的基因產物,由sfp的基因產物增強,接受己二酸半醛作為底物(參見圖13),并合成己二醛。
其它實施例
應當理解,雖然已經結合其詳細描述描述了本發明,但是前面的描述旨在說明而不是限制由所附權利要求的范圍限定的本發明的范圍。其他方面,優點和修改在所附權利要求的范圍內。
序列表
<110> 英威達技術有限責任公司.
<120> 通過氧化切割從長鏈脂肪酸生產6-碳化學物的方法
<130> 35643-0030WO1
<150> US 61/992,794
<151> 2014-05-13
<160> 23
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 246
<212> PRT
<213> 短乳桿菌
<400> 1
Met Ala Ala Asn Glu Phe Ser Glu Thr His Arg Val Val Tyr Tyr Glu
1 5 10 15
Ala Asp Asp Thr Gly Gln Leu Thr Leu Ala Met Leu Ile Asn Leu Phe
20 25 30
Val Leu Val Ser Glu Asp Gln Asn Asp Ala Leu Gly Leu Ser Thr Ala
35 40 45
Phe Val Gln Ser His Gly Val Gly Trp Val Val Thr Gln Tyr His Leu
50 55 60
His Ile Asp Glu Leu Pro Arg Thr Gly Ala Gln Val Thr Ile Lys Thr
65 70 75 80
Arg Ala Thr Ala Tyr Asn Arg Tyr Phe Ala Tyr Arg Glu Tyr Trp Leu
85 90 95
Leu Asp Asp Ala Gly Gln Val Leu Ala Tyr Gly Glu Gly Ile Trp Val
100 105 110
Thr Met Ser Tyr Ala Thr Arg Lys Ile Thr Thr Ile Pro Ala Glu Val
115 120 125
Met Ala Pro Tyr His Ser Glu Glu Gln Thr Arg Leu Pro Arg Leu Pro
130 135 140
Arg Pro Asp His Phe Asp Glu Ala Val Asn Gln Thr Leu Lys Pro Tyr
145 150 155 160
Thr Val Arg Tyr Phe Asp Ile Asp Gly Asn Gly His Val Asn Asn Ala
165 170 175
His Tyr Phe Asp Trp Met Leu Asp Val Leu Pro Ala Thr Phe Leu Arg
180 185 190
Ala His His Pro Thr Asp Val Lys Ile Arg Phe Glu Asn Glu Val Gln
195 200 205
Tyr Gly His Gln Val Thr Ser Glu Leu Ser Gln Ala Ala Ala Leu Thr
210 215 220
Thr Gln His Met Ile Lys Val Gly Asp Leu Thr Ala Val Lys Ala Thr
225 230 235 240
Ile Gln Trp Asp Asn Arg
245
<210> 2
<211> 261
<212> PRT
<213> 植物乳桿菌
<400> 2
Met Ala Thr Leu Gly Ala Asn Ala Ser Leu Tyr Ser Glu Gln His Arg
1 5 10 15
Ile Thr Tyr Tyr Glu Cys Asp Arg Thr Gly Arg Ala Thr Leu Thr Thr
20 25 30
Leu Ile Asp Ile Ala Val Leu Ala Ser Glu Asp Gln Ser Asp Ala Leu
35 40 45
Gly Leu Thr Thr Glu Met Val Gln Ser His Gly Val Gly Trp Val Val
50 55 60
Thr Gln Tyr Ala Ile Asp Ile Thr Arg Met Pro Arg Gln Asp Glu Val
65 70 75 80
Val Thr Ile Ala Val Arg Gly Ser Ala Tyr Asn Pro Tyr Phe Ala Tyr
85 90 95
Arg Glu Phe Trp Ile Arg Asp Ala Asp Gly Gln Gln Leu Ala Tyr Ile
100 105 110
Thr Ser Ile Trp Val Met Met Ser Gln Thr Thr Arg Arg Ile Val Lys
115 120 125
Ile Leu Pro Glu Leu Val Ala Pro Tyr Gln Ser Glu Val Val Lys Arg
130 135 140
Ile Pro Arg Leu Pro Arg Pro Ile Ser Phe Glu Ala Thr Asp Thr Thr
145 150 155 160
Ile Thr Lys Pro Tyr His Val Arg Phe Phe Asp Ile Asp Pro Asn Arg
165 170 175
His Val Asn Asn Ala His Tyr Phe Asp Trp Leu Val Asp Thr Leu Pro
180 185 190
Ala Thr Phe Leu Leu Gln His Asp Leu Val His Val Asp Val Arg Tyr
195 200 205
Glu Asn Glu Val Lys Tyr Gly Gln Thr Val Thr Ala His Ala Asn Ile
210 215 220
Leu Pro Ser Glu Val Ala Asp Gln Val Thr Thr Ser His Leu Ile Glu
225 230 235 240
Val Asp Asp Glu Lys Cys Cys Glu Val Thr Ile Gln Trp Arg Thr Leu
245 250 255
Pro Glu Pro Ile Gln
260
<210> 3
<211> 1174
<212> PRT
<213> 海魚分枝桿菌
<400> 3
Met Ser Pro Ile Thr Arg Glu Glu Arg Leu Glu Arg Arg Ile Gln Asp
1 5 10 15
Leu Tyr Ala Asn Asp Pro Gln Phe Ala Ala Ala Lys Pro Ala Thr Ala
20 25 30
Ile Thr Ala Ala Ile Glu Arg Pro Gly Leu Pro Leu Pro Gln Ile Ile
35 40 45
Glu Thr Val Met Thr Gly Tyr Ala Asp Arg Pro Ala Leu Ala Gln Arg
50 55 60
Ser Val Glu Phe Val Thr Asp Ala Gly Thr Gly His Thr Thr Leu Arg
65 70 75 80
Leu Leu Pro His Phe Glu Thr Ile Ser Tyr Gly Glu Leu Trp Asp Arg
85 90 95
Ile Ser Ala Leu Ala Asp Val Leu Ser Thr Glu Gln Thr Val Lys Pro
100 105 110
Gly Asp Arg Val Cys Leu Leu Gly Phe Asn Ser Val Asp Tyr Ala Thr
115 120 125
Ile Asp Met Thr Leu Ala Arg Leu Gly Ala Val Ala Val Pro Leu Gln
130 135 140
Thr Ser Ala Ala Ile Thr Gln Leu Gln Pro Ile Val Ala Glu Thr Gln
145 150 155 160
Pro Thr Met Ile Ala Ala Ser Val Asp Ala Leu Ala Asp Ala Thr Glu
165 170 175
Leu Ala Leu Ser Gly Gln Thr Ala Thr Arg Val Leu Val Phe Asp His
180 185 190
His Arg Gln Val Asp Ala His Arg Ala Ala Val Glu Ser Ala Arg Glu
195 200 205
Arg Leu Ala Gly Ser Ala Val Val Glu Thr Leu Ala Glu Ala Ile Ala
210 215 220
Arg Gly Asp Val Pro Arg Gly Ala Ser Ala Gly Ser Ala Pro Gly Thr
225 230 235 240
Asp Val Ser Asp Asp Ser Leu Ala Leu Leu Ile Tyr Thr Ser Gly Ser
245 250 255
Thr Gly Ala Pro Lys Gly Ala Met Tyr Pro Arg Arg Asn Val Ala Thr
260 265 270
Phe Trp Arg Lys Arg Thr Trp Phe Glu Gly Gly Tyr Glu Pro Ser Ile
275 280 285
Thr Leu Asn Phe Met Pro Met Ser His Val Met Gly Arg Gln Ile Leu
290 295 300
Tyr Gly Thr Leu Cys Asn Gly Gly Thr Ala Tyr Phe Val Ala Lys Ser
305 310 315 320
Asp Leu Ser Thr Leu Phe Glu Asp Leu Ala Leu Val Arg Pro Thr Glu
325 330 335
Leu Thr Phe Val Pro Arg Val Trp Asp Met Val Phe Asp Glu Phe Gln
340 345 350
Ser Glu Val Asp Arg Arg Leu Val Asp Gly Ala Asp Arg Val Ala Leu
355 360 365
Glu Ala Gln Val Lys Ala Glu Ile Arg Asn Asp Val Leu Gly Gly Arg
370 375 380
Tyr Thr Ser Ala Leu Thr Gly Ser Ala Pro Ile Ser Asp Glu Met Lys
385 390 395 400
Ala Trp Val Glu Glu Leu Leu Asp Met His Leu Val Glu Gly Tyr Gly
405 410 415
Ser Thr Glu Ala Gly Met Ile Leu Ile Asp Gly Ala Ile Arg Arg Pro
420 425 430
Ala Val Leu Asp Tyr Lys Leu Val Asp Val Pro Asp Leu Gly Tyr Phe
435 440 445
Leu Thr Asp Arg Pro His Pro Arg Gly Glu Leu Leu Val Lys Thr Asp
450 455 460
Ser Leu Phe Pro Gly Tyr Tyr Gln Arg Ala Glu Val Thr Ala Asp Val
465 470 475 480
Phe Asp Ala Asp Gly Phe Tyr Arg Thr Gly Asp Ile Met Ala Glu Val
485 490 495
Gly Pro Glu Gln Phe Val Tyr Leu Asp Arg Arg Asn Asn Val Leu Lys
500 505 510
Leu Ser Gln Gly Glu Phe Val Thr Val Ser Lys Leu Glu Ala Val Phe
515 520 525
Gly Asp Ser Pro Leu Val Arg Gln Ile Tyr Ile Tyr Gly Asn Ser Ala
530 535 540
Arg Ala Tyr Leu Leu Ala Val Ile Val Pro Thr Gln Glu Ala Leu Asp
545 550 555 560
Ala Val Pro Val Glu Glu Leu Lys Ala Arg Leu Gly Asp Ser Leu Gln
565 570 575
Glu Val Ala Lys Ala Ala Gly Leu Gln Ser Tyr Glu Ile Pro Arg Asp
580 585 590
Phe Ile Ile Glu Thr Thr Pro Trp Thr Leu Glu Asn Gly Leu Leu Thr
595 600 605
Gly Ile Arg Lys Leu Ala Arg Pro Gln Leu Lys Lys His Tyr Gly Glu
610 615 620
Leu Leu Glu Gln Ile Tyr Thr Asp Leu Ala His Gly Gln Ala Asp Glu
625 630 635 640
Leu Arg Ser Leu Arg Gln Ser Gly Ala Asp Ala Pro Val Leu Val Thr
645 650 655
Val Cys Arg Ala Ala Ala Ala Leu Leu Gly Gly Ser Ala Ser Asp Val
660 665 670
Gln Pro Asp Ala His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala
675 680 685
Leu Ser Phe Thr Asn Leu Leu His Glu Ile Phe Asp Ile Glu Val Pro
690 695 700
Val Gly Val Ile Val Ser Pro Ala Asn Asp Leu Gln Ala Leu Ala Asp
705 710 715 720
Tyr Val Glu Ala Ala Arg Lys Pro Gly Ser Ser Arg Pro Thr Phe Ala
725 730 735
Ser Val His Gly Ala Ser Asn Gly Gln Val Thr Glu Val His Ala Gly
740 745 750
Asp Leu Ser Leu Asp Lys Phe Ile Asp Ala Ala Thr Leu Ala Glu Ala
755 760 765
Pro Arg Leu Pro Ala Ala Asn Thr Gln Val Arg Thr Val Leu Leu Thr
770 775 780
Gly Ala Thr Gly Phe Leu Gly Arg Tyr Leu Ala Leu Glu Trp Leu Glu
785 790 795 800
Arg Met Asp Leu Val Asp Gly Lys Leu Ile Cys Leu Val Arg Ala Lys
805 810 815
Ser Asp Thr Glu Ala Arg Ala Arg Leu Asp Lys Thr Phe Asp Ser Gly
820 825 830
Asp Pro Glu Leu Leu Ala His Tyr Arg Ala Leu Ala Gly Asp His Leu
835 840 845
Glu Val Leu Ala Gly Asp Lys Gly Glu Ala Asp Leu Gly Leu Asp Arg
850 855 860
Gln Thr Trp Gln Arg Leu Ala Asp Thr Val Asp Leu Ile Val Asp Pro
865 870 875 880
Ala Ala Leu Val Asn His Val Leu Pro Tyr Ser Gln Leu Phe Gly Pro
885 890 895
Asn Ala Leu Gly Thr Ala Glu Leu Leu Arg Leu Ala Leu Thr Ser Lys
900 905 910
Ile Lys Pro Tyr Ser Tyr Thr Ser Thr Ile Gly Val Ala Asp Gln Ile
915 920 925
Pro Pro Ser Ala Phe Thr Glu Asp Ala Asp Ile Arg Val Ile Ser Ala
930 935 940
Thr Arg Ala Val Asp Asp Ser Tyr Ala Asn Gly Tyr Ser Asn Ser Lys
945 950 955 960
Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu Cys Gly Leu
965 970 975
Pro Val Ala Val Phe Arg Cys Asp Met Ile Leu Ala Asp Thr Thr Trp
980 985 990
Ala Gly Gln Leu Asn Val Pro Asp Met Phe Thr Arg Met Ile Leu Ser
995 1000 1005
Leu Ala Ala Thr Gly Ile Ala Pro Gly Ser Phe Tyr Glu Leu Ala Ala
1010 1015 1020
Asp Gly Ala Arg Gln Arg Ala His Tyr Asp Gly Leu Pro Val Glu Phe
1025 1030 1035 1040
Ile Ala Glu Ala Ile Ser Thr Leu Gly Ala Gln Ser Gln Asp Gly Phe
1045 1050 1055
His Thr Tyr His Val Met Asn Pro Tyr Asp Asp Gly Ile Gly Leu Asp
1060 1065 1070
Glu Phe Val Asp Trp Leu Asn Glu Ser Gly Cys Pro Ile Gln Arg Ile
1075 1080 1085
Ala Asp Tyr Gly Asp Trp Leu Gln Arg Phe Glu Thr Ala Leu Arg Ala
1090 1095 1100
Leu Pro Asp Arg Gln Arg His Ser Ser Leu Leu Pro Leu Leu His Asn
1105 1110 1115 1120
Tyr Arg Gln Pro Glu Arg Pro Val Arg Gly Ser Ile Ala Pro Thr Asp
1125 1130 1135
Arg Phe Arg Ala Ala Val Gln Glu Ala Lys Ile Gly Pro Asp Lys Asp
1140 1145 1150
Ile Pro His Val Gly Ala Pro Ile Ile Val Lys Tyr Val Ser Asp Leu
1155 1160 1165
Arg Leu Leu Gly Leu Leu
1170
<210> 4
<211> 1173
<212> PRT
<213> 恥垢分枝桿菌
<400> 4
Met Thr Ser Asp Val His Asp Ala Thr Asp Gly Val Thr Glu Thr Ala
1 5 10 15
Leu Asp Asp Glu Gln Ser Thr Arg Arg Ile Ala Glu Leu Tyr Ala Thr
20 25 30
Asp Pro Glu Phe Ala Ala Ala Ala Pro Leu Pro Ala Val Val Asp Ala
35 40 45
Ala His Lys Pro Gly Leu Arg Leu Ala Glu Ile Leu Gln Thr Leu Phe
50 55 60
Thr Gly Tyr Gly Asp Arg Pro Ala Leu Gly Tyr Arg Ala Arg Glu Leu
65 70 75 80
Ala Thr Asp Glu Gly Gly Arg Thr Val Thr Arg Leu Leu Pro Arg Phe
85 90 95
Asp Thr Leu Thr Tyr Ala Gln Val Trp Ser Arg Val Gln Ala Val Ala
100 105 110
Ala Ala Leu Arg His Asn Phe Ala Gln Pro Ile Tyr Pro Gly Asp Ala
115 120 125
Val Ala Thr Ile Gly Phe Ala Ser Pro Asp Tyr Leu Thr Leu Asp Leu
130 135 140
Val Cys Ala Tyr Leu Gly Leu Val Ser Val Pro Leu Gln His Asn Ala
145 150 155 160
Pro Val Ser Arg Leu Ala Pro Ile Leu Ala Glu Val Glu Pro Arg Ile
165 170 175
Leu Thr Val Ser Ala Glu Tyr Leu Asp Leu Ala Val Glu Ser Val Arg
180 185 190
Asp Val Asn Ser Val Ser Gln Leu Val Val Phe Asp His His Pro Glu
195 200 205
Val Asp Asp His Arg Asp Ala Leu Ala Arg Ala Arg Glu Gln Leu Ala
210 215 220
Gly Lys Gly Ile Ala Val Thr Thr Leu Asp Ala Ile Ala Asp Glu Gly
225 230 235 240
Ala Gly Leu Pro Ala Glu Pro Ile Tyr Thr Ala Asp His Asp Gln Arg
245 250 255
Leu Ala Met Ile Leu Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly
260 265 270
Ala Met Tyr Thr Glu Ala Met Val Ala Arg Leu Trp Thr Met Ser Phe
275 280 285
Ile Thr Gly Asp Pro Thr Pro Val Ile Asn Val Asn Phe Met Pro Leu
290 295 300
Asn His Leu Gly Gly Arg Ile Pro Ile Ser Thr Ala Val Gln Asn Gly
305 310 315 320
Gly Thr Ser Tyr Phe Val Pro Glu Ser Asp Met Ser Thr Leu Phe Glu
325 330 335
Asp Leu Ala Leu Val Arg Pro Thr Glu Leu Gly Leu Val Pro Arg Val
340 345 350
Ala Asp Met Leu Tyr Gln His His Leu Ala Thr Val Asp Arg Leu Val
355 360 365
Thr Gln Gly Ala Asp Glu Leu Thr Ala Glu Lys Gln Ala Gly Ala Glu
370 375 380
Leu Arg Glu Gln Val Leu Gly Gly Arg Val Ile Thr Gly Phe Val Ser
385 390 395 400
Thr Ala Pro Leu Ala Ala Glu Met Arg Ala Phe Leu Asp Ile Thr Leu
405 410 415
Gly Ala His Ile Val Asp Gly Tyr Gly Leu Thr Glu Thr Gly Ala Val
420 425 430
Thr Arg Asp Gly Val Ile Val Arg Pro Pro Val Ile Asp Tyr Lys Leu
435 440 445
Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr Asp Lys Pro Tyr Pro
450 455 460
Arg Gly Glu Leu Leu Val Arg Ser Gln Thr Leu Thr Pro Gly Tyr Tyr
465 470 475 480
Lys Arg Pro Glu Val Thr Ala Ser Val Phe Asp Arg Asp Gly Tyr Tyr
485 490 495
His Thr Gly Asp Val Met Ala Glu Thr Ala Pro Asp His Leu Val Tyr
500 505 510
Val Asp Arg Arg Asn Asn Val Leu Lys Leu Ala Gln Gly Glu Phe Val
515 520 525
Ala Val Ala Asn Leu Glu Ala Val Phe Ser Gly Ala Ala Leu Val Arg
530 535 540
Gln Ile Phe Val Tyr Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val
545 550 555 560
Val Val Pro Thr Pro Glu Ala Leu Glu Gln Tyr Asp Pro Ala Ala Leu
565 570 575
Lys Ala Ala Leu Ala Asp Ser Leu Gln Arg Thr Ala Arg Asp Ala Glu
580 585 590
Leu Gln Ser Tyr Glu Val Pro Ala Asp Phe Ile Val Glu Thr Glu Pro
595 600 605
Phe Ser Ala Ala Asn Gly Leu Leu Ser Gly Val Gly Lys Leu Leu Arg
610 615 620
Pro Asn Leu Lys Asp Arg Tyr Gly Gln Arg Leu Glu Gln Met Tyr Ala
625 630 635 640
Asp Ile Ala Ala Thr Gln Ala Asn Gln Leu Arg Glu Leu Arg Arg Ala
645 650 655
Ala Ala Thr Gln Pro Val Ile Asp Thr Leu Thr Gln Ala Ala Ala Thr
660 665 670
Ile Leu Gly Thr Gly Ser Glu Val Ala Ser Asp Ala His Phe Thr Asp
675 680 685
Leu Gly Gly Asp Ser Leu Ser Ala Leu Thr Leu Ser Asn Leu Leu Ser
690 695 700
Asp Phe Phe Gly Phe Glu Val Pro Val Gly Thr Ile Val Asn Pro Ala
705 710 715 720
Thr Asn Leu Ala Gln Leu Ala Gln His Ile Glu Ala Gln Arg Thr Ala
725 730 735
Gly Asp Arg Arg Pro Ser Phe Thr Thr Val His Gly Ala Asp Ala Thr
740 745 750
Glu Ile Arg Ala Ser Glu Leu Thr Leu Asp Lys Phe Ile Asp Ala Glu
755 760 765
Thr Leu Arg Ala Ala Pro Gly Leu Pro Lys Val Thr Thr Glu Pro Arg
770 775 780
Thr Val Leu Leu Ser Gly Ala Asn Gly Trp Leu Gly Arg Phe Leu Thr
785 790 795 800
Leu Gln Trp Leu Glu Arg Leu Ala Pro Val Gly Gly Thr Leu Ile Thr
805 810 815
Ile Val Arg Gly Arg Asp Asp Ala Ala Ala Arg Ala Arg Leu Thr Gln
820 825 830
Ala Tyr Asp Thr Asp Pro Glu Leu Ser Arg Arg Phe Ala Glu Leu Ala
835 840 845
Asp Arg His Leu Arg Val Val Ala Gly Asp Ile Gly Asp Pro Asn Leu
850 855 860
Gly Leu Thr Pro Glu Ile Trp His Arg Leu Ala Ala Glu Val Asp Leu
865 870 875 880
Val Val His Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Arg Gln
885 890 895
Leu Phe Gly Pro Asn Val Val Gly Thr Ala Glu Val Ile Lys Leu Ala
900 905 910
Leu Thr Glu Arg Ile Lys Pro Val Thr Tyr Leu Ser Thr Val Ser Val
915 920 925
Ala Met Gly Ile Pro Asp Phe Glu Glu Asp Gly Asp Ile Arg Thr Val
930 935 940
Ser Pro Val Arg Pro Leu Asp Gly Gly Tyr Ala Asn Gly Tyr Gly Asn
945 950 955 960
Ser Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu Cys
965 970 975
Gly Leu Pro Val Ala Thr Phe Arg Ser Asp Met Ile Leu Ala His Pro
980 985 990
Arg Tyr Arg Gly Gln Val Asn Val Pro Asp Met Phe Thr Arg Leu Leu
995 1000 1005
Leu Ser Leu Leu Ile Thr Gly Val Ala Pro Arg Ser Phe Tyr Ile Gly
1010 1015 1020
Asp Gly Glu Arg Pro Arg Ala His Tyr Pro Gly Leu Thr Val Asp Phe
1025 1030 1035 1040
Val Ala Glu Ala Val Thr Thr Leu Gly Ala Gln Gln Arg Glu Gly Tyr
1045 1050 1055
Val Ser Tyr Asp Val Met Asn Pro His Asp Asp Gly Ile Ser Leu Asp
1060 1065 1070
Val Phe Val Asp Trp Leu Ile Arg Ala Gly His Pro Ile Asp Arg Val
1075 1080 1085
Asp Asp Tyr Asp Asp Trp Val Arg Arg Phe Glu Thr Ala Leu Thr Ala
1090 1095 1100
Leu Pro Glu Lys Arg Arg Ala Gln Thr Val Leu Pro Leu Leu His Ala
1105 1110 1115 1120
Phe Arg Ala Pro Gln Ala Pro Leu Arg Gly Ala Pro Glu Pro Thr Glu
1125 1130 1135
Val Phe His Ala Ala Val Arg Thr Ala Lys Val Gly Pro Gly Asp Ile
1140 1145 1150
Pro His Leu Asp Glu Ala Leu Ile Asp Lys Tyr Ile Arg Asp Leu Arg
1155 1160 1165
Glu Phe Gly Leu Ile
1170
<210> 5
<211> 1148
<212> PRT
<213> Segniliparus rugosus
<400> 5
Met Gly Asp Gly Glu Glu Arg Ala Lys Arg Phe Phe Gln Arg Ile Gly
1 5 10 15
Glu Leu Ser Ala Thr Asp Pro Gln Phe Ala Ala Ala Ala Pro Asp Pro
20 25 30
Ala Val Val Glu Ala Val Ser Asp Pro Ser Leu Ser Phe Thr Arg Tyr
35 40 45
Leu Asp Thr Leu Met Arg Gly Tyr Ala Glu Arg Pro Ala Leu Ala His
50 55 60
Arg Val Gly Ala Gly Tyr Glu Thr Ile Ser Tyr Gly Glu Leu Trp Ala
65 70 75 80
Arg Val Gly Ala Ile Ala Ala Ala Trp Gln Ala Asp Gly Leu Ala Pro
85 90 95
Gly Asp Phe Val Ala Thr Val Gly Phe Thr Ser Pro Asp Tyr Val Ala
100 105 110
Val Asp Leu Ala Ala Ala Arg Ser Gly Leu Val Ser Val Pro Leu Gln
115 120 125
Ala Gly Ala Ser Leu Ala Gln Leu Val Gly Ile Leu Glu Glu Thr Glu
130 135 140
Pro Lys Val Leu Ala Ala Ser Ala Ser Ser Leu Glu Gly Ala Val Ala
145 150 155 160
Cys Ala Leu Ala Ala Pro Ser Val Gln Arg Leu Val Val Phe Asp Leu
165 170 175
Arg Gly Pro Asp Ala Ser Glu Ser Ala Ala Asp Glu Arg Arg Gly Ala
180 185 190
Leu Ala Asp Ala Glu Glu Gln Leu Ala Arg Ala Gly Arg Ala Val Val
195 200 205
Val Glu Thr Leu Ala Asp Leu Ala Ala Arg Gly Glu Ala Leu Pro Glu
210 215 220
Ala Pro Leu Phe Glu Pro Ala Glu Gly Glu Asp Pro Leu Ala Leu Leu
225 230 235 240
Ile Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly Ala Met Tyr Ser
245 250 255
Gln Arg Leu Val Ser Gln Leu Trp Gly Arg Thr Pro Val Val Pro Gly
260 265 270
Met Pro Asn Ile Ser Leu His Tyr Met Pro Leu Ser His Ser Tyr Gly
275 280 285
Arg Ala Val Leu Ala Gly Ala Leu Ser Ala Gly Gly Thr Ala His Phe
290 295 300
Thr Ala Asn Ser Asp Leu Ser Thr Leu Phe Glu Asp Ile Ala Leu Ala
305 310 315 320
Arg Pro Thr Phe Leu Ala Leu Val Pro Arg Val Cys Glu Met Leu Phe
325 330 335
Gln Glu Ser Gln Arg Gly Gln Asp Val Ala Glu Leu Arg Glu Arg Val
340 345 350
Leu Gly Gly Arg Leu Leu Val Ala Val Cys Gly Ser Ala Pro Leu Ser
355 360 365
Pro Glu Met Arg Ala Phe Met Glu Glu Val Leu Gly Phe Pro Leu Leu
370 375 380
Asp Gly Tyr Gly Ser Thr Glu Ala Leu Gly Val Met Arg Asn Gly Ile
385 390 395 400
Ile Gln Arg Pro Pro Val Ile Asp Tyr Lys Leu Val Asp Val Pro Glu
405 410 415
Leu Gly Tyr Arg Thr Thr Asp Lys Pro Tyr Pro Arg Gly Glu Leu Cys
420 425 430
Ile Arg Ser Thr Ser Leu Ile Ser Gly Tyr Tyr Lys Arg Pro Glu Ile
435 440 445
Thr Ala Glu Val Phe Asp Ala Gln Gly Tyr Tyr Lys Thr Gly Asp Val
450 455 460
Met Ala Glu Ile Ala Pro Asp His Leu Val Tyr Val Asp Arg Ser Lys
465 470 475 480
Asn Val Leu Lys Leu Ser Gln Gly Glu Phe Val Ala Val Ala Lys Leu
485 490 495
Glu Ala Ala Tyr Gly Thr Ser Pro Tyr Val Lys Gln Ile Phe Val Tyr
500 505 510
Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val Val Val Pro Asn Ala
515 520 525
Glu Val Leu Gly Ala Arg Asp Gln Glu Glu Ala Lys Pro Leu Ile Ala
530 535 540
Ala Ser Leu Gln Lys Ile Ala Lys Glu Ala Gly Leu Gln Ser Tyr Glu
545 550 555 560
Val Pro Arg Asp Phe Leu Ile Glu Thr Glu Pro Phe Thr Thr Gln Asn
565 570 575
Gly Leu Leu Ser Glu Val Gly Lys Leu Leu Arg Pro Lys Leu Lys Ala
580 585 590
Arg Tyr Gly Glu Ala Leu Glu Ala Arg Tyr Asp Glu Ile Ala His Gly
595 600 605
Gln Ala Asp Glu Leu Arg Ala Leu Arg Asp Gly Ala Gly Gln Arg Pro
610 615 620
Val Val Glu Thr Val Val Arg Ala Ala Val Ala Ile Ser Gly Ser Glu
625 630 635 640
Gly Ala Glu Val Gly Pro Glu Ala Asn Phe Ala Asp Leu Gly Gly Asp
645 650 655
Ser Leu Ser Ala Leu Ser Leu Ala Asn Leu Leu His Asp Val Phe Glu
660 665 670
Val Glu Val Pro Val Arg Ile Ile Ile Gly Pro Thr Ala Ser Leu Ala
675 680 685
Gly Ile Ala Lys His Ile Glu Ala Glu Arg Ala Gly Ala Ser Ala Pro
690 695 700
Thr Ala Ala Ser Val His Gly Ala Gly Ala Thr Arg Ile Arg Ala Ser
705 710 715 720
Glu Leu Thr Leu Glu Lys Phe Leu Pro Glu Asp Leu Leu Ala Ala Ala
725 730 735
Lys Gly Leu Pro Ala Ala Asp Gln Val Arg Thr Val Leu Leu Thr Gly
740 745 750
Ala Asn Gly Trp Leu Gly Arg Phe Leu Ala Leu Glu Gln Leu Glu Arg
755 760 765
Leu Ala Arg Ser Gly Gln Asp Gly Gly Lys Leu Ile Cys Leu Val Arg
770 775 780
Gly Lys Asp Ala Ala Ala Ala Arg Arg Arg Ile Glu Glu Thr Leu Gly
785 790 795 800
Thr Asp Pro Ala Leu Ala Ala Arg Phe Ala Glu Leu Ala Glu Gly Arg
805 810 815
Leu Glu Val Val Pro Gly Asp Val Gly Glu Pro Lys Phe Gly Leu Asp
820 825 830
Asp Ala Ala Trp Asp Arg Leu Ala Glu Glu Val Asp Val Ile Val His
835 840 845
Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr His Gln Leu Phe Gly
850 855 860
Pro Asn Val Val Gly Thr Ala Glu Ile Ile Arg Leu Ala Ile Thr Ala
865 870 875 880
Lys Arg Lys Pro Val Thr Tyr Leu Ser Thr Val Ala Val Ala Ala Gly
885 890 895
Val Glu Pro Ser Ser Phe Glu Glu Asp Gly Asp Ile Arg Ala Val Val
900 905 910
Pro Glu Arg Pro Leu Gly Asp Gly Tyr Ala Asn Gly Tyr Gly Asn Ser
915 920 925
Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Glu Leu Val Gly
930 935 940
Leu Pro Val Ala Val Phe Arg Ser Asp Met Ile Leu Ala His Thr Arg
945 950 955 960
Tyr Thr Gly Gln Leu Asn Val Pro Asp Gln Phe Thr Arg Leu Val Leu
965 970 975
Ser Leu Leu Ala Thr Gly Ile Ala Pro Lys Ser Phe Tyr Gln Gln Gly
980 985 990
Ala Ala Gly Glu Arg Gln Arg Ala His Tyr Asp Gly Ile Pro Val Asp
995 1000 1005
Phe Thr Ala Glu Ala Ile Thr Thr Leu Gly Ala Glu Pro Ser Trp Phe
1010 1015 1020
Asp Gly Gly Ala Gly Phe Arg Ser Phe Asp Val Phe Asn Pro His His
1025 1030 1035 1040
Asp Gly Val Gly Leu Asp Glu Phe Val Asp Trp Leu Ile Glu Ala Gly
1045 1050 1055
His Pro Ile Ser Arg Ile Asp Asp His Lys Glu Trp Phe Ala Arg Phe
1060 1065 1070
Glu Thr Ala Val Arg Gly Leu Pro Glu Ala Gln Arg Gln His Ser Leu
1075 1080 1085
Leu Pro Leu Leu Arg Ala Tyr Ser Phe Pro His Pro Pro Val Asp Gly
1090 1095 1100
Ser Val Tyr Pro Thr Gly Lys Phe Gln Gly Ala Val Lys Ala Ala Gln
1105 1110 1115 1120
Val Gly Ser Asp His Asp Val Pro His Leu Gly Lys Ala Leu Ile Val
1125 1130 1135
Lys Tyr Ala Asp Asp Leu Lys Ala Leu Gly Leu Leu
1140 1145
<210> 6
<211> 1185
<212> PRT
<213> Mycobacterium massiliense
<400> 6
Met Thr Asn Glu Thr Asn Pro Gln Gln Glu Gln Leu Ser Arg Arg Ile
1 5 10 15
Glu Ser Leu Arg Glu Ser Asp Pro Gln Phe Arg Ala Ala Gln Pro Asp
20 25 30
Pro Ala Val Ala Glu Gln Val Leu Arg Pro Gly Leu His Leu Ser Glu
35 40 45
Ala Ile Ala Ala Leu Met Thr Gly Tyr Ala Glu Arg Pro Ala Leu Gly
50 55 60
Glu Arg Ala Arg Glu Leu Val Ile Asp Gln Asp Gly Arg Thr Thr Leu
65 70 75 80
Arg Leu Leu Pro Arg Phe Asp Thr Thr Thr Tyr Gly Glu Leu Trp Ser
85 90 95
Arg Thr Thr Ser Val Ala Ala Ala Trp His His Asp Ala Thr His Pro
100 105 110
Val Lys Ala Gly Asp Leu Val Ala Thr Leu Gly Phe Thr Ser Ile Asp
115 120 125
Tyr Thr Val Leu Asp Leu Ala Ile Met Ile Leu Gly Gly Val Ala Val
130 135 140
Pro Leu Gln Thr Ser Ala Pro Ala Ser Gln Trp Thr Thr Ile Leu Ala
145 150 155 160
Glu Ala Glu Pro Asn Thr Leu Ala Val Ser Ile Glu Leu Ile Gly Ala
165 170 175
Ala Met Glu Ser Val Arg Ala Thr Pro Ser Ile Lys Gln Val Val Val
180 185 190
Phe Asp Tyr Thr Pro Glu Val Asp Asp Gln Arg Glu Ala Phe Glu Ala
195 200 205
Ala Ser Thr Gln Leu Ala Gly Thr Gly Ile Ala Leu Glu Thr Leu Asp
210 215 220
Ala Val Ile Ala Arg Gly Ala Ala Leu Pro Ala Ala Pro Leu Tyr Ala
225 230 235 240
Pro Ser Ala Gly Asp Asp Pro Leu Ala Leu Leu Ile Tyr Thr Ser Gly
245 250 255
Ser Thr Gly Ala Pro Lys Gly Ala Met His Ser Glu Asn Ile Val Arg
260 265 270
Arg Trp Trp Ile Arg Glu Asp Val Met Ala Gly Thr Glu Asn Leu Pro
275 280 285
Met Ile Gly Leu Asn Phe Met Pro Met Ser His Ile Met Gly Arg Gly
290 295 300
Thr Leu Thr Ser Thr Leu Ser Thr Gly Gly Thr Gly Tyr Phe Ala Ala
305 310 315 320
Ser Ser Asp Met Ser Thr Leu Phe Glu Asp Met Glu Leu Ile Arg Pro
325 330 335
Thr Ala Leu Ala Leu Val Pro Arg Val Cys Asp Met Val Phe Gln Arg
340 345 350
Phe Gln Thr Glu Val Asp Arg Arg Leu Ala Ser Gly Asp Thr Ala Ser
355 360 365
Ala Glu Ala Val Ala Ala Glu Val Lys Ala Asp Ile Arg Asp Asn Leu
370 375 380
Phe Gly Gly Arg Val Ser Ala Val Met Val Gly Ser Ala Pro Leu Ser
385 390 395 400
Glu Glu Leu Gly Glu Phe Ile Glu Ser Cys Phe Glu Leu Asn Leu Thr
405 410 415
Asp Gly Tyr Gly Ser Thr Glu Ala Gly Met Val Phe Arg Asp Gly Ile
420 425 430
Val Gln Arg Pro Pro Val Ile Asp Tyr Lys Leu Val Asp Val Pro Glu
435 440 445
Leu Gly Tyr Phe Ser Thr Asp Lys Pro His Pro Arg Gly Glu Leu Leu
450 455 460
Leu Lys Thr Asp Gly Met Phe Leu Gly Tyr Tyr Lys Arg Pro Glu Val
465 470 475 480
Thr Ala Ser Val Phe Asp Ala Asp Gly Phe Tyr Met Thr Gly Asp Ile
485 490 495
Val Ala Glu Leu Ala His Asp Asn Ile Glu Ile Ile Asp Arg Arg Asn
500 505 510
Asn Val Leu Lys Leu Ser Gln Gly Glu Phe Val Ala Val Ala Thr Leu
515 520 525
Glu Ala Glu Tyr Ala Asn Ser Pro Val Val His Gln Ile Tyr Val Tyr
530 535 540
Gly Ser Ser Glu Arg Ser Tyr Leu Leu Ala Val Val Val Pro Thr Pro
545 550 555 560
Glu Ala Val Ala Ala Ala Lys Gly Asp Ala Ala Ala Leu Lys Thr Thr
565 570 575
Ile Ala Asp Ser Leu Gln Asp Ile Ala Lys Glu Ile Gln Leu Gln Ser
580 585 590
Tyr Glu Val Pro Arg Asp Phe Ile Ile Glu Pro Gln Pro Phe Thr Gln
595 600 605
Gly Asn Gly Leu Leu Thr Gly Ile Ala Lys Leu Ala Arg Pro Asn Leu
610 615 620
Lys Ala His Tyr Gly Pro Arg Leu Glu Gln Met Tyr Ala Glu Ile Ala
625 630 635 640
Glu Gln Gln Ala Ala Glu Leu Arg Ala Leu His Gly Val Asp Pro Asp
645 650 655
Lys Pro Ala Leu Glu Thr Val Leu Lys Ala Ala Gln Ala Leu Leu Gly
660 665 670
Val Ser Ser Ala Glu Leu Ala Ala Asp Ala His Phe Thr Asp Leu Gly
675 680 685
Gly Asp Ser Leu Ser Ala Leu Ser Phe Ser Asp Leu Leu Arg Asp Ile
690 695 700
Phe Ala Val Glu Val Pro Val Gly Val Ile Val Ser Ala Ala Asn Asp
705 710 715 720
Leu Gly Gly Val Ala Lys Phe Val Asp Glu Gln Arg His Ser Gly Gly
725 730 735
Thr Arg Pro Thr Ala Glu Thr Val His Gly Ala Gly His Thr Glu Ile
740 745 750
Arg Ala Ala Asp Leu Thr Leu Asp Lys Phe Ile Asp Glu Ala Thr Leu
755 760 765
His Ala Ala Pro Ser Leu Pro Lys Ala Ala Gly Ile Pro His Thr Val
770 775 780
Leu Leu Thr Gly Ser Asn Gly Tyr Leu Gly His Tyr Leu Ala Leu Glu
785 790 795 800
Trp Leu Glu Arg Leu Asp Lys Thr Asp Gly Lys Leu Ile Val Ile Val
805 810 815
Arg Gly Lys Asn Ala Glu Ala Ala Tyr Gly Arg Leu Glu Glu Ala Phe
820 825 830
Asp Thr Gly Asp Thr Glu Leu Leu Ala His Phe Arg Ser Leu Ala Asp
835 840 845
Lys His Leu Glu Val Leu Ala Gly Asp Ile Gly Asp Pro Asn Leu Gly
850 855 860
Leu Asp Ala Asp Thr Trp Gln Arg Leu Ala Asp Thr Val Asp Val Ile
865 870 875 880
Val His Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Asn Gln Leu
885 890 895
Phe Gly Pro Asn Val Val Gly Thr Ala Glu Ile Ile Lys Leu Ala Ile
900 905 910
Thr Thr Lys Ile Lys Pro Val Thr Tyr Leu Ser Thr Val Ala Val Ala
915 920 925
Ala Tyr Val Asp Pro Thr Thr Phe Asp Glu Glu Ser Asp Ile Arg Leu
930 935 940
Ile Ser Ala Val Arg Pro Ile Asp Asp Gly Tyr Ala Asn Gly Tyr Gly
945 950 955 960
Asn Ala Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu
965 970 975
Cys Gly Leu Pro Val Ala Val Phe Arg Ser Asp Met Ile Leu Ala His
980 985 990
Ser Arg Tyr Thr Gly Gln Leu Asn Val Pro Asp Gln Phe Thr Arg Leu
995 1000 1005
Ile Leu Ser Leu Ile Ala Thr Gly Ile Ala Pro Gly Ser Phe Tyr Gln
1010 1015 1020
Ala Gln Thr Thr Gly Glu Arg Pro Leu Ala His Tyr Asp Gly Leu Pro
1025 1030 1035 1040
Gly Asp Phe Thr Ala Glu Ala Ile Thr Thr Leu Gly Thr Gln Val Pro
1045 1050 1055
Glu Gly Ser Glu Gly Phe Val Thr Tyr Asp Cys Val Asn Pro His Ala
1060 1065 1070
Asp Gly Ile Ser Leu Asp Asn Phe Val Asp Trp Leu Ile Glu Ala Gly
1075 1080 1085
Tyr Pro Ile Ala Arg Ile Asp Asn Tyr Thr Glu Trp Phe Thr Arg Phe
1090 1095 1100
Asp Thr Ala Ile Arg Gly Leu Ser Glu Lys Gln Lys Gln His Ser Leu
1105 1110 1115 1120
Leu Pro Leu Leu His Ala Phe Glu Gln Pro Ser Ala Ala Glu Asn His
1125 1130 1135
Gly Val Val Pro Ala Lys Arg Phe Gln His Ala Val Gln Ala Ala Gly
1140 1145 1150
Ile Gly Pro Val Gly Gln Asp Gly Thr Thr Asp Ile Pro His Leu Ser
1155 1160 1165
Arg Arg Leu Ile Val Lys Tyr Ala Lys Asp Leu Glu Gln Leu Gly Leu
1170 1175 1180
Leu
1185
<210> 7
<211> 1186
<212> PRT
<213> Segniliparus rotundus
<400> 7
Met Thr Gln Ser His Thr Gln Gly Pro Gln Ala Ser Ala Ala His Ser
1 5 10 15
Arg Leu Ala Arg Arg Ala Ala Glu Leu Leu Ala Thr Asp Pro Gln Ala
20 25 30
Ala Ala Thr Leu Pro Asp Pro Glu Val Val Arg Gln Ala Thr Arg Pro
35 40 45
Gly Leu Arg Leu Ala Glu Arg Val Asp Ala Ile Leu Ser Gly Tyr Ala
50 55 60
Asp Arg Pro Ala Leu Gly Gln Arg Ser Phe Gln Thr Val Lys Asp Pro
65 70 75 80
Ile Thr Gly Arg Ser Ser Val Glu Leu Leu Pro Thr Phe Asp Thr Ile
85 90 95
Thr Tyr Arg Glu Leu Arg Glu Arg Ala Thr Ala Ile Ala Ser Asp Leu
100 105 110
Ala His His Pro Gln Ala Pro Ala Lys Pro Gly Asp Phe Leu Ala Ser
115 120 125
Ile Gly Phe Ile Ser Val Asp Tyr Val Ala Ile Asp Ile Ala Gly Val
130 135 140
Phe Ala Gly Leu Thr Ala Val Pro Leu Gln Thr Gly Ala Thr Leu Ala
145 150 155 160
Thr Leu Thr Ala Ile Thr Ala Glu Thr Ala Pro Thr Leu Phe Ala Ala
165 170 175
Ser Ile Glu His Leu Pro Thr Ala Val Asp Ala Val Leu Ala Thr Pro
180 185 190
Ser Val Arg Arg Leu Leu Val Phe Asp Tyr Arg Ala Gly Ser Asp Glu
195 200 205
Asp Arg Glu Ala Val Glu Ala Ala Lys Arg Lys Ile Ala Asp Ala Gly
210 215 220
Ser Ser Val Leu Val Asp Val Leu Asp Glu Val Ile Ala Arg Gly Lys
225 230 235 240
Ser Ala Pro Lys Ala Pro Leu Pro Pro Ala Thr Asp Ala Gly Asp Asp
245 250 255
Ser Leu Ser Leu Leu Ile Tyr Thr Ser Gly Ser Thr Gly Thr Pro Lys
260 265 270
Gly Ala Met Tyr Pro Glu Arg Asn Val Ala His Phe Trp Gly Gly Val
275 280 285
Trp Ala Ala Ala Phe Asp Glu Asp Ala Ala Pro Pro Val Pro Ala Ile
290 295 300
Asn Ile Thr Phe Leu Pro Leu Ser His Val Ala Ser Arg Leu Ser Leu
305 310 315 320
Met Pro Thr Leu Ala Arg Gly Gly Leu Met His Phe Val Ala Lys Ser
325 330 335
Asp Leu Ser Thr Leu Phe Glu Asp Leu Lys Leu Ala Arg Pro Thr Asn
340 345 350
Leu Phe Leu Val Pro Arg Val Val Glu Met Leu Tyr Gln His Tyr Gln
355 360 365
Ser Glu Leu Asp Arg Arg Gly Val Gln Asp Gly Thr Arg Glu Ala Glu
370 375 380
Ala Val Lys Asp Asp Leu Arg Thr Gly Leu Leu Gly Gly Arg Ile Leu
385 390 395 400
Thr Ala Gly Phe Gly Ser Ala Pro Leu Ser Ala Glu Leu Ala Gly Phe
405 410 415
Ile Glu Ser Leu Leu Gln Ile His Leu Val Asp Gly Tyr Gly Ser Thr
420 425 430
Glu Ala Gly Pro Val Trp Arg Asp Gly Tyr Leu Val Lys Pro Pro Val
435 440 445
Thr Asp Tyr Lys Leu Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr
450 455 460
Asp Ser Pro His Pro Arg Gly Glu Leu Ala Ile Lys Thr Gln Thr Ile
465 470 475 480
Leu Pro Gly Tyr Tyr Lys Arg Pro Glu Thr Thr Ala Glu Val Phe Asp
485 490 495
Glu Asp Gly Phe Tyr Leu Thr Gly Asp Val Val Ala Gln Ile Gly Pro
500 505 510
Glu Gln Phe Ala Tyr Val Asp Arg Arg Lys Asn Val Leu Lys Leu Ser
515 520 525
Gln Gly Glu Phe Val Thr Leu Ala Lys Leu Glu Ala Ala Tyr Ser Ser
530 535 540
Ser Pro Leu Val Arg Gln Leu Phe Val Tyr Gly Ser Ser Glu Arg Ser
545 550 555 560
Tyr Leu Leu Ala Val Ile Val Pro Thr Pro Asp Ala Leu Lys Lys Phe
565 570 575
Gly Val Gly Glu Ala Ala Lys Ala Ala Leu Gly Glu Ser Leu Gln Lys
580 585 590
Ile Ala Arg Asp Glu Gly Leu Gln Ser Tyr Glu Val Pro Arg Asp Phe
595 600 605
Ile Ile Glu Thr Asp Pro Phe Thr Val Glu Asn Gly Leu Leu Ser Asp
610 615 620
Ala Arg Lys Ser Leu Arg Pro Lys Leu Lys Glu His Tyr Gly Glu Arg
625 630 635 640
Leu Glu Ala Met Tyr Lys Glu Leu Ala Asp Gly Gln Ala Asn Glu Leu
645 650 655
Arg Asp Ile Arg Arg Gly Val Gln Gln Arg Pro Thr Leu Glu Thr Val
660 665 670
Arg Arg Ala Ala Ala Ala Met Leu Gly Ala Ser Ala Ala Glu Ile Lys
675 680 685
Pro Asp Ala His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala Leu
690 695 700
Thr Phe Ser Asn Phe Leu His Asp Leu Phe Glu Val Asp Val Pro Val
705 710 715 720
Gly Val Ile Val Ser Ala Ala Asn Thr Leu Gly Ser Val Ala Glu His
725 730 735
Ile Asp Ala Gln Leu Ala Gly Gly Arg Ala Arg Pro Thr Phe Ala Thr
740 745 750
Val His Gly Lys Gly Ser Thr Thr Ile Lys Ala Ser Asp Leu Thr Leu
755 760 765
Asp Lys Phe Ile Asp Glu Gln Thr Leu Glu Ala Ala Lys His Leu Pro
770 775 780
Lys Pro Ala Asp Pro Pro Arg Thr Val Leu Leu Thr Gly Ala Asn Gly
785 790 795 800
Trp Leu Gly Arg Phe Leu Ala Leu Glu Trp Leu Glu Arg Leu Ala Pro
805 810 815
Ala Gly Gly Lys Leu Ile Thr Ile Val Arg Gly Lys Asp Ala Ala Gln
820 825 830
Ala Lys Ala Arg Leu Asp Ala Ala Tyr Glu Ser Gly Asp Pro Lys Leu
835 840 845
Ala Gly His Tyr Gln Asp Leu Ala Ala Thr Thr Leu Glu Val Leu Ala
850 855 860
Gly Asp Phe Ser Glu Pro Arg Leu Gly Leu Asp Glu Ala Thr Trp Asn
865 870 875 880
Arg Leu Ala Asp Glu Val Asp Phe Ile Ser His Pro Gly Ala Leu Val
885 890 895
Asn His Val Leu Pro Tyr Asn Gln Leu Phe Gly Pro Asn Val Ala Gly
900 905 910
Val Ala Glu Ile Ile Lys Leu Ala Ile Thr Thr Arg Ile Lys Pro Val
915 920 925
Thr Tyr Leu Ser Thr Val Ala Val Ala Ala Gly Val Glu Pro Ser Ala
930 935 940
Leu Asp Glu Asp Gly Asp Ile Arg Thr Val Ser Ala Glu Arg Ser Val
945 950 955 960
Asp Glu Gly Tyr Ala Asn Gly Tyr Gly Asn Ser Lys Trp Gly Gly Glu
965 970 975
Val Leu Leu Arg Glu Ala His Asp Arg Thr Gly Leu Pro Val Arg Val
980 985 990
Phe Arg Ser Asp Met Ile Leu Ala His Gln Lys Tyr Thr Gly Gln Val
995 1000 1005
Asn Ala Thr Asp Gln Phe Thr Arg Leu Val Gln Ser Leu Leu Ala Thr
1010 1015 1020
Gly Leu Ala Pro Lys Ser Phe Tyr Glu Leu Asp Ala Gln Gly Asn Arg
1025 1030 1035 1040
Gln Arg Ala His Tyr Asp Gly Ile Pro Val Asp Phe Thr Ala Glu Ser
1045 1050 1055
Ile Thr Thr Leu Gly Gly Asp Gly Leu Glu Gly Tyr Arg Ser Tyr Asn
1060 1065 1070
Val Phe Asn Pro His Arg Asp Gly Val Gly Leu Asp Glu Phe Val Asp
1075 1080 1085
Trp Leu Ile Glu Ala Gly His Pro Ile Thr Arg Ile Asp Asp Tyr Asp
1090 1095 1100
Gln Trp Leu Ser Arg Phe Glu Thr Ser Leu Arg Gly Leu Pro Glu Ser
1105 1110 1115 1120
Lys Arg Gln Ala Ser Val Leu Pro Leu Leu His Ala Phe Ala Arg Pro
1125 1130 1135
Gly Pro Ala Val Asp Gly Ser Pro Phe Arg Asn Thr Val Phe Arg Thr
1140 1145 1150
Asp Val Gln Lys Ala Lys Ile Gly Ala Glu His Asp Ile Pro His Leu
1155 1160 1165
Gly Lys Ala Leu Val Leu Lys Tyr Ala Asp Asp Ile Lys Gln Leu Gly
1170 1175 1180
Leu Leu
1185
<210> 8
<211> 459
<212> PRT
<213> 紫色色桿菌
<400> 8
Met Gln Lys Gln Arg Thr Thr Ser Gln Trp Arg Glu Leu Asp Ala Ala
1 5 10 15
His His Leu His Pro Phe Thr Asp Thr Ala Ser Leu Asn Gln Ala Gly
20 25 30
Ala Arg Val Met Thr Arg Gly Glu Gly Val Tyr Leu Trp Asp Ser Glu
35 40 45
Gly Asn Lys Ile Ile Asp Gly Met Ala Gly Leu Trp Cys Val Asn Val
50 55 60
Gly Tyr Gly Arg Lys Asp Phe Ala Glu Ala Ala Arg Arg Gln Met Glu
65 70 75 80
Glu Leu Pro Phe Tyr Asn Thr Phe Phe Lys Thr Thr His Pro Ala Val
85 90 95
Val Glu Leu Ser Ser Leu Leu Ala Glu Val Thr Pro Ala Gly Phe Asp
100 105 110
Arg Val Phe Tyr Thr Asn Ser Gly Ser Glu Ser Val Asp Thr Met Ile
115 120 125
Arg Met Val Arg Arg Tyr Trp Asp Val Gln Gly Lys Pro Glu Lys Lys
130 135 140
Thr Leu Ile Gly Arg Trp Asn Gly Tyr His Gly Ser Thr Ile Gly Gly
145 150 155 160
Ala Ser Leu Gly Gly Met Lys Tyr Met His Glu Gln Gly Asp Leu Pro
165 170 175
Ile Pro Gly Met Ala His Ile Glu Gln Pro Trp Trp Tyr Lys His Gly
180 185 190
Lys Asp Met Thr Pro Asp Glu Phe Gly Val Val Ala Ala Arg Trp Leu
195 200 205
Glu Glu Lys Ile Leu Glu Ile Gly Ala Asp Lys Val Ala Ala Phe Val
210 215 220
Gly Glu Pro Ile Gln Gly Ala Gly Gly Val Ile Val Pro Pro Ala Thr
225 230 235 240
Tyr Trp Pro Glu Ile Glu Arg Ile Cys Arg Lys Tyr Asp Val Leu Leu
245 250 255
Val Ala Asp Glu Val Ile Cys Gly Phe Gly Arg Thr Gly Glu Trp Phe
260 265 270
Gly His Gln His Phe Gly Phe Gln Pro Asp Leu Phe Thr Ala Ala Lys
275 280 285
Gly Leu Ser Ser Gly Tyr Leu Pro Ile Gly Ala Val Phe Val Gly Lys
290 295 300
Arg Val Ala Glu Gly Leu Ile Ala Gly Gly Asp Phe Asn His Gly Phe
305 310 315 320
Thr Tyr Ser Gly His Pro Val Cys Ala Ala Val Ala His Ala Asn Val
325 330 335
Ala Ala Leu Arg Asp Glu Gly Ile Val Gln Arg Val Lys Asp Asp Ile
340 345 350
Gly Pro Tyr Met Gln Lys Arg Trp Arg Glu Thr Phe Ser Arg Phe Glu
355 360 365
His Val Asp Asp Val Arg Gly Val Gly Met Val Gln Ala Phe Thr Leu
370 375 380
Val Lys Asn Lys Ala Lys Arg Glu Leu Phe Pro Asp Phe Gly Glu Ile
385 390 395 400
Gly Thr Leu Cys Arg Asp Ile Phe Phe Arg Asn Asn Leu Ile Met Arg
405 410 415
Ala Cys Gly Asp His Ile Val Ser Ala Pro Pro Leu Val Met Thr Arg
420 425 430
Ala Glu Val Asp Glu Met Leu Ala Val Ala Glu Arg Cys Leu Glu Glu
435 440 445
Phe Glu Gln Thr Leu Lys Ala Arg Gly Leu Ala
450 455
<210> 9
<211> 468
<212> PRT
<213> 銅綠假單胞菌
<400> 9
Met Asn Ala Arg Leu His Ala Thr Ser Pro Leu Gly Asp Ala Asp Leu
1 5 10 15
Val Arg Ala Asp Gln Ala His Tyr Met His Gly Tyr His Val Phe Asp
20 25 30
Asp His Arg Val Asn Gly Ser Leu Asn Ile Ala Ala Gly Asp Gly Ala
35 40 45
Tyr Ile Tyr Asp Thr Ala Gly Asn Arg Tyr Leu Asp Ala Val Gly Gly
50 55 60
Met Trp Cys Thr Asn Ile Gly Leu Gly Arg Glu Glu Met Ala Arg Thr
65 70 75 80
Val Ala Glu Gln Thr Arg Leu Leu Ala Tyr Ser Asn Pro Phe Cys Asp
85 90 95
Met Ala Asn Pro Arg Ala Ile Glu Leu Cys Arg Lys Leu Ala Glu Leu
100 105 110
Ala Pro Gly Asp Leu Asp His Val Phe Leu Thr Thr Gly Gly Ser Thr
115 120 125
Ala Val Asp Thr Ala Ile Arg Leu Met His Tyr Tyr Gln Asn Cys Arg
130 135 140
Gly Lys Arg Ala Lys Lys His Val Ile Thr Arg Ile Asn Ala Tyr His
145 150 155 160
Gly Ser Thr Phe Leu Gly Met Ser Leu Gly Gly Lys Ser Ala Asp Arg
165 170 175
Pro Ala Glu Phe Asp Phe Leu Asp Glu Arg Ile His His Leu Ala Cys
180 185 190
Pro Tyr Tyr Tyr Arg Ala Pro Glu Gly Leu Gly Glu Ala Glu Phe Leu
195 200 205
Asp Gly Leu Val Asp Glu Phe Glu Arg Lys Ile Leu Glu Leu Gly Ala
210 215 220
Asp Arg Val Gly Ala Phe Ile Ser Glu Pro Val Phe Gly Ser Gly Gly
225 230 235 240
Val Ile Val Pro Pro Ala Gly Tyr His Arg Arg Met Trp Glu Leu Cys
245 250 255
Gln Arg Tyr Asp Val Leu Tyr Ile Ser Asp Glu Val Val Thr Ser Phe
260 265 270
Gly Arg Leu Gly His Phe Phe Ala Ser Gln Ala Val Phe Gly Val Gln
275 280 285
Pro Asp Ile Ile Leu Thr Ala Lys Gly Leu Thr Ser Gly Tyr Gln Pro
290 295 300
Leu Gly Ala Cys Ile Phe Ser Arg Arg Ile Trp Glu Val Ile Ala Glu
305 310 315 320
Pro Asp Lys Gly Arg Cys Phe Ser His Gly Phe Thr Tyr Ser Gly His
325 330 335
Pro Val Ala Cys Ala Ala Ala Leu Lys Asn Ile Glu Ile Ile Glu Arg
340 345 350
Glu Gly Leu Leu Ala His Ala Asp Glu Val Gly Arg Tyr Phe Glu Glu
355 360 365
Arg Leu Gln Ser Leu Arg Asp Leu Pro Ile Val Gly Asp Val Arg Gly
370 375 380
Met Arg Phe Met Ala Cys Val Glu Phe Val Ala Asp Lys Ala Ser Lys
385 390 395 400
Ala Leu Phe Pro Glu Ser Leu Asn Ile Gly Glu Trp Val His Leu Arg
405 410 415
Ala Gln Lys Arg Gly Leu Leu Val Arg Pro Ile Val His Leu Asn Val
420 425 430
Met Ser Pro Pro Leu Ile Leu Thr Arg Glu Gln Val Asp Thr Val Val
435 440 445
Arg Val Leu Arg Glu Ser Ile Glu Glu Thr Val Glu Asp Leu Val Arg
450 455 460
Ala Gly His Arg
465
<210> 10
<211> 454
<212> PRT
<213> 丁香假單胞菌
<400> 10
Met Ser Ala Asn Asn Pro Gln Thr Leu Glu Trp Gln Ala Leu Ser Ser
1 5 10 15
Glu His His Leu Ala Pro Phe Ser Asp Tyr Lys Gln Leu Lys Glu Lys
20 25 30
Gly Pro Arg Ile Ile Thr Arg Ala Glu Gly Val Tyr Leu Trp Asp Ser
35 40 45
Glu Gly Asn Lys Ile Leu Asp Gly Met Ser Gly Leu Trp Cys Val Ala
50 55 60
Ile Gly Tyr Gly Arg Glu Glu Leu Ala Asp Ala Ala Ser Lys Gln Met
65 70 75 80
Arg Glu Leu Pro Tyr Tyr Asn Leu Phe Phe Gln Thr Ala His Pro Pro
85 90 95
Val Leu Glu Leu Ala Lys Ala Ile Ser Asp Ile Ala Pro Glu Gly Met
100 105 110
Asn His Val Phe Phe Thr Gly Ser Gly Ser Glu Gly Asn Asp Thr Met
115 120 125
Leu Arg Met Val Arg His Tyr Trp Ala Leu Lys Gly Gln Pro Asn Lys
130 135 140
Lys Thr Ile Ile Ser Arg Val Asn Gly Tyr His Gly Ser Thr Val Ala
145 150 155 160
Gly Ala Ser Leu Gly Gly Met Thr Tyr Met His Glu Gln Gly Asp Leu
165 170 175
Pro Ile Pro Gly Val Val His Ile Pro Gln Pro Tyr Trp Phe Gly Glu
180 185 190
Gly Gly Asp Met Thr Pro Asp Glu Phe Gly Ile Trp Ala Ala Glu Gln
195 200 205
Leu Glu Lys Lys Ile Leu Glu Leu Gly Val Glu Asn Val Gly Ala Phe
210 215 220
Ile Ala Glu Pro Ile Gln Gly Ala Gly Gly Val Ile Val Pro Pro Asp
225 230 235 240
Ser Tyr Trp Pro Lys Ile Lys Glu Ile Leu Ser Arg Tyr Asp Ile Leu
245 250 255
Phe Ala Ala Asp Glu Val Ile Cys Gly Phe Gly Arg Thr Ser Glu Trp
260 265 270
Phe Gly Ser Asp Phe Tyr Gly Leu Arg Pro Asp Met Met Thr Ile Ala
275 280 285
Lys Gly Leu Thr Ser Gly Tyr Val Pro Met Gly Gly Leu Ile Val Arg
290 295 300
Asp Glu Ile Val Ala Val Leu Asn Glu Gly Gly Asp Phe Asn His Gly
305 310 315 320
Phe Thr Tyr Ser Gly His Pro Val Ala Ala Ala Val Ala Leu Glu Asn
325 330 335
Ile Arg Ile Leu Arg Glu Glu Lys Ile Val Glu Arg Val Arg Ser Glu
340 345 350
Thr Ala Pro Tyr Leu Gln Lys Arg Leu Arg Glu Leu Ser Asp His Pro
355 360 365
Leu Val Gly Glu Val Arg Gly Val Gly Leu Leu Gly Ala Ile Glu Leu
370 375 380
Val Lys Asp Lys Thr Thr Arg Glu Arg Tyr Thr Asp Lys Gly Ala Gly
385 390 395 400
Met Ile Cys Arg Thr Phe Cys Phe Asp Asn Gly Leu Ile Met Arg Ala
405 410 415
Val Gly Asp Thr Met Ile Ile Ala Pro Pro Leu Val Ile Ser Phe Ala
420 425 430
Gln Ile Asp Glu Leu Val Glu Lys Ala Arg Thr Cys Leu Asp Leu Thr
435 440 445
Leu Ala Val Leu Gln Gly
450
<210> 11
<211> 467
<212> PRT
<213> 球形紅細菌
<400> 11
Met Thr Arg Asn Asp Ala Thr Asn Ala Ala Gly Ala Val Gly Ala Ala
1 5 10 15
Met Arg Asp His Ile Leu Leu Pro Ala Gln Glu Met Ala Lys Leu Gly
20 25 30
Lys Ser Ala Gln Pro Val Leu Thr His Ala Glu Gly Ile Tyr Val His
35 40 45
Thr Glu Asp Gly Arg Arg Leu Ile Asp Gly Pro Ala Gly Met Trp Cys
50 55 60
Ala Gln Val Gly Tyr Gly Arg Arg Glu Ile Val Asp Ala Met Ala His
65 70 75 80
Gln Ala Met Val Leu Pro Tyr Ala Ser Pro Trp Tyr Met Ala Thr Ser
85 90 95
Pro Ala Ala Arg Leu Ala Glu Lys Ile Ala Thr Leu Thr Pro Gly Asp
100 105 110
Leu Asn Arg Ile Phe Phe Thr Thr Gly Gly Ser Thr Ala Val Asp Ser
115 120 125
Ala Leu Arg Phe Ser Glu Phe Tyr Asn Asn Val Leu Gly Arg Pro Gln
130 135 140
Lys Lys Arg Ile Ile Val Arg Tyr Asp Gly Tyr His Gly Ser Thr Ala
145 150 155 160
Leu Thr Ala Ala Cys Thr Gly Arg Thr Gly Asn Trp Pro Asn Phe Asp
165 170 175
Ile Ala Gln Asp Arg Ile Ser Phe Leu Ser Ser Pro Asn Pro Arg His
180 185 190
Ala Gly Asn Arg Ser Gln Glu Ala Phe Leu Asp Asp Leu Val Gln Glu
195 200 205
Phe Glu Asp Arg Ile Glu Ser Leu Gly Pro Asp Thr Ile Ala Ala Phe
210 215 220
Leu Ala Glu Pro Ile Leu Ala Ser Gly Gly Val Ile Ile Pro Pro Ala
225 230 235 240
Gly Tyr His Ala Arg Phe Lys Ala Ile Cys Glu Lys His Asp Ile Leu
245 250 255
Tyr Ile Ser Asp Glu Val Val Thr Gly Phe Gly Arg Cys Gly Glu Trp
260 265 270
Phe Ala Ser Glu Lys Val Phe Gly Val Val Pro Asp Ile Ile Thr Phe
275 280 285
Ala Lys Gly Val Thr Ser Gly Tyr Val Pro Leu Gly Gly Leu Ala Ile
290 295 300
Ser Glu Ala Val Leu Ala Arg Ile Ser Gly Glu Asn Ala Lys Gly Ser
305 310 315 320
Trp Phe Thr Asn Gly Tyr Thr Tyr Ser Asn Gln Pro Val Ala Cys Ala
325 330 335
Ala Ala Leu Ala Asn Ile Glu Leu Met Glu Arg Glu Gly Ile Val Asp
340 345 350
Gln Ala Arg Glu Met Ala Asp Tyr Phe Ala Ala Ala Leu Ala Ser Leu
355 360 365
Arg Asp Leu Pro Gly Val Ala Glu Thr Arg Ser Val Gly Leu Val Gly
370 375 380
Cys Val Gln Cys Leu Leu Asp Pro Thr Arg Ala Asp Gly Thr Ala Glu
385 390 395 400
Asp Lys Ala Phe Thr Leu Lys Ile Asp Glu Arg Cys Phe Glu Leu Gly
405 410 415
Leu Ile Val Arg Pro Leu Gly Asp Leu Cys Val Ile Ser Pro Pro Leu
420 425 430
Ile Ile Ser Arg Ala Gln Ile Asp Glu Met Val Ala Ile Met Arg Gln
435 440 445
Ala Ile Thr Glu Val Ser Ala Ala His Gly Leu Thr Ala Lys Glu Pro
450 455 460
Ala Ala Val
465
<210> 12
<211> 459
<212> PRT
<213> 大腸桿菌
<400> 12
Met Asn Arg Leu Pro Ser Ser Ala Ser Ala Leu Ala Cys Ser Ala His
1 5 10 15
Ala Leu Asn Leu Ile Glu Lys Arg Thr Leu Asp His Glu Glu Met Lys
20 25 30
Ala Leu Asn Arg Glu Val Ile Glu Tyr Phe Lys Glu His Val Asn Pro
35 40 45
Gly Phe Leu Glu Tyr Arg Lys Ser Val Thr Ala Gly Gly Asp Tyr Gly
50 55 60
Ala Val Glu Trp Gln Ala Gly Ser Leu Asn Thr Leu Val Asp Thr Gln
65 70 75 80
Gly Gln Glu Phe Ile Asp Cys Leu Gly Gly Phe Gly Ile Phe Asn Val
85 90 95
Gly His Arg Asn Pro Val Val Val Ser Ala Val Gln Asn Gln Leu Ala
100 105 110
Lys Gln Pro Leu His Ser Gln Glu Leu Leu Asp Pro Leu Arg Ala Met
115 120 125
Leu Ala Lys Thr Leu Ala Ala Leu Thr Pro Gly Lys Leu Lys Tyr Ser
130 135 140
Phe Phe Cys Asn Ser Gly Thr Glu Ser Val Glu Ala Ala Leu Lys Leu
145 150 155 160
Ala Lys Ala Tyr Gln Ser Pro Arg Gly Lys Phe Thr Phe Ile Ala Thr
165 170 175
Ser Gly Ala Phe His Gly Lys Ser Leu Gly Ala Leu Ser Ala Thr Ala
180 185 190
Lys Ser Thr Phe Arg Lys Pro Phe Met Pro Leu Leu Pro Gly Phe Arg
195 200 205
His Val Pro Phe Gly Asn Ile Glu Ala Met Arg Thr Ala Leu Asn Glu
210 215 220
Cys Lys Lys Thr Gly Asp Asp Val Ala Ala Val Ile Leu Glu Pro Ile
225 230 235 240
Gln Gly Glu Gly Gly Val Ile Leu Pro Pro Pro Gly Tyr Leu Thr Ala
245 250 255
Val Arg Lys Leu Cys Asp Glu Phe Gly Ala Leu Met Ile Leu Asp Glu
260 265 270
Val Gln Thr Gly Met Gly Arg Thr Gly Lys Met Phe Ala Cys Glu His
275 280 285
Glu Asn Val Gln Pro Asp Ile Leu Cys Leu Ala Lys Ala Leu Gly Gly
290 295 300
Gly Val Met Pro Ile Gly Ala Thr Ile Ala Thr Glu Glu Val Phe Ser
305 310 315 320
Val Leu Phe Asp Asn Pro Phe Leu His Thr Thr Thr Phe Gly Gly Asn
325 330 335
Pro Leu Ala Cys Ala Ala Ala Leu Ala Thr Ile Asn Val Leu Leu Glu
340 345 350
Gln Asn Leu Pro Ala Gln Ala Glu Gln Lys Gly Asp Met Leu Leu Asp
355 360 365
Gly Phe Arg Gln Leu Ala Arg Glu Tyr Pro Asp Leu Val Gln Glu Ala
370 375 380
Arg Gly Lys Gly Met Leu Met Ala Ile Glu Phe Val Asp Asn Glu Ile
385 390 395 400
Gly Tyr Asn Phe Ala Ser Glu Met Phe Arg Gln Arg Val Leu Val Ala
405 410 415
Gly Thr Leu Asn Asn Ala Lys Thr Ile Arg Ile Glu Pro Pro Leu Thr
420 425 430
Leu Thr Ile Glu Gln Cys Glu Leu Val Ile Lys Ala Ala Arg Lys Ala
435 440 445
Leu Ala Ala Met Arg Val Ser Val Glu Glu Ala
450 455
<210> 13
<211> 453
<212> PRT
<213> 河流孤菌
<400> 13
Met Asn Lys Pro Gln Ser Trp Glu Ala Arg Ala Glu Thr Tyr Ser Leu
1 5 10 15
Tyr Gly Phe Thr Asp Met Pro Ser Leu His Gln Arg Gly Thr Val Val
20 25 30
Val Thr His Gly Glu Gly Pro Tyr Ile Val Asp Val Asn Gly Arg Arg
35 40 45
Tyr Leu Asp Ala Asn Ser Gly Leu Trp Asn Met Val Ala Gly Phe Asp
50 55 60
His Lys Gly Leu Ile Asp Ala Ala Lys Ala Gln Tyr Glu Arg Phe Pro
65 70 75 80
Gly Tyr His Ala Phe Phe Gly Arg Met Ser Asp Gln Thr Val Met Leu
85 90 95
Ser Glu Lys Leu Val Glu Val Ser Pro Phe Asp Ser Gly Arg Val Phe
100 105 110
Tyr Thr Asn Ser Gly Ser Glu Ala Asn Asp Thr Met Val Lys Met Leu
115 120 125
Trp Phe Leu His Ala Ala Glu Gly Lys Pro Gln Lys Arg Lys Ile Leu
130 135 140
Thr Arg Trp Asn Ala Tyr His Gly Val Thr Ala Val Ser Ala Ser Met
145 150 155 160
Thr Gly Lys Pro Tyr Asn Ser Val Phe Gly Leu Pro Leu Pro Gly Phe
165 170 175
Val His Leu Thr Cys Pro His Tyr Trp Arg Tyr Gly Glu Glu Gly Glu
180 185 190
Thr Glu Glu Gln Phe Val Ala Arg Leu Ala Arg Glu Leu Glu Glu Thr
195 200 205
Ile Gln Arg Glu Gly Ala Asp Thr Ile Ala Gly Phe Phe Ala Glu Pro
210 215 220
Val Met Gly Ala Gly Gly Val Ile Pro Pro Ala Lys Gly Tyr Phe Gln
225 230 235 240
Ala Ile Leu Pro Ile Leu Arg Lys Tyr Asp Ile Pro Val Ile Ser Asp
245 250 255
Glu Val Ile Cys Gly Phe Gly Arg Thr Gly Asn Thr Trp Gly Cys Val
260 265 270
Thr Tyr Asp Phe Thr Pro Asp Ala Ile Ile Ser Ser Lys Asn Leu Thr
275 280 285
Ala Gly Phe Phe Pro Met Gly Ala Val Ile Leu Gly Pro Glu Leu Ser
290 295 300
Lys Arg Leu Glu Thr Ala Ile Glu Ala Ile Glu Glu Phe Pro His Gly
305 310 315 320
Phe Thr Ala Ser Gly His Pro Val Gly Cys Ala Ile Ala Leu Lys Ala
325 330 335
Ile Asp Val Val Met Asn Glu Gly Leu Ala Glu Asn Val Arg Arg Leu
340 345 350
Ala Pro Arg Phe Glu Glu Arg Leu Lys His Ile Ala Glu Arg Pro Asn
355 360 365
Ile Gly Glu Tyr Arg Gly Ile Gly Phe Met Trp Ala Leu Glu Ala Val
370 375 380
Lys Asp Lys Ala Ser Lys Thr Pro Phe Asp Gly Asn Leu Ser Val Ser
385 390 395 400
Glu Arg Ile Ala Asn Thr Cys Thr Asp Leu Gly Leu Ile Cys Arg Pro
405 410 415
Leu Gly Gln Ser Val Val Leu Cys Pro Pro Phe Ile Leu Thr Glu Ala
420 425 430
Gln Met Asp Glu Met Phe Asp Lys Leu Glu Lys Ala Leu Asp Lys Val
435 440 445
Phe Ala Glu Val Ala
450
<210> 14
<211> 224
<212> PRT
<213> 枯草芽孢桿菌
<400> 14
Met Lys Ile Tyr Gly Ile Tyr Met Asp Arg Pro Leu Ser Gln Glu Glu
1 5 10 15
Asn Glu Arg Phe Met Ser Phe Ile Ser Pro Glu Lys Arg Glu Lys Cys
20 25 30
Arg Arg Phe Tyr His Lys Glu Asp Ala His Arg Thr Leu Leu Gly Asp
35 40 45
Val Leu Val Arg Ser Val Ile Ser Arg Gln Tyr Gln Leu Asp Lys Ser
50 55 60
Asp Ile Arg Phe Ser Thr Gln Glu Tyr Gly Lys Pro Cys Ile Pro Asp
65 70 75 80
Leu Pro Asp Ala His Phe Asn Ile Ser His Ser Gly Arg Trp Val Ile
85 90 95
Cys Ala Phe Asp Ser Gln Pro Ile Gly Ile Asp Ile Glu Lys Thr Lys
100 105 110
Pro Ile Ser Leu Glu Ile Ala Lys Arg Phe Phe Ser Lys Thr Glu Tyr
115 120 125
Ser Asp Leu Leu Ala Lys Asp Lys Asp Glu Gln Thr Asp Tyr Phe Tyr
130 135 140
His Leu Trp Ser Met Lys Glu Ser Phe Ile Lys Gln Glu Gly Lys Gly
145 150 155 160
Leu Ser Leu Pro Leu Asp Ser Phe Ser Val Arg Leu His Gln Asp Gly
165 170 175
Gln Val Ser Ile Glu Leu Pro Asp Ser His Ser Pro Cys Tyr Ile Lys
180 185 190
Thr Tyr Glu Val Asp Pro Gly Tyr Lys Met Ala Val Cys Ala Ala His
195 200 205
Pro Asp Phe Pro Glu Asp Ile Thr Met Val Ser Tyr Glu Glu Leu Leu
210 215 220
<210> 15
<211> 222
<212> PRT
<213> 諾卡氏菌屬sp. NRRL 5646
<400> 15
Met Ile Glu Thr Ile Leu Pro Ala Gly Val Glu Ser Ala Glu Leu Leu
1 5 10 15
Glu Tyr Pro Glu Asp Leu Lys Ala His Pro Ala Glu Glu His Leu Ile
20 25 30
Ala Lys Ser Val Glu Lys Arg Arg Arg Asp Phe Ile Gly Ala Arg His
35 40 45
Cys Ala Arg Leu Ala Leu Ala Glu Leu Gly Glu Pro Pro Val Ala Ile
50 55 60
Gly Lys Gly Glu Arg Gly Ala Pro Ile Trp Pro Arg Gly Val Val Gly
65 70 75 80
Ser Leu Thr His Cys Asp Gly Tyr Arg Ala Ala Ala Val Ala His Lys
85 90 95
Met Arg Phe Arg Ser Ile Gly Ile Asp Ala Glu Pro His Ala Thr Leu
100 105 110
Pro Glu Gly Val Leu Asp Ser Val Ser Leu Pro Pro Glu Arg Glu Trp
115 120 125
Leu Lys Thr Thr Asp Ser Ala Leu His Leu Asp Arg Leu Leu Phe Cys
130 135 140
Ala Lys Glu Ala Thr Tyr Lys Ala Trp Trp Pro Leu Thr Ala Arg Trp
145 150 155 160
Leu Gly Phe Glu Glu Ala His Ile Thr Phe Glu Ile Glu Asp Gly Ser
165 170 175
Ala Asp Ser Gly Asn Gly Thr Phe His Ser Glu Leu Leu Val Pro Gly
180 185 190
Gln Thr Asn Asp Gly Gly Thr Pro Leu Leu Ser Phe Asp Gly Arg Trp
195 200 205
Leu Ile Ala Asp Gly Phe Ile Leu Thr Ala Ile Ala Tyr Ala
210 215 220
<210> 16
<211> 418
<212> PRT
<213> 單胞菌屬sp. JS666
<400> 16
Met Ser Glu Ala Ile Val Val Asn Asn Gln Asn Asp Gln Ser Arg Ala
1 5 10 15
Tyr Ala Ile Pro Leu Glu Asp Ile Asp Val Ser Asn Pro Glu Leu Phe
20 25 30
Arg Asp Asn Thr Met Trp Gly Tyr Phe Glu Arg Leu Arg Arg Glu Asp
35 40 45
Pro Val His Tyr Cys Lys Asp Ser Leu Phe Gly Pro Tyr Trp Ser Val
50 55 60
Thr Lys Phe Lys Asp Ile Met Gln Val Glu Thr His Pro Glu Ile Phe
65 70 75 80
Ser Ser Glu Gly Asn Ile Thr Ile Met Glu Ser Asn Ala Ala Val Thr
85 90 95
Leu Pro Met Phe Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg
100 105 110
Met Ala Val Ser Pro Ile Val Ala Pro Glu Asn Leu Ala Lys Leu Glu
115 120 125
Gly Leu Ile Arg Glu Arg Thr Gly Arg Ala Leu Asp Gly Leu Pro Ile
130 135 140
Asn Glu Thr Phe Asp Trp Val Lys Leu Val Ser Ile Asn Leu Thr Thr
145 150 155 160
Gln Met Leu Ala Thr Leu Phe Asp Phe Pro Trp Glu Asp Arg Ala Lys
165 170 175
Leu Thr Arg Trp Ser Asp Val Ala Thr Ala Leu Val Gly Thr Gly Ile
180 185 190
Ile Asp Ser Glu Glu Gln Arg Met Glu Glu Leu Lys Gly Cys Val Gln
195 200 205
Tyr Met Thr Arg Leu Trp Asn Glu Arg Val Asn Val Pro Pro Gly Asn
210 215 220
Asp Leu Ile Ser Met Met Ala His Thr Glu Ser Met Arg Asn Met Thr
225 230 235 240
Pro Glu Glu Phe Leu Gly Asn Leu Ile Leu Leu Ile Val Gly Gly Asn
245 250 255
Asp Thr Thr Arg Asn Ser Met Thr Gly Gly Val Leu Ala Leu Asn Glu
260 265 270
Asn Pro Asp Glu Tyr Arg Lys Leu Cys Ala Asn Pro Ala Leu Ile Ala
275 280 285
Ser Met Val Pro Glu Ile Val Arg Trp Gln Thr Pro Leu Ala His Met
290 295 300
Arg Arg Thr Ala Leu Gln Asp Thr Glu Leu Gly Gly Lys Ser Ile Arg
305 310 315 320
Lys Gly Asp Lys Val Ile Met Trp Tyr Val Ser Gly Asn Arg Asp Pro
325 330 335
Glu Ala Ile Glu Asn Pro Asp Ala Phe Ile Ile Asp Arg Ala Lys Pro
340 345 350
Arg His His Leu Ser Phe Gly Phe Gly Ile His Arg Cys Val Gly Asn
355 360 365
Arg Leu Ala Glu Leu Gln Leu Arg Ile Val Trp Glu Glu Leu Leu Lys
370 375 380
Arg Trp Pro Asn Pro Gly Gln Ile Glu Val Val Gly Ala Pro Glu Arg
385 390 395 400
Val Leu Ser Pro Phe Val Lys Gly Tyr Glu Ser Leu Pro Val Arg Ile
405 410 415
Asn Ala
<210> 17
<211> 420
<212> PRT
<213> 分枝桿菌屬sp. HXN-1500
<400> 17
Met Thr Glu Met Thr Val Ala Ala Ser Asp Ala Thr Asn Ala Ala Tyr
1 5 10 15
Gly Met Ala Leu Glu Asp Ile Asp Val Ser Asn Pro Val Leu Phe Arg
20 25 30
Asp Asn Thr Trp His Pro Tyr Phe Lys Arg Leu Arg Glu Glu Asp Pro
35 40 45
Val His Tyr Cys Lys Ser Ser Met Phe Gly Pro Tyr Trp Ser Val Thr
50 55 60
Lys Tyr Arg Asp Ile Met Ala Val Glu Thr Asn Pro Lys Val Phe Ser
65 70 75 80
Ser Glu Ala Lys Ser Gly Gly Ile Thr Ile Met Asp Asp Asn Ala Ala
85 90 95
Ala Ser Leu Pro Met Phe Ile Ala Met Asp Pro Pro Lys His Asp Val
100 105 110
Gln Arg Lys Thr Val Ser Pro Ile Val Ala Pro Glu Asn Leu Ala Thr
115 120 125
Met Glu Ser Val Ile Arg Gln Arg Thr Ala Asp Leu Leu Asp Gly Leu
130 135 140
Pro Ile Asn Glu Glu Phe Asp Trp Val His Arg Val Ser Ile Glu Leu
145 150 155 160
Thr Thr Lys Met Leu Ala Thr Leu Phe Asp Phe Pro Trp Asp Asp Arg
165 170 175
Ala Lys Leu Thr Arg Trp Ser Asp Val Thr Thr Ala Leu Pro Gly Gly
180 185 190
Gly Ile Ile Asp Ser Glu Glu Gln Arg Met Ala Glu Leu Met Glu Cys
195 200 205
Ala Thr Tyr Phe Thr Glu Leu Trp Asn Gln Arg Val Asn Ala Glu Pro
210 215 220
Lys Asn Asp Leu Ile Ser Met Met Ala His Ser Glu Ser Thr Arg His
225 230 235 240
Met Ala Pro Glu Glu Tyr Leu Gly Asn Ile Val Leu Leu Ile Val Gly
245 250 255
Gly Asn Asp Thr Thr Arg Asn Ser Met Thr Gly Gly Val Leu Ala Leu
260 265 270
Asn Glu Phe Pro Asp Glu Tyr Arg Lys Leu Ser Ala Asn Pro Ala Leu
275 280 285
Ile Ser Ser Met Val Ser Glu Ile Ile Arg Trp Gln Thr Pro Leu Ser
290 295 300
His Met Arg Arg Thr Ala Leu Glu Asp Ile Glu Phe Gly Gly Lys His
305 310 315 320
Ile Arg Gln Gly Asp Lys Val Val Met Trp Tyr Val Ser Gly Asn Arg
325 330 335
Asp Pro Glu Ala Ile Asp Asn Pro Asp Thr Phe Ile Ile Asp Arg Ala
340 345 350
Lys Pro Arg Gln His Leu Ser Phe Gly Phe Gly Ile His Arg Cys Val
355 360 365
Gly Asn Arg Leu Ala Glu Leu Gln Leu Asn Ile Leu Trp Glu Glu Ile
370 375 380
Leu Lys Arg Trp Pro Asp Pro Leu Gln Ile Gln Val Leu Gln Glu Pro
385 390 395 400
Thr Arg Val Leu Ser Pro Phe Val Lys Gly Tyr Glu Ser Leu Pro Val
405 410 415
Arg Ile Asn Ala
420
<210> 18
<211> 420
<212> PRT
<213> 結核分枝桿菌
<400> 18
Met Thr Glu Met Thr Val Ala Ala Asn Asp Ala Thr Asn Ala Ala Tyr
1 5 10 15
Gly Met Ala Leu Glu Asp Ile Asp Val Ser Asn Pro Val Leu Phe Arg
20 25 30
Asp Asn Thr Trp His Pro Tyr Phe Lys Arg Leu Arg Glu Glu Asp Pro
35 40 45
Val His Tyr Cys Lys Ser Ser Met Phe Gly Pro Tyr Trp Ser Val Thr
50 55 60
Lys Tyr Arg Asp Ile Met Ala Val Glu Thr Asn Pro Lys Val Phe Ser
65 70 75 80
Ser Glu Ala Lys Ser Gly Gly Ile Thr Ile Met Asp Asp Asn Ala Ala
85 90 95
Ala Ser Leu Pro Met Phe Ile Ala Met Asp Pro Pro Lys His Asp Val
100 105 110
Gln Arg Lys Thr Val Ser Pro Ile Val Ala Pro Glu Asn Leu Ala Thr
115 120 125
Met Glu Ser Val Ile Arg Gln Arg Thr Ala Asp Leu Leu Asp Gly Leu
130 135 140
Pro Ile Asn Glu Glu Phe Asp Trp Val His Arg Val Ser Ile Asp Leu
145 150 155 160
Thr Thr Lys Met Leu Ala Thr Leu Phe Asp Phe Pro Trp Asp Asp Arg
165 170 175
Ala Lys Leu Thr Arg Trp Ser Asp Val Thr Thr Ala Leu Pro Gly Gly
180 185 190
Gly Ile Ile Asp Ser Glu Glu Gln Arg Met Ala Glu Leu Met Glu Cys
195 200 205
Ala Thr Tyr Phe Thr Glu Leu Trp Asn Gln Arg Val Asn Ala Glu Pro
210 215 220
Lys Asn Asp Leu Ile Ser Met Met Ala His Ser Glu Ser Thr Arg His
225 230 235 240
Met Ala Pro Glu Glu Tyr Leu Gly Asn Ile Val Leu Leu Ile Val Gly
245 250 255
Gly Asn Asp Thr Thr Arg Asn Ser Met Thr Gly Gly Val Leu Ala Leu
260 265 270
Asn Glu Phe Pro Asp Glu Tyr Arg Lys Leu Ser Ala Asn Pro Ala Leu
275 280 285
Ile Ser Ser Met Val Ser Glu Ile Ile Arg Trp Gln Thr Pro Leu Ser
290 295 300
His Met Arg Arg Thr Ala Leu Glu Asp Ile Glu Phe Gly Gly Lys His
305 310 315 320
Ile Arg Gln Gly Asp Lys Val Val Met Trp Tyr Val Ser Gly Asn Arg
325 330 335
Asp Pro Glu Ala Ile Asp Asn Pro Asp Thr Phe Ile Ile Asp Arg Ala
340 345 350
Lys Pro Arg Gln His Leu Ser Phe Gly Phe Gly Ile His Arg Cys Val
355 360 365
Gly Asn Arg Leu Ala Glu Leu Gln Leu Asn Ile Leu Trp Glu Glu Ile
370 375 380
Leu Lys Arg Trp Pro Asp Pro Leu Gln Ile Gln Val Leu Gln Glu Pro
385 390 395 400
Thr Arg Val Leu Ser Pro Phe Val Lys Gly Tyr Glu Ser Leu Pro Val
405 410 415
Arg Ile Asn Ala
420
<210> 19
<211> 405
<212> PRT
<213> 單胞菌屬sp. JS666
<400> 19
Met Ser Glu Thr Val Ile Ile Ala Gly Ala Gly Gln Ala Ala Gly Gln
1 5 10 15
Ala Val Ala Ser Leu Arg Gln Glu Gly Phe Asp Gly Arg Ile Val Leu
20 25 30
Val Gly Ala Glu Pro Val Leu Pro Tyr Gln Arg Pro Pro Leu Ser Lys
35 40 45
Ala Phe Leu Ala Gly Thr Leu Pro Leu Glu Arg Leu Phe Leu Lys Pro
50 55 60
Pro Ala Phe Tyr Glu Gln Ala Arg Val Asp Thr Leu Leu Gly Val Ala
65 70 75 80
Val Thr Glu Leu Asp Ala Ala Arg Arg Gln Val Arg Leu Asp Asp Gly
85 90 95
Arg Glu Leu Ala Phe Asp His Leu Leu Leu Ala Thr Gly Gly Arg Ala
100 105 110
Arg Arg Leu Asp Cys Pro Gly Ala Asp His Pro Arg Leu His Tyr Leu
115 120 125
Arg Thr Val Ala Asp Val Asp Gly Ile Arg Ala Ala Leu Arg Pro Gly
130 135 140
Ala Arg Leu Val Leu Ile Gly Gly Gly Tyr Val Gly Leu Glu Ile Ala
145 150 155 160
Ala Val Ala Ala Lys Leu Gly Leu Ala Val Thr Val Leu Glu Ala Ala
165 170 175
Pro Thr Val Leu Ala Arg Val Thr Cys Pro Ala Val Ala Arg Phe Phe
180 185 190
Glu Ser Val His Arg Gln Ala Gly Val Thr Ile Arg Cys Ala Thr Thr
195 200 205
Val Ser Gly Ile Glu Gly Asp Ala Ser Leu Ala Arg Val Val Thr Gly
210 215 220
Asp Gly Glu Arg Ile Asp Ala Asp Leu Val Ile Ala Gly Ile Gly Leu
225 230 235 240
Leu Pro Asn Val Glu Leu Ala Gln Ala Ala Gly Leu Val Cys Asp Asn
245 250 255
Gly Ile Val Val Asp Glu Glu Cys Arg Thr Ser Val Pro Gly Ile Phe
260 265 270
Ala Ala Gly Asp Cys Thr Gln His Pro Asn Ala Ile Tyr Asp Ser Arg
275 280 285
Leu Arg Leu Glu Ser Val His Asn Ala Ile Glu Gln Gly Lys Thr Ala
290 295 300
Ala Ala Ala Met Cys Gly Lys Ala Arg Pro Tyr Arg Gln Val Pro Trp
305 310 315 320
Phe Trp Ser Asp Gln Tyr Asp Leu Lys Leu Gln Thr Ala Gly Leu Asn
325 330 335
Arg Gly Tyr Asp Gln Val Val Met Arg Gly Ser Thr Asp Asn Arg Ser
340 345 350
Phe Ala Ala Phe Tyr Leu Arg Asp Gly Arg Leu Leu Ala Val Asp Ala
355 360 365
Val Asn Arg Pro Val Glu Phe Met Val Ala Lys Ala Leu Ile Ala Asn
370 375 380
Arg Thr Val Ile Ala Pro Glu Arg Leu Ala Asp Glu Arg Ile Ala Ala
385 390 395 400
Lys Asp Leu Ala Gly
405
<210> 20
<211> 424
<212> PRT
<213> 分枝桿菌屬sp. HXN-1500
<400> 20
Met Ile His Thr Gly Val Thr Glu Ala Val Val Val Val Gly Ala Gly
1 5 10 15
Gln Ala Gly Ala Gln Thr Val Thr Ser Leu Arg Gln Arg Gly Phe Glu
20 25 30
Gly Gln Ile Thr Leu Leu Gly Asp Glu Pro Ala Leu Pro Tyr Gln Arg
35 40 45
Pro Pro Leu Ser Lys Ala Phe Leu Ala Gly Thr Leu Pro Leu Asp Arg
50 55 60
Leu Tyr Leu Arg Pro Ala Ala Phe Tyr Gln Gln Ala His Val Asp Val
65 70 75 80
Met Val Asp Thr Gly Val Ser Glu Leu Asp Thr Glu Asn Arg Arg Ile
85 90 95
Arg Leu Thr Asp Gly Arg Ala Ile Ser Phe Asp His Leu Val Leu Ala
100 105 110
Thr Gly Gly Arg Pro Arg Pro Leu Ala Cys Pro Gly Ala Asp His Pro
115 120 125
Arg Val His Tyr Leu Arg Thr Val Thr Asp Val Asp Arg Ile Arg Ser
130 135 140
Gln Phe His Pro Gly Thr Arg Leu Val Leu Val Gly Gly Gly Tyr Ile
145 150 155 160
Gly Leu Glu Ile Ala Ala Val Ala Ala Glu Leu Gly Leu Thr Val Thr
165 170 175
Val Leu Glu Ala Gln Thr Thr Val Leu Ala Arg Val Thr Cys Pro Thr
180 185 190
Val Ala Arg Phe Phe Glu His Thr His Arg Arg Ala Gly Val Thr Ile
195 200 205
Arg Cys Ala Thr Thr Val Thr Arg Ile His Asp Ser Ser Ser Thr Ala
210 215 220
Arg Ile Glu Leu Asp Ser Gly Glu Tyr Ile Asp Ala Asp Leu Val Ile
225 230 235 240
Val Gly Ile Gly Leu Leu Pro Asn Val Asp Leu Ala Ser Ala Ala Gly
245 250 255
Leu Thr Cys Glu Ser Gly Ile Val Val Asp Ser Arg Cys Gln Thr Ser
260 265 270
Ala Pro Gly Ile Tyr Ala Ala Gly Asp Cys Thr Gln Tyr Pro Ser Pro
275 280 285
Ile Tyr Gly Arg Pro Leu His Leu Glu Ser Val His Asn Ala Ile Glu
290 295 300
Gln Ala Lys Thr Ala Ala Ala Ala Ile Leu Gly Arg Asp Glu Pro Phe
305 310 315 320
Arg Gln Val Pro Trp Phe Trp Ser Asp Gln Tyr Asn Ile Lys Leu Gln
325 330 335
Thr Ala Gly Val Asn Glu Gly Tyr Asp Asp Val Ile Ile Arg Gly Asp
340 345 350
Pro Ala Ser Ala Ser Phe Ala Ala Phe Tyr Leu Arg Ala Gly Lys Leu
355 360 365
Leu Ala Val Asp Ala Ile Asn Arg Pro Arg Glu Phe Met Ala Ser Lys
370 375 380
Thr Leu Ile Ala Glu Arg Ala Glu Val Asp Pro Thr Gln Leu Ala Asp
385 390 395 400
Glu Ser Leu Pro Pro Thr Ala Leu Ala Ala Ala Val Asn Gly Pro Thr
405 410 415
Arg Ala Thr Ser Pro Thr Ser Leu
420
<210> 21
<211> 106
<212> PRT
<213> 單胞菌屬sp. JS666
<400> 21
Met Thr Lys Val Thr Phe Ile Glu His Asn Gly Thr Val Arg Asn Val
1 5 10 15
Asp Val Asp Asp Gly Leu Ser Val Met Glu Ala Ala Val Asn Asn Leu
20 25 30
Val Pro Gly Ile Asp Gly Asp Cys Gly Gly Ala Cys Ala Cys Ala Thr
35 40 45
Cys His Val His Ile Asp Ala Ala Trp Leu Asp Lys Leu Pro Pro Met
50 55 60
Glu Ala Met Glu Lys Ser Met Leu Glu Phe Ala Glu Gly Arg Asn Glu
65 70 75 80
Ser Ser Arg Leu Gly Cys Gln Ile Lys Leu Ser Pro Ala Leu Asp Gly
85 90 95
Ile Val Val Arg Thr Pro Leu Gly Gln His
100 105
<210> 22
<211> 106
<212> PRT
<213> 分枝桿菌屬sp. HXN-1500
<400> 22
Met Pro Lys Ile Thr Tyr Ile Asp Tyr Thr Gly Thr Ser Arg Cys Val
1 5 10 15
Asp Ala Glu Asn Gly Met Ser Leu Met Glu Ile Ala Ile Asn Asn Asn
20 25 30
Val Pro Gly Ile Asp Gly Asp Cys Gly Gly Glu Cys Ala Cys Ala Thr
35 40 45
Cys His Val His Val Asp Ala Asp Trp Leu Asp Lys Leu Pro Pro Ser
50 55 60
Ser Asp Gln Glu Val Ser Met Leu Glu Phe Cys Asp Gly Val Asp His
65 70 75 80
Thr Ser Arg Leu Gly Cys Gln Ile Lys Ile Cys Pro Thr Leu Asp Gly
85 90 95
Ile Val Val Arg Thr Pro Ala Ala Gln His
100 105
<210> 23
<211> 395
<212> PRT
<213> 枯草芽孢桿菌
<400> 23
Met Thr Ile Ala Ser Ser Thr Ala Ser Ser Glu Phe Leu Lys Asn Pro
1 5 10 15
Tyr Ser Phe Tyr Asp Thr Leu Arg Ala Val His Pro Ile Tyr Lys Gly
20 25 30
Ser Phe Leu Lys Tyr Pro Gly Trp Tyr Val Thr Gly Tyr Glu Glu Thr
35 40 45
Ala Ala Ile Leu Lys Asp Ala Arg Phe Lys Val Arg Thr Pro Leu Pro
50 55 60
Glu Ser Ser Thr Lys Tyr Gln Asp Leu Ser His Val Gln Asn Gln Met
65 70 75 80
Met Leu Phe Gln Asn Gln Pro Asp His Arg Arg Leu Arg Thr Leu Ala
85 90 95
Ser Gly Ala Phe Thr Pro Arg Thr Thr Glu Ser Tyr Gln Pro Tyr Ile
100 105 110
Ile Glu Thr Val His His Leu Leu Asp Gln Val Gln Gly Lys Lys Lys
115 120 125
Met Glu Val Ile Ser Asp Phe Ala Phe Pro Leu Ala Ser Phe Val Ile
130 135 140
Ala Asn Ile Ile Gly Val Pro Glu Glu Asp Arg Glu Gln Leu Lys Glu
145 150 155 160
Trp Ala Ala Ser Leu Ile Gln Thr Ile Asp Phe Thr Arg Ser Arg Lys
165 170 175
Ala Leu Thr Glu Gly Asn Ile Met Ala Val Gln Ala Met Ala Tyr Phe
180 185 190
Lys Glu Leu Ile Gln Lys Arg Lys Arg His Pro Gln Gln Asp Met Ile
195 200 205
Ser Met Leu Leu Lys Gly Arg Glu Lys Asp Lys Leu Thr Glu Glu Glu
210 215 220
Ala Ala Ser Thr Cys Ile Leu Leu Ala Ile Ala Gly His Glu Thr Thr
225 230 235 240
Val Asn Leu Ile Ser Asn Ser Val Leu Cys Leu Leu Gln His Pro Glu
245 250 255
Gln Leu Leu Lys Leu Arg Glu Asn Pro Asp Leu Ile Gly Thr Ala Val
260 265 270
Glu Glu Cys Leu Arg Tyr Glu Ser Pro Thr Gln Met Thr Ala Arg Val
275 280 285
Ala Ser Glu Asp Ile Asp Ile Cys Gly Val Thr Ile Arg Gln Gly Glu
290 295 300
Gln Val Tyr Leu Leu Leu Gly Ala Ala Asn Arg Asp Pro Ser Ile Phe
305 310 315 320
Thr Asn Pro Asp Val Phe Asp Ile Thr Arg Ser Pro Asn Pro His Leu
325 330 335
Ser Phe Gly His Gly His His Val Cys Leu Gly Ser Ser Leu Ala Arg
340 345 350
Leu Glu Ala Gln Ile Ala Ile Asn Thr Leu Leu Gln Arg Met Pro Ser
355 360 365
Leu Asn Leu Ala Asp Phe Glu Trp Arg Tyr Arg Pro Leu Phe Gly Phe
370 375 380
Arg Ala Leu Glu Glu Leu Pro Val Thr Phe Glu
385 390 395