專利名稱:用于生產能夠轉化阿拉伯糖的細胞的方法
技術領域:
本發明涉及用于生產能夠轉化阿拉伯糖的細胞的方法。本發明還涉及可通過所述方法生產的細胞。本發明進一步涉及其中使用這類細胞生產發酵產物例如乙醇的方法。
背景技術:
最近幾十年,傳統化石燃料(基于石油的燃料)的大規模消耗造成了高水平的污染。這與化石燃料的世界儲備并非有限的認識以及增長的環境意識一起刺激了研究替代性燃料(如乙醇)可行性的新動機,所述替代性燃料是以每升為基礎比無鉛汽油釋放更少CO2的無粒子燃燒燃料來源。盡管生物量衍生的乙醇可以通過得自許多不同來源的己糖的發酵來生產,但是,典型地用于商業規模生產燃料醇的底物如甘蔗和玉米淀粉是昂貴的。因此,燃料乙醇生產的提高會需要使用更低成本的原料。目前,只有衍生自植物生物量的木質纖維素原料能夠足量獲得,用于代替目前用于乙醇生產的作物。在大部分木質纖維素材料中,在C6糖之后的第 二常見的糖還包含相當大的量的C5糖(包括阿拉伯糖)。因此,對于經濟上可行的燃料生產工藝而言,己糖和戊糖均必須被發酵形成乙醇。酵母Saccharomycescerevisia是有活力的并且充分適合乙醇生產,但是不能夠轉化阿拉伯糖。另外,沒有一種天然存在的生物是已知能夠以高乙醇產量以及高乙醇生產力將木糖發酵成乙醇的。因此,對下述生物存在需要,所述生物具有這些特性從而能夠在商業上有活力地從木質纖維素原料生產乙醇。
發明內容
本發明的目的是提供能夠轉化阿拉伯糖的細胞,特別是酵母細胞。根據本發明達到了該目的,本發明提供了用于生產能夠轉化阿拉伯糖的細胞的方法,所述方法包括下述步驟:a)將基因araA、araB和araD引入不能夠轉化阿拉伯糖的宿主菌株,該細胞被命名為構建細胞;b)使構建細胞進行適應性進化直到獲得轉化阿拉伯糖的細胞,c)任選地,使第一阿拉伯糖轉化細胞進行適應性進化,以改進阿拉伯糖轉化;步驟b)或c)中產生的細胞被命名為第一阿拉伯糖轉化細胞;d)分析第一阿拉伯糖轉化細胞和構建細胞的基因組的一部分或全基因組;e)鑒定第一阿拉伯糖轉化細胞中的單核苷酸多態性(SNP);并f)在能夠轉化阿拉伯糖的細胞的合理設計中使用SNP信息;g)構建在步驟f)中設計的能夠轉化阿拉伯糖的細胞。除了酵母細胞BIE201外,本發明還提供了具有基因araA、araB和araD的酵母細胞,其中染色體VII具有通過電泳測定的從1300至1600Kb的大小。本發明還涉及多肽,所述多肽屬于下述多肽組成的組:a.多肽,其具有由在SSYl中具有置換E455終止子的多核苷酸SEQ IDNO:14編碼的序列,以及其變體多肽,其中一個或多個其他位置具有用AA反式超家族中已有的氨基酸的另一種氨基酸對氨基酸的突變;b.多肽,其具有由在YJR154W中具有置換D171G的多核苷酸SEQ IDNO: 16編碼的序列,以及其變體多肽,其中一個或多個其他位置具有用PhyH超家族中已有的保守氨基酸的另一種氨基酸對氨基酸的突變;c.多肽,其具有由在CEP3中具有置換S396G的多核苷酸SEQ ID NO:18編碼的序列;d.多肽,其具有由在GAL80中具有置換T146P的SEQ ID NO:20編碼的序列;和其變體多肽,其中一個或多個其他位置可具有用NADB Rossmann超家族中已有的保守氨基酸的氨基酸對氨基酸的突變。附圖簡述
圖1展示了載體pPWT006的物理圖譜。圖2展示了質粒pPWT018的物理圖譜,其序列在SEQ ID NO:1中給出。圖3展示了顯示雜交實驗結果的放射自顯影圖,所述雜交實驗顯示了在CEN.PK113-7D中的質粒pPWT080的一個拷貝的正確整合;圖4展示了質粒pPWT080的物理圖譜,其序列在SEQ ID NO:8中給出。圖5展示了在作為唯一碳源的2%阿拉伯糖上的參照菌株BIE104A2P1的需氧生長曲線,圖6展示了在作為唯一碳源的2%阿拉伯糖上的BIE104A2P1C的厭氧生長曲線,圖7展示了 BIE104的生長曲線(0D600的糖_、乙醇-和甘油濃度)和產生的C02 (ml/hr,第二軸),BIE104在2%葡萄糖上預培養并在具有5%葡萄糖、5%木糖、3.5%阿拉伯糖和I %半乳糖的Verduyn培養基中生長,所有%以w/w的形式。圖8展示了 BIE104A2P1C的生長曲線(0D600的糖_、乙醇-和甘油濃度)和產生的C02 (ml/hr,第二軸),BIE104A2Plc在2%葡萄糖上預培養并在具有5%葡萄糖、5%木糖、
3.5%阿拉伯糖和I %半乳糖的Verduyn培養基中生長。圖9展示了 BIE201的生長曲線(0D600的糖-、乙醇-和甘油濃度)和產生的C02 (ml/hr,第二軸),其在2%葡萄糖上預培養并在具有5%葡萄糖、5%木糖、3.5%阿拉伯糖和I %半乳糖的Verduyn培養基中生長,所有%以w/w的形式。圖10展示了雜交的示意圖。圖11展示了“標準化熔融曲線”(熔融曲線;上圖)和“標準化熔融峰”曲線(下圖)的例子。后者源于第一圖并顯示作為溫度函數的熒光信號的變化。展示菌株BIE104A2P1和BIE201。在該圖中測試的基因是YJR154w。兩個測試的菌株BIE201和BIE104A2P1之間探針的熔融溫度的不同是清楚的。圖12展示了在菌株BIE201中染色體VII的示意圖(覆蓋圖)。讀取深度闡釋為沿著染色體的位置的函數。染色體VII的一些部分表示為多重拷貝,即2倍或3倍重復出現。圖13展示了用溴化乙錠染色的CHEF凝膠。按照它們的大小使用CHEF技術將染色體分開。分析的菌株是BIE104(未轉化的酵母細胞)、BIE104A2Pla(不能消耗阿拉伯糖的初次轉化體,BIE104A2P1的同 義詞)、通過適應性進化源自BIE104A2P1的菌株BIE104A2Plc,其能夠在阿拉伯糖上生長和通過適應性進化源自BIE104A2Plc的菌株BIE201,其在厭氧條件下可在阿拉伯糖上生長。觀察到染色體的轉變(見正文)。菌株YNN295是標記物菌株(Bio-Rad)。圖14展示了用araA探針印跡和雜交的CHEF凝膠。按照它們的大小使用CHEF技術將染色體分開。分析的菌株是BIE104(未轉化的酵母細胞)、BIE104A2Pla(不能消耗阿拉伯糖的初次轉化體,BIE104A2P1的同義詞)、BIE104A2Plc,通過適應性進化源自BIE104A2P1的菌株,其能夠在阿拉伯糖上生長和通過適應性進化源自BIE104A2P1C的菌株BIE201,其在厭氧條件下可在阿拉伯糖上生長。觀察到染色體的轉變(見正文)。菌株YNN295是標記物菌株(Bio-Rad),用作染色體大小的參照。圖15展示了用ACTl探針印跡和雜交的CHEF凝膠。按照它們的大小使用CHEF技術將染色體分開。分析的菌株是BIE104(未轉化的酵母細胞)、BIE104A2Pla(不能消耗阿拉伯糖的初次轉化體,BIE104A2P1的同義詞)、BIE104A2Plc、通過適應性進化源自BIE104A2P1的菌株,其能夠在阿拉伯糖上生長和通過適應性進化源自BIE104A2P1C的菌株BIE201,其在厭氧條件下可在阿拉伯糖上生長。觀察到染色體的轉變(見正文)。菌株YNN295是標記物菌株(Bio-Rad),用作染色體大小的參照。圖16展示了用PNCl探針印跡和雜交的CHEF凝膠。按照它們的大小使用CHEF技術將染色體分開。分析的菌株是BIE104(未轉化的酵母細胞)、BIE104A2Pla(不能消耗阿拉伯糖的初次轉化體,BIE104A2P1的同義詞)、BIE104A2Plc,通過適應性進化源自BIE104A2P1的菌株,其能夠在阿拉伯糖上生長和通過適應性進化源自BIE104A2P1C的菌株BIE201,其在厭氧條件下可在阿拉伯糖上生長。觀察到染色體的轉變(見正文)。菌株YNN295是標記物菌株(Bio-Rad),用作染色體大小的參照。圖17展示了用HSFl探針印跡和雜交的CHEF凝膠。按照它們的大小使用CHEF技術將染色體分開。分析的菌株是BIE104(未轉化的酵母細胞)、BIE104A2Pla(不能消耗阿拉伯糖的初次轉化體,BIE104A2P1的同義詞)、BIE104A2Plc,通過適應性進化源自BIE104A2P1的菌株,其能夠在阿拉伯糖上生長和通過適應性進化源自BIE104A2P1C的菌株BIE201,其在厭氧條件下可在阿拉 伯糖上生長。觀察到染色體的轉變(見正文)。菌株YNN295是標記物菌株(Bio-Rad),用作染色體大小的參照。圖18展示了用YGR031W探針印跡和雜交的CHEF凝膠。按照它們的大小使用CHEF技術將染色體分開。分析的菌株是BIE104(未轉化的酵母細胞)、BIE104A2Pla(不能消耗阿拉伯糖的初次轉化體,BIE104A2P1的同義詞)、BIE104A2Plc,通過適應性進化源自BIE104A2P1的菌株,其能夠在阿拉伯糖上生長和通過適應性進化源自BIE104A2Plc的菌株BIE201,其在厭氧條件下可在阿拉伯糖上生長。觀察到染色體的轉變(見正文)。菌株YNN295是標記物菌株(Bio-Rad),用作染色體大小的參照。圖19展示了來自雜交BIE104A2P1XBIE201的10個剝離的子囊的例子。子囊用Singer Micromanipulator剝離。每個子囊由4個子囊孢子組成。這些子囊孢子彼此分開并以不同的距離放在瓊脂平板上。理論上,4個單倍體孢子分離物可產生4個單獨菌落。在一個“圓柱體”中的4個菌落起源于I個子囊。圖20圖解菌株BIE252在BAM (生物活性監測器,Halotec,TheNetherlands)中的性能。菌株在Verduyn培養基2%葡萄糖中預培養。BAM中的應用在厭氧條件下,在補充5%葡萄糖、5%木糖、3.5%阿拉伯糖、I %半乳糖和0.5%甘露糖的pH4.2的Verduyn培養基上進行。圖21圖解菌株BIE252AGAL80在BAM中的性能。菌株在Verduyn培養基2%葡萄糖中預培養。BAM中的應用在厭氧條件下,在補充5%葡萄糖、5%木糖、3.5%阿拉伯糖、I %半乳糖和0.5%甘露糖的pH4.2的Verduyn培養基上進行。圖22展示了將完全己二酸路徑雙交換整合進入基因組的示意圖。圖23展示了用分析方法測量的己二酸標準物和樣品產生的色譜圖。圖24展示了質粒pGBS416ARABD的物理圖譜。序列表簡沭SEQ ID NO:1 展示了 pPWT018 的序列;SEQ ID NO:2展示了用于檢查pPWT018整合的引物序列;SEQ ID NO:3展示了用于檢查pPWT018整合(用SEQ ID N0:2)并且用于檢查PPWT018拷貝數(用SEQ ID NO:4)的引物;SEQ ID NO:4展示了用于檢查pPWT018拷貝數的引物序列;SEQ ID NO:4展示了結合SEQ ID NO:4用于檢查基因組中的pPWT018的存在的引物序列;SEQ ID NO:6展示了用于產生SIT2探針的正向引物序列;SEQ ID NO:7展示了用于產生SIT2探針的反向引物序列;SEQ ID NO:8 展示了質粒 pPWT080 的序列;SEQ ID NO:9展示了用于檢查GRE3-基因座的3’-末端處的pPWT080的正確整合(用SEQ ID NO: 10)并且用于檢查質粒PPWT080的拷貝數(用SEQID N0:11)的正向引物序列;SEQ ID NO:10展示了用于檢查GRE3-基因座的3’ -末端處的pPWT080的正確整合的反向引物序列;SEQ ID NO:11展示了檢查質粒pPWT080的拷貝數(用SEQ ID NO:10)的反向引物序列;SEQ ID NO:12展示了用于產生RKIl-探針的正向引物序列;SEQ ID NO:13展示了用于產生RKIl-探針的反向引物序列;SEQ ID NO:14展示了針對在野生型菌株BIE104中的SSYl基因的序列的序列;SEQ ID NO:15展示了在菌株BIE104A2Plc和BIE201中的SSYl基因的序列;SEQ ID NO:16展示了在野生型菌株BIE104中的YJR154w基因的序列;SEQ ID NO:17 展示了在菌株 BIE104A2Plc 和 BIE201 中的 YJRl54w 基因的序列;SEQ ID NO:18展示了在野生型菌株BIE104中的CEP3基因的序列;SEQ ID NO:19展示了在菌株BIE104A2Plc和BIE201中的CEP3基因的序列;
SEQ ID NO:20展示了在野生型菌株BIE104中的YPL277c基因的序列;SEQ ID NO:21 展示了在菌株 BIE104A2Plc 和 BIE201 中的 YPL277c 基因的序列;SEQ ID NO:22展示了在野生型菌株BIE104中的GAL80基因的序列;SEQ ID NO:23展示了在菌株BIE201中的GAL80基因的序列;SEQ ID NO 24展示了正向引物SSYl的序列;SEQ ID NO 25展示了反向引物SSYl的序列;
SEQIDNO 26展示了正向引物YJRl54w的序列;SEQIDNO 27展示了反向引物YJR154w的序列;SEQIDNO 28展示了正向引物CEP3的序列;SEQIDNO 29展示了反向引物CEP3的序列;SEQIDNO 30展示了正向引物YPL277c的序列;SEQIDNO 31展示了反向引物YPL277c的序列;SEQIDNO 32展示了正向引物GAL80的序列;SEQIDNO 33展示了反向引物GAL80的序列;SEQIDNO 34 展示了 H1-Res 探針 SSYl 的序列;SEQIDNO 35 展示了 H1-Res 探針 YJR154w 的序列;SEQIDNO 36 展示了 H1-Res 探針 CEP3 的序列;SEQIDNO 37 展示了 H1-Res 探針 YPL277c 的序列;SEQIDNO 38 展示了 H1-Res 探針 GAL80 的序列;SEQIDNO 39展示了正向引物YGL057c的序列;SEQIDNO 40展示了反向引物YGL057c的序列;
SEQIDNO 41展示了正向引物SDS23的序列;SEQIDNO 42展示了反向引物SDS23的序列;SEQIDNO 43展示了正向引物ACTl的序列;SEQIDNO 44展示了反向引物ACTl的序列;SEQIDNO 45展示了正向引物araA的序列;SEQIDNO 46展示了反向引物araA的序列;SEQIDNO 47展示了正向引物ACTl的序列;SEQIDNO 48展示了反向引物ACTl的序列;SEQIDNO 49展示了正向引物PNCl的序列;SEQIDNO 50展示了反向引物PNCl的序列;SEQIDNO 51展示了正向引物HSFl的序列;SEQIDNO 52展示了反向引物HSFl的序列;SEQIDNO 53展示了正向引物YGR031w的序列;SEQIDNO 54展示了反向引物YGR031w的序列;SEQIDNO 55 展示了正向引物(matA, mata)的序列;SEQIDNO 56展示了反向引物matA的序列;SEQIDNO 57 展示了反向引物 mata (alpha)的序列;SEQIDNO 58 展示了正向引物 GAL80::kanMX 的序列;SEQIDNO 59 展示了反向引物 GAL80::kanMX 的序列;SEQIDNO 60展示了用于擴增INTlLF的正向引物序列;SEQIDNO 61展示了用于擴增與Adi21表達盒具有50bp重疊側翼的INTlLF的反向引物序列;SEQIDNO 62展示了用于擴增具有50bp側翼INTlLF的Adi21表達盒的正向引物序列;
SEQ ID NO63展示了用于擴增Adi21表達盒的反向引物序列;SEQ ID NO64展示了用于擴增Adi22表達盒的正向引物序列;SEQ ID NO65展示了用于擴增Adi22表達盒的反向引物序列;SEQ ID NO66展示了用于擴增Adi23表達盒的正向引物序列;SEQ ID NO67展示了用于擴增Adi23表達盒的反向引物序列;SEQ ID NO68展示了用于擴增來自pUG7的與Adi23具有50bp側翼重疊的kanMX標記物的正向引物序列;SEQ ID NO69展示了用于擴增來自pUG7的與Adi8具有50bp側翼重疊的kanMX標記物的反向引物序列;SEQ ID NO70展示了用于擴增與pUG7的kanMX具有25bp側翼重疊的Adi8表達盒的正向引物序列;SEQ ID NO71展示了 Adi8表達盒的反向引物序列;SEQ ID NO72展示了用于擴增Adi24表達盒的正向引物序列;SEQ ID NO73展示了用于擴增Adi24表達盒的反向引物序列;SEQ ID NO74展示了用于擴增Adi25表達盒的正向引物序列;SEQ ID NO75展示了用于擴增與SucC具有50bp重疊的Adi25表達盒的反向引物序列; SEQ ID NO76展示了用于擴增與Adi25具有50bp重疊的SucC的正向引物序列;SEQ ID NO77展示了用于擴增SucC表達盒的反向引物序列;SEQ ID NO78展示了用于擴增SucD表達盒的正向引物序列;SEQ ID NO79展示了用于擴增SucD表達盒的反向引物序列;SEQ ID NO80展示了用于擴增acdh67表達盒的正向引物序列;SEQ ID NO81展示了用于擴增與INTRF具有50bp側翼重疊的acdh67構建體的反向引物序列;SEQ ID NO82展示了用于擴增酵母基因組上INTlLF位點的正向引物序列;SEQ ID NO83展示了反向引物用于擴增酵母基因組上INTlLF位點的序列;SEQ ID NO84 展示了 ADI21 PCR 片段的序列;SEQ ID NO85 展示了 ADI22 PCR 片段的序列;SEQ ID NO86 展示了 ADI23 PCR 片段的序列;SEQ ID NO87 展示了 ADI8 PCR 片段的序列;SEQ ID NO88 展示了 ADI24 PCR 片段的序列;SEQ ID NO89 展示了 ADI25 PCR 片段的序列;SEQ ID NO90 展示了 SUCC PCR 片段的序列;SEQ ID NO91 展示了 SUCD PCR 片段的序列;SEQ ID NO92 展示了 ACDH67PCR 片段的序列;SEQ ID NO93展示了 KANMX標記物片段的序列;SEQ ID NO94 展示了 INTlLF PCR 片段的序列;SEQ ID NO95 展示了 INTlRF PCR 片段的序列;SEQ ID NO96展示了 araABD表達盒的正向引物序列;
SEQ ID NO 97展示了 araABD表達盒的反向引物序列SEQ ID NO 98 展示了 Tyl:: araABD 的正向引物序列;SEQ ID NO 99 展示了 TYl:: araABD 的反向引物序列;SEQ ID NO 100 展示了 Tyl::kanMX 的正向引物序列;SEQ ID NO 101 展示了 Tyl::kanMX 的反向引物序列。發明詳述在本說明書和附帶的權利要求書中,詞語“包含”和“包括”及其變體如“包含comprises","包含")、“包括包括"和"包括")應被解釋為包含在內。也就是說,在上下文允許時,這些詞語旨在傳達可能包括未明確指出的其它元素或整數。冠詞“一個”(“a”和“an”)在本文中被用于表示一個或多于一個(即一個或至少一個)所述冠詞的語法客體。例如,“一個元件”可表示一個元件或多于一個元件。本文所述的本發明的多個實施方式可以交叉組合。本發明提供了用于生產能夠轉化阿拉伯糖的細胞的方法,所述方法包括步驟a)至g),這些將在本文中詳細描述:步驟a)將基因araA、araB和araD引入不能夠轉化阿拉伯糖的宿主菌株,該細胞被命名為構建細胞;步驟a)將在說明書 中下文詳細描述并將通過例子闡釋。步驟b)和c)使構建細胞進行適應性進化直到獲得轉化阿拉伯糖的細胞,任選地,使第一阿拉伯糖轉化細胞進行適應性進化,以改進阿拉伯糖轉化;步驟b)或c)中產生的細胞被命名為第一阿拉伯糖轉化細胞;步驟b)和c)將在適應性進化下在說明書中下文詳細描述并通過例子闡釋。步驟d)分析第一阿拉伯糖轉化細胞和構建細胞的基因組的一部分或全基因組;使用基因組重測序通常技術進行該步驟d)。步驟e)鑒定第一阿拉伯糖轉化細胞中的單核苷酸多態性(SNP);通過查看第一阿拉伯糖轉化細胞和其構建細胞之間的差異來進行步驟e)步驟f)使用在能夠轉化阿拉伯糖的合理設計的細胞中的SNP的信息;在步驟f)中,技術人員將知道哪種SNP阿拉伯糖轉化是有貢獻的,并基于該信息能用常用技術設計改進的菌株。在步驟e)、f)和/或g)中技術人員優選地使用表現分型技術,即鑒定具有期望特征的細胞并結合基因分型技術,即鑒定與選擇的特征關聯的候選基因。表現分型技術的例子是在單糖或糖混合物的存在下在搖瓶或發酵罐中的生長實驗。可應用在固體瓊脂培養基上的生長檢驗。但是,可使用合適已知方法。基因分型技術的例子是重測序技術比如Solexa等等、定量PCR、Southern印跡。但可使用其他合適的已知方法。步驟g)構建在步驟f)中設計的能夠轉化阿拉伯糖的細胞。在步驟g)中,可使用構建新菌株的所有常用技術。在一種實施方式中,使不同的菌株(親本)合并,以使親本的有利特性合并。例如可使用雜交技術,包括步驟b)或c)的菌株與與不具有在步驟b)或c)的菌株中存在的所有SNP的菌株雜交。例如,通過稱為適應性進化的方法,用對發酵阿拉伯糖的能力而言必要的基因或增強發酵阿拉伯糖的能力的基因(所有基因一起命名為ARA)轉化的單倍體酵母菌株可被增強。在適應性進化方法期間,三個命名為mutl、mut2和mut3的突變已被引入基因組。此類酵母菌株的基因型可被寫為mutl mut2 mut3 AM。此類酵母菌株可與另一單倍體酵母菌株雜交,所述另一單倍體酵母菌株還包含就阿拉伯糖轉化而言需要的基因,但尚不能進行阿拉伯糖轉化,因為其缺少進行阿拉伯糖轉化的額外突變。但是,該菌株可具有另一有益特性,比如對抑制劑的耐受性。該特性被命名為ABC。此種方法在圖10中闡釋。在一種實施方式中,在上述方法中,能夠轉化阿拉伯糖的酵母細胞具有較之宿主菌株而言擴增的染色體,其中擴增的染色體具有與其中araA、araB和araD基因被引入宿主菌株的染色體相同的數目。在一種實施方式中擴增的染色體是染色體VII。在一種實施方式中,在酵母細胞中,(較之宿主菌株)擴增了動粒周圍的部分染色體VII。在一種實施方式中,染色體VII左臂上的區域擴增了三次。在一種實施方式中,染色體VII的部分右臂擴增了兩次并且鄰近部分擴增了三次(見圖12)。擴增三次的染色體VII右臂上的部分含有在強構建型啟動子控制下的阿拉伯糖表達盒,即基因araA、araB和araD。除了酵母細胞BIE201外,本發明還涉及具有araA、araB和araD基因的酵母細胞,其中染色體VII具有如通過電泳測定的從1300至1600Kb的大小。菌株BIE201已在W02011003893 中公開。BIE201具有所有單核苷酸多態性:SSY1基因中的G1363T、YJR154w基因中的A512T、CEP3基因中的Al 186G和GAL80基因中的A436C。在一種實施方式中,在酵母細胞中,araA、araB和araD基因的拷貝數是每種2至10個,在一種實施方式中,每種2至8個或3至5個。araA、araB和araD基因的拷貝數可以是2、3、4、5、6、7、8、9或10個。拷貝數可以用對技術人員而言已知的方法測定,合適的方法在實施例中闡釋,并且結 果在例如圖12中示出。在一種實施方式中,酵母細胞的單核苷酸多態性的兩種或多種但不是不是全部選自由下述突變組成的組=SSYl基因中的G1363T、YJR154w基因中的A512T、CEP3基因中的A1186G和GAL80基因中的A436C。在一種實施方式中,酵母細胞具有單種多態性GAL80基因中的A436C。在一種實施方式中,酵母細胞具有單種多態性CEP3基因中的A1186G。性接合通過可擴散分子、信息素介導的酵母中的交配可容易證明(Manney, Duntze &Betz 1981)。當在培養皿中的瓊脂生長培養基表面上混合相反交配型的細胞時,2至3個小時內變化顯而易見。由于每一類型的細胞將其信息素分泌進培養基,其對由相反類型產生
的信息素有反應(MacKay Manney 1974)。它們各自通過分化為專門的功能形式-配子
起反應。細胞停止分裂并改變它們的形狀。它們伸長并成為梨形的。這些特征性細胞已被稱為“梨形細胞(shmoos) ”。接觸或近似靠近的相反交配型的細胞在表面上結合并融合在一起形成具有中心縊痕的特征性“花生”形狀,即兩個梨形細胞在它們的小末端處融合。每一結合對內的兩個單倍體核融合成為二倍體核,形成真正的合子。二倍體迅速在縊痕處發芽,形成特征性的“三葉草”圖。人們在顯微鏡下能容易地觀察到所有這些階段。通過單倍體細胞分泌的交配信息素是通過瓊脂擴散的小的肽分子(Betz, Manney& Duntze 1981)。因此,它們的存在和對相反交配型的細胞的作用易于證明。如果交配型a (alpha)的細胞在瓊脂培養基上過夜培養,高濃度的信息素在生長周圍的瓊脂中累積。如果交配型a(matA或mata)的細胞位于該瓊脂上,它們在兩個小時內開始經歷“梨形細胞”轉化。可在其中已生長交配型a (alpha)細胞的液體培養基中證明相同的作用。減數分裂梨形細胞是酵母中的配子。只有當存在相反交配型的細胞時,所述梨形細胞從正常營養性單倍體細胞中分化。以類似方式,任何二倍體細胞可經歷減數分裂形成具有成為配子的潛能的單倍體(Esposito & Klapholzl981 ;Fowell 1969)。減數分裂是孢子形成的一部分過程,其發生在當二倍體細胞轉移至營養不平衡培養基上時,但是當子囊變得相當突出時,只有在3-5天之后該變化在顯微鏡下變得顯而易見。理論上,所有的子囊應當包含4個孢子,但實際上,一些僅僅包含2個或3個。子囊具有特征性形狀。用容易獲得的消化酶粗制制劑(例如酵母裂解酶,蝸牛酶)處理孢子形成混合物將去除子囊的壁,釋放孢子。當在子囊中的或被釋放的孢子回到營養充足的環境時,它們萌發并在穩定的單倍體階段經歷營養生長。在稱為a和a (alpha)的2個交配型中出現單倍體菌。每個子囊中,2個孢子是正常的交配型a(matA)并且另外2個是a (mata(alpha))型。當一種交配型的細胞遇到另一種交配型的細胞時,它們啟動一系列的事件導致接合(見性接合)。結果是二倍體細胞,其通過在穩定的二倍體階段的有絲細胞分裂生長。如果人們僅僅將形成孢子的細胞培養物轉移至生長培養基,結果是單倍體菌株和新的二倍體菌株的混合種群,所述二倍體菌株與來自二倍體高級生物體之間的雜交的生殖相似。通常,酵母遺傳學家隨機或通過微操作分離孢子,以保護單倍體菌株交配并形成下一代二倍體菌株。該控制程度和在單倍體階段觀察遺傳特性的能力使得酵母的遺傳分析有力和有效。話應(adaption)適應是一種進化過程,藉此種群變得更加適合(適應)其一種或多種棲息地(棲息地)。該過程在若干到許多代中發生,并且是生物學的基本現象之一。術語適應也可以表示對生物存活而言特別重要的特征。此類適應在可變種群中通過天然選擇由更成功地進行繁殖的、更好地適應的形式生產。環境條件的改變改變了天然選擇的結果,影響所造成的適應的選擇性益處(selective benefits),改善生物在新條件下的適合度(fitness)。在極端環境改變的情況下,有益適應的出現和固定對存活而言可以是至關重要的。大量不同的因素(例如養分可用度、溫度、氧可用度等等)能夠驅動適應性進化。話合度(Fitness)適應性(在給定棲息地集合中生物能夠生活和繁殖的程度)和適合度之間存在清楚的聯系。適合度是天然選擇率的一種估計量和預測器。通過應用天然選擇,替代性表型的相對頻率可隨著時間而變化,如果它們可以遺傳的話。遺傳改奪當天然選擇作用于種群的遺傳變異性時,遺傳改變是潛在的機制。通過這種方式,種群遺傳適應于其環境。遺傳改變可導致可見的結構,或者以適應改變的棲息地的方式調節生物的生理活性。
可出現棲息地的頻繁變化。因此,接著適應的過程從不會最終結束。及時地,可能出現環境逐步變化并且物種越來越好地適應其環境。另一方面,可能出現環境變化相對迅速并且接著物種越來越不能良好適應。適應是遺傳過程,其在某種程度上一直在進行,當種群不改變棲息地或環境時也在進行。DNA序列中的單個核苷酸可改變(置換)、去除(缺失)或添加(插入)。插入或缺失SNP(InDel)可轉變翻譯框。單核苷酸多態性可落入基因的編碼序列(開放閱讀框或0RF)內、基因的非編碼區域(如啟動子序列、終止子序列等等)或基因之間的基因間區域。由于遺傳密碼的兼并性,編碼序列中的SNP未必改變在轉錄和翻譯之后產生的相應的蛋白質的氨基酸序列。其中兩種形式產生相同多肽序列的SNP稱為同義的(同義突變)。如果產生不同的多肽序列,它們是非同義的。非同義的變化可以是錯義的或無義的。錯義變化在相應的多肽中產生不同的氨基酸,而無義變化產生過早的終止密碼子,有時導致形成截短的蛋白質。例如通過改變的轉錄因子結合或相應的mRNA穩定性,不在蛋白質-編碼區域的SNP可仍具有基因表達的結果。可在DNA中出現的變化不必限于單個核苷酸的變化(置換、缺失或插入),而是也可包含兩個或多個核苷酸的變化(小細胞核變異)。另外,可出現染色體易位。染色體易位是由非同源染色體之間的部分重排造成的染色體畸形。尤其,根據本發明在下述閱讀框中產生SNP:SSYU CEP3和GAL80。SSYl在這里是SPS質膜氨基酸傳感器系統(Ssylp-Ptr3p-Ssy5p)的組分,其感知外部的氨基酸濃度并傳送導致調節氨基酸通透酶基因表達的細胞內信號。CEP3在這里是必須的動粒蛋白質,CBF3復合物的組分,其結合著絲粒的⑶EIII區域;包含N-末端Zn2Cys6類型鋅指結構域、C-末端酸性結構域和推測的卷曲螺旋二聚化結構域。GAL80在這里是參與在缺少半乳糖的情況下抑制GAL基因的轉錄調節子。通常其通過Gal4p抑制轉錄活性并通過Gal3p或Gallp結合釋放抑制。根據本發明,已經顯示基因SSYl、CEP3和GAL80中的SNP對于細胞能夠發酵混合糖組合物而言是重要的。進行BLAST搜索用于在這些基因中發現SNP。經鑒定的SNP的概況在表I中給出: 表1:本發明的SNP的概況
權利要求
1.生產能夠轉化阿拉伯糖的細胞的方法,其包括下述步驟: a)將基因araA、araB和araD引入不能夠轉化阿拉伯糖的宿主菌株,該細胞被命名為構建細胞; b)使所述構建細胞進行適應性進化,直到獲得轉化阿拉伯糖的細胞, c)任選地,使第一阿拉伯糖轉化細胞進行適應性進化,以改善阿拉伯糖轉化;在步驟b)或c)中生產的所述細胞被命名為第一阿拉伯糖轉化細胞; d)分析所述第一阿拉伯糖轉化細胞和所述構建細胞的全基因組或部分基因組; e)鑒定所述第一阿拉伯糖轉化細胞中的單核苷酸多態性(SNP);和 f)在能夠轉化阿拉伯糖的細胞的合理設計中使用SNP的信息; g)構建在步驟f)中設計的能夠轉化阿拉伯糖的所述細胞。
2.根據權利要求1的方法,其中在步驟e)、f)和/或g)中一種或多種分表型技術與一種或多種分表型技術組合使用。
3.根據權利要求1方法或2的方法,其中,在所述方法中,所述能夠轉化阿拉伯糖的酵母細胞具有與所述宿主菌株相比擴增的染色體,其中所述擴增的染色體具有與所述宿主菌株中的araA、araB和araD基因被引入其中的所述染色體相同的數目。
4.根據權利要求3的方法,其中所述擴增的染色體是染色體VII。
5.除了酵母細胞BIE20 1之外,具有araA、araB和araD基因的酵母細胞,所述酵母細胞中染色體VII具有如通過電泳測定的從1300至1600Kb的大小。
6.根據權利要求5的酵母細胞,其中所述araA、araB和araD基因的拷貝數是每種3至5個。
7.根據權利要求6的酵母細胞,其具有選自由下述突變組成的組的一種或多種所述單核苷酸多態性:SSY1基因中的G1363T、YJR154W基因中的A512T、CEP3基因中的A1186G和GAL80基因中的A436C。
8.根據權利要求7的酵母細胞,其具有GAL80基因中的A436C的單核苷酸多態性。
9.根據權利要求8的酵母細胞,其還具有CEP3基因中的A1186G的單核苷酸多態性。
10.屬于由下述多肽組成的組的多肽: a.多肽,其具有由在SSYl中具有置換E455終止子的多核苷酸SEQIDN0:14編碼的序列,以及其變體多肽,其中一個或多個其他位置具有用作為AA反式超家族中已有的氨基酸的另一種氨基酸對氨基酸的突變; b.多肽,其具有由在YJR154W中具有置換D171G的多核苷酸SEQIDNO:16編碼的序列,以及其變體多肽,其中一個或多個其他位置具有用作為PhyH超家族中已有的保守氨基酸的另一種氨基酸對氨基酸的突變; c.多肽,其具有由在CEP3中具有置換S396G的多核苷酸SEQIDNO:18編碼的序列; d.多肽,其具有由在GAL80中具有置換T146P的SEQID NO:20編碼的序列; 和其變體多肽,其中一個或多個其他位置可具有用作為NADBRossmann超家族中已有的保守氨基酸的氨基酸對氨基酸的突變。
11.由包含葡萄糖、半乳糖、阿拉伯糖和木糖的糖組合物生產一種或多種發酵產品的方法,其中用根據權利要求5-9任一項的酵母細胞發酵所述糖組合物。
12.根據權利要求11的方法,其中所述糖組合物通過下述由木質纖維素材料生產:a)預處理一種或多種木質纖維素材料以生產經預處理的木質纖維素材料; b)酶處理所述經預處理的木質纖維素材料以生產所述糖組合物。
13.根據權利要求11或12的方法,其中所述發酵是厭氧進行的。
14.根據權利要求11-13任一項的方法,其中所述發酵產品選自由下述組成的組:乙醇;正丁醇;異丁醇;乳酸;3_羥基-丙酸;丙烯酸;乙酸;琥珀酸;延胡索酸;蘋果酸;衣康酸;馬來酸;檸檬酸;己二酸;氨基酸,比如賴氨酸、甲硫氨酸、色氨酸、蘇氨酸和天冬氨酸;`1,3_丙二醇;乙烯;甘油;β-內酰胺抗生素和頭孢菌素;維生素;藥物制劑;動物飼料添加劑;專用化學品;化學原料;塑料;溶劑;燃料,包括生物燃料和生物氣或有機聚合物和工業酶,諸如蛋白酶、纖維素酶、淀粉酶、葡聚糖酶、乳糖酶、脂肪酶、裂解酶、氧化還原酶、轉移酶或木聚糖酶。`
全文摘要
本發明涉及用于生產能夠轉化阿拉伯糖的細胞的方法,其包含下述步驟a)將基因AraA、araB和araD引入不能夠轉化阿拉伯糖的宿主菌株,該細胞被命名為構建細胞;b)使構建細胞進行適應性進化直到獲得轉化阿拉伯糖的細胞;c)任選地,使第一阿拉伯糖轉化細胞進行適應性進化,以改進阿拉伯糖轉化;在步驟b)或c)中生產的細胞被命名為第一阿拉伯糖轉化細胞;d)分析第一阿拉伯糖轉化細胞和構建細胞的全基因組或部分基因組;e)鑒定第一阿拉伯糖轉化細胞中的單核苷酸多態性(SNP);和f)在能夠轉化阿拉伯糖的細胞的合理設計中使用SNP的信息;g)構建在步驟f)中設計的能夠轉化阿拉伯糖的細胞。
文檔編號C07K14/395GK103119053SQ201180020279
公開日2013年5月22日 申請日期2011年4月19日 優先權日2010年4月21日
發明者保羅·克萊斯森, 比安卡·伊麗莎白·瑪麗亞·吉勒森, 威爾伯特·赫爾曼·馬里·海涅, 吉斯博蒂娜·皮特奈拉·蘇勒庫姆·范 申請人:帝斯曼知識產權資產管理有限公司