專利名稱:能產生用于降解木質纖維素材料的酶的宿主細胞的制作方法
技術領域:
本發明涉及能生產從纖維素酶、半纖維素酶和果膠酶的組中選擇的至少四種不同的酶的宿主細胞,制備所述宿主細胞的方法,通過所述宿主細胞產生的酶組合物,使用所述宿主細胞產生酶組合物的方法,使用酶組合物對木質纖維素材料糖化的方法和使用酶組合物制備發酵產物的方法。
_4]
背景技術:
碳水化合物組成地球上最豐量的有機化合物。然而,許多這類碳水化合物隱蔽在 復雜聚合物中,包括淀粉(種子和谷物中的主要儲存碳水化合物)和已知為木質纖維素的碳水化合物與木質素的集合。木質纖維素的主要碳水化合物組分是纖維素、半纖維素和果膠。這些復雜的聚合物通常被統稱為木質纖維素。從由于OPEC減少石油輸出而導致石油危機爆發的70年代開始,可再生的木質纖維素生物質成為可發酵的糖的生物轉化吸引了研究人員強烈的注意力,所述可發酵的糖隨后被發酵產生醇(例如乙醇),作為液體燃料的替代品。在過去二十年間,乙醇已被廣泛使用,在美國作為與汽油的10%的摻合物,或在巴西作為車輛的純燃料。更最近實現了E85(85%乙醇摻合物)的使用,特別是用于清潔城市應用。燃料生物乙醇的重要性將會隨著油價的提高及其來源的逐漸耗盡而提高。另外,可發酵的糖被用于生產塑料、聚合物和其他基于生物的制品,并且預期這一工業將大幅增長,從而提高了對豐量的低成本可發酵糖的需求,所述可發酵糖可以被用作原料來代替基于石油的原料。大量碳水化合物在植物生物質中的隱蔽提供了糖(五碳糖以及六碳糖)形式的大量潛在的能量來源,所述糖能夠被用于大量工業和農業過程。然而,這些碳水化合物的大量能源潛力目前利用不足,因為糖封閉在復雜聚合物中并因此不容易進行發酵。由植物生物質生產糖的方法會提供大量的、經濟上有競爭性的原料,用于發酵成化學品、塑料、燃料。與纖維素原料的種類無關,酶的成本和水解效率是限制生物質的生物轉化方法商業化的主要因素。微生物生產的酶的生產成本與產酶菌株的生產力密切相關。菌株的“生產力”表示每個時間在發酵液中產生的總蛋白或酶活性的量,例如kg蛋白/(m3發酵液 年)或酶單位/(m3發酵液 年)。“酶單位”是在某些確定的條件下確定量的蛋白轉化確定底物的能力。
發明內容
為了產生用于微生物中生物質轉化的酶,通常需要獨立的“纖維素酶誘導物”的存在。由于下述原因,纖維素酶誘導物不是有優勢的。第一,誘導物例如植物材料可具有可變組分,這對從編碼纖維素酶、半纖維素酶和果膠酶的多核苷酸組中選擇的異源多核苷酸的表達的可控性不是有優勢的。第二,在誘導物可用于誘導從纖維素酶、半纖維素酶和果膠酶的組中選擇的至少四種不同的酶產生之前,需要能量來滅菌用于誘導的植物材料。第三,植物材料會嚴重污染發酵設備。第四,誘導物可導致纖維素酶生產培養基的粘性較高,在所述培養基中宿主細胞表達從編碼纖維素酶、半纖維素酶和果膠酶的多核苷酸組中選擇的至少四種不同的多核苷酸。第五,存在誘導物時,特別是當其已被預處理時,可導致對宿主細胞有害的抑制劑產生。“纖維素酶誘導物”在本文中被定義為誘導宿主細胞中纖維素酶產生的化合物。纖維素酶誘導物的例子包括純的纖維素、纖維二糖、槐糖和龍膽二糖或任何木質纖維素材料。因而,提供用于從植物生物質中生產糖的簡單的經濟上吸引人的酶方法是高度期望的。該目標通過提供下述宿主細胞而被實現,所述宿主細胞包含從編碼纖維素酶、半纖維素酶和果膠酶的多核苷酸組中選擇的至少四種不同的異源多核苷酸,其中宿主細胞能 產生從纖維素酶、半纖維素酶和果膠酶組中選擇的至少四種不同的酶,其中所述宿主細胞是絲狀真菌并能分泌所述至少四種不同的酶。由于用于降解木質纖維素材料的所有必要的酶在一種并且在同一種宿主細胞產生并分泌,即用型酶組合物可僅在一種發酵中產生。通過本發明的宿主細胞產生的酶組合物可適用在木質纖維素材料的糖化方法中。此外,本發明的宿主細胞可不需要纖維素酶誘導物來產生從纖維素酶、半纖維素酶和果膠酶的組中選擇的至少四種不同的酶。在木質纖維素材料的糖化方法中使用本發明的宿主細胞的可能的優勢在于,不必要以期望的比率摻雜/混合用于降解木質纖維素材料需要的多種酶。此外,在降解木質纖維素材料的方法中使用酶之前,沒有必要存儲單獨的酶。此外,根據本發明的優選的實施方式通過選擇宿主細胞和宿主細胞的遺傳修飾,可實現酶的高生產力。此外,發酵液(包含從纖維素酶、半纖維素酶和果膠酶的組中選擇的至少四種不同的酶)可在降解木質纖維素材料的方法中直接使用而不經任何純化。因此,本發明提供了非常簡單和經濟有效的方法。
圖I :在 T. emersonii 中表達 T. emersonii 纖維二糖水解酶 I (CBH I)的PGBT0PEBA205的圖譜。描繪了從葡糖淀粉酶啟動子(PglaA)表達的EBA205。此外,描繪了表達盒的葡糖淀粉酶側翼(3’glaA)。對于編碼T. emersonii EG的DNA-序列的pGBT0PEBA8和包含編碼T. emersonii BG的DNA-序列的pGBT0PEBA4,pGBT0PEBA205是有代表性的。圖2 :在 T. Emersonii 中表達 T. emersonii 纖維二糖水解酶 II (CBHII)的PGBFINEBA176的圖譜。pGBFINEBA176是基于pGBFINll的質粒。描繪了從葡糖淀粉酶啟動子(PglaA)表達的EBA176。此外,描繪了從AspergiIIus nidulans甘油醒3-磷酸脫氫酶啟動子(Pgpd)表達的選擇性標記物(amdS)和表達盒的葡糖淀粉酶側翼(3’glaA和3”glaA)。圖3 :在A. niger中的多種重組T. emersonii纖維素酶的檢測(3A).在A. niger中表達的T. emersonii纖維素酶的SDS-PAGE檢測。用PGBT0PEBA4、pGBT0PEBA8、pGBFINEBA176 和 pGBT0PEBA205 的混合物轉化 A. niger。轉化體在包含含麥芽糖的培養基的搖瓶中生長并通過SDS-PAGE分析法來分析從96小時培養物中收獲的上清液中的蛋白。(3B)表示轉化體中WSU活性的圖。轉化體在含麥芽糖的培養基中生長96小時并在培養物的上清液中測定WSU活性。圖4.在T. emersonii中的多種重組T. emersonii纖維素酶的檢測。(4A).在 T. emersonii 中表達的 T. emersonii 纖維素酶的 SDS-PAGE 檢測。用PGBT0PEBA4、pGBT0PEBA8、pGBFINEBA176 和 pGBT0PEBA205 的混合物轉化 T. emersonii。近400個轉化體在96-孔平板中生長并通過E-PAGE凝膠分析法針對至少一種纖維素酶的表達進行篩選。感興趣的轉化體在含基于葡萄糖的培養基的搖瓶中生長并且從72小時培養物中收獲的上清液中的蛋白被TCA-沉淀并通過SDS-PAGE分析法進行分析。FBG142是空菌株。
(4B).顯示了轉化體中的WSU活性的圖。轉化體在基于葡萄糖的培養基中生長72小時并在培養物的16-倍稀釋的上清液中測定WSU活性。FBG142是空菌株。序列表簡單描沭SEQ ID NO 1展示了來自Talaromyces emersonii的纖維二糖水解酶I的氨基酸序列。SEQ ID NO :2 :展不了來自 Talaromyces emersonii 的編碼SEQ ID NO. I 的氨基酸序列的多核苷酸。SEQ ID NO :3 展示了來自 Talaromyces emersonii 的 P _ 葡聚糖酶 CEA 的氨基酸序列。SEQ ID NO :4 展不了來自 Talaromyces emersonii 的編碼 SEQ ID NO. 3 的氨基酸序列的多核苷酸。SEQ ID NO :5展示了來自Talaromyces emersonii的P _葡萄糖苷酶的氨基酸序列。SEQ ID NO 6 展不了來自 Talaromyces emersonii 的編碼 SEQ ID NO. 5 的氨基酸序列的多核苷酸。SEQ ID NO 7展示了來自Talaromyces emersonii的纖維二糖水解酶II的氨基酸序列。SEQ ID NO 8 展不了來自 Talaromyces emersonii 的編碼 SEQ ID NO. 7 的氨基酸序列的多核苷酸。SEQ ID NO 9展示了來自T. emersonii的大小209個aa的未知蛋白的氨基酸序列。SEQ ID NO 10展示了來自T. emersonii的具有根據SEQ ID NO 9的氨基酸序列的未知蛋白的編碼序列。SEQ ID NO 11展示了 T. emersonii膨脹因子的氨基酸序列。SEQ ID NO 12展示了 T. emersonii膨脹因子的編碼序列。SEQ ID N0:13展示了 T. emersonii乙酰基木聚糖酯酶的氨基酸序列。SEQ ID N0:14展示了 T. emersonii乙酰基木聚糖酯酶的編碼序列。
SEQ ID NO :15展示了 T. emersonii木聚糖酶的氨基酸序列。SEQ ID N0:16展示了 T. emersonii木聚糖酶的編碼序列。本文中使用的表述“異源多核苷酸”表示不在未經轉化的宿主細胞中存在的多核苷酸,而“同源多核苷酸”表示在未經轉化的宿主細胞中存在的多核苷酸。本文中合成的多核苷酸被認為是異源多核苷酸,而不受它們可能存在于未經轉化的宿主細胞中的影響。本文中使用的“轉化體”表示已經是轉化的客體的細胞。“轉化體”、“宿主細胞”和“重組細胞”在本文中用作同義詞。“轉化”在本文中表示通過重組技術使細胞遺傳改變。通過人為干預,這可導致遺傳材料(DNA、RNA或蛋白)在細胞中吸收、插入和表達或遺傳材料在細胞中突變或缺失。宿豐細朐
根據本發明的宿主細胞可從任何細胞中制備。針對在根據本發明的宿主細胞中產生的化合物的具體用途,可根據此類用途做出對將被轉化的細胞的選擇。其中例如在根據本發明的宿主細胞中產生的化合物被被用在食品應用中,宿主細胞可從食品級生物體比如Saccharomyces cerevisiae中選擇。具體用途包括但不限于,食品、(動物)飼料、制藥、農業比如作物保護和/或個人護理應用。根據一種實施方式,根據本發明的宿主細胞是真核宿主細胞。優選地,真核細胞是哺乳動物、昆蟲、植物、真菌或海藻細胞。優選的哺乳動物細胞包括例如中國倉鼠卵巢(CHO)細胞、COS細胞、293細胞、PerC6 細胞和和雜交瘤。優選的昆蟲細胞包括例如Sf9和Sf21細胞及其衍生物。更優選地,真核細胞是真菌細胞,即酵母細胞,比如Candida、Hansenula、Kluyveromyces、Pichia、Saccharomyces、Schizosaccharomyces 或 Yarrowia 菌株,更優選地來自 Kluyveromyces lactis、S. cerevisiae、Hansenula polymorpha、Yarrowialipolytica和Pich ia pastoris或絲狀真菌細胞。最優選地,真核細胞是絲狀真菌細胞。“絲狀真菌”包括亞門Eumycota和Oomycota的所有絲狀形式(如Hawksworthet al. , In, Ainsworth and Bisby; s Dictionary of The Fungi,8th edition,1995,CAB International, University Press, Cambridge, UK 確定的)。絲狀真菌特征在于,由幾丁質、纖維素、葡聚糖、殼聚糖、甘露聚糖和其他復合多糖組成菌絲體壁。營養生長通過菌絲衍生且碳代謝是專性需氧的。絲狀真菌菌株包括但不限于Acremonium、Agaricus、Aspergillus、Aureobasidium、Chrysosporium、Coprinus、Cryptococcus、Filibasidium、Fusarium、Humicola、Magnaporthe、Mucor、MyceIiophthora、NeocalIimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Panerochaete、Pleurotus、Schizophyllum、Talaromyces、Thermoascus> Thielavia、Tolypocladium 和 Trichoderma 的菌株。絲狀真菌的若干菌株在許多培養物收集處中對公眾而言是容易得到的,所述培養物收集處比如美國典型培養物收集處(ATCC)、Deutsche德國微生物菌種保藏中心(DSM)、荷蘭生物科技研究所培養物保藏中心(CBS)和美國農業研究中心培養物收集處、北方地區研究中心(NRRL)。此類菌株的例子包括 Aspergillus niger CBS 513. 88、Aspergillusoryzae ATCC 20423、IFO 4177、ATCC 1011、ATCC 9576、ATCC14488-14491、ATCC 11601、ATCC12892、P. chrysogenum CBS 455. 95、Penicillium citrinum ATCC 38065、Penicilliumchrysogenum P2、Talaromyces emersonii CBS 393. 64、Acremonium chrysogenum ATCC36225 或 ATCC 48272、Trichoderma reesei ATCC 26921 或 ATCC 56765 或 ATCC 26921、Aspergillus sojae ATCCl 1906> Chrysosporium lucknowense ATCC44006 及其衍生物。優選的絲狀真菌細胞屬于Aspergillus、Chrysosporium、Penicillium、Talaromyces 或 Trichoderma genus,最優選地屬于 Aspergillus niger、Aspergillusawamori、AspergiIIus foetidus、Aspergillus sojae、Aspergillus fumigatus、Talaromyces emersonii>AspergiIIus oryzae>Chrysosporium lucknowense>Trichodermareesei 或 Penicillium chrysogenum。最優選地,將被轉化以形成宿主細胞的細胞是Aspergillus。多種酶(至少四種不同的纖維素酶、半纖維素酶和/或果膠酶)在Aspergillus中表達的優勢是可在糖上的高酶產率。當將被轉化形成根據本發明的宿主細胞的細胞是Aspergi I Ius菌株時, Aspergillus菌株優選地是CBS 513. 88或其衍生物,更優選地宿主細胞是Aspergillusniger CBS 513.88。根據另一實施方式,將被轉化形成根據本發明的宿主細胞的細胞是原核細胞。優選地,原核宿主細胞是細菌細胞。術語“細菌細胞”包括革蘭氏陰性和革蘭氏陽性微生物二者。合適的細菌可從 Escherichia、Anabaena、Caulobactert、Gluconobacter>Rhodobacter> Pseudomonas> Paracoccus、Bacillus、Brevibacterium、Corynebacterium、Rhizobium(Sinorhizobium)、 Flavobacterium、 Klebsiella、 Enterobacter、Lactobacillus、Lactococcus、Methylobacterium、Staphylococcus 和 Streptomyces 的組中選擇。優選地,細菌細胞選自由 B. subtilis、B. amyloliquefaciens、B. IicheniformiS、B.puntis、B.megaterium、B.halodurans、B. pum ilus、G.oxydans> Caulobactertcrescentus CB 15、Methylobacterium extorquens、Rhodobacter sphaeroides、Pseudomonas zeaxanthinifaciens、Paracoccus denitrificans> E. coli、C. glutamicum、Staphylococcus carnosus、 Streptomyces lividans、 Sinorhizobium melioti 和Rhizobium radiobacter 組成的組。酶在本發明中,從纖維素酶、半纖維素酶和果膠酶的組中,優選地從纖維素酶和半纖維素酶的組中,更優選地從纖維素酶的組中選擇選擇至少四種不同的酶。纖維素酶是水解纖維素(¢-1,4-葡聚糖或P D-葡糖苷鍵)導致葡萄糖、纖維二糖、纖維寡糖等等形成的酶。纖維素酶在傳統上已被分為三個主要種類內切葡聚糖酶(EC 3.2.1. 4)("EG")、外切葡聚糖酶或纖維二糖水解酶(EC 3.2. 1.91) (" CBH")和P -葡萄糖苷酶([3 ]-D-葡糖苷葡糖水解酶;EC 3.2.1.21)(" BG")。見例如Knowles等人的TIBTECH 5,255-261,1987 ;Shulein,方法 s Enzymol.,160, 25, pp. 234-243,1988。內切葡聚糖酶主要在纖維素纖維的非晶態部分上起作用,而纖維二糖水解酶還能降解結晶纖維素(Nevalainenand Penttila,Mycota,303-319,1995)。因而,需要在纖維素酶系統中存在纖維二糖水解酶,用于有效溶解結晶纖維素(Suurnakki,et al. Cellulose 7 :189-209,2000)。¢-葡萄糖苷酶的作用是從纖維二糖、纖維-寡糖和其他葡糖苷中釋放D-葡萄糖單位(Freer,J. Biol. Chem. vol. 268, no. 13, pp. 9337-9342,1993)。纖維素酶已知通過大量的細菌、酵母和真菌產生。某些真菌產生能降解纖維素結晶形式的完整的纖維素酶系統,使得纖維素酶容易通過發酵大量產生。絲狀真菌發揮了特殊的作用,因為許多酵母,比如釀酒酵母菌,缺乏水解纖維素的能力。見,例如 ,Aubert et al. , 1988 ;ffood et al. , Methods in Enzymology, vol. 160,no. 9,pp. 87-116,1988 和 Coughlan, et al. , " Comparative Biochemistry of Fungal andBacterial Cellulolytic Enzyme Systems" Biochemistry and Genetics of CelluloseDegradation, pp.11-30 1988。
CBH、EG和BG的真菌纖維素酶分類可被進一步擴展為包括每一分類內的多種組分。例如,多種CBH、EG和BG已從多種真菌來源中分離,所述真菌來源包括Trichodermareesei,其含有編碼 2 種 CBH(即,CBH I 和 CBH II)、至少 8 種 EG(即,EG I,EG II,EG III、EGIV、EGV、EGVI、EGVII 和 EGVI11)和至少 5 種 BG(即,BGl、BG2、BG3、BG4 和 BG5)的已知
多核苷酸。因此,本發明的酶組合物可包含任何纖維素酶,例如,纖維二糖水解酶、內切-¢-1,4-葡聚糖酶、¢-葡萄糖苷酶或¢-(1,3) (1,4)_葡聚糖酶。本文中,纖維二糖水解酶(EC 3.2. I. 91)是能夠催化纖維素或纖維四糖中1,4-3-D-葡糖苷鍵水解、從鏈的非還原性末端釋放纖維二糖的任何多肽。所述酶也可以被稱作纖維素酶1,4-0 -纖維二糖苷酶(1,4-0 -cellobiosidase), 1,4-^ -纖維二糖水解酶,I,4- P -D-葡聚糖纖維二糖水解酶,微晶纖維素酶(avicelase),外切-I,4_ P -D-葡聚糖酶,外切纖維二糖水解酶或外切葡聚糖酶。本文中,內切-@ -1,4-葡聚糖酶(EC 3. 2. I. 4)是能夠催化纖維素、地衣淀粉或谷類3-D-葡聚糖中1,4-0-D-葡糖苷鍵內切水解的任何多肽。此類多肽也可以能夠水解還含有1,3_鍵的P-D-葡聚糖中的1,4_鍵。所述酶也可以被稱作纖維素酶、微晶纖維素酶、^ -1,4-內切葡聚糖水解酶、^ -1,4-葡聚糖酶、羧甲基纖維素酶、纖維糊精酶、內切-1,4- ^ -D-葡聚糖酶、內切-I,4- P -D-葡聚糖水解酶、內切-I,4- P -葡聚糖酶或內切葡聚糖酶。本文中,¢-(1,3) (1,4)_葡聚糖酶(EC 3. 2. 1.73)是能夠催化含有1,3_和1,4-鍵的P-D-葡聚糖中I,4-P-D-葡糖苷鍵水解的任何多肽。此類多肽可作用于地衣淀粉和谷類P-D-葡聚糖,但不作用于僅含1,3-或1,4-鍵的P-D-葡聚糖。所述酶也可以被稱作地衣淀粉酶(11(*61^11&%),1,3-1,4-0-0-葡聚糖4-葡聚糖水解酶,¢-葡聚糖酶,內切-¢-1, 3-1,4葡聚糖酶,地衣多糖酶(Iichenase)或混合鍵P -葡聚糖酶。這類酶的替代方案是被描述為內切-1,3(4)-0-葡聚糖酶的EC 3. 2. 1.6。當下述葡萄糖殘基在C-3處被自身取代時,這類酶水解P -D-葡聚糖酶中的I,3-鍵或I,4-鍵,所述葡萄糖殘基的還原基團涉及要水解的鍵。替代性的名稱包括內切-1,3-P-葡聚糖酶,昆布多糖酶,1,3-(1,3 ;1,4)-P-D-葡聚糖3(4)葡聚糖水解酶,底物包括昆布多糖,地衣淀粉和谷類P-D-葡聚糖。本文中,^ -葡糖苷酶(EC 3. 2. I. 21)是能夠催化末端、非還原性P -D-葡萄糖殘基水解并釋放P-D-葡萄糖的任何多肽。這樣的多肽可具有針對P-D-葡糖苷的廣泛特異性,并且也可以水解以下一種或多種P -D-半乳糖苷、a -L-阿拉伯糖苷、P -D-木糖苷或
3-D-巖藻糖苷。所述酶也可以被稱作苦杏仁苷酶、3-D-葡糖苷葡糖水解酶、纖維二糖酶或龍膽二糖酶。
宿主細胞可產生并分泌內切葡聚糖酶活性和/或纖維二糖水解酶活性和/或^-葡萄糖苷酶活性。宿主細胞可產生并分泌這些種類中的一種或多種中的超過一種酶活性。例如,宿主細胞可產生并分泌兩種內切葡聚糖酶活性,例如,內切-1,3(1,4)-0葡聚糖酶活性和內切-I,4-葡聚糖酶活性。本文中,半纖維素酶是能夠降解或改性半纖維素的任何多肽。也就是說,半纖維素酶可以能夠降解或改性木聚糖、葡糖醛酸木聚糖、阿拉伯木聚糖、葡甘露聚糖和木葡聚糖之一種或多種。能夠降解半纖維素的多肽是能夠催化下述過程的多肽將半纖維素降解成更小的多糖,例如部分地降解成寡糖,或者完全降解成糖單體,例如己糖或戊糖單體。與半纖維素酶接觸時,半纖維素酶可得到寡糖與糖單體的混合種群。此類降解將典型地通過水解反應而發生。本發明的組合物可以包含任何半纖維素酶,例如內切木聚糖酶、¢-木糖苷酶、a -L-阿拉伯呋喃糖苷酶、乙酰木聚糖酯酶、a -D-葡糖醛酸糖苷酶、纖維二糖水解酶、阿魏酸酯酶、香豆酸酯酶、a -半乳糖苷酶、3 -半乳糖苷酶、3 -甘露聚糖酶或3 -甘露糖苷酶。
本文中,內切木聚糖酶(EC 3. 2. I. 8)是能夠催化木聚糖中1,4_0 -D-木糖苷鍵內切水解的任何多肽。所述酶也可以被稱作內切-1,4-0 -木聚糖酶或1,4-P-D-木聚糖木聚糖水解酶。一種木聚糖內切酶是EC 3. 2. I. 136,葡糖醛酸阿拉伯木聚糖內切木聚糖酶,一種能夠水解葡糖醛酸阿拉伯木聚糖中1,4木糖苷鍵的酶。本文中,P -木糖苷酶(EC 3. 2. I. 37)是能夠催化1,4_P -D-木聚糖的水解、從非還原性末端去除相繼的D-木糖殘基的任何多肽。這類酶也可以水解木二糖。所述酶也可以被稱作木聚糖1,4-0 -木糖苷酶、1,4-0 -D-木聚糖木糖水解酶、外切-1,4-0 -木糖苷酶或木二糖酶。本文中,a -L-阿拉伯呋喃糖苷酶(EC 3. 2. I. 55)是能夠作用于a -L-阿拉伯呋喃糖苷、含(1,2)和/或(1,3)_和/或(1,5)_鍵的a-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖的任何多肽。所述酶也可以被稱作a-N-阿拉伯呋喃糖苷酶、阿拉伯呋喃糖苷酶或阿拉伯糖苷酶。本文中,a -D-葡糖醛酸糖苷酶(EC 3. 2. I. 139)是能夠催化以下形式反應的任何多肽a -D-葡糖醛酸苷+H2O —醇+D-葡糖醛酸酯。所述酶也被稱作a -葡糖醛酸糖苷酶或a-葡糖苷酸酶。這些酶也可水解可作為木聚糖中取代基存在的4-0-甲基化的葡糖醛酸。替代方式是EC 3.2. I. 131 :木聚糖a-I,2-葡糖醛酸糖苷酶,其催化a-l,2-(4-0-甲基)葡糖醛酰基連接的水解。本文中,乙酰基木聚糖酯酶(EC 3. I. I. 72)是能特別水解天然木聚糖的木聚糖部分的2和/或3位置中的乙酰基的酯鍵的任何多肽。本文中,阿魏酸酯酶(EC 3. I. I. 73)是能夠催化以下形式反應的任何多肽阿魏酸基-糖+H2o—阿魏酸酯+糖。糖可以是例如寡糖或多糖。其典型地可以催化來自酯化的糖的4-羥基-3-甲氧基肉桂酰(阿魏酰)基的水解,所述糖通常是“天然”底物中的阿拉伯糖,對硝基苯酚乙酸酯和阿魏酸甲基酯是典型地更弱的底物。所述酶也可以被稱作肉桂酰基酯水解酶,阿魏酸酯酶或羥基肉桂酰基酯酶。也可以被稱作半纖維素附屬酶,因為其可幫助木聚糖酶和果膠酶分解植物細胞壁半纖維素和果膠。本文中,香豆酰基酯酶(EC 3. I. I. 73)是能夠催化以下形式反應的任何多肽香豆酰基-糖+H2o—香豆酸酯+糖。糖可以是例如寡糖或多糖。所述酶也可以被稱作反式-4-香豆酰基酯酶、反式-對香豆酰基酯酶、對香豆酰基酯酶或對香豆酸酯酶。所述酶也落入EC 3. I. I. 73中,從而也可以被稱作阿魏酸酯酶。本文中,a -半乳糖苷酶(EC 3. 2. I. 22)是能夠催化a -D-半乳糖苷(包括半乳糖寡糖、半乳甘露聚糖、半乳聚糖和阿拉伯半乳聚糖)中末端、非還原性a-D-半乳糖殘基水解的任何多肽。此類多肽也可以能夠水解a-D-巖藻糖苷。所述酶也可以被稱作蜜二糖酶。本文中,P -半乳糖苷酶(EC 3. 2. I. 23)是能夠催化P -D-半乳糖苷中末端非還原性P-D-半乳糖殘基水解的任何多肽。這樣的多肽也可以能夠水解a-L-阿拉伯糖苷。所述酶也可以被稱作外切- (I- > 4)-D-半乳聚糖酶或乳糖酶。P -半乳糖苷酶是可接受半纖維素和果膠作為其底物的酶,因此其被歸類為半纖維素酶和果膠酶 本文中,^ -甘露聚糖酶(EC 3. 2. I. 78)是能夠催化甘露聚糖、半乳甘露聚糖和葡 甘露聚糖中I,4-P-D-甘露糖苷鍵隨機水解的任何多肽。所述酶也可以被稱作甘露聚糖內切-1,4- P -甘露糖苷酶或內切-1,4-甘露聚糖酶。本文中,@ -甘露糖苷酶(EC 3. 2. I. 25)是能夠催化@ -D-甘露糖苷中末端非還原性P-D-甘露糖殘基水解的任何多肽。所述酶也可以被稱作甘露聚糖酶或甘露糖酶。本文中,果膠酶是能夠降解或改性果膠的任何多肽。能夠降解果膠的多肽是能夠催化下述過程的多肽將果膠降解成更小的單元,例如部分地降解成寡糖,或者完全降解成糖單體。與果膠酶接觸時,根據本發明的果膠酶可得到寡糖與糖單體的混合種群。此類降解將典型地通過水解反應而發生。根據本發明的宿主細胞可包含下述異源多核苷酸,所述異源多核苷酸編碼任何果膠酶,例如內切多聚半乳糖醛酸酶,果膠甲基酯酶,內切-半乳聚糖酶,¢-半乳糖苷酶,果膠乙酰基酯酶,內切-果膠裂合酶,果膠酸裂合酶,a -鼠李糖苷酶,外切-半乳糖醛酸酶,外切多聚半乳糖醛酸酯裂合酶,鼠李半乳糖醛酸聚糖水解酶,鼠李半乳糖醛酸聚糖裂合酶,鼠李半乳糖醛酸聚糖乙酰基酯酶,鼠李半乳糖醛酸聚糖半乳糖醛酸水解酶,木半乳糖醛酸酶。本文中,內切-多聚半乳糖醛酸酶(EC 3. 2. I. 15)是能夠催化果膠酸酯和其他半乳糖醛酸聚糖中l,4-a-D-半乳糖醛酸鍵的隨機水解的任何多肽。所述酶也可以被稱作多聚半乳糖醒酸酶果膠解聚酶,內切多聚半乳糖醒酸酶,果膠酶(pectolase),果膠水解酶,果膠多聚半乳糖醛酸酶,多聚- a -I,4-半乳糖醛酸苷聚糖水解酶,內切半乳糖醛酸酶;內切-D-半乳糖醛酸酶或多聚(I,4-a-D-半乳糖醛酸苷)聚糖水解酶。在本文中,果膠甲基酯酶(EC 3. I. I. 11)是能夠催化下述反應的任何酶果膠+nH2O — n甲醇+果膠酸酯。所述酶也已知為果膠酯酶(pectinesterase),果膠脫甲氧基酶,果膠甲氧基酶,果膠甲基酯酶,果膠酶,果膠酯酶(pectinoesterase)或果膠果酰基水解酶(pectin pectylhydrolase)。在本文中,內切-半乳聚糖酶(EC 3. 2. I. 89)是能夠催化阿拉伯半乳聚糖中1,4-3-D-半乳糖苷鍵的內切水解的任何酶。所述酶也已知為阿拉伯半乳聚糖內切-I,4- 3 -半乳糖苷鍵,內切-I,4- 0 -半乳聚糖酶,半乳聚糖酶,阿拉伯半乳聚糖酶或阿拉伯半乳聚糖4- 3 -D-半乳聚糖水解酶。本文中,果膠乙酰基酯酶在本文中被定義為下述任何酶,所述酶具有催化果膠GaIUA殘基羥基處乙酰基的脫乙酰基作用的乙酰基酯酶活性。本文中,內切-果膠裂合酶(EC 4.2.2. 10)是能夠催化(I — 4) - a-D-半乳糖醛酸聚糖甲基酯的清除性切割,得到在其非還原末端具有4_脫氧-6-0-甲基-a -D-半乳-4-糖醒酰基的寡糖。所述酶也可已知為果膠裂合酶,果膠反式消除酶(trans-eliminase),內切果膠裂合酶,多聚甲基半乳糖醛酸反式消除酶,果膠甲基反式消除酶,果膠酶(pectolyase),PL, PNL或PMGL或(I — 4) -6-0-甲基-a -D-半乳糖醛酸聚糖裂合酶。本文中,果膠酸裂合酶(EC 4. 2. 2. 2)是能夠催化(I — 4) - a -D-半乳糖醛酸聚糖的消除性切割,得到在其非還原性末端具有4-脫氧- a -D-半乳-4-糖醛酰基的任何酶。該酶也可以已知為多聚半乳糖醛酸反式消除酶,果膠酸反式消除酶,多聚半乳糖醛酸酯裂合酶,內切果膠甲基反式消除酶,果膠酸反式消除酶,內切半乳糖醛酸酯反式消除酶,果膠酸裂合酶,果膠裂合酶,a-l,4_D-內切多聚半乳糖醛酸裂合酶,PGA裂合酶,PPase-N,內切-a -1,4-多聚半乳糖醛酸裂合酶,多聚半乳糖醛酸裂合酶,果膠反式消除酶,多聚半乳糖醛酸反式消除酶或(I — 4)-a-D-半乳糖醛酸聚糖裂合酶。
本文中,a -鼠李糖苷酶(EC 3. 2. I. 40)是能夠催化a -L-鼠李糖苷或鼠李半乳糖醛酸聚糖中末端非還原性a-L-鼠李糖殘基水解的任何多肽。所述酶也可以已知為a -L-鼠李糖苷酶T,a -L-鼠李糖苷酶N或a -L-鼠李糖苷鼠李糖水解酶。本文中,外切-半乳糖醛酸酶(EC 3. 2. I. 82)是能夠從非還原性末端水解果膠酸、釋放二半乳糖醛酸的任何多肽。酶也可以已知為外切-多聚- a-半乳糖醒酸昔酶(exo-poly-a-galacturonosidase)、外切多聚半乳糖醒酸苷酶(exopolygalacturonosidase)或外切多聚聚半乳糖醒酸苷酶(exopolygalacturanosidase)。本文中,外切-半乳糖醛酸酶(EC 3.2. 1.67)是能夠催化以下的任何多肽(1,
4-a -D-半乳糖醛酸苷)n+H20 — (I,4- a -D-半乳糖醛酸苷)n_i+D-半乳糖醛酸酯。所述酶也可以已知為半乳糖醒I,4_ a -半乳糖醒酸苷酶(galacturan 1,4_ a-galacturonidase),外切多聚半乳糖醛酸酶,多聚(半乳糖醛酸酯)水解酶,外切-D-半乳糖醛酸酶,外切-D-半乳糖醛酸聚糖酶,外切多聚-D-半乳糖醛酸酶或多聚(I,4-a-D-半乳糖醛酸苷)半乳糖醛酸水解酶。本文中,外切多聚半乳糖醛酸酯裂合酶(EC 4. 2. 2. 9)是能夠催化從果膠酸(即脫脂化的果膠)的還原末端消除性切割4- (4-脫氧-a -D-半乳-4-糖醛酰基)-D-半乳糖醛酸酯的任何多肽。所述酶可已知為果膠酸二糖裂合酶,果膠酸外切裂合酶,外切果膠酸反式消除酶,外切果膠酸裂合酶,外切多聚半乳糖醛酸-反式-消除酶,PATE,外切-PATEjF切-PGL或(I — 4) - a -D-半乳糖醛酸聚糖還原末端二糖裂合酶。本文中,鼠李半乳糖醛酸聚糖水解酶是能夠在嚴格交替出現的鼠李半乳糖醛酸聚糖結構中以內切方式水解半乳基糖醛酸酸和吡喃鼠李糖基之間鍵的任何多肽,所述鼠李半乳糖醛酸聚糖結構由二糖[(1,2-a-L-鼠李糖基_(1,4)-a-半乳糖醛酸]組成。本文中,鼠李半乳糖醛酸聚糖裂合酶是能夠以內切方式在鼠李半乳糖醛酸聚糖中通過P -消除切割a -L-Rhap-(I — 4) - a -D-GalpA鍵的任何多肽。本文中,鼠李半乳糖醛酸聚糖乙酰基酯酶是能夠催化鼠李半乳糖醛酸聚糖中交替出現的鼠李糖和半乳糖醛酸殘基主鏈的脫乙酰化的任何多肽。
本文中,鼠李半乳糖醛酸聚糖半乳糖醛酸水解酶是能夠以外切方式、從嚴格交替出現的鼠李半乳糖醛酸聚糖結構的非還原性末端水解半乳糖醛酸的任何多肽。本文中,木半乳糖醛酸酶是通過以內切方式切割¢-木糖取代的半乳糖醛酸主鏈而作用于木半乳糖醛酸聚糖的任何多肽。所述酶也可以已知為木半乳糖醛酸聚糖水解酶。a -L-阿拉伯糖呋喃糖苷酶可接受半纖維素和果膠作為其底物,因此其被歸類為半纖維素酶和果膠酶二者。本文中,a -L-阿拉伯糖呋喃糖苷酶(EC 3. 2. I. 55)是能夠作用于a -L-阿拉伯呋喃糖苷、含有(1,2)和/或(1,3)_和/或(1,5)_鍵的a-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖的任何多肽。所述酶也可以被稱作a-N-阿拉伯糖呋喃糖苷酶,阿拉伯糖呋喃糖苷酶或阿拉伯糖苷酶。本文中,內切阿拉伯聚糖酶(EC 3. 2. I. 99)是能夠催化1,5_阿拉伯聚糖中1,
5-a -阿拉伯呋喃糖苷鍵內切水解的任何多肽。所述酶也已知為內切阿拉伯糖酶,阿拉伯聚·糖內切-I,5- a -L-阿拉伯糖苷酶,內切-I,5- a -L-阿拉伯聚糖酶,內切-a -I,5_阿拉伯聚糖酶;內切-阿拉伯聚糖酶或I,5-a -L-阿拉伯聚糖I,5-a -L-阿拉伯聚糖水解酶。在本發明的特別的實施方式中,至少四種不同的酶是至少兩種不同的纖維二糖水解酶,例如纖維二糖水解酶I和/或纖維二糖水解酶II,任選地至少內切葡聚糖酶,例如^ -葡聚糖酶CEA和至少P -葡萄糖苷酶。優選地,所述不同的纖維二糖水解酶之一與SEQ ID NO. I至少具有70%同一性且另一所述不同的纖維二糖水解酶與SEQ ID NO. 7具有至少70%同一性,其中內切葡聚糖酶與SEQ ID NO. 3具有至少70%同一性且其中P -葡萄糖苷酶與SEQ ID NO. 5具有至少70%同一I"生。例如,一種纖維二糖水解酶與SEQ ID NO. I可具有至少75%,例如至少80%、例如至少85%、例如至少90%、例如至少93%、例如至少95%、例如至少97%、例如至少98%、例如至少99%同一性。例如,另一纖維二糖水解酶可與SEQ ID NO. 7具有至少75%,例如至少80%、例如至少85%、例如至少90%、例如至少93%、例如至少95%、例如至少97%、例如至少98%、例如至少99%同一性。例如,內切葡聚糖酶可與SEQ ID NO. 3具有至少75%,例如至少80%、例如至少85%、例如至少90%、例如至少93%、例如至少95%、例如至少97%、例如至少98%、例如至少99%同一性。例如,¢-葡萄糖苷酶可與SEQ ID NO. 5具有至少75%,例如至少80%、例如至少85%、例如至少90%、例如至少93%、例如至少95%、例如至少97%、例如至少98%、例如至少99%同一性。優選地,通過本發明的宿主細胞產生的酶在16倍或更多倍稀釋的上清液或發酵液中具有至少2WSU的纖維素酶活性,例如在16倍稀釋的上清液或發酵液中至少3WSU的纖維素酶活性或至少5WSU或更多的纖維素酶活性。發酵液或上清液可以是例如10000倍稀釋的、5000倍稀釋的或2500倍稀釋的。I “WSU”意味著在65 °C、pH 4. 50下20小時內通過200 的酶混合物從2. Iw/v%洗漆的預處理的麥稻中釋放0. 119mg/ml葡萄糖。
當異源纖維素酶、半纖維素酶和/或果膠酶從宿主細胞分泌進培養基中時,適當的信號序列可被添加至多肽,以將重新合成的多肽導向宿主細胞的分泌路徑。本領域技術人員知道針對具體宿主選擇適當的信號序列。信號序列對宿主細胞而言可以是內源的或對宿主細胞而言可以是外源的。作為例子,可使用來自對宿主細胞而言天然的蛋白的信號序列。優選地,所述天然蛋白是高分泌蛋白,即以高于正被分泌的蛋白的總量的10%分泌的蛋白。作為信號序列的替代形式,本發明的多肽可與分泌的載體蛋白或其部分融合。通過載體蛋白或其部分的信號序列,此類嵌合構建體(chimeric construct)被導向分泌路徑。此外,載體蛋白將向根據本發明的多肽提供穩定作用和/或可增強溶解性。此類載體多肽可以是任何蛋白。優選地,高分泌蛋白被用作載體蛋白。載體蛋白相對于根據本發明的多肽可以是內源或外源的。載體蛋白相對于宿主細胞可以是內源的或可以是外源的。此類載體蛋白的例子是葡萄糖淀粉酶、a -結合因子的前原序列、Clostridium cellulovorans纖維素結合蛋白A的纖維素結合域、谷胱甘肽S-轉移酶、Bacillus circulans幾丁質酶Al的幾丁質結合域、由E. coli K12的malE基因編碼的麥芽糖結合域、0 -半乳糖苷酶和堿性磷酸酶。用于在Aspergillus細胞中此類嵌合構建體表達的優選的載體蛋白是葡萄糖淀粉 酶。多核苷酸術語“多核苷酸”與術語“核酸分子”是等同的并且在本文中可互換使用。該術語是指多核苷酸分子,其是單鏈或雙鏈的核糖核酸(RNA)或脫氧核糖核酸(DNA)分子。多核苷酸可以分離形式存在或包含在重組核酸分子或載體中或包含在宿主細胞中。多核苷酸可以是合成的或可以是從染色體DNA中分離的。在本文中使用時,術語“基因”是指核酸分子,其可從染色體DNA中分離或可以是基于序列表合成的,其包括編碼多肽的開放閱讀框。根據本發明的多核苷酸可以是合成的多核苷酸。合成的多核苷酸可以按照密碼子使用被優化,優選地根據W02006/077258和/或PCT/EP2007/055943中所述的方法被優化,所述參考文獻通過引用并入本文。PCT/EP2007/055943介紹了密碼子對優化。密碼子對優化是這樣一種方法其中編碼多肽的核苷酸序列根據其密碼子使用、尤其是使用的密碼子對而被修飾,以獲得編碼多肽的核苷酸序列經改進的表達和/或所編碼的多肽的經改進的生產。密碼子對被定義為編碼序列中一組兩個連續的三聯體(密碼子)。術語“編碼序列”在本文中被定義為下述序列,所述序列被轉錄成mRNA并翻譯成本發明的多肽。編碼序列的界限通常由mRNA 5’-端的ATG起始密碼子和mRNA 3'-端終止開放讀碼框的翻譯終止密碼子序列決定。編碼序列可包括但不限于DNA、cDNA和重組核酸序列。編碼從纖維素酶、半纖維素酶和果膠酶的組中選擇的酶的至少四種不同的異源多核苷酸可從任何已知的多核苷酸中選擇。優選地,多核苷酸是從編碼纖維素酶、半纖維素酶和果膠酶的多核苷酸組中選擇的,是從編碼纖維素酶和半纖維素酶的多核苷酸組中選擇的,更優選地從編碼纖維素酶的多核苷酸組中選擇。在一種實施方式中,根據本發明的多核苷酸是從編碼熱穩定酶的多核苷酸中選擇的。本文中,這表示酶具有約60°C或更高,例如約70°C或更高比如約75°C或更高、例如約80°C或更高比如85°C或更高的最適溫度。技術人員可使用普通知識選擇合適的多核苷酸。它們可例如從嗜熱微生物中分離或可由技術人員設計并人工合成。在一種實施方式中,多核苷酸可從嗜熱絲狀真菌中分離。可從中分離編碼熱穩定酶的多核苷酸的嗜熱絲狀真菌有Acremonium, Aureobasidium、Cryptococcus、Filibasidium、Fusarium、Humicola、Magnaporthe、Mucor、Myceliophthora、Neurospora、Paecilomyces、Penicillium、Schizophyllum、Talaromyces、Thermoascus、Thielavia和 Tolypocladium。在本發明的特別方面中,至少四種不同的多核苷酸是至少編碼纖維二糖水解酶I和/或纖維二糖水解酶II、內切葡聚糖酶和P -葡萄糖苷酶的多核苷酸。優選地,編碼纖維二糖水解酶I的多核苷酸與SEQ ID NO. 2具有至少70%、更優選地至少75 %、更優選地至少80 %、更優選地至少85 %、更優選地至少87 %,例如至少90 %、例如至少93%、例如至少95%、例如至少96%、例如至少97%、例如至少98%、例如至少99%或100%的同一性(來自Talaromyces emersonii CBS 39364的編碼纖維二糖水解 酶I的多核苷酸)。優選地,編碼纖維二糖水解酶II的多核苷酸與SEQ ID NO. 8具有至少70%、更優選地至少75%、更優選地至少80%、更優選地至少85%、更優選地至少87%,例如至少90%、例如至少93%、例如至少95%、例如至少96%、例如至少97%、例如至少98%、例如至少99%或100%的同一性(來自Talaromyces emersonii CBS 39364的編碼纖維二糖水解酶II的多核苷酸)。優選地,編碼內切葡聚糖酶的多核苷酸與SEQ ID NO. 4具有至少70%、更優選地至少75%、更優選地至少80%、更優選地至少85%、更優選地至少87%,例如至少90%、例如至少93%、例如至少95%、例如至少96%、例如至少97%、例如至少98%、例如至少99%或100%的同一性(來自Talaromyces emersonii CBS 39364的編碼內切葡聚糖酶的多核苷酸)。優選地,編碼¢-葡萄糖苷酶的多核苷酸與SEQ ID NO. 6具有至少70%、更優選地至少75%、更優選地至少80%、更優選地至少85%、更優選地至少87%,例如至少90%、例如至少93%、例如至少95%、例如至少96%、例如至少97%、例如至少98%、例如至少99%或100%的%同一丨丨生(來自Talaromyces emersonii的編碼P _葡萄糖苷酶的多核苷酸)。在本發明的特定實施方式中,編碼與SEQ ID NO. 2具有至少70%同一性的纖維二糖水解酶I的多核苷酸(來自Talaromyces emersonii CBS 39364的編碼纖維二糖水解酶I的多核苷酸)、與SEQ ID NO. 8具有至少70%同一性的多核苷酸(來自Talaromycesemersonii CBS 39364的編碼纖維二糖水解酶II的多核苷酸)、與SEQ ID NO. 4具有至少70%同一性的多核苷酸(來自Talaromyces emersonii CBS 39364的編碼內切葡聚糖酶的多核苷酸)和與SEQ ID NO. 6具有至少70%同一性的多核苷酸(來自Talaromycesemersonii的編碼P _葡萄糖苷酶的多核苷酸)在宿主細胞中存在,優選地在Aspergillus宿主細胞中存在。Aspergillus 是Talaromyces emersonii 的多核苷酸(SEQ ID NO. 2 的纖維二糖水解酶I、SEQ ID NO. 8的纖維二糖水解酶II、SEQ ID NO. 4的內切葡聚糖酶和SEQ ID NO. 6的葡萄糖苷酶)和與其具有至少70%同一性的多核苷酸的非常好的宿主細胞。令人驚訝地,已發現SEQ ID NO. 2的纖維二糖水解酶I、SEQ ID NO. 8的纖維二糖水解酶II、SEQID NO. 4的內切葡聚糖酶和SEQ ID NO. 6的P -葡萄糖苷酶在Aspergillus中表達并由其分泌,而不需要針對AspergiIIu的優選的密碼子使用和信號序列的對這些序列的任何適
應性改變。優選地,編碼從纖維素酶、半纖維素酶和果膠酶的組中選擇的至少四種不同的酶的多核苷酸是源自Talaromyces菌株,更優選地源自Talaromyces emersonii菌株,更優選地源自在 CENTRAAL BUREAU VOOR SCHIMMELCULTURES,Uppsalalaan 8,P.O.Box 85167,NL-3508AD Utrecht, The Netherlands 于 2009 年 7 月 I 日報藏的具有登錄號 CBS 39364 的Talaromyces emersonii菌株的原始的多核苷酸或密碼子優化的多核苷酸或其功能等同突變體。后一種菌株在本文中表不為Talaromyces emersonii CBS 39364。氨基酸或核苷酸序列當展示某些水平的相似性時被稱為是同源的。兩個同源序列 是密切相關的還是更遠相關的,分別通過為高的或低的“百分比同一性”或同一性”表
/Jn o就本發明目的而言,在本文中定義為了測定兩條氨基酸序列或兩條核酸序列的百分比同一性,就最適比較的目的比對完整的序列。為了優化兩條序列之間的比對,可在被比較的兩條序列的任何一條中引入缺口。這種比對可以在被比較的序列的全長上進行。同一性是在報告的比對區域上的兩條序列之間的同一匹配的百分比。可以使用數學算法完成兩個序列之間的序列比較和同一性百分比測定。技術人員應當明白下述事實可獲得比對兩條序列的若干種不同的計算機程序并測定兩條序列之間的同源性(Kruskal, J. B. (1983)An overview of sequence comparison In D.Sankoffand J. B. Kruskal, (ed. ), Time warps, string edits and macromolecules the theoryand practice of sequence comparison,pp. l_44Addison Wesley)。可使用用于I匕對兩條序列的Needleman和Wunsch算法測定兩條氨基酸序列之間的百分比同一性(Needleman,S.B.and Wunsch, C. D. (1970) J. Mol. Biol. 48,443-453)。算法比對氨基酸序列以及核苷酸序列。Needleman-Wunsch算法已在計算機程序NEEDLE中實施。就本發明目的而言,使用了來自 EMBOSS 包的 NEEDLE 程序(版本 2. 8. 0 或更高,EMBOSS The European MolecularBiology Open Software Suite (2000)Rice, P. Longden, I. and Bleasby, A. Trends inGenetics 16, (6)pp276~277, http://emboss, bioinformatics, nl/)。就蛋白序列而言,EBL0SUM62用于替換矩陣,就核苷酸序列而言,使用了 EDNAFULL。可指定其他矩陣。就本發明目的而言,用于比對氨基酸序列的參數是缺口開放懲罰為10和缺口延伸懲罰為0.5。技術人員會意識到所有這些不同的參數會產生些微不同的結果,但是當使用不同的算法時兩條序列的總百分比同一性不顯著改變本文中提到的蛋白序列還可用作“查詢序列”以針對序列數據庫進行搜索,例如來鑒定其他家族成員或相關序列。可使用BLAST程序進行此類搜索。進行BLAST分析的軟件通過National Center for Biotechnology Information (http://www. ncbi. nlm. nih. rov)是公眾可得到的。BLASTP用于氨基酸序列,BLASTN用于核苷酸序列。在BLAST程序中,可使用下述缺省設置-開放缺口的開銷缺省=5用于核苷酸/II用于蛋白-延伸缺口的開銷缺省=2用于核苷酸/I用于蛋白
-核苷酸錯配懲罰缺省=-3-核苷酸匹配獎勵缺省=I-期望值缺省=10-字長缺省=11用于核苷酸/28用于megablast/3用于蛋白
本文中提到的核酸序列還可用作“查詢序列”以針對公用數據庫進行搜索,例如,來鑒定其他家族成員或相關的序列。使用Altschul,et al. (1990) J. Mol. Biol. 215 :403-10的NBLAST和XBLAST程序(版本2. 0)進行此類搜索。BLAST核苷酸搜索可用NBLAST進行,評分=100,字長=12以獲得與本發明的核酸分子同源的核苷酸序列。可以例如通過進行PCR分離同源的多核苷酸序列,所述PCR使用以本文提到的核苷酸序列為基礎設計的兩個簡并寡核苷酸引物池。用于反應的模板可以是通過反轉錄mRNA獲得的cDNA,所述mRNA從已知或懷疑表達本發明多核苷酸的菌株中制備。可以對PCR產物進行亞克隆和測序,以確保被擴增的序列代表了新核酸序列的序列或其功能等同物。然后可以通過多種已知方法,使用PCR片段來分離全長cDNA克隆。例如,被擴增的片段可以被標記,并用于篩選噬菌體或粘粒cDNA文庫。或者,被標記的片段可以被用于篩選基因組文庫。也可以用PCR技術來從其它生物中分離全長cDNA序列。例如,可以根據標準步驟從合適的細胞或組織來源中分離RNA。可以使用特異于被擴增片段最5’端的寡核苷酸引物,引導第一鏈合成,針對RNA進行反轉錄反應。然后可以使用標準的末端轉移酶反應將得到的RNA/DNA雜交體“加尾”(例如用鳥嘌呤),可以用RNase H消化所述雜交體,然后(例如用多聚-C引物)引物起始第二鏈合成。因此,被擴增片段上游的cDNA序列可以容易地被分離。有用的克隆策略的綜述,見例如下文提到的Sambrook et al.。例如,術語與氨基酸序列的序列表“至少70%同一性”意味著從按照上文描述的方法獲得的百分比,獲得的百分比是70%或更高。制備宿主細胞的方法在另一方面中,本發明涉及制備根據本發明的宿主細胞的方法,其包括下述步驟(a)提供一個或多個表達盒,所述表達盒包含從編碼纖維素酶、半纖維素酶和果膠酶的多核苷酸組中選擇的至少四種不同的異源多核苷酸和表達這些多核苷酸需要的控制序列。(b)提供選擇性標記物(C)用所述一個或多個表達盒和來自步驟(b)的選擇性標記物轉化細胞(d)選擇因而形成的能通過所述至少四種不同的異源多核苷酸編碼產生至少四種不同的纖維素酶、半纖維素酶和/或果膠酶的宿主細胞。術語“核酸構建體”在本文中是指為單鏈或雙鏈的核酸分子,其與天然存在的基因分離,或者已被修飾為含有下述核酸區段,所述核酸區段以天然不會存在的方式組合和并置。當核酸構建體含有表達編碼序列所需的所有控制序列時,術語核酸構建體與術語“表達盒”同義,其中所述控制序列可操作地與所述編碼序列連接。
術語“可操作地連接”在本文中被定義為一種連接,其中控制序列相對于DNA序列的編碼序列被適當地置于一定位置上,使得控制序列指導多肽的生產。術語“控制序列”在本文中被定義為至少包括對mRNA和/或多肽表達而言必需和/或有利的任何組件。任何控制序列對于編碼多肽的核酸序列而言可以是天然的或外源的。此類控制序列包括但不限于前導區、Shine-Delgarno序列、最適翻譯起始序列(如Kozak,1991,J. Biol. Chem. 266 :19867-19870中所述)、多聚腺苷酸化序列、原-肽序列、前_原肽序列、啟動子、信號序列和轉錄終止子。最低限度下,控制序列包括啟動子、轉錄和翻譯終止信號。控制序列可針對它們的具體目的而被優化。在本發明中使用的優選的優化的控制序列是在W02006/077258中描述的那些,其通過引用被并入本文。可以為了引入特定的限制性位點而對控制序列提供連接子,所述特定的限制性位點有助于將控制序列與編碼多肽的核酸序列的編碼區連接。控制序列可以是合適的啟動子序列(啟動子)。
控制序列也可以是合適的轉錄終止子(終止子)序列,這是被絲狀真菌細胞識別為終止轉錄的序列。終止子序列與編碼多肽的核酸序列的3'-端可操作地連接。本發明中可以使用在細胞中發揮功能的任何終止子。對絲狀真菌細胞而言優選的終止子得自編碼以下的多核苷酸A. oryzae TAKA淀粉酶、A. niger葡糖淀粉酶(glaA)、A. nidulans鄰氨基苯甲酸合酶、A. niger a-葡糖苷酶、trpC和Fusarium oxysporum膜蛋白酶樣蛋白酶。控制序列也可以是合適的前導序列(前導區)、對絲狀真菌細胞翻譯而言重要的mRNA非翻譯區。前導序列與編碼多肽的核酸序列的5'端可操作地連接。在細胞中發揮功能的任何前導序列可用于本發明中。對絲狀真菌細胞而言優選的前導區得自編碼以下的多核苷酸A. oryzae TAKA淀粉酶和A. nidulans磷酸丙糖異構酶和A. niger glaA和植酸酶。其他控制序列可分離自Penicillium IPNS基因,或pcbC基因,P微管蛋白基因。WO 01/21779中引用的所有控制序列通過引用并入本文。控制序列也可以是多聚腺苷酸化序列,這是與核酸序列3'-端可操作地連接的序列,其轉錄后被絲狀真菌細胞識別為對所轉錄的mRNA添加多聚腺苷殘基的信號。本發明中可以使用在細胞中有功能的任何多聚腺苷酸化序列。對絲狀真菌細胞而言優選的多聚腺苷酸化序列得自編碼以下的多核苷酸A. oryzae TAKA淀粉酶、A. niger葡糖淀粉酶、A. nidulans鄰氨基苯甲酸合酶、Fusariumoxysporum胰蛋白酶樣蛋白酶和A. niger a -葡糖苷酶。術語“啟動子”在本文中被定義為結合RNA聚合酶并將聚合酶定向到編碼生物化合物的核酸序列的正確下游轉錄起始位點處從而啟動轉錄的DNA序列。RNA聚合酶有效地催化與編碼區的適當DNA鏈互補的信使RNA的裝配。術語“啟動子”還可被理解為包括在轉錄成mRNA后用于翻譯的5'-非編碼區(啟動子和翻譯起點之間),順式作用轉錄控制元件如增強子,和能夠與轉錄因子相互作用的其他核苷酸序列。啟動子可以是適用于真核或原核宿主細胞的任何合適的啟動子序列,其顯示轉錄活性,包括突變、截短和雜交的啟動子,并且可得自編碼對細胞而言同源(天然)或異源(外源)的細胞外或細胞內多肽的多核苷酸。啟動子可以是組成型或誘導型啟動子。
可以使用的誘導型啟動子的例子是淀粉誘導型啟動子、銅誘導型啟動子、油酸誘導型啟動子。啟動子可選自下組,所述組包括但不限于,得自編碼A. oryzae TAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、A. niger中性a -淀粉酶、A. niger酸穩定性a -淀粉酶、A. niger或A. awamori葡糖淀粉酶(glaA)、R. miehei脂肪酶、A. oryzae堿性蛋白酶、A. oryzae磷酸丙糖異構酶、A. nidulans乙酰胺酶的多核苷酸的啟動子,NA2_tpi啟動子(來自編碼A. niger中性a -淀粉酶和A. oryzae磷酸丙糖異構酶的多核苷酸的啟動子的雜交),及其突變、截短和雜交的啟動子。優選地,編碼纖維素酶、半纖維素酶和/或果膠酶的至少四種多核苷酸是受啟動子驅動的,所述啟動子在含有葡萄糖的培養基中是活性的,所述啟動子例如葡糖淀粉酶啟動子,優選地glaA啟動子,因為這使得不需要存在纖維素酶誘導物。因此,本發明還涉及在葡萄糖培養基中在缺乏纖維素酶誘導物時能產生纖維素酶的宿主細胞。 其他啟動子是在W02006/092396和W02005/100573中描述的啟動子,所述參考文獻通過引用并入本文。為了有助于表達和/或翻譯,多核苷酸或核酸構建體根據本發明可包含在表達載體中使得編碼感興趣的(一種或多種)酶的(一種或多種)多核苷酸與適當控制序列可操作地連接,用于體外或在原核或真核宿主細胞中表達和/或翻譯。表達載體可以是任何載體(例如,質粒或病毒),其可方便地經受重組DNA程序并可帶來編碼感興趣的多肽(多種)的核酸序列的表達。載體的選擇典型地取決于載體和載體將被引入的細胞的相容性。載體可以是線性或閉合環的質粒。載體可以是自主復制的載體,即,載體,其作為額外的染色體實體存在,其復制不依賴染色體復制,例如,質粒(額外的染色體元件)、微型染色體或人工染色體。自主維護的克隆載體可包含AMAl-序列(見例如 Aleksenko and Clutterbuck(1997), Fungal Genet. Biol. 21 :373-397)。或者,載體可以是這樣的載體,當被引入宿主細胞時,其被整合進基因組中并和已被整合進載體的染色一起復制。整合型克隆載體可在宿主細胞染色體中隨機整合,或在預定的靶基因座處整合。在本發明的一個的實施方式中,整合型克隆載體可包含與宿主細胞基因組中預定的靶基因座中的DNA序列同源的DNA片段,用于將克隆載體的整合靶向至該預定的基因座。為了促進定向整合,在轉化細胞之前優選地將克隆載體線性化。優選地進行下述線性化,所述線性化使得克隆載體的至少一端,優選地任一端的側翼是與靶基因座同源的序列。靶基因座側翼的同源序列的長度優選地至少30bp、優選地至少50bp、優選地至少0. Ikb、甚至優選地至少0. 2kb、更優選地至少0. 5kb、甚至更優選地至少Ikb、最優選地至少2kb。優選地,通過增強宿主細胞的同源重組能力,增加定向整合進宿主細胞基因組,SP在預定的靶基因座中整合的效率。優選地,與靶基因座同源的克隆載體中的同源側翼DNA序列得自高表達基因座,意味著它們得自能在宿主細胞中高表達水平的基因。能高表達水平的基因,即高表達基因,本文中定義為下述基因,其mRNA可占總細胞mRNA的至少0. 5% (w/w),例如在誘導條件下或可選擇地,其基因產物可占總細胞蛋白的至少1% (w/w)的基因,或在分泌的基因產物的情況下,可被分泌為至少0. lg/1的水平(如在EP 357 127B1中描述的)。多于一個拷貝核酸序列可被插進細胞中以提高通過所述序列編碼的產物的生產。這可優選地通過整合進DNA序列的其基因組拷貝中,更優選地通過在前面段落中定義的高表達基因座之一上定向整合DNA序列來進行。或者,這通過包括具有核酸序列的擴增的可選擇標記物基因來進行,其中通過在存在適當選擇試劑情況下培養細胞,含有擴增的可選擇標記物基因拷貝和因而額外的核酸序列拷貝的細胞可被選擇。為增加將被過表達的甚至更多數目的DNA序列的拷貝,可使用如在W098/46772中描述的基因轉變技術。載體系統可以是單個載體或質粒或一起含有將被引入宿主細胞基因組的總DNA的兩個或多個載體或質粒,或轉座子。載體優選地含有一個或多個選擇性標記物,所述標記物允許轉化的細胞容易選擇。選擇性標記物是下述基因,其基因產物提供殺生劑或病毒抗性、對重金屬的抗性、營養缺陷型的原養型等等。選擇性標記物可在作為表達盒的表達載體上被引入細胞或可在單獨的表達載體上被引入。用在絲狀真菌細胞中的選擇性標記物可從下述組中選擇,所述組包括但不限于amdS(乙酰胺酶)、argB (鳥氨酸氨甲酰轉移酶)、bar (草胺膦乙酰基轉移酶)、bleA(腐草霉素結合)、hygB (潮霉素磷酸轉移酶)、niaD (硝酸鹽還原酶)、pyrG (乳清酸核苷_5'-磷酸脫羧酶)、SC(硫酸腺苷轉移酶)和trpC(鄰氨基苯甲酸合酶)以及來自其他物種的等同物。優選的用在 Aspergillus 和 Penicillium 細胞中的是 A. nidulans 或 A. oryzae 的 amdS基因(見例如 EP 635574B1、EP0758020A2、EP1799821A2、WO 97/06261A2)和 pyrG 基因和Streptomyces hygroscopicus的bar基因。更優選地使用amdS基因,甚至更優選地來自A. nidulans或A. niger的amdS基因。最優選的選擇性標記物基因是與A. nidulans gpdA啟動子融合的A. nidulans amdS編碼序列(見EP 635574B1)。其他優選的AmdS標記物是在W02006/040358中描述的那些。還可以使用來自其他絲狀真菌的AmdS基因(W0 97/06261)。用來連接上述的元件以構建本發明的重組表達載體的程序對本領域技術人員而言是熟知的(見,例如 Sambrook&Russell,Molecular Cloning A Laboratory Manual, 3rdEd. ,CSHL Press,Cold Spring Harbor,NY. 2001 ;and Ausubel et al.,Current Protocolsin Molecular Biology, Wiley InterScience, NY,1995).此外,標準分子克隆技術比如DNA分離、凝膠電泳、核酸的酶限制性修飾、Southern分析、細胞轉化等等對技術人員而言是已知的并被例如Sambrook etal. (1989) " Molecular Cloning a laboratory manual " , Cold Spring HarborLaboratories, Cold Spring Harbor, N ew York and Innis et al. (1990) " PCRprotocols, a guide to 方法 s and applications" Academic Press, San Diego 描述。使用期望的多核苷酸序列作為雜交探針,可使用標準雜交和克隆技術,分離根據本發明的核酸分子(e. g.,as described in Sambrook, J.,Fritsh, E. F.,and Maniatis,T. Molecular Cloning A Laboratory Manual. 2nd,ed. , Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)。可根據標準PCR擴增技術,使用cDNA、mRNA或者基因組DNA作為模板和適宜的寡核苷酸引物擴增核酸分子。這樣擴增的核酸分子可被克隆進適宜的載體中并通過DNA序列分析表征。而且,可通過標準合成技術,例如使用自動DNA合成儀,制備與根據本發明的核苷酸序列對應的或可雜交的寡核苷酸。、
優選地,宿主細胞,例如Aspergillus被工程改造以改進感興趣的多核苷酸表達。優選地,通過增強宿主細胞的同源重組能力,增加定向整合進宿主細胞,即在預定的靶基因座上整合的效率。此類細胞的表型優選地包括如在W02005/095624A2中描述的缺陷型hdfA或hdfB。W02005/095624A2公開了獲得包含增加的定向整合效率的絲狀真菌細胞的優選的方法。或者,宿主細胞包含與野生型細胞相比的提高的未折疊蛋白反應(UPR),以增強感興趣的多肽的生產能力。通過在US2004/0186070A1和/或US2001/0034045A1和/或W001/72783A2和/或W02005/123763A1中描述的技術可增加UPR。更特定地,HACl和/或IREl和/或PTC2的蛋白水平已被調控,和/或SEC61蛋白已被工程改造,以獲得具有提高的UPR的宿主細胞。或者,或與提高的UPR組合,對宿主細胞進行遺傳修飾,以獲得與野生型細胞相比展示更低蛋白酶表達和/或蛋白酶分泌的表型,從而增強感興趣的多肽的生產能力。此類表型可以通過蛋白酶表達的轉錄調節子的缺失和/或修飾和/或失活來獲得。此類轉錄調節子可以是例如prtT。通過調控prtT來降低蛋白酶的表達可以通過US2004/0191864A1中描述的技術進行。或者,或與提高的UPR和/或展示更低蛋白酶表達和/或蛋白酶分泌的表型組合,宿主細胞展示了草酸鹽缺陷型表型,從而增強感興趣的多肽的生產產量。草酸鹽缺陷型表型可以通過W02004/070022A2中描述的技術獲得。或者,或與提高的UPR和/或展示更低蛋白酶表達和/或蛋白酶分泌和/或草酸 鹽缺陷的表型組合,宿主細胞展示了與野生型相比的表型差異的組合,以增強感興趣的多肽的生產產率。這些差異可包括但不限于,降低的葡糖淀粉酶和/或中性a-淀粉酶A和/或中性a-淀粉酶B蛋白酶和草酸水解酶的表達。宿主細胞展示的所述表型差異可以通過根據US2004/0191864A1中所述技術的遺傳修飾獲得。或者,或與提高的UPR和/或展示更低蛋白酶表達和/或蛋白酶分泌和/或草酸鹽缺陷的表型和雨野生型相比為了增強感興趣的多肽生產產率的表型差異的組合相組合,宿主細胞展示毒素基因的缺陷,使得絲狀真菌宿主細胞失去表達毒素的能力。此類毒素包括但不限于,赭曲毒素,煙曲霉毒素,環并偶氮酸(cyclapiazonic acid),3_硝基丙酸,布洛芬,畸形素,黃曲霉毒素和黑麥酸。此類缺陷優選地例如描述于W02000/039322A1中本領域技術人員知道怎樣用一個或多個表達盒和選擇性標記物轉化細胞。例如,技術人員可使用一個或多個表達載體,其中一個或多個克隆載體包含表達盒和選擇性標記物。細胞的轉化可通過任何合適的已知方法進行,包括例如電穿孔法、粒子轟擊或微粒轟擊、原生質體法和Agrobacterium介導的轉化(AMT)。優選地,使用原生質體方法° 轉化的程序由 J. R. S. Fincham, Transformation in fungi. 1989, microbiologicalreviews. 53,148-170 描述。優選地,通過本領域熟知的技術進行通過多核苷酸表達載體或核酸構建體引入細胞的宿主細胞轉化(見Sambrook & Russell ;Ausubel, supra)。轉化可包括由下述組成的方法原生質體形成、原生質體轉化和以自身已知的方式的細胞壁再生。Aspergillus細胞轉化的合適的程序在 EP 238 023A2 和 Yelton et al. , 1984, Proceedings ofthe National Academy of Sciences USA 81 1470-1474 描述。使用 Agrobacteriumtumefaciens轉化Aspergillus和其他絲狀真菌宿主細胞的合適的程序在例如De Grootet al. ,Agrobacterium tumefaciens-mediated transformation of filamentous fungi.Nat Biotechnol. 1998,16 :839-842. Erratum in Nat Biotechnol 199816 :1074 中描述。轉化 Fusarium 物種的合適的方法被 Malardier et al. , 1989, Gene 78:147156 or inWO 96/00787A2描述。可應用其他方法,比如使用如在Christiansen et al. , Biolistictransformation of the obiigate plant pathogenic fungus,Erysiphe graminis f. sp.hordei. 1995, Curr Genet. 29 100-102中描述的基因槍轉化的方法。使用Becker andGuarente, In Abelson, J. N. and Simon, M. I. , editors, Guide to Yeast Genetics andMolecular Biology, Methods in Enzymology, Volume 194,pp 182—187, Academic Press,Inc. ,New York、Ito et al. ,1983,Journal of Bacteriology 153 :163和Hinnen et al.,1978,Proceedings of the National Academy of Sciences USA 75 :1920描述的程序,可轉化酵母。為了增加感興趣的多核苷酸在宿主細胞中的拷貝數目,可需要多種宿主細胞轉化。以這種方式,通過宿主細胞生產的不同酶的比率可被影響。表達載體還可包含多個表達盒以增加將被轉化的(一種或多種)多核苷酸的拷貝數目。另一方式可以是選擇針對不同的多核苷酸的不同的控制序列,其取決于選擇可引起期望的酶的生產更高或更低。本發明的宿主細胞的一個優勢在于,本發明的宿主細胞用于制備具有一致組成的酶組合物。基于選擇性標記物的存在與否,可選擇用選擇性標記物轉化的細胞。在轉化(Aspergillus)細胞的情況下,通常當在同時用所有的核酸材料轉化細胞時,選擇性標記物存在時,編碼期望的(一種或多種)酶的(一種或多種)多核苷酸也存在。但是,為了確保期望的酶是通過宿主細胞產生的,可基于在發酵液中存在的酶選擇宿主細胞。如在下文實驗部分中描述的,期望的酶活性(WSU)的存在可在發酵液中檢測至|J。或者,可使用如在下文實驗部分中描述的SDS-PAGE分析,測定期望的酶的存在。酶組合物在另一方面中,本發明涉及酶組合物,所述酶組合物包含通過根據本發明的宿主細胞產生的至少四種不同的纖維素酶、半纖維素酶和/或果膠酶。酶組合物可以是未純化的發酵液,其中宿主細胞已產生并分泌至少四種不同的纖維素酶、半纖維素酶和/或果膠酶,所述發酵液含有宿主細胞或其可以是發酵液的進一步的純化形式。純化酶的方法對本領域技術人員而言是已知的(如下文描述的下游處理)。在一種實施方式中,CBHI在包含BG、EG和CBHII的酶組合物中提供。在其一種實施方式中,選擇酶量使得BG以2-12%、CBHI以10-65%、CBHII以10-40%且EG以12-70%存在,或在其一種實施方式中,BG以4-12%、EG以18-50%、CBHII以10-35%且CBHI以10-60%存在,基于總蛋白量(w/w)計算。
本發明的另一方面涉及培養發酵液的下游處理的選擇。根據本發明應用的分批工藝有助于下游處理,尤其因為高產率的有價值化合物的和低量的副產物。下游處理可包括回收以及形成步驟。
培養過程結束后,使用針對回收感興趣的有價值化合物開發的標準技術,有價值的產物可從培養發酵液中回收。將被應用的相關的下游處理技術因而取決于有價值化合物的性質和細胞定位和取決于感興趣的產物的期望純度水平。在典型的回收方法中,使用例如離心或過濾從培養液體中分離生物質。在有價值的產物在微生物細胞中累積或與微生物細胞關聯時,有價值化合物接著從生物質中回收。術語“回收”包括從培養基中分離、提取、收獲、分開或純化化合物。可根據本領域中已知任何常規分離或純化方法(包括但不限于PH改變、溶劑提取、透析、細胞過濾和超濾、濃縮、冷凍干燥等等)進行化合物分離。還在另一方面中,本發明涉及生產根據本發明的包含至少四種不同的纖維素酶、半纖維素酶和/或果膠酶的酶組合物的方法,所述方法包括下述步驟(a)提供本發明的宿主細胞(b)允許至少四種不同的纖維素酶、半纖維素酶和/或果膠酶經由宿主細胞生產和分泌,和
(C)任選的回收因此獲得的酶組合物。本發明還涉及通過該方法可獲得的酶組合物。例如,本發明的宿主細胞可在合適的培養基中在允許纖維素酶混合物將被表達和/或分離的條件下培養。使用本領域已知的程序(見,例如Bennett, J. W. and LaSure, L. , eds. ,More GeneManipulations in Fungi, Academic Press, CA, 1991),培養在包含碳源和氮源和無機鹽的營養培養基中發生。合適的培養基購自商業供應商或可使用(美國典型培養物收集中心的目錄中)公開的組成制備。在本文提到的培養基,對本發明不是關鍵的。假設養分供應過量,根據討論的宿主細胞的需要可添加養分至工藝中。培養基適宜地含有碳源、氮源以及其他用于微生物生長和/或產物形成的額外的化合物。例如,可存在額外的化合物用于誘導產物產生。本領域中已知的合適的碳源的例子包括葡萄糖、麥芽糖、糊精、蔗糖、水解淀粉、糖蜜和油。本領域已知的氮源的例子包括大豆粉、玉米漿、酵母提取物、氨、銨鹽和硝酸鹽。額外的化合物的例子包括磷酸鹽、硫酸鹽、痕量元素和維生素。取決于例如宿主細胞的需要和/或允許酶表達和分泌的時間,將被添加的碳源和氮源的總量可改變。碳源和氮源之間的比率可相當大的改變,其中碳源和氮源之間的最佳比率的一個決定因素可以是將要形成的產物的元素組成。宿主細胞生長和/或產物形成需要的額外的化合物比如磷酸鹽、硫酸鹽或痕量元素可以在不同種類的宿主細胞之間(即真菌、酵母和細菌之間)可改變的量添加。此外,通過形成的產物類型,可確定將被添加的額外的化合物的量。“回收因而獲得的酶組合物”意味著酶組合物可與宿主細胞和不是期望的酶的其他組分分開(見上文描述的下游處理)。優選地,宿主細胞被允許在含葡萄糖的培養基中產生和分泌至少四種不同的纖維素酶、半纖維素酶和/或果膠酶,由于本文中描述的原因,所述含葡萄糖的培養基優選地不含有纖維素酶誘導物。當然,本發明的酶組合物還可包含其他組分,例如蛋白,比如酶;或其他組分。在蛋白的情況下,這些蛋白已通過宿主細胞產生并分泌,但是它們還可被單獨添加至酶組合物。
例如,酶組合物可包含輔助酶活性。此種額外的活性可源自典型來源和/或通過遺傳修飾的生物體產生。 因此,再者,從下述組中選擇的一個或多個(例如兩種、三種、四種或所有)酶可在本發明的酶組合物中存在淀粉酶、蛋白酶(優選地來自不降解纖維素酶的蛋白酶組)、在酶組合物中存在的半纖維素酶和/或果膠酶;脂肪酶、木質酶、己糖基轉移酶、葡糖醛酸糖苷酶、擴展蛋白、纖維素誘導的蛋白、纖維素整合蛋白和其他蛋白。“蛋白酶”包括水解肽鍵的酶(肽酶),以及水解肽和其它部分如糖之間鍵的酶(糖肽酶)。許多肽酶根據EC 3. 4表征,適合在本發明中使用并且通過引用并入本文。一些特定類型的蛋白酶包括半胱氨酸蛋白酶(包括胃蛋白酶,木瓜蛋白酶)和絲氨酸蛋白酶(包括糜蛋白酶,羧肽酶和金屬內切蛋白酶)。“脂肪酶”包括水解脂質、脂肪酸和酰基甘油酯(包括磷酸甘油酯)、脂蛋白、二酰基甘油等等的酶。在植物中,脂質被用作結構組分,來限制水損失和病原體感染。這些脂質包括來自脂肪酸的蠟質,以及角質和木栓素(suberin)。“木質酶”包括能夠水解或分解木質素聚合物結構的酶。能夠分解木質素的酶包括木質素過氧化物酶、錳過氧化物酶、漆酶和阿魏酸酯酶,和在本領域中已知解聚或以其他方式分解木質素聚合物的描述的其他酶。還包括在內的是能夠水解在半纖維素糖(主要是阿拉伯糖)和木質素之間形成的鍵的酶。木質酶包括但不限于以下組的酶木質素過氧化物酶(EC I. 11. I. 14)、錳過氧化物酶(EC I. 11. I. 13)、漆酶(EC I. 10. 3. 2)和阿魏酸酯酶(EC3. I. I. 73)。“己糖基轉移酶”(2. 4. I-)包括能催化轉移酶反應但還能催化纖維素和/或纖維素降解產物的水解反應的酶,可以在本發明中使用的己糖基轉移酶的例子是¢-葡聚糖基轉移酶。此類酶可以能夠催化(1,3) (1,4)葡聚糖和/或纖維素和/或纖維素降解產物的降解。“葡糖醛酸糖苷酶”包括催化葡糖醛酸苷(例如P -葡糖醛酸苷)水解得到醇的酶。許多葡糖醛酸糖苷酶已被表征,并可適合在本發明中使用,例如3 -葡糖醛酸糖苷酶(EC 3.2. I. 31),透明質酸酶葡糖醛酸糖苷酶(EC 3.2. I. 36),葡糖醛酰基-二硫葡糖胺葡糖醛酸糖苷酶(3. 2. I. 56),甘草酸P -葡糖醛酸糖苷酶(3. 2. I. 128)或a -D-葡糖醛酸糖苷酶(EC 3. 2. I. 139)。本發明的組合物可包含擴展蛋白多肽或擴展蛋白樣多肽,如膨脹因子(swollenin)(見 Salheimo et al. , Eur. J. Biohem. 269,4202-4211, 2002)或膨脹因子樣多肽。擴展蛋白涉及植物細胞生長期間細胞壁結構的松弛。已經提出擴展蛋白破壞纖維素和其他細胞壁多糖之間的氫鍵,但不具有水解活性。認為它們通過這種方式允許纖維素纖維的滑動和細胞壁的擴大。一種擴展蛋白樣蛋白——膨脹因子,含有N端碳水化合物結合模塊家族I結構域(CBD)和C端擴展蛋白樣結構域。就本發明的目的而言,擴展蛋白樣蛋白或膨脹因子樣蛋白可包含此類結構域中的一種或兩種和/或可破壞細胞壁的結構(如破壞纖維素結構),任選地不生產可檢測量的還原糖。本發明的組合物可包含纖維素整合蛋白、支架蛋白或支架樣蛋白的多肽產物,例如分別來自 Clostridium thermocellum 或 Clostridium cellulolyticum 的 CipA 或 CipC
支架蛋白和纖維素整合蛋白是多功能整合亞基,其可將分解纖維素的亞基組合進多酶復合物中。這通過兩類互補的結構域(即支架蛋白上的內聚結構域(cohesiondomain)和每個酶單元上的錨定結構域(dockerin domain))的相互作用完成。支架蛋白亞基還帶有介導纖維體與其底物結合的纖維素結合模塊(CBM)。就本發明的目的而言,支架蛋白或纖維素整合蛋白可包含此類結構域中的一種或兩種。本發明的組合物可包含纖維素誘導的蛋白或調節蛋白,例如由來自Trichodermareesei/Hypocrea jacorina的cipl或cip2 基因或類似基因所編碼的蛋白(見Foreman etal.,J. Biol. Chem. 278 (34) 31988-31997,2003)。這些基因的多肽產物是雙模塊蛋白,其含有纖維素結合模塊和其功能或活性不與已知的糖基水解酶家族相關的結構域。而纖維素結合模塊的存在和這些基因的表達與纖維素酶元件的共同調節表明在生物質降解中具有潛在作用的先前未被認識的活性。本發明的組合物可由上文提到的多肽種類的任一成員、一個多肽種類的若干成員、或這些多肽種類的任何組合組成。在本發明的組合物可以由來自以下的多肽(例如酶)組成(1)供應商;(2)克隆基因表達的多肽,例如酶;(3)復合發酵液(例如由培養基中微生物菌株的生長得到的,其中所述菌株向培養基中分泌蛋白和酶);(4)如(3)中生長的菌株的細胞裂解物;和/或(5)植物材料表達的多肽,例如酶。本發明組合物中不同的多肽,例如酶可得自不同的來源。酶組合物的可以是熱穩定的。本文中,這表示活性具有約60°C或更高,例如約700C或更高比如約75°C或更高,例如約800C或更高比如85°C或更高的最適溫度。酶組合物的活性典型地不具有相同的最適溫度,但優選地仍然是熱穩定的。再者,酶組合物中的酶活性可以能在低pH下工作。就本發明目的而言,低pH表示約5. 5或更低、約5或更低、約4. 5或更低、約4. 0或更低或約3. 8或更低或約3. 5或更低的pH。酶組合物中的活性可通過任何上文的最適溫度和pH值的組合定義。酶組合物的工業應用原則上,本發明的酶組合物可以在任何需要處理包含非淀粉多糖的材料的方法中使用。因此,本發明的多肽或酶組合物可以在非淀粉多糖材料的處理中使用。本文中,非淀粉多糖材料是下述材料,所述材料包含一種或更典型地多種非淀粉多糖或者基本由一種或更典型地多種非淀粉多糖組成。典型地,植物和真菌和得自它們的材料包含大量非淀粉的多糖材料。因此,本發明的多肽可以用于植物或真菌材料或源自它們的材料的處理。植物非淀粉多糖材料的一個重要的組分是木質纖維素(在本文中也稱作木質纖維素生物質)。木質纖維素是由纖維素和半纖維素和木質素組成的植物材料。碳水化合物聚合物(纖維素和半纖維素)與木質素通過氫鍵和共價鍵緊密結合。因此,本發明的多肽可以用于木質纖維素材料的處理。本文中,木質纖維素材料是包含木質纖維素或基本由木質纖維素組成的材料。因此,在用于處理非淀粉的多糖的本發明方法中,非淀粉的多糖可以是木質纖維素材料/生物質。因此,本發明提供了用于處理包含非淀粉多糖的方法,其中所述處理包括纖維素和/或半纖維素的降解和/或改性。
降解在本文上下文中表示導致產生纖維素和/或半纖維素和/或果膠物質的水解產物(即與類似的未經處理的非淀粉多糖中存在的相比,由于處理而存在更短鏈的糖)的處理。因此,降解在本文上下文中可以導致寡糖和/或糖單體的釋放。所有植物和真菌都含有非淀粉的多糖,同樣,基本上所有來自植物和真菌的多糖材料也含有非淀粉的多糖。因此,在本發明的用于處理非淀粉多糖的方法中,所述非淀粉多糖可以以植物或源自植物的材料或包含植物或源自植物的材料的形式提供,例如以植物漿體、植物提取物、食品或其成分、織物、紡織品或衣物。本發明的酶組合物能夠極度有效地將木質纖維素材料,例如玉米桿或麥秸,水解成單體糖(木質纖維素材料的水解在本文中還被稱為木質纖維素材料的糖化),所述單體糖隨后可以被轉化成有用的產物,如乙醇。因此,在另一方面中,本發明涉及糖化木質纖維素材料的方法,其包括下述步驟
-任選的預處理木質纖維素材料,和
-使木質纖維素材料與根據本發明的酶組合物接觸以產生一種或多種糖。本發明的酶組合物可用來進行非常有效的木質纖維素底物的水解。鑒于需要較低量的酶(與當前可得到的產物比較),這在從木質纖維生物質生產燃料乙醇的商業可行方法情形下是非常重要的。另外,目前可獲得的具有纖維素酶活性的酶(典型地源自Trichoderma)在嗜溫溫度(mesophilic temperatures)如45°C到50°C下和pH 5. 0下發揮功能。然而,這可導致降低產率的細菌感染,因此期望在65°C或更高的溫度下進行糖化。另外,嗜溫溫度的使用提高了使用的生物質的粘度,從而限制了使用的干物質含量。另外,使用經酸預處理的生物質時,必須提高pH,使得酶能夠糖化生物質中的糖。在商業可行的燃料乙醇工業的情形中,這意味著需要例如氫氧化鈉或硫酸鈣和生產大量相應的鹽,例如在氫氧化鈉情況下生產石膏。因此,期望使用能夠在PH 4.0或更低的pH下工作的酶進行糖化。而且,如果從編碼纖維素酶、半纖維素酶和果膠酶的多核苷酸組中選擇的編碼至少四種不同酶的多核苷酸是源自Talaromyces菌株,例如源自Talaromyces emersonii菌株的多核苷酸,該水解可尤其在高溫下進行。在更高溫度下,例如在65°C或更高溫度下的木質纖維素底物水解是有利的,因為這(i)降低了細菌感染的風險,并且(ii)導致更不粘稠的生物質漿體。后者的效果是顯著的,因為其使得能夠更好地摻合酶,導致植物中更高的可加工的干物質,并允許因此實現更高的乙醇濃度。因此,需要使用更少的能量來提高可持續性(sustainability),并且需要更少的發酵過程,從而需要更低的投資。木質纖維素材料的預處理通常在高的溫度下發生;如果從編碼纖維素酶、半纖維素酶和果膠酶的多核苷酸組中選擇的編碼至少四種不同酶的多核苷酸是源自Talaromyces菌株,例如源自Talaromyces emersonii菌株的多核苷酸,在添加酶之前,不需要完全將木質纖維素材料冷卻至低的溫度,比如低于40°C。代替地,酶組合物可例如被添加至具有高至80°C的溫度的木質纖維素材料,例如具有在從60至80°C的溫度范圍中例如在約65°C的木質纖維素材料。這相當大地縮短了糖化木質纖維素材料方法的時間并提供了更為綠色的途徑。其原因是在更高溫度下添加酶需要較少冷卻預處理的木質纖維素材料,這節省了能源并且酶可被更早地添加至木質纖維素材料,這節省了時間。例如,通過本發明的酶組合物水解木質纖維素材料可在至少30°C,例如至少37°C、例如至少40°C、例如至少50°C、例如至少56°C、例如至少60°C、例如至少65°C、例如至少70°C的溫度下進行。例如,通過本發明的酶組合物水解木質纖維素材料可在至多100°C,例如至多90°C、例如至多80°C、例如至多70°C的溫度下進行。另外,所述水解可以在低pH,例如在pH 4.0或更低的pH下下進行。這是有利的,因為通常用酸預處理生物質。如果隨后用于糖化的酶能夠在低PH下作用,則用這種方式預處理的生物質不需要進行PH調節。這意味著對例如氫氧化鈉或硫酸鈣的更低需要,和其中沒有廢棄鹽的方法。這在例如要生產乙醇的方法中是意義重大的,因為在此類方法中要消耗巨大量的材料。這允許進行不需要或需要小的PH調節的根據本發明的方法,即不需要添加酸或堿或添加酸或堿的需要減少。因此,所述方法可以作為零或低廢棄物(無或低鹽產 生)方法進行和/或作為其中不需要或需要少的無機化學品輸入的方法來進行。另外,還表明了使用高干物質含量時,酶組合物能夠有效水解生物質。高度期望在例如燃料乙醇生產中使用的酶能夠作用于具有高粘度的底物(即高干重組合物),因為這允許實現更高量的終產物,例如燃料乙醇。顯著地,在水解反應中可使用高水平的(木質纖維素材料)干物質,進行本發明的方法。因而,可用約5%或更高、約8%或更高、約10%或更高、約15%或更高、約20%或更高、約25%或更高、約30%或更高、約35%或更高或約40%或更高的干物質含量進行本發明。優選地,在所述方法中,木質纖維素材料是果園底料,樹叢,磨坊廢棄物,城市木材廢棄物,市政廢棄物,伐木廢棄物,森林疏伐廢棄物,短期輪種木本作物,工業廢棄物,小麥秸,燕麥秸,水稻秸,大麥秸,黑麥秸,亞麻秸,大豆殼,稻殼,水稻秸,玉米谷蛋白飼料,甘蔗,玉米秸桿,玉米桿,玉米芯,玉米殼,芒屬植物,甜高粱,油菜莖,大豆莖,牧場草,磨擦禾,狐尾草;甜菜漿,柑橘果實漿,種子殼,纖維素動物糞便,草坪修剪廢棄物,棉花,海藻,針葉樹,白楊,松樹,灌木叢,草,小麥,小麥秸,甘蔗渣,玉米,玉米棒,玉米粒,來自玉米粒的纖維,來自谷物濕磨或干磨的產物和副產物,市政固體廢棄物,廢紙,庭院廢棄物,草本材料,農業殘余物,林業殘余物,廢紙,紙漿,造紙廠殘余物,樹枝,灌木,甘蔗,能源作物,森林,水果,鮮花,谷物,草,草本作物,樹葉,樹皮,針葉,原木,根,樹苗,灌木叢,柳枝稷,樹木,蔬菜,水果皮,藤蔓,甜菜漿,小麥麩皮,燕麥殼,硬木材或軟木材,由農業加工產生的有機廢棄物材料,林業木材廢棄物,或其中任意兩種或更多的組合。組合物與底物在任何適當條件下反應。例如,酶可在約25°C、約30°C、約35°C、約 37°C、約 40°C、約 45°C、約 50°C、約 55°C、約 60°C、約 65°C、約 70°C、約 75°C、約 80°C、約85°C、約90°C或更高溫度下孵育。即,它們可在從約20°C至約95°C的溫度下在例如從低至中等離子強度和/或從低至中性PH的緩沖液中孵育。“中等離子強度”表示對任何單個離子組分而言,緩沖液具有約200毫摩爾(mM)或更少的離子濃度。pH可在從約pH 2. 5、約pH3. O、約 pH 3. 5、約 pH 4. O、約 pH 4. 5、約 pH 5、約 pH 5. 5、約 pH 6、約 pH 6. 5、約 pH 7、約 pH7. 5、約pH 8. 0至約pH 8. 5的范圍內。通常,pH范圍會從約pH 3. 0到約pH 9。典型地,反應可以在上文定義的低pH條件下進行。因此,可以進行本發明的方法從而不需要調節pH(即調節至更中性的pH)。也就是說,可以使用經酸預處理的原料,因為在添加本發明的酶組合物之前不需要添加例如過氧化鈉。可以在液化/水解之前洗滌原料。所述洗滌可以例如用水進行。在這些條件下孵育組合物導致大量糖從木質纖維素材料釋放或解離。大量表示至少約20 %、至少約30 %、至少約40 %、至少約50 %、至少約60 %、至少約70 %、至少約80 %、至少約90%、至少約95%或更多的可利用的糖。可以使用涉及用酶或酶混合物孵育的液化/水解或預糖化步驟。所述步驟可以在許多不同的溫度下進行,但是優選預糖化在最適合要測 試的酶混合物的溫度下,或針對要測試的酶預測的酶最適溫度下進行。預處理溫度可以在從約10°C到約100°C,約30°C到約80 V,約40 V到約70 V,約50 V到約70 V,優選地約60 V到約70 V,更優選地約65 °C。缺失最適溫度數據時,優選首先在37°C下,然后在更高溫度如65°C下進行預處理反應。預糖化混合物的pH可以在從約2. 0到約10. 0,但是優選地約3. 0到約5. O。另外,在糖化之前可能不必須調節PH,因為酶組合物典型地適合在本文定義的低pH下使用。液化/水解或預糖化步驟反應可以進行數分鐘到數小時,例如從約I小時到約120小時,優選地從約2小時到約48小時,更優選地從約2小時到約24小時,最優選地從約2小時到約6小時。液化/水解可進行數分鐘到數小時,例如從約6小時到約168小時,優選地約12小時到約96小時,更優選地約24小時到約72小時,進一步更優選地從約24小時到約48小時。取決于應用,例如當酶或酶組合物用在液化/水解與發酵組合的方法中時,所述方法可作為分開的水解和發酵(SHF)和同時水解和發酵(SSF)進行。在SSF中,預糖化是適當的。SHF和SSF將在下文更詳細描述。本發明還涉及將木質纖維素材料轉化為有用產物的方法,其包括下述步驟a)預處理一種或多種木質纖維素材料以產生預處理的木質纖維素材料;b)酶處理預處理的木質纖維素材料以產生一種或多種糖;c)將糖轉化為一種或多種有用的產物和d)分離一種或多種有用的產物,其中在步驟a)、b)或c)中,使用或添加了本發明的酶組合物。因此,本發明還涉及用于制備發酵產物的方法,所述發酵產物包括氨基酸、維生素、藥物、動物飼料補充劑、特種化學品、化學原料、塑料、溶劑、燃料或其他有機聚合物、乳酸、乙醇、燃料乙醇或化學品、塑料、二羧酸(比如琥珀酸、衣康酸、己二酸)、(生物)燃料(包括乙醇、甲醇、丁醇、合成液體燃料和沼氣),其中用發酵微生物,優選酵母,發酵根據本發明的方法生產的一種或多種糖,以生產發酵產物。“發酵微生物”表示具有能將一種或多種糖轉化為發酵產物的能力的微生物。可以進行此類方法而不需要在所述方法期間調節pH。也就是說,所述方法是可以不添加任何酸或堿而進行的方法。然而,這排除了其中可以添加酸的預處理步驟。關鍵是本發明的組合物能夠在低PH下發揮作用,因此不需要調節經酸預處理的原料的pH,從而可以發生糖化。因此,本發明的方法可以是僅使用有機產物而不需要輸入無機化學品的零廢棄物方法。優選地,在根據本發明的方法,有用的產物是下述的一種或多種乙醇、丁醇、乳酸、塑料、有機酸、溶劑、動物飼料補充劑、藥物、維生素、氨基酸、酶或化學原料。本發明涉及下述組合物,所述組合物包含纖維素水解和/或半纖維素水解酶活性并且具有改性(例如降解)非淀粉的碳水化合物材料的能力。非淀粉的碳水化合物材料是包含一種或多種非淀粉的碳水化合物的材料、由一種或多種非淀粉的碳水化合物組成的材料或基本由一種或多種非淀粉的碳水化合物組成的材料。碳水化合物在本文上下文中包括所有糖,例如多糖、寡
糖、二糖或單糖。本文所述的組合物典型地通過此類材料的化學改性來改性非淀粉的碳水化合物材料。該碳水化合物材料的化學改性可例如通過水解、氧化或其他化學改性(例如通過裂合酶的作用)導致此類材料的降解。適用于被本文所述的組合物改性的非淀粉的碳水化合物是木質纖維素。可以被認為是潛在的可再生原料的、包含不同木質纖維素殘基的主要的多糖是纖維素(葡聚糖)、半纖維素(木聚糖、雜木聚糖(heteroxylans)和木葡聚糖(xyloglucans))。另外,一些半纖維素可以作為葡甘露聚糖(glucomannans)存在于例如木材衍生的原料中。這些多糖成為可溶糖(包括單體和多體,例如葡萄糖、纖維二糖、木糖、阿拉伯糖、半乳糖、果糖、甘露糖、 鼠李糖、核糖、半乳糖醛酸、葡糖醛酸和其他己糖和戊糖)的酶促水解發生于共同作用的不同酶的作用下。另外,果膠和其他果膠物質如阿拉伯聚糖(arabinans)可占來自非木本植物組織典型的細胞壁干物質的可觀的比例(約四分之一到一半的干物質可以是果膠)。纖維素是由通過¢-1,4鍵連接的葡萄糖殘基組成的線性多糖。纖維素纖維的線性本質以及化學計量的¢-連接的葡萄糖(相對于a)產生比淀粉的高度枝化的a-連接的結構更傾向于鏈間(interstrand)氫鍵合的結構。因此,纖維素聚合物與淀粉中存在的纖維相比通常溶解度更小,并且形成更緊密結合的纖維。制備發酵產物的方法可任選地包括回收發酵產物。此類方法可在需氧或厭氧條件下進行。優選地,所述方法在微需氧或氧受限的條件下進行。厭氧發酵方法在本文中被定義為在不存在氧時運行的,或者其中基本不消耗氧,優選地消耗約5或更少、約2. 5或更少、或約lmmol/L/h或更少氧,并且其中有機分子既作為電子供體又作為電子受體的發酵方法。氧受限的發酵方法是其中氧消耗受到從氣體到液體的氧轉移限制的方法。氧限制程度由進入氣流的量和組成以及使用的發酵設備的實際混合/物料轉移性質決定。優選地,在氧受限條件下進行的方法中,氧消耗速率至少約5. 5,更優選地至少約6,進一步更優選地至少約7mmol/L/h。制備發酵產物的方法可任選地包括回收發酵產物。缺乏氧時,在糖酵解和生物質形成中產生的NADH不能通過氧化磷酸化被氧化。為解決這個問題,許多微生物使用丙酮酸鹽或其衍生物作為電子和氫受體因而產生NAD+。因而,在優選的厭氧發酵方法中,丙酮酸鹽被用作電子(和氫受體)并被還原為發酵產物比如乙醇、丁醇、乳酸、3-輕基-丙酸、丙烯酸、乙酸、琥m酸、梓檬酸、蘋果酸、富馬酸、氨基酸、1,3_丙烷-二醇、乙烯、甘油、¢-內酰胺抗生素和頭孢菌素。發酵方法優選地在對細胞而言是最佳的溫度下運行。因而,對于大多數酵母或真菌宿主細胞而言,發酵方法在小于約42°C、優選地小于約38°C的溫度下進行。對于酵母或絲狀真菌宿主細胞而言,發酵方法優選地在低于約35、約33、約30或約28°C的溫度且高于約20、約22或約25 °C的溫度下進行。
在方法中在木糖和/或葡萄糖上的乙醇產率優選地至少約50、約60、約70、約80、約90、約95或約98%。乙醇產率在本文中定義為理論最大產量的百分比。本發明還涉及用于產生發酵產物的方法。在優選的方法中,細胞發酵木糖和葡萄糖二者,優選地同時發酵,在這種情況下,優選地,使用對葡萄糖抑制不敏感的細胞,以防止二次生長。除了木糖來源作為碳源之外,發酵培養基還包含細胞生長需要的適當成分。用于微生物比如酵母生長的發酵培養基組成是本領域熟知的。發酵方法可以以分批、補料分批或連續模式進行。可應用單獨的水解和發酵(SHF)方法或同時糖化和發酵(SSF)方法。這些發酵方法模式的組合對于最佳生產力而言也是可能的。這些方法在下文詳細描述。SSF 樽式 對同時糖化和發酵(SSF)的模式而言,液化/水解或預糖化步驟的反應時間取決于實現期望產率(即纖維素成為葡萄糖的轉化產率)的時間。這類產率優選地盡可能高,優選地為60%或更多,65%或更多,70%或更多,75%或更多,80%或更多,85%或更多,90%或更多,95%或更多,96%或更多,97%或更多,98%或更多,99%或更多,甚至99. 5%或更多或99. 9%或更多。根據本發明,在SHF模式下實現了非常高的糖濃度,在SSF模式下實現了非常高的產物濃度(例如乙醇)。在SHF操作中,葡萄糖濃度是25g/L或更高,30g/L或更高,35g/L或更高,40g/L或更高,45g/L或更高,50g/L或更高,55g/L或更高,60g/L或更高,65g/L或更高,70g/L或更高,75g/L或更高,80g/L或更高,85g/L或更高,90g/L或更高,95g/L或更高,100g/L或更高,110g/L或更高,120g/L或更高,或者可以例如是25g/L-250g/L,30gl/L-200g/L,40g/L-200g/L,50g/L-200g/L,60g/L-200g/L,70g/L-200g/L,80g/L-200g/L,90g/L,80g/L-200g/LoSSF樽式中的產物濃度在SSF操作中,產物濃度(g/L)取決于生產的葡萄糖量,但因為在SSF中糖被轉化成產物,所以這是不可見的,并且糖濃度可以通過與理論最大產率(以gr產物/克葡萄糖計的Yps max)相乘而與潛在的葡萄糖濃度相關。發酵產物的理論最大產率(以gr產物/克葡萄糖計的Yps max)可得自生物化學教科書。對乙醇而言,I摩爾葡萄糖(ISOgr)根據酵母中正常的糖酵解發酵通路產生2摩爾乙醇(=2x46 = 92gr乙醇)。因此,基于葡萄糖的乙醇的理論最大產率為92/180 =0. 511gr乙醇/gr葡萄糖。對丁醇(MW 74gr/摩爾)或異丁醇而言,理論最大產率是每摩爾葡萄糖I摩爾丁醇。因此,(異)丁醇的Yps max = 74/180 = 0. 41 Igr (異)丁醇/gr葡萄糖。對乳酸而言,純乳酸發酵(homolactic fermentatio)的發酵產率是每摩爾葡萄糖2摩爾乳酸(MW = 90gr/摩爾)。根據所述化學計量法,Yps max = Igr乳酸/gr葡萄糖。對其他發酵產物而言,可以進行類似的計算。SSF 樽式在SSF操作中,產物濃度為25g*Yps g/L/L或更高,30*Yps g/L或更高,35g*Yps/L或更高,40*Yps g/L或更高,45*Yps g/L或更高,50*Yps g/L或更高,55*Yps g/L或更高,60*Yps g/L 或更高,65*Yps g/L 或更高,70*Yps g/L 或更高,75*Yps g/L 或更高,80*Ypsg/L 或更高,85*Yps g/L 或更高,90*Yps g/L 或更高,95*Yps g/L 或更高,100*Yps g/L 或更高,110*Yps g/L或更高,120g/L*Yps或更高,或者可以例如是25*Yps g/L_250*Yps g/L,30*Yps gl/L_200*Yps g/L,40*Yps g/L_200*Yps g/L,50*Yps g/L_200*Yps g/L,60*Ypsg/L_200*Yps g/L,70*Yps g/L_200*Yps g/L,80*Yps g/L_200*Yps g/L,90*Yps g/L,80*Yps g/L_200*Yps g/L。因此,本發明提供了制備發酵產物的方法,所述方法包括a.使用本文所述的方法降解木質纖維素;和b.發酵所得到的材料,從而制備發酵產物。
發酵產物本發明的發酵產物可以是任何有用的產物。在一種實施方式中,其是選自下述組的產物乙醇、n-丁醇、異丁醇、乳酸、3-羥基-丙酸、丙烯酸、乙酸、琥珀酸、延胡索酸、蘋果酸、衣康酸、馬來酸、檸檬酸、己二酸、氨基酸(比如賴氨酸、甲硫氨酸、色氨酸、蘇氨酸和天冬氨酸)、1,3-丙烷-二醇、乙烯、甘油、¢-內酰胺抗生素和頭孢菌素、維生素、藥物、動物飼料補充劑、特種化學品、化學原料、塑料、溶劑、燃料(包括生物燃料和沼氣)或有機聚合物和工業酶(比如蛋白酶、纖維素酶、淀粉酶、葡聚糖酶、乳糖酶、脂肪酶、裂合酶氧化還原酶、轉移酶或木聚糖酶)。回收發酵產物
對于回收發酵產物,可以使用現有技術。對于不同的發酵產物,不同的回收方法是適當的。從水性混合物中回收乙醇的現有技術通常使用分餾和吸附技術。例如,蒸餾釜可用來處理含有在水性混合物中的乙醇的發酵產物,以產生富集的含有乙醇的混合物,所述混合物接著經受分餾(例如分餾蒸餾或其他類似技術)。接下來,含有最高濃度的乙醇的餾分可通過吸附器,以從乙醇中去除(如果不是全部的話)大部分剩余的水。本發明將通過下述實施例的方式闡明,但不被這些實施例限制。
實施例實施例I多種 Talaromyces Emersonii 纖維素酶在 AsperRillus NiRer 中的表達該實施例描述了在A. niger WT-1中的T. emersonii CBS 39364纖維二糖水解酶-I (CBHI),T. emersonii CBS 39364 纖維二糖水解酶-II (CBHII),T. emersonii P -葡聚糖酶CEA CBS 39364(EG)和如在GenBank數據庫中列出的具有登錄號AAL69548的T. emersonii P -葡萄糖苷酶(BG)的克隆和表達。此外,菌株在搖瓶中生長后,將轉化體的纖維素酶活性與空菌株的纖維素酶活性比較。T emersonii編碼區在表達載體中的克隆通過DNA2.0 (Menlo Park, USA)合成編碼 T. emersonii 纖維二糖水解酶-I (CBHI)、T. emersonii 0 -葡聚糖酶CEA(EG)和T. emersonii ¢-葡萄糖苷酶(BG)的多核苷酸(DNA-序列)并作為EcoRI/SnaBI片段克隆進包含包含葡糖淀粉酶(glaA)啟動子和終止子序列的 pGBTOP-8 載體(EP 0635574A1),分別得到載體 pGBT0PEBA205、pGBT0PEBA8 和PGBT0PEBA4。為了克隆的目的,葡糖淀粉酶啟動子的3’部分的198個核苷酸也與編碼序列一起合成。T. emersonii 纖維二糖水解酶-I (CBHI)、T. emersonii beta-葡聚糖酶 CEA(EG)和T. emersonii P -葡萄糖苷酶(BG)的氨基酸序列分別由SEQ ID N0:l、3和5表示。DNA序列分別由SEQ ID N0:2、4和6表示。圖I表示載體pGBT0P12內的glaA啟動子的控制下的含有編碼 T. emersonii CBHI 的 DNA-序列的 pGBT0PEBA205 的圖譜。pGBT0PEBA205 對于包含編碼T. emersonii EG的DNA-序列的pGBT0PEBA8和包含編碼T. emersonii BG的DNA-序列的pGBT0PEBA4而言是代表性的。如在專利W02001/070998A1中描述的,編碼T. emersonii纖維二糖水解酶-II (CBHII)的多核苷酸從T. emersonii cDNA文庫中獲得。圖2表示含有載體PGBFINlKffO 9932617 (A2))內的 glaA 啟動子的控制下的編碼 T. emersonii CBHII 的DNA-序列的pGBFINEBA176的圖譜。pGBFINl I載體還含有選擇標記物AmdS (EP0758020 (A2),其針對使用乙酰胺作為唯一氮源的能力進行選擇。氨基酸序列和核苷酸序列分別由SEQ IDNO 7和8表示。 具有多種纖維素酶的Aspergillus niger的轉化Aspergillus niger WT-1 菌株用于轉化。Aspergillus niger WT-1 菌株源自在CBS中心保藏的在保藏號CBS 513. 88下的A. niger菌株(Pel et al. , Genomesequencing and analysis of the versatile cell factory Aspergillus niger CBS513. 88. 2007, Nat Biotechnol. 25 :189-90)。如在 EP 0635574(A1)中描述的,其包含通過使用“MARKER-GENE FREE”方法構建的編碼葡糖淀粉酶(glaA)的基因缺失。在該專利申請中,其廣泛描述了怎樣缺失CBS 513. 88基因組中glaA特異性DNA序列。該程序導致MARKER-GENE FREE A glaA重組體A. niger CBS513. 88菌株,其最終不具有任何外源DNA序列。為了將pGBTOPEBA 載體和 pGBFINEBA 176 引入 Aspergillus niger WT-1,基本上如TO 9846772 (A2)和WO 9932617 (A2)中描述的進行了轉化和隨后的轉化體選擇。簡而言之,在用NotI消化后,載體的線性DNA被分離,以從載體去除E. coli序列。用線性DNA轉化細胞后,在含有乙酰胺作為唯一氮源的培養基上選擇轉化體并進行菌落純化。如EP 635 574A1中描述的,使用500ml帶擋板的搖瓶在振蕩孵育器中在34°C下在170rpm下于100ml CSM-MES培養基中培養轉化體。在發酵的不同時間點下,收獲上清液樣品以通過SDS-PAGE分析測定表達。按照制造商的說明書,在NuPAGE 4-12%Bis-Tris (Invitrogen, Breda, The Netherlands)上在還原條件下分離蛋白樣品并用 SyproRuby (Invitrogen, Breda, The Netherlands)染色。圖3A顯示了測試的表達多種纖維素酶的轉化體的一個亞組的SDS-PAGE凝膠。通過 pGBT0PEBA4、pGBT0PEBA8、pGBFINEBA176 和 pGBT0PEBA205 編碼的蛋白的理論分子量在表I中示出。表I :通過 pGBT0PEBA4,pGBT0PEBA8, pGBFINEBA176 和 pGBT0PEBA205 編碼的蛋白
的理論分子量
權利要求
1.宿主細胞,其包含從編碼纖維素酶、半纖維素酶和果膠酶的多核苷酸組中選擇的至少四種不同的異源多核苷酸,其中所述宿主細胞能產生從纖維素酶、半纖維素酶和果膠酶的組中選擇的至少四種不同的酶,其中宿主細胞是絲狀真菌并能分泌所述至少四種不同的酶。
2.根據權利要求I的宿主細胞,其中所述宿主細胞是Aspergillus菌株。
3.根據權利要求I或權利要求2的宿主細胞,其中所述宿主細胞是從CBS513. 88及其衍生物中選擇的Aspergillus菌株。
4.根據權利要求1-3的任一項的宿主細胞,其中所述至少四種不同的酶是從纖維素酶和半纖維素酶的組中選擇的,優選地從纖維素酶組中選擇的。
5.根據權利要求1-4的任一項的宿主細胞,其中所述至少四種不同的酶是至少兩種不同的纖維二糖水解酶,任選地至少內切葡聚糖酶和至少β -葡萄糖苷酶。
6.根據權利要求1-5的任一項的宿主細胞,其中所述不同的纖維二糖水解酶之一與SEQ ID NO. I具有至少70%同一性且所述不同的纖維二糖水解酶中另一個與SEQ ID NO. 7具有至少70%同一性,其中所述內切葡聚糖酶與SEQ ID NO. 3具有至少70%同一性且其中所述β -葡萄糖苷酶與SEQ ID NO. 5具有至少70%同一性。
7.根據權利要求1-6的任一項的宿主細胞,其中所述至少四種不同的異源多核苷酸全球源自Talaromyces菌株,優選地源自Talaromyces emersonii菌株,更優選地源自Talaromyces emersonii CBS 39364。
8.根據權利要求1-7的任一項的宿主細胞,在16倍或更多倍稀釋的上清液或發酵液中具有2WSU或更大的纖維素酶活性。
9.根據權利要求1-8的任一項的宿主細胞,其能在含葡萄糖的培養基中在缺乏纖維素酶誘導物時產生纖維素酶。
10.用于制備根據權利要求1-9的任一項的宿主細胞的方法,其包括下述步驟 (a)提供一個或更多個表達盒,其包含從多核苷酸組(b)中選擇的至少四種不同的異源多核苷酸 (b)編碼纖維素酶、半纖維素酶和果膠酶的多核苷酸和表達這些多核苷酸需要的控制序列 (C)提供選擇性標記物 (d)用所述一個或多個表達盒和來自步驟(b)的選擇性標記物轉化細胞 (e)選擇因而形成的能產生通過至少四種不同的異源多核苷酸編碼的至少四種不同的纖維素酶、半纖維素酶和/或果膠酶的宿主細胞。
11.酶組合物,其包含通過根據權利要求任一項1-9的宿主細胞產生的至少四種不同的纖維素酶、半纖維素酶和/或果膠酶。
12.用于生產包含至少四種不同的纖維素酶、半纖維素酶和/或果膠酶的酶組合物的方法,所述方法包括下述步驟 (a)提供權利要求1-9的任一項的宿主細胞 (b)允許至少四種不同的纖維素酶、半纖維素酶和/或果膠酶經由所述宿主細胞生產并分泌,和 (c)任選的回收因此獲得的酶組合物。
13.通過權利要求12的方法可獲得的酶組合物。
14.用于糖化木質纖維素材料的方法,其包括下述步驟 -任選預處理木質纖維素材料,和 -使木質纖維素材料與權利要求11或權利要求13的酶組合物接觸以產生一種或多種糖。
15.制備發酵產物的方法,所述發酵產物包括氨基酸、維生素、藥物、動物飼料補充劑、特種化學品、化學原料、塑料、溶劑、燃料或其他有機聚合物、乳酸、乙醇、燃料乙醇或化學品、塑料、琥珀酸、衣康酸、己二酸、包括乙醇、甲醇、丁醇、合成液體燃料和沼氣的(生物)燃料,其中用發酵微生物,優選酵母,發酵根據權利要求14的方法產生的一種或多種糖,以生產所述發酵產物。
全文摘要
本發明涉及宿主細胞,其包含從編碼纖維素酶、半纖維素酶和果膠酶的多核苷酸組中選擇的至少四種不同的異源多核苷酸,其中宿主細胞能產生從纖維素酶、半纖維素酶和果膠酶的組中選擇的至少四種不同的酶,其中宿主細胞是絲狀真菌并能分泌所述至少四種不同的酶。該宿主細胞可適用于生產可在纖維素材料的糖化方法中使用的酶組合物。
文檔編號C12N1/15GK102762727SQ201180009426
公開日2012年10月31日 申請日期2011年2月11日 優先權日2010年2月11日
發明者埃里克·皮特·洛斯, 瑪格特·伊麗莎白·弗蘭克希斯·休恩瓦爾德-貝格曼斯, 科尼利斯·瑪麗亞·雅各布斯·沙吉, 羅波圖斯·安東尼厄斯·戴維爾德 申請人:帝斯曼知識產權資產管理有限公司