專利名稱:具有β-葡糖苷酶活性的多肽及其用途的制作方法
技術領域:
本發明涉及包含下述基因的序列,所述基因編碼具有降解碳水化合物材料活性的多肽的序列或幫助降解碳水化合物材料活性的多肽的序列。本發明涉及該新穎基因的全長編碼序列以及該全長功能性蛋白的氨基酸序列,以及所述基因或氨基酸序列的變體和片段。本發明還涉及在工業方法中使用這些蛋白的方法。本發明還包括用根據本發明的多核苷酸轉化的適用于生產這些蛋白質的細胞。本發明還涉及編碼下述多肽的基因在宿主中的成功表達,所述多肽具有降解碳水化合物材料的活性。宿主可以是任何合適的宿主,例如Aspergillus (例如 Aspergillus niger)或 Talaromyces (例如 Talaromyces emersonii)。 _4]
背景技術:
碳水化合物組成地球上最豐量的有機化合物。然而,許多這類碳水化合物隱蔽在復雜聚合物中,包括淀粉(種子和谷物中的主要儲存碳水化合物)和被稱為木質纖維素的碳水化合物與木質素的集合體。木質纖維素的主要碳水化合物組分是纖維素、半纖維素和果膠。這些復雜的聚合物通常被統稱為木質纖維素。從由于OPEC減少石油輸出而導致石油危機爆發的70年代開始,可再生的木質纖維素生物質轉化為可發酵的糖的生物轉化吸引了研究人員強烈的注意力,所述可發酵的糖隨后被發酵產生醇(例如乙醇),作為液體燃料的替代品。在過去二十年間,乙醇已被廣泛使用,在美國作為與汽油的10%的摻合物,或在巴西作為車輛的純燃料。最近實現了E85(85%乙醇摻合物)的使用,特別是用于清潔城市應用。燃料生物乙醇的重要性將會隨著油價的提高及其來源的逐漸耗盡而提高。另外,可發酵的糖被用于生產塑料、聚合物和其他基于生物的制品,并且預期這一工業將大幅增長,從而提高了對大量的低成本可發酵糖的需求,所述可發酵糖可以被用作原料來代替基于石油的原料。大量碳水化合物在植物生物質中的隱蔽以糖(五碳糖以及六碳糖)的形式提供了大量潛在的能量來源,所述糖能夠被用于大量工業和農業過程。然而,這些碳水化合物的巨大能源潛力目前利用不足,因為糖封閉在復雜聚合物中并因此不容易進行發酵。由植物生物質生產糖的方法會提供大量的、經濟上有競爭性的原料,用于發酵成化學品、塑料,例如琥珀酸和(生物)燃料,包括乙醇、甲醇、丁醇合成液體燃料和沼氣。與纖維素原料的種類無關,酶的成本和水解效率是限制生物質生物轉化方法商業化的主要因素。由微生物生產的酶的生產成本與產酶菌株的生產力和發酵液中最終的活性產率密切相關。盡管過去幾十年為了理解酶促木質纖維素生物質降解和纖維素酶生產而進行了持續的研究,但是仍然期望發現或者改造新的有高度活性的纖維素酶和半纖維素酶。還高度期望構建能夠進行迅速和高效的木質纖維素材料生物降解的高效酶組合物,尤其是具有提高的熱穩定性的此類纖維素酶和半纖維素酶。此類酶可被用于生產糖,用于發酵成化學品,塑料,例如琥珀酸和(生物)燃料,包括乙醇、甲醇、丁醇、合成液體燃料和沼氣,用于青貯,還在其他工業方法中(例如在食品或飼料、紡織品、制漿或造紙或洗滌劑工業和其他工業中)用作酶
發明內容
本發明提供了編碼能夠降解(即幫助降解)碳水化合物(例如多糖)、特別是木質纖維素的多肽的多核苷酸。本發明的多核苷酸典型地編碼具有β-葡糖苷酶活性的多肽。本發明還提供了具有此類活性的天然和重組生產的多肽,以及生產此類酶的重組細胞系。還提供了制造和使用本發明多核苷酸和多肽的方法。根據本發明,提供了包含SEQ ID NO :2中示出的氨基酸序列或SEQID NO :1的核苷酸序列編碼的氨基酸序列,或其變體多肽或變體多核苷酸,其中所述變體多肽與SEQ IDNO :2中示出的序列具有至少96%的序列同一性,或所述變體多核苷酸編碼與SEQ ID NO 2中示出的序列具有至少96%序列同一性的多肽。根據本發明的多肽具有良好的特性,尤其是降解纖維素的活性。在一種實施方式中,根據本發明的多肽具有β -葡糖苷酶(縮寫為BG)活性。本文中,β -葡糖苷酶(beta-glucosidase) (EC 3. 2. I. 21)是能夠催化末端、非還原性β-D-葡萄糖殘基水解并釋放β-D-葡萄糖的任何多肽。這樣的多肽可具有針對β -D-葡糖苷的廣泛特異性,并且也可以水解以下一種或多種β -D-半乳糖苷、a -L-阿拉伯糖苷、β-D-木糖苷或β-D-巖藻糖苷。這種酶也可以被稱作苦杏仁苷酶、β-D-葡糖苷葡糖水解酶、纖維二糖酶或龍膽二糖酶。在一種實施方式中,變體多肽具有催化殘基Asp277-Glu505(如在SEQ ID N0:2中的位置)。在一種實施方式中,變體多肽與SEQ ID NO :2中列出的序列具有至少96%序列同一性、具有催化殘基Asp277-Glu505和BG活性。另外,多肽可具有高的熱穩定性。根據本發明的多肽以孵育時間(h)的函數保持高的相對活性(初始活性的%),例如2小時、3小時、4小時、5小時、6小時、8小時、9小時、10小時或更多、20小時或更多、30小時或更多,尤其是在高溫下,例如在60°C或更高溫度下、在65°C或更高溫度下、在70°C或更高溫度下,例如在65°C下8小時或在60°C下72小時。本發明還提供了包含以下的多核苷酸(a) SEQ ID NO 1中示出的核苷酸序列;或(b)與是SEQ ID NO 1的反向互補體對多核苷酸選擇性雜交的核苷酸序列;或(c)與SEQ ID NO : I的核苷酸序列具有至少約83%序列同一性的核苷酸序列;或(d)如(a)、(b)或(C)中定義的核苷酸序列的片段,其長度至少約100個核苷酸;或(e)序列,其是作為遺傳編碼的結果的(a)、(b)、(c)或(d)任一中定義的序列簡并體;或(f)核苷酸序列,其為(a)、(b)、(c)、(d)或(e)中定義的核苷酸序列的反向互補體。
根據本發明還提供了并入了本發明多核苷酸序列的載體(例如表達載體)和包含本發明多肽、多核苷酸或載體的細胞。本發明還提供了 用于制備具有纖維素增強活性的多肽的方法,所述方法包括在允許所述多肽表達的條件下培養本發明的細胞,并任選地回收所表達的多肽;可通過此類方法獲得的多肽;和組合物,其包含(i)本發明的多肽;和(ii)纖維素酶和/或半纖維素酶和/或果膠酶。具有纖維素增強活性的本發明多肽可被用于工業方法中。因此,本發明提供了用于處理包含碳水化合物材料的底物的方法,所述方法包括使底物與本發明的多肽或組合物·接觸。本發明尤其提供了用于從木質纖維素材料生產一種或多種糖的方法,所述方法包括使木質纖維素材料與本發明的多肽或組合物接觸。通過這種方式生產的糖可在發酵方法中使用。因此,本發明提供了用于生產發酵產物的方法,所述方法包括使用上述方法生產可發酵的糖;對得到的可發酵的糖進行發酵,從而生產發酵產物。本發明的多肽或組合物也可以在例如食物制品的制備、洗滌劑的制備、動物飼料的制備、漿體的處理或造紙或織物或紡織品的制備或其清潔中使用。本發明還提供了 可通過使植物材料或木質纖維素材料與本發明的多肽或組合物接觸獲得的經加工的材料;包含本發明的多肽或組合物的食物或飼料;和包含根據本發明的多核苷酸、多肽、載體或細胞的植物或其部分。附圖
簡述圖I :用于在A.niger中表達基因的pGBTOP的圖譜。描繪了從葡糖淀粉酶啟動子(PglaA)開始表達的感興趣的基因(GOI)。另外,描繪了表達盒的葡糖淀粉酶側翼(3’ glaA)。在本申請中,感興趣的基因是TEMER02527的編碼序列,如下文所定義。序列表簡述SEQ ID NO 1 展示了 TEMER02527 的編碼序列;SEQ ID NO 2 展示了 TEMER02527 的氨基酸序列;SEQ ID NO 3 展示了 TEMER02527 的信號序列;發明詳述在本說明書和所附權利要求書的通篇中,詞語“包含”("comprise")和“包括,,(" include")及其不同詞性的變體(如"comprises" , " comprising" ," includes"和"including")應被解釋為開放性的。也就是說,在上下文允許時,這些詞語旨在表達可能包括未明確指出的其他要素或成分。冠詞“一”(“a”和“an”)在本文中被用于表示一個或多于一個(即一個或至少一個)所述冠詞的語法客體。例如,“一要素”可表示一個要素或多于一個要素。本發明提供了編碼多肽的多核苷酸,所述多肽例如是能夠改性(例如降解)碳水化合物材料的酶。碳水化合物材料是包含一種或多種碳水化合物或由其組成或基本由其組成的材料。酶在本文中是多肽的亞類。在本文中,底物(也稱作原料)被用于表示包含碳水化合物材料的物質,其可用根據本發明的酶處理,使得其中的碳水化合物材料被改性。除了碳水化合物材料以外,底物還可含有任何其他組分,包括但不限于非碳水化合物材料和淀粉。本發明提供了編碼多肽的多核苷酸,所述多肽例如是能夠改性(例如降解)碳水化合物材料的酶。碳水化合物材料是包含一種或多種碳水化合物或由其組成或基本由其組成的材料。酶在本文中是多肽的亞類。典型地,本發明的多核苷酸編碼具有至少葡糖苷酶活性、暫時稱作TEMER02527、具有根據SEQ ID NO 2的氨基酸序列的多肽,或編碼其變體的序列,或編碼所述多肽或其變體的片段的序列,所述變體典型地為具有SEQ ID NO :2的序列的多肽的功能性等同物。
在一種實施方式中,本發明的多肽可具有一種或多種除上述提到的β_葡糖苷酶活性之外的替代性和/或額外的活性,例如本文中提到的其他降解碳水化合物和/或水解碳水化合物活性之一。碳水化合物在本文上下文中包括所有糖類,例如多糖、寡糖、二糖或單糖。根據本發明的多肽可通過化學降解或物理降解此類材料或水解碳水化合物來改性和/或降解碳水化合物材料。物理降解包括例如打斷纖維素微纖維之間的相互作用和/或打開纖維素纖維結構。碳水化合物材料的化學改性可例如通過水解、氧化或其他化學改性,例如通過裂合酶的作用導致此類材料的降解。物理改性可伴隨或不伴隨化學改性。合適的碳水化合物材料適合被本發明的多肽改性的非淀粉碳水化合物是木質纖維素。可以被認為是潛在的可再生原料的、包含不同木質纖維素殘基的主要的多糖是纖維素(葡聚糖)、半纖維素(木聚糖、雜木聚糖(heteroxylans)和木葡聚糖(xyloglucans))。另外,一些半纖維素可以作為葡甘露聚糖(glucomannans)存在于例如木材衍生的原料中。這些多糖變成為可溶糖(例如葡萄糖、木糖、阿拉伯糖、半乳糖、果糖、甘露糖、鼠李糖、核糖、D-半乳糖醛酸和其他己糖和戊糖)的酶促水解發生于共同作用的不同酶的作用下。另外,果膠和其他果膠物質如阿拉伯聚糖(arabinans)可占來自非木本植物組織典型的細胞壁干物質的可觀的比例(約四分之一到一半的干物質可以是果膠)。纖維素是由通過β_1,4鍵連接的葡萄糖殘基組成的線性多糖。纖維素纖維的線性本質以及化學計量的β_連接的葡萄糖(相對于α)比淀粉的高度枝化的α-連接的結構更傾向于產生鏈間(interstrand)氫鍵合的結構。因此,纖維素聚合物與淀粉中存在的纖維相比通常溶解度更小,并且形成更緊密結合的纖維。半纖維素是復合聚合物,并且其組成常常在生物之間、組織類型之間大幅變化。通常,半纖維素的主要成分是β_1,4-連接的木糖(一種五碳糖)。然而,所述木糖通常在木糖的0-3和/或0-2處被枝化,并且可以被與阿拉伯糖、半乳糖、甘露糖、葡糖醛酸、半乳糖醛酸形成的鍵取代,或者被對乙酸的酯化(和阿魏酸對阿拉伯糖的酯化)取代。半纖維素也可含有葡聚糖,所述葡聚糖是連接的六碳糖(如先前提到的β_(1,3)(1,4)葡聚糖和雜葡聚糖)和額外的葡甘露聚糖(其中葡萄糖和甘露糖均存在于線性主鏈中,彼此通過β-鍵連接)的總稱。與單子葉植物(monocots,即具有單個子葉或種子葉的植物,如玉米、小麥、水稻、草、大麥)相比,雙子葉植物(dicot,即其種子具有兩片子葉或種子葉的植物,如利馬豆(lima beans)、花生、杏仁、豌豆、四季豆)中半纖維素的組成、取代性質和枝化程度差異很大。在雙子葉植物中,半纖維素主要由下述木葡聚糖組成,所述木葡聚糖是具有I,6- β -連接的木糖基側鏈的1,4-β-連接的葡萄糖鏈。在單子葉植物(包括大部分谷類作物)中,半纖維素的主要組分是雜木聚糖。這些主要由下述1,4-β-連接的木糖主鏈聚合物組成,所述木糖主鏈聚合物與阿拉伯糖、半乳糖、甘露糖和葡糖醛酸或4-0-甲基-葡糖醛酸具有1,3_α連接以及與由酯連接的乙酸改性的木糖具有I,3-α連接。還存在由1,3_和1,4-β-連接的葡糖基鏈組成的β葡聚糖。在單子葉植物中,纖維素、雜木聚糖和葡聚糖可以大致等量地存在,各自包含約15-25%的細胞壁干物質。另外,不同的植物可包含不同 量和不同組成的果膠物質。例如,甜菜含有以干重為基礎約19%的果膠和約21%的阿拉伯聚糖。因此,本發明的組合物可根據要使用的具體原料(也稱作底物)來定制。也就是說,本發明組合物中的活性譜可根據考慮的原料來變化。酶組合或物理處理可以并發或先后地施用。酶可以在微生物、酵母、真菌、細菌或植物中外源產生,然后分離并加入木質纖維素原料中。或者,酶可以被生產但不分離,并且將粗制細胞群發酵液或植物材料(如玉米桿)等等加入原料中。或者,可以處理粗制細胞群或酶生產培養基或植物材料,以預防進一步的微生物生長(例如通過加熱或添加抗微生物劑),然后添加至原料。這些粗制酶混合物可包含生產酶的生物。或者,酶可以在下述發酵中生產,所述發酵施用原料(例如玉米桿)對生產酶的生物提供營養。通過這種方式,生產酶的植物可以發揮木質纖維素原料的作用,并且被添加進木質纖維素原料中。酶活性內切-1,4- β -葡聚糖酶(EG)和外切-纖維二糖水解酶(CBH)催化不溶性纖維素水解成為纖維寡糖(纖維二糖作為主要產物),而β_葡糖苷酶(BGL)將寡糖(主要是纖維二糖和纖維三糖)轉化為葡萄糖。木聚糖酶與其他附屬酶例如a-L-阿拉伯呋喃糖酶、阿魏酸酯酶和乙酰木聚糖酯酶、葡糖醛酸糖苷酶和β -木糖苷酶一起,催化半纖維素的部分水解。果膠物質包括果膠、阿拉伯聚糖、半乳聚糖和阿拉伯半乳聚糖。果膠是植物細胞壁中最復雜的多糖。它們沿著一定程度上散布有L-鼠李糖的α (1,4)_連接的D-半乳糖醛酸單元核心鏈周圍構建。在任何細胞壁中都存在符合該描述的大量結構單元,并且通常認為在單個果膠分子中,不同結構單元的核心鏈彼此連續。果膠酶包括例如內切多聚半乳糖醛酸酶,果膠甲基酯酶,內切-半乳聚糖酶,β -半乳糖苷酶,果膠乙酰基酯酶,內切-果膠裂合酶,果膠酸裂合酶,α -鼠李糖苷酶,外切-半乳糖醛酸酶,外切多聚半乳糖醛酸酯裂合酶,鼠李半乳糖醛酸聚糖水解酶,鼠李半乳糖醛酸聚糖裂合酶,鼠李半乳糖醛酸聚糖乙酰基酯酶,鼠李半乳糖醛酸聚糖半乳糖醛酸水解酶,木半乳糖醛酸酶,α-阿拉伯呋喃糖苷酶。結構單元的主要類型是聚半乳糖醛酸(同聚半乳糖醛酸),其可被甲醇在羧基上取代,被乙酸酯在0-2和0-3上取代;鼠李半乳糖醛酸聚糖I (RGI),其中半乳糖醛酸單元與帶有(1,4)-連接的半乳聚糖和(1,5)_連接的阿拉伯聚糖側鏈的鼠李糖交替存在。阿拉伯聚糖側鏈可直接與鼠李糖結合,或者通過半乳聚糖鏈間接結合;木半乳糖醛酸聚糖,在半乳糖醛酸的0-3上具有單個木糖基單元(與RGI緊密結合);和鼠李半乳糖醛酸聚糖
II(RGII),含有罕見糖例如芹菜糖的特別復雜的小型單元。RGII單元可含有兩個芹菜糖殘基,所述芹菜糖殘基在合適的離子條件下能夠與硼酸鹽可逆地形成酯。如上文所述,本發明的多肽典型地具有葡糖苷酶活性。然而,除了所述活性之外或替代所述活性,本發明的多肽可具有一種或多種上文公開的活性。除了具有β_葡糖苷酶活性的本發明多肽所提供的活性以外,本文所述的本發明的組合物還可具有一種或多種上文所述的活性。多核苷酸序列 本發明提供了包含編碼TEMER02527的基因的基因組多核苷酸序列及其編碼序列。因此,本發明涉及包含根據SEQ ID NO :1的編碼核苷酸序列的基因組核苷酸序列的經分離的多核苷酸,及其任一的變體,例如功能性等同物。本發明尤其涉及下述經分離的多核苷酸,所述多核苷酸能夠(例如在嚴格條件下、優選地在高度嚴格條件下)選擇性地與包含SEQ ID NO :1中示出的序列的多核苷酸的反向互補體雜交。更特定地,本發明涉及包含根據SEQ ID NO 1的核苷酸序列或基本由其組成的多核苷酸。本發明還涉及包含下述序列或基本由其組成的經分離的多核苷酸或其任一的變體(例如功能性等同物)或片段,所述序列編碼根據SEQ ID NO :2的多肽或其變體的至少一個功能性結構域。在本文中使用時,術語“基因”和“重組基因”是指可從染色體DNA中分離的核酸分子,其包含編碼蛋白質(例如根據本發明的β_葡糖苷酶蛋白)的開放讀碼框。基因可包括編碼序列、非編碼序列、內含子和/或調節序列。另外,術語“基因”可表示如本文定義的經分離的核酸分子。可使用本文提供的序列信息和標準分子生物學技術,分離本發明的核酸分子,例如具有SEQ ID NO :1的核苷酸序列的核酸分子或其變體(例如功能等同物)。例如,使用SEQ ID NO :1的全部或部分核酸序列作為雜交探針,可以使用標準雜交和克隆技術分離根據本發明的核酸分子(例如,如Sambrook, J. , Fritsh, E. F. , and Maniatis,T. Molecular Cloning ALaboratory Manual. 2nd, ed. , Cold Spring Harbor Laboratory,Cold SpringHarbor Laboratory Press, Cold Spring Harbor, NY, 1989 中所述)。另外,可使用以SEQ ID NO :I中含有的序列信息為基礎設計的合成寡核苷酸引物,通過聚合酶鏈式反應(PCR)分離包含SEQ ID NO :1全部或部分的核酸分子。可以使用cDNA、mRNA或者基因組DNA作為模板和適當的寡核苷酸引物,根據標準PCR擴增技術擴增本發明的核酸。可以將藉此擴增的核酸克隆進適當的載體中,并通過DNA序列分析來表征。另外,可以通過標準合成技術,例如使用自動化DNA合成儀,制備對應于本發明核苷酸序列或可與本發明核苷酸序列雜交的寡核苷酸。在一個優選的實施方式中,本發明的經分離的核酸分子包含SEQ IDNO :1中所示的核苷酸序列。在另一個優選的實施方式中,本發明的經分離的核酸分子包含下述核酸分子,所述核酸分子是SEQ ID NO :1中所示核苷酸序列的反向互補體,或此類核苷酸序列任一的變體,例如功能性等同物。與另一核苷酸序列互補的核酸分子是與另一核苷酸序列充分互補、使得其能夠與另一核苷酸序列雜交從而形成穩定雙鏈體的核酸分子。本發明的一個方面涉及編碼本發明多肽或其變體(例如功能性等同物,例如生物活性片段或結構域)的經分離的核酸分子,以及足以用作鑒定編碼本發明多肽的核酸分子的雜交探針的核酸分子,和適合用作用于擴增或突變核酸分子的PCR引物的、此類核酸分子的片段。
根據本發明的多核苷酸可以是“經分離的”。在本發明上下文中,“經分離的多核苷酸”或“經分離的核酸”是下述DNA或RNA,所述DNA或RNA與其來源生物天然存在的基因組中與之緊鄰的一條或兩條編碼序列(一條在5’端,一條在3’端)不再緊鄰。因此,在一個實施方式中,經分離的核酸包括與編碼序列緊鄰的部分或所有5’非編碼(例如啟動子)區。該術語因此包括例如被整合進載體中、自助復制的質粒或病毒中、或原核生物或真核生物的基因組DNA中的,或者作為獨立于其他序列的單獨的分子(例如通過PCR或限制性內切核酸酶處理生產的cDNA或基因組DNA片段)存在的重組DNA。其還包括基本不含細胞材料、病毒材料、或培養基(通過重組DNA技術生產時)或化學前體或其他化學品(化學合成時)的重組DNA,所述重組DNA是編碼其他多肽的雜種基因的部分。另外,“經分離的核酸片段”是不作為片段天然存在并且在天然狀態下不會被找到的核酸片段。在本文中使用時,術語“多核苷酸”或“核酸分子”旨在包括DNA分子(例如cDNA或基因組DNA)和RNA分子(例如mRNA)和使用核苷酸類似物生產的DNA或RNA的類似物。核酸分子可以是單鏈或雙鏈的,但是優選地是雙鏈DNA。可以使用寡核苷酸類似物或衍生物(例如肌苷或硫代磷酸核苷酸(phosphorothioate nucleotides))合成核酸。此類寡核苷酸可被用于例如制備具有改變的堿基配對能力或提高的核酸酶抗性的核酸。本發明的另一實施方式提供了與TEMER02527核酸分子反義的經分離的核酸分子,例如TEMER02527核酸分子的編碼鏈。還包括在本發明范圍內的是本文所述核酸分子的互補鏈。除非另有說明,本文通過測序DNA分子所測定的所有核苷酸序列均使用自動化DNA測序儀測定,本文測定的DNA分子編碼的多肽的所有氨基酸序列均通過上文測定的DNA序列的翻譯來預測。因此,如本領域針對通過所述自動化途徑測定的任何DNA序列所已知的,本文測定的任何核苷酸序列可含有一些錯誤。通過自動化測定的核苷酸序列典型地與被測序的DNA分子的實際核苷酸序列至少約90%相同,更典型地至少約95%到至少約99. 9%相同。可以通過其他途徑(包括本領域公知的手動DNA測序法)來更加精確地測定實際序列。也如本領域所已知的,與實際序列相比被測定的核苷酸序列中的單個插入或缺失會在核苷酸序列的翻譯中引起移碼,使得預測的由所測定的核苷酸序列編碼的氨基酸序列從此類插入或缺失點處開始,與被測定的DNA分子實際編碼的氨基酸序列完全不同。本領域技術人員能夠鑒定此類被錯誤鑒定的堿基,并且已知如何校正此類錯誤。
根據本發明的核酸分子可僅包含SEQ ID NO :1中所不核酸序列(或其任一的變體)的部分或片段,例如可用作探針或引物的片段,或編碼TEMER02527多肽的一部分的片段。通過克隆TEMER02527基因和cDNA測定的核苷酸序列允許生產被設計用于鑒定和/或克隆其他TEMER02527家族成員以及來自其他物種的TEMER02527同源物的探針和引物。探針/引物典型地包含基本純化的寡核苷酸,所述寡核苷酸典型地包含下述核苷酸序列區域,所述區域優選地在高度嚴格條件下與SEQ ID NO: I所示核苷酸序列或其任一的變體(例如功能性等同物)的至少從約12個到約15個、優選地從約18個到約20個、優選地從約22個到約25個、更優選地約30個、約35個、約40個、約45個、約50個、約55個、約60個、約65個、或曰75個或更多個連續的核苷酸雜交。
基于TEMER02527核苷酸序列的探針可被用于檢測例如其他生物中編碼相同或同源多肽的轉錄本或基因組TEMER02527序列。在優選的實施方式中,探針還包含與之結合的標簽基團,例如所述標簽基團可以是放射性同位素、熒光化合物、酶或酶輔因子。此類探針也可以被用作用于鑒定表達TEMER02527多肽的細胞的診斷測試試劑盒的部分。本文的多核苷酸可以是合成的多核苷酸。合成的多核苷酸可以按照密碼子使用被優化,優選地根據W02006/077258和/或PCT/EP2007/055943中所述的方法被優化,所述參考文獻通過引用并入本文。PCT/EP2007/055943介紹了密碼子對優化。密碼子對優化是這樣一種方法其中編碼多肽的核苷酸序列根據其密碼子使用、尤其是使用的密碼子對而被修飾,以獲得編碼多肽的核苷酸序列經改進的表達和/或所編碼的多肽的經改進的生產。密碼子對被定義為編碼序列中一組兩個連續的三聯體(密碼子)。本發明還涉及包含前文所述多核苷酸的核酸構建體。“核酸構建體”在本文中被定義為單鏈或雙鏈的核酸分子,其與天然存在的基因分離,或者已被修飾為含有下述核酸區段,所述核酸區段以天然不會存在的方式組合和并置。當核酸構建體含有表達編碼序列所需的所有控制序列時,術語核酸構建體與術語“表達盒”同義。本文定義的術語“編碼序列”在本文中被定義為下述序列,所述序列被轉錄成mRNA并翻譯成本發明的蛋白酶啟動子的轉錄活化子。編碼序列的界限通常由mRNA 5’-端的ATG起始密碼子和mRNA 3'-端終止開放讀碼框的翻譯終止密碼子序列決定。編碼序列可包括但不限于DNA、cDNA和重組核酸序列。優選地,核酸具有高GC含量。本文的GC含量是指構建體中G和C核苷酸的數量除以核苷酸的總數,以%表示。GC含量優選地為56%或更多、57%或更多、58%或更多、59%或更多、60 %或更多,或者在56-70 %的范圍內或58-65 %的范圍內。優選地,DNA構建體包含啟動子DNA序列、與所述啟動子DNA序列可操作地連接的編碼序列,和控制序列例如-一個選自以下序列列表的由5’朝向3’方向的翻譯終止序列TAAG、TAGA和TAAA,優選地TAAA,和/或-一個選自以下序列列表的由5’朝向3’方向的翻譯起始子編碼序列GCTACCCCC ;GCTACCTCC ;GCTACCCTC ;GCTACCTTC ;GCTCCCCCC ;GCTCCCTCC ;GCTCCCCTC ;GCTCCCTTC ;GCTGCCCCC ;GCTGCCTCC ;GCTGCCCTC ;GCTGCCTTC ;GCTTCCCCC ;GCTTCCTCC ;GCTTCCCTC ;和GCTTCCTTC,優選地 GCT TCC TTC,和 / 或-選自以下序列列表的翻譯起始子序列5’-mwChkyCAAA_3’;5’-mwChkyCACA_3’或5’-mwChkyCAAG-3’,其中使用核苷酸的模糊編碼m(A/C) ;w(A/T) ;y(C/T) ;k(G/T) ;h(A/C/T),優選地 5’ -CACCGTCAAA-3’ 或 5’ -CGCAGTCAAG-3 ’。在本發明的上下文中,術語“翻譯起始子編碼序列”被定義為DNA編碼序列開放讀碼框起始子或起始密碼子緊下游的9個核苷酸。起始子或起始密碼子編碼AA甲硫氨酸。起始密碼子典型地為ATG,但是也可以是任何功能性起始密碼子如GTG。在本發明的上下文中,術語“翻譯終止序列”被定義為從開放讀碼框或核苷酸編碼序列3’端的翻譯終止密碼子開始并按5’到3’方向的四個核苷酸。在本發明的上下文中,術語“翻譯起始子序列”被定義為編碼多肽的DNA序列開放讀碼框的起始子或起始密碼子緊上游的十個核苷酸。起始子或起始密碼子編碼AA甲硫氨酸。起始密碼子典型地為ATG,但是也可以是任何功能性起始密碼子如GTG。本領域公知在RNA中尿嘧啶U代替脫氧核苷酸胸腺嘧啶T。 同源性和同一性當氨基酸序列或核苷酸序列展示某些相似性水平時,其被稱為是同源的。同源的兩個序列表示共同的進化來源。不論兩個同源序列是密切相關的還是更遠相關的,其分別由或高或低的“百分比同一性”或“百分比相似性”表示。雖然是有爭論的,但為了表示“百分比同一性”或“百分比相似性”,“同源性水平”或“百分比同源性”通常互換使用。術語“同源性”、“百分比同源性”、“百分比同一性”或“百分比相似性”在本文可互換使用。就本發明的目的而言,在本文中定義為了測定兩條氨基酸序列或兩條核酸序列的百分比同一性,就最佳比較目的而言比對全序列。為了優化兩個序列之間的比對,可在被比較的兩條序列的任一條中引入缺口。這類比對可以在被比較的序列的全長上進行。或者,比對可在更短的比較長度上進行,例如在約20、約50、約100或更多個核酸/堿基或氨基酸上進行。同一性是在報告的比對區域上的兩條序列之間的同一性匹配的百分比。可以使用數學算法完成兩個序列之間的序列比較和同一性百分比測定。技術人員應當明白下述事實可獲得比對兩條序列的若干種不同的計算機程序并測定兩條序列之間的同源性(Kruskal, J. B. (1983)An overview ofsequence comparison In D.Sankoffand J. B. Kruskal, (ed. ), Time warps, stringedits and macromolecules the theoryand practice of sequence comparison, pp. 1-44 Addison Wesley)。可使用用于I匕對兩條序列的Needleman和Wunsch算法測定兩條氨基酸序列之間的百分比同一性(Needleman,
S.B. andffunsch, C. D. (1970) J. Mol. Biol. 48,443-453)。算法比對氨基酸序列以及核苷酸序列。Needleman-Wunsch算法已在計算機程序NEEDLE中實施。就本發明目的而言,使用了來自 EMBOSS包的NEEDLE程序(版本2. 8. O 或更高,EMBOSS :The European Molecular BiologyOpen Software Suite(2000)Rice,P. Longden,I. and Bleasby,A. Trends in Genetics 16,
(6)pp276~277,http://emboss, bioinformatics, nl/)。就多妝序列而言,BL0SUM62 用于替換矩陣,就核苷酸序列而言,使用了 EDNAFULL。可指定其他矩陣。用于比對氨基酸序列的任選的參數是缺口開放懲罰為10和缺口延伸懲罰為0. 5。技術人員會意識到所有這些不同的參數會產生些微不同的結果,但是當使用不同的算法時兩條序列的總百分比同一性不顯著改變。總體同源性定義同源性或同一性是在包括任何缺口或延伸的總比對區域上的兩條全序列之間的同一性匹配的百分比。兩條比對序列之間的同源性或同一性如下計算在兩個序列中都顯示相同氨基酸的比對中的對應位置的數目除以包括缺口的比對的全長。本文中定義的同一性可從NEEDLE中獲得并在程序輸出中被標記為“同一性”。最長的同一'丨生定義在兩個比對序列之間的同源性或同一性如下計算在兩個序列中都顯示相同氨基酸的比對中的對應位置的數目除以減去比對中的總缺口數目后的比對的全長。可通過使用N0BRIEF選擇從NEEDLE中獲得本文中定義的同一性并且所述同一性在程序輸出中被標記為“最長同一性”。就本發明目的而言,根據“最長同一性”的定義計算兩條序列(氨基酸或核苷酸)之間的同一性(同源性)水平,如可通過使用程序NEEDLE進行計算。本方面的多肽序列還可用作“查詢序列”以針對序列數據庫進行搜索,例如來鑒定其他家族成員或相關序列。可使用BLAST程序進行此類搜索。進行BLAST分析的軟件通過National Center for BiotechnologyInformation (http: //www. ncbi. nlm. nih. gov)是公 眾可得到的。BLASTP用于氨基酸序列,BLASTN用于核苷酸序列。BLAST程序使用下述缺省-開放缺口的開銷缺省=5用于核苷酸/11用于多肽-延伸缺口的開銷缺省=2用于核苷酸/I用于多肽-核苷酸錯配懲罰缺省=-3-核苷酸匹配獎勵缺省=I-期望值缺省=10-字長缺省=11用于核苷酸/28用于megablast/3用于多肽此外,通過BLAST程序,測定查詢氨基酸序列或查詢核酸序列與檢索的同源序列之間的局部同一性(同源性)程度。但是,僅僅比較在某一閾值上給出匹配的那些序列段。從而,程序僅針對這些匹配段計算同一性。因此,以這種方式計算的同一性被稱為局部同一性。雜交在本文中使用時,術語“選擇性雜交”("selectively hybridizing "和“hybridizes selectively”)和類似的術語旨在描述用于雜交和洗漆的下述條件,在所述條件下彼此至少約50 %、至少約55 %、至少約60 %、至少約65 %、至少約70 %、至少約75%、至少約80%、更優選地至少約85%、進一步更優選地至少約90%、最優選地至少95%、更優選地至少約98%或更優選地至少約99%彼此同源的核苷酸序列典型地保持為彼此雜交。也就是說,這類雜交序列可共享至少約50%、至少約55%、至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、更優選地至少約85%、進一步更優選地至少約98%或更優選地至少約99%的序列同一性。這類雜交條件的一個優選的非限制性例子是于約45°C下在6X氯化鈉/檸檬酸鈉(SSC)中雜交,然后于約50°C、優選約55°C、優選約60°C和進一步更優選約65°C下,在I X SSC,O. 1% SDS中洗滌一次或多次。高度嚴格條件包括例如于約68°C下在5XSSC/5XDenhardf s溶液/I. 0% SDS中雜交并于室溫下在O. 2XSSC/0. 1% SDS中洗滌。或者,洗滌可以在42°C進行。技術人員應當知道對于嚴格和高度嚴格的雜交條件而言應用何種條件。涉及這類條件的其它指示在該領域能夠容易地獲得,例如在Sambrooket al. , 1989, MolecularCloning,A Laboratory Manual,Cold Spring HarborPress,N. Y.; 和 Ausubel etal. (eds.),1995,Current Protocols in MolecularBiology, (John Wiley & Sons,N.Y.)中。當然,僅與多聚A序列(例如mRNA的3’末端多聚(A))或互補的T (或U)殘基段雜交的多核苷酸不應被包括于與本發明的核酸部分特異雜交的本發明多核苷酸中,因為這類多核苷酸會與含有多聚(A)段或其互補體的任何核酸分子(例如尤其是任何雙鏈cDNA克隆)雜交。可以以一種典型的途徑,來篩選從其它生物(例如絲狀真菌,尤其是來自Trichomaceae 科、例如來自 Aspergillus 或 Penicillium 屬的微生物例如 Penicilliumdecumbens)構建的cDNA文庫。
例如,可以通過Northern印跡針對同源的TEMER02527多核苷酸篩選Penicillium菌株。檢測到與根據本發明的多核苷酸同源的轉錄物后,可以利用本領域技術人員公知的標準技術從分離自適當菌株的RNA構建cDNA文庫。或者,可以使用能夠與根據本發明的TEMER02527多核苷酸雜交的探針來篩選總基因組DNA文庫。可以例如通過進行PCR分離同源的基因序列,所述PCR使用以本文所述核苷酸序列為基礎設計的兩個簡并寡核苷酸引物池。用于反應的模板可以是通過反轉錄mRNA獲得的cDNA,所述mRNA從已知或懷疑表達本發明多核苷酸的菌株中制備。可以對PCR產物進行亞克隆和測序,以確保被擴增的序列代表了新TEMER02527核酸序列的序列或其功能等同物。然后可以通過多種已知方法,使用PCR片段來分離全長cDNA克隆。例如,被擴增的片段可以被標記,并用于篩選噬菌體或粘粒cDNA文庫。或者,被標記的片段可以被用于篩選基因組文庫。也可以用PCR技術來從其它生物中分離全長cDNA序列。例如,可以根據標準步驟從合適的細胞或組織來源中分離RNA。可以使用特異于被擴增片段最5’端的寡核苷酸引物,引導第一鏈合成,針對RNA進行反轉錄反應。然后可以使用標準的末端轉移酶反應將得到的RNA/DNA雜交體“加尾”(例如用鳥嘌呤),可以用RNase H消化所述雜交體,然后(例如用多聚-C引物)引物起始第二鏈合成。因此,被擴增片段上游的cDNA序列可以容易地被分離。有用的克隆策略的綜述,參閱例如上文 Sambrook etal.;和上文的 Ausubel et al.。載體本發明的另一方面涉及包含編碼TEMER02527多肽或其功能性等同物的本發明多核苷酸的載體,包括克隆和表達載體,還涉及在例如本發明多肽發生表達的條件下,在合適的宿主細胞中培養、轉化或轉染這類載體的方法。本文使用的術語“載體”指能夠轉運與之連接的另一核酸的核酸分子。本發明的多核苷酸可以被摻入重組的可復制載體中,例如克隆或表達載體中。載體可被用于在相容的宿主細胞中復制核酸。因此在另一實施方式中,本發明提供了如下制造本發明多核苷酸的方法將本發明的多核苷酸引入可復制載體中,將所述載體引入相容的宿主細胞中,并在使得所述載體復制的條件下培養所述宿主細胞。載體可以從宿主細胞中被回收。合適的宿主細胞在下文討論。
其中插入本發明表達盒或多核苷酸的載體可以是能夠便利地進行重組DNA操作的任何載體,并且所述載體的選擇通常應取決于要引入它的宿主細胞。根據本發明的載體可以是自主復制載體,即顯示為染色體外實體的載體,其復制不依賴于染色體復制,例如質粒。或者載體可以是被引入宿主細胞中后被整合進宿主細胞基因組中,并與整合了它的染色體一起復制的載體。一種類型的載體是“質粒”,質粒是指其中可以連接其它DNA區段的環狀雙鏈DNA環。另一種類型的載體是病毒載體,其中其它DNA區段可以被連接進病毒基因組中。某些載體在它們被引入的宿主細胞中能夠自主復制(例如具有細菌復制起點的細菌載體和附加體哺乳動物載體)。其它載體(例如非附加體哺乳動物載體)在引入宿主細胞時被整合進宿主細胞的基因組中,從而隨宿主細胞的基因組一起被復制。另外,某些載體能夠指導與它們可操作地連接的基因的表達。這類載體在本文中被稱作“表達載體”。一般而言,重組DNA技術中使用的表達載體通常是以質粒的形式存在的。術語“質粒” 和“載體”在本文中可互換使用,因為質粒是最常用的載體形式。然而,本發明旨在包括這類表達載體的起等同作用的其它形式,如粘粒、病毒載體(例如復制缺陷反轉錄病毒、腺病毒和腺伴隨病毒)和噬菌體載體。對大部分絲狀真菌和酵母而言,載體或表達構建體優選地被整合進宿主細胞的基因組中,從而獲得穩定的轉化體。然而,對某些酵母而言還可獲得合適的附加體載體,可以向其中并入表達構建體進行穩定和高水平的表達,其例子包括分別衍生自Saccharomyces和Kluyveromyces的2 μ和pKDl質粒的載體,或含有AMA序列(例如來自Aspergillus的AMA1)的載體。將表達構建體整合進宿主細胞基因組中的情況下,所述構建體被整合進基因組中隨機基因座處,或者使用同源重組整合進預定的目標基因座處,在這種情況下目標基因座優選地包含高度表達的基因。因此,可用于本發明的表達載體包括來自染色體、附加體和病毒的載體,例如來自細菌質粒、噬菌體、酵母附加體、酵母染色體元件、病毒(如桿狀病毒、乳多空病毒、痘苗病毒、腺病毒、禽痘病毒、假狂犬病病毒和反轉錄病毒)的載體和來自其組合的病毒,如來自質粒和噬菌體遺傳元件的病毒(如粘粒和噬菌粒)。根據本發明的載體可以體外使用,例如用于生產RNA或用于轉染或轉化宿主細胞。可以例如使用T7啟動子調節序列和T7聚合酶體外轉錄和翻譯重組表達載體。本發明的載體可包含兩種或更多,例如三種、四種或五種本發明的多核苷酸,例如用于過表達。本發明的重組表達載體以適合核酸在宿主細胞中表達的形式包含本發明的核酸,這意味著重組表達載體含有一個或多個與待表達的核酸序列可操作地連接的調節序列,以要用于表達的宿主細胞為基礎選擇所述調節序列。在載體例如表達載體中,“可操作地連接”旨在表示感興趣的核苷酸序列與調節序列以允許該核苷酸序列表達(例如在體外轉錄/翻譯體系中或當載體被引入宿主細胞中時在宿主細胞中)的方式連接,即術語“可操作地連接”是指一種連接,其中所述組分處于允許它們以其預期方式發揮功能的關系中。與編碼序列“可操作地連接”的調節序列如啟動子、增強子或其它表達調節信號以下述方式放置在與所述控制序列相容的條件下實現所述編碼序列的表達;或者所述調節序列被布置為使得它們與其預期目的一致地發揮功能,例如轉錄在啟動子處開始并通過編碼多肽的DNA序列繼續。針對指定宿主細胞的載體或表達構建體因此可包含以下元件,所述元件以相對于編碼第一發明的多肽的序列的編碼鏈從5’ -端到3’ -端的連續順序彼此可操作地連接(i)能夠在給定的宿主細胞中指導編碼多肽的核苷酸序列轉錄的啟動子序列;(2)任選地,能夠指導多肽從給定的宿主細胞分泌進培養基中的信號序列;(3)本發明的DNA序列,其編碼成熟和優選地活性形式的、具有β_葡糖苷酶活性的多肽;和優選地還有(4)能夠終止編碼多肽的核苷酸序列下游轉錄的轉錄終止區(終止子)。根據本發明的核苷酸序列的下游可以是含有一個或多個轉錄終止位點(例如終止子)的3’非翻譯區。終止子的起點較不關鍵。終止子可以例如對編碼多肽的DNA序列而言是天然的。然而,優選地在酵母宿主細胞中使用酵母終止子并在絲狀真菌宿主細胞中使用絲狀真菌終止子。更優選地,終止子對宿主細胞(其中要表達編碼多肽的核苷酸序列)而言是內源的。在被轉錄的區域中,可存在用于翻譯的核糖體結合位點。構建體所表達的成熟轉錄本的編碼部分應當包括位于要翻譯的多肽起點處的翻譯起始AUG和適當地位于 結尾處的終止密碼子。本發明多核苷酸的增強的表達也可以通過對異源調節區(例如啟動子、分泌前導肽和/或終止子區)的選擇來實現,所述異源調節區可發揮以下作用提高表達宿主對感興趣的多肽的表達水平和需要時的分泌水平,和/或提供本發明多肽表達的誘導型控制。本領域技術人員應當知道對表達載體的設計可以以下述因素為基礎,如待轉化的宿主細胞的選擇、期望的多肽表達水平等。本發明的載體(例如表達載體)可以被引入宿主細胞中,從而生產由本文所述的核酸編碼的蛋白質或肽(例如TEMER02527多肽、TEMER02527多肽的突變體形式,其片段、變體或功能等同物)。本發明的載體(例如重組表達載體)可以被設計用于在原核細胞和真核細胞中表達TEMER02527多肽。例如,TEMER02527多肽可以在細菌細胞如Ε. coli、昆蟲細胞(使用桿狀病毒表達載體)、絲狀真菌、酵母細胞、真菌細胞或哺乳動物細胞中表達。合適的宿主細胞在GoeddeliGene Expression Technology !Methods inEnzymology 185,Academic Press,SanDiego, CA(1990)中進一步討論。適當宿主的代表性例子在下文中描述。用于上述宿主細胞的適當培養基和條件是本領域已知的。術語“控制序列”或“調節序列”在本文中被定義為至少包括對多肽表達而言必需和/或有利地任何組件。任何控制序列對于編碼多肽的本發明核酸序列而言可以是天然的或外源的。此類控制序列可包括但不限于啟動子、前導序列、最適翻譯起始序列(如Kozak,1991,J. Biol. Chem. 266 :19867-19870中所述)、分泌信號序列、原-肽序列、多聚腺苷酸化序列、轉錄終止子。控制序列至少典型地包括啟動子、轉錄和翻譯終止信號。如上文所述,“可操作地連接”在本文中被定義為一種連接,其中控制序列相對于DNA序列的編碼序列被適當地置于一定位置上,使得控制序列指導多肽的生產。可以為了引入特定的限制性位點而對控制序列提供連接子,所述特定的限制性位點有助于將控制序列與編碼多肽的核酸序列的編碼區連接。術語“可操作地連接”在本文中被定義為一種連接,其中控制序列相對于DNA序列的編碼序列被適當地置于一定位置上,使得控制序列指導多肽的生產。控制序列可以是合適的啟動子序列,啟動子序列是被宿主細胞識別用于表達核酸序列的核酸序列。啟動子序列含有介導多肽表達的轉錄控制序列。啟動子可以是在細胞中顯示轉錄活性的任何核酸序列,包括突變、截短和雜種的啟動子,并且可得自編碼對細胞而言同源或異源的細胞外或細胞內多肽的基因。控制序列也可以是合適的轉錄終止子序列,這是被絲狀真菌細胞識別為終止轉錄的序列。終止子序列與編碼多肽的核酸序列的3'-端可操作地連接。本發明中可以使用在細胞中發揮功能的任何終止子。控制序列也可以是終止子。對絲狀真菌細胞而言優選的終止子得自編碼以下的基因A. oryzae TAKA淀粉酶、A. niger葡糖淀粉酶(glaA)、A. nidulans鄰氨基苯甲酸合酶、A. niger α -葡糖苷酶、trpC基因和Fusariumoxysporum膜蛋白酶樣蛋白酶。控制序列也可以是合適的前導序列、對絲狀真菌細胞翻譯而言重要的mRNA非翻譯區。前導序列與編碼多肽的核酸序列的5'端可操作地連接。在細胞中發揮功能的任何前導序列可用于本發明中。對絲狀真菌細胞而言優選的前導序列得自編碼以下的基因A. oryzae淀粉酶和A. nidulans憐酸丙糖異構酶和A. niger glaA。其他控制序列可分離自Penicillium IPNS基因,或pcbC基因,β微管蛋白基因。WO 01/21779中引用的所有控制序列通過引用并入本文。控制序列也可以是多聚腺苷酸化序列,這是與核酸序列3'-端可操作地連接 的序列,其轉錄后被絲狀真菌細胞識別為對所轉錄的mRNA添加多聚腺苷殘基的信號。本發明中可以使用在細胞中有功能的任何多聚腺苷酸化序列。對絲狀真菌細胞而言優選的多聚腺苷酸化序列得自編碼以下的基因A. oryzae TAKA淀粉酶、A. niger葡糖淀粉酶、A. nidulans鄰氨基苯甲酸合酶、Fusarium oxysporum膜蛋白酶樣蛋白酶和A. niger α-葡糖苷酶。當根據本發明的多肽要從宿主細胞分泌進培養基時,可以對多肽添加適當的信號序列,從而將從新合成的多肽導向宿主細胞的分泌途徑。本領域技術人員已知針對特定的宿主細胞選擇適當的信號序列。信號序列對宿主細胞可以是天然的,或者對宿主細胞可以是外源的。例如,可以使用來自對宿主細胞而言天然的多肽的信號序列。優選地,所述天然的多肽是高度分泌的多肽,即以高于被分泌的多肽總量10%的量被分泌的多肽。根據本發明優選地使用的信號序列是例如pmeA。作為信號序列的替代方式,本發明的多肽可與分泌載體多肽(carrierpolypeptide)或其部分融合。此類嵌合構建體借助于載體多肽或其部分的信號序列而被導向分泌途徑。另外,載體多肽會對根據本發明的多肽提供穩定化效應,和/或可以增強溶解度。此類載體多肽可以是任何多肽。優選地,使用高度分泌的多肽作為載體多肽。載體多肽對根據本發明的多肽而言可以是天然的或外源的。載體多肽對宿主細胞而言可以是天然的或可以是外源的。此類載體多肽的例子是葡糖淀粉酶,α-交配因子的前原序列,Clostridium cellulovorans纖維素結合蛋白A的纖維素結合結構域,谷胱甘肽-S-轉移酶,Bacillus circulans幾丁質酶Al的幾丁質結合結構域,E. coliK12的malE基因編碼的麥芽糖結合結構域,β -半乳糖苷酶,和堿性磷酸酶。用于在Aspergillus細胞中表達此類嵌合構建體的一種優選的載體多肽是葡糖淀粉酶。載體蛋白和多肽可含有特定的氨基酸基序,以便于多肽的分離;根據本發明的多肽可通過專用的釋放劑被釋放。釋放劑可以是蛋白水解酶或化學試劑。此類氨基酸基序的一個例子是KEX蛋白酶切割位點,其是本領域技術人員公知的。可以使用信號序列來協助本發明蛋白質或多肽的分泌和分離。信號序列的典型特征是疏水氨基酸核,其通常在分泌期間的一個或多個切割事件中從成熟蛋白質上被切割。這類信號肽含有加工位點,所述加工位點允許在經過分泌通路時從成熟蛋白質上切下信號序列。信號序列指導蛋白質如從轉化了表達載體的真核宿主中分泌,并且隨后或同時切割信號序列。然后可以通過已知方法,從細胞外介質中容易地純化蛋白質。或者,可以使用簡化純化的序列(如具有GST結構域),將信號序列與感興趣的蛋白質連接。因此,例如編碼多肽的序列可以與簡化融合多肽純化的標記序列(如編碼肽的序列)融合。在本發明這一方面的某些優選的實施方式中,標記序列是六-組氨酸肽,如PQE載體(Qiagen,Inc.)中提供的標簽,以及其它,其中許多可商業獲得。例如如Gentz et al,Proc. Natl. Acad. Sci.USA86 =821-824(1989)中所述,六-組氨酸提供了融合蛋白的便利純化。HA標簽是可用于純化的另一種肽,其對應于衍生自流感血凝素蛋白的表位,由例如Wilson et al. , Cell 37:767(1984)描述。·優選地,通過標準重組DNA技術生產本發明的TEMER02527融合蛋白。例如,根據常規技術將編碼不同多肽序列的DNA片段以符合讀碼框的方式連接在一起,所述常規技術例如通過使用平末端或交錯末端(stagger-ended termini)用于連接、使用限制性酶消化來提供適當的末端、適當時填平粘末端、使用堿性磷酸酶處理來避免不想要的接合,和酶促連接。在另一實施方式中,可以通過常規技術(包括自動化DNA合成儀)合成融合基因。或者,可以使用錨定引物進行基因片段的PCR擴增,所述錨定引物在兩條相鄰的基因片段之間產生互補性懸突,所述相鄰基因片段可隨后退火并被再擴增產生嵌合基因序列(參閱例如 CurrentProtocols in Molecular Biology, eds. Ausubel et al. John Wiley &Sons:1992)。另外,可以商業獲得已經編碼融合片段(例如GST多肽)的許多表達載體。TEMER02527-編碼核酸可以被克隆進這樣的表達載體中,從而使融合片段與TEMER02527蛋白以符合讀碼框的方式連接。優選地,通過宿主細胞增強的同源重組能力提高了定向整合進宿主細胞基因組中(即在預定的靶基因座中整合)的效率。細胞的此類表型優選地涉及如W02005/095624中所述的缺陷型hdfA或hdfB基因。W02005/095624公開了獲得包含提高的定向整合效率的絲狀真菌細胞的一種優選的方法。任選地,宿主細胞包含與野生型細胞相比提高的解折疊蛋白應答(UPR),以增強感興趣的多肽的生產能力。可以通過US2004/0186070A1和/或US2001/0034045A1和/或W001/72783A2和/或W02005/123763中描述的技術提高UPR。更特定地,為了獲得具有提高的UPR的宿主細胞,調控了 HACl和/或IREl和/或PTC2的蛋白質水平,和/或改造了SEC61蛋白質。或者,或與提高的UPR組合,對宿主細胞進行遺傳修飾,以獲得與野生型細胞相比展示更低蛋白酶表達和/或蛋白酶分泌的表型,從而增強感興趣的多肽的生產能力。此類表型可以通過蛋白酶表達的轉錄調節子的缺失和/或修飾和/或失活來獲得。此類轉錄調節子可以是例如prtT。通過調控prtT來降低蛋白酶的表達可以通過US2004/0191864A1中描述的技術進行。或者,或與提高的UPR和/或展示更低蛋白酶表達和/或蛋白酶分泌的表型組合,宿主細胞展示了草酸鹽缺陷型表型,從而增強感興趣的多肽的生產產量。草酸鹽缺陷型表型可以通過W02004/070022A2中描述的技術獲得。或者,或與提高的UPR和/或展示更低蛋白酶表達和/或蛋白酶分泌和/或草酸鹽缺陷的表型組合,宿主細胞展示了與野生型相比的表型差異的組合,以增強感興趣的多肽的生產產率。這些差異可包括但不限于,降低的葡糖淀粉酶和/或中性α-淀粉酶A和/或中性α-淀粉酶B蛋白酶和草酸水解酶的表達。宿主細胞展示的所述表型差異可以通過根據US2004/0191864A1中所述技術的遺傳修飾獲得。或者,或與提高的UPR和/或展示更低蛋白酶表達和/或蛋白酶分泌和/或草酸鹽缺陷的表型和雨野生型相比為了增強感興趣的多肽生產產率的表型差異的組合相組合,宿主細胞展示毒素基因的缺陷,使得絲狀真菌宿主細胞失去表達毒素的能力。此類毒素包括但不限于,赭曲毒素,煙曲霉毒素,環并偶氮酸(cyclapiazonic acid),3-硝基丙酸,布洛芬,畸形素,黃曲霉毒素和黑麥酸。此類缺陷優選地例如描述于W02000/039322中。
(過)表達在一個優選的實施方式中,與其中本文所述的本發明的多核苷酸未被過表達的親本微生物菌株相比,所述基因可以在本發明的微生物菌株中被過表達。多核苷酸序列的過表達在本文中被定義為所述序列基因的表達,所述表達導致微生物菌株中所述序列編碼的酶活性是親本微生物中酶活性的至少約I. 5倍;優選地所述酶活性是親本微生物中酶活性的至少約2倍,更優選地至少約3倍,更優選地至少約4倍,更優選地至少約5倍,進一步更優選地至少約10倍,最優選地至少約20倍。載體可還包括產生RNA的多核苷酸側翼的序列,所述側翼的序列包含與真核基因組序列或病毒基因組序列同源的序列。這會允許將本發明的多核苷酸引入宿主細胞的基因組中。整合型克隆載體可在整合了它的宿主細胞染色體中隨機整合或在預定的靶基因座處整合。在本發明的一個優選的實施方式中,整合型克隆載體可包含與宿主細胞基因組中預定的靶基因座中的DNA序列同源的DNA片段,用于將克隆載體的整合靶向所述預定的基因座。為了促進定向整合,在轉化宿主細胞之前優選地將克隆載體線性化。優選地以下述方式進行線性化,所述方式使得克隆載體的至少一端,優選地任一端的側翼是與靶基因座同源的序列。靶基因座側翼的同源序列的長度優選地至少約O. lkb,例如至少約O. 2kb,更優選地至少約O. 5kb,進一步更優選地至少約Ikb,最優選地至少約2kb。優選地,可如W005/095624和/或W02007/115886中所述,為了經改進的定向DNA整合頻率修飾親本宿主菌株。本發明中提供的缺失例子使用基因的啟動子作為5’-側翼,使用基因作為3’-側翼,從而在啟動子和基因之間插入選擇標記物,進而破壞(即功能性失活)基因轉錄。上文給出的基因序列可被用于制造類似地功能失活的基因。基因可以被一分為二,得到5’ -側翼和3’ -側翼,但是基因也可以被用于克隆含有基因啟動子和終止子區的基因組DNA的大片段,所述啟動子和終止子區隨后可發揮5’ -側翼和3’ -側翼的功能。載體系統可以是單個載體例如單個質粒,或兩個或更多個載體,例如兩個或更多個質粒,它們一起含有要被引入宿主細胞基因組中的總DNA。載體可以反義方向含有本發明的多核苷酸,以提供反義RNA的生產。
可以通過常規的轉化或轉染技術將載體DNA引入原核或真核細胞中。本文使用的術語“轉化”和“轉染”旨在表示用于向宿主細胞中引入外源核酸(例如DNA)的多種本領域公認的技術,包括磷酸鈣或氯化鈣共沉淀、DEAE-葡聚糖-介導的轉染、轉導、感染、月旨質轉染、陽離子脂質介導的轉染或電穿孔。用于轉化或轉染宿主細胞的合適方法可見于Sambrook,et al. (Molecular Cloning A Laboratory Manual,2nd,ed. ColdSpring HarborLaboratory, Cold Spring Harbor Laboratory Press, Cold SpringHarbor, NY,1989),Davis et al. , Basic Methods in Molecular Biology (1986)和其它實驗室手冊中。對于哺乳動物細胞的穩定轉染而言,已知取決于使用的表達載體和轉染技術,只有非常小的細胞級分可以將外源DNA整合進它們的基因組中。為了鑒定并選擇這些整合體,通常將編碼可選擇標記(例如抗性或抗生素)的基因與感興趣的基因一起引入宿主細胞中。優選的可選擇標記包括但不限于賦予藥物抗性或補足宿主細胞缺陷的可選擇標記。它們包括例如可用于轉化大部分絲狀真菌和酵母的通用標記基因,如乙酰胺酶基因或cDNA (來自 A. nidulans、A. oryzae 或 A. niger 的 amdS、niaD、facA 基因或 cDNA),或提供抗生 素抗性如G418、潮霉素、博來霉素、卡那霉素、甲氨喋呤、腐草霉素或苯菌靈抗性(benA)的基因。或者,可以使用特異性選擇標記,如需要相應突變體宿主菌株的營養缺陷型標記,例如URA3(來自S. cerevisiae或來自其它酵母的類似基因)、pyrG或pyrA (來自A. nidulans或A. niger)、argB (來自A. nidulans或A. niger)或trpC。在一個優選的實施方式中,在引入表達構建體后從經轉化的宿主細胞中缺失選擇標記,從而獲得能夠生產下述多肽的經轉化的宿主細胞,所述多肽不含選擇標記基因。其它標記包括ATP合成酶、亞基9(oliC)、乳清苷-5'-磷酸脫羧酶(pvrA)、細菌G418抗性基因(這也可在酵母中使用,但是不能在真菌中使用)、氨芐西林抗性基因(E. coli)、新霉素抗性基因(Bacillus)、來自Streptomyces nursei的諾爾絲菌素抗性基因natl、Aspergillus oryzae的卩比唳硫胺抗性基因ptrA以及編碼β -葡糖醒酸糖苷酶(GUS)的Ε. coli UidA基因。載體可以體外使用,例如用于生產RNA或用于轉染或轉化宿主細胞。蛋白質在原核生物中的表達常在Ε. coli中用下述載體完成,所述載體含有指導融合蛋白或非融合蛋白表達的組成型或誘導型啟動子。融合載體對其中編碼的蛋白質、例如對重組蛋白的氨基端添加大量氨基酸。這類融合載體典型地具有三個目的1)提高重組蛋白的表達;2)提高重組蛋白的溶解度;3)通過在親和層析中發揮配體作用來幫助純化重組蛋白。通常在融合表達載體中,在融合片段和重組蛋白的接合處引入蛋白水解切割位點,使得能夠在融合蛋白的純化后將重組蛋白與融合片段分開。如所指出的,表達載體優選地含有可選擇標記。這類標記包括用于真核細胞培養的二氫葉酸還原酶或新霉素抗性,和用于在Ε. coli和其它細菌中培養的四環素或氨芐西林抗性。優選用于細菌的載體例如公開于W0-A1-2004/074468中,所述文獻通過引用并入本文。其它合適的載體應是技術人員容易知道的。為了將翻譯的蛋白質分泌進入內質網腔中、進入壁膜間隙中或進入細胞外環境中,可以向被表達的多肽中整合進適當的分泌信號。所述信號對多肽可以是同源的或它們可以是異源信號。TEMER02527多肽可以以經修飾的方式(例如作為融合蛋白)被生產,并可不僅含有分泌信號而且含有額外的異源功能區。因此,例如額外氨基酸區(尤其是帶電荷的氨基酸)可被添加至多肽的N端,以促進純化期間或隨后的操作和儲存期間在宿主細胞中的穩定性和持久性。還可向多肽添加肽基元,以便于純化。本發明提供了經分離的多肽,所述多肽具有根據SEQ ID NO :2的氨基酸序列,和能夠通過在合適的宿主中表達SEQ ID NO :1的多核苷酸獲得的氨基酸序列。包含上述多肽的變體(例如功能等同物)的肽或多肽也包括在本發明內。上述多肽集體包含在術語“本發明的多肽”中。術語“變體肽”或“變體多肽”在本文中被定義為分別在肽或多肽的一個或多個特定位置上包含一個或多個改變(例如一個或多個特定氨基酸殘基的取代、插入、缺失和/或截短)的肽或多肽。相應地,變體信號肽是在信號肽的一個或多個特定位置上包含一個或多個改變(例如一個或多個特定氨基酸殘基的取代、插入 、缺失和/或截短)的信號肽。術語“多核苷酸”與術語“核酸分子”相同,并且在本文中可互換理解。該術語是指多核苷酸分子,其為單鏈或雙鏈的核糖核酸(RNA)或脫氧核糖核酸(DNA)分子。多核苷酸可以分離形式存在,或者可包含在重組核酸分子或載體中,或包含在宿主細胞中。術語“變體多核苷酸”在本文中被定義為在多核苷酸中一個或多個特定位置上包含一個或多個改變(例如一個或多個核苷酸的取代、插入、缺失和/或截短)的多核苷酸。術語“肽”和“寡肽”被認為是同義的(如其通常被認為的那樣),且當上下文需要表示通過肽鍵偶合的至少兩個氨基酸鏈時,每個術語可以互換使用。詞語“多肽”在本文中使用表示含有多于七個氨基酸殘基的鏈。所有的寡肽和多肽式或序列在本文中從左到右和從氨基端到羧基端的方向書寫。本文使用的單字母氨基酸代碼是本領域普遍已知的,并可見于 Sambrook, et al. (Molecular Cloning A Laboratory Manual, 2nd, ed. ColdSpringHarbor Laboratory, Cold Spring Harbor Laboratory Press, Cold SpringHarbor, NY,1989)o“分離的”多肽或蛋白質表示被從其天然環境中取出的多肽或蛋白質。例如,就本發明的目的而言,在宿主細胞中表達的重組產生的多肽和蛋白質被認為是分離的,與通過任何合適的技術已基本純化的天然或重組多肽一樣,所述合適的技術例如Smith andJohnson, Gene 67 :31-40 (1988)中公開的單步驟純化方法。根據本發明的TEMER02527P -葡糖苷酶多肽可以通過本領域已知的方法從重組細胞培養物中回收和純化。最優選地,使用高效液相色譜(“HPLC”)進行純化。本發明的多肽包括天然純化的產物、化學合成步驟的產物,和通過重組技術從原核或真核宿主生產的產物,所述宿主包括例如細菌、酵母、高等植物、昆蟲和哺乳動物細胞。取決于重組生產步驟中使用的宿主,可以將本發明的多肽糖基化或不糖基化。另外,本發明的多肽也可以包含最初被修飾的殘基(在一些情況下由宿主介導的過程產生)。本發明還包括根據本發明的多肽的生物活性片段。本發明的多肽的生物活性片段包括包含下述氨基酸序列的多肽,所述氨基酸序列與TEMER02527多肽的氨基酸序列(例如SEQ ID NO 2的氨基酸序列)足夠相同或來自后者,所述片段包含比全長多肽更少的氨基酸但是顯示相應的全長多肽的至少一種生物活性。典型地,生物活性片段包含具有TEMER02527多肽的至少一種活性的結構域或基序。本發明的多肽的生物活性片段可以是長度為例如約10、約25、約50、約100或更多個氨基酸,或長度至少約100個氨基酸、至少約150、200、250、300、350、400個氨基酸,或長
度多達本發明多肽氨基酸總數的多肽。另外,其它生物活性部分(其中多肽的其它區域被缺失)可以通過重組技術被制備,并針對本發明多肽的天然形式的一種或多種生物活性做出評價。本發明還包括編碼TEMER02527多肽的上述生物活性片段的核酸片段。多肽在本發明的另一方面中,提供了經改進的TEMER02527多肽。經改進的TEMER02527多肽是其中至少一種生物活性被改進的多肽。這類多肽可以如下獲得沿全部或部分TEMER02527編碼序列隨機地引入突變(例如通過飽和誘變),重組表達得到的突變體苷針對生物活性進行篩選。 導致經改進的葡糖苷酶功能的本發明氨基酸序列經改進的變體可通過本發明的相應基因獲得。此類修飾包括I.易錯PCR以引入隨機突變,之后篩選獲得的變體并分離具有經改進的動力學特性的變體2.編碼葡糖苷酶的酶的基因相關變體的家族改組,之后篩選獲得的變體并分離具有經改進的動力學特性的變體導致提高的mRNA和/或多肽水平、導致更多β -葡糖苷酶活性的本發明的基因變體可通過所述基因的多核苷酸序列獲得。此類修飾包括I.以下述方式改進密碼子使用,所述方式使得密碼子(最適地)適合親本微生物宿主。2.以下述方式改進密碼子對使用,所述方式使得密碼子(最適地)適合親本微生物宿主3.對編碼β -葡糖苷酶多肽的基因組信息添加穩定化序列,導致具有提高的半哀期的mRNA分子分離具有經改進的催化特性或提高的mRNA或蛋白質水平的變體的優選方法描述于TO03/010183和W003/01311中。優化親本微生物菌株中密碼子使用的優選方法描述于PCT/EP2007/05594中。對編碼本發明的β -葡糖苷酶多肽的基因添加穩定化元件的優選方法描述于W02005/059149中。在一個優選的實施方式中,TEMER02527多肽具有根據SEQ ID NO 2的氨基酸序列。在另一實施方式中,TEMER02527多肽與根據SEQ ID NO :2的氨基酸序列基本同源,并保留根據SEQ ID NO :2的多肽的至少一種生物活性,但是由于所述的天然變異或誘變而在
氨基酸序列上有差異。在又一個優選的實施方式中,TEMER02527多肽具有由下述經分離的核酸片段編碼的氨基酸序列,所述經分離的核酸片段能夠與根據SEQ IDNO 1的核酸優選地在高度嚴格的雜交條件下雜交。因此,TEMER02527多肽優選地是包含下述氨基酸序列的多肽,所述氨基酸序列與SEQ ID NO :2所示氨基酸序列至少96%、至少97%、至少98%、至少99%或更多同源,典型地,保留根據SEQ ID NO :2的多肽的至少一種功能活性。也可以如下文所述來鑒定根據本發明的多肽的功能等同物例如,針對葡糖苷酶活性,篩選本發明多肽的突變體(例如截短突變體)的組合文庫。在一個實施方式中,通過核酸水平上的組合誘變產生有斑文庫(variegated library)。可以通過例如將合成的寡核苷酸混合物酶連接為基因序列來產生變體的有斑文庫,從而可能的多肽序列的簡并集合(degenerateset)可作為個體多肽表達,或者作為一組更大的融合蛋白表達(例如用于噬菌體展示)。存在可用于從簡并寡核苷酸生產本發明多肽的可能變體文庫的多種方法。用于合成簡并寡核苷酸的方法是本領域已知的(見例如Narang(1983) Tetrahedron 39:3;ltakura et al. (1984)Annu. Rev. Biochem. 53 :323 ;ltakura et al. (1984)Science 198 1056 ;Ike et al. (1983)Nucleic AcidRes. 11 :477)。另外,本發明多肽的編碼序列的片段文庫可以被用于產生有斑的多肽群,用于篩選隨后的變體選擇。例如,可以如下產生編碼序列片段的文庫在每個分子僅發生約一次切割的條件下用核酸酶處理感興趣的編碼序列的雙鏈PCR片段,變性雙鏈DNA,將DNA復性形成雙鏈DNA (其可包含來自被不同切割的產物的有義/反義對),通過用SI核酸酶處 理從再形成的雙鏈體上去除單鏈部分,并將得到的片段文庫連接進表達載體中。通過該方法,可以得到下述表達文庫,所述表達文庫編碼感興趣的蛋白質的不同大小的N-末端和內部片段。本領域已知有若干種技術可用于篩選組合文庫(其通過截短的點突變制造)的基因產物,和用于篩選cDNA文庫以獲得具有選定特性的基因產物。用于篩選大基因文庫的、適用于高通量分析的、最廣泛使用的技術典型地包括將基因文庫克隆進可復制的表達載體中,用得到的載體文庫轉化合適的細胞,和在下述條件下表達組合基因,所述條件下想要的活性的檢測簡化編碼基因(其產物被檢測)的載體的分離。循環總體誘變(Recursiveensemble mutagenesis, REM),—種增強文庫中功能突變體頻率的技術,可以與篩選實驗組合使用以鑒定本發明多妝的變體(Arkin andYourvan (1992)Proc. Natl. Acad. Sci. USA 89:7811-7815 ;Delgrave et al. (1993)Protein Engineering 6(3) :327-331)。除了 SEQ ID NO :1中所示的TEMER02527基因序列外,本領域技術人員應當知道給定的種群中可存在DNA序列多態,所述多態導致TEMER02527多肽氨基酸序列中的改變。這類遺傳多態性可存在于來自不同種群的細胞中或由于天然等位基因變異而存在于一個種群中。等位基因變體也可包括功能等同物。根據本發明的多核苷酸的片段也可包括不編碼功能多肽的多核苷酸。這類多核苷酸可作為PCR反應的探針或引物作用。根據本發明的核酸無論是編碼功能多肽還是無功能的多肽,均可被用作雜交探針或聚合酶鏈式反應(PCR)引物。不編碼具有TEMER02527活性的多肽的本發明核酸分子的用途尤其包括(I)從cDNA文庫分離編碼TEMER02527多肽的基因或其等位基因變體,所述cDNA文庫例如來自合適的微生物;(2)與中期染色體涂片原位雜交(例如FISH)以提供 TEMER02527 基因的精確染色體定位,如 Verma et al. ,HumanChromosomes a Manual ofBasic Techniques, Pergamon Press, New York(1988)所述;(3)Northern 印跡分析,用于檢測TEMER02527mRNA在特定組織中的表達;和4)能夠被用作診斷工具來分析給定的生物(例如組織)樣品中核酸存在的探針和引物,所述核酸能與TEMER02527探針雜交。本發明還包括獲得TEMER02527基因功能等同物的方法。這類方法需要獲得被標記的含有被分離的核酸的探針,所述被分離的核酸編碼根據SEQ ID NO :2的多肽序列或其任何變體的全部或部分;在允許探針與文庫中的核酸片段雜交從而形成核酸雙鏈體的條件下,用被標記的探針篩選核酸片段文庫,和從任何被標記的雙鏈體中的核酸片段制備全長的基因序列,以獲得與TEMER02527基因相關的基因。在一個實施方式中,本發明的TEMER02527核酸與SEQ ID NO :1中所示的核酸序列或其互補體至少83 %、至少84 %、至少85 %、至少86 %、至少87 %、至少88 %、至少89 %、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或更加同源。本發明進一步提供了包含本發明多核苷酸或載體的宿主細胞。所述多核苷酸對宿主細胞的基因組可以是異源的。通常涉及宿主細胞的術語“異源的”表示多核苷酸不天然存在于宿主細胞的基因組中,或者多肽不由所述細胞天然地生產。
在另一實施方式中,本發明包括細胞,例如含有本發明所包括的核酸的經轉化的 宿主細胞或重組的宿主細胞。“經轉化的細胞”或“重組細胞”是其中(或其祖先中)已經借助于重組DNA技術引入了本發明核酸的細胞。原核和真核細胞均包括在內,例如細菌、真菌、酵母等等,特別優選的是來自絲狀真菌(例如Aspergillus niger或Talaromycesemersonii)的細胞。可選用調控插入序列表達并以特異的、期望的方式加工基因產物的宿主細胞。蛋白質產物的這類修飾(例如糖基化)和加工(例如切割)可促進蛋白質發揮最佳功能。多種宿主細胞具有用于翻譯如加工和修飾蛋白質和基因廣物的特性和特異機制。可選用分子生物學和/或微生物學領域技術人員熟悉的適當細胞系或宿主系統,以確保對所表達的外源蛋白質的想要的和正確的修飾與加工。為此,可以使用具有下述細胞機制的真核宿主細胞,所述細胞機制用于適當地加工原始轉錄本、糖基化和磷酸化基因產物。這類宿主細胞是本領域公知的。如果需要的話,可以在根據本發明的多肽的制備中使用上述細胞。這樣的方法典型地包含在提供編碼多肽的編碼序列(的載體)表達的條件下培養宿主細胞(例如用上述表達載體轉化或轉染的),并任選地回收被表達的多肽。可以將本發明的多核苷酸并入重組可復制載體例如表達載體中。可以使用載體在相容的宿主細胞中復制核酸。因此在又一個實施方式中,本發明提供了如下制造本發明多核苷酸的方法將本發明的多核苷酸引入可復制載體中,將所述載體引入相容的宿主細胞中,并在使得所述載體復制的條件下培養所述宿主細胞。可以從所述宿主細胞中回收載體。優選地,多肽作為分泌型蛋白質被生產,在這種情況下,表達構建體中編碼多肽成熟形式的核苷酸序列與編碼信號序列的核苷酸序列可操作地連接。優選地,信號序列對編碼多肽的核苷酸序列而言是天然的(同源的)。或者,信號序列對編碼多肽的核苷酸序列而言是外來的(異源的),在這種情況下信號序列優選地對其中表達本發明核苷酸序列的宿主細胞而言是內源的。對酵母宿主細胞而言合適的信號序列的例子是衍生自酵母a-因子基因的信號序列。類似地,對絲狀真菌宿主細胞而言合適的信號序列是例如衍生自絲狀真菌淀粉葡萄糖苷酶(AG)基因例如A. niger glaA基因的信號序列。這可與淀粉糖苷酶(也稱作(葡糖)淀粉酶)啟動子自身組合使用,以及與其它啟動子組合使用。在本發明上下文中也可以使用雜種信號序列。優選的異源分泌前導序列是來自于真菌淀粉葡萄糖苷酶(AG)基因(glaA-例如來自Aspergillus的18和24個氨基酸版本)、a -因子基因(酵母,例如Saccharomyces和Kluyveromyces)或α -淀粉酶基因(Bacillus)的分泌前導序列。可如上文所述將載體轉化或轉染進合適的宿主細胞中,以提供本發明多肽的表達。該方法可包括在提供編碼本發明多肽的編碼序列的載體表達的條件下培養宿主細胞,所述宿主細胞用如上所述的表達載體轉化。宿主細胞本發明因此提供了用本發明多核苷酸或載體轉化或轉染的或包含本發明多核苷酸或載體的宿主細胞。優選地,所述多核苷酸被包含在用于復制和表達多核苷酸的載體中。應選擇與所述載體相容的細胞,并且其可以是原核(例如細菌)、真菌、酵母或植物細胞。可以選擇異源宿主,其中本發明的多肽以基本不含其它纖維素降解酶或半纖維素 降解酶的形式被生產。這可以通過選擇正常情況下不生產此類酶的宿主來實現。本發明包括通過編碼多肽的DNA序列的重組表達來生產本發明多肽的方法。就這一目的而言,本發明的DNA序列可用于基因擴增和/或改變表達信號如啟動子、分泌信號序列,從而允許合適同源或異源宿主細胞中多肽的經濟生產。同源宿主細胞是下述宿主細胞,其與DNA序列衍生自的物種是相同物種或是相同物種內的變體。合適的宿主細胞優選地是原核微生物如細菌,或更優選地是真核生物,例如真菌,如酵母或絲狀真菌,或植物細胞。通常,酵母細胞是超過真菌細胞優選的,因為它們更易于操作。然而,一些蛋白質在酵母中分泌較差,或者在一些情況下不被正確加工(例如酵母中的超糖基化)。在這些情況下,應當選擇真菌宿主生物。宿主細胞可過表達多肽,并且用于進行過表達的技術是公知的。宿主細胞因此可具有兩個或更多拷貝的編碼多核苷酸(因此載體可相應地具有兩個或更多拷貝)。來自Bacillus屬的細菌非常適合作為異源宿主,因為它們能夠將蛋白質分泌進培養基中。適合作為宿主的其它細菌是來自Streptomyces和Pseudomonas屬的細菌。用于表達編碼多肽的DNA序列的一種優選的酵母宿主細胞是Saccharomyces、Kluyveromyces、Hansenula、Pichia、Yarrowia 和 Schizosaccharomyces 的屬。更優選地,酵母宿主細胞選自由Saccharomyces cerevisiae、Kluyveromyceslactis (也已知為 Kluyveromycesmarxianus var. lactis)、Hansenulapolymorpha、Pichiapastoris、Yarrowia lipolytica 和 Schizosaccharomyces pombe 物種組成的組。然而,最優選的是(例如絲狀)真菌宿主細胞。優選的絲狀真菌宿主細胞選自由 Aspergillus、Trichoderma/Hypocrea、Fusarium、Disporotrichum、Penicillium、Acremonium、Neurospora、Thermoascus、Myceliophtora、Sporotrichum、Thielavia、Chryosporium、Fusarium、Humicola、Neurospora 和 Talaromyces 屬組成的組。更優選地,絲狀真菌宿主細胞是下屬種。所述種包括但不限于Aspergillusniger、Aspergillu sawamori> Aspergillus tubingensis、AspergiIlusacuIeatus>Aspergillus foetidus、Aspergillus nidulans、Aspergillusjaponicus> Aspergillusoryzae 和 Aspergillus ficuum、Trichodermareesei/Hypocrea jecorina、Fusariumgraminearum>Talaromyces emersonii、Penicillium decumbens、Acremonium alabamense、Neurospora crassa、Myceliophtora thernaophilurri、Sporotrichum cellulophilum、Disporotrichumdimorphosporum、Talaromyces emersonii、Talaromyces stipitatus 和Thielavia terrestris。
根據本發明的宿主細胞包括植物細胞,因此本發明擴展至含有一個或多個本發明細胞的轉基因生物,如植物及其部分。所述細胞可異源表達本發明的多肽,或可異源地含有一個或多個本發明的多核苷酸。轉基因(或經遺傳修飾的)植物可因此在其基因組中(例如穩定地)插入了編碼一個或多個本發明多肽的序列。可以使用已知技術,例如使用來自Agrobacterium tumefaciens的Ti或Ri質粒,進行植物細胞的轉化。質粒(或載體)可因此含有感染植物必需的序列,并且可以使用Ti和/或Ri質粒的衍生物。或者,可進行植物部分例如葉、根或莖的直接感染。在該技術中,例如如下對要被感染的植物造成創傷用刀片切割植物、或用針穿刺植物或用磨蝕劑摩擦植物。然后用Agrobacterium接種傷口。然后可在合適的培養基上培養植物或植物部分,并允許其發育成為成熟的植物。可通過已知技術實現經轉化的細胞成為經遺傳修飾的植物的再生,例如通過使用抗生素選擇經轉化的枝條,并將枝條接種在含有適當營養素、植物激素等等的培養基上來實現。
本發明因此還包括被修飾為表達本發明的葡糖苷酶多肽或其變體的細胞。這類細胞包括經瞬時修飾的,或優選地經穩定修飾的高級真核細胞系,例如哺乳動物細胞或昆蟲細胞,低級真核細胞,例如酵母和絲狀真菌細胞,或原核細胞例如細菌細胞。還可能本發明的多肽在細胞系中或膜上(例如在桿狀病毒表達系統中)被瞬時表達。適合表達根據本發明的多肽的此類系統也包括在本發明的范圍內。根據本發明,本發明多肽的生產可以通過在便利的營養發酵培養基中培養微生物表達宿主來實現,所述微生物表達宿主已用一種或多種本發明的多核苷酸轉化。多肽/酶生產可使用本領域已知的步驟培養根據本發明的重組宿主細胞。對啟動子和宿主細胞的每種組合而言,可以獲得有助于編碼多肽的DNA序列表達的培養條件。達到期望的細胞密度或多肽滴度后,停止培養并使用已知的步驟回收多肽。發酵培養基可含有已知的培養基,所述培養基含有碳源(例如葡萄糖、麥芽糖、糖蜜、淀粉、纖維素、木聚糖、果膠、木質纖維素生物質水解產物等等)、氮源(例如硫酸銨、硝酸銨、氯化銨等等)、有機氮源(例如酵母提取物、麥芽提取物、蛋白胨等等)和無機氮源(例如磷酸鎂、磷酸鉀、磷酸鋅、磷酸鐵等等)。任選地可以包括誘導劑(例如纖維素、果膠、木聚糖、麥芽糖、麥芽糖糊精或聚木糖半乳糖醒酸(xylogalacturonan))。對合適培養基的選擇可基于表達宿主的選擇和/或基于表達構建體的調節需求來進行。這類培養基是本領域技術人員已知的。需要時,培養基可含有額外的組分,所述額外的組分對經轉化的表達宿主的偏好優于其它可能的污染微生物。可根據任何已知的程序進行通過轉化的宿主(發酵)的多肽生產。生產時間可在從約O. 5到約30天的周期上進行。發酵可以是分批、連續或補料分批的過程,在0-100°C或0-80°C范圍內,例如從約0°C到約60°C的合適溫度下,和/或例如在從約2到約10或從約3到約9的pH下。優選的發酵條件是從約20°C到約55°C之間范圍內的溫度和/或從約3到約5之間的pH。適當的條件通常基于表達宿主的選擇和要表達的多肽來選擇。發酵后,如果必須的話,可通過離心或過濾從發酵液中去除細胞。發酵停止或去除細胞后,可隨后回收本發明的多肽,并且需要時通過常規手段純化和分離。多肽/酶組合物
本發明提供了包含本發明的多肽和纖維素酶和/或半纖維素酶和/或果膠酶的組合物。當本發明的多肽是纖維素酶時,除了本發明的多肽以外,本發明的組合物會典型地包含半纖維素酶和/或果膠酶。當本發明的多肽是半纖維素酶時,除了本發明的多肽以外,本發明的組合物會典型地包含纖維素酶和/或果膠酶。當本發明的多肽是果膠酶時,除了本發明的多肽以外,本發明的組合物會典型地包含纖維素酶和/或半纖維素酶。本發明的組合物可包含一類、兩類或三類或更多類的纖維素酶,例如內切-1,4-β-葡聚糖酶(EG)、外切-纖維二糖水解酶(CBH)和β-葡糖苷酶(BG)中的一種、兩種或所有。·本發明的組合物可包含具有相同酶活性的多肽,例如與本發明多肽提供的活性相同類型的纖維素酶、半纖維素酶和/或果膠酶活性。本發明的組合物可包含與本發明的多肽提供的活性不同類型的纖維素酶活性和/或半纖維素酶活性和/或果膠酶活性。例如,本發明的組合物可包含本發明多肽提供的一種類型的纖維素酶和/或半纖維素酶活性和/或果膠酶活性和其他半纖維素酶/果膠酶提供的另一種類型的纖維素酶和/或半纖維素酶活性和/或果膠酶活性。在本文中,纖維素酶是能夠降解纖維素的任何多肽。能夠降解纖維素的多肽是能夠催化下述過程的多肽將纖維素降解成更小的單元,例如部分地降解成纖維素糊精,或者完全降解成葡萄糖單體。與纖維素酶接觸時,根據本發明的纖維素酶可得到纖維素糊精與葡萄糖單體的混合種群。此類降解將典型地通過水解反應而發生。本文中,半纖維素是能夠降解半纖維素的任何多肽。也就是說,半纖維素酶可以能夠降解木聚糖、葡糖醛酸木聚糖、阿拉伯木聚糖、葡甘露聚糖和木葡聚糖之一種或多種。能夠降解半纖維素的多肽是能夠催化下述過程的多肽將半纖維素降解成更小的多糖,例如部分地降解成寡糖,或者完全降解成糖單體,例如己糖或戊糖單體。與半纖維素酶接觸時,根據本發明的半纖維素酶可得到寡糖與糖單體的混合種群。此類降解將典型地通過水解反應而發生。本文中,果膠酶是能夠降解果膠的任何多肽。能夠降解果膠的多肽是能夠催化下述過程的多肽將果膠降解成更小的單元,例如部分地降解成寡糖,或者完全降解成糖單體。與果膠酶接觸時,根據本發明的果膠酶可得到寡糖與糖單體的混合種群。此類降解將典型地通過水解反應而發生。因此,本發明的組合物可包含任何纖維素酶,例如纖維二糖水解酶,內切-1,4-葡聚糖酶,β-葡糖苷酶或β_(1,3) (1,4)_葡聚糖酶。本文中,纖維二糖水解酶是能夠催化纖維素或纖維四糖中I,4_β-D-葡糖苷鍵水解、從鏈的末端釋放纖維二糖的任何多肽。所述酶也可以被稱作纖維素酶1,4-β-纖維二糖苷酶(1,4_β -cellobiosidase),1,4_β -纖維二糖水解酶,1,4-β -D-葡聚糖纖維二糖水解酶,微晶纖維素酶(avicelase),外切_1,4_ β-D-葡聚糖酶,外切-葡聚糖酶或外切葡聚糖酶。其可具有EC編碼EC3. 2. I. 91。纖維二糖水解酶可被分為纖維二糖水解酶I (CBHI)和纖維二糖水解酶II (CBH II)。CBH I被定義為主要從還原性末端水解纖維素,分裂出纖維二糖的纖維二糖水解酶。CBH II被定義為主要從非還原性末端水解纖維素,分裂出纖維二糖的纖維二糖水解酶。本文中,內切-β_1,4-葡聚糖酶(EC 3. 2. I. 4)是能夠催化纖維素、地衣淀粉或谷類β-D-葡聚糖中1,4-β-D-葡糖苷鍵內切水解的任何多肽。此類多肽也可以能夠水解還含有1,3_鍵的β-D-葡聚糖中的1,4_鍵。所述酶也可以被稱作纖維素酶、微晶纖維素酶、β_1,4-內切葡聚糖水解酶、β-1,4-葡聚糖酶、羧甲基纖維素酶、纖維糊精酶、內切-I,4- β -D-葡聚糖酶、內切-I,4- β -D-葡聚糖水解酶、內切-I,4- β -葡聚糖酶或內切葡聚糖酶。本文中,CEA是基于其3D結構被歸類在糖基水解酶家族5 (GH5)下的內切葡聚糖酶EC3. 2. I. 4。GH5家族成員的已知活性包括殼聚糖酶(EC 3. 2. I. 132)、β -甘露糖苷酶(EC 3.2. I. 25)、纖維素酶(EC 3.2. I. 4)、葡聚糖 1,3-β-葡糖苷酶(EC3. 2. I. 58)、地衣淀粉酶(Iicheninase) (EC 3. 2. I. 73)、葡聚糖內切 _1,6_β -葡糖苷酶(EC 3. 2. I. 75)、甘露聚糖內切-β-I,4-甘露糖苷酶(EC 3.2. I. 78)、內切-β-I,4-木聚糖酶(EC 3.2. 1.8)、纖維素β-1,4-纖維二糖苷酶(EC 3. 2. I. 91)、內切-β-1,6-半乳聚糖酶(EC 3.2.1.-)、β-1,3-甘露聚糖酶(EC 3.2. I.-)、木糖葡聚糖-特異性內切-β_1,4-葡聚糖酶(EC
3.2. I. 151)、甘露聚糖轉糖基酶(EC 2. 4. I.-)活性。本文中CEB是基于其3D結構被歸類在糖基水解酶家族7 (GH7)下的內切葡聚糖酶EC 3.2. 1.4。GH7家族成員的已知活性包括內切-β -1,4-葡聚糖酶(EC 3. 2. 1.4),[對還原末端起作用的]纖維二糖水解酶(EC3.2. I.-)、殼聚糖酶(EC 3.2. I. 132)、內切-β-1,3-1,4-葡聚糖酶(EC 3.2. I. 73)活性。本文中,β-葡糖苷酶(縮寫為BG) (EC 3.2.1.21)是能夠催化末端、非還原性β-D-葡萄糖殘基水解并釋放β-D-葡萄糖的任何多肽。這樣的多肽可具有針對β-D-葡糖苷的廣泛特異性,并且也可以水解以下一種或多種β -D-半乳糖苷、a -L-阿拉伯糖苷、β-D-木糖苷或β-D-巖藻糖苷。所述酶也可以被稱作苦杏仁苷酶、β-D-葡糖苷葡糖水解酶、纖維二糖酶或龍膽二糖酶。本文中,β_(1,3) (1,4)_葡聚糖酶(EC 3. 2. I. 73)是能夠催化含有1,3_和1,4-鍵的β-D-葡聚糖中I,4-β-D-葡糖苷鍵水解的任何多肽。此類多肽可作用于地衣淀粉和谷類β-D-葡聚糖,但不作用于僅含1,3-或1,4-鍵的β-D-葡聚糖。所述酶也可以被稱作地衣淀粉酶(licheninaSe),l,3-l,4-i3-D-葡聚糖4-葡聚糖水解酶,β -葡聚糖酶,內切-β-1,3-1,4葡聚糖酶,地衣多糖酶(Iichenase)或混合鍵β -葡聚糖酶。這類酶的替代方案是被描述為內切-1,3 (4)-β-葡聚糖酶的EC 3. 2. 1.6。當下述葡萄糖殘基在C-3處被自身取代時,這類酶水解β -D-葡聚糖酶中的I,3-鍵或I,4-鍵,所述葡萄糖殘基的還原基團涉及要水解的鍵。替代性的名稱包括內切_1,3-β-葡聚糖酶,昆布多糖酶,1,3-(1,3 ;l,4)-i3-D-葡聚糖3(4)葡聚糖水解酶,底物包括昆布多糖,地衣淀粉和谷類β-D-葡聚糖。根據本發明的組合物可包含GH61家族酶或具有增強纖維素酶的活性的任何其他酶。本文中增強纖維素酶的活性被定義為增強至少一種纖維素酶的活性。當本發明的β -葡糖苷酶蛋白在具有一種或多種纖維素酶的混合物中,例如在具有纖維二糖水解酶(CBH)和β-葡糖苷酶(BG)的混合物中存在時,其會增強這些纖維素酶的活性,這會導致降解纖維素的混合物的活性更高。基于家族成員(內切葡聚糖酶(EC 3. 2. I. 4))中的非常弱的內切-l,4-b-D-葡聚糖酶活性的測量,GH61家族中的酶最初被歸類為糖苷水解酶家族。當然這些酶的結構和作用模式不是典型的并且它們不能被認作真正的糖苷酶。但是,當與纖維素酶或纖維素酶的混合物連起來使用時,基于其增強木質纖維素分解的能力,它們被保留在 CAZy 種類中。在 Harris,PV et al,Biochemistry 2010,49,3305-3316 的圖 5 中給出了 GH61家族的已知成員的綜述。本發明的組合物可以包含任何半纖維素酶,例如內切木聚糖酶、木糖苷酶、a -L-阿拉伯呋喃糖苷酶、a -D-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶、香豆酸酯酶、α -半乳糖苷酶、β -半乳糖苷酶、β -甘露聚糖酶或β -甘露糖苷酶。本文中,內切木聚糖酶(EC 3. 2. I. 8)是能夠催化木聚糖中1,4_β -D-木糖苷鍵內切水解的任何多肽。所述酶也可以被稱作內切_1,4-β-木聚糖酶或1,4-β_ -木聚糖木聚糖水解酶。一種替代是EC 3. 2. I. 136,葡糖醛酸阿拉伯木聚糖內切木聚糖酶,一種能夠水解葡糖醛酸阿拉伯木聚糖中1,4木糖苷鍵的酶。本文中,β -木糖苷酶(EC 3. 2. I. 37)是能夠催化1,4_β -D-木聚糖的水解、從非 還原性末端去除相繼的D-木糖殘基的任何多肽。這類酶也可以水解木二糖。所述酶也可以被稱作木聚糖1,4-β -木糖苷酶、1,4-β -D-木聚糖木糖水解酶、外切-1,4-β -木糖苷酶或木二糖酶。本文中,a -L-阿拉伯呋喃糖苷酶(EC 3. 2. I. 55)是能夠作用于a -L-阿拉伯呋喃糖苷、含(1,2)和/或(1,3)_和/或(1,5)_鍵的a-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖的任何多肽。所述酶也可以被稱作α-N-阿拉伯呋喃糖苷酶、阿拉伯呋喃糖苷酶或阿拉伯糖苷酶。本文中,a -D-葡糖醛酸糖苷酶(EC 3. 2. I. 139)是能夠催化以下形式反應的任何多肽a -D-葡糖醛酸苷+H2O =醇+D-葡糖醛酸酯。所述酶也被稱作α -葡糖醛酸糖苷酶或α-葡糖苷酸酶。這些酶也可水解可作為木聚糖中取代基存在的4-0-甲基化的葡糖醛酸。替代方式是EC 3.2. I. 131 :木聚糖α-I,2-葡糖醛酸糖苷酶,其催化α-1,2-(4_0-甲基)葡糖醛酰基連接的水解。本文中,乙酰基木聚糖酯酶(EC 3. I. I. 72)是能夠催化木聚糖和木寡糖脫乙酰化的任何多肽。此類多肽可催化來自多聚木聚糖、乙酰化木糖、乙酰化葡萄糖、α -萘基乙酸酯或對硝基苯基乙酸酯的乙酰基水解,但是一般不催化來自于三酰甘油的乙酰基水解。此類多肽一般不作用于乙酰化的甘露聚糖或果膠。本文中,阿魏酸酯酶(EC 3. I. I. 73)是能夠催化以下形式反應的任何多肽阿魏酸基-糖+H2O=阿魏酸酯+糖。糖可以是例如寡糖或多糖。其典型地可以催化來自酯化的糖的4-羥基-3-甲氧基肉桂酰(阿魏酰)基的水解,所述糖通常是“天然”底物中的阿拉伯糖,對硝基苯酚乙酸酯和阿魏酸甲基酯是典型地更弱的底物。所述酶也可以被稱作肉桂酰基酯水解酶,阿魏酸酯酶或羥基肉桂酰基酯酶。也可以被稱作半纖維素附屬酶,因為其可幫助木聚糖酶和果膠酶分解植物細胞壁半纖維素和果膠。本文中,香豆酰基酯酶(EC 3. I. I. 73)是能夠催化以下形式反應的任何多肽香豆酰基-糖+H2O=香豆酸酯+糖。糖可以是例如寡糖或多糖。所述酶也可以被稱作反式-4-香豆酰基酯酶、反式-對香豆酰基酯酶、對香豆酰基酯酶或對香豆酸酯酶。所述酶也落入EC 3. I. I. 73中,從而也可以被稱作阿魏酸酯酶。
本文中,α -半乳糖苷酶(EC 3. 2. I. 22)是能夠催化a -D-半乳糖苷(包括半乳糖寡糖、半乳甘露聚糖、半乳聚糖和阿拉伯半乳聚糖)中末端、非還原性a-D-半乳糖殘基水解的任何多肽。此類多肽也可以能夠水解a-D-巖藻糖苷。所述酶也可以被稱作蜜二糖酶。本文中,β -半乳糖苷酶(EC 3. 2. I. 23)是能夠催化β -D-半乳糖苷中末端非還原性β-D-半乳糖殘基水解的任何多肽。這樣的多肽也可以能夠水解a-L-阿拉伯糖苷。所述酶也可以被稱作外切- (I- > 4)-β -D-半乳聚糖酶或乳糖酶。
本文中,β -甘露聚糖酶(EC 3. 2. I. 78)是能夠催化甘露聚糖、半乳甘露聚糖和葡甘露聚糖中I,4-β-D-甘露糖苷鍵隨機水解的任何多肽。所述酶也可以被稱作甘露聚糖內切-1,4- β -甘露糖苷酶或內切-1,4-甘露聚糖酶。本文中,β -甘露糖苷酶(EC 3. 2. I. 25)是能夠催化β -D-甘露糖苷中末端非還原性β-D-甘露糖殘基水解的任何多肽。所述酶也可以被稱作甘露聚糖酶或甘露糖酶。本發明的組合物可包含任何果膠酶,例如內切多聚半乳糖醛酸酶,果膠甲基酯酶,內切-半乳聚糖酶,β -半乳糖苷酶,果膠乙酰基酯酶,內切-果膠裂合酶,果膠酸裂合酶,α -鼠李糖苷酶,外切-半乳糖醛酸酶,外切多聚半乳糖醛酸酯裂合酶,鼠李半乳糖醛酸聚糖水解酶,鼠李半乳糖醛酸聚糖裂合酶,鼠李半乳糖醛酸聚糖乙酰基酯酶,鼠李半乳糖醛酸聚糖半乳糖醛酸水解酶,木半乳糖醛酸酶。本文中,內切-多聚半乳糖醛酸酶(EC 3. 2. I. 15)是能夠催化果膠酸酯和其他半乳糖醛酸聚糖中1,4-α-D-半乳糖醛酸鍵的隨機水解的任何多肽。所述酶也可以被稱作多聚半乳糖醒酸酶果膠解聚酶,果膠酶,內切多聚半乳糖醒酸酶,果膠酶(pectolase),果膠水解酶,果膠多聚半乳糖醛酸酶,多聚-α-1,4_半乳糖醛酸苷聚糖水解酶,內切半乳糖醛酸酶;內切-D-半乳糖醛酸酶或多聚(I,4-a-D-半乳糖醛酸苷)聚糖水解酶。在本文中,果膠甲基酯酶(EC 3. I. I. 11)是能夠催化下述反應的任何酶果膠+ηH2O = η甲醇+果膠酸酯。所述酶也已知為果膠酯酶(pectinesterase),果膠脫甲氧基酶,果膠甲氧基酶,果膠甲基酯酶,果膠酶,果膠酯酶(pectinoesterase)或果膠果酰基水解酶(pectinpectylhydroIase)。在本文中,內切-半乳聚糖酶(EC 3. 2. I. 89)是能夠催化阿拉伯半乳聚糖中1,4-i3_D-半乳糖苷鍵的內切水解的任何酶。所述酶也已知為阿拉伯半乳聚糖內切-I,4- β -半乳糖苷鍵,內切-I,4- β -半乳聚糖酶,半乳聚糖酶,阿拉伯半乳聚糖酶或阿拉伯半乳聚糖4- β -D-半乳聚糖水解酶。本文中,果膠乙酰基酯酶在本文中被定義為下述任何酶,所述酶具有催化果膠GaIUA殘基羥基處乙酰基的脫乙酰基作用的乙酰基酯酶活性。本文中,內切-果膠裂合酶(EC 4. 2. 2. 10)是能夠催化(I — 4) - a -D-半乳糖醛酸聚糖甲基酯的清除性切割,得到在其非還原末端具有4_脫氧-6-0-甲基-a -D-半乳-4-糖醒酰基的寡糖。所述酶也可已知為果膠裂合酶,果膠反式消除酶(trans-eliminase),內切果膠裂合酶,多聚甲基半乳糖醛酸反式消除酶,果膠甲基反式消除酶,果膠酶(pectolyase),PL, PNL或PMGL或(I — 4) -6-0-甲基-a -D-半乳糖醛酸聚糖裂合酶。本文中,果膠酸裂合酶(EC 4. 2. 2. 2)是能夠催化(I — 4) - a -D-半乳糖醛酸聚糖的消除性切割,得到在其非還原性末端具有4-脫氧- a -D-半乳-4-糖醛酰基的任何酶。該酶也可以已知為多聚半乳糖醛酸反式消除酶,果膠酸反式消除酶,多聚半乳糖醛酸酯裂合酶,內切果膠甲基反式消除酶,果膠酸反式消除酶,內切半乳糖醛酸酯反式消除酶,果膠酸裂合酶,果膠裂合酶,a-l,4-D-內切多聚半乳糖醛酸裂合酶,PGA裂合酶,PPase-N,內切-α -I,4-多聚半乳糖醛酸裂合酶,多聚半乳糖醛酸裂合酶,果膠反式消除酶,多聚半乳糖醛酸反式消除酶或(I — 4)-α-D-半乳糖醛酸聚糖裂合酶。本文中,α -鼠李糖苷酶(EC 3. 2. I. 40)是能夠催化a -L-鼠李糖苷或鼠李半乳糖醛酸聚糖中末端非還原性a-L-鼠李糖殘基水解的任何多肽。所述酶也可以已知為a -L-鼠李糖苷酶Τ,a -L-鼠李糖苷酶N或a -L-鼠李糖苷鼠李糖水解酶。本文中,外切-半乳糖醛酸酶(EC 3. 2. I. 82)是能夠 從非還原性末端水解果膠酸、釋放二半乳糖醛酸的任何多肽。酶也可以已知為外切-多聚- α-半乳糖醒酸昔酶(exo-poly-a-galacturonosidase)、外切多聚半乳糖醒酸苷酶(exopolygalacturonosidase)或外切多聚聚半乳糖醒酸苷酶(exopolygalacturanosidase)。本文中,外切-半乳糖醛酸酶(EC 3.2. 1.67)是能夠催化以下的任何多肽(1,
4-(1-0-半乳糖醛酸苷)11+!120= (l,4-a-D-半乳糖醛酸苷)n_i+D-半乳糖醛酸酯。所述酶也可以已知為半乳糖醒1,4_ α -半乳糖醒酸苷酶(galacturanl, 4_ a -galacturonidase),外切多聚半乳糖醛酸酶,多聚(半乳糖醛酸酯)水解酶,外切-D-半乳糖醛酸酶,外切-D-半乳糖醛酸聚糖酶,外切多聚-D-半乳糖醛酸酶或多聚(I,4-a-D-半乳糖醛酸苷)半乳糖醛酸水解酶。本文中,外切多聚半乳糖醛酸酯裂合酶(EC 4. 2. 2. 9)是能夠催化從果膠酸(即脫脂化的果膠)的還原末端消除性切割4- (4-脫氧-a -D-半乳-4-糖醛酰基)-D-半乳糖醛酸酯的任何多肽。所述酶可已知為果膠酸二糖裂合酶,果膠酸外切裂合酶,外切果膠酸反式消除酶,外切果膠酸裂合酶,外切多聚半乳糖醛酸-反式-消除酶,ΡΑΤΕ,外切-PATEjF切-PGL或(I — 4) - a -D-半乳糖醛酸聚糖還原末端二糖裂合酶。本文中,鼠李半乳糖醛酸聚糖水解酶是能夠在嚴格交替出現的鼠李半乳糖醛酸聚糖結構中以內切方式水解半乳基糖醛酸酸和吡喃鼠李糖基之間鍵的任何多肽,所述鼠李半乳糖醛酸聚糖結構由二糖[(l,2-a-L-鼠李糖基_(1,4)-α-半乳糖醛酸]組成。本文中,鼠李半乳糖醛酸聚糖裂合酶是能夠以內切方式在鼠李半乳糖醛酸聚糖中通過β -消除切割a -L-Rhap-(I — 4) - a -D-GalpA鍵的任何多肽。本文中,鼠李半乳糖醛酸聚糖乙酰基酯酶是能夠催化鼠李半乳糖醛酸聚糖中交替出現的鼠李糖和半乳糖醛酸殘基主鏈的脫乙酰化的任何多肽。本文中,鼠李半乳糖醛酸聚糖半乳糖醛酸水解酶是能夠以外切方式、從嚴格交替出現的鼠李半乳糖醛酸聚糖結構的非還原性末端水解半乳糖醛酸的任何多肽。本文中,木半乳糖醛酸酶是通過以內切方式切割木糖取代的半乳糖醛酸主鏈而作用于木半乳糖醛酸聚糖的任何多肽。所述酶也可以已知為木半乳糖醛酸聚糖水解酶。本文中,a -L-阿拉伯糖呋喃糖苷酶(EC 3. 2. I. 55)是能夠作用于a -L-阿拉伯呋喃糖苷、含有(1,2)和/或(1,3)_和/或(1,5)_鍵的a-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖的任何多肽。所述酶也可以被稱作α-N-阿拉伯糖呋喃糖苷酶,阿拉伯糖呋喃糖苷酶或阿拉伯糖苷酶。
本文中,內切阿拉伯聚糖酶(EC 3. 2. I. 99)是能夠催化1,5-阿拉伯聚糖中1,
5-α -阿拉伯呋喃糖苷鍵內切水解的任何多肽。所述酶也已知為內切阿拉伯糖酶,阿拉伯聚糖內切-I,5- a -L-阿拉伯糖苷酶,內切-I,5- a -L-阿拉伯聚糖酶,內切-α -I,5_阿拉伯聚糖酶;內切-阿拉伯聚糖酶或1,5- a -L-阿拉伯聚糖1,5- a -L-阿拉伯聚糖水解酶。本發明的組合物將一般包含至少一種纖維素酶和/或至少一種半纖維素酶和/或至少一種果膠酶(所述酶之一是根據本發明的多肽)。本發明的組合物可包含纖維二糖水解酶,內切葡聚糖酶和/或葡糖苷酶。此類組合物也可以包含一種或多種半纖維素酶和/或一種或多種果膠酶。本發明的組合物中可以存在淀粉酶、蛋白酶、脂肪酶、木質酶、己糖基轉移酶葡糖醛酸糖苷酶中的一種或多種(例如兩種、三種、四種或所有)。“蛋白酶”包括水解肽鍵的酶(肽酶),以及水解肽和其它部分如糖之間鍵的酶(糖·肽酶)。許多肽酶根據EC 3. 4表征,適合在本發明中使用并且通過引用并入本文。一些特定類型的蛋白酶包括半胱氨酸蛋白酶(包括胃蛋白酶,木瓜蛋白酶)和絲氨酸蛋白酶(包括糜蛋白酶,羧肽酶和金屬內切蛋白酶)。“脂肪酶”包括水解脂質、脂肪酸和酰基甘油酯(包括磷酸甘油酯)、脂蛋白、二酰基甘油等等的酶。在植物中,脂質被用作結構組分,來限制水損失和病原體感染。這些脂質包括來自脂肪酸的蠟質,以及角質和木栓素(suberin)。“木質酶”包括能夠水解或分解木質素聚合物結構的酶。能夠分解木質素的酶包括木質素過氧化物酶、錳過氧化物酶、漆酶和阿魏酸酯酶,和在本領域中已知解聚或以其他方式分解木質素聚合物的描述的其他酶。還包括在內的是能夠水解在半纖維素糖(主要是阿拉伯糖)和木質素之間形成的鍵的酶。木質酶包括但不限于以下組的酶木質素過氧化物酶(EC1. 11. 14)、錳過氧化物酶(EC I. 11. I. 13)、漆酶(EC I. 10. 3. 2)和阿魏酸酯酶(EC3. I. I. 73)。“己糖基轉移酶”(2. 4. I-)包括能夠轉移糖基、更特定地轉移幾糖基的酶。除了將糖基從含糖基的供體轉移至另一含糖基的化合物受體以外,所述酶還能夠將糖基轉移至作為受體的水。所述反應也已知為水解反應而不是轉移反應。可以在本發明中使用的己糖基轉移酶的例子是β_葡聚糖基轉移酶。此類酶可以能夠催化(1,3) (1,4)葡聚糖和/或纖維素和/或纖維素降解產物的降解。“葡糖醛酸糖苷酶”包括催化葡糖醛酸苷(例如β -葡糖醛酸苷)水解得到醇的酶。許多葡糖醛酸糖苷酶已被表征,并可適合在本發明中使用,例如葡糖醛酸糖苷酶(EC 3. 2. I. 31),透明質酸酶葡糖醛酸糖苷酶(EC3. 2. I. 36),葡糖醛酰基-二硫葡糖胺葡糖醛酸糖苷酶(3. 2. I. 56),甘草酸β -葡糖醛酸糖苷酶(3. 2. I. 128)或a -D-葡糖醛酸糖苷酶(EC 3. 2. I. 139)。本發明的組合物可包含擴展蛋白多肽或擴展蛋白樣多肽,如膨脹因子(swollenin)(見 Salheimo et al. , Eur. J. Biohem. 269,4202-4211, 2002)或膨脹因子樣多肽。擴展蛋白涉及植物細胞生長期間細胞壁結構的松弛。已經提出擴展蛋白破壞纖維素和其他細胞壁多糖之間的氫鍵,但不具有水解活性。認為它們通過這種方式允許纖維素纖維的滑動和細胞壁的擴大。一種擴展蛋白樣蛋白——膨脹因子,含有N端碳水化合物結合模塊家族I結構域(CBD)和C端擴展蛋白樣結構域。就本發明的目的而言,擴展蛋白樣蛋白或膨脹因子樣蛋白可包含此類結構域中的一種或兩種和/或可破壞細胞壁的結構(如破壞纖維素結構),任選地不生產可檢測量的還原糖。本發明的組合物可包含纖維素整合蛋白、支架蛋白或支架樣蛋白的多肽產物,例如分別來自 Clostridium thermocellum 或 Clostridiumcellulolyticum 的 CipA 或 CipC0支架蛋白和纖維素整合蛋白是多功能整合亞基,其可將分解纖維素的亞基組合進多酶復合物中。這通過兩類互補的結構域(即支架蛋白上的內聚結構域(cohesiondomain)和每個酶單元上的錨定結構域(dockerindomain))的相互作用完成。支架蛋白亞基還帶有介導纖維體與其底物結合的纖維素結合模塊(CBM)。就本發明的目的而言,支架蛋白或纖維素整合蛋白可包含此類結構域中的一種或兩種。本發明的組合物可包含纖維素誘導的蛋白或調節蛋白,例如由來自Trichodermareesei/Hypocrea jacorina的cipl或cip2基因或類似基因所編碼的蛋白(見Foreman et al.,J. Biol. Chem. 278 (34) · 31988-31997,2003)。這些基因的多肽產物是雙模塊蛋白,其含有纖維素結合模塊和其功能或活性不與已知的糖基水解酶家族相關的結構域。而纖維素結合模塊的存在和這些基因的表達與纖維素酶元件的共同調節表明在生物質降解中具有潛在作用的先前未被認識的活性。本發明的組合物可包含上文提到的多肽種類的任一成員、一個多肽種類的若干成員、或這些多肽種類的任何組合。在本發明的組合物可以由來自以下的多肽(例如酶)組成(1)供應商;(2)克隆基因表達的多肽,例如酶;(3)復合發酵液(例如由培養基中微生物菌株的生長得到的,其中所述菌株向培養基中分泌蛋白和酶);(4)如(3)中生長的菌株的細胞裂解物;和/或(5)植物材料表達的多肽,例如酶。本發明組合物中不同的多肽,例如酶可得自不同的來源。多肽的用途根據本發明的多肽和多肽組合物可用于許多不同的應用中。例如,它們可被用于生產可發酵的糖。可發酵的糖隨后可(作為生物燃料方法的部分)被轉化成沼氣或乙醇、丁醇、異丁醇、2 丁醇或其他合適的物質。或者,多肽及其組合物可(例如在食物制品的生產中,在洗滌劑組合物中,在造紙工業和制漿工業中,和在抗菌配制物中,在藥物制品例如潤喉片、牙膏和漱口水中)用作酶。這些用途中的一些將在下文中更詳細地闡述。在下文所述地用途和方法中,上述組合物的組分可共同(即本身作為單一組合物)或單獨或先后提供。本發明還涉及根據本發明的葡糖苷酶多肽和包含此類酶的組合物在工業方法中的用途。盡管用這些方法獲得了長期的經驗,但是根據本發明的β_葡糖苷酶多肽可具有優于目前所使用的酶的大量顯著優點。根據具體的應用,這些優點可包括下述方面,例如更低的生產成本,更高的底物特異性,降低的抗原性,更少的不想要的副活性,在合適的微生物、更合適的pH和溫度范圍中生產時更高的產量,不受疏水的、來自木質素的產物抑制,或更少的產物抑制,或在食品工業情況下最終產物更好的口味或質地,以及食品級別和猶太教戒律方面。原則上,β_葡糖苷酶多肽或本發明的組合物可以在任何下述方法中使用,所述方法需要處理包含多糖的材料。因此,本發明的多肽或組合物可以在多糖材料的處理中使用。本文中,多糖材料是下述材料,所述材料包含一種或更典型地包含多于一種多糖或者基本由所述多糖組成。典型地,植物和源自它們的材料包含大量非淀粉的多糖材料。因此,本發明的多肽可以用于植物或真菌材料或源自它們的材料的處理。木質纖維素植物非淀粉多糖材料的一個重要的組分是木質纖維素(在本文中也稱作木質纖維素生物質)。木質纖維素是包含纖維素和半纖維素和木質素的植物材料。碳水化合物聚合物(纖維素和半纖維素)與木質素通過氫鍵和共價鍵緊密結合。因此,本發明的多肽可以用于木質纖維素材料的處理。本文中,木質纖維素材料是包含木質纖維素或基本由木質纖維素組成的材料。因此,在用于處理非淀粉的多糖的本發明方法中,非淀粉的多糖可以是木質纖維素材料/生物質。 因此,本發明提供了用于處理包含非淀粉多糖的底物的方法,其中所述處理包括纖維素和/或半纖維素和/或果膠物質的降解和/或水解和/或改性。降解在本文上下文中表示導致產生纖維素和/或半纖維素和/或果膠物質的水解產物(即與類似的未經處理的非淀粉多糖中存在的相比,由于處理而存在更短鏈的糖)的處理。因此,降解在本文上下文中可以導致寡糖和/或糖單體的釋放。所有植物都含有非淀粉的多糖,同樣,基本上所有來自植物的多糖材料也含有非淀粉的多糖。因此,在本發明的用于處理包含非淀粉多糖的底物的方法中,所述底物可以以植物或源自植物的材料或包含植物或源自植物的材料的形式提供,例如以植物漿體、植物提取物、食品或其成分、織物、紡織品或衣物。適合在本發明的方法中使用的木質纖維素生物質包括生物質,并可包括原生生物質(virgin biomass)和/或非原生生物質如農業生物質,商業有機物,建筑和拆除碎片,市政固體廢棄物,廢紙和庭院廢棄物。常見的生物質形式包括樹木,灌木叢(shrubs)和草,小麥,小麥秸,甘蔗渣,玉米,玉米殼,玉米芯(corn cobs),玉米粒(包括來自玉米粒的纖維),來自谷物如玉米、小麥和大麥研磨(包括濕磨和干磨)的通常稱作麩或纖維的產物和副產物,以及市政固體廢棄物,廢紙和庭院廢棄物。生物質也可以是,但不限于草本材料,農業殘余物,林業殘余物,市政固體廢棄物,廢紙,和紙漿和造紙廠殘余物。“農業生物質”包括樹枝,灌木(bushes),藤蔓(canes),玉米和玉米殼,能量作物,森林,水果,鮮花,谷物,草,草本作物,樹葉,樹皮,針葉,原木,根,樹苗,短期輪種木本作物(short-rotationwoody crops),灌木叢,柳枝稷,樹木,蔬菜,水果皮,蔓藤(vines),甜菜衆,小麥麩皮(wheatmidlings),燕麥殼,和硬木材或軟木材(不包括帶有有害材料的木材)。另外,農業生物質包括由農業加工產生的有機廢棄物材料,所述農業加工包括農業和林業活動,特定地包括林業木材廢棄物。農業生物質可以是前述任一或其任何組合或混合物。合適的生物質的其他例子是果園底料,樹叢,磨坊廢棄物,城市木材廢棄物,市政廢棄物,伐木廢棄物,森林疏伐廢棄物,短期輪種木本作物,工業廢棄物,小麥秸,燕麥秸,水稻秸,大麥秸,黑麥秸,亞麻秸,大豆殼,稻殼,水稻秸,玉米谷蛋白飼料,燕麥殼,甘蔗,玉米秸桿,玉米桿,玉米芯,玉米殼,牧場草,磨擦禾,狐尾草;甜菜漿,柑橘果實漿,種子殼,纖維素動物糞便,草坪修剪廢棄物,棉花,海藻,樹木,灌木叢,草,小麥,小麥秸,甘蔗渣,玉米,玉米殼,玉米棒,玉米粒,來自玉米粒的纖維,來自谷物濕磨或干磨的產物和副產物,市政固體廢棄物,廢紙,庭院廢棄物,草本材料,農業殘余物,林業殘余物,市政固體廢棄物,廢紙,紙漿,造紙廠殘余物,樹枝,灌木,甘蔗,玉米,玉米殼,能源作物,森林,水果,鮮花,谷物,草,草本作物,樹葉,樹皮,針葉,原木,根,樹苗,灌木叢,柳枝稷,樹木,蔬菜,水果皮,藤蔓,甜菜衆,小麥麩皮,燕麥殼,硬木材或軟木材,由農業加工產生的有機廢棄物材料,林業木材廢棄物,或其中任意兩種或更多的組合。除了已經在食物和飼料或造紙和制漿工業中加工的原生生物質或原料以外,生物質/原料可額外地用熱、機械和/或化學改性或此類方法的任何組合預處理,從而增強酶降解。預處理為了以任何本領域已知的方式增強底物對酶水解的可接近性和/或水解半纖維素和/或溶解半纖維素和/或纖維素和/或木質素,在酶處理之前,任選地可用熱、機械、和 /或化學改性或此類方法的任何組合對原料預處理。預處理可包括將木質纖維素材料暴露于(熱)水、蒸汽(蒸汽爆破)酸、堿、溶劑、熱、過氧化物、臭氧、機械擊打、粉碎、研磨或快速降壓,或其中任何兩種或更多的組合。所述化學預處理通常與熱預處理(例如150-220°C之間I到30分鐘)組合。預糖化預處理步驟后,可以使用涉及用酶或酶混合物孵育的液化/水解或預糖化步驟。預糖化步驟可以在許多不同的溫度下進行,但是優選預糖化在最適合要應用的酶混合物的溫度下,或針對要應用的酶預測的酶最適度下進行。預糖化步驟的溫度范圍可以是從約10°C到約 95°C,約 20°C到約 85°C,約 30°C到約 70°C,約 40°C到約 60°C,約 37°C到約 50°C,優選地約37°C到約80°C,更優選地約60-70°C,進一步更優選地在65°C左右。預糖化混合物的pH可以在從約2. O到約10. 0,但是優選地約3. O到約7. O,更優選地約4. O到約6. 0,進一步更優選地約4. O到約5. O。另外,pH可以被調節以最大化酶活性,并且可以通過添加酶來調節。液化/水解或預糖化步驟反應可以進行數分鐘到數小時,例如從約I小時到約120小時,優選地從約2小時到約48小時,更優選地從約2小時到約24小時,最優選地從約2小時到約6小時。纖維素酶處理可進行數分鐘到數小時,例如從約6小時到約120小時,優選地約12小時到約72小時,更優選地約24小時到48小時。糖化本發明提供了由木質纖維素材料生產糖的方法,所述方法包括將本發明的多肽與木質纖維素材料接觸。此類方法允許由木質纖維素生物質生產游離的糖(單體)和/或寡糖。這些方法涉及用本發明的多肽或組合物將木質纖維素生物質轉化成游離糖和小寡糖。將復合碳水化合物如木質纖維素轉化為糖的方法優選地允許轉化成可發酵的糖。此類方法可以被稱作“糖化”。因此,本發明的方法可導致一種或多種己糖和/或戊糖(如葡萄糖、木糖、阿拉伯糖、半乳糖、半乳糖醛酸、葡糖醛酸、甘露糖、鼠李糖、核糖和果糖中的一種或多種)的釋放。因此,本發明的另一方面包括下述方法,所述方法與其它酶或物理處理(例如溫度和pH) —起利用上文所述本發明的組合物的多肽,將木質纖維素植物生物質轉化成糖和寡糖。盡管組合物已作為單一混合物被討論,但是認為酶可以先后添加,其中溫度、pH和其他條件可以被改變,以提高每種個體酶的活性。或者,可以針對酶混合物測定最適PH和溫度。酶在任何適當的條件下與底物反應。例如,酶可以在約25°C,約30°C,約35°C,約 37°C,約 40°C,約 45°C,約 50°C,約 55°C,約 60°C,約 65°C,約 70°C,約 75°C,約 80°C,約85 °C,約90 V或更高下孵育。也就是說,它們可以在從約20 V到約95 °C下,例如在低到中等離子強度的緩沖液中和/或從低到中性PH下孵育。“中等離子強度”表示對任何單個離子 組分而言,緩沖液具有約200毫摩爾(mM)或更少的離子濃度。pH可在從約pH 2. 5,約pH3.0,約 pH 3. 5,約 pH 4.0,約 pH 4. 5,約 pH 5,約 pH 5. 5,約 pH 6,約 pH 6. 5,約 pH 7,約 pH7. 5,約pH 8.0,到約pH 8. 5的范圍內。通常,pH范圍會從約pH 3. O到約pH 7。為了生產乙醇,優選酸性介質,例如PH = 4,而為了生產沼氣,期望中性pH例如pH = 7。在這些條件下孵育酶組合導致大量糖從木質纖維素釋放或解離。大量表示可利用的糖的至少20%、30%、40%、50%、60%、70%、80%、90%、95% 或更多。多肽(例如酶)可以在微生物、酵母、真菌、細菌或植物中外源產生,然后分離并加入例如木質纖維素原料中。或者,酶可以被生產但不分離,并且將粗制細胞群發酵液或植物材料(如玉米桿)等等可被加入例如原料中。或者,可以處理粗制細胞群或酶生產培養基或植物材料,以預防進一步的微生物生長(例如通過加熱或添加抗微生物劑),然后添加至例如原料中。這些粗制酶混合物可包含生產酶的生物。或者,酶可以在下述發酵中生產,所述發酵施用原料(例如玉米桿)對生產酶的生物提供營養。通過這種方式,生產酶的植物自身可以發揮木質纖維素原料的作用,并且被添加進木質纖維素原料中。糖的發酵可發酵的糖可以被轉化成有用的增值的(value-added)發酵產物,其非限制性例子包括氨基酸、維生素、藥物、動物飼料補充劑、特種化學品(specialty chemicals)、化學品原料、塑料、溶劑、燃料或其他有機聚合物、乳酸和乙醇,包括燃料乙醇。糖尤其可被用作用于原料,用于發酵成化學品、塑料、例如琥珀酸和(生物燃料),包括乙醇、甲醇、丁醇合成液體燃料和沼氣。例如,在本發明的方法中,酶或酶的組合作用于發揮原料作用的木質纖維素底物或植物生物質上,從而將所述復合底物轉化成簡單的糖和寡糖,用于生產乙醇或其它有用的發酵產物。從生物量釋放的糖可被轉化成有用的發酵產物,例如包括但不限于,氨基酸、維生素、藥物、動物飼料補充劑、特種化學品,化學品原料,塑料,和乙醇,包括燃料乙醇。因此,本發明提供了用于制備發酵產物的方法,所述方法包括a.使用本文所述的方法降解木質纖維素;以及b.對得到的材料進行發酵;由此制備發酵產物。發酵可在需氧或厭氧條件下進行。優選地,所述方法在微需氧或氧受限的條件下進行。
厭氧發酵方法在本文中被定義為在不存在氧時運行的,或者其中基本不消耗氧,優選地消耗約5或更少、約2. 5或更少、或約lmmol/L/h或更少氧,并且其中有機分子既作為電子供體又作為電子受體的發酵方法。氧受限的發酵方法是其中氧消耗受到從氣體到液體的氧轉移限制的方法。氧限制程度由進入氣流的量和組成以及使用的發酵設備的實際混合/物料轉移性質決定。優選地,在氧受限條件下進行的方法中,氧消耗速率至少約5. 5,更優選地至少約6,進一步更優選地至少約7mmol/L/h。用于制備發酵產物的方法可任選地包括發酵產物的回收。SSF發酵和糖化也可以按照同時糖化和發酵(SSF)的模式進行。這種模式的優點之一是減少對酶促水解的糖抑制(對纖維素酶的糖抑制由Caminal B&B Vol XXVII Pp 1282-1290 描述)。發酵產物可以根據本發明生產的發酵產物包括氨基酸、維生素、藥物、動物飼料補充劑、特種化學品、化學原料、塑料、溶劑、燃料或其他有機聚合物、乳酸和乙醇,包括燃料乙醇(術語“乙醇”被理解為包括乙醇或乙醇和水的混合物)。可以通過本發明的方法生產的特定的增值產物包括但不限于生物燃料(包括乙醇和丁醇和沼氣);乳酸;塑料;特種化學品;有機酸,包括檸檬酸、琥珀酸、延胡索酸、衣康酸和順丁烯二酸;3_羥基-丙酸,丙烯酸;乙酸;1,3-丙烷-二醇;乙烯;丙三醇;溶劑;動物飼料補充劑;藥物,如內酰胺抗生素或頭孢菌素;維生素;氨基酸,如賴氨酸,甲硫氨酸,色氨酸,蘇氨酸和天冬氨酸;工業酶,如蛋白酶,纖維素酶,淀粉酶,葡聚糖酶,乳糖酶,脂肪酶,裂合酶,氧化還原酶,轉移酶或木聚糖酶;和化學原料。沼氣本發明還提供了本文所述的多肽或組合物在用于制備沼氣的方法中的用途。沼氣典型地表示由有機物質(例如含有非淀粉碳水化合物的材料)在不存在氧時生物降解而生產的氣體。沼氣源自生物源材料,并且是一種生物燃料。一種沼氣由可生物降解的材料(例如生物質、糞便或污水、市政廢棄物和能源作物)的厭氧消化或發酵生產。這種沼氣主要由甲烷和二氧化碳組成。氣體甲烷可以用氧燃燒或氧化。空氣含有21%的氧。該能量釋放允許沼氣被用作燃料。在許多國家中沼氣可被用作低成本燃料,用于任何加熱目的,例如烹飪。其也可以被用在現代廢棄物管理設備中,在那里其可以被用于運行任何類型的熱引擎,從而產生機械力或電力。微生物沼氣生產的第一步由聚合物和復合底物(例如非淀粉碳水化合物)的酶促降解組成。因此,本發明提供了用于制備沼氣的方法,其中包含非淀粉碳水化合物的底物與本發明的多肽或組合物接觸,從而產生可發酵的材料,所述可發酵的材料可由生物(例如微生物)轉化成沼氣。在此類方法中,本發明的多肽可由生物提供,所述生物例如是表達此類多肽的微生物。酶在食物制品中的用途本發明的多肽和組合物可在下述方法中使用,所述方法加工植物材料,從而降解或改性植物或真菌材料細胞壁的纖維素或半纖維素或果膠物質組分。此類方法可用于制備食物制品。因此,本發明提供了制備食物制品的方法,所述方法包括在食物制品的制備期間摻入本發明的多肽或組合物。本發明還提供了加工植物材料的方法,所述方法包括將植物材料與本發明的多肽或組合物接觸,從而降解或改性(植物)材料中的纖維素。優選地,植物材料是植物漿體或植物提取物,例如汁液。植物和含有纖維素/半纖維素/果膠物質的材料包括植物漿體、植物部分和植物提取物。在本發明的上下文中, 來自植物材料的提取物是可通過提取(機械和/或化學)、加工或其他分離技術源自植物材料的任何物質。提取物可以是汁液、花蜜、堿或由其制成的濃縮物。植物材料可包含或源自蔬菜,例如胡蘿卜、芹菜、洋蔥、豆類或豆科植物(大豆、黃豆、豌豆)或水果,例如梨果或帶種子的水果(seed fruit)(蘋果、梨、柑橘等)、葡萄、西紅柿、柑橘(橙、檸檬、枸櫞、蜜桔)、甜瓜、洋李、櫻桃、黑醋栗、紅醋栗、覆盆子、草莓、蔓越莓、菠蘿和其他熱帶水果,樹及其部分(例如花粉,來自松樹),或谷物(燕麥、大麥、小麥、玉米、水稻)。(要被水解的)材料也可以是農業殘余物,例如甜菜漿、玉米芯(com cobs)、小麥秸、(粉碎的)堅果殼,或可再生材料,例如(廢)紙。本發明的多肽因此可被用于處理植物材料,包括植物漿體和植物提取物。它們也可以被用于處理液體或固體食品或可食用的食品成分,或在植物油、淀粉的提取中使用,或被用作食物中的增稠劑。典型地,本發明的多肽被用作上文所述的組合物/酶制劑。所述組合物通常會被添加至可通過例如機械加工(如擠壓或研磨)植物材料獲得的植物漿體中。組合物與植物的孵育會典型地進行從10分鐘到5小時、例如30分鐘到2小時、優選地約I小時的時間。加工溫度優選地從約10°C到約55°C,例如從約15°C到約25°C,任選地約20°C,每噸要處理的材料可以使用從約IOg到約300g,優選地從約30g到約70g,任選地約50g的酶。使用的所有酶或它們的組合物可以被先后或同時添加至植物漿體中。根據酶制劑的組成,植物材料可首先被浸潰(例如至純凈)或液化。使用本發明的多肽,可以改進加工參數,例如提取產率、提取物粘度和/或提取物品質。或者,或除上文以外,本發明的多肽可以被添加至通過壓榨或液化植物漿體而獲得的粗制汁液中。在劑量、溫度和持續時間方面,粗制汁液的處理應與植物漿體以類似的方式進行。另外,可以包括其他酶,例如先前討論的酶。典型的孵育條件如前一段中所述。一旦用本發明的多肽孵育了粗制汁液,則隨后可以離心或過濾(超濾)汁液以生
產最終產物。用本發明的多肽處理后,可以對(終)產物進行熱處理,例如在約100°C下進行約I分鐘到約I小時,在使本發明多肽部分或完全失活的條件下進行。含有本發明多肽的組合物也可以在水果泥或蔬菜泥的制備期間使用。在烘焙中,多肽可改善面團結構,修飾其粘性或柔韌性,改進面包體積和/或碎屑結構,或賦予更好的質地特征,例如斷裂品質、成條品質或碎屑品質。本發明因此涉及用于制備面團或基于谷物的食物制品的方法,所述方法包括向面團中摻入本發明的多肽或組合物。相對于其中未摻入多肽的面團或基于谷物的食物制品而言,這可以改進面團或得自面團的基于谷物的食物制品的一種或多種特性。根據本發明的基于谷物的食物制品的制備可包括本領域中已知的步驟,例如煮沸、干燥、油炸、蒸或烘焙獲得的面團。由煮過的面團制成的制品是例如煮過的面條、餃子,由炸過的面團制成的制品是例如面包圈、beignets、油炸面條,由蒸過的面團制成的制品是例如蒸慢頭和蒸面,由干燥的面團制成的制品是意大利面和干面條,由烘焙的面團制成的制品是面包、曲奇、蛋糕。術語“經改進的特性”在本文中被定義為相對于其中未摻入根據本發明的多肽的面團或制品而言,被根據本發明的多肽作用改進的面團和/或由面團獲得的制品、尤其是基于谷物的食物制品的任何特性。經改進的特性可包括但不限于,提高的面團強度,提高的面團彈性,提高的面團穩定性,經改進的面團可加工性,經改進的面團醒發抗性,降低的面團粘度,經改進的面團延伸性,提高的基于谷物的食物制品體積,降低的基于谷物的食物制品發泡性,經改進的烘焙制品碎屑結構,經改進的基于谷物的食物制品的柔軟性,經改進的基于谷物的食物制品的風味,經改進的基于谷物的食物制品的抗老化性(anti-staling)。與意大利面和面條類型的基于谷物的制品相關的經改進的特性是例如經改進的硬度,降低的粘度,經改進的凝聚性和降低的烹調損失。
經改進的特性可通過添加或不添加本發明的多肽而制備的面團和/或基于谷物的食物制品的比較來確定。感官品質可以使用烘焙工業中公認的程序來評價,并且可包括使用例如受過訓練的口味測試者小組。術語“面團”在本文中被定義為足夠堅硬到揉捏或滾動的谷物粉和其他成分的混合物。谷物的例子是小麥、黑麥、玉米、玉蜀黍、大麥、水稻、米粒(groats)、蕎麥和燕麥。小麥在此處和下文中旨在包括Triticum屬的所有種,例如aestivum、durum和/或spelta。合適的其他成分的例子是根據本發明的β -葡糖苷酶多肽,額外的酶,化學添加劑和/或加工助劑。面團可以是新鮮的、冷凍的、預制備的或預烘焙的。來自上述成分的面團的制備是本領域公知的,并且包括將所述成分與加工助劑混合,和一個或多個塑型(moulding)和任選的發酵步驟。凍面團的制備由Kulp andLorenz在Frozen and Refrigerated Doughsand Batters 中描述。術語“基于谷物的食物制品”在本文中被定義為由面團制備的任何制品,無論具有軟的特征還是具有易碎的特征。可有利地通過本發明生產的基于谷物的食物制品的例子(無論是白色、淺色或深色類型)是面包(尤其是白面包、全麥面包或黑麥面包),典型地是面包片或面包卷的形式,法棍型面包,意大利面,面條,面包圈,百吉餅,蛋糕,皮塔餅(pitabread),玉米餅(tortillas),墨西哥卷餅(tacos),蛋糕,煎餅,餅干,曲奇,派皮(piecrusts),蒸面包(steamed bread)和脆面包(crispbread)等等。術語“烘焙制品”在本文中被定義為通過烘焙面團制備的任何基于谷物的食物制
品O非淀粉多糖(NSP)能夠提高食糜(digesta)的粘度,這可進而降低營養可用度和動物表現。本發明的β_葡糖苷酶多肽的使用能夠提高磷利用,以及動物食糜期間的陽離子礦物質和多肽。對飼料添加特定的養分會改進動物消化并從而降低飼料成本。目前正在使用大量飼料添加劑,并且持續開發出新的概念。使用特定的酶(例如非淀粉碳水化合物降解酶)能夠分解纖維,釋放能量,以及提高蛋白質可消化性,因為纖維分解時有更好的蛋白質可達性。藉此,飼料成本能夠降低,并且飼料中的蛋白質水平也能降低。
非淀粉多糖(NSP)事實上也存在于植物來源的所有飼料成分中。NSP利用較差,并且在溶解時能夠顯示對消化的不良影響。外源酶能夠有助于更好地利用這些NSP,并因此降低任何抗營養效應。本發明的非淀粉碳水化合物降解酶可在基于谷物的家禽膳食中被用于該目的,或者在更小的程度上用于豬和其他物種。本發明的非淀粉碳水化合物降解多肽/酶(包含本發明多肽/酶的組合物)可在洗滌劑工業中使用,例如用于從洗衣房中去除基于碳水化合物的污點。洗滌劑組合物可包含本發明的多肽/酶,另外包含一種或多種纖維素,半纖維素酶,果膠酶,蛋白酶,脂肪酶,角質酶,淀粉酶或碳水化合物酶。酶在洗滌劑組合物中的用途 包含本發明多肽或組合物的洗滌劑組合物可以是任何便利的形式,例如糊劑、凝膠、粉末或液體。液體洗滌劑可以是水性的,典型地含有最多約70%的水和從約O到約30%的有機溶劑或非水性材料。此類洗滌劑組合物可例如被配制為手洗洗滌劑組合物或機洗洗滌劑組合物,包括適用于預處理臟污織物的洗衣添加組合物和漂洗添加的織物柔軟劑組合物,或被配制成用于一般居家硬表面清潔操作的洗滌劑組合物,或被配制用于手洗或機洗的洗碗操作。通常,酶的特性應當與所選擇的洗滌劑相容(例如pH-最適度,與其他酶和/或非酶成分的相容性等等),并且酶應當以有效量存在。洗滌劑組合物可包含表面活性劑,例如陰離子或非離子型表面活性劑,洗滌劑增量組分或復合劑,一種或多種聚合物,漂白系統(例如H2O2源)或酶穩定劑。洗滌劑組合物也可包含任何其他常規的洗滌劑成分,例如護理劑包括粘土,泡沫加強劑,sud抑制劑,抗腐蝕劑,土壤懸浮劑,土壤再沉淀劑,染料,殺菌劑,光學增亮劑,助水溶物,晦暗抑制劑(tarnish inhibitor)或香料。酶在造紙和漿體加工中的用途本發明的多肽可用于造紙和制漿工業,尤其是漂白過程中,以增強被漂白的漿體的亮度,從而可以降低漂白階段中使用的氯,并且提高漿體在再循環造紙方法中的自由度(Eriksson, K. E. L. , Wood Science andTechnology 24(1990) :79-101 ;Paice, et al.,Biotechnol. and Bioeng. 32(1988) :235_239and Pommier et al.,Tappi Journal(1989)187-191)。另外,本發明的多肽或組合物可被用于處理木質纖維素漿體,從而改進其可漂白性。因此可以降低獲得令人滿意的漿體漂白所需要的氯量。本發明的多肽或組合物可被用于下述方法中,所述方法降低含纖維素的織物變得粗糙的速率,或降低含纖維素的織物的粗糙度,所述方法包括用上文所述的多肽或組合物處理含纖維素的織物。本發明還涉及為有色的含纖維素的織物提供色彩澄清的方法,所述方法包括用上文所述的多肽或組合物處理有色的含有纖維素的織物,和在有色的含纖維素的織物中提供局部變化的方法,所述方法包括用上文所述的多肽或組合物處理有色的含纖維素的織物。本發明的方法可以通過在洗滌期間處理含纖維素的織物來進行。然而,需要時織物的處理也可以在浸泡或漂洗期間進行,或簡單地通過將上文所述的多肽或組合物添加至浸潰或要浸潰織物的水中來進行。其他酶用途另外,本發明的多肽或組合物也可以被用于抗菌配制物中以及藥物制品例如潤喉糖、牙膏和漱口水中。以下實施例闡述本發明
實施例材料和方法DNA 程序除非另有說明,如別處所述進行標準DNA程序(Sambrook et al. , 1989,Molecularcloning a laboratory manual,2nd Ed. , Cold Spring HarborLaboratory Press,ColdSpring Harbor,New York)。使用校正讀碼酶 Physion 聚合酶(Finnzymes)擴增 DNA。限制性酶來自 Invitrogen 或 NewEngland Biolabs0·
纖維素酶樣品的制備源自Talaromyces emersonii 的纖維素酶在 Aspergillus niger 中表達。如W02004/030468所述產生酶的濃縮濾液。在對含有合適的表達質粒的Aspergillus niger培養后,在4°C下在5000x g下通過對發酵液離心30分鐘,制備無細胞的上清液。任選的可用4N KOH將上清液調至pH = 5并且在2 μ m(瓶頂)過濾器上用抽吸無菌過濾以去除任何真菌材料。而且,上清液可進一步在GF/A Whatmann Glass微纖維過濾器(150mm 0 )上過濾以去除任何固體。將上清液超濾、濃縮并在4°C下存儲直至使用或在_20°C下冷凍。用于總蛋白測定的方法該方法是使用三氯乙酸(TCA)沉淀蛋白的組合,以去除干擾物質并允許用雙縮脲比色反應對蛋白濃度進行測定。在雙縮脲反應中,銅(II)離子被還原為銅(I),所述銅(I)離子在堿性溶液中與肽鍵的氮和碳形成復合物。紫色顏色表示存在蛋白。根據比爾-蘭伯特定律,顏色的強度與蛋白濃度成正比例,因而在546nm下的吸收與蛋白濃度成正比例。使用BSA(牛血清蛋白)進行標準化并且蛋白含量被表示為g蛋白(BSA當量)/L或被表示為mg蛋白(BSA當量)/ml。使用本領域中已知的標準計算方案計算蛋白含量,其通過繪制OD546對具有已知濃度的樣品的濃度的圖,隨后使用從校準線產生的方程計算未知濃度樣品來實現。用于測定β -葡糖苷酶活性的方法使用在pH 4. 5的50mM乙酸鈉緩沖液中的I. 5mM濃度的對硝基苯基-β -葡糖苷,來測定β_葡糖苷酶活性。在40°C下進行孵育30分鐘。使用IM的碳酸氫鈉停止反應。如本領域技術人員所已知的,從在405nm下測定的消光和堿性條件下對硝基酚的摩爾消光系數來計算活性。活性表示為每分鐘每ml釋放的μπιο ρΝΡ。用于β-葡糖苷酶活性測定的另一種備選方法是用在50mM乙酸鈉緩沖液中的IOmM纖維二糖對酶進行孵育。在40°C下30分鐘后,用氫氧化鈉停止反應。將樣品超濾并使用有脈沖的安培檢測(PulsedAmperometric Detection)的高效陰離子交換色譜(HPAEC-PAD)進行分析。應用在30°C下恒溫的CarboPac PA-20柱和以O. 5ml/min的流速的200mM NaOH,將葡萄糖和纖維二糖分離。β -葡糖苷酶活性以每分鐘每ml釋放的μ mo I葡萄糖表示。洗滌的預處理的小麥秸底物的制備可如Linde, M.et al, Biomass and Bioenergy 32 (2008), 326-332 中所述并且可使用如 Schell,D. J. ,Applied Biochemistry and Biotechnology(2003) ,vol. 105-108,pp69-85中所述的裝置,獲得稀酸預處理的小麥秸。用水洗滌預處理的小麥秸直到具有小麥秸的溶液的PH為6. O或更高。濾出洗滌水。纖維素的延長的水解以IOmL規模進行酶組合物對在pH 4. 5的50mM乙酸鈉緩沖液中的2%洗滌的酸預處理的小麥秸(PWS)干物質(dm)底物溶液的孵育。以相對于每克底物干物質固定的蛋白劑量添加酶組合物。按時取樣,直到在65°C下孵育72小時。在給定的時間處終止反應,隨后旋轉殘留物,吸取上清液并冷凍樣品直到分析。使用流動-NMR,進行釋放的葡萄糖量的分析。在質子頻率500MHz和探頭溫度27°C下操作的fcuker AVANCE II BEST NMR系統上記錄1HNMR光譜。·實施例II. I.表汰質粒的構律使用EcoRI和SnaBI位點將SEQ ID NO 1的序列克隆到pGBTOP載體中(圖I),其包含葡萄糖淀粉酶啟動子和終止子序列。在轉化A.nigerCBS 513. 88之前通過NotI消化除去大腸桿菌(E. coli)部分。L 2. L niger 的轉化A. niger WT-1 :該A. niger菌株是CBS 513. 88,其包含編碼葡萄糖淀粉酶(glaA)、真菌淀粉酶和酸性淀粉酶之基因的缺失。如EP O 635 574B1所述用“MARKER-GENE FREE”法構建 A. niger WT-1。根據Tilburn,J. et al. (1983) Gene 26,205-221 和 Kelly,J. & Hynes, Μ. (1985)EMBO J.,4,475-479所述方法,用表達載體共轉染A. niger WT-I菌株,其中進行以下修改-使孢子萌發并在30°C下在Aspergillus基本培養基(100ml)中在300rpm旋轉搖床中的搖瓶中培養16小時。Aspergillus基本培養基每升中含有6g NaNO3,0. 52g KCl, I. 52g KH2PO4,1. 12ml 4M Κ0Η,0. 52gMgS04. 7H20,IOg 葡萄糖,Ig 酪蛋白氨基酸,22mg ZnSO4. 7H20,1 ImgH3BO3, 5mg FeSO4. 7H20,1. 7mg CoCl2. 6H20,1. 6mg CuSO4. 5H20,5mgMnCl2. 2H20,1. 5mg Na2MoO4. 2H20, 50mg EDTA, 2mg 核黃素,2mg 硫胺-HC1, 2mg 煙酰胺,Img批哆醇-HCL,0. 2mg泛酸,4g生物素,10ml青霉素(5000IU/ml)鏈霉素(5000UG/ml)溶液(Gibco)。-用Novozym234 (Novo Industries)代替螺旋酶來制備原生質體;-形成原生質體(60-90分鐘)后,加入KC緩沖液(O.8M KCl, 9. 5mM檸檬酸,pH
6.2)至終體積為45ml,將原生質體懸液在吊桶式轉頭中在4°C下以3000rpm離心10分鐘。將原生質體重懸于20ml KC緩沖液中,隨后加入25ml STC緩沖液(I. 2M山梨醇,IOmMTris-HCl pH 7. 5,50mM CaCl2)。將原生質體懸液在吊桶式轉頭中在4°C下以3000rpm離心10分鐘,用STC緩沖液洗滌并以10E8原生質體/ml的濃度重懸于STC緩沖液中;-向200毫升原生質體懸液中,加入溶于IOmlTE緩沖液(IOmMTris-HCl pH 7. 5,0. ImM EDTA)和 100ml PEG 溶液(20% PEG 4000 (Merck), 0. 8M 山梨醇,IOmM Tris-HCl pH
7.5,50mM CaCl2)中的 DNA 片段;-將DNA-原生質體懸液在室溫下孵育10分鐘后,緩慢加入I.5ml PEG溶液(60%PEG 4000 (Merck), IOmM Tris-HCl pH 7. 5,50mMCaCl2),并將管反復混合。室溫孵育 20 分鐘后,用5ml I. 2M山梨醇稀釋懸液,顛倒混合并在室溫下以4000rpm離心10分鐘。將原生質體輕柔地重懸于Iml I. 2M山梨醇中,并涂板到固體選擇再生培養基上,該培養基由不含核黃素、硫胺HCL、煙酰胺、吡哆醇、泛酸、生物素、酪蛋白氨基酸和葡萄糖的Aspergillus基本培養基組成。對于乙酰胺選擇的情況,培養基含有IOmM乙酰胺作為唯一氮源和IM蔗糖作為滲壓劑和碳源。或者,將原生質體涂板到PDA(Potato Dextrose Agar, Oxoid)上,其中補充有1_50μ g/ml腐草霉素和IM蔗糖作為滲壓劑。用2%瓊脂(瓊脂No. I, OxoidLll)使再生平板固化。在30°C孵育6-10天后,將轉化體的分生孢子轉移至含有2%葡萄糖和1.5%瓊脂糖(Invitrogen)到Aspergillus選擇培養基(對于乙酰胺選擇的情況為含有乙酰胺作為唯一氮源的基本培養基,或者對于腐草霉素選擇的情況為補充1-50 μ g/ml腐草霉素到PDA)并在30°C下孵育5-10天。分離單個轉化體,將這種選擇純化步驟重復一次,之后保存純化的轉化體。轉化后,在含有乙酰胺作為唯一氮源的培養基上選擇轉化體并純化集落。通過定量PCR估計拷貝數,并選擇低和高拷貝數的轉化體。如EP635574所述,使用500ml帶擋板的搖瓶,在培養箱搖床中以34°C、170rpm將高拷貝數轉化體在搖瓶中培養在IOOml CSM-MES 培養基中。發酵3天和4天后,收獲上清液樣品以通過SDS-PAGE測定表達。I. 3蛋白含量對表達β-葡糖苷酶(TEMER02527)的轉化體的搖瓶發酵的超濾且濃縮的上清液分析蛋白含量。蛋白含量被測定為4mg蛋白(作為BSA當量)/ml。實施例22. I纖維素酶樣品的制備如針對TEMER02527的實施例I中所述的,分別制備都來自Talaromycesemersonii的纖維素酶增強蛋白——TEMER07589 (如在與本中請同日提交的共同待決專利中請DSM案號27666中所述的)和兩種外切葡聚糖酶——CBHII (如在與本中請同日提交的共同待決專利中請DSM案號27829中描述的)和在專利申請EP09158739. 4中描述的CBHI。測定這些樣品的蛋白含量,測得含量范圍從20mg至60mg蛋白(作為BSA當量)/ml。另外,β _葡糖苷酶TEMER02527 的最近的同源體之一,從Murrayet al. ,Protein expression andPurification, 2004, 38, 248-257 中已知的 Talaromyces emersonii 的另一 β -葡糖苷酶也在Aspergillus niger中過表達。將該β -葡糖苷酶表示為BG-TE。2. 2. 4種酶混合物的延長的水解以相對于混合物中總蛋白的9% TEMER02527,37% TEMER07589,30% CBHI 和 24%CBHII的相對量,將TEMER02527i3-葡糖苷酶與3種其他水解纖維素的蛋白混合。也用BG-TE制備類似的混合物,其中TEMER02527被BG-TE替代。將這些混合物在pH 4. 5和65°C下在有2% DM預處理小麥秸的以IOmL規模進行的延長的水解中應用。每一孵育中的總蛋白劑量為每克預處理的小麥秸干物質的15mg蛋白(作為BSA當量)。孵育持續72小時并在若干時間間隔下取樣。將樣品旋出,并將上清液冷凍直到通過NMR分析。葡萄糖和纖維二糖隨時間的釋放量在表I中示出。表I.通過含有相對于混合物的總蛋白的9%、30%、24%和37%的相對量的IBG (TEMER02527或BG-TE)、ICBHI、ICBHII、I纖維素酶增強蛋白的4種酶混合物,在pH 4. 5和65°C下對2% DM洗滌的預處理小麥秸孵育期間的葡萄糖和纖維二糖的釋放量,表示為mmol/L0
葡萄糖(mmol/L)纖維二糖(mmol/L)
3 h 21 H 45 H 72 H 3 H 21 h 45 H 72 h TEMER02527 ili 12.4 28.8 35.8 38,0 0.2 0.1 0.1 0.1
合物
ΙΚ. - :浞合物 Π 0 28.3 40 6 43 7 O O 0 2 0.1從該實驗清楚地看出,TEMER02527在有3種其他水解纖維素的蛋白的混合物中能 很好地將纖維素水解為葡萄糖。特別地,在孵育的最初2 Ih中,該β -葡糖苷酶和BG-TE —樣有效。
權利要求
1.多肽,其包含SEQID NO :2中示出的氨基酸序列或SEQ ID NO :1的核苷酸序列編碼的氨基酸序列,或其變體多肽或變體多核苷酸,其中所述變體多肽與SEQ ID NO :2中示出的序列具有至少96%的序列同一性,或所述變體多核苷酸編碼與SEQ ID NO 2中示出的序列具有至少96%序列同一性的多肽。
2.根據權利要求I所述的多肽,其中所述多肽具有β_葡糖苷酶活性。
3.多核苷酸,其包含 (a)SEQ ID NO :1中示出的核苷酸序列;或 (b)與是SEQID NO 1的反向互補體的多核苷酸選擇性雜交的核苷酸序列;或 (c)與SEQID NO : I的核苷酸序列具有至少83%序列同一性的核苷酸序列;或 (d)長度至少約100個核苷酸的(a)、(b)或(c)中定義的核苷酸序列的長度至少約100個核苷酸的片段;或 (e)序列,其是作為遺傳編碼的結果的(a)、(b)、(c)或(d)任一中定義的序列的簡并體;或 (f)核苷酸序列,其為(a)、(b)、(C)、(d)或(e)中任一項所定義的核苷酸序列的反向互補體。
4.根據權利要求3所述的多核苷酸,其編碼根據權利要求I或2所述的多肽。
5.根據權利要求3或4所述的多核苷酸,其為DNA序列。
6.包含根據權利要求3到5中任一項所述的多核苷酸的核酸構建體。
7.根據權利要求6所述的核酸構建體,其中GC含量為56%或更多,58%或更多,或從58%至 65%。
8.載體,其中包括根據權利要求3到5中任一項所述的多核苷酸序列。
9.細胞,其包含根據權利要求I或2所述的多肽、根據權利要求3到5中任一項所述的多核苷酸、根據權利要求6或7所述的核酸構建體或根據權利要求8所述的載體。
10.根據權利要求9所述的細胞,其中所述細胞是真核細胞。
11.根據權利要求10所述的細胞,其中所述細胞是真菌細胞。
12.根據權利要求11所述的細胞,其中所述真菌細胞選自由Aspergillus、Trichoderma/Hypocrea、Fusarium、Disporotrichum、Penicillium、Acremonium、Neurospora、Thermoascus、Myceliophtora、Sporotrichum、Thielavia、Chryosporium、Fusarium、Humicola、Neurospora 和 Talaromyces 屬構成的組。
13.根據權利要求12所述的細胞,其中所述真菌細胞是Aspergillusoryzae、Aspergillus so jae、Aspergillus nidulans 或 Aspergillus niger 的種。
14.根據權利要求9-13中任一項所述的細胞,其中一個或多個基因被完全或部分破壞、敲除或缺失,其中任選地所述基因編碼蛋白酶。
15.轉基因植物或其部分,其包含根據權利要求3-5中任一項所述的多核苷酸、根據權利要求6或7所述的核酸構建體、根據權利要求8的載體或根據權利要求9-14中任一項所述的細胞,其中任選地所述植物是玉米植物、高粱植物、番茄植物、小麥植物、油籽植物、油菜籽植物、大豆植物、大麥植物、草或煙草植物;或Anacardium、Arachis> ragus、Atropa、Avena、Brassica、Citrus、Citrullus、Capsicum、CarthamusΛ Cocos、Coffea、ferae、Cucumis、Cucurbita、Daucus、Elaeis、Fragaria、Glycine、Gossypium、Helianthus、Ocallis、Hordeum、Hyoscyamus> Lactuca、Linum、Lolium、Lupinus、Lycopersicon、Malus、Majorana、Medicago、Nicotiana、Olea、Oryza、Panieum、Pannisetum、Persea、eolus、Pistachio、Pisum、Pyrus、Prunus、Raphanus、Ricinus、Secale、Senecio、Sinapis、Sorghum、Theobromus> Trigonella、Triticum、Vicia、Vitis、Vigna 或 Zea 屬的植物。
16.用于制備根據權利要求I或2所述的多肽的方法,所述多肽具有降解碳水化合物材料和/或水解碳水化合物的活性,所述方法包括在允許所述多肽表達的條件下培養根據權利要求9到14中任一項所述的細胞,以及任選地,回收所表達的多肽。
17.組合物,其包含⑴根據權利要求I或2所述的多肽;和(ii)纖維素酶和/或半纖維素酶和/或果膠酶和/或屬于GH61家族的多肽。
18.根據權利要求17所述的組合物,其中所述纖維素酶是纖維二糖水解酶、纖維二糖水解酶I、纖維二糖水解酶11、內切-β -I,4-葡聚糖酶、β -葡糖苷酶或β - (I,3) (I,4)-葡聚 糖酶。
19.根據權利要求17或18所述的組合物,其中所述半纖維素酶是內切木聚糖酶、β_木糖苷酶、a-L-阿拉伯呋喃糖苷酶、a-D-葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿魏酸酯酶、香豆酸酯酶、α -半乳糖苷酶、β -半乳糖苷酶、β -甘露聚糖酶或β -甘露糖苷酶。
20.根據權利要求17到19中任一項所述的組合物,其中所述果膠酶是內切多聚半乳糖 醛酸酶,果膠甲基酯酶,內切-半乳聚糖酶,β -半乳糖苷酶,果膠乙酰基酯酶,內切-果膠裂合酶,果膠酸裂合酶,α -鼠李糖苷酶,外切-半乳糖醛酸酶,外切多聚半乳糖醛酸酯裂合酶,鼠李半乳糖醛酸聚糖水解酶,鼠李半乳糖醛酸聚糖裂合酶,鼠李半乳糖醛酸聚糖乙酰基酯酶,鼠李半乳糖醛酸聚糖半乳糖醛酸水解酶,木半乳糖醛酸酶,α -阿拉伯呋喃糖苷酶或內切-阿拉伯聚糖酶。
21.根據權利要求17到20中任一項所述的組合物,其包含木質酶、擴展蛋白、擴展蛋白樣 多肽、膨脹因子或編碼纖維素整合蛋白或纖維素誘導的蛋白質的基因的多肽產物。
22.用于處理包含碳水化合物材料的底物、任選地處理植物材料的方法,所述方法包括使所述底物與根據權利要求I或2所述的多肽和/或根據權利要求17到21中任一項所述的組合物接觸。
23.根據權利要求22所述的方法,其中所述底物是植物材料,所述植物材料以下述形式提供植物、植物漿體、植物提取物、食品或源于其的成分,或包含植物材料的織物、紡織品或衣物。
24.根據權利要求22和/或權利要求23所述的方法,其中所述處理包括纖維素和/或半纖維素和/或果膠物質的降解和/或改性。
25.根據權利要求I或2所述的多肽和/或根據權利要求17到21中任一項所述的組合物用于從木質-纖維素材料生產糖的用途。
全文摘要
本發明涉及多肽,所述多肽包含SEQ ID NO2中示出的氨基酸序列或SEQ ID NO1的核苷酸序列編碼的氨基酸序列,或其變體多肽或變體多核苷酸,其中變體多肽與SEQ ID NO2中示出的序列具有至少96%的序列同一性,或變體多核苷酸編碼與SEQ ID NO2中示出的序列具有至少96%序列同一性的多肽。本發明描述了新穎基因的全長編碼序列以及全長功能性多肽的氨基酸序列和所述基因或氨基酸序列的功能等同物。本發明還涉及在工業方法中使用所述多肽的方法。本發明還包括用根據本發明的多核苷酸轉化的適用于生產這些蛋白質的細胞。
文檔編號C12N9/24GK102958939SQ201180032518
公開日2013年3月6日 申請日期2011年6月23日 優先權日2010年6月29日
發明者瑪格特·伊麗莎白·弗蘭克希斯·休恩瓦爾德-貝格曼斯, 威爾伯特·赫爾曼·馬里·海涅, 羅波圖斯·安東尼厄斯·戴維爾德, 芮妮·馬賽爾·德·鐘 申請人:帝斯曼知識產權資產管理有限公司