專利名稱::新的內切木糖聚半乳糖醛酸酶的制作方法
技術領域:
:本發明涉及一種新的內切木糖聚半乳糖醛酸酶(endo-xylogalacturonase,XGH)及其同源物。本發明還涉及在植物和含果膠的物質加工方法中使用內切木糖聚半乳糖醛酸酶來生產果汁和其它植物提取物。
背景技術:
:酶制劑經常用于植物材料加工過程,例如在水果及果汁的提取和液化步驟以及它們的過濾和澄清步驟中。商業的酶制劑包括降解果膠聚合物的酶混合物,果膠聚合物是植物細胞壁的一種主要成分。這些酶類包括果膠裂解酶、多聚半乳糖醛酸酶、果膠酯酶、纖維素酶、木糖葡聚糖酶、半乳聚糖酶和阿聚糖酶(arabinanase)。果膠在本質上是作為高等植物細胞壁的組成成分出現的。它們存在于原生細胞壁薄層,并嵌入到纖維素纖維之間。在不同的植物種類中果膠的成分是不同的,而且與水果的年齡和成熟度有關。富含果膠的來源是檸檬和柑橘,它們的多糖含量可高達30%。大多數果膠聚合物包括“光滑”的同型聚半乳糖醛酸區域和分枝的“毛發”區域。“光滑的”區域由線性的同型聚半乳糖醛酸骨架組成。蘋果的“毛發”區域由三種不同的亞單位組成亞單位Ⅰ是木糖聚半乳糖醛酸(聚半乳糖醛酸骨架很大程度上被木糖取代了);亞單位Ⅱ是較短的鼠李糖聚半乳糖醛酸骨架部分,相對富含長的阿聚糖、半乳聚糖和/或阿拉伯半乳聚糖側鏈(“毛發”);亞單位Ⅲ是一種鼠李糖聚半乳糖醛酸寡聚物,含有一個交錯排列的鼠李糖和半乳糖醛酸殘基組成的骨架。許多眾所周知的用于工業食品加工的果膠酶僅降解果膠聚合物的“光滑”部分,而不降解“毛發”區域。因此,以蘋果汁生產過程為例,由于果膠聚合物的未降解部分造成過濾或超濾膜的堵塞,引起低效率過濾,造成生產損失。已有報道有幾種酶能降解部分毛發區,例如骨架(亞單位Ⅲ)的鼠李糖聚半乳糖醛酸區。這些酶被稱作鼠李糖聚半乳糖醛酸酶(RGase),其中這些酶有幾種類型。可是,至今“毛發”區域的木糖聚半乳糖醛酸部分(亞單位Ⅰ)仍抵抗酶的消化作用,因此,在現有技術的酶促內切消化過程中木糖聚半乳糖醛酸作為惰性糖類遺留下來。由于在其它植物,如豆科植物象大豆和豌豆、西瓜、葡萄和松花粉中也發現木糖聚半乳糖醛酸的存在,降解這些聚合物的酶在植物材料加工中將會有用。已經鑒定了一種外切聚半乳糖醛酸酶(42KDa,SDS-PAGE)1,它不被單一的木糖側鏈所干擾,用一種來自大豆的可溶“毛發”果膠多糖作為底物,可以降解木糖聚半乳糖醛酸。這種酶以外切的方式起作用,因為它產生半乳糖醛酸或由木糖和半乳糖醛酸組成的二糖。此酶已被純化到接近均一(組分HTP2和Q2),并進行了部分表征。與已知的鼠李糖聚半乳糖醛酸酶相比(不降解同型聚半乳糖醛酸),這種酶對于木糖聚半乳糖醛酸不是十分特異的,它也能作用于果膠酸。另外,這種酶不能以隨機的方式消化木糖聚半乳糖醛酸骨架,因此至今還未發現擁有內切木糖聚半乳糖醛酸酶活性的酶。
發明內容本發明來自于一種新的內切木糖聚半乳糖醛酸酶以及編碼它的cDNA的分離和表征。內切木糖聚半乳糖醛酸酶cDNA序列見SEQ.IDNo.1。來自核苷酸98-1315的ORF的氨基酸序列見SEQ.IDNo.2。本發明的第一部分提供了一種(例如分離和/或純化的)具有內切木糖聚半乳糖醛酸酶活性的多肽。還提供了一種包含內切木糖聚半乳糖醛酸酶的多肽,例如一種包含SEQ.IDNo.2所述序列的多肽,或一種與其基本上同源的多肽,或者至少有5個氨基酸的SEQ.IDNo.2的多肽的片段。優選地,本發明的多肽具有下列一種或多種附加特點,即(1)具有內切木糖聚半乳糖醛酸酶活性;(2)具有從2.5到6的最適pH值范圍;(3)在50℃到70℃的溫度具有最佳活性;和/或(4)具有從40到50Kda的分子量大小。“內切木糖聚半乳糖醛酸酶活性”定義為可以切割在內部糖苷鍵中至少部分被木糖取代的半乳糖醛酸聚合物(如在果膠中發現的)的能力。該活性由此允許切割非末端單元的相鄰聚半乳糖醛酸(沒有一個這樣的單位是存在于聚合物的末端,這與外切活性的末端單元可被裂解是相對的)。切割優選地發生在[半乳糖醛酸(1,4)半乳糖醛酸]鍵。優選地,多肽不能切割木糖取代的半乳糖醛酸殘基中末端的木糖殘基,例如[半乳糖醛酸(3-1)木糖]鍵。該多肽傾向于在兩個相鄰的非木糖取代的聚半乳糖醛酸單元間進行切割,底物聚合物中可被其它糖基單位(如木糖)取代40-80%。本發明所述多肽切割的兩個半乳糖醛酸殘基可以都被(木糖)取代,或者只有一個被(木糖)取代或者(優選地)均沒有被(木糖)取代。可選擇地或另外,兩個半乳糖醛酸殘基可以都被甲基化,或者有一個可被甲基化,或者(優選的)沒有被甲基化。優選地,本發明所述的多肽來自于微生物,它擁有編碼內切木糖聚半乳糖醛酸酶活性的一種酶的基因。更優選地,這種微生物是一種微生物體,優選地是真菌,理想地是絲狀真菌。優選的生物體是曲霉屬(Aspergillus)、木霉屬(Trichoderma)、青霉屬(Penicillium)、頂孢霉屬(Acremonium)、鐮孢霉屬(Fusarium)、腐質霉屬(Humicola)、脈孢菌屬(Neurospora)、毛霉屬(Mucor)、透明小柱霉屬(Scytallidium)、毀絲霉屬(Myceliophtora)、梭孢殼屬(Thielavia)、藍霉菌(Talaromyces)、Thermomyces、Thermoascus、毛殼屬(Chaetomium)、側孢霉屬(Sporotrichum)、Corynascus、Calcarisporiella或Mycelia的種。最佳的生物體是來自于黑曲霉的一些品種。(如Raper和Fennell定義,曲霉屬(Aspergillus),Williams&Wilkins公司,Baltimore,pp293-344,1965),特別地包括但是不限于黑曲霉、泡盛曲霉(Aspergillusawamori)、塔賓曲霉(Aspergillustubigensis)、棘孢曲霉(Aspergillusaculeatus)、臭曲霉(Aspergillusfoetidus)、日本曲霉(Aspergillusjaponicus)或無花果曲霉(Aspergillusficuum)。本發明的第二部分提供了一種(例如分離和/或純化)編碼本發明第一部分多肽的多核苷酸。例如,本發明提供了編碼內切木糖聚半乳糖醛酸酶的一種多核苷酸,這種木糖聚半乳糖醛酸酶的氨基酸序列見SEQIDNo2。本發明進一步提供了一種編碼具有與SEQIDNo2氨基酸序列基本上同源的氨基酸序列的多肽的多核苷酸。還提供了一種選自以下的多核苷酸(a)包含SEQIDNo1所示核苷酸序列或其互補序列的多核苷酸;(b)包含能夠與SEQIDNo1所示的核苷酸序列或其片段雜交的多核苷酸;(c)包含能夠與SEQIDNo1所示核苷酸序列或其片段的互補序列雜交的多核苷酸;和/或(d)包含能夠與(a)、(b)、(c)所定義的多核苷酸由于遺傳密碼的簡并性而與它們簡并的多核苷酸。本發明所述的多核苷酸也包括一種多核苷酸,其a.編碼一種擁有內切木糖聚半乳糖醛酸酶活性的多肽,該多核苷酸是(1)SEQIDNo1的編碼序列;(2)能夠選擇性地與(1)中定義的序列的互補序列雜交的序列;(3)與(1)或(2)中分別定義的序列由于遺傳密碼而簡并的序列;或b.與(a)中定義的多核苷酸互補的序列。“能夠雜交”一詞意思是本發明的靶多核苷酸能夠與用做探針的核酸(如SEQIDNo1中的核苷酸序列,或其片段或其互補序列)以顯著高于背景的水平雜交。發生背景水平的雜交可能因為例如,其它多核苷酸(象DNA分子)的存在,例如在篩選基因組或cDNA文庫。在這種情況下,背景是指發生在探針和文庫中的非特異性多核苷酸部分之間的相互作用所產生信號的水平,強度不超過與觀察到的靶多核苷酸特異相互作用的1/10,優選地不超過1/100。相互作用的強度可以進行測量,例如,采用放射性標記探針,如使用32P。將在后面描述適宜的條件。優選地,本發明的多核苷酸與多肽來自同一種生物體,例如真菌,特別是曲霉屬的真菌。本發明還提供了多核苷酸探針,其包含上述本發明多核苷酸的至少15個核苷酸片段。在第三部分,本發明提供了包含本發明所述多核苷酸的載體,包括克隆載體和表達載體,在第四部分生長的方法中,將這些載體轉化或轉染進合適的宿主細胞,例如在可表達本發明所述多肽或本發明中序列編碼多肽的條件下進行。第五部分提供的是包含本發明的多核苷酸或載體的宿主細胞,其中該多核苷酸與宿主細胞的基因組是異源的。“與宿主細胞的基因組是異源的”這個詞意思是多核苷酸天然不存在于宿主細胞的基因組中。優選地,宿主細胞是酵母細胞,例如克魯維酵母屬(Kluyveromyces)或酵母屬(Saccharomyces)的酵母細胞,或一種真菌細胞,例如曲霉屬的。具有內切木糖聚半乳糖醛酸酶活性的本發明的多肽可在第六部分中用于處理包括植物果肉和植物提取物的植物材料。例如,它們可用以在蘋果汁生產過程中處理蘋果果肉和/或原汁。本發明的多肽與合適的載體或包括緩沖液的稀釋液結合在一起,以產生一種組合物/酶制劑。這樣本發明在第七部分提供了一種包含本發明的多肽的組合物。此組合物還可包含另外的組分,諸如一種或多種酶,例如果膠酶,包括內切阿聚糖酶和鼠李糖聚半乳糖醛酸酶、纖維素酶和/或木糖聚半乳糖醛酸酶。因此,本發明的多肽和組合物可用在植物材料加工的方法中,來降解或修飾植物材料細胞壁的果膠組分。因此在第八部分,本發明提供了一種降解或修飾植物細胞壁的方法,此方法包括用本發明的多肽或組合物與植物細胞壁接觸。本發明還提供了一種加工植物材料的方法,此方法包括用本發明的多肽或組合物與植物材料接觸,以降解或修飾植物材料中的果膠。優選地,植物材料是植物果肉或植物提取物。尤其是,降解優選地包括對植物細胞壁的果膠成分之木糖聚半乳糖醛酸酶亞單位的內切型剪切。優選地,植物材料是水果或蔬菜果肉,或是水果或蔬菜提取物,例如,蘋果果肉或蘋果汁。本發明還提供了一種通過用本發明的多肽或組合物與植物材料接觸而得到的加工的植物材料。優選地,加工的植物材料是水果或蔬菜汁,例如蘋果汁。本發明也提供了一種減少植物提取物粘度的方法,此方法包括用有效量的本發明的多肽或組合物與植物提取物接觸,以降解含在該植物提取物中的果膠。本發明的一部分優選的特點和特性對其它方面也是適用的。發明詳述A.多核苷酸本發明提供了一種多核苷酸,其a.編碼一種具有內切木糖聚半乳糖醛酸酶活性的多肽,此多核苷酸是(1)SEQIDNo.1的編碼序列;(2)可選擇性地與(1)中定義的序列之互補序列雜交的序列;或(3)由于遺傳密碼的簡并性與(1)或(2)中定義的核酸序列簡并的序列;或b.是一段與(a)中所述的多核苷酸互補的序列。本發明的多核苷酸也包括具有內切木糖聚半乳糖醛酸酶活性的SEQIDNo.1的編碼序列的變異體。變異體可由添加、替換和/或缺失形成的。因此這些變異體可具有在內部剪切半乳糖醛酸聚合物的能力。通常本發明的多核苷酸包含連續的核苷酸序列,其在選擇性條件下能與SEQIDNo.1的編碼序列的互補序列雜交。本發明的多核苷酸及SEQIDNo1編碼序列的互補序列可以以顯著高于背景的水平雜交。可能會發生背景雜交,例如,由于在cDNA文庫中其它cDNA的存在。本發明的多核苷酸與SEQIDNo1編碼序列的互補序列之間相互作用所產生的信號水平一般比其它序列與SEQIDNo1編碼序列之間相互作用所產生信號至少強10倍,優選地至少強100倍。相互作用的強度可以測定,例如采用如32P標記放射性探針。一般可采用低嚴謹條件(例如,0.03M氯化鈉,0.03M檸檬酸鈉,在約40℃)、中等嚴謹條件(例如,0.03M氯化鈉,0.03M檸檬酸鈉,在約50℃)和高嚴謹條件(例如,0.03M氯化鈉,0.03M檸檬酸鈉,在約60℃)可以實現選擇性的雜交。一個優選的能夠與SEQIDNo1的DNA序列之互補序列選擇性雜交的多核苷酸與SEQIDNo1的編碼序列一般存在至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%或至少99%的相同性。覆蓋的區域至少有20個,優選地是至少30個,例如至少40個、至少50個、至少60個或優選至少100個連續的核苷酸,或者最優選地是覆蓋SEQIDNo1的全長。上述任何不同的序列相同性和最小的長度間的組合都可以用來定義本發明的多核苷酸,優選地采用更嚴格的組合(指更高的序列相同性覆蓋更長的長度),例如超過25個,優選地超過30個核苷酸的序列相同性至少90%的一段多核苷酸,或者超過40個核苷酸具有至少達到95%序列相同性的一段多核苷酸。可以通過核苷酸置換的方法修飾SEQIDNo1的編碼序列,例如從1個、2個、3個到10個、25個、50個或100個核苷酸置換。SEQIDNo1的多核苷酸還可以通過一個或多個插入和/或刪除(如與上述置換的數目相同)和/或在一個末端或兩個末端的延伸而被修飾。被修飾的多核苷酸一般編碼具有內切木糖聚半乳糖醛酸酶活性的多肽。當被修飾的序列被翻譯后,簡并性的置換和/或置換可導致保守氨基酸的置換,例如在第11頁的表中有關多肽的部分。本發明所述多核苷酸可包括DNA或者RNA。它們可能是單鏈或雙鏈。它們也可是內部包括人工合成或修飾的核苷酸的多核苷酸,現有技術已知可以對多核苷酸進行多種不同類型的修飾,包括膦酸甲酯骨架和硫代磷酸酯(phosphorothioate)骨架,在分子的3’-和/或5’-末端增加吖啶或多聚賴氨酸鏈。為了本發明的目的應該可以理解,這里所描述的多核苷酸可以被任何本領域現有的方法所修飾。可以理解本領域熟練技術人員可以使用常規的技術,進行不影響本發明所述多核苷酸編碼的多肽序列的核苷酸置換,以反映任何待表達本發明多肽的宿主生物的密碼子偏好性。本發明所述的多核苷酸也可以用做引物(例如PCR引物),用于其它擴增反應的引物,用做探針,例如采用常規的放射性或非放射性方法標記的顯示性探針,或者此多核苷酸可以被克隆到載體中。這類引物、探針和其它片段的長度至少在15個,優選地至少20個,例如至少25個、30個或40個核苷酸。一般可以達到40個、50個、60個、70個、100個或150個核苷酸的長度。探針和片段的長度可以超過150個核苷酸,例如200個、300個、400個、500個、600個、700個核苷酸長度,甚至達到僅比SEQIDNo1的編碼序列短幾個核苷酸(如5個或10個核苷酸)。本發明的多核苷酸(象DNA)和引物可由重組、合成制備或通過在本領域技術人員可用的技術等任何方法產生。它們也可用標準的技術進行克隆。多核苷酸通常以分離和/或純化的形式提供。一般地,引物將通過合成的方式生產,包括一次一個核苷酸的目的核酸序列的分步操作。用自動化技術完成這些任務的方法在本領域中是可得的。較長的多核苷酸通常用重組的方法制備,例如用PCR(聚合酶鏈式反應)克隆技術。這涉及根據待克隆的內切木糖聚半乳糖醛酸酶基因的區域設計一對引物(例如,約15-30個核苷酸的一對),將引物與從真菌、酵母、細菌植物或原核細胞中獲得的mRNA或cDNA相接觸,在能發生目的區域擴增的條件下進行聚合酶鏈式反應,分離擴增的片段(例如,通過在瓊脂糖凝膠上純化反應混合物)以及回收擴增的DNA。引物應設計成含合適的限制性酶切位點,以使擴增的DNA能克隆到合適的克隆載體中。這種技術可用來獲得此處所述的全部或部分內切木糖聚半乳糖醛酸酶序列。對應于SEQIDNo.1的cDNA或內切木糖聚半乳糖醛酸酶基因的基因組克隆,包含例如內含子和啟動子區域包括在本發明之內,其也可用類似的方式(如重組方法、PCR、克隆技術)從來自真菌、酵母、細菌植物或原核細胞的基因組DNA獲得。盡管此處所述的技術是本領域熟知的,可參考一些文獻尤其是Sambrook等,分子克隆,實驗室手冊(MolecularCloning,ALaboratoryManual)(1989)和Ausubel等,現代分子生物學方法(CurrentProtocolsinMolecularBiology)(1995),JohnWileySons,Inc。與SEQIDNo.1沒有100%相同性但落在本發明范圍內的多核苷酸可用許多方法獲得。這樣,此處所述的內切木糖聚半乳糖醛酸酶的變異體可通過,諸如探查來自一定范圍生物體的基因組DNA文庫,例如那些作為本發明的多肽來源的生物體的方法來獲得。另外,也可獲得其它真菌、植物或內切木糖聚半乳糖醛酸酶的原核同源物,并且這些同源物和其片段,其一般能與SEQIDNo.1雜交。這些序列可通過探查來自其它種的cDNA文庫或基因組文庫來獲得,并且在中等到高嚴謹條件下(例如,0.03M氯化鈉,0.03M檸檬酸鈉,在50℃-60℃)用包含所有或部分SEQIDNo.1的探針探查這些文庫。包含所有或部分SEQIDNo.1的核酸探針可用來探查來自其它種的cDNA文庫,例如那些描述的作為本發明的多肽來源的品種。種同源物也可用簡并PCR獲得,此PCR用設計在編碼保守氨基酸序列的變異體和同源物之間的靶序列的引物。此引物包括一種或多種簡并性位點,可使用比采用針對已知序列的單一序列引物克隆序列時所用條件低的嚴謹條件。或者,這類的多肽可以通過對內切木糖聚半乳糖醛酸酶或其變異體進行定點誘變方法來獲得。例如,在需要序列沉默密碼子改變,以優化表達該多核苷酸序列的特定宿主細胞的密碼子偏好中是有益的。為了引入限制性酶內切位點,或者,為了改變由該多核苷酸編碼的多肽的性質或功能也需要一些其它的序列改變。本發明包含帶有本發明的多核苷酸及其互補序列的雙鏈多核苷酸。本發明所述的多核苷酸或引物可帶有一種顯示標記。適宜的標記包括如32P和35S的放射性同位素標記、酶標、或者其它蛋白質標記,如生物素和DIG-半抗原。這些標記可以添加到本發明所述的多核苷酸或引物上,并可以采用自知的技術進行檢測。本發明還提供了下述編碼本發明多肽的多核苷酸。由于這些多核苷酸序列可用于重組生產本發明所述的多肽,因此不需要這些序列具有與SEQIDNo1雜交的能力,雖然一般需要這種能力。另外,這些多核苷酸可被標記,如需要可如上制得。B.多肽本發明的多肽包含SEQIDNo2所示的氨基酸序列或者基本上同源的序列,或者任一序列的片段,其可具有內切木糖聚半乳糖醛酸酶活性。一般來講,SEQIDNo2所示的天然存在的氨基酸序列是優選的。特別是,本發明所述的多肽可包括a.SEQIDNo2所述的多肽序列;b.天然存在的變異體或不同物種間的其同源序列;或者c.與(a)或(b)所述的序列存在至少60%、至少70%、至少80%、至少90%、至少95%、至少98%或至少99%序列相同性的蛋白質。變異體可以是,例如在真菌、細菌、酵母或者植物細胞中天然存在的。其可以以與SEQIDNo2的蛋白質基本上相同的方式發揮功能。同樣,一種蛋白質種間同源物應該是在另一物種中天然存在的等效蛋白質,其具有內切木糖聚半乳糖醛酸酶活性。變異體和種間同源物可以在適宜的細胞中,例如細菌、酵母、真菌或植物細胞中通過下述的步驟生產SEQIDNo2多肽而獲得。也可以用上述的探針探查酵母、細菌、真菌或植物細胞文庫來獲得包括變異體和種間同源物在內的克隆。該克隆可經常規操作來通過自知的重組或合成技術以生產本發明所述的多肽。優選地,本發明所述多肽與SEQIDNo2的蛋白質具有至少60%的相同性,更加優選地是至少70%、80%、90%、95%、97%或至少99%的序列相同性。覆蓋的長度至少應達到20個連續的氨基酸,優選地是至少30個,例如至少40個、60個、100個、200個或300個連續的氨基酸,或者達到SEQIDNo2的全長。可以通過對SEQIDNo2多肽的序列及其變異體和種間同源物進行修飾來提供本發明的多肽。可以進行氨基酸的置換,例如從1個、2個或3個到10個、20個到30個置換。也可以進行同樣數目的插入或缺失。修飾后的多肽一般保留內切木糖聚半乳糖醛酸酶的活性。按照下表可以進行保守的置換,位于表中第二欄同一區的,優選的第三欄中同一行的氨基酸間可以相互置換。本發明所述多肽還包括上述全長多肽及其變異體的片段,包括SEQIDNo2所示序列的片段。這類片段一般保留了內切木糖聚半乳糖醛酸酶的活性。片段可至少有10、15、20、30、50、100或200個氨基酸的長度。本發明所述多肽可以為基本上分離的形式。可以理解,該多肽在與不影響其特定目的的載體或稀釋液混合時也可以被認為是基本上分離的。本發明所述的多肽也可以處于基本上純化的形式,本發明所述多肽一般在制劑的多肽中應包含超過50%,例如超過80%、90%、95%、98%或99%(以重量計)的本發明的多肽。也可以對本發明所述多肽進行化學修飾,例如翻譯后修飾,例如可以被糖基化(一次或多次)或者包含一個或多個被修飾的氨基酸殘基。也可以通過添加組氨酸殘基或T7標簽來修飾這些多肽,從而幫助鑒定和純化它們,或者通過增加信號肽序列促進它們從細胞中的分泌,下面將進行討論。如果需要,本發明所述多肽可以通過合成的方法進行生產,盡管通常是采用下面將要討論的重組方法制造。特別優選的本發明所述多肽包括由SEQIDNo2中所示氨基酸序列的第19~406氨基酸組成的多肽,因為它不含有構成SEQIDNo2中第1~18氨基酸的N-末端信號肽。這些多肽及其片段可以含有前面所定義的氨基酸變化。在重組表達生產本發明多肽時使用酵母和真菌宿主細胞,預計可以提供最佳生物學活性所需要的翻譯后修飾(例如,蛋白水解加工、豆蔻酰化、糖基化、截短和酪氨酸、絲氨酸或蘇氨酸磷酸化)。C.重組方面本發明所述多核苷酸可以被摻入到一個重組可復制性載體,例如一種克隆或表達載體中。載體可以在適宜的宿主細胞中用于復制該核酸分子。因此在又一實施方案中,本發明提供了一種制備本發明多核苷酸的方法,包括將本發明所述多核苷酸引入一種可復制的載體,將載體導入一種相容性宿主細胞,在一定條件下培養宿主細胞以使載體復制。可從宿主細胞中回收載體。適宜的宿主細胞將與表達載體一起在下一部分進行描述。表達載體優選地,本發明所述的多核苷酸在載體中是與一種調控序列有效地連接的,該調控序列能使宿主細胞表達編碼序列,即載體是表達載體。“有效地連接”一詞的意思是指所描述的成分在位置上相鄰并允許它們以預定方式發揮它們的功能。一種調控序列,例如啟動子、增強子或其它表達調控信號與編碼序列“有效地連接”,將其放在合適的位置,使得編碼序列能夠在與控制序列相適合的條件下實現表達。載體可以是,例如帶有復制起始位點、任選地表達本發明多核苷酸的啟動子和任選地的啟動子調控區域的質粒、病毒或噬菌體載體。編碼該多肽的DNA序列可被導入合適的宿主細胞作為表達構建體的一部分,其中該DNA序列可與能夠指導宿主細胞中的DNA序列表達的表達信號有效地連接。將此表達構建體轉化合適的宿主之轉化步驟對于本領域熟練人員來說是很熟悉的3,4。此表達構建體可用于轉化宿主,做為攜帶一種選擇性標記的載體的一部分,或者此表達構建體作為單獨的分子與攜帶一種選擇性標記的載體一起共轉化。載體可包括一種或多種選擇性標記基因。優選的選擇性標記3,4包括但并不局限于諸如能用于轉化大部分絲狀真菌和酵母的通用標記基因,如乙酰胺酶基因或cDNA(來自構巢曲霉(A.nidulans)、或米曲霉(A.oryzae)或黑曲霉的amdS基因或cDNA)、或是提供抵抗象G418、潮霉素、腐草霉素或苯菌靈抗性(benA)的基因。另外,可使用更多的特異性選擇性標記,例如需要相應突變的宿主菌株的營養缺陷型標記例如URA3(來自釀酒酵母或來自其它酵母的類似基因)、pyrG(來自構巢曲霉或黑曲霉)或argB(來自構巢曲霉或黑曲霉)。在一種更優選的實施方案中,根據EP-A-0635574中所述的方法,將表達構建體導入后把選擇性標記從轉化的宿主細胞中刪除,從而獲得能生產不含選擇性標記的多肽的轉化宿主細胞。其它標記包括ATP合成酶、亞單位9(oliC)、乳清酸核苷-5’-磷酸-脫羧酶(pvrA)、細菌G418抗性基因(這也可用于酵母,但不能用于真菌)、氨芐青霉素抗性基因(用于大腸桿菌),新霉素抗性基因(芽孢桿菌)以及大腸桿菌uidA基因,編碼β-葡糖醛酸酶(GUS)。載體可用于體外,例如用于制備RNA或用于轉染或轉化宿主細胞。對于大多數的絲狀真菌和酵母,優選的表達構建體是整合到宿主細胞基因組中以獲得穩定的轉化。但是,對于某些酵母來講,也有合適的附加型載體系統,其中可摻入此表達構建體用于穩定的和高水平的表達。其中的實例包括分別衍生自酵母屬和克魯維酵母屬的21μ和pKD1質粒的載體。對于整合于宿主細胞基因組中的表達構建體,表達構建體可以整合在基因組的隨機位點,或利用同源重組方法整合于預定的靶位點,優選的靶位點包含一個高表達基因。在這里定義的一個高表達基因,其mRNA例如在誘導條件下至少應占細胞總mRNA量的0.05%(w/w),或者其基因產物至少占細胞總蛋白量的1%(w/w),或者,對于分泌的基因產物,分泌的水平至少達0.1g/L。這里隨后將提供許多合適的高表達基因的例子。對于一種給定的宿主細胞之表達構建體,通常包含下列(按照相對于第一部分中編碼所述多肽的編碼鏈5’-末端到3’-末端方向)有效地連接的元件(1)在給定的宿主細胞中能指導編碼所述多肽的DNA序列轉錄的啟動子序列;(2)任選的,一個可以在給定的宿主細胞中指導所述多肽分泌到培養基中的信號肽序列;(3)編碼成熟和優選的活性形式多肽的DNA序列,以及優選地(4)能在編碼所述多肽的DNA序列下游終止轉錄的轉錄終止區(終止子)。通過選擇異源的調控區,例如啟動子、分泌信號肽和終止子等用于提高表達水平的區域,可以實現編碼本發明所述多肽之多核苷酸的增強表達,如果需要,也可以提高在已選擇的表達宿主中目的蛋白的分泌水平和/或提供本發明所述多肽表達的可誘導的控制。除編碼本發明所述多肽基因的天然啟動子,其它的啟動子也可以用于指導本發明所述多肽的表達。可以按照在所需表達宿主中指導本發明所述多肽的表達效率來選擇啟動子。可用多種3,4可在宿主細胞中指導本發明所述多肽的轉錄的啟動子。優選地,啟動子序列來自于前面定義的高表達基因。啟動子所來自的高表達基因例子優選地來自和/或包含在用于表達構建體整合的預定的靶位點中,包括但不僅限于編碼糖酵解酶的基因,如丙糖磷酸異構酶(TPI)、磷酸甘油醛脫氫酶(GAPDH)、磷酸甘油酸激酶(PGK)、丙酮酸激酶(PYK)、乙醇脫氫酶(ADH)以及編碼淀粉酶、葡糖淀粉酶、木糖酶、纖維二糖水解酶、β-半乳糖苷酶、乙醇(甲醇)氧化酶、延伸因子和核糖體蛋白的基因。特異合適的高表達基因的例子包括來自例如克魯維酵母屬的種的LAC4基因、分別來自漢遜酵母屬(Hansenula)和畢赤酵母屬(Pichia)的種的甲醇氧化酶基因(AOX和MOX)、來自黑曲霉和泡盛曲霉的葡糖淀粉酶(glaA)基因、米曲霉TAKA-淀粉酶基因、構巢曲霉的gpdA基因和T.reesei的纖維二糖水解酶基因。可以在真菌表達宿主中使用的強組成型和/或誘導型表達啟動子的例子有獲自真菌基因的木糖酶(xlnA)、植酸酶、ATP合成酶、亞基9(oliC)、磷酸丙糖異構酶(tpi)、乙醇脫氫酶(AdhA)、α-淀粉酶(amy)、淀粉葡萄糖苷酶(AG-來源于glaA基因)、乙酰胺酶(amdS)和甘油醛-3-磷酸脫氫酶(gpd)等啟動子。強的酵母啟動子的例子有來源于乙醇脫氫酶、乳酸酶、3-磷酸甘油酸激酶和磷酸丙糖異構酶等基因的啟動子。強的細菌啟動子的例子是α-淀粉酶和SPO2的啟動子,以及來自細胞外蛋白酶基因的啟動子。宿主細胞和表達優選地,多肽以一種分泌蛋白的形式產生,在此情況下,編碼表達構建體中多核苷酸的成熟形式的DNA序列有效地與編碼信號序列的DNA序列連接。優選地,信號序列對于編碼多肽的DNA序列是天然的(同源的)。另外,信號序列對于編碼多肽的DNA序列是外來的(異源的),在此情況下信號序列對于在其中表達DNA序列的宿主細胞優選是內源的。合適的酵母宿主細胞的信號序列的例子是來自酵母α-因子基因的信號序列。同樣地,一種適于絲狀真菌的信號序列是例如來自絲狀真菌葡糖淀粉酶基因(如黑曲霉glaA基因)。這可與淀粉葡糖苷酶(AG)啟動子自身一起使用,也可與其它啟動子聯合使用。雜合信號序列也可用在本發明的范圍之列。優選的異源分泌引導序列有來源于真菌的淀粉葡糖苷酶(AG)基因(glaA-18和24個氨基酸的版本,例如來自曲霉屬的)、α-因子基因(例如酵母屬和克魯維酵母屬的)或者α-淀粉酶基因(芽孢桿菌屬)。在編碼本發明多肽DNA序列的下游,表達構建體優選地包含一個3’-非翻譯區,其中帶有一個或更多的轉錄終止位點,也稱為終止子。終止子的來源并不關鍵。終止子可以是對于編碼本發明多肽DNA序列為天然的終止子。但是優選地,在酵母宿主細胞中使用酵母終止子及在真菌宿主細胞中使用真菌終止子。更優選地,終止子對于在其中表達編碼本發明所述多肽的DNA序列的宿主細胞來講應是內源的。另一方面,本發明提供了按照本發明制備多肽的方法,包括在可使帶有編碼本發明所述多肽的編碼序列的載體表達的條件下,培養已被前述表達載體轉染或轉化的宿主細胞,以及回收表達的多肽。另一方面,本發明還提供了被包含本發明所述多核苷酸或載體轉染或轉化的宿主細胞。優選地,本發明多核苷酸攜帶于一個載體中以便復制和表達。應選擇與上述載體相容性的細胞,例如原核細胞(如細菌)、真菌、酵母或植物細胞。根據編碼本發明多肽的多核苷酸的特點,和/或表達蛋白的進一步加工的需要,優選的可是真核宿主細胞,如酵母或真菌。一般來說,酵母細胞優于真菌細胞,因為它們易于操作。但是,一些蛋白質難以從酵母細胞中分泌,或者在某些情況下不能正確加工(例如在酵母細胞中的過度糖基化)。在這些情況下,應選擇真菌宿主機體。當本發明多肽要以基本上無其它果膠降解酶的形式表達,也可以選擇異源宿主。可以通過選擇一般不產生這些酶類的宿主來達到這一要求,例如乳酸克魯維酵母(Kluyveromyceslactis)。本發明包括通過重組表達編碼多肽的DNA序列的方法生產本發明的多肽的過程。為此目的,本發明的DNA序列可用于基因擴增和/或表達信號的交換,例如啟動子、分泌信號序列,從而在同源的或異源的宿主細胞中允許經濟的多肽生產。此處的同源宿主細胞定義為一種與DNA序列所衍生的種類為同一種或同一種的變異體的宿主細胞。合適的宿主細胞最好是原核微生物例如細菌、或更優選地是真核生物體,例如真菌,諸如酵母或絲狀真菌、或植物細胞。來自芽孢桿菌屬的種的細菌由于其能分泌蛋白質進入培養液,其作為異源宿主是非常合適的。其它合適的作為宿主的細菌是那些來自鏈霉菌屬(Streptomyces)和假單胞屬(Pseudomonas)的細菌。一種優選的表達編碼多肽的DNA序列的酵母宿主細胞是來自酵母屬、克魯維酵母屬、漢森酵母屬、畢赤酵母屬、Yarrowia和裂殖酵母屬(Schizosaccharomyces)。更優選地酵母宿主細胞是選自下列屬的種釀酒酵母、乳酸克魯維酵母(也稱作馬克思克魯維酵母乳酸變種(Kluyveromycesmarxianusvar.1actis))、多形漢森酵母(Hansenulapolymorpha)、畢赤巴斯德酵母(Pichiapastoris)、Yarrowialipolytica和粟酒裂殖酵母(Schizosaccharomycespombe)。然而最優選地表達編碼多肽的DNA序列的是絲狀真菌宿主細胞。優選的絲狀真菌宿主細胞選自下列屬的種曲霉屬、木霉屬、鐮孢霉屬、青霉屬、頂孢霉屬、脈孢菌屬、Thermoascus、毀絲霉屬、側孢霉屬、梭孢殼屬和Talaromyces。更優選地,絲狀真菌宿主細胞是屬于米曲霉、醬油曲霉(Aspergillussojae)、構巢曲霉,來自黑曲霉群的種(由Raper和Fennell定義,曲霉屬,Willians&Wilkins公司,Baltimore,pp293-344,1965)。這包括但并不局限于黑曲霉、泡盛曲霉、塔賓曲霉、棘孢曲霉、臭曲霉、構巢曲霉、日本曲霉、米曲霉和無花果曲霉,并進一步包括Trichodermareesei、禾本科鐮孢(Fusariumgraminearum)、產黃青霉(Penicilliumchrysogenum)、Acremoniumalabamense、紅色脈孢霉(Neurosporacrassa)、Myceliophtorathermophilum、Sporotrichumcellulophilum和Thielaviaterrestris。本發明范圍內優選的表達宿主的例子是真菌,例如曲霉屬的種(描述于EP-A-184438和EP-A-284603)和木霉屬的種;諸如芽孢桿狀屬的種的細菌(描述于EP-A-134048和EP-A253455),例如,枯草芽孢桿菌、地衣芽孢桿菌(Bacilluslicheniformis)、液化淀粉芽孢桿菌(Bacillusamyloliquefaciens)、假單胞菌屬的種;以及酵母,例如克魯維酵母屬的種(描述于EP-A-096430,例如乳酸克魯維酵母和EP-A-301670)和酵母屬的種,例如釀酒酵母。宿主細胞培養和重組生產根據本發明,本發明的多核苷酸的生產可受到培養的微生物表達宿主的影響,該表達宿主已被一種或多種本發明的多核苷酸轉化,且在常規營養發酵培養基培養。根據本發明的重組宿主細胞可用本領域熟知的步驟培養。對于各個啟動子和宿主細胞的組合,有益于編碼多肽的DNA序列表達的培養條件是可用的。當達到所需的細胞密度或多肽效價即停止培養,并用已知的步驟回收多肽。發酵培養基可包括含有碳源(例如葡萄糖、麥芽糖、糖蜜等)、氮源(例如硫酸銨、硝酸銨、氯化銨等)、有機氮源(例如酵母提取物、麥芽提取物、蛋白胨等)以及無機營養源(例如磷酸、鎂、鈉、鋅、鐵等)的已知培養基。任選地,也可包括誘導劑(例如蘋果MHR、果膠或木糖聚半乳糖醛酸)。選擇合適的培養基可根據選擇的表達宿主細胞和/或根據表達構建體的調控需要。這些培養基為本領域技術人員所熟知。如果需要,培養基可包含附加的組分以有利于轉化的表達宿主對抗其它潛在的污染性微生物。發酵可進行的時間為0.5-20天,以分批、連續的或分批補料的操作形式在0-45℃的溫度范圍是合適的,例如,在2和10之間的pH。優選的發酵條件是溫度在20和37℃范圍內和/或在3和9之間的pH。合適的條件通常是根據表達宿主和要表達的蛋白質而選擇的。發酵后,可通過離心或過濾將細胞從發酵肉湯中除去。除去細胞后,本發明的多肽可回收,若需要的話,用常規方法純化和分離。D.植物或含果膠材料的加工方法植物和含果膠的材料包括植物果肉、植物的部分和植物提取物。在本發明的范圍中,植物材料的提取物是能通過提取(機械的和/或化學的)、加工或通過其它分離技術而得的任何來源于植物材料的物質。提取物可以是汁液、花蜜、基料(base)或由它們制得的濃縮物。植物材料可包括或來自蔬菜,例如,胡蘿卜、芹菜、洋蔥、豆莢或豆類植物(大豆、黃豆、豌豆)或水果,例如,梨果或種子水果(蘋果、梨、溫柏等)、葡萄、西紅柿、柑橘類植物(橘子、檸檬、酸橙、中國柑桔)、瓜類、李子類、櫻桃、黑醋栗,紅醋栗、覆盆子、黑莓、大果越桔、鳳梨和其它熱帶水果、樹和其部分(例如來自松樹的花粉)。根據本發明,蘋果和蘋果汁是特別優選的。本發明的多肽可由此用于處理包括植物果肉或植物提取物的植物材料。舉例來說,在蘋果汁的生產過程中它可用于處理蘋果果肉和/或原果汁。它們還可用于處理液態物質或固體食品或可食用的食品成分。通常,本發明的多肽與合適(固體或液體)的載體或包括緩沖液的稀釋劑一起使用,以產生一種組合物或酶制劑。多肽通常以液體或干粉形式穩定地配制。通常,產物制成一種任選地包含例如穩定緩沖液和/或防腐劑的組合物。組合物還可包括其它能消化植物材料或果膠的酶,例如其它果膠酶,諸如內切-阿聚糖酶、鼠李糖聚半乳糖醛酸酶、和/或多聚半乳糖醛酸酶。對某些應用,在固體基質上酶的固定或與固體載體顆粒結合或進入固體載體顆粒是優選的。組合物也可包括多種其它降解植物材料的酶,例如纖維素酶和其它果膠酶。因此本發明的多肽和組合物可用于植物材料加工方法中,以降解或修飾植物材料細胞壁的果膠成分2。通常,本發明的多肽被用做如上所述的組合物/酶制劑。此組合物一般被加入如用機械加工(象粉碎或壓榨)得到的植物果肉中。將組合物和植物一起孵育,通常進行10分鐘到5小時,諸如30分鐘到2小時,最好是約1小時。優選地,加工溫度為10-55℃,例如從15-25℃,最合適地,大約20℃,并且每噸要處理的物質可用10-300g,優選地30-70g,最合適地大約50g的酶。所有的酶或其組合物可按順序或同時加入到植物果肉中。根據酶制劑的組合物,植物材料可首先被浸軟(呈濃湯狀)或液化。使用本發明的多肽加工參數例如提取的產量、提取物的粘度和/或提取物的質量可得到提高。另外,或除上所述,本發明的多肽可加入到來自壓榨或液化植物果肉得到的原汁中。關于劑量、溫度、保持時間方面,處理原汁和處理植物果肉的方式是類似的。此外,其它的酶,例如那些前面討論過的酶也包括在內。通常的孵育條件和前面段落描述的相同。原汁和本發明的多肽一起孵育后,果汁經離心或(超濾)過濾以生產出終產品。含有本發明的多肽的組合物也可在水果或蔬菜汁的制備過程中使用。這些步驟的終產物通常在85℃熱處理1分鐘到1小時的一段時間,在部分或完全滅活本發明多肽的條件下進行。由于對果膠的高度特異作用,本發明的多肽也可用于制備具有修飾的特性的果膠,例如,用于特殊應用的修飾的凝膠化能力。本發明的多肽也可加入富含果膠或木糖聚半乳糖醛酸的動物飼料,例如含大豆的食物中,以改進植物細胞壁的破碎,從而提高動物對植物營養的利用。如果預浸透或流質食品是優選的,本發明的多肽可添加到飼料或貯藏的飼料中。有利地,本發明的多肽可繼續在體內降解食物中的木糖聚半乳糖醛酸。本發明真菌來源的多肽一般有最合適的較低的pH,并能在象動物的胃這樣的酸性環境中釋放出重要的營養物質。因此本發明也構思了包括一種或多種本發明的多肽的(如動物)飼料或糧食。本發明的多肽也可用在從大豆中生產牛奶的替代品(或替代物)的過程中。這種牛奶的替代品人和動物都可使用。在制備這些牛奶替代品的過程中通常的一個問題是大豆漿液的高粘度,導致需要不希望的對漿液稀釋到干固體10-15%的濃度。包含本發明多肽的酶制劑可加入,或在漿液的加工過程中加入,能使在一種較高濃度(通常40-50%)干固體的情況下加工。酶也可用在風味產品的制作中,例如用大豆制作。果膠降解酶的檢測此處描述的新的檢測方法和底物使得可鑒定和確定內切-木糖聚半乳糖醛酸酶的活性。然而,這些方法可用于檢測其它果膠降解酶是否有內切-木糖聚半乳糖醛酸酶的活性。可用于此種檢測方法的底物可包括已經過強酸處理的西黃蓍膠。優選的酸是三氟乙酸(TFA)。西黃蓍膠可任選地被皂化和/或其已被堿處理,例如一種堿金屬氫氧化物,例如氫氧化鈉。本發明的另一部分涉及鑒定或檢測一種能降解果膠的多肽的檢測方法。活性可以是內切-木糖聚半乳糖醛酸酶或、或可以是果膠裂解酶、多聚半乳糖醛酸酶、酯酶、纖維素酶、木糖聚半乳糖醛酸酶、半乳糖醛酸酶、阿拉伯聚糖酶和鼠李糖聚半乳糖醛酸酶。此檢測方法包括a.提供前面段落描述的底物,作為候選化合物(通常為一種多肽)的底物;和b.用候選化合物接觸底物,檢測是否引起任何碳水化合物的減少。碳水化合物的減少的量能測量出來。若必要,它們然后可與沒有候選化合物存在的對照實驗中的碳水化合物的量相比較。測量可包括BCA檢測。這可包括用存在的碳水化合物的減少測量Cu(Ⅱ)還原為Cu(Ⅰ)的量。這可通過與二辛可酸(BCA)接觸,并確定BCA-Cu(Ⅰ)復合物形成的量。本發明現將關于下列僅是舉例但并不局限的實施例進行描述。在圖中有實施例。圖1是一種有最高的分子量的蘋果MHR(修飾的毛發區)優勢群假想的結構示意圖(亞單位Ⅰ是木糖聚半乳糖醛酸,亞單位Ⅱ是富含阿拉伯聚糖側鏈的骨架,亞單位Ⅲ是鼠李糖聚半乳糖醛酸酶寡聚物。乙酰基的分布沒有給出,但主要部分認為是定位在亞單位Ⅲ之內。注GalA=半乳糖醛酸;rham=鼠李糖;gal=半乳糖;xyl=木糖;ara=阿拉伯糖);圖2是根據本發明載體pCVlacK的圖譜(構建描述于實施例1);圖3是說明用木糖聚半乳糖醛酸酶(一種本發明的多肽)降解木糖聚半乳糖醛酸后的HPAEC圖;圖4是說明用木糖聚半乳糖醛酸酶降解前和降解后木糖聚半乳糖醛酸的HPSEC的圖;圖5說明用木糖聚半乳糖醛酸酶完全降解木糖聚半乳糖醛酸的產物的Malsi-ToF質譜圖;圖6A-G是表明分別單獨用和共同用內切-阿拉伯聚糖酶、鼠李糖聚半乳糖醛酸酶、木糖聚半乳糖醛酸酶降解MHR-S的HPSEC洗脫圖;圖7和8分別是HPSEC和HPAEC的圖,洗脫方式表明用木糖聚半乳糖醛酸酶降解大豆果膠;及圖9表明PG、XghA和RHG序列(與XghA序列相同的氨基酸用一個點代替)的多種序列比較,為獲得理想的序列比較引入的缺口用(-)指出。在所有植物、真菌和原核PG中的保守氨基酸用陰影表示。注Atub=塔賓曲霉;Anig=黑曲霉;Aac=棘孢曲霉。cDNA厙用SephacrylS-500柱分離大小。最先從柱上洗脫下的級分不含任何cDNA,但第二和第三級分包含最大尺寸的cDNA。接下來的級分大概含有相對大量的非全長cDNA,對構建文庫無用。用ClontechLigationExpressTM試劑盒將第二和第三級分的cDNA連接到pCVlacK表達載體的HindⅢ和XhoⅠ位點。每個連接混合物分兩批轉化至電感受態大腸桿菌XL-BlueMRF1細胞。四份轉化懸浮液鋪板在32個瓊脂平板上(LB+50μg/ml氨芐青霉素)。37℃孵育16小時后,得到7366個轉化子。通過將2.5mlLB培養基倒入平板上,然后刮下細胞收集細菌;將0.5ml細胞懸液加入甘油中于-80℃保存;剩余的2ml用做DNA分離(QiagenTMSpinminiprep試劑盒)。如果發現每個平板上的轉化子數較低,將2.5ml轉到第二、第三或第四個平板上。這產生22個庫的325個單一的轉化子。混合每個庫中等量的DNA用做乳酸克魯維酵母的轉化。實施例1.3表達文庫轉化乳酸克魯維酵母過夜培養的生長在30℃的YPD(10g/l酵母提取物、20g/l的Bacto-蛋白胨、20g/l的葡萄糖)上的乳酸克魯維酵母菌株CBS2359在150ml新鮮的YPD中稀釋3000-、600-、300和100倍,并在160轉/分的旋轉搖床上于30℃孵育6小時。光密度值為0.7-1.0的培養物用做準備電感受態的細胞6。用1μg合并的大腸桿菌文庫DNA轉化電感受態的細胞。用BioradGenepulserTM的系統進行轉化,設置是1.4kV、200歐姆和25μF。轉化子的選擇用雙層的YPD平板(20g/l的Bacto-瓊脂的YPD)底層含50μg/mlG418,上層是非選擇性的。將660μL的轉化混合物鋪到80個雙層平板上。吸取1.5和15μL的等份液體到各平板上。大約獲得10,000個轉化子。表1溫和酸水解從多糖中有效地去除了阿拉伯糖基和巖藻糖基,然而GlaAXyl的比例基本上沒有改變。西黃蓍膠的乙酰基和甲基酯化程度用高壓液相(HPLC)來測定7。西黃蓍膠甲基化和乙酰基化的程度分別是大約75%和20%(以摩爾甲基或乙酰基團/每摩爾GlaA計算)。膠的皂化去掉了所有甲基和乙酰基團。聚合物的分子量分布用高壓分子排阻層析(HPSEC)方法在三個Bio-GelTSK柱子(40XL、30XL和20XL)上連續地進行8,皂化的西黃蓍膠的溫和酸性水解伴隨著分子量的減少,盡管得到的產物仍有高的分子量。根據HPSEC的洗脫圖,用支鏈淀粉做參考化合物,木糖聚半乳糖醛酸的估計分子量大約為1100kDa。木糖聚半乳糖醛酸證明能有效地抵抗所有測試的內切-多聚半乳糖醛酸酶和鼠李糖聚半乳糖醛酸酶的酶降解作用。將這些轉化子接種于一系列35多孔培養板,其中含80ng/mL抗生素G418的相同的200μL培養基,同時做復制板。乳酸克魯維酵母轉化子在30℃的溫箱中生長兩天。在HermleTMzk380離心機中3000轉/分離心沉淀細胞。實施例3.2底物降解仔細地將每孔的25μL上清吸出轉到新的多孔培養板中,加入25μL0.2%的底物緩沖液(來自實施例2的MHR-S或木糖聚半乳糖醛酸或sGT/TFA)或加入100mM醋酸鈉緩沖液,pH5.0。于30℃的溫箱中孵育過夜后,用BCA方法檢測還原糖類的增加。步驟包括在一個多孔培養板中混合10μL包含來自實施例3.2樣品的還原糖,和90μL水和100μLBCA試劑。每天通過混合兩種溶液,A和B,1∶1(v/v)來制備新鮮的BCA試劑。溶液A在每升蒸餾水含54.28gNa2CO3,24.20gNaHCO3和1.942gNa2BCA。溶液B在每升蒸餾水中含1.248gCuSO4·5H2O和1.262gL-絲氨酸。將含樣品、試劑和水的培養板蓋上蓋子于80℃溫箱中孵育1小時。冷卻培養板15分鐘后,用酶標儀(SLT實驗室儀器,澳大利亞;EAR400型)讀取550nm的吸收值。半乳糖的檢測線表明在0到125μM半乳糖范圍內測定是線性的。在BCA檢測中產生比空白高0.1單位吸收值的轉化子被選出,再一次培養,并采用木糖-聚半乳糖醛酸作為底物進行BCA檢測,檢查其降解木糖聚半乳糖醛酸的能力。發現三個產生木糖聚半乳糖醛酸酶的轉化子。與蛋白數據庫比較氨基酸序列表明,與原核、真菌、植物的多聚半乳糖醛酸酶序列以及與曲霉屬的鼠李糖聚半乳糖醛酸酶A和B的序列同源。用來自EMBL資料庫的序列對XghA的氨基酸序列進行比較。XghA與內切PG有31-39%的序列相似性,與塔賓曲霉的外切PG有44%的序列相似性。XghA與2RGH-A的序列相似性有30%(黑曲霉)和32%(棘孢曲霉),而與黑曲霉的RGH-B的相似性很有限。圖9表明Xgh與PG和RGH-A的多重序列比較的分析。多重序列比較表明四個保守的氨基酸結構域,這是首次對植物、真菌和細菌來源的多聚半乳糖醛酸酶進行的描述15。當將所有的從數據庫檢索中獲得的PG序列排列起來進行比較,只有四個小的氨基酸片段是保守的NXD、DD、HG和RXK(圖9中的陰影,其中X代表一種可變的氨基酸)。在水解反應中涉及到的關鍵氨基酸認為是結構域Ⅰ和結構域Ⅱ的三個天冬氨酸殘基以及結構域Ⅲ的組氨酸殘基中的一個。這些結構域在XghA中完全保守。假定第四個結構域含涉及底物結合的氨基酸。此結構域的精氨酸殘基是XghA中的甘氨酸殘基。此結構域在RGH序列上不太保守,三個天冬氨酸殘基中只有兩個是保守的,且組氨酸被甘氨酸代替。實施例4.2Southern印跡分析XghA基因的拷貝數用幾種酶消化后的塔賓曲霉基因組DNA進行Southern印跡分析(沒有顯示結果)。在嚴謹條件(65℃和0.2xSSC)和較低嚴謹條件(60℃和1xSSC)下與xghA的1.0kbHindⅢ片段雜交,清楚地表明單個的雜交片段。這證實xghA基因在塔賓曲霉基因組中是單拷貝存在的。粗酶制劑在HitrapTMQ離子交換柱(PharmaciaBiotech,瑞典)上進行預濃縮,流速為0.3mL/分。洗脫用一種鹽梯度從20mM的哌嗪(pH5.0)起始緩沖液(緩沖液A)到20mM的哌嗪(pH5.0)溶液中的0.5MNaCl(緩沖液B)在FPLC系統上進行(PharmaciaBiotech,瑞典)。采用下列梯度1分鐘內到10%的B緩沖液,19分鐘內到35%的B,經2分鐘到100%的B并持續3分鐘。采用實施例3描述的方法檢查活性并收集活性級分。用20mM的哌嗪(pH5.0)緩沖液將樣品稀釋3倍,上MiniQ柱(PharmaciaBiotech,瑞典)。在Smart系統(PharmaciaBiotech,瑞典)上采用20mM的哌嗪(pH5.0)起始緩沖液到10mM的HCl的線性pH梯度進行洗脫,流速為0.4mL/分鐘。收集活性級分并采用SDS-PAGE進行檢查。采用銀染的方法在分子量大約60kDa的位置發現一個蛋白質條帶。推測與基于DNA序列預測的分子量為45kDa(見實施例4)的區別是由于糖基化的原因。為測定pH和溫度的最優條件,純化的酶和底物在pH范圍從2.5到8或溫度范圍從20到80℃溫育2小時。此后,還原糖的增加用實施例3所述的方法測定。在溫度為60℃和pH3.0時酶有最佳活性。在pH2.5到5.0的范圍酶表現出不超過50%的活性。pH2.5時的活性仍然有pH3.0時最大活性的95%。沒有測量低于pH2.5時的值。用4×250ml規格的DionexcarbopackPA1柱進行HPAEC。用0.1MNaOH(溶液A)和在0.1MNaOH中的1MNaOAc(溶液B)進行洗脫。采用下列梯度50分鐘內從0到62%B,5分鐘內到100%B,然后100%B持續5分鐘。酶沒有產生木糖(預期在5分鐘的保持時間)和半乳糖醛酸(預期在15分鐘的保持時間),甚至孵育8小時后也沒有。僅有寡聚物釋放出來,最小的寡聚物發現在約22分鐘的保持時間這是木糖-半乳糖醛酸二聚體。(圖3中,下線(A)t=1小時,中線(B)t=4小時,頂線(C)t=8小時的孵育)。用三個連續的柱進行HPSECBio-GelTSK40(300×7.5mm,來自Biorad),Bio-GelTSK30XL(300×7.5mm,來自Biorad)和TSKGelG2500PXL(300×7.8mm,來自TosoHaas)。圖4說明木糖聚半乳糖醛酸的高分子量部分被迅速地降解(上線(B)代表降解前的聚合物,下線(A)代表降解后的聚合物)。當用Maldi-ToF質譜儀監測降解產物時,鑒定發現的產物示于表2。表2<tablesid="t02"num="003"><table>寡聚物降解產物的成分波峰數目(圖4中)分子量(Da)二聚體galAxy11349.1三聚體GalA2xy12525.1四聚體GalA2xy12GalA3xy13a,3b657.3,701.3五聚體GalA3xy12GalA4xy114a,4b833.4,877.4六聚體GalA4xy1251009.5七聚體GalA4xy13GalA5xy126a,6b1141.6,1185.5八聚體GalA6xy1271361.5</table></tables>當MHR-S與XghA孵育時形成兩種產物。這些產物甚至在孵育很短的時間后就出現。這些結果表明木糖聚半乳糖醛酸是由木糖聚半乳糖醛酸酶以內切方式降解的。獲得的圖與那些從多聚半乳糖醛酸消化得到的相比,很清楚沒有形成MHR-S降解產物的是多聚半乳糖醛酸寡聚物。這表明XghA產生被木糖取代的半乳糖醛酸寡聚物。當將產生木糖聚半乳糖醛酸酶的乳酸克魯維酵母轉化子的上清液與多聚半乳糖醛酸孵育時,沒有發現此底物的降解。象實施例7描述的那樣,用HPSEC對MHR-S的降解進行監測。結果在圖6到6G中顯示,其中上線(b)代表對照,下線(d)代表與酶一起孵育。孵育是與A阿拉伯聚糖酶;B木糖聚半乳糖醛酸酶;C鼠李糖聚半乳糖醛酸酶D內切-阿拉伯聚糖酶和木糖聚半乳糖醛酸酶順序加入;E內切-阿拉伯聚糖酶和木糖聚半乳糖醛酸酶共同加入;F內切-阿拉伯聚糖酶和鼠李糖聚半乳糖醛酸酶順序加入;及G內切-阿拉伯聚糖酶、鼠李糖和木糖聚半乳糖醛酸酶共同加入。圖6B表明木糖聚半乳糖醛酸酶能降解MHR-S可觀察到向較低分子量物質移動。內切-阿拉伯聚糖酶(圖6A)和鼠李糖聚半乳糖醛酸酶(圖6C)也產生一些分子量的移動。可是,在一次孵育中使用兩種不同的酶會得到較好的結果(圖6D,內切-阿拉伯聚糖酶和木糖聚半乳糖醛酸酶順序加入;6E,內切-阿拉伯聚糖酶和木糖聚半乳糖醛酸酶共同加入;和6F內切-阿拉伯聚糖酶和鼠李糖聚半乳糖醛酸酶順序加入)。圖6D和6E的區別是顯著的共同加入內切阿拉伯聚糖酶和木糖聚半乳糖醛酸酶比順序加入有效得多。當將三種酶共同加入時,高分子量物質的幾乎完全降解是可能的(圖6G)。圖7表明如HPSEC測量的分子量分布的變化在木糖聚半乳糖醛酸酶處理的物質(曲線c),峰值出現在大約20分鐘,代表高分子量物質,降低到起始物質值的70%(曲線a)。在圖8中顯示了HPSEC分析的結果。木糖聚半乳糖醛酸酶處理的物質(曲線b)與空白(曲線(a))相比,可以看出木糖聚半乳糖醛酸酶導致了特征性木糖半乳糖醛酸二聚體(用一個X做標志)和其它未確定的寡聚體(X右側的峰)的釋放,與實施例7中的圖6出現的峰是相類似。參考文獻1.G.Beldman,L.A.M.vandenBroeck,H.A.Schols,M.J.FSearle-vanLeeuwen,K.M.JvanLaere和A.G.J.Voragen(1996)生物技術通訊(BiotechnologyLetters)18707-7122.C.Grassin和P.Fauquembergue(1996)果膠和果膠酶,生物技術進展(ProgressinBiotechnology)14453-4623.Goosen等人.,1992,“絲狀真菌的轉化和基因調控綜述”在應用真菌學手冊(HandbookofAppliedMycology)第4卷“真菌生物技術”(FungalBiotechnology),D.K.4.Romanos等人,酵母(Yeast)8423-488(1992)5.Arora,R.P.Elander和K.G.Mukerji,編,MarcelDekerIn.,NewYork,151-195頁6.K.N.Faber,P.Haima,W.Harder,M。Veenhuis,G.AB(1994),現代遺傳學(CurrentGenetics)25305-3107.A.G.J.Voragen,H.A.Schols和W.Pilnik,(1986)FoodHydrocoll165-708.H.A.Schols,M.A.Posthumus,A.G.J.Voragen(1990)糖類研究(CarbohydrateResearch)206117-1299.J.D.Fox,J.F.Robyt(1991)分析生物化學(AnalyticalBiochemistry)19593-9610.M.A.Sobanski和Didlinson(1995)生物化學技術(BiotechnologyTechniques)9225-23011.G.vonHeijne(1986)核酸研究(NucleicacieResearch)144683-469012.G.Beldman,M.J.F.SearlevanLeeuwen,G.A.deRuiter,H.A.Siliha,A.G.J.Voragen(1993)糖類聚合物(CarbohydratePolymers)20159-16813.H.A.Schols,C.C.,J.M.Geraerds,M.J.F.SearlevanLeeuwen,F.J.M.Kormelink,A.G.J.Voragen(1990)糖類研究(CarbohydrateResearch)206105-11514.M.Kozak,等人,翻譯的掃描模型進展細胞生物學雜志(J.Cell.Biol)。108(1989)229-24115.H.J.D.Bussink等人,現代遺傳學19(1991),467-47416.Huisman,M.M.H.等人(1998)糖類聚合物3787-9517.WinklerA.A.等人,博士論文,Leiden大學,荷蘭(1998)序列表(1)一般信息(ⅰ)申請人(A)姓名GIST-BROCADESB.V.(B)街道Wateringseweg1(C)城市Delft(E)國家荷蘭(F)郵政編碼2611XT(ⅱ)發明名稱新型內切木糖聚半乳糖醛酸酶(ⅲ)序列數目2(ⅳ)計算機可讀形式(A)介質類型磁盤(B)計算機IBM兼容機(C)操作系統PC-DOS/MS-DOS(D)軟件PatnetInRelease#1.0Version#1.25(EPO)(ⅴ)當前申請信息申請號N/A(2)SEQ.ID.NO.1的信息(ⅰ)序列特征(A)長度1602個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線性(ⅱ)分子類型cDNA(ⅲ)假擬非(ⅳ)反義否(ⅵ)初始來源(A)生物塔賓曲霉(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置98..1318CTCGAG是XhoI位點(ⅹⅰ)SEQ.ID.NO.1的序列描述GCTTGTGTTTCTTAGGAGAATTATTATTCTTTTGTTATGTTGCGCTTGTAGTTGGAAAAG60GTGAAGAGACAAAGCTTGAATTCCGAAATCGCTCATCATGGCGCTATATCGTAAC115MetAlaLeuTyrArgAsn15CTCTACCTTCTGGCCAGCCTTGGGCTAAGCAGTGCTGCTCCCTCCAAG163LeuTyrLeuLeuAlaSerLeuGlyLeuSerSerAlaAlaProSerLys101520GTCCAGCGAGCCCCGGATTCTTCCATTCATGCTCGCGCTGTCTGTACC211ValGlnArgAlaProAspSerSerIleHisAlaArgAlaValCysThr253035CCGACCGCAGGAGGCGATTCGTCCACCGACGATGTCCCCGCCATCACC259ProThrAlaGlyGlyAspSerSerThrAspAspValProAlaIleThr404550GAGGCCCTCAGCTCGTGCGGAAATGGTGGCACCATCGTCTTCCCCGAG307GluAlaLeuSerSerCysGlyAsnGlyGlyThrIleValPheProGlu55606570GGCAGCACCTACTACCTCAACAGTGTGCTGGACTTGGGCAGCTGCAGT355GlySerThrTyrTyrLeuAsnSerValLeuAspLeuGlySerCysSer758085GATTGCGACATCCAGGTGGAAGGTCTTCTGAAGTTCGCCAGCGATACC403AspCysAspIleGlnValGluGlyLeuLeuLysPheAlaSerAspThr9095100GATTACTGGAGCGGTCGCACTGCCATGATCAGTGTTTCCAATGTAGAT451AspTyrTrpSerGlyArgThrAlaMetIleSerValSerAsnValAsp105110115GGTTTGAAGCTGCGCTCATTGACTGGATCTGGTGTCATTGATGGCAAT499GlyLeuLysLeuArgSerLeuThrGlySerGlyValIleAspGlyAsn120125130GGCCAGGATGCGTGGGATCTCTTTGCTTCGGACAGTAGTTACTCACGC547GlyGlnAspAlaTrpAspLeuPheAlaSerAspSerSerTyrSerArg135140145150CCGACGCTCTTGTACATCACTGGCGGCAGCAACCTAGAAATCTCCGGG595ProThrLeuLeuTyrIleThrGlyGlySerAsnLeuGluIleSerGly155160165CTGCGTCAAAAGAATCCACCTAACGTGTTCAACTCGGTCAAGGGTGGC643LeuArgGlnLysASnProProAsnValPheASnSerValLysGlyGly170175180GCCACTAATGTCGTCTTCTCCAACCTGAAGATGGATGCCAACTCCAAG691AlaThrASnValValPheSerAsnLeuLysMetAspAlaASnSerLys185190195TCGGACAATCCGCCCAAGAACACTGATGGGTTCGACATTGGCGAGAGT739SerAspAsnProProLysAsnThrAspGlyPheAspIleGlyGluSer200205210ACCTATGTGACCATCACCGAGGTCACCGTAGTCAACGATGACGACTGT787ThrTyrValThrIleThrGluValThrValValAsnAspAspAspCys215220225230GTCGCCTTCAAGCCCAGTTCCAACTACGTGACAGTGGACACGATCAGC835ValAlaPheLysProSerSerAsnTyrValThrValAspThrIleSer235240245TGCACCGGCTCCCATGGAATTTCCGTGGGATCATTAGGAAAGTCGAGC863CysThrGlySerMisGlyIleSerValGlySerLeuGlyLysSerSer250255260GACGACTCGGTCAAGAACATTTATGTCACGGGCGCAACTATGATCAAC931AspASpSerVelLysAsnIleTyrValThrGlyAlaThrMetIleAsn265270275TCCACCAAAGCCGCCGGGATCAAGACTTATCCGAGTGGAGGCGACCAC979SerThrLysAlaAlaGlyIleLysThrTyrProSerGlyGlyAspHis280285290GGTACCTCCACGGTCAGCAATGTGACCTTCAACGATTTCACTGTGGAC1027GlyThrSerThrValSerAsnValThrPheAsnAspPheThrValAsp295300305310AACTCCGACTATGCCTTCCAGATCCAGAGCTGCTATGGCGAGGACGAT1075ASnSerAspTyrAlaPheGlnIleGlnSerCysTyrGlyGluAspAsp315320325GACTATTGCGAGGAAAACCCGGGCAACGCCAAACTGACTGATATAGTC1123AspTyrCysGluGluAsnProGlyAsnAlaLysLeuThrAspIleVal330335340GTGTCAAGCTTCAGTGGGACAACCAGTGACAAGTACGATCCGGTCGTG1171ValSerSerPheSerGlyThrThrSerAspLysTyrAspProValVal345350355GCCAACCTCGACTGCGGTGCGGATGGAACTTGTGGCATCTCCATCAGT1219AlaAsnLeuAspCysGlyAlaAspGlyThrCysGlyIleSerIleSer360365370GGGTTCGATGTCAAGGCGCCATCGGGCAAGTCTGAAGTGTTGTGCGCC1267GlyPheAspValLysAlaProSerGlyLysSerGluValLeuCysAla375380385390AACACCCCGTCTGATTTGGGCGTCACTTGCACTTCGGGGGCTTCGGGC1315AsnThrProSerAspLeuGlyValThrCysThrSerGlyAlaSerGly395400405TAAATAGCTTTGGCCGGGTTGCTTTCTGAATCCACTGAGTGGAGGTCTTCTTCGGGTTTG1375ATATTTTGTATGGTCGTGTGTATAGCAGAATGTGACAATAGAATTAGTGAAATTGCCATT1435CTTTTCGAAAGACAAAAAAAAAAAAAAAAAAAAAAAAAAAACTCGAGAATTTATACTTAG1495ATAAGTATGTACTTACAGGTATATTTCTATGAGATACTGATGTATACATGCATGATAATA1555TTTAAACGGTTATTAGTGCCGATTGTCTTGTGCGATAATGACGTTCC1602(2)SEQ.ID.NO.2的信息(ⅰ)序列特征(A)長度406個氨基酸(B)類型氨基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅹⅰ)SEQ.ID.NO.2的序列描述MetAlaLeuTyrArgAsnLeuTyrLeuLeuAlaSerLeuGlyLeuSer151015SerAlaAlaProSerLysValGlnArgAlaProAspSerSerIleHis202530AlaArgAlaValCysThrProThrAlaGlyGlyAspSerSerThrAsp354045AspValProAlaIleThrGluAlaLeuSerSerCysGlyAsnGlyGly505560ThrIleValPheProGluGlySerThrTyrTyrLeuAsnSerValLeu65707580AspLeuGlySerCysSerAspCysAspIleGlnValGluGlyLeuLeu859095LysPheAlaSerAspThrAspTyrTrpSerGlyArgThrAlaMetIle100105110SerValSerAsnValAspGlyLeuLysLeuArgSerLeuThrGlySer115120125GlyValIleAspGlyAsnGlyGlnAspAlaTrpAspLeuPheAlaSer130135140AspSerSerTyrSerArgProThrLeuLeuTyrIleThrGlyGlySer145150155160AsnLeuGluIleSerGlyLeuArgGlnLysAsnProProAsnValPhe165170175AsnSerValLysGlyGlyAlaThrAsnValValPheSerAsnLeuLys180185190MetAspAlaAsnSerLysSerAspAsnProProLysAsnThrAspGly195200205PheAspIleGlyGluSerThrTyrValThrIleThrGluValThrVal210215220ValAsnAspAspAspCysValAlaPheLysProSerSerAsnTyrVal225230235240ThrValAspThrIleSerCysThrGlySerHisGlyIleSerValGly245250255SerLeuGlyLysSerSerAspAspSerValLysAsnIleTyrValThr260265270GlyAlaThrMetIleAsnSerThrLysAlaAlaGlyIleLysThrTyr275280285ProSerGlyGlyAspHisGlyThrSerThrValSerAsnValThrPhe290295300AsnAspPheThrValAspAsnSerAspTyrAlaPheGlnIleGlnSer305310315320CysTyrGlyGluAspAspAspTyrCysGluGluAsnProGlyAsnAla325330335LysLeuThrAspIleValValSerSerPheSerGlyThrThrSerAsp340345350LysTyrAspProValValAlaAsnLeuAspCysGlyAlaAspGlyThr355360365CysGlyIleSerIleSerGlyPheAspValLysAlaProSerGlyLys370375380SerGluValLeuCysAlaAsnThrProSerAspLeuGlyValThrCys385390395400ThrSerGlyAlaSerGly40權利要求1.一種具有內切木糖聚半乳糖醛酸酶活性的多肽。2.一種從真菌獲得并具有內切木糖聚半乳糖醛酸酶活性的具有內木糖聚半乳糖醛酸酶活性的多肽。3.根據權利要求2的多肽,其中該真菌是曲霉屬的。4.根據前述任一權利要求的多肽,其包括SEQ.IDNo.2所述序列,或一種與其基本上同源的序列、或任一序列的片段。5.根據權利要求4的多肽,其中該片段有至少5個氨基酸或同源序列與SEQ.IDNo.2有至少60%的相同性。6.根據權利要求5的多肽,其包括SEQ.IDNo.2所述氨基酸序列的19-406氨基酸。7.一種編碼根據任一前述權利要求的多肽的多核苷酸。8.一種多核苷酸,包含(a)SEQ.IDNo.1所述多核苷酸序列,或其互補序列;(b)能與SEQ.IDNo.1所述核苷酸序列雜交的多核苷酸序列,或其片段;(c)能與SEQ.IDNo.1所述多核苷酸序列的互補序列雜交的多核苷酸序列,或其片段;(d)多核苷酸序列,其由于遺傳密碼的簡并性與(a)(b)或(c)中定義的任一多核苷酸是簡并的。9.根據權利要求8的多核苷酸,其a.編碼具有內切木糖聚半乳糖醛酸酶活性的多肽,此多核苷酸是(1)SEQ.IDNo.1的編碼序列;(2)一種與(1)中定義的序列的互補序列選擇性雜交的序列;或(3)一種由于遺傳密碼的簡并性與(1)或(2)中定義的序列簡并的序列,或者b.一種與(a)中定義的多核苷酸互補的序列。10.根據權利要求7、8或9從真菌中獲得的分離的多核苷酸。11.根據權利要求10的多核苷酸,其中真菌是曲霉屬的。12.一種包括權利要求7到11中任一項定義的多核苷酸之至少15個核苷酸的片段的多核苷酸探針。13.一種包含權利要求7到12中任一項定義的多核苷酸的載體。14.一種包含權利要求7到11中任一項定義的多核苷酸的表達載體,所述多核苷酸與一種或多種能在宿主細胞中指導多核苷酸表達的調控序列有效地連接。15.一種用根據權利要求13到14中任一項的載體轉化或轉染的宿主細胞。16.包括或含有根據權利要求7到11中任一項的多核苷酸的宿主細胞,其中該多核苷酸與宿主細胞的基因組是異源的。17.根據權利要求15或16的宿主細胞,其是酵母細胞。18.一種制備根據任何權利要求1到6中任一項的多肽的方法,包括在允許多肽表達的條件下孵育或培養根據權利要求15到17中任一項的宿主細胞,并任選地純化多肽。19.一種包括或表達根據權利要求1到6中任一項的多肽的宿主細胞,其中該多肽與宿主細胞是異源的。20.一種包含根據權利要求1到6中任一項的多肽的組合物。21.根據權利要求20的組合物,其中還包括具有內切阿拉伯聚糖酶、鼠李糖聚半乳糖醛酸酶或多聚半乳糖醛酸酶活性的多肽。22.一種處理植物材料的方法,此方法包括用根據權利要求1到6中任一項的多肽或根據權利要求20或21的組合物來接觸植物材料。23.根據權利要求22的方法,其中處理包括降解或修飾植物材料中的果膠。24.根據權利要求22的方法,用于降解或修飾植物細胞壁。25.根據權利要求22或23的方法,其中處理包括對材料中的果膠成分的木糖聚半乳糖醛酸亞單位的內切型剪切。26.根據權利要求22到24中任一項的方法,其中材料包括植物、植物果肉、植物提取液或可食用的食品或其中的成分。27.根據權利要求26的方法,其中材料是水果或蔬菜果肉、液汁或提取物。28.一種加工的植物材料,其是用根據任何權利要求1到6中任一項的多肽或根據權利要求20或21的組合物與植物材料接觸獲得的,或由根據權利要求22到26中任一項的方法獲得的。29.根據權利要求27的加工的植物材料,其是一種水果或蔬菜汁。30.一種降低植物材料粘度的方法,此方法包括用根據權利要求1到6中任一項的多肽或根據權利要求20或21的組合物以有效降解材料中所含的果膠的量和條件下接觸植物材料。31.根據任何權利要求1到6中任一項的多肽或根據權利要求20或21的組合物在處理植物材料的方法中的用途。32.根據權利要求31的用途,其中處理包括內切型剪切植物材料中果膠的木糖聚半乳糖醛酸取代基。33.根據權利要求1到6中任一項的多肽或根據權利要求20或21的組合物在加工植物果肉、汁液或提取物的方法中的用途,此方法包括用多肽或組合物與果肉、汁液或提取物溫育以至少部分降解果膠。34.一種包含根據權利要求1到6中任一項的多肽的(動物)飼料或食品。35.一種包含(任選地皂化的)用強酸處理的西黃蓍膠(sGT)的組合物。36.一種鑒定或檢測具有果膠降解活性的多肽的檢測方法,包括a.作為候選化合物的底物,提供用強酸(sGT/TFA)處理過的(任選地皂化的)西黃蓍膠,及b.用候選化合物接觸sGT/TFA,檢測是否有任何還原糖類產生。37.根據權利要求35的檢測方法,其中測量了還原糖類的量,并任選地與沒有候選化合物的對照中產生的糖類的量比較。38.根據權利要求35或36的檢測方法,其包括通過測量由糖類還原Cu(Ⅱ)為Cu(Ⅰ)的量,任選地通過與二辛可酸(BCA)接觸,確定形成的BCA-Cu(Ⅰ)復合物的量。全文摘要公開了具有新的活性,即內切木糖聚半乳糖醛酸酶活性的多肽。這些多肽可降解見于植物提取物和植物材料中的果膠,尤其是果膠聚合物中的“毛發區”。特別是,多肽可在內部糖苷鍵處切割半乳糖醛酸。公開了新型酶XghA,其氨基酸序列和編碼DNA序列也給出。在酵母細胞中表達此多肽,并用于處理植物材料,特別是處理在可食性食物制備中的大豆和水果汁。文檔編號A23L2/84GK1294633SQ99804431公開日2001年5月9日申請日期1999年2月9日優先權日1998年2月10日發明者P·J·A·密烏森,C·J·B·范德威魯特伯格曼斯,J·P·范克恩,G·貝爾德曼,A·G·J·沃瑞格恩,M·A·赫威杰爾,A·J·J·范歐杰恩申請人:Dsm公司