專利名稱::具有阿拉伯呋喃糖苷酶活性的多肽及其編碼多核苷酸的制作方法具有阿拉伯呋喃糖苷酶活性的多肽及其編碼多核苷酸涉及序列表本申請含有計算機可讀形式的序列表。通過提述而將計算機可讀形式并入本文。涉及生物材料的保藏本申請含有對生物材料的保藏的涉及,通過提述而將所述保藏并入本文。發明領域本發明涉及具有α-L-阿拉伯呋喃糖苷酶活性的分離的多肽和編碼該多肽的分離的多核苷酸。本發明還涉及包含所述多核苷酸的核酸構建體、載體、和宿主細胞以及生成和使用所述多肽的方法。
背景技術:
:一般而言,植物細胞壁多糖構成90%的植物細胞壁,并且可以分成三組纖維素、半纖維素和果膠。纖維素代表細胞壁多糖的主要成分。半纖維素是植物細胞壁的第二豐富的成分。主要的半纖維素聚合物是木聚糖。植物細胞壁中存在的木聚糖結構可以隨其起源而顯著不同,但是它們總含有β-1,4-連接的D-木糖主鏈。β-1,4-連接的D-木糖主鏈可以用各種側基,諸如L-阿拉伯糖、D-半乳糖、乙酰基、阿魏酰基、對香豆酰基和葡糖醛酸殘基取代。對木聚糖主鏈的生物降解依賴于兩類酶內切木聚糖酶和β-木糖苷酶。內切木聚糖酶(EC3.2.1.8)將木聚糖主鏈切割成較小的寡糖,其能被β-木糖苷酶(EC3.2.1.37)進一步降解成木糖。木聚糖降解中牽涉的其它酶包括例如乙酰木聚糖酯酶、阿拉伯糖酶、α-L-阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、阿魏酸酯酶、和對香豆酸酯酶。Kaji和Tagawa,1970,Biochim.Biophys.Acta207456-464描述了來自黑曲霉(Aspergillusniger)的α-L-阿拉伯呋喃糖苷酶的純化、結晶和氨基酸組成。Kaji.和Yoshihara,1971,Biochim.Biophys.Acta250367-371描述了來自羅耳伏革菌(Corticiumrolfsii)的α-L-阿拉伯呋喃糖苷酶的特性。Tagawa和Kaji,1969,Carbohydr.Res.11293-301描述了含有L-阿拉伯糖的多糖的制備和α-L-阿拉伯呋喃糖苷酶對該多糖的作用。Filho等,1996,Appl.Environ.Microbiol.62:168_173公開了來自膠囊青霉(Penicilliumcapsulatum)的兩種α-L-阿拉伯呋喃糖苷酶的純化和表征。WO96/06935公開了來自黑曲霉的阿拉伯木聚糖降解酶。WO2006/125438描述了膠囊青霉α-L-阿拉伯呋喃糖苷酶及其多核苷酸。本發明涉及具有α-L-阿拉伯呋喃糖苷酶活性的多肽和編碼該多肽的多核苷酸。發明概述本發明涉及具有α-L-阿拉伯呋喃糖苷酶活性的分離的多肽,其選自下組(a)包含氨基酸序列的多肽,所述氨基酸序列與SEQIDNO2的成熟多肽具有至少70%序列同一性;(b)由多核苷酸編碼的多肽,所述多核苷酸在至少中-高嚴格條件下與SEQIDNO1的成熟多肽編碼序列或其全長互補鏈雜交;(c)由多核苷酸編碼的多肽,所述多核苷酸包含與SEQIDNO:1的成熟多肽編碼序列具有至少70%序列同一性的核苷酸序列;和(d)SEQIDNO:2的成熟多肽的包含取代、缺失和/或插入一個或多個(數個)氨基酸的變體。本發明還涉及編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽的分離的多核苷酸,其選自下組(a)編碼包含氨基酸序列的多肽的多核苷酸,所述氨基酸序列與SEQIDNO2的成熟多肽具有至少70%序列同一性;(b)多核苷酸,其在至少中_高嚴格條件下與SEQIDNO1的成熟多肽編碼序列或其全長互補鏈雜交;(c)多核苷酸,其包含與SEQIDNO=I的成熟多肽編碼序列具有至少70%序列同一性的核苷酸序列;和(d)編碼變體的多核苷酸,所述變體為SEQIDNO:2的成熟多肽的包含取代、缺失、和/或插入一個或多個(數個)氨基酸的變體。本發明還涉及包含所述多核苷酸的核酸構建體、重組表達載體、重組宿主細胞,及生成具有α-L-阿拉伯呋喃糖苷酶活性的多肽的方法。本發明還涉及抑制細胞中多肽的表達的方法,包括對所述細胞施用雙鏈RNA(dsRNA)分子或者在所述細胞中表達雙鏈RNA(dsRNA)分子,其中所述dsRNA包含本發明的多核苷酸的亞序列。本發明還涉及此類雙鏈抑制性RNA(dsRNA)分子,其中任選地,所述dsRNA是siRNA或miRNA分子。本發明還涉及用于降解包含木聚糖的材料的方法。本發明還涉及包含分離的多核苷酸的植物,所述分離的多核苷酸編碼所述具有α-L-阿拉伯呋喃糖苷酶活性的多肽。本發明還涉及生成所述具有α-L-阿拉伯呋喃糖苷酶的多肽的方法,包括(a)在有益于所述多肽生成的條件下培養轉基因植物或植物細胞,所述轉基因植物或植物細胞包含編碼所述具有α-L-阿拉伯呋喃糖苷酶活性的多肽的多核苷酸;并(b)回收所述多肽。本發明進一步涉及核酸構建體,其包含編碼蛋白質的基因,其中所述基因與編碼信號肽的核苷酸序列可操作連接,所述信號肽包含SEQIDNO:2的氨基酸1至17,或由SEQIDNO2的氨基酸1至17組成,其中所述基因對于所述核苷酸序列而言是外來的。附圖簡述圖IA和圖IB顯示了家族62特異腐質霉(Humicolainsolens)DSM1800α-L-阿拉伯呋喃糖苷酶的基因組DNA序列和推導的氨基酸序列(分別為SEQIDNO:1和2)。圖2顯示了ρ匪ar4的限制圖譜。圖3顯示了pHinsGH62A的限制圖譜。定義α-L-阿拉伯呋喃糖苷酶活性術語“α_L_阿拉伯呋喃糖苷酶活性”在本文中定義為α-L-阿拉伯呋喃糖苷阿拉伯呋喃水解酶活性(EC3.2.1.55),其催化對α_L_阿拉伯糖苷中的末端非還原性α-L-阿拉伯呋喃糖苷殘基的水解。該酶活性對α-L-阿拉伯呋喃糖苷、含有(1,3)_和/或(1,5)_鍵的α-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶也稱為阿拉伯糖苷酶、α-阿拉伯糖苷酶、α-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖α-L-阿拉伯呋喃糖苷酶、α-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶或α-L-阿拉伯聚糖酶。就本發明而言,根據下文所描述的方法或實施例10中所描述的方法來測定α-L-阿拉伯呋喃糖苷酶活性。本發明的多肽具有SEQIDNO2的成熟多肽的α-L-阿拉伯呋喃糖苷酶活性的至少20%,優選至少40%,更優選至少50%,更優選至少60%,更優選至少70%,更優選至少80%,甚至更優選至少90%,最優選至少95%,并且甚至最優選至少100%。特定阿拉伯木聚糖寡糖的制備。通過將IOOml0.IM乙酸鹽ρΗ6.0緩沖液中的Ig水不溶性小麥阿拉伯木聚糖(Megazyme,Bray,CountyWicklow,愛爾蘭)與每kg水不溶性小麥阿拉伯木聚糖6.67gSHEARZYME(棘孢曲霉(Aspergillusaculeatus)GH10內切-1,4-β-木聚糖酶,NovozymesA/S,BagSV出rd,丹麥)一起于30°C溫育2小時來制備含有末端(1—3)連接的阿拉伯糖基基團的寡糖。通過將IOOml0.IM乙酸鈉ρΗ6.0中的Ig水不溶性小麥阿拉伯木聚糖與每kg水不溶性小麥阿拉伯木聚糖0.03gPENTOPANMONO(疏棉狀嗜熱霉(Thermomyceslanuginosus)GHll內切_1,4_β-木聚糖酶;NovozymesA/S,Bagsvasrd,丹麥)一起于30°C溫育2小時來制備含有內部(1—3)連接的阿拉伯糖基基團的寡糖。通過將IOOml0.IM乙酸鈉ρΗ6.0中的Ig水不溶性小麥阿拉伯木聚糖與每kg水不溶性小麥阿拉伯木聚糖0.03gPENTOPANMONO和每kg水溶性小麥阿拉伯木聚糖0.03gα-L-阿拉伯呋喃糖苷酶一起于30°C溫育2小時來制備含有內部(1—2)連接的阿拉伯糖基基團的寡糖。為了停止酶促反應,于100°c加熱混合物10分鐘。將阿拉伯木寡糖(arabinoxylo-oligosaccharide)在旋轉蒸發器上濃縮,并通過1H-NMR來評估。最佳反應條件的測定。在雙因素Box-Behnken響應面設計模板(Montgomery,2001,Designandanalysisofexperiments.Wiley,NewYork)中評估α-L-阿拉伯呋喃糖苷酶的最佳反應條件。每個模板包含ρΗ(3-7)和反應溫度(30-70°C)的數種不同組合,具有3個中心點(with3centerpoints)。將水溶性小麥阿拉伯木聚糖(0.002g;Megazyme,Bray,CountyWicklow,愛爾蘭)在2ml去離子水中溶解。然后將溶液與每kg水溶性小麥阿拉伯木聚糖每次測定0.Ig酶蛋白一起溫育。反應正好24小時后取樣,并于100°C立即加熱10分鐘以停止酶反應。然后以20,OOOxg離心樣品10分鐘,并通過HPAEC分析在上清液中測定阿拉伯糖水平。所報告的數值按每g小麥阿拉伯木聚糖mg計。α-L-阿拉伯呋喃糖苷酶的作用模式。將α-L-阿拉伯呋喃糖苷酶于40°C添加至Iml0.IM乙酸鈉ρΗ6.0中的0.Olg水溶性小麥阿拉伯木聚糖、0.Olg含有末端(1—3)連接的阿拉伯糖基基團的寡糖、0.Olg含有內部(1—3)連接的阿拉伯糖基基團的寡糖、或0.Olg含有內部(1—2)連接的阿拉伯糖基基團的寡糖達2小時。于100°C使酶促反應失活10分鐘。將樣品在旋轉蒸發器上濃縮,并通過1H-NMR來分析。HPAEC0將水解產物(10μ1)施用至裝配有與CARB0PACPAl預柱(4x50mm)組合的CARB0PACPAl保護柱(4x250mm)(DionexCorporation,Sunnyvale,CA,USA)的BioLC系統(DionexCorporation,Sunnyvale,CA,USA)上。以每分鐘Iml的流速用IOmMKOH等度分離阿拉伯糖15分鐘。通過脈沖電化學檢測器以脈沖安培計量檢測模式檢測阿拉伯糖。電極電壓編程為+0.IV(t=0-0.4s)至-2.OV(t=0.41-0.42s)至0.6V(t=0.43s)和最終的-0.IV(t=0.44-0.50s),期間級分t=0.2-0.4s所得的信號。使用阿拉伯糖(Merck,Darmstadt,德國)作為標準品。1H-NMR分析。從99.9%D2O凍干所有降解產物兩次,并在99.9%D2O中再溶解。對一些水解產物進行透析(Spectra/Por膜截留分子量1000)以在譜分析之前除去游離的阿拉伯糖。在以400MHz操作且裝備有4-核自動可變換探針(4-nucleusauto-switchableprobe)的Varian汞-VX儀中于30°C記錄1H-匪R譜。在128-512次掃描中收集數據,并使用HDO信號作為參照信號(4.67ppm)。含有木聚糖的材料術語“含有木聚糖的材料”在本文中定義為任何包含木聚糖作為成分的材料。木聚糖是含有β-1,4-連接的木糖殘基主鏈的植物細胞壁多糖。一般而言,4-0-甲基葡糖醛酸和阿拉伯糖的側鏈與乙酰基和阿魏酰基基團一起以不同量存在。木聚糖是半纖維素的一種主要成分。家族62或家族GH62術語“家族62”或“家族GH62”或“GH62”在本文中定義為根據HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280:309_316,及HenrissatandBairoch,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316695-696屬于糖苷水解酶家族62的多肽。分離的多肽如本文中所使用的,術語“分離的多肽”指自來源分離的多肽。在一個優選的方面,如通過SDS-PAGE所測定的,多肽為至少1%純,優選至少5%純,更優選至少10%純,更優選至少20%純,更優選至少40%純,更優選至少60%純,甚至更優選至少80%純,并且最優選至少90%純。基本上純的多肽術語“基本上純的多肽”在本文表示多肽制備物,所述多肽制備物含有按重量計至多10%,優選至多8%,更優選至多6%,更優選至多5%,更優選至多4%,更優選至多3%,甚至更優選至多2%,最優選至多1%,并且甚至最優選至多0.5%的與其天然或重組結合的(associated)的其它多肽材料。因此,優選所述基本上純的多肽是按存在于制備物中的全部多肽材料的重量計至少92%純,優選至少94%純,更優選至少95%純,更優選至少96%純,更優選至少96%純,更優選至少97%純,更優選至少98%純,甚至更優選至少99%純,最優選至少99.5%純,并且甚至最優選100%純。本發明的多肽優選處于基本上純的形式,即所述多肽制備物基本上(essentially)沒有與其天然或重組結合的其它多肽材料。例如,這能夠通過以下實現通過公知的重組方法或由經典純化方法制備多肽。成熟多肽術語“成熟多肽”在本文中定義為具有α-L-阿拉伯呋喃糖苷酶活性的多肽,所述多肽以其翻譯和任何翻譯后修飾之后的最終形式存在,所述修飾諸如N端加工、C端截短、糖基化、磷酸化等。在一個優選的方面,成熟多肽是基于SignalP程序的SEQIDNO2的氨基酸18至387,所述SignalP程序預測SEQIDNO2的氨基酸1至17是信號肽。成熟多肽編碼序列術語“成熟多肽編碼序列”在本文中定義為編碼具有α-L-阿拉伯呋喃糖苷酶活性的成熟多肽的核苷酸序列。在一個優選的方面,成熟多肽編碼序列是基于SignalP程序的SEQIDNO1的核苷酸52至1161,所述SignalP程序預測SEQIDΝ0:1的核苷酸1至51編碼信號肽。同一性參數“同一性”描述兩個氨基酸序列之間或兩個核苷酸序列之間的相關性。7就本發明而言,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48443-453)來測定兩個氨基酸序列之間的序列同一性程度,如EMBOSS包(EMBOSSTheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,TrendsinGenetics16:276-277)的Needle程序(優選第3·0.0或其后版本)中所執行的。所使用的任選參數是缺口開放罰分10,缺口延伸罰分0.5,和EBL0SUM62(BL0SUM62的EMBOSS形式)取代矩陣。使用Needle標記為“最高同一性(longestidentity)”的輸出結果(使用-nobrief選項獲得)作為百分比同一性,并計算如下(相同的殘基XlOO)/(比對長度-比對中缺口的總數)就本發明而言,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,見上文)來測定兩個脫氧核糖核苷酸序列之間的序列同一性程度,如EMBOSS包(EMBOSS=TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,見上文)的Needle程序(優選第3.0.0或其后版本)中所執行的。所使用的任選參數是缺口開放罰分10,缺口延伸罰分0.5,和EDNAFULL(NCBINUC4.4的EMBOSS形式)取代矩陣。使用Needle標記為“最高同一性”的輸出結果(使用-nobrief選項獲得)作為百分比同一性,并計算如下(相同的脫氧核糖核苷酸XlOO)/(比對長度-比對中缺口的總數)同源序列術語“同源序列”在本文中定義為在用SEQIDNO:2的特異腐質霉α-L-阿拉伯呋喃糖苷酶或其成熟多肽進行的tfasty搜索(Pearson,W.R.,1999,于BioinformaticsMethodsandProtocols,S.Misener禾口S.A.Krawetz編,第185-219頁)中E值(或期望值)小于0.001的預測蛋白質。多肽片段術語“多肽片段”在本文中定義為從SEQIDNO:2的成熟多肽或其同源序列的氨基和/或羧基末端缺失一個或多個(數個)氨基酸的多肽;其中所述片段具有α-L-阿拉伯呋喃糖苷酶活性。在一個優選的方面,片段含有SEQIDNO:2的成熟多肽或其同源序列的至少310個氨基酸殘基,更優選至少330個氨基酸殘基,并且最優選至少350個氨基酸殘基。亞序列術語“亞序列(subsequence)”在本文中定義為從SEQIDNO1的成熟多肽編碼序列或其同源序列的5’和/或3’端缺失一個或多個(數個)核苷酸的核苷酸序列;其中所述亞序列編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽片段。在一個優選的方面,亞序列含有SEQIDNO:1的成熟多肽編碼序列或其同源序列的至少930個核苷酸,更優選至少990個核苷酸,并且最優選至少1050個核苷酸。等位變體(allelicvariant)術語“等位變體”在本文中表示占據相同染色體基因座的基因的任何兩種或兩種以上可選形式。等位變異通過突變天然地發生,并且可導致種群內的多態性。基因突變可以是沉默的(在編碼的多肽中無變化)或可以編碼具有改變的氨基酸序列的多肽。多肽的等位變體是由基因的等位變體編碼的多肽。分離的多核苷酸如本文中所使用的,術語“分離的多核苷酸”指自來源分離的多核苷酸。在一個優選的方面,如通過瓊脂糖電泳所測定的,多核苷酸為至少1%純,優選至少5%純,更優選至少10%純,更優選至少20%純,更優選至少40%純,更優選至少60%純,甚至更優選至少80%純,并且最優選至少90%純。基本上純的多核苷酸如本文中所使用的,術語“基本上純的多核苷酸”指沒有其它外來的或不期望的核苷酸的多核苷酸制備物,并且所述多核苷酸制備物處于適合于在8遺傳工程的蛋白質生產體系中使用的形式。因此,基本上純的多核苷酸含有按重量計至多10%,優選至多8%,更優選至多6%,更優選至多5%,更優選至多4%,更優選至多3%,甚至更優選至多2%,最優選至多1%,并且甚至最優選至多0.5%的與其天然或重組結合的其它多核苷酸材料。然而,基本上純的多核苷酸可以包括天然存在的5’和3’非翻譯區,例如啟動子和終止子。優選基本上純的多核苷酸是按重量計至少90%純,優選至少92%純,更優選至少94%純,更優選至少95%純,更優選至少96%純,更優選至少97%純,甚至更優選至少98%純,最優選至少99%,并且甚至最優選至少99.5%純的。本發明所述多核苷酸優選為基本上純的形式,即所述多核苷酸制備物基本上沒有與其天然或重組結合的其它多核苷酸材料。所述多核苷酸可以是基因組、cDNA、RNA、半合成、合成來源的,或它們的任何組I=Iο編碼序列在本文中使用時,術語“編碼序列”指直接指定其蛋白質產物的氨基酸序列的核苷酸序列。編碼序列的邊界通常由讀碼框決定,所述讀碼框通常以ATG起始密碼子或可選的起始密碼子例如GTG和TTG開始,并且以終止密碼子例如TAA、TAG和TGA結束。編碼序列可以是DNA、cDNA、合成的或重組的核苷酸序列。cDNA:術語“cDNA”在本文中定義為能夠通過反轉錄從得自真核細胞的成熟的、已剪接的mRNA分子制備的DNA分子。cDNA缺少可存在于相應基因組DNA中的內含子序列。起始的、初級的RNA轉錄物是mRNA的前體,其通過一系列的步驟加工然后作為成熟的已剪接的mRNA出現。這些步驟包括通過稱作剪接的過程除去內含子序列。因而源自mRNA的cDNA缺乏任何內含子序列。核酸構建體如本文中所使用的,術語“核酸構建體”指單鏈或雙鏈的核酸分子,所述核酸分子分離自天然存在的基因,或所述核酸分子以本來不存在于(nototherwiseexist)自然界中的方式修飾以含有核酸的區段,或所述核酸分子是合成的。當所述核酸構建體含有表達本發明的編碼序列所需的調控序列時,術語核酸構建體與術語“表達盒”同義。調控序列(controlsequence)術語“調控序列”在本文定義為包括表達編碼本發明多肽的多核苷酸所必需的所有組分。各調控序列對于編碼所述多肽的核苷酸序列可以是天然的或外來的,或各調控序列對于彼此可以是天然的或外來的。這些調控序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、啟動子、信號肽序列和轉錄終止子。最少的情況,調控序列包括啟動子和轉錄和翻譯的終止信號。調控序列可以和用于引入特異性限制位點的接頭一起提供,所述特異性限制位點促進調控序列與編碼多肽的核苷酸序列編碼區的連接。可操作連接的術語“可操作連接的”在本文表示這樣的構型,其中將調控序列置于相對于多核苷酸序列的編碼序列的適當位置,使得調控序列指導多肽編碼序列的表達。表達術語“表達”包括涉及多肽產生的任何步驟,其包括但不限于轉錄、轉錄后修飾、翻譯、翻譯后修飾和分泌。表達載體術語“表達載體”在本文定義為線性的或環狀的DNA分子,其包含編碼本發明多肽的多核苷酸,并且所述多核苷酸與提供用于其表達的額外核苷酸可操作連接。宿主細胞如本文中所使用的,術語“宿主細胞”包括任何細胞類型,所述細胞類型對于使用包含本發明多核苷酸的核酸構建體或表達載體的轉化、轉染、轉導等是易感的(susceptible)。修飾術語“修飾”在本文中指對由SEQIDNO2的成熟多肽組成的多肽或其同源序列的任何化學修飾,以及對編碼所述多肽的DNA的遺傳操作。所述修飾可以是一個或多個(數個)氨基酸的取代、缺失和/或插入以及一個或多個(數個)氨基酸側鏈的置換。人工變體在本文中使用時,術語“人工變體”指具有α-L-阿拉伯呋喃糖苷酶活性的多肽,所述多肽由表達SEQIDNO:1的成熟多肽編碼序列或其同源序列的修飾的核苷酸序列的生物體產生。所述修飾的核苷酸序列通過人為干預(humanintervention),通過修飾公開于SEQIDNO1的多核苷酸序列或它們的同源序列來獲得。發明詳述具有α-L-阿拉伯呋喃糖苷酶活性的多肽在第一個方面,本發明涉及包含氨基酸序列的分離的多肽,所述氨基酸序列與SEQIDNO2的成熟多肽具有優選至少70%,更優選至少75%,更優選至少80%,更優選至少85%,甚至更優選至少90%,最優選至少95%,并且甚至最優選至少96%,至少97%,至少98%,或至少99%的序列同一性程度,所述多肽具有α-L-阿拉伯呋喃糖苷酶活性(下文中的“同源多肽”)。在一個優選的方面,所述同源多肽具有氨基酸序列,其與SEQIDΝ0:2的成熟多肽相差十個氨基酸,優選相差五個氨基酸,更優選相差四個氨基酸,甚至更優選相差三個氨基酸,最優選相差兩個氨基酸,并且甚至最優選相差一個氨基酸。本發明的多肽優選包含SEQIDNO2的氨基酸序列或其等位變體;或它們的具有α-L-阿拉伯呋喃糖苷酶活性的片段。在一個優選的方面,多肽包含SEQIDNO2的氨基酸序列。在另一個優選方面,多肽包含SEQIDNO:2的成熟多肽。在另一個優選方面,多肽包含SEQIDNO:2的氨基酸18至387,或其等位變體;或它們的具有α-L-阿拉伯呋喃糖苷酶活性的片段。在另一個優選方面,多肽包含SEQIDNO:2的氨基酸18至387。在另一個優選的方面,多肽由SEQIDNO:2的氨基酸序列或其等位變體;或它們的具有α-L-阿拉伯呋喃糖苷酶活性的片段組成。在另一個優選的方面,多肽由SEQIDNO:2的氨基酸序列組成。在另一個優選方面,多肽由SEQIDNO:2的成熟多肽組成。在另一個優選的方面,多肽由SEQIDNO2的氨基酸18至387或其等位變體;或它們的具有α-L-阿拉伯呋喃糖苷酶活性的片段組成。在另一個優選的方面,多肽由SEQIDNO2的氨基酸18至387組成。在第二個方面,本發明涉及具有α-L-阿拉伯呋喃糖苷酶活性的分離的多肽,所述分離的多肽由多核苷酸編碼,所述多核苷酸在優選非常低的嚴格條件下,更優選低的嚴格條件下,更優選中等嚴格條件下,更優選中_高的嚴格條件下,甚至更優選高的嚴格條件下,并且最優選非常高的嚴格條件下,與以下雜交(i)SEQIDN0:1的成熟多肽編碼序列,()⑴的亞序列,或(iii)⑴或(ii)的全長互補鏈(J.Sambrook,E.F.Fritsch,禾口T.Maniatis,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。SEQIDNO:1的成熟多肽編碼序列的亞序列含有至少100個連續的核苷酸或優選至少200個連續的核苷酸。此外,所述亞序列可編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽片段。在一個優選的方面,所述互補鏈是SEQIDNO1的成熟多肽編碼序列的全長互補鏈。可以使用SEQIDNO1的核苷酸序列或其亞序列,以及SEQIDNO2的氨基酸序列或其片段來設計核酸探針以根據本領域內公知的方法從不同屬和種的菌株鑒定和克隆編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽的DNA。具體而言,遵循標準的Southern印跡方法,可將這些探針用于與感興趣的屬或種的基因組或cDNA雜交,以鑒定和從其中分離相應的基因。此類探針可明顯短于完整序列,但長度上應為至少14,優選至少25,更優選至少35,并且最優選至少70個核苷酸。然而,優選所述核酸探針是至少100個核苷酸長度。例如,所述核酸探針的長度可為至少200個核苷酸,優選至少300個核苷酸,更優選至少400個核苷酸,或最優選至少500個核苷酸。甚至可以使用更長的探針,例如,長度是優選至少600個核苷酸,更優選至少700個核苷酸,甚至更優選至少800個核苷酸,或最優選至少900個核苷酸的核酸探針。DNA和RNA探針二者均可使用。通常將探針標記以探測相應的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白標記)。本發明涵蓋此類探針。因此,可以對自此類其它菌株制備的基因組DNA或cDNA文庫篩選DNA,所述DNA與上文所描述的探針雜交并且編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽。可以通過瓊脂糖或聚丙烯酰胺凝膠電泳,或通過其它分離技術分離來自此類其它菌株的基因組或其它DNA。可以將來自文庫的DNA或分離的DNA轉移至硝酸纖維素或其它合適的載體材料并且固定于其上。為了鑒定與SEQIDNO:1或其亞序列同源的克隆或DNA,優選在Southern印跡中使用載體材料。就本發明而言,雜交指明核苷酸序列在非常低至非常高的嚴格條件下與經標記的核酸探針雜交,所述核酸探針對應于SEQIDNO1的成熟多肽編碼序列;其全長互補鏈;或它們的亞序列。可使用例如X射線片(X-rayfilm)來檢測在這些條件下與核酸探針雜交的分子。在一個優選的方面,核酸探針是SEQIDNO:1的成熟多肽編碼序列。在另一個優選的方面,核酸探針是SEQIDNO:1的核苷酸52至1161。在另一個優選的方面,核酸探針是編碼SEQIDNO:2的多肽的多核苷酸序列,或其亞序列。在另一個優選的方面,核酸探針是SEQIDNO:1。在另一個優選的方面,核酸探針是質粒pHinsGH62A中含有的多核苷酸序列,所述質粒pHinsGH62A包含在大腸桿菌(E.coli)NRRLB-50075中,其中所述其多核苷酸序列編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽。在另一個優選的方面,核酸探針是質粒pHinsGH62A中含有的成熟多肽編碼區,所述質粒pHinsGH62A包含在大腸桿菌NRRLB-50075中。對于長度至少100個核苷酸的長探針,將非常低至非常高的嚴格條件定義為在42°C,在5XSSPE、0.3%SDS、200yg/ml已剪切并且變性的鮭精DNA中,并且對于非常低和低的嚴格性為25%的甲酰胺、對于中等的和中-高的嚴格性為35%的甲酰胺、或對于高的和非常高的嚴格性為50%的甲酰胺,遵循標準的Southern印跡法進行預雜交和雜交最佳12至24小時。對于長度為至少100個核苷酸的長探針,使用2XSSC、0.2%SDS優選于45°C(非常低的嚴格性),更優選于50°C(低嚴格性),更優選于55°C(中等嚴格性),更優選于60°C(中-高嚴格性),甚至更優選于65°C(高嚴格性),并且最優選于70°C(非常高的嚴格性)將載體材料最終清洗三次,每次15分鐘。對于長度約15個核苷酸至約70個核苷酸的短探針,將嚴格條件定義為在比使用根據Bolton禾口McCarthy(1962,ProceedingsoftheNationalAcademyofSciencesUSA48:1390)的計算算出的Tm低約5°C至約10°C,在0.9MNaCl,0.09MTris-HClpH7.6、6mMEDTA.0.5%NP-40UXDenhardt氏溶液、ImM焦磷酸鈉(sodiumpyrophosphate)、ImM磷酸二氫鈉(sodiummonobasicphosphate),0.ImMATP和0.2mg每ml的酵母RNA中,遵循標準的Southern印跡方法進行預雜交、雜交和雜交后清洗最佳12至24小時。對于長度約15個核苷酸至約70個核苷酸的短探針,將所述載體材料在6XSCC加0.1%SDS中清洗一次15分鐘,并使用6XSSC在比計算的Tm低5°C至10°C的溫度清洗兩次,每次15分鐘。在第三個方面,本發明涉及由多核苷酸編碼的具有α-L-阿拉伯呋喃糖苷酶活性的分離的多肽,所述多核苷酸包含核苷酸序列或由核苷酸序列組成,所述核苷酸序列與SEQIDNO1的成熟多肽編碼序列具有優選至少70%,更優選至少75%,更優選至少80%,更優選至少85%,甚至更優選至少90%,最優選至少95%,并且甚至最優選至少96%,至少97%,至少98%,或至少99%的序列同一性程度,其編碼活性多肽。參見本文的多核苷酸部分。在第四個方面,本發明涉及人工變體,所述人工變體包含取代、缺失和/或插入一個或多個(數個)氨基酸的SEQIDNO2的成熟多肽;或其同源序列。優選地,氨基酸改變對性質是較不重要的(ofaminornature),即保守的氨基酸取代或插入,其不顯著影響蛋白質的折疊和/或活性;通常為1至約30個氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸殘基;多至約20-25個殘基的小接頭肽;或通過改變凈電荷或其它功能來促進純化的小延伸,諸如多組氨酸束(polyhistidinetract)、抗原性表位或結合域。保守取代的例子在以下組之內堿性氨基酸組(精氨酸、賴氨酸和組氨酸)、酸性氨基酸組(谷氨酸和天冬氨酸)、極性氨基酸組(谷氨酰胺和天冬酰胺)、疏水性氨基酸組(亮氨酸、異亮氨酸和纈氨酸)、芳族氨基酸組(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸組(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和甲硫氨酸)。通常不改變比活性的氨基酸取代是本領域己知的,并且由例如H.Neurath禾PR.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍發生的交換是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr>Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe>Ala/Pro>Lys/Arg>Asp/Asn>Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。除了20種標準的氨基酸外,非標準氨基酸(例如4-羥脯氨酸、6-N-甲基賴氨酸、2_氨基異丁酸、異纈氨酸和α-甲基絲氨酸)可以取代野生型多肽的氨基酸殘基。有限數量的非保守氨基酸、不由遺傳密碼編碼的氨基酸和非天然氨基酸可以取代氨基酸殘基。“非天然氨基酸”在蛋白質合成后已經過修飾,和/或在它們的側鏈具有不同于標準氨基酸的化學結構。非天然氨基酸能夠以化學方法合成,并且優選是商業上可獲得的,包括六氫吡啶羧酸(pipecolicacid)、噻唑烷羧酸(thiazolidinecarboxylicacid)、脫氫脯氨酸、3-和4-甲基脯氨酸和3,3-二甲基脯氨酸。或者,氨基酸改變具有這樣的性質以使多肽的物理化學性質改變。例如,氨基酸改變可改進多肽的熱穩定性,改變底物特異性,改變最適PH等。可以根據本領域已知的方法,諸如定點誘變或丙氨酸掃描誘變(Cunningham和Wells,1989,Science244:1081_1085)來鑒定親本多肽中的必需氨基酸。在后一種技術中,將單一丙氨酸突變引入到分子中的每個殘基,并且測試所得突變分子的生物學活性(即,α-L-阿拉伯呋喃糖苷酶活性)以鑒定對于所述分子的活性關鍵的氨基酸殘基。還可參見Hilton等,1996,J.Biol.Chem.271=4699-4708酶的活性位點或其它生物學相互作用也能通過對結構的物理分析來測定,如通過以下這些技術如核磁共振、晶體學、電子衍射或光親和標記,連同推定的接觸位點氨基酸的突變來測定。參見例如deVos等,1992,Science255:306_312;Smith等,1992,J.Mol.Biol.224:899_904;Wlodaver等,1992,FEBSLett.309:59-64。必需氨基酸的身份也能夠從與多肽的同一性分析來推斷,所述多肽與根據本發明的多肽相關。可以使用已知的誘變、重組和/或改組(shuffling)方法,然后是有關的篩選方法,諸如那些由Reidhaar-Olson禾ΠSauer,1988,Science241:53_57;Bowie禾ΠSauer,1989,Proc.Natl.Acad.Sci.USA86:2152_2156;WO95/17413;或WO95/22625公開的方法來進行并測試單個或多個氨基酸取代、缺失和/或插入。可以使用的其它方法包括易錯PCR、噬菌體展示(例如Lowman等,1991,Biochem.3010832-10837;美國專利號5,223,409;WO92/06204)和區域定向的誘變(Derbyshire等,1986,Gene46145;Ner等,1988,DNA7127)。誘變/改組方法可以與高通量、自動化的篩選方法組合以檢測由宿主細胞表達的克隆的、誘變的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。可以從宿主細胞回收編碼活性多肽的誘變的DNA分子,并且使用本領域內標準方法快速測序。這些方法允許快速測定感興趣的多肽中單個氨基酸殘基的重要性,并且可以應用于未知結構的多肽。SEQIDNO2的成熟多肽,諸如SEQIDNO2的氨基酸18至387的氨基酸取代、缺失和/或插入的總數是10,優選9,更優選8,更優選7,更優選至多6,更優選5,更優選4,甚至更優選3,最優選2,并且甚至最優選1。具有α-L-阿拉伯呋喃糖苷酶活性的多肽的來源本發明具有α-L-阿拉伯呋喃糖苷酶活性的多肽可以獲自任何屬的微生物。就本發明而言,如本文中所使用的,與給定的來源有關的術語“獲自”,應當意味著核苷酸序列編碼的多肽由所述來源產生,或由其中插入了來自所述來源的核苷酸序列的菌株產生。在一個優選的方面,獲自給定來源的多肽是胞外分泌的。本發明具有α-L-阿拉伯呋喃糖苷酶活性的多肽可以是細菌多肽。例如,所述多肽可以是具有α-L-阿拉伯呋喃糖苷酶活性的革蘭氏陽性細菌多肽諸如芽孢桿菌屬(Bacillus)、鏈球菌屬(Str印tococcus)、鏈霉菌屬(Str印tomyces)、葡萄球菌屬(Staphylococcus)、腸球菌屬(Enterococcus)、乳桿菌屬(Lactobacillus)、乳球菌屬(Lactococcus)>It^M(Clostridium)>jft^ifeff^M(Geobacillus)胃屬(Oceanobacillus)多肽;或具有α-L-阿拉伯呋喃糖苷酶活性的革蘭氏陰性細菌多肽,諸如大腸桿菌(E.coli)、假單胞菌屬(Pseudomonas)、沙門氏菌屬(Salmonella)、彎曲桿菌屬(Campylobacter)lifM(Helicobacter)、黃桿菌屬(Flavobacterium)、梭桿菌屬(Fusobacterium)、泥桿菌屬(Ilyobacter)、奈瑟氏菌屬(Neisseria)或脲原體屬(Ureaplasma)多妝。在一個優選的方面,所述多肽是具有ex-L-阿拉伯呋喃糖苷酶活性的嗜堿芽孢桿胃(Bacillusalkalophilus)、Ι定㈱Ii包If胃(Bacillusamyloliquefaciens)、失豆Ii包If菌(Bacillusbrevis)、環狀芽孢桿菌(Bacilluscirculans)、克勞氏芽孢桿菌(Bacillus13clausii)、凝結芽孢桿菌(Bacilluscoagulans)、堅強芽孢桿菌(Bacillusfirmus)、燦爛芽孢桿菌(Bacilluslautus)、遲緩芽孢桿菌(Bacilluslentus)、地衣芽孢桿菌(Bacilluslicheniformis)、巨大芽孢桿菌(Bacillusmegaterium)、短小芽孢桿菌(Bacilluspumilus)、嗜熱月旨肪芽孢桿菌(Bacillusstearothermophilus),枯草芽孢桿菌(Bacillussubtilis)或蘇云金芽孢桿菌(Bacillusthuringiensis)多肽。在另一個優選的方面,所述多肽是具有α-L-阿拉伯呋喃糖苷酶活性的似馬鏈球菌(Streptococcusequisimilis)、酉良胺鏈球菌(Streptococcuspyogenes)、乳房鏈球菌(Streptococcusuberis)或馬鏈球菌獸痕亞禾中(Streptococcusequisubsp.Zooepidemicus)多月太。在另一個優選的方面,所述多肽是具有α-L-阿拉伯呋喃糖苷酶活性的不產色鏈霉菌(Streptomycesachromogenes)、除蟲鏈霉菌(Streptomycesavermitilis)、天藍鏈霉菌(Streptomycescoelicolor)、灰色鏈霉菌(Streptomycesgriseus)或淺青紫鏈霉菌(Streptomyceslividans)多月太。本發明具有α-L-阿拉伯呋喃糖苷酶活性的多肽也可以是真菌多肽,并且更優選具有α-L-阿拉伯呋喃糖苷酶活性的酵母多肽諸如念珠菌屬(Candida)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Pichia)、酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)或西洋蓍霉屬(Yarrowia)多肽;或更優選具有α-L-阿拉伯呋喃糖苷酶活性的絲狀真菌多肽諸如枝頂孢霉屬(Acremonium)、蘑菇屬(Agaricus)、鏈格孢屬(Alternaria)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、葡萄座腔菌屬(Botryospaeria)、擬賭菌屬(Ceriporiopsis)、毛_殼屬(Chaetomidium)、金抱子菌屬(Chrysosporium)、麥角菌屬(Clavic印s)、旋孢腔菌屬(Cochliobolus)、鬼傘屬(Coprinopsis)、Coptotermes>棒囊殼屬(Corynascus)、β急叢赤殼屬(Cryphonectria)、隱球菌屬(Cryptococcus)、色二孢屬(Diplodia)、黑耳屬(Exidia)、Filibasidium、鐮孢屬(Fusarium)、赤霉屬(Gibberella)、全鞭毛蟲屬(Holomastigotoides)、腐質霉屬(Humicola)、奉巴齒菌屬(Irpex)、香燕屬(Lentinula)、小球腔菌屬(Leptospaeria)>梨孢菌屬(Magnaporthe)、Melanocarpus、節毛菌屬(Meripilus)、毛霉屬Mucor)、毀絲霉屬(Myceliophthora)、新考瑪月旨霄屬(Neocallimastix)、脈抱菌屬(Neurospora)>擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、平革菌屬(Phanerochaete)、瘤胃壺菌屬(Piromyces)、Poitrasia,假黑盤菌屬(Pseudoplectania)、假披發蟲屬(Pseudotrichonympha)、根毛霉屬(Rhizomucor)、裂裙菌屬(Schizophyllum)、節隔孢屬/柱頂孢屬(Scytalidium)、踝節菌屬(Talaromyces)、熱子囊菌屬/嗜熱霉屬(Thermoascus)、梭抱殼屬(Thielavia)、彎頸霉屬(Tolypocladium)、木霉屬(Trichoderma)、Trichophaea、輪枝孢屬(Verticillium)、草屬(Volvariella)、或炭角菌屬(Xylaria)多肽。在一個優選的方面,所述多肽是具有α-L-阿拉伯呋喃糖苷酶活性的卡爾酵母(Saccharomycescarlsbergensis)、酉良酒酵母(Saccharomycescerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克魯弗酵母(Saccharomyceskluyveri)、諾地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)多月太。14在另一個優選方面,所述多肽是具有α-L-阿拉伯呋喃糖苷酶活性的解纖維枝丁頁抱霉(Acremoniumcellulolyticus)、棘抱曲霉(Aspergillusaculeatus)、^^ffiβ(Aspergillusawamori)Λffiβ(Aspergillusfumigatus)、1ffiβ(Aspergillusfoetidus)、曰本曲霉(Aspergillusjaponicus)、構巢曲霉(Sspergillusnidulans)、漂曲霉(Aspergillusniger)、米曲霉(Aspergillusoryzae)、嗜角質金抱子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、熱帶金抱子菌(Chrysosporiumtropicum)、Chrysosporiummerdarium、Chrysosporiuminops、租金抱子菌(Chrysosporiumpannicola)、ChrysosporiumqueenslandicumΛChrvsosporiumzonatum、桿抱狀德抱(Fusariumbactridioides)、禾谷德抱(Fusariumcerealis)、庫威,廉抱(Fusariumcrookwellense)、大刀,廉抱(Fusariumculmorum)、禾本禾斗德抱(Fusariumgraminearum)、禾赤德抱(Fusariumgraminum)、異抱德抱(Fusariumheterosporum)、合歡木德抱(Fusariumnegundi)、尖德抱(Fusariumoxysporum)、多枝德抱(Fusariumreticulatum)、粉紅德抱(Fusariumroseum)、接骨木,廉抱(Fusariumsambucinum)、膚色,廉?包(Fusariumsarcochroum)、擬分枝抱,廉抱(Fusariumsporotrichioides)、硫色鐮?包(Fusariumsulphureum)、圓鐮孢(Fusariumtorulosum)、擬絲孢鐮孢(Fusariumtrichothecioides)、鑲片鐮孢(Fusariumvenenatum)、白囊奉巴齒菌(Irpexlacteus)、^■€β(Mucormiehei)、口f%罾M胃(Myceliophthorathermophila)、粗糙脈孢菌(Neurosporacrassa)、繩狀青霉(Penicilliumfuniculosum)、產紫青霉(Penicilliumpurpurogenum)、黃抱平革菌(Phanerochaetechrysosporium)、Thielaviaachromatica、Thielaviaalbomyces、Thielaviaalbopilosa、澳洲梭抱殼(Thielaviaaustraleinsis)、Thielaviafimeti、小抱梭抱殼(Thielaviamicrospora)、卵抱梭抱殼(Thielaviaovispora)、Thielaviaperuviana、罾包冑(Thielaviaspededonium)、毛梭抱殼(Thielaviasetosa)、Thielaviasubthermophila、土生梭抱霉(Thielaviaterrestris)、哈茨木毒(Trichodermaharzianum)、康寧木毒(Trichodermakoningii)、長枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)或綠色木霉(Trichodermaviride)多月太。在另一個優選的方面,所述多肽是灰色腐質霉(Humicolagrisea)、特異腐質霉或疏棉狀腐質霉多肽。在一個更優選的方面,所述多肽是具有ex-L-阿拉伯呋喃糖苷酶活性的特異腐質霉。在一個最優選的方面,所述多肽是具有α-L-阿拉伯呋喃糖苷酶活性的特異腐質霉DSM1800多肽,例如包含SEQIDNO2的成熟多肽的多肽。應當理解的是對于前述的種,本發明涵蓋完全和不完全階段(perfectmdimperfectstates),和其它分類學的等同物(equivalent),例如無性型(mamorph),而無論它們已知的種名。本領域熟練技術人員將容易地識別適合的等同物的同一性。這些種的菌株在許多培養物保藏中心對于公眾能夠容易地取得,所述保藏中心諸如美國典型培養物保藏中心(theAmericanTypeCultureCollection,ATCC)、德意志微生物禾口細胞培養物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSM)、真菌菌種保藏中心(CentraalbureauVoorSchimmelcultures,CBS)和農業研究機構專利培養物保藏中心北區研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter,NRRL)。此外,可以使用上述的探針從其它來源,包括從自然界(例如,土壤、堆肥、水等)分離的微生物鑒定和獲得此類多肽。用于從天然生境(habitat)分離微生物的技術是本領域內公知的。隨后可通過相似地篩選所述微生物的基因組或cDNA文庫來獲得所述多核苷酸。一旦用所述探針檢測到編碼多肽的多核苷酸序列,就可以使用本領域普通技術人員熟知的技術將所述多核苷酸分離或克隆(參見例如,Sambrook等,1989,見上文)。本發明的多肽還包括融合多肽或可切割的融合多肽,其中將另外的多肽融合到所述多肽或其片段的N末端或C末端。通過將編碼另一個多肽的核苷酸序列(或其部分)融合于本發明的核苷酸序列(或其部分)來產生融合的多肽。產生融合多肽的技術是本領域已知的,并包括連接編碼多肽的編碼序列以使它們在讀碼框中,并且使融合多肽的表達在相同啟動子和終止子的控制下。融合多肽還可以包括切割位點。一旦分泌了融合多肽,就切割所述位點,從融合蛋白質釋放具有α-L-阿拉伯呋喃糖苷酶活性的多肽。切割位點的例子包括,但不限于,編碼二肽Lys-Arg的Kex2位點(Martin等,2003,J.Ind.Microbiol.Biotechnol.3568-576;Svetina,2000,J.Biotechnol.76245-251;Rasmussen-ffiIsonφ,1997,Appl.Environ.Microbiol.633488-3493;Ward等,1995,Biotechnology13498-503;和Contreras等,1991,Biotechnology9:378_381);Ile_(Glu或Asp)-Gly-Arg位點,其在精氨酸殘基后通過FactorXa蛋白酶切割(Eaton等,1986,Biochem.25:505_512);Asp-Asp-Asp-Asp-Lys位點,其在賴氨酸后通過腸激酶切割(Collins-Racie等,1995,Biotechnology13:982_987);His-Tyr-Glu位點或His-Tyr-Asp位點,其通過GenenaseI切割(Carter等,1989,ProteinsStructure,Function,andGenetics6:240_248);Leu-Val-Pro-Arg-Gly-Ser位點,其在Arg后通過凝血酶切割(Stevens,2003,DrugDiscoveryWorld435-48);Glu-Asn-Leu-Tyr-Phe-Gln-Gly位點,其在Gln后通過TEV蛋白酶切割(Stevens,2003,見上文);和Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位點,其在Gln后通過基因工程形式的人鼻病毒3C蛋白酶切割(Stevens,2003,見上文)。多核苷酸本發明還涉及分離的多核苷酸,其包含編碼本發明具有α-L-阿拉伯呋喃糖苷酶活性的多肽的核苷酸序列,或由所述核苷酸序列組成。在一個優選的方面,核苷酸序列包含SEQIDNO1或由SEQIDNO=I組成。在另一個更優選的方面,核苷酸序列包含大腸桿菌NRRLΒ-50075中所含質粒pHinsGH62A中含有的序列,或由該序列組成。在另一個優選的方面,核苷酸序列包含SEQIDNO:1的成熟多肽編碼序列或由SEQIDNO:1的成熟多肽編碼序列組成。在另一個優選的方面,核苷酸序列包含SEQIDNO:1的核苷酸52至1161或由SEQIDNO:1的核苷酸52至1161組成。在另一個更優選的方面,核苷酸序列包含質粒pHinsGH62A中含有的成熟多肽編碼序列或由該成熟多肽編碼序列組成,所述質粒pHinsGH62A包含在大腸桿菌NRRLB-50075中。本發明還涵蓋編碼多肽的核苷酸序列,所述多肽包含SEQIDNO:2的氨基酸序列或其成熟多肽,或由SEQIDNO:2的氨基酸序列或其成熟多肽組成;由于遺傳密碼的簡并性,所述核苷酸序列不同于SEQIDNO:1或其成熟多肽編碼序列。本發明還涉及SEQIDNO:1的亞序列,所述亞序列編碼SEQIDN0:2中具有α-L-阿拉伯呋喃糖苷酶活性的片段。本發明還涉及突變多核苷酸,所述突變多核苷酸在SEQIDNO1的成熟多肽編碼序列中包含至少一個突變或由具有至少一個突變的SEQIDNO:1的成熟多肽編碼序列組成,其中所述突變核苷酸序列編碼SEQIDNO2的成熟多肽。用于分離或克隆編碼多肽的多核苷酸的技術是本領域內已知的,包括從基因組DNA分離,從cDNA制備,或其組合。可通過例如使用熟知的聚合酶鏈式反應(PCR)或表達文庫的抗體篩選來檢測具有共享結構特性的克隆DNA片段,從而實現從這種基因組DNA克隆本發明的多核苷酸。參見例如,Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork0可以使用其它核酸擴增方法,諸如連接酶鏈式反應(LCR)、連接活化轉錄(ligatedactivatedtranscription;LAT)和基于核苷酸序列的擴增(NASBA)。可以從腐質霉屬(Humicola)菌株,或其它或相關生物體克隆多核苷酸,并且因而可以是例如所述核苷酸序列的多肽編碼區的等位變體或種變體。本發明還涉及分離的多核苷酸,其包含下述核苷酸序列或由其組成,所述核苷酸序列與SEQIDNO:1的成熟多肽編碼序列具有優選至少70%,更優選至少75%,更優選至少80%,更優選至少85%,甚至更優選至少90%,最優選至少95%,并且甚至最優選至少96%,至少97%,至少98%,或至少99%的序列同一性程度,所述多核苷酸編碼活性多肽。修飾編碼本發明多肽的核苷酸序列對于合成與所述多肽基本上相似的多肽可為必需的。術語與所述多肽“基本上相似”指多肽的非天然存在的形式。這些多肽可能以一些工程改造的方式而不同于從其天然來源分離的多肽,例如,比活性、熱穩定性、最適PH等方面不同的人工變體。可以在作為SEQIDNO:1的成熟多肽編碼序列呈現的核苷酸序列,例如其亞序列的基礎上,和/或通過引入如下核苷酸取代來構建變體序列所述取代不產生由核苷酸序列編碼的多肽的另外的氨基酸序列,但是符合意欲產生酶的宿主生物體的密碼子選擇;或者所述取代可產生不同的氨基酸序列。關于核苷酸取代的概述,參見,例如,Ford等,1991,ProteinExpressionandPurification2一107。對于本領域技術人員顯而易見的是,這些取代能在對于分子功能重要的區域之外進行,并且仍然產生活性多肽。對于由本發明的分離的多核苷酸編碼的多肽活性關鍵的并且因此優選不進行取代的氨基酸殘基,可以根據本領域公知的方法,例如定點誘變或丙氨酸掃描誘變(參見,例如,Cunningham和Wells,1989,見上文)來鑒定。在后一種技術中,將突變引入到分子中的每個帶正電荷的殘基處,并且測試所得突變分子的α-L-阿拉伯呋喃糖苷酶活性,以鑒定對于所述分子的活性關鍵的氨基酸殘基。底物_酶相互作用的位點也能夠通過分析三維結構來測定,如通過核磁共振分析、晶體學或光親和標記等技術所測定的(參見,例如,deVos等,1992,見上文;Smith等,1992,見上文;Wlodaver等,1992,見上文)。本發明還涉及編碼本發明多肽的分離的多核苷酸,所述分離的多核苷酸在非常低的嚴格條件下,優選低嚴格條件,更優選中等嚴格條件,更優選中_高嚴格條件,甚至更優選高嚴格條件,并且最優選非常高的嚴格條件下,與以下序列雜交SEQIDNO:1的成熟多肽編碼序列或其全長互補鏈;或它們的等位變體和亞序列(Sambrook等,1989,見上文),如本文所定義的。本發明還涉及分離的多核苷酸,所述分離的多核苷酸通過以下方法獲得(a)在非常低、低、中等、中-高、高或非常高嚴格條件下,將DNA的群體與SEQIDNO:1的成熟多17肽編碼序列或其全長互補鏈雜交;和(b)分離雜交的多核苷酸,其編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽。核酸構建體本發明還涉及包含本發明的分離的多核苷酸的核酸構建體,所述分離的多核苷酸與一個或多個(數個)調控序列可操作地連接,所述調控序列在合適的宿主細胞中在與該調控序列相容的條件下指導編碼序列的表達。可以用許多方式操作編碼本發明多肽的分離的多核苷酸以提供多肽的表達。依賴于表達載體,在將多核苷酸的序列插入載體之前對其進行操作可能是理想的或必需的。使用重組DNA方法修飾多核苷酸序列的技術是本領域熟知的。調控序列可以是適當的啟動子序列,其是由用于表達編碼本發明多肽的多核苷酸的宿主細胞識別的核苷酸序列。啟動子序列含有介導多肽的表達的轉錄調控序列。啟動子可以是在所選的宿主細胞中顯示轉錄活性的任何核苷酸序列,包括突變的、截短的和雜合的啟動子,并且可以從編碼與宿主細胞同源或異源的胞外或胞內多肽的基因獲得。用于指導本發明的核酸構建體轉錄,特別是在細菌宿主細胞中轉錄的合適啟動子的例子是從下述獲得的啟動子大腸桿菌Iac操縱子、天藍色鏈霉菌(Str印tomycescoelicolor)瓊脂糖酶基因(dagA)、枯草芽孢桿菌果聚糖蔗糖酶基因(sacB)、地衣芽孢桿菌α-淀粉酶基因(amyL)、嗜熱脂肪芽孢桿菌產麥芽淀粉酶基因(amyM)、解淀粉芽孢桿菌α-淀粉酶基因(amyQ)、地衣芽孢桿菌青霉素酶基因(penP)、枯草芽孢桿菌xylA和xylB基因和原核β-內酰胺酶基因(Villa-Kamaroff等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:3727_3731),以及tac啟動子(DeBoer等,1983,ProceedingsoftheNationalAcademyofSciencesUSA80:21-25)。另外的啟動子在"Usefulproteinsfromrecombinantbacteria,,于ScientificAmerican,1980,242:74_94中;禾口在Sambrook等,1989,見上文中描述。用于指導本發明的核酸構建體在絲狀真菌宿主細胞中轉錄的合適啟動子的例子是從下列酶的基因獲得的啟動子米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸穩定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構酶、構巢曲霉乙酰胺酶、鑲片鐮孢淀粉葡糖苷酶(W000/56900)、鑲片鐮孢Daria(WC)00/56900)、鑲片鐮孢Quirm(W000/56900)、尖鐮孢胰蛋白酶樣蛋白酶(W096/00787)、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶I、里氏木霉纖維二糖水解酶II、里氏木霉內切葡聚糖酶I、里氏木霉內切葡聚糖酶II、里氏木霉內切葡聚糖酶III、里氏木霉內切葡聚糖酶IV、里氏木霉內切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi啟動子(來自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸異構酶基因的啟動子的雜合體);和它們的突變的、截短的和雜合的啟動子。在酵母宿主中,有用的啟動子從如下酶的基因獲得釀酒酵母烯醇化酶(ΕΝ0-1)、釀酒酵母半乳糖激酶(GALl)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH1,ADH2/GAP)、釀酒酵母丙糖磷酸異構酶(TPI)、釀酒酵母金屬硫蛋白(CUPl)和釀酒酵母3-磷酸甘油酸激酶。對于酵母宿主細胞其它有用的啟動子由Romanos等,1992,Yeast8:423_488描述。18調控序列也可以是合適的轉錄終止子序列,是由宿主細胞識別以終止轉錄的序列。所述終止子序列與編碼所述多肽的核苷酸序列的3’末端可操作地連接。可以將在所選宿主細胞中有功能的任何終止子用在本發明中。對于絲狀真菌宿主細胞優選的終止子從如下酶的基因獲得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構巢曲霉鄰氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖鐮孢胰蛋白酶樣蛋白酶。對于酵母宿主細胞優選的終止子從如下酶的基因獲得釀酒酵母烯醇化酶、釀酒酵母細胞色素C(CYCl)和釀酒酵母甘油醛-3-磷酸脫氫酶。對于酵母宿主細胞其它有用的終止子由Romanos等,1992,見上文描述。調控序列還可以是合適的前導序列,其是對于宿主細胞的翻譯重要的mRNA非翻譯區。前導序列可操作地連接于編碼多肽的核苷酸序列的5’-末端。可以將在所選宿主細胞中有功能的任何前導序列用在本發明中。對于絲狀真菌宿主細胞優選的前導序列從如下酶的基因獲得米曲霉TAKA淀粉酶和構巢曲霉丙糖磷酸異構酶。對于酵母宿主細胞合適的前導序列從如下酶的基因獲得釀酒酵母烯醇化酶(ΕΝ0-1)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母α因子和釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)。調控序列也可以是聚腺苷酸化序列,其是與核苷酸序列的3,末端可操作地連接的序列,并且在轉錄時,宿主細胞將其識別為將聚腺苷殘基添加至轉錄的mRNA的信號。可以將在所選宿主細胞中有功能的任何聚腺苷酸化序列在本發明中使用。對于絲狀真菌宿主細胞優選的聚腺苷酸化序列從如下酶的基因獲得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構巢曲霉鄰氨基苯甲酸合酶、尖鐮孢胰蛋白酶樣蛋白酶和黑曲霉α-葡糖苷酶。對于酵母宿主細胞有用的聚腺苷酸化序列由Guo和Sherman,1995,MolecularCellularBiology15:5983_5990描述。調控序列還可以是信號肽編碼序列,其編碼與多肽的氨基末端相連的氨基酸序列,并且指導編碼的多肽進入細胞分泌途徑。核苷酸序列的編碼序列5’端可固有地包含信號肽編碼序列,其與編碼分泌多肽的編碼序列片段一起天然地連接在翻譯閱讀框中。或者,編碼序列5’端可含有對于所述編碼序列異源的信號肽編碼序列。異源信號肽編碼序列在編碼序列不天然地含有信號肽編碼序列時可為必需的。或者,外源信號肽編碼序列可以簡單地取代天然信號肽編碼序列以增強多肽的分泌。然而,指導表達的多肽進入所選宿主細胞的分泌途徑(即,分泌至培養基中)的任何信號肽編碼序列可在本發明中使用。對于細菌宿主細胞有效的信號肽編碼序列是從如下酶的基因獲得的信號肽編碼序列芽孢桿菌屬NCIB11837產麥芽糖淀粉酶、嗜熱脂肪芽孢桿菌α-淀粉酶、地衣芽孢桿菌枯草蛋白酶(subtilisin)、地衣芽孢桿菌β-內酰胺酶、嗜熱脂肪芽孢桿菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢桿菌prsA。另外的信號肽由Simonen和Palva,1993,MicrobiologicalReviews57109-137描述。對于絲狀真菌宿主細胞有效的信號肽編碼序列是從如下酶的基因獲得的信號肽編碼序列米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特異腐質霉纖維素酶、特異腐質霉內切葡聚糖酶V和疏棉狀腐質霉脂肪酶。對于酵母宿主細胞有用的信號肽從釀酒酵母α因子和釀酒酵母轉化酶的基因獲得。其它有用的信號肽編碼序列由Romanos等,1992,見上文描述。在一個優選的方面,信號肽包含SEQIDNO:2的氨基酸1至17或者由SEQIDNO:2的氨基酸1至17組成。在另一個優選的方面,信號肽編碼區包含SEQIDNO1的核苷酸1至51或者由SEQIDNO1的核苷酸1至51組成。調控序列還可以是前肽編碼序列,其編碼位于多肽氨基末端的氨基酸序列。所得多肽稱為酶原(proenzyme)或前多肽(propolyp印tide)(或在某些情況下稱為酶原(zymogen))0前多肽通常是無活性的并且能夠通過前肽的催化或自催化切割從前多肽轉化為成熟活性多肽。可以從枯草芽孢桿菌堿性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、釀酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜熱毀絲霉漆酶(W095/33836)的基因獲得前肽編碼序列。當信號肽和前肽序列二者均出現在多肽的氨基末端時,將前肽序列置于緊接著(nextto)多肽氨基末端,并且將信號肽序列置于緊接著前肽序列的氨基末端。同樣理想的是添加調節序列,其允許相對于宿主細胞的生長來調節多肽的表達。調節系統的例子是引起基因表達響應化學或物理刺激物,包括調節化合物的存在而開啟或關閉的那些系統。原核系統中的調節系統包括lac、tac和trp操縱基因系統。在酵母中,可以使用ADH2系統或GALl系統。在絲狀真菌中,可以使用TAKAα-淀粉酶啟動子、黑曲霉葡糖淀粉酶啟動子和米曲霉葡糖淀粉酶啟動子作為調節序列。調節序列的其它例子是那些允許基因擴增的序列。在真核系統中,這些調節序列包括在氨甲蝶呤(methotrexate)存在下擴增的二氫葉酸還原酶基因,和以重金屬(withheavymetal)擴增的金屬硫蛋白基因。在這些情況下,編碼多肽的核苷酸序列將與調節序列可操作地連接。表達載體本發明還涉及重組表達載體,所述重組表達載體包含本發明的多核苷酸、啟動子和轉錄和翻譯終止信號。本文所述的多種核酸和調控序列可以結合在一起以產生重組表達載體,所述表達載體可以包括一個或多個(數個)方便的限制位點以允許在這些位點插入或取代編碼多肽的核苷酸序列。可供選擇的是,可以通過在適當的用于表達的載體中插入包含所述序列的核苷酸序列或核酸構建體來表達本發明的核苷酸序列。在制備表達載體的過程中,將編碼序列置于載體中,從而將該編碼序列與適當的表達調控序列可操作地連接。重組表達載體可以是任何載體(例如,質粒或病毒),其能夠方便地進行重組DNA步驟,并且能夠產生核苷酸序列的表達。載體的選擇將通常依賴于載體與將引入該載體的宿主細胞的相容性。載體可以是線狀或閉合環狀質粒。載體可以是自主復制載體,即,作為染色體外實體(entity)存在的載體,其復制獨立于染色體復制,例如,質粒、染色體外元件、微型染色體(minichromosome)或人工染色體。載體可以含有任何用于確保自復制的手段(means)。或者,載體可以是一種當被引入宿主細胞中時,整合到基因組中并且與整合了該載體的染色體一起復制的載體。此外,可以使用單獨的載體或質粒或兩個或更多個載體或質粒,其共同含有待引入宿主細胞基因組的完整DNA(totalDNA),或可以使用轉座子(transposon)。本發明的載體優選地含有一個或幾個選擇性標記,其允許簡單選擇經轉化、轉染、轉導等的細胞。選擇性標記是基因,其產物提供殺生物劑或病毒抗性、對重金屬的抗性、對營養缺陷型的原養性(prototrophytoauxotrophs)等。細菌選擇性標記的例子是來自枯草芽孢桿菌或地衣芽孢桿菌的dal基因,或賦予抗生素抗性的標記,所述抗生素抗性例如氨芐青霉素、卡那霉素、氯霉素或四環素抗性。對于酵母宿主細胞合適的標記是ADE2、HIS3、LEU2、LYS2、MET3、TRPl和URA3。用于絲狀真菌宿主細胞的選擇性標記包括但不限于amdS(乙酰胺酶)、argB(鳥氨酸氨甲酰基轉移酶)、bar(草銨膦(phosphinothricin)乙酰轉移酶)、hph(潮霉素磷酸轉移酶)、niaD(硝酸還原酶)(nitratereductase)、pyrG(乳清酸核苷-5,-磷酸脫羧酶)(orotidine-5’-phosphatedecarboxylase)、sC(硫酸腺苷酰轉移酶)和trpC(鄰氨基苯甲酸合酶(anthraniIatesynthase))以及它們的等價物。優選用在曲霉屬細胞中的是構巢曲霉或米曲霄的amdS禾口pyrG基因禾口吸水鏈霄菌(Streptomyceshygroscopicus)的bar基因。本發明的載體優選含有元件,其允許載體整合入宿主細胞基因組或載體在細胞中獨立于基因組的自主復制。為了整合入宿主細胞基因組,載體可依賴編碼多肽的多核苷酸的序列或用于通過同源或非同源重組整合入基因組的任何其它載體元件。或者,載體可以含有額外的核苷酸序列,用于指導通過同源重組整合入宿主細胞基因組染色體中的精確位置。為了增加在精確位置整合的可能性,整合元件應優選含有足夠數量的核酸,如100至10,000堿基對,優選400至10,000堿基對,并且最優選800至10,000堿基對,其與相應的目標序列具有高度序列同一性以增強同源重組的概率。整合元件可以是任何序列,其與宿主細胞基因組中的目標序列同源。此外,整合元件可以是非編碼或編碼的核苷酸序列。另一方面,可以將載體通過非同源重組整合到宿主細胞的基因組中。為了自主復制,載體可以還包含復制起點,其使載體能夠在所述的宿主細胞中自主地復制。復制起點可以是介導自主復制的任何質粒復制子(r印licator),其在細胞中發揮功能。術語“復制起點”或“質粒復制子”在本文定義為能夠使質粒或載體體內復制的核苷酸序列。細菌復制起點的例子是允許在大腸桿菌中復制的質粒pBR322、pUC19、pACYC177和pACYC184的復制起點,和允許在芽孢桿菌屬中復制的質粒pUBllO、pE194、pTA1060和ρΑΜβ1的復制起點。用于酵母宿主細胞中的復制起點的例子是2微米復制起點,ARSl,ARS4,ARSl和CEN3的組合,和ARS4和CEN6的組合。在絲狀真菌細胞中有用的復制起點的例子是AMAl和ANSI(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsResearch159163-9175;WO00/24883)。分離AMAl基因和構建包含該基因的質粒或載體能夠根據公開于WO00/24883中的方法完成。可以將多于一個拷貝的本發明的多核苷酸插入宿主細胞以增加基因產物的產生。多核苷酸拷貝數的增加可通過如下方法獲得將至少一個額外拷貝的序列整合入宿主細胞基因組,或將可擴增的選擇性標記基因包括于多核苷酸,其中可通過在合適的選擇劑(selectableagent)存在下培養細胞來選擇含有選擇性標記基因的擴增拷貝,從而含有多核苷酸的額外拷貝的細胞。用于連接上述元件以構建本發明的重組表達載體的方法是本領域技術人員熟知21的(參見,例如,Sambrook等,1989,見上文)。宿主細胞本發明還涉及重組宿主細胞,其包含本發明的分離的多核苷酸,所述重組宿主細胞在所述多肽的重組生產中有利使用。將包含本發明多核苷酸的載體導入宿主細胞中,使得載體作為染色體整合物或者作為自我復制的染色體外載體維持,如較早所描述的。術語“宿主細胞”涵蓋由于復制過程中發生的突變而與親本細胞不同的親本細胞的任何后代。宿主細胞的選擇會很大程度上取決于編碼多肽的基因及其來源。宿主細胞可以是在本發明的多肽的重組產生中有用的任何細胞,例如,原核或真核細胞。原核宿主細胞可以是任何革蘭氏陽性細菌或革蘭氏陰性細菌。革蘭氏陽性細菌包括但不限于,芽孢桿菌屬、鏈球菌屬、鏈霉菌屬、葡萄球菌屬、腸球菌屬、乳桿菌屬、乳球菌屬、梭菌屬、地芽孢桿菌屬和海洋芽孢桿菌屬。革蘭氏陰性細菌包括但不限于,大腸桿菌、假單胞菌屬、沙門氏菌屬、彎曲桿菌屬、螺桿菌屬、黃桿菌屬、梭桿菌屬、泥桿菌屬、奈瑟氏菌屬和脲原體屬。細菌宿主細胞可以是任何芽孢桿菌屬細胞。在本發明的實施中有用的芽孢桿菌屬細胞包括但不限于,嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環狀芽孢桿菌、克勞氏芽孢桿菌、凝結芽孢桿菌、堅強芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌和蘇云金芽孢桿菌細胞。在一個優選的方面,細菌宿主細胞是解淀粉芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、嗜熱脂肪芽孢桿菌或枯草芽孢桿菌細胞。在一個更優選的方面,細菌宿主細胞是解淀粉芽孢桿菌細胞。在另一個更優選的方面,細菌宿主細胞是克勞氏芽孢桿菌細胞。在另一個更優選的方面,細菌宿主細胞是地衣芽孢桿菌細胞。在另一個更優選的方面,細菌宿主細胞是枯草芽孢桿菌細胞。細菌宿主細胞還可以是任何鏈球菌屬細胞。在本發明的實施中有用的鏈球菌屬細胞包括但不限于,似馬鏈球菌、釀膿鏈球菌、乳房鏈球菌和馬鏈球菌獸瘟亞種細胞。在一個優選的方面,細菌宿主細胞是似馬鏈球菌細胞。在另一個優選的方面,細菌宿主細胞是釀膿鏈球菌細胞。在另一個優選的方面,細菌宿主細胞是乳房鏈球菌細胞。在另一個優選的方面,細菌宿主細胞是馬鏈球菌獸瘟亞種細胞。細菌宿主細胞還可以是任何鏈霉菌屬細胞。在本發明的實施中有用的鏈霉菌屬細胞包括但不限于,不產色鏈霉菌、除蟲鏈霉菌、天藍鏈霉菌、灰色鏈霉菌和淺青紫鏈霉菌細胞。在一個優選的方面,細菌宿主細胞是不產色鏈霉菌細胞。在另一個優選的方面,細菌宿主細胞是除蟲鏈霉菌細胞。在另一個優選的方面,細菌宿主細胞是天藍鏈霉菌細胞。在另一個優選的方面,細菌宿主細胞是灰色鏈霉菌細胞。在另一個優選的方面,細菌宿主細胞是淺青紫鏈霉菌細胞。可通過如下方法實現將DNA引入到芽孢桿菌屬細胞例如原生質體轉化(參見,例如,Chang和Cohen,1979,MolecularGeneralGenetics168:111_115),使用感受態細胞(參見,例如,Young禾口Spizizen,1961,JournalofBacteriology81:823_829或Dubnau和Davidoff-Abelson,1971,JournalofMolecularBiology56:209_221),電穿孔(參見,例如,Shigekawa和Dower,1988,Biotechniques6:742_751)或接合(參見,例如,Koehler禾口Thorne,1987,JournalofBacteriologyl69:5771_5278)。可通過如下方法實現將DNA引入到大腸桿菌細胞例如原生質體轉化(參見,例如,Hanahan,1983,J.Mol.Biol.166557-580)或電穿孔(參見,例如,Dower等,1988,NucleicAcidsRes.166127-6145)。可通過如下方法實現將DNA引入到鏈霉菌屬細胞例如原生質體轉化和電穿孔(參見,例如,Gong等,2004,FoliaMicrobiol.(Praha)49:399_405),接合(參見,例如,Mazodier等,1989,J.Bacteriol.171:3583_3585),或轉導(參見,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA98=6289-6294)。可通過如下方法實現將DNA引入到假單胞菌細胞例如電穿孔(參見,例如,Choi等,2006,J.Microbiol.Methods64:391-397)或接合(參見,例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51_57)。可通過如下方法實現將DNA引入到鏈球菌屬細胞例如天然感受態(naturalcompetence)(參見,例如,Perry和Kuramitsu,1981,Infect.Immun.321295-1297),原生質體轉化(參見,例如,Cart和Jollick,1991,Microbios.68189-2070),電穿孔(參見,例如,Buckley等,1999,Appl.Environ.Microbiol.653800-3804)或接合(參見,例如,Clewell,1981,Microbiol.Rev.45409-436)。然而,可以使用本領域已知的將DNA導入宿主細胞中的任何方法。宿主細胞還可以是真核生物,如哺乳動物、昆蟲、植物或真菌細胞。在一個優選的方面,宿主細胞是真菌細胞。“真菌”用在本文包括以下門子囊菌門(Ascomycota)、擔子菌門(Basidiomycota)、壺菌門(Chytridiomycota)禾口接合菌門(Zygomycota)(如由Hawksworth等,于AinsworthandBisby'sDictionaryofTheFungi,第8版,1995,CABInternational,UniversityPress,Cambridge,UK中所定義)以及卵菌門(Oomycota)(如Hawksworth等,1995,見上,171頁中所引用),和所有有絲分裂孢子真菌(mitosporicfungi)(Hawksworth等,1995,見上)。在一個更優選的方面,真菌宿主細胞是酵母細胞。“酵母”用在本文包括產子囊酵母(ascosporogenousyeast)(內孢霉目(Endomycetales))、產擔子酵母(basidiosporogenousyeast)禾口屬于半知菌類(FungiImperfecti)(芽抱綱(Blastomycetes))的酵母。由于酵母的分類在未來可能改變,就本發明而言,將酵母定義為如BiologyandActivitiesofYeast(Skinner,F.A.,Passmore,S.Μ·,禾口Davenport,R.R編,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述。在一個甚至更加優選的方面,酵母宿主細胞是念珠菌屬、漢遜酵母屬(Hansenula)、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或西洋蓍霉屬細胞。在一個最優選的方面,酵母宿主細胞是卡爾酵母、釀酒酵母、糖化酵母、道格拉氏酵母、克魯弗酵母、諾地酵母或卵形酵母細胞。在另一個最優選的方面,酵母宿主細胞是乳酸克魯維酵母(Kluyveromyceslactis)細胞。在另一個最優選的方面,酵母宿主細胞是解脂西洋蓍霉(Yarrowialipolytica)細胞。在另一個更優選的方面,真菌宿主細胞是絲狀真菌細胞。“絲狀真菌”包括真菌門(Eumycota)和卵菌門的亞門(如由Hawksworth等,1995,見上文,所定義)的所有絲狀形式。絲狀真菌通常的特征在于由殼多糖(chitin)、纖維素、葡聚糖、殼聚糖(chitosan)、甘露聚糖和其它復雜多糖組成的菌絲體壁。通過菌絲延伸進行營養生長,而碳分解代謝是專性需氧的。相反,酵母例如釀酒酵母的營養生長通過單細胞菌體的出芽生殖(budding)進23行,而碳分解代謝可以是發酵的。在一個甚至更優選的方面,絲狀真菌宿主細胞是枝頂孢霉屬、曲霉屬、短梗霉屬、煙管霉屬(Bjerkandera)、擬蠟菌屬、金孢子菌屬、鬼傘屬(Coprinus)、革蓋菌屬(Coriolus)、隱球菌屬、Filibasidium、鐮孢屬、腐質霉屬、梨孢菌屬、毛霉屬、毀絲霉屬、新考瑪脂霉屬、脈孢菌屬、擬青霉屬、青霉屬、平革菌屬(Phanerochaete)、射脈菌屬(Phlebia)、瘤胃壺菌屬、側耳屬(Pleurotus)、裂褶菌屬、踝節菌屬、嗜熱子囊菌屬/嗜熱霉屬、梭孢殼屬、彎頸霉屬、栓菌屬(Trametes)或木霉屬細胞。在一個最優選的方面,絲狀真菌宿主細胞是泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構巢曲霉、黑曲霉或米曲霉細胞。在另一個最優選方面,絲狀真菌宿主細胞是桿孢狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢或鑲片鐮孢細胞。在另一個最優選的方面,絲狀真菌宿主細胞是黑刺煙管菌(Bjerkanderaadusta)、干(Ceriporiopsisaneirina)、干if^lii、Ceriporiopsiscaregiea>Ceriporiopsisgilvescens>Ceriporiopsispannocinta>Ceriporiopsisrivulosa、Ceriporiopsissubrufa>Ceriporiopsissubvermispora、B譽角質金包子菌、Chrysosporiumlucknowense、熱帶金抱子菌、Chrysosporiummerdarium、Chrysosporiuminops、|£金包子菌、Chrysosporiumqueenslandicum>Chrysosporiumzonatum、灰蓋鬼傘(Coprinuscinereus)、毛革蓋菌(Coriolushirsutus)、特異腐質霉、疏棉狀腐質霉、米黑毛霉、嗜熱毀絲霉、粗糙脈孢菌、產紫青霉、黃孢平革菌、輻射射脈菌(Phlebiaradiata),刺芹側耳(Pleurotuseryngii)、土生梭孢霉、長絨毛栓菌(Trametesvillosa)、變色栓菌(Trametesversicolor)、哈茨木霉、康寧木霉、長枝木霉、里氏木霉或綠色木霉細胞。可以將真菌細胞通過涉及原生質體形成、原生質體轉化和細胞壁重建的方法以本身公知的方式轉化。用于轉化曲霉屬和木霉屬宿主細胞的合適方法在EP238023和Yelton^,1984,ProceedingsoftheNationalAcademyofSciencesUSA811470-1474中描述。用于轉化鐮孢屬菌種的合適方法由Malardier等,1989,Gene78:147-156和WO96/00787描述。可以使用由如下文獻描述的方法轉化酵母=Becker和Guarente,于Abelson,J.N.禾口Simon,Μ.I.編,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volumel94,pp182—187,AcademicPress,Inc.,NewYork;Ito等,1983,JournalofBacteriology153:163;禾口Hinnen等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:1920o生產方法本發明還涉及用于生產本發明多肽的方法,其包括(a)在有益于生產多肽的條件下培養細胞,所述細胞以其野生型形式產生所述多肽;和(b)回收所述多肽。在一個優選的方面,所述細胞是腐質霉屬細胞。在一個更優選的方面,所述細胞是特異腐質霉。在一個最優選的方面,所述細胞是特異腐質霉DSM1800。本發明還涉及用于生產本發明的多肽的方法,其包括(a)在有益于生產多肽的條件下培養重組宿主細胞,如本文所描述的;和(b)回收所述多肽。本發明還涉及用于生產本發明的多肽的方法,其包括(a)在有益于生產多肽的條件下培養重組宿主細胞,其中所述宿主細胞包含突變核苷酸序列,其在SEQIDN0:1的成熟多肽編碼序列中具有至少一個突變,其中所述突變核苷酸序列編碼多肽,所述多肽包含SEQIDNO:2的成熟多肽或由該成熟多肽組成,和(b)回收所述多肽。在本發明的生產方法中,使用本領域熟知的方法在適合于生產所述多肽的營養培養基中培養細胞。例如,可以通過在合適培養基中和允許表達和/或分離所述多肽的條件下進行的搖瓶培養,和實驗室或工業發酵罐中的小規模或大規模發酵(包括連續、分批、補料分批或固態發酵)來培養細胞。使用本領域已知的方法在合適的營養培養基中進行培養,所述營養培養基包含碳源和氮源和無機鹽。合適的培養基能夠從商業供應商獲得或可以根據公開的組成制備(例如,在美國典型培養物保藏中心的目錄中)。如果多肽分泌到營養培養基中,該多肽能夠從所述培養基中直接回收。如果多肽不分泌到培養基中,其能夠從細胞裂解物(Iysate)回收。可以使用本領域已知的對于所述多肽是特異性的方法來檢測多肽。這些檢測方法可包括特異性抗體的使用、酶產物的形成或酶底物的消失。例如,酶試驗(enzymeassay)可用于測定如本文所述的多肽的活性。所得多肽可以使用本領域已知的方法回收。例如,多肽可以通過常規方法從營養培養基中回收,所述常規方法包括但不限于離心、過濾、提取、噴霧干燥、蒸發或沉淀。本發明的多肽可以通過多種本領域已知的方法純化以獲得基本上純的多肽,所述方法包括但不限于層析(例如,離子交換、親和、疏水、層析聚焦和大小排阻)、電泳方法(例如,制備型(pr印arative)等電聚焦)、差示溶解度(例如,硫酸銨沉淀)、SDS_PAGE或提取(參見,例如,ProteinPurification,J.-C.Janson禾口LarsRyden編,VCHPublishers,NewYork,1989)。植物本發明還涉及植物,例如,轉基因植物、植物部分或植物細胞,其包含分離的多核苷酸,所述多核苷酸編碼本發明具有α-L-阿拉伯呋喃糖苷酶活性的多肽,從而以可回收的量表達和產生所述多肽。多肽可從植物或植物部分回收。或者,同樣可以將含有該重組多肽的植物或植物部分用于改進食品或飼料的質量,例如,改進營養價值、適口性(palatability)和流變性質(rheologicalproperties),或用于破壞抗營養因子。轉基因植物可以是雙子葉的(雙子葉植物)或單子葉的(單子葉植物)。單子葉植物的例子是草(grasses),如草地早熟禾(meadowgrass)(藍草(bluegrass),早熟禾屬(Poa));飼用牧草(foragegrass)如羊茅屬(Festuca)、黑麥草屬(Lolium);寒地型牧草(temperategrass),如Agrostis(剪股穎屬);和谷類,例如,小麥、燕麥、黑麥、大麥、稻(rice)、高粱和玉蜀黍(maize)(玉米)。雙子葉植物的例子是煙草(tobacco),豆類(legumes),如羽扇豆(lupins),馬鈴薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜籽(rapeseed)和緊密相關的模型生物體擬南芥(Arabidopsisthaliana)。植物部分的例子是莖(stem)、愈傷組織(calIus)、葉(leaf)、根(root)、果實(fruit)、種子(seed)和塊莖(tuber),以及包含這些部分的獨立組織,例如,表皮(epidermis)、葉肉(mesophyll)、薄壁組織(parenchyme)、維管組織(vasculartissue)、分生組織(meristem)。具體的植物細胞區室(compartments),如葉綠體(chloroplast)、質外體(apoplast)、線粒體(mitochondria)、液泡(vacuole)、過氧化物酶體(peroxisome)禾口細胞質(cytoplasm)也被認為是植物部分。此外,任何植物細胞,無論什么組織來源,都被認為是植物部分。同樣地,植物部分,如分離以促進本發明的應用的具體組織和細胞也被認為是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和種皮(seedcoat)。同樣包含于本發明范圍內的還有這些植物、植物部分和植物細胞的子代。表達本發明多肽的轉基因植物或植物細胞可以依照本領域已知方法構建。簡而言之,通過如下方法構建所述植物或植物細胞將編碼本發明多肽的一個或多個(數個)表達構建體并入植物宿主基因組或葉綠體基因組,并且將所得的修飾植物或植物細胞繁殖為轉基因植物或植物細胞。表達構建體便利地是包含編碼本發明多肽的多核苷酸的核酸構建體,所述多核苷酸與在選擇的植物或植物部分中表達該多核苷酸序列所需的適當的調節序列可操作地連接。此外,表達構建體可以包含對于鑒定宿主細胞有用的選擇性標記,在所述宿主細胞中整合了表達構建體和將該構建體引入到所述植物中所必需的DNA序列(后者依賴于使用的DNA引入方法)。調節序列的選擇,例如啟動子和終止子序列和任選地信號或轉運序列的選擇,舉例來說,基于期望何時、何處以及如何表達多肽而確定。例如,編碼本發明多肽的基因的表達可以是組成型的或誘導型的,或可以是發育、階段或組織特異性的,并且基因產物可以靶向特定的組織或植物部分例如種子或葉。調節序列由例如Tague等,1988,PlantPhysiology86:506所述。對于組成性表達,可以使用35S_CaMV、玉米泛素1和稻肌動蛋白1啟動子(Franck等,1980,Cell21:285_294,Christensen等,1992,PlantMo.Biol.18:675_689;Zhang等,1991,PlantCell3:1155_1165)。器官特異性啟動子可以是例如來自貯藏庫組織(storagesinktissue)例如種子、馬鈴薯塊蓮和果實的啟動子(Edwards&Coruzzi,1990,Ann.Rev.Genet.24:275_303),或來自代謝庫組織(metabolicsinktissue)例如分生組織的啟動子(Ito等,1994,PlantMol.Biol.24:863_878),種子特異性啟動子諸如來自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)啟動子(Wu等,1998,PlantandCellPhysiology39:885_889),來自豆球蛋白(Iegumin)B4和蠶豆(Viciafaba)的未知的種子蛋白基因的蠶豆啟動子(Conrad等,1998,JournalofPlantPhysiology152:708_711)、來自種子油體蛋白(oilbodyprotein)的啟動子(Chen等,1998,PlantandCellPhysiology39:935_941),來自歐洲油菜(Brassicanapus)的貯藏蛋白napA啟動子,或本
技術領域:
公知的任何其他種子特異性的啟動子,例如,在TO91/14772中所描述的。此外,啟動子可為葉特異性的啟動子,如來自稻或番茄的rbcs啟動子(Kyozuka等,1993,PlantPhysiology102:991_1000),小球藻病毒(chlorellavirus)腺嘌呤甲基轉移酶(adeninemethyltransferase)基因啟動子(Mitra和Higgins,1994,PlantMolecularBiology26:85_93),或來自稻的aldP基因啟動子(Kagaya等,1995,Molecularandgeneralgenetics248:668_674),或傷口誘導的啟動子,如馬鈴薯pin2啟動子(Xu等,1993,PlantMolecularBiology22:573-588)。同樣地,所述啟動子可通過非生物的處理誘導,所述非生物的處理諸如溫度、干旱或鹽度變化,或通過外源施加的激活所述啟動子的物質誘導,例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙26烯、脫落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金屬。啟動子增強子元件也可以用于實現本發明多肽在植物中的較高表達。例如,啟動子增強子元件可以是內含子,其置于啟動子和編碼本發明多肽的核苷酸序列之間。例如Xu等,1993,見上,公開了使用稻肌動蛋白1基因的第一內含子以增強表達。選擇性標記基因和表達構建體的任何其它部分可以選自本領域內可用的那些。將核酸構建體根據本領域已知的常規技術并入植物基因組,所述常規技術包括土壤桿菌屬(Agrobacterium)介導的轉化、病毒介導的轉化、顯微注射(microinjection)、粒子轟擊、生物射彈轉化和電穿孔(Gasser等,1990,Science2441293;Potrykus,1990,Bio/Technology8535;Shimamoto等,1989,Nature338274)。目前,根癌土壤桿菌(Agrobacteriumtumefaciens)介導的基因轉移(genetransfer),是產生轉基因雙子葉植物的優選方法(為了參考,見Hooykas和Schilperoort,1992,PlantMolecularBiology19:15_38),而且它也可以用于轉化單子葉植物,雖然對于這些植物其他的轉化方法是常用的。目前,產生轉基因單子葉植物的優選的方法,是用粒子(用轉化DNA涂覆的微觀的金或鎢粒子)轟擊胚愈傷組織(embryoniccalli)或發育中的胚(developingembryos)(Christou,1992,PlantJournal2:275-281;Shimamoto,1994,CurrentOpinionBiotechnology5158-162;Vasil等,1992,Bio/Technology10:667_674)。轉化單子葉植物的可供選擇的方法是基于原生質體轉化,如由Omirulleh等,1993,PlantMolecularBiology21:415_428所描述的。轉化之后,根據本領域熟知的方法選擇具有并入的表達構建體的轉化體并且再生成為完整植物。通常設計轉化方法用于通過如下方法在再生期間或在后續世代中選擇性消除選擇基因例如,使用帶有兩種獨立的T-DNA構建體的共轉化或通過特異性重組酶位點特異性地切除選擇基因。本發明還涉及用于生產本發明多肽的方法,其包括(a)在有益于生產所述多肽的條件下培養包含多核苷酸的轉基因植物或植物細胞,所述多核苷酸編碼本發明具有α-L-阿拉伯呋喃糖苷酶活性的多肽;和(b)回收所述多肽。去除或減少α-L-阿拉伯呋喃糖苷酶活性本發明還涉及用于產生親本細胞突變體的方法,其包括破壞或缺失編碼本發明的多肽的多核苷酸序列或其部分,所述方法導致在相同條件下培養時,與親本細胞相比突變的細胞產生較少的所述多肽。可以使用本領域熟知的方法通過減少或消除編碼本發明多肽的核苷酸序列的表達,所述方法例如,插入、破壞、替代或缺失來構建突變細胞。在一個優選的方面,所述核苷酸序列是失活的。待修飾或失活的核苷酸序列可以是,例如,編碼區或其對活性關鍵的部分,或表達編碼區所需的調節元件。這種調節或調控序列的例子可以是啟動子序列或其功能部分,即,足以影響核苷酸序列表達的部分。用于可能的修飾的其它調控序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、信號肽序列、轉錄終止子和轉錄激活子。可以通過向親本細胞施以誘變,并且選擇其中已將所述核苷酸序列的表達減少或消除的突變細胞來進行核苷酸序列的修飾或失活。誘變可能是特異性的或隨機的,可以通過例如使用合適的物理或化學誘變劑進行,通過使用合適的寡核苷酸進行,或通過將所述DNA序列進行PCR產生的誘變來進行。此外,可以通過使用這些誘變劑的任何組合來進行誘27變。適合于本發明目的的物理或化學誘變劑的例子包括紫外(UV)照射、羥胺、N-甲基-N,-硝基-N-亞硝基胍(MNNG)、0_甲基羥胺、亞硝酸、乙基甲烷磺酸酯(ethylmethanesulphonate)(EMS)、亞硫酸氫鈉、甲酸和核苷酸類似物。當使用這些試劑時,通常通過如下方法來進行所述誘變在合適條件下存在優選的誘變劑時溫育待誘變的親本細胞,并篩選和/或選擇顯示基因表達減少的或無基因表達的突變體細胞。通過導入、取代或去除基因中的一個或多個(數個)核苷酸或其轉錄或翻譯所需的調控元件可以實現所述核苷酸序列的修飾或失活。例如,可以插入或去除核苷酸從而導致引入終止密碼子,去除起始密碼子,或改變開放閱讀框。按照本領域已知的方法通過定位誘變或PCR產生的誘變可以實現這種修飾或失活。盡管在理論上所述修飾可以在體內進行,即,直接在表達待修飾核苷酸序列的細胞上進行,但優選如下面所示例的那樣在體外進行所述修飾。消除或減少核苷酸序列通過細胞表達的便利方式的例子是基于基因取代,基因缺失,或基因破壞的技術。例如,在基因破壞方法中,將相應于內源核苷酸序列的核酸序列在體外進行誘變以產生缺陷性的核酸序列,隨后將其轉化入親本細胞中以產生缺陷基因。通過同源重組,所述缺陷性核酸序列替代了內源性核苷酸序列。理想的是所述缺陷性核苷酸序列還編碼標記,其可用于選擇其中核苷酸序列被修飾或破壞的轉化子。在一個特別優選的方面,用可選擇的標記(如本文所述的那些)來破壞所述核苷酸序列。或者,可以使用與所述核苷酸序列互補的序列通過確定的反義或RNAi技術來進行所述核苷酸序列的修飾或失活。更具體地,通過導入與所述基因的核苷酸序列互補的序列可以減少或消除所述核苷酸序列通過細胞的表達,所述序列可以在細胞中轉錄并且能夠與細胞中產生的mRNA雜交。在允許所述互補反義核苷酸序列與mRNA雜交的條件下,由此減少或消除翻譯的蛋白質的量。本發明進一步涉及親本細胞的突變體細胞,其包含編碼多肽的核苷酸序列或其調控序列的破壞或缺失,這導致與親本細胞相比突變體細胞產生更少的多肽或不產生多肽。這樣生成的多肽缺陷型突變細胞作為表達天然和/或異源多肽的宿主細胞特別有用。所以,本發明進一步涉及生產天然或異源多肽的方法,其包括(a)在有益于生產多肽的條件下培養突變細胞;和(b)回收所述多肽。術語“異源多肽”在本文中定義為對宿主細胞不是天然的多肽,進行了修飾以改變天然序列的天然蛋白,或作為通過重組DNA技術對宿主細胞操作的結果其表達在量上改變的天然蛋白。在另一方面,本發明涉及通過發酵可產生本發明的多肽以及目標蛋白產物的細胞來生產基本上無α-L-阿拉伯呋喃糖苷酶活性的蛋白質產品的方法在發酵之前、過程中或發酵完成之后向發酵液(fermentationbroth)中添加有效量的能夠抑制α-L-阿拉伯呋喃糖苷酶活性的試劑,從發酵液中回收目標產物,并且任選地將回收的產物進行進一步純化。在另一方面,本發明涉及通過如下生產基本上無α-L-阿拉伯呋喃糖苷酶活性的蛋白質產物的方法在允許產物表達的條件下培養細胞,將得到的培養液進行組合的PH和溫度處理以基本上減少α-L-阿拉伯呋喃糖苷酶活性,和從發酵液中回收產物。或者,可以將從培養液回收的酶制備物進行組合的PH和溫度處理。所述組合的PH和溫度處理可任選地與α-L-阿拉伯呋喃糖苷酶抑制劑處理組合使用。依照本發明的這個方面,可能去除至少60%,優選至少75%,更優選至少85%,還更優選至少95%,并且最優選至少99%的α-L-阿拉伯呋喃糖苷酶活性。可使用此方法獲得α-L-阿拉伯呋喃糖苷酶活性的完全去除。組合的ρΗ和溫度處理優選在2-4或9-11范圍內的ρΗ和至少60_70°C范圍內的溫度進行一段足夠的時間以達到期望的效果,通常30至60分鐘是足夠的。用于培養和純化感興趣的產物的方法可以通過本領域已知的方法進行。用于產生基本上無α-L-阿拉伯呋喃糖苷酶產物的本發明的方法在真核多肽,特別是真菌蛋白質例如酶的產生中是特別令人有興趣的。所述酶可以選自,例如,淀粉分解酶(amylolyticenzyme)、脂肪分解酶、蛋白水解酶、纖維素分解酶(cellulolyticenzyme)、氧化還原酶或植物細胞壁降解酶。這些酶的例子包括氨肽酶、淀粉酶、淀粉葡糖苷酶、糖酶、羧肽酶、過氧化氫酶、纖維二糖水解酶、纖維素酶、幾丁質酶(chitinase)、角質酶(cutinase)、環糊精糖基轉移酶、脫氧核糖核酸酶、內切葡聚糖酶、酯酶、半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡糖氧化酶、葡糖苷酶、商素過氧化酶、半纖維素酶、轉化酶、異構酶、漆酶、連接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、果膠分解酶、過氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉移酶、轉谷氨酰胺酶或木聚糖酶。α-L-阿拉伯呋喃糖苷酶缺陷細胞也可以用于表達在制藥上引起興趣的異源蛋白質如激素、生長因子、受體等。可理解的是術語“真核多肽”不僅包括天然多肽,也包括那些多肽例如酶,其通過氨基酸取代、缺失或添加或其它這樣的修飾而被修飾以增強活性、熱穩定性、PH耐受性等。在另外的方面,本發明涉及基本上無α-L-阿拉伯呋喃糖苷酶活性的蛋白質產物,其通過本發明的方法產生。抑制多肽表達的方法本發明還涉及抑制多肽在細胞中表達的方法,其包括對細胞施用雙鏈RNA(dsRNA)分子或者在細胞中表達雙鏈RNA(dsRNA)分子,其中dsRNA包含本發明多核苷酸的亞序列。在一個優選的方面,dsRNA長約15、16、17、18、19、20、21、22、23、24、25或更多的雙鏈體核苷酸。dsRNA優選是小干擾RNA(siRNA)或微RNA(miRNA)。在一個優選的方面,dsRNA是用于抑制轉錄的小干擾RNA(SiRNA)。在另一個優選的方面,dsRNA是用于抑制翻譯的微RNA(miRNA)。本發明還涉及所述雙鏈RNA(dsRNA)分子,其包含SEQIDNO1的成熟多肽編碼序列中用于抑制多肽在細胞中表達的部分。本發明不受到任何特定作用機制的限制,dsRNA能進入細胞,并引起相似或相同序列的單鏈RNA(ssRNA)的降解,所述RNA包括內源mRNA。當細胞接觸dsRNA時,來自同源基因的mRNA選擇性地受到稱為RNA干擾(RNAi)的過程的降解。本發明的dsRNA可以用于基因沉默療法。在一個方面,本發明提供使用本發明的dsRNAi選擇性地降解RNA的方法。所述過程可以在體外、在活體外(exvivo)或在體內進行。在一個方面,dsRNA分子能夠用于產生細胞、器官或動物中的功能缺失突變(loss-of-functionmutation)。制備或使用選擇性降解RNA的dsRNA分子的方法在本領域中公知,參見,例如,美國專利號6,506,559;美國專利號6,511,824;美國專利號6,515,109;和美國專利號6,489,127。組合物本發明還涉及包含本發明的多肽的組合物。優選地,所述組合物富含這種多肽。術語“富含”表示所述組合物的α-L-阿拉伯呋喃糖苷酶活性,例如,以至少1.1的富集因數(enrichmentfactor)增力口。所述組合物可以包含本發明的多肽作為主要酶成分,例如,單成分組合物。或者,所述組合物可以包含多種酶活性,如氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、幾丁質酶、角質酶、環糊精糖基轉移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、鹵素過氧化物酶、轉化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果膠分解酶、肽谷氨酰胺酶(peptidoglutaminase)、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶或木聚糖酶。額外的酶可以通過例如屬于以下屬或種的微生物產生曲霉屬,優選棘孢曲霉、泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構巢曲霉、黑曲霉或米曲霉;鐮孢屬,優選桿孢狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢或鑲片鐮孢;腐質霉屬,優選特異腐質霉或疏棉狀腐質霉;或木霉屬,優選哈茨木霉、康寧木霉、長枝木霉、里氏木霉或綠色木霉。可以依照本領域內已知的方法制備多肽組合物,并且可以是液體或干組合物的形式。例如,所述多肽組合物可以是顆粒(granulate)或微粒(microgranulate)的形式。可以依照本領域內已知方法將包括于所述組合物中的多肽穩定化。下面給出的是本發明多肽組合物的優選的用途的實例。本發明的多肽組合物的劑量和使用該組合物的其它條件可以基于本領域內已知的方法確定。用途本發明還涉及使用具有α-L-阿拉伯呋喃糖苷酶活性的多肽或其組合物的方法。可以在數種應用中使用本發明具有α-L-阿拉伯呋喃糖苷酶活性的多肽來降解或轉化含有木聚糖的材料,其通過用有效量的所述多肽處理所述材料來進行(參見例如WO2002/18561)。優選地,在必須降解木聚糖的方法中與其它木聚糖降解酶諸如木聚糖酶、乙酰木聚糖酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、阿魏酸酯酶、葡糖醛酸糖苷酶,和其組合聯合使用本發明的多肽。由于脫酰反應,木聚糖對木聚糖酶和其它木聚糖降解酶的易接近性變得更好。具有α-L-阿拉伯呋喃糖苷酶活性的多肽在許多應用中是有用的體內修飾含有木聚糖的動物飼料以改善消化率;在例如燃料和/或可飲乙醇的生產中源于生物量降解或轉化成可發酵糖類的普遍應用;紙漿和紙脫木質化中使用的加工助劑;紡織品的酶促煮煉(scouring)系統的成分;食物應用,例如烘焙,與其它酶促功能性組合以改善烘焙物品的物理特性;和與其它酶功能性組合的洗衣洗滌劑應用。可以在根據美國專利號5,658,765的用于處理Kraft漿的方法中使用多肽。一般而言,通常用木聚糖酶處理Kraft漿以除去紙產品制備物中的木質素。當在木聚糖酶處理前或與木聚糖酶處理同時用α-L-阿拉伯呋喃糖苷酶處理紙漿時,木聚糖酶的效率得到很大地提高。也可以在根據美國專利號5,658,765的用于生成木糖或木寡糖的方法中使用所述多肽。所述多肽也可以作為根據美國專利號6,245,546的飼料增強酶使用,所述飼料增強酶改良飼料消化率以提高其利用效率。α-L-阿拉伯呋喃糖苷酶在飼料中的使用可以降低飼料組分的溶解度,由此減少粘性,并降低戊聚糖(pentosanes)的抗營養效果。也可以在根據美國專利號5,693,518的烘焙中使用所述多肽。可以進一步在根據WO2002/24926的釀造中使用所述多肽,其中可以使用此酶與其它酶的組合來降解生物細胞壁材料以在涉及果汁或啤酒制備的應用中提高溶解度或流動特征。因此,本發明還涉及降解木聚糖的方法,包括用所述具有α-L-阿拉伯呋喃糖苷酶活性的多肽處理含有木聚糖的材料。在一個優選的方面,進一步用一種或多種木聚糖降解酶處理含有木聚糖的材料。信號月太本發明還涉及核酸構建體,所述核酸構建體包含編碼蛋白質的基因,其中所述基因與編碼信號肽的核苷酸序列可操作地連接,所述信號肽包含SEQIDNO2的氨基酸1至17,或由SEQIDNO2的氨基酸1至17組成,其中所述基因對于該核苷酸序列是外源的。在一個優選的方面,所述核苷酸序列包括SEQIDNO=I的核苷酸1至51或由SEQIDNO1的核苷酸1至51組成。本發明還涉及包含這種核酸構建體的重組表達載體和重組宿主細胞。本發明還涉及用于產生蛋白質的方法,包括(a)在適合于產生所述蛋白質的條件下培養這樣的重組宿主細胞;和(b)回收所述蛋白質。所述蛋白質對于宿主細胞可以是天然的或異源的。術語“蛋白質”在本文的意思不是指特定長度的編碼產物,并且因此包含肽、寡肽和蛋白質。術語“蛋白質”還包含組合以形成編碼產物的兩種以上多肽。所述蛋白質還包括雜合多肽,其包含部分或全部多肽序列的組合,所述多肽序列從至少兩種不同的蛋白質獲得,其中一個或多個(數個)對于宿主細胞可以是異源或天然的。蛋白質進一步包括上述蛋白質和雜合蛋白質天然存在的等位基因變異和工程改造的變異。優選蛋白質是激素或其變體、酶、受體或其部分、抗體或其部分,或報告蛋白(reporter)。在一個更優選的方面,所述蛋白質是氧化還原酶、轉移酶、水解酶、裂合酶(lyase)、異構酶或連接酶。在一個更加優選的方面,所述蛋白質是氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、幾丁質酶、角質酶、環糊精糖基轉移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、轉化酶、漆酶、另外的脂肪酶、甘露糖苷酶、變位酶(mutanase)、氧化酶、果膠分解酶、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶或木聚糖酶。基因可以從任何原核、真核或其它來源獲得。通過以下實施例進一步對本發明進行描述,但不應將其理解為對本發明范圍的限制。31實施例材料作為緩沖液和底物使用的化學品是至少試劑級的商業產品。菌株使用特異腐質霉DSM1800作為編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽的家族62基因的來源。使用黑曲霉MBinl20菌株(W02004/090155)來表達編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽的特異腐質霉基因。培養基PDA平板每升由39g馬鈴薯右旋糖瓊脂組成。YP培養基每升由IOg酵母提取物和20g細菌用蛋白胨組成。COVEA尿素-乙酰胺+平板每升由20mlCOVEA鹽溶液、220g山梨糖醇、IOg葡萄糖、IOmlIM乙酰胺、和30g細菌pH5.2。COVEA鹽溶液每升由26gKCl、26gMgS04、76gKH2PO4、和50mlCOVEA痕量元素溶液組成。COVEA痕量元素溶液每升由0.04gNa2B4O7·10Η20、0·4gCuSO4·5Η20、0·8gFeSO4·7Η20、0·7gMnSO4·H20,0.8gNa2MoO2·2H20、10gZnSO4·7H20、禾口IOg檸檬酸組成。M410培養基每升由50g麥芽糖、50g葡萄糖、2gMgSO4·7H20、2gKH2PO4,4g檸檬酸無水粉末、8g酵母提取物、2g尿素、0.5gAMG痕量金屬溶液和0.5gCaCl2組成;pH6.0。AMG痕量金屬溶液每升由14.3gZnSO4·7Η20、2·5gCuSO4·5Η20、0·5gNiCl2·6Η20、13.8gFeSO4·7Η20、8·5gMnSO4·7Η20和3g檸檬酸組成。LB培養基每升由IOg胰蛋白胨、5g酵母提取物和5gNaCl組成。實施例1具有α-L-阿拉伯呋喃糖苷酶活性的特異腐質霉GH62A多肽的鑒定ULTRAFL0L的蛋白質分級。首先使用HIPREP26/10脫鹽柱(GEHealthcare,Piscataway,NJ,USA)來將2ml等分試樣的ULTRAFLOUNovozymesA/S,Bagsvaerd,丹麥)緩沖液交換入150mM氯化鈉-20mM乙酸鈉pH5中。然后通過用裝備有3,000道爾頓截留分子量膜(VivascienceAG,Hannover,德國)的VIVASPIN20旋轉柱進行超濾來將所得的經緩沖液交換的材料(18.5ml)濃縮至3ml。然后通過在與等度洗脫相同的緩沖液條件下在HIL0AD26/60SUPERDEX200制備級大小排阻柱(GEHealthcare,Piscataway,NJ,USA)上進行大小排阻層析來分級2ml等分試樣的經緩沖液交換并且濃縮的ULTRAFLOL材料。將在280nm處顯示UV吸光度的級分組合成來自不同洗脫時間的六份不同匯合物,每份范圍為20-40ml總體積。通過用裝備有3,OOODa截留分子量膜的VIVASPIN20旋轉柱進行超濾來將匯合的級分濃縮至l_5ml。在CRITERION8-16%Tris-HClSDS-PAGE凝膠(Bio-RadLaboratories,Inc.,Hercules,CA,USA)上根據制造商建議的條件分離20μ1每種濃縮的匯合級分。使用PRECISIONPLUSPROTEIN標準品(Bio-RadLaboratories,Inc.,Hercules,CA,USA)作為分子量標志物。從盒取出凝膠,并用考馬斯藍(G250)蛋白質染料(ΒΙΟ-SAFE考馬斯染料,Bio-RadLaboratories,Inc.,Hercules,CA,USA)染色,并用剃刀刀片切割可見條帶,用于蛋白質鑒定分析。對多肽的凝膠內消化以進行肽測序。使用MultiPROBEΠ液體操作機器人(LiquidHandlingRobot)(PerkinElmerLifeandAnalyticalSciences,Boston,MA,32USA)來實施凝膠內消化。用50μ1在IOOmM碳酸氫銨ρΗ8.0中的IOmM二硫蘇糖醇(DTT)來還原45kDa蛋白質凝膠條帶30分鐘。還原后,用50μ1在IOOmM碳酸氫銨ρΗ8.0中的55mM碘乙酰胺來使凝膠塊烷基化20分鐘。容許干燥的凝膠塊在25μ1在50mM碳酸氫銨PH8中的胰蛋白酶消化溶液(6ng/l·!1測序級胰蛋白酶;Promega,Madison,WI,USA)中于室溫膨脹30分鐘,接著于40°C消化8小時。上文所描述的每個反應步驟之后是遵循制造商的標準方案用合適的溶液進行的許多清洗和預清洗。使用50μ1乙腈來使各反應間的凝膠塊脫水,并在各步驟間風干凝膠塊。用HPLC級水中的甲酸/2%乙腈提取肽兩次達30分鐘。將肽提取溶液轉移至96孔有緣PCR型平板(ABGene,Rochester,NY,USA),其已經冷卻至10-15°C,并用96孔板蓋(PerkinElmerLifeandAnalyticalSciences,Boston,ΜΑ,USA)覆蓋以阻止蒸發。于4°C進一步貯存平板,直至可以實施質譜術分析。蛋白質鑒定。為了通過串聯質譜術進行從頭肽測序,使用Q-T0FMICR0,即混合IE交四極飛時1、司質i普儀(hybridorthogonalquadrupo1etime—of—flightmassspectrometer)(WatersMicromassMSTechnologies,Milford,MA)jftSifLC/MS/MS^>豐斤。Q-TOFMICRO裝備有ULTIMATE毛細管和納流(nano-flow)HPLC系統,其偶聯有FAM0S微自動取樣器和SWITCH0SII柱開關裝置(LCPackings/Dionex,Sunnyvale,CA,USA),用于使樣品濃縮和脫鹽。將樣品上樣至注射環(injectionloop)中安裝的保護柱(300μmIDX5cm,PEPMApC18)上,并使用SwitchosII泵用水中的0.1%甲酸以每分鐘40μ1清洗2分鐘。使用ΝΑΝ-75校準器(calibrator)(Dionex,Sunnyvale,CA,USA)將肽在75μmIDχ15cm,C18,3μm,ΙΟΟΑPEPMAP(LCPackings,SanFrancisco,CA,USA)納流融合型毛細管柱(nanoflowfusedcapillarycolumn)上以來自175ul/分鐘的分流的175nl/分鐘的流速分離。在45分鐘時間間隔里施用0.甲酸中的5%至80%乙腈的步驟洗脫梯度。在215nm監測柱洗脫液,并經由安裝有納噴霧(nanospray)界面的電噴霧離子源引入Q-TOFMICRO中。Q-TOFMICRO完全受微處理器控制,其使用MASSLYNX軟件第4.1版(WatersMicromassMSTechnologies,Milford,MA,USA)來實現。在調查(survey)掃描模式中并且從m/z400至1990的質量范圍及MS至MS/MS的開關標準獲得數據,以包括大于每秒10.0次計數的離子強度和+2、+3和+4的電荷狀態。可以獲得掃描時間為1.9秒和中間掃描時間為0.1秒的多至4個共洗脫種類的分析譜。通常使用45伏的錐孔電壓(conevoltage),并將碰撞能量編程為隨洗脫肽的質量和電荷狀態而變化,并且在10_60伏的范圍內。以自動方式將所獲得的譜組合,使它們平滑,并集中(center),并且產生峰列表。使用PR0TEINLYNXGlobalServer2.2.05軟件(WatersMicromassMSTechnologies,Milford,MA,USA)和PEAKSStudio第4·5版SPl(BioinformaticSolutionsInc.,Waterloo,Ontario,加拿大)針對選定的數據庫搜索此峰列表。評估來自PR0TEINLYNX和PEAKSStudio搜索的結果,通過評估每個感興趣離子的MS/MS譜來進一步分析未鑒定的蛋白質,并通過鑒定y和b離子系列并將質量差異與合適的氨基酸匹配來確定從頭序列。自凝膠內消化的45kDa多肽凝膠條帶的數個多電荷離子(multiplychargedion)獲得從通過質譜術進行的從頭測序確定的肽序列。雙電荷胰蛋白酶肽離子604.26m/z序列測定為[[ILE/Leu]或Asp]-Thr-Ser-Glu-Asn-Asn-Pro-Phe-Ala-Gly-Arg(SEQIDNO:2的氨基酸249至259)。另一種雙電荷胰蛋白酶肽離子698.32m/z序列測定為[Gln/Lys]-Tyr-[Ile/Leu]-Met-[Ile/Leu]-Val-Glu-Ser-[Ile/Leu]-Gly-Ser-Arg(SEQIDNO2的氨基酸218至229)。另一種雙電荷胰蛋白酶肽離子711.32m/z序列測定為Asn-[Ile/Leu]-Trp-Val-[Ile/Leu]-Ala-Tyr-[Gln/Lys]-Trp-Gly-Arg(SEQIDNO2的氨基酸105至115)。另一種雙電荷胰蛋白酶肽離子726.84m/z序列測定為Ala-Ala-Val-Ala-Pro-Thr-Leu-Phe-Tyr-Phe-[Gln/Lys]-Pro-Lys(SEQIDNO2的氨基酸92至104)。另一種雙電荷胰蛋白酶肽離子1005.42m/z序列測定為Asn-Asp-[Ile/Leu]-Phe-Glu-Ala_Val-[Gln/Lys]-Val-Tyr-Thr-IIe-Asp-Gly-Ser-Asn-Pro-[Gln/Lys](SEQIDNO2的氨基酸200至217)。不能辨別[Ile/Leu]和[Gln/Lys],因為它們具有等同的質量。實施例2特異腐質霉DSM1800基因組DNA提取于45°C將特異腐質霉DSM1800在PDA平板上培養至匯合。從PDA平板切割三塊4mm2正方形,并于41°C和200rpm接種入在帶擋板的125ml搖瓶中的25ml含有2%葡萄糖的YP培養基中達2天,期間以200rpm搖動。通過使用MIRACLOTH(Calbiochem,LaJolla,CA,USA)進行過濾來收獲菌絲體,在去離子水中清洗兩次,并在液氮下冷凍。通過研缽和杵將冷凍的菌絲體研磨成細粉末,并使用DNEASY植物Maxi試劑盒(QIAGENInc.,Valencia,CA,USA)來分離總DNA。實施例3自特異腐質霉DSM1800分離GH62Aα-L-阿拉伯呋喃糖苷酶基因的部分片段使用共有-簡并雜合寡核苷酸引物程序(C0DEH0P;Rose等,1998,NucleicAcidsResearch261628-1635),基于實施例1中所描述的鑒定出的肽片段將簡并引物設計成相關GH62序列的同源性區域。用于生成特異腐質霉GH62Aα-L-阿拉伯呋喃糖苷酶基因的片段的簡并引物為引物HinsGH62sense15,-CCAAGTCGATCTGGGTNCTCGCNTAYCA-3,(SEQIDNO3)簡并引物HinsGH62sensel的蛋白質翻譯PKSIffVLAYQ(SEQIDNO4)引物HinsGH62antil5,-AGTTGGCGCGNCCNGCRAANGG-3,(SEQIDNO5)簡并引物HinsGH62antil的蛋白質翻譯PFAGRAN為了獲得特異腐質霉GH62Aα-L-阿拉伯呋喃糖苷酶基因的初始DNA片段,于范圍為40°C至60°C的6個不同退火溫度實施梯度PCR。擴增反應(25μ1)由80ng特異腐質霉DSM1800基因組DNA作為模板,0.4mM各種dATP、dTTP、dGTP和dCTP,50pmol各種引物HinsGH62sensel禾Π弓丨物HinsGH62antil,IXADVANTAGEGC-熔解LA緩沖液(ClontechLaboratories,Inc.,MountainView,CA,USA),和1.25個單位的ADVANTAGEGC基因組聚合酶混合物(ClontechLaboratories,Inc.,MountainView,CA,USA)組成。使用EPPENDORFMASTERCYCLER5333(EppendorfScientific,Inc.,ffestbury,NY,USA)來實施擴增反應,所述EPPENDORFMASTERCYCLER5333編程為于95°C預變性1分鐘;各為于95°C的變性溫度達30秒;30個循環,每個循環為于50°C+/-1(TC的溫度退火30秒(6個梯度選項)和于72°C延伸1分鐘;和于72°C最終延伸6分鐘。通過在TBE(每升10.8gTris堿、5.5g硼酸和4ml0.5MEDTApH8.0)緩沖液中進行1.0%瓊脂糖凝膠電泳來分離反應產物。從凝膠切割來自59.8°C退火溫度的約500bpPCR產物條帶,使用QIAQUICK凝膠提取試劑盒(QIAGENInc.,Valencia,CA,USA)根據制造商的說明來純化,并采用染料終止劑化學(Giesecke等,1992,JournalofVirologyMethods38:47_60)引物步行策略以Perkin-ElmerAppliedBiosystemsModel377XL自動DNA測序儀(Perkin-Elmer/AppliedBiosystems,Inc.,FosterCity,CA,USA)使用引物HinsGH62sensel和引物HinsGH62antil來測序。實施例4全長特異腐質霉GH62Aα-L-阿拉伯呋喃糖苷酶基因的鑒定使用GEN0MEWALKER通用試劑盒(ClontechLaboratories,Inc.,MountainView,CA,USA)根據制造商的說明從特異腐質霉DSM1800鑒定全長家族62α-L-阿拉伯呋喃糖苷酶基因。簡言之,用四種不同留下平端的限制酶(DraI、EcoRV,PvuII和StuI)分別消化來自特異腐質霉DSM1800的總基因組DNA。然后分別將每批消化過的基因組DNA連接至GEN0MEWALKER銜接頭(ClontechLaboratories,Inc.,MountainView,CA,USA)以創建四個文庫。然后采用這四個文庫作為PCR反應中的模板,所述PCR反應使用下文所顯示的四種基因特異性引物,兩種用于通過編碼α-L-阿拉伯呋喃糖苷酶的N端的5’末端擴增片段上游的初次和再次PCR,而兩種用于通過編碼α-L-阿拉伯呋喃糖苷酶的C端的3’末端擴增片段下游的初次和再次PCR。基于來自實施例3中所描述的特異腐質霉的部分家族62α-L-阿拉伯呋喃糖苷酶基因序列來設計下列引物。N端引物Hins_GH62_GSPl_R(初次)5’-AGCTGTCGCTGATGGAGCCCGAGAAGA-3‘引物Hins_GH62_GSP2_R(再次)5,-GAAGGCAGTCCGGCCCCATTGATATGC-3‘C-端引物Hins_GH62_GSPl_F(初次)5,-GCTCCAACCCCAAGCAGTACCTCATGC-3,(SEQIDNO8)引物Hins_GH62_GSP2_F(再次)5,-CCGCTACTTCCGCTCCTACGTCTCCAA-3,(SEQIDNO9)初次擴增由最終體積25μ1中1μ1(約6ng)每個文庫作為模板、0.4mM各種dATP、dTTP、dGTP和dCTP、IOpmol銜接頭引物1(ClontechLaboratories,Inc.,MountainView,CA,USA)、50pmol弓丨物Hins_GH62_GSPl_R或Hins_GH62_GSPl_F、IXADVANTAGEGC-熔解LA緩沖液(ClontechLaboratories,Inc.,MountainView,CA,USA)和1.25個單位的ADVANTAGEGC基因組聚合酶混合物組成。使用EPPENDORFMASTERCYCLER5333來實施擴增反應,編程為于95°C預變性1分鐘;7個循環,每個為于95°C的溫度變性25秒;于72°C退火和延伸5分鐘;和32個循環,每個為于95°C的溫度變性25秒;于67°C退火和延伸5分鐘;和于67°C最終延伸7分鐘。再次擴增由最終體積25μ1中1μ1每種初次PCR產物作為模板、0.4mM各種dATP、dTTP、dGTP禾口dCTP、IOpmol祎接頭引物2(ClontechLaboratories,Inc.,MountainView,CA,USA)、50pmol弓丨物Hins_GH62_GSP2_R或Hins_GH62_GSP2_F、IXADVANTAGE(SEQIDNO6)(SEQIDNO7)35GC-熔解LA緩沖液和1.25個單位的ADVANTAGEGC基因組聚合酶混合物組成。使用EPPENDORFMASTERCYCLER5333來實施擴增反應,編程為于95°C預變性1分鐘;5個循環,每個為于95°C的溫度變性25秒;于72°C退火和延伸5分鐘;和20個循環,每個為于95°C的溫度變性25秒;于67°C退火和延伸7分鐘;和于67°C最終延伸5分鐘。通過在TBE緩沖液中進行1.0%瓊脂糖凝膠電泳來分離反應產物。從5’端PCR擴增物中,從凝膠切割來自DraI文庫的600bp產物條帶,使用QIAQUICK凝膠提取試劑盒根據制造商的說明來純化、并測序。從3’端PCR擴增物中,從凝膠切割來自DraI文庫的1.Skb產物條帶,并從凝膠切割來自EcoRV文庫的700bp產物條帶,使用QIAQUICK凝膠提取試劑盒根據制造商的說明來純化、并測序。通過使用染料終止劑化學(Giesecke等,1992,見上文)的Perkin-ElmerAppliedBiosystemsModel377XL自動DNA測序儀和引物步行策略來實施PCR片段的DNA測序。使用銜接頭引物2、引物Hins_GH62_GSP2_R和引物Hins_GH62_GSP2_F來測序。對核苷酸序列數據細察質量,并通過PHRED/PHRAP軟件(華盛頓大學,Seattle,WA,USA)的幫助來彼此比較所有序列。與實施例3中所描述的來自特異腐質霉的部分家族62α-L-阿拉伯呋喃糖苷酶基因序列比較和比對PCR片段序列結果。基于本文和實施例3中所獲得的基因片段來構建基因模型,其容許用其它同源家族62α-L-阿拉伯呋喃糖苷酶測定基因的5’和3’端。實施例5全長特異腐質霉GH62Aα-L-阿拉伯呋喃糖苷酶基因的克隆和黑曲霉表達載體的構建設計下文所顯示的兩種合成的寡核苷酸引物以從由實施例2中制備的基因組DNAPCR擴增出全長特異腐質霉DSM1800α-L-阿拉伯呋喃糖苷酶基因。使用InFusion克隆試劑盒(BDBiosciences,PaloAlto,CA,USA)以將片段直接克隆入表達載體pBM120a(TO2006/078256)中。BDinfGH62有義NCO5,-ACACAACTGGCCATGAGGTCGGTTGCTGCTTTCCTC-3,(SEQIDNO10)BDinfantiGH62PACl5,-CAGTCACCTCTAGTTATTACTTACAAGGATTCGAGT-3,(SEQIDNO11)粗體字母代表編碼序列。剩余序列與pBM120a的插入位點同源。在PCR反應中使用50皮摩爾的上述引物之每種,所述PCR反應由25μ1最終體積中80ng特異腐質霉基因組DNA,IXADVANTAGEGC-熔解LA緩沖液,0.4mM各種dATP、dTTP、dGTP和dCTP,和1.25個單位的ADVANTAGEGC基因組聚合酶混合物組成。使用EPPENDORFMASTERCYCLER5333來實施擴增,編程為于94°C1分鐘的1個循環;5個循環,每個為于94°C30秒,50°C30秒和72°C90秒;和30個循環,每個為于94°C30秒、60°C30秒和72°C90秒;和于72°C最終延伸5分鐘。然后加熱塊轉到4°C浸泡循環。通過在TBE緩沖液中進行1.0%瓊脂糖凝膠電泳來分離反應產物,其中從凝膠切割出約1.1-1.2kb產物條帶,并使用QIAQUICK凝膠提取試劑盒根據制造商的說明來純化。用NcoI和PacI來消化質粒pBM120a,通過在TBE緩沖液中進行1.0%瓊脂糖凝膠電泳來分離,并使用QIAQUICK凝膠提取試劑盒根據制造商的說明來純化。36使用InFusion克隆試劑盒(BDBiosciences,PaloAlto,CA,USA)將基因片段和消化過的載體連接在一起,產生pMMar4(圖2),其中α_L_阿拉伯呋喃糖苷酶基因的轉錄在來自黑曲霉中性α-淀粉酶和米曲霉丙糖磷酸異構酶基因的啟動子的雜合體(NA2_tpi啟動子)的控制下。連接反應(20μ1)由IXInFusion緩沖液(BDBiosciences,PaloAlto,CA,USA),IXBSA(BDBiosciences,PaloAlto,CA,USA),1μ1InFusion酶(稀釋110)(BDBiosciences,PaloAlto,CA,USA),106ng用NcoI和PacI消化的pBM120a,禾口163ng純化的特異腐質霉PCR產物組成。于室溫溫育反應達30分鐘。使用2μ1反應物來轉化大腸桿菌XLlOSOLOPACKGold超感受態細胞(Stratagene,LaJolla,CA,USA)。通過限制性消化來檢測含有pMMar4的大腸桿菌轉化體,并使用BIOROBOT9600(QIAGENInc.,Valencia,CA,USA)來制備質粒DNA0使用染料_終止劑化學(Giesecke等,1992,見上文)和引物步行策略以Perkin-ElmerAppliedBiosystemsModel377XL自動DNA測序儀通過DNA測序來確認pMMar4中的特異腐質霉GH62A插入物。使用引物996271Na2tpi啟動子fwd和996270AMGrev(下文所顯示)來測序。996271Na2tpi啟動子fwd5,-ACTCAATTTACCTCTATCCACACTT-3,(SEQ.IDNO12)996270AMGrev5,-CTATAGCGAAATGGATTGATTGTCT-3,(SEQ.IDNO13)將含有pMMar4的克隆挑入2X50ml補充有每ml100μg氨芐青霉素的LB培養基中,并在250ml玻璃燒杯中于37°C和200rpm振動培養過夜。使用QIAGENMidi試劑盒根據制造商的說明從培養液分離質粒pMMar4。用PmeI消化質粒pMMar4,通過在TBE緩沖液中進行1.0%瓊脂糖凝膠電泳來分離,并使用QIAQUICK凝膠提取試劑盒根據制造商的說明來純化含有GH62Aci-L-阿拉伯呋喃糖苷酶基因的片段以準備好轉化黑曲霉MBinl20原生質體。使用TOPOTACLONING試劑盒來將約1.1-1.2kb的片段克隆入pCR2.1-TOPO載體(Invitrogen,Carlsbad,CA,USA)中以生成pHinsGH62A(圖3)。通過DNA測序來確認pHinsGH62A中的特異腐質霉GH62A插入物。在2007年11月20日將大腸桿菌pHinsGH62A保藏于農業研究機構專利培養物保藏中心(AgriculturalResearchServicePatentCultureCollection),北區石if究中心(NorthernRegionalResearchCenter),Peoria,IL0實施例6編碼具有α-L-阿拉伯呋喃糖苷酶的GH62A多肽的全長特異腐質霉基因組序列的表征對核苷酸序列數據(實施例5)細察質量,并通過PHRED/PHRAP軟件(華盛頓大學,Seattle,WA,USA)的幫助來彼此比較所有序列。圖IA和圖IB中顯示了核苷酸序列(SEQIDNO1)和推導的氨基酸序列(SEQIDNO2)。基因組片段編碼387個氨基酸的多肽。全長編碼序列和成熟編碼序列的%G+C含量分別是64.9%和65%。使用SignalP軟件程序(Nielsen等,1997,ProteinEngineering101-6),預測17個殘基的信號肽。預測的成熟蛋白含有370個氨基酸,具有40.3kDa的分子量。使用Needleman-Wunsch算法(Needleman禾口Wunsch,1970,J.Mol.Biol.48443-453)來測定氨基酸序列的比較配對全局比對,如EMBOSS的Needle程序中所執行的,其中缺口開放罰分10,缺口延伸罰分0.5,和EBL0SUM62矩陣。比對顯示特異腐質霉家族62α-L-阿拉伯呋喃糖苷酶基因的成熟多肽的推導氨基酸序列與黑曲霉阿拉伯木聚糖降解酶(GeneSeqP登錄號AAR94170)的推導氨基酸序列共享65.7%同一性(排除缺口)。實施例7特異腐質霉GH62Aα-L-阿拉伯呋喃糖苷酶基因在黑曲霉MBinl20中的表達根據Christensen等,1988,Bio/Technology61419-1422的方法來制備黑曲霉MBinl20原生質體。使用4ygPmeI消化過的pMMar4來轉化黑曲霉MBinl20。用經PmeI消化的pMMar4轉化黑曲霉MBinl20產生約50個轉化體。將22個轉化體分離至各個COVEA尿素-乙酰胺+平板。從22個轉化體的匯合的COVEA尿素-乙酰胺+平板切割二塊3mm平方瓊脂塊,并分別接種入125ml塑料搖瓶中的25mlM410培養基中,并于34°C,250rpm溫育。溫育5天后,通過SDS-PAGE來分析6μ1來自每種培養物的上清液,所述SDS-PAGE使用CRITERION8-16%Tris-HClSDS-PAGE凝膠及CRITERIONCell(Bio-RadLaboratories,Inc.,Hercules,CA,USA)根據制造商的說明來進行。用ΒΙΟ-SAFE考馬斯染料(Bio-RadLaboratories,Inc.,Hercules,CA,USA)對所得的凝膠染色。培養物的SDS-PAGE譜顯示約半數的轉化體具有約45kDa的主要條帶。選擇一個稱作黑曲霉MMar202的轉化體用于在黑曲霉中表達具有α_L_阿拉伯呋喃糖苷酶活性的特異腐質霉GH62A多肽。實施例8黑曲霉MMar202的發酵搖瓶培養基每升由70g蔗糖和100大豆濃縮物組成。痕量金屬溶液每升由13.SgFeSO4·7H20、14.3gZnSO4·7H20、11.6gMnSO4·Η20、2.5gCuSO4·5Η20、0·5gNiCl2·6H20禾口3.3g—水合檸檬酸組成。將100ml搖瓶培養基添加至500ml搖瓶。用來自黑曲霉MMar202的甘油孢子原液的200μ1接種搖瓶,并于30°C在軌道振蕩器上以220rpm溫育72小時。使用50ml來自4個不同搖瓶之每個的搖瓶培養液來接種3升發酵容器。發酵分批培養基每升由250g葡萄糖、5g(NH4)2S04、2.5gKH2P04、0.5gCaCl2·2H20、2gMgSO4-7H20,3gK2SO4Ug檸檬酸、Iml消沫劑和0.75ml痕量金屬溶液組成。痕量金屬溶液每升由13.8gFeSO4·7Η20、14·3gZnS04·7Η20、11·6gMnSO4·H20,2.5gCuSO4·5Η20、0·5gNiCl2·6Η20和3.3g—水合檸檬酸組成。發酵補料培養基每千克由406g麥芽糖、0.5g—水合檸檬酸、和Iml消泡劑組成。將總共2升發酵分批培養基添加至ApplikonBiotechnology二升玻璃夾套發酵罐(ApplikonBiotechnology,Schiedam,荷蘭)。以0至4g/l/小時的速率定量給料發酵補料培養基185小時的一段時間。將發酵容器維持于34°C的溫度,并使用Applikon1030控制系統(ApplikonBiotechnology,Schiedam,荷蘭)來將pH控制于設定點5.1+/-0.1。以Ivvm的速率將空氣添加至容器,并通過以IlOOrpm旋轉的Rushton葉輪來攪動培養液。發酵結束時,從容器收獲全培養液,并以3000Xg離心來除去生物量。將上清液無菌過濾,并于5至10°C貯存。實施例9具有α-L-阿拉伯呋喃糖苷酶活性的特異腐質霉GH62A多肽的純化首先將含有黑曲霉中表達的具有α-L-阿拉伯呋喃糖苷酶活性的重組特異腐質霉GH62A多肽的發酵培養液上清液(實施例8)緩沖液交換入25mM乙酸鈉pH5.1中,38其通過流過400ml在相同緩沖液中平衡的SEPHADEXG-25細樹脂(GEHealthcare,Piscataway,NJ,USA)來進行。然后使用以相同緩沖液平衡的MONOSHR16/10柱(GEHealthcare,Piscataway,NJ,USA)來純化所得的經緩沖液交換的材料(50ml),然后用0-0.5M氯化鈉的線性梯度來洗脫。接著,通過SDS-PAGE來分析在280nm處顯示UV吸光度的級分。在CRITERION8-16%Tris-HClSDS-PAGE凝膠上根據制造商建議的條件來分離2.5μ1級分等分試樣。使用PRECISIONPLUSPROTEIN標準品作為分子量標志物。從盒取出凝膠,并用INSTANTBLUE考馬斯藍蛋白質染料(ExpedeonProteinSolutions,Cambridge,UK)根據制造商建議的條件來染色。還用中等粘度小麥阿拉伯木聚糖(MegazymeInternationalIreland,Ltd.,Bray,Co.Wicklow,愛爾蘭)對在280nm處顯示UV吸光度的級分測定活性。將級分稀釋,并在96孔COSTAR微量滴定板(CorningInc.,Corning,NY,USA)中與每ml具有0.01%(w/v)TWEEN20的50mM乙酸鈉pH5中4.75mg小麥阿拉伯木聚糖在總體積200μ1中于40°C—起溫育70分鐘。通過添加50μ12%氫氧化鈉來停止反應,并使用適用于96孔微板形式的對羥基苯甲酸酰胼(PHBAH,Sigma,St.Louis,MO,USA)測定法來測定還原糖含量,如下文所述。簡言之,在96孔錐底COSTAR微量滴定板中放置100μ1等分試樣的樣品。通過將50μ1在2%NaOH中的1.5%(w/v)PHBAH添加至每孔來起始反應。在無蓋的情況中于95°C加熱平板10分鐘。容許平板冷卻至室溫,并將50μ1H2O添加至每孔。將100μ1來自每孔的等分試樣轉移至平底96孔板,并使用SPECTRAMAX微板讀板儀(MolecularDevices,Sunnyvale,CA,USA)來測量在410nm的吸光度。使用葡萄糖標準品(0.100-0.065mg/ml)來準備標準曲線以將在410nm獲得的吸光度值轉化成葡萄糖等同物,并量化測定法中釋放的還原糖量。匯集含有SDS-PAGE上40-150kD的長的擴散條帶,而且還在小麥阿拉伯木聚糖的情況中具有活性的級分,總體積為48ml。接著使用具有IOkDa截留分子量膜的VIVASPIN20超濾濃縮器來將匯集的材料濃縮至1.5ml體積。然后使用HIL0AD26/60SUPERDEX75制備級柱(GEHealthcare,Piscataway,NJ,USA)在具有125mM氯化鈉的25mM乙酸鈉pH5中純化濃縮的材料。以與上文所描述類似的方式通過SDS-PAGE和小麥阿拉伯木聚糖活性來分析和匯集柱級分,以產生純化的特異腐質霉α-L-阿拉伯呋喃糖苷酶。使用微板BCA蛋白質測定試劑盒(Pierce,Rockford,IL,USA)來測定純化的特異腐質霉α-L-阿拉伯呋喃糖苷酶的蛋白質濃度。實施例10具有α-L-阿拉伯呋喃糖苷酶活性的特異腐質霉GH62A多肽的酶活性將具有α-L-阿拉伯呋喃糖苷酶活性的純化的特異腐質霉GH62A多肽(實施例9)稀釋,并在96孔COSTAR微量滴定板中與每mlIOOmM乙酸鈉pH5中5mg中等粘度小麥阿拉伯木聚糖(MegazymeInternationalIreland,Ltd.,Bray,Co.Wicklow,愛爾蘭)在總體積200μ1中于40°C—起溫育30分鐘。溫育后,在冰上冷卻平板,然后通過具有BIOMAX5kDa截留分子量膜(Millipore,Billerica,MA,USA)的ULTRAFREE-0.5離心濾器來過濾反應物。然后對濾液分析糖含量。通過具有0.05%w/w苯甲酸的0.005M硫酸以每分鐘0.6ml的流速從4.6x250mmAMINEXHPX-87H柱(Bio-RadLaboratories,Inc.,Hercules,CA,USA)于65°C洗脫后,通過積分來自通過純糖樣品校準的折射率檢測器(CHEMSTATION,AGILENT1100HPLC,AgilentTechnologies,SantaClara,CA,USA)的葡萄糖、阿拉伯糖和木糖信號來定量,從而測量樣品濾液的糖濃度。觀察到具有α-L-阿拉伯呋喃糖苷酶活性的特異腐質霉多肽在測定條件下從小麥阿拉伯木聚糖釋放92.6mg阿拉伯糖/mg酶蛋白和7.4mg木糖/mg酶蛋白。生物材料保藏依據布達佩斯條約的條款,下述的生物學材料已經保藏于農業研究機構專利培養物保藏中心(AgriculturalResearchServicePatentCultureCollection)或農業研究培養物保藏中心(AgriculturalResearchCultureCollection,NRRL),北區研究中心(NorthernRegionalResearchCenter),1815UniversityStreet,Peoria,Illinois,61604,USA,并給予下述的保藏號保藏物保藏號保藏日期大腸桿菌pHinsGH62ANRRLB-500752007年11月20日所述菌株于下述條件下保藏確保在本專利申請未決期間,由外國專利法授權的人能夠獲得所述培養物。所述保藏物為所保藏菌株的基本上純的培養物。在提交了該申請的副本,或其后續文本的國家,依據該外國專利法律的要求,可以獲得所述保藏物。然而,應當理解,保藏物的獲得并不構成對實施本發明的許可,實施本發明是對政府行為所授予的專利權的侵犯。通過下列編號的段落來進一步描述本發明[1]具有α-L-阿拉伯呋喃糖苷酶活性的分離的多肽,其選自下組(a)包含氨基酸序列的多肽,所述氨基酸序列與SEQIDNO:2的成熟多肽具有至少70%序列同一性;(b)由多核苷酸編碼的多肽,所述多核苷酸在至少中-高嚴格條件下與SEQIDNO:1的成熟多肽編碼序列或其全長互補鏈雜交;(c)由多核苷酸編碼的多肽,所述多核苷酸包含與SEQIDNO1的成熟多肽編碼序列具有至少70%序列同一性的核苷酸序列;和(d)SEQIDNO2的成熟多肽的包含取代、缺失和/或插入一個或多個(數個)氨基酸的變體。[2]段落1的多肽,其包含與SEQIDNO2的成熟多肽具有至少70%序列同一性的氨基酸序列。[3]段落2的多肽,其包含與SEQIDNO2的成熟多肽具有至少75%序列同一性的氨基酸序列。[4]段落3的多肽,其包含與SEQIDNO2的成熟多肽具有至少80%序列同一性的氨基酸序列。[5]段落4的多肽,其包含與SEQIDNO2的成熟多肽具有至少85%序列同一性的氨基酸序列。[6]段落5的多肽,其包含與SEQIDNO2的成熟多肽具有至少90%序列同一性的氨基酸序列。[7]段落6的多肽,其包含與SEQIDNO2的成熟多肽具有至少95%序列同一性的氨基酸序列。[8]段落7的多肽,其包含與SEQIDNO2的成熟多肽具有至少97%序列同一性的氨基酸序列。[9]段落1的多肽,其包含SEQIDNO2的氨基酸序列或其具有α-L-阿拉伯呋喃糖苷酶活性的片段,或由SEQIDNO:2的氨基酸序列或其具有α-L-阿拉伯呋喃糖苷酶活性的片段組成。[10]段落9的多肽,其包含SEQIDNO2的氨基酸序列或由SEQIDNO2的氨基酸序列組成。[11]段落9的多肽,其包含SEQIDNO2的成熟多肽或由SEQIDNO2的成熟多肽組成。[12]段落1的多肽,其由多核苷酸編碼,所述多核苷酸在至少中-高嚴格條件下與SEQIDNO1的成熟多肽編碼序列或其全長互補鏈雜交。[13]段落12的多肽,其由多核苷酸編碼,所述多核苷酸在至少高嚴格條件下與SEQIDNO1的成熟多肽編碼序列或其全長互補鏈雜交。[14]段落1的多肽,其由多核苷酸編碼,所述多核苷酸包含與SEQIDN0:1的成熟多肽編碼序列具有至少70%序列同一性的核苷酸序列。[15]段落14的多肽,其由多核苷酸編碼,所述多核苷酸包含與SEQIDNO1的成熟多肽編碼序列具有至少75%序列同一性的核苷酸序列。[16]段落15的多肽,其由多核苷酸編碼,所述多核苷酸包含與SEQIDNO1的成熟多肽編碼序列具有至少80%序列同一性的核苷酸序列。[17]段落16的多肽,其由多核苷酸編碼,所述多核苷酸包含與SEQIDNO1的成熟多肽編碼序列具有至少85%序列同一性的核苷酸序列。[18]段落17的多肽,其由多核苷酸編碼,所述多核苷酸包含與SEQIDNO1的成熟多肽編碼序列具有至少90%序列同一性的核苷酸序列。[19]段落18的多肽,其由多核苷酸編碼,所述多核苷酸包含與SEQIDNO1的成熟多肽編碼序列具有至少95%序列同一性的核苷酸序列。[20]段落19的多肽,其由多核苷酸編碼,所述多核苷酸包含與SEQIDNO1的成熟多肽編碼序列具有至少97%序列同一性的核苷酸序列。[21]段落1的多肽,其由多核苷酸編碼,所述多核苷酸包含SEQIDN0:1的核苷酸序列或其編碼具有α-L-阿拉伯呋喃糖苷酶活性的片段的亞序列,或由SEQIDΝ0:1的核苷酸序列或其編碼具有α-L-阿拉伯呋喃糖苷酶活性的片段的亞序列組成。[22]段落21的多肽,其由多核苷酸編碼,所述多核苷酸包含SEQIDNO=I的核苷酸序列或由SEQIDNO1的核苷酸序列組成。[23]段落21的多肽,其由多核苷酸編碼,所述多核苷酸包含SEQIDNO=I的成熟多肽編碼序列或由SEQIDNO1的成熟多肽編碼序列組成。[24]段落1的多肽,其中所述多肽是SEQIDNO:2的成熟多肽的包含取代、缺失和/或插入一個或多個(數個)氨基酸的變體。[25]段落1的多肽,其由質粒pHinsGH62A中所含的所述多核苷酸編碼,所述質粒pHinsGH62A包含在大腸桿菌NRRLB-50075中。[26]段落1-25中任一項的多肽,其中所述成熟多肽是SEQIDNO2的氨基酸18至387。[27]段落1-26中任一項的多肽,其中所述成熟多肽編碼序列是SEQIDNO1的核苷酸52至1161。[28]分離的多核苷酸,其包含編碼段落1-27中任一項的多肽的核苷酸序列。[29]段落28的分離的多核苷酸,其在SEQIDNO:1的成熟多肽編碼序列中包含至少一個突變,其中所述突變核苷酸序列編碼SEQIDNO:2的成熟多肽。[30]核酸構建體,其包含段落28或29的多核苷酸,所述多核苷酸與一個或多個(數個)調控序列可操作連接,所述調控序列指導多肽在表達宿主中生成。[31]重組表達載體,其包含段落30的核酸構建體。[32]重組宿主細胞,其包含段落30的核酸構建體。[33]生成段落1-27中任一項的多肽的方法,包括(a)在有益于所述生產多肽的條件下培養細胞,所述細胞以其野生型形式生成所述多肽;和(b)回收所述多肽。[34]生產段落1-27中任一項的多肽的方法,包括(a)在有益于所述生產多肽的條件下培養包含核酸構建體的宿主細胞,所述核酸構建體包含編碼所述多肽的核苷酸序列;和(b)回收所述多肽。[35]生成親本細胞的突變體的方法,包括破壞或缺失編碼段落1-27中任一項的多肽的核苷酸序列,得到與所述親本細胞相比產生更少所述多肽的突變體。[36]通過段落35的方法生成的突變細胞。[37]段落36的突變細胞,其進一步包含編碼天然的或異源的蛋白質的基因。[38]生產蛋白質的方法,包括(a)在有益于所述蛋白質生產的條件下培養段落37的突變細胞;和(b)回收所述蛋白質。[39]段落28或29的分離的多核苷酸,其通過如下獲得(a)在至少中-高嚴格條件下,將DNA的群體與SEQIDNO=I的成熟多肽編碼序列或其全長互補鏈雜交;和(b)分離雜交的多核苷酸,其編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽。[40]段落39的分離的多核苷酸,其通過如下獲得(a)在至少高嚴格條件下,將DNA的群體與SEQIDNO=I的成熟多肽編碼序列或其全長互補鏈雜交;和(b)分離雜交的多核苷酸,其編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽。[41]段落39或40的分離的多核苷酸,其中所述成熟多肽編碼序列是SEQIDNO1的核苷酸52至1161。[42]生成多核苷酸的方法,所述多核苷酸包含編碼具有α-L-阿拉伯呋喃糖苷酶活性的多肽的突變核苷酸序列,所述方法包括(a)將至少一個突變引入SEQIDN0:1的成熟多肽編碼序列,其中所述突變核苷酸序列編碼多肽,該多肽包含SEQIDNO:2的成熟多肽或由SEQIDNO2的成熟多肽組成;和(b)回收包含所述突變核苷酸序列的多核苷酸。[43]通過段落42的方法生成的突變多核苷酸。[44]生產多肽的方法,包括(a)在有益于所述生產多肽的條件下培養細胞,所述細胞包含編碼所述多肽的段落43的突變多核苷酸;和(b)回收所述多肽。[45]生產段落1-27中任一項的多肽的方法,包括(a)在有益于所述生產多肽的條件下培養轉基因植物或植物細胞,其包含編碼多肽的多核苷酸;和(b)回收所述多肽。[46]轉基因植物、植物部分或植物細胞,其用編碼段落1-27中任一項的多肽的多核苷酸轉化。[47]雙鏈抑制性RNA(dsRNA)分子,其包含段落28或29的多核苷酸的亞序列,其中任選地所述dsRNA是siRNA或miRNA分子。[48]段落47的雙鏈抑制性RNA(dsRNA)分子,其長度為約15、16、17、18、19、20、21、22、23、24、25或更多個雙鏈體核苷酸。[49]抑制細胞中多肽的表達的方法,包括對所述細胞施用雙鏈RNA(dsRNA)分子或者在所述細胞中表達雙鏈RNA(dsRNA)分子,其中所述dsRNA包含段落28或29的多核苷酸的亞序列。[50]段落49的方法,其中所述dsRNA的長度為約15、16、17、18、19、20、21、22、23、24、25或更多個雙鏈體核苷酸。[51]核酸構建體,其包含編碼蛋白質的基因,所述基因與編碼信號肽的核苷酸序列可操作連接,所述信號肽包含SEQIDNO2的氨基酸1至17或由SEQIDNO2的氨基酸1至17組成,其中所述基因對于所述核苷酸序列而言是外來的。[52]重組表達載體,其包含段落51的核酸構建體。[53]重組宿主細胞,其包含段落51的核酸構建體。[54]生產蛋白質的方法,包括(a)在有益于所述蛋白質生產的條件下培養段落53的重組宿主細胞;和(b)回收所述蛋白質。[55]用于降解木聚糖的方法,包括用具有段落1-27中任一項的具有α-L-阿拉伯呋喃糖苷酶活性的多肽處理含有木聚糖的材料。[56]段落55的方法,其進一步包括用一種或多種(數種)木聚糖降解酶處理所述含有木聚糖的材料。[57]段落56的方法,其中所述一種或多種(數種)木聚糖降解酶選自下組木聚糖酶、阿拉伯呋喃糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶、木糖苷酶和葡糖醛酸糖苷酶。[58]段落55的方法,其中所述含有木聚糖的材料是動物飼料。[59]段落55的方法,其中所述含有木聚糖的材料是Kraft漿。[60]段落55的方法,其中所述含有木聚糖的材料是纖維素或木素纖維素材料。本文描述和要求保護的發明并不受限于本文所公開的具體方面的范圍,因為這些方面意欲作為本發明幾個方面的說明。任何等同的方面意欲在本發明的范圍之內。實際上,從前面的說明中,除本文所顯示和描述的之外,本發明的各種修改對于本領域的技術人員而言會是顯而易見的。這些修改也意欲落入所附權利要求書的范圍內。在沖突的情況下,將以包括定義的本公開內容為準。4權利要求一種具有αL阿拉伯呋喃糖苷酶活性的分離的多肽,其選自下組(a)包含氨基酸序列的多肽,所述氨基酸序列與SEQIDNO2的成熟多肽具有至少70%序列同一性;(b)由多核苷酸編碼的多肽,所述多核苷酸在至少中高嚴格條件下與SEQIDNO1的成熟多肽編碼序列或其全長互補鏈雜交;(c)由多核苷酸編碼的多肽,所述多核苷酸包含與SEQIDNO1的成熟多肽編碼序列具有至少70%序列同一性的核苷酸序列;和(d)SEQIDNO2的成熟多肽的包含取代、缺失和/或插入一個或多個(數個)氨基酸的變體。2.權利要求1的多肽,其包含SEQIDNO2的氨基酸序列或其具有α-L-阿拉伯呋喃糖苷酶活性的片段,或由SEQIDNO:2的氨基酸序列或其具有α-L-阿拉伯呋喃糖苷酶活性的片段組成。3.權利要求1的多肽,其由多核苷酸編碼,所述多核苷酸包含SEQIDNO:1的核苷酸序列或其編碼具有α-L-阿拉伯呋喃糖苷酶活性的片段的亞序列,或由SEQIDNO:1的核苷酸序列或其編碼具有α-L-阿拉伯呋喃糖苷酶活性的片段的亞序列組成。4.權利要求1的多肽,其由質粒pHinsGH62A中所含的所述多核苷酸編碼,所述質粒pHinsGH62A包含在大腸桿菌NRRLB-50075中。5.一種分離的多核苷酸,其包含編碼權利要求1-4中任一項的多肽的核苷酸序列。6.一種核酸構建體,其包含權利要求5的多核苷酸,所述多核苷酸與一個或多個(數個)調控序列可操作連接,所述調控序列指導所述多肽在表達宿主中生成。7.—種重組宿主細胞,其包含權利要求6的核酸構建體。8.—種生成權利要求1-4中任一項的多肽的方法,包括(a)在有益于所述多肽生成的條件下培養細胞,所述細胞以其野生型形式生成所述多肽;并(b)回收所述多肽。9.一種生成權利要求1-4中任一項的多肽的方法,包括(a)在有益于所述多肽生成的條件下培養包含核酸構建體的宿主細胞,所述核酸構建體包含編碼所述多肽的核苷酸序列;并(b)回收所述多肽。10.一種生成親本細胞的突變體的方法,包括破壞或缺失編碼權利要求1-4中任一項的多肽的核苷酸序列,得到與所述親本細胞相比產生更少所述多肽的突變體。11.通過權利要求10的方法生成的突變細胞。12.—種生成權利要求1-4中任一項的多肽的方法,包括(a)在有益于所述多肽生成的條件下培養轉基因植物或植物細胞,所述轉基因植物或植物細胞包含編碼所述多肽的多核苷酸;并(b)回收所述多肽。13.轉基因植物、植物部分或植物細胞,其用編碼權利要求1-4中任一項的多肽的多核苷酸轉化。14.一種雙鏈抑制性RNA(dsRNA)分子,其包含權利要求5的多核苷酸的亞序列,其中任選地,所述dsRNA是siRNA或miRNA分子。15.一種抑制多肽在細胞中表達的方法,包括對所述細胞施用雙鏈RNA(dsRNA)分子或者在所述細胞中表達雙鏈RNA(dsRNA)分子,其中所述dsRNA包含權利要求5的多核苷酸的亞序列。16.一種核酸構建體,其包含編碼蛋白質的基因,所述基因與編碼信號肽的核苷酸序列可操作連接,所述信號肽包含SEQIDNO2的氨基酸1至17,或由SEQIDNO2的氨基酸1至17組成,其中所述基因對于所述核苷酸序列而言是外來的。17.—種重組宿主細胞,其包含權利要求16的核酸構建體。18.—種生成蛋白質的方法,包括(a)在有益于所述蛋白質生成的條件下培養權利要求17的重組宿主細胞;并(b)回收所述蛋白質。19.一種用于降解木聚糖的方法,包括用權利要求1-4中任一項的具有α-L-阿拉伯呋喃糖苷酶活性的多肽處理含有木聚糖的材料。20.權利要求19的方法,其進一步包括用一種或多種(數種)木聚糖降解酶處理所述含有木聚糖的材料。全文摘要本發明涉及具有α-L-阿拉伯呋喃糖苷酶活性的分離的多肽和編碼該多肽的分離的多核苷酸。本發明還涉及包含所述多核苷酸的核酸構建體、載體、和宿主細胞以及生成和使用所述多肽的方法。文檔編號C12N9/24GK101978049SQ200880125640公開日2011年2月16日申請日期2008年11月20日優先權日2007年11月30日發明者米歇爾·馬蘭塔,詹姆斯·蘭斯頓,金伯利·布朗申請人:諾維信公司