專利名稱::具有葡糖淀粉酶活性的多肽和編碼該多肽的多核苷酸的制作方法
技術領域:
:本發明涉及具有葡糖淀粉酶活性的分離的多肽和編碼所述多肽的分離的多核苷酸。本發明還涉及包含所述多核苷酸的核酸構建體、載體和宿主細胞,以及用于產生和使用所述多肽的方法,和本發明的葡糖淀粉酶的用途,以及使用本發明的葡糖淀粉酶產生液化、糖化和發酵產物的工藝。本發明還涉及包含本發明的葡糖淀粉酶的組合物。相關領域描述葡糖淀粉酶(1,4-a-D-葡聚糖葡糖水解酶,EC3.2.I.3)是催化從淀粉或相關的寡糖和多糖分子的非還原端釋放D-葡萄糖的酶。葡糖淀粉酶由幾種絲狀真菌和酵母產生,其中來自曲霉屬(Aspergillus)的那些在商業上最為重要。葡糖淀粉酶(等同于淀粉葡糖苷酶,AMG)主要作為糖化酶出售予多種工業,包括釀造、淀粉和燃料工業。在淀粉和燃料工業中,商業上使用葡糖淀粉酶將已經由α-淀粉酶部分水解的淀粉材料轉化為葡萄糖。然后可使用發酵生物將葡萄糖直接或間接地轉化為發酵產物。商業性發酵產物的實例包括醇(例如乙醇,甲醇,丁醇,1,3_丙二醇),有機酸(例如檸檬酸,乙酸,衣康酸,乳酸,葡糖酸,葡糖酸鹽,乳酸,琥珀酸,2,5-二酮-D-葡糖酸);酮(例如丙酮);氨基酸(例如谷氨酸);氣體(例如H2和CO2),和更復雜的化合物,包括例如抗生素(例如青霉素和四環素);酶;維生素(例如核黃素,B12,β-胡蘿卜素);激素,和其他難以合成產生的化合物。發酵工藝亦常用于可飲用醇類(例如啤酒和葡萄酒),乳制品(例如在酸奶和乳酪的生產中),皮革,飲料和煙草工業。終產物亦可為糖漿。例如,終產物可為葡萄糖,但亦可例如由葡萄糖異構酶轉化為果糖或由幾乎等量的葡萄糖和果糖構成的混合物。該混合物,或進一步富集果糖的混合物,是在整個世界都商業化的最常用的高果糖玉米糖漿(HFCS)。公開了兩種形式的來自草酸青霉(Penicilliumoxalicum)的葡糖淀粉酶的純化和特性(YoshikiYAMASAKI,Agric.Biol.Chem.,41(5),755762,1977)。這兩種葡糖淀粉酶均在高至55°C穩定,但在60°C左右的溫度,葡糖淀粉酶活性顯著下降。這兩種形式的葡糖淀粉酶的序列并未公開于該文獻,甚至較遲的文獻中。發明概述本發明涉及具有葡糖淀粉酶活性的分離的多肽,其選自下組(a)多肽,其包含氨基酸序列,所述氨基酸序列與SEQIDNO:2的成熟序列具有優選至少61.5%,更優選至少63%,更優選至少65%,更優選至少68%,更優選至少70%,更優選至少75%,更優選至少80%,更優選至少85%,更優選至少90%,更優選至少91%,更優選至少92%,甚至更優選至少93%,最優選至少94%,并且甚至最優選至少95%,如甚至至少96%,97%,98%,99%或100%同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸在優選至少低嚴格條件,更優選至少中等嚴格條件,甚至更優選至少中等-高嚴格條件,最優選至少高嚴格條件,并且甚至最優選至少非常高嚴格條件下與以下雜交(i)SEQIDNO:I的成熟多肽編碼序列,(ii)包含SEQIDNO:I的成熟多肽編碼序列的基因組DNA序列,或(iii)(i)或(ii)的全長互補鏈;(c)多肽,其由多核苷酸編碼,所述多核苷酸包含核苷酸序列,所述核苷酸序列與SEQIDNO:I的成熟多肽編碼序列具有至少61.5%,更優選至少63%,更優選至少65%,更優選至少68%,更優選至少70%,更優選至少75%,更優選至少80%,更優選至少85%,更優選至少90%,更優選至少91%,更優選至少92%,甚至更優選至少93%,最優選至少94%,并且甚至最優選至少95%,如甚至至少96%,97%,98%,99%或100%同一性;(d)SEQIDN0:2的成熟多肽包含一個或多個(例如幾個)氨基酸的取代、缺失和/或插入的變體;和(e)(a)、(b)、(c)或(d)的多肽具有葡糖淀粉酶活性的片段。本發明亦涉及分離的多核苷酸,其包含編碼本發明的多肽的核苷酸序列。本發明亦涉及包含所述多核苷酸的核酸構建體、重組表達載體和重組宿主細胞,并涉及產生具有葡糖淀粉酶活性的多肽的方法。本發明亦涉及用本發明的多核苷酸轉化的轉基因植物、植物部分或植物細胞。本發明亦涉及包含本發明的多肽的組合物。本發明亦涉及本發明的多肽用于液化、糖化和/或發酵工藝,優選在淀粉轉化中的用途,涉及本發明的多肽用于生產糖漿、飲料和/或發酵產物的用途,并且涉及本發明的多肽用于釀造的用途。本發明亦涉及用于從含淀粉材料產生液化、糖化和/或發酵產物的工藝,其包括下述步驟用本發明的多肽處理含淀粉材料。圖I顯示純化的本發明的草酸青霉葡糖淀粉酶樣品的SDS-PAGE電泳。泳道I:標志物(97、66、45、30、20.I和14.4kDa);泳道2:本發明的草酸青霉葡糖淀粉酶在純化前的上清;泳道3:本發明的草酸青霉葡糖淀粉酶。本發明的草酸青霉葡糖淀粉酶的多核苷酸序列和推導的氨基酸序列分別示于SEQIDNO:I和2。發明詳述本發明的一個目標是提供具有葡糖淀粉酶活性的多肽和編碼所述多肽的多核苷酸,優選地,提供具有高度熱穩定性的具有葡糖淀粉酶活性的多肽和編碼所述多肽的多核苷酸。定義葡糖淀粉酶活性術語“葡糖淀粉酶(1,4-a-D-葡聚糖葡糖水解酶,3.2.I.3)活性”在本文中定義為催化從淀粉或相關的寡糖和多糖分子的非還原端釋放D-葡萄糖的酶活性。葡糖淀粉酶活性可以以AGU單位測量。參見下文“材料和方法”部分中的“葡糖淀粉酶活性”部分。本發明的多肽具有SEQIDNO:2的成熟多肽的葡糖淀粉酶活性的至少20%,優選至少40%,更優選至少50%,更優選至少60%,更優選至少70%,更優選至少80%,甚至更優選至少90%,最優選至少95%,和甚至最優選至少100%。分離的多肽術語“分離的”和“純化的”意指從與其天然地相結合的至少一種組分移去的多肽或多核苷酸。舉例而言,多肽如通過SDS-PAGE確定,可為至少1%純,例如至少5%純,至少10%純,至少20%純,至少40%純,至少60%純,至少80%純,和至少90%純,而多核苷酸如通過瓊脂糖電泳確定,可為至少1%純,例如至少5%純,至少10%純,至少20%純,至少40%純,至少60%純,至少80%純,至少90%純,和至少95%純。成熟多肽術語“成熟多肽”在本文意指為以其在翻譯和任何翻譯后修飾之后的最終形式存在的多肽,所述修飾如N-末端加工、C-末端截短、糖基化、磷酸化等。在一個方面,基于預測SEQIDNO:2的氨基酸I至21是信號肽的SignalP(Nielsen等,1997,ProteinEngineering10:1-6)程序,所述成熟多肽是SEQIDNO:2的氨基酸22至616。成熟多肽編碼序列術語“成熟多肽編碼序列”在本文中定義為編碼具有葡糖淀粉酶活性的成熟多肽的核苷酸序列。在一個方面,基于預測SEQIDNO:I的核苷酸I至63編碼信號肽的SignalP(Nielsen等,1997,見上)程序,所述成熟多肽編碼序列是SEQIDNO:I的核苷酸64至1848。序列同一性參數“序列同一性”描述兩個氨基酸序列之間或兩個核苷酸序列之間的相關性。就本發明而言,兩個氨基酸序列之間的序列同一性程度使用如EMBOSS軟件包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,TrendsinGenetics16:276-277)(優選3.0.0版或更高版本)的Needle程序中所執行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)來測定。使用的可選參數為缺口開啟罰分(gapopenpenalty)10,缺口延伸罰分(gapextensionpenalty)0.5和EBL0SUM62(BL0SUM62的EMBOSS版)取代矩陣。使用Needle標記為“最長同一'I"生(longestidentity)”的輸出結果(使用-nobrief選項獲得)作為百分比同一性,并計算如下(同樣的殘基X100)/(比對長度一比對中缺口的總數)就本發明而言,兩個脫氧核糖核苷酸序列之間的序列同一性程度使用如EMBOSS軟件包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,見上文)(優選3·0.O版或更高版本)的Needle程序中所執行的Needleman-Wunsch算法(Needleman和Wunsch,1970,見上文)來測定。使用的可選參數為缺口開啟罰分10,缺口延伸罰分0.5和EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩陣。使用Needle標記為“最長同一性”的輸出結果(使用-nobrief選項獲得)作為百分比同一性,并計算如下(同樣的脫氧核糖核苷酸X100)/(比對長度一比對中缺口的總數)—種來自黑曲霉(Aspergillusniger)的具有葡糖淀粉酶活性的多肽(uniprot:P69328)(Svensson,B.Larsen,K.Gunnarsson,A.;"CharacterizationofaglucoamylaseG2fromAspergillusniger.〃;Eur.J.Biochem.154:497-502(1986))與本發明的SEQIDNO:2的草酸青霉葡糖淀粉酶48.1%相同。一種來自Hormoconisresinae的具有葡糖淀粉酶活性的多肽(UNIPROT:Q03045)(Joutsjoki,V.V.Torkkeli,T.K.;"GlucoamyIasePgeneofHormoconisresinae:molecularcloning,sequencingandintroductionintoTrichodermareesei.〃;FEMSMicrobiol.Lett.78:237-243(1992))與本發明的SEQIDNO:2的草酸青霉葡糖淀粉酶51.68%相同(無缺口)。同源序列術語“同源序列”在本文中定義為用SEQIDNO:2的草酸曲霉[大腸桿菌(E.coli)DSM23123]葡糖淀粉酶或其成熟多肽,在tfasty檢索(Pearson,ff.R.,1999,于BioinformaticsMethodsandProtocols.,S.Misener和S.A.Krawetz編,185-219頁)中給出小于0.001的E值(或預期分數)的預測蛋白質。多肽片段術語“多肽片段”在本文中定義為從SEQIDNO:2的成熟多肽或其同源序列的氨基和/或羧基末端缺失一個或多個(例如幾個)氨基酸的多肽;其中所述片段具有葡糖淀粉酶活性。在一個方面,片段含有至少473個氨基酸殘基,例如SEQIDN0:2的氨基酸28至500(本發明的GH151域),更優選至少575個氨基酸殘基,例如,SEQIDNO:2的氨基酸28至500(本發明的GH151域)和氨基酸514至615(本發明的CBM20x域,或其同源序列。亞序列術語“亞序列(subsequence)”在本文中定義為從SEQIDNO:I的成熟多肽編碼序列或其同源序列的5’和/或3’端缺失一個或多個(例如幾個)核苷酸的核苷酸序列;其中所述亞序列編碼具有葡糖淀粉酶活性的多肽片段。在一個方面,亞序列含有SEQIDNO:I的成熟多肽編碼序列或其同源序列的至少1419個核苷酸,例如編碼本發明的GH151域(核苷酸82-1500)的核苷酸,更優選至少其1725個核苷酸,例如編碼本發明的GH151域和CBM20x(核苷酸1540-1845)的核苷酸。等位變體(allelicvariant):術語“等位變體”在本文中表示占據相同染色體基因座的基因的任何兩種或更多種(例如幾個)可選形式。等位變異通過突變天然地發生,并且可導致種群內的多態性。基因突變可以是沉默的(在編碼的多肽中無變化)或可以編碼具有改變的氨基酸序列的多肽。多肽的等位變體是由基因的等位變體編碼的多肽。分離的多核苷酸術語“分離的多核苷酸”用于本文中指從來源分離的多核苷酸。在一個優選的方面,多核苷酸如通過瓊脂糖電泳測定的,為至少1%純,優選至少5%純,更優選至少10%純,更優選至少20%純,更優選至少40%純,更優選至少60%純,甚至更優選至少80%純,并且最優選至少90%純。基本上純的多核苷酸術語“基本上純的多核苷酸”用于本文指不含其它外來的或不期望的核苷酸的多核苷酸制備物,并且所述多核苷酸制備物處于適合于在遺傳工程的蛋白質生產體系中使用的形式。因此,基本上純的多核苷酸含有按重量計至多10%,優選至多8%,更優選至多6%,更優選至多5%,更優選至多4%,更優選至多3%,甚至更優選至多2%,最優選至多1%,并且甚至最優選至多O.5%的與其天然或重組結合的其它多核苷酸材料。然而,基本上純的多核苷酸可以包括天然存在的5’和3’非翻譯區,例如啟動子和終止子。優選基本上純的多核苷酸是按重量計至少90%純,優選至少92%純,更優選至少94%純,更優選至少95%純,更優選至少96%純,更優選至少97%純,甚至更優選至少98%純,最優選至少99%純,并且甚至最優選至少99.5%純的。本發明所述多核苷酸優選為基本上純的形式,SP,所述多核苷酸制備物基本上不含與其天然或重組結合的其它多核苷酸材料。所述多核苷酸可以是基因組、cDNA、RNA、半合成、合成來源的,或它們的任何組合。編碼序列當用于本文時術語“編碼序列”的意思是直接指定其蛋白產物的氨基酸序列的核苷酸序列。編碼序列的邊界通常由開讀框決定,所述開讀框通常以ATG起始密碼子或可供選擇的起始密碼子例如GTG和TTG開始,并且以終止密碼子例如TAA、TAG和TGA結束。編碼序列可以是DNA、cDNA、合成的或重組的核苷酸序列。cDNA:術語“cDNA”在本文中定義為可通過逆轉錄從自真核細胞獲得的成熟的、剪接的mRNA分子制備的DNA分子。cDNA缺乏可存在于相應的基因組DNA中的內含子序列。該起始的、初級的RNA轉錄物是mRNA的前體,其經歷一系列步驟,最后作為成熟的、剪接的mRNA出現。這些步驟包括通過稱作剪接的過程去除內含子序列。因此,來源于mRNA的cDNA不含任何內含子序列。核酸構建體術語“核酸構建體”用于本文指單鏈或雙鏈的核酸分子,所述核酸分子分離自天然存在的基因,其以本來不存在于(nototherwiseexist)自然界中的方式修飾以含有核酸的區段。所述核酸構建體亦可為合成的。當所述核酸構建體含有表達本發明的編碼序列所需的調控序列時,術語核酸構建體與術語“表達盒”同義。調控序列(controlsequence):術語“調控序列”在本文定義為包括對編碼本發明多肽的多核苷酸表達是必需的所有成分。各個調控序列對于編碼所述多肽的核苷酸序列可以是天然的或外源的,或各個調控序列對于彼此可以是天然的或外源的。這些調控序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、啟動子、信號肽序列和轉錄終止子。最少的情況,調控序列包括啟動子和轉錄和翻譯的終止信號。調控序列可以和用于引入特異性限制位點的接頭一起提供,所述特異性限制位點促進調控序列與編碼多肽的核苷酸序列編碼區的連接。可操作地連接術語“可操作地連接”在本文表示這樣的構型,其中將調控序列置于相對于多核苷酸序列的編碼序列的適當位置,使得調控序列指導多肽編碼序列的表達。表達術語“表達”包括涉及多肽產生的任何步驟,其包括但不限于轉錄、轉錄后修飾、翻譯、翻譯后修飾和分泌。表達載體術語“表達載體”在本文定義為線性的或環狀的DNA分子,其包含編碼本發明多肽的多核苷酸,并且所述多核苷酸與提供用于其表達的額外核苷酸可操作地連接。宿主細胞如本文中所使用的術語“宿主細胞”包括任何細胞類型,所述細胞類型對于使用包含本發明多核苷酸的核酸構建體或表達載體的轉化、轉染、轉導等是易感的(susceptible)。修飾術語“修飾”在本文的意思是,對包含或組成為SEQIDNO:2的成熟多肽或其同源序列的多肽的任何化學修飾,以及對編碼所述多肽的DNA的遺傳操作。所述修飾可以是一個或多個(例如幾個)氨基酸的取代、缺失和/或插入,以及一個或多個(例如幾個)氨基酸側鏈的置換。人工變體當用于本文,術語“人工變體”意指由表達SEQIDNO:I的成熟多肽編碼序列的修飾的核苷酸序列,或其同源序列的生物所產生的,具有葡糖淀粉酶活性的多肽。所述修飾的核苷酸序列是通過人為介入修飾SEQIDNO:I中公開的多核苷酸序列或其同源序列獲得的核苷酸序列。具有葡糖淀粉酶活性的多肽在第一個方面,本發明涉及具有葡糖淀粉酶活性的分離的多肽(在下文中稱為“同源多肽”),所述多肽包含氨基酸序列,所述氨基酸序列與SEQIDN0:2的成熟多肽具有優選至少61.5%,更優選至少63%,更優選至少65%,更優選至少68%,更優選至少70%,更優選至少75%,更優選至少80%,更優選至少85%,甚至更優選至少90%,最優選至少95%,并且甚至最優選至少96%,至少97%,至少98%,至少99%,或至少100%的序列同一性程度。在一個優選的方面,所述同源多肽包含氨基酸序列,所述氨基酸序列與SEQIDN0:2的成熟多肽相差十個氨基酸,優選相差九個氨基酸,優選相差八個氨基酸,優選相差七個氨基酸,優選相差六個氨基酸,優選相差五個氨基酸,更優選相差四個氨基酸,甚至更優選相差三個氨基酸,最優選相差兩個氨基酸,并且甚至最優選相差一個氨基酸。本發明的多肽優選包含SEQIDNO:2的氨基酸序列,其等位變體。在一個優選的方面,本發明的多肽包含SEQIDNO:2的氨基酸序列,或其具有葡糖淀粉酶活性的片段。在另一個優選的方面,所述多肽包含SEQIDN0:2的成熟多肽。在另一個優選的方面,本發明的多肽包含SEQIDNO:2的氨基酸22至616或其等位變體,或它們具有葡糖淀粉酶活性的片段。在另一個優選的方面,所述多肽的組成為SEQIDNO:2的氨基酸序列或其等位變體,或它們具有葡糖淀粉酶活性的片段。在另一個優選的方面,所述多肽的組成為SEQIDNO:2的氨基酸序列。在另一個優選的方面,所述多肽的組成為SEQIDN0:2的成熟多肽。在另一個優選的方面,所述多肽的組成為SEQIDNO:2的氨基酸22至616或其等位變體,或它們具有葡糖淀粉酶活性的片段。在另一個優選的方面,所述多肽的組成為SEQIDN0:2的氨基酸22至616。在另一個方面,所述成熟多肽是SEQIDNO:2的氨基酸22至616。在第二個方面,本發明涉及具有葡糖淀粉酶活性的分離的多肽,其由多核苷酸編碼,所述多核苷酸在優選非常低嚴格條件,更優選低嚴格條件,更優選中等嚴格條件,更優選中等-高嚴格條件,甚至更優選高嚴格條件,和最優選非常高嚴格條件下與以下雜交(i)SEQIDNO:I的成熟多肽編碼序列;(ii)包含SEQIDNO:I的成熟多肽編碼序列的基因組DNA序列,(iii)(i)或(ii)的全長互補鏈(J.Sambrook,E.F.Fritsch,andT.Maniatis,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。SEQIDNO:I的核苷酸序列,或其亞序列,以及SEQIDNO:2的氨基酸序列,或其片段,可用于設計核酸探針,以根據本領域內公知的方法從不同屬或種的菌株鑒定和克隆編碼具有葡糖淀粉酶活性的多肽的DNA。具體而言,根據標準的Southern印跡方法,可將這些探針用于與感興趣的屬或種的基因組或cDNA雜交,以鑒定和分離其中相應的基因。這些探針可明顯短于完整序列,但長度上應為至少14,優選至少25,更優選至少35,并且最優選至少70個核苷酸。然而,優選所述核酸探針是至少100個核苷酸長度。例如,所述核酸探針的長度可為至少200個核苷酸,優選至少300個核苷酸,更優選至少400個核苷酸,或最優選至少500個核苷酸。可使用甚至更長的探針,例如長度為優選至少600個核苷酸,更優選至少800個核苷酸,甚至更優選至少1000個核苷酸,甚至更優選至少1500個核苷酸,或最優選至少1800個氨基酸的核酸探針。DNA和RNA探針二者均可使用。通常將探針標記以探測相應的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)標記)。這些探針涵蓋于本發明中。因而,可從由這些其它菌株制備的基因組DNA或cDNA文庫中篩選DNA,所述DNA與上述探針雜交并且編碼具有葡糖淀粉酶活性的多肽。可以通過瓊脂糖或聚丙烯酰胺凝膠電泳,或通過其它分離技術分離來自這些其它菌株的基因組或其它DNA。可以將來自文庫的DNA或分離的DNA轉移至并且固定于硝化纖維素(nitrocellulose)或其它合適的載體材料。為了鑒定與SEQIDN0:1,或其亞序列同源的克隆或DNA,將所述載體材料優選用于Sounthern印跡中。就本發明而言,雜交表示核苷酸序列在非常低至非常高的嚴格條件下與標記的核酸探針雜交,所述核酸探針對應于SEQIDNO:I的成熟多肽編碼序列;包含SEQIDNO:I的成熟多肽編碼序列的基因組DNA序列;其全長互補鏈;或它們的亞序列。可使用例如X射線片(X-rayfilm)檢測在這些條件下與核酸探針雜交的分子。在一個優選的方面,核酸探針是SEQIDNO:I的成熟多肽編碼序列。在另一個優選的方面,核酸探針是SEQIDNO:I的核苷酸64至1848。在另一個優選的方面,核酸探針是編碼SEQIDN0:2的多肽的多核苷酸序列,或其亞序列。在另一個優選的方面,核酸探針是SEQIDN0:1。在另一個優選的方面,核酸探針是包含于大腸桿菌DSM23123中的質粒AMGI中包含的多核苷酸序列,其中其多核苷酸序列編碼具有葡糖淀粉酶活性的多肽。在另一個優選的方面,核酸探針是包含于大腸桿菌DSM23123中的質粒AMGI中包含的成熟多肽編碼區。在另一個優選的方面,核酸探針是SEQIDNO:I的核苷酸82至1500,核苷酸1504至1845。對于長度至少100個核苷酸的長探針,非常低至非常高的嚴格條件定義為在42°C,在5XSSPE、0.3%SDS、200μg/ml已剪切并且變性的鮭精DNA中,以及對于非常低和低嚴格性為25%的甲酰胺,對于中等和中-高嚴格性為35%的甲酰胺,或對于高和非常高嚴格性為50%的甲酰胺,根據標準的Southern印跡步驟進行預雜交和雜交最佳12至24小時。對于長度為至少100個核苷酸的長探針,使用2XSSC、0.2%SDS優選在45°C(非常低嚴格性),更優選在50°C(低嚴格性),更優選在55°C(中等嚴格性),更優選在60°C(中等-高嚴格性),甚至更優選在65°C(高嚴格性),并且最優選在70°C(非常高嚴格性)將載體材料最終洗滌三次,每次15分鐘。對于長度大約15個核苷酸至大約70個核苷酸的短探針,將嚴格條件定義為在比使用根據Bolton和McCarthy的計算法(1962,ProceedingsoftheNationalAcademyofSciencesUSA48:1390)計算的Tni低大約5°C至大約10°C,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP_40,1XDenhardt溶液,ImM焦憐酸鈉(sodiumpyrophosphate),ImM憐酸二氧納(sodiummonobasicphosphate),0.ImMATP和0.2mg每ml的酵母RNA中,根據標準的Southern印跡步驟進行預雜交、雜交和雜交后洗滌最佳12至24小時。對于長度大約15個核苷酸至大約70個核苷酸的短探針,將所述載體材料在6XSSC加0.1%SDS中洗滌一次15分鐘,并用6XSSC在比計算的Tm低5°C至10°C的溫度洗滌兩次,每次15分鐘。在第三個方面,本發明涉及由多核苷酸編碼的具有葡糖淀粉酶活性的分離的多肽,所述多核苷酸包含或組成為如下核苷酸序列,所述核苷酸序列與SEQIDNO:I的成熟多肽編碼序列具有至少61.5%,更優選至少63%,更優選至少65%,更優選至少68%,更優選至少70%,更優選至少75%,更優選至少80%,更優選至少85%,甚至更優選至少90%,最優選至少95%,并且甚至最優選至少96%,至少97%,至少98%,或至少99%的序列同一性程度,并編碼具有葡糖淀粉酶活性的多肽。參見下文“多核苷酸”部分。在第四個方面,本發明涉及SEQIDNO:2的成熟多肽或其同源序列的包含取代、缺失和/或插入一個或多個(例如幾個)氨基酸的人工變體。優選地,氨基酸改變對性質是較不重要的(ofaminornature),即保守的氨基酸取代或插入,其不顯著影響蛋白質的折疊和/或活性;通常為I至大約30個氨基酸的小缺失;小的氨基或羧基末端延伸,如氨基末端甲硫氨酸殘基;多至大約20-25個殘基的小接頭肽;或通過改變凈電荷或其它功能來促進純化的小延伸,如多組氨酸序列(polyhistidinetract)、抗原表位(antigenicepitope)或結合域(bindingdomain)。保守取代的實例是在以下組之內堿性氨基酸組(精氨酸、賴氨酸和組氨酸)、酸性氨基酸組(谷氨酸和天冬氨酸)、極性氨基酸組(谷氨酰胺和天冬酰胺)、疏水性氨基酸組(亮氨酸、異亮氨酸和纈氨酸)、芳族氨基酸組(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸組(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和甲硫氨酸)。通常不改變比活性(specificactivity)的氨基酸取代是本領域已知的,并且例如由H.Neuratt^PR.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍發生的交換是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。除了用20個標準氨基酸,也可用非標準氨基酸(例如4-羥脯氨酸、6-N-甲基賴氨酸、2-氨基異丁酸、異纈氨酸和α-甲基絲氨酸)取代野生型多肽中的氨基酸殘基。有限數量的非保守氨基酸、不由遺傳密碼編碼的氨基酸和非天然氨基酸可以取代氨基酸殘基。“非天然氨基酸”在蛋白質合成后已經過修飾,和/或在它們的側鏈具有不同于基本氨基酸的化學結構。非天然氨基酸能夠以化學方法合成,并且優選是商業上能夠獲得的,包括六氫吡啶羧酸(pipecolicacid)、噻唑燒羧酸(thiazolidinecarboxylicacid)、脫氫腦氨酸、3_和4-甲基脯氨酸,和3,3-二甲基脯氨酸。或者,氨基酸變化可為這樣的性質,其使得所述多肽的物理化學性質改變。例如,氨基酸變化可改善多肽的熱穩定性,改善其底物特異性,改變最適PH等。能夠根據本領域已知的方法,例如定位誘變或丙氨酸分區誘變法(Cunningham和Wells,1989,Science244:1081-1085)來鑒定親本多肽中的必需氨基酸。在后一技術中,將單一丙氨酸突變引入到分子中的每個殘基,并且測試所得突變分子的生物活性(即葡糖淀粉酶活性)以鑒定對于所述分子的活性關鍵的氨基酸殘基。同樣參見Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能夠通過結構的物理分析而確定,如通過以下這些技術如核磁共振、晶體學、電子衍射或光親和標記,連同推定的接觸位點氨基酸的突變來確定。參見例如deVos等,1992,Science255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;fflodaver等,1992,FEBSLett.309:59-64。必需氨基酸的身份(identity)也能夠從與多肽的同一性分析來推斷,所述多肽與根據本發明的多肽相關。能夠使用已知的誘變、重組和/或改組(shuffIing)方法,然后是有關的篩選方法,例如那些由Reidhaar-Olson和Sauer,1988,Science241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA86:2152-2156;W095/17413;或冊95/22625公開的那些方法來進行并測試單個或多個氨基酸取代、缺失和/或插入。能夠使用的其它方法包括易錯PCR、噬菌體展示(例如,Lowman等,1991,Biochem.30:10832-10837;美國專利No.5,223,409;W092/06204)和區域定向的誘變(Derbyshire等,1986,Gene46:145;Ner等,1988,DNA7:127)。誘變/改組方法能夠與高通量、自動化的篩選方法組合以檢測由宿主細胞表達的克隆的、誘變的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。能夠從宿主細胞回收編碼活性多肽的誘變的DNA分子,并且使用本領域內標準方法快速測序。這些方法允許快速確定感興趣的多肽中單個氨基酸殘基的重要性,并且能夠應用于未知結構的多肽。SEQIDNO:2的成熟多肽中的氨基酸取代、缺失和/或插入可為最多10個,優選最多9個,更優選最多8個,更優選最多7個,更優選最多6個,更優選最多5個,更優選最多4個,甚至更優選最多3個,最優選最多2個,并且甚至最優選最多I個。本發明的多肽還包括融合多肽或可切割的融合多肽,其中將另外的多肽融合到所述多肽或其片段的N末端或C末端。通過將編碼另一個多肽的核苷酸序列(或其部分)融合于本發明的核苷酸序列(或其部分)來產生融合的多肽。產生融合多肽的技術是本領域已知的,并包括連接編碼多肽的編碼序列以使它們符合讀框(inframe),并且使融合多肽的表達在相同啟動子和終止子的控制下。融合多肽還可以包括切割位點。一旦分泌了融合蛋白,就切割所述位點,從融合蛋白質釋放具有葡糖淀粉酶活性的多肽。切割位點的實例包括,但不限于,編碼二肽Lys-Arg的Kex2位點(Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-576;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology13:498-503;和Contreras等,1991,Biotechnology9:378-381);Ile-(Glu或Asp)-Gly-Arg位點,其在精氨酸殘基后通過因子Xa蛋白酶切割(Eaton等,1986,Biochem.25:505-512);Asp-Asp-Asp-Asp-Lys位點,其在賴氨酸后通過腸激酶切割(Collins-Racie等,1995,Biotechnology13:982-987);His-Tyr-Glu位點或His-Tyr-Asp位點,其通過GenenaseI切割(Carter等,1989,Proteins:Structure,Function,andGenetics6:240-248);Leu-Val-Pro-Arg-Gly-Ser位點,其在Arg后通過凝血酶切割(Stevens,2003,DrugDiscoveryWorld4:35-48);Glu-Asn-Leu-Tyr-Phe-Gln-Gly位點,其在Gln后通過TEV蛋白酶切割(Stevens,2003,見上文);和Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位點,其在Gln后通過基因工程形式的人鼻病毒3C蛋白酶切割(Stevens,2003,見上文)。在一個優選的方面,本發明的多肽由多核苷酸編碼,所述多核苷酸包含或組成為SEQIDNO:I的核苷酸序列或其編碼具有葡糖淀粉酶活性的片段的亞序列。在一個優選的方面,本發明的多肽由多核苷酸編碼,所述多核苷酸包含或組成為SEQIDNO:I的成熟多肽編碼序列。在一個優選的方面,本發明的多肽由質粒AMGI中包含的多核苷酸編碼,所述質粒包含于大腸桿菌DSM23123。在一個優選的方面,所述成熟多肽編碼序列是SEQIDNO:I的核苷酸64至1848。具有葡糖淀粉酶活性的多肽的來源本發明的具有葡糖淀粉酶活性的多肽可以獲得自任何屬的微生物。就本發明而言,用于本文與給定的來源有關的術語“獲得自”意思是核苷酸序列編碼的多肽由所述來源產生,或由其中插入了來自所述來源的核苷酸序列的菌株產生。在一個優選的方面,獲得自給定來源的多肽是胞外分泌的。本發明的具有葡糖淀粉酶活性的多肽可為真菌多肽。舉例而言,所述多肽可為酵母多肽,如具有葡糖淀粉酶活性的酵母多肽如假絲酵母屬(Candida),克魯維酵母屬(Kluyveromyces),畢赤酵母屬(Pichia),酵母屬(Saccharomyces),裂殖酵母屬(Schizosaccharomyces),或西洋蓍霉屬(Yarrowia)多肽;或更優選具有葡糖淀粉酶活性的絲狀真菌多肽如枝頂孢霉屬(Acremonium)、傘菌屬(Agaricus)、鏈格孢屬(Alternaria)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、Botryospaeria、擬錯菌屬(Ceriporiopsis)、毛_殼屬(Chaetomidium)、金抱子菌屬(Chrysosporium)、Claviceps、Cochliobolus、鬼傘屬(Coprinopsis)、Coptotermes、棒囊殼屬(Corynascus)、隱叢赤殼屬(Cyphonectria)、隱球菌屬(Cryptococcus)、色二孢屬(Diplodia)、黑耳屬(Exidia)、Filibasidium、鐮抱屬(Fusarium)、赤霉屬(Gibberella)、全鞭毛蟲屬(Holomastigotoides)、腐質霉屬(Humicola)、把齒菌屬(Irpex)、蘑燕屬(Lentinula)、Leptospaeria、梨抱菌屬(Magnaporthe)、Melanocarpus、多孑L菌屬(Meripilus)、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、新考瑪脂霉屬(Neocallimastix)、脈孢菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、平革菌屬(Phanerochaete)、瘤胃壺菌屬(Piromyces)、Poitrasia、假黑盤菌屬(Pseudoplectania)、Pseudotrichonympha、根毛霉屬(Rhizomucor)、裂糟菌屬(Schizophyllum)、柱頂抱屬(Scytalidium)、踝節菌屬(Talaromyces)、嗜熱子囊菌屬(Thermoascus)、梭孢殼屬(Thielavia)、彎頸霉屬(Tolypocladium)、木霉屬(Trichoderma)、長毛盤菌屬(Trichophaea)、輪枝孢屬(Verticillium)、包腳燕屬(Volvariella)或炭角菌屬(Xylaria)多肽。在另一個優選的方面,所述多肽是具有葡糖淀粉酶活性的AcremoniumceIIuloIytiCUsλ棘抱曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillusawamori)、煙曲霉(Aspergillusfumigatus)、臭曲霉(Aspergillusfoetidus)、日本曲霉(Aspergillusjaponicus)、構巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillusniger)、米曲霉(Aspergillusoryzae)、嗜角質金孢子菌(Cgrysosporiumkeratinophilum)、Chrysosporiumlucknowense、熱帶金抱子菌(Chrysosporiumtropicum)、Chrysosporiummerdarium、Chrysosporiuminops、租金抱子菌(Chrysosporiumpannicola)、ChrysosporiumqueenslandicumΛChryssosporiumzonatum、桿抱狀德抱(Fusariumbactridioides)、禾谷德抱(Fusariumcerealis)、庫威德抱(Fusariumcrookwellense)、大刀德抱(Fusariumculmorum)、禾本科德抱(Fusariumgraminearum)、禾赤德抱(Fusariumgraminum)、異抱德抱(Fusariumheterosporum)、合歡木德抱(Fusariumnegundi)、尖德抱(Fusariumoxysporum)、多枝德抱(Fusariumreticulatum)、粉紅德抱(Fusariumroseum)、接骨木德抱(Fusariumsambucinum)、膚色德抱(Fusariumsarcochroum)、擬分枝抱德抱(Fusariumsporotrichioides)、硫色德抱(Fusariumsulphureum)、圓德抱(Fusariumtorulosum)、擬絲抱德抱(Fusariumtrichothecioides)、壤片德抱(Fusariumvenenatum)、灰色腐質霉(Humicolagrisea)、特異腐質霉(Humicolainsolens)、疏棉狀腐質霉(Humicolalanuginosa)、白奉巴齒菌(IrpexIacteus)、米黑毛霉(Mucormiehei)、嗜熱毀絲霉(Myceliophthorathermophila)、粗糖脈抱菌(Neurosporacrassa)、繩狀青霉(Penicilliumfuniculosum)、產紫青霉(Penicilliumpurpurogenum)、黃抱平革菌(Phanerochaetechrysosporium)、福射射脈菌(Phlebiaradiata)、托姆青霉(Penicilliumthomii)、草酸青霉(Penicilliumoxalicum)、Thielaviaachromatica、Thielaviaalbomyces、Thielaviaalbopilosa、Thielaviaaustraleinsis、Thielaviafimeti、Thielaviamicrospora、Thielaviaovispora、Thielaviaperuviana、瘤抱梭抱殼(Thielaviaspededonium)、毛梭抱殼(Thielaviasetosa)、Thielaviasubthermophila、土生梭抱殼(Thielaviaterrestris)、哈茨木霉(Trichodermaharzianum)、康寧木霉(Trichodermakoningii)、長枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)或綠色木霉(Trichodermaviride)多妝。在更優選的方面,所述多肽是具有葡糖淀粉酶活性的草酸青霉多肽。在最優選的方面,所述多肽是具有葡糖淀粉酶活性的草酸青霉多肽,例如,包含SEQIDN0:2的成熟多肽的多肽。可理解的是對于前述的種,本發明包含完全和不完全階段(perfectandimperfectstates),和其它分類學的等同物(equivalent),例如無性型(anamorph),而無論它們已知的種名。本領域熟練技術人員將容易地識別適合的等同物的身份(identity)。這些種的菌株在許多培養物保藏中心對于公眾能夠容易地取得,所述保藏中心諸如美國典型培養物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物和細胞培養物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSMZ)、真菌菌種保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和農業研究機構專利培養物保藏中心北區研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)0此外,可以使用上述的探針從其它來源,包括從自然界(例如,土壤、堆肥、水等)分離的微生物鑒定和獲得這些多肽。用于從天然生境(habitat)分離微生物的技術是本領域內公知的。隨后可通過相似地篩選這種微生物的基因組或cDNA文庫來獲得所述多核苷酸。一旦用所述探針檢測到編碼多肽的多核苷酸,就能夠通過使用本領域普通技術人員熟知的技術將所述多核苷酸分離或克隆(參見,例如,Sambrook等,1989,見上文)。多核苷酸本發明還涉及分離的多核苷酸,其包含編碼本發明具有葡糖淀粉酶活性的多肽的核苷酸序列或由所述核苷酸序列組成。在一個優選的方面,本發明的核苷酸序列包含或組成為SEQIDNO:I。在另一個更優選的方面,所述核苷酸序列包含或組成為大腸桿菌DSM23123中包含的質粒AMGI中所含的多核苷酸序列。在另一個優選的方面,所述核苷酸序列包含或組成為SEQIDN0:1的成熟多肽編碼序列。在另一個優選的方面,成熟多肽編碼序列為SEQIDNO:I的核苷酸64至1848。在另一個更優選的方面,所述核苷酸序列包含大腸桿菌DSM23123中包含的質粒AMGI中包含的成熟多肽編碼序列或由所述成熟多肽編碼序列組成。本發明還涵蓋編碼多肽的核苷酸序列,所述多肽包含或組成為SEQIDNO:2的氨基酸序列或其成熟多肽,所述核苷酸序列由于遺傳密碼的簡并性與SEQIDNO:I或其成熟多肽編碼序列有差異。本發明還涉及SEQIDNO:I的亞序列,其編碼SEQIDNO:2的具有葡糖淀粉酶活性的片段。本發明亦涉及突變體多核苷酸,其包含或組成為有至少一個突變的SEQIDNO:I的成熟多肽編碼序列,其中所述突變體核苷酸序列編碼SEQIDNO:2的成熟多肽。所述至少一個突變可為一個或多個(例如一個或幾個)突變。優選地,所述至少一個突變是最多10個,優選最多9個,更優選最多8個,更優選最多7個,更優選最多6個,更優選最多5個,更優選最多4個,甚至更優選最多3個,最優選最多2個,并且甚至最優選最多I個突變。優選所述突變為核苷酸取代、缺失和/或插入。用于分離或克隆編碼多肽的多核苷酸的技術是本領域內已知的,包括從基因組DNA分離,從cDNA制備,或其組合。可通過例如使用熟知的聚合酶鏈式反應(PCR)或表達文庫的抗體篩選來檢測具有共有結構特性的克隆DNA片段,從而實現從這種基因組DNA克隆本發明的多核苷酸。參見,例如,Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork。可以使用其它核酸擴增方法,如連接酶鏈式反應(LCR)、連接活化轉錄(ligatedactivatedtranscription;LAT)和基于核苷酸序列的擴增(NASBA)。可以從青霉屬菌株,或其它或相關生物體克隆多核苷酸,并且因此例如可為所述核苷酸序列的多肽編碼區的等位基因變體或種變體(speciesvariant)。本發明還涉及分離的多核苷酸,其包含或組成為如下核苷酸序列,所述核苷酸序列與SEQIDNO:I的成熟多肽編碼序列具有優選至少61.5%,更優選至少63%,更優選至少65%,更優選至少68%,更優選至少70%,更優選至少75%,更優選至少80%,更優選至少85%,甚至更優選至少90%,最優選至少95%,并且最優選至少96%,至少97%,至少98%,或至少99%的序列同一性程度,并編碼具有葡糖淀粉酶活性的多肽。修飾編碼本發明多肽的核苷酸序列對于合成與所述多肽基本上相似的多肽可為必需的。術語與所述多肽“基本上相似”指多肽的非天然存在的形式。這些多肽可能以一些工程改造的方式而不同于從其天然來源分離的多肽,例如,比活性、熱穩定性、最適PH等方面不同的人工變體。可以在作為SEQIDNO:I的成熟多肽編碼序列存在的核苷酸序列,例如其亞序列的基礎上,和/或通過引入如下核苷酸取代來構建變體序列所述取代不產生由核苷酸序列編碼的多肽的另外的氨基酸序列,但是符合意欲產生酶的宿主生物體的密碼子選擇;或者所述取代可產生不同的氨基酸序列。關于核苷酸取代的概述,參見,例如,Ford等,1991,ProteinExpressionandPurification2:95-107。對于本領域技術人員顯而易見的是,這些取代能夠在對于分子功能重要的區域之外進行,并且仍然產生活性多肽。可以根據本領域公知的方法,例如定位誘變或丙氨酸分區誘變法(參見,例如,Cunningham和Wells,1989,見上文)來鑒定對于由本發明的分離的多核苷酸編碼的多肽活性關鍵的并且因此優選不進行取代的氨基酸殘基。在后一技術中,將突變引入到分子中的每個荷正電的殘基處,并且測試所得突變分子的葡糖淀粉酶活性,以鑒定對于所述分子的活性關鍵的氨基酸殘基。底物-酶相互作用的位點也能夠通過分析三維結構測定,通過如核磁共振分析、晶體學或光親和標記這樣的技術來測定(參見,例如,deVos等,1992,見上文;Smith等,1992,見上文;fflodaver等,1992,見上文)。在一個優選的方面,本發明還涉及編碼本發明多肽的分離的多核苷酸,其在優選非常低嚴格條件,更優選低嚴格條件,更優選中等嚴格條件,更優選中等-高嚴格條件,甚至更優選高嚴格條件,和最優選非常高嚴格條件下與以下雜交(i)SEQIDN0:1的成熟多肽編碼序列,(ii)包含SEQIDNO:I的成熟多肽編碼序列的基因組DNA序列;或(iii)(i)或(ii)的全長互補鏈;或其等位變體和亞序列(Sambrook等,1989,見上文),如本文中所定義。在一個優選的方面,本發明還涉及通過下述方法獲得的分離的多核苷酸(a)將DNA群體在優選非常低嚴格條件,更優選低嚴格條件,更優選中等嚴格條件,更優選中-高嚴格條件,甚至更優選高嚴格條件,并且最優選非常高嚴格條件下與以下雜交(i)SEQIDNO:I的成熟多肽編碼序列,(ii)包含SEQIDNO:I的成熟多肽編碼序列的基因組DNA序列;或(iii)(i)或(ii)的全長互補鏈;和(b)分離雜交的多核苷酸,其編碼具有葡糖淀粉酶活性的多肽。核酸構建體本發明還涉及包含本發明的分離的多核苷酸的核酸構建體,所述分離的多核苷酸與一個或多個(例如幾個)調控序列可操作地連接,所述調控序列在合適的宿主細胞中在與該調控序列相容的條件下指導編碼序列的表達。可以用許多方式操作編碼本發明多肽的分離的多核苷酸以提供多肽的表達。依賴于表達載體,在將多核苷酸的序列插入載體之前對其進行操作可能是理想的或必需的。使用重組DNA方法修飾多核苷酸序列的技術是本領域熟知的。調控序列可以是適當的啟動子序列,其是由用于表達編碼本發明多肽的多核苷酸的宿主細胞識別的核苷酸序列。啟動子序列含有介導多肽的表達的轉錄調控序列。啟動子可以是在所選的宿主細胞中顯示轉錄活性的任何核苷酸序列,包括突變的、截短的和雜合的啟動子,并且可以從編碼與宿主細胞同源或異源的胞外或胞內多肽的基因獲得。用于指導本發明的核酸構建體在絲狀真菌宿主細胞中轉錄的合適啟動子的實例是從下列酶的基因獲得的啟動子米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸穩定性α-淀粉酶、黑曲霉或泡盛曲霉(Asperillusawamori)葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構酶、構巢曲霉乙酰胺酶、鑲片鐮孢淀粉葡糖苷酶(W000/56900)、鑲片鐮孢Daria(WC)00/56900)、鑲片鐮孢Quinn(W)00/56900)、尖鐮孢胰蛋白酶樣蛋白酶(W096/00787)、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶I、里氏木霉纖維二糖水解酶II、里氏木霉內切葡聚糖酶I、里氏木霉內切葡聚糖酶II、里氏木霉內切葡聚糖酶III、里氏木霉內切葡聚糖酶IV、里氏木霉內切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木糖苷酶,以及NA2-tpi啟動子(一種修飾的啟動子,其包含在曲霉屬(Aspergilli)中編碼中性α-淀粉酶的基因,其中未翻譯的前導序列由在曲霉屬中編碼丙糖磷酸異構酶的基因的未翻譯的前導序列所替代;非限制性實例包括修飾的啟動子,其包含在黑曲霉中編碼中性α-淀粉酶的基因,其中未翻譯的前導序列由在構巢曲霉或米曲霉中編碼丙糖磷酸異構酶的基因的未翻譯的前導序列所替代);和它們的突變的、截短的和雜合的啟動子。在酵母宿主中,有用的啟動子從如下酶的基因獲得釀酒酵母烯醇化酶(EN0-1)、釀酒酵母半乳糖激酶(GALl)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH1,ADH2/GAP)、釀酒酵母丙糖磷酸異構酶(TPI)、釀酒酵母金屬硫蛋白(CUPl)和釀酒酵母3-磷酸甘油酸激酶。對于酵母宿主細胞其它有用的啟動子由Romanos等,1992,Yeast8:423-488描述。調控序列也可以是合適的轉錄終止子序列,即由宿主細胞識別以終止轉錄的序列。所述終止子序列與編碼所述多肽的核苷酸序列的3’末端可操作地連接。可以將在所選宿主細胞中有功能的任何終止子用在本發明中。對于絲狀真菌宿主細胞優選的終止子從如下酶的基因獲得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構巢曲霉鄰氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖鐮孢胰蛋白酶樣蛋白酶。對于酵母宿主細胞優選的終止子從如下酶的基因獲得釀酒酵母烯醇化酶、釀酒酵母細胞色素C(CYCl)和釀酒酵母甘油醛-3-磷酸脫氫酶。對于酵母宿主細胞其它有用的終止子由Romanos等,1992,見上文描述。調控序列還可以是合適的前導序列,當其轉錄時,是對于宿主細胞的翻譯重要的mRNA非翻譯區。前導序列可操作地連接于編碼多肽的核苷酸序列的5’-末端。可以將在所選宿主細胞中有功能的任何前導序列用在本發明中。對于絲狀真菌宿主細胞優選的前導序列從如下酶的基因獲得米曲霉TAKA淀粉酶和構巢曲霉丙糖磷酸異構酶。對于酵母宿主細胞合適的前導序列從如下酶的基因獲得釀酒酵母烯醇化酶(EN0-1)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母α因子和釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)。調控序列也可以是聚腺苷酸化序列,其是與核苷酸序列的3’末端可操作地連接的序列,并且在轉錄時,宿主細胞將其識別為將聚腺苷殘基添加至轉錄的mRNA的信號。可以將在所選宿主細胞中有功能的任何聚腺苷酸化序列在本發明中使用。對于絲狀真菌宿主細胞優選的聚腺苷酸化序列從如下酶的基因獲得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構巢曲霉鄰氨基苯甲酸合酶、尖鐮孢胰蛋白酶樣蛋白酶和黑曲霉α-葡糖苷酶。對于酵母宿主細胞有用的聚腺苷酸化序列由Guo和Sherman,1995,MolecularCellularBiology15:5983-5990描述。調控序列還可以是信號肽編碼區,其編碼與多肽的氨基末端相連的信號肽,并且指導編碼的多肽進入細胞分泌途徑。核苷酸序列的編碼序列5’端可固有地包含信號肽編碼序列,其與編碼分泌多肽的編碼序列片段一起天然地連接在翻譯閱讀框中。可供選擇的是,編碼序列5’端可含有對于所述編碼序列外源的信號肽編碼序列。外源信號肽編碼序列在編碼序列不天然地含有信號肽編碼序列時可為必需的。或者,外源信號肽編碼序列可以簡單地取代天然信號肽編碼序列以增強多肽的分泌。然而,指導表達的多肽進入所選宿主細胞的分泌途徑(即,分泌至培養基中)的任何信號肽編碼序列可在本發明中使用。對于絲狀真菌宿主細胞有效的信號肽編碼序列是從如下酶的基因獲得的信號肽編碼序列米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特異腐質霉(Humicolainsolens)纖維素酶、特異腐質霉內切葡聚糖酶V和疏棉狀腐質霉(Humicolalanuginosa)脂肪酶。對于酵母宿主細胞有用的信號肽從釀酒酵母α因子和釀酒酵母轉化酶的基因獲得。其它有用的信號肽編碼序列由Romanos等,1992,見上文描述。在一個優選的方面,所述信號肽包含或組成為SEQIDN0:2的氨基酸I至21。在另一個優選的方面,所述信號肽編碼序列包含或組成為SEQIDNO:I的I至63。調控序列還可以是前肽編碼序列,其編碼位于多肽氨基端的前肽。所得多肽稱作酶原(proenzyme)或前多肽(propolypeptide)(或在某些情況下稱為酶原(zymogen))。前多肽通常是無活性的,并且能夠通過前肽的催化或自催化切割從前多肽轉化為成熟活性多肽。可以從枯草芽孢桿菌堿性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、釀酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜熱毀絲霉漆酶(W095/33836)的基因獲得前肽編碼序列。當信號肽和前肽序列二者均存在于在多肽的氨基端時,將前肽序列置于緊接著(nextto)多肽氨基端端,并且將信號肽序列置于緊接著前肽序列的氨基端。同樣理想的是添加調節序列,其允許相對于宿主細胞的生長來調節多肽的表達。調節系統的實例是引起基因表達響應化學或物理刺激物,包括調節化合物的存在而開啟或關閉的那些系統。原核系統中的調節系統包括lac、tac和trp操縱基因系統。在酵母中,可以使用ADH2系統或GALl系統。在絲狀真菌中,可以使用TAKAα-淀粉酶啟動子、黑曲霉葡糖淀粉酶啟動子和米曲霉葡糖淀粉酶啟動子作為調節序列。調節序列的其它實例是那些允許基因擴增的序列。在真核系統中,這些調節序列包括在氨甲蝶呤(methotrexate)存在下擴增的二氫葉酸還原酶基因,和以重金屬(withheavymetal)擴增的金屬硫蛋白基因。在這些情況下,編碼多肽的核苷酸序列將與調節序列可操作地連接。表達載體本發明還涉及重組表達載體,所述重組表達載體包含本發明的多核苷酸,優選進一步包含啟動子和轉錄和翻譯終止信號。本文所述的多種核酸和調控序列可以結合在一起以產生重組表達載體,所述表達載體可以包括一個或多個(例如幾個)方便的限制位點以允許在這些位點插入或取代編碼多肽的核苷酸序列。可供選擇的是,可以通過在適當的用于表達的載體中插入包含所述序列的核苷酸序列或核酸構建體來表達本發明的多核苷酸序列。在制備表達載體的過程中,將編碼序列置于載體中,從而將該編碼序列與適當的表達調控序列可操作地連接。重組表達載體可以是任何載體(例如,質粒或病毒),其能夠方便地進行重組DNA步驟,并且能夠產生核苷酸序列的表達。載體的選擇將通常依賴于載體與將引入該載體的宿主細胞的相容性。載體可以是線狀或閉合環狀質粒。載體可以是自主復制載體,即,作為染色體外實體(entity)存在的載體,其復制獨立于染色體復制,例如,質粒、染色體外元件、微型染色體(minichromosome)或人工染色體。載體可以含有任何用于確保自復制的手段(means)。或者,載體可以是一種當被引入宿主細胞中時,整合到基因組中并且與整合了該載體的染色體一起復制的載體。此外,可以使用單獨的載體或質粒或兩個或更多個載體或質粒,其共同含有待引入宿主細胞基因組的完整DNA(totalDNA),或可以使用轉座子(transposon)。本發明的載體優選地含有一個或多個(例如幾個)選擇性標記,其允許簡單選擇經轉化、轉染、轉導等的細胞。選擇性標記是基因,其產物提供殺生物劑或病毒抗性、對重金屬的抗性、對營養缺陷型的原養性(prototrophytoauxotrophs)等。用于酵母宿主細胞的合適標記為ADE2,HIS3,LEU2,LYS2,MET3,TRP1,和URA3。用于絲狀真菌宿主細胞的選擇性標記包括但不限于amdS(乙酰胺酶)、argB(鳥氨酸氨甲酰基轉移酶)、bar(草銨膦(phosphinothricin)乙酰轉移酶)、hph(潮霉素磷酸轉移酶)、niaD(硝酸還原酶)(nitratereductase)、pyrG(乳清酸核苷_5’-磷酸脫羧酶)(orotidine-5’-phosphatedecarboxylase)、sC(硫酸腺昔酸轉移酶)和trpC(鄰氛基苯甲酸合酶(anthranilatesynthase))以及它們的等同物。優選用在曲霉屬細胞中的是構巢曲霉(Aspergillusnidulans)或米曲霉的amdS和pyrG基因和吸水鏈霉菌(Streptomyceshygroscopicus)的bar基因。本發明的載體優選含有元件,其允許載體整合入宿主細胞基因組或允許載體在細為了整合入宿主細胞基因組,載體可依賴編碼多肽的多核苷酸的序列或用于通過同源或非同源重組整合入基因組的任何其它載體元件。或者,載體可以含有額外的核苷酸序列,用于指導通過同源重組整合入宿主細胞基因組染色體中的精確位置。為了增加在精確位置整合的可能性,整合元件應優選含有足夠數量的核酸,如100至10,000堿基對,優選400至10,000堿基對,并且最優選800至10,000堿基對,其與相應的目標序列具有高度序列同一性以增強同源重組的概率。整合元件可以是任何序列,其與宿主細胞基因組中的目標序列同源。此外,整合元件可以是非編碼或編碼的核苷酸序列。另一方面,可以將載體通過非同源重組整合到宿主細胞的基因組中。為了自主復制,載體可以進一步包含復制起點,其使載體能夠在所述的宿主細胞中自主地復制。復制起點可以是介導自主復制的任何質粒復制子(replicator),其在細胞中發揮功能。術語“復制起點”或“質粒復制子”在本文定義為能夠使質粒或載體體內復制的核苷酸序列。細菌復制起點的實例是允許在大腸桿菌中復制的質粒pBR322、pUC19、pACYC177和pACYC184的復制起點,和允許在芽孢桿菌屬中復制的質粒pUBllO、pE194、pTA1060和ρΑΜβI的復制起點。用于酵母宿主細胞中的復制起點的實例是2微米復制起點,ARS1,ARS4,ARSI和CEN3的組合,和ARS4和CEN6的組合。在絲狀真菌細胞中有用的復制起點的實例是AMAl和ANSI(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsResearch15:9163-9175;W000/24883)。分離AMAl基因和構建包含該基因的質粒或載體能夠根據公開于WO00/24883中的方法完成。可以將多于一個拷貝的本發明的多核苷酸插入宿主細胞以增加基因產物的產生。多核苷酸拷貝數的增加可通過如下方法獲得將至少一個額外拷貝的序列整合入宿主細胞基因組,或將可擴增的選擇性標記基因包括于多核苷酸,其中可通過在合適的選擇劑(selectableagent)存在下培養細胞來選擇含有選擇性標記基因的擴增拷貝,且由此含有所述多核苷酸的額外拷貝的細胞。用于連接上述元件以構建本發明的重組表達載體的方法是本領域技術人員熟知的(參見,例如,Sambrook等,1989,見上文)。宿主細胞本發明還涉及重組宿主細胞,其包含本發明的核酸構建體。將包含本發明多核苷酸的構建體或載體導入宿主細胞,使構建體或載體如前所述作為染色體整合體或者作為自復制的染色體外載體維持。術語“宿主細胞”包括親本細胞的任何后代,其由于復制過程中發生的突變而不同于親本細胞。宿主細胞的選擇將在很大程度上依賴于編碼多肽的基因及其來源。宿主細胞可以是在本發明的多肽的重組產生中有用的任何細胞,例如,原核或真核細胞。原核宿主細胞可以是任何革蘭氏陽性細菌或革蘭氏陰性細菌。革蘭氏陽性細菌包括但不限于,芽孢桿菌屬(Nacillus)、鏈球菌屬(Streptococcus)、鏈霉菌屬(Streptomyces)、葡萄球菌屬(Staphylococcus)、腸球菌屬(Enterococcus)、乳桿菌屬(Lactobacillus)、乳球菌屬(Lactococcus)、梭菌屬(Clostridium)、地芽抱桿菌屬(Geobacillus)和海洋芽孢桿菌屬(Oceanobacillus)。革蘭氏陰性細菌包括但不限于,大腸桿菌(E.coli)、假單胞菌屬(Pseudomonas)、沙門氏菌屬(Salmonella)、彎曲桿菌屬(Campylobacter)、螺桿菌屬(Helicobacter)、黃桿菌屬(Flavobacterium)、梭桿菌屬(Fusobacterium)、泥桿菌屬(Ilyobacter)、奈瑟氏菌屬(Neisseria)和脲原體屬(Ureaplasma)。可通過如下方法實現將DNA引入到芽孢桿菌屬細胞例如原生質體轉化(參見,例如,Chang和Cohen,1979,MolecularGeneralGenetics168:111-115),使用感受態細胞(參見,例如,Young和Spizizen,1961,JournalofBacteriology81:823-829或Dubnau和Davidoff-Abelson,1971,JournalofMolecularBiology56:209-221),電穿孔(參見,例如,Shigekawa和Dower,1988,Biotechniques6:742-751)或接合(參見,例如,Koehler和Thorne,1987,JournalofBacteriology169:5771-5278)。可通過如下方法實現將DNA引入到大腸桿菌細胞例如原生質體轉化(參見,例如,Hanahan,1983,J.Mol.Biol.166:557-580)或電穿孔(參見,例如,Dower等,1988,NucleicAcidsRes.16:6127-6145)。可通過如下方法實現將DNA引入到鏈霉菌屬細胞例如原生質體轉化和電穿孔(參見,例如,Gong等,2004,FoliaMicrobiol.(Praha)49:399-405),接合(參見,例如,Mazodier等,1989,J.Bacteriol.171:3583-3585),或轉導(參見,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA98:6289-6294)。可通過如下方法實現將DNA引入到假單胞菌屬細胞例如電穿孔(參見,例如,Choi等,2006,J.Microbiol.Methods64:391-397)或接合(參見,例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51-57)。可通過如下方法實現將DNA引入到鏈球菌屬細胞例如天然感受態(naturalcompetence)(參見,例如,Perry和Kuramitsu,1981,Infect.Tmmun.32:1295-1297),原生質體轉化(參見,例如,Catt和Jollick,1991,Microbios.68:189-207),電穿孑L(參見,例如,Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)或接合(參見,例如,Clewell,1981,Microbiol.Rev.45:409-436)。然而,可以使用本領域已知的將DNA引入宿主細胞的任何方法。宿主細胞還可以是真核生物,如哺乳動物、昆蟲、植物或真菌細胞。在一個優選的方面,宿主細胞是真菌細胞。“真菌”用在本文包括以下門子囊菌門(Ascomycota)、擔子菌門(Basidiomycota)、壺菌門(Chytridiomycota)和接合菌門(Zygomycota)(如由Hawksworth等,于AinsworthandBisby,sDictionaryofTheFungi,第8版,1995,CABInternational,UniversityPress,Cambridge,UK中所定義)以及卵菌門(Oomycota)(如Hawksworth等,1995,見上,171頁中所引用),和所有有絲分裂抱子真菌(mitosporicfungi)(Hawksworth等,1995,見上文)。在一個更優選的方面,真菌宿主細胞是酵母細胞。“酵母”用在本文包括產子囊酵母(ascosporogenousyeast)(內抱霉目(Endomycetales))、產擔子酵母(basidiosporogenousyeast)和屬于半知菌類(FungiImperfecti)(芽抱綱(Blastomycetes))的酵母。由于酵母的分類在未來可能改變,就本發明而言,將酵母定義為如BiologyandActivitiesofYeast(Skinner,F.A.,Passmore,S.M.,和Davenport,R.R.編,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述。在一個甚至更加優選的方面,酵母宿主細胞是假絲酵母屬(Candida)、漢遜酵母屬(Hansenula)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Pichia)、酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)或西洋蓄霉屬細胞(Yarrowia)。在最優選的方面,酵母宿主細胞是卡爾酵母(Saccharomycescarlsbergensis)細胞。在另一個優選的方面,酵母宿主細胞是釀酒酵母(Saccharomycescerevisiae)細胞。在另一個優選的方面,酵母宿主細胞是糖化酵母(Saccharomycesdiastaticus)細胞。在另一個優選的方面,酵母宿主細胞是道格拉氏酵母(Saccharomycesdouglasii)細胞。在另一個優選的方面,酵母宿主細胞是克魯弗酵母(Saccharomyceskluyveri)細胞。在另一個優選的方面,酵母宿主細胞是諾地酵母(Saccharomycesnorbensis)細胞。在另一個優選的方面,酵母宿主細胞是卵形酵母細胞(Saccharomycesoviformis)細胞。在另一個最優選的方面,酵母宿主細胞是乳酸克魯維酵母(KluyveromycesIactis)細胞。在另一個最優選的方面,酵母宿主細胞是解脂西洋蓍霉(YarrowiaIipolytica)細胞。在另一個更優選的方面,真菌宿主細胞是絲狀真菌細胞。“絲狀真菌”包括真菌門(Eumycota)和卵菌門的亞門(如由Hawksworth等,1995,見上文,所定義)的所有絲狀形式。絲狀真菌通常的特征在于由殼多糖(chitin)、纖維素、葡聚糖、殼聚糖(chitosan)、甘露聚糖和其它復雜多糖組成的菌絲體壁。通過菌絲延伸進行營養生長,而碳分解代謝是專性需氧的。相反,酵母例如釀酒酵母的營養生長通過單細胞菌體的出芽生殖(budding)進行,而碳分解代謝可以是發酵的。在一個甚至更優選的方面,絲狀真菌宿主細胞是枝頂孢霉屬(Acremonium)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、煙管霉屬(Bjerkandera)、擬錯菌屬(Ceriporiopsis)、金孢子菌屬(Chrysosporium)、鬼傘屬(Coprinus)、革蓋菌屬(Coriolus)、隱球菌屬(Cryptococcus)、Filibasidium、德抱屬(Fusarium)、腐質霉屬(Humicola)、梨抱菌屬(Magnaporthe)、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、新考瑪脂霉屬(Neocallimastix)、脈抱菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、平革菌屬(Phanerochaete)、射脈菌屬(Phlebia)、瘤胃壺菌屬(Piromyces)、側耳屬(Pleurotus)、裂糟菌屬(Schizophyllum)、踩節菌屬(Talaromyces)、嗜熱子囊菌屬(Thermoascus)、梭孢殼屬(Thielavia)、彎頸霉屬(Tolypocladium)、栓菌屬(Trametes)或木霉屬(Trichoderma)細胞。在最優選的方面,絲狀真菌宿主細胞是泡盛曲霉(Aspergillusawamori)、煙曲霉(Aspergillusfumigatus)、臭曲霉(Aspergillusfoetidus)、日本曲霉(Aspergillusjaponicus)、構巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillusniger)或米曲霉(Aspergillusoryzae)細胞。在另一個最優選方面,絲狀真菌宿主細胞是桿抱狀德抱(Fusariumbactridioides)、禾谷德抱(Fusariumcerealis)、庫威德抱(Fusariumcrookwellense)、大刀德抱(Fusariumculmorum)、禾本科德抱(Fusariumgraminearum)、禾赤德抱(Fusariumgraminum)、異抱德抱(Fusariumheterosporum)、合歡木德抱(Fusariumnegundi)、尖德抱(Fusariumoxysporum)、多枝德抱(Fusariumreticulatum)、粉紅德抱(Fusariumroseum)、接骨木德抱(Fusariumsambucinum)、膚色德抱(Fusariumsarcochroum)、擬分枝抱德抱(Fusariumsporotrichioides)、硫色德抱(Fusariumsulphureum)、圓德抱(Fusariumtorulosum)、擬絲抱德抱(Fusariumtrichothecioides)或壤片德抱(Fusariumvenenatum)細胞。在另一個最優選的方面,絲狀真菌宿主細胞是黑剌煙管菌(Bjerkanderaadusta)、干擬錯菌(Ceriporiopsisaneirina)、干擬錯菌(Ceriporiopsisaneirina)、Ceriporiopsiscaregiea、Ceriporiopsisgilvescens、Ceriporiopsispannocinta、Ceriporiopsisrivulosa、Ceriporiopsissubrufa、蟲擬錯菌(Ceriporiopsissubvermispora)、嗜角質金抱子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、熱帶金抱子菌(Chrysosporiumtropicum)、Chrysosporiummerdarium、Chrysosporiuminops、租金抱子菌(Chrysosporiumpannicola)、ChrysosporiumqueenslandicumΛChrysosporiumzonatum、灰蓋鬼傘(Coprinuscinereus)、毛革蓋菌(Coriolushirsutus)、特異腐質霉(Humicolainsolens)、疏棉狀腐質霉(Humicolalanuginosa)、米黑毛霉(Mucormiehei)、嗜熱毀絲霉(Myceliophthorathermophila)、粗糖脈抱菌(Neurosporacrassa)、產紫青霉(Penicilliumpurpurogenum)、黃抱平革菌(Phanerochaetechrysosporium)、福射射脈菌(Phlebiaradiata)、剌序側耳(Pleurotuseryngii)、土生梭抱殼(Thielaviaterrestris)、長域毛栓菌(Trametesvillosa)、變色栓菌(Trametesversicolor)、哈茨木霉(Trichodermaharzianum)、康寧木霉(Trichodermakoningii)、長枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)或綠色木霉(Trichodermaviride)細胞。在另一個最優選的方面,絲狀真菌宿主細胞是黑曲霉(Aspergillusniger)細胞。在另一個最優選的方面,絲狀真菌宿主細胞是米曲霉(Aspergillusoryzae)細胞。在另一個最優選的方面,絲狀真菌宿主細胞是Chrysosporiumlucknowense細胞。在另一個最優選的方面,絲狀真菌宿主細胞是鑲片鐮孢(Fusariumvenenatum)細胞。在另一個最優選的方面,絲狀真菌宿主細胞是嗜熱毀絲霉(Myceliophthorathermophila)細胞。在另一個最優選的方面,絲狀真菌宿主細胞是里氏木霉細胞。可以將真菌細胞通過涉及原生質體形成、原生質體轉化和細胞壁再生的方法以本身公知的方式轉化。用于轉化曲霉屬和木霉屬宿主細胞的合適方法在EP238023和Yelton等,1984,ProceedingsoftheNationalAcademyofSciencesUSA81:1470-1474中描述。用于轉化鐮孢屬菌種的合適方法由Malardier等,1989,Gene78:147-156和WO96/00787描述。可以使用由如下文獻描述的方法轉化酵母Becker和Guarente,于Abelson,J.N.和Simon,M.I.編,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volume194,pp182-187,AcademicPress,Inc.,NewYork;Ito等,1983,JournalofBacteriology153:163;和Hinnen等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:1920。產生方法本發明還涉及產生本發明多肽的方法,其包括(a)在有助于產生多肽的條件下培養細胞,所述細胞以其野生型形式產生所述多肽;和(b)回收所述多肽。在一個優選的方面,所述細胞是青霉屬(Penicillium)的細胞。在一個更優選的方面,所述細胞是草酸青霉(Penicilliumoxalicum)。在一個最優選的方面,所述細胞是草酸青霉,其包含大腸桿菌DSM23123中含有的質粒AMGI中的葡糖淀粉酶基因。本發明還涉及產生本發明的多肽的方法,其包括(a)在有助于產生多肽的條件下培養宿主細胞,所述宿主細胞包含核酸構建體,所述核酸構建體包含編碼本發明的多肽的多核苷酸;和(b)回收所述多肽。本發明還涉及產生本發明的多肽的方法,包括(a)在有助于產生多肽的條件下培養重組宿主細胞,其中所述宿主細胞包含突變核苷酸序列,其在SEQIDNOil的成熟多肽編碼序列中具有至少一個突變,其中所述突變核苷酸序列編碼多肽,該多肽包含或組成為SEQIDN0:2的成熟多肽,和(b)回收所述多肽。在本發明的產生方法中,使用本領域熟知的方法在適合于產生所述多肽的營養培養基中培養細胞。例如,可以通過在合適培養基中和允許表達和/或分離所述多肽的條件下進行的搖瓶培養,和實驗室或工業發酵罐中的小規模或大規模發酵(包括連續、分批、補料分批或固態發酵)來培養細胞。使用本領域已知的方法在合適的營養培養基中進行培養,所述營養培養基包含碳源和氮源和無機鹽。合適的培養基能夠從商業供應商獲得或可以根據公開的組成制備(例如,在美國典型培養物保藏中心的目錄中)。如果多肽分泌到營養培養基中,該多肽能夠從所述培養基中直接回收。如果多肽不分泌到培養基中,其能夠從細胞裂解物(lysate)回收。可以使用本領域已知的對于多肽是特異性的方法來檢測所述多肽。這些檢測方法可包括特異性抗體的使用、酶產物的形成或酶底物的消失。例如,酶試驗(enzymeassay)可用于測定如本文所述的多肽的活性。所得多肽可以使用本領域已知的方法回收。例如,多肽可以通過常規方法從營養培養基中回收,所述常規方法包括但不限于離心、過濾、提取、噴霧干燥、蒸發或沉淀。本發明的多肽可以通過多種本領域已知的方法純化以獲得基本上純的多肽,所述方法包括但不限于層析(例如,離子交換、親和、疏水、層析聚焦和大小排阻)、電泳方法(例如,制備型(preparative)等電聚焦)、差示溶解度(例如,硫酸銨沉淀)、SDS-PAGE或提取(參見,例如,ProteinPurification,J._C.Janson和LarsRyden,editors,VCHPublishers,NewYork,1989)。本發明還涉及產生本發明的多肽的方法,其包括(a)在有助于多肽產生的條件下培養轉基因植物或植物細胞,所述植物或植物細胞包含編碼所述多肽的多核苷酸;和(b)回收所述多肽。植物本發明還涉及植物,例如,轉基因植物、植物部分或植物細胞,其經多核苷酸轉化,所述多核苷酸編碼本發明具有葡糖淀粉酶活性的多肽,從而以可回收的量表達和產生所述多肽。多肽可從植物或植物部分回收。或者,同樣可以將含有該重組多肽的植物或植物部分用于改進食品或飼料的質量,例如,改進營養價值、適口性(palatabiIity)和流變性質(rheologicalproperties),或用于破壞抗營養因子。轉基因植物可以是雙子葉的(雙子葉植物)或單子葉的(單子葉植物)。單子葉植物的實例是草(grasses),如草地早熟禾(meadowgrass)(藍草(bluegrass),早熟禾屬(Poa));飼用牧草(foragegrass)如羊茅屬(Festuca)、黑麥草屬(Lolium);寒地型牧草(temperategrass),如Agrostis(翦股穎屬);和谷類,例如,小麥、燕麥、黑麥、大麥、稻(rice)、高粱和玉蜀黍(maize)(玉米)。雙子葉植物的實例是煙草(tobacco),豆類(legumes),如羽扇豆(lupins),馬鈴薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜桿(rapeseed)和緊密相關的模式生物體擬南芥(Arabidopsisthaliana)。植物部分的實例是莖(stem)、愈傷組織(callus)、葉(leaf)、根(root)、果實(fruit)、種子(seed)和塊莖(tuber),以及包含這些部分的獨立組織,例如,表皮(epidermis)、葉肉(mesophyll)、薄壁組織(parenchyme)、維管組織(vasculartissue)、分生組織(meristem)。具體的植物細胞區室(compartments),如葉綠體(chloroplast)、質外體(apoplast)、線粒體(mitochondria)、液泡(vacuole)、過氧化物酶體(peroxisome)和細胞質(cytoplasm)也被認為是植物部分。此外,任何植物細胞,無論什么組織來源,都被認為是植物部分。同樣地,植物部分,如分離以促進本發明的應用的具體組織和細胞也被認為是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和種皮(seedcoat)。同樣包含于本發明范圍內的還有這些植物、植物部分和植物細胞的后代。表達本發明多肽的轉基因植物或植物細胞可以依照本領域已知方法構建。簡而言之,通過如下構建所述植物或植物細胞將編碼本發明多肽的一個或多個(例如幾個)表達構建體并入植物宿主基因組或葉綠體基因組,并且將所得的修飾植物或植物細胞繁殖為轉基因植物或植物細胞。表達構建體便利地是包含編碼本發明多肽的多核苷酸的核酸構建體,所述多核苷酸與在選擇的植物或植物部分中表達該核苷酸序列所需的適當的調節序列可操作地連接。此外,表達構建體可以包含對于鑒定整合了該表達構建體的宿主細胞有用的選擇性標記,和將該構建體引入到所述植物中所必需的DNA序列(后者依賴于使用的DNA引入方法)。調節序列的選擇,例如啟動子和終止子序列和任選地信號或轉運序列的選擇,舉例來說,基于期望何時、何處以及如何表達多肽而確定。例如,編碼本發明多肽的基因的表達可以是組成型的或誘導型的,或可以是發育、階段或組織特異性的,并且基因產物可以祀向特定的組織或植物部分例如種子或葉。調節序列由例如Tague等,1988,PlantPhysiology86:506所述。對于組成型表達,可以使用35S_CaMV、玉米泛素I和稻肌動蛋白I啟動子(Franck等,1980,Cell21:285-294,Christensen等,1992,PlantMo.Biol.18:675-689;Zhang等,1991,PlantCell3:1155-1165)。器官特異性啟動子可以是例如來自貯藏庫組織(storagesinktissue)例如種子、馬鈴薯塊莖和果實的啟動子(Edwards和Coruzzi,1990,Ann.Rev.Genet.24:275-303),或來自代謝庫組織(metabolicsinktissue)例如分生組織的啟動子(Ito等,1994,PlantMol.Biol.24:863-878),種子特異性啟動子諸如來自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)啟動子(Wu等,1998,PlantandCellPhysiology39:885-889),來自豆球蛋白(Iegumin)Β4和蠶豆(Viciafaba)的未知的種子蛋白基因的蠶豆啟動子(Conrad等,1998,JournalofPlantPhysiologyl52:708-711)、來自種子油體蛋白(oilbodyprotein)的啟動子(Chen等,1998,PlantandCellPhysiology39:935-941),來自歐洲油菜(Brassicanapus)的忙藏蛋白napA啟動子,或本
技術領域:
公知的任何其他種子特異性的啟動子,例如,在W091/14772中所描述的。此外,啟動子可為葉特異性的啟動子,如來自稻或番爺的rbcs啟動子(Kyozuka等,1993,PlantPhysiology102:991-1000),小球藻病毒(chlorellavirus)腺嘌呤甲基轉移酶(adeninemethyltransferase)基因啟動子(Mitra和Higgins,1994,PlantMolecularBiology26:85-93),或來自稻的aldP基因啟動子(Kagaya等,1995,Molecularandgeneralgenetics248:668-674),或傷口誘導的啟動子,如馬鈴薯pin2啟動子(Xu等,1993,PlantMolecularBiology22:573-588)。同樣地,所述啟動子可通過非生物的處理誘導,所述非生物的處理如溫度、干旱或鹽度變化,或通過外源施加的激活所述啟動子的物質誘導,例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙烯、脫落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金屬。啟動子增強子元件也可以用于實現本發明多肽在植物中的較高表達。例如,啟動子增強子元件可以是內含子,其置于啟動子和編碼本發明多肽的核苷酸序列之間。例如Xu等,1993,見上,公開了使用稻肌動蛋白I基因的第一內含子以增強表達。選擇性標記基因和表達構建體的任何其它部分可以選自本領域內可用的那些。將核酸構建體根據本領域已知的常規技術并入植物基因組,所述常規技術包括土壤桿菌屬(Agrobacterium)介導的轉化、病毒介導的轉化、顯微注射(microinjection)、粒子轟擊、生物射彈轉化和電穿孔(Gasser等,1990,Science244:1293;Potrykus,1990,Bio/Technology8:535;Shimamoto等,1989,Nature338:274)。目前,根癌土壤桿菌(Agrobacteriumtumefaciens)介導的基因轉移(genetransfer),是產生轉基因雙子葉植物的優選方法(為了參考,見Hooykas和Schilperoort,1992,PlantMolecularBiology19:15-38),而且它也可以用于轉化單子葉植物,雖然對于這些植物常常使用其他的轉化方法。目前,產生轉基因單子葉植物的優選的方法,是用粒子(用轉化DNA涂覆的微觀的金或鎢粒子)轟擊胚愈傷組織(embryoniccalli)或發育中的胚(developingembryos)(Christou,1992,PlantJournal2:275-281;Shimamoto,1994,CurrentOpinionBiotechnology5:158-162;Vasil等,1992,Bio/Technology10:667-674)。轉化單子葉植物的可供選擇的方法基于原生質體轉化,如由Omirulleh等,1993,PlantMolecularBiology21:415_428所描述的。其它依照本公開使用的轉化方法包括描述于美國專利號6,395,966和7,151,204中的那些(兩者均通過全文提述并入本文)。轉化之后,根據本領域熟知的方法選擇具有并入的表達構建體的轉化體并且再生成為完整植物。通常設計轉化方法用于通過如下方法在再生期間或在后續世代中選擇性消除選擇基因例如,使用帶有兩個獨立的T-DNA構建體的共轉化或通過特異性重組酶位點特異性地切除選擇基因。本發明還涉及產生本發明多肽的方法,其包括(a)在有助于產生多肽的條件下培養包含多核苷酸的轉基因植物或植物細胞,所述多核苷酸編碼本發明具有葡糖淀粉酶活性的多肽;和(b)回收所述多肽。除了用根據本發明制備的構建體直接轉化具體植物基因型之外,還可通過將具有本發明的構建體的植物與缺乏該構建體的第二植物雜交來制備轉基因植物。舉例而言,可將編碼具有葡糖淀粉酶活性的多肽或其部分的構建體通過雜交而引入特定植物品種,而根本無需直接轉化該給定品種的植物。因此,本發明不僅涵蓋從依照本發明經轉化的細胞直接再生的植物,還包括此類植物的后代(progeny)。如用于本文,后代可指依照本發明制備的親本植物任何世代的后裔(offspring)。此種后代可包含依據本發明制備的DNA構建體,或依據本發明制備的DNA構建體的一部分。雜交導致本發明的轉基因通過將起始種系與包含本發明的轉基因的供體植物種系交叉授粉而引入植物種系。此類步驟的非限制性實例進一步闡述于美國專利7,151,204號。考慮包含本發明的具有葡糖淀粉酶活性的多肽的植物包括通過回交轉化的過程生成的植物。舉例而言,本發明的植物包括稱作回交轉化的基因型、種系、近交體(inbred)或雜交體(hybrid)的植物。可使用遺傳標記以協助本發明的一種或多種轉基因從一個遺傳背景基因滲入(introgression)至另一個。標記協助的選擇提供了相對于常規育種的優勢,在于其可用于避免由表型變異導致的錯誤。進一步,遺傳標記可在特定雜交的個體后代中提供有關良種種質相對程度的數據。舉例而言,當具有期望性狀但除此之外(otherwise)具有非農藝學期望的遺傳背景的植物與良種親本雜交時,可使用遺傳標記來選擇不僅具有該目標性狀,還具有相對較大比例期望種質的后代。以此方式,使一種或多種性狀基因滲入特定遺傳背景所需的世代數得到最小化。組合物本發明還涉及包含本發明的多肽,并優選包含載體和/或賦形劑的組合物。優選地,所述組合物富含這種多肽。術語“富含”表示所述組合物的葡糖淀粉酶活性,例如,以至少I.I的富集因數(enrichmentfactor)增加。優選地,所述組合物配制為提供期望的特征如低色澤,低氣味,和可接受的儲藏穩定性。所述組合物可以包含本發明的多肽作為主要酶成分,例如,單成分組合物。或者,所述組合物可包含多種酶活性,如氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、殼多糖酶、角質酶、環糊精糖基轉移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β_半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、鹵素過氧化物酶、轉化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果膠水解酶、肽谷氨酰胺酶、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶或木聚糖酶。其他的酶可以通過例如屬于以下屬或種的微生物產生曲霉屬,優選棘孢曲霉、泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構巢曲霉、黑曲霉或米曲霉;鐮孢屬,優選桿孢狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢或鑲片鐮孢;腐質霉屬,優選特異腐質霉或疏棉狀腐質霉;或木霉屬,優選哈次木霉、康寧木霉、長枝木霉、里氏木霉或綠色木霉。可以依照本領域內已知的方法制備多肽組合物,并且可以是液體或干組合物的形式。例如,所述多肽組合物可以是顆粒(granulate)或微粒(microgranulate)的形式。可以依照本領域內已知方法將包括于所述組合物中的多肽穩定化。下文給出了本發明的多肽或多肽組合物的優選用途的實例。本發明的多肽組合物的劑量和使用該組合物的其它條件可以基于本領域內已知的方法確定。葡糖淀粉酶和α-淀粉酶的組合根據本發明的該方面,本發明的葡糖淀粉酶可與α-淀粉酶組合。優選地,酸性α-淀粉酶對葡糖淀粉酶的比例是O.05至5.0AFAU/AGU。更優選地,酸性α-淀粉酶活性和葡糖淀粉酶活性之間的比例為至少O.10,至少O.15,至少O.20,至少O.25,至少O.30,至少O.35,至少O.40,至少O.45,至少O.50,至少O.55,至少O.60,至少O.65,至少O.70,至少O.75,至少O.80,至少O.85,至少O.90,至少O.95,至少I.00,至少I.05,至少I.10,至少I.20,至少I.30,至少I.40,至少I.50,至少I.60,至少I.70,至少I.80,至少I.85,或甚至至少I.90AFAU/A(iU。然而酸性α-淀粉酶活性和葡糖淀粉酶活性之間的比例應優選小于4.50,小于4.00,小于3.50,小于3.00,小于2.50,或甚至小于2.25AFAU/A⑶。上述組合物適用于液化、糖化和/或發酵工藝,優選用于淀粉轉化,特別是用于產生糖漿和發酵產物,如乙醇。下文給出了本發明的多肽組合物的優選用途的實例。本發明的多肽組合物的劑量和使用該組合物的其它條件可以基于本領域內已知的方法確定。用途本發明亦涉及本發明的多肽在液化、糖化和/或發酵工藝中的用途。所述多肽可用于單個工藝,例如,用于液化工藝、糖化工藝或發酵工藝。所述多肽亦可用于工藝的組合,例如用于液化和糖化工藝,用于液化和發酵工藝,或用于糖化和發酵工藝,優選涉及淀粉轉化。在本發明的一個優選的方面,所述液化、糖化和/或發酵工藝包括順序或同時進行的液化和糖化工藝。在常規酶液化工藝中,添加熱穩定性α-淀粉酶,而長鏈淀粉降解為支化和線性的較短單元(麥芽糊精),但不添加葡糖淀粉酶。本發明的葡糖淀粉酶高度熱穩定,因此將該葡糖淀粉酶添加于液化工藝是有利的。本發明的葡糖淀粉酶當與α-淀粉酶在液化工藝中組合時具有協同作用。在常規糖化過程中,在液化工藝過程中生成的糊精進一步受水解以產生低分子糖DP1-3,其可由發酵生物代謝。所述水解通常使用葡糖淀粉酶進行,或者除了葡糖淀粉酶之外,可使用α-葡糖苷酶和酸性α-淀粉酶。當應用本發明的葡糖淀粉酶,潛在地,與α-淀粉酶組合用于液化和/或糖化工藝中,特別是用于同時液化和糖化工藝中時,所述工藝可以以較高溫度進行。通過將所述液化和/或糖化工藝在較高溫度進行,所述工藝可在較短期限內進行,或者所述工藝可使用較低的酶劑量進行。此外,當將液化和/或糖化工藝以較高溫度進行時,微生物污染的風險減少。含淀粉材料的轉化本發明提供了本發明的葡糖淀粉酶用于從淀粉產生葡萄糖等的用途。一般而言,所述方法包括單獨使用本發明的葡糖淀粉酶或在α-淀粉酶存在下使用本發明的葡糖淀粉酶來部分水解前體淀粉的步驟。本發明的葡糖淀粉酶亦可與僅水解包含至少四個糖基殘基的分子中的α-(1,6)-葡糖苷鍵的酶組合使用。優選地,本發明的葡糖淀粉酶與普魯蘭酶或異淀粉酶組合使用。異淀粉酶和普魯蘭酶在淀粉脫支中的用途,這些酶的分子性質,和這些酶與葡糖淀粉酶一起的潛在用途描述于G.Μ.A.vanBeynum等,StarchConversionTechnology,MarcelDekkerjNewYork,1985,101-142。在一個進一步的方法,本發明涉及本發明的葡糖淀粉酶在淀粉轉化中的用途。此外,本發明的葡糖淀粉酶可用于包括連續糖化工藝的連續淀粉轉化工藝。糖漿、飲料和/或發酵產物的生產本發明的葡糖淀粉酶的用途包括將淀粉轉化為例如糖漿飲料,和/或發酵產物,包括乙醇。本發明亦提供了使用本發明的葡糖淀粉酶從含淀粉材料產生糖漿,如葡萄糖等的工藝。合適的起始材料例示于“含淀粉材料”部分。一般而言,所述工藝包括下述步驟在單獨的本發明葡糖淀粉酶或其與α-淀粉酶的組合的存在下部分或完全地水解含淀粉材料(液化和/或糖化)以從淀粉或相關的寡糖和多糖分子的非還原端釋放葡萄糖。本發明的葡糖淀粉酶亦可以以固定化的形式使用。這適用于并常常用于產生特種糖漿如麥芽糖糖漿,以及與果糖糖漿例如高果糖糖漿(HFS)相關的寡糖的萃余液流中。本發明的葡糖淀粉酶亦可用于產生多種飲料,如但不限于,番茄、馬鈴薯、甜薯(Chinesepotato)、甘薯和/或南瓜的飲料。發酵產物術語“發酵產物”意指通過包括使用發酵生物的發酵工藝的工藝產生的產物。根據本發明涵蓋的發酵產物包括醇(例如,阿拉伯糖醇(arabinitol)、丁醇、乙醇、甘油、甲醇、乙二醇、1,3_丙二醇(丙二醇)、丁二醇、丙三醇、山梨醇和木糖醇);有機酸(例如,乙酸、醋酮酸、己二酸、抗壞血酸、檸檬酸、2,5-二酮-D-葡糖酸、甲酸、反丁烯二酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羥基丙酸、衣康酸、乳酸、蘋果酸、丙二酸、草酸、草酰乙酸、丙酸、琥珀酸和木糖酸);酮(例如,丙酮);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、賴氨酸、絲氨酸和蘇氨酸);烷烴(例如,戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷和十二烷);環烷烴(例如,環戊烷、環己烷、環庚烷和環辛烷);烯烴(例如,戊烯、己烯、庚烯和辛烯);氣體(例如,甲烷、氫氣(H2)、二氧化碳(CO2)和一氧化碳(CO));抗生素(例如,青霉素和四環素);酶;維生素(例如,核黃素,B12,β-胡蘿卜素);和激素。在一個優選的方面,所述發酵產物是乙醇,例如燃料乙醇;飲用乙醇,即,可飲用的中性酒;或工業乙醇或用于可飲用醇類工業(例如,啤酒和葡萄酒)、乳制品工業(例如,發酵的乳制品)、皮革工業和煙草工業的產物。優選的啤酒類型包括愛兒啤酒(ale)、烈性啤酒(stout)、缽爾透黑啤酒(porters)、陳忙啤酒(lagers)、苦味酒(bitters)、麥芽酒(maltliquors)、發泡酒(happoushu)、高醇啤酒(high-alcoholbeer)、低醇啤酒(low-alcoholbeer)、低熱量啤酒(low-caloriebeer)或清淡啤酒(lightbeer)。使用的優選發酵工藝包括醇發酵工藝,其是本領域公知的。優選的發酵工藝為厭氧發酵工藝,其是本領域公知的。釀造本發明的葡糖淀粉酶高度熱穩定,并因此其可用于需要高溫下淀粉水解的工業。舉例而言,本發明的葡糖淀粉酶可用于釀造工業。本發明的葡糖淀粉酶以有效量添加,其可方便地由本領域技術人員確定。液化、糖化和/或發酵產物的產生在此方面,本發明涉及用于從含淀粉材料產生液化、糖化和/或發酵產物的工藝,包括下述步驟用本發明的多肽處理含淀粉材料。合適的含淀粉起始材料列于下文“含淀粉材料”部分。涵蓋的酶列于下文“酶”部分。優選地,本發明的工藝包括用單獨的本發明多肽或其與α-淀粉酶一同處理含淀粉材料。優選地,用本發明的多肽(單獨或在α-淀粉酶存在下)處理含淀粉材料的步驟是在40°C至100°C,優選65°C至90°C,更優選80°C至85°C進行,和/或在2.O至7.O的pH,優選pH4.O至pH6.0,更優選pH4.5至pH5.5進行。本發明的液化和/或糖化產物是糊精,或低分子糖例如DP1-3。在液化工藝中,淀粉至葡萄糖、糊精和/或低分子量糖的轉化通過添加本發明的葡糖淀粉酶而增強。發酵產物如乙醇可任選地在發酵之后例如通過蒸餾來回收。發酵優選在酵母,優選在酵母屬的菌株的存在下進行。合適的發酵生物列于下文的“發酵生物”部分。在發酵產物特別是乙醇的產生中,最廣泛使用的工藝是同時糖化和發酵(SSF)工藝,其中可將發酵生物如酵母,和糖化酶一同添加。SSF通常在25°C至40°C,如29°C至35°C,如30°C至34°C,如大約32°C的溫度進行。根據本發明在發酵過程中可將溫度調高或調低。本發明的葡糖淀粉酶當用于液化工藝時可良好地增強乙醇產生。本發明的葡糖淀粉酶當與α-淀粉酶一同添加時,可加速發酵速率,且亦可增加最終乙醇效價。常規糖化可使用本領域公知的條件進行。舉例而言,完整的糖化工藝可持續高至約24至72小時,然而,通常僅在30至65°C,通常約60°C的溫度進行通常40至90分鐘的預糖化,接著在同時糖化和發酵(SSF)的發酵過程中進行完全糖化。糖化通常在30至65°C,通常大約60°C的溫度進行。本發明的葡糖淀粉酶高度熱穩定,因此本發明的預糖化和/或糖化可在與常規預糖化和/或糖化相比更高的溫度進行。在一個實施方案中,本發明的工藝包括在同時糖化和發酵(SSF)工藝之前預糖化含淀粉材料。預糖化可在高溫進行(例如50至85°C,優選60至75V),然后移至SSF。含淀粉材料可通過減少粒徑,優選通過濕法磨制,減少至O.05至3.Omm,優選O.I至O.5mm來制備。在對其進行本發明的工藝之后,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,優選至少99%,并且甚至更優選100%的含淀粉材料的干固形物轉化為可溶性淀粉水解物。在一個實施方案中,本發明的工藝包括在本發明的葡糖淀粉酶的存在下糖化含淀粉材料,例如DEll(右旋糖當量11)麥芽糊精,以產生糖,其可由合適的發酵生物發酵為期望的發酵產物。所述發酵工藝可進行I至250小時,優選25至190小時,更優選30至180小時,更優選40至170小時,甚至更優選50至160小時,仍更優選50至130小時的期間。可制備含淀粉材料如粒狀淀粉的漿料,其具有10至55被%含淀粉材料的干固形物(DS),優選25至40wt%干固形物,更優選30至35wt%干固形物。所述漿料可含有水和/或工藝水(processwater),如爸懼物(逆流(backset))、洗漆水(scrubberwater)、蒸發器冷凝液或懼出物、來自蒸懼的側線汽提器水(side-stripperwater)或其他發酵產物設備(plant)的工藝水。在對其進行本發明的工藝之后,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,優選至少99%,并且甚至更優選100%的含淀粉材料的干固形物轉化為可溶性淀粉水解物。含淀粉材料根據本發明,可使用任何合適的含淀粉的起始材料,包括粒狀淀粉。所述起始材料通常基于期望的發酵產物而選擇。適用于本發明工藝的含淀粉的起始材料的實例包括塊莖、根、莖、全谷粒、玉米、玉米穗軸、小麥、大麥、黑麥、買羅高粱、西米、木薯、樹薯、高粱、稻、豌豆(pea)、豆(bean)或甘薯,或它們的組合,或谷類,含糖的原材料如糖蜜,果物材料,甘蔗或糖甜菜,馬鈴薯,以及含纖維素材料,如木質或植物殘余物,或其組合。涵蓋蠟質和非蠟質兩者類型的玉米和大麥。發酵牛物“發酵生物”指任何適用于發酵工藝并能夠產生期望的發酵產物的生物,包括細菌和真菌生物。特別合適的發酵生物能夠將糖如葡萄糖或麥芽糖直接或間接發酵(即轉化)為期望的發酵產物。發酵生物的實例包括真菌生物,如酵母。優選的酵母包括酵母屬菌種,特別是釀酒酵母的菌株。商業上可獲得的酵母包括例如RedStar/LesaffreEthanolRed(可從RedStar/Lesaffre,USA獲得),FALI(可從BurnsPhilpFoodInc.,USA的分支機構Fleischmann’sYeast獲得),SUPERSTART(可從Alltech獲得),GERTSTRAND(可從GertStrandAB,Sweden獲得)和FERMIOL(可從DSMSpecialties獲得)。酶葡糖淀粉酶葡糖淀粉酶優選為本發明的葡糖淀粉酶。然而如上所述,本發明的葡糖淀粉酶亦可與其他葡糖淀粉酶組合。葡糖淀粉酶可以以0.001至10AGU/gDS,優選0.01至5AGU/gDS,如大約0.05,0.1,0·3,0·5,I或2AGU/gDS,特別是0.05至0.5AGU/gDS或0.02_20AGU/gDS,優選0.l-10AGU/gDS的量添加。α-淀粉酶根據本發明α-淀粉酶可為任何來源的。優選真菌或細菌來源的α-淀粉酶。在一個優選的方面,所述α-淀粉酶是酸性α-淀粉酶,例如真菌酸性α-淀粉酶或細菌酸性α-淀粉酶。術語“酸性α-淀粉酶”意指以有效量添加、在pH范圍3至7,優選3.5至6,或更優選4至5具有最優活性的α-淀粉酶(EC3.2.I.I)。細菌α-淀粉酶根據本發明,細菌α-淀粉酶優選來源于芽孢桿菌屬。在一個優選的方面,所述芽孢桿菌屬α-淀粉酶來源于地衣芽孢桿菌、解淀粉芽孢桿菌、枯草芽孢桿菌或嗜熱脂肪芽孢桿菌的菌株,但亦可來源于其他芽孢桿菌菌種。涵蓋的α-淀粉酶的具體實例包括示于WO99/19467中SEQIDNO:4的地衣芽孢桿菌α-淀粉酶(BLA),示于WO99/19467中SEQIDNO:5的解淀粉芽孢桿菌α-淀粉酶(BAN),和示于WO99/19467中SEQIDNO:3的嗜熱脂肪芽孢桿菌α-淀粉酶(BSG)。在一個本發明的實施方案中,所述α-淀粉酶為分別與WO99/19467中示為SEQIDNO:1、2、3、4或5的任何序列具有至少60%,優選至少70%,更優選至少80%,甚至更優選至少90%,如至少95%,至少96%,至少97%,至少98%或至少99%同一性的同一性程度的酶。所述芽孢桿菌屬α-淀粉酶亦可為變體和/或雜合體,特別是WO96/23873、WO96/23874、WO97/41213、WO99/19467、WO00/60059和TO02/10355(所有文獻通過提述并入本文)任一篇中所描述的。具體而言,涵蓋的α-淀粉酶變體公開于美國專利號6,093,562,6,297,038或美國專利號6,187,576(通過提述并入本文),并包括在位置179至182具有一個或兩個氨基酸缺失的嗜熱脂肪芽孢桿菌α-淀粉酶(BSGα-淀粉酶)變體,所述缺失優選為WO1996/23873中公開的雙缺失(參見,例如第20頁第1_10行,通過提述并入本文),優選與WO99/19467中公開的SEQIDNO:3中所列的野生型BSGα-淀粉酶氨基酸序列相比對應于Λ(181-182),或使用WO99/19467(通過提述并入本文)中SEQIDNO:3的編號方式的氨基酸179和180的缺失。甚至更優選的是與WO99/19467中公開的SEQIDNO:3中所列的野生型BSGα-淀粉酶氨基酸序列相比具有對應于Λ(181-182)的雙缺失,并進一步包含N193F取代(亦表示為I181*+G182*+N193F)的芽孢桿菌屬α-淀粉酶,特別是嗜熱脂肪芽孢桿菌α-淀粉酶。所述α-淀粉酶亦可為產麥芽糖α-淀粉酶。“產麥芽糖α-淀粉酶”(葡聚糖1,4-α-麥芽水解酶,EC3.2.I.133)能夠將直鏈淀粉和支鏈淀粉(amylopectin)水解為α-構型的麥芽糖。一種來自嗜熱脂肪芽孢桿菌菌株NCIB11837的產麥芽糖α-淀粉酶商業上可從NovozymesA/S,Denmark獲得。產麥芽糖α_淀粉酶描述于美國專利號4,598,048,4,604,355和6,162,628,其通過提述并入本文。細菌雜合α-淀粉酶具體涵蓋的雜合α-淀粉酶包含地衣芽孢桿菌α-淀粉酶(示為WO99/19467中的SEQIDNO:4)的445個C端氨基酸殘基和來源于解淀粉芽孢桿菌的α-淀粉酶(示為WO99/194676中的SEQIDNO:3)的37個N端氨基酸殘基,并具有一個或多個,特別是所有的下述取代G48A+T49I+G107Α+Η156Υ+Α181Τ+Ν190F+I201F+A209V+Q264S(使用地衣芽孢桿菌編號)。亦優選具有一個或多個下述突變(或其他芽孢桿菌屬α-淀粉酶骨架中對應的突變)的變體H154Y、A181T、N190F、A209V和Q264S,和/或位置176和179之間兩個殘基的缺失,優選缺失E178和G179(使用WO99/19467的SEQIDNO:5的編號方式)。真菌α-淀粉酶真菌酸性α-淀粉酶包括來源于曲霉屬菌株的酸性α-淀粉酶,如米曲霉、黑曲霉或川地曲霉α-淀粉酶。優選的酸性真菌α-淀粉酶是Fungamyl樣α-淀粉酶,其優選來源于米曲霉的菌株。在本公開中,術語“Fungamyl樣α-淀粉酶”指與示于WO96/23874的SEQIDNO:10的氨基酸序列的成熟部分呈現高同一性,即高于70%,高于75%,高于80%,高于85%,高于90%,高于95%,高于96%,高于97%,高于98%,高于99%或甚至100%同一性的α-淀粉酶。另一種優選的酸性α-淀粉酶來源于黑曲霉菌株。在一個優選的方面,所述酸性真菌α-淀粉酶是來自黑曲霉、作為“AMYAASPNG”以初級登錄號Ρ56271公開于Swiss-prot/TeEMBL數據庫并更具體描述于WO89/01969(實施例3)的α-淀粉酶。所述酸性黑曲霉酸性α-淀粉酶在WO2004/080923(Novozymes)(通過提述并入本文)亦顯示于SEQIDNO:I。還涵蓋了所述酸性真菌淀粉酶與WO2004/080923中的SEQIDNO:I具有至少70%同一性,如至少80%或甚至至少90%同一性,如至少95%,至少96%,至少97%,至少98%,或至少99%同一性的變體。在一個優選的方面,所述α-淀粉酶來源于川地曲霉,并公開于Kaneko等,J.Ferment.Bioeng.81:292-298(1996)“Molecular-cloninganddeterminationofthenucleotide-sequenceofageneencodinganacid-stablealpha—amylasefromAspergilluskawachii〃;并進一步作為EMBL:#AB008370公開。所述真菌酸性α-淀粉酶亦可為包含糖結合模塊(CBM)和α-淀粉酶催化域的野生型酶(即,非雜合體),或其變體。在一個實施方案中,所述野生型酸性α-淀粉酶來源于川地曲霉的菌株。酸性α-淀粉酶可根據本發明以O.01至10AFAU/gDS,優選O.01至5AFAU/gDS,特別是O.02至2AFAU/gDS的量添加。真菌雜合α-淀粉酶在一個優選的方面,所述真菌酸性α-淀粉酶是雜合α-淀粉酶。真菌雜合α-淀粉酶的優選實例包括WO2005/003311或美國專利發明者李明,段俊欣,劉崢,福山志朗,綾部圭,G.科沃德-凱利,R.戴因哈默申請人:諾維信公司