專利名稱:α-淀粉酶的制作方法
技術領域:
本發明涉及α-淀粉酶,編碼所述α-淀粉酶的核酸,產生所述α-淀粉酶的方法,和使用所述α-淀粉酶的方法。
背景技術:
α -淀粉酶(α -I, 4_葡聚糖_4_葡聚糖水解酶,3. 2. I. I)構成一組酶,其催化淀粉和其他直鏈和支鏈1,4-糖苷寡糖和多糖的水解。 α -淀粉酶在數種已知應用中的工業使用由來已久,所述應用如去污劑、烘烤、釀造、淀粉液化和糖化,例如,在高果糖糖漿或乙醇的產生中。這些應用以及其他應用利用源自微生物的α-淀粉酶,特別是細菌α-淀粉酶。最初使用的細菌α -淀粉酶之一是來自地衣芽孢桿菌(B. Iicheniformis)的α -淀粉酶,亦稱作Termamyl 。已對其徹底表征,并對于該酶已確定了晶體結構。堿性淀粉酶,如來源于芽孢桿菌屬菌種(Bacillus sp.)菌株 NCIB 12289,NCIB 12512,NCIB 12513和DSM 9375(公開于WO 95/26397),構成可用于去污劑的特定的α-淀粉酶組。已對許多這些已知的細菌淀粉酶進行修飾以改善其在特定應用中的功能性。Termamyl 和許多高效α -淀粉酶的活性需要|丐。Termamyl 的晶體結構顯示三個鈣原子通過荷負電荷的氨基酸殘基的絡合而結合于α-淀粉酶結構。對鈣的需求對于存在強螯合化合物存在的應用如去污劑中或從全谷粒產生乙醇過程(其中植物材料包含大量的天然螯合劑如植酸)中是不利的。已知對鈣不敏感性淀粉酶,例如公開于EP 1022334和WO 03/083054的α -淀粉酶,和具有公開于UNIPROT :Q03657的序列的環狀芽孢桿菌(Bacillus circulans) α-淀粉酶。因此,提供具有減少的鈣敏感性的α -淀粉酶會是有利的。
發明內容
本發明涉及α-淀粉酶,其包含鈣敏感性α-淀粉酶的A-和C-結構域,和鈣不敏感性α-淀粉酶的B-結構域或其部分。所述α -淀粉酶在強螯合劑存在下具有高穩定性和/或活性,并且還在多種工業應用中具有相當大改進的性能。本發明還涉及包含本發明的α -淀粉酶的組合物,例如去污劑組合物。此外,本發明涉及編碼本發明的α-淀粉酶的核酸,包含這類核酸的質粒,包含這種質粒或核酸的宿主細胞,和用于產生所述α -淀粉酶的方法。
圖I顯示具有SEQ ID NO: 1-16,29和30的氨基酸序列的α -淀粉酶的比對。發明詳述定義Α-、Β_和C-結構域α -淀粉酶的結構包含三個明顯的結構域Α、Β和C,參見例如Machius等,1995,J. Mol. Biol. 246:545-559。術語“結構域”抑制多肽的區,其本身形成整個分子的明顯而獨立的亞結構。α-淀粉酶包含攜帶活性位點的β/α-8桶(barrel),其標為A-結構域,在β_折疊3和α-螺旋3之間有一定長度的環,其標為B-結構域,和C結構域,并在一些情況下還包含糖結合結構域(例如,WO 2005/001064;Machius等,見上)。α -淀粉酶的結構域可通過結構分析如通過使用晶體學技術來確定。另一種用于確定α-淀粉酶的結構域的方法是通過將α-淀粉酶的氨基酸序列與已經確定結構域的另一種α-淀粉酶進行序列比對。例如,與以確定結構域的α-淀粉酶的B-結構域序列能夠比對的序列可認為是該給定α -淀粉酶的B-結構域。等位變體(allelic variant):術語“等位變體”意指占據相同染色體基因座的基因的任何兩種或更多種可選形式。等位變異通過突變天然地發生,并且可導致種群內的多態性。基因突變可以是沉默的(在編碼的多肽中無變化)或可以編碼具有改變的氨基酸序列的多肽。多肽的等位變體是由基因的等位變體編碼的多肽。α-淀粉酶(α-1,4-葡聚糖-4-葡聚糖水解酶,3. 2. I. I)構成一組酶,其催化淀粉和其他直鏈和支鏈1,4-糖苷寡糖和多糖的水解。已知源自廣泛選擇的生物的α -淀粉酶,所述生物包括細菌,例如源自芽孢桿菌屬(Bacillus)的菌種,例如,地衣芽孢桿菌(Bacillus licheniformis);源自真菌菌種,例如米曲霉(Aspergillus oryzae) (TAKA淀粉酶)或黑曲霉(Aspergillus nigar);源自植物例如大麥以及源自哺乳動物。鈣不敏感淀粉酶意指無需鈣存在以供最適活性和/或維持活性構象/結構的α -淀粉酶。鈣敏感性淀粉酶意指需要鈣存在以維持其結構和/或具有完整酶活性的α -淀粉酶。對于一些鈣敏感性淀粉酶,已顯示其在活性構象中含有絡合于酸性氨基酸殘基的鈣原子。已知大量鈣敏感性α-淀粉酶,且由于其有利的性質,已在產業上使用。鈣敏感性α -淀粉酶對于導致絡合于其結構中的鈣原子的喪失的條件,如去污劑組合物和燃料物質(fuel mass)通常是敏感的。鈣敏感性通過將給定的α-淀粉酶在強螯合劑的存在下溫育并分析該溫育對α-淀粉酶的活性或穩定性的作用來確定。鈣敏感性α-淀粉酶在絡合劑的存在下會較不穩定,并通過所述溫育喪失其活性的大部分或全部,而鈣不敏感性淀粉酶在溫育過程中不會喪失活性,或僅喪失小部分活性。螯合劑強度可使用本領結構域中已知的方法如描述于 Nielsen 等,2003,Anal. Biochem. 314:227-234 以及 Nagarajan and Paine, 1984, J.Am. Oil Chem.Soc. 61 (9) :1475-1478(通過提述并入本文)的方法來衡量。可用于此種測定的強螯合劑的實例為EGTA(乙二醇四乙酸),EDTA(乙二胺四乙酸),DTPA( 二亞乙基三胺五乙酸,diethylene triamine pentaacetic acid), DTMPA(二亞乙基三胺五亞甲基勝酸,diethylene triamine-penta-methylene phosphonic acid)和HEDP(1_輕基乙燒-I, I-二基二膦酸,1-hydroxyethan-l, 1-diylbis (phosphonic acid))。可使用其他強螯合劑確定α -淀粉酶的鈣敏感性。本領域普通技術人員能夠決定用于測定鈣敏感性的溫度、PH和鈣濃度。通常,使用比最佳溫度高約5-10度的溫度。編碼序列術語“編碼序列”意指直接指定多肽氨基酸序列的多核苷酸。編碼序列的邊界通常由開讀框確定,所述開讀框通常以ATG起始密碼子或可供選擇的起始密碼子如GTG和TTG開始,并且以終止密碼子如TAA、TAG和TGA結束。編碼序列可以是基因組DNA、cDNA、合成的或重組的多核苷酸。調控序列(control sequence):術語“調控序列”意指包括編碼本發明的α -淀粉酶的多核苷酸表達所必需的所有組分。各個調控序列對于編碼所述α-淀粉酶的多核苷酸可以是天然的或外源的,或各個調控序列對于彼此可以是天然的或外源的。這些調控序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、啟動子、信號肽序列和轉錄終止子。最低限度,調控序列包括啟動子和轉錄和翻譯的終止信號。調控序列可以和用于引入特異性限制位點的接頭一起提供,所述特異性限制位點促進調控序列與編碼α -淀粉酶的多核苷酸編碼區的連接。 表達術語“表達”包括涉及多肽產生的任何步驟,其包括但不限于轉錄、轉錄后修飾、翻譯、翻譯后修飾和分泌。表達載體術語“表達載體”意指線性的或環狀的DNA分子,其包含編碼本發明的多肽的多核苷酸,并與供用于其表達的其他核苷酸可操作地連接。宿主細胞術語“宿主細胞”意指任何細胞類型,所述細胞類型對于用包含本發明的多核苷酸的核酸構建體或表達載體的轉化、轉染、轉導等是易感的(susceptible)。術語“宿主細胞”涵蓋由于在復制過程中發生的突變而與親本細胞不完全相同的親本細胞的任何后代。改善的性質術語“改善的性質”意指與其他α -淀粉酶相比得到改善的與α -淀粉酶相關的特征。此類改善的特征包括但不限于,改變的溫度依存性活性概貌,熱穩定性,PH活性,pH穩定性,底物特異性,產物特異性和化學穩定性。核酸構建體術語“核酸構建體”意指單鏈或雙鏈的核酸分子,所述核酸分子分離自天然存在的基因,或將所述核酸分子以本來不存在于(not otherwise exist)自然界中的方式修飾以含有核酸的區段或所述核酸分子是合成的。當所述核酸構建體含有表達編碼序列所需的調控序列時,術語核酸構建體與術語“表達盒”同義。可操作地連接術語“可操作地連接”意指這樣的構型,其中將調控序列置于相對于多核苷酸序列的編碼序列的適當位置,使得調控序列指導多肽的編碼序列的表達。親本酶術語“親本”α -淀粉酶意指這樣的α -淀粉酶,本發明的α -淀粉酶是通過對其進行修飾而產生的。所述親本可為天然存在的(野生型)多肽,或其通過任何合適的方式制備的變體。舉例而言,所述親本蛋白可為具有修飾的或改變的氨基酸序列的天然存在的多肽的變體。親本亦可為等位變體。多肽片段術語“多肽片段”意指從成熟多肽的氨基和/或羧基末端缺失了一個或多個(幾個)氨基酸的多肽;其中所述片段具有α-淀粉酶活性。在一個方面,片段含有至少481個氨基酸殘基,例如至少483個,至少486個和至少493個氨基酸殘基。同一性兩個氨基酸序列間或兩個核苷酸序列間的相關性由參數”同一性”所描述。就本發明而言,兩個氨基酸序列之間的同一性程度使用如EMBOSS軟件包(EMBOSS :歐洲分子生物學開放軟件組(The European Molecular Biology Open SoftwareSuite),Rice 等,2000,Trends in Genetics 16:276-277)的 Needle 程序,優選為 3. 0. 0版或之后的版本中執行的 Needleman-Wunsch 算法(Needleman 和 Wunsch, 1970, J. Mol.Biol. 48 :443-453)確定。所用的可選參數為缺口開放罰分(gap open penalty) 10,缺口延伸罰分(gap extension penalty) O. 5,和 EBL0SUM62 (BL0SUM62 的 EMBOSS 版)取代矩陣。使用標記為“最長同一性”的Needle輸出(使用-nobrief選項獲得)作為百分比同一性并計算如下(相同的殘基X100)/(比對長度-比對中缺口總數)就本發明而言,兩個脫氧核糖核苷酸序列之間的同一性程度使用如EMBOSS軟件包(EMBOSS :歐洲分子生物學開放軟件組(The European Molecular Biology OpenSoftware Suite), Rice等,2000,見上)的Needle程序,優選為3. 0. 0版或之后的版本中執行的Needleman-Wunsch算法(Needleman和Wunsch, 1970,見上)確定。所用的可選參數為缺口開放罰分10,缺口延伸罰分0. 5,和EDNAFULL (NCBI NUC4. 4的EMBOSS版)取代矩陣。使用標記為”最長同一性”的Needle輸出(使用-nobrief選項獲得)作為百分比同·一性并計算如下(相同的脫氧核糖核苷酸X100)/(比對長度-比對中缺口總數)亞序列術語“亞序列(subsequence) ”意指從成熟多肽編碼序列的5'和/或3'端缺失了一個或多個(幾個)核苷酸的多核苷酸序列;其中所述亞序列編碼具有α-淀粉酶活性的多肽片段。變體術語“變體”意指具有α -淀粉酶活性的多肽,其包含改變,即在一個或多個(幾個)位置取代、插入和/或缺失一個或多個(幾個)氨基酸殘基。取代意指將占據某位置的氨基酸用不同的氨基酸取代;缺失意指去除占據某位置的氨基酸;和插入意指在占據某位置的氨基酸鄰接處或之后添加氨基酸,例如,1-5個氨基酸。野生型術語“野生型” α-淀粉酶意指由天然存在的微生物如見于自然界的細菌、酵母或絲狀真菌表達的α -淀粉酶。變體命名規則就本發明而言,除非另行指明,使用公開于SEQ ID NO: 27中的雜合多肽(其具有如下序列嗜熱脂肪芽抱桿菌(Bacillus stearothermophilus) α -淀粉酶(SEQ ID NO: 4)的氨基酸1-104,接著是環狀芽孢桿菌(Bacillus circulans) α -淀粉酶(SEQ ID NO: 13)的氨基酸103-208,接著是嗜熱脂肪芽孢桿菌(Bacillus stearothermophi lus) α -淀粉酶(SEQ ID NO:4)的氨基酸211-515)以確定在其他α -淀粉酶中對應的氨基酸殘基。將其他α-淀粉酶的氨基酸序列與公開于SEQ ID Ν0:27中的成熟多肽進行比對,并基于該比對,可以使用 Needleman-Wunsch 算法(Needleman 和 Wunsch, 1970, J. Mol. Biol. 48 :443-453)(如用EMBOSS軟件包(EMBOSS :歐洲分子生物開放軟件組(The European Molecular BiologyOpen Software Suite),Rice等,2000,Trends in Genetics 16:276-277 ;http://emboss,org)的Needle程序執行,優選為3. 0. 0版或之后的版本)確定SEQ ID NO:27所公開的成熟多肽中任何氨基酸殘基對應的氨基酸位置編號。在另一個α -淀粉酶中對應氨基酸殘基的鑒定可通過使用“ClustalW”(Larkin等,2007,Bioinformatics 23:2947-2948)進行的多個多肽序列的比對來確證。
當其他酶與SEQ ID N0:2的成熟多肽歧異到傳統的基于序列的比較無法檢測出其關系時(Lindahl 和 Elofsson, 2000,J. Mol. Biol. 295:613-615),可使用其他配對序列比較算法。在基于序列的搜索中較高的敏感度可使用采用多肽家族的概率表現(probabilistic representation)(序型)搜索數據庫的搜索程序來獲得。例如,PSI-BLAST程序通過迭代的(iterative)數據庫搜索過程來產生序型,并能夠檢測出較遠的同源物(A tschul 等,1997,Nucleic Acids Res. 25:3389-3402)。當多肽的家族或超家族在蛋白質結構數據庫中具有一個或多個(幾個)代表時,甚至可達成更高的敏感度。程序如 GenTHREADER(Jones 1999, J. Mol. Biol. 287:797-815;McGuffin 和Jones, 2003, Bioinformatics 19:874-881)使用來自不同來源(PSI-BLAST、二級結構預測(secondary structure prediction)、結構 I匕對序型(structural alignment profile)以及溶解勢(solvation potential))的信息作為預測所查詢序列(query sequence)結構折疊(structural fold)的神經網絡的輸入。類似地,Gough等,2000,J. Mol.Biol. 313:903-919的方法可用于將未知結構的序列與存在于SCOP數據庫中的超家族模型進行比對。這些比對可接著用于生成所述多肽的同源性模型,且上述模型可就其準確度使用多種為此目的開發的工具加以評價。對于已知結構的蛋白質,可獲取數種工具和資源以供找回(retrieve)和生成結構比對。例如,已將SCOP超家族的蛋白質進行了結構比對,且這些比對是可獲取并可下載的。兩個或更多蛋白質結構可使用多種算法,如距離比對矩陣(distance alignmentmatrix)(Holm 和 Sander,1998,Proteins 33:88-96)或組合延伸(combinatorialextension) (Shindyalov 和 Bourne, 1998, Protein Eng. 11:739-747)進行比對,且這些算法的實施可另外用于查詢具有目標結構的結構數據庫,以發現可能的結構同源物(例如Holm和Park, 2000, Bioinformaticsl6:566-567)。這些結構比對可用于在相同結構超家族內的氨基酸中預測結構和功能上對應的氨基酸殘基。這些信息,以及來源于同源性建模和概貌檢索(profile search)的信息,可用于當將感興趣的突變從一種蛋白移至近或遠的同源物時,預測突變哪個殘基。在描述本發明的不同α-淀粉酶變體時,為了參照方便起見,采用了下面所述的命名法。在所有情況下,采用通用的IUPAC單字母或三字母氨基酸縮寫。取代。對于氨基酸取代,使用下述命名法初始氨基酸,位置,取代氨基酸。相應地,在226位用丙氨酸取代蘇氨酸命名為“Thr226Ala”或“Τ226Α”。多重突變可以用加號(“ +,,)分開,例如,“Gly205Arg+Ser411Phe” 或 “G205R+S411F”,分別代表在 205 和 411 位用精氨酸(R)取代甘氨酸(G),以及用苯丙氨酸(F)取代絲氨酸(S)。缺失。對于氨基酸缺失,使用了如下命名法初始氨基酸,位置*。相應地,在位置195缺失甘氨酸命名為“Glyl95*”或“G195*”。多個缺失通過加法符(“ + ”)分開,例如,“Glyl95*+Ser411*,,或 “G195*+S411*,,。通入。對于氨基酸插入,使用了如下的命名法初始氨基酸,位置,初始氨基酸,新插入的氨基酸。因此,在位置195的甘氨酸之后插入賴氨酸命名為“Glyl95GlyLys”或“G195GK”。多個氨基酸的插入命名為[初始氨基酸,位置,初始氨基酸,新插入的氨基酸#1,新插入的氨基酸#2 ;等等]。例如,在位置195的甘氨酸之后插入賴氨酸和丙氨酸記為“Glyl95GlyLysAla” 或 “G195GKA”。
在此情況下,通過在插入的氨基酸殘基前的氨基酸殘基的位置號添加小寫字母而對插入的氨基酸殘基進行編號。因此,在上一例子中序列為
權利要求
1.一種分離的α -淀粉酶,其包含鈣敏感性α -淀粉酶的A-和C-結構域,和鈣不敏感性α -淀粉酶的B-結構域。
2.一種分離的α-淀粉酶,其包含與SEQ ID NOS: 1_12、29和30中任一項的A-結構域具有至少60%序列同一性的A-結構域,與SEQ ID N0S: 13-16和31中任一項的B-結構域具有至少60%序列同一性的B-結構域,和與SEQ ID N0S: 1-12,29和30中任一項的C-結構域具有至少60%序列同一性的C-結構域。
3.權利要求2的α-淀粉酶,其中所述A-結構域與SEQ ID NO: 4的A-結構域具有至少60%序列同一性,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。
4.權利要求1-3中任一項的α-淀粉酶,其中所述Al-結構域與SEQ IDNO:4中在位置1-5的范圍中的位置開始并且在位置94-114的范圍中的位置結束的序列,例如,在位置1-3的范圍中的位置開始并且在位置99-104的范圍中的位置結束的序列,或在位置1-3的范圍中的位置開始并且在位置104-109的范圍中的位置結束的序列,特別是位置1-104的序列具有至少60%序列同一性,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。
5.權利要求1-4中任一項的α-淀粉酶,其中所述B-結構域與SEQIDN0:13中在位置93-113的范圍中的位置開始并且在位置195-215的范圍中的位置結束的序列,例如,在位置97-109的范圍中的位置開始并且在位置199-211的范圍中的位置結束的序列,或在位置100-106的范圍中的位置開始并且在位置202-208的范圍中的位置結束的序列,特別是位置103-208的序列具有至少60%序列同一性,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。
6.權利要求1-5中任一項的α-淀粉酶,其中所述C-結構域與SEQ ID NO:4的C-結構域具有至少60%序列同一性,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。
7.權利要求1-6中任一項的α-淀粉酶,其中所述Α2和C-結構域與SEQIDN0:4中在位置201-221的范圍中的位置開始并且在位置478-483的范圍中的位置結束的序列,例如,在位置206-211的范圍中的位置開始并且在位置480-483的范圍中的位置結束的序列,或在位置211-216的范圍中的位置開始并且在位置480-483的范圍中的位置結束的序列,特別是位置211-483的序列具有至少60%序列同一性,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。
8.權利要求1-7中任一項的α-淀粉酶,其與SEQID N0S: 1_12、29和30中任一項的α-淀粉酶相比更加熱穩定。
9.權利要求1-8中任一項的α-淀粉酶,其與SEQID N0S: 1_12、29和30中任一項的α-淀粉酶相比具有減少的鈣敏感性。
10.一種去污劑組合物,其包含權利要求1-9任一項的α-淀粉酶和表面活性劑。
11.一種組合物,其包含權利要求1-9中任一項的α-淀粉酶和一種或多種選自下組的酶β -淀粉酶,纖維素酶(β -葡糖苷酶、纖維二糖水解酶和內切葡聚糖酶),葡糖淀粉酶,半纖維素酶(例如木聚糖酶),異淀粉酶,異構酶,脂肪酶,肌醇六磷酸酶,蛋白酶和支鏈淀粉酶。
12.權利要求1-9中任一項的α-淀粉酶用于洗滌和/或餐具洗滌的用途。
13.權利要求1-9中任一項的α-淀粉酶用于使紡織品脫漿的用途。
14.權利要求1-9中任一項的α-淀粉酶用于產生烘烤產物的用途。
15.權利要求1-9中任一項的α-淀粉酶用于液化含淀粉材料的用途。
16.—種產生液化的淀粉的方法,其包括用權利要求1-9中任一項的α-淀粉酶液化含淀粉材料。
17.—種產生發酵產物的方法,其包括 (a)用權利要求1-9中任一項的α-淀粉酶液化含淀粉材料以產生液化醪; (b)糖化該液化醪以產生可發酵的糖;和 (C)在發酵生物的存在下發酵可發酵的糖。
18.—種產生發酵產物的方法,包括將淀粉底物與權利要求1-9中任一項的α-淀粉酶、葡糖淀粉酶和發酵生物接觸。
19.權利要求17或18的方法,其中所述發酵產物選自下組醇(例如乙醇和丁醇),有機酸(例如琥珀酸和乳酸),糖醇(例如甘油),抗壞血酸中間物(例如葡糖酸,2-酮-D-葡糖酸,2,5-二酮-D-葡糖酸和2-酮-L-古洛糖酸),氨基酸(例如賴氨酸),蛋白(例如抗體及其片段)。
20.一種核酸序列,其編碼權利要求1-9中任一項的α -淀粉酶。
21.一種質粒,其包含權利要求20的核酸序列。
22.—種宿主細胞,其包含權利要求20的核酸序列或權利要求21的質粒。
23.一種轉基因植物、植物部分或植物細胞,其是用權利要求20的核酸序列轉化的。
24.一種制備權利要求1-9中任一項的α-淀粉酶的方法,包括下述步驟 (a)在導致雜合α-淀粉酶表達的條件下培養權利要求22的宿主細胞;和 (b)回收所述雜合α-淀粉酶。
全文摘要
本發明涉及α-淀粉酶,編碼所述α-淀粉酶的核酸,和產生所述α-淀粉酶的方法,以及使用所述α-淀粉酶的方法。
文檔編號C12N9/28GK102918149SQ201180012228
公開日2013年2月6日 申請日期2011年1月4日 優先權日2010年1月4日
發明者C.安德森, T.A.波爾森 申請人:諾維信公司