具有改進的轉化效率的細菌突變體的制作方法
【專利說明】具有改進的轉化效率的細菌突變體
[0001] 對序列表的引用
[0002] 本申請包括一個計算機可讀形式的序列表,將其通過引用結合在此。
[0003] 背景
[0004] 遺傳感受態是一種外源DNA可以被內化,從而引起轉化事件的生理狀態(貝爾 卡(Berka)等人,分子微生物學(Mol.Microbiol.)2002,43,1331-1345),但是不同于涉 及電穿孔、原生質體和熱激或CaCl 2*理的人工轉化。已經在革蘭氏陽性和革蘭氏陰性 細菌兩者的物種中觀察到天然感受態(杜布諾(Dubnau),微生物學年評(Annual Rev. Microbiol.) 1999, 53, 217-244),并且該過程需要超過一打其表達針對每個生物體的需求 被精確精心設計的蛋白質。
[0005] 已經就天然感受態的目的提議了若干假說,并且可以將它們總結為用于食物的 DNA、用于修復的DNA和用于遺傳多樣性的DNA(杜布諾(Dubnau),1999,見上文)。用于食 物的DNA假說由以下觀察現象支持,感受態是當細胞的營養素被限制時出現的靜止期現 象,并且通常,一種強有力的無特異性核酸酶與轉化特異性蛋白共表達。第二種假說的證據 來自以下事實,編碼DNA修復酶的基因與編碼DNA轉運蛋白的基因協同地表達。最后,針 對遺傳多樣性的DNA假說提議到,感受態是一種用于經由水平基因轉移而探索適合度景觀 (fitness landscape)的機制。感受態由群體感應機制調控和它是一種雙穩狀態的觀察現 象(艾弗里(Avery),微生物學趨勢(Trends Microbiol.) 2005,13,459-462)支持這一假 說。
[0006] 公共數據庫現在包含眾多的完整的細菌基因組,包括來自相同物種的不同菌株 的若干基因組。使用成對全基因組比對,最近的分析已經顯示相同物種的不同菌株在 基因含量方面可能在實質上具有差異。例如,大腸桿菌菌株CFT073、EDL933和MG1655 的基因組比較揭示到,僅僅其蛋白(基因產物)的組合組的39.2%為所有三種菌株所 共有,從而突出了相同物種的菌株之中的驚人多樣性(布拉特納(Blattner)等人,科 學(Science) 1997, 277,1453-1474 ;林(Hayashi)等人,2006,分子系統生物學(Mol. Syst.Biol.)doi:10.1038:msb4100049;佩納(Perna)等人,自然(Nature)2001,409, 529-533;韋爾奇(Welch)等人,美國國家科學院院刊(Proc. Natl. Acad Sci. USA) 2002,99, 17020-17024)。此外,大腸桿菌菌株CFT073的基因組序列揭示了 1,623個菌株特異性基 因(21.2%)。自此類型的比較,可以清楚地看到細菌基因組被分段為共有的保守骨架和菌 株特異性序列。典型地,就在所有菌株之中保守的保守"骨架"基因和可能為水平轉移所需 的非保守基因的分布而言,一個物種內的給定菌株的基因組顯示出一種鑲嵌結構(布魯斯 科維克茲(Brzuszkiewicz)等人,美國國家科學院院刊(Proc. Natl. Acad. Sci. USA) 2006, 103,12879-12884;韋爾奇(Welch)等人,2002,見上文)。
[0007] 就實用性而言,經由天然感受態的轉化是一種用于構建細菌菌株(例如,芽孢桿 菌屬)的極其有用的工具,這些細菌菌株可以包含染色體基因的改變的等位基因或經由重 組DNA方法組裝的質粒。盡管可以經由如以上所指出人工手段(例如,電穿孔、原生質體和 熱激或CaCl2處理)實現用質粒和染色體DNA轉化某些物種,但是通過天然感受態引入DNA 提供簡單、方便、快速及有效的明顯優勢。
[0008] 在枯草芽孢桿菌中,經由涉及群體感應、信號轉導和基因表達級聯的過程,群體中 僅僅5%-10%的細胞區別于感受態狀態(稱為K-狀態)(艾弗里(Avery),2005,見上文)。 已知在感受態中直接涉及至少50個基因,并且多達165個基因由中心轉錄因子ComK (直接 或間接)調控(貝爾卡(Berka)等人,2002,見上文)。枯草芽孢桿菌中的感受態級聯由兩 個被分子開關打斷的調控模塊組成(圖1),該級聯涉及ComS結合至銜接分子MecA,從而干 擾ClpC/ClpP蛋白酶降解轉錄因子ComK (圖爾加伊(Turgay)等人,歐洲分子生物學學會雜 志(EMBO J.)1998,17,6730-6738)。
[0009] 在枯草芽孢桿菌中,已經顯示mecA失活適度地提高轉化效率,這歸因于ComK的增 加的有效性(哈恩(Hahn)等人,分子微生物學(Mol. Microbiol.),1995,18, 755-767)。一 項最近的研宄表明,根據示于圖2中的mecA與eps和tasA調節子之間的調控關系,枯草芽 孢桿菌mecA缺失引起eps和tasA操縱子的表達增加(普利皮克(Prepiak)等人,分子微 生物學(Mol. Microbiol. ),2011,80,1014-1030)。
[0010] 除comP和comS之外,地衣芽孢桿菌賦予實現天然感受態所必需的基因的直系同 源物。表面上,不能獲得天然感受態地衣芽孢桿菌細胞,這歸因于缺乏功能性comS基因,從 而引起ComK被MecA連續螯合并且被ClpC/P/MecA復合物蛋白水解地降解。申請人已經顯 示,ComS和ComK在地衣芽孢桿菌中的表達可以改進感受態(US 2010/0028944)。
[0011] 因為芽孢桿菌屬物種為多種工業相關過程(例如代謝工程和生化生產)提供了關 鍵平臺,表現改進的感受態的工程化菌株對于構建新的且改進的生產菌株而言是高度令人 希望的。用于改進芽孢桿菌屬菌株中的感受態的全包(turn-key)方法的有效性將改進隨 其可以引入染色體標記/等位基因和表達載體的速度與效率。本發明滿足這些以及其他需 求。
[0012] 概述
[0013] 在此描述了具有改進的轉化效率的芽孢桿菌屬突變體。諸位申請人已經出人意料 地發現,與單獨破壞內源mecA基因相比,在芽孢桿菌屬宿主細胞中破壞內源基因 mecA和 sinl兩者顯示出顯著改進的轉化效率。
[0014] 在一個方面中,是一種親本芽孢桿菌屬菌株的突變體,該突變體包括對內源mecA 基因的破壞和對內源sinl基因的破壞,其中當在相同條件下培養時,與缺乏對內源mecA基 因的破壞并缺乏對內源sinl基因的破壞的該親本芽孢桿菌屬菌株相比,該突變體具有改 進的轉化效率。在一些方面中,該芽孢桿菌屬突變體是一種地衣芽孢桿菌突變體或枯草芽 孢桿菌突變體。
[0015] 還描述了用于獲得芽孢桿菌屬突變體的方法,該方法包括在親本芽孢桿菌屬菌株 中破壞內源mecA基因和內源SinI基因。
[0016] 還描述了用于獲得芽孢桿菌屬轉化株的方法,該方法包括將異源多核苷酸轉化進 該芽孢桿菌屬突變體中。
[0017] 還描述了獲得多肽的方法,該方法包括:(a)培養包括編碼該多肽的異源多核苷 酸的芽孢桿菌屬轉化株;并且(b)回收該多肽。
[0018] 還描述了獲得發酵產品的方法,該方法包括:(a)培養包括編碼發酵途徑的多肽 的異源多核苷酸的芽孢桿菌屬轉化株;并且(b)回收該發酵產品。
[0019] 附圖簡要說明
[0020] 圖1示出了枯草芽孢桿菌的感受態調控級聯。模塊1涉及經由磷酸化機制檢測 感受態信息素 CSF和信號轉導,從而合成ComS肽。ComS經由結合至MecA而干擾轉錄因子 ComK的蛋白水解降解,該MecA激活編碼后期感受態功能的模塊2,該模塊編碼DNA轉運機 制。
[0021] 圖2示出了枯草芽孢桿菌中的mecA與印s和asA調節子之間的調控關系。
[0022] 圖3示出了地衣芽孢桿菌mecA基因的DNA序列和推導的氨基酸序列(分別為SEQ ID NO: 1 和 2)。
[0023] 圖4示出了地衣芽孢桿菌sinl基因的DNA序列和推導的氨基酸序列^IjSSEQ ID NO:3 和 4)。
[0024] 圖5示出了枯草芽孢桿菌mecA基因的DNA序列和推導的氨基酸序列(分別為SEQ ID NO:15 和 16)。
[0025] 圖6示出了枯草芽孢桿菌sinl基因的DNA序列和推導的氨基酸序列^IjSSEQ ID NO:17 和 18)。
[0026] 圖7示出了包括mecA基因破壞的菌株TaHy9的轉化效率。
[0027] 圖8示出了菌株TaHy9 (包括mecA基因破壞)和BaC0155 (包括mecA基因破壞和 sinl基因破壞)的相對轉化效率。
[0028] 定義
[0029] 破壞:術語"破壞"意指參照基因的編碼區和/或控制序列被部分或完全修飾(例 如通過缺失、插入和/或取代一個或多個核苷酸,或通過與RNAi締合或反義技術),從而 使得編碼的多肽的表達不存在(失活)或降低,和/或編碼的多肽的酶活性不存在或降 低。可以使用本領域已知的技術測量破壞效果,如使用來自在此參照的無細胞提取物測量 值檢測酶活性的不存在或降低;或通過對應的mRNA的不存在或降低(例如,至少25%降 低、至少50 %降低、至少60 %降低、至少70 %降低、至少80 %降低或至少90 %降低);具有 酶活性的對應多肽的量的不存在或降低(例如,至少25%降低、至少50%降低、至少60% 降低、至少70%降低、至少80%降低或至少90%降低);或具有酶活性的對應多肽的比活 性的不存在或降低(例如,至少25 %降低、至少50 %降低、至少60 %降低、至少70 %降低、 至少80%降低或至少90%降低)。可以通過本領域已知的方法破壞感興趣的具體基因,例 如通過直接同源重組(參見酵母遺傳學方法(Methods in Yeast Genetics) (1997版), 亞當斯(Adams),戈特斯科林(Gottschling),凱澤(Kaiser)及施特姆斯(Stems),冷泉 港出版社(Cold Spring Harbor Press) (1998))。在此描述了用于破壞芽孢桿菌屬基因 的技術并且已經在本領域中證實(參見斯特爾(Stahl)&法拉利(Ferrari),細菌學雜志 (J. Bacteriol.) 1984,158,411-418)〇
[0030] 親本:術語"親本"或"親本芽孢桿菌屬菌株"意指對其進行破壞以產生在此描述 的突變芽孢桿菌屬菌株的芽孢桿菌屬菌株。親本可以是一種天然發生的(野生型)或先前 修飾的芽孢桿菌屬菌株。
[0031] 突變體:術語"突變體"意指對親本芽孢桿菌屬菌株做出一個或多個破壞后的所得 芽孢桿菌屬菌株。
[0032] 改進的轉化效率:術語"改進的轉化效率"意指當在相同條件下轉化和培養 時,與親本芽孢桿菌屬菌株相比,參照芽孢桿菌屬突變體菌株能夠產生增加數目的轉化 株。可以使用描述于以下實例中的轉化方法,通過產生增加數目的轉化株證實改進的轉 化效率。還可以使用先前描述的方法證實改進的轉化效率(例如,阿納格諾斯托普洛 斯(Anagnostopoulos)和斯皮宰曾(Spizizen),細菌學雜志(J. Bacteriol.) 1961,81, 741-746)。在一些方面中,當在相同條件下培養時,與缺乏對內源mecA基因的破壞并缺乏 對內源sinl基因的破壞的親本芽孢桿菌屬菌株相比,芽孢桿菌屬突變體菌株能夠產生多 至少2倍,例如至少5倍、至少10倍、至少20倍、至少50倍、至少100倍、至少200倍、至少 500倍、至少1000倍、至少2000倍、至少5000倍、至少10000倍、至少20000倍、至少50000 倍或至少100000倍的轉化株。
[0033] 編碼序列:術語"編碼序列"意指明確一種多肽的氨基酸序列的多核苷酸序列。編 碼序列的邊界一般由開放閱讀框架決定,該開放閱讀框架通常以ATG起始密碼子或替代性 起始密碼子(例如GTG和TTG)開始,并且以終止密碼子(例如TAA、TAG、和TGA)結束。編 碼序列可以是基因組DNA、cDNA、合成的多核苷酸、和/或重組多核苷酸的一個序列。
[0034] 序列一致性:兩個氨基酸序列之間或兩個核苷酸序列之間的相關性由參數"序列 一致性"描述。
[0035] 出于在此所述的目的,使用尼德爾曼-翁施(Needleman-Wunsch)算法(尼德爾 曼和翁施,分子生物學雜志(J.M 〇l.Bi〇l.) 1970,48,443-453)來確定兩個氨基酸序列之 間的序列一致性程度,該算法是如在EMBOSS包(EMBOSS :歐洲分子生物學開放軟件套件 (The European Molecular Biology Open Software Suite),賴斯(Rice)等人,遺傳學趨 勢(Trends Genet.) 2000,16, 276-277)(優選 3.0.0 版或更新版本)的尼德爾(Needle) 程序中所實施的。所使用的這些任選參數是空位開放罰分10、空位延伸罰分0.5,及 EBL0SUM62 (BL0SUM62的EMBOSS版本)取代矩陣。尼德爾標注的"最長的一致性"的輸出 (使用-非簡化選項獲得)被用作百分比一致性,并且如下計算:
[0036] (一致的殘基X 100V(比對長度-比對中的空位總數)
[0037] 出于在此所述的目的,使用尼德曼-翁施算法(尼德曼(Needleman)和翁施 (Wunsch),1970,見上文)來確定兩個脫氧核糖核苷酸序列之間的序列一致性程度,該算法 是如在EMBOSS軟件包(EMBOSS :歐洲分子生物學開放軟件套件,賴斯(Rice)等人,2000,見 上文)(優選3. 0. 0版或更新版本)的尼德爾程序中所實施的。所使用的這些任選參數是空 位開放罰分10、空位延伸罰分0. 5,及EDNAFULL (NCBI NUC4. 4的EMBOSS版本)取代矩陣。 尼德爾標注的"最長的一致性"的輸出(使用-非簡化選項獲得)被用作百分比一致性,并 且如下計算:
[0038] (一致的脫氧核糖核苷酸X 100V(比對長度-比對中的空位總數)
[0039] 雜交條件:術語"非常低嚴謹度條件"意指對于長度為至少100個核苷酸的探針 而言,遵循標準DNA印跡程序,在42°C下在5X SSPE、0. 3% SDS、200微克/ml剪切并變性的 鮭魚精子DNA和25%甲酰胺中預雜交和雜交12至24小時。載體材料最終使用0.2X SSC、 0. 2 % SDS,在45 °C下洗滌三次,每次15分鐘。
[0040] 術語"低嚴謹度條件"意指對于長度為至少100個核苷酸的探針而言,遵循標準 DNA印跡程序,在42°C下在5X SSPE、0. 3% SDS、200微克/ml剪切并變性的鮭魚精子DNA 和25%甲酰胺中預雜交和雜交12至24小時。載體材料最終使用0. 2X SSC、0. 2% SDS,在 50 °C下洗滌三次,每次15分鐘。
[0041] 術語"中嚴謹度條件"意指對于長度為至少100個核苷酸的探針而言,遵循標準 DNA印跡程序,在42°C下在5X SSPE、0. 3% SDS、200微克/ml剪切并變性的鮭魚精子DNA 和35%甲酰胺中預雜交和雜交12至24小時。載體材料最終使用0. 2X SSC、0. 2% SDS,在 55 °C下洗滌三次,每次15分鐘。
[0042] 術語"高嚴謹度條件"意指對于長度為至少100個核苷酸的探針而言,遵循標準 DNA印跡程序,在42°C下在5X SSPE、0. 3% SDS、200微克/ml剪切并變性的鮭魚精子DNA 和35%甲酰胺中預雜交和雜交12至24小時。載體材料最終使用0. 2X SSC、0. 2% SDS,在 60 °C下洗滌三次,每次15分鐘。
[0043] 術語"高嚴謹度條件"意指對于長度為至少100個核苷酸的探針而言,遵循標準 DNA印跡程序,在42°C下在5X SSPE、0. 3% SDS、200微克/ml剪切并變性的鮭魚精子DNA 和50%甲酰胺中預雜交和雜交12至24小時。載體材料最終使用0. 2X SSC、0. 2% SDS,在 65 °C下洗滌三次,每次15分鐘。
[0044] 術語"非常高嚴謹度條件"意指對于長度為至少100個核苷酸的探針而言,遵循標 準DNA印跡程序,在42°C下在5X SSPE、0. 3% SDS、200微克/ml剪切并變性的鮭魚精子DNA 和50%甲酰胺中預雜交和雜交12至24小時。載體材料最終使用0. 2X SSC、0. 2% SDS,在 70 °C下洗滌三次,每次15分鐘。
[0045] 異源多核苷酸:在此將術語"異源多核苷酸"定義為以下多核苷酸:對該宿主細胞 而言不是天然的多核苷酸;已經對編碼區做出一種或多種(例如,兩種,若干種)結構修飾 的天然多核苷酸;由于通過重組DNA技術對DNA的操作而定量改變其表達的天然多核苷酸, 例如,將一種不同的(外源的)啟動子連接至該多核苷酸;或通過向該宿主細胞中引入該多 核苷酸的一個或多個另外的拷貝而定量改變其表達的天然多核苷酸。
[0046] 分離的:術語"分離的"意指處于非天然存在的形式或環境中的物質。分離的物質 的非限制性實例包括⑴任何非天然存在的物質,⑵任何物質,包括(但不限于)從與其 性質上相關的一種或多種或所有天然存在的組分至少部分除去的任何宿主細胞、酶、變體、 核酸、蛋白質、肽或輔因子;(3)相對于自然中發現的物質,由人工修飾的任何物質;或(4) 通過相對于與其天然相關的其他組分,增加物質的量而修飾的任何物質。
[0047] 內源基因:術語"內源基因"意指對親本芽孢桿菌屬菌株而言天然的基因。
[0048] 核酸構建體:術語"核酸構建體"意指一種包括一個或多個(例如,兩個、若干個) 控制序列的多核苷酸。多核苷酸可以是單鏈的或雙鏈的,并且可以分離自天然存在的基因、 可以被修飾來以另外的不會在自然界中存在的方式包含核酸的區段,或可以是合成的。
[0049] 控制序列:術語"控制序列"意指多肽表達所必需的核酸序列。控制序列對于編碼 多肽的多核苷酸可以是天然的或外源的,并且彼此可以是天然的或外源的。此類控制序列 包括但不限于,前導序列、多聚腺苷酸化序列、前肽序列、啟動子序列、信號肽序列及轉錄終 止子序列。出于引入有利于將這些控制序列與編碼一種多肽的多核苷酸的編碼區連接的特 異性限制酶切位點的目的,這些控制序列可以提供有多個接頭。
[0050] 可操作地連接:術語"可操作地連接"意指一種配置,其中一個控制序列相對于一 種多核苷酸的編碼序列放置在一個適當位置處,以使得控制序列指引編碼序列的表達。
[005