專利名稱:增加細菌內(nèi)多肽表達的修飾的分泌系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明提供了改變宿主細胞中所需多肽產(chǎn)量的方法。特別的,本發(fā)明 提供了編碼截短的SecG蛋白質(zhì)的多核苷酸,所述蛋白質(zhì)能夠有利于細菌 宿主細胞(例如芽胞桿菌屬物種)對所需蛋白酶的分泌,以及含有所述多 核苷酸的表達載體和宿主細胞。
背景
革蘭氏陽性;微生物,例如芽胞桿菌屬的成員,部分由于其可以將它們 發(fā)酵產(chǎn)物分泌到培養(yǎng)基中的能力,而可用于大規(guī)模的工業(yè)發(fā)酵。分泌蛋白 質(zhì)跨過細胞膜和細胞壁輸出,然后釋放到外部培養(yǎng)基中。多肽向周質(zhì)空間 或培養(yǎng)基中的分泌是工業(yè)發(fā)酵中需要認真考慮的重要課題。
微生物對異源多肽的分泌是工業(yè)中普遍使用的技術(shù)。典型的,可以用 編碼目標異源多肽的核酸轉(zhuǎn)化細胞。然后,這些轉(zhuǎn)化的細胞可以表達目標
異源多肽,從而大量的分泌多肽。該技術(shù)可用于生產(chǎn)比天然生成的多肽多 得多的大量多肽。上ii^達的多肽具有多種工業(yè)應(yīng)用,包括治療性和農(nóng)業(yè) 用途,以及在食品、化妝品、清潔組合物、動物飼料等中的用途。本領(lǐng)域 需要提供能夠分泌異源多肽的宿主。
發(fā)明概述
本發(fā)明提供了改變宿主細胞內(nèi)所需多肽的產(chǎn)量的方法。特別地,本發(fā)明提供了編碼截短的SecG蛋白質(zhì)的多核苷酸,所述蛋白質(zhì)能夠有利于細 菌宿主細胞(例如芽胞桿菌屬物種)對所需蛋白酶的分泌,以及含有所述 多核苷酸的表達載體和宿主細胞。
本發(fā)明至少部分的基于這樣的發(fā)現(xiàn),所述發(fā)現(xiàn)是異源多肽在細菌多肽 分泌系統(tǒng)內(nèi)的分泌涉及一些蛋白質(zhì),可以修飾這些蛋白質(zhì)并且仍然保持其 功能,例如,可以截短、突變或缺失一些蛋白質(zhì),且仍然保持或者甚至增 加了它們有利于多肽分泌的能力。因此,本發(fā)明教導的內(nèi)M供了能夠有 利于細菌宿主系統(tǒng)分泌所需多肽的多肽,包括該多肽的編碼多核苷酸。此 外,本發(fā)明教導的內(nèi)容還提供了在細菌系統(tǒng)中利用這些多肽來產(chǎn)生異源多 肽的方法。
在一個實施方案中,發(fā)明提供了分離的異源多肽,其編碼異源的截短 SecG,其能夠有利于細菌宿主細胞分泌所需多肽。在一些實施方案中,用 異源多核苷酸替換了細菌宿主細胞的內(nèi)源性SecG的編碼基因,在其它實 施方案中,異源多核苷酸補充了(complement)細菌宿主細胞的內(nèi)源性SecG 的編碼基因。在其它實施方案中,編碼截短SecG的異源多肽與SEQ ID NO:ll的截短SecG具有至少約50%同 一性。在一些實施方案中,截短SecG 包括全長異源SecG的區(qū)域,在一些實施方案中,所述區(qū)域包括全長SecG 多肽的N-端前39個氨基酸。在其它一些實施方案中,截短SecG包括所述 SecG的第一個跨膜結(jié)構(gòu)域。在另一個實施方案中,發(fā)明提供了編碼異源的 截短SecG的分離的異源多核苷酸,所述異源截短SecG包括SEQ ID NO:l-9的SecG中任一個的前39個氮基酸,并能夠有利于細菌宿主細胞 分泌所需多肽。在其它實施方案中,發(fā)明的SecG是細菌SecG。發(fā)明涵蓋 了來自芽孢桿菌屬物種或土芽孢桿菌屬(G^k"7/"力的SecG蛋白。
在另一個實施方案中,發(fā)明提供了表達載體,所述栽體包含編碼異源 的截短SecG的分離的異源多核苷酸,其能夠有利于細菌宿主細胞分泌所 需多肽。
在另一個實施方案中,發(fā)明提供了編碼異源的截短SecG的多肽,其 由分離的異源多核苷酸編碼,并能夠有利于細菌宿主細胞分泌所需多肽。另一個實施方案中,發(fā)明提供了在細菌宿主細胞中生產(chǎn)所需多肽的方
法,包括U)在所述細菌宿主細胞中表達異源SecG多肽,和(b)生產(chǎn) 所述所需多肽。在一個實施方案中,異源SecG由截短的基因編碼,所述 基因替換了宿主細胞內(nèi)的內(nèi)源性SecG基因。在另一個實施方案中,異源 SecG由全長基因編碼,所述全長基因替換了宿主細胞內(nèi)的內(nèi)源性SecG基 因。在另一個實施方案中,異源SecG是截短的多肽,包括選自SEQ ID NO:l-9的全長M酸序列的前39個氮基酸。在一些實施方案中,截短的 SecG只包含一個跨膜區(qū)域。在另一個實施方案中,發(fā)明提供了在細菌宿主 細胞中,生產(chǎn)與SEQIDNO:26的堿性絲氨酸蛋白酶至少80%同一的細菌 堿性絲氨酸蛋白酶的方法,包括(a)在所述細菌宿主細胞中表達異源SecG 多肽,和(b)生產(chǎn)細菌堿性絲氨酸蛋白酶。在一些實施方案中,細菌宿主 細胞不表達內(nèi)源性SecG蛋白,而在其它實施方案中,宿主細胞表達內(nèi)源 性SecG。在其它實施方案中,與不表達異源性SecG的相應(yīng)宿主細胞生產(chǎn) 的所需多肽的量相比,異源性SecG能夠增加宿主細胞生產(chǎn)的所需多肽的 量。在一些實施方案中,發(fā)明提供了在細菌宿主細胞中生產(chǎn)所需多肽的方 法,包括(a)在所述細菌宿主細胞中表達異源SecG多肽,和(b)生產(chǎn) 所述所需多肽,還包括回收所述所需多肽。在一些實施方案中,所需多肽 和異源性SecG源自第一菌林,其中第一菌林不同于宿主細胞。在一些實 施方案中,第一菌林是克勞氏芽孢桿菌(Bacillus clausii),宿主細胞是枯草 芽孢桿菌(B. subtilis)。在其它實施方案中,刪除了所述宿主細胞內(nèi)的內(nèi)源 性SecG基因。在另一個實施方案中,發(fā)明提供了包含編碼異源性SecG的 多核苷酸的細菌宿主細胞,其中,與不表達異源性SecG的相應(yīng)宿主細胞 的所需多肽的分泌相比,異源性SecG能夠增加宿主細胞對所需多肽的分 泌。在一個實施方案中,細菌宿主細胞是芽孢桿菌屬的宿主細胞。在另一 個實施方案中,細菌宿主細胞是一枯草芽孢桿菌宿主細胞。在另一個實施方 案中,細菌宿主細胞分泌的所需蛋白質(zhì)是酶。在一些實施方案中,酶是絲 氨酸蛋白酶。在其它實施方案中,所需多肽選自SEQIDNO:25-29、 36和 28的蛋白酶,或其變體。在一些實施方案中,宿主細胞的內(nèi)源性SecG基因被刪除。在其它實施方案中,所述細胞的內(nèi)源性SecG基因由編碼異源 SecG的異源secG基因補充。在其它實施方案中,由編碼所述異源SecG 的異源secG基因替換了所述細胞的內(nèi)源secG基因。在一些實施方案中, 異源SecG是截短的,而在其它實施方案中,異源SecG是全長SecG。 下文敘述了本發(fā)明教導內(nèi)容的上述和其他特征。
附圖簡述
本領(lǐng)域技術(shù)人員可以理解,附圖僅用于示例的目的。附圖并非意在以 任何方式限制本發(fā)明教導內(nèi)容的范圍。
圖1顯示了與不包含截短的克勞氏芽孢桿菌secG基因的對照宿主細胞 (JS1009)中的Properase產(chǎn)量相比,枯草芽孢桿菌宿主細胞(JS1015 ) 的Properase產(chǎn)量的增加,其中編碼克勞氏芽孢桿菌的截短SecG的多核苷 酸(SEQ ID NO:12 )被整合到枯草芽孢桿菌的染色體中,以補充內(nèi)源的枯 草芽孢桿菌secG。
圖2顯示了大腸桿菌SecG的拓樸學模型(Satoh等人,Biochemistry 42:7434-7441 (2003))。
圖3顯示,來自克勞氏芽孢桿菌的截短SecG (SEQ ID NO:ll)對枯 草芽孢桿菌宿主細胞的蛋白酶V049 (也稱為Puramax; SEQ ID NO:26 ) 產(chǎn)量的影響,在所述宿主細胞中截短的克勞氏芽孢桿菌secG基因替換了 (CF375)內(nèi)源性枯草芽孢桿菌基因,或補充了所述內(nèi)源基因(CF371); 以及全長克勞氏芽孢桿菌SecG (SEQ ID NO:10)對枯草芽孢桿菌宿主細 胞的蛋白酶V049產(chǎn)量的影響,在所述宿主細胞中全長的克勞氏芽孢桿菌 secG基因替換了 (CF379)內(nèi)源性枯草芽孢桿菌基因,上述結(jié)果是與表達 V049的枯草芽孢桿菌宿主細胞的V049產(chǎn)量比較的,其中該宿主細胞不含 有截短的或全長的克勞氏芽孢桿菌secG基因(CF363 )。使用0.01% (v/v) 接種物來起始細胞生長。
圖4顯示,表達來自克勞氏芽孢桿菌的截短SecG (SEQIDNO:12) 對枯草芽孢桿菌宿主細胞的蛋白酶Properase ( SEQ ID NO:29 )產(chǎn)量的影響,在所述宿主細胞中截短的克勞氏芽孢桿菌secG基因替換了 (CF378)內(nèi)源性枯草芽孢桿菌基因,或補充了所述內(nèi)源基因(CF374);以及全長克勞氏芽孢桿菌SecG (SEQ ID NO:IO)對枯草芽孢桿菌宿主細胞的蛋白酶Properase產(chǎn)量的影響,在所述宿主細胞中全長的克勞氏芽孢桿菌secG基因替換了 (CF380)內(nèi)源性枯草芽孢桿菌secG基因,上述結(jié)果是與表達Properase的枯草芽孢桿菌宿主細胞的Properase產(chǎn)量比較的,其中該宿主細胞不含有截短的或全長的克勞氏芽孢桿菌secG基因(CF381)。利用0.01% (V/V)接種物起始細胞生長。
圖5顯示,當用5%接種物起始細胞生長時,圖3中描述的影響。
圖6顯示,來自克勞氏芽孢桿菌的截短SecG (SEQ ID NO:ll)對枯草芽孢桿菌宿主細胞的突變蛋白酶V049-E33Q產(chǎn)量的影響,在所述宿主細胞中截短的克勞氏芽孢桿菌secG基因替換了 (CF376)內(nèi)源性枯草芽孢桿菌基因,或補充了所述內(nèi)源基因(CF372 );上述結(jié)果是與表達V049-E33Q(CF365)和V049 ( CF363 )的枯草芽孢桿菌宿主細胞的V049-E33Q產(chǎn)量比較的,其中該宿主細胞不含有截短的克勞氏芽孢桿菌secG基因。
圖7顯示,來自克勞氏芽孢桿菌的截短SecG (SEQIDNO:ll)對枯草芽孢桿菌宿主細胞的突變蛋白酶V049-E33R產(chǎn)量的影響,在所述宿主細胞中截短的克勞氏芽孢桿菌secG基因替換了 (CF377)內(nèi)源性枯草芽孢桿菌基因,或補充了所述內(nèi)源基因(CF373);上述結(jié)果是與表達V049-E33R(CF366)和V049 ( CF363 )的枯草芽孢桿菌宿主細胞的V049-E33R產(chǎn)量比較的,其中該宿主細胞不含有截短的克勞氏芽孢桿菌secG基因。
圖8顯示,轉(zhuǎn)化到枯草芽孢桿菌中的構(gòu)建體的圖,所述構(gòu)建體用來自克勞氏芽孢桿菌的secG基因替換內(nèi)源性枯草芽孢桿菌secG基因。
圖9顯示,與在枯草芽孢桿菌宿主(CF363)中的V049產(chǎn)量相比,刪除內(nèi)源性枯草芽孢桿菌secG基因?qū)049 (CF396)產(chǎn)量的影響,前者中沒有缺失內(nèi)源性secG基因。
發(fā)明的詳細描述本發(fā)明提供了改變宿主細胞中所需多肽產(chǎn)量的方法。特別的,本發(fā)明
提供了編碼全長和截短的SecG蛋白質(zhì)的多核苷酸,所述蛋白質(zhì)能夠有利于細菌宿主細胞(例如芽胞桿菌屬物種)對所需蛋白酶的分泌,以及含有所述多核苷酸的表達載體和宿主細胞。
本發(fā)明的教導內(nèi)容將通過參考文獻詳細的描述,僅使用下列定義和實例。本文中除非另外定義,本文中使用的所有的科學和技術(shù)術(shù)語都具有本發(fā)明所屬領(lǐng)域的普通技術(shù)人員普遍理解的相同含義。數(shù)字范圍包括定義所述范圍的數(shù)值。本文提供的標題不是對各方面或?qū)嵤┓桨傅南拗?,其可以參考作為整體的說明書。因此,通過整體參考說明書可以更全面的定義下文定義的術(shù)語。
除非另外指出,本發(fā)明的實踐涉及在分子生物學、微生物學、蛋白質(zhì)純化、蛋白質(zhì)工程化、蛋白質(zhì)和DNA測序,以及重組DNA領(lǐng)域的通常使用的常規(guī)技術(shù),這在本領(lǐng)域的范圍內(nèi)。此類技術(shù)是本領(lǐng)域技術(shù)人員已知的,并描述在多本文件和參考書中(參見例如,Sambrook等人,"MolecularCloning: A Laboratory Manual",第2版(冷泉港),[1989];和Ausubel等人,"Current Protocols in Molecular Biology" [1987])。本文上下文中提及的所有專利、專利申請、文獻和出版物,都通過引用明確的整合到本文中。
除非另外指出,本文中使用的所有科技術(shù)語都具有本發(fā)明所屬領(lǐng)域的普通技術(shù)人員普遍理解的相同含義。例如,Singleton和Sainsbury,Dictionary of Microbiology and Molecular Biology, 第2版,John Wiley和Sons, NY (1994);和Hale和Markham, The Harper Collins Dictionary ofBiology, Harper Perennial, NY (1991),為本領(lǐng)域技術(shù)人員提供了本發(fā)明中使用的大部分術(shù)語的常規(guī)字典。雖然在本發(fā)明的實踐中可以使用與本文描述的相似或等價的任何方法和材料,但是本文描述了優(yōu)選的方法和材料。因此,通過整體參考說明書,可以更全面的描述下文定義的術(shù)語。此外,如本文中使用的,除非上下文清楚的指出,單數(shù)形式"一"、"一個,,和"某個,,包括了復(fù)數(shù)形式。數(shù)值范圍包括了定義范圍的數(shù)值。除非另外指出,核酸都按5,至3,方向由左至右書寫;^J^酸序列都按氮基至氛基端方向由左至右書寫。可以理解,本發(fā)明不限于所描述的特定方法學、規(guī)程和試劑,其可以根據(jù)本領(lǐng)域技術(shù)人員使用的背景而變化。
本說明書全文中給出的每個數(shù)值上限都意在包括每個更小的數(shù)值限定,就如同本文明確的書寫了上述較小的數(shù)值限定。本說明書全文中給出
的每個數(shù)值下限都意在包括每個更大的數(shù)值限定,就如同本文明確的書寫了上述較大的數(shù)值限定。本說明書全文中給出的每個數(shù)值范圍都將包括落入上述較寬數(shù)值范圍內(nèi)的每個較窄的數(shù)值范圍,就如同本文明確的書寫了上述較窄的數(shù)值范圍。
此外,本文提供的標題不是發(fā)明的各方面或?qū)嵤┓桨傅南拗疲淇梢宰鳛閷φf明書的整體參考。因此,通過整體參考說明書,可以更全面的定義下文定義的術(shù)語。但是,為了幫助理解發(fā)明, 一些術(shù)語定義如下。
定義
本文中使用的術(shù)語"多肽,,指由通過肽鍵連接的氨基酸殘基單鏈組成的化合物。本文中使用的術(shù)語"蛋白質(zhì)"可與術(shù)語"多肽"互換的使用。
術(shù)語"核酸"和"多核苷酸"可互換的使用,涵蓋了 DNA、 RNA、 cDNA、單鏈或雙鏈,及其化學修飾物。由于遺傳密碼是簡并的,因此可以使用一種以上的密碼子編碼特定的氨基酸,本發(fā)明涵蓋了編碼特定M酸序列的所有多核苷酸。
當術(shù)語"重組,,用于表示細胞、核酸、蛋白質(zhì)或載體時,表示已經(jīng)通過引入異源核酸或蛋白質(zhì),或改變天然的核酸或蛋白質(zhì)來修飾了所述細胞、核酸、蛋白質(zhì)或栽體,或者所述細胞是源于上述修飾的細胞。因此,例如重組細胞表達在天然類型(非重組)的細胞中沒有發(fā)現(xiàn)的核酸或多肽,或者表達天然基因,所述天然基因否則是異常表達的、低表達的、W達的或完全不表達。
如本文中使用的,術(shù)語"基因"意指在生產(chǎn)多肽鏈中涉及的DNA片段,可以或可以不包括在編碼區(qū)之前和之后的區(qū)域,例如5,非翻譯(5,UTR)或"前導"序列,和3, UTR或"尾隨"序列,以及位于單個編碼片段(外顯子)之間的間插序列(內(nèi)含子)。
如本文中使用的,術(shù)語"天然基因"指天然發(fā)現(xiàn)的具有其自身調(diào)控序列的基因。"嵌合基因"指不是天然基因的任何基因,包括天然發(fā)現(xiàn)不在一起的調(diào)控和編碼序列。因此,嵌合基因可以包括來自不同來源的調(diào)控序列和編碼序列,或來自相同來源但以不同于天然發(fā)現(xiàn)的方式排列的調(diào)控序列和編碼序列。在一些實施方案中,嵌合基因是與不是其天然啟動子的啟動子有效連接的內(nèi)源基因。
如本文中使用的,術(shù)語"內(nèi)源基因"指位于生物基因組的天然位置上的天然基因。"外源"或"異源"基因指通常在宿主生物體中未發(fā)現(xiàn)的基因,但其通過基因轉(zhuǎn)移被引入宿主生物體中。外來基因可以包括插入到非天然生物體中的天然基因或嵌合基因。"轉(zhuǎn)基因"是已通過轉(zhuǎn)化程序被引入到基因組中的基因。
如本文中使用的,"融合核酸"包括有效的連接在一起的兩種或多種核酸。核酸可以是DNA (基因組的和cDNA都包括在內(nèi)),或者RNA,或RNA和DNA的雜合體。編碼全部或部分多肽序列的核酸可用于構(gòu)建融合核酸序列。在一些實施方案中,使用編碼全長多肽的核酸。在一些實施方案中,可以使用編碼部分多肽的核酸。
術(shù)語"嵌合多肽"和"融合多肽"在本文中可互換的使用,指包括至少兩個分離的且不同區(qū)域的蛋白質(zhì),所述區(qū)域可以或可以不源自相同的蛋白質(zhì)。例如,與目標蛋白質(zhì)連接的信號肽可以定義為嵌合多肽或嵌合蛋白,其中信號肽不是通常與目標蛋白質(zhì)連接的信號肽。
如本文中使用的,術(shù)語"啟動子"指具有指導下游基因轉(zhuǎn)錄的功能的核酸序列。在待表達耙基因的宿主細胞中,啟動子通常是合適的。對于表達給定的基因,啟動子和其他轉(zhuǎn)錄和翻譯調(diào)控核酸序列(也定義為"控制序列,,)是必需的。 一般而言,轉(zhuǎn)錄和翻譯調(diào)控序列包括但不限于,啟動子序列、核糖體結(jié)合位點、轉(zhuǎn)錄起始和終止序列,翻譯起始和終止序列,以及增強子或激活子序列。如本文中使用的,術(shù)語"有效的連接"意指轉(zhuǎn)錄和翻譯調(diào)控核酸相對于編碼序列位于這樣的位置,所述位置可以起始轉(zhuǎn)錄。通常,這意指啟動
子和轉(zhuǎn)錄起始或開始序列位于編碼區(qū)的5,。轉(zhuǎn)錄和翻譯調(diào)控核酸通常對用于表達蛋白質(zhì)的宿主細胞是合適的。本領(lǐng)域已知可用于多種宿主細胞的多種類型的合適表達載體,和合適的調(diào)控序列。
如本文中使用的,術(shù)語"表達"指基于基因的核酸序列生產(chǎn)多肽的過
程。該過程包括轉(zhuǎn)錄和翻譯。
涉及目標蛋白質(zhì)(例如,蛋白酶)的術(shù)語"生產(chǎn),,和"分泌",涵蓋了全長蛋白酶的加工步驟,包括去除已知在蛋白質(zhì)分泌過程中發(fā)生的信號肽;去除前原區(qū)(pro region),這產(chǎn)生活性成熟形態(tài)的酶且已知在成熟過程中發(fā)生(Wang等人,Biochemistry 37:3165-3171 (1998); Power等人,Proc Natl Acad Sci USA 83:3096-3100 (1986));和蛋白酶轉(zhuǎn)移到宿主細胞外部。
涉及蛋白酶的術(shù)語"加工"或"處理"指全長蛋白質(zhì)(例如,蛋白酶)經(jīng)歷成為活性成熟的酶的成熟過程。
如本文中使用的,術(shù)語"染色體整合"指進入的序列被引入到宿主細胞染色體中的過程。轉(zhuǎn)化DNA的同源區(qū)與染色體的同源區(qū)進行排列。然后,在雙交換中i^序列取代了位于同源框之間的序列(即,同源重組)。在本發(fā)明的一些實施方案中,D N A構(gòu)建體的滅活染色體片段的同源部分與芽孢桿菌屬染色體的內(nèi)在染色體區(qū)的側(cè)翼同源區(qū)進行排列。然后,內(nèi)在的染色體區(qū)在雙交換中被DNA構(gòu)建體刪除(即,同源重組)。刪除的區(qū)域可以同時用不同的i^X染色體區(qū)替換。
"同源重組"意指兩個D N A分子或成對染色體在相同或幾乎相同的核苷^列的位置上交換D N A片段。
涉及內(nèi)源基因或蛋白質(zhì)(例如,secG基因)的術(shù)語"替換"或"被替換",在本文中指這樣的過程,通過所述過程宿主細胞的內(nèi)源性secG基因不再表達,因其被異源性多核苷酸替換,其中,所述異源多核苷酸表達異源secG。如本文中4吏用的,"使補充"、"補充作用(complementation)"或"補 充(complenting)"可互換的使用,指兩個等位基因?qū)Ρ硇偷呢暙I。術(shù)語在 本文中指編碼內(nèi)源性SecG的天然或內(nèi)源多核苷酸,以及編碼異源SecG的 異源多核苷酸(完整的或以其片段的形式)存在于相同的菌林中,天然的 或通過整合的方法位于染色體上,或者由多拷貝質(zhì)粒攜帶。因此,在一些 實施方案中,細菌宿主細胞包括編碼異源SecG的異源多核苷酸,其補充 了編碼內(nèi)源SecG的內(nèi)源多核苷酸,導致細菌宿主細胞包含兩種編碼SecG 蛋白的多核苷酸。在一些實施方案中,內(nèi)源和異源的Sec蛋白都是全長SecG 蛋白。在其它實施方案中,異源SecG是截短的SecG蛋白。
術(shù)語"%同源性"在本文中與術(shù)語"%同一性"可互換的使用,指當 用序列比對程序比對時,核酸或M酸序列之間核酸或氨基酸序列相同的 水平。例如,如本文中使用的,80%同源性意指與通過定義的算法確定的 80%序列同一性相同的對象,因此,給定序列的同源物在一定長度的給定 序列上,具有大于80%的序列同一性。序列同一性的示例性水平包括但不 限于與給定序列約50、約60、約65、約70、約75、約80、約85、約卯、 約95、約98、約99%或更高的序列同一性。利用本領(lǐng)域已知的標準技術(shù) 確定同源性(參見例如,Smith和Waterman, Adv Appl Math, 2:482, 1981; Needleman和Wunsch, J Mol Biol, 48:443,1970; Pearson和Lipman, Proc Natl Acad Sci USA, 85:2444, 1988;程序例如威斯康辛遺傳學軟件包 (Wisconsin Genetics Software Package)中的GAP、 BESTFIT 、 FAST A和 TFASTA, Genetics Computer Group, Madison, Wl;和Devereux等人, Nucl Acid Res, 12:387-395, 1984)。
有效算法的一個實例是PILEUP。 PILEUP從一組相關(guān)序列中,利用 漸進的成對比對法創(chuàng)建多重序列比對。它還可以繪制樹狀圖,顯示用于創(chuàng) 建比對的成蔟關(guān)系。PILEUP利用了 Feng和Doolittle的漸進比對方法 (Feng和Doo腿e, J Mol Evol, 35:351 -360, 1987 )的簡化版。該方法與 Higgins和Sharp (Higgins和Sharp, CABIOS 5:151 -153, 1989)描述的相 似。有效的PILEUP參數(shù)包括缺省的空位權(quán)重3.00,缺省的空位長度權(quán)重0.10,和加權(quán)的末端空位。
有效算法的另一個實例是Altschul等人描述的BLAST算法(Altschul 等人,J Mol Biol, 215:403-410, 1990;和Karlin等人,Proc Natl Acad Sci USA, 90:5873-5787, 1993)。特別有效的BLAST程序是WU-BLAST-2程 序(參見,Altschul等人,Meth Enzymol, 266:460-480, 1996)。 WU-BLAST-2 程序使用一些檢索參數(shù),大部分設(shè)定為缺省值??烧{(diào)節(jié)的參數(shù)設(shè)定為下列 值重疊間隔=1,重疊分數(shù)=0.125,字符閾(T) =11。 HSP S和HSP S2 參數(shù)是動態(tài)值,根據(jù)特定序列的組成和檢索目標序列所針對的特定數(shù)據(jù)庫 的組成,由程序自身確定。然而,可以調(diào)整值來增加靈敏度。%#Ju^f 列同一性值是通過將匹配相同的殘基數(shù)除以在比對區(qū)域中"較長"序列的 殘基總數(shù)來確定的。"較長"序列是在比對區(qū)域(忽略了 WU-Blast-2為了 使比對分數(shù)最大化而引入的空位)具有最多實際殘基的序列。
因此,"百分比(%)核酸或^J^酸序列同一性"定義為候選序列中 與起始序列(即,目標序列)的核苷酸或氨基酸殘勤目同的核苷酸殘基的 百分比;"百分比M酸序列相似性"定義為候選序列中與起始序列(即, 目標序列)的氨基酸殘基相同的氨基酸殘基的百分比。優(yōu)選的方法利用 WU-BLAST-2的BLASTN模塊,設(shè)定缺省參數(shù),其中重疊間隔和重疊分 數(shù)分別i更定為1和0.125。
如本文中使用的,"芽孢桿菌屬物種"包括本領(lǐng)域技術(shù)人員已知的, "芽孢桿菌"屬中的所有物種,包括但不限于枯草芽孢桿菌(B. subtilis)、 地衣芽孢桿菌(B. licheniformis)、遲緩芽胞桿菌(B. lentus)、短芽孢桿菌(B. brevis)、嗜熱脂肪芽胞桿菌(B. stearothermophilus)、嗜堿芽孢桿菌(B. alkalophilus)、解淀粉芽胞桿菌(B. amyloliquefaciens)、克勞氏芽孢桿菌(B. clausii)、極端耐堿芽孢桿菌(B. halodurans )、 巨大芽胞桿菌(B. megaterium)、凝固芽胞桿菌(B. coagulans)、環(huán)狀芽胞桿菌(B. circulans)、 燦爛芽胞桿菌(B. lautus)和蘇云金芽孢桿菌(B. thuringiensis)。 i人識到芽孢 桿菌屬不斷經(jīng)歷分類重組。因此,所述屬意在包括已經(jīng)經(jīng)過重新分類的物 種,包括但不限于此類生物,例如嗜熱脂肪芽胞桿菌,現(xiàn)名為"嗜熱脂肪土芽胞桿菌(Geobacillus stearothermophilus)"。在存在氧氣的務(wù)降下產(chǎn) 生耐受性的內(nèi)生孢子,這被認為是芽孢桿菌屬的決定性特征,但是該特征 也用于目前命名的脂環(huán)酸桿菌屬(Alicyclobacillus )、雙芽孢桿菌鼠
(Amphibacillus )、硫胺素芽孢桿菌屬(A國rinibacilhis )、厭氧芽孢桿 菌屬(Anoxybacillus )、短芽胞桿菌屬(Brevibacillus )、絲狀芽胞桿菌 屬(Filobacillus )、薄壁芽胞桿菌屬(Graciliacillus )、喜鹽芽孢桿菌屬
(Halobacillus)、類芽孢桿菌屬(Paenibacilhis )、需鹽芽孢桿菌屬
(Salibacillus )、熱桿菌屬(The腦bacillus )、解脲芽孢桿菌屬
(Ureibadllus)和枝芽,胞桿菌屬(Virgibaeil!us)。
"天然發(fā)生的"或"野生型"指蛋白酶或編碼蛋白酶的多核苷酸,所 述蛋白酶具有未修飾的、與天然發(fā)現(xiàn)的相同的M酸序列。天然發(fā)生的酶 包括天然的酶,這些酶天然的表達或存在于特定微生物中。野生型或天然 發(fā)生的序列指變體來源的序列。野生型序列可以編碼同源的或異源的蛋白 質(zhì)。
如本文中使用的,術(shù)語"異源蛋白質(zhì)"指不是天然存在于宿主細胞內(nèi) 的蛋白質(zhì)或多肽。相似的,"異源多核苷酸"指不天然存在于宿主細胞內(nèi) 的多核苦酸。
如本文中使用的,"同源蛋白質(zhì)"或"內(nèi)源蛋白質(zhì)"指細胞內(nèi)內(nèi)在的 或天然的存在的蛋白質(zhì)或多肽。相似的,"同源多核苷酸"或"內(nèi)源多核 苷酸"指細胞內(nèi)內(nèi)在的或天然的存在的多核苷酸。
如本文中使用的,術(shù)語"PCR產(chǎn)物"、"PCR片段,,和"擴增產(chǎn)物" 指在結(jié)束兩輪或多輪的變性、退火和延伸的PCR步驟后,所獲得的化合物 的混合物。這些術(shù)語涵蓋了擴增一種或多種乾序列的一個或多個片段的情 況。
如本文中使用的,術(shù)語"引物"指這樣的寡核苷酸,其不論是從純化 的限制性酶切消化中天然發(fā)生的,還是人工合成的,當處于與引入的核酸 鏈互補的引物延伸產(chǎn)物的合成條件下時(即,在存在核苷酸和引發(fā)劑例如 DNA聚合酶的條件下,和合適的溫度和pH),能夠作為合成起始位點。引物優(yōu)選的是單鏈,具有最大的擴增效率,但可選的可以是雙鏈。如果是 雙鏈,在用于制備延伸產(chǎn)物前首先處理引物以分離它的鏈。優(yōu)選的,引物 是寡聚脫氧核糖核苷酸。引物必須足夠長,在存在引發(fā)劑的條件下觸發(fā)延 伸產(chǎn)物的合成。引物的準確長度取決于多種因子,包括溫度、引物來源和 使用的方法。
相關(guān)的(和衍生的)蛋白質(zhì)包括"變體蛋白質(zhì)"。在一些優(yōu)選的實施 方案中,變體蛋白質(zhì)在少數(shù)M酸殘基上不同于親本蛋白或前體蛋白并且
彼此也不同。如本文中使用的,"變體"指通過向C-端和/或N-端添加一 水《實水翁寞ffi^在扇寞is&床萬il始一水遂.容水;Ki^的仿占—卜丑3UJe.—水劣.容
j z , "js v^X^"*"*^' ""vw 一 , , # , —z i— , ~,," 一 - r — , 、 , —'、 z
個氨基酸,在蛋白質(zhì)的一端或兩端或氨基酸序列的一個或多個位點缺失一 個或多個氣基酸,和/或在M酸序列的一個或多個位點插入一個或多個氨 基酸,而與其相應(yīng)的野生型蛋白質(zhì)不同的前體蛋白。在本發(fā)明的上下文中, 通過克勞氏芽孢桿菌蛋白酶V049 (SEQ ID NO:26)來示例變體蛋白質(zhì), 其是天然發(fā)生的蛋白質(zhì)Maxacal ( SEQ ID NO:25 )的變體。在一些優(yōu)選的 實施方案中,變體蛋白質(zhì)在少數(shù)^J^酸殘基上不同于親本蛋白或前體蛋白 并且彼此也不同。不同的M酸殘基的數(shù)量可以是一個或多個,優(yōu)選的l、 2、 3、 4、 5、 10、 15、 20、 30、 40、 50或更多個氨基酸殘基。在一些優(yōu)選 的實施方案中,變體之間不同氨基酸的數(shù)量是在1和10之間。在一些特別 優(yōu)選的實施方案中,相關(guān)的蛋白質(zhì)和特定的變體蛋白之間包括至少約 35%、約40%、約45%、約50%、約55%、約60%、約65%、約70%、 約75%、約80%、約85%、約90%、約95%、約97%、約98%或約99% 的氨基,列同一性。此外,本文中使用的相關(guān)蛋白質(zhì)或變體蛋白指在一 些顯著的區(qū)域與另一種相關(guān)蛋白質(zhì)或親本蛋白不同的蛋白質(zhì)。例如,在一 些實施方案中,變體蛋白質(zhì)具有l(wèi)、 2、 3、 4、 5或10個不同于親本蛋白質(zhì) 的相應(yīng)顯著區(qū)。
如本文中使用的,術(shù)語"載體"指設(shè)計用于向一種或多種細胞類型中 引入核酸的多核苷酸構(gòu)建體。載體包括克隆載體、表達載體、穿梭載體、 質(zhì)粒、盒等。
17如本文中使用的,術(shù)語"表達載體"指能夠在外源細胞中摻入和表達
異源DNA片段的載體。多種原核和真核表達載體是可商購的。
如本文中使用的,術(shù)語"DNA構(gòu)建體"、"轉(zhuǎn)化DNA"和"表達栽 體"可互換的使用,指用于將序列引入宿主細胞或生物體中的DNA。 DNA 可以是通過PCR或任何本領(lǐng)域技術(shù)人員已知的其它合適的技術(shù)在體外產(chǎn) 生的,例如利用Sambrook等人描述的標準分子生物學方法。此外,表達 構(gòu)建體的DNA可以是人工的,例如化學合成的??梢詫NA構(gòu)建體、轉(zhuǎn) 化DNA或重組表達盒摻入到質(zhì)粒、染色體、線粒體DNA、質(zhì)體DNA、病 毒或核酸片段中。通常,表達載體、DNA構(gòu)建體或轉(zhuǎn)化DNA的重組表達 盒部分包括待被轉(zhuǎn)錄的核酸序列和啟動子等。在一些實施方案中,表達載 體具有在宿主細胞內(nèi)摻入和表達異源DNA片段的能力。
在將核^列插入到細胞內(nèi)的語境中,術(shù)語"引入"意指"轉(zhuǎn)染"或 "轉(zhuǎn)化"或"轉(zhuǎn)導",包括涉及核酸序列摻入到真核或原核細胞中,其中 核酸序列可以4皮摻入到細胞的基因組中(例如,染色體、質(zhì)粒、質(zhì)體或線 粒體DNA),轉(zhuǎn)化為自發(fā)復(fù)制子或瞬時表達(例如,轉(zhuǎn)染的mRNA)。
術(shù)語"宿主細胞"意指已經(jīng)引入了載體,或染色體整合的表達盒,或 整合的PCR片段的細胞,支持表達構(gòu)建體的復(fù)制和/或轉(zhuǎn)錄,或轉(zhuǎn)錄和翻 譯(表達)。
"相應(yīng)的宿主細胞"是這樣的宿主細胞,所述細胞中沒有引入載體, 或染色體整合的表達盒,或整合的PCR片段,且不支持宿主細胞的表# 建體的復(fù)制和/或轉(zhuǎn)錄,或轉(zhuǎn)錄和翻譯(表達)。"相應(yīng)的宿主細胞"是宿 主細胞的參照細胞。
術(shù)語"信號序列"指位于蛋白質(zhì)N-末端部分的Jl^酸序列,其有利于 成熟形態(tài)的蛋白質(zhì)分泌到細胞外。成熟形態(tài)的胞外蛋白質(zhì)缺乏在分泌過程 中被切除的信號序列。在一些實施方案中,信號序列是源自芽孢桿菌屬的 sec-依賴性信號肽。
術(shù)語"回收"、"分離"和"分開的"在本文中可互換的使用,指蛋 白質(zhì)、細胞、核酸、氨基酸等去除了至少一種與其天然相關(guān)聯(lián)的組分。如本文中使用的,術(shù)語"雜合體,,指這樣的序列(例如分泌因子), 其含有源自兩種或多種直系同源物的序列。因此,"雜合基因"或"雜合 蛋白質(zhì)"分別是這樣的基因或蛋白質(zhì),其中兩種或多種片^列l(wèi))分別
源自兩個或多個不同基因或蛋白質(zhì),2)源自來自兩個或多個不同生物體的 基因或蛋白質(zhì),或上述來源的組合。例如,雜合基因或蛋白質(zhì)可以包括來 自相同或不同微生物體的兩個或多個片段,例如細菌菌林如芽孢桿菌菌林 或土芽孢桿菌菌抹。
如本文中使用的,術(shù)語"蛋白酶"和"蛋白水解活性"指這樣的蛋白 質(zhì)或肽,其表現(xiàn)出水解肽或具有肽連接的底物的活性。存在多種普遍已知 的程序用于測量蛋白水解活性(Kalisz, "Microbial Proteinases," In: Fiechter 編著,Advances in Biochemical Engineering/Biotechnology, [1988)。例如,可以通過比較測定確定蛋白水解活性,所述測定分析所 產(chǎn)生的蛋白酶水解商購底物的能力??捎糜诖祟惖鞍酌富虻鞍姿饣钚苑?析的示例性底物包括但不限于二甲基酪蛋白(Sigma C-9801)、牛膠原蛋 白(Sigma C-9879)、牛彈性蛋白(Sigma E-1625),和牛角蛋白(ICN Biomedical卯21 11)。利用這些底物的比色測定是本領(lǐng)域普遍已知的(參 見例如,WO 99/34011和美國專利號6,376,450,兩者均通過引用整合到本 文中)。AAPF測定(參見例如,Del Mar等人,Anal. Biochem., 99:316-320 [1979)也可用于確定蛋白酶的產(chǎn)量。該測定測量酶水解可溶性合成底物 琥珀酰-丙氨酸-丙氨酸-脯氨酸-苯丙氨酸-對硝基苯胺 (succinyl-alanine-alanine-proline-phenylalanine-p-nitroanilide) (sAAPF-pNA)而釋放對硝基苯胺的速率。在分光光度計的410nm處測 量水解反應(yīng)產(chǎn)生黃色的速率,與活性酶濃度成比例。
如本文中使用的,"直系同源物"和"直系同源基因"指從共同的先 祖基因通過物種形成進化而來的,位于不同物種中的基因。 一般而言,直 系同源物在進化過^中保持了相同的功能。
"所需多肽,,或"目標多肽"指待被宿主細胞表達和分泌的蛋白質(zhì)/ 多肽。目標蛋白質(zhì)可以是任何到目前為止認為可以在原核和/或真核細胞中表達的蛋白質(zhì)。在一個實施方案中,目標蛋白質(zhì)通過宿主細胞使用的分泌 相關(guān)蛋白或系統(tǒng)轉(zhuǎn)移,包括包含信號肽的蛋白質(zhì)。所需多肽可以是對宿主 同源或異源的。在一些實施方案中,所需多肽是分泌多肽,特別是選自淀 粉分解酶、蛋白水解酶、溶細胞酶、氧化還原酶和植物壁降解酶的酶。在 其它實施方案中,這些酶包括淀粉酶、蛋白酶、木聚糖酶、脂肪酶、漆酶、
酚氧化酶、氧化酶、角質(zhì)酶(cutinase)、纖維素酶、半纖維素酶、酯酶、過 氧化物酶、過氧化氫酶、葡萄糖氧化酶、植酸酶、果膠酶、葡糖苷酶、異 構(gòu)酶、轉(zhuǎn)移酶、半乳糖苷酶和幾丁質(zhì)酶。在其它實施方案中,所需多肽是 激素、生長因子、受體、疫苗、抗體等。但是本發(fā)明并非意在限定于任何 特定的蛋白質(zhì)/多肽,在一些最優(yōu)選的實施方案中,所需多肽是蛋白酶。
本發(fā)明教導的內(nèi)容U于這樣的發(fā)現(xiàn),即多肽在細菌分泌系統(tǒng)內(nèi)的分 泌涉及一些蛋白質(zhì),可以修飾這些蛋白質(zhì)并且不消除分泌復(fù)合體的分泌功 能。在一些實施方案中,可以截短、突變或缺失一些分泌蛋白,同時保持 或者甚至增加了其有利于多肽分泌的能力。因此,本發(fā)明提供了對于促進 細菌系統(tǒng)分泌所需多肽有用的細菌宿主系統(tǒng)和多肽及其編碼多核苷酸。此 外,本發(fā)明教導的內(nèi)容還提供了利用上述細菌宿主系統(tǒng)和多肽來產(chǎn)生所需 多肽(例如,異源多肽)的方法。在一些實施方案中,截短的分泌蛋白SecG 增加所需蛋白質(zhì)的產(chǎn)量。
在一些方面,本發(fā)明教導的內(nèi),供了編碼截短的SecG的多核普酸。 根據(jù)本發(fā)明的教導,截短的SecG可以是全長SecG的任何片段,例如,能 夠有利于細菌宿主細胞分泌所需多肽。在一些實施方案中,本發(fā)明教導的 內(nèi)^:供的截短的SecG具有利于細菌宿主細胞分泌所需多肽的活性或能 夠有利于細菌宿主細胞分泌所需多肽,所述細菌宿主細胞含有全長內(nèi)源性 SecG、截短或突變的內(nèi)源性SecG,或不含有4壬何部分的內(nèi)源性SecG。在 一些實施方案中,本發(fā)明提供的截短的SecG包括一個或多個區(qū)域,例如 來自一種或多種全長SecG的連續(xù)或不連續(xù)的區(qū)域。在一些實施方案中, 本發(fā)明提供的截短的SecG包括全長野生型SecG的區(qū)域。在一些實施方案 中,其包括全長的變體、修飾或突變的SecG的區(qū)域。在一些實施方案中,截短的SecG包括全長SecG的區(qū)域,所述全長SecG選自克勞氏芽孢桿菌、枯草芽孢桿菌、地衣芽孢桿菌、嗜熱脂肪土芽孢桿菌(Geobacillus stearothermophilus)、遲緩芽胞桿菌、大腸桿菌(Escherichia coli)或解淀粉芽胞桿菌的SecG。在一些實施方案中,截短的SecG包括任何示例性全長SecG的區(qū)域,例如SEQ ID NO: 1畫SEQ IDNO: 9。
嗜熱脫氮土芽胞桿菌(Geobacillus thermodenitrificans)NG80-2的^J^
^列(登錄號YP—001127090 )
MHALLVTLLVIVSIALIAIVLLQSGRSAGLSGAITGGAEQLFGKQKARGLDAVFQRVTVVLAIL
YFVLTI LVAYVQPS (SEQ ID NO: 1)
威氏利斯特氏菌(Listeria welshimeri)血清變型6b str. SLCC5334的M酸序列(登錄號YP_850596)
VILIALAYFVQ (SEQ ID NO: 2)
地衣芽孢桿菌(Bacillus licheniformis ) ATCC 14580 (DSM 13)的氨基酸序列(登錄號YP_080735)
MAAFLTVLLVIVSIVLIVWLLQSGKSAGLSGAISGGAEQLFGKQKARGLDLILHRMTWLTVLFFFLTIALAYFV (SEQ ID NO: 3)
枯草芽孢桿菌枯草亞種(Bacillus subtilis subsp. subtilis)str. 168的^J^
^列(登錄號NP_391243)
MHAVLITLLVIVSIALIIVVLLQSSKSAGLSGAISGGAEQLFGKQKARGLDLILHRITVVLAVLFFVLTIALAYIL (SEQ ID NO: 4)
植物乳桿菌(Lactobacillus plantarum ) WCFS 1的^J^酸序列(登錄
號NP_784540)
MYNLLLTLILWSVUIIAVMMQPSKTNDAMSSLTGGADDLFAKQKPRGFEAFMQKVTWLGIAFFILALALAWYSSK (SEQ ID NO: 5)
干酪乳桿菌(Lactobacillus casei) ATCC 334的^J^酸序列(登錄號
YP—806214)
MQSLLTTFLVIDSILMATLMQPSKQQDALSALSGGATDLFGKTKSRGFEAFMEKVTVALGVIFFGLAIALVYLEAH (SEQ ID NO: 6)金黃色葡萄球菌金黃亞種(Staphylococcus aureus subsp.
aureus)MRSA252的^J^絲列(登錄號YP_040260 )MHTFLIVLLIIDCIALITVVLLQEGKSSGFSGAISGGAEQLFGKQKQRGVDLFLNRLTIILSILFFVLMICISYLGM (SEQ ID NO: 7)
大腸桿菌K12的M酸序列(登錄號NP—417642 )MYEALLWFLIVAIGLVGLIMLQQGKGADMGASFGAGASAflFGSSGSGNFMTRMTALLATL
FFIISLVLGNINSNKTNKGSEWENLSAPAKTEQTQPAAPAKPTSDIPN (SEQ ID NO: 8)
在其它實施方案中,截短的SecG包括SEQIDNO:9的克勞氏芽孢桿
菌全長SecG的區(qū)域。能夠有利于細菌宿主細胞分泌所需蛋白質(zhì)的截短
SecG區(qū)域包含N-端M酸序列,其跨越第一跨膜結(jié)構(gòu)域。在其它實施方
案中,截短的SecG具有SEQIDNO:ll。
克勞氏芽孢桿菌全長SecG的JL&酸序列MQLFLMIALIIVSVLLVAWLLQPGRSSGLSGAITGGAEQLLGKQKARGLDAVLHRATIVLAVL
FFILTGLNAYFL (SEQ ID NO:9)
克勞氏芽孢桿菌截短SecG的Jl^酸序列MQLFLMIALIIVSVLLVAVVLLQPGRSSGLSGAITGGAE (SEQ ID NO:11)
在一些實施方案中,截短的SecG包括全長SecG的區(qū)域,所述全長SecG來自任何生物體,其具有與克勞氏芽孢桿菌、枯草芽孢桿菌、地衣芽孢桿菌、嗜熱脂肪土芽胞桿菌、遲緩芽胞桿菌、大腸桿菌或解淀粉芽胞桿菌的SecG相同或基^目同的^J^酸序列,例如,至少約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、約95%、約98%或約99%的同一性。在其它實施方案中,截短的SecG共享與來自克勞氏芽孢桿菌、枯草芽孢桿菌、地衣芽孢桿菌、嗜熱脂土芽胞桿菌、遲緩芽胞桿菌、大腸桿菌或解淀粉芽胞桿菌的SecG序列具有至少約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、約95%、約98%或約99%的相似性的#^酸序列。在其它實施方案中,截短的SecG與SEQ ID NO:ll的截短的SecG至少50%同一。
在一些實施方案中,截短的SecG包括全長野生型或全長變體細菌
22SecG的區(qū)域。全長SecG可以來自任何已知的或新發(fā)現(xiàn)的細菌菌林,例如與細菌系統(tǒng)中多肽分泌通路相關(guān)的。在一些實施方案中,細菌SecG是芽孢桿菌屬SecG。全長SecG來源的細菌菌林的實例包括但不限于,不動桿菌屬(Acinetobacter)、根癌土壤桿菌(Agrobacterium tumefaciens )、固氮弧菌屬(Azoarcus)、炭疽芽胞桿菌(Bacillus anthracis)、克勞氏芽孢桿菌(Bacillus clausii)、地衣芽孢桿菌(Bacillus licheniformis)、解淀粉芽孢桿菌(Bacillus amyloliquefaciens )、枯草芽孢桿菌、遲緩芽孢桿菌(Bacillus lentus)、極端耐堿芽孢桿菌(Bacillus halod訓ns )、長雙歧桿菌(Bifidobacterium longum )、對蟲巴克納氏菌(Buchneraaphidicola) 、 Campestris、 空腸彎曲桿菌(Campylobacter jejuni)、產(chǎn)氣莢膜梭狀芽胞桿菌(Clostridium perfringens )、大腸桿菌、胡蘿卜軟腐歐文氏菌(Erwinia carotovora ) 、 土拉熱弗朗西絲氏菌(Francisellatularensis )、 流感嗜血桿菌(Haemophilus influenzae)、 幽門螺桿菌
(Helicobacter pylori)、結(jié)核分枝桿菌(Mycobacterium tuberculosis )、腦膜炎奈瑟氏菌(Neisseria meningitides )、綠膿假單胞菌(Pseudomonasaeruginosa)、 原綠球藻(Prochlorococcus marinus )、 肺炎鏈球菌
(Streptococcus pneumoniae )、腸沙門氏菌(Salmonella enterica )、 沙雷菌(Shewanella oneidensis )、腸沙門氏菌(Salmonella enterica)、 鼠"f另寒沙、門氏菌(Salmonella typhimurium )、表皮葡萄球菌(Staphylococcusepidermidis)、金黃色葡萄球菌(Staphyl ococcus aureus)、 弗氏志賀氏菌(Shigella flexneri)、天藍色鏈霉菌(Streptomyces coelicolor)、淺青紫鏈霉菌 (Streptomyces lividans ) 、 Tropheryma whipplei 、 土拉菌
(Tularensis )、 Temecula、 Thermosynechococcus elongates 、 Thermococcuskodakarensis、地趁草黃單胞菌(Xanthomonas axonopodis)、野油菜黃單胞菌(Xanthomonas campestris)、苛養(yǎng)^fr菌(Xylella fastidiosa)和鼠疫耶爾森氏菌(Yersinia pestis)。
在一些實施方案中,截短的SecG是克勞氏芽孢桿菌SecG。在一些實施方案中,截短的SecG通常包括至少最少數(shù)量的氨基酸殘基,使其可以有利于例如部分多肽分泌通路,或者直接或間接的功能性作
用于所需多肽的分泌。在一些實施方案中,截短的SecG包括全長SecG的 至少30、 31、 32、 33、 34、 35、 36、 37、 38或39個氛基酸。在一些實施 方案中,全長SecG是野生型SecG。在其它實施方案中,全長SecG是變 體SecG。在一些實施方案中,截短的SecG包括全長SecG的N-端區(qū)域的 前至少30、 31、 32、 33、 34、 35、 36、 37、 38或前39個氨基酸。
在一些實施方案中,截短的SecG包括全長的天然或變體SecG的至少 一個區(qū)域或結(jié)構(gòu)域。在一些實施方案中,截短的SecG包括至少一個跨膜 區(qū)域。在一些實施方案中,截短的SecG只包括一個跨膜區(qū)域。在一些實 施方案中,跨膜區(qū)域?qū)?yīng)全長SecG的N-端跨膜片段。
在一些實施方案中,截短的SecG可以或可以不與一種或多種"分泌 相關(guān)蛋白,,相互作用。在一些實施方案中,截短的SecG與一種或多種分 泌相關(guān)蛋白相互作用。在一些實施方案中,截短的SecG不與一種或多種 分泌相關(guān)蛋白相互作用。術(shù)語"分泌相關(guān)蛋白"在本文中通常指在目標蛋 白質(zhì)從宿主細胞中分泌時涉及的蛋白質(zhì)。分泌相關(guān)蛋白可以幫助新生(即, 在合成過程中或剛結(jié)束合成時)蛋白質(zhì)正確折疊,蛋白質(zhì)從胞內(nèi)向胞外環(huán) 境的移動(例如,通過細胞質(zhì)到細胞膜,和/或跨過細胞膜/細胞壁至胞外環(huán) 境等),正確的加工等??梢哉J為在蛋白質(zhì)移動的任何方面涉及的蛋白質(zhì) 都具有分泌相關(guān)活性或功能,所述移動為所述蛋白質(zhì)凈iLl&內(nèi)合成直到出現(xiàn) 在細胞膜的外表面。此類蛋白質(zhì)的實例包括但不限于,幫助新生的目標蛋 白實現(xiàn)正確的折疊構(gòu)象所涉及的蛋白質(zhì),或來自Sec通路的蛋白質(zhì)。術(shù)語 "分泌相關(guān)蛋白"、"分泌相關(guān)因子,,和"分泌因子,,在本文中可互換的 使用。
在一些實施方案中,發(fā)明提供了編碼"雜合"截短SecG的多核苷酸。 雜合的截短SecG包含多余一種全長SecG的區(qū)域。此類雜合的截短SecG 包含來自第一種全長SecG的區(qū)域和來自第二種全長SecG的區(qū)域。第一或 第二種全長SecG可以是野生型SecG或變體SecG。在一些實施方案中, 第一或第二種全長SecG是細菌的,例如芽孢桿菌屬的SecG。在一些實施方案中,截短的SecG是雜合的截短SecG,其包含兩個區(qū) 域,所述區(qū)域包括來自兩種不同細菌菌林(第一和第二菌林)的全長SecG 的區(qū)域。在一些實施方案中,第一菌林是克勞氏芽孢桿菌,第二菌林是枯 草芽孢桿菌。在一些實施方案中,第一菌林和第二菌林包括但不限于地衣 芽孢桿菌和枯草芽孢桿菌;嗜熱脂肪土芽胞桿菌和枯草芽孢桿菌;嗜熱脂 肪土芽胞桿菌和地衣芽孢桿菌;克勞氏芽孢桿菌和地衣芽孢桿菌;遲緩芽 孢桿菌和枯草芽孢桿菌;大腸桿菌和枯草芽孢桿菌;解淀粉芽孢桿菌和枯 草芽孢桿菌;解淀粉芽孢桿菌和地衣芽孢桿菌。在一些實施方案中,雜合
的截短SecG的N-端區(qū)域包含來自克勞氏芽孢桿菌SecG的區(qū)域,雜合的 截短SecG的C-端區(qū)域包含來自枯草芽孢桿菌SecG的區(qū)域。
一般而言,與不含有截短的SecG的細菌宿主細胞的所需多肽的產(chǎn)量 相比,本發(fā)明教導的截短的SecG增加了所需多肽的產(chǎn)量。在一些實施方 案中,與不含有截短的SecG的細菌宿主細胞的所需多肽的產(chǎn)量相比,截 短的SecG增加了所需多肽的產(chǎn)量至少約20%、約30%、約40%、約50%、 約60%、約70%、約75%、約80%、約85%、約90%、約95%、約100%、 約125%、約150%、約175%、約200%或約250%。在一些實施方案中, 含有截短的SecG的細菌宿主細胞包含內(nèi)源性SecG。在其它實施方案中, 刪除了細菌宿主細胞的內(nèi)源性SecG基因。在其它實施方案中,用異源的 全長SecG基因替換了細菌宿主細胞的內(nèi)源性SecG基因。在其它實施方案 中,用異源的截短SecG基因替換了細菌宿主細胞的內(nèi)源性SecG基因。
在一些實施方案中,截短的SecG含有來自野生型或變體全長SecG的 區(qū)域,且與^^有全長SecG的細菌宿主細胞對所需多肽的分泌相比,增加 了所需多肽的分泌。在一些實施方案中,與含有全長SecG的細菌宿主細 胞的所需多肽的分泌相比,截短的SecG增加了所需多肽的分泌至少約 20%、約30%、約40%、約50%、約60%、約70%、約75%、約80%、 約85%、約90%、約95%、約100%、約125%、約150%、約175%、 約200%或約250%。
在其它一些實施方案中,發(fā)明提供了含有上述多核苷酸以及由上述多
25核苷酸編碼的多肽的表達載體,例如細菌表達栽體,和宿主細胞。具有合 適的啟動子、選擇標記等的合適栽體,例如細菌表達載體,是本領(lǐng)域技術(shù)
人員已知的。在一些實施方案中,表達載體包括aprE基因的aprE啟動子, 其天然的轉(zhuǎn)錄枯草芽孢桿菌的枯草桿菌蛋白酶。在一些實施方案中,宿主 細胞包括 aprE 啟動子,其是野生型 aprE 啟動子
(SEQIDNO:39;美國專利申請
發(fā)明者A·范齊蒙耐德, C·佩雷斯, C·菲奧雷西, E·費拉里 申請人:丹尼斯科美國公司