具有過氧合酶活性的多肽的制作方法
【專利說明】具有過氧合酶活性的多化
[0001] 對序列表的引用
[0002] 本申請包括一個計算機可讀形式的序列表,將其通過引用結合在此。
[000引背景 發明領域
[0004] 本發明設及具有過氧合酶(peroxygenase)活性的多膚和編碼該些多膚的多核巧 酸。本發明還設及核酸構建體、載體W及包括該些多核巧酸的宿主細胞連同產生和使用該 些多膚的方法。
[0005] 相關技術說明
[0006] W0 2006/034702A1披露了使用茶樹茹TMA1的AaP過氧合酶來酶促哲基化未活 化的姪(例如,蒙、甲苯和環己燒)的方法。該也描述于烏爾里克扣llrich)和霍夫里克特 (Hofrichter),2005,歐洲生化學會聯合會快報(陽BSLetters) 579:6247-6250 中。
[0007] DE103 32 065A1披露了用于通過使用茶樹茹TMA1的AaP過氧合酶通過醒的中 間形成從醇中酶法制備酸的方法。
[000引報道了用于通過該AaP過氧合酶而快速和選擇性地W分光光度計直接檢測芳香 族哲基化的方法(克盧格化luge)等人,2007,應用微生物學和生物技術(ApplMicrobiol Biotechnol)75:1473-1478)0
[0009] 從嗜糞真菌福毛鬼傘(Coprinusradians)中分離了另一種能夠進行芳香族過氧 合化(peroxygenation)的過氧合酶并對其進行了表征,鑒定了N-末端16個氨基酸并與較 早公布的茶樹茹的AaP酶的N-末端14個氨基酸進行了比對;但是未分離編碼基因(安赫 (Anh)等人,2007,應用與環境微生物學(ApplEnvMicrobiol) 73 (17): 5477-5485)。
[0010] WO2008/119780披露了若干種不同的過氧合酶多膚及其編碼多核巧酸連同其重 組產生。
[OCm]wo2011/120938披露了使用過氧合酶多膚的脂肪姪的位點特異性哲基化。
[0012] 本發明提供了具有過氧合酶活性的新穎多膚和編碼該些多膚的多核巧酸。
[001引發明概述
[0014] 本發明設及具有過氧合酶活性的分離的多膚,該些分離的多膚選自下組,該組由 W下各項組成:
[00巧](a) -種多膚,該多膚與SEQIDNO:2的成熟多膚具有至少60%的序列一致性;
[0016] 化)一種由W下多核巧酸編碼的多膚,該多核巧酸在中嚴謹度條件下與(i)SEQID NO: 1的成熟多膚編碼序列、(ii)其cDNA序列、或(iii) (i)或(ii)的全長互補體雜交;
[0017] (C) 一種由W下多核巧酸編碼的多膚,該多核巧酸與SEQIDN0:1的成熟多膚編碼 序列、或其cDNA序列具有至少60%序列一致性;
[0018] (d)SEQIDN0:2的成熟多膚的一種變體,該變體在一個或多個(例如,若干個)位 置處包括取代、缺失、和/或插入;W及
[0019](e) (a)、化)、(C)或(d)的多膚的一個片段,該片段具有過氧合酶活性。
[0020] 本發明還設及編碼本發明的多膚的分離的多核巧酸;核酸構建體;重組表達載 體;包括該些多核巧酸的重組宿主細胞;W及產生該些多膚的方法。
[0021] 本發明還設及使用本發明的多膚的方法。
[0022] 本發明還設及一種編碼信號膚的多核巧酸,該信號膚包括SEQIDNO:2的氨基 酸-19至-1或由其組成,該多核巧酸被可操作地連接至編碼一種蛋白質的基因;包括該些 多核巧酸的核酸構建體、表達載體和重組宿主細胞;W及產生一種蛋白質的方法。
[002引定義
[0024] 過氧合酶(Peroxygenase):術語"過氧合酶"意指根據EC1. 11. 2. 1的一種"非特 異性過氧合酶"活性,其催化來自馬化的一個氧原子插入多種底物(例如硝基苯并二曠茂) 中。出于本發明的目的,過氧合酶活性是根據描述于實例2,或描述于W下中的程序確定的: M.波拉杰-可比爾斯考(Poraj-Kobielska),M.金巧化inne),R.烏爾里克扣llrich),K.詩 切布內爾(Scheibner),M.霍夫里克特化0化ichter),"用于檢測真菌過氧合酶的分光光度 計測定(Aspectrophotometricassayforthedetectionoffungalperoxygenases) ", 分析生物化學(Anal5rticalBiochemistir) (2012),第 421 卷,第 1 期,第 327 - 329 頁。
[0025] 在一個方面中,本發明的該些多膚(過氧合酶)具有SEQIDN0:2的成熟多膚的至 少20%,例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95% 或至少100%的過氧合酶活性。
[0026] 等位基因變體;術語"等位基因變體"意指占據同一染色體基因座的基因的兩種或 更多種可替代形式中的任一種。等位基因變異由突變天然產生,并且可W導致群體內的多 態性。基因突變可W是沉默的(在所編碼的多膚中沒有改變)或可編碼具有改變的氨基酸 序列的多膚。多膚的等位基因變體是由基因的等位基因變體編碼的多膚。
[0027] cDNA;術語"cDNA"意指可W通過反轉錄從得自真核或原核細胞的成熟的、已剪接 的mRNA分子制備的DNA分子。cDNA缺乏可W存在于相應基因組DNA中的內含子序列。早 先的初始RNA轉錄本是mRNA的前體,其在呈現為成熟的剪接的mRNA之前要經一系列的步 驟進行加工,包括剪接。
[002引編碼序列;術語"編碼序列"意指直接指定一個多膚的氨基酸序列的多核巧酸。編 碼序列的邊界一般由一個開放閱讀框架決定,該開放閱讀框架從一個起始密碼子(如ATG、 GTG或TTG)開始并且W-個終止密碼子(如TAA、TAG或TGA)結束。編碼序列可W是一種 基因組DNA、cDNA、合成DNA或其組合。
[0029] 控制序列;術語"控制序列"意指對于表達編碼本發明的成熟多膚的多核巧酸所必 需的核酸序列。每個控制序列對于編碼該多膚的多核巧酸來說可W是天然的(即,來自相 同基因)或外源的(即,來自不同基因),或相對于彼此是天然的或外源的。此類控制序列 包括但不限于前導子、聚腺巧酸化序列、前膚序列、啟動子、信號膚序列、W及轉錄終止子。 至少,控制序列包括啟動子,W及轉錄和翻譯終止信號。出于引入有利于將該些控制序列與 編碼一種多膚的多核巧酸的編碼區連接的特異性限制酶切位點的目的,該些控制序列可W 提供有多個接頭。
[0030] 表達;術語"表達"包括設及多膚產生的任何步驟,包括但不限于,轉錄、轉錄后修 飾、翻譯、翻譯后修飾、W及分泌。
[0031] 表達載體;術語"表達載體"意指線性或環狀DNA分子,該分子包括編碼多膚的多 核巧酸并且該多核巧酸可操作地與提供用于其表達的控制序列相連接。
[0032] 片段;術語"片段"意指具有從成熟多膚或結構域的氨基和/或駿基末端缺失的一 個或多個(例如,若干個)氨基酸的多膚或催化結構域;其中該片段具有過氧合酶活性。在 一個方面中,一個片段包含至少240個氨基酸殘基(例如,SEQIDNO:2的氨基酸1至240 或SEQIDNO:2的氨基酸20至240)、至少230個氨基酸殘基(例如,SEQIDNO:2的氨基 酸1至230或SEQIDNO: 2的氨基酸20至230)或至少220個氨基酸殘基(例如,SEQID NO:2的氨基酸1至220或SEQIDNO:2的氨基酸20至220)。
[0033] 高嚴謹度條件:術語"高嚴謹度條件"意指對于長度為至少100個核巧酸的探針而 言,遵循標準DNA印跡程序,在42°C下在5XSS陽、0. 3%SDS、200微克/ml剪切并變性的蛙 魚精子DNA和50%甲酯胺中預雜交和雜交12至24小時。載體材料最終使用2XSSC、0. 2% SDS,在65°C下洗漆=次,每次15分鐘。
[0034] 宿主細胞;術語"宿主細胞"意指任何細胞類型,該細胞類型對于用包含本發明的 多核巧酸的核酸構建體或表達載體進行轉化、轉染、轉導等是易感的。術語"宿主細胞"涵 蓋由于復制期間發生的突變而與親本細胞不同的親本細胞的任何后代。
[0035] 分離的;術語"分離的"意指處于自然界中不出現的形式或環境中的物質。分離的 物質的非限制性實例包括(1)任何非天然存在的物質;(2)至少部分地從與其在自然界中 相關聯的一種或多種或全部天然存在的組分中除去的任何物質,包括但不局限于任何酶、 變體、核酸、蛋白質、膚或輔因子;(3)相對于自然界中發現的那種物質通過人工手動修飾 的任何物質;或者(4)通過相對于與其天然相關聯的其他組分增加該物質的量而修飾的任 何物質(例如,編碼該物質的基因的多個拷貝;比與編碼該物質的基因天然相關聯的啟動 子更強的啟動子的使用)。一種分離的物質可W存在于發酵液樣品中。
[0036] 低嚴謹度條件:術語"低嚴謹度條件"意指對于長度為至少100個核巧酸的探針而 言,遵循標準DNA印跡程序,在42°C下在5XSS陽、0. 3%SDS、200微克/ml剪切并變性的蛙 魚精子DNA和25%甲酯胺中預雜交和雜交12至24小時。載體材料最終使用2XSSC、0. 2% SDS,在50°C下洗漆=次,每次15分鐘。
[0037] 成熟多膚;術語"成熟多膚"意指在翻譯和任何翻譯后修飾如N-末端加工、C-末 端截短、糖基化作用、磯酸化作用等之后處于其最終形式的多膚。在一個方面中,基于預測 SEQIDN0:2的氨基酸-19至-1是信號膚的Si即alP3. 0程序,成熟多膚是SEQIDN0:2 的氨基酸1至244。本領域中已知的是,一個宿主細胞可W產生由同一多核巧酸表達的兩種 或更多種不同成熟多膚(即,具有不同C-末端和/或N-末端氨基酸)的混合物。
[003引成熟多膚編碼序列;術語"成熟多膚編碼序列"意指編碼具有過氧合酶活性的成熟 多膚的一種多核巧酸。在一個方面中,基于預測SEQIDNO: 1的核巧酸1至57編碼信號膚 的Si即alP3.0程序,成熟多膚編碼序列是SEQIDN0:1的核巧酸58至88、166至406、475 至746W及806至993,或其cDNA序列。
[0039] 中嚴謹度條件:術語"中嚴謹度條件"意指對于長度為至少100個核巧酸的探針而 言,遵循標準DNA印跡程序,在42°C下在5XSS陽、0. 3%SDS、200微克/ml剪切并變性的蛙 魚精子DNA和35%甲酯胺中預雜交和雜交12至24小時。載體材料最終使用2XSSC、0. 2% SDS,在55°C下洗漆=次,每次15分鐘。
[0040] 中-高嚴謹度條件;術語"中-高嚴謹度條件"意指對于長度為至少100個核巧酸 的探針而言,遵循標準DM印跡程序,在42°C下在5XSSPE、0. 3%SDS、200微克/ml剪切并 變性的蛙魚精子DM和35%甲酯胺中預雜交和雜交12至24小時。載體材料最終使用2X SSC、0. 2%SDS,在60°C下洗漆S次,每次15分鐘。
[0041] 核酸構建體;術語"核酸構建體"意指單鏈或雙鏈的一種核酸分子,該核酸分子是 從天然存在的基因中分離的,或者W-種本來不存在于自然界中的方式被修飾成含有核酸 的區段,或者是合成的,該核酸分子包含一個或多個控制序列
[0042] 可操作地連接;術語"可操作地連接"意指如下的構造,其中,控制序列相對于多核 巧酸的編碼序列安置在適當位置處,從而使得該控制序列指導該編碼序列的表達。
[0043] 序列一致性;兩個氨基酸序列之間或者兩個核巧酸序列之間的關聯度通過參數 "序列一致性"來描述。
[0044] 出于本發明的目的,使用如在EMBOSS包(EMBOSS;歐洲分子生物學開放軟件套件 (TheEluropeanMolecularBiologyOpenSoftwareSuite),賴斯巧ice)等人,2000,遺 傳學趨勢(TrendsGenet.) 16:276-277)(優選5. 0.0版或更新版本)的巧德爾(Needle) 程序中所實施的巧德爾曼-翁施(Needleman-Wunsch)算法(Needleman(巧德爾曼)和 Wunsch(翁施),1970,分子生物學雜志(J.Mol.Biol.)48:443-453)來確定兩個氨基酸 序列之間的序列一致性。使用的該些參數是空位開放罰分10、空位延伸罰分0.5,W及 E化0SUM62炬L0SUM62的EMBOSS版本)取代矩陣。巧德爾標注的"最長的一致性"的輸出 (使用-非簡化選項獲得)被用作百分比一致性,并且如下計算:
[0045] (一致的殘基X100)/(比對長度-比對中的空位總數)
[0046] 在一個實施例中,比對長度是至少150個氨基酸殘基,優選至少180個氨基酸殘 基,更優選至少200個氨基酸殘基,并且最優選至少220個氨基酸殘基。
[0047] 出于本發明的目的,使用如在EMBOSS包(EMBOSS;歐洲分子生物學開放軟件套件, 賴斯巧ice)等人,2000,見上文)(優選5.0.0版或更新版本)的巧德爾程序中所實施的巧 德爾曼-翁施算法(巧德爾曼(Needleman)和翁施(Wunsch) ,1970,見上文)來確定兩個 脫氧核糖核巧酸序列之間的序列一致性。使用的該些參數是空位開放罰分10、空位延伸罰 分0. 5W及邸NA即化(NCBINUC4. 4的EMBOSS版本)取代矩陣。巧德爾標注的"最長的一 致性"的輸出(使用-非簡化選項獲得)被用作百分比一致性,并且如下計算:
[0048] (一致的脫氧核糖核巧酸X100) /(比對長度-比對中的空位總數)
[0049] 子序列;術語"子序列"意指使一個或多個(例如,若干個)核巧酸從成熟多膚編 碼序列的5'端和/或3'端缺少的多核巧酸,其中該子序列編碼具有過氧合酶活性的一個 片段。在一個方面中,子序列包含至少600個核巧酸、至少650個核巧酸或至少700個核巧 酸。
[0050] 變體;術語"變體"意指在一個或多個(例如,若干個)位置處包括改變(即,取代、 插入和/或缺失)的具有過氧合酶活性的一個多膚。取代意指占據一個位置的氨基酸替換 不同的氨基酸;缺失意指去除占據一個位置的氨基酸;并且插入意指在鄰接并且緊隨占據 一個位置的氨基酸之后添加一個氨基酸。
[0化1] 非常高嚴謹度條件;術語"非常高嚴謹度條件"是指對于長度為至少100個核巧酸 的探針而言,遵循標準DNA印跡程序,在42°C下在5XSSPE、0. 3 %SDS、200微克/ml剪切并 變性的蛙魚精子DNA和50%甲酯胺中預雜交和雜交12至24小時。載體材料最終使用2X SSC、0. 2%SDS,在70°C下洗漆S次,每次15分鐘。
[0052] 非常低嚴謹度條件;術語"非常低嚴謹度條件"是指對于長度為至少100個核巧酸 的探針而言,遵循標準DNA印跡程序,在42°C下在5XSSPE、0. 3%SDS、200微克/ml剪切并 變性的蛙魚精子DM和25%甲酯胺中預雜交和雜交12至24小時。載體材料最終使用2X SSC、0. 2%SDS,在45°C下洗漆S次,每次15分鐘。
[005引詳細說明
[0化4] 具有過氧合酶活性的多膚
[0化5] 在一個實施例中,本發明設及與SEQIDNO:2成熟多膚具有至少60%,例如至少 65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少 93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致 性的分離的多膚,該些分離的多膚具有過氧合酶活性。在一個方面中,該些多膚與SEQID NO:2的成熟多膚相差不超過10個氨基酸,例如1、2、3、4、5、6、7、8或9個。
[0化6] 本發明的多膚優選地包括SEQIDNO: 2的氨基酸序列或其等位基因變體或由其組 成;或是其具有過氧合酶活性的片段。在另一個方面中,該多膚包括SEQIDN0:2的成熟多 膚或由其組成。在另一個方面中,該多膚包括SEQIDN0:2的氨基酸-19至244或SEQID NO:2的氨基酸1至244或由其組成。
[0化7] 本發明的多膚可W包括如W下所示的氨基酸序列:
[0058] Glu-His-Asp-Gly-Ser-Leu-Ser-Arg(沈QIDN0:3),
[0059] Glu-His-Asp-Ala-Ser-Leu-Ser-Arg(沈QIDNO:4),
[0060] 6111-化3-43口-617-561-116-561-4'徑(沈9 10側:5),或
[0061] Glu-His-Asp-Ala-Ser-Ile-Ser-Arg(沈QIDNO:6)。
[006引-其對應于SEQIDNO: 2的氨基酸85-92,并且其配位血紅素基附近的Mn原子。
[0063] 因此,本發明的多膚的氨基酸序列可W包括如W下所示的基序(其是將SEQID NO:3組合至SEQIDNO:6的結果);
[0064] E-H-D-[G,A]-S-[LI]-S-R(SEQIDN0:7)。
[00化]本發明的多膚可W包括如W下所示的氨基酸序列:
[0066] Arg-Gly-Pr〇-Cys-Pr〇-Xaa-Met-Asn-Ser-Leu(SEQIDNO:8),
[0067] Arg-Ala-Pr〇-Cys-Pr〇-Xaa-Met-Asn-Ser-Leu(SEQIDNO:9),
[0068] Arg-Gly-Pr〇-Cys-Pr〇-Xaa-Leu-Asn-Ser-Leu(SEQIDNO:10),
[0069] Arg-Ala-Pr〇-Cys-Pr〇-Xaa-Leu-Asn-Ser-Leu(SEQIDNO:11),
[0070] Arg-Gly-Pr〇-切s-Pro-Xaa-Met-Asn-T虹-Leu(SEQIDNO:12),
[0071] Arg-Ala-Pro-切s-Pr〇-Xaa-Met-Asn-T虹-Leu(SEQIDNO:13),
[0072] Arg-Gly-Pr〇-切s-Pr〇-Xaa-Leu-Asn-T虹-Leu(SEQIDNO:14),或
[0073] Arg-Ala-Pro-切s-Pr〇-Xaa-Leu-Asn-T虹-Leu(SEQIDNO:15);
[0074] -其對應于SEQIDNO: 2的氨基酸12-21,并且其形成連接至血紅素基的必需結構 元件。Xaa可W是任何氨基酸,但是優選地,它是Met、Gly、Ala或Val。
[0075] 因此,本發明的多膚的氨基酸序列可W包括如W下所示的基序(其是將SEQID NO:8組合至SEQIDNO: 15的結果);
[0076] R-[G,A]-P-C-P-X-[M,L]-N-[S,T]-L(SEQIDN0:16);并且優選地
當前第1頁
1 
2 
3 
4 
5 
6