突變酶的制作方法
【專利說明】
[0001 ]本申請是申請日為2 0 0 8年1 0月8日的題為"突變酶"的中國專利申請 No .200880119582.8 的分案申請。
技術領域
[0002] 本發明涉及具有增強性能的突變酶。
【背景技術】
[0003] 生物酶催化劑,如P450bm-3酶,發現越來越多地用于從精細化學品、中間體、藥品和 藥物代謝物的合成到有機化學污染物和污物的降解的各種工業應用中。蛋白質工程,采用 定向進化(directed evolution)或定點突變,可以用于分離已知酶的變異體,這可以對它 們的催化活性產生新的契機和應用。
[0004] 巨大芽孢桿菌(Bacillus megaterium) (1)的P45〇bm-3屬于細胞色素 P450酶的超家 族(或超族,superfamily)。在各種基因序列數據庫中存在超過7,700個編碼P450酶的基因。 P450酶的命名法也已經系統化。酶的超家族稱為CYP,之后是酶家族的編號(因此,為CYP1、 CYP51、CYP102等),其被分成通過字母表示的子族(因此,為CYP1A、CYP101B等),并且每一子 族成員由數字標識(因此,為CYP1A1、CYP3A4、CYP101D3等)。編碼CYP酶的基因由斜體表示, 例如CYP101A1基因。P450bm-3已被標識為CYP102A1,即,它是CYP102家族的第一成員。自此, CYP102A1的系統命名將用于P450bm- 3。
[0005] CYP102A1(1)是用于生物轉化應用的受關注的酶,因為其是催化上自給自足的。與 其他P450酶不一樣,其中P450單加氧酶和電子轉移輔助因子蛋白是獨立的部分 (entities),CYP102A1具有融合至二弗拉芬(diflavin)電子轉移還原酶域的血紅素單加氧 酶域,其在單個多肽中同時含有FAD和FMN輔基。CYP102A1的天然底物被認為是直鏈或支鏈 的中鏈脂肪酸(1,2) XYP102A1血紅素域的晶體結構在1993年(3)就可獲得,其中揭示了活 性位點結構并且存在底物進入通道(或底物接近通道,substrate access channel)。四年 之后公布的具有結合底物的晶體結構,指出對于F87-旦底物結合后側鏈構象的變化(4)。
[0006] 對CYP102A1的蛋白質工程已經進行了綜述(5~7)。早期的研究集中在活性位點殘 基F87,其中F87V、F87A、F87Y和F87G突變已經顯示出對脂肪酸氧化的活性和選擇性具有不 同的影響(8~11) A87上的突變已經發現有利于各種底物的氧化(7)。在底物進入通道入口 處的殘基如F42、R47和Y51也被標靶。雖然F42A突變降低了酶活性(10),但是中和或逆轉在 47位置處的電荷改變了底物的特異性(8,12),正如疏水性取代¥5^-樣。冊0031273公開了 突變的R47L/Y51F偶聯體(或結合體,couplet)用來促進疏水性有機分子如聚芳香烴和類萜 烴的進入、結合和氧化。該偶聯體也與F87A、I263A、A264G和M354A突變組合以提供增強的底 物氧化的活性和/或產物選擇性(13,14) A47L/Y51F組合,以及在其自身上的R47L和Y51F突 變,現在通常用于CYP102A1工程(15~19)。
[0007] 除了突變位點的合理選擇之外,篩選技術已經用于識別對活性和選擇性具有期望 影響的其他突變和突變位點。隨機或位點飽和誘變早在1997年就應用于CYP102A1 (20)。 N020020380公開了使用經由吲哚氧化生成靛藍作為發現具有新的活性的CYP102A1突變的 篩選方法。飽和誘變應用于許多可能影響底物結合的殘基,而突變體A74G/F87V/L188Q據報 道相比于野生型能以增強的活性和改變的選擇性氧化很寬范圍的有機分子(21~25)。 AT342351T公開了經由ω-對硝基苯氧基-羧酸氧化而采用光譜檢測到對硝基苯酚的生成, 在一組隨機誘變實驗中作為篩選程序。突變V26T、R47F、S72G、A74G、F87A&V、L188A,G,Ν,Κ, 0,尺,5嫌、]\〇541'都已公開(26,27)。
[0008]對硝基苯酸篩選方法通過采用對硝基苯氧基辛燒作為替代底物(surrogate substrate)而得以擴展。W02002083868、EP1470219和 US2005202419(隨后在 W02005017116、 EP1660646 和 US2005037411 中校正)公開 了突變 L52I、I58V、F87A、H100R、S106R、F107L、 A135S、M145A&V、A184V、N239H、S274T、L324I、V340M、I366V、K434E、E442K、V446I。
[0009] W02003008563和US2003100744公開了采用相同方法的更多輪隨機誘變、基因重組 (gene shuffling)和篩選的結果,并報道了突變M30I、E64A、V78A、F87A,D,G,H,I,K,N,R,V& W、H138Y、F162S、H171Q、T175I、V178I、A184V、N186D、D217V、I220T、K224I、S226I、D232G、 T235A、H236Q、E252G、R255S、I258T、I259V、T268Q、A290V、A295T、L353V,D370Q,E380G、 G396M、T411A、M416L。
[0010] W02005017105、US2005059128和EP1639091公開了相同方法的使用并報道了突變 R47C、L75I&W、V78A,F&T、A82L,F,G,I,S&T、F87I,L&V、T88C、K94I、P142S、T175I、A184V、 F205C、S226R、H236Q、E252G、R255S、T260,L,N&S、A290V、A328V&M、L353V。
[0011] 隨后,W02006105082 公開 了突變 R47C、V78F、A82S、K94I、P141S、T175I、A184V、 F205C、S226R、H236Q、E252G、R255S、A290V、A291V、A328F、L353V。
[0012] 這些通過隨機誘變產生的系列突變體顯示出對于從乙烷到中鏈烷烴的烷烴氧化 的增強的活性(28~30)。也存在選擇性變化,尤其是在定向進化變異體與通過定點誘變引 入到活性位點的突變組合時,例如,在辛烷氧化中,其中突變將氧化位點向末端碳轉移 (31),在末端烯烴的選擇性環氧化中(32),以及對映選擇性在環戊烷羧酸衍生物的氧化中 (33)。值得注意的是,通過使定向進化與合理的重新設計進行組合經常可以獲得更好的結 果。
[0013] CYP102A3 是與 CYP102A1屬于相同子族(sub-family)的 P450 酶。CYP102A3 的隨機誘 變,接著烷烴氧化并在對末端醇特異性的醇脫氫酶存在的情況下監控NADH的形成,產生了 由辛烷氧化生成50%的1-辛醇的突變。這是迄今為止通過設計的CYP102族P450酶所觀察到 的直鏈烷烴的末端C-H鍵氧化的最高比例(34)。
[0014] 仍繼續需要分離工業上有用的酶如CYP102A1酶的另外的突變,以進一步理解結構 變化對它們的催化機理的影響,改進它們的催化轉化(catalytic turnover),并擴大其底 物和/或產物的范圍。通常,進行P450酶如CYP102A1的設計以增強酶活性,其中控制產物選 擇性和底物特異性是第二重要的目標。可將選擇性控制結合至增強的單加氧酶活性的突變 和突變位點是顯著缺乏的,以致化合物的酶轉化可以是較快的但是沒有足夠的選擇性,或 雖有一定的選擇性但反應很慢,或期望的產物并未形成。對于可以提供具有增強的活性和/ 或期望的選擇性的突變體的篩選方法也存在需要。
【發明內容】
[0015] 現在已經發現,根據本發明,CYP102A1特異性位置的取代突變在增強單加氧酶活 性方面具有期望的作用,并且也提供了改變的選擇性。這些突變位點通過使用提供增強的 活性和增強/改變的選擇性選擇的新型篩選方法來識別。
[0016] 本發明提供了一種突變CYP102A1酶,其具有增強的單加氧酶活性和/或改變的選 擇性,并含有在 CYP102A1 的位置 117、131、191、215、276、307、330、377、401、403、425 中的一 個或多個處的取代。另外還提供了一種用于氧化作為有機化合物的底物的方法,該方法包 括用本發明的突變CYP102A1酶來氧化所述有機化合物。
[0017] 所要求的取代(替代,substitution)構成相同的本發明構思的一部分,因為它們 共同具備增強單加氧酶活性的效應和/或改變CYP102A1的選擇性。在位置330、401和403的 取代也經由如下所概述的共同結構和功能機制發揮它們的作用。
[0018] SEQ ID N0:1 是CYP102A1 的序列。
【附圖說明】
[0019] 圖1:相關殘基在CYP102A1(P450bm-3)中的定位。Palm表示該酶的脂肪酸底物。
[0020]圖2:在野生型CYP102A1和A330P突變體的底物進入通道中的關鍵殘基和活性位點 的比較,突出表明了由A330P突變產生的P329和A328處的結構攝動(structural perturbations)〇
【具體實施方式】
[0021 ] 本發明可以適用于CYP102A1的天然和人工同源物(或同系物,homologues),例如, 其包括與CYP102A1具有至少40%的氨基酸序列同一性的序列。這樣的同源物典型地包括對 應于(即與之具有同源性或相同于)CYP102A1的血紅素單加氧酶域的氨基酸序列(由氨基酸 位置1~480表示)。
[0022] 本發明的酶包括與SEQ ID N0:1(CYP102A1的序列)具有至少40%同一性的序列 (或由其構成)。在優選的實施方式中,該序列在至少20,優選至少30,例如至少40、60、100、 200、300、400或更多個鄰近氨基酸內,或甚至在同源物的整個序列內與其可能具有至少 55%、65%、80%或90%,并且更優選至少95%、97%或99%的同源性。在一個實施方式中, 本發明的酶在與CYP102A1的氨基酸殘基1~480相比時具有任何指定的百分比同源性。鄰近 氨基酸可以包括活性位點。該同源性可以可替換地并不在鄰近氨基酸內而是僅僅在活性位 點的氨基酸內進行測定。因此,同源性基于氨基酸的同一性典型地至少40 %同源于 CYP102A1。本發明的酶可以與CYP102A1序列具有一定百分比同一性,這與以上提及的任何 序列長度內任何具體百分比同源性值(即,其可以具有至少40%、55%、80%或90%以及更 優選至少95%、97%或99%的同一性)相同。
[0023]同源序列可以表示CYP102A1序列的突變部分和/或可以以本發明酶的全長融合多 肽的形式存在。
[0024]本文中所提及的任何同源蛋白(即,描述為與另一蛋白同源)典型地至少40%同源 于相關的蛋白。同源性可以采用已知的方法進行測定。例如,UWGCG軟件包提供了可以用于 計算同源性的BESTFIT程序(例如,以其缺省設置進行使用KDevereux et al(1984) Nucleic Acids Research 12,387_395)。
[0025] PILEUP和BLAST算法可以用于計算同源性或比對序列(典型地按照其缺省設置), 例如在Altschul S.F.(1993)J Mol Evol36:290-300;Altschul,S,F et al(1990)J Mol Biol 215:403-10中所描述的。
[0026] 用于進行BLAST分析的軟件可以通過國家生物技術信息中心(National Center for Biotechnology Information) (http://www.ncbi .nhn.nih.gov/)公開獲得。i亥算法首 先涉及通過在與數據庫序列中相同長度的字比對時匹配或滿足一些正值閾值評分T的查詢 序列中識別長度W的短字來識別高評分序列對(HSPhT稱為鄰近字評分閾值(Altschul et al,supra)。這些初始的鄰近字命中(word hits)作為用于初始搜索以找到含有它們的HSP 的種子(seeds)。字命中在沿著直至能夠增加累積比對評分的每一序列的兩個方向上延伸。 當累積比對評分從其最大達到值下降量X;由于一個或多個負評分殘基比對的累積使累積 評分變成零或更低;或任一序列的末端到達時,對在每一方向上字命中的延伸就停止。 BLAST算法參數W、T和X決定了比對的靈敏度和速度。BLAST程序使用11的字長(W),50的 BL0SUM62評分矩陣(參見Henikoff and Henikoff(1992)Proc.Natl.Acad.Sci.USA 89: 10915-10919)比對(B),10的期望值(E),M=5,N=4和雙鏈對照作為缺省值。
[0027] BLAST算法進行兩序列之間類似性的統計分析;參見例如,Karlin and Altschul (1993)Proc · Natl · Acad · Sci · USA 90:5873-5787。通過BLAST算法提供的一種類似性度量是 最小和概率(P(N)),其提供了一個概率指示,通過該概率指示兩個核苷酸或氨基酸序列之 間的匹配就會偶然出現。例如,如果在第一序列與第二序列的比較中最小和概率低于約1, 優選低于約0.1,更優選低于約0.01,并且最優選低于約0.001,則該序列被認為類似于另一 序列。
[0028] 典型地,當比較所有蛋白或任何以上提及的鄰近氨基酸(contiguous amino acids)的長度時,同源蛋白不同于相關蛋白至少、或少于2、5、10、20、40、50或60個突變(其 每一個都可以是取代、插入或缺失)。
[0029]本發明的CYP102A1酶的酶活性典型地在體外采用本文中所提及的任何底物或條 件進行測定,并作為NADPH氧化速率,產物生成速率和結合效率(coupling efficiency)給 出。速率是轉化頻率并以(nmol NADPH)(nmol CYP1 02A1)-Hmin)-1 或(nmol產物)(nmol CYP1 (^Α?ΓΗπ?ηΓ1給出。結合效率是用于產物生成所消耗的NADPH的百分數,即,理論最 大效率的百分數。本發明的CYP102A1酶(例如,當用于本發明的方法中時)可以典型地具有 至少1 %,如至少2%、4%、6%、10%、20%、40%、80%或更大的結合效率。CYP102A1酶(例 如,當用于本發明的方法中時)典型地具有至少SmirT 1,如至少4、10、15、20、25、50、100、200、 300、500、700、1000、200011^11_ 1或更大的產物生成速率。在形成多于一種產物(這是一種常見 的情況)的情況下,產物生成速率表示形成的所有氧化產物的總量。在一些實施方式中,測 量特定氧化產物的產物生成速率,即,可以測量并非所有的氧化產物。
[0030] 本發明的突變CYP102A1酶顯示出相對于相應的野生型CYP102A1酶的增強的單加 氧酶活性和/或改變的選擇性。增強的單加氧酶活性可以根據增加的結合效率或增加的產 物生成速率采用一種或多種用于氧化的底物進行表征。增加的結合效率或增加的產物生成 速率可以在或可以不在被突變CYP102A1酶利用的所有底物中共享。突變CYP102A1酶典型地 表現出比該野生型酶的結合效率大至少10%、20%、50%、100%、500%、1000%或1500%的 結合效率。突變CYP102A1酶也可以具有比該野生型酶的產物生成速率大至少50%、100%、 150%、500%、1000%、2000%、5000%、10000% 的產物生成速率。
[0031] 應該理解到,本發明的突變CYP102A1酶也可以顯示出相對于相應的野生型酶和文 獻中所公開的突變體的其他改變的特性,使得這些效應可以包括但也不限于增強的單加氧 酶活性。例如,突變酶可以顯示出改變的底物特異性,允許優先利用特異性底物,或可以顯 示出單加氧酶活性,其中野生型酶或已知的突變體并不能氧化底物有機化合物。
[0032] 本發明的突變酶也可以顯示出改變的產物選擇性,其中由野生型以較小比例形成 的產物成為突變體的優勢產物,或以較小比例或根本不由野生型形成的新產物成為大多數 或優勢產物。下面描述突變酶和通過該突變酶實施的氧化過程的另外的改變的特性。
[0033] 突變 CYP102A1 酶在 CYP102A1 的位置 117、131、191、215、276、307、330、377、401、403 和425中的一個或多個處包括取代。典型地,它們可以在2個或更多個、3個或更多個、4個或 更多個、5個或更多個、6個或更多個以上定義的位置處包括取代。在一個優選的實施方式 中,其中在位置330處具有取代,存在小于5個其他取代,如小于3,或在一個實施方式中,其 他位置沒有被取代。
[0034]在描述CYP102A1的特異性突變的情況下,在CYP102A1的天然形式中存在的氨基酸 殘基的字母在位置之前,位置之后是突變體中的氨基酸。這些位置可以關聯于SEQ ID NO: 1 中所示的編號。為了指示出相同蛋白中的多個突變,每一突變通過斜線分開而列出。而且, 尤其優選的突變體可以采用以下概述的內部命名法進行描述。
[0035] 雖然參照CYP102A1中的位置定義了突變,但是本發明也涵蓋享有與SEQ ID N0:1 至少40 %氨基酸同一性的CYP10 2A1同源物的多肽鏈中同源的或相應位置的等價取代突變。 等價位置(equinalent position)通過參照SEQ ID N0:1的氨基酸序列進行確定。基于序列 之間的同源性,同源或相應位置可以通過對比CYP102A1 (SEQ ID NO: 1)的序列和同源物(或 同系物,homologue)序列來容易地推導。PILEUP和BLAST算法可以用于比對這些序列。在所 指的同源的或相應的氨基酸是活性位點殘基的情況下,一般將處于如同本文中討論的任何 特定氨基酸的同源物活性位點中的類似位置。
[0036]對于本領域技術人員來說眾所周知的是,P450酶超家族盡管具有高度保守的三級 結構,但在蛋白和酶中具有低同源性的一級結構卻是不常見的(35~37)。在基因組數據庫 中現在存在>6500CYP基因,而在蛋白數據庫(Protein Data Bank)中存在>150的結構。迄今 確定的所有P450結構表現出結合針對主β鏈域包裝的富螺旋域的特性形態學,如Poulos及 其合作者首次報道的P450酶(CYP101A1)的晶體結構中所描述的(38)。螺旋命名為A-L,而β 鏈β1-β5,其中整個形態現在稱為"Ρ450折疊"(38-42)。在二級結構元件中,血紅素遠側上的 Β和Β'螺旋、BC環、F和G螺旋和FG環形成底物結合袋(substrate binding pocket)。序列比 對很容易識別這些螺旋和環中的殘基,但是根據氨基酸序列和結構排列,在這些一般框架 內存在高度可變性,而且這也產生了 P450催化的多種特異性、活性和選擇性模式。
[0037] 在不同家族中的P450酶具有低至20%的同源性(氨基酸同一性)(35~37)。在 CYP102A1和結構表征的P450酶之間比對的樣例示于表A中。直至近來,連續序列分析已經建 議,在P450酶或域中典型的400~460中少至3個殘基是絕對保守的:血紅素鐵的鄰近半胱氨 酸配體,和在血紅素連接和結合中可能起作用的K螺旋中的EXXR基序(43)。然而,有關2006 年公開的CYP157家族的結果表明,甚至EXXR基序也不是保守的,剩下鄰近半胱氨酸作為整 個P450超家族中僅有的保守殘基。在P450超家族的系統分類中(44),剛好具有40%氨基酸 同一性的酶因此而位于相同的家族中,而緊密相關的家族成員(>55%同一性)歸成子族(參 見,例如,表B)。
[0038]實際上詳細的分子結構,底物特異性和產物選擇性在家族內是保守的,而序列同 一性卻經常較低。最顯著的實例是在生命王國中發現的固醇14α-去甲基酶的CYP51家族。這 些在角鯊烯氧化物環化之后形成的中間體的C14甲基的氧化性去甲基化作用中起到關鍵作 用。序列比對表明,整個生命王國的已知CYP51族基因之間的同源性平均為30 %,在緊密相 關的物種如哺乳動物中升高至95%,而在低級生物之間下降至23% (45)。越來越認識到,用 于將酶分配給同一家族的40%臨界值在一些情況下可能過高,而經常對于活性位點殘基觀 察到的酶活性和更高的同源性可能需要在未來被更多地考慮。
[0039]因此,典型地基于"Ρ450折疊"也可以容易地識別基于氨基酸同一性與CYP102A1至 少40%同源的同源物,而在相應或同源位置引入等價突變的同源物序列的比對可以通過包 含在整個酶家族中共享的Ρ450折疊的α螺旋和β鏈排列的保守性質的知識進行輔助。
[0040] 應該理解到,CYP102A1是電子轉移還原酶域和血紅素單加氧酶域的融合體。這些 域可以通過蛋白酶解或通過全長基因的截斷而切下。活性位點(底物結合袋)位于血紅素域 中。CYP102家族的一些成員并不是融合蛋白,但是與CYP102A1血紅素域的序列同源性為 40 %。因此,序列同源性可以單一地在這些環境下在整個血紅素域范圍內進行測定。在這些 酶中等價于本發明中所公開的CYP102A1的等價殘基(equivalent residues)可以通過本領 域技術人員已知的序列同源性和結構分析進行識別。
[0041] 在活性位點中的氨基酸是排列或限定在催化期間結合有底物位點的那些氨基酸 或排列或限定底物在到達催化位點之前必須經過的位點的那些氨