代謝進(jìn)化方法
【專利摘要】本發(fā)明涉及代謝途徑中天然芳族小分子產(chǎn)物的變體的代謝進(jìn)化方法,其通過(guò)采用至少一種基因A的基因嵌合體來(lái)體細(xì)胞體內(nèi)組裝和重組所述代謝途徑,所述方法包括:a)在單個(gè)步驟過(guò)程中,(i)用與作為細(xì)胞基因組的主要部分或存在于基因構(gòu)建體的框架中的待重組的另一基因的序列同源性小于99.5%的至少一種基因A轉(zhuǎn)化細(xì)胞,(ii)重組所述基因,(iii)在靶基因組的整合位點(diǎn)產(chǎn)生所述基因的基因嵌合體,其中所述至少一種基因A在與所述整合位點(diǎn)的5′或3′端錨定的5’端或3’端具有單側(cè)翼靶序列,(iv)重組所述代謝途徑的最終的其它基因,和b)選擇能夠表達(dá)所述變體的包括所述基因嵌合體和所述最終的其它基因的克隆,本發(fā)明涉及產(chǎn)生代謝途徑中天然芳族小分子產(chǎn)物的變體的細(xì)胞文庫(kù)的制備方法,和由此產(chǎn)生并用于制備所述變體的文庫(kù)。
【專利說(shuō)明】代謝進(jìn)化方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及代謝途徑中天然芳族小分子產(chǎn)物的變體的代謝進(jìn)化方法,其通過(guò)采用基因嵌合體來(lái)體細(xì)胞體內(nèi)組裝和重組所述代謝途徑。
【背景技術(shù)】
[0002]蛋白質(zhì)設(shè)計(jì)的首要目標(biāo)之一是產(chǎn)生具有新的或改進(jìn)的性質(zhì)的蛋白質(zhì)。為在蛋白質(zhì)或酶上賦予期望活性的能力在化學(xué)和制藥工業(yè)中具有相當(dāng)大的實(shí)際應(yīng)用。定向蛋白質(zhì)進(jìn)化已應(yīng)運(yùn)而生,成為蛋白質(zhì)工程中強(qiáng)有力的技術(shù)平臺(tái),其中在變體文庫(kù)中通過(guò)實(shí)驗(yàn)尋找擁有期望性質(zhì)的克隆。
[0003]定向蛋白質(zhì)進(jìn)化利用自然選擇的力量來(lái)進(jìn)化具有期望性質(zhì)但未在自然中發(fā)現(xiàn)的蛋白質(zhì)或核酸。多種技術(shù)用于產(chǎn)生蛋白質(zhì)突變體和變體并用于選擇期望的功能。重組DNA技術(shù)已將單結(jié)構(gòu)基因或整個(gè)通路基因轉(zhuǎn)移至適合的替代宿主以便快速繁殖和/或高水平生產(chǎn)蛋白質(zhì)?;钚曰蚱渌再|(zhì)的積累改進(jìn)通常通過(guò)迭代突變和篩選而獲得。定向進(jìn)化的應(yīng)用主要存在于學(xué)術(shù)和工業(yè)實(shí)驗(yàn)室,用以改進(jìn)蛋白質(zhì)穩(wěn)定性并增強(qiáng)酶和有機(jī)體的活性或總體性能,或者用以改變酶底物特異性和設(shè)計(jì)新活性。大多數(shù)定向進(jìn)化工程追求使在農(nóng)業(yè)、醫(yī)藥或工業(yè)領(lǐng)域?qū)θ祟愑杏玫男再|(zhì)(生物催化)進(jìn)化。
[0004]整個(gè)代謝途徑的進(jìn)化是特別吸引人的概念,這是因?yàn)榇蠖鄶?shù)天然和新的化合物是通過(guò)途徑而不是通過(guò)單個(gè)酶產(chǎn)生的。代謝途徑工程通常需要途徑中所有酶的協(xié)調(diào)操作。新的代謝途徑的進(jìn)化和生物處理的增強(qiáng)通常通過(guò)重組和篩選或選擇的迭代循環(huán)的過(guò)程以進(jìn)化單個(gè)基因、整個(gè)質(zhì)粒、多基因簇或者甚至整個(gè)基因組來(lái)進(jìn)行。
[0005]Shao等(I)描述了在釀酒酵母(Saccharomyces cerevisiae)中一步法組裝編碼整個(gè)生物化學(xué)途徑的大型重 組DNA或基因組,其通過(guò)在5’和3’端包含相鄰片段的5’或3’端序列的兩個(gè)側(cè)翼(錨定)區(qū)的體內(nèi)同源重組來(lái)組裝。
[0006]Elefanty等(2)描述了產(chǎn)生突變小鼠的基因靶向?qū)嶒?yàn),其中IacZ報(bào)告基因已敲入至SCL座位。參考圖1,示出了采用兩個(gè)錨定序列,即5’和3’端各一個(gè)的SCL-1acZ基因靶向策略。
[0007]US7807422B2 (3)公開了通過(guò)重組微生物生產(chǎn)類黃酮。將一組基因引入異源宿主細(xì)胞,以使基因的表達(dá)導(dǎo)致酶的產(chǎn)生。
[0008]Naesby等(4)描述了在酵母中隨機(jī)組裝生物合成途徑和生產(chǎn)多種天然產(chǎn)物或中間體。編碼七步類黃酮途徑的酶的基因被單獨(dú)地克隆至酵母表達(dá)盒中,然后將酵母表達(dá)盒隨機(jī)組合到酵母人工染色體上。類似地,Trantas等(5)能夠在酵母質(zhì)粒中表達(dá)編碼類黃酮和芪途徑的酶的異源基因。
[0009]定向進(jìn)化可在活細(xì)胞中進(jìn)行,也稱為體內(nèi)進(jìn)化,或者可根本不涉及細(xì)胞(體外進(jìn)化)。體內(nèi)進(jìn)化具有選擇細(xì)胞環(huán)境中的性質(zhì)的優(yōu)勢(shì),當(dāng)將進(jìn)化的蛋白質(zhì)或核酸用于生物體時(shí)這是有用的。酵母中的體內(nèi)同源重組已廣泛用于克隆、質(zhì)粒構(gòu)建和文庫(kù)建立。
[0010]通過(guò)突變或重組獲得文庫(kù)多樣性。DNA改組(DNA shuffling)允許來(lái)自多基因的有利突變定向重組。在DNA改組中,DNA序列群隨機(jī)斷裂,然后重組成全長(zhǎng)雜合序列。
[0011]出于同源重組的目的,天然產(chǎn)生的同源基因用作起始多樣性的來(lái)源。單基因改組文庫(kù)成員典型地為超過(guò)95%的同一性。然而,家族改組允許典型地超過(guò)60%同一性的序列的嵌段交換(block exchange)。功能序列多樣性來(lái)自自然選擇存活下來(lái)的相關(guān)親本序列;因此,在給定序列中容忍數(shù)量大得多的突變而不引入對(duì)結(jié)構(gòu)或功能的有害影響。
[0012]在W01990007576A1(6)中記載了具有多達(dá)30%多樣性的不同來(lái)源的DNA片段的重組。在錯(cuò)配修復(fù)缺陷菌或錯(cuò)配修復(fù)(MMR)體系暫時(shí)失活的細(xì)菌中通過(guò)屬間和/或種間重組而在體內(nèi)產(chǎn)生雜合基因。因此,避免了修復(fù)損傷DNA的那些過(guò)程,這將對(duì)趨異序列之間的重組頻率即部分同源重組產(chǎn)生抑制效果。
[0013]文庫(kù)的多樣性可通過(guò)利用單倍體細(xì)胞有效配對(duì)而引起二倍體生物形成的能力來(lái)增強(qiáng)。在釀酒酵母的營(yíng)養(yǎng)生命周期中,細(xì)胞具有單倍體基因組,即每個(gè)染色體以單拷貝存在。在特定條件下,單倍體細(xì)胞可配對(duì)。借此形成二倍體細(xì)胞。二倍體細(xì)胞可再次形成單倍體細(xì)胞,特別是在特定的營(yíng)養(yǎng)素缺失的時(shí)候。然后它們經(jīng)歷稱為減數(shù)分裂的過(guò)程,隨后孢子形成而形成四個(gè)單倍體孢子。減數(shù)分裂期間,兩個(gè)親本基因組的不同染色體重組。減數(shù)分裂重組期間,DNA片段交換產(chǎn)生重組的DNA物質(zhì)。
[0014]W02005/075654A1 (7)公開了在釀酒酵母中產(chǎn)生重組DNA序列的體系,其基于釀酒酵母的有性生殖周期。雜合二倍體細(xì)胞在誘導(dǎo)減數(shù)分裂和孢子形成過(guò)程的條件下生長(zhǎng)。減數(shù)分裂通常的特征在于增加遺傳重組頻率。因此,減數(shù)分裂的產(chǎn)物(單倍體細(xì)胞或孢子)由于兩種不同DNA序列之間的重組而可包含重組DNA序列。通過(guò)迭代法,選擇重組單倍體后代并彼此配對(duì),所得二倍體再次形成孢子,它們的后代孢子經(jīng)受適當(dāng)?shù)倪x擇條件,從而確定新的重組事件。該過(guò)程描述于野生型或錯(cuò)配修復(fù)缺陷型釀酒酵母細(xì)胞中。因此,將感興趣的兩側(cè)各有兩個(gè)選擇標(biāo)記的基因整合至錯(cuò)配修復(fù)缺陷型二倍體菌株的兩個(gè)姐妹染色體中每一個(gè)的同一位點(diǎn)。DNA序列添加到與整合有DNA的基因座的側(cè)翼DNA序列100%同一性的新DNA片段的5’或3’端。這些側(cè)翼靶序列約400-450核苷酸長(zhǎng)。然后迫使細(xì)胞起始孢子形成。孢子形成期間發(fā)生重組過(guò)程。所得孢子和重組序列可由選擇適當(dāng)側(cè)翼標(biāo)記來(lái)區(qū)分。
[0015]酵母有效重組同源DNA序列的能力還可用于增加文庫(kù)的多樣性。當(dāng)享有89.9%同源性的兩種基因通過(guò)PCR突變并轉(zhuǎn)化至野生型酵母中時(shí),通過(guò)體內(nèi)同源重組建立10e7的嵌合文庫(kù),貫穿兩種基因顯示多個(gè)交叉點(diǎn)(8)。
[0016]盡管已通過(guò)工程化重組宿主進(jìn)行了改進(jìn)代謝途徑來(lái)在工業(yè)規(guī)模上產(chǎn)生小分子的努力,但此類代謝產(chǎn)物的變體僅通過(guò)例如造成中間體積累的不完整途徑而零星發(fā)現(xiàn)。
[0017]本發(fā)明的目的為提供作為代謝途徑產(chǎn)物的天然芳族小分子的改善的生產(chǎn)方法。
[0018]該目的通過(guò)提供本申請(qǐng)實(shí)施方案來(lái)實(shí)現(xiàn)。
【發(fā)明內(nèi)容】
[0019]根據(jù)本發(fā)明,提供代謝途徑中天然芳族小分子產(chǎn)物的變體的代謝進(jìn)化方法,其通過(guò)采用至少一種基因A的基因嵌合體來(lái)體細(xì)胞體內(nèi)組裝和重組所述代謝途徑來(lái)進(jìn)行,所述方法包括:
[0020]a)在單個(gè)步驟過(guò)程中,[0021](i)用與作為細(xì)胞基因組的整合部分或存在于基因構(gòu)建體的框架中的待重組的另一基因的序列同源性小于99.5%的至少一種基因A轉(zhuǎn)化細(xì)胞,
[0022](ii)重組所述基因,
[0023](iii)在靶基因組的整合位點(diǎn)產(chǎn)生所述基因的基因嵌合體,其中所述至少一種基因A在與所述整合位點(diǎn)的5'或3'端錨定的5’端或3’端具有單側(cè)翼靶序列,
[0024](iv)重組所述代謝途徑的最終的其它基因,和
[0025]b)選擇能夠表達(dá)所述變體的包括所述基因嵌合體和所述最終的其它基因的克隆。
[0026]特別優(yōu)選將選擇標(biāo)記用于基因嵌合體,并根據(jù)選擇標(biāo)記的存在來(lái)選擇克隆。例如,基因嵌合體包括選擇標(biāo)記,例如其中所述基因A連接至選擇標(biāo)記。可選地,還可通過(guò)重組體產(chǎn)生的任何產(chǎn)物的存在,例如借助確定產(chǎn)率或功能特性來(lái)進(jìn)行選擇。具體地,一種或多種不同的選擇標(biāo)記可用于區(qū)分基因嵌合體的類型。
[0027]用于本發(fā)明方法的選擇標(biāo)記可選自由已知的營(yíng)養(yǎng)缺陷型標(biāo)記、抗生素抗性標(biāo)記、熒光標(biāo)記、敲入標(biāo)記、活化劑/結(jié)合域標(biāo)記和顯隱性標(biāo)記以及比色標(biāo)記中的任一種組成的組。優(yōu)選的標(biāo)記可暫時(shí)失活或功能性敲除,并可再建立以恢復(fù)其標(biāo)記性質(zhì)。進(jìn)一步優(yōu)選的標(biāo)記為可追蹤的基因,其中所述標(biāo)記為基因序列A和/或其它基因如基因B的功能,而不是具有標(biāo)記功能的單獨(dú)序列,以便基因嵌合體的表達(dá)可通過(guò)檢測(cè)嵌合體本身來(lái)直接確定。在該情況下,基因嵌合體是直接可追蹤的。
[0028]根據(jù)特定實(shí)施方案,所述基因包括在線性多核苷酸、載體或酵母人工染色體中。具體地,基因A和/或待重組的其 它基因?yàn)閮?yōu)選300-20,OOObp的線性多核苷酸的形式。具體地,沒(méi)有必要構(gòu)建或采用質(zhì)?;虼筚|(zhì)粒。因此基因可被原樣使用,即不需要載體。
[0029]用于重組和整合的基因還可包括在任何基因構(gòu)建體中,所述基因構(gòu)建體例如將用作承載所述基因的載體。所述基因因此可包括在基因構(gòu)建體如線性多核苷酸、載體或酵母人工染色體中。這些優(yōu)選包括線性多核苷酸、質(zhì)粒、PCR構(gòu)建體、人工染色體、類酵母人工染色體、病毒載體或轉(zhuǎn)座元件。
[0030]根據(jù)本發(fā)明的特定實(shí)施方案,靶基因組的整合位點(diǎn)位于各基因中,例如在線性多核苷酸、質(zhì)?;蛉旧w(包括人工染色體)中。
[0031]具體地,所述另一基因?yàn)榘谢蚪M例如細(xì)胞基因組的一部分。在優(yōu)選的實(shí)施方案中,所述另一基因?yàn)樽鳛榧?xì)胞基因組的一部分的基因B。
[0032]根據(jù)可選的優(yōu)選實(shí)施方案,所述另一基因?yàn)閺陌谢蚪M分離的基因構(gòu)建體,例如線性多核苷酸,并在重組過(guò)程中任選地整合進(jìn)靶基因組中。
[0033]根據(jù)本發(fā)明,根據(jù)所述方法的具體方面,用至少一種基因A和至少一種基因B共轉(zhuǎn)化所述細(xì)胞,其中所述基因A的單側(cè)翼靶序列錨定至所述靶基因組上的整合位點(diǎn)的5'端,并且其中基因B連接至錨定于整合位點(diǎn)3’端的單側(cè)翼靶序列。
[0034]具體地,可用具有選擇標(biāo)記的至少一種基因A和至少一種基因B共轉(zhuǎn)化細(xì)胞,其中所述基因A的單側(cè)翼靶序列錨定至所述靶基因組的整合位點(diǎn)的5'端,并且其中基因B連接至錨定于整合位點(diǎn)3’端的不同選擇標(biāo)記和單側(cè)翼靶序列,并且其中選擇至少兩種選擇標(biāo)記的克隆。
[0035]具體地,用至少兩種不同基因Al和A2,并任選地用至少兩種不同的基因BI和B2共轉(zhuǎn)化細(xì)胞。[0036]根據(jù)本發(fā)明,根據(jù)所述方法的另一方面,共轉(zhuǎn)化至少一種其它基因C,所述其它基因C具有與基因A和/或所述另一基因如基因B的序列雜交的序列,從而獲得所述其它基因C與基因A和/或所述另一基因的組裝和最終的重組。
[0037]具體地,所述基因C的雜交序列與所述序列具有小于99.5%的序列同源性,并優(yōu)選至少30%的序列同源性。
[0038]具體地,選擇所述基因中具有至少一種核苷酸置換或交叉的基因嵌合體,即具有基因內(nèi)交叉的嵌合體,例如包括基因A的一部分和結(jié)合的所述另一(多個(gè))基因的一部分的那些,其被理解為部分基因的混合物,從而獲得重組基因內(nèi)基因嵌合體,例如適用于以不同方式如具有改進(jìn)性質(zhì)或改進(jìn)產(chǎn)量表達(dá)產(chǎn)物的基因。此類基因內(nèi)基因嵌合體可通過(guò)一系列基因的重組并優(yōu)選組裝來(lái)生產(chǎn),其中一種或多種組裝的基因具有這種基因內(nèi)基因嵌合體。
[0039]根據(jù)優(yōu)選實(shí)施方案,可獲得至少三種不同基因A和/或B和/或C的嵌合體。
[0040]優(yōu)選的,所述基因A和/或所述另一基因?yàn)榉蔷幋a序列或編碼多肽或具有活性的多肽的一部分的序列。
[0041]具體地,本發(fā)明方法采用編碼具有活性的多肽的一部分的基因A、B和/或C。因此,基因如基因A和/或B和/或C,優(yōu)選其全部本身都不獨(dú)立地編碼生物學(xué)活性多肽,而僅編碼其部分,并僅在基因組裝時(shí)可引起相應(yīng)活性或修飾活性。
[0042]使用本發(fā)明的方法,可組裝和重組編碼生物化學(xué)途徑的多肽的多基因。根據(jù)優(yōu)選的實(shí)施方案,重組和組裝所述代謝途徑的至少兩種基因,例如重組和組裝編碼所述代謝途徑的多肽的至少兩種基因。
[0043]具體地,所述基因?yàn)閮?yōu)選300-20,OOObp的線性多核苷酸。
`[0044]根據(jù)具體實(shí)施方案,獲得至少3個(gè)、優(yōu)選至少9個(gè)、多至20,000個(gè)堿基對(duì)優(yōu)選每700bp具有3個(gè)交叉事件的基因嵌合體。優(yōu)選包括至少一種基因內(nèi)嵌合體的基因嵌合體,其每700bp堿基對(duì)、優(yōu)選每600bp、每500bp或甚至更低,優(yōu)選具有至少3個(gè)交叉事件,優(yōu)選至少4、5或10個(gè)交叉事件。典型地,高交叉事件提供大的重組基因多樣性,這可用于生產(chǎn)選擇適當(dāng)文庫(kù)成員的文庫(kù)。嵌合體或交叉事件的程度可被理解為此類文庫(kù)的質(zhì)量參數(shù)。
[0045]根據(jù)本發(fā)明的方法具體提供了具有基因內(nèi)基因嵌合體的至少一種克隆的選擇。具體地,選擇具有基因組裝和至少一種基因內(nèi)基因嵌合體的至少一種克隆。
[0046]根據(jù)本發(fā)明方法修飾的基因可為例如出于科學(xué)或工業(yè)目的用于源材料的酶促加工來(lái)產(chǎn)生有機(jī)小分子的任何基因。這些基因可編碼,例如整個(gè)或部分多肽的變體,包括那些部分序列,其不編碼具有生物學(xué)活性的多肽,所述多肽具體選自由酶、轉(zhuǎn)錄因子、轉(zhuǎn)運(yùn)蛋白、信號(hào)肽、受體、激素、生長(zhǎng)因子組成的組,但還可編碼可改善產(chǎn)物表達(dá)的非多肽基因,例如啟動(dòng)子、終止子及其它調(diào)控因子。
[0047]因此,如此處所理解的,用于包括“酶促進(jìn)化”或“酶促合成”的“代謝進(jìn)化”的序列的重組和/或組裝是指,例如由酶變體或由改善酶(包括輔因子)的表達(dá)或活性的化合物來(lái)支持代謝途徑的酶促加工的序列嵌合體,以及非編碼序列。
[0048]如果編碼作為具有生物活性的多肽的部分的氨基酸序列的基因(也稱為“部分基因”)被修飾,可優(yōu)選此類部分基因的組裝具有功能特性,如編碼具有生物活性的多肽。優(yōu)選若干不同基因,如大小在3bp-20,OOObp范圍內(nèi)、具體至少lOObp,優(yōu)選300bp_20,OOObp,具體多至10,OOObp的不同的部分基因重組,其中不同基因的數(shù)量為至少2,更具體至少3、4、5、6、7、8、9,或至少10,從而產(chǎn)生編碼例如具有被有利調(diào)節(jié)的生物活性,如具有增加的生物活性的重組多肽的重組基因序列。如在這一點(diǎn)上使用的術(shù)語(yǔ)“生物活性”具體是指酶促活性,例如將特定底物轉(zhuǎn)化為特定產(chǎn)物的活性。根據(jù)本發(fā)明作為多樣化的優(yōu)選基因編碼多鏈多肽。
[0049]根據(jù)本發(fā)明的方法具體是指選自由苯丙素類(phenylpropanoids)、類黃酮、黃酮醇、花青苷、木質(zhì)素、花青素、查耳酮、香草醛和及其天然產(chǎn)生的衍生物(通常包括中間體)組成的組的天然芳族小分子。
[0050]特別地,所述變體由重組酶變體合成。
[0051]在具體實(shí)施方案中,酶變體由此類基因嵌合體例如直接通過(guò)基因嵌合體的重組和最終組裝,或作為此類基因嵌合體例如通過(guò)一系列酶促過(guò)程的結(jié)果來(lái)獲得。典型的方法是指肉桂酸酯-4-水解酶(C4H)和編碼具有改善的或新的酶學(xué)特性(enzymologicproperties)的酶的C4H產(chǎn)生基因。 [0052]4-香豆酰(coumaroyl)CoA是聚丙烷類(polypropanoid)代謝中的關(guān)鍵分子,也是用于界定類黃酮和芪合成的重要連接點(diǎn)的連接酶4CL的底物。關(guān)鍵酶CHS合成用作類黃酮和異黃酮合成中間體的查耳酮。
[0053]根據(jù)優(yōu)選的實(shí)施方案,所述變體為具有選自例如由功能分析確定的抗菌、抗氧化、芳香(fragrant)和風(fēng)味(flavorful)活性的組的生物活性的苯丙素類。
[0054]特別優(yōu)選的方法采用酶和包括至少2個(gè)具有生物活性的酶的酶途徑的重組和組裝,從而獲得具有相應(yīng)基因嵌合體的酶變體或途徑變體,用于加工生物源材料或陣列,進(jìn)而產(chǎn)生具有新結(jié)構(gòu)和功能的天然芳族小分子的變體。由此首次能夠通過(guò)酶進(jìn)化合成新的小分子。
[0055]任何有重組能力的真核或原核宿主細(xì)胞可用于通過(guò)根據(jù)本發(fā)明的體細(xì)胞體內(nèi)重組產(chǎn)生基因嵌合體。根據(jù)本發(fā)明的優(yōu)選實(shí)施方案,所述細(xì)胞為修復(fù)缺陷型細(xì)胞,例如核酸修復(fù)缺陷型細(xì)胞,如具有DNA修復(fù)缺陷,即DNA修復(fù)缺陷型細(xì)胞,或MMR缺陷型細(xì)胞。
[0056]具體地,所述細(xì)胞為真核細(xì)胞或原核細(xì)胞,優(yōu)選真菌、哺乳動(dòng)物或植物細(xì)胞。
[0057]優(yōu)選地,所述細(xì)胞為曲霉屬(Aspergillus sp)或真菌細(xì)胞,優(yōu)選地,其可選自由酵母屬(Saccharomyce)、念珠菌屬(Candida)、克魯維酵母屬(Kluyveromyces)、漢遜酵母屬(Hansenula)、裂殖酵母屬(Schizosaccaromyces)、耶氏酵母屬(Yarrowia)、畢赤酵母屬(Pichia)和曲霉屬(Aspergillus)組成的組。
[0058]優(yōu)選地,采用單倍體菌株,例如單倍體酵母菌株。
[0059]可選地,可使用原核生物如大腸桿菌(E.coli)、芽孢桿菌屬(Bacillus)、鏈霉菌屬(Streptomyces)或哺乳動(dòng)物細(xì)胞諸如HeLa細(xì)胞或Jurkat細(xì)胞,或植物細(xì)胞諸如擬南芥屬(Arabidopsis)。
[0060]根據(jù)具體實(shí)施方案,側(cè)翼祀序列為至少5bp,優(yōu)選至少IObp,更優(yōu)選至少20bp、50bp、100bp,多至5,OOObp長(zhǎng)。具體地,側(cè)翼靶序列連接至所述基因或?yàn)樗龌虻恼稀⒛┒瞬糠?。?yōu)選所述側(cè)翼靶序列與所述整合位點(diǎn)的錨定序列雜交具有30%至99.5%范圍內(nèi)的同源性,優(yōu)選小于95%、小于90%、小于80%。
[0061]當(dāng)根據(jù)本發(fā)明使用錨定至基因組的靶整合位點(diǎn)的至少兩種不同側(cè)翼靶序列時(shí),優(yōu)選它們不相互重組,優(yōu)選它們享有小于30%的同源性。[0062]根據(jù)本發(fā)明的特定實(shí)施方案,提供基因變體的細(xì)胞展示方法,其包括使用根據(jù)本發(fā)明的方法在細(xì)胞中建立基因嵌合體的變體,在所述細(xì)胞表面展示所述變體,從而獲得嵌合體文庫(kù)。
[0063]根據(jù)本發(fā)明的具體方面,提供產(chǎn)生代謝途徑中天然芳族小分子產(chǎn)物的變體的細(xì)胞文庫(kù),其包括通過(guò)采用至少一種基因A的基因嵌合體來(lái)體細(xì)胞體內(nèi)組裝和重組所述代謝途徑來(lái)工程化重組細(xì)胞,所述方法包括:
[0064]a)在單個(gè)步驟過(guò)程中,
[0065](i)用與作為細(xì)胞基因組的整合部分或存在于基因構(gòu)建體的框架中的待重組的另一基因的序列同源性小于99.5%的至少一種基因A轉(zhuǎn)化細(xì)胞,
[0066](ii)重組所述基因,
[0067](iii)在靶基因組的整合位點(diǎn)產(chǎn)生所述基因的基因嵌合體,其中所述至少一種基因A在與所述整合位點(diǎn)的5,或3,端錨定的5’端或3’端具有單側(cè)翼靶序列,
[0068](iv)重組所述代謝途徑的最終的其它基因,和
[0069]b)收集能夠產(chǎn)生所述變體的包括所述基因嵌合體和所述最終的其它基因的克隆。
[0070]根據(jù)本發(fā)明的另一方面,提供通過(guò)此類方法可獲得的文庫(kù),所述文庫(kù)包括至少10E3種產(chǎn)生包含至少1%,更優(yōu)選至少10%,更優(yōu)選至少20%,更優(yōu)選至少40%,更優(yōu)選至少60%,更優(yōu)選至少80%,甚至更優(yōu)選至少90%,更優(yōu)選至少95%的功能ORF的所述變體的不同克隆。
[0071]很好理解,術(shù)語(yǔ)“可獲得”還指通過(guò)所述方法獲得的產(chǎn)物。
[0072]根據(jù)具體實(shí)施方案,提供包括編碼一系列(repertoire)代謝途徑的重組基因的細(xì)胞文庫(kù),所述細(xì)胞文庫(kù)通過(guò)根據(jù)本發(fā)明的方法可獲得。
[0073]具體地,所述文庫(kù)為包括編碼一系列合成酶的重組基因的細(xì)胞文庫(kù)。
[0074]具體地,提供合成 重組酶的文庫(kù),所述文庫(kù)可由根據(jù)本發(fā)明方法可獲得的此類文庫(kù)來(lái)獲得。
[0075]通過(guò)此類優(yōu)選的展示可獲得的文庫(kù)具體包括功能開放閱讀框(ORF)內(nèi)的高百分比的基因嵌合體,優(yōu)選至少80%。
[0076]根據(jù)本發(fā)明的文庫(kù)具體可以為任何適合的形式,具體為包括各種含有基因變體的生物體的生物文庫(kù)。根據(jù)本發(fā)明的生物文庫(kù)可包含在生物群體中和/或具體由生物群體表達(dá),從而建立一系列生物體,其中個(gè)體生物包括至少一種文庫(kù)成員。
[0077]根據(jù)本發(fā)明的具體方面,進(jìn)一步提供包括來(lái)自此類文庫(kù)的基因變體的生物體,例如選自一系列生物體的生物體。根據(jù)本發(fā)明提供的生物體可用于在適合的表達(dá)體系,例如生產(chǎn)宿主細(xì)胞中表達(dá)基因表達(dá)產(chǎn)物。
[0078]根據(jù)本發(fā)明的方法優(yōu)選進(jìn)一步提供用于從根據(jù)本發(fā)明的文庫(kù)例如通過(guò)功能分析選擇天然芳族小分子的變體。
[0079]優(yōu)選進(jìn)一步例如通過(guò)確定所述變體的結(jié)構(gòu)和功能來(lái)表征變體。
[0080]在具體實(shí)施方案中,所述方法進(jìn)一步包括在重組宿主中生產(chǎn)所述變體。
[0081]在另一具體實(shí)施方案中,所述方法進(jìn)一步包括合成生產(chǎn)所述變體。
【專利附圖】
【附圖說(shuō)明】[0082]圖1:非減數(shù)分裂體內(nèi)重組
[0083]重組同源基因A和B (小于99.5%的同源性)。由于標(biāo)記序列和側(cè)翼靶序列不同源,重組/組裝僅發(fā)生在基因A和B之間。結(jié)果,雜合/嵌合DNA包含重組基因A和B、兩種標(biāo)記和兩種側(cè)翼靶序列?;蚯逗象w整合至靶染色體的靶基因座內(nèi)。已整合整個(gè)構(gòu)建體的克隆在對(duì)兩種標(biāo)記具有選擇性的適當(dāng)培養(yǎng)基上生長(zhǎng)。
[0084]T5’和T3’對(duì)應(yīng)于酵母基因組上的靶序列(小于99.5%的同源性)(約400bp),引起在染色體位點(diǎn)上的同源整合。Ml和M2為雙重選擇的側(cè)翼標(biāo)記。基因A和基因B是具有給定同源度(degree of homology)(小于99.5%)的相關(guān)的部分同源形式。重疊序列對(duì)應(yīng)于兩種基因的整個(gè)0RF。在MMR缺陷型酵母轉(zhuǎn)化株中通過(guò)部分同源重組組裝后,雙重選擇允許重組體的分離。
[0085]圖2:通過(guò)部分同源重組的DNA的重組和組裝
[0086]該圖示出具體實(shí)施方案的示意性描述,其中用至少兩種基因(此處DNA片段A和B)共轉(zhuǎn)化細(xì)胞,在其80bp的重疊部分上具有小于99.5%的同源性。各DNA片段的側(cè)翼為一個(gè)選擇標(biāo)記。
[0087]片段A包含對(duì)應(yīng)于染色體上5’端正確整合位點(diǎn)的側(cè)翼靶序列和與片段B重疊的雜交區(qū),片段B包含對(duì)應(yīng)于3’整合位點(diǎn)的側(cè)翼靶序列和與片段A重疊的雜交區(qū)。用所得片段轉(zhuǎn)化錯(cuò)配缺陷型酵母細(xì)胞。所得轉(zhuǎn)化株涂在對(duì)兩種標(biāo)記具有選擇性的培養(yǎng)基上。分離可選擇兩種標(biāo)記的克隆,重組/整合簇的完整性以及基因A和B的ORF的重構(gòu)由所選重組體的基因組DNA的分子分析證實(shí)。
[0088]T5’和T3’對(duì)應(yīng)于酵母基因組上的靶序列(小于99.5%的同源性)(約400bp),引起在染色體位點(diǎn)上的同源重組。Ml和M2為雙重選擇的側(cè)翼標(biāo)記。DNA片段A和B可組裝至一個(gè)基因(可為可追蹤的,如GFP),或可表示通過(guò)該方法組裝的兩種基因。所有基因的重疊序列具有小于99.5%的同 源性(120bp),允許組裝后通過(guò)部分同源重組的ORF的重構(gòu)。雙重選擇允許重組體分離并用作組裝的初步證實(shí)。
[0089]圖3:基因A、B和C的重組和組裝
[0090]該圖示出另外的基因C的共轉(zhuǎn)化,基因C具有與基因A和/或B的側(cè)翼序列雜交從而獲得所述基因C與基因A和B的組裝的序列。
[0091]T5’和T3’對(duì)應(yīng)于酵母基因組上的靶序列(小于99.5%的同源性)(約400bp),引起染色體位點(diǎn)上的同源重組。Ml和M2為雙重選擇的側(cè)翼標(biāo)記?;駻、基因B和基因C為具有給定的同源度(小于99.5%)的相關(guān)的部分同源形式。重疊序列對(duì)應(yīng)于基因的5’部分和3’部分?;駼連接側(cè)翼片段,新的ORF ABC通過(guò)序列相似性重建。在MMR缺陷型酵母轉(zhuǎn)化株中通過(guò)部分同源重組組裝后,雙重選擇允許重組體的分離。
[0092]圖4:通過(guò)包含部分同源基因序列的片段的類黃酮途徑的組裝
[0093]該圖示出8個(gè)片段的共轉(zhuǎn)化,所述8個(gè)片段包括用于從苯丙氨酸開始生產(chǎn)類黃酮的8個(gè)基因。各片段僅在各親本基因(部分同源或同源序列)的整個(gè)ORF區(qū)中雜交和重組。由此,整個(gè)途徑在DNA缺陷修復(fù)型酵母細(xì)胞中重組,然后整合至染色體中。
[0094]Tg5’和Tg3’對(duì)應(yīng)于酵母基因組上的靶序列(小于99.5%的同源性)(約400bp),引發(fā)向期望的染色體位點(diǎn)的同源整合。URA3和HPH(潮霉素抗性)為能夠雙重選擇重組途徑的側(cè)翼標(biāo)記?;駽H1、F3H、PAL、CHS、C4H、FLS和4CL為具給定的同源度(小于99.5%)的相關(guān)的部分同源形式。各基因具有允許它們?cè)诮湍讣?xì)胞中表達(dá)的一個(gè)啟動(dòng)子和一個(gè)終止子序列。重疊序列對(duì)應(yīng)于基因的整個(gè)ORF。在MMR缺陷型酵母轉(zhuǎn)化株中通過(guò)部分同源重組組裝片段后,功能重組的完整途徑重建,并且雙重選擇允許重組體的分離。
[0095]各基因的植物來(lái)源用三個(gè)字母后接基因名來(lái)表示,也以三個(gè)字母示出。對(duì)應(yīng)的植物物種在左側(cè)表示?;虻牟糠滞葱问街g的序列同一性以百分比表示。在一些片段旁的符號(hào)*表示這些還用于同源整合,意指重疊片段的基因序列為100%—致(野生型對(duì)照,克隆H3)。
[0096]圖5:新的重組類黃酮途徑的結(jié)構(gòu)和用于擴(kuò)增各組裝片段的引物
[0097]該圖示出在如圖4所述用合成DNA片段轉(zhuǎn)化后DNA修復(fù)缺陷型酵母細(xì)胞中整合的類黃酮途徑的最終體內(nèi)重組結(jié)構(gòu)?;疑^(第一個(gè)和最后的箭頭)對(duì)應(yīng)于選擇標(biāo)記,黑色箭頭表示類黃酮途徑的具體基因,白色框表示各基因內(nèi)的啟動(dòng)子和終止子序列(詳情參見(jiàn)圖4)。該圖還列出用于擴(kuò)增圖4中示出的各片段的引物。對(duì)于引物詳情和功能參見(jiàn)表6。
[0098]圖6:用于證實(shí)途徑組裝和擴(kuò)增測(cè)序用重組基因的引物
[0099]如圖5所示,該圖示出用于證實(shí)酵母菌中整合后片段組裝并用于擴(kuò)增用于測(cè)序分析的重組基因的引物。對(duì)于引物詳情和功能參見(jiàn)表7。
[0100]圖7:由克隆Ml獲得的重組途徑的嵌合序列
[0101]7A:該圖示出由包含類黃酮途徑的表達(dá)盒的片段在酵母中組裝和整合獲得的7個(gè)重組基因的嵌合結(jié)構(gòu)。從選擇的克隆中提取基因組,并將特定引物用于擴(kuò)增重組類黃酮基因。白色框?qū)?yīng)于來(lái)自親本基因`A的序列(即PA=CHI基因,來(lái)自大豆(Glycine max),還存在于H3 [野生型對(duì)照]克隆中)。黑色框?qū)?yīng)于來(lái)自基因B的序列(即PB=CHI基因,來(lái)自菊花屬(Chrysanthemum sp.)物種)。Ml克隆中存在超過(guò)I個(gè)核苷酸的交換說(shuō)明了作為組裝的結(jié)果的親本基因之間的交叉事件(詳情參見(jiàn)圖14的序列)。7B:所用各親本基因的基因名稱和植物來(lái)源的參考。
[0102]圖8:來(lái)自包含類黃酮途徑的重組克隆的酵母上清液的抑菌效果
[0103]該圖示出表達(dá)類黃酮基因的酵母培養(yǎng)上清液對(duì)大腸桿菌培養(yǎng)細(xì)胞的抑制效果。將1/10體積的包含重組類黃酮途徑的克隆的誘導(dǎo)上清液添加至9/10體積的接種有大腸桿菌T0P10細(xì)胞的LB中,0D600為0.05。在幾個(gè)時(shí)間點(diǎn),測(cè)量0D,并將所得值與不表達(dá)類黃酮基因的相應(yīng)對(duì)照相比較。當(dāng)添加克隆H3、M1、M7和M8的上清液時(shí)觀察到對(duì)大腸桿菌生長(zhǎng)的強(qiáng)抑制效果。沒(méi)有觀察到克隆M3和M4,以及陰性對(duì)照克隆Y26或僅使用酵母培養(yǎng)基的顯著效果。
[0104]圖9:酵母培養(yǎng)上清液中在類黃酮存在下的DPH粹滅(quenching)
[0105]該圖示出由表達(dá)重組類黃酮途徑的克隆產(chǎn)生的化合物如在類黃酮情況下所公知的能夠猝滅DPH。用乙酸乙酯提取包含重組類黃酮途徑的克隆的酵母培養(yǎng)誘導(dǎo)上清液并凍干。以1/10初始體積的70%乙醇回收顆粒。將9 ill各樣品添加至I U 10.1mM的DPH(DMS0中)中并混合。然后,將I加樣在Hybond-C膜上并在紫外透射儀(UV-transi Iuminator)上觀察樣品的猝滅(插圖(inset)A)。程序Image-J用于測(cè)量斑點(diǎn)的信號(hào)強(qiáng)度。將值標(biāo)準(zhǔn)化(normalized)為利用僅由培養(yǎng)基制備的提取物所獲得的信號(hào)(未猝滅)。柚皮素(Naringenin) (I u M)用作最大猝滅的對(duì)照。H3、Ml、M4和M7克隆揭示了猝滅值較高,而克隆M2、M3和Y26 (陰性對(duì)照)觀察到弱的效果或無(wú)效果。
[0106]圖10:基因和蛋白質(zhì)嵌合體OXAl 1/0XA7 (SEQ ID N0sl-14)的序列
[0107]0XA7來(lái)源的核苷酸序列加粗和下劃線,突變的核苷酸序列加粗斜體。
[0108]通過(guò)雙重選擇分離克隆,DNA用于擴(kuò)增和測(cè)序。僅使用清楚可讀的雙鏈序列。用類Clustal程序比對(duì)所得色譜圖。
[0109]圖11:基因和蛋白質(zhì)嵌合體OXAl 1/0XA5 (SEQ ID N0sl5_38)的序列
[0110]0XA5來(lái)源的核苷酸序列加粗和下劃線,突變的核苷酸序列加粗斜體。
[0111]通過(guò)雙重選擇分離克隆,DNA用于擴(kuò)增和測(cè)序。僅使用清楚可讀的雙鏈序列。用類Clustal程序比對(duì)所得色譜圖。
[0112]圖12:親本基因 OXAl I (綠膿桿菌(P.aeruginosa),G1: 296549,SEQ ID39)、0XA7(大腸桿菌,G1:516188, SEQ ID40)和 0XA5 (綠膿桿菌,G1: 48856,SEQ ID41)的序列
[0113]圖13:包括復(fù)合嵌合基因的克隆的序列,對(duì)應(yīng)于部分同源組裝0XA11/0XA5/0XA7
[0114]序列克隆和相應(yīng)蛋白質(zhì)退火的結(jié)果:圖13a)0UL3-05-1I(SEQ ID N0s42and43),圖13b)0UL3-05-1II(SEQ ID N0s44 和 45),圖 13c) 0UL3-05-1V (SEQ ID N0s46 和 47),圖 13d)0UL3-05-1X(SEQ ID N0s48和 49),和圖 13e) 0XA11/0XA5/0XA7 的 0UL3-05-X(SEQ ID N0s50和 51)。
[0115]0XA5的核苷酸序列加粗,對(duì)應(yīng)于0XA7`的核苷酸序列加下劃線。未加粗、非下劃線的序列對(duì)應(yīng)于OXAlI。
[0116]圖14:實(shí)施例3的重組克隆的序列
[0117]序列克隆和結(jié)果提供為SEQ ID No:52-58。
[0118]圖15:重組克隆Ml的誘導(dǎo)嵌合體C4H酶與對(duì)照克隆H3相比能夠積累更高量的對(duì)
香豆酸
[0119]該圖示出,在部分誘導(dǎo)條件下,并通過(guò)想培養(yǎng)基添加肉桂酸,克隆Ml (嵌合類黃酮途徑)的上清液與對(duì)照(無(wú)嵌合體)H3克隆相比包含兩倍以上的對(duì)香豆酸。
[0120]培養(yǎng)物在蔗糖的存在下生長(zhǎng),從而在無(wú)外源苯丙氨酸和甲硫氨酸下表達(dá)PAL活性,進(jìn)而誘導(dǎo)C4H表達(dá)。通過(guò)向培養(yǎng)基添加150 μ M的前體來(lái)進(jìn)行肉桂酸酯供給。在不同時(shí)間取等份培養(yǎng)物,并通過(guò)片化(pelleting)細(xì)胞獲得上清液。在SPE柱上提取上清液,并通過(guò)使用C18HPLC柱和如(4)所記載的丙腈/水梯度的標(biāo)準(zhǔn)操作手冊(cè)分離甲醇提取物。用標(biāo)準(zhǔn)分子預(yù)先校準(zhǔn)的使用峰下面積計(jì)算上清液中對(duì)香豆酸和肉桂酸的摩爾濃度。將值標(biāo)準(zhǔn)化為培養(yǎng)物中的細(xì)胞數(shù)。對(duì)香豆酸的生產(chǎn)如連續(xù)的黑線所示。H3對(duì)照克隆對(duì)應(yīng)于黑色方形,嵌合體Ml克隆對(duì)應(yīng)于黑色菱形。淺灰色線示出供給前體肉桂酸酯的消耗。
[0121]圖16:在用柚皮素-查爾酮供給期間在對(duì)照(無(wú)嵌合體)和Ml (嵌合體)克隆的上清液中的中間體和最終的類黃酮產(chǎn)物的不同產(chǎn)量
[0122]該圖示出,當(dāng)完全誘導(dǎo)的培養(yǎng)物供給有150 μ M柚皮素-查爾酮(NAR)時(shí),Ml (黑色方形)上清液中對(duì)香豆酸的量比Η3(黑色菱形,插圖Α)高5倍。陰性對(duì)照值用灰色三角形標(biāo)識(shí)。在SPE柱中提取上清液,并通過(guò)使用C18HPLC柱和如(4)所記載的丙腈/水梯度的標(biāo)準(zhǔn)操作手冊(cè)分離甲醇提取物。12小時(shí)時(shí)肉桂酸酯的產(chǎn)生和消耗(插圖B)與12小時(shí)時(shí)二氫堪非醇(dihydrokaempferol)的產(chǎn)生(插圖C)相關(guān),這最后肯定源自供給分子柚皮素。最終的類黃酮產(chǎn)物堪非醇緊隨其后(18小時(shí),插圖D)。Ml克隆產(chǎn)生的堪非醇的量比對(duì)照H3少3倍,然而嵌合體克隆比對(duì)照H3消耗更多的前體。這些差異表明重組發(fā)生的嵌合性導(dǎo)致最終和中間產(chǎn)物的生產(chǎn)改善,并示出在相同的培養(yǎng)和供給條件下重組途徑的前體和/或中間體的利用表現(xiàn)不同。
【具體實(shí)施方式】
[0123]因此,本發(fā)明涉及天然芳族小分子的變體的酶促進(jìn)化,其首次可通過(guò)新的和高效方法用于體內(nèi)重組部分同源DNA序列,即相似但不相同的序列。下文中術(shù)語(yǔ)同源重組(在重組部分同源序列時(shí)有時(shí)稱為部分同源重組)是指具有一定同源性的序列重組,其可以相同或可以不相同。不像依靠位點(diǎn)特異性消化和連接的常規(guī)克隆方法,同源重組比對(duì)互補(bǔ)序列并能夠在片段之間交換。重組嵌合基因,也稱為雜合基因,通過(guò)具有錯(cuò)配堿基的序列雜交在細(xì)胞中產(chǎn)生。通過(guò)這樣的創(chuàng)造性突變形成方法,可容易以時(shí)間有效的方式建立適用于選擇和設(shè)計(jì)感興趣多肽的多樣性。
[0124]具體地,本發(fā)明通過(guò)體內(nèi)重組的功能體系,在單個(gè)步驟過(guò)程中采用不同基因的有效重組和嵌合體形成、多樣化和組裝。
[0125]術(shù)語(yǔ)“單個(gè)步驟過(guò)程”是指工程化重組的幾個(gè)工序,如用基因轉(zhuǎn)化細(xì)胞、基因重組、嵌合基因的重組和基因整合至靶基因組中,典型地在一個(gè)方法步驟中進(jìn)行。因此,將會(huì)不需要在體內(nèi)重組之前的體外重組DNA載體,或任何工序的重復(fù)循環(huán),包括采用減數(shù)分裂的那些。有利地,可避免減數(shù)分裂酵母細(xì)胞的使用。
[0126]根據(jù)本發(fā)明的單個(gè)步驟過(guò)程可甚至包括由宿主在同一時(shí)間表達(dá)此類設(shè)計(jì)重組體。從而沒(méi)有必要進(jìn)一步操作來(lái)獲得表達(dá)產(chǎn)物。
[0127]根據(jù)本發(fā)明的術(shù)語(yǔ)“基因嵌合體”是指至少兩種不同基因與至少一個(gè)交叉事件的組合。具體地,此類交叉提供DNA序列的組合或混合。基因嵌合體可通過(guò)(多個(gè))基因的基因內(nèi)混合、基因內(nèi)基因嵌合和/或基因組裝來(lái)建立,基因組裝理解為連接基因,例如至少兩種線性基因或其部分頭尾連接,從而獲得例如在重疊部分的具有基因間交叉的基因組裝,和可選地通過(guò)重疊串在一起的復(fù)合基因,進(jìn)一步可選地具有基因內(nèi)和基因間(多個(gè))交叉兩者的基因或(多個(gè))基因嵌合體的組裝。
[0128]術(shù)語(yǔ)“交叉”是指在兩條DNA鏈可交換遺傳信息的位點(diǎn)處基因(即至少一個(gè)核苷酸)之間的重組。交叉過(guò)程導(dǎo)致后代嵌合基因具有來(lái)自親本基因的基因或序列的不同組
口 o
[0129]任選地,可提供不基于交叉的其它修復(fù)機(jī)制,例如包括鏈連接后的識(shí)別錯(cuò)誤核苷酸、刪除和/或置換的核苷酸切除修復(fù)或非同源端連接機(jī)制。
[0130]術(shù)語(yǔ)“側(cè)翼靶序列”是指核苷酸序列與感興趣的靶標(biāo)互補(bǔ)的區(qū)域,例如基因組靶整合位點(diǎn),包括基因A和/或待重組的其它基因、線性多核苷酸以及線性或環(huán)狀質(zhì)粒YAC等的位點(diǎn)。由于具體的互補(bǔ)或同源度,側(cè)翼靶序列可與基因雜交并將基因整合至靶整合位點(diǎn)。
[0131]術(shù)語(yǔ)細(xì)胞的“基因組”是指全部生物體遺傳信息,由基因和DNA的非編碼序列,或?yàn)槿旧w或?yàn)榉侨旧w遺傳因子表示,例如諸如包括基因A和/或待重組的其它基因等的線性多核苷酸、病毒、自我復(fù)制媒介(carriers)和載體(vectors)、質(zhì)粒和包括人工染色體等的轉(zhuǎn)座子。人工染色體為線性或環(huán)狀DNA分子,包含引入細(xì)胞時(shí)穩(wěn)定保持所必需的所有序列,它們表現(xiàn)得類似于天然染色體,因而被認(rèn)為是基因組的一部分。[0132]術(shù)語(yǔ)“同源性”表示兩種以上的核苷酸序列在相應(yīng)位置具有(達(dá)到一定程度的,高達(dá)100%的)相同或保守堿基對(duì)。對(duì)于如本文公開的全長(zhǎng)天然DNA序列或DNA序列的片段,同源序列,也被稱為互補(bǔ)的、相應(yīng)的或匹配的序列,如根據(jù)本發(fā)明所使用的優(yōu)選與同源配對(duì)序列雜交,例如與相應(yīng)的互補(bǔ)序列具有至少30%序列同一性,但小于99.5%序列同一性,可能小于95%、小于90%、小于85%或小于80%。優(yōu)選地,同源序列將具有至少約30%的核苷酸序列同一性,優(yōu)選至少約40%同一性,更優(yōu)選至少約50%同一性,更優(yōu)選至少約60%同一性,更優(yōu)選至少約70%同一'丨生,更優(yōu)選至少約80%同一'丨生,更優(yōu)選至少約90%同一'丨生,更優(yōu)選至少約95%同一性。如上所不限制上下限的優(yōu)選范圍為在30%至99.5%的相應(yīng)序列同一性的范圍內(nèi)。如本文所示用的,同一度(degree of identity)通常還是指互補(bǔ)序列。
[0133]相對(duì)于基因的核苷酸序列的〃百分比(%)同一性〃定義為與DNA序列中的核苷酸同一的候選DNA序列中的核苷酸的百分比,在比對(duì)序列并引入間隙(gap)后,如有必要的話,獲得最大百分序列同一性,并且不考慮任何保守替換作為序列同一性的一部分。為了確定百分比核苷酸序列同一性的比對(duì)可以以本領(lǐng)域技術(shù)中的各種方式,例如使用公開的計(jì)算機(jī)軟件來(lái)實(shí)現(xiàn)。本領(lǐng)域技術(shù)人員可確定適當(dāng)?shù)膮?shù)用于測(cè)量比對(duì),包括任何所需算法來(lái)實(shí)現(xiàn)要比較的序列的全長(zhǎng)上的最大比對(duì)。
[0134]術(shù)語(yǔ)“錨定”意指基因或基因嵌合體與整合序列通過(guò)稱為“錨定序列”的片段利用部分或完全序列同源性來(lái)結(jié)合,從而使此類基因或基因嵌合體能夠整合至基因組的整合位點(diǎn)中。具體地,錨定序列可為與基因組的整合位點(diǎn)同源或部分同源的側(cè)翼靶區(qū)域。優(yōu)選的錨定序列具有優(yōu)選與靶整合位點(diǎn)的至少約70%的序列同源性,更優(yōu)選與基因組的雜交部分至少80%、90%、95%、多至99.5%或完全匹配。
[0135]整合位點(diǎn)可適當(dāng)?shù)貫樗拗骰蚪M上的確定的基因座,此處會(huì)發(fā)生高頻重組事件。優(yōu)選的基因座為,例如釀酒酵母的III號(hào)染色體上的BUD31-HCM1基因座。通常,優(yōu)選顯示高頻重組但沒(méi)有細(xì)胞生存 能力變化的酵母染色體上的任何其它基因座。
[0136]術(shù)語(yǔ)〃表達(dá)”或“表達(dá)體系〃或“表達(dá)盒”是指包含可操作地連接的期望的編碼序列和調(diào)控序列的核酸分子,以便轉(zhuǎn)化或轉(zhuǎn)染有這些序列的宿主能夠產(chǎn)生編碼蛋白。為了影響轉(zhuǎn)化,表達(dá)體系可包括在載體中;然而,相關(guān)DNA也可整合至宿主染色體中。
[0137]術(shù)語(yǔ)“基因”還應(yīng)包括基因的DNA片段,特別是那些部分基因。片段還包含幾個(gè)開放閱讀框,為相同ORF或不同ORF的重復(fù)。該術(shù)語(yǔ)應(yīng)具體包括核苷酸序列,其全部或部分為非編碼多肽如未轉(zhuǎn)錄或未翻譯序列,或編碼多肽。
[0138]根據(jù)本發(fā)明使用的術(shù)語(yǔ)“基因A”應(yīng)意指編碼感興趣的非編碼序列或一個(gè)或多個(gè)多肽的任何核苷酸序列。基因A的特征在于,存在于基因構(gòu)建體例如表達(dá)盒、線性多核苷酸、質(zhì)粒或載體的框架中,其優(yōu)選至少包括標(biāo)記序列并在基因A或基因構(gòu)建體的5’端或3’端具有單側(cè)翼靶序列。在根據(jù)本發(fā)明的方法中,基因A典型地為用于基因嵌合體形成的一系列基因中的第一個(gè)基因?;駻與待重組的另一基因同源,待重組的另一基因根據(jù)具體情況最終為基因A的變體,或基因B、C、D、E、F、G、H等任一個(gè)。從而,出于最大保真目的,典型地每個(gè)基因A僅提供一個(gè)側(cè)翼靶序列?;駻的變體稱為基因A1、A2、A3等,其具有一定程度的序列同源性,和可選地類似的功能特性。術(shù)語(yǔ)“至少一種基因A”應(yīng)意指至少基因A和可選地基因A的變體。
[0139]根據(jù)本發(fā)明使用的術(shù)語(yǔ)“基因B”應(yīng)意指感興趣的非編碼序列或一個(gè)或多個(gè)多肽,其選擇為與待重組的另一基因用于基因嵌合體形成,待重組的另一基因根據(jù)具體情況最終為基因A,基因B的變體,或基因C、D、E、F、G、H等任一個(gè)?;駼與基因A或其它基因一定程度上同源,從而使得能夠與基因A或待重組的其它基因嵌合體形成。在根據(jù)本發(fā)明的方法中,基因B典型地為用于基因嵌合體形成的一系列基因中的最后一個(gè)基因?;駼可為細(xì)胞基因組的整合部分,或存在于基因構(gòu)建體例如表達(dá)盒、線性多核苷酸、質(zhì)?;蜉d體的框架中,其優(yōu)選至少包括標(biāo)記序列并在基因B或基因構(gòu)建體的5’端或3’端具有單側(cè)翼靶序列,作為基因A的側(cè)翼靶序列的配對(duì)物,意指在基因的另一端。如果基因A的側(cè)翼靶序列在基因A的5’端,則基因B將典型地在3’端具有其側(cè)翼靶序列,反之亦然。從而,出于最大保真目的,典型地每個(gè)基因B僅提供一個(gè)側(cè)翼靶序列?;駼可為基因A的變體。基因B的變體稱為基因B1、B2、B3等,其具有一定程度的序列同源性,和可選地類似的功能特性。術(shù)語(yǔ)“至少一種基因B”應(yīng)意指至少基因B和可選地基因B的變體。
[0140]根據(jù)本發(fā)明使用的術(shù)語(yǔ)“基因C”應(yīng)意指編碼感興趣的非編碼序列或一個(gè)或多個(gè)多肽的任何核苷酸序列?;駽的特征在于,存在于基因構(gòu)建體例如表達(dá)盒、線性多核苷酸、質(zhì)?;蜉d體的框架中,其可選地包括標(biāo)記序列,并且進(jìn)一步的特征在于其核苷酸序列的片段根據(jù)具體情況與基因A和/或基因B,基因C的變體或最終的其它基因D、E、F、G、H等同源?;駽優(yōu)選具有在基因C的5’端或3’端的單側(cè)翼靶序列或在兩側(cè)的側(cè)翼靶序列。從而,基因C可與基因A和/或待重組的其它基因部分或完全雜交,連接和組裝基因。在根據(jù)本發(fā)明的方法中,基因C典型地為用于基因嵌合體形成的一系列待重組基因中的在基因A后的第二個(gè)基因?;駽的變體稱為C1、C2、C3等,其具有一定程度的序列同源性,和可選地類似的功能特性。
[0141]另外的基因D可任選地通過(guò)與基因C的序列同源的其核苷酸序列或其核苷酸序列的片段的雜交來(lái)重組和組裝,基因D的變體或最終的其它基因A、B、E、F、G、H等根據(jù)具體情況提供各自的重組和連接?;駾優(yōu)選具有在基因D的5’端或3’端的單側(cè)翼靶序列或在兩側(cè)的側(cè)翼靶序列。在根據(jù)本發(fā)明的方法中,基因D典型地為用于基因嵌合體形成的一系列待重組基因中的在基因C之后的下Iv基因?;駾的變體稱為Dl、D2、D3等,其具有一定程度的序列同源性,和可選`地類似的功能特性。
[0142]另外的基因E可任選地通過(guò)與基因D的序列同源的其核苷酸序列的片段的雜交來(lái)重組和組裝,基因E的變體或最終的其它基因A、B、C、F、G、H等根據(jù)具體情況提供各自的重組和連接。基因E優(yōu)選具有在基因E的5’端或3’端的單側(cè)翼靶序列或在兩側(cè)的側(cè)翼靶序列。在根據(jù)本發(fā)明的方法中,基因E典型地為用于基因嵌合體形成的一系列待重組基因中的在基因D之后的下一個(gè)基因。基因E的變體稱為E1、E2、E3等,其具有一定程度的序列同源性,和可選地類似的功能特性。
[0143]另外的基因F、G、H等可相應(yīng)地使用。這些系列的另外的基因不理解為受英文字母數(shù)的限制。最終的感興趣的基因鏈將通過(guò)連接基因A和B獲得,從而在基因組的整合位點(diǎn)獲得基因組裝。如此組裝的感興趣的基因可以可操作地連接以分別支持相應(yīng)的感興趣多肽和代謝物的表達(dá)。具體的組裝方法采用通過(guò)體內(nèi)重組的盒的組合,從而組裝甚至大量DNA片段,從而獲得實(shí)質(zhì)大小的期望的DNA分子。表示重疊序列的盒適合旨在覆蓋整個(gè)期望序列。在一個(gè)實(shí)施方案中,優(yōu)選的重疊為至少約5bp、優(yōu)選至少約10bp。在其他實(shí)施方案中,重疊可為至少15、優(yōu)選至少20多至1,OOObp。[0144]在一個(gè)優(yōu)選的實(shí)施方案中,一些盒旨在包含允許鑒定的標(biāo)記序列。典型地,標(biāo)記序列位于耐性轉(zhuǎn)座子插入位點(diǎn),從而最小化對(duì)最終期望的核酸序列的生物效應(yīng)。
[0145]在具體實(shí)施方案中,宿主細(xì)胞能夠通過(guò)與所述基因或片段的混合物共轉(zhuǎn)化,并培養(yǎng)其中轉(zhuǎn)移了重組或組裝序列的所述宿主,在宿主細(xì)胞中重組或組裝甚至大量的具有重疊序列的核酸的基因或DNA片段,例如至少2個(gè),優(yōu)選至少3、4、5、6、7、8、9個(gè),更優(yōu)選至少10個(gè)基因或核酸片段。
[0146]根據(jù)本發(fā)明使用的基因或DNA片段,作為整個(gè)基因或部分,可為雙鏈或單鏈。雙鏈核酸序列通常為300-20,000個(gè)堿基對(duì),單鏈片段通常較短并可在40-10,000個(gè)核苷酸的范圍內(nèi)。例如,差不多2Mb多達(dá)500Mb的組裝體(assemblies)可在酵母中組裝。
[0147]來(lái)自大量生物體的基因組序列是公開的,并可經(jīng)根據(jù)本發(fā)明的方法來(lái)使用。這些基因組序列優(yōu)選包括從不同宿主細(xì)胞株或不同物種獲得的信息,從而提供具有特定多樣性的同源序列。
[0148]用作重組底物的起始基因通常為包括基因變體形式的多核苷酸的集合。變體形式顯示彼此的實(shí)質(zhì)的序列同一性,從而允許底物之間的同源重組。多核苷酸之間的多樣性可為天然的,例如等位基因或例如易錯(cuò)PCR或易錯(cuò)遞歸序列(recursive sequence)重組誘導(dǎo)的物種變體,或者為體 外重組的結(jié)果。多樣性還可由利用替代的密碼子選擇(codon usage)來(lái)再合成編碼天然蛋白的基因所造成。底物之間應(yīng)有至少足夠的多樣性,以使重組可產(chǎn)生比起始原料更多樣化的產(chǎn)物。必須存在在至少一個(gè)以上的位置處不同的至少兩種底物。多樣性程度依賴于重組底物的長(zhǎng)度和待進(jìn)化的功能改變的程度。多達(dá)69%的位置的多樣性是典型的。
[0149]根據(jù)本發(fā)明,優(yōu)選基因A、B、C和其它基因至少在設(shè)計(jì)為雜交的片段處,例如在重疊部分處共享至少30%的同源性,以便在重疊處獲得至少一個(gè)交叉和可選地將包括全長(zhǎng)基因的基因組裝。有限的同源性百分比為至少40%,更優(yōu)選至少50%,更優(yōu)選至少60%,更優(yōu)選至少70%,更優(yōu)選至少80%,更優(yōu)選至少90%,甚至更優(yōu)選至少95%,多達(dá)小于99.5%。
[0150]還可期望簡(jiǎn)單地組裝,例如串起來(lái)并可選地混合這些基因和基因變體,根據(jù)該方法使更大的基因如個(gè)體代謝途徑的成員多樣化,或者代謝途徑的組裝多重性。不是天然存在的代謝途徑可以以該方式構(gòu)建。因此,酶,存在于一個(gè)生物體中對(duì)由缺乏此類下游酶的不同生物體產(chǎn)生的期望底物起作用,可借助構(gòu)建基因或部分基因的組裝而在同一生物體中編碼,從而獲得重組酶??捎纱税ǘ喾N酶來(lái)構(gòu)建復(fù)合代謝途徑。如果一組多肽或部分多肽應(yīng)根據(jù)它們的生物化學(xué)功能在途徑內(nèi)排列,則是有利的。典型的感興趣的基因途徑為編碼用于工業(yè)感興趣的次級(jí)代謝產(chǎn)物如類黃酮、大環(huán)內(nèi)酯、聚酮化合物(polyketides)等的合成的酶。
[0151]另外,組合文庫(kù)可通過(guò)混合片段來(lái)制備,其中一個(gè)以上的片段提供有編碼酶或其它蛋白質(zhì)的相同的雜交序列,但不同的插入序列。
[0152]遺傳途徑可以組合形式構(gòu)建,以便組合文庫(kù)中的各成員具有不同的基因變體的組合。例如,變體的組合文庫(kù)可由個(gè)體DNA元件構(gòu)建,其中不同的片段被重組和組裝,并且其中不同片段的每一個(gè)具有幾個(gè)變體。代謝途徑的重組和組裝可以不需要標(biāo)記序列的存在來(lái)證明設(shè)計(jì)成功。代謝物以期望方式的表達(dá)對(duì)工作例已經(jīng)會(huì)是指示性的。成功的代謝途徑的重組和組裝可例如由次級(jí)代謝產(chǎn)物在細(xì)胞培養(yǎng)基中的檢測(cè)來(lái)確定。[0153]原核和真核宿主細(xì)胞二者預(yù)期供所公開的方法使用,包括細(xì)菌宿主細(xì)胞如大腸桿菌或芽孢桿菌屬(Bacillus sp),酵母宿主細(xì)胞如釀酒酵母,昆蟲宿主細(xì)胞如草地貪夜蛾(Spodooptera frugiperda),或人宿主細(xì)胞如 HeLa 和 Jurkat。
[0154]優(yōu)選的宿主細(xì)胞為單倍體細(xì)胞,如假絲酵母屬(Candida sp)、畢赤酵母屬(Pichiasp)和酵母屬(Saccharomyces sp)。
[0155]本發(fā)明的方法不會(huì)使用生殖周期或減數(shù)分裂重組。DNA片段可轉(zhuǎn)化至單倍體細(xì)胞中。轉(zhuǎn)化子可立即在選擇性平板上劃線培養(yǎng)(streaked out)。然后將通過(guò)PCR或其它手段如缺口修復(fù)(gap repair)來(lái)分離重組體。
[0156]本發(fā)明的方法可在任何野生型或修復(fù)缺陷型原核或真核細(xì)胞(包括具有核算修復(fù)如DNA或RNA修復(fù)的缺陷的那些)中構(gòu)建。在野生型細(xì)胞中,選擇允許部分同源重組的適合的整合位點(diǎn)。在野生型細(xì)胞中進(jìn)行的根據(jù)本發(fā)明的方法優(yōu)選提供基因例如具有至少80%、優(yōu)選至少90%的序列同一性的基因A和B的重組。盡管損傷和錯(cuò)配DNA通常被修復(fù)而使重組被抑制,但出乎意料的結(jié)果是,整合位點(diǎn)的部分同源重組在此類野生型細(xì)胞中也是可以的。
[0157]錯(cuò)配修復(fù)(MMR)體系的突變或修飾將增強(qiáng)細(xì)胞中的重組頻率。任選地,可使用其它修復(fù)缺陷體系,例如DNA修復(fù)基因radUrecQ的完全或暫時(shí)敲除,這可增強(qiáng)重組。
[0158]DNA修復(fù)缺陷型細(xì)胞優(yōu)選用于根據(jù)本發(fā)明的方法。作為實(shí)例,錯(cuò)配修復(fù)可完全或暫時(shí)敲除,或可為有條件的或通過(guò)向細(xì)胞培養(yǎng)基添加具體底物來(lái)誘導(dǎo),其中細(xì)胞在進(jìn)行目標(biāo)重組期間或之后培養(yǎng)。特別地,細(xì)胞的MMR缺陷可通過(guò)瞬時(shí)或永久損害錯(cuò)配修復(fù)的任何策略來(lái)實(shí)現(xiàn),所述策略包括錯(cuò)配修復(fù)中涉及的基因突變,用UV光處理,用化學(xué)品如2-氨基嘌呤處理,錯(cuò)配修復(fù)中涉及的基因例如經(jīng)可控啟動(dòng)子的誘導(dǎo)表達(dá)或抑制,這將允許瞬時(shí)失活或激活。`
[0159]細(xì)菌錯(cuò)配修復(fù)體系已廣泛地研究。在其它體系例如酵母中,已識(shí)別了幾種基因,其產(chǎn)物與釀酒酵母中的細(xì)菌錯(cuò)配修復(fù)蛋`白如MutS蛋白類似物即Mshl、Msh2p、Msh3p、Msh4、Msh5、Msh6p,和 MutL 蛋白即 Mlhlp、Mlh2p、Mlh3p 和 Pmsl 享有同源性。
[0160]優(yōu)選的錯(cuò)配修復(fù)缺陷型細(xì)胞的實(shí)例為具體的酵母細(xì)胞,例如具有缺陷的或(瞬時(shí))失活的MSH2的釀酒酵母菌株,例如設(shè)計(jì)的W303、BY、SKl菌株,如MXY47 (具有破壞的MSH2 的 W303)菌株。
[0161]MMR的進(jìn)一步的優(yōu)選體系為公知的細(xì)菌菌株的選擇,例如US5912119中記載的那些,例如如mutS或mutL型的酶MutHLS錯(cuò)配修復(fù)體系缺陷菌株,其中參與錯(cuò)配識(shí)別的蛋白質(zhì)MutS和MutL缺陷。優(yōu)選的菌株為例如使用F-mutL或重組大腸桿菌Hfr/鼠傷寒沙門氏菌FnutL的鼠傷寒沙門氏菌(S.Typhimurium)的菌株。
[0162]此外,根據(jù)本發(fā)明優(yōu)選使用其它真核錯(cuò)配修復(fù)缺陷型細(xì)胞如HeLa和Jurkat細(xì)胞。
[0163]根據(jù)本發(fā)明的方法主要采用成功的重組產(chǎn)物的標(biāo)記輔助選擇。使用工具如分子標(biāo)記或DNA指紋可繪制(map)感興趣的基因。這允許篩選大量擁有感興趣特性的細(xì)胞。篩選基于是否存在特定基因。
[0164]根據(jù)本發(fā)明使用的術(shù)語(yǔ)“選擇標(biāo)記”是指編碼蛋白質(zhì)的或非編碼的DNA序列,在成功整合時(shí)提供標(biāo)記。具體地,編碼蛋白質(zhì)的標(biāo)記序列選自營(yíng)養(yǎng)標(biāo)記、色素標(biāo)記、抗生素抗性標(biāo)記、抗生素敏感性標(biāo)記、熒光標(biāo)記、敲入標(biāo)記、活化劑/結(jié)合域標(biāo)記和顯隱性標(biāo)記、比色標(biāo)記和編碼酶的不同亞單位的序列(其只有在同一細(xì)胞中表達(dá)兩種以上的亞單位時(shí)起作用)的組。該術(shù)語(yǔ)還應(yīng)指用于直接確定基因嵌合體的可追蹤的待重組基因,而不需要使用單獨(dú)的標(biāo)記序列。
[0165]“營(yíng)養(yǎng)標(biāo)記”為編碼可補(bǔ)償細(xì)胞的營(yíng)養(yǎng)缺陷并因而給予營(yíng)養(yǎng)缺陷型細(xì)胞以原營(yíng)養(yǎng)的基因產(chǎn)物的標(biāo)記序列。根據(jù)本發(fā)明,術(shù)語(yǔ)“營(yíng)養(yǎng)缺陷型”意指細(xì)胞必須在包含營(yíng)養(yǎng)缺陷型細(xì)胞本身不能生產(chǎn)的必需營(yíng)養(yǎng)素的培養(yǎng)基中生長(zhǎng)。營(yíng)養(yǎng)標(biāo)記基因的基因產(chǎn)物促進(jìn)在營(yíng)養(yǎng)缺陷型細(xì)胞中缺失的該必需營(yíng)養(yǎng)素的合成。通過(guò)成功表達(dá)營(yíng)養(yǎng)標(biāo)記基因,不必添加該必需營(yíng)養(yǎng)素至細(xì)胞生長(zhǎng)的培養(yǎng)基。
[0166]優(yōu)選的標(biāo)記序列為URA3、LEU2、CAN1、CYH2、TRP1、ADEl 和 MET5。
[0167]編碼“色素標(biāo)記”的基因編碼色素合成中涉及的基因產(chǎn)物,其表達(dá)時(shí)可染色細(xì)胞。從而,提供了成功表達(dá)色素標(biāo)記的迅速細(xì)胞表型檢測(cè)。
[0168]“抗生素抗性標(biāo)記”為編碼基因產(chǎn)物的基因,其允許細(xì)胞在抗生素的存在下在不表達(dá)所述產(chǎn)物的細(xì)胞不能生長(zhǎng)的濃度下生長(zhǎng)。
[0169]“抗生素敏感性標(biāo)記”為標(biāo)記基因,其中在抗生素的存在下基因產(chǎn)物抑制表達(dá)所述標(biāo)記的細(xì)胞生長(zhǎng)。
[0170]“敲入”標(biāo)記理解為表示敲除細(xì)胞的缺失環(huán)節(jié),因而在成功重組和操作后引起細(xì)胞生長(zhǎng)的核苷酸序列。敲除細(xì)胞為基因工程細(xì)胞,其中已通過(guò)靶向突變關(guān)閉一個(gè)以上的基因。此類缺失基因可適當(dāng)?shù)赜米髑萌霕?biāo)記。
[0171]“熒光標(biāo)記”應(yīng)意指編碼可通過(guò)發(fā)出相應(yīng)的熒光信號(hào)來(lái)檢測(cè)的熒光團(tuán)的核苷酸序列。細(xì)胞可容易通過(guò)流式細(xì)胞儀的公知技術(shù)基于差示熒光標(biāo)記分類。
[0172]用于多樣化或重組的基因可為非編碼序列或編碼多肽的序列或編碼蛋白質(zhì)的序列或其具有足以成功重組事件的 序列長(zhǎng)度的部分或片段。更具體地,所述基因具有3bp的最小長(zhǎng)度,優(yōu)選至少IOObp,更優(yōu)選至少300bp。
[0173]根據(jù)本發(fā)明獲得的優(yōu)選的基因嵌合體為至少3個(gè)、優(yōu)選多至20,000個(gè)堿基對(duì),優(yōu)選的范圍將為300-10,OOObp ;特別優(yōu)選至少500bp或至少1,OOObp的大DNA序列。
[0174]具體優(yōu)選的是下述基因嵌合體,其特征在于每700個(gè)堿基對(duì)有至少3個(gè)交叉事件,優(yōu)選每700個(gè)堿基對(duì)有至少4個(gè)交叉事件,每700個(gè)堿基對(duì)有至少5、6或7個(gè)交叉事件,這包括單核苷酸,至少I個(gè)、優(yōu)選至少2、3、4、5、10、20多至更大的核苷酸序列的片段的交叉。
[0175]根據(jù)本發(fā)明的方法在一個(gè)單重組基因中不僅可獲得奇數(shù)而且還獲得偶數(shù)的重組事件。這對(duì)體內(nèi)重組中的減數(shù)分裂特別有利。
[0176]重組嵌合的復(fù)合模式可通過(guò)本發(fā)明的方法獲得,在一個(gè)單分子中提供大批不同長(zhǎng)度的重組序列塊。此外,可獲得對(duì)應(yīng)于鏈模板之一的核苷酸的類似點(diǎn)的替換(point-likereplacement)作為關(guān)于開放閱讀框的框架的多樣性的重要來(lái)源。嵌合和類似點(diǎn)的交換(point-like exchange)在蛋白質(zhì)水平不必保守。的確,可在重組后產(chǎn)生具有不同極性的新的氨基酸,給予通過(guò)該方法衍生的重組蛋白以新的潛能和酶促蛋白性質(zhì)。
[0177]優(yōu)選地,基因?yàn)榉蔷幋a序列或者編碼治療或工業(yè)用途的酶或蛋白質(zhì)的蛋白質(zhì)編碼序列或其部分片段。在下文中,術(shù)語(yǔ)“多肽”應(yīng)包括具有優(yōu)選至少2個(gè)氨基酸的感興趣的肽,優(yōu)選至少3個(gè)多肽和蛋白質(zhì)。優(yōu)選選擇感興趣的多肽,但不限于酶、轉(zhuǎn)錄因子、轉(zhuǎn)運(yùn)蛋白、信號(hào)肽、受體、激素和生長(zhǎng)因子。由基因嵌合體產(chǎn)生的相應(yīng)的重組變體可引發(fā)和催化新的代謝物的合成。因此,這是第一次能夠通過(guò)支持酶促合成過(guò)程的代謝進(jìn)化來(lái)有效生產(chǎn)大量天然芳族小分子的變體。
[0178]具體地,芳族氨基酸如苯丙氨酸、酪氨酸或/和色氨酸的代謝物例如由植物或酵母通過(guò)酶促活性生產(chǎn)的那些,或任何中間體或衍生物可以以新的方式生產(chǎn)。一系列酶變體由此導(dǎo)致不同的代謝物形成,然后篩選其用于期望的結(jié)構(gòu)和功能。那些天然芳族小分子的變體具有使僅合成的有機(jī)物質(zhì)擁有功能或生物活性的可能性增加的優(yōu)勢(shì)。
[0179]Phe和Tyr密切相關(guān)。它們含有苯環(huán),在酪氨酸中苯環(huán)被另外羥基化。酪氨酸由必需氨基酸苯丙氨酸直接合成。色氨酸含有共軛的吲哚環(huán)。這些代謝關(guān)系引起復(fù)雜的營(yíng)養(yǎng)依賴性。
[0180]在植物中,莽草酸酯合成途徑(shikimate pathway)產(chǎn)生化合物苯丙氨酸用于生物合成苯丙素類。對(duì)羥基肉桂酸酯和由還原酶、氧化酶和轉(zhuǎn)移酶的組合產(chǎn)生的酯限定了器官中代謝物的具體模式,并且依賴于它們的發(fā)育,該屬性是各植物物種的特征。PP途徑的起始的三個(gè)步驟為被PAL、C4H和4CL酶催化,并提供所有隨后分支和所得代謝物如類黃酮、木質(zhì)素、苯丙素類酯、橙酮、異黃酮、芪、前花青素等的基礎(chǔ)。
[0181]例如,PAL已知催化Phe的脫氨基作用以給出肉桂酸,這是苯丙素類途徑的第一步,以及初級(jí)和次級(jí)代謝之間的調(diào)控點(diǎn)。苯丙素類化合物為一系列天然具有許多功能的酚類化合物如木質(zhì)素、類黃酮、異類黃酮、香豆素和芪的前體。
[0182]代謝途徑的產(chǎn)物典型地為天然小分子或其例如在糖基化、?;?、氨基化、羥基化或甲基化等方面不同的具有改進(jìn)的或新的功能的變體。這些代謝物適合作為芳香劑(fragrant)或風(fēng)味劑(flavor)或作為治療分子(例如抗感染藥或用于癌癥治療)。
[0183]本文所使用的術(shù)語(yǔ)“芳族小分子”應(yīng)指具有芳族結(jié)構(gòu)的有機(jī)小分子的范圍,其中一個(gè)以上的CH基可被雜原子如N、0和S替換,包括具有不同類型和數(shù)量的芳環(huán)和各種取代基的復(fù)合結(jié)構(gòu)。`
[0184]可作為代謝物獲得的天然芳族小分子的優(yōu)選實(shí)例為香草醛、香豆酸、阿魏酸、木質(zhì)素、3-苯丙素類、類黃酮、花青素。
[0185]具有新功能性質(zhì)的優(yōu)選實(shí)例為例如乙基香草醛(風(fēng)味劑)、辛基甲氧基肉桂酸酯及其酯類物質(zhì)(遮光劑(sunscreen))、具有增加的抗菌作用的查耳酮衍生物。
[0186]此類代謝物生產(chǎn)的中間體有時(shí)用作風(fēng)味劑或芳香劑或作為食品成分。
[0187]一旦通過(guò)選擇包括基因嵌合體的克隆來(lái)合成代謝物或此類代謝物的中間體,它們典型地通過(guò)適當(dāng)?shù)谋磉_(dá)體系例如通過(guò)微生物或通過(guò)體外合成過(guò)程來(lái)大規(guī)模生產(chǎn)。
[0188]在本發(fā)明的優(yōu)選實(shí)施方案中,在單個(gè)步驟過(guò)程中進(jìn)行嵌合基因的組裝、其與宿主基因組的重組以及進(jìn)一步的嵌合基因的表達(dá)以產(chǎn)生感興趣的重組多肽或所述宿主細(xì)胞的代謝物。
[0189]根據(jù)本發(fā)明,可采用本領(lǐng)域技術(shù)中常規(guī)的分子生物學(xué)、微生物學(xué)和重組DNA技術(shù)。此類技術(shù)在文獻(xiàn)(9)中完整描述。
[0190]對(duì)于體內(nèi)重組,待重組基因與基因組或其它基因使用標(biāo)準(zhǔn)轉(zhuǎn)染技術(shù)用于轉(zhuǎn)染宿主。在適當(dāng)?shù)膶?shí)施方案中,提供復(fù)制起始的DNA包括在構(gòu)建體中。復(fù)制起始可由技術(shù)人員適當(dāng)?shù)剡x擇。根據(jù)基因的性質(zhì),如果序列已經(jīng)與本身可作為復(fù)制起始操作的基因或基因組一起存在,可不需要補(bǔ)充的復(fù)制起始。[0191]合成核酸序列或盒以及亞單位可以以線性多核苷酸,質(zhì)粒,大質(zhì)粒,合成或人工染色體如植物、細(xì)菌、哺乳動(dòng)物或酵母人工染色體的形式生產(chǎn)。
[0192]細(xì)胞可在內(nèi)源或外源DNA已引入細(xì)胞內(nèi)部時(shí)被此類DNA轉(zhuǎn)化。轉(zhuǎn)化DNA可以或不可整合,即共價(jià)連接至細(xì)胞的基因組。在原核生物、酵母和哺乳動(dòng)物細(xì)胞中,例如轉(zhuǎn)化DNA可保持在附加元件如質(zhì)粒上。關(guān)于真核生物細(xì)胞,穩(wěn)定轉(zhuǎn)化的細(xì)胞為其中轉(zhuǎn)化DNA已整合至染色體中以便通過(guò)染色體復(fù)制由子細(xì)胞繼承的細(xì)胞。該穩(wěn)定性通過(guò)真核生物細(xì)胞建立細(xì)胞系的能力或包括含有轉(zhuǎn)化DNA的子細(xì)胞群的克隆來(lái)闡明。
[0193]不同基因底物可并入質(zhì)粒。質(zhì)粒通常是標(biāo)準(zhǔn)的克隆載體,例如細(xì)菌多拷貝質(zhì)粒。底物可并入相同或不同的質(zhì)粒。通常至少兩種具有不同類型的選擇標(biāo)記的不同類型的質(zhì)粒用于允許選擇含有至少兩種類型的載體的細(xì)胞。
[0194]含有不同個(gè)基因底物的質(zhì)粒最初通過(guò)任意方法引入(例如,化學(xué)轉(zhuǎn)化、自然感受態(tài)、電穿孔、基因槍、包裝至噬菌體或病毒體系內(nèi))。通常,質(zhì)粒以飽和濃度存在或接近于飽和濃度(相對(duì)于最大轉(zhuǎn)染能力),從而增加不止一個(gè)質(zhì)粒進(jìn)入同一細(xì)胞的能力。包含各種底物的質(zhì)粒可同時(shí)或多輪轉(zhuǎn)染。例如,在后一種方法中,可用第一份質(zhì)粒轉(zhuǎn)染細(xì)胞,選擇轉(zhuǎn)染子并繁殖,然后用第二份質(zhì)粒轉(zhuǎn)染。優(yōu)選的質(zhì)粒為,例如pUC和pBluscribe衍生物如pMXY9、PMXY12 和 pMIX-LAM 或 YAC 衍生物如 YCp50。 [0195]進(jìn)化的速率可通過(guò)允許所有基因底物參與重組來(lái)增加。這可通過(guò)使轉(zhuǎn)染細(xì)胞進(jìn)行電穿孔來(lái)實(shí)現(xiàn)。電穿孔的條件與常規(guī)用于將外源DNA引入細(xì)胞的那些條件相同。進(jìn)化速率還可通過(guò)融合細(xì)胞以誘導(dǎo)質(zhì)粒或染色體交換來(lái)增。融合可通過(guò)化學(xué)試劑如PEG或病毒蛋白如流感病毒血凝素、HSV-1gB和gD來(lái)誘導(dǎo)。進(jìn)化速率還可通過(guò)使用增變基因宿主細(xì)胞(如細(xì)菌中的Mut L、S、D、T、H,酵母中的類似突變體和共濟(jì)失調(diào)毛細(xì)血管擴(kuò)張人細(xì)胞系)來(lái)增加。
[0196]承載重組基因的細(xì)胞為期望的功能而進(jìn)行篩選或選擇。例如,如果進(jìn)化的底物含有抗藥基因,則其將為抗藥性而選擇。
[0197]典型地,在本發(fā)明的重組方法中,已取得期望表型的重組終產(chǎn)物在0.1%-50%的位置上與初始底物不同,并具以超過(guò)自然獲得的突變速率數(shù)量級(jí)(如,至少10-倍、100倍或1,000倍,或10,000倍)的速率進(jìn)化。出于生產(chǎn)目的,最終的基因嵌合產(chǎn)物可轉(zhuǎn)移至更適合利用重組DNA(shuffled DNA)的另一宿主。
[0198]在根據(jù)本發(fā)明的優(yōu)選方法中,宿主細(xì)胞使用公知的細(xì)胞展示體系在細(xì)胞表面展示基因嵌合體。通過(guò)借助此類雜交的多樣化,產(chǎn)生可適當(dāng)展示的一系列基因變體,從而建立此類變體的文庫(kù)。
[0199]適當(dāng)?shù)恼故痉椒òń湍刚故竞图?xì)菌細(xì)胞展示。特備優(yōu)選的文庫(kù)為如在蛋白質(zhì)工程和文庫(kù)篩選中的許多應(yīng)用中使用的酵母表面展示文庫(kù)。此類文庫(kù)提供相對(duì)于野生型多肽具有增強(qiáng)的表型性質(zhì)的多肽變體的適當(dāng)選擇。優(yōu)選地,細(xì)胞基礎(chǔ)的選擇方法用于針對(duì)例如表面固定化配體。常規(guī)使用的選擇技術(shù)包括分析和比較由此類文庫(kù)獲得的突變多肽的性質(zhì)與野生型多肽的性質(zhì)。改進(jìn)的期望性質(zhì)將包括能夠結(jié)合至受體的連接多肽的結(jié)合性質(zhì)的特異性或親和性的變化。多肽親和性突變?yōu)楸景l(fā)明的特別優(yōu)選的實(shí)施方案。進(jìn)一步期望的變體性質(zhì)是指穩(wěn)定性,例如感興趣的重組多肽的熱穩(wěn)定性、PH穩(wěn)定性、蛋白酶穩(wěn)定性、溶解度、產(chǎn)量或選擇水平。[0200]根據(jù)本發(fā)明的方法獲得的文庫(kù)包含高百分比的功能性嵌合基因的潛在的主要候選物,其可在功能ORF中表達(dá)。優(yōu)選的文庫(kù)具有至少80%的包含在功能ORF中的基因嵌合體,優(yōu)選至少85%、至少90%、甚至至少95%。根據(jù)本發(fā)明提供的文庫(kù)具體進(jìn)一步的特征在于,只是高百分比的成功雜交的標(biāo)記序列的存在。根據(jù)本發(fā)明,不僅可獲得奇數(shù)而且偶數(shù)的嵌合補(bǔ)丁(mosaic patch),增加了通過(guò)所述方法產(chǎn)生的重組文庫(kù)中的變體或文庫(kù)成員的數(shù)量。
[0201]通常根據(jù)本發(fā)明的文庫(kù)包括至少10個(gè)基因嵌合體的變體,優(yōu)選至少100個(gè),更優(yōu)選至少1,000個(gè),更優(yōu)選至少104,更優(yōu)選至少105,更優(yōu)選至少106,更優(yōu)選至少107,更優(yōu)選至少108,更優(yōu)選至少109,更優(yōu)選至少101(1,更優(yōu)選至少1011,多至1012,甚至更高的數(shù)量是可行的。
[0202]根據(jù)本發(fā)明的方法可提供包含至少IO2個(gè)表達(dá)基因嵌合體的功能變體的獨(dú)立克隆的文庫(kù)。根據(jù)本發(fā)明,還提供預(yù)選的例如親和性強(qiáng)的獨(dú)立克隆池,該池包括優(yōu)選至少10個(gè),更優(yōu)選至少100個(gè),更優(yōu)選至少1,000個(gè),更優(yōu)選至少10,000,甚至超過(guò)100,000個(gè)獨(dú)立克隆。包含預(yù)選池的那些文庫(kù)是選擇根據(jù)本發(fā)明的高親和性變體的優(yōu)選資源。
[0203]根據(jù)本發(fā)明使用的文庫(kù)優(yōu)選包括至少IO2個(gè)文庫(kù)成員,更優(yōu)選至少IO3個(gè),更優(yōu)選至少IO4個(gè),更優(yōu)選至少IO5個(gè),更優(yōu)選至少IO6個(gè)文庫(kù)成員,更優(yōu)選至少IO7個(gè),更優(yōu)選至少IO8個(gè),更優(yōu)選至少IO9個(gè),更優(yōu)選至少101°個(gè),更優(yōu)選至少IO11個(gè),多至IO12個(gè)文庫(kù)成員,優(yōu)選源自親本基因,為相應(yīng)的感興趣多肽設(shè)計(jì)新性。
[0204]優(yōu)選地,文庫(kù)為酵母文庫(kù),酵母宿主細(xì)胞優(yōu)選將具有生物活性的感興趣的多肽展示在細(xì)胞表面??蛇x地,產(chǎn)物停留在細(xì)胞內(nèi)或分泌到細(xì)胞外。酵母宿主細(xì)胞優(yōu)選選自酵母屬、畢赤酵母屬、漢遜酵母屬、裂殖酵母屬、克魯維酵母屬、耶氏酵母屬和假絲酵母屬。更優(yōu)選地,宿主細(xì)胞為釀酒酵母。
[0205]本文所述實(shí)施例為本`發(fā)明的示例,且不意欲對(duì)本發(fā)明限制。已根據(jù)本發(fā)明記載了不同的本發(fā)明實(shí)施方案??稍诓籤偏離本發(fā)明的精神和范圍下對(duì)本文所記載和說(shuō)明的技術(shù)進(jìn)行許多修改和變化。因此,應(yīng)理解實(shí)施例僅為示例且不限定本發(fā)明的范圍。
[0206]實(shí)施例
[0207]實(shí)施例1
[0208]描述
[0209]在第一實(shí)驗(yàn)計(jì)劃中,我們使用了 OXA類的β -內(nèi)酰胺酶基因作為待重組底物。OXA基因的優(yōu)勢(shì)在于可獲得不同多樣性(5-50%)的部分同源基因的事實(shí)。這些基因因此是測(cè)試體內(nèi)重組多樣性的限度的良好候選物。所述基因還容易操作(約SOObp長(zhǎng))。
[0210]表1:0xa基因的序列同一性
[0211]
【權(quán)利要求】
1.一種代謝途徑中天然芳族小分子產(chǎn)物變體的代謝進(jìn)化方法,其通過(guò)采用至少一種基因A的基因嵌合體來(lái)體細(xì)胞體內(nèi)組裝和重組所述代謝途徑來(lái)進(jìn)化,所述方法包括: a)在單個(gè)步驟過(guò)程中, (i)用與作為細(xì)胞基因組的整合部分或存在于基因構(gòu)建體框架中的待重組的另一基因的序列同源性小于99.5%的至少一種基因A轉(zhuǎn)化細(xì)胞, (ii)重組所述基因, (iii)在靶基因組的整合位點(diǎn)產(chǎn)生所述基因的基因嵌合體,其中所述至少一種基因A在與所述整合位點(diǎn)的5'或3'端錨定的5’端或3’端具有單側(cè)翼靶序列, (iv)重組所述代謝途徑的最終的其它基因,和 b)選擇能夠表達(dá)所述變體的包括所述基因嵌合體和所述最終的其它基因的克隆。
2.根據(jù)權(quán)利要求1所述的方法,其中所述另一基因?yàn)樗黾?xì)胞基因組的一部分。
3.根據(jù)權(quán)利要求1或2所述的方法,其中用至少一種基因A和至少一種基因B共轉(zhuǎn)化所述細(xì)胞,其中所述基因A的單側(cè)翼靶序列錨定至所述靶基因組整合位點(diǎn)的5'端,并且其中所述基因B連接至錨定于所述整合位點(diǎn)3’端的單側(cè)翼靶序列。
4.根據(jù)權(quán)利要求1至3任一項(xiàng)所述的方法,其中用至少兩種不同基因Al和A2共轉(zhuǎn)化所述細(xì)胞,和可選地用至 少兩種不同基因BI和B2共轉(zhuǎn)化。
5.根據(jù)權(quán)利要求1至4任一項(xiàng)所述的方法,其中共轉(zhuǎn)化至少一種其它基因C,所述其它基因C具有與所述基因A和/或所述另一基因的序列雜交的序列,從而獲得所述其它基因C與所述基因A和/或所述另一基因的組裝。
6.根據(jù)權(quán)利要求1至5任一項(xiàng)所述的方法,其中所述基因A和/或所述另一基因?yàn)榉蔷幋a序列或編碼多肽或具有活性的部分多肽的序列。
7.根據(jù)權(quán)利要求1至6任一項(xiàng)所述的方法,其中將所述代謝途徑的至少兩種基因重組和組裝。
8.根據(jù)權(quán)利要求7所述的方法,其中所述基因?yàn)閮?yōu)選300至20,OOObp的線性多核苷酸。
9.根據(jù)權(quán)利要求1至8任一項(xiàng)所述的方法,其中獲得至少3多至20,000個(gè)堿基對(duì)的優(yōu)選每700bp具有至少3個(gè)交叉事件的基因嵌合體。
10.根據(jù)權(quán)利要求1至9任一項(xiàng)所述的方法,其中所述細(xì)胞為DNA修復(fù)缺陷型細(xì)胞。
11.根據(jù)權(quán)利要求1至10任一項(xiàng)所述的方法,其中所述細(xì)胞為真核細(xì)胞或原核細(xì)胞,所述真核細(xì)胞優(yōu)選真菌、哺乳動(dòng)物或植物細(xì)胞。
12.根據(jù)權(quán)利要求1至11任一項(xiàng)所述的方法,其中所述天然芳族小分子選自由苯丙素類、類黃酮、黃酮醇、花青苷、木質(zhì)素、花青素、查耳酮、香草醛和其天然產(chǎn)生的衍生物組成的組。
13.根據(jù)權(quán)利要求1至12任一項(xiàng)所述的方法,其中所述變體由重組酶變體合成。
14.一種產(chǎn)生代謝途徑中天然芳族小分子產(chǎn)物的變體的細(xì)胞文庫(kù)的制備方法,其包括通過(guò)采用至少一種基因A的基因嵌合體來(lái)體細(xì)胞體內(nèi)組裝和重組所述代謝途徑,從而工程化重組細(xì)胞,所述方法包括: a)在單個(gè)步驟過(guò)程中, (i)用與作為細(xì)胞基因組的整合部分或存在于基因構(gòu)建體的框架中的待重組的另一基因的序列同源性小于99.5%的至少一種基因A轉(zhuǎn)化細(xì)胞, (ii)重組所述基因, (iii)在靶基因組的整合位點(diǎn)產(chǎn)生所述基因的基因嵌合體,其中所述至少一種基因A在與所述整合位點(diǎn)的5,或3,端錨定的5’端或3’端具有單側(cè)翼靶序列, (iv)重組所述代謝途徑的最終的其它基因,和 b)收集包括所述基因嵌合體和所述最終的其它基因的克隆從而獲得能夠產(chǎn)生所述變體的文庫(kù)。
15.根據(jù)權(quán)利要求14所述的方法獲得的文庫(kù),其包括至少10E3種產(chǎn)生所述變體的不同克隆。
16.根據(jù)權(quán)利要求15所述的文庫(kù),其為包含編碼一系列代謝途徑的重組基因的細(xì)胞文庫(kù)。
17.根據(jù)權(quán)利要求15或16所述的文庫(kù),其為包括編碼一系列合成酶的重組基因的細(xì)胞文庫(kù)。
18.一種合成重組酶的文庫(kù),其可由根據(jù)權(quán)利要求15至17任一項(xiàng)所述的文庫(kù)獲得。
19.一種生物體,其包括來(lái)自根據(jù)權(quán)利要求15至18任一項(xiàng)所述的文庫(kù)的基因變體。
20.一種從根據(jù)權(quán)利要求15至18任一項(xiàng)所述的文庫(kù)選擇天然芳族小分子的變體的方法。
21.根據(jù)權(quán)利要求20所述的方法,其進(jìn)一步包括確定所述變體的結(jié)構(gòu)和功能。
22.根據(jù)權(quán)利要求20或21所述的方法,其進(jìn)一步包括在重組宿主中生產(chǎn)所述變體。
23.根據(jù)權(quán)利要求20或21所述的方法,其進(jìn)一步包括合成生產(chǎn)所述變體。
24.根據(jù)權(quán)利要求20至23任一項(xiàng)所述的方法,其中所述變體為具有選自由抗菌、抗氧化活性組成的組的生物學(xué)活性或者作為芳香劑和風(fēng)味劑的苯丙素類。
【文檔編號(hào)】C12P17/06GK103764828SQ201280041012
【公開日】2014年4月30日 申請(qǐng)日期:2012年6月20日 優(yōu)先權(quán)日:2011年6月21日
【發(fā)明者】魯?shù)稀づ瞬橐撂? 薩拉·西巴伊, 亞歷杭德羅·盧克 申請(qǐng)人:艾威艾基克斯有限公司