絲狀真菌中多個基因拷貝的同時位點特異性整合的制作方法
【專利摘要】本發明涉及將兩個或更多個拷貝的目標多核苷酸同時整合到真菌宿主細胞的染色體中的方法,該染色體包括至少兩對位點特異性重組酶的識別序列,每對識別序列位于駐留陰性選擇標記的兩側;對細胞轉化攜帶側翼也是識別序列的目標基因的構建體,以確保在重組酶短暫表達之后的雙交換事件,接著選擇所有陰性選擇標記都被切除的細胞。
【專利說明】絲狀真菌中多個基因拷貝的同時位點特異性整合
[0001]對序列表的引用
[0002]本申請包含計算機可讀形式的序列表。該計算機可讀形式并入本文以作參考。
【技術領域】
[0003]本發明涉及使用短暫表達的重組酶連同合適的駐留(resident)選擇標記將多個拷貝的目標多核苷酸同時位點特異性地整合到真菌宿主細胞的基因組中的方法。
【背景技術】
[0004]已經發現大量的自然產生的生物體產生有用的多肽產物,例如酶,酶的大規模生產為研究和商業用途所需。在鑒定出這樣的多肽產物后,經常要致力于開發具有改進的生產率的制造方法。一種廣泛運用的基于重組DNA技術的方法是克隆編碼該產物的基因,并將該基因插入到合適的表達體系中,從而在有益于產物表達的條件下在合適的宿主細胞中表達該產物,該基因或是整合到染色體中,或是作為染色體外的實體。
[0005]無論使用何種生產方法,通常期望提高給定的多肽或蛋白質的生產水平。因此,正在為增加生產而作出努力,例如,通過將編碼該產物的基因插入到強表達信號的控制下,增加所轉錄的mRNA的穩定性或通過增加所考慮的生產生物體中該基因的拷貝數。后一種方法可以通過將該基因插入到多拷貝質粒中來實現,但是通常多拷貝質粒存在在所考慮的宿主細胞中不穩定的傾向,或者通過將多個拷貝的該基因整合到生產生物體的染色體中來實現,該途徑由于構建體的穩定性趨向于是更高的而通常被認為是更具有吸引力的。
[0006]宿主細胞的構建已被描述過,其中高度表達的染色體基因由位點特異性重組酶的識別序列替代,從而可以在 隨后通過使用識別所述序列的重組酶將單個編碼產物的多核苷酸插入到那個位點(EP1405908A1 ;ProBioGen AG)。
[0007]已經公開了在基因組中的已知位置插入DNA (O’ Gorman等,1991Science,251:1351-55 ;Baubonis 和 Sauer, 1993Nucl.,Acids Res., 21:2025-29 ;Albert等,1995Plant J.,7:649-59)。這些方法利用自由可逆的位點特異性重組體系。這些可逆體系包括以下:來自卩遼菌體Pl的Cre-1ox體系(Baubonis和Sauer, 1993,見上文;Albert 等,1995Plant J.,7549-59),釀酒酵母(Saccharomyces cerevisiae)的 FLP-FRT體系(O,Gorrnan 等,1991,見上文),Zygosaccharonzyces rouxii 的 R-RS 體系(Onouchi等,1995Mol.Gen.Genet.247:653-660),來自 Mu 噬菌體的改良 Gin-gix 體系(Maeser 和Kahmann, 1991Mol.Gen.Genet.,230:170-76),來自枯草芽抱桿菌(Bacillus subtilis)質粒的 β -重組酶-six 體系(Diaz 等,1999J.Biol.Chem.274 =6634-6640)以及來自細菌轉座子 TnlOOO 的 δ - Y-res 體系(Schwikardi 和 Dorge, 2000E B S let.471:147-150)。Cre、FLP、R、Gin、β -重組酶和 δ -y 是重組酶,lox、FRT、RS、gix、six 和 res是各個重組位點(由 Sadowslu, 1993FASEB J.,7:750-67 ;0w 和 Medberry, 1995Crit.Rev.Plant Sc1.14:239-261綜述)。多重Cre/lox重組允許選擇性位點特異性DNA靶向酵母基因組中的自然位點和工程化位點(Sauer, B.Nucleic Acids Research.1996, Vol.24(23):4608-4613)。已經顯示使用鏈霉菌屬(Sti^ptomyces)噬菌體OC31的衍生物感染具有自然附著位點attB和異位引入的attB位點的宿主細胞,結果使該噬菌體整合到兩個attB位點中(Smith等,2004, Switching the polarity of a bacteriophage integrationsystem.Mol Microbiol51 (6): 1719-1728)。使用Mx9噬菌體轉化體系,多個拷貝的基因可以引入到包含多個被Mx9整合酶識別的附著位點的細胞中(W02004/018635A2)。溫帶Iactococcal卩遼菌體TP901-1整合酶和識別序列是良好表征的(Breiiner等,(1990)Novel Organization of Genes Involved in Prophage Excision Identified in theTemperate Lactococcal Bacteriophage TP901-1.J Bacterioll81 (23):7291-7297 ;Breiiner等,2001.Resolvase-like recombination performed by the TP901-lintegrase.Microbiologyl47:2051-2063)。
[0008]以上的位點特異性重組體系具有共同的性質,即單一的多肽重組酶催化相同序列或近乎相同序列在兩個位點間的重組。每個重組位點由短的不對稱間隔序列組成,在該短的不對稱間隔序列處發生鏈交換,該短的不對稱間隔序列在兩側有重組酶結合的反向重復序列。間隔序列的不對稱性對重組位點提供了一個方向,并規定了重組反應的結果。直接或間接定向的順式位點之間的重組分別切除或倒置干預DNA。反式位點之間的重組引起兩個線性DNA分子的相互易位,或者,如果兩個分子之中有至少一個是環形的,則引起共整合。因為由重組產生的產物位點自身是隨后重組的底物,所以反應是自由可逆的。但是,在實際中,因為兩個重組位點緊密相連的地方的分子內相互作用的可能性遠遠高于不相連位點間的分子內相互作用的可能性,所以切除基本上是不可逆的。必然的結果是插入到基因組重組位點中的DNA分子會很容易地切除掉。
[0009]已經公開了在真核生物的基因組中進行DNA取代、易位和疊加的方法,在這些方法中多個基因可以一步步整合(W002/08409)。通過位點特異性和短暫表達的整合酶在微生物宿主細胞中進行多個拷貝的無啟動子開放閱讀框或操縱子的同時基因組整合(W02006/042548)早前已經在芽孢桿菌(Bacillus)宿主中示出。
【發明內容】
[0010]本發明涉及將兩個或更多個拷貝的目標多核苷酸整合到真菌宿主細胞的染色體中的方法,該方法通過以下步驟進行:
[0011]Ca)提供在其染色體內包括至少兩個整合位點的真菌宿主細胞,每個整合位點包括一對位點特異性重組酶的識別序列,每對識別序列位于駐留(resident)選擇標記的兩側;
[0012](b)向所述細胞中引入核酸構建體,該核酸構建體包括一對位點特異性重組酶的識別序列,該識別序列對位于目標多核苷酸的兩側;
[0013](C)在細胞中短暫表達位點特異性重組酶,借此染色體的識別序列對通過重組酶與核酸構建體的對應的識別序列對重組,從而使得在至少兩個整合位點,染色體中的駐留選擇標記被切除而目標多核苷酸的拷貝整合到它的位置上,產生包括兩個或更多個拷貝的整合到真菌宿主細胞的染色體中的目標多核苷酸的真菌宿主細胞。
[0014]如在以下的實施例部分中所例證的,本發明的主要方面提供將兩個或更多個拷貝的目標多核苷酸同時整合到真菌宿主細胞的染色體中的方法,該方法包括以下步驟:[0015](a)提供在其染色體內包括至少兩對位點特異性重組酶的識別序列的真菌宿主細胞,每對識別序列位于駐留陰性選擇標記的兩側;
[0016](b)向所述細胞中引入核酸構建體,該核酸構建體包括一對位點特異性重組酶的識別序列,該識別序列對位于目標多核苷酸的兩側;
[0017](C)在細胞中短暫表達位點特異性重組酶,借此染色體的識別序列對通過重組酶與核酸構建體的對應的識別序列對重組,從而使得染色體中的每個駐留陰性選擇標記被切除而目標多核苷酸的拷貝整合到它的位置上;然后
[0018](d)在選擇性培養基中培養該細胞并選擇細胞,其中每個陰性選擇標記已經通過雙同源重組被兩個或更多個拷貝的目標多核苷酸取代。
【專利附圖】
【附圖說明】
[0019]圖1顯示本發明方法的基本方案,在此運用FRT/FLP重組體系和pyrG (作為雙向選擇標記)以及兩側是兩拷貝轉錄終止子(標記為“Term”)的FLP編碼基因一起加以例證,其使得可以通過雙同源重組實現FLP和pyrG基因的切除,使得可以進行FLP的短暫表達。
[0020]圖2 顯示 pHUda981 的質粒圖譜(在 W007045248 中描述了 Pgpd,HSVltk 和 TtrpC)。
[0021]圖3顯示pHUdal019的質粒圖譜。
[0022]圖4顯示pHUdalOOO的質粒圖譜。
[0023]圖5顯示pHUdalOOO正確引入到NN059183中之后的NAl (上圖)和酸穩定性淀粉酶基因座示意圖(下圖)。
[0024]圖6顯示pHUda`801的質粒圖譜。
[0025]圖7顯示pHUdal043的質粒圖譜。
[0026]圖8顯示pHUdal078的質粒圖譜。
[0027]圖9顯示pHUdal067的質粒圖譜。
[0028]圖10顯示NN059208中的NAl基因座(上部)、NA2基因座(中間)和酸穩定性淀粉酶基因座(下部)示意圖。
[0029]圖11顯示pRikal47的質粒圖譜。
[0030]圖12顯示pRikal47正確整合到NN059208中之后的NAl (上部)、NA2 (中間)和酸穩定性淀粉酶基因座(下部)示意圖。
[0031]圖13顯示pHUdall74的質粒圖譜。
[0032]圖14顯不Ml 146中PAY基因座(上部)的不意圖。
[0033]圖15顯示pHUdal306的質粒圖譜。
[0034]圖16六顯示當?汜1?1147引入到祖146中時的嫩1基因座(上部)和嫩2 (2nd)的示意圖。
[0035]圖16B顯示當pRikal47引入到M1146中時的SP288基因座(3rd)示意圖。
[0036]圖16C顯示當pRikal47引入到M1146中時的PAY基因座示意圖。
[0037]圖17顯示pHUdal356的質粒圖譜。
[0038]圖18顯示用來將FRT位點在cbhl基因座處整合到里氏木霉(T.reesei)基因組中的載體pJfyS147的圖譜。
[0039]圖19顯示使用FLP/FRT體系用來將煙曲霉(A.fumigatus)BG在cbhl基因座處整合到里氏木霉菌株JfyS147-20B中的載體pJfyS150的圖譜。
[0040] 定義
[0041 ] 胞嘧啶脫氨酶:胞嘧啶脫氨酶(EC3.5.4.1)催化胞嘧啶和5_氟胞嘧啶(5FC)的脫氨基作用以分別形成尿嘧啶和有毒的5-氟尿嘧啶(5FU)。當包含胞嘧啶脫氨酶的基因改造細胞與5FC結合時,5FC被轉化成有毒的5FU,因此胞嘧啶脫氨酶編碼基因潛在地是有效的陰性選擇標記。
[0042]也已顯示,嘧啶從頭(de novo)合成途徑中的抑制劑可以用于創造如下條件,在該條件下細胞依賴于通過胞嘧啶脫氨酶進行的嘧啶補充物到尿嘧啶的轉化。因此,只有表達胞嘧啶脫氨酶基因的細胞可以在包含嘧啶從頭合成抑制劑及肌苷和胞嘧啶的陽性選擇介質中被救援(參見Wei and Huber, 1996, J Biol Chem271 (7):3812的圖1)。該抑制劑優選是N-膦乙酰基-L-天冬氨酸(PALA),其抑制天冬氨酸氨甲酰基轉移酶。
[0043]如果必要的話,胞嘧啶脫氨酶活性可以通過基因檢測加以定量(FredericoL.A.等,1990,Biochemistry29:2532_2537)。
[0044]等位變體(allelic variant):術語“等位變體”是指占據相同染色體基因座的兩種或多種可替換基因形式中的任一種。等位變體自然地通過突變而產生,且可以引起群體內的多態性。基因突變可以是沉默的(在編碼的多肽中沒有變化),或者可以編碼具有改變的氨基酸序列的多肽。多肽的等位變體是由基因的等位變體編碼的多肽。
[0045]催化結構域:術語“催化結構域”是指酶的包含酶的催化機構的區域。
[0046]cDNA:術語“cDNA”是指能夠通過得自真核或原核細胞的成熟的、剪接的mRNA分子的反轉錄而制得的DNA分子。cDNA缺少可能存在于相應基因組DNA中的內含子序列。早先的初始RNA轉錄子是mRNA的前體 ,其在呈現為成熟的剪接的mRNA之前要經一系列的步驟加工,包括剪接。
[0047]編碼序列:術語“編碼序列”是指多核苷酸,其直接明確多肽的氨基酸序列。編碼序列的邊界通常由開放閱讀框決定,其以起始密碼子例如ATG、GTG或TTG開始,并以終止密碼子例如TAA、TAG或TGA結束。編碼序列可以是基因組DNA、cDNA、合成DNA或其組合。
[0048]控制序列:術語“控制序列”是指對于本發明的編碼成熟多肽的多核苷酸的表達為必要的核酸序列。各個控制序列可以相對于編碼多肽的多核苷酸是原生的(native)(g卩,來自相同基因)或外源的(即,來自不同基因)或者相互為原生的或外源的。這樣的控制序列包括但不限于,前導序列、多腺苷酸化序列、前肽序列、啟動子、信號肽序列和轉錄終止子。控制序列至少包括啟動子、以及轉錄和翻譯終止信號。出于引入特定限制性酶切位點的目的,控制序列可具有接頭,其促進控制序列與編碼多肽的多核苷酸的編碼區域的連接。
[0049]表達:術語“表達”包括涉及到多肽生產中的任何步驟,包括但不限于:轉錄、轉錄后修飾、翻譯、翻譯后修飾以及分泌。
[0050]表達載體:術語“表達載體”是指包括編碼多肽的多核苷酸并且可操作地與用于其表達的控制序列相連接的線性或環狀DNA分子。
[0051]片段:術語“片段”是指具有一個或多個(例如,數個)從成熟多肽或結構域的氨基和/或羧基端缺失的氨基酸的多肽或催化結構域;其中片段具有胞嘧啶脫氨酶活性。
[0052]宿主細胞:術語“宿主細胞”是指對轉化、轉染、轉導等敏感的任何細胞類型,其具有包含本發明的多核苷酸的核酸構建體或表達載體。術語“宿主細胞”包括因復制過程中發生的突變而與親本細胞不同的親本細胞的任意后代。
[0053]分離的或純化的:術語“分離的”或“純化的”是指從與其自然相關聯的至少一個成分中移出的多肽或多核苷酸。例如,按照SDS-PAGE所測定的,多肽可以是至少1%純的,例如至少5%純,至少10%純,至少20%純,至少40%純,至少60%純,至少80%純,至少90%純,或至少95%純,如按照瓊脂糖電泳所測定的,多核苷酸可以是至少1%純的,例如至少5%純,至少10%純,至少20%純,至少40%純,至少60%純,至少80%純,至少90%純,或至少95%純。
[0054]陰性選擇標記:術語“陰性選擇標記”是指能夠賦予選擇特征從而使得具有該陰性選擇標記的細胞被殺死或者以其他方式例如通過熒光被識別的核酸序列。陰性選擇標記優選基本不能與靶標DNA序列同源重組。
[0055]核酸構建體:術語“核酸構建體”是指從天然存在的基因中分離的、或以自然中不會另外出現的方式被修飾成包含核酸片段的、或合成的單鏈或雙鏈的核酸分子,其包括一個或多個控制序列。
[0056]可操作地連接:術語“可操作地連接”是指如下的構造,其中,控制序列相對于多核苷酸的編碼序列安置在合適位置處,從而控制序列指導編碼序列的表達。
[0057]序列同一性:兩個氨基酸序列之間或兩個核苷酸序列之間的關聯性通過參數“序列同一性”來說明。
[0058]出于本發明的目的,使用在EMBOSS軟件包(EMBOSS:The European MolecularBiology Open Software Suite (歐洲分子生物學開放軟件包),Rice 等人,2000, TrendsGenet.16:276-277)(優選 5.0.0 版本或更新)的 Needle 程序中執行的 Needleman-Wunsch算法(Needleman and Wunsch, 1970, J.Mol.Biol.48:443-453)來確定兩個氛基酸序列之間的序列同一性。所用的參數:空位開放罰分為10,空位擴展罰分為0.5,以及EBL0SUM62(BL0SUM62的EMBOSS版本)替換矩陣。Needle標記的“最長一致度”的輸出(使用-nobrief選項得到的)被用作百分比一致度并如下計算:
[0059](相同殘基X100) / (比對長度-比對中的空位總數)
[0060]出于本發明的目的,使用在EMBOSS軟件包(EMBOSS:The European MolecularBiology Open Software Suite (歐洲分子生物學開放軟件包),Rice等人,2000,同上)(優選5.0.0版本或更新)的Needle程序中執行的Needleman-Wunsch算法(Needleman andWunsch, 1970,同上)來確定兩個脫氧核糖核苷酸序列之間的序列同一性。所用的參數:空位開放罰分為10,空位擴展罰分為0.5,以及EDNAFULL (NCBI NUC4.4的EMBOSS版本)替換矩陣。Needle標記的“最長一致度”的輸出(使用-nobrief選項得到的)被用作百分比一致度并如下計算:
[0061](相同脫氧核糖核酸X100) / (比對長度-比對中的空位總數)
[0062]同時:本文中所使用的術語“同時”,即,關于至少兩個目標多核苷酸向宿主細胞中的整合,指的是這樣一個過程,通過這個過程在至少兩個拷貝的目標多核苷酸向宿主細胞中的整合發生在同一過程步驟中,致使增加一個拷貝的目標多核苷酸,即,不需要增加任何其它材料和/或任何附加過程步驟。因此,目標多核苷酸在同一過程中在相同時刻或不同時刻但在同一過程中同時期地被引入到該宿主細胞中的至少兩個不同整合位點。
[0063]子序列:術語“子序列”是指從成熟多肽編碼序列的5’和/或3’端缺失一個或多個(例如,數個)核苷酸的多核苷酸;其中子序列編碼具有胞嘧啶脫氨酶活性的片段。
[0064]變體:術語“變體”是指在一個或多個位置上包括一個或多個(例如,數個)氨基酸殘基的改變(即替換、插入和/或缺失)的具有胞嘧啶脫氨酶活性的多肽。替換是指用不同的氨基酸替換占據某位置的氨基酸;缺失是指去除占據位置的氨基酸;并且插入是指增加與占據某位置的氨基酸相鄰的氨基酸。
【具體實施方式】 [0065]本發明的第一方面涉及將兩個或更多個拷貝的目標多核苷酸整合到真菌宿主細胞的染色體中的方法,該方法通過以下步驟進行:
[0066](a)提供在其染色體內包括至少兩個整合位點的真菌宿主細胞,每個整合位點包括一對位點特異性重組酶的識別序列,每對識別序列位于駐留(resident)選擇標記的兩側;
[0067](b)向所述細胞中引入核酸構建體,該核酸構建體包括一對位點特異性重組酶的識別序列,該識別序列對位于目標多核苷酸的兩側;
[0068](C)在細胞中短暫表達位點特異性重組酶,借此染色體的識別序列對通過重組酶與核酸構建體的對應的識別序列對重組,從而使得在至少兩個整合位點,染色體中的駐留選擇標記被切除而目標多核苷酸的拷貝整合到它的位置上,產生包括兩個或更多個拷貝的整合到真菌宿主細胞的染色體中的目標多核苷酸的真菌宿主細胞。
[0069]在一個【具體實施方式】中,本發明的第一方面涉及將兩個或更多個拷貝的目標多核苷酸同時整合到真菌宿主細胞的染色體中的方法,該方法包括以下步驟:
[0070](a)提供在其染色體內包括至少兩對位點特異性重組酶的識別序列的真菌宿主細胞,每對識別序列位于駐留陰性選擇標記的兩側;
[0071](b)向所述細胞中引入核酸構建體,該核酸構建體包括一對位點特異性重組酶的識別序列,該識別序列對位于目標多核苷酸的兩側;
[0072](C)在細胞中短暫表達位點特異性重組酶,借此染色體的識別序列對通過重組酶與核酸構建體的對應的識別序列對重組,從而使得染色體中的每個駐留陰性選擇標記被切除而目標多核苷酸的拷貝整合到它的位置上;然后
[0073](d)在選擇性培養基中培養該細胞并選擇細胞,其中每個陰性選擇標記已經通過雙同源重組被兩個或更多個拷貝的目標多核苷酸取代。
[0074]在優選的實施方式中,該目標多核苷酸包括編碼至少一個目標多肽的操縱子或開放閱讀框。該目標多肽可以編碼任何目標蛋白質,比如,例如,細胞因子(特別是白介素、干擾素、集落刺激因子(CSF)和生長因子),抗凝血劑,酶和酶抑制劑。
[0075]優選地,該目標多肽包括酶,優選為水解酶、異構酶、連接酶、裂解酶、氧化還原酶或轉移酶,例如氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維二糖水解酶、纖維素酶、幾丁質酶、角質酶、環糊精糖基轉移酶、脫氧核糖核酸酶、內切葡聚糖酶、酯酶、α-半乳糖苷酶、β -半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、轉化酶、漆酶、脂肪酶、甘露糖苷酶、變聚糖酶(mutanase)、氧化酶、果膠分解酶、過氧化物酶、植酸酶、多酹氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶、木聚糖酶、或β -木糖苷酶。
[0076]自由可逆的位點特異性重組體系已經在文獻中有詳細描述。這些可逆體系包括以下:來自卩遼菌體Pl 的 Cre-1ox體系(Baubonis 和 Sauer, 1993,見上文;Albert 等,1995PlantJ., 7549-59),釀酒酵母(Saccharomyces cerevisiae)的 FLP-FRT 體系(O,Gorrnan 等,1991,見上文.),Zygosaccharonzyces rouxii 的 R-RS 體系(Onouchi 等,1995Mol.Gen.Genet.247:653-660),來自 Mu 卩遼菌體的改良 Gin-gix 體系(Maeser 和 Kahmann, 1991Mol.Gen.Genet.,230:170-76),來自枯草芽抱桿菌(Bacillus subtilis)質粒的 β _ 重組酶-six 體系(Diaz 等,1999J.Biol.Chem.274:6634-6640)以及來自細菌轉座子 TnlOOO 的δ-y-res 體系(Schwikardi 和 Dorge,2000E B S let.471:147-150)。Cre、FLP、R、Gin、β -重組酶和δ - y是重組酶,lox、FRT、RS、gix、six和res是各個重組位點(由Sadowslu,1993FASEB J.,7:750-67 ;0w 和 Medberry, 1995Crit.Rev.Plant Sc1.14:239-261 綜述)。多重Cre/lox重組允許選擇性位點特異性DNA靶向酵母基因組中的自然位點和工程化位點(Sauer, B.Nucleic Acids Research.1996,Vol.24(23):4608_4613)。已經顯不使用鏈霉菌屬(Streptomyces)卩遼菌體C>C31的衍生物感染具有自然附著位點attB和異位引入的attB位點的宿主細胞,結果使該卩遼菌體整合到兩個attB位點中(Smith等,2004, Switching thepolarity of a bacteriophage integration system.Mol Microbiol51 (6): 1719-1728)。使用Mx9噬菌體轉化體系,多個拷貝的基因可以引入到包含多個被Mx9整合酶識別的附著位點的細胞中(W02004/018635A2)。溫帶Iactococcal噬菌體TP901-1整合酶和識別序列是良好表征的(Breiiner 等,(1990)Novel Organization of Genes Involved in ProphageExcision Identified in the Temperate Lactococcal Bacteriophage TP901—1.J Bacteriol 181 (23):7291-7297 ;Breiiner 等,2001.Resolvase-like recombinationperformed by the TP901_lintegrase.Microbiologyl47:2051-2063)。
[0077]以上的位點特異性重組體系具有共同的性質,即單一的多肽重組酶催化相同序列或近乎相同序列在兩個位點間的重組。每個重組位點由短的不對稱間隔序列組成,在該短的不對稱間隔序列處發生鏈交換,該短的不對稱間隔序列在兩側有重組酶結合的反向重復序列。間隔序列的不對稱性對重組位點提供了一個方向,并規定了重組反應的結果。直接或間接定向的順式位點之間的重組分別切除或倒置干預DNA。反式位點之間的重組引起兩個線性DNA分子的相互易位,或者,如果兩個分子之中有至少一個是環形的,則引起共整合。因為由重組產生的產物位點自身是隨后重組的底物,所以反應是自由可逆的。但是,在實際中,因為兩個重組位點緊密相連的地方的分子內相互作用的可能性遠遠高于不相連位點間的分子內相互作用的可能性,所以切除基本上是不可逆的。必然的結果是插入到基因組重組位點中的DNA分子會很容易地切除掉,除非該重組酶短暫表達,在這種情況下,插入的DNA在重組酶不再表達后得以保持。
[0078] 因此,在第一方面的方法中,優選位點特異性重組酶和它的識別序列對來自于噬菌體 Pl 的 Cre-1ox 體系、釀酒酵母的 FLP-FRT 體系、Zygosaccharonzyces rouxii 的 R-RS體系、來自Mu噬菌體的改良Gin-gix體系、來自枯草芽孢桿菌質粒的β -重組酶-six體系,來自細菌轉座子TnlOOO的S-Y-res體系、鏈霉菌屬噬菌體OC31、Mx9噬菌體轉化體系或溫帶Iactococcal卩遼菌體TP901-1的Xis-att體系。
[0079]在實施方式中,位點特異性重組酶和它的識別序列對來自FLP-FRT體系。在具體的實施方式中,FLP重組酶是如在Buchholz, Frank, Improved propertiesof FLP recombinase evolved by cycling mutagenesis, Nature BiotechnologyVolume:16Issue:7 (1998-07-01) p.657-662中記載的FLP重組酶變體。在另一個具體的實施方式中,FLP重組酶是具有氨基酸改變P2S、L33S、Y108N和S294P的被指定為“FLPe”的熱穩定性重組酶變體。FLPe的核酸序列和相應的氨基酸序列分別見SEQ ID NO: 106和SEQID NO:107。
[0080]在第一方面的優選實施方式中,陰性選擇標記編碼對宿主細胞賦予抗菌素抗性的多肽且選擇性培養基包括抑菌濃度的抗菌素。
[0081]或者,在第一方面的另一個優選實施方式中,陰性選擇標記編碼胞嘧啶脫氨酶且選擇性培養基包括足量的5-氟胞嘧啶,其通過所述胞嘧啶脫氨酶轉化為抑菌濃度的毒性5-氟尿嘧啶。
[0082]在實施方式中,陰性選擇標記編碼胞嘧啶脫氨酶多肽,該胞嘧啶脫氨酶多肽與SEQID NO: 60具有至少60%的序列同一性,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%的序列同一性。在一個方面,多肽與SEQ ID NO: 60相差不多于十個氨基酸,例如九個氨基酸、八個氨基酸、七個氨基酸、六個氨基酸、五個氨基酸、四個氨基酸、三個氨基酸、二個氨基酸或一個氨基酸。[0083]優選地,本發明的編碼的胞嘧啶脫氨酶多肽包括SEQ ID NO:60的氨基酸序列或其等位變體或者由其組成;或者該胞嘧啶脫氨酶多肽是它的具有胞嘧啶脫氨酶活性的片段。在另一個方面,該多肽包括或者由SEQ ID N0:60的多肽組成。
[0084]在另一個實施方式中,陰性選擇標記編碼胞嘧啶脫氨酶多肽,并在極低等嚴格條件、低等嚴格條件、中等嚴格條件、中高等嚴格條件、高等嚴格條件或極高等嚴格條件下與(i ) SEQ ID NO: 59的多肽編碼序列,(i i )其cDNA序列,或(i i i ),( i )或(i i )的全長互補物雜交(Sambrook等,1989,Molecular Cloning, A Laboratory Manual,第 2 版,冷泉港(ColdSpring Harbor),紐約)。
[0085]根據本領域眾所周知的方法,SEQ ID NO:59的多核苷酸或其子序列以及SEQ IDNO:60的多肽或其片段可以用來設計核酸探針,以鑒定和克隆來自不同屬或種的菌株的編碼具有胞嘧啶脫氨酶活性的多肽的DNA。具體地,根據標準Southern印跡步驟,這些探針可以用于與目標細胞的基因組DNA或cDNA進行雜交,以鑒定并分離其中的相應基因。在長度上,這些探針可以比完整序列短很多,但應當是至少15個核苷酸,例如,在長度上為至少25個,至少35個或至少個70核苷酸。優選地,核酸探針在長度上是至少100個核苷酸,例如,在長度上為至少200個核苷酸,至少300個核苷酸,至少400個核苷酸,至少500個核苷酸,至少600個核苷酸,至少700個核苷酸,至少800個核苷酸或至少900個核苷酸。DNA和RNA探針兩者都可以使用。通常,這些探針被標記以檢測相應基因(例如,用32P、3H、35S、生物素或抗生物素蛋白標記)。本發明涵蓋這些探針。
[0086]對于與上述探針雜交且編碼具有胞嘧啶脫氨酶活性的多肽的DNA,可以篩選從這樣的其他菌株制備的基因組DNA或cDNA文庫。可以通過瓊脂糖或聚丙烯酰胺凝膠電泳或其它分離技術,分離來自這樣的其他菌株的基因組DNA或其它DNA。來自文庫的DNA或分離的DNA可以被轉移到并被固定在硝化纖維或其它合適的載體材料上。為了鑒定與SEQ IDNO: 59或其子序列同源的克隆或DNA,優選在Southern印跡中使用載體材料。
[0087]出于本發明的目的,雜交是指多核苷酸在極低等到極高等嚴格條件下與如下的標記核酸探針雜交,該標記的核酸探針與(i)SEQ ID N0:59 ;(ii)SEQ ID N0:59的多肽編碼序列;(iii)其cDNA序列;(iv)其全長互補物;或&)其子序列相對應。可以運用例如X-ray膜來檢測核酸探針在這些條件下所雜交的分子。[0088]對于長度為至少100個核苷酸的探針,極低等嚴格條件定義為,在42°C下在5XSSPE、0.3%SDS、200mg/ml剪切并變性的鮭魚精子DNA和25%甲酰胺中預雜交并雜交,最佳地,之后進行12~24個小時的標準Southern印跡過程。載體材料最終使用2XSSC、0.2%SDS在45 °C下清洗三次,每次15分鐘。
[0089]對于長度為至少100個核苷酸的探針,低等嚴格條件定義為,在42 °C下在5XSSPE、0.3%SDS、200mg/ml剪切并變性的鮭魚精子DNA和25%甲酰胺中預雜交并雜交,最佳地,之后進行12~24個小時的標準Southern印跡過程。載體材料最終使用2XSSC、
0.2%SDS在50°C下清洗三次,每次15分鐘。
[0090]對于長度為至少100個核苷酸的探針,中等嚴格條件定義為,在42°C下在5XSSPE、0.3%SDS、200mg/ml剪切并變性的鮭魚精子DNA和35%甲酰胺中預雜交并雜交,最佳地,之后進行12~24個小時的標準Southern印跡過程。載體材料最終使用2XSSC、
0.2%SDS在55 °C下清洗三次,每次15分鐘。
[0091]對于長度為至少100個核苷酸的探針,中高等嚴格條件定義為,在42°C下在5XSSPE、0.3%SDS、200mg/ml剪切并變性的鮭魚精子DNA和35%甲酰胺中預雜交并雜交,最佳地,之后進行12~24個小時的標準Southern印跡過程。載體材料最終使用2XSSC、
0.2%SDS在60°C下清洗三次,每次15分鐘。
[0092]對于長度為至少100個核苷酸的探針,高等嚴格條件定義為,在42 °C下在5XSSPE、0.3%SDS、200mg/ml剪切并變性的鮭魚精子DNA和50%甲酰胺中預雜交并雜交,最佳地,之后進行12~24個小時的標準Southern印跡過程。載體材料最終使用2XSSC、
0.2%SDS在65 °C下清洗三次,每次15分鐘。
[0093]對于長度為至少100個核苷酸的探針,極高等嚴格條件定義為,在42°C下在5XSSPE、0.3%SDS、200mg/ml剪切并變性的鮭魚精子DNA和50%甲酰胺中預雜交并雜交,最佳地,之后進行12~24個小時的標準Southern印跡過程。載體材料最終使用2XSSC、
0.2%SDS在70°C下清洗三次,每次15分鐘。
[0094]在另一個實施方式中,第一方面的陰性選擇標記與SEQ ID NO: 59的多肽編碼序列或其cDNA序列具有至少60%的序列同一性,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%的序列同一性。
[0095]在另一個實施方式中,陰性選擇標記編碼包括在一個或多個(例如數個)位置的取代、缺失和/或插入的SEQ ID NO:60的胞嘧啶脫氨酶多肽的變體。氨基酸變化優選性質小的變化,即不顯著影響蛋白質的折疊和/或活性的保守性氨基酸取代或插入;小的缺失,通常為I到大約30個氨基酸的缺失;小的氨基端或羧基端延伸,諸如氨基端的蛋氨酸殘基;最多約20~25個殘基的小接頭肽;或者通過改變凈電荷或其它功能而有助于純化的小延伸,諸如多聚組氨酸片段(tract)、抗原性表位或結合結構域。
[0096]保守性取代的實例是堿性氨基酸(精氨酸、賴氨酸和組氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、極性氨基酸(谷氨酰胺和天冬酰胺)、疏水氨基酸(亮氨酸、異亮氨酸和纈氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和蛋氨酸)各組內的取代。通常不改變比活度的氨基酸取代在本領域是已知的,并且在例如 H.Neurath and R.L.Hill, 1979, In, The Proteins, Academic Press, New York 中記載。常見的取代是 Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu 和 Asp/Gly。
[0097]或者,氨基酸改變具有這樣的性質,即多肽的理化性質發生改變。例如,氨基酸改變可以提高多肽的熱穩定性,改變底物專一性、改變最適PH等等。
[0098]多肽中的必需氨基酸可以根據本領域已知的程序如定點誘變或丙氨酸掃描誘變加以鑒定(Cunningham and Wells, 1989,Science244:1081-1085)。在后述技術中,在分子中的每個殘基處引入單一丙氨酸突變,且對生成的突變分子測試胞嘧啶脫氨酶活性,以鑒定對該分子的活性很關鍵的氨基酸殘基。還參見Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性位點或其他生物相互作用同樣可以通過結構的物理分析測定,如通過這樣的技術測定,如核磁共振、結晶學、電子衍射或光親合標記,連同假定接觸位點氨基酸的突變。例如,參閱 de Vos 等,1992,Science255:306-312 ;Smith 等,1992,J.Mol.Biol.224:899-904 ;Wlodaver 等,1992,FEBS Lett.309:59-64。必需氨基酸的鑒定也可以從與相關多肽的比對來推斷。
[0099]使用已知的誘變、重組和/或改組(shuffling)方法,接著進行相關的篩選步驟,比如 Reidhaar-Olson and Sauer, 1988,Science241:53-57 ;Bowie and Sauer, 1989, Proc.Natl.Acad.Sc1.USA86:2152-2156 ;W095/17413 ;或 W095/22625 所公開的,可以完成和測試單個或多個氨基酸的取代、缺失和/或插入。可以運用的其他方法包括易錯PCR、噬菌體展示(例如,Lowman 等,1991,Biochemistry30:10832-10837 ;U.S.專利號 5,223,409 ;W092/06204)和定位誘變(Derbyshire 等,1986,Gene46:145 ;Ner 等,1988,DNA7:127)。
[0100]誘變/改組方法可以與高通量的自動篩選方法結合,以檢測宿主細胞所表達的克隆的誘變多肽的活性(Ness等,1999, Nature Biotechnologyl7:893_896)。可以從宿主細胞回收編碼活性多肽的誘變DNA`分子且可以用本領域的標準方法來快速測序。這些方法允許對多肽中個別氨基酸殘基的重要性進行快速測定。
[0101]在實施方式中,引入到SEQ ID N0:60多肽中的氨基酸取代、缺失和/或插入的數目不多于10,例如,1、2、3、4、5、6、7、8或9。多肽可以是雜合多肽,在其中,一個多肽的區域融合在另一個多肽的區域的N端或C端。
[0102]具有胞嘧啶脫氨酶活性的多肽的來源
[0103]編碼本發明的具有胞嘧啶脫氨酶活性的多肽的多核苷酸可以從任何屬的微生物中獲得。出于本發明的目的,本文中與給定來源一起使用的術語“由……獲得”應指,由多核苷酸編碼的多肽是由該來源或插入了來自該來源的多核苷酸的菌株所產生。
[0104]胞嘧啶脫氨酶多肽可以是真菌多肽。例如,該多肽可以是酵母多肽,諸如假絲酵母屬(Candida)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Pichia)、酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)或耶氏酵母屬(Yarrowia)多肽;或絲狀真菌多肽,諸如支頂孢屬(Acremonium)、傘菌屬(Agaricus)、鏈格孢屬(Alternaria)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、Botryospaeria、擬臘菌屬(Ceriporiopsis)、毛 _ 殼屬(Chaetomidium)、金抱子菌屬(Chrysosporium)、麥角菌屬(Claviceps)、旋孢腔菌(Cochliobolus)、鬼傘屬(Coprinopsis)、乳白 蟻屬(Coptotermes)、棒囊殼屬(Corynascus)、栗疫屬(Cryphonectria)、隱球酵 母屬(Cryptococcus)、色二抱屬(Diplodia)、黑耳屬(Exidia)、Filibasidium、鐮 抱霉屬(Fusarium)、赤霉菌屬(Gibberella)、全鞭毛蟲屬(Holomastigotoides)、 腐質霉屬(Humicola)、把齒菌屬(Irpex)、香燕屬(Lentinula)、Leptospaeria、 稻痕菌屬(Magnaporthe)、Melanocarpus、Meripilus、毛霉屬(Mucor)、毀絲霉屬 (Myceliophthora)、Neocallimastix、脈抱菌屬(Neurospora)、擬青霉屬(Paecilomyces)、 青霉屬(Penicillium)、平革菌屬(Phanerochaete)、Piromyces、Poitrasia、假黑 盤菌屬(Pseudoplectania)、Pseudotrichonympha、根毛霉屬(Rhizomucor)、裂糟菌 屬(Schizophyllum)、柱頂孢屬(Scytalidium)、踝節菌屬(Talaromyces)、嗜熱子囊 菌屬(Thermoascus)、梭抱殼屬(Thielavia)、彎頸霉屬(Tolypocladium)、木霉屬 (Trichoderma)、長毛盤菌屬(Trichophaea)、輪枝孢屬(Verticillium)、小包腳燕屬 (Volvariella)或炭角菌屬(Xylaria)多肽。
[0105]另一方面,多妝是卡氏酵母(Saccharomyces carlsbergensis)、釀酒酵母 (Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵 母(Saccharomyces douglasii)、克魯弗酵母(Saccharomyces kluyveri)、諾地酵母 (Saccharomyces norbensis)或 Saccharomyces oviformis 多月太。
[0106]另一方面,多肽是解纖維枝頂孢霉(Acremonium cellulolyticus)、棘孢曲霉 (Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、煙曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillus japonicus)、構 巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、Chrysosporium inops、嗜角質金抱子菌(Chrysosporium keratinophilum)、 Chrysosporium lucknowense、Chrysosporium merdarium、Chrysosporium pannicola、 Chrysosporium queenslandicum、熱帶 金抱子 菌(Chrysosporium tropicum)、 Chrysosporium zonatum、桿抱狀德抱(Fusarium bactridioides)、Fusarium cerealis、 克地德刀菌(Fusarium crookwellense)、黃色德抱菌(Fusarium culmorum)、禾 谷德刀菌(Fusarium graminearum)、禾赤德抱(Fusarium graminum)、異抱德抱 (Fusarium heterosporum)、合歡木德抱(Fusarium negundi)、尖抱德抱菌(Fusarium oxysporum)、Fusarium reticulatum、粉紅德刀菌(Fusarium roseum)、接骨木德抱 (Fusarium sambucinum)、膚色德抱(Fusarium sarcochroum)、擬枝抱德刀菌(Fusarium sporotrichioides)、硫色德抱(Fusarium sulphureum)、Fusarium torulosum、擬絲抱德刀 菌(Fusarium trichothecioides)、Fusarium venenatum、灰腐質霉(Humicola grisea)、 特異腐質霉(Humicola insolens)、柔毛腐質霉(Humicola lanuginosa)、白把齒菌(Irpex lacteus)、米赫毛霉(Mucor miehei)、嗜熱毀絲霉(Myceliophthora thermophila)、 粗糖脈抱菌(Neurospora crassa)、繩狀青霉(Penicillium funiculosum)、產紫青霉 菌(Penicillium purpurogenum)、黃抱原毛平革菌(Phanerochaete chrysosporium)、 Thielavia achromatica、Thielavia albomyces、Thielavia albopilosa、澳洲梭抱殼 (Thielavia australeinsis)、Thielavia fimeti、小抱梭抱殼(Thielavia microspora)、 卵抱梭抱殼(Thielavia ovispora)、Thielavia peruviana、毛梭抱殼(Thielaviasetosa)、Thielavia spededonium、耐熱梭抱殼(Thielavia subthermophila)、太瑞斯梭抱殼霉(Thielavia terrestris)、哈茨木霉(Trichoderma harzianum)、康寧木霉(Trichoderma koningii)、長梗木霉(Trichoderma 1ngibrachiatum)> 里氏木霉(Trichoderma reesei)或綠色木霉(Trichoderma viride)多妝。
[0107]應當理解,對于前面提及的物種,本發明涵蓋上述物種的完全和不完全狀態(imperfect state)和其它分類學同等物,如無性型,而不論這些物種現在的名稱如何。
[0108]本領域技術人員將容易領會適當同等物的具體內容(identity)。這些物種的菌株可以從大量的培養物收藏中心為公眾獲得,諸如美國典型培養物收藏中心(AmericanType Culture Collection, ATCC)、Deutsche Sammlung von Mikroorganismen undZellkulturen GmbH (DSMZ)>Centraalbureau Voor Schimmelcultures (CBS)和北方地區研究中心(NRRL)的農業研究機構專利培養物收藏中心。
[0109]此外,可以使用上述探針由其它來源包括由自然界(如土壤、堆肥、水等等)分離的微生物鑒定并獲得多肽。用于由天然棲息地分離微生物的技術在本領域是眾所周知的。然后,相似地,可以通過對另一微生物的基因組DNA或cDNA文庫或者混合的DNA樣本進行篩選而獲得編碼多肽的多核苷酸。在用探針檢測到編碼多肽的多核苷酸后,可以通過本領域普通技術人員已知的技術分離或克隆多核苷酸(參閱Sambrook等人,1989,見上文)。
[0110]核酸構建體
[0111]本發明還涉及包括選擇標記和目標多核苷酸的核酸構建體或表達載體,該選擇標記和目標多核苷酸與一個或多個在合適的表達宿主細胞中指導表達的控制序列可操作地連接。在具體的實施方式中,本發明還涉及包括陰性選擇標記和目標多核苷酸的核酸構建體或表達載體,該陰性選擇標記和目標多核苷酸與一個或多個在合適的表達宿主細胞中指導表達的控制序列可操作地連接。
[0112]可以通過多種方式操縱多核苷酸以提供所編碼的多肽的表達。根據該表達載體,在多核苷酸插入到載體之前對多核苷酸進行操縱是合乎需要的或必須的。使用重組DNA方法修飾多核苷酸的技術在本領域是眾所周知的。
[0113]控制序列可以是啟動子序列,一種由宿主細胞識別以表達編碼本發明多肽的多核苷酸的多核苷酸。啟動子序列包含介導多肽表達的轉錄控制序列。啟動子可以是任何在選擇的宿主細胞中表現出轉錄活性的多核苷酸,包括突變、截短和雜合的啟動子,并且可從編碼胞外或胞內多肽的對于宿主細胞為同源或異源的基因得到。
[0114]用于在絲狀真菌宿主細胞中指導本發明核酸構建體轉錄的合適啟動子的實例是包括從構巢曲霉乙酰胺酶、黑曲霉中性α淀粉酶、黑曲霉酸穩定α淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori )葡糖淀粉酶(glaA)、米曲霉(Aspergillus oryzae) TAKA 淀粉酶、米曲霉堿性蛋白酶、米曲霉磷酸丙糖異構酶、尖孢鐮刀菌(Fusarium oxysporum)胰酶樣蛋白酶(W096/00787)、Fusarium venenatum 淀粉葡糖苷酶(W000/56900)、Fusariumvenenatum Daria (W000/56900)> Fusarium venenatum Quinn (W000/56900)、米黑根毛霉(Rhizomucor miehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉(Trichodermareesei) β -葡糖苷酶、里氏木霉纖維二糖水解酶1、里氏木霉纖維二糖水解酶I1、里氏木霉內切葡聚糖酶1、里氏木霉內切葡聚糖酶I1、里氏木霉內切葡聚糖酶II1、里氏木霉內切葡聚糖酶IV、里氏木霉內切葡聚糖酶V、里氏木霉木聚糖酶1、里氏木霉木聚糖酶I1、里氏木霉β-木糖苷酶的基因獲得的啟動子,以及NA2-tpi啟動子(編碼中性α淀粉酶的曲霉基因的修飾啟動子,其中不翻譯的前導被編碼磷酸丙糖異構酶的曲霉基因的不翻譯前導替代;非限制性實例包括來自編碼中性α淀粉酶的黑曲霉基因的修飾啟動子,其中不翻譯前導被編碼磷酸丙糖異構酶的構巢曲霉或米曲霉基因的不翻譯前導替代);及其突變的、截短的和雜合的啟動子。
[0115]在酵母宿主中,有用的啟動子從釀酒酵母(Saccharomyces cerevisiae)烯醇酶(EN0-1)、釀酒酵母半乳糖激酶(GAL1)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH1、ADH2/GAP)、釀酒酵母磷酸丙糖異構酶(TPI)、釀酒酵母金屬硫蛋白(CUPl)以及釀酒酵母3-磷酸甘油酸激酶的基因獲得。其它用于酵母宿主細胞的有用啟動子在Romanos等人(1992,酵母(Yeast) 8 =423-488)中記載。
[0116]控制序列還可以是合適的轉錄終止子序列,其由宿主細胞識別以終止轉錄。終止子序列與編碼多肽的多核苷酸的3’末端可操作地連接。在選定的宿主細胞中發揮功能的任何終止子都可以用于本發明。
[0117]用于絲狀真菌宿主細胞的優選終止子從構巢曲霉的鄰氨基苯甲酸合成酶基因、黑曲霉的葡糖淀粉酶基因、黑曲霉的α -葡糖苷酶基因、米曲霉的TAKA淀粉酶基因和尖孢鐮刀菌的類胰蛋白酶蛋白酶基因獲得。
[0118]用于酵母宿主細胞的優選終止子從釀酒酵母的烯醇酶基因、釀酒酵母的細胞色素C (CYCl)基因和釀酒酵母的甘油醛-3-磷酸脫氫酶基因獲得。其它用于酵母宿主細胞的有用終止子在Romanos等人(1992,見上文)中記載。
[0119]控制序列還可以是合適的前導序列,其在轉錄時是mRNA的非翻譯區且對于宿主細胞進行的翻譯很重要。前導序列與編碼多肽的多核苷酸的5’端可操作地連接。可使用任何在選擇的宿主細胞中有功能的前導序列。
[0120]用于絲狀真菌宿主細胞的優選前導序列從米曲霉的TAKA淀粉酶基因和構巢曲霉的磷酸丙糖異構酶基因獲得。`
[0121]用于酵母宿主細胞的合適前導序列由釀酒酵母的烯醇酶(ΕΝ0-1)基因、釀酒酵母的3-磷酸甘油酸激酶基因、釀酒酵母的α -因子基因和釀酒酵母的醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)基因獲得。
[0122]控制序列還可以是多腺苷酸化序列,即與多核苷酸的3’末端可操作地連接、當轉錄時由宿主細胞識別作為向轉錄的mRNA添加多腺苷酸殘基的信號的序列。可以使用在選定的宿主細胞中發揮功能的任何多腺苷酸化序列。
[0123]用于絲狀真菌宿主細胞的優選多腺苷酸化序列由米曲霉的TAKA淀粉酶基因、黑曲霉的葡糖淀粉酶基因、構巢曲霉的鄰氨基苯甲酸合成酶基因、尖孢鐮刀菌的類胰蛋白酶蛋白酶基因和黑曲霉的α-葡糖苷酶基因獲得。
[0124]Guo 和 Sherman (1995, Mol.Cellular Biol.15:5983-5990)描述了可用于酵母宿
主細胞的多腺苷酸化序列。
[0125]控制序列也可以是編碼與多肽的N端連接并指導多肽進入細胞的分泌通路的信號肽的信號肽編碼區。多核苷酸的編碼序列的5’端本身可包含在翻譯閱讀框中天然與編碼多肽的編碼序列片段相連接的信號肽編碼序列。或者,編碼序列的5’端可含有對于該編碼序列為外源的信號肽編碼序列。在編碼序列并不天然包含信號肽編碼序列的情況下可能需要外源的信號肽編碼序列。或者,為增強多肽的分泌,可以簡單地用外源信號肽編碼序列替換天然信號肽編碼序列。然而,可以使用指導所表達多肽進入選定宿主細胞的分泌通路的任何信號妝編碼序列。
[0126]用于絲狀真菌宿主細胞的有效信號肽編碼序列是獲自黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特異腐質霉(Humicola insolens)纖維素酶、特異腐質酶內切葡聚糖酶V、柔毛腐質霉(Humicola lanuginosa)脂肪酶以及米黑根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶的基因的信號肽編碼序列。
[0127]可用于酵母宿主細胞的信號肽獲自釀酒酵母α因子和釀酒酵母轉化酶的基因。其他可用的信號肽編碼序列在Romanos等,1992 (同上)中有過描述。
[0128]控制序列也可以是編碼位于多肽N端的前肽的前肽編碼序列。得到的多肽被稱為酶原(proenzyme)或多肽原(或在一些情況下為酶原(zymogen))。多肽原通常為無活性的并能夠通過前肽的催化切割或自身催化切割而從多肽原轉化為活性多肽。
[0129]當信號肽和前肽序列在多肽的N端同時存在時,前肽序列的位置緊鄰于多肽的N端,且信號肽序列的位置緊鄰于前肽序列的N端。
[0130]也可能期望加入相對于宿主細胞的生長對多肽表達進行調控的調控序列。調控體系的例子是使得基因表達響應于化學或物理刺激(包括調控化合物的存在)而打開或關閉的那些。原核系統中的調控體系包括lac、tac和trp操縱基因體系。在酵母中,可以使用ADH2體系或GALl體系。在絲狀真菌中,可以使用黑曲霉葡糖淀粉酶啟動子、米曲霉TAKA α -淀粉酶啟動子和米曲霉葡糖淀粉酶啟動子。調控序列的其他例子是允許基因擴增的那些。在真核系統中,這些調控序列包括,在甲氨蝶呤的存在下擴增的二氫葉酸還原酶基因、以及在重金屬下擴增的金屬硫蛋白基因。在這些情況中,編碼多肽的多核苷酸將與調控序列可操作地連接。
[0131]表汰載體
[0132]本發明還涉及重組表達載體,包括本發明的多核苷酸、啟動子、以及轉錄和翻譯終止信號,以及如本文所述的,一對在目標多核苷酸側翼的位點特異性重組酶的識別序列、啟動子和轉錄及翻譯終止信號。可將多種核苷酸和控制序列連接在一起,產生可包括一個或多個方便的限制性位點的重組表達載體,從而可以在這些位點插入或替代編碼多肽的多核苷酸。或者,可以通過將多核苷酸或包括該序列的核酸構建體插入到合適的表達載體中來表達多核苷酸。在建立表達載體時,編碼序列位于載體中,使得該編碼序列與用于表達的適當控制序列可操作地連接。
[0133]重組表達載體可以是能夠方便地進行重組DNA程序并能使多核苷酸表達的任何載體(例如,質粒或病毒)。載體的選擇將通常取決于載體和載體將要被引入的宿主細胞之間的相容性。載體可以是線性或閉合的環狀質粒。
[0134]載體可以是自主復制型載體,即作為染色體外實體而存在、其復制獨立于染色體復制的載體,例如,質粒、染色體外元件、微型染色體或人工染色體。載體可以包括確保自我復制的任何元件(means)。或者,載體可以是,在被引入宿主細胞后整合到基因組中并與其整合的染色體一起復制的載體。此外,可以使用單個載體或質粒,或一起包含將要引入宿主細胞基因組中的總DNA的兩個或多個載體或質粒,或轉座子。
[0135]載體優選包含一個或多個允許方便地選擇轉化細胞、轉染細胞、轉導細胞等細胞的選擇標記。選擇標記是其產物例如提供殺生物劑或病毒抗性、重金屬抗性、相對營養缺陷型的原養型等的基因。
[0136]用于酵母宿主細胞的合適標記為,ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于絲狀真菌宿主細胞中的選擇標記包括但不限于amdS (乙酰胺酶)、argB (鳥氨酸氨甲酰基轉移酶)、bar (草胺勝乙酸轉移酶,phosphinothricin acetyltransferase)、hph (潮霉素磷酸轉移酶)、niaD (硝酸還原酶)、pyrG (乳清酸核苷_5’-磷酸脫羧酶)、sC (硫酸腺苷酰轉移酶,sulfate adenyltransferase)和trpC (鄰氨基苯甲酸合酶)、及其等同物。優選用于曲霉細胞中的是構巢曲霉或米曲霉amdS和pyrG基因以及吸水鏈霉菌(Streptomyceshygroscopicus) bar 基因。
[0137]用于連接上述元件以構建本發明的重組表達載體的步驟是本領域技術人員熟知的(參見,例如,Sambrook等,1989,見上)。
[0138]宿豐細朐
[0139]本發明還涉及通過本發明的方法轉化的重組宿主細胞。本發明還涉及適合于用包含目標多核苷酸的整合核酸構建體向宿主細胞基因組中進行轉化的重組宿主細胞,其中目標多核苷酸的側翼是與胞嘧啶脫氨酶編碼基因同源的區域或與分別在該基因的上游和下游的區域同源的區域,該整合核酸構建體指導通過位點特異性雙同源重組進行的染色體整合,借此目標多核苷酸整合到該宿主細胞的基因組中,同時該胞嘧啶脫氨酶編碼基因被部分或全部切除并因此失活。駐留胞嘧啶脫氨酶編碼基因的成功失活在培養基包括包含5-氟胞嘧啶的培養基中是可以選擇的,5-氟胞嘧啶通過胞嘧啶脫氨酶轉化成有毒的5-氟尿嘧啶。所以,在這樣的轉化方法中,胞嘧啶脫氨酶編碼基因起陰性選擇標記的作用,如在本發明的方法中概述的一樣。
[0140]具有不能測量的胞嘧啶脫氨酶活性的宿主細胞適合于這樣的轉化方法,在該轉化方法中,用包括至少一個可表達的編碼胞嘧啶脫氨酶的多核苷酸的核酸構建體轉化該宿主細胞,然后在有利于胞嘧啶脫氨酶表達的條件下在包括從頭嘧啶合成抑制劑的生長培養基中用作陽性選擇標記。優選地,從頭嘧啶合成抑制劑是N-膦乙酰基-L-天冬氨酸(PALA),其抑制天冬氨酸氨甲酰基轉移酶。
[0141]術語“宿主細胞”包括任意因復制過程中發生的突變而與親本細胞不同的親本細胞后代。對于宿主細胞的選擇將很大程度取決于編碼多肽的基因及其來源。
[0142]宿主細胞可以是真菌細胞。本文中使用的“真菌”包括子囊菌門(Ascomycota)、擔子菌門(Basidiomycota)、壺菌門(Chytridiomycota)和接合菌門(Zygomycota)(如在 Hawksworth 等,In, Ainsworth and Bisbyj s Dictionary of The Fungi,8thedition, 1995, CAB International, University Press, Cambridge, UK 中定義的)以及卵菌門(Oomycota)(如在Hawksworth等,1995,同上,pagel71中引用的)和所有有絲分裂的孢子真菌(Hawksworth 等,1995,同上)。
[0143]真菌宿主細胞可以是酵母細胞。本文中使用的“酵母”包括產子囊酵母(內孢霉目(Endomycetales))、產擔抱子(basidiosporogenous)酵母以及屬于半知菌類(FungiImperfecti)芽孢綱(Blastomycetes)的酵母。因為酵母分類將來可能會變化,出于本發明的目的,酵母應按 Biology and Activities of YeastC Skinner, F.A., Passmore, S.M., andDavenport, R.R., eds, Soc.App.Bacteriol.Symposium Series N0.9, 1980)中的描述來定義。[0144]酵母宿主細胞可以是假絲酵母屬(Candida)、漢遜酵母屬(Hansenula)、克魯維酵母屬(Kluyveromyces )、畢赤酵母屬(Pichia)、酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)、或耶氏酵母屬(Yarrowia)細胞,例如乳酸克魯維酵母(Kluyveromyces lactis)、卡爾酵母(Saccharomyces carlsbergensis)、釀酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、Saccharomycesdouglasi1、克魯弗酵母(Saccharomyces kluyveri)、Saccharomyces norbensis、Saccharomyces oviformis 或解脂耶氏酵母(Yarrowia lipolytica)細胞。
[0145]真菌宿主細胞可以是絲狀真菌細胞。“絲狀真菌”包括真菌門(Eumycota)和卵菌門亞門的所有絲狀類型(如Hawksworth等,1995,同上,定義的)。絲狀真菌的總體特征為,由幾丁質、纖維素、葡聚糖、殼聚糖、甘露聚糖和其他復合多糖構成的菌絲體壁。營養生長是通過菌絲延伸進行的,且碳的分解代謝一般是專性需氧的。相反,酵母例如釀酒酵母的營養生長是通過單細胞菌體的出芽來進行的,且碳的分解代謝可以是發酵的。
[0146]絲狀真菌宿主細胞可以是支頂孢屬(Acremonium)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、煙管菌屬(Bjerkandera)、擬錯菌屬(Ceriporiopsis)、金抱子菌屬(Chrysosporium)、鬼傘屬(Coprinus)、革蓋菌屬(Coriolus)、隱球菌屬(Cryptococcus)、Filibasidium、鐮孢霉屬(Fusarium)、腐質霉屬(Humicola)、稻痕菌屬(Magnaporthe)、毛霉屬(Mucor)λ 毀絲霉屬(Myceliophthora)、Neocallimastix、脈抱菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、平革菌屬(Phanerochaete)、射脈菌屬(Phlebia)、Piromyces、側耳屬(Pleurotus)、裂糟菌屬(SchizophylIum)、踩節菌屬(Talaromyces)、嗜熱子囊菌屬(Thermoascus)、梭孢殼屬(Thielavia)、彎頸霉屬(Tolypocladium)、栓菌屬(Trametes)或木霉屬(Trichoderma)細胞。
[0147]例如,該真菌宿主細胞可以是泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、煙曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillusjaponicus)、構巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、煙管菌(Bjerkandera adusta)、干擬錯菌(Ceriporiopsisaneirina)、Ceriporiopsis caregiea、淺黃擬錯孔菌(Ceriporiopsis gilvescens)、Ceriporiopsis pannocinta、 Ceriporiopsis rivulosa、 Ceriporiopsis subrufa、蟲擬錯菌(Ceriporiopsis subvermispora)、Chrysosporium inops、嗜角質金抱子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、Chrysosporiummerdarium、Chrysosporium pannicola、Chrysosporium queenslandicum、熱帶金抱子菌(Chrysosporium tropicum)、Chrysosporium zonatum、灰蓋鬼傘(Coprinus cinereus)、毛云芝菌(Coriolus hirsutus)、Fusarium bactridioides、Fusarium cerealis、Fusariumcrookwellense、黃色德刀菌(Fusarium culmorum)、禾谷德抱菌(Fusarium graminearum)、禾赤德抱(Fusarium graminum)、異抱德抱(Fusarium heterosporum)、Fusarium negund1、尖抱德刀菌(Fusarium oxysporum)、Fusarium reticulatum、粉紅色德刀菌(Fusariumroseum)、接骨木德刀菌(Fusarium sambucinum)、膚色德抱(Fusarium sarcochroum)、擬枝抱德刀菌(Fusarium sporotrichioides)、硫色德刀菌(Fusarium sulphureum)、Fusariumtorulosum、擬絲抱德刀菌(Fusarium trichothecioides)、Fusarium venenatum、特異腐質霉(Humicola insolens)、柔毛腐質霉(Humicola lanuginosa)、米赫毛霉(Mucor miehei)、嗜熱毀絲菌(Myceliophthora thermophila)、粗糖脈抱菌(Neurospora crassa)、產紫青霉(Penicillium purpurogenum)、黃抱原毛平革菌(Phanerochaete chrysosporium)、脈射側菌(Phlebia radiata)、白腐菌(Pleurotus eryngii)、太瑞斯梭孢殼霉(Thielaviaterrestris)、長絨毛栓菌(Trametes villosa)、變色栓菌(Trametes versicolor)、哈 I β S'(Trichoderma harzianum)> tJ2 β (Trichoderma koningii)> ix 1?
霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)、或綠色木霉(Trichoderma viride)細胞。
[0148]可以通過涉及原生質體形成、原生質體轉化以及細胞壁再生的方法以本質上已知的方式來轉化真菌細胞。用于曲霉和木霉宿主細胞的轉化的合適過程在EP238023、Yelton 等,1984,Proc.Natl.Acad.Sc1.USA81:1470-1474、和 Christensen 等,1988, Bio/Technology6:1419-1422中有過描述。用于轉化鐮孢菌屬的適當方法描述于Malardier等,1989,Gene78:147-156 和 W096/00787 中。酵母可以使用在 Becker and Guarente, InAbelson, J.N.and Simon, Μ.1., editors,Guide to Yeast Genetics and MolecularBiology, Methods in Enzymology,Volumel94, ppl82-187, Academic Press,Inc., NewYork; Ito 等,1983,J.Bacteriol.153:163;and Hinnen 等,1978,Proc.Natl.Acad.Sc1.USA75:1920中描述的方法進行轉化。
[0149]胞嘧啶脫氨酶活性的去除或降低
[0150]本發明還涉及產生親本細胞的突變體的方法,該方法包括使第一方面的多核苷酸或其編碼胞嘧啶脫氨酶的部分滅活、破壞或缺失,結果產生當在同樣的條件下培養時與親本細胞相比產生更少或 不產生所編碼的胞嘧啶脫氨酶的突變細胞。
[0151]可以運用本領域中熟知的方法(例如插入、破壞、取代或缺失)通過減少或消除多核苷酸的表達來構建突變細胞。在優選的方面,多核苷酸被失活。例如,待修飾或失活的多核苷酸可以是編碼區域或其對于活性而言必需的一部分,或編碼區域表達所需的調控元件。這樣的調控序列或控制序列的實例可以是啟動子序列或它的功能性部分,即,足以影響該多核苷酸的表達的部分。用于可能的修飾的其他控制序列包括但不限于前導序列、多腺苷酸化序列、前肽序列、信號肽序列、轉錄終止子和轉錄激活因子。
[0152]可以通過對親本細胞進行誘變并選擇其中多核苷酸的表達降低或消除的突變細胞,進行多核苷酸的修飾或失活。例如,可以通過使用合適的物理或化學誘變劑、通過使用合適的寡核苷酸或通過對DNA序列進行PCR產生的誘變來進行誘變,該誘變可以是特異或隨機的。此外,可以通過使用這些誘變劑的任意組合進行誘變。
[0153]適合于本發明目的的物理或化學誘變劑的實例包括紫外線(UV)照射、羥胺、N-甲基-N’ -硝基-N-亞硝基胍(MNNG)、0-甲基羥胺、亞硝酸、甲基磺酸乙酯(EMS)、亞硫酸氫鈉、甲酸和核苷酸類似物。
[0154]當使用這些試劑時,通常通過在合適條件下在選定誘變劑的存在下培育要突變的親本細胞,并篩選和/或選擇表現出降低的基因表達或沒有該基因表達的突變細胞來進行誘變。
[0155]多核苷酸的修飾或失活可以通過在基因中或其轉錄或翻譯所需的調控元件中插入、取代或缺失一個或多個核苷酸來實現。例如,可以插入或除去核苷酸,從而引入終止密碼子、引起起始密碼子的除去或引起開放閱讀框的改變。根據本領域的已知方法,這樣的修飾或失活可以通過定點誘變或PCR產生的誘變來實現。雖然從理論上說,可以在體內進行修飾,即,直接在表達待修飾的多核苷酸的細胞上進行修飾,但優選如下文所示例的在體外進行修飾。
[0156]消除或降低多核苷酸的表達的方便方法的實例是基于基因取代、基因缺失或基因破壞的技術。例如,在基因破壞方法中,在體外對對應于內源多核苷酸的核酸序列進行誘變以產生缺陷的核酸序列,然后將該序列轉化到親本細胞以產生缺陷型基因。通過同源重組,該缺陷核酸序列取代了內源多核苷酸。可能期望該缺陷型多核苷酸還編碼可以用于選擇其中多核苷酸已被修飾或破壞的轉化子的標記物。在一個方面,多核苷酸被如本文所描述的這些可選標記破壞。
[0157]本發明還涉及抑制具有胞嘧啶脫氨酶活性的多肽在細胞中表達的方法,其包括對細胞施用雙鏈RNA (dsRNA)分子或者在細胞中表達雙鏈RNA (dsRNA)分子,其中該dsRNA包含本發明多核苷酸的子序列。在優選的方面,dsRNA是長約15、16、17、18、19、20、21、22、23、24、25或更多的雙鏈體(duplex)核苷酸。
[0158]dsRNA優選是小干擾RNA (siRNA)或微RNA (miRNA)。在優選的方面,dsRNA是用于抑制轉錄的小干擾RNA。在另一優選的方面,dsRNA是用于抑制翻譯的微RNA。
[0159]本發明還涉及用于抑制細胞中多肽表達的這種雙鏈RNA (dsRNA)分子,其包含SEQID N0:59的多肽編碼序列的一部分。本發明不局限于任何特定的作用機制,dsRNA能進入細胞,并引起相似或相同序列的單鏈RNA (ssRNA)包括內源mRNA的降解。當細胞暴露于dsRNA時,來自同源基因的mRNA選擇性地通過稱為RNA干擾(RNAi)的過程被降解。
[0160]本發明的dsRNA可以用于基因沉默中。在一個方面,本發明提供使用本發明的dsRNAi選擇性地降解RNA的方 法。該方法可以在體外、先體外后體內(ex vivo)或在體內實踐。在一個方面,該dsRNA分子可以用于在細胞、器官或動物中產生功能喪失突變(loss-of-function mutation)。制備和使用選擇性降解RNA的dsRNA分子的方法在本領域中公知;參見,例如,美國專利N0.6,489,127 ;N0.6,506,559 ;N0.6,511,824 ;和N0.6,515,109。
[0161]本發明進一步涉及親本細胞的突變細胞,其包括編碼胞嘧啶脫氨酶多肽的多核苷酸或其控制序列的破壞或缺失或者編碼該多肽的沉默基因,這導致突變細胞與親本細胞相比產生較少的胞嘧啶脫氨酶或不產生胞嘧啶脫氨酶。
[0162]胞嘧啶脫氨酶缺陷型突變細胞作為宿主細胞用于轉化編碼目標原生蛋白和異源蛋白的基因是特別有用的。因此,本發明還涉及產生原生或異源多肽的方法,其包括:(a)在有益于產生多肽的條件下培養突變細胞jP(b)回收所述多肽。術語“異源多肽”是指對于宿主細胞而言不是原生的多肽,例如,原生多肽的突變體。宿主細胞可以包括多于一個拷貝的編碼原生或異源多肽的多核苷酸。
[0163]用于培養和純化目標產物的方法可以用本領域已知的方法進行。
[0164]重組酶的短暫表達
[0165]有眾多眾所周知的簡單方法來實現本發明第一方面中步驟(C)的位點特異性重組酶的短暫表達。
[0166]首先,有利的是,在引入到細胞中的核酸構建體內包含編碼重組酶的多核苷酸,SP使使用這種方式,核酸構建體在整合后也可以很容易地從細胞中去除而在染色體中留下剩余的整合目標多核苷酸。一個這樣的方法被用于實施例中且也在圖1中概括出,其中指示出優選的識別位點對,即FRT-F和FRT-F3,以及FLP重組酶編碼基因和雙向pyrG標記及雙轉錄終止子(在圖1中指示為“Term”),其對于之后通過雙同源重組切除FLP基因和pyrG標記充當同源盒。當然,圖1中的術語僅是實例且不是意在限制本發明的范圍,它們可以被其他眾所周知的標記和識別序列對等替換。
[0167]在第一方面的優選實施方式中,核酸構建體(兩側同樣是該對識別序列)進一步包括:進入選擇標記和編碼位點特異性重組酶的多核苷酸,其依次在兩側是一對同源盒,它們全部與步驟(C)中的目標多核苷酸一起整合。優選地,該進入選擇標記使得可以進行陽性選擇或陰性選擇或者該進入選擇標記是雙向的。然后,設想該第一方面的方法包括對步驟(C)中通過目標多核苷酸連同進入選擇標記和編碼位點特異性重組酶的多核苷酸的雙同源重組進行的整合進行陽性選擇,其中后兩者在兩側是同源盒。進一步地,該方法包括對進入選擇標記和編碼位點特異性重組酶的多核苷酸的每個整合拷貝的切除進行陰性選擇的步驟,其中切除通過其側翼同源盒之間的雙同源重組而進行。
[0168]在另一個優選實施方式中,第二核酸構建體在步驟(b)中被引入該細胞中,該第二核酸構建體是非復制型或是溫度敏感復制型,其包括編碼該位點特異性重組酶的多核苷酸和選擇標記,并分別通過選擇壓力或在許可溫度下的生長而短暫維持在該細胞內,從而使該位點特異性重組酶可以在步驟(C)中短暫表達,其中該選擇標記使得可以進行陽性選擇或陰性選擇或者其是雙向的。
[0169]在最后的優選實施方式中,步驟(a)中的細胞在其染色體內包括至少一個拷貝的與緊密調節型啟動子可操作地連接的編碼該位點特異性重組酶的多核苷酸,該啟動子可以通過改變生長條件而被啟動或關閉,例如通過提供特定的碳源或誘導物,從而可以在步驟
(c)中進行該位點特異性重組酶的短暫表達。
[0170]實施例`
[0171]分子克隆技術記載于Sambrook, J.,Fritsch, E.F., Maniatis, T.(1989)《分子克隆:實驗室手冊》(Molecular Cloning:A Laboratory Manual)(第2版),冷泉港實驗室,冷泉港,紐約。
[0172]塵
[0173]用于DNA操作的酶(如限制性內切酶、連接酶等等)可得自New England Biolabs,Inc.且根據供應商的說明書使用。
[0174]培養基和試劑
[0175]使用以下培養基和試劑除非另有說明:
[0176]用于緩沖劑和底物的化學品是分析等級的商品。
[0177]Cove:342.3g/L鹿糖,20ml/L COVE鹽溶液,IOmM 乙酰胺,30g/L諾布爾瓊脂(nobleagar)。
[0178]Cove頂層瓊脂:342.3g/L蔗糖,20ml/L COVE鹽溶液,IOmM乙酰胺,10g/L低熔點瓊脂糖。
[0179]Cove-2:30g/L 蔗糖,20ml/L COVE 鹽溶液,IOmM 乙酰胺,30g/L 諾布爾瓊脂。
[0180]Cove-N (tf)平板由 342.3g 鹿糖,20ml Cove 鹽溶液,3g NaNO3,以及 30g 諾布爾瓊脂和水(每升)構成。
[0181]Cove-N平板由30g鹿糖,20ml Cove鹽溶液,3g NaNO3,以及30g諾布爾瓊脂和水(每升)構成。
[0182]COVE 鹽溶液由 26g KC1,26g MgSO4.7H20,76g KH2PO4 以及 50ml Cove 微量金屬和水(每升)構成。
[0183]COVE 微量金屬溶液由 0.04g NaB4O7.IOH2O, 0.4g CuSO4.5H20,1.2g FeSO4.7H20,
1.0g MnSO4.H20,0.8g 中性淀粉酶 II MoO2.2H20,以及 10.0g ZnSO4.7H20 和水(每升)構成。
[0184]Cove-N頂層瓊脂由342.3g蔗糖,20ml COVE鹽溶液,3g NaNO3,以及IOg低熔點瓊脂糖和水(每升)構成。
[0185]淀粉葡糖苷酶微量金屬溶液由6.8g ZnCl2.7H20, 2.5g CuSO4.5H20,0.24gNiCl2.6H20,13.9g FeSO4.7H20,13.5g MnSO4.H2O 以及 3g 檸檬酸和水(每升)構成。
[0186]YPG 由 4g 酵母提取物,Ig KH2PO470.5g MgSO4.7Η20 和 15g 葡萄糖(ρΗ6.0)和水(每升)構成。
[0187]STC緩沖液由0.8Μ山梨醇,25mM Tris (pH8)以及25mM CaCl2和水(每升)構成。
[0188]STPC緩沖液由其中含40%PEG4000的STC緩沖液構成。
[0189]MLC由40g葡萄糖,50g大豆粉末,4g檸檬酸(pH5.0)和水(每升)構成。
[0190]MSS由70g鹿糖,100g大豆粉末(p`H6.0)和水(每升)構成。
[0191]MU-1 由 260g 麥芽糖糊精,3g MgSO4.7H20,5g KH2PO4,6g K2SO4,0.5ml 淀粉葡糖苷酶微量金屬溶液,以及2g尿素(pH4.5)和水(每升)構成。
[0192]KCl平板由0.6M KCl,20ml Cove鹽溶液,3g NaNO3以及30g諾布爾瓊脂和水(每升)構成。
[0193]5-氟胞嘧啶儲液:1000mg5-氟胞嘧啶溶解于Iml0.9INaCl溶液中。
[0194]購買的材料(大腸桿菌,質粒和試劑盒)
[0195]大腸桿菌DH5-a (Toyobo)用于質粒構建和擴增。商業質粒/載體TOPO克隆試劑盒(Invitrogen)和 pBluescript II SK- (Stratagene#212206)用于 PCR 片段的克隆。擴
增的質粒由Qiagen?質粒試劑盒(Qiagen)回收。用DNA連接試劑盒(Takara)或T4DNA連接酶(Boehringer Mannheim)來完成連接。用 Expand TM PCR體系(Boehringer Mannheim)來進行聚合酶鏈反應(PCR)。QIAquickTM凝膠提取試劑盒(Qiagen)用于PCR片段純化和從瓊脂糖凝膠提取DNA片段。
[0196]菌株
[0197]W02000/039322中描述了米曲霉BECh-2。構巢曲霉菌株NRRL1092用作供體株。
[0198]表達宿主菌株黑曲霉NN059095由Novozymes分離且是從土壤中分離的黑曲霉NN049184的派生物。對NN059095進行基因改造以破壞淀粉葡糖苷酶活性的表達。
[0199]W02005/070962的實施例11中描述了米曲霉ToC1512。
[0200]質粒
[0201]專利申請W02006/069289描述了表達質粒pHUda440和來自瓣環栓菌(Trametescingulata)的淀粉葡糖苷酶的核苷酸序列。
[0202]W007045248的實施例9中描述了質粒pJaL574和單純皰疹病毒(HSV)胸苷激酶基因(TK)、構巢曲霉甘油醛-3-磷酸脫氫酶啟動子(Pgpd)和構巢曲霉色氨酸合成酶終止子(TtrpC)的核苷酸序列。
[0203]專利公開W02005070962描述了表達盒質粒pJaL790和中性淀粉酶II啟動子(Pna2)的核苷酸序列。
[0204]專利申請10729.000-US中描述了 JAl26淀粉酶表達載體。 [0205]專利W02001/068864的實施例8中描述了質粒pDV8。
[0206]實施例10中描述了質粒pJaL504。
[0207]實施例10 中描述了質粒 pJaL504-delta_Bglll。
[0208]專利W02000/050567A1的實施例1中描述了質粒pJaL554。
[0209]質粒pJaL574記載于實施例10中。
[0210]質粒pJaL835記載于實施例10中。
[0211 ] 質粒pJaL955記載于實施例10中。
[0212]質粒pJaL1022記載于實施例10中。
[0213]質粒pJaL1025記載于實施例10中。
[0214]質粒pJaL1027記載于實施例10中。
[0215]質粒pJaL1029記載于實施例10中。
[0216]質粒pJaL1120記載于實施例10中。
[0217]質粒pJaL1123記載于實施例10中。
[0218]質粒pJaL1183記載于實施例10中。
[0219]質粒pJaL1194記載于實施例10中。
[0220]質粒pJaL1202記載于實施例10中。
[0221]專利W091/17243 中記載了質粒 pToC65。
[0222]質粒pUC19:該構建記載于 Vieira 等,1982,基因(Gene) 19:259-268。
[0223]質粒pCR? 4Blunt TOPO?來自 Invitrogen
[0224]曲霍的轉化
[0225]曲霉屬菌株的轉化可使用用于酵母轉化的一般方法實現。本發明的優選步驟描述如下。
[0226]將黑曲霉宿主菌株接種至補充IOmM尿苷的100ml YPG培養基中,并在32°C以80rpm溫育16小時。收集沉淀,用0.6M KCl洗滌,并重懸于20ml含有終濃度為20mg/ml的市售 β -葡聚糖酶產物(GLUCANEX?, Novozymes A/S,Denmark)的 0.6Μ KCl
中。將懸液于32°C在振動下(SOrpm)溫育直至形成原生質體,然后用STC緩沖液洗滌兩次。對原生質體用血細胞計數器計數,在STC:STPC:DMS0為8:2:0.1的溶液中重懸并調節至
2.5 X IO7個原生質體/ml的終濃度。將大約4 μ g的質粒DNA添加至100 μ I的原生質體懸液,輕柔混合,并在冰上溫育30分鐘。添加Iml的SPTC,并將原生質體懸液在37°C溫育20分鐘。在添加IOml的50°C Cove或Cove-N頂層瓊脂糖之后,將反應物傾至Cove或Cove-N(tf)瓊脂平板上,并將平板在32°C溫育5日。
[0227]其它真菌宿主比如木霉屬菌株的轉化也可以使用用于真菌轉化的一般方法實現。
[0228]PCR 擴增
[0229]
【權利要求】
1.一種用于將兩個或更多個拷貝的目標多核苷酸同時整合到真菌宿主細胞的染色體中的方法,所述方法包括以下步驟: (a)提供在其染色體內包括至少兩個整合位點的真菌宿主細胞,每個整合位點包括一對位點特異性重組酶的識別序列,每對識別序列位于駐留陰性選擇標記的兩側; (b)向所述細胞中引入核酸構建體,所述核酸構建體包括一對所述位點特異性重組酶的識別序列,所述識別序列對位于所述目標多核苷酸的兩側; (C)在所述細胞中短暫表達所述位點特異性重組酶,借此染色體的識別序列對通過所述重組酶與所述核酸構建體的對應的識別序列對重組,從而使得在所述至少兩個整合位點,所述染色體中的駐留陰性選擇標記被切除而所述目標多核苷酸的拷貝整合到它的位置上,產生包括兩個或更多個拷貝的整合到所述真菌宿主細胞的染色體中的所述目標多核苷酸的真菌宿主細胞。
2.根據權利要求1所述的方法,進一步包括在選擇性培養基中培養步驟(C)中的真菌宿主細胞并選擇其中真菌宿主細胞包括至少兩個整合到所述真菌宿主細胞的染色體中的目標多核苷酸的細胞。
3.根據權利要求1所述的方法,其中所述目標多核苷酸包括編碼至少一個目標多肽的操縱子或開放閱讀框。
4.根據權利要求1~3中任一項所述的方法,其中所述目標多肽包括酶,優選為水解酶、異構酶、連接酶、裂解酶、氧化還原酶或轉移酶,例如氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維二糖水解酶、纖維素酶、幾丁質酶、角質酶、環糊精糖基轉移酶、脫氧核糖核酸酶、內切葡聚糖酶、酯酶、α-半乳糖苷酶、β -半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β -葡糖苷酶、轉化酶、漆酶、脂肪酶、甘露糖苷酶、變聚糖酶、氧化酶、果膠分解酶、過氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶、木聚糖酶、或β -木糖苷酶。
5.根據權利要求1~4中任`一項所述的方法,其中所述真菌宿主細胞是絲狀真菌宿主細胞;優選為支頂孢屬(Acremonium)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、煙管菌屬(Bjerkandera)、擬臘菌屬(Ceriporiopsis)、金孢子菌屬(Chrysosporium)、鬼傘屬(Coprinus)、革蓋菌屬(Coriolus)、隱球菌屬(Cryptococcus)、Filibasidium、鍵抱霉屬(Fusarium)、腐質霉屬(Humicola)、稻痕菌屬(Magnaporthe)、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、Neocallimastix、脈抱菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、平革菌屬(Phanerochaete)、射脈菌屬(Phlebia)、Piromyces、側耳屬(Pleurotus)、裂裙菌屬(Schizophyllum)、踝節菌屬(Talaromyces)、嗜熱子囊菌屬(Thermoascus)、梭抱殼屬(Thielavia)、彎頸霉屬(TolypocIadium)、栓菌屬(Trametes)或木霉屬(Trichoderma)細胞,或者更優選為泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、煙曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillusjaponicus)、構巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、煙管菌(Bjerkandera adusta)、干擬臘菌(Ceriporiopsisaneirina)、Ceriporiopsis caregiea、淺黃擬臘孔菌(Ceriporiopsis gilvescens)、Ceriporiopsis pannocinta、 Ceriporiopsis rivulosa、 Ceriporiopsis subrufa、蟲擬臘菌(Ceriporiopsis subvermispora)、Chrysosporium inops、嗜角質金抱子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、Chrysosporiummerdarium、Chrysosporium pannicola、Chrysosporium queenslandicum、熱帶金抱子菌(Chrysosporium tropicum)、Chrysosporium zonatum、灰蓋鬼傘(Coprinus cinereus)、毛云芝菌(Coriolus hirsutus)、Fusarium bactridioides、Fusarium cerealis、Fusariumcrookwellense、黃色德刀菌(Fusarium culmorum)、禾谷德抱菌(Fusarium graminearum)、禾赤德抱(Fusarium graminum)、異抱德抱(Fusarium heterosporum)、Fusarium negund1、尖抱德刀菌(Fusarium oxysporum)、Fusarium reticulatum、粉紅色德刀菌(Fusariumroseum)、接骨木德刀菌(Fusarium sambucinum)、膚色德抱(Fusarium sarcochroum)、擬枝抱德刀菌(Fusarium sporotrichioides)、硫色德刀菌(Fusarium sulphureum)、Fusariumtorulosum、擬絲抱德刀菌(Fusarium trichothecioides)、Fusarium venenatum、特異腐質霉(Humicola insolens)、柔毛腐質霉(Humicola lanuginosa)、米赫毛霉(Mucor miehei)、嗜熱毀絲菌(Myceliophthora thermophila)、粗糖脈抱菌(Neurospora crassa)、產紫青霉(Penicillium purpurogenum)、黃抱原毛平革菌(Phanerochaete chrysosporium)、脈射側菌(Phlebia radiata)、白腐菌(Pleurotus eryngii)、太瑞斯梭孢殼霉(Thielaviaterrestris)、長域毛栓菌(Trametes villosa)、變色栓菌(Trametes versicolor)、哈茨木霉菌(Trichoderma harzianum)、康寧木霉(Trichoderma koningii)、長梗木霉(Trichoderma 1ngibrachiatum)Λ 里氏木霉(Trichoderma reesei)、或綠色木霉(Trichoderma viride)細胞。
6.根據權利要求1~5中任一項所述的方法,其中所述位點特異性重組酶和它的識別序列對來自于嗷菌體Pl的Cre-lox體系、釀酒酵母(Saccharomyces cerevisiae)的FLP-FRT 體系、Zygosaccharonzyces rouxii 的 R-RS 體系、來自嗷菌體 Mu 的改良 Gin-gix體系、來自枯草芽孢桿菌(Bacillus subtilis)質粒的β -重組酶-six體系、來自細菌轉座子TnlOOO的δ - Y -res體系、鏈霉菌屬(Streptomyces)嗷菌體C>C31、Mx9嗷菌體轉化體系或溫帶Iactococcal嗷菌體TP901-1的Xis-att體系。
7.根據權利要求1~6中任一項所述的方法,其中所述陰性選擇標記編碼對所述宿主細胞賦予抗菌素抗性的多肽且所述選擇性培養基包括抑菌濃度的抗菌素。
8.根據權利要求1~6中任一項所述的方法,其中所述陰性選擇標記編碼胞嘧啶脫氨酶且所述選擇性培養基包括足量的5-氟胞嘧啶,其通過所述胞嘧啶脫氨酶轉化為抑菌濃度的毒性5-氟尿嘧啶。
9.根據權利要求8所述的方法,其中所述陰性選擇標記編碼具有胞嘧啶脫氨酶活性的多肽,所述多肽選自: (a)與SEQID N0:60的多肽具有至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性的多肽; (b)由在中等嚴格條件、中高等嚴格條件、高等嚴格條件或極高等嚴格條件下與(i)SEQID NO:59的多肽編碼序列;(ii)其cDNA序列;或(^1),(i)或(ii)的全長互補物雜交的多核苷酸所編碼的多肽; (c)由與SEQID NO: 59的多肽編碼序列或其cDNA序列具有至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少.97%,至少98%,至少99%或100%序列同一性的多核苷酸所編碼的多肽; Cd)在一個或多個位置包括取代、缺失和/或插入的SEQ ID NO:60的多肽的變體;和 Ce)具有胞嘧啶脫氨酶活性的(a)、(b)、(c)或(d)的多肽的片段。
10.根據權利要求1~8中任一項所述的方法,其中所述陰性選擇標記在中等嚴格條件、中高等嚴格條件、高等嚴格條件或極高等嚴格條件下與(i)SEQ ID NO: 59的多肽編碼序列;(ii)其cDNA序列;*(iii),(i)或(ii)的全長互補物雜交。
11.根據權利要求1~8中任一項所述的方法,其中所述陰性選擇標記包括與SEQIDNO: 59的多肽編碼序列或其cDNA序列具有至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性的核酸序列。
12.根據權利要求1~8中任一項所述的方法,其中所述陰性選擇標記編碼具有SEQIDN0:60的氨基酸序列的多肽的片段,其中所述片段具有胞嘧啶脫氨酶活性。
13.根據權利要求1~8中任一項所述的方法,其中所述陰性選擇標記編碼具有SEQIDNO:60的氨基酸序列的胞嘧啶脫氨酶多肽。
14.根據權利要求1~13中任一項所述的方法,其中所述核酸構建體進一步包括進入選擇標記和編碼所述位點特異性重組酶的多核苷酸,其依次在兩側具有一對同源盒,其中進入選擇標記、編碼所述位點特異性重組酶的多核苷酸和所述同源盒對全部在兩側也具有一對識別序列,并在步驟(c )中與所述目標多核苷酸一起整合。
15.根據權利要求14所述的方法,其中所述進入選擇標記使得可以進行陽性選擇或陰性選擇或者所述進入選擇標記是雙向的。
16.根據權利要求15所述的方法,其中所述方法包括對步驟(c)中通過所述目標多核苷酸連同所述進入選擇標記和編碼所述位點特異性重組酶的多核苷酸的雙同源重組進行的整合進行陽性選擇,其中后兩者在兩側是同源盒。
17.根據權利要求16所述的方法,其中所述方法包括對所述進入選擇標記和編碼所述位點特異性重組酶的多核苷酸的每個整合拷貝的切除進行陰性選擇的步驟,其中切除通過其側翼同源盒之間的雙同源重組而進行。
18.根據權利要求1~13中任一項所述的方法,其中第二核酸構建體在步驟(b)中被引入所述細胞,所述第二核酸構建體是非復制型或是溫度敏感復制型,其包括編碼所述位點特異性重組酶的多核苷酸和選擇標記,并分別通過選擇壓力或在許可溫度下的生長而短暫維持在所述細胞內,從而使所述位點特異性重組酶可以在步驟(c)中短暫表達,其中所述選擇標記使得可以進行陽性選擇或陰性選擇或者其是雙向的。
19.根據權利要求1~13中任一項所述的方法,其中步驟(a)中的細胞在其染色體內包括至少一個拷貝的與緊密調節型啟動子可操作地連接的編碼所述位點特異性重組酶的多核苷酸,所述啟動子可以通過改變生長條件而被啟動或關閉,從而可以在步驟(c)中進行所述位點特異性重組酶的短暫表達。
20.根據權利要求1~19中任一項所述的方法,其中所述位點特異性重組酶包括具有SEQ ID NO: 107的氨基酸序列的氨基酸序列。
【文檔編號】C12N15/80GK103562391SQ201280025301
【公開日】2014年2月5日 申請日期:2012年5月23日 優先權日:2011年5月23日
【發明者】宇田川裕晃 申請人:諾維信公司