專(zhuān)利名稱:用于在真菌細(xì)胞中表達(dá)基因的真菌啟動(dòng)子的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及DNA序列,具體而言,涉及經(jīng)過(guò)分離的真菌啟動(dòng)子,并涉及包含這些啟動(dòng)子的DNA構(gòu)建體、載體和真菌宿主細(xì)胞,其中,所述啟動(dòng)子與編碼多肽的編碼序列可操作地相連。本發(fā)明還涉及表達(dá)基因和/或生產(chǎn)多肽的方法。
背景技術(shù):
在真菌宿主細(xì)胞中生產(chǎn)重組多肽通常是通過(guò)下述方法完成的構(gòu)建表達(dá)盒,其中編碼多肽的DNA處于適用于該宿主細(xì)胞的啟動(dòng)子的表達(dá)控制下??赏ㄟ^(guò)質(zhì)?;蜉d體介導(dǎo)的轉(zhuǎn)化將表達(dá)盒引入宿主細(xì)胞。然后可通過(guò)在表達(dá)盒所含有的啟動(dòng)子正確發(fā)揮功能所必要的誘導(dǎo)條件下培養(yǎng)經(jīng)過(guò)轉(zhuǎn)化的宿主細(xì)胞來(lái)生產(chǎn)多肽。對(duì)每種真菌宿主細(xì)胞而言,通過(guò)轉(zhuǎn)化引入到真菌宿主中的編碼序列的表達(dá)和該編碼序列編碼的重組多肽的生產(chǎn)需要獲得功能性的啟動(dòng)子。已知有大量啟動(dòng)子在真菌宿主細(xì)胞中是有功能的。下面是啟動(dòng)子在物種間交叉使用的例子已知Aspergillus nidulans (A. nidulans) gpdA 基因的啟動(dòng)子在 Aspergillus niger (A. niger)中有功能(J Biotechnol. 1991 Jan ; 17 (1) :19-33. Intracellular and extracellular production of proteins in Aspergillus under the control of expression signals of the highly expressed A. nidulans gpdA gene. Punt PJ, Zegers ND, Busscher M, Pouwels PH, van den Hondel CA)。另一個(gè)例子是用于 A. niger 禾口 A. nidulans 的 A. niger beta-木糖昔
xlnD 啟動(dòng)子(Transcriptional regulation of the xylanolytic enzyme system of Aspergillus, van Peij, NNME, PhD—thesis Landbouwuniversiteit ffageningen, the Netherlands, ISBN 90-5808-154-0),以及 Escherichia coli beta-葡糖酸酸酶基因在 A. niger、A. nidulans 禾口 Cladosporium fulvum 中的表達(dá),見(jiàn) Curr Genet. 1989 Mar ; 15(3) :177-80 =Roberts IN, Oliver RP, Punt PJ, van den Hondel CA. “ Expression of the Escherichia coli beta-glucuronidase gene in industrial and phytopathogenic filamentous fungi “所述。但是,人們?nèi)孕枰?jīng)過(guò)改進(jìn)的啟動(dòng)子,用于控制被引入的基因的表達(dá),用于控制內(nèi)源基因的表達(dá)水平,用于對(duì)內(nèi)源基因的表達(dá)加以調(diào)控或者用于介導(dǎo)內(nèi)源基因的失活,或用于生產(chǎn)多肽,或用于前述應(yīng)用的組合。上述經(jīng)過(guò)改進(jìn)的啟動(dòng)子可以,例如比以前已知的那些更強(qiáng)。它們也可以是可由特定的方便的底物或化合物誘導(dǎo)的。當(dāng)需要在單種真菌宿主中同時(shí)過(guò)量表達(dá)多種不同的基因,知道若干種功能性啟動(dòng)子是有益的。為防止壓制(特定轉(zhuǎn)錄因子的滴定(titration)),優(yōu)選使用多種不同的啟動(dòng)子,對(duì)每種待表達(dá)基因使用一種特定的啟動(dòng)子。
圖1描述了 pGBTOPGLA的質(zhì)粒圖譜,其是整合型葡糖淀粉酶表達(dá)載體。圖2描述了 pGBTOPGLA-2的質(zhì)粒圖譜,其是具有多克隆位點(diǎn)的整合型葡糖淀粉酶表達(dá)載體。圖3描述了 pGBTOPGLA-3的質(zhì)粒圖譜,其是一種整合型葡糖淀粉酶表達(dá)載體,其中含有與葡糖淀粉酶編碼序列可操作地相連的本發(fā)明啟動(dòng)子。圖4描述了通過(guò)單同源重組進(jìn)行整合的示意圖。圖5 :WT1、WT2和多種pGBTOPGLA載體轉(zhuǎn)化子的葡糖淀粉酶活性。顯示的是標(biāo)準(zhǔn)化的活性,其中,WTl在第4天的活性被設(shè)置為100%。圖6描述了 pGBDEL-PGGLAA的質(zhì)粒圖譜,其是置換型載體。圖7描述了啟動(dòng)子置換的示意圖。圖8描述了通過(guò)同源重組的整合示意圖。發(fā)明詳述本發(fā)明涉及選自由如下物質(zhì)所構(gòu)成的組(a)DNA 序列,其中包含 SEQ ID NO =USEQ ID N0:2、SEQ ID N0:3、SEQ ID NO :4、 SEQ ID NO 5的核苷酸序列,(b) DNA序列,其能與(a)的DNA序列雜交,(c) DNA序列,其與(a)的DNA序列至少50%同源,(d) (a)至(c)的任何DNA序列的變體,以及(e) (a)至(d)的DNA序列中任何一種的亞序列(subsequence)。在本發(fā)明的上下文中,啟動(dòng)子DNA序列是當(dāng)該啟動(dòng)子DNA序列與編碼序列可操作地相連時(shí),能控制該編碼序列表達(dá)的DNA序列。術(shù)語(yǔ)“可操作地相連”在本文中被定義為下述結(jié)構(gòu),其中啟動(dòng)子DNA被放置于相對(duì)編碼序列來(lái)說(shuō)合適的位置,使得啟動(dòng)子DNA序列能指導(dǎo)被編碼序列編碼的多肽的生產(chǎn)。術(shù)語(yǔ)“編碼序列”在本文中被定義為在合適的控制序列的控制下,能轉(zhuǎn)錄為 mRNA,能翻譯為多肽的核酸序列。編碼序列的邊界通常是ATG起始密碼子(通常是mRNA 5’ 末端的開(kāi)放讀碼框的開(kāi)始)和轉(zhuǎn)錄終止子序列(恰好處于mRNA 3’末端開(kāi)放讀碼框的下游)界定的。編碼序列可以包括但不限于,基因組DNA,cDNA,半合成、合成和重組核酸序列。更具體地,術(shù)語(yǔ)“啟動(dòng)子”在本文中被定義為下述DNA序列,其能與RNA聚合酶結(jié)合,指導(dǎo)聚合酶到編碼多肽的編碼序列正確的下游轉(zhuǎn)錄開(kāi)始位點(diǎn),來(lái)初始化轉(zhuǎn)錄。RNA聚合酶能有效地催化與編碼區(qū)域適當(dāng)DNA鏈互補(bǔ)的信使RNA的裝配。術(shù)語(yǔ)“啟動(dòng)子”還將被理解為包括用于轉(zhuǎn)錄為mRNA之后進(jìn)行翻譯的5’非編碼區(qū)域(啟動(dòng)子和翻譯起始之間)、順式作用的轉(zhuǎn)錄控制元件(例如增強(qiáng)子)以及其它能與轉(zhuǎn)錄因子反應(yīng)的核苷酸序列。在一種優(yōu)選的實(shí)施方式中,本發(fā)明的啟動(dòng)子DNA是根據(jù)SEQ ID NO=USEQ ID NO: 2、SEQ ID NO :3、SEQ ID NO 4 或 SEQ ID NO 5 的序列。根據(jù)另一種優(yōu)選的實(shí)施方式,本發(fā)明的啟動(dòng)子DNA序列是能與SEQ ID NO :1、SEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4或SEQ ID NO 5雜交且仍然保持啟動(dòng)子活性的DNA 序列。優(yōu)選通過(guò)測(cè)量與啟動(dòng)子可操作地相連的編碼序列編碼的蛋白的濃度來(lái)確定啟動(dòng)子活性。或者,通過(guò)測(cè)量與啟動(dòng)子可操作地相連的編碼序列編碼的蛋白的酶活來(lái)測(cè)定啟動(dòng)子濃度。根據(jù)一種優(yōu)選的實(shí)施方式,通過(guò)測(cè)量IacZ報(bào)道基因(importer gene) 編碼序列的表達(dá)來(lái)測(cè)定啟動(dòng)子活性(及長(zhǎng)度)(見(jiàn)Luo (Gene 163(1995) 127-131.)根據(jù)另一種優(yōu)選的實(shí)施方式,通過(guò)使用綠熒光蛋白作為編碼序列來(lái)測(cè)定啟動(dòng)子活性(見(jiàn) Microbiology. 1999Mar ; 145 (Pt 3) :729-34. Santerre Henriksen AL, Even S, Muller C, Punt PJ, van den Hondel CA, Nielsen J. Study)。此外,可以通過(guò)測(cè)量啟動(dòng)子控制下產(chǎn)生的轉(zhuǎn)錄子的mRNA水平來(lái)確定啟動(dòng)子活性。mRNA水平可以,例如,通過(guò)Northern雜交印記來(lái)測(cè)量(J. Sambrook, E. F. Fritsch, and Τ. Maniatus,1989, Molecular Cloning, A Laboratory Manual,2d edition, Cold Spring Harbor, N. Y.)。本發(fā)明包括能在非常低嚴(yán)謹(jǐn)度條件下、優(yōu)選低嚴(yán)謹(jǐn)度條件下、更優(yōu)選中等嚴(yán)謹(jǐn)度條件下、更優(yōu)選中高嚴(yán)謹(jǐn)度條件下、進(jìn)一步更優(yōu)選高嚴(yán)謹(jǐn)度條件下以及最優(yōu)選非常高嚴(yán)謹(jǐn)度條件下與相應(yīng)于如下分子的核酸探針雜交的(經(jīng)過(guò)分離的)啟動(dòng)子DNA序列,所述分子是(i)SEQ ID NO :1、SEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4 或 SEQ ID NO 5 的第 1 至 2000位核苷酸,優(yōu)選地,第100至1990位核苷酸,更優(yōu)選地,第200至1980位核苷酸,進(jìn)一步更優(yōu)選地,第300至1970位核苷酸,進(jìn)一步更優(yōu)選地,第350至1950位核苷酸,最優(yōu)選地,第 360至1900位核苷酸,(ii)是⑴的亞序列;或(iii)是⑴、(ii)互補(bǔ)鏈(J. Sambrook, E. F. Fritsch, and Τ. Maniatis,1989, Molecular Cloning, A Laboratory Manual, 2d edition,Cold Spri π g Harbor,N. Y.) SEQ ID NO =USEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4或SEQ ID NO :5的亞序列可以是至少100個(gè)核苷酸,優(yōu)選至少200個(gè)核苷酸,更優(yōu)選至少300個(gè)核苷酸,進(jìn)一步更優(yōu)選至少400個(gè)核苷酸,以及最優(yōu)選地,至少500個(gè)核苷酸。SEQ ID NO =USEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4 或 SEQ ID NO 5 或其亞序列的核酸序列可被用于設(shè)計(jì)核酸探針,以按照本領(lǐng)域公知的方法來(lái)鑒定和克隆來(lái)自不同屬或種的菌株的DNA啟動(dòng)子。具體而言,此類(lèi)探針可被用于按照標(biāo)準(zhǔn)Southern雜交印記流程與目標(biāo)屬或種的基因組或cDNA雜交,以鑒定和分離其中相應(yīng)的基因。此類(lèi)探針可比全長(zhǎng)序列短很多,但是長(zhǎng)度應(yīng)當(dāng)有至少15個(gè),優(yōu)選至少25個(gè),更優(yōu)選至少35個(gè)核苷酸。此外, 此類(lèi)探針可被用于通過(guò)PCR來(lái)擴(kuò)增DNA啟動(dòng)子。通過(guò)PCR克隆啟動(dòng)子的例子在本文中有所描述(見(jiàn)實(shí)施例1. 3)。更長(zhǎng)的探針也可以使用。DNA、RNA或肽核酸(PNA)探針可以使用。 典型地,對(duì)探針進(jìn)行標(biāo)記,用于探測(cè)相應(yīng)的基因(例如,用032P、@33P、@3H、@35S、生物素或親和素或熒光標(biāo)記來(lái)標(biāo)記)。此類(lèi)探針被包括在本發(fā)明中。因此,可對(duì)從上述其它生物制得的基因組DNA或cDNA文庫(kù)加以篩選,選出能與上述探針雜交并能編碼多肽的DNA。可通過(guò)瓊脂糖或聚丙烯酰胺凝膠電泳,或其它分離技術(shù)來(lái)分離來(lái)自此類(lèi)其它生物的基因組或其它DNA。可將來(lái)自文庫(kù)的DNA或分離的DNA轉(zhuǎn)移并固定到硝酸纖維素或其它合適的載體物質(zhì)上。為鑒定出與SEQ ID NO=U SEQ ID NO :2、SEQ ID NO 3, SEQ ID NO :4或SEQ ID NO :5或其亞序列同源的克隆或DNA,可將載體物質(zhì)用于 Southern 雜交 £口記。就本發(fā)明的目的而言,雜交指核酸序列與相應(yīng)于SEQ ID NO :1、SEQ ID NO :2、 SEQ ID NO 3, SEQ ID NO :4或SEQ ID NO :5示出的核酸序列、它們的互補(bǔ)鏈或其亞序列的經(jīng)過(guò)標(biāo)記的核酸探針在非常低至非常高嚴(yán)謹(jǐn)度條件下雜交。用例如X射線膜來(lái)探測(cè)上述條件下與核酸探針雜交的分子。其它雜交技術(shù)也可使用,例如,使用熒光來(lái)探測(cè)以及玻璃側(cè)面(glass side)和/或DNA微陣列作為支持物的技術(shù)。FEMS Yeast Res. 2003 Dec ;4 (3) :259-69 (Daran-Lapujade P, Daran JM, Kotter P, Petit Τ, Piper MD, Pronk JT. " Comparative genotyping of the Saccharomyces cerevisiae laboratory strains S288C and CEN. PK113-7D using oligonucleotide microarrays “中給出了 DNA 微陣列雜交探測(cè)的例子。此外,PNA微陣列用于雜交的用途被描述于Nucleic Acids Res. 2003 Oct 1;31(19) :ell9 (Brandt 0, Feldner J,Stephan A,Schroder M,Schnolzer M, Arlinghaus HF, Hoheisel JD, Jacob A. PNA microarrays for hybridisation of unlabelled DNA samples 中。在一種優(yōu)選的實(shí)施方式中,核酸探針是SEQ ID NO =USEQ ID NO :2、SEQ ID NO :3、 SEQ ID NO :4或SEQ ID NO :5的核酸序列。在另一種優(yōu)選的實(shí)施方式中,核酸探針是具有 SEQ ID NO :1、SEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4 或 SEQ ID NO :5 第 20 至 1980 位核苷酸,更優(yōu)選地,SEQ ID N0:1、SEQ ID N0:2、SEQ ID N0:3、SEQ ID NO :4 或 SEQ ID NO: 5 的第 500 至 1950 位核苷酸,進(jìn)一步更優(yōu)選地,SEQ ID NO =USEQ ID N0:2、SEQ ID NO :3、 SEQ ID NO :4或SEQ ID NO :5的第800至1920位核苷酸,以及最優(yōu)選地,SEQ ID NO =USEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4 或 SEQ ID NO 5 的第 900 至 1900 位核苷酸的序列。 另一種優(yōu)選的探針是DNA序列轉(zhuǎn)錄位點(diǎn)前的部分。對(duì)于長(zhǎng)度為至少100個(gè)核苷酸的長(zhǎng)探針而言,非常低至非常高嚴(yán)謹(jǐn)度的條件被定義為按照標(biāo)準(zhǔn)Southern雜交印記流程,于42攝氏度進(jìn)行預(yù)雜交和雜交,在下述物質(zhì)中進(jìn)行5倍SSPE,0. 3% SDS,200yg/ml經(jīng)修剪和變性的鮭魚(yú)精DNA,以及,對(duì)于非常低和低嚴(yán)謹(jǐn)度而言,25%甲酰胺;對(duì)于中等和中高嚴(yán)謹(jǐn)度而言,35%甲酰胺;或?qū)τ诟吆头浅8邍?yán)謹(jǐn)度而言,50%甲酰胺。對(duì)于長(zhǎng)度為至少100個(gè)核苷酸的長(zhǎng)探針而言,載體物質(zhì)被洗三次,每次15分鐘,其中使用2倍SSC,0. 2% SDS,優(yōu)選在至少45攝氏度(非常低嚴(yán)謹(jǐn)度),更優(yōu)選在至少50攝氏度(低嚴(yán)謹(jǐn)度),更優(yōu)選在至少陽(yáng)攝氏度(中等嚴(yán)謹(jǐn)度),更優(yōu)選在至少60攝氏度(中高嚴(yán)謹(jǐn)度),進(jìn)一步更優(yōu)選在至少65度(高嚴(yán)謹(jǐn)度)以及最優(yōu)選在70攝氏度(非常高嚴(yán)謹(jǐn)度)進(jìn)行。對(duì)于長(zhǎng)度為大約15個(gè)核苷酸至大約70個(gè)核苷酸的短探針而言,嚴(yán)謹(jǐn)度條件被定義為預(yù)雜交、雜交和雜交后洗滌在比根據(jù)Bolton and McCarthy (1962,Proceedings of the National Academy of Sciences USA 48 :1390)的算式計(jì)算得到的 Tm 低 5 攝氏度至 10 攝氏度的溫度下,在 0. 9M NaCl、0. 09M Tris HCl pH 7. 6、6mM EDTA、0. 5% NP-40、1 倍 Denhardt’s溶液、ImM焦磷酸鈉、ImM磷酸二氫鈉、0. ImM ATP和每ml 0. 2mg酵母RNA中,按照標(biāo)準(zhǔn)Southern雜交印記流程來(lái)進(jìn)行。對(duì)于長(zhǎng)度為大約15個(gè)核苷酸至大約70個(gè)核苷酸的短探針而言,對(duì)載體物質(zhì)的洗滌如下安排使用6倍SSC加0. 1 % SDS洗一次,15分鐘,用6倍SSC洗兩次,每次15分鐘, 洗滌在比計(jì)算出的Tm低5至10攝氏度的溫度下進(jìn)行。根據(jù)另一種優(yōu)選的實(shí)施方式,SEQID NO :1、SEQ ID NO :2、SEQ ID NO :3、SEQ ID NO :4或SEQ ID NO :5首先被用于克隆與之可操作地相連的天然基因、編碼序列或其部分。 這可以用 SEQ ID N0:1、SEQ ID N0:2、SEQ ID N0:3、SEQ ID NO :4 或 SEQ ID NO :5 或前文定義的其亞序列來(lái)開(kāi)始,用該序列作為探針。將探針與給定宿主(Aspergillus niger或本申請(qǐng)中定義的任何其它真菌宿主)的cDNA或基因組文庫(kù)雜交。一旦天然基因或其部分已被克隆,隨后就可以通過(guò)本文所述的雜交實(shí)驗(yàn),用其自身作為探針去克隆來(lái)自其它真菌的其同源基因。在本發(fā)明的上下文中,同源基因指與天然基因至少50%同源(相同)的基因。優(yōu)選地,同源基因與天然基因至少55%同源,更優(yōu)選地,至少60%,更優(yōu)選地,至少65%,更優(yōu)選地,至少70 %,進(jìn)一步更優(yōu)選地,至少75 %,優(yōu)選地,大約80 %,更優(yōu)選地,大約90 %,進(jìn)一步更優(yōu)選地,大約95%,以及最優(yōu)選地,大約97%同源。同源基因編碼序列上游的序列是本發(fā)明所包括的啟動(dòng)子。或者,可以用SEQ ID NO =USEQ ID N0:2、SEQ ID NO :3、SEQ ID NO :4 或 SEQ ID NO :5 或前文定義的其亞序列去搜索基因組數(shù)據(jù)庫(kù),例如,使用本文所述的BLAST算法或比對(duì)方法,對(duì)與本發(fā)明啟動(dòng)子可操作地相連的天然基因的序列、編碼序列或其部分加以鑒定。該鑒定出的序列可被用于鑒定本申請(qǐng)所定義的任何其它真菌宿主中的直向同源物或同源基因。鑒定出的直向同源物或同源基因編碼序列上游的序列是本發(fā)明所包括的啟動(dòng)子。根據(jù)另一種優(yōu)選的實(shí)施方式,本發(fā)明的啟動(dòng)子DNA序列是(經(jīng)過(guò)分離的)DNA序列,其與SEQ ID N0:1、SEQ ID NO :2、SEQ ID NO :3、SEQ ID NO :4或SEQ ID NO :5至少50% 同源(相同)。優(yōu)選地,該 DNA 序列與 SEQ ID NO :1、SEQ ID NO :2、SEQ ID NO :3、SEQ ID NO :4或SEQ ID NO :5至少55%同源,更優(yōu)選地,至少60%,更優(yōu)選地,至少65%,更優(yōu)選地, 至少70 %,進(jìn)一步更優(yōu)選地,至少75 %,優(yōu)選地,大約80 %,更優(yōu)選地,大約90 %,進(jìn)一步更優(yōu)選地,大約95 %,以及最優(yōu)選地,大約97 %同源。就本發(fā)明的目的而言,兩條核酸序列之間同源性(相同性)的程度優(yōu)選通過(guò) BLAST程序來(lái)確定。用于進(jìn)行BLAST分析的軟件是公眾可通過(guò)National Center for Biotechnology Information (http: //www, ncbi. nlm. niR. rov/)獲f導(dǎo)白勺。BLAST 算法參數(shù) W、T和X確定了比對(duì)的靈敏度和速度。BLAST程序使用缺省值,字長(zhǎng)(W)為11,BL0SUM62分?jǐn)?shù)矩陣(見(jiàn) Henikoff&HenikofT,Proc. Natl. Acad. ki. USA 89 :10915(1989))比對(duì)(B)為 50,期望(E)為10,M = 5,N = -4,以及對(duì)兩條鏈都加以比對(duì)。在另一種優(yōu)選的實(shí)施方式中,啟動(dòng)子是SEQ ID NO =USEQ ID NO :2、SEQ ID NO :3、 SEQ ID NO :4或SEQ ID NO :5的亞序列,該亞序列仍然具有啟動(dòng)子活性。該亞序列優(yōu)選含有至少大約100個(gè)核苷酸,更優(yōu)選地,至少大約200個(gè)核苷酸,以及最優(yōu)選地,至少大約300 個(gè)核苷酸。在另一種優(yōu)選的實(shí)施方式中,亞序列是SEQ ID NO =USEQ ID NO :2、SEQ ID NO :3、 SEQ ID NO 4或SEQ ID NO 5所包含的核酸序列(除了來(lái)自5,和/或3,末端的一個(gè)或多個(gè)核苷酸已缺失之外),所述DNA序列仍具有啟動(dòng)子活性。在另一種優(yōu)選的實(shí)施方式中,啟動(dòng)子序列是“經(jīng)修整的(trimmed),,序列,S卩,來(lái)自翻譯起始處和/或轉(zhuǎn)錄起始處上游的序列片段。對(duì)啟動(dòng)子進(jìn)行修整以及功能分析的例子 JALGene. 1994 Aug 5 ; 145 (2) :179-87 :the effect of multiple copies of the upstream region on expression of the Aspergillus niger glucoamylase-encoding gene. Verdoes JC,Punt PJ,Stouthamer AH,van den Hondel CA 所述。在本發(fā)明的另一種實(shí)施方式中,啟動(dòng)子DNA序列是SEQ ID N0:1、SEQ ID NO :2、 SEQ ID NO :3、SEQ ID NO 4 或 SEQ ID NO 5 的變體。
術(shù)語(yǔ)“變體”或“變體啟動(dòng)子”在本文中被定義為具有下述核苷酸序列的啟動(dòng)子, 所述核苷酸序列包含對(duì)親本啟動(dòng)子一個(gè)或多個(gè)核苷酸的取代、缺失和/或插入,其中,變體啟動(dòng)子較之相應(yīng)的親本啟動(dòng)子具有更多或更少的活性。術(shù)語(yǔ)“變體啟動(dòng)子”將包括天然變體和體外產(chǎn)生的變體,它們是用本領(lǐng)域公知的方法,例如經(jīng)典誘變、定點(diǎn)誘變和DNA改組 (shuffling)獲得的。變體啟動(dòng)子可以具有一處或多處突變。每處突變是獨(dú)立的對(duì)核苷酸的取代、缺失和/或插入。根據(jù)一種優(yōu)選的實(shí)施方式,變體啟動(dòng)子是較之最初鑒定出的啟動(dòng)子序列(SEQ ID NO =USEQ ID N0:2、SEQ ID N0:3、SEQ ID NO :4 或 SEQ ID NO :5)具有至少一處經(jīng)修飾的調(diào)控位點(diǎn)的啟動(dòng)子。此類(lèi)調(diào)控位點(diǎn)可以被整體去除或按照上文的解釋進(jìn)行特定的突變。對(duì)此類(lèi)啟動(dòng)子變體的調(diào)控由此被修飾,從而,例如,其不再被葡萄糖所誘導(dǎo)。此類(lèi)啟動(dòng)子變體和如何獲得它們的技術(shù)的例子被描述于EP 6734 或WO 94/04673中。這些專(zhuān)利通過(guò)引用并入本文。啟動(dòng)子變體可以是等位基因啟動(dòng)子。等位基因變體指,占據(jù)相同染色體基因座的基因的兩種或多種替代性形式中的任何形式。等位基因變化是通過(guò)突變天然產(chǎn)生的,其能導(dǎo)致種群多態(tài)性??赏ㄟ^(guò)下述方法來(lái)獲得變體啟動(dòng)子(a)在非常低、低、中等、中高、高或非常高嚴(yán)謹(jǐn)度條件下,將 DNA 與(i)SEQ ID NO =USEQ ID N0:2、SEQ ID N0:3、SEQ ID NO: 4或SEQ ID NO :5, (ii) (i)的亞序列或(iii) (i)、(ii)的互補(bǔ)鏈雜交,以及(b)從DNA分離變體啟動(dòng)子。嚴(yán)謹(jǐn)度和洗滌條件如本文所述。本發(fā)明的啟動(dòng)子可以是隨序列提供有接頭的啟動(dòng)子,所述接頭用于如下目的引入特定限制位點(diǎn),協(xié)助啟動(dòng)子序列與編碼多肽的核酸序列編碼區(qū)域之間的連接。本文提供的序列信息不應(yīng)被狹義理解為需要包括進(jìn)被錯(cuò)誤鑒定的堿基。本文公開(kāi)的特定序列可容易地用于從有絲真菌,特別是Aspergillus niger分離原始DNA序列,再對(duì)其進(jìn)行進(jìn)一步的序列分析,由此鑒定出序列錯(cuò)誤。除非另有指明,本文中通過(guò)對(duì)DNA分子進(jìn)行測(cè)序測(cè)定的所有核苷酸序列都是用自動(dòng)DNA測(cè)序儀測(cè)定的。因此,如本領(lǐng)域關(guān)于通過(guò)該自動(dòng)方法測(cè)定的任何DNA序列所已知的, 本文測(cè)定的任何核苷酸序列可能含有一些錯(cuò)誤。通過(guò)自動(dòng)方法測(cè)定的核苷酸序列典型地與被測(cè)序DNA分子的實(shí)際核苷酸序列至少大約90%相同,更典型地,至少大約95%相同至至少大約99. 9%相同??梢酝ㄟ^(guò)其它方法,包括本領(lǐng)域公知的手動(dòng)DNA測(cè)序方法對(duì)實(shí)際序列進(jìn)行更為精確地測(cè)定。本領(lǐng)域技術(shù)人員能鑒定出此類(lèi)被錯(cuò)誤鑒定的堿基,并且知道如何更正此類(lèi)錯(cuò)誤。本發(fā)明包括啟動(dòng)子的功能等同物,其典型地含有不會(huì)改變目標(biāo)啟動(dòng)子生物學(xué)功能的突變。術(shù)語(yǔ)“功能等同物”還包括A. niger DNA序列的直向同源物。A. nigerDNA序列的直向同源物是從其它菌株或物種中分離出來(lái)的,具有相似或相同生物活性的DNA序列。本發(fā)明的啟動(dòng)子可從任何屬的微生物中獲得。就本發(fā)明的目的而言,本文中所用的與一給定來(lái)源相關(guān)的術(shù)語(yǔ)“從……獲得”將表示多肽是該來(lái)源生產(chǎn)的,或是被來(lái)自該來(lái)源的基因所插入的細(xì)胞生產(chǎn)的。啟動(dòng)子序列可從真菌來(lái)源獲得,優(yōu)選從酵母菌株獲得,例如Candida、Hansenula, Kluyveromyces> Pichia、Saccharomyces> Schizosaccharomyces 或 Yarrowia 的菌株,更優(yōu)選地,從 Saccharomyces carlsbergensis、Saccharomyces cerevisiae、Saccharomycesdiastaticus、Saccharomyces douglasii、Saccharomyces kluyveri> Saccharomyces norbensis 或 Saccharomyces oviformis 白勺菌株獲得。在另一種優(yōu)選的實(shí)施方式中,啟動(dòng)子序列從有絲真菌菌株獲得,例如Acremonium、 Aspergillus、Aureobasidium、Cryptococcus、Filibasidium、Fusarium、Humicola、 Magnaportheλ Mucor、Myceliophthora、Neocallimastix、Neurospora、Paecilomyces、 Penicillium、 Piromyces、 Schizophyllum、 Talaromyces、 Thermoascus、 Thielavia、 Tolypocladium 或 Trichoderma 的菌株,更優(yōu)選地,從 Aspergillus aculeatus、 Aspergillus awamori、Aspergillus foetidus、Aspergillus japonicus、A.nidulans、 A. niger、Aspergillus oryzae (A. oryzae)、Humicola insolens、Humicola lanuginosa、 Mucor miehei、Myceliophthora thermophila、Neurospora crassa、Penicillium purpurogenum、 Trichoderma harzianum、 Trichoderma koningii、 Trichoderma longibrachiatum、Trichoderma reesei 或 Trichoderma viride 的菌株獲得。在另一種優(yōu)選的實(shí)施方式中,啟動(dòng)子序列從Fusarium bactridioides、Fusarium cerealis、Fusarium crookwellense、Fusarium culmorum、Fusarium graminearum、 Fusarium graminum、Fusarium heterosporum、Fusarium negundi、Fusarium oxysporum、 Fusarium reticulatum、Fusarium roseum、Fusarium sambucinum、Fusarium sarcochroum、 Fusarium sporotrichioides、Fusarium sulphureum、Fusarium torulosum、Fusarium trichothecioides、Fusarium venenatum 獲得。應(yīng)理解,對(duì)上述物種而言,本發(fā)明包括完美的和不完美的狀態(tài)以及其它分類(lèi)學(xué)等同物,例如,無(wú)性型(anamorph),而不管它們是作為什么名字被知道的。本領(lǐng)域技術(shù)人員容易對(duì)合適的等同物加以鑒定。這些物種的菌株是公眾容易從大量的培養(yǎng)單位獲得的,例如, American Type Culture Collection(ATCC) Λ Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH(DSM)、Centraalbureau Voor Schimmelcultures (CBS)禾口 Agricultural Research Service Patent Culture Collection, Northern Regional Research Center(NRRL)0此外,可使用上文提到的探針,從其它來(lái)源(包括從自然界(例如,土壤、肥料、水等)分離的微生物)鑒定并獲得根據(jù)本發(fā)明的啟動(dòng)子序列。用于從自然環(huán)境分離微生物的技術(shù)是本領(lǐng)域公知的。然后可以通過(guò)對(duì)其它微生物基因組DNA文庫(kù)進(jìn)行類(lèi)似篩選來(lái)獲得核酸序列。一旦用探針探測(cè)出了編碼啟動(dòng)子的核酸序列,就可以利用本領(lǐng)域普通技術(shù)人員已知的技術(shù)來(lái)分離或克隆該序列(例如,見(jiàn)上述Sambrook et al.,1989)。在本發(fā)明中,啟動(dòng)子DNA序列還可以是雜交啟動(dòng)子,其中包含本發(fā)明的一種或多種啟動(dòng)子的一部分;本發(fā)明的啟動(dòng)子的一部分以及另外的已知啟動(dòng)子的一部分,例如,一種啟動(dòng)子的引導(dǎo)子(leader)序列和來(lái)自其它啟動(dòng)子的轉(zhuǎn)錄起始位點(diǎn);或者本發(fā)明的一種或多種啟動(dòng)子的一部分以及一種或多種其它啟動(dòng)子的一部分。其它啟動(dòng)子可以是任何在選用的真菌宿主細(xì)胞中顯示出轉(zhuǎn)錄活性的啟動(dòng)子序列,包括變體、截短的和雜交啟動(dòng)子,其可以從編碼對(duì)于宿主細(xì)胞來(lái)說(shuō)同源或異源的、細(xì)胞外或細(xì)胞內(nèi)多肽的基因獲得。其它啟動(dòng)子序列可以是對(duì)編碼多肽的核酸序列來(lái)說(shuō)天然的或外源的,并且對(duì)細(xì)胞來(lái)說(shuō)可以是天然的或外源的。作為一種優(yōu)選的實(shí)施方式,鑒定出的啟動(dòng)子的重要調(diào)控序列可以與其它“基礎(chǔ)”啟動(dòng)子融合,以增強(qiáng)它們的啟動(dòng)子活性(例如,見(jiàn)MoI Microbiol. 1994 May ; 12 (3) :479-90. Regulation of the xylanase—encoding xlnA gene of Aspergillus tubigensis. de Graaff LH, van den Broeck HC, van Ooijen AJ, Visser J.所述)??捎糜谂c本發(fā)明的啟動(dòng)子一起構(gòu)建雜交啟動(dòng)子的其它啟動(dòng)子的例子包括從 A. oryzae TAKA U t)" Bi、 Rhizomucor mieheiS B|> A. niger ψ alpha U 粉酶、Α. niger酸穩(wěn)定性alpha淀粉酶、A. niger或Aspergillus awamori葡糖淀粉酶 (glaA)、A. niger gpdA、A. niger 葡萄糖氧化酶 goxC、Rhizomucor miehei 月旨酶、A. oryzae 堿性蛋白酶、A. oryzae磷酸丙糖異構(gòu)酶、A. nidulans乙酉先胺酶禾口 Fusarium oxysporum 類(lèi)胰島素蛋白酶(WO 96/00787)的基因獲得的啟動(dòng)子,以及NA2_tpi啟動(dòng)子(來(lái)自用于 (A. niger中性alpha淀粉酶和A. oryzae磷酸丙糖異構(gòu)酶的基因的啟動(dòng)子的雜交體)、 Saccharomyces cerevisiae 烯酉享酶(ENO-I)、Saccharomyces cerevisiae 半乳糖激酶 (GALl)、Saccharomyces cerevisiae 醇脫氫酶 / 甘油醛 _3_ 磷酸酯脫氫酶(ADH2/GAP)和 Saccharomyces cerevisiae 3_磷酸甘油酯激酶的基因獲得的啟動(dòng)子以及它們的突變的、 截短的和雜交的啟動(dòng)子。其它可用于酵母宿主細(xì)胞的啟動(dòng)子見(jiàn)Romanoset al. , 1992,Yeast 8 :423-488 所述。在本發(fā)明中,啟動(dòng)子DNA序列還可以是“串聯(lián)啟動(dòng)子”?!按?lián)啟動(dòng)子”在本文中被定義為兩個(gè)或多個(gè)啟動(dòng)子序列,它們中的每一個(gè)都與編碼序列可操作地相連,并對(duì)編碼序列向mRNA的轉(zhuǎn)錄加以調(diào)節(jié)。串聯(lián)啟動(dòng)子包含本發(fā)明的兩種或多種啟動(dòng)子或本發(fā)明的一種或多種啟動(dòng)子與一種或多種其它已知的啟動(dòng)子,例如,上文例示的用于構(gòu)建雜交啟動(dòng)子的那些。串聯(lián)啟動(dòng)子的兩種或多種啟動(dòng)子序列可以同時(shí)促進(jìn)核酸序列的轉(zhuǎn)錄?;蛘撸?lián)啟動(dòng)子的一種或多種啟動(dòng)子序列可以促進(jìn)核酸序列在細(xì)胞不同生長(zhǎng)階段或者菌絲體不同形態(tài)部位的轉(zhuǎn)錄。在本發(fā)明中,啟動(dòng)子對(duì)于編碼目標(biāo)多肽的編碼序列和/或真菌宿主細(xì)胞來(lái)說(shuō)可以是外源的。本發(fā)明的變體、雜交或串聯(lián)啟動(dòng)子應(yīng)當(dāng)被理解為對(duì)于編碼多肽的編碼來(lái)說(shuō)是外源的,即使野生型啟動(dòng)子是編碼序列或真菌宿主細(xì)胞天然的。本發(fā)明的變體、雜交或串聯(lián)啟動(dòng)子具有具有SEQ ID NO =USEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4或SEQ ID NO 5的啟動(dòng)子的啟動(dòng)子活性的至少大約20%,優(yōu)選至少大約40 %,更與選至少大約60 %,更優(yōu)選至少大約80 %,更優(yōu)選至少大約90 %,更優(yōu)選至少大約100%,進(jìn)一步更優(yōu)選至少大約200%,最優(yōu)選至少大約300%,以及進(jìn)一步最優(yōu)選至少大約 400%。本發(fā)明還涉及一種DNA構(gòu)建體,其中包含至少一種上文定義的啟動(dòng)子DNA序列,以及與所述啟動(dòng)子DNA序列可操作地相連的編碼序列,從而該編碼序列可于給定的真菌宿主細(xì)胞中在啟動(dòng)子DNA序列的控制下被表達(dá)。編碼序列編碼多肽,其對(duì)于目標(biāo)真菌宿主細(xì)胞來(lái)說(shuō)可以是天然的或異源的。術(shù)語(yǔ)“多肽”在本文中并不代表被編碼產(chǎn)物的特定長(zhǎng)度,因此其包括肽、寡肽和蛋白。術(shù)語(yǔ)“異源多肽”在本文中被定義為并非真菌細(xì)胞天然的多肽,經(jīng)過(guò)修飾改變了天然序列的天然多肽,或通過(guò)重組DNA技術(shù)對(duì)真菌細(xì)胞進(jìn)行操作導(dǎo)致表達(dá)從數(shù)量上被改變的天然多肽。例如,天然多肽可以通過(guò)下述方法被重組生產(chǎn),所述方法例如,將編碼多肽的序列置于本發(fā)明啟動(dòng)子的控制之下,以增強(qiáng)多肽的表達(dá),用信號(hào)序列加速目標(biāo)天然多肽被運(yùn)出細(xì)胞的過(guò)程,以及增加編碼通常由該細(xì)胞產(chǎn)生的多肽的基因的拷貝數(shù)。真菌細(xì)胞可以含有一個(gè)或多個(gè)拷貝的、編碼多肽的編碼序列。優(yōu)選地,編碼序列編碼肽激素或其變體、酶、細(xì)胞內(nèi)蛋白、分泌過(guò)程涉及的蛋白、折疊過(guò)程涉及的蛋白、分子伴侶(chaperone)、肽氨基酸轉(zhuǎn)運(yùn)蛋白、糖基化因子、轉(zhuǎn)錄因子、受體或其一部分、抗體或其一部分或報(bào)道基因。在一種優(yōu)選的實(shí)施方式中,多肽是細(xì)胞外分泌的。在一種更優(yōu)選的實(shí)施方式中,多肽是酶。酶的例子是纖維素酶,例如,內(nèi)切葡聚糖酶、β-葡聚糖酶、纖維二糖水解酶或β-葡糖苷酶;半纖維素酶或果膠水解 (pectinolytic)酶,例如,木聚糖酶、木糖苷酶、甘露聚糖酶、半乳糖酶、半乳糖苷酶、果膠甲酯酶、果膠裂解酶、果膠酸裂解酶、內(nèi)切聚半乳糖醛酸酶、外切聚半乳糖醛酸酶、鼠李半乳糖醛酸酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、阿拉伯木聚糖水解酶、半乳糖醛酸酶,裂解酶或淀粉水解酶;磷酸酶,例如,植酸酶,酯酶,例如脂酶,蛋白水解酶,例如蛋白酶,肽酶,氧化還原酶,例如氧化酶,轉(zhuǎn)移酶或異構(gòu)酶。或者,編碼序列可以編碼細(xì)胞內(nèi)蛋白,例如,分子伴侶或轉(zhuǎn)錄因子。這方面的例子被描述于 Appl Microbiol Biotechnol. 1998 Oct ;50 (4) :447-54( “ Analysis of the role of the gene bipA, encoding the major endoplasmic reticulum chaperone protein in the secretion of homologous and heterologous proteins in black Aspergilli.Punt PJ, van Gemeren IA, Drint-Kuijvenhoven J, Hessing JG, van Muijlwijk-Harteveld GM, Beijersbergen A, Verrips CT, van den Hondel CA)中。這可用于例如,提高宿主細(xì)胞作為蛋白生產(chǎn)者的效率,如果該編碼序列,例如分子伴侶或轉(zhuǎn)錄因子已知是蛋白生產(chǎn)限制因素的話。編碼序列還可編碼初級(jí)或次級(jí)代謝產(chǎn)物合成中涉及的酶,所述代謝產(chǎn)物例如,有機(jī)酸、類(lèi)胡蘿卜素,(beta-內(nèi)酰胺)抗生素、維生素。編碼目標(biāo)多肽的編碼序列可從任何原核生物、真核生物或其它來(lái)源獲得?;蛘撸幋a序列可針對(duì)反義RNA和/或RNAi (RNA干擾)構(gòu)建體的表達(dá)進(jìn)行編碼。編碼反義-RNA 的例子見(jiàn) Appl Environ Microbiol. 2000 Feb ;66 (2) :775-82. (Characterization of a foldase, protein disulfide isomerase A, in the protein secretory pathway of Aspergillus niger. Ngiam C, Jeenes DJ, Punt PJl Van Den Hondel CA, Archer DB)或(Zrenner R, Willmitzer L, Sonnewald U. Analysis of the expression of potato uridinediphosphate-glucose pyrophosphorylase and its inhibition by antisense RNA. Planta. (1993) ; 190 (2) :247-52)。對(duì)基因表達(dá)完全失活可用于,例如,用于對(duì)控制不想要的代謝途徑支鏈的基因失活,例如,增加對(duì)特定次級(jí)代謝產(chǎn)物(例如(beta-內(nèi)酰胺)抗生素或類(lèi)胡蘿卜素)的生產(chǎn)。完全失活還可用于減少毒性或不想要的化合物的產(chǎn)生(Penicillium中的黃青霉素、Aspergillus中的黃曲霉素=MacDonald KD et al, :heterokaryon studies and the genetic control of penicillin and chrysogenin production in Penicillium chrysogenum. J Gen Microbiol. (1963)33: 375-83)。完全失活還可用于改變生物的形態(tài),從而改進(jìn)發(fā)酵過(guò)程和下游加工。本發(fā)明的另一種實(shí)施方式涉及對(duì)真菌細(xì)胞進(jìn)行廣泛的代謝重構(gòu)(!^programming) 或工程改造。將全新的途徑引入和/或?qū)Σ幌胍耐緩降男揎棇⑻峁┍惶禺愋缘馗脑爝^(guò)的細(xì)胞,所述改造針對(duì)特定化合物(例如蛋白質(zhì)或代謝產(chǎn)物)的生產(chǎn)。在本發(fā)明的方法中,當(dāng)編碼序列編碼多肽時(shí),所述多肽還可以包括融合或雜交多肽,其中,另一種多肽融合到前述多肽或其片段的N-末端或C-末端上。融合的多肽可以通過(guò)將編碼一種多肽的核酸序列(或其一部分)融合到編碼另一種多肽的核酸序列(或其一部分)來(lái)生產(chǎn)。用于生產(chǎn)融合多肽的技術(shù)是本領(lǐng)域內(nèi)已知的,其包括將編碼多肽的編碼序列相連,使得它們處于同一讀碼框內(nèi)(in frame),并且融合多肽的表達(dá)處于同樣的啟動(dòng)子和終止子的控制之下。雜交多肽可以包含從至少兩種不同的多肽(其中,一種或多種可以是真菌細(xì)胞異源的)獲得的部分或全部多肽序列的組合。除啟動(dòng)子DNA序列之外,DNA構(gòu)建體還可以包含一種或多種控制序列,它們能在與控制序列兼容的條件下,指導(dǎo)編碼序列在合適的宿主細(xì)胞中的表達(dá)。表達(dá)應(yīng)被理解為包括 生產(chǎn)多肽所涉及的任何步驟,其包括但不限于,轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾以及分泌。一種或多種控制序列可以是編碼序列或宿主天然的?;蛘撸环N或多種控制序列可被對(duì)核酸序列來(lái)說(shuō)外源的一種或多種控制序列置換,用于提高編碼序列在宿主細(xì)胞中的表達(dá)。“DNA構(gòu)建體”在本文中被定義為下述核酸分子,其是單鏈或雙鏈的,是從天然存在的基因分離出來(lái)的,或已經(jīng)過(guò)修飾,以便含有以非天然存在的方式結(jié)合及并置的核酸片斷。 當(dāng)DNA構(gòu)建體含有編碼序列以及表達(dá)該編碼序列所需的所有控制序列時(shí),術(shù)語(yǔ)“DNA構(gòu)建體”與術(shù)語(yǔ)“表達(dá)盒”同義。術(shù)語(yǔ)“控制序列”在本文中被定義為包括對(duì)于表達(dá)編碼序列來(lái)說(shuō)必要或有益的所有組件,其中包括本發(fā)明的啟動(dòng)子。每種控制序列可以是編碼多肽的核酸序列天然的或外源的。此類(lèi)控制序列包括但不限于,引導(dǎo)子(leader)、優(yōu)化的翻譯初始化序列(如Kozak, 1991,J. Biol. Chem. 266 :19867-19870所述)、聚腺苷化序列、前肽序列、信號(hào)肽序列、上游活化序列、本發(fā)明的啟動(dòng)子(包括從其獲得的變體、片段和雜交體,以及串聯(lián)啟動(dòng)子)和轉(zhuǎn)錄終止子。至少,控制序列包括轉(zhuǎn)錄和翻譯終止信號(hào)以及本發(fā)明的啟動(dòng)子(的一部分)??刂菩蛄惺强呻S接頭提供,所述接頭用于如下目的引入特定限制位點(diǎn),協(xié)助控制序列與編碼多肽的核酸序列編碼區(qū)域之間的連接??刂菩蛄锌梢允呛线m的終止子序列,即,可被宿主細(xì)胞識(shí)別以終止轉(zhuǎn)錄的序列。終止子序列與編碼多肽的編碼序列的3’末端可操作地相連。任何在宿主細(xì)胞中具有功能的終止子都可用于本發(fā)明。用于有絲真菌宿主細(xì)胞的優(yōu)選終止子可從A. oryzae TAKA淀粉酶、A. niger葡糖淀粉酶、A. nidulans氨基苯甲酸鹽/酯合酶、A. niger alpha-葡糖苷酶、trpC基因以及 Fusarium oxysporum類(lèi)胰島素蛋白酶的基因獲得。用于酵母宿主細(xì)胞的優(yōu)選終止子可從&iccharomyces cerevisiae烯醇酶、 Saccharomyces cerevisiae細(xì)胞色素C(CYCl)禾口Saccharomyces cerevisiae甘油酸_3_憐酸酯脫氫酶的基因獲得。其它可用于酵母宿主細(xì)胞的終止子如前述Romanos et al,1992 所述??刂菩蛄锌梢允呛线m的引導(dǎo)子序列,S卩,對(duì)宿主細(xì)胞的翻譯來(lái)說(shuō)重要的mRNA 5’非翻譯區(qū)域。引導(dǎo)子序列可與編碼多肽的核酸序列的5’末端可操作地相連。在選用的宿主細(xì)胞中有功能的任何引導(dǎo)子序列可用于本發(fā)明。優(yōu)選用于有絲真菌宿主細(xì)胞的引導(dǎo)子獲得自A. oryzae TAKA淀粉酶、A. nidulans磷酸丙糖異構(gòu)酶和A. niger glaA的基因。用于酵母宿主細(xì)胞的合適的引導(dǎo)子是從&iccharomyces cerevisiae烯醇酶 (EN0-1) > Saccharomyces cerevisiae 3_ 憐酸甘油酉旨激酶、Saccharomyces cerevisiae alpha-因子和Saccharomyces cerevisiae醇脫氫酶/甘油醛_3_磷酸酯脫氫酶(ADH2/ GAP)基因獲得的??刂菩蛄羞€可以是聚腺苷化序列,這是與核酸序列3’末端可操作地相連的序列, 當(dāng)轉(zhuǎn)錄時(shí),其可被宿主細(xì)胞作為信號(hào)識(shí)別,用于向轉(zhuǎn)錄的mRNA添加聚腺苷殘基。在選用的宿主細(xì)胞中有功能的任何聚腺苷化序列可用于本發(fā)明。優(yōu)選用于有絲真菌宿主細(xì)胞的聚腺苷化序列是從A. oryzae TAKA淀粉酶、A. niger 葡糖淀粉酶、A. nidulans氨基苯甲酸鹽/酯合酶、Fusarium oxysporum類(lèi)胰島素蛋白酶和 A. niger alpha-葡糖苷酶的基因獲得的??捎糜诮湍杆拗骷?xì)胞的聚腺苷化序列見(jiàn)Guo and Sherman, 1995, Molecular Cellular Biology 15 :5983-5990 所述。控制序列還可以是信號(hào)肽編碼區(qū)域,其編碼與多肽氨基末端相連的氨基酸序列, 并能指導(dǎo)編碼的多肽向細(xì)胞中分泌的途徑。核酸序列的編碼序列的5’末端可以遺傳性地含有下述信號(hào)肽編碼區(qū)域,其天然就與編碼被分泌多肽的編碼區(qū)域片斷以同一翻譯讀碼框的方式相連?;蛘撸幋a序列的5’可以含有對(duì)編碼序列來(lái)說(shuō)是外源的信號(hào)肽編碼區(qū)域。當(dāng)編碼區(qū)域天然不含信號(hào)肽編碼區(qū)域的情況下,可能會(huì)需要外源信號(hào)肽編碼區(qū)域。或者,外源信號(hào)肽編碼區(qū)域可以簡(jiǎn)單地置換天然信號(hào)肽編碼區(qū)域,以提高多肽的分泌。但是,能指導(dǎo)被表達(dá)的多肽進(jìn)入選用的宿主細(xì)胞的分泌途徑的任何信號(hào)肽編碼區(qū)域都可用于本發(fā)明。對(duì)于有絲真菌宿主細(xì)胞而言,有效的信號(hào)肽編碼區(qū)域是從A. oryzae TAKA淀粉酶、A. niger中性淀粉酶、A. ficuum植酸酶、A. niger葡糖淀粉酶、A. niger內(nèi)切木聚糖酶、Rhizomucor miehei 天冬氨酸蛋白酶、Humicola insolens 纖維素酶禾口 Humicola lanuginosa脂酶基因獲得的信號(hào)肽編碼區(qū)域。可用于酵母宿主細(xì)胞的信號(hào)肽是從&iccharomyces cerevisiae alpha因子和 Saccharomyces cerevisiae轉(zhuǎn)化酶的基因獲得的。其它有用的信號(hào)肽區(qū)域見(jiàn)前述Romanos et al.,1992 所述??刂菩蛄羞€可以是前肽編碼區(qū)域,其編碼位于多肽氨基末端的氨基酸序列。得到的多肽被稱為酶原或前多肽(或者,某些情況下,酵素原(zymogen))。前多肽通常沒(méi)有活性,可通過(guò)從前多肽上催化或自動(dòng)催化切割下前肽,將其轉(zhuǎn)化為成熟的活性多肽。前肽編碼區(qū)域可從Bacillus subtilis堿性蛋白酶(aprE)、Bacillus subtilis中性蛋白酶 (nprT) > Saccharomyces cerevisiae alpha 因子、Rhizomucor miehei 天冬氨酸蛋白酶、 Mvceliophthora thermophila漆酶(WO 95/33836)和 A. niger 內(nèi)切木聚糖酶(endol)的基因獲得。當(dāng)信號(hào)肽和前肽區(qū)域都存在于多肽氨基末端時(shí),前肽區(qū)域位于多肽氨基末端鄰側(cè),信號(hào)肽區(qū)域位于前肽區(qū)域氨基末端鄰側(cè)。添加允許對(duì)宿主細(xì)胞生長(zhǎng)相關(guān)多肽的表達(dá)進(jìn)行調(diào)控的調(diào)控序列也可能是人們需要的。調(diào)控系統(tǒng)的例子是,導(dǎo)致基因表達(dá)應(yīng)答于化學(xué)或物理刺激(包括調(diào)控化合物的存在) 被打開(kāi)或關(guān)閉的那些。原核細(xì)胞系統(tǒng)中的調(diào)控系統(tǒng)包括Iac和trp操縱子系統(tǒng)。酵母中,ADH2系統(tǒng)或GALl系統(tǒng)可以使用。有絲真菌中,TAKA alpha-淀粉酶啟動(dòng)子、A. niger葡糖淀粉酶啟動(dòng)子、A. oryzae葡糖淀粉酶啟動(dòng)子、A. tubingensis內(nèi)切木聚糖酶(xlnA)啟動(dòng)子、A. niger硝酸鹽還原酶(niaD)啟動(dòng)子、Trichoderma reesei纖維二糖水解酶啟動(dòng)子和 A. nidulans醇和醛脫氫酶(分別為alcA和aldA)啟動(dòng)子(如US 5,503,991所述)可用作為調(diào)控序列。調(diào)控序列的其它例子是允許基因擴(kuò)增的那些。在真核系統(tǒng)中,它們包括二氫葉酸還原酶基因(在甲氨蝶呤存在的情況下被擴(kuò)增)以及金屬硫蛋白基因(在重金屬存在的情況下被擴(kuò)增)。在這些情況下,編碼多肽的核酸序列將與可調(diào)控的序列可操作地相連。重要的可能是去除creA結(jié)合位點(diǎn)(如以前在EP 673429中所述,碳代謝物遏制), 改變pacC和areA (針對(duì)pH和氮調(diào)控)。本發(fā)明還涉及重組表達(dá)載體,其中包含本發(fā)明啟動(dòng)子、編碼多肽的編碼序列和轉(zhuǎn)錄和翻譯終止信號(hào)。上文所述的多種編碼和控制序列都可以一起加入,產(chǎn)生包括一種或多種方便的限制性位點(diǎn)的重組表達(dá)載體,所述位點(diǎn)用于允許啟動(dòng)子和/或編碼多肽的編碼序列在此類(lèi)位點(diǎn)插入或取代?;蛘?,編碼序列和啟動(dòng)子的融合可通過(guò),例如,使用PCR進(jìn)行序列重疊延伸(SOE-PCR)來(lái)進(jìn)行,如 Gene. 1989 Apr 15 ;77(1) :51-9. Ho SN, Hunt HD, Horton RM, Pullen JK, Pease LR“ Site-directed mutagenesis by overlap extension using the polymerase chain reaction"所述,或通過(guò)用 Gateway 克隆系統(tǒng)(Invitrogen)開(kāi)展克隆來(lái)進(jìn)行。或者,可以通過(guò)將編碼序列或包含啟動(dòng)子和/或編碼序列的DNA構(gòu)建體插入到用于表達(dá)的合適載體中,來(lái)表達(dá)編碼序列。在制造表達(dá)載體的過(guò)程中,編碼序列被放置于載體中,使得編碼序列與本發(fā)明的啟動(dòng)子和一種或多種用于表達(dá)的合適控制序列可操作地相連。重組表達(dá)載體可以是任何載體(例如,質(zhì)?;虿《?,其可方便地經(jīng)歷重組DNA流程,并可使得編碼序列表達(dá)。典型地,對(duì)載體的選擇將依賴于載體與載體將被引入的宿主細(xì)胞之間的兼容性。載體可以是線性的或閉合環(huán)狀質(zhì)粒。載體可以是自主復(fù)制載體,S卩,作為染色體外的整體存在,其復(fù)制不依賴于染色體復(fù)制,例如,質(zhì)粒、染色體外元件、微型染色體或人工染色體。對(duì)自主復(fù)制而言,載體可以包含能使載體在所用的宿主細(xì)胞中自主復(fù)制的復(fù)制原點(diǎn)(origin)??捎糜诮湍杆拗骷?xì)胞中的復(fù)制原點(diǎn)的例子是2微米復(fù)制原點(diǎn)、ARSU ARS4、ARSl和CEN3的組合以及ARS4和CEN6 的組合。復(fù)制原點(diǎn)可以是一種具有突變的原點(diǎn),使得其在宿主細(xì)胞中的功能對(duì)溫度敏感 (見(jiàn),例如 Ehrlich,1978,Proceedings of the National Academy of Sciences USA 75: 1433)。在有絲真菌中自主保持的克隆載體的例子是包含AMAl序列的克隆載體。AMAl是從A. nidulans分離的6. 01Λ的基因組DNA片段,其能自主保持于Aspergillus中(見(jiàn),例如 Aleksenko and Clutterbuck(1997), Fungal Genet. Biol. 21 :373-397)?;蛘?,載體可以是如下載體當(dāng)引入宿主細(xì)胞時(shí),其能整合進(jìn)基因組,并隨著其被整合進(jìn)的染色體一起復(fù)制。此外,可以使用單種載體或質(zhì)粒,或者一起含有將被引入到宿主細(xì)胞基因組的完整DNA的兩種或多種載體或質(zhì)粒,或轉(zhuǎn)座子。本發(fā)明的載體優(yōu)選含有一種或多種選擇性標(biāo)記,其允許對(duì)轉(zhuǎn)化的細(xì)胞加以容易的選擇。宿主可以被至少兩種載體共轉(zhuǎn)化,其中一種包含選擇標(biāo)記。選擇性標(biāo)記是一種基因,其產(chǎn)物提供針對(duì)生物殺滅劑或病毒的抗性、對(duì)重金屬的抗性、針對(duì)營(yíng)養(yǎng)缺陷的原營(yíng)養(yǎng)型等。用于酵母宿主細(xì)胞的合適標(biāo)記是ADE2、HIS3、LEU2、LYS2、MET3、TRPl和URA3。用于有絲真菌宿主細(xì)胞的選擇性標(biāo)記包括但不限于,amdS(乙酰胺酶)、argB (鳥(niǎo)氨酸氨基甲酰轉(zhuǎn)移酶)、bar (草胺膦乙酰轉(zhuǎn)移酶)、hygB (潮霉素磷酸轉(zhuǎn)移酶)、niaD(硝酸鹽還原酶)、 PyrG (乳清苷-5,-磷酸脫羧酶)、sC (硫酸鹽腺苷轉(zhuǎn)移酶)、trpC (氨基苯甲酸鹽/酯合酶) 以及其等同物。賦予針對(duì)例如,腐草霉素、潮霉素B或G418抗性的標(biāo)記也可使用。優(yōu)選用于 Aspergillus 細(xì)胞的是 A. nidulans 或 A. oryzae 的 amdS 禾口 pyrG 基因,以及 Streptomyces hygroscopicus的bar基因。amdS標(biāo)記優(yōu)選按照EP 635574或WO 97/06 所描述的技術(shù)來(lái)使用。優(yōu)選的選擇標(biāo)記基因是與A. nidulans gpdA啟動(dòng)子融合的A. nidulans amdS編碼序列(EP 635574)。來(lái)自其它有絲真菌的amdS基因也可使用(W0 97/06261)。為整合進(jìn)宿主細(xì)胞基因組,載體可以依賴于啟動(dòng)子序列和/或編碼多肽的編碼序列或載體的其它任何元件,用于通過(guò)同源或非同源重組將載體穩(wěn)定整合進(jìn)基因組?;蛘?,載體可以含有額外的核酸序列,用于指導(dǎo)通過(guò)同源重組向宿主細(xì)胞基因組的整合。額外的核酸序列能使載體整合進(jìn)宿主細(xì)胞基因組染色體上的精確位置。為增加在精確位置上整合的可能性,整合元件應(yīng)當(dāng)優(yōu)選含有足夠數(shù)量的、與相應(yīng)目標(biāo)序列高度同源的核酸,例如100至 1500個(gè)堿基對(duì),優(yōu)選地,400至1500個(gè)堿基對(duì),更優(yōu)選地,800至1500個(gè)堿基對(duì),以及最優(yōu)選地,至少21Λ,以增大同源重組的可能性。整合元件可以是與宿主細(xì)胞基因組中的目標(biāo)基因銅元的任何序列。整合元件可以是非編碼或編碼的核酸序列。為促進(jìn)定位整合,優(yōu)選在轉(zhuǎn)化宿主細(xì)胞之前對(duì)克隆載體進(jìn)行線性化。線性化優(yōu)選被進(jìn)行至下述程度使得克隆載體的至少一端或優(yōu)選全部?jī)啥说膫?cè)翼都有與目標(biāo)基因座同源的序列。優(yōu)選地,克隆載體中與目標(biāo)基因座同源的整合元件來(lái)自高度表達(dá)的基因座,這意味著它們來(lái)自能在真菌宿主細(xì)胞中高水平表達(dá)的基因。能高水平表達(dá)的基因,即高度表達(dá)的基因,在本文中被定義為其mRNA占細(xì)胞總mRNA的至少0.5% (w/w)的基因,例如,在誘導(dǎo)條件下的,或者被定義為其基因產(chǎn)物占細(xì)胞總蛋白的至少(w/w)的基因,或者,在分泌出的基因產(chǎn)物的情況下,可分泌至至少0. lg/Ι的水平(如EP 357127B1所述)。下面舉例給出了大量?jī)?yōu)選的高度表達(dá)的真菌基因來(lái)自Aspergilli或Trichoderma的淀粉酶、葡糖淀粉酶、醇脫氫酶、木聚糖酶、甘油醛-磷酸酯脫氫酶或纖維二糖水解酶的基因。就上述目的而言,最優(yōu)選的高度表達(dá)的基因是葡糖淀粉酶基因(優(yōu)選地,A. niger葡糖淀粉酶基因), A. oryzae TAKA 淀粉酶基因,A. nidulans gpdA 基因,SEQ ID NO :1、SEQ ID NO :2、SEQ ID NO 3,SEQ ID NO :4 或 SEQ ID NO :5 的基因座,SEQ ID NO =USEQ ID N0:2、SEQ ID NO :3、 SEQ ID NO :4 或 SEQ ID NO :5 的 A. niger 基因座,或 Trichoderma reesei 纖維二糖水解酶基因。另一方面,載體可通過(guò)非同源重組整合進(jìn)宿主細(xì)胞的基因組。可以有超過(guò)一個(gè)拷貝的、編碼多肽的核酸序列被插入到宿主細(xì)胞中,以增加基因產(chǎn)物的產(chǎn)生。這可以通過(guò)下述方法來(lái)實(shí)現(xiàn)優(yōu)選地,將DNA序列的拷貝整合進(jìn)其基因組,更優(yōu)選地,將DNA序列整合到高度表達(dá)的基因座,優(yōu)選地,整合到葡糖淀粉酶基因座或SEQ ID NO =USEQ ID N0:2、SEQ ID NO :3、SEQ ID NO :4 或 SEQ ID NO :5 的基因座?;蛘?,這可以通過(guò)下述方法來(lái)實(shí)現(xiàn)將可擴(kuò)增的選擇性標(biāo)記基因包括到核酸序列,在該處,含有選擇標(biāo)記基因擴(kuò)增拷貝以及核酸序列的額外拷貝的細(xì)胞可被選擇出來(lái),這是通過(guò)在有合適的選擇試劑存在的情況下對(duì)細(xì)胞加以培養(yǎng)來(lái)實(shí)現(xiàn)的。為進(jìn)一步增加將被過(guò)量表達(dá)的DNA序列的拷貝數(shù),如WO 98/46772中所述的基因轉(zhuǎn)化技術(shù)可以使用。
用于將上述元件連接起來(lái)以構(gòu)建本發(fā)明的重組表達(dá)載體的流程是本領(lǐng)域技術(shù)人員公知的(見(jiàn),例如前述Sambrook et al.,1989)。本發(fā)明還涉及重組宿主細(xì)胞,其中包含與編碼多肽的編碼序列可操作地相連的本發(fā)明的啟動(dòng)子序列,所述細(xì)胞可有利地用于生產(chǎn)多肽。包含與編碼多肽的編碼序列可操作地相連的本發(fā)明的啟動(dòng)子的載體被引入宿主細(xì)胞,使得該載體被保持為染色體成分或如前文所述的自主復(fù)制型染色體外載體。術(shù)語(yǔ)“宿主細(xì)胞”包括由于復(fù)制期間發(fā)生的突變,故而與親本細(xì)胞不相同的、親本細(xì)胞的任何后代。對(duì)宿主細(xì)胞的選擇將在很大程度上依賴于編碼多肽的基因及其來(lái)源。本發(fā)明還涉及重組宿主細(xì)胞,其中包含多于一種本發(fā)明的啟動(dòng)子DNA序列,每種啟動(dòng)子都與編碼多肽的編碼序列可操作地相連。此類(lèi)宿主細(xì)胞可以有利地用于對(duì)至少一種多肽的重組生產(chǎn)。優(yōu)選地,載體中存在至少一種啟動(dòng)子及其相連的編碼序列。載體被引入到宿主細(xì)胞中,使得其被保持為染色體成分或如前文所述的自主復(fù)制型染色體外載體。根據(jù)另一種優(yōu)選的實(shí)施方式,宿主細(xì)胞被用于生產(chǎn)特定的初級(jí)或次級(jí)代謝產(chǎn)物, 例如,(beta-內(nèi)酰胺)抗生素、維生素或類(lèi)胡蘿卜素。宿主細(xì)胞可以是有用于本發(fā)明的方法中的任何真菌細(xì)胞。本文中使用的“真菌” 包括 phyla Ascomycota、Basidiomycota、Chytridiomycota 禾口 Zygomycota (如 Hawksworth et al. , Ainsworth and Bisby ‘ s Dictionary of The Fungi,8th edition,1995, CAB International,University Press,Cambridge,UK 所定義的)以及 Oomycota(如 Hawksworth et al.,1995,supra,page 171中提到的)以及所有的有絲分裂孢子真菌(前述 Hawksworth et al. ,1995)0在一種優(yōu)選的實(shí)施方式中,真菌宿主細(xì)胞是酵母細(xì)胞。用于本文中的“酵母”包 1 /^^ ^ (Endomycetales) ^ ^/^^ (basidiosporogenous) ##禾口Μ Fungi Imperfecti的酵母(Blastomycetes)。因?yàn)閷?duì)酵母的分類(lèi)未來(lái)可能會(huì)有改變,就本發(fā)明的目的而言,酵母將如 Biology and Activities of Yeast (Skinner, F. A. ,Passmore, S. Μ., and Davenport, R. R. , eds, Soc. App. Bacteriol. Symposium Series No. 9,1980)中所定義。在一種更優(yōu)選的實(shí)施方式中,酵母宿主細(xì)胞是Candida、Hansenula, Kluyveromyces> Pichia、Saccharomyces> Schizosaccharomyces 或 Yarrowia 細(xì)胞。在一種最為優(yōu)選的實(shí)施方式中,酵母宿主細(xì)胞是Saccharomyces car 1sbergensis、Saccharomyces cerevisiae> Saccharomyces diastaticus、 Saccharomyces douglasii、Saccharomyces kluyveri> Saccharomyces norbensis 或 Saccharomyces oviformis細(xì)胞。在另一種最為優(yōu)選的實(shí)施方式中,酵母宿主細(xì)胞是 Kluyveromyces Iactis細(xì)胞。在另一種最為優(yōu)選的實(shí)施方式中,酵母宿主細(xì)胞是Yarrowia Iipolytica 細(xì)胞。在另一種優(yōu)選的實(shí)施方式中,真菌宿主細(xì)胞是有絲真菌細(xì)胞?!坝薪z真菌細(xì)胞”包括Eumycota和Oomycota亞門(mén)的所有有絲形式(如前述Hawksworth et al.,1995所定義的)。有絲真菌具有如下特征由幾丁質(zhì)、纖維素、葡聚糖、殼聚糖、甘露聚糖和其它復(fù)雜多糖構(gòu)成的菌絲體壁。營(yíng)養(yǎng)生長(zhǎng)是通過(guò)菌絲伸長(zhǎng)進(jìn)行的,碳代謝是專(zhuān)性需氧的。與之相對(duì),酵母,例如Saccharomyces cerevisiae的營(yíng)養(yǎng)生長(zhǎng)是通過(guò)單細(xì)胞原植體出芽來(lái)進(jìn)行的,碳代謝可以是發(fā)酵的。
在一種優(yōu)選的實(shí)施方式中,有絲真菌宿主細(xì)胞是下述物種的細(xì)胞,但不限于此 Acremonium、Aspergillus、Fusarium、Humicola、MucorΛ Myceliophthora、Neurospora、 Penicillium、Thielavia、Tolypocladium 或 Trichoderma。在一種最優(yōu)選的實(shí)施方式中,有絲真菌細(xì)胞是Aspergillus awamori. Aspergillus foetidus、Aspergillus japonicus、A· nidulans、A· niger 或 A oryzae 的細(xì)胞。在另一種最優(yōu)選的實(shí)施方式中,有絲真菌細(xì)胞是Fusarium bactridioides、Fusarium cerealis、Fusarium crookwellense、Fusarium culmorum、Fusarium graminearum、 Fusarium graminum、Fusarium heterosporum、Fusarium negundi、Fusarium oxysporum、 Fusarium reticulatun、Fusarium roseum、Fusarium sambucinum、Fusarium sarcochroum、 Fusarium sporotrichioides、Fusarium sulphureum、Fusarium torulosum、Fusarium trichothecioides或Fusarium venenatum的細(xì)胞。在另一種最優(yōu)選的實(shí)施方式中,有絲真菌細(xì)胞是 Humicola insolens、Humicolalanuginosa、Mucor miehei、Myceliophthora thermophila、Neurospora crassa、Penicillium purpurogenum、Thielavia terrestris、 Trichoderma harzianum、 Trichoderma koningii、 Trichoderma longibrachiatum、 Trichoderma reesei 或 Trichoderma viride 的細(xì)胞。可以用本身已知的技術(shù),通過(guò)下述方法來(lái)轉(zhuǎn)化真菌細(xì)胞,所述方法涉及到原生質(zhì)體形成、原生質(zhì)體轉(zhuǎn)化以及細(xì)胞壁再生。合適的用于轉(zhuǎn)化Aspergillus宿主細(xì)胞的方法被描述于 EP 238023 and Yelton et al.,1984,Proceedings of the National Academy of Sciences USA 81 :1470-1474 巾。☆ iS 白勺、ffi Agrobacterium tumefaciens 轉(zhuǎn) it Aspergillus和其它有絲真菌宿主細(xì)胞的方法被描述于,例如Nat Biotechnol. 1998 Sep ; 16(9) :839-42. Erratum in :Nat Biotechnol 1998 Nov; 16 (11) 1074. Agrobacterium tumefaciens-mediated transformation of filamentous fungi, de Groot MJ, Bundock P, Hooykaas PJ, Beijersbergen AG. Unilever Research Laboratory Vlaardingen, The Netherlands中。合適的用于轉(zhuǎn)化Fusarium的種的方法被描述于Malardier et al.,1989, Gene 78 147-156 和 WO 96/00787 中。可以用 Becker and Guarente,In Abel son, J. N. and Simon, M. I. , editors, Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology, Volume 194, pp 182—187, Academic Press, Inc., New York、Ito et al., 1983, Journal of Bacteriology 153 :163 禾口 Hinnen et al. ,1978, Proceedings of the National Academy of Sciences USA 75 :1920 所述的流程來(lái)轉(zhuǎn)化酵母。本發(fā)明還涉及在宿主細(xì)胞中表達(dá)編碼序列的方法。所述方法包括如下步驟(a)提供一種DNA構(gòu)建體,所述構(gòu)建體包含本發(fā)明的啟動(dòng)子DNA序列以及上述編碼序列,(b)用所述的DNA構(gòu)建體去轉(zhuǎn)化合適的宿主細(xì)胞,以及(c)在所述啟動(dòng)子DNA序列的控制下表達(dá)編碼序列。本發(fā)明還涉及一種方法,用于在合適的真菌宿主中生產(chǎn)編碼序列所編碼的多肽, 所述編碼序列處于本發(fā)明啟動(dòng)子的控制下。所述方法包括如下步驟(a)提供一種DNA構(gòu)建體,所述構(gòu)建體包含本發(fā)明的啟動(dòng)子DNA序列以及編碼上述次級(jí)代謝產(chǎn)物的生產(chǎn)中所涉及的酶的序列,(b)用所述的DNA構(gòu)建體去轉(zhuǎn)化合適的真菌宿主細(xì)胞,以及
(c)在有益于表達(dá)所述多肽的合適培養(yǎng)條件下培養(yǎng)所述合適的真菌宿主,(d)從培養(yǎng)物中回收所述多肽。本發(fā)明還涉及一種方法,用于在合適的宿主中生產(chǎn)次級(jí)代謝產(chǎn)物,所述方法包括(a)提供一種DNA構(gòu)建體,所述構(gòu)建體包含本發(fā)明的啟動(dòng)子DNA序列以及編碼上文定義的酶的序列,(b)用所述的DNA構(gòu)建體去轉(zhuǎn)化合適的真菌宿主細(xì)胞,以及(c)在有益于生產(chǎn)所述次級(jí)代謝產(chǎn)物的合適培養(yǎng)條件下培養(yǎng)所述合適的真菌宿主,(d)從培養(yǎng)物中回收所述多肽。在本發(fā)明的生產(chǎn)方法中,細(xì)胞被培養(yǎng)于適合用于用本領(lǐng)域已知的方法來(lái)生產(chǎn)多肽或代謝產(chǎn)物的營(yíng)養(yǎng)培養(yǎng)基中。例如,可通過(guò)在合適的培養(yǎng)基中于允許編碼序列得以表達(dá)和/ 或多肽得以被分離的條件下進(jìn)行搖瓶培養(yǎng)、實(shí)驗(yàn)室或工業(yè)發(fā)酵罐中的小規(guī)?;虼笠?guī)模發(fā)酵 (包括連續(xù)、分批、補(bǔ)料分批或固態(tài)發(fā)酵)來(lái)培養(yǎng)細(xì)胞。培養(yǎng)發(fā)生于包含碳和氮源以及無(wú)機(jī)鹽的合適營(yíng)養(yǎng)培養(yǎng)基中,使用本領(lǐng)域已知的流程來(lái)進(jìn)行培養(yǎng)。合適的培養(yǎng)基可以從廠商處購(gòu)得,或者按照公開(kāi)的組分配方來(lái)制備(例如,在American Type Culture Collection的目錄中)。如果多肽或代謝產(chǎn)物被分泌到營(yíng)養(yǎng)培養(yǎng)基中,可以直接從培養(yǎng)基中回收多肽或代謝產(chǎn)物。如果多肽或代謝產(chǎn)物不分泌,可以從細(xì)胞裂解物中對(duì)其進(jìn)行回收??梢杂帽绢I(lǐng)域已知的、特定用于多肽的方法來(lái)探測(cè)多肽。這些探測(cè)方法可以包括 使用特異性抗體、酶產(chǎn)物的形成或酶底物的消失??梢杂帽绢I(lǐng)域已知的方法來(lái)回收得到的多肽或代謝產(chǎn)物。例如,可以通過(guò)傳統(tǒng)流程,其包括但不限于,離心、過(guò)濾、萃取、噴霧干燥、蒸發(fā)或沉淀,從營(yíng)養(yǎng)培養(yǎng)基中回收多肽或代謝產(chǎn)物??梢杂帽绢I(lǐng)域已知的多種流程來(lái)純化多肽,其包括但不限于,色譜(例如,離子交換、親和、疏水、層析聚焦和尺寸排除)、電泳流程(例如,制備性等電聚焦)、差異溶解(例如,硫酸銨沉淀)、SDS-PAGE 或萃取(見(jiàn),例如 Protein Purification, J. -C. Janson and Lars Ryden, editors, VCH Publishers, New York,1989)。本發(fā)明還涉及DNA構(gòu)建體,其用于改變真菌宿主細(xì)胞內(nèi)源的、編碼多肽的編碼序列的表達(dá)。所述構(gòu)建體可以含有用于改變內(nèi)源基因表達(dá)所需的最小數(shù)量的組分。在一種實(shí)施方式中,核酸構(gòu)建體優(yōu)選含有(a)定位序列,(b)本發(fā)明的啟動(dòng)子DNA 序列,(c)外顯子以及(d)剪接供體位點(diǎn)。將核酸構(gòu)建體引入細(xì)胞后,該構(gòu)建體通過(guò)同源重組整合進(jìn)細(xì)胞基因組的內(nèi)源基因位點(diǎn)。定位序列引導(dǎo)著元件(a)-(d)整合進(jìn)內(nèi)源基因,使得元件(b)-(d)與內(nèi)源基因可操作地相連。在另一種實(shí)施方式中,核酸構(gòu)建體優(yōu)選含有(a)定位序列,(b)本發(fā)明的啟動(dòng)子 DNA序列,(c)外顯子,(d)剪接供體位點(diǎn),(e)內(nèi)含子以及(f)剪接受體位點(diǎn),其中,定位序列引導(dǎo)著元件(a)-(f)的整合,使得元件(b)-(f)與內(nèi)源基因可操作地相連。但是,所述構(gòu)建體還可以含有額外元件,例如選擇性標(biāo)記。前文已描述過(guò)可以使用的選擇性標(biāo)記。在兩種實(shí)施方式中,這些元件的引入導(dǎo)致了新的轉(zhuǎn)錄單元的產(chǎn)生,其中,內(nèi)源基因的表達(dá)被改變。大體上,新的轉(zhuǎn)錄單元是定位構(gòu)建體引入的序列和內(nèi)源基因的融合產(chǎn)物。在一種實(shí)施方式中,其中內(nèi)源基因被改變,基因即被活化。在該實(shí)施方式中,通過(guò)插入調(diào)控序列,同源重組被用于置換、打斷或失活在正常情況下與親本細(xì)胞內(nèi)源基因相連的調(diào)控區(qū)域, 這導(dǎo)致較之在相應(yīng)親本細(xì)菌中的情況,基因以更高的水平被表達(dá)。定位序列可以位于內(nèi)源基因內(nèi),緊鄰該基因,在上游基因中,或在內(nèi)源基因上游并與其有一段距離??梢允褂靡环N或多種定位序列。例如,環(huán)狀質(zhì)?;駾NA片段優(yōu)選使用單種定位序列,而線狀質(zhì)?;駾NA片段優(yōu)選使用兩種定位序列。構(gòu)建體還含有內(nèi)源基因的一個(gè)或多個(gè)外顯子。外顯子被定義為下述DNA序列其會(huì)被拷貝為RNA,并存在于成熟mRNA分子中,使得外顯子序列與內(nèi)源基因的編碼序列處于同一讀碼框。外顯子可選地可以含有編碼一個(gè)或多個(gè)氨基酸和/或部分編碼氨基酸的DNA。 或者,外顯子含有相應(yīng)于5’非編碼區(qū)域的DNA。當(dāng)外源外顯子或外顯子編碼一個(gè)多個(gè)氨基酸和/或氨基酸的一部分時(shí),核酸構(gòu)建體被設(shè)計(jì)為轉(zhuǎn)錄和剪接后,讀碼框與內(nèi)源基因的編碼區(qū)域處于同一讀碼框,使得從第二個(gè)外顯子獲得的mRNA的部分的合適讀碼框不被改變。 構(gòu)建體的剪接供體位點(diǎn)指導(dǎo)從一個(gè)外顯子到另一個(gè)外顯子的剪接。典型地,第一個(gè)外顯子處于第二個(gè)外顯子的5’側(cè),重疊且側(cè)翼于第一個(gè)外顯子3’側(cè)的剪接供體位點(diǎn)能識(shí)別在第二個(gè)外顯子5’側(cè)側(cè)翼于第二個(gè)外顯子的剪接受體位點(diǎn)。剪接受體位點(diǎn),和剪接供體位點(diǎn)一樣,都是能指導(dǎo)從一個(gè)外顯子到另一個(gè)外顯子的剪接的序列。剪接裝置與剪接供體位點(diǎn)聯(lián)合作用,使用剪接受體位點(diǎn)來(lái)實(shí)現(xiàn)內(nèi)含子的去除。用于改變給定DNA序列表達(dá)的優(yōu)選策略包括缺失給定的DNA序列和/或用經(jīng)修飾的啟動(dòng)子DNA序列,例如本發(fā)明的啟動(dòng)子,去置換給定DNA序列的內(nèi)源啟動(dòng)子序列。優(yōu)選通過(guò)EP 0357127所述的基因置換技術(shù)來(lái)進(jìn)行缺失和置換。優(yōu)選使用amdS基因作為選擇標(biāo)記基因按照EP 635574所述來(lái)進(jìn)行對(duì)基因和/或啟動(dòng)子序列的特異性缺失。通過(guò)EP 635574 所述的在氟乙酰胺培養(yǎng)基上進(jìn)行的反向選擇,得到的菌株是不含選擇標(biāo)記的,其可用于進(jìn)一步的基因修飾。作為替代,或與上面提到的技術(shù)組合,還可以使用基于在E. coli中進(jìn)行粘粒體內(nèi)重組的技術(shù),如 A rapid method for efficient gene replacement in the filamentous fungus A. nidulans(2000)Chaveroche, M-K. , Ghico, J-M. and d ' Enfert C;Nucleic acids Research, vol 28,no 22所述。該技術(shù)可用于其它有絲真菌,例如A. niger。本文中描述并要求保護(hù)的本發(fā)明不僅限于本文所公開(kāi)的特定實(shí)施方式的范圍,因?yàn)檫@些實(shí)施方式僅被用于對(duì)本發(fā)明的若干方面加以闡述。任何等同的實(shí)施方式都被包括在本發(fā)明的范圍內(nèi)。事實(shí)上,基于前述的說(shuō)明書(shū),除本文展示和描述過(guò)的之外,本發(fā)明的多種改良形式將是本領(lǐng)域技術(shù)人員顯而易見(jiàn)的。此類(lèi)改良形式也將在所附權(quán)利要求的范圍內(nèi)。在有爭(zhēng)論的情況下,本發(fā)明的公開(kāi)文本,包括定義,將起控制作用。本文提到的所有專(zhuān)利和出版物,包括這些專(zhuān)利和出版物內(nèi)所公開(kāi)的所有序列和方法,都通過(guò)引用被明確并入本文。這些專(zhuān)利和公開(kāi)文本包括EP 357127、EP 673429、EP 635574、WO 97/06261、WO 98/46772、WO 94/04673。
實(shí)施例實(shí)驗(yàn)信息菌株
WTl 該A.niger菌株被用作為野生型菌株。該菌株被保藏于CBS研究所,保藏號(hào)為 CBS 513. 88。WT2 該A. niger菌株是包含編碼葡糖淀粉酶的基因(glaA)缺失的WTl菌株。WT2 是按照EP 0635574所述使用“MARKER-GENE FREE”方法構(gòu)建的。在該專(zhuān)利中,廣泛地描述了如何在CBS 513. 88基因組中缺失glaA特異性DNA序列的方法。該流程產(chǎn)生了不含標(biāo)記基因的glaA重組A. niger CBS 513. 88菌株,該菌株最終并不具有任何外源DNA序列。葡糖淀粉酶活件檢騎按照WO 98/46772所述,使用對(duì)硝基苯a_D_吡喃葡糖苷(Sigma)來(lái)測(cè)定葡糖淀粉酶活性。棚列1 ^^ DNA伺觸■■歹丨_藥艦紐輔王本實(shí)施例描述了對(duì)在本發(fā)明啟動(dòng)子控制下的表達(dá)構(gòu)建體的構(gòu)建。此處使用的編碼序列或報(bào)道構(gòu)建體是編碼A. niger葡糖淀粉酶的glaA基因。葡糖淀粉酶被用作為能測(cè)量本發(fā)明啟動(dòng)子活性的報(bào)道酶。1. 1對(duì)整合型葡糖淀粉_表汰裁彳本(dGBTOPGLA)的描沭將葡糖淀粉酶啟動(dòng)子和來(lái)自A. niger的葡糖淀粉酶編碼基因glaA克隆進(jìn)表達(dá)載體pGBT0P-8(其被描述于WO 99/3沈17中)。按照已知流程和常規(guī)克隆技術(shù)來(lái)進(jìn)行克隆,得到質(zhì)粒pGBTOPGLA (見(jiàn)圖1)。大體上,該表達(dá)載體包含葡糖淀粉酶啟動(dòng)子、編碼序列和終止子區(qū)域,側(cè)翼有E. coli載體中的3’和3” glaA定位序列。1. 2構(gòu)建帶有多克隆位點(diǎn)MCS的整合型葡糖淀粉酶表達(dá)載體(pGBTOPGLA-2)使用SEQ ID NO 6示出的寡核苷酸5,-ATgCggCCgCCTCgAgTTAATTAAggCCAggCCggCCggCgCgCCTCAgCAATgTCgTTCCgA-3,和SEQ ID NO 7 示出的5’ -AGCCATTGACTTCTTCCCAG-3,以及Ing pGBTOPGLA載體作為模板,產(chǎn)生了含有g(shù)laA編碼序列一部分的PCR片段。 用B10I和BglII來(lái)消化該片段,將其引入到BioI和BglII消化過(guò)的載體pGBTOPGLA中,得到載體pGBTOPGLA-2 (見(jiàn)圖2)。通過(guò)序列分析,證實(shí)了包含MCS和glaA編碼序列一部分的、 引入的PCR片段的序列。1. 3構(gòu)建帶有本發(fā)明的啟動(dòng)子的整合型表達(dá)載體(pGBTOPGLA-3),所述啟動(dòng)子與葡糖淀粉酶編碼序列可操作地相連對(duì)菌株CBS 513.88的基因組DNA進(jìn)行測(cè)序和分析。使用下表展示的寡核苷酸組合物(寡核苷酸SEQ ID NO ),用菌株CBS 513. 88的基因組DNA作為模板,通過(guò)PCR擴(kuò)增將合適的限制性位點(diǎn)連到本發(fā)明的啟動(dòng)子上。被示為SEQ ID NO=U SEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4或SEQ ID NO 5的序列包含大約21Λ的獲得的片段序列,如下表所示。用AscI和B10I去消化全部五段得到的片段,將它們引入到用AscI和B10I消化過(guò)的載體 pGBTOPGLA-2 中,得到載體 pGBTOPGLA-4、pGBTOPGLA-5、pGBTOPGLA-7、pGBTOPGLA-9 或 pGBTOPGLA-10,如下表所示(載體名)。在圖3中,可以找到用于說(shuō)明全部五種載體的布局結(jié)構(gòu)的圖。通過(guò)序列分析,證實(shí)了多種包含本發(fā)明啟動(dòng)子的引入的PCR片段的序列。
權(quán)利要求
1.啟動(dòng)子DNA序列,選自由如下物質(zhì)構(gòu)成的組(a)DNA序列,其中包含SEQ ID NO :1的核苷酸序列,(b)DNA序列,其能與(a)的DNA序列雜交,(c)DNA序列,其與(a)的DNA序列至少50%同源,(d)(a)至(c)所述的任何DNA序列的變體,以及(e)(a)至(d)所述的DNA序列中任何一種的亞序列。
2.DNA構(gòu)建體,其中包含如權(quán)利要求1所述的啟動(dòng)子DNA序列,以及與所述啟動(dòng)子DNA 序列可操作地相連的編碼序列,從而所述編碼序列可在所述啟動(dòng)子DNA序列控制下被表達(dá)。
3.宿主細(xì)胞,包含如權(quán)利要求2所述的DNA構(gòu)建體。
4.如權(quán)利要求3所述的宿主細(xì)胞,其中,所述宿主細(xì)胞是Aspergilluslenicillium或 Trichoderma 的物種。
5.如權(quán)利要求4所述的宿主細(xì)胞,其中,所述Aspergillus是Aspergillusniger或 Aspergillus oryzae 的物禾中。
6.一種方法,用于在宿主細(xì)胞中表達(dá)基因,所述方法包括(a)提供如權(quán)利要求2所述的DNA構(gòu)建體,(b)用所述DNA構(gòu)建體去轉(zhuǎn)化合適的宿主細(xì)胞,以及(c)在所述啟動(dòng)子DNA序列控制下表達(dá)所述基因。
7.一種方法,用于在合適的宿主中生產(chǎn)多肽,所述方法包括(a)提供如權(quán)利要求2所述的DNA構(gòu)建體,其中包含編碼所述多肽的編碼序列,(b)用所述DNA構(gòu)建體去轉(zhuǎn)化合適的宿主細(xì)胞,(e)在有益于所述多肽表達(dá)的培養(yǎng)條件下培養(yǎng)所述合適的宿主,以及(f)從培養(yǎng)物中回收所述多肽。
8.一種方法,用于在合適的宿主中生產(chǎn)次級(jí)代謝產(chǎn)物(a)提供如權(quán)利要求2所述的DNA構(gòu)建體,其中包含編碼對(duì)次級(jí)代謝產(chǎn)物的生產(chǎn)中所涉及的酶的編碼序列,(b)用所述DNA構(gòu)建體去轉(zhuǎn)化合適的宿主細(xì)胞,(c)在有益于所述次級(jí)代謝產(chǎn)物生產(chǎn)的培養(yǎng)條件下培養(yǎng)所述合適的宿主,以及(d)從培養(yǎng)物中回收所述次級(jí)代謝產(chǎn)物。
全文摘要
本發(fā)明提供了用于在真菌細(xì)胞中表達(dá)基因的真菌啟動(dòng)子。本發(fā)明涉及經(jīng)過(guò)分離的真菌啟動(dòng)子DNA序列,涉及包含這些啟動(dòng)子的DNA構(gòu)建體、載體和真菌宿主細(xì)胞,所述啟動(dòng)子與編碼多肽的編碼序列可操作地相連。本發(fā)明還涉及用經(jīng)過(guò)分離的新啟動(dòng)子表達(dá)基因和/或生產(chǎn)多肽的方法。本發(fā)明還涉及用本發(fā)明的新啟動(dòng)子改變轉(zhuǎn)錄水平和/或?qū)?nèi)源基因的調(diào)控的方法。
文檔編號(hào)C07K14/38GK102286483SQ20111016654
公開(kāi)日2011年12月21日 申請(qǐng)日期2005年4月18日 優(yōu)先權(quán)日2004年4月16日
發(fā)明者蒂鮑特·喬斯·維恩策爾, 諾林·尼古拉斯·瑪麗亞·艾里薩伯斯·佩伊·范, 阿恩·斯達(dá)姆 申請(qǐng)人:帝斯曼知識(shí)產(chǎn)權(quán)資產(chǎn)管理有限公司