專利名稱:編碼黑曲霉羧肽酶的基因的制作方法
技術領域:
本發明涉及編碼真菌液泡蛋白酶的基因。特別是本發明涉及絲狀子囊菌類或半知菌類真菌,例如曲霉屬的羧肽酶基因。
真菌液泡是含有許多水解酶,包括數種蛋白酶的酸性器官,并且基本上等同于哺乳動物的溶酶體。已經鑒定并表征了特別是酵母的一種或多種真菌的水解酶;這些包括蛋白酶A(PEPA或PrA),蛋白酶B(PrB)或氨肽酶(APE),二肽基氨肽酶B(DPAPB),羧肽酶Y(CPY)和羧肽酶S(CPS)。大多數液泡水解酶是作為非活性前體而合成的糖蛋白。事實上,除APE外,上述所有提到的蛋白酶都有導致過渡通過分泌途徑的信號肽。在晚期高爾基體中,液泡蛋白與分泌蛋白分開,然后最終輸送到液泡中。除信號肽外,大多數液泡蛋白還含有輸送到液泡后被裂解以產生成熟活性酶的原肽。已經證實在原肽中存在PrA和CPY對于以液泡為靶所需的氨基酸信息(Johnson et al.,Cell 48875-885,1987;Rothman etal.,PNAS USA 833248-3252,1989;Valls et al.,Cell 48887-897;Valls et al.J.Cell Biol.111361-368,1987)。對于CPY,已經表明有四個氨基酸殘基(QRPL)對于定位于液泡是必需的(Valls etal.J.Cell Biol.111361-368,1990)。一旦輸送到液泡后,蛋白酶A(pep4)裂解CPY和PrB的原肽以便激活蛋白酶(Ammerer et al.,Mol.Cell.Biol.62490-2499,1986;Woolford et al.,Mol.Cell.Biol.62500-2510)。
在啤酒酵母中,已鑒定了錯定位或錯分類液泡蛋白的三類突變體(Bankaitis et al.,PNAS USA 839075-9079,1986;Robinson et al.,Mol.Cell.Biol.,84936-4948,1988;Rothman et al.,EMBOJ.82057-2065,1989;Rothman and Steven,Cell 471041-1051,1986)。這些突變體被稱為vps或液泡蛋白分類突變體。利用一種選擇來分離數個這樣的突變體,所述選擇是基于觀察到質粒上的高拷貝液泡蛋白酶的過表達會導致分泌液泡蛋白酶(Steven etal.,J.Cell Biol.,1021551-1557,1986Rothman et al,PNAS USA833248-3241,1986)。這表明在晚期高爾基體中可能有飽和分類機制。
在啤酒酵母中,還表明,缺失PEP4,CPY和PrB的菌株由于所需產物蛋白水解的減少生產較高水平的異源蛋白質。因此,由于生產所研究的液泡蛋白酶的真菌被用于重組生產異源蛋白,因而從商業角度看,所述液泡蛋白酶是很重要的。在發酵中這些蛋白酶的存在是很令人頭痛的,因為它們還可以降解所需的蛋白質,從而明顯降低生產率。通過破碎或缺失編碼其的基因可以有利于消除任何已有蛋白質的功能;但是,這樣做首先要鑒定并分離在所需宿主中的相應的基因。如上所述,從各種酵母菌株中只鑒定了很少的所述基因;然而,在絲狀子囊菌或半知菌中編碼液泡蛋白酶的基因很少有人知道。例如,已經分離了編碼另兩種黑曲霉液泡蛋白酶的PEPC(Frederich et al.,Gene 12557-64,1993)和PEPE(Jarai et al.,Gene145171-178,1994)基因。PEPC編碼蛋白酶B(PrB)同系物,PEPE編碼蛋白酶A的同系物。也已經克隆了編碼PrA同系物的Neutospora Crassa的PEP4基因(Bowman,17th funga;Genetics Conference,1993)。本文首次描述了來自絲狀子囊菌或半知菌的編碼液泡CPY的基因。
本發明涉及含有編碼絲狀子囊菌或半知菌羧肽酶Y的核酸構建體,以及重組生產由其編碼的蛋白質。如本文所用的,“核酸構建體”指任何cDNA,基因組DNA,合成的DNA或RNA源的核酸分子。術語“構建體”指核酸片段,所述核酸片段可以是單鏈或雙鏈的,可以從天然基因中完全或部分地被分離,或可以被修飾以含有以在自然界不存在的方式組合且并置的DNA片段。所述構建體還可以含有其他核酸片段。在優選的實施方案中,所述序列編碼曲霉屬的羧肽酶。本發明還提供了生產不產生羧肽酶的絲狀子囊菌或半知菌細胞的方法,包括破碎或缺失羧肽酶基因以防止功能酶的表達,或通過利用物理或化學處理的經典誘變以產生其生產CPY能力降低或沒有了的細胞。另外,本發明還包含不能生產功能羧肽酶或以相對于野生型菌株生產的量而言,生產減少量的羧肽酶的絲狀子囊菌或半知菌。所述生物提供了改進重組蛋白質生產方法的基礎,其中用編碼所述蛋白質的核酸構建體轉化羧肽酶缺陷型微生物,然后在表達所述蛋白質的條件下培養。
附圖描述
圖1表示黑曲霉Bo-1基因組CPY克隆的DNA序列及其翻譯。圖2表示黑曲霉SFAG2 CPYcDNA的DNA序列及其翻譯。標明了信號肽酶裂解的預期的位點以及成熟CPY的N-末端。圖3說明了在破壞CPY中所用的構建體。
利用啤酒酵母CPY,微紫青霉羧肽酶S1(Svedsen etal.,FEBS33339-43,1993,和麥芽羧肽酶-MIII(Sorensen et al.,Carlsberg res.Commun.54193-202,1993),通過設計一系列的簡并寡核苷酸來開始嘗試分離曲霉屬羧肽酶Y。下文實施例中提供了所述寡核苷酸序列。在利用黑曲霉菌株Bo-1基因組DNA為模板的PCR反應中,用這些序列以各種組合為引物。其中的兩個反應(用引物1-1和2-1;以及1-2和2-2)產生了一個1100bp的擴增產物,將其亞克隆并測序,但是沒有亞克隆與鑒定為所需基因的CPY明顯同源。然后進行了用引物3-1,3-2,4-1,4-2,2-1和2-2的其他PCR反應。在其中的兩個反應中(用引物4-1和2-1;以及4-2和2-1)得到了一個600bp的擴增產物。將該產物亞克隆,并將11個亞克隆測序;其中的9個亞克隆是一致的,而且與其他來源的羧肽酶Y基因同源。用一個亞克隆中的插入片段探測黑曲霉基因組DNA;用Bamh I,Hind III,和SAlI消化產物觀察到有一個帶的雜交,表明在黑曲霉中存在單個CPY基因。于65℃,在1.5×SSPE,1.0%SDS,0.5%脫脂牛奶和200μg/ml鮭精子DNA中進行雜交。
制備在EMBL4中的黑曲霉基因組DNA庫,然后用PCRCPY-衍生的基因片段(32P-標記的)檢測,以便分離全長基因。在約28,000個噬菌體中,撿出11個陽性的;將其中的9個在純化后再用探針雜交。大多數這些克隆共有的5.5HindIII片段被鑒定為黑曲霉CPY基因。將該片段亞克隆并測序;在圖1中提供了含有CPY編碼區和預期的氨基酸序列的片段的序列。
隨后,再篩選來自不同黑曲霉菌株的cDNA庫。從該庫中還鑒定至少一個全長克隆。將該克隆測序并在圖2中描述了所述序列。預期均有兩個557個氨基酸長的CPY前體序列。以與來自啤酒酵母的同源基因的比較為基礎,來自黑曲霉的CPY似乎有一個137或138個氨基酸的前-原肽。所述基因含有一個61個堿基對的內含子。兩個黑曲霉序列的比較表明,在氨基酸序列方面有些不同,這可能反映了所述基因組的和cDNA克隆是分離自不同的菌株。與啤酒酵母和C.albican的相應的CPY基因的比較表明分別有65%和66%的一致性。
本發明并不限于使用圖1和2所公開的序列。首先,本發明還包括生產與圖1或2中描述的氨基酸序列相同的,但是因遺傳密碼簡并性而不同的核苷酸序列。另外,因相同種的兩個菌株而得到不同的氨基酸序列說明在一個種內的序列上的變異是可以容忍的,而且利用本文描述的技術,可以很容易鑒定所述的變異體。因此在本文中提到“黑曲霉”時,應理解包括所有所述的變異體。具體地說,本發明還包括任何變異體核苷酸序列,及由其編碼的蛋白質,其中所述蛋白質保留了與圖1或2中所示的氨基酸序列至少約80%,優選約85%,最佳為至少約90-95%的同源性,而且在性質上保留了本文所述序列的活性。在上述定義的目錄中有用的變異體包括例如,已完成的保守氨基酸取代,所述取代并未顯著影響所述蛋白質的活性。所謂保守取代指相同類型的氨基酸可以由該類型的其他氨基酸取代。例如,可以交換非極性的脂肪族殘基Ala,Val,Leu,和Ile,堿性殘基Lys和Arg,或酸性殘基Asp和Glu。相似地,Ser和Thr彼此可以進行保守取代,Asn和Gln也可以。
另外,分離的基因提供了從其他絲狀子囊菌或半知菌,例如曲霉種,如米曲霉,臭曲霉,日本曲霉,棘孢曲霉,或構巢曲霉中分離同源基因的方法。其他非曲霉絲狀子囊菌包括鐮孢屬,例如,禾谷鐮孢,尖孢鐮孢,茄病鐮孢大刀鐮孢(或相應的teleomorphs)粗糙鏈孢霉,Trichoderma reesei,Tviridae,T.harzianum T.longibranchiatum,微紫青霉,點青霉,產黃青霉,沙門氏柏干酪青霉,婁格法兒特氏青霉,Humicola insolen,灰色腐質霉thermoidea變種,H.lanuginosa,Scytalidium thermophilumyceliophthora thermophila,和Thielavia terrestris。在Southern雜交中可以用所述基因或以其為基礎的寡核苷酸作探針,以分離這些其他種中的同源基因。具體地說,用所述探針在低或高嚴謹條件下(例如,在42℃,5×SSPE,0.3%SDS,200μg/ml剪切并變性的鮭精DNA,分別為50,35或25%用于高,中和低嚴謹條件下預雜交和雜交)與所需種的基因組或cDNA進行雜交,標準的Southerm印跡方法后,以鑒定并分離其中相應的CPY基因。用本文所述的簡并探針及來自絲狀真菌的基因組DNA或第一條鏈cDNA的PCR也可以得到CPY特異性產物,然后可以用其作為探針克隆相應的基因組或cDNA。
本發明基因在產生絲狀子囊菌,例如曲霉的羧肽酶-缺陷型突變體時特別有用。可以用很多方法達到該目的。在一種方法中,如下文進一步描述的,將一個選擇性標記克隆到CPY基因個中部。用限制酶將破壞的片段從母本質粒中釋放出。用所述線性化的DNA片段轉化所選的宿主細胞。在所述的宿主細胞中,同源末端與宿主染色體配對,同源重組產生了染色體基因替代。與真菌細胞宿主可一起使用的可選擇標記包括amdS,pyrG;argB,niaD,sC,和hygB。另外,用兩種可選擇標記可以使用兩步法。在所述的一種方法中,用在CPY配對內切割一次以便在轉化過程中靶整合到CPY座位的限制酶消化含有截斷的CPY基因和可選擇標記基因的質粒。然后在選擇丟失可選擇標記的培養基上使轉化體生長,例如若標記為pyrG時,培養基可含有5-fluorootic acid。在野生型CPY和導入的截斷的CPY基因之間重組時,常常發生可選擇標記的丟失。與約50%的所得菌株應只有截斷的CPY基因,而另外50%只含有野生型基因。在Rothstein,Meth.Enzymol.194,281-301,1991中描述了所述方法。
所產生的CPY缺陷型突變體在表達異源蛋白質時,是特別有用的。在本發明中,“異源蛋白質”指在所述宿主中天然不存在的蛋白質,對天然序列已經進行了修飾的天然蛋白質,或用重組DNA技術修飾宿主后,其表達在數量上發生了變化的天然蛋白質。該術語還包括其突變體的表達使用了宿主中天然沒有的遺傳成分或使用了經加工后,以在宿主中不常見的方式發揮作用的天然成分的天然蛋白質。
正如已經提到的,由所選擇的宿主細胞而進行的蛋白酶生產可以在其被回收前通過降解產物而嚴格限制了所需蛋白質的產率。因此由宿主生產的CPY的消除或量的減少實質上提高了所需蛋白質的產率,而且可以提供商業上可行的用于重組蛋白質生產的商業上通常不使用的宿主細胞。在優選的實施方案中,CPY缺陷型細胞生產至少25%,優選至少50%弱,且最佳為至少70%弱的CPY,與相應的野生型相比,最多可喪失全部的CPY功能。
可以用本發明的突變體真菌細胞以與野生型菌株相同的方法用于重組蛋白質的生產。本領域專業人員很容易從本文所述的具體實施方案中認識各種途徑的變化,所述實施方案根據上述菌株而對方法加以改進。用表達載體可以表達活性形式的所需基因。有用的表達載體含有可以使所述載體穩定整合到宿主細胞的基因組中或使載體在宿主細胞基因組外獨立自主復制的元件,以及優選的一種或多種可以很容易地篩選轉化的宿主細胞的表型標記。所述表達載體還可以包括編碼啟動子的序列,核糖體結合位點,翻譯起始密碼子和,可選擇的阻遏物基因或激活物基因。為了在控制序列的指導下表達,根據本發明所用的基因優選的在適當的閱讀框中與所述的控制序列可操作相連。
表達載體可以是任何可方便地利用重組DNA技術的載體,而且載體的選擇通常取決于其所導入的宿主細胞。在本發明優選的實施方案中,宿主細胞是曲霉屬的菌株。因此載體可以是自主復制載體,即可以作為染色體外個體而存在的載體,其復制獨立于染色體復制,例如質粒或一種染色體外元件,小染色體,或人工染色體。另外,所述載體可以是當其導入宿主細胞中時,可整合到宿主細胞染色體并與其所整合上的染色體一起復制的載體。
在所述載體中,所需基因的序列應與適宜的啟動子序列可操作相連。所述啟動子可以是在所選的宿主細胞中有轉錄活性的任何DNA序列,并且可以得自編碼與宿主細胞同源或異源的基因。為了在真菌宿主中轉錄,有用的啟動子的例子是得自編碼米曲霉TAKA淀粉酶,Rhizomucor miehei天冬氨酸蛋白酶,黑曲霉中性α-淀粉酶,黑曲霉酸穩定的α-淀粉酶,黑曲霉或泡盛葡糖淀粉酶(glaA),Rhizomucor miehei脂酶,米曲霉堿性蛋白酶,米曲霉丙糖磷酸異構酶或構巢曲霉乙酰胺酶基因的啟動子。優選的是TAKA-淀粉酶和glaA啟動子。
本發明的表達載體還可以含有適宜的轉錄終止子,和在真核細胞中與編碼異源基因序列的DNA序列可操作相連的多聚腺苷酸序列。終止和多聚腺苷酸序列適宜的可從與啟動子相同的來源得到。所述載體還可以含有能夠使載體在所研究的宿主細胞中復制的DNA序列。所述序列的實例是質粒pUC19,pACYC177,pUB110,pE194,pAMB1和pIJ702的復制起點。
所述載體還可以含有選擇性標記,例如其產物補充宿主細胞中的缺陷的基因,或賦予抗生素抗性,例如氨芐青霉素,卡那霉素,氯霉素或四環素抗性的基因。曲霉選擇標記的實例包括amdS,PYrGmargB,niaD sC,和hygB,產生hygromycin抗性的標記。在曲霉宿主細胞中優選使用構巢曲霉或米曲霉的amdS和pyrG。此外,例如按WO 91/17243中的描述通過共轉化來完成選擇。
通常優選的是表達后得到細胞外產物。因此所述蛋白質含有可以將表達的蛋白質分泌到培養基中的前區。如果需要,所述前區可以是本發明蛋白質的天然的,或經編碼相應前區的DNA序列一般取代而用不同前區或信號序列取代的。例如,所述前區可以得自曲霉種的葡糖淀粉酶或淀粉酶基因,桿菌種的淀粉酶基因,Rhizomucor miehei的脂酶或蛋白酶基因,啤酒酵母α-因子的基因或牛前原凝乳酶基因。當宿主是真菌細胞時,特別優選的是米曲霉TAKA淀粉酶,黑曲霉中性淀粉酶,桿菌NCIB 11837的maltogenic淀粉酶,嗜熱脂肪芽孢桿菌α-淀粉酶或地衣形芽孢桿菌蛋白酶的前區。一種有效的信號序列是米曲霉TAKA淀粉酶信號,Rhizomucor miehei天冬氨酸蛋白酶信號和Rhizomucormiehei脂酶信號。
分別用于連接本發明的DNA構建體,啟動子,終止子和其他成分然后將其插入含有復制所需的信息的適宜的載體中的方法,是本領域專業人員熟知的(參見例如,Sambrook et al.,MolecularCloning,1989)。
可以用CPY缺陷型突變體表達任何所需的原核或真核蛋白質,而且優選用于表達真核蛋白質。這些細胞特別有用的是適用于表達過氧化氫酶,漆酶,酚氧化酶,氧化酶,氧化還原酶,纖維素酶,木聚糖酶,過氧化物酶,脂酶,水解酶,酯酶,角質酶(cutinase)蛋白酶和其他蛋白水解酶,氨肽酶,羧肽酶,植酸酶,裂解酶,果膠酶和其他果膠水解(pectinolytic)酶,淀粉酶,葡糖淀粉酶,半乳糖苷酶,半乳糖苷酶,α-葡糖苷酶,β-葡糖苷酶,甘露糖苷酶,異構酶,蔗糖酶,轉移酶,核糖核酸酶,幾丁質酶和脫氧核糖核酸酶。本領域專業人員應該理解,術語“真菌酶”不僅包括天然真菌,而且包括經氨基酸取代,缺失,加入或為提高其活性,熱穩定性,pH耐受性等而修飾過的真菌酶。也可以用所述突變體表達藥物學上的異源蛋白質,例如激素,生長因子,受體等。
將用下列實施例對本發明作進一步的說明。實施例I.分離黑曲霉CPY基因A.材料和方法i.菌株在下文描述的方法中使用了下列生物材料。E.coli K802(ek4-(nrca),mcr B,hsdR2,galD2,GalT22,WupE44,metB1;E.coliSOLP(E14-(mcrA)(mcrCB-hsdSMR-mrr)171,sbcC,recB,recJ,uvrC,umuDTn5(kanr),lacgryS96,relA1,thi-1,endA1,λR[F’proAB lacIqZΔM15]Su-,E.coliJM101supE,thi-1,Δ(lac-proAB),[F’traD36,proAB,lacIqZΔM15],E.coli XL-1 Blue rec A1,endA1,gyr A96,thi-1,hsdR17,supE44,relA1,lac[F’proAB lacIqZΔM15,Tn10(tetR)],黑曲霉Bo-1,黑曲霉SFAG-2。
ii.PCR擴增用標準技術在45℃退火來進行PCR。用黑曲霉Bo-1基因組DNA作為模板,用下列簡并寡核苷酸。引物 1-1(94-282)-GGIGGICCIGGITGYTC引物 1-2(94-283)-GGIGGICCIGGITGYAG引物 2-1(94-284)-CCIAGCCARTTRCADAT引物 2-2(94-285)-CCYAACCARTTRCADAT引物 3-1(94-331)-GTIGGITTYTCITAYTCIGG引物 3-2(94-332)-GTIGGITTYAGYTAYAGYGG引物 4-1(94-329)-GARTCITAYGCIGGICAYTA引物 2-1(94-284)-GARAGYTAYGCIGGICAYTA在上述引物中I代表肌苷,Y代表C或T,R代表A或G,D代表A,G或T。iii.亞克隆PCR產物按制造商的說明,用TA Cloning試劑盒(Invitrogen)將PCR產物亞克隆以進行測序。iv.從λZap II體內切割通過在大腸桿菌SOLR中傳代,然后按照Strategene提供的方法,可從CPY cDNAλZap克隆獲得含有在pBluescript SK載體中攜帶了cDNA插入子的質粒。v.DNA測序用熒光標記的核苷酸,利用聚合酶循環測序確定核苷酸測序。在Applied Biosystems自動DNA測序儀(Model 363 A,1.20版)上電泳測序反應產物。使用下列CPY特異性引物,再使用M13反向(-48)和M13(-20)前向引物(Sanger et al.,J.Mol.Biol.143163-178)94-376TCGCTGCCAGTCTATGATTGA94-377ACATCAACCGCAACTTCCTCT94-378TTGCCAATGAGAACGGACTGC94-379CGCACTTACCACGGACATCAT94-503CAAGCATCCTCAAACTATCGT94-504GAGACGCATGAAGGTGAAGTT94-505GCCGTCCCTCCCTTCCAGCAG94-506GTGCCGACGGGTTCTCCAAGC94-507GCAGCGAGGAAGAGCGTTGTC94-510GGGTCATTCTCGGGGTCATTG94-511GACCCCGAGAATGACCCTGTT94-512GTAGGGCTTCATCCAGTCACC94-513TCTCACCGTTCTCACCAGTAA94-514TCCCTCCCCAAGAAGCACAAC94-528AGCGTCTGGGTTACTGGTGAG94-529AAGATCGGCCAGGTCAAGTCC94-530GAGACGGTGGTAGGGCTTCAT94-531AACGTCGGTTACTCTTACAGC94-532GTGGTCGGGGCGGCGGTTGTG94-533TGTTTGAAGAAGAGGGTAAGC94-575CGCTGCTACTTGATTTTTCTA94-576CTCAGCGCCAACAGCCTCAAT94-577ACCTGCAGTCCGTTCTTATTG94-634TGCGATCGATTCATTCTCATC94-635GGAGTAACCGACATTGACAGG94-536CCTGTCAATGTCGGTTACTCC94-637GTCCCATGGCAACTTCACCTT94-646CTTCTCACCGTTCTCACCAGT94-647CGAGACTCGAAGAACCCTAAGB.結果用黑曲霉Bo-1基因組DNA為模板,,使用各種組合的CPY特異性簡并寡核苷酸,引物1-1,1-2,2-1和2-2(圖1)完成PCR反應。所有的反應均以一個循環為95℃5分鐘,45℃1分鐘和72℃2分鐘,接著進行25個下一循環,即95℃1分鐘,45℃1分鐘和72℃2分鐘。在瓊脂糖凝膠上將反應物小樣(10μl)電泳,在兩個反應中,一個使用引物1-2和2-1,另一個使用引物1-2和2-2,約1100bp的擴增產物占大部分。使用假設在那兒的這些寡核苷酸組合而預期的產物的大小在900bp的基因內沒有內含子,使用前向和反向引物將1100bp的擴增產物亞克隆并測序。7個亞克隆被測序,但是,沒有一個與CPY密碼子同源。
使用與上述相同的條件,完成使用各種引物組合3-1,3-2,4-1,4-2,2-1和2-2的PCR。在瓊脂糖凝膠上電泳小樣,在兩個反應中,一個使用引物4-1和2-1,另一個使用引物4-2和2-1,約600bp的擴增產物占大部分。根據與其它羧肽酶的同源性而預測的該擴增產物的大少為600bp。將600bp的擴增產物亞克隆,用前向和反向引物確定11個亞克隆的DNA序列。11個克隆中的9個以與啤酒酵母有69%的一致性為基礎,為黑曲霉CPY的密碼子。。所有9個均彼此相同,說明在黑曲霉中只有一個羧肽酶基因。將含有600bp黑曲霉CPY PCR產物的亞克隆稱為pDSY17。
用pDSY17的插入子探測黑曲霉Bo-1基因組DNA的Southerm印跡。用Gibco-BRL的缺口-翻譯試劑盒放射性標記探針。所用的雜交條件為于60℃,在1.5×SSPE,1%SDS和0.5%脫脂牛奶和200μg/ml鮭精DNA。于65℃用0.2×SSC,1%SDS和0.1%焦磷酸鈉將印跡洗滌兩次,每次15分鐘。在BamHI,HindIII和SalI的消化產物中,約10,5.5和7kb的單帶分別與CPY探針雜交。
為了分離CPY的全長基因,用PCR-產生的CPY基因片段(用Gibco-BRL的缺口-翻譯試劑盒標記的),探測含有約26,000個重組體的黑曲霉Bo-1的EMBL4中的基因組庫。將約28,000個噬菌斑放在濾器上并檢測。從這些平皿中撿出11個陽性的。純化后,9個一級克隆仍與CPY探針雜交。從9個克隆中分離DNA,進行限制酶消化以對其進行表征。從限制圖譜看,9個中有7個是相同的。其他兩個克隆是特有的。從克隆的Southern產物,確定9個中的8個含有與CPY探針雜交的約5.5kb的相同HindIII片段。不含有相同HindIII片段的克隆含有較大(>12kb)的與CPY探針雜交的HindIII片段。亞克隆共有的HindIII片段以進行DNA測序。基因組DNA序列和推測的氨基酸序列示于圖1。
再篩選黑曲霉SFAG-2的λZAPII(Stratagene)中的cDNA庫。將42,000個噬菌斑放到濾器上,然后用上述的CPY探針檢測,在嚴格的上述條件下,112個這樣的噬菌斑進行了雜交。撿出開始的20個,然后進行再篩選,純化后,18個仍與CPY探針雜交。從4個陽性克隆中,用配有λZAP試劑盒的體內切割方法分離DNA。用EcoRI消化獲救的質粒,然后在瓊脂糖凝膠上電泳以確定插入片段的大小。兩個克隆(2-1和3-2)似乎有足夠大的插入片段,可含有全長CPY的cDNA,而且各含有約1700和250bp的兩個EcoRI片段。預計的全長cDNA的大小約為1600bp。另兩個cDNA克隆(2-2和2-4)含有較小的插入片段,但是,它們均含有250bp的EcoRI片段。確定了克隆3-2和2-2的部分DNA序列,3-2含有全長cDNA,而克隆2-2在5’末端被截斷約200bp。
確定了兩個鏈的完整cDNA序列(圖2)。認為cDNA編碼557個氨基酸長的CPY前體。到目前為止,cDNA和基因組克隆之間的大多數核苷酸差異均處于擺動范圍內,這點不令人驚奇,因為它們是來自兩個不同的黑曲霉菌株。以啤酒酵母的CPY排列為基礎,黑曲霉CPY看起來含有信號肽和前肽,成熟CPY蛋白質為419或420個氨基酸長。黑曲霉CPY與啤酒酵母和C.albicans的CPY(Mukhtar et al.,Gene 121173-177,1992)分別有約65%和66%的一致性。II制備CPY缺陷型突變體為了產生缺失了CPY的黑曲霉菌株,制備其中米曲霉pyrG基因插入到CPY編碼區中的構建體(圖3)。將含有幾乎完整CPY基因和約6kb基因下游的約6.5kb HindIII片段亞克隆到pKS+(Stratagene)衍生物中,其中破壞了PstI位點。用PstI消化所得的重組體,以便從CPY編碼區缺失815 bp的片段,加入T4 DNA聚合酶和所有4種dNTP而補平因PstI消化而產生的懸末端。將所得的平整末端載體與通過用Hind III消化,然后用Klenow片段填平而得到的約3.8kb平整末端的片段相連。用Hind III消化其中含有pyrG插入片段的最終構建體,以得到用于轉化黑曲霉pyrG菌株的線性片段,在基本培養基上生長進行篩選。用Southern印跡篩選轉化體以確定那些菌株含有破壞的CPY基因。用Western印跡分析轉化體以尋找在細胞內丟失的CPY。一旦鑒定了一個菌株含有破壞了的CPY,就可以確定對異源蛋白質的影響。生物材料的保藏已于1994年9月13日將下列生物材料保藏在AgriculturalResearch Service Culture Collection(NRRL)1815 North UniversityStreet,Peoria,Illinois 61604。細胞系 保藏號含有pDSY23的 NRRL B-21326E.coli(EMCC#0120)
序列表(1)一般資料(i)申請人(A)名稱Novo Nordisk Biotech,Inc.
(B)街道1445 Drew Avenue(C)城市Davis(D)州California(E)國家US(F)郵編95616-4880(G)電話(916)757-8100(H)電傳(916)758-0317(ii)發明題目編碼黑曲霉羧肽酶的基因(iii)序列數目4(iv)相關地址(A)收件人Novo Nordisk of North America,Inc.
(B)街道405 Lexington Avenue,Suite 6400(C)城市New York(D)州New York(E)國家U.S.A.
(F)郵編10174-6401(v)計算機可讀形式(A)介質類型軟盤
(B)計算機IBM PC(C)操作系統PC-DOS/MS-DOS(D)軟件PatentIn Release #1.0,Version #1.25(EPO)(vi)目前的申請資料(A)申請號US(B)申請日19-9月-1995(C)分類號(vii)在先申請資料(A)申請號US 08/309,341(B)申請日20-9月-1994(viii)代理人/代理資料(A)姓名Lowney,Karen A.
(B)登記號31,274(C)文件號4247.204-WO(ix)通訊資料(A)電話212 867 0123(B)電傳212 867 0298(2)SEQ ID NO1的資料(i)序列特征(A)長度2068個堿基對(B)類型核酸(C)鏈型雙鏈
(D)拓撲結構線性(ii)分子類型基因組DNA(vi)來源(A)生物黑曲霉(ix)特征(A)名稱/關鍵詞內含子(B)位置572...632(ix)特征(A)名稱/關鍵詞CDS(B)位置連接(571..633)(xi)序列描述SEQ ID NO1TCCTCTGCCT ACTCATCCCA TCACCATCTC AATTCATACC GCCCCCGTGG GGTTTCAGCA60CCA ATG AGA GTC CTT CCA GCT GCT ATG CTG GTT GGA GCG GCC ACG GCG 108Met Arg Val Leu Pro Ala Ala Met Leu Val Gly Ala Ala Thr Ala1 5 10 15GCC GTT CCT CCC TTC CAG CAG GTC CTT GGA GGT AAC GGT GCC AAG CAC 156Ala Val Pro Pro Phe Gln Gln Val Leu Gly Gly Asn Gly Ala Lys His20 25 30GGT GCC GAC CAT GCG GCC GAG GTC CCT GCG GAT CAC AGT GCC GAC GGG 204Gly Ala Asp His Ala Ala Glu Val Pro Ala Asp His Ser Ala Asp Gly35 40 45TTC TCC AAG CCG CTG CAC GCA TTC CAG GAG GAG CTG AAG TCT CTC TCT 252Phe Ser Lys Pro Leu His Ala Phe Gln Glu Glu Leu Lys Ser Leu Ser50 55 60GAC GAG GCT CGT AAG CTT TGG GAT GAG GTG GCC AGC TTC TTC CCG GAG 300Asp Glu Ala Arg Lys Leu Trp Asp Glu Val Ala Ser Phe Phe Pro Glu65 70 75AGC ATG GAT CAG AAC CCT CTC TTT TCC CTC CCC AAG AAG CAC AAC CGC 348Ser Met Asp Gln Asn Pro Leu Phe Ser Leu Pro Lys Lys His Asn Arg80 85 90 95CGT CCC GAC TCG CAC TGG GAC CAC ATC GTC CGC GGC TCC GAC GTT CAG 396Arg Pro Asp Ser His Trp Asp His Ile Val Arg Gly Ser Asp Val Gln100 105 110AGC GTC TGG GTC ACT GGT GAG AAC GGT GAG AAG GAG CGC GAG GTC GAT 444Ser Val Trp Val Thr Gly Glu Asn Gly Glu Lys Glu Arg Glu Val Asp115 120 125GGC AAG CTG GAA GCC TAT GAT CTC AGG GTC AAG AAG ACC GAT CCT GGC 492Gly Lys Leu Glu Ala Tyr Asp Leu Arg Val Lys Lys Thr Asp Pro Gly130 135 140TCT CTT GGC ATC GAC CCC GGC GTG AAG CAG TAC ACC GGT TAT CTC GAT 540Ser Leu Gly Ile Asp Pro Gly Val Lys Gln Tyr Thr Gly Tyr Leu Asp145 150 155GAC AAC GAG AAT GAT AAG CAT TTG TTC TAC GTAAGCACAC CTTGGTTCAA 590Asp Asn Glu Asn Asp Lys His Leu Phe Tyr160 165GATCACGCTT TTTATATGCT CTGGATATCT AACGCAACTT AG TGG TTC TTC GAG 644Trp Phe Phe Glu170TCT CGC AAT GAC CCC GAG AAT GAT CCC GTT GTT CTG TGG CTG AAC GGT 692Ser Arg Asn Asp Pro Glu Asn Asp Pro Val Val Leu Trp Leu Asn Gly175 180 185GGC CCT GGG TGC TCT TCC CTC ACC GGT CTC TTC ATG GAG CTT GGC CCT 740Gly Pro Gly Cys Ser Ser Leu Thr Gly Leu Phe Met Glu Leu Gly Pro190 195 200 205AGC AGC ATC AAC AAG AAG ATC CAG CCG GTC TAC AAT GAC TAC GCT TGG 788Ser Ser Ile Asn Lys Lys Ile Gln Pro Val Tyr Asn Asp Tyr Ala Trp210 215 220AAC TCC AAC GCG TCC GTG ATC TTC CTT GAC CAG CCT GTC AAT GTC GGT 836Asn Ser Asn Ala Ser Val Ile Phe Leu Asp Gln Pro Val Asn Val Gly225 230 235TAC TCC TAC AGT AAC TCT GCT GTC AGC GAC ACG GTC GCT GCT GGC AAG 884Tyr Ser Tyr Ser Asn Ser Ala Val Ser Asp Thr Val Ala Ala Gly Lys240 245 250GAC GTC TAT GCC TTG CTT ACC CTC TTC TTC AAA CAA TTC CCC GAG TAT 932Asp Val Tyr Ala Leu Leu Thr Leu Phe Phe Lys Gln Phe Pro Glu Tyr255 260 265GCT AAG CAG GAC TTC CAC ATT GCC GGT GAA TCT TAT GCT GGT CAC TAT 980Ala Lys Gln Asp Phe His Ile Ala Gly Glu Ser Tyr Ala Gly His Tyr270 275 280 285ATC CCC GTC TTC GCT TCG GAG ATC CTG TCT CAC AAG AAG CGC AAC ATC1028Ile Pro Val Phe Ala Ser Glu Ile Leu Ser His Lys Lys Arg Asn Ile290 295 300AAC CTG CAG TCC GTT CTC ATT GGC AAC GGT CTC ACC GAC GGA TAC ACC1076Asn Leu Gln Ser Val Leu Ile Gly Asn Gly Leu Thr Asp Gly Tyr Thr305 310 315CAG TAC GAG TAC TAC CGT CCC ATG GCC TGC GGT GAC GGC GGT TAC CCA1124Gln Tyr Glu Tyr Tyr Arg Pro Met Ala Cys Gly Asp Gly Gly Tyr Pro320 325 330GCT GTC TTG GAC GAG AGC TCC TGC CAG TCC ATG GAC AAC GCT CTT CCT1172Ala Val Leu Asp Glu Ser Ser Cys Gln Ser Met Asp Asn Ala Leu Pro335 340 345CGC TGC CAG TCT ATG ATT GAG TCT TGC TAC AGT TCC GAG AGC GCT TGG1220Arg Cys Gln Ser Met Ile Glu Ser Cys Tyr Ser Ser Glu Ser Ala Trp350 355 360 365GTT TGT GTC CCG GCC TCC ATC TAC TGT AAC AAC GCC CTC CTT GCC CCT1268Val Cys Val Pro Ala Ser Ile Tyr Cys Asn Asn Ala Leu Leu Ala Pro370 375 380TAC CAG CGC ACT GGG CAG AAC GTC TAT GAT GTC CGT GGT AAG TGC GAG1316Tyr Gln Arg Thr Gly Gln Asn Val Tyr Asp Val Arg Gly Lys Cys Glu385 390 395GAT AGC TCT AAC CTT TGC TAC TCG GCT ATG GGC TAC GTC AGC GAC TAC1364Asp Ser Ser Asn Leu Cys Tyr Ser Ala Met Gly Tyr Val Ser Asp Tyr400 405 410CTG AAC AAG CCC GAA GTC ATC GAG GCT GTT GGC GCT GAG GTC AAC GGC1412Leu Asn Lys Pro Glu Val Ile Glu Ala Val Gly Ala Glu Val Asn Gly415 420 425TAC GAC TCG TGC AAC TTT GAC ATC AAC CGC AAC TTC CTC TTC CAC GGT1460Tyr Asp Ser Cys Asn Phe Asp Ile Asn Arg Asn Phe Leu Phe His Gly430 435 440 445GAC TGG ATG AAG CCC TAC CAC CGC CTC GTT CCG GGA CTC CTG GAG CAG1508Asp Trp Met Lys Pro Tyr His Arg Leu Val Pro Gly Leu Leu Glu Gln450 455 460ATC CCT GTC TTG ATC TAT GCC GGT GAT GCT GAT TTC ATT TGC AAC TGG1556Ile Pro Val Leu Ile Tyr Ala Gly Asp Ala Asp Phe Ile Cys Asn Trp465 470 475CTG GGC AAC AAG GCC TGG ACT GAA GCC CTG GAG TGG CCC GGA CAG GCT1604Leu Gly Asn Lys Ala Trp Thr Glu Ala Leu Glu Trp Pro Gly Gln Ala480 485 490GAA TAT GCC TCC GCT GAG CTG GAG GAT CTG GTC ATT GTC GAC AAT GAG1652Glu Tyr Ala Ser Ala Glu Leu Glu Asp Leu Val Ile Val Asp Asn Glu495 500 505CAC ACG GGC AAG AAG ATT GGC CAG GTT AAG TCC CAT GGC AAC TTC ACC1700His Thr Gly Lys Lys Ile Gly Gln Val Lys Ser His Gly Asn Phe Thr510 515 520 525TTC ATG CGT CTC TAT GGT GGT GGC CAC ATG GTC CCG ATG GAC CAG CCC1748Phe Met Arg Leu Tyr Gly Gly Gly His Met Val Pro Met Asp Gln Pro530 535 540GAG TCG AGT CTC GAG TTC TTC AAC CGC TGG TTG GGA GGT GAA TGG TTC1796Glu Ser Ser Leu Glu Phe Phe Asn Arg Trp Leu Gly Gly Glu Trp Phe545 550 555TAA AGACGTGCTA CCACCGCATA TAGACTTTCT GGTCATTTCG GTGACACTGC 1849AGATATGTTT CTTAACGATA GTTTGAGCAT GCTTGTCAAT GCCCACTAGT CCCGATCCTT 1909ATATGTTGCA TGGTATCTAT GAGTTTTGTC ACTATAGTGC ATTATACATG TGTACTTCGT 1969ATGAGAATGA ATCGATCGCA TTTACACGCA TATAAATAGT ACCCACCTCC GCCTGGACAT 2029GAATTAGGCC CGGCCAGTCG TTTACATACA GTGCTAGAA 2068(2)SEQ ID NO2的資料(i)序列特征(A)長度557個氨基酸(B)類型氨基酸(C)鏈型單鏈
(D)拓撲結構線性(ii)分子類型蛋白質(vi)來源(A)生物黑曲霉(xi)序列描述SEQ ID NO2Met Arg Val Leu Pro Ala Ala Met Leu Val Gly Ala Ala Thr Ala Ala1 5 10 15Val Pro Pro Phe Gln Gln Val Leu Gly Gly Asn Gly Ala Lys His Gly20 25 30Ala Asp His Ala Ala Glu Val Pro Ala Asp His Ser Ala Asp Gly Phe35 40 45Ser Lys Pro Leu His Ala Phe Gln Glu Glu Leu Lys Ser Leu Ser Asp50 55 60Glu Ala Arg Lys Leu Trp Asp Glu Val Ala Ser Phe Phe Pro Glu Ser65 70 75 80Met Asp Gln Asn Pro Leu Phe Ser Leu Pro Lys Lys His Asn Arg Arg85 90 95Pro Asp Ser His Trp Asp His Ile Val Arg Gly Ser Asp Val Gln Ser100 105 110Val Trp Val Thr Gly Glu Asn Gly Glu Lys Glu Arg Glu Val Asp Gly115 120 125Lys Leu Glu Ala Tyr Asp Leu Arg Val Lys Lys Thr Asp Pro Gly Ser130 135 140Leu Gly Ile Asp Pro Gly Val Lys Gln Tyr Thr Gly Tyr Leu Asp Asp145 150 155 160Asn Glu Asn Asp Lys His Leu Phe Tyr Trp Phe Phe Glu Ser Arg Asn165 170 175Asp Pro Glu Asn Asp Pro Val Val Leu Trp Leu Asn Gly Gly Pro Gly180 185 190Cys Ser Ser Leu Thr Gly Leu Phe Met Glu Leu Gly Pro Ser Ser Ile195 200 205Asn Lys Lys Ile Gln Pro Val Tyr Asn Asp Tyr Ala Trp Asn Ser Asn210 215 220Ala Ser Val Ile Phe Leu Asp Gln Pro Val Asn Val Gly Tyr Ser Tyr225 230 235 240Ser Asn Ser Ala Val Ser Asp Thr Val Ala Ala Gly Lys Asp Val Tyr245 250 255Ala Leu Leu Thr Leu Phe Phe Lys Gln Phe Pro Glu Tyr Ala Lys Gln260 265 270Asp Phe His Ile Ala Gly Glu Ser Tyr Ala Gly His Tyr Ile Pro Val275 280 285Phe Ala Ser Glu Ile Leu Ser His Lys Lys Arg Asn Ile Asn Leu Gln290 295 300Ser Val Leu Ile Gly Asn Gly Leu Thr Asp Gly Tyr Thr Gln Tyr Glu305 310 315 320Tyr Tyr Arg Pro Met Ala Cys Gly Asp Gly Gly Tyr Pro Ala Val Leu325 330 335Asp Glu Ser Ser Cys Gln Ser Met Asp Asn Ala Leu Pro Arg Cys Gln340 345 350Ser Met Ile Glu Ser Cys Tyr Ser Ser Glu Ser Ala Trp Val Cys Val355 360 365Pro Ala Ser Ile Tyr Cys Asn Asn Ala Leu Leu Ala Pro Tyr Gln Arg370 375 380Thr Gly Gln Asn Val Tyr Asp Val Arg Gly Lys Cys Glu Asp Ser Ser385 390 395 400Asn Leu Cys Tyr Ser Ala Met Gly Tyr Val Ser Asp Tyr Leu Asn Lys405 410 415Pro Glu Val Ile Glu Ala Val Gly Ala Glu Val Asn Gly Tyr Asp Ser420 425 430Cys Asn Phe Asp Ile Asn Arg Asn Phe Leu Phe His Gly Asp Trp Met435 440 445Lys Pro Tyr His Arg Leu Val Pro Gly Leu Leu Glu Gln Ile Pro Val450 455 460Leu Ile Tyr Ala Gly Asp Ala Asp Phe Ile Cys Asn Trp Leu Gly Asn465 470 475 480Lys Ala Trp Thr Glu Ala Leu Glu Trp Pro Gly Gln Ala Glu Tyr Ala485 490 495Ser Ala Glu Leu Glu Asp Leu Val Ile Val Asp Asn Glu His Thr Gly500 505 510Lys Lys Ile Gly Gln Val Lys Ser His Gly Asn Phe Thr Phe Met Arg515 520 525Leu Tyr Gly Gly Gly His Met Val Pro Met Asp Gln Pro Glu Ser Ser530 535 540Leu Glu Phe Phe Asn Arg Trp Leu Gly Gly Glu Trp Phe545 550 555(2)SEQ ID NO3的資料(i)序列特征(A)長度2002個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線性
(ii)分子類型cDNA(vi)來源(A)生物黑曲霉(ix)特征(A)名稱/關鍵詞內含子(B)位置349...411(ix)特征(A)名稱/關鍵詞CDS(B)位置連接(348..412)(xi)序列描述SEQ ID NO3GCGGCCGCTG CTACTTGCTT TTTCTAATTT GATACTTTTG TGTCCGTACC GTACCTTCCA 60GACCGCAAGG TACCCATCCT CTACCTACTC ATCCCATCAT CATCTCGATT TCATACCAAC 120CCCGTTGGGT TTCAACACA ATG AGA GTT CTT CCA GCT GCT ATG CTG GTT GGA 172Met Arg Val Leu Pro Ala Ala Met Leu Val Gly1 5 10GCG GGC ACT GCG GCC GTC CCT CCC TTC CAG CAG GTC CTT GGA GGT AAC 220Ala Gly Thr Ala Ala Val Pro Pro Phe Gln Gln Val Leu Gly Gly Asn15 20 25GGT GCC AAG CAC GGT GCC GAC CAT GCG GCC GAG GTC CCT GCG GAT CAC 268Gly Ala Lys His Gly Ala Asp His Ala Ala Glu Val Pro Ala Asp His30 35 40AGT GCC GAC GGG TTC TCC AAG CCG CTG CAC GCA TTC CAG GAG GAG CTG 316Ser Ala Asp Gly Phe Ser Lys Pro Leu His Ala Phe Gln Glu Glu Leu45 50 55AAG TCT CTC TCT GAT GAG GCT CGT AAG CTC TGG GAT GAG GTT GCT AGC 364Lys Ser Leu Ser Asp Glu Ala Arg Lys Leu Trp Asp Glu Val Ala Ser60 65 70 75TTC TTC CCG GAG AGC ATG GAT CAG AAC CCT CTC TTC TCC CTC CCC AAG 412Phe Phe Pro Glu Ser Met Asp Gln Asn Pro Leu Phe Ser Leu Pro Lys80 85 90AAG CAC AAC CGC CGC CCC GAC CAC CAC TGG GAC CAC ATC GTC CGC GGC 460Lys His Asn Arg Arg Pro Asp His His Trp Asp His Ile Val Arg Gly95 100 105TCC GAC GTT CAG AGC GTC TGG GTT ACT GGT GAG AAC GGT GAG AAG GAG 508Ser Asp Val Gln Ser Val Trp Val Thr Gly Glu Asn Gly Glu Lys Glu110 115 120CGT GAG GTC GAT GGC AAG CTG GAA GCC TAT GAT CTC AGG GTC AAG AAG556Arg Glu Val Asp Gly Lys Leu Glu Ala Tyr Asp Leu Arg Val Lys Lys125 130 135ACC GAT CCT AGC TCT CTT GGC ATC GAC CCT GGC GTA AAG CAG TAC ACC604Thr Asp Pro Ser Ser Leu Gly Ile Asp Pro Gly Val Lys Gln Tyr Thr140 145 150 155GGT TAT CTC GAT GAC AAC GAG AAC GAC AAG CAT CTG TTC TAC TGG TTC652Gly Tyr Leu Asp Asp Asn Glu Asn Asp Lys His Leu Phe Tyr Trp Phe160 165 170TTC GAG TCT CGC AAT GAC CCC GAG AAT GAC CCT GTT GTT CTG TGG CTG700Phe Glu Ser Arg Asn Asp Pro Glu Asn Asp Pro Val Val Leu Trp Leu175 180 185AAC GGT GGC CCT GGA TGC TCT TCC CTC ACC GGT CTT TTC ATG GAG CTC748Asn Gly Gly Pro Gly Cys Ser Ser Leu Thr Gly Leu Phe Met Glu Leu190 195 200GGC CCT AGC AGC ATC AAC AAG AAG ATC CAG CCG GTC TAC AAC GAC TAC796Gly Pro Ser Ser Ile Asn Lys Lys Ile Gln Pro Val Tyr Asn Asp Tyr205 210 215GCT TGG AAC TCC AAC GCG TCC GTG ATC TTC CTT GAC CAG CCT GTC AAC844Ala Trp Asn Ser Asn Ala Ser Val Ile Phe Leu Asp Gln Pro Val Asn220 225 230 235GTC GGT TAC TCT TAC AGC AAC TCT GCT GTC AGC GAC ACC GTT GCT GCT892Val Gly Tyr Ser Tyr Ser Asn Ser Ala Val Ser Asp Thr Val Ala Ala240 245250GGC AAG GAC GTC TAT GCC TTG CTT ACC CTC TTC TTC AAA CAA TTC CCC940Gly Lys Asp Val Tyr Ala Leu Leu Thr Leu Phe Phe Lys Gln Phe Pro255 260 265GAG TAT GCC AAG CAG GAC TTC CAC ATT GCC GGT GAA TCC TAT GCT GGT988Glu Tyr Ala Lys Gln Asp Phe His Ile Ala Gly Glu Ser Tyr Ala Gly270 275 280CAC TAT ATC CCC GTC TTT GCT TCG GAG ATT TTG TCT CAC AAG AAG CGC 1036His Tyr Ile Pro Val Phe Ala Ser Glu Ile Leu Ser His Lys Lys Arg285 290 295AAC ATC AAC CTG CAG TCC GTT CTT ATT GGC AAC GGT CTC ACC GAC GGT 1084Asn Ile Asn Leu Gln Ser Val Leu Ile Gly Asn Gly Leu Thr Asp Gly300 305 310 315CTC ACT CAG TAC GAG TAC TAC CGT CCC ATG GCC TGT GGT GAC GGT GGT 1132Leu Thr Gln Tyr Glu Tyr Tyr Arg Pro Met Ala Cys Gly Asp Gly Gly320 325 330TAC CCA GCT GTC TTG GAC GAG GGC TCC TGC CAG GCC ATG GAC AAC GCC 1180Tyr Pro Ala Val Leu Asp Glu Gly Ser Cys Gln Ala Met Asp Asn Ala335 340 345CTT CCT CGC TGC CAG TCT ATG ATT GAG TCT TGC TAT AGT TCC GAG AGC 1228Leu Pro Arg Cys Gln Ser Met Ile Glu Ser Cys Tyr Ser Ser Glu Ser350 355 360GCT TGG GTT TGT GTC CCG GCC TCC ATC TAC TGT AAC AAC GCC CTC CTT 1276Ala Trp Val Cys Val Pro Ala Ser Ile Tyr Cys Asn Asn Ala Leu Leu365 370 375GCC CCT TAC CAG CGC ACC GGA CAG AAC GTC TAC GAT GTT CGT GGT AAG 1324Ala Pro Tyr Gln Arg Thr Gly Gln Asn Val Tyr Asp Val Arg Gly Lys380 385 390 395TGC GAG GAT AGC TCC AAC CTC TGC TAC TCG GCC ATG GGC TAC GTC AGC 1372Cys Glu Asp Ser Ser Asn Leu Cys Tyr Ser Ala Met Gly Tyr Val Ser400 405 410GAC TAC CTG AAC AAG ACC GAG GTC ATT GAG GCT GTT GGC GCT GAG GTC 1420Asp Tyr Leu Asn Lys Thr Glu Val Ile Glu Ala Val Gly Ala Glu Val415 420 425AAC GGC TAC GAC TCG TGC AAC TTT GAC ATC AAC CGC AAC TTC CTC TTC 1468Asn Gly Tyr Asp Ser Cys Asn Phe Asp Ile Asn Arg Asn Phe Leu Phe430 435 440CAC GGT GAC TGG ATG AAG CCC TAC CAC CGT CTC GTT CCG GGA CTC CTG 1516His Gly Asp Trp Met Lys Pro Tyr His Arg Leu Val Pro Gly Leu Leu445 450 455GAG CAG ATC CCT GTC CTG ATC TAC GCT GGT GAC GCC GAT TTC ATC TGC 1564Glu Gln Ile Pro Val Leu Ile Tyr Ala Gly Asp Ala Asp Phe Ile Cys460 465 470 475AAC TGG CTG GGC AAC AAG GCC TGG ACT GAA GCC CTT GAG TGG CCC GGA 1612Asn Trp Leu Gly Asn Lys Ala Trp Thr Glu Ala Leu Glu Trp Pro Gly480 485 490CAG GCT GAA TAT GCC TCC GCT AAG CTG GAG GAC CTG GTC GTG GTC GAG 1660Gln Ala Glu Tyr Ala Ser Ala Lys Leu Glu Asp Leu Val Val Val Glu495 500 505AAT GAG CAC AAG GGC AAG AAG ATC GGC CAG GTC AAG TCC CAT GGC AAC 1708Asn Glu His Lys Gly Lys Lys Ile Gly Gln Val Lys Ser His Gly Asn510 515 520TTC ACC TTC ATG CGT CTC TAT GGC GGT GGC CAC ATG GTC CCG ATG GAC 1756Phe Thr Phe Met Arg Leu Tyr Gly Gly Gly His Met Val Pro Met Asp525 530 535CAA CCC GAG TCG AGT CTT GAA TTC TTC AAC CGC TGG TTG GGA GGT GAA 1804Gln Pro Glu Ser Ser Leu Glu Phe Phe Asn Arg Trp Leu Gly Gly Glu540 545 550 555TGG TTT TAA AGACGTGCTA TCACCGCATA TAGACTTTCC GGTCATTTCG GTGACACTGC1863Trp PheAGATATGTTT CTTAACGATA GTTTGAGGAT GCTTGTCAAT GCCCACTAAT CCCGAGCCTT 1923ATGTTACATG GTATCTATGA GTTTGTCATT ATAGTGCATT ATGCATTTGT ACTCCGTACG 1983AGAATGAATC AGCGGCCGC 2002(2)SEQ ID NO4的資料(i)序列特征(A)長度557個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型蛋白質
(vi)來源(A)生物黑曲霉(xi)序列描述SEQ ID NO4Met Arg Val Leu Pro Ala Ala Met Leu Val Gly Ala Gly Thr Ala Ala1 5 10 15Val Pro Pro Phe Gln Gln Val Leu Gly Gly Asn Gly Ala Lys His Gly20 25 30Ala Asp His Ala Ala Glu Val Pro Ala Asp His Ser Ala Asp Gly Phe35 40 45Ser Lys Pro Leu His Ala Phe Gln Glu Glu Leu Lys Ser Leu Ser Asp50 55 60Glu Ala Arg Lys Leu Trp Asp Glu Val Ala Ser Phe Phe Pro Glu Ser65 70 75 80Met Asp Gln Asn Pro Leu Phe Ser Leu Pro Lys Lys His Asn Arg Arg85 90 95Pro Asp His His Trp Asp His Ile Val Arg Gly Ser Asp Val Gln Ser100 105 110Val Trp Val Thr Gly Glu Asn Gly Glu Lys Glu Arg Glu Val Asp Gly115 120 125Lys Leu Glu Ala Tyr Asp Leu Arg Val Lys Lys Thr Asp Pro Ser Ser130 135 140Leu Gly Ile Asp Pro Gly Val Lys Gln Tyr Thr Gly Tyr Leu Asp Asp145 150 155 160Asn Glu Asn Asp Lys His Leu Phe Tyr Trp Phe Phe Glu Ser Arg Asn165 170 175Asp Pro Glu Asn Asp Pro Val Val Leu Trp Leu Asn Gly Gly Pro Gly180 185 190Cys Ser Ser Leu Thr Gly Leu Phe Met Glu Leu Gly Pro Ser Ser Ile195 200 205Asn Lys Lys Ile Gln Pro Val Tyr Asn Asp Tyr Ala Trp Asn Ser Asn210 215 220Ala Ser Val Ile Phe Leu Asp Gln Pro Val Asn Val Gly Tyr Ser Tyr225 230 235 240Ser Asn Ser Ala Val Ser Asp Thr Val Ala Ala Gly Lys Asp Val Tyr245 250 255Ala Leu Leu Thr Leu Phe Phe Lys Gln Phe Pro Glu Tyr Ala Lys Gln260 265 270Asp Phe His Ile Ala Gly Glu Ser Tyr Ala Gly His Tyr Ile Pro Val275 280 285Phe Ala Ser Glu Ile Leu Ser His Lys Lys Arg Asn Ile Asn Leu Gln290 295 300Ser Val Leu Ile Gly Asn Gly Leu Thr Asp Gly Leu Thr Gln Tyr Glu305 310 315 320Tyr Tyr Arg Pro Met Ala Cys Gly Asp Gly Gly Tyr Pro Ala Val Leu325330 335Asp Glu G1y Ser Cys Gln Ala Met Asp Asn Ala Leu Pro Arg Cys Gln340 345 350Ser Met Ile Glu Ser Cys Tyr Ser Ser Glu Ser Ala Trp Val Cys Val355 360 365Pro Ala Ser Ile Tyr Cys Asn Asn Ala Leu Leu Ala Pro Tyr Gln Arg370 375 380Thr Gly Gln Asn Val Tyr Asp Val Arg Gly Lys Cys Glu Asp Ser Ser385 390 395 400Asn Leu Cys Tyr Ser Ala Met Gly Tyr Val Ser Asp Tyr Leu Asn Lys405 410 415Thr Glu Val Ile Glu Ala Val Gly Ala Glu Val Asn Gly Tyr Asp Ser420 425 430Cys Asn Phe Asp Ile Asn Arg Asn Phe Leu Phe His Gly Asp Trp Met435 440 445Lys Pro Tyr His Arg Leu Val Pro Gly Leu Leu Glu Gln Ile Pro Val450 455 460Leu Ile Tyr Ala Gly Asp Ala Asp Phe Ile Cys Asn Trp Leu Gly Asn465 470 475 480Lys Ala Trp Thr Glu Ala Leu Glu Trp Pro Gly Gln Ala Glu Tyr Ala485 490 495Ser Ala Lys Leu Glu Asp Leu Val Val Val Glu Asn Glu His Lys Gly500 505 510Lys Lys Ile Gly Gln Val Lys Ser His Gly Asn Phe Thr Phe Met Arg515 520 525Leu Tyr Gly Gly Gly His Met Val Pro Met Asp Gln Pro Glu Ser Ser530 535 540Leu Glu Phe Phe Asn Arg Trp Leu Gly Gly Glu Trp Phe545 550 55權利要求
1含有編碼絲狀子囊菌或半知菌羧肽酶Y的核酸序列的核酸構建體。
2權利要求1的構建體,其中子囊菌或半知菌選自漆酶,鐮孢屬,青霉菌,腐質霉屬,木霉屬,Scytalidium,毀絲霉屬或草根霉屬。
3權利要求1的構建體,其中所述羧肽酶Y是黑曲霉羧肽酶。
4權利要求1的構建體,其中所述核酸序列是圖1中描述的核酸序列,或編碼與圖1所述的氨基酸序列有至少70%一致性的蛋白質的同系物。
5權利要求1的構建體,其中所述核酸序列是圖2中描述的核酸序列,或編碼與圖2所述的氨基酸序列有至少70%一致性的蛋白質的同系物。
6權利要求1的構建體,其中將選擇性標記插入羧肽酶序列中。
7權利要求6的構建體,其中選擇性標記是amdS,pyrG,argB,niaD,sC,或hygB。
8突變絲狀子囊菌細胞,它在相同條件下生產比野生型細胞少至少25%的羧肽酶。
9權利要求8的細胞,它生產比野生型細胞少至少50%的羧肽酶。
10權利要求8的細胞,它生產比野生型細胞少至少70%的羧肽酶。
11權利要求8的細胞,它選自曲霉屬,鐮孢屬,青霉菌屬,腐質霉屬,木霉屬,Scytalidium,毀絲霉屬或草根霉屬。
12權利要求8的細胞,它是黑曲霉。
13突變子囊菌或半知菌細胞,它生產比野生型細胞少至少25%的羧肽酶,所述細胞含有編碼異源蛋白質的核酸序列。
14含有編碼絲狀子囊菌或半知菌羧肽酶的核酸序列,且該序列中插入了選擇性標記基因的核酸構建體的突變絲狀子囊菌或半知菌細胞。
14一種突變絲狀子囊菌或半知菌細胞,它含有一核酸構建物,該構建物含有編碼非功能性絲狀子囊菌或半知菌羧肽酶的核酸序列。
15產生非羧肽酶的絲狀子囊菌或半知菌細胞的生產方法,包括破壞或缺失羧肽酶基因,由此得到基本上不產生羧肽酶的細胞。
16重組生產所需蛋白質的方法,包括在表達所述蛋白質的條件下,培養在相同條件下生產比相應野生型細胞少至少25%羧肽酶且含有編碼所述蛋白質的核酸序列的的突變絲狀子囊菌或半知菌細胞,并從培養液物中回收所需蛋白質。
全文摘要
本發明涉及編碼子囊菌或半知菌羧肽酶Y基因的基因,以及經過修飾而產生減少量的羧肽酶的宿主細胞。
文檔編號C12N9/48GK1137293SQ95191058
公開日1996年12月4日 申請日期1995年9月19日 優先權日1994年9月20日
發明者D·S·亞夫爾, S·A·索姆普森 申請人:諾沃諾爾迪斯克生物技術有限公司