專利名稱:適于改變油質酵母中多不飽和脂肪酸水平的△12去飽和酶的制作方法
技術領域:
本發明是生物技術領域。更具體地,本發明設計鑒定編碼Δ12脂肪酸去飽和酶的核酸片段,所述酶可用于破壞或者增強油質微生物,如油質酵母中多不飽和脂肪酸的產生。
背景技術:
很久就認識到某些多不飽和脂肪酸,或者PUFA,是健康細胞的重要生物組分。例如,認識到此類PUFA為·“必需”脂肪酶,其不能在哺乳動物中從頭合成,必須在食物中獲得或者通過亞油酸(LA)或者α-亞麻酸(ALA)的進一步去飽和和延長得到;·細胞的質膜成分,其中他們可以以諸如磷脂或者甘油三酯的形式發現;·對于本身發育,尤其在正發育的嬰兒腦中,和對于組織形成和修復是必須的;和·在哺乳動物中重要的一些生物活性類花生酸的前體,包括前列環素、類花生酸、白三烯和前列腺素。
在20世紀70年代,Greenland Eskimos的觀察將心臟病的低發病率和長鏈ω-3 PUFAs的大量攝入聯系起來(Dyerberg,J.等人,Amer.J.Clin Nutr.28958-966(1975);Dyerberg,J.等人,Lancet 2(8081)117-119(July 15,1978))。更近的研究已經證實了ω-3 PUFAs的心血管保護作用(Shimokawa,H.,World Rev NutrDiet,88100-108(2001);von Schacky,C.,和Dyerberg,J.,World Rev Nutr Diet,8890-99(2001))。此外,已經發現一些病癥響應ω-3脂肪酸的治療,所述病癥為諸如血管成形術后再狹窄率、炎癥和類風濕性關節炎、哮喘、銀屑病和濕疹的癥狀。已經表明γ-亞麻酸(GLA,一種ω-6 PUFA)降低與壓力相關的血壓升高和改善算術測驗的表現。已經表明GLA和二同型-γ-亞麻酸(DGLA,另一種ω-6 PUFA)抑制血小板聚集、導致血管舒張、降低膽固醇水平和抑制血管壁平滑肌和纖維組織的增殖(Brenner等人,Adv.Exp.Med.Biol.8385-101(1976))。已經表明GLA或者DGLA單獨或者與二十碳五烯酸(EPA,一種ω-3 PUFA)聯合施用減少或者預防非甾體抗炎藥導致的胃腸道出血和其他副作用(U.S.4,666,701)。此外,已經表明GLA和DGLA預防或者治療子宮內膜異位和月經前期綜合征(U.S.4,758,592)和治療病毒感染后的肌痛性腦脊髓炎和慢性疲勞(U.S.5,116,871)。其他證據表明PUFAs可能涉及鈣代謝的調節,提示它們可用于治療或者預防骨質疏松和腎和尿道結石。最后,PUFAs可以用于治療癌癥和糖尿病(U.S.4,826,877;Horrobin等人,Am.J.Clin.Nutr.57(Suppl.)732S-737S(1993))。
PUFAs通常分成兩種主要類別(由ω-6和ω-3脂肪酸組成),所述類別通過必需脂肪酸LA和ALA的去飽和和延長得到。盡管存在來自天然途徑的多種通過商業途徑可以獲得的PUFAs[例如,月見草、琉璃苣和黑加侖的種子;絲狀真菌(被孢霉屬,Mortierella),Porphyridium(紅藻),魚油和海洋浮游生物(Cyclotella,Nitzschia,Crypthecodinium)],但是這些生產方法具有一些缺點。首先,天然來源如魚和植物傾向于具有高度異質的油組分。因此,從這些來源得到的油需要多方面純化以分離或者富集一種或多種所希望的PUFAs。天然來源在有效性方面也受到不可控制的波動性(例如,由于天然、痰病或者對于魚原料,由于過度捕撈);并且,產生PUFAs的作物通常與開發用于食物生產的雜交作物在經濟上沒有競爭性。天然產生PUFAs的一些生物(例如,Porphyridium,被孢霉屬)的大規模發酵也可能是昂貴和/或難以在商業規模上培養。
由于上述限制,已經進行了大量工作以1)開發容易經濟生產的PUFAs的重組來源;和2)修飾脂肪酸生物合成途徑以能夠產生所希望的PUFAs。例如,在過去幾年里已經在分離、克隆和操作來自多種生物的脂肪酸去飽和酶和延伸酶(elongase)基因中取得了進展。這些基因序列的知識提供了在不天然產生PUFAs的新的宿主生物中產生所希望的脂肪酸和/或脂肪酸組合物的前景。文獻報導了在釀酒酵母(Saccharomyces cerevisiae)中的許多實例,如Domergue,F.,等人(Eur.J.Biochem.2694105-4113(2002)),其中,將來自海洋硅藻(Phaeodactylum tricornutum)的兩種去飽和酶克隆到釀酒酵母中,導致產生EPA;Beaudoin F.,等人(Proc.Natl.Acad.Sci.U.S.A.97(12)6421-6(2000)),其中使用來自秀麗隱桿線蟲(Caenorhabditis elegans)的基因,在釀酒酵母中重構ω-3和ω-6PUFA生物合成途徑;Dyer,J.M.,等人(Appl.Eniv.Microbiol.,59224-230(2002)),其中在釀酒酵母中表達植物脂肪酸去飽和酶(FAD2和FAD3),和U.S.6,136,574(Knutzon等人,AbbottLaboratories),其中將來自Brassica napus的一種去飽和酶和來自真菌Mortierella alpina的兩種去飽和酶克隆到釀酒酵母中,導致產生LA、GLA、ALA和STA。然而,仍然需要適宜的微生物系統,在所述系統中可以表達這些類型的基因以提供一種或多種PUFAs的經濟量的商業生產。此外,需要富含特定PUFAs的油,特別是EPA和DHA。
以前未調查作為PUFAs的生產平臺的一類微生物是油質酵母。這些生物積累高達它們的干細胞重量的80%的油。生長具有高油含量的油質酵母的技術是成熟的(例如,見EP 0 005 277Bl;Ratledge,C.,Prog.Ind.Microbiol.16119-206(1982)),并且與商業微藻發酵生產ω-3-或ω-6 PUFAs相比可以提供成本優勢。完整酵母細胞還可以代表封裝富含ω-3或ω-6 PUFA的油用于功能性食物和動物飼料補充物的方便的方法。
盡管具有上述優點,但是多數油質酵母天然缺乏ω-3和ω-6PUFA,因為這些生物中天然產生的PUFAs通常局限于18:2脂肪酸(較不常見地;18:3脂肪酸)。從而,待解決的問題是開發積累富含ω-3和/或ω-6脂肪酸的油。為此,不僅必需引入允許在油質酵母中合成和積累ω-3和/或ω-6脂肪酸的所需要的去飽和酶和延伸酶,而且必需增加18:2底物(即,LA)的有效性。通常,該底物的有效性受到Δ12去飽和酶的活性的控制,Δ12去飽和酶催化油酸向LA的轉化。
在公共文獻中公開了多種已知的Δ12去飽和酶,它們的一些來自真菌來源(例如,高山被孢霉(Mortierella alpina)、Emericellanidulans、魯西毛霉(Mucor rouxii))。還未知這些去飽和酶可以有效改變油質酵母中的脂肪酸組成,盡管例如,高山被孢霉去飽和酶以前已經在非油質酵母釀酒酵母中表達并且能夠積累18:2(Sakuradani E.,等人,Eur J Biochem.261(3)812-20(1999))。WO 2003/099216描述了來自粗糙脈孢霉(Neurosporacrassa)和灰葡萄孢(Botrytis cinerea)的Δ12去飽和酶。在釀酒酵母中的隨后表達證實了粗糙脈孢霉能夠將油酸轉化成18:2;然而,該反應的百分數底物轉化為僅68%(計算為([18:2]/[18:1+18:2])*100)。從而,需要鑒定和分離編碼Δ12去飽和酶的基因,所述Δ12去飽和酶能夠支持在產油宿主生物(例如,油質酵母)中產生高水平18:2(LA)以用于生產PUFAs。
通過從真菌串珠鐮孢(Fusarium moniliforme)分離編碼Δ12去飽和酶的基因并闡明當在油質酵母中表達是將油酸轉化成18:2(LA)的令人驚奇的有效轉化,申請人解決了所陳述的問題。此外,在構巢曲霉(Aspergillus nidulans)、黃曲霉(Aspergillus flavus)、煙曲霉(Aspergillus fumigatus)、Magnaporthe grisea,粗糙脈孢霉和禾本科鐮孢(Fusarium graminearium)中已經鑒定了該Δ12去飽和酶的直向同源物(ortholog)。
發明概述本發明涉及從鐮孢菌(Fusarium)分離的編碼Δ12去飽和酶的基因,其用于操作生物化學途徑,導致產生ω-3和ω-6脂肪酸。因此,本發明提供了編碼真菌Δ12去飽和酶的分離的核酸片段,其選自由(a)分離的核酸片段,其編碼如SEQ ID NO4中給出的氨基酸序列;(b)分離的核酸片段,其與(a)在下面的條件下雜交0.1X SSC,0.1%SDS,65℃和用2X SSC,0.1%SDS,然后用0.1X SSC,0.1%SDS洗滌;或者(c)分離的核酸片段,其與(a)或者(b)互補,構成的組。
在一個特定實施方案中,本發明提供了分離的核酸片段,其包含第一種核苷酸序列,該核苷酸序列編碼Δ12去飽和酶,基于Clustal比對方法與具有SEQ ID NO3中給出的序列的核酸片段比較時具有至少89.2%同一性;或者第二種核苷酸序列,其包含第一種核苷酸序列的互補序列。
類似地,本發明提供了分離的核酸片段,其包含編碼至少477個氨基酸的Δ12去飽和酶的第一種核苷酸序列,所述Δ12去飽和酶基于Clustal比對方法與具有SEQ ID NO4中給出的序列的多肽比較時具有至少95%同一性;或者第二種核苷酸序列,其包含第一種核苷酸序列的互補序列。
類似地,本發明提供了本發明的分離的核酸編碼的多肽以及這些核酸的遺傳嵌合體和包含該遺傳嵌合體的經轉化的宿主細胞。
在另一實施方案中,本發明提供了得到編碼Δ12去飽和酶的核酸片段的方法,其包括(a)用本發明的核酸序列探測基因組文庫;(b)鑒定與本發明的核酸片段雜交的DNA克隆;和(c)對包含步驟(b)中鑒定的基因組片段測序,其中所測序的基因組片段編碼Δ12去飽和酶。
類似地,本發明提供了得到編碼Δ12去飽和酶的核酸片段的方法,其包括(a)合成對應于SEQ ID NOs4,8,12,16,20,21和22中給出的序列的部分的至少一種寡核苷酸引物;和(b)使用步驟(a)的寡核苷酸引物擴增克隆載體中存在的插入片段;其中所擴增的插入片段編碼Δ12去飽和酶的氨基酸序列的一部分。
在另一實施方案中,本發明提供了產生亞油酸的方法,其包括a)提供油質酵母,其包含(i)編碼具有Δ12去飽和酶活性的真菌多肽的分離的核酸,所述多肽當基于Clustal比對方法與具有SEQ ID NO4中給出的序列的多肽比較時具有至少56.3%同一性;和(ii)油酸來源;b)在其中嵌合去飽和酶基因表達并且油酸轉化成亞油酸的條件下生長步驟(a)的酵母;和c)任選回收步驟(b)的亞油酸。
類似地,本發明提供了產生ω-3或ω-6多不飽和脂肪酸的方法,其包括a)提供油質酵母,其包含
(i)編碼具有Δ12去飽和酶活性的蛋白質的分離的核酸片段,所述蛋白質當基于Clustal比對方法與具有SEQ ID NO4中給出的序列的多肽比較時具有至少56.3%同一性;和(ii)編碼功能ω-3/ω-6脂肪酸生物合成途徑的基因;b)提供包含油酸的去飽和酶底物的來源;和c)將(a)的油質酵母與(b)的去飽和酶底物在其中產生多不飽和脂肪酸的條件下接觸;和d)任選回收步驟(c)的多不飽和脂肪酸。
此外,本發明提供了通過本發明的方法產生的微生物油。
附圖簡述和序列描述
圖1顯示了油質酵母中脂質積累的生物化學機制的示意圖。
圖2闡明了ω-3和ω-6脂肪酸生物合成途徑。
圖3闡明了構建用于在Yarrowia lipolytica中基因表達的質粒載體pY5。
圖4顯示了使用Megalign DNASTAR軟件產生的來自不同絲狀真菌(即,構巢曲霉、串珠鐮孢、禾本科鐮孢、Magnaporthe grisea和粗糙脈孢霉)的與Yarrowia lipolyticaΔ12去飽和酶具有同源性的蛋白質的系統樹。
圖5顯示了使用ClustalW分析(DNASTAR軟件的Megalign程序),對來自不同絲狀真菌(即,構巢曲霉、串珠鐮孢、禾本科鐮孢、Magnaporthe grisea和粗糙脈孢霉)的與Yarrowia lipolyticaΔ12去飽和酶具有同源性的蛋白質之間的逐對比較(%同一性)。
圖6顯示了使用ClustalW分析(DNASTAR軟件的Megalign程序),對來自不同絲狀真菌的與Yarrowia lipolytica Δ12去飽和酶具有同源性的蛋白質和來自一些其他真菌和非真菌物種的Δ12去飽和酶蛋白質之間的逐對比較(%同一性)。
圖7提供了pKUNF12T6E的質粒圖。
從下面的詳細描述和所附序列描述可以更完全地理解本發明,所述序列描述形成本申請的一部分。
下面的序列符合37C.F.R.§1.821-1.825(“Requirements forPatent Applications Containing Nucleotide Sequences and/orAmino Acid Sequence Disclosures-the Sequence Rules”)并且與世界知識產權組織(WIPO)標準ST.25(1998)和EPO和PCT的序列表要求(5.2和49.5(a-bis)條,和Section 208和Annex C of theAdministrative Instructions)一致。用于核苷酸和氨基酸序列數據的符號和格式符合37C.F.R.§1.822中給出的條例。
SEQ ID NOs1-22,51和52是表1中鑒定的ORFs編碼基因或者蛋白質。
表1去飽和酶基因和蛋白質SEQ ID號概述
表1(續)
SEQ ID NOs23和24分別是引物TEF 5’和TEF 3’,它們用于分離TEF啟動子。
SEQ ID NOs25和26分別是用于分離XPR2轉錄終止子的引物XPR5’和XPR 3’。
SEQ ID NOs27-38對應于用于質粒構造的引物YL5、YL6、YL9、YL10、YL7、YL8、YL3、YL4、YL1、YL2、YL61和YL62。
SEQ ID NOs39和41分別是用于分離Yarrowia lipolytica Δ12去飽和酶基因的鑒定為P73和P76的簡并引物。
SEQ ID NOs40和42分別是對應于簡并引物P73和P76的簡并引物P73和P76的氨基酸共有序列。
SEQ ID NOs43-46分別對應于用于天然Yarrowia lipolyticaΔ12去飽和酶基因的定向破壞的引物P99、P100、P101和P102。
SEQ ID NOs47-50分別對應于篩選所破壞的Y.lipolytica Δ12去飽和酶基因的定向整合的引物P119、P120、P121和P122。
SEQ ID NOs53和54分別對應于擴增全長Y.lipolytica Δ12去飽和酶編碼區的引物P147和P148。
SEQ ID NOs55和56分別對應于擴增全長串珠鐮孢Δ12去飽和酶編碼區的引物P194和P195。
SEQ ID NO57提供了質粒pKUNF12T6E的DNA序列。
SEQ ID NO58對應于Yarrowia lipolytica FBAIN啟動子區。
SEQ ID NO59是經密碼子優化用于在Y.lipolytica中表達的來自高山被孢霉的合成的延伸酶1基因的957bp核苷酸序列,而SEQ IDNO60是對應的318個氨基酸的序列。
SEQ ID NO61是經密碼子優化用于在Y.lipolytica中表達的來自高山被孢霉的合成的Δ6去飽和酶基因的1374bp核苷酸序列,而SEQ ID NO62是對應的457個氨基酸的序列。
SEQ ID NO63對應于Yarrowia lipolytica FBA啟動子區。
SEQ ID NO64是經密碼子優化用于在Y.lipolytica中表達的來自Thraustochytrium aureum的合成的延伸酶2基因的819bp核苷酸序列,而SEQ ID NO65是對應的272個氨基酸的序列。
SEQ ID NO66對應于最適在Yarrowia sp中表達的密碼子優化的翻譯起始位點。
發明詳述根據主題發明,申請人已經分離并證實了編碼Δ12去飽和酶的串珠鐮孢(Fusarium moniliforme)基因的身份并鑒定了它的在其他真菌中的直向同源物。此外,提供了允許修飾長鏈多不飽和脂肪酸(PUFA)含量和油質酵母如Yarrowia lipolytica的組分的方法和組合物。
本發明涉及新的Δ12去飽和酶和其編碼基因,所述基因可以用于操作用于產生健康PUFAs的生物化學途徑。從而,主題發明發現了許多應用。通過本文公開的方法產生的PUFAs或者其衍生物可以用作飲食替代品或者補充物,尤其嬰兒配方,用于經歷靜脈內營養法的患者或者用于預防或者治療營養不良。備選地,所純化的PUFAs(或者其衍生物)可以摻入到所配制的烹調油、脂肪或者人造黃油中,從而在正常使用中,受者將接受所希望量的飲食補充。PUFAs還可以摻入到嬰兒配方、營養補充品或者其他食品中并且可以用作抗炎劑或者膽固醇降低劑。任選地,組合物可以用于藥物用途(人或者獸)。在該情況中,PUFAs通常經口施用但是可以通過任意途徑施用,只要通過所述途徑PUFAs可以被成功地吸收,所述途徑為例如腸胃外(例如,皮下、肌內或者靜脈內)、直腸、陰道或者局部(例如,作為皮膚軟膏劑或者洗劑)。
用通過重組方法產生的PUFAs補充人或者動物可以導致所加入的PUFAs以及它們的代謝物的水平增加。例如,用花生四烯酸治療不僅導致ARA水平增加,而且導致ARA的下游產物,如前列腺素的水平增加。復雜調節機制使得希望組合多種PUFAs,或者加入PUFAs的不同綴合物,以便防止、控制或者克服此類機制以實現個體中特定PUFAs的所希望的水平。
定義在本公開中,使用了許多術語和縮寫。提供了下面的定義。
“可該框”縮寫為ORF。
“聚合酶鏈式反應”縮寫為PCR。
“美國典型培養物保藏中心”縮寫為ATCC。
“多不飽和脂肪酸”縮寫為PUFA(s)。
術語“串珠鐮孢”與“Fusarium verticillioides”同義。
術語“脂肪酸”指約C12到C22的不同鏈長的長鏈脂族酸(鏈烷酸)(盡管更長和更短的鏈長是已知的)。主要的鏈長為C16到C22。脂肪酸的結構由簡單標記系統“X:Y”代表,其中X是特定脂肪酸中碳原子總數,Y是雙鍵數。
通常,將脂肪酸分類為飽和或不飽和的。術語“飽和脂肪酸”指在它們的碳主鏈之間沒有“雙鍵”。相比,“不飽和脂肪酸”具有“雙鍵”以及它們的碳主鏈(其最通常為順式構型)。“單不飽和脂肪酸”沿著碳主鏈具有僅一個“雙鍵”(例如,對于棕櫚油酸(16:1)和油酸(18:1)通常在第9個和第10個碳原子之間),而“多不飽和脂肪酸”(或者“PUFAs”)沿著碳主鏈具有至少兩個雙鍵(例如,對于亞油酸(18:2)為第9和第10個和第12和第13個碳原子之間);對于α-亞麻酸(18:3)為第9和第10、第12和第13和第15和第16個碳原子之間)。
可以將“PUFAs”分類成兩個主要家族(根據最接近脂肪酸碳鏈的甲基末端的第一個雙鍵的位置(n))。從而,“ω-6脂肪酸”(ω-6或n-6)具有距離該分子的ω(甲基)末端6個碳原子的第一個不飽和的雙鍵和額外具有共兩個或多個雙鍵,每個隨后的不飽和出現朝向該分子的羧基末端的3個額外的碳原子。相比,“ω-3脂肪酸”(ω-3或n-3)具有距離分子的ω末端三個碳原子的第一個不飽和雙鍵并且額外具有共三個或多個雙鍵,每個隨后的不飽和出現朝向該分子的羧基末端的3個額外的碳原子。
對于本發明,將使用ω參照系統指出碳原子數、雙鍵數目和與ω碳最接近的雙鍵的位置,從ω碳(其對于該目的編號為1)的計數。該命名在下面的表2中標題為“Shorthand Notation”的列中顯示。該表達剩余內容總結了ω-3和ω-6脂肪酸的普通名、將用于說明書全文的縮寫和每種化合物的“化學名”。
表2多不飽和脂肪酸的命名
術語“基本上脂肪酸”指特定PUFA,個體為了生存必須攝入該PUFA,不能從頭合成該特定必需脂肪酸。亞油酸(18:2,ω-6)和亞麻酸(18:3,ω-3)脂肪酸是“必需脂肪酸”,因為人不能合成它們并且必須從他們的飲食得到它們。
術語“脂肪”指在25℃為固體并且通常是飽和的脂類物質。
術語“油”指在25℃為液態并且通常是不飽和的脂類物質。在一些藻類、油質酵母和絲狀真菌的油中發現了PUFA。“微生物油”或者“單細胞油”為由微生物在它們的壽命中天然產生的油。此類油可以含有長鏈PUFA。
術語“PUFA生物合成途徑酶”指與PUFA的生物合成相關的下列酶的任一種(和編碼所述酶的基因),包括Δ4去飽和酶、Δ5去飽和酶、Δ6去飽和酶、Δ12去飽和酶、aΔ15去飽和酶、Δ17去飽和酶、Δ9去飽和酶、Δ8去飽和酶和/或延伸酶。
術語“ω-3/ω-6脂肪酸生物合成途徑”指一組基因,其當在適當條件下表達是編碼催化產生ω-3和ω-6脂肪酸的一種或兩種的酶。通常,涉及ω-3/ω-6脂肪酸生物合成途徑的基因編碼一些或者所有下面的酶Δ12去飽和酶、Δ6去飽和酶,延伸酶、Δ5去飽和酶、Δ17去飽和酶,Δ15去飽和酶、Δ9去飽和酶、Δ8去飽和酶和Δ4去飽和酶。代表性途徑在圖2中闡明,提供了油酸通過多種中間物向DHA的轉化,該圖闡明了怎樣可以從普通來源產生ω-3和ω-6脂肪酸。該途徑自然地分成兩個部分,其中一個部分將產生ω-3脂肪酸和其他部分,另一部分僅產生ω-6脂肪酸。僅產生ω-3脂肪酸的部分將在本文中稱作ω-3脂肪酸生物合成途徑,而僅產生ω-6脂肪酸的部分將在本文中稱作ω-6脂肪酸生物合成途徑。
本文所用術語“功能的”在ω-3/ω-6脂肪酸生物合成途徑的上下文中表示該途徑中一些(或者所有)基因表達活性酶。將理解“ω-3/ω-6脂肪酸生物合成途徑”或者“功能ω-3/ω-6脂肪酸生物合成途徑”不暗含上面段落中所列的所有基因都是需要的,因為許多脂肪酸產物將僅需要表達該途徑基因的亞組。
術語“去飽和酶”指在一種或多種脂肪酸中去飽和,即引入雙鍵以產生單-或者多不飽和脂肪酸的多肽。盡管在說明書全文中參考特定脂肪酸時使用ω參照系統,但是使用Δ系統通過從底物的羧基末端計數指出去飽和酶的活性更加方便。本文中尤其重要的是Δ12去飽和酶,其去飽和從分子的羧基末端編號的第12到第13個碳原子之間的脂肪酸并且催化油酸向LA的轉化。與本公開相關的其他去飽和酶包括Δ15去飽和酶,其催化LA向ALA的轉化;Δ17去飽和酶,其催化DGLA向ETA和/或ARA向EPA的轉化;Δ6去飽和酶,其催化LA向GLA和/或ALA向STA的轉化;Δ5去飽和酶,其催化DGLA向ARA和/或ETA向EPA的轉化;Δ4去飽和酶,其催化DPA向DHA的轉化;Δ8去飽和酶,其催化EDA向DGLA和/或ETrA向ETA的轉化;和Δ9去飽和酶,其催化棕櫚酸向棕櫚油酸(16:1)和/或硬脂酸向油酸(18:1)轉化。在本領域中,Δ15和Δ17去飽和酶還偶然稱作“omega-3去飽和酶”,“w-3去飽和酶”,和/或“ω-3去飽和酶”。一些去飽和酶對兩種或多種底物(例如,Saprolegnia diclina Δ17去飽和酶的底物,包括ARA和DGLA,而秀麗隱桿線蟲ω-3去飽和酶的底物包括LA和GLA)。
術語“具有與Yarrowia lipolytica.Δ12去飽和酶同源性的蛋白質”指在本文中鑒定為SEQ ID NOs2、4、6、8、10、12、14、16、18、20、21和22并且具有與本文中鑒定為SEQ ID NO52(在共同待決的美國專利申請10/840325中表征,此處將該專利完整引入作為參考)的Y.lipolytica去飽和酶具有同源性的蛋白質。系統進化分析法確定,這些蛋白質(即,SEQ ID NOs2、4、6、8、10、12、14、16、18、20、21和22)聚簇成兩種不同的亞家族,在本文中稱作“亞家族1”和“亞家族2”。特別地,亞家族1蛋白質似乎編碼Δ15去飽和酶(即,SEQ ID NOs2、6、10、14和18;見共同待決的美國臨時申請60/519191,將其完整引入本文作為參考)。相比,亞家族2蛋白質編碼如此處表征的具有Δ12去飽和酶活性(即,SEQ ID NOs4、8、12、16、20、21和22)的蛋白質。
術語“轉化效率”和“底物轉化百分數”指特定酶(例如,去飽和酶或延伸酶)可以將底物轉化成產物的效率。根據下面的公式測量轉化效率([產物]/[底物+產物])*100,其中,“產物”包括直接產物和該產物所來源的途徑中的所有產物。在本申請中,希望鑒定特征是當在油質酵母宿主中表達時具有高底物轉化百分數的那些Δ12去飽和酶;從而,例如,優選向LA的轉化效率為至少70%,至少80%的向LA的轉化效率是尤其適宜的,至少85%的向LA的轉化效率是最優選的。
術語“延伸酶”指可以延伸脂肪酸碳鏈以產生酸的多肽,所述酸比延伸酶所作用的脂肪酸底物長2個碳。該延伸過程以多步機制與脂肪酸合酶聯合作用,其中CoA是酰基載體(Lassner等人,The PlantCell 8281-292(1996))。簡言之,丙二酸單酰輔酶A與長鏈酰基輔酶A縮合產生CO2和β-酮酰基-CoA(其中酰基部分已經被延長2個碳原子)。隨后反應包括還原成β-羥基酰基-CoA,脫水成烯酰輔酶A,和再次還原產生延伸的酰基-CoA。延伸酶催化的反應的實例是GLA向DGLA,STA向ETA,和EPA向DPA的轉化。因此,延伸酶可以具有不同特異性。例如,C16/18延伸酶將優選為C16底物,C18/20延伸酶將優選C18底物,C20/22延伸酶將優選C20底物。以相似的方式,Δ9延伸酶能夠催化LA和ALA分別向EDA和ETrA的轉化。
術語“油質的”指傾向于以脂質的形式保存它們的能源的那些生物(Weete,InFungal Lipid Biochemistry,2nded.,Plenum,1980)。這些包括油料種子植物(例如,大豆、玉米、紅花、向日葵、蕓苔、油菜籽、亞麻、玉米和報春花)和微生物(例如,破囊壺菌(Thraustochytrium sp.,)、Schizochytrium sp.,被孢霉(Mortierella sp.)和某些油質酵母)。
術語“油質酵母”指分類為可以產油的酵母的那些微生物。通常,油質微生物的細胞油或者甘油三酯含量遵循S形曲線,其中脂質濃度增加直到晚對數或者早靜止生長期的最大值,然后在晚靜止和死亡期期間逐漸減少(Yongmanitchai和Ward,Appl.Environ.Microbiol.57419-25(1991))。油質微生物積累超過它們的干重的約25%的油是常見的。油質酵母的實例包括,但不限于下面的屬Yarrowia,假絲酵母屬(Candida)、紅酵母屬(Rhodotorula)、紅冬孢酵母屬(Rhodosporidium)、隱球菌屬(Cryptococcus)、毛孢子菌屬(Trichosporon)和油脂酵母屬(Lipomyces)。
術語“可發酵的碳底物”指微生物將代謝以產生能量的碳源。本發明的典型的碳底物包括,但不限于單糖、寡糖、多糖、烴類、脂肪酸、脂肪酸酯、甘油單酯、二氧化碳、甲醇、甲醛、甲酸和含碳胺。
術語“密碼子優化的”當涉及用于轉化多種宿主的核酸片段的基因或者編碼區時,指改變核酸分子的基因或者編碼區中的密碼子以反映宿主生物的典型的密碼子選擇而不改變DNA編碼的多肽。
本文所用的“分離的核酸片段”是單鏈或者雙鏈RNA或者DNA聚合物,其任選含有合成的、非天然或者改變的核苷酸堿基。DNA聚合物形式的分離的核酸片段可以包含cDNA、基因組DNA或者合成DNA的一個或多個片段。
當核酸片段的單鏈形式能夠與另一種核酸片段在適宜的溫度和溶液離子強度條件下退火時,所述核酸片段與所述另一種核酸片段,如cDNA、基因組DNA或者RNA分子是“可雜交的”。雜交和洗滌條件是公知的并且在Sambrook,J.,Fritsch,E.F.and Maniatis,T.Molecular CloningA Laboratory Manual,2nded.,Cold SpringHarbor LaboratoryCold Spring Harbor,NY(1989),尤其第11章和表11.1中例證。溫度條件和離子強度的條件決定雜交的“嚴格性”。可以調節嚴格條件以從中等相似的片段(如來自遠相關生物的同源序列)篩選高度相似的片段(如來自近相關生物的一式兩份的功能酶)。雜交后洗滌決定嚴格條件。一組優選條件使用一些列洗滌,其以6X SSC,0.5%SDS在室溫下15分鐘開始,然后用0.2X SSC,0.5%SDS在50℃30分鐘重復兩次。一組更優選的嚴格條件使用更高的溫度,其中洗滌與上面的相同,只是最后兩次在0.2X SSC,0.5%SDS30分鐘洗滌的溫度增加到60℃。另一組優選的高度嚴格條件使用在0.1X SSC,0.1%SDS中65℃下最后兩次洗滌。額外組的嚴格條件包括例如,在0.1X SSC,0.1%SDS,65℃雜交和用2X SSC,0.1%SDS然后用0.1X SSC,0.1%SDS洗滌。
雜交需要兩種核酸含有互補序列,盡管取決于雜交的嚴格性,但是堿基之間的錯配是可能的。雜交的核酸分子的適宜嚴格性取決于核酸的長度和互補程度——本領域公知的變量。兩種核酸序列之間相似性或者同源性程度越大,具有那些序列的核酸的雜交分子的Tm值越大。核酸雜交的相對穩定性(對應于較高的Tm)以下面的順序減小RNA:RNA,DNA:RNA,DNA:DNA。對于長度大于100個核苷酸的雜交分子,已經推導了計算Tm的方程(見Sambrook等人,上文,9.50-9.51)。對于與較短核酸,即寡核苷酸的雜交,錯配的位置變得重要,并且寡核苷酸的長度決定了它的特異性(見,Sambrook等人,上文,11.7-11.8)。在一個實施方案中,可雜交的核酸的長度為至少約10個核苷酸。優選地,可雜交的核酸的最小長度為至少約15個核苷酸,更優選至少約20個核苷酸;最優選地,長度為至少約30個核苷酸。此外,技術人員將認識到如必要,可以根據諸如探針長度的因子調節溫度和洗滌溶液鹽濃度。
氨基酸或者核苷酸序列的“實質部分”是包含包含多肽的氨基酸序列或者基因的核苷酸序列的足夠部分的部分,推定所述部分鑒定該多肽或者基因,所述鑒定可以通過由本領域技術人員通過序列的手工評價或者通過計算機自動化的序列比較進行和使用諸如BLAST(BasicLocal Alignment Search Tool;Altschul,S.F.,等人,J.Mol.Biol.215403-410(1993))的算法鑒定。通常,為了假定鑒定與已知蛋白質或者基因同源的多肽或者核酸序列,10或更多連續氨基酸或者30或更多核苷酸的序列是必要的。此外,關于核苷酸序列,包含20-30個連續核苷酸的基因特異的寡核苷酸探針可以用于基因鑒定(例如,DNA雜交)和分離(例如,細菌菌落或者噬菌體噬菌斑的原位雜交)的依賴序列的方法。此外,12-15個堿基的短寡核苷酸可以用作PCR中的擴增引物以便得到包含引物的特定核酸片段。因此,核苷酸序列的“實質部分”包含足夠序列以特異鑒定和/或分離包含所述序列的核酸片段。本說明書教導了編碼特定真菌蛋白質的完整氨基酸和核苷酸序列。技術人員擁有本文所報導的益處,現在可以為了本領域技術人員已知的目的使用所公開序列的所有或者實質部分。因此,本發明包含如所附序列表中報導的完整序列,以及如上面定義的那些序列的實質部分。
術語“互補的”用于描述能夠相互雜交的核苷酸堿基之間的關系。例如,關于DNA,腺苷與胸苷互補,胞苷與鳥苷互補。因此,本發明還包括與所附序列表中報導的完整序列互補的分離的核酸片段,以及那些實質上相似的核酸序列。
如本領域已知的術語“同一性百分數”是如通過比較序列確定的兩種或多種多肽序列或者兩種或多種多核苷酸序列之間的關系。在本領域中,“同一性”還指多肽或者多核苷酸序列之間的序列相關性程度,根據具體情況而定,如通過此類序列的字符串之間的匹配決定。“同一性”和“相似性”可以通過已知方法容易地計算,所述方法包括但不限于如下文獻中描述的1.)Computational MolecularBiology(Lesk,A.M.,Ed.)Oxford UniversityNY(1988);2.)BiocomputingInformatics and Genome Projects(Smith,D.W.,Ed.)AcademicNY(1993);3.)Computer Analysis ofSequence Data,Part I(Griffin,A.M.,and Griffin,H.G.,Eds.)HumaniaNJ(1994);4.)Sequence Analysis in Molecular Biology(von Heinje,G.,Ed.)Academic(1987);and 5.)SequenceAnalysis Primet(Gribskov,M.and Devereux,J.,Eds.)StocktonNY(1991)。設計確定同一性的優選方法以得到所測試序列之間的最佳匹配。確定同一性和相似性的方法在公眾可利用的計算機程序中編碼。序列比對和同一性百分數計算可以用LASERGENE生物信息學計算套件(DNASTAR Inc.,Madison,WI)的Megalign程序進行。除非另外說明,序列的多重比對使用Clustal比對方法(Higgins和Sharp,CABIOS.5151-153(1989)),使用默認參數(GAP PENALTY=10,GAPLENGTH PENALTY=10)進行。使用Clustal方法進行逐對比對的默認參數為KTUPLE 1,GAP PENALTY=3,WINDOW=5和DIAGONALS SAVED=5。
適宜的核酸片段(本發明的分離的多核苷酸)編碼與本文報導的氨基酸序列具有至少約70%同一性,優選約75%同一性,更優選約80%同一性的多肽。優選的核酸片段編碼與本文報導的氨基酸序列具有約85%同一性的氨基酸序列。更優選的核酸片段編碼與本文報導的氨基酸序列具有約90%同一性的氨基酸序列。更優選的為編碼與本文報導的氨基酸序列具有約95%同一性的氨基酸序列。適宜的核酸片段不僅具有上面的同源性而且通常編碼具有至少50個氨基酸,優選至少100個氨基酸,更優選至少150個氨基酸,更優選至少200個氨基酸,最優選至少250個氨基酸的多肽。
術語“同源性”指序列之間的關系,所述序列中存在一定程度的相似,其通常是由于從共同的祖先序列演化。同源序列可以具有基因的、結構的、功能的和/或行為的性質而具有同源性。術語“直向同源物”或者“直向同源序列”在本文指其中物種形成后序列趨異的關系(即,不同物種中的同源序列從物種形成期間的共同祖先基因產生)。相比,術語“共生同源的”指一個物種內由于基因復制引起的同源序列。本領域技術人員將熟悉鑒定同源、直向同源和共生同源序列所需的技術。
“密碼子簡并”指遺傳密碼中的性質,其允許改變核苷酸序列而不影響所編碼的多肽的氨基酸序列。本領域技術人員熟知核苷酸密碼子選擇中特定宿主細胞顯示出的“密碼子偏愛”以指定給定氨基酸。因此,當合成用于在宿主細胞中提高表達的基因時,希望設計該基因使得它的密碼子選擇頻率接近該宿主細胞的優選密碼子選擇的頻率。
“化學合成的”當涉及DNA序列時,指在體外裝配組分核苷酸。DNA的手工化學合成可以使用成熟的方法完成;或者自動化化學合成可以使用許多通過商業途徑可獲得的機器來進行。使用本領域技術人員公知的步驟,可以從化學合成的寡核苷酸構件裝配“合成基因”。這些構件連接并退火形成基因片段,其然后酶促裝配以構造完整基因。因此,可以基于核苷酸序列的優化以反映宿主細胞的密碼子偏愛來定制基因用于最佳基因表達。技術人員明白如果密碼子選擇偏向宿主喜愛的那些密碼子,那么可能進行成功的基因表達。可以基于來自宿主的基因的考察確定優選的密碼子,其中所述基因的序列信息是可得的。
“基因”指表達特定蛋白質的核酸片段,并且可以指僅編碼區或者可以包括編碼序列前(5’-非編碼序列)和之后(3’非編碼序列)的調節序列。“天然基因”指在自然中發現的基因與其自己的調節序列。“嵌合基因”指不是天然基因的任意基因,其包含未在自然界中發現在一起的調節序列和編碼序列。因此,嵌合基因可以包含不同的來源的調節序列和編碼序列,或者來自相同來源,但是以不同于在自然中發現的方式排列的調節序列和編碼序列。“內源基因”指位于生物的基因組中它的天然位置中的天然基因。“外源”基因指通過基因轉移導入宿主生物的基因。外源基因可以包含導入非天然生物的天然基因、導入天然宿主內的新位置的天然基因,或者嵌合基因。“轉基因”是通過轉化方法導入基因組中的基因。“密碼子優化的基因”是這樣的基因,將其密碼子選擇頻率設計成模擬宿主細胞的優選密碼子選擇的頻率。
“編碼序列”指編碼特定氨基酸序列的DNA序列。“適宜的調節序列”指位于編碼序列的上游(5’非編碼序列)、內部或者下游(3’非編碼序列)并且影響相關編碼序列的轉錄、RNA加工或者穩定性,或者翻譯的核苷酸序列。調節序列可以包括啟動子、翻譯前導序列、內含子、多腺苷酸化識別序列、RNA加工位點、效應子結合位點和莖環結構。
“啟動子”指能夠控制編碼序列或者功能RNA的表達的DNA序列。通常,編碼序列位于啟動子序列的3’。啟動子可以完整地來自天然基因,或者可以由來自自然界中發現的不同啟動子的不同元件組成,或者甚至包含合成的DNA片段。本領域技術人員發現不同啟動子可以指導基因在不同組織或者細胞類型,或者在不同發育階段中,或者應答不同環境或者生理條件表達。導致基因在多數細胞類型中在多數時間表達的啟動子通常稱作“組成型啟動子”。還認識到因為在多數情況中,調節序列的確切邊界還沒有被完全限定,所以不同長度的DNA片段可能具有相同啟動子活性。
術語“3’非編碼序列”和“轉錄終止子”指位于編碼序列下游的DNA序列。這包括多腺苷酸化識別序列和編碼能夠影響mRNA加工或基因表達的調節信號的其他序列。多腺苷酸化信號通常的特征是影響多腺苷酸序列向mRNA前體的3’末端的加入。3’區可以影響相關編碼序列的轉錄、mRNA加工或穩定性,或者翻譯。
“RNA轉錄物”指DNA的RNA聚合酶催化的轉錄產生的產物。當RNA轉錄物是DNA序列完全互補拷貝時,它稱作初級轉錄物,或者它可以是來自初級轉錄物的轉錄后加工的RNA序列并且稱作成熟RNA。“信使RNA”或者“mRNA”指沒有內含子并且可以由細胞翻譯成蛋白質的RNA。“cDNA”指與mRNA互補或者來自mRNA的雙鏈DNA。“有義”RNA指包括mRNA并且可以因此由細胞翻譯成蛋白質的RNA轉錄物。“反義RNA”指與靶初級轉錄物或者mRNA的所有或者部分互補并且阻斷靶基因的表達的RNA轉錄物(U.S.5,107,065;WO 99/28508)。反義RNA的互補性可以是與特定基因轉錄物的任意部分,即在5’非編碼序列、3’非編碼序列或者編碼序列處互補。“功能RNA”指沒有翻譯然而對細胞過程具有影響的反義RNA、核酶RNA或者其他RNA。
術語“可操作地連接”指一個核酸片段上核酸序列的結合使得一個核酸序列的功能受到另一個核酸序列的影響。例如,當啟動子能夠影響編碼序列的表達(即,編碼序列處于啟動子的轉錄控制下)時,啟動子可操作地連接編碼序列。編碼序列可以以有義或者反義方向可操作地連接調節序列。
本文所用術語“表達”指來自本發明的核酸片段的有義(mRNA)或者反義RNA的轉錄和穩定積累。表達還可以指mRNA翻譯成多肽。
“成熟”蛋白質指翻譯后加工的多肽;即已經從初級轉錄產物除去任何前肽的多肽。“前體”蛋白質指mRNA翻譯的初級產物;即仍然存在前肽。前肽可以是(但是不限于)細胞內定位信號。
“轉化”指將核酸片段轉移到宿主生物,導致基因穩定的遺傳。核酸片段可以是例如自主復制的質粒;或者它可以整合到宿主生物的基因組中。含有所轉化的核酸片段的宿主生物稱作“轉基因的”或者“重組的”或者“轉化的”生物。
術語“質粒”、“載體”和“盒”指染色體外元件,其通常攜帶不是細胞的中心代謝部分的基因,并且通常為環形雙鏈DNA片段的形式。此類元件可以是來自任意來源的線性或環狀的單鏈或者雙鏈DNA或者RNA的自主復制的序列、基因組整合序列、噬菌體或者核苷酸序列,其中許多核苷酸序列已經連接或者重組成獨特的結構,其能夠例如,將啟動子片段和所選基因產物的DNA序列以及合適的3’非翻譯序列導入細胞中。“轉化盒”指特定載體,其含有外源基因并且具有除了外源基因之外的元件,所述元件方便轉化特定宿主細胞。“表達盒”指特定載體,其含有外源基因和除了該外源基因之外的元件,所述元件允許該基因在外來宿主中增強的表達。
術語“同源重組”指兩個DNA分子之間DNA片段的交換(在交換期間)。被交換的片段的側翼是兩個DNA分子之間相同核苷酸序列的位點(即,“同源區”)。術語“同源區”指核酸片段上的核苷酸序列段,其參與相互同源的核酸片段的同源重組。當同源區具有至少約10bp長度,優選具有至少約50bp長度時,通常將發生同源重組。通常,意在用于重組的片段含有至少兩個同源區,其中希望靶基因破壞和替換。
術語“序列分析軟件”指可用于分析核苷酸或者氨基酸序列的任意計算機算法或者軟件程序。“序列分析軟件”可以通過商業途徑獲得或者獨立開發。通常,序列分析軟件將包括,但不限于1)GCG程序套包(Wisconsin Package版本9.0,Genetics Computer Group(GCG),Madison,WI);2.)BLASTP,BLASTN,BLASTX(Altschul等人,J.Mol.Biol.215403-410(1990));3.)DNASTAR(DNASTAR,Inc.Madison,WI);4.)Sequencher(Gene Codes Corporation,AnnArbor,MI);和5.)FASTA程序,其整合Smith-Waterman算法(W.R.Pearson,Comput.Methods Genome Res.,[Proc.Int.Symp.](1994),Meeting Date 1992,111-20.Editor(s)Suhai,Sandor.PlenumNew York,NY)。在本申請的上下文內,將理解除非另外指出,當使用序列分析軟件進行分析時,分析的結果將基于所參考程序的“默認值”。本文所用的“默認值”將指當軟件首次初始化時最初加載的任何一組值或者參數。
用于本文的標準重組DNA和分子克隆技術是本領域公知的并且由Sambrook,J.,Fritsch,E.F.和Maniatis,T.,Molecular CloningA Laboratory Manual,第二版,Cold Spring Harbor LaboratoryCold Spring Harbor,NY(1989)(下文中,“Maniatis”);Silhavy,T.J.,Bennan,M.L.和Enquist,L.W.,Experiments with GeneFusions,Cold Spring Harbor LaboratoryCold Spring Harbor,NY(1984);和Ausubel,F.M.等人,Current Protocols inMolecular Biology,published by Greene Publishing Assoc.andWiley-Interscience(1987)描述。
脂肪酸的微生物生物合成通常,油質微生物中脂質積累由對生長培養基中存在的總的碳氮比率引發(圖1)。當細胞耗盡可利用的氮供應(例如,當碳氮比率大于約40)時,細胞腺苷一磷酸(AMP)的耗盡導致線粒體中AMP-依賴的異檸檬酸脫氫酶活性的停止,將檸檬酸轉運到胞質溶膠中,和隨后由ATP-檸檬酸裂合酶切割以產生乙酰輔酶A。乙酰輔酶A是脂肪酸的從頭生物合成的基本構件。盡管可以有效代謝以產生乙酰輔酶A的任意化合物都可以用作脂肪酸的前體,但是葡萄糖是該類型反應中的主要來源(圖1)。葡萄糖通過糖酵解轉化成丙酮酸,丙酮酸然后被轉運到線粒體中,在線粒體中丙酮酸可以由丙酮酸脫氫酶(“PD”)轉化成乙酰輔酶A。因為乙酰輔酶A不能通過線粒體膜直接轉運到細胞質中,所以來自乙酰輔酶A的兩個碳與草酰乙酸縮合產生檸檬酸(由檸檬酸合成酶催化)。檸檬酸直接轉運到細胞質中,在細胞質中它被ATP-檸檬酸裂合酶切割以再生乙酰輔酶A和草酰乙酸。草酰乙酸通過轉化成蘋果酸再次進入三羧酸循環。
丙二酸單酰輔酶A的合成是脂肪酸生物合成的首先進行的步驟,它發生在細胞質中。由乙酰輔酶A羧化酶(“ACC”)對乙酰輔酶A的羧化產生丙二酸單酰輔酶A。脂肪酸合成由多酶脂肪酸合成酶復合體(“FAS”)催化并且通過8個二碳片段(來自乙酰輔酶A的乙酰基)的縮合形成16碳飽和脂肪酸棕櫚酸。更具體地,FAS催化一系列7次反應,其包括下面的(Smith,S.FASEB J.,8(15)1248-59(1994))1.乙酰輔酶A和丙二酸單酰輔酶A轉移到FAS的酰基載體蛋白質(ACP)。然后乙酰基轉移到丙二酰基,形成β-酮丁酰基-ACP并釋放CO2。
2.β-酮丁酰基-ACP經歷還原(通過β-酮酰基還原酶)和脫水(通過β-羥基酰基脫水酶)形成反式-單不飽和的脂肪酰基。
3.雙鍵由NADPH還原,產生比最初的飽和脂肪酰基長2個碳的飽和脂肪酰基。然后再生該丁酰基與新的丙二酰基縮合和重復延伸步驟的能力。
4.當脂肪酰基變成長16個碳時,硫酯酶活性將其水解,釋放游離棕櫚酸。
棕櫚酸(16:0)是更長鏈飽和和不飽和脂肪酸(例如,硬脂酸(18:0),棕櫚油酸(16:1)和油酸(18:1))通過內質網膜中存在的延伸酶和去飽和酶的作用的前體。棕櫚酸和硬脂酸(作為輔酶A和/和ACP酯)通過Δ9去飽和酶的作用分別轉化成它們的不飽和衍生物棕櫚油酸(16:1)和油酸(18:1)。
通過兩分子的乙酰輔酶A與甘油-3-磷酸的酯化產生1,2-二酰基甘油磷酸(通常稱作磷脂酸)形成三酰基甘油(脂肪酸的主要儲存單位)(圖1)。然后由磷脂酸磷酸酶除去磷酸產生1,2-二酰基甘油。當加入第三種脂肪酸,例如,通過二酰基甘油-酰基轉移酶的作用形成三酰基甘油。
ω脂肪酸的生物合成簡言之,將LA轉化成GLA、DGLA和ARA(ω-6途徑)和將ALA轉化成STA、ETA、EPA、DPA和DHA(ω-3途徑)的代謝過程包括通過加入兩個碳單位和通過加入雙健對分子去飽和延伸碳鏈(圖2)。這序列存在于內質網膜中的一系列專門的去飽和和延伸酶。
ω-6脂肪酸油酸通過Δ12去飽和酶的作用首先轉化成ω-6脂肪酸。隨后ω-6脂肪酸如下產生1)LA通過Δ6去飽和酶轉化成GLA;2)GLA通過延伸酶的作用轉化成DGLA;和3)DGLA通過Δ5去飽和酶的作用轉化成ARA。
ω-3脂肪酸亞油酸(LA)通過Δ15去飽和酶的作用首先轉化成ω-3脂肪酸。隨后,ω-3脂肪酸以相似于ω-6脂肪酸的一系列步驟產生。特別地1)ALA通過Δ6去飽和酶的活性轉化成STA;2)STA通過延伸酶的活性轉化成ETA;和3)ETA通過Δ5去飽和酶的活性轉化成EPA。備選地,可以通過Δ17去飽和酶的活性分別從DGLA和ARA產生ETA和EPA。EPA可以通過延伸酶和Δ4去飽和酶的活性進一步轉化成DHA。
在備選實施方案中,Δ9延伸酶能夠催化LA和ALA分別向EDA和ETrA的轉化。Δ8去飽和酶然后將這些產物分別轉化成DGLA和ETA。
參與ω脂肪酸產生的基因許多微生物,包括藻類、細菌、霉和酵母可以在細胞代謝的普通過程中合成PUFAs和ω脂肪酸。尤其充分研究的是真菌,包括Schizochytrium aggregatm,破囊壺菌屬的種和Morteriellaalpin。此外,許多甲藻(甲藻綱)天然產生高濃度PUFA。同樣的,通過遺傳方法已經鑒定了參與油產生的多種基因并且這些基因的一些的DNA序列可以公開得到(非限制性實例在下表3中顯示)
表3參與PUFA產生的一些可公開得到的基因
表3續參與PUFA產生的一些可公開得到的基因
表3續參與PUFA產生的一些可公開得到的基因
此外,專利文獻提供了許多參與油產生的基因的額外的DNA序列(和/或關于一些上面基因的細節和它們的分離方法)。見,例如,U.S.5,968,809(Δ6去飽和酶s);U.S.5,972,664和U.S.6,075,183(Δ5去飽和酶s);WO 91/13972和U.S.5,057,419(Δ9去飽和酶s);U.S.2003/0196217A1(Δ17去飽和酶s);WO 02/090493(Δ4去飽和酶s);WO 93/11245和WO 03/099216(Δ15去飽和酶s);WO 00/12720和U.S.2002/0139974A1(延伸酶)。這些專利和申請的每一個都完整引入本文作為參考。
本文中尤其重要的是Δ12去飽和酶,更具體地,適于在油質酵母(例如,Yarrowia lipolytica)中異源表達的Δ12去飽和酶。一些Δ12去飽和酶(即,Glycine max、Brassica napus、擬南芥、蓖麻(Ricinus communis)、玉米(Zea mays);粗糙脈孢霉、灰葡萄孢)的序列在WO 94/11516和WO 03/099216中公開。
此外,最近分離和表征了天然Yarrowia lipolytica Δ12脂肪酸去飽和酶(見,共同待決的美國專利申請10/840325,將其完整引入作為參考;也參加本文的實施例2和3,和SEQ ID NOs51和52)。簡言之,使用簡并PCR引物通過PCR從Yarrowia lipolytica克隆了部分推定的Δ12去飽和酶DNA片段。使用所產生的片段對內源Yarrowialipolytica Δ12去飽和酶基因的定向破壞在所破壞的菌株中產生水平增加的18:1和沒有可檢測的18:2,從而證實除去了天然Δ12去飽和酶活性。隨后,使用質粒拯救分離的所整合質粒側翼的基因組DNA序列并裝配了全長Yarrowia lipolytica Δ12去飽和酶基因(SEQ IDNO51)。該序列包括1257個堿基的可該框(SEQ ID NO51的核苷酸+283到+1539),而所推導的編碼氨基酸序列長為419個殘基(SEQ IDNO52)。該Δ12去飽和酶的過表達適于增加油酸向LA的底物轉化百分數(計算為([18:2]/[18:1+18:2])*100),從而它從野生型細胞中的59%增加到所轉化的宿主細胞中的74%。盡管這些宿主細胞內LA的增加的可用性,但是希望得到甚至更大的底物庫,其適于能夠在Y.lipolytica轉化細胞中高水平產生多種ω-3和/或ω-6 PUFAs。從而,具有高水平Δ12去飽和酶活性的異源蛋白質的表達在工程化生物的途徑中是有益的。
許多因素影響具有Δ12去飽和酶活性的特定多肽的選擇,所述多肽將在宿主細胞中表達以產生PUFAs(任選聯合其他去飽和酶和延伸酶)。取決于宿主細胞,底物的有效性,和目的終產物、一些多肽是重要的;然而,對選擇具有去飽和酶活性的特定多肽的考慮包括所述多肽的底物特異性,而不管所述多肽或者其組分是限速酶,該去飽和酶是所希望的PUFA的合成必需的,和/或該多肽需要輔因子。所表達的多肽優選具有于它在宿主細胞中的位置的生物化學環境相容。例如,所述多肽可以必須與宿主細胞中的其他酶競爭底物。因此,在確定給定多肽用于修飾給定宿主細胞中PUFA產生的適宜性中,考慮所述多肽的KM和比活的分析。用于具體宿主細胞的多肽是在目的宿主細胞中存在的生物化學條件下有功能的多肽,但是另外可以是具有能夠修飾所希望的脂肪酸(即,油酸)的Δ12去飽和酶活性的任意多肽。從而,所述序列可以來自任意來源,例如,從天然來源分離(來自細菌、藻類、真菌、植物、動物等等),通過半合成途徑產生或者從頭合成。
對于本發明,然而,最希望具有Δ12去飽和酶活性的多肽當在所希望的宿主細胞中表達時具有至少約70%的轉化效率,其中至少約80%的轉化效率尤其合適,至少約85%的轉化效率是最優選的。
鑒定新的真菌Δ12去飽和酶使用Yarrowia lipolytica Δ12去飽和酶蛋白質序列(SEQ IDNO52)作為查詢序列,通過序列比較在本文中鑒定了來自串珠鐮孢的新的Δ12去飽和酶。特別地,用Yarrowia查詢序列搜索串珠鐮孢菌株M-8114的專有的DuPont已表達序列標志(EST)文庫(E.I.du Pont deNemours and Co.,Inc.,Wilmington,DE)的推定的編碼的蛋白質序列。這導致鑒定了兩種同源序列Fm1(SEQ ID NO2)和Fm2(SEQ IDNO4),它們分別由核苷酸序列SEQ ID NOs1和3編碼。
還將Yarrowia Δ12去飽和酶序列用作針對一些絲狀真菌的公共數據庫的查詢序列;特別地,在構巢曲霉(SEQ ID NOs6 and 8)、Magnaporthe grisea(SEQ ID NOs10和12)、粗糙脈孢霉(SEQ IDNOs14和16)、禾本科鐮孢(SEQ ID NOs18和20)、煙曲霉(SEQ IDNO21)和黃曲霉(SEQ ID NO22)中鑒定了同源蛋白質序列。使用Clustal W(slow,accurate,Gonnet option;Thompson等人Nucleic Acids Res.224673-4680(1994))的方法,基于這些序列(即,SEQ ID NOs2,4,6,8,10,12,14,16,18,20,21和22)的比較的隨后的種系發生和同源性分析揭示具有與Yarrowia Δ12去飽和酶的同源性的蛋白質的兩個不同的“亞家族”。特別地,“亞家族1”的所有蛋白質(SEQ ID NOs2,6,10,14和18)相互具有至少46.2%同一性,并且與“亞家族2”的蛋白質(SEQ ID NOs4,8,12,16,20,21和22)具有小于39.6%的同一性(圖4和5;Clustal比對方法(上文))。亞家族2的蛋白質相互具有至少56.3%同一性(見實施例4)。
因為Yarrowia僅能合成18:2(但不是18:3),而多數上述絲狀真菌可以合成18:2和ALA,并且因為Yarrowia具有一種Δ12去飽和酶而多數絲狀真菌具有與Yarrowia Δ12去飽和酶的兩種同源物,所以本申請人推測這些生物中去飽和酶的亞家族之一代表Δ12去飽和酶,另一個亞家族代表Δ15去飽和酶。通過使用表達分析測定了兩個亞家族的每一個內代表性蛋白質的活性檢驗了該假說。特別地,Fm1和Mg1在Yarrowia lipolytica中表達并且發現它們編碼Δ15去飽和酶(見共同待決的美國臨時申請60/519191);類似地,2003年12月4日的公開WO 03/099216提示本文鑒定的序列,因為亞家族1粗糙脈孢霉和構巢曲霉序列具有Δ15去飽和酶活性。相比,Fm2如本文描述的在Y.lipolytica中表達并且經表征為Δ12去飽和酶。亞家族2粗糙脈孢霉序列的Δ12去飽和酶活性在WO 03/099216中類似地得到證實。
使用Clustal比對方法(Thompson等人,Nucleic Acids Res.224673-4680(1994))將串珠鐮孢Δ12去飽和酶推導的氨基酸序列(SEQ ID NO4)與公共數據庫序列比較。從而,串珠鐮孢Δ12去飽和酶氨基酸序列基于百分數同一性最相似于本文中以SEQ ID NO20提供的禾本科鐮孢Δ12去飽和酶(在477個氨基酸長度上95%同一性)。更優選的氨基酸片段與本文的序列至少約96%同一,而97%-98%同一的那些序列是尤其適宜的,最優選約99%同一的那些序列。
以相似方式,使用Clustal比對方法,將串珠鐮孢Δ12去飽和酶核苷酸堿基序列與公共數據庫的比較揭示最相似的已知核酸序列(禾本科鐮孢基因組計劃中的重疊群1.233;本文的SEQ ID NO19)與本文報導的串珠鐮孢Δ12去飽和酶的核酸序列(SEQ ID NO3)至少89.2%同一。對應于當前ORF的優選Δ12去飽和酶編碼核酸序列為編碼活性蛋白質并且與編碼本文報導的串珠鐮孢Δ12去飽和酶的核酸序列具有至少約89%-90%同一性的那些序列,其中具有91%-95%同一性的那些序列尤其合適,具有大于95%同一性的那些序列最優選。
同源物的鑒定和分離本發明的Δ12去飽和酶核酸片段可以用于鑒定和分離編碼來自相同或者其他細菌、藻類、真菌或者植物種類的同源蛋白質的基因。
鑒定技術例如,本文描述的串珠鐮孢Δ12去飽和酶的氨基酸或者核苷酸序列的實質部分可以用于推定性鑒定相關的多肽或者基因,可以通過本領域技術人員對序列的手工評估,或者通過使用諸如BLAST的算法(Basic Local Alignment Search Tool;Altschul,S.F.,等人,J.Mol.Biol.215403-410(1993))和ClustalW(DNASTAR軟件的Megalign程序)的計算機自動化序列比較和鑒定來進行所述鑒定。如上所述,使用Yarrowia lipolytica Δ12去飽和酶(SEQ ID NO52)允許鑒定一組真菌去飽和酶,其當分析時,聚簇為蛋白質的兩個不同的亞家族(即,亞家族1和亞家族2)。亞家族2包含上述串珠鐮孢Δ12去飽和酶以及這樣的蛋白質,其編碼DNA序列在下列內容中發現·構巢曲霉基因組計劃(Center for Genome Research(CGR),Cambridge,MA發起)中的重疊群1.15(scaffold 1)(AAG36933)(SEQ ID NO8);·Magnaporthe grisea基因組計劃(CGR and International RiceBlast Genome Consortium發起)中重疊群中的基因座MG01985.1(SEQ ID NO12);·GenBank檢索號AABX01000374(粗糙脈孢霉)(SEQ ID NO16);·禾本科鐮孢 基因組計劃(the CGR and the InternationalGibberella zeae Genomics Consortium(IGGR)發起)中的重疊群1.233(SEQ ID NO20);·煙曲霉基因組計劃(Sanger Institute發起,the Universityof Manchester and The Institute of Genome Research(TIGR)合作)中的AFA.344248345586(反相)(SEQ ID NO21);和,·GenBank檢索號AY280867(黃曲霉)(SEQ ID NO22)。
假設上面的蛋白質的每一種都編碼Δ12去飽和酶。該假設在WO03/099216對粗糙脈孢霉進行了證實。
對上面蛋白質的分析揭示,根據Clustal比對方法(上文),這些蛋白質與串珠鐮孢Δ12去飽和酶(SEQ ID NO4)具有至少56.3%序列同一性(圖5)。此外,將本發明中亞家族2的Δ12去飽和酶與其他已知的Δ12去飽和酶比較;然而,此處亞家族2的Δ12去飽和酶與Yarrowia lipolytica Δ12去飽和酶(51.6%同一性;圖6)比與任意其他已知的Δ12去飽和酶的同源性更高。本領域技術人員將能夠使用相似的方法鑒定將在亞家族2中聚簇的其他直向同源蛋白質(在此處鑒定為Δ12去飽和酶)。
備選地,本發明去飽和酶序列的任一種(即,SEQ ID NOs3,4,7,8,11,12,15,16,19,20,21和22)可以用作同源物鑒定中的雜交試劑。核酸雜交試驗的基本成分包括探針、懷疑含有目的基因或基因片段的樣品和特定雜交方法。本發明的探針通常是單鏈核酸序列,其與待檢測的核酸序列互補。探針與待檢測的核酸序列是“可雜交的”。探針長度可以從5個堿基到數萬堿基不等,并且將取決于所進行的特定試驗。通常,約15個堿基到約30個堿基的探針長度是合適的。僅部分探針分子需要與待檢測的核酸序列互補。此外,探針和靶序列之間的互補性不必是完全的。在不完全互補的分子之間發生雜交,結果雜交區中的一部分堿基不與適當的互補堿基配對。
雜交方法是成熟的。通常,探針和樣品必須在將允許核酸雜交的條件下混合。這包括在無機或者有機鹽存在下在適當的濃度和溫度條件下將探針和樣品接觸。探針和樣品核酸必須接觸足夠長的時間使得可以發生探針和樣品核酸之間發生任何可能的雜交。混合物中探針或者靶標的濃度將決定發生雜交所必要的時間。探針或者靶標濃度越高,需要的雜交孵育時間越短。任選地,可以加入離液劑。離液劑通過抑制核酸酶活性穩定核酸。此外,離液劑允許室溫下短寡核苷酸探針的靈敏和嚴格雜交(Van Ness和Chen,Nucl.Acids Res.195143-5151(1991))。適宜的離液劑包括氯化胍、硫氰酸胍、硫氰酸鈉、四氯代乙酸鋰、高氯酸鈉、四氯代乙酸銣、碘化鉀和三氟乙酸銫,等等。通常,離液劑將以約3M的終濃度存在。如果希望,可以將甲酰胺加入到雜交混合物,濃度通常為30-50%(v/v)。
可以使用多種雜交溶液。通常,這些包含約20到60%體積,優選30%的極性有機溶劑。常用的雜交溶液使用約30-50%v/v甲酰胺,約0.15到1M氯化鈉,約0.05到0.1M緩沖液(例如,檸檬酸鈉,Tris-HCl,PIPES或HEPES(pH范圍約6-9)),約0.05到0.2%去污劑(例如,十二烷基硫酸鈉),或0.5-20mM EDTA,FICOLL(PharmaciaInc.)(約300-500kdal),聚乙烯吡咯酮(約250-500kdal),和血清白蛋白。典型雜交溶液中還包括的將是約0.1到5mg/mL未標記的載體核酸、片段化核DNA(例如,小牛胸腺或鮭精DNA,或酵母RNA),和任選約0.5到2%wt/vol甘氨酸。還可以包括其他添加劑,如體積排阻劑,其包括多種極性水溶性或者膨脹劑(例如,聚乙二醇),陰離子聚合物(例如,聚丙烯酸酯或者聚異丁烯酸酯)和陰離子糖類聚合物(例如,硫酸葡聚糖)。
核酸雜交適于多種測定形式。一種最適宜的是夾層測定形式。夾層測定尤其適于在非變性條件下雜交。夾層型測定的主要成分是固相支持體。固相支持體已經在其上吸附或者偶聯了固定化核酸探針,其是未標記的或者與序列的一部分互補。
分離方法本發明的串珠鐮孢Δ12去飽和酶核酸片段(或者本文鑒定的任意Δ12去飽和酶[SEQ ID NOs7,8,11,12,15,16,和19-22])可以用于分離編碼來自相同或者其他細菌、藻類、真菌或者植物種類的同源蛋白質的基因。使用序列依賴性方案分離同源基因是本領域公知的。
序列依賴性方案的實例包括,但不限于1)核酸雜交方法;2)DNA和RNA擴增方法,如通過核酸擴增技術的多種用途例證[例如,聚合酶鏈式反應(PCR),Mullis等人,美國專利4,683,202;連接酶鏈反(LCR),Tabor,S.等人,Proc.Acad.Sci.USA 821074(1985);或者鏈置換擴增(SDA),Walker,等人,Proc.Natl.Acad.Sci.U.S.A.,89392(1992)];和3)文庫構建和通過互補作用篩選的方法。
例如,使用本領域技術人員公知的方法,通過用本發明核酸片段的全部或者一部分作為DNA雜交探針篩選來自任意希望的酵母或者真菌的文庫,可以直接分離編碼與本文描述的去飽和酶相似的蛋白質或者多肽的基因(其中將優選產生LA[或者LA衍生物]的那些酵母或者真菌)。通過本領域已知的方法(Maniatis,上文)可以設計和合成基于本發明核酸序列的特異寡核苷酸探針。此外,完整序列可以直接用于由技術人員合成DNA探針(例如,隨機引物DNA標記、缺口翻譯或者末端標記技術),或者使用可利用的體外RNA轉錄系統合成RNA探針。此外,可以設計并使用特異引物擴增本發明序列的部分(或者全長序列)。所得擴增產物可以在擴增反應期間直接標記或者在擴增反應后標記,并用作探針在適宜嚴格性的條件下分離全長DNA片段。
通常,在PCR型擴增技術中,引物具有不同序列并且不相互互補。取決于所希望的測試條件,應該設計引物的序列以提供靶核酸的有效和可靠的復制。PCR引物設計方法是本領域常見和公知的(Thein和Wallace,“The use of oligonucleotide as specifichybridization probes in the Diagnosis of Genetic Disorders”,in Human Genetic DiseasesA Practical Approach,K.E.DavisEd.,(1986)pp 33-50,IRLHerndon,VA;and Rychlik,W.,InMethods in Molecular Biology,White,B.A.Ed.,(1993)Vol.15,pp 31-39,PCR ProtocolsCurrent Methods andApplications.HumaniaTotowa,NJ)。
通常本發明序列的兩種短片段可以用于聚合酶鏈式反應方案中來從DNA或者RNA擴增編碼同源基因的更長的核酸片段。還可以對所克隆的核酸片段文庫進行聚合酶鏈式反應,其中一種引物的序列來自本發明核酸片段,另一種引物的序列利用了編碼微生物基因的mRNA前體的3,末端的聚腺苷酸序列。
備選地,第二種引物序列可以基于來自克隆載體的序列。例如,技術人員可以通過使用PCR擴增轉錄物的單個點和3’或5’末端之間區域的拷貝,按照RACE方案(Frohman等人,PNAS USA 858998(1988))來產生cDNA。可以從本發明序列設計3’和5’方向取向的引物。使用通過商業途徑可獲得的3’RACE或5’RACE系統(Gibco/BRL,Gaithersburg,MD),可以分離特定3’或5’cDNA片段(Ohara等人,PNAS USA 865673(1989);Loh等人,Science 243217(1989))。
本發明核苷酸和推導的氨基酸序列的有效性方便了DNA表達文庫的免疫學篩選。可以合成代表本發明氨基酸序列的部分的合成肽。這些肽可以用于免疫動物以產生對包含所述氨基酸序列的肽或者蛋白質具有特異性的多克隆或者單克隆抗體。這些抗體可以用于篩選DNA表達文庫來分離全長目的DNA克隆(Lerner,R.A.Adv.Immunol.361(1984);Maniatis,上文)。
用于提高異源表達的基因優化多種技術可用于提高特定目的Δ12去飽和酶在備選宿主中的表達。兩種此類技術包括密碼子優化和基因誘變。
密碼子優化對于一些實施方案,可能希望修飾例如,編碼具有Δ12去飽和酶活性的多肽的密碼子的部分,以便增強編碼這些多肽的基因在備選宿主(即,油質酵母)中的表達。
通常,通過檢查蛋白質(優選以錄大量表達的那些蛋白質)的密碼子選擇并確定那些密碼子以最高頻率使用可以確定特定目的宿主物種中的宿主優選的密碼子。然后,可以使用該宿主物種中優選的密碼子完整或者部分合成具有去飽和酶活性的目的多肽的編碼序列。還可以合成DNA的全部(或者部分)以除去將在所轉錄的mRNA中存在的任何不穩定序列或者二級結構區。可以合成DNA的全部(或者部分)以將堿基組成改變成所希望的宿主細胞中更優選的堿基組成。
在本發明的優選實施方案中,來自例如串珠鐮孢,構巢曲霉,Magnaporthe grisea,粗糙脈孢霉,禾本科鐮孢,煙曲霉和黃曲霉的Δ12去飽和酶可以經密碼子優化后在異源油質酵母宿主,例如Yarrowia lipolytica中表達。
誘變合成序列并將序列聚集的方法是文獻中非常確實的。例如,體外誘變和選擇、定點誘變、易錯PCR(Melnikov等人,Nucleic AcidsResearch,27(4)1056-1062(February 15,1999)),“基因改組”(U.S.5,605,793;U.S.5,811,238;U.S.5,830,721;和U.S.5,837,458)或者其他方法可以用于得到天然發生的去飽和酶,如本文描述的Δ12去飽和酶的基因的突變。這將允許在體內產生具有去飽和酶活性的多肽,其具有在宿主中發揮功能所需的多種所希望的物理和動力學參數(例如,更長的半壽期或者產生所希望的PUFA的更高速率)。
如果希望,可以通過常規誘變、所得突變多肽的表達和確定它們的活性可以確定對于酶活性重要的去飽和酶多肽的區域。突變體可以包括缺失、插入和點突變,或者其組合。典型的功能分析以缺失誘變開始,該缺失誘變用于確定所述蛋白質的功能必需的N-和C-末端界限,然后產生內部缺失、插入或者點突變體以進一步確定功能必需的區域。還可以使用其他技術,如盒誘變或者總合成。例如,通過使用外切核酸酶以順序除去5’或者3’編碼區可以完成缺失誘變。此類技術可以使用試劑盒。缺失后,通過將含有起始或者終止密碼子的寡核苷酸連接到分別5’或3’缺失后缺失的編碼區,可以完成編碼區。備選地,通過包括定點誘變、誘變PCR的多種方法或者通過連接到消化的DNA的現有的限制性位點上可以將編碼起始或者終止密碼子的寡核苷酸插入到編碼區。通過多種方法可以進行相似的內部插入,所述方法包括使用DNA中的現有限制性位點,通過使用誘變引物經定點誘變或者誘變PCR。通過諸如接頭分區誘變、定點誘變或者誘變PCR的技術可以進行點突變。化學誘變也可以用于鑒定對于活性重要的去飽和酶多肽區。表達突變構建體,并測定所得改變的蛋白質發揮去飽和酶功能的能力。此類結構-功能分析可以確定可以缺失哪些區,那些區耐受插入,和那些點突變允許突變蛋白質以與天然去飽和酶基本相同的方式發揮功能。來自本文描述的去飽和酶基因的所有此類突變蛋白質和編碼它們的核苷酸序列都在本發明范圍內。
從而,本發明包含如在所附序列表中報導的Δ12去飽和酶基因的完整序列、那些完整序列的互補序列、那些序列的實質性部分、源于它們的密碼子優化的去飽和酶,和與它們基本上同源的那些序列。
ω-3和/或ω-6脂肪酸的微生物生產ω-3和/或ω-6脂肪酸的微生物生產與從天然來源如魚或者植物純化相比具有一些優點。例如1.)與高級生物相比,已知許多微生物具有極大簡化的油組成,使得所希望的組分的純化更容易;2.)微生物生產不受外部變量,如天氣或者食物供應導致的波動;3.)微生物產物的油基本上無環境污染物的污染;4.)微生物可以提供特定形式的PUFA,其可以具有特定用途;和
5.)通過控制培養調節,特別是通過提供用于微生物表達的酶的特定底物,或者通過加入化合物或者用基因工程方法抑制不希望的生物化學途徑,可以操控微生物油生產。
除了這些優點,從重組微生物生產ω-3和/或ω-6脂肪酸提供了改變天然產生的微生物脂肪酸圖的能力,通過改變宿主中新的生物合成經,或者通過抑制不希望的途徑,從而增加所希望的PUFA的水平(或者其綴合形式)和降低不希望的PUFA的水平(見,共同待決的美國專利申請10/840579,這里完整引入作為參考)可以實現所述目睹。
產生多種ω-3和/或ω-6脂肪酸的方法預計引入處于適當啟動子控制下的編碼本文描述的Δ12去飽和酶的嵌合基因將導致所轉化的宿主生物中LA的產生增加。同樣地,本發明包括指導PUFA產生的方法,其包括將脂肪酸底物(即,油酸)暴露于此處描述的PUFA酶(例如,串珠鐮孢Δ12去飽和酶),從而底物轉化成所希望的脂肪酸產物(即,LA)。更特別地,本發明的一個目的是提供在油質酵母中產生LA的方法,其中為所述油質酵母提供了(a)編碼具有Δ12去飽和酶活性的真菌蛋白質的分離的核酸片段,當基于Clustal比對方法將所述蛋白質與具有SEQ ID NO4中給出的序列的多肽比較時具有至少56.3%同一性;和(b)由油酸組成的去飽和酶底物來源;其中酵母在一定條件下生長,使得嵌合去飽和酶基因表達并且油酸轉化成LA,并且其中任選回收LA。從而,該方法最少包括使用下面的Δ12去飽和酶如本文描述的SEQ ID NOs4、8、12、16、20、21和22。
備選地,每種PUFA基因和其相應的在本文描述的酶產物可以間接用于產生ω-3和/或ω-6 PUFA。發生PUFA的間接產生,其中脂肪酸底物通過中間步驟或者中間途徑間接轉化成目的脂肪酸產物。從而,預期本文描述的Δ12去飽和酶與編碼其他酶的一種或多種基因一起表達,從而發生一系列反應以產生所希望的產物。在優選實施方案中,例如,宿主生物可以用包含編碼PUFA生物合成途徑的酶的基因以導致更高水平地產生ω-3和/或ω-6脂肪酸(例如,GLA、DGLA、ARA、ALA、STA、ETA、EPA、DPA和DHA)。特別地,例如,可以希望在宿主細胞中表達任一種本文描述的Δ12去飽和酶,所述宿主細胞還表達1)編碼用于過量產生GLA的Δ6去飽和酶的基因;2)表達盒,其包含編碼用于過量產生DGLA的Δ6去飽和酶和高親和性延伸酶的基因;3)編碼用于過量產生ARA的Δ6去飽和酶、高親和性延伸酶和Δ5去飽和酶的基因;或4)編碼用于過量產生EPA的Δ6去飽和酶、高親和性延伸酶、Δ5去飽和酶和Δ17去飽和酶的基因。在備選實施方案中,例如,可以希望在細胞中過量表達如本文描述的Δ12去飽和酶,所述細胞還表達1)編碼用于過量產生ALA的Δ15去飽和酶的基因2)編碼用于過量產生STA的Δ15去飽和酶和Δ6去飽和酶的基因;3)編碼用于過量產生ETA的Δ15去飽和酶、Δ6去飽和酶和高親和性延伸酶的基因;4)編碼用于過量產生EPA的Δ15去飽和酶、Δ6去飽和酶、高親和性延伸酶和Δ5去飽和酶的基因。如本領域技術人公知的,下面酶活性的多種其他組合可以用于在宿主中與本文的去飽和酶一起表達Δ15去飽和酶、Δ4去飽和酶、Δ5去飽和酶、Δ6去飽和酶、Δ17去飽和酶、Δ9去飽和酶、Δ8去飽和酶和/或延伸酶(圖2)。在特定表達盒中包括的特定基因將取決于宿主細胞(和它的PUFA圖和/或去飽和酶圖)、底物的可用性,和所希望的終產物。
在備選實施方案中,有用的是基于本文描述的完整序列、那些完整序列的互補序列、那些序列的實質性部分、來源于所述序列的密碼子優化的去飽和酶和與所述序列基本上同源的那些序列,可以破壞宿主生物的天然Δ12去飽和酶。例如,宿主生物中Δ12去飽和酶的定向那破壞產生不能合成LA的突變菌株。
表達系統、盒和載體可以在異源微生物細胞,尤其在油質酵母(例如,Yarrowialipolytica)的細胞中產生本文描述的本發明序列的基因和基因產物。重組微生物宿主中的表達可以用于產生多種PUFA途徑中間產物,或者用于調節宿主中現有的PUFA途徑用以合成迄今使用該宿主不可能合成的新產物。
含有指導外源蛋白質的高水平表達的調節序列的微生物表達系統和表達載體是本領域技術人員公知的。這些表達系統和表達載體的任一種都可以用于構建嵌合基因用來產生本發明序列的基因產物的任一種。這些嵌合基因可以然后通過轉化導入適宜的微生物以提供所編碼酶的高水平表達。
用于轉化適宜的宿主細胞的載體或者DNA盒是本領域公知的。構建體中存在的序列的特定選擇取決于所希望的表達產物(上文)、宿主細胞的性質和所建議的分離轉化細胞與未轉化細胞的方法。然而,通常,載體或者表達盒含有指導相關基因轉錄和翻譯的序列、選擇性標記和允許自主復制或者染色體整合的序列。適宜的載體包含控制轉錄起始的基因5’區和控制轉錄終止的DNA片段3’區。當兩個控制區都來自所轉化的宿主細胞的基因時是最優選的,盡管將理解此類控制區不必來自選擇生產宿主的特定物種天然的基因。
用于驅動本發明ORF在所希望的宿主細胞中表達的起始控制區或者啟動子有許多并且是本領域技術人員熟悉的。幾乎能夠指導這些基因在所選宿主細胞中表達的任何啟動子都適于本發明。可以以瞬時或者穩定的方式完整宿主細胞中的表達。通過誘導與目的基因可操作地連接的可調節的啟動子的活性可以完成瞬時表達。通過使用與目的基因可操作地連接的組成型啟動子可以實現穩定表達。作為實例,當宿主細胞是酵母時,提供了在酵母細胞中有功能的轉錄和翻譯區,尤其來自宿主物種的轉錄和翻譯區。例如可以從如下得到轉錄起始調節區1)糖酵解途徑中的基因,如醇脫氫酶、甘油醛-3-磷酸-脫氫酶(見美國專利申請號10/869630)、磷酸甘油酸變位酶(見美國專利申請號10/869630)、果糖二磷酸醛縮酶(見美國專利申請號60/519971)、磷酸葡萄糖異構酶、磷酸甘油酸酯激酶、甘油-3-磷酸O-酰基轉移酶(見美國專利申請號60/610060),等等;或者2)可調節的基因,如酸性磷酸酶、乳糖酶、金屬硫蛋白、葡萄糖淀粉酶、翻譯延伸因子EF1-α(TEF)蛋白質(U.S.6,265,185)、核糖體蛋白質S7(U.S.6,265,185)等等。可以使用多種調節序列的任一種,這取決于希望組成型還是誘導型轉錄、啟動子在表達目的ORF中的效率、構建的容易性,等等。
已經發現翻譯起始密碼子ATG周圍的核苷酸序列影響酵母細胞中的表達。如果本發明Δ12去飽和酶的任一種在酵母中表達很弱,那么可以修飾外源基因的核苷酸序列以包括有效的酵母翻譯起始序列從而得到最佳的基因表達。為了在酵母中表達,這可以通過無效表達的基因的定點誘變來進行,通過將所述基因融合在內源酵母基因,優選高度表達的基因的框內來進行所述定點誘變。備選地,可以確定宿主中共有翻譯起始序列并將該序列改造成異源基因用于它們在目的宿主中的最佳表達(關于可應用于Yarrowia lipolytica的特定教導見,例如,美國專利申請號10/840478)。
終止區可以來自基因的3’區,其中起始區從所述基因得到或者來自不同的基因。多種終止序列是已知的并且在多種宿主中令人滿意地發揮功能(當用于與它們所來源的相同或不同的屬和種時)。通常選擇終止區更多是由于方便而不是因為任何具體性質。優選地,終止區來自酵母基因,尤其酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)、假絲酵母屬(Candida)、Yarrowia或者克魯維酵母屬(Kluyveromyces)。還已知編碼γ-干擾素和α-2干擾素的哺乳動物基因的3’區在酵母中有功能。終止控制區還可以來自優選宿主天然的多種基因。任選地,終止位點可以是不必要的;然而,最優選包括終止位點。
如本領域技術人員已知的,僅將基因插入到克隆載體不能確保它將以所需的水平成功地表達。響應更高表達率的需要,通過操作許多不同的遺傳元件已經產生了許多專門的表達載體,所述遺傳元件控制轉錄、翻譯、蛋白質穩定性、氧限制、和從宿主細胞的分泌。更特別地,已經操作用以控制基因表達的一些分子特征包括1)相關轉錄啟動子和終止子序列的性質;2)所克隆的基因拷貝數和該基因是包含在質粒中還是整合到宿主的染色體中;3)所合成的外源蛋白質的最終細胞定位;4)宿主生物中翻譯效率;5)宿主細胞內所克隆的基因蛋白質的內在穩定性;和6)所克隆基因內的密碼子選擇,從而它的頻率接近宿主細胞的優選密碼子選擇的頻率。這些類型修飾的每一種都包括在本發明中,作為進一步優化本文所述的Δ12去飽和酶的表達的方式。
微生物宿主的轉化一旦已經得到了編碼適于在油質酵母中表達的多肽的DNA,就將它置于能夠在宿主細胞中自主復制的質粒載體中,或者它直接整合到宿主細胞的基因組中。表達盒的整合可以在宿主基因組內隨機發生或者可以通過使用含有與宿主基因的同源性區的構建體靶定,所述同源性足夠與宿主基因座的靶定重組。當構建體靶向內源基因座時,通過內源基因座可以提供所有或者一些轉錄和翻譯調節區。
當從分開的復制載體表達兩種和多種基因時,希望每種載體具有不同的分泌方式并且應該缺少與其他載體的同源性從而保持穩定表達和防止構建體間元件的再分布。可以通過實驗確定調節區的慎重選擇、選擇方法和增殖方法,從而所有導入的基因以提供目的產物合成必要的水平表達。
包含目的基因的構建體可以通過標準技術導入宿主細胞。這些技術包括轉化(例如,乙酸鋰轉化[Methods in Enzymology,194186-187(1991)])、原生質體融合、生物射彈轟擊(biolisticimpact)、電穿孔、微注射或者將目的基因導入宿主細胞的任意其他方法。適于油質酵母(即,Yarrowia lipolytica)的更特別的教導包括美國專利號4,880,741和5,071,764和Chen,D.C.等人(ApplMicrobiol Biotechnol.48(2)232-235-(1997))。
為了方便,已經通過任意方法操作以吸收DNA序列(例如,表達盒)的宿主細胞將在本文稱作“轉化的”或者“重組的”。所轉化的宿主將具有表達構建體的至少一個拷貝并且可以具有兩個或多個拷貝,這取決于所述基因整合到基因組、擴增,還是存在于具有多個拷貝數的染色體外元件上。通過選擇所導入的構建體上含有的標記可以鑒定轉化的宿主細胞。備選地,可以有目的構建體共同轉化單獨的標記構建體,因為許多轉化技術向宿主細胞導入許多DNA分子。通常,對轉化的宿主選擇它們在選擇性培養基上生長的能力。選擇性培養基可以摻入抗生素或者缺少未轉化的宿主的生長必需的因子,如營養物或者生長因子。所導入的標記基因可以賦予抗生素抗性,或者編碼必需生長因子或者酶,從而當在所轉化的宿主中表達時允許在選擇性培養基上生長。當可以直接或者間接檢測表達的標記蛋白質時,也可以發生經轉化的宿主細胞的選擇。標記蛋白質可以單獨或者作為與另一種蛋白質的融合蛋白表達。標記蛋白質可以通過如下檢測1)它的酶促活性(例如,β半乳糖苷酶可以將底物X-gal[5-溴-4-氯-3-吲哚基-β-D-吡喃半乳糖苷]轉化成有色產物;螢光素酶可以螢光素轉化成發光產物);或者2)它的光產生或者修飾特征(例如,Aequorea victoria的綠色熒光蛋白當用藍光照射時發熒光)。備選地,可以用抗生素檢測例如,目的蛋白質上的標記蛋白質或者分子標簽。可以例如,通過視覺或者通過諸如FACS或者使用抗體淘選可以選擇表達標記蛋白質或者標簽的細胞。對于酵母轉化株的選擇,可以使用在酵母中有功能的任意標記。理想地,對卡那霉素、潮霉素和氨基糖苷G418的抗性是重要的以及在缺少尿嘧啶或者亮氨酸的培養基上生長的能力。
轉化后,適于本發明Δ12去飽和酶(和任選地在宿主細胞內共表達的其他PUFA酶)的底物可以由宿主天然地或者轉基因地產生,或者它們可以外源地提供。
微生物中ω-3和/或ω-6脂肪酸生物合成的代謝工程化本發明Δ12去飽和酶的序列的知識將可以用于操作油質酵母,尤其Yarrowia lipolytica中ω-3和/或ω-6脂肪酸生物合成。這可能需要PUFA生物合成途徑內的直接代謝工程化或者對PUFA生物合成途徑貢獻碳的途徑的額外操作。用于操作生物化學途徑的方法是本領域技術人員公知的。
用于上調所希望的生物合成途徑的技術可以將去飽和酶(任選延伸酶)的額外拷貝導入宿主中以增加ω-3和/或ω-6脂肪酸生物合成途徑的輸出,通常通過使用多拷貝質粒。去飽和酶和延伸酶基因的表達也可以通過使用更強的啟動子(受調節的或者組成型的)在轉錄水平上增加,以導致增加的表達,通過從所述mRNA或者編碼的蛋白質除去/缺失區去穩定序列,或者通過向所述mRNA加入穩定序列(U.S.4,910,141)也可以增加所述表達。增加異源去飽和酶或者延伸酶基因的表達的再一種方法是通過將天然基因中的密碼子用用于在所選宿主微生物中最佳基因表達的密碼子代替來增加所編碼mRNA的翻譯效率。
下調不希望的生物合成途徑的技術相反地,與ω-3和/或ω-6脂肪酸生物合成途徑競爭能量或者碳的生物化學途徑,或者干擾特定PUFA終產物的產生的天然PUFA生物合成途徑酶可以通過基因破壞消除或者通過其他方法(例如,反義mRNA)下調。對于基因破壞,將外源DNA片段(通常選擇性標記基因)插入到待破壞的結構基因中以便中斷它的編碼序列并從而功能地失活所述基因。將破壞盒轉化到宿主細胞導致通過與非功能破壞的基因的同源重組代替功能的天然基因(見,例如Hamilton等人J.Bacteriol.1714617-4622(1989);Balbas等人Gene 136211-213(1993);Gueldener等人Nucleic Acids Res.242519-2524(1996);和Smith等人Methods Mol.Cell.Biol.5270-277(1996))。
反義技術是當已知靶基因的序列時下調基因的另一種方法。為了完成該目的,將來自所希望的基因的核酸片段克隆并可操作地連接啟動子從而將轉錄RNA的反義鏈。然后將該構建體導入宿主細胞并產生RNA的反義鏈。反義RNA通過防止編碼目的蛋白質的mRNA的積累抑制基因表達。本領域技術人員將知道特定考慮與反義技術的用途結合以便減小具體基因的表達。例如,反義基因表達的適宜水平可以需要使用不同的嵌合基因,利用技術人員已知的不同調節元件。
盡管靶定基因破壞和反義技術提供了當已知序列時下調基因的有效方法,但是已經開發了不是基于序列的特異性較低的方法。例如,可以將細胞暴露于紫外照射然后篩選所希望的表型。用化學劑誘變對于產生突變體也是有效的并且是常用的物質,包括影響非復制的DNA的化學品(例如,HNO2和NH2OH),以及影響正復制的DNA的試劑(例如,吖啶類染料,已知其導致移碼突變)。使用輻射或者化學試劑產生突變體的特定方法在本領域中詳細記載。參加,例如Thomas D.Brock inBiotechnologyA Textbook of IndustrialMicrobiology,2nded.(1989)Sinauer AssociatesSunderland,MA;or Deshpande,Mukund V.,Appl.Biochem.Biotechnol.,36227(1992)。
基因破壞的另一種非特異方法是使用轉座元件或者轉座子。轉座子是隨機插入DNA但是可以基于序列確定發生插入的位置在以后恢復的遺傳元件。體內和體外轉座方法都是已知的。兩種方法包括使用轉座元件聯合轉座酶。當轉座元件或者轉座子在轉座酶存在下與核酸片段接觸時,轉座元件將隨機插入到該核酸片段中。該技術用于隨機誘變和基因分離,因為可以基于轉座元件的序列鑒定所破壞的基因。用于體外轉座的試劑盒可以通過商業途徑獲得[見,例如1)PrimerIsland Transposition試劑盒,其可以從Perkin Elmer AppliedBiosystems,Branchburg,NJ得到,基于酵母Ty1元件;2)GenomePriming System,其可以從New England Biolabs,Beverly,MA得到,基于細菌轉座子Tn7;和3)EZ::TN Transposon InsertionSystems,其可以從Epicentre Technologies,Madison,WI獲得,基于Tn5細菌轉座元件]。
在本發明上下文中,有用的是通過上述方法之一調節脂肪酸生物合成途徑的表達。例如,本發明提供了編碼所述生物合成途徑中的關鍵酶的基因(即,Δ12去飽和酶),導致產生ω-3和/或ω-6脂肪酸。尤其有用的是在油質酵母中表達產生不足量的18:2脂肪酸的這些基因,和使用用于宿主生物的代謝工程化的多種方法調節這種和其他PUFA生物合成基因的表達以最大化優選PUFA產物的產生。同樣地,為了最大化這些基因的PUFA產生,有必要破壞競爭指向PUFA生物合成的碳流的途徑。
在備選實施方案中,可能希望破壞本文的Δ12去飽和酶,以防止ω-3和/或ω-6脂肪酸的合成。在另一備選實施方案中,可能通過將任一種本發明的Δ12去飽和酶基因置于可誘導的或者受調節的啟動子控制下調節ω-3和/或ω-6脂肪酸的產生。
用于重組表達Δ12去飽和酶的優選微生物宿主用于表達本發明基因和核酸片段的宿主細胞可以包括在多種原料,包括簡單和復雜糖類、有機酸和醇,和/或烴上在寬范圍的溫度和pH值下生長的微生物宿主。盡管已經分離了用于在油質酵母,尤其Yarrowia lipolytica中表達的本發明中描述的基因,但是預計因為轉錄、翻譯和蛋白質生物合成裝置是高度保守的,所以任意細菌、酵母、藻類和/或絲狀真菌將是用于表達本發明核酸片段的適宜的宿主。
優選的宿主是油質生物,如油質酵母。這些油質生物天然地能夠進行油合成和積累,其中油可以占細胞干重的約25%以上,或者優選細胞干重的約30%以上,最優選細胞干重的約40%以上。通常鑒定為油質酵母的屬包括,但不限于Yarrowia、假絲酵母屬、紅酵母屬、紅冬孢酵母屬、隱球菌屬、毛孢子菌屬和油脂酵母屬。更特別地,闡明性油合成酵母包括Rhodosporidium toruloides,Lipomycesstarkeyii,L.lipoferus,Candida revkaufi,C.pulcherrima,C.tropicalis,C.utilis,Trichosporon pullans,T.cutaneum,Rhodotorula glutinus,R.graminis和Yarrowia lipolytica以前分類為Candida lipolytica)。最優選地是油質酵母Yarrowialipolytica;在另一實施方案中,最優選稱作ATCC #76982、ATCC#20362、ATCC #8862、ATCC #18944和/或LGAM S(7)1的Yarrowialipolytica菌株(Papanikolaou S.,和Aggelis G.,Bioresour.Technol.82(1)43-9(2002))。
其他優選的微生物宿主包括油質細菌、藻類和其他真菌(例如,Thraustochytrium sp.,Schizochytrium sp.和Mortierellasp.)。
用于PUFA生產的發酵方法所轉化的微生物宿主細胞在優化脂肪酸生物合成基因活性和產生最大和最經濟的脂肪酸產率(例如,LA,其可以又增加多種ω-3和/或ω-6脂肪酸的產生)的條件下生長。通常,可以優化的培養基條件包括碳源的類型和量、氮源的類型和量、碳-氮比率、氧水平、生長溫度、pH、生物量生產期的長度、油積累期的長度和細胞收獲的時間。目的微生物,如油質酵母生長在復雜培養基(例如,酵母提取物-蛋白胨-葡萄糖培養基(YPD)或者缺少生長必需組分的確定的基本培養基并從而強迫選擇所希望的表達盒(例如,Yeast Nitrogen Base(DIFCO Laboratories,Detroit,MI))。
本發明中的發酵培養基必須含有適宜的碳源。適宜的碳源可以包括,但不限于單糖(例如,葡萄糖、果糖),二糖(例如,乳糖或蔗糖),寡糖,多糖(例如,淀粉、纖維素或者其混合物),糖醇(例如,甘油)或者來自可更新的原料的混合物(例如,干酪乳清滲透物、玉米漿、甜菜糖蜜、大麥麥芽)。此外,碳源可以包括烴類、脂肪酸、脂肪酸酯、甘油一酯、甘油二酯、甘油三酯、磷脂和脂肪酸的多種商業來源,包括植物油(例如,大豆油)和動物脂肪。此外,碳底物可以包括一碳底物(例如,二氧化碳或者甲醇),已經為所述底物闡明了向關鍵生物化學中間物的代謝轉化。因此,預計用于本發明的碳源可以包括多種含碳底物并且將僅受到宿主生物的選擇的限制。盡管預計所有上述碳底物和其混合物將適于本發明,但是優選的碳底物為糖和/或脂肪酸。最優選的是葡萄糖和/或含有10-22個碳的脂肪酸。可以從無機(例如,(NH4)2SO4)或者有機來源(例如,尿素或者谷氨酸)提供氮。除了適宜的碳和氮源,發酵培養基必須還含有適宜的礦物質、鹽、輔因子、緩沖劑、維生素、和本領域已知的其他組分,它們適于微生物的生長和促進PUFA產生必要的酶途徑。特別注意處理脂類和PUFA合成的一些金屬離子(例如,Mn+2,Co+2,Zn+2,Mg+2)(Nakahara,T.等人Ind.Appl.Single Cell Oils,D.J.Kyle and R.Colin,eds.pp 61-97(1992))。
本發明中優選的生長培養基是通常商業制備的培養基,如YeastNitrogen Base(DIFCO Laboratories,Detroit,MI)。也可以使用其他限定的或者合成生長培養基并且用于生長特定微生物的適宜培養基將是微生物學或者發酵科學領域技術人員已知的。用于發酵的適宜的pH范圍通常為約pH4.0到pH8.0,其中pH 5.5到pH 7.0優選為最初生長條件的范圍。發酵可以在需氧或者厭氧條件下進行,其中優選微需氧條件。
通常油質微生物中PUFA的高水平積累需要兩階段方法,因為代謝狀態必須在生長或者脂肪的合成/貯存之間“平衡”。從而,最優選地,兩階段發酵方法是在油質酵母中產生PUFA必需的。在該方法中,發酵的第一階段致力于產生和積累細胞量并且特征是快速細胞生長和細胞分裂。在發酵第二階段中,優選建立培養物中氮消除條件以促進高水平脂質積累。該氮消除的影響將是減小細胞中AMP的有效濃度,從而減小線粒體的NAD依賴性異檸檬酸脫氫酶的活性。當這發生時,檸檬酸將積累,從而形成細胞質中乙酰輔酶A的大量庫并引發脂肪酸合成。從而,該階段的特征是細胞分裂的停止,接著是合成脂肪酸和積累油。
盡管細胞通常在約30℃生長,但是一些研究已經顯示在較低溫度下不飽和脂肪酸的合成增加(Yongmanitchai和Ward,Appl.Environ.Microbiol.57419-25(1991))。基于方法經濟性,兩階段的第一階段后可能發生該溫度變動,此時已經發生了大量生物生長。
預計可以應喲個多種發酵方法設計,其中希望使用本發明Δ12去飽和酶基因進行ω脂肪酸的商業生產。例如,通過分批、補料分批和連續發酵方法可以產生從重組微生物宿主商業生產PUFA。
批發酵過程是一種密閉系統,其中培養基組分在該過程的開始設定并且除了為在該過程期間保持pH和氧氣水平,不進行其他加入。從而,在培養過程的開始,對培養基接種所希望的生物并允許生長或者代謝活性而不向培養基加入額外底物(即,碳源和氮源)。在批過程中,系統的代謝物和生物量組分不斷改變直到培養結束的時間。在典型的分批過程中,細胞通過靜止滯后期溫和發展到高生長對數期并最后發展到穩定期,其中生長速率減小或者停止。如果不處理,穩定期的細胞將最終死亡。標準分批方法的變通方法是補料分配方法,其中在發酵過程中向發酵罐不斷加入底物。補料分配方法也適于本發明。當分解代謝物抑制易于抑制細胞的代謝或者當希望任何時刻在培養基中有有效量的底物時,補料分配方法是有用的。測量補料分批系統中底物濃度是困難的并因此可以基于可測量的因素如pH、溶解氧和廢氣的部分壓強(例如,CO2)來估計。分批和補料分批培養方法是本領域常見和公知的并且實例可以見Thomas D.Brock,BiotechnologyATextbook of Industrial Microbiology,2nded.,(1989)SinauerAssociatesSunderland,MA;或Deshpande,Mukund V.,Appl.Biochem.Biotechnol.,36227(1992),將它們引入作為參考。
通過連續發酵方法也可以完成使用本發明Δ12去飽和酶進行ω脂肪酸的商業生產,在所述連續發酵方法中,將確定成分培養基連續加到生物反應器中而同時取出等量培養體積用于產品回收。連續培養通常以恒定的細胞密度保持細胞處于對數生長期。連續或者半連續培養方法允許調節影響細胞生長或者終產物濃度的一種因素或者任意多種因素。例如,一種方法可以限制碳源和允許所有其他參數來緩和代謝。在其他系統中,可以連續改變影響生長的許多因素而通過培養基濁度測量的細胞濃度保持恒定。連續系統力爭保持穩態生長從而細胞生長速率必須和由于從培養基分離培養物導致的損失之間保持平衡。調節連續培養方法的營養物和生長因子,以及最大化產生形成速率的技術是工業微生物學領域公知的并且Brock,上文中詳述了多種方法。
PUFAs的純化PUFA可以在宿主微生物中作為游離脂肪酸或者以酯化形式如酰基甘油、磷脂、硫脂或者糖脂形式發現,并且可以通過本領域公知的多種方法從宿主細胞提取出來。酵母脂質的提取技術、質量分析和可接受性標準的一個綜述為Z.Jacobs(Critical Reviews inBiotechnology 12(5/6)463-491(1992))的綜述。下游加工的簡要綜述見A.Singh和O.Ward(Adv.Appl.Microbiol.45271-312(1997))。
通常,純化PUFA的方法可以包括用有機溶劑提取、超生處理、超臨界流體提取(例如,使用二氧化碳)、皂化和物理方法,如壓力,或者它們的組合。尤其重要的是在水存在下用甲醇和氯仿提取(E.G.Bligh & W.J.Dyer,Can.J.Biochem.Physiol.37911-917(1959))。希望時,可以將含水層酸化以質子化帶負電的部分和從而增加所希望的產物向有機層的分配。提取后,可以在氮氣流下蒸發除去有機溶劑。當以綴合形式分離時,可以用酶或者化學切割產物以釋放游離脂肪酸或者較不復雜的目的綴合物,并且可以進行進一步操作以產生目的終產物。理想地,用氫氧化鉀斷裂脂肪酸的綴合形式。
如果需要進一步純化,可以使用標準方法。此類方法可以包括提取、用尿素處理、分步結晶、HPLC、分餾、硅膠層析、高速離心或者蒸餾,或者這些技術的組合。反應基,如酸性或者鏈烯基的保護可以通過已知技術(例如,烷基化或者碘化)在任意步驟進行。所用的方法包括脂肪酸的甲基化以產生甲酯。類似地,可以在任意步驟除去保護基。理想地,含有GLA、STA、ARA、DHA和EPA的級分的純化可以通過用尿素處理和/和級分蒸餾完成。
優選實施方案描述本文描述的工作的最終目的是開發積累富含ω-3和/或ω-6 PUFAs的油的油質酵母。為此,必須鑒定在油質酵母中有功能的去飽和酶,使得能夠在這些宿主中合成和大量積累優選的PUFA。對于探作宿主細胞中產生的ω-3與ω-6 PUFAs比率,也有必要鑒定有效的去飽和酶。
在以前工作中,申請人已經分離了天然Yarrowia lipolyticaΔ12去飽和酶并且過表達了該蛋白質,導致相對于野生型油酸向LA的轉化增加(美國專利申請10/840325,將其完整引入作為參考;也參見本文實施例2和SEQ ID NOs51和52)。特別地,底物轉化百分數(測量為([18:2]/[18:1+18:2])*100)在所轉化細胞中為74%,相比在野生型Yarrowia中底物轉化百分數為僅59%。盡管觀察到這些宿主細胞內LA可用性增加,然而,希望鑒定編碼具有Δ12去飽和酶活性的蛋白質的基因,所述基因將使得能夠產生油酸向LA的更大轉化。這將允許在Y.lipolytica轉化的細胞中LA作為用于高水平合成多種ω-3和/或ω-6 PUFAs(例如,GLA、DGLA、ARA、ALA、STA、ETA、EPA、DPA和DHA)的有效性增加。從而,具有高水平Δ12去飽和酶活性的異源蛋白質的表達在生物的途徑改造中是有利的。
為了實現該目標,在本發明中,申請人已經從串珠鐮孢分離和克隆了編碼Δ12去飽和酶(SEQ ID NOs3和4)的DNA片段。該基因作為Δ12去飽和酶的活性的證實基于1)當在破壞天然Δ12去飽和酶基因的Yarrowia lipolytica菌株中表達串珠鐮孢基因時恢復了LA生物合成(通過互補);和2)在表達串珠鐮孢基因的野生型Y.lipolytica細胞中過量產生LA(實施例6)。
然而,上述實驗導致令人驚奇的發現,其中串珠鐮孢Δ12去飽和酶比Yarrowia lipolytica Δ12去飽和酶在Yarrowia lipolytica中產生18:2更有效(見實施例6,表11)。特別地,確定了Yarrowialipolytica中TEF啟動子控制下的串珠鐮孢Δ12去飽和酶的表達產生比以前通過表達處于TEF啟動子控制下的編碼YarrowialipolyticaΔ12去飽和酶的嵌合基因可以得到的(LA的59%產物積累)更高水平的18:2(LA的68%產物積累)。這對應于底物轉化百分數(以([18:2]/[18:1+18:2])*100計算)中的差異分別為85%和74%。此外,串珠鐮孢Δ12去飽和酶比以前報導的任何已知的Δ12去飽和酶更有效地發揮功能(例如,當在釀酒酵母中過表達粗糙脈孢霉Δ12去飽和酶時實現油酸向18:2的僅68%的底物轉化[WO 2003/099216])。
基于這些結果,本發明真菌串珠鐮孢Δ12去飽和酶的表達比其他已知Δ12去飽和酶優選作為工程化積累富含ω-3和/或ω-6 PUFAs的油的油質酵母的方法(然而,本領域技術人員將預計例如,密碼子優化后可以增強Yarrowia lipolytica中串珠鐮孢Δ12去飽和酶的活性)。
此外,申請人還從上述構巢曲霉、Magnaporthe grisea、粗糙脈孢霉、禾本科鐮孢、煙曲霉和黃曲霉鑒定了與上述串珠鐮孢蛋白質直向同源的一組Δ12去飽和酶(即,SEQ ID NOs8、12、16、20、21和22)。這些蛋白質(包括串珠鐮孢Δ12去飽和酶(SEQ ID NO4))在不同的蛋白質亞家族(本文稱作“亞家族2”)中聚簇,所述亞家族蛋白質與“亞家族1”內聚簇的蛋白質明顯不同(即,SEQ ID NOs2,6,10,14和18,在共同待決的美國臨時申請60/519191中鑒定為Δ15去飽和酶),盡管所有蛋白質均與本文鑒定為SEQ ID NO52(在共同待決的美國專利申請10/840325中表征)的Y.lipolyticaΔ12去飽和酶同源。亞家族2的蛋白質(在本文鑒定為Δ12去飽和酶并且受到WO 03/099216中將所述粗糙脈孢霉功能表征為Δ12去飽和酶的指出)代表相互具有至少56.3%同一性的一組蛋白質(實施例4)并且它們通過與以前描述的Δ12去飽和酶的序列同源性而顯著區分。
預期該獨特類別的真菌Δ12去飽和酶將可以用于在油質酵母(例如,Yarrowia lipolytica)中表達作為改變脂肪酸組成的方法,這是基于它們將以高效率發揮功能的預期(即,底物轉化百分數,其中至少約70%的油酸向LA的底物轉化%是優選的,而至少約80%的油酸向LA的底物轉化%是尤其適宜的,至少約85%的油酸向LA的底物轉化%是最優選的)。從而,本發明的一個實施方案是改變幼稚酵母中脂肪酸分布圖的方法,其中亞家族2的Δ12去飽和酶單獨表達或者與其他脂肪酸生物合成基因(例如,Δ4去飽和酶、Δ5去飽和酶、Δ6去飽和酶、Δ12去飽和酶、Δ15去飽和酶、Δ17去飽和酶、Δ9去飽和酶、Δ8去飽和酶和/或延伸酶)聯合表達。
實施例在下面實施例中進一步限定本發明。將理解這些實施例盡管指出本發明的優選實施方案,但是僅作為例證給出。從上面的討論和這些實施例,本領域技術人員可以確定本發明的基本特征,并且不背離本發明的精神和范圍,可以對本發明做出多種改變和修改使其適于多種用法和條件。
一般方法實施例中使用的標準重組DNA和分子克隆技術是本領域公知的并且由1.)Sambrook,J.,Fritsch,E.F.和Maniatis,T.Molecular CloningA Laboratory Manual;Cold Spring HarborLaboratoryCold Spring Harbor,NY(1989)(Maniatis);2.)T.J.Silhavy,M.L.Bennan,和L.W.Enquist,Experiments withGene Fusions;Cold Spring Harbor LaboratoryCold SpringHarbor,NY(1984);和3.)Ausubel,F.M.等人,CurrentProtocols in Molecular Biology,Greene Publishing Assoc.andWiley-Interscience出版(1987)描述。
適于維持和生長細胞培養物的材料和方法是本領域公知的。適于用于下面的實施例的技術可以見Manual of Methods for GeneralBacteriology(Phillipp Gerhardt,R.G.E.Murray,Ralph N.Costilow,Eugene W.Nester,Willis A.Wood,Noel R.Krieg andG.Briggs Phillips,Eds),American Society for MicrobiologyWashington,D.C.(1994));或Thomas D.Brock inBiotechnologyA Textbook of Industrial Microbiology,2nded.,SinauerAssociatesSunderland,MA(1989)。除非另外指出,用于生長和維持細菌細胞的所有試劑、限制酶和材料都從Aldrich Chemicals(Milwaukee,WI),DIFCO Laboratories(Detroit,MI),GIBCO/BRL(Gaithersburg,MD),或Sigma Chemical Company(St.Louis,MO)得到。
大腸桿菌(E.coli)TOP10細胞和大腸桿菌Electromax DH10B細胞從Invitrogen(Carlsbad,CA)得到。大腸桿菌DH5α的MaxEfficiency感受態細胞從GIBCO/BRL(Gaithersburg,MD)得到。大腸桿菌(XL1-Blue)感受態細胞從Stratagene Company(San Diego,CA)購買。所有大腸桿菌細胞通常在37℃生長在Luria Bertani(LB)板上。
根據標準方法(Sambrook等人,上文)進行常規分子克隆。由Sigma-Genosys(Spring,TX)合成寡核苷酸。將PCR產物克隆到Promega的pGEM-T-easy載體(Madison,WI)。
使用染料終止劑技術(U.S.5,366,860;EP 272,007),用載體和插入片段特異引物的聯合在ABI自動測序儀上產生DNA序列。用Sequencher(Gene Codes Corporation,Ann Arbor,MI)進行序列編輯。所有序列代表兩個方向至少兩倍的蓋度。用DNASTAR軟件(DNASTAR Inc.,Madison,WI)完成基因序列的比較。
縮寫的含義如下“sec”表示秒;“min”表示分鐘;“h”表示小時,“d”表示天,“μl”表示微升,“mL”表示毫升,“L”表示升,“μM”表示微摩爾/升,“mM”表示毫摩爾/升,“M”表示摩爾/升,“mmol”表示毫摩爾,“μmole”表示微摩爾,“g”表示克,“μg”表示微克,“ng”表示納克,“U”表示單位,“bp”表示堿基對,“kB”表示千堿基。
Yarrowia lipolytica的培養Yarrowia lipolytica菌株ATCC #76982和ATCC #90812從美國典型培養物保藏中心(American Type Culture Collection)(Rockville,MD)購買。Y.lipolytica菌株在28℃生長在YPD瓊脂(1%酵母提取物,2%細菌用蛋白胨,2%葡萄糖,2%瓊脂)上。對于轉化選擇,使用基本培養基(0.17%酵母氮堿基(DIFCO Laboratories,Detroit,MI),其沒有硫酸銨并且沒有氨基酸,2%葡萄糖,0.1%脯氨酸,pH6.1)。適當補加腺嘌呤、亮氨酸、賴氨酸和/或尿嘧啶至0.01%的終濃度。
Yarrowia lipolytica的脂肪酸分析對于脂肪酸分析,通過離心收集細胞,并如Bligh,E.G.& Dyer,W.J.(Can.J.Biochem.Physiol.37911-917(1959))中描述的提取脂質。通過用甲氧基鈉進行脂提取物的轉酯作用(Roughan,G.,and Nishida I.Arch Biochem Biophys.276(1)38-46(1990))制備脂肪酸甲酯并隨后用安裝30-m X 0.25mm(i.d.)HP-INNOWAX(Hewlett-Packard)柱的Hewlett-Packard 6890GC分析。烘箱溫度以3.5℃/min從170℃(25min保持)升高到185℃。
對于直接堿基轉酯,收獲Yarrowia培養物(3mL),將其用蒸餾水洗滌一次,并在Speed-Vac中真空干燥5-10分鐘。向樣品中加入甲氧基鈉(100μl,1%),然后渦旋樣品并搖動20min。加入3滴1MNaCl和400μl己烷后,渦旋并離心樣品。除去上層并如上述通過GC分析。
實施例1構建Yarrowia表達載體本發明描述了質粒pY5,pY5-13(包含嵌合的TEF啟動子::XPR終止子基因),和pY5-20(包含嵌合的潮霉素抗性基因)的構建。
構建質粒pY5構建質粒pY5用于在Yarrowia lipolytica中表達異源基因(圖3),質粒pY5是pINA532(Claude Gaillardin博士,InsitutNational Agronomics,Centre de biotechnologie Agro-Industrielle,laboratoire de Genetique Moleculaire etCellularie INRA-CNRS,F-78850Thiverval-Grignon,France饋贈)的衍生物。
首先,將含有ARS18序列和pINA532的LEU2基因的部分消化的3598bp EcoRI片段亞克隆到pBluescript(Strategene,San Diego,CA)的EcoRI位點產生pY2。通過PCR使用TEF5’(SEQ ID NO23)和TEF3’(SEQ ID NO24)作為引物從Yarrowia lipolytica基因組DNA擴增TEF啟動子(Muller S.,等人Yeast,141267-1283(1998))。在50μl總體積中進行PCR擴增,所述總體積含有100ng Yarrowia基因組DNA,含有10mM KCl,10mM(NH4)2SO4,20mM Tris-HCl(pH8.75),2mM MgSO4,0.1%Triton X-100,100μg/mL BSA(終濃度),200μM每種脫氧核糖核酸三磷酸的PCR緩沖液,10pmole每種引物和1μl PfuTurbo DNA聚合酶(Stratagene,San Diego,CA)。如下進行擴增95℃ 3min的最初變性,然后35個如下95℃ 1min,56℃ 30sec,72℃ 1min循環。進行72℃ 10min的最終延伸循環,然后在4℃結束反應。將418bp PCR產物連接到pCR-Blunt以產生pIP-tef。將pIP-tef的BamHI/EcoRV片段亞克隆到pY2的BamHI/SmaI位點產生pY4。
通過PCR使用pINA532作為模板和XPR5’(SEQ ID NO25)和XPR3’(SEQ ID NO26)作為引物擴增XPR2轉錄終止子。使用上述組分和條件在50μl總體積中進行PCR擴增。將179bp PCR產物用SacII消化然后連接到pY4的SacII位點以產生pY5。從而,pY5(圖3中顯示)可用作Yarrowia-大腸桿菌穿梭載體,其含有1.)Yarrowia自主復制序列(ARS18);2.)ColE1質粒復制起點;3.)氨芐青霉素抗性基因(AmpR),其用于大腸桿菌中的選擇;4.)Yarrowia LEU2基因,其用于Yarrowia中的選擇;5.)翻譯延伸啟動子(TEF P),其用于在Yarrowia中表達異源基因;和6.)細胞外蛋白酶基因終止子(XPR2),其用于Yarrowia中異源基因表達的轉錄終止。
質粒pY5-13和pY5-20的構建將pY5-13和pY5-20構建為pY5的衍生物以方便在Yarrowialipolytica中的亞克隆和異源基因表達。
特別地,使用pY5作為模板,通過6輪定點誘變構建pY5-13。使用寡核苷酸YL5和YL6(SEQ ID NOs27和28)通過定點誘變從pY5除去SalI和ClaI位點產生pY5-5。使用寡核苷酸YL9和YL10(SEQ IDNOs29和30)通過定點誘變在Leu2基因和TEF啟動子之間引入SalI位點產生pY5-6。使用寡核苷酸YL7和YL8(SEQ ID NOs31和32)將PacI位點導入pY5-6中LEU2基因和ARS18之間以產生pY5-8。使用寡核苷酸YL3和YL4(SEQ ID NOs33和34)在pY5-8中TEF的翻譯起始密碼子的周圍引入NcoI位點以產生pY5-9。用YL1和YL2寡核苷酸(SEQ ID NOs35和36)除去pY5-9的Leu2基因內的NcoI位點以產生pY5-12。最后,使用寡核苷酸YL61和YL62(SEQ ID NOs37和38)在pY5-12的ColEI和XPR區之間引入BsiWI位點以產生pY5-13。
質粒pY5-20是pY5的衍生物。通過將含有嵌合的潮霉素抗性基因的Not I片段插入到pY5的Not I位點構建pY5-20。所述嵌合基因具有處于Yarrowia lipolytica TEF啟動子控制下的潮霉素抗性ORF。
實施例2克隆Yarrowia lipolytica Δ12去飽和酶和破壞內源Δ12去飽和酶基因基于Yarrowia lipolytica(ATCC #76982)的脂肪酸組成(其闡明該生物可以產生LA(18:2)但不是ALA(18:3)),假定Y.lipolytica將可能含有具有Δ12去飽和酶活性但沒有Δ15去飽和酶活性的基因。從而,本實施例描述了使用簡并PCR引物分離Yarrowialipolytica Δ12去飽和酶的部分編碼序列,使用該部分序列破壞Yarrowia lipolytica中的天然基因,和隨后克隆全長基因。
使用簡并PCR引物通過PCR從Yarrowia lipolytica克隆部分推定的Δ12去飽和酶序列使用DNeasy Tissue試劑盒(Qiagen,Catalog #69504)從Yarrowia lipolytica(ATCC #76982)分離基因組DNA并將其以0.5μg/μl的DNA濃度重懸浮在試劑盒緩沖液AE中。用基因組DNA作為模板和根據在不同Δ12去飽和酶之間保守的氨基酸序列制備的幾組簡并引物進行PCR擴增。用一組上游和下游引物(分別是P73和P76)得到了最佳結果,如下表所示。
表4用于擴增部分推定的Δ12去飽和酶的簡并引物 在Eppendorf Mastercycler Gradient循環變溫器中根據生產商的推薦進行PCR。如下進行擴增95℃ 1min的最初變性,接著是30個95℃ 30sec變性,58℃ 1min退火,和72℃ 1min延伸的循環。進行72℃ 10min的最后延伸循環,然后在4℃結束反應。
將預期(約740bp)大小的PCR產物通過瓊脂糖凝膠電泳檢測,分離,純化并克隆到pTA載體(Invitrogen),和測序。基于BLAST程序分析(Basic Local Alignment Search Tool;Altschul,S.F.,等人,J.Mol.Biol.215403-410(1993)),所得序列與已知的Δ12去飽和酶具有同源性。
Yarrowia lipolytica Δ12去飽和酶基因的定向破壞用稱作pY23D12的靶定盒對Δ12去飽和酶基因進行同源重組介導的替換,進行Yarrowia lipolytica ATCC #76982中Δ12去飽和酶基因的定向破壞。pY23D12來自質粒pY20(實施例1)。
特別地,將Hind III/Eco RI片段插入到相似線性化的pY20產生pY23D12。該642bp片段由(5’到3’方向)從+718到+1031位的3’同源序列(SEQ ID NO51中的編碼序列(ORF))、Bgl II限制位點,和從+403到+717位的5’同源序列(SEQ ID NO51中的編碼序列(ORF))組成。分別使用PCR引物組P99和P100(SEQ ID NOs43和44)和P101和P102(SEQ ID NOs45和46)從642bp PCR產物PCR擴增3’和5’序列制備所述片段。
將pY23D12通過Bgl II限制性消化線性化并通過乙酸鋰方法根據Chen,D.C.等人(Appl Microbiol Biotechnol.48(2)232-235(1997))的方法轉化到對數中期Y.lipolytica ATCC #76982細胞。簡言之,將Y.lipolytica在YPD板上劃線并在30℃生長約18小時。從平板刮除一些大的菌環量細胞并將其重懸浮在1ml轉化緩沖液中,該緩沖液含有2.25mL 50%PEG,平均MW 3350;0.125mL 2M乙酸鋰,pH6.0;0.125mL 2M DTT;和50μg剪切的鮭精DNA。
將約500ng質粒DNA在100μl重懸浮的細胞中孵育,并在39℃保持1小時,用渦旋以15分鐘間隔混合。將細胞接種在YPD潮霉素選擇平板上并在30℃保持2到3天。
分裂了四個潮霉素抗性菌落并通過PCR篩選定向破壞。設計一組PCR引物(P119[SEQ ID NO47]和P120[SEQ ID NO48])用于擴增同源重組后的特定連接片段。設計另一組PCR引物(P121[SEQ IDNO49]和P122[SEQ ID NO50])用于檢測天然基因。四個潮霉素抗性菌落中的3個對于連接片段呈陽性并且對于天然片段呈陰性,從而證實了定向整合。
確定Δ12去飽和酶-破壞的菌株中脂肪酸分布圖通過稱作Q-d12D的一個被破壞的菌株中總脂質的GC分析進一步證實天然Δ12去飽和酶基因的破壞。野生型(ATCC #76982)和Q-d12D的單個菌落每個生長在3ml基本培養基(成分/L20g葡萄糖,1.7g酵母氮堿基,1g L-脯氨酸,0.1g L-腺嘌呤,0.1g L-賴氨酸,pH6.1)中30℃下直到OD600~1.0。收獲細胞,將其用蒸餾水洗滌,speedvacuum干燥并進行直接轉酯作用和GC分析(如一般方法中描述)。
在下表5中顯示了野生型Yarrowia和包含破壞的Δ12去飽和酶的轉化株Q-d12D的脂肪酸分布圖。鑒定脂肪酸為16:0(棕櫚酸),16:1(p棕櫚油酸),18:0,18:1(油酸)和18:2(LA)并且每種脂肪酸的成分以總脂肪酸的%表示。
表5野生型和轉化體Yarrowia lipolytica中脂肪酸成分(總脂肪酸的%)
*nd=不可檢測結果表明Q-d12D菌株中天然Δ12去飽和酶基因被失活。從而,可以推斷在僅一種基因編碼Yarrowia lipolytica ATCC #76982中功能Δ12去飽和酶。
Yarrowia liDolytica Δ12去飽和酶基因的質粒拯救因為插入也含有大腸桿菌氨芐青霉素抗性基因和大腸桿菌ori的完整pY23D12載體破壞了Δ12去飽和酶基因,所以可能拯救大腸桿菌中的側翼序列。為此,用DNeasy Tissue Kit分離Yarrowia lipolytica菌株Q-d12D的基因組DNA。特別地,在200μl的反應體積中用50μl限制酶Age I,Avr II,Nhe I和Sph I消化10μg基因組DNA。將所消化的DNA用酚氯仿萃取并重懸浮在40μl去離子水中。所消化的DNA(10μl)在含有3U T4 DNA連接酶的200μl連接混合物中自連接。在16℃進行連接12小時。用酚氯仿萃取所連接的DNA并將其重懸浮在40μl去離子水中。最后,用1μl重懸浮的經連接的DNA通過電穿孔轉化大腸桿菌并接種在含有氨芐青霉素(Ap)的LB板上。分離Ap-抗性菌落并通過小量制備分析質粒的存在。在回收或拯救的質粒中發現了下面的插入片段大小(表6)
表6所回收質粒的插入片段大小,根據限制酶
用測序引物P99(SEQ ID NO43)和P102(SEQ ID NO46)開始質粒測序。
基于測序結果,裝配編碼Yarrowia lipolytica Δ12去飽和酶基因的全長基因(1936bp;SEQ ID NO51)。特別地,所述序列編碼1257個堿基(SEQ ID NO51的核苷酸+283到+1539)的可讀框,而所推導的序列長為419個殘基(SEQ ID NO52)。該基因也在“Yeastproject Genolevures”(Center for Bioinformatics,LaBRI,Talence Cedex,France)的公開Y.lipolytica蛋白質數據庫中公開為YALI-CDS3053.1(也參見Dujon,B.等人,Nature 430(6995)35-44(2004))。
實施例3處于異源Yarrowia啟動子控制下的Yarrowia lipolytica Δ12去飽和酶ORF的表達本實施例描述了處于異源(非-Δ12去飽和酶)Yarrowia啟動子控制下的嵌合基因中Y.lipolytica Δ12去飽和酶ORF(來自實施例2)的表達。這使得能夠互補Δ12去飽和酶-破壞的突變體和在野生型Y.lipolytica菌株中過量產生LA。
特別地,用上游引物P147(SEQ ID NO53)和下游引物P148(SEQID NO54)從Y.lipolytica ATCC #76982的基因組DNA用PCR擴增編碼Y.lipolytica Δ12去飽和酶的ORF。將正確大小(1260bp)的片段分離、純化、用Nco I和Not I消化并克隆到NcoI-Not I切割的pY5-13載體(實施例1),從而該基因處于TEF啟動子控制下。通過小量制備分析證實正確的轉化株并將所得質粒命名為pY25-d12d。
用實施例2中描述的轉化方法將質粒pY5-13(“對照”)和pY25-d12d每個單獨轉化到Y.lipolytica ATCC#76982野生型(WT)和Δ12-破壞的菌株(Q-d12D)。在Bio101 DOB/CSM-Leu板上選擇陽性轉化株。
轉化株的單個菌落長大并如一般方法中描述的分析GC。結果在下面的表中顯示。將脂肪酸鑒定為16:0(棕櫚酸),16:1(棕櫚油酸),18:0,18:1(油酸)和18:2(LA);每種脂肪酸的組分代表為總脂肪酸的%。根據下面的公式計算“D12d SC”([18:2]/[18:1+18:2])*100并且代表底物轉化百分數(SC)。
表7用Yarrowia lipolytica Δ12去飽和酶基因轉化的Yarrowia的脂肪酸組成(總脂肪酸%)
*nd=不可檢測結果表明使用TEF啟動子表達Y.lipolytica Δ12去飽和酶恢復了在內源基因破壞的菌株中18:2的產生。
此外,結果表明野生型細胞中Y.lipolytica Δ12去飽和酶的過表達導致LA產生(18:2)的水平增加。特別地,LA的%產物積累從野生型細胞中的47%增加到轉化的細胞中59%(代表底物轉化百分數[“D12d SC”]從野生型中的59%改變為用嵌合Δ12去飽和酶轉化的那些細胞中的74%)。
實施例4從絲狀真菌鑒定Δ12去飽和酶本實施例描述了多種絲狀真菌中Δ12去飽和酶的鑒定。基于與Yarrowia lipolytica Δ12去飽和酶的同源性鑒定這些序列(實施例2);并且,來自每個物種的序列根據系統進化分析法落入兩個“亞家族”之一。
使用Δ12去飽和酶蛋白質序列(SEQ ID NO52)作為針對絲狀真菌的可利用的序列數據庫的查詢序列進行BLAST搜索(Basic LocalAlignment Search Tool;Altschul,S.F.,等人,J.Mol.Biol.215403-410(1993)),所述數據庫包括1)粗糙脈孢霉,Magnaporthegrisea,構巢曲霉和禾本科鐮孢的公共數據庫;和2)串珠鐮孢菌株M-8114的DuPont EST文庫(E.I.du Pont de Nemours和Co.,Inc.,Wilmington,DE)(串珠鐮孢菌株M-8114可以從Fusarium ResearchCenter,University Park,PA得到;也參見Plant Disease 81(2)211-216(1997))。這些BLAST搜索鑒定了每種生物內與Yarrowialipolytica Δ12去飽和酶蛋白質的兩種同源物。下表概述了關于這些同源物的每一種的細節。
表8與Yarrowia lipolytica Δ12去飽和酶具有同源性的ORF的描述
*注釋奇數SEQ ID NOs指ORF核苷酸序列,偶數SEQ ID NOs指所推導的氨基酸序列。
所有同源物為未注解的或者有注解的Δ12去飽和酶或脂肪酸去飽和酶。此外,來自禾本科鐮孢的核苷酸序列為具有推定的內含子序列的基因組序列;申請人進行了所推定氨基酸的試驗性裝備以比較來自其他同源物的氨基酸序列。
使用LASERGENE生物信息學計算套件(Windows 32 Megalign 5.061993-2003;DNASTAR Inc.,Madison,WI)的Megalign程序對Δ12去飽和酶的系統樹分析出乎意料地揭示了兩個亞家族。如圖4中所示,Nc1,Mg1,Fg1,Fm1和An1在與Yarrowia lipolytica Δ12去飽和酶具有同源性的蛋白質的“亞家族1”中聚簇,而Fg2,Fm2,Mg2,Nc2和An2在Yarrowia lipolytica Δ12去飽和酶蛋白質同源物的“亞家族2”內聚簇。
隨后,在兩種額外生物的公共序列數據庫中也鑒定了一種Δ12去飽和酶同源物,如下面的表9中所示。
表9與Yarrowia lipolytica Δ12去飽和酶具有同源性的額外ORFs
這些額外序列在Yarrowia lipolytica Δ12去飽和酶蛋白質同源物的亞家族2內聚簇。
然后使用DNASTAR軟件的Megalign程序的Clustal W方法(slow,accurate,Gonnet選項;Thompson等人,Nucleic Acids Res.224673-4680(1994))對與Yarrowia lipolytica Δ12去飽和酶具有同源性的每種蛋白質進行比對。通過該方法揭示的百分數同一性用于確定所述蛋白質是否是直向同源物(圖5)。此外,將所述同源物與表10中所示的已知的Δ12去飽和酶比較。
表10用于Clustal W分析的已知的Δ12去飽和酶
亞家族1的蛋白質(SEQ ID NOs2,6,10,14和18;圖5)相互至少46.2%同一并且與亞家族2的蛋白質(SEQ ID NOs4,8,12,16,20;圖5)具有小于45.2%的同一性。此外,亞家族2的蛋白質(SEQ IDNOs4,8,12,16,20;圖5)相互具有至少56.3%同一性。亞家族2的蛋白質和來自S.platensis、秀麗隱桿線蟲、C.reinhardtii、普通小球藻、擬南芥、Y.lipolytica、D.hansenii、M.alpina、魯西毛霉,和P.augusta的Δ12去飽和酶之間的最大同一性為51.6%(圖6)。
盡管未在圖5或圖6中顯示,但是使用Clustal W方法(上文)類似地比較了黃曲霉Δ12去飽和酶同源物(SEQ ID NO22)和亞家族2的其他蛋白質(SEQ ID NOs4、8、12、16、20和21)。得到了下面的結果黃曲霉相對A.fumigatus的蛋白質同一性為79%,相對粗糙脈孢霉的蛋白質同一性為68.5%,相對禾本科鐮孢的蛋白質同一性為60.9%,相對串珠鐮孢的蛋白質同一性為61.8%,相對M.grisea的蛋白質同一性為66.1%,相對構巢曲霉的蛋白質同一性為76%。從而,基于圖5和6中的同源性和上面給出的同源性,根據串珠鐮孢和M.grisea蛋白質序列之間的同源性,串珠鐮孢Δ12去飽和酶(SEQ ID NO4)與亞家族2的剩余Δ12去飽和酶蛋白質的同一性為至少56.3%(這里定義為SEQ ID NOs4、8、12、16、20、21和22)。
上面的分析清除地區分了與Yarrowia lipolytica Δ12去飽和酶(SEQ ID NO52)具有同源性的兩個亞家族蛋白質。此外,已知酵母,如Y.lipolytica只能合成18:2(但是不能合成18:3),而5種絲狀真菌每一種都能合成18:2和18:3。此外,從Yarrowia分離了一種Δ12去飽和酶,而多數真菌與Yarrowia Δ12去飽和酶具有兩種同源物。從而,申請人推測這些生物中去飽和酶的亞家族之一代表a Δ12去飽和酶(允許油酸向LA(18:2)的轉化)并且另一種代表Δ15去飽和酶(允許LA向ALA(18:3)轉化)。
實施例5構建包含亞家族2的串珠鐮孢去飽和酶的表達質粒pY35(TEF::Fm2)(編碼推定的Δ12去飽和酶)本實施例描述了構建包括實施例4中鑒定的亞家族2的串珠鐮孢Δ12去飽和酶(“Fm2”或“Fm d12”)的表達質粒。特別地,產生了嵌合基因,使得推定的Δ12去飽和酶將在Yarrowia TEF啟動子的控制下表達。這將使得能夠隨后測定Yarrowia lipolytica中所述蛋白質的活性,這可以通過測試表達ORF在野生型菌株中產生LA和互補Δ12去飽和酶-破壞的突變株的能力來實現(下文,實施例6)。
使用含有全長cDNA的cDNA克隆ffm2c.pK007.g13和ffm2c.pk001.p18作為模板并使用上游和下游引物P194(SEQ IDNO55)和P195(SEQ ID NO56)通過PCR擴增編碼串珠鐮孢Δ12去飽和酶的ORF。使用TA Taq和pfu聚合酶,按照生產商的推薦,在Eppendorf Mastercycler Gradient Cycler中進行PCR。如下進行擴增95℃1分鐘的最初變性;然后是30個循環的95℃ 30秒變性,58℃ 1分鐘退火;和72℃ 1分鐘的延伸,接著在4℃反應結束。
從兩種模板都得到正確大小(約1441bp)的片段。使用Qiagen DNA純化試劑盒從瓊脂糖凝膠純化片段,用NcoI和NotI消化并克隆到NcoI和NotI切割的pY25-d12d(實施例3),從而代替TEF::Y1D12d嵌合基因中的Yarrowia Δ12去飽和酶ORF。這導致產生稱作pY35的8571bp質粒,其含有TEF::Fm2嵌合基因(與Yarrowia Δ12去飽和酶相反)。質粒pY35還含有大腸桿菌復制起點、細菌氨芐青霉素抗性基因、Yarrowia Leu 2基因和Yarrowia自主復制序列(ARS)。
實施例6包含亞家族2的串珠鐮孢去飽和酶的質粒pY35(TEF::Fm2)(編碼推定的Δ12去飽和酶)在Yarrowia lipolytica中的表達串珠鐮孢去飽和酶Of亞家族2本實施例描述了質粒pY35(包含嵌合的TEF::Fm2基因;來自實施例5)在Yarrowia lipolytica中的表達。特別地,測試了包含推定的Δ12去飽和酶的所表達的串珠鐮孢ORF賦予在Y.lipolytica的野生型菌株中產生LA和互補Δ12去飽和酶-破壞的突變株(來自實施例2)的能力。
使用實施例2中描述的轉化方法,將質粒pY5(僅載體對照,來自實施例1),pY25-d12d(TEF::Y1D12d,來自實施例3的“陽性對照”),和pY35(TEF::Fm2)每一種單獨轉化到Yarrowia lipolytica ATCC#76892的野生型(WT)和Δ12去飽和酶-破壞的(Q-d12D)菌株中。在Bio101 DOB/CSM-Leu板上選擇轉化細胞。
如實施例2和一般方法中描述的,在3mL基本培養基中生長每種野生型和轉化細胞的單個菌落,將其收獲、洗滌、干燥并分析。
在下面的表11中顯示了野生型Yarrowia和每種轉化株的脂肪酸分布圖。脂肪酸經鑒定為16:0(棕櫚酸),16:1(棕櫚油酸),18:0,18:1(油酸),18:2(LA)和18:3(ALA)并且每種脂肪酸的組成以總脂肪酸的%給出。根據下面的公式計算“d12d SC”([18:2]/[18:1+18:2])*100并且“d12d SC”代表底物向18:2轉化的百分數。
表11當在Yarrowia lipolytica中表達時證實串珠鐮孢Fm2ORF’s Δ12去飽和酶活性
上面的結果表明,本文中稱作Fm2并且鑒定為與YarrowialipolyticaΔ12去飽和酶具有同源性的那些蛋白質的亞家族2內的蛋白質的串珠鐮孢ORF是Δ12去飽和酶。基于該證實,申請人預測亞家族2的所有其他成員(SEQ ID NOs8,12,16,20,21和22)將也具有Δ12去飽和酶功能性。
此外,所述結果表明,串珠鐮孢Δ12去飽和酶(Fm2)在Yarrowia中的活性出乎意料地高于天然Y.lipolyticaΔ12去飽和酶的活性。特別地,比較表11和表7中的數據(實施例3)揭示在WT+TEF::Fm2細胞中的底物轉化百分數(SC)為85%,而在WT+TEF::Y1 D12d細胞中僅為74%。同樣地,Q-d12D+TEF::Fm2細胞中底物轉化百分數為67%,而在Q-d12D+TEF::Y1 D12d細胞中底物轉化百分數僅為57%。從而,預計串珠鐮孢Δ12去飽和酶聯合PUFA生物合成的其他基因(例如,Δ6去飽和酶,延伸酶、Δ5去飽和酶、Δ17去飽和酶、Δ9去飽和酶、Δ4去飽和酶、Δ8去飽和酶、Δ15去飽和酶)的表達產生的ω-3和ω-6 PUFAs將高于使用天然Y.lipolytica Δ12去飽和酶產生ω-3和ω-6 PUFAs的產量。
實施例7使用用串珠鐮孢Δ12去飽和酶構建的嵌合基因在Yarrowialipolytica中產生DGLA產生構建體pKUNF12T6E(圖7;SEQ ID NO57)將4種嵌合基因(包含串珠鐮孢Δ12去飽和酶、Δ6去飽和酶和2種延伸酶)整合到野生型Yarrowia菌株ATCC #20362的Ura3基因座,從而使得能夠產生DGLA。pKUNF12T6E質粒含有下面的組分
表12質粒pKUNF12T6E(SEQ ID NO57)的描述
表12續質粒pKUNF12T6E(SEQ ID NO57)的描述
將pKUNF12T6E質粒用AscI/SphI消化,然后用于轉化野生型Y.lipolytica ATCC #20362(如實施例2中描述)。所轉化的細胞在5-氟尿嘧啶-6-羧酸一水合物(“FOA”)選擇培養基平板(0.17%酵母氮堿基(DIFCO Laboratories,Detroit,MI),沒有硫酸銨或者氨基酸,2%葡萄糖,0.1%脯氨酸,75mg/L尿嘧啶,75mg/L尿苷,20g/瓊脂和800mg/L FOA(Zymo Research Corp.,Orange,CA92867))上接種并保持在30℃ 2到3天。挑選FOA抗性菌落并在包含基本培養基((20g/L葡萄糖,1.7g/L酵母氮堿基(無氨基酸),1g/L L-脯氨酸,0.1g/L L-腺嘌呤,0.1g/L L-賴氨酸,pH 6.1)或者基本培養基加上0.01%尿嘧啶(“MMU”)的選擇平板上劃線。選擇可以在MMU板上生長但是不在基本培養基板上生長的菌落作為Ura-菌株。然后將Ura-菌株的單個菌落接種到30℃液態MMU中并以250轉/分鐘搖動2天。
GC分析(如一般方法中描述)表明在含有DKUNF12T6E的4種嵌合基因中存在DGLA,但是在野生型Yarrowia時照菌株中不存在DGLA。多數選擇的32Ura-菌株產生約6%DGLA總脂類。有兩個菌株產生總脂類的約8%DGLA。
實施例8合成密碼子優化的Δ12去飽和酶基因用于在Yarrowialipolytica中表達_基于串珠鐮孢DNA序列(SEQ ID NO3),根據Yarrowia密碼子選擇模式,ATG翻譯起始密碼子周圍的共有序列,和RNA穩定性的一般規律(Guhaniyogi,G.和J.Brewer,Gene 265(1-2)11-23(2001)),將設計密碼子優化的Δ12去飽和酶基因。
確定Yarrowia lipolytica中優選的密碼子選擇Yarrowia lipolytica中的密碼子選擇在表13中顯示。它是基于National Center for Biotechnology Information公共數據庫中發現的Y.lipolytica的約100種基因的編碼區。將這些基因的編碼區(包含121,167bp)通過DNAStar的Editseq程序翻譯成對應的40,389個氨基酸并列表顯示以確定圖13種顯示的Y.lipolytica密碼子選擇分布圖。列標題“No.”指40,389個氨基酸的樣品中編碼特定氨基酸的給定密碼子的次數。列標題“%”指編碼特定氨基酸的給定密碼子的頻率。以粗體顯示的條目代表在Yarrowia lipolytica中占優勢的密碼子。
表13Yarrowia lipolytica中的密碼子選擇
通過本領域技術人員公知的方法產生合成的、密碼子優化的Δ12去飽和酶。
為了進一步優化Y.lipolytica中的基因表達,檢查了79種基因的“ATG”起始密碼子周圍的共有序列。所分析的基因的77%都在-3位具有‘A’(翻譯起始密碼子(ATG)的第一個‘A’標記位+1,表明在該位置強烈偏愛‘A’。在-4,-2和-1位也偏愛‘A’或‘C’,在+5位偏愛‘A’,‘C’或‘T’,在+6位偏愛‘G’或‘C’。從而,用于基因在Y.lipolytica中最佳表達的密碼子優化的翻譯起始位點的優選共有序列是‘MAMMATGNHS’(SEQ ID NO66),其中所用的核酸簡并密碼如下M=A/C;S=C/G;H=A/C/T;和N=A/C/G/T。
本領域技術人員將容易地能夠使用上面提供的信息,基于本文提供的串珠鐮孢Δ12去飽和酶序列合成密碼子優化的Δ12去飽和酶基因。
序列表<110>E.I.du Pont de Nemours and Co.,Inc.Yadav,Narendra<120>適于改變油質酵母中多不飽和脂肪酸水平的Δ12去飽和酶<130>CL2502<150>US 60/570679<151>2004-05-13<160>66<170>PatentIn version 3.3<210>1<211>1209<212>DNA<213>Fusarium monoliforme<400>1atggcgactc gacagcgaac tgccaccact gttgtggtcg aggaccttcc caaggtcact 60cttgaggcca agtctgaacc tgtgttcccc gatatcaaga ccatcaagga tgccattccc120gcgcactgct tccagccctc gctcgtcacc tcattctact acgtcttccg cgattttgcc180atggtctctg ccctcgtctg ggctgctctc acctacatcc ccagcatccc cgaccagacc240ctccgcgtcg cagcttggat ggtctacggc ttcgtccagg gtctgttctg caccggtgtc300tggattctcg gccatgagtg cggccacggt gctttctctc tccacggaaa ggtcaacaat360gtgaccggct ggttcctcca ctcgttcctc ctcgtcccct acttcagctg gaagtactct420caccaccgcc accaccgctt caccggccac atggatctcg acatggcttt cgtccccaag480actgagccca agccctccaa gtcgctcatg attgctggca ttgacgtcgc cgagcttgtt540gaggacaccc ccgctgctca gatggtcaag ctcatcttcc accagctttt cggatggcag600gcgtacctct tcttcaacgc tagctctggc aagggcagca agcagtggga gcccaagact660ggcctctcca agtggttccg agtcagtcac ttcgagccta ccagcgctgt cttccgcccc720aacgaggcca tcttcatcct catctccgat atcggtcttg ctctaatggg aactgctctg780tactttgctt ccaagcaagt tggtgtttcg accattctct tcctctacct tgttccctac840ctgtgggttc accactggct cgttgccatt acctacctcc accaccacca caccgagctc900cctcactaca ccgctgaggg ctggacctac gtcaagggag ctctcgccac tgtcgaccgt960gagtttggct tcatcggaaa gcacctcttc cacggtatca ttgagaagca cgttgttcac 1020catctcttcc ctaagatccc cttctacaag gctgacgagg ccaccgaggc catcaagccc 1080gtcattggcg accactactg ccacgacgac cgaagcttcc tgggccagct gtggaccatc 1140ttcggcacgc tcaagtacgt cgagcacgac cctgcccgac ccggtgccat gcgatggaac 1200aaggactag 1209<210>2<211>402
<212>PRT<213>Fusarium monoliforme<400>2Met Ala Thr Arg Gln Arg Thr Ala Thr Thr Val Val Val Glu Asp Leu1 5 10 15Pro Lys Val Thr Leu Glu Ala Lys Ser Glu Pro Val Phe Pro Asp Ile20 25 30Lys Thr Ile Lys Asp Ala Ile Pro Ala His Cys Phe Gln Pro Ser Leu35 40 45Val Thr Ser Phe Tyr Tyr Val Phe Arg Asp Phe Ala Met Val Ser Ala50 55 60Leu Val Trp Ala Ala Leu Thr Tyr Ile Pro Ser Ile Pro Asp Gln Thr65 70 75 80Leu Arg Val Ala Ala Trp Met Val Tyr Gly Phe Val Gln Gly Leu Phe85 90 95Cys Thr Gly Val Trp Ile Leu Gly His Glu Cys Gly His Gly Ala Phe100 105 110Ser Leu His Gly Lys Val Asn Asn Val Thr Gly Trp Phe Leu His Ser115 120 125Phe Leu Leu Val Pro Tyr Phe Ser Trp Lys Tyr Ser His His Arg His130 135 140His Arg Phe Thr Gly His Met Asp Leu Asp Met Ala Phe Val Pro Lys145 150 155 160Thr Glu Pro Lys Pro Ser Lys Ser Leu Met Ile Ala Gly Ile Asp Val165 170 175Ala Glu Leu Val Glu Asp Thr Pro Ala Ala Gln Met Val Lys Leu Ile180 185 190Phe His Gln Leu Phe Gly Trp Gln Ala Tyr Leu Phe Phe Asn Ala Ser195 200 205Ser Gly Lys Gly Ser Lys Gln Trp Glu Pro Lys Thr Gly Leu Ser Lys210 215 220Trp Phe Arg Val Ser His Phe Glu Pro Thr Ser Ala Val Phe Arg Pro225 230 235 240Asn Glu Ala Ile Phe Ile Leu Ile Ser Asp Ile Gly Leu Ala Leu Met245 250 255
Gly Thr Ala Leu Tyr Phe Ala Ser Lys Gln Val Gly Val Ser Thr Ile260 265 270Leu Phe Leu Tyr Leu Val Pro Tyr Leu Trp Val His His Trp Leu Val275 280 285Ala Ile Thr Tyr Leu His His His His Thr Glu Leu Pro His Tyr Thr290 295 300Ala Glu Gly Trp Thr Tyr Val Lys Gly Ala Leu Ala Thr Val Asp Arg305 310 315 320Glu Phe Gly Phe Ile Gly Lys His Leu Phe His Gly Ile Ile Glu Lys325 330 335His Val Val His His Leu Phe Pro Lys Ile Pro Phe Tyr Lys Ala Asp340 345 350Glu Ala Thr Glu Ala Ile Lys Pro Val Ile Gly Asp His Tyr Cys His355 360 365Asp Asp Arg Ser Phe Leu Gly Gln Leu Trp Thr Ile Phe Gly Thr Leu370 375 380Lys Tyr Val Glu His Asp Pro Ala Arg Pro Gly Ala Met Arg Trp Asn385 390 395 400Lys Asp<210>3<211>1434<212>DNA<213>Fusarium monoliforme<400>3atggcgtcca cttcggctct gcccaagcag aaccctgcgc ttagacgcac cgtcacctca 60actactgtga cggattctga gtctgccgcc gtctctcctt cagactctcc ccgccactcg120gcctcttcca catcgctctc gtccatgtcc gaggttgata tcgccaagcc caagtccgag180tatggtgtca tgctcgacac ctacggcaac cagttcgagg ttcccgactt taccatcaag240gacatctaca atgccatccc taagcactgc ttcaagcgct ccgctctcaa gggatacggt300tatatcctcc gcgacattgt cctcctgact accactttca gcatctggta caactttgtg360acccccgaat atatcccctc cacccccgcc cgcgctggtc tgtgggccgt gtacaccgtt420cttcagggtc ttttcggtac tggtctctgg gttattgccc atgagtgcgg tcacggtgct480ttctccgatt ctcgcatcat caacgacatt actggctggg ttcttcactc ttccctcctt540gtcccctact tcagctggca aatctcccac cgaaagcacc acaaggccac tggcaacatg600gagcgtgaca tggtcttcgt tccccgaacc cgcgagcagc aggctactcg tctcggaaag660
atgacccacg agctcgctca tcttactgag gagacccccg ctttcactct tctcatgctc720gtccttcagc agctcgttgg ctggcccaac tacctcatca ccaatgttac cggccacaac780taccacgagc gccagcgtga gggtcgcggc aagggcaagc ataacggcct cggcggtggt840gttaaccact tcgatccccg cagccctctg tacgagaaca gtgacgctaa gctcatcgtc900ctcagcgata ttggtatcgg tctgatggcc actgctctgt acttcctcgt tcagaagttc960ggtttctaca acatggccat ctggtacttt gttccctacc tctgggttaa ccactggctc 1020gttgccatca ccttcctcca gcacaccgac cctacccttc cccactacac caacgacgag 1080tggaacttcg tccgtggtgc cgctgctacc attgaccgtg agatgggctt catcggccgc 1140caccttctcc acggcatcat cgagactcat gtcctccacc actacgtcag cagcatcccc 1200ttctacaacg cggacgaggc caccgaggcc attaagccca tcatgggcaa gcactaccgg 1260gctgatgtcc aggatggtcc tcgtggcttc atccgcgcca tgtaccgcag tgcgcgtatg 1320tgccagtggg ttgagcccag cgctggtgcc gagggtgctg gtaagggtgt tctgttcttc 1380cgcaaccgca acaacgtggg cacccccccc gctgttatca agcccgttgc ttaa 1434<210>4<211>477<212>PRT<213>Fusarium monoliforme<400>4Met Ala Ser Thr Ser Ala Leu Pro Lys Gln Asn Pro Ala Leu Arg Arg1 5 10 15Thr Val Thr Ser Thr Thr Val Thr Asp Ser Glu Ser Ala Ala Val Ser20 25 30Pro Ser Asp Ser Pro Arg His Ser Ala Ser Ser Thr Ser Leu Ser Ser35 40 45Met Ser Glu Val Asp Ile Ala Lys Pro Lys Ser Glu Tyr Gly Val Met50 55 60Leu Asp Thr Tyr Gly Asn Gln Phe Glu Val Pro Asp Phe Thr Ile Lys65 70 75 80Asp Ile Tyr Asn Ala Ile Pro Lys His Cys Phe Lys Arg Ser Ala Leu85 90 95Lys Gly Tyr Gly Tyr Ile Leu Arg Asp Ile Val Leu Leu Thr Thr Thr100 105 110Phe Ser Ile Trp Tyr Asn Phe Val Thr Pro Glu Tyr Ile Pro Ser Thr115 120 125Pro Ala Arg Ala Gly Leu Trp Ala Val Tyr Thr Val Leu Gln Gly Leu
130 135 140Phe Gly Thr Gly Leu Trp Val Ile Ala His Glu Cys Gly His Gly Ala145 150 155 160Phe Ser Asp Ser Arg Ile Ile Asn Asp Ile Thr Gly Trp Val Leu His165 170 175Ser Ser Leu Leu Val Pro Tyr Phe Ser Trp Gln Ile Ser His Arg Lys180 185 190His His Lys Ala Thr Gly Asn Met Glu Arg Asp Met Val Phe Val Pro195 200 205Arg Thr Arg Glu Gln Gln Ala Thr Arg Leu Gly Lys Met Thr His Glu210 215 220Leu Ala His Leu Thr Glu Glu Thr Pro Ala Phe Thr Leu Leu Met Leu225 230 235 240Val Leu Gln Gln Leu Val Gly Trp Pro Asn Tyr Leu Ile Thr Asn Val245 250 255Thr Gly His Asn Tyr His Glu Arg Gln Arg Glu Gly Arg Gly Lys Gly260 265 270Lys His Asn Gly Leu Gly Gly Gly Val Asn His Phe Asp Pro Arg Ser275 280 285Pro Leu Tyr Glu Asn Ser Asp Ala Lys Leu Ile Val Leu Ser Asp Ile290 295 300Gly Ile Gly Leu Met Ala Thr Ala Leu Tyr Phe Leu Val Gln Lys Phe305 310 315 320Gly Phe Tyr Asn Met Ala Ile Trp Tyr Phe Val Pro Tyr Leu Trp Val325 330 335Asn His Trp Leu Val Ala Ile Thr Phe Leu Gln His Thr Asp Pro Thr340 345 350Leu Pro His Tyr Thr Asn Asp Glu Trp Asn Phe Val Arg Gly Ala Ala355 360 365Ala Thr Ile Asp Arg Glu Met Gly Phe Ile Gly Arg His Leu Leu His370 375 380Gly Ile Ile Glu Thr His Val Leu His His Tyr Val Ser Ser Ile Pro385 390 395 400Phe Tyr Asn Ala Asp Glu Ala Thr Glu Ala Ile Lys Pro Ile Met Gly
405 410 415Lys His Tyr Arg Ala Asp Val Gln Asp Gly Pro Arg Gly Phe Ile Arg420 425 430Ala Met Tyr Arg Ser Ala Arg Met Cys Gln Trp Val Glu Pro Ser Ala435 440 445Gly Ala Glu Gly Ala Gly Lys Gly Val Leu Phe Phe Arg Asn Arg Asn450 455 460Asn Val Gly Thr Pro Pro Ala Val Ile Lys Pro Val Ala465 470 475<210>5<211>1206<212>DNA<213>Aspergillus nidulans<400>5atggctgcaa ctgcaacaac cctagcagag attgaaaaga aaaaagaaga aataactctg 60cagacaatca aaaatgcgat tcccaaacac tgcttcaacc gctctctcct catttcctct120gcctacgtcg tccgcgatct cctctacgcc tccgtcctct tctactttgc cctgcacatt180gacaccctct tttcctcgca actcctccgc atcctcgcct ggaccgccta cggtttcatg240caaggctgcg tcggcaccgg aatctggatc ctcgcacacg aatgcggcca tggagctttc300tccccatacc aaacgtggaa cgatgtcgtc ggatggacat tgcactccct cctgatggtc360ccgtatttca gctggaagat cacgcacgct cgacaccacc ggtacacaaa caacacagag420cgagatacag catttgtccc ctggacagag aaggaatacg acactcgccc gcgctacttc480cctgcctggt ttgagatgtt tgaggacacg cccgtctaca accttattag cctactggcg540catcagatcg caggatggca gatgtatctc tgtttttacg ttagcgccgg cgcaaagagt600aagcctgtac cgcagggaaa acagagcggg tggtttggag gccagcagag cgccagccac660tttgatccgg gcagttcgct gtggacggaa aaccagcggc atctgattgc gatttcggac720ctggggttgc tgcttgttgc ggcggcaaat tggtaccttg cgcagcaagt gggcgtgctc780cgcatggtgc tgatctatgt tgtgccgtac ttctgggtgc accattggct tgtggcgatc840acgtacctcc accacacaca cccctcgatc ccgcactaca ctgatagcac ctggacgttc900accaaaggcg ctctgtccac cgtcgaccgc gacttcggtt tcatcgggcg gcatttcttc960caccatatca ttgaccacca tgtcgtgcat cacttgttta accggatccc gttctaccat 1020gccgaggagg cgactaatgc cattattccc gtactcgggg acatgtatca tcgcgaagag 1080accggcttct tgtggagttt aatggagacg tacaagaact gtcggtttgt aggcgttgaa 1140aatgatgttg gaaaggaggg cgttttgcat tgggtttttg aggagaagaa gggtgccaaa 1200gcggaa 1206
<210>6<211>401<212>PRT<213>Aspergillus nidulans<400>6Met Ala Ala Thr Ala Thr Thr Leu Ala Glu Ile Glu Lys Lys Lys Glu1 5 10 15Glu Ile Thr Leu Gln Thr Ile Lys Asn Ala Ile Pro Lys His Cys Phe20 25 30Asn Arg Ser Leu Leu Ile Ser Ser Ala Tyr Val Val Arg Asp Leu Leu35 40 45Tyr Ala Ser Val Leu Phe Tyr Phe Ala Leu His Ile Asp Thr Leu Phe50 55 60Ser Ser Gln Leu Leu Arg Ile Leu Ala Trp Thr Ala Tyr Gly Phe Met65 70 75 80Gln Gly Cys Val Gly Thr Gly Ile Trp Ile Leu Ala His Glu Cys Gly85 90 95His Gly Ala Phe Ser Pro Tyr Gln Thr Trp Asn Asp Val Val Gly Trp100 105 110Thr Leu His Ser Leu Leu Met Val Pro Tyr Phe Ser Trp Lys Ile Thr115 120 125His Ala Arg His His Arg Tyr Thr Asn Asn Thr Glu Arg Asp Thr Ala130 135 140Phe Val Pro Trp Thr Glu Lys Glu Tyr Asp Thr Arg Pro Arg Tyr Phe145 150 155 160Pro Ala Trp Phe Glu Met Phe Glu Asp Thr Pro Val Tyr Asn Leu Ile165 170 175Ser Leu Leu Ala His Gln Ile Ala Gly Trp Gln Met Tyr Leu Cys Phe180 185 190Tyr Val Ser Ala Gly Ala Lys Ser Lys Pro Val Pro Gln Gly Lys Gln195 200 205Ser Gly Trp Phe Gly Gly Gln Gln Ser Ala Ser His Phe Asp Pro Gly210 215 220Ser Ser Leu Trp Thr Glu Asn Gln Arg His Leu Ile Ala Ile Ser Asp225 230 235 240Leu Gly Leu Leu Leu Val Ala Ala Ala Asn Trp Tyr Leu Ala Gln Gln
245 250 255Val Gly Val Leu Arg Met Val Leu Ile Tyr Val Val Pro Tyr Phe Trp260 265 270Val His His Trp Leu Val Ala Ile Thr Tyr Leu His His Thr His Pro275 280 285Ser Ile Pro His Tyr Thr Asp Ser Thr Trp Thr Phe Thr Lys Gly Ala290 295 300Leu Ser Thr Val Asp Arg Asp Phe Gly Phe Ile Gly Arg His Phe Phe305 310 315 320His His Ile Ile Asp His His Val Val His His Leu Phe Asn Arg Ile325 330 335Pro Phe Tyr His Ala Glu Glu Ala Thr Asn Ala Ile Ile Pro Val Leu340 345 350Gly Asp Met Tyr His Arg Glu Glu Thr Gly Phe Leu Trp Ser Leu Met355 360 365Glu Thr Tyr Lys Asn Cys Arg Phe Val Gly Val Glu Asn Asp Val Gly370 375 380Lys Glu Gly Val Leu His Trp Val Phe Glu Glu Lys Lys Gly Ala Lys385 390 395 400Ala<210>7<211>1416<212>DNA<213>Aspergillus nidulans<400>7atgtcgtcta ctgccctccc gaagcgcgtt gcgctgcatc gcaacccgac taccgactct 60tcggtcccca gctccgtctc ggtctccccg ctggactcgc cccgtcagtc tccgtcgtcg120acttcgctct cgtcaatggc ctcggatgcg ggcaagggag acttgggcaa gatgctcgac180acctatggca atgagttcaa gatccccgac tacaccatca aggatatccg tgatgccatt240ccgtcccact gctacaaccg gtctgctatc aggagtctgt cctatgtctt ccgtgatctc300gccgtcctcg cttccgtctt ctacgtcttc cacaaatacg tgaccccgga gaccgtccct360tcgtacccgg cgcgtgttgc gctgtggact ctctacactg tcgtccaggg tctgttcggt420accggtattt gggttcttgc tcacgagtgt ggacaccagg cgttctctac ttccaaggtg480ctcaacgaca ctgttggctg gatcctgcat tcggctctgc tggtccccta tttctcgtgg540aagatctctc acggcaagca ccacaaggcc accggtaacc tggctcgtga catggtcttc600
gtccccaaga cccgcgaggt gtacgcctcc cgcatcaaga agaccatcta cgacctgaac660gaggtgatgg aggagacccc cttggccact gccacccact ccatcctgca gcagctgttc720ggctggccct tgtacctgct caccaacgtt accggtcacg acaaccacga gcgccagcct780gaaggccgcg gcaagggcaa gcgtaacggc tacttcaccg gcgtcaacca cttcaacccc840aacagccctc tgttcgaggc caaggacgcc aagctcatca ttctgagtga tatcggcctc900gccatcaccg ccagcatcct gtacctgatc ggctccaagt tcggctggat gaacttgctc960gtctggtacg gtatccccta cctctgggtg aaccactggc ttgttgccat cacctacctc 1020cagcacaccg accccactct cccccactac cagcccgagt cctggacctt cgcccgcggt 1080gccgctgcca ccattgaccg cgagttcggc ttcatcggcc gtcacattct ccacggcatc 1140atcgagaccc acgtcctcca ccactacgtc agcaccatcc ccttctacca cgccgacgag 1200gccagcgagg ctatcaagaa ggtcatgggc tcgcactacc gcagcgaggc acacaccggt 1260cctctgggct tcctcaaggc tctctggacc agcgcccgtg tctgccactg ggtcgagccc 1320accgaaggca ccaagggcga gaacgctggt gtcttgttct tccgcaacac caacggcatc 1380ggtgttcctc ccattaagct gaccaagcct aactaa 1416<210>8<211>471<212>PRT<213>Aspergillus nidulans<400>8Met Ser Ser Thr Ala Leu Pro Lys Arg Val Ala Leu His Arg Asn Pro1 5 10 15Thr Thr Asp Ser Ser Val Pro Ser Ser Val Ser Val Ser Pro Leu Asp20 25 30Ser Pro Arg Gln Ser Pro Ser Ser Thr Ser Leu Ser Ser Met Ala Ser35 40 45Asp Ala Gly Lys Gly Asp Leu Gly Lys Met Leu Asp Thr Tyr Gly Asn50 55 60Glu Phe Lys Ile Pro Asp Tyr Thr Ile Lys Asp Ile Arg Asp Ala Ile65 70 75 80Pro Ser His Cys Tyr Asn Arg Ser Ala Ile Arg Ser Leu Ser Tyr Val85 90 95Phe Arg Asp Leu Ala Val Leu Ala Ser Val Phe Tyr Val Phe His Lys100 105 110Tyr Val Thr Pro Glu Thr Val Pro Ser Tyr Pro Ala Arg Val Ala Leu115 120 125
Trp Thr Leu Tyr Thr Val Val Gln Gly Leu Phe Gly Thr Gly Ile Trp130 135 140Val Leu Ala His Glu Cys Gly His Gln Ala Phe Ser Thr Ser Lys Val145 150 155 160Leu Asn Asp Thr Val Gly Trp Ile Leu His Ser Ala Leu Leu Val Pro165 170 175Tyr Phe Ser Trp Lys Ile Ser His Gly Lys His His Lys Ala Thr Gly180 185 190Asn Leu Ala Arg Asp Met Val Phe Val Pro Lys Thr Arg Glu Val Tyr195 200 205Ala Ser Arg Ile Lys Lys Thr Ile Tyr Asp Leu Asn Glu Val Met Glu210 215 220Glu Thr Pro Leu Ala Thr Ala Thr His Ser Ile Leu Gln Gln Leu Phe225 230 235 240Gly Trp Pro Leu Tyr Leu Leu Thr Asn Val Thr Gly His Asp Asn His245 250 255Glu Arg Gln Pro Glu Gly Arg Gly Lys Gly Lys Arg Asn Gly Tyr Phe260 265 270Thr Gly Val Asn His Phe Asn Pro Asn Ser Pro Leu Phe Glu Ala Lys275 280 285Asp Ala Lys Leu Ile Ile Leu Ser Asp Ile Gly Leu Ala Ile Thr Ala290 295 300Ser Ile Leu Tyr Leu Ile Gly Ser Lys Phe Gly Trp Met Asn Leu Leu305 310 315 320Val Trp Tyr Gly Ile Pro Tyr Leu Trp Val Asn His Trp Leu Val Ala325 330 335Ile Thr Tyr Leu Gln His Thr Asp Pro Thr Leu Pro His Tyr Gln Pro340 345 350Glu Ser Trp Thr Phe Ala Arg Gly Ala Ala Ala Thr Ile Asp Arg Glu355 360 365Phe Gly Phe Ile Gly Arg His Ile Leu His Gly Ile Ile Glu Thr His370 375 380Val Leu His His Tyr Val Ser Thr Ile Pro Phe Tyr His Ala Asp Glu385 390 395 400
Ala Ser Glu Ala Ile Lys Lys Val Met Gly Ser His Tyr Arg Ser Glu405 410 415Ala His Thr Gly Pro Leu Gly Phe Leu Lys Ala Leu Trp Thr Ser Ala420 425 430Arg Val Cys His Trp Val Glu Pro Thr Glu Gly Thr Lys Gly Glu Asn435 440 445Ala Gly Val Leu Phe Phe Arg Asn Thr Asn Gly Ile Gly Val Pro Pro450 455 460Ile Lys Leu Thr Lys Pro Asn465 470<210>9<211>1185<212>DNA<213>Magnaporthe grisea<400>9atgtccacca ccgtcactca gcggccgggc gccgctagcc gcgctgaagc caagcccaag 60gagcagcaat ttccagacat caacaccatc aggaatgcta tccccgcaca ctgttttgag120gcatctctgg tgacttcagt tggttacttg gtgcgagatg tggccctcat caccgctctc180ggctgggccg ccttgaccta cattccccaa attccggatt cgactttgcg ctggaccgcc240tgggccgctt acggctttgt tcagggtctc tttggcaccg gtctctggat tctggcccac300gagtgcggcc acggtgcttt cagcaagcac acgcgcatta acaacattct tggctgggcc360gcccactcgg ccctgctggt accgtacttc agctggaagt tctctcacca ccgccaccac420aacttcaccg gccacatgga gaaggacatg gcctttgtgc ccccccaggc tgccgaccgc480gagtcccgcg ccagcttgct gtcccgcttc ggcatcgacc tcgaggtctt tgaggatacc540cccatctttc agcttgctcg cctcgtgagc caccagctct tcggctggca gacttacctg600ctcttcaacg ccacctgcgg caaggagtct ctgcagaaca agggtgccgc gtggttccgc660cagagccact ttgagcccac ctctgccgtc ttccgctcca gcgaggccct ctacatcgcc720atctctgaca ttggcctggc catcgttgcc gccgccatct actggggctc caccaaggtc780ggcgccggca ccatgttcct cctctacgcc gttccctaca tgtgggttca ccactggctc840gtcgccatca cctaccttca ccacaccaac aaggaggtgc accactacga ggccgacagc900tggacctttg tcaagggtgc cgtcgccact gtcgaccgtg actttggttt cattgaccgc960cacctgttcc acggtatcat tggaacccac gtcgcccacc atctgttccc tcgcattccc 1020ttttacaagg cagaggaggc caccgaggcc atcaagcctg tcctcggaga cctttaccac 1080agcgacaatc gccccttcat gcaggctctg tggagcaact tcaccacctg caagtacgtc 1140gagaaggacc ccaaggttcc cggcgccatg aggtgggccg attga 1185
<210>10<211>394<212>PRT<213>Magnaporthe grisea<400>10Met Ser Thr Thr Val Thr Gln Arg Pro Gly Ala Ala Ser Arg Ala Glu1 5 10 15Ala Lys Pro Lys Glu Gln Gln Phe Pro Asp Ile Asn Thr Ile Arg Asn20 25 30Ala Ile Pro Ala His Cys Phe Glu Ala Ser Leu Val Thr Ser Val Gly35 40 45Tyr Leu Val Arg Asp Val Ala Leu Ile Thr Ala Leu Gly Trp Ala Ala50 55 60Leu Thr Tyr Ile Pro Gln Ile Pro Asp Ser Thr Leu Arg Trp Thr Ala65 70 75 80Trp Ala Ala Tyr Gly Phe Val Gln Gly Leu Phe Gly Thr Gly Leu Trp85 90 95Tle Leu Ala His Glu Cys Gly His Gly Ala Phe Ser Lys His Thr Arg100 105 110Ile Asn Asn Ile Leu Gly Trp Ala Ala His Ser Ala Leu Leu Val Pro115 120 125Tyr Phe Ser Trp Lys Phe Ser His His Arg His His Asn Phe Thr Gly130 135 140His Met Glu Lys Asp Met Ala Phe Val Pro Pro Gln Ala Ala Asp Arg145 150 155 160Glu Ser Arg Ala Ser Leu Leu Ser Arg Phe Gly Ile Asp Leu Glu Val165 170 175Phe Glu Asp Thr Pro Ile Phe Gln Leu Ala Arg Leu Val Ser His Gln180 185 190Leu Phe Gly Trp Gln Thr Tyr Leu Leu Phe Asn Ala Thr Cys Gly Lys195 200 205Glu Ser Leu Gln Asn Lys Gly Ala Ala Trp Phe Arg Gln Ser His Phe210 215 220Glu Pro Thr Ser Ala Val Phe Arg Ser Ser Glu Ala Leu Tyr Ile Ala225 230 235 240Ile Ser Asp Ile Gly Leu Ala Ile Val Ala Ala Ala Ile Tyr Trp Gly
245 250 255Ser Thr Lys Val Gly Ala Gly Thr Met Phe Leu Leu Tyr Ala Val Pro260 265 270Tyr Met Trp Val His His Trp Leu Val Ala Ile Thr Tyr Leu His His275 280 285Thr Asn Lys Glu Val His His Tyr Glu Ala Asp Ser Trp Thr Phe Val290 295 300Lys Gly Ala Val Ala Thr Val Asp Arg Asp Phe Gly Phe Ile Asp Arg305 310 315 320His Leu Phe His Gly Ile Ile Gly Thr His Val Ala His His Leu Phe325 330 335Pro Arg Ile Pro Phe Tyr Lys Ala Glu Glu Ala Thr Glu Ala Ile Lys340 345 350Pro Val Leu Gly Asp Leu Tyr His Ser Asp Asn Arg Pro Phe Met Gln355 360 365Ala Leu Trp Ser Asn Phe Thr Thr Cys Lys Tyr Val Glu Lys Asp Pro370 375 380Lys Val Pro Gly Ala Met Arg Trp Ala Asp385 390<210>11<211>1656<212>DNA<213>Magnaporthe grisea<400>11atgccttcca ccagatcgac cacatcgggc attgcccagg agaagactcc tatgaggcga 60acgaccacct cggccactgt cgaatcggac gtctcagctc cgggaaccgc tgttcagtcg120cctatggact cgccccgcca ctctgcctcg tccacctcac tctcttcact ctcttccgtt180gatgcggcgg ccgagaagaa atccaacgag tctgtcggca aactcgtcga cacgtacggc240aacacctttg agatccctga cttcaccatc aaggacatcc acgatgccat tccaaagcac300tgctttgaac gctctgctat tcgtagcttg agctacgtcg cccgtgatat ggtcctcctg360gcgacgacct tctacgtgtt ccacaactac gtgacaccag agtacattcc ctcgaagccg420gctcgtgctg gtctgtgggc catttacacg gtgctccagg gcctcttcgg caccggaatc480tgggttcttg cccatgagtg tggccactag gctttctcgc cttccaagac catcaacaac540acggttggct ggattctcca ctcgtctctg ctggttccgt acttcagctg gcagatgtca600cacagcaagc accacaaggc cactggccat attgagcgcg acatggtctt tgtgccccgc660acccgggagg agcacgctag caggatcggc cgcatggtcc acgagctgtc ggagttgacc720
gaggagacgc ctattgccac ccttatccac ttggttgggc agcagctgat cggctggcct780ctgtacatca tcactaacaa gaccggtcac aactaccacg agcgccagcg tgagggccgt840ggcaagggca agaagaacgg tcttttcact ggcgtcaacc acttcaaccc cagcagccct900ctgtacgaga acaaggacgc cggaaaggtg cttctcagcg acctgggtgt cggccttgtt960atcgctggcc tcgtgtacct ttgccaaact ttcggcaccc agaacatgct ggtttggtac 1020tttatcccct acctctgggt gaaccactgg ctcgttgcca ttacattcct tcagcacacc 1080gacccctcgc ttccgcacta tactgccgag gaatggaact tcgtccgagg tgccgctgcc 1140acgatcgatc gcgagtttgg cttcgtcggc cgccacctgc ttcacggtat cattgagacc 1200cacgtcctgc accactatgt cagcacgatc cccttttaca acgccgacga ggctactgat 1260gccatcaaga aggtgatggg caagcactac cgcagcgaca ctgccggcgg ccctgctggc 1320ttccttaagt cactctggac gagtagccgc atgtgccaat gggttgagcc cagcgccgag 1380gctgagggta gtggcaaggg tgtcctgttc ttccgcaacc acaacaagat cggcactcct 1440cctatcaaga tgtctgctca gaaaattaga ctatgcaatg accttcttgg catgcataag 1500ggaaagaatc aaatgaatgg atcaagggag cgccgcggcg gacaaagtag tttaaagagg 1560gtgagaaatc agcgatcgac aaatatgaac gaatcacaca tgacggtgtt ccgggcattc 1620cgaacttgga gctcatgcac gcgcgcgtcc acatga 1656<210>12<211>551<212>PRT<213>Magnaporthe grisea<400>12Met Pro Ser Thr Arg Ser Thr Thr Ser Gly Ile Ala Gln Glu Lys Thr1 5 10 15Pro Met Arg Arg Thr Thr Thr Ser Ala Thr Val Glu Ser Asp Val Ser20 25 30Ala Pro Gly Thr Ala Val Gln Ser Pro Met Asp Ser Pro Arg His Ser35 40 45Ala Ser Ser Thr Ser Leu Ser Ser Leu Ser Ser Val Asp Ala Ala Ala50 55 60Glu Lys Lys Ser Asn Glu Ser Val Gly Lys Leu Val Asp Thr Tyr Gly65 70 75 80Asn Thr Phe Glu Ile Pro Asp Phe Thr Ile Lys Asp Ile His Asp Ala85 90 95Ile Pro Lys His Cys Phe Glu Arg Ser Ala Ile Arg Ser Leu Ser Tyr100 105 110
Val Ala Arg Asp Met Val Leu Leu Ala Thr Thr Phe Tyr Val Phe His115 120 125Asn Tyr Val Thr Pro Glu Tyr Ile Pro Ser Lys Pro Ala Arg Ala Gly130 135 140Leu Trp Ala Ile Tyr Thr Val Leu Gln Gly Leu Phe Gly Thr Gly Ile145 150 155 160Trp Val Leu Ala His Glu Cys Gly His Gln Ala Phe Ser Pro Ser Lys165 170 175Thr Ile Asn Asn Thr Val Gly Trp Ile Leu His Ser Ser Leu Leu Val180 185 190Pro Tyr Phe Ser Trp Gln Met Ser His Ser Lys His His Lys Ala Thr195 200 205Gly His Ile Glu Arg Asp Met Val Phe Val Pro Arg Thr Arg Glu Glu210 215 220His Ala Ser Arg Ile Gly Arg Met Val His Glu Leu Ser Glu Leu Thr225 230 235 240Glu Glu Thr Pro Ile Ala Thr Leu Ile His Leu Val Gly Gln Gln Leu245 250 255Ile Gly Trp Pro Leu Tyr Ile Ile Thr Asn Lys Thr Gly His Asn Tyr260 265 270His Glu Arg Gln Arg Glu Gly Arg Gly Lys Gly Lys Lys Asn Gly Leu275 280 285Phe Thr Gly Val Asn His Phe Asn Pro Ser Ser Pro Leu Tyr Glu Asn290 295 300Lys Asp Ala Gly Lys Val Leu Leu Ser Asp Leu Gly Val Gly Leu Val305 310 315 320Ile Ala Gly Leu Val Tyr Leu Cys Gln Thr Phe Gly Thr Gln Asn Met325 330 335Leu Val Trp Tyr Phe Ile Pro Tyr Leu Trp Val Asn His Trp Leu Val340 345 350Ala Ile Thr Phe Leu Gln His Thr Asp Pro Ser Leu Pro His Tyr Thr355 360 365Ala Glu Glu Trp Asn Phe Val Arg Gly Ala Ala Ala Thr Ile Asp Arg370 375 380
Glu Phe Gly Phe Val Gly Arg His Leu Leu His Gly Ile Ile Glu Thr385 390 395 400His Val Leu His His Tyr Val Ser Thr Ile Pro Phe Tyr Asn Ala Asp405 410 415Glu Ala Thr Asp Ala Ile Lys Lys Val Met Gly Lys His Tyr Arg Ser420 425 430Asp Thr Ala Gly Gly Pro Ala Gly Phe Leu Lys Ser Leu Trp Thr Ser435 440 445Ser Arg Met Cys Gln Trp Val Glu Pro Ser Ala Glu Ala Glu Gly Ser450 455 460Gly Lys Gly Val Leu Phe Phe Arg Asn His Asn Lys Ile Gly Thr Pro465 470 475 480Pro Ile Lys Met Ser Ala Gln Lys Ile Arg Leu Cys Asn Asp Leu Leu485 490 495Gly Met His Lys Gly Lys Asn Gln Met Asn Gly Ser Arg Glu Arg Arg500 505 510Gly Gly Gln Ser Ser Leu Lys Arg Val Arg Asn Gln Arg Ser Thr Asn515 520 525Met Asn Glu Ser His Met Thr Val Phe Arg Ala Phe Arg Thr Trp Ser530 535 540Ser Cys Thr Arg Ala Ser Thr545 550<210>13<211>1290<212>DNA<213>Neurospora crassa<400>13atgacggtca ccacccgcag ccacaaggcc gcggccgcca ccgagcccga ggttgtcagc 60accggcgttg acgccgtctc tgctgctgct ccctcctcct cctcctcctc ttccagccaa120aagtcggccg agcccatcga ataccccgac atcaagacca tccgcgacgc catccccgac180cactgcttcc gcccgcgcgt ctggatctcc atggcctact tcatccgcga cttcgccatg240gcctttggcc tcggctacct cgcctggcag tacatccccc tgatcgcctc caccccgctc300cgctacggcg cctgggctct gtacggctac ctccagggtc tcgtctgcac gggcatctgg360attctggcgc acgagtgcgg ccacggcgcc ttctcgaggc acacgtggtt caacaacgtc420atggggtgga ttggccactc cttcctcttg gtcccttact tcagctggaa gttcagccac480catcgccacc atcgcttcac cggccacatg gagaaggaca tggcgtttgt gcctgccacc540
gaggctgatc gcaaccagag gaagctggcc aacttgtaca tggacaagga gacggccgag600atgtttgagg atgtgcccat tgtccagctc gtcaagctca tcgcccacca gctggccggc660tggcagatgt acctcctctt caacgtctcc gccggtaagg gcagcaagca gtgggagact720ggcaagggcg gcatgggctg gttgagggtt agccactttg agccttcctc tgctgtgttc780cgcaactccg aggccatcta cattgccctg tccgatcttg gtctcatgat catgggctat840atcctctacc aggccgcgca ggttgttggc tggcagatgg taggtctgct gtacttccag900cagtacttct gggttcacca ttggttggtc gccatcactt acctccacca cacccacgag960gaagtccacc actttgacgc cgactcgtgg accttcgtca agggcgctct cgccaccgtc1020gaccgcgatt ttggcttcat tggcaagcac ctcttccaca acattatcga ccaccacgtc1080gtccaccact tgttccctcg catccccttc tactacgccg aagaagccac caactcgatc1140cgccccatgc tcggccccct ctaccaccgc gacgaccgct ccttcatggg ccagctgtgg1200tacaacttca cccactgcaa gtgggtcgtt ccggaccccc aggtccccgg cgcgcttatt1260tgggcgcaca ccgttcagag cacccagtaa 1290<210>14<211>429<212>PRT<213>Neurospora crassa<400>14Met Thr Val Thr Thr Arg Ser His Lys Ala Ala Ala Ala Thr Glu Pro1 5 10 15Glu Val Val Ser Thr Gly Val Asp Ala Val Ser Ala Ala Ala Pro Ser20 25 30Ser Ser Ser Ser Ser Ser Ser Gln Lys Ser Ala Glu Pro Ile Glu Tyr35 40 45Pro Asp Ile Lys Thr Ile Arg Asp Ala Ile Pro Asp His Cys Phe Arg50 55 60Pro Arg Val Trp Ile Ser Met Ala Tyr Phe Ile Arg Asp Phe Ala Met65 70 75 80Ala Phe Gly Leu Gly Tyr Leu Ala Trp Gln Tyr Ile Pro Leu Ile Ala85 90 95Ser Thr Pro Leu Arg Tyr Gly Ala Trp Ala Leu Tyr Gly Tyr Leu Gln100 105 110Gly Leu Val Cys Thr Gly Ile Trp Ile Leu Ala His Glu Cys Gly His115 120 125Gly Ala Phe Ser Arg His Thr Trp Phe Asn Asn Val Met Gly Trp Ile
130 135 140Gly His Ser Phe Leu Leu Val Pro Tyr Phe Ser Trp Lys Phe Ser His145 150 155 160His Arg His His Arg Phe Thr Gly His Met Glu Lys Asp Met Ala Phe165 170 175Val Pro Ala Thr Glu Ala Asp Arg Asn Gln Arg Lys Leu Ala Asn Leu180 185 190Tyr Met Asp Lys Glu Thr Ala Glu Met Phe Glu Asp Val Pro Ile Val195 200 205Gln Leu Val Lys Leu Ile Ala His Gln Leu Ala Gly Trp Gln Met Tyr210 215 220Leu Leu Phe Asn Val Ser Ala Gly Lys Gly Ser Lys Gln Trp Glu Thr225 230 235 240Gly Lys Gly Gly Met Gly Trp Leu Arg Val Ser His Phe Glu Pro Ser245 250 255Ser Ala Val Phe Arg Asn Ser Glu Ala Ile Tyr Ile Ala Leu Ser Asp260 265 270Leu Gly Leu Met Ile Met Gly Tyr Ile Leu Tyr Gln Ala Ala Gln Val275 280 285Val Gly Trp Gln Met Val Gly Leu Leu Tyr Phe Gln Gln Tyr Phe Trp290 295 300Val His His Trp Leu Val Ala Ile Thr Tyr Leu His His Thr His Glu305 310 315 320Glu Val His His Phe Asp Ala Asp Ser Trp Thr Phe Val Lys Gly Ala325 330 335Leu Ala Thr Val Asp Arg Asp Phe Gly Phe Ile Gly Lys His Leu Phe340 345 350His Asn Ile Ile Asp His His Val Val His His Leu Phe Pro Arg Ile355 360 365Pro Phe Tyr Tyr Ala Glu Glu Ala Thr Asn Ser Ile Arg Pro Met Leu370 375 380Gly Pro Leu Tyr His Arg Asp Asp Arg Ser Phe Met Gly Gln Leu Trp385 390 395 400Tyr Asn Phe Thr His Cys Lys Trp Val Val Pro Asp Pro Gln Val Pro
405 410 415Gly Ala Leu Ile Trp Ala His Thr Val Gln Ser Thr Gln420 425<210>15<211>1446<212>DNA<213>Neurospora crassa<400>15atggcgtccg tctcctctgc ccttcccgag ggcaacaagc ctgccctgcg caggacccaa60accgaggcca cctccgactc ataccctggt accgctgatg cctctccctt cgactctccc120cttgagcgct cggcctccaa cacctcgctt tcttcccagg cctctgacaa cgtcaagacc180gacaaggccg agttcggcaa gctgctcgac acgtatggca acgagttcga ggtccccgac240ttcaccatca aggacatccg cgatgccatc cccgcccact gctttgagcg ttcggctctt300cacagcttgg cgcacgtcgt ccgcgacatc atttacctca ccgtcacttt ttacgtctgg360aacaagtatg tcactcccga gtacatcccc atgaaggctg cccgtgtcgt cctctggggt420ctgtacacct tcatgcaggg ccttttcggc accggtctct gggttcttgc ccatgagtgc480ggtcaccagg ctttctcccc gtccaggttg atcaacgaca ccgtcggctg ggtcctccac540tctgcccttc tcgtccccta cttctcgtgg aagttctccc acagcaagca ccacaaggcc600accggcaaca tcgagcgtga catggtcttc gttcctcgga cccgcgagca gtttgcgtct660cgcatcggcc gtttcgtcca tgagatttcc gagttgaccg aggagacccc catctacacc720ttgatccacc ttatcggtca gcagctcatc ggctggccca actacctcat gaccaacgtc780accggccaca acttccacga gaggcagcgc gagggtcgtg gcaagggcaa gaagaacggc840tggttcactg gtgtcaacca cttcaacccc agctctcccc tctatgagga gcgtgaggcc900ccctggatca tcgtctccga catcggtatc gctatcgccg ccaccgccct catctacctc960ggcaacacct tcggctggtc caacatgttc gtctggtact tccttcccta cctctgggtc1020aaccactggc ttgttgccat cacctacctc cagcacaccg acccctcgct cccccactac1080acccctgatc agtggaactt tgtccgtggt gccgccgcga ctattgaccg cgagttcggc1140ttcatcggcc gtcacctcct ccacggcatt atcgagaccc acgttctcca ccactacgtc1200agcaccattc ccttttacca cgccgacgag gcctccgagg ccatcaagaa ggtcatgggc1260cgtcactacc gcgctgacgt ccaagatggc cccatcggtt tcatcaaggc catgtggaag1320gctgctcgtt ggtgccagtg ggttgagcct accgagggcg ctgagggtaa gggcaagggc1380gtcttgttct accgcaacca gaacggtctc ggtgtcaagc ctgccaagct ccccaaaacc1440aactaa 1446<210>16<211>481<212>PRT<213>Neurospora crassa
<400>16Met Ala Ser Val Ser Ser Ala Leu Pro Glu Gly Asn Lys Pro Ala Leu1 5 10 15Arg Arg Thr Gln Thr Glu Ala Thr Ser Asp Ser Tyr Pro Gly Thr Ala20 25 30Asp Ala Ser Pro Phe Asp Ser Pro Leu Glu Arg Ser Ala Ser Asn Thr35 40 45Ser Leu Ser Ser Gln Ala Ser Asp Asn Val Lys Thr Asp Lys Ala Glu50 55 60Phe Gly Lys Leu Leu Asp Thr Tyr Gly Asn Glu Phe Glu Val Pro Asp65 70 75 80Phe Thr Ile Lys Asp Ile Arg Asp Ala Ile Pro Ala His Cys Phe Glu85 90 95Arg Ser Ala Leu His Ser Leu Ala His Val Val Arg Asp Ile Ile Tyr100 105 110Leu Thr Val Thr Phe Tyr Val Trp Asn Lys Tyr Val Thr Pro Glu Tyr115 120 125Ile Pro Met Lys Ala Ala Arg Val Val Leu Trp Gly Leu Tyr Thr Phe130 135 140Met Gln Gly Leu Phe Gly Thr Gly Leu Trp Val Leu Ala His Glu Cys145 150 155 160Gly His Gln Ala Phe Ser Pro Ser Arg Leu Ile Asn Asp Thr Val Gly165 170 175Trp Val Leu His Ser Ala Leu Leu Val Pro Tyr Phe Ser Trp Lys Phe180 185 190Ser His Ser Lys His His Lys Ala Thr Gly Asn Ile Glu Arg Asp Met195 200 205Val Phe Val Pro Arg Thr Arg Glu Gln Phe Ala Ser Arg Ile Gly Arg210 215 220Phe Val His Glu Ile Ser Glu Leu Thr Glu Glu Thr Pro Ile Tyr Thr225 230 235 240Leu Ile His Leu Ile Gly Gln Gln Leu Ile Gly Trp Pro Asn Tyr Leu245 250 255Met Thr Asn Val Thr Gly His Asn Phe His Glu Arg Gln Arg Glu Gly
260 265 270Arg Gly Lys Gly Lys Lys Asn Gly Trp Phe Thr Gly Val Asn His Phe275 280 285Asn Pro Ser Ser Pro Leu Tyr Glu Glu Arg Glu Ala Pro Trp Ile Ile290 295 300Val Ser Asp Ile Gly Ile Ala Ile Ala Ala Thr Ala Leu Ile Tyr Leu305 310 315 320Gly Asn Thr Phe Gly Trp Ser Asn Met Phe Val Trp Tyr Phe Leu Pro325 330 335Tyr Leu Trp Val Asn His Trp Leu Val Ala Ile Thr Tyr Leu Gln His340 345 350Thr Asp Pro Ser Leu Pro His Tyr Thr Pro Asp Gln Trp Asn Phe Val355 360 365Arg Gly Ala Ala Ala Thr Ile Asp Arg Glu Phe Gly Phe Ile Gly Arg370 375 380His Leu Leu His Gly Ile Ile Glu Thr His Val Leu His His Tyr Val385 390 395 400Ser Thr Ile Pro Phe Tyr His Ala Asp Glu Ala Ser Glu Ala Ile Lys405 410 415Lys Val Met Gly Arg His Tyr Arg Ala Asp Val Gln Asp Gly Pro Ile420 425 430Gly Phe Ile Lys Ala Met Trp Lys Ala Ala Arg Trp Cys Gln Trp Val435 440 445Glu Pro Thr Glu Gly Ala Glu Gly Lys Gly Lys Gly Val Leu Phe Tyr450 455 460Arg Asn Gln Asn Gly Leu Gly Val Lys Pro Ala Lys Leu Pro Lys Thr465 470 475 480Asn<210>17<211>1212<212>DNA<213>Fusarium graminearium<400>17atggccacca gacagcgaac tgccaccact gttgtggtcg agaaggacct gcccaaggtc60actctcgagg ccacttctca gcctcaattc cccgacatca agaccatcaa ggatgccatc120
cccgcccact gcttccagcc ctcgctcatc acctcatact actatgtcgt ccgcgacttc180gccatggtcg gctccctcgt ctgggccgcc ctcacctaca tccccggcat tgaggaccag240tacctccgcg tcgccgcctg gatggcctac ggcttcctcc agggtctctt ctgcaccgga300atctggattc tcggtcatga gtgcggccac ggtgccttct ctacccacag caagctcaac360aatgtgaccg gctggttcct ccactcgttc ctcatggtcc cctatttcag ctggaagtac420tctcaccacc gtcaccaccg cttcaccggc cacatggatc tcgacatggc ctttgtcccc480cgcacttcgc ccaagccttc tttgtctttc cgcattgctg gtatggacgt cgctgagctg540attgaggaca cccccattgc ccaggccgtc aagctcatct tccaccagct cttcggatgg600caggtgtaca ccttcttcaa cgccagctct ggcaagggta gcaagcagtg ggagcccaag660agcggcttgg ccagctggtt ccgcgtcagc cacttcgagc ccaccagcgc tgtcttccgc720cccgccgagg ctcctttcat cctcatctcc gacattggtc tcgccctcac tggaactgct780ctgtactttg cttccaagga ggtcggcgtt tccaccgttc tctacctcta cctcgtcccc840tacctctggg tccaccactg gctcgtcgcc atcacctacc tccaccacca ccacaccgag900cttccccact acaccgccga gggctggacc tacgtcaagg gtgctctcgc tactgttgac960cgcgagtttg gcttcattgg caagcacctt ttccacggca tcattgagaa gcacgtcatt1020caccacctgt tccctaagat ccccttctac aaggctgacg aggccaccga ggccatcaag1080cccatcatcg gcgaccacta ctgccacgac gaccgcagct tccttggcca gctctggacc1140atctttggca gcctcaagta cgtcgagcac gaccccgccg tccctggtgc catgcgctgg1200gccaaggagt ag1212<210>18<211>403<212>PRT<213>Fusarium graminearium<400>18Met Ala Thr Arg Gln Arg Thr Ala Thr Thr Val Val Val Glu Lys Asp1 5 10 15Leu Pro Lys Val Thr Leu Glu Ala Thr Ser Gln Pro Gln Phe Pro Asp20 25 30Ile Lys Thr Ile Lys Asp Ala Ile Pro Ala His Cys Phe Gln Pro Ser35 40 45Leu Ile Thr Ser Tyr Tyr Tyr Val Val Arg Asp Phe Ala Met Val Gly50 55 60Ser Leu Val Trp Ala Ala Leu Thr Tyr Ile Pro Gly Ile Glu Asp Gln65 70 75 80Tyr Leu Arg Val Ala Ala Trp Met Ala Tyr Gly Phe Leu Gln Gly Leu
85 90 95Phe Cys Thr Gly Ile Trp Ile Leu Gly His Glu Cys Gly His Gly Ala100 105 110Phe Ser Thr His Ser Lys Leu Asn Asn Val Thr Gly Trp Phe Leu His115 120 125Ser Phe Leu Met Val Pro Tyr Phe Ser Trp Lys Tyr Ser His His Arg130 135 140His His Arg Phe Thr Gly His Met Asp Leu Asp Met Ala Phe Val Pro145 150 155 160Arg Thr Ser Pro Lys Pro Ser Leu Ser Phe Arg Ile Ala Gly Met Asp165 170 175Val Ala Glu Leu Ile Glu Asp Thr Pro Ile Ala Gln Ala Val Lys Leu180 185 190Ile Phe His Gln Leu Phe Gly Trp Gln Val Tyr Thr Phe Phe Asn Ala195 200 205Ser Ser Gly Lys Gly Ser Lys Gln Trp Glu Pro Lys Ser Gly Leu Ala210 215 220Ser Trp Phe Arg Val Ser His Phe Glu Pro Thr Ser Ala Val Phe Arg225 230 235 240Pro Ala Glu Ala Pro Phe Ile Leu Ile Ser Asp Ile Gly Leu Ala Leu245 250 255Thr Gly Thr Ala Leu Tyr Phe Ala Ser Lys Glu Val Gly Val Ser Thr260 265 270Val Leu Tyr Leu Tyr Leu Val Pro Tyr Leu Trp Val His His Trp Leu275 280 285Val Ala Ile Thr Tyr Leu His His His His Thr Glu Leu Pro His Tyr290 295 300Thr Ala Glu Gly Trp Thr Tyr Val Lys Gly Ala Leu Ala Thr Val Asp305 310 315 320Arg Glu Phe Gly Phe Ile Gly Lys His Leu Phe His Gly Ile Ile Glu325 330 335Lys His Val Ile His His Leu Phe Pro Lys Ile Pro Phe Tyr Lys Ala340 345 350Asp Glu Ala Thr Glu Ala Ile Lys Pro Ile Ile Gly Asp His Tyr Cys
355 360 365His Asp Asp Arg Ser Phe Leu Gly Gln Leu Trp Thr Ile Phe Gly Ser370 375 380Leu Lys Tyr Val Glu His Asp Pro Ala Val Pro Gly Ala Met Arg Trp385 390 395 400Ala Lys Glu<210>19<211>1371<212>DNA<213>Fusarium graminearium<400>19tcaaccacgg cgacggatac tgagtctgct gccgtttctc cttcagactc tccccgccat60tcggcctctt ccacctcgct ctcgtctctt tccgagattg atatcgccaa gcccaaggcc120gaatatggtg ttatgcttga cacctatggc aacaagttcg aggttcccga cttcaccatc180aaggagatct acaatgccat ccccaagcac tgcttccagc gctccgctct caagggatac240ggatacatcc tccgcgacat tgtccttctt gctaccacct ttagcatctg gtacaactat300gtgacccccg agtacatccc tagcactccc gcccgcgctg gtctctgggc tgtctacact360gttctccagg gtcttttcgg taccggtctc tgggtcatcg ctcacgagtg tggccacggt420gctttctccg actctcgcct tatcaacgac atcaccggct gggtcctcca ctcttctctc480ctcgtcccct acttcagctg gcaaatctcc caccgaaagc accacaaggc taccggaaac540atggagcgtg acatggtctt tgttccccga actcgcgagc agcaggctac tcgtctcggc600aagatgaccc acgagcttgc tcacctcact gaggagaccc ccgtcttcac tctgatcatg660cttgttctcc agcagctcgt cggctggccc aactacctca tgaccaacgt tactggccac720aactaccacg agcgtcagaa ggagggccgt ggcaagggca agcacaacgg tctcggcggc780ggtgtcaacc actttgatcc ccgcagccct ctttacgagc acagcgatgc taagctcatt840gtcttgagtg atattggtat cggtctgatg ggtaccgctc tgtacttcct cgtccagaag900tttggctttt acaacatggc catctggtac tttgtccctt acctttgggt caaccactgg960ctcgtcgcca ttactttcct ccagcacacc gaccctaccc ttccccacta caccaacgac1020gagtggaact ttgtccgcgg tgctgctgct accatcgatc gtgagatggg tttcattggc1080cgacacctcc tccacggtat catcgagact cacgtcctcc accactacgt cagcagcatc1140cccttctaca acgccgacga ggctaccgag gctatcaagc ctgtcatggg caagcactac1200cgtgccgacg tccaggatgg tccccgtggt ttcattcgtg ccatgtaccg cagtgcccgt1260atgtgccagt gggttgagcc cagcgctgag gccgagggtg ctggcaaggg tgttctgttc1320ttccgcaacc gcaacaaggt tggcactgct cctgccgtcc tcaaggctta g 1371
<210>20<211>456<212>PRT<213>Fusarium graminearium<400>20Ser Thr Thr Ala Thr Asp Thr Glu Ser Ala Ala Val Ser Pro Ser Asp1 5 10 15Ser Pro Arg His Ser Ala Ser Ser Thr Ser Leu Ser Ser Leu Ser Glu20 25 30Ile Asp Ile Ala Lys Pro Lys Ala Glu Tyr Gly Val Met Leu Asp Thr35 40 45Tyr Gly Asn Lys Phe Glu Val Pro Asp Phe Thr Ile Lys Glu Ile Tyr50 55 60Asn Ala Ile Pro Lys His Cys Phe Gln Arg Ser Ala Leu Lys Gly Tyr65 70 75 80Gly Tyr Ile Leu Arg Asp Ile Val Leu Leu Ala Thr Thr Phe Ser Ile85 90 95Trp Tyr Asn Tyr Val Thr Pro Glu Tyr Ile Pro Ser Thr Pro Ala Arg100 105 110Ala Gly Leu Trp Ala Val Tyr Thr Val Leu Gln Gly Leu Phe Gly Thr115 120 125Gly Leu Trp Val Ile Ala His Glu Cys Gly His Gly Ala Phe Ser Asp130 135 140Ser Arg Leu Ile Ash Asp Ile Thr Gly Trp Val Leu His Ser Ser Leu145 150 155 160Leu Val Pro Tyr Phe Ser Trp Gln Ile Ser His Arg Lys His His Lys165 170 175Ala Thr Gly Asn Met Glu Arg Asp Met Val Phe Val Pro Arg Thr Arg180 185 190Glu Gln Gln Ala Thr Arg Leu Gly Lys Met Thr His Glu Leu Ala His195 200 205Leu Thr Glu Glu Thr Pro Val Phe Thr Leu Ile Met Leu Val Leu Gln210 215 220Gln Leu Val Gly Trp Pro Asn Tyr Leu Met Thr Asn Val Thr Gly His225 230 235 240Asn Tyr His Glu Arg Gln Lys Glu Gly Arg Gly Lys Gly Lys His Asn
245 250 255Gly Leu Gly Gly Gly Val Asn His Phe Asp Pro Arg Ser Pro Leu Tyr260 265 270Glu His Ser Asp Ala Lys Leu Ile Val Leu Ser Asp Ile Gly Tle Gly275 280 285Leu Met Gly Thr Ala Leu Tyr Phe Leu Val Gln Lys Phe Gly Phe Tyr290 295 300Asn Met Ala Ile Trp Tyr Phe Val Pro Tyr Leu Trp Val Asn His Trp305 310 315 320Leu Val Ala Ile Thr Phe Leu Gln His Thr Asp Pro Thr Leu Pro His325 330 335Tyr Thr Asn Asp Glu Trp Asn Phe Val Arg Gly Ala Ala Ala Thr Ile340 345 350Asp Arg Glu Met Gly Phe Ile Gly Arg His Leu Leu His Gly Ile Ile355 360 365Glu Thr His Val Leu His His Tyr Val Ser Ser Ile Pro Phe Tyr Asn370 375 380Ala Asp Glu Ala Thr Glu Ala Ile Lys Pro Val Met Gly Lys His Tyr385 390 395 400Arg Ala Asp Val Gln Asp Gly Pro Arg Gly Phe Ile Arg Ala Met Tyr405 410 415Arg Ser Ala Arg Met Cys Gln Trp Val Glu Pro Ser Ala Glu Ala Glu420 425 430Gly Ala Gly Lys Gly Val Leu Phe Phe Arg Asn Arg Asn Lys Val Gly435 440 445Thr Ala Pro Ala Val Leu Lys Ala450 455<210>21<211>424<212>PRT<213>Aspergillus fumigatus<400>21Met Ala Ser Asp Ala Glu Lys Thr Ser Ser Lys Met Ile Asp Thr Tyr1 5 10 15Gly Asn Glu Phe Lys Ile Pro Asp Tyr Thr Ile Lys Gln Ile Arg Asp20 25 30
Ala Ile Pro Ala His Cys Tyr Gln Arg Ser Ala Ala Thr Ser Leu Tyr35 40 45Tyr Val Phe Arg Asp Met Ala Ile Leu Ala Ser Val Phe Tyr Val Phe50 55 60His Asn Tyr Val Thr Pro Glu Thr Val Pro Ser Met Pro Val Arg Val65 70 75 80Val Leu Trp Thr Ile Tyr Thr Val Val Gln Gly Leu Val Gly Thr Gly85 90 95Val Trp Val Leu Ala His Glu Cys Gly His Gln Ala Phe Ser Thr Ser100 105 110Lys Val Leu Asn Asp Thr Val Gly Trp Ile Cys His Ser Leu Leu Leu115 120 125Val Pro Tyr Phe Ser Trp Lys Ile Ser His Gly Lys His His Lys Ala130 135 140Thr Gly Asn Ile Ala Arg Asp Met Val Phe Val Pro Lys Thr Arg Glu145 150 155 160Glu Tyr Ala Thr Arg Ile Gly Arg Ala Ala His Glu Leu Ser Glu Leu165 170 175Met Glu Glu Thr Pro Ile Leu Thr Ala Thr Asn Leu Val Leu Gln Gln180 185 190Leu Phe Gly Trp Pro Met Tyr Leu Leu Thr Asn Val Thr Gly His Asn195 200 205Asn His Glu Arg Gln Pro Glu Gly Arg Gly Lys Gly Lys Arg Asn Gly210 215 220Tyr Phe Gly Gly Val Asn His Phe Asn Pro Ser Ser Pro Leu Tyr Glu225 230 235 240Ala Lys Asp Ala Lys Leu Ile Val Leu Ser Asp Leu Gly Leu Phe Leu245 250 255Val Gly Ser Leu Leu Tyr Tyr Ile Gly Ser Thr Tyr Gly Trp Leu Asn260 265 270Leu Leu Val Trp Tyr Gly Ile Pro Tyr Leu Trp Val Asn His Trp Leu275 280 285Val Ala Ile Thr Phe Leu Gln His Thr Asp Pro Thr Leu Pro His Tyr290 295 300
Gln Pro Glu Ala Trp Asp Phe Thr Arg Gly Ala Ala Ala Thr Ile Asp305 310 315 320Arg Asp Phe Gly Phe Val Gly Arg His Ile Phe His Gly Ile Ile Glu325 330 335Thr His Val Leu His His Tyr Val Ser Thr Ile Pro Phe Tyr His Ala340 345 350Asp Glu Ala Ser Glu Ala Ile Gln Lys Val Met Gly Pro His Tyr Arg355 360 365Ser Glu Ala His Thr Gly Trp Thr Gly Phe Leu Lys Ala Leu Trp Thr370 375 380Ser Ala Arg Thr Cys Gln Trp Val Glu Pro Thr Glu Gly Ala Lys Gly385 390 395 400Glu Ser Gln Tyr Val Leu Phe Tyr Arg Asn Ile Asn Gly Ile Gly Val405 410 415Pro Pro Ala Lys Ile Pro Ala Lys420<210>22<211>466<212>PRT<213>Aspergillus flavus<400>22Met Ser Ser Thr Ala Ile Pro Lys Arg Met Ala Leu Asn Arg Asn Pro1 5 10 15Gly Thr Asp Ser Ser Val Pro Ser Val Ser Val Ser Pro Phe Asp Ser20 25 30Pro Arg His Ser Pro Ser Ser Thr Ser Leu Ser Ser Leu Ala Ser Glu35 40 45Ser Glu Asn Lys Gly Lys Met Leu Asp Thr Tyr Gly Asn Glu Phe Lys50 55 60Ile Pro Asp Tyr Thr Ile Lys Gln Ile Arg Asp Ala Ile Pro Ala His65 70 75 80Cys Tyr Glu Arg Lys Ala Leu Thr Ser Leu Tyr Tyr Val Phe Arg Asp85 90 95Ile Ala Met Leu Gly Ser Ile Phe Tyr Val Phe His Asn Tyr Val Thr100105110
Pro Glu Thr Val Pro Ser Phe Pro Ala Arg Val Ala Leu Trp Ser Leu115 120 125Tyr Thr Val Val Gln Gly Leu Ile Ala Thr Gly Val Trp Val Leu Ala130 135 140His Glu Cys Gly His Gln Ala Phe Ser Pro Ser Lys Val Leu Asn Asp145 150 155 160Thr Val Gly Trp Ile cys His Ser Ala Leu Leu Val Pro Tyr Phe Ser165 170 175Trp Lys Ile Ser His Gly Lys His His Lys Ala Thr Gly Asn Ile Ala180 185 190Arg Asp Met Val Phe Val Pro Lys Thr Arg Glu Glu Tyr Ala Ser Arg195 200 205Ile Gly Lys Thr Ile His Asp Leu Asn Glu Leu Met Glu Glu Thr Pro210 215 220Ile Ala Thr Val Thr Asn Leu Ile Leu Gln Gln Leu Phe Gly Trp Pro225 230 235 240Met Tyr Leu Leu Thr Asn Val Thr Gly His Asn Asn His Glu Arg Gln245 250 255Pro Glu Gly Arg Gly Lys Gly Lys Arg Asn Gly Tyr Phe Gly Gly Val260 265 270Asn His Phe Asn Pro Ser Ser Pro Leu Tyr Glu Ala Lys Asp Ala Lys275 280 285Leu Ile Val Leu Ser Asp Leu Gly Leu Ala Ile Thr Gly Ser Val Leu290 295 300Tyr Tyr Ile Gly Ser Thr Tyr Gly Trp Leu Asn Leu Leu Val Trp Tyr305 310 315 320Gly Ile Pro Tyr Leu Trp Val Asn His Trp Leu Val Ala Ile Thr Tyr325 330 335Leu Gln His Thr Asp Pro Thr Leu Pro His Tyr Gln Pro Glu Val Trp340 345 350Asn Phe Ala Arg Gly Ala Ala Ala Thr Ile Asp Arg Asp Phe Gly Phe355 360 365Val Gly Arg His Ile Leu His Gly Ile Ile Glu Thr His Val Leu His370 375 380
His Tyr Val Ser Thr Ile Pro Phe Tyr His Ala Asp Glu Ala Ser Glu385 390 395 400Ala Ile Gln Lys Val Met Gly Ser His Tyr Arg Thr Glu Ala His Thr405 410 415Gly Trp Thr Gly Phe Phe Lys Ala Leu Phe Thr Ser Ala Arg Val Cys420 425 430His Trp Val Glu Pro Thr Glu Gly Ala Arg Gly Glu Ser Glu Gly Val435 440 445Leu Phe Tyr Arg Asn Thr Asn Gly Ile Gly Val Pro Pro Ala Lys Leu450 455 460Ser Lys465<210>23<211>19<212>DNA<213>人工序列<220>
<223>引物TEF5′<400>23agagaccggg ttggcggcg19<210>24<211>30<212>DNA<213>人工序列<220>
<223>引物TEF3′<400>24ttggatcctt tgaatgattc ttatactcag30<210>25<211>29<212>DNA<213>人工序列<220>
<223>引物XPR5′<400>25tttccgcggc ccgagattcc ggcctcttc 29<210>26<211>31<212>DNA<213>人工序列<220>
<223>引物XPR3′
<400>26tttccgcgga cacaatatct ggtcaaattt c 31<210>27<211>39<212>DNA<213>人工序列<220>
<223>引物YL5<400>27cccccctcga ggtcgatggt gtcgataagc ttgatatcg 39<210>28<211>39<212>DNA<213>人工序列<220>
<223>引物YL6<400>28cgatatcaag cttatcgaca ccatcgacct cgagggggg 39<210>29<211>35<212>DNA<213>人工序列<220>
<223>引物YL9<400>29tggtaaataa atgatgtcga ctcaggcgac gacgg 35<210>30<21>35<212>DNA<213>人工序列<220>
<223>引物YL10<400>30ccgtcgtcgc ctgagtcgac atcatttatt tacca 35<210>31<211>37<212>DNA<213>人工序列<220>
<223>引物YL7<400>31caaccgattt cgacagttaa ttaataattt gaatcga37<210>32<21>37<212>DNA
<213>人工序列<220>
<223>引物YL8<400>32tcgattcaaa ttattaatta actgtcgaaa tcggttg37<210>33<211>36<212>DNA<213>人工序列<220>
<223>引物YL3<400>33gtataagaat cattcaccat ggatccacta gttcta 36<210>34<211>36<212>DNA<213>人工序列<220>
<223>引物YL4<400>34tagaactagt ggatccatgg tgaatgattc ttatac 36<210>35<211>30<212>DNA<213>人工序列<220>
<223>引物YL1<400>35cagtgccaaa agccaaggca ctgagctcgt30<210>36<211>31<212>DNA<213>人工序列<220>
<223>引物YL2<400>36gacgagctca gtgccttggc ttttggcact g 31<210>37<211>33<212>DNA<213>人工序列<220>
<223>引物YL61<400>37acaattccac acaacgtacg agccggaagc ata33
<210>38<211>33<212>DNA<213>人工序列<220>
<223>引物YL62<400>38tatgcttccg gctcgtacgt tgtgtggaat tgt33<210>39<211>26<212>DNA<213>人工序列<220>
<223>簡并引物P73<220>
<221>misc_feature<222>(24)..(24)<223>n is a,c,g,or t<400>39tgggtcctgg gccaygartg yggnca26<210>40<211>9<212>PRT<213>人工序列<220>
<223>Δ12去飽和酶中的共有序列<400>40Trp Val Leu Gly His Glu cys Gly His1 5<210>41<211>30<212>DNA<213>人工序列<220>
<223>簡并引物P76<220>
<221>misc_feature<222>(25)..(25)<223>n is a,c,g,or t<220>
<221>misc_feature<222>(28)..(28)<223>n is a,c,g,or t<400>41ggtggcctcc tcggcgtgrt araanggnat30
<210>42<211>10<212>PRT<213>人工序列<220>
<223>Δ12去飽和酶中的共有序列<220>
<221>MISC_FEATURE<222>(1)..(1)<223>Xaa=Met or Ile<400>42Xaa Pro Phe Val His Ala Glu Glu Ala Thr1 5 10<210>43<211>29<212>DNA<213>人工序列<220>
<223>引物P99<400>43ggcaagctta acgccccgct gtttgagaa 29<210>44<211>36<212>DNA<213>人工序列<220>
<223>引物P100<400>44tgacgttgtt agatctacgt gggtctcgat gatgtc36<210>45<211>35<212>DNA<213>人工序列<220>
<223>引物P101<400>45gacccacgta gatctaacaa cgtcaccgga tgggt 35<210>46<21>29<212>DNA<213>人工序列<220>
<223>引物P102<400>46cgggaattcg gggttgaagt ggttgacag 29
<210>47<211>16<212>DNA<213>人工序列<220>
<223>引物P119<400>47taataacgcc agggtt 16<210>48<211>22<212>DNA<213>人工序列<220>
<223>引物P120<400>48gtagaagggc attcgagaca cg22<210>49<211>22<212>DNA<213>人工序列<220>
<223>引物P121<400>49tgtgcccaag gaccgaaagg ag22<210>50<211>28<212>DNA<213>人工序列<220>
<223>引物P122<400>50tgcaggtagg tgatggccac gagttggg 28<210>51<211>1936<212>DNA<213>Yarrowia lioplytica<400>51cgtagttata tacaagaggt agatgcgtgc tggtgttaga ggggctctca ggattaggag 60gaaaatttga cattggccct caacatataa cctcgggtgt gcctctgttt accctcagct120tttgcttgtc cccaagtcag tcacgccagg ccaaaaaggt tggtggattg acagggagaa180aaaaaaaagc ctagtgggtt taaactcgag gtaagacatt gaaatatata ccggtcggca240tcctgagtcc ctttctcgta ttccaacaga ccgaccatag aaatggattc gaccacgcag300accaacaccg gcaccggcaa ggtggccgtg cagcccccca cggccttcat taagcccatt360gagaaggtgt ccgagcccgt ctacgacacc tttggcaacg agttcactcc tccagactac420
tctatcaagg atattctgga tgccattccc caggagtgct acaagcggtc ctacgttaag480tcctactcgt acgtggcccg agactgcttc tttatcgccg tttttgccta catggcctac540gcgtacctgc ctcttattcc ctcggcttcc ggccgagctg tggcctgggc catgtactcc600attgtccagg gtctgtttgg caccggtctg tgggttcttg cccacgagtg tggccactct660gctttctccg actctaacac cgtcaacaac gtcaccggat gggttctgca ctcctccatg720ctggtccctt actacgcctg gaagctgacc cactccatgc accacaagtc cactggtcac780ctcacccgtg atatggtgtt tgtgcccaag gaccgaaagg agtttatgga gaaccgaggc840gcccatgact ggtctgagct tgctgaggac gctcccctca tgaccctcta cggcctcatc900acccagcagg tgtttggatg gcctctgtat ctgctgtctt acgttaccgg acagaagtac960cccaagctca acaaatgggc tgtcaaccac ttcaacccca acgccccgct gtttgagaag 1020aaggactggt tcaacatctg gatctctaac gtcggtattg gtatcaccat gtccgtcatc 1080gcatactcca tcaaccgatg gggcctggct tccgtcaccc tctactacct gatcccctac 1140ctgtgggtca accactggct cgtggccatc acctacctgc agcacaccga ccccactctg 1200ccccactacc acgccgacca gtggaacttc acccgaggag ccgccgccac catcgaccga 1260gagtttggct tcatcggctc cttctgcttc catgacatca tcgagaccca cgttctgcac 1320cactacgtgt ctcgaattcc cttctacaac gcccgaatcg ccactgagaa gatcaagaag 1380gtcatgggca agcactaccg acacgacgac accaacttca tcaagtctct ttacactgtc 1440gcccgaacct gccagtttgt tgaaggtaag gaaggcattc agatgtttag aaacgtcaat 1500ggagtcggag ttgctcctga cggcctgcct tctaaaaagt agagctagaa atgttatttg 1560attgtgtttt aactgaacag caccgagccc gaggctaagc caagcgaagc cgaggggttg 1620tgtagtccat ggacgtaacg agtaggcgat atcaccgcac tcggcactgc gtgtctgcgt 1680tcatgggcga agtcacatta cgctgacaac cgttgtagtt tccctttagt atcaatactg 1740ttacaagtac cggtctcgta ctcgtactga tacgaatctg tgggaagaag tcacccttat 1800cagaccttca tactgatgtt tcggatatca atagaactgg catagagccg ttaaagaagt 1860ttcacttaat cactccaacc ctcctacttg tagattcaag cagatcgata agatggattt 1920gatggtcagt gctagc 1936<210>52<211>419<212>PRT<213>Yarrowia lipolytica<400>52Met Asp Ser Thr Thr Gln Thr Asn Thr Gly Thr Gly Lys Val Ala Val1 5 10 15Gln Pro Pro Thr Ala Phe Ile Lys Pro Ile Glu Lys Val Ser Glu Pro20 25 30
Val Tyr Asp Thr Phe Gly Asn Glu Phe Thr Pro Pro Asp Tyr Ser Ile35 40 45Lys Asp Ile Leu Asp Ala Ile Pro Gln Glu Cys Tyr Lys Arg Ser Tyr50 55 60Val Lys Ser Tyr Ser Tyr Val Ala Arg Asp Cys Phe Phe Ile Ala Val65 70 75 80Phe Ala Tyr Met Ala Tyr Ala Tyr Leu Pro Leu Ile Pro Ser Ala Ser85 90 95Gly Arg Ala Val Ala Trp Ala Met Tyr Ser Ile Val Gln Gly Leu Phe100 105 110Gly Thr Gly Leu Trp Val Leu Ala His Glu cys Gly His Ser Ala Phe115 120 125Ser Asp Ser Asn Thr Val Asn Asn Val Thr Gly Trp Val Leu His Ser130 135 140Ser Met Leu Val Pro Tyr Tyr Ala Trp Lys Leu Thr His Ser Met His145 150 155 160His Lys Ser Thr Gly His Leu Thr Arg Asp Met Val Phe Val Pro Lys165 170 175Asp Arg Lys Glu Phe Met Glu Asn Arg Gly Ala His Asp Trp Ser Glu180 185 190Leu Ala Glu Asp Ala Pro Leu Met Thr Leu Tyr Gly Leu Ile Thr Gln195 200 205Gln Val Phe Gly Trp Pro Leu Tyr Leu Leu Ser Tyr Val Thr Gly Gln210 215 220Lys Tyr Pro Lys Leu Asn Lys Trp Ala Val Asn His Phe Asn Pro Asn225 230 235 240Ala Pro Leu Phe Glu Lys Lys Asp Trp Phe Asn Ile Trp Ile Ser Asn245 250 255Val Gly Ile Gly Ile Thr Met Ser Val Ile Ala Tyr Ser Ile Asn Arg260 265 270Trp Gly Leu Ala Ser Val Thr Leu Tyr Tyr Leu Ile Pro Tyr Leu Trp275 280 285Val Asn His Trp Leu Val Ala Ile Thr Tyr Leu Gln His Thr Asp Pro290 295 300
Thr Leu Pro His Tyr His Ala Asp Gln Trp Asn Phe Thr Arg Gly Ala305 310 315 320Ala Ala Thr Ile Asp Arg Glu Phe Gly Phe Ile Gly Ser Phe Cys Phe325 330 335His Asp Ile Ile Glu Thr His Val Leu His His Tyr Val Ser Arg Ile340 345 350Pro Phe Tyr Asn Ala Arg Ile Ala Thr Glu Lys Ile Lys Lys Val Met355 360 365Gly Lys His Tyr Arg His Asp Asp Thr Asn Phe Ile Lys Ser Leu Tyr370 375 380Thr Val Ala Arg Thr Cys Gln Phe Val Glu Gly Lys Glu Gly Ile Gln385 390 395 400Met Phe Arg Asn Val Asn Gly Val Gly Val Ala Pro Asp Gly Leu Pro405 410 415Ser Lys Lys<210>53<211>25<212>DNA<213>人工序列<220>
<223>引物P147<400>53tcatgccatg gattcgacca cgcag 25<210>54<211>26<212>DNA<213>人工序列<220>
<223>引物P148<400>54acatgcggcc gcctactttt tagaag26<210>55<211>37<212>DNA<213>人工序列<220>
<223>引物P194<400>55agactccatg gcgtccactt cggctctgcc caagcag37
<210>56<211>44<212>DNA<213>人工序列<220>
<223>引物P195<400>56tttatagcgg ccgcctactt aagcaacggg cttgataaca gcgg44<210>57<211>12649<212>DNA<213>人工序列<220>
<223>質粒pKUNF12T6E<220>
<221>misc_feature<222>(2507)..(2507)<223>n is a,c,g,or t<220>
<221>misc_feature<222>(2512)..(2515)<223>n is a,c,g,or t<400>57taaccctcac taaagggaac aaaagctgga gctccaccgc ggacacaata tctggtcaaa 60tttcagtttc gttacataaa tcgttatgtc aaaggagtgt gggaggttaa gagaattatc120accggcaaac tatctgttaa ttgctaggta cctctagacg tccacccggg tcgcttggcg180gccgaagagg ccggaatctc gggccgcggt ggcggccgct tagttggtct tggacttctt240gggcttcttc aggtaggact ggacaaagaa gttgccgaac agagcgagca gggtgatcat300gtacacgccg agcagctgga ccagagcctg agggtagtcg caggggaaga ggtagtcgta360cagggactgc accagcatag ccatgaactg ggtcatctgc agagtggtga tgtagggctt420gatgggcttg acgaagccga agccctgaga ggaaaagaag tagtaggcgt acatgacggt480gtggacgaag gagttgagga tgacggagaa gtaggcgtcg ccaccaggag cgtacttggc540aatagcccac cagatggcga agatggtggc atggtggtac acgtgcagga aggagacctg600gttgaacttc ttgcacagga tcatgatagc ggtgtccagg aactcgtagg ccttggagac660gtagaacacg tagacgattc gggacatgcc ctgagcgtgg gactcgttgc ccttctccat720gtcgttgccg aagaccttgt agccacccag gatagcctgt cggatggtct cgacgcacat780gtagagggac agtccgaaga ggaacaggtt gtggagcagc ttgatggtct tcagctcgaa840gggcttctcc atctgcttca tgatgggaat gccgaagagc agcatggcca tgtagccgac900ctcgaaggcg agcatggtgg agacgtccat catgggcaga ccgtcggtca gagcgtaggg960cttagctccg tccatccact ggtcgacacc ggtctcgact cgtccgacca cgtcgtccca 1020gacagaggag ttggccatgg tgaatgattc ttatactcag aaggaaatgc ttaacgattt 1080
cgggtgtgag ttgacaagga gagagagaaa agaagaggaa aggtaattcg gggacggtgg1140tcttttatac ccttggctaa agtcccaacc acaaagcaaa aaaattttca gtagtctatt1200ttgcgtccgg catgggttac ccggatggcc agacaaagaa actagtacaa agtctgaaca1260agcgtagatt ccagactgca gtaccctacg cccttaacgg caagtgtggg aaccggggga1320ggtttgatat gtggggtgaa gggggctctc gccggggttg ggcccgctac tgggtcaatt1380tggggtcaat tggggcaatt ggggctgttt tttgggacac aaatacgccg ccaacccggt1440ctctcctgaa ttctgcatcg atcgaggaag aggacaagcg gctgcttctt aagtttgtga1500catcagtatc caaggcacca ttgcaaggat tcaaggcttt gaacccgtca tttgccattc1560gtaacgctgg tagacaggtt gatcggttcc ctacggcctc cacctgtgtc aatcttctca1620agctgcctga ctatcaggac attgatcaac ttcggaagaa acttttgtat gccattcgat1680cacatgctgg tttcgatttg tcttagagga acgcatatac agtaatcata gagaataaac1740gatattcatt tattaaagta gatagttgag gtagaagttg taaagagtga taaatagcgg1800ccgcgcctac ttaagcaacg ggcttgataa cagcgggggg ggtgcccacg ttgttgcggt1860tgcggaagaa cagaacaccc ttaccagcac cctcggcacc agcgctgggc tcaacccact1920ggcacatacg cgcactgcgg tacatggcgc ggatgaagcc acgaggacca tcctggacat1980cagcccggta gtgcttgccc atgatgggct taatggcctc ggtggcctcg tccgcgttgt2040agaaggggat gctgctgacg tagtggtgga ggacatgagt ctcgatgatg ccgtggagaa2100ggtggcggcc gatgaagccc atctcacggt caatggtagc agcggcacca cggacgaagt2160tccactcgtc gttggtgtag tggggaaggg tagggtcggt gtgctggagg aaggtgatgg2220caacgagcca gtggttaacc cagaggtagg gaacaaagta ccagatggcc atgttgtaga2280aaccgaactt ctgaacgagg aagtacagag cagtggccat cagaccgata ccaatatcgc2340tgaggacgat gagcttagcg tcactgttct cgtacagagg gctgcgggga tcgaagtggt2400taacaccacc gccgaggccg ttatgcttgc ccttgccgcg accctcacgc tggcgctcgt2460ggtagttgtg gccggtaaca ttggtgatga ggtagttggg ccagccnacg annnnctcag2520taagatgagc gagctcgtgg gtcatctttc cgagacgagt agcctgctgc tcgcgggttc2580ggggaacgaa gaccatgtca cgctccatgt tgccagtggc cttgtggtgc tttcggtggg2640agatttgcca gctgaagtag gggacaagga gggaagagtg aagaacccag ccagtaatgt2700cgttgatgat gcgagaatcg gagaaagcac cgtgaccgca ctcatgggca ataacccaga2760gaccagtacc gaaaagaccc tgaagaacgg tgtacacggc ccacagacca gcgcgggcgg2820gggtggaggg gatatattcg ggggtcacaa agttgtacca gatgctgaaa gtggtagtca2880ggaggacaat gtcgcggagg atataaccgt atcccttgag agcggagcgc ttgaagcagt2940gcttagggat ggcattgtag atgtccttga tggtaaagtc gggaacctcg aactggttgc3000cgtaggtgtc gagcatgaca ccatactcgg acttgggctt ggcgatatca acctcggaca3060tggacgagag cgatgtggaa gaggccgagt ggcggggaga gtctgaagga gagacggcgg3120
cagactcaga atccgtcaca gtagttgagg tgacggtgcg tctaagcgca gggttctgct3180tgggcagagc cgaagtggac gccatggaga gctgggttag tttgtgtaga gagtgtgtgt3240tgctagcgac tttcggattg tgtcattaca caaaacgcgt cgtctcgaca ctgatcttgt3300cgtggatact cacggctcgg acatcgtcgc cgacgatgac accggacttt cgcttaagga3360cgtcagtaac aggcattgtg tgatgtgtag tttagatttc gaatctgtgg ggaaagaaag3420gaaaaaagag actggcaacc gattgggaga gccactgttt atatataccc tagacaagcc3480ccccgcttgt aagatgttgg tcaatgtaaa ccagtattaa ggttggcaag tgcaggagaa3540gcaaggtgtg ggtaccgagc aatggaaatg tgcggaaggc aaaaaaatga ggccacggcc3600tattgtcggg gctatatcca gggggcgatt gaagtacact aacatgacat gtgtccacag3660accctcaatc tggcctgatg agccaaatcc atacgcgctt tcgcagctct aaaggctata3720acaagtcaca ccaccctgct cgacctcagc gccctcactt tttgttaaga caaactgtac3780acgctgttcc agcgttttct gcctgcacct ggtgggacat ttggtgcaac ctaaagtgct3840cggaacctct gtggtgtcca gatcagcgca gcagttccga ggtagttttg aggcccttag3900atgatgcaat ggtgtcagtc gctggatcac gagtcttaat ggcagtattc gttcttattt3960gtgccattga gccccgttat cctcgtatct tctacccccc atcccatccc tttgttggtg4020caaccctacc catttattgt tgggtgcagc ccaaccgacg tggagagctt ggcttggcca4080tataaaaagg ccccccccta gtggcaatgg cagaaagtca gctgtgagtt gttgaatttg4140tcatctaggc ggcctggccg tcttctccgg ggcaattgtt cctctatagt actgcgtaca4200ctgtttaaac agtgtacgca gatctgcgac gacggaattc ctgcagccca tctgcagaat4260tcaggagaga ccgggttggc ggcgtatttg tgtcccaaaa aacagcccca attgccccaa4320ttgaccccaa attgacccag tagcgggccc aaccccggcg agagccccct tcaccccaca4380tatcaaacct cccccggttc ccacacttgc cgttaagggc gtagggtact gcagtctgga4440atctacgctt gttcagactt tgtactagtt tctttgtctg gccatccggg taacccatgc4500cggacgcaaa atagactact gaaaattttt ttgctttgtg gttgggactt tagccaaggg4560tataaaagac caccgtcccc gaattacctt tcctcttctt ttctctctct ccttgtcaac4620tcacacccga aatcgttaag catttccttc tgagtataag aatcattcac catggctgcc4680gctccctctg tgcgaacctt tacccgagcc gaggttctga acgctgaggc tctgaacgag4740ggcaagaagg acgctgaggc tcccttcctg atgatcatcg acaacaaggt gtacgacgtc4800cgagagttcg tccctgacca tcctggaggc tccgtgattc tcacccacgt tggcaaggac4860ggcaccgacg tctttgacac ctttcatccc gaggctgctt gggagactct cgccaacttc4920tacgttggag acattgacga gtccgaccga gacatcaaga acgatgactt tgccgctgag4980gtccgaaagc tgcgaaccct gttccagtct ctcggctact acgactcctc taaggcctac5040tacgccttca aggtctcctt caacctctgc atctggggac tgtccaccgt cattgtggcc5100aagtggggtc agacctccac cctcgccaac gtgctctctg ctgccctgct cggcctgttc5160
tggcagcagt gcggatggct ggctcacgac tttctgcacc accaggtctt ccaggaccga5220ttctggggtg atctcttcgg agccttcctg ggaggtgtct gccagggctt ctcctcttcc5280tggtggaagg acaagcacaa cactcaccat gccgctccca acgtgcatgg cgaggatcct5340gacattgaca cccaccctct cctgacctgg tccgagcacg ctctggagat gttctccgac5400gtccccgatg aggagctgac ccgaatgtgg tctcgattca tggtcctgaa ccagacctgg5460ttctacttcc ccattctctc cttcgctcga ctgtcttggt gcctccagtc cattctcttt5520gtgctgccca acggtcaggc tcacaagccc tccggagctc gagtgcccat ctccctggtc5580gagcagctgt ccctcgccat gcactggacc tggtacctcg ctaccatgtt cctgttcatc5640aaggatcctg tcaacatgct cgtgtacttc ctggtgtctc aggctgtgtg cggaaacctg5700ctcgccatcg tgttctccct caaccacaac ggtatgcctg tgatctccaa ggaggaggct5760gtcgacatgg atttctttac caagcagatc atcactggtc gagatgtcca tcctggactg5820ttcgccaact ggttcaccgg tggcctgaac taccagatcg agcatcacct gttcccttcc5880atgcctcgac acaacttctc caagatccag cctgccgtcg agaccctgtg caagaagtac5940aacgtccgat accacaccac tggtatgatc gagggaactg ccgaggtctt ctcccgactg6000aacgaggtct ccaaggccac ctccaagatg ggcaaggctc agtaagcggc cgcatgagaa6060gataaatata taaatacatt gagatattaa atgcgctaga ttagagagcc tcatactgct6120cggagagaag ccaagacgag tactcaaagg ggattacacc atccatatcc acagacacaa6180gctggggaaa ggttctatat acactttccg gaataccgta gtttccgatg ttatcaatgg6240gggcagccag gatttcaggc acttcggtgt ctcggggtga aatggcgttc ttggcctcca6300tcaagtcgta ccatgtcttc atttgcctgt caaagtaaaa cagaagcaga tgaagaatga6360acttgaagtg aaggaattta aattgccccg gagaagacgg ccaggccgcc tagatgacaa6420attcaacaac tcacagctga ctttctgcca ttgccactag gggggggcct ttttatatgg6480ccaagccaag ctctccacgt cggttgggct gcacccaaca ataaatgggt agggttgcac6540caacaaaggg atgggatggg gggtagaaga tacgaggata acggggctca atggcacaaa6600taagaacgaa tactgccatt aagactcgtg atccagcgac tgacaccatt gcatcatcta6660agggcctcaa aactacctcg gaactgctgc gctgatctgg acaccacaga ggttccgagc6720actttaggtt gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga acagcgtgta6780cagtttgtct taacaaaaag tgagggcgct gaggtcgagc agggtggtgt gacttgttat6840agcctttaga gctgcgaaag cgcgtatgga tttggctcat caggccagat tgagggtctg6900tggacacatg tcatgttagt gtacttcaat cgccccctgg atatagcccc gacaataggc6960cgtggcctca tttttttgcc ttccgcacat ttccattgct cggtacccac accttgcttc7020tcctgcactt gccaacctta atactggttt acattgacca acatcttaca agcggggggc7080ttgtctaggg tatatataaa cagtggctct cccaatcggt tgccagtctc ttttttcctt7140tctttcccca cagattcgaa atctaaacta cacatcacac aatgcctgtt actgacgtcc7200
ttaagcgaaa gtccggtgtc atcgtcggcg acgatgtccg agccgtgagt atccacgaca7260agatcagtgt cgagacgacg cgttttgtgt aatgacacaa tccgaaagtc gctagcaaca7320cacactctct acacaaacta acccagctct ccatggagtc cattgctccc ttcctgccct7380ccaagatgcc tcaggacctg ttcatggacc tcgccagcgc tatcggtgtc cgagctgctc7440cctacgtcga tcccctggag gctgccctgg ttgcccaggc cgagaagtac attcccacca7500ttgtccatca cactcgaggc ttcctggttg ccgtggagtc tcccctggct cgagagctgc7560ctctgatgaa ccccttccac gtgctcctga tcgtgctcgc ctacctggtc accgtgtttg7620tgggtatgca gatcatgaag aactttgaac gattcgaggt caagaccttc tccctcctgc7680acaacttctg tctggtctcc atctccgcct acatgtgcgg tggcatcctg tacgaggctt7740atcaggccaa ctatggactg tttgagaacg ctgccgatca caccttcaag ggtctcccta7800tggctaagat gatctggctc ttctacttct ccaagatcat ggagtttgtc gacaccatga7860tcatggtcct caagaagaac aaccgacaga tttcctttct gcacgtgtac caccactctt7920ccatcttcac catctggtgg ctggtcacct tcgttgctcc caacggtgaa gcctacttct7980ctgctgccct gaactccttc atccacgtca tcatgtacgg ctactacttt ctgtctgccc8040tgggcttcaa gcaggtgtcg ttcatcaagt tctacatcac tcgatcccag atgacccagt8100tctgcatgat gtctgtccag tcttcctggg acatgtacgc catgaaggtc cttggccgac8160ctggataccc cttcttcatc accgctctgc tctggttcta catgtggacc atgctcggtc8220tcttctacaa cttttaccga aagaacgcca agctcgccaa gcaggccaag gctgacgctg8280ccaaggagaa ggccagaaag ctccagtaag cggccgcaag tgtggatggg gaagtgagtg8340cccggttctg tgtgcacaat tggcaatcca agatggatgg attcaacaca gggatatagc8400gagctacgtg gtggtgcgag gatatagcaa cggatattta tgtttgacac ttgagaatgt8460acgatacaag cactgtccaa gtacaatact aaacatactg tacatactca tactcgtacc8520cgggcaacgg tttcacttga gtgcagtggc tagtgctctt actcgtacag tgtgcaatac8580tgcgtatcat agtctttgat gtatatcgta ttcattcatg ttagttgcgt acgaagtcgt8640caatgatgtc gatatgggtt ttgatcatgc acacataagg tccgacctta tcggcaagct8700caatgagctc cttggtggtg gtaacatcca gagaagcaca caggttggtt ttcttggctg8760ccacgagctt gagcactcga gcggcaaagg cggacttgtg gacgttagct cgagcttcgt8820aggagggcat tttggtggtg aagaggagac tgaaataaat ttagtctgca gaacttttta8880tcggaacctt atctggggca gtgaagtata tgttatggta atagttacga gttagttgaa8940cttatagata gactggacta tacggctatc ggtccaaatt agaaagaacg tcaatggctc9000tctgggcgtc gcctttgccg acaaaaatgt gatcatgatg aaagccagca atgacgttgc9060agctgatatt gttgtcggcc aaccgcgccg aaaacgcagc tgtcagaccc acagcctcca9120acgaagaatg tatcgtcaaa gtgatccaag cacactcata gttggagtcg tactccaaag9180gcggcaatga cgagtcagac agatactcgt cgaccttttc cttgggaacc accaccgtca9240
gcccttctga ctcacgtatt gtagccaccg acacaggcaa cagtccgtgg atagcagaat9300atgtcttgtc ggtccatttc tcaccaactt taggcgtcaa gtgaatgttg cagaagaagt9360atgtgccttc attgagaatc ggtgttgctg atttcaataa agtcttgaga tcagtttggc9420gcgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg9480ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt9540atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa9600gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc9660gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag9720gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt9780gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg9840aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg9900ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg9960taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 10020tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 10080gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt 10140taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 10200tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 10260tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 10320ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt 10380taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 10440tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt 10500cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 10560gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 10620cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 10680ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac 10740aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 10800atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc 10860tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact 10920gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 10980aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat 11040acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 11100ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 11160tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 11220aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 11280
catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 11340atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 11400aaaagtgcca cctgatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca 11460tcaggaaatt gtaagcgtta atattttgtt aaaattcgcg ttaaattttt gttaaatcag 11520ctcatttttt aaccaatagg ccgaaatcgg caaaatccct tataaatcaa aagaatagac 11580cgagataggg ttgagtgttg ttccagtttg gaacaagagt ccactattaa agaacgtgga 11640ctccaacgtc aaagggcgaa aaaccgtcta tcagggcgat ggcccactac gtgaaccatc 11700accctaatca agttttttgg ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg 11760gagcccccga tttagagctt gacggggaaa gccggcgaac gtggcgagaa aggaagggaa 11820gaaagcgaaa ggagcgggcg ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac 11880caccacaccc gccgcgctta atgcgccgct acagggcgcg tccattcgcc attcaggctg 11940cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa 12000gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca gtcacgacgt 12060tgtaaaacga cggccagtga attgtaatac gactcactat agggcgaatt gggcccgacg 12120tcgcatgcag tggtggtatt gtgactgggg atgtagttga gaataagtca tacacaagtc 12180agctttcttc gagcctcata taagtataag tagttcaacg tattagcact gtacccagca 12240tctccgtatc gagaaacaca acaacatgcc ccattggaca gatcatgcgg atacacaggt 12300tgtgcagtat catacatact cgatcagaca ggtcgtctga ccatcataca agctgaacaa 12360gcgctccata cttgcacgct ctctatatac acagttaaat tacatatcca tagtctaacc 12420tctaacagtt aatcttctgg taagcctccc agccagcctt ctggtatcgc ttggcctcct 12480caataggatc tcggttctgg ccgtacagac ctcggccgac aattatgata tccgttccgg 12540tagacatgac atcctcaaca gttcggtact gctgtccgag agcgtctccc ttgtcgtcaa 12600gacccacccc gggggtcaga ataagccagt cctcagagtc gcccttaat 12649<210>58<211>973<212>DNA<213>Yarrowia lipolytica<220>
<221>misc_feature<223>啟動子FBAIN<400>58aaattgcccc ggagaagacg gccaggccgc ctagatgaca aattcaacaa ctcacagctg 60actttctgcc attgccacta ggggggggcc tttttatatg gccaagccaa gctctccacg 120tcggttgggc tgcacccaac aataaatggg tagggttgca ccaacaaagg gatgggatgg 180ggggtagaag atacgaggat aacggggctc aatggcacaa ataagaacga atactgccat 240taagactcgt gatccagcga ctgacaccat tgcatcatct aagggcctca aaactacctc 300
ggaactgctg cgctgatctg gacaccacag aggttccgag cactttaggt tgcaccaaat360gtcccaccag gtgcaggcag aaaacgctgg aacagcgtgt acagtttgtc ttaacaaaaa420gtgagggcgc tgaggtcgag cagggtggtg tgacttgtta tagcctttag agctgcgaaa480gcgcgtatgg atttggctca tcaggccaga ttgagggtct gtggacacat gtcatgttag540tgtacttcaa tcgccccctg gatatagccc cgacaatagg ccgtggcctc atttttttgc600cttccgcaca tttccattgc tcggtaccca caccttgctt ctcctgcact tgccaacctt660aatactggtt tacattgacc aacatcttac aagcgggggg cttgtctagg gtatatataa720acagtggctc tcccaatcgg ttgccagtct cttttttcct ttctttcccc acagattcga780aatctaaact acacatcaca caatgcctgt tactgacgtc cttaagcgaa agtccggtgt840catcgtcggc gacgatgtcc gagccgtgag tatccacgac aagatcagtg tcgagacgac900gcgttttgtg taatgacaca atccgaaagt cgctagcaac acacactctc tacacaaact960aacccagctc tcc 973<210>59<211>957<212>DNA<213>Mortierella alpina<400>59atggagtcca ttgctccctt cctgccctcc aagatgcctc aggacctgtt catggacctc 60gccagcgcta tcggtgtccg agctgctccc tacgtcgatc ccctggaggc tgccctggtt120gcccaggccg agaagtacat tcccaccatt gtccatcaca ctcgaggctt cctggttgcc180gtggagtctc ccctggctcg agagctgcct ctgatgaacc ccttccacgt gctcctgatc240gtgctcgcct acctggtcac cgtgtttgtg ggtatgcaga tcatgaagaa ctttgaacga300ttcgaggtca agaccttctc cctcctgcac aacttctgtc tggtctccat ctccgcctac360atgtgcggtg gcatcctgta cgaggcttat caggccaact atggactgtt tgagaacgct420gccgatcaca ccttcaaggg tctccctatg gctaagatga tctggctctt ctacttctcc480aagatcatgg agtttgtcga caccatgatc atggtcctca agaagaacaa ccgacagatt540tcctttctgc acgtgtacca ccactcttcc atcttcacca tctggtggct ggtcaccttc600gttgctccca acggtgaagc ctacttctct gctgccctga actccttcat ccacgtcatc660atgtacggct actactttct gtctgccctg ggcttcaagc aggtgtcgtt catcaagttc720tacatcactc gatcccagat gacccagttc tgcatgatgt ctgtccagtc ttcctgggac780atgtacgcca tgaaggtcct tggccgacct ggatacccct tcttcatcac cgctctgctc840tggttctaca tgtggaccat gctcggtctc ttctacaact tttaccgaaa gaacgccaag900ctcgccaagc aggccaaggc tgacgctgcc aaggagaagg ccagaaagct ccagtaa 957<210>60<211>318<212>PRT<213>Mortierella alpina(GenBank Accession No.AX464731)
<400>60Met Glu Ser Ile Ala Pro Phe Leu Pro Ser Lys Met Pro Gln Asp Leu1 5 10 15Phe Met Asp Leu Ala Thr Ala Ile Gly Val Arg Ala Ala Pro Tyr Val20 25 30Asp Pro Leu Glu Ala Ala Leu Val Ala Gln Ala Glu Lys Tyr Ile Pro35 40 45Thr Ile Val His His Thr Arg Gly Phe Leu Val Ala Val Glu Ser Pro50 55 60Leu Ala Arg Glu Leu Pro Leu Met Asn Pro Phe His Val Leu Leu Ile65 70 75 80Val Leu Ala Tyr Leu Val Thr Val Phe Val Gly Met Gln Ile Met Lys85 90 95Asn Phe Glu Arg Phe Glu Val Lys Thr Phe Ser Leu Leu His Asn Phe100 105 110Cys Leu Val Ser Ile Ser Ala Tyr Met Cys Gly Gly Ile Leu Tyr Glu115 120 125Ala Tyr Gln Ala Asn Tyr Gly Leu Phe Glu Asn Ala Ala Asp His Thr130 135 140Phe Lys Gly Leu Pro Met Ala Lys Met Ile Trp Leu Phe Tyr Phe Ser145 150 155 160Lys Ile Met Glu Phe Val Asp Thr Net Ile Met Val Leu Lys Lys Asn165 170 175Asn Arg Gln Ile Ser Phe Leu His Val Tyr His His Ser Ser Ile Phe180 185 190Thr Ile Trp Trp Leu Val Thr Phe Val Ala Pro Asn Gly Glu Ala Tyr195 200 205Phe Ser Ala Ala Leu Asn Ser Phe Ile His Val Ile Met Tyr Gly Tyr210 215 220Tyr Phe Leu Ser Ala Leu Gly Phe Lys Gln Val Ser Phe Ile Lys Phe225 230 235 240Tyr Ile Thr Arg Ser Gln Met Thr Gln Phe cys Met Met Ser Val Gln245 250 255Ser Ser Trp Asp Met Tyr Ala Met Lys Val Leu Gly Arg Pro Gly Tyr
260 265 270Pro Phe Phe Ile Thr Ala Leu Leu Trp Phe Tyr Met Trp Thr Met Leu275 280 285Gly Leu Phe Tyr Asn Phe Tyr Arg Lys Asn Ala Lys Leu Ala Lys Gln290 295 300Ala Lys Ala Asp Ala Ala Lys Glu Lys Ala Arg Lys Leu Gln305 310 315<210>61<211>1374<212>DNA<213>Mortierella alpina<400>61atggctgccg ctccctctgt gcgaaccttt acccgagccg aggttctgaa cgctgaggct 60ctgaacgagg gcaagaagga cgctgaggct cccttcctga tgatcatcga caacaaggtg120tacgacgtcc gagagttcgt ccctgaccat cctggaggct ccgtgattct cacccacgtt180ggcaaggacg gcaccgacgt ctttgacacc tttcatcccg aggctgcttg ggagactctc240gccaacttct acgttggaga cattgacgag tccgaccgag acatcaagaa cgatgacttt300gccgctgagg tccgaaagct gcgaaccctg ttccagtctc tcggctacta cgactcctct360aaggcctact acgccttcaa ggtctccttc aacctctgca tctggggact gtccaccgtc420attgtggcca agtggggtca gacctccacc ctcgccaacg tgctctctgc tgccctgctc480ggcctgttct ggcagcagtg cggatggctg gctcacgact ttctgcacca ccaggtcttc540caggaccgat tctggggtga tctcttcgga gccttcctgg gaggtgtctg ccagggcttc600tcctcttcct ggtggaagga caagcacaac actcaccatg ccgctcccaa cgtgcatggc660gaggatcctg acattgacac ccaccctctc ctgacctggt ccgagcacgc tctggagatg720ttctccgacg tccccgatga ggagctgacc cgaatgtggt ctcgattcat ggtcctgaac780cagacctggt tctacttccc cattctctcc ttcgctcgac tgtcttggtg cctccagtcc840attctctttg tgctgcccaa cggtcaggct cacaagccct ccggagctcg agtgcccatc900tccctggtcg agcagctgtc cctcgccatg cactggacct ggtacctcgc taccatgttc960ctgttcatca aggatcctgt caacatgctc gtgtacttcc tggtgtctca ggctgtgtgc 1020ggaaacctgc tcgccatcgt gttctccctc aaccacaacg gtatgcctgt gatctccaag 1080gaggaggctg tcgacatgga tttctttacc aagcagatca tcactggtcg agatgtccat 1140cctggactgt tcgccaactg gttcaccggt ggcctgaact accagatcga gcatcacctg 1200ttcccttcca tgcctcgaca caacttctcc aagatccagc ctgccgtcga gaccctgtgc 1260aagaagtaca acgtccgata ccacaccact ggtatgatcg agggaactgc cgaggtcttc 1320tcccgactga acgaggtctc caaggccacc tccaagatgg gcaaggctca gtaa 1374
<210>62<211>457<212>PRT<213>Mortierella alpina(GenBank Accession No.AF465281)<400>62Met Ala Ala Ala Pro Ser Val Arg Thr Phe Thr Arg Ala Glu Val Leu1 5 10 15Asn Ala Glu Ala Leu Asn Glu Gly Lys Lys Asp Ala Glu Ala Pro Phe20 25 30Leu Met Ile Ile Asp Asn Lys Val Tyr Asp Val Arg Glu Phe Val Pro35 40 45Asp His Pro Gly Gly Ser Val Ile Leu Thr His Val Gly Lys Asp Gly50 55 60Thr Asp Val Phe Asp Thr Phe His Pro Glu Ala Ala Trp Glu Thr Leu65 70 75 80Ala Asn Phe Tyr Val Gly Asp Ile Asp Glu Ser Asp Arg Asp Ile Lys85 90 95Asn Asp Asp Phe Ala Ala Glu Val Arg Lys Leu Arg Thr Leu Phe Gln100 105 110Ser Leu Gly Tyr Tyr Asp Ser Ser Lys Ala Tyr Tyr Ala Phe Lys Val115 120 125Ser Phe Asn Leu Cys Tle Trp Gly Leu Ser Thr Val Ile Val Ala Lys130 135 140Trp Gly Gln Thr Ser Thr Leu Ala Asn Val Leu Ser Ala Ala Leu Leu145 150 155 160Gly Leu Phe Trp Gln Gln Cys Gly Trp Leu Ala His Asp Phe Leu His165 170 175His Gln Val Phe Gln Asp Arg Phe Trp Gly Asp Leu Phe Gly Ala Phe180 185 190Leu Gly Gly Val Cys Gln Gly Phe Ser Ser Ser Trp Trp Lys Asp Lys195 200 205His Asn Thr His His Ala Ala Pro Asn Val His Gly Glu Asp Pro Asp210 215 220Ile Asp Thr His Pro Leu Leu Thr Trp Ser Glu His Ala Leu Glu Met225 230 235 240Phe Ser Asp Val Pro Asp Glu Glu Leu Thr Arg Met Trp Ser Arg Phe
245 250 255Met Val Leu Asn Gln Thr Trp Phe Tyr Phe Pro Ile Leu Ser Phe Ala260 265 270Arg Leu Ser Trp Cys Leu Gln Ser Ile Leu Phe Val Leu Pro Asn Gly275 280 285Gln Ala His Lys Pro Ser Gly Ala Arg Val Pro Ile Ser Leu Val Glu290 295 300Gln Leu Ser Leu Ala Met His Trp Thr Trp Tyr Leu Ala Thr Met Phe305 310 315 320Leu Phe Ile Lys Asp Pro Val Asn Met Leu Val Tyr Phe Leu Val Ser325 330 335Gln Ala Val Cys Gly Asn Leu Leu Ala Ile Val Phe Ser Leu Asn His340 345 350Asn Gly Met Pro Val Ile Ser Lys Glu Glu Ala Val Asp Met Asp Phe355 360 365Phe Thr Lys Gln Ile Ile Thr Gly Arg Asp Val His Pro Gly Leu Phe370 375 380Ala Asn Trp Phe Thr Gly Gly Leu Asn Tyr Gln Ile Glu His His Leu385 390 395 400Phe Pro Ser Met Pro Arg His Asn Phe Ser Lys Ile Gln Pro Ala Val405 410 415Glu Thr Leu Cys Lys Lys Tyr Asn Val Arg Tyr His Thr Thr Gly Met420 425 430Ile Glu Gly Thr Ala Glu Val Phe Ser Arg Leu Asn Glu Val Ser Lys435 440 445Ala Thr Ser Lys Met Gly Lys Ala Gln450 455<210>63<211>1001<212>DNA<213>Yarrowia lipolytica<220>
<22>misc_feature<223>Promoter FBA<400>63taaacagtgt acgcagtact atagaggaac aattgccccg gagaagacgg ccaggccgcc60
tagatgacaa attcaacaac tcacagctga ctttctgcca ttgccactag ggggggcctt120tttatatggc caagccaagc tctccacgtc ggttgggctg cacccaacaa taaatgggta180gggttgcacc aacaaaggga tgggatgggg ggtagaagat acgaggataa cggggctcaa240tggcacaaat aagaacgaat actgccatta agactcgtga tccagcgact gacaccattg300catcatctaa gggcctcaaa actacctcgg aactgctgcg ctgatctgga caccacagag360gttccgagca ctttaggttg caccaaatgt cccaccaggt gcaggcagaa aacgctggaa420cagcgtgtac agtttgtctt aacaaaaagt gagggcgctg aggtcgagca gggtggtgtg480acttgttata gcctttagag ctgcgaaagc gcgtatggat ttggctcatc aggccagatt540gagggtctgt ggacacatgt catgttagtg tacttcaatc gccccctgga tatagccccg600acaataggcc gtggcctcat ttttttgcct tccgcacatt tccattgctc ggtacccaca660ccttgcttct cctgcacttg ccaaccttaa tactggttta cattgaccaa catcttacaa720gcggggggct tgtctagggt atatataaac agtggctctc ccaatcggtt gccagtctct780tttttccttt ctttccccac agattcgaaa tctaaactac acatcacaca atgcctgtta840ctgacgtcct taagcgaaag tccggtgtca tcgtcggcga cgatgtccga gccgtgagta900tccacgacaa gatcagtgtc gagacgacgc gttttgtgta atgacacaat ccgaaagtcg960ctagcaacac acactctcta cacaaactaa cccagctctc c 1001<210>64<211>819<213>Thraustochytrium aureum<400>64atggccaact cctctgtctg ggacgacgtg gtcggacgag tcgagaccgg tgtcgaccag 60tggatggacg gagctaagcc ctacgctctg accgacggtc tgcccatgat ggacgtctcc120accatgctcg ccttcgaggt cggctacatg gccatgctgc tcttcggcat tcccatcatg180aagcagatgg agaagccctt cgagctgaag accatcaagc tgctccacaa cctgttcctc240ttcggactgt ccctctacat gtgcgtcgag accatccgac aggctatcct gggtggctac300aaggtcttcg gcaacgacat ggagaagggc aacgagtccc acgctcaggg catgtcccga360atcgtctacg tgttctacgt ctccaaggcc tacgagttcc tggacaccgc tatcatgatc420ctgtgcaaga agttcaacca ggtctccttc ctgcacgtgt accaccatgc caccatcttc480gccatctggt gggctattgc caagtacgct cctggtggcg acgcctactt ctccgtcatc540ctcaactcct tcgtccacac cgtcatgtac gcctactact tcttttcctc tcagggcttc600ggcttcgtca agcccatcaa gccctacatc accactctgc agatgaccca gttcatggct660atgctggtgc agtccctgta cgactacctc ttcccctgcg actaccctca ggctctggtc720cagctgctcg gcgtgtacat gatcaccctg ctcgctctgt tcggcaactt ctttgtccag780tcctacctga agaagcccaa gaagtccaag accaactaa 819
<210>65<211>272<212>PRT<213>Thraustochytrium aureum<400>65Met Ala Asn Ser Ser Val Trp Asp Asp Val Val Gly Arg Val Glu Thr1 5 10 15Gly Val Asp Gln Trp Met Asp Gly Ala Lys Pro Tyr Ala Leu Thr Asp20 25 30Gly Leu Pro Met Met Asp Val Ser Thr Met Leu Ala Phe Glu Val Gly35 40 45Tyr Met Ala Met Leu Leu Phe Gly Ile Pro Ile Met Lys Gln Met Glu50 55 60Lys Pro Phe Glu Leu Lys Thr Ile Lys Leu Leu His Asn Leu Phe Leu70 75 80Phe Gly Leu Ser Leu Tyr Met Cys Val Glu Thr Ile Arg Gln Ala Ile85 90 95Leu Gly Gly Tyr Lys Val Phe Gly Asn Asp Met Glu Lys Gly Asn Glu100 105 110Ser His Ala Gln Gly Met Ser Arg Ile Val Tyr Val Phe Tyr Val Ser115 120 125Lys Ala Tyr Glu Phe Leu Asp Thr Ala Ile Met Ile Leu Cys Lys Lys130 135 140Phe Asn Gln Val Ser Phe Leu His Val Tyr His His Ala Thr Ile Phe145 150 155 160Ala Ile Trp Trp Ala Ile Ala Lys Tyr Ala Pro Gly Gly Asp Ala Tyr165 170 175Phe Ser Val Ile Leu Asn Ser Phe Val His Thr Val Met Tyr Ala Tyr180 185 190Tyr Phe Phe Ser Ser Gln Gly Phe Gly Phe Val Lys Pro Ile Lys Pro195 200 205Tyr Ile Thr Thr Leu Gln Met Thr Gln Phe Met Ala Met Leu Val Gln210 215 220Ser Leu Tyr Asp Tyr Leu Phe Pro Cys Asp Tyr Pro Gln Ala Leu Val225 230 235 240Gln Leu Leu Gly Val Tyr Met Ile Thr Leu Leu Ala Leu Phe Gly Asn
245 250 255Phe Phe Val Gln Ser Tyr Leu Lys Lys Pro Lys Lys Ser Lys Thr Asn260 265 270<210>66<211>10<212>DNA<213>Yarrowia lipolytica<220>
<221>misc_feature<222>(8)..(8)<223>n is a,c,g,or t<400>66mammatgnhs 10
權利要求
1.編碼真菌Δ12去飽和酶的分離的核酸片段,其選自由(a)分離的核酸片段,其編碼如SEQ ID NO4中給出的氨基酸序列;(b)分離的核酸片段,其與(a)在下面的條件下雜交0.1X SSC,0.1%SDS,65℃和用2X SSC,0.1%SDS,然后用0.1X SSC,0.1%SDS洗滌;或者(c)分離的核酸片段,其與(a)或者(b)互補,構成的組。
2.權利要求1的分離的核酸片段,其如SEQ ID NO3中給出。
3.權利要求1的分離的核酸片段,其從串珠鐮孢分離。
4.分離的核酸片段,其包含第一種核苷酸序列,該核苷酸序列編碼Δ12去飽和酶,基于Clustal比對方法與具有SEQ ID NO3中給出的序列的核酸片段比較時具有至少89.2%同一性;或者第二種核苷酸序列,其包含第一種核苷酸序列的互補序列。
5.分離的核酸片段,其包含編碼至少477個氨基酸的Δ12去飽和酶的第一種核苷酸序列,所述Δ12去飽和酶基于Clustal比對方法與具有SEQ ID NO4中給出的序列的多肽比較時具有至少95%同一性;或者第二種核苷酸序列,其包含第一種核苷酸序列的互補序列。
6.嵌合基因,其包含與適宜的調節序列有效連接的權利要求1-4任一項的分離的核酸片段。
7.經轉化的宿主細胞,其包含權利要求1-4任一項的分離的核酸片段。
8.根據權利要求7的經轉化的宿主細胞,其選自由細菌、植物、藻類、真菌和酵母構成的組。
9.根據權利要求8的經轉化的宿主細胞,其中所述酵母是油質酵母。
10.根據權利要求9的經轉化的宿主細胞,其中所述油質酵母選自由Yarrowia、假絲酵母屬、紅酵母屬、紅冬孢酵母屬、隱球菌屬、毛孢子菌屬和油脂酵母屬構成的組。
11.根據權利要求10的經轉化的宿主細胞,其中Yarrowia選自由Yarrowia lipolytica ATCC #20362,Yarrowia lipolytica ATCC#8862,Yarrowia lipolytica ATCC #18944,Yarrowia lipolyticaATCC #76982和Yarrowia lipolytica LGAM S(7)1構成的組。
12.產生亞油酸的方法,其包括a)提供油質酵母,其包含(i)編碼具有Δ12去飽和酶活性的多肽的分離的核酸,所述多肽當基于Clustal比對方法與具有SEQ ID NO4中給出的序列的多肽比較時具有至少56.3%同一性;和(ii)油酸來源;b)在其中編碼具有Δ12去飽和酶活性的多肽的分離的核酸片段表達并且油酸轉化成亞油酸的條件下生長步驟(a)的酵母;和c)任選回收步驟(b)的亞油酸。
13.根據權利要求12的方法,其中編碼具有Δ12去飽和酶活性的多肽的分離的核酸片段分離自選自由構巢曲霉、黃曲霉、煙曲霉、Magnaporthe grisea、粗糙脈孢霉、禾本科鐮孢和串珠鐮孢構成的組的真菌。
14.根據權利要求13的方法,其中具有Δ12去飽和酶活性的多肽的分離的核酸片段編碼選自SEQ ID NOs4、8、12、16、20、21和22的氨基酸序列。
15.根據權利要求12的方法,其中具有Δ12去飽和酶活性的多肽導致油酸向亞油酸的至少約70%的底物轉化百分數。
16.根據權利要求12的方法,其中具有Δ12去飽和酶活性的多肽導致油酸向亞油酸的至少約80%的底物轉化百分數。
17.具有Δ12去飽和酶活性的多肽導致油酸向亞油酸的至少約85%的底物轉化百分數。
18.產生不飽和脂肪酸的方法,其包括a)提供油質酵母,其包含(i)編碼具有Δ12去飽和酶活性的多肽的分離的核酸片段,所述多肽當基于Clustal比對方法與具有SEQ ID NO4中給出的序列的多肽比較時具有至少56.3%同一性;和(ii)編碼功能ω-3/ω-6脂肪酸生物合成途徑的基因;b)提供包含油酸的去飽和酶底物的來源;和c)將(a)的油質酵母與(b)的去飽和酶底物在其中產生多不飽和脂肪酸的條件下接觸;和d)任選回收步驟(c)的多不飽和脂肪酸。
19.根據權利要求18的方法,其中所述多不飽和脂肪酸選自ω-3和ω-6脂肪酸。
20.根據權利要求18的方法,其中編碼具有Δ12去飽和酶活性的多肽的分離的核酸片段由權利要求1-5任一項的核酸片段編碼。
21.根據權利要求18的方法,其中編碼具有Δ12去飽和酶活性的多肽的分離的核酸片段編碼具有選自SEQ ID NOs4,8,12,16,20,21和22構成的組的氨基酸序列。
22.根據權利要求18的方法,其中編碼功能ω-3/ω-6脂肪酸脂肪酸生物合成途徑的基因編碼選自由Δ6去飽和酶、延伸酶、Δ5去飽和酶、Δ4去飽和酶、Δ15去飽和酶、Δ9去飽和酶、Δ8去飽和酶、Δ9延伸酶和Δ17a去飽和酶構成的組的酶。
23.根據權利要求18的方法,其中ω-3和ω-6脂肪酸選自亞油酸、γ-亞麻酸、二十碳二烯酸、二同型-γ-亞麻酸、花生四烯酸、α-亞麻酸、十八碳四烯酸、二十碳三烯酸、二十碳四烯酸、二十碳五烯酸、二十二碳五烯酸和二十二碳六烯酸。
24.根據權利要求12或18的方法,其中油質酵母選自由Yarrowia sp.、假絲酵母屬、紅酵母屬、紅冬孢酵母屬、隱球菌、毛孢子菌和油脂酵母屬構成的組。
25.根據權利要求24的方法,其中Yarrowia sp.選自由Yarrowia lipolytica ATCC #20362,Yarrowia lipolytica ATCC#8862,Yarrowia lipolytica ATCC #18944,Yarrowia lipolyticaATCC #76982和Yarrowia lipolytica LGAM S(7)1構成的組。
26.通過權利要求12或18的方法產生的微生物油。
27.得到編碼Δ12去飽和酶的核酸片段的方法,其包括(a)用權利要求1的核酸片段探測基因組文庫;(b)鑒定與權利要求1的核酸片段雜交的DNA克隆;和(c)對包含步驟(b)中鑒定的基因組片段測序,其中所測序的基因組片段編碼Δ12去飽和酶。
28.得到編碼Δ12去飽和酶的核酸片段的方法,其包括(a)合成對應于SEQ ID NOs3中給出的序列的部分的至少一種寡核苷酸引物;和(b)使用步驟(a)的寡核苷酸引物擴增克隆載體中存在的插入片段;其中所擴增的插入片段編碼Δ12去飽和酶的氨基酸序列的一部分。
全文摘要
本發明涉及能夠催化油酸向亞油酸(LA;18:2)轉化的真菌Δ12脂肪酸去飽和酶。描述了編碼所述去飽和酶的核酸序列、與其雜交的DNA構建體,和表達水平增加的所述去飽和酶的重組宿主微生物。本文還描述了通過過表達Δ12脂肪酸去飽和酶增加產生特定ω-3和ω-6脂肪酸的方法。
文檔編號C12P7/64GK1878785SQ200480033338
公開日2006年12月13日 申請日期2004年11月12日 優先權日2003年11月12日
發明者N·S·亞達夫, Q·Q·朱, H·張 申請人:納幕爾杜邦公司