專利名稱:抗真菌蛋白及其編碼dna和摻入此dna的宿主的制作方法
技術領域:
本發明涉及可以作為抗真菌蛋白的新型氧化酶及其編碼DNA和摻入此DNA的宿主,以及通過使所述真菌病原體與所述蛋白接觸以抵抗真菌病原體的方法。本發明進一步涉及摻入和表達編碼抗真菌蛋白的DNA的植物和因此表現對真菌病原體易感性降低的植物。
背景技術:
在整個農作物栽培歷史中,農作物植株的真菌疾病是農作物損失的主要因素之一。農作物的單種栽培促進了真菌病原體強毒種類的增殖并且新的各種植物變得在急劇增加的侵襲植物的進化病原體強毒株大范圍危險中生長。由于攜帶病原體植物材料的國際運輸,使疾病的發生明顯惡化,使沒有機會產生對病原體抗性的植物與病原體接觸。因此由于人為的干預,宿主和病原體之間的天然平衡遭到破壞,在許多情況下帶來災難性的影響。這樣的情況導致了諸如19世紀期間出現在愛爾蘭的由馬鈴薯晚疫病真菌(致病疫霉)引起的災難性損失甚至饑荒。真菌病也可能使一些農作物在大面積范圍內完全不能生長,如萎焉鐮孢毀滅生長在美國東部的大面積番茄時或霜霉病(葡萄生單軸霉)真菌摧毀生長在歐洲部分區域的藤本植物時就是這種情況。真菌疾病的爆發也可能如荷蘭榆樹疾病(Ceratocystis ulmi)破壞整個英國榆樹(Ulmus procera)種群時發生的那樣對環境有嚴重的影響。除了在農作物生長期間導致的損失,真菌疾病可能產生進一步的收獲后損失。例如,各種軟腐病如灰葡萄孢尤其在軟水果中存在問題。真菌黃曲霉盡管不是真的引起疾病的真菌,但尤其在熱帶國家導致儲藏花生和玉米收獲后的腐病,并且是最嚴重的,因為它產生對人類非常有毒的毒素-黃曲霉毒素。
與真菌病相關的主要經濟問題存在于世界上更濕潤的部分,主要是歐洲西部和濕熱帶。各種農作物管理技術如輪作和避免機械上土壤傳播等可用于防止真菌病嚴重侵染的形成和傳播。植物育種已在增加許多農作物對重要疾病抗性方面取得顯著效果。例如,農作物育種者成功地將有效抵抗番茄尖鐮孢的抗性基因1和1-2導入番茄。然而,特別是當種特異抗性由于快速進化的病原體新種類而減弱時,問題仍然存在。在番茄中,尖鐮孢的另一個強毒株已經出現并且育種者正在尋求第三個有用的抗性基因。最近在生長在西部歐洲部分的谷類中黃銹病(條形柄銹菌)強毒株的爆發導致對具有對其它真菌抗性的品種使用的殺真菌劑快速增加。在這些特定情況下,如對育種者來說沒有天然來源的抗性可用的情況下,化學品廣泛地用于控制真菌病。
在世界的許多地方化學殺真菌劑仍然是農作物生產成本中的主要投入。據統計1990年21%的農業化學品銷售是用于殺真菌劑(5、54億美元)。農場主和種植者有強烈的降低它們投入成本的愿望。與經濟原因相提并論的是逐漸增強的環境因素。在更先進的經濟中,尤其是在北美和西歐,來自政治家和消費者的關于較少依靠化學品投入的農業的壓力逐漸增加。對于這樣的要求的理由可能缺乏公認的原理或科學的證據,但是對一些關于殘留在飲用水中或檢測到的殺蟲劑的量超過了食品殘留物所能接受的最小量的報道的恐懼正在增加。例如在荷蘭,有在2000年前將殺蟲劑的總用量降低50%的強制要求。
致病疫霉屬于稱為卵菌綱的真菌類。致病疫霉感染茄科的各個成員如馬鈴薯、番茄和一些觀賞植物。它引起馬鈴薯和番茄的晚疫病并影響除了根部以外的所有部分。此真菌在地理上廣泛分布并可以在所有生產馬鈴薯的國家中發現。馬鈴薯的晚疫病在經濟上非常重要的,因為在節令的早期侵染會嚴重降低農作物產量。目前通過定期噴灑化學殺真菌劑(二硫代氨基甲酸鹽類如代森錳鋅、代森錳和代森鋅)控制病害。從環境和經濟的觀點考慮,對由致病疫霉引起的病害的生物學控制比使用化學殺真菌劑更有利。
腐霉也屬于稱為卵菌綱的真菌類。腐霉屬不同于相關的疫霉屬,因為形成相對不分化的孢子囊。此真菌在地理上廣泛分布于所有陸地。由腐霉屬種類引起的第一種主要病害類型是由于對大田或苗圃中幼苗侵襲的突然和快速的發展而導致的枯萎。腐霉屬種類引起第二種類型的病害即根壞死并導致植物生長總體減慢(例如小麥和玉米)和產量損失。在歐洲由腐霉引起的主要損失是針對大田農作物如甜菜。損失基本上趨向于全或無。相似地,苗圃種植的觀賞植物和森林樹木也可能遭到完全破壞。(有關卵菌綱的綜述,參見歐洲植物病害手冊,由I.M.Smith等編輯,1988,Blackwell Scientific Publications,第8章)。
另一種真菌是葡萄孢,尤其灰葡萄孢,屬于半知菌類,它導致灰霉疫病或芽和花的疫病,它普遍存在于收獲后的軟熟水果上,但它也可能在收獲前出現。它也可以影響各種蔬菜如萵苣、豆類和番茄。葡萄孢的其它種類普遍存在于花卉如百合、唐菖蒲和郁金香上。
從TMV誘導的煙草葉中分離的具有抗真菌活性的蛋白公開于WO91/18984,該蛋白能引起致病疫霉的發芽孢子和菌絲尖裂解并使菌絲體以降低的速率生長。該蛋白具有約24千道爾頓的表觀分子量并命名為AP24。將由AP24基因的核酸序列推測的其完整氨基酸序列與數據庫中的已知蛋白比較,揭示了此蛋白是滲透蛋白樣蛋白。
盡管在抵抗真菌病原體如致病疫霉方面已取得初步成功,但是仍然需要鑒定能夠合成具有抗此真菌病原體活性的抗真菌蛋白的遺傳工程植株并分離具有抵抗此真菌的抗真菌活性的其它蛋白。
發明概述本發明提供可從植物來源獲得的具有針對卵菌綱優選地針對疫霉和/或腐霉的最有效的抗真菌活性并通過SDS(十二烷基磺酸鈉)-PAGE(聚丙烯酰凝膠)電泳測定分子量為約55-65千道爾頓的分離的蛋白。優選的蛋白是那些可從向日葵或萵苣植株獲得的蛋白。甚至更優選的蛋白是可從用水楊酸鈉誘導的向日葵或萵苣葉子獲得的蛋白。更優選的分離蛋白的特征在于選自含有選自SEQ ID NO:1,2或6,16,20,49,50,51,58,71,73或75中所示的氨基酸序列并具有抗真菌活性,特別是抗疫霉和/或抗腐霉活性的蛋白的群體及其突變蛋白。根據本發明所述的進一步優選的蛋白的特征在于它包括含有由SEQ ID NO:16,20,58,71,73或75代表的氨基酸序列或諸如由SEQ ID NO:6代表的部分序列的蛋白。
本發明也提供新型酶,其酶活性是碳水化合物的氧化。
本發明也包括包含能編碼根據本發明所述的蛋白的開放閱讀框架的分離DNA序列以及能在嚴格條件下與其雜交的DNA,優選地特征在于該開放閱讀框架能編碼根據本發明所述的蛋白。
本發明也提供根據本發明所述的嵌合DNA序列,進一步包含轉錄起始區域和選擇性地轉錄終止區域,它們與所述的開放閱讀框架連接使嵌合DNA在存在于存活宿主細胞中時能在宿主細胞中轉錄,從而產生含所述開放閱讀框架的RNA。根據本發明所述的優選的嵌合DNA序列是其包含開放閱讀框架的RNA能在存在于所述宿主細胞中時在宿主細胞中翻譯為蛋白從而合成所述蛋白的嵌合DNA序列。尤其優選的是包含如SEQ ID NO:15,19,57,70,72或74所示序列的DNA序列。
本發明也包括包含根據本發明所述的DNA序列的嵌合DNA序列,它可以選自復制子如細菌克隆質粒和載體如細菌表達載體、(非整合型)植物病毒載體、農桿菌Ti質粒載體如雙元載體等;以及包含根據本發明所述的復制子或載體并且一旦所述復制子存在其中時能維持該復制子的宿主細胞。根據實施方案優選的宿主細胞是植物細胞,所述的載體是非整合型病毒載體。
本發明進一步提供根據本發明所述的嵌合DNA序列穩定摻入其基因組的宿主細胞如植物細胞以及包含所述細胞或基本上由所述細胞組成的多細胞宿主如植物。尤其優選的是其特征在于根據本發明所述的嵌合DNA至少在許多植物細胞中表達以引起其中合成所述抗真菌蛋白的植物。
根據本發明的另一實施方案,提供了制備具有碳水化合物氧化酶活性的蛋白的方法,其特征在于根據本發明所述的宿主細胞在允許所述宿主細胞合成所述蛋白的條件下生長,選擇性地隨后進行從宿主細胞回收蛋白的步驟。
本發明的另一部分是涉及具有碳水化合物氧化酶活性的蛋白的抗真菌用途。
本發明也提供了根據本發明所述的蛋白的用途,即用于抑制真菌,優選地卵菌綱,并且更優選地疫霉和腐霉的生長。根據本發明的另一實施方案,抑制真菌的生長通過在植物上或植物鄰近處施用能合成蛋白的微生物或通過從微生物宿主收集蛋白并以農業化學制劑施用蛋白來實現。
本發明也提供了用于獲得對真菌尤其是對疫霉和/或腐霉具有降低的易感性的植物的方法,包括以下步驟(a)將嵌合DNA序列導入易于再生出完整植株的祖細胞,-所述嵌合DNA序列包含能編碼根據權利要求1-12中的任意一項所述的蛋白的開放閱讀框架,所述開放閱讀框架可操作性地與轉錄和翻譯區域及選擇性地轉錄終止區域連接,以使對所述真菌侵染易感的植物細胞中合成所述的蛋白,并且-所述嵌合DNA序列能編碼植物選擇性標記,以允許選擇所述選擇性標記存在其中的轉化祖細胞,并且(b)在有利于具有所述選擇性標記的祖細胞的條件下使所述祖細胞再生為植株,并且(c)鑒定合成根據權利要求1所述的蛋白的植物,由此降低所述植物對所述真菌侵染的易感性。
根據本發明優選的是特征在于步驟(a)使用能將T-DNA轉移入植物細胞并攜帶克隆入雙元載體pMOG800的所述嵌合DNA的根瘤農桿菌菌株進行的方法;另一個優選的方法是步驟(b)在存在抗生素從而有利于含有新霉素磷酸轉移酶的細胞的情況下進行的方法。
本發明進一步提供抗真菌組合物,包含根據本發明所述的蛋白和適當的載體。
本發明也提供能與根據本發明所述的蛋白N端片段,優選地與由SEQ ID NO:6,16,20,58,71,73或75代表的肽反應的抗體。該抗體適用于檢測能合成根據本發明所述的蛋白的宿主細胞和多細胞宿主,優選地檢測植物中根據本發明所述的嵌合DNA的表達水平。
本發明也提供可從編碼根據本發明所述的蛋白的基因獲得的核酸序列,所述的核酸序列在植物中具有組織特異性轉錄調控活性。本發明特別提供可從所述基因翻譯起始位點上游區域獲得的核酸序列,優選地所述基因翻譯起始位點緊鄰的上游區域的至少500個核苷酸。
附圖描述
圖1向日葵蛋白MS59不同純化步驟的SDS-PAGE(12.5%)。MW=分子量標記物;1=凝膠過濾(G25)后粗制的向日葵蛋白提取物;2=結合到陽離子交換層析(S-瓊脂糖)上的蛋白組分;3=陽離子交換層析(Mono S)后的活性組分;4=經疏水相互作用層析(苯基superose)的流出物;5=凝膠過濾后的活性組分。
圖2凝膠過濾(SD75)柱的不同組分(序號6-16)的SDS-PAGE(12.5%)。以3個稀釋度測試組分10-15對致病疫霉(A板)和終極腐霉(B板)的生長抑制。
圖3從天然PAGE的9個凝膠塊洗脫的組分的SDS-PAGE(12.5%)(泳道1-9),在天然PAGE中,含有MS59的SD75組分(SD75組分13)得到分離。右板SD75組分13(L)和洗脫實驗的2個組分,組分2(含有MS59)和組分5(含有約30千道爾頓蛋白)的SDS-PAGE(12.5%)。底部板用洗脫組分1-6測試對致病疫霉生長的抑制,每孔加入5微升和1微升。
圖4在向PDA培養基加入致病疫霉游動孢子囊之后24小時對體外真菌抑制實驗的顯微分析。左板對照培養,僅加入MES緩沖液。右板向培養物中加入在MES緩沖液中的大腸桿菌合成的MS59。
圖6:(A)WL64的SD75凝膠過濾。WL64在組分13,14,15洗脫。在圖頂部的箭頭表示分子量標記物。X軸組分序號。Y軸A280。
(B)SD75凝膠過濾曲線的組分11-17的12.5%SDS-PAGE凝膠的考馬斯亮藍染色。分子量標記物在右邊以千道爾頓表示。箭頭之間表示與抗真菌活性相關的蛋白條帶。
(C)體外抗真菌測試。10微升相應組分(500微升總體積)用于篩選立枯絲核菌菌絲的生長抑制。
圖7:WL64純化的12.5%SDS-PAGE凝膠的考馬斯亮藍染色。泳道1萵苣提取物;泳道2:HIC峰;泳道3:Source S峰;泳道4:MonoS峰;泳道5:SD75峰;泳道6:Mono P峰。分子量標記物在圖的兩側以千道爾頓表示。
圖8:(A)以葡萄糖為底物測定的MS59(空心菱形)、WL64(實心圓圈)和GOX(空心方形)的氧化酶活性的Lineweaver-Burk圖。對于MS59、WL64和GOX,每次測試的蛋白量分別是17,29和45納克。
(B)以真菌細胞壁為底物測定的MS59(空心菱形)、WL64(實心圓圈)和GOX(空心方形)的氧化酶活性的Lineweaver-Burk圖。對于MS59、WL64和GOX每次測試的蛋白量分別是17,29和225納克。
圖9:MS59(點形柱)、WL64(斜條紋柱)和GOX(實心柱)的氧化酶活性的底物特異性。
圖10本發明的蛋白MS59、WL64與來自擬南芥的兩個同系物At26(SEQ ID NO:71)和At27(SEQ ID NO:75)[含有已知的黃連素橋酶(berberine bridge enzyme)(EcBBE和PsBBe)]的匹配。保守的變化以灰色表示,而相同的區域(6個氨基酸中有3個相同)以黑色表示。
發明詳述為了舉例說明,已在體外分析中證明了本發明的蛋白對下列真菌的抗真菌效應致病疫霉,惡疫霉,煙草疫霉,大雄疫霉,終極腐霉,Pythium sylvaticum,堇菜腐霉,側雄腐霉,立枯絲核菌,Tanatephoruscucumeris,紫卷擔菌,白腐小核菌,巴斯德畢赤酵母和灰葡萄孢。顯然,根據本發明所述的蛋白或其編碼DNA在抵抗真菌的方法中的用途不限于針對上述真菌。沒有理由假定根據本發明所述的蛋白不具有抵抗比本文測試的更寬范圍的真菌,尤其是卵菌綱真菌的活性。
盡管以轉基因番茄、煙草、胡蘿卜、馬鈴薯和歐洲油菜(Brassicanapus)植物為例詳細地舉例說明了本發明,但是應該理解可以將一種或多種植物可表達的基因構建體提供給任何容易受某些形式的真菌侵襲尤其受上述真菌侵襲的植物種類,該構建體表達時在所述植物中過量合成根據本發明所述的蛋白以降低侵染比例和/或這樣的侵襲的影響。本發明甚至可以在目前不易于轉化的植物種類中實施,因為這樣的種類的易受性僅僅是時間問題而且轉化本身與構成本發明的原理無關。因此,適用于本說明書的目的的植物應包括被子植物和裸子植物,單子葉植物和雙子葉植物,它們可用于飼料、食物或工業加工的目的;也包括用于任何農業或園藝目的,包括林業和花卉培養,以及家庭花園或室內花園,或其它裝飾目的的植物。
根據本發明所述的蛋白可以通過從任何含有該蛋白的適當植物來源材料分離得到。特別適當的來源包含向日葵(Helianthus)的葉子和萵苣(萵苣Lollo bionda變種)的葉子。通過從植物種類制備植物提取物并使用如本文所述的體外抗真菌測試法測試這些提取物中抗真菌活性的存在,可以很容易地測定任何植物種類的植物來源材料中根據本發明所述的抗真菌蛋白的存在,通過適當的蛋白分級分離技術與體外測試結合進一步分級分離所得的樣品直至得到包含約55-65千道爾頓蛋白的抗真菌組分,內部命名為MS59或其同系物WL64,其分離的形式表現抗真菌活性。尤其是可以在卵菌綱如疫霉或終極腐霉等或其它真菌如擔子菌亞綱、子囊菌亞綱和接合菌類或其它綱或亞綱上測試該組分的抗真菌活性。
選擇性地,通過克隆包含能編碼所述蛋白或其前體的開放閱讀框架的DNA并將其中所述的開放閱讀框架與轉錄區域和選擇性地翻譯起始和轉錄終止區域連接,將所述DNA插入適當的宿主細胞并使所述的宿主合成所述蛋白,可以獲得根據本發明所述的抗真菌蛋白。隨后,可以優選地在所述宿主細胞將該蛋白分泌到培養基中之后,從所述宿主細胞回收蛋白。選擇性地,可以直接將所述宿主細胞作為可接受的殺蟲劑組合物用于根據本發明所述的抵抗真菌病原體的方法。
在獲得根據本發明所述的蛋白的方法中適用的宿主細胞可以選自原核微生物宿主如細菌如農桿菌、芽孢桿菌、藍細菌、大腸桿菌、假單胞菌等,以及真核宿主包括酵母如釀酒酵母、真菌如木霉和植物細胞,包括原生質體。
在植物葉子上或植物葉子附近抑制真菌生長的方法中,宿主細胞可以適當地選自常規用作生物殺真菌劑的種類。
蛋白也可以由微生物合成、得到收集并以農業化學制劑形式施用。
術語蛋白是指通過肽鍵連接的氨基酸序列。多肽或肽也應認為是蛋白。根據本發明所述的蛋白的突變蛋白可以通過替換、添加和/或缺失一個或多個氨基酸從序列表中所示的蛋白得到,而仍保持其抗真菌活性。采用體內蛋白質工程如通過改變能編碼抗真菌蛋白的開放閱讀框架從而影響氨基酸序列也可以容易地制備這樣的突變蛋白。只要氨基酸序列的改變不完全破壞抗真菌活性,這樣的突變蛋白也包含在本發明內。
本發明提供包含能編碼根據本發明所述的蛋白的開放閱讀框架的嵌合DNA序列。表達嵌合DNA序列是指包括含有不在自然界天然存在的DNA序列的任何DNA序列。例如,嵌合DNA應該指包括在植物基因組非天然位置包含所述開放閱讀框架的DNA,盡管所述植物基因組一般在其天然染色體位置含有開放閱讀框架的拷貝。相似地,所述的開放閱讀框架可以摻入到其非天然存在的植物基因組或非天然存在的復制子或載體如細菌質粒或病毒載體中。嵌合DNA將不限于可在宿主中復制的DNA分子,也包括能連接入復制子的DNA,如通過特定的接頭序列與根據本發明所述的開放閱讀框架連接的DNA。該開放閱讀框架可以或可以不與其天然的上游和下游調控元件連接。
開放閱讀框架可以來自基因組文庫。對于后者,它可以包含一個或多個分隔構成編碼根據本發明所述的蛋白的開放閱讀框架的外顯子的內含子。開放閱讀框架也可以由不間斷的外顯子或由合成編碼根據本發明所述的蛋白的mRNA的cDNA編碼。根據本發明所述的開放閱讀框架也包含其中已人工除去或加入一個或多個內含子的開放閱讀框架。本發明也包含所有這些變體。
編碼抗真菌蛋白的嵌合DNA序列也是本發明的一部分,所述的DNA序列包括SEQ ID NO:21-48中所示的一個或多個EST序列。如可以從序列表中得到的,這些至今未知功能的EST與編碼從Helianthus和Lactuca分離的蛋白的DNA序列有相當的同源性。
本發明的另一部分由根據本發明所述的蛋白的固有活性形成。已發現它們是碳水化合物氧化酶,能氧化許多不同的單糖和二糖。底物特異性與己糖氧化酶(EC1.1.3.5),也已知為D-己糖氧1-氧化還原酶的特異性相似。已證明它們能氧化真菌(來自絲核菌)細胞壁成分的純化混合物。據信此氧化能力賦予蛋白抗真菌特性。在文獻中,有一個抗真菌氧化酶的例子,即來自真菌曲霉(WO95/14784)的葡萄糖氧化酶。然而本發明的蛋白表現類似于己糖氧化酶的底物廣譜性并且對于底物具有更低的Km。
已從同源性研究發現根據本發明所述的蛋白的氨基酸序列的某些部分是較保守的并且與常見于氧化酶的序列相關。已發現與網狀番荔枝堿氧化酶有最高的同源性,該酶已知來源于罌粟科(Facchini,P.J.等,植物生理學,112,1669-1677,1996)。
為了能夠在宿主細胞中表達,根據本發明所述的嵌合DNA通常提供使之能被宿主生物化學機制識別并使開放閱讀框架在宿主中轉錄和/或翻譯的調控元件。調控元件通常包括可以適當地從能在所選的宿主細胞中表達的任何基因衍生的轉錄起始區域以及用于核糖體識別和結合的翻譯起始區域。在真核細胞中,表達盒通常還包含位于所述開放閱讀框架下游的轉錄終止區域,使轉錄終止并出現初始轉錄物的多聚腺苷化。另外,可以將密碼子用法調整為所選宿主接受的密碼子用法。控制嵌合DNA構建體在選定宿主細胞中表達的原理為本領域普通技術人員公知,并且現在對于任何種類的宿主細胞,原核細胞或真核細胞,可表達的嵌合DNA構建體的構建是常規技術。
為了在宿主細胞中維持開放閱讀框架,開放閱讀框架通常以包含與被選定的宿主細胞識別和復制的DNA連接的根據本發明所述的開放閱讀框架的復制子形式提供。因此,復制子的選擇主要根據所選的宿主細胞決定。指導選擇對于特定的所選細胞適合的復制子的原理為本領域普通技術人員熟知。
特定類型的復制子是其本身或其部分能轉移到另一宿主細胞如植物細胞中從而將根據本發明所述的開放閱讀框架共轉移到所述的植物細胞中的復制子。具有這樣的能力的復制子在本文中稱為載體。所述載體的一個例子是Ti質粒載體,該載體存在于適當宿主如根瘤農桿菌中時能轉移其本身的一部分,所謂的T-區域到植物細胞中。目前有不同類型的Ti質粒載體(參見EP0116718B1)常規地用于將嵌合DNA序列轉移到植物細胞或原生質體中,從中可以再生其中所述嵌合DNA穩定摻入其基因組的新植株。Ti質粒載體特別優選的形式是如EP0120516B1和US4,940,838中要求保護的所謂雙元載體。可用于將根據本發明所述的DNA導入植物宿主的其它適當載體可以選自病毒載體如非整合型植物病毒載體,如源自雙鏈植物病毒(例如CaMV)和單鏈病毒、雙生病毒等的載體。這樣的載體的使用尤其是當難于穩定轉化植物宿主時有利。對于木本種類,尤其是樹和藤可能是這種情況。
術語“在其基因組中摻入根據本發明所述的嵌合DNA序列的宿主細胞”是指包括其基因組穩定摻入了所述嵌合DNA從而維持該嵌合DNA并優選地通過有絲分裂或減數分裂將這樣的嵌合DNA的拷貝轉移到子代細胞中的細胞以及包含這樣的細胞或基本上由這樣的細胞組成的多細胞生物。根據本發明優選的實施方案,提供基本上由其基因組摻入了一個或多個拷貝的所述嵌合DNA的細胞組成并能優選地以孟德爾方式將一個或多個拷貝傳給其子代的植物。通過根據本發明所述的嵌合DNA在一些或所有植物細胞中的轉錄和翻譯,產生抗真菌蛋白的那些細胞將表現對真菌侵染尤其對致病疫霉侵染增強的抗性。盡管不是完全了解如上所述的指導DNA在植物細胞中轉錄的原理,但是目前能夠以基本上組成型方式,即基本上在植物的大多數細胞類型中和基本上沒有嚴格時間和/或發育限制表達的嵌合DNA的制備是常規技術。用于此目的的常規使用的轉錄起始區域是可從花椰菜花葉病毒得到的啟動子,尤其是35S RNA和19S RNA轉錄啟動子和根瘤農桿菌的所謂的T-DNA啟動子,特別值得提及的是胭脂堿合成酶啟動子、章魚堿合成酶啟動子(如EP 0122791 B1中公開的)和甘露堿合成酶啟動子。另外可以使用植物啟動子,它可以是基本上組成型的如水稻肌動蛋白基因啟動子或例如器官特異性的如根特異性啟動子。選擇性地,可以使用可由病原體誘導的啟動子如可從馬鈴薯得到的PRP1啟動子(也稱為gst1啟動子)[Martini N.等(1993),Mol.Gen.Genet.,263,179-186]。啟動子的選擇不是主要的,盡管有必要說明組成型高水平啟動子是略微優選的。進一步已知一些元件,所謂的增強子的重復可以大大增強在其控制下的DNA的表達水平[參見例如Kay等,(1987),科學,236:1299-1302:CaMV啟動子的-343和-90之間的序列的重復增強該啟動子的活性]。除了個別的或雙重加強的35S啟動子,高水平啟動子的例子是光誘導的核酮糖二磷酸羧化酶小亞基(rbcSSU)啟動子和葉綠素a/b結合蛋白(Cab)啟動子。本發明也涉及包含物理連接的不同啟動子區域元件的雜交啟動子。眾所周知的例子是所謂的CaMV加強的甘露堿合成酶啟動子(美國專利5,106,739),它包含與CaMV增強子連接的甘露堿合成酶啟動子。
至于轉錄終止子區域的必要性,通常認為這樣的區域加強了植物細胞中轉錄的可靠性和效率。因此它的使用在本發明內容中是非常優選的。
至于本發明在不同植物種類中的適用性,不得不提到雖然僅用轉基因番茄和煙草植物作為例子來說明本發明的特定實施方案,但是事實上,實際的適應性不限于這些植物種類。任何易于受某些形式的真菌侵襲特別是受卵菌綱如致病疫霉侵襲的植物種類都可以用根據本發明所述的蛋白處理或優選地提供根據本發明所述的嵌合DNA序列使蛋白在一些或所有植物細胞中合成。
盡管例如因為一些植物種類至今仍難以進行遺傳轉化,所以本發明的一些實施方案可能目前不能實施,但是本發明在這樣的植物種類中的實施僅僅是時間問題而不是原則問題,因為遺傳轉化本身的易受性與構成本發明實施方案的原理無關。
目前對于許多植物種類,包括雙子葉和單子葉植物綱,植物種類的轉化是常規技術。原則上,只要細胞能夠再生為完整植株,任何轉化方法都可用于將根據本發明所述的嵌合DNA導入適當的祖細胞。轉化方法可以適當選自用于原生質體的鈣/聚乙二醇方法(Klens,EA.等,1982,自然,296,72-74;Negrutiu I.等,1987年6月,植物分子生物學,8,363-373),原生質體的電穿孔(Shillito R.D.等,1985,生物/技術,3,1099-1102),向植物材料顯微注射(Crossway A.等,1986,Mol.Gen.Genet.,202,179-185),對各種植物材料的(DNA或RNA包裹的)微粒轟擊(Klein T.M.等,1987,自然,327,70),用(非整合型)病毒侵染等。根據本發明所述的優選的方法包括農桿菌介導的DNA轉移。尤其優選的是使用如EP A120516和美國專利4940838中公開的所謂雙元載體技術。番茄的轉化優選地基本上按照Van Roekel等所述的方法進行[Van Roekel,J.S.C.,Damm,B.,Melchers,L.S.,Koekema,A.(1993),影響番茄(Lycopersicon esculentum)轉化效率的因子,植物細胞報道,12,644-647]。馬鈴薯的轉化優選地基本上按照Koekema等所述的方法進行[Koekema,A.,Huisman,M.J.,Molendijk,L.,van den Elzen,P.J.M.和Cornelissen,B.J.C.(1989),兩種商業馬鈴薯栽培品種馬鈴薯X病毒抗性的遺傳工程,生物/技術,7,273-278]。
通常,選擇存在一個或多個標記物的轉化植物細胞或細胞群體,其中所述的標記物由與編碼根據本發明所述的蛋白的核酸序列共轉化的植物可表達基因編碼,此后使轉化材料再生為完整植株。
盡管有時認為單子葉植物更難于進行遺傳轉化,但是有些單子葉植物易于轉化,并且可以從轉化的細胞或胚、或其它植物材料再生可育的轉基因植株。目前,優選的轉化單子葉植物的方法是對胚、外植體或懸浮細胞進行微粒轟擊和直接DNA攝入或電穿孔(Shimamoto等,1989,自然,338,274-276)。已通過微粒轟擊將編碼膦絲菌素酰基轉移酶(使除草劑膦蘇菌素失活的酶)的吸水鏈霉菌bar基因導入玉米懸浮培養物的成胚細胞得到轉基因玉米植物(Gordon-Kamm,1990,植物細胞,2,603-618)。已有報道將遺傳材料導入到其它單子葉農作物如小麥和大麥的糊粉原生質體(Lee,1989,植物分子生物學,13,21-30)。已通過選擇老化致密和結節的成胚愈傷組織來建立成胚懸浮培養物并從成胚懸浮培養物再生小麥植株(Vasil,1990,生物/技術,8,429-434)。與用于這些農作物的轉化系統結合可使本發明應用于單子葉植物。
包括商業上重要的農作物如水稻和玉米的單子葉植物也易于通過農桿菌菌株進行DNA轉移[參見WO94/00977;EP0159418 B1;GouldJ,Michael D,Hasegawa O,Ulian EC,Peterson G,Smith RH,(1991)植物生理學,95,426-434]。
在DNA轉移和再生后,例如可以利用Southern分析評估假設轉化的植株中根據本發明所述的嵌合DNA的存在、拷貝數和/或基因組構成。另外,選擇性地可以使用具有本領域普通技術的人員熟知的Northern和/或Western分析檢測新導入DNA的表達水平。選擇性地,在最初分析之后,對表現新導入的根據本發明所述的嵌合DNA的所需拷貝數和表達水平的轉化植物進行抵抗對根據本發明所述的蛋白敏感的病原體如致病疫霉的抗性水平的檢測。選擇性地,可以對選擇的植株進行另一輪轉化,例如導入其它基因如編碼幾丁質酶、葡聚糖酶、滲透蛋白,爪蟾抗菌肽等的基因以便加強抗性水平或增加對如此處所述的體外測試中沒有發現對根據本發明所述的蛋白易感的其它真菌的抗性。
其它評估可以包括大田條件下的抗真菌抗性測試,檢測可育性、產量和其它特性。這樣的測試對于本領域普通技術人員是常規操作。
在這樣的評估之后,可以直接培養轉化植株,但是通常它們可在新品種育種或制備雜種等情況時用作親本株系。
許多植物蛋白表現抗真菌活性,然而有一些蛋白本身沒有抗真菌活性,但是如果與其它植物蛋白結合使用就產生顯著的協同抗真菌效應。在歐洲專利申請440,304 A1中公開了植物可表達的葡聚糖酶基因與來自馬鈴薯的堿性幾丁質酶在轉基因植物中同時過量表達導致比僅表達植物可表達的Ⅰ類幾丁質酶的植物更高水平的抗性。
幾丁質酶、葡聚糖酶、滲透蛋白、爪蟾抗菌膚和根據本發明所述的新型抗真菌蛋白基于不相容的病原體-植物相互作用在侵染的植物組織中積累。根據此觀察結果和發現幾種蛋白互相增強抗真菌效應的事實,我們預測根據本發明所述的抗真菌蛋白可以適當地用于和與病原體抗性相關的其它蛋白結合。
可以用于與根據本發明所述的蛋白結合的蛋白的例子包括但不限于從大麥(Swegle M.等,1989,植物分子生物學,12,403-412;BalanceG.M.等,1976,加拿大植物科學雜志,56,459-466;Hoj P.B.等,1988,FEBS Lett.,230,67-71;Hoj P.B.等,1989,植物分子生物學,13,31-421989),大豆(Boller T.等,1983,Planta,157,22-31;Broglie K.E.等,1986,美國國家科學院院報,83,6820-6824;Vogeli U.等,1988,Planta,174,364-372;Mauch F.& Staehelin L.A.,1989,植物細胞,1,447-457);黃瓜(Motraux J.P.& Boller T.,1986,Physiol.Mol.Plant Pathol.,28,161-169);韭蔥(Spanu P.等,1989,Planta,177,447-455);玉米(Nasser W.等,1988,植物分子生物學,11,529-538);燕麥(Fink W.等,1988,植物生理學,88,270-275),豌豆(Mauch F.等,1984,植物生理學,76,607-611;Mauch F.等,1988,植物生理學,87,325-333),白楊(Parsons,T.J.等,1989,美國國家科學院院報,86,7895-7899),馬鈴薯(Gaynor J.J.,1988,核酸研究,16,5210;Kombrink E.等,1988,美國國家科學院院報,85,782-786;Laflamme D.和Roxby R.,1989,植物分子生物學,13,249-250),煙草(例如Legrand M.等,1987,美國國家科學院院報,84,89-93),番茄(Joosten M.H.A.& De Wit P.J.G.M.1989,植物生理學,89,945-951),小麥(Molano J.等,1979,生物化學雜志,254,4901-4907)等獲得的β-1,3-葡聚糖酶和幾丁質酶。
為了獲得能夠組成型表達一個以上嵌合基因的轉基因植物,有許多可供選擇的方法可以使用,包含下列方法A.使用諸如雙元質粒上的T-DNA的DNA和與選擇性標記基因物理連接的多個修飾基因。此方法的優點是嵌合基因是物理連接的,因此作為單個孟德爾基因座遷移。
B.每個已經能夠表達優選地與選擇性標記基因偶聯的一個或多個嵌合基因的轉基因植物與來自含有與另一個選擇性標記基因偶聯的一個或多個嵌合基因的轉基因基因的花粉進行交叉授粉。之后基于兩個選擇性標記基因的存在或基于嵌合基因本身的存在來選擇通過這種雜交獲得的種子。之后來自選擇的種子的植物可以用于進一步雜交。原則上,嵌合基因不只在單個基因座上,因此基因可以作為獨立的基因座分離。
C.使用許多各含有一個或多個嵌合基因和選擇性標記的多個嵌合DNA分子如質粒。如果共轉化頻率高,那么僅基于一個標記物的選擇是足夠的。在其它情況下,基于一個以上標記物的選擇是優選的。
D.用選擇性地包含選擇性標記基因的新的嵌合DNA連續轉化已經含有第一、第二等嵌合基因的轉基因植物。如方法B,原則上嵌合基因不是在單個基因座上,因此嵌合基因可以作為獨立的基因座分離。
E.上述方案的結合實際策略可取決于可能易于決定的幾種考慮如親本株系的目的(直接生長,用于育種計劃,用于產生雜種),但是對于所述發明不是關鍵。
在本文中,應該強調已經含有能編碼抗真菌蛋白的嵌合DNA的植物可以形成適于導入根據本發明所述的嵌合DNA的遺傳背景以增強抗性水平或擴大抗性。對應于可以適當地用于與DNA結合的蛋白的其它基因的克隆和能相對過量表達所述蛋白的轉基因植物的獲得以及其在植物中對病原體抗性效應的評估目前在本領域普通技術人員的范圍之內。
得到能夠表達或相對過量表達根據本發明所述的蛋白的轉基因植物是用于阻止由真菌例如諸如致病疫霉的卵菌綱導致的破壞的優選方法,這一點在上面描述中是非常清楚的。但是,本發明不限于此。本發明也清楚地預想到根據本發明所述的蛋白本身,優選地以抗真菌組合物形式的用途。殺真菌組合物包括那些其中以蛋白本身配制的組合物,但也以能合成蛋白從而導致病原體與蛋白接觸的宿主細胞如細菌細胞形式存在。適當的宿主細胞例如可以選自無害的細菌和真菌,優選地那些能在植物根部和/或葉部形成菌落的菌。可用于根據本發明所述的方法的細菌宿主的例子是農桿菌屬、節桿菌屬、固氮螺菌屬、假單胞菌屬、根瘤菌屬等菌株,選擇性地在使它們適于該目的之后使用。
含有根據本發明所述的抗真菌蛋白的組合物另外包含如WO91/18984中所述的滲透蛋白樣蛋白。本發明獨立地提供進一步包含抑制劑如經典的真菌抗生素,SAFP和化學殺真菌劑如多氧菌素、三國霉素、羧酰胺、芳香碳水化合物、萎銹靈、嗎啉、固醇生物合成抑制劑、有機磷混合物、酶如葡聚糖酶,幾丁質酶,溶菌酶等的抗真菌組合物。本發明的抗真菌蛋白本身或者與其它活性組分結合的施用濃度在1納克/毫升和1毫克/毫升之間,優選地2納克/毫升和0.1毫克/毫升之間,pH在3.0到9.0范圍內。一般希望使用緩沖制劑,例如濃度在1mM和1M之間,優選地10mM和100mM之間,特別是15和50mM之間的磷酸緩沖液,因此對于低緩沖液濃度的情況,需要加入鹽以增加離子強度,優選的是濃度在1mM和1M之間,優選地10mM和100mM之間的氯化鈉。
具有針對真菌病,尤其是針對由諸如疫霉和腐霉的卵菌綱引起的病害增強的抗性的相對過量表達根據本發明所述的蛋白的植物或其部分,包括植物變種可以在大田、溫室中生長或在室內或其它地方生長。植物或其可食用的部分可以用作動物飼料或人類消費品或加工成為食品、飼料或用于其它任何形式的農業或工業目的。農業應該是指包括園藝、樹木栽培、花卉栽培等。可從根據本發明所述的植物材料獲利的工業包含但不限于醫藥工業、紙和紙漿制造工業、制糖工業、飼料和食品工業、酶制備工業等。根據本發明所述的植物或其部分的優點是減少對殺真菌劑處理的需求,因此降低材料、勞力的成本和環境污染或延長這樣的植物產品(例如水果,種子等)的儲存期。用于本發明目的的植物應該是指能夠光合作用的并對一些形式的真菌病易感的多細胞生物體。它們應該至少包括裸子植物和被子植物,單子葉和雙子葉植物。
術語“相對過量表達蛋白的植物”應該是指含有表達轉化基因編碼的蛋白的細胞的植物,其中蛋白在所述植物中不是天然存在的或者如果它由于編碼相同蛋白的內源基因而存在,但不以相同量或不在植物的同一細胞、細胞腔隙、組織或器官中存在。例如已知可以將正常在細胞內積累的蛋白導向質外體空間。
根據本發明的另一方面,編碼本發明的抗真菌蛋白的植物基因的調控區域可以用于在其控制下表達其它異源序列。使用緊接基因編碼區域上游的至少1000堿基對的調控元件足以獲得任何異源序列的表達。
在這方面的異源序列是指與所述調控區域天然不結合的基因區域,并且它們包含不同的基因編碼區域和反義基因區域。可以有利地在維管組織中表達的異源編碼區域包括編碼抗病原體蛋白如殺昆蟲、殺細菌、殺真菌和殺線蟲蛋白的那些區域。在這樣的策略中,可以證明選擇具有抵抗偏好韌皮部作為營養物(例如蚜蟲)或作為侵襲植物入口的病原體或害蟲的活性的蛋白非常有利。這樣的例子是抗蚜蟲的伸展蛋白、植物凝集素或脂肪氧合酶(參見WO93/04177)。假設根據本發明所述的調控區域在木質部有活性,在所述調控區域的控制下可以表達抗真菌蛋白以抵抗鐮刀菌屬、輪枝孢屬、鏈格孢屬和長緣殼屬種類。
根據本發明所述的調控區域也可有利地用于調節或控制韌皮部的轉運過程。對于本領域技術人員,易于認識到許多其它的應用。
內源基因的一部分以反義方向的表達(例如在EP0233399A中公開的)可以有效地負調節所述內源基因的表達從而具有有利的應用。而且編碼根據本發明所述的抗真菌蛋白基因本身可以使用反義方法得到負調節,反義方法可以幫助建立此蛋白的性質和功能。可以利用GUS標記以類似于本文所述方法的方式進一步闡明負責組織特異性表達的區域。
可以考慮以下現有技術特別地作為本發明涉及的本領域一般技術水平EP-A392225A2;EP-A440304A1;EP-A460753A2;WO90/07001A1;美國專利4940840。
本發明的另一方面是針對新型氧化酶的生產,由于它的低Km,此酶能在低濃度時氧化碳水化合物。更具體地說,己糖是此酶催化活性的底物,盡管其它糖也在較低程度上受影響。此酶可以從其天然存在的來源分離(根據本發明中所述的方法)或從用編碼該蛋白的可表達的基因轉化的植物或其它有機體分離。這些氧化酶可在工業過程中用于氧化碳水化合物如葡萄糖、甘露糖、半乳糖、纖維二糖、麥芽糖和乳糖。轉基因植物的評估隨后評估轉基因植物所需特性的存在和/或表達所需特征的程度。最初的評估可以包括新導入基因的表達水平、轉化植物對真菌的抗性水平、所需特征的穩定遺傳性、大田實驗等。
另外,如果需要,可以將轉化植物與其它品種如有較高商業價值的品種或已經導入其它所需特性的品種雜交育種或用于制備雜交種子或進行另一輪轉化等。協同作用預期根據本發明所述的抗真菌蛋白之一與植物或微生物來源的其它抗真菌蛋白的結合會表現強烈的協同抗真菌效應。如果將抗真菌CBPs或CHi-V與來自其它植物來源的β-1,3-葡聚糖酶或幾丁質酶結合,表現相似的協同抗真菌效應。
顯然,病原體誘導的蛋白的結合的協同作用是較普遍的現象,這種現象對于真菌抗性植物的遺傳工程有重要價值。
具有針對植物病原真菌的增強抗性的具商業利益的植物或其部分可以在大田中或溫室中生長,并且隨后用作動物飼料、直接的人類消費品,用于延長儲藏期,用于食品或其它工業加工等。根據本發明所述的植物或其部分的優點是降低了對殺真菌劑處理的需求,因此降低了物質、勞力的成本和環境污染或延長了這樣的植物產品(例如水果,種子等)的儲存期。
實驗部分用于DNA分離、操作和擴增的標準方法以及用于重組DNA復制的適當載體、適當細菌菌株、選擇性標記、培養基等例如在Maniatis等,分子克隆實驗室手冊,第2版(1989),冷泉港實驗室出版;DNA克隆Ⅰ和Ⅱ卷(D.N.Glover編,1985)和從基因到克隆(E.L.Winnacker編,1987)中描述。體外抗真菌測試所有真菌在馬鈴薯葡萄糖瓊脂(Difco)上于25℃培養,除了灰葡萄孢和黑脛莖點霉在燕麥粉瓊脂(Difco)上于25℃生長,致病疫霉在黑麥瓊脂上于18℃在黑暗中生長(Caten和Jinks,1968),灰葡萄孢和黑脛莖點霉在UV照射下培養。通過用水淹沒瓊脂平板收集形成孢子的真菌的孢子。將孢子的濃度調節到10000孢子/毫升。以立枯絲核菌和終極腐霉為例,在馬鈴薯葡萄糖培養液中于25℃培養液體振蕩培養物。收集菌絲體并振蕩1分鐘以從這些振蕩培養物制備接種物。在通過細篩后,將接種物的濃度調節到每毫升2500-5000個片段,每個片段各含1-3個細胞。
對于形成孢子的真菌,所有真菌都在施用蛋白樣品之前有和沒有預先形成孢子的情況下進行測試。對于不形成孢子的真菌,使用菌絲片段。
在純化期間,在根據Woloshuk等,1991所述使用真菌致病疫霉和終極腐霉或以相似的方法使用其它真菌的微量滴定板分析中監測抗真菌活性。在24孔微量滴定板的每個孔中,用吸管加入250微升馬鈴薯葡萄糖瓊脂(PDA)。將對于例如致病疫霉的真菌孢子和例如對于終極腐霉的菌絲片段重新懸浮于水中,并向加樣孔加入50毫升400-600孢子或200片段。隨后加入100微升過濾滅菌(0.22微米)的蛋白溶液(在50mMMES中,pH6.0)。用Parafilm包住微量滴定板并在室溫下培養。在開始保溫之后的幾個時間點,顯微監測加入蛋白對真菌的影響。2-3天后,在加樣孔中生長的真菌菌絲體用乳酚棉藍染色并評估生長程度。
GI生長抑制;使用0-4的評分,0=沒有可見的抑制,1=弱抑制(0-30%的抑制),2=中度(30-60%)抑制,3=強(60-90%)抑制,4=非常強(100%)的抑制。實施例1從用水楊酸誘導的向日葵純化的抗真菌蛋白MS59
用10mM水楊酸鈉每天噴灑7-8周齡的向日葵(向日葵zenulon栽培品種)植株的葉子,共5次。3小時后,用水充分沖洗植物以除去水楊酸鈉。在最后噴灑3天后,將葉子(400克)收集到液氮中并使用Waring攪拌器在500毫升0.5M醋酸鈉(pH5.2)和4克活性炭中于4℃勻漿。將勻漿液在4層奶酪布(cheese cloth)上過濾并隨后將濾液于4℃,20000g離心50分鐘。將上清液通過S-Sephadex(Fast-flow,Pharmacia)柱,柱長5厘米、直徑5厘米,用40mM醋酸鈉(pH5.2)平衡。用上述緩沖液(流速400-500毫升/小時)洗柱直到OD280下降到0。結合的蛋白用含400毫摩爾氯化鈉的200毫升上述緩沖液洗脫。
在逆著50毫摩爾MES(pH6.0)透析之后,分析洗脫液的抗真菌活性。使用真菌致病疫霉和終極腐霉在微量滴定板分析中監測抗真菌活性。參見上述關于體外測試的細節。隨后,再次使用陽離子交換層析,于是將洗脫液通過FPLC Mono-S HP5/5(Pharmacia)并用0-400毫摩爾的氯化鈉線性梯度洗脫。所有組分通過使用含有十二烷基硫酸鈉(SDS)的12.5%聚丙烯酰胺凝膠電泳[laemmli(1970),自然,227:680-685]進行分析,使用預染色的分子量標記物(15-105千道爾頓)作為參考。另外,監測所有組分針對致病疫霉和終極腐霉的抗真菌活性。抗真菌活性在45-60毫摩爾NaCl之間從柱中洗脫并且在所有活性組分中可見到59千道爾頓的條帶。將含有抗真菌活性的組分合并,并逆著含有1M硫酸銨的50毫摩爾磷酸鉀(pH7.0)透析。將合并液進行疏水相互作用層析,于是將樣品上樣到以相同緩沖液平衡的FPLC苯基Superose HR5/5(Pharmacia)中并用含于50毫摩爾磷酸鉀(pH7.0)中的逐漸降低的1-0M硫酸銨線性梯度洗脫。如上所述再將所有組分在SDS-PAGE上分析并監測抗真菌活性。也對不能與此柱結合的蛋白合并組分(FlowThrough,FT)在本文所選的條件下進行這樣的分析。抗真菌活性最豐富地存在于FT中,其次也在0.76到0.45mM硫酸銨之間洗脫的組分中。對于這兩種情況,在SDS-PAGE中可見59千道爾頓的蛋白。將FT和梯度組分逆著50毫摩爾MES、0.2M氯化鈉透析并分別在用相同緩沖液平衡的FPLC Superdex75HR10/30柱上(Pharmacia)層析。根據分子量大小從該柱洗脫蛋白。另外對于這兩種情況,59千道爾頓蛋白的存在與如由SDS-PAGE和體外抗真菌測試判斷的針對致病疫霉和終極腐霉的抗真菌活性一致。在疏水相互作用柱的FT中存在的59千道爾頓蛋白是最豐富的,稱為MS59,其純化在圖1中可見。其在凝膠過濾柱上分離的結果和隨后在SDS-PAGE中和對致病疫霉的分析結果在圖2中表示。梯度蛋白和M59的幾個特征(抗真菌活性,層析特性,分子量)表明這兩個蛋白非常相似。
為了進一步鑒定MS59,部分測定其氨基酸序列。因此,在上槽緩沖液含有0.1mM巰基乙酸鹽(thioglycolate)和12.5%聚丙烯酰胺凝膠上含有SDS的情況下分離MS59,該聚丙烯酰胺凝膠在上槽緩沖液含有0.05mM谷胱甘肽的情況下于50伏預電泳2小時。用含于45%(體積/體積)甲醇和10%乙酸中的5%(體積/體積)Serva Blue G對凝膠染色30分鐘并且在20%(體積/體積)醋酸中脫色30分鐘,切下59千道爾頓條帶并在Applied Biosystems477A蛋白測序儀上根據由制造商提供的方法利用埃德曼降解測序。MS59的N-末端氨基酸測序表明N-末端被封閉。為了獲得內部序列,用胰蛋白酶消化MS59。胰蛋白酶在精氨酸和賴氨酸殘基處裂解蛋白。消化產物在反相柱上分離并通過埃德曼降解分析。對兩個胰蛋白酶裂解的片段進行了測序Pep1和Pep2。Pep1的25個氨基酸殘基得到鑒定S-I-N-V-D-I-E-Q-E-T-A-W-V-Q-A-G-A-T-L-G-E-V-Y-Y-R(SEQ ID NO:1)。
氨基酸序列使用單字母符號給出。Pep2的25個氨基酸殘基進一步得到鑒定D-P-S-F-P-I-T-G-E-V-Y-T-P-G-(?)-S-S-F-P-T-V-L-Q-N-Y(SEQ ID NO:2)。
括號內的氨基酸殘基沒有得到明確鑒定。實施例2從天然PAGE洗脫抗真菌蛋白和隨后的測試從圖1和2明顯可以看到MS59不是完全純的。為了進一步確定59千道爾頓蛋白確實對觀察到的抗真菌活性負責,使用與如上所述相同的系統,但是不含SDS并在上樣之前不煮沸樣品,使含有59千道爾頓峰值的組分在天然凝膠上電泳。將凝膠泳道切割成0.5厘米水平方向的小塊,每小塊單獨在50毫摩爾Mes(pH6)中洗脫48小時。離心后,所得上清在SDS-PAGE上進行分析并分析其體外抗真菌活性。結果在圖3中表示。只在含有MS59的組分中觀察到針對致病疫霉和終極腐霉的抗真菌活性。實施例3針對非卵菌綱的體外抗真菌活性測試如在總實驗部分中所述的進行體外抗真菌活性測試。測試致病疫霉作為陽性對照。MS59峰定位于組分4。結果在表1表示。表1來自Mono-S(pH6)的含有MS59的組分的抗真菌效應
*)孢子=未預先萌發,萌發=萌發至萌發管為孢子長度的3-5倍,菌絲=菌絲片段用作起始接種物。
GI生長抑制;使用0-4的評分,0=無可見的生長抑制,1=弱(0-30%)抑制,2=中度(30-60%)抑制,3=強(60-90%)抑制,4=非常強(100%)的抑制。
可以看出,腐霉屬和疫霉屬種類看來對MS59非常敏感。實施例4從用水楊酸誘導的萵苣純化抗真菌蛋白WL64用10mM水楊酸鈉每天噴灑7-8周齡的萵苣植物(萵苣Lollobionda栽培品種)的葉子,共4天。2小時后,用水充分地沖洗植物以除去水楊酸鈉。在第5天,將葉子收集到液氮中并儲藏在-80℃直到進一步使用。
將萵苣葉子凍融并使用Waring攪拌器在0.5M醋酸鈉(pH5.2)、0.1%β-巰基乙醇[萵苣∶緩沖液=1∶1.5(重量/體積)]和10克活性炭/每千克葉子中于4℃勻漿。將勻漿液于4℃,9000g離心60分鐘。隨后將上清液在10層奶酪布上過濾,用硫酸銨使濾液達到40%飽和度,于9000g離心30分鐘。對含有85%的蛋白和相對于粗勻漿液大于95%的抗真菌活性的所得上清進行疏水相互作用層析。
將上清液用濾紙過濾并上樣到苯基Superose6FF High sub柱(Pharmacia,在Pharmacia XK50/20柱中的100毫升柱床體積)上,該柱用含于50毫摩爾磷酸鉀緩沖液(pH6.0中的40%(1.45M)硫酸銨(稱為緩沖液A)以10毫升/分鐘或更低的流速預平衡。用至少10倍柱體積的緩沖液A洗柱,之后在40分鐘期間用從100%緩沖液A到20%緩沖液A[50毫摩爾磷酸鉀(pH6.0)稱為緩沖液B]的降低的鹽梯度以10毫升/分鐘的流速,接著在30分鐘期間用從20%緩沖液A到0%緩沖液A(=100%B)的降低的線性梯度以相同的流速洗脫結合的蛋白。用緩沖液B洗滌該柱另一個45分鐘,之后洗脫結束。收集一分鐘級分組分(10毫升/分鐘)。組分40-75(稱為HIC峰)含有抗真菌活性。
將收集的組分濃縮[利用攪拌流動器和YM30千道爾頓膜(Amicon)]并隨后用25mM醋酸鈉(pH4.5)稀釋15倍。以10毫升/分鐘的流速將該溶液上樣到預先安裝的Source S柱(16/20,Pharmacia)上。在用5倍柱體積的所述緩沖液洗柱之后,在60分鐘期間用逐漸增加的氯化鈉梯度[含于25mM醋酸鈉(pH4.5)中的0-0.4氯化鈉]以2.5毫升/分鐘從該柱洗脫蛋白,收集1分鐘級分組分。將組分收集到250微升的1M磷酸鉀(pH7.0)中以中和相對酸性的醋酸鈉緩沖液。將含有抗真菌活性的組分[組分25-45(0.2-0.3M氯化鈉)]合并并稱為Source S峰。
將Source S峰濃縮并且緩沖液換為25mM醋酸鈉(pH4.5)得到約10毫升的組分,并進行使用Mono S柱(5/5,Pharmacia)的陽離子交換層析。用下面的氯化鈉梯度[含于25mM醋酸鈉(pH4.5)中的氯化鈉]洗脫0-5分鐘,0-0.1M氯化鈉;5-20分鐘,0.1-0.16M氯化鈉;20-21分鐘,0.16-0.25M氯化鈉;21-31分鐘,0.25M氯化鈉;31-32分鐘,0.25-1.0M氯化鈉;隨后用1.0M氯化鈉洗脫10分鐘,之后洗脫結束。抗真菌活性在0.25M氯化鈉步驟(通常組分22-30;Mono S峰)期間從該柱洗脫。以1毫升/分鐘的流速,將1毫升組分收集到100微升1M磷酸鉀(pH 7.0)中。
將Mono S峰濃縮至約0.5-1.0毫升并進行用含于50mM磷酸鉀(pH7.0)中的200mM氯化鈉作為電泳緩沖液的凝膠過濾層析(Superdex75,10/30,Pharmacia)。樣品體積是200微升;流速是0.5毫升/分鐘;0.5毫升/級分組分。從柱中洗脫的抗真菌活性在66千道爾頓標記物的位置。將活性組分(SD75峰)與SDS-PAGE上的蛋白模式比較,表明64千道爾頓蛋白是萵苣抗真菌蛋白最有可能的候選者(圖6A-C)。該蛋白稱為WL64。
將SD75峰緩沖液變換為pH9.5,并根據制造商的說明在Mono P柱(Pharmacia)上進行層析聚焦(chromatophocusing)。盡管有一些分離(在流出物中有3個重疊峰),但所有活性都在柱的流出物中發現(甚至對于將該柱平衡到pH11.0的情況)。流速是0.5毫升/分鐘;0.5毫升/級分組分。將含有抗真菌活性的組分合并,并且將緩沖液變換為50mMMES(pH6.0)。在SDS-PAGE之后對最高純化的蛋白組分進行考馬斯亮藍染色,表明約6個蛋白條帶是最顯著的,其中兩個條帶為64千道爾頓和55千道爾頓,(圖7)。推測的兩個蛋白在最終組分中的相對量是64千道爾頓蛋白為1/6-1/8,55千道爾頓蛋白為1/2-1/3。雖然在凝膠上表明此柱明顯地對64千道爾頓蛋白進行了純化,但是合并的組分中的比活以及蛋白的回收率下降了很多(參見表2)。
典型的純化步驟概括于表2中。表2 WL64的純化樣品或柱蛋白活性比活 純化回收率(毫克) (GI單位) (GI單位/mg) (X-倍)(%)萵苣(1.54毫克)提取物 685硫酸銨上清 584 101250 173 1 100HIC 17444000 253 1.46 43Source S 38.732400 837 4.84 32Mono S 2.3 8960 3896 22.5 8.8SD-75 0.452 8200 18142105 8.1Mono P 0.137 1752 12788 74 1.7活性以生長抑制單位(GI單位)表示。4個GI單位代表在如實施例的常規部分所述的體外測試中導致100%的生長抑制的蛋白量。實施例5從天然PAGE洗脫WL64和隨后的測試因為WL64不是完全純的,所以需進一步研究64千道爾頓蛋白是否確實對觀察到的抗真菌活性負責,在沒有SDS和β-巰基乙醇并且不煮沸樣品的情況下,將含有抗真菌活性峰值的Mono P組分于酸性條件下在天然的10%聚丙烯凝膠上電泳。將兩個鄰近的凝膠泳道切割成0.3厘米水平方向的小塊,一部分直接用于抗真菌測試,另一部分在變性條件下進行SDS-PAGE。生長抑制明顯與64千道爾頓蛋白相關,而不與55千道爾頓蛋白相關。實施例6WL64的糖基化按照說明通過與伴刀豆球蛋白A結合和采用洋地黃毒苷-葡聚糖檢測試劑盒(Boehringer)將WL64k以及55千道爾頓蛋白糖基化。兩種蛋白對糖肽酶-F處理不敏感,說明糖基化作用可能是O-連接的。實施例7WL64的氨基酸測序為了進行N-末端氨基酸序列測定,將21微克用量的純化蛋白(代表約4微克WL64)在7.5%聚丙烯酰胺凝膠上分離,并隨后吸印到PVDF膜上。用含于45%(體積/體積)甲醇,10%乙酸中的0.1%Serva Blue G在室溫下對膜染色5分鐘并且用45%甲醇,10%醋酸脫色。將64千道爾頓條帶切下并在Applied Biosystems477A蛋白測序儀上根據由制造商提供的方法利用埃德曼降解測序。
為了進行內部蛋白測序,將105微克純化蛋白(代表約20微克WL64)在7.5%SDS聚丙烯酰胺凝膠上分離,隨后用含于20%甲醇和0.5%乙酸中的0.2%Serva Blue G在室溫下對凝膠染色20分鐘并用30%甲醇在室溫下脫色約1小時。將64千道爾頓條帶切下,隨后用胰蛋白酶消化蛋白。消化產物在反相柱上分離并通過埃德曼降解分析。
除了N-末端的序列(SEQ ID NO:49),還對兩個胰蛋白酶裂解的片段進行了測序(SEQ ID NO:50和SEQ ID NO:51)。
SEQ ID NO:49:Thr-Ser-Thr-Ser-Ile-Ile-Asp-Arg-Phe-Thr-Gln-(Cys/Ser)-Leu-Asn-Asn-Arg-Ala-Asp-Pro-(Ser)-(Phe)-SEQ ID NO:50:(Ser)-Ile-(???)-Val-(Ser)-Ile-Glu-Asp-Glu-Thr-Ala-(Trp)-Val-Gln-Ala-Gly-Ala-Thr-Leu-Gly-Glu-Val-Tyr-(Tyr)-SEQ ID NO:51:Ala-Asp-Pro-Ser-Phe-Pro-Leu-Ser-Gly-Gln-Leu-Tyr-Thr-Pro-括號內的氨基酸殘基沒有得到明確鑒定。實施例8MS59和WL64的抗真菌活性根據MS59和WL64之間的序列同源性,兩個蛋白看來是互相非常相關的。這一點對于它們的抗真菌活性以及針對相應真菌的比活可能是正確的。對此推測進行測定,結果概括于表3中。表3MS59和WL64的抗真菌活性1病原體完全抑制(GI4)所需 完全抑制(GI4)所需的的WL64量 MS59量(ng/分析)(ng/分析)致病疫霉 105終極腐霉 105立枯絲核菌20 10Tanatephorus cucumeris20 未測試紫卷擔菌 15 7.5蔥核盤菌 40 20巴斯德畢赤酵母 未測試 5灰葡萄孢 200 101抗真菌測試按照總的實驗部分中所述的進行。
注意蛋白量通過在SDS-PAGE凝膠上的考馬斯亮藍染色估計,意味著此處所示的蛋白量是指示性的,而不是絕對的。實施例9氧化酶活性在冰上充分地對50毫升馬鈴薯葡萄糖培養液中的立枯絲核菌培養物進行超聲處理,隨后在4℃以3000g離心20分鐘。然后將獲得的上清液以25000g離心1小時。沉淀用去離子水洗2次并重新懸浮于含有1.0%Triton X-100的1毫升水中。以這種方式獲得真菌細胞壁懸浮液。
根據Gallo,1981的方法(Gallo,酶學方法,71:665-668,1981),使用試劑4-氨基-安替比林(4-AAP)測定氧化酶的活性。500微升的反應體積中含有50mM磷酸鉀緩沖液(pH7.0),0.25微摩爾FAD,10毫摩爾NaN3,0.01%Triton X-100,6mM2,4,6-三溴羥基苯甲酸,2mM4-AAP和10個單位的辣根過氧化物酶。在510nm處測定過氧化氫的合成。包括已知量的過氧化氫作為標準。
WL64以及MS59利用真菌細胞壁懸浮液作為底物發揮氧化酶活性。隨后盡可能以不同的底物如一些碳水化合物和氨基酸(參見實施例10)進行測試。發現葡萄糖和其它碳水化合物可作為WL64以及MS59的氧化酶活性底物。
因為WL64和MS59表現碳水化合物氧化酶和特別地葡萄糖氧化酶活性,所以需要調查真菌細胞壁懸浮液是否可作為來自黑曲霉(Sigma,G2133)的葡萄糖氧化酶(GOX)的底物。的確是這種情況。如通過Lineweaver-Bruk圖所示的(圖8A),動力學研究表明葡萄糖用作底物時MS59、WL64和GOX表現Mochaelis-Menten動力學。MS59和WL64的Km值比GOX的值低一個以上數量級對于WL64和MS59分別是19.5μM和23.3μM,對于GOX為359μM。這意味著MS59和WL64與葡萄糖的親和性高于GOX。然而WL64、MS59和GOX的Vmax值是相似的,分別為5.7,16.8,9.7μmol過氧化氫/分鐘/mg蛋白。
如圖8B所示,利用真菌細胞壁懸浮液作為底物的動力學研究表明,對于MS59和WL64表現Mochaelis-Menten動力學,但是對于GOX不是。利用上述的懸浮液,MS59和WL64的Km值分別是4.7μl和24.3μl。MS59和WL64的Vmax值分別為22.0和11.2μmol過氧化氫/分鐘/mg蛋白。由于GOX以真菌細胞壁作為底物的Lineweaver-Burk圖中不表現線性關系,所示不能從該圖中推斷出Km值和Vmax值。動力學數據概括于表4中。表4MS59,WL64和葡萄糖氧化酶的動力學參數
實施例10底物特異性盡可能以不同的底物進行測試。在蔗糖、山梨糖、果糖、羧甲基纖維素、β-丙氨酸、天冬氨酸、幾丁質、纖維素、谷氨酸鹽,甘氨酸-甘氨酸、昆布糖和葡萄糖之中,只有后者可用作至少WL64的底物。各種底物的濃度可以在5mM和50mM之間變動。進一步調查是否對于MS59和WL64葡萄糖是唯一的底物或者其它碳水化合物也可以被氧化。酶測試按照實施例9所述的進行,底物濃度是50mM。已證明GOX專一氧化葡萄糖(圖9)。相同的圖也表明MS59和WL64有更寬的底物特異性,即從C4糖到二糖和多糖的范圍。用D-葡萄糖、D-甘露糖、D-半乳糖、纖維二糖、麥芽糖和乳糖獲得了最高(和幾乎相同的活性)(圖9)。底物范圍類似于由己糖氧化酶(EC.1.1.3.5)轉化的范圍。實施例11與推測的MS59核苷酸序列同源的基因的鑒定和定性基于Pep1(SEQ ID NO:1的氨基酸12-22)和Pep2(SEQ ID NO:2的12-22氨基酸)的氨基酸序列,設計用于PCR的引物。基因組DNA從向日葵zebulon栽培品種分離,PCR引物4(5’AAC TTC TCC IAG IGTIGC ICC IGC TTG IAC CCA3’,SEQ ID NO:3)和5(5’GAT CCI TCTTTC CCI ATT ACT GGI GAG GTT TA3’,SEQ ID NO:4)用于進行PCR從向日葵基因組擴增354個堿基對的DNA片段。克隆相當于該片段大小的PCR產物(SEQ ID NO:5)。對產物的序列分析表明存在未間斷的開放閱讀框架(ORF)(SEQ ID NO:6),其中氨基酸從頭到尾與SEQ IDNO:1和SEQ ID NO:2的氨基酸序列一致。測序的幾個克隆在PCR片段中含有1-4個點突變。除了一個突變外,所有這些突變都是沉默突變(核苷酸57位的T突變為C,核苷酸63位的C突變為A,核苷酸225位的A突變為G),因此它不改變編碼的氨基酸序列。但是一個克隆的確含有點突變(核苷酸203位的G突變為A),它改變氨基酸序列,即68位氨基酸從精氨酸變為賴氨酸。
用SEQ ID NO:5探測向日葵基因組DNA的southern印跡表明基因組中存在大量同源序列。使用SphⅠ,探測到6個條帶;EcoRV,5個條帶;SpeⅠ,3個條帶而NdeⅠ,4個條帶。以前用其它酶已觀察到3-4個條帶。此分析表明存在與MS59序列有(部分)同源性的3個基因。
根據原始PCR引物序列之間的不可變區域設計新的PCR引物。引物對于3’RACE:5’CAG GCA GCT GTG GTT TGT GGC 3’(SEQID NO:7),對于5’RACE:5’GTC CAC AAT GAA GAA GGG TTG 3’(SEQID NO:8),對于嵌套式3’RACE:5’ACG TAG ATA TCG AAC AAGAAA CCG C3’(SEQ ID NO:9)。
從用10mM水楊酸鈉溶液噴灑5次誘導的向日葵葉子材料分離含多聚腺苷酸化的RNA。制備cDNA并按照MarathonTM試劑盒(Clontech實驗室公司,Palo Alto,CA)說明書中所述的進行5’和3’RACE PCR反應。通過5’和3’RACE PCR反應分離了部分cDNA克隆。序列分析證實了部分cDNA克隆的相同性。
然后根據從克隆的5’和3’RACE PCR產物新獲得的序列信息設計新的PCR和嵌套式PCR引物。用于5’RACE的引物:5’CTG GGGAAG CCC GTG TAG TAA AGC3’(SEQ ID NO:11),5’CGG GAAGTT GCA GAA GAT TGG GTT G3’(SEQ ID NO:13),對于嵌套式5’RACE:5’GAG CAA GAG AAG AAG GAG AC3’(SEQ ID NO:14),對于3’RACE:5’GCT TTA CTA CAC GGG CTT CCC CAG3’(SEQID NO:10),對于嵌套式3’RACE:5’GGT ACT CCA ACC ACG GCGCTC3’(SEQ ID NO:12)。分離4個部分cDNA克隆,它們加在一起編碼完整開放閱讀框架,此開放閱讀框架包含推測的信號肽,后面接著約59千道爾頓的蛋白及5’和3’UTR(未翻譯區域)(SEQ ID NO:15)。其ORF(21位至1608位)編碼529個氨基酸殘基(SEQ ID NO:16)的1784個堿基對的全長cDNA克隆可由這4個部分cDNA克隆和上述的PCR片段(SEQ ID NO:5)裝配起來。
氨基末端的信號序列(Von Heijne等,1983和Von Heijne等,1985)很可能不是完整地存在于起始的19個氨基酸殘基中。預測了推測的裂解位點。
將該cDNA克隆的氨基酸序列用于BLAST同源性研究。該序列表現與來自花菱草(Eschscholtzia californica)(Dittrich和Kutchan,1991,美國國家科學院院報。88,9969-9973)和罌粟(Papaversomniferum)(Facchini等,1996,植物生理學,112,1669-1677)的黃連素橋酶(BBE)有很高的同源性。
用SEQ ID NO:16中所示的氨基酸序列對表達序列標簽(dbEST)數據庫進行BLAST篩選,揭示了擬南芥(SEQ ID NO:21-SEQ IDNO:47)和水稻(SEQ ID NO:48)中MS59蛋白的同系物。
根據與MS59同源的方向將EST序列以有義方向列出。通過在移碼位置插入一個或兩個額外的未知核苷酸(N或NN)來改變EST克隆的序列以獲得與MS59同源的單個翻譯框架。實施例12編碼WL64的基因的分離和其核苷酸序列的測定根據WL64蛋白氨基末端的氨基酸序列(SEQ ID NO:49,Thr-Ser-Thr-Ser-Ile-Ile-Asp-Arg-Phe-Thr-Gin-(Cys/Ser)-Leu-Asn-Asn-Arg-Ala-Asp-Pro-(Ser)-(Phe)-),設計PCR引物(SEQ ID NO:49的氨基酸1-11)。
N-末端的氨基酸序列(SEQ ID NO:49)表現與MS59蛋白(SEQID NO:16的20-39氨基酸殘基)的相應部分有很高的同源性。
從用10mM的水楊酸鈉溶液噴灑5次誘導的萵苣(萵苣LoHobionda變種)葉子分離含有多聚腺苷酸化的RNA,并從此RNA制備cDNA。PCR引物FR-WL64-142(5’ACT TCT ACT TCT ATT ATTGAT AGG TTT ACT CA3’,SEQ ID NO:52)和MS59引物4(5’AACTTC TCC IAG IGT IGC ICC IGC TTG IAC CCA3’,SEQ ID NO:3)用于從萵苣cDNA庫擴增405個堿基對的片段。克隆對應于此PCR片段的PCR產物并測序(SEQ ID NO:53),揭示了未間斷的開放閱讀框架(SEQ ID NO:54)。表5表現與MS59有同源性的EST序列將移碼導入以優化EST與MS59序列的匹配。在用移碼1和移碼2的欄中,列出了移碼和移動(框架--→框架)的位置。(-)標記是指沒有移碼存在。
根據定位于原始PCR引物之間的SEQ ID NO:53的序列設計新的PCR引物。用于5’RACE:5’CAC GTT TAT GGA GCG TAA GTTGAA C3’(SEQ ID NO:55)和用于3’RACE:5’CAC CCT TCA CACATT CAA GCA GC3’(SEQ ID NO:56)的引物得到合成并用于按照MarathonTMcDNA擴增試劑盒(Clontech實驗室公司,Palo Alto,CA)說明書中所述進行5’和3’RACE PCR反應。通過5’和3’RACE PCR反應擴增了兩個部分cDNA克隆。序列分析證實了部分cDNA克隆的相同性,它們加在一起編碼完整開放閱讀框架,此開放閱讀框架包含推測的信號肽及5’和3’UTR(未翻譯區域)。1981個堿基對的全長cDNA克隆得到裝配,其ORF(7位至1629位)編碼540個氨基酸殘基(SEQ IDNO:58)。氨基末端的信號序列由起始的27個氨基酸殘基代表。實施例13來自罌粟和花菱草的黃連素橋酶基因的鑒定和分離從完全發育的花菱草和罌粟(變種Marianne)植物的葉子制備基因組DNA。
設計花菱草基因(EcBBE)的引物,在成熟蛋白的起始處(5’GGTAAT GAT CTC CTT TCT TGT TTG ACC3’,SEQ ID NO:59)和終止密碼子(5’AGA GCG GCC GCT ATA TTA CAA CTT CTC CACCAT CAC TCC TC3’,SEQ ID NO:60)緊接TAG終止密碼子的下游導入NotⅠ限制性位點。
對于罌粟基因(PsBBE),以相似的方式設計引物,在推測的成熟蛋白的起始處(5’GGT GAT GTT AAT GAT AAT CTC CTC3’,SEQ IDNO:61)和TAG終止密碼子處(5’AGA GCG GCC ACA ATT CCT TCAACA TGT AAA TTT CCT C3’,SEQ ID NO:62)導入NotⅠ限制性位點。
這些引物用于擴增兩個BBE基因的成熟蛋白部分。
PCR產物用NotⅠ消化并連接入用EcoRⅤ和NotⅠ消化的pET32a載體(Novagen,Madison,WI)中。采用限制性酶分析和DNA測序證實片段的正確插入。實施例14從擬南芥鑒定和分離MS59的同系物在我們的BLAST篩選中,鑒定了與MS59有同源性的26個EST。在水稻中發現一種EST,其余的25個都在擬南芥中發現。發現同源EST覆蓋了全長MS59序列。對擬南芥表達序列標簽的分析發現在蛋白的5’末端有高度同源性的3個EST(SEQ ID NO:21,SEQ ID NO:39和SEQ IDNO:40),其中SEQ ID NO:39和SEQ ID NO:40是重疊序列。MS59的3’部分表現與7個EST序列(SEQ ID NO:24,27,32,34,41,43和45)有同源性,其中SEQ ID NO:24與SEQ ID NO:43重疊和SEQ ID NO:32與SEQ ID NO:45重疊。
設計與MS59的5’部分(SEQ ID NO:16)同源的兩個不同EST位于推測的成熟蛋白部分的起始處的引物(根據由Von Heijne等,1983和VonHeijne等,1985所述的保守序列推測可能的裂解位點)。
如果與MS59氨基酸序列(SEQ ID NO:16)比較,由SEQ ID NO:21代表的EST序列可能丟失了推測成熟蛋白部分的開始3個氨基酸殘基,因此通過在引物的5’末端包含9個核苷酸來導入SEQ ID NO:16的氨基酸殘基20-22。
位于SEQ ID NO:21的5’端的引物加入了MS59(SEQ ID NO:16)的20-22位殘基5’ACT TCC CGT AGA AAC TCG GAG ACT TTCACA CAA TGC3’(SEQ ID NO:63)。
位于SEQ ID NO:39和SEQ ID NO:40的推測的裂解位點之后的引物5’TCC ATC CAA GAT CAA TTC ATA AAC TGT GTC(SEQ IDNO:64)。
制備與MS59氨基酸序列(SEQ ID NO:16)的3’部分同源的5個不同EST位于終止密碼子周圍的引物,并且導入了NotⅠ限制性位點以克隆入pET32a大腸桿菌表達載體。
位于SEQ ID NO:24和SEQ ID NO:43的引物5’AGA GCGGCC GCT TTC ATG AAC CTA GCT TCT ATG AGG3’(SEQ IDNO:65)。位于SEQ ID NO:27的引物5’AGA GCG GCC GCG AAATGG CCC CCC TTT TAA AAC GGG G3’(SEQ ID NO:66)。位于SEQID NO:32和SEQ ID NO:41的引物5’AGA GCG GCC GCA AATGAT ATC TTC AGG TAA CTT TGT TCA C(SEQ ID NO:67)。位于SEQ ID NO:34的引物5’AGA GCG GCC GCA TAA TCA AAT AAATCA ACT TAT GGT AAC ACA G(SEQ ID NO:68)和位于SEQ IDNO:45的引物5’AGA GCG GCC GCT GGT TTT GTA TTG AGGACT CAA AAC AG3’(SEQ ID NO:69)。
將5’引物和3’引物的所有可能的結合用于對從擬南芥哥倫比亞栽培品種分離的基因組DNA進行PCR。在使用SEQ ID NO:63和SEQ IDNO:68引物的PCR中,擴增到約1800個堿基對的條帶。將該條帶克隆,通過DNA測序證實PCR產物的相同性。1757個堿基對的克隆的PCR產物(SEQ ID NO:70)含有從570位到801位的內含子,SEQ ID NO:70的開放閱讀框架由508個氨基酸殘基組成(SEQ ID NO:71)。
從擬南芥Col-0的在Murashige和Skoog瓊脂上黑暗中生長的12天齡無菌幼苗,從在液體Murashige和Skoog培養基上和16小時光周期下生長的12天齡無菌幼苗,從充分生長的植物葉、莖、花和長角果分離總RNA(Newman等,1994,植物生理學106:1241-1255)。合并來自不同發育階段的RNA。采用多聚腺苷酸QuickmRNA分離試劑盒(Stratagene,La Jolla,CA)分離多聚腺苷酸化RNA并采用MarathonTMcDNA擴增試劑盒(Clontech實驗室公司,Palo Alto,CA)制備cDNA。
用不同的5’引物和3’引物的結合對cDNA庫進行PCR反應。用SEQID NO:63和SEQ ID NO:68引物結合擴增到約1600個堿基對的PCR產物。PCR產物克隆到在細菌表達載體pET32a(Novagen,Madison,WI)的EcoRⅤ和NotⅠ限制性位點之間。PCR產物的序列得到測定,并揭示了代表508個氨基酸殘基的蛋白(SEQ ID NO:73)的1527個堿基對的未間斷開放閱讀框架(SEQ ID NO:72)。
用SEQ ID NO:64和SEQ ID NO:65引物結合擴增到約1600個堿基對的第二個cDNA克隆。也將此cDNA克隆連接到pET32a載體(Novagen,Madison,WI)的EcoRⅤ和NotⅠ限制性位點之間。此cDNAPCR克隆也通過DNA測序進行鑒定,它包含編碼509個氨基酸殘基(SEQID NO:75)的1530個堿基對的未間斷開放閱讀框架(SEQ ID NO:74)。實施例15MS59,來自罌粟和花菱草的MS59,黃連素橋酶和來自擬南芥哥倫比亞栽培品種的兩個同源蛋白在大腸桿菌中的表達將含有推測的MS59成熟部分的PCR片段導入pET32a載體(Novagen,Madison,WI)并使用DNA測序證實片段的正確插入。然后,將質粒導入大腸桿菌AD494(DE3)pLysS(Novagen,Madison,WI)。然后開始制備幾個克隆的少量培養物,其中一半通過加入IPTG至1mM終濃度進行誘導。來自大腸桿菌的總提取物在SDS凝膠上電泳,并且通過考馬斯亮藍染色進行分析。幾個克隆表現大大地過量表達MS59蛋白。選擇大大過量表達的克隆用于大量培養。用此大腸桿菌培養物接種入補充了0.4mM葡萄糖的500毫升LB中并使之生長到光密度為0.5-0.7。然后加入IPTG至1mM終濃度并使之在30℃合成蛋白3小時。大多數MS59蛋白在不溶的蛋白組分中發現,少量看來是溶解的。所得的不溶蛋白制品主要含有MS59蛋白。將此制品用于制備抗體(實施例17)。將溶解組分用于體外測試以檢測MS59是否仍然表現抗真菌活性。
將含有4個MS59/WL64同系物的開放閱讀框架的pET32a質粒導入大腸桿菌AD494(DE3)pLysS(Novagen,Madison,WI)。使幾個獨立克隆的小量培養物生長至光密度0.5-0.7。然后加入IPTG到1mM終濃度并使之于30℃合成蛋白3小時。
分離溶解的和總的蛋白組分。使用SDS-PAGE分析樣品,隨后進行Neuhoff染色和使用S-Tag Western檢測試劑盒(Novagen,Madison,WI)的Western分析。大部分蛋白在不溶的組分中發現,只有少量看來是溶解的。選擇強烈過量表達同系物蛋白的克隆用于以1.5升大量培養物生產蛋白。實施例16MS59,來自花菱草和罌粟的MS59,MS59/WL64同系物和來自擬南芥的兩個同源蛋白的體外抗真菌活性測試在大腸桿菌中合成含有N-末端trxA-,His-和S-Tag的MS59蛋白。His-Tag用于在帶Ni2+的IMAC(固定金屬親和層析)柱上純化溶解的MS59。通過逐漸提高咪唑濃度洗脫結合的蛋白。此純化的峰組分含有一些污染的大腸桿菌蛋白。
將此MS59純化的峰組分逆著50mM MES(pH6.0)透析,并用于使用致病疫霉和終極腐霉的體外測試。對于用致病疫霉和終極腐霉進行體外抗真菌活性測試的標準方法,參見上文。
作為對照處理,我們以一些大腸桿菌蛋白背景測試了從相同表達宿主純化的不相關的組氨酸標鑒蛋白。也包括煮沸的MS59對照(在100℃加熱10分鐘)。在致病疫霉測試中測試約40納克融合蛋白,此用量的兩倍用于終極腐霉抑制測試。
用Parafilm包住微量滴定板盤并在黑暗中室溫下培養。2-3天后,加樣孔中正在生長的真菌菌絲體用乳酚棉蘭染色并評估其生長程度。
來自含有MS59的大腸桿菌可溶組分的IMAC組分在20-40納克濃度時表現對致病疫霉和終極腐霉的完全抑制。表6來自大腸桿菌的MS59對致病疫霉的抗真菌效應
以0(沒有抑制作用)到4(完全抑制生長)的線性評分對生長抑制(GI)進行目測評估。表7來自大腸桿菌的MS59對致病疫霉的抗真菌效應
加樣孔的顯微分析表明在各個對照中致病疫霉游動孢子的快速萌發和隨后的生長。在含有來自大腸桿菌的MS59的反應物中的萌發幾乎完全受到抑制。一些孢子的確萌發,但是菌絲尖生長看來在起始之后立即停止。48小時后,致病疫霉菌絲體的生長在對照中很充分,但在含有MS59的測試中幾乎檢測不到。甚至在72小時后也基本上沒有觀察到生長。在含有MS59的反應物中真菌菌絲體看似粒狀并且變稠。與大腸桿菌合成的MS59一起培養的真菌生長的典型模式的例子在圖4中表示。48小時和72小時后,對照培養中的真菌生長是如此地充分以致無法采到可攝影的材料。存在MS59時的培養導致進一步生長的完全抑制,在24小時觀察到的萌芽管沒有明顯的進一步延伸。
同樣,在終極腐霉抑制測試中,如果使用菌絲體片段,對于用MS59處理沒有明顯的生長(參見圖5)。24小時后,對照反應物菌絲體完全過度生長。MS59處理的樣品中在該階段只有小的菌絲體片段。
在大腸桿菌(pET32a)中表達罌粟同系物并測試對致病疫霉和終極腐霉的體外抗真菌活性。將致病疫霉的孢子和終極腐霉的菌絲片段分別懸浮于無菌水或馬鈴薯葡萄糖培養液(PDB)中。向各個加樣孔加入400-600個孢子或200片段/50微升。
用IMAC柱層析部分純化表達的蛋白。將含有表達的蛋白的組分變換到50mM MSE(pH6.0)緩沖液(過濾滅菌)中并用IMAC純化的大腸桿菌pET-MS59作為陽性對照測試其抗真菌活性。
對于花菱草和罌粟的MS59/WL64同系物,沒有觀察到抗真菌活性,甚至在比陽性對照高10倍的濃度下也沒有導致對兩種真菌的100%生長抑制。這意味著這些大腸桿菌表達的蛋白沒有正確的折疊,因此沒有表現生物學活性。實施例17針對變性MS59制備抗體在兔中針對變性MS59(來自不溶的大腸桿菌組分的可溶化形式)制備抗體。該抗體表現僅與具有抗真菌活性和葡萄糖氧化酶活性的pMOG1180煙草植株的IF(實施例18和19)中的約60千道爾頓條帶有交叉反應。令人驚奇的是,沒有發現與WL64的交叉反應。實施例18構建MS59克隆以在轉基因植物中表達基于ATG起始密碼子和TGA終止密碼子周圍的序列設計PCR引物以用于克隆開放閱讀框架(ORF)。通過使用引物5’CC GCC ATGGAG ACT TCC ATT CTT ACT C3’(SEQ ID NO:16)進行PCR在ATG起始密碼子處導入NcoⅠ限制性位點用于與組成型啟動子融合。由于導入的NcoⅠ限制性位點,將ORF的第二個密碼子從caa(Q)變為gag(E)。
通過使用引物5’GCC GGA TCC TCA AGA TGA CAA AGTTGG GAT GCT3’(SEQ ID NO:18)進行PCR在TGA終止密碼子的下游導入BamHⅠ限制性位點。
用pfu DNA聚合酶進行PCR反應,我們利用PCR引物擴增完整ORF以在起始密碼子處導入NcoⅠ限制性位點并在緊接終止密碼子的下游導入BamHⅠ限制性位點。通過測序證實DNA序列的正確性(SEQ IDNO:19)。將整個ORF與允許在大部分植物中高水平蛋白表達的組成型啟動子連接。在ORF后導入含有多聚腺苷酸化所需序列(An等,1989,植物細胞,1,115-122)的馬鈴薯蛋白酶抑制劑Ⅱ的3’非翻譯區域(Thirnburg等,1987,美國國家科學院院報,84,744-748)。將得到的嵌合基因導入雙元載體pMOG800(于1993年8月12日保藏于真菌菌種保藏中心,Barrn,荷蘭,保藏號為CBS414.93)。將獲得的攜帶在ocs-mas雜交啟動子(WO95/14098)控制下的MS59構建體的pMOG1180克隆導入適于轉化目的農作物番茄和馬鈴薯的根瘤農桿菌EHA105菌株,適于轉化煙草和擬南芥的MOG101菌株和適于轉化歐洲油菜的MOG301。實施例19含有MS59基因構建體的轉基因煙草和馬鈴薯植株的制備和分析利用農桿菌介導的轉化系統將含有如實施例18所述的MS59基因構建體的雙元構建體導入煙草和馬鈴薯。使這些不同植物種類的轉基因幼苗再生為完整植株,隨后,分析原始轉化子中新導入的MS59基因的表達。采用對與BSA偶聯的MS59肽特異的抗體進行此Western印跡技術分析。以1∶5000稀釋所有抗血清。使用純化蛋白的一系列濃度(12.5,25,50和100納克)來鑒定轉基因植物中導入蛋白的表達水平。將轉基因樣品在50mM醋酸鈉緩沖液(pH5.2)中勻漿并通過離心使提取物澄清。將上清液直接用于分析或在冰上放置過夜以沉淀。過夜沉淀之后總是隨后進行澄清(通過離心)。使用Bradford試劑(Bradford,1976,生物化學分析,72,248-254)和BSA作為標準蛋白以任一方式測定所得上清的蛋白濃度。將盡可能多的蛋白(但不超過10納克)上樣到12.5%聚丙烯酰胺凝膠(laemmli,同上)上并且如前所述進行免疫印跡(Ponstein等,同上)。
通過在含50mM醋酸鈉的緩沖液(pH5.2)中研磨葉段從MS59轉基因煙草和馬鈴薯植物制備提取物。之后,通過離心去除不溶性蛋白。測定溶解蛋白總含量并且將10微克等價物上樣到SDS凝膠上。在凝膠電泳之后,將蛋白轉移成印跡。利用針對純化MS59制備的抗血清(實施例17)使此印跡顯色。MS59特異的抗血清以1∶5000稀釋度使用。純化MS59也在膠的另一側電泳,并包括它作為參考。根據MS59蛋白的高水平表達選擇的轉化植物和S1子代植物在真菌抗性測試中得到測試。實施例20從煙草轉基因植株純化MS59轉基因蛋白制備組成型表達MS59的轉基因煙草植株。利用Western分析測定表達水平。對轉基因材料的提取物進行針對致病疫霉和終極腐霉的體外生長抑制活性測試。從含有pMOG1180構建體(mas-ocs-啟動子-MS59)的煙草和煙草對照株系的體外葉子制備小量總提取物。通過在50mM醋酸鈉(pH5.2)中研磨葉片材料來制備提取物。將上清液逆著50mM MES(pH6.0)透析并按照在總的實驗部分所述的方法測試體外抗真菌活性。與其它株系或對照株系相比,一些煙草pMOG1180株系表現針對致病疫霉和終極腐霉的高抗真菌活性。實施例21碳水化合物氧化酶活性/MS59在轉基因煙草中的定位測試等量的部分純化的溶解MS59和溶解的同系物組分(罌粟,花菱草,擬南芥A11和B7)的碳水化合物氧化酶活性。MS59的碳水化合物氧化酶活性是0.011ODu/分鐘,同系物為0.0003-0.0012ODu/分鐘,差距是10倍。
在后階段,從表現體外抗真菌活性的實施例20的轉基因煙草pMOG1180株系分離IF并用于測試碳水化合物氧化酶活性。在IF分離后留下的物質(稱為“-IF”)也用于測試。表現抗真菌活性的相同株系具有高碳水化合物氧化酶活性。該活性定位于IF。實施例22將含有在組成型植物啟動子控制下的Chi-Ⅰ、GluⅠ、AP24和MS59的4個基因構建體導入番茄、馬鈴薯、胡蘿卜、歐洲油菜和擬南芥采用農桿菌介導的轉化系統,將含有編碼Chi-Ⅰ,Glu-Ⅰ,AP24和MS59的基因的雙元構建體pMOG1145和pMOG1180或含有編碼Chi-Ⅰ,Glu-Ⅰ,bPR-1和MS59的pMOG1146導入不同農作物種類,包括番茄、馬鈴薯、胡蘿卜、歐洲油菜和擬南芥。在真菌侵染測試中測試S1子代植株。
序列表(1)基本信息(ⅰ)申請人(A)名稱MOGEN International nv(B)街道Einsteinweg97(C)城市Leiden(E)國家荷蘭(F)郵編(ZIP):2333CB(G)電話31-(0)71-5258282(H)電傳31-(0)71-5221471(ⅱ)發明名稱抗真菌蛋白及其編碼DNA和摻入此DNA的宿主(ⅲ)序列數75(ⅴ)計算機可讀形式(A)媒介類型軟盤(B)計算機IBM PC兼容機(C)操作系統PC-DOS/MS-DOS(D)軟件Patentln Release#1.0,版本#1.25(EPO)(ⅵ)優先申請資料(A)申請號EP96.202.466.7(B)申請日1996年9月4日(ⅵ)優先申請資料(A)申請號EP97.200.831.2(B)申請日1997年3月10日(2)關于SEQ ID NO:1的信息(ⅰ)序列特征(A)長度25個氨基酸(B)類型氨基酸(C)鏈型單鏈
(D)拓撲結構線形(ⅱ)分子類型蛋白質(ⅲ)假設否(ⅲ)反義否(ⅴ)片段類型內部(ⅵ)原始來源(A)生物向日葵(B)株系栽培品種zebulon(ⅹⅰ)序列描述SEQ ID NO:1Ser Ile Asn Val Asp Ile Glu Gln Glu Thr Ala Trp Val Gln Ala Gly1 5 10 15Ala Thr Leu Gly Glu Val Tyr Tyr Arg20 25(2)關于SEQ ID NO:2的信息(ⅰ)序列特征(A)長度25個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型蛋白質(ⅲ)假設否(ⅲ)反義否(ⅴ)片段類型內部(ⅵ)原始來源(A)生物向日葵(B)株系栽培品種zebulon(ⅹⅰ)序列描述SEQ ID NO:2Asp Pro Ser Phe Pro Ile Thr Gly Glu Val Tyr Thr Pro Gly Xaa Ser1 5 10 15Ser Phe Pro Thr Val Leu Gln Asn Tyr20 25(2)關于SEQ ID NO:3的信息(ⅰ)序列特征(A)長度33個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅸ)特征(A)名稱/關鍵詞mis-特征(B)位置1(D)其它信息/功能=“引物”(ⅹⅰ)序列描述SEQ ID NO:3AACTTCTCCN AGNGTNGCNC CNGCTTGNAC CCA 33(2)關于SEQ ID NO:4的信息(ⅰ)序列特征(A)長度32個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設是
(ⅸ)特征(A)名稱/關鍵詞mis-特征(B)位置1(D)其它信息/功能=“引物”(ⅹⅰ)序列描述SEQ ID NO:4:GATCCNTCTT TCCCNATTAC TGGNGAGGTT TA32(2)關于SEQ ID NO:5的信息(ⅰ)序列特征(A)長度354個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型DNA(基因組)(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物向日葵(B)株系栽培品種zebulon(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置1..354(ⅹⅰ)序列描述SEQ ID NO:5:GAT CCG TCT TTC CCG ATT ACT GGG GAG GTT TAC ACT CCC GGA AAC TCA 48Asp Pro Ser Phe Pro Ile Thr Gly Glu Val Tyr Thr Pro Gly Asn Ser1 5 10 15TCT TTT CCT ACC GTC TTG CAA AAC TAC ATC CGA AAC CTT CGG TTC AAT 96Ser Phe Pro Thr Val Leu Gln Asn Tyr Ile Arg Asn Leu Arg Phe Asn20 25 30GAA ACT ACC ACA CCA AAA CCC TTT TTA ATC ATC ACA GCC GAA CAT GTT 144Glu Thr Thr Thr Pro Lys Pro Phe Leu Ile Ile Thr Ala Glu His Val35 40 45TCC CAC ATT CAG GCA GCT GTG GTT TGT GGC AAA CAA AAC CGG TTG CTA 192Ser His Ile Gln Ala Ala Val Val Cys Gly Lys Gln Asn Arg Leu Leu50 55 60CTG AAA ACC AGA AGC GGT GGT CAT GAT TAT GAA GGT CTT TCC TAC CTT 240Leu Lys Thr Arg Ser Gly Gly His Asp Tyr Glu Gly Leu Ser Tyr Leu65 70 75 80ACA AAC ACA AAC CAA CCC TTC TTC ATT GTG GAC ATG TTC AAT TTA AGG 288Thr Asn Thr Asn Gln Pro Phe Phe Ile Val Asp Met Phe Asn Leu Arg85 90 95TCC ATA AAC GTA GAT ATC GAA CAA GAA ACC GCA TGG GTC CAA GCC GGC 336Ser Ile Asn Val Asp Ile Glu Gln Glu Thr Ala Trp Val Gln Ala Gly100 105 110GCC ACC CTC GGA GAA GTT 354Ala Thr Leu Gly Glu Val115(2)關于SEQ ID NO:6的信息(ⅰ)序列特征(A)長度118個氨基酸(B)類型氨基酸(D)拓撲結構線形(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:6Asp Pro Ser Phe Pro Ile Thr Gly Glu Val Tyr Thr Pro Gly Asn Ser1 5 10 15Ser Phe Pro Thr Val Leu Gln Asn Tyr Ile Arg Asn Leu Arg Phe Asn20 25 30Glu Thr Thr Thr Pro Lys Pro Phe Leu Ile Ile Thr Ala Glu His Val35 40 45Ser His Ile Gln Ala Ala Val Val Cys Gly Lys Gln Asn Arg Leu Leu50 55 60Leu Lys Thr Arg Ser Gly Gly His Asp Tyr Glu Gly Leu Ser Tyr Leu65 70 75 80Thr Asn Thr Asn Gln Pro Phe Phe Ile Val Asp Met Phe Asn Leu Arg85 90 95Ser Ile Asn Val Asp Ile Glu Gln Glu Thr Ala Trp Val Gln Ala Gly100 105 110Ala Thr Leu Gly Glu Val115(2)關于SEQ ID NO:7的信息(ⅰ)序列特征(A)長度21個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅲ)反義否(ⅸ)特征(A)名稱/關鍵詞misc-特征(B)位置1(D)其它信息/功能=“引物”(ⅸ)序列描述SEQ ID NO:7:CAGGCAGCTG TGGTTTGTGG C 21(2)關于SEQ ID NO:8的信息(ⅰ)序列特征(A)長度21個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅲ)反義否(ⅸ)特征(A)名稱/關鍵詞misc-特征(B)位置1
(D)其它信息/功能=“引物”(ⅸ)序列描述SEQ ID NO:8:GTCCACAATG AAGAAGGGTT G 21(2)關于SEQ ID NO:9的信息(ⅰ)序列特征(A)長度25個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅲ)反義否(ⅸ)特征(A)名稱/關鍵詞misc-特征(B)位置1(D)其它信息/功能=“引物”(ⅸ)序列描述SEQ ID NO:9ACGTAGATAT CGAACAAGAA ACCGC 25(2)關于SEQ ID NO:10的信息(ⅰ)序列特征(A)長度24個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA
(ⅲ)假設否(ⅲ)反義否(ⅸ)序列描述SEQ ID NO:10GCTTTACTAC ACGGGCTTCC CCAG 24(2)關于SEQ ID NO:11的信息(ⅰ)序列特征(A)長度24個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅲ)反義否(ⅸ)序列描述SEQ ID NO:11CTGGGGAAGC CCGTGTAGTA AAGC 24(2)關于SEQ ID NO:12的信息(ⅰ)序列特征(A)長度21個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅲ)反義否(ⅸ)序列描述SEQ ID NO:12GGTACTCCAA CCACGGCGCT C 21(2)關于SEQ ID NO:13的信息(ⅰ)序列特征(A)長度25個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅲ)反義否(ⅸ)序列描述SEQ ID NO:13CGGGAAGTTG CAGAAGATTG GGTTG 25(2)關于SEQ ID NO:14的信息(ⅰ)序列特征(A)長度20個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅲ)反義否(ⅹⅰ)序列描述SEQ ID NO:14GAGCAAGAGA AGAAGGAGAC20(2)關于SEQ ID NO:15的信息(ⅰ)序列特征
(A)長度1784個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物向日葵(B)株系栽培品種zebulon(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置21..1608(ⅹⅰ)序列描述SEQ ID NO:15ATATCACATC TTCTTTCAAC ATG CAA ACT TCC ATT CTT ACT CTC CTT CTT 50Met Gln Thr Ser Ile Leu Thr Leu Leu Leu1 5 10CTC TTG CTC TCA ACC CAA TCT TCT GCA ACT TCC CGT TCC ATT ACA GAT98Leu Leu Leu Ser Thr Gln Ser Ser Ala Thr Ser Arg Ser Ile Thr Asp15 20 25CGC TTC ATT CAA TGT TTA CAC GAC CGG GCC GAC CCT TCA TTT CCG ATA 146Arg Phe Ile Gln Cys Leu His Asp Arg Ala Asp Pro Ser Phe Pro Ile30 35 40ACC GGA GAG GTT TAC ACT CCC GGA AAC TCA TCT TTT CCT ACC GTC TTG 194Thr Gly Glu Val Tyr Thr Pro Gly Asn Ser Ser Phe Pro Thr Val Leu45 50 55CAA AAC TAC ATC CGA AAC CTT CGG TTC AAT GAA ACT ACC ACA CCA AAA 242Gln Asn Tyr Ile Arg Asn Leu Arg Phe Asn Glu Thr Thr Thr Pro Lys60 65 70CCC TTT TTA ATC ATC ACA GCC GAA CAT GTT TCC CAC ATT CAG GCA GCT 290Pro Phe Leu Ile Ile Thr Ala Glu His Val Ser His Ile Gln Ala Ala75 80 85 90GTG GTT TGT GGC AAA CAA AAC CGG TTG CTA CTG AAA ACC AGA AGC GGT 338Val Val Cys Gly Lys Gln Asn Arg Leu Leu Leu Lys Thr Arg Ser Gly95 100 105GGT CAT GAT TAT GAA GGT CTT TCC TAC CTT ACA AAC ACA AAC CAA CCC 386Gly His Asp Tyr Glu Gly Leu Ser Tyr Leu Thr Asn Thr Asn Gln Pro110 115 120TTC TTC ATT GTG GAC ATG TTC AAT TTA AGG TCC ATA AAC GTA GAT ATC 434Phe Phe Ile Val Asp Met Phe Asn Leu Arg Ser Ile Asn Val Asp Ile125 130 135GAA CAA GAA ACC GCA TGG GTC CAA GCC GGT GCG ACT CTT GGT GAA GTG 482Glu Gln Glu Thr Ala Trp Val Gln Ala Gly Ala Thr Leu Gly Glu Val140 145 150TAC TAT CGA ATA GCG GAG AAA AGT AAC AAG CAT GGT TTT CCG GCA GGG 530Tyr Tyr Arg Ile Ala Glu Lys Ser Asn Lys His Gly Phe Pro Ala Gly155 160 165 170GTT TGT CCA ACG GTT GGC GTT GGT GGG CAT TTT AGT GGT GGT GGG TAT 578Val Cys Pro Thr Val Gly Val Gly Gly His Phe Ser Gly Gly Gly Tyr175 180 185GGT AAT TTG ATG AGA AAA TAT GGT TTG TCG GTT GAT AAT ATT GTT GAT 626Gly Asn Leu Met Arg Lys Tyr Gly Leu Ser Val Asp Asn Ile Val Asp190 195 200GCT CAA ATA ATA GAT GTG AAT GGC AAG CTT TTG GAT CGA AAG AGT ATG 674Ala Gln Ile Ile Asp Val Asn Gly Lys Leu Leu Asp Arg Lys Ser Met205 210 215GGT GAG GAT TTG TTT TGG GCG ATC ACC GGC GGT GGT GGT GTT AGT TTT 722Gly Glu Asp Leu Phe Trp Ala Ile Thr Gly Gly Gly Gly Val Ser Phe220 225 230GGT GTG GTT CTA GCC TAC AAA ATC AAA CTA GTT CGT GTT CCG GAG GTT 770Gly Val Val Leu Ala Tyr Lys Ile Lys Leu Val Arg Val Pro Glu Val235 240 245 250GTG ACC GTG TTT ACC ATT GAA AGA AGA GAG GAA CAA AAC CTC AGC ACC 818Val Thr Val Phe Thr Ile Glu Arg Arg Glu Glu Gln Asn Leu Ser Thr255 260 265ATC GCG GAA CGA TGG GTA CAA GTT GCT GAT AAG CTA GAT AGA GAT CTT 866Ile Ala Glu Arg Trp Val Gln Val Ala Asp Lys Leu Asp Arg Asp Leu270 275 280TTC CTT CGA ATG ACC TTT AGT GTC ATA AAC GAT ACC AAC GGT GGA AAG 914Phe Leu Arg Met Thr Phe Ser Val Ile Asn Asp Thr Asn Gly Gly Lys285 290 295ACA GTC CGT GCT ATC TTT CCA ACG TTG TAC CTT GGA AAC TCG AGG AAT 962Thr Val Arg Ala Ile Phe Pro Thr Leu Tyr Leu Gly Asn Ser Arg Asn300 305 310CTT GTT ACA CTT TTG AAT AAA GAT TTC CCC GAG TTA GGG TTG CAA GAA 1010Leu Val Thr Leu Leu Asn Lys Asp Phe Pro Glu Leu Gly Leu Gln Glu315 320 325 330TCG GAT TGT ACT GAA ATG AGT TGG GTT GAG TCT GTG CTT TAC TAC ACG 1058Ser Asp Cys Thr Glu Met Ser Trp Val Glu Ser Val Leu Tyr Tyr Thr335 340 345GGC TTC CCC AGT GGT ACT CCA ACC ACG GCG CTC TTA AGC CGT ACT CCT 1106Gly Phe Pro Ser Gly Thr Pro Thr Thr Ala Leu Leu Ser Arg Thr Pro350 355 360CAA AGA CTC AAC CCA TTC AAG ATC AAA TCC GAT TAT GTG CAA AAT CCT 1154Gln Arg Leu Asn Pro Phe Lys Ile Lys Ser Asp Tyr Val Gln Asn Pro365 370 375ATT TCT AAA CGA CAG TTC GAG TTC ATC TTC GAA AGG CTG AAA GAA CTT 1202Ile Ser Lys Arg Gln Phe Glu Phe Ile Phe Glu Arg Leu Lys Glu Leu380 385 390GAA AAC CAA ATG TTG GCT TTC AAC CCA TAT GGT GGT AGA ATG AGT GAA 1250Glu Asn Gln Met Leu Ala Phe Asn Pro Tyr Gly Gly Arg Met Ser Glu395 400 405 410ATA TCC GAA TTC GCA AAG CCT TTC CCA CAT AGA TCG GGT AAC ATA GCG 1298Ile Ser Glu Phe Ala Lys Pro Phe Pro His Arg Ser Gly Asn Ile Ala415 420 425AAA ATT CAA TAC GAA GTA AAC TGG GAG GAT CTT AGC GAT GAA GCC GAA 1346Lys Ile Gln Tyr Glu Val Asn Trp Glu Asp Leu Ser Asp Glu Ala Glu430 435 440AAT CGT TAC TTG AAT TTC ACA AGG CTG ATG TAT GAT TAC ATG ACC CCA 1394Asn Arg Tyr Leu Asn Phe Thr Arg Leu Met Tyr Asp Tyr Met Thr Pro445 450 455TTT GTG TCG AAA AAC CCT AGA AAA GCA TTT TTG AAC TAT AGG GAT TTG 1442Phe Val Ser Lys Asn Pro Arg Lys Ala Phe Leu Asn Tyr Arg Asp Leu460 465 470GAT ATT GGT ATC AAC AGC CAT GGC AGG AAT GCT TAT ACT GAA CGA ATG 1490Asp Ile Gly Ile Asn Ser His Gly Arg Asn Ala Tyr Thr Glu Gly Met475 480 485 490GTT TAT GGG CAC AAG TAT TTC AAA GAG ACA AAT TAC AAG AGG CTA GTA 1538Val Tyr Gly His Lys Tyr Phe Lys Glu Thr Asn Tyr Lys Arg Leu Val495 500 505AGT GTG AAG ACT AAA GTT GAT CCT GAC AAC TTC TTT AGG AAT GAG CAA 1586Ser Val Lys Thr Lys Val Asp Pro Asp Asn Phe Phe Arg Asn Glu Gln510 515 520AGC ATC CCA ACT TTG TCA TCT T GAAGAACGTA CATATATAAA TAAATACCTT1638Ser Ile Pro Thr Leu Ser Ser525TGTGCATGGT ATTTTCAGGG TGTTAAAGTG ATATTCAGAT ATTTATGATA GAATTTTGAC 1698TTGTATTTTA TACAATCAAA ATTGTATGGT TCTCCGAATT TCTCTTTTTA ATTCTGAAAA 1758ATACATATTA GTATTGTCAA AAAAAA 1784(2)關于SEQ ID NO:16的信息(ⅰ)序列特征(A)長度529個氨基酸(B)類型氨基酸(D)拓撲結構線形(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:16Met Gln Thr Ser Ile Leu Thr Leu Leu Leu Leu Leu Leu Ser Thr Gln1 5 10 15Ser Ser Ala Thr Ser Arg Ser Ile Thr Asp Arg Phe Ile Gln Cys Leu20 25 30His Asp Arg Ala Asp Pro Ser Phe Pro Ile Thr Gly Glu Val Tyr Thr35 40 45Pro Gly Asn Ser Ser Phe Pro Thr Val Leu Gln Asn Tyr Ile Arg Asn50 55 60Leu Arg Phe Asn Glu Thr Thr Thr Pro Lys Pro Phe Leu Ile Ile Thr65 70 75 80Ala Glu His Val Ser His Ile Gln Ala Ala Val Val Cys Gly Lys Gln85 90 95Asn Arg Leu Leu Leu Lys Thr Arg Ser Gly Gly His Asp Tyr Glu Gly100 105 110Leu Ser Tyr Leu Thr Asn Thr Asn Gln Pro Phe Phe Ile Val Asp Met115 120 125Phe Asn Leu Arg Ser Ile Asn Val Asp Ile Glu Gln Glu Thr Ala Trp130 135 140Val Gln Ala Gly Ala Thr Leu Gly Glu Val Tyr Tyr Arg Ile Ala Glu145 150 155 160Lys Ser Asn Lys His Gly Phe Pro Ala Gly Val Cys Pro Thr Val Gly165 170 175Val Gly Gly His Phe Ser Gly Gly Gly Tyr Gly Asn Leu Met Arg Lys180 185 190Tyr Gly Leu Ser Val Asp Asn Ile Val Asp Ala Gln Ile Ile Asp Val195 200 205Asn Gly Lys Leu Leu Asp Arg Lys Ser Met Gly Glu Asp Leu Phe Trp210 215 220Ala Ile Thr Gly Gly Gly Gly Val Ser Phe Gly Val Val Leu Ala Tyr225 230 235 240Lys Ile Lys Leu Val Arg Val Pro Glu Val Val Thr Val Phe Thr Ile245 250 255Glu Arg Arg Glu Glu Gln Asn Leu Ser Thr Ils Ala Glu Arg Trp Val260 265 270Gln Val Ala Asp Lys Leu Asp Arg Asp Leu Phe Leu Arg Met Thr Phe275 280 285Ser Val Ile Asn Asp Thr Asn Gly Gly Lys Thr Val Arg Ala Ile Phe290 295 300Pro Thr Leu Tyr Leu Gly Asn Ser Arg Asn Leu Val Thr Leu Leu Asn305 310 315 320Lys Asp Phe Pro Glu Leu Gly Leu Gln Glu Ser Asp Cys Thr Glu Met325 330 335Ser Trp Val Glu Ser Val Leu Tyr Tyr Thr Gly Phe Pro Ser Gly Thr340 345 350Pro Thr Thr Ala Leu Leu Ser Arg Thr Pro Gln Arg Leu Asn Pro Phe355 360 365Lys Ile Lys Ser Asp Tyr Val Gln Asn Pro Ile Ser Lys Arg Gln Phe370 375 380Glu Phe Ile Phe Glu Arg Leu Lys Glu Leu Glu Asn Gln Met Leu Ala385 390 395 400Phe Asn Pro Tyr Gly Gly Arg Met Ser Glu Ile Ser Glu Phe Ala Lys405 410 415Pro Phe Pro His Arg Ser Gly Asn Ile Ala Lys Ile Gln Tyr Glu Val420 425 430Asn Trp Glu Asp Leu Ser Asp Glu Ala Glu Asn Arg Tyr Leu Asn Phe435 440 445Thr Arg Leu Met Tyr Asp Tyr Met Thr Pro Phe Val Ser Lys Asn Pro450 455 460Arg Lys Ala Phe Leu Asn Tyr Arg Asp Leu Asp Ile Gly Ile Asn Ser465 470 475 480His Gly Arg Asn Ala Tyr Thr Glu Gly Met Val Tyr Gly His Lys Tyr485 490 495Phe Lys Glu Thr Asn Tyr Lys Arg Leu Val Ser Val Lys Thr Lys Val500 505 510Asp Pro Asp Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Thr Leu Ser515 520 525Ser(2)關于SEQ ID NO:17的信息(ⅰ)序列特征(A)長度27個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅲ)反義否(ⅹⅰ)序列描述SEQ ID NO:17CCGCCATGGA GACTTCCATT CTTACTC27(2)關于SEQ ID NO:18的信息(ⅰ)序列特征(A)長度33個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅲ)反義否(ⅸ)序列描述SEQ ID NO:18GCCGGATCCT CAAGATGACA AAGTTGGGAT GCT 33(2)關于SEQ ID NO:19的信息(ⅰ)序列特征(A)長度1590個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物向日葵(B)株系zebulon(ⅹⅰ)特征(A)名稱/關鍵詞CDS(B)位置1..1590(ⅹⅰ)序列描述SEQ ID NO:19ATG GAG ACT TCC ATT CTT ACT CTC CTT CTT CTC TTG CTC TCA ACC CAA 48Met Glu Thr Ser Ile Leu Thr Leu Leu Leu Leu Leu Leu Ser Thr Gln1 5 10 15TCT TCT GCA ACT TCC CGT TCC ATT ACA GAT CGC TTC ATT CAA TGT TTA96Ser Ser Ala Thr Ser Arg Ser Ile Thr Asp Arg Phe Ile Gln Cys Leu20 25 30CAC GAC CGG GCC GAC CCT TCA TTT CCG ATA ACC GGA GAG GTT TAC ACT 144His Asp Arg Ala Asg Pro Ser Phe Pro Ile Thr Gly glu Val Tyr Thr35 40 45CCC GGA AAC TCA TCT TTT CCT ACC GTC TTG CAA AAC TAC ATC CgA AAC 192Pro Gly Asn Ser Ser Phe Pro Thr Val Leu Gln Asn Tyr Ile Arg Asn50 55 60CTT CGG TTC AAT GAA ACT ACC ACA CCA AAA CCC TTT TTA ATC ATC ACA 240Leu Arg Phe Asn Glu Thr Thr Thr Pro Lys Pro Phe Leu Ile Ile Thr65 70 75 80GCC GAA CAT GTT TCC CAC ATT CAG GCA GCT GTG GTT TGT GGC AAA CAA 288Ala Glu His Val Ser His Ile Gln Ala Ala Val Val Cys Gly Lys Gln85 90 95AAC CGG TTG CTA CTG AAA ACC AGA AGC GGT GGT CAT GAT TAT GAA GGT 336Asn Arg Leu Leu Leu Lys Thr Arg Ser Gly Gly His Asp Tyr Glu Gly100 105 110CTT TCC TAC CTT ACA AAC ACA AAC CAA CCC TTC TTC ATT GTG GAC ATG 384Leu Ser Tyr Leu Thr Asn Thr Asn Gln Pro Phe Phe Ile Val Asp Met115 120 125TTC AAT TTA AGG TCC ATA AAC GTA GAT ATC GAA CAA GAA ACC GCA TGG 432Phe Asn Leu Arg Ser Ile Asn Val Asp Ile Glu Gln Glu Thr Ala Trp130 135 140GTC CAA GCC GGT GCG ACT CTT GGT GAA GTG TAC TAT CGA ATA GCG GAG 480Val Gln Ala Gly Ala Thr Leu Gly Glu Val Tyr Tyr Arg Ile Ala Glu145 150 155 160AAA AGT AAC AAG CAT GGT TTT CCG GCA GGG GTT TGT CCA ACG GTT GGC 528Lys Ser Asn Lys His Gly Phe Pro Ala Gly Val Cys Pro Thr Val Gly165 170 175GTT GGT GGG CAT TTT AGT GGT GGT GGG TAT GGT AAT TTG ATG AGA AAA 576Val Gly Gly His Phe Ser Gly Gly Gly Tyr Gly Asn Leu Met Arg Lys180 185 190TAT GGT TTG TCG GTT GAT AAT ATT GTT GAT GCT CAA ATA ATA GAT GTG 624Tyr Gly Leu Ser Val Asp Asn Ile Val Asp Ala Gln Ile Ile Asp Val195 200 205AAT GGC AAG CTT TTG GAT CGA AAG AGT ATG GGT GAG GAT TTG TTT TGG 672Asn Gly Lys Leu Leu Asp Arg Lys Ser Met Gly Glu Asp Leu Phe Trp210 215 220GCG ATC ACC GGC GGT GGT GGT GTT AGT TTT GGT GTG GTT CTA GCC TAC 720Ala Ile Thr Gly Gly Gly Gly Val Ser Phe Gly Val Val Leu Ala Tyr225 230 235 240AAA ATC AAA CTA GTT CGT GTT CCG GAG GTT GTG ACC GTG TTT ACC ATT 768Lys Ile Lys Leu Val Arg Val Pro Glu Val Val Thr Val Phe Thr Ile245 250 255GAA AGA AGA GAG GAA CAA AAC CTC AGC ACC ATC GCG GAA CGA TGG GTA 816Glu Arg Arg Glu Glu Gln Asn Leu Ser Thr Ile Ala Glu Arg Trp Val260 265 270CAA GTT GCT GAT AAG CTA GAT AGA GAT CTT TTC CTT CGA ATG ACC TTT 864Gln Val Ala Asp Lys Leu Asp Arg Asp Leu Phe Leu Arg Met Thr Phe275 280 285AGT GTC ATA AAC GAT ACC AAC GGT GGA AAG ACA GTC CGT GCT ATC TTT 912Ser Val Ile Asn Asp Thr Asn Gly Gly Lys Thr Val Arg Ala Ile Phe290 295 300CCA ACG TTG TAC CTT GGA AAC TCG AGG AAT CTT GTT ACA CTT TTG AAT 960Pro Thr Leu Tyr Leu Gly Asn Ser Arg Asn Leu Val Thr Leu Leu Asn305 310 315 320AAA GAT TTC CCC GAG TTA GGG TTG CAA GAA TCG GAT TGT ACT GAA ATG 1008Lys Asp Phe Pro Glu Leu Gly Leu Gln Glu Ser Asp Cys Thr Glu Met325 330 335AGT TGG GTT GAG TCT GTG CTT TAC TAC ACG GGC TTC CCC AGT GGT ACT 1056Ser Trp Val Glu Ser Val Leu Tyr Tyr Thr Gly Phe Pro Ser Gly Thr340 345 350CCA ACC ACG GCG CTC TTA AGC CGT ACT CCT CAA AGA CTC AAC CCA TTC 1104Pro Thr Thr Ala Leu Leu Ser Arg Thr Pro Gln Arg Leu Asn Pro Phe355 360 365AAG ATC AAA TCC GAT TAT GTG CAA AAT CCT ATT TCT AAA CGA CAG TTC 1152Lys Ile Lys Ser Asp Tyr Val Gln Asn Pro Ile Ser Lys Arg Gln Phe370 375 380GAG TTC ATC TTC GAA AGG ATG AAA GAA CTT GAA AAC CAA ATG TTG GCG 1200Glu Phe Ile Phe Glu Arg Met Lys Glu Leu Glu Asn Gln Met Leu Ala385 390 395 400TTC AAC CCA TAT GGT GGT AGA ATG AGT GAA ATA TCC GAA TTC GCA AAG 1248Phe Asn Pro Tyr Gly Gly Arg Met Ser Glu Ile Ser Glu Phe Ala Lys405 410 415CCT TTC CCA CAT AGA TCG GGT AAC ATA GCG AAG ATT CAA TAC GAA GTA 1296Pro Phe Pro His Arg Ser Gly Asn Ile Ala Lys Ile Gln Tyr Glu Val420 425 430AAC TGG GAG GAT CTT AGC GAT GAA GCC GAA AAT CGT TAC TTG AAT TTC 1344Asn Trp Glu Asp Leu Ser Asp Glu Ala Glu Asn Arg Tyr Leu Asn Phe435 440 445ACA AGG CTG ATG TAT GAT TAC ATG ACT CCA TTT GTG TCG AAA AAC CCT 1392Thr Arg Leu Met Tyr Asp Tyr Met Thr Pro Phe Val Ser Lys Asn Pro450 455 460AGA GAA GCA TTT TTG AAC TAT AGG GAT TTG GAT ATT GGT ATC AAC AGC 1440Arg Glu Ala Phe Leu Asn Tyr Arg Asp Leu Asp Ile Gly Ile Asn Ser465 470 475 480CAT GGC AGG AAT GCT TAT ACT GAA GGA ATG GTT TAT GGG CAC AAA TAT 1488His Gly Arg Asn Ala Tyr Thr Glu Gly Met Val Tyr Gly His Lys Tyr485 490 495TTC AAA GAG ACA AAT TAC AAG AGG CTA GTA AGT GTG AAG ACT AAA GTT 1536Phe Lys Glu Thr Asn Tyr Lys ArG Leu Val Ser Val Lys Thr Lys Val500 505 510GAT CCT GAC AAC TTC TTT AGG AAT GAG CAA AGC ATC CCA ACT TTG TCA 1584Asp Pro Asp Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Thr Leu Ser515 520 525TCT TG 1590Ser530(2)關于SEQ ID NO:20的信息(ⅰ)序列特征(A)長度529個氨基酸(B)類型氨基酸(D)拓撲結構線形(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:20Met Glu Thr Ser Ile Leu Thr Leu Leu Leu Leu Leu Leu Ser Thr Gln1 5 10 15Ser Ser Ala Thr Ser Arg Ser Ile Thr Asp Arg Phe Ile Gln Cys Leu20 25 30His Asp Arg Ala Asp Pro Ser Phe Pro Ile Thr Gly Glu Val Tyr Thr35 40 45Pro Gly Asn Ser Ser Phe Pro Thr Val Leu Gln Asn Tyr Ile Arg Asn50 55 60Leu Arg Phe Asn Glu Thr Thr Thr Pro Lys Pro Phe Leu Ile Ile Thr65 70 75 80Ala Glu His Val Ser His Ile Gln Ala Ala Val Val Cys Gly Lys Gln85 90 95Asn Arg Leu Leu Leu Lys Thr Arg Ser Gly Gly His Asp Tyr Glu Gly100 105 110Leu Ser Tyr Leu Thr Asn Thr Asn Gln Pro Phe Phe Ile Val Asp Met115 120 125Phe Asn Leu Arg Ser Ile Asn Val Asp Ile Glu Gln Glu Thr Ala Trp130 135 140Val Gln Ala Gly Ala Thr Leu Gly Glu Val Tyr Tyr Arg Ile Ala Glu145 150 155 160Lys Ser Asn Lys His Gly Phe Pro Ala Gly Val Cys Pro Thr Val Gly165 170 175Val Gly Gly His Phe Ser Gly Gly Gly Tyr Gly Asn Leu Met Arg Lys180 185 190Tyr Gly Leu Ser Val Asp Asn Ile Val Asp Ala Gln Ile Ile Asp Val195 200 205Asn Gly Lys Leu Leu Asp Arg Lys Ser Met Gly Glu Asp Leu Phe Trp210 215 220Ala Ile Thr Gly Gly Gly Gly Val Ser Phe Gly Val Val Leu Ala Tyr225 230 235 240Lys Ile Lys Leu Val Arg Val Pro Glu Val Val Thr Val Phe Thr Ile245 250 255Glu Arg Arg Glu Glu Gln Asn Leu Ser Thr Ile Ala Glu Arg Trp Val260 265 270Gln Val Ala Asp Lys Leu Asp Arg Asp Leu Phe Leu Arg Met Thr Phe275 280 285Ser Val Ile Asn Asp Thr Asn Gly Gly Lys Thr Val Arg Ala Ile Phe290 295 300Pro Thr Leu Tyr Leu Gly Asn Ser Arg Asn Leu Val Thr Leu Leu Asn305 310 315 320Lys Asp Phe Pro Glu Leu Gly Leu Gln Glu Ser Asp Cys Thr Glu Met325 330 335Ser Trp Val Glu Ser Val Leu Tyr Tyr Thr Gly Phe Pro Ser Gly Thr340 345 350Pro Thr Thr Ala Leu Leu Ser Arg Thr Pro Gln Arg Leu Asn Pro Phe355 360 365Lys Ile Lys Ser Asp Tyr Val Gln Asn Pro Ile Ser Lys Arg Gln Phe370 375 380Glu Phe Ile Phe Glu Arg Met Lys Glu Leu Glu Asn Gln Met Leu Ala385 390 395 400Phe Asn Pro Tyr Gly Gly Arg Met Ser Glu Ile Ser Glu Phe Ala Lys405 410 415Pro Phe Pro His Arg Ser Gly Asn Ile Ala Lys Ile Gln Tyr Glu Val420 425 430Asn Trp Glu Asp Leu Ser Asp Glu Ala Glu Asn Arg Tyr Leu Asn Phe435 440 445Thr Arg Leu Met Tyr Asp Tyr Met Thr Pro Phe Val Ser Lys Asn Pro450 455 460Arg Glu Ala Phe Leu Asn Tyr Arg Asp Leu Asp Ile Gly Ile Asn Ser465 470 475 480His Gly Arg Asn Ala Tyr Thr Glu Gly Met Val Tyr Gly His Lys Tyr485 490 495Phe Lys Glu Thr Asn Tyr Lys Arg Leu Val Ser Val Lys Thr Lys Val500 505 510Asp Pro Asp Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Thr Leu Ser515 520 525Ser(2)關于SEQ ID NO:21的信息(ⅰ)序列特征(A)長度350個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅹⅰ)特征(A)名稱/關鍵詞CDS(B)位置2..350(ⅸ)序列描述SEQ ID NO:21GAGAAACTCG GAGACTTTCA CACAATGCCT AACCTCAAAC TCCGACCCCA AACATCCCAT 60CTCCCCCGCT ATCTTCTTCT CCGGAAATGG CTCCTACTCC TCCGTATTAC AAGCCAACAT 120CCGTAACCTC CGCTTCAACA CCACCTCAAC TCCGAAACCC TTCCTCATAA TCGCCGCAAC 180ACATGAATCC CATGTGCAAG CCGCGATTAC TTGCGGGAAA CGCCACAACC TTCAGATGAA 240AATCAGAAGT GGAGGCCACG ACTACGATGG CTTGTCATAC GTTACATACT CTGGCAAACC 300GTTCTTCGTC CTCGACATGT TTAACCTCCG TTCGGTGGAT GTCGACGTGG350(2)關于SEQ ID NO:22的信息(ⅰ)序列特征(A)長度278個堿基對
(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅹⅰ)特征(A)名稱/關鍵詞CDS(B)位置2..278(ⅹⅰ)序列描述SEQ ID NO:22GGCATGGATC TCCGCCGGAG CGACTCTCGG AGAGGTTTAT TATCGGATTT GGGAGAAAAG 60CAGAGTCCAT GGATTCCCCG CCGGAGTTTG ACCGACGGTT GGTGTTGGTG GGCATTTAAG 120CGGCGGTGGT TACGGTAACA TGGTGAGGAA GTTTGGATTA TCTGTGGATT ACGTTGAGGA 180TGCCAAGATC GTCGATGTAA ACNGTCGGGT TTTAGATCGG AAAGCAATGG GTGAGGATCT 240GTTCTGGGCG ATTACCGGTG GAGGAGGAGG TAGCGTAC 278(2)關于SEQ ID NO:23的信息(ⅰ)序列特征(A)長度345個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源
(A)生物擬南芥(B)株系Columbia生態型(ⅹⅰ)特征(A)名稱/關鍵詞CDS(B)位置2..345(ⅸ)序列描述SEQ ID NO:23TGGACATATT AGCGGAGGAG GATTCGGTAC AATAATGAGG AAATACGGTT TAGCGTCTGA 60TAACGTTGTG GACGCACGTT TGATGGATGT AAATGGGAAA ACTCTTGACC GGAAAACGAT 120GGGAGAGGAT TTGTTTTGGG CGCTTAGAGG CGGTGGAGCT GCGAGTTTTG GCGTTGTCTT 180GTCGTGGAAG GTTAAGCTTG CTAGGGTTCC TGAAAAGGTA ACTTGTTTCA TAAGTCAACA 240TCCGATGGGA CCTAGCATGA ACAAGCTTGT TCATAGATGG CAATCCATAG GATCAAGANN 300GCTAGACGAA GATTTATTCA TCAGAGTCAA TATTGACAAC AGTCT 345(2)關于SEQ ID NO:24的信息(ⅰ)序列特征(A)長度695個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅹⅰ)特征(A)名稱/關鍵詞CDS(B)位置1..695(ⅸ)序列描述SEQ ID NO:24GTTCGTTAAA ACCTATCCTN NANGGGCNAA AGNATATCAA AGNTTGNTTA NGNAACCCAA 60NATTTCTGAA CTGGCCNCCT TCGGTGGTAT ATGNCNAAAN CCCTTGAATC TGCGNANCCN 120ATTCCGCATA GAAACGGAAC CCTCTTCAAG ATTCTCTATT TACNCGAACT GNCTAGANNG 180AATGACAAGA CATCGAGTAG NAAAATCAAC TGGATCAAAG AGATATACAA TTACATGGCG 240CCTTATGTCT CAAGCAATCC AAGACAAGCA TATGTGAACT ACAGAGATCT AGACTTCGGA 300CAGAACAAGA ACAACGCAAA GGTTAACTTC ATTGAAGCTA AAATCTGGGG ACCTAAGTAC 360TTCAAAGGCA ATTTTGACAG ATTGGTGAAG ATTAAAACCA AGGTTGATCC AGAGAACTTC 420TTCAGGCACG AGCAGAGTAT CCCACCTATG CCCTACTAGA AGCTAGGTTC ATGAAACCAA 480TAACATTATC AAAAATAAGR ATAAATGRTA ATTGTATACA ACATGATTCG KCTTTCTTTA 540TTTCAGACAA TGTGGACACT ACTCTAAANT AAAAWGTCNA TTTACCTTAA AAAAAAAATA 600ATCCCCNNTA ANANAAAANT GGGGGGGCCN TTTTTGGGGN TCCCGGTTTT NGGACGGGGN 660GCTTTNGGGG GGCTTGGNNT TTTTTTNGGN GCCCC695(2)關于SEQ ID NO:25的信息(ⅰ)序列特征(A)長度495個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅹⅰ)特征(A)名稱/關鍵詞CDS(B)位置2..495
(ⅹⅰ)序列描述SEQ ID NO:25TCTGTTTTNA GGCAGAGCAG AGGAAGTTGT TGCTTTGCTT GGTAAGGAGT TTCCTGAATT 60NAGTTTAAAG AAGGAGAACT GTTCGGAGAT GACTTGGTTT CAGTCAGCTT TATGGTGGGA 120TAATCGTGTT AACCCTACTC ANATTGATCC WAAAGTGTTT CTCGATCGGA ATCTTGATAG 180AGCGAATTTC GGAAAGAGGA AATCGGATTA CGTTGCGAGT AAGATTCCTA GAGATGGGAT 240TAAGYCTTTT TCCAAGARGA TGMCTGACCT GGGGAAAAYC GGGCTTGTTT TTAAWCCGTA 300TGGTGGGAAA ATGGCGGAGG TTACGGTTAA CGCGACGCCG TTTCCNCACC GAAGCAAGCT 360TTTTAAGATT CAGTACTCGG TGACTTNGCA AGAAAACTCT NTCGAGATAG AGAAAGGGTT 420TCTTGAATCA GGCTAACGTC CTTATAGGTT CATGACCGGG TTTTTNAGCA AGANCCCTGG 480AATNCTTACT TNAAT 495(2)關于SEQ ID NO:26的信息(ⅰ)序列特征(A)長度204個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅹⅰ)特征(A)名稱/關鍵詞CDS(B)位置1..204(ⅹⅰ)序列描述SEQ ID NO:26AAATTAAAAC AAATCAATGT TGATATTGAA TCCAATAGTG CTTGGTTTCA ACCTGGTGCT 60ACGCTTGGTG AGCTTTACTA CAGAATTNCA GAGAAGAGCA AAATCCATGG ATTTCCNGCG 120GGTTTNTNCA CAAGCNTAGG CATAGGTGGG TATATNANAG GCGGTGGATA CGGTACCTTG 180ATGAGGAAGT ATGGTCTTNC GGGA204(2)關于SEQ ID NO:27的信息(ⅰ)序列特征(A)長度491個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅹⅰ)特征(A)名稱/關鍵詞CDS(B)位置2..491(ⅸ)序列描述SEQ ID NO:27GAGATTTCTC GAGCAAGATA CTCCACTGAT GATCTTTGAG CCATTGGGTG GGAAAATCAG 60CAAGATTTCA GAAACAGAAT CTCCATATCC ACACAGAAGA GGTAATCTGT ATAATATACA 120GTACATGGTG AAATGGAAAG TGAATGANGT CGAGGAGATG AACAAACATG TCAGGTGGAT 180GAGATCGTTA CACGATTACA TGACTCCGTA TGTTTCTAAA TCGCCGAGAG GAGCTTATTT 240GANTTACAGA GATCTTGATT TGGGCTCGAC CAAAGGGATT AACACGGGTT TCGGAGATGC 300AAGGAAATGG NNGGGTGAGN CTTTTTTCAA AGGTAATTTC CAAGGGGTTA GGTTTTGGTT 360AAAGGGGAGG TTTNNCCCAN CAAATTTTTT TTCAGGANCC GGCCANGNTT TTCCCCCCCC 420TNTTTTTNGG NCCCCAATCN AAANCCCCGT TTTAAAAGGG GGGCCATTTC NTTTTTTNCA 480NNTTAAAAGG G 491(2)關于SEQ ID NO:28的信息(ⅰ)序列特征(A)長度407個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅹⅰ)特征(A)名稱/關鍵詞CDS(B)位置3..407(ⅸ)序列描述SEQ ID NO:28ATTTGTTCGT GAGGTTAACT TTGACTTTAG TCAACGGTAC GAAGCCTGGT GAGAATACGG 60TTTTAGCGAC TTTCATTGGG ATGTATTTAG GCCGGTCGGA TAAGCTGTTG ACCGTNATGA 120ACCGGGATTT CCCGGAGTTG AAGCTGAAGA AAACCGATTN TACCGAGATG AGATGGATCG 180ATTCGGTTCT GTTTTGGGAC GATTATCCGG TTGGTACACC GACTTCTGTG CTACTAAATC 240CGCTAGTCGC AAAAAAGTTG TTCATGAAAC GAAAATCGGA CTACGTGAAG CGTCTNATTT 300TCGAGAACCC GATCTCNNGT TTGATACTCA AGAAATTTGT AGAGGTTNNG AAAGTTAAAA 360TNAATTTGGA TCCGCATTNN GGNANNNATG GTGAAACCCC NNGTTNT 407(2)關于SEQ ID NO:29的信息(ⅰ)序列特征(A)長度360個堿基對(B)類型核酸(C)鏈型雙鏈
(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅹⅰ)特征(A)名稱/關鍵詞CDS(B)位置3..360(ⅸ)序列描述SEQ ID NO:29ACGGCGTCGT ATTGGCCTAC AAAATAAACC TTGTTGAAGT CCCAGAAAAC GTCACCGTTT 60TCAGAATCTC CCGGACGTTA GAACAAAATG CGACGGATAT CATTCACCGG TGGCAACAAG 120TTGCACCGAA GCTTCCCGAC GAGCTTTTCA TAAGANCAGT CATTGACGTA NAAACGGCAC 180TGTTTCATNN CTCAAAAGAC CGTCAGACAA CATTCATAGC AATGTTTCTA GGAGACACGN 240CAACTCTACT GTCGATATTA AACCGGAGAT TCCCAGAATT GGGTTTGGTC CGGTCTGACT 300GTACCGNAAC AAGCNNTTGG ATCCAATCTG TGCTATTTTT GGGACAAATA TCCCAGGTTG 360(2)關于SEQ ID NO:30的信息(ⅰ)序列特征(A)長度427個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源
(A)生物擬南芥(B)株系Columbia生態型(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置3..427(ⅹⅰ)序列描述SEQ ID NO:30TCTTCACTGT CACCAAAACG TTAGAACAAG ACGCAAGATT GAAGACTATT TCTAAGTGGC 60AACAAATTTC ATCCAAGATT ATTGAAGAGA TACACATCCG AGTGGTACTC AGAGCAGCTG 120GAAATGATGG AAACAAGACT GTGACAATGA CCTACCTAGG TCAGTTTCTT GGCGAGAAAG 180GCACCTTGCT GAAGGTTATG GAGAAGGCTT TTCCAGAACT AGGGTTAACT CAAAAGGATT 240GTACTGAAAT GAGCTGGATT GAAGCCGCCC TTTTCCATGG TGGRTTTCCA ACAGGKTCTC 300CTATTGAAAT TTTGCTTMAG CTCAAGTCGC CTYTAGGAAA AGRTTWCTTC AAAGCAACGK 360CGGATTTCGT TAAAGAACCT WTTCCTGTGA TAGGGCTCAA AGGAATATTC AAAAGATTGA 420TTGAAGG 427(2)關于SEQ ID NO:31的信息(ⅱ)序列特征(A)長度437個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅸ)特征
(A)名稱/關鍵詞CDS(B)位置1..437(ⅹⅰ)序列描述SEQ ID NO:31GTTGTACTAT CATNGAAGAT TAAGTTAGTC GATGTTCCGT CCACGGTCAC CGNGTTTAAA 60GTCCAGAAAC ATNAGGAGAA AGAGGCCGTT AGGNTCATCA ACAAGTGGCA GTATGTTGCG 120GATAAGGTCC CTGAAGATCT TTTCATCAGC GCAACGTTGG NGAGATCAAA CGGAAACTCT 180GTGCAGGCTT TGTTTACTGG ACTCTATCTT GGNCCGGTGA ATAATNTCTT GGCCTTGATG 240GAAGAAAAGT TTCCAGANTT AGGTCTTGAT ATCCAAGNCT GCACAGAGAT GAGTTGGGCT 300GAATCTGCAC TCTGGTNTNC TGNTTTCNCT AAAGGAGAGN CTCCTTGGGT GTTCCNCGCG 360GATCGGNAGC GGNCAATTTN TGGNCTTTCA AGGGGAAAGN CGGCTTTTTN CAAGAACCCG 420NTACCCGGGG TTCAATT437(2)關于SEQ ID NO:32的信息(ⅰ)序列特征(A)長度441個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置1..441(ⅹⅰ)序列描述SEQ ID NO:32GCGGACCCTA TAGATCANNA TGTGCTACTG ANAGAAGAGG AAGCCAAGAA CAAGCCGGAG 60ACAGATAAAT ATCTGAAATG GGNCGATANC GTTTACGAAT TTATGACNCC ATATGTTTCG 120AAATCTCCAA GAGGAGCTTA TGTCAATTTC AAGGATATGG ATTTGGGTAT GTATCTTGGA 180AAGAAGAAGA CAAAGTACGA GGAAGGAAAG AGTTGGGGAG TGAAGTATTT CAAGAACAAT 240TTCGAGAGAT TGGTGAGAGT GAAGACTAGG GTTGATCCAA CAGATTTCTT CTGCGATGAA 300CAGAGCATTC CTCTGGTGAA CAAAGTTACC TGAAGATATC ATTTGAAGTT TTTTATTAGT 360CCCTTTTCTC TGTGAAATCA TCTGTGCGTG TTGAATATTA TGCGTCAAGT GTGTAACTTA 420TGTGTGTGAT TGTGAATTGT G 441(2)關于SEQ ID NO:33的信息(ⅰ)序列特征(A)長度502個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置2..502(ⅹⅰ)序列描述SEQ ID NO:33CTGGCTTAAC ACAACGTCGT TTTGGGCCAA TTACCCGGCG GGTACACCCA AGAGCATCCT 60TCTAGATAGG CCTCCGACGA ATTCAGTGTC ATTTAAGAGT AAATCGGATT TTGTCAAAAA 120ACCAATACCC AAAAAAGGTT TAGAGAAGCT TTGGAAGACA ATGTTTAAAT TCAACAGTAG 180CGTCTCGTTG CAATTCAACC CTTACGGTGG AGTGATGGAC CGGATTCCGG CAACGGCCAC 240CGCTTTTCCT CATCGGAAAG GAAACTTGTT CAAGGTTCAA TACNCTACGA TGTGGTTTGA 300CGCAAACGCC ACACAGAGTA GCCNGGCTAT GATGAATGAG CTTTTTGAGG TGGCGGGACC 360GTACGTGNGT CAAGTAAACC CGAGANANGG CTTCCTTTAA NTTCAGAGNC CATCGNTNTT 420NGGAGCAANN CCAAGTGGGG GGGNCCAACC GGGGGNTNAA ANCNNAGNTC TTNGGGGGCC 480CAGAATTTCC TTNGGGGAAT TT 502(2)關于SEQ ID NO:34的信息(ⅰ)序列特征(A)長度400個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置2..400(ⅹⅰ)序列描述SEQ ID NO:34NGGGAATTGC NCGAGGNAAG TTGTACCCAA TTCCTGGACC ACCATTGGTT TCCCAAGAAN 60CCCGAGACAA CCGTTTTTCA ATNACCGTGA TGTTGATTTG GGTATTAATT CTCATAATGG 120TAAAATCAGT AGTTATGTGG AAGGTAAACG TTACGGGAAG AAGTATTTCG CAGGTAATTT 180CGAGAGATTG GTGAAGATTA AGACGAGAGT TGATAGTGGT AATTTCTTTA GGAACGAACA 240GAGTATTCCT GTGTTACCAT AAGTGTATTT ATTTGATTAT TGGTTAGTGA AATTTGTTGT 300TGTATAATGA TTATATGTCG TATTTTTATT TATTATTAGT AATTTATAAA GTTTGATATT 360AAATACAAAT AGTATAATAA GATAGTTTCT TTTAGTAAAA 400(2)關于SEQ ID NO:35的信息(ⅰ)序列特征(A)長度383個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置2..383(ⅹⅰ)序列描述SEQ ID NO:35CAACTCTAAT GGGAACACCT ACTTCGATCG AATGTCGATG GGGGAAGAGC TTTTCTGGGC 60GGTTCGAGGA GGTGGAGCCG CGAGTTTCGG CATCGTGATG GGATACAAAA TCCGGTTGGT 120TCCGGTTCCG GAGAAAGTTA CGGTTTTTAG CGTCGGAAAA ACCGTCGGAG AAGGAGCCGT 180TGATCTTATA ATGAAGTGGC AGAACTTCTC TCATAGTACG GNTCGGAATT TNTTTGTGAA 240GCTGANTTTT GANTTTAGTC AACGGTGCAA AGCCGGGTGA AAAAAAGGTT TTAGNGNCTT 300TCANTTTGGN TGNAANCTTG GGGGTTTTAT NAGAACGGTT AACCGGGATT NANCCCGNGT 360TTTCCCGGGG TTAAAACCTT NGG 383(2)關于SEQ ID NO:36的信息(ⅰ)序列特征
(A)長度354個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置1..354(ⅹⅰ)序列描述SEQ ID NO:36ATCAATGTTC TTACTAAACG TACACGAGCA TCGTTGGCTT TCAAGGCTAA ATCTGATTTT 60NTTCAAGAAC CGATNCCTAA AACCGCGATT TCGAAGCTTT GGAGACGGTT GCAAGAACCG 120GAAGCAGAGC ATGCTCAGCT AATTTNCACN CCATTTGGTG GTAAAATGAG TNAGATTGCA 180GATTACGAAA CACCATTTCC GCATAGGAAG GGGAATATAT ATNAGATTCA GTACTTGAAT 240TACTGGAGAG GAGACGTGAA AGAGAAGTAT ATTGAGATNG GTGGAGGAGA GTTTACGGTT 300GNTATNAGTA AGTTTTTTGG CGAAGTNTNC CNAGAGGNGN CTTNNTNTAA ACCT 354(2)關于SEQ ID NO:37的信息(ⅰ)序列特征(A)長度403個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置2..403(ⅹⅰ)序列描述SEQ ID NO:37TTTTTTAGTA CACTAATAAT CAAATGGAAT GAGAAATGAA GCCACAAAAG TATCTGCAAT 60CAAAATATCC TGCTATCTCC ATCTCAAGCT CTCAATAGTA TCCTCTCCGA AAGTGAAATC 120AACATTTCAA ACTCTATTTC TTGGTGGAAT CGATAGACTG ATTCCTCTGA TGAACCAGAA 180GTTTCCGGAA CTCGGCTTAC GATCTCAAGA CTGTTCGGAA ATGAGCTGGA TCGAATCGAT 240AATGTTCTTC AACTGGAGAT CAGGACAGCC GTTAGAGATT TTGCTCAACA GAGACCTAAG 300GATTCGAGGA TCAGTATTTC AAAGCAAAGT CAGGATTATG GTTCAAAAAC CCGTTCCTGA 360AAACGTTTTT CGAAGAGGTA TCCAAGGGGT TTCTCGAGCA AGT 403(2)關于SEQ ID NO:38的信息(ⅰ)序列特征(A)長度260個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置1..260(ⅹⅰ)序列描述SEQ lD NO:38GAGATGAGTT GGATTAANTC TGTACTCTGG TTTGCTGATT TCCCTAAAGG AGAATCTCTT 60NGTGTTCTCA CGAATCGTAA GCGTACATCT CTATCTTTNA AAGGCAAAGA TGATTTTATC 120CAAGAACCGA TACCCGAGGC TGCAATTNAA GAGATATGGA GGCGATTAGA AGCCCCCNAG 180GCTCGGCTTG GAAAGATCAT ATTAACTCCA TTTGGTGGGA AAATNAGTGA AATGGCAGAG 240TACGTANCAC CATTCCCACA 260(2)關于SEQ ID NO:39的信息(ⅰ)序列特征(A)長度605個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置2..605(ⅹⅰ)序列描述SEQ ID NO:39CTCTTGCATA TTCGCTGCAA GGATGGGAAA TTCAAAACCA CTCCCTACAA TTTTTTGTAT 60TATAGTTTCA GTCTTGTATT TTTAATTCTA TTGCATAACA CCAACTTCTT CATCAGCCTC 120CATCCAAGAT CAATTCATAA ACTGTGTCAA AAGAAACACA CATGTTTCTT TTCCACTCGA 180GAAAACGTTA TTCACCCCTG CGAAAAACGT CTCTTTGTTC AACCAAGTCC TTGANTCGAC 240GGCTCAAAAT CTCCAGTTCT TGGCAAAATC CATGCCTAAA CCGGGRTTCA TATTCAGACC 300GATTCACCAG TCTCAAGTCC AAGSTTCCAT CATTTGTTCA AMGRAACTCG GGNTTCATTT 360TNGTGTTTGA NGTGGCGGTC ACGATTTTCG AGGCCTTTGT NTTTATGTTT CACGGTTTGA 420AAAAACCGTT TATATTACTC GGCCTGTCAA ANTTGNANNC AAAATCANAT GTTGGATATT 480GNATTCCAAA TAGGTNCTTG GGGTNAACCT GGTGGCTANC GTTTGGTGAG CTTTTACTTT 540CAAGAATTTG CANGNGGANG TGCAAAGATT CCATGGGATT TCCCGGGGGG TTTNTTGCAC 600AATGT 605(2)關于SEQ ID NO:40的信息(ⅰ)序列特征(A)長度464個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置2..464(ⅹⅰ)序列描述SEQ ID NO:40AACACAAAAC TCTTCCATTT GGCTTCTCTC TTGCATATTC GTTGCAAGGA TGGGAAATTC 60AAAACCACTC CCTACAATTN CTTGTATTAT CGTTTCAGTC TTGTATTTTN NATTCTATTG 120CATAACACCA ACTTCTTCAT CAGCCTCCAT CCAAGNTCAA TTCATAAACT GTGTCAAAAG 180GAACACACAT GTTTCTTTTC CACTCGAGNA AACGGTATTC ACTCCTGCGG AAAACGGCTC 240TNTTATTCAA CGGGTCCNTG AATCGACGGG TCAAAATCTC CAGTTCTTGG NAAAATCCAT 300GNCTAAACCG GGGTTCATAT TCAGGCCGGT TCACCAGTCT CAAGTCCAAG NTTCCATCAT 360TTGTTCAAAG GAACTCGGGA TTCATTTCCG CGNTAGAAGT GGCGGGCANN GGTTTCGGGG 420CCTGTCTNTT GNTTANGGGN AGGAAAACCG GTTNTATTNC TCGG 464(2)關于SEQ ID NO:41的信息(ⅰ)序列特征(A)長度386個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置1..386(ⅹⅰ)序列描述SEQ ID NO:41TCGGGAGCCC ANGNTAAATT ANNTGAAAAT GGGGNCGNAT ANCCGTTTAC NGAATTTTAT 60GACNCCCAAT ATGTTTCGAA ATCTCAAAGA NNGGGANCTT ATGTCAATTT CAAGGATATG 120GATTTGGGTA TGTATCTTGG AAAGNAGAAG ACAAAGTACG AGGAAGGAAA GAGTTGGGGA 180GTGAAGTATT TCAAGAACAA TTTCGAGAGA TTGGTGAGAG TGAAGACTAG GGTTGATCCN 240ACAGATTTCN TCTGCGATGA ACAGAGCATT CCTCTGGTGN ACAAAGTTAC CTGAAGATAT 300CATTTGAAGT TTTTTATTAG TCCCTTTTCT CTGTGAAATC ATCTGTGCGT GTTGAATANT 360ATGCGTCAAG TGTGTAACTT ATGTGT 386(2)關于SEQ ID NO:42的信息(ⅰ)序列特征(A)長度377個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置1..377(ⅹⅰ)序列描述SEQ ID NO:42TACCATAGGG AGGTGGTGNA AGATTTTGTA TGTAGNCTTA GGGGAAGGCG AGTAGTATGG 60TGGTGGTGGG GAGCTGTAAA CGTATGGTGG TGGTGGAGAT TTGTATGTGG GCTGGTTAAC 120TTCATTGAAG CTAAAATCTG GGGACCTAAG TACTTCAAAG GCAATTTTGA CAGATTGGTG 180AAGATTAAAA CCAAGGTTGA TCCAGAGAAC TTCTTCAGGC ACGAGCAGAG TATCCCACCT 240ATGCCCTACT AGAAGCTAGG TTCATGAAAC CAATAACATT ATCAAAAATA AGAATAAATG 300ATAATTGTAT ACAACATGAT TCGTCTTTCT TTATTTCAGA CAATGTGGAC ACTACTCTAA 360ATAAAATGTC ATTTACC377(2)關于SEQ ID NO:43的信息(ⅰ)序列特征(A)長度377個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置1..377(ⅹⅰ)序列描述SEQ ID NO:43TACCATAGGG AGGTGGTGNA AGATTTTGTA TGTAGNCTTA GGGGAAGGCG AGTAGTATGG 60TGGTGGTGGG GAGCTGTAAA CGTATGGTGG TGGTGGAGAT TTGTATGTGG GCTGGTTAAC 120TTCATTGAAG CTAAAATCTG GGGACCTAAG TACTTCAAAG GCAATTTTGA CAGATTGGTG 180AAGATTAAAA CCAAGGTTGA TCCAGAGAAC TTCTTCAGGC ACGAGCAGAG TATCCCACCT 240ATGCCCTACT AGAAGCTAGG TTCATGAAAC CAATAACATT ATCAAAAATA AGAATAAATG 300ATAATTGTAT ACAACATGAT TCGTCTTTCT TTATTTCAGA CAATGTGGAC ACTACTCTAA 360ATAAAATGTC ATTTACC377(2)關于SEQ ID NO:44的信息(ⅰ)序列特征(A)長度346個堿基對(B)類型核酸
(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置2..346(ⅹⅰ)序列描述SEQ ID NO:44GAGCTGTGGA TATGGTCACA AATGGCAATC GGTTGGTCCG AAAACTGATC CGAATCTTTT 60TATGAGAATN TTGATTCAAC CAGTGACGAG GAAGAAGGTA AAGACTGTGA GAGCTTCTNT 120GGTTGCCCTN TTTTNAGGCN AGACAGATGA AGTTTTTGCT TTCCTTAGTA AGGAGTTTCC 180TGAATTGGGT TTAAAGAAGG AGAATTNTTC GGAGATGACT TGGTTTCANT CTGCTTTATG 240GTGGGACAAT CGTCTTAATG CTACTCAGGT TGATCCTAAA GTNTTTCTTG ATCGGAATCT 300CGATACCTCG AGTTTCGGTA AGAGGAAATC GGATTACGTC GCGACT346(2)關于SEQ ID NO:45的信息(ⅰ)序列特征(A)長度261個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置2..261(ⅹⅰ)序列描述SEQ ID NO:45ATGGGGTGAG ACTTATTTCA AAGGTAATTT CAAGAGATTA GGTTTGGTTA AAGGGAAGNT 60TGATCCAACA AATTTCTTCA GGAACGAACA GAGTATTCCT CCTCTGTTTT GAGTCCTCAA 120TACAAAACCA GATATAAAAG ATGTCATTTC ATTTTTTCAA TTATAATAGA TAATGTAACT 180TTCTGCTACA ATTGTAAAAG TGAGATGTAC CCAATACGGT TTAAGCGGAC CGAGAATAGT 240CAATTCAAAG ACCAAATTCT G 261(2)關于SEQ ID NO:46的信息(ⅰ)序列特征(A)長度478個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置1..478(ⅹⅰ)序列描述SEQ ID NO:46GCTCAAAGGA CTAACCATGA AAACTTCCTC AAGTGTCTCT CTCACCGANT CAACGAGGAC 60GACTCAAGAN TTATACACAC ATCAAAAGAT CCTTCGTATT TNTCAATCTT GATTTCTTCC 120ATACAAAATC CAAGTTTCTC TGTTCTCGAA ACACCTAAAC CGGTTTCAAT CATCACTCCG 180GTTCAAGCCA CCGATGTTCA ATCTACGNTT AAATNCGCAC GGNCTTCACG GGTATACACA 240ATCAGGGCTA GGAGTGGTNG TCATGACTAC GGAGGTTTAT CTTTACATTG GCTTAAAAAN 300CANNCCGTTC GTTNNTCATT GATTTNNAGA AATCTTCCGG GCTTATTTAA CATNTAAGAT 360GTTTGATAAN CCGGNNCCNG TTTGGGGTTC AAATCCCGGT GGCTTACAAA NTTNGGGGGA 420ATTGTNCCTA TGAGGTTTGG AAAATTAANG CAAAATNTTT TGGGCCTTCC CGGCCGGT 478(2)關于SEQ ID NO:47的信息(ⅰ)序列特征(A)長度579個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系Columbia生態型(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置2..579(ⅹⅰ)序列描述SEQ ID NO:47GGCCGTTAGG ATCATCAAGA AATGGCAATA TGCTGCAGAT AAGGTTCCTG ATGATCTTTT 60CATTAGGACA ACATTGGAGA GATCAAACAA GAACGCAGTA CACGCTTTGT TCACTGGACT 120ATATATTGGT CCGGTGAACA ATCTATTGGC GTTGATGGAA GAAAAGTTTC CGGAACTAGG 180TCTTGAGAAA GAAGGTTGTG AAGAGATGAG TTGGATTGAG TCTGTACTCT GGTTTGCTGA 240TTTCCCTAAA GGAGAATCTC TTGGTGTTCT CACGAATCGT GAGCGTACAT CTCTATCTTT 300CAAAGGCAAA GATGATTTTG TCCAAGAACC GATACCCGAG GCTGCAATTC AAGAGATATG 360GAGGCGATTA GAAGCCCCCG AGGCTCGGCT TGGAAAGATC ATATTAACTC CATTTGGGTG 420NGGNAAAATG AGTGAAATGG CAGAGNCCGA ACCACCAATT CCCACANNCG AGGGAGGGGA 480ACCCCTNTGN GGNTCAGAAT GTGGTTCCTG GNNNNNAAGN GGGNGCCAGN ACCAANCCGG 540GNCNGTAAAN CNTGNAATGG GCCNAACCCG TNCCGGATT579(2)關于SEQ ID NO:48的信息(ⅰ)序列特征(A)長度252個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物稻(B)株系日本型,粳型亞種(D)發育階段黃化苗(8日齡)(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置3..252(ⅹⅰ)序列描述SEQ ID NO:48TGTCCTGGAA GGTCCGCCTC GTGCAGGTTN CGACGACGGT GACGGTGTTC GTCGTCGGGA 60GGAACGTCGA CCAGGGCGCC GCNGACGTCG TCGCCAGATG GCAAGACGTC GCGCCGAGCC 120TCCCTCCCGA GCTCACCATA CGGGTGATCG TNCGAGGGCA GCGCGCCACG TTCCAGTCGC 180TGTACCTCGG CTCGTGCGCC GACCTGGTGC CGACGATGAG CAGCATGTTC CCGGAGCTCG 240GGATGACGAT TG 252(2)關于SEQ ID NO:49的信息(ⅰ)序列特征(A)長度21個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型蛋白質(ⅲ)假設否(ⅵ)原始來源(A)生物萵苣(B)株系lollo bionda(ⅸ)特征(A)名稱/關鍵詞修飾的位點(B)位置12(D)其它信息/標記物=不確定/備注=“Xaa=Cys或Ser”(ⅸ)特征(A)名稱/關鍵詞修飾的位點(B)位置20..21(D)其它信息/標記物=不確定/備注=“Xaa-Xaa可能是Ser-Phe”(ⅹⅰ)序列描述SEQ ID NO:49Thr Ser Thr Ser Ile Ile Asp Arg Phe Thr Gln Xaa Leu Asn Asn Arg1 5 10 15Ala Asp Pro Xaa Xaa20(2)關于SEQ ID NO:50的信息(ⅰ)序列特征(A)長度24個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型蛋白質(ⅲ)假設否(ⅵ)原始來源(A)生物萵苣(B)株系lollo bionda(ⅸ)特征(A)名稱/關鍵詞修飾的位點(B)位置1(D)其它信息/標記物=不確定/備注“Xaa=可能是Ser”(ⅸ)特征(A)名稱/關鍵詞修飾的位點(B)位置3(D)其它信息/標記物=未知(ⅸ)特征(A)名稱/關鍵詞修飾的位點(B)位置5(D)其它信息/標記物=不確定/備注“Xaa=可能是Ser”(ⅸ)特征(A)名稱/關鍵詞修飾的位點(B)位置12(D)其它信息/標記物=不確定
/備注“Xaa=可能是Trp”(ⅸ)特征(A)名稱/關鍵詞修飾的位點(B)位置24(D)其它信息/標記物=不確定/備注“Xaa=可能是Tyr”(ⅹⅰ)序列描述SEQ ID NO:50Xaa Ile Xaa Val Xaa Ile Glu Asp Glu Thr Ala Xaa Val Gln Ala Gly1 5 10 15Ala Thr Leu Gly Glu Val Tyr Xaa20(2)關于SEQ ID NO:51的信息(ⅰ)序列特征(A)長度14個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型蛋白質(ⅲ)假設否(A)生物萵苣(B)株系lollo bionda(ⅹⅰ)序列描述SEQ ID NO:51Ala Asp Pro Ser Phe Pro Leu Ser Gly Gln Leu Tyr Tyr Pro1 5 10(2)關于SEQ ID NO:52的信息(ⅰ)序列特征(A)長度32個氨基酸(B)類型氨基酸
(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅹⅰ)序列描述SEQ ID NO:52ACTTCTACTT CTATTATTGA TAGGTTTACT CA 32(2)關于SEQ ID NO:53的信息(ⅰ)序列特征(A)長度405個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物萵苣(B)株系lollo bionda(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置1..405(ⅹⅰ)序列描述SEQ ID NO:53ACT TCT ACT TCT ATT ATT GAT AGG TTT ACT CAA TGT CTA AAC AAC CGA 48Thr Ser Thr Ser Ile Ile Asp Arg Phe Thr Gln Cys Leu Asn Asn Arg1 5 10 15GCT GAC CCT TCT TTC CCG CTC AGT GGA CAA CTT TAC ACT CCC GAT AAC 96Ala Asp Pro Ser Phe Pro Leu Ser Gly Gln Leu Tyr Thr Pro Asp Asn20 25 30TCC TCT TTT CCA TCC GTC TTG CAA GCT TAC ATC CGG AAC CTC CGA TTC 144Ser Ser Phe Pro Ser Val Leu Gln Ala Tyr Ile Arg Asn Leu Arg Phe35 40 45AAT GAA TCC ACG ACT CCC AAA CCC ATC TTA ATC ATC ACC GCC TTA CAC 192Asn Glu Ser Thr Thr Pro Lys Pro Ile Leu Ile Ile Thr Ala Leu His50 55 60CCT TCA CAC ATT CAA GCA GCT GTT GTG TGC GCC AAA ACA CAC CGC CTG 240Pro Ser His Ile Gln Ala Ala Val Val Cys Ala Lys Thr His Arg Leu65 70 75 80CTA ATG AAA ACC AGA AGC GGA GGC CAT GAT TAT GAG GGG CTT TCC TAT 288Leu Met Lys Thr Arg Ser Gly Gly His Asp Tyr Glu Gly Leu Ser Tyr85 90 95GTG ACC AAT TCG AAC CAA CCC TTT TTT GTT GTT GAC ATG TTC AAC TTA 336Val Thr Asn Ser Asn Gln Pro Phe Phe Val Val Asp Met Phe Asn Leu100 105 110CGC TCC ATA AAC GTG AGT ATT GAA GAT GAA ACT GCA TGG GTC CAA GCC 384Arg Ser Ile Asn Val Ser Ile Glu Asp Glu Thr Ala Trp Val Gln Ala115 120 125GGC GCC ACC CTC GGA GAA GTT 405Gly Ala Thr Leu Gly Glu Val130 135(2)關于SEQ ID NO:54的信息(ⅰ)序列特征(A)長度135個氨基酸(B)類型氨基酸(D)拓撲結構線形(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:54Thr Ser Thr Ser Ile Ile Asp Arg Phe Thr Gln Cys Leu Asn Asn Arg1 5 10 15Ala Asp Pro Ser Phe Pro Leu Ser Gly Gln Leu Tyr Thr Pro Asp Asn20 25 30Ser Ser Phe Pro Ser Val Leu Gln Ala Tyr Ile Arg Asn Leu Arg Phe35 40 45Asn Glu Ser Thr Thr Pro Lys Pro Ile Leu Ile Ile Thr Ala Leu His50 55 60Pro Ser His Ile Gln Ala Ala Val Val Cys Ala Lys Thr His Arg Leu65 70 75 80Leu Met Lys Thr Arg Ser Gly Gly His Asp Tyr Glu Gly Leu Ser Tyr85 90 95Val Thr Asn Ser Asn Gln Pro Phe Phe Val Val Asp Met Phe Asn Leu100 105 110Arg Ser Ile Asn Val Ser Ile Glu Asp Glu Thr Ala Trp Val Gln Ala115 120 125Gly Ala Thr Leu Gly Glu Val130 135(2)關于SEQ ID NO:55的信息(ⅰ)序列特征(A)長度25個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅹⅰ)序列描述SEQ ID NO:55CACGTTTATG GAGCGTAAGT TGAAC25(2)關于SEQ ID NO:56的信息(ⅰ)序列特征(A)長度23個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅹⅰ)序列描述SEQ ID NO:56CACCCTTCAC ACATTCAAGC AGC 23(2)關于SEQ ID NO:57的信息(ⅰ)序列特征(A)長度1981個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物萵苣(B)株系lollo bionda(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置7..1626(ⅸ)特征(A)名稱/關鍵詞未確定(B)位置替換(372,“g”)(ⅸ)特征(A)名稱/關鍵詞未確定(B)位置替換(379,“g”)(ⅸ)特征(A)名稱/關鍵詞未確定(B)位置替換(786,“t”)(ⅸ)特征(A)名稱/關鍵詞未確定(B)位置替換(1105..1106,“ga”)
(D)其它信息/備注“也可能是“gg”和“aa””(ⅹⅰ)序列描述SEQ ID NO:57ACAAAA ATG GCA ATT ACC TAT TCT TTC AAC TTC AAA TCT TAT ATT TTT 48Met Ala Ile Thr Tyr Ser Phe Asn Phe Lys Ser Tyr Ile Phe1 5 10CCT CTC CTC CTT GTC TTG CTC TCT ACC CAT TCA TCA GCG ACT TCA ACT 96Pro Leu Leu Leu Val Leu Leu Ser Thr His Ser Ser Ala Thr Ser Thr15 20 25 30TCC ATT ATA GAT CGC TTC ACC CAA TGT CTA AAC AAC CGA GCT GAC CCT 144Ser Ile Ile Asp Arg Phe Thr Gln Cys Leu Asn Asn Arg Ala Asp Pro35 40 45TCT TTC CCG CTC AGT GGA CAA CTT TAC ACT CCC GAT AAC TCC TCT TTT 192Ser Phe Pro Leu Ser Gly Gln Leu Tyr Thr Pro Asp Asn Ser Ser Phe50 55 60CCA TCC GTC TTG CAA GCT TAC ATC CGG AAC CTC CGA TTC AAT GAA TCC 240Pro Ser Val Leu Gln Ala Tyr Ile Arg Asn Leu Arg Phe Asn Glu Ser65 70 75ACG ACT CCC AAA CCC ATC TTA ATC ATC ACC GCC TTA CAC CCT TCA CAC 288Thr Thr Pro Lys Pro Ile Leu Ile Ile Thr Ala Leu His Pro Ser His80 85 90ATT CAA GCA GCT GTT GTG TGC GCC AAA ACA CAC CGC CTG CTA ATG AAA 336Ile Gln Ala Ala Val Val Cys Ala Lys Thr His Arg Leu Leu Met Lys95 100 105 110ACC AGA AGC GGA GGC CAT GAT TAT GAG GGG CTT TCC TAT GTG ACC AAT 384Thr Arg Ser Gly Gly His Asp Tyr Glu Gly Leu Ser Tyr Val Thr Asn115 120 125TCG AAC CAA CCC TTT TTT GTT GTT GAC ATG TTC AAC TTA CGC TCC ATA 432Ser Asn Gln Pro Phe Phe Val Val Asp Met Phe Asn Leu Arg Ser Ile130 135 140AAC GTG AGT ATT GAA GAT GAA ACT GCA TGG GTC CAA GCT GGT GCG ACT 480Asn Val Ser Ile Glu Asp Glu Thr Ala Trp Val Gln Ala Gly Ala Thr145 150 155CTT GGT GAA GTC TAC TAC CGA ATA GCA GAG AAA AGC AAC AGT CAT GCT 528Leu Gly Glu Val Tyr Tyr Arg Ile Ala Glu Lys Ser Asn Ser His Ala160 165 170TTT CCG GCT GGC GTT TGC CCT ACT GTT GGA GTT GGT GGC CAT TTT AGT 576Phe Pro Ala Gly Val Cys Pro Thr Val Gly Val Gly Gly His Phe Ser175 180 185 190GGT GGT GGT TAT GGT AAC TTG ATG GGA AAA TAC GGC CTT TCT GTT GAC 624Gly Gly Gly Tyr Gly Asn Leu Met Gly Lys Tyr Gly Leu Ser Val Asp195 200 205AAT ATT GTC GAT GCT CAG TTA ATC GAT GTG AAT GGT AAA CTT CTG AAT 672Asn Ile Val Asp Ala Gln Leu Ile Asp Val Asn Gly Lys Leu Leu Asn210 215 220CGG AAA TCA ATG GGT GAA GAT CTT TTT TGG GCC ATC ACA GGT GGT GGT 720Arg Lys Ser Met Gly Glu Asp Leu Phe Trp Ala Ile Thr Gly Gly Gly225 230 235GGT GTC AGC TTT GGT GTG GTT GTA GCG TAC AAG ATC AAA CTG GTT CGT 768Gly Val Ser Phe Gly Val Val Val Ala Tyr Lys Ile Lys Leu Val Arg240 245 250GTT CCT ACC ACT GTG ACC GTT TTT AAC GTA CAA AGA ACA TCC GAG CAG 816Val Pro Thr Thr Val Thr Val Phe Asn Val Gln Arg Thr Ser Glu Gln255 260 265 270AAC CTA AGC ACC ATA GCC CAC CGA TGG ATA CAA GTT GCG GAT AAG CTC 864Asn Leu Ser Thr Ile Ala His Arg Trp Ile Gln Val Ala Asp Lys Leu275 280 285GAT AAT GAC CTT TTC CTT CGA ATG ACC TTT AAC GTG ATA AAC AAC ACA 912Asp Asn Asp Leu Phe Leu Arg Met Thr Phe Asn Val Ile Asn Asn Thr290 295 300AAT GGC GAA AAG ACG ATA CGT GGT TTG TTT CCA ACA CTG TAC CTC GGA 960Asn Gly Glu Lys Thr Ile Arg Gly Leu Phe Pro Thr Leu Tyr Leu Gly305 310 315AAC TCT ACC GCT CTT GTT GCC CTC CTG AAC AAG GAT TTC CCT GAA TTA 1008Asn Ser Thr Ala Leu Val Ala Leu Leu Asn Lys Asp Phe Pro Glu Leu320 325 330GGT GTA GAA ATT TCA GAT TGT ATT GAA ATG AGT TGG ATC GAG TCT GTT 1056Gly Val Glu Ile Ser Asp Cys Ile Glu Met Ser Trp Ile Glu Ser Val335 340 345 350CTT TTC TAC ACA AAC TTC CCC ATT GGT ACT CCG ACC ACT GCT CTT CTA 1104Leu Phe Tyr Thr Asn Phe Pro Ile Gly Thr Pro Thr Thr Ala Leu Leu355 360 365AGC CGT ACA CCT CAA AGA CTA AAC CCA TTC AAA ATC AAA TCT GAT TAC 1152Ser Arg Thr Pro Gln Arg Leu Asn Pro Phe Lys Ile Lys Ser Asp Tyr370 375 380GTA AAA AAC ACT ATT TCC AAA CAG GGA TTC GAA TCC ATA TTT GAA AGG 1200Val Lys Asn Thr Ile Ser Lys Gln Gly Phe Glu Ser Ile Phe Glu Arg385 390 395ATG AAA GAA CTC GAA AAC CAA ATG CTA GCT TTC AAC CCT TAT GGT GGA 1248Met Lys Glu Leu Glu Asn Gln Met Leu Ala Phe Asn Pro Tyr Gly Gly400 405 410AGA ATG AGC GAA ATT TCC GAA TTT GCA AAG CCT TTT CCC CAT CGA TCA 1296Arg Met Ser Glu Ile Ser Glu Phe Ala Lys Pro Phe Pro His Arg Ser415 420 425 430GGG AAT ATA GCG AAG ATC CAA TAC GAA GTA AAC TGG GAT GAA CTT GGC 1344Gly Asn Ile Ala Lys Ile Gln Tyr Glu Val Asn Trp Asp Glu Leu Gly435 440 445GTT GAA GCA GCC AAT CGG TAC TTG AAC TTC ACA AGG GTG ATG TAT GAT 1392Val Glu Ala Ala Asn Arg Tyr Leu Asn Phe Thr Arg Val Met Tyr Asp450 455 460TAT ATG ACT CCG TTT GTT TCT AAG AAC CCC AGG GAA GCA TTT CTG AAC 1440Tyr Met Thr Pro Phe Val Ser Lys Asn Pro Arg Glu Ala Phe Leu Asn465 470 475TAC AGG GAT TTA GAT ATT GGT GTC AAC AGT CAT GGC AAG AAT GCT TAC 1488Tyr Arg Asp Leu Asp Ile Gly Val Asn Ser His Gly Lys Asn Ala Tyr480 485 490GGT GAA GGA ATG GTT TAT GGG CAC AAG TAT TTC AAA GAG ACG AAT TAT 1536Gly Glu Gly Met Val Tyr Gly His Lys Tyr Phe Lys Glu Thr Asn Tyr495 500 505 510AAG AGG CTA ACG ATG GTG AAG ACG AGG GTT GAT CCT AGC AAT TTT TTT 1584Lys Arg Leu Thr Met Val Lys Thr Arg Val Asp Pro Ser Asn Phe Phe515 520 525AGG AAT GAG CAA AGT ATC CCA ACT TTG TCA TCT TCA TGG AAG 1626Arg Asn Glu Gln Ser Ile Pro Thr Leu Ser Ser Ser Trp Lys530 535 540TAAATTCTAA ATTCACTTGT GAAATTGAAT AAAAGTATGG CTTTTTCAAG GTCATGGTAT 1686CCAGATTCAG ATGATATTGA TATAATTTTG ACTTGTATTT ATACAAACAA AATTATATTA 1746TATTTTTCTG AATTTAGATT TTCCATTCTT TGGAAAAATA TACGAACATT GATGTTGATA 1806TTTTTAAGAA TTATAGATTT TGAACATTGT GAACAATGAA TAAACCGAGG ACTTCCCTTG 1866GGTTTTTTTT ATAAGTATGT AATAGCATGT CTTTAATCAA GATAACCGAT CATTGGATGC 1926AATTTATTAT TATAAACCTT ATTTAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAA 1981(2)關于SEQ ID NO:58的信息(ⅰ)序列特征(A)長度540個氨基酸(B)類型氨基酸(D)拓撲結構線形(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:58Met Ala Ile Thr Tyr Ser Phe Asn Phe Lys Ser Tyr Ile Phe Pro Leu1 5 10 15Leu Leu Val Leu Leu Ser Thr His Ser Ser Ala Thr Ser Thr Ser Ile20 25 30Ile Asp Arg Phe Thr Gln Cys Leu Asn Asn Arg Ala Asp Pro Ser Phe35 40 45Pro Leu Ser Gly Gln Leu Tyr Thr Pro Asp Asn Ser Ser Phe Pro Ser50 55 60Val Leu Gln Ala Tyr Ile Arg Asn Leu Arg Phe Asn Glu Ser Thr Thr65 70 75 80Pro Lys Pro Ile Leu Ile Ile Thr Ala Leu His Pro Ser His Ile Gln85 90 95Ala Ala Val Val Cys Ala Lys Thr His Arg Leu Leu Met Lys Thr Arg100 105 110Ser Gly Gly His Asp Tyr Glu Gly Leu Ser Tyr Val Thr Asn Ser Asn115 120 125Gln Pro Phe Phe Val Val Asp Met Phe Asn Leu Arg Ser Ile Asn Val130 135 140Ser Ile Glu Asp Glu Thr Ala Trp Val Gln Ala Gly Ala Thr Leu Gly145 150 155 160Glu Val Tyr Tyr Arg Ile Ala Glu Lys Ser Asn Ser His Ala Phe Pro165 170 175Ala Gly Val Cys Pro Thr Val Gly Val Gly Gly His Phe Ser Gly Gly180 185 190Gly Tyr Gly Asn Leu Met Gly Lys Tyr Gly Leu Ser Val Asp Asn Ile195 200 205Val Asp Ala Gln Leu Ile Asp Val Asn Gly Lys Leu Leu Asn Arg Lys210 215 220Ser Met Gly Glu Asp Leu Phe Trp Ala Ile Thr Gly Gly Gly Gly Val225 230 235 240Ser Phe Gly Val Val Val Ala Tyr Lys Ile Lys Leu Val Arg Val Pro245 250 255Thr Thr Val Thr Val Phe Asn Val Gln Arg Thr Ser Glu Gln Asn Leu260 265 270Ser Thr Ile Ala His Arg Trp Ile Gln Val Ala Asp Lys Leu Asp Asn275 280 285Asp Leu Phe Leu Arg Met Thr Phe Asn Val Ile Asn Asn Thr Asn Gly290 295 300Glu Lys Thr Ile Arg Gly Leu Phe Pro Thr Leu Tyr Leu Gly Asn Ser305 310 315 320Thr Ala Leu Val Ala Leu Leu Asn Lys Asp Phe Pro Glu Leu Gly Val325 330 335Glu Ile Ser Asp Cys Ile Glu Met Ser Trp Ile Glu Ser Val Leu Phe340 345 350Tyr Thr Asn Phe Pro Ile Gly Thr Pro Thr Thr Ala Leu Leu Ser Arg355 360 365Thr Pro Gln Arg Leu Asn Pro Phe Lys Ile Lys Ser Asp Tyr Val Lys370 375 380Asn Thr Ile Ser Lys Gln Gly Phe Glu Ser Ile Phe Glu Arg Met Lys385 390 395 400Glu Leu Glu Asn Gln Met Leu Ala Phe Asn Pro Tyr Gly Gly Arg Met405 410 415Ser Glu Ile Ser Glu Phe Ala Lys Pro Phe Pro His Arg Ser Gly Asn420 425 430Ile Ala Lys Ile Gln Tyr Glu Val Asn Trp Asp Glu Leu Gly Val Glu435 440 445Ala Ala Asn Arg Tyr Leu Asn Phe Thr Arg Val Met Tyr Asp Tyr Met450 455 460Thr Pro Phe Val Ser Lys Asn Pro Arg Glu Ala Phe Leu Asn Tyr Arg465 470 475 480Asp Leu Asp Ile Gly Val Asn Ser His Gly Lys Asn Ala Tyr Gly Glu485 490 495Gly Met Val Tyr Gly His Lys Tyr Phe Lys Glu Thr Asn Tyr Lys Arg500 505 510Leu Thr Met Val Lys Thr Arg Val Asp Pro Ser Asn Phe Phe Arg Asn515 520 525Glu Gln Ser Ile Pro Thr Leu Ser Ser Ser Trp Lys530 535 540(2)關于SEQ ID NO:59的信息(ⅰ)序列特征(A)長度27個堿基對(B)類型核酸(C)鏈型單鏈
(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅹⅰ)序列描述SEQ ID NO:59GGTAATGATC TCCTTTCTTG TTTGACC 27(2)關于SEQ ID NO:60的信息(ⅰ)序列特征(A)長度41個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅲ)反義否(ⅹⅰ)序列描述SEQ ID NO:60AGAGCGGCCG CTATATTACA ACTTCTCCAC CATCACTCCT C41(2)關于SEQ ID NO:61的信息(ⅰ)序列特征(A)長度24個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅹⅰ)序列描述SEQ ID NO:61:GGTGATGTTA ATGATAATCT CCTC 24(2)關于SEQ ID NO:62的信息(ⅰ)序列特征(A)長度40個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅹⅰ)序列描述SEQ ID NO:62AGAGCGGCCG CTACAATTCC TTCAACATGT AAATTTCCTC 40(2)關于SEQ ID NO:63的信息(ⅰ)序列特征(A)長度36個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅹⅰ)序列描述SEQ ID NO:63ACTTCCCGTA GAAACTCGGA GACTTTCACA CAATGC 36(2)關于SEQ ID NO:64的信息(ⅰ)序列特征(A)長度30個堿基對
(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅹⅰ)序列描述SEQ ID NO:64TCCATCCAAG ATCAATTCAT AAACTGTGTC30(2)關于SEQ ID NO:65的信息(ⅰ)序列特征(A)長度36個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅹⅰ)序列描述SEQ ID NO:65AGAGCGGCCG CTTTCATGAA CCTAGCTTCT AGTAGG 36(2)關于SEQ ID NO:66的信息(ⅰ)序列特征(A)長度37個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否
(ⅹⅰ)序列描述SEQ ID NO:66AGAGCGGCCG CGAAATGGCC CCCCTTTTAA AACGGGG37(2)關于SEQ ID NO:67的信息(ⅰ)序列特征(A)長度40個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅹⅰ)序列描述SEQ ID NO:67AGAGCGGCCG CAAATGATAT CTTCAGGTAA CTTTGTTCAC 40(2)關于SEQ ID NO:68的信息(ⅰ)序列特征(A)長度43個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅹⅰ)序列描述SEQ ID NO:68AGAGCGGCCG CATAATCAAA TAAATACACT TATGGTAACA CAG 43(2)關于SEQ ID NO:69的信息
(ⅰ)序列特征(A)長度38個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線形(ⅱ)分子類型cDNA(ⅲ)假設否(ⅹⅰ)序列描述SEQ ID NO:69AGAGCGGCCG CTGGTTTTGT ATTGAGGACT CAAAACAG38(2)關于SEQ ID NO:70的信息(ⅰ)序列特征(A)長度1757個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型DNA(基因組)(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系columbia(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置接點(1..570,801..1754)(ⅹⅰ)序列描述SEQ ID NO:70ACT TCC CGT AGA AAC TCG GAG ACT TTC ACA CAA TGC CTA ACC TCA AAC 48Thr Ser Arg Arg Asn Ser Glu Thr Phe Thr Gln Cys Leu Thr Ser Asn1 5 10 15TCC GAC CCC AAA CAT CCC ATC TCC CCC GCT ATC TTC TTC TCC GGA AAT96Ser Asp Pro Lys His Pro Ile Ser Pro Ala Ile Phe Phe Ser Gly Asn20 25 30GGC TCC TAC TCC TCC GTA TTA CAA GCC AAC ATC CGT AAC CTC CGC TTC 144Gly Ser Tyr Ser Ser Val Leu Gln Ala Asn Ile Arg Asn Leu Arg Phe35 40 45AAC ACC ACC TCA ACT CCG AAA CCC TTC CTC ATA ATC GCC GCA ACA CAT 192Asn Thr Thr Ser Thr Pro Lys Pro Phe Leu Ile Ile Ala Ala Thr His50 55 60GAA TCC CAT GTG CAA GCC GCG ATT ACT TGC GGG AAA CGC CAC AAC CTT 240Glu Ser His Val Gln Ala Ala Ile Thr Cys Gly Lys Arg His Asn Leu65 70 75 80CAG ATG AAA ATC AGA AGT GGA GGC CAC GAC TAC GAT GGC TTG TCA TAC 288Gln Met Lys Ile Arg Ser Gly Gly His Asp Tyr Asp Gly Leu Ser Tyr85 90 95GTT ACA TAC TCT GGC AAA CCG TTC TTC GTC CTC GAC ATG TTT AAC CTC 336Val Thr Tyr Ser Gly Lys Pro Phe Phe Val Leu Asp Met Phe Asn Leu100 105 110CGT TCG GTG GAT GTC GAT GTG GCA AGT AAG ACC GCG TGG GTC CAA ACC 384Arg Ser Val Asp Val Asp Val Ala Ser Lys Thr Ala Trp Val Gln Thr115 120 125GGT GCC ATA CTC GGA GAA GTT TAT TAC TAT ATA TGG GAG AAG AGC AAA 432Gly Ala Ile Leu Gly Glu Val Tyr Tyr Tyr Ile Trp Glu Lys Ser Lys130 135 140ACC CTA GCT TAT CCC GCC GGA ATT TGT CCC ACG GTT GGT GTC GGT GGC 480Thr Leu Ala Tyr Pro Ala Gly Ile Cys Pro Thr Val Gly Val Gly Gly145 150 155 160CAT ATC AGT GGT GGA GGT TAC GGT AAC ATG ATG AGA AAA TAC GGT CTC 528His Ile Ser Gly Gly Gly Tyr Gly Asn Met Met Arg Lys Tyr Gly Leu165 170 175ACC GTA GAT AAT ACC ATC GAT GCA AGA ATG GTC GAC GTT AAT 570Thr Val Asp Asn Thr Ile Asp Ala Arg Met Val Asp Val Asn180 185 190GGTATAATTG ATATCTCTAT TTTATATACT AATTAAATTT TATAGTGTGG ATCGGATAGT 630GATTTTGGTC CATCAATTAA AAACTTGGTG AACATAAAAT TAACCAAGCA ATCAATTTAG 690ACAAGCAACA TAATCATATA TATTTTTCTT ACATTTGTAT GTACCTGAAT ATTTATATTT 750ATGTTTATAT GTTCTCACTA TATTTTCACT TTTGTATTTG AAAATTTTTA GGA AAA806Gly LysATT TTG GAT AGA AAA TTG ATG GGA GAA GAT CTC TAC TGG GCA ATA AAC 854Ile Leu Asp Arg Lys Leu Met Gly Glu Asp Leu Tyr Trp Ala Ile Asn195 200 205GGA GGA GGA GGA GGG AGC TAC GGC GTC GTA TTG GCC TAC AAA ATA AAC 902Gly Gly Gly Gly Gly Ser Tyr Gly Val Val Leu Ala Tyr Lys Ile Asn210 215 220CTT GTT GAA GTC CCA GAA AAC GTC ACC GTT TTC AGA ATC TCC CGG ACG 950Leu Val Glu Val Pro Glu Asn Val Thr Val Phe Arg Ile Ser Arg Thr225 230 235 240TTA GAA CAA AAT GCG ACG GAT ATC ATT CAC CGG TGG CAA CAA GTT GCA 998Leu Glu Gln Asn Ala Thr Asp Ile Ile His Arg Trp Gln Gln Val Ala245 250 255CCG AAG CTT CCC GAC GAG CTT TTC ATA AGA ACA GTC ATT GAC GTA GTA 1046Pro Lys Leu Pro Asp Glu Leu Phe Ile Arg Thr Val Ile Asp Val Val260 265 270AAC GGC ACT GTT TCA TCT CAA AAG ACC GTC AGG ACA ACA TTC ATA GCA 1094Asn Gly Thr Val Ser Ser Gln Lys Thr Val Arg Thr Thr Phe Ile Ala275 280 285ATG TTT CTA GGA GAC ACG ACA ACT CTA CTG TCG ATA TTA AAC CGG AGA 1142Met Phe Leu Gly Asp Thr Thr Thr Leu Leu Ser Ile Leu Asn Arg Arg290 295 300TTC CCA GAA TTG GGT TTG GTC CGG TCT GAC TGT ACC GAA ACA AGC TGG 1190Phe Pro Glu Leu Gly Leu Val Arg Ser Asp Cys Thr Glu Thr Ser Trp305 310 315 320ATC CAA TCT GTG CTA TTC TGG ACA AAT ATC CAA GTT GGT TCG TCG GAG 1238Ile Gln Ser Val Leu Phe Trp Thr Asn Ile Gln Val Gly Ser Ser Glu325 330 335ACA CTT CTA CTC CAA AGG AAT CAA CCC GTG AAC TAC CTC AAG AGG AAA 1286Thr Leu Leu Leu Gln Arg Asn Gln Pro Val Asn Tyr Leu Lys Arg Lys340 345 350TCA GAT TAC GTA CGT GAA CCG ATT TCA AGA ACC GGT TTA GAG TCA ATT 1334Ser Asp Tyr Val Arg Glu Pro Ile Ser Arg Thr Gly Leu Glu Ser Ile355 360 365TGG AAG AAA ATG ATC GAG CTT GAA ATT CCG ACA ATG GCT TTC AAT CCA 1382Trp Lys Lys Met Ile Glu Leu Glu Ile Pro Thr Met Ala Phe Asn Pro370 375 380TAC GGT GGT GAG ATG GGG AGG ATA TCA TTA CGG GTG ACT CCG TTC CCA 1430Tyr Gly Gly Glu Met Gly Arg Ile Ser Leu Arg Val Thr Pro Phe Pro385 390 395 400TAC AGA GCC GGT AAT CTC TGG AAG ATT CAG TAC GGT GCG AAT TGG AGA 1478Tyr Arg Ala Gly Asn Leu Trp Lys Ile Gln Tyr Gly Ala Asn Trp Arg405 410 415GAT GAG ACT TTA ACC GAC CGG TAC ATG GAA TTG ACG AGG AAG TTG TAC 1526Asp Glu Thr Leu Thr Asp Arg Tyr Met Glu Leu Thr Arg Lys Leu Tyr420 425 430CAA TTC ATG ACA CCA TTT GTT TCC AAG AAT CCG AGA CAA TCG TTT TTC 1574Gln Phe Met Thr Pro Phe Val Ser Lys Asn Pro Arg Gln Ser Phe Phe435 440 445AAT AAC CGT GAT GTT GAT TTG GGT ATT AAT TCT CAT AAT GGT AAA ATC 1622Asn Asn Arg Asp Val Asp Leu Gly Ile Asn Ser His Asn Gly Lys Ile450 455 460AGT AGT TAT GTG GAA GGT AAA CGT TAC GGG AAG AAG TAT TTC GCA GGT 1670Ser Ser Tyr Val Glu Gly Lys Arg Tyr Gly Lys Lys Tyr Phe Ala Gly465 470 475 480AAT TTC GAG AGA TTG GTG AAG ATT AAG ACG AGA GTT GAT AGT GGT AAT 1718Asn Phe Glu Arg Leu Val Lys Ile Lys Thr Arg Val Asp Ser Gly Asn485 490 495TTC TTT AGG AAC GAA CAC AGT ATT CCT GTG TTA CCA TAA 1757Phe Phe Arg Asn Glu His Ser Ile Pro Val Leu Pro500 505(2)關于SEQ ID NO:71的信息(ⅰ)序列特征(A)長度508個氨基酸(B)類型氨基酸(D)拓撲結構線形(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:71Thr Ser Arg Arg Asn Ser Glu Thr Phe Thr Gln Cys Leu Thr Ser Asn1 5 10 15Ser Asp Pro Lys His Pro Ile Ser Pro Ala Ile Phe Phe Ser Gly Asn20 25 30Gly Ser Tyr Ser Ser Val Leu Gln Ala Asn Ile Arg Asn Leu Arg Phe35 40 45Asn Thr Thr Ser Thr Pro Lys Pro Phe Leu Ile Ile Ala Ala Thr His50 55 60Glu Ser His Val Gln Ala Ala Ile Thr Cys Gly Lys Arg His Asn Leu65 70 75 80Gln Met Lys Ile Arg Ser Gly Gly His Asp Tyr Asp Gly Leu Ser Tyr85 90 95Val Thr Tyr Ser Gly Lys Pro Phe Phe Val Leu Asp Met Phe Asn Leu100 105 110Arg Ser Val Asp Val Asp Val Ala Ser Lys Thr Ala Trp Val Gln Thr115 120 125Gly Ala Ile Leu Gly Glu Val Tyr Tyr Tyr Ile Trp Glu Lys Ser Lys130 135 140Thr Leu Ala Tyr Pro Ala Gly Ile Cys Pro Thr Val Gly Val Gly Gly145 150 155 160His Ile Ser Gly Gly Gly Tyr Gly Asn Met Met Arg Lys Tyr Gly Leu165 170 175Thr Val Asp Asn Thr Ile Asp Ala Arg Met Val Asp Val Asn Gly Lys180 185 190Ile Leu Asp Arg Lys Leu Met Gly Glu Asp Leu Tyr Trp Ala Ile Asn195 200 205Gly Gly Gly Gly Gly Ser Tyr Gly Val Val Leu Ala Tyr Lys Ile Asn210 215 220Leu Val Glu Val Pro Glu Asn Val Thr Val Phe Arg Ile Ser Arg Thr225 230 235 240Leu Glu Gln Asn Ala Thr Asp Ile Ile His Arg Trp Gln Gln Val Ala245 250 255Pro Lys Leu Pro Asp Glu Leu Phe Ile Arg Thr Val Ile Asp Val Val260 265 270Asn Gly Thr Val Ser Ser Gln Lys Thr Val Arg Thr Thr Phe Ile Ala275 280 285Met Phe Leu Gly Asp Thr Thr Thr Leu Leu Ser Ile Leu Asn Arg Arg290 295 300Phe Pro Glu Leu Gly Leu Val Arg Ser Asp Cys Thr Glu Thr Ser Trp305 310 315 320Ile Gln Ser Val Leu Phe Trp Thr Asn Ile Gln Val Gly Ser Ser Glu325 330 335Thr Leu Leu Leu Gln Arg Asn Gln Pro Val Asn Tyr Leu Lys Arg Lys340 345 350Ser Asp Tyr Val Arg Glu Pro Ile Ser Arg Thr Gly Leu Glu Ser Ile355 360 365Trp Lys Lys Met Ile Glu Leu Glu Ile Pro Thr Met Ala Phe Asn Pro370 375 380Tyr Gly Gly Glu Met Gly Arg Ile Ser Leu Arg Val Thr Pro Phe Pro385 390 395 400Tyr Arg Ala Gly Asn Leu Trp Lys Ile Gln Tyr Gly Ala Asn Trp Arg405 410 415Asp Glu Thr Leu Thr Asp Arg Tyr Met Glu Leu Thr Arg Lys Leu Tyr420 425 430Gln Phe Met Thr Pro Phe Val Ser Lys Asn Pro Arg Gln Ser Phe Phe435 440 445Asn Asn Arg Asp Val Asp Leu Gly Ile Asn Ser His Asn Gly Lys Ile450 455 460Ser Ser Tyr Val Glu Gly Lys Arg Tyr Gly Lys Lys Tyr Phe Ala Gly465 470 475 480Asn Phe Glu Arg Leu Val Lys Ile Lys Thr Arg Val Asp Ser Gly Asn485 490 495Phe Phe Arg Asn Glu His Ser Ile Pro Val Leu Pro500 505(2)關于SEQ ID NO:72的信息(ⅰ)序列特征(A)長度1527個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系columbia(ⅸ)特征
(A)名稱/關鍵詞CDS(B)位置1..1524(ⅹⅰ)序列描述SEQ ID NO:72ACT TCC CGT AGA AAC TCG GAG ACT TTC ACA CAA TGC CTA ACC TCA AAC48Thr Ser Arg Arg Asn Ser Glu Thr Phe Thr Gln Cys Leu Thr Ser Asn1 5 10 15TCC GAC CCC AAA CAT CCC ATC TCC CCC GCT ATC TTC TTC TCC GGA AAT96Ser Asp Pro Lys His Pro Ile Ser Pro Ala Ile Phe Phe Ser Gly Asn20 25 30GGC TCC TAC TCC TCC GTA TTA CAA GCC AAC ATC CGT AAC CTC CGC TTC 144Gly Ser Tyr Ser Ser Val Leu Gln Ala Asn Ile Arg Asn Leu Arg Phe35 40 45AAC ACC ACC TCA ACT CCG AAA CCC TTC CTC ATA ATC GCC GCA ACA CAT 192Asn Thr Thr Ser Thr Pro Lys Pro Phe Leu Ile Ile Ala Ala Thr His50 55 60GAA TCC CAT GTG CAA GCC GCG ATT ACT TGC GGG AAA CGC CAC AAC CTT 240Glu Ser His Val Gln Ala Ala Ile Thr Cys Gly Lys Arg His Asn Leu65 70 75 80CAG ATG AAA ATC AGA AGT GGA GGC CAC GAC TAC GAT GGC TTG TCA TAC 288Gln Met Lys Ile Arg Ser Gly Gly His Asp Tyr Asp Gly Leu Ser Tyr85 90 95GTT ACA TAC TCT GGC AAA CCG TTC TTC GTC CTC GAC ATG TTT AAC CTC 336Val Thr Tyr Ser Gly Lys Pro Phe Phe Val Leu Asp Met Phe Asn Leu100 105 110CGT TCG GTG GAT GTC GAC GTG GCA AGT AAG ACC GCG TGG GTC CAA ACC 384Arg Ser Val Asp Val Asp Val Ala Ser Lys Thr Ala Trp Val Gln Thr115 120 125GGT GCC ATA CTC GGA GAA GTT TAT TAC TAT ATA TGG GAG AAG AGC AAA 432Gly Ala Ile Leu Gly Glu Val Tyr Tyr Tyr Ile Trp Glu Lys Ser Lys130 135 140ACC CTA GCT TAT CCC GCC GGA ATT TGT CCC ACG GTT GGT GTC GGT GGC 480Thr Leu Ala Tyr Pro Ala Gly Ile Cys Pro Thr Val Gly Val Gly Gly145 150 155 160CAT ATC AGT GGT GGA GGT TAC GGT AAC ATG ATG AGA AAA TAC GGT CTC 528His Ile Ser Gly Gly Gly Tyr Gly Asn Met Met Arg Lys Tyr Gly Leu165 170 175ACC GTA GAT AAT ACC ATC GAT GCA AGA ATG GTC GAC GTA AAT GGA AAA 576Thr Val Asp Asn Thr Ile Asp Ala Arg Met Val Asp Val Asn Gly Lys180 185 190ATT TTG GAT AGA AAA TTG ATG GGA GAA GAT CTC TAC TGG GCA ATA AAC 624Ile Leu Asp Arg Lys Leu Met Gly Glu Asp Leu Tyr Trp Ala Ile Asn195 200 205GGA GGA GGA GGA GGG AGC TAC GGC GTC GTA TTG GCC TAC AAA ATA AAC 672Gly Gly Gly Gly Gly Ser Tyr Gly Val Val Leu Ala Tyr Lys Ile Asn210 215 220CTT GTT GAA GTC CCA GAA AAC GTC ACC GTT TTC AGA ATC TCC CGG ACG 720Leu Val Glu Val Pro Glu Asn Val Thr Val Phe Arg Ile Ser Arg Thr225 230 235 240TTA GAA CAA AAT GCG ACG GAT ATC ATT CAC CGG TGG CAA CAA GTT GCA 768Leu Glu Gln Asn Ala Thr Asp Ile Ile His Arg Trp Gln Gln Val Ala245 250 255CCG AAG CTT CCC GAC GAG CTT TTC ATA AGA ACA GTC ATT GAC GTA GTA 816Pro Lys Leu Pro Asp Glu Leu Phe Ile Arg Thr Val Ile Asp Val Val260 265 270AAC GGC ACT GTT TCA TCT CAA AAG ACC GTC AGG ACA ACA TTC ATA GCA 864Asn Gly Thr Val Ser Ser Gln Lys Thr Val Arg Thr Thr Phe Ile Ala275 280 285ATG TTT CTA GGA GAC ACG ACA ACT CTA CTG TCG ATA TTA AAC CGG AGA 912Met Phe Leu Gly Asp Thr Thr Thr Leu Leu Ser Ile Leu Asn Arg Arg290 295 300TTC CCA GAA TTG GGT TTG GTC CGG TCT GAC TGT ACC GAA ACA AGC TGG 960Phe Pro Glu Leu Gly Leu Val Arg Ser Asp Cys Thr Glu Thr Ser Trp305 310 315 320ATC CAA TCT GTG CTA TTC TGG ACA AAT ATC CAA GTT GGT TCG TCG GAG 1008Ile Gln Ser Val Leu Phe Trp Thr Asn Ile Gln Val Gly Ser Ser Glu325 330 335ACA CTT CTA CTC CAA AGG AAT CAA CCC GTG AAC TAC CTC AAG AGG AAA 1056Thr Leu Leu Leu Gln Arg Asn Gln Pro Val Asn Tyr Leu Lys Arg Lys340 345 350TCA GAT TAC GTA CGT GAA CCG ATT TCA AGA ACC GGT TTA GAG TCA ATT 1104Ser Asp Tyr Val Arg Glu Pro Ile Ser Arg Thr Gly Leu Glu Ser Ile355 360 365TGG AAG AAA ATG ATC GAG CTT GAA ATT CCG ACA ATG GCT TTC AAT CCA 1152Trp Lys Lys Met Ile Glu Leu Glu Ile Pro Thr Met Ala Phe Asn Pro370 375 380TAC GGT GGT GAG ATG GGG AGG ATA TCA TCT ACG GTG ACT CCG TTC CCA 1200Tyr Gly Gly Glu Met Gly Arg Ile Ser Ser Thr Val Thr Pro Phe Pro385 390 395 400TAC AGA GCC GGT AAT CTC TGG AAG ATT CAG TAC GGT GCG AAT TGG AGA 1248Tyr Arg Ala Gly Asn Leu Trp Lys Ile Gln Tyr Gly Ala Asn Trp Arg405 410 415GAT GAG ACT TTA ACC GAC CGG TAC ATG GAA TTG ACG AGG AAG TTG TAC 1296Asp Glu Thr Leu Thr Asp Arg Tyr Met Glu Leu Thr Arg Lys Leu Tyr420 425 430CAA TTC ATG ACA CCA TTT GTT TCC AAG AAT CCG AGA CAA TCG TTT TTC 1344Gln Phe Met Thr Pro Phe Val Ser Lys Asn Pro Arg Gln Ser Phe Phe435 440 445AAT TAC CGT GAT GTT GAT TTG GGT ATT AAT TCT CAT AAT GGT AAA ATC 1392Asn Tyr Arg Asp Val Asp Leu Gly Ile Asn Ser His Asn Gly Lys Ile450 455 460AGT AGT TAT GTG GAA GGT AAA CGT TAC GGG AAG AAG TAT TTC GCA GGT 1440Ser Ser Tyr Val Glu Gly Lys Arg Tyr Gly Lys Lys Tyr Phe Ala Gly465 470 475 480AAT TTC GAG AGA TTG GTG AAG ATT AAG ACG AGA GTT GAT AGT GGT AAT 1488Asn Phe Glu Arg Leu Val Lys Ile Lys Thr Arg Val Asp Ser Gly Asn485 490 495TTC TTT AGG AAC GAA CAG AGT ATT CCT GTG TTA CCA TAA 1527Phe Phe Arg Asn Glu Gln Ser Ile Pro Val Leu Pro500 505(2)關于SEQ ID NO:73的信息(ⅰ)序列特征(A)長度508個氨基酸(B)類型氨基酸(D)拓撲結構線形(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:73Thr Ser Arg Arg Asn Ser Glu Thr Phe Thr Gln Cys Leu Thr Ser Asn1 5 10 15Ser Asp Pro Lys His Pro Ile Ser Pro Ala Ile Phe Phe Ser Gly Asn20 25 30Gly Ser Tyr Ser Ser Val Leu Gln Ala Asn Ile Arg Asn Leu Arg Phe35 40 45Asn Thr Thr Ser Thr Pro Lys Pro Phe Leu Ile Ile Ala Ala Thr His50 55 60Glu Ser His Val Gln Ala Ala Ile Thr Cys Gly Lys Arg His Asn Leu65 70 75 80Gln Met Lys Ile Arg Ser Gly Gly His Asp Tyr Asp Gly Leu Ser Tyr85 90 95Val Thr Tyr Ser Gly Lys Pro Phe Phe Val Leu Asp Met Phe Asn Leu100 105 110Arg Ser Val Asp Val Asp Val Ala Ser Lys Thr Ala Trp Val Gln Thr115 120 125Gly Ala Ile Leu Gly Glu Val Tyr Tyr Tyr Ile Trp Glu Lys Ser Lys130 135 140Thr Leu Ala Tyr Pro Ala Gly Ile Cys Pro Thr Val Gly Val Gly Gly145 150 155 160His Ile Ser Gly Gly Gly Tyr Gly Asn Met Met Arg Lys Tyr Gly Leu165 170 175Thr Val Asp Asn Thr Ile Asp Ala Arg Met Val Asp Val Asn Gly Lys180 185 190Ile Leu Asp Arg Lys Leu Met Gly Glu Asp Leu Tyr Trp Ala Ile Asn195 200 205Gly Gly Gly Gly Gly Ser Tyr Gly Val Val Leu Ala Tyr Lys Ile Asn210 215 220Leu Val Glu Val Pro Glu Asn Val Thr Val Phe Arg Ile Ser Arg Thr225 230 235 240Leu Glu Gln Asn Ala Thr Asp Ile Ile His Arg Trp Gln Gln Val Ala245 250 255Pro Lys Leu Pro Asp Glu Leu Phe Ile Arg Thr Val Ile Asp Val Val260 265 270Asn Gly Thr Val Ser Ser Gln Lys Thr Val Arg Thr Thr Phe Ile Ala275 280 285Met Phe Leu Gly Asp Thr Thr Thr Leu Leu Ser Ile Leu Asn Arg Arg290 295 300Phe Pro Glu Leu Gly Leu Val Arg Ser Asp Cys Thr Glu Thr Ser Trp305 310 315 320Ils Gln Ser Val Leu Phe Trp Thr Asn Ile Gln Val Gly Ser Ser Glu325 330 335Thr Leu Leu Leu Gln Arg Asn Gln Pro Val Asn Tyr Leu Lys Arg Lys340 345 350Ser Asp Tyr Val Arg Glu Pro Ile Ser Arg Thr Gly Leu Glu Ser Ile355 360 365Trp Lys Lys Met Ile Glu Leu Glu Ile Pro Thr Met Ala Phe Asn Pro370 375 380Tyr Gly Gly Glu Met Gly Arg Ile Ser Ser Thr Val Thr Pro Phe Pro385 390 395 400Tyr Arg Ala Gly Asn Leu Trp Lys Ile Gln Tyr Gly Ala Asn Trp Arg405 410 415Asp Glu Thr Leu Thr Asp Arg Tyr Met Glu Leu Thr Arg Lys Leu Tyr420 425 430Gln Phe Met Thr Pro Phe Val Ser Lys Asn Pro Arg Gln Ser Phe Phe435 440 445Asn Tyr Arg Asp Val Asp Leu Gly Ile Asn Ser His Asn Gly Lys Ile450 455 460Ser Ser Tyr Val Glu Gly Lys Arg Tyr Gly Lys Lys Tyr Phe Ala Gly465 470 475 480Asn Phe Glu Arg Leu Val Lys Ile Lys Thr Arg Val Asp Ser Gly Asn485 490 495Phe Phe Arg Asn Glu Gln Ser Ile Pro Val Leu Pro500 505(2)關于SEQ ID NO:74的信息(ⅰ)序列特征(A)長度1530個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線形(ⅱ)分子類型cDNA至mRNA(ⅲ)假設否(ⅲ)反義否(ⅵ)原始來源(A)生物擬南芥(B)株系columbia(ⅸ)特征
(A)名稱/關鍵詞CDS(B)位置1..1527(ⅹⅰ)序列描述SEQ ID NO:74TCC ATC CAA GAT CAA TTC ATA AAC TGT GTC AAA AGA AAC ACA CAT GTT48Ser Ile Gln Asp Gln Phe Ile Asn Cys Val Lys Arg Asn Thr His Val1 5 10 15TCT TTT CCA CTC GAG AAA ACG TTA TTC ACC CCT GCG AAA AAC GTC TCT96Ser Phe Pro Leu Glu Lys Thr Leu Phe Thr Pro Ala Lys Asn Val Ser20 25 30TTG TTC AAC CAA GTC CTT GAA TCG ACG GCT CAA AAT CTC CAG TTC TTG 144Leu Phe Asn Gln Val Leu Glu Ser Thr Ala Gln Asn Leu Gln Phe Leu35 40 45GCA AAA TCC ATG CCT AAA CCG GGA TTC ATA TTC AGA CCG ATT CAC CAG 192Ala Lys Ser Met Pro Lys Pro Gly Phe Ile Phe Arg Pro Ile His Gln50 55 60TCT CAA GTC CAA GCT TCC ATC ATT TGT TCA AAG AAA CTC GGA ATT CAT 240Ser Gln Val Gln Ala Ser Ile Ile Cys Ser Lys Lys Leu Gly Ile His65 70 75 80TTT CGT GTT AGA AGT GGC GGT CAC GAT TTC GAG GCC TTG TCT TAT GTT 288Phe Arg Val Arg Ser Gly Gly His Asp Phe Glu Ala Leu Ser Tyr Val85 90 95TCA CGG ATT GAA AAA CCG TTT ATA TTA CTC GAC CTG TCA AAA TTG AAA 336Ser Arg Ile Glu Lys Pro Phe Ile Leu Leu Asp Leu Ser Lys Leu Lys100 105 110CAA ATC AAT GTT GAT ATT GAA TCC AAT AGT GCT TGG GTT CAA CCT GGT 384Gln Ile Asn Val Asp Ile Glu Ser Asn Ser Ala Trp Val Gln Pro Gly115 120 125GCT ACG CTT GGT GAG CTT TAC TAC AGA ATT GCA GAG AAG AGC AAG ATC 432Ala Thr Leu Gly Glu Leu Tyr Tyr Arg Ile Ala Glu Lys Ser Lys Ile130 135 140CAT GGA TTT CCC GCG GGT TTG TGC ACA AGT GTA GGC ATA GGT GGG TAT 480His Gly Phe Pro Ala Gly Leu Cys Thr Ser Val Gly Ile Gly Gly Tyr145 150 155 160ATG ACA GGC GGT GGA TAC GGT ACC TTG ATG AGG AAG TAT GGT CTT GCG 528Met Thr Gly Gly Gly Tyr Gly Thr Leu Met Arg Lys Tyr Gly Leu Ala165 170 175GGA GAT AAT GTT CTA GAC GTA AAG ATG GTT GAT GCA AAT GGT AAA TTA 576Gly Asp Asn Val Leu Asp Val Lys Met Val Asp Ala Asn Gly Lys Leu180 185 190CTC GAC AGA GCC GCG ATG GGT GAG GAC CTA TTT TGG GCG ATT AGA GGA 624Leu Asp Arg Ala Ala Met Gly Glu Asp Leu Phe Trp Ala Ile Arg Gly195 200 205GGC GGT GGA GCG AGT TTC GGG ATA GTT CTA GCA TGG AAG ATC AAG CTT 672Gly Gly Gly Ala Ser Phe Gly Ile Val Leu Ala Trp Lys Ile Lys Leu210 215 220GTT CCT GTT CCT AAG ACT GTT ACC GTC TTC ACT GTC ACC AAA ACG TTA 720Val Pro Val Pro Lys Thr Val Thr Val Phe Thr Val Thr Lys Thr Leu225 230 235 240GAA CAA GAC GCA AGA TTG AAG ACT ATT TCT AAG TGG CAA CAA ATT TCA 768Glu Gln Asp Ala Arg Leu Lys Thr Ile Ser Lys Trp Gln Gln Ile Ser245 250 255TCC AAG ATT ATT GAA GAG ATA CAC ATC CGA GTG GTA CTC AGA GCA GCT 816Ser Lys Ile Ile Glu Glu Ile His Ile Arg Val Val Leu Arg Ala Ala260 265 270GGA AAT GAT GGA AAC AAG ACT GTG ACA ATG ACC TAC CTA GGT CAG TTT 864Gly Asn Asp Gly Asn Lys Thr Val Thr Met Thr Tyr Leu Gly Gln Phe275 280 285CTT GGC GAG AAA GGC ACC TTG CTG AAG GTT ATG GAG AAG GCT TTT CCA 912Leu Gly Glu Lys Gly Thr Leu Leu Lys Val Met Glu Lys Ala Phe Pro290 295 300GAA CTA GGG TTA ACT CAA AAG GAT TGT ACT GAA ATG AGC TGG ATT GAA 960Glu Leu Gly Leu Thr Gln Lys Asp Cys Thr Glu Met Ser Trp Ile Glu305 310 315 320GCC GCC CTT TTC CAT GGT GGA TTT CCA ACA GGT TCT CCT ATT GAA ATT 1008Ala Ala Leu Phe His Gly Gly Phe Pro Thr Gly Ser Pro Ile Glu Ile325 330 335TTG CTT CAG CTC AAG TCG CCT CTA GGA AAA GAT TAC TTC AAA GCA ACG 1056Leu Leu Gln Leu Lys Ser Pro Leu Gly Lys Asp Tyr Phe Lys Ala Thr340 345 350TCG GAT TTC GTT AAA GAA CCT ATT CCT GTG ATA GGC TTC AAA GGA ATA 1104Ser Asp Phe Val Lys Glu Pro Ile Pro Val Ile Gly Phe Lys Gly Ile355 360 365TTC AAA AGA TTG ATT GAA GGA AAC ACA ACA TTT CTG AAC TGG ACT CCT 1152Phe Lys Arg Leu Ile Glu Gly Asn Thr Thr Phe Leu Asn Trp Thr Pro370 375 380TAC GGT GGT ATG ATG TCG AAA ATC CCT GAA TCT GCG ATC CCA TTT CCG 1200Tyr Gly Gly Met Met Ser Lys Ile Pro Glu Ser Ala Ile Pro Phe Pro385 390 395 400CAT AGA AAC GGA ACC CTC TTC AAG ATT CTC TAT TAC GCG AAC TGG CTA 1248His Arg Asn Gly Thr Leu Phe Lys Ile Leu Tyr Tyr Ala Asn Trp Leu405 410 415GAG AAT GAC AAG ACA TCG AGT AGA AAA ATC AAC TGG ATC AAA GAG ATA 1296Glu Asn Asp Lys Thr Ser Ser Arg Lys Ile Asn Trp Ile Lys Glu Ile420 425 430TAC AAT TAC ATG GCG CCT TAT GTC TCA AGC AAT CCA AGA CAA GCA TAT 1344Tyr Asn Tyr Met Ala Pro Tyr Val Ser Ser Asn Pro Arg Gln Ala Tyr435 440 445GTG AAC TAC AGA GAT CTA GAC TTC GGA CAG AAC AAG AAC AAC GCA AAG 1392Val Asn Tyr Arg Asp Leu Asp Phe Gly Gln Asn Lys Asn Asn Ala Lys450 455 460GTT AAC TTC ATT GAA GCT AAA ATC TGG GGA CCT AAG TAC TTC AAA GGC 1440Val Asn Phe Ile Glu Ala Lys Ile Trp Gly Pro Lys Tyr Phe Lys Gly465 470 475 480AAT TTT GAC AGA TTG GTG AAG ATT AAA ACC AAG GTT GAT CCA GAG AAC 1488Asn Phe Asp Arg Leu Val Lys Ile Lys Thr Lys Val Asp Pro Glu Asn485 490 495TTC TTC AGG CAC GAG CAG AGT ATC CCA CCT ATG CCC TAC TAG 1530Phe Phe Arg His Glu Gln Ser Ile Pro Pro Met Pro Tyr500 505(2)關于SEQ ID NO:75的信息(ⅰ)序列特征(A)長度509個氨基酸(B)類型氨基酸(D)拓撲結構線形(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:75Ser Ile Gln Asp Gln Phe Ile Asn Cys Val Lys Arg Asn Thr His Val1 5 10 15Ser Phe Pro Leu Glu Lys Thr Leu Phe Thr Pro Ala Lys Asn Val Ser20 25 30Leu Phe Asn Gln Val Leu Glu Ser Thr Ala Gln Asn Leu Gln Phe Leu35 40 45Ala Lys Ser Met Pro Lys Pro Gly Phe Ile Phe Arg Pro Ile His Gln50 55 60Ser Gln Val Gln Ala Ser Ile Ile Cys Ser Lys Lys Leu Gly Ile His65 70 75 80Phe Arg Val Arg Ser Gly Gly His Asp Phe Glu Ala Leu Ser Tyr Val85 90 95Ser Arg Ile Glu Lys Pro Phe Ils Leu Leu Asp Leu Ser Lys Leu Lys100 105 110Gln Ile Asn Val Asp Ile Glu Ser Asn Ser Ala Trp Val Gln Pro Gly115 120 125Ala Thr Leu Gly Glu Leu Tyr Tyr Arg Ile Ala Glu Lys Ser Lys Ile130 135 140His Gly Phe Pro Ala Gly Leu Cys Thr Ser Val Gly Ile Gly Gly Tyr145 150 155 160Met Thr Gly Gly Gly Tyr Gly Thr Leu Met Arg Lys Tyr Gly Leu Ala165 170 175Gly Asp Asn Val Leu Asp Val Lys Met Val Asp Ala Asn Gly Lys Leu180 185 190Leu Asp Arg Ala Ala Met Gly Glu Asp Leu Phe Trp Ala Ile Arg Gly195 200 205Gly Gly Gly Ala Ser Phe Gly Ile Val Leu Ala Trp Lys Ile Lys Leu210215 220Val Pro Val Pro Lys Thr Val Thr Val Phe Thr Val Thr Lys Thr Leu225 230 235 240Glu Gln Asp Ala Arg Leu Lys Thr Ile Ser Lys Trp Gln Gln Ile Ser245 250 255Ser Lys Ile Ile Glu Glu Ile His Ile Arg Val Val Leu Arg Ala Ala260 265 270Gly Asn Asp Gly Asn Lys Thr Val Thr Met Thr Tyr Leu Gly Gln Phe275 280 285Leu Gly Glu Lys Gly Thr Leu Leu Lys Val Met Glu Lys Ala Phe Pro290 295 300Glu Leu Gly Leu Thr Gln Lys Asp Cys Thr Glu Met Ser Trp Ile Glu305 310 315 320Ala Ala Leu Phe His Gly Gly Phe Pro Thr Gly Ser Pro Ile Glu Ile525 330 335Leu Leu Gln Leu Lys Ser Pro Leu Gly Lys Asp Tyr Phe Lys Ala Thr340 345 350Ser Asp Phe Val Lys Glu Pro Ile Pro Val Ile Gly Phe Lys Gly Ile355 360 365Phe Lys Arg Leu Ile Glu Gly Asn Thr Thr Phe Leu Asn Trp Thr Pro370 375 380Tyr Gly Gly Met Met Ser Lys Ile Pro Glu Ser Ala Ile Pro Phe Pro385 390 395 400His Arg Asn Gly Thr Leu Phe Lys Ile Leu Tyr Tyr Ala Asn Trp Leu405 410 415Glu Asn Asp Lys Thr Ser Ser Arg Lys Ile Asn Trp Ile Lys Glu Ile420 425 430Tyr Asn Tyr Met Ala Pro Tyr Val Ser Ser Asn Pro Arg Gln Ala Tyr435 440 445Val Asn Tyr Arg Asp Leu Asp Phe Gly Gln Asn Lys Asn Asn Ala Lys450 455 460Val Asn Phe Ile Glu Ala Lys Ile Trp Gly Pro Lys Tyr Phe Lys Gly465 470 475 480Asn Phe Asp Arg Leu Val Lys Ile Lys Thr Lys Val Asp Pro Glu Asn485 490 495Phe Phe Arg His Glu Gln Ser Ile Pro Pro Met Pro Tyr500 50權利要求
1.一種分離的蛋白或其部分或其突變蛋白,具有抗真菌活性,優選地抗卵菌綱活性,更優選地抗疫霉和/或抗腐霉活性,并且該蛋白質可從植物來源獲得,由如SEQ ID NO:15,SEQ ID NO:18,SEQ IDNO:57,SEQ ID NO:70,SEQ ID NO:72或SEQ ID NO:74所示的核苷酸序列編碼。
2.根據權利要求1所述的分離的蛋白,其特征在于該蛋白可從向日葵或萵苣植株獲得。
3.一種具有碳水化合物氧化酶活性的分離的蛋白,其特征在于具有抗真菌活性,優選地抗卵菌綱活性,更優選地抗疫霉和/或抗腐霉活性。
4.一種碳水化合物氧化酶或其部分或其突變蛋白,其特征在于具有如SEQ ID NO:16,SEQ ID NO:19,SEQ ID NO:58,SEQ ID NO:71,SEQ ID NO:73或SEQ ID NO:75所示的氨基酸序列。
5.一種分離的蛋白,其特征在于它包括一種或多種選自包含下列氨基酸序列的群體的肽(a)SEQ ID NO:1的1-25位氨基酸,(b)SEQ ID NO:2的1-25氨基酸,(c)SEQ ID NO:6的1-118位氨基酸,(d)SEQ ID NO:16的1-529位氨基酸,或所述序列的具有抗真菌活性的部分,(e)SEQ ID NO:20的1-529位氨基酸,或所述序列的具有抗真菌活性的部分,(f)SEQ ID NO:49的1-21位氨基酸,(g)SEQ ID NO:50的1-24位氨基酸,(h)SEQ ID NO:51的1-14位氨基酸,(i)SEQ ID NO:58的1-540位氨基酸,或所述序列的具有抗真菌活性的部分,(j)SEQ ID NO:71的1-508位氨基酸,或所述序列的具有抗真菌活性的部分,(j)SEQ ID NO:73的1-508位氨基酸,或所述序列的具有抗真菌活性的部分,(j)SEQ ID NO:75的1-509位氨基酸,或所述序列的具有抗真菌活性的部分,以及它們具有抗真菌活性的突變蛋白。
6.一種抗真菌蛋白,其特征在于所包含的氨基酸序列由SEQ IDNO:15所示的開放閱讀框架或其部分編碼。
7.一種抗真菌蛋白,其特征在于所包含的氨基酸序列由SEQ IDNO:57所示的開放閱讀框架或其部分編碼。
8.一種抗真菌蛋白,其特征在于所包含的氨基酸序列由SEQ IDNO:70所示的開放閱讀框架或其部分編碼。
9.一種抗真菌蛋白,其特征在于所包含的氨基酸序列由SEQ IDNO:72所示的開放閱讀框架或其部分編碼。
10.一種抗真菌蛋白,其特征在于所包含的氨基酸序列由SEQ IDNO:74所示的開放閱讀框架或其部分編碼。
11.一種抗真菌蛋白,其特征在于所包含的氨基酸序列由SEQ IDNO:19所示的開放閱讀框架或其部分編碼。
12.一種抗真菌蛋白,其特征在于所包含的氨基酸序列由SEQ IDNO:21-48中的任意一個所示的開放閱讀框架編碼。
13.一種分離的DNA序列,包括能編碼根據權利要求1-12中的任意一項所述的蛋白的開放閱讀框架和能在嚴格條件下與其雜交的DNA。
14.根據權利要求13所述的分離的DNA序列,其特征在于包含SEQID NO:5中所示的核苷酸序列。
15.根據權利要求13所述的分離的DNA序列,其特征在于包含SEQID NO:15中所示的核苷酸序列。
16.根據權利要求13所述的分離的DNA序列,其特征在于包含SEQID NO:19中所示的核苷酸序列。
17.根據權利要求13所述的分離的DNA序列,其特征在于包含SEQID NO:21-48中所示的核苷酸序列。
18.根據權利要求13所述的分離的DNA序列,其特征在于包含SEQID NO:57中所示的核苷酸序列。
19.根據權利要求13所述的分離的DNA序列,其特征在于包含SEQID NO:70中所示的核苷酸序列。
20.根據權利要求13所述的分離的DNA序列,其特征在于包含SEQID NO:72中所示的核苷酸序列。
21.根據權利要求13所述的分離的DNA序列,其特征在于包含SEQID NO:74中所示的核苷酸序列。
22.一種嵌合DNA序列,包含根據權利要求13-21中的任意一項所述的DNA序列。
23.根據權利要求22所述的嵌合DNA序列,進一步包含轉錄起始區域和選擇性地轉錄終止區域,它們與所述開放閱讀框架連接使嵌合DNA在存在于存活宿主細胞中時能在宿主細胞中轉錄,從而產生包含所述開放閱讀框架的RNA。
24.根據權利要求23所述的嵌合DNA序列,其中含所述開放閱讀框架的RNA在存在于所述宿主細胞中時能在宿主細胞中翻譯成蛋白,從而產生所述的蛋白。
25.根據權利要求22-24中的任意一項所述的嵌合DNA序列,是復制子,優選地pMOG1144或pMOG1180。
26.根據權利要求25所述的嵌合DNA序列,是載體。
27.根據權利要求26所述的載體,是兩元載體,優選地pMOG1144或pMOG1180。
28.包含根據權利要求25所述的復制子的宿主細胞,一旦該復制子存在其中就能維持該復制子。
29.包含根據權利要求26或27所述的載體的宿主細胞,一旦存在該載體其中就能維持該載體。
30.根據權利要求22或23所述的嵌合DNA序列穩定摻入其基因組中的宿主細胞。
31.根據權利要求30所述的宿主細胞,是植物細胞,所述載體是非整合型病毒載體。
32.根據權利要求30所述的宿主細胞,是植物細胞。
33.一種植物或植物部分,包含至少一種根據權利要求31或32所述的植物細胞。
34.一種植物或植物部分,基本上由根據權利要求32所述的植物細胞組成。
35.根據權利要求34所述的植物,其特征在于所述嵌合DNA至少在許多植物細胞中表達并使其中合成所述的抗真菌蛋白。
36.合成具有抗真菌活性,優選地抗卵菌綱活性,更優選地抗疫霉和/或抗腐霉活性的蛋白的方法,其特征在于在有利條件下培養根據權利要求29到32所述的宿主細胞并且從宿主細胞回收該蛋白。
36.合成具有抗真菌活性,優選地抗卵菌綱活性,更優選地抗疫霉和/或抗腐霉活性的蛋白的方法,其特征在于在有利條件下培養根據權利要求29到32所述的宿主細胞并且從培養基分離該蛋白。
38.根據權利要求1-12中的任意一項所述的蛋白的用途,用于抑制真菌生長,優選地抑制卵菌綱種類生長,更優選地抑制疫霉屬種類和/或腐霉屬種類生長。
39.一種分子量為55-56kD的植物來源的蛋白,其特征在于具有碳水化合物氧化酶活性。
40.根據權利要求39所述的蛋白,其特征在于是己糖氧化酶。
41.根據權利要求40所述的蛋白,其特征在于可從向日葵或萵苣植株獲得。
42.抑制植物葉子上真菌,優選地卵菌綱,更優選地疫霉或腐霉生長的方法,其特征在于用由根據權利要求29或30所述的宿主細胞或由根據權利要求35所述的植物產生的蛋白處理植物。
43.獲得對真菌,優選地卵菌綱,更優選地疫霉或腐霉的易感性降低的植物的方法,包括以下步驟(a)將嵌合DNA序列導入易于再生出完整植株的祖細胞,-所述嵌合DNA序列包含能編碼根據權利要求1-12中的任意一項所述的蛋白的開放閱讀框架,所述開放閱讀框架可操作性地與轉錄和翻譯區域及選擇性地轉錄終止區域連接,以使對所述真菌侵染易感的植物細胞中合成所述蛋白,并且-所述嵌合DNA序列能編碼植物選擇性標記,以允許選擇所述選擇性標記存在其中的轉化祖細胞,并且(b)在有利于具有所述的選擇性標記的祖細胞的條件下使所述祖細胞再生為植株,并且(c)鑒定合成根據權利要求1-7所述的蛋白的植物,由此降低所述植物對所述真菌侵染的易感性。
44.根據權利要求43所述的方法,其特征在于步驟(a)使用能將T-DNA轉移入植物細胞并攜帶雙元載體的根瘤農桿菌菌株進行,步驟(b)在存在抗生素從而有利于含有新霉素磷酸轉移酶的細胞的情況下進行。
45.一種抗真菌組合物,包含根據權利要求1-12中的任意一項所述的蛋白和適當的載體。
46.能夠識別根據權利要求1-12中的任意一項所述的蛋白的抗體。
47.可從編碼根據權利要求1-12中的任意一項所述的蛋白的基因得到的核酸序列,在植物中具有組織特異性和/或發育特異性轉錄調控活性。
48.根據權利要求47所述的核酸序列,可從所述基因的翻譯起始位點的上游區域得到。
49.根據權利要求48所述的核酸序列,具有所述基因翻譯起始位點上游區域的至少1000個核苷酸。
50.根據權利要求47-49中的任意一項所述的核酸序列的用途,用于制備可在植物中表達的基因構建體。
全文摘要
本發明提供可從植物來源獲得的具有抗真菌活性,特別是抗疫霉和/或抗腐霉活性并且通過SDS聚丙烯酰胺凝膠電泳測定分子量為約55—65千道爾頓的分離的蛋白;以及包含能編碼根據本發明所述的蛋白的開放閱讀框架的分離DNA序列,優選地特征在于所含的開放閱讀框架能編碼在SEQ ID NO:16,SEQ ID NO:57,SEQ ID NO:70,SEQ ID NO:72或SEQ ID NO:74中所示的蛋白或其突變蛋白。本發明進一步包括摻入了能編碼根據本發明所述的蛋白的嵌合DNA并且蛋白在其中表達的植物。本發明也證明了所述蛋白的碳水化合物氧化酶和優選地己糖氧化酶活性。本發明也提供使用該蛋白或能合成該蛋白的宿主細胞來抵抗真菌,尤其是疫霉和腐霉屬種類的方法。
文檔編號C07K14/415GK1233290SQ97198755
公開日1999年10月27日 申請日期1997年9月4日 優先權日1996年9月4日
發明者M·H·斯圖威, J·H·H·V·庫斯特斯, M·B·斯拉-布拉格, L·S·美徹斯, J·P·E·范德威特-特路斯特, W·拉格威格, A·S·普斯坦 申請人:莫根國際股份有限公司