專利名稱:對羥基苯丙酮酸雙加氧酶的植物基因的制作方法
技術領域:
本發明涉及編碼來自植物中的對羥基苯丙酮酸雙加氧酶的核酸的分離和修飾。這些核酸序列用來建立抑制該酶活性的新除草劑化合物的鑒定方法,及制備能耐受這種酶的抑制劑的除草作用的新作物。包括含有編碼對羥基苯丙酮酸雙加氧酶的核酸序列的全部或部分的核酸片段的嵌合基因可用在微生物中生產活性植物對羥基苯丙酮酸雙加氧酶,還引起在植物中該酶修飾形式的產生,使得這種植物耐受該酶的抑制劑。
背景技術:
脫色除草劑靠減少植物葉綠體中的葉綠素和類胡蘿卜素含量影響葉綠體。已知幾種脫色除草劑抑制八氫番茄紅素脫氫酶,導致八氫番茄紅素在處理過的植物中累積,然而苯甲酰環己烷-1,3-二酮引起八氫番茄紅素在植物中積累,但在體外不抑制八氫番茄紅素脫氫酶(Sandmann.G.等(1990)Pestic.Sci.30:353-355)。隨后的工作揭示了這些化合物是對羥基苯丙酮酸雙加氧酶的有效抑制劑(對羥基苯丙酮酸氧氧化還原酶EC1.13.11.27)。該酶是質體醌和生育酚生物合成中的關鍵酶(Schulz.A.等(1993)FEBSLett.318:162-166)。根據觀察,八氫番茄紅素脫氫酶要求一個醌作為電子受體,這些作者推測靠抑制對羥基苯丙酮酸雙加氧酶,這些除草劑阻斷醌的生物合成而間接作用于八氫番茄紅素脫氫酶。
類胡蘿卜素生物合成需要對羥基苯丙酮酸雙加氧酶的觀點,已得到模式植物系統擬南芥(Arabidopsis thaliana)中的遺傳研究的支持。在Pds1和Pds2遺傳位點的突變導致在突變體植物中積累八氫番茄紅素。但是這些突變基因的遺傳圖譜指出它們沒有相應編碼八氫番茄紅素脫氫酶的基因。Pdsl突變能被對羥基苯丙酮酸雙加氧酶的底物尿黑酸補救,因此這種突變相當于對羥基苯丙酮酸雙加氧酶活性上的缺陷。(Norris.S.R.等(1995)Plant Cell7:2139-2149)。
根據這些公開內容,對羥基苯丙酮酸雙加氧酶是新除草劑化合物大有前途的新作用目標。編碼這種酶的植物基因的分離和在轉基因生物中這種基因的功能表達,對以發現基于這種作用模式的新除草劑為目標的研究將是非常有利的。例如,在重組的微生物中生產的活性酶能用來建立篩選方法,用作新的活性化合物的鑒定,和獲得結構及機制信息,用來指導進一步的化學合成。而且這種基因的分離將有利于以產生突變的耐受除草劑的酶形式為目標的研究,這種酶形式使轉基因植物具有除草劑抗性。
已鑒定了與相應編碼哺乳動物對羥基苯丙酮酸雙加氧酶的序列同源的擬南芥cDNA的部分序列(GenBank登錄號T20952)。但這種截短序列不足以鑒定活性的植物對羥基苯丙酮酸雙加氧酶。WO96/38576A2提出了對羥基苯丙酮酸雙加氧酶基因DNA序列的實用性,但與公開序列相關的功能還沒有生化證據。
發明概述本發明涉及編碼植物對羥基苯丙酮酸雙加氧酶的核酸片段的分離和表征,更具體而言,本發明涉及從擬南芥和玉米(Zea mays)中分離編碼對羥基苯丙酮酸雙加氧酶的核酸片段。
本發明也涉及在大腸桿菌(E.coli)中產生活性對羥基苯丙酮酸雙加氧酶。在一個實施方案中,要求保護含有編碼具有對羥基苯丙酮酸雙加氧酶活性的多肽的核酸片段的嵌合基因,其操縱連接于指導基因在大腸桿菌中表達的調節序列。在另一個實施方案中,公開了包含嵌合基因的一個質粒載體,在另一個實施方案中,公開了轉化的大腸桿菌,它包含一個編碼具有對羥基苯丙酮酸雙加氧酶活性的多肽的核酸片段組成的嵌合基因。
本發明也涉及抑制對羥基苯丙酮酸雙加氧酶反應速率的物質的鑒定方法。在一個實施方案中,本發明涉及對羥基苯丙酮酸雙加氧酶抑制劑的檢測,其中來自于轉化大腸桿菌,顯示對羥基苯丙酮酸雙加氧酶活性的多肽在測試物存在時溫育,溫育后測試對羥基苯丙酮酸雙加氧酶的酶活性,其中酶活性的減少是測試物抑制能力的指示。酶活性能用任何適當的手段測試,包括但不限于氧的利用,二氧化碳釋放,尿黑酸的產生和對羥基苯丙酮酸的減少。結果可用放射,比色或層析手段定量。
在另一個實施方案中,本發明涉及基本上能耐受至少一種抑制對羥基苯丙酮酸雙加氧酶反應速率的化合物施用的植物,植物耐受性的獲得可通過以下途徑野生型對羥基苯丙酮酸雙加氧酶的過量表達,該酶的天然抗性變體的表達,或對羥基苯丙酮酸雙加氧酶的改構形式的表達,這種改構形式的酶能抗抑制野生型酶的化合物的作用。
本發明的另一個實施方案中是分離的包含選自以下的成員的核酸片段(a)在SEQ ID NO:16中列出的分離的核酸片段;(b)基本上類似于在SEQ ID NO:16中列出的分離核酸片段的分離核酸片段;(c)與(a)或(b)互補的分離核酸片段。
附圖簡述和序列描述從下列詳述和附圖中以及序列描述中能更充分地理解本發明,它們形成該申請的一部分。
圖1給出了已表達序列標志(EST,GenBank登錄號T92052)的部分核酸序列,其獲自擬南芥cDNA文庫。這個序列包含在基因文庫中的克隆91B13T7中。
圖2給出了編碼全長擬南芥對羥基苯丙酮酸雙加氧酶的克隆cDNA核酸序列,它是原始測定的(SEQ ID NO:2),轉錄起始和終止密碼子下畫線標明,也標出了選擇性的限制位點。
圖3給出了從擬南芥(SEQ ID NO:15)和玉米(SEQ ID NO:11)中獲得的全長對羥基苯丙酮酸雙加氧酶和來源于人(SEQ ID NO:6,GenBank登錄號U29895),豬(SEQ ID NO:7,GenBank登錄號D13390),小鼠(SEQ ID NO:8,GenBank登錄號D29987)和大鼠(SEQ ID NO:9,GenBank登錄號M18405)的對羥基苯丙酮酸雙加氧酶的氨基酸序列比較,星號表示在所有六個物種中保守的氨基酸殘基,該圖是用GCG堆積(Pileup)程序產生的(Program Manual for the WisconsinPackage,Version9.0-OpenVMS,December 1996,GeneticsComputer Group,575 Scince Drive,Madison,WI,USA53711)。
圖4是一個描繪了中間載體pT7B1ueR+PD01.的構建圖。
圖5是一個描繪了大腸桿菌表達載體pE24CP1的構建圖。
申請人在專利申請中提供的序列表與“專利申請中核苷酸和氨基酸的標準代碼規則(EPO局長決定附錄Ⅰ和Ⅱ,OJEPO,12/1992增刊No.2)和37C.F.R.1.821-1.825及附錄A、B一致(含核苷酸和/或氨基酸序列的申請公開的要求)。
SEQ ID NO:1給出了GenBank登錄號T92052的已表達序列標志(EST)的部分核苷酸序列,其獲自擬南芥cDNA基因文庫。該序列包含在基因文庫的克隆91B13T7中。
SEQ ID NO:2給出了原始測定的核酸序列和編碼全長形式的對羥基苯丙酮酸雙加氧酶的cDNA的推斷氨基酸序列。該序列包含在質粒pGBPD2中。
SEQ ID NO:3給出了根據擬南芥對羥基苯丙酮酸雙加氧酶cDNA原始推斷的氨基酸序列。
SEQ ID NO:4和5給出了一對互補寡核苷酸的核苷酸序列(分別為CAM32和CAM33),其用來幫助編碼沒有葉綠體轉運序列的對羥基苯丙酮酸雙加氧酶基因的表達和亞克隆。
SEQ ID NO:6給出了來自人(GenBank登錄號U29895)的對羥基苯丙酮酸雙加氧酶的氨基酸序列。
SEQ ID NO:7給出了來源于豬的(GenBank登錄號D13390)對羥基苯丙酮酸雙加氧酶的氨基酸序列。
SEQID NO:8給出了來源于小鼠的(GenBank登錄號D29987)對羥基苯丙酮酸雙加氧酶的氨基酸序列。
SEQ ID NO:9給出了來源于大鼠的(GenBank登錄號M18405)對羥基苯丙酮酸雙加氧酶的氨基酸序列。
SEQ ID NO:10給出了編碼玉米對羥基苯丙酮酸雙加氧酶的克隆cDNA的核酸序列和推斷氨基酸序列,它包含在質粒pMPDO中。
SEQ ID NO:11給出了編碼玉米對羥基苯丙酮酸雙加氧酶的克隆cDNA的推斷氨基酸序列,它包含在質粒pMPDO中。
SEQ ID NO:12給出了擬南芥的對羥基苯丙酮酸雙加氧酶的截短形式的核酸序列和推斷氨基酸序列,包含在pE24CP1中。
SEQ ID NO:13給出了包含在pE24CP1中的擬南芥對羥基苯丙酮酸雙加氧酶的截短形式的氨基酸序列。
SEQ ID NO:14給出了編碼全長的擬南芥對羥基苯丙酮酸雙加氧酶的克隆cDNA的校正核酸序列和推斷氨基酸序列,它包含在質粒pGPPD2中。
SEQ ID NO:15給出了從編碼全長的擬南芥對羥基苯丙酮酸雙加氧酶的cDNA中推斷的校正氨基酸序列。
SEQ ID NO:16給出了包含在克隆vsl.pk0015.b2。中來自Vernonia galamenesis cDNA一部分的測定核酸序列。
發明詳述生物保藏以下生物材料按布達佩斯條約保藏于美國典型培養物保藏中心(ATCC),12301 Parklawn Drive,Rockville,MD20852,登錄號如下保藏者標識國際保藏宿主菌株 質粒登錄號 保藏日期大腸桿菌BL21(DE3) pE24CP1 ATCC98083 1996.6.25N/A pGBPPD2 ATCC97622 1996.6.25N/A pMPD0 ATCC209120 1997.6.12定義在公開內容的上下文中運用了許多術語。用在這里的術語“核酸”指由單體(核苷酸)組成進而形成單鏈或雙鏈的大分子,單體含有一個糖,磷酸,和嘌呤或嘧啶。一段“核酸片段”是已知的核酸分子的一部分。用在此處的“DNA”(脫氧核糖核酸)是遺傳物質,而“RNA”(核糖核酸)參與DNA編碼的信息傳遞到蛋白質或多肽。“基因組”是在一種生物的每個細胞中的遺傳物質的全體。術語“核苷酸序列”指單鏈或雙鏈的DNA或RNA的聚合物,任選含能摻進DNA或RNA聚合物的合成,非天然或改構的核苷酸堿基。
用在這里的“基本上類似”指DNA序列可能涉及堿基變化,但不引起編碼的氨基酸變化,或涉及的堿基變化可能改變一個或多個氨基酸,但不影響DNA序列編碼的蛋白質的功能特性。因此,可以理解本發明不僅包括特定的示例序列,也包括對序列的修飾例如序列中的缺失,插入,或替換產生的“沉默變化”(即基本不影響所得蛋白分子功能特性的變化)。例如也包括在基因序列中反映遺傳密碼的簡并或導致在給定位點產生化學性質相當的氨基酸的變化。因此丙氨酸,一種疏水性氨基酸,其密碼子能被另一個疏水性較弱的氨基酸的密碼子替換,例如甘氨酸,或被疏水更強的殘基例如,纈氨酸,亮氨酸或異亮氨酸替換。與此類似,由一個負電荷殘基替換另一個負電荷殘基,例如天冬氨酸替換谷氨酸,或一個正電荷殘基替換另一個正電荷殘基,例如賴氨酸替換精氨酸導致的變化,預期也會產生生物等價產物。導致蛋白質分子N末端和C末端變化的核苷酸變化預期也不改變蛋白質的活性。在某些情況下,為了研究變化對蛋白質生物活性的影響,事實上需要作一些序列突變。提出的每種修飾在本領域是常規的技術,測定編碼產物的生物活性保留也是常規技術。并且,本領域技術人員理解,本發明包括的基本相似序列也用在嚴緊條件下(0.1×SSC,0.1%SDS,65℃)與這里的示例序列雜交的能力來限定。
“基因”是編碼一個特定蛋白的核酸片段,包括編碼區上游(5’非編碼區)和下游(3’非編碼區)的調節序列。“天然”基因指在自然條件下發現、有其調節序列的基因。“嵌合”基因指包含異源調節序列和編碼序列的基因。“內源”基因指正常情況下見于基因組的天然位點的天然基因。“外源”基因指正常情況下在宿主生物中不存在,而由基因轉移引入的基因。
“編碼”序列是編碼特定蛋白的一段DNA序列,不包括非編碼序列。
“起始密碼子”和“終止密碼子”指三聯體核苷酸單位,在編碼序列中分別指示蛋白質合成(mRNA)的起始和終止。“可讀框”指在編碼序列的翻譯起始和終止密碼子之間編碼氨基酸的序列。
“RNA轉錄物”指由RNA聚合酶催化DNA序列轉錄的產物。當RNA轉錄是DNA序列的完全互補拷貝時,它是指初級轉錄物或可以是來源于初級轉錄物的轉錄后加工的RNA序列。“信使RNA”(mRNA)指能被細胞翻譯成蛋白質的RNA。“cDNA”指雙鏈DNA,其中一條鏈通過反轉錄來源于mRNA并與其互補。“有義RNA”指包括mRNA的RNA轉錄物。
這里用的“調節序列”是指控制編碼序列的轉錄或表達的核酸序列,位于編碼序列的上游(5’)、內部或(3’)下游,其與細胞的蛋白生物合成裝置共同起作用,包括啟動子,翻譯先導序列,轉錄終止序列和聚腺苷酸化序列。
“啟動子”指基因中的一段DNA序列,通常在編碼序列的上游(5’),它通過提供RNA聚合酶和正確轉錄所需的其它因子的識別控制編碼序列的表達。一個啟動子也可能含有參與蛋白質因子結合的DNA序列,蛋白質因子對生理或發育條件發生應答,控制轉錄的起始效率。在真核生物中,啟動子可能含有增強子元件。
“增強子元件”是能刺激啟動子活性的DNA序列。它可能是啟動子內部的自身元件或插入的增強啟動子活性水平和組織特異性的異源元件。“組成型啟動子”指在所有組織和所有時間指導基因表達的增強子元件。“器官特異性”或“發育特異性”啟動子指幾乎僅在特殊器官例如葉或種子,或特殊發育階段,例如在胚胎發育的早期或晚期指導基因表達的序列。
術語“操縱連接”指在單一核酸分子上相連的核酸序列,連接結果是一個的功能能被另一個的功能影響,例如啟動子與一個結構基因操縱連接(即編碼對羥基苯丙酮酸雙加氧酶的基因,這里已公開),則它能影響結構基因的表達(即結構基因在啟動子的轉錄控制之下)。
術語“表達”用在這里意味著一個基因編碼的蛋白質產物的產生。更具體而言,“表達”指來源于本發明的核酸片段的有義RNA(mRNA)的轉錄和穩定積累,連帶著細胞的蛋白合成裝置的積累,導致蛋白質產物水平的改變。“過量表達”指在轉基因生物中基因產物的生產超過了正常或非轉化生物的生產水平。“改變水平”指在轉基因生物中基因產物的產生在量或比例上不同于正常或非轉化生物。“促進表達”指培養含目的基因的宿主細胞的步驟和條件能生產出增加的酶產量。例如加入與基因操縱連接的特定啟動子特異性的化學誘導物會促進其編碼酶的表達。該測試相對于來處理基因的生產水平。
“3’端非編碼序列”指基因的DNA序列部分,含有聚腺苷酸化信號和能影響mRNA加工或基因表達的其它調節信號,聚腺苷酸化信號特點是通常影響聚腺苷酸片段加到mRNA前體的3’末端。
“翻譯先導序列”指在基因的啟動子和編碼序列之間的DNA序列部分,它能轉錄成RNA和出現在完全加工的mRNA翻譯起始密碼的上游(5’),翻譯先導序列可影響初級轉錄物到mRNA的加工,mRNA的穩定性或翻譯效率。
“轉化”這里指外源基因轉移進宿主生物的基因組中及其穩定遺傳。細菌的轉化可通過本領域中眾所周知的幾種方法的任一種進行,包括氯化鈣介導的轉化和電穿孔。植物轉化方法的實例包括農桿菌(Agrobacterium)介導的轉化和粒子加速或“基因槍”轉化技術(美國專利4,945,050)。
“宿主細胞”指用引入的遺傳物質轉化的細胞。
“質粒載體”指雙鏈閉環的染色體外DNA分子。
“耐受”或“耐性”指如下的情況,即一種細胞或生物能抵抗一種化合物或組合物以某種濃度或速率施用的影響,而上述施用引起非耐受細胞或生物的明確的效果。例如,能耐受除草劑化合物或組合物施用的植物生長或生存受到的影響較不能耐受此除草劑化合物或組合物施用的植物為小。
編碼對羥基苯丙酮酸雙加氧酶的植物基因的克隆來自植物的對羥基苯丙酮酸雙加氧酶是作為新除草劑化合物的一類新的有前途的作用靶,為了能詳細研究這種酶,并適量提供該酶用于抑制劑篩選,鑒定了編碼對羥基苯丙酮酸雙加氧酶的cDNA克隆,這些核酸片段可用于它們編碼的酶的表達,也用于從編碼其它對羥基苯丙酮酸雙加氧酶的其它植物來源的克隆的分離和理解這些酶的生化和結構特性。
現已從植物擬南芥中分離到核酸片段,該片段包括編碼對羥基苯丙酮酸雙加氧酶的不同形式的核苷酸序列,隨后這些核苷酸序列在大腸桿菌細胞中表達,顯示出能指導對羥基苯丙酮酸雙加氧酶的合成。
在擬南芥屬(Arabidopsis)cDNA文庫數據庫中進行核苷酸序列自動檢索,檢索與其它已知的非植物對羥基苯丙酮酸雙加氧酶基因同源的序列,結果為質粒cDNA克隆91B13T7,這個cDNA是從俄亥俄州立大學擬南芥屬(Arabidopsis)種子貯藏中心(the ArabidopsisSeed Stock Center at Ohio State University)獲得的。制備了適合于核苷酸序列測定的質粒DNA并測定了質粒插入的核苷酸序列。最終結果序列不可判讀,意味著可能有外源核酸污染。用限制性酶消化質粒DNA和瓊脂糖凝膠電泳分離消化后的核酸片段,證實了這種假設。該分析顯示存在不可能來自于帶有推斷的對羥基苯丙酮酸雙加氧酶片段的質粒的核酸片段。此外,對向公眾開放的核酸序列數據庫的檢索顯示報道的cDNA克隆91B13T7中擬南芥序列與截短的cDNA相當(圖1)。根據向公眾開放的對羥基苯丙酮酸雙加氧酶的哺乳動物cDNA序列信息,預計編碼完整對羥基苯丙酮酸雙加氧酶的最小長度是1kb(表1)表1預計編碼對羥基苯丙酮酸雙加氧酶的序列的cDNA長度生物體氨基酸殘基 最小cDNA(kb)人3921.176豬3921.176假單胞桿菌3571.071因此根據能編碼一個有功能的對羥基苯丙酮酸雙加氧酶的cDNA的預計長度,從公開數據庫中獲得的擬南芥序列不足以編碼一個全長有活性的對羥基苯丙酮酸雙加氧酶,因此克隆了一個能編碼擬南芥全長酶的cDNA,如本文所述。用限制性酶消化質粒91B13T7,其中插入的一段400bp片段釋放出來,用于篩選從norflurazon處理的擬南芥幼苗中制備的cDNA文庫(Scolnik.P.A.和Bartley.G.E.(1994)植物生理104:1469-1470)。對與這種探針顯示陽性雜交的幾個克隆測序,從這個結果獲得的最長cDNA克隆序列的原始測定顯示在圖2和SEQ ID NO:2中,對該克隆接著工作時,證實該序列的特征就變得必要了,這個cDNA修正序列在SEQ.ID.NO:12中給出。
報道在圖2中的序列表示該cDNA能編碼一個分子量48,841的蛋白,如圖3所示,它與來源于其它真核生物的對羥基苯丙酮酸雙加氧酶有很高同源性。
從玉米中獲得了編碼全長對羥基苯丙酮酸雙加氧酶的cDNA,使用擬南芥屬cDNA中的大約900bp作為探針,在玉米cDNA文庫中鑒定了包含在質粒pMPDO中的該cDNA,預計的玉米cDNA編碼的氨基酸序列與來自其它真核生物的對羥基苯丙酮酸雙加氧酶在圖3中作了比較。
制備了從Vernonia galamenensis發育種子中分離的信使RNA的cDNA文庫,對文庫克隆的隨機測序鑒定了一個可能為這種植物的對羥基苯丙酮酸雙加氧酶的克隆,命名為vsl.ok0015.b2.。該513bp的已表達序列標志(EST)在SEQ.ID.NO:16中給出。編碼時羥基苯丙酮酸雙加氧酶的擬南芥cDNA在大腸桿菌中的表達本發明編碼植物對羥基苯丙酮酸雙加氧酶的核酸片段能操縱連接合適的調節序列,從而產生用來指導酶在轉基因植物中表達的嵌合基因。這些轉基因生物包括但不限于植物(Plant Mo1.Biol.,Croy,R.R.D.,Ed;Bios Scienrific Publisher;1993);微生物,包括大腸桿菌(Gold,L.(1990)酶學方法185:11),枯草芽胞桿菌(Bacillus subtilis)(Henner D.J.(1990)酶學方法185:199),酵母(Gellissen,G.,等(1992)Antonie Leeuwenhoek62:79)和真菌,包括曲霉屬(Aspergillus)的一些成員(Devchand,M.和Gqtnne.D.I.(1991)生物技術雜志,17:3);和含重組桿狀病毒的昆蟲細胞(Lukow,V.A.和Summers.M.D.(1988)Bio/Technology6:47)。
本領域的技術人員可通過利用或產生限制性酶位點來分離來自本發明片段的編碼序列,例見Sambrook,J.,等((1989)《分子克隆實驗手冊》第二版,冷泉港實驗室出版,以下稱為“Maniatis”)。或者利用聚合酶鏈反應(PCR)技術來分離和/或修飾本發明的片段(Newton,C.R.和Graham.A(1994)PCR;Bios ScientificPublishers)。
在一株表達T7 RNA聚合酶的T7啟動子控制下,在大腸桿菌中表達擬南芥對羥基苯丙酮酸雙加氧酶(Studier,F.W.等(1990)酶學方法185:60)。除T7外的啟動子一般用在表達載體中,能替換使用在大腸桿菌中的蛋白表達。可替換的啟動子實例包括但不限于trp(Yansura.D.G.和Henner.D.J.(1990)酶學方法185:54),PL(Remaut.E.等(1981)基因15:81),tac(Amann.E.等(1983)基因25:167)trc(Amann.E.等(1988)基因69:301)和lacUV5,lpp,PR等啟動子以及特別構建結合特殊性質以增加強度或調節能力的雜合和串聯啟動子(Balbas.P.和Bolivar.F.(1990)酶學方法185:14)。
酶功能的生化證據對羥基苯丙酮酸雙加氧酶催化對羥基苯丙酮酸與分子氧的反應,產生尿黑酸和二氧化碳。酶的測定方法如下測量氧的利用(Hager,S.E.等(1957)J.Biol.Chem.225:935-947),測定從放射性標記的對羥基苯丙酮酸來源的二氧化碳和尿黑酸的生成(Lindbkad,B,(1971)Clin.Chem.Acta 34:113-121),對羥基苯丙酮酸的減少(Lin.E.C.C.等(1958)J.Biol.Chem.,233:668-673)或在HPLC或類似的層析分離技術后用比色法(Fellman.J.H.等(1972)生物化學與生物物理學報,284:90-100)或用紫外檢測尿黑酸的生成。對羥基苯丙酮酸雙加氧酶活性也可通過偶聯試驗測定,其中起始產物尿黑酸在尿黑酸加氧酶作用下,形成馬來酰乙酰乙酸,在330nm測量吸收值可測定其量(Fernandez-Canon,J.M.和Penalva,M.A.(1997)分析生物化學,245:218-221)。
對羥基苯丙酮酸雙加氧酶的動力學測定的兩種可選擇的方法是終點測定或固定時間測定。其方法是根據未轉化的底物對羥基苯丙酮酸在硼酸鹽離子存在下,靠異構酶轉化成烯二醇異構體,測定該異構體的308nm的特征峰(Lin.E.C.C.等(1958)J.Biol.Chem.233:668-673)。測試方法包括在200μl測試緩沖液中加入足夠的對羥基苯丙酮酸雙加氧酶,一個多小時后消耗該有機物底物的80%,這種情況下的緩沖液是50mM Tris,pH7.4,0.10mM對羥基苯丙酮酸,1.75mM抗壞血酸和1.25mM EDTA。反應1小時后加入100μl0.8M硼酸鹽,pH7.3終止反應,其中含1000ppb的對羥基苯丙酮酸雙加氧酶抑制劑和0.25μl 6.1mg/ml的異構酶,溫育30分鐘后,在308nm測定吸收值,此后穩定2小時。這種測試動力學方法的優點是對羥基苯丙酮酸雙加氧酶無需在存在高濃度硼酸鹽時氧化底物,該條件可能干擾抑制劑的作用模式。此外,該測試方法基本是對羥基苯丙酮酸雙加氧酶抑制的穩定等分顯示,也非常適合于要求高流通量的樣品及試驗。
由核酸片段編碼在大腸桿菌中過量表達的酶,通過一些用來抽提可溶性植物酶的常規緩沖液可抽提出來。雖然,大量的過量表達蛋白經常不溶解,但可溶酶的量可達到整個可溶蛋白的50%,可溶的過量表達蛋白有很高的對羥基苯丙酮酸雙加氧酶活性并容易抽提。同樣地,在合適條件下,可能將不溶性過量表達蛋白重新溶解成活性形式,因為加入肌氨酰(十二烷基肌氨酸鈉)到抽提緩沖液中,似乎提高過量表達蛋白的抽提量,為獲得最佳活性,應存在還原試劑,例如抗壞血酸或還原性的谷胱甘肽,以及亞鐵離子。
過量表達的酶能用以上描述的測定對羥基苯丙酮酸雙加氧酶活性的各種技術測試,而只有用標記對羥基苯丙酮酸的技術能用來測定原始的植物抽提液的活性。因此,過量表達酶的獲得可大大促進鑒定酶抑制劑的高效篩選。潛在抑制劑通過以下方式評價它們減少酶反應速率的能力,導致減少氧的吸收和二氧化碳的釋放,降低尿黑酸的形成速率及對羥基苯丙酮酸的減少。申請人已證實本發明的核苷酸片段中至少有一種在大腸桿菌細胞中能過量表達,導致能催化對羥基苯丙酮酸轉化成尿黑酸并伴隨二氧化碳釋放的蛋白質的產生。而且,還顯示已知抑制對羥基苯丙酮酸雙加氧酶的商業除草劑能抑制這種活性。最后,過量表達的酶能用在鑒定抑制對羥基苯丙酮酸雙加氧酶活性的化合物的高效試驗中,該化合物可用作除草劑。
耐受對羥基苯丙酮酸雙加氧酶抑制劑的植物的制備本發明包括能抗或至少能耐受除草劑的植物,該除草劑以對羥基苯丙酮酸雙加氧酶為靶,正常情況下能抑制天然產生的對羥基苯丙酮酸雙加氧酶。該改構的對羥基苯丙酮酸雙加氧酶活性是通過以下方法獲得的(1)野生型對羥基苯丙酮酸雙加氧酶的過量表達,或(2)編碼耐受除草劑的酶的DNA分子的表達。該酶是自然條件下在真核生物或原核生物中產生的對羥基苯丙酮酸雙加氧酶的修飾形式,或自然條件下產生在植物中的對羥基苯丙酮酸雙加氧酶的修飾形式,或在自然條件下在原核生物中產生的耐受除草劑的酶(Duke等,HerbicideResistant Crops;hewis;Boca Raton:1994)。使植物組織細胞基本能耐受除草劑的基因表達的有效量,取決于基因是編碼未改構的對羥基苯丙酮酸雙加氧酶的基因還是編碼對除草劑不敏感的酶的突變或改構形式的基因。一個未改構的植物對羥基苯丙酮酸雙加氧酶基因表達的有效量,是使除草劑耐受增加2至10倍的量。本發明的植物基因包括單子葉植物和雙子葉植物基因,優選為抑制對羥基苯丙酮酸雙加氧酶的抑制劑潛在作用靶的植物,特別是農藝上重要的作物,例如玉米和其它谷類作物。
對羥基苯丙酮酸雙加氧酶活性表達水平較天然表達量增加2倍到10倍或更多倍,將足以克服由除草劑引起的生長抑制。含有改構的對羥基苯丙酮酸雙加氧酶活性的植物可通過在植物中直接選擇而獲得,這種方法在本領域中是已知的。例見美國專利5,162,602,美國專利4,761,373及其中所引參考文獻。
對羥基苯丙酮酸雙加氧酶的過量表達,也能用嵌合基因DNA分子穩定轉化宿主植物細胞而完成,該嵌合基因包括一個在植物細胞中能驅動連接編碼序列表達的啟動子,其操縱連接一個同源或異源的編碼對羥基苯丙酮酸雙加氧酶的編碼序列,“同源”對羥基苯丙酮酸雙加氧酶基因是從分類上與靶植物細胞相同的生物中分離的,而“異源”對羥基苯丙酮酸雙加氧酶基因是從分類上與靶植物細胞不同的生物中分離的。
植物中外源基因的表達已很成熟(De Blaere等(1987)酶學方法143:277-291)。用來驅動基因在轉基因植物或植物細胞中表達的啟動子(即那些能驅動連接的編碼序列例如對羥基苯丙酮酸雙加氧酶編碼序列在植物細胞中表達的啟動子),包括那些在花椰菜花葉病毒中指導19S和35S轉錄物表達的啟動子(Odell等(1985)Nature,313:810-812;Hull等(1987)病毒學,86:482-493),1,5二磷酸核酮糖羧化酶小亞單位(Morelli等(1985)Nature,315:200-204,Broglie等(1984)Science224:838-843;Hererra-Estrella等(1984)Nature,310:115-120;Coruzzi等(1984)EMBO J,3:1671-1679;Faciotti等(1985)Bio/Technology,3:241)和葉綠素a/b結合蛋白(Lamppa等(1986)Nature,316:750-752);胭脂堿合酶啟動子(Depicker等(1982)J.Mol.App.Genet.1:561-573;An等(1990)Plant Cell,2:225-233)。本發明的嵌合DNA構建體可含有多拷貝啟動子或多拷貝對羥基苯丙酮酸雙加氧酶的編碼序列。此外,該構建體可包括選擇性標記的編碼序列和其它肽例如信號或轉運肽的編碼序列。這種構建體的制備在本領域技術人員的能力之內。植物類胡蘿卜素生物合成途徑的抑制劑抗性已通過表達CaMV啟動子驅動的編碼八氫番茄紅素脫氫酶的細菌基因獲得,該生物合成途徑也是對羥基苯丙酮酸雙加氧酶抑制劑的作用靶。(Misawa等(1994)植物雜志4:481-490)。
轉運肽可與本發明嵌合基因DNA構建體中對羥基苯丙酮酸雙加氧酶的編碼序列融合,指導表達的對羥基苯丙酮酸雙加氧酶運輸到希望的作用位點。轉運肽的實例包括葉綠體轉運肽,例見Von Heijne等(1991)Plant Mol.Biol.Rep,9:104-126;Mazur等,(1987)PlantPhysiol,85:1110;Vorst等(1988)Gene,65:59,和線粒體轉運肽,例見Boutry等,(1987)Nature,328:340-342。
可以想象增強子或增強子類似元件引入啟動子構建體也將使初始轉錄物的水平增加,從而完成本發明。這些包括病毒增強子,例如見于35S啟動子中的增強子(Odell等(1988)Plant Mol.Biol.,10:263-272),來自冠癭堿基因的增強子(Fromm等(1989)Plant Cell1:977-984),或來自其它來源置于操縱連接本發明核酸片段的啟動子中時導致轉錄增加的增強子。
從玉米Adh-1和Bz-1基因分離的內含子(Callis等,(1987)GeneDev.,1:1183-1200)和玉米Shrunken-1(sh-1)基因的內含子1和外顯子1(Maas等,(1991)Plant Mol.Biol.,16:199-207)也可用來提高引入的基因的表達。玉米的醇脫氫酶基因的第一個內含子(Adh-1)的結果表明,當該元件置于一個外源基因的轉錄單位中,mRNA的水平比正常水平提高了6.7倍。用玉米肌動蛋白基因的內含子3觀察到了類似水平的內含子增強(Luehrsen.K.R.和Qalbot.V.(1991)Mol.Gen.Genet.225:81-93)。也注意到了基因表達為Adh1內含子6所增強(Oard等,(1989)Plant Cell Rep 8:156-160)。在玉米懸浮培養中,玉米sh-1基因的外顯子1和內含子1顯示各自能增加的報道基因表達量分別為10倍和100倍。當聯合使用時,這些元件顯示能使報道基因表達量增加1000倍(Maas等(1991)Plant Mol.Biol.,16:199-207)。
任何能提供聚腺苷酸化信號和其它正確表達所需的調節序列的3’非編碼區能用來完成本發明。這包括貯藏蛋白的3’末端,例如10kd,15kd,27kd和α玉米醇溶蛋白基因的3’末端,菜豆蛋白基因的3’末端,大豆β-conglycinin基因的3’末端,病毒基因的3’末端,如花椰菜花葉病毒35S或19S轉錄物3’末端,來自冠癭堿合成基因的末端,1,5二磷酸核酮糖羧化酶或葉綠素a/b結合蛋白的3’末端,或任何來源的3’末端,使得所用的序列在其核酸序列內部提供必要的調節信息,導致與其操縱連接的啟動子/編碼區的正確表達。在本領域中有許多實例給出了不同3’非編碼區用途的教導(例見Ingelbrecht等,(1989)Plant Cell,1:671-680)。
本領域技術人員熟知各種引入DNA序列到高等植物真核細胞(即轉化)的方法(見EPO出版物0295959A2和0138341A1)。這種方法包括用核酸構建體包被的金屬粒子高速彈道式轟擊(見Klein等(1987)Nature,(倫敦)327:70-73和美國專利4,945,050),以及利用基于農桿菌Ti和Ri質粒的轉化載體的方法,特別是這些載體的穿梭載體。Ti衍生載體轉化寬范圍的各種高等植物,包括單子葉植物和雙子葉植物,例如大豆,棉花和歐洲油菜(Pacciotti等(1985)Bio/Technology,3:241;Byme等(1987)Plant Cell,Tissueand Organ Culture,8:3;Sukhapinda等(1987)Plant Mol.Biol.,8:209-216;Lorz等(1985)Mol.Gen.Genet.,199:178-182;Potrykus等,(1985)Mol.Gen.Genet.,199:183-188)。
本領域技術人員也可利用其它轉化方法,例如直接攝入外源DNA構建體(見EPO出版物0295959A2)和電穿孔技術(見Fromm等(1986)Nature,(倫敦)319:791-793)。細胞一旦轉化,本領域的技術人員就能再生它。最近介紹了一些將核酸片段引入商業上重要的作物的有關方法,例如引入油菜(見De Block等(1989)Plant Physiol,91:694-701),向日葵(Everett等(1987),Bio/Technology,5:1201-1204),大豆(McCabe等(1988)Bio/Technology,6:923-926;Hinchee等,(1988)Bio/Technology,6:915-922;Chee等(1989)Plant Physiol,91:1212-1218;Christou等,(1989)Proc.Nat1.Acad.Sci.USA,86:7500-7504,EPO出版物0301749A2),和玉米(Gordon-Kamm等(1990)Plant Cell,2:603-618;和Formm等(1990)Bio/Technology,8:833-839)。
改構的對羥基苯丙酮酸雙加氧酶活性也可通過分離的真核對羥基苯丙酮酸雙加氧酶編碼序列的修飾形式的產生或鑒定而得到,該編碼序列至少含有一個氨基酸替換,增加或缺失,它編碼一個改構的對羥基苯丙酮酸雙加氧酶,能抗抑制未改構的天然產生酶的除草劑。編碼這種酶的基因能通過本領域已知的許多策略獲得。第一種策略涉及在微生物(例如,大腸桿菌,釀酒酵母(Miller,(1972)分子遺傳實驗,冷泉港實驗室,冷泉港,紐約;Davis等,(1980)高級細菌遺傳,冷泉港實驗室,冷泉港紐約;Sherman等(1983)酵母遺傳學方法,冷泉港實驗室,冷泉港,紐約,和美國專利4,975,374)和藍細菌(Bryant,藍細菌的分子生物學;Kluwer Academic Publishers,波士頓,1995。)中直接或間接誘變的方法。第二獲得真核對羥基苯丙酮酸雙加氧酶的突變抗除草劑等位基因的方法涉及在植物中直接選擇,例如,抑制劑對植物例如擬南芥,大豆,玉米生長的影響,可通過該領域已知的方法在平皿上種植無菌種子來測定,平皿中含濃度增加的抑制劑的簡單中性鹽培養基。可重復檢測的顯著生長抑制的最低劑量用于隨后的實驗。在選定群體中,植物材料的誘變可用來增加抗性等位基因的頻率。誘變的種子材料可從各種途徑得到,包括化學或物理誘變種子,或化學或物理誘變花粉(Neuffer玉米的生物學研究,Sheridan,ed,Univ.Press.Grand Forks.ND.pp.61-64(1982)),然后將其用來使植物受精,收集所得的M1代突變種子,一般,對擬南芥而言,M2代種子(由化學手段如甲基磺酸乙酯或物理手段如γ射線或快中子誘變的種子長成的植株的種子)在含合適濃度抑制劑的簡單中性鹽培養基中的密度達到10000粒/平皿(10cm直徑)。在平皿中處理后,能繼續生長并能保持綠色7-21天的幼苗移植到土壤中,長到成熟,獲得種子。測試這些種子的后代對除草劑的抗性,如果抗性性狀是顯性,種子分離比為3∶1(抗性敏感)的植物被認為在M2代中為抗性雜合體。全部產生抗性種子的植物被認為在M2代中為抗性純合體。這種對未處理種子的誘變及篩選其M2代子代也可在其它植物種類中例如大豆(見例如美國專利5,084,082)中進行。耐受除草劑的突變種子也可通過與物理或化學手段誘變的花粉受精后篩選獲得。
實施例1擬南芥對羥基苯丙酮酸雙加氧酶cDNA的克隆含有擬南芥9lBl3T7已表達序列標志的質粒(Newman等(1994)Plant Physiol,106:1241-1255)用限制性酶BamHⅠ和EcoRⅠ消化,得到的400bp的片段按照以下方法用來篩選擬南芥幼苗的λ噬菌體cDNA文庫(Scolnik.P.A.和Bartley,G.E.(1994)PlantPhysiol,104:1469-1470)。
大腸桿菌KW251細胞在含0.2%麥芽糖和10mM MgSO4的LuriaBroth(LB)中過夜生長。離心使細胞沉淀,重懸浮在10mM MgSO4中至OD600為0.5。在45℃時一等份(0.8毫升)細胞與0.1毫升稀釋的噬菌體樣品和7毫升上層瓊脂糖(在含10mM MgSO4的LB中含0.7%的瓊脂糖)混合,涂布接種在含LB瓊脂的培養皿中,在5-7小時內,噬菌斑變得可見,此時將平皿放在4℃。
噬菌斑按標準操作技術轉移到硝酸纖維素濾膜上,濾膜與按Feinberg和Vogelstein((1983)Anal.Biochem.132:6-13)的方法制備的32P標記探針雜交,使用Berlyn等((1989)Proc.Natl.Acad.Sci.86:4604-4608.)的雜交條件。X光膠片上曝光48小時后,洗出12個陽性斑,在同樣條件下涂布接種和雜交。在第二輪雜交仍然保持陽性信號的9個噬斑,用Exassist/SOLRTM系統按廠商說明進行體內切割(Stratagene Cloning Systems.LaJolla,CA)。制備體內切割為陽性的噬斑的質粒DNA,使用WizardPlusTM試劑盒測序(Promeg Madixon.WI.)。8個測序的克隆顯示與現有的對羥基苯丙酮酸雙加氧酶有強烈的保守性,而另一個克隆與對羥基苯丙酮酸雙加氧酶不對應。與已知的對羥基苯丙酮酸雙加氧酶序列對比也揭示2個克隆與轉錄物3’末端的0.3kbp片段對應,而另兩個克隆與轉錄物5’末端的1.2kbp片段對應。每種一個克隆通過在NheⅠ限制位點連接用來組裝一個1.5kbp的cDNA(圖1)。所得cDNA克隆的DNA序列(SEQ ID NO:2)的原始測定顯示在圖2中,該DNA片段隨后的工作需要確證其序列的某些特征。發現列出的大約10個核苷酸殘基是錯誤的。該DNA的修正序列在SEQ ID NO:14中列出,其推斷的氨基酸序列給出在SEQ ID NO:15中。校正的序列為本文報道用于分析和比較的堿基。
實施例2在大腸桿菌中擬南芥屬cDNA的過量表達擬南芥屬對羥基苯丙酮酸雙加氧酶的推斷氨基酸序列與來自小鼠,豬和Streptomyces avermitilis的對羥基苯丙酮酸雙加氧酶的氨基酸序列用GCG堆積程序進行序列對比(Program Manual for theWisconsin Package,Version 8,September 1994,GeneticsComputer Group,575 Science Drive,Madison,WI USA 53711)。這種分析表明,在擬南芥屬序列(圖3和SEQ ID NO:31-29位)的氨基末端有額外的29個氨基酸突出,這種氨基末端突出被認為是一個葉綠體轉運肽,該轉運肽在成熟酶中是缺失的。因此,葉綠體轉運肽編碼序列的去除與對羥基苯丙酮酸雙加氧酶編碼序列從克隆載體轉移進表達載體相符合。
通過中間克隆載體pT7BlueR(Novagen),將擬芥屬對羥基苯丙酮酸雙加氧酶cDNA從Bluesript SK-克隆載體(Stratagene,LaJolla,CA)轉移到pET24c(+)表達載體中(Novagen,Madison,WI),質粒pGBPPD2由擬南芥屬對羥基苯丙酮酸雙加氧酶cDNA和pBluescript SK-克隆載體(Stratagene)組成。質粒pE24CP1由沒有推斷的葉綠體轉運肽DNA序列的擬南芥屬對羥基苯丙酮酸雙加氧酶cDNA和pEt24c(+)表達載體(Novagen)組成。
質粒pGBPPD2和pT7BlueR(每個5μg)各自用20單位的XbaⅠ(New England Biolabs,NEB,Beverly,MA)和20單位的HindⅢ(Gibco BRL,Gaithersburg,MD)在補加了100μg/mL牛血清白蛋白的NEB限制酶緩沖液2中,37℃時消化1.75小時,用限制酶XbaⅠ和HindⅢ消化pGBPPD2分別從pBluescript SK-多接頭釋放出對羥基苯丙酮酸雙加氧酶cDNA的5’末端和3’末端。用TRIS/乙酸/EDTA(TAE)緩沖液在1%瓊脂糖凝膠中電泳分離消化產物并用溴化乙錠染色顯示(Maniatis)。pGBPPD2用兩種限制性內切酶消化產生2922bp的載體帶和1499bp的對羥基苯丙酮酸雙加氧酶cDNA帶。用兩種酶消化pT7BlueR后只有一條2863bp的帶是明顯的,但也形成24bp片段。1499bp的對羥基苯丙酮酸雙加氧酶帶和2863bp的T7BlueR帶從膠上切下,用QIAquick Gel Extraction Kit(Qiagen,Chatsworth,CA)按廠商說明從瓊脂糖中將DNA純化。純化的DNA樣品加入乙酸鈉(pH5.2)至0.3M,10μg tRNA(加入作為載體)和2倍體積的-20℃乙醇,在-20℃下過夜溫育沉淀。離心收集核酸沉淀,用70%乙醇洗滌,在空氣中干燥。兩種沉淀都溶解在10μL TRIS/EDTA(TE)緩沖液,pH8(Maniatis)中。每個樣品取1μL加樣在1%瓊脂糖TAE膠分離槽中,相鄰的槽含有4μL分子量梯度(Gibco BRL),所有的樣品上樣前用水調到10μL。溴化乙錠著色并紫外照射,通過比較每個樣品帶的強度與分子量梯度帶的強度對DNA定量。
大約300ng對羥基苯丙酮酸雙加氧酶插入片段與300ng雙酶切的pT7BlueR載體在7μL總體積中混合,接著加熱至45℃ 5分鐘,緊接著在冰上冷卻。T4 DNA連接酶緩沖液(Gibco BRL)和1單位的T4 DNA連接酶(Gibco BRL)加入到冷卻的DNA中至總體積為10μL,連接混合物在室溫下溫育4小時,然后按照標準方法(Maniatis)轉化進大腸桿菌MAX有效DH5α感受態細胞(Gibco BRL)中,轉化的細菌涂布到補加了100μg/mL羧芐青霉素的LB瓊脂平板中,在37℃下溫育過夜。選擇17個菌落用于隨后的分析,每個菌落中的一部分接種到單獨的17×100mm聚丙烯培養管中(Falcon,Lincoln Park,NJ),其中含2mL液體LB培養基,200μg/mL的羧芐青霉素。液體的細菌培養物在37℃下振蕩(250rpm)溫育過夜。質粒DNA用QIAprep Spin Plasmid Miniprep Kit(Qiagen)按制造廠商的說明分離。每種質粒制備物的一部分(50μL中取出5μL)用10單位HindⅢ和10單位的EcoRⅤ(Gibco BRL)在總體積為15μL的反應2緩沖液(Gibco BRL)中消化1小時(注意在制備pGBPPD2時破壞了pBluescript多接頭中的EcoRⅤ位點,所以只有在pT7BlueR多接頭中的EcoRⅤ位點可被限制酶消化)。樣品在1%瓊脂糖和TRIS/硼酸鹽/EDTA(TBE)緩沖液(Maniatis)中電泳分離,用溴化乙錠著色顯示帶。17個樣品中7個含2條帶(2837和1525bp),其中包含對羥基苯丙酮酸雙加氧酶插入片段,命名為pT7BlueR+PDO1(見圖4)。
為了去掉推斷的葉綠體轉運序列,pT7BlueR+PDO1每種制備物其余45μL合并成單一樣品,DNA含量在A260用分光光度法測定(Maniatis)。部分pT7BlueR+PDO1(5μg)用16單位Eco47Ⅲ(MBIFermentas)在含緩沖液0(MBIFermentas)的100μL總體積中,37℃時消化2小時,消化的質粒DNA用乙酸鈉和乙醇按以上描述沉淀,最終干燥的沉淀溶解在60μL含20單位NdeⅠ(Gibco BRL)的反應2(Gibco BRL)緩沖液中,在37℃溫育2小時。雙酶消化的樣品上樣在TAE中的1%瓊脂糖凝膠中,較大的4166bp Nde I-Eco47Ⅲ片段與196bp片段電泳分離,大片段從膠中切下,按以上描述從瓊脂糖中純化和沉淀出來。
在9.9μL的總體積中,制備由寡聚物CAM32和CAM33(分別為SEQID NOS:4和5)每種100pmol組成的寡核苷酸混合物。兩種寡聚物彼此互補形成一個3’平末端,相應于Eco47Ⅲ限制位點的5’端一半,還形成一個5’端交錯末端,相應于NdeⅠ限制位點的3’端一半。
CAM32:(SEQ ID NO:4)5’-TATGTCCAAGTTCGTAAGAAAGAATCCAAAGTCTGATAAATTCAAGGTTAAGC-3’CAM33:(SEQ ID NO:5)5’-GCTTAACCTTGAATTTATCAGACTTTGGATTCTTTCTTACGAACTTGGACA-3’
寡聚混合物加熱到90℃1.5分鐘,然后冷卻到室溫超過20分鐘,從4166bp NdeⅠ-Eco47Ⅲ片段的純化獲得的干燥核酸沉淀溶解在7μL冷卻的寡聚混合物中,隨后加熱至45℃5分鐘,接著在冰上冷卻,寡聚物與NdeⅠ-Eco47Ⅲ片段連接后,接著按以上描述轉化進DH5α,轉化的細菌細胞涂布到LB/羧芐青霉素平板上,37℃下溫育過夜,選擇17個菌落按以上方法分離質粒DNA。每個質粒的一部分(50μL中5μL)用NdeⅠ和HindⅢ每種10單位雙酶消化,片段在TBE中于1%瓊脂糖凝膠上電泳分離。檢測到一個相應插入片段(1373或1518bp)和載體(2844bp)的兩條帶。質粒的另一5μL部分用XbaⅠ和HindⅢ每種10單位再次雙酶消化。當用NdeⅠ和HindⅢ消化時,質粒中均不包括含有XbaⅠ位點的小插入片段。如果兩個寡聚物替換原來存在于pT7BlueR+PDO1的196片段,XbaⅠ位點將會消除。具有修飾的對羥基苯丙酮酸雙加氧酶插入片段的7個質粒樣品合并,命名為pT7BlueR+PDO2。
pT7BlueR+PDO2質粒DNA用分光光度法定量(如上述),5μg用NdeⅠ和HindⅢ每種20單位在37℃下于62μL反應2緩沖液中消化2小時。消化樣品上樣于TAE中的1%瓊脂糖,電泳分離。分離到1373bp片段,按以上方法沉淀。質粒pET24c(+)(5μg)用NdeⅠ和HindⅢ每種20單位在37℃下于反應2緩沖液中雙酶消化2小時,然后5245bp片段在TAE中的1%瓊脂糖上純化,然后按以上方法從瓊脂糖中分離和沉淀。干燥的pET24c(+)沉淀溶解在10μL TE中,然后取8μL用水,脫磷酸化緩沖液(Gibco BRL)和1單位牛小腸堿性磷酸酶(GibcoBRL)調節到總體積20μL。樣品在37℃下溫育30分鐘,然后按以上方法從瓊脂糖中純化分離和沉淀。干燥脫磷酸化的pET24c(+)載體沉淀和修飾的對羥基苯丙酮酸雙加氧酶插入片段沉淀分別溶解在10μL TE中,各取1μL在1%瓊脂糖的TBE膠中電泳,用4μL分子量梯度按以上方法定量DNA。100ng修飾的對羥基苯丙酮酸雙加氧酶插入片段與120ng脫磷酸化的pET24c(+)載體混合,總體積為7μL。混合物加熱至45℃5分鐘,然后冰上冷卻。向混合物中加入T4 DNA連接酶緩沖液和1單位T4DNA連接酶,總體積為10μL,在室溫下溫育4小時,連接混合物然后轉化DH5α,涂布在補加了30μg/mL卡那霉素的LB瓊脂上,在37℃下溫育過夜。對11個菌落按以上描述進行質粒的制備。用NdeⅠ和HindⅢ雙酶消化質粒,電泳分離片段,所有的質粒有預期的1373bp和5245bp片段,選擇一個細菌菌落用來接種補加了30μg/mL卡那霉素的100mL液體LB,然后在37℃下溫育振蕩過夜。用Qiagen Plasmid Midi Kit按廠商說明從所得的細菌培養物中分離質粒DNA,質粒(pE24CPl)DNA的一部分用Sequence Version 2.0DNA測序試劑盒(United States Biochemical,Cleveland,OH)按廠商說明進行非放射性手動測序,使用T7啟動子生物素化測序引物(United States BioChemical)。DNA從測序膠在毛細作用下轉移到Hybond-N+尼龍轉移膜(Amersham,Arlington Heights,IL)上。轉移和隨后DNA片段的化學發光檢測的所有步驟,按廠商說明用SEQ-Light-化學發光測序試劑盒(Tropix,Bedford,MA)進行。DNA測序證實質粒含有預期的修飾對羥基苯丙酮酸雙加氧酶插入片段的5’序列,該插入片段1-95(圖2)核苷酸用ATG轉錄起始位點代替。這相當于從擬南芥屬對羥基苯丙酮酸雙加氧酶氨基酸序列的N-末端切除的2-29個氨基酸(圖3)。
質粒pE24CP1按以上描述轉化進BL21(DE3)大腸桿菌感受態細胞(Novagen)。轉化細胞涂布在LB/卡那霉素平板上和在37℃下溫育過夜。選擇7個菌落制備質粒。質粒DNA用NdeⅠ和HindⅢ雙酶消化,證實所有質粒有預期帶型。選擇一個菌落,在LB/卡那霉素平板上劃線分離,一個分離良好的菌落用來接種補加了30μg/mL卡那霉素的液體LB,培養物在37℃下振蕩(250rpm)直到在A600時吸收值為0.6,按Novagen操作制備8%甘油冷凍儲備液,貯藏在-80℃,所有的隨后表達研究使用新長成的細菌細胞,該細菌細胞是從甘油凍存液劃線于LB/卡那霉素平板上后分離的。
從甘油凍存液中來的含有pE24CP1或pET24c(+)(陰性對照)的BL21(DE3)細胞劃線到LB/卡那霉素平板上,在37℃下溫育過夜。選擇一個分離的菌落接種17×100mm Falcom試管中的2mL含30μg/mL卡那霉素的LB,在37℃下,振蕩(250rpm)溫育過夜。過夜培養物接著用來接種100mL含30μg/mL卡那霉素的新鮮LB中。新的培養物在37℃下振蕩溫育,直到A600為0.4到0.6個吸收單位。pE24CP1和pET24c(+)培養物的一半放在新培養瓶中,加入IPTG(異丙基硫代-β-D-半乳糖苷,Gibco BRL)到新瓶中至終濃度1mM,在37℃下,培養瓶再振蕩溫育3小時,然后收獲細胞。
收獲的細胞離心,所得細胞沉淀用2mL抽提緩沖液(50mM(第一次試驗20mM,表2)磷酸鉀緩沖液,pH7.2,含0.14M KCl,0.32mM還原谷胱苷肽,1%聚乙烯吡咯烷酮,0.1%Triton-X 100(只在第一次試驗中使用0.01%溶菌酶))超聲抽提(3×10秒),裂解物17000g離心10分鐘后,為粗抽提酶。在第一次試驗(表2)也測定了20%至60%硫酸銨沉淀的酶部分。固體硫酸銨慢慢加入攪動的2mL溶菌產物中,至濃度為20%(w/v),在冰上溫育大約15分鐘后,溶液17000g離心10分鐘,收集上清液,加入固體硫酸銨至濃度60%(w/v),離心后,所得沉淀重懸浮在1mL的抽提緩沖液中。
從細菌中表達的擬南芥屬對羥基苯丙酮酸雙加氧酶得到的不溶性蛋白的一部分用來作N-末端序列分析。用60μL抽提緩沖液懸浮蛋白(大約180μg),然后用5倍體積樣品緩沖液(62.5mM Tris,pH6.8,6M尿素,160mM二硫蘇糖醇,0.01%溴酚藍)稀釋,在室溫下間歇性旋渦振蕩1小時,按制造商的說明書,為Mini-ProteinⅡ雙重板電泳室(Bio-Rad,Hercules,CA)制備1.5mm厚,12%聚丙烯酰胺分離膠,讓聚丙烯酰胺聚合3小時,用制備性的梳子制備濃縮膠,電極緩沖液按廠商說明制備,并加入0.1mM的巰基乙酸鈉。可溶性的蛋白樣品按廠商說明電泳分離。當溴酚藍染料達到了膠的前面,取出膠,在印跡溶液(10mN CAPS,pH11,10%甲醇,平衡水)中平衡5分鐘,膠按廠商說明放在Mini Trans-電印跡轉移室(Bio-Rad)中,ProBlottPVDF膜(Applied Biosystem Foster city CA)按廠商說明處理,電印跡在印跡緩沖液存在時在50伏特電壓下于冰浴中進行45分鐘,膜用水洗,按ProBlott方法用考馬斯亮藍染色,主要蛋白帶從膜上切下,在Beckman(Fullerton.CA)LF3000蛋白測序儀上進行N-末端氨基酸測序,第一次11個循環,分別鑒定為S-K-F-V-R-K-N-P-K-S-D(見SEQ ID NO:3氨基酸30-40),這種預期的修飾擬南芥屬對羥基苯丙酮酸雙加氧酶的N-末端去掉了起始甲硫氨酸(氨基酸30-40,圖3)。
實施例3在大腸桿菌中表達的植物蛋白的對羥基苯丙酮酸雙加氧酶活性按以上描述抽提具有不同質粒構建體的細胞培養物,通過測定從[1-14C]-對羥基苯丙酮酸形成14CO2或從[U-14C]對羥基苯丙酮酸形成14CO2和14C-尿黑酸(Lindblad,B.(1971)Clin.Chim.Acta34:113-121;及Lindstedt,S.和0delhog,B(1987)酶學方法,142:143-148)進行分析。標記底物從[1-14C]-L-酪氨酸(55mCi/mmol;American Radiolabeled Chemicals.Inc.,St.Louis,MO)或[U-14C]-L-酪氨酸(498mCi/mmol;DuPont NEN.Boston.MA)制備。標記的酪氨酸貯藏液取50-100μL(5-10μCi)轉移到4mL玻璃瓶中,在45℃下氮氣流吹干,瓶中加入175μL 0.1M的磷酸緩沖液,pH6.5,5μL觸酶(28700單位C-100,Sigma Chemical Co.,St.Louis,MO),和20μL L-氨基酸氧化酶(Sigma A-9253,6.5單位/mL),瓶放在30℃水浴搖床中,60轉/分鐘,0.5-1小時。反應混合物通過一個含400μL Dowex AG 50W X8陽離子交換樹脂的小柱,柱用1.5mL水洗,收集含標記對羥基苯丙酮酸的洗脫液,標記底物立即使用或在-80℃貯藏在制備后一星期內使用。
測試在用血清瓶塞蓋著的14mL培養管中進行,該瓶塞懸垂的聚丙烯槽中含有200μL 1N KOH。反應混合物含5740單位的觸酶,100μL新鮮配制的150mM還原谷胱苷肽和3mM二氯酚啶酚的1∶1(V∶V)混合物,5mM抗壞血酸,0.1mM硫酸亞鐵(抗壞血酸和硫酸亞鐵在第一次試驗的緩沖液中不存在,表2),50μM未標記的對羥基苯丙酮酸,1-25μL酶抽提物和50μM磷酸鉀緩沖液,最終體積980μL。在50mM磷酸鉀緩沖液中制造新鮮的當日用的未標記底物,在室溫下至少平衡2小時以確保95%以上是酮式。加入20μL(0.04μCi)14C對羥基苯丙酮酸以前試管在30℃振蕩的水浴中溫育10分鐘。60分鐘后,通過血清瓶塞注入1N 500μL硫酸終止反應,瓶留在搖床上30分鐘,以確保完全俘獲釋放的14CO2,取下血清瓶塞,切下槽,放入8mL閃爍瓶中,加入6mL Formula-989閃爍液(Packard Insrurments,Meriden,CT)到瓶中,14C放射性用閃爍計數器測定,表2總結了這個試驗的結果。
表2含有不同質粒構建體的大腸桿菌抽提物的對羥基苯丙酮酸雙加氧酶活性
*14C:12C=1:50;14C-對羥基苯丙酮酸雙加氧酶比活性=55mCi/mmol結果表明,在不含編碼對羥基苯丙酮酸雙加氧酶的核酸片段的質粒(pET24(+))和基因表達誘導物(IPTG)的任何細胞培養物中,很少或沒有對羥基苯丙酮酸雙加氧酶的活性,基因和誘導物共同導致了明顯的活性增加。
在使用[U-14C]對羥基苯丙酮酸(HPPA)的試驗中,測定了14CO2和14C-尿黑酸,反應通過加入50μL標記底物(0.3μCi)起始,用10%磷酸100μL終止。釋放的14CO2閃爍計數測定,尿黑酸的量在有一個放射檢測計的Zorbax RX-C8柱(4.6×250mm)的HPLC上測定。從離心后的反應混合物中取出1.7至15μL的量,注入前稀釋成柱平衡緩沖液,在室溫下用1mL/分鐘的流速進行分離。接著用水和甲醇作溶劑A和B的梯度,每種均使用1%磷酸0-2分鐘,95%A,5%B等梯度洗脫,2-17分鐘線性梯度洗脫,A從95到75%,B從5到25%,17-19分鐘線性梯度,A從75到5%,B從25到95%,19-22分鐘等梯度為5%A和95%B,22-24分鐘線性梯度,A從5%到95%,B從95%到5%。在該系統中尿黑酸在10.8分鐘時洗出,該試驗結果顯示在表3
表3根據從[U-14C]對羥基苯丙酮酸釋放的CO2和尿黑酸的生成測定細胞抽提物的對羥基苯丙酮酸雙加氧酶活性
*14C:12C=1:87.7;14C[U]-p-HPPA比活性=498mCi/mmol在反應中的兩種反應產物測定結果之間緊密相關,結果證實不含編碼對羥基苯丙酮酸雙加氧酶的核酸片段的細胞培養物沒有明顯的對羥基苯丙酮酸雙加氧酶活性。在缺乏誘導物時,有可測的酶活性,但當誘導物加入時,活性比未誘導的培養物增加了6倍。這些結果和表2中的結果清楚地顯示,分離并在大腸桿菌細胞中過量表達的核酸片段編碼催化對羥基苯丙酮酸轉化成尿黑酸并釋放CO2的蛋白質。
過量表達的蛋白質也在室溫下用烯醇硼酸異構酶進行了分光光度測定(Lin.E.C.C.等(1958)J.Biol.Chem.,233:668-673)。每10mL測試緩沖液含0.4M硼酸(用0.2M硼酸鈉調節至pH7.2),4mM抗壞血酸,2.5mM EDTA,40μM對羥基苯丙酮酸和0.5單位的異構酶(Sigma,T6004)。當底物的異構化作用完成時(當在308nm吸收穩定時),使用反應混合物。加入40μL細胞抽提物到960μL測試緩沖液中起始測試,通過測定308nm吸收的減少觀測反應進行。表4總結了表3所示的四種細胞培養物抽提物的結果。
表4細胞抽提物對羥基苯丙酮酸雙加氧酶活性的分光光度測定
對羥基苯丙酮酸減少,以平衡混合物的摩爾消光系數為9850,如Lin等(1958)J.Biol.Chem.,233:668-673)實施例4商業性除草劑對對羥基苯丙酮酸雙加氧酶的抑制兩種已知抑制植物對羥基苯丙酮酸雙加氧酶的除草劑Sulcotrione(2-(2-氯-4-甲磺酸苯酰氧基)-1,3-環己烷二酮)和Isoxaflutole(5-環丙基異噁唑-4-基2-甲磺酰基-4-三氟甲基苯基酮)抑制過量表達的蛋白的酶活性。這兩種化合物對過量表達的蛋白的作用用14CO2和連續分光光度烯醇硼酸異構酶試驗測定。在10μL丙酮或二甲亞砜中的兩種化合物加入到測試緩沖液中,根據觀察抑制劑幾種濃度的抑制百分數計算I50值(抑制酶50%的濃度)。測試結果在表5中示出。
表5植物對羥基苯丙酮酸雙加氧酶抑制劑的I50值<
這些結果清楚地顯示所示商業性除草劑抑制過量表達的蛋白的對羥基苯丙酮酸雙加氧酶活性,這種除草劑的作用模式是抑制該酶。然而,連續分光光度試驗給出類似于用14CO2試驗獲得的I50值。將分光光度試驗改為微量滴定板試驗,結合308nm或接近308nm的平板讀數器,適用于高效篩選對羥基苯丙酮酸雙加氧酶抑制劑。并且,對尿黑酸或對羥基苯丙酮酸的比色或熒光測定也很容易改為篩選這種酶的抑制劑的高效方法。分離的過量表達的酶有足夠的活性,可直接用于分光光度試驗,或進一步純化以提高試驗敏感度。
實施例5用于在細菌中生產活性穩定酶的全長對羥基苯丙酮酸雙加氧酶基因的重建在實施例2中描述的及含有全長對羥基苯丙酮酸雙加氧酶基因的質粒pT7BlueR+PD02證實在EcoRⅠ位點有不正確的序列,重新測定這個序列,以便能用常用的環出誘變,設計一段含NdeⅠ位點的寡核苷酸序列置換EcoRⅠ位點。設計的這段寡核苷酸序列,使得上述過程在對羥基苯丙酮酸雙加氧酶基因的5’末端也引進ATG起始密碼子,其后緊接著全長對羥基苯丙酮酸雙加氧酶序列。誘變后,克隆在大腸桿菌中擴增,純化質粒。接著用NdeⅠ和NheⅠ消化獲得的全長基因“PDO-B”,一個約820bp的片段用來替換在pE24CP1(實施例1)“PDO-A”中截短的對羥基苯丙酮酸雙加氧酶基因的NdeⅠ和NheⅠ部分。通過酶活性測定和N-末端序列分析,獲得的質粒pE24PDO-B能在細菌中表達,產生全長擬南芥屬對羥基苯丙酮酸雙加氧酶。
實施例6全長構建體比截短的構建體增加了穩定性擬南芥對羥基苯丙酮酸雙加氧酶的兩種不同的構建體,一種含如實施例5的全長序列PDO-B,從質粒pE24PDO-B產生,一種含缺乏推斷的葉綠體先導序列的截短序列PDO-A,從質粒pE24CP1中產生,兩種都用Pharmacia苯基Sepharose疏水相互作用柱純化,接著通過Phamacia Sephacryl 300凝膠過濾層析。用含5mM抗壞血酸,1mM還原谷胱苷肽和0.1mM硫酸銨亞鐵的20mM bis Tris-propane緩沖液,pH7.2稀釋兩種蛋白至1mg/mL,貯存在4℃冰箱中至10天。在不同時間內取樣,通過異構酶偶聯分光光度法測定活性。在這種條件下,全長酶活性的半衰期是4天,而截短酶制劑半衰期為9至10小時。此外,全長酶的活性可通過與鐵和還原性試劑還原谷胱苷肽或抗壞血酸溫育,或對含鐵和還原性試劑的緩沖液透析恢復。相形之下,截短酶的活性不能通過與含鐵和還原性試劑的緩沖液溫育恢復。全長酶在分光光度試驗中也更為穩定,有用線性區較截短酶長2至3倍。兩種酶制品用除草劑活性抑制劑顯示類似的I50值。
由于在貯存條件下,在分光光度測試中和在存在鐵和還原性試劑的活性可逆重建中穩定性更高,這些結果清楚地顯示全長PDO-B構建體較截短的酶有決定性的優勢。盡管兩種酶的構建體能用作抑制劑的篩選,但本申請中優選PDO-B酶,其在機制和結構研究中更具優勢。
實施例7玉米對羥基苯丙酮酸雙加氧酶基因的克隆在中等嚴緊條件下,用異源探針濾膜雜交篩選Stratagene玉米Uni-Zap cDNA文庫(來自幼小植物)的大約600,000個噬菌斑,探針用PCR制備,是一條916bp的DNA片段,由SEQ ID NO:14的263至1178位突出區域限定。在初步篩選中,鑒定了24個陽性噬菌體克隆,在第二次篩選獲得了11個噬菌體克隆。7個陽性克隆進行測序,與擬南芥對羥基苯丙酮酸雙加氧酶比較,其中4個顯示在氨基酸水平上非常保守,4個中最長的含988bp的插入片段,與擬南芥屬蛋白的同一性為70%,類似性為78%,但是缺少相應于蛋白氨基末端的大約550bp。
試圖獲得玉米對羥基苯丙酮酸雙加氧酶基因的全長cDNA的努力未成功,可能是因為RNA的二級結構有效地抑制了這個轉錄物的逆轉錄。篩選另兩個cDNA文庫,對足夠含有全長cDNA的克隆測序,這些克隆都顯示為嵌合體。因此篩選一個基因組文庫以獲得基因的5’端三分之一。用含截短的玉米對羥基苯丙酮酸雙加氧酶cDNA(cloneH101C)5’端的415bp EcoRⅠ-BssHⅡ片段,篩選來自噬菌體載體EMBL3中的Clontech玉米文庫(整個幼苗,2葉期)的大約100萬個克隆。8個初級篩選陽性的噬菌體克隆涂平板并篩選,挑出4個次級陽性的克隆。用Qiagen Lambda midi-kit從每個克隆中制備DNA。SalⅠ或EcoRⅠ消化表明兩個克隆是一樣的,來自剩余三個克隆(11.1.3,13.1.1,和21.2.1)的DNA樣品用SalⅠ,EcoRⅠ或SalⅠ和EcoRⅠ消化,用于Southern分析和用作制備全長擬南芥屬對羥基苯丙酮酸雙加氧酶基因的探針。克隆中有兩個(11.1.3和13.1.1)顯示了序列保守,亞克隆這些同源性片段并測序,兩個克隆似乎含有全長基因,每個含有基因3’端附近的一個內含子。然而兩個克隆的序列之間有差異,表明它們可能是兩種不同的基因或一個可能是假基因。克隆11.1.3的序列與cDNA序列吻合,這個克隆用來構建一個全長對羥基苯丙酮酸雙加氧酶的編碼區。
該基因包含兩個相鄰片段,一個3.5kb EcoRⅠ-SalⅠ片段和一個2kb SalⅠ片段。將二者亞克隆進pBluescript SKⅡ+,產生質粒pESlll3和pSalllll3。用SpeⅠ消化pESlll3釋放出大約2.7kb的上游序列,然后再連接,產生一個有747個堿基對插入片段的質粒(pSPE1)。pSPE1用SalⅠ消化成線性質粒,與來自pSallll3的2kbSalⅠ片段連接,該片段用SalⅠ消化釋放,凝膠純化。用SpelⅠ和Bpul 102Ⅰ消化證實了其方向,正確的質粒命名為plll3。為了去掉基因組克隆3’末端的內含子,質粒用Bpull02Ⅰ和XhoⅠ消化,含有載體和基因5’部分的3.9kb片段用凝膠純化。相應的來自pHl011c(cDNA)的882bp Bpull02Ⅰ-XhoⅠ片段凝膠純化,與3.9kb片段連接,產生克隆pMPD0(ATCC 209120),其含有1782bp插入片段。推斷的ATG上游有260個堿基,在終止密碼的下游有189個堿基。通過對插入片段測序證實是全長序列,該玉米對羥基苯丙酮酸雙加氧酶的核酸序列和推斷的蛋白序列分別在SEQ ID N0:10和11給出。從玉米和擬南芥屬獲得的對羥基苯丙酮酸雙加氧酶序列,用GCG的Gap程序(Program Manual for the Wisconsin Package,Vetsion9.0-OpenVMS,December,1996,Genetics Computer Group,575Science Drive,Madison,WI,USA53711)比較,這些比較的結果表明,在核苷酸水平上它們大約有67%一致,在氨基酸水平上,它們有69%類似和62%一致。玉米的對羥基苯丙酮酸雙加氧酶的預計氨基酸序列與擬南芥屬和其它真核生物的比較見圖3。
實施例8cDNA文庫的組成,cDNA克隆的分離和測序制備代表來自剛開始產生斑鳩菊酸的Vernonia galamenensis發育種子的mRNA的cDNA文庫。按廠商的方法(Stratagene CloningSystems La Jolla,CA)用一個Uni-ZAPTMXR載體制備文庫。按Stratagene提供的方法將Uni-ZAPTMXR載體轉變成質粒文庫。轉變之后,cDNA插入片段包含在質粒載體pBluescript中。來自隨機挑取的含有重組pBluescript的細菌克隆的cDNA插入片段,用插入cDNA序列的兩側載體序列作專一引物,通過聚合酶鏈反應擴增。擴增的插入DNA用染料引物測序反應產生部分cDNA序列(已表達序列標志或ESTs,見Adams,M.D.等(1991)Science,252:1651)。得到的ESTs用Perkin Elmer 377型熒光測序儀分析。
實施例9cDNA克隆的鑒定和表征通過BLAST(Basic Local Alignment Search Tool:Altschul,S.F.等(1993)分子生物學雜志,215:403-410;也見www.ncbi.nlm.nih.gov/BLAST/)檢索可鑒定編碼Vernoniagalamenensis酶的ESTs與BLASTnr數據庫中(比較所有非冗余GenBank CDS翻譯本,來自Brookhaven蛋白數據庫3維結構的序列,SWISS-PROT蛋白序列數據庫、EMBL和DDBJ數據庫的最新重要公布)序列的相似性。用國家生物技術信息中心(NCBI)提供的BLASTN算法,分析了實施例9中獲得的cDNA序列與所有包含在nr數據庫中對公眾開放的DNA序列的相似性。翻譯DNA序列的所有可讀框,用NCBI提供的BLASTX算法(Gish.W和States,D.J.(1993)自然遺傳,3:266-272)比較與包含在nr數據庫中所有對公眾開放的蛋白序列的相似性。為了方便,觀察到cDNA序列與僅僅偶然通過BLAST計算包括在檢索數據庫中的序列匹配的P值(概率)在這里作為pLog值,它代表報道的P值的負對數。據此,pLog值越大,cDNA序列相似性就越大,BLAST選中代表同源蛋白。
使用克隆vsl.pk0015.b2的BLASTX檢索,揭示了由cDNA編碼的蛋白與來源于其它植物的多種對羥基苯丙酮酸雙加氧酶的相似性。三種最相似的對羥基苯丙酮酸雙加氧酶是鏈霉菌對羥基苯丙酮酸雙加氧酶(GenBank登錄號U11864,pLog=8.34),大鼠對羥基苯丙酮酸雙加氧酶(GenBank登錄號M18405,pLog=7.66),人的對羥基苯丙酮酸雙加氧酶(GenBank登錄號U29895,pLog=7.60)。SEQ ID NO:16顯示了在克隆vsl.pk0015.b2中的Vernonia galamenensis cDNA的部分核苷酸序列。序列對比和BLAST值及概率表明該核酸片段編碼Vernonia galamenensis對羥基苯丙酮酸雙加氧酶的一部分。
序列表(1)一般信息(ⅰ)申請人(A)姓名E.I.DUPONT DE NEMOURS AND COMPANY(B)街道1007 MARKET STREET(C)城市WILMINGTON(D)州DELAWARE(E)國家美國(F)郵編(ZIF):19898(G)電話302-892-8112(H)傳真302-773-0164(I)電傳6717325(ⅱ)發明名稱對羥基苯丙酮酸雙加氧酶的植物基因(ⅲ)序列數目16(ⅳ)計算機可讀形式(A)介質類型磁盤,3.5英寸(B)計算機IBM PC兼容機(C)操作系統用于WINDOWS 95的微軟WORD(D)軟件微軟WORD 7.0版(ⅴ)當前申請數據(A)申請號(B)申請日
(C)分類(ⅵ)在先申請數據(A)申請號60/021,364(B)申請日1996年6月27(ⅶ)律師/代理人信息(A)姓名FLOYD,LINDA AXAMETHY(B)注冊號33,692(C)參考/案卷號BA-9120(2)SEQ ID N0:1的信息(ⅰ)序列性質(A)長度233堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線性(ⅱ)分子類型cDNA(ⅹⅰ)序列描述SEQ ID N0:1CAAGAAACGN GTCGNCGACG TGCTCAGCGA TGATCAGATC AAGGAGTGTG AGGAATTAGG60GATTCTTNTA GACAGAGATG ATCAAGGGAC GTTNCTTCAA ATCTNCACAA AACCACTAGG120TGACAGGCCG ACGNTATTTA TAGAGATAAT CCAGAGNGTA GGATGCATGA TGAAAGATGT180GGAAGGGANG GCTTACCAGA GTGGAGNATN TNGTGGTTTT GGCAAAGGCA ATT 233(2)SEQ ID NO:2的信息(ⅰ)序列性質(A)長度1448堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線性(ⅱ)分子類型cDNA(ⅲ)特征(A)名稱/關鍵詞CDS(B)位置9..1343(ⅹⅰ)序列描述SEQ ID NO:2TGAAATCA ATG GGC CAC CAA AAC GCC GCC GTT TCA GAG AAT CAA AAC CAT 50Met Gly His Gln Asn Ala Ala Val Ser Glu Asn Gln Asn His1 5 10GAT GAC GGC GCT GCG TCG TCG CCG GGA TTC AAG CTC GTC GGA TTT TCC 98Asp Asp Gly Ala Ala Ser Ser Pro Gly Phe Lys Leu Val Gly Phe Ser15 20 25 30AAG TTC GTA AGA AAG AAT CCA AAG TCT GAT AAA TTC AAG GTT AAG CGC 146Lys Phe Val Arg Lys Asn Pro Lys Ser Asp Lys Phe Lys Val Lys Arg35 40 45TTC CAT CAC ATC GAG TTC TGG TGC GGG GAC GCA ACC AAC GTC GCT CGT 194Phe His His Ile Glu Phe Trp Cys Gly Asp Ala Thr Asn Val Ala Arg50 55 60CGC TTC TCC TGG GGT CTG GGG ATG AGA TTC TCC GCC AAA TCC GAT CTT 242Arg Phe Ser Trp Gly Leu Gly Met Arg Phe Ser Ala Lys Ser Asp Leu65 70 75TCC ACC GGA AAC ATG GTT CAC GCC TCT TAC CTA CTC ACC TCC GGT GAA 290Ser Thr Gly Asn Met Val His Ala Ser Tyr Leu Leu Thr Ser Gly Glu80 85 90CTC CGA TTC CTT TTC ACT GCT CCT TAC TCT CCG TCT CTC TCC GGC GGA 338Leu Arg Phe Leu Phe Thr Ala Pro Tyr Ser Pro Ser Leu Ser Gly Gly95 100 105 110GAG ATT AAA CCG ACA ACC ACA GGT TCT ATC CCA AGT TTC GAT CAC GGG 386Glu Ile Lys Pro Thr Thr Thr Gly Ser Ile Pro Ser Phe Asp His Gly115 120 125TCT TGT CGG TCC TTC TTC TCT TCA CAT GGT CTC GGT GTT AGA CCC GTT 434Ser Cys Arg Ser Phe Phe Ser Ser His Gly Leu Gly Val Arg Pro Val130 135 140GCG ATT GAA GTA GAA GAC GCG GAG TCA GCT TTC TCC ATC AGT GTA GCT 482Ala Ile Glu Val Glu Asp Ala Glu Ser Ala Phe Ser Ile Ser Val Ala145 150 155AAT GGC GCT ATT CCT TCG TCG CCT CCT ATC GTC CTC AAT GAA GCA GTT 530Asn Gly Ala Ile Pro Ser Ser Pro Pro Ile Val Leu Asn Glu Ala Val160 165 170ACG ATC GCT GAG GTT AAA CTA TAC GGC GAT GTT GTT CTC CGA TAT GTT 578Thr Ile Ala Glu Val Lys Leu Tyr Gly Asp Val Val Leu Arg Tyr Val175 180 185 190AGT TAC AAA GCA GAA GAT ACC GAA AAA TCC GAA TTC TTG CCA GGG TTC 626Ser Tyr Lys Ala Glu Asp Thr Glu Lys Ser Glu Phe Leu Pro Gly Phe195 200 205GAG CGT GTA GAG GAT GCG TCG TCG TTC CCA TTG GAT TAT GGT ATC CGG 674Glu Arg Val Glu Asp Ala Ser Ser Phe Pro Leu Asp Tyr Gly Ile Arg210 215 220CGG CTT GAC CAC GCC GTG GGA AAC GTT CCT GAG CTT GGT CCG GCT TTA 722Arg Leu Asp His Ala Val Gly Asn Val Pro Glu Leu Gly Pro Ala Leu225 230 235ACT TAT GTA GCG GGG TTC ACT GGT TTT CAC CAA TTC GCA GAG TTC ACA 770Thr Tyr Val Ala Gly Phe Thr Gly Phe His Gln Phe Ala Glu Phe Thr240 245 250GCA GAC GAC GTT GGA ACC GCC GAG AGC GGT TTA AAT TCA GCG GTC CTG 818Ala Asp Asp Val Gly Thr Ala Glu Ser Gly Leu Asn Ser Ala Val Leu255 260 265 270GCT AGC AAT GAT GAA ATG GTT CTT CTA CCG ATT AAC GAG CCA GTG CAC 866Ala Ser Asn Asp Glu Met Val Leu Leu Pro Ile Asn Glu Pro Val His275 280 285GGA ACA AAG AGG AAG AGT CAG ATT CAG ACG TAT TTG GAA CAT AAC GAA 914Gly Thr Lys Arg Lys Ser Gln Ile Gln Thr Tyr Leu Glu His Asn Glu290 295 300GGC GCA GGG CTA CAA CAT CTG GCT CTG ATG AGT GAA GAC ATA TTC AGG 962Gly Ala Gly Leu Gln His Leu Ala Leu Met Ser Glu Asp Ile Phe Arg305 310 315ACC CTG AGA GAGATG AGG AAG AGG AGC AGT ATT GGA GGA TTC GAC TTC 1010Thr Leu Arg Glu Met Arg Lys Arg Ser Ser Ile Gly Gly Phe Asp Phe320 325 330ATG CCT TCT CCT CCG CCT ACT TAC TAC CAG AAT CTC AAG AAA CGG GTC 1058Met Pro Ser Pro Pro Pro Thr Tyr Tyr Gln Asn Leu Lys Lys Arg Val335 340 345 350GGC GAC GTG CTC AGC GAT GAT CAG ATC AAG GAG TGT GAG GAA TTA GGG 1106Gly Asp Val Leu Ser Asp Asp Gln Ile Lys Glu Cys Glu Glu Leu Gly355 360 365ATT CTT GTA GAC AGA GAT GAT CAA GGG ACG TTG CTT CAA ATC TTC ACA 1154Ile Leu Val Asp Arg Asp Asp Gln Gly Thr Leu Leu Gln Ile Phe Thr370 375 380AAA CCA CTA GGT GAC AGG CCG ACG ATA TTT ATA GAG ATA ATC CAG AGA 1202Lys Pro Leu Gly Asp Arg Pro Thr Ile Phe Ile Glu Ile Ile Gln Arg385 390 395GTA GGA TGC ATG ATG AAA GAT GAG GAA GGG AAG GCT TAC CAG AGT GGA 1250Val Gly Cys Met Met Lys Asp Glu Glu Gly Lys Ala Tyr Gln Ser Gly400 405 410GGA TGT GGT GGT TTT GCC AAA GGC AAT TTC TCT GAG CTC TTC AAG TCC 1298Gly Cys Gly Gly Phe Ala Lys Gly Asn Phe Ser Glu Leu Phe Lys Ser415 420 425 430ATT GAA GAA TAC GAA AAG ACT CTT GAA GCC AAA CAG TTA GTG GGA 1343Ile Glu Glu Tyr Glu Lys Thr Leu Glu Ala Lys Gln Leu Val Gly435 440 445TGAACAAGAA GAAGAACCAA CTAAAGGATT GTGTAATTAA TGTAAAACTG TTTTATCTTA1403TCAAAACAAT GTATACAACA TCTCATTTAA AAACGAGATC AATCC1448(2)SEQ ID NO:3的信息(ⅰ)序列性質(A)長度445個氨基酸(B)類型氨基酸(D)拓撲學線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:3Met Gly His Gln Asn Ala Ala Val Ser Glu Asn Gln ASn His Asp Asp1 5 10 15Gly Ala Ala Ser Ser Pro Gly Phe Lys Leu Val Gly Phe Ser Lys Phe20 25 30Val Arg Lys Asn Pro Lys Ser Asp Lys Phe Lys Val Lys Arp PHe His35 40 45His Ile Glu Phe Trp Cys Gly Asp Ala Thr Asn Val Ala Arg Arg Phe50 55 60Ser Trp Gly Leu Gly Met Arg Phe Ser Ala Lys Ser Asp Leu Ser Thr65 70 75 80Gly Asn Met Val His Ala Ser Tyr Leu Leu Thr Ser Gly Glu Leu Arg85 90 95Phe Leu Phe Thr Ala Pro Tyr Ser Pro Ser Leu Ser Gly Gly Glu Ile100 105 110Lys Pro Thr Thr Thr Gly Ser Ile Pro Ser Phe Asp His Gly Ser Cys115 120 125Arg Ser Phe Phe Ser Ser His Gly Leu Gly Val Arg Pro Val Ala Ile130 135 140Glu Val Glu Asp Ala Glu Ser Ala Phe Ser Ile Ser Val Ala Asn Gly145 150 155 160Ala Ile Pro Ser Ser Pro Pro Ile Val Leu Asn Glu Ala Val Thr Ile165 170 175Ala Glu Val Lys Leu Tyr Gly Asp Val Val Leu Arg Tyr Val Ser Tyr180 185 190Lys Ala Glu Asp Thr Glu Lys Ser Glu Phe Leu Pro Gly Phe Glu Arg195 200 205Val Glu Asp Ala Ser Ser Phe Pro Leu Asp Tyr Gly Ile Arg Arg Leu210 215 220Asp His Ala Val Gly Asn Val Pro Glu Leu Gly Pro Ala Leu Thr Tyr225 230 235 240Val Ala Gly Phe Thr Gly Phe His Gln Phe Ala Glu Phe Thr Ala Asp245 250 255Asp Val Gly Thr Ala Glu Ser Gly Leu Asn Ser Ala Val Leu Ala Ser260 265 270Asn Asp Glu Met Val Leu Leu Pro Ile Asn Glu Pro Val His Gly Thr275 280 285Lys Arg Lys Ser Gln Ile Gln Thr Tyr Leu Glu His Asn Glu Gly Ala290 295 300Gly Leu Gln His Leu Ala Leu Met Ser Glu Asp Ile Phe Arg Thr Leu305 310 315 320Arg Glu Met Arg Lys Arg Ser Ser Ile Gly Gly Phe Asp Phe Met Pro325 330 335Ser Pro Pro Pro Thr Tyr Tyr Gln Asn Leu Lys Lys Arg Val Gly Asp340 345 350Val Leu Ser Asp Asp Gln Ile Lys Glu Cys Glu Glu Leu Gly Ile Leu355 360 365Val Aap Arg Asp Asp Gln Gly Thr Leu Leu Gln Ile Phe Thr Lys Prc370 375 380Leu Gly Asp Arg Pro Thr Ile Phe Ile Glu Ile Ile Gln Arg Val Gly385 390 395 400Cys Met Met Lys Asp Glu Glu Gly Lys Ala Tyr Gln Ser Gly Gly Cys405 410 415Gly Gly Phe Ala Lys Gly Asn Phe Ser Glu Leu Phe Lys Ser Ile Glu420 425 430Glu Tyr Glu Lys Thr Leu Glu Ala Lys Gln Leu Val Gly435 440 445(2)SEQ ID NO:4的信息(ⅰ)序列性質(A)長度53堿基對
(B)類型核酸(C)鏈型單鏈(D)拓撲學線性(ⅱ)分子類型DNA(基因組)(ⅹⅰ)序列描述SEQ ID NO:4TATGTCCAAG TTCGTAAGAA AGAATCCAAA GTCTGATAAA TTCAAGGTTA AGC 53(2)SEQ ID NO:5的信息(ⅰ)序列性質(A)長度51堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線性(ⅱ)分子類型DNA(基因組)(ⅹⅰ)序列描述SEQ ID NO:5GCTTAACCTT GAATTTATCA GACTTTGGAT TCTTTCTTAC GAACTTGGAC A 5l(2)SEQ ID NO:6的信息(ⅰ)序列性質(A)長度392個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲學線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:6Thr Ser Tyr Ser Asp Lys Gly Glu Lys Pro Glu Arg Gly Arg Phe Leu1 5 10 15His Phe His Ser Val Thr Phe Trp Val Gly Asn Ala Lys Gln Ala Ala20 25 30Ser Tyr Tyr Cys Ser Lys lle Gly Phe Glu Pro Leu Ala Tyr Lys Gly35 40 45Leu Glu Thr Gly Ser Arg Glu Val Val Ser His Val Val Lys Gln Asp50 55 60Lys Ile Val Phe Val Phe Ser Ser Ala Leu Asn Prc Trp Asn Lys Glu65 70 75 80Met Gly Asp His Leu Val Lys His Gly Asp Gly Val Lys Asp Ile Ala85 90 95Phe Glu Val Glu Asp Cys Asp Tyr Ile Val Gln Lys Ala Arg Glu Arg100 105 110Gly Ala Ile Ile Val Arg Glu Glu Val Cys Cys Ala Ala Asp Val Arg115 120 125Gly His His Thr Pro Leu Asp Arg Ala Arg Gln Val Trp Glu Gly Thr130 135 140Leu Val Glu Lys Met Thr Phe Cys Leu Asp Ser Arg Pro Gln Pro Ser145 150 155 160Gln Thr Leu Leu His Arg Leu Leu Leu Ser Lys Leu Pro Lys Cys Gly165 170 175Leu Glu Ile Ile Asp His Ile Val Gly Asn Gln Pro Asp Gln Glu Met180 185 190Glu Ser Ala Ser Gln Trp Tyr Met Arg Asn Leu Gln Phe His Arg Phe195 200 205Trp Ser Val Asp Asp Thr Gln Ile His Thr Glu Tyr Ser Ala Leu Arg210 215 220Ser Val Val Met Ala Asn Tyr Glu Glu Ser Ile Lys Met Pro Ile Asn225 230 235 240Glu Pro Ala Pro Gly Lys Lys Lys Ser Gln Ile Gln Glu Tyr Val Asp245 250 255Tyr Asn Gly Gly Ala Gly Val Gln His Ile Ala Leu Lys Thr Glu Asp260 265 270Ile Ile Thr Ala Ile Arg Ser Leu Arg Glu Arg Gly Val Glu Phe Leu275 280 285Ala Val Pro Phe Thr Tyr Tyr Lys Gln Leu Gln Glu Lys Leu Lys Ser290 295 300Ala Lys Ile Arg Val Lys Glu Ser lle Asp Val Leu Glu Glu Leu Lys305 310 315 320Ile Leu Val Asp Tyr Asp Glu Lys Gly Tyr Leu Leu Gln Ile Phe Thr325 330 335Lys Pro Met Gln Asp Arg Pro Thr Val Phe Leu Glu Val Ile Gln Arg340 345 350Asn Asn His Gln Gly Phe Gly Ala Gly Asn Phe Asn Ser Leu Phe Lys355 360 365Ala Phe Glu Glu Glu Gln Glu Leu Arg Gly Asn Leu Thr Asp Thr Asp370 375 380Pro Asn Gly Val Pro Phe Arg Leu385 390(2)SEQ ID NO:7的信息(ⅰ)序列性質(A)長度392個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲學線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:7Thr Ser Tyr Ser Asp Lys Gly Glu Lys Pro Glu Arg Gly Arg Phe Leu1 5 10 15His Phe His Ser Val Thr Phe Trp Val Gly Asn Ala Lys Gln Ala Ala20 25 30Ser Tyr Tyr Cys Ser Lys Ile Gly Phe Glu Pro Leu Ala Tyr Lys Gly35 40 45Leu Glu Thr Gly Ser Arg Glu Val Val Ser His Val Val Lys Gln Asp50 55 60Lys Ile Val Phe Val Phe Ser Ser Ala Leu Asn Pro Trp Asn Lys Glu65 70 75 80Met Gly Asp His Leu Val Lys His Gly Asp Gly Val Lys Asp Ile Ala85 90 95Phe Glu Val Glu Asp Cys Asp Tyr Ile Val Gln Lys Ala Arg Glu Arg100 105 110Gly Ala Ile Ile Val Arg Glu Glu Val Cys Cys Ala Ala Asp Val Arg115 120 125Gly His His Thr Pro Leu Asp Arg Ala Arg Gln Val Trp Glu Gly Thr130 135 140Leu Val Glu Lys Met Thr Phe Cys Leu Asp Ser Arg Pro Gln Pro Ser145 150 155 160Gln Thr Leu Leu His Arg Leu Leu Leu Ser Lys Leu Pro Lys Cys Gly165 170 175Leu Glu Ile Ile Asp His Ile Val Gly Asn Gln Pro Asp Gln Glu Met180 185 190Glu Ser Ala Ser Gln Trp Tyr Met Arg Asn Leu Gln Phe His Arg Phe195 200 205Trp Ser Val Asp Asp Thr Gln Ile His Thr Glu Tyr Ser Ala Leu Arg210 215 220Ser Val Val Met Ala Asn Tyr Glu Glu Ser Ile Lys Met Pro Ile Asn225 230 235 240Glu Pro Ala Pro Gly Lys Lys Lys Ser Gln lle Gln Glu Tyr Val Asp245 250 255Tyr Asn Gly Gly Ala Gly Val Gln His Ile Ala Leu Lys Thr Glu Asp260 265 270Ile Ile Thr Ala Ile Arg Ser Leu Arg Glu Arg Gly Val Glu Phe Leu275 280 285Ala Val Pro Phe Thr Tyr Tyr Lys Gln Leu Gln Glu Lys Leu Lys Ser290 295 300Ala Lys Ile Arg Val Lys Glu Ser Ile Asp Val Leu Glu Glu Leu Lys305 310 215 320Ile Leu Val Asp Tyr Asp Glu Lys Gly Tyr Leu Leu Gln Ile Phe Thr325 330 335Lys Pro Met Gln Asp Arg Pro Thr Val Phe Leu Glu Val Ile Gln Arg340 345 350Asn Asn His Gln Gly Phe Gly Ala Gly Asn Phe Asn Ser Leu Phe Lys355 360 365Ala Phe Glu Glu Glu Gln Glu Leu Arg Gly Asn Leu Thr Asp Thr Asp370 375 380Pro Asn Gly Val Pro Phe Arg Leu385 390(2)SEQ ID NO:8的信息(ⅰ)序列性質(A)長度392個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲學線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:8Thr Thr Tyr Asn Asn Lys Gly Pro Lys Pro Glu Arg Gly Arg Phe Leu1 5 10 15His Phe His Ser Val Thr Phe Trp Val Gly Asn Ala Lys Gln Ala Ala20 25 30Ser Phe Tyr Cys Asn Lys Met Gly Phe Glu Pro Leu Ala Tyr Arg Gly35 40 45Leu Glu Thr Gly Ser Arg Glu Val Val Ser His Val Ile Lys Arg Gly50 55 60Lys Ile Val Phe Val Leu Cys Ser Ala Leu Asn Pro Trp Asn Lys Glu65 70 75 80Met Gly Asp His Leu Val Lys His Gly Asp Gly Val Lys Asp Ile Ala85 90 95Phe Glu Val Glu Asp Cys Asp His Ile Val Gln Lys Ala Arg Glu Arg100 105 110Gly Ala Lys Ile Val Arg Glu Pro Trp Val Glu Gln Asp Lys Phe Gly115 120 125Lys Val Lys Phe Ala Val Leu Gln Thr Tyr Gly Asp Thr Thr His Thr130 135 140Leu Val Glu Lys Ile Asn Tyr Thr Gly Arg Phe Leu Pro Gly Phe Glu145 150 155 160Ala Pro Thr Tyr Lys Asp Thr Leu Leu Pro Lys Leu Pro Arg Cys Asn165 170 175Leu Glu Ile Ile Asp His Ile Val Gly Asn Gln Pro Asp Gln Glu Met180 185 190Gln Ser Ala Ser Glu Trp Tyr Leu Lys Asn Leu Gln Phe His Arg Phe195 200 205Trp Ser Val Asp Asp Thr Gln Val His Thr Glu Tyr Ser Ser Leu Arg210 215 220Ser Ile Val Val Thr Asn Tyr Glu Glu Ser Ile Lys Met Pro Ile Asn225 230 235 240Glu Pro Ala Pro Gly Arg Lys Lys Ser Gln lle Gln Glu Tyr Val Asp245 250 255Tyr Asn Gly Gly Ala Gly Val Gln His Ile Ala Leu Lys Thr Glu Asp260 265 270Ile Ile Thr Ala Ile Arg His Leu Arg Glu Arg Gly Thr Glu Phe Leu275 280 285Ala Ala Pro Ser Ser Tyr Tyr Lys Leu Leu Arg Glu Asn Leu Lys Ser290 295 300Ala Lys Ile Gln Val Lys Glu Ser Met Asp Val Leu Glu Glu Leu His305 310 315 320Ile Leu Val Asp Tyr Asp Glu Lys Gly Tyr Leu Leu Gln Ile Phe Thr325 330 335Lys Pro Met Gln Asp Arg Pro Thr Leu Phe Leu Glu Val Ile Gln Arg340 345 350His Asn His Gln Gly Phe Gly Ala Gly Asn Phe Asn Ser Leu Phe Lys355 360 365Ala Phe Glu Glu Glu Gln Ala Leu Arg Gly Asn Leu Thr Asp Leu Glu370 375 380Pro ASn Gly Val Arg Ser Gly Met385 390(2)SEQ ID NO:9的信息(ⅰ)序列性質(A)長度376個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲學線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:9Tyr Trp Asp Lys Gly Pro Lys Pro Glu Arg Gly Arg Phe Leu His Phe1 5 10 15His Ser Val Tnr Pne Trp Val Gly Ash Ala Lys Gln Ala Ala Ser Phe20 25 30Tyr Cys Asn Lys Met Gly Phe Glu Pro Leu Ala Tyr Lys Gly Leu Glu35 40 45Thr Gly Ser Arg Glu Val Val Ser His Val Ile Lys Gln Gly Lys Ile50 55 60Val Phe Val Leu Cys Ser Ala Leu Asn Pro Trp Asn Lys Glu Met Gly65 70 75 80Asp His Leu Val Lys His Gly Asp Gly Val Lys Asp Ile Ala Phe Glu85 90 95Val Glu Asp Cys Glu His Ile Val Gln Lys Ala Arg Glu Arg Gly Ala100 105 110Lys Ile Val Arg Glu Pro Trp Val Glu Glu Asp Lys Phe Gly Lys Val115 120 125Lys Phe Ala Val Leu Gln Thr Tyr Gly Asp Thr Thr His Thr Leu Val130 135 140Glu Lys Ile Asn Tyr Thr Gly Arg Phe Leu Pro Gly Phe Glu Ala Pro145 150 155 160Thr Tyr Lys Asp Thr Leu Leu Pro Lys Leu Pro Ser Cys Ash Leu Glu165 170 175Ile Ile Asp His Ile Val Gly Asn Gln Pro Asp Gln Glu Met Glu Ser180 185 190Ala Ser Glu Trp Tyr Leu Lys Asn Leu Gln Phe His Arg Phe Trp Ser195 200 205Val Asp Asp Thr Gln Val His Thr Glu Tyr Ser Ser Leu Arg Ser Ile210 215 220Val Val Ala Asn Tyr Glu Glu Ser Ile Lys Met Pro Ile Asn Glu Pro225 230 235 240Ala Pro Gly Arg Lys Lys Ser Gln Ile Gln Glu Tyr Val Asp Tyr Asn245 250 255Gly Gly Ala Gly Val Gln His Ile Ala Leu Arg Thr Glu Asp Ile Ile260 265 270Thr Thr Ile Arg His Leu Arg Glu Arg Gly Met Glu Phe Leu Ala Val275 280 285Pro Ser Ser Tyr Tyr Arg Leu Leu Arg Glu Asn Leu Lys Thr Ser Lys290 295 300Ile Gln Val Lys Glu Asn Met Asp Val Leu Glu Glu Leu Lys Ile Leu305 310 315 320Val Asp Tyr Asp Glu Lys Gly Tyr Leu Leu Gln Ile Phe Thr Lys Pro325 330 335Met Gln Asp Arg Pro Thr Leu Phe Leu Glu Val Ile Gln Arg His Asn340 345 350His Gln Gly Phe Gly Ala Gly Asn Phe Asn Ser Leu Phe Lys Ala Phe355 360 365Glu Glu Glu Gln Ala Leu Arg Gly370 375(2)SEQ ID NO:10的信息(ⅰ)序列性質(A)長度1766堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線性(ⅱ)分子類型cDNA到mRNA(ⅲ)假設非(ⅳ)反義非(ⅴ)最初來源(A)生物體玉米(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置261..1595(ⅹⅰ)序列描述SEQ ID NO:10ACTAGTTGTG AGAGCCTTCT GCGTTGGCAA TTGGCAGTAC AAGACAAATC ACATCCGCAA60CCGCAACCAC AGAATCGTCC GTCCACGTGG CCCCCATCAC TTCCCTTTAT TTACCAGTCG120TCCCCCATCC CCAGGGCCAC CCACCAACAA GTGCAGTCAC CCGAGCCGCA AACTGCAGCT180CTGCAAGCTA CAGAGGCCAC CACGAGTCCA CGACGCCACG CCCTCCGAGA GAAAGAGAAA240GAGAAAACCA AAGCACGATA ATG CCC CCG ACC CCC ACA GCC GCC GCA GCC290Met Pro Pro Thr Pro Thr Ala Ala Ala Ala1 5 10GGC GCC GCC GTG GCG GCG GCA TCA GCA GCG GAG CAA GCG GCG TTC CGC 338Gly Ala Ala Val Ala Ala Ala Ser Ala Ala Glu Gln Ala Ala Phe Arg15 20 25CTC GTG GGC CAC CGC AAC TTC GTC CGC TTC AAC CCG CGC TCC GAC CGC 386Leu Val Gly His Arg Asn Phe Val Arg Phe Asn Pro Arg Ser Asp Arg30 35 40TTC CAC ACG CTC GCG TTC CAC CAC GTG GAG CTC TGG TGC GCC GAC GCG 434Phe His Thr Leu Ala Phe His His Val Glu Leu Trp Cys Ala Asp Ala45 50 55GCC TCC GCC GCG GGC CGC TTC TCC TTC GGC CTG GGC GCG CCG CTC GCC 482Ala Ser Ala Ala Gly Arg Phe Ser Phe Gly Leu Gly Ala Pro Leu Ala60 65 70GCA CGC TCC GAC CTC TCC ACG GGC AAC TCC GCG CAC GCG TCC CTG CTG 530Ala Arg Ser Asp Leu Ser Thr Gly Asn Ser Ala His Ala Ser Leu Leu75 80 85 90CTC CGC TCC GGC TCC CTC TCC TTC CTC TTC ACG GCG CCC TAC GCG CAC 578Leu Arg Ser Gly Ser Leu Ser Phe Leu Phe Thr Ala Pro Tyr Ala His95 100 105GGC GCC GAC GCT GCC ACC GCC GCG CTG CCC TCC TTC TCC GCC GCC GCC 626Gly Ala Asp Ala Ala Thr Ala Ala Leu Pro Ser Phe Ser Ala Ala Ala110 115 120GCG CGG CGC TTC GCA GCC GAC CAC GGC CTC GCG GTG CGC GCC GTC GCG 674Ala Arg Arg Phe Ala Ala Asp His Gly Leu Ala Val Arg Ala Val Ala125 130 135CTC CGC GTC GCC GAC GCC GAG GAC GCC TTC CGC GCC AGC GTC GCG GCC 722Leu Arg Val Ala Asp Ala Glu Asp Ala Phe Arg Ala Ser Val Ala Ala140 145 150GGG GCG CGC CCG GCG TTC GGC CCC GTC GAC CTC GGC CGC GGC TTC CGC 770Gly Ala Arg Pro Ala Phe Gly Pro Val Asp Leu Gly Arg Gly Phe Arg155 160 165 170CTC GCC GAG GTC GAG CTC TAC GGC GAC GTC GTG CTC CGG TAC GTG AGC 818Leu Ala Glu Val Glu Leu Tyr Gly Asp Val Val Leu Arg Tyr Val Ser175 180 185TAC CCG GAC GGC GCC GCG GGC GAG CCC TTC CTG CCG GGG TTC GAG GGC 866Tyr Pro Asp Gly Ala Ala Gly Glu Pro Phe Leu Pro Gly Phe Glu Gly190 195 200GTG GCC AGC CCC GGG GCG GCC GAC TAC GGG CTG AGC AGG TTC GAC CAC 914Val Ala Ser Pro Gly Ala Ala Asp Tyr Gly Leu Ser Arg Phe Asp His205 210 215ATC GTC GGC AAC GTG CCG GAG CTG GCG CCC GCC GCC GCC TAC TTC GCC 962Ile Val Gly Asn Val Pro Glu Leu Ala Pro Ala Ala Ala Tyr Phe Ala220 225 230GGC TTC ACG GGG TTC CAC GAG TTC GCC GAG TTC ACG ACG GAG GAC GTG 1010Gly Phe Thr Gly Phe His Glu Phe Ala Glu Phe Thr Thr Glu Asp Val235 240 245 250GGC ACC GCG GAG AGC GGC CTC AAC TCC ATG GTG CTC GCC AAC AAC TCG 1058Gly Thr Ala Glu Ser Gly Leu Asn Ser Met Val Leu Ala Asn Asn Ser255 260 265GAG AAC GTG CTG CTC CCG CTC AAC GAG CCG GTG CAC GGC ACC AAG CGC 1106Glu Asn Val Leu Leu Pro Leu Asn Glu Pro Val His Gly Thr Lys Arg270 275 280CGC AGC CAG ATA CAA ACG TTC CTG GAC CAC CAC GGC GGC CCC GGC GTG 1154Arg Ser Gln Ile Gln Thr Phe Leu Asp His His Gly Gly Pro Gly Val285 290 295CAG CAC ATG GCG CTG GCC AGC GAC GAC GTG CTC AGG ACG CTG AGG GAG 1202Gln His Met Ala Leu Ala Ser Asp Asp Val Leu Arg Thr Leu Arg Glu300 305 310ATG CAG GCG CGC TCG GCC ATG GGC GGC TTC GAG TTC ATG GCG CCT CCC 1250Met Gln Ala Arg Ser Ala Met Gly Gly Phe Glu Phe Met Ala Pro Pro315 320 325 330ACA TCC GAC TAC TAT GAC GGC GTG AGG CGG CGC GCC GGG GAC GTG CTC 1298Thr Ser Asp Tyr Tyr Asp Gly Val Arg Arg Arg Ala Gly Asp Val Leu335 340 345ACG GAA GCA CAG ATT AAG GAG TGC CAG GAG CTA GGG GTG CTG GTG GAC 1346Thr Glu Ala Gln Ile Lys Glu Cys Gln Glu Leu Gly Val Leu Val Asp350 355 360AGG GAT GAC CAG GGC GTG CTG CTC CAA ATC TTC ACC AAG CCA GTG GGG 1394Arg Asp Asp Gln Gly Val Leu Leu Gln Ile Phe Thr Lys Pro Val Gly365 370 375GAC AGG CCA ACG CTG TTC TTG GAA ATC ATC CAA AGG ATC GGG TGC ATG 1442Asp Arg Pro Thr Leu Phe Leu Glu Ile Ile Gln Arg Ile Gly Cys Met380 385 390GAG AAG GAT GAG AAG GGG CAA GAA TAC CAA AAG GGT GGC TGC GGC GGG 1490Glu Lys Asp Glu Lys Gly Gln Glu Tyr Gln Lys Gly Gly Cys Gly Gly395 400 405 410TTC GGC AAG GGA AAC TTC TCG CAG CTG TTC AAG TCC ATC GAG GAT TAT 1538Phe Gly Lys Gly Asn Phe Ser Gln Leu Phe Lys Ser Ile Glu Asp Tyr415 420 425GAG AAG TCC CTT GAA GCC AAG CAA GCT GCT GCA GCA GCT GCA GCT CAG 1586Glu Lys Ser Leu Glu Ala Lys Gln Ala Ala Ala Ala Ala Ala Ala Gln430 435 440GGA TCC TAG GACAGTGCTT GGAGACGAGC AACTGCTGTG GCACTTTGTA 1635Gly SerTCATGGAACA GAAATAATGA AGCGTGTTCT TTGTGACACT TGACATGCAA ATGTTTGTGT1695TCTGTAACCG TTGAATATAT GGGACGATGC TATGATGGTG TAATAGATGG TAGAGAGGGT1755ACAACCCTGA T 1766(2)SEQ ID NO:11的信息(ⅰ)序列性質(A)長度445個氨基酸(B)類型氨基酸(D)拓撲學線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:11Met Pro Pro Thr Pro Thr Ala Ala Ala Ala Gly Ala Ala Val Ala Ala1 5 10 15Ala Ser Ala Ala Glu Gln Ala Ala Phe Arg Leu Val Gly His Arg Asn20 25 30Phe Val Arg Phe Asn Pro Arg Ser Asp Arg Phe His Thr Leu Ala Phe35 40 45His His Val Glu Leu Trp Cys Ala Asp Ala Ala Ser Ala Ala Gly Arg50 55 60Phe Ser Phe Gly Leu Gly Ala Pro Leu Ala Ala Arg Ser Asp Leu Ser65 70 75 80Thr Gly Asn Ser Ala His Ala Ser Leu Leu Leu Arg Ser Gly Ser Leu85 90 95Ser Phe Leu Phe Thr Ala Pro Tyr Ala His Gly Ala Asp Ala Ala Thr100 105 110Ala Ala Leu Pro Ser Phe Ser Ala Ala Ala Ala Arg Arg Phe Ala Ala115 120 l25Asp His Gly Leu Ala Val Arg Ala Val Ala Leu Arg Val Ala Asp Ala130 135 140Glu Asp Ala Phe Arg Ala Ser Val Ala Ala Gly Ala Arg Pro Ala Phe145 150 155 160Gly Pro Val Asp Leu Gly Arg Gly Phe Arg Leu Ala Glu Val Glu Leu165 170 175Tyr Gly Asp Val Val Leu Arg Tyr Val Ser Tyr Pro Asp Gly Ala Ala180 185 190Gly Glu Pro Phe Leu Pro Gly Phe Glu Gly Val Ala Ser Pro Gly Ala195 200 205Ala Asp Tyr Gly Leu Ser Arg Phe Asp His Ile Val Gly Asn Val Pro210 215 220Glu Leu Ala Pro Ala Ala Ala Tyr Phe Ala Gly Phe Thr Gly Phe His225 230 235 240Glu Phe Ala Glu Phe Thr Thr Glu Asp Val Gly Thr Ala Glu Ser Gly245 250 255Leu Asn Ser Met Val Leu Ala Asn Asn Ser Glu Asn Val Leu Leu Pro260 265 270Leu Asn Glu Pro Val His Gly Thr Lys Arg Arg Ser Gln Ile Gln Thr275 280 285Phe Leu Asp His His Gly Gly Pro Gly Val Gln His Met Ala Leu Ala290 295 300Ser Asp Asp Val Leu Arg Thr Leu Arg Glu Met Gln Ala Arg Ser Ala305 310 315 320Met Gly Gly Phe Glu Phe Met Ala Pro Pro Thr Ser Asp Tyr Tyr Asp325 330 335Gly Val Arg Arg Arg Ala Gly Asp Val Leu Thr Glu Ala Gln Ile Lys340 345 350Glu Cys Gln Glu Leu Gly Val Leu Val Asp Arg Asp Asp Gln Gly Val355 360 365Leu Leu Gln Ile Phe Thr Lys Pro Val Gly Asp Arg Pro Thr Leu Phe370 375 380Leu Glu Ile Ile Gln Arg Ile Gly Cys Met Glu Lys Asp Glu Lys Gly385 390 395 400Gln Glu Tyr Gln Lys Gly Gly Cys Gly Gly Phe Gly Lys Gly Asn Phe405 410 415Ser Gln Leu Phe Lys Ser Ile Glu Asp Tyr Glu Lys Ser Leu Glu Ala420 425 430Lys Gln Ala Ala Ala Ala Ala Ala Ala Gln Gly Ser435440(2)SEQ ID NO:12的信息(ⅰ)序列性質(A)長度1356對堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲學線性(ⅱ)分子類型cDNA到mRNA(ⅲ)假設非(ⅳ)最初來源(A)生物體擬南芥(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置1..1254(ⅸ)特征(A)名稱/關鍵詞misc-feature(B)位置1..3(C)其它信息/標準名稱=翻譯起始密碼子(ⅸ)特征(A)名稱/關鍵詞misc-feature(B)位置1252..1254(C)其它信息/標準名稱=翻譯終止密碼子(ⅹⅰ)序列描述SEQ ID NO:12ATG TCC AAG TTC GTA AGA AAG AAT CCA AAG TCT GAT AAA TTC AAG GTT 48Met Ser Lys Phe Val Arg Lys Asn Pro Lys Ser Asp Lys Phe Lys Val1 5 10 15AAG CGC TTC CAT CAC ATC GAG TTC TGG TGC GGC GAC GCA ACC AAC GTC 96Lys Arg Phe His His Ile Glu Phe Trp Cys Gly Asp Ala Thr Asn Val20 25 30GCT CGT CGC TTC TCC TGG GGT CTG GGG ATG AGA TTC TCC GCC AAA TCC 144Ala Arg Arg Phe Ser Trp Gly Leu Gly Met Arg Phe Ser Ala Lys Ser35 40 45GAT CTT TCC ACC GGA AAC ATG GTT CAC GCC TCT TAC CTA CTC ACC TCC 192Asp Leu Ser Thr Gly Asn Met Val His Ala Ser Tyr Leu Leu Thr Ser50 55 60GGT GAC CTC CGA TTC CTT TTC ACT GCT CCT TAC TCT CCG TCT CTC TCC 240Gly Asp Leu Arg Phe Leu Phe Thr Ala Pro Tyr Ser Pro Ser Leu Ser65 70 75 80GCC GGA GAG ATT AAA CCG ACA ACC ACA GCT TCT ATC CCA AGT TTC GAT 288Ala Gly Glu Ile Lys Pro Thr Thr Thr Ala Ser Ile Pro Ser Phe Asp85 90 95CAC GGC TCT TGT CGT TCC TTC TTC TCT TCA CAT GGT CTC GGT GTT AGA 336His Gly Ser Cys Arg Ser Phe Phe Ser Ser His Gly Leu Gly Val Arg100 105 110GCC GTT GCG ATT GAA GTA GAA GAC GCA GAG TCA GCT TTC TCC ATC AGT 384Ala Val Ala Ile Glu Val Glu Asp Ala Glu Ser Ala Phe Ser Ile Ser115 120 125GTA GCT AAT GGC GCT ATT CCT TCG TCG CCT CCT ATC GTC CTC AAT GAA 432Val Ala Asn Gly Ala Ile Pro Ser Ser Pro Pro Ile Val Leu Asn Glu130 135 140GCA GTT ACG ATC GCT GAG GTT AAA CTA TAC GGC GAT GTT GTT CTC CGA 480Ala Val Thr Ile Ala Glu val Lys Leu Tyr Gly Asp Val Val Leu Arg145 150 155 160TAT GTT AGT TAC AAA GCA GAA GAT ACC GAA AAA TCC GAA TTC TTG CCA 528Tyr Val Ser Tyr Lys Ala Glu Asp Thr Glu Lys Ser Glu Phe Leu Pro165 170 175GGG TTC GAG CGT GTA GAG GAT GCG TCG TCG TTC CCA TTG GAT TAT GGT 576Gly Phe Glu Arg Val Glu Asp Ala Ser Ser Phe Pro Leu Asp Tyr Gly180 185 190ATC CGG CGG CTT GAC CAC GCC GTG GGA AAC GTT CCT GAG CTT GGT CCG 624Ile Arg Arg Leu Asp His Ala Val Gly Asn Val Pro Glu Leu Gly Pro195 200 205GCT TTA ACT TAT GTA GCG GGG TTC ACT GGT TTT CAC CAA TTC GCA GAG 672Ala Leu Thr Tyr Val Ala Gly Phe Thr Gly Phe His Gln Phe Ala Glu210 215 220TTC ACA GCA GAC GAC GTT GGA ACC GCC GAG AGC GGT TTA AAT TCA GCG 720Phe Thr Ala Asp Asp Val Gly Thr Ala Glu Ser Gly Leu Asn Ser Ala225 230 235 240GTC CTG GCT AGC AAT GAT GAA ATG GTT CTT CTA CCG ATT AAC GAG CCA 768Val Leu Ala Ser Asn Asp Glu Met Val Leu Leu Pro Ile Asn Glu Pro245 250 255GTG CAC GGA ACA AAG AGG AAG AGT CAG ATT CAG ACG TAT TTG GAA CAT 816Val His Gly Thr Lys Arg Lys Ser Gln Ile Gln Thr Tyr Leu Glu His260 265 270AAC GAA GGC GCA GGG CTA CAA CAT CTG GCT CTG ATG AGT GAA GAC ATA 864Asn Glu Gly Ala Gly Leu Gln His Leu Ala Leu Met Ser Glu Asp Ile275 280 285TTC AGG ACC CTG AGA GAG ATG AGG AAG AGG AGC AGT ATT GGA GGA TTC 912Phe Arg Thr Leu Arg Glu Met Arg Lys Arg Ser Ser Ile Gly Gly Phe290 295 300GAC TTC ATG CCT TCT CCT CCG CCT ACT TAC TAC CAG AAT CTC AAG AAA 960Asp Phe Met Pro Ser Pro Pro Pro Thr Tyr Tyr Gln Asn Leu Lys Lys305 310 315 320CGG GTC GGC GAC GTG CTC AGC GAT GAT CAG ATC AAG GAG TGT GAG GAA 1008Arg Val Gly Asp Val Leu Ser Asp Asp Gln Ile Lys Glu Cys Glu Glu325 330 335TTA GGG ATT CTT GTA GAC AGA GAT GAT CAA GGG ACG TTG CTT CAA ATC 1056Leu Gly Ile Leu Val Asp Arg Asp Asp Gln Gly Thr Leu Leu Gln Ile340 345 350TTC ACA AAA CCA CTA GGT GAC AGG CCG ACG ATA TTT ATA GAG ATA ATC 1104Phe Thr Lys Pro Leu Gly Asp Arg Pro Thr Ile Phe Ile Glu Ile Ile355 360 365CAG AGA GTA GGA TGC ATG ATG AAA GAT GAG GAA GGG AAG GCT TAC CAG 1152Gln Arg Val Gly Cys Met Met Lys Asp Glu Glu Gly Lys Ala Tyr Gln370 375 380AGT GGA GGA TGT GGT GGT TTT GGC AAA GGC AAT TTC TCT GAG CTC TTC 1200Ser Gly Gly Cys Gly Gly Phe Gly Lys Gly Asn Phe Ser Glu Leu Phe385 390 395 400AAG TCC ATT GAA GAA TAC GAA AAG ACT CTT GAA GCC AAA CAG TTA GTG 1248Lys Ser Ile Glu Glu Tyr Glu Lys Thr Leu Glu Ala Lys Gln Leu Val405 410 415GGA TGA ACAAGAAGAA GAACCAACTA AAGGATTGTC TAATTAATGT AAAACTGTTT 1304Gly *TATCTTATCA AAACAATGTA TACAACATCT CATTTAAAAA CGAGATCAAT CC1356(2)SEQ ID NO:13的信息(ⅰ)序列性質(A)長度418個氨基酸(B)類型氨基酸(D)拓撲學線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:13Met Ser Lys Phe Val Arg Lys Asn Pro Lys Ser Asp Lys Phe Lys Val1 5 10 15Lys Arg Phe His His Ile Glu Phe Trp Cys Gly Asp Ala Thr Asn Val20 25 30Ala Arg Arg Phe Ser Trp Gly Leu Gly Met Arg Phe Ser Ala Lys Ser35 40 45Asp Leu Ser Thr Gly Asn Met Val His Ala Ser Tyr Leu Leu Thr Ser50 55 60Gly Asp Leu Arg Phe Leu Phe Thr Ala Pro Tyr Ser Pro Ser Leu Ser65 70 75 80Ala Gly Glu Ile Lys Pro Thr Thr Thr Ala Ser Ile Pro Ser Phe Asp85 90 95His Gly Ser Cys Arg Ser Phe Phe Ser Ser His Gly Leu Gly Val Arg100 105 110Ala Val Ala Ile Glu Val Glu Asp Ala Glu Ser Ala Phe Ser Ile Ser115 120 125Val Ala Asn Gly Ala Ile Pro Ser Ser Pro Pro Ile Val Leu Asn Glu130 135 140Ala Val Thr Ile Ala Glu Val Lys Leu Tyr Gly Asp Val Val Leu Arg145 150 155 160Tyr Val Ser Tyr Lys Ala Glu Asp Thr Glu Lys Ser Glu Phe Leu Pro165 170 175Gly Phe Glu Arg Val Glu Asp Ala Ser Ser Phe Pro Leu Asp Tyr Gly180 185 190Ile Arg Arg Leu Asp His Ala Val Gly Asn Val Pro Glu Leu Gly Pro195 200 205Ala Leu Thr Tyr Val Ala Gly Phe Thr Gly Phe His Gln Phe Ala Glu210 215 220Phe Thr Ala Asp Asp Val Gly Thr Ala Glu Ser Gly Leu Asn Ser Ala225 230 235 240Val Leu Ala Ser Asn Asp Glu Met Val Leu Leu Pro Ile Asn Glu Pro245 250 255Val His Gly Thr Lys Arg Lys Ser Gln Ile Gln Thr Tyr Leu Glu His260 265 270Asn Glu Gly Ala Gly Leu Gln His Leu Ala Leu Met Ser Glu Asp Ile275 280 285Phe Arg Thr Leu Arg Glu Met Arg Lys Arg Ser Ser Ile Gly Gly Phe290 295 300Asp Phe Met Pro Ser Pro Pro Pro Thr Tyr Tyr Gln Asn Leu Lys Lys305 310 315 320Arg Val Gly Asp Val Leu Ser Asp Asp Gln Ile Lys Glu Cys Glu Glu325 330 335Leu Gly Ile Leu Val Asp Arg Asp Asp Gln Gly Thr Leu Leu Gln Ile340 345 350Phe Thr Lys Pro Leu Gly Asp Arg Pro Thr Ile Phe Ile Glu Ile Ile355 360 365Gln Arg Val Gly Cys Met Met Lys Asp Glu Glu Gly Lys Ala Tyr Gln370 375 380Ser Gly Gly Cys Gly Gly Phe Gly Lys Gly Asn Phe Ser Glu Leu Phe385 390 395 400Lys Ser Ile Glu Glu Tyr Glu Lys Thr Leu Glu Ala Lys Gln Leu Val405 410 415Gly *(2)SEQ ID NO:14的信息(ⅰ)序列性質(A)長度1448堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲學線性(ⅱ)分子類型cDNA到mRNA(ⅲ)假設非(ⅳ)最初來源(A)生物體擬南芥(ⅸ)特征(A)名稱/關鍵詞CDS(B)位置9..1346(ⅸ)特征(A)名稱/關鍵詞misc-feature(B)位置9..11(C)其它信息/標準名稱=翻譯起始密碼子(ⅸ)特征(A)名稱/關鍵詞misc-feature(B)位置1344..1346(C)其它信息/標準名稱=翻譯終止密碼子(ⅹⅰ)序列描述SEQ ID NO:14TGAAATCA ATG GGC CAC CAA AAC GCC GCC GTT TCA GAG AAT CAA AAC CAT 50Met Gly His Gln Asn Ala Ala Val Ser Glu Asn Gln Asn Hisl 5 10GAT GAC GGC GCT GCG TCG TCG CCG GGA TTC AAG CTC GTC GGA TTT TCC 98Asp Asp Gly Ala Ala Ser Ser Pro Gly Phe Lys Leu Val Gly Phe Ser15 20 25 30AAG TTC GTA AGA AAG AAT CCA AAG TCT GAT AAA TTC AAG GTT AAG CGC 146Lys Pne Val Arg Lys Asn Pro Lys Ser Asp Lys Phe Lys Val Lys Arg35 40 45TTC CAT CAC ATC GAG TTC TGG TGC GGC GAC GCA ACC AAC GTC GCT CGT 194Phe His His Ile Glu Phe Trp Cys Gly Asp Ala Thr Asn Val Ala Arg50 55 60CGC TTC TCC TGG GGT CTG GGG ATG AGA TTC TCC GCC AAA TCC GAT CTT 242Arg Phe Ser Trp Gly Leu Gly Met Arg Phe Ser Ala Lys Ser Asp Leu65 70 75TCC ACC GGA AAC ATG GTT CAC GCC TCT TAC CTA CTC ACC TCC GGT GAC 290Ser Thr Gly Asn Met Val His Ala Ser Tyr Leu Leu Thr Ser Gly Asp80 85 90CTC CGA TTC CTT TTC ACT GCT CCT TAC TCT CCG TCT CTC TCC GCC GGA 338Leu Arg Phe Leu Phe Thr Ala Pro Tyr Ser Pro Ser Leu Ser Ala Gly95 100105 110GAG ATT AAA CCG ACA ACC ACA GCT TCT ATC CCA AGT TTC GAT CAC GGC 386Glu Ile Lys Pro Thr Thr Thr Ala Ser Ile Pro Ser Phe Asp His Gly115 120 125TCT TGT CGT TCC TTC TTC TCT TCA CAT GGT CTC GGT GTT AGA GCC GTT 434Ser Cys Arg Ser Phe Phe Ser Ser His Gly Leu Gly Val Arg Ala Val130 135 140GCG ATT GAA GTA GAA GAC GCA GAG TCA GCT TTC TCC ATC AGT GTA GCT 482Ala Ile Glu Val Glu Asp Ala Glu Ser Ala Phe Ser Ile Ser Val Ala145 150 155AAT GGC GCT ATT CCT TCG TCG CCT CCT ATC GTC CTC AAT GAA GCA GTT 530Asn Gly Ala Ile Pro Ser Ser Pro Pro Ile Val Leu Asn Glu Ala Val160 165 170ACG ATC GCT GAG GTT AAA CTA TAC GGC GAT GTT GTT CTC CGA TAT GTT 578Thr Ils Ala Glu Val Lys Leu Tyr Gly Asp Val Val Leu Arg Tyr Val175 180 185 190AGT TAC AAA GCA GAA GAT ACC GAA AAA TCC GAA TTC TTG CCA GGG TTC 626Ser Tyr Lys Ala Glu Asp Thr Glu Lys Ser Glu Phe Leu Pro Gly Phe195 200 205GAG CGT GTA GAG GAT GCG TCG TCG TTC CCA TTG GAT TAT GGT ATC CGG 674Glu Arg Val Glu Asp Ala Ser Ser Phe Pro Leu Asp Tyr Gly Ile Arg210 215 220CGG CTT GAC CAC GCC GTG GGA AAC GTT CCT GAG CTT GGT CCG GCT TTA 722Arg Leu Asp His Ala Val Gly Asn Val Pro Glu Leu Gly Pro Ala Leu225 230 235ACT TAT GTA GCG GGG TTC ACT GGT TTT CAC CAA TTC GCA GAG TTC ACA 770Thr Tyr Val Ala Gly Phe Thr Gly Phe His Gln Phe Ala Glu Phe Thr240 245 250GCA GAC GAC GTT GGA ACC GCC GAG AGC GGT TTA AAT TCA GCG GTC CTG 818Ala Asp Asp Val Gly Thr Ala Glu Ser Gly Leu Asn Ser Ala Val Leu255 260 265 270GCT AGC AAT GAT GAA ATG GTT CTT CTA CCG ATT AAC GAG CCA GTG CAC 866Ala Ser Asn Asp Glu Met Val Leu Leu Pro Ile Asn Glu Pro Val His275 280 285GGA ACA AAG AGG AAG AGT CAG ATT CAG ACG TAT TTG GAA CAT AAC GAA 914Gly Thr Lys Arg Lys Ser Gln Ile Gln Thr Tyr Leu Glu His Asn Glu290 295 300GGC GCA GGG CTA CAA CAT CTG GCT CTG ATG AGT GAA GAC ATA TTC AGG 962Gly Ala Gly Leu Gln His Leu Ala Leu Met Ser Glu Asp Ile Phe Arg305 310 315ACC CTG AGA GAG ATG AGG AAG AGG AGC AGT ATT GGA GGA TTC GAC TTC 1010Thr Leu Arg Glu Met Arg Lys Arg Ser Ser Ile Gly Gly Phe Asp Phe320 325 330ATG CCT TCT CCT CCG CCT ACT TAC TAC CAG AAT CTC AAG AAA CGG GTC 1058Met Pro Ser Pro Pro Pro Thr Tyr Tyr Gln Asn Leu Lys Lys Arg Val335 340 345 350GGC GAC GTG CTC AGC GAT GAT CAG ATC AAG GAG TGT GAG GAA TTA GGG 1106Gly Asp Val Leu Ser Asp Asp Gln Ile Lys Glu Cys Glu Glu Leu Gly355 360 365ATT CTT GTA GAC AGA GAT GAT CAA GGG ACG TTG CTT CAA ATC TTC ACA 1154Ile Leu Val Asp Arg Asp Asp Gln Gly Thr Leu Leu Gln Ile Phe Thr370 375 380AAA CCA CTA GGT GAC AGG CCG ACG ATA TTT ATA GAG ATA ATC CAG AGA 1202Lys Pro Leu Gly Asp Arg Pro Thr Ile Phe Ile Glu Ile Ile Gln Arg385 390 395GTA GGA TGC ATG ATG AAA GAT GAG GAA GGG AAG GCT TAC CAG AGT GGA 1250Val Gly Cys Met Met Lys Asp Glu Glu Gly Lys Ala Tyr Gln Ser Gly400 405 410GGA TGT GGT GGT TTT GGC AAA GGC AAT TTC TCT GAG CTC TTC AAG TCC 1298Gly Cys Gly Gly Phe Gly Lys Gly Asn Phe Set Glu Leu Phe Lys Ser415 420 425 430ATT GAA GAA TAC GAA AAG ACT CTT GAA GCC AAA CAG TTA GTG GGA TGA 1346Ile Glu Glu Tyr Glu Lys Thr Leu Glu Ala Lys Gln Leu Val Gly *435 440 445ACAAGAAGAA GAACCAACTA AAGGATTGTG TAATTAATGT AAAACTGTTT TATCTTATCA1406AAACAATGTA TACAACATCT CATTTAAAAA CGAGATCAAT CC 1448(2)SEQ ID NO:15的信息(ⅰ)序列性質(A)長度446個氨基酸(B)類型氨基酸(D)拓撲學線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:15Met Gly His Gln Asn Ala Ala Val Ser Glu Asn Gln Asn His Asp Asp1 5 10 15Gly Ala Ala Ser Ser Pro Gly Phe Lys Leu Val Gly Phe Ser Lys Phe20 25 30Val Arg Lys Asn Pro Lys Ser Asp Lys Phe Lys Val Lys Arg Phe His35 40 45His Ile Glu Phe Trp Cys Gly Asp Ala Thr Asn Val Ala Arg Arg Phe50 55 60Ser Trp Gly Leu Gly Met Arg Phe Ser Ala Lys Ser Asp Leu Ser Thr65 70 75 80Gly Asn Met Val His Ala Ser Tyr Leu Leu Thr Ser Gly Asp Leu Arg85 90 95Phe Leu Phe Thr Ala Pro Tyr Ser Pro Ser Leu Ser Ala Gly Glu Ile100 105 110Lys Pro Thr Thr Thr Ala Ser Ile Pro Ser Phe Asp His Gly Ser Cys115 120 125Arg Ser Phe Phe Ser Ser His Gly Leu Gly Val Arg Ala Val Ala Ile130 135 140Glu Val Glu Asp Ala Glu Ser Ala Phe Ser Ile Ser Val Ala Asn Gly145 150 155 160Ala Ile Pro Ser Ser Pro Pro Ile Val Leu Asn Glu Ala Val Thr Ile165 170 175Ala Glu Val Lys Leu Tyr Gly Asp Val Val Leu Arg Tyr Val Ser Tyr180 185 190Lys Ala Glu Asp Thr Glu Lys Ser Glu Phe Leu Pro Gly Phe Glu Arg195 200 205Val Glu Asp Ala Ser Ser Phe Pro Leu Asp Tyr Gly Ile Arg Arg Leu210 215 220Asp His Ala Val Gly Asn Val Pro Glu Leu Gly Pro Ala Leu Thr Tyr225 230 235 240Val Ala Gly Phe Thr Gly Phe His Gln Phe Ala Glu Phe Thr Ala Asp245 250 255Asp Val Gly Thr Ala Glu Ser Gly Leu Asn Ser Ala Val Leu Ala Ser260 265 270Asn Asp Glu Met Val Leu Leu Pro Ile Asn Glu Pro Val His Gly Thr275 280 285Lys Arg Lys Ser Gln Ile Gln Thr Tyr Leu Glu His Asn Glu Gly Ala290 295 300Gly Leu Gln His Leu Ala Leu Mer Ser Glu Asp Ile Phe Arg Thr Leu305 310 315 320Arg Glu Met Arg Lys Arg Ser Ser Ile Gly Gly Phe Asp Phe Met Pro325 330 335Ser Pro Pro Pro Thr Tyr Tyr Gln Asn Leu Lys Lys Arg Val Gly Asp340 345 350Val Leu Ser Asp Asp Gln Ile Lys Glu Cys Glu Glu Leu Gly Ile Leu355 360 365Val Asp Arg Asp Asp Gln Gly Thr Leu Leu Gln Ile Phe Thr Lys Pro370 375 380Leu Gly Asp Arg Pro Thr Ile Phe Ile Glu Ile Ile Gln Arg Val Gly385 390 395 400Cys Met Met Lys Asp Glu Glu Gly Lys Ala Tyr Gln Ser Gly Gly Cys405 410 415Gly Gly Phe Gly Lys Gly Asn Phe Ser Glu Leu Phe Lys Ser Ile Glu420 425 430Glu Tyr Glu Lys Thr Leu Glu Ala Lys Gln Leu Val Gly435 440 445(2)SEQ ID NO:16的信息(ⅰ)序列性質(A)長度513堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲學線性(ⅱ)分子類型cDNA到mRNA(ⅲ)假設非(ⅵ)最初來源(A)生物體Vernonia galamenensis(ⅶ)中間來源(B)克隆vsl.pkOO15.b2(ⅹⅰ)序列描述SEQ ID NO:16CCACACCGAT TGCCGGAACT TCACCGCCTC TCACGGCCTT GCAGTCCGAG CAATCGCCAT 60TGAAGTCGAT GACGCCGAAT TAGCTTTCTC CGTCAGCGTC TCTCACGGCG CTAAACCCTC120CGCTGCTCCT GTAACCCTTG GAAACAACGA CGTCGTATTG TCTGAAGTTA AGCTTTACGG180CGATGTCGCT TTCCGGTACA TAAGTTACAA AAATCCGAAC TATACATCTT CCTTTTTGCC240CGGGTTCGAG CCCGTTGAAA AGACGTCGTC GTTTTATGAC CTTGACTACG GTATCCGCCG300TTTGGACCAC GCCGTAGGNA ACGTCCCTGA GCTTGCTTCG GCAGTGGACT ACGTGAAATC360ATTCACCGGA TTCCATGAGT TCGCCGAATT CACCGCGGAG GACGTCGGGA CGAGCGAGAG420GGAACTGAAT TCGGTCGTTT TAGCTTGCAA CAGTGAGATG GTCTTGATTC CGATGAACGA480GCCGGTGTAC GGAANAAAAG GAAGNAGCCA GAT 51權利要求
1 編碼植物對羥基苯丙酮酸雙加氧酶的分離核酸片段,該片段包括選自以下的核苷酸序列編碼包括描述在SEQ ID NO:3,SEQ ID NO:11,SEQ ID NO:13和SEQ ID NO:15中的一條多肽的核苷酸序列和與SEQ ID NO:2,SEQ ID NO:10,SEQ ID NO:12和SEQ ID NO:14的核苷酸序列基本類似的修飾核苷酸序列,在序列中含有不影響編碼蛋白功能特性的缺失、插入或替換。
2 編碼植物對羥基苯丙酮酸雙加氧酶的分離核酸片段,該片段含有描述在SEQ ID NO:14的核苷酸序列。
3 含有操縱連接于至少一種合適的調節序列的權利要求1或權利要求2的核酸片段的嵌合基因。
4 權利要求3的嵌合基因,其中至少一個合適的調節序列指導基因在微生物中表達。
5 權利要求3的嵌合基因,其中至少一個合適的調節序列指導基因在植物中表達。
6 包含操縱連接至少一種合適調節序列的權利要求1或權利要求2的核酸片段的質粒載體。
7 包含宿主細胞和權利要求6的質粒載體的轉化宿主細胞。
8 權利要求7的轉化宿主細胞,其中宿主細胞來自植物或為微生物。
9 權利要求8的轉化宿主細胞,其中微生物是大腸桿菌。
10 能耐受與至少一種在非轉化植物中抑制對羥基苯丙酮酸雙加氧酶反應速率的化合物接觸的轉化植物,該轉化植物含有權利要求3的嵌合基因和宿主植物。
11 權利要求10的轉化植物,其中宿主植物是谷類作物。
12 鑒定能抑制對羥基苯丙酮酸雙加氧酶反應速率的化合物的方法,包括(a)用權利要求6的質粒載體轉化宿主細胞;(b)促進編碼植物對羥基苯丙酮酸雙加氧酶的核酸片段的表達;(c)用一測試化合物接觸來自步驟(b)的表達酶;(d)評估測試化合物抑制對羥基苯丙酮酸雙加氧酶反應速率的能力。
13 權利要求12的方法,其中通過測定氧的利用,二氧化碳的釋放,尿黑酸的產生,對羥基苯丙酮酸的減少或馬來酰乙酰乙酸的產生,來評估測試化合物抑制對羥基苯丙酮酸雙加氧酶反應速率的能力。
14 權利要求12的方法,其中轉化的宿主細胞是含編碼植物對羥基苯丙酮酸雙加氧酶的嵌合基因的大腸桿菌。
15 抑制植物對羥基苯丙酮酸雙加氧酶活性的化合物,該化合物用權利要求14的方法鑒定。
16 使植物耐受至少一種抑制對羥基苯丙酮酸雙加氧酶反應速率的化合物的方法,包括(a)用包含編碼植物對羥基苯丙酮酸雙加氧酶的核酸片段的嵌合基因轉化宿主植物細胞,和(b)表達嵌合基因,其量可以使轉化植物基本上耐受至少一種抑制對羥基苯丙酮酸雙加氧酶反應速率的化合物。
17 微生物生產活生植物對羥基苯丙酮酸雙加氧酶的方法,包括(a)用權利要求4的編碼植物對羥基苯丙酮酸雙加氧酶的嵌合基因穩定轉化微生物;(b)促進嵌合基因在合適的時期表達;(c)回收活性植物對羥基苯丙酮酸雙加氧酶。
18 在植物中過量表達對羥基苯丙酮酸雙加氧酶的方法,包括(a)用一種嵌合DNA分子穩定轉化宿主植物細胞,該嵌合DNA分子包含至少一個拷貝在植物細胞中驅動相連的編碼序列表達的合適啟動子,該啟動子與至少一個拷貝的同源或異源對羥基苯丙酮酸雙加氧酶編碼序列操縱連接;和(b)使步驟(a)的轉化宿主植物細胞生長。
19 權利要求18的方法,其中嵌合DNA分子是權利要求5的嵌合基因。
20 一種分離的核酸片段,包括選自以下的成員(a)一種描述在SEQ ID NO:16中的分離核酸片段;(b)一種基本上類似于描述在SEQ ID NO:16中的分離核酸片段的分離核酸片段;和(c)一種與(a)或(b)互補的分離核酸片段。
全文摘要
本發明涉及編碼來自植物中的對羥基苯丙酮酸雙加氧酶的核酸的分離和修飾。這些核酸序列用來建立抑制該酶活性的新除草劑化合物的鑒定方法,及制備能耐受這種酶的抑制劑的除草作用的新作物。包括含有編碼對羥基苯丙酮酸雙加氧酶的核酸序列的全部或部分的核酸片段的嵌合基因可用在微生物中生產活性植物對羥基苯丙酮酸雙加氧酶,還引起在植物中該酶修飾形式的產生,使得這種植物耐受該酶的抑制劑。
文檔編號C12N15/82GK1223688SQ97195920
公開日1999年7月21日 申請日期1997年6月26日 優先權日1997年6月26日
發明者C·A·馬克斯維爾, P·A·斯克爾尼克, V·A·維藤巴赫, S·古特里德格 申請人:納幕爾杜邦公司