植物調控元件及其用途
【專利摘要】本發明提供可用于調節植物中的基因表達的DNA分子和構建體及其核苷酸序列。還提供包含與異源可轉錄多核苷酸可操作地連接的DNA分子的轉基因植物、植物細胞、植物部分和種子以及它們的使用方法。
【專利說明】植物調控元件及其用途
[0001] 相關申請的引用
[0002] 本申請要求2012年4月20日提交的美國臨時申請No. 61/635, 945和2013年3 月14日提交的美國非臨時申請No. 13/830,403的權益,其通過引用全文合并到本文中。
[0003] 序列表的并入
[0004] 包含在2013年4月10日建立的22千字節(如在Microsoft Windows?中測 量的)的名稱為"M0NS326W0_ST25. txt"的文件中的序列表通過電子提交與本申請一起提 交并通過引用合并到本文中。 發明領域
[0005] 本發明涉及植物分子生物學和植物遺傳工程領域。更特別地,本發明涉及可用于 調節植物中的基因表達的DNA分子。
[0006] 發明背景
[0007] 調控元件是通過調節與可操作地連接的可轉錄多核苷酸分子的轉錄而調節基因 活性的遺傳元件。這樣的元件包括啟動子、前導序列、內含子和3'非翻譯區且可用于植物 分子生物學和植物遺傳工程領域中。
[0008] 表達賦予植物在冷和濕應激條件下萌發過程中的優勢的轉基因的轉基因作物需 要具有在最有利于表達這樣的轉基因的組織中的表達模式的調控元件。這樣的調控元件應 當在發育的種子中充分地表達以使得能夠儲存可以在種子于冷和/或濕條件下萌發時快 速發揮作用的轉基因產物以及提供在萌發和出苗的早期階段中的表達。因此,本發明提供 在發育和萌發的種子中表現出較高表達水平且可用于驅動在冷和/或濕萌發條件下提供 益處的轉基因表達的新型調控元件。
【發明內容】
[0009] 本發明提供用于植物中的新型基因調控元件。本發明還提供包含該調控元件的 DNA構建體。本發明還提供包含該調控元件的轉基因植物細胞、植物和種子。可以提供與可 轉錄多核苷酸分子可操作地連接的序列。在一個實施方案中,可轉錄多核苷酸分子相對于 本文中提供的調控序列可以是異源的。在特定的實施方案中,本發明提供的調控元件序列 因此可以定義為與異源可轉錄多核苷酸分子可操作地連接。本發明還提供制備和使用該調 控元件、包含該調控元件的DNA構建體及包含與可轉錄多核苷酸分子可操作地連接的該調 控元件的轉基因植物細胞、植物和種子的方法。
[0010] 在一個方面中,本發明提供包含選自下組的DNA序列的DNA分子:(a)與SEQ ID N0:l、2、3、4、6或8中任一具有至少85%序列同一性的序列;(b)包含SEQIDN0 :l、2、3、4、 6或8中任一的序列;和(C)SEQ ID NO: 1、2、3、4、6或8中任一的片段,其中所述片段具有 基因調控活性,其中所述序列與異源可轉錄多核苷酸分子可操作地連接。在一個實施方案 中,DNA分子與SEQ ID N0:l、2、3、4、6或8中任一的DNA序列具有至少約90%序列同一性。 在另一個實施方案中,DNA分子與SEQ ID NO: 1、2、3、4、6或8中任一的DNA序列具有至少 95%序列同一性。在另一個實施方案中,DNA序列包含基因調控活性。在又另一個實施方 案中,異源可轉錄多核苷酸分子包含具有農學意義的基因。在其它實施方案中,具有農學意 義的基因賦予植物的除草劑耐受性或害蟲抗性。
[0011] 在另一個方面中,本發明提供包含異源DNA分子的轉基因植物細胞,該異源DNA分 子包含選自下組的序列:(a)與SEQ ID NO: 1、2、3、4、6或8中任一具有至少約85%序列同 一性的序列;(b)包含 SEQ ID N0:l、2、3、4、6 或 8 中任一的序列;和(c)SEQ ID N0:l、2、3、 4、6或8中任一的片段,其中所述片段具有基因調控活性,其中所述序列與異源可轉錄多核 苷酸分子可操作地連接。在多個實施方案中,轉基因植物細胞可以是單子葉植物細胞或雙 子葉植物細胞。
[0012] 在其它實施方案中,本發明提供轉基因植物或其部分,其包含選自下組的DNA分 子:(a)與SEQ ID N0:l、2、3、4、6或8中任一具有至少約85%序列同一性的序列;(b)包 含 SEQ ID N0:l、2、3、4、6 或 8 中任一的序列;和(c)SEQ ID N0:l、2、3、4、6 或 8 中任一的片 段,其中所述片段具有基因調控活性,其中所述序列與異源可轉錄多核苷酸分子可操作地 連接。在另一個實施方案中,本發明提供這種轉基因植物的任何代的后代植物或其部分, 其中所述后代植物或部分包含如上所述的DNA分子。在又另一個實施方案中,本發明提供 轉基因種子,其中所述種子包含如上所述的DNA分子。
[0013] 在另一個方面中,本發明提供包含選自SEQ ID NO: 1、6和8的轉錄調控表達元件 組的轉基因盒,其中所述轉錄調控表達元件組與異源編碼序列可操作地連接,該異源編碼 序列與選自SEQ ID N0:10、ll、12和13的3'UTR可操作地連接。在一個實施方案中,轉基因 盒包含如SEQ ID NO: 1所示的轉錄調控表達元件組,其中所述轉錄調控表達元件組與異源 編碼序列可操作地連接,該異源編碼序列與如SEQ ID NO: 10所示的3' UTR可操作地連接。 在另一個實施方案中,轉基因盒包含如SEQ ID N0:6所示的轉錄調控表達元件組,其中所述 轉錄調控表達元件組與異源編碼序列可操作地連接,該異源編碼序列與選自SEQ ID NO: 11 和12的3'UTR可操作地連接。在又另一個實施方案中,轉基因盒包含如SEQ ID NO: 8所示 的轉錄調控表達元件組,其中所述轉錄調控表達元件組與異源編碼序列可操作地連接,該 異源編碼序列與選自SEQ ID N0:12和13的3'UTR可操作地連接。在另一個實施方案中,本 發明提供生產商品的方法,包括獲得包含選自下組的DNA序列的轉基因植物或其部分:(a) 與SEQ ID NO: 1、2、3、4、6或8中任一具有至少約85%序列同一性的序列;(b)包含SEQ ID N0:l、2、3、4、6或8中任一的序列;和(c)SEQIDN0:l、2、3、4、6或8中任一的片段,其中所 述片段具有基因調控活性,其中所述序列與異源可轉錄多核苷酸分子可操作地連接;和從 該轉基因植物或其部分生產商品。在一個實施方案中,所述商品是蛋白質濃縮物、蛋白質分 離物、籽粒、淀粉、種子、粗粉、面粉、生物質或種子油。
[0014] 在另一個方面中,本發明提供表達可轉錄多核苷酸分子的方法,包括獲得包含選 自下組的DNA序列的轉基因植物:(a)與SEQ ID NO: 1、2、3、4、6或8中任一具有至少約85% 序列同一性的序列;(b)包含SEQ ID NO: 1、2、3、4、6或8中任一的序列;和(c)SEQ ID NO: 1、 2、3、4、6或8中任一的片段,其中所述片段具有基因調控活性,其中所述序列與異源可轉錄 多核苷酸分子可操作地連接;和栽培植物,其中所述可轉錄多核苷酸被表達。
[0015] 附圖簡要說明
[0016] 圖1 -顯示通過不同轉基因盒結構賦予的轉基因發育玉米胚和胚乳組織中的 β-葡萄糖醛酸苷酶(⑶s)表達。各轉基因盒結構由與轉錄調控表達元件組EXP-Zm. Nac+Os. FBA:I:I(SEQ ID NO:6)和 EXP-Zm. Nac+Os. Cab-1:1:1(SEQ ID NO:8)及 3' UTR T-〇s.CLUS33428J-l:l:l(SEQ ID N0:ll)、T-0s.Mth-l:l:l(SEQ ID N0:12)和!^^· Ara5-1:1:1 (SEQ ID NO: 13)可操作地連接的⑶S編碼序列組成,如實施例3的表3中所示。
[0017] 圖2-顯示通過不同轉基因盒結構賦予的所選擇轉基因玉米組織中的β-葡 萄糖醛酸苷酶(⑶S)表達。各轉基因盒結構由與轉錄調控表達元件組EXP-Zm. Nac+Os. FBA:1:1(SEQ ID NO:6)和 EXP-Zm. Nac+Os. Cab-1:1:1(SEQ ID NO:8) &3'UTRT-〇s. CLUS33428j-l:l:l(SEQ ID N0:ll)、T-0s.Mth_l:l:l(SEQ ID N0:12)和1'-〇8· Ara5-1:1:1 (SEQ ID NO: 13)可操作地連接的⑶S編碼序列組成,如實施例3的表3中所示。
[0018] 序列的簡要說明
[0019] SEQ ID NO: 1-轉錄調控表達元件組或 EXP(EXP-Zm. Nac+Zm. DnaK: 1:1)的序 列,其由與前導序列L-Zm.Nac-l:l:l(SEQ ID N0:4)可操作地5'連接的啟動子P-Zm. Nac-1:1:2(SEQ ID N0:3)組成,該前導序列與內含子I-Zm. DnaK-1:1:1 (SEQ ID N0:5)可操 作地連接。
[0020] SEQ ID NO:2-由與前導序列 L-Zm. Nac-1:1:1 (SEQ ID NO:4)可操作地 5' 連接的 啟動子 P-Zm. Nac-1:1:2 (SEQ ID NO:3)組成的序列。
[0021] SEQ ID NO:3-啟動子 P-Zm. Nac-1:1:2 的序列。
[0022] SEQ ID NO:4-前導序列 L-Zm. Nac-1:1:1 的序列。
[0023] SEQ ID NO:5-內含子 I-Zm. DnaK-1:1:1 的序列。
[0024] SEQ ID N0:6-轉錄調控表達元件組或 EXP(EXP-Zm.Nac+0s.FBA:l:l)的序 列,其由與前導序列L-Zm.Nac-l:l:l(SEQ ID N0:4)可操作地5'連接的啟動子P-Zm. Nac-1:1:2(SEQ ID N0:3)組成,該前導序列與內含子 Ι-Os. FBA-1-1:1:1(SEQ ID N0:7)可 操作地連接。
[0025] SEQ ID NO:7-內含子 Ι-Os. FBA-1-1:1:1 的序列。
[0026] SEQ ID NO:8_ 轉錄調控表達元件組或 EXP(EXP-Zm. Nac+0s. Cab-1:1:1)的序 列,其由與前導序列L-Zm.Nac-l:l:l(SEQ ID N0:4)可操作地5'連接的啟動子P-Zm. Nac-1:1:2(SEQ ID N0:3)組成,該前導序列與內含子 I-〇s.Cab-l-l:l:l(SEQ ID N0:9)可 操作地連接。
[0027] SEQ ID NO:9-內含子 Ι-Os. Cab-1-1:1:1 的序列。
[0028] SEQ ID NO: 10-3,UTR T-AGRtu. nos-1:1:13 的序列。
[0029] SEQ ID N0:ll-3,UTR T-Os. CLUS33428_1-1:1:1 的序列。
[0030] SEQ ID NO: 12-3,UTR T-Os. Mth-1:1:1 的序列。
[0031] SEQ ID NO: 13-3, UTR T-Os. Ara5-1:1:1 的序列。
[0032] SEQ ID NO: 14-β-葡萄糖醛酸苷酶標記基因的編碼序列。
[0033] SEQ ID NO: 15-轉錄調控表達元件組或EXP(EXP-CaMV. 35S: 1:1)的序列,其包含花 椰菜花葉病毒(CaMV) 35S啟動子和前導序列。
[0034] SEQ ID NO: 16-轉錄調控表達元件組或EXP(EXP-Os. Actl: 1:1)的序列,其包含水 稻肌動蛋白1啟動子、前導序列和內含子。
[0035] 本發明的詳細說明
[0036] 本發明提供來自植物物種的具有有益的基因調控活性的新型多核苷酸分子。本發 明還提供包含調控元件的DNA構建體以及包含調控元件的轉基因植物細胞、植物和種子。 這些多核苷酸分子的核苷酸序列提供為SEQ ID NO: 1、2、3、4、6和8。本發明提供了這些多 核苷酸分子的設計、構建和用途。這些多核苷酸分子能夠例如影響植物組織中可操作地連 接的可轉錄多核苷酸分子的表達,并因此選擇性地調節轉基因植物中編碼的基因產物的基 因表達或活性。本發明還提供制備和使用該調控元件的方法、包含啟動子和/或其它公開 的核苷酸序列的DNA構建體及制備和使用該DNA構建體的方法。本發明還提供包含與可轉 錄多核苷酸分子可操作地連接的調控元件的轉基因植物細胞、植物和種子以及轉化的宿主 細胞。
[0037] 可以提供與可轉錄多核苷酸分子可操作地連接的根據本發明的DNA序列。在一個 實施方案中,可轉錄多核苷酸分子相對于本文中提供的調控序列可以是異源的。在特定實 施方案中,本發明提供的調控元件序列因此可以定義為與異源可轉錄多核苷酸分子可操作 地連接。
[0038] 以下定義和方法提供用于更好地限定本發明和指導本領域普通技術人員實施本 發明。除非另外注明,術語按照相關領域的普通技術人員的常規用法來理解。
[0039] DNA 分子
[0040] 如本文中使用的,術語"DNA"或"DNA分子"是指基因組或合成來源的雙鏈DNA分 子,即脫氧核糖核苷酸堿基的聚合物或多核苷酸分子,其從5'(上游)末端至3'(下游)末 端閱讀。如本文中使用的,術語"DNA序列"是指DNA分子的核苷酸序列。本文中使用的專門 術語對應于美國聯邦管理法規§ 1. 822的法令37的專門術語,且在WIPO標準ST. 25 (1998) 附件2,表1和3的表格中給出。
[0041] 如本文中使用的,術語"分離的DNA分子"是指至少部分地與在其原始或天然狀態 中正常相關的其它分子分離的DNA分子。在一個實施方案中,術語"分離的"是指至少部分 地與在其原始或天然狀態中正常側鄰DNA分子的部分核酸分離的DNA分子。因此,與通常 不相關的調控或編碼序列融合(例如,作為重組技術的結果)的DNA分子在本文中被認為 是分離的。這樣的分子在整合到宿主細胞的染色體中或存在于具有其它DNA分子的核酸溶 液中時被認為是分離的,因為它們不是處于其原始狀態。
[0042] 本領域技術人員公知的多種方法可用于分離和操作DNA分子或其片段,如本發明 中公開的。例如,聚合酶鏈反應(PCR)技術可用于擴增特定起始DNA分子和/或產生原始 分子的變體。DNA分子或其片段也可以通過其它技術獲得,如通過化學手段直接合成片段, 如通常通過使用自動寡核苷酸合成儀實施的。
[0043] 如本文中使用的,術語"序列同一性"是指兩個最佳比對的多核苷酸序列或兩個最 佳比對的多肽序列相同的程度。最佳序列比對通過人工比對兩個序列(例如,參比序列和 另一序列)以最大化具有適宜內部核苷酸插入、刪除或空位的序列比對中核苷酸匹配的數 目而產生。如本文中使用的,術語"參比序列"是指如SEQ ID NO: 1、2、3、4、6和8的多核苷 酸序列提供的序列。
[0044] 如本文中使用的,術語"百分序列同一性"或"百分同一性"或" %同一性"是同一 性分數乘以1〇〇。與參比序列最佳比對的序列的"同一性分數"是最佳比對中核苷酸匹配的 數目除以參比序列中核苷酸的總數,例如整個參比序列的全長中核苷酸的總數。因此,在一 個實施方案中,本發明提供包含與參比序列(本文中提供為SEQ ID NO: 1、2、3、4、6和8)最 佳比對時具有與參比序列的至少約85 %同一性、至少約90 %同一性、至少約95 %同一性、 至少約96%同一性、至少約97%同一性、至少約98%同一性或至少約99%同一性的序列。 在特定實施方案中,這樣的序列可以定義為具有基因調控活性。
[0045] 調控元件
[0046] 調控元件是具有基因調控活性的DNA分子,即具有影響可操作地連接的可轉錄多 核苷酸分子的轉錄和/或翻譯的能力的DNA分子。術語"基因調控活性"因此指的是通過影 響可操作地連接的可轉錄多核苷酸分子的轉錄和/或翻譯來影響可操作地連接的可轉錄 多核苷酸分子的表達模式的能力。如本文中使用的,轉錄調控表達元件組(EXP)可以由可 操作地連接的表達元件如增強子、啟動子、前導序列和內含子組成。因此,轉錄調控表達元 件組可以由例如與前導序列可操作地5'連接的啟動子連接,而前導序列依次可操作地5' 連接內含子序列。內含子序列可以由在原始序列的第一內含子/外顯子剪接結合點處開始 的序列組成并可以進一步由包含第二內含子/外顯子剪接結合的小前導序列片段組成,從 而提供正確的內含子/外顯子加工以有助于所得轉錄物的轉錄和正確加工。前導序列和內 含子可以正向影響可操作地連接的可轉錄多核苷酸分子的轉錄以及所得的轉錄RNA的翻 譯。預加工的RNA分子包含前導序列和內含子,其可以影響轉錄RNA的轉錄后加工和/或 轉錄RNA分子從細胞核到細胞質的輸出。在轉錄RNA分子的轉錄后加工后,前導序列可以 保留作為最終信使RNA的部分且可以正向影響信使RNA分子的翻譯。
[0047] 調控元件如啟動子、前導序列、內含子和轉錄終止區是具有基因調控活性并在活 細胞中基因的總體表達中發揮總體部分的DNA分子。術語"調控元件"是指具有基因調控 活性的DNA分子,即具有影響可操作地連接的可轉錄多核苷酸分子的轉錄和/或翻譯的能 力的DNA分子。在植物中具有功能的分離的調控元件如啟動子和前導序列因此可用于通過 遺傳工程的方法改變植物表型。
[0048] 調控元件可以特征在于其表達模式效應(定性地和/或定量地),例如,正或負效 應和/或組成型或其它效應,如特征在于其時間、空間、發育、組織、環境、生理、病理、細胞 周期和/或化學反應表達模式及其任何組合,以及特征在于定量或定性指示。啟動子可以 用作用于調節可操作地連接的可轉錄多核苷酸分子的表達的調控元件。
[0049] 如本文中使用的,"基因表達模式"是可操作地連接的DNA分子轉錄成轉錄RNA分 子的任何轉錄模式。轉錄RNA分子可以被翻譯以產生蛋白質分子或可以提供反義或其它調 控 RNA 分子,如 mRNA、dsRNA、tRNA、rRNA、miRNA 等等。
[0050] 如本文中使用的,術語"蛋白質表達"是轉錄RNA分子翻譯成蛋白質分子的任何翻 譯模式。蛋白質表達可以特征在于其時間、空間、發育或形態特性,以及特征在于定量或定 性指示。
[0051] 如本文中使用的,術語"啟動子" 一般是指參與RNA聚合酶II和其它蛋白質(反 式作用轉錄因子)的識別和結合以啟動轉錄的DNA分子。啟動子最初可以從基因的基因組 拷貝的5'非翻譯區(5'UTR)分離。或者,啟動子可以是合成產生或操作的DNA分子。啟動 子也可以是嵌合的,即通過兩個或更多個異源DNA分子的融合產生的啟動子。用于實施本 發明的啟動子可以包括SEQ ID N0:3或其片段或變體。在本發明的特定實施方案中,如本 文中描述的這樣的分子及其任何變體或衍生物進一步定義為包含啟動子活性,即能夠在宿 主細胞中(如在轉基因植物中)作為啟動子發揮作用。在再進一步的特定實施方案中,片 段可以定義為表現出其所來源的起始啟動子分子所具有的啟動子活性,或者片段可以包含 提供基礎轉錄水平且由TATA盒或用于RNA聚合酶II的識別和結合以啟動轉錄的等同序列 組成的"最小啟動子"。
[0052] 在一個實施方案中,本發明提供如本文中公開的啟動子序列的片段。啟動子片段 可以包含如上所述的啟動子活性,且可以單獨地或與其它啟動子和啟動子片段結合使用, 如用于構建嵌合啟動子。在特定實施方案中,提供了包含本文中公開的具有啟動子活性的 多核苷酸分子的至少約50、95、150、250、500、750或至少約1000個連續核苷酸或更長的啟 動子片段。
[0053] 例如,由如SEQ ID N0:3所示的啟動子衍生的組合物如內部或5'刪除可以使用本 領域中已知的方法產生以改善或改變表達,包括通過移除對表達具有正或負效應的元件、 重復對表達具有正或負效應的元件和/或重復或移除對表達具有組織或細胞特異性效應 的元件。由如SEQ ID NO: 3所示的啟動子衍生的、由其中TATA盒元件或其等同序列及下游 序列被移除的3'刪除組成的組合物可以例如用于形成增強子元件。可以進行進一步的刪 除以移除對表達具有正或負、組織特異性、細胞特異性或時間特異性(例如,但不限于晝夜 節律)效應的任何元件。如SEQ ID N0:3所示的啟動子及由該啟動子衍生的片段或增強子 可以用于形成包含與其它增強子和啟動子可操作地連接的如SEQ ID N0:3所示的啟動子及 由該啟動子衍生的片段或增強子的嵌合轉錄調控元件組合物。本文中描述的修飾、重復或 刪除對于特定轉基因的所需表達特征的效率可以在穩定和瞬時植物分析(如本文中工作 實施例中描述的那些)中經驗地測試以驗證結果,其可以根據所進行的變化和起始分子中 變化的目標而改變。
[0054] 如本文中使用的,術語"前導序列"是指從基因的基因組拷貝的5'非翻譯區 (5'UTR)分離并一般定義為轉錄起始位點(TSS)和蛋白質編碼序列起始位點之間的核苷酸 片段的DNA分子。或者,前導序列可以是合成產生或操作的DNA元件。前導序列可以用作用 于調節可操作地連接的可轉錄多核苷酸分子的表達的5'調控元件。前導序列分子可以與 異源啟動子或與其原始啟動子一起使用。本發明的啟動子分子因此可以與其原始前導序列 可操作地連接或可以與異源前導序列可操作地連接。可用于實施本發明的前導序列如SEQ ID N0:4或其片段或變體所示。在特定實施方案中,可以提供定義為能夠在宿主細胞(包 括,例如轉基因植物細胞)中作為前導序列發揮作用的這樣的序列。在一個實施方案中,這 樣的序列解碼為包含前導序列活性。
[0055] 如SEQ ID N0:4所示的前導序列(5'UTR)可以由調控元件組成或可以采取可具有 對轉基因的轉錄或翻譯的效應的二級結構。這一前導序列可以按照本發明用于形成影響轉 基因的轉錄或翻譯的嵌合調控元件。另外,如SEQ ID N0:4所示的前導序列可以用于形成 影響轉基因的轉錄或翻譯的嵌合前導序列。
[0056] 外源基因引入新的植物宿主中不總是導致引入基因的高表達。此外,如果處理復 雜性狀,有時有必要調節具有空間或時間上不同的表達模式的幾個基因。內含子可以主要 地提供這種調節。但是,在一個植物中相同內含子的多重使用已經證明表現出不利。在這 些情況中,有必要具有用于構建適宜重組DNA元件的基礎控制元件的集合。本領域中已知 具有表達增強性質的內含子數目是有限的,且因此替代物是需要的。
[0057] 由如SEQ ID N0:5、7和9所示的任何內含子衍生的組合物可以由順式調控元件的 內部刪除或重復組成。另外地,包含內含子/外顯子剪接接合的5'和3'序列的改變可以 在與啟動子+前導序列或嵌合啟動子+前導序列和編碼序列可操作地連接時用于改善表達 或表達特異性。包含內含子/外顯子剪接接合的5'和3'區域的改變也可以形成以降低在 信使RNA加工和剪接后所得轉錄物中引入產生的錯誤起始和終止密碼子的可能性。內含子 可以如工作實施例中所述經驗地測試以確定內含子對轉基因的表達的效應。
[0058] 按照本發明,啟動子或啟動子片段可以分析已知啟動子元件的存在,即DNA序列 特征,如TATA-盒和其它已知轉錄因子結合位點基序。這樣的已知啟動子元件的鑒定可以 被本領域技術人員用于設計具有與原始啟動子相似的表達模式的啟動子變體。
[0059] 如本文中使用的,術語"增強子"或"增強子元件"是指順式作用轉錄調控元件(順 式元件),其賦予總體表達模式的方面,但其通常不足以單獨地驅動可操作地連接的多核苷 酸序列的轉錄。與啟動子不同,增強子元件通常不包括轉錄起始位點(TSS)或者TATA盒或 等同序列。啟動子可以天然地包含影響可操作地連接的多核苷酸序列的轉錄的一個或多個 增強子元件。分離的增強子元件也可以與啟動子融合以產生嵌合啟動子順式元件,其賦予 基因表達的總體調節的方面。啟動子或啟動子片段可以包含影響可操作地連接的基因的轉 錄的一個或多個增強子元件。許多啟動子增強子元件據信結合DNA結合蛋白質和/或影 響DNA拓撲結構,從而產生選擇性地允許或限制RNA聚合酶訪問DNA模板或者幫助選擇性 開放轉錄起始位點處的雙鏈的局部構象。增強子元件可以起到結合調節轉錄的轉錄因子的 功能。一些增強子元件結合超過一個轉錄因子,且轉錄因子可以以不同親和力與超過一個 增強子域相互作用。增強子元件可以通過多種技術鑒定,包括刪除分析(即從啟動子的5' 末端或內部刪除一個或多個核苷酸)、使用DNA酶I足跡的DNA結合蛋白質分析、甲基化干 擾、電泳遷移率變換分析、通過連接介導的PCR的體內基因組足跡和其它常規分析;或者通 過利用常規DNA序列比較方法如BLAST的使用已知順式元件基序或增強子元件作為靶序列 或靶序列的DNA序列相似性分析。增強子域的精細結構可以進一步通過一個或多個核苷酸 的誘變(或取代)或通過其它常規方法研究。增強子元件可以通過化學合成或通過從包括 這樣的元件的調控元件分離獲得,且它們可以與包含可用的限制性酶位點的附加側翼核苷 酸一起合成以幫助后續操作。因此,根據本文中公開的方法設計、構建和使用用于調節可操 作地連接的可轉錄多核苷酸分子的表達的增強子元件包括在本發明范圍內。
[0060] 在植物中,在基因構建體中包括一些內含子導致相對于缺乏內含子的構建 體提高的mRNA和蛋白質累積。這一效應稱為基因表達的"內含子介導的增強"(IME) (Mascarenhas 等,(1990)Plant Mol. Biol. 15:913-920)。已知刺激植物中的表 達的內含子已經在玉米基因中(例如,tubAl、Adhl、Shi、Ubil) (Jeon等,Plant Physiol. 123:1005-1014, 2000 ;Callis等,Genes Dev. 1:1183-1200, 1987 ;Vasil 等,Plant Physiol. 91:1575-1579, 1989 !Christiansen 等,Plant Mol.Biol. 18:675-689, 1992)和 在水稻基因中(例如,salt, tpi:McElroy 等,Plant Cell 2:163-171, 1990 ;Xu 等,Plant Physiol. 106:459-467, 1994)鑒定。類似地,來自雙子葉植物基因如矮牽牛(例如,rbcS)、 土豆(例如,st-1 si)和擬南芥(例如,ubq3和pat 1)的內含子已發現提高基因表達 率(Dean 等,Plant Cell 1:201-208, 1989 ;Leon 等,Plant Physiol. 95:968-972, 1991; Norris 等,Plant Mol Biol 21:895-906, 1993 ;Rose 和 Last, Plant J. 11:455-464, 1997)。 已證明內含子的剪接位點內的刪除或突變降低基因表達,表明剪接可能是ME需要 的(Mascarenhas 等,Plant Mol Biol. 15:913-920,1990 ;Clancy 和 Hannah, Plant Physiol. 130:918-929,2002)。但是,這樣的剪接不是雙子葉植物中特定ME需要的, 如來自擬南芥的pat 1基因的剪接位點內的點突變證明的(Rose和Beliakoff,Plant Physiol. 122:535-542, 2000)。
[0061] 基因表達通過內含子增強不是普遍的現象,因為一些內含子插入到重組表達盒 中不能增強表達(例如,來自雙子葉植物基因(如來自豌豆的rbcS基因、來自大豆的 云扁豆蛋白(phaseolin)基因和來自馬鈴薯(Solanum tuberosum)的stls-1基因)的 內含子)和來自玉米基因的內含子(adhl基因的第九內含子和hsp81基因的第一內含 子)(Chee 等,Gene41:47-57, 1986 ;Kuhlemeier 等,Mol Gen Genet 212:405-411,1988; Mascarenhas 等,Plant Mol.Biol.15:913-920, 1990 ;Sinibaldi 和 Mettler, In WE Cohn,K Moldave, eds, Progress in Nucleic Acid Research and Molecular Biology,Vol 42. Academic Press,New York, pp 229-257, 1992 ;Vancanneyt 等,Mol. Gen. Genet. 220:245-250, 1990)。因此,不是每個內含子可以用于操作轉基因植物中非內源基因 或內源基因的基因表達水平。什么特性或特定序列特征必須存在于內含子序列中以增強給 定基因的表達率是現有技術中未知的,且因此不可能預測給定植物內含子在異源使用時是 否引起ME。
[0062] 如本文中使用的,術語"嵌合的"是指通過融合第一 DNA分子與第二DNA分子產生 的單一 DNA分子,其中第一 DNA分子和第二DNA分子正常情況下都不以該構型(即與另一 DNA分子融合)存在。因此嵌合DNA分子是另外通常不在自然界中存在的新DNA分子。如 本文中使用的,術語"嵌合啟動子"是指通過DNA分子的這種操作產生的啟動子。嵌合啟動 子可以結合兩個或更多個DNA片段,例如啟動子與增強子元件的融合。因此,根據本文中公 開的方法設計、構建和使用嵌合啟動子用于調節可操作地連接的可轉錄多核苷酸分子的表 達包括在本發明范圍內。
[0063] 如本文中使用的,術語"變體"是指組成上與第一 DNA分子相似但與第一 DNA分子 不同的第二DNA分子,然而第二DNA分子仍保持第一 DNA分子的總體功能性,即相同或相似 的表達模式。變體可以是第一 DNA分子的更短或截短形式和/或第一 DNA分子的序列的改 變形式,如具有不同限制性酶位點和/或內部刪除、取代和/或插入的變體。"變體"也可 以包括具有含有參比序列的一個或多個核苷酸的取代、刪除和/或插入的核苷酸序列的調 控元件,其中衍生的調控元件具有與對應的母體調控分子相比更高或更低的或等同的轉錄 或翻譯活性。調控元件"變體"也包括由天然存在于細菌和植物細胞轉化中的突變產生的 變體。在本發明中,如SEQ ID N0:l、2、3、4、6和8提供的多核苷酸序列可以用于形成組成 上與原始調控元件的多核苷酸序列相似但與原始調控元件的多核苷酸序列不同的而仍保 持原始調控元件的總體功能性(即相同或相似的表達模式)的變體。本發明的這種變體的 產生根據本公開在本領域技術人員的技能范圍內且包括在本發明的范圍內。嵌合調控元件 "變體"包含與參比序列相同的組成元件,但構成嵌合調控元件的組成元件可以通過本領域 中已知的各種方法可操作地連接,如限制性酶消化和連接、非連接依賴性的克隆、擴增期間 PCR產物的模塊化組裝或調控元件的直接化學合成,以及本領域中已知的其它方法。所得的 嵌合調控元件"變體"可以由參比序列的相同組成元件或相同組成元件的變體組成但包含 允許組成部分可操作地連接的一個或多個連接序列的一個或多個序列不同。在本發明中, 如SEQ ID NO: 1、2、3、4、6和8提供的多核苷酸序列提供了參比序列,其中包含參比序列的 組成元件可以通過本領域中已知的方法接合且可以包含天然存在于細菌和植物細胞轉化 中一個或多個核苷酸的取代、刪除和/或插入或者突變。
[0064] 構建體
[0065] 如本文中使用的,術語"構建體"意思是源自任何來源的能夠基因組整合或自主復 制的任何重組多核苷酸分子如質粒、粘粒、病毒、自主復制的多核苷酸分子、噬菌體或者線 性或環狀單鏈或雙鏈DNA或RNA多核苷酸分子,其包含多核苷酸分子,其中一個或多個多核 苷酸分子以功能上操作的方式連接(即可操作地連接)。如本文中使用的,術語"載體"意思 是可以用于轉化目的(即將異源DNA引入宿主細胞中)的任何重組多核苷酸構建體。按照 本發明的載體可以包括從任何前述分子分離的表達盒或轉基因盒。可用于實施本發明的表 達盒或轉基因盒由與異源編碼序列可操作地連接的如SEQ ID N0:l、6或8所示的轉錄調控 表達元件組("EXP")組成,該異源編碼序列與如SEQ ID NO: 10、11、12或13所示的3' UTR 可操作地連接。
[0066] 如本文中使用的,術語"可操作地連接的"是指與第二分子接合的第一分子,其中 所述分子如此排列以使得第一分子影響第二分子的功能。兩個分子可以是或不是單一連續 分子的部分且可以是或不是相鄰的。例如,如果啟動子調節細胞中目標可轉錄多核苷酸分 子的轉錄,則啟動子與可轉錄多核苷酸分子可操作地連接。例如,當前導序列能夠用作編碼 序列編碼的多肽的前導序列時,該前導序列與編碼序列可操作地連接。
[0067] 在一個實施方案中,本發明的構建體可以提供為具有包含T-DNA的從根癌農桿菌 分離的右邊界(RB或AGRtu. RB)和左邊界(LB或AGRtu. LB)區域的雙Ti質粒邊界DNA構 建體,其連同根癌農桿菌細胞提供的轉移分子一起允許T-DNA整合到植物細胞的基因組中 (參見,例如,U.S.專利No. 6, 603, 061)。構建體也可以包含在細菌細胞中提供復制功能和 抗生素選擇的質粒骨架DNA片段,例如大腸桿菌復制起點如ori322、廣譜宿主范圍復制起 點如oriV或oriRi和選擇標記的編碼區域如Spec/Strp (其編碼賦予對壯觀霉素或鏈霉素 的抗性的Tn7氨基糖苷腺苷酰基轉移酶)(aadA)或者慶大霉素(Gm,Gent)選擇標記基因。 為了植物轉化,宿主細菌菌株通常是根癌農桿菌ABI、C58或LBA4404 ;但是,植物轉化領域 的技術人員已知的其它菌株可以在本發明中發揮功能。
[0068] 本領域中已知以可轉錄多核苷酸分子轉錄成功能性mRNA分子的方式用于將構建 體組裝和引入到細胞中的方法,該功能性mRNA分子翻譯和表達為蛋白質產物。對于本發明 的實施,用于制備和使用構建體和宿主細胞的常規組合物和方法是本領域技術人員公知的 (參見,例如,Molecular Cloning:A Laboratory Manual, 3rd edition Volumes I, 2, and 3, J.Sambrook, D. W. Russell 和 N. Irwin, Cold Spring Harbor Laboratory Press, 2000)。 用于制備特別適合于植物轉化的重組載體的方法包括,但不限于U. S.專利No. 4, 971,908、 4, 940, 835、4, 769, 061和4, 757, 011中整體描述的那些。這些類型的載體也在科技文獻 中綜述(參見,例如 Rodriguez 等,Vectors:A Survey of Molecular Cloning Vectors and Their Uses, Butterworths, Boston, 1988 和 Glick 等,Methods in Plant Molecular Biology and Biotechnology,CRC Press,Boca Raton, FL·,1993)。可用于在高等植物中表 達核酸的典型載體是本領域中公知的且包括來源于根瘤農桿菌的腫瘤誘導(Ti)質粒的載 體(Rogers 等,Methods in Enzymology 153:253-277, 1987)。可用于植物轉化的其它重組 載體,包括PCaMVCN轉移控制載體,也已經描述在科技文獻中(參見,例如Fromm等,Proc. Natl. Acad. Sci. USA 82:5824-5828, 1985)。
[0069] 各種調控元件可以包括在構建體中,包括本文中提供的那些的任一種。任何這類 調控元件可以與其它調控元件組合提供。這樣的組合可以設計或改變以產生所需的調控特 征。在一個實施方案中,本發明的構建體包含與可轉錄多核苷酸分子可操作地連接的至少 一個調控元件,該可轉錄多核苷酸分子可操作地連接3'轉錄終止分子。
[0070] 本發明的構建體可以包括本文中提供的或本領域中已知的任何啟動子或前導序 列。例如,本發明的啟動子可以可操作地連接異源非翻譯5'前導序列如源自熱休克蛋白基 因的前導序列(參見,例如U.S.專利No. 5, 659, 122和5, 362, 865)。或者,本發明的前導序 列可以可操作地連接異源啟動子如花椰菜花葉病毒(CaMV) 35S轉錄啟動子(參見,U.S.專 利 No. 5, 352, 605)。
[0071] 如本文中使用的,術語"內含子"是指可以從基因的基因組拷貝分離或鑒定的且可 以一般地定義為在翻譯前的mRNA加工過程中剪接出來的DNA分子。或者,內含子可以是合 成地產生或操作的DNA元件。內含子可以包含影響可操作地連接的基因的轉錄的增強子元 件。內含子可以用作用于調節可操作地連接的可轉錄多核苷酸分子的表達的調控元件。DNA 構建體可以包含內含子,且內含子相對于可轉錄多核苷酸分子序列可以是或不是異源的。 本領域中內含子的實例包括水稻肌動蛋白內含子(U. S.專利No. 5, 641,876)和玉米HSP70 內含子(U.S.專利No. 5, 859, 347)。可用于實施本發明的內含子包括SEQ ID NO: 5、7和9。 另外,當修飾內含子/外顯子邊界序列時,可能優選的是避免使用核苷酸序列AT或者恰在 剪接位點(GT)的5'末端之前的核苷酸A及緊接剪接位點(AG)的3'末端之后的分別核苷 酸G或核苷酸序列TG以消除在信使RNA加工成最終轉錄物的過程中形成不需要的起始密 碼子的可能性。因此內含子的5'或3'末端剪接接合位點周圍的序列可以以這種方式修飾。
[0072] 如本文中使用的,術語"3'轉錄終止分子"或"3' UTR"是指在轉錄過程中使用以 產生mRNA分子的3'非翻譯區(3'UTR)的DNA分子。mRNA分子的3'非翻譯區可以通過特 定的切割和3'聚腺苷酸化(polyA尾)生成。3'UTR可以可操作地連接可轉錄多核苷酸分 子和位于其下游且可以包括提供聚腺苷酸化信號和能夠影響轉錄、mRNA加工或基因表達的 其它調控信號的多核苷酸。PolyA尾被認為發揮mRNA穩定性和翻譯起始方面的功能。本 領域中3'轉錄終止分子的實例是胭脂氨酸合成酶3'區域(參見,Fraley等,Proc. Natl. Acad. Sci. USA,80:4803-4807, 1983)、小麥hspl73'區域、豌豆核酮糖二磷酸羧化酶-加氧 酶(rubisco)小亞基 3' 區域、棉花 E63' 區域(U.S.專利 No.6,096,950)、W0/0011200A2 中 公開的 3' 區域和薏苡辛(coixin) 3'UTR(U.S.專利 No. 6,635,806)。
[0073] 3'UTR通常具有用于特定基因的重組表達的有益用途。在動物系統中, 3' UTR 的機制已很好地定義(例如,Zhao 等,Microbiol Mol Biol Rev 63:405 -445,1999;Proudfoot,Nature 322:562-565, 1986 ;Kim 等,Biotechnology Progress 19:1620-1622,2003 ;Yonaha 和 Proudfoot,EMBO J. 19:3770-3777,2000 ;Cramer 等,FEBS Letters 498:179-182, 2001 ;Kuerstem 和 Goodwin, Nature Reviews Genetics 4:626-637,2003)。RNA轉錄的有效終止是防止不需要的性狀不相關(下游)序列的轉錄 (其可能干擾性狀性能)所需要的。多個基因表達盒彼此接近(例如在一個T-DNA內)的 排列可以引起所述構建體中一個或多個基因的基因表達與獨立插入相比的抑制(Padidam 和Cao, BioTechniques 31:328-334, 2001)。這可以妨礙獲得足夠的表達水平,例如在其中 希望所有盒的強基因表達的情況中。
[0074] 在植物中,明確定義的聚腺苷酸化信號序列是未知的。Hasegawa等(Plant J. 33:1063-1072,2003)未能在Nicotiana sylvestris的體外和體內系統中確認保守的 聚腺苷酸化信號序列和確定原始(非聚腺苷酸化的)轉錄物的實際長度。弱3'UTR可以 產生通讀,其可以影響位于相鄰表達盒中的基因的表達(Padidam和Cao, BioTechniques 31:328-334, 2001)。轉錄終止的適當控制可以防止通讀到位于下游的序列(例如,其它表 達盒)中且可以進一步允許RNA聚合酶的高效循環以改善基因表達。轉錄的有效終止(RNA 聚合酶II從DNA釋放)是轉錄重新起始的必要條件且因此直接影響總體轉錄水平。在轉 錄終止后,成熟mRNA從合成位點和模板釋放到胞質中。真核mRNA在體內以poly (A)形式 累積,使得難以通過常規方法檢測轉錄終止。但是,通過生物信息學方法預測功能性的和有 效的3' UTR是困難的,因為不存在保守的序列以使得能夠容易地預測有效的3' UTR。
[0075] 從實踐的觀點,可能有益的是用于轉基因盒中的3'UTR具有特定特征。例如,根據 本發明可用的3'UTR可以高效地和有效地終止轉基因的轉錄和防止轉錄物通讀到任何相 鄰DNA序列中,其可以由另一轉基因盒(如在存在于一個T-DNA中的多個盒的情況中)或 T-DNA插入其中的相鄰染色體DNA組成。最佳情況下,3' UTR不應受到用于驅動轉基因的表 達的啟動子、前導序列和內含子影響而引起轉錄活性的降低。在植物生物技術中,3'UTR通 常用于啟動從轉化的植物提取的反轉錄RNA的擴增反應且可以用于(1)在轉基因盒一旦整 合到植物染色體中時評價轉基因盒的轉錄活性或表達;(2)評價植物DNA內插入序列的拷 貝數;和(3)評價在育種后所得種子的接合性。3'UTR也可以用于從轉化的植物提取的DNA 的擴增反應中以表征插入的盒的完整性。
[0076] 可用于在植物中提供轉基因表達的3' UTR可以基于從信使RNA形成的cDNA文庫 中已表達序列標簽(EST)的表達來鑒定,該信使RNA從來源于例如大須芒草(Andropogon gerardii)> 鹿茅[Saccharum ravennae (Erianthus ravennae)]> 狗尾草(Setaria viridis)、墨西哥玉蜀黍(Zea mays 亞種 mexicana)、粟(Setaria italica)或薏該(Coix lacryma-jobi)的種子、花或任何其它組織分離。使用本領域技術人員已知的方法,cDNA 文庫可以使用花組織、種子、葉、根或其它植物組織從分離自植物物種的組織制備。所得 的cDNA使用本領域中已知的各種測序方法測序。所得的EST使用生物信息學軟件如 clc_ref_assemble_complete 版本 2. OL 37139 (CLC bio USA, Cambridge, Massachusetts 02142)組裝成簇。各簇的轉錄物豐度通過計數各簇的cDNA閱讀片段的數目確定。所鑒 定的3'UTR可以由源自cDNA序列的序列以及源自基因組DNA的序列組成。cDNA序列可 以用于設計引物,其然后可以用于按照制造商的方案構建的GenomeWalker?(Clontech Laboratories, Inc, Mountain View, CA)文庫以克隆相應基因組DNA序列的3'區域而提供 更長的終止序列。相對轉錄物豐度通過直接計數或對于各組織文庫的觀察序列閱讀片段的 標準化計數進行分析可以用于推斷關于表達模式的性質。例如,一些3' UTR可以在根組織 中而不是在葉組織中更豐富的轉錄物中發現。這表明轉錄物在根中高度地表達且根表達的 性質可能歸因于啟動子、前導序列、內含子或3' UTR的轉錄調控。通過特定器官、組織或 細胞類型中的表達性質鑒定的3' UTR的經驗測試可以導致增強這些特定器官、組織或細胞 類型中的表達的3'UTR的鑒定。可用于實施本發明的3'UTR提供為SEQ ID N0:9、10、ll和 12〇
[0077] 構建體和載體也可以包括轉運肽編碼序列,其表達可用于將蛋白質產物靶向于特 別是葉綠體、白色體或其它質體細胞器;線粒體;過氧化物酶體;液泡或細胞外位置的連接 肽。對于葉綠體轉運肽的應用的描述,參見u. S.專利No. 5, 188, 642和5, 728, 925。許多 葉綠體定位的蛋白質作為前體由核基因表達并通過葉綠體轉運肽(CTP)靶向于葉綠體。 這樣的分離葉綠體蛋白質的實例包括,但不限于與核酮糖-1,5,-二磷酸羧化酶的小亞基 (SSU)、鐵氧還蛋白、鐵氧還蛋白氧化還原酶、獲光復合物蛋白I和蛋白II、硫氧還蛋白F、 烯醇丙酮酸莽草酸磷酸合成酶(EPSPS)以及描述于U. S.專利No. 7, 193, 133的轉運肽類 相關的那些。已在體內和體外證明,通過與異源CTP的蛋白質融合可將非-葉綠體蛋白質 靶向于葉綠體,并且CTP足以將蛋白質靶向于葉綠體。適合的葉綠體轉運肽(例如擬南芥 EPSPS CTP (CTP2)(參見,Klee 等人,Mol. Gen. Genet.,210:437-442 (1987))或矮牽牛 EPSPS CTP (CTP4)(參見,della-Cioppa 等人,Proc. Natl. Acad. Sci. USA, 83:6873-6877 (1986))) 的引入已顯示在轉基因植物中將異源EPSPS蛋白質序列靶向于葉綠體(參見,U. S.專 利 No. 5, 627, 061、5, 633, 435 和 5, 312, 910 及 EP 0218571、EP 189707、EP 508909 和 EP 924299)。
[0078] 可轉錄多核苷酸分子
[0079] 如本文中使用的,術語"可轉錄多核苷酸分子"是指任何能夠被轉錄為RNA分子的 DNA分子,包括但不局限于具有蛋白質編碼序列的那些以及產生具有用于基因抑制的序列 的RNA分子的那些。"轉基因"是指與至少相對于其基因組中的位置對于宿主細胞異源的可 轉錄多核苷酸分子和/或人工并入當前或任何前代細胞的宿主細胞基因組中的可轉錄多 核苷酸分子。
[0080] 本發明的啟動子可以可操作地連接相對于啟動子分子為異源的可轉錄多核苷酸 分子。如本文中使用的,術語"異源的"是指當兩個或更多個多核苷酸分子的組合通常不存 在于自然界中時的這種組合。例如,兩個分子可來源于不同物種和/或兩個分子可源自不 同基因,例如,來自相同物種的不同基因,或來自不同物種的相同基因。因此,如果這種組合 通常不存在于自然界中,則啟動子相對于可操作地連接的可轉錄多核苷酸分子為異源的, 即與該啟動子分子組合的該可轉錄多核苷酸分子不是天然發生地可操作地連接的。
[0081] 可轉錄多核苷酸分子通常可為其RNA轉錄體的表達為所需的任何DNA分子。RNA 轉錄體的這種表達可導致所得到的mRNA分子的翻譯以及因此蛋白質的表達。可選地,例 如,可轉錄多核苷酸分子可設計為最終導致特定基因或蛋白質的表達降低。在一個實施方 案中,這可通過使用以反義方向定向的可轉錄多核苷酸分子來實現。本領域的普通技術人 員熟悉這種反義技術的使用。簡而言之,當反義可轉錄多核苷酸分子被轉錄時,RNA產物在 細胞中與互補RNA分子雜交并且隔絕(sequester)互補RNA分子。這一雙鏈RNA分子不能 通過細胞的翻譯機制翻譯為蛋白質,并且在細胞中降解。任何基因可以這種方式反向調控。
[0082] 因此,在本發明的一個實施方案中,調控元件(提供為SEQ ID NO: 1、2、3、4、6和8) 可操作地連接可轉錄多核苷酸分子,從而當將構建體整合到植物細胞的基因組中時以需要 的水平或以需要的模式調節可轉錄多核苷酸分子的轉錄。在一個實施方案中,可轉錄多核 苷酸分子包含基因的蛋白質編碼區域,并且啟動子影響被翻譯和表達為蛋白質產物的RNA 分子的轉錄。在另一個實施方案中,可轉錄多核苷酸分子包含基因的反義區域,并且啟動子 影響反義RNA分子、雙鏈RNA或其他相似抑制性RNA分子的轉錄以抑制靶宿主細胞中特定 目的RNA分子的表達。
[0083] 具有農學意義的基因
[0084] 根據本發明的可轉錄多核苷酸分子可以是具有農學意義的基因。如本文中使用 的,術語"具有農學意義的基因"是指當在特定的植物組織、細胞或細胞類型中表達時賦予 所需特征例如與植物形態學、生理學、生長、發育、產量、產物、營養分布、疾病或害蟲抗性和 /或環境或化學耐受性相關的特征的可轉錄多核苷酸分子。具有農學意義的基因包括,但 不限于編碼產量蛋白、應激抗性蛋白、發育控制蛋白、組織分化蛋白、分生組織蛋白、環境響 應蛋白、衰老蛋白、激素響應蛋白、脫落蛋白(abscission protein)、源蛋白、SINK蛋白、花 調控蛋白、種子蛋白、除草劑抗性蛋白、疾病抗性蛋白、脂肪酸生物合成酶、生育酚生物合成 酶、氨基酸生物合成酶、殺蟲蛋白或任何其他試劑例如用于抑制的靶向特定基因的反義或 RNAi分子的基因。具有農學意義的基因的產物可在植物中起作用以引起對植物生理學或代 謝的作用,或可在以植物為食的害蟲的食物中作為殺蟲劑起作用。
[0085] 在本發明的一個實施方案中,啟動子被并入構建體中,以使啟動子可操作地連接 作為具有農學意義的基因的可轉錄多核苷酸分子。為了獲得農學有益性狀,具有農學意義 的基因的表達是需要的。有益農學性狀可以特別地包括,但不限于,例如除草劑耐受性、昆 蟲控制、改良的產量、真菌疾病抗性、病毒抗性、線蟲抗性、細菌疾病抗性、植物生長和發育、 淀粉產生、改良的油產生、高油產量、改良的脂肪酸含量、高蛋白質產量、果實成熟、提高的 動物和人類營養、生物聚合物、環境應激抗性、藥用肽和可分泌肽、改善的加工性狀、改善的 消化性、酶產生、味道、固氮、雜交種子產生、纖維產生和生物燃料產生。本領域已知的農學 意義的基因的實例包括具有除草劑抗性(U. S.專利No. 6, 803, 501、6, 448, 476、6, 248, 876、 6, 225, 114、6, 107, 549、5, 866, 775、5, 804, 425、5, 633, 435 和 5, 463, 175)、提高的產量 (U.S.專利 N〇.USRE38,446、6,716,474、6,663,906、6,476,295、6,441,277、6,423,828、 6,399,330、6,372,211、6,235,971、6,222,098 和 5,716,837)、昆蟲控制(仄5.專利 No. 6, 809, 078、6, 713, 063、6, 686, 452、6, 657, 046、6, 645, 497、6, 642, 030、6, 639, 054、 6, 620, 988、6, 593, 293、6, 555, 655、6, 538, 109、6, 537, 756、6, 521,442、6, 501,009、 6, 468, 523、6, 326, 351、6, 313, 378、6, 284, 949、6, 281,016、6, 248, 536、6, 242, 241、 6, 221,649、6, 177, 615、6, 156, 573、6, 153, 814、6, 110, 464、6, 093, 695、6, 063, 756、 6, 063, 597、6, 023, 013、5, 959, 091、5, 942, 664、5, 942, 658、5, 880, 275、5, 763, 245 和 5, 763, 241)、真菌疾病抗性(U. S.專利 No. 6, 653, 280、6, 573, 361、6, 506, 962、6, 316, 407、 6,215,048、5,516,671、5,773,696、6,121,436、6,316,407 和 6,506,962)、病毒抗性 (U. S.專利 No. 6, 617, 496、6, 608, 241、6, 015, 940、6, 013, 864、5, 850, 023 和 5, 304, 730)、 線蟲抗性(U.S.專利No. 6, 228, 992)、細菌疾病抗性(U.S.專利No. 5, 516, 671)、植物生 長和發育(U. S.專利 No. 6, 723, 897 和 6, 518, 488)、淀粉生產(U. S.專利 No. 6, 538, 181、 6, 538, 179、6, 538, 178、5, 750, 876和 6, 476, 295)、改良的油生產(U. S.專利No. 6, 444, 876、 6, 426, 447 和 6, 380, 462)、高油產量(U. S.專利 No. 6, 495, 739、5, 608, 149、6, 483, 008 和 6, 476, 295)、改良的脂肪酸含量(U. S.專利 No. 6, 828, 475、6, 822, 141、6, 770, 465、 6, 706, 950、6, 660, 849、6, 596, 538、6, 589, 767、6, 537, 750、6, 489, 461 和 6, 459, 018)、高蛋 白質產量(u. S.專利No. 6, 380, 466)、果實成熟(U. S.專利No. 5, 512, 466)、提高的動物和 人類營養(U. S.專利 No. 6, 723, 837、6, 653, 530、6, 5412, 59、5, 985, 605 和 6, 171,640)、生 物聚合物(U. S.專利 No. USRE37, 543、6, 228, 623、5, 958, 745 和 6, 946, 588)、環境應激抗 性(U. S.專利 No. 6, 072, 103)、藥用肽和可分泌肽(U. S.專利 No. 6, 812, 379、6, 774, 283、 6, 140, 075和6, 080, 560)、改善的加工性狀(U. S.專利No. 6, 476, 295)、改善的消化性 (U. S.專利No. 6, 531,648)、低棉子糖(U. S.專利No. 6, 166, 292)、工業酶產生(U. S.專利 No. 5, 543, 576)、改良的味道(U. S.專利 No. 6, 011,199)、固氮(U. S.專利 No. 5, 229, 114)、 雜交種子產生(U. S.專利 No. 5, 689, 041)、纖維產生(U. S.專利 No. 6, 576, 818、6, 271,443、 5, 981,834 和 5, 869, 720)和生物燃料產生(U. S.專利 No. 5, 998, 700)。
[0086] 可選地,具有農學意義的基因可以通過編碼引起內源基因的基因表達的靶向調 節的RNA分子而影響以上所述的植物特征或表型,例如通過反義物(參見,例如,U.S.專 利5, 107, 065)、抑制性RNA ( "RNAi ",包括通過miRNA、siRNA、反式作用siRNA和相 控sRNA介導的機理的基因表達調節,例如,如描述于公開的申請US2006/0200878和US 2008/0066206及U. S.專利申請No. 11/974, 469中),或共抑制介導的機理。RNA也可以為 催化的RNA分子(例如,核酶或核開關;參見例如,US 2006/0200878),其經工程化以切割 所希望的內源性mRNA產物。因此,編碼影響農學重要表型或目的形態學變化的轉錄RNA分 子的任何可轉錄多核苷酸分子可用于實施本發明。用于構建構建體和將構建體引入細胞 內從而將可轉錄多核苷酸分子轉錄至能夠引起基因抑制的分子中的方法在本領域中是已 知的。例如,在植物中使用具有反義定向的可轉錄多核苷酸分子的構建體進行轉錄后基因 抑制以調控基因表達公開于U. S.專利No. 5, 107, 065和5, 759, 829中,并且在植物中使用 具有正義定向的可轉錄多核苷酸分子的構建體進行轉錄后基因抑制以調控基因表達公開 于U.S.專利No. 5, 283, 184和5, 231,020中。在植物細胞中表達可轉錄多核苷酸也可用 于抑制以該植物細胞為食的植物害蟲,例如,從鞘翅目害蟲分離的組合物(U.S.專利公開 No. US2007/0124836)和從線蟲害蟲分離的組合物(U. S.專利公開No. US2007/0250947)。植 物害蟲包括,但不限于節肢類害蟲、線蟲害蟲和真菌或微生物害蟲。用于并入本發明的構建 體中的示例性可轉錄多核苷酸分子包括,例如,來自于不同于目標物種之外物種的DNA分 子或基因,或起源于或存在于相同物種但通過遺傳工程方法而不是經典繁殖或育種技術并 入受體細胞中的基因。多核苷酸分子的類型可以包括,但不限于已經存在于植物細胞中的 多核苷酸分子、來自另一植物的多核苷酸分子、來自不同生物體的多核苷酸分子或外部產 生的多核苷酸分子(例如含有基因的反義信息的多核苷酸分子,或編碼人工的、合成的或 另外修飾形式的轉基因的多核苷酸分子)。
[0087] 選擇標記
[0088] 如本文中使用的術語"標記"是指任何可轉錄多核苷酸分子,其表達或其缺乏可 以某種方式篩選或評分。用于實施本發明的標記基因包括,但不限于編碼葡萄糖醛酸 酶0^3,描述于。5.專利5,599,670中)、綠色熒光蛋白及其變體(6--,描述于。5.專 利5, 491,084和6, 146, 826中)、賦予抗生素抗性的蛋白質或賦予除草劑耐受性的蛋白質 的可轉錄多核苷酸分子。可用的抗生素耐藥性標記,包括編碼賦予卡那霉素(nptll)、潮霉 素 B(aph IV)、鏈霉素或壯觀霉素(aad,spec/strep)和慶大霉素(aac3和aacC4)耐藥性 的蛋白質的那些標記是本領域公知的。已證實轉基因植物的耐受性并且本發明方法可應 用的除草劑可以包括,但不限于:氨基-甲基-膦酸、草甘膦、草丁膦、磺酰脲類、咪唑啉酮、 溴草腈、茅草枯、麥草畏、環己二酮、原卟啉原氧化酶抑制劑和異卩惡唑草酮(isoxasfIutole) 除草劑。編碼參與除草劑耐受性的蛋白質的可轉錄多核苷酸分子在本領域是已知的,并且 可以包括,但不局限于編碼5-烯醇丙酮酸莽草酸-3-磷酸合成酶(用于草甘膦耐受性的 EPSPS,描述于 U. S.專利 5, 627, 061、5, 633, 435、6, 040, 497 和 5, 094, 945 中)的可轉錄多 核苷酸分子;編碼草甘膦氧化還原酶和草甘膦-N-乙酰基轉移酶(G0X,描述于U. S.專利 5,463, 175中、GAT,描述于美國專利公開No. 2003/0083480中)以及麥草畏單加氧酶(描述 于U. S.專利公開No. 2003/0135879中)的可轉錄多核苷酸分子;編碼溴草腈腈水解酶(用 于溴草腈耐受性的Bxn,描述于U. S.專利4, 810, 648中)的可轉錄多核苷酸分子;編碼用 于達草滅耐受性的八氫番茄紅素去飽和酶(crtl)的可轉錄多核苷酸分子(描述于Misawa 等人,Plant Journal, 4:833-8401993 和 Plant Journal, 6:481-4891994 中)、編碼用于橫 酰脲類除草劑耐受性的乙酰羥酸合成酶(AHAS,也就是ALS)的可轉錄多核苷酸分子(描述 于 Sathasiivan 等人,Nucl. Acids Res.,18:2188-21931990 中),以及用于草丁勝和雙丙 氨磷耐受性的bar基因(描述于DeBlock等人,EMBO Journal, 6:2513-25191987中)。本 發明的啟動子分子可表達連接的可轉錄多核苷酸分子,其編碼草胺膦(phosphinothricin) 乙酰基轉移酶、草甘膦抗性EPSPS、氨基糖苷磷酸轉移酶、羥苯基丙酮酸酯脫氫酶、潮霉素磷 酸轉移酶、新霉素磷酸轉移酶、茅草枯脫齒素酶、溴草腈抗性腈水解酶、鄰氨基苯甲酸合成 酶、芳氧基鏈烷酸酯雙加氧酶、乙酰CoA羧化酶、草甘膦氧化還原酶和草甘膦-N-乙酰基轉 移酶。
[0089] 包括于術語"選擇標記"中的也有編碼選擇標記的基因,其分泌可作為識別或選擇 轉化細胞的方式檢測。其實例包括編碼可通過抗體相互作用識別的可分泌抗原的標記或甚 至編碼可催化地檢測的可分泌酶。可選擇的分泌標記蛋白質劃分為多個類別,包括(例如, 通過ELISA)可檢測的小的可擴散的蛋白質、可在細胞外溶液中檢測的小的活性酶(例如, α -淀粉酶、β -內酰胺酶、草胺膦轉移酶)或插入或禁閉在細胞壁中的蛋白質(例如包括 在例如延伸表達單元中發現的前導序列的蛋白質或者與煙草致病性相關的蛋白質,也稱為 煙草PR-S)。其他可能的選擇標記基因對于本領域技術人員是明顯的并且包含在本發明中。 [0090] 細胞轉化
[0091] 術語"轉化"是指將核酸引入受體宿主中。如本文中使用的,術語"宿主"是指細 菌、真菌或植物,包括細菌、真菌或植物的任何細胞、組織、器官或后代。例如,根據本發明 的宿主細胞可以是任何細胞或生物體如植物細胞、藻類細胞、藻類、真菌細胞、真菌、細菌細 胞、昆蟲細胞等等。在一個實施方案中,宿主和轉化的細胞可以包括來自以下的細胞:植物、 曲霉屬、酵母、昆蟲、細菌和藻類。具有特定興趣的植物組織和細胞包括,但不限于原生質 體、愈傷組織、根、塊莖、種子、莖、葉、幼苗、胚和花粉。
[0092] 如本文中使用的,術語"轉化的"是指其中被引入外源多核苷酸分子(例如構建 體)中的細胞、組織、器官或生物體。引入的多核苷酸分子可被整合至受體細胞、組織、器官 或生物體的基因組DNA中,以使得被引入的多核苷酸分子被遺傳至后續的后代。"轉基因的" 或"轉化的"細胞或生物體也包括細胞或生物體的后代,以及產生于在雜交中應用這種轉基 因生物體作為母本并且顯示由外源多核苷酸分子的存在導致的改變表型的育種程序的后 代。術語"轉基因"是指含有一個或多個異源多核酸分子的細菌、真菌或植物。
[0093] 存在許多將多核酸分子引入植物細胞中的方法。該方法通常可以包括選擇合適的 宿主細胞、使用重組載體轉化宿主細胞以及獲得轉化的宿主細胞的步驟。合適的方法包括 細菌感染(例如農桿菌)、雙元細菌人工染色體載體、DNA的直接遞送(例如,通過PEG-介 導的轉化)、干燥/抑制介導的DNA攝取、電穿孔、用碳化硅纖維攪拌以及DNA涂覆顆粒的加 速等(綜述在 Potrykus等,Ann.Rev. Plant Physiol. Plant Mol. Biol. ,42:2051991 中)。
[0094] 將DNA分子引入細胞中的技術為本領域技術人員公知的。在本發明的實施中,通 過將植物DNA構建體引入植物基因組中來轉化植物細胞的方法和材料可包括任何公知的 和證實的方法。任何轉化方法可以用于用本發明的一個或多個啟動子和/或構建體轉化宿 主細胞。
[0095] 再生的轉基因植物可以進行自花授粉以提供純合的轉基因植物。可選地, 從再生的轉基因植物獲得的花粉可與非轉基因植物雜交,優選為農學重要物種的自 交系。通常用于不同性狀和作物的育種方法的描述可見于幾本參考書中的一本, 參見,例如,Allard, Principles of Plant Breeding, John Wiley&Sons,NY, U. of CA, Davis, CA, 50-98, 1960 ;Simmonds, Principles of crop improvement, Longman, Inc. , N Y, 369-399, 1979 ;Sneep 和 Hendriksen, Plant breeding perspectives, Wageningen(ed), Center for Agricultural Publishing and Documentation, 1979 ;Fehr, Soybeans:Impro vement, Production and Uses, 2nd Edition, Monograph. , 16:249, 1987 ;Fehr, Principles of variety development, Theory and Technique, (Vol I)和Crop Species Soybean(Vol 2) ,Iowa State Univ., Macmillan Pub. Co·, NY, 360-376, 1987。相反地,來自非轉基因植 物的花粉可用于給再生的轉基因植物授粉。
[0096] 可以分析轉化的植物的目標基因的存在以及本發明調控元件所賦予的表達水 平和/或表達譜。本領域技術人員知道許多可用于分析轉化的植物的方法。例如,植物 分析的方法包括,但不限于Southern印跡法或northern印跡法、基于PCR的方法、生 化分析、表型篩選方法、田間評估以及免疫診斷分析。可轉錄多核苷酸分子的表達可用 TaqMan⑧(Applied Biosystems, Foster City, CA)試劑和制造商描述的方法測量和 使用 TaqMan? Testing Matrix 確定 PCR 循環次數。可選地,Invader? (Third Wave Technologies, Madison, WI)試劑和制造商描述的方法可用于評估轉基因表達。
[0097] 本發明植物的種子可從能繁殖的轉基因植物收獲并且用于生長本發明的轉化植 物后代世代,包括包含本發明構建體和表達具有農學意義的基因的植物雜交系。
[0098] 本發明還提供本發明植物的部分。植物部分包括,但不限于葉、莖、根、塊莖、種子、 胚乳、胚珠和花粉。本發明還包括和提供包含本發明的核酸分子的轉化的植物細胞。
[0099] 轉基因植物可將轉基因多核苷酸分子傳遞至其后代。后代包括包含源自祖代植物 的轉基因的任何可再生的植物部分或種子。轉基因植物優選對轉化的多核苷酸分子為純合 的,并且作為有性繁殖的結果將該序列傳遞至所有后代。后代可從產生于轉基因植物的種 子生長。然后,這些另外的植物可以進行自花授粉以產生植物的純育品系。來自這些植物 的后代特別地評估基因表達。基因表達可通過例如western印跡法、northern印跡法、免 疫沉淀和ELISA的幾種常見方法檢測。
[0100] 盡管已概括地描述了本發明,通過參考以下實施例將會更加容易地理解本發明, 除非特別說明,這些實施例僅是示例性的且并不意圖限制本發明。本領域技術人員應該理 解,以下實施例中公開的技術代表了本發明人發現的技術以很好地實施本發明。但是,本領 域技術人員應該理解,根據本發明公開的內容,可以對公開的【具體實施方式】做出許多改變, 并仍然會得到相同或相似的結果而不偏離本發明的精神和范圍,因此提出或顯示在所附附 圖中的所有內容應被理解為示例性的而不是限制性的。 實施例
[0101] 實施例1
[0102] 從玉米分離的調控元件和相應的轉錄調控表達元件組
[0103] 調控元件從玉米分離,且構建包含玉米調控元件的轉錄調控表達元件組(EXP)序 列。
[0104] 玉米種子在美國北部在早至四月初的早植對玉米種子造成潛在有害的風險。例 如,長期的冷和濕田間條件可能阻止最佳萌發和成苗(seedling establishment)。通過轉 錄物譜分析和后續的表征,鑒定了幾種候選基因,其顯示可用于種子發育和萌發的表達模 式。來自候選基因的啟動子和前導序列(此處分別稱為P-Zm. Nac-1:1:2 (SEQ ID N0:3)和 L-Zm. Nac-1:1:1(SEQ ID NO:4))從玉米基因組DNA擴增并克隆和測序。
[0105] 基于專有和公共的基因組和EST序列設計擴增引物,其然后用于按照制造商的方 案構建的GenomeWalker?(Clontech Laboratories, Inc, Mountain View, CA)文庫以克隆相 應基因組DNA序列的5'區域。使用這一序列,調控元件通過生物信息學方式在基因的5' 區域內鑒定。利用這一分析的結果,調控元件定義在基因編碼序列上游的5'序列內。然后 設計引物以擴增調控元件。各調控元件的相應DNA分子使用包含獨特限制性酶位點的引物 和從玉米分離的基因組DNA利用標準PCR條件擴增。這一克隆的序列包含玉米基因的蛋白 質編碼區域上游的啟動子和5' UTR序列。所得的DNA片段使用標準DNA克隆方法接合到基 礎植物表達載體中并測序。
[0106] 鑒定的轉錄調控表達元件組("EXP")的序列在本文中提供為SEQ ID NO: 1、6和 8,如以下表1中所列的。啟動子序列在本文中提供為SEQ ID N0:2。前導序列在本文中提 供為SEQ ID N0:3。內含子序列在本文中提供為SEQ ID N0:4、6和8。
[0107] 表1.從各種草物種分離的轉錄調控表達元件組("EXP")、啟動子、前導序列和內 含子
[0108]
【權利要求】
1. 一種DNA分子,其包含選自下組的DNA序列: a) 與SEQ ID N0:l、2、3、4、6或8中任一具有至少85%序列同一性的序列; b) 包含SEQ ID NO: 1、2、3、4、6或8中任一的序列;和 c) SEQ ID N0:l、2、3、4、6或8中任一的片段,其中所述片段具有基因調控活性; 其中所述序列與異源可轉錄多核苷酸分子可操作地連接。
2. 權利要求1的DNA分子,其中所述序列與SEQ ID NO: 1、2、3、4、6或8中任一的DNA 序列具有至少90 %的序列同一性。
3. 權利要求1的DNA分子,其中所述序列與SEQ ID NO: 1、2、3、4、6或8中任一的DNA 序列具有至少95 %的序列同一性。
4. 權利要求1的DNA分子,其中所述DNA序列包含基因調控活性。
5. 權利要求1的DNA分子,其中所述異源可轉錄多核苷酸分子包含具有農學意義的基 因。
6. 權利要求5的DNA分子,其中所述具有農學意義的基因賦予植物除草劑耐受性。
7. 權利要求5的DNA分子,其中所述具有農學意義的基因賦予植物害蟲抗性。
8. -種轉基因植物細胞,包含含有選自下組的序列的異源DNA分子: a) 與SEQ ID N0:l、2、3、4、6或8中任一具有至少85%序列同一性的序列; b) 包含SEQ ID NO: 1、2、3、4、6或8中任一的序列;和 c) SEQ ID N0:l、2、3、4、6或8中任一的片段,其中所述片段具有基因調控活性; 其中所述序列與異源可轉錄多核苷酸分子可操作地連接。
9. 權利要求8的轉基因植物細胞,其中所述轉基因植物細胞是單子葉植物細胞。
10. 權利要求8的轉基因植物細胞,其中所述轉基因植物細胞是雙子葉植物細胞。
11. 一種轉基因植物或其部分,其包含權利要求1的DNA分子。
12. 權利要求11的轉基因植物的后代植物或其部分,其中所述后代植物或其部分包含 所述DNA分子。
13. -種轉基因種子,其中所述種子包含權利要求1的DNA分子。
14. 一種轉基因盒,其包含選自SEQ ID NO: 1、6和8的轉錄調控表達元件組,其中 所述轉錄調控表達元件組與異源編碼序列可操作地連接,該異源編碼序列與選自SEQ ID NO: 10、11、12和13的3'UTR可操作地連接。
15. 權利要求14的轉基因盒,其包含如SEQ ID NO: 1所示的轉錄調控表達元件組,其 中所述轉錄調控表達元件組與異源編碼序列可操作地連接,該異源編碼序列與如SEQ ID NO: 10所示的3' UTR可操作地連接。
16. 權利要求14的轉基因盒,其包含如SEQ ID N0:6所示的轉錄調控表達元件組,其 中所述轉錄調控表達元件組與異源編碼序列可操作地連接,該異源編碼序列與選自SEQ ID NO: 11和12的3' UTR可操作地連接。
17. 權利要求14的轉基因盒,其包含如SEQ ID N0:8所示的轉錄調控表達元件組,其 中所述轉錄調控表達元件組與異源編碼序列可操作地連接,該異源編碼序列與選自SEQ ID NO: 12和13的3' UTR可操作地連接。
18. -種生產商品的方法,包括獲得根據權利要求11的轉基因植物或其部分,和從該 轉基因植物或其部分生產所述商品。
19. 權利要求18的方法,其中所述商品是蛋白質濃縮物、蛋白質分離物、籽粒、淀粉、種 子、粗粉、面粉、生物質或種子油。
20. -種表達可轉錄多核苷酸分子的方法,包括獲得根據權利要求11的轉基因植物并 栽培植物,其中所述可轉錄多核苷酸被表達。
【文檔編號】C12N5/14GK104364370SQ201380031796
【公開日】2015年2月18日 申請日期:2013年4月10日 優先權日:2012年4月20日
【發明者】J·阿倫斯, S·徹里安, P·J·羅伊達, L·L·路非亞, W·吳, 謝嘉麗 申請人:孟山都技術公司