專利名稱:Dof(具有一指的dna結合)序列和使用方法
技術領域:
本發明涉及遺傳學和分子生物學領域。更具體地,所述組合物和 方法涉及植物的碳固定的調節,提高氮利用,提高產量和提高脅迫耐 受性。
背景技術:
近年來,通過常規育種來提高谷粒產量已經在玉米中達到平臺。 然后自然地采用一些替代性的、非常規的方法,它們可以用于得到額 外的產量增加。由于在過去的約百年中選擇谷粒產量期間,玉米的收 獲指數保持基本上不變,已經從增加每單位陸地面積的總生物量生產, 實現了產量提高(Sinclair,爭乂, (1998) Cra/ 38: 638-643;
Duvick,爭乂, (1999) Cra/ S"ewce 39: 1622-1630;和,Tollenaar,爭 乂, (1999) Crap Sc/e"ce 39: 1597-1604)。該增加的總生物量已經通過 增加種植密度來實現,所述增加種植密度已經導致適應性的表型改變, 例如葉角和雄花穗大小的減小,前者會減少低矮葉的遮蔽,后者可能 會增加收獲指數(Duvick,爭乂, (1999)Cra/ S"'e"ce 39: 1622-1630)。
碳固定和氮同化作用是限制生物量生產的兩個關鍵過程(Sinclair, 爭乂, (1975) S"'ewce 189: 565-567; Bhatia,等人.(1976) S"ewce 194: 1418-1421; Dhugga,爭乂. (1989) Crop 29: 1232-1239;和Sinclair, 爭乂, (1998) Crop 5We"ce 38: 638-643)。使用硝態氮(它是玉米從土 壤中獲得的主要氮形式)制備蛋白的能量成本,從光合產物單位是制 備碳水化合物所需能量成本的約2倍(Penning,爭乂, (1974) 77zeor. 脂.45: 339-377和Sinclair,爭乂, (1975) Sc/e置189: 565-567)。與 此相一致,作為選擇在更高的種植密度的谷粒產量的結果,玉米谷粒 中的蛋白濃度已經下降(Duvick,爭乂 , (1999) 39:
1622-1630)。理想地,用最小量的應用氮來最大化谷粒產量。除了抬升 肥料價格以外,流失和滲掉的硝酸鹽造成不希望的環境效應(Frink, 爭乂, (1999) 96: 1175-1180)。鑒于一條開放途徑是選擇降低的
谷粒蛋白含量(因為更大量的碳水化合物的積累,這可能反映為增加
的谷粒產量),另一途徑是增加光合作用的速率(Leakey,爭乂, (2004) G/o6a/ C/zawge 5z'o/ogy 10: 951 -962)。
考慮到代謝途徑的復雜性,單一基因改變不可能在提高生物量生 產中取得豐碩成果(Morandini,爭乂, (2003) 7>ewt/""尸/a"f S"ewce 8: 70-75)。但是,整個途徑中不同組分的同步提高,可能克服(至少在一 定程度上)代謝途徑的復雜性。基因表達的上游調節因子會輔助實現 該目的(Morandini,爭乂, (2003) 7>e"<^ z力尸/a"f 8: 70-75)。
例如,單個的上游'主調節,基因可以用于改變途徑中多個代謝基因的表 達(Rabinowicz,爭人,(1999) Ge"幼cs 153: 427-444; DellaPenna (2001) 尸/a"f尸/^wo/ 125: 160-153; Morandini, ^1^1, (2003) 7>em^ z力尸/"w/1 5We"ce 8: 70-75)。這些類型的基因稱作轉錄因子(TF)。 TF在更高水平 的分子級系運行,在多種生物學過程中起關鍵作用。這從下述事實顯 而易見約5。/。的擬南芥基因組編碼TF (約1500),它們基于每個組特 有的DNA-結合域,分成約50個不同的組(Riechmann,夢乂, (2000) 5We"ce 290: 2105-2110)。
本領域需要可以使用這樣的主調節序列來調節植物的碳固定和氮 同化作用的方法和組合物。
發明內容
本發明的組合物包含分離的多肽,其包含選自下述氨基酸序列的 氨基酸序列SEQIDNO: 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 51, 54, 57, 60, 63, 66, 69, 72, 75, 78, 80, 82, 85, 88, 91, 94, 97, 100, 103, 106, 109, 112, 115, 118, 121, 124, 127, 130, 133, 135, 138, 141, 144, 154, 155, 156, 157, 158, 159或160,或其變體或片,殳。
所述組合物也包含分離的多核普酸,其包含選自下組的核普酸序 列包含SEQIDNO: 1, 2, 4, 5, 7, 8, 10, 11, 13, 14, 16, 17, 19, 20, 22, 23, 25, 26, 28, 29, 31, 32, 34, 35, 37, 38, 40, 41, 43, 44, 46, 47, 49, 50, 52, 53, 55, 56, 58, 59, 61, 62, 64, 65, 67, 68, 70, 71, 73, 74, 76, 77, 79, 81, 83, 84, 86,87, 89, 90, 92, 93, 95, 96, 98, 99, 101, 102, 104, 105, 107, 108, 110, 111, 113, 114, 116, 117, 119, 120, 122, 123, 125, 126, 128, 129, 131, 132, 134, 136, 137, 139, 140, 142, 143, 146, 147, 148, 149, 150, 151, 152或153的核苷酸序列,或其變體或片段。
另外提供了包含這些序列的表達盒、植物、植物細胞、植物部分 和種子。在具體的實施方案中,所述多核苷酸可操作地連接至組織優 選的啟動子,包括、但不限于,葉優選的啟動子,葉肉優選的啟動子, 維管束鞘優選的啟動子,脈管優選的啟動子,種子優選的啟動子,胚 乳優選的啟動子,或胚優選的啟動子。
提供了調節植物或植物部分中Dof多肽水平的方法。所述方法包 含向植物或植物部分中引入包含本發明的Dof序列的異源多核苷酸。 Dof多肽的水平可以升高或降低。這樣的方法可以用于增加植物的產 量,增加植物的氮利用效率,和/或改進植物的脅迫反應。
本發明的其它組合物包含分離的表達盒,其包含可操作地連接至 葉優選的啟動子或脈管優選的啟動子的多核苷酸,其中所述多核苷酸 選自(a)編碼包含SEQIDNO: 145所述氨基酸序列的Dof多肽的多 核苷酸;(b)編碼包含與SEQIDNO: 145具有至少80°/。序列同 一性的 氨基酸序列的Dof多肽的多核苷酸,其中所述Dof多肽能調節轉錄; (c)當在植物中表達時會降低包含SEQIDNO: 145所述氨基酸序列的 Dof多肽的表達水平的多核苷酸;和,(d)當在植物中表達時會降低包 含與SEQ ID NO: 145具有至少80%序列同 一性的氨基酸序列的Dof 多肽的表達水平的多核苷酸,其中所述Dof多肽能調節轉錄。也提供 了具有該表達盒的植物、植物部分、細胞和種子。
另外提供了提高植物的氮效率、增加植物的產量和改進植物的脅 迫反應的方法。這樣的方法包含向植物中引入異源多核苦酸;和,在 植物中從可操作地連接的葉優選的啟動子或脈管優選的啟動子表達所 述多核苷酸。在這樣的方法中,異源多核苷酸的表達會調節至少一種 包含SEQ ID NO: 145所迷氨基酸序列的Dof多肽或其生物活性變體 或片段的水平。附圖簡述
圖1提供了來自水稻的不同Dof多肽的表征的Dof結構域的比對。
圖2A和2B提供了來自玉米Dof家族的不同成員的Dof結構域的 比對。強調顯示了保守區。在比對的上面闡明了共有的Dof結構域(SEQ ID NO: 145)。
發明詳述
在下文中參考附圖更完整地描述了本發明,其中顯示了本發明的 有些、但不是所有實施方案。實際上,本發明可以以許多不同的形式 來實施,不應當理解為限于本文所述的實施方案;相反,提供了這些 實施方案,使得本公開內容滿足適用的法律要求。數字是指從頭至尾 的元素。
本發明所屬領域的技術人員在具有前面描述所示的教導的益處 后,會明白本文所述的本發明的許多改進和其它實施方案。因此,應 當理解,本發明不限于公開的具體實施方案,且改進和其它實施方案 意在包括在所附權利要求書的范圍內。盡管在本文中采用特定的術語, 它們僅以普通的、描述性的含義使用,不用于限制目的。
I. 概述
提供了用于提高植物或植物部分的氮利用效率、增加植物或植物 部分的碳固定、增加植物的產量或生物量生產、和/或增加植物的脅迫 耐受性的方法和組合物。本發明的組合物和方法會通過調節植物中至 少一種具有Dof結構域的Dof多肽或具有Dof結構域的生物活性變體 或片段的多肽的水平,調節這些不同的表型。
II. 組合物
ADo尸,祐夯^和/庶
本發明的組合物包括Dof多核苷酸和多肽和它們的變體和片段, 它們參與調節轉錄。Dof (代表具有一指的DNA結合(DNA binding with one finger))是在不同植物物種中發現的一個DNA結合蛋白家族。Dof
家族的成員包含Dof結構域或其活性變體或片段,后者是參與DNA結 合的高度保守的氨基酸序列。Dof結構域的特征在于具有C2-C2指結 構的約50個氨基酸的保守區,它與基本區域締合。Dof家族的特定成 員的基本區域可以結合具有5,-T/AAAAG-3,核心的DNA序列。參見, 例如,Ujavetzky, 爭乂, (2003)廚C 5V由,》鮮少3: 17和 Yanagisawa,爭入,(1999)尸/""〃. 17: 209。圖1提供了來自幾種表征 的Dof多肽的Dof結構域的序列比對。Dof結構域的共有序列如SEQ ID NO: 145所述。
本文使用的"Dof,序列包含具有保守的Dof結構域或Dof結構域 的生物活性變體或片段的多肽,或編碼所述多肽的多核苷酸。保守的 Dof 結 構 如 下
C-P誦R國C-X-S-X-[DHN]-T-K國F國C國Y國[FY]-N畫N畫Y畫[NS]-X國X-Q-P-R-[HY]-[ FL]隱C隱[KR]-X國C誦[RKQH]-R陽[YH]-W畫T-X-G陽G畫[TASV]-[LMI]-R (有陰影 的殘基在Dof成員之間高度保守,X代表任意氨基酸,[]圍繞著在該位 置可以發現的列舉的氨基酸)。SEQ ID NO: 145闡明了該保守的結構 域。但是,應當認識到,Dof結構域共有序列中所述的保守序列可以 改變,且仍然保持Dof活性(即,調節轉錄的能力)。參見,例如, Yanagisawa, #vl, (2001)尸/awf Ce〃尸/^w'o/. 42: 813-22,和Lijavetzky, 爭乂, (2003) 5MC Ao/ogy 3: 17和圖1。表2也提供了
來自不同玉米Dof多肽的代表性Dof結構域。當將該結構域置于適當 多肽的背景中時,Dof結構域的生物活性片段和變體將繼續保持調節 轉錄的能力。
在一個實施方案中,本發明提供了分離的Dof多肽,其包含SEQ ID NO: 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 51, 54, 57, 60, 63, 66, 69, 72, 75, 78, 80, 82, 85, 88, 91, 94, 97, 100, 103, 106, 109, 112, 115, 118, 121, 124, 127, 130, 133, 135, 138, 141, 144, 154, 155, 156, 157, 158, 159或160所示的氨基酸序列。另外提供了多核苦酸,其包含SEQ ID NO: 1, 2, 4, 5, 7, 8, 10, 11, 13, 14, 16, 17, 19, 20, 22, 23, 25, 26, 28, 29, 31, 32, 34, 35, 37, 38, 40, 41, 43, 44, 46, 47, 49, 50, 52, 53, 55, 56, 58, 59, 61, 62, 64, 65, 67, 68,
70, 71, 73, 74, 76, 77, 79, 81, 83, 84, 86, 87, 89, 90, 92, 93, 95, 96, 98, 99, 101, 102, 104, 105, 107, 108, 110, 111, 113, 114, 116, 117, 119, 120, 122, 123, 125, 126, 128, 129, 131, 132,
134, 136, 137, 139, 140, 142, 143, 146, 147, 148, 149, 150, 151, 152或153所述的核苷酸序列。在表1中描述了 SEQIDNO: 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 51, 54, 57, 60, 63, 66, 69, 72, 75, 78, 80, 82, 85, 88, 91, 94, 97, 100, 103, 106, 109, 112, 115, 118, 121, 124, 127, 130, 133,
135, 138, 141, 144, 154, 155, 156, 157, 158, 159或160的保守 的Dof結構域。
本發明包括分離的或基本上純化的多核苷酸或蛋白組合物。"分離 的"或"純化的"多核苷酸或蛋白或它們的生物活性部分與實質上或基本 上不含被發現在天然存在的環境中通常與多核苷酸或蛋白相隨或相互 作用的組分。因此,由重組技術制備時,分離的或純化的多核普酸或 蛋白基本上不含其它細胞物質或培養基,當化學合成時基本上不含化 學前體或其它化學藥品。最優地,"分離的"多核苷酸不含有在獲取該多 核苷酸的生物體的基因組DNA中天然側接所述多核苷酸的序列(即位 于多核苷酸5,和3'端的序列)(最優地,蛋白編碼序列)。例如,在多 種實施方案中,分離的多核苷酸可包含在獲取該多核香酸的細胞的基 因組DNA中天然側接該多核苷酸的小于約5 kb、 4kb、 3 kb、 2 kb、 1 kb、 0.5 kb、 O.lkb的核苷酸序列。基本上不含細胞物質的蛋白包括含 有小于約30%、 20%、 10%、 5%或1% (按干重計)的污染蛋白的蛋 白制劑。當重組制備本發明的蛋白或其生物活性部分時,最優地,培 養基具有小于約30%、 20%、 10%、 5%或1% (按干重計)的化學前 體或非目標蛋白的化學物質。
本發明的方法和組合物也包括Dof結構域或Dof多核苷酸的片段 和變體和由此編碼的蛋白。"片段"是指多核苷酸的一部分或氨基酸序列 的一部分。多核苷酸片段可以編碼保留天然蛋白的生物活性并從而調 節轉錄的蛋白片段。或者,用于抑制或沉默(即,降低表達水平)Dof 序列的片段不需要編碼蛋白片段,但是仍然保留抑制目標Dof序列的 表達的能力。另外,用作雜交探針的片段通常不編碼保留生物活性的
片段蛋白。因而,核苷酸序列片段的范圍可以是至少約18個核苷酸, 約20個核苷酸,約50個核苷酸,約100個核苷酸和最高達編碼本發 明蛋白的全長多核苷酸。
編碼Dof結構域或Dof多肽的多核苷酸片段會編碼至少15, 25, 30, 50,跳150, 200, 250, 275, 300, 352, 350, 375, 400, 425, 450, 475, 480個連續氨基酸或最高達全長Dof結構域或Dof蛋白中 存在的氨基酸總數(即,SEQIDNO: 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 51, 54, 57, 60, 63, 66, 69, 72, 75, 78, 80, 82, 85, 88, 91, 94, 97, 100, 103, 106, 109, 112, 115, 118, 121, 124, 127, 130, 133, 135, 138, 141, 144, 154, 155, 156, 157, 158, 159或160)。用作雜交探針、PCR引物或抑制 構建體的Dof結構域或Dof多核苷酸的片段通常不需要編碼Dof蛋白 或Dof結構域的生物活性部分。
可以如下制備Dof結構域或Dof蛋白的生物活性部分分離Dof 多核苷酸的一部分,表達Dof蛋白的編碼的部分(例如,通過體外重組 表達),和評-f介Dof蛋白的編碼的部分的活性。作為Dof結構域或Dof 核苷酸序列的片段的多核普酸包含至少16, 20, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 800, 900, 1,000, 1,100, 1,200, 1,300, 1,400, 1,500, 1,600, 1,700, l,訓, 1,900, 2,000, 2,050, 2,080個連續核苷酸或最高達全長Dof結構域或 Dof多核苷酸中存在的核苷酸數目(即,SEQIDNO: 1, 2, 4, 5, 7, 8, 10, 11, 13, 14, 16, 17, 19, 20, 22, 23, 25, 26, 28, 29, 31, 32, 34, 35, 37, 38, 40, 41, 43, 44, 46, 47, 49, 50, 52, 53, 55, 56, 58, 59, 61, 62, 64, 65, 67, 68, 70, 71, 73, 74, 76, 77, 79, 81, 83, 84, 86, 87, 89, 90, 92, 93, 95, 96, 98, 99, 101, 102, 104, 105, 107, 108, 110, 111, 113, 114, 116, 117, 119, 120, 122, 123, 125, 126, 128, 129, 131, 132, 134, 136, 137, 139, 140, 142, 143, 146, 147, 148, 149, 150, 151, 152或153)。
"變體"意在表示基本上相似的序列。對于多核苷酸,變體包含在天 然多核苷酸內的一或多個內部位點的一或多個核苷酸的缺失和/或添
加,和/或在天然多核苷酸的一或多個位點的一或多個核苷酸的取代。 本文使用的"天然的"多核苷酸或多肽分別包含天然存在的核苷酸序列 或氨基酸序列。對于多核苷酸,保守變體包括由于遺傳密碼的簡并性,
編碼Dof多肽或Dof結構域之一的氨基酸序列的那些序列。可使用公 知的分子生物學技術,例如下文概述的聚合酶鏈反應(PCR)和雜交技 術,鑒定諸如這些天然存在的等位變體。變體多核苦酸還包括通過合 成獲得的多核苷酸,例如通過例如定點誘變生成、但仍然編碼能調節 轉錄或能降低(即,抑制或沉默)Dof多核苷酸的表達水平的Dof結構域 或Dof多肽的多核苷酸。 一般而言,本發明的特定多核苷酸的變體與 該特定多核苷酸將具有至少至少約40°/。、 45%、 50%、 55%、 60%、 65%、 70%、 75%、 80%、 85%、 90%、 91%、 92%、 93%、 940/0、 95%、 96%、 97%、 98%、 99%或更高的序列同一性,如通過本文其它地方說明的序 列比對程序和參數所確定的。
也可以通過比較由變體多核苷酸編碼的多肽和由參照多核苷酸編 碼的多肽之間的序列同一性百分比,對本發明的特定多核苷酸(即參 照多核苷酸)的變體進行評價。因此,例如,公開了編碼與SEQIDNO: 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 51, 54, 57, 60, 63, 66, 69, 72, 75, 78, 80, 82, 85, 88, 91, 94, 97, 100, 103, 106, 109, 112, 115, 118, 121, 124, 127, 130, 133, 135, 138, 141, 144, 154, 155, 156, 157, 158, 159或160的 多肽具有給定的序列同一性百分比的多肽的分離的多核苷酸。任何兩 條多肽之間的序列同 一性百分比可以使用在本文其它地方說明的序列 比對程序和參數計算得出。在通過比較多核苷酸編碼的兩條多肽之間 的序列同 一性百分比來對本發明的任何給定的多核苷酸對進行評價 時,兩條被編碼的多肽之間的序列同一性百分比是至少約40%、 45%、 50%、 55%、 60%、 65%、 70%、 75%、 80%、 85%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%、 99%或更高的序列同 一性。
"變體"蛋白意在表示通過在天然蛋白的一或多個內部位點的一或 多個氨基酸的缺失或添加和/或在天然蛋白的一或多個位點的一或多個 氨基酸的取代,從天然蛋白衍生的蛋白。本發明包含的變體蛋白是有 生物活性的,也就是說它們仍然具有想要的天然蛋白的生物活性,即 在本文所述的調節轉錄。這些變體可因為例如遺傳多態性或或因為人
為操縱而產生。如通過在本文其它地方說明的序列比對程序和參數所
確定的,本發明Dof蛋白或Dof結構域的生物活性變體與Dof蛋白 或共有Dof結構域的氨基酸序列具有至少約40%、 45%、 50%、 55%、 60%、 65o/o、 70%、 75o/o、 80%、 85%、 90%、 910/。、 92%、 93%、 94%、 95%、 96%、 97%、 98%、 99%或更高的序列同 一性。本發明Dof蛋白 或Dof結構域的生物活性變體與該蛋白的區別在于少至1-15個氨基酸 殘基、少至1-10個例如6-10個、少至5個、少至4個、少至3個、少 至2個或甚至少至1個氨基酸殘基。
本發明的多核苷酸可以通過多種方式被改變,包括氨基酸取代、 缺失、截短和插入。這些操作的方法是本領域普遍已知的。例如,可 以通過DNA中的突變,制備Dof蛋白或Dof結構域的氨基酸序列變 體和片段。誘變和多核苷酸改變的方法是本領域公知的。見例如Kunkel (1985)尸rac, A^/.爿c^/. S" f/&4 82: 488-492; Kunkel爭乂(1987) M^/zo& z力五"2ywo/. 154: 367-382;美國專利號4,873,192; Walker和 Gaastra , 編.(1983) 7fec/m一es z力 M /ecw/ar 歷o/ogy (MacMillan Publishing Company, New York)以及其中引用的參考文獻。關于不影響 目標蛋白的生物活性的合適的氨基酸取代的指導,可見Dayhoff爭入 (1978)爿f/(3w o/ 7Vo^z'w 5^《wewce S/rw"wre (Natl. Biomed. Res. Found., Washington, D.C.)的模型,該文獻在本文中引作參考。保守取 代,例如將一個氨基酸與另一個具有相似性質的氨基酸交換,可能是 最優的。
式。同樣地,本發明^I蛋白包括:然存在的^白及其變體和經修飾形 式。這些變體仍然具有希望的活性(即,調節轉錄或降低目標Dof序列 的表達水平的能力)。在具體實施方案中,將在編碼變體的DNA中進 行的突變不會將序列置于讀碼框之外,且不會產生能夠形成二級 mRNA結構的互補區域。參見,EP專利申請
發明者C·R·西蒙斯, J·劉, K·S·杜加, R·古普塔 申請人:先鋒高級育種國際公司