專利名稱:用于控制雙子葉植物花發育的兩個遺傳元件的組合及在檢測和選擇方法中的應用的制作方法
技術領域:
本發明涉及植物變種的選擇,尤其是植物性型的選擇領域。本發明涉及通過基因A 和基因G的多態性分析進行的植物性別的基因型檢測,以及所述檢測的應用手段和獲得性表型改變的植物的方法。
背景技術:
雜種植物的產生在農學和農業中具有重要意義。實際上,由于雜種優勢 (heterosis,也稱為雜種優勢(hybrid vigour))現象,相對于其兩個親本的平均值,雜種植物顯示許多性狀的優越性。此優越性可以表現為,例如雜種相對于其親本的更好的活力、更好的產率、對栽培雜種的培養基更高的適應性和更大的均一性。當親本在遺傳上距離更遠時,此雜種優勢甚至更大。建立純而穩定的品系(未來的雜種親本)是建立表現最大雜種優勢的純系和可育雜種變種必不可少的步驟。因此,有必要建立純而穩定的品系,然后雜交這些品系來獲得雜種。純系的建立涉及植物的自花受精,以獲得具有同一生殖質,對所有需要的生產力、 產量的規律性或對疾病的抗性性狀固定的植物。因此有必要使用其性型允許自花受精的植物,例如雌雄同株同花植物來建立純系。現在,許多雙子葉植物,尤其是葫蘆科(Cucurbitaceae)可以是雌雄同株異花 (monoecious)、雄花兩性花同株(andromonoecious)、全雌花性(gynoecious)或雌雄同株同花(hermaphroditic)。用來獲得純系的第一種技術包括植物的化學處理,以獲得可以自花受精的植物, 例如雌雄同株同花植物。例如在甜瓜(Cucumis melo)中,噴灑乙烯合成的抑制劑,如硝酸銀或硫代硫酸銀導致雄蕊暫時出現在雌性花中(Rudich等,1969 ;Risser等,1979)。以這種方式,用全雌花性植物轉化為雌雄同株同花植物來保持純系。但是,通過此方法產生純系受化學品成本、其作用持續時間及其植物毒性作用限制。此外,就從具有長開花期的植物產生雜種而言,這類物質可以無效,因為處理后出現的新花可不受該化學處理影響。因此,存在對使得可能控制雙子葉植物花型發育和獲得確定花型的植物的系統的需要。此外,有必要進行大量雜交,以從純系獲得目的雜種,并在每一雜交時保留具有最有前景的表型的幼苗。當將純系彼此雜交時,能夠選擇進行雜交的方向并避免植物的自花傳粉很重要, 自花傳粉可導致不具有所需的雜種優勢的植物。
同樣,由于雙子葉植物性型的多樣性,有必要分離同一幼苗的雄性花和雌性花以防止自花傳粉。第一種技術(尤其用于玉米)包括使用機械手段來去雄植物。但是,此技術證明是極其昂貴的,因為對于所進行的每一雜交,該技術需要去雄待防止其自花傳粉的每株植物。另一技術包括進行植物的化學去雄,阻斷有活力的花粉的形成。因此,在甜瓜中, 用乙烯利(乙烯前體)處理雌雄同株異花植物導致雄性花的暫時不出現。如上文所述,用來產生短暫雄性不育的稱為去雄劑的化學品有幾個缺點,如高成本或相當大的毒性。因此,上文所述的用于控制花型的機械或化學技術證明非常昂貴,尤其是因為有必要進行大量雜交來獲得具有所需性狀和可以推向市場的雜種植物。因此,為了便于建立純系和雜種,還存在對使得可能控制雙子葉植物花型發育和獲得確定花型的植物的系統的需要。獲得可以用于建立純系的能夠自花傳粉的植物或不能自花傳粉的植物來建立雜種的另一方式可以分別包括選擇一個物種中存在的完全雌雄同株同花的個體,或完全雌性的個體。但是,這種技術也證明極其昂貴,因為其需要栽培大量植物,直到可能確定它們的性型。此外,此技術是隨機的,因為花的性決定機制尤其依賴于環境因素。根據另一途徑,已存在鑒定和表征甜瓜中涉及控制花型的遺傳決定子的嘗試。在甜瓜中,性決定的遺傳控制由兩個主要的遺傳決定子控制,分別是(1)雄花兩性花同株遺傳決定子(“a”)和(2)全雌花性遺傳決定子(“g”),每個決定子具有至少兩個等位基因, 其組合產生多種性表型。NO.W02007/125264下公開的PCT國際申請描述了遺傳決定子(a) 的鑒定和表征,發現其由編碼氨基環丙烷羧酸合酶(ACS)的基因組成。因此,PCT申請No. WO 2007/125264提供了使得可能選擇或產生具有顯性等位基因(A)或隱性等位基因(a)的雙子葉植物的檢測和控制手段。遺傳決定子(g)仍然完全未知。目前,初步的數據表明,具有未知性質和結構的遺傳決定子(g)可位于由命名為M8和M30的標記定界的超過2. 4兆堿基對的寬基因組區內。因為通常假設100千堿基對的植物基因組中平均存在12個可讀框 (“0RF” ),所以定界在標記M8和M30之間的基因組區域可能包含約300個可讀框。但是,在缺乏對第二全雌花性遺傳決定子(或“g”)的表征的情況下,不可能使公眾能夠得到選擇或控制花型發育的手段,以使得可能例如區分或產生嚴格雌性的植物群體,因為此表型完全由遺傳決定子(g)控制。此外,只有在鑒定和表征遺傳決定子(g)之后, 才可能選擇或獲得完全雌雄同株同花的植物群體。因此,存在對使得可能在不必栽培它們的情況下選擇例如雌雄同株同花或雌性雙子葉植物的方法的需要。此方法應使得可能選擇尤其是可以用來產生上文所述的純系或雜種的植物。發明_既述根據本發明,已鑒定和表征了全雌花性遺傳決定子來控制雙子葉植物花的發育, 該雙子葉植物是被子植物,且更確切而言是葫蘆科的植物。全雌花性遺傳決定子(g)的鑒定和表征首次使得可能發展雄花兩性花同株(a)和全雌花性(g)兩個遺傳決定子的組合,其允許完全控制雙子葉植物的花型發育,無論所考慮的是哪種性表型。
7
因此,本發明提供兩個遺傳元件(A/a)和(G/g)的組合,其使得可能控制雙子葉植物,尤其是葫蘆科成員如甜瓜的花型發育。現有技術中已顯示,在生理學上,兩個等位基因(A)和(a)彼此的不同在于蛋白質氨基丙烷羧酸合酶(也稱為ACS)的不同的酶活性水平。本發明人現已顯示,在生理學上,本發明鑒定和表征的等位基因(G)和(g)彼此的不同在于新蛋白質,蛋白質CmWIPl的不同水平。因此,本發明涉及用于控制雙子葉植物花型發育的兩個遺傳元件的組合,所述組合分別包括a)以顯性等位基因㈧和隱性等位基因(a)的形式存在于所述雙子葉植物中的第一遺傳控制元件(A/a),其中-顯性等位基因(A)由允許蛋白質ACS(氨基丙烷羧酸合酶)表達的核酸(NA)組成,-隱性等位基因(a)與顯性等位基因的不同在于在所述雙子葉植物中無功能的核酸(NA),和b)以顯性等位基因(G)和隱性等位基因(g)的形式存在于所述雙子葉植物中的第二遺傳控制元件(G/g),其中-顯性等位基因(G)由允許蛋白質CmWIPl表達的核酸(NG)組成,-隱性等位基因(g)與顯性等位基因的不同在于在所述雙子葉植物中無功能的核酸(NG),其理解為,至少將該第二遺傳控制元件人為弓I入所述雙子葉植物中。在本發明的組合的某些實施方案中,對于第二遺傳控制元件(G/g),顯性等位基因 (G)和隱性等位基因(g)各自的特征如下-顯性等位基因(G)由核酸(NG)組成,其包含(i)在雙子葉植物中有功能的調節性多核苷酸(PG),和(ii)其表達受該調節性多核苷酸(PG)調節的核酸,所述核酸編碼蛋白質CmWIPl,-隱性等位基因(g)與顯性等位基因(G)的不同在于(i)核酸(NG)不存在于該植物中,或(ii)在雙子葉植物中無功能的調節性多核苷酸0 ),或(iii)對活性蛋白質CmWIPl的表達無功能的核酸(Ng)。蛋白質ACS包括序列SEQ ID No. 3的蛋白質或與序列SEQ ID No. 3的蛋白質具有至少90%氨基酸同一性,優選至少91%、92%、93%、94%、95%、96%、97%、98%或99%氨
基酸同一性的蛋白質。蛋白質CmWIPl包括序列SEQ ID No. 12的蛋白質或與序列SEQ IDNo. 12的蛋白質具有至少90%氨基酸同一性,優選至少91%、92%、93%、94%、95%、96%、97%、98%或 99%氨基酸同一性的蛋白質。蛋白質CmWIPl還包括序列SEQ ID No. 16的蛋白質或與序列SEQ ID No. 16的蛋白質具有至少90%氨基酸同一性,優選至少91%、92%、93%、94%、 95%、96%、97%、98%或99%氨基酸同一性的蛋白質。在本發明的組合的某些實施方案中,對于第二遺傳控制元件(A/a),顯性等位基因 (A)和隱性等位基因(a)各自的特征如下
-顯性等位基因(A)由核酸(NA)組成,其包含(i)在雙子葉植物中有功能的調節性多核苷酸(PA),和(ii)其表達受該調節性多核苷酸(PA)調節的核酸,所述核酸編碼蛋白質ACS(氨基丙烷羧酸合酶),-隱性等位基因(a)與顯性等位基因㈧的不同在于(i)核酸(NA)不存在于該植物中,或(ii)在雙子葉植物中無功能的調節性多核苷酸0 ),或(iii)對活性蛋白質ACS的表達無功能的核酸(Na)。本發明還涉及這樣的調節性多核苷酸(PG)和(Pg)。本發明還涉及用于獲得性表型已改變的轉化的植物,以及這種植物的部分,尤其是其種子的方法。本發明還涉及下文更詳細定義的蛋白質CmWIPl或此蛋白質的片段,以及針對蛋白質CmWIPl的抗體。本發明還涉及用于檢測等位基因㈧、(a)、(G)和(g)在樣品中的存在的方法。附圖描述
圖1顯示基因座g的定位克隆。圖IA顯示染色體4上的基因座g的物理和遺傳圖譜。該基因座以兩個標記M261 和M335為界。虛線顯示這些遺傳標記在多個克隆BAC中的位置。圖IB以它們的方向預測顯示見于BAC 102中的8個可讀框或0RF(寬箭頭)的示意圖。三角形標記代表稱為Gyno-hAT的DNA轉座子的插入,其序列描述于SEQ ID No. 14 中。正是此轉座子的插入誘導了 CmWIPl基因啟動子的甲基化并導致其失活。圖IC是基因座g附近兩個關鍵重組事件的高分辨率作圖。顯示了多態性SNP,重組體P63. 2和87. 94確定了 1. 4kb的最終區域。圖2顯示在插入基因座g的轉座子DNA上進行的對內切核酸酶McrBr敏感的半定量PCR擴增的結果。正義引物位于轉座子序列中,而反義引物位于鄰接轉座子的基因組序列上。在不用內切核酸酶消化基因組DNA Gynadou的情況下,通過PCR擴增導致強擴增,表明轉座子在此基因座上的存在。用內切核酸酶McrBC預消化后通過PCR擴增未顯示任何擴增,這表明轉座子的非常高的甲基化水平。無論提供什么支持均未針對PI124112獲得擴增,因為轉座子未插入基因座G。圖3顯示基因座g上的甲基化分析。圖3A顯示針對雌雄同株異花基因型(G_)PI124112和全雌花性基因型 Gynadou (gg),通過McrBR敏感的半定量PCR在最靠近基因座g的三個可讀框或ORF上進行的擴增。擴增隨著用McrBC預消化而缺乏表明DNA甲基化的存在。消化寡核苷酸以產生鄰接針對各ORF預測的轉錄起始位點的擴增子(包含一部分啟動子和一部分第一外顯子)。圖;3B顯示DNA的甲基化和CmWIPl基因的結構。黑箭頭表示通過“5' RACE”技術確定的轉錄起始位點,黑框表示兩個外顯子,第二外顯子后的符號表示通過“3' RACE”技術確定的“3' UTR”序列末端。用符號在基因的3'端區域上表示轉座子的插入。通過用McrBC敏感的定量PCR擴增來測定CmWIPl完整序列中的DNA甲基化。每個值對應于來自至少3株植物,每個PCR 反應進行三次的平均值。圖3C顯示通過用亞硫酸氫鹽測序進行的胞嘧啶甲基化分析。用亞硫酸氫鹽處理后,擴增對應于啟動子的高度甲基化部分的兩個擴增子。通過直條顯示甲基化胞嘧啶的百分比。圖4顯示甜瓜(C.melo)不同基因庫的基因座g上的甲基化分析。W1998、Bulgaria 14,Paul和Gynadou是等位基因g純合的。PI161375、Vedrantais和PI124112是等位基因 G純合的。圖4A顯示通過PCR擴增來在多個基因庫中篩查轉座子在基因座g上的插入的實驗。為了驗證插入的存在(上行),正義引物位于轉座子序列中,反義引物位于鄰接該轉座子的基因組序列中,其中用鄰接插入位點的兩條引物來驗證轉座子的缺乏(下行)。圖4A顯示多個基因庫中在CmWIPl基因上進行的McrBr敏感的半定量PCR擴增的結果。用McrBr消化后擴增的缺乏表明DNA甲基化的存在。圖5顯示CmWIPl的信使RNA的表達譜分析。通過定量PCR分析了 CmWIPl的表達水平。每個值對應于來自至少三株植物的平均值。用遍在基因肌動蛋白基因的表達水平歸一化CmWIPl的表達水平。圖6顯示通過定量PCR在一組直至階段6的花芽中分析的CmWIPl表達水平的分析結果。每個值對應于來自至少三株植物的平均值。用遍在基因肌動蛋白基因的表達水平歸一化CmWIPl的表達水平。圖7顯示通過TILLING技術鑒定的花表型的觀察結果。與突變體P193L —樣,將突變體S306F主莖的花與雌雄同株異花親本的野生型雄性花和雌性花相比較。與突變體 P193L—樣,突變體S306F的花清楚地在第四螺旋(spiral)中顯示子房的發育。突變體 L77F是弱突變體。Ov 子房;St 雄蕊。圖8A顯示獲自具有表型㈧的植物[上行]和具有表型(a)的植物[下行]的 ACS基因信使RNA片段的比對,并顯示區分(A)和(a)的核苷酸點突變。圖8B顯示由圖8A中的核酸編碼的氨基酸序列的比對,包括具有表型㈧的植物 [上行]和具有表型(a)的植物[第二行],并顯示區分(A)和(a)的氨基酸點突變。圖9顯示具有甜瓜等位基因A或a的擬南芥(Arabidopsis thaliana)轉基因植物的顯微照片。圖9A和9B顯示,用等位基因A轉化的植物的長角果(圖9A-Cm-A和圖9B) 比野生植物(Col-O)和用等位基因(a)轉化的植物的長角果短。發明詳述根據本發明,已鑒定和表征了與之前在現有技術中描述的遺傳決定子(A/a)相組合,在葫蘆科中控制花型發育的遺傳決定子(G/g)。遺傳決定子(G/g)的鑒定和表征首次向本領域技術人員提供了選擇或產生具有所希望的性表型的雙子葉植物,尤其是具有所希望的性表型的葫蘆科植物如甜瓜的可能性。如下文表1中所示,可回顧等位基因(A)控制植物的雄花兩性花同株性狀,而等位基因(G)控制植物的全雌花性性狀。
表 1
表型基因型花型雌雄同株異花A-G-雄性和雌性雄花兩性花同株aaG -雄性和兩性雌雄同株同花aagg兩性全雌花性A-gg雌性表1顯示雙子葉植物的基因型和花的性表型之間的對應關系。本發明人現已顯示,在生理學上,本發明已鑒定和表征的兩個等位基因(G)和(g) 的不同在于新蛋白質,蛋白質CmWIPl的不同水平。通過與已知蛋白質的序列比較,本發明人顯示,可將新蛋白質CmWIPl分類在WIP 型鋅指蛋白質家族中,該家族存在于包括雙子葉植物、單子葉植物、裸子植物和蘚類植物的多種植物中。從遺傳的觀點看,本發明人顯示,等位基因(g)與等位基因(G)的不同在于與具有等位基因(G)的植物相比,植物中低水平的蛋白質CmWIPl,或者相對于具有等位基因(G)的植物所產生的蛋白質CmWIP 1,產生突變的蛋白質CmWIP 1。本發明人還顯示,等位基因(G)對等位基因(g)是顯性的。如已經指出的那樣,現有技術中已顯示,在生理學上,兩個等位基因㈧和(a)的不同在于蛋白質氨基丙烷羧酸合酶(也稱為ACS)酶活性的不同水平,該蛋白質是涉及乙烯合成的蛋白質。現在,多項研究已顯示,葫蘆科的花生物學基因編碼涉及乙烯生物合成或調節途徑的蛋白質(Kamachi 等,1997 ;Kahana 等,2000)。之前還已顯示,等位基因(a)在生理上與等位基因(A)的不同在于與具有等位基因(A)的植物相比,植物中低水平的蛋白質ACS酶活性。還已顯示,等位基因(A)在心皮的promordia中表達,正是此表達阻斷了雄蕊的發育。等位基因A的表達缺乏,或獲自例如TILLING篩選的突變形式的蛋白質或獲自具有突變A57V的等位基因“a”的蛋白質的表達不阻斷雄蕊的發育。最后,還已顯示等位基因(A) 對等位基因(a)是顯性的。不希望受任意理論的限制,本發明人認為,可以將通過基因(G/g)和(A/a)的等位基因組合控制花型發育的系統推廣至雙子葉植物綱(Dicotyledoneae),包括葫蘆科。因此,本發明涉及用于控制雙子葉植物花型發育的兩個遺傳元件的組合,所述組合分別包括a)以顯性等位基因㈧和隱性等位基因(a)的形式存在于所述雙子葉植物中的第一遺傳控制元件(A/a),其中-顯性等位基因㈧由允許蛋白質ACS(氨基丙烷羧酸合酶),優選序列SEQID No. 3的蛋白質ACS表達的核酸(NA)組成,
-隱性等位基因(a)與顯性等位基因的不同在于在所述雙子葉植物中無功能的核酸(NA),和b)以顯性等位基因(G)和隱性等位基因(g)的形式存在于所述雙子葉植物中的第二遺傳控制元件(G/g),其中-顯性等位基因(G)由允許蛋白質CmWIPl,優選序列SEQID No. 12的蛋白質 CmffIPl表達的核酸(NG)組成,-隱性等位基因(g)與顯性等位基因的不同在于在所述雙子葉植物中無功能的核酸(NG),和其理解為,至少將第二遺傳控制元件人為弓I入所述雙子葉植物中。表征等位基因(a)的非功能性核酸(NA)包含編碼以下的核酸⑴與SEQ ID No. 3 的蛋白質不同的蛋白質,包括突變的蛋白質A57V;或(ii)相對于SEQ ID No. 3的蛋白質突變并導致失活的酶的其他任意形式的蛋白質;或(iii)其他非功能性ACS ;或(iv)不表達的等位基因。上文所述的兩個遺傳元件的組合使得可能控制和/或改變雙子葉植物花的性別, 并因此而相對于現有技術中使用的機械控制系統(其通常昂貴)或化學藥品(其通常有
毒)非常有利。在本發明的意義內,“等位基因”指在一對同源染色體上占據一個位點或基因座的基因形式之一。基因的等位基因涉及同一遺傳性狀,但可以決定不同的表型。顯性等位基因是其表型表達水平比同源等位基因(稱為隱性)的表型表達水平高的等位基因。顯性可以是完全顯性或部分顯性。隱性等位基因是只有在植物從其兩個親本中的每一個獲得相同的等位基因時才在表型中表達的等位基因。相反,若存在顯性同源等位基因,則隱性等位基因的表達被掩蔽。因此,上文定義的組合以各對應于一種表型的不同狀態的形式存在。當第一遺傳控制元件(A/a)以等位基因(A)的形式存在于雙子葉植物中時,該植物具有雌雄同株異花或全雌花性表型。當第一遺傳控制元件(A/a)以等位基因(aa)的形式存在于植物中時,該植物具有雌雄同株同花或雄花兩性花同株表型。當存在于雙子葉植物中的第二遺傳控制元件(G/g)是等位基因(G)的形式時,該植物具有雌雄同株異花或雄花兩性花同株表型。當第二遺傳控制元件(G/g)以等位基因(gg)的形式存在于植物中時,該植物具有雌雄同株同花或全雌花性表型。表1中總結了等位基因和表型之間的對應關系。在本發明的組合的某些實施方案中,對于第二遺傳控制元件(G/g),顯性等位基因 (G)和隱性等位基因(g)各自的特征如下-顯性等位基因(G)由核酸(NG)組成,其包含(i)在雙子葉植物中有功能的調節性多核苷酸(PG),和(ii)其表達受該調節性多核苷酸(PG)調節的核酸,所述核酸編碼序列SEQ ID No. 12的蛋白質CmWIPl( “甜瓜鋅指蛋白質”),
12
-隱性等位基因(g)與顯性等位基因(G)的不同在于(i)核酸(NG)不存在于該植物中,或(ii)在雙子葉植物中無功能的調節性多核苷酸0 ),或(iii)對活性蛋白質CmWIPl的表達無功能的核酸(Ng)。在本發明的組合的某些實施方案中,對于第一遺傳控制元件(A/a),顯性等位基因 (A)和隱性等位基因(a)各自的特征如下-顯性等位基因㈧由核酸(NA)組成,其包含(i)在雙子葉植物中有功能的調節性多核苷酸(PA),和(ii)其表達受該調節性多核苷酸(PA)調節的核酸,所述核酸編碼序列SEQ ID No. 3的蛋白質ACS (氨基丙烷羧酸合酶),-隱性等位基因(a)與顯性等位基因(A)的不同在于(i)核酸(NA)不存在于該植物中,或(ii)在雙子葉植物中無功能的調節性多核苷酸0 ),或(iii)對活性蛋白質ACS的表達無功能的核酸(Na)。本說明書的其余部分提出了構成本發明的控制系統的部分的第一和第二遺傳控制元件的變體或優選實施方案。本發明的兩個遺傳控制元件的組合中的顯性等位基因(G)的形式的遺傳控制元件G/g一般而言,相對于等位基因(G)不存在于所述植物中時觀察到的水平,以顯性等位基因(G)的形式存在于植物中的遺傳控制元件G/g使得可能獲得更高水平的蛋白質 CmffIPlo在本說明書的其余部分中,認為“高水平”的蛋白質CmWIPl對應于在其基因組中包含顯性等位基因(G)的植物中測量的蛋白質CmWIPl的平均水平,而“低水平”的蛋白質 CmWIPl對應于在其基因組中不包含顯性等位基因(G)的植物中觀察到的蛋白質CmWIPl的平均水平。顯性等位基因(G)由核酸(NG)組成,其包含(i)在雙子葉植物中有功能的調節性多核苷酸(PG),和(ii)其表達受該調節性多核苷酸(PG)調節的核酸,所述核酸編碼序列SEQ ID No. 12的蛋白質CmWIPl。-功能性調節性多核苷酸(PG)本發明的功能性調節性多核苷酸或啟動子(PG)由允許序列SEQ IDNo. 12的蛋白質CmWIPl在雙子葉植物中表達的核酸組成。作為實例,這種啟動子包含序列SEQ ID No. 13的核酸或由其組成,其定位于序列 SEQ ID No. 10的CmWIPl基因的核酸的1位核苷酸至四99位核苷酸。因此,在其中第二遺傳元件由等位基因G組成的本發明的兩個遺傳元件的組合的實施方案中,調節性多核苷酸(PG)可以由這樣的多核苷酸組成,該多核苷酸包含以下或由以下組成(i)從序列SEQ ID No. 10的核苷酸1至核苷酸四99的核苷酸序列;或(ii)與 SEQ ID No. 10的序列14999具有至少90%核苷酸同一性且具有功能的序列;或(iii)前述序列(i)和(ii)的具有功能的片段。
本發明還涉及上文定義的調節性多核苷酸(PG),以及將在標題為“本發明的核酸” 的部分中更詳細地討論的此核酸的片段。本發明的功能性調節性多核苷酸(PG)還可以由已知指導編碼蛋白質CmWIPl的核酸序列組成型或組織特異性表達的啟動子組成。因此,本發明的功能性調節性多核苷酸(PG)可以選自組織特異性啟動子,如 Theissen等,2001所述的A、B、C、D和E類“MADS盒”家族基因的啟動子,或同源異形基因的任意其他啟動子。因此,本發明的功能性調節性多核苷酸(PG)可以選自-花椰菜花葉病毒的啟動子35S,或啟動子19S或有利地是描述于Kay等,1987的文章中的雙組成型啟動子35S(pd35S),-包含于McElroy等,1991所描述的pActl_F4質粒中的后接ri3肌動蛋白內含子的ri3肌動蛋白啟動子(pAR-IAR),-描述于PCT申請No.WO 90/02172或AXELOS等(1989)的文章中的編碼植物延伸因子的基因的組成型啟動子EF-I α ;-由3拷貝具有根癌農桿菌(Agrobacteriumtumefaciens)章魚堿合酶基因啟動子轉錄活性的元件與根癌農桿菌甘露堿合酶基因啟動子的轉錄激活元件融合組成的嵌合超級啟動子(superpromoter)PSP(NI 等,199 ;和-向日葵的泛蛋白啟動子(BINET等,1991);-玉米泛蛋白1的啟動子(CHRISTENSEN等,1996)。本發明的功能性調節性多核苷酸(PG)還可以由誘導型啟動子組成。因此,本發明涉及之前定義的用于控制雙子葉植物花型的兩個遺傳元件的組合, 其中調節性多核苷酸(PG)對誘導信號的作用敏感,且優選地,其中調節性多核苷酸(PG)是轉錄或翻譯的誘導性多核苷酸激活劑。當激活轉錄或翻譯的調節性多核苷酸直接或間接對激活誘導信號的作用敏感時, 其在本發明的意義中是“誘導性激活”多核苷酸。根據本發明,“誘導性激活”型調節性多核苷酸是僅在外部信號存在下激活的調節序列。所述外部信號可以是轉錄因子的固定,且可以在調節性多核苷酸直接或間接對其敏感的激活誘導信號的作用下誘導轉錄因子的固定。當將這種核酸結構(construction)用于細胞宿主中時,可以通過使轉化的細胞宿主與激活調節性多核苷酸直接或間接對其敏感的激活誘導信號接觸,來誘導編碼本發明的蛋白質CmWIPl的多核苷酸的表達。當希望此轉化的細胞宿主中缺乏編碼多肽CmWIPl的多核苷酸的表達時,則充分消除或抑制轉錄或翻譯的調節性多核苷酸對其敏感的激活誘導信號的存在。本領域技術人員可求助于他在調節性多核苷酸,尤其是在植物中有活性的調節性多核苷酸方面的一般技術知識來定義對應于以上實施方案的定義的結構。能夠控制編碼蛋白質CmWIPl的核酸的調節序列可以是可通過特定代謝物誘導的調節序列,如-AOYAMA等(1997)所描述或McNELLYS等(1998)所描述的可由糖皮質激素誘導的調節序列;
-可由乙醇誘導的調節序列,如SALTER等(1998)所描述或CADDICK等(1998)所描述的調節序列;-可由四環素誘導的調節序列,如由CL0NTECH公司銷售的調節序列;-可由病原體或病原體產生的代謝物誘導的啟動子序列;-可由水楊酸或BTH或Aliette誘導的I3R型基因的調節序列(Gorlach等,1996; Molina 等,1998);-可由例如隸屬于二苯甲酰胼家族的蟲酰胼(產品索引RH5992,由R0HM&HAAS銷售)誘導的蛻皮激素受體型的調節序列(Martinez等,1999)。-編碼蛋白質CmWIPl的核酸優選地,編碼蛋白質CmWIPl的核酸從5'端至3'至少包含(i)與從序列SEQ ID No. 10的核苷酸3000至核苷酸3617的多核苷酸具有至少 95%同一性的一條序列,和(ii)與從序列SEQ ID No. 10的核苷酸M58至核苷酸5901的多核苷酸具有至少 95%同一性的一條序列。在其他實施方案中,編碼蛋白質CmWIPl的核酸包含核苷酸序列SEQID No. 11。本發明的系統的隱性等位基因(g)的形式的遺傳控制元件G/g一般而言,當存在于基因組中不包含顯性等位基因(G)的植物中時,隱性等位基因(g)形式的遺傳控制元件(G/g)不允許獲得與存在等位基因(G)時獲得的一樣高的蛋白質CmWIPl的水平。因此,可將等位基因(g)定義為使得不可能獲得與等位基因(G) —樣高的CmWIPl 水平的對應于等位基因(G)的任意基因型改變。隱性等位基因(g)與顯性等位基因(G)的不同在于(i)核酸(NG)不存在于該植物中,或(ii)在雙子葉植物中無功能的調節性多核苷酸0 ),或(iii)對失活的蛋白質CmWIPl的表達無功能的核酸(Ng)。作為實例,通過序列SEQ ID No. 15的核酸來說明隱性等位基因(g)形式的控制元件G/g的一個實施方案,該核酸是編碼CmWIPl的序列的等位基因,其中存在命名為 “Gyno-hAT”的轉座子核酸。在序列SEQ IDNo. 15的核酸中,Gyno-hAT轉座子定位于序列 SEQ ID No. 15的7167位核苷酸至15412位核苷酸。在序列SEQ ID No. 14的核酸中,Gyno-hAT轉座子定位于序列SEQID No. 14的10 位核苷酸至8246位核苷酸。-非功能性多核苷酸調節子(Pg)本發明的非功能性調節性多核苷酸(Pg)或啟動子是這樣的核酸,其(i)不允許序列SEQ ID No. 12的蛋白質CmWIPl在宿主細胞中表達,或(ii)與用調節性多核苷酸(PG)觀察到的水平相比,允許此蛋白質以低水平表達, 或(iii)與用調節性多核苷酸(PG)觀察到的表達相比,允許蛋白質CmWIPl在植物一生中表達較短的時間。在非功能性調節性多核苷酸(Pg)的某些實施方案中,所述多核苷酸(Pg)是甲基化的。例如,調節性多核苷酸(Pg)可以由甲基化核酸形式的調節性多核苷酸(PG)組成。根據本發明,“甲基化核酸”或“甲基化調節性多核苷酸”指對應的核酸的(甲基化堿基數)/(非甲基化堿基數)比為至少5/1。因此,根據本發明,甲基化核酸包含具有至少 6/1、7/1、8/1、9/1、10/1、11/1、12/1、13/1、14/1、15/1、16/1、17/1、18/1 和 20/1 的(甲基化堿基數)/(非甲基化堿基數)比的核酸。本領域技術人員可通過任意已知技術容易地測定(甲基化堿基數)/(非甲基化堿基數)比。本領域技術人員尤其可以使用本說明書的實施例中所述的亞硫酸氫鹽測序法。為了比較幾個啟動子的表達水平,本領域技術人員已知的一種簡單技術包括將選擇標記基因置于待測試的啟動子的控制下。選擇標記基因可以是例如本領域技術人員公知的除草劑BASTA抗性基因。另一種技術可以包括用針對此蛋白質的抗體和描述于“本發明的多肽”部分中的方法,測量編碼此蛋白質的序列處于不同啟動子控制下時獲得的蛋白質CmWIPl的水平。如實施例中所示,非功能性啟動子(Pg)的實例包括這樣的啟動子,其具有與功能性啟動子(PG)相同的核苷酸序列,但其在細胞內或在體內處于非功能性甲基化形式。在實施例中闡述的具體實施方案中,啟動子(Pg)的甲基化狀態由位于距CmWIPl基因3'端不足 1千堿基處的轉座因子(TE)的存在引起。非功能性多核苷酸(Pg)還可以是衍生自上文所定義的多核苷酸(PG)的任意多核苷酸,相對于調節性多核苷酸的核苷酸序列,其核苷酸序列包含一個或多個核苷酸的插入、 取代或缺失。因此,本發明還涉及包含這樣的核苷酸序列的核酸,相對于從序列SEQ ID No. 10 的核苷酸1至核苷酸四99的核酸,該核苷酸序列具有至少一個選自突變、插入或缺失的改變,當其控制所述蛋白質的表達時,相對于由序列SEQ ID No. 10的核苷酸1至核苷酸四99 的核酸控制的蛋白質CmWIPl的表達,所述改變的核酸導致降低的蛋白質CmWIPl的表達。本發明還涉及如上文所定義的調節性多核苷酸(Pg)。本發明還涉及包含調節性多核苷酸(Pg)的核酸和編碼序列SEQ IDNo. 12的蛋白質CmWIPl的核酸。本發明還涉及本說明書中一般定義的用于控制雙子葉植物花型發育的兩個遺傳元件的組合,其中調節性多核苷酸(Pg)對誘導信號的作用敏感,且優選地,其中調節性多核苷酸(Pg)是轉錄或翻譯的誘導性阻抑物多核苷酸。根據本發明,“阻抑物”調節性多核苷酸指其組成型活性可被外部信號阻斷的調節序列。所述外部信號可以是缺乏由阻抑物調節性多核苷酸識別的轉錄因子的固定。可以在阻抑物調節性多核苷酸對其敏感的阻抑物誘導信號的作用下誘導轉錄因子固定的缺乏。根據此第一個特定實施方案,在缺乏阻抑物調節性多核苷酸直接或間接對其敏感的阻抑物誘導信號的情況下,編碼蛋白質CmWIPl的序列在細胞宿主中組成型表達。由于對阻抑物調節性多核苷酸的直接或間接作用,使細胞宿主與阻抑物誘導信號接觸具有抑制和/或阻斷編碼蛋白質CmWIPl的多核苷酸表達的作用。為了影響本發明的包含阻抑物調節性多核苷酸的DNA結構,本領域技術人員可求助于其在植物基因表達方面的一般技術知識。標題為“獲得本發明的轉化的植物的方法”的部分中描述了用此類型的調節性多核苷酸獲得轉化的植物的方法。-對活性蛋白質CmWIPl的表達無功能的核酸(Ng)核酸(Ng)包括這樣的核酸,其包含至少一部分編碼活性蛋白質CmWIPl的序列,但當在雙子葉植物細胞中將它們置于的功能性調節性多核苷酸的控制下時,其不允許活性蛋白質CmWIPl在所述植物中產生。核酸(Ng)基本上包括這樣的核酸(NG),相對于參考核酸(NG),其在至少一個內含子或一個外顯子中存在一個或多個突變,每個突變選自(i) 一個核苷酸或一個以上核苷酸的取代;(ii) 一個核苷酸或至少兩個連續核苷酸的缺失;和(iii) 一個核苷酸或至少兩個連續核苷酸的缺失。核酸(Ng)尤其包括編碼失活的蛋白質CmWIPl的核酸。在本發明的意義中,“編碼失活的蛋白質CmWIPl的核酸”指編碼這樣的蛋白質的核酸,該蛋白質因一個或多個氨基酸的取代、缺失或插入而不同于序列SEQ ID No. 12的蛋白質CmWIP 1,且不具有SEQ ID No. 12的蛋白質CmWIPl的生物學活性。其還包括編碼這樣的蛋白質的核酸,該蛋白質因一個或多個氨基酸的取代、缺失或插入而不同于序列SEQ ID No. 16的蛋白質CmWIPl,且不具有SEQ ID No. 16的蛋白質 CmffIPl的生物學活性。尤其是,當其在不表達任何活性蛋白質CmWIPl,尤其是任何序列SEQ ID No. 12的蛋白質CmWIPl或序列SEQ ID No. 16的蛋白質CmWIPl的植物中表達時,所述失活的蛋白質 CmffIPl分別誘導-與等位基因(a/a)以純合形式存在于所述植物中組合的雌雄同株同花植物表型,-與⑴等位基因(A/A)以純合形式存在于所述植物中組合或與(ii)等位基因 (A/a)以雜合形式存在于所述植物中組合的雌性植物表型。實施例中顯示,用編碼失活的蛋白質CmWIPl的核酸獲得了具有遺傳元件(G/g)的等位基因(g)的植物。尤其是,實施例中顯示,用編碼蛋白質CmWIPl的核酸獲得了具有遺傳元件(G/g)的等位基因(g)的植物,相對于編碼序列SEQ ID No. 12的蛋白質CmWIPl的核苷酸序列SEQ ID No. 11,該編碼蛋白質CmWIPl的核酸具有單個核苷酸取代。為了說明的目的,實施例顯示了具有等位基因(g),且其對應的核酸編碼具有選自 L77F、P193L和S306F(根據用于序列SEQ ID No. 12的氨基酸編號)的氨基酸取代的突變的蛋白質CmWIPl的植物。已在法國專利申請No. FR四00415和PCT申請No. WO 2007/125洸4中描述了顯性等位基因(A)的形式或顯性等位基因(a)的形式的遺傳控制元件A/a。但是,由于遺傳控制元件(A/a)是本發明的用于控制花型發育的兩個遺傳元件的組合的重要元件,所以下文再次描述其的主要特征。本發明的組合的顯性等位基因(A)的形式的遺傳控制元件A/a一般而言,相對于等位基因(A)不存在于所述植物中時觀察到的水平,以顯性等位基因(A)的形式存在于植物中的遺傳控制元件A/a使得可能獲得更高水平的活性蛋白質 ACS。在本說明書的其余部分中,認為“高水平”的蛋白質ACS對應于在基因組中包含顯性等位基因㈧的植物中測量的蛋白質ACS的平均水平,而“低水平”的蛋白質ACS對應于在基因組中不包含顯性等位基因(A)的植物中觀察到的活性蛋白質ACS的平均水平。低水平的蛋白質ACS包括活性蛋白質ACS的水平為0,例如在表達包括具有突變A57V的等位基因“a”的產物的失活ACS的情況下。顯性等位基因㈧由核酸(NA)組成,其包含(i)雙子葉植物中的功能性調節性多核苷酸(PA),和(ii)其表達受該調節性多核苷酸(PA)調節的核酸,所述核酸編碼序列SEQ ID No. 3的蛋白質ACS。-功能性調節性多核苷酸(PA)本發明的功能性調節性多核苷酸或啟動子(PA)由允許序列SEQ IDNo. 3的蛋白質 ACS在雙子葉植物中表達的核酸組成。作為實例,這種啟動子包含從序列SEQ ID No. 1的核苷酸1至核苷酸5906的核苷酸序列。因此,在其中第一遺傳控制元件由等位基因A組成的本發明兩個遺傳控制元件的組合的實施方案中,調節性多核苷酸(PA)可以由這樣的多核苷酸組成,該多核苷酸包含以下或由以下組成(i)從序列SEQ ID No. 1的核苷酸1至核苷酸5906的核苷酸序列;或(ii) 與SEQ ID No. 1的序列1-5906具有至少90%核苷酸同一性且具有功能的序列;或(iii)前述序列(i)和(ii)的具有功能的片段。因此,在本發明的兩個遺傳元件的組合的某些實施方案中,調節性多核苷酸(PA) 包含序列SEQ ID No. 1的核苷酸1至核苷酸5906的核苷酸序列或由該核苷酸序列組成。包含于本發明的兩個遺傳元件的組合中的功能性調節性多核苷酸(PA)還可以由已知指導編碼蛋白質ACS的核酸序列組成型或組織特異性表達的啟動子組成。因此,包含于本發明的兩個遺傳元件的組合中的功能性調節性多核苷酸(PA)可以選自之前針對調節性多核苷酸(PG)的某些實施方案描述的組成型或組織特異性啟動子的任一個。本發明的功能性調節性多核苷酸(PA)還可以由誘導型啟動子組成。因此,本發明涉及上文定義的兩個遺傳元件的組合,其中調節性多核苷酸(PA)對誘導信號的作用敏感,且優選地,其中調節多核苷酸(PA)是轉錄和翻譯的誘導性激活多核苷酸,其可以選自在調節性多核苷酸(PG)的某些實施方案中描述的誘導性激活多核苷酸的任一個。當將這樣的核酸結構用于細胞宿主中時,可以通過使轉化的宿主細胞與激活調節性多核苷酸直接或間接對其敏感的激活誘導信號接觸來誘導本發明的編碼蛋白質ACS的多核苷酸的表達。當希望此轉化的細胞宿主中缺乏編碼多肽ACS的多核苷酸的表達時,則充分消除或抑制轉錄或翻譯的調節性多核苷酸對其敏感的激活誘導信號的存在。本領域技術人員可求助于其在調節性多核苷酸,尤其是在植物中有活性的調節性多核苷酸方面的一般技術知識來定義對應于以上實施方案的定義的結構,尤其是針對調節性多核苷酸(PG)所述的結構。-編碼蛋白質ACS的核酸優選地,編碼蛋白質ACS的核酸從5'端至3'端至少包含
18
(i)與從序列SEQ ID No. 1的核苷酸5907至核苷酸6086的多核苷酸具有至少 95%同一性的一條序列,(ii)與從序列SEQ ID No. 1的核苷酸6181至核苷酸6467的多核苷酸具有至少 95%同一性的一條序列,和(iii)與從序列SEQ ID No. 1的核苷酸7046至核苷酸7915的多核苷酸具有至少 95%同一性的一條序列。本發明的組合的隱性等位基因(a)的形式的遺傳控制元件A/a一般而言,當存在于基因組中不具有顯性等位基因(A)的植物中時,隱性等位基因(a)形式的遺傳控制元件(A/a)不允許獲得與存在等位基因(A)時獲得的一樣高的蛋白質ACS的水平。因此,我們可將等位基因(a)定義為不允許獲得ACS的活性水平的對應于等位基因(A)的任意基因型改變。隱性等位基因(a)與顯性等位基因(A)的不同在于(i)核酸(NA)不存在于該植物中,或(ii)在雙子葉植物中無功能的調節性多核苷酸(1 ),或(iii)編碼失活的蛋白質ACS的核酸,或(iv)在雙子葉植物中無功能的調節性多核苷酸(Pa)和編碼失活的蛋白質ACS的核酸。-非功能性多核苷酸調節子(Pa)本發明的非功能性調節性多核苷酸(Pa)或啟動子是這樣的核酸,其(i)不允許序列SEQ ID No. 3的蛋白質ACS在宿主細胞中表達,或(ii)與用調節性多核苷酸(PA)觀察到水平相比,允許此蛋白質以低水平表達,或(iii)與用調節性多核苷酸(PA)觀察到的表達相比,允許蛋白質ACS在植物一生中表達較短的時間。在非功能性調節性多核苷酸(Pa)的某些實施方案中,所述多核苷酸(Pa)是甲基化的。例如,調節性多核苷酸(Pa)可以由甲基化核酸形式的調節性多核苷酸(PA)組成。根據本發明,“甲基化核酸”或“甲基化調節性多核苷酸”指對應的核酸的(甲基化堿基數)/(非甲基化堿基數)比為至少5/1。因此,根據本發明,甲基化核酸包含具有至少 6/1、7/1、8/1、9/1、10/1、11/1、12/1、13/1、14/1、15/1、16/1、17/1、18/1 和 20/1 的(甲基化堿基數)/(非甲基化堿基數)比的核酸。本領域技術人員可通過任意已知技術容易地測定(甲基化堿基數)/(非甲基化堿基數)比。本領域技術人員尤其可以使用本說明書的實施例中所述的亞硫酸氫鹽測序法。為了比較幾個啟動子的表達水平,本領域技術人員已知的一種簡單技術包括將選擇標記基因置于待測試的啟動子的控制下。選擇標記基因可以是例如本領域技術人員公知的除草劑BASTA抗性基因。另一種技術可以包括用針對此蛋白質的抗體和描述于“本發明的多肽”部分中的方法,測量編碼此蛋白質的序列處于不同啟動子控制下時獲得的蛋白質ACS的水平。作為實例,非功能性調節性多核苷酸(Pa)包括從序列SEQ ID No. 2的核苷酸1至核苷酸3650的核苷酸序列。
作為另一個實例,非功能性調節性多核苷酸(Pa)包括相對于從SEQID No. 1的核苷酸1至核苷酸3650的核苷酸序列,包含一個或多個堿基取代、缺失或添加的某些核苷酸序列。因此,在本發明的用于控制花型發育的兩個遺傳元件的組合中,非功能性調節性多核苷酸(Pa)可以包括通過本領域技術人員已知的方法之一改變的從序列SEQ ID No. 2 的核苷酸1至核苷酸3650的核苷酸序列。本發明還涉及本說明書中定義的用于控制花型發育的兩個遺傳元件的組合,其中等位基因(a)是包含序列SEQ ID No. 2的核酸。所述序列SEQID No. 2的核酸包含調節性多核苷酸(Pa)和編碼序列SEQ ID No. 3的蛋白質ACS的核酸。非功能性多核苷酸(Pa)還可以是衍生自上文定義的多核苷酸(PA)的任意多核苷酸,相對于調節性多核苷酸的核苷酸序列,其核苷酸序列包含一個或多個核苷酸的插入、取代或缺失。因此,在本發明的組合的某些實施方案中,多核苷酸(Pa)由包含這樣的核苷酸序列的核酸組成,相對于從序列SEQ ID No. 1的核苷酸1至核苷酸5907的核酸,該核苷酸序列具有至少一個選自突變、插入或缺失的改變,當其控制所述蛋白質的表達時,相對于由序列SEQ ID No. 1的核苷酸1至核苷酸5907的核酸控制的蛋白質ACS的表達,所述改變的核酸導致降低的蛋白質ACS的表達。本發明還涉及上文定義的用于控制花型發育的兩個遺傳元件的組合,其中調節性多核苷酸(Pa)對誘導信號的作用敏感,且優選地,其中調節性多核苷酸(Pa)是轉錄或翻譯的誘導性阻抑物多核苷酸。根據此第一特定實施方案,在缺乏阻抑物調節性多核苷酸直接或間接對其敏感的阻抑物誘導信號的情況下,編碼蛋白質ACS的序列在所選擇的細胞宿主中組成型表達。由于對阻抑物調節性多核苷酸的直接或間接作用,使與阻抑物誘導信號接觸的細胞宿主具有抑制和/或阻斷編碼蛋白質ACS的多核苷酸表達的作用。為了產生本發明的包含阻抑物調節性多核苷酸的DNA結構,本領域技術人員可求助于其在植物基因表達方面的一般技術知識。標題為“獲得本發明的轉化的植物的方法”的部分中描述了用此類型的調節性多核苷酸獲得轉化的植物的方法。-對活性蛋白質ACS的表達無功能的核酸(Na)核酸(Na)包括這樣的核酸,其包含至少一部分編碼活性蛋白質ACS的序列,但當在雙子葉植物細胞中將它們置于的功能性調節性多核苷酸的控制下時,其不允許活性蛋白質ACS在所述植物中產生。核酸(Na)基本上包括這樣的核酸(NA),相對于參考核酸(NA),其在至少一個內含子或一個外顯子中存在一個或多個突變,每個突變選自(i) 一個核苷酸或一個以上核苷酸的取代;(ii) 一個核苷酸或至少兩個連續核苷酸的缺失;和(iii) 一個核苷酸或至少兩個連續核苷酸的缺失。核酸(Na)尤其包括編碼失活的蛋白質ACS的核酸。在本發明的意義中,“編碼失活的蛋白質ACS的核酸”指編碼這樣的蛋白質的核酸,該蛋白質因一個或多個氨基酸的取代、缺失或插入而不同于序列SEQ ID No. 3的蛋白質 ACS,且不具有SEQ ID No. 3的蛋白質ACS的生物學活性。圖8中顯示了說明這種核酸的實例。尤其是,此類失活的蛋白質ACS不允許S-腺苷甲硫氨酸轉化為ACC(1-氨基環丙烷-1-羧酸鹽)。本發明的核酸如上文所述,已表征了包含于本發明的用于控制花型發育的兩個遺傳元件的組合中的第二遺傳控制元件(G/g)的兩個等位基因變體(G)和(g)。本發明人將序列SEQ ID No. 10的核酸鑒定為對應于顯性等位基因變體(G)的核酸,且其在植物中的甲基化形式對應于基因(G/g)形式的第二遺傳控制元件的隱性等位基因變體(g)。在本發明的用于控制花發育的兩個遺傳元件的組合中,至少將該兩個遺傳控制元件的第二個人為引入植物中。如上文所述,所述引入引起該植物的花的性別改變,其是本發明所需的目的之一。因此,序列SEQ ID No. 10的核酸構成本發明的部分目的。因此,本發明涉及包含與核苷酸序列SEQ ID No. 10,或與序列SEQ IDNo. 10的片段具有至少95%核苷酸同一性的多核苷酸的核酸,只要所述核酸具有上文定義的等位基因 (G)的功能特征。與上文定義的核酸序列互補的核酸也構成本發明的部分。本發明的另一個目的是由與序列SEQ ID No. 10,或與序列SEQ ID No. 10的片段, 或與互補序列的核酸具有至少95%核苷酸同一性的多核苷酸組成的核酸,只要所述核酸具有上文定義的等位基因(G)的功能特征。本發明還涉及包含序列SEQ ID No. 10的核酸的至少12個、優選至少15個和最優選至少20個連續核苷酸的核酸,其理解為所述核酸在其定義中包括了本說明書中定義的本發明的核酸的“片段”。本發明還涉及包含序列SEQ ID No. 10或由序列SEQ ID No. 10組成的核酸。本發明還涉及包含序列SEQ ID No. 10的核酸的至少12個、優選至少15個和最優選至少20個連續核苷酸的核酸,其理解為所述核酸在其定義中包括了本說明書中定義的本發明的核酸的“片段”。由序列SEQ ID No. 10定義的等位基因(G)從5'端至3'端分別包含a)具有此基因的轉錄和/或翻譯調節元件的非編碼序列,位于第一外顯子上游, 從序列SEQ ID No. 10的1位核苷酸至四99位核苷酸;b)所謂的“編碼”區,其包含基因(G/g)的兩個外顯子和內含子,此編碼區位于序列SEQ ID No. 10的3000位核苷酸至5901位核苷酸;和c)位于編碼區下游的非編碼區,從序列SEQ ID No. 10的5902位核苷酸至7621位
核苷酸。下文表2中給出了基因G/g的兩個外顯子和內含子的結構特征的細節。基因(G/ g)的等位基因(G)和(g)的兩個外顯子和內含子的結構特征非常相似,以至于在某些實施方案中,等位基因(G)和(g)的外顯子可以編碼同一序列SEQ ID No. 12的蛋白質。如上文所述,對應于等位基因(G)和(g)的核苷酸序列之間的主要差異可以存在于(i)在對應于這兩個等位基因的上游調節序列中,對于等位基因(G),其在植物中是非甲基化的,而對于等位基因(g),其在植物中是甲基化的,(ii)或外顯子序列中,因為引起蛋白質CmWIPl序列中的氨基酸取代的單個核苷酸取代足以獲得等位基因(g)。表2基因G/g的外顯子序列
權利要求
1.用于控制雙子葉植物花型發育的兩個遺傳元件的組合,所述組合分別包括a)以顯性等位基因(A)和隱性等位基因(a)的形式存在于所述雙子葉植物中的第一遺傳控制元件(A/a),其中-所述顯性等位基因(A)由允許序列SEQ ID No.3的蛋白質ACS(氨基環丙烷羧酸合酶)表達的核酸(NA)組成,-所述隱性等位基因(a)與所述顯性等位基因的不同在于在所述雙子葉植物中無功能的核酸(NA),和b)以顯性等位基因(G)和隱性等位基因(g)的形式存在于所述雙子葉植物中的第二遺傳控制元件(G/g),其中-所述顯性等位基因(G)由允許序列SEQ ID No. 12的蛋白質CmWlPl (“甜瓜鋅指蛋白質”)表達的核酸(NG)組成,-所述隱性等位基因(g)與所述顯性等位基因的不同在于在所述雙子葉植物中無功能的核酸(NG),其理解為至少將所述第二遺傳控制元件人為引入所述雙子葉植物中。
2.權利要求1的組合,其特征在于對于所述第一遺傳控制元件(A/a),所述顯性等位基因㈧和所述隱性等位基因(a)各自的特征如下-所述顯性等位基因(A)由核酸(NA)組成,其包含 (i)在雙子葉植物中有功能的調節性多核苷酸(PA),和( )其表達受所述調節性多核苷酸(PA)調節的核酸,所述核酸編碼序列SEQ ID No. 3 的蛋白質ACS (氨基環丙烷羧酸合酶),-所述隱性等位基因(a)與所述顯性等位基因(A)的不同在于 (i)核酸(NA)不存在于所述植物中,或 ( )在雙子葉植物中無功能的調節性多核苷酸0 ),或 (iii)對活性蛋白質ACS的表達無功能的核酸(Na)。
3.權利要求1和2中任一項的組合,其特征在于所述編碼蛋白質ACS的核酸從5'端至3'端至少包含(i)與從序列SEQ ID No. 1的核苷酸5907至核苷酸6086的多核苷酸具有至少95%同一性的序列,( )與從序列SEQ ID No. 1的核苷酸6181至核苷酸6467的多核苷酸具有至少95% 同一性的序列, 禾口(iii)與從序列SEQ ID No. 1的核苷酸7046至核苷酸7915的多核苷酸具有至少95% 同一性的序列。
4.權利要求1至3中任一項的組合,其特征在于所述調節性多核苷酸(PA)包含從序列 SEQ ID No. 1的核苷酸1至核苷酸5906的核苷酸序列。
5.權利要求1至4中任一項的組合,其特征在于所述調節性多核苷酸(Pa)包含從序列 SEQ ID No. 2的核苷酸1至核苷酸3650的核苷酸序列。
6.權利要求1至5中任一項的組合,其特征在于所述調節性多核苷酸(PA)和/或調節性多核苷酸(Pa)對誘導信號的作用敏感。
7.權利要求1至6中任一項的組合,其特征在于所述調節性多核苷酸(PA)是轉錄或翻譯的誘導性激活多核苷酸。
8.權利要求1至7中任一項的組合,其特征在于所述調節性多核苷酸(Pa)是轉錄或翻譯的誘導性阻抑物多核苷酸。
9.權利要求1的組合,其特征在于所述第二遺傳控制元件(G/g),所述顯性等位基因 (G)和所述隱性等位基因(g)各自的特征如下-所述顯性等位基因(G)由核酸(NG)組成,其包含 (i)在雙子葉植物中有功能的調節性多核苷酸(PG),和( )其表達受所述調節性多核苷酸(PG)調節的核酸,所述核酸編碼序列SEQ ID No. 12的蛋白質CmWlPl( “甜瓜鋅指蛋白質”),-所述隱性等位基因(g)與所述顯性等位基因(G)的不同在于 (i)核酸(NG)不存在于所述植物中,或 ( )在雙子葉植物中無功能的調節性多核苷酸( ),或 (iii)對活性蛋白質CmWlPl的表達無功能的核酸(Ng)。
10.權利要求1至9中任一項的組合,其特征在于所述編碼蛋白質CmWlPl的核酸從5‘ 端至3'端至少包含(i)與從序列SEQ ID No. 10的核苷酸3000至核苷酸3617的多核苷酸具有至少95% 同一性的一條序列,和( )與從序列SEQ ID No. 10的核苷酸M58至核苷酸5901的多核苷酸具有至少95% 同一性的一條序列。
11.權利要求9至10中任一項的組合,其特征在于所述調節性多核苷酸(PG)包含核苷酸序列 SEQ ID No. 11。
12.權利要求9至11中任一項的組合,其特征在于所述調節性多核苷酸(PG)和/或調節性多核苷酸(Pg)對誘導信號的作用敏感。
13.權利要求9至12中任一項的組合,其特征在于所述調節性多核苷酸(PG)是轉錄或翻譯的誘導性激活多核苷酸。
14.權利要求9至12中任一項的組合,其特征在于所述調節性多核苷酸(Pg)是轉錄或翻譯的誘導性阻抑物多核苷酸。
15.核酸,其從5'端至3'端至少包含(i)與從序列SEQ ID No. 10的核苷酸3000至核苷酸3617的多核苷酸具有至少98. 5% 同一性的一條序列,和( )與從序列SEQ ID No. 10的核苷酸M58至核苷酸5901的多核苷酸具有至少 99. 5%同一性的序列。
16.序列SEQID No. 10的核酸,其為權利要求9中定義的等位基因(G)的形式。
17.核酸,其包含從序列SEQID No. 10的核苷酸3000延伸至核苷酸5901的核苷酸序列。
18.核酸,相對于從序列SEQID No. 10的核苷酸1至核苷酸四99的核酸,其包含具有至少一個選自突變、插入或缺失的改變的核苷酸序列,當其控制所述蛋白質的表達時,相對于受從序列SEQ ID No. 10的核苷酸1至核苷酸四99的核酸控制的蛋白質CmWlPl的表達, 所述改變的核酸導致序列SEQ ID No. 12的蛋白質CmWlPl的改變的表達。
19.重組載體,其包含權利要求9至14的任一項中定義的核酸或權利要求15至18中任一項的核酸。
20.宿主細胞,其由權利要求9至14的任一項中定義的核酸,或由權利要求15至18中任一項的核酸,或由權利要求19的重組載體轉化。
21.權利要求20的宿主細胞,其特征在于其是隸屬于葫蘆科植物的細胞,且優選是隸屬于甜瓜物種的植物的細胞。
22.隸屬于葫蘆科的植物,其由權利要求9至14的任一項中定義的核酸或權利要求15 至18中任一項的核酸,或由權利要求19的重組載體轉化。
23.權利要求22的轉化的植物,其特征在于其包含至少一個權利要求1中定義的等位基因(G)。
24.轉化的植物,其包含權利要求20或21的多個宿主細胞。
25.由兩種核酸轉化的宿主細胞,其分別 (i)由選自以下的核酸轉化-權利要求1至8的任一項中定義的決定等位基因A或(a)的核酸, -核酸,其從5'端至3'端至少包含(i)與從序列SEQID No. 1的核苷酸5907至核苷酸6086的多核苷酸具有至少95%同一性的一條序列,(ii)與從序列SEQID No. 1的核苷酸6181至核苷酸6467的多核苷酸具有至少95% 同一性的一條序列,和(iii)與從序列SEQID No. 1的核苷酸7046至核苷酸7915的多核苷酸具有至少95% 同一性的一條序列,-序列SEQ ID No. 1的核酸,其為權利要求2中定義的等位基因(A)的形式, -序列SEQ ID No. 2的核酸,其為權利要求2中定義的等位基因(a)的形式, -包含從序列SEQ ID No. 1的核苷酸1至核苷酸5906的核苷酸序列的核酸, -核酸,相對于從序列SEQ ID No. 1的核苷酸1至核苷酸5907的核酸,其包含具有至少一個選自突變、插入或缺失的改變的核苷酸序列,當其控制所述蛋白質的表達時,相對于受從序列SEQ ID No. 1的核苷酸1至核苷酸5907的核酸控制的蛋白質ACS的表達,所述改變的核酸導致序列SEQID No. 3的蛋白質ACS的改變的表達,-包含從序列SEQ ID No. 2的核苷酸1延伸至核苷酸3650的序列的核酸, ( )由權利要求9至14的任一項中定義的核酸,或由權利要求15至18中任一項的核酸,或由權利要求19的重組載體轉化。
26.權利要求25的宿主細胞,其特征在于其是隸屬于葫蘆科植物的細胞,且優選是隸屬于甜瓜物種的植物的細胞。
27.轉化的植物,其包含權利要求25或沈的多個宿主細胞。
28.核酸,其可用作與權利要求10至14的任一項中定義的核酸或權利要求15至18中任一項的核酸特異性雜交的探針或引物。
29.用于檢測權利要求1中定義的定位基因(G)或(g)的存在的方法,所述方法包括以下步驟1)使權利要求觀的一個核苷酸探針或多個核苷酸探針與待測試的樣品接觸;2)檢測一個或多個探針和存在于樣品中的核酸之間形成的任意復合物。
30.用于獲得在編碼蛋白質CmWlPl的基因中人為突變的植物的方法,其包括以下步驟a)通過化學誘變產生一群突變體雙子葉植物;b)從步驟a)中產生的突變體植物的群體選擇在編碼蛋白質CmWlPl的基因中具有一個突變或一個以上突變的植物;c)從步驟b)中選擇的突變體植物選擇表達表型(g)的植物。
31.權利要求30的方法,其特征在于還在編碼蛋白質ACS的基因中突變所述植物和在于-在步驟b)中,選擇(i)在編碼蛋白質CmWlPl的基因中具有一個突變或一個以上突變和(ii)在編碼蛋白質ACS的基因中具有一個突變或一個以上突變的植物,-在步驟c)中,從在編碼蛋白質CmWlPl的基因中和在編碼蛋白質ACS的基因中突變的植物選擇表達與遺傳元件(G/g)的等位基因(g)相關的表型和與遺傳元件(A/a)的等位基因(a)相關的表型二者的植物。
32.已在編碼蛋白質CmWlPl的基因序列中人為突變的具有改變的花型的雙子葉植物, 所述植物表達與遺傳元件(G/g)的等位基因(g)相關的表型。
33.已(i)在編碼蛋白質CmWlPl的基因序列中和(ii)在編碼蛋白質ACS的基因序列中人為突變的具有改變的花型的雙子葉植物,所述植物表達(i)與遺傳元件(G/g)的等位基因(g)相關的表型和(ii)與遺傳元件(A/a)的等位基因(a)相關的表型二者。
34.用于獲得隸屬于葫蘆科的轉化的植物的方法,其特征在于該方法包括以下步驟a)由權利要求1中定義的核苷酸序列(NG)或包含這種核酸的重組載體轉化在其基因組中不包含權利要求1中定義的等位基因(G)的目的植物的至少一個植物細胞;b)選擇步驟a)中獲得的已將核酸(NG)整合入其基因組中的轉化的細胞;c)從步驟b)中獲得的轉化的細胞再生為轉化的植物。
35.用于獲得隸屬于葫蘆科的轉化的植物的方法,其特征在于該方法包括以下步驟a)在植物中,通過權利要求1中定義的等位基因(g)取代權利要求1中定義的等位基因(G),b)選擇衍生自步驟a)中獲得的已將等位基因(g)整合入其基因組中的植物的轉化的細胞,c)從步驟b)中獲得的轉化的細胞再生為轉化的植物,d)雜交步驟c)中獲得的植物來獲得不再具有權利要求1中定義的等位基因(G)的植物。
全文摘要
本發明的主題是用于控制雙子葉植物花發育的兩個遺傳元件的組合,該組合分別包括以顯性等位基因(A)和隱性等位基因(a)的形式存在于雙子葉植物中的第一遺傳控制元件(A/a),和以顯性等位基因(G)和隱性等位基因(g)的形式存在于雙子葉植物中的第二遺傳控制元件(G/g),其理解為,至少將該第二遺傳控制元件人為引入所述雙子葉植物中。以上組合使得可能控制和/或改變雙子葉植物的花的性別。
文檔編號C07K14/415GK102165067SQ200980137698
公開日2011年8月24日 申請日期2009年7月27日 優先權日2008年7月28日
發明者A·布阿萊姆, A·本達馬內, C·多吉蒙特, C·特羅阿代克, M·安托萬 申請人:國家農藝研究院