專利名稱:選擇性控制基因表達的植物調節序列的制作方法
技術領域:
本發明涉及控制植物中基因表達的核酸分子的分離和用途,特別是新型植物啟動子。本發明要求1999年9月1日提交的美國臨時申請60/151,892的優先權,在此引入其完整內容作為參考。
背景技術:
植物基因工程的目標之一是產生具有農業上重要的特征或性狀的植物。基因工程最近的發展為將植物轉化為包含并表達外來基因提供了必備的工具(Kahl et al.(1995)World Journal of Microbiology andBiotechnology 11449-460)。植物基因工程特別需要的性狀或感興趣的特性應該包括,但不限于抗昆蟲和其它害蟲及致病劑、耐受除草劑、增加的穩定性、產量或儲存期、環境耐受和營養增強。植物轉化和再生技術的發展使研究者可以從異源來源或修飾為有不同的或改進的特性的原生來源取出DNA片段,如基因,并將外源性DNA整合進植物基因組。然后基因可以在植物細胞中表達,顯示添加的特征或性狀。在一種方法中,正常情況下在特定植物或植物組織不表達的新型基因的表達可以賦予需要的表型效果。在另一種方法中,以反義方向進行的基因或基因一部分的轉錄可以通過防止或抑制內源性基因的表達產生需要的作用。
分離植物啟動子對通過基因工程修飾植物而產生需要的表型特征是有用的。為產生這樣的轉基因植物,將包括在植物中表達時賦予需要表型的異源基因序列的載體引入植物細胞。此載體也包括可操作連接到異源基因序列的植物啟動子,通常啟動子在正常情況下與異源基因不相關聯。然后將載體引入植物細胞而產生轉化的植物細胞,并將轉化植物細胞再生到轉基因植物內。啟動子控制引入的與啟動子可操作連接的DNA序列的表達并因此影響DNA序列賦予的所需特征。
由于啟動子是在基因的總體表達中不可或缺的5’調節元件,具有多種啟動子而適應基因表達使得基因在植物生長和發育過程中的恰當時間、在植物的最佳位置和以產生所需效果的必要量有效轉錄是有利的。例如,在一種情況下,基因產物的組成型表達在植物的一個位置可能是有益的,而在植物的另一個部分可能無益。在其它情況下,使基因產物在植物的某個發育階段或應答于某種環境或化學刺激而產生是有益的。遺傳改進種質的商業發展也已經進展到將多種性狀引入農作物,也稱作基因堆積法。在這種方法中,賦予不同感興趣特征的多種基因可以被引入植物。當把多種基因引入植物時,重要的是每種植物被調節或控制進行最優表達以及調節元件為多樣的,從而減少可以由同源序列重組導致的潛在基因沉默。根據這些和其它考慮,很明顯的是,基因表達的最優控制和調節元件多樣性在植物生物技術中是很重要的。
適當的調節序列必需出現在感興趣的DNA序列的適當位置,使新插入的DNA轉錄并且如果需要,可以在植物細胞中翻譯為蛋白質。這些調節序列包括但不限于啟動子,5’非翻譯前導序列和3’端聚腺苷酸化序列。選擇轉錄這種外來DNA的組織的能力和獲得這種外來DNA轉錄的植物生長時間的能力通過選擇控制這些基因轉錄的適當啟動子序列而成為可能。
許多不同類型的啟動子可以用于植物基因工程。啟動子可以根據范圍或組織特異性分類。例如,被稱作組成型啟動子的啟動子可以有效轉錄操作連接的DNA序列并在多種組織中表達該DNA序列。組織增強型或組織特異性啟動子可以在DNA序列上游并與其操作連接,這些DNA序列正常情況下以高水平在某些植物組織或特異性在某些植物組織中轉錄。其它啟動子類型包括,但不限于誘導型啟動子,它可以被外部刺激如化學試劑、發育刺激或環境刺激觸發。這樣,所需不同類型的啟動子可以通過分離以組成、組織增強或可誘導的方式轉錄和表達的DNA序列上游5’端調節區而獲得。
高流通量測序和生物信息學的技術發展為啟動子發現提供了額外的分子工具。可以將處在特定發育階段,或在特定化學、環境或生理狀況下的特定靶植物細胞、組織或器官作為來源物質而分離mRNA和構建cDNA文庫。迅速測序cDNA文庫并電子分類表達序列。使用序列分析軟件,可以在短時間內分析成千上萬的序列,并且可以對比所選cDNA文庫中的序列。實驗室和基于計算機的扣除法的結合允許研究者掃描和對比cDNA文庫并識別有所需表達形態的序列。例如,可以通過對比一種組織的cDNA文庫與其它組織的cDNA文庫并電子“扣除”共同序列從而找到只在感興趣的靶組織中表達的序列而識別優先在一種組織中表達的序列。然后組織增強序列可以用于探針和引物而克隆對應的全長cDNA。然后靶植物的基因組文庫可以用于分離對應基因和相關調節元件,包括啟動子序列。
可以通過選擇性對比cDNA靶胚發生或愈傷組織文庫與非靶或本底cDNA文庫如葉和根組織文庫而找到與靶文庫中的被表達序列相關的5’調節區,從而分離賦予所需表達形態的多種啟動子序列如胚發生或愈傷組織增強或特異性啟動子。分離的啟動子序列可以在基因堆積法中用于選擇性調節任何操作連接基因的表達并在植物表達載體中提供額外的調節元件多樣性。
發明概述本發明提供了包含位于植物DNA結構編碼序列5’端上游的調節序列的核酸序列,這些序列在胚發生或愈傷組織中轉錄,如SEQ IN NOS36-51所示。
一方面,本方面提供了包含選自SEQ ID NOS36-51或此序列的任何片段、區域或順式元件的可以調節可操作連接的DNA序列的轉錄的核酸序列。
本發明也提供了包含選自啟動子序列SEQ ID NOS36-51之一的序列的核酸序列。
本發明的另一方面涉及公開的5’啟動子序列的至少一種順式元件,或片段或區域的用途,它們可以結合起來建立新型啟動子或應用于與另一種異源調節序列的新穎結合而建立可以調節可操作連接的DNA序列的轉錄的嵌合啟動子。
所以,本發明涉及公開于SEQ ID NOS36-51,或當與DNA序列可操作連接時可以調節DNA序列轉錄的該公開序列的任何片段、區域或順式元件的用途。所以,本發明不僅包括公開于SEQ ID NOS36-51的序列,也包括可以作為啟動子獨立行使功能的其任何截短或缺失衍生物,或其片段或區域,包括當可操作連接到可轉錄序列時可以與一種或更多調節序列結合作為調節序列行使功能的順式元件。
因此本發明包括含公開于SEQ ID NOS36-51的核酸序列的新型啟動子,或嵌合或雜合啟動子。嵌合或雜合啟動子可以由與其它任何有轉錄活性的最小或全長啟動子結合的公開序列SEQ ID NOS36-51的任何長度的片段、區域或順式元件組成。例如,選自SEQ ID NOS36-51的啟動子序列可以與CaMV 35S或其它啟動子結合而構建新型啟動子。最小啟動子也可以與本發明的核酸序列結合使用。新型啟動子也可以包含任何由以足夠轉錄可操作連接的DNA序列的方式制造公開于SEQ IDNOS36-51的序列或公開序列的任何片段、區域或順式元件而構建的啟動子。
本發明的另一方面涉及啟動子序列SEQ ID NOS36-51,或其片段、區域或順式元件調節胚發生或愈傷組織中可操作連接的可轉錄序列的能力。在某些組織能夠調節可操作連接的SEQ ID NOS36-51的片段、區域或順式元件可以從核酸序列SEQ ID NOS36-51分離出來并用于制造賦予可操作連接DNA序列胚發生增強或愈傷組織增強表達或與其它異源調節序列結合的新型啟動子。
本發明也包括含SEQ ID NOS36-51所表示的公開序列或其任何片段、區域或順式元件的DNA構建體,包括用公開序列或公開序列的片段、區域或順式元件產生的新型啟動子。
本發明也包括任何含公開于SEQ ID NOS36-51所表示的DNA或其任何片段、區域或順式元件的細胞和轉基因植物。
本發明也提供了一種調節DNA序列轉錄的方法,包括將DNA序列可操作連接到任何包含選自SEQ ID NOS36-51的序列的所有或任何片段、區域或順式元件。
本發明的另一種實施方案提供了一種通過可操作連接選自SEQ IDNOS36-51的序列,或公開序列的任何片段、區域或順式元件到可轉錄DNA序列而賦予胚發生或愈傷組織增強或特異性表達的方法。以SEQID NOS36-51表示的,賦予可操作連接的DNA序列在胚發生或愈傷組織增強表達的公開啟動子的片段、區域或順式元件可以被工程改造并獨立用于包括多聚體,或截短的衍生物的新組合,并且新型啟動子可以與可轉錄DNA序列可操作連接。可以賦予可操作連接的DNA序列在胚發生或愈傷組織中增強表達的公開序列的公開片段、區域或順式元件可以與包括最小啟動子的異源啟動子結合而建立新型啟動子或雜合啟動子。
本發明也提供了一種通過將含(i)包含含有選自SEQ ID NOS36-51,或其片段、區域或順式元件的序列并操作連接到啟動子的核酸的啟動子,(ii)可轉錄DNA序列和(iii)3’非轉錄區的DNA構建體引入植物細胞中產生轉基因植物的方法。
本發明也提供了一種從感興趣的靶植物分離所需表達圖譜的至少一個5’調節序列的方法,包含通過評價源于由感興趣的植物細胞類型制備的至少一種cDNA文庫的ESTs核酸序列集合,比較至少一種靶植物cDNA文庫的EST序列和至少一種不同植物細胞類型中的非靶cDNA文庫的ESTs,扣除在靶和非靶文庫中共同的EST序列,從扣除后剩余的代表靶表達序列的ESTs設計基因特異性引物,并分離至少一種對應的5’側翼和調節序列,它包括用基因特異性引物從靶植物制備的基因組文庫中得到的至少一種啟動子序列。
從下面的發明詳述和附圖將更明顯得到本發明前面的內容和其它方面。
附圖簡述
圖1是pMON19469的質粒2是pMON39721的質粒3是pMON51002的質粒4是pMON51008的質粒5是pMON51001的質粒6是pMON51009的質粒7是pMON51003的質粒8是pMON51010的質粒圖質粒pMON19469是由下列基因成分組成的表達載體P-CaMV.35S是CaMV的35S RNA的啟動子,含有-90到-300區的一個串聯重復(美國專利No.5,322,938,在此引入其完整內容作為參考);I-Zm.Hsp70內含子是玉米熱休克蛋白的間插序列,如美國專利5,593,874和5,859,347所描述,在此引入其完整內容作為參考;Ec.GUS1為大腸桿菌β葡糖醛酸糖苷酶的編碼區;T-AGRTU.nos是胭脂堿合成酶基因的終止信號;ori-M13和ori-pUC為復制起點;AMP為氨芐青霉素選擇的編碼區。
質粒pMON39721為雙邊(右(RB)和左(LB)T-DNA邊)植物轉化載體,由下列基因成分組成P-CaMV.35S是CaMV 35S啟動子(美國專利No.5,352,605,在此引入其完整內容作為參考);AGRTU.npt II為根癌土壤桿菌的編碼序列,賦予卡那霉素抗生素的耐藥性;T-AGRTU.nos為從根癌土壤桿菌分離的胭脂堿合成酶基因的3’終止序列;ori322和oriV為復制起點,aad為賦予放線菌素和鏈霉素抗生素耐藥性的編碼序列。
質粒pMON51002為下列基因成分組成的表達載體ZM-70025861是從玉米胚基因組文庫中分離的進行胚增強表達的啟動子;I-Zm.Hsp70內含子是玉米熱休克蛋白的間插序列,如美國專利5,593,874和5,859,347所描述,在此引入其完整內容作為參考;Ec.GUS1為大腸桿菌β葡糖醛酸糖苷酶的編碼區;T-AGRTU.nos是胭脂堿合成酶基因的終止信號;ori-M13和ori-pUC為復制起點;AMP為氨芐青霉素選擇的編碼區。
質粒pMON51008為雙邊,右(RB)和左(LB)T-DNA邊,植物轉化載體,由下列基因成分組成ZM-70025861是從玉米胚基因組文庫中分離的進行胚增強表達的啟動子;I-Zm.Hsp70內含子是玉米熱休克蛋白的間插序列,如美國專利5,593,874和5,859,347所描述,在此引入其完整內容作為參考;Ec.GUS1為大腸桿菌β葡糖醛酸糖苷酶的編碼區;T-AGRTU.nos是胭脂堿合成酶基因的終止信號;P-CaMV.35S是CaMV35S啟動子(美國專利No.5,352,605,在此引入其完整內容作為參考);AGRTU.npt II為根癌土壤桿菌的編碼序列,賦予卡那霉素抗生素的耐藥性;T-AGRTU.nos為從根癌土壤桿菌分離的胭脂堿合成酶基因的3’終止序列;ori322和oriV為復制起點,aad為賦予放線菌素和鏈霉素抗生素耐藥性的編碼序列。
質粒pMON51001為下列基因成分組成的表達載體ZM-700267629是從玉米胚基因組文庫中分離的進行胚增強表達的啟動子;I-Zm.Hsp70內含子是玉米熱休克蛋白的間插序列,如美國專利5,593,874和5,859,347所描述,在此引入其完整內容作為參考;Ec.GUS1為大腸桿菌β葡糖醛酸糖苷酶的編碼區;T-AGRTU.nos是胭脂堿合成酶基因的終止信號;ori-M13和ori-pUC為復制起點;AMP為氨芐青霉素選擇的編碼區。
質粒pMON51009為雙邊,右(RB)和左(LB)T-DNA邊,的植物轉化載體,由下列基因成分組成ZM-700267629是從玉米胚基因組文庫中分離的進行胚增強表達的啟動子;I-Zm.Hsp70內含子是玉米熱休克蛋白的間插序列,如美國專利5,593,874和5,859,347所描述,在此引入其完整內容作為參考;Ec.GUS1為大腸桿菌β葡糖醛酸糖苷酶的編碼區;T-AGRTU.nos是胭脂堿合成酶基因的終止信號;P-CaMV.35S是CaMV 35S啟動子(美國專利No.5,352,605,在此引入其完整內容作為參考);AGRTU.npt II為根癌土壤桿菌的編碼序列,賦予卡那霉素抗生素的耐藥性;T-AGRTU.nos為從根癌土壤桿菌分離的胭脂堿合成酶基因的3’終止序列;ori322和oriV為復制起點,aad為賦予放線菌素和鏈霉素抗生素耐藥性的編碼序列。
質粒pMON51001為下列基因成分組成的表達載體ZM-700263624是從玉米胚基因組文庫中分離的進行胚增強表達的啟動子;I-Zm.Hsp70內含子是玉米熱休克蛋白的間插序列,如美國專利5,593,874和5,859,347所描述,在此引入其完整內容作為參考;Ec.GUS1為大腸桿菌β葡糖醛酸糖苷酶的編碼區;T-AGRTU.nos是胭脂堿合成酶基因的終止信號;ori-M13和ori-pUC為復制起點;AMP為氨芐青霉素選擇的編碼區。
質粒pMON51009為雙邊,右(RB)和左(LB)T-DNA邊,的植物轉化載體,由下列基因成分組成ZM-700263624是從玉米胚基因組文庫中分離的進行胚增強表達的啟動子;I-Zm.Hsp70內含子是玉米熱休克蛋白的間插序列,如美國專利5,593,874和5,859,347所描述,在此引入其完整內容作為參考;Ec.GUS1為大腸桿菌β葡糖醛酸糖苷酶的編碼區;T-AGRTU.nos是胭脂堿合成酶基因的終止信號;P-CaMV.35S是CaMV 35S啟動子(美國專利No.5,352,605,在此引入其完整內容作為參考);AGRTU.npt II為根癌土壤桿菌的編碼序列,賦予卡那霉素抗生素的耐藥性;T-AGRTU.nos為從根癌土壤桿菌分離的胭脂堿合成酶基因的3’終止序列;ori322和oriV為復制起點,aad為賦予放線菌素和鏈霉素抗生素耐藥性的編碼序列。
發明詳述本申請要求99年9月1日提交的美國臨時申請60/151,892的權益。
感興趣的基因(GOI)賦予除草劑或抗生素耐受,例如,殺昆蟲蛋白基因,抗疾病基因,影響植物生長、代謝或發育、產油或修飾油的基因和編碼藥物蛋白的基因,被考慮為本發明的各方面。這里公開的組合物和方法可以用于任何可以通過植物生物技術方法進行遺傳修飾的植物。這里描述的組合物和方法描述對植物胚和植物種子中轉基因產物的表達有用的DNA序列。
為在本發明實施過程更好地定義本發明和指導本領域的普通技術人員,提供了下列定義和方法。除非有其它注解,應根據相關領域中普通技術人員的常規用法理解各名詞。使用了闡述于37 CFR§1.882的DNA堿基命名。使用了氨基酸殘基的標準1和3字母命名。
“核酸(序列)”或“多核苷酸(序列)”是指基因組或合成來源的單鏈或雙鏈DNA或RNA,即分別為脫氧核糖核苷酸或核糖核苷酸堿基的聚合物,從5’(上游)端到3’(下游)端。核酸可以表示有意義或互補(反義)鏈。
“天然的”是指天然存在的(“野生型”)核酸序列。
“異源性”序列是指從外部來源或物種起源的序列,如果來自于相同來源,其原始形式經過了修飾。
“分離的”核酸序列基本與在核酸天然存在的生物細胞中與其正常相關的其它核酸序列即其它染色體或染色體外DNA分開或從中被純化出來。此名詞包含了生化上被純化,因而基本去掉污染核酸和其它細胞成分的核酸。此名詞也包括了重組核酸和化學合成核酸。
這里使用的名詞“基本純化的”是指基本與在其天然狀態下與其正常相關的其它分子分離的分子。更優選地,基本純化的分子是在制劑中的主要種類。基本純化的分子可以是大于60%,優選70%,更優選90%從其它存在于天然混合物中的分子(除溶劑)分離開。名詞“基本純化的”不準備包括以天然狀態存在的分子。
如果第一個核酸序列顯示“基本等同”于一個參照核酸序列,當與另一條核酸(或其互補鏈)進行最優對比(有適當核苷酸插入或缺失,在比較窗中總共小于20%)時,在至少20個核苷酸位置,優選至少50個核苷酸位置,更優選至少100個核苷酸位置,最優選在第一個核酸的全長的比較窗中有至少約75%的核苷酸序列等同性,優選至少約80%的等同性,更優選至少約85%的等同性,最優選約90%的等同性。可以通過Smith and Waterman局部同源性算法,Adv.Appl.Math.2482,1981;通過Needleman and Wunsch同源性算法,J.Mol.Biol.48443,1970;通過Pearson and Lipman相似性搜索法,Proc.Natl.Acad.Sci.USA 852444,1988;優選通過這些算法的計算機實現(GAP,BBSTFIT,FASTA,and TFASTA in the Wisconsin Genetics SoftwarePackage Release 7.0,Genetics Computer Group,575 Science Dr.,Madison,WI.)進行對比比較窗的序列最優對比。參照核苷酸可以是全長分子或更長分子的一部分。另外,如果一個核酸與另一個核酸在下面定義的嚴格條件下雜交,那么兩個核酸具有基本等同性。
當序列排列為第一個核酸序列影響第二個核酸序列的功能時,第一個核酸序列與第二個核酸序列“可操作連接”。優選地,這兩個序列是單個連續核酸序列的一部分并優選鄰近。例如,如果啟動子調節或介導細胞中基因的轉錄,啟動子可操作連接于此基因。
“重組”核酸由兩個分開的序列片段的人工結合,如通過化學合成或通過用基因工程技術操作核酸的分離片段而產生。核酸操作的技術是熟知的(見如Sambrook et al.,1989,和Ausubel et al.,1992)。核酸的化學合成方法討論于,例如,Beaucage and Carruthers,Tetra.Letts.221859-1862,1981,和Matteucci et al.,JAm.Chem.Soc.1033185,1981。核酸的化學合成可以用例如可以買到的自動寡核苷酸合成器進行。
為在特定宿主細胞中增強表達和克隆到適當載體中的目的,可以設計并化學合成“合成的核酸序列”。宿主細胞通常顯示優選的密碼子使用模式(Murray et al.,1989)。設計為在特定宿主細胞中增強表達的合成DNA因此應該反映宿主細胞中的密碼子使用模式。可以用于這些目的的計算機程序包括但不限于序列分析軟件包的“BestFit”或“Gap”程序,Genetics Computer,Inc.University of Wisconsin BiotechnologyCenter,Madison,WI 53711。
核酸“擴增”或“核酸復制”是指生成核酸序列的額外拷貝并用聚合酶鏈式反應(PCR)技術執行。許多擴增方法是本領域中公知的,描述于美國專利4,683,195和4,683,202及描述于PCR方案A Guide toMethods and Applications,ed.Innis et al.,Academic Press,San Diego,1990。在PCR中,引物是指序列確定的短寡聚核苷酸,與DNA模板退火以起始聚合酶鏈式反應。
“轉化的”、“轉染的”或“轉基因的”是指引入了外來核酸,如重組載體的細胞、組織、器官或生物體。優選地,引入的核酸被整合到接受細胞、組織、器官或生物體的基因組DNA中,使得引入的核酸由以后的后代遺傳。“轉基因的”或“轉化”的細胞或生物體也包括由在雜交中使用這種“轉基因”植物作為親代的雜交程序產生并表現出由于重組結構或載體存在導致的改變表型的細胞或生物體或后代的后代。
名詞“基因”是指編碼肽、多肽、蛋白質或RNA分子的染色體DNA、質粒DNA、cDNA、合成DNA、或其它DNA,和參與表達調節的編碼序列側翼區。一些基因可以被轉錄為mRNA并翻譯為多肽(結構基因);其它基因可以被轉錄為RNA(如rRNA,tRNA);另外一些類型的基因作為表達的調節物(調節物基因)。
基因的“表達”是指基因的轉錄而產生對應的mRNA及此mRNA的翻譯而產生對應的基因產物,即肽、多肽或蛋白質。基因表達由包括5’調節元件如啟動子的調節元件控制或調節。
“基因成分”是指也可以作為表達載體的成分或部分的任何核酸序列或基因元件。基因成分的例子包括,但不限于啟動子區、5’非翻譯先導序列、內含子、基因、3’非翻譯區和其它調節序列或影響一種或更多核酸序列轉錄或翻譯的序列。
名詞“重組DNA構建體”、“重組載體”、“表達載體”或“表達盒”是指來自于任何來源、可以進行基因組整合或自主復制的任何介質如質粒、粘粒、病毒、BAC(細菌人工染色體)、自主復制序列、噬菌體或線性或環形單鏈或雙鏈DNA或RNA核苷酸序列,包含一個或更多DNA序列以功能操作方式連接的DNA分子。
“互補的”是指核酸序列通過堿基配對(A-G-T與互補序列T-C-A配對)天然相關。如果只有一些核酸對是互補的,兩個單鏈分子間的互補性可以是部分的;如果所有堿基對是互補的,互補性是完全的。互補性的程度影響雜交和擴增反應的效率和強度。
“同源性”是指分別以核苷酸或氨基酸位置等同性百分比表示的核酸或氨基酸序列間的相似性水平,即序列的相似性或等同性。同源性也指不同核酸或蛋白質之間相似的功能特性的概念。
“ESTs”或表達序列標記是從cDNA(或互補DNA)文庫中隨機選擇的代表隨機選擇克隆的cDNA插入物的短序列(McCombie,et al.,Nature Genetics,1124,1992;Kurata,et al.,Nature Genetics,8365,1994;Okubo,et al.,Nature Genetics,2173,1992)。
名詞“電子Northern”是指一種基于計算機的序列分析,它允許多個cDNA文庫中的序列以研究者指定的參數包括多個cDNA文庫的EST群或專門由一種或多種文庫的結合建立的EST的豐度進行電子對比。
“Subsetting”是指一種對比不同或多種來源的核酸序列的方法,可以用于估計反應在特定組織、特定時間或在特定條件下的基因轉錄活性和信息穩定性的核酸序列的表達圖譜。
“啟動子”是指基因中位于開放讀框(或蛋白編碼區)翻譯起始密碼子上游或5’的核酸序列,它參與識別和結合RNA聚合酶II和其它蛋白而起始轉錄。“植物啟動子”是一種在植物細胞中起作用的天然或非天然啟動子。組成型啟動子在植物發育中的大多數或所有植物組織中起作用。組織、器官或細胞特異性啟動子分別只在或主要在特定組織、器官或細胞類型中表達。除了在某些組織、器官或細胞類型中“特異性”表達,與植物其它部分相比,啟動子可以在植物一部分表現出“增強的”表達,即高水平表達。時間調節的啟動子僅僅或主要在植物發育中的某些時間段或在一天中的某些時間起作用,例如,與晝夜節律相關的基因。誘導型啟動子應答于內源性或外源性刺激,例如化學化合物(化學誘導劑)或應答于環境、激素、化學和/或發育信號而選擇性表達可操作連接的DNA序列。誘導或調節型啟動子包括,例如,由光、熱、壓力、洪水或干旱、植物激素、創傷、或化學物質如乙醇、茉莉酮酸酯、水楊酸或安全劑調節的啟動子。
植物啟動子可以用作調節特定基因表達的5’調節序列。一種優選的啟動子將是植物RNA聚合酶II啟動子。與其它高等真核生物的啟動子相似,植物RNA聚合酶II啟動子具有復雜的結構并由一些不同的元件組成。這種元件之一是TATA盒或Goldberg-Hogness盒,是正確體外表達真核基因并準確、有效起始體內轉錄所需要的。TATA盒一般位于約-25到-35,即位于確定為+1位置的轉錄起始位點或帽位點上游(5’)25到35堿基對(bp)的位置。(Breathnach and Chambon,Ann.Rev.Biochem.50349-383,1981;Messing et al.,InGenetic Engineering ofPlants,Kosuge et al.,eds.,pp.21 1-227,1983)。另一種常見的元件,CCAAT盒,位于-70和-100bp之間。在植物中,CCAAT盒可以與哺乳動物啟動子的功能相似物序列有不同的共有序列(植物相似物曾命名為“AGGA盒”,使其區分于動物相似物;Messing et al.,InGeneticEngineering of Plants,Kosuge et al.,eds.,pp.211-227,1983)。另外,幾乎所有啟動子都包括附加的上游激活序列或增強子(Benoist and Chambon,nature 290304-310,1981;Gruss et al.,Proc.Nat.Acad.Sci.USA78943-947,1981;及Khoury and Gruss,Cell 27313-314,1983),從約-100bp伸展到-1,000bp或在轉錄起始位點的更上游。
當與異源DNA序列融合時,這種啟動子一般使融合序列以與啟動子天然相關的基因序列的轉錄方式相似的方式轉錄。包括調節序列的啟動子片段可以添加到(例如,與5’端融合,或插入)有自己的部分或完整的調節序列的活性的啟動子(Fluhr et al.,Science 2321106-1112,1986;Ellis et al.,EMBO J.611-16,1987;Strittmatter and Chua,Proc.Nat.Acad.Sci.USA 848986-8990,1987;Poulsen and Chua,Mol.Gen.Genet.21416-23,1988;Comal Ct al.,Plant Mol.Biol.15373-381,1991)。另外,異源調節序列可以添加到無活性、截短的啟動子如僅包括核心TATA和有時包括CCAAT元件的啟動子的5’上游區(Flukir et al.,Science2321106-1112,1986;Strittmatter and Chua,Proc.Nat.Acad.Sci.USA848986-8990,1987;Aryan et al.,Mol.Gen.Genet.22565-71,1991)。
啟動子一般由多種不同的“順式作用轉錄調節元件”,或簡稱為“順式元件”組成,每種可以賦予基因表達總體控制的不同方面(Stritttnatterand Chua,Proc.Nat.Acad.Sci.USA 8439g6-g990,1987;Ellis et al.,EMBO J.611-16,1987;Benfey et al.,EMBO J.91677-1684,1990)。“順式元件”與調節轉錄的反式作用蛋白因子結合。一些順式元件與一個以上的因子結合,反式轉錄因子可以以不同的親和性與一個以上順式元件相互作用(Johnson and McKnight,Ann.Rev.Biocliem.58799-839,1989)。對應于順式元件的植物轉錄因子及它們的相互作用的分析討論于,例如Martin,Curr.Opinions Biotech.7130-138,1996;Murai,InMethods in Plant Biochemistry and Molecular Biology,Dashek,ed.,CRCPress,1997,pp.397422;and Methods in Plant Molecular Biology,Maligaet al.,eds.,Cold Spring Harbor Press,1995,pp.233-300。本發明的啟動子可以包含可以調節基因表達的“順式元件”。
可以用許多技術,包括缺失分析即從啟動子5’端或內部去除一個或更多核苷酸;使用DNA酶I印跡的DNA結合蛋白分析,甲基化干擾分析、電泳遷移率變異分析、通過連接介導PCR進行的體內基因組印跡及其它常規分析法;或通過常規序列比較法得到與已知順式元件基序的相似性來鑒定順式元件。可以通過誘變(或替換)一個或更多核苷酸或通過其它常規方法進一步研究順式元件的適當結構。見,如,Method inPlant Biochemistry and Molecular Biology,Dashek,ed.,CRC Press,1997,pp.397-422;和Methods in Plant Molecular Biology,Maliga et al.,eds.,Cold Spring Harbor Press,1995,pp.233-300。
順式元件可以通過化學合成或通過從包括這些元件的啟動子克隆,它們可以用包含有用的限制性內切酶位點的額外的側翼序列合成而促進后續操作。在一種實施方案中,啟動子由多種不同的“順式作用轉錄調節元件”或簡稱為“順式元件”組成,每一個可以調節基因表達總體控制中的不同方面(Strittmatter and Chua,Proc.Nat.Acad.Sci.USA848986-8990,1987;Ellis et al.,EMBO J.611-16,1987;Benfey et al.,EMBO J.91677-1684,1990)。例如,順式元件區或35S啟動子的片段的結合可以表現出組織特異性表達模式(見美國專利5,097,025,在此引入其完整內容作為參考)。在一種實施方案中,可以用設計為通過比較已知順式元件而特異性識別順式元件、結構域或基序或可以用于對比多個5’調節序列而識別新型順式元件的計算機程序識別包含SEQ IDNOS36-51的核酸序列中的“順式元件”的序列區。
本發明包括SEQ ID Nos36-51的順式元件或已知影響基因調節,表現出與本發明的核酸序列的同源性的順式元件同系物。許多這種元件是文獻中已知的,如由許多因子如光、熱或應激調節的元件,由病原體或化學物質調節或誘導的元件等。這些元件可以正或負調節基因表達,這取決于條件。順式元件的例子可以包括但不限于氧反應元件(Cowen etal.,3.Biol.Chem.268(36)26904,1993),光調節元件(見例如,Bruceand Quajil,Plant Cell 2(11)1081.1990,及Bruce et al.,EMBO J.103015,1991),應答于茉莉酮酸甲酯處理的順式元件(Beaudoin andRothstein,Plant Mol.Biol.33835,1997),水楊酸反應元件(Strange et al.,Plant 3.111315,1997),熱休克反應元件(Pelham et al.,Trends Genet131,1985),應答于創傷和應激的元件(Loace et al.,Proc.Nati.Acad.Sci.U.S.A.899230,1992;Mhiri et al.,Plant Mol.Biol.33257,1997),低溫元件(Baker et al.,Plant Mol.Biol.24701,1994;Jiang et al.,Plant Mol.Biol.30679,1996;Nordin et al.,Plant Mol.Biol.21641,1993;Zhou etal.,3.Biol.Chem.26723515,1992),和干旱反應元件(Yamaguchi et al.,Plant Cell 6251-264,1994;Wang et al.,Plant Mol.Biol.28605,1995;Bray E.A.Trends in Plant Science 248,1997)。
所以本發明包括公開核酸分子的區域、結構域、片段或“順式元件”,并且核酸片段可以包括公開序列的任何連續區域。以SEQ IDNos36-51表示的本發明的啟動子區域可以包含一個或更多包括但不限于“順式元件”或可以調節植物種子和植物種子組織中可操作連接的DNA序列的轉錄的調節元件。植物種子組織包括由胚細胞和胚組織如盾片、胚乳、aluerone、和種皮組成的胚。
植物啟動子可以包括通過操作已知啟動子而產生合成、嵌合或雜合的啟動子。這種啟動子可以結合來自一個或更多啟動子的順式元件,例如,通過添加一個異源調節序列到有自己的部分或完全的調節序列的活性啟動子(Ellis et al.,EMBO J.611-16,1987;Strittmatter and Chua,Proc.Nat.Acad.Sci.USA 848986-8990,1987;Poulsen and Chua,Mol.Gen.Genet.21416-23,1988;Comai et al.,Plant.Mol.Biol.15373-381,1991)。通過添加異源性調節序列到無活性的、截短的啟動子,即僅包括核心TATA和選用CCAAT元件的5’上游區可以產生嵌合啟動子(Fluhr et al.,Science 2321106-1112,1986;Strittrnatter and Chua,Proc.Nat.Acad.Sci.USA 848986-8990,1987;Aryan et al.,Mol.Gen.Genet.22565-71,1991)。所以包含至少一種調節可操作連接的核酸序列表達的SEQ ID Nos36-51的順式元件的嵌合或雜合啟動子的設計、構建和用途包括在本發明的范圍中。
SEQ ID Nos36-51的啟動子序列、片段、區域或順式元件可以在胚發生或愈傷組織中轉錄DNA序列并因此可以選擇性調節這些組織中的基因表達。優選在胚發生或愈傷組織中調節基因表達的啟動子序列在轉化和選擇性表達母體組織基因中有用。例如,愈傷組織增強的或胚增強的啟動子可以可操作連接到可測量(scorable)標記如GUS或GFP。當這些分別為編碼葡糖醛酸糖苷酶和綠色熒光蛋白的報道基因與本發明的5’調節序列可操作連接時,可以提供胚發生組織的轉化潛能的指示和為最優化轉化和再生參數提供指示。本發明的5’調節序列也可用于選擇性轉錄任何基因或感興趣的基因,包括,但不限于那些增強種子質量性狀的基因。
包括分子和生物信息技術的基因組學的出現,產生了對來自于大量目標,包括但不限于農業上重要的植物種的大量DNA樣品的迅速測序和分析。為從cDNA序列數據庫或集合中識別本發明的核酸序列,第一步包括從感興趣的植物組織目標中構建cDNA文庫。簡言之,首先從那些在特定發育階段或在特定環境條件下收獲的組織建立cDNA文庫。通過識別在不同發育階段或不同條件下在植物組織中不同表達的基因,可以識別并分離那些基因的對應調節序列。轉錄成像使以從cDNA文庫中得到的核苷酸序列的特異性成像為基礎的對組織優選序列的識別成為可能。這里使用的轉錄成像是表示比較在一個或更多文庫中表達的基因豐度的分析。包含在cDNA文庫中的克隆被測序,與此序列比較的序列來自于公共數據庫。基于計算機的方法允許研究者提供查詢序列,它從多個文庫中比較序列。與本領域中的技術人員公知的常規雜交扣除方法相比,此方法使迅速識別感興趣的克隆成為可能。
使用常規的方法學,可以用聚dT引物和反轉錄酶從某種組織或生物體的mRNA(信使RNA)構建cDNA文庫(Efstmtiadis,et al.,Cell 7279,1976;Higuchi,et al.,Proc.Nati.Acad.Sci.U.S.A.)733146,1976;Maniatis,et al.,Cell 8163,1976;Land et al.,Nucleic Acids Res.92251,1981;Okayama,et al.,Mol.Cell.Biol.2161,1982;Gubler,et al.,Gene25263,1983)。
可以使用一些方法獲得全長cDNA構建體。例如,可以用末端轉移酶將dC殘基的同聚物尾添加到游離的3’羥基基團(Land,et al.,NucleicAcids Res.92251,1981)。這個尾然后可以與作為全長的第二條cDNA鏈的合成引物的寡聚dG雜交。Okayama和Berg報道了一種獲得全長cDNA構建體的方法。此方法通過使用合成的引物-連接物而簡化,合成的引物-連接物具有引發第一和第二條合成和克隆到質粒(Coleclough,et al.,Gene 34305,1985)和噬菌體載體(Krawinkel,et al.,Nucleic Acids Res.141913,1986;and Han,et al.,Nucleic Acids Res.156304,1987)的限制性位點的聚合物尾。
這些策略可以配合其它分離稀少mRNA群的策略。例如,典型的哺乳動物細胞包含10,000-20,000個不同的mRNA序列。Davidson,GeneActivity in Early Development,2nd ed.,Academic Press,New York,1976。獲得低豐度mRNA出現在cDNA文庫中的某個概率的要求克隆數為N=(ln(1-P)/ln(1-1/n)),其中N為要求的克隆數,P為需要的概率,1/n為以一條稀有mRNA為單位表示的總mRNA的分數部分(Sambrook,et al.,1989)。
一種富集mRNA制劑中感興趣序列的方法是根據大小區分。一種方法是通過瓊脂糖凝膠電泳區分(Pennica,et al.,Nature 301214,1983)。另一種方法在一種試劑如變性RNA二級結構的羥化甲基汞存在時使用蔗糖梯度離心(Schweinfest,et al.,Proc.Nati.Acad.Sci.(U.S.A.)794997-5000,1982)。
一種經常采納的方法是構建均等化或標準化的cDNA文庫(Ko,Nucleic Acids Res.185705,1990;Patanjali,S.R.et al.,Proc.Nati.Acad.Sci.(U.S.A.)881943,1991)。一般說來,cDNA群通過扣除雜交法而標準化(Schinid,et al.,J.Neurochem.48307,1987;Fargnoli,et al.,Anal.Biochem.187364 1990 Travis,et al.,Proc.Nati.Acad.Sci(U.S.A.)851696,1988;Kato,Bur.J.Neurosci.2704 1990 and Schweinfest,et al.,Genet.Anal.Tech.Appi.764,1990)。扣除代表了另一種減少cDNA文庫中某些序列群的方法。(Swaroop,et al.,Nucleic Acids Res.191954,1991).標準化文庫可以用Soares程序構建(Soares et al.,Proc.Nati.Acad.Sci.(U.S.A.)919228,1994)。這種方法的設計是為了減少個體cDNA頻率的初始10,000倍改變而獲得在一個數量級中的豐度并同時保持文庫的總體序列復雜性。在標準化程序中,高豐度cDNA克隆劇減,中間水平豐度的克隆相對未受影響,稀少轉錄克隆的豐度有效增加。
ESTs可以用許多方法測序。兩種基本方法可以用于DNA測序,即Sanger et al.,Proc.Nati.Acad.Sci.U.S.A 745463,1977中描述的鏈終止法和Maxam and Gilbert,Proc.Nat.Acad.Sci.U.S.A.74560,1977中描述的化學降解法。技術的自動化和發展如用基于熒光的測序替代放射性同位素法減少了測序DNA要求的努力(Craxton,Methods,220,1991;Ju et al.,Proc.Nati.Acad.Sci.(U.S.A.)924347,1995;Tabor andRichardson,Proc.Nati.Acad.Sci.(U.S.A.)926339,1995)。從許多生產商可以獲得自動測序儀,例如,Pharmacia Biotech,Inc.,Piscataway,New Jersey(Pharmacia ALF),LI-COR,Inc.,Lincoln,Nebraska (LI-COR 4,000)and Millipore,Bedford,Massachusetts(MilliporeBaseStation)。
已經發現長于150bp的ESTs對相似性搜索和作圖很有用(Adams,et al.,Science 2521651,1991)。EST序列一般為150-450個堿基。用單次運行序列數據可以常規并可靠產生序列長度信息。一般說來,從cDNA文庫只獲得單次運行序列數據,Adams,et al.,Science 2521651,1991。自動化的單次運行測序一般產生約2-3%錯誤或堿基混淆率(Boguski,et al.,Nature Genetics,4332,1993)。
EST數據庫由例如(McCombrie,et al.,Nature Genetics 1124,1992);人肝細胞系HepG2(Okubo,et al.,Nature Genetics 2173,1992);人腦RNA(Adams,et al.,Science 2521651,1991;Adams,et al.,Nature355632,1992);Arabidopsis,(Newnian,et al.,Plant Physiol.1061241,1994);以及小鼠(Kurata,et al.,Nature Genetics 8365,1994)構建或部分構建。本發明使用從許多從玉米胚和愈傷組織制備的文庫中分離的ESTs作為識別與在這些需要的組織中表達的基因相關的啟動子序列的工具,然后它促進調節基因的5’調節序列如啟動子的分離。
基于計算機的序列分析可以用于識別不同表達的序列,包括但不限于與另一種組織相比在一種組織中表達的序列。例如,從根組織和葉組織中分離的植物組織中分離的cDNA中可以發現不同系列的序列。因此,可以從在不同環境或生理條件下生長的植物制備的cDNA文庫中比較序列。當從感興趣的cDNA文庫中識別出優選序列時,可以從植物組織制備的基因組文庫中分離基因組克隆,對應的調節序列包括但不限于5’調節序列可以被識別并分離。
在一種優選實施方案中,從許多cDNA文庫中得到的表達序列標記(EST)序列在序列數據庫中分類。該數據庫用于從特定感興趣的組織中識別啟動子目標。為隨后的啟動子分離而進行的表達序列標記的篩選反映了在從單個cDNA文庫或cDNA文庫集合中的隨機取樣得到的代表性ESTs中一種或更多序列的存在。例如,調節胚發生或愈傷組織中轉錄物表達的調節序列的識別是通過識別出現在從胚發生或愈傷組織中制備的cDNA文庫中并在數據庫中的其它cDNA文庫中不存在或低豐度ESTs而進行的。然后估計被識別的EST先導序列在文庫中的相對豐度以及被估計的某種EST的表達圖譜。這里使用的豐度表示克隆或克隆簇在文庫中出現的次數。在特定組織或器官中被增強或高豐度,代表靶表達圖譜的序列是以這種方式被識別并可以從所識別的EST序列設計引物。一種基于PCR的方法可以用于從感興趣的靶植物基因組文庫中擴增側翼區。許多用于擴增鄰近已知序列核心區的未知DNA序列的方法是本領域技術人員公知的。這些方法包括,但不限于反相PCR(IPCR),vectorette PCR,Y形PCR和基因組步行法。
在一種優選的實施方案中,與連接物連接的基因組DNA用基因特異性引物和與連接物序列退火的引物進行第一輪PCR擴增。然后將PCR產物作為模板用基因特異性引物和第二種連接物進行嵌套的PCR擴增。然后將從嵌套PCR反應得到的片段分離、純化并亞克隆到適當的載體。當從截短的cDNA得到EST時,將片段測序并識別翻譯起點。然后可以將片段作為與報道基因如β葡糖醛酸糖苷酶(GUS)的融合克隆到植物表達載體中。然后可以在瞬時分析中檢驗這些構建體并隨后在適當的植物轉化載體中將5’調節區可操作連接到其它基因,然后通過許多本領域技術人員公知的方法分析轉化植物中感興趣基因的表達。
可以選擇任何植物進行基因和調節序列識別。分離基因和調節序列的適當植物目標將包括但不限于金合歡、紫花苜蓿、蘋果、杏、擬南芥、洋薊、芝麻菜、蘆筍、鱷梨、香蕉、大麥、豆角、甜菜、黑莓、藍莓、椰菜、抱子甘藍、卷心菜,canola,哈密瓜、胡蘿卜、木薯、蓖麻、花椰菜、芹菜、櫻桃、菊苣、芫荽、柑橘、克萊門小柑橘、苜蓿、椰子、咖啡、玉米、棉花、黃瓜、道格拉斯冷杉、茄子、菊苣、苣荬菜、桉樹、茴香、無花果、大蒜、葫蘆、葡萄、葡萄果、蜜瓜、涼薯、獼猴桃、萵苣、韭菜、檸檬、酸橙、火炬松、亞麻子、芒果、甜瓜、蘑菇、油桃、堅果、燕麥、油棕櫚、油菜、黃秋葵、橄欖、洋蔥、桔子、觀賞植物、棕櫚、番木瓜、歐芹、歐洲防風草、豌豆、桃、花生、梨、胡椒、柿子、松樹、菠蘿、車前草、李子、石榴、白楊、土豆、西葫蘆、溫柏、radiatapine、radiscchio、蘿卜、油菜籽、覆盆子、大米、黑麥、高梁、南方松、大豆、菠菜、南瓜、草莓、甜菜、甘蔗、向日葵、甘薯、橘子、茶葉、煙草、番茄、黑小麥、草、蕪箐、藤本植物、西瓜、小麥、山藥、夏季產南瓜,特別優選的植物目標應包括玉米、棉花、大豆和小麥。
本發明的核酸分子從玉米(Zea mays)中分離。玉米發育約20-21個葉,在發芽后約65天抽絲,在發芽后約121天成熟。正常的玉米植物遵循普通的發育模式,但不同階段間的時間間隔和形態在不同雜交、生長和環境條件間是不同的。
在玉米植物發育中有許多可識別的階段。這些階段被定義為營養期(V)和生殖(R)期。V期的細分按數字指定為V1,V2,V3等到V(n),(n)表示抽穗前的最后一個出葉期,第一個V階段為發芽(VE)期。例如,VE是幼苗葉從土壤中突出,V1表示第一片真葉,V2表示第二片葉,等。生殖階段包括第一條絲的出現到成熟的種子,按如下表示R1為抽絲,R2為發皰,R3為乳熟期,R4為臘熟期、R5為dent期,R6為生理成熟期(見,例如Ritchie SW et al.(1986)How a Corn PlantDevelops,Iowa State University of Science and Technology CooperativeExension Service,Ames,IA 481-21)。
任何植物組織類型都可用作識別基因和相關調節序列包括但不限于啟動子序列的靶組織。對于本發明,使用了玉米組織。更優選地,玉米胚發生或愈傷組織為識別啟動子序列的靶組織。玉米cDNA文庫用從傳粉后21天(21-DAP)和傳粉后13天(13-DAP)的玉米分離的胚組織和II型玉米愈傷組織構建。
任何允許在不同類型序列之間進行示差比較的方法都可以用于分離感興趣的基因或調節序列。例如,在一種示差篩選方法中,可以用買到的克隆試劑盒在噬菌體宿主中制備從特定組織mRNA得到的cDNA文庫。將斑片鋪展到含細菌宿主如大腸桿菌菌苔的平皿上產生噬菌體斑。只有DNA結合膜可以產生105-106個噬斑。用靶組織和非靶組織產生的探針探測復制膜,從而判斷靶組織和非靶或本底組織的差別表達。探針被標記,從而促進雜交和發育后的檢測。與靶組織來源的探針雜交但不與非靶組織來源的探針雜交,表現出所需差別表達模式的噬斑可以選作進一步分析。也可以通過用限制性酶部分消化和在特定大小范圍內對DNA片段進行大小篩選而從選擇物種制備基因組DNA文庫。基因組DNA可以被克隆到適當的載體,包括但不限于噬菌體,并用前面所描述的適當試劑盒制備(見例如,Stratagene,La Jolla,CA or Gibeo BREGaithersburg,MD)這里使用的示差雜交技術是本領域技術人員公知的并可以用于分離需要的序列類型。這里使用的序列類型表示以共同的識別物包括但不限于可以以從共同靶植物中分離的序列、共同文庫或共同植物組織類型為基礎而分成組的序列。在一種優選實施方案中,感興趣的序列是以序列分析和查詢不同組織類型的文庫中的不同cDNA序列集合而識別的。公開的方法提供了以從不同cDNA文庫中得到的植物ESTs的電子序列分析為基礎的示差篩選的一個例子。
許多用于評估基因表達的方法是以測量器官、組織或細胞樣品中的mRNA水平為基礎的。典型的方法包括但不限于RNA印跡、核糖核酸酶保護測定和RT-PCR。在另一種優選實施方案中,使用了高流通量的方法從轉錄作圖(transcript profiling)法中識別調節序列。cDNA微陣列(microarray)技術的發展使系統監測成千上萬基因的基因表達圖譜成為可能(Schena et al,Science,270467,1995)。這種以DNA芯片為基礎的技術將成千上萬的cDNA序列排列在支持面上。同時將這些陣列與許多從不同細胞或組織類型的RNA樣品制備的標記cDNA探針雜交,允許直接的表達比較分析。此技術首先是通過分析48個擬南芥基因在根和芽的差別表達而證明的(Schena et al,Science,270467,1995)。更近一些,用cDNA微陣列技術監測了超過1400個基因的表達圖譜(Ruan et al,The Plant Journal 15821,1998)。微陣列提供了高產量、定量的和可再生的方法而分析基因表達和鑒定基因功能。這樣使用微陣列的轉錄作圖法為分離調節序列如與這些基因相關的啟動子提供了另一種有價值的工具。
本發明使用高產量的序列分析而形成感興趣序列的迅速的計算機識別的基礎。本領域的技術人員了解序列分析可用的資源。可以通過判斷檢驗或詢問序列與公共或私有數據庫中序列的相似性(“相似性分析”)或通過搜索某些基序(內在序列分析)(如順式元件)而進行序列比較(Coulson,Trends in Biotechnology,1276,1994;Birren,et al.,Genome Analysis,1543,1997)。
SEQ ID Nos36-51或其片段提供的核酸序列或其互補序列,或至少90%等同于,優選95%等同于甚至更優選99%或100%等同于SEQ IDNos36-51或其片段提供的序列或其互補序列的核苷酸序列,可以“被提供”于許多介質中。這種介質也可以以允許本領域技術人員檢驗序列的形式提供其亞型。
在此實施方案的一種應用中,本發明的核苷酸序列可以被記錄在計算機可讀的介質上。這里使用的“計算機可讀介質”是指任何可以由計算機直接讀入和存取的介質。這種介質包括,但不限于磁性存儲介質,如軟盤、硬盤、存儲介質和磁帶;光學存儲介質如CD-ROM;電子存儲介質如RAM和ROM;以及這些類別的雜合物如磁性/光學存儲介質。本領域的技術人員可以很容易了解目前已知的計算機可讀介質如何創建包含記錄本發明核苷酸序列的計算機可讀介質的產品。
通過提供一種或更多本發明的核酸序列,本領域中的技術人員可以為多種目的而常規存取序列信息。可以通過許多方法分析序列,如通過在沒有為這種目的而設計的軟件的幫助下分析序列。計算機軟件也是公共的,允許本領域中的技術人員存取提供于計算機可讀介質中的序列信息。公共數據庫的例子包括但不限于日本DNA數據庫(DDBJ)(http//www.ddbj.nig.ac.jp/);基因庫(http//www.ncbi.nlm.nih.gov/web/Genbank/Index.html);以及歐洲分子生物實驗室核酸序列數據庫(EMBL)(http//www.ebi.ac.uk/ebi_docs/embl_db.html)或其譯本。已經開發了許多不同的搜索算法,包括但不限于稱作BLAST程序的一套程序。有五種BLAST執行,三種是為核苷酸序列查詢而設計(BLASTN,BLASTX和TBLASTX),兩種是為蛋白序列查詢而設計(BLASTP and TBLASTN)(Coulson,Trends in Biotechnology,1276-80,1994;Birren,et al.,Genome Analysis 1543.l997)。
為基序搜索而設計的程序在本發明中也有用。為基序搜索而設計的序列分析程序可以用于識別順式元件。優選的計算機程序可以包括但不限于MEME,SIGNAL SCAN和GENESCAN。Meme是一個在一組未對比序列中識別保守基序(核酸或肽)的程序。Meme將這些基序保存為一系列分布圖。這些分布圖可以用于搜索序列數據庫。MEME算法(2.2版)可以在GCG軟件包10.0版中找到;MEME(T.Bailey and C.Elkan,Machine Learning,21(1-2)51-80,1995)站點位置如下(http/Iwww.sdsc.edu/MEMEImeme/website/COPYRIGHT.html.)。SignalScan是一個用其它數據庫中的信息識別檢驗序列的已知基序的程序(Prestridge,D.S.,CABIOS 7,203-206(1991)。SignalScan 4.0信息在以下站點可以找到http//biosci.cbs.umn.edu/software/sigscan.html。用于SignalScan的ftp站點為ftp//biosci.cbs.umn.edu/sofiw~e/sig5can.html。Signal Scan使用的數據庫包括PLACE(http//www.dna.affrc.go.ip/htdocs/PLACE(Higo et al.,Nucleic AcidsResearch 27(1)297-300(1999)和TRANSFAC(Heinemeye,X.et al.,Nucleic Acid Research 27(1)318-322),可以在如下站點找到http//taansfac.gbf.deA。GeneScan是另一個適合基序搜索的程序(Burge,C and Karlin,S.J.Mol.Biol.268,78-94(1997),1.0版的信息在以下站點可以找到http//gnomic.stanford.edu/GENESCANW.html.。這里用到的“靶結構基序”或“靶基序”是指任何合理選擇的序列或序列結合,其中序列是以靶基序折疊而形成的三維構象為基礎而選擇的。許多靶基序是本領域中的技術人員所公知的。蛋白的靶基序包括但不限于酶活性位點和信號序列。本發明的優選靶基序包括但不限于啟動子序列、順式元件、發夾結構和其它表達元件如蛋白結合序列。
這里使用的“搜索”是指在基于計算機的系統中運行而比較靶序列或靶結構基序與儲存在數據儲存設備中的序列信息的一種或更多程序。搜索方法是用于識別與特定靶序列或靶基序匹配的本發明的序列片段或區域。也可以比較多個序列以便識別負責特定功能的共同區域或基序。例如,當用某些軟件包對比和分析相似類型啟動子的多個啟動子區域時,可以識別賦予特定表達圖譜的順式元件或序列結構域。
本發明還提供了包含這里所描述的序列信息的系統,特別是基于計算機的系統。這里使用的“基于計算機的系統”是指用于分析本發明核苷酸序列信息的硬件設備、軟件設備和數據存儲設備。本發明的最低硬件設備包括中央處理單元(CPU)、輸入設備、輸出設備和數據儲存設備。本領域的技術人員可以理解任何數量的基于計算機的系統都適合用于本發明,這種程序與沒有計算機系統輔助的檢查相比提供了有效的序列數據分析手段。
SEQ ID Nos6-35是從基于計算機的序列比較而識別的cDNA序列設計的引物。這些序列是用于用聚合酶鏈式反應(PCR)擴增技術延伸核酸序列(見,例如,Mullis et al.,Cold Spring Harbor Symp.Quant.Biol.51263,1986;Erlich等,歐洲專利申請50,424;歐洲專利申請84,796,歐洲專利申請258,017;歐洲專利申請237,362;Mullis,歐洲專利申請201,184;Mullis等,美國專利4,683,202;Erlich,美國專利4,582,788;和Saiki等,美國專利4,683,194)。許多PCR擴增方法是本領域中的技術人員所公知的,并用于識別鄰近于已知序列的核酸序列。例如,描述了擴增鄰近于已知序列的核心區的未知DNA序列的反相PCR(IPCR)方法。也提供了其它方法,如捕捉PCR(Lagerstrom M.,et al.,PCR Methods Applic.1111,1991),及步行PCR(Parker,JD et al.,Nucleic Acids Res 193055,1991)。為識別感興趣的序列,許多生產商也開發了以這些方法的修飾為基礎的試劑盒。技術的發展包括引物和連接物的改進、聚合酶的改進和溫度循環能力促進了分離感興趣序列的更快和更有效的方法。
在一種優選實施方案中,用基因組步行方法(UniversalGenomeWalkerTMKit,CLONTECH Laboratories,Inc.,Palo,Alto,CA)分離含有本發明的5’調節元件的側翼序列。簡言之,使純化的基因組DNA接受限制性內切酶消化,產生末端與GenomeWalkerTM連接物連接的基因組DNA片段。GenomeWalkerTM引物與基因特異性引物一起在兩個連續的PCR反應中使用(初級和嵌套PCR反應),從而產生含有隨后被克隆和測序的5’調節序列的PCR產物。
除了用于調節基因表達,本發明的啟動子序列也具有在核酸雜交實驗中作為探針和引物的應用。本發明的核酸探針和引物可以在嚴格條件下與靶DNA序列雜交。名詞“嚴格的雜交條件”定義為探針或引物與靶序列特異性雜交但不與非靶序列雜交的條件,可以由經驗判斷。名詞“嚴格條件”是關于核酸探針與靶核酸(即與感興趣的特定核酸序列)通過討論于Sambrook et al.,1989,9.52-9.55的特異性雜交程序而雜交的功能性定義。也見Sambrook et al.,1989 at 9.47-9.52,9.56-9.58;Kanehisa,Nucl.Acids Res.12203-213,1984;及Wetmur and Davidson,J Mol.Biol.31349-370,1968。促進DNA雜交的適當嚴格條件為,例如,在約45℃下6.0x氯化鈉/檸檬酸鈉(SSC),然后是在50℃下用2.0xSSC洗滌,這是本領域中技術人員公知的,或可以在Current Protocols inMolecular Biology,John Wiley & Sons,N.Y.,1989,6.3.1-6.3.6中找到。例如,洗滌步驟中的鹽濃度可以選用50℃下約2.0xSSC的低嚴格性到50℃下約0.2xSSC的高嚴格性。另外,洗滌步驟中的溫度可以從在室溫下的約22℃的低嚴格性條件到約65℃的高嚴格雜交條件。溫度和鹽都可以改變,或當其它變量改變時溫度和鹽濃度可以保持恒定。
例如,對于高嚴格性,用DNA或RNA探針或引物進行的雜交可以在65℃下,6x SSC,0.5%SDS,5x Denhardt試劑,100ug/mL非特異性DNA(如超聲波降解的鮭魚精子DNA)下進行,在65℃下,0.5xSSC,0.5%SDS洗滌。
考慮到了如果保留了探針或引物對靶序列的結合特異性,較低嚴格的雜交條件如更低的雜交和/或洗滌溫度可以用于識別具有更低度序列相似性的相關序列。因此,由于它們選擇性與DNA片段互補鏈形成雙螺旋分子的能力,可以使用本發明的核苷酸序列。通過雜交檢測DNA節段是本領域的技術人員公知的,因此根據本申請所預見的,將需要使用不同雜交條件而獲得探針對靶序列的不同程度的選擇性,選擇方法將取決于所需的結果。
SEQ ID Nos36-51的核酸序列和任何其變體可以在適當選擇的嚴格條件下與其它核酸序列雜交。如這里所用到的,如果兩個分子可以形成反向平行的、雙鏈核酸結構那么兩個核酸分子就稱為可以特異性互相雜交。如果兩個核酸分子表現出完全互補,那么就稱一個核酸分子與另一個核酸分子“互補”。如這里所用到的,當一個分子的所有核苷酸每個核苷酸都與另一個分子的核苷酸互補,那么就稱這兩個分子表現出“完全互補”。如果兩個分子的互相雜交有充分的穩定性而允許它們在至少常規“低嚴格”條件下互相退火,那么就稱它們是“最小互補”的。如果兩個分子的互相雜交有充分的穩定性而允許它們在至少常規“高嚴格”條件下互相退火,那么就稱它們是“互補的”。常規的嚴格雜交條件描述于Sambrook,et al.,Molecular Cloning,A Laboratory Manual,2nd Ed.,Cold Spring Harbor Press,Cold Spring Harbor,New York,1989,and by Haymes et al.,Nucleic Acid Hybridization,A Practical Approach,IRL Press,Washington,DC,1985。
在一種優選實施方案中,核酸序列SEQ ID Nos36-51或這些序列的片段、區域、順式元件或寡聚物,可以用于其它植物組織的雜交分析而識別密切相關或同源的基因和相關調節序列。這些包括但不限于在任何底物包括但不限于適當制備的植物組織、纖維素、尼龍或組合過濾器、芯片或載玻片上進行的DNA或RNA雜交分析。這些方法學是本領域中公知的,可以從銷售商提供的試劑盒或制劑中得到。
當然,也可以通過其它技術如通過化學方法直接合成片段而獲得片段,通常用自動寡核苷酸合成器執行。也可通過核酸復制技術,如通過分子生物學領域技術人員公知的重組DNA技術進行的PCRTM(聚合酶鏈式反應)技術獲得片段。關于用特定擴增引物對擴增靶核酸序列(如通過PCR),“嚴格PCR條件”是指允許引物對僅僅與靶核酸序列雜交的條件,靶核苷酸序列將與具有對應野生型序列(或其互補序列)的引物結合并優選產生唯一的擴增產物。
這里使用的核酸片段是指小于全長的任何核酸部分。片段也可以包含至少一個可以在前面定義的嚴格雜交條件下特異性與天然核酸雜交的最小長度。這種最小片段的長度優選為天然核酸序列的至少8個連續核苷酸,更優選為15個連續核苷酸,更優選為至少20個連續核苷酸,最優選為至少30個連續核苷酸。
本發明的核酸序列也可以用于探針和引物。可以根據天然基因序列制備核酸探針和引物。“探針”是常規可檢測標記物或受體分子,如放射活性同位素、配體、化學發光劑或酶連接的分離核酸。“引物”是通過核酸雜交而退火到互補靶DNA鏈的分離核酸,從而形成引物和靶DNA鏈的雜交物,然后通過聚合酶,如DNA聚合酶沿靶DNA鏈延伸。引物對可以用于如通過聚合酶鏈式反應(PCR)或其它常規核酸擴增方法擴增核酸序列。
探針和引物一般為15個核苷酸或更長,優選20個核苷酸或更多,更優選25個核苷酸,最優選30個核苷酸或更多。這種探針和引物在高嚴格雜交條件下特異性與靶DNA或RNA序列雜交,并在低嚴格條件下特異性與另一物種的靶天然序列雜交。盡管可以用常規方法設計與天然序列不同并保持與靶天然序列雜交的能力的探針,本發明的探針和引物優選與天然序列有完全的序列相似性。制備和使用探針和引物的方法描述于,例如Molecular CloningA Laboratory Manual,2nd ed.,vol.1-3,ed.Sambrook et al.,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY,1989(以下稱為,″Sambrook et al.,1989″);CurrentProtocols in Molecular Biology,ed.Ausubel et al.,Greene Publishing andWiley-Interscience,New York,1992(有定期更新)(以下為,″Ausubel etal.,1992);and Innis et al.,PCR ProtocolsA Guide to Methods andApplications,Academic PressSan Diego,1990。PCR引物對可以,例如,通過使用針對該目的如引物的計算機程序(Version 0.5,1991,Whitehead Institute for Biomedical Research,Cambridge,MA)可以從已知序列得到引物對。這里公開的以天然啟動子序列為基礎的引物和探針可以用于證實,如果需要,用于通過常規方法如通過再克隆和再測序而修飾公開序列。
在另一種實施方案中,這里公開的啟動子核苷酸序列可以被修飾。本領域中的技術人員可以建立核苷酸序列有改變的DNA分子。以SEQ ID NOS36-51表示的本發明的核苷酸序列可以被修飾或改變而增強它們的控制特征。一種改變核酸序列的優選方法是用PCR修飾選定的核苷酸或序列區。這些方法是本領域中的技術人員公知的。可以通過以PCR為基礎的DNA修飾法例如插入、去除或替代模板序列而修飾序列。“變體”DNA分子為含有天然序列的一個或更多核苷酸被去除、添加和/或替代的改變的DNA分子,優選基本保持啟動子功能。在啟動子片段的情況下,“變體”DNA可以包括影響與其可操作連接的最小的啟動子轉錄的改變。可以通過例如,標準DNA誘變技術或通過化學合成變體DNA分子或其部分而產生變體DNA分子。
在另一種實施方案中,以SEQ ID NOS36-51表示的核苷酸序列包括可以調節可操作連接的DNA序列的任何長度的序列。例如,公開于SEQ ID NOS36-51的序列可以被截短或去除并仍然保持可以調節可操作連接的DNA序列的轉錄。在一種相關的實施方案中,公開序列的順式元件可以賦予特定的特異性如賦予胚發生或愈傷組織中可操作連接的DNA序列增強的表達并因此也可以調節轉錄。所以,公開序列的任何序列片段、部分或區域可以用于調節序列,包括,但不限于順式元件或基序。例如,可以將一個或更多堿基對從啟動子序列的5’或3’端去除而產生“截短的”啟動子。也可以將一個或更多堿基對插入、去除或內部替代到啟動子序列。可以將啟動子構建為使啟動子片段或元件被可操作連接,例如,通過將這種片段放置在最小啟動子的上游。最小或基本啟動子是可以募集并結合基本轉錄機構的DNA片段。真核細胞中的基本轉錄機構是RNA聚合酶II復合物和它的輔助蛋白。這種基本轉錄機構的酶成分可以利用最小或基本啟動子起始和延長某種基因的轉錄。也就是說,在啟動子區沒有可以募集和結合調節轉錄,如增強、阻遏、導致轉錄激素依賴性等的轉錄因子的添加的順式作用序列。替代、去除、插入或其結合可以結合而產生終末構建體。
本發明的天然或合成核酸可以摻入重組核酸構建體,一般是DNA構建體,可以導入宿主細胞并在其中復制。在一種優選實施方案中,以SEQ ID NOS36-51表示的核苷酸序列或其片段、變體或衍生物被摻入包括可操作連接到基因成分如可選擇、可篩選或可測量的標記基因的本發明的啟動子區的表達載體盒中。本發明的公開核酸序列優選可以可操作連接到基因成分如賦予與所需與植物形態、生理、生長和發育、產量、營養增強、抗疾病或抗害蟲、或環境或化學耐受相關的特征的核酸。這些基因成分如標記基因或感興趣的農業基因可以在識別轉化植物細胞或植物中起作用,或產生有農業應用的產品。本發明的啟動子序列可以用于調節任何可操作連接的可轉錄序列的表達。特別優選的可操作連接的可轉錄序列將包括但不限于那些優選在胚發生或愈傷組織中表達的序列。
在一種優選的實施方案中,一種基因成分產生作為選擇設備和作用于可再生植物組織中產生可以賦予植物組織耐受其它毒性化合物的化合物的產物。用作可選擇的、可篩選或可測量標記的感興趣基因可以包括但不限于GUS(β-葡糖醛酸糖苷酶的編碼區)、GFP(綠色熒光蛋白的編碼序列)或抗生素或除草劑耐受基因。轉座子和相關的抗生素耐藥基因包括Tns(bla),Tn5(npt II),Tn7(dhfr),青霉素,卡那霉素(以及新霉素、G418、博萊霉素);氨甲喋呤(以及甲氧芐氨嘧啶;氯霉素;卡那霉素和四環素轉座子。
對植物中可選擇的標記有用的特征在一項關于微生物的使用的報告中有概述(Advisory Committee on Novel Foods and Processes,July1994)。這些特征包括最小數目的未轉化組織的嚴格選擇,大量獨立轉化事件而沒有對再生的嚴重干擾,應用于大量物種,存在一種為組織中標記的存在評分的測定。
許多可選擇的標記基因是本領域中公知的,并且一些抗生素耐藥標記滿足這些標準,包括耐卡那霉素(npt II)、潮霉素(aph IV)和慶大霉素(aac3和aac4)的標記。有用的顯性可選擇標記基因包括編碼抗生素耐藥基因的基因(如耐潮霉素、卡那霉素、博萊霉素、G418、鏈霉素或奇放線菌素);以及除草劑抗性基因(如膦絲菌素乙酰轉移酶)。選擇抗除草劑的轉化突變型的一種有用的策略描述于如,Vasil,Cell Cultureand Somatic Cell Genetics of Plants,Vols.I-III,Laboratory Proceduresand Their Applications Academic Press,New York,1984。用于本發明的特別優選的可選擇標記將包括賦予抗化合物如抗生素如卡那霉素以及除草劑如草甘膦(Della-Cioppa et al.,Bioffechnology 5(6),1987,U.S.Patent 5,463,175,U.S.Patent 5,633,435)。也可執行其它選擇裝置并仍處在本發明的范圍中。
對于本發明的實施,使用了制備和使用載體的常規組合物和方法及宿主細胞,如Sambrook et al.,1998等所討論的。在一種優選實施方案中,宿主細胞為植物細胞。許多適于穩定轉染植物細胞或建立轉基因植物的載體描述于如,Pouwels et al.,Cloning VectorsA LaboratoryManual,1985,supp.1987;Weissbach and Weissbach,Methods for PlantMolecular Biology,Academic Press,1989;Gelvin et al.,Plant MolecularBiology Manual,Kluwer Academic Publishers,1990;and R.R.D.Croy,Plant Molecular Biology LabFax,BIOS Scientific Publishers,1993。植物表達載體可以包括,如在5’和3’調節序列轉錄控制下的一種或更多克隆植物基因。這種植物表達載體也可以含啟動子調節區(如,控制誘導型或組成型,環境或發育調節的或細胞或組織特異性表達的調節區域),轉錄起始位點,核糖體結合位點,RNA加工信號、轉錄終止位點和聚腺苷酸化信號。在表達載體中視為基因成分的其它類型的調節序列包括但不限于可以與啟動子偶聯的非翻譯先導序列。在一種特別優選的實施方案中,宿主細胞為植物細胞,植物表達載體包含SEQ ID Nos36-51的啟動子區域。植物表達載體也可以包含額外序列,包括但不限于用于克隆目的的限制性酶位點。
任何感興趣基因的許多對植物基因表達有用的啟動子包括但不限于可選擇標記,可測量標記,耐受害蟲、耐受疾病、營養增強的基因或其它農業上感興趣的基因。對植物基因表達有用的組成型啟動子的例子包括但不限于,賦予在大多數植物組織中組成型、高水平表達的花椰菜花葉病毒(CaMV)35S啟動子(見,如,Odel et al.,Nature 313810,1985),包括單子葉植物(見如Dekeyser et al.,Plant Cell 2591,1990;Teradaand Shimamoto,Mol.Gen.Genet.220389,1990);胭脂堿合成酶啟動子(An et al.,Plant Physiol.88547,1988)及章魚堿合成酶啟動子(Fromm etal.,Plant Cell 1977,1989)和玄參花葉病毒(FMV)啟動子(美國專利No.5,378,619,是一種雙邊,右(RB)和左(LB)T-DNA邊的植物轉化載體,由下列基因成分組成ZM-700267629是從玉米胚基因組文庫中分離的進行玉米胚增強表達的啟動子;I-Zm.Hsp70內含子是玉米熱休克蛋白的間插序列,如美國專利5,593,874和5,859,347所描述,在此引入其完整內容作為參考);Ec.GUS1為大腸桿菌β葡糖醛酸糖苷酶的編碼區;T-AGRTU.nos是胭脂堿合成酶基因的終止信號;P-CaMV.35S是CaMV 35S啟動子(美國專利No.5,352,605,在此引入其完整內容作為參考)。
許多植物啟動子是應答于環境、化學和/或發育信號而調節的,可以用以表達植物細胞中可操作連接的基因,包括由(1)熱(Callis et al.,Plant Physiol.88965,1988),(2)光(如,pea rbcS-3A promoter,Kuhlemeier et al.,Plant Cell 1471,1989;maize rbcS promoter,Schaffner and Sheen,Plant Cell 3997,1991;或chlorophyll a/b-bindingprotein promoter,Simpson et al.,EMBO J.42723,1985),(3)激素如脫落酸(M & cotte et al.,Plant Cell 1969,1989),(4)創傷(如,wuni,Siebertz etal.,Plant Cell 1961,1989);或(5)化學物質如茉莉酸、水楊酸或安全劑調節的啟動子。使用(6)器官特異性啟動子(如,Roshal et al.,EMBO J.61155,1987;Schernthaner et al.,EMBO J.71249,1988;Bustos et al.,Plant Cell 1839,1989)也可以是有益的。本發明的啟動子是胚細胞增強的和胚發生組織增強的或愈傷組織增強的植物啟動子,可以可操作連接到表達載體中的任何感興趣基因。
植物表達載體可以包括RNA加工信號,如內含子,可以位于轉基因的多肽編碼序列的上游或下游。另外,表達載體可以包括植物基因3’非翻譯區的額外調節序列(Thomburg et al.,Proc.Nati.Acad.Sci.USA84744(1987);An et al.,Plant Cell 1115(1989),如增加mRNA的mRNA穩定性的終止子區,如土豆的PI-II終止子區或章魚堿或胭脂堿合成酶3’終止子區。mRNA的5’非翻譯區可以在翻譯起始中起重要作用并且也可以是植物表達載體的基因成分。例如,已經證明從熱休克蛋白基因得到的非翻譯5’先導序列可以增強植物中的基因表達(見,例如美國專利5,352,865,在此引入其完整內容作為參考)。這些額外的上游和下游調節序列可以源于與存在于表達載體中的其它元件的天然或異源的來源。
本發明的啟動子序列被用于控制植物細胞中的基因表達。更優選將此啟動子序列用于控制植物種子中的基因表達。甚至更優選將此啟動子序列用于控制植物胚中的基因表達。公開的啟動子序列是用于植物轉化的載體的一部分的基因成分。本發明的啟動子序列可以與任何適當的含可選擇或可篩選標記和相關調節元件的植物轉化質粒或載體,以及如本文所述的以足夠賦予特別需要的性狀的方式表達的一種或更多核酸一起使用。本發明預見的適當有農業益處的基因包括但不限于一種或更多昆蟲耐受基因如B.t.,害蟲耐受如真菌疾病控制基因,除草劑耐受如授予草甘膦耐受的基因,以及改進質量的基因如產量、增強營養如維生素、油和氨基酸組成、環境或壓力耐受或植物生理、生長、發育、形態或植物產品的任何需要的改變。
另外,DNA編碼序列可以通過編碼例如通過反義或共抑制介導機制導致定向抑制內源性基因表達的非翻譯RNA分子影響這些表型(見,例如,Bird et al.,Biotech.Gen.Engin.Rev.9207,1991)。RNA也可以是經加工而切除需要的內源性mRNA產物的催化性RNA分子(即核酶)(見例如Gibson and Shillitoe,Mol.Biotech.7125,197)。這樣,任何產生表達感興趣的表型或形態改變的蛋白或mRNA的基因對實施本發明都是有用的。
除了位于DNA序列上游(5’)或內部的調節元件或序列,還有影響基因表達的下游序列,因此這里使用的名詞調節序列是指任何位于DNA序列上游、內部或下游,與細胞的蛋白合成裝置結合控制、介導或影響基因產物表達的核苷酸序列。
例如,為在其它植物系統中表達本發明的啟動子序列,可以修飾本發明的啟動子序列。在另一種方法中,可以通過許多方法設計或加工新穎的嵌合或雜合啟動子。許多啟動子包含激活、增強或定義強度和/或啟動子特異性的上游序列(Atchison,Ann.Rev.Cell Biol.4127,1988)。T-DNA基因,如含有定義轉錄起始位點的TATA盒和位于轉錄起始位點上游的其它上游元件調節轉錄水平(Gelvin,In TransgenicPlants(Kung,S.-D.And Us,R.,eds),San DiegoAcademic Press,pp.49-87,1988)。另一種嵌合啟動子將章魚堿合成酶(ocs)激活劑三聚體結合到甘露堿合成酶(mas)激活劑與啟動子,并報道了報道基因表達的增加(Min Ni et al.,The Plant Joumal 7661,1995)。本發明的上游調節序列可以用于構建這種嵌合或雜合啟動子。用于構建本發明的變異啟動子的方法包括但不限于將不同啟動子的控制元件或啟動子的復制部分或區域結合起來(見例如美國專利5,110,732,在此引入其完整內容作為參考,以及美國專利5,097,025,在此引入其完整內容作為參考)。本領域的技術人員熟悉描述構建、操作和分離大分子(如DNA分子,質粒等)的特定條件和程序,產生重組生物體和篩選及分離基因的標準來源物質(見例如Sambrook et al.,Molecular CloningA Laboratory Manual,ColdSpring Harbor Press,1989;Mailga et al.,Methods in Plant MolecularBiology,Cold Spring Harbor Press,1995;Birren et al.,Genome Analysisvolume 1,Analyzing DNA,(1997);volume 2,Detecting Genes,(1998);volume 3,Cloning Systems,(1999),volume 4,Mapping Genomes,(1999),Cold Spring Harbor,New York)。
如文中所描述可以用可篩選或可測量的標記將本發明的啟動子序列插入表達載體中并在提供穩定植物系統中的基因表達的指示的瞬時測定中對其進行檢驗。在瞬時測定中檢驗基因表達的方法是本領域中的技術人員公知的。用許多植物、組織和DNA運送系統報道了標記基因的瞬時表達。例如,瞬時分析的類型可以包括但不限于在使用任何感興趣的植物種的瞬時測定中通過電穿孔或粒子轟擊組織而指導基因運送。這種瞬時系統包括但不限于從小麥懸浮液培養物中得到的原生質體(Zhou et al.,Plant Cell Reports 12612.1993),小麥葉原生質的電穿孔(Sethi et al.,J.Crop Sci.52152,1983);從玉米組織制備的原生質的電穿孔(Sheen,J.The Plant Cell 3225,1991),或感興趣的特定組織的粒子轟擊。本發明包含用任何瞬時表達系統評估操作連接到選擇的報道基因,標記基因或感興趣的農業基因的調節序列。預備通過適當的運送系統在瞬時系統中檢驗的植物組織的例子包括但不限于葉基組織、愈傷組織、子葉、根、胚乳、胚發生組織、花組織、花粉和表皮組織。
任何可測量或可篩選的標記都可以用于瞬時測定。瞬時分析本發明的啟動子或5’調節序列的優選標記基因包括GUS基因(β葡糖醛酸糖苷酶的編碼序列)或GFP(綠色熒光蛋白編碼序列)。將含有與標記基因可操作連接的5’調節序列的表達載體運送到組織中,并用適當的機制根據標記分析組織。數量或質量分析被用作評估當啟動子序列在穩定植物中與農業上感興趣的基因操作連接時的潛在表達圖譜。最終,將本發明的5’調節序列直接摻入適當的植物轉化表達載體中,將本發明的5’調節序列操作連接到可選擇的標記和感興趣的基因,轉化到植物中,并分析轉化植物及其后代中由5’調節序列賦予的表達圖譜。本領域的技術人員已知適于植物轉化的載體。適當的載體將包括但不限于用于土壤桿菌介導方法的disarmed Ti質粒。這些載體可以含抗性標記、1-2個T-DNA邊和大腸桿菌和土壤桿菌的復制起點以及一種或更多感興趣的基因及相關調節區。本領域的技術人員已知對于土壤桿菌介導途徑,可以使用許多菌株和方法。這些菌株包括但不限于土壤桿菌株C58,LBA44O4,EHAIOl和EHAl05。特別優選的株為根癌土壤桿菌株。其它用于植物轉化的DNA運送系統也是本領域技術人員公知的并包括但不限于選定植物組織的粒子轟擊。其它用于植物轉化的DNA運送系統也是本領域技術人員公知的并包括但不限于一般為感興趣的特定植物宿主優化的選定植物組織的粒子轟擊。
可以用本發明范圍中的方法引入的核酸的例子包括,例如從另一物種得到的DNA序列或基因,或甚至是同一物種起源或存在于同一物種中,但是是通過經典復制或雜交技術以外的基因工程方法摻入受體細胞的序列。然而,名詞外源性的,也意欲指通常在被轉化細胞中不存在,或也許僅僅是不以轉化DNA片斷或基因中的形式、結構等存在的基因或通常存在,但需要如過度表達的基因。這樣,名詞“外源性”基因或DNA意欲指任何引入受體細胞的任何基因或DNA片段,不管此細胞中是否已經有相似的基因。包括在外源性DNA中的DNA類型可以包括已經存在于植物細胞中的DNA,另一種植物的DNA,不同生物體的DNA,或外部產生的DNA,如含基因反義信息的DNA序列,或編碼基因的合成或修飾版本的DNA序列。
可以通過植物轉化方法將包含本發明的啟動子序列的植物轉化載體引入植物。有一些方法可以將DNA序列引入植物細胞并且是本領域中熟知的。適當的方法包括細菌感染,二元細菌人工染色體載體,直接運送DNA(如通過PEG介導的轉化),干燥/抑制介導的DNA攝取,電穿孔,用氧化硅纖維攪拌,以及加速DNA包被的顆粒(綜述于Potrykus,Ann.Rev.Plant Physiol.Plant Mol.Biol.,42205,1991)。
特異性轉化雙子葉植物的方法主要使用根癌土壤桿菌。例如,報道過的轉基因植物包括但不限于棉花(美國專利5,004,863;美國專利5,159,135;美國專利5,518,908,WO 97/43430),大豆(美國專利5,569,834;美國專利5,416,011;McCabe et al.,Bio/Technology,6923,1988;Christou et al.,Plant Physiol.,87671,1988);蕓苔(美國專利5,463,174),和花生(Cheng et al.,Plant Cell Rep.,15653,1996)。
在單子葉植物轉化中報道了相似的方法。已經描述了許多農作物包括但不限于蘆筍(Asparagus officinalis;Bytebier et al.,Proc.Natl.Acad.Sci.U.S.A.,845345,1987);大麥(Hordeum vulgarae;Wan and Lemaux,Plant Physiol.,10437,1994);玉米(Zea mays;Rhodes,C.A.,et al.,Science,240204,1988;Gordon-Kamni,et al.,Plant Cell,2603,1990;Fromm,et al.,Bio/Teclinology,8833,1990;Koziel,et al.,Bio/Technology,11194,1993);燕麥(Avena sativa;Somers,et al.,Bio/Technology,101589,1992);鴨茅(Dactylis glomerata;Horn,et al.,Plant Cell Rep.,7469,1988);大米(Oryza sativa,including indica andjaponica varieties,Toriyama,et al.,Bio/Technology,610,1988;Zhang,et al.,Plant Cell Rep.,7379,1988;Luo and Wu,Plant Mol.Biol.Rep.,6165,1988;Zhang and Wu,Theor.AppI.Genet.,76835,1988;Christou,et al.,Bio/Technology,9957,1991);高梁(Sorghum bicolor;Casas,A.M.,et al.,Proc.Nati.Acad.Sci.U.S.A.,9011212,1993);甘蔗(Saecharumspp.Bower and Birch,Plant 3.,2409,1992);高羊茅(Festucaarundinacea;Wang,Z.Y.et al.,Bioffechnology,10691,1992);草(Agrostis palustris;Zhong et al.,Plant Cell Rep.,131,1993);小麥(Triticum aestivum;Vasil et al.,Biotechnology,10667,1992;Weeks T.,et al.,Plant Physiol.,1021077,1993;Becker,et al.,Plant,J.5299,1994),以及紫花苜蓿(Masoud,S.A.,et al.,Transgen.Res.,5313,1996)。對本領域中的技術人員很明顯的是,為從任何感興趣的靶農作物產生穩定的轉基因植物,可以使用或修飾許多轉化方法。
分析了轉化植物中感興趣基因的存在和表達水平和/或由本發明的啟動子序列賦予的形態。本領域中的技術人員已知有很多方法可以用于分析轉化植物。使用了許多方法估計基因表達和判斷引入基因是否按照預期目標恰當整合、作用及遺傳。對于本發明,可以通過判斷操作連接了啟動子的基因的表達水平而評價啟動子。對啟動子功能的初步分析可以通過使用報道基因的瞬時測定方法而判斷,但更權威性的啟動子評估可以通過穩定植物的分析而判斷。植物分析的方法包括但不限于DNA或RNA印跡,基于PCR的方法,生化分析,表型篩選法,大田評估和免疫診斷測定。
本發明的方法包括但不限于本領域技術人員公知的cDNA文庫制備、基因組文庫制備、測序、序列分析、PCR技術、載體構建、瞬時測定和植物轉化方法,并用標準技術或其修飾執行。
下面的實施例是為了證明本發明的優選實施方案而引入的。本領域的技術人員應該理解,遵照發明者發現的代表技術的實施例中公開的技術在本發明的實施中可以正常行使作用。然而,本領域中的技術人員按照本公開內容應該理解在公開的特定實施方案中可以進行許多改變而仍然獲得相似或相同的結果,并且不離開本發明的精神和范圍。所以在附圖中闡述或表示的內容應該解釋為說明而不是限制意義。
實施例選用了許多組織和植物發育階段制備玉米文庫。本領域中的技術人員已知組織選擇和制備中一種組織樣品與另一種組織樣品會有不同。下面是靶文庫的條件。
實施例1分別用傳粉后13天的玉米胚(13-DAP)(SATMON033文庫)或傳粉后21天的玉米胚(21-DAP)(SATMON017文庫)作為胚-13-DAP或胚-21-DAP cDNA文庫的來源物質。這些文庫是從玉米產生的(DK604,Dekalb Genetics,Dekalb,Illinois U.S.A.)。將種子種植在含Metro 200生長培養基的2″-3″的罐中約3厘米深度的土壤并在2-3周之后移植到含同樣土壤的更大的10″的罐中。在移植后每周使用Peters 15-16-17肥料3次,濃度為150ppm,植物從移植到開花的生命中共2-3次。每個罐中添加總共約900mg鐵,在植物從移植到開花的生命周期中共添加2到3次。玉米植物以白天15小時/夜晚9小時的循環在溫室中生長。白晝溫度為約80°F,夜晚溫度為約70°F。用1000W的鈉蒸汽燈提供補充的光照。
選擇的玉米植物超過了V10期,在抽絲前將準備進行受精的穗芽包在紙袋中阻止花粉。傳粉后13天(13-DAP)或傳粉后21天(21-DAP),抽出谷穗并將谷粒從谷穗上摘下。解剖谷粒的胚和胚乳并去除糊粉層。解剖后將胚在液氮中冷凍并在RNA制備前在-80℃下儲存。
為制備再生的HI II II型愈傷組織文庫(SATMON025),制備了含愈傷組織起始培養基的培養皿。此培養基含N6鹽和維生素,3%的蔗糖,2.3g/l的脯氨酸,0.1g/l的酪蛋白水解產物,2mg/l的2,4-D,15.3mg/l的AgNO3和0.8%的Bacto-Agar(商品名,細菌培養用瓊脂),并在高壓滅菌前將培養基調節為pH6.0。在傳粉后9-11天,選擇具有測量為約1-2mm長的未成熟胚的谷穗。去除谷殼和絲,將谷穗分成兩半并將其放置于高壓滅菌的Clorox/tween 20溶液。用去離子水沖洗谷穗并將每個胚從谷粒中提取出來。將完整的胚放置于與培養基接觸,去除盾片。將多個胚放置于每個平皿上并在黑暗中25℃下孵育(所有培養基成分都是可以買到的,大多數是從Sigma Chemical Co.,St.Louis,MO購買的)。將形成的易碎的II型愈傷組織轉移到沒有AgNO3的培養基中并且每7-10天進行一次傳代培養。在胚分離后約4周,將愈傷組織從平皿中取出并在液氮中冷凍。在RNA制備前將收獲的組織在-80℃下儲存。
使用從Life Technologies公司(Gaithersburg,Maryland)購買的Trizol試劑基本按生產商所推薦的從收獲組織中純化出RNA。用磁性寡dT珠基本按生產商所推薦的(Dynabeads,Dynal Corporation,LakeSuccess,New York)純化聚腺苷酸+RNA(mRNA)。
構建cDNA文庫是本領域中熟知的,并且存在許多克隆策略。可以買到許多cDNA文庫構建試劑盒。按生產商建議的條件使用SuperscriptTM質粒系統用于cDNA合成和質粒克隆(Gibco BRL,LifeTechnologies,Gaithersburg,MD)。
將cDNA文庫平鋪于含適當用于選擇的抗生素的LB瓊脂上并在37℃下孵育充足時間,以便允許個體克隆的生長。將單個克隆逐個置于含包括選擇性抗生素的LB液體的96孔微量滴定板的每個加樣孔中。在約37℃將這些滴定板孵育過夜并輕輕振蕩促進培養物生長。用Qiaprep質粒分離試劑盒(Qiagen Inc.,Santa Clara,CA),采用生產商推薦的條件將質粒DNA從每個克隆分離。
將模板質粒DNA克隆用于隨后的測序。為進行測序,使用ABIPRISM dRhodamine Terminator Cycle Sequencing Ready Reaction試劑盒與AmpliTaqDNA聚合酶(PE Applied Biosystems,Foster City,CA)。
實施例2
從源于各種玉米組織包括胚細胞和胚發生組織增強的或愈傷組織增強的mRNA制備的cDNA文庫的EST序列的數據庫中識別啟動子。此序列也用作對包含前面識別和注釋序列的GenBank的詢問序列并用BLAST程序搜索同源區。用于隨后的啟動子分離的表達序列標記(EST)的選擇反映了個體cDNA文庫或cDNA文庫集合中隨機取樣得到的代表性EST中一種或更多序列的存在。為識別調節玉米胚中的轉錄序列表達的調節序列,運行了subsetting函數,要求所有ESTs在靶胚文庫中找到并且在數據庫中的其它非靶EST文庫不存在或以低豐度存在。使產生的候選EST接受電子northern函數,其中顯示了特定EST的假定組織表達圖譜和文庫中的豐度水平。識別出具有需要的組織表達圖譜和豐度的靶ESTs,并以識別的EST序列為基礎設計基因特異性引物。產物得分是指感興趣的EST克隆和GenBank序列的BLAST匹配程度。百分比豐度是指一組相關表達的序列在得到EST文庫中出現的次數。可以執行任何數目的查詢而獲得需要的ESTs并將取決于EST數據庫和可用于序列分析的計算機程序。對于本發明,通過選擇相對豐度,嚴格性和/或產物得分的需要值識別序列。對于SEQ ID Nos36-51啟動子序列,在本底≤0,嚴格性≥50和產物得分≤100的情況下,選擇靶豐度≥1。
以這些數據庫查詢為基礎識別代表具有靶表達圖譜的cDNA的感興趣的EST序列的克隆IDs。表1為用于隨后分離SEQ ID Nos36-51啟動子序列的ESTs提供了本底克隆ID(EST)信息,文庫來源和Genbank識別(gi)信息。為基于以10-8P值截止的GenBank BLAST查詢的克隆IDs列出序列注釋。當向序列數據庫提交新序列時信息接受改變。ESTs的注解如下,注解信息在括號中克隆700614347(印度稻胚特異性蛋白(Ose731)基因,完整cds).;克隆700257959(稻類球蛋白mRNA,克隆Ose709,部分cds).;克隆700265029(玉米肌醇-1磷酸合成酶mRNA,完整cds).;克隆700321659(第3組Lea蛋白MGL3的玉米RNA).;克隆700616085(印度稻胚特異性蛋白(Ose731)基因,完整cds)。表1.啟動子概括信息序列ID No.克隆ID文庫來源GenBank識別器(gi)36 700264271胚,21-DAP無37 700265872胚,21-DAP無38 700263624胚,21-DAP無39 700267629胚,21-DAP無40 700258061胚,21-DAP無41 700614347胚,13-DAPg410569142 700257959胚,21-DAPg409709943 700265029胚,21-DAPg310805244 700266438胚,21-DAP無45 700259522胚,21-DAP無46 700321659玉米愈傷組織 g44404451 700266176胚,21-DAP無47 700257969胚,21-DAP無48. 700613864胚,13-DAP無49,50 700260279胚,21-DAP無實施例3從使用根據Ausubel et al.,1992的CsCl純化方案,或通過CTAB純化方法(Rogers and Bendich,Plant Mol.Biol.,569(1985)分離的玉米DNA(從玉米雜交物Fr27 x FrMo 17得到)制備基因組文庫。可以買到試劑(例如,Sigma Chemical Co.,St.Louis,MO)。根據生產商的說明(GENOME WALKER,是CLONTECH Laboratories,Inc,Palo Alto,CA的商標)制備文庫。在單獨的反應中,用下列鈍端內切核酸酶使DNA在37℃下接受限制性酶過夜消化EcoRV,Scal,Dral,PvuII,or StuI(CLONThCH Laboratories,Inc.Palo Alto,CA)。用苯酚氯仿萃取反應混合物,用乙醇沉淀,并重新懸浮于Tris-EDTA緩沖液中。然后將純化的鈍端基因組片段連接于GenomeWalkerTM連接物,根據生產商的方案完成產生的DNA片段與連接物的連接。等分GenomeWalkerTM亞文庫并在-20℃下儲存。
用基因特異性引物1(GSPI)和退火為連接物序列的引物,SEQ IDNO1表示的連接物引物1(AP1)使與GenomeWalkerTM連接物(前面所述)連接的DNA基因組接受初級PCR。將稀釋的(1∶50)初級PCR反應的等分物作為嵌套輪PCR擴增的輸入DNA,這一輪使用基因特異性引物2(GSP2)和SEQ ID NO2表示的連接物引物2(AP2),或SEQ IDNO3表示的連接物引物3(AP3)。Genome Walker第一引物(AP1)和嵌套引物(AP2)的退火溫度分別為59℃和71℃。一般說來,基因特異性引物被設計為有下列特性26-30個核苷酸長,40-60%的GC含量,對于大多數基因特異性引物,產生溫度為60℃范圍的高溫或約70℃。使用的Taq聚合酶為Amplitaq GoldTM,可以從Perkin-Elmer Biosystems(Branchbury,New Jersey)得到。為進行PCR實驗,許多溫度循環儀器和試劑盒可以從許多生產商購買,如PE Biosystems(Foster City,CA),Strategene(La Jolla,CA),and MJ Research Inc.(Watertown,MA)。在初級PCR之后,用等分物(10-15μg)進行瓊脂糖凝膠分析。每一種未知序列從5亞基因組文庫和陰性對照組(無DNA)擴增。
PCR成分和條件如下初級PCR成分要求量/體積亞文庫等分物 1μl基因特異性引物1 1μl(100pmol)GenomeWalkerTM連接物引物1(AP1) 1μldNTP混合物(每種dNTP 10mM) 1μlDMSO 2.5μl(或2-5%終濃度)10X PCR緩沖液(含MgCl2) 5μl(終濃度為1X)Amplitaq GoldTM0.5μl蒸餾水 到50μl的終反應體積初級PCR的反應條件A.在95℃下9分鐘B.94℃下2秒,70℃下3分鐘;重復94℃/70℃循環共7次C.94℃下2秒,65℃下3分鐘;重復94℃/65℃循環共36次D.65℃下4分鐘作為最終延長E.10℃下延長孵育嵌套PCR(二級PCR反應)成分要求量/體積初級PCR反應物的1∶50稀釋液1μl基因特異性引物2 1μl(100pmol)GenomeWalkerTM連接物引物2或3(AP2或AP3) 1μldNTP混合物(每種dNTP 10mM) 1μlDMSO 2.5μl(或2-5%終濃度)10X PCR緩沖液(含MgCl2)5μl(終濃度為1X)Amplitaq GoldTM0.5μl蒸餾水 到50μl的終反應體積嵌套PCR的反應條件A.在95℃下9分鐘B.94℃下2秒,70℃下3分鐘;重復94℃/70℃循環共5次C.94℃下2秒,65℃下3分鐘;重復94℃/65℃循環共24次D.65℃下4分鐘作為最終延長E.10℃下延長孵育為分離啟動子序列SEQ ID NO36(克隆ID 700264271),在初級PCR反應中將SEQ ID NO1(A)與SEQ ID NO6結合。為進行嵌套PCR反應,在二級PCR反應中將SEQ ID NO2與SEQ ID NO7結合。
為分離啟動子序列SEQ ID NO37(克隆ID 700265872),在初級PCR反應中將SEQ ID NO1與SEQ ID NO8結合。為進行嵌套PCR反應,在二級PCR反應中將SEQ ID NO2與SEQ ID NO9結合。
為分離啟動子序列SEQ ID NO38(克隆ID 700263624),在初級PCR反應中將SEQ ID NO1與SEQ ID NO10結合。為進行嵌套PCR反應,在二級PCR反應中將SEQ ID NO2與SEQ ID NO11結合。
為分離啟動子序列SEQ ID NO39(克隆ID 700267629),在初級PCR反應中將SEQ ID NO1與SEQ ID NO12結合。為進行嵌套PCR反應,在二級PCR反應中將SEQ ID NO1與SEQ ID NO13結合。
為分離啟動子序列SEQ ID NO40(克隆ID 700258061),在初級PCR反應中將SEQ ID NO1與SEQ ID NO14結合。為進行嵌套PCR反應,在二級PCR反應中將SEQ ID NO2與SEQ ID NO15結合。
為分離啟動子序列SEQ ID NO41(克隆ID 700614347),在初級PCR反應中將SEQ ID NO1與SEQ ID NO16結合。為進行嵌套PCR反應,在二級PCR反應中將SEQ ID NO2與SEQ ID NO17結合。
為分離啟動子序列SEQ ID NO42(克隆ID 700257959),在初級PCR反應中將SEQ ID NO1與SEQ ID NO18結合。為進行嵌套PCR反應,在二級PCR反應中將SEQ ID NO2與SEQ ID NO19結合。
為分離啟動子序列SEQ ID NO43(克隆ID 700265029),在初級PCR反應中將SEQ ID NO1與SEQ ID NO20結合。為進行嵌套PCR反應,在二級PCR反應中將SEQ ID NO2與SEQ ID NO21結合。
為分離啟動子序列SEQ ID NO44(克隆ID 700266438),在初級PCR反應中將SEQ ID NO1與SEQ ID NO22結合。為進行嵌套PCR反應,在二級PCR反應中將SEQ ID NO2與SEQ ID NO23結合。
為分離啟動子序列SEQ ID NO45(克隆ID 700259522),在初級PCR反應中將SEQ ID NO1與SEQ ID NO24結合。為進行嵌套PCR反應,在二級PCR反應中將SEQ ID NO2與SEQ ID NO25結合。
為分離啟動子序列SEQ ID NO46(克隆ID 700321659),在初級PCR反應中將SEQ ID NO1與SEQ ID NO26結合。為進行嵌套PCR反應,在二級PCR反應中將SEQ ID NO2與SEQ ID NO27結合。
為分離啟動子序列SEQ ID NO47(克隆ID 700257969),在初級PCR反應中將SEQ ID NO1與SEQ ID NO28結合。為進行嵌套PCR反應,在二級PCR反應中將SEQ ID NO2與SEQ ID NO29結合。
為分離啟動子序列SEQ ID NO48(克隆ID 70061864),在初級PCR反應中將SEQ ID NO1與SEQ ID NO30結合。為進行嵌套PCR反應,在二級PCR反應中將SEQ ID NO2與SEQ ID NO31結合。
為分離啟動子序列SEQ ID NO49(克隆ID 700260279-PvuII文庫),在初級PCR反應中將SEQ ID NO1與SEQ ID NO32結合。為進行嵌套PCR反應,在二級PCR反應中將SEQ ID NO2與SEQ IDNO33結合。
為分離啟動子序列SEQ ID NO50(克隆ID 700260279-Dral文庫),在初級PCR反應中將SEQ ID NO1與SEQ ID NO32結合。為進行嵌套PCR反應,在二級PCR反應中將SEQ ID NO3與SEQ ID NO34結合。
為分離啟動子序列SEQ ID NO51(克隆ID 700266176),在初級PCR反應中將SEQ ID NO1與SEQ ID NO34結合。為進行嵌套PCR反應,在二級PCR反應中將SEQ ID NO3與SEQ ID NO35結合。
實施例4分離并凝膠純化從嵌套PCR擴增得到的DNA片段。在瓊脂糖凝膠中電泳二級PCR的40μl的等分物。按生產商建議的條件使用BIO101Geneclean II試劑盒(Midwest Scientific,Valley Park,MO)將DNA片段將二級PCR產物從瓊脂糖凝膠中純化出來。按生產商建議的條件將純化DNA與pGEM-T Easy載體(pGEM-T Easy Vector System I,PromegaCorp.,Madison,WI)連接。將連接反應的等分物轉化到適當的大腸桿菌宿主如DH10B并將細胞平鋪于選擇培養基(對于DH10B,100μg/ml羧芐青霉素)。選擇細菌轉化株,在液體培養基中生長并用可買到的試劑盒如Qiaprep Spin Microprep試劑盒(Qiagen Corp.,Valencia,CA)分離質粒DNA。用SEQ ID NO4(M13向前引物)和SEQ ID NO5(M13反向引物)所表示的M13向前和反向引物的向兩個方向的染色終止子方法測序含根據限制性酶分析預測插入大小的純化質粒。使用的限制性酶也可以從許多生產商處買到(例如,Boehringer Mannheim(Indianapolis,IN)。判斷含啟動子序列的5′側翼區并以SEQ ID NOS36-51表示。用于克隆啟動子片段到適當載體的工程化限制位點一般是用本領域技術人員公子的PCR方法完成的。
實施例5為進行瞬時表達分析,將啟動子片段克隆到表達載體。如果識別了靶啟動子的起始密碼子(AUG),則將啟動子片段克隆到圖1(pMON19469)所示的載體,替代P-CaMV.35S基因元件。如果沒有識別AUG,則將啟動子片段克隆到允許報道基因如GUS或GFP翻譯融合的表達載體。
在瞬時植物測定中檢驗表達構建體。可以使用許多本領域技術人員公知的測定。為進行GUS活性的組化分析,在13-DAP收集胚并與II型胚發生愈傷組織一起放置于培養基如MS培養基(PhysiologiaPlantarum 15473(1962)。為在瞬時測定中分析啟動子,使用適當粒子槍設備用表達載體DNA轟擊13-DAP谷粒胚乳的切片和受精(DAG)后14天的幼苗的黃化葉片段(見例如Clrristou et al.,Plant Physiol.,87671(1989);Klein et al.,Proc.Natl.Acad.Sci.USA,854305(1988);Ye,G.-N.,et al.,Plant Mol.Biol.,15809(1990)。每個表達載體被轟擊到兩個獨立的平皿上。允許組織恢復48小時然后用X-Gluc(5-溴-4-氯-3-碘β-D-葡糖醛酸糖苷酶)染色檢測GUS基因在感興趣組織中的表達(Jefferson et al.,EMBO J.,63901(1987)。
實施例6
為進行穩定植物轉化,將啟動子序列克隆到圖2所示(pMON39721)轉化載體并通過適當運送系統如土壤桿菌介導的轉化(見例如美國專利5,569,834,5,416,011,5,631,152,5,159,135和5,004,863,在此引入其全部內容作為參考)或粒子轟擊方法(見例如專利申請WO 92/15675,WO97/48814和歐洲專利586,355,以及美國專利5,120,657,5,503,998,5,830,728和5,015,580,在此引入其全部內容作為參考)轉化到感興趣的靶農作物。
為玉米的穩定轉化,分離包括驅動Ec.GUS基因表達的啟動子Zm.700258061(SEQ ID NO40)的pMON51002(圖3)的NotI片段,并將其克隆到植物轉化載體pMON39721(圖2)的NotI位點產生pMON51008(圖4)。為玉米的穩定轉化,分離包括驅動Ec.GUS基因表達的啟動子Zm.700267629(SEQ ID NO39)的pMON51001(圖5)的NotI片段,并將其克隆到植物轉化載體pMON39721的NotI位點產生pMON51009(圖9)。為玉米的穩定轉化,分離包括驅動Ec.GUS基因表達的啟動子Zm.700263624(SEQ ID NO38)的pMON51003(圖7)的NotI片段,并將其克隆到植物轉化載體pMON39721的NotI位點產生pMON51010(圖8)。在構建這些植物轉化構建體時使用了分子生物學領域中公知的方法,如內切核酸酶消化、DNA片段純化、連接、細菌轉化、抗生素選擇、質粒純化(Sambrook et al.,1989)。用三親代交配程序(Ditta et al.Proc.Natl Acad.Sci USA 777347(1980)將植物轉化構建體轉移到根癌土壤桿菌。
使用根癌土壤桿菌(ABI株)并在27℃下將其在含100mg/L卡那霉素、50mg/L奇放線菌素和25mg/L氯霉素的(Sigma-Aldrich,St.Louis,MO)LB液體培養基(每250ml的燒瓶中50ml)中培養約24小時(在150-160rpm的旋轉臺上)。在3400rpm離心培養物并在250ml的燒瓶中將其重新懸浮于含用于LB的1/2水平的奇放線菌素和卡那霉素以及200μM乙酰丁香酮(AS;用于引入毒性)的AB液體培養基(在660nm下將OD調節為0.2)。在與LB培養物相同的條件下培養15-16小時后。收獲土壤桿菌懸浮液并將其在含AS的1/2 VI培養基中洗滌并離心,然后重新懸浮于1/2 MS PL培養基(也含同樣水平的AS)。土壤桿菌的終濃度為約1×109cfu/ml(等于660nm下OD為1.0)。
在我們的實驗中的轉化使用了玉米三倍雜合體(Pa9 1xH99)xA188。無菌收集大小為0.5mm到2.0mm長的玉米不成熟胚并浸入含土壤桿菌和200μM AS的1/2 MS PL的液體培養基中。在一頁紙上干燥不成熟胚,然后將其放置于含3.0mg/L 2,4-D,200μM乙酰丁香酮,2%蔗糖,1%葡萄糖,12mM脯氨酸和20μM硝酸銀的1/2 MS協同培養基在23℃下培養2或3天。然后將不成熟胚轉移到由15AA大分子和小分子鹽,1mg/L 2,4-D,12mM脯氨酸和500mg/l羧芐青霉素組成的15AA延遲培養基并在27℃下培養5天。將胚轉移到含有含1.0mg/L2,4-D,12mM脯氨酸,750mg/l羧芐青霉素和50mg/L巴龍霉素的15AA培養基的首選培養基并在27℃下培養2周。然后將胚轉移到同樣的但含更高水平選擇試劑(100mg/L巴龍霉素)的培養基中培養2周,然后將這些胚轉移到含200mg/L巴龍霉素的培養基中再進行一次或兩次選擇。將所選的愈傷組織放入MS 6BA再生培養基約2周,然后將它們再轉移到MS OD培養基并在照明室中培養。選擇有旺盛生長的根和莖的幼苗并將其置于土壤中健化7天,然后放置于溫室中。
將溫室中的轉基因植物與H99雜交,在傳粉后13天和21天收獲它們的不成熟胚進行GUS染色(表2)和MUG(表3)活性測定。轉基因植物組織的GUS染色測定(Jefferson et al.,EMl30 J.,63901(1987)為判斷玉米葉、根、胚、胚乳和種皮組織的表達模式提供了本發明玉米胚增強型啟動子的定性分析。不檢測葉中本發明啟動子序列的GUS表達,而且不經常檢測根組織中發明啟動子序列的GUS表達。檢測種子中特別是種子胚中的GUS表達。這些啟動子表現出在種子和與根、葉或其它植物組織中的表達相關的種子相關組織中增強的表達。
表2.在轉基因玉米組織提取物中的定性GUS活性Zm.700258061Zm.700267629 Zm.700263624pMON51008 pMON51009 pMON51010葉中的GUS- - -活性根中的GUS 15%+/85%-*18%+/82%-*16%+/84%-*活性胚中的GUS+ + +活性胚乳中的GUS 糊粉中的部分+- 糊粉中的部分+活性 其它部分- 其它部分-
種皮中的GUS +/-+ +/-活性+有GUS活性-沒有可檢測的GUS活性+/-不確定或陰性*一些植物的根組織是陽性的MUG測定提供了轉基因種子中胚和胚乳表達的定性分析。從解剖轉基因玉米植物的每一半穗得到的10個胚和10個胚乳中提取蛋白。在13dpp的時間點測定陰性對照PHxA/CK野生型玉米組織。MUG測定使用加入組織的500μl GUS提取緩沖液,在1.5ml的eppendorf管中用聚四氟乙烯杵研磨組織并在4℃下以10K RPM離心5分鐘(BeckmanGS-15R)。將400μl上清液轉移到96個深加樣孔的新滴定板。在干冰上冷凍提取物并在使用前在-80℃下儲存。MUG測定由一下步驟組成,用4-甲基傘形酮(SIGMA Ml 381)進行從31.2pmol到2000pmol的連續稀釋產生活性的標準曲線。在預讀植物將本底調零后以雙份將5μl的每種提取物加入平底96孔滴定板(Falcon 3872)。將200μl GUS測定溶液(0.1M KPO4 pH7.8,1.0mM EDTA,5%甘油,1.0mM DDT,2mM 4-甲基傘形酮葡糖醛酸糖苷酶Fluka 69602)加入每個加樣孔并用加樣頭與樣品混合。在37℃下用過濾器對在F-max(分子設備)上動態讀取滴定板激活-655/散射460。典型的讀數由以3分鐘為間隔持續1小時讀出的21個讀數組成。根據每個樣品的MUG結果和蛋白結果計算GUS活性(pmol/min/μg蛋白)。用Bio-Rad蛋白測定試劑盒測定總蛋白。將BSA蛋白連續稀釋為0.05mg/ml到0.5mg/ml,用于制造標準曲線。將雙份1.5μl的提取物加入平底96孔滴定板(Falcon)。加入200μl稀釋染色試劑并與樣品混合。在室溫下孵育5分鐘后在室溫下Spectromax 250(分子設備)中測量595nm下的吸收。MUG分析證明了前面描述的本發明分離的啟動子在玉米種子組織中表達并且在胚和胚乳組織中的表達不同。可以從本發明的啟動子轉化的,在種子中胚和胚發育的不同階段表達的植物群中選擇獨立轉化的玉米系。表3.MUG測定/pmol/min/μg蛋白構建體啟動子植物#胚/ 胚乳/ 胚/ 胚乳/13dpp13dpp21dpp21dpppMON51008 700258061 s1281150.4 00.3 0.1s1282223.3 0s128230.4 0.1 8.6 0.3s12824 0 0s128292.7 019.1 0.6s128320.2 046.9 2.4s128349.8 0.3s128365.4 1.412 0.3s128260.9 0 210 0s128281.9 0135.9 0s128336.6 0.2 135.5132.9s1281372.22.70.8 0.5s128356.7 0.266.2 1.8pMON51009 700267629 s13745 0 1s137460.9 0 20.3 1.1s13747 0 0.2 0.7 0.9s13750 0 0.1s13752 0 0s13753 0 0s13754 0 0s13755 0 0 0 0s13756 0 0s137570.2 0.2s137591.6 0 1.2s13760 0 0 0s13761 0s13763 0 0 0 0s13764 0 0s13766 0 0s13767 0 0s13768 0 0s138110.6s13813 0 0s13814 0 1.4s13815 0 0.3s13816 0.7 0.6
s13817 0 2.7s13818 0.8 0 5.2s13819 3.8 0s13820 0.1 0.4s13821 0 0.1構建體啟動子植物#胚/ 胚乳/胚/ 胚乳/13dpp13dpp21dpp21dpppMON51010700263624 s13769 00s13770 00s1377100s13772 00s13773 5.6 0s13774 00s13775 00s13776 6.4s13777 00 6.6s13778 00s13779 00 27.3 1.8s13780 3.3 0s13781 00s13782 00s13783 00 5.4s13785 0.5 2.3 0s13786 3.6s13789 00s13791 00s13792 2.8 0 23.4 0s13793 005s13794 00 4.3s13795 0 3.8 0s13797 00 4.1 0s13799 00s13801 1.8 0 5.9s13802 00 47.5 6.1s13805 00 5.1s13806 00s13807 00s13809 00s13810 00s13826 00s13827 0.4 050s13828 00 0.4 0PhxA/CK-00
許多轉化和再生系統和方法都是可用的并且是本領域技術人員公知的。隨后用任何數目的本領域技術人員公知的分子、免疫診斷、生化和/或大田評價方法分析穩定轉化植物和后代中基因在感興趣的組織中的表達。
實施例7適當的啟動子調節所必需的順式作用調節元件可以用許多方法識別。在一種方法中,執行缺失分析而去除啟動子區域并測定產生的啟動子片段的啟動子活性。如果截短的啟動子活性與原始啟動子片段的活性相比有改變,那么就認為DNA片段是啟動子調節所必需的。通過這種缺失分析,可以識別哪些小的DNA區域是轉錄的正或負調節所必需的。也可識別啟動子序列基序和制造為含這些調節可操作連接的轉錄序列的表達的順式元件的新型啟動子。見例如,美國專利5,223,419,在此引入其完整內容作為參考,美國專利4,990,607,在此引入其完整內容作為參考,以及美國專利5,097025,在此引入其完整內容作為參考。
另一種方法是尋找有相似表達圖譜的啟動子之間的相似序列。有重疊活性模式的啟動子可以有共同的調節機制。一些計算機程序可以用于識別啟動子之間的保守序列基序,包括但不限于MEME,SIGNALSCAN,或GENE SCAN。這些基序可以代表調節啟動子的轉錄因子的結合位點。當識別了序列基序后,可以測定它們的功能。例如,可以將基序序列從啟動子去除從而判斷此基序是否是正確啟動子功能所必需的。此外,可以將基序添加到最小啟動子而檢驗它是否足夠激活轉錄。可以通過添加活性啟動子并尋找啟動子活性減少而檢驗懷疑的陰性調節元件的豐度。一些順式作用調節元件可能要求其它元件的作用。所以,可以以任何數目的本領域中技術人員公知的方法的結合檢驗多種元件。
當識別了功能性的啟動子元件后,可以在核苷酸水平修飾啟動子元件而影響蛋白結合。這些修飾可以導致更高或更低的親和結合,這將影響啟動子的轉錄水平。
啟動子元件可以補充或協同作用而影響總體啟動子活性。在這點上,可以將不同5’調節區的啟動子元件置于一前一后的位置,從而獲得有不同表達譜或更高水平表達的啟動子。另外,可以將啟動子元件多聚化,從而增加特異性以該啟動子元件影響的模式的表達水平。
構建含新型的工程化的5’調節元件的表達載體所需要的技術方法是本領域技術人員所公知的。在表達載體中檢驗工程化的啟動子并通過將新型啟動子與適當報告基因如GUS可操作連接并在瞬時植物測定中進行瞬時檢驗。將新型啟動子與一種或更多感興趣的基因與一種或更多額外的調節元件插入植物轉化載體并用適當的DNA運送系統轉化到感興趣的靶植物中。用任何數目的適合評估所需農業特征的分子、免疫診斷、生化、表型或大田方法評估穩定轉化的植物和后代。
按照這里公開的方法,植物分子生物學領域的技術人員可以分離能夠調節與啟動子異源的可操作連接的DNA序列轉錄的DNA啟動子序列。這些啟動子對增強植物種子、植物胚發生組織核植物愈傷組織中轉基因的表達有用,這種表達與這些啟動子可以在其它植物細胞和組織,如根和葉中指導的表達水平相關。作為本發明的啟動子序列的DNA分子包含各種順式作用元件,它們是從具有已知啟動子序列的DNA分子中分離并與其融合建立雜合啟動子序列。這些雜合啟動子將有不同于已知啟動子序列和通過本領域中的方法分離的啟動子的表達模式。在植物中行使功能的熟知的啟動子包括,但不限于花椰菜花葉病毒35S和19S啟動子,玄參花葉病毒35S啟動子,甘蔗桿狀病毒啟動子和其它植物病毒啟動子,植物肌動蛋白啟動子如大米肌動蛋白啟動子和擬南芥肌動蛋白啟動子和植物泛素啟動子。這些啟動子具有識別用于指導在轉基因植物細胞中轉錄的最小序列。這些最小序列是本發明DNA分子的順式作用元件的雜合啟動子的成分。
已經舉例說明并描述了本發明的原則,對本領域的技術人員應該很明顯的是,可以在不離開這些原則的前提下對本發明的安排合細節進行修飾。我們要求保護所有在所附權利要求精神和范圍內的所有修飾。
在此引入在本說明中引用的所有出版物和公開的專利文獻作為參考,其范圍與特定和個別指出引入作為參考的每個個別出版物或專利申請相同。
序列表<110>T.W.康納(Conner,Timothy W)I.察夫里爾(Tzafrir,Iris)<120>選擇性控制基因表達的植物調節序列<130>06009.0019.NPUS00(RENN019)<140>US/09/651,169<141>2000-08-30<160>51<170>PatentIn version 3.0<210>1<211>22<212>DNA<213>人工序列<220><223>人工序列說明引物<400>1gtaatacgac tcactatagg gc 22<210>2<211>19<212>DNA<213>人工序列<220><223>人工序列說明引物<400>2actatagggc acgcgtggt 19<210>3<211>30<212>DNA<213>人工序列<220><223>人工序列說明引物<400>3agggcaagct tggtcgacgg cccgggctgg30<210>4<211>23<212>DNA<213>人工序列<220><223>人工序列說明引物<400>4cggcagggtt ttcccagtca cga 23<210>5<211>24<212>DNA<213>人工序列<220><223>人工序列說明引物<400>5agcggataac aatttcacac agga 24<210>6<211>27<212>DNA<213>人工序列<220><223>人工序列說明引物<400>6cagaaagcct ccattcctta tcaggca27<210>7<211>27<212>DNA<213>人工序列<220><223>人工序列說明引物<400>7cgagaggaag tgcctggcgt aatcaaa 27<210>8<211>26<212>DNA<213>人工序列<220><223>人工序列說明引物<400>8gctcatcaga gttgccgtcg ttgcta26<210>9<211>44<212>DNA<213>人工序列<220><223>人工序列說明引物<400>9cgcggatcca gatctactcg tctgacccat ccgttatcac tccg44<210>10<211>26<212>DNA<213>人工序列<220><223>人工序列說明引物<400>10agtgaggcga tccattcacg cgccta 26<210>11<211>26<212>DNA<213>人工序列<220><223>人工序列說明引物<400>11gatcgcttgc actctctgcc tctctg 26<210>12<211>27<212>DNA<213>人工序列<220><223>人工序列說明引物<400>12tctccccgca aggcgcgtat ctgatga 27<210>13<211>42<212>DNA<213>人工序列<220><223>人工序列說明引物<400>13cgcggatcca gatctggcgc gtcggggcac cggccggcgc ag 42<210>14<211>27<212>DNA<213>人工序列<220><223>人工序列說明引物<400>14ttgccgaccc ctccttcacc ttctcct 27<210>15<211>27<212>DNA<213>人工序列<220><223>人工序列說明引物<400>15tgtccttcgc cttcaccttc gctgtct 27<210>16<211>26<212>DNA<213>人工序列<220><223>人工序列說明引物<400>16ggaatctcca cgttctggca cgacga 26<210>17<211>26<212>DNA<213>人工序列<220><223>人工序列說明引物<400>17tgtctctcgc aaagtcgcaa tgtctg 26<210>18<211>28<212>DNA<213>人工序列<220><223>人工序列說明引物<400>18tgaggctgga cggtttgatc tcccactt28<210>19<211>42<212>DNA<213>人工序列<220><223>人工序列說明引物<400>19cgcggatcca gatctgaaga agaagaaccc gagtcgccac cc 42<210>20<211>29<212>DNA<213>人工序列<220><223>人工序列說明引物<400>20agctctcgat gaacatcttg cctttcctc 29<210>21<211>43<212>DNA<213>人工序列<220><223>人工序列說明引物<400>21cgcggatcca gatctgaatg gaatgcgaag cgaggtagcg agc43<210>22<211>29<212>DNA<213>人工序列<220><223>人工序列說明引物<400>22acgacacctc tcgccatagc aaactctcc 29<210>23<211>44<212>DNA<213>人工序列<220><223>人工序列說明引物<400>23cgcggatcca gatctcattc atctgatcca tccgtcacca ctcc 44<210>24<211>27<212>DNA<213>人工序列<220><223>人工序列說明引物<400>24ggagatgtgg ttgagcgcca tcatcgg 27<210>25<211>27<212>DNA<213>人工序列<220><223>人工序列說明引物<400>25agtctcagtc ctggcctctt tggggtg 27<210>26<211>30<212>DNA<213>人工序列<220><223>人工序列說明引物<400>26caaatcactc ggagaaagaa atatgcttgg 30<210>27<211>29<212>DNA<213>人工序列<220><223>人工序列說明引物<400>27ggctactact gactgtgacg atggtgctc 29<210>28<211>27<212>DNA<213>人工序列<220><223>人工序列說明引物<400>28ccagaagcag gaggaggacg aagaagg27<210>29<211>26<212>DNA<213>人工序列<220><223>人工序列說明引物<400>29gaaacgaact ccagagcttg ccgagg26<210>30<211>27<212>DNA<213>人工序列<220><223>人工序列說明引物<400>30acaagacgat tcccagacaa gggacca 27<210>31<211>26<212>DNA<213>人工序列<220><223>人工序列說明引物<400>31gcccacacct cacggcatcc atattt26<210>32<211>29<212>DNA<213>人工序列<220><223>人工序列說明引物<400>32acgagcgcca cttgtcttga acttgttgg 29<210>33<211>41<212>DNA<213>人工序列<220><223>人工序列說明引物<400>33cgcggatcca gatctagcgc gaactgccgg cggcgctgct c 41<210>34<211>27<212>DNA<213>人工序列<220><223>人工序列說明引物<400>34gtcggttaga ccgaacaaaa attcagc 27<210>35<211>43<212>DNA<213>人工序列<220><223>人工序列說明引物<400>35cgcggatcca gatctgtcgg ttagaccgaa caaaaattca gcc 43<210>36<211>654<212>DNA<213>玉米(Zea Mays)<400>36ctgcccatcg tcgcgcgccg gaggcccgac ggccgaggat ggtccttcgt gtgggacgac 60gactcgytty tgctccagct ccgcgacggc attcccgagg atatggaggt gytcttcgtc 120ggytccctcc gcgccgatgt ccccgtagcc gagcaggacg aggtgtcgca ggcgttgctc 180gaccggttcc gytgcgcgcc ggtcttcctc cctgaccgcc tcaacgaccg cttctaccac 240ggcttctgca agcgccaact ctggcctctg ttccactaca tgctcccctt ctcctcatcc 300gcgtccgccg ccggcaccac ctcttcctcc tccgccgcca cttgcaacgg tcgcttcgac 360cgcagcgctt gggaggcgta cgtgctcgcc aacaagttct tcttcgagaa ggtcgtcgag 420gtaatcaacc cggaggatga ctacgtttgg gttcacgact accatctcat ggcgctgcct 480accttcctcc gccgctgctt caaccgcctc cgcatcggat tcttcctcca cakccccttc 540ccctcgtccg agatctaccg caccctccct gttcgggagg agatactcaa ggcgctgctc 600aactgtgacc taattggctt ccacactttt gattacgcca ggcacttcct ctcg654<210>37<211>277<212>DNA<213>玉米(Zea Mays)<400>37ctgggacgac ggttcgtgag cgactttccc atatacgatg gccgtggctc cggcgcccgc 60ctcgtcgctc gcttgcaggg agtcactgtc caaatcggca gctcgcacta gctagtcagc 120atcgtcttcg aggccgagag gtagttaaat gtatgcatgc atgcatgtag tatatatata 180atgcatgtgc gattcattca ttggttcatc gtcgtctgca ggcttaaggg ctccacgctg 240ctcaccaacg gagtgataac ggatgggtca gacgagt 277<210>38<211>476<212>DNA<213>玉米(Zea Mays)<400>38aaaaaatata gtttctaaac tagcccttag aagatactta aataagtatt gtttcttatt 60tttacgggat gctatgcgga ggggtctact acacatattt actatctcat ctcccatttt 120attctatatt atatatatat aaatttgcaa acattgttat acatcgtcat ttccagtgag 180acacagcggt cgtgtcatca gaaaagcgga cacgcgtcgc gtcgcgaggc caggtgggtt 240atgcacggac ctgctatgct agccatgctc caggctccag ctccacccgt ccaccgactt 300ctcttctcaa cgagactgcg tcctcaccat gcacgacgac acgtgcgatg ccatcacaca 360tccacactca cctgttgcct ctatatccac cgccccaccg ccgtagcacc agaaagaaat 420gtacagtcta cagtctacac acaagctgac cagagaggca gagagtgcaa gcgatc 476<210>39<211>344<212>DNA<213>玉米(Zea Mays)<400>39atcaggttag actaacttcc tttctctgtt atgcatatgc atgtgtgtat gccttttgat 60ttcttggtat gatggaataa tcaggggtgg atctgcaccc tgaaccaccc tgtcgtggcc 120cagggtttga tccatgtaat cctttataag tctatttaat ccagtataaa atgacttaga 180taaaaggtag agaagaaaat ttagtgccga gctaccaagg caccttcttt attccgtcct 240tgctcagtca cacctcgctc tcgctcactc tcgccgtccg cacagccgct catcgtctcc 300cactgcctgc cctctccctg cgccggccgg tgccccgacg cgcc 344<210>40<211>547<212>DNA<213>玉米(Zea Mays)<400>40aaaaattttt tagtctaaac gtgattttac ttctgtttaa gtttaagggc taaawtaaaa 60aaaaattcgg cagaagaaac tacgcgcgga cagagaaata cgatcggcca agccgtatac 120ggagacgtgg cgtgatcctc tcagcacagc attccctagg tggtggtgat gtctgccttc 180accactatca gatttgcaca cgcagccacg caggacatct gctacagggc acgcggcggc 240tcagaacgaa gctacgagca cagcgaggtc gccacctcac ggtgcgacgt gcagctccag 300ctgctcaccg accactgcat gtcgcccacg taagattcaa ccagtccgcc actccaagat 360ccaagactcc agagaccggc cggcctggcc gctagctttt atatacttcc ggcagccatg 420caccctcatg tccagcatat cgacgcagag tcgcagtcgc agcacacact gaattctctt 480tagctagcta agagarggta gccacaccaa gacaggatgc agacarcgaa ggtgaaggcg 540aaggaca547<210>41<211>856<212>DNA<213>玉米(Zea Mays)<400>41actttagtta gggttcggtc tttaattctt ttgctgggca gcagtaaacg gagatgagaa 60gcgcgagctg atcattgttg ccattctgtg caacgaagct aggggaccaa tgctgactcg 120cacgagggca tagttgctga tggtcataga cgacgcgttc acttaaaata ataaagaatt 180ataaattgtt gtcataagtc gtgcagccta atataggaga gtgcggcatt gctgtagcta 240attaagagag tattccggtc atgcttgagc ttggagaatt tttgaggscc cgttcgcttg 300gagagtcgga gatttttgag ggcccgtttc gcttgcacaa tawtaaacaa agatttgttc 360tagctcatcc aaatctatat aaattaaaga agtaattcgg ttaggaatca atccaagagc 420tctaattctt aaaaaccgaa cagggcctga gttgtttgtc tagacgacat tatctgatta 480agttattttc atcttcaatt tcaaatgtga tctarcagca taaaacttgt tgtctgacag 540atatttgact tccacacggg ccacagctca attacaaaca tacttcaaac atcaggcaga 600ggcagagcac tagcagcatt cgctacgtgg cggtgggcag cagtggccag cacattcgac 660aactgccacg gatcccgtac tacttcaaac acgtatcgct tccagaatcc agagtcacac 720gtgtgcagct gcatgaaccc agctcactcc cttaagaaca gctcgacgct cacctgtcta 780gtctagctcg tgcatgccgc cctgagcgcc actgcacaga cgcgcagaga cagacattgc 840gactttgcga gagaca 856<210>42<211>1137<212>DNA<213>玉米(Zea Mays)<400>42ctgcacggat gcggccgagt gcggcagcac agcagcgcgc gcgcgctcca catcgccttc 60gctagttcgc tccgccacgt acgcggcccg gcctccacct ggcggcgcgc atggctgcga 120ccctcgccgc gccacctctt catatacgct gcagctcgcc tcgaaccctc gcatcgaacg 180cacactcgca ctcgcacgta caccacacta gttaccacag acgacgggcg ccatgaaagt 240cccggtgctt cttctcctgg tctccctgtg cttctcgctc gcgctcgcgt ggcaaacgga 300cacggaatcg ggctcaggca ggccgtacca ctacggcgag gagagtttcc ggcactggac 360gcgctcccgg cagggccggt tcagggtgct ggaacggttc acccacgagc tgctggagga 420cgccgtcggc aactaccgcg tcgccgagct ggaggccgcg ccgcgcgcgt tcctgcagcc 480cagccactac gatgccgacg aggtgatgtt cgtgaaggaa ggcgagggcg tcatcgtgct 540gctccgcggc gggaagaggg agtcgttctg cgtcagggag ggcgacgtca tggtcatccc 600cgcgggcgcc gtcgtgtact cggccaacac gcaccagtcg gagtggttcc gcgtcgtctt 660gctcctcagc cccgtcgtct ccacgtctgg acgcttcgag gttcgctttg cttctcgtgc 720tttaatcttg catgcaaata gatggaggtg acggaaactt ctgttctctt cgtgatttcg 780gcaggagttc ttccccatcg gaggcgagag ccccgagtcc ttcctcagcg tcttcagcga 840cgacgttatc caggcgtcgt tcaacgtatg catgcccttc atcgtcctca cggccgggtt 900tcttctctta tacatcgatt tttcgctagc tagctagcaa actaacccag atttgaacac 960gaccatgcat gtgtcctaga ctcgccggga ggagtgggag aaagtgttcg agaagcagag 1020caagggggag atcacgacgg cgtccgagga acagatccgg gagctgagca ggtcctgctc 1080acgtggtggc cgcagcagcc gcagcgaggg tggcgactcg ggttcttctt cttcaga 1137<210>43<211>753<212>DNA<213>玉米(Zea mays)<400>43atcactacag tttataatgc ttcagttttc gaatactaca atatccaata cataaaggtg 60tttgggaaaa actttggttg agaccaatca gccagagcgg gaccaagctg tcgctctctt 120tacagagaaa aactttggtg agaccaaagt tttcaaaact gcaaaacaag tacagtattt 180acaatattat agtttagtat acagaaattt cagataaatt ttcaaacacc tcaaaatata 240taataccaca gtattactca atactataat attactataa tactacagaa aaactttgtt 300ctcaaacacc tcttccatcg gtatgtcctc cgtcatcccg aaagccttca ttcggctcgc 360tgtcttcttt ctatcgctca caacacaacc atagcccaca ggccgccggc ggccgccagc 420cgacgtcctc ccatttcgct ccccctcctc cgctgcggtc gagcaaaagt tccggccatc 480cggcaatccc cccgcacccg gcggttcaaa ccgtatcttt ctgacctgac gcggctacga 540cgtcgctcct ccggtccctt cgatccggtg gggtccgttt ctttcaagcg cggcctcgct 600ggccgcctcg tggcagtgac cgtcgaaccc tctataaatc ccgtgccccg agcacccttc 660ctcgatcaca caacccaaag cagccacagc agcctccttc ctcctctcac tctcgctcgc 720gctgcgctcg ctacctcgct tcgcattcca ttc 753<210>44<211>684<212>DNA<213>玉米(Zea Mays)<400>44gtgttgtcca aactggacat cagacaagca cgacaatgac aggcgttcgc caagtgtacg 60tacaggagac gaacacgaca agtagcaccg tcctggccga gagcccgtca tgctcatgca 120tgcatgctga tcatctcgat aaatatacag cagagagctg agctacgtac acaaacaaga 180agcttgcatt gttcgtttgc tcgatcgttg cagataatgg agaaccctgc tccgagtatc 240gtagcgcccc ccattgccgc acctgtatca gcgaacttca gcagactcgc cttccgcaac 300ctgtacatcc gacggacggg tccagacagc agggagatgg tgactgtgga gggaagaaga 360ggctctagtg atcagacagg cgacatgagg tacgtgagtg acttccccgt ctacgatggc 420cgtggctccg acgccgtcct ggtggctcgc gtgcagggcg tcacaaccac gttcgggaac 480tccaaccagt tcttcaccgt cgccttcgag gccggcaggt tcttcgttta gacagatata 540tagctagata gatgctagct tgtggttcat atatagcaga tagatatatg catccgccat 600tgatcgtcca tcgtcatcga tcagcaggct caagggctcc acgctcctta ccgaaggagt 660ggtgacggat ggatcagatg aatg 684<210>45<211>1025<212>DNA<213>玉米(Zea Mays)<400>45actccgtact tctaaagggt gggttattta tgtacatggt ccttgcgtta cggagtttga 60ataaacaaaa acaaaaaaat atatagatga ataaacaaat cagtcacaaa aacaaaaaaa120atctagatga gaaataaatc tggacggaca aatcagcaac ataaacaaaa aatatggaca180acaaaaaaca aatttgtgac aaagacaaaa aagaaaacta ttaaacgccc accatgagac240ttgaacccac aacctcaagg ttaaaaacct tatactctac cgactaagct agatgagttt300tgtcattaca tattcgagct cggcggcata gatcttggcg ccgagctcgg tgccacgttg360gcgccacgtc gtctaggttg tgccagcgca acacgttctt cggcgtcata gcctatggcg420ccgagatgtg ttacctcggc gctataggct atgacgccga gtaaagggtc caaaagtgac480attaaaattt tttaaggtct aaacgtgaat ttttttcaga gaaacggaca aaatacaaaa540agttcgggcg catgcatggg tggggtgacg gtggcgctcg caactcagta actcacacgt600gcccgctcgg actcaagggg ctggggcacg ggcatgggca tgggcgcatg gcatgcctgc660aagcagagtg tagcagacgg cgtcagcacg ccaccttggc cgcttggcgg ccacacggtg720ccgacctgac aggggcgcgc gctctcgagt cccagtccca ggctactgcc gtggcgggcc780ttacggccgc cacgtcggcc gaggccaccc atccatgcaa gcggcgcatg ggaacgtggc840attccggcgc gacggcacga ccgcgctccc gcgccatgcg tcacggtcac gtgcacgcag900agccccgctc gccttctata ggtagcgccg cgcgggtggc gtcgcttctg gtctgtggcg960gatcggatcg acacccagcc agcgcgtgga gagtagaaca ccccaaagag gccaggactg 1020agact 1025<210>46<211>910<212>DNA<213>玉米(Zea Mays)<400>46aaatttgtgc ccttagtttt agtggtgtgc tcacatataa cctcagtcgt gtttttttct 60cagctgtgct cacatacgag cacgtacaat gagactgaca aacgagcgtg aatgggtagg120gagttttgtt ggagatacga ataattacac aaatcgtata aaatacggat gctaagttta180atagggtgat tgttaaagtt ggtctaagtg gataaagcag ctcaatagta gaaccgaggc240aaccccggtg aagaaaacaa gcgctcgata agcgcatgta tgggcatggg tgcaccgtgc300atgtccaggc cacctggagc tcgctcgcgc gtattgctcc actccaccgc atcaccacca360ccaagtggca tgcatatcga gcagagggaa accacatcca acttgtactc gatcgccact420gtcgacattt ccctatcgtc cgtctgaacc gatcaacagg tgatgagatc gatcgtgatc480gtcatctggt accgttcgtg caccatcgcg tcgagacgag agcaacgcac tcgatttgta540ctccactact agttcttccg gccggcctac gggttctctc tcaaacgtgg cgagtgcctt600gcacatggtg gtggtccggt gaccagctga ccgacgccta tgggcgtgcg cgcgcgcgaa660tcagctccat cgacatgggc aggcttcgcg aaggtacgga cctcgtgaca caacacagcg720cgtggcgtgt cctttctacg tggccgtcat gtgggaggct gggagcccgg ccacgctacg780tggcccgggg actgcctcgc tgctgctgct tataaatatt ccccgctgga aaagccccca840gccatcatca gtagctagct gttcgaagct ttcagccgat cgagcaccat cgtcacagtc900agtagtagcc 910<210>47<211>734<212>DNA<213>玉米(Zea Mays)<400>47actcggcaaa gagaccgctg gcgatgtaca gttcgccgaa cgttctttgc caagtgttac 60actcggcaaa tcttttgccg agtgtaaaat arcctttgcc gagtgtctga gacacatggc120aaaggagctg attccggtag tgatgtatta cttgtgatca ttttggagat gaagagaggc180cactaatgct tcattttgaa tgtttgtgtc actatttgtt tttcttcagc ttcattttga 240tccgattcaa aaagaaaagt tttattttga taaaactcta acattttgta tttttgtttg 300tctaatgtgc agttgaagaa gcgcatgavc cgkttaagag gaagcstaga aagatgaggc 360agargtcaag tacacatcga gggagatyca wggrgtgtcc ccgccarccc ttgcsttgga 420ttgccytgcy ggkgtagtac aaacagtttc attttccytt gcgtggtckt gggcccamam 480cgtcgtcstg twtaacmaag cggctcawkc araccaacac gcggsgartc ccarcgctty 540camagcawta mcgccgccyc ytycamatka rgsktyaatt caargsgccc aatgcaactc 600ccttttctct tgtccctgtc ctttccgcaa cagagcttgt gagcttgacc agcgagaggc 660gagtggctag gacctaggcc tccgatccat gcaggtccct gtgggtttcc tcggcaagct 720ctggagttcg ttttc 734<210>48<211>1129<212>DNA<213>玉米(Zea Mays)<220><221>misc_feature<222>(1)..(1129)<223>N=任何核苷酸<400>48cctctttcct ttagaggggg aatacaatta tatgtcttgc ttaccttcaa tgcttgctga60atcaagatct ctgtaatgtg ctaccatgct attttaactt aggggacagt atgatccagc 120cttatgggct ggcaaagtgg gcaatagttg gcgtacaact gacgacataa cggatacatg 180gaaaaggtaa cccatgttct tttcagagga aaaaagagat agaacattag ctctgtcgat 240gtgctctcaa actgacttat ttatgtatct ggtgaaaaca agcatgacag acattgctga 300taagaacaac aagtgggcat catatgctgg acctggtggt tggaatggta attatgttag 360tgatgagttc aagctgtctg caatttgctg tgctttgtgg agctgttcag tatactgtta420ctctgttatt gaacctctgc ttttctgcag acccagatat gctggaagta ggcaatggtg480acatgacctt aacagagtat cggctcacat tttagcatat gggytctcat gaaggtaagt540tttcactgar aattggaccc gatgttgtat gktcatattt tgagtaagga ggttcgacca600angagttttg aaaattaaaa actgtagttc attgaagatg atggttggca tgtaagtatt660acagttattg attctccact tactgatgtt acatttggat gcgagaaagg agatatccta720ctcntaatgg gttaactgct accttatata ctgttgtgct tcaggcccct ctattaattg780gctgtgatgt cagaaacatg acttctgaaa caatggaaat actgagcaac aaagaagtaa840ttcaagtaaa ccaaggtatt attctgattc ttctttcgga gagaacatgt tatcctggtt900tagtatcaca ggctacaaaa atatgttttt acatagaaac tgacaacctt cttatttttg960tatataattt cccaacatat cttatatggc agaacaattt aaattcgtaa tgctcatata 1020atcacataaa ctcttgagtt gcatgtgttt tattttctgc agatcctctt ggagttcaag 1080gaagaaaaat tttaggacaa ggaaaatatg gatgccgtga ggtgtgggc 1129<210>49<211>571<212>DNA<213>玉米(Zea Mays)<220><221>misc_feature<222>(1)..(571)<223>N=任何核苷酸<400>49tnacagaatg atcaaantgg attttgnatt gatcaagggg gnaagtgttn caattttttt 60gttgaccaat ccaaaggggc tcgacgaaat acattcctaa agggacacac ccctagggca120agcttggtcg acggcccggg ctggtataag tctgtcttcc ctgcaataaa gcgaatacaa 180cttgccattc tctcgagtct cgttttcact gcgctttaac aagagctaaa aagtgcgaga 240ccgcgagaga aatccagcag gtgtacgtac gtaaagcgag agtcgacgcg tgggcgcggc 300agacgcgagc ctcccgccac gttggcctcg ttcccgcgcc acgcggccac gcctgcctgc 360ctcctcacct tgtttatatg cctcgcgcct ccctcaccgt gccaatgcca tgcgcgcgct 420actgcatctg cggctcatca atccgtgcag tcccagagca ccccgtcttc ccgctactcc 480cgcaagggcg ctcgtcgctt ccttctccgg ggcgtggcag gcaccttctg gtagagcgag 540agcgagagca gcgccgccgg cagttcgcgc t571<210>50<211>579<212>DNA<213>玉米(Zea mays)<400>50aaatattaga tactactgat aaaaaagata aacaccatta gctatattac caccctctcc 60aactgttttc tgaactaatt gtaaatgggc ccatagtgta gtcgtcaagc atggaggccc 120gctcgaccga cctcctcgat cgctcaaatt tggaaacagc ggttgctact gaccggggtg 180agtgctgcgt tgttggcgac tgccctgttt tttaatggat tcagtgagag ctaaaaagtg 240cgagactgcg agagaaatcc agcaggtgta cgtacgtaaa gcgagagtcg acgcgtgggc 300gcggcagacg cgagcctccc gccacgttgg cctcgttccc gcgccacgcg gccacgcctg 360cctgctccta ccttgtttat atgcctcgcg cctcctcacc gtgccaatgc catgcgcgcg 420ctactgcatc tgcggctcat caatccgtgc agtcccagar caccccgtct tcccgctact 480cccgcaaggg cgctcgtcgc tttccttctt ccggggcgtg gcaaggcacc tttttggtaa 540aagcgagagc caagagcagc gccgccggca gttcgcgct579<210>51<211>193<212>DNA<213>玉米(Zea Mays)<400>51ctgtttcagg catatctgcc acctcggtca catgccgtcc gccacgtcga gaccgcgagc 60tccatacgtg tcacgcgcag ccattcccga cgtctccggt gccgtgtttt aaagaacgcg120ccgtagcgca gcgcactgcg ccactcatct gatgccgtaa cacaaggctg aatttttgtt180cggtctaacc gac 19權利要求
1.一種分離DNA分子,包含選自SEQ ID NOS36-51或具有至少20個核苷酸的其片段的多核苷酸。
2.權利要求1的分離DNA分子,進一步包含與該DNA分子連接的第二種多核苷酸分子。
3.權利要求2的分離DNA分子,其中多核苷酸使得轉基因植物胚發生組織或植物愈傷組織或植物種子中第二種多核苷酸分子的表達增強。
4.權利要求2的分離DNA分子,其中多核苷酸分子為雜合啟動子。
5.權利要求4的分離DNA分子,進一步包含最小啟動子序列。
6.一種分離DNA構建體,包含選自SEQ ID NOS36-51或具有至少20個核苷酸的其片段的分離多核苷酸,其中該分離DNA分子,其中該分離DNA構建體與第二種多核苷酸和3’非翻譯區可操作連接。
7.一種轉基因植物或植物細胞,包含權利要求6的分離DNA構建體。
8.權利要求7的轉基因植物,其中該植物為單子葉植物。
9.一種制造轉基因植物的方法,包括(i)將包含(a)包含選自SEQ IDNOS36-51或具有至少20個核苷酸的其片段的多核苷酸的啟動子,其中啟動子被可操作連接到(b)第二種多核苷酸以及(c)3’非翻譯區的DNA構建體引入植物細胞;(ii)選擇該植物細胞;(iii)將該植物細胞再生成植物。
10.一種從植物中分離賦予可操作連接的多核苷酸在胚、胚發生或愈傷組織中增強表達的啟動子的方法,包括(i)評估源于一個或更多從靶植物胚、胚發生或愈傷細胞類型制備的cDNA文庫的ESTs的集合;及(ii)比較來自于至少一個靶植物cDNA文庫的ESTs和一種或更多來自于非胚、非胚發生或愈傷植物細胞類型的非靶cDNA文庫的ESTs;及(iii)扣除在靶和非靶文庫中共同的ESTs;及(iv)在該扣除后從剩余ESTs設計基因特異性引物;及(v)使用該引物從靶植物制備的基因組文庫中分離對應的5’側翼和調節區。
全文摘要
本發明涉及調節植物中基因表達的核酸序列。具體地說,本發明涉及對調節植物中異源DNA表達有用的5’調節序列和識別當可操作連接到DNA序列時賦予特定表達圖譜的5’調節序列的方法。本發明也涉及含5’調節序列的表達載體和含有表達載體的轉基因植物。
文檔編號C07K14/415GK1387572SQ00815225
公開日2002年12月25日 申請日期2000年8月30日 優先權日1999年9月1日
發明者T·W·康納, I·察夫里爾 申請人:孟山都技術有限公司