專利名稱::用于昆蟲細胞的合成的表達載體的制作方法
技術領域:
:本發明總的來說涉及用于在昆蟲細胞中產生異源蛋白質的經改良的表達載體的設計。所述經改良的表達載體由一系列調控元件組成,所述調控元件是合成起源的,或者以提供高水平的重組蛋白質表達的方式進行優化和裝配。此外,本發明還涉及利用這些經改良的表達載體來產生重組亞單位蛋白質以用于在疫苗制劑中使用。
背景技術:
:已開發出了許多異源細胞表達系統來表達和分泌重組蛋白質。一般而言,使用基于真核宿主細胞的系統來表達需要正確的折疊和翻譯后修飾的真核蛋白質,從而允許產生"天然樣"蛋白質。存在有4種主要的通常利用的真核宿主細胞類型真菌(包括酵母)、昆蟲、植物和哺乳動物。待采用的重組蛋白質表達系統的選擇依賴于所需的應用。所選擇的系統必須符合關鍵標準例如所需蛋白質產物的正確折疊和加工、一致'〖生和生產率(成本效益)(Schmidt,爿/v人#/'cro6/o/.5/ofec力/20/.(2004)65:363-372)。基于易于培養、更高的在大規模培養過程中對于重量摩爾滲透壓濃度和副產物濃度的耐受性、以及一般地更高的表達水平,基于昆蟲細胞的表達系統具有滿足容量需求的潛力(Ikonomou等人,」;7p/.#/croWo/W0&c力/20人(2003)62:1-20)。近來,使用基于昆蟲細胞的表達系統已變得更常見。這些系統提供了真核系統的所需特征中的大多數,但具有附加的益處例如更低的商品成本。昆蟲細胞系統基于用昆蟲病毒載體(例如桿狀病毒)感染宿主細胞,或者基于通過將表達質粒整合到宿主細胞的基因組中來產生穩定的細胞系。桿狀病毒表達系統(BES)已作為用于重組蛋白質表達的主要昆蟲細胞培養系統而出現。這種系統基于使用源自稱為桿狀病毒的昆蟲病毒的栽體。將這些載體用于產生編碼所需蛋白質產物的重組病毒。將所述重組病毒用于感染宿主昆蟲細胞,所述宿主昆蟲細胞隨后表達所需重組蛋白質。盡管對于這種系統來說在易于克隆和"至產物的時間"方面存在有優點,但也存在有幾個缺點。在使用BES中的主要挑戰是,它基于宿主細胞的病毒感染。這導致在感染后72-96小時的細胞裂解和細胞死亡(Farrell等人,Wotec/.S/oge/j.(1998)60:656-663;Deo和Park,A/ofec/wo7.^//."2'oc力e邁.(2006)43:129—135)。因此,在感染的后期過程中,昆蟲細胞的加工機制被損害至所需產物的加工也被損害的程度。這限制了細胞可以產生產物的時間,并且可能更重要地導致出現正產生出的產物的經改變的形式。此外,細胞的裂解釋放出細胞酶,這些細胞酶還可以影響所需產物的品質。將穩定轉化的昆蟲細胞用于表達重組蛋白質是對于使用BES來說的備選方案。基于穩定轉化的昆蟲細胞系的表達系統是非裂解性的,并且使得能夠穩定地長期生產需要正確的折疊和翻譯后修飾的分泌型料,并且允許最:的i白;產二用基本方法進行純化。這導致獲得具有更高品質的產物(Kirkpatrick和Shatzman,Ceie^r/7res"'aoiys^e邁s.'^y/刀g^afwre尸orf力e^^rpress/o"(1999)pp289-330)。黑腹果蠅(/^wo;力y7a邁e/a;30^2Wer)細胞表達系統("果蠅表達系統")是已建立的異源蛋白質表達系統,其基于使用包含果蠅啟動子的表達載體和果蠅S2細胞("S2細胞")(Schneider,f/z^iyo/.^T.#0/77力.(1972)27:353-365)。用這些載體轉化S2細胞,以便建立穩定細胞系,該穩定細胞系表達相應于被引入載體中的異源序列的蛋白質(Johansen,H.等人,Ce/z"Zer.(1989)3:882-889;Ivey—Hoyle,M.,O/rr.6^//."/ofec/wo/.(1991)2:704—707',Culp,J.S.等人,WWec/wo/og/^V"(1991)9:173-177;美國專利5,550,043;5,681,713;5,705,359;6,046,025)。這種昆蟲細胞表達系統已顯示出成功產生了來自不同來源的許多蛋白質。已在果蠅S2細胞系統中成功表達的蛋白質的例子包括HIVgpl20(Culp,J".S.,等人,WWec力/7o/c^/(1991)9:173-177;Ivey-Hoyle,M.,倫fe由o人(1991)2:704-707)、人多巴胺p-水解酶(Bin等人,"/oc力e瓜/.(1996)313:57-64)、人血管細胞粘著蛋白(Bernard等人,O^ofec/wo/.(1994)15:139-144)。在這些例子的每一個中,表達水平大于先前所利用的其他表達系統。除了高水平的表達外,果蠅表達系統已顯示能夠表達保持了天然樣生物學功能的異源蛋白質(Bin等人,"/oc力e瓜/.(1996)313:57-64),(Incardona和Rosenberry,A/o厶Ce//.(1996)7:595-611)。借助于X射線晶體學研究,更近期的例子顯示,這種表達系統能夠產生具有天然樣結構的分子(Modis等人,yVs〃.力c".蹈(2003)100:6986-6991),(Modis等人,#"謡(2004)427:313-319),(Xu等人,Cr/"a"(^t.頻o厶CiT"a"o《r(2005)61:942-950)。兩個其他的近期出版物也證明了果繩表達系統產生高品質產物的能力。在第一篇報道中,Schmetzer等人(/.//z朋wl(2005)174:942-952)就蛋白質折疊和天然構象而言將由桿狀病毒表達的EpCAM蛋白與由果蠅表達的EpCAM蛋白進行比較。特別地,將由BES表達的EpCAM和由果蠅表達的EpCAM與變性的由果蠅表達的EpCAM進4亍比較。確定了,相對于未變性的和變性的由果蠅表達的EpCAM蛋白而言,由BES表達的EpCAM處于部分折疊的狀態。這編碼,由BES表達的蛋白質處于不完全折疊的狀態。另一方面,由果蠅表達的EpCAM蛋白采取更完全折疊的狀態。這篇文章的作者認為由果蠅表達的蛋白質處于"天然的"狀態,而由桿狀病毒表達的蛋白質則不是。在第二篇報道中,Gardsvoll等人(尸rW.戶"r/尸.(2004)34:284—295)證明,尿激酶型纖溶酶原激活物受體(uPAR)在S2細胞中的表達導致6在糖基化(5個N-聯位點)方面比在CH0細胞中表達的uPAR更均一的產物。基于利用果蠅S2細胞作為宿主細胞來表達異源蛋白質的一批工作,清楚地知曉,這些細胞具有許多在表達系統中所希望的特征。在對于利用這些細胞來產生重組蛋白質的公開報道所進行的綜覽中,蛋白質產物的表達水平通常為5-50jig/ml。為了具有可以滿足生物技術制造的嚴苛需要的蛋白質生產系統,希望更高的表達水平。為了達到始終如一地較高的表達水平,要求優化下列中的任何一個或全部宿主細胞系、生長培養基或表達載體。任何異源蛋白質表達系統的開發要求將各種調節控制元件(下文,備選地稱為"調控元件"或"控制元件",或者簡單地稱為"元件",包括各自的單數形式)裝配到驅動所需重組蛋白質產物的表達的表達載體中。這些調節控制元件包括轉錄激活子和增強子、轉錄起始和終止元件、翻譯起始和終止元件、以及分泌信號前導序列。用于分泌重組蛋白質產物的表達載體的5種主要的調節控制元件為l)近側啟動子,2)核心啟動子,3)5,非翻譯區,4)分泌信號肽,和5)3,非翻譯區。對于這些元件中的每一種,必須首先獨立地進行任何優化。一旦獨個元件進行了優化,它們就必須進行裝配和測試,以確保給定元件的裝配是相容的并且能夠指導所需重組蛋白質產物的有效表達。在元件的各種組合的裝配中,還重要的是,這些元件是"有效連接的"。"有效連接的,,是指各種元件之間以這樣的方式的功能性連接,所述方式保留了各個元件的功能以及組合的元件的功能,因為許多轉錄和翻譯功能是從一個元件到下一個元件進行處理的結果。因此,"有效連接的"意指,各種元件的核酸序列是相連接和鄰接的,并且在需要時鄰接地進行連接以保持合適的編碼蛋白質的讀碼框。盡管已開發了許多成功的表達載體,但經完全優化的系統較不常見。此外,大多數開發出的系統基于使用天然存在的序列,即各種調控元件取自現有的(天然存在的)基因序列。經過過去數年,合成序列的使用已被用作用于開發經優化的表達載體的手段。"啟動子"由兩個基本部分(核心啟動子和近側啟動子)組成。啟動子位于給定基因的編碼序列的上游。核心啟動子被定義為能夠指導給定基因的精確轉錄起始的最小核苷酸序列。真核生物中的核心啟動子負責指導通過RNA聚合酶II復合物的起始。一般將核心啟動子描繪為跨越轉錄起始位點(INR)的序列,更具體而言INR上游和下游35至45個核苷酸的序列(總長度70-90個核苷酸)。由核心啟動子所界定的區域可以包含一種或多種下列保守的調節基序TFIIB識別元件(BRE)、TATA盒、起始子(initiator)(INR)、基序10元件(motiftenelement)(MTE)、下游啟動子元件(DPE)和下游核心元件(DCE)。盡管在調節控制元件內的某些核苷酸序列具有包括詞語"元件"的本領域公認的名稱,但此類序列在本文中籠統地稱為"基序";特別的本領域公認的名稱(例如,BRE、MTE、DPE和DCE)在本文中具有與在所引用的參考文獻中一樣的含義,盡管它們在本文中被稱為"基序",例如"MTE基序"。核心啟動子及其組成性獨個基序的作用和組成已由0hler等人(Ce/2咖e,(2002)3:1-12),Smale和Kadonaga(WeF.A/oc力e/z.(2003)72:449—479),FUzGerald等人(Ge/2歸S/o/.(2006)7:R53),Gershenzon等人(MC*Ce/2o/77/cs(2006)7:161)和Juven-Gershon等人("2'oc力e/z/.5Vc.rra/^.(2006)34:1047-1050)進行了綜述。還已經報道了定義了DPE基序(Kutach和Kadonaga,Ce7/.S/o/.(2000)20:4754-4764)和MTE基序(Lim等人,Ce"esZer.(2004)18:1606-1617)的研究。盡管大多數基因的核心啟動子包含以各種組合的這些基序中的一種或多種,但存在有不包含任何這些基序的小部分的基因。在來自幾種生物體的核心啟動子的綜覽中,清楚的是,不存在通用核心啟動子,或者通用的包含核心啟動子的基序子集;然而,INR基序是在核心啟動子中發現的最常見的基序(FitzGerald等人,fe"咖e"/o人(2006)7:R53)。真核生物中的近側啟動子一般被定義為緊在核心啟動子上游的序列。近側啟動子的長度是高度可變的。近側啟動子由征募轉錄因子的轉錄激活子基序組成,而所述轉錄因子又激活與核心啟動子區結合的聚合酶起始復合物。轉錄激活子基序的性質和數目對于給定啟動子來說是高度變化的。可以通過系統性地置換和測試各種元件或基序,使用合成啟動子文庫,或者隨機置換獨個調控元件或基序來進行啟動子的優化。已報等人(W"wre貝o"c力/o人(1999)17:241-245)的工作中,報道了對隨機裝配的轉錄因子結合位點驅動肌特異性啟動子的轉錄進行評估的方法。Edel歸n等人(/Voc.5W.(2000)97:3038-3043)描述了高通量選擇操作程序,以選擇增強核心啟動子的轉錄活性的合成的近側啟動子。Tornoe等人(Ce/e(2002)297:21-32)建立了一組用于在哺乳動物細胞中使用的合成啟動子,其將病毒和人啟動子元件相組合。所述合成的哺乳動物啟動子通過下列方式來進一步進行優化置換共有序列并使其他非共有序列隨機化,以獲得具有可變活性的啟動子。在開發用于在乳桿菌("c^6aci//^)中進行基因表達的合成啟動子中,Rud等人(#/cro6.(2006)152:1011-1019)利用了列隨機化,以改良啟動子的性能。以這種方式,他們能夠鑒定具有增力口的活性的合成啟動子。在由Juven-Gershon等人(Mature#e^c>^s(2006)3:917-922)進行的工作中,經優化的核心啟動子的開發通過將來自不同果蠅和病毒基因的核心啟動子基序相組合來完成。這項工作集中于使用核心啟動子的MTE基序(Lim等人,Ce/7esZer.(2004)18:1606-1617)。這種策略導致具有增加的轉錄活性的核心啟動子。基于這些報道,清楚的是,需要通過實驗來確定什么調控元件和組成性基序構成了功能性啟動子。這包括使用何種基序組合,基序以何種順序進行裝配,以及基序和元件以何種方向插入。無論所利用的基序或元件基于合成的序列還是基于經優化的序列,這都是必需的。盡管啟動子的優化已導致在表達方面的改良,但啟動子僅代表了在完全功能性的和經優化的表達載體中所需要的調控元件的一個方面。信使RNA(mRNA)的5,非翻譯區(5,UTR)的序列在來自真核mRNA的基因表達的轉錄后調節中起重要作用。mRNA的5'UTR區的序列的可變性以及各種基序和特征的重要性已得到證明(Kozak,/.#o7.5/o入(1994)235:95-110)和(Kozak,Ce/7e(2005)361:13-37)。5,UTR的性質在信息穩定性和翻譯效率中起作用。給定mRNA的穩定性和可翻譯性將影響有效地表達重組蛋白質的能力。因此,用于最佳地產生重組蛋白質的表達栽體的設計要求,就其在給定宿主細胞系統中以有效的方式起作用的能力來評估5,UTR。所描述的5'UTR是mRNA的一個重要部分,其由在基因啟動子的3,末端中所包含的DNA序列編碼。因此,在定義啟動子的DNA序列的情況下,一般包括了5,UTR序列(從INR到起始甲硫氨酸密碼子的區域)。mRNA的3,非翻譯區(3,UTR)連同5,UTR的序列一起在基因表達的轉錄后調節中起重要作用。3,UTR的性質在信息穩定性、從細胞核轉運至細胞質以及亞細胞定位中起作用。這些因子中的每一個可以對于給定信息的翻譯效率具有影響和最終對于蛋白質表達水平具有影響。因此,用于最佳地產生重組蛋白質的表達載體的設計要求,就其在給定宿主細胞系統中以有效的方式起作用的能力來評估3,UTR。從細胞中分泌出的大多數蛋白質包含指導蛋白質進入細胞的分泌途徑的N-末端信號序列。在真核細胞中,分泌信號或信號肽與內質膜相互作用以起始分泌過程。已將真核信號序列分成3個結構區域(堿性的、疏水性的和極性的),分別從N-末端開始并進行至C-末端(vonHeijne,#uc.Jc油細.(1986)14:4683-4690)和(Bendtsen等人,/.Sio人(2004)340:783-795)。經過數年,已鑒定了許多分泌信號,并用于指導重組蛋白質的分泌。盡管已使用了許多不同的信號序列并且它們顯示是有功能的,但已報道了對于給定細胞類型定義了最佳序列的少數研究。充分建立了與所述三個結構區域相關的一般特征和準貝'j,々口由vonHeijne(#〃c.爿c/c^(1986)14:4683-4690)和Bendtsen等人(/.顏.A/。人(2004)340:783-795)所詳細描述的,然而,關于什么構成了最佳分泌信號存在很少的比較10實驗數據。大多數公開的報道涉及革蘭氏陽性細菌或酵母分泌信號的表征和優化(LeLoir等人,Ce7/,ac^.(2005)4:2,以及Hofmann和Schultz,Ce/ze(1991)101:105-111)。描述了IL-2分泌信號的優化的一篇報道明確地證明了優化的益處(Zhang等人,/."e歸.(2005)7:354-365)。經優化的表達載體(其用于在昆蟲細胞中使用以產生能夠生產大量高品質重組蛋白質的穩定細胞系)的開發要求鑒定合適的調控元件,包括但不限于核心啟動子元件,其可以用于驅動待表達的異源蛋白質的轉錄和翻譯。此外,可以設計并利用合成的調控元件,以進一步優化表達載體的功能性。Lim等人,"脂齡.(2004)18:1606-1617;Kutach和Kadonaga,Ce//.A/o/.(2000)20:4754-4764;和Juven—Gershon等人,^/ocAe/w.Soc.rra/7S.(2006)34:1047-1050的公開內容局限于核心啟動子元件,并且特別地局限于TATA盒、INR、MTE和DPE基序的新型或異源序列和/或間隔。重組蛋白質的表達的調節控制的完全優化要求,優化核心啟動子中的多個調控元件,而不僅僅是基序。盡管許多調控元件對于果蠅以及其他昆蟲來說是已知的,但什么構成了用于在昆蟲細胞中表達異源蛋白質的最佳元件是未知的。目前的技術和方法提供了基于目前的知識體系將調控元件裝配到表達載體中的可能。盡管存在這種可能,但是作為公知常識,并非如此進行的所有嘗試都導致成功。在一種細胞類型中起作用的重組表達調控元件不一定在另一種細胞類型中起作用。例如,Olsen等人(0^o"c力/o/.(1992)10:157-167)評估了一系列啟動子在S2細胞中驅動異源蛋白質表達的能力,并且發現僅果蠅MtnA導致微克產量的產物,盡管所測試的所有啟動子顯示出在其他細胞類型中起作用。在另一個例子中,基于在鱗翅目昆蟲細胞中良好工作的IE啟動子(Farrell等人,"/ofec力/20/."/oe/g.(1998)60:656-663)的家香(Ao/z^/i邁or/)表達載體無法足夠地驅動異源蛋白質在S2細胞中的表達(未公開的數據)。因此,需要系統性的評估以確定使用S2細胞來始終如一地表達高水平的高品質異源蛋白質的潛力。在生物
技術領域:
中,在有利的商品成本下有效地生產重組蛋白質的能力是獲得成功的關鍵。為了達到使用果蠅S2細胞這個目標,需要進一步開發合適的表達載體。將多個調控元件以達到額外益處這樣的合適方式進行組合可以進一步增強表達載體的效用。因此,待解決的技術問題是(l)鑒定用于包括在表達載體中的調控元件,所述表達載體能夠在昆蟲細胞中驅動大量高品質重組蛋白質的表達,(2)設計合成形式的功能性調控元件,其具有改良的功能,和(3)確定多個調控元件的最佳組合,從而使得該組合導致在蛋白質表達的生產率方面的額外增加。在穩定的昆蟲表達系統中的進一步改良可以潛在地為其中需要大量高品質蛋白質的蛋白質制造提供新的平臺,例如在用于生產亞單位疫苗(針對傳染病例如流感或者具有生物恐怖主義潛力的生物體)的基于細胞的系統中。發明概述述調控元件相組合以提供在經穩定轉化的昆蟲細胞中異源重組蛋白質的高水平表達。特別地,本發明旨在當將黑腹果蠅S2細胞用作宿主細胞時表達異源蛋白質。下文所描述的pHBI-10(SEQ.ID.NO:10)和pHBI-ll(SEQ.ID.NO:11)表達載體由5種調控元件組成近側啟動子、核心啟動子、5,UTR、分泌信號序列和3,UTR。使所述5種元件有效連接以形成表達盒。使包含在該表達盒中的調節控制元件各自就在果蠅S2細胞中的使用進行優化;然而,由于這些序列的經優化或合成的性質,在果蠅基因組序列中沒有天然地發現定義了本發明的調控元件的核苷酸序列。本發明的表達載體能夠指導異源蛋白質的高水平表達和分泌到經轉化的細胞的培養基中。特別地,所描述的表達載體包含l)合成的經優化的誘導型近側啟動子,2)合成的經優化的RNA聚合酶II核心啟動子,3)截短的且經優化的5,UTR序列,4)合成的經優化的分泌信號序列,和5)經優化的3,UTR序列。本發明還提供了用于將異源基因序列克隆到所述經優化的表達載體中并利用所述經優化的表達載體來轉化昆蟲細胞的方法,這導致分泌出高水平的保持了天然樣結構的重組蛋白質。附圖簡述圖1。3XRMRE-3XRMRE-SCPl-TolloMTE-A111合成啟動子的序列。標明了近側和核心啟動子區中的每個調節基序。圖2。3XRMRE-3XRMRE-SCP7合成啟動子的序列。標明了近側和核心啟動子區中的每個調節基序。圖3。pMTtPA、pHBI-10和pHBI-11表達栽體的比較。關于每種載體的調節控制元件在表3中列出。圖4。pHBI-10質粒圖謙。顯示了完整質粒的質粒圖譜。pHBI-10載體包含合成的核心啟動子TolloMTE-Alll。圖5。pHBI-ll質粒圖譜。顯示了完整質粒的質粒圖i普。pHBI-ll載體包含合成的核心啟動子SCP7。發明詳述本發明提供了已組合到表達載體中的一系列經優化的調控元件,所述表達載體用于驅動從昆蟲細胞進行高水平的高品質蛋白質的表達,所述昆蟲細胞已用攜帶待表達的蛋白質的基因序列的這些表達載體穩定轉化。在單個表達載體中使用合成的且經優化的調控元件導致獲得這樣的能力,即以提供關于所表達的產物而言有利的商品成本的水平在穩定的昆蟲表達系統中可靠且快速地產生重組蛋白質。術語"調控元件"(或"調節控制元件"或"控制元件",或者簡單地"元件")是指表達載體的這樣的區段,該區段在給定基因序列的所得蛋白質產物的表達中所牽涉的轉錄和/或翻譯過程之中具有已知功能。調控元件不同于術語"調節基序,,(或簡單地"基序"),術語"調節基序"是指用作結合位點或標記出過渡位點的指定序列。一般而言,調控元件由多個調節基序組成。術語"合成的"調控元件是指未被發現天然存在的序列。更具體而言,本文所描述的合成的元件未在果蠅的基因組序列中發現。術語"經優化的"調控元件是指這樣的序列,其源自天然存在的序列并且已被改變以增強其功能。經優化的調控元件的特定序列不代表所述經優化的序列所源自的序列的天然存在的變體;因此,經優化的調控元件(和其中的基序)也可以被稱為是合成的。"表達盒"意指啟動子元件與有效連接的其他轉錄和翻譯調節控制元件的組合。可以將異源基因序列插入到表達盒中以用于表達所述基因序列的目的。表達盒能夠指導轉錄,該轉錄導致產生關于所需基因產物的mRNA。將表達盒插入到質粒中以產生表達載體。這樣的表達載體指導異源蛋白質在宿主細胞中的表達。術語"經轉化的"是指由DNA介導的細胞轉化。這是指在所引入的DNA整合到細胞的基因組中后而產生穩定細胞系的過程之中將質粒DNA引入到昆蟲細胞中。這個術語用于代替常常在相同情況下使用的術語"轉染"。我們對于將質粒DNA引入到培養的細胞中使用術語"轉化",以區別于最初稱為轉染的將病毒DNA引入到培養的細胞中。因為在本發明的表達載體中不存在病毒DNA序列并且將這些表達載體引入到細胞中不導致產生病毒樣顆粒或細胞裂解,所以術語"經轉化的,,是優選的。"表達"或"表達的"意指使用表達載體和宿主細胞例如果蠅S2細胞來產生蛋白質以生產重組蛋白質產物,所述重組蛋白質產物可作到「^.、-'、土、ia"分泌"意指表達出的重組蛋白質從培養的宿主細胞中分泌到培養基中。經表達和分泌的蛋白質是下列操作的結果將給定基因序列14200880021845.1與表達盒有效連接,從而使得所述序列編碼給定蛋白質。術語"產物"指由宿主細胞表達的任何重組蛋白質(全長或其亞基),在所述宿主細胞中引入了攜帶編碼該產物的基因序列的表達載體。昆蟲細胞是備選的真核表達系統,其提供表達經正確折疊和翻譯后修飾的蛋白質的能力,而同時提供簡單且相對廉價的生長條件。使用經穩定轉化的昆蟲細胞表達系統提供了超過基于宿主昆蟲細胞的桿狀病毒感染的那些表達系統的益處。在此基礎上,選擇S2細胞作為所選擇的昆蟲宿主細胞。因此,對于經穩定轉化的昆蟲細胞而言來優化進行的分析的數據。在本發明的一個優選的實施方案中,表達載體的核心啟動子被定義為跨越轉錄起始位點UNR)的序列,更具體而言INR上游和下游35至45個核苷酸的序列(總長度70-90個核苷酸)。將INR基序的"A"(腺噪呤)核苷酸指定為+1。本發明的核心啟動子包含有在自然界中未發現的基序組合。這些核心啟動子由已知的調節基序組成;然而,基序的組合是獨特的,并且幾個在本發明的核心啟動子中的基序基于共有序列并且進一步地當相組合從而形成核心啟動子調控元件時就最佳功能進行調整。在本文所描述的表達載體的核心啟動子中重要的已知區域是TATA盒、轉錄起始位點(INR)、基序10元件(MTE)和下游啟動子元件(DPE)。本發明的啟動子(其具有包含這4種核心調節基序中的至少3種的合成的核心啟動子)呈現在SEQ.ID.NO:1、NO:2和NO:3中。在本發明中,當與合適的上游調控元件例如近側啟動子相連接時,所述合成的核心啟動子(SEQ.ID.NO:2和NO:3)能夠驅動高水平的表達。在本發明的另外一個優選的實施方案中,5'UTR序列被定義為這樣的序列,該序列從INR基序的"A"(腺嘌呤)核苷酸到緊在起始甲硫氨酸密碼子之前的序列中的核苷酸。本發明的5,UTRs具有比較短的5'UTR并且在3,末端處包含果蠅共有Kozak序列。在SEQ.ID.NO:415和N0:5中呈現了這樣的序列,所述序列定義了mRNA的5,UTR,所述mRNA起因于由本發明的兩種合成的核心啟動子所指導的轉錄。在本發明的另一個優選的實施方案中,在驅動核心啟動子轉錄并且導致高水平表達的近側啟動子中所包含的上游調控元件是由多個金屬應答元件(MRE)組成的合成序列。該合成的近側啟動子由通過11個核苷酸間隔開的2組3XMREs組成。所有MREs的方向為相對于轉錄起始而言的相反方向,如圖1和2中所描繪的。這種合成的近側啟動子的序列呈現在SEQ.ID.NO:6中。在本發明的另外一個優選的實施方案中,提供了經優化的分泌信號肽序列。通過改變總長度、N-末端堿性區域以及疏水性區域的組成,設計并合成了經優化的信號肽序列以用于指導表達出的蛋白質分泌到經轉化的細胞的培養基中。還設計了限制位點并且將其摻入到分泌信號序列中,所述限制位點允許將蛋白質編碼序列克隆到與分泌信號相同的讀碼框,并且不會負面地影響分泌信號切割位點。所述合成的分泌信號的氨基酸序列以及編碼該肽的核苷酸序列呈現在SEQ.ID.NO:7和NO:8中。在本發明的另外一個優選的實施方案中,由本發明的表達載體所產生的mRM轉錄物的3,UTR序列是優化形式的天然果蠅3,UTR序列,所述天然果蠅3'UTR序列源自編碼高度表達且分泌的稱為殼多糖酶樣蛋白的蛋白質的基因(Kirkpatrick等人,C(1995)153:147-154)。殼多糖酶樣蛋白是S2細胞中最豐富地表達且分泌的蛋白質之一。為此,選擇編碼殼多糖酶樣蛋白(CLP)的基因作為用于優化3'UTR的基礎。來自CLP基因的3'UTR不包含典型的多腺苷酸化信號基序AATAAA。對該3,UTR進行的修飾和截短導致更高水平的表達。本發明的3'UTR的序列呈現在SEQ.ID.NO:9中。在本發明的一個更優選的實施方案中,公開了將上文所描述的5種調控元件組合(包括轉錄和翻譯元件)到指導在S2細胞中的高水平表達的功能性表達盒中。僅在所利用的核心啟動子序列中發生變化的兩種所裝配的表達盒的序列呈現在SEQ.ID.NO:IO和NO:11中。16因此,本發明提供了由合成的且經優化的調控元件組成的表達載體,其能夠驅動高水平的異源蛋白質表達。當用于在S2細胞中表達異源蛋白質時,所述合成的表達載體使得能夠經濟地生產大量的高品質蛋白質。所有合成的調節控制元件,或者合成的和野生型的調節控制元件的組合,或合成的和共有的調節控制元件的組合,或合成的、野生型的和共有的調節控制元件的組合可以在表達盒中使用。下面的實施例顯示了,使用所有合成的元件產生(或"驅動")了最高水平的異源蛋白質表達。當少于所有的調節控制元件是合成的時,其余的元件采取為本領域已知對給定類型的宿主細胞起作用的野生型元件(未經優化的)。盡管上文所呈現的描述和隨后的實施例主要針對將經優化的表達載體與果蠅S2細胞一起進行使用,但所述載體和方法可以應用于其他昆蟲細胞系,所述其他昆蟲細胞系導致在用質粒DNA轉化宿主細胞后獲得穩定的細胞系。作為舉例說明,而不是作為限制,提供了下面的實施例。實施例下面的實施例描述了用于在昆蟲細胞中使用的合成的表達載體的開發。所述實施例證明了,以在商業上適合于產品開發的水平在果蠅S2細胞中有效地表達異源蛋白質的能力。所述實施例表明了獨個調控元件增強在S2細胞中表達蛋白質的能力的能力,以及為了確定何種變化促成了這些元件的增強的功能而作出的努力。下面所呈現的結果證明,不同的元件和這些元件的修飾可以導致高水平的表達或者很少或無法檢測的表達。因此,功能性且有效的調控元件的選擇必須通過實驗來確定。因此,本文所描述的本發明是獨特的,因為所描述的表達盒在組成上來說主要是合成的并且指導高水平的蛋白質表達。實施例1將非果蠅啟動子用于在果蠅S2細胞中驅動異源蛋白質的表達在為了鑒定能夠在S2細胞中驅動高水平的高品質產物的備選表達載體的努力中,評估了包含源自其他昆蟲的啟動子的表達載體。對于這個工作,利用了用于培養和轉化S2細胞的標準方法(VanderStraten,#e^o&a力cT"/o人(1989)1:1-8;Culp等人,"/"e由o7og/(1991)9:173-177;Kirkpatrick和Shatzman,Ce/eimpress/'0/2te歷s.'^s//2gfy_re尸ort力e力rfoT^rpre^s/o",編輯Fernandez和Hoeffler,AcademicPress,(1999)289-330)。利用了從ATCC獲得的果蠅S2細胞(Schneider,/.^6iTo/.JA77.#077力.(1972)27:353-365)。S2細胞已適應于在Excel1420培養基(SAFC,StLouis,M0)中生長,并且本文所描述的所有操作程序和培養都在Excell420培養基中進行。培養物通常以1><106個細胞/ml的密度進行接種,并且在第5和7天之間進行傳代。所有培養物均于26-27。C進行溫育。借助于磷酸鈣法,將其中插入了目的基因的表達質粒轉化到S2細胞中。以20jig表達質粒對1jigpCoHygro的比率,用pCoHygro質粒共轉化S2細胞,以便用潮霉素B進行選擇。在轉化后,選擇出對于0.3mg/ml潮霉素具有抗性的細胞。一旦選擇出穩定的細胞系,就對它們就合適產物的表達進行評估。為了評估表達,以2x1(^個細胞/ml接種5ml所選細胞系的培養物,并且在O.2mM硫酸銅存在下于26。C培養7天。在與細胞相聯合的級分和培養基中,就重組蛋白質的表達來對培養物進行評估。通過SDS-PAGE來分開蛋白質,并且用考馬斯藍染色或者印跡至硝酸纖維素。將對于所表達的蛋白質特異的抗體用于探測Western印跡。通過SDS-PAGE凝膠的考馬斯染色,在S2培養物中容易地檢測到1fig/ml(1mg/L)或更大的表達水平。所測試的第一種昆蟲啟動子是家蠶(蠶蛾)細胞質肌動蛋白A3啟動子。這種啟動子已在被設計用于經穩定轉化的家蠶細胞的高水平表達的表達載體中使用。除了肌動蛋白A3啟動子外,表達載體pIEl/153A還包含家蠶核型多角體病毒(BmPNV)立即早期(ie-l)轉錄因子和BmNPV的同源重復序列3(HR3)區域(Farre11等人W"ec力.A'oe/^.(1998)60:656-663)。在轉化鱗翅目昆蟲細胞后,這種表達載體顯示出驅動重組蛋白質的高水平表達。將編碼亞單位蛋白質例如流感血凝素(HA)胞外域(H3HA-Ecto)和癡疾裂殖子表面蛋白1p42C-末端片段(MSPl-p42)的各種基因克隆到pIE/153A載體中,并且隨后將所得到的重組質粒用于轉化S2細胞。H3HA-Ecto序列源自H3N2流感毒林A/Fujian/411/02全長HA基因序列(HAO),其編碼具有566個氨基酸殘基的蛋白質。特別地,所利用的序列源自在登錄號ISDN38157(ISD,www.flu.lanl.gov)中的核苷酸序列。HAO蛋白質序列包含有在N-末端的16氨基酸分泌信號序列以及C-末端的膜錨著點。為了表達可溶性H3HA-Ecto,表達了N-和C-截短的分子,其被包含在全長蛋白質的Glnn至Gly526(HA2的殘基175,類似于X31晶體結構的C-末端,Wilson等人,#a"re(1981)289:366-373)的序列中。H3HA-Ecto的核苷酸和氨基酸序列以及表達詳細公開在W02007/022425中。瘧疾MSPl-p42序列源自惡性瘧原蟲(戶7as/BO(^.w/z7/^/c/parw/z)的FUP才朱(Genbank登^己號M37213)。通過PCR擴增而獲得的MSP-1p42編碼序列編碼MSP-1蛋白的氨基酸Ala^3至Ser。5。MSPl-p42的核苷酸和氨基酸序列以及表達詳細公開在WO2006/026625中。當由PIE/153A載體來驅動表達時,流感和癡疾亞單位蛋白質的表達水平在S2細胞中小于1jig/ml。根據這些結果,當用于轉化S2細胞時,pIE/153A載體不指導重組亞單位蛋白質的高水平表達。所測試的第二種昆蟲啟動子是岡比亞按蚊(^0/7/e/es^2/z6/ae)(蚊子)金屬硫蛋白1啟動子。為了就其在S2細胞中驅動高水平表達的能力來測試這種啟動子,從果蠅表達載體pMTtPA中除去黑腹果蠅金屬硫蛋白啟動子區(MtnA),并且用按蚊(^70/7力e/es)啟動子替代。pMTtPA表達載體以及關于將其用于在培養的果蠅細胞中表達重組蛋白質的方法描述在下列美國專利中5,550,043;5,681,713;5,705,359;6,046,025。在美國專利5,681,713中描述的質粒pCoHygro用于在共轉化S2細胞后進行潮霉素選擇。pMTtPA表達載體包含下述元件果蠅金屬硫蛋白啟動子(MtnA)、人組織纖溶酶原激活物(tPA)前原(pre-pro)信號序列、和SV40早期多腺苷酸化信號(Culp等人,Biotechnol.(1991)9:173-177)。pCoHygro質粒提供了關于潮霉素的選捧才示i己(vanderStraten等人,//#o/.j/7f/Ce//A/o/.(1989)1:1-8)。潮霉素基因處于果蠅COPIA轉座元件長末端重復序列的轉錄控制之下。通過缺失長度為15個堿基對的^威I片段來對pMTtPA載體進行修飾,所述A/nHI片段包含外來的位點。這種被稱為pMTtAXho的經修飾的載體允許利用獨特的BglII和J力o/位點來定向地克隆插入片段。通過緊在tPA前原信號序列的起始曱硫氨酸密碼子之前添加"'//dill限制位點和添加果蠅"共有Kozak序列"(Cavener,Y"c.Jc油b.(1987)15:1353-1361)來進一步修飾載體。特別地,將緊在ATG之前的在pMTtPA中的長度為12個核苷酸的序列TGTGAAGCAATC變成AAGCTTAACAAC(前6個核苷酸代表了^7/2din限制位點,和后6個核苷酸代表了果蠅共有Kozak序列)。該經進一步修飾的載體稱為pMT-KtAXho。"'"dill限制位點允許克隆緊在tPA前原信號序列的翻譯起始密碼子之前的啟動子序列。按蚊金屬疏蛋白啟動子片段源自在按蚊基因組數據庫(www.ensembl.org/Anopheles—gambiae/)中的序列。特別地,長度為1833個核苷酸的啟動子片段代表了在岡比亞按蚊金屬硫蛋白l基因(UniProtKB/TrEMBL登錄名Q52P92-ANOGA)的翻譯起始密碼子上游的序列。該基因可以在染色體2R上在位置11,911,992-11,912,384處發現,并且是果蠅MtnA基因的同源物。采用化學方法來合成(DNA2.0,MenloPark,CA)該核苷酸序列,其中在5,末端處添加//7/2l限制位點和在3,末端處添加i^/Kiin限制位點。用&力1和iW/3din消化pMT-KtAXho載體,以去除果蠅啟動子并且用按蚊啟動子替代。所得到的質粒稱為pAgMT-KtAXho。然后,將H3HA-Ecto序列克隆到pAgMT-KtAXho載體中。將編碼H3HA-Ecto亞單位蛋白質的pAgMT-KtAXho表達質粒用于轉化S2細胞。在選擇出穩定的細胞系后,就當在硫酸銅存在下進行培養時分泌形式的H3HA-Ecto蛋白質的表達來對細胞進行篩選。由按蚊金屬硫蛋白啟動子驅動的H3HA-Ecto亞單位的表達導致具有預期分子量的均勻的產物。盡管由按蚊啟動子驅動的H3HA-Ecto的表達大于由蠶(Ao/^/jr)啟動子驅動的表達,但表達水平仍被認為是低的,大約1ng/ml。這個水平比當利用果蠅MtnA啟動子時H3HA-Ecto表達的水平(大約30fig/ml)低得多。實施例2設計用于果蠅S2細胞的合成的核心啟動子核心啟動子被定義為能夠指導給定基因的轉錄起始的最小核苷酸序列。真核生物中的核心啟動子負責指導通過RNA聚合酶II復合物的起始。一般將核心啟動子描繪為跨越轉錄起始位點(INR)的序列,更具體而言INR上游和下游35至45個核苷酸的序列(總長度70-90個核苷酸)。5,UTR編碼序列在INR處開始并且延伸直至翻譯起始ATG密碼子。5,UTR編碼序列在長度方面是可變的,從相對較短的50個核苷酸到相當長的幾百個核苷酸。如先前所描述的,核心啟動子一般包含一種或多種下列序列基序TFIIB識別元件(BRE)、TATA盒、起始子(INR)、基序10元件(MTE)、下游啟動子元件(DPE)和下游核心元件(DCE)。在來自幾種生物體(包括果蠅)的核心啟動子的綜覽中,清楚的是,不存在通用核心元件;然而,INR基序是最常見的(FitzGerald等人,f7e層e飾7.(2006)7:R53)。在為了制備能夠指導轉錄(所述轉錄導致高水平的重組蛋白質表達)的強核心啟動子的努力中,設計了用于果蠅的合成的核心啟動子,其摻入有所有這些元件。利用了關于構成核心啟動子的各種果蠅調節基序的共有序列。這些共有調節基序由0hler等人,Ce層"/o/o^r(2002)3:1-12;Kutach和Kadonaga,#。厶Ce/人5/o人(2000)20:4754-4764;Smale和Kadonaga,h/2.Woc力e瓜(2003)72:449-479;Lim等人,Ce/zes"e7.(2004)18:1606-1617;FUzGerald等人,Ce/20/e"/o/.(2006)7:R53;Gershenzon等人,廚Ce層i"(2006)7:161進行了描述。為了構建果蠅合成啟動子,設計了包含下述果蠅共有調節基序的核心啟動子包含GGGCGCC的BRE,包含TATAAA的TATA,包含TCAGTC的INR,包含CGAACGGAAC的MTE,和包含GGTTCG的DPE。將合成的核心啟動子融合至按蚊金屬硫蛋白15,UTR的部分。按蚊金屬硫蛋白15,UTR與核心啟動子的融合導致INR相對于翻譯起始ATG的位置類似于果蠅MtnA啟動子的那種。釆用化學方法來合成這種合成啟動子,并且將其稱為合成的核心啟動子l(SCP1)。SCP1啟動子的序列作為SEQ.ID.NO:1列出。化學合成的SCP1在其5'末端處包括J6al位點并且在其3,末端處包括iW/2dIII位點以用于克隆到現有的表達載體中。通過在MtnA啟動子的TATA盒序列上游7個核苷酸處插入限制位點來進一步修飾實施例1中所描述的pMT-KtAXho表達載體。這種質粒-故稱為pMT-X-KtAXho。這允許通過用J&I和"/"dill限制酶進4亍消化并且插入備選的核心啟動子和5'UTR序列,來去除MtnA核心啟動子(包括5,UTR)。以這種方式,將SCP1插入到pMT-X-KtAXho表達載體中。實施例3設計包含能夠在果蠅S2細胞中驅動異源蛋白質表達的轉錄激活子元件的近側啟動子在為了上調核心啟動子中的轉錄水平(而這又導致在S2細胞中高水平的表達)的努力中,將合成的近側啟動子設計為包含各種轉錄激活子元件。選擇開發合成的近側啟動子而不是利用天然存在的近側啟動子以在S2細胞中使用基于在使用兩種昆蟲啟動子的實施例1中的結果,以及還基于Olsen等人(0^Wec力/7o7o^T(1992)10:157-167)的工作,其中證明哺乳動物和病毒起源的啟動子在S2細胞中并不良好地工作。因此,合成的近側啟動子被設計為包含源自果蠅啟動子的調節基序。近側啟動子設計牽涉裝配獨個調節基序共有序列的重復或者不同共有調節基序的組合。就其當與核心啟動子相連接時指導高水平轉錄的能力來對合成的近側啟動子進行評估。所評估的第一種類型的轉錄調控元件是果蠅DM復制相關元件(DRE)。編碼DNA復制相關蛋白質的果蠅基因的啟動子包含共有DRE序列5,-TATCGATA。特異的DRE結合因子、DNA復制相關元件因子或DREF結合至DRE,并且正向調節在DRE控制下的基因且導致高水平的表達。果蠅啟動子的計算機研究(Ohler等人,^/o歷e"/o/og/(2002)3:1-12)已顯示,DRE元件在許多果蠅啟動子中被發現。事實上,它是最常見的轉錄元件之一。在Hirose等人(/our/a/o尸"/'Wog/ca/CAe/z//"r/(1993)268:2092-2099)的工作中,裝配了多個拷貝的DRE,并且將其連接至控制螢光素酶報道基因的果蠅MtnA核心啟動子。所述DREs上調螢光素酶表達,其中表達水平隨著加入的DREs的數目而增加。在包含近側啟動子的合成的DRE的設計中,使用序列CTGCCTGCW"GATTCAGG(DRE共有序列為斜體并加有下劃線)。合成的DRE近側啟動子設計如下1XDRE、2XDRE和4XDRE。通過去除MtnA近側啟動子(J/wI-J6al)并且緊在MtnA核心啟動子上游插入備選的近側啟動子,將包含DRE的近側啟動子克隆到實施例2中所描述的pMT-X-KtAXho載體中。DRE重復都以相同的正向方向(5,至3,)。將這些載體稱為pDRE-X-KtAXho。為了評估使用這些DRE表達質粒的重組蛋白質的表達,將實施例1中所描述的H3HA-Ecto基因序列插入到這些載體中并用于評估表達水平。將編碼H3HA-Ecto亞單位蛋白質的pDRE-X-KtAXho表達質粒用于轉化S2細胞。在選擇出穩定的細胞系后,就分泌形式的H3HA-Ecto蛋白的表達來對它們進行篩選。所有DRE近側啟動子構建體無法導致<壬{可可測量的H3HA-Ecto表達。所評估的第二種類型的轉錄調控元件是果蠅GAGA元件。果蠅GAGA轉錄調控因子因其結合交替的(GAr或(CTT序列(GAGA元件)的能力而得名。這種轉錄因子被認為通過重塑在受影響的基因周圍的染色質結構來增加基因表達(Granok等人,C〃rreWWo/og/(1995)5:238-241)。GAGA元件在多種果蠅基因的啟動子中被發現。它在這些基因的遠側、近側和甚至核心啟動子中被發現(Soeller等人,#0厶6W入5A/o^f(1993)13:7961-7970)。在Soeller等人(1993)的工作中,證明了多個GAGA元件可以驅動核心啟動子的轉錄。設計了兩種近側啟動子,其中將單個GAGA元件與DRE元件相組合。這兩種設計如下GAGA-2XDRE和2XDRE-GAGA-2XDRE。與使用DRE近側啟動子一樣,將這些近側啟動子插入在表達載體pMT-X-KtAXho中的MtnA核心啟動子的上游。為了評估使用這些DRE-GAGA表達質粒的重組蛋白質的表達,將實施例1中所描述的H3HA-Ecto基因序列用作報道分子。將編碼H3HA-Ecto亞單位蛋白質的具有DRE-GAGA組合啟動子的表達載體用于轉化S2細胞。在選擇出穩定的細胞系后,就分泌形式的H3HA-Ecto蛋白的表達來對細胞進行篩選。這兩種構建體也無法導致任何可測量的蛋白質表達。所評估的笫三種類型的轉錄調控元件是果蠅金屬應答元件(MRE)。特異的MRE結合因子、金屬應答轉錄因子或MTF-1結合至MRE,并且正向調節在MRE控制下的基因且導致高水平的表達。由MTF-1調節的果蠅基因的啟動子包含共有MRE序列5,-TGCACAC。已證明,4個拷貝的MREs可以驅動最小啟動子的轉錄(Zhang等人,6W人Wo人(2001)21:4505-4514)。在pMTtPAAXho表達載體中MtnA近側啟動子的缺失分析表明,具有序列5,-TCTTT^i^GCCGGC(共有序列為斜體并加有下劃線)的MRE的缺失對于MtnA啟動子的強度具有最大影響。因此,設計了包含一個或多個拷貝的mre序列Tcrnrg(:淵(XCCGGc的合成的近側啟動子。合成的MRE近側啟動子設計如下2X、3X、4X、5X、6X、8XMREs。這些近側啟動子設計中的MREs都以5,至3,(正向)頭尾相接的方式排列。與使用DRE近側啟動子一樣,將MRE近側啟動子插入在表達載24體pMT-X-KtAXho中的MtnA核心啟動子的上游。為了評估使用這些合成的MRE啟動子表達載體的重組蛋白質的表達,將實施例1中所描述的H3HA-Ecto基因序列插入到載體中。將編碼H3HA-Ecto亞單位蛋白質的具有MRE近側啟動子的表達質粒用于轉化S2細胞。在選擇出穩定的細胞系后,就分泌形式的H3HA-EctQ蛋白的表達來對細胞進行篩選。因為這些構建體包含MREs,所以表達的評估要求,用0.2mMCuS04來對培養物進行誘導,并且于26。C培養7天。這些S2轉化體的分析揭示,隨著MRE單元的數目增加,基因表達的水平也增加,直至在使用6XMRE時達到最大值。在使用8X時,表達水平減少。因此,利用合成的MRE近側啟動子的表達的進一步分析基于6XMRE設計。使用6XMRE合成的近側啟動子,制備了一系列表達構建體,其允許將天然的MtnA近側啟動子與合成的6XMRE近側啟動子進行比較。在該一系列的表達構建體中,使這兩種近側啟動子連接至三種不同的最小或核心啟動子1)果蠅MtnA,2)按蚊MtnA,和3)實施例2中所描述的SCP1。然后,將所得到的6種構建體與H3HA-Ecto報道基因相連接。當比較給定獨個核心啟動子中的每一種時,6XMRE和DmMtnA近側啟動子都能夠驅動flu基因的表達水平至相等的水平。例如,6XMRE近側-MtnA核心和DmMtnA近側-MtnA核心導致H3HA-Ecto蛋白的相等水平的表達。使用6XMRE近側啟動子的這個數據表明,可以設計出功能性的合成的近側啟動子,盡管使用在這個實施例中所測試的前兩種轉錄激活子時遭到失敗。6XMRE與DraMtnA近側啟動子的比較還揭示,在包含MtnA核心啟動子的構建體中H3HA-Ecto的表達水平為包含SCP1的那些構建體的大約4倍。因此,作出了努力,以評估備選的核心啟動子(如實施例4中所描述的)以及進一步優化合成的核心啟動子(如實施例5中所描述的)。實施例4對"超級核心啟動子"在果蠅S2細胞中驅動異源蛋白質表達進行評估Juven-Gershon等人("re#e(2006)3:917-922)描述了稱為"超級核心啟動子"的核心啟動子的設計和分析,該核心啟動子在后生動物宿主細胞中指導高水平的通過RNA聚合酶II的RNA轉錄。相同的"超級核心啟動子"的使用也公開于PCT申請PCT/US2006/020394(Kadonaga和Gershon,優先權日為2005年5月25日)中。這些出版物中所描述的"超級核心啟動子"將被稱為"Kadonaga核心啟動子"或"KCP"。Kadonaga核心啟動子由最小啟動子組成,所述最小啟動子包含INR和MTE元件,并且任選地包含TATA和/或DPE元件,它們源自幾種不同的果蠅和病毒基因。在KCP核心啟動子和本說明書中所描述的核心啟動子之間在設計方面存在有相似性,因為兩者都嚴重依賴于首先描述了果蠅MTE調節基序的"GenesandDevelopment"的文章(Lim等人,Ce編紋(2004)18:1606-1617)。Kadonaga核心啟動子被描述為可用于在后生動物宿主細胞中的異源蛋白質表達,所述后生動物宿主細胞包括果蠅S2細胞。因此,我們在HawaiiBiotech,Inc.制備了包含Kadonaga核心啟動子的3種構建體,以測試Kadonaga核心啟動子在經穩定轉化的S2細胞中表達異源蛋白質的情況下的功能性。合成Kadonaga核心啟動子,其中具有合適的側翼限制位點。將KCP合成序列插入到實施例9中所描述并且由SEQ.ID.NO:10所定義的HBI-IO表達載體中,從該表達栽體中去除了近側和核心啟動子序列。所得到的KCP/HBI-10雜合表達載體包含與1R5L(SEQ.ID.NO:7)分泌信號、H3HA-Ecto報道基因和0p-CLP-3,UTR(SEQ.ID.NO:9)連接的KCP。KCP/HBI-10載體不包含近側啟動子。因此,從這種"基礎KCP/HBI-10雜合載體"制備了兩種額外的構建體,除了KCP外,在第一種額外的構建體中還包含6xMRE近側啟動子("6xMRE/KCP/HBI-10"),以及在第二種額外的構建體中,還包含26巨細胞病毒(CMV)增強子("CMV/KCP/HBI-10");每種近側啟動子插入在緊在KCP序列上游處。所述CMV增強子與在Juven-Gershon等人(A"wreVeMo^y(2006)3:917-922,對于其來說Dr.Kadonaga是相應的作者)中所使用的相同。將這三種構建體一式三份地轉化到果蠅S2細胞中,并且測定H3HA-Ecto的表達水平。單獨的(無近側啟動子或增強子)兩種構建體CMV/KCP/HBI-10和KCP/HBI-10顯示出最低水平的H3-HA-Ecto表達,即<1ng/ml。因此,這個數據表明,l)單獨的KCP提供了低水平的分泌型蛋白質表達,和2)這個表達水平在經轉化的果蠅S2細胞中并沒有通過CMV增強子而得到增強或增加。6xMRE/KCP/HBI-10構建體導致以在粗制上清液中2-3ug/ml的水平表達和分泌出H3-HA-Ecto蛋白。使用6xMRE-SCPl的類似構建體的先前實驗導致以10ug/ml或者以連接至相同6XMRE近側啟動子的KCP的約略2-3倍的水平表達出相同的H3-HA蛋白。因為這兩種構建體之間的差異僅是核心啟動子,所以可以得出結論,實施例2和3中所描述的SCP1提供了這樣的分泌型異源蛋白質的表達水平,所述表達水平為在經轉化的果蠅S2細胞中由于使用Kadonaga核心啟動子和6xMRE近側啟動子而產生的表達的大約2-3倍。在Lim等人(Ce扁齡.(2004)18:1606-1617)或Juven-Gershon等人(射訓(2006)3:917-922)參考文獻中未公開MRE或基于MRE的近側啟動子的使用。就在哺乳動物細胞中的使用,對Kadonaga核心啟動子進行優化。關于在HeLaS3細胞中使用KCP所呈現的數據局限于瞬時轉染和使用靈敏的熒光測定法;因此,基于在穩定轉化果蠅細胞后用KCP核心啟動子獲得的結果,瞬時轉染和靈敏的報道分子測定法的使用并不表示在所有細胞類型中以高水平表達和分泌異源蛋白質的能力。KCP的設計包括病毒啟動子例如CMV和AdML的元件,它們已傳統地用于在哺乳動物細胞中表達蛋白質。然而,相對于KCP而言通過使用SCP1使在果蠅細胞中分泌型異源蛋白質的穩定表達增加至2-3倍是值得注意的且出乎意料的。實施例5就在果蠅S2細胞中表達異源蛋白質來對合成的核心啟動子進行優化實施例2中所描述的原始SCP1設計包含具有BRE、TATA盒、INR、MTE和DPE的核心啟動子。獨個地去除這些基序中的每一種,并且評估它們的去除對于表達的影響。在每種情況下,表達水平看起來略微降低。嘗試著通過獨個地將BRE、TATA、INR、MTE和DPE基序交換成備選的序列來進一步優化SCP,所述備選的序列包含代表了給定調節基序的備選序列或者具有在核心啟動子中的等價位置處缺乏調節基序的序列。例如,野生型果蠅MtnA核心啟動子缺乏BRE、MTE或DPE基序,然而,基于實施例3中所呈現的數據,果蠅MtnA核心啟動子是迄今所測試的最強的野生型核心啟動子。去除SCP1中的BRE序列并且用"中性"序列來替代之沒有導致報道基因產物的表達水平發生變化,這表明BRE的存在是中性的,即它對于轉錄無明顯的影響。在TATA盒的情況下,將SCP1TATA和INR之間的間隔減少3個核苷酸,以匹配果蠅MtnATATA盒與其相應的INR之間的間隔。所去除的那3個核苷酸(ACA)是緊接TATA盒的3,的那些。這個變化導致報道基因表達水平的略微降低,這表明SCP1中的間隔相對于MtnA中的間隔而言是優選的。將SCP1的INR(TCAGTC)變成GCATCA,6個核苷酸中的3個發生變化。這個變化使報道基因產物的表達增加大約50%。SCP1包含長度為190個核苷酸的5,UTR編碼序列。SCP1的這個部分源自按蚊Mtn基因。這個序列對于轉錄/表達是有益還是有害是未知的。為了確定這個序列的貢獻,產生了兩種在這個序列內的缺失構建體。第一種去除了該序列的從3'末端開始的60個核苷酸。這個變化導致表達水平的略微增加。第二種去除了該序列的從3,末端開始的127個核苷酸。這個變化導致表達水平增加至大約2倍。這個截短形式的SCP1被稱為SCPlAlll,并且用于進一步評估對于核心啟動子的修飾。由Lim等人(Cs紐(2004)18:1606-1617)描述了TolloMTE對于轉錄水平的影響。因此,將在SCP1A111中使用的共有MTE變成在果蠅Tollo啟動子中發現的那種。用TolloMTE序列替代共有MTE導致表達水平增加至大約2-3倍。將TolloMTE插入到SCP1核心中對于表達水平明顯具有非常正面的影響。該插入有TolloMTE的核心啟動子被稱為"SCPl-TolloMTEAlll",并且包含這個核心啟動子的啟動子序列作為SEQ.ID.NO:2列出。測試了核心啟動子的進一步優化。設計了一組3個新的核心啟動子,其摻入有在前面的3個段落中描述的導致表達增加的正面方面。所述3種關鍵基序和所述5,UTR元件的特定組合是1)TATA基序,其包含TATAAA,和相對于INR的由原始SCP1所定義的間隔,2)INR序列基序GCATCA,3)源自果蠅Tollo的MTE序列基序,和4)截短的5,UTR(A111)元件。將這三種新的核心啟動子命名為SCP5、SCP6和SCP7。所有這三種核心啟動子都缺乏來自SCP1的BRE序列基序(當存在時,包含GGGCGCC)。這三種新的核心啟動子在由DPE基序所占據的序列方面不同。SCP5包含來自果蠅Tollo基因的DPE(GGACGC),SCP6包含在SCP1中所使用的共有DPE(GGTTCG),和SCP7缺乏DPE基序而取而代之包含"中性填充物"序列以提供相對于SCP5和SPC6序列而言相同的間隔。當在等價的果蠅S2表達構建體(它們僅在其SCP序列方面不同)中比較SCP1、SCP5、SCP6和SCP7時,SCP7的設計導致最高水平的表達。SCP7序列作為SEQ.ID.NO:3列出。如先前所討論的,信使MA(mRM)的5'非翻譯區(5'UTR)的序列在來自真核mRNA的基因表達的轉錄后調節中起重要作用。5,UTR由從INR到起始曱硫氨酸密碼子的區域來定義;因此,在對于啟動子的DNA序列進行定義的情況下,它一般包括5,UTR序列。對于關于SCPl-TolloAlll和SCP7啟動子所列出的序列,這是這種情況。起因于SCPl-TolloMTEAlll啟動子的5,狙被稱為Alll5,UTR,并且作為SEQ.ID.NO:4列出;起因于SCP7啟動子的5,UTR被稱為Alll-75,UTR,并且作為SEQ.ID.NO:5列出。實施例6就在果蠅S2細胞中表達異源蛋白質來對合成的MRE轉錄激活子進行優化在自然界中,在近側啟動子中發現了轉錄激活子的不同組合。在此基礎上,制備了實施例3中所描述的GAGA和MRE元件的組合,以測定這種基序組合是否將會導致更高水平的轉錄和最終導致更高水平的表達。測試了兩種GAGA-MRE近側啟動子設計。它們如下GAGA-2XMRE和2XMRE-GAGA-2XMRE。利用在實施例3中所描述的載體pMT-X-KtAXho之中的/6al限制位點,將所述兩種GAGA-MRE近側啟動子克隆到緊在實施例3中所描述的各種核心啟動子之前的區域中。在用包含GAGA-DRE近側啟動子的質粒轉化并選擇了穩定的S2細胞系后,評估了H3HA-Ecto產物的表達。相比于不含GAGA元件的類似MRE構建體而言,向所利用的MREs添加GAGA元件并不增加或減少表達水平。在許多近側啟動子中,相同類型的多個轉錄因子結合位點常常在正向和反向這兩個方向中被發現。這對于在果蠅的Mtn基因家族的近側啟動子中發現的內源MREs來說是正確的。因此,在為了確定MREs的方向是否能夠改善近側啟動子的功能的努力中,使用正向和反向MRE序列的各種組合而制備了一系列合成的MRE近側啟動子。反向(R)MRE僅僅是實施例3中所描述的正向(F)MRE序列的反向互補物。反向MRE具有序列GCCGGCCTTO:患AGA(共有MRE序列為斜體并加有下劃線)。這一系列的新的近側啟動子由以各種組合進行排列的正向和/或反向MREs的3X重復組成。所述組合如下3XFMRE、3XRMRE、3XFMRE-3XRMRE、3XRMRE-3XFMRE、3XFMRE-3XFMRE和3XRMRE-3XRMRE。3XMRE重復單元之間的間隔為11個核苷酸。間隔子的序列為ATCAAACTAGA。如在實施例3中一樣,將包含MRE近側啟動子的正向和反向插入在表達載體pMT-X-KtAXho中的MtnA核心啟動子的上游。還構建了包含SCP1核心的類似的表達質粒。為了評估使用這些合成的MRE啟動子表達栽體的重組蛋白質的表達,將實施例1中所描述的H3HA-Ecto基因序列插入到所述載體中。將編碼H3HA-Ecto亞單位蛋白質的具有MRE近側啟動子的表達質粒用于轉化S2細胞。在用包含正向和反向MRE組合的質粒轉化和選擇出穩定的S2細胞系后,評估H3HA-Ecto產物的表達。因為這些構建體包含MREs,所以表達的評估要求,用Q.2mMCuS04來對培養物進行誘導,并且于26C培養7天。這些S2轉化體的分析揭示,當使用不同的正向和反向組合時,它們導致各種水平的表達,所有這些表達水平均大于實施例3的6XMRE。即使3XFMRE-3XFMRE也導致比6XMRE略微更高的表達(為~2倍)。這可能是由于長度為11個核苷酸的間隔子所造成的結果,這是6XMRE和3XFMRE-3XFMRE近側啟動子序列之間的唯一差異。由3XFMRE-3XRMRE所指導的表達大約等于3XFMRE-3XFMRE的那種。由3XRMRE-3XFMRE所指導的表達為6XMRE的大約3倍,和由3XRMRE-3XRMRE所指導的表達為6XMRE的大約4-5倍。因此,選擇3XRMRE-3XRMRE作為近側啟動子,以在進一步的構建體中使用,在所述構建體中將所選擇的調控元件相組合從而形成僅由合成的或經優化的元件組成的完整的表達盒,如實施例9中所描述的。合成的近側啟動子3XRMRE-3XRMRE的序列在SEQ.ID.NO:6中列出。實施例7就在果蠅S2細胞中表達異源蛋白質對合成的分泌信號進行設計和優化分泌信號肽在被靼向從細胞中進行分泌的蛋白質的表達中起重要作用。因此,在表達載體中使用最佳序列對于此類表達載體的利用來說是重要的,所述表達載體指導重組蛋白質在產生過程中分泌到培養基中。由Zhang等人(/.Ce/2e(2005)7:354-365)所提出的分泌信號優化的例子清楚地證明了分泌信號優化的益處;然而,這個特定的例子應用于植物,并且并不清楚改變成所描述的分泌信號可以31應用于其他真核細胞類型。因此,設計了一系列的三種分泌信號,以確定對于該序列的何種類型的改變將會導致蛋白質產物進入到經穩定轉化的S2細胞的培養基中的表達增加。合成的分泌信號的設計遵循矩P車表(matrixtable),其首先由vonHeijne(腸.Jc油Wes.(1986)14:4683-4690)描述,并且由Bendtsen等人(/.Wo/.(2004)340:783-795)進一步改進。所測試的第一組三種分泌信號在切割區域中都包含有相同的序列,在疏水性區域中包含有不相同的序列長度,和在堿性區域中包含有不相同數目的帶電荷的殘基。所測試的三種信號肽的氨基酸序列如下,其中名稱在括號中MRTIIA"LLTVSGAQG("1R4L")MRTIIALLL"TVSGAQG("1R5L,,)MUTIIALLLLLTVSGAQG("2R5L,,)。1R5L序列比1R4L序列長1個氨基酸(以斜體字體顯示的額外的"L"),因為增加了疏水性核的長度;而2R5L序列比1R5L序列長1個殘基(以斜體字體顯示的額外的"R,,),因為向堿性區域中添加了額外的帶電荷的殘基并同時保持了相同的疏水性核。1R4L、1R5L和2R5L序列的長度分別是17、18和19個氨基酸。這三種分泌信號在pMtaf表達載體中與H3HA-Ecto結構域基因有效連接。將利用這三種分泌信號來進行的H3HA-Ecto產物的表達和分泌與其中利用了tPA分泌信號的類似的H3HA-Ecto結構域構建體進行比較。在如實施例1中所描述的,轉化S2細胞、選擇穩定的細胞系以及就產物在培養基中的表達水平進行篩選后,確定了1R5L導致最高水平的表達,其為包含tPA的構建體的大約2倍,為包含2R5L的構建體的大約3倍,以及為包含1R札(等價于tPA)的構建體的大約2倍。此外,在1R5L序列中的偶然突變,Q至H(-2位置),導致表達的出乎意料的進一步增加,為原始1R5L序列的大約2倍。包含該H殘基的1R5L序列被稱為1R5L(H),并且用于在實施例9中所公開的最終表達載體之中。在這些分泌信號序列的設計中,將六核苷酸序列AACAAC置于緊在起始曱石克氨酸密碼子之前。這代表了由Cavener(#zyc.」c/&Wes.(1987)15:1353-1361)所描述的關于果蠅的共有Kozak序列。分泌信號序列的設計還評估了緊隨在切割位點處的G之后的T或S氨基酸殘基的使用。當選擇用于這些殘基的合適密碼子時,在G/T和G/S切割位點處的序列分別編碼限制性內切核酸酶切割位點)T/wI和5緒HI。這兩個切割位點序列良好地起作用。它們都提供了編碼所需蛋白質的序列的方便插入,以在同一個讀碼框中與分泌信號相融合。1R5L(H)這一經優化的分泌信號的序列為MRTIIALLLLLTVSGAHG。優選的在切割位點后的氨基酸是S。編碼該經優化的分泌信號的核苷酸序列以及相應的氨基酸序列分別作為SEQ.ID.NO:7和NO:8列出。實施例8就在果蠅S2細胞中表達異源蛋白質對備選的3,UTR元件進行評估基因和mRM的3,UTR分別在基因表達的轉錄和翻譯水平上起重要作用(由Kloc等人,Ce//(2002)108:533-544進行了綜述)。因此,在表達載體(其幫助改善多腺苷酸化,改善mRM從細胞核到細胞質的移位,改善mRNA穩定性,并且不干擾mRNA定位至粗面內質網)中使用最佳3,UTR序列對于指導產物釋放到培養基中的表達載體的利用來說是重要的。這是由于已建議的這些原因,在表達質粒的設計中,將3,UTR考>{|、用于優4匕(vanderVelden等人,5iofecA/2/《wes(2001)31:572-582)。果蠅pMTtPA表達質粒利用了病毒SV40早期3'UTR序列以用于終止和多腺苷酸化。雖然它是具有功能的,但看起來在使用這種SV40序列之上存在有改善的空間。例如,由Van0ers等人(/.h'ro/.(1999)2253-2262)報道了就在昆蟲系統中進行異源表達而對3,UTR進行的優化。他們用桿狀病毒3,UTR替代了SV40早期3,UTR,并且表達水平增加。雖然他們未剖析該新的3,UTR以確定哪個部分促成了表達的增加,但這項工作證明3'UTR中的改變可以改善異源蛋白質的表達。不幸的是,每種表達系統是獨特的,并且必需確定什么構成了用于在S2細胞中表達分泌型產物的最佳3,UTR。大多數真核3'UTR元件的主要特征是多腺苷酸化信號序列(polyA信號),其為AATAAA。polyA信號牽涉定義在細胞核中且在其上發生多腺苷酸化的新轉錄的mRNA的3,末端切割位點。在某些3,UTRs中,緊在切割位點下游觀察到保守序列。這些序列被稱為下游序列元件(DSE),并且被認為參與定義3,UTR切割位點。在pMTtPA載體和衍生物中存在的SV40早期3'UTR的長度為138個堿基,并且包含兩個推定的polyA信號。用于添加polyA尾的切割位點出現在核苷酸96處。在核苷酸96和138之間的序列中,存在被認為代表了將會幫助切割的DSE基序的序列。在為了鑒定將會導致更高水平的表達的3'UTR序列的努力中,評估了在許多果蠅基因上的3,UTRs。主要標準是,3,UTR的長度為大約IOO個核苷酸,并且源自編碼分泌型產物的基因。由Kirkpatrick等人("e/e(1995)143:147-154)所描述的果蠅殼多糖酶樣蛋白(CLP)是來自S2細胞的最豐富的分泌型蛋白質之一,并且滿足這些標準。該3,UTR不具有符合AATAAA序列的polyA信號。Kirkpatrick等人提出,polyA信號在AATATA或CATAAA處。在Kirkpatrick等人(1995)中,CLP3,UTR切割位點由將polyA序列添加至mRM所處的位置(核苷酸106)來定義。基于來自"rc^o/7力Z/aGeneCollection(BerkeleyDrosophilaGenomeProject,www.fruitfly.org/DGC/)的CLPcDM克隆LD21619,切割位點為進一步往下游7-11個核苷酸。Kirkpatrick等人的序列、LD21619的序列和來自果蠅基因組序列的相應序列之間的序列比對,鑒定出在Kirkpatrick等人的序列中在核苷酸43處的單個核苷酸錯誤,A變為G。這個變化導致獲得AAGAAAA("變體polyA信號")而不是AAAAAAA的序列。在CLP3'UTR中還存在有另一個AAGAAA序列。基于這些AAGAAA序列的位置,本發明人假定這些序列之一可能能夠充當polyA信號,其中第二個序列是最可能的。為了在表達載體中對CLP3'UTR進行最初測試,選擇長度為117個核苷酸的片段。這個片段包含所述兩個AAGAAA變體polyA信號。此外,基于不同來源的CLP序列的比對,這個117片段將會允許在所提出的切割位點中的任一個處進行切割,即接近所述兩個變體polyA信號中的每一個。將該117核苷酸CLP3,UTR序列添加至表達載體pMTtPAAXho,從所述表達載體中去除了SV40早期3,UTR。該117核苷酸CLP3,UTR的插入導致報道分子H3HA-Ecto蛋白的表達增加至1.5倍。在為了確定AAGAAA序列是否充當polyA信號的努力中,將所述兩個推定的信號中的G殘基誘變成T殘基,以匹配共有polyA序列。相比于具有SV40早期3,UTR的等價的表達載體而言,這個變化導致表達增加至3倍。在進一步的實驗中,使CLP3'UTR中的所述兩個推定的多腺苷酸化位點均進行突變,以使所述序列斷裂(第一個AAGAAA變成ACGCAA,而第二個AAGAAA變成AATGAA)。這些變化導致表達水平的急劇減少。這進一步支持了,這些推定的多腺苷酸化信號中的至少一個充當polyA信號。為了確定另外的下游序列是否是對于作為DSE起作用來說所必需的,基于在相應位置處的基因組序列,使3'UTR再延長20個核苷酸。延長的3,UTR使表達水平降低至1/2至1/3,這是出人意料的。基于這些結果,選擇具有兩個G至T突變的117核苷酸CLP-3,UTR,以用于構建組合了多個調控元件的表達載體(如實施例9中所描述的)。這種經優化的3,UTR導致更高水平的表達,并且被稱為Op-CLP-3,UTR。Op-CLP-3,UTR的序列作為SEQ.ID.NO:9列出。實施例9就在果蠅S2細胞中異源蛋白質的增強的表達來對包含調控元件的組合的表達載體進行評估為了形成用于在S2細胞中表達重組蛋白質產物的經優化的表達載體,需要下述5種調控元件中的每一種近側啟動子、核心啟動子、5,UTR、分泌信號和3,UTR。理想地,對這5種元件中的每一種進行優化,并且所述元件的組合將會導致獲得這樣的表達盒,所述表達盒導致更高水平的產物表達。在先前實施例中,鑒定出了下述經優化的元件合成的近側啟動子3XRMRE-3XRMRE,合成的核心啟動子SCPl-TolloMTEMll和SCP7,具有共有Kozak序列的截短的5,UTR,合成的分泌信號1R5L(H),和經優化的3,UTROp-CLP-3,UTR。作為用于評估這些經優化的調控元件的組合的第一個步驟,將1R5L分泌信號和Op-CLP-3,UTR分別用于替代在實施例3中所描述的pMT-X-KtAXho之中的tPA分泌信號和SV40早期3,UTR。包含這兩種經優化的元件的表達載體被稱為pHBI-5。將報道基因(例如,H3HA-Ecto)克隆到pHBI-5中,并且評估它們的表達。一般地,表達水平為對于克隆到pMT-X-KtAXho中的相同報道基因所看到的表達水平的1.5倍,這表明獨個地通過1R5L分泌信號和0p-CLP-3,UTR所看到的改善不是加和性的;然而,該表達水平仍高于由pMT-X-KtAXho載體所驅動的表達水平。裝配出包含所有5種元件的兩個表達盒。所述兩個盒在使用所述兩個核心啟動子中的哪一個核心啟動子方面不同。第一個盒包含SCP1-TolloMTEAlll核心啟動子,而第二個盒包含SCP7核心啟動子。這些表達盒分別稱為HBI-10和HBI-11。整個盒的序列在SEQ.ID.NO:10(HBI-10)和SEQ.ID.NO:11(HBI-11)中列出。圖1和2分別圖解說明了HBI-IO和HBI-11的近側啟動子和核心啟動子區域的序列,并且進行了充分注釋。HBI-10和HBI-11相對于pMTtPA的差異以表格形式概括在圖3中。將HBI-10和HBI-11表達盒插入到pBR322克隆載體中,以形成S2細胞表達栽體pHBI-10和pHBI-ll。關于這兩種S2細胞表達載體的質粒圖i普分別顯示在圖4和5中。對于利用pHBI-10和pHBI-11表達載體來表達H3HA-Ecto產物所進行的評估揭示,pHBI-11導致相對于pMT-X-KtA載體而言增加至大約3倍的表達水平,而pHBI-10導致相對于由pMT-X-KtA載體所指導的相同-HA-Ecto產物的表達而言增加至大約2倍的表達水平。參考文獻ApuyaN,KwokS,AlexandrovN,TatrinovaT,FangY,PennellR,LuYP,MedranoL,CookZ,FeldmannPromoter,PromoterControlElements,andCombinations,andusesThereof.U.S.PatentNo.:US2006/0090216Al.Pub.Date;Apr.27,1006.BendtsenJD,NielsenH,vonHeijneG,BrimalS.Improvedpredictionofsignalpeptides:SignalP3.0.JMolBiol2004;340:783-795.BernardAR,KostTA,OvertonL,CavegnC,YoungJ,BertrandM,Yahia-cherifZ,ChabertCandStillsA.RecombinantproteinexpressioninZ>oyo;/n7acellline:comparisonwiththebaculovirussystem.Cytotechnology.1994;15:139-144.BinL,TsingS,KosakaAH,NguyenB,OsenEG,BachC,ChanHandBamettJ.Expressionofhumandopaminefi-iiydroxylaseinZ)my叩M"Scloneider2cells.Biochem.丄1996;313:57-64.Butler,JEF,KadonagaJT.TheRNApolymeraseIIcorepromoter:akeycomponentintheregulationofgeneexpression.GenesDev.2002;16:2583-2592.CavenerDR,ComparisonoftheconsensussequenceflankingtranslationalstartsitesinDra^op/n'/"andvertebrates.NucleicAcidsResearch.1987;15(4》1353-1361.CulpJS,JohansenH,HellmigB.RegulatedexpressionallowshighlevelproductionandsecretionofHIVgpl加envelopeglycoproteininZ>as*op/n7"Schneidercells.Biotechnology.1991;9:173-177.DeoYfC,ParkEY.Multipleco陽transfectionandco-expressionofhumanP-1,3-N-acetylglucosaminyltransferasewithhumancalreticulinchaperonecDNAinasinglestepininsectcells.Biotechnol.Appl.Biochem.2006;43:129-135.EdelmanGM,MeechR,OwensGC,andJonesFS.Syntheticpromoterelementsobtainedbynucleotidesequencevariationandselectionforactivity.ProcNatlAcadSci.2000;97:3038-3043.FarrellPJ,LuM,PrevostJ,BrownC,BehieL,IatrouK.High-levelexpressionofsecretedglycoproteinsintransformedlepidopteraninsectcellsusinganovelexpressionvector.BiotechnologyandBioengineering.1998;60(6):656-663.FitzGeraldPC,SturgillD,ShyakhtenkoA,OliverB,VinsonC.ComparativegenomicsofDrarap/z//"andhumancorepromoters.GenomeBiology.2^)06;7:R53.GardsvollH,WernerF,SondergaardL,DanoK,PlougM.Characterizationoflow-glycosylatedformsofsolublehumanurokinasereceptorexpressininZVora////"Schneider5cellsafterdeletionofglycosylation-sites.聲roteinExpressionandPurification.2004;34:284-295.GershenzonNI,TrifonovED,loshikhesIP.ThefeaturesofDrosophilacorepromotersrevealedbystatisticalanalysis.BMCGenomics.7:161,GranokH,LeibovitchBA,ShafferCD,ElginSCR.Ga匿gaoverGAGAfactor*CurrentBiol.1995;5:238-241.HiroseF,YamaguchiM,HandaH,InomataY,MatsukageA.Novel8-basepairsequence(DrosophilaDNAreplication-relatedelement)andspecificbindingfactorinvolvedintheexpressionofDrosophilagenesforDNApolymeraseaandproliferatingcellnuclearantigen.JBiolChem.1993;268:2092-2099.37HofmannKJ,SchultzLD.Mutationsoftheoc-galactosidasesignalpepetidewhichgreatlyenhancesecretionofheterologousproteinsbyyeast.Gene.1991;101:105-111.IkonomouL,SchneiderY陽J,AgathosSN.Insectcellcultureforindustrialproductionofrecombinantproteins.Appl.Microbiol.Biotechnol.2003;62:1-20.Incardona,J.P.andT.L.Rosenberry.ConstructionandcharacterizationofsecretedandchimerictransmembraneformsofDmyopMaacetylcholinesterase:alargetruncationoftheC-terminalsignalpeptidedoesnoteliminateglycoinositolphospholipidanchoring.Mol.Biol,oftheCell1996;7:595-611.Ivey-Hoyle,M.RecombinantgeneexpressioninculturedZ)ra^p/7,7"me/awogoy/ercells.Curr.Opin.Biotechnol.1991;2:704-707.JohansenHA,vanderStratenR,SweetR,OttoE,MaroniG,RosenbergM.Regulatedexpressionathighcopynumberallowsproductionofagrowth-inhibitoryoncogeneproductinDmsop/z/'/"Schneidercells,。enesandDevelopment.1989;3:882-889.Juven-GershonT,HsuJY,KadonagaJT.PerspectivesontheRNApolymeraseIIcorepromoter.BiochemSoc,Trans.2006;34:1047-1050.Juven-GershonT,ChengS,KadonagaJT.Rationaldesignofasupercorepromoterthatenhancesgeneexpression.NatureMethods.2006;3:917-922.KadonagaJTandTGershon.Optimizedcorepromotersandusestherfor.ApplicationPCT/US2006/020394.Apppublished30November2006.Prioritydate25May2005(USprovisional60/684,4825.LimCY,SantosoB,BoulayT,DongE,OhlerU,KadonagaJT.TheMTE,anewcorepromoterelementfortranscriptionbykNApolymeraseII,GenesandDevelopment.2004;18:1606-1617.KirkpatrickRB,MaticoRE,McNultyDE,StricklerJE,RosenbergM.AnabundantlysecretedglycoproteinfromDms*op///a廳/awogasterisrelatedtomammaliansecretoryproteinsproducedinrheumatoidtissuesandbyactivatedmacrophages.Gene.199^;153:147-154.KirkpatrickRBandShatzmatiA.Z>tw//n7"S2Systemforheterologousgeneexpression.7nGeneExpressionSystems:UsingNaturefortheArtofExpression.JosephMFernandezandJamesHoefflereditors.AcademicPress.199$;Pp.289-330.KlocM,ZearfossNR,EtkinLD,MechanismsofsubcellularmRNAlocalization.CelL2002;108:533-544.KozakM.Featuresinthe5'non-codingsequencesofrabbitaandP-globiiimRNAsthataffecttranslation^efficiency,J.Mol.Biol.1994;235:95-110.KozakM.RegulationoftranslationviamRNAstructureinprokaryotesandeukaryotes.Gene.2005;361:13-37.KutachAK,KadonagaJT.ThedownstreampromoterelementDPEappearstobeaswidelyusedastheTATAboxinDrosophilacorepromoters.MoLCell.Biol.2000;20:4754-4764.LeLoirY,AzevedoV,OliveiraSC,FreitasDA,MiyoshiA,Bermudez-HumamnLG,NouailleS,RibeiroLA,LeclercqS,GabrielJE,GuimaraesVD,OliveiraMN,CharlierC,GautierM,LangellaP.ProteinsecretioninLactococcuslactis:andefficientwaytoincreasetheoverallheterologousproteinproduction.Microb.CellFact,2005;4:2.LiX,EastmanEM,SchwartzRJ,Draghia-AkliR.Syntheticmusclepromoters:activitiesexceedingnaturallyoccurringregulatorysequences.NatureBiotechnology.1999;17:241-245.LimCY,SantosoB,BoulayT,DongE,OhlerU,KadonagaJT.TheMTE,anewcorepromoterelementfortranscriptionbyRNApolymeraseII.GenesandDev.2004;18:1606-1617.LuM,JohnsonRR,IatrouK.Trans-activationofacellhousekeepinggenepromoterbytheIE1geneproductofbaculovirus.Virology.1996;218:103-113.LuM,FarrellPJ,JohnsonR,mIatrouK.Abaculovirus(BmNPV)repeatelementfunctionsasapowerfulconstitutiveenhancerintransfectedinsectcells.J.Biol.Chem.1997;272:30724-30728,ModisY,OgataS,ClementsD,HarrisonSC.Aligand-bindingpocketinthedenguevirusenvelopeglycoprotein.Proc.Natl.Acad.Sci.USA.2003;100:6986-6991.ModisY,OgataS,ClementsD,HarrisonSC.Structureofthedenguevirusenvelopeproteinaftermembranefusion.Nature,2004;427(6972):313-319.OhlerU,LiaoG,NiemannH,RubinGM,ComputationalanalysisofcorepromotersintheD簡—,7"genome.GenomeBiol.2002;3(12):research0087.1-00087.12.OlsenMK,RockenbachSK,FischerHD,HoogerheideJG,TomichCSC,StableproductionofananalogofhumantissueplasminogenactivatorfromculturedDtotop/h7gcells.Cytotechnology.1992;10:157-167.RudI,JensenPR,Naterstad,AxelssonL.Asyntheticpromoterlibraryforconstituitivegeneexpressionin丄a加6鎖7/top/aw加腦.Microbiology.2006;152:1011-1019.SchmetzerO,MoldenhauerG,RiesenbergR,PiresJR,SchlagP,PezzuttoA.2005.Qualityofrecombinantproteindeterminestheamountofautoreactivityagainstthetumor-associatedepithelialcelladhesionmoleculeantigen:lowfrequencyofantibodiesagainstthenaturalprotein.TheJournalofImmunology.2005;174:SchmidtFR.Recombinantexpressionsystemsinthepharmaceuticalindustry.ApplMicrobiolBiotechnol,2004;65:363-372.SchneiderIJ.CelllinesderivedfromlateembryonicstagesofZ)ras^;/u7(7艦/"wogoy脫J.Embryol.Exp.Morph.1972;27:353-365.SmaleST,KadonagaJT.TheRNApolymeraseIIcorepromoter.Annu*Rev.Biochem.2003;72:449-479.SoellerWC,OhCE,KornbergTB.IsolationofcDNAsencodingtheZ)my叩/n7"GAGAtranscriptionfactor.MolandCellBiol.1993;13:7961-7970,TomoeJ,KuskP,JohansenTE,JensenPR.Generationofasyntheticmammalianpromoterlibrarybymodificationofsequencesspacingtranscriptionfactorbindingsites.Gene.2002;297:21-32.vanderStratenAH,JohansenH,RosenbergM,SweetRW.IntroductionandconstitutiveexpressionofgeneproductsinculturesofDra^/MacellsusinghygromycinBselection.MethodsinMolAndCellBiol.1989;1:1-8.vanderVeldenAW,VoormaHO,ThomasAAM.Vectordesignforoptimalproteinexpression.BioTechniques.2001;31:572-582.vonHeijneG.Anewmethodforpredictingsignalsequencecleavagesites,NucAcidsRes,1986;14:4683-4690.vanOersMM,VlakJM,VoormaHO,Thomas,AAM.Roleofthe3'untranslatedregionofbaculovirusp10mRNAinhigh-levelexpressionofforeigngenes.JGenVirol.1999;80:2253-2262.WilsonIA,SkehelJJ,WileyDC.Structureofthehaemagglutininmembraneglycoproteinofinfluenzavirusat3人resolution.Nature1981;289:366-673.XuT,LogsdonNJ,WaterMR.Structureofinsect-cell-derivedIL-22.ActaCrystaUogrDBiolCrystaUogr.2005;61(pt7):942-50.ZhangL,LengQ,MixsonAJ.AlterationintheIL2signalpeptideaffectssecretionofproteinsz>v/fraand>v/vo.J.GeneMed.2005;7:354-365.40權利要求1.用于在培養的昆蟲細胞中表達和分泌異源蛋白質的表達載體,其包含表達盒,其中所述表達盒包含由近側和核心啟動子元件組成的合成啟動子,所述近側和核心啟動子元件在所述表達盒內有效連接,從而使得異源基因序列的插入將導致從用所述表達載體穩定轉化的細胞中的蛋白質表達。2.權利要求l的合成啟動子,其進一步包含SEQ.ID.所示的近側啟動子3XRMRE-3XRMRE序列,和SEQ.ID.NO:的合成的核心啟動子SCP1-TolloMTEAlll序列。3.權利要求l的合成啟動子,其進一步包含SEQ.ID.所示的近側啟動子3XRMRE-3XRMRE序列,和SEQ.ID.NO:的合成的核心啟動子SCP7序列。4.權利要求2或3的表達載體,其進一步包含與所述合成的近側啟動子和核心啟動子有效連接的合成的5,UTR元件,從而使得該組合能夠驅動異源蛋白質的表達。5.權利要求4的表達載體,其進一步包含與所述合成的近側啟動子、核心啟動子和5,UTR元件有效連接的合成的分泌信號序列,從而使得該組合能夠驅動異源蛋白質的表達和分泌。6.權利要求5的表達栽體,其進一步包含與所述合成的近側啟動子、核心啟動子、5,UTR和合成的分泌信號序列元件有效連接的合成的3,UTR序列,從而使得該組合能夠驅動異源蛋白質的表達和分泌。7.權利要求4的合成的5,UTR,其包含SEQ.ID.NO:4中所示的序列。8.權利要求4的合成的5,UTR,其包含SEQ.ID.NO:5中所示的序列。9.權利要求5的合成的分泌信號序列,其包含SEQ.ID.NO:7中所示的1R5L(H)編碼序列。10.權利要求6的合成的3,UTR,其包含SEQ.ID.NO:9中所示NO:6中2中所示NO:6中3中所示的OpCLP3'UTR序列。11.用于在培養的昆蟲細胞中表達和分泌異源蛋白質的表達載體,其包含SEQ.ID.NO:10中所示的表達盒。12.用于在培養的昆蟲細胞中表達和分泌異源蛋白質的表達載體,其包含SEQ.ID.MO:ll中所示的表達盒。13.權利要求l、2、3、4、5、6、7、8、9、10、11和12的表達載體的用途,其中所述昆蟲細胞為果蠅細胞。14.權利要求l、2、3、4、5、6、7、8、9、10、11和12的表達載體的用途,其中所述昆蟲細胞為果蠅S2細胞。全文摘要本發明旨在用于在昆蟲細胞中表達天然樣異源蛋白質的經優化的表達載體。本發明的組成為代表了表達載體的元件的核苷酸序列,當所述元件相組合時,導致異源蛋白質的增強的表達和分泌。所述元件包括定義了在昆蟲細胞中有功能的轉錄激活子、核心啟動子、分泌信號和3’非翻譯區的序列。在經優化的載體中所包含的元件都是合成得到的,或者為天然存在的昆蟲序列的經修飾的變體。當編碼蛋白質的核苷酸序列與所述載體有效連接時,所述表達載體可用于表達天然樣蛋白質。這些載體可以用于轉化昆蟲細胞,所述昆蟲細胞隨后可以進行培養以產生所需蛋白質產物。表達出的天然樣蛋白質可以用于需要大量高品質蛋白質的診斷、疫苗或其他應用中。文檔編號C12Q1/68GK101688246SQ200880021845公開日2010年3月31日申請日期2008年4月28日優先權日2007年4月26日發明者C·威克斯-利維,D·E·克萊門茨,G·V·L·王申請人:夏威夷生物技術公司