專利名稱::啟動子的制作方法啟動子本發明為蛋白質表達和細胞選擇領域。本文報道了具有弱啟動子強度和因此有限表達有效連接的編碼核酸的啟動子。
背景技術:
:蛋白質的表達是活細胞中的基本過程。蛋白質表達需要的所有信息均由單個核酸提供。該核酸不僅含有蛋白質M酸序列的信息,其還提供所需的調節信息(例如,核糖體結合位點、轉錄起始和終止信號、剪接信號、增強子元件等),包括啟動子/啟動子序列。啟動子是調節例如編碼多肽的核酸(其有效連接啟動子)轉錄為前mRNA的量的核酸。其為轉錄控制元件,定位在有效連接編碼序列5,末端的RNA聚合酶起始位點附近。從對SV40早期啟動子的分析已知,在啟動子由7-20堿基對組成的區段中含有轉錄激活子的識另,J/結合位點。一個區段是RNA合成的起始位點,例如眾所周知的TATA框。定位在RNA合成起始位點5,即上游大約30-110堿基對處的其他區段定義了轉錄起始的頻率。啟動子至少需要在特定位點并以指定方向(即,5,到3,方向)起始RNA合成的一個區段。。^口^;^^Hlac-lpp、ara-、lac一、tac畫、trc-、trp-、phoA-、Pbad-、入pl-、lpp-和T7-啟動子。SV40啟動子是來自猴(空泡)病毒40基因組的核酸序列。對于真核或原核細胞中異源多肽的重組產生,通常將一個或多個表達質粒引入所述細胞中。所述一個或多個表達質粒包含用于表達異源多肽的表達盒,并還包含用于表達選擇性標記的表達盒,所述選擇性標記為選擇表達所述異源多肽的轉染細胞所需。異源多肽和選擇性標記的合成均需要部分細胞表達裝置的能力。因為目標主要是產生異源多肽,所以細胞表達裝置的絕大多數可得能力應該分配來表達編碼異源多肽的核酸。僅少量應該用于表達選擇性標記。表達能力的這種分配通過相應啟動子的強度來完成。更強的啟動子是更多有效連接的核酸進行了轉錄并因此進行了翻譯。因此,存在具有可調節或可減小啟動子強度的啟動子的需要。Taylor,W.E.等(Endocrinol.137(1996)5407-5414)報道了人干細胞因子啟動子缺失變體。在美國專利申請US2007/0092968中才艮道了用于癌治療基因的腫瘤選擇性和高效表達的新hTMC啟動子和載體。Fromm等(J.Mol.Appl.Gen.1(1982)457-481和ibid2(1983)127-135)才艮道了SV-40早期區啟動子的缺失作圖和缺失突變體。在US6,399,571中報道了殼多糖酶殼多糖結合片段。WO99/62927報道了結締組織生長因子-4。發明概述本發明的第一方面是具有,即具有核酸序列SEQIDNO:02或SEQIDNO:03或SEQIDNO:04或SEQIDNO:06的啟動子。在一個實施方案中,所述啟動子具有核酸序列SEQIDNO:04。本發明的笫二方面是具有核苷酸序列SEQIDNO:04,并當有效連接編碼綠色熒光蛋白(GFP)的核酸序列SEQIDNO:07時,相比于野生型SV40啟動子SEQIDNO:05具有20%或更^f氐啟動子強度的核酸。本發明的其他方面是選擇細胞的方法,所述方法包括這樣順序的以下步驟a)用核酸轉染真核細胞,所述核酸包含i)包含編碼異源多肽的核酸的第一個表達盒,ii)包含第一個核酸SEQIDNO:04和編碼選擇性標記的第二個核酸的第二個表達盒,由此所述第一個核酸有效連接第二個核酸,b)在適合于非轉染真核細胞生長的條件下培養所述轉染細胞,c)選擇在步驟b)中繁殖的細胞,并同時i)在選擇性培養條件下繁殖,或ii)表達戶斤述選擇'l"生才示i己。在本發明該方面的一個實施方案中,真核細胞是哺乳動物細胞。在優選的實施方案中,所述哺乳動物細胞是CHO細胞、BHK細胞或PER.C6細胞、或HEK細胞、或Sp2/0細胞。在另一實施方案中,所述異源多肽M疫球蛋白,或免疫球蛋白片段,或免疫球蛋白綴合物。在一個實施方案中,所述選擇性標記是新霉素-氨基糖苷磷酸轉移酶,或潮霉素-磷酸轉移酶,或dLNGFR或GFP。本發明的第四方面是用于表達異源多肽的方法,其包括這樣順序的以下步驟a)用包含表達盒的核酸轉染哺乳動物細胞,所述表達盒包含有效連接編碼異源多肽的第二個核酸的第一個核酸SEQIDNO:02或SEQIDNO:03或SEQIDNO:04或SEQIDNO:06,b)選擇步驟a)中轉染的細胞,c)在適合于所述異源多肽表達的情況下培養所選擇的細胞,d)從所述細胞或所述培養基中回收異源多肽。在本發明該方面的一個實施方案中,哺乳動物細胞是CHO細胞、BHK細胞、或PER.C6細胞、或HEK細胞、或Sp2/0細胞。在另一實施方案中,第一個核酸是SEQIDNO:04。在另一實施方案中,第二個核酸編碼免疫球蛋白,或免疫球蛋白片段,或免疫球蛋白綴合物。在另一實施方案中,所述核酸包含編碼選擇性標記的第二個表達盒。發明詳述本發明報道了具有核苷酸序列SEQIDNO:02或SEQIDNO:03或SEQIDNO:04或SEQIDNO:06的新啟動子核酸。用于進行本發明的方法和技術為本領域技術人員所知并描述于,例如A謂bel,F.M.,編輯,CurrentProtocolsinMolecularBiology,I至III巻(1997),和Sambrook等,MolecularCloning:ALaboratoryManual,第二版,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.(1989)7中。已知本領域技術人員能夠使用重組DNA技術產生核酸和/或多肽的許多衍生物。例如可通過在個別位置或幾個位置中替代、改變、交換、缺失或插入來修飾此類衍生物。例如可通過位點定向誘變進行修飾或衍生。本領域技術人員可容易地進行這種修飾(參閱例如Sambrook,J.等,MolecularCloning:Alaboratorymanual(1999)ColdSpringHarborLaboratoryPress,NewYork,美國)。重組凈支術的4吏用4吏得本領域4支術人員能夠用異源核酸轉化多種宿主細胞。"啟動子,,指核酸,即多核苷酸序列,其控制有效連接的核酸的轉錄。啟動子可包括RNA聚合酶結合和轉錄起始的信號。所用一個或多個啟動子在宿主細胞的細胞類型中將是有功能的,在所述宿主細胞中涉及有效連接核酸的表達。大量啟動子,包括來自多種不同來源的組成型、誘導型和阻抑型啟動子為本領域所熟知(并在數據庫如GenBank中得以鑒定)。它們可克隆多核苷酸獲得或在克隆多核苷酸內獲得(來自例如保藏中心,如ATCC及其他市售或個體來源)。"啟動子"包含指導例如有效連接的結構基因進行轉錄的核苷酸序列。通常,啟動子位于基因的5'非編碼區或5'非翻譯區(5,UTR),靠近結構基因的轉錄起始位點。在轉錄起始起作用的啟動子內的序列元件特征通常在于共有核苷酸序列。這些序列元件包括RNA聚合酶結合位點、TATA序列、CAAT序列、分化特異性元件(DSE;McGehee,R.E.等,Mol.Endocrinol.7(1993)551)、環腺苷酸應答元件CRE)、血清應答元件(SRE;Treisman,R.,SeminarsinCancerBiol.1(19卯)47)、糖皮質激素應答元件(GRE),和用于其他轉錄因子如CRE/ATF(O'Reilly,M.A.等,J.Biol.Chem.267(1992)19938)、AP2(Ye,J"等,J.Biol.Chem.269(1994)25728)、SP1的結合位點、cAMP應答元件結合蛋白(CREB;Loeken,M.R"GeneExpr.3(1993)253-264)和/Mt苷酸因子(一般參閱,Watson等編輯,MolecularBiologyoftheGene,第4版,TheBenjamin/CummingsPublishingCompany,Inc.1987,和Lemaigre,F.P.和Rousseau,G.G,Biochem.J.303(1994)1-14)。如果啟動子是誘導型啟動子,那么響應誘導劑的轉錄速率提高。相反,如果所迷啟動子是組成型啟動子,那么轉錄速率不受誘導劑的調節。阻抑型啟動子也是已知的。例如,c-fos啟動子在生長激素結合到細胞表面其受體上后被特異性激活。可通過人工雜合啟動子完成四環素(tet)調節的表達,所述啟動子由例如CMV啟動子后接兩個Tet-操縱子位點組成。Tet-阻抑物結合兩個Tet-操縱子位點并阻斷轉錄。加入誘導物四環素后,Tet-阻抑物從Tet-操縱子位點上釋放,轉錄繼續進行(Gossen,M.和Bujard,H"Proc.Natl.Acad.Sci.美國89(1992)5547-5551)。對于其他誘導型啟動子,包括金屬石危蛋白和熱激啟動子,參閱例如Sambrook,等(上文),和Gossen,M.,等,Curr.Opin.Biotech.5(1994)516-520。已經鑒定為強啟動子用于高水平表達的真核啟動子是SV40早期啟動子、腺病毒主要晚期啟動子、小鼠金屬硫蛋白-I啟動子、勞斯肉瘤病毒長末端重復、中國倉鼠延伸因子loc(CHEF-1,參閱例如US5,888,809)、人EF-la、泛素和人巨細胞病毒立即早期啟動子(CMVIE)。增強子(即,在啟動子上作用增強轉錄的順式作用DNA元件)在提高單獨用啟動子獲得的表達水平中與啟動子連接發揮作用是必需的,并可作為轉錄調節元件被包括在內。通常,含有啟動子的多核苷酸區段也將包括增強子序列(例如,CMV或SV40)。如此處所用,術語"核酸"是由各核普酸組成的多聚物,即多核苦酸。它指天然發生的,或部分或完全非天然發生的核酸,其例如編碼可重組產生的多肽。核酸可由通過化學手段分離的或合成的DNA片段構成。核酸可整合到另一核酸中,例如整合到表達質粒或宿主細胞的基因組/染色體中。質粒包括穿梭和表達栽體。通常,所述質粒還將包含原核增殖單位,其包含分別用于在細菌中栽體復制和選擇的復制起始區(例如ColEl的復制起始區)和選擇性標記(例如,青霉素或四環素抗性基因)。如本發明中所用的術語"啟動子強度"和其語法上的等同物指啟動子在有效連接的核酸的轉錄中的功效。如果與野生型SV40啟動子SEQIDNO:05的啟動子強度相比,啟動子的啟動子強度可以高,即其可以從卯%到高于100%,或中等,即可以從40。/。到^f氐于90%,或j氐,即其可^直至低于40%。可通過比較有效連接所討論的啟動子的異源多肽的表達量與同一細胞類型中有效連接野生型SV40啟動子的該異源多肽的表達量來測定該值。這可以例如通過ELISA測定,測定轉染有表達盒的CHO-或HEK-細胞中異源多肽的表達量來完成,所述表達盒由所討論的啟動子有效連接的編碼異源多肽的核酸組成。在轉染有表達盒的同一細胞系中通過比較該量與同一異源多肽的表達量,即比較具有相同表ii^粒(其中僅一個啟動子被改變)的同一細胞中異源多肽的量來測定相對啟動子強度,所述表達盒與由野生型SV40啟動子有效連接的編碼同一ELISA測定確定的異源多肽的核酸組成。如本申請中所用的術語"野生型SV40啟動子,,表示核酸SEQIDNO:05,其對應于SV40基因組核酸SEQIDNO:01的位置72-411。"有效連接"指兩種或更多種組分的并置,其中所述組分處于允許它們以其期望方式起作用的關系中。例如,如果其順式起作用以控制或調節連接的編碼序列的轉錄,那么啟動子和/或增強子有效連接編碼序列。通常,但不是必須的,"有效連接的"DNA序列是相鄰的,并且需要時連接兩個蛋白質編碼區,如相鄰并在閱讀框內的分泌前導序列/信號序列和多肽。然而,盡管有效連接的啟動子通常位于編碼序列的上游,但其不必與其相鄰。增強子不必相鄰。如果所迷增強子增強編碼序列的轉錄,那么其有效連接編碼區。有效連接的增強子可以位于編碼序列的上游、中間或下游,和距離啟動子相當遠的位置。如果聚腺普酸化位點以轉錄通過編碼區至聚腺苷酸化序列進4亍的方式定位在編碼序列的下游末端,那么其有效連接編碼序列。通過本領域已知的重組方法,例如使用PCR方法,和/或通過在便利的限制性酶切位點上連接來完成連接。如果不存在便利的限制性酶切位點,那么根據一般實踐使用合成的寡核苷酸銜接頭或接頭。在本發明范圍內,可基本上利用本領域所知的任何種類的轉染方法獲得轉染細胞。例如,可通過電穿孔或顯微注射將核酸引入細胞中。或者,可寸吏用脂轉染試劑如FuGENE6(RocheDiagnosticsGmbH,德國)、X-tremeGENE(RocheDiagnosticsGmbH,德國)和LipofectAmine(InvitrogenCorp.,美國)。或者,可通過基于逆轉錄病毒、慢病毒、腺病毒和腺相關病毒的適當病毒栽體系統將核酸引入細胞中(Singer,O.,Proc.Natl.Acad.Sci,美國101(2004)5313-5314)。術語"細胞"或"宿主細胞"指能夠或可以向其中引A/轉染例如編碼異源多肽或構成shRNA的核酸的細胞。宿主細胞包括原核細胞,其用于繁殖栽體/質粒,和真核細胞,其用于表達核酸。在一個實施方案中,真核細胞是哺乳動物細胞。在另一實施方案中,所述哺乳動物宿主細胞選自如下的哺乳動物細胞CHO細胞(例如CHOKl或CHODG44)、BHK細胞、NS0細胞、SP2/0細胞、HEK293細胞、HEK293EBNA細胞、PER.C6細胞和COS細胞。在其他實施方案中,所述哺乳動物細胞選自雜交瘤、骨髓瘤和嚙齒動物細胞。骨髓瘤細胞包含大鼠骨髓瘤細胞(例如YB2),和小鼠骨髓瘤細胞(例如NS0、SP2/0)。用于藥學應用的多肽在一個實施方案中在哺乳動物細胞如CHO細胞、NS0細胞、Sp2/0細胞、COS細胞、HEK細胞、BHK細胞、PERC6細胞等中產生。為了宿主細胞的發酵并因此為了目的多肽的表達,使用培養基。今天CHO細胞在實驗室中小規^^莫或在生產過程中大規模地廣泛用于藥物多肽的表達。由于其廣泛的分布和用途,CHO細胞的特征和遺傳背景是眾所周知的。因此,管理機構認可CHO細胞用于產生應用于人的治療蛋白質。在一個實施方案中,所述哺乳動物細胞是CHO細胞。"表達盒"指核酸,其含有宿主細胞中至少含有的結構基因進行表達和分泌所需的元件。核酸的特征同樣在于其由單個核苷酸組成的序列,或由核酸分子編碼的氨基酸序列。"基因"表示核酸,其為例如染色體或質粒上的區段,能夠影響肽、多肽或蛋白質的表達。除了編碼區,即結構基因,基因還包含其他功能元件,例如,信號序列、啟動子、內含子和/或終止子。"結構基因"表示不含信號序列的基因區域,即編碼區。如此處所用,術語"表達"指細胞內發生的轉錄和/或翻譯。可在細胞中存在的相應mRNA量的l^出上測定宿主細胞中期望產物的轉錄水平。例如,可通過PCR或通過Northern雜交對從所選核酸轉錄的mRNA進行定量(參閱Sambrook等,MolecularCloning:ALaboratoryManual,ColdSpringHarborLaboratoryPress(1989))。可通過多種方法,例如通過ELISA,通過測定蛋白質的生物活性,或通過使用不依賴該活性的測定,如使用識別并結合所述蛋白質的抗體的Western印跡或放射免疫測定對由所選核酸編碼的蛋白質進行定量(參閱Sambrook,等,1989,上文)。如此處所用,"調節元件"指編碼目的多肽的核酸序列進行轉錄和/或翻譯所需的順式存在的核苷酸序列。轉錄調節元件通常包含待表達的核酸序列上游的啟動子、轉錄起始和終止位點和聚腺苷酸化信號序列。術語"轉錄起始位點,,指核酸中對應于摻入初級轉錄物即mRNA前體的笫一個核苷酸的核普酸;所述轉錄起始位點可與所述啟動子序列重疊。術語"轉錄終止位點"指通常在待轉錄目的基因3'末端處呈現的核苷酸序列,其引起RNA聚合酶終止轉錄。所述聚腺苷酸化信號序列或多A添加信號為在真核mRNA3'末端的特定位點進行切割并在細胞核中向切割的3'末端轉錄后添加約100-200個腺苦酸(聚A尾巴)的序列提供信號。所迷聚腺香酸化信號序列可包括位于切割位點上游約10-30個核苷酸的共有序列AATAAA。"多肽"是通過肽鍵連接的M酸殘基的聚合物,其可以是天然產生的或合成的。低于約20個氨基酸殘基的多肽可稱作"肽"。包含兩條或多條M酸鏈或包含長度為100個M酸或更多個M酸的M酸鏈的多肽可稱作"蛋白質"。多肽或蛋白質也可包含非肽組分,如糖類基團或金屬離子。可通過產生所述蛋白質的細胞向蛋白質添加糖類和其他非肽成分,并且其根據細胞類型而有所變化。蛋白質和多肽此處以其氨基酸骨架結構定義;如添加糖類基團通常不進行明確說明,但也存在。"異源DNA"或"異源多肽"指并非給定宿主細胞中天然存在的DNA分子或多肽,或DNA分子群或多肽群。對特定宿主細胞異源的DNA分子可含有來自宿主細胞種類的DNA(即內源DNA),只要該宿主細胞來源DNA與非宿主細胞來源DNA(即外源DNA)組合。例如,認為含有編碼多肽的非宿主DNA區段的DNA分子是異源DNA分子,所述非宿主DNA區段有效連接包含啟動子的宿主DNA區段。相反,異源DNA分子可包含12與外源啟動子有效連接的內源結構基因。非宿主DNA分子編碼的肽或多肽是"異源"肽或多肽。術語"選擇性標記"表示允許在相應"選擇劑"的存在下特異性選擇或不選擇攜帶該核酸的細胞的核酸。有用的陽性選擇性標記是例如抗生素抗性基因。所述選擇性標記允許在相應選擇劑的存在下選擇轉化有該選擇性標記的細胞;非轉化細胞在選擇性培養條件下,即在選擇刑存在下不能夠生長或存活。選擇性標記可以是陽性的、陰性的或雙功能的。陽性選擇性標記允許選擇攜帶所述標記的細胞,而陰性選擇性標記允許特異性排除攜帶標記的細胞。通常,選擇性標記將賦予對藥物的抗性或補償細胞中的代謝或分解代謝缺陷。對真核細胞重要的選擇性標記包括,例如^tJ4t苷砩酸轉移酶(APH),如潮霉素磷酸轉移酶(HYG)、新霉素和G418APH、二氫葉酸還原酶(DHFR)、胸苷激酶(TK)、谷氨酰胺合成酶(GS)、天冬酰胺合成酶、色氨酸合成酶(選擇劑-引咪)、組氨醇脫氫酶(選擇劑組氨醇D),和提供嘌呤霉素、博萊霉素、腐草霉素、氯霉素、Zeocin和霉酚酸抗性的基因。其他選擇性標記才艮道于WO92/08796和WO94/28143。如本發明所用,術語"表達裝置"表示細胞的酶、輔助因子等的總和,其參與從核酸或基因(即也稱為"基因表達裝置")轉錄開始到核酸編碼的多肽進行翻譯后修飾的過程。所述"表達裝置"例如包括步驟DNA轉錄成前mRNA、前mRNA剪接成成熟mRNA、mRNA翻譯成多肽并且所述多肽進行翻譯后修飾。術語"在適合于異源多^達的條件下"表示用于培養表達異源多肽域技術人員也已知的是這些條件可根據所培養的哺乳動物細胞的類型和所表達的蛋白質的類型而變化。通常,所述哺乳動物細胞在例如20。C到40r之間的溫度下,以0.1升到107升的體積培養足以允許有效蛋白質產生的時間,例如4到28天。術語"在適合于非轉染細胞生長的條件下"表示通常用于培養同一細胞系的非轉染細胞的條件。這些M是已知的或可通過本領域技術人員容易地測定。如本申請中所用,術語"回收異源多肽,,表示沉淀、鹽析、超濾、滲濾、冷凍干燥、溶劑體積減少,以獲得濃縮的溶液,或層析。通常層析方法用于分離和純化多肽。充分建立了不同的方法并廣泛用于蛋白質回收和純化,如具有微生物蛋白質(例如A蛋白或G蛋白親和層析)的親和層析、離子交換層析(例如陽離子交換(羧曱基樹脂)、陰離子交換(M乙基樹脂)和混合態交換)、親硫吸附層析(例如具有P巰基乙醇和其他SH配基)、疏水性相互作用或芳香族吸附層析(例如具有苯基瓊脂糖、氮雜-arenophilic樹脂或m-^苯基硼酸)、金屬螯合親和層析(例如具有Ni(II)-和Cu(II)-親和金屬)、大小排阻層析和電泳方法(如凝膠電泳、毛細管電泳)(Vijayalakshmi,M.A.,Appl.Biochem.Biotech.75(1998)93-102)。術語"免疫球蛋白"指基本上由免疫球蛋白基因編碼的一種或更多種多肽組成的蛋白質。公認的免疫球蛋白基因包括不同的恒定區基因以及多種免疫球蛋白可變區基因。免疫球蛋白可以以多種形式存在,包括例如Fv、Fab和F(ab)2以及單鏈(scFv)或雙體(例如Huston,J.S.等,Proc.Natl.Acad.Sci.美國85(1988)5879-5883;Bird,R.E.等,Science242(1988)423-426;綜述,Hood等,Immunology,BenjaminN.Y.,第2版(1984);和Hunkapiller,T.和Hood,L.,Nature323(1986)15-16)。免疫球蛋白通常包含兩條所謂的輕鏈多肽(輕鏈)和兩條所謂的重鏈多肽(重鏈)。每條重鏈和輕鏈多肽均含有可變域(可變區)(通常為多肽鏈的氨基端部分),其包含能夠與抗原相互作用的結合區。每條重鏈和輕多肽鏈均包含恒定區(通常為羧基末端部分)。重鏈的恒定區介導抗體結合i)攜帶Fey受體(FcyR)的細胞,如吞噬細胞,或ii)攜帶也稱為Brambell受體的新生Fc受體(FcRn)的細胞。其也介導結合一些因子,包括經典的補體系統的因子,如組分(Clq)。免疫球蛋白輕鏈或重鏈的可變域依次包含不同的區段,即四個框架區(FR)和三個高變區(CDR)。"免疫球蛋白片段"表示包含結構域組中至少一個結構域的多肽,所述結構域組包含免疫球蛋白重鏈的可變域、CHl結構域、鉸鏈區、Ch2結14構域、CH3結構域、CH4結構域或免疫球蛋白輕鏈的可變域或CL結構域。也包含的是其衍生物和變體。此外,可存在其中一個或多個氨基酸或M酸區域缺失的可變區。"免疫球蛋白綴合物"表示通過肽鍵與其他多肽綴合的多肽,其包含免疫球蛋白重鏈或輕鏈的至少一個結構域。所述其他多肽是非免疫球蛋白肽,如激素、生長受體、抗融合肽(antifusogenicpeptide)等。本發明報道了具有核苷酸序列SEQIDNO:02或SEQIDNO:03或SEQIDNO:04或SEQIDNO:06的啟動子。用于鑒定潛在高產細胞克隆的方法是通過內部核糖體進入位點(IRES)連接選擇性標記基因和編碼異源多肽的結構基因的表達。在該設計下,所述異源多肽的表達可與所述選擇性標記的表W目關聯。另一方法U因擴增。用載體/質粒轉染其中缺少酶,二氫葉酸還原酶(DHFR)的細胞,所述載體/質粒含有用于表達DHFR蛋白質的第一個表達盒和用于表達異源多肽的第二個表達盒。通過使用缺少甘氨酸的培養基,建立次黃嘌呤和胸腺嘧咬核苷選擇性培養條件。為了擴增,加入DHFR抑制劑氨甲蝶呤(MTX)(Kaufman,R.J"等,JMol.Biol.159(1982)601-621;US4,656,134)。通常可使用任何類型的基因,其表達產物作為富集和選擇轉染子的標記定位在細胞表面/可在細胞表面被檢測。低親和力神經生長因子受體的截短形式dLNGFR,因此對信號轉導而言為滅活的,其在細胞表面上表達,并已經證明為對細胞生物學分析極其有用的標記(Philipps,K.等,Nat.Med.2(1996)1154-1156和Machl,A.W.等,Cytometry29(1997)371-374)。為了必要地減少目的異源多肽的產生,選擇產生異源多肽的細胞,即成功轉染的細胞所需的選擇性標記的表達應該盡可能低,但仍然可檢測。目前已經驚奇地發現該需要可通過本發明的啟動子得以滿足。通過使用本發明的啟動子,可選擇這樣的細胞,其相比于在相同條件下選擇的并不使用本發明啟動子的細胞表達更高水平的異源多肽。已經驚奇地發現使用本發明的啟動子,可在降低開支的情況下分離表達異源多肽的細胞。此外,已經發現通過使用本發明的啟動子,相比于在相同條件和選擇劑濃度的情況下通過^f吏用全長SV40啟動子選擇的細胞,可選擇以更高水平表達異源多肽的細胞。如本申請中所用,術語"5,縮短的SV40啟動子"表示野生型SV40啟動子,其中已經刪除了核酸序列5,末端一定數量的連續核苷酸。因此,本發明才艮道了具有,即具有核酸序列SEQIDNO:02的啟動子。SEQIDNO:02包含野生型SV40啟動子SEQIDNO:05的核苷酸61到348,即核苷酸l到60已經被刪除。具有啟動子SEQIDNO:02的制備示于實施例1中。本發明還報道了具有,即具有核酸序列SEQIDNO:03的啟動子。SEQIDNO:03對應于野生型SV40啟動子SEQIDNO:05的核苷酸130到348,即核苷酸1到129已經被刪除。具有啟動子SEQIDNO:03的制備示于實施例2中。本發明最后凈艮道了具有,即具有核酸序列SEQIDNO:04的啟動子。SEQIDNO:04是野生型SV40啟動子SEQIDNO:05的核普酸177到348,即核苷酸l到176已經纟皮刪除。具有啟動子SEQIDNO:04的制備示于實施例3中。本發明最后報道了具有,即具有核酸序列SEQIDNO:06的啟動子。SEQIDNO:06由野生型SV40啟動子SEQIDNO:05的核苷酸203到348組成,即核苷酸1到202已經被刪除。為了測定具有SEQIDNO:02到04和06的核酸序列的啟動子的啟動子強度,已經產生了表達質粒,其中每種不同啟動子有效連接編碼GFP(綠色熒光蛋白,SEQIDNO:07)的核酸。如從圖7a)到c)可見,野生型SV40啟動子核酸中核苷酸的5,缺失降低了啟動子強度。啟動子SEQIDNO:02與全長野生型SV40啟動子具有大致相同的強度。啟動子SEQIDNO:03和04分別具有大約56%和大約19%的啟動子強度。因此,與野生型SV40啟動子相比,使用本發明的啟動子,有效連接到其上的核酸的表達可被降低或限制。在猴病毒40中是前面為兩個72bp重復的SV40啟動子。在本發明的一個實施方案中是第一個72bp重復缺失,而第二個72bp保留。在一個實施方案中,本發明的核酸包含核酸SEQIDNO:04前面的核酸SEQIDNO:14。在另一實施方案中,本發明的核酸包含猴病毒40啟動子SEQIDNO:14的第二個72bp重復。在本發明的核酸的其他實施方案中,所迷SV40啟動子的第一個72bp重復缺失,而SV40啟動子的第二個72bp重復保留。這可用于異源多肽的表達。在該實施方案中是本發明的啟動子(其僅含有野生型SV40啟動子的第二個72bp重復)有效連接編碼選擇性標記的核酸。在該啟動子的啟動子強度降低的情況下,選擇性標記的表達降低,而通過使用例如野生型SV40啟動子SEQIDNO:05維持了異源多肽的表達。因此,已經發現相比于其中編碼選擇性標記的核酸以及編碼目的異源多肽的核酸均有效連接野生型啟動子的構建體,有效連接編碼選擇性啟動子,例如SV40或CMV的組合導致異源多肽的表達升高。在穩定細胞克隆中,編碼選擇性標記的核酸和編碼異源多肽的核酸,以及其相應的啟動子共同整合到所述細胞的基因組中。因為基因組中的整合定位是隨機過程,通常進行選擇步驟。在該選擇步驟中,僅選擇這樣的細胞,其中相連核酸整合到基因組中并位于轉錄高度活化位點附近。通過選擇步驟去除已經整合遠離該位點的核酸或已經整合不同位點的兩種核酸的細胞。本發明的另一方面是由核斷列SEQIDNO:02或SEQIDNO:03或SEQIDNO:04或SEQIDNO:06組成的核酸,當有效連接核酸SEQIDNO:07時,其具有野生型SV40啟動子SEQIDNO:05的啟動子強度的卯%或更高,或40%到{氐于90%,或^f氐于40%的啟動子強度。當它們各自有效連接核酸SEQIDNO:07時,在優選的實施方案中具有核酸序列SEQIDNO:04并且啟動子強度是野生型SV40啟動子SEQIDNO:05的啟動子強度的20%或更低的核酸。因為本發明的核酸和啟動子分別各自具有降低的啟動子強度,即當與野生型SV40啟動子相比時,有效連接到其上的核酸以減少的量或減少的17速率進行轉錄,它們用于多種應用中。例如,它們可用于促進有效連接的選擇性標記的表達,在不需要大部分細胞蛋白質表達裝置能力的情況下允許選擇攜帶該選擇性標記的細胞。由此不負面影響例如共表達異源多肽的表達。本發明的另一方面是選擇表達異源多肽的細胞的方法,其包括步驟a)用核酸轉染真核細胞,所述核酸包含i)包含編碼異源多肽的核酸的第一個表達盒,ii)包含第一個核酸SEQIDNO:04和編碼選擇性標記的第二個核酸的第二個表達盒,由此所述第一個核酸有效連接第二個核酸,b)在適合于非轉染真核細胞生長的條件下培養所述轉染細胞,c)選擇步驟b)中繁殖的細胞,并且還i)在選擇性條件下繁殖,或ii)表達所述選擇性標記。適合于該方法的細胞是例如CHO細胞、BHK細胞、PERC6⑧細胞、HEK細胞、HeLa細胞、SP2/0細胞、NS0細胞、骨髓瘤細胞或雜交瘤細胞。在一個實施方案中,所述細胞是哺乳動物細胞,在優選的實施方案中所述細胞選自CHO細胞、BHK細胞、HEK細胞、Sp2/0細胞或PER.C6細胞。異源多肽可以是任何目的異源多肽,如前體藥物、酶、酶片段、酶抑制劑、酶激活劑、生物活性多肽、刺猬蛋白、骨形成蛋白、生長因子、促紅細胞生成素、血小板生成素、GCSF、白介素、干擾素、免疫球蛋白,或抗融合肽,或其片段,或其綴合物。在一個實施方案中,所述異源多肽M疫球蛋白,或免疫球蛋白片段,或免疫球蛋白綴合物。在一個實施方案中,方法的步驟c)是在選擇性培養條件,即存在選擇劑的情況下選擇步驟b)中繁殖的細胞。在另一實施方案中,方法的步驟c)是選擇步驟b)中繁殖的細胞并表達所述第二種核酸編碼的選擇性標記。在第一個實施方案中是在選擇劑存在下培養的轉染細胞,所述選擇劑抑制未轉染細胞或不充分表達編碼所述選擇性標記的第二種核酸的細胞的繁殖。在第二個實施方案中是在選擇劑缺失下培養的轉染細胞,并且通過檢測選擇性標記的表達,例如通過FACS或目檢進行選擇。可以單一步驟或多個步驟進行細胞的選擇。在單一/多個步驟方法中,基于例如選擇性標記(如dLNGFR或GFP)的閾水平進行第一次選擇。例如,對于通過流式細胞術(例如通過FACS-熒光激活細胞分選)進行的選擇,設定熒光閾水平,選擇熒光高于該閾水平的細胞。或者,可收集樣品群體熒光強度前1-15%(即,具有最強檢測標記的15%細胞)、或前1-10%、或前1-5%、或前5-10%的細胞。用于選擇細胞的可選方法是免疫結合例如包被A蛋白質或特異性免疫球蛋白的磁珠。可將所選細胞組視為用于進一步選擇步驟的基本群體,例如通過單個細胞播種、培養和ELISA分析(酶聯免疫吸附測定)、或通過有限稀釋克隆、或通過培養幾天擴繁并進一步進行FACS選擇、或通過更高閾水平的進一步FACS選擇,其例如基于先前FACS選擇中檢測的熒光強度、或通過免疫沉淀方法(參閱例如WO2005/020924)。在一個實施方案中,可通過選自流式細胞術、ELISA、免疫沉淀、免疫親和柱層析、磁珠免疫親和分選、基于顯微鏡的分離方法,或免疫結合的方法進行選擇本發明的細胞。在另一實施方案中,可通過選自流式細胞術、EL1SA、免疫沉淀、免疫親和柱層析、磁珠免疫親和分選、基于顯微鏡的分離方法,或免疫結合的方法,然后通過選自單細胞播種和培養、有限稀釋、或培養擴繁的方法,然后通過選自FACS、免疫沉淀、免疫親和柱層析、磁珠免疫親和分選、基于顯微鏡的分離方法或ELISA進行選擇本發明的細胞。本發明最后一方面是通過將本發明的啟動子有效連接到編碼所述異源多肽的核酸上,以在細胞中表達異源多肽的方法。該方法適合于表達例如具有低溶解性或慢折疊動力學的大蛋白質。如果異源多肽或核酸負面影響宿主細胞或降低有功能的,即正確折疊的異源多肽的總產量,那么異源多肽表達或核酸轉錄的量或速率的降低是可取的。因此,本發明的一方面是具有無功能,即未正確折疊的多肽的還原部分的異源多肽的表達或產生。如果宿主細胞中表達的異源多肽例如超過了重量、或氨基酸數量、或亞基數量、或翻譯后修飾數量的某一值,那么可能在培養宿主細胞后獲得無功能,即非活性或未正確折疊形式的異源多肽。防止該問題發生的一種可能是減少蛋白質表達的量,即速率。因為蛋白質的表達受有效連接的啟動子強度的調節,所以本發明的啟動子十分合適。因此,本發明包含用于表達或產生具有無功能多肽的還原部分的異源多肽的方法,其中所述方法包括這樣順式的以下步驟a)用包含表達盒的核酸轉染哺乳動物細胞,所述表達盒包含有效連接編碼異源多肽的核酸SEQIDNO:02或SEQIDNO:03或SEQIDNO:04或SEQIDNO:06的啟動子,b)選擇步驟a)中轉染的細胞,c)在適合于所述異源多肽表達的條件下培養所選細胞,d)從所述細胞或培養基中回收所述異源多肽。在本發明該方面的一個實施方案中,哺乳動物細胞CHO細胞、BHK細胞、HEK細胞、Sp2/0細胞或PER,C6⑧細胞。在該方法的一個實施方案中,所述啟動子是SEQIDNO:03或SEQIDNO:04。在另一實施方案中具有SEQIDNO:04的啟動子。在另一實施方案中是編碼異源多肽、編碼免疫球蛋白,或免疫球蛋白片段,或免疫球蛋白綴合物的核酸。在另一實施方案中包含編碼選擇性標記的第二個表達盒的核酸。提供以下實施例、序列表和附圖幫助理解本發明,其真正范圍在所附權利要求中得以闡明。應理解在不背離本發明精神的情況下可在所述方法中進行修改。附圖簡述圖1質粒5500的質粒圖。圖2質粒5501的質粒圖。圖3質粒4703的質粒圖。圖4質粒4712的質粒圖。圖5質粒4713的質粒圖。20圖6FACS分析HEK293EBNA細胞的dLNGFR表達,所述細胞轉染有a)有效連接SEQIDNO:07的SEQIDNO:05的表達盒,b)有效連接SEQIDNO:07的SEQIDNO:04的表達盒,c)有效連接SEQIDNO:07的SEQIDNO:06的表達盒,圖7FACS分析HEK293EBNA細胞的GFP表達,所述細胞轉染有a)有效連接SEQIDNO:07的SEQIDNO:05的表達盒,b)有效連接SEQIDNO:07的SEQIDNO:03的表達盒,c)有效連接SEQIDNO:07的SEQIDNO:06的表達盒。實施例1核酸SEQIDNO:02的構建用有效連接編碼dLNGFR(質粒4788)的核酸的全長SV40啟動子作為模板經PCR反應獲得5,縮短的SV40啟動子SEQIDNO:02。PCR混合物為添加有2mMMgS04的1xPWO緩沖液(RocheMolecularBiochemicals,Mannheim,德國)、200|uMdNTPPCRNucleotideMix(RocheMolecularBiochemicals,Mannheim,德國)、1|aM正向引物SEQIDNO:08、1|aM反向引物SEQIDNO:13、50ng質粒4788的模板DNA、2.5UPWO掘A聚合酶(PWO=Pyrococcuswoesei;RocheMolecularBiochemicals,Mannheim,德國)、和100重蒸餾超純水。PCR條件為94°Cl分鐘,l個循環;94'C0.5分鐘,25個循環;55°C0.5分鐘,25個循環;72°Cl分鐘,25個循環;72°C5分鐘,1個循環。實施例2核酸SEQIDNO:03的構建用有效連接編碼來自質粒4788的dLNGFR的核酸的全長SV40啟動子作為模板經PCR反應獲得5,縮短的SV40啟動子變體SEQIDNO:03。PCR混合物為添加有2mMMgS04的1xPWO緩沖液、200nMdNTPPCRNucleotideMix、1pMSEQIDNO:09的正向引物、1JliMSEQIDNO:13的反向引物、50ng質粒4788的模板DNA、2.5UPWO-DNA聚合酶和100重蒸餾超純水。PCR條件為94°C1分鐘,1個循環;94"C0,5分鐘,25個循環;55。C0.5分鐘,25個循環;72'C1分鐘,25個循環;72。C5分鐘,l個循環。實施例3核酸SEQIDNO:04的構建用有效連接編碼dLNGFR(質粒4788)的核酸的全長SV40啟動子作為模板經PCR反應獲得5,縮短的SV40啟動子變體SEQIDNO:04。PCR混合物為添加有2mMMgS04的1xPWO緩沖液、200jiMdNTPPCRNucleotideMix、1juM正向引物SEQIDNO:10、1pM反向引物SEQIDNO:13、50ng質粒4788的模板DNA、2.5UPWO-DNA聚合酶和100pL重蒸餾超純水。PCR條件為94°C1分鐘,1個循環;94°C0.5分鐘,25個循環;55°C0.5分鐘,25個循環;72X:1分鐘,25個循環;72°C5分鐘,l個循環。實施例4其他啟動子的構建用有效連接編碼dLNGFR的核酸的全長SV40啟動子作為模板經PCR反應產生其他5,縮短的SV40啟動子變體。PCR混合物為添加有2mMMgS04的1xPWO緩沖液、200nMdNTPPCRNucleotideMix、1jaM正向引物SEQIDNO:11(產生SEQIDNO:06)或SEQIDNO:12、1MM反向引物SEQIDNO:13、50ng質粒4788的模板DNA、2.5UPWO-DNA聚合酶和100|nL重蒸餾超純水。PCR條件為94'C1分鐘,l個循環;94°C0.5分鐘,25個循環;55°C0.5分鐘,25個循環;72°Cl分鐘,25個循環;72X:5分鐘,1個循環。實施例5有效連接SEQIDNO:02、03、04和06的dLNGFR的表達獲得核酸SEQIDNO:02、03、04和06所用的引物包含限制性內切酶Sail和EcoRI的限制性位點。使用這些限制性位點/限制性內切酶已將有效連接編碼dLNGFR(對于LNGFR(低親和力神經生長因子)參見例如Philipps,K.等,Nat.Med.2(1996)1154-1156;或Machl,A.W.等,Cytometry29(1997)371-374)的核酸的這些核酸連接至質粒4736-pUC-DHFR上,該質粒4736-pUC-DHFR已使用限制性位點Sail和PvuII將其線性化。所獲質粒為5500-pUC-DHFR—dLNGFR—野生型SV40(圖1中的質粒圖),5501-pUC-DHFR—dLNGFR—縮短—2(圖2中的質粒圖),5502-pUCDHFR—dLNGFR—縮短一3,5503-pUC-DHFR—dLNGFR—縮短_4,5504-pUC-DHFR—dLNGFR縮短6。已用這些質粒轉染HEK293EBNA細胞并瞬時表達編碼的多肽。48小時后已經FACS驗證dLNGFR的表達。對于測定不同啟動子的啟動子強度(表達強度),經抗dLNGFR抗體對表達的表面標記dLNGFR進行焚光標記。對于每一測定,已通過每6孑L(GIBCOInvitrogen,Karlsruhe,德國)加入1mlAccutase⑧將約0.5乂106至l.OxlO6個細胞分離。將分離后的細胞轉移至小瓶中并用添加有10%(v/v)胎牛血清的RPMI1640培養基洗滌一次。隨后通過離心(1,500轉/分鐘,5分鐘)將細胞沉淀下來并去除上清。以下所有步驟在0至2"C的冰浴上或冰浴中進行。用100fil含30將/ml抗dLNGFR抗體的溶液將細胞沉淀重懸。30分鐘的溫育周期后,通過加入2ml水冷的RPMI1640培養基稀釋樣品并隨后通過離心進行沉淀。在100pL濃度為20照/ml的二抗溶液中將沉淀重懸,所述二抗為與Phycoerythrin綴合的山羊抗小鼠IgG抗體(CaltagLaboratories,Burlingame,CA,美國)。黑暗中水上溫育樣品30分鐘。經洗涂和離心步驟之后在500jal培養基中將樣品重懸并置于黑暗中水上保存直至測定。使用FACSCalibur軟件(CellQuestPro)評估FACS分析。結果顯示于圖6中。FACS分析的結果23<table>tableseeoriginaldocumentpage24</column></row><table>可見從質粒5504表達的標記dLNGFR的平均熒光強度顯示出約85%下降的顯著表達下降。實施例6有效連接SEQIDNO:02、03、04和06的GFP的表達獲得核酸SEQIDNO:02、03、04和06所用的引物包含限制性內切酶Sail和EcoRI的限制性位點。使用這些限制性位點/限制性內切酶已將有效連接編碼GFP(SEQIDNO:07)的核酸的這些核酸連接至質粒4703-pUC-OriP上(圖3),該質粒4703-pUC-OriP已使用限制性位點Sail和PvuII將其線性化。所獲質粒為4712-pUC-Hyg—GFP—野生型SV40(圖4中的質粒圖),4713-pUC-Hyg—GFP—縮短—2(圖5中的質粒圖),4714-pUCHyg—GFP—縮短—3,4715-pUC-Hyg—GFP—縮短_4,4716-pUC-Hyg—GFP—縮短_6。對于每一測定,已通過每6孑L(GIBCOInvitrogen,Karlsruhe,德國)中加入1mlAccutase⑧將約5xl(^至lxl(^個細胞分離。將分離后的細胞轉移至小瓶中并在3ml添加有10%(v/v)胎牛血清的RPMI1640培養基中重懸。隨后通過離心(1,500轉/分鐘,5分鐘)將細胞沉淀下來并去除上清。在500pl培養基中將細胞沉淀重懸。為了區分活細胞與死細胞,加入1pi碘化丙咬。在FACS測定前短暫重懸細胞。使用FACSCalibur軟件(CellQuestPro)評估FACS分析。結果顯示于圖7中。<table>tableseeoriginaldocumentpage25</column></row><table><table>tableseeoriginaldocumentpage26</column></row><table>可見從質粒4714或質粒4715表達的GFP的平均熒光強度分別顯示出約為50%下降和75%下降的顯著表達下降。質粒4716中未發現GFP可檢測到的表達。權利要求1.啟動子,其具有核酸序列SEQIDNO04。2.核酸,其特征在于其由核酸SEQIDNO:04組成;并且當有效連接核酸SEQIDNO:07時,具有SV40啟動子SEQIDNO:05的20%或更低的啟動子強度。3.根據權利要求2的核酸,其特征在于所述核酸包含核酸SEQIDNO:04之前的核酸SEQIDNO:14。4.根據權利要求2的核酸,其特征在于其包含猴病毒40啟動子SEQIDNO:14的笫二個72bp重復。5.根據權利要求2-4中任一項的核酸,其特征在于所述核酸中SV40啟動子的第一個72bp重復缺失而該SV40啟動子的笫二個72bp重復保留。6.用于選擇細胞的方法,其特征在于其包括以下步驟a)用核酸轉染真核細胞,所述核酸包含i)包含編碼異源多肽的核酸的第一個表達盒,ii)包含第一個核酸SEQIDNO:04和編碼選擇性標記的第二個核酸的第二個表達盒,由此所述第一個核酸與第二個核酸有效連接,b)在適合于所述非轉染細胞生長的條件下培養所述轉染細胞,c)在選擇性培養條件下選擇步驟b)中繁殖的細胞。7.根據權利要求6的方法,其特征在于所述方法的步驟c)是在選擇性培養^H牛下選擇步驟b)中繁殖的細胞。8.根據權利要求6的方法,其特征在于所述方法的步驟c)是選擇步驟b)中繁殖的細胞并表達所述笫二個核酸編碼的選擇性標記。9.用于表達異源多肽的方法,其特征在于其包括以下步驟a)用包含表達盒的核酸轉染真核細胞,所*達盒包含有效連接第二個核酸的笫一個核酸SEQIDNO:04,所述第二個核酸編碼異源多肽,b)選擇步驟a)中轉染的細胞,c)在適合于所迷異源多肽表達的條件下培養步驟b)中的所選細胞,d)從所述細胞或培養基中回收所述異源多肽。10.根據權利要求9的方法,其特征在于所述核酸包含編碼選擇性標記的第二個表達盒。11.根據權利要求6-10中任一項的方法,其特征在于所述真核細胞是哺乳動物細胞。12.根據權利要求ll的方法,其特征在于所述哺乳動物細胞是CHO細胞、BHK細胞、HEK細胞、Sp2/0細胞或Per.C6⑧細胞。13,根據權利要求12的方法,其特征在于所述哺乳動物細胞是CHO細胞或HEK細胞。14.根據權利要求6-13中任一項的方法,其特征在于所述異源多肽是免疫球蛋白,或免疫球蛋白片段,或免疫球蛋白綴合物。15.根據權利要求6-8和10-14中任一項的方法,其特征在于所述選擇性標記是新霉素-氨基糖苷磷酸轉移酶,或潮霉素-磷酸轉移酶,或dLNGFR,或GFP。16.根據權利要求9-14中任一項的方法,其特征在于所述第一個核酸是根據權利要求2的核酸。17.根據權利要求16的方法,其特征在于所述第一個核酸僅含有野生型SV40啟動子的第二個72bp重復。18.用于表達異源多肽的方法,其特征在于其包括i)有效連接編碼選擇性標記的核酸的核酸SEQIDNO:04,其含有野生型SV40啟動子的第二個72bp重復,ii)核酸SEQIDNO:05或有效連接編碼異源多肽的核酸的CMV啟動子,iii)CHO細胞或HEK細胞,iv)用i)和ii)的核酸轉染iii)中所述的細胞,v)在選擇劑存在下選擇iv)中轉染的細胞,vi)在v)所用選擇劑缺失的情況下,在適合于表達所述異源多肽的條件下培養V)中所述的所選細胞,vii)從培養基或細胞中回收所述異源多肽。19.根據權利要求6-18中任一項的方法,其特征在于通過選自流式細胞術、ELISA、免疫沉淀、免疫親和柱層析、磁珠免疫親和分選、基于顯微鏡的分離方法或免疫結合的方法進行所述選擇。全文摘要本發明報道了具有核酸序列SEQIDNO02,或SEQIDNO03,或SEQIDNO04,或SEQIDNO06的啟動子,其為啟動子強度降低的5’縮短的SV40啟動子,其尤其用于異源多肽或選擇性標記的有限表達。文檔編號C12N15/85GK101688222SQ200880022641公開日2010年3月31日申請日期2008年6月25日優先權日2007年6月29日發明者C·克萊因,E·科佩茨基申請人:弗·哈夫曼-拉羅切有限公司