專利名稱:用于瞬時或穩(wěn)定表達外源分子的表達盒和載體的制作方法
技術領域:
本發(fā)明涉及表達載體和表達盒,更具體地說涉及用于在生物體中表達外源分子的方法、組合物和系統(tǒng)。
背景技術:
將核酸分子,多肽,肽,和小分子導入靶細胞及組織不僅被用作治療遞送系統(tǒng),還被用于在體外制備治療分子。該方法的適用性隨著對宿主細胞以及細胞分裂、分化及表達機理的分子生物學的進一步理解而增加。
發(fā)明概述現(xiàn)已發(fā)現(xiàn)由CMV啟動子驅(qū)動、并由變體人生長激素基因(hGHv)的polyA結(jié)構(gòu)域終止的轉(zhuǎn)錄比不含有這兩種元件或其中之一的其它表達載體更有效。因此,本發(fā)明提供了用于表達目的多核苷酸的表達盒及表達載體。本發(fā)明所述表達盒包括調(diào)控元件的組合,所述調(diào)控元件的組合能夠提供有效的轉(zhuǎn)錄,有效的轉(zhuǎn)錄終止,以及轉(zhuǎn)錄產(chǎn)物的增加的mRNA穩(wěn)定性。實施方案中,所述表達盒包括人巨細胞病毒啟動子/增強子,克隆位點或目的多核苷酸,以及hGHv聚腺苷酸化信號結(jié)構(gòu)域。任選地可存在長度可變的間插序列(variable length intervening sequence)。
本發(fā)明提供表達盒,其中包括人CMV立即早期1(hCMV IE1)啟動子/增強子區(qū)域,目的多核苷酸,以及變體人生長激素(hGHv)polyA信號結(jié)構(gòu)域或其變體。所述polyA信號結(jié)構(gòu)域或其變體的長度為至少100個核苷酸,并含有序列AATAAA,并且與hGH polyA信號結(jié)構(gòu)域具有至少92%的同一性。
本發(fā)明還提供了含有本發(fā)明所述表達盒的表達載體,以及含有本發(fā)明所述表達盒或表達載體的宿主細胞。
本發(fā)明還提供了表達盒,其中包含人CMV立即早期1(hCMV IE1)啟動子/增強子區(qū)域,含有剪接供體和剪接受體位點的長度可變的間插序列(VLIVS),目的多核苷酸,及變體人生長激素(hGHv)polyA信號結(jié)構(gòu)域或其變體。所述polyA信號結(jié)構(gòu)域或其變體的長度為至少100個核苷酸,其中含有序列AATAAA,并與hGHv polyA信號結(jié)構(gòu)域具有至少92%的同一性。
本發(fā)明還提供了表達載體,其中包含人CMV立即早期1(hCMV IE1)啟動子/增強子區(qū)域,其中含有剪接供體位點和剪接受體位點的長度可變的間插序列(VLIVS),克隆位點,hGH聚腺苷酸化區(qū)域,以及選擇標記。在本發(fā)明的一個方面,所述hCMV IE1啟動子/增強子區(qū)域位于所述克隆位點的上游(5’),所述hGH聚腺苷酸化區(qū)域位于該克隆位點的下游(3’)。
本發(fā)明還包括在體內(nèi)遞送目的藥劑的方法。該方法包括將含有表達盒的組合物遞送至受試者,所述表達盒包含hCMV IE1啟動子/增強子區(qū)域;含有剪接供體和剪接受體位點的長度可變的間插序列;編碼所述目的藥劑的多核苷酸;以及人生長激素(hGHv)polyA信號結(jié)構(gòu)域或其變體。
本發(fā)明還包括表達系統(tǒng)。所述表達系統(tǒng)包括經(jīng)由本發(fā)明表達盒轉(zhuǎn)染或轉(zhuǎn)化的宿主細胞,其中所述宿主細胞在使目的多核苷酸表達的條件下培養(yǎng);以及回收所述目的藥劑。
本發(fā)明的一個或多個實施方案的詳述見下文的附圖和說明書。本發(fā)明的其它特點、目的和優(yōu)勢可以從下面的說明和附圖以及權利要求部分明顯地看出。本申請中引用的所有文獻在此引入作為參考。
圖1是pV10載體的質(zhì)粒圖譜。通過PCR制備巨細胞病毒立即早期1(CMV IE1)啟動子/內(nèi)含子(IVS),并將其克隆入HindIII和BamH1位點。另外還標明了氨芐西林抗性基因β內(nèi)酰胺酶(bla)。
圖2是pV40的質(zhì)粒圖譜。標明了巨細胞病毒立即早期1(CMV IE1)啟動子,內(nèi)含子(IVS),長約600個堿基對的hGHv聚腺苷酸化信號結(jié)構(gòu)域(polyA),以及氨芐西林抗性基因β內(nèi)酰胺酶(bla)。
圖3是質(zhì)粒pV70的示意圖。圖中標出了CMV IE1啟動子,含有缺失連接(deletion junction)以及剪接供(SD)和剪接受體(SA)位點的IVS,hGHvpolyA信號結(jié)構(gòu)域,和bla基因。所述缺失連接表示的是BspE1′/′HpaI的平端連接結(jié)果。
圖4是制備pXLC.1載體的示意圖。所述pXLC.1載體是使用表達載體pV70和含有輕鏈編碼序列的PCR產(chǎn)物構(gòu)建而成的。用BamHI將PV70線性化,用BamHI消化所述PCR產(chǎn)物,然后連接這兩者生成所述pXLC.1載體。
圖5是制備pXLC.2載體的示意圖。
圖6圖示了pV60載體以及pXHC載體的制備。所述pXHC載體是使用表達載體pV60和含有大部分重鏈編碼序列(不包括N-末端的52個氨基酸)構(gòu)建而成的。用BamHI將PV60線性化,用BamHI消化所述PCR產(chǎn)物,然后將二者連接在一起。
圖7是pXHC.1載體的示意圖。
圖8是pXHC.3載體的示意圖。
圖9是圖示了將dhfr盒添加到pXHC.3得到的pXHC.5載體。所述表達盒的調(diào)控元件源自于pSI(Promega,Genbank登錄號#U47121),其中含有SV40啟動子/增強子,人工內(nèi)含子和SV40晚期聚腺苷酸化序列。
圖10是載體pV80的示意圖。標出的是含有剪接供體(SD)和剪接受體(SA)位點的巨細胞病毒立即早期1(CMV IE1)啟動子/內(nèi)含子(IVS)片段,hGHv聚腺苷酸化信號結(jié)構(gòu)域(polyA),氨芐西林抗性基因,β內(nèi)酰胺酶(bla),SV40啟動子/增強子,人工內(nèi)含子和SV40晚期聚腺苷酸化序列。
圖11A和11B是載體pV90的示意圖及相應的標注(annotated)序列。圖11A是載體圖譜。標出的是含有剪接供體(SD)和剪接受體(SA)位點的巨細胞病毒立即早期1(CMV IE1)啟動子/內(nèi)含子(IVS)片段,hGHv聚腺苷酸化信號結(jié)構(gòu)域(polyA),氨芐西林抗性基因,β內(nèi)酰胺酶(bla),SV40啟動子/增強子,人工內(nèi)含子和SV40晚期聚腺苷酸化序列。所述載體不含dhfr表達盒中的NotI位點。圖11B是pV90載體的標注序列。圖11B中,SEQ IDNO19中的第1275-1866位核苷酸代表長度約600個核苷酸的hGHv polyA。
圖12是pSI-DHFR.2的載體圖譜。SV40啟動子驅(qū)動dhfr基因。
圖13圖示了經(jīng)轉(zhuǎn)染的合并物的相對比產(chǎn)率。3個合并物用來分析pCMV-hGHvPA-SEAP和pSEAP2,一個合并物用于分析pUC18。
圖14是顯示所述分離株的相對比產(chǎn)率的一對圖表。每一種構(gòu)建體的前20種分離株按排列順序給出。
圖15給出的是Genbank登錄號No.K00470中的序列(SEQ ID NO18)。
發(fā)明詳述本發(fā)明涉及表達盒以及含有該表達盒的載體。所述表達盒含有能夠驅(qū)動真核宿主中的轉(zhuǎn)錄的轉(zhuǎn)錄調(diào)控區(qū)域以及轉(zhuǎn)錄終止區(qū)域。本發(fā)明所述表達盒和載體提供了強的轉(zhuǎn)錄起始和終止以及轉(zhuǎn)錄產(chǎn)物的增強的mRNA穩(wěn)定性。
本發(fā)明提供了來自任一株巨細胞病毒的啟動子和任選的增強子元件,例如本申請所述的或者例如美國專利No.5,658,759等文獻中所述的巨細胞病毒毒株,這些文獻的內(nèi)容在本申請引入作為參考。例如,可用于本發(fā)明所述表達盒的合適的CMV立即早期啟動子區(qū)域可以從CMV-啟動的β-半乳糖苷酶表達載體CMVβ獲得(MacGregor et al.,Nucl.Acids Res.172365(1989))。
如本申請中進一步所述,所述hGHv聚腺苷酸化信號結(jié)構(gòu)域提供了強的轉(zhuǎn)錄終止信號,以及提高的mRNA轉(zhuǎn)錄物穩(wěn)定性。所述調(diào)控/表達元件可以通過例如,目的多核苷酸或克隆位點(例如,多克隆位點)。自hGHv聚腺苷酸化信號結(jié)構(gòu)域分離。
本發(fā)明的一個方面,提供了其中含有表達盒的多核苷酸,該表達盒包括巨細胞病毒(CMV)轉(zhuǎn)錄調(diào)控區(qū)域,長度可變的間插序列(例如,來自CMV的內(nèi)含子A),目的多核苷酸,和聚腺苷酸化信號結(jié)構(gòu)域。本發(fā)明進一步涉及用于從宿主細胞制備和回收異源多肽的方法和表達載體。
另一方面,本發(fā)明的表達盒包括,可操作地連接的如下序列(i)CMV主要立即早期1(IE1)啟動子/增強子區(qū)域和長度可變的間插序列(例如,內(nèi)含子A的衍生物),(ii)目的多核苷酸,和(iii)hGHv聚腺苷酸化信號結(jié)構(gòu)域。所述術語“可操作地連接的”是指并置(juxta position),其中的各成分間的相互關系使得它們可以其預定方式發(fā)揮作用(例如,功能性地連接)。因此,例如,可操作地連接于目的多核苷酸的啟動子/增強子以這樣一種方式與后者連接,即使得能夠在與活化所述啟動子/增強子表達相容的條件下完成所述目的多核苷酸的表達。
在本發(fā)明的具體實施方案中,所述表達盒包括SEQ ID NO1中的約第1-約第1867位核苷酸所示的序列(例如,約第1-第1865,1866,1867,1868,或1869位核苷酸)。SEQ ID NO1中第1-1867位核苷酸所示表達盒包含大量不同的結(jié)構(gòu)域,例如CMV IE1啟動子/增強子區(qū)域,所述結(jié)構(gòu)域具有SEQID NO1中約x1-約x2所示的序列,其中x1是第1-20位核苷酸中的核苷酸,x2是約第715-720位核苷酸(例如,SEQ ID NO1中約第1-719位核苷酸)中的核苷酸。所述表達盒的另一結(jié)構(gòu)域包括長度可變的間插序列(VLIVS),其中含有剪接供體和剪接受體位點。所述VLIVS可以為長度至少50bp(例如,長度至少100,150,200,或250bp),而且可以包括來自本領域任一已知來源的剪接供體和受體。參見,例如,Varani et al.,Annu Rev BiophysBiomol Struct 27407-45(1998)和Koning,Eur J Bi°Chem 21925-42(1994)。合適的插入結(jié)構(gòu)域可以包括任意CMV毒株基因組的內(nèi)含子A的全部,或可以包括較小的片段,這種較小片段含有連接在一起的含剪接供體位點的5’序列和含剪接受體位點的3′序列。例如,所述VLIVS包括SEQ ID NO1中約x3-約x4的核苷酸,其中x3是第715-720位核苷酸中的核苷酸,x4是第1236-1254位核苷酸(例如,SEQ ID NO1中第719-1236位核苷酸)中的核苷酸。位于CMV IE1啟動子/增強子之后的間插序列的大小可以變化,可多達為SEQ ID NO1中的317個核苷酸。例如,從pV40和pV70(分別見例如圖2和3)所示的IVS序列缺失317個核苷酸,來制備SEQ ID NO1的VLIVS。因此,在本發(fā)明的另一方面,所述表達盒包括SEQ ID NO1的約第1-約第1254位核苷酸的序列(例如,CMV IE1啟動子/增強子和間插序列)。多克隆位點可以存在于IVS區(qū)域(例如,包括BamH1位點和Not1位點的SEQID NO1的第1255-1272位核苷酸)之后(即,下游)??梢允褂帽绢I域技術人員已知技術,在所述表達盒中構(gòu)建不同的或另外的限制酶切位點。所述表達盒還可以進一步包括polyA結(jié)構(gòu)域。
所述polyA信號結(jié)構(gòu)域源自于hGHv基因,該基因的3′UTR序列可變,例如,從等位基因到等位基因。hGHv基因的一種等位基因的描述見Genbank登錄號No.K00470(SEQ ID NO18),另一序列為圖11B中描述的SEQ IDNO19,該序列對應于SEQ ID NO18中第2032-2625位核苷酸(參見圖15)。polyA信號結(jié)構(gòu)域的非天然存在的變體可以通過誘變技術制備,包括適于多核苷酸、細胞或生物體的技術。hGHv基因的polyA變體包括polyA信號結(jié)構(gòu)域,該結(jié)構(gòu)域不同于野生型hGHv polyA信號結(jié)構(gòu)域但是仍保留了發(fā)出轉(zhuǎn)錄終止信號和/或穩(wěn)定mRNA的能力。例如,所述聚腺苷酸化信號結(jié)構(gòu)域可以包括SEQ ID NO18或19所示的hGHv聚腺苷酸化信號結(jié)構(gòu)域序列。分子生物學領域的技術人員還應理解,所述序列的長度無需約為600個核苷酸。相反,包含任何這樣的polyA序列結(jié)構(gòu)域,其包含hGHv基因的至少100nt(例如,至少200,300,400,500,或600nt)的連續(xù)核苷酸序列(包含標準(canonical)AATAAA位點)。此外,本發(fā)明還包括與上述序列之間的差異達8%(例如,與SEQ ID NO18或19或其特征結(jié)構(gòu)域具有92%同一性)的序列。例如,長度為100nt的多核苷酸,其與SEQ ID NO1的第1-1867位核苷酸具有95%同一性,并含有可保持終止轉(zhuǎn)錄的能力的AATAAA序列。
本發(fā)明的另一方面中,提供了含有表達盒的載體。在本申請中,“載體”是指一經(jīng)導入受體細胞(例如,細菌如大腸桿菌(E.coli)),即能夠自主復制的核酸分子(DNA或RNA)。質(zhì)粒、病毒和噬菌體是載體的實例。從表達載體“表達”的過程是已知的,包括細胞酶的使用和從目的多核苷酸制備表達產(chǎn)物的過程(processes)。表達載體是指能夠介導克隆的多核苷酸在宿主細胞中表達的載體,所述宿主細胞與用于載體復制或增殖的細胞可以相同或不同類型。許多哺乳動物表達載體能夠在常見細菌(受體細胞)中增殖,但在哺乳動物細胞(宿主細胞)中表達目的多核苷酸而不能在細菌中表達。
本發(fā)明涉及那些能夠允許多核苷酸在真核(例如,哺乳動物,更具體地為,人,鼠,猿,牛,豬,嚙齒動物,或綿羊細胞)細胞中有效轉(zhuǎn)錄和翻譯的載體的設計和使用。本發(fā)明所述載體包括上述表達盒,其中含有能提供有效轉(zhuǎn)錄終止和mRNA穩(wěn)定性的聚腺苷酸化信號結(jié)構(gòu)域。
本發(fā)明所述載體包括用于接納目的多核苷酸的克隆位點;足以允許被插入宿主細胞中克隆位點的多核苷酸的轉(zhuǎn)錄的轉(zhuǎn)錄調(diào)控元件(例如,CMVIE1啟動子/增強子區(qū)域);足以允許所述多核苷酸的RNA轉(zhuǎn)錄物在宿主細胞中翻譯的翻譯元件,以及(如果需要)足以允許所述載體在宿主細胞或用于所述載體的增殖的另一受體細胞中進行復制的復制元件。本發(fā)明所述載體能介導在宿主細胞中的所述瞬時或穩(wěn)定表達。
在具體的實施方案中,本發(fā)明載體包括(1)SEQ ID NO1所示序列;(2)與SEQ ID NO1所示序列互補的序列;(3)與SEQ ID NO1至少80%(優(yōu)選至少90%;95%;98%或99%)相同的序列或其互補序列;或(4)載體,其含有SEQ ID NO1中的約第1-約第1867位核苷酸并且含有目的多核苷酸和/或選擇標記。
含有SEQ ID NO1的載體具有大量不同的結(jié)構(gòu)域和編碼區(qū)域。例如,具有SEQ ID NO1中約x1-約x2所示序列的CMV IE1啟動子/增強子區(qū)域存在于所述載體中,其中x1是第1-20位核苷酸中的核苷酸,x2是約第715-720位核苷酸(例如,SEQ ID NO1中約1-719位核苷酸)中的核苷酸。本發(fā)明表達載體的另一結(jié)構(gòu)域包括含有剪接供體和剪接受體位點的長度可變的間插序列(VLIVS)。例如,所述IVS包括SEQ ID NO1的約x3-約x4,其中x3包括第715-720位核苷酸中的核苷酸,x4包括第1236-1254位核苷酸(例如,SEQ ID NO1中大約第719-1236位核苷酸)中的核苷酸。所述表達載體的多克隆位點包括SEQ ID NO1的第1255-1272位核苷酸(例如,BamH1位點和Not1位點)??梢允褂帽绢I域技術人員已知技術在所述表達載體中構(gòu)建不同的或其它的限制酶切位點。所述表達載體還可以進一步包括polyA信號結(jié)構(gòu)域。所述polyA信號結(jié)構(gòu)域是hGHv polyA信號結(jié)構(gòu)域或hGH polyA信號結(jié)構(gòu)域的其它變體。例如,polyA信號結(jié)構(gòu)域包括SEQ ID NO19所示的hGHv polyA信號結(jié)構(gòu)域序列。另外,本發(fā)明載體中還含有一種或多種選擇標記。例如,SEQ ID NO1包括二氫葉酸還原酶(dhfr)基因(例如,SEQ IDNO1中約第2568-約第3132位核苷酸)。除上述的那些元件之外,本發(fā)明載體可以包括另外的啟動子/增強子元件和調(diào)控區(qū)域(例如,聚腺苷酸化結(jié)構(gòu)域)。所述另外的調(diào)控元件和聚腺苷酸化結(jié)構(gòu)域可以位于選擇標記或目的多核苷酸的側(cè)翼(例如,緊密鄰接于其5’和3’端)。例如,所述含有SEQ ID NO1的載體包括SEQ ID NO1中約第2568-約第3132位核苷酸所示的二氫葉酸還原酶(dhfr)基因。所述dhfr基因側(cè)接SV40啟動子/增強子元件和SV40聚腺苷酸化區(qū)域(例如,分別為SEQ ID NO1的約第1868-約第2210位核苷酸和約第3144-約第3440位核苷酸)。
選擇標記的具體實例是編碼下述蛋白質(zhì)的選擇標記,所述蛋白質(zhì)可賦予針對細胞抑制藥物或殺細胞藥物的抗性,所述蛋白質(zhì)例如,能賦予抗氨甲蝶呤抗性的DHFR蛋白質(zhì)(Wigler et al.,Proc.Natl.Acad.Sci.USA 773567(1980);O’Hare et al.,Proc.Natl.Acad.Sci.USA 781527(1981));能賦予抗霉酚酸(mycophenolic acid)抗性的GPF蛋白(Mulligan & Berg,Proc.Natl.Acad.Sci.USA 782072(1981)),能賦予抗氨基糖苷G-418抗性的新霉素抗性標記物(Colberre-Garapin et al.,J.Mol.Biol.1501(1981));能賦予抗潮霉素抗性的Hygro蛋白(Santerre et al.,Gene 30147(1984));和ZeocTM抗性標記(可購自Invitrogen)。此外,單純皰疹病毒胸苷激酶(Wigler et al.,Cell 11223(1977)),次黃嘌呤-鳥嘌呤磷酸核糖轉(zhuǎn)移酶(hypoxanthine-guaninephophoribosyltransferase)(Szybalska & Szybalski,Proc.Natl.Acad.Sci.USA482026(1962)),以及腺嘌呤磷酸核糖轉(zhuǎn)移酶(Lowy et al.,Cell 22817(1980))可以分別應用于tk-,hgprt-或aprt-細胞中。其它選擇標記編碼嘌呤霉素N-乙酰轉(zhuǎn)移酶或腺苷脫氨酶。
對兩個或多個核酸分子來說,當使用比較算法或者通過人工比對及目測進行檢測,在比較窗比較并比對以得到最大對應度口時,術語“相同”或百分比“同一性”是指兩個或多個序列或亞序列是相同的或者具有特定比例的相同核苷酸。這些定義也指序列的互補序列(例如,SEQ ID NO1所示序列的互補序列或其含有表達盒的片段)。例如,所述表達盒及其片段包括與SEQ ID NO1部分序列(例如,SEQ ID NO1的1-719,1-1254位核苷酸等)具有至少約80%,約90%,約95%,約97%,約98%或約99%核苷酸序列同一性的那些序列。因此,如果序列與SEQ ID NO1的全長序列或其結(jié)構(gòu)域之間具有所需的序列同一性,那么該序列就可以分別作為本發(fā)明的表達盒或結(jié)構(gòu)域而起作用。
就序列比較而言,通常將一段序列用作參照序列,將受試序列與之進行比較。當使用序列比較算法時,將受試及參照序列輸入電腦,設定亞序列坐標(如有必要),并設定序列算法的程序參數(shù)??梢允褂媚J的程序參數(shù),或者也可以設定替換參數(shù)。然后,根據(jù)設定的參數(shù)或默認的程序參數(shù),用所述序列比較算法計算受試序列相對于參照序列的序列同一性百分比。在本申請中,“比較窗”,包括參照選自具有下列數(shù)目之一個連續(xù)核苷酸的任一片段25-600個,通常約50-約200個,更通常為約100-約150個,其中可以在將將序列與具有同等數(shù)目個連續(xù)核苷酸的參照序列進行最佳比對之后,對這兩個序列進行比較。用于比較的序列比對法已為本領域所熟知。用于比較的序列最佳比對可以用以下方法進行例如,Smith & Waterman,Adv.Appl.Math.2482(1981)的局部同源性算法,Needleman & Wunsch,J.Mol.Biol.48443(1970)的同源性比對算法,Pearson & Lipman,Proc.Natl.Acad.Sci.USA 852444(1988)的相似性搜索算法,這些算法的電腦化運行(GAP,PILEUP,BESTFIT,F(xiàn)ASTA,和TFASTA in the Wisconsin GeneticsSoftware Package,Genetics Computer Group,575 Science Dr.,Madison,WI),或通過人工比對以及目測檢查。
適于測定序列同一性百分比(即,基本上的相似性或同一性)的算法的一個實例是BLAST算法,其描述見Altschul,J.Mol.Biol.215403-410,1990。用于執(zhí)行BLAST分析的軟件公眾可以從the National Center forBiotechnology Information(on the World Wide Web at ncbi.nlm.nih.gov/)獲得。這種算法包括首先通過鑒定詢問序列中的短字長W(short words of lengthW),鑒定出高得分序列對(HSP),它們或者相互匹配,或者當與數(shù)據(jù)庫序列中等長的字符比對時滿足一些正值的閾值得分(positive-valued thresholdscore)T?!癟″是指鄰近字符得分閾值(neighborhood word score threshold)。這些起始鄰近擊中字符串(initial neighborhood word hits)作為種子(seed)啟動檢索以發(fā)現(xiàn)含有它們的更長的HSP。然后,沿每一序列的雙向延伸得到的擊中字符串,只要能增加累積的比對得分即可。使用參數(shù)M(成對匹配殘基的獎勵得分;永遠>0)和N(錯配殘基的處罰得分;永遠<0)計算核苷酸序列的累積得分。當達到下述情況時擊中字符串的雙向延伸停止累積比對得分比其最大獲得值低數(shù)量X;由于一或多個陰性-得分殘基比對的累積,所述累積得分降至零或零以下;或者到達任一序列末端。BLAST算法參數(shù)W、T和X決定比對的靈敏度和速度。一個實施方案中,為了測定一種核酸序列是否落于本發(fā)明范圍之內(nèi),使用BLASTN程序(對于核苷酸序列),引入字長(W)11的缺省值(default),期望值(E)10,M=5,N=4,以及對兩條鏈進行比較。對于氨基酸序列而言,BLASTP程序使用下列缺省參數(shù)字長(W)3,期望值(E)10,以及BLOSUM62得分矩陣(參見,例如,Henikoff,Proc.Natl.Acad.Sci.USA 8910915,1989)。
另外還使用BLAST算法對兩個序列之間的相似度進行了統(tǒng)計分析(參見,例如,Karlin,Proc.Nat’l.Acad.Sci.USA 905873-5787,1993)。BLAST算法提供的一種相似度測算方法是最小求和概率(smallest sum probability)(P(N)),該方法提供了兩個核苷酸或氨基酸序列之間隨機發(fā)生匹配的概率的指標。例如,如果受試核酸和參照核酸之間比較中的最小求和概率小于約0.1,更優(yōu)選小于約0.01,以及最優(yōu)選小于約0.001,那么就認為該核酸與參照序列相似。
本發(fā)明此外還包括能夠與SEQ ID NO1中約第1-1867位核苷酸所示多核苷酸序列特異性雜交的多核苷酸。術語“選擇性(或特異性)雜交”是指在嚴謹雜交條件下,分子與具體參照多核苷酸的結(jié)合、雙螺旋或雜交。術語“嚴謹雜交條件”是指這樣的條件,在該條件下探針主要與其亞序列雜交,所述目標亞序列通常在核酸的復雜混合物中,但是所述探針不與其它序列雜交。嚴謹條件是序列-依賴性的,因環(huán)境的不同而不同,例如,取決于探針的長度。較長的序列可以在較高溫度特異性雜交。核酸雜交的全面指導見Tijssen,Techniques in Bi°hemistry and Molecular Biology--Hybridizationwith Nucleic Probes,“Overview of principles of hybridization and the strategy ofnucleic acid assays”(1993)。通常,在一定離子強度和pH時,嚴謹條件被選擇為比具體序列的熱解鏈溫度(Tm)低約5-10℃。Tm是指這樣的溫度(在一定的離子強度、pH和核酸濃度),在該溫度達平衡時,互補于靶序列的探針的50%與所述靶序列雜交(由于靶序列過量存在,在Tm達平衡時,50%的探針被結(jié)合)。嚴謹條件中的鹽濃度小于約1.0M鈉離子、通常約0.01-1.0M鈉離子濃度(或其它鹽),pH為7.0-8.3,溫度對于短探針(例如,10-約50個核苷酸)為至少約30℃而對于長探針(例如,大于約50個核苷酸)為至少約60℃。嚴謹條件還可以通過加入去穩(wěn)定劑例如甲酰胺來實現(xiàn)。對于選擇性或特異性雜交而言,陽性信號(例如,本發(fā)明核酸的鑒定)是背景雜交的約2倍。對于長探針而言,用于鑒定本發(fā)明范圍內(nèi)基本相同的核酸的“嚴謹”雜交條件包括在含50%甲酰胺、5×SSC和1%SDS的緩沖液中、42℃-65℃進行雜交,65℃用0.2×SSC和0.1%SDS洗滌。但是,本領域普通技術人員顯然明白,雜交條件可以根據(jù)序列組成進行調(diào)整。代表性的“中度嚴謹雜交條件”包括37℃、在包含40%甲酰胺、1M NaCl和1%SDS的緩沖液中雜交,然后在45℃、用1×SSC洗滌。陽性雜交應該至少是背景信號的兩倍。本領域普通技術人員很容易認識到可以使用其它雜交和洗滌條件以提供類似嚴謹度的條件。因此,本發(fā)明的表達盒可以包括在高度嚴謹條件下與含SEQ ID NO18或19所示核苷酸序列的ssDNA雜交的hGHv polyA信號結(jié)構(gòu)域。
所述表達盒可以以裸核酸構(gòu)建體的形式使用??蛇x地,所述表達盒可作為核酸載體(例如,表達載體如上述表達載體)的一部分導入。所述載體包括質(zhì)粒和病毒載體。載體可以包括位于所述表達盒側(cè)翼的序列,包括與諸如哺乳動物基因組序列的真核基因組序列或病毒基因組序列同源的序列。這樣就可以通過同源重組酶將所述表達盒導入真核細胞或病毒的基因組。例如,包含與病毒序列側(cè)接的表達盒的質(zhì)粒載體可用于制備適于將所述表達盒遞送至脊椎動物的病毒載體,所述脊椎動物包括魚、鳥類或哺乳動物細胞。所采用技術已為本領域技術人員所熟知。
所述術語“目的多核苷酸”意欲包括至少能夠被轉(zhuǎn)錄的核酸分子。所述分子相對于啟動子可為有或反義方向。可以采用本領域熟知的技術,使用反義構(gòu)建體抑制細胞中基因的表達。所述目的多核苷酸可以包括異源多核苷酸。術語異源多核苷酸包括任一基因。異源多核苷酸通常源自與表達盒或載體中與該異源多核苷酸可操作連接的調(diào)控元件所不同的物種,或者如果來自相同的來源,那么就是其原始形態(tài)的經(jīng)修飾的基因。因此,可操作地連接于啟動子的異源多核苷酸的來源與所述啟動子的來源不同,或者,如果它們的來源相同,那么就是其原始形態(tài)的經(jīng)修飾的啟動子。對異源多核苷酸的修飾可以通過以下方法進行,例如,通過用限制性內(nèi)切酶處理DNA制得能夠可操作連接于所述啟動子的DNA片段。另外還可使用定點誘變對異源多核苷酸進行修飾。異源多核苷酸還可以包括標記基因(例如,編碼β-半乳糖苷酶或綠色熒光蛋白的基因)或者其產(chǎn)物能夠調(diào)節(jié)其它基因表達的基因。因此,用作mRNA、tRNA和rRNA的多核苷酸也在該定義的范疇之內(nèi)。所述異源基因可以是野生型基因的等位變體,或者其可以是突變基因。mRNA可任選包括位于5’和/或3’端轉(zhuǎn)錄但不翻譯的側(cè)翼區(qū)域的一部分或全部,該區(qū)域與翻譯的編碼序列天然或非天然相連。
目的多核苷酸可以任選更進一步包括通常與所轉(zhuǎn)錄出的分子相連的相關轉(zhuǎn)錄控制元件,例如轉(zhuǎn)錄終止信號,聚腺苷酸化結(jié)構(gòu)域和下游增強子元件。所述目的多核苷酸可以編碼治療產(chǎn)物或者作為治療產(chǎn)物的模板,所述治療產(chǎn)物可以是例如肽,多肽,蛋白質(zhì)或者核糖核酸。所述目的多核苷酸通常是編碼多肽產(chǎn)物的DNA序列(例如cDNA或基因組DNA),所述多肽產(chǎn)物諸如酶(例如β-半乳糖苷酶);血液衍生物;激素;細胞因子;白介素;干擾素;TNF;生長因子(例如IGF-1);可溶性受體分子(例如,可溶性TNF受體分子);神經(jīng)遞質(zhì)或其前體;營養(yǎng)因子諸如BDNF,CNTF,NGF,IGF,GMF,aFGF,bFGF,NT3和NT5;載脂蛋白諸如ApoAI和ApoAIV;肌營養(yǎng)不良蛋白(dystrophin)或小肌營養(yǎng)不良蛋白(minidystrophin);腫瘤-抑制型蛋白諸如p53,Rb,RaplA,DCC和k-rev;凝血相關因子(factors involvedin coagulation)例如因子VII,VIII和IX;或者完整或部分天然或人工免疫球蛋白(例如Fab和ScFv,或者克隆的IgG的輕鏈或重鏈)。
目的多核苷酸還可以包括用作制備反義分子的模板,其在靶細胞中的轉(zhuǎn)錄使得細胞mRNA的基因表達或轉(zhuǎn)錄能夠得以控制??梢杂帽绢I域已知技術,所述分子可例如在靶細胞中被轉(zhuǎn)錄為細胞mRNA的互補RNA,從而能夠阻遏細胞mRNA翻譯為蛋白質(zhì)。具體而言,反義分子可以用于在炎性細胞因子或代謝細胞因子引發(fā)的關節(jié)炎和組織丟失治療過程中阻遏這些細胞因子的翻譯。
所述目的多核苷酸序列通常編碼診斷或治療用的多肽??梢允褂煤斜景l(fā)明所述表達盒的各種宿主細胞(例如,COS細胞或CHO細胞或其衍生物),在生物反應器中在體外制備所述多肽。可選地,本發(fā)明所述表達盒和/或載體可用于基因遞送,蛋白質(zhì)遞送,和/或基因治療。
本發(fā)明還可以用于表達毒性因子和多肽。后者具體而言可以為細胞毒素(諸如白喉毒素,假單胞菌毒素和篦麻毒素A),能誘導針對外界因子(例如胸苷激酶和胞嘧啶脫氨酶)的敏感性的產(chǎn)物,或者可選能夠誘導細胞死亡的因子(例如Grb3-3和抗-ras ScFv)。
治療用途意指能夠?qū)崿F(xiàn)消除疾病或病癥,治愈疾病或病癥,以及/或者減輕疾病或病癥嚴重程度的用途。診斷用途包括使用下述分子,所述分子能夠測定分子與疾病過程之間的因果關系或相關程度或提供相關信息,或者測定疾病或病癥是否存在。診斷試劑并不能直接促進疾病或病癥的改善。
另外,目的多核苷酸還可以編碼可用作疫苗的抗原多肽??乖嚯幕蚝怂岱肿釉醋杂诓≡矬w例如,細菌或病毒。例如,抗原多肽包括存在于病原生物體的基因組或基因產(chǎn)物中的抗原決定簇,所述病原生物體例如,病毒性出血性敗血癥(viral haemorrhagic septicemia),細菌性腎病,弧菌病(vibriosis)和癤病(furunculosis)的病原生物體。抗原性的多肽可以選自例如丙型肝炎病毒基因組的區(qū)域和基因產(chǎn)物。
在本申請中,“分離的”這一詞匯用來描述分子或組合物諸如本發(fā)明的載體或表達盒或目的多核苷酸時,意指所述分子或組合物與至少一種其它化合物例如蛋白質(zhì)、DNA、RNA或其它污染物分離開來,所述分子或組合物在體內(nèi)或其天然存在狀態(tài)下與所述其它化合物相結(jié)合。因此,當目的多核苷酸同與其天然結(jié)合的任何其它成分已經(jīng)分離開來的時候,那么就可以稱這種目的多核苷酸為分離的。但是,分離的組合物也可以是基本上純的。分離的組合物可以處于均質(zhì)狀態(tài)(homogeneous state)。它可以是干燥的/凍干的狀態(tài)或水溶液。純度和均質(zhì)性可以用分析化學技術測定,例如,聚丙烯酰胺凝膠電泳(PAGE),瓊脂糖凝膠電泳或高壓液相色譜(HPLC)。
在本申請中,術語“核酸分子”和“多核苷酸”可以交換使用,包括寡核苷酸(即,短多核苷酸)。另外它們還可以指合成的和/或非天然存在的核酸分子(例如,包括核苷酸類似物或經(jīng)過修飾的主鏈殘基或鍵)。另外,該術語還可指單鏈或雙鏈形式的脫氧核糖核苷酸或核糖核苷酸寡核苷酸。該術語包括其中含天然核苷酸類似物的核酸。該術語還包括帶有合成主鏈的核酸-樣結(jié)構(gòu)。本發(fā)明提供的DNA主鏈類似物包括磷酸二酯,硫代磷酸酯,二硫代磷酸酯,甲基-膦酸酯,氨基磷酸酯,烷基磷酸三酯,氨基磺酸酯,3’-硫縮醛,甲叉(甲亞氨基(methylimino)),3’-N-氨基甲酸酯,嗎啉代氨基甲酸酯,和肽核酸(PNA);參見Oligonucleotides and Analogues,F(xiàn).Eckstein編著,a Practical Approach,IRL Press at Oxford University Press(1991);AntisenseStrategies,Annals of the New York Academy of Sciences,Volume 600,Baserga和Denhardt編著(NYAS 1992);Milligan(1993)J.Med.Chem.361923-1937;Antisense Research and Applications(1993,CRC Press)。PNA含有非離子主鏈,例如N-(2-氨乙基(aminoethyl))甘氨酸單元。硫代磷酯鍵的描述見WO97/03211;WO 96/39154;Mata(1997)Toxicol.Appl.Pharmacol.144189-197。該術語包括的其它合成主鏈包括甲基-膦酸酯鍵或交替的甲基膦酸酯和磷酸二酯鍵(Strauss-Soukup(1997)Biochemistry368692-8698),和苯甲基-膦酸酯鍵(Samstag(1996)Antisense Nucleic Acid Drug Dev 6153-156)。
在本申請中,“重組”是指合成的或者體外操作的多核苷酸(例如,“重組多核苷酸”),使用重組多核苷酸在細胞或其它生物系統(tǒng)中制備產(chǎn)物的方法,或者由重組多核苷酸編碼的多肽(“重組蛋白”)。重組多核苷酸包括不同來源的核酸分子,其被連接入表達盒或表達載體,所述載體用于表達例如融合蛋白或者通過多肽的可誘導型或組成型表達制備的那些蛋白質(zhì)(例如,本發(fā)明表達盒或載體可操作地連接于異源的多核苷酸,例如多肽編碼序列)。
在常見的表達系統(tǒng)中,從異源多核苷酸制備多肽的過程要么不受調(diào)控,要么通過下述方式實現(xiàn)調(diào)控對自可操作地連接于編碼異源多肽的多核苷酸上游的轉(zhuǎn)錄啟動子的轉(zhuǎn)錄進行調(diào)節(jié)。但是,為了提供正確的轉(zhuǎn)錄終止和mRNA穩(wěn)定性,還必須在下游進行適當調(diào)控。本發(fā)明的一個方面,在本發(fā)明表達盒或載體中目的多核苷酸的下游提供了人生長激素變體(hGHv)聚腺苷酸化(polyA)信號結(jié)構(gòu)域。所述hGHv polyA信號結(jié)構(gòu)域含有源自人生長激素基因序列的序列。所述hGHv聚腺苷酸化信號結(jié)構(gòu)域序列在真核細胞中提供強的轉(zhuǎn)錄終止,并且提供增強了的mRNA穩(wěn)定性。該hGHv聚腺苷酸化信號結(jié)構(gòu)域具有獨特的優(yōu)勢,勝過包括使用CMV啟動子/增強子的表達盒和/或載體在內(nèi)的現(xiàn)有的表達盒和/或載體。
另外,還可能存在翻譯元件,并意圖包括允許RNA轉(zhuǎn)錄物翻譯為蛋白質(zhì)所必需的專門序列(諸如核糖體結(jié)合位點和起始密碼子)包括在內(nèi)。翻譯元件還可以包括共有序列、前導序列、剪接信號等,用于促進或提高翻譯程度,或者提高表達產(chǎn)物的穩(wěn)定性。例如,所述hGHv聚腺苷酸化信號結(jié)構(gòu)域提供提高了的mRNA穩(wěn)定性。本發(fā)明所述載體可以擁有輔助轉(zhuǎn)錄區(qū)域,例如內(nèi)含子,聚腺苷酸化信號,Shine/Dalgarno翻譯信號和Kozak共有序列(Shine et al.,Proc.Natl.Acad.Sci.(U.S.A.)711342-1346(1974);Kozak,Cell44283-292(1986))。
術語“復制元件”意圖包括允許載體在載體受體細胞中復制所必需的專門序列(例如復制起點)。通常,所述載體含有足以允許載體在受體細胞中自主穩(wěn)定復制的至少一個復制起點。
為了有助于本發(fā)明載體的篩選和保持,可以在所述載體中引入一或多種選擇標記(例如能夠賦予抗生素抗性或者使細胞能在極限培養(yǎng)基上或在毒性代謝產(chǎn)物存在的條件下生長的多核苷酸)。
另一實施方案中,本發(fā)明涉及含有上述構(gòu)建體(例如,本發(fā)明所述的表達盒或載體)的宿主細胞。本發(fā)明所述表達盒可以通過下述方式對宿主細胞進行重組修飾轉(zhuǎn)染或者轉(zhuǎn)化宿主細胞以表達所需的目的多核苷酸。在本申請中,術語“重組修飾”是指將本發(fā)明的表達盒或載體導入活細胞或表達系統(tǒng)。通常,其中含有目的多核苷酸的表達盒存在于載體(例如,質(zhì)粒)中。表達系統(tǒng)包括已導入了目的多核苷酸(其產(chǎn)物將被表達)的活宿主細胞,如本申請所述。
宿主細胞是指表達盒(包括其中含有表達盒的載體)能夠在其中增殖并且多核苷酸編碼的產(chǎn)物能夠被表達的細胞。宿主細胞還包括目的宿主細胞或其衍生物的任一后代。應理解所有后代并不會完全等同于親代細胞,因為在復制過程中有突變發(fā)生。但是,當使用“宿主細胞”這一術語時是將這樣的后代包括在內(nèi)的??捎糜诒景l(fā)明的宿主細胞包括細菌細胞、真菌細胞(例如,酵母)、植物細胞和動物細胞。例如,宿主細胞可以是較高等的真核細胞例如哺乳動物細胞等,或者較低等的真核細胞例如酵母等,或者所述宿主細胞可以是原核細胞例如細菌細胞等。將構(gòu)建體導入宿主細胞可以通過下列方式實施磷酸鈣轉(zhuǎn)染,DEAE-葡聚糖介導的轉(zhuǎn)染,或電穿孔(Davis,L.,Dibner,M.,Battey,I.,Basic Methods in Molecular Biology(1986))。作為合適宿主的代表性實例,可以列出的有真菌細胞,諸如酵母;昆蟲細胞諸如果蠅S2和斜紋夜蛾(Spodoptera)Sf9;動物細胞例如CHO,COS或Bowes黑素瘤;植物細胞等。通過本申請中的教導,可以認為合適宿主的選擇在本領域技術人員掌握的范圍之內(nèi)。
可用于本發(fā)明的宿主細胞是真核宿主細胞(例如,哺乳動物細胞)。在本發(fā)明的一方面,所述宿主細胞是適合于在細胞培養(yǎng)中生長的哺乳動物產(chǎn)物細胞。工業(yè)化生產(chǎn)中常用的所述細胞的實例有CHO,VERO,BHK,HeLa,CV1(包括Cos;Cos-7),MDCK,293,3T3,C127,骨髓瘤細胞系(具體是鼠的),PCI2和W138細胞。中國倉鼠卵巢(CHO)細胞被廣泛用于制備數(shù)種復合體重組蛋白,例如細胞因子,凝血因子和抗體(Brasel et al.,Blood882004-2012(1996);Kaufman et al.J.Biol Chem 2636352-6362(1988);McKinnon et al.,J Mol Endorinol 6231-239(1991);Wood et al.,J.Immunol1453011-3016(1990))。二氫葉酸還原酶(DHFR)-缺陷的突變體細胞系(Urlaub et al.,Proc Natl Acad Sci USA 774216-4220(1980))是所選的(ofchoice)CHO宿主細胞系,因為有效的DHFR可選擇且可擴增的基因表達系統(tǒng)使得能夠在這些細胞中實現(xiàn)高水平的重組蛋白質(zhì)表達(Kaufman,MethEnzymol 185527-566(1990))。此外,這些細胞易于以可貼壁或懸浮培養(yǎng)方式操作,并且表現(xiàn)出相對較好的遺傳穩(wěn)定性。CHO細胞和表達于其中的重組蛋白質(zhì)已經(jīng)被廣泛地研究,已經(jīng)被管理機構(gòu)批準用于臨床生產(chǎn)。此外,還可以使用源自上述任一細胞系并具有所需表型的宿主細胞。例如,衍生的宿主細胞包括已經(jīng)被選擇性用于培養(yǎng)所需表型(例如,通過陽性和/或陰性篩選方法)的CHO細胞(例如,DG44細胞系)。
本發(fā)明的一方面,提供了用于體外生產(chǎn)目的多核苷酸所編碼藥劑的表達系統(tǒng)。如本申請所述,所述目的多核苷酸可以編碼具有藥用、醫(yī)用、營養(yǎng)和/或工業(yè)價值的多肽。例如,所述的多核苷酸可以編碼基于多肽(polypeptide-based)的藥物。通常所述多肽可以作為細胞外產(chǎn)物表達。例如,可以用本發(fā)明所述表達盒和/或載體制備的多肽包括,但是不局限于,F(xiàn)lt3配體,CD40配體,促紅細胞生成素,血小板生成素,降鈣素,F(xiàn)as配體,NF-κB受體活化劑的配體(RANKL),TNF-相關的凋亡-誘導型配體(TRAIL),ORK/Tek,胸腺基質(zhì)(thymic stroma)-衍生的淋巴細胞生成素(lymphopoietin),粒細胞集落刺激因子,粒細胞-巨噬細胞集落刺激因子,肥大細胞生長因子,干細胞生長因子,表皮生長因子,RANTES,生長激素,胰島素,促胰島素生成素(insulinotropin),胰島素-樣生長因子,甲狀旁腺激素,干擾素(例如,干擾素β),神經(jīng)生長因子,胰高血糖素,白介素1-18,集落刺激因子,淋巴毒素-β,腫瘤壞死因子,白血病抑制因子,制瘤素(oncostatin)-M,細胞表面分子Elk和Hek的各種配體(例如eph-相關激酶的配體,或LERKS),以及抗體的輕鏈或重鏈。
任一上述蛋白質(zhì)的受體也可以用發(fā)明的方法和組合物表達,包括兩種形式的腫瘤壞死因子受體(稱為p55和p75),白介素-1受體(1型和2型),白介素-4受體,白介素-15受體,白介素-17受體,白介素-18受體,粒細胞-巨噬細胞集落刺激因子受體,粒細胞集落刺激因子受體,制瘤素-M和白血病抑制因子的受體,NF-κB的受體活化劑(RANK),TRAIL受體,BAFF受體,淋巴毒素β受體,TGFβ受體I型和2型,以及含有死亡結(jié)構(gòu)域的受體,諸如Fas或凋亡-誘導型受體(Apoptosis-Inducing Receptor)(AIR)。
可以用本發(fā)明表達盒和/或載體表達的其它蛋白質(zhì)包括簇分化抗原(稱為CD蛋白質(zhì)),例如,Leukocyte Tvping VI(Proceedings of the VIthInternational Workshop and Conference;Kishimoto,Kikutani et al.,eds.;Kobe,Japan,1996)中公開的那些,或者后來的研討會(workshop)公開的CD分子。所述分子的實例包括CD27,CD30,CD39,CD40,及其配體(CD27配體,CD30配體和CD40配體)。這其中的一些是TNF受體家族的成員,其中包括41BB和OX40;所述配體通常是TNF家族的成員(41BB配體和OX40配體也是);因此,所述TNF和TNFR家族的成員也可以使用本發(fā)明表達。
另外,具有酶促活性的多肽也可以按照本發(fā)明來表達。實例包括金屬蛋白酶-去整聯(lián)蛋白(disintegrin)家族成員,各種激酶,葡糖腦苷脂酶(glucocere brosidase),過氧化物歧化酶(superoxide dismutase),組織纖溶酶原激活物,因子VIII,因子IX,載脂蛋白E,載脂蛋白A-I,球蛋白,IL-2拮抗劑,α-1抗胰蛋白酶,TNF-α轉(zhuǎn)化酶(TACE),以及眾多的其它酶。具酶促活性蛋白的配體也可以使用本發(fā)明表達盒和載體表達。
本發(fā)明的組合物和方法還可用于表達其它類型的重組蛋白質(zhì)和多肽,包括免疫球蛋白分子或其部分以及嵌合抗體(例如,具有與鼠抗原結(jié)合區(qū)域偶聯(lián)的人恒定區(qū)的抗體)或其片段。已知多種技術可對編碼免疫球蛋白分子的DNA進行操作以產(chǎn)生編碼重組蛋白質(zhì)的DNA,所述重組蛋白質(zhì)諸如單鏈抗體,高親合力抗體,或其它以基于抗體的多肽(參見,例如,Larrick et al.,Biotechnology 7934-938(1989);Reichmann et al.,Nature 332323-327(1988);Roberts et al.,Nature 328731-734(1987);Verhoeyen et al.,Science2391534-1536(1988);Chaudhary et al.,Nature 339394-397(1989))??寺〉娜嗽椿贵w包括能特異性結(jié)合淋巴毒素β受體和整聯(lián)蛋白諸如VLA-1、VLA-4、和αvβ6的抗體,所述抗體可以是激動劑或拮抗劑。
各種融合蛋白質(zhì)也可以使用本發(fā)明的方法和組合物表達。所述融合蛋白質(zhì)的實例包括表達為與部分免疫球蛋白分子的融合物的蛋白質(zhì),表達為帶有拉鏈部分(zipper moiety)的融合蛋白的蛋白質(zhì),以及新的多功能蛋白質(zhì)諸如細胞因子與生長因子的融合蛋白質(zhì)(例如,GM-CSF和IL-3,MGF和IL-3)。WO 93/08207和WO 96/40918描述了一種被稱為CD40L的分子的各種可溶性寡聚形式的制備方法,包括分別免疫球蛋白融合蛋白質(zhì)和拉鏈(zipper)融合蛋白質(zhì);其中描述的技術適用于其它蛋白質(zhì)。
目的多核苷酸一旦被表達,那么所述表達產(chǎn)物(例如,蛋白質(zhì)或多肽)可以使用本領域常規(guī)技術純化。例如,當所述目的多核苷酸編碼含有純化標記的融合多肽時,可以使用可特異性結(jié)合所述標記的抗體來純化。在一方面,將編碼標記分子的寡核苷酸連接在編碼所需多肽的目的多核苷酸的5’或3’末端;所述寡核苷酸可以編碼聚His(例如Hexa His),或其它“標記”諸如FLAG,HA(流感病毒血凝素(hemaglutinin Influenza virus)),或可得到其商品化抗體的myc。在表達所述多肽時,通常將所述標記與多肽融合在一起,從用作將目的多肽自宿主細胞中的親合純化的方法。例如,可以通過使用抗標記抗體作為親和基質(zhì)的柱層析,來完成親合純化。任選地,隨后可以用各種方法例如蛋白水解切割,將標記從純化后的多肽除去。
本發(fā)明所述的表達盒和載體可用于將目的多核苷酸穩(wěn)定地轉(zhuǎn)移入宿主細胞。穩(wěn)定轉(zhuǎn)移意指目的多核苷酸在宿主中連續(xù)地保持。本發(fā)明所述的表達盒或載體還可以用于將目的多核苷酸在宿主細胞中的瞬時表達。瞬時轉(zhuǎn)染的宿主細胞會在細胞復制和生長期間丟失外源性DNA。
本發(fā)明的表達盒可用于將治療劑遞送至需要治療的人或動物??蛇x地,本發(fā)明所述表達盒可用于將編碼體內(nèi)發(fā)揮疫苗作用的潛在免疫原性多肽的藥劑遞送至受試者(例如,人),具體是用于家養(yǎng)動物的免疫接種,包括食用(foodstock)動物,例如魚,豬,馬,牛,犬及貓科。
本發(fā)明所述表達盒可以作用裸露的核酸構(gòu)建體直接施用,該構(gòu)建體通常含有與宿主細胞基因組同源的側(cè)翼序列??梢杂冒ㄉ飶椛鋼?biolistic)轉(zhuǎn)化法和脂質(zhì)轉(zhuǎn)染法(lipofection)在內(nèi)的幾種已知技術,來提高脊椎動物對裸露核酸構(gòu)建體的攝取。
可選地,所述表達盒可作為載體的一部分導入,所述載體包括質(zhì)粒載體或病毒載體。
通常,將所述表達盒或載體與可藥用的載體或稀釋劑混合來制備藥物組合物。合適的載體和稀釋劑包括等滲鹽溶液包括,例如,磷酸鹽緩沖的鹽水。可以將其中含有所述表達盒或載體的組合物配制用于各種施用形式,包括,例如經(jīng)肌內(nèi)施用。
當其中含有所述表達盒或載體的組合物以可注射形式使用時,通常將其與可藥用的載體混合制成可直接注射入待治療位點的可注射劑型。所述可藥用的載體或稀釋劑可以是,例如,無菌的等滲(isotonic)溶液。其中含有所述表達盒或載體的所述組合物還可以配制成為口服活性形式。
所用的實際劑型可由本領域技術人員輕易確定,并且隨待施用物質(zhì)的性質(zhì)和施用途徑變動。
所用物質(zhì)的劑量可以根據(jù)各種參數(shù)來調(diào)整,尤其是根據(jù)所用物質(zhì),受試者的年齡、體重、狀態(tài),所用施用方式和所需的臨床治療方案來調(diào)整。醫(yī)師應能根據(jù)任一具體受試者和疾病確定所需的施用途徑和劑量。
實施例pV10載體的構(gòu)建pV10構(gòu)建的其它細節(jié)概括于圖1。從用人巨細胞病毒株AD169轉(zhuǎn)染的人二倍體成纖維細胞中分離出基因組DNA(ATCC No.VR-538),然后用其作為PCR擴增CMV立即早期基因1啟動子/增強子區(qū)域(CMV IE1 P/E)的模板(CMV IE1基因的5’UTR的細節(jié)參見圖11(B)(SEQ ID NO1))。擴增啟動子,所用的引物在5’末端含有HindIII位點(tttAAGCTTGACATTGATTATTGACTAG;SEQ ID NO2;下劃線部分為限制酶切位點)并在3′末端含有BamHI位點(ttttGGATCCCTGTCAAGGACGGTGACTGC;SEO ID NO3;下劃線部分為限制酶切位點)。位于限制酶切位點之前的末端″t″核苷酸包含在寡核苷酸設計中,以促進限制性內(nèi)切酶消化,并在隨后的克隆步驟中被除去。
所有PCR反應全部在DNA engine PTC-200 Pelier Thermal Cycler(MJResearch,Watertown,MA)中完成。反應總體積為100μl1X NEB Vent聚合酶緩沖液(10mM KCl,20mM Tris pH 8.8,25℃,10mM(NH4)SO4,2mMMgSO4,0.1% Triton X-100),2.5mM dNTP’s,2單位Vent DNA聚合酶(New England Biolabs,Beverly,MA),每種引物各1μg,1μg分離自CMV感染的細胞的基因組DNA作為模板。反應的條件如下99℃、1分鐘,55℃、30秒,75℃、1.5分鐘,共15個循環(huán)。得到的片段用限制性內(nèi)切酶BamHI和HindIII(New England Biolabs)消化后,亞克隆入經(jīng)BamHI和HindIII消化的克隆載體pUC19。對插入片段的序列進行分析,發(fā)現(xiàn)與克隆的CMV IE1啟動子/增強子區(qū)域的公開序列一致。
pV40載體的構(gòu)建pV40的構(gòu)建概括于圖2。從分離自人成纖維細胞的基因組DNA通過PCR擴增出含有polyA信號的hGHv基因的3’UTR。5’引物的(+)鏈(TTTTGGATCCCTGCCCGGGTGGCATCC;SEQ ID NO20)含有末端的BamHI限制酶切位點,3’引物的(-)鏈含有末端的EcoRI位點(TTTTGAATTCATGAGAGGACAGTGCCAAGC;SEQ ID NO21)。PCR反應條件與pV10構(gòu)建中所述的相同。得到的PCR片段用BamHI和EcoRI消化后,用凝膠純化,然后連接入經(jīng)BamHI和EcoRI消化的載體pv10。得到的質(zhì)粒命名為pV40,用限制性內(nèi)切酶分析加以確證。隨后測序表明該hGHv基因的3 UTR(SEQ ID NO19)和公開的Genbank登錄號No.K00470中的hGHv基因序列(SEQ ID NO18)有少數(shù)幾個核苷酸不同。這些差異中的至少一些是由于等位基因突變引起的。
pV70載體的構(gòu)建用BspEl和HpaI消化所述pV40載體以便從內(nèi)含子A區(qū)域中去除317個核苷酸的片段(參見,例如,圖2和3)。pV60通過平端連接入(blunt endligation into)pV40的dhfr編碼區(qū)域的BspEI-HpaI制得。所述pV70表達載體含有調(diào)控轉(zhuǎn)錄的人巨細胞病毒主要立即早期1(hCMV IE1)啟動子/增強子區(qū)域。其中還含有hCMV IE1 5’UTR和內(nèi)含子A,而所述內(nèi)含子包括317個堿基對缺失。為了終止轉(zhuǎn)錄,所述載體含有人生長激素變體聚腺苷酸化(hGHv poly A)區(qū)域,SEQ ID NO19。pV40、pV60和pV70的構(gòu)建下文有詳細描述,進一步描述見附圖。
A.pXLC.1的產(chǎn)生將含有抗體輕鏈編碼序列的PCR產(chǎn)物用BamHI消化后,克隆入表達載體pV70的單一BamHI位點(圖3)。將所述輕鏈編碼區(qū)域插入單一的BamHI位點,該位點位于hCMV IE1內(nèi)含子3’末端的5’UTR和hGHv poly A區(qū)域的5’末端之間。所述質(zhì)粒命名為pXLC.1。圖4圖示的是產(chǎn)生pXLC.1載體的示意圖。
B.neo表達盒-pXLC.2的添加將新霉素轉(zhuǎn)移酶(neo)表達盒導入pXLC.1用作選擇標記(圖5)。所述neo表達盒被制備為名為pGT-N28的商品化質(zhì)粒(New England Biolabs,catalog#307-28)的BamHI/EcoRI片段。該質(zhì)粒中,所述neo基因是由磷酸甘油酸激酶(PGK)啟動子驅(qū)動,終止于PGK聚-腺苷酸化位點。使用下列銜接子寡聚物(adaptor aligo)將neo表達盒5’BamHI尾轉(zhuǎn)化為NarI尾端EcoRIBamHI相容(compatible)GATCGATGAATTCGG(SEQ ID NO4)CTACTTAAGCCGC(SEQ ID NO5)NarI相容利用這些接頭,添加了新的EcoRI位點。首先將所述銜接子連接至BamHI/EcoRI切出的neo片段,然后將經(jīng)轉(zhuǎn)化的NarI/EcoRI片段克隆入經(jīng)NarI和EcoRI消化后的pXLC.1。這樣,就將所述neo表達盒插入了所述質(zhì)粒的輕鏈序列德3’末端。該質(zhì)粒命名為pXLC.2(圖5)。
重鏈表達載體-pXHC.5的構(gòu)建A.重鏈的RT-PCR擴增通過RT-PCR反應擴增得到重鏈,使用5’PCR引物TTTTGGATCCATGTACTGGGTGAAGCAG(SEQ ID NO6),其中斜體序列是加入的帶有BamHI位點的接頭區(qū)域,加下劃線的堿基對應于重鏈編碼序列中的第二個甲硫氨酸。使用3’PCR引物,GCCCGGATCCTCATTTACCCGGAGACAG(SEQ ID NO7),其還含有添加的具有BamHI位點的接頭區(qū)域(斜體字母)以及對應于重鏈編碼序列并含終止密碼子的序列(下劃線部分)。獲得了1268個堿基對的預期PCR產(chǎn)物。
B.pXHC的構(gòu)建因為使用的5’PCR引物是與編碼區(qū)域中的第二個ATG密碼子而不是與PCR產(chǎn)物所含編碼區(qū)域中的起始ATG雜交,所以該重鏈編碼區(qū)域是不完整的。將含有所述不完整重鏈的BamHI片段克隆入質(zhì)粒pV60(圖6)。除了在內(nèi)含子的缺失位置處含有dhfr編碼區(qū)外,該載體與pV70(上述)完全相同。將所述重鏈編碼區(qū)域插入單一的BamHI位點,該位點位于hCMV IE1內(nèi)含子3’末端的5’非翻譯序列與hGHv變體poly A區(qū)域的5’末端之間。將這種含有所述不完整重鏈的質(zhì)粒命名為pXHC。
C.重鏈編碼序列的填充(completion)-pXHC.1將上述重鏈序列中缺失的編碼區(qū)插入pXHC制備得到質(zhì)粒pXHC.1(圖7)。為了實現(xiàn)這一點,使用含有抗體編碼序列的質(zhì)粒作為模板,通過PCR制備得到一種片段。使用的5’PCR引物為PstIBamHITTTTCTGCAGTCACCGTCCTTGACACGGGATCCATGGACTGGACCTTGGAGGG(SEQ ID NO8)。斜體序列對應于BamHI位點5′側(cè)的pXHC序列,粗體序列對應于從重鏈序列中起始密碼子前的兩個堿基處開始的序列。所用的3’引物為CTGAGGAGACGGTGACCAGGGTCCCTTGGCCCC(SEQID NO9)。該引物與第一外顯子(重鏈可變區(qū))的末端雜交。正如所料得到了445個堿基對的PCR產(chǎn)物,用PstI和StuI切割該產(chǎn)物。將該PstI/StuI片段克隆入經(jīng)PstI和StuI切割的pXHC以制備pXHC.1。
D.內(nèi)含子dhfr的去除-pXHC.3pXHC.1含有hCMV IE1內(nèi)含子中的dhfr基因。由于這種結(jié)構(gòu)在擴增時可能引發(fā)問題,從該內(nèi)含子除去dhfr基因,并將表達盒插入到重鏈表達盒的3’(圖8)。第一步是去除內(nèi)含子中的dhfr基因。這一步通過下述方法完成從pXHC.1中切割出重鏈編碼序列作為PstI/EcoRI片段,然后將其克隆入經(jīng)同樣酶切割的pXLC.1質(zhì)粒。通過這一克隆步驟容易地將所述質(zhì)粒中的輕鏈置換為重鏈(switched the light chain for the heavy chain)。得到的質(zhì)粒與pXHC.1相同,除了含dhfr基因的內(nèi)含子被具有上述pXLC.1缺失的內(nèi)含子取代外。該重鏈質(zhì)粒命名為pXHC.3(圖8)。
E.dhfr表達盒的插入-pXHC.5dhfr構(gòu)型(configuration)改變的第二步是將dhfr表達盒插入重鏈表達盒的3’(圖9)。所述dhfr表達盒源自于質(zhì)粒pSI-DHFR的BglII/BamHI片段上,并含有SV40早期啟動子、dhfr基因和SV40 poly A區(qū)域。使用下列銜接子寡聚物,將該片段克隆入位于pXHC.3中hGHv poly A區(qū)域3’末端的EcoRI位點SalIEcoRI相容AATTCGTCGACA(SEQ ID NO10)GCAGCTGTCTAG(SEQ ID NO11)BamHI/BglII相容首先將該銜接子連接到經(jīng)EcoRI切割的質(zhì)粒,然后將所述BglII/BamHIdhfr表達盒連接到連接了銜接子的(adapted)質(zhì)粒。該質(zhì)粒命名為pXHC.5(圖9)。
pXLC.2和pXHC.5的定性使用限制性內(nèi)切酶對這兩種質(zhì)粒進行分析,驗證插入片段的存在和方向。另外,對質(zhì)粒的編碼區(qū)進行測序,證實PCR或克隆步驟過程中沒有任何突變的累積。
通過下述方法驗證功能性neo選擇標記的存在將pXLC.2轉(zhuǎn)染入CHO細胞,證明抗G418的抗性。當將pXLC.2和pXHC.5質(zhì)粒共-轉(zhuǎn)染入適應無血清條件的(serum free adapted)DG44 CHO宿主細胞時,證明能夠進行雙重選擇的能力。在雙重選擇培養(yǎng)基(含400mg/ml G418的α-MEM 10%dFBS)中,菌落從共-轉(zhuǎn)染物(co-transfection)長出。同樣條件下,任一單獨的選擇培養(yǎng)基(either selection alone)(α-MEM或400mg/ml G418)能殺死未轉(zhuǎn)染的細胞。
載體的構(gòu)建pV80和pV90載體從重鏈表達載體pXHC.5制備pV80(圖10)。使用BamHI去除pXHC.5中的重鏈編碼序列。連接該主鏈使其在BamHI位點處再環(huán)化。
在pV80載體上做兩處改變制備pV90(圖11)。pV80構(gòu)建體中第3166位的NotI位點(位于dhfr編碼區(qū)的末端,參見所附序列)被破壞。為了實現(xiàn)這一點,用NotI消化該質(zhì)粒,用Klenow聚合酶將突出端“補平(fill-in)”。因此,再連接后的質(zhì)粒就失去了第3166位的NotI位點。然后,用BamHI消化所述載體,導入NotI接頭,在克隆位點創(chuàng)建新的NotI位點,該NotI接頭是下列14-mer自身退火制得的GATCCGCGGCCGCG.(SEQ IDNO12)。當一起退火時,所述接頭序列為NotlBamHI相容的GATCCGCGGCCGC(SEQ ID NO13)CGCCGGCGCCTAGG(SEQ ID NO14)BamHI相容的該克隆步驟在NotI位點的兩側(cè)各自再建BamHI位點。這些BamHI位點可用于用該載體產(chǎn)生的穩(wěn)定細胞系的基因分析。通過序列分析驗證pV90的克隆位點序列。
在pv80載體中,可以將多核苷酸(例如,編碼序列)克隆入BamHI位點GGATCCCTGCCCGGGT(SEQ ID NO15)。所述粗體序列代表BamH1位點。在pV90載體中,可以將多核苷酸(例如,編碼序列)克隆入BamHI或NotI位點GGATCCGCGGCCGCGGATCC CTGCCCGGGT(SEQ ID NO16)。其中,粗體序列表示BamHI位點,下劃線序列表示NotI位點。為了取得使用NotI位點時的最佳結(jié)果,應該在PCR引物中起始密碼子之前添加“C”以實現(xiàn)與Kozak序列的最佳匹配(例如,GGATCC GCGGCCGC C ATG.(SEQID NO17))。
pV80和pV90中的限制酶切位點除了NotI限制酶切位點外pV80和pV90完全相同pV80在第3166位具有單一NotI位點(dhfr編碼區(qū)的末端),pV90在第1260位具有單一NotI位點(克隆位點)。
其中的2個或少于2個被發(fā)現(xiàn)的共同限制酶切位點(common restrictionsites of which 2 or fewer were found)包括表1中列出的位點。
表1
未發(fā)現(xiàn)下列常見酶切位點表2
報道物基因的克隆將其中含有CMV IE1、內(nèi)含子A片段和hGHv polyA構(gòu)建體的表達盒/載體與以基于商品化SV40的高表達載體進行比較。
使用分泌的堿性磷酸酶(SEAP)作為報道物來比較所述質(zhì)粒?;赟V40的表達載體pSEAP2-對照(Cat#6052-1,Clontech)能夠在SV40早期啟動子和SV40增強子的控制下表達SEAP。所述SEAP編碼序列后接SV40晚期聚腺苷酸化信號以確保真核細胞中的SEAP轉(zhuǎn)錄物能得到正確有效的加工。合成的轉(zhuǎn)錄阻遏物(transcription blocker)(TB)由鄰接的聚腺苷酸化和轉(zhuǎn)錄暫停位點組成,其位于MCS上游,能夠減少背景轉(zhuǎn)錄。所述載體整合大量以下特性通過提高SEAP表達的效率提高SEAP敏感性,或改善所述載體的使用(utility)。這些包括增加Kozak共有序列翻譯起始位點;去除SV40小-t內(nèi)含子,該內(nèi)含子能夠?qū)е码[蔽剪接以及一些基因和/或細胞類型中表達的減少;將SV40的早期聚腺苷酸化信號轉(zhuǎn)換為晚期聚腺苷酸化信號,這通常會引起mRNA水平增加5倍;擴大的多克隆位點(MCS);壓縮(compact)質(zhì)粒大??;除去SEAP mRNA 3’非翻譯區(qū)的外源序列。Genbank登錄號U89938。
為了制備pCMV-hGHvPA-SEAP質(zhì)粒,用PCR方法從pSEAP2-對照質(zhì)粒中提取SEAP編碼序列,并將其克隆入pV110載體。pV110質(zhì)粒是pV90的衍生物(無dhfr表達盒,不同的多聚接頭,除此以外都完全相同)。通過測序?qū)λ鰌CMV-hGHvPA-SEAP質(zhì)粒構(gòu)建體進行驗證。
用于轉(zhuǎn)染的宿主是二氫葉酸還原酶(dhfr)缺陷的中華倉鼠卵巢細胞系DG44(Urlaub et al.,Cell 33,405-412(1983))。用編碼二氫葉酸還原酶(dhfr)的質(zhì)粒共-轉(zhuǎn)染CMVSEAP和pSEAP2-對照報道質(zhì)粒,以便能夠篩選出穩(wěn)定的轉(zhuǎn)染體(pSI-DHFR.2,圖12)。每一轉(zhuǎn)染含有50μg報道質(zhì)粒和5μg pSI-dhfr.2。所有DNA都使用Megaprep試劑盒(Qiagen)制備。在轉(zhuǎn)染之前,用ETOH沉淀DNA,然后用70%EtOH洗滌,干燥,重懸于HEBS(20mMHepes,pH 7.05,137mM NaCl,5mM KCl,0.7mM Na2HPO4,6mM葡萄糖),然后在轉(zhuǎn)染前進行定量。用包括pUC18在內(nèi)的陰性對照(ATCC No.37253)作為報道物對照,用無DNA轉(zhuǎn)染(no DNA transfection)的作為轉(zhuǎn)染對照(表3)。
0.28kV和950mF條件下使用0.4cm樣品池(BioRad),通過在0.8mlHEBS中進行電穿孔,轉(zhuǎn)染細胞和DNA。每次轉(zhuǎn)染都使用5E6細胞。電穿孔脈沖后,讓細胞在樣品池中于室溫保溫5-10分鐘。然后,將其轉(zhuǎn)移到離心管(含有10ml含核苷及10%dFBS的αMEM)中,然后1K RPM沉淀5分鐘。將重懸的沉淀物接種于含有αMEM(含10%dFBS但無核苷)的6-孔平板中,在濕潤溫箱中,于5%CO2、36℃保溫直至菌落形成。
表3轉(zhuǎn)染試驗
轉(zhuǎn)染約2周后,在只含有pSIDHFR.2質(zhì)粒的轉(zhuǎn)染物中有菌落形成。穩(wěn)定轉(zhuǎn)染體以合并物(pool)或者分離株方式進行分析。試驗測定比繁殖力,其中把培養(yǎng)基換為新鮮的培養(yǎng)基,24小時后從培養(yǎng)基取樣,進行細胞計數(shù)。將產(chǎn)品滴度標準化為24小時的試驗結(jié)束時的細胞數(shù)目,然后將產(chǎn)率表示為每個細胞的SEAP活性。
SEAP試驗.使用the Great EscAPeTM SEAP Reporter System3(clontech)對經(jīng)調(diào)節(jié)的培養(yǎng)基(conditioned medium)進行分析。該試驗使用熒光底物檢測經(jīng)調(diào)節(jié)的培養(yǎng)基中的SEAP活性。按照96孔格式(format)使用試劑盒,除了下列內(nèi)容不同外,按照廠商說明書進行。把試劑盒中的試驗緩沖液換為1.5M二乙醇胺,0.75mM MgCl2,15mM L-同型精氨酸(homoarginine),和10% Emerald II(Cat#9761,Applied BiosystemsBiosystems)。所有標準物和樣本都用新鮮的培養(yǎng)基而不用提供的稀釋緩沖液來稀釋。將只在60分鐘后讀數(shù)1次改為以10-20分鐘的間隔時間多次讀數(shù),然后使用這些讀數(shù)結(jié)果將SEAP活性表示為每分鐘相對熒光單位(RFU/min)。平板讀數(shù)器(Cytofluor II,PerSeptive Biosystems)使用的發(fā)射濾波器(emission filter)為460nm而非推薦的449nm。
根據(jù)試劑盒提供的標準物,將RFU/min值相對于標準曲線標準化。由于提供的標準物未定量,所以所有值全都是相對值。將這些相對值相對于細胞數(shù)目和孵育期進行標準化,以產(chǎn)生相對比繁殖力(每個細胞每日的SEAP活性)。
合并物.菌落出現(xiàn)后,收集并且合并來自每次轉(zhuǎn)染的細胞。將合并物以每孔~2×105個細胞種植入6-孔平板。第二天,將培養(yǎng)基換為2ml新鮮培養(yǎng)基。24小時后,進行細胞計數(shù),使用培養(yǎng)基的樣本測定SEAP活性。合并物試驗的結(jié)果圖示于圖13。
分離株.從轉(zhuǎn)染物“挑取(picking)”菌落獲得分離株。通過用設定在50ml的P200 PipetmanTM從菌落直接吸取完成“挑取”。首先將吸出的菌落轉(zhuǎn)移到48孔平板,然后在有足夠數(shù)目的細胞時再轉(zhuǎn)移到6孔平板。在將近鋪滿至鋪滿細胞密度時,使用上述24-小時試驗測定比產(chǎn)率(圖14)。
如圖13和14概括的那樣,基于CMV IE啟動子和hGHv polyA信號結(jié)構(gòu)域的組合的表達載體比自稱具有高表達能力的商品化載體要好得多。
雖然已經(jīng)描述了本發(fā)明的許多實施方案。但是,顯然還可以做各種改變而不脫離本發(fā)明的實質(zhì)和范圍。因此,其它實施方案也在下列權利要求的范圍之內(nèi)。
序列表<110>比奧根艾迪克公司(Biogen Idec Inc.)<120>用于瞬時表達或穩(wěn)定表達外源分子的表達盒和載體<130>13751-013WO1<150>US 60/448,179<151>2003-02-14<160>21<170>FastSEQ for Windows Version 4.0<210>1<211>6069<212>DNA<213>人(Homo sapiens)<400>1agcttgacat tgattattga ctagttatta atagtaatca attacggggt cattagttca 60tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 120gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 180agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 240acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 300cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 360cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 420atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 480gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 540gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttagtgaa 600ccgtcagatc gcctggagac gccatccacg ctgttttgac ctccatagaa gacaccggga 660ccgatccagc ctccgcggcc gggaacggtg cattggaacg cggattcccc gtgccaagag 720tgacgtaagt accgcctata gagtctatag gcccaccccc ttggcttctt atgcatgcta 780tactgttttt ggcttggggt ctatacaccc ccgcttcctc atgttatagg tgatggtata 840gcttagccta taggtgtggg ttattgacca ttattgacca ctcccctatt ggtgacgata 900ctttccatta ctaatccata acatggctct ttgccacaac tctctttatt ggctatatgc 960caatacactg tccttcagag actgacacgg actctgtatt tttacaggat ggggtctcat1020ttattattta caaattcaca tatacaacac caccgtcccc agtgcccgca gtttttatta1080aacataacgt gggatctcca cgcgaatctc gggtacgtgt tccggaacgg tggagggcag1140tgtagtctga gcagtactcg ttgctgccgc gcgcgccacc agacataata gctgacagac1200taacagactg ttcctttcca tgggtctttt ctgcagtcac cgtccttgac acgggatccg1260cggccgcgga tccctgcccg ggtggcatcc ctgtgacccc tccccagtgc ctctcctggt1320cgtggaaggt gctactccag tgcccaccag ccttgtccta ataaaattaa gttgcatcat1380tttgtttgac taggtgtcct tgtataatat tatggggtgg aggcgggtgg tatggagcaa1440ggggcaggtt gggaagacaa cctgtagggc cttcagggtc tattgggaac caggctggag1500tgcagtggca cgatcttggc tcgctgcaat ctccgcctcc tgggttcaag cgattctcct1560gcctcagtct cccgaatagt tgggattcca ggcatgcacg accaggctca gctaattttt1620gtatttttgg tagagacggg gtttcaccat attggccagt ctggtctcca tctcctgacc1680tcaggtaatc cgcccgcctc ggcctcccaa attgctggga ttacaggtat gagccactgg1740gcccttccct gtcctgtgat tttaaaataa ttataccagc agaaggacgt ccagacacag1800catgggctac ctggccatgc ccagccagtt ggacatttga gttgtttgct tggcactgtc1860ctctcatgaa ttcgtcgaca gatctgcgca gcaccatggc ctgaaataac ctctgaaaga1920ggaacttggt taggtacctt ctgaggcgga aagaaccagc tgtggaatgt gtgtcagtta1980gggtgtggaa agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat2040tagtcagcaa ccaggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc2100atgcatctca attagtcagc aaccatagtc ccgcccctaa ctccgcccat cccgccccta2160actccgccca gttccgccca ttctccgccc catggctgac taattttttt tatttatgca2220gaggccgagg ccgcctcggc ctctgagcta ttccagaagt agtgaggagg cttttttgga2280
ggcctaggct tttgcaaaaa gcttgattct tctgacacaa cagtctcgaa cttaagctgc2340agaagttggt cgtgaggcac tgggcaggta agtatcaagg ttacaagaca ggtttaagga2400gaccaataga aactgggctt gtcgagacag agaagactct tgcgtttctg ataggcacct2460attggtctta ctgacatcca ctttgccttt ctctccacag gtgtccactc ccagttcaat2520tacagctctt aaggctagag tacttaatac gactcactat aggctagcat ggttcgacca2580ttgaactgca tcgtcgccgt gtcccaaaat atggggattg gcaagaacgg agacctaccc2640tggcctccgc tcaggaacga gttcaagtac ttccaaagaa tgaccacaac ctcttcagtg2700gaaggtaaac agaatctggt gattatgggt aggaaaacct ggttctccat tcctgagaag2760aatcgacctt taaaggacag aattaatata gttctcagta gagaactcaa agaaccacca2820cgaggagctc attttcttgc caaaagtttg gatgatgcct taagacttat tgaacaaccg2880gaattggcaa gtaaagtaga catggtttgg atagtcggag gcagttctgt ttaccaggaa2940gccatgaatc aaccaggcca cctcagactc tttgtgacaa ggatcatgca ggaatttgaa3000agtgacacgt ttttcccaga aattgatttg gggaaatata aacttctccc agaataccca3060ggcgtcctct ctgaggtcca ggaggaaaaa ggcatcaagt ataagtttga agtctacgag3120aagaaagact aactcgagaa ttcacgcgtg gtacctctag agtcgacccg ggcggccggc3180cgcttcgagc agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc3240agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta3300taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg3360gggaggtgtg ggaggttttt taaagcaagt aaaacctcta caaatgtggt aaaatcgata3420aggatctgtc gacgaattca ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg3480gcgttaccca acttaatcgc cttgcagcac atcccccttt cgccagctgg cgtaatagcg3540aagaggcccg caccgatcgc ccttcccaac agttgcgcag cctgaatggc gaatggcgcc3600tgatgcggta ttttctcctt acgcatctgt gcggtatttc acaccgcata tggtgcactc3660tcagtacaat ctgctctgat gccgcatagt taagccagcc ccgacacccg ccaacacccg3720ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg3780tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc gcgagacgaa3840agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg gtttcttaga3900cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa3960tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt4020gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg4080cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag4140atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg4200agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg4260gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt4320ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga4380cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac4440ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc4500atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc4560gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac4620tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag4680gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg4740gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta4800tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg4860ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata4920tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt4980ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc5040ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct5100tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa5160ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag5220tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc5280tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg5340actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca5400cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat5460gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg5520tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc5580ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc5640ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc5700cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg5760cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga5820gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt tggccgattc5880attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag cgcaacgcaa5940
ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg cttccggctc6000gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc tatgaccatg6060attacgcca6069<210>2<211>28<212>DNA<213>人工序列<220>
<223>引物<400>2tttaagcttg acattgatta ttgactag 28<210>3<211>30<212>DNA<213>人工序列<220>
<223>引物<400>3ttttggatcc ctgtcaagga cggtgactgc 30<210>4<211>15<212>DNA<213>人工序列<220>
<223>銜接子寡核苷酸<400>4gatcgatgaa ttcgg 15<210>5<211>13<212>DNA<213>人工序列<220>
<223>銜接子寡核苷酸<400>5ctacttaagc cgc 13<210>6<211>28<212>DNA<213>人工序列<220>
<223>引物<400>6ttttggatcc atgtactggg tgaagcag 28
<210>7<211>28<212>DNA<213>人工序列<220>
<223>引物<400>7gcccggatcc tcatttaccc ggagacag 28<210>8<211>53<212>DNA<213>人工序列<220>
<223>引物<400>8ttttctgcag tcaccgtcct tgacacggga tccatggact ggaccttgga ggg 53<210>9<211>33<212>DNA<213>人工序列<220>
<223>引物<400>9ctgaggagac ggtgaccagg gtcccttggc ccc 33<210>10<211>12<212>DNA<213>人工序列<220>
<223>銜接子寡核苷酸<400>10aattcgtcga ca 12<210>11<211>12<212>DNA<213>人工序列<220>
<223>銜接子寡核苷酸<400>11gcagctgtct ag 12<210>12<211>14<212>DNA
<213>人工序列<220>
<223>合成制備的寡核苷酸<400>12gatccgcggc cgcg14<210>13<211>13<212>DNA<213>人工序列<220>
<223>合成制備的寡核苷酸<400>13gatccgcggc cgc 13<210>14<211>14<212>DNA<213>人工序列<220>
<223>合成制備的寡核苷酸<400>14cgccggcgcc tagg14<210>15<211>16<212>DNA<213>人工序列<220>
<223>合成制備的寡核苷酸<400>15ggatccctgc ccgggt 16<210>16<211>30<212>DNA<213>人工序列<220>
<223>合成制備的寡核苷酸<400>16ggatccgcgg ccgcggatcc ctgcccgggt 30<210>17<211>18<212>DNA<213>人工序列<220>
<223>合成制備的寡核苷酸
<400>17ggatccgcgg ccgccatg18<210>18<211>2660<212>DNA<213>人(Homo sapiens)<400>18gaattcagca ctgaatcatg cccagaaccc ccgcaatcta ttggctgtgc tttggcccct 60tttcccaaca cacacattct gtctggtggg tggaggggaa acatgcgggg aggaggaaag 120gaataggata gagagtggga tggggtcggt aggggtctca aggactggcc tatcctgaca 180tccttctccg cgttcaggtt ggccaccatg gcctgctgcc agagggcacc cacgtgaccc 240ttaaagagag gacaagttgg gtggtatctc tggctgacat tctgtgcaca accctcacaa 300cgctggtgat ggtgggaagg gaaagatgac aagtcagggg gcatgatccc agcatgtgtg 360ggaggagctt ctaaattatc cattagcaca agcccgtcag tggccccagg cctaaacatg 420cagagaaaca ggtgaggaga agcagcgaga gagaaggggc caggtataaa aagggcccac 480aagagaccag ctcaaggatc ccaaggccca actccccgaa ccactcaggg tcctgtggac 540agctcactag cggcaatggc tgcaggtaag cgcccctaaa atccctttgg cacaatgtgt 600cctgagggga gaggcggcgt cctgtagatg ggacgggggc actaaccctc aggtttgggg 660cttatgaatg ttagctatcg ccatctaagc ccagtatttg gccaatctct gaatgttcct 720ggtccctgga ggaggcagag agagagagag agaaaaaaaa aacccagctc ctggaacagg 780gagagcgctg gcctcttgct ctccagctcc ctctgttgcc tccggtttct ccccaggctc 840ccggacgtcc ctgctcctgg cttttggcct gctctgcctg tcctggcttc aagagggcag 900tgccttccca accattccct tatccaggct ttttgacaac gctatgctcc gcgcccgtcg 960cctgtaccag ctggcatatg acacctatca ggagtttgta agctcttggg taatgggtgc1020gcttcagagg tggcaggaag gggtgaattt cccccgctgg gaagtaatgg gaggagacta1080aggagctcag ggttgttttc tgaagtgaaa atgcaggcag atgagcatac gctgagtgag1140gttcccagaa aagtaacaat gggagcaggt ctccagcata gaccttggtg ggcggtcctt1200ctcctaggaa gaagcctata tcctgaagga gcagaagtat tcattcctgc agaaccccca1260gacctccctc tgcttctcag agtctattcc aacaccttcc aacagggtga aaacgcagca1320gaaatctgtg agtggatgcc ttctccccag gtgggatggg gtagacctgt ggtcagagcc1380cccgggcagc acagccactg ccggtccttc ccctgcagaa cctagagctg ctccgcatct1440ccctgctgct catccagtca tggctggagc ccgtgcagct cctcaggagc gtcttcgcca1500acagcctggt gtatggcgcc tcggacagca acgtctatcg ccacctgaag gacctagagg1560aaggcatcca aacgctgatg tgggtgaggg tggcaccagg atccaatcct ggggccccac1620tggcttccag ggactgggga gagaaacact gctgccctct ttttagcagt caggcgctga1680cccaagagaa ctcaccgtat tcttcatttc ccctcgtgaa tcctccaggc ctttctctac1740aacctggagg ggagggagga aaatggatga atgagagagg gagggaacag tgcccaagcg1800cttggcctct ccttctcttc cttcactttg cagaggctgg aagatggcag cccccggact1860gggcagatct tcaatcagtc ctacagcaag tttgacacaa aatcgcacaa cgatgacgca1920ctgctcaaga actacgggct gctctactgc ttcaggaagg acatggacaa ggtcgagaca1980ttcctgcgca tcgtgcagtg ccgctctgtg gagggcagct gtggcttcta gctgcccggg2040tggcatccct gtgacccctc cccagtgcct ctcctggtcg tggaaggtgc tactccagtg2100cccaccagcc ttgtcctaat aaaattaagt tgcatcattt tgtttgacta ggtgtccttg2160tataatatta tggggtggag gcgggtggta tggagcaagg ggccaggttg ggaagacaac2220ctgtagggcc ttcagggtct attcgggaac caggctggag tgcagtggca gtcttggctc2280gctgcaatct ccgcctcctg ggttcaagcg attctcctgc ctcagtctcc cgaatagttg2340cgattccagg catgcaagac caggctcagc taatttttgt atttttggta gagacggggt2400ttcaccatat tggccagtct ggtctccatc tcctgacctc aggtaatccg cccgcctcgg2460cctcccaaat tgctgggatt acaggtatga gccactgggc ccttccctgt cctgtgattt2520taaaataatt ataccagcag aaggacgtcc agacacagca tgggctacct ggccatgccc2580agccagttgg acatttgagt tgtttgcttg gcactgtcct ctcatgcatt gggtccactc2640agtagatgct tgttgaattc2660<210>19<211>594<212>DNA<213>人(Homo sapiens)
<400>19ctgcccgggt ggcatccctg tgacccctcc ccagtgcctc tcctggtcgt ggaaggtgct 60actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt gtttgactag 120gtgtccttgt ataatattat ggggtggagg cgggtggtat ggagcaaggg gccaggttgg 180gaagacaacc tgtagggcct tcagggtcta ttcgggaacc aggctggagt gcagtggcag 240tcttggctcg ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc tcagtctccc 300gaatagttgc gattccaggc atgcaagacc aggctcagct aatttttgta tttttggtag 360agacggggtt tcaccatatt ggccagtctg gtctccatct cctgacctca ggtaatccgc 420ccgcctcggc ctcccaaatt gctgggatta caggtatgag ccactgggcc cttccctgtc 480ctgtgatttt aaaataatta taccagcaga aggacgtcca gacacagcat gggctacctg 540gccatgccca gccagttgga catttgagtt gtttgcttgg cactgtcctc tcat 594<210>20<211>27<212>DNA<213>人工序列<220>
<223>引物<400>20ttttggatcc ctgcccgggt ggcatcc 27<210>21<211>30<212>DNA<213>人工序列<220>
<223>引物<400>21ttttgaattc atgagaggac agtgccaagc 30
權利要求
1.表達盒,其中含有人CMV立即早期1(hCMV IE1)啟動子/增強子區(qū)域;目的多核苷酸;和變體人生長激素(hGHv)polyA信號結(jié)構(gòu)域或其變體,其中所述hGHvpolyA信號的長度為至少100個核苷酸并含有序列AATAAA,并且所述polyA變體與hGH polyA信號結(jié)構(gòu)域具有至少92%的同一性。
2.權利要求1所述的表達盒,其中所述的人CMV IE1啟動子/增強子區(qū)域含有SEQ ID NO1中約x1到約x2所示的序列,其中x1表示在SEQ IDNO1中約第1-20位之間的核苷酸,x2表示在SEQ ID NO1中約第715-720位之間的核苷酸。
3.權利要求1所述的表達盒,其還包含長度可變的間插序列(VLIVS),所述VLIVS含有剪接供體和剪接受體位點。
4.權利要求3所述的表達盒,其中所述的VLIVS含有hCMV IE1基因的內(nèi)含子A。
5.權利要求3所述的表達盒,其中所述VLIVS含有hCMV IE1基因的內(nèi)含子A,該基因具有在所述內(nèi)含子A的剪接受體和剪接供體之間的缺失。
6.權利要求5所述的表達盒,其中所述的VLIVS含有SEQ ID NO1中約x3到x4所示的序列,其中x3表示在SEQ ID NO1中約第715-720位之間的核苷酸,x4表示在SEQ ID NO1中約第1236-1254位之間的核苷酸。
7.權利要求1所述的表達盒,其中所述目的多核苷酸編碼治療劑。
8.權利要求1所述的表達盒,其中所述polyA信號結(jié)構(gòu)域含有SEQ IDNO19的至少100個連續(xù)核苷酸。
9.權利要求8所述的表達盒,其中所述polyA信號結(jié)構(gòu)域包含SEQ IDNO19。
10.權利要求1所述的表達盒,還含有DHFR基因。
11.表達載體,其中含有權利要求1-10中任一項所述的表達盒。
12.宿主細胞,其中含有權利要求11所述的表達載體。
13.宿主細胞,其中含有權利要求1-10中任一項所述的表達盒。
全文摘要
本發(fā)明提供了用于表達多核苷酸的表達盒和含有所述表達盒的載體。所述表達盒包括啟動子/增強子,插入?yún)^(qū),以及聚腺苷酸化信號結(jié)構(gòu)域。本發(fā)明還提供了表達系統(tǒng)以及所述表達盒及載體的使用方法。
文檔編號C07H21/04GK1774500SQ200480010147
公開日2006年5月17日 申請日期2004年2月13日 優(yōu)先權日2003年2月14日
發(fā)明者威廉·P·西斯克, 霍利·普倫蒂斯 申請人:比奧根艾迪克Ma公司