專利名稱:人Corin基因的控制序列的制作方法
技術領域:
本發明提供了一種從哺乳動物Corin基因中分離得到的新的表達控制區。該控制區優選地激活心臟細胞內的轉錄。本發明還提供了用該控制區鑒定能調控Corin表達的物質以及治療心臟病的方法及組合物。
背景技術:
Corin,一種心臟的跨膜絲氨酸蛋白酶,在前心房肽(pro-ANP)到ANP的轉化上發揮著重要作用(Yan,W.et al.(2000)PNAS,978525-8529;Wu et al.(2002)J.Biol.Chem.27716900-16905)。ANP是一種心臟激素,它通過以受體依賴性方式促進鹽的排泄、增加尿量、減少血容量以及緩和血管張力來降低高血壓。例如高血壓和心衰的主要心血管病都與ANP有關(Burnett,J.C.et al.(1986)Science,2311145-1147)。在基因敲除小鼠中,不論ANP或其受體的缺失都引起自發性高血壓(John,S.W.et al.(1995)Science 267679-681;John,S.W.et al.(1996)Am.J.Physiol.271,R109-R114;Lopez et al.(1995)Nature 37865-68)。認識到從前ANP轉化為ANP的活化步驟在心臟激素的調節上是至關重要的。
Corin具有推定的II型跨膜蛋白結構,它含有兩個卷曲樣的富含半胱氨酸基序、八個LDL受體重復序列、一個巨噬細胞清道夫受體樣結構域、以及細胞外區域的胰蛋白酶樣蛋白酶結構域(Yan et al.(1999)J.BioLChem.27414926-14935)。Corin的總的拓撲學與其它II型跨膜絲氨酸蛋白酶相似,這些蛋白酶包括hepsin、腸激酶、MT-SP1/matriptase、人氣道胰蛋白酶樣蛋白酶、TMPRSS2、TMPRSS3/TADG-12、TMPRSS4、MSPL以及Stubble-stubbloid。相似的拓撲學以及不一樣的組成結構說明這些蛋白構成了一個由祖先外顯子的重復及重排所進化形成的基因家族。
該人基因跨越>200kb并含有22個外顯子。內含子/外顯子之間的界限在物種之間具有較高的保守性,且絕大多數外顯子編碼結構結構域。先前已經描述了編碼Corin蛋白的小鼠和人cDNA的克隆(Yan等,ibid)。Northern分析顯示Corin mRNA大量表達于人心臟中。通過原位熒光雜交分析將人Corin基因繪制于染色體4的短臂上(4p12-13),其中已經定位了一種先天性心臟病的基因座,即完全異常肺靜脈回流的基因座。
發明內容
本發明涉及分離、克隆以及鑒定哺乳動物Corin基因的表達控制區,包括啟動子和其它調節元件,并涉及該心臟特異性的表達控制區在鑒定調控心房肽基因表達的新物質以及治療心臟病中的用途。
朝著這些目標,本發明的一個目的是提供一種含有Corin控制區的分離的多核苷酸,其中所述控制區調控任何與其可操縱地連接的異源性多核苷酸的轉錄,所述異源性多核苷酸包括但不限定于人Corin基因。
Corin表達控制區指導與其可操縱地連接的異源性多核苷酸的心臟特異性的轉錄,它包括選自由GATA、Tbx-5、NKx2.5、Krüppel樣轉錄因子、和NF-AT結合位點構成的組的一個或多個轉錄調節元件,并能結合轉錄蛋白,例如GATA-4。
本發明的進一步的目的是提供含有人Corin表達控制區的多核苷酸。本發明優選的多核苷酸是定位于核苷酸-4037到-15(SEQ ID NO6),更優選的是核苷酸-1297到-15(SEQ ID NO5),以及進一步更優選的是核苷酸-405到-15(SEQ ID NO4),其中的核苷酸編號是相對于人Corin基因或如圖8所示的它的互補鏈(SEQ ID NO2)的翻譯起始位點(ATG)的編號。
根據發明的這個方面,也提供了這些多核苷酸的片段及變體。
本發明的另一個目的是提供含有Corin表達控制區、或其片段或變體的載體。在進一步的實施方案中,載體也包括可操縱地連接于Corin表達控制區的異源性多核苷酸,例如Corin。根據發明的這個方面,也提供了被這些載體所轉染的宿主細胞,以及表達由這些異源性多核苷酸編碼的產物的方法。
本發明的另一個目的是提供藥用組合物,其包括存在于可藥用載體內的含有與異源性多核苷酸可操縱地連接的Corin表達調節區的載體或這樣的載體所轉染的宿主細胞。
本發明的另一個目的是提供鑒定能調控細胞內人Corin基因表達的物質的方法,其中方法包括(a)產生一種重組載體,其中一種包含哺乳動物Corin表達控制區的分離的多核苷酸可操作地連接于一種報告基因;(b)用所述重組載體轉染細胞;(c)用所述物質處理細胞;(d)測定被處理細胞內的報告序列的轉錄水平;以及(e)比較在有所述物質存在時的報告序列的表達水平與未經所述物質處理的轉染的對照細胞內的表達水平。
在優選的實施方案中,使用心肌細胞。
本發明的另一個目的是提供一種調控人類對象內的基因的心臟特異性表達的方法,方法包括(a)產生一種重組載體,其中一種包含哺乳動物Corin表達控制區的分離的多核苷酸可操縱地連接于異源性多核苷酸;以及(b)將治療有效量的所述載體施用于所述對象。
本發明的這個方面的優選的實施方案是這樣一種載體,其中所述的異源性多核苷酸編碼Corin。同樣優選的實施方案是Corin表達控制區選自具有SEQ ID NO4、SEQ ID NO5或SEQ ID NO6的序列的多核苷酸。
本發明的另一個目的是提供一種治療人類對象的充血性心衰、高血壓或心肌梗死的方法,所述方法包括給所述對象施用治療有效量的分離的多核苷酸,所述多核苷酸包含與一種基因可操縱地連接的Corin表達控制區,所述基因選自由Corin、心房肽(ANP)、B型利鈉肽、受磷蛋白(phosphonolamban)、血管緊張素轉化酶(ACE)或這些基因的負顯性形式所構成的組。或者,Corin表達控制區可以可操縱地連接于編碼反義RNA分子的多核苷酸。
在發明的這個方面的優選的實施方案中,所選的基因是Corin基因。
本發明的另一個方面是提供一種治療人類對象的心衰的方法,所述方法包含(a)產生一種重組載體,其中一種包含哺乳動物Corin表達控制區的分離的多核苷酸可操縱地連接于一種編碼一種多肽的多核苷酸,所述多肽選自ANP、B型利鈉肽、受磷蛋白、血管緊張素轉化酶(ACE)、或這些基因的負顯性形式所構成的組;以及(b)給所述對象施用存在于可藥用載體中的所述重組載體。
圖1哺乳動物Corin基因的結構。顯示了(A)人與(B)小鼠的Corin基因的結構。用鳥槍法將兩個BAC克隆測序并顯示了它們的組裝的插入序列的大小。垂直框表示外顯子。用限制性酶位點(H,Hind III;E,EcoRl)表示用于亞克隆人基因的BAC 26540的質粒克隆。利用自動測序用引物延伸法測序亞克隆的插入序列。在底部描述的是BAC克隆、重疊群(Contigs)以及橫跨Corin基因的質粒克隆的位置。
圖2相對于Corin的蛋白結構域的內含子-外顯子的分界位點。將Corin基因的外顯子1到22(上行)與它們的對應的蛋白結構域一起排列。TM,跨膜結構域;卷曲(Frizzled)卷曲樣富含半胱氨酸結構域;LDLR,LDL受體重復序列;SRCR,清道夫受體富含半胱氨酸結構域;H、D以及S,蛋白酶結構域的催化三聯體的His、Asp以及Ser殘基。
圖3人(SEQ ID NO1)及小鼠(SEQ ID NO3)的Corin基因的5’側翼區的比對。對人與小鼠基因的5’側翼區,外顯子1以及內含子1的一部分進行比對。編號是相對于翻譯起始密碼子ATG(粗體及斜體)。在人與小鼠之間所顯示的編號是不同的,這是因為兩者的第一外顯子存在偏差。箭頭表示人Corin基因的第一外顯子與內含子之間的連接,下劃線的是人內含子1的供體剪接序列。推定的調節序列用粗體表示(與Tbx5結合的Tbx5位點,Tbx5是一種含有T盒的轉錄因子;NF-AT,活化T細胞的核因子的結合位點;GATA,GATA蛋白的結合元件;與Krüppel樣因子結合的GT盒;與基本轉錄因子TFIID結合的TATA盒;以及NKE,與Nxk2.5結合的基序)。下劃線標出的是與近端GATA序列重疊的NKE序列。
圖4培養的心肌細胞內的Corin基因啟動子活性的功能分析。圖示了含有與螢光素酶基因連接的人及小鼠Corin基因的5’側翼區的連續截斷片段的報告基因構建體(A)。顯示了推定的調節元件的定位。用pRL-SV40將這些構建體共轉染到小鼠HL-5細胞中,pRL-SV40是一種由SV40病毒啟動子驅動的Rellina螢光素酶表達質粒。將每個構建體所表達的螢光素酶活性標準化為每個轉染的pRL-SV40表達的Rellina螢光素酶活性。每個構建體的每個轉染試驗都重復進行三次。數據表示為三次獨立試驗的平均值±S.D.(B)。
圖5人與小鼠Corin基因的5’側翼序列的心臟特異性表達。用所示的構建體與對照構建體pRL-SV40一起轉染心肌細胞HL5細胞以及上皮樣的HeLa細胞。用每20μl轉染細胞的細胞提取液的光量單位表示螢光素酶及Rellina活性。每個轉染試驗都重復進行三次。數據表示為三次獨立試驗的平均值±S.D.。
圖6核蛋白與包含近端GATA元件的調節序列的結合。
A上鏈寡核苷酸序列用作探針及競爭序列。每個序列的GATA基序(SEQ ID NO11和13,相應地為人和小鼠)都為粗體,而突變核苷酸(SEQ ID NO12和14,相應地為人和小鼠)都為斜體。人與小鼠的近端GATA元件都來自所示的Corin 5’側翼序列區域。含有兩個GATA基序的共有序列GATA探針(SEQ ID NO15)來源于人T細胞受體特異性增強子區。
B在存在或不存在100倍過量的所示的標記寡核苷酸時,將所標記的共有序列GATA探針(SEQ ID NO15)或其突變探針(SEQ ID NO16)與HL-5細胞的核提取物一起孵育。箭頭表示GATA序列依賴性的DNA-蛋白復合物。
C在存在抗GATA蛋白抗體時,將所標記的共有序列GATA探針與HL-5細胞的核提取物一起孵育。箭頭表示DNA-蛋白復合物,其形成被抗GATA-4抗體而不是被抗GATA-1、-3及-6抗體所阻斷。
D在存在或不存在抗GATA-4抗體時,將標記的人Corin GATA元件與HL-5的核提取物一起孵育。箭頭表示在存在抗GATA-4抗體時,DNA-蛋白復合物的形成被完全阻斷。
圖7近端保守的GATA元件的突變分析。將在EMSA中終止了與GATA-4蛋白結合的相同突變(GATA到CTTA)引入到小鼠的從-642到-77的5’側翼區或人的-405到-15的5’側翼區所驅動的螢光素酶報告基因構建體中。將突變型與野生型轉染到HL-5細胞中,每種都與對照構建體pRL-SV40一起轉染。將每個構建體所表達的螢光素酶活性標準化為每個轉染的pRL-SV40所表達的Rellina螢光素酶活性。每個突變構建體的啟動子活性都表示為相應的野生型構建體的百分比。每個轉染試驗都重復進行三次。數據表示為三次獨立試驗的平均值±S.D.。
圖8人Corin基因的5’側翼區的核苷酸序列(SEQ ID NO2)。4165個堿基對序列包括5’側翼區、第一外顯子以及第一內含子的起始部(下面的部分)。所有的編號都相對于翻譯起始位點(ATG,粗體并有下劃線)。用粗體表示推定的調節元件。在圖3的圖例說明中描述了推定的調節元件的縮寫。
對本發明的詳細描述本發明涉及分離、克隆及鑒定心臟特異性的Corin基因的表達控制區,包括啟動子和調節元件。用分離的Corin表達控制區、和它們的片段及變體體外和體內構建用于研究Corin基因表達的調控及用于鑒定新的Corin基因表達的調控物的試驗模型。表達控制區也用于靶向于心臟病變例如心衰的基因治療。
定義如在說明書、實施例以及所附的權利要求書中所使用的,除非有特殊的相反的解釋,下面的名詞都為所說明的含義。
“核酸”或“多核苷酸”指的是單鏈或雙鏈形式的脫氧核糖核酸或核糖核酸或它們的聚合物。名詞包括含有已知的核苷酸類似物或經修飾的骨架殘基或連接的核酸,它們可以是合成的、天然形成的以及非天然形成的,它們具有與所參照的核酸相似的結合特性,以及它們是以與參照核苷酸相似的方式被代謝。這些類似物的實例包括但不限定于硫代磷酸酯、亞磷酰胺、甲基磷酸酯、手性-甲基磷酸酯、2-O-甲基核糖核苷酸、核酸肽(PNA)。
除非有其它說明,特殊的核酸序列也默認包括它們的保守修飾的變體(例如,簡并密碼子取代)和互補序列,以及明確指示的序列。特別地,通過生成其中一個或多個所選定的(或所有)密碼子的第三個位點被混和堿基和/或脫氧次黃嘌呤殘基所取代的序列可以完成簡并密碼子取代(Batzer et al.(1991)Nucl.Acids Res.195081;Ohtsuka et al.(1985)J.Biol.Chem.2602605-08;Rossolini et al.(1994)Mol.Cell.Probes 891-98)。名詞核酸可以與基因、cDNA、mRNA、寡核苷酸以及聚核苷酸交替使用。
特殊的核酸序列也默認包括“剪接變體”。同樣,核酸編碼的特殊蛋白也默認包括任何該核酸的剪接變體所編碼的蛋白。“剪接變體”如同名詞本身所提示的,它是基因的選擇性剪接的產物。在轉錄后,初始的核酸轉錄體可以被剪接,使得不同的(選擇性)的核酸剪接產物可以編碼不同的多肽。這種剪接變體的產生機制多種多樣,但包括對外顯子的選擇性剪接。本定義也包括通過通讀轉錄來源于同一核酸的候補多肽。本定義包括剪接反應的任何產物包括剪接產物的重組形式。
“Corin基因”指的是編碼與Yan等(1999)J.Biol.Chem.27414926-14935中所描述的人Corin基因氨基酸序列有著約至少60%(優選地75%、78%、90%以及更優選的約95%)相同性的連續氨基酸序列的基因。
“Corin表達控制區”或“表達控制區”指的是定位于天然形成的哺乳動物Corin基因的編碼區的上游(5’)基因組序列內的多核苷酸。在人Corin基因中,相對于Corin基因或如圖8所示的它的互補鏈的轉錄起始位點(ATG),Corin表達控制區開始于-4165核苷酸并終止于-15核苷酸。Corin表達控制區能激活心臟組織(肌細胞)內的Corin基因的轉錄。Corin表達控制區多核苷酸的長度可以從100到5000個核苷酸;功能性的人Corin表達控制區的特殊實施方案是長度為4023、1283或391個核苷酸(相應地為SEQ ID NO6、5和4)。Corin表達控制區多核苷酸通常與這些序列至少有70%同源性。在一些實施方案中,Corin表達控制區多核苷酸與這些序列至少有75%、80%、85%、90%、92%、95%或100%同源性。名詞“控制區”不包括起始或終止密碼子以及Yan等已經描述的其它序列。Corin表達控制區含有各種轉錄調節蛋白的結合位點,例如GATA-4,它可以按與自然或人工方式基本一樣的方式被連接。Corin表達控制區激活Corin基因或其它與其可操縱地連接的異源性多核苷酸,特別是以心臟特異性的方式。
“心臟特異性表達”意思是多核苷酸在心臟源性細胞中的轉錄率比在非心臟細胞中更大。因此,Corin表達控制區通常在心肌細胞中激活所連接的多核苷酸的效力比在非心臟細胞中高出至少2倍,其中在每種情況下的表達被標準化為另一種與SV40啟動子/增強子或其它組成型啟動子連接的多核苷酸的轉錄。
在此所用的多核苷酸的“變體”指的是與參照多核苷酸的多核苷酸序列不同的多核苷酸。通常差別是有限的,使得參照體與變體的多核苷酸序列總體上是非常相似的并且在許多地方是完全一樣的。差別是那些不改變多核苷酸功能的差別,如果多核苷酸正常地編碼多肽,那么形成的多肽或者是氨基酸序列沒有改變,或者是當具有不同的氨基酸序列時功能仍是完全一樣的。
在此所用的“片段”指的是具有與上述的Corin表達控制區及它的變體的部分但不是全部多核苷酸序列完全一樣的多核苷酸的多核苷酸。這些片段保留了Corin表達控制區指導與其可操縱地連接的異源性多核苷酸的心臟特異性轉錄的能力。
“轉錄起始元件”指的是啟動子中特異于RNA聚合酶II的起始位點的序列。轉錄起始元件可以包括直接起始下游25-35堿基轉錄的TATA盒,或者起始子元件,它們是定位鄰近于轉錄起始位點本身的序列。真核啟動子通常包括轉錄啟動元件以及或啟動子近端元件、遠端增強子元件或兩者。
當參照于例如細胞、核酸、蛋白或載體一起使用的“重組體”代表已經被引入異源性核酸或蛋白或天然核酸或蛋白的變化所修飾的細胞、核酸、蛋白或載體、或來源于被修飾細胞的細胞。因此,例如重組細胞表達在天然形式細胞(非重組細胞)中沒有發現的基因或表達不正常表達的、低表達的或根本不表達的天然基因。
“增強子”指的是一種增強轉錄的DNA調節區。增強子通常是但不總是定位于近端啟動子區外,并且可以是定位于離轉錄起始位點幾千堿基對或更遠的地方,甚至是在編碼序列的3’端或在基因的內含子內。啟動子或增強子可以是獨立地或組合地參與組織的特異性表達。
“沉默子”指的是一種DNA調節區,當其出現在Corin基因的天然序列中時,它或通過它本身作為慎重(discreet)DNA片段的作用或通過與所述元件結合并實現對基因表達的陰性控制的反式作用因子的作用而造成對啟動子引起的轉錄的抑制。該元件可能在Corin基因的限制性細胞類型表達模式上發揮著重要作用,例如在心肌細胞中表達可能是允許的,其中該沉默子可能是無活性的,但在其它的細胞類型中表達是受限的,其中該沉默子是活化。該元件可以或不可以單獨或在異源性啟動子構建體中發揮作用。
“分離的”,當指的是例如多核苷酸時,意思是物質被遠離于它的原始環境(例如,如果它是天然存在的就指天然環境),以及與它天然連接的至少一種其它成分分離或分開。例如,存在于它的天然活宿主內的天然存在的多核苷酸不是分離的,但與天然系統中的所有共存物質分開的同一種多核苷酸是分離的。這樣的多核苷酸可以是組合物的一部分,并且仍是分離的,這是因為該組合物不是其天然環境的一部分。
“相同性百分比”或相同的百分比,當指的是序列時,意思是在將所述的或所要求保護的序列與要比較的序列進行比對后,將該序列與要求保護的元件或所述的序列進行比較。用數學算法可以完成序列的比較并測定兩個序列之間的相同性和相似性百分比。這樣的數學算法的優選的非受限的實例被描述于Karlin等(1993)Proc.Natl.Acad.Sci.USA 905873-587中。Altschul等(1997)Nucleic Acid Res.253389-3402描述的NBLAST及XBLAST程序(2.0版本)中整合有這樣的算法。
在此所用的“高嚴格性”意思是,例如在含有例如5X SSC、0.5%SDS、100g/ml變性的鮭精DNA以及50%甲酰胺的雜交溶液中將一印跡與長多核苷酸探針在42℃孵育過夜。然后在高嚴格性的條件下洗滌印跡,使得發生例如小于5%的堿基錯配(例如在0.1x SSC和0.1%SDS 65℃洗滌30分鐘兩次),由此選擇具有例如95%或更大序列相同性的序列。
當多核苷酸的DNA拷貝被轉錄為RNA時,該多核苷酸被“表達”。
當多核苷酸與Corin表達控制區在單一分子中的結合造成了多核苷酸的轉錄,最優選的是心臟特異性的轉錄(在心肌細胞中),該多核苷酸是“被可操縱地連接于”Corin表達控制區。
“異源性多核苷酸”指的是除Corin表達控制區以外的多核苷酸,它被可操縱地連接于Corin表達控制區并優選地表達于心臟特異性細胞內。所連接的多核苷酸表達治療有用的分子,例如多肽、反義RNA。名詞“分離的”、“純化的”、或“生物學純度”指的是物質基本上或完全游離于在它的天然狀態中所見的正常地伴隨于它的成分。用例如聚丙烯酰胺凝膠電泳或高效液相色譜的分析化學技術通常可以確定純度及均一性。在制劑中作為主要種類的蛋白基本上已經被純化。具體地,分離的核酸被位于該基因側翼的并編碼其它蛋白的可讀框隔離。名詞“純化的”表示核酸或蛋白在凝膠電泳上只給出一條主要條帶。具體地,它指的是核酸或蛋白的純度是至少85%、更優選的至少95%以及最優選的至少99%。
名詞“多肽”、“肽”和“蛋白質”在此可以交替地用于表示氨基酸殘基的聚合物。這些名詞適用于其中一個或多個氨基酸殘基是相應的天然存在的氨基酸的人工化學的模擬物的氨基酸聚合物,以及天然存在的氨基酸的聚合物和非天然存在的氨基酸的聚合物。
名詞“氨基酸”指的是天然存在的或合成的氨基酸,以及氨基酸類似物和氨基酸模擬物,它們具有與天然存在的氨基酸相似的功能。天然存在的氨基酸是那些遺傳密碼編碼的氨基酸,以及那些后來被修飾的氨基酸,例如羥脯氨酸、γ-羧基谷氨酸和O-磷酸絲氨酸。氨基酸類似物指的是具有與天然存在的氨基酸相同的基礎化學結構的化合物,也就是與氫、羧基基團、氨基基團以及R基團結合的碳原子,例如高絲氨酸、正亮氨酸、甲硫氨酸亞砜、甲硫氨酸甲基锍。這些類似物具有被修飾的R基團(例如正亮氨酸)或被修飾的肽骨架,但保留與天然存在的氨基酸相似的基礎化學結構。氨基酸模擬物指的是具有與氨基酸的常見化學結構不一樣的結構但具有與天然存在的氨基酸相似功能的化合物。
在此氨基酸也可以用它們的熟知的三個字母符號或IUPAC-IUB生物化學標準命名委員會推薦的單個字母符號來表示。同樣,核苷酸可以用它們的常用的單個字母符號來表示。
“保守修飾的變體”適用于氨基酸及核酸序列。對于特殊的核酸序列,保守修飾的變體指的是那些編碼相同的或基本相同的氨基酸序列的核酸,或者對于不編碼氨基酸序列的核酸,指的是基本相同的序列。因為遺傳密碼子的簡并性,對于任何特定的蛋白可有大量功能相同的編碼核酸。例如,密碼子GCA、GCC、GCG和GCU都編碼氨基酸丙氨酸。因此,在每一個某密碼子所具體確定的丙氨酸位點,該密碼子可以被變更為任何一種所述的相應的密碼子而不改變所編碼的多肽。這樣的核酸變體是“沉默變體”,它是保守修飾的變體的一種。每一種在此的編碼多肽的核酸也表示核酸的每一種可能的沉默變體。本領域人員認識到核酸的每一個密碼子(除了AUG,它通常是甲硫氨酸的唯一密碼子,以及TGG,它通常是色氨酸的唯一密碼子)都可被修飾并生成功能相同的分子。因此,編碼多肽的核酸的每一個沉默變體都包含于每一個所述的序列中。
對于氨基酸序列,本領域人員將認識到,導致在編碼的序列中改變、添加或刪除單個氨基酸或小部分氨基酸的那些發生于核酸、肽、多肽或蛋白序列中的單個取代、缺失或添加是“保守修飾的變體”,其中的變更造成一種氨基酸被化學性質相似的另一種氨基酸所取代。本領域熟知提供功能相似的氨基酸的保守取代的表。這些保守修飾的變體應加入到本發明的多形變體、物種間同源物以及等位基因中,而不能被排除在本發明以外。
下面8組的每一組都含有能彼此保守取代的氨基酸1)丙氨酸(A)、甘氨酸(G);2)天冬氨酸(D)、谷氨酸(E);3)天冬酰胺(N)、谷氨酰胺(Q);4)精氨酸(R)、賴氨酸(K);
5)異亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、纈氨酸(V);6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);7)絲氨酸(S)、蘇氨酸(T);以及8)半胱氨酸(C)、甲硫氨酸(M),見,例如Creighton,Proteins(1984)。
“表達載體”指的是重組或合成產生的核酸構建體,以及一系列容許在宿主細胞中轉錄特殊核酸的特異性核酸元件。表達載體可以是質粒、病毒或核酸片段的一部分。通常的,表達載體包括被可操縱地連接到表達控制區的所轉錄核酸,例如Corin表達控制區。
“可藥用賦形劑”指的是可藥用載體以及任何所需的與生理條件相容的可藥用的輔助物質,它們是無毒的且不會對懸浮或包含于其中的藥用組合物的生物學活性產生不良影響。適宜的賦形劑可以是例如甘露醇、琥珀酸鹽、甘油或血清白蛋白等化合物。
“治療有效量”指的是當將本發明的化合物施用于所需的對象時,足以在患有心臟病的患者或很可能出現心臟病的患者中實現治療作用(如下定義)的本發明的化合物的量。構成“治療有效量”的一種化合物的量將依賴于所述的化合物,但本領域的任何人員根據他自己的知識以及本文的公開可以輕松地確定出這個量。
在此所用的“治療的”或“治療”覆蓋了心臟的治療并包括(a)預防人發生心臟病,特別是當此人處于這些疾病的易患狀態時;(b)抑制心臟病,即阻止其發展;或(c)緩解心臟病,即造成病變的消退。
具體實施方案本發明涉及克隆及鑒定哺乳動物Corin基因(例如,小鼠、人)的表達控制區,包括啟動子及其它調節元件,以及涉及該表達控制區在鑒定用于調控Corin基因表達的物質和治療心臟病的用途。具體地,本發明涉及包括新的Corin表達控制區的多核苷酸以及該控制區指導與其可操縱地連接的異源性多核苷酸的心臟特異性表達的能力。
Corin表達控制區多核苷酸的分離及描述本發明依賴于重組遺傳學領域的常規方法。闡述有本發明所用的常用方法的基礎教材包括Sambrook et al.,Molecular Cloning,A LaboratoryManual(2nd ed.1989);Kriegler,Gene Transfer and ExpressionALaboratory Manual(1990);以及Ausubel et al,Current Protocols inMolecular Biology(John Wiley and Sons,New York,NY,1994)。
哺乳動物Corin基因的結構圖1描述了人和小鼠Corin基因的結構以及(細菌人工染色體)BAC克隆、重疊群以及含有Corin基因和它們的5’側翼區的質粒克隆的定位。人與小鼠Corin基因橫跨至少200Kb并由22個外顯子和21個內含子組成。
Corin cDNA序列預示了一種由大量不同的結構域所構成的蛋白。如圖2中圖表所示的,蛋白結構域之間的界限幾乎完全對應于基因組結構的外顯子/內含子界限。外顯子1和外顯子2的一半編碼N末端的胞漿尾部,緊接著的是外顯子2的另一半所編碼的跨膜結構域。外顯子3編碼跨膜及第一個卷曲結構域之間的區域。每個卷曲結構域是由兩個外顯子編碼,八個LDLR的每個都由單個外顯子編碼,以及由三個外顯子編碼清道夫受體富含半胱氨酸結構域。C末端的蛋白酶結構域是由外顯子19到22編碼,其中外顯子19編碼含有蛋白裂解活性位點及催化性組氨酸殘基的序列。外顯子20和22編碼相應地含有其它兩個催化殘基天冬氨酸及絲氨酸的序列。
Corin表達控制區的克隆為了克隆人與小鼠的Corin基因和它們的5’側翼區,合成對應于這些基因的已發表的Corin cDNA序列(Yan et al.(1999)J.Biol.Chem.27414926-14935)的特異寡核苷酸。在用人或小鼠基因組DNA的基于PCR的反應中,用這些寡核苷酸引物測試擴增特異產物。然后將成功地擴增特異PCR產物的引物對用于基于PCR的篩選方法中,該篩選方法用于鑒定含有人或小鼠Corin基因和/或它們的相應的5’側翼區的BAC克隆。被鑒定為陽性的BAC克隆或通過鳥槍法直接測序或被亞克隆進pUC118(PanVera/Takara,Madison,WI)中進行測序。用Stagen程序包進行鳥槍序列的裝配(Bonfield et al.(1995)Nucleic Acids Res.234992-4999)。
用基于PCR的篩選方法獲得四個BAC克隆,每兩個都含有人與小鼠Corin基因。用鳥槍法測序三個BAC克隆,聯合這些序列以及可獲得的Trace文檔信息(http//www.ncbi.nlm.nih.gov80/Traces/trace.cgi,http//trace.ensembl.org)用于組裝含有人Corin基因的340kb的連續序列,并確定小鼠Corin基因的5個重疊群的序列。對于小鼠Corin基因,通過各個鄰近的重疊群內的所存在的一些配對閱讀對確認5個重疊群的順序。這些距離容許我們確定出空隙大小為小于500bp,因為公用的鳥槍文庫的插入大小已經被很好的定義。然后分析人及小鼠的Corin基因的結構。然而,340kb的人基因組序列不含有5’側翼區。從BAC 26540中分離得到的另一個4165bp的Hind III-EcoR I片段包括3919bp的5’側翼區、所有的外顯子1以及內含子1的一部分(已呈交給GenBankTM/EBI data Bank,編號為AF 521006)。
在此所描述的Corin表達控制區多核苷酸都來源于分離于BAC26540的4165bp的Hind III-EcoR I片段(見圖8,SEQ ID NO2)。用基于PCR的方法、或限制酶消化法或聯合這兩種方法得到這些表達控制區多核苷酸。用引物F1(5′-AAGCTTCATGAGGGCAGGAG-3′)(SEQ ID NO7)和R1(5′-GAGCTCGCTTATTCTTCTGTCCACTT-3′)(SEQ ID NO8)從Hind III-EcoR I片段或人基因組DNA中擴增得到4023bp的Corin表達控制區多核苷酸(SEQ ID NO6)。相似地,用引物F2(5′-AAGCTTATAAAAATAATAGCTTCTTC-3′)(SEQ ID NO9)和R1擴增得到1283bp的Corin表達控制區多核苷酸(SEQ ID NO5),以及用引物F3(5′-AAGCTTAGTAACTCTTTTGCTCCCAA-3′)(SEQ ID NO10)和R1擴增得到391bp的Corin表達控制區多核苷酸(SEQ ID NO4)。
可以容易地從中提取出DNA的任何哺乳動物組織例如白細胞都是用于分離哺乳動物Corin表達控制區多核苷酸的基因組DNA的適宜的來源。
功能性的Corin表達控制區多核苷酸通過將特定的表達控制區多核苷酸可操縱地連接到報告基因上,將構建體轉染進心肌細胞中,以及測定特殊的表達控制區多核苷酸序列指導報告基因的心臟特異性轉錄的能力來測定上述的Corin表達控制區多核苷酸的心臟特異性轉錄活性。報告基因通常編碼具有容易測定的酶活性而且宿主細胞天然不存在的蛋白。常見的真核啟動子的報告基因蛋白包括氯霉素乙酰轉移酶(CAT)、螢火蟲或Renilla螢光素酶、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、堿性磷酸酶和綠色熒光蛋白(GFP)。優選的報告基因是螢火蟲螢光素酶。
將一個檢測Corin表達控制區活性的體系瞬時或穩定轉染入培養細胞株。帶有與報告基因可操縱地連接的表達控制區多核苷酸的檢測載體可以被轉染進任何哺乳動物細胞株中用于檢測啟動子活性;細胞培養、轉染及報告基因的方法見于Ausubel et al.(2000),supra;TransfectionGuide,Promega Corporation,Madison,WI(1998)。通過將檢測載體平行地轉染心臟源性的細胞株以及非心臟源性的細胞株可以檢測Corin控制區多核苷酸的心臟特異性轉錄活性。通常,與檢測載體一起共轉染含有已知的啟動子所驅動的第二個報告基因的對照載體,例如Sv40早期啟動子/增強子驅動的Renilla螢光素酶(pRL-SV40,Promega,Madison,WI),用于控制不同細胞株之間的轉染效率或報告基因轉錄的差異。
或者,通過直接測定從報告基因轉錄的RNA量也可以測定出Corin表達控制區多核苷酸所驅動的轉錄。在這些實施方案中,報告基因可以是任何可轉錄的已知序列的且宿主細胞所沒有表達的核酸。本領域的技術例如mRNA逆轉錄和擴增、總RNA或poly A+RNA的分離、northern印跡法、斑點雜交、原位雜交、RNase保護、引物擴增、高密度多核苷酸陣列檢測技術等等可用于分析Corin表達控制區多核苷酸構建體所表達的RNA。
常規地測定相對于對照構建體的Corin控制區多核苷酸序列激活轉錄的能力。在一個實施方案中,通過比較與Corin表達控制區多核苷酸連接的報告基因的表達和沒有與這樣的序列連接的同樣的報告基因的表達來測定Corin控制區多核苷酸激活轉錄的能力。因此,在優選的實施方案中,比較pRL-SV40與在螢光素酶基因的5’端插入Corin控制區多核苷酸序列的pRL-SV40之間的螢光素酶的表達(見實施例2,圖4)。在其它的實施方案中,可以與已知啟動子的活性比較Corin表達控制區多核苷酸的活性。因此,比較了Corin表達控制區多核苷酸驅動的報告基因的活性與特定的啟動子所驅動的報告基因的活性(例如,pGL3-對照的SV40啟動子/增強子,Promega,Madison,WI)。
通過比較報告基因在心臟源性與非心臟源性細胞中的轉錄測定Corin表達控制區所指導的轉錄的心臟特異性。用于測定心臟特異性轉錄的適宜的心臟源性細胞株是AT-1(Claycomb et al.(1998)Proc.Nafl.Acad.Sci.952979-2984),HL-1(Lanson et al.(1992)Circulation 851835-1841),以及HL-5(Wu et al.(2002)J.Biol.Chem.27716900-16905)。優選的細胞株是HL-5細胞株。任何容易轉染的哺乳動物細胞株都可以用于測定Corin表達控制區在非心臟源性細胞中的活性(例如,HeLa細胞,ATCCNo.CCL2)。在實施例3中(圖5),通過比較具有和不具有這些表達控制區片段的載體在HL-5及HeLa細胞株中的螢火蟲螢光素酶的表達來證明人(hCp405LUC)與小鼠(mCp642LUC)Corin表達控制區多核苷酸的心臟特異性活性。對于每一種檢測,將Corin表達控制區活性標準化為共轉染的SV40啟動子活性(即pGL3-對照)來控制不同細胞株之間的變異性。
一旦在Corin表達控制區多核苷酸中證實了心臟特異性的轉錄活性,可以構建缺失、突變、重排以及其它的序列修飾,并用本發明的方法測定心臟特異性的轉錄。這些Corin表達控制區多核苷酸的衍生物可用于生成更緊湊的啟動子,以減少非心源性細胞的背景表達、消除抑制序列或鑒定新的心臟特異性轉錄調節蛋白。比較人與嚙齒動物的Corin表達控制區序列可以鑒定保守的轉錄調節元件,包括那些賦予心臟特異性表達的元件。
本領域已知的常規的重組DNA方法可以構建Corin表達控制區的亞片段及衍生物。這些方法可以生成一系列Corin表達控制區序列內的缺失衍生物(實施例2)。通過比較缺失系列的轉錄活性,可以定位出造成或減弱心臟特異性轉錄的元件。根據這些分析,可以設計出Corin表達控制區多核苷酸的改良衍生物。例如,Corin表達控制區元件可以與異源性啟動子的心臟特異的或通用的調節元件組合以增加Corin表達控制區多核苷酸的心臟特異性或活性。
載體和宿主細胞本發明也涉及包含本發明的多核苷酸的載體、用本發明載體遺傳學加工的宿主細胞以及重組技術生成的本發明的多肽產物。這些技術被描述于Sambrook et al.,Molecular Cloning,A Laboratory Manual,Cold SpringHarbor Press,Plainview,N.Y.,1989和Ausubel,F.M.et al.,CurrentProtocols in Molecular Biology,John Wiley & Sons,New York,N.Y.,1989。
為了可以表達所連接的多核苷酸編碼的產物例如Corin,宿主細胞可以被遺傳學加工成組合有含有本發明的Corin表達控制區的多核苷酸以及含有與Corin表達控制區可操縱地連接的編碼Corin或其它多肽的基因的多核苷酸。利用熟知的感染、轉導、轉染、轉位、轉化技術可以將多核苷酸引入到宿主細胞內。可以單獨或與其它多核苷酸一起引入多核苷酸。這些其它的多核苷酸可以被單獨引入、共同引入或結合到本發明的多核苷酸后引入。
因此,例如利用例如哺乳動物細胞的共轉染及選擇技術可以將本發明的多核苷酸與另一種編碼選擇性標記物的單獨的多核苷酸一起轉染宿主細胞。在這種情況中,多核苷酸通常被穩定地結合于宿主細胞的基因組中。
或者,多核苷酸可以與含有選擇性標記物的載體結合并用于在宿主中的繁殖。用前述的技術可以將載體構建體引入到宿主細胞內。通常,質粒載體以沉淀物中的DNA,例如磷酸鈣沉淀或與帶電荷脂質形成復合物的形式被引入。也可以用電穿孔將多核苷酸引入到宿主中。如果載體是病毒,那么它可以在體外被包裝或引入到包裝細胞內并且被包裝的病毒可以被轉導到細胞內。根據發明的這個部分,大量的適合于制備多核苷酸以及將多核苷酸引入到細胞內的技術對于本領域人員是熟知及常規的技術。這些技術在上述引用的Sambrook等中已經被詳細地描述,它是許多詳細描述這些技術的實驗室手冊的一個范例。根據本發明的這個方面,載體可以是例如質粒、單鏈或雙鏈噬菌體載體、單鏈或雙鏈RNA或DNA病毒載體。用熟知的將DNA和RNA轉導進細胞的技術可以將這些載體以多核苷酸,優選的作為DNA形式引入到細胞內。對于噬菌體和病毒載體,用熟知的感染和轉導技術也可以將載體以被包裝或包裹的病毒的形式轉染細胞。病毒載體可以是可復制的或不可復制的。在后一種情況中,病毒傳播通常只發生在互補的宿主細胞中。
在某些部分,優選的載體是那些用于表達本發明的多核苷酸及多肽的載體。這些載體通常包括對于表達宿主內與宿主可操縱地連接的需表達的多核苷酸是有效的順式作用控制區。適宜的反式作用因子或由宿主提供、由互補載體提供或由引入到宿主內的載體本身提供。
用多種已知的及常規的技術中的任何一種技術可以將本發明的Corin表達控制區多核苷酸插入到載體內。一般而言,通過用一種或多種限制性內切酶降解DNA序列和表達載體以及然后用T4 DNA連接酶將這些限制性片段連接在一起,將用于表達的DNA連接到表達載體中。用于這個目的的內切酶限制性及連接的方法對于本領域人員是熟知及常規的技術。這方面的適合的方法以及用其它技術構建表達載體的方法對于這些人員也是熟知及常規的技術,并且在在此引用的Sambrook等中有更多詳細的描述。
Corin表達控制區的用途本發明的Corin表達控制區多核苷酸適用于在心臟源性細胞內特異性表達治療性分子。治療性分子的心臟特異性表達可用于例如治療充血性心衰、高血壓以及心臟肥大。因此,含有與本發明的Corin表達控制區多核苷酸可操縱地連接的治療性多核苷酸的載體可以被構建并被施用于患者以治療心臟病及發展新的和改進的治療方法。
任何治療性多核苷酸都可以被可操縱地連接于Corin表達控制區多核苷酸,包括但不限定于表達Corin的多核苷酸。通常,Corin表達控制區多核苷酸包含于表達盒內并插入于所表達的治療性多核苷酸的5’端。Corin表達控制區多核苷酸可以被定位于非常接近于治療性多核苷酸的位置,盡管Corin表達控制區多核苷酸增強子元件可以定位于治療性多核苷酸的數千堿基內的任何位置,包括治療性多核苷酸的3’末端以及內含子中。通過將Corin表達控制區多核苷酸以相對于報告基因的合適的構型定位并如在此所描述的檢測心臟特異性報告基因的活性可以驗證給定位點的Corin表達控制區多核苷酸賦予心臟特異性表達的能力。
Corin表達控制區多核苷酸可以被直接連接于編碼治療性分子的多核苷酸,且不需要附加序列。在Corin表達控制區多核苷酸不包括Corin表達起始元件的實施方案中,應當提供例如TATA盒及轉錄起始位點的附加元件。這些元件可以是治療性基因的天然轉錄元件,也可以是來源于異源性真核或病毒啟動子的元件。例外,只要保留心臟特異性的表達(如本發明的檢測所測定的),通過包含來自治療性基因或來自異源性基因的增強子和多腺苷酰化序列可以增加治療基因的表達水平。
在Tang et al.(2002)Methods 28259-266;Philips et al.(2002)Hypertension 39651-655;Prentice et al.(1997)Cardiovas.Res.35567-574;Beggah AT et al.(2002)PNAS 997160-7165;Monte et al.(2003)J.Physiol.54649-61中可以發現體外和體內轉染心臟源性細胞的載體、確保體內心臟源性細胞內的持續表達的方法、將治療性多核苷酸可操縱地連接于心臟特異性啟動子的方法、以及體外或體內將載體靶向于心臟細胞的方法、施用途徑以及用治療性載體治療心臟病的劑量。
因此,本發明的Corin表達控制區多核苷酸可以用于心臟特異性表達各種治療性多核苷酸。Corin表達控制區多核苷酸所表達的治療性多核苷酸是活性多核苷酸本身(例如反義及催化性多核苷酸)或編碼具有治療作用的蛋白的多核苷酸。
反義及催化性核糖核苷酸的表達可以被Corin表達控制區多核苷酸所表達的治療性多核苷酸的一種類型是反義RNA或RNA(Fire,A.(1999)Trends.Genet 15358-363;Sharp,P.(2001)Genes Dev.15485-490)。在這些實施方案中,Corin表達控制區多核苷酸被可操縱地連接于多核苷酸,該多核苷酸被細胞內RNA聚合酶轉錄后能與靶mRNA結合。在例如Stein & Cohen(1988)Cancer Res.482659-68和van der Krol et al.(1988)Bio Techniques 6958-76中描述了根據編碼靶蛋白的cDNA序列的反義序列的衍生物。靶蛋白通常是一種它的存在被認為是造成了或增加了心臟病的機會的蛋白,例如血管緊張素轉化酶、血管緊張素II受體或NF-ATC(Stein et al.(1998)Amer.Heart J.135914-923;Levin et al.(1998)New Eng.J.Med.339321-328;Keating andGoa(2003)Drugs 6347-70)。因此,反義分子的心臟特異性表達可以優選地減少這些蛋白在高危個體中的表達。已經描述了心臟特異性的反義分子表達的成功應用(Beggah AT et al.(2002)PNAS 997160-7165)。這些利用心臟特異性表達的方法已經證實在治療心臟纖維化及心衰上是成功的(Lee et al.(1966)Anticancer Res.161805-11)。
除了反義多核苷酸,可以設計核酶以抑制靶分子的表達。核酶是一種能催化地降解其它RNA分子的RNA分子。因此,通過將編碼核酶的多核苷酸連接于Corin表達控制區多核苷酸,可以用本發明的Corin表達控制區多核苷酸在心臟源性細胞內特異性地表達核酶。已經描述了不同類型的核酶,包括I組核酶、錘頭狀核酶、發夾狀核酶、RNase P、以及斧頭狀核酶(axhead ribozyme)(見,例如Castanotto et al.(1994)Adv.inPharmacology 25289-317對不同核酶特性的綜述)。在例如Hampelet al.(1990)Nucl.Acids Res.18299-304;Hampel et al.,歐洲專利文件No.0 360257(1990);美國專利No.5,254,678中描述了發夾狀核酶的常見特性。制備核酶的方法對于本領域人員是熟知的(見,例如Wong-Staal et al.,WO 94/26877;Ojwang et al.(1993)Proc.Natl.Acad.Sci.USA 906340-44;Yamada et al.(1994)Hum.Gene Ther.139-45;Leavitt et al.(1995)Proc.Natl.Acad.Sci.USA 92699-703;Leavitt et al.(1994)Hum.Gene Ther.51115-20;和Yamada et al.(1994)Virology 205121-26)。
治療性蛋白的表達很多種治療性蛋白可以用于治療心臟病。因此,可以用本發明的Corin表達控制區多核苷酸在心臟細胞內特異性地表達編碼治療性蛋白的多核苷酸。治療性蛋白可以是原核、真核、病毒或合成來源的蛋白。當治療性蛋白不是哺乳動物來源時,根據本領域已知的方法(例如,哺乳動物密碼子選擇及同一轉錄起始位點)可以將蛋白的編碼序列修飾為最大化的哺乳動物的表達。
可以將治療性蛋白可操縱地連接于Corin表達控制區多核苷酸,使得可以進行心臟特異性的表達并被成功地應用于治療各種病因的心臟病,包括(但不限定于)缺血性心臟病、高血壓心臟病、瓣膜性心臟病、心肌炎、Chagas心肌病和特發性心肌病。這些治療性蛋白包括但不限定于例如Corin的蛋白,它將心房肽前體(pro-ANP)轉化為ANP以及B型利鈉肽,ANP通過促進鈉的排泄以及血管擴張來降低血容量和血壓。
Corin表達調控物的鑒定可以用本發明的Corin表達控制區多核苷酸鑒定新的調控物,它們可用于控制哺乳動物尤其是人的心臟相關性疾病,實例包括心血管性高血壓、充血性心衰或心肌病。這些調控物可用于治療具有異常水平的Corin基因表達的宿主。也可以用Corin基因調控物治療Corin基因表達的水平所影響的疾病和病變,例如但不限定于機械性牽拉、血容量、鹽排泄、尿量以及血管舒縮張力。調控物也可用于治療動物的與所選定的多肽的表達水平相關的模擬人的疾病或病變。
具體地,通過物質所造成報告基因的轉錄水平變化的能力可以鑒定出結合并調控這些表達的物質,報告基因例如螢光素酶,如前所述它被可操縱地連接于Corin表達控制區多核苷酸(見實施例2)。
上述方法中所測定的物質可以被隨機地選擇或有目的地選擇或設計。如在此所用的,當不考慮任何特異的序列隨機地選擇物質時,物質被認為是被隨機選擇的。隨機選擇的物質的實例是化學文庫或生物體的生長培養基或植物提取物(Bunin,et al.(1992)J.Am.Chem.Soc.11410997-10998,在此一同并入參考)。
如在此所用的,當考慮靶位點的序列和/或其與物質作用相關的構象從非隨機的基庫中選擇物質時,物質被認為是被有目的選擇或設計的。
基因治療本發明提供了可以被轉染到細胞內用于體外和體內治療目的的Corin表達控制區多核苷酸。這些核酸可以被插入到大量的用于轉染如下所述的靶細胞和生物體的熟知載體中的任何一個載體中。通過載體與靶細胞之間的相互作用,可以將核酸體內或體外轉染到細胞內。通常,Corin表達控制區多核苷酸與第二種治療有用的多核苷酸的可操縱地連接造成了第二種多核苷酸的心臟特異性的表達。將足量的組合物施用于患者以引發患者的治療反應。達到這點的足夠多的量被稱為“治療有效劑量或治療有效量”。
這些基因治療方法已經被用于糾正獲得性或先天性遺傳缺陷、腫瘤和病毒感染等等。在人體中表達治療有用的人工基因的能力有助于許多重要的人類疾病的預防和/或治愈,這些疾病包括許多其它治療方法所不能治療的疾病(基因治療方法的綜述,見Anderson(1992)Science 256808-13;Nabel & Felgner,TIBTECH(1993),Vol.11,pp.211-17;Mitani &Caskey,TIBTECH(1993),Vol.11,pp.162-66;Mulligan,Science(1993),Vol.260,pp.926-32;Dillon,TIBTECH(1993),Vol.11,pp.167-75;Miller,Nature(1992),Vol.357,pp.455-60;Van Brunt,Biotechnology(1998),Vol.6,pp.1149-54;Vigne,Restorative Neurol.Neurosci.(1995),Vol.8,pp.35-36;Kremer & Perricaudet,British Medical Bulletin(1995),Vol.51,pp.31-44;Haddada et al.,in Current Topics in Microbiology and Immunology(Doerfler& Bohm eds.,1995);以及Yu et al.,Gene Therapy(1994),Vol.1 pp.13-26)。
將基因或遺傳物質轉移到細胞內是基于基因治療的疾病治療的第一步。本領域人員熟知大量轉移方法。優選的,施用核酸以用于體內或體外基因治療的用途。非病毒載體轉移體系包括DNA質粒、裸核酸以及與轉移微粒例如脂質體復合的核酸。病毒載體轉移體系包括DNA和RNA病毒,它在轉移進細胞后可以是游離或整合于基因組中。
核酸的非病毒轉移的方法包括脂染、微注射、biolistics、病毒核蛋白顆粒、脂質體、免疫脂質體、聚陽離子或脂質核酸結合體、裸DNA、人工病毒顆粒以及物質強化的DNA攝取。在例如美國專利No 5,049,386、4,946,787和4,897,355中描述了脂染,脂染試劑是可商業化獲得的(例如TransfectamTM和LipofectinTM)。適合用于多核苷酸的有效的受體識別脂染的陽離子及中性脂質包括Felgner在WO 91/17424和WO 91/16024中所述的那些。可以轉移到細胞(體外施用)或靶組織(體內施用)。
本領域人員熟知脂質核酸復合物的制備,包括例如免疫脂質復合物的靶向脂質體(見例如,Crystal,Science(1995),Vol.270,pp.404-10;Blaese et al.,Cancer Gene Ther.(1995),Vol.2,pp.291-97;Behr et al.,Bioconjugate Chem.(1994),Vol.5,pp.382-89;Remy et al.,BioconjugateChem.(1994),Vol.5,pp.647-54;Gao et al.,Gene Therapy(1995),Vol.2,pp.710-22;Ahmad et al.,Cancer Res(1992),Vol.52,pp.4817-20;美國專利Nos.4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028和4,946,787)。
使用用于轉移核酸的基于RNA或DNA病毒的體系的優點是將病毒靶向于體內的特異細胞并將病毒載量加入到核內的高度進化的過程。可以直接將病毒載體施用于患者(體內)或可以將病毒載體體外處理細胞并將經修飾的細胞施用于患者(體外)。用于轉移核酸的常規的基于病毒的體系包括用于基因轉移的逆轉錄病毒、慢病毒、腺病毒、腺相關病毒以及單純皰疹病毒的載體。目前病毒載體是最有效的和用途廣泛的靶細胞與組織的基因轉移的方法。用逆轉錄病毒、慢病毒和腺相關病毒基因轉移方法可以整合于宿主基因組中,常造成插入的轉基因的長期表達。另外,在許多不同的細胞類型和靶組織中觀察到了較高的轉導效率。特別地,目前至少有六種病毒載體方法正被用于基因轉移的臨床試驗,至今逆轉錄病毒載體是應用最為廣泛的體系。所有的這些病毒載體都利用涉及插入到輔助細胞株的基因對缺陷載體的互補作用并生成轉導物質的方法。
通過結合外源性的包被蛋白可以改變逆轉錄病毒的向性,擴展潛在靶向的靶細胞群。慢病毒載體是能轉導或感染非分裂細胞病通常能生成高病毒滴度的逆轉錄病毒載體。因此,對逆轉錄病毒轉移體系的選擇將依賴于靶組織。逆轉錄病毒載體由具有包裝最大到6-10kbp外源序列的能力的順式作用長末端重復構成。最小的順式作用LTR作用于載體的復制和包裝,然后它被用于將治療基因整合到靶細胞中以提供永久的轉基因表達。被廣泛使用的逆轉錄病毒載體包括那些基于小鼠白細胞病毒(MuLV)、長臂猿白血病病毒(GaLV)、猿免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)以及它們的組合載體(見例如Buchscher et al.,J.Virol.(1992),Vol.66,pp.2731-39;Johann et al.,J.Virol.(1992),Vol.66,pp.1635-40;Sommerfelt et al.,Virology(1990),Vol.176,pp.58-59;Wilson et al.,J.Virol.(1989),Vol.63,pp.2374-78;Miller et al.,J.Virol.(1991),Vol.65,pp.2220-24;PCT/US94/05700)。
pLASN和MFG-S是已經應用于臨床試驗的逆轉錄病毒的實例(Dunbar et al.,Blood(1995),Vol.85,pp.3048-57;Kohn et al.,Nat.Med.(1995),Vol.1,pp.1017-23;Malech et al.,Proc.Natl.Acad.Sci.USA(1997),Vol.94,pp.12133-38)。PA317/pLASN是第一個應用于基因治療試驗的治療性載體(Blaese et al.,Science(1995),Vol.270,pp.475-80)。在MFG-S包裝的載體中觀察到了50%或更高的轉導效率(Ellem et al.,Immunol.Immunother.(1997),Vol.44,pp.10-20;Dranoff et al.,Hum.Gene Ther.(1997),Vol.1,pp.111-23)。
在優選為核酸的瞬時表達的申請中,常使用基于腺病毒的體系。基于腺病毒的體系在許多細胞類型中都具有非常高的轉導效率并且不需要細胞分裂。用這些載體,已經獲得高滴度及高水平的表達。在相對簡單的體系中可以大量生產這種載體。腺相關病毒(“AAV”)也用于靶核酸的細胞轉導,例如在核酸及肽的體外生產,以及體內及體外基因治療方法中(見,例如West et al.,Virology(1987),Vol.160,pp.38-47;美國專利No.4,797,368;WO 93/24641;Kotin,Hum.Gene Ther.(1994),Vol.5,pp.793-801;Muzyczka,J.Clin.Invest.(1994),Vol.94,pp.1351)。在大量文獻中都描述了重組AAV載體的構建,包括美國專利No.5,173,414;Tratschinet al.,Mol.Cell.Biol.(1985),Vol.5,pp.3251-60;Tratschinet al.,Mol.Cell.Biol.(1984),Vol.4,pp.2072-81;Hermonat & Muzyczka,Proc.Natl.Acad.Sci.USA.(1984),Vol.81,pp.6466-70;以及Samulski et al,J.Virol.(1989),Vol.63,pp.3822-28。
重組腺相關病毒載體(rAAV)是一種基于缺陷的及非致病性的細小病毒2型腺相關病毒的有前途的可選擇的基因轉移體系。所有載體都來源于一個質粒,它只保留了轉基因表達盒一側的AAV 145bp的反向末端重復。因為整合進所轉導細胞的基因組內所具有的有效的基因轉移及穩定的轉基因轉移是這種載體體系的重要特點(Wagner et al,Lancet(1998),Vol.351,pp.1702-03;Kearnset al.,Gene Ther.(1996),Vol.9,pp.748-55)。
復制缺陷重組腺病毒載體(Ad)主要被用于瞬時表達的基因治療,因為它們可以被高滴度地生成并且它們容易感染多種不同的細胞類型。絕大多數腺病毒載體被加工成轉基因取代了Ad E1a、E1b和E3基因;隨后在人293細胞中擴增復制缺陷載體,該細胞反式提供了被刪除基因的功能。Ad載體可以體內轉導多種類型的組織,包括例如在肝臟、腎臟和肌肉系統組織中所發現的非分裂的、已分化的細胞。傳統的Ad載體具有很大的攜帶能力。Ad載體在臨床試驗上應用的一個實例包括多核苷酸治療用于肌肉注射的抗腫瘤接種免疫(Stermanet al.,Hum.Gene Ther.(1998),Vol.9,pp.1083-92)。腺病毒載體在基因轉移的臨床試驗中的應用的實例還包括Rosenecker et al.,Infection(1996),Vol.241,pp.5-10;Welsh et al.,Hum.Gene Ther.(1995),Vol.2,pp.205-18;Alvarez et al.,Hum.Gene Ther.(1997),Vol.5,pp.597-613;Topf et al.,Gene Ther.(1998),Vol.5,pp.507-13;Stermanet al.,Hum.Gene Ther.(1998),Vol.9,pp.1083-89。
在許多基因治療的應用中,需要的是基因治療載體的轉運應具有對特殊組織類型的高度特異性。通過在病毒的外表面表達一個作為與病毒包膜蛋白的融合蛋白的配基,通常可將病毒載體修飾為具有對特定細胞類型的特異性。所選擇的配基具有對目標細胞類型中存在的已知受體的親和力。例如,Han et al.,Proc.Natl.Acad.Sci.USA(1995),Vol.92,pp.9747-51報告,Moloney小鼠白血病病毒可以被改造成表達與gp70融合的Heregulin,該重組病毒感染特定的表達人表皮生長因子受體的人乳腺癌細胞。這個原理可被擴展到其它對的表達配基融合蛋白的病毒與表達受體的靶細胞。例如,絲狀噬菌體可以被加工成展示具有對任何所選定的細胞受體的特異性結合親和力的抗體片段(例如,Fab或Fv)。盡管上述的方法主要應用于病毒載體,但是相同的方法也可以應用于非病毒載體。這些載體可以被加工成具有被認為能有利于特殊的靶細胞攝取的特殊攝取序列。
藥用組合物及施用本發明也涉及藥用組合物,它可以包括聯合有可藥用載體的Corin表達控制區,或含有表達控制區的載體。在本發明的一個實施方案中,可藥用載體是藥學惰性的載體。
通過施用可以將基因治療載體體內轉運到個體患者中,經常通過全身施用(例如,靜脈內、腹腔內、肌肉內、皮下或顱內灌注)或局部施用,如下面所描述的。同樣可以將載體體外轉運到細胞內,例如從個體患者中取得的細胞(例如淋巴細胞、骨髓穿刺物、組織活檢物)或通用供體的造血干細胞,緊接著將細胞重新移植到患者體內,這通常是在選擇出已經整合有載體的細胞之后。
本領域人員熟知用于診斷、研究或基因治療的體外細胞轉染方法(例如,通過將轉染細胞重新輸注到宿主體內)。在優選的實施方案中,從對象生物體中分離出細胞,用核酸(基因或cDNA)轉染細胞,將細胞重新輸注回對象生物體內(例如患者)。本領域人員熟知各種適用于體外轉染的細胞類型(見,例如Freshney et al.,Culture of Animal Cells,A Manual ofBasic Technique(3rd ed.,1994),以及其中所引用的關于如何從患者中分離及培養細胞的討論的參考文獻)。
也可以將用于體內轉導細胞的含有治療性核酸的載體(例如,逆轉錄病毒、腺病毒、脂質體等)直接施用于生物體。同樣,可以施用裸DNA。通過任何正常地用于將分子引入與血液或組織細胞最后接觸的途徑施用。適合于施用這些核酸的方法是可獲得的并且是為本領域人員所熟知的,盡管多于一種途徑可用于施用特殊的組合物,但一種特殊的途徑常比另一種途徑提供更迅速及更有效的反應。
所施用的具體的組合物(例如,核酸、蛋白、調控化合物或轉導細胞)以及用于施用組合物的具體方法部分地決定了所用的可藥用載體。因此,有很多種本發明的藥用組合物的適宜制劑(見,例如Remington’sPharmaceutical Sciences,17thed.,1989)。施用可以是任何便利的方式,例如經注射、口服施用、吸入或經皮使用。
適合于口服施用的制劑包括(a)液體溶液,例如懸浮于稀釋液的有效量的被包裝的核酸,稀釋液例如水、鹽水或PEG 400);(b)膠囊、粉劑或片劑,每種都含有設定量的為液體、固體、顆粒或凝膠的活性成分;(c)適宜液體中的懸浮液;以及(d)適宜的乳劑。片劑形式可以包括一種或多種乳糖、蔗糖、甘露醇、山梨糖、磷酸鈣、玉米淀粉、馬鈴薯淀粉、微晶纖維素、明膠、膠體二氧化硅、滑石、硬脂酸鎂、和其它賦形劑、顯色劑、填充劑、粘合劑、稀釋劑、緩沖劑、濕化劑、防腐劑、調味劑、染料、分解劑和藥用相容性載體。除了活性成分外,糖錠形式可以包括有味道的活性成分,例如蔗糖,以及含有惰性基底的活性成分的藥片,例如明膠和甘油或蔗糖和阿拉伯膠乳劑、凝膠,以及本領域已知的載體的類似物。
所選定的組合物單獨或與其它適宜的成分一起可以被通過制成吸入施用的氣霧劑制劑(即,它們可以被“霧化”)。氣霧劑制劑可以被放置于被壓縮的可用的推進劑中,例如二氯二氟甲烷、丙烷、氮等等。
適合于例如經關節(關節內)、靜脈內、肌肉內、皮內、腹腔內、皮下途徑施用的腸外施用的制劑包括水性和非水性、等滲無菌注射溶液,它可以包括抗氧化劑、緩沖液、抑菌劑和使得制劑與預計受體的血液等滲的溶劑;以及水性和非水性無菌懸浮液,它可以包括懸浮劑、增溶劑、增稠劑、穩定劑和防腐劑。在本發明的實踐中,例如可以經靜脈內輸注、口服、局部、腹腔內、膀胱內、鞘內施用組合物。腸外施用以及靜脈內施用是優選的施用方法。組合物的制劑放置在單劑量或多劑量的密封容器中,例如安瓿和小藥瓶。
可以從前述類型的無菌粉末、顆粒和片劑制備出注射溶液和懸浮液。如上述也可以經靜脈內或腸外施用用于體外治療的核酸所轉導的細胞。
在本發明的范圍內,施用于患者的劑量應當足夠給患者造成長時間的有益治療反應的劑量。劑量由所采用的具體載體的效率和患者的條件、以及所治療的患者的體重或體表面積所決定的。劑量的大小也由施用具體載體所伴隨的任何副作用的出現、性質以及嚴重程度、或具體患者的轉導細胞的類型所決定的。
在決定所施用的載體的有效量中,醫生評估載體的血漿水平、載體毒性、疾病進展以及抗載體抗體的生成。通常的,對于常規的70公斤的患者,與之相當的載體的裸核酸的劑量是約1μg到100μg,并計算出包括逆轉錄病毒顆粒的載體的劑量以得到相當劑量的治療性核酸。
對于施用,本發明的化合物和轉導細胞可以以一定的速度被施用,該速度是由抑制劑、載體或轉導細胞類型的LD50、和不同濃度的抑制劑、載體或細胞類型的副作用,如患者的體重和總的健康狀況所決定的。可以通過單一劑量或分次劑量施用。
試劑盒本發明進一步涉及藥用包裝和試劑盒,包括一個或多個裝有一種或多種上述的本發明的組合物的成分的容器。與這些容器相關的是管理藥品或生物制品的生產、使用或銷售的政府部門所規定的通告形式,這反映了施用人的產品的生產、使用或銷售的管理機構的認證。
轉基因小鼠本發明的Corin表達控制區多核苷酸也可用于生產轉基因哺乳動物,優選的是轉基因小鼠。這些轉基因生物體可用于,例如鑒定和/或描繪調控這樣的多核苷酸的表達和/或活性的物質。轉基因動物也可用作心臟病變的模型。在此闡述的發明也涉及非人的轉基因動物,在其基因組中包括一個或多個本發明的多核苷酸的拷貝。本發明的轉基因動物可以在它們的基因組中包含有多個多核苷酸的拷貝。
在一個優選的實施方案中,轉基因動物在它的基因組中包含有人Corin基因的表達控制區。本發明包括各種非人的轉基因生物體,例如果蠅、C.elegans、斑馬魚和酵母。本發明的轉基因動物優選的是哺乳動物,例如牛、山羊、綿羊、兔、非人的靈長類動物、或大鼠,最優選的是小鼠。
生產轉基因動物的方法對本領域人員是熟知的,并包括例如同源重組、突變(例如,ENU,Rathkolb et al.(2000)Exp.Physio.,85635-644),和四環素調節的基因表達體系(例如,美國專利No.6,242,667),在此沒有被詳細描述(見例如,Wu et al,Methods in Gene Biotechnology,CRC1997,pp.339-366;Jacenko,O.,Strategies in Generating Transgenic Animals,in Recombinant Gene Expression Protocols.Vol.62 of Methods in MolecularBiology,Humana Press,1997,pp 399-424)。
本發明也涉及非人的基因敲除動物,其基因組包含有與報告基因序列可操縱地連接的人Corin的表達控制區,其中所述的控制區能有效地啟動、終止或調節報告基因序列的轉錄。
用任何有效的方法可以完成與控制序列可操縱地連接的報告基因序列的功能裂解,包括將終止密碼子引入到編碼序列的任何部分,使得所形成的多肽是生物學無活性的(例如,因為它缺少催化結構域、配體連接結構域等);將突變引入到啟動子或其它調節序列中,使得能有效地終止轉錄,或減少外源序列的報告基因序列轉錄成使之失活的報告基因序列。具有功能性裂解基因的轉基因動物的實例是熟知的,例如在美國專利No.6,239,326、6,225,525、6,207,878中所描述的。
不需要進一步的推敲,相信本領域人員可以利用前面的描述最大限度地應用本發明。所有的實施例都利用標準技術進行,這些技術在本領域是熟知的,除其它詳細說明的技術外。
如在標準的實驗室手冊例如Sambrook et al.,Molecular CloningALaboratory Manual,2ndEd.;Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y.,1989中描述的實施下面實施例的常規的分子生物學技術。
因此,下面優選的特殊的實施方案只作為舉例說明,無論如何都不是對發明的剩余內容的任何形式的限制。在此一同并入上面所引用的所有申請書、專利和文獻的全部內容作為參考。
實施例1包括5’側翼區的人與小鼠的Corin基因的分離和描述為了克隆人和小鼠的Corin基因以及它們的5’側翼區,合成了與Corin cDNA序列的5’和3’末端相對應的特異的寡核苷酸。在利用人或小鼠基因組DNA的基于PCR的反應中,用這些寡核苷酸引物嘗試擴增特異產物。用PCR試劑體系(Life Technologies Inc)進行PCR反應,為30個擴增周期(94℃變性1分鐘,50℃退火1分鐘,以及72℃延伸1分鐘)和最后的72℃延伸7分鐘。然后在基于PCR的篩選中用成功擴增特異PCR產物的引物對鑒定含有人或小鼠Corin基因和/或它們的表達控制區的BAC克隆。根據廠家說明書(Incyte Genomics,Palo Alto,CA)進行BAC克隆的DNA分離。用利用32P標記的人和小鼠Corin DNA探針的southern印跡分析進一步確認經鑒定為陽性的細菌人工染色體(BAC)克隆。將BAC克隆直接用鳥槍法測序或將其亞克隆到pUC118(PanVera/Takara,Madison,WI)內進行測序。用Staden軟件包進行鳥槍序列的組裝(MRC Laboratory of Molecular Biology;Bonfield et al.(1995)Nucleic Acid Res.234992-4999)。
用基于PCR的篩選得到四個BAC克隆,每兩個都含有人和小鼠Corin基因。采用染料末端化學法,以鳥槍法測序三個BAC克隆。聯合鳥槍法數據與公開獲得的Trace文檔信息(http//www.ncbi.nlm.nih.gov80/Traces/trace.cgi,http//trace.ensembl.org),裝配含有人Corin基因的340kb的連續序列和小鼠Corin基因的5個重疊群。通過相應的鄰近重疊群中存在的一些配對的閱讀對確認5個重疊群的順序。這些重疊群的距離使得我們可以確定間隔大小小于500bp,因為公用鳥槍文庫的插入大小已經被很好的定義。然后分析人和小鼠Corin基因的結構。然而340kb的人基因組序列沒有包含5’側翼區。從BAC26540中分離得到另外的4165bp的Hind III-EcoR I片段,它包括5’側翼區的最初的3919bp堿基、外顯子1以及內含子1的部分堿基對(提交于GenBankTM/EBI數據庫,編號為AF 521006)。
利用基于PCR的方法、或限制性酶切方法、或聯合于兩者,Corin表達控制區多核苷酸(SEQ ID NO4、SEQ ID NO5和SEQ ID NO6)都來源于從BAC 26540中分離到的4165bp的Hind III-EcoR I片段(圖8,SEQ ID NO2)。例如,用引物F1(5′-AAGCTTCATGAGGGCAGGAG-3′)(SEQ ID NO7)和R1(5′-GAGCTCGCTTATTCTTCTGTCCACTT-3′)(SEQ ID NO8)從4165bp Hind III-EcoR I片段或人基因組DNA中擴增得到在此所述的4023bp的Corin表達控制區多核苷酸(SEQ ID NO6)。用引物F2(5′-AAGCTTATAAAAATAATAGCTTCTTC-3′)(SEQ ID NO9)和R1從4165bp Hind III-EcoR I片段或人基因組DNA中擴增得到在此所述的1283bp的Corin表達控制區多核苷酸(SEQ ID NO5)。用引物F3(5′-AAGCTTAGTAACTCTTTTGCTCCCAA-3′)(SEQ ID NO10)和R1從4165bp Hind III-EcoR I片段或人基因組DNA中擴增得到在此所述的391bp的Corin表達控制區多核苷酸(SEQ ID NO4)。任何從中容易提取出DNA的哺乳動物組織都是用于分離哺乳動物Corin多核苷酸的基因組DNA的適宜來源。
實施例25’側翼區的啟動子活性通過制備人或小鼠的Corin基因的5’側翼序列的連續的截斷片段與無啟動子的螢光素酶基因相連接(見圖4A)的報告基因構建體測定Corin基因的5’側翼區的啟動子活性。分兩步產生人Corin啟動子報告基因構建體,hCp1297LUC(與螢火蟲螢光素酶基因相連的1283bp的Corin表達控制區(SEQ ID NO))以及hCp405LUC(與螢火蟲螢光素酶基因相連的391bp的Corin表達控制區(SEQ ID NO))首先,用具有Sac I和Hind III的限制性位點的引物相應地PCR克隆-1297或-405到-15的人Corin基因的5’側翼區;以及第二步,將相應的PCR產物插入到pGL3基本載體(Promega,Madison,WI)的Sac I和Hind III位點中。
相似地,用上述的PCR克隆方法制備小鼠Corin啟動子構建體,mCp1183LUC、mCp809LUC和mCp646LUC。用EndoFree Plasmid Maxi試劑盒(Qiagen,Valencia,CA)制備這些構建體的質粒。根據廠家的說明書用基于Lipofectin的方法進行對HL-5細胞的轉染(Claycomb et al.(1998)Proc.Nati.Acad.Sci.,USA 952979-2984)。簡要的,將10μg每種Corin報告基因構建體的DNA加上0.1μg pSL-SV40與1ml含有20μgLipofectin的OPTI-MEM I低血清培養基(reduced-serum medium)混和。在室溫下孵育混合物30分鐘,然后將混合物加入到培養于6孔板的一個孔內的70%融合的HL-5細胞中。孵育6個小時后,用新鮮的Ex-Cell 320培養基替換培養基,30小時后,收集轉染細胞并測定螢火蟲及Renilla螢光素酶活性。根據廠家的說明書(Promega)進行二次螢光素酶活性測定。簡要的,通過用250μl新稀釋的被動裂解緩沖液(Promega)裂解轉染細胞制成細胞提取物。在13,000rpm離心5分鐘去除細胞碎片之前將裂解物凍融1次。將上清液轉移到新的試管中,用二次螢光素酶報告基因檢測體系測定20μl上清液。用微量板發光計數器LB96 V(EG&Berthold)監測標本的熒光強度,它測定了10秒間期內的光產物(相對發光值)。每種細胞提取物重復測定三次。每種構建體的每個轉染試驗重復三次。將螢火蟲螢光素酶活性標準化為Renilla螢光素酶活性。
如圖4B所示,人Corin報告基因構建體hCP1297LUC和hCP405LUC所啟動的螢光素酶活性要顯著地高于pGL-3基礎轉染細胞的背景活性。同樣,小鼠報告基因構建體mCp1183LUC、mCp809LUC和mCp646LUC產生了比得上人構建體所啟動的顯著的熒光素活性。這些數據說明負責大多數啟動子活性的順式作用序列相應地定位于人和小鼠Corin基因的-405到-15核苷酸或-646到-77核苷酸之間。
實施例3心臟特異性表達的驗證為了驗證這些構建體是否介導心臟特異性表達,用所述的構建體轉染不表達Corin mRNA和蛋白的HeLa細胞(ATCC,No.CCL2)。與hCp405LUC和mCp646LUC構建體在HL-5細胞中的高活性相反,它們在HeLa細胞中只有很小的啟動子活性(圖5)。作為對照,同步轉染的pRL-SV40在HeLa中比在HL-5細胞中啟動了更高水平的Renilla螢光素酶活性,說明在這些試驗中HeLa細胞和HL-5細胞一樣容易被轉染。這些結構說明從-405到-15的人Corin基因的5’側翼序列或從-646到-77的小鼠Corin基因的5’側翼序列含有足以在培養的心肌細胞中進行特異性表達的元件。
實施例4與GATA-4結合的近端GATA元件對于Corin啟動子的最佳功能是必需的從人-405到-15核苷酸或從小鼠-646到-77核苷酸的5’側翼區能啟動培養的心肌細胞而不是HeLa細胞內的高水平的基因表達。這說明這些區域含有負責進行心肌特異性表達的調節元件。對這些區域的觀察發現了保守的GATA共有序列(稱為近端GATA序列)。
為了確定近端GATA序列是否真的結合于GATA蛋白,我們如前所述的從指數生長的HL-5細胞中制備出核提取物(Schreiber E.et al.,(1989)Nucleic Acids Res.176419),并用已經被描述過的共有GATA寡核苷酸探針(Redondo,J.M.et al.(1990)Science 247(4947),1225-9)以及含有每種近端GATA序列(圖6A)的探針進行電泳遷移率改變分析(EMSA)。含有兩個共有GATA序列或突變的GATA序列(從GATA到CTTA)的雙鏈寡核苷酸探針購自Santa Cruz Biotechnology。合成并HPLC純化含有人或小鼠Corin GATA(相應地為SEQ ID NO11和13)、或突變的人和小鼠Corin GATA(從GATA到CTTA)(相應地為SEQ ID NO12和14)的探針序列。利用[γ-32P]ATP(3000Ci/mmol,Amersham Pharmacia Biotech),以T4多核苷酸激酶(Life Techologies)進行寡核苷酸的5’末端標記。如前所述的進行膠遷移率改變分析(Pan,J.& McEver R.P.(1993)J.Biol.Chem.26822600-22608)。與設想的一樣,當標記的共有GATA探針(SEQ ID NO15)與HL-5細胞的核提取物一起孵育時,它形成了序列特異性的DNA-蛋白復合物(圖6B)。加入100倍過量的未標記探針阻止了該復合物的形成,而無關的GAS元件沒有阻斷這種形成。復合物的形成依賴于完整的GATA序列,因為GATA序列的突變中斷了復合物的形成。而且,在存在100倍過量的含有人或小鼠近端GATA序列的標記探針時,沒有檢測到復合物。相反的,100倍過量的含有突變的近端GATA序列(SEQ ID NO12和14)的標記探針對復合物形成只有很小的影響。這些數據說明Corin近端GATA序列以及共有的GATA探針與常見的GATA蛋白結合。
為了確定復合物涉及哪種GATA蛋白,我們在存在抗GATA家族成員的抗體時,用標記的共有GATA探針進行EMSA。抗小鼠GATA-1(SC-1234x)、GATA-3(SC-268x)、GATA-4(SC-12237x)和GATA-6(SC-7244x)抗體都來自Santa Cruz Biotechnology(Santa Cruz,CA)。如圖6C所示,抗GATA-4抗體顯著地抑制了復合物的形成,而抗GATA-1、-3和-6抗體幾乎沒有這種作用。為了直接確認GATA-4與近端GATA序列的結合,我們在不存在或存在相同的抗GATA-4抗體時使用標記的人近端GATA探針。如圖6D所示,抗GATA-4抗體完全抑制了與用共有GATA探針形成的復合物相同遷移率的DNA-蛋白復合物的形成。這些數據說明GATA-4與近端GATA序列結合,提示GATA-4與近端GATA序列的結合可能造成Corin在心肌細胞中的基因表達。
為了驗證近端GATA元件是否是啟動子活性所必需的,我們將啟動最高啟動子活性的人或小鼠構建體中的野生型序列AGATAA突變成ACTTAA(圖7)。用重疊PCR方法(Ho S.N.et al.,(1989)Gene(Amst)7751-59)構建突變構建缽hCp405mutGATA和mCp646mutGATA。簡要的,用一個反義或有義突變的GATA寡核苷酸和一個外引物(outside primer)生成兩個單獨的PCR產物,每一個產物是雜交產物的一半。純化兩種產物并混和。然后用兩種外引物進行第二次PCR。用Sac I和Hind III消化PCR產物并連接到用Sac I和Hind III消化的pGL3-基礎載體上。用限制性酶切圖和DNA測序確認所有的構建體。GATA元件的突變與在EMSA中所用的突變GATA探針中的突變一樣。當突變構建體轉染進HL-5細胞時,與它們的相應的野生型序列比較,人和小鼠突變構建體具有10%或42%啟動子活性。這些結果說明近端GATA元件對于培養的心肌細胞內的人或小鼠Corin基因的組成型表達是必需的。
通過替換在前述的實施例中所使用的一般或具體描述的本發明的試劑和/或操作條件可以重復出同樣成功的上述實施例。
雖然本發明被描述為關于人或小鼠Corin基因的新的表達控制區,顯而易見的是,只要不脫離發明的精神或范圍就可以對發明進行變化和修改。
序列表<110>舍林股份公司<120>人Corin基因的控制序列<130>52351AWOM1<150>US 60/384,108<151>2002-05-31<160>16<170>PatentIn version 3.2<210>1<211>1888<212>DNA<213>Homo sapiens<220>
<221>misc_feature<222>(922)..(922)<223>n is a,c,g,or t<400>1aaagaagatg aaatagaaac ttgtacttgg cctcagaatg cctgtagaaa ccttagcaat 60tgaatccagc ccttatgtta taggctgagt taactgtggc ccagaaagac tatgtgattt 120gctcacagtt cttgattccc agactggcac tgcggtgatg gtgtgtgatg aggtagtatc 180ttagtaagaa cacaatccag aagtcactgc ctcgggggaa tcccagctca gcttcttgct 240agcttgcgta ggctggttac ttcacttcag ctccctgaat ctgctttctt atctctaaaa 300taaaaataat agcttcttcc tcagagtagt tggtggaact gaaagaatac atgtaaagtg 360cttagtatga cacctgccac ataatatgaa ctgaattatt gtgaattatg ataaatttgt 420cagatactgg tttacaaatc ggatgttaga ataacatgga atcagtgttt cagtcatttt 480actatacata tgcaatattt tctacatttg atctcacttc agaaacaaaa tactgccccc 540cccattttac aaatgcatat ttttttctca gcaataatgt tcaagaacaa gtgcttggcc 600catattttgt tgtctttaca tggctttctt taaataatgg ggatggattt attaaataac 660ctcatgagta attttcaaaa tttccattaa gatcttgatt gaaattggat gaaaaatcat 720ttctaagaaa aacccaatga agtgtttttc tttgccacat ttgacaattg ccttggactt 780ggtaaagtaa tcattactgt gttgagtacc tccagtgccc tccttgacgc tgccttagaa 840aaggtagctg cttttgaatg acaggcagga atttgttcgc cttttaggtt cagcctgtag 900gtgccctctg caggaaatca gnaactaggg ttttggaagc agtcagggtg gggttctccc 960ttgtccctgc agcctcagca aagactcagg cagtctggca aaagcagttt cttcagcata1020cctaacagaa cgcaagtttc catatgcctg atgcaaataa tggcctccaa acgttaaacc1080ttttttgaga taaacttgtt ctttaattgc cagcgcctgc agttaatttt gattggctac1140
actctggtta aaagaaaatg ctttcgatgt gatatggcaa atttggagaa aagtaactct1200tttgctccca accagtcttc cacaacttaa acttaatcgt cctgtccttt ttctgctgcc1260ctcgtggagt gtaagttttt gagggagacc agcagaaact gactttccat atgcccctga1320acaataactt ctttgaatgc aaagaggtgg ggacacggag gatctgtcat tacgggttat1380tatgggtggg acccagagac gggagtgaag ggagggtgtg gcccgcgggt gggatctgta1440gagcagacaa aatatggggc ccctggcgct taaagttcag tttgtctctc ttgagcttgg1500agaaaatcat ccgtagtgcc tccccggggg acacgtagag gagagaaaag cgaccaagat1560aaaagtggac agaagaataa gcgagacttt ttatccatga aacagtctcc tgccctcgct1620ccggaagagc gctgccgcag agccgggtcc ccaaagccgg taagatcgat gattcgctgt1680cctaccgcag ccaggtgtga tggcctctta gtcccggtga attcagggtc agcccctccc1740gcccccgtcc tctcctccgc ccgatgccac ctccttcccc agccgccggt gagctcccgc1800tctgacagtt ccgcgctcag cgccctgcac ccagttccca ggcgcacggc cctggtcccg1860accaccaccc cggtcgcccg gcgtccga 1888<210>2<211>4165<212>DNA<213>Homo sapiens<220>
<221>misc_feature<222>(3363)..(3363)<223>n is a,c,g,or t<400>2aagcttcatg agggcaggag tgcagttttg tttattactg taacctcaga gtagagaagc 60ctggccacat agtagatgct agtattcgtt tcctagggct gctgtaacag ataccataca120tcagttactt aaaacaacag aaatttattc tttcacagtt taggtggcca gaagtcccaa180accaagatat aacaaattat atctgcaaag cctttatttc cacagaacca cattctgagg240ttctgggtgg acattaattt ggcagggagt agtgggggga cactaaccta ctacagtgct300cagtaaatat ttattgggtg aatgaaaatt cagagtgtat tctaagctgt aaaccccttg360gatgttttca tcacagtctt ctcttaataa ctgctacaga acataaggat tagtttgtgg420tcccagattt tttaggctcc aattctgctt ctaccacttt ctacttgtga gctcttaggc480acgctattta actttgtaag cctcagtttc ttctgtaaaa tggtgacaat aagaaataac540agtaagtgcc caataagttt taactattat tatgtgtcta tagctatttt aaagcacttt600ctatatgtaa tcctcataac aaccgtatta ggtgagccta ttacacttct cattttatga660caaaggaaac tagatttgtt tcaagaatga aaaacctaga aaattatatg tcactttatg720aagtgcctgg cacatagtac atagaatagc ttagctacaa taatatagat atgtgacttt780
acctcataac tttaagacat ctcaaattga ttcacaaatc agaaaaaaaa tctgaggcat 840cagatgtgag gtgaggtgag gtgaggcatc tcagtttttg cacatatggt tactgttatt 900gagggagctc catgtcattg agggagctcc acgtcattga gggaggactg ggtgggatgc 960tggccaaagg taggggcata tttaggcagt gaaattgcag ttatgggacc cctctatagc1020actagatgtg tgagaggact aaaaataaaa ttcctttgaa atttcttaca gggtcatata1080ttacctcctt cccaatgact actgtggtat attagagtag gggattgatg tcccagaaat1140attatgtaca tcaaacagaa gatctacaca aattgtttta tcagatactg aatatatcaa1200tgggctagag tgtattatag tacatatggg tatgttgttt tccccctttt gactaaataa1260actctcccct ctctgcaaca ggtaaatttc cagtttacct ttttcttgct gtttttaatt1320ttttttattt tgaaggcttt gtatctttat atctcagctg aaaatattac attctaactc1380cccaaagcta ttctcacatt atttgcaagt attttttcat agtttacatg tttgtgtatt1440tgtttaatac attccacaag actgaaagtc ttggtgaggg caggaactct gtctaggttg1500ttcatctggc agccagcaaa cccaaaataa gtattagttg aatgaatagc taaatagatg1560agccatgggg tagcatatct gttttagcta ctgcttgcct gttatcatcc tgggatgctg1620cttgcttctc cgtgatctct tcttgttctt aaattgtctt cagttgtagt actaagtact1680aatttgatct gtaatgtgat atgtggctga agtttgctct gtaaaatcac cgtttcatga1740ggtatattca atatctttaa tttttccata aatctcttca aggtttgtgt gtgttttctt1800ttaaattatc taactagttg gatgtatgct tgaagtgcta gacaataaaa gtttcaatag1860gctagaaatg tttctttttg taaaattatt ttaagaaact agatgatggt tgtcacttga1920agctgaaatg caaatgtagc tagttttttt taaagaataa ttcaaatagg tcattaaaga1980ttactatgag cacactgcat attcaaatca gtttgaatat gttttgagac ttctaatagt2040ttatgattct tgacatttta atgagcacac tgcatattca aatcagtttg aatatgtttt2100gcgacttcta atagtttatg attcttgaca ttttaaaagt ttattataaa gaatataaaa2160catctttacc ctcatttttt atgtcattac cttcatgcaa agaatacctc aggtattaat2220tctggtgctg ttggtaacta gaactggttg ggttttcttg ctaaaaggaa gtttaaaaaa2280tgtttatttt acaccattaa tgcaattagc tttagttctc agaggaacta aaagtggaaa2340agtgagggag actgatcgac cctatctcaa atccactgac gtagctactt taatttcata2400gtccctgtag cacctccacc agagggcaga aagtggaaga gaaagaagat gaaatagaaa2460cttgtacttg gcctcagaat gcctgtagaa accttagcaa ttgaatccag cccttatgtt2520ataggctgag ttaactgtgg cccagaaaga ctatgtgatt tgctcacagt tcttgattcc2580cagactggca ctgcggtgat ggtgtgtgat gaggtagtat cttagtaaga acacaatcca2640gaagtcactg cctcggggga atcccagctc agcttcttgc tagcttgcgt aggctggtta2700cttcacttca gctccctgaa tctgctttct tatctctaaa ataaaaataa tagcttcttc2760
ctcagagtag ttggtggaac tgaaagaata catgtaaagt gcttagtatg acacctgcca2820cataatatga actgaattat tgtgaattat gataaatttg tcagatactg gtttacaaat2880cggatgttag aataacatgg aatcagtgtt tcagtcattt tactatacat atgcaatatt2940ttctacattt gatctcactt cagaaacaaa atactgcccc ccccatttta caaatgcata3000tttttttctc agcaataatg ttcaagaaca agtgcttggc ccatattttg ttgtctttac3060atggctttct ttaaataatg gggatggatt tattaaataa cctcatgagt aattttcaaa3120atttccatta agatcttgat tgaaattgga tgaaaaatca tttctaagaa aaacccaatg3180aagtgttttt ctttgccaca tttgacaatt gccttggact tggtaaagta atcattactg3240tgttgagtac ctccagtgcc ctccttgacg ctgccttaga aaaggtagct gcttttgaat3300gacaggcagg aatttgttcg ccttttaggt tcagcctgta ggtgccctct gcaggaaatc3360agnaactagg gttttggaag cagtcagggt ggggttctcc cttgtccctg cagcctcagc3420aaagactcag gcagtctggc aaaagcagtt tcttcagcat acctaacaga acgcaagttt3480ccatatgcct gatgcaaata atggcctcca aacgttaaac cttttttgag ataaacttgt3540tctttaattg ccagcgcctg cagttaattt tgattggcta cactctggtt aaaagaaaat3600gctttcgatg tgatatggca aatttggaga aaagtaactc ttttgctccc aaccagtctt3660ccacaactta aacttaatcg tcctgtcctt tttctgctgc cctcgtggag tgtaagtttt3720tgagggagac cagcagaaac tgactttcca tatgcccctg aagaataact tctttgaatg3780caaagaggtg gggacacgga ggatctgtca ttacgggtta ttatgggtgg gacccagaga3840cgggagtgaa gggagggtgt ggcccgcggg tgggatctgt agagcagaca aaatatgggg3900cccctggcgc ttaaagttca gtttgtctct cttgagcttg gagaaaatca tccgtagtgc3960ctccccgggg gacacgtaga ggagagaaaa gcgaccaaga taaaagtgga cagaagaata4020agcgagactt tttatccatg aaacagtctc ctgccctcgc tccggaagag cgctgccgca4080gagccgggtc cccaaagccg gtaagatcga tgattcgctg tcctaccgca gccaggtgtg4140atggcctctt agtcccggtg aattc 4165<210>3<211>1817<212>DNA<213>Mus musculus<400>3aactctgaaa tgaaagaaac tcaactgagc cttcaagatg ggtgaacgta cacccactgt 60tccatcacag actgcttaac tctggccttc agggtggagt tggcaaatgt gtctcctggg120ctctgggttc tcagatgggg ttcctgtggg tggtggtgtg cgctgaggca gtgtctcagt180cagaactcag tcacaaaatg ccaccatctc tggggagtgt caggtcactg cctaccaaat240gacctcagcg ggttatgcca gttgcctctc atctctaagt taaagagggt atgtgcaaaa300
tgcttagtgc agagcccggc atgctggaac actcaggttt gtgaattgtg aaacccttgt 360tagaaatggc atgcctcact gatgctggaa taacttgagg tcaagtgtcc ctcgtcttta 420acgacacata gatgatattc ccacactcca tgtcttttcg gaagcaaagt acccattacc 480acttccttcc actcgtacaa atgtgccttt gtccacacaa tgatactcaa ggtcttattg 540tctgcttact atatgtagcc ttctctagtg gagatgggct acagtataac cttgaataat 600tattgaaatt ttgaaaattt tgattaaaaa tgcatttaaa actcacgttt aagaaaactt 660aaatttttgt tatccttggc ggtttttttt ttcaattttc gataaatatt taagaattgt 720cttgggcttc aatgcaacct ttgctttgga atgtctacac tgctttcctt gacgctatta 780gaatgcagct ccctgtctga tgggcgcgaa tttgctggcc cctgatttca gcctgggcag 840gttcttgtca gacaatcgca ggcccgagtt ctcctagccc atgaagctca aacagcaacg 900ccgtttcccc ccctaaactt gtagcagaag acagatttgc aatttgtgta acacgaataa 960tgcctgcctt cgaaacctga catcttttcg aacacaacaa acttgtcatt ggatcgctag1020tgtctgaaga cattcatttt gatacttgcc tggctagaat cctgtatgag gggatagact1080gttctagatg tgataatgag agttcggaag agagcagccc tttacactgc tcaacaaagt1140tctgccctca acaaagcagc aaaggccaaa agctgctgcc ccatagttga agggttggtt1200tgtttgtttt ttccctggtg tggaggatgg gggcagtaga ctcttggctc tccatctgcc1260atagaaaaat aacttttttg aaggctgggg tgggtatgga ggaactgtct cattaagggt1320tatgggtagg acccagagac gtgagtgaag ggagggagtg gtctgcgggt ggggtctgcc1380cagcagacaa aatatggggc tccaatcccc tgagtataac ttcactccga gtgaggagaa1440agacacccgt agtgcctctc ctcgagatcc atagagcaga gaaaagcgac cgagataaga1500gtggacagag gagaaagata tgttcacgaa acggcccccc gcccttgctc cggaggagta1560cagccgccga gctgacgccc caaagagggt aagatccacc ctcctcgctc ctccagcaca1620caggtcgcgt ggcctgagtc ctggtgactt cagagtcaac cttttttctc cctgtccctt1680cctcctttca tcgggtgcca cctccttccc gtccgtaggt cagtgagcac agacttctca1740gtggctcgtt ctagtcccca ggcagacggt ccctcactcc tgtggcttgg cgtcggagac1800gctggcagtc atgggca 1817<210>4<211>391<212>DNA<213>Homo sapiens<400>4agtaactctt ttgctcccaa ccagtcttcc acaacttaaa cttaatcgtc ctgtcctttt 60tctgctgccc tcgtggagtg taagtttttg agggagacca gcagaaactg actttccata120tgcccctgaa gaataacttc tttgaatgca aagaggtggg gacacggagg atctgtcatt180
acgggttatt atgggtggga cccagagacg ggagtgaagg gagggtgtgg cccgcgggtg240ggatctgtag agcagacaaa atatggggcc cctggcgctt aaagttcagt ttgtctctct300tgagcttgga gaaaatcatc cgtagtgcct ccccggggga cacgtagagg agagaaaagc360gaccaagata aaagtggaca gaagaataag c 391<210>5<211>1283<212>DNA<213>Homo sapiens<220>
<221>misc_feature<222>(623)..(623)<223>n is a,c,g,or t<400>5ataaaaataa tagcttcttc ctcagagtag ttggtggaac tgaaagaata catgtaaagt 60gcttagtatg acacctgcca cataatatga actgaattat tgtgaattat gataaatttg 120tcagatactg gtttacaaat cggatgttag aataacatgg aatcagtgtt tcagtcattt 180tactatacat atgcaatatt ttctacattt gatctcactt cagaaacaaa atactgcccc 240ccccatttta caaatgcata tttttttctc agcaataatg ttcaagaaca agtgcttggc 300ccatattttg ttgtctttac atggctttct ttaaataatg gggatggatt tattaaataa 360cctcatgagt aattttcaaa atttccatta agatcttgat tgaaattgga tgaaaaatca 420tttctaagaa aaacccaatg aagtgttttt ctttgccaca tttgacaatt gccttggact 480tggtaaagta atcattactg tgttgagtac ctccagtgcc ctccttgacg ctgccttaga 540aaaggtagct gcttttgaat gacaggcagg aatttgttcg ccttttaggt tcagcctgta 600ggtgccctct gcaggaaatc agnaactagg gttttggaag cagtcagggt ggggttctcc 660cttgtccctg cagcctcagc aaagactcag gcagtctggc aaaagcagtt tcttcagcat 720acctaacaga acgcaagttt ccatatgcct gatgcaaata atggcctcca aacgttaaac 780cttttttgag ataaacttgt tctttaattg ccagcgcctg cagttaattt tgattggcta 840cactctggtt aaaagaaaat gctttcgatg tgatatggca aatttggaga aaagtaactc 900ttttgctccc aaccagtctt ccacaactta aacttaatcg tcctgtcctt tttctgctgc 960cctcgtggag tgtaagtttt tgagggagac cagcagaaac tgactttcca tatgcccctg1020aagaataact tctttgaatg caaagaggtg gggacacgga ggatctgtca ttacgggtta1080ttatgggtgg gacccagaga cgggagtgaa gggagggtgt ggcccgcggg tgggatctgt1140agagcagaca aaatatgggg cccctggcgc ttaaagttca gtttgtctct cttgagcttg1200gagaaaatca tccgtagtgc ctccccgggg gacacgtaga ggagagaaaa gcgaccaaga1260taaaagtgga cagaagaata agc1283
<210>6<211>4023<212>DNA<213>Homo sapiens<220>
<221>misc_feature<222>(3363)..(3363)<223>n is a,c,g,or t<400>6aagcttcatg agggcaggag tgcagttttg tttattactg taacctcaga gtagagaagc 60ctggccacat agtagatgct agtattcgtt tcctagggct gctgtaacag ataccataca 120tgagttactt aaaacaacag aaatttattc tttcacagtt taggtggcca gaagtcccaa 180accaagatat aacaaattat atctgcaaag cctttatttc cacagaacca cattctgagg 240ttctgggtgg acattaattt ggcagggagt agtgggggga cactaaccta ctacagtgct 300cagtaaatat ttattgggtg aatgaaaatt cagagtgtat tctaagctgt aaaccccttg 360gatgttttca tcacagtctt ctcttaataa ctgctacaga acataaggat tagtttgtgg 420tcccagattt tttaggctcc aattctgctt ctaccacttt ctacttgtga gctcttaggc 480aagctattta actttgtaag cctcagtttc ttctgtaaaa tggtgacaat aagaaataac 540agtaagtgcc caataagttt taactattat tatgtgtcta tagctatttt aaagcacttt 600ctatatgtaa tcctcataac aaccgtatta ggtgagccta ttacacttct cattttatga 660caaaggaaac tagatttgtt tcaagaatga aaaacctaga aaattatatg tcactttatg 720aagtgcctgg cacatagtac atagaatagc ttagctacaa taatatagat atgtgacttt 780acctcataac tttaagacat ctcaaattga ttcacaaatc agaaaaaaaa tctgaggcat 840cagatgtgag gtgaggtgag gtgaggcatc tcagtttttg cacatatggt tactgttatt 900gagggagctc catgtcattg agggagctcc acgtcattga gggaggactg ggtgggatgc 960tggccaaagg taggggcata tttaggcagt gaaattgcag ttatgggacc cctctatagc1020actagatgtg tgagaggact aaaaataaaa ttcctttgaa atttcttaca gggtcatata1080ttacctcctt cccaatgact actgtggtat attagagtag gggattgatg tcccagaaat1140attatgtaca tcaaacagaa gatctacaca aattgtttta tcagatactg aatatatcaa1200tgggctagag tgtattatag tacatatggg tatgttgttt tccccctttt gactaaataa1260actctcccct ctctgcaaca ggtaaatttc cagtttacct ttttcttgct gtttttaatt1320ttttttattt tgaaggcttt gtatctttat atctcagctg aaaatattac attctaactc1380cccaaagcta ttctcacatt atttgcaagt attttttcat agtttacatg tttgtgtatt1440tgtttaatac attccacaag actgaaagtc ttggtgaggg caggaactct gtctaggttg1500ttcatctggc agccagcaaa cccaaaataa gtattagttg aatgaatagc taaatagatg1560
agccatgggg tagcatatct gttttagcta ctgcttgcct gttatcatcc tgggatgctg1620cttgcttctc cgtgatctct tcttgttctt aaattgtctt cagttgtagt actaagtact1680aatttgatct gtaatgtgat atgtggctga agtttgctct gtaaaatcac cgtttcatga1740ggtatattca atatctttaa tttttccata aatctcttca aggtttgtgt gtgttttctt1800ttaaattatc taactagttg gatgtatgct tgaagtgcta gacaataaaa gtttcaatag1860gctagaaatg tttctttttg taaaattatt ttaagaaact agatgatggt tgtcacttga1920agctgaaatg caaatgtagc tagttttttt taaagaataa ttcaaatagg tcattaaaga1980ttactatgag cacactgcat attcaaatca gtttgaatat gttttgagac ttctaatagt2040ttatgattct tgacatttta atgagcacac tgcatattca aatcagtttg aatatgtttt2100gagacttcta atagtttatg attcttgaca ttttaaaagt ttattataaa gaatataaaa2160catctttacc ctcatttttt atgtcattac cttcatgcaa agaatacctc aggtattaat2220tctggtgctg ttggtaacta gaactggttg ggttttcttg ctaaaaggaa gtttaaaaaa2280tgtttatttt acaccattaa tgcaattagc tttagttctc agaggaacta aaagtggaaa2340agtgagggag actgatcgac cctatctcaa atccactgac gtagctactt taatttcata2400gtccctgtag cacctccacc agagggcaga aagtggaaga gaaagaagat gaaatagaaa2460cttgtacttg gcctcagaat gcctgtagaa accttagcaa ttgaatccag cccttatgtt2520ataggctgag ttaactgtgg cccagaaaga ctatgtgatt tgctcacagt tcttgattcc2580cagactggca ctgcggtgat ggtgtgtgat gaggtagtat cttagtaaga acacaatcca2640gcagtcactg cctcggggga atcccagctc agcttcttgc tagcttgcgt aggctggtta2700cttcacttca gctccctgaa tctgctttct tatctctaaa ataaaaataa tagcttcttc2760ctcagagtag ttggtggaac tgaaagaata catgtaaagt gcttagtatg acacctgcca2820cataatatga actgaattat tgtgaattat gataaatttg tcagatactg gtttacaaat2880cggatgttag aataacatgg aatcagtgtt tcagtcattt tactatacat atgcaatatt2940ttctacattt gatctcactt cagaaacaaa atactgcccc ccccatttta caaatgcata3000tttttttctc agcaataatg ttcaagaaca agtgcttggc ccatattttg ttgtctttac3060atggctttct ttaaataatg gggatggatt tattaaataa cctcatgagt aattttcaaa3120atttccatta agatcttgat tgaaattgga tgaaaaatca tttctaagaa aaacccaatg3180aagtgttttt ctttgccaca tttgacaatt gccttggact tggtaaagta atcattactg3240tgttgagtac ctccagtgcc ctccttgacg ctgccttaga aaaggtagct gcttttgaat3300gacaggcagg aatttgttcg ccttttaggt tcagcctgta ggtgccctct gcaggaaatc3360agnaactagg gttttggaag cagtcagggt ggggttctcc cttgtccctg cagcctcagc3420aaagactcag gcagtctggc aaaagcagtt tcttcagcat acctaacaga acgcaagttt3480
ccatatgcct gatgcaaata atggcctcca aacgttaaac cttttttgag ataaacttgt3540tctttaattg ccagcgcctg cagttaattt tgattggcta cactctggtt aaaagaaaat3600gctttcgatg tgatatggca aatttggaga aaagtaactc ttttgctccc aaccagtctt3660ccacaactta aacttaatcg tcctgtcctt tttctgctgc cctcgtggag tgtaagtttt3720tgagggagac cagcagaaac tgactttcca tatgcccctg aagaataact tctttgaatg3780caaagaggtg gggacacgga ggatctgtca ttacgggtta ttatgggtgg gacccagaga3840cgggagtgaa gggagggtgt ggcccgcggg tgggatctgt agagcagaca aaatatgggg3900cccctggcgc ttaaagttca gtttgtctct cttgagcttg gagaaaatca tccgtagtgc3960ctccccgggg gacacgtaga ggagagaaaa gcgaccaaga taaaagtgga cagaagaata4020agc 4023<210>7<211>20<212>DNA<213>artificial sequence<220>
<223>primer<400>7aagcttcatg agggcaggag20<210>8<211>26<212>DNA<213>artificial sequence<220>
<223>primer<400>8gagctcgctt attcttctgt ccactt 26<210>9<211>26<212>DNA<213>artificial sequence<220>
<223>primer<400>9aagcttataa aaataatagc ttcttc 26<210>10<211>26<212>DNA<213>artificial sequence<220>
<223>primer
<400>10acgcttagta actcttttgc tcccaa 26<210>11<211>42<212>DNA<213>artificial sequence<220>
<223>probe<400>11cgtagaggag agaaaagcga ccaagataaa agtggacaga ag 42<210>12<211>42<212>DNA<213>artificial sequence<220>
<223>probe<400>12cgtagaggag agaaaagcga ccaacttaaa agtggacaga ag 42<210>13<211>42<212>DNA<213>artificial sequence<220>
<223>probe<400>13catagagcag agaaaagcga ccgagataag agtggacaga gg 42<210>14<211>42<212>DNA<213>artificial sequence<220>
<223>probe<400>14catagagcag agaaaagcga ccgacttaag agtggacaga gg 42<210>15<211>27<212>DNA<213>artificial sequence<220>
<223>probe<400>15cacttgataa cagaaagtga taactct27<210>16
<211>27<212>DNA<213>artificial sequence<220>
<223>probe<400>16cacttcttaa cagaaagtct taactct2權利要求
1.一種包含哺乳動物的Corin表達控制區的分離的多核苷酸,其中所述控制區調控與其可操縱地連接的異源性多核苷酸的轉錄。
2.權利要求1的多核苷酸,其中所述控制區調控哺乳動物Corin基因的轉錄。
3.權利要求1的多核苷酸,其中轉錄發生于心臟組織。
4.權利要求1的多核苷酸,其中所述控制區包含選自GATA結合位點、Tbx-5結合位點、NKx2.5結合位點和NF-AT結合位點的一種轉錄調節元件。
5.權利要求1的多核苷酸,其中所述控制區與轉錄調節蛋白結合,其中所述蛋白選自GATA-4、Tbx-5、NKx2.5、Krüppel樣因子和NF-AT轉錄因子。
6.權利要求1的多核苷酸,其中哺乳動物是人。
7.權利要求6的多核苷酸,其中所述多核苷酸具有SEQ ID NO4所示的序列。
8.權利要求6的多核苷酸,其中所述多核苷酸具有SEQ ID NO5所示的序列。
9.權利要求6的多核苷酸,其中所述多核苷酸具有SEQ ID NO6所示的序列。
10.一種權利要求1的多核苷酸的片段或變體,其中所述片段或變體能轉錄與其可操縱地連接的異源性多核苷酸。
11.權利要求10的片段或變體,其中所述片段或變體具有的序列與SEQ ID NO4具有至少70%的相同性。
12.權利要求10的片段或變體,其中所述片段或變體具有的序列與SEQ ID NO5具有至少70%的相同性。
13.權利要求10的片段或變體,其中所述片段或變體具有的序列與SEQ ID NO6具有至少70%的相同性。
14.一種包含權利要求1的Corin表達控制區的載體。
15.一種包含權利要求14的載體的宿主細胞。
16.一種生產多肽的方法,其包含自權利要求15的宿主細胞中表達由可操縱地連接于Corin表達控制區的異源性多核苷酸所編碼的多肽。
17.一種生產多核苷酸的方法,其包含自權利要求15的宿主細胞中表達由可操縱地連接于Corin表達控制區的異源性多核苷酸所編碼的反義分子。
18.一種藥物組合物,其包含存在于可藥用載體中的權利要求14的載體。
19.一種藥物組合物,其包含存在于可藥用載體中的權利要求15的細胞。
20.一種鑒定調控細胞內人Corin基因的表達的物質的方法,其中所述方法包括(a)產生一種重組載體,其中一種包含哺乳動物Corin表達控制區的分離的多核苷酸可操縱地連接于一種報告基因;(b)用所述重組載體轉染細胞;(c)用物質處理所述細胞;(d)測定所處理的細胞中的報告基因序列的表達水平;以及(e)比較在存在所述物質情況下所述報告基因序列的表達水平與未被處理的轉染的對照細胞中的表達水平。
21.權利要求20的方法,其中所述細胞是心臟的肌細胞。
22.一種用于調控人類對象的基因表達的方法,所述方法包括(a)產生一種重組載體,其中一種包含哺乳動物Corin表達控制區的分離的多核苷酸可操縱地連接于一種異源性多核苷酸;(b)將治療有效量的所述載體施用于所述對象。
23.權利要求22的方法,其中所述異源性多核苷酸編碼一種治療性蛋白質,例如Corin、ANP、B型利鈉肽、受磷蛋白、ACE、或這些基因的負顯性形式。
24.權利要求23的方法,其中所述異源性多核苷酸編碼Corin。
25.權利要求22的方法,其中所述異源性多核苷酸編碼一種治療性多核苷酸,例如反義RNA分子或催化性RNA分子。
26.權利要求22的方法,其中所述控制區選自SEQ ID NO4、SEQID NO5、和SEQ ID NO6。
27.一種用于治療人類對象的充血性心衰、高血壓或心肌梗死的方法,所述方法包括給所述對象施用治療有效量的一種分離的多核苷酸,所述分離的多核苷酸包含與選自Corin、ANP、B型利鈉肽、受磷蛋白、ACE、和這些基因的負顯性形式的一種基因可操縱地連接的哺乳動物Corin表達控制區。
28.權利要求27的方法,其中所述基因是Corin。
全文摘要
本發明提供了一種從哺乳動物Corin基因分離得到的新的表達控制區。該控制區優選地在心臟細胞內激活轉錄。本發明也提供了采用該控制區來鑒定能夠調控Corin表達的物質以及治療心臟病的方法及組合物。
文檔編號A61K38/00GK1671729SQ03818169
公開日2005年9月21日 申請日期2003年5月28日 優先權日2002年5月31日
發明者潘峻亮, 吳慶宇 申請人:舍林股份公司