專利名稱:一種表皮生長因子樣蛋白及編碼它的多核苷酸序列的制作方法
技術領域:
本發明公開了一種新的人表皮生長因子樣蛋白(以下簡稱為EGFLP)及編碼它的多核苷酸序列,還涉及所述蛋白質和多核苷酸在診斷、預防和治療與該蛋白質表達異常相關疾病中的應用。
表皮生長因子樣基元(EGF-like motif)約由45個氨基酸殘基組成,含有六個半胱氨酸殘基組成的分子內三個二硫鍵,形成三個環狀結構,其相對距離較為固定。由于首次在表皮生長因子(EGF)中發現,故定義為表皮生長因子樣基元(生物化學雜志(J.Biol.Chem)1972,2477612-21)。表皮生長因子樣基元是一個蛋白質相互作用的基元,在表皮生長因子家族中高度保守。表皮生長因子家族包括表皮生長因子(EGF)、肝素結合的表皮生長因子樣(HB-EGF)、轉化生長因子α(TGF-α)、擴增調節因子(AR)、表皮調節因子(Epiregulin)、β細胞因子(betacellulin,BTC)、神經調節因子(NRG)和許旺衍生生長因子(SDGF)等。
研究表明,此家族蛋白主要通過表皮生長因子樣基元結合受體EGFR(EGFR是一跨膜糖蛋白,其膜外區域能結合具有激動功能的配體),使受體二聚化,激活自身酪氨酸激酶活性,或者激活鄰近酪氨酸激酶活性,隨后受體磷酸化,一系列效應蛋白如SHC和磷脂酶Cγ均被磷酸化,這個信息連鎖反應就會觸發表達EGFR細胞的DNA合成而調節細胞生長,增殖,分化(Neuron9,383-391(1992),腫瘤研究(CancerRes),1997;574838~4848)。
在表皮生長因子家族中,EGF、HB-RBF、TGF-α、AR、BTC主要促使表皮細胞、骨胳肌細胞等生長、分裂,存在于人類、鼠、豬等生物的許多組織,如肺、心臟、骨骼肌等中(生物化學與生物物理學研究通訊)(Biochem.Biophy.Res.Commun.),190,125-133(1993))。在EGF反應性上皮細胞中,這些生長因子表現出自我誘導、交叉誘導的特點(生物化學雜志,1994,9;269(36)22817-22)。NRG富含在神經組織中,調節膠質細胞、表皮細胞、肌細胞等細胞的生長、分化(美國國家科學院院報(Proc Natl Acad Sci USA)1997年9月2;94(18)9562-7,自然(Nature)1997年5月29;387(6632)512-6)。
Slit蛋白在果蠅胚胎發育中參與神經中樞系統中線形成。Northern印跡顯示人類同源基因Slit-1、Slit-2、Slit-3 mRNA分別存在于腦、脊髓、甲狀腺中。原位雜交探查到鼠Slit-1 mRNA存在于胎鼠和成年鼠前腦中(分子腦研究(Molec.Brain Res.)62175-186,1998)。據報道,Slit蛋白具有促成神經前體分子從telcephalon的前腹面區遷移到嗅球中的功能(Nature 400331-336,1999)。采用計算機輔助的基元誘捕篩選方法得到MEGF。此類基因的mRNA大于5Kb,對應的蛋白氨基酸殘基多于1500個,都有多個EGF樣基元。其中,MEGF4、MEGF5為分泌蛋白,與果蠅Slit蛋白同源(基因組(Genomics)1998年7月1日,51(1)27-34)。故推測Slit、MEGF4、5對神經系統、內分泌系統的形成和維持起主要作用。
在人類各種癌癥組織中,都可探測到表皮生長因子家族蛋白mRNA的過量表達,故此類蛋白對于癌癥機制的研究和治療有重要作用。
由于如上所述表皮生長因子家族參與包括信號轉導、細胞通訊、生長發育、胚胎形成、免疫應答、生血細胞的生存和分化、炎癥、組織修復和再生、動脈粥樣硬化和癌癥等的許多病理和生理過程,而且相信這些調節過程中涉及大量這樣的因子,因而本領域中一直需要鑒定更多參與這些過程的表皮生長因子,特別是鑒定這種蛋白的氨基酸序列。新表皮生長因子編碼基因的分離也為確定該蛋白在健康和疾病狀態下作用的提供了基礎。這種蛋白可能構成開發疾病診斷和/或治療藥的基礎,因此分離其編碼DNA是非常重要的。
本發明的目的就是提供一種新的人表皮生長因子樣蛋白及編碼它的多核苷酸。本發明的多肽含有EGF家族的特征性基元,即EGF樣基元,因而本發明的EGFLP是該家族中的一個新成員。
本發明涉及一種分離的多肽,它包含具有SEQ ID No.2氨基酸序列的多肽、或其保守性變體、生物活性片段或衍生物。
本發明還涉及一種分離的多核苷酸,它包含選自下組的一種核苷酸序列或其變體(a)編碼具有SEQ ID No.2氨基酸序列的多肽的多核苷酸;(b)與多核苷酸(a)互補的多核苷酸;(c)與(a)或(b)的多核苷酸序列具有至少80%相同性的多核苷酸。
本發明另外涉及一種含有本發明多核苷酸的載體,特別是表達載體;一種用該載體遺傳工程化的宿主細胞,包括轉化、轉導或轉染的宿主細胞;一種包括培養所述宿主細胞和回收表達產物的制備本發明多肽的方法。
本發明還涉及一種能與本發明多肽特異性結合的抗體。
本發明還涉及一種篩選的模擬、激活、拮抗或抑制該表皮生長因子樣蛋白活性的化合物的方法,其包括利用本發明的多肽。本發明還涉及用該方法獲得的化合物。
本發明還涉及一種體外檢測與該表皮生長因子樣蛋白異常表達相關的疾病或疾病易感性的方法,包括檢測生物樣品中所述多肽或其編碼多核苷酸序列中的突變,或者檢測生物樣品中本發明多肽的量或生物活性。
本發明也涉及一種藥物組合物,它含有本發明多肽或其模擬物、激活劑、拮抗劑或抑制劑以及藥學上可接受的載體。
本發明還涉及本發明的多肽和/或多核苷酸在制備用于調節血管平滑肌細胞增殖、恢復或增強神經功能、促進傷口愈合、組織再生、治療角膜炎、腎病、肝病、潰瘍和脫發的藥物的用途。
本發明還涉及本發明多肽的拮抗劑或反義多核苷酸在制備用于治療腫瘤、牛皮癬和糖尿病的藥物中的用途。
本發明上述的和其它的方面對于本領域的技術人員來說,從本文以下的詳細描述看應該是很清楚的。
本說明書和權利要求書中使用的下列術語除非特別說明具有如下的含義“核酸序列”是指寡核苷酸、核苷酸或多核苷酸及其片段或部分,也可以指基因組或合成的DNA或RNA,它們可以是單鏈或雙鏈的,代表有義鏈或反義鏈。類似地,術語“氨基酸序列”是指寡肽、肽、多肽或蛋白質序列及其片段或部分。當本發明中的“氨基酸序列”涉及一種天然存在的蛋白質分子的氨基酸序列時,這種“多肽”或“蛋白質”不意味著將氨基酸序列限制為與所述蛋白質分子相關的完整的天然氨基酸。
蛋白質或多核苷酸“變體”是指一種具有一個或多個氨基酸或核苷酸改變的氨基酸序列或編碼它的多核苷酸序列。所述改變可包括氨基酸序列或核苷酸序列中氨基酸或核苷酸的缺失、插入或替換。變體可具有“保守性”改變,其中替換的氨基酸具有與原氨基酸相類似的結構或化學性質,如用亮氨酸替換異亮氨酸。變體也可具有非保守性改變,如用色氨酸替換甘氨酸。
“缺失”是指在氨基酸序列或核苷酸序列中一個或多個氨基酸或核苷酸的缺失。
“插入”或“添加”是指在氨基酸序列或核苷酸序列中的改變導致與天然存在的分子相比,一個或多個氨基酸或核苷酸的增加。
“替換”是指由不同的氨基酸或核苷酸替換一個或多個氨基酸或核苷酸。
“生物活性”是指具有天然分子的結構、調控或生物化學功能的蛋白質。類似地,術語“免疫學活性”是指天然的、重組的或合成蛋白質及其片段在合適的動物或細胞中誘導特定免疫反應以及與特異性抗體結合的能力。
“激動劑”是指當與EGFLP結合時,一種可引起該蛋白質改變從而調節該蛋白質活性的分子。激動劑可以包括蛋白質、核酸、碳水化合物或任何其它可結合EGFLP的分子。
“拮抗劑”或“抑制物”是指當與EGFLP結合時,一種可封閉或調節EGFLP的生物學活性或免疫學活性的分子。拮抗劑和抑制物可以包括蛋白質、核酸、碳水化合物或任何其它可結合EGFLP的分子。
“調節”是指EGFLP的功能發生改變,包括蛋白質活性的升高或降低、結合特性的改變及EGFLP的任何其它生物學性質、功能或免疫性質的改變。
"基本上純"是指基本上不含天然與其相關的其它蛋白、脂類、糖類或其它物質。本領域的技術人員能用標準的蛋白質純化技術純化EGFLP。基本上純的EGFLP在非還原性聚丙烯酰胺凝膠上能產生單一的主帶。EGFLP多肽的純度可用氨基酸序列分析。
“互補的”或“互補”是指在允許的鹽濃度和溫度條件下通過堿基配對的多核苷酸天然結合。例如,序列“C-T-G-A”可與互補的序列“G-A-C-T”結合。兩個單鏈分子之間的互補可以是部分的或全部的。核酸鏈之間的互補程度對于核酸鏈之間雜交的效率及強度有明顯影響。
“同源性”是指互補的程度,可以是部分同源或完全同源。“部分同源”是指一種部分互補的序列,其至少可部分抑制完全互補的序列與靶核酸的雜交。這種雜交的抑制可通過在嚴格性程度降低的條件下進行雜交(Southern印跡或Northern印跡等)來檢測。基本上同源的序列或雜交探針可競爭和抑制完全同源的序列與靶序列在的嚴格性程度降低的條件下的結合。這并不意味嚴格性程度降低的條件允許非特異性結合,因為嚴格性程度降低的條件要求兩條序列相互的結合為特異性或選擇性相互作用。
“相同性百分率”是指在兩種或多種氨基酸或核酸序列比較中序列相同或相似的百分率。可用電子方法測定相同性百分率,如通過MEGALIGN程序(Lasergene軟件包,DNASTAR,IncMadisonWis.)。MEGALIGN程序可根據不同的方法如Cluster法比較兩種或多種序列(Higgins,D.G.和P.M.Sharp(1988)Gene 73237-244)。Cluster法通過檢查所有配對之間的距離將各組序列排列成簇。然后將各簇以成對或成組分配。兩個氨基酸序列如序列A和序列B之間的相同性百分率通過下式計算
也可以通過Cluster法或用本領域周知的方法如Jotun Hein測定核酸序列之間的相同性百分率(Hein J(1990)酶學方法(Methods inenzymology)183625-645)。
“相似性”是指氨基酸序列之間排列對比時相應位置氨基酸殘基的相同或保守性取代的程度。用于保守性取代的氨基酸例如,帶負電荷的氨基酸可包括天冬氨酸和谷氨酸;帶正電荷的氨基酸可包括賴氨酸和精氨酸;具有不帶電荷的頭部基團有相似親水性的氨基酸可包括亮氨酸、異亮氨酸和纈氨酸;甘氨酸和丙氨酸;天冬酰胺和谷氨酰胺;絲氨酸和蘇氨酸;苯丙氨酸和酪氨酸。
“反義”是指與特定的DNA或RNA序列互補的核苷酸序列。“反義鏈”是指與“有義鏈”互補的核酸鏈。
“衍生物”是指EGFLP或編碼其的核酸的化學修飾物。這種化學修飾物可以是用烷基、酰基或氨基替換氫原子。核酸衍生物可編碼保留天然分子的主要生物學特性的多肽。
“抗體”是指完整的抗體分子及其片段,如Fa、F(ab’)2及Fv,其能特異性結合EGFLP的抗原決定簇。
“分離的”一詞指將物質從它原來的環境(例如,若是自然產生的就指其天然環境)之中移出。比如說,一個自然產生的多核苷酸或多肽存在于活動物中就是沒有被分離出來,但同樣的多核苷酸或多肽同一些或全部在自然系統中與之共存的物質分開就是分離的。這樣的多核苷酸可能是某一載體的一部分,也可能這樣的多核苷酸或多肽是某一組合物的一部分。既然載體或組合物不是它天然環境的成分,它們仍然是分離的。
本發明一方面提供了一種新的人表皮生長因子樣蛋白,及其具有生物活性的的片段、類似物和衍生物。本發明的另一方面,提供了編碼這些多肽的分離的核酸分子,包括mRNA、DNA、cDNA和基因組DNA,及其具有生物活性的片段、類似物和衍生物。本發明的再一方面提供了核酸的探針,它包含足夠長度的核酸分子以及與EGFLP基因序列進行特異性雜交的序列。
依據本發明的一方面,它提供了一種分離的多核苷酸,這些核苷酸編碼具有SEQ ID No.2所示的推定的氨基酸序列的多肽。
編碼EGFLP的多核苷酸可以從許多成人和胎兒的cDNA文庫中分離,如人胎腦cDNA文庫。SEQ ID No.1所示的多核苷酸序列全長為1403個堿基,具有編碼一個含185個氨基酸殘基的多肽的開放閱讀框架。根據氨基酸序列同源比較發現,此多肽與人表皮生長因子家族的Slit-1具有69%的相同性,72%的相似性。
本發明的多核苷酸可以RNA或DNA的形式存在,其中DNA包括cDNA、基因組DNA和合成的DNA。DNA可以是雙鏈或者單鏈的,單鏈也可以是有義鏈或者反義鏈。編碼多肽的多核苷酸序列可以與SEQ IDNo.1所示的多核苷酸序列相同,或者可以是一個由于遺傳密碼的冗余或簡并性而不同的多核苷酸序列,但它與SEQ ID No.1編碼相同的成熟多肽。
編碼SEQ ID No.2的多肽的多核苷酸可以包括僅僅編碼成熟多肽的多核苷酸序列(如SEQ ID No.1中577-1131位多核苷酸)、包含編碼成熟多肽的多核苷酸序列和任選的其它編碼序列或非編碼序列(例如內含子或編碼成熟多肽的多核苷酸序列5’端和/或3’端的非編碼序列)的多核苷酸序列(如SEQ ID No.1中1-1403位多核苷酸)。
本發明進一步涉及上面所描述的多核苷酸的各種變體,它們編碼含有SEQ ID No.2所示的推定的氨基酸序列多肽的片段、類似物和衍生物。這些多核苷酸變體可以是天然存在的等位基因變體或非天然存在的多核苷酸變體。
編碼本發明多肽的多核苷酸也可能與特定的標記序列在同一讀框中相融合,標記序列可幫助本發明多肽的純化。標記序列在使用細菌宿主時可以是pQE載體的六聚組氨酸標記,以利于融合有標記的成熟多肽的純化,或者當使用哺乳類宿主(如猴腎成纖維細胞的COS-7細胞系)時,標記序列可以是一種血細胞凝集素(HA)標記。此外,包含編碼本發明多肽的多核苷酸序列還可包含同源或異源的特定信號肽序列,以幫助目的蛋白質分泌到原核細胞或真核細胞膜外。本領域普通技術人員知曉,上述標記序列和信號肽序列也可通過重組方法或化學法添加在用于表達本發明多肽的載體上。
本發明的多核苷酸序列也包括全長cDNA的片段,例如編碼SEQ IDNo.2中至少20個,優選至少30個,更優選至少50個,最好至少80個氨基酸的多核苷酸片段。這些片段例如具有SEQ ID No.1所示序列中連續的至少10個,優選的至少20個核苷酸,更優選的至少50個核苷酸,特別是至少60,90、150或240個核苷酸。
本發明進一步涉及能與上述序列雜交的多核苷酸,這兩個序列間至少有70%,較優選至少80%,優選至少90%,更優選至少95%的同源性。本發明特別涉及在嚴格條件下能與上述多核苷酸雜交的多核苷酸。這里所用的術語“嚴格條件”意味著兩序列之間有95%,優選至少97%同源性才能發生雜交。在一優選的實施方案中,與上述多核苷酸互補鏈雜交的多核苷酸編碼的多肽基本保持了與SEQ ID No.2所示多肽相同的生物功能或活性。
另外,本發明涉及可與本發明的多核苷酸雜交的多核苷酸,其至少含20個堿基,優選至少30個堿基,更優選至少50個堿基并且具有上面所描述的同源性,其可以保留或不保留活性。例如,這樣的多核苷酸可以用作為檢測SEQ ID No.1所示多核苷酸或其它來源的相似序列的探針;又如,其可以用于本發明多核苷酸的回收或者作為一種診斷探針或PCR引物。
本發明的DNA序列可用多種方法獲得。例如,用本領域熟知的雜交技術分離DNA。這些技術包括但不局限于1)用探針與基因組或cDNA文庫雜交以檢出同源性多核苷酸序列,和2)表達文庫的抗體篩選以檢出具有共同結構特征的克隆的DNA片段。
編碼EGFLP的特異DNA片段序列也能用下列方法獲得1)從基因組DNA分離雙鏈DNA序列;2)化學合成DNA序列以獲得所需多肽的雙鏈DNA。
分離感興趣的cDNA的標準方法是從高表達該基因的供體細胞中分離mRNA并進行逆轉錄,形成質粒或噬菌體cDNA文庫。提取mRNA的方法已有多種成熟的技術,試劑盒也可從商業途徑獲得(Qiagene)。而構建cDNA文庫也是本領域技術人員周知的方法(Sambrook等人,分子克隆實驗室手冊(Molecular Cloning,a Laboratory Manual),冷泉港實驗室,紐約,1989)。還可得到商業供應的cDNA文庫,如Clontech公司的不同cDNA文庫。當結合使用聚合酶反應技術時,即使極少的表達產物也能克隆。
可用常規方法從這些cDNA文庫中篩選本發明的多核苷酸序列。這些方法包括但不限于(1)DNA-DNA或DNA-RNA雜交;(2)標志基因的功能出現或喪失;(3)測定EGFLP的轉錄本的水平;(4)應用免疫學技術或測定生物學活性檢測基因表達的蛋白產物。上述方法可單獨使用,也可多種方法聯合應用。
在第(1)種方法中,雜交所用的探針可與本發明多核苷酸的任何一部分具有相同性,其長度至少是15個核苷酸,優選是20-30個核苷酸,更優選是50-60個核苷酸,最優選是100個核苷酸以上。此處所用的探針通常是在本發明的基因DNA序列信息的基礎上化學合成的DNA序列。本發明的基因本身或者片段當然可以用做探針。DNA探針可用放射性同位素、熒光素或酶(如堿性磷酸酶)等標記。第(4)種方法中,檢測EGFLP基因表達的蛋白產物可用免疫學技術如Western印跡、放射免疫沉淀法、酶聯免疫吸附法(ELISA)等。
由于本申請提供了EGFLP的全長cDNA序列,應用PCR技術擴增DNA/RNA的方法(Saiki,等人,科學(Science)1985;2301350-1354)優先用于獲得本發明的基因。特別是很難從文庫中得到全長的cDNA時,可優選使用RACE法(RACEcDNA末端快速擴增法),在上述PCR方面所用的引物根據本文所公開的本發明的序列信息可適當地選擇,并可用常規方法合成。可用常規方法如通過凝膠電泳分離和純化擴增的DNA/RNA片段。
如上所述得到的本發明的基因,或者各種DNA片段的核苷酸序列的測定可用常規方法如雙脫氧鏈終止法(Sanger等人,美國國家科學院院報,1977,745463-5467)。這類核苷酸序列測定也可用商業測序試劑盒等。為了獲得全長的cDNA序列,測序需反復進行。有時需要測定多個克隆的cDNA序列,以拼接成全長的cDNA序列。
本發明的多核苷酸序列的全部或部分也可通過本領域周知的化學方法合成(Caruthers,M.H.等人,(1980)Nucl.Acids Res.Symp.Ser.215-223;Horn,T.等人,(1980)Nucl.Acid Res.Symp.Ser.225-232)。
本發明進一步涉及具有SEQ ID No.2所示推定氨基酸序列的多肽及其活性片段、類似物和衍生物。SEQ ID No.2所示推定氨基酸序列的多肽為一個含185個氨基酸殘基的多肽。
SEQ ID No.2所示多肽的“片段”、“衍生物”和“類似物”指能基本保留該多肽的生物學功能或活性的多肽或無活性的前體。由此,本發明的多肽包括了其前原蛋白、前蛋白和蛋白原等形式,其經過加工后(如蛋白質水解或修飾)可被激活,產生一個有活性的成熟多肽。
本發明的多肽可以是重組多肽、天然存在的多肽或合成的多肽,優選為重組多肽。SEQ ID No.2所示的多肽的片段、衍生物和類似物可以是(ⅰ)一個或多個氨基酸殘基被保守性或非保守性氨基酸殘基所取代(優選是保守性氨基酸殘基)的多肽,取代的氨基酸殘基是或不是由遺傳密碼所編碼的氨基酸。例如,可以通過氨基酸殘基的插入、取代和/或刪除,得到EGFLP的沉默突變體或功能等同物。可基于氨基酸殘基之間在極性、電荷、溶解性、疏水性、親水性和/或兩親性等方面的相似性進行保守性氨基酸取代,只要保留EGFLP的活性;或(ⅱ)一個或多個氨基酸殘基帶有取代基團的多肽;或(ⅲ)成熟多肽與其它功能性化合物,如提高多肽半壽期的化合物(例如聚乙二醇)融合在一起的多肽;或(ⅳ)成熟多肽與其它氨基酸序列相融合的多肽,其中所述其它氨基酸序列包括諸如幫助純化成熟蛋白的氨基酸序列或蛋白原序列等。這些幫助純化的結構域包括但不限于金屬鰲合肽,如用于在固定化金屬上純化的組氨酸-色氨酸模塊;用于在固定化免疫球蛋白上純化的蛋白A結構域以及用于FLAGS延伸/親和純化系統的結構域(IMMUNEX公司,Seattle,Wash)。特異于因子XA或腸激酶的斷裂接頭序列也可用于幫助目的蛋白質的純化(Porath,J.等人(1992),Prot.Exp.Purif.3263-281)。從這些公開內容看,這樣的片段、衍生物和類似物的應處于本領域技術人員的知識范圍內。
本發明的多肽包括SEQ ID No.2所示的多肽(特別指成熟多肽),也包括與SEQ ID No.2多肽至少有70%相似性(優選是70%相同性)的多肽,優選至少有90%相似性(優選是90%的相同性)的多肽,更優選至少有95%相似性(優選是95%相同性)的多肽,也包括這些多肽的一些部分,通常這些多肽部分至少含有30個氨基酸、優選至少50個氨基酸。
本發明的多肽、其保守性變體和生物活性片段及衍生物可以用常規的肽合成的方法制備,例如固相肽合成(Merrifield J.(1963),美國化學會雜志(J.Am.Chem.Soc.)852149-2154;Roberge,J.Y.等人,(1995)科學,269202-204)。蛋白質合成可以手工完成,也可利用肽自動合成儀如Applied Biosystems 431A肽合成儀進行(Perkin Elmer)。本發明多肽也可以從天然生物材料中經分離純化得到,但優選利用本發明提供的多核苷酸用重組DNA技術制備。根據重組生產方法中所用的宿主不同,本發明中的多肽可能被糖基化或不被糖基化。該多肽也可能具有起始的甲硫氨酸殘基。
根據普通的重組DNA技術,利用本發明的多核苷酸序列可表達或制備重組的EGFLP多肽(科學,1984;2241431)。本發明因而涉及制備本發明EGFLP多肽的方法,一般包括以下步驟(1)用本發明編碼EGFLP的多核苷酸(或變體)或含有該多核苷酸的重組表達載體轉化合適的宿主細胞;(2)在合適的培養基中及適當的培養條件下培養宿主細胞;(3)從培養基或細胞中分離、純化目的蛋白質。
本發明也涉及包含本發明多核苷酸的重組載體、帶有本發明重組載體的遺傳工程化宿主細胞和通過重組技術制備本發明多肽的方法。
本發明的多核苷酸可以用來經重組技術產生多肽。例如,該多核苷酸可以存在于選自多種用于表達多肽的表達載體中的任一載體上,這些載體包括染色體的、非染色體的及合成的DNA序列,例如,SV40的衍生物、細菌質粒、噬菌體DNA、酵母質粒、衍生于質粒和噬菌體DNA結合的載體、病毒DNA、桿狀病毒、牛痘病毒、腺病毒、禽痘病毒及偽狂犬病毒,包括但不限于pQE系列(Qiagen)、pBS、pD10、phagescript、psiX174、pBluescript SK、pBSKS、pNH系列(Stratagene)、pTRC99a、pKK223-3、pDR540、pRIT5(Pharmacia);pWLNEO、pSV2CAT、pOG44、pXT1、pSG(Stratagene)、pSVK3、pBPV、pMSG、pSVL(Pharmacia)。不過,只要是能在宿主中復制和存活,其它質粒或載體也可應用。
本發明也包括含有本發明多核苷酸的重組構建體。該構建體包括載體,如上述質粒或病毒載體,其中可正向或反向插入本發明的多核苷酸序列。構建體中還包含調節序列,例如,有效地連接到本發明多核苷酸序列上的啟動子(包括組成型和誘導型啟動子),介導下游結構序列的轉錄。合適的啟動子包括但不限于,λ噬菌體的PL啟動子、桿狀病毒多角體蛋白啟動子;細菌啟動子如;LacI、LacZ、T3、T7、gpt、λPR、PL和trp;真核啟動子如CMV立即早期啟動子、HSV胸苷激酶啟動子、早期和晚期SV40啟動子、逆轉錄病毒的LTR和小鼠金屬硫蛋白I啟動子;還包括衍生自植物細胞基因組中的啟動子,如熱休克蛋白、RUBISCO啟動子。
表達載體也包含翻譯起始所需要的核糖體結合位點和轉錄終止子,其還可以具有增強表達的合適序列,如增強子。增強子是DNA的順式作用因子,通常有大約10-300bp,作用于啟動子,提高它的轉錄。例如,SV40中位于復制起點后側100-270bp處的增強子,巨細胞病毒早期啟動子增強子、位于復制起點后側的多形瘤增強子及腺病毒增強子。此外,表達載體優選還包含能提供表型特征的一種或多種選擇性基因、抗性基因和/或標記基因,以便于轉化宿主細胞的篩選。選擇性基因如幫助細胞利用吲哚或組氨醇的trpB、hisD(Hartman,S.C和R.C.Mulligan(1988)美國國家科學院院報858047-51),用于tk-或aprt-細胞的肝皰疹病毒胸腺嘧啶激酶(Wigler,M.等人(1977)細胞11223-32)和腺嘌呤磷酸核糖轉移酶(Lowy,I.等人(1980)細胞22817-23);抗性基因如賦予氨甲蝶呤抗性的二氫葉酸還原酶DHFR(Wigler,M.等人(1989),美國國家科學院院報,773567-70)或賦予新霉素和G-418抗性的npt(Colbere-Garapin,F.等人(1981)分子生物學雜志,1501-14),以及四環素或氨芐青霉素抗性基因。哺乳類表達載體一般包括復制起點、適當的啟動子、增強子及任何必需的核糖體結合位點、多腺苷化位點、拼接供體和受體位點、轉錄終止序列和5’側翼非轉錄序列。衍生于SV40拼接序列的DNA序列和多腺苷化位點可用于提供所需要的非轉錄遺傳元件。此外,包含編碼本發明多肽的核苷酸序列的載體還可包含同源或異源的特定信號肽序列,以幫助目的蛋白質分泌到原核細胞或真核細胞膜外。本領域普通技術人員知曉,上述表達載體及構建體中含有的標記序列和信號肽序列也可通過重組方法或化學法添加在編碼本發明多肽的多核苷酸上。
合適載體和啟動子的選擇為本領域普通技術人員周知。細菌適用的有效表達載體可以這樣來構建將編碼目的蛋白的結構DNA序列隨同適當的翻譯起始和終止信號被插入到帶有一個功能啟動子的可操縱的閱讀框中。本領域普通技術人員周知用于構建含有本發明核苷酸序列以及合適的轉錄及翻譯調控元件的方法。這些方法包括體外重組DNA技術、合成技術以及體內遺傳重組技術(Sambrook,J.(1989),《分子克隆,實驗室手冊》,Cold Spring Harbor Press;Plainview,N.Y.;Ausubel,F.M.(1989)現代分子生物學方法(Current Protocols in MolecularBiology),John Wiley & Sons,N.Y.)。
包含上述合適的DNA序列、合適的啟動子或控制序列的載體可以用于轉化合適的宿主,讓宿主表達該蛋白。
本領域技術人員知曉,根據本發明DNA序列所插入的表達載體或構建體的種類和特性選擇合適的宿主以表達目的蛋白質。適于表達本發明的多肽的宿主包括但不限于原核宿主,諸如大腸桿菌、芽孢桿菌屬、鏈霉菌屬等;真核宿主,諸如酵母屬、曲霉屬、昆蟲細胞,諸如果蠅S2和草地夜蛾Sf9;動物細胞,如CHO、COS(猴腎成纖維細胞系,Gluzman,細胞,23175,1981)及其它的能表達相容載體的細胞系,例如C127、3T3、CHO、HeLa、BHK、Bowes黑素瘤細胞;植物細胞以及腺病毒等等。各種哺乳動物細胞的培養系統也能用于表達重組蛋白。從這些講授看,合適宿主的選擇應該在本領域技術人員的知識范圍內。
帶有如上所述的含有本發明核苷酸序列之載體或構建體能夠通過傳統的方法導入合適的宿主細胞中以產生重組產物。將構建體導入上述宿主細胞的方法為本領域技術人員周知,包括但不限于氯化鈣介導的轉化、磷酸鈣轉染、DEAE-葡聚糖介導的轉染、電穿孔、顯微注射、粒子轟擊法或基因槍方法(Sambrook,J.(1989),《分子克隆,實驗室手冊》,Cold Spring Harbor Press;Plainview,N.Y.;Ausubel,F.M.(1989)現代分子生物方法,John Wiley & Sons,N.Y.;Hobbs,S.等人,McGraw Hill科技年鑒(1992),McGraw Hill,N.Y.191-196;Engelhard,E.K.等人,美國國家科學院院報,913224-3227;Logan,J.等人,美國國家科學院院報,813655-3659)。
在適當的培養條件與培養基中培養經轉化的宿主菌株或細胞,使其生長到恰當的細胞密度之后,用適當的方法(例如溫度轉變或化學藥品誘導)誘導所選擇的啟動子,并將細胞再培養一段時間。針對不同的宿主菌株或細胞選擇以及所表達的目的蛋白質的性質相應的培養條件和培養基在本領域技術人員知識范圍之內。
在合適的啟動子控制下可以在哺乳類細胞、酵母、細菌或其它細胞中表達成熟蛋白。利用由本發明的DNA構建體衍生的RNA,也可以用無細胞翻譯體系產生這種蛋白質(Sambrook,J.(1989),《分子克隆,實驗室手冊》,第18章第4節,Cold Spring Harbor Press;Plainview,N.Y.)。
通常用離心的方法收獲細胞或培養液。對于目的蛋白質保留在胞內的情況,一般可用任何便捷的物理、化學方法或酶法,包括凍融循環、超聲波、機械破碎,或使用細胞溶解劑或特定的酶破碎細胞,將粗提物保留以進一步純化。對于對于目的蛋白質分泌到胞外的情況,可直接回收培養上清液。這些方法都是本領域的技術人員熟知的。
多肽可以從重組細胞培養物中回收和純化出來,回收和純化的方法有硫酸銨或乙醇沉淀、酸提取、陰離子或陽離子交換層析、體積排阻層析、疏水相互作用層析、親和層析、羥基磷灰石層析和植物凝集素層析。形成成熟蛋白的完整構象還需要蛋白質的重折疊步驟。通常高效液相層析(HPLC)或毛細管電泳可應用于最后的純化步驟。
本發明中的多核苷酸和多肽可用作研究試劑和材料,以發現人類疾病的治療和診斷方法。這種多核苷酸和其編碼的多肽也可用于體外的相關科學研究、DNA合成和DNA載體的制備,還用于設計治療和診斷人類疾病的方法。
全長EGFLP基因的片段可以用作cDNA文庫的雜交探針,從而分離出全長基因和與之有高度序列相似性或相似生物學活性的其它基因。這種類型的探針一般至少有20個堿基。但是,這些探針優選至少有30個堿基并且一般不超過50個堿基,盡管它們可以具有更多的堿基。該探針也可以用于鑒定相應于全長轉錄物的cDNA克隆或具有完整基因,包括調節和啟動子區域、外顯子及內含子的基因組克隆。篩選的一種方法是,利用已知的DNA序列合成一個寡核苷酸探針,用它去分離出基因的編碼區域。與本發明的多核苷酸序列互補的經標記的寡核苷酸可用于篩選人類cDNA文庫、基因組文庫、mRNA文庫,以確定文庫中哪些成員可與探針雜交。
可利用部分核苷酸序列及利用本領域已知方法延伸編碼EGFLP的核酸序列,以檢測其上游序列如啟動子和調控元件。例如,可利用通用引物通過限制位點PCR(RESTRICTION-SITE PCR)以找回與已知基因座相鄰的未知序列(Sarkar,G.(1993)PCR方法應用(PCR MethodApplic.)2318-322)。基于已知區域利用不同的引物通過逆轉錄PCR擴增或延伸序列(Triglia,T.等人,(1988),核酸研究(Nucleic AcidsRes.)168186)。其他可用的PCR方法包括捕獲PCR(capture PCR),如用鄰近人和酵母人工染色體DNA的DNA片段進行PCR擴增(Lagerstrom,M等人,(1991)PCR方法應用1111-119)。此外,本領域技術人員也可通過PCR利用巢式引物(nested primer)及PromoterFinderTM文庫進行基因組DNA步行(Clontech,Palo Alto,Calif.)。
本發明還涉及利用EGFLP基因產物檢測與EGFLP的多核苷酸序列突變相關的疾病或對疾病的易感性的診斷方法。這些疾病與本發明的EGFLP基因的mRNA及編碼的蛋白質表達異常有關,例如腫瘤和癌癥。
可以用各種技術在DNA的水平上檢測出EGFLP基因突變的個體。用于診斷的核酸可以從病人的細胞中獲得,例如血液、尿液、唾液、活組織檢查和尸體解剖材料。基因組DNA可以直接用于檢測,也可以在檢測分析前用PCR進行酶法擴增(Saiki等人,自然324163-166,1986)。RNA或cDNA也可用于同樣目的。例如,與編碼EGFLP基因的核酸互補的PCR引物可用來鑒定和分析EGFLP基因的突變。例如,從擴增產物的大小與正常基因型相比發生的變化中可以檢出缺失和/或插入突變。將擴增的DNA與放射性標記的EGFLP RNA雜交可檢測點突變,或者使用放射性標記EGFLP反義DNA序列來進行雜交。用RNA酶A消化或從解鏈溫度的不同或改變可以區分完全配對的序列與錯配的雙螺旋。
通過檢測DNA片段在含有或不含有變性劑的凝膠中電泳遷移率的變化,可以進行基于DNA序列差異的遺傳學測試。小序列的缺失和插入可以從高分辨率的凝膠電泳中看出。例如,不同大小的DNA片段可以在變性聚丙烯酰胺凝膠電泳(PAGE)中區別出來。含有點突變的DNA序列與正常的DNA序列分別變性后在不含變性劑的聚丙烯酰胺凝膠中可因構象的不同(泳動速度不同)而區別開來。
本發明的多核苷酸的一部分或全部可作為探針固定在微陣列(Microarray)或DNA芯片(又稱為基因芯片)上,用于分析組織中基因的差異表達分析和基因診斷。
核酸酶保護實驗可以揭示特定位置的序列變化,比如RNA酶和S1酶保護法或者化學斷裂法(Cotton等人,美國國家科學院院報854397-4401,1985)。
總之,特異DNA序列可以用下述方法檢測雜交、RNA酶保護、化學斷裂、直接DNA測序或使用限制性內切酶(例如,限制片段長度的多態性RFLP)及基因組DNA的Southern印跡技術。
除了較傳統的凝膠電泳和DNA測序方法外,突變還可用原位分析檢測出來。
本發明也涉及用于檢測各種組織中EGFLP基因的mRNA表達異常的診斷方法。mRNA水平的變化可用逆轉錄PCR(RT-PCR)、Northern印跡、點雜交或RNA原位雜交等方法進行檢測。這些方法對于本領域的技術人員來說是周知的。
本發明還涉及用于檢測各種組織中EGFLP基因蛋白水平改變的診斷方法,與正常對照組織樣品相比,EGFLP蛋白的減少可檢測疾病或對疾病易感性的存在(如腫瘤)。測定宿主樣品中EGFLP基因蛋白水平的方法是本領域技術人員熟知的,包括放射性免疫測定法、競爭性結合測定法、Western印跡分析、酶聯免疫吸附法和夾心測定法。酶聯免疫吸附法(ELISA)(Coligan等人,現代免疫學方法(Current Protocols inImmunology)卷1,No.2,第6章,1991)要預先準備針對EGFLP抗原的特異性抗體,優選是單克隆抗體。另外,還要準備抗單克隆抗體的報告抗體。報告抗體上連有一個可檢測的試劑,諸如放射性同位素、熒光或辣根過氧化物酶等標記。例如,從宿主取得樣品并在一個固相載體上溫育,例如聚苯乙烯反應板,它能吸附樣品中的蛋白。然后用一種非特異性蛋白如牛血清白蛋白(BSA)溫育,覆蓋板上任何游離的蛋白結合位點。第二步,加入單克隆抗體在板中溫育,這時,單克隆抗體與附著在聚苯乙烯反應板上的EGFLP基因蛋白結合。所有未結合上的單克隆抗體用緩沖液洗去。與辣根過氧化物酶相連的報告抗體此時加入板中,結果報告抗體就與結合在EGFLP抗原上的單克隆抗體相結合。未結合上的報告抗體也被洗掉。然后加入過氧化物酶的底物,在一定的時間內所形成的顏色的深淺與標準曲線作比較,就能測出一定體積的病人樣品中EGFLP基因蛋白的含量。
競爭測定法也可用于這項檢測。將EGFLP抗原的特異性抗體連到一個固相載體上,然后讓標記的EGFLP和從宿主獲得的樣品一起通過固相載體并檢測標記物的數量,例如用液相閃爍計數器。標記物的數量與樣品中的EGFLP的數量相關。夾心測定法類似于酶聯免疫吸附法,包括雙抗原夾心法和雙抗體夾心法。在雙抗體夾心測定法中,EGFLP通過固體載體,與吸附在固相載體上的抗體結合。第二種抗體又結合到EGFLP上。第三種抗體是被標記的并對第二種抗體有特異性,當它通過固相載體時就結合到第二種抗體上,然后檢測它的數量。
利用標記的EGFLP在受體結合實驗中可以檢測表達EGFLP受體的惡性細胞。可以根據EGFLP受體的存在與否和其密度區分細胞,從而提供預測這種細胞對EGFLP活性之敏感性的基礎。
基于本發明EGFLP與已知表皮生長因子的相似性,EGFLP或編碼它的多核苷酸可能用于調節血管平滑肌細胞增殖、恢復或增強神經功能、促進傷口愈合、組織再生、治療眼炎、腎病、肝病、潰瘍和脫發等。本發明多肽的拮抗劑或反義多核苷酸可能用于治療腫瘤、牛皮癬和糖尿病等。
因此,給予包括人和動物受試者治療有效劑量的EGFLP、其生物活性衍生物或激動劑,可治療、緩解和/或預防選自下列的疾病神經病,包括徂不限于神經創傷、阿爾茨海默癥、帕金森氏癥等;眼病,如角膜炎;腎病,如腎功能不全;肝病,如肝功能低下;傷口愈合,包括皮膚傷口、角膜傷口、和體內空腔內壁表皮的損傷,傷口可以是燒傷、挫傷或割傷,也可以是手術創傷;慢性疾病,如慢性潰瘍、糖尿病性潰瘍或其它不愈合性疾病;脫發或其它影響毛囊形成的皮膚病,如由化療引起的脫發。
給予包括人和動物受試者治療有效劑量的EGFLP拮抗劑或抑制劑,可治療、緩解和/或預防選自下列的疾病癌癥,包括但不限于腦癌、肺癌、胃癌、結腸癌、白血病等;牛皮癬和糖尿病等。
EGFLP多肽及其具有生物活性的片段、類似物和衍生物可以與藥學可接受載體一起在組合物中使用,這樣的組合物中包括有效治療劑量的多肽和藥學可接受的載體或賦形劑。這樣的載體包括但并不限制于鹽水、緩沖鹽水、右旋糖、水、甘油、乙醇及其組合。配制品應該適合給藥方式。
本發明的藥物組合物還包括利用本發明的多肽制備的疫苗,其包括本發明的多肽或其具有生物學活性或免疫學活性的片段,其中任選地還含有弗氏完全佐劑、弗氏不完全佐劑以及其它藥學可接受的載體。
本發明也提供了一種藥物包裝或試劑盒,包括一個或多個裝有一種或多種本發明的藥物組合物的成分的容器。另外,這些多肽及其具有生物活性的片段、類似物和衍生物也可與其它的治療化合物組合使用。
這些藥物組合物可用一種方便的方式給藥,諸如表皮、靜脈內、腹膜內、肌肉內、腫瘤內、皮下、鼻內或真皮內途徑。這些藥物組合物以治療和/或預防具體適應癥的有效劑量使用。
本發明的EGFLP多核苷酸可用于基因治療,經體內表達EGFLP或利用反義技術而達到治療目的。
基因治療方法例如包括將病人的細胞在離體情況下用編碼EGFLP多肽的多核苷酸(DNA或RNA)工程化,再將工程化的細胞供給待治療的病人。這樣的方法是本領域中大家所熟悉的。例如,可以用包含編碼本發明EGFLP多肽的RNA的逆轉錄病毒顆粒進行細胞工程化。
同樣,用本領域所知的方法可以在體內工程化細胞以體內表達多肽。如本領域中所知,用于產生含有編碼本發明多肽的RNA的逆轉錄病毒顆粒的生產細胞可以注入病人體內,使體內細胞工程化并在體內表達該多肽。從本發明的講授看,這些以及其它的多肽給藥方式對于本領域技術人員是很清楚的。例如除了逆轉錄病毒外,還有別的用于工程化細胞的表達載體,例如腺病毒,把它與一個合適的運輸載體結合后可在體內工程化細胞。
可以衍生出上述逆轉錄病毒質粒載體的逆轉錄病毒包括但不限于Moloney鼠白血病病毒、脾壞死病毒、勞斯氏肉瘤病毒、Harvey內瘤病毒、禽白血病病毒、長臂猿白血病病毒、人免疫缺陷病毒、腺病毒、骨髓增生性肉瘤病毒和哺乳動物腫瘤病毒。
上述載體中可包含一個或多個啟動子。可使用的合適啟動子包括但不限于逆轉錄病毒的LTR、SV40啟動子、人巨細胞病毒(CMV)啟動子(Miller生物技術(Biotechniques),卷7,No.9,980-990頁,1989)或其它啟動子(例如,真核細胞啟動子包括但不限制于組蛋白、polIII、β-肌動蛋白啟動子)。其它可用的病毒啟動子包括但不限于腺病毒啟動子、胸苷激酶(TK)啟動子和B19細小病毒啟動子。從這里的講授,合適啟動子的選擇在本領域技術人員知識范圍之內。
編碼本發明多肽的多核苷酸序列應在合適啟動子的控制之下。合適的啟動子包括但不限于,腺病毒的啟動子,比如腺病毒主要晚期啟動子;或異源啟動子,比如巨細胞病毒(CMV)啟動子;呼吸道合胞體病毒(RSV)啟動子;可誘導的啟動子,比如MMT啟動子、金屬硫蛋白啟動子;熱休克啟動子;白蛋白啟動子;ApoAI啟動子;人珠蛋白啟動子;病毒胸苷激酶啟動子,比如單純性皰疹胸苷激酶啟動子;逆轉錄病毒的LTR(包括上面所描述的修飾的逆轉錄病毒的LTR);β-肌動蛋白啟動子;及人生長激素啟動子。也可以是控制編碼該多肽的基因的自身啟動子。
用逆轉錄病毒質粒載體轉導包裝細胞系而形成生產細胞系。用于轉染的包裝細胞包括,但不限制于,PE501、PA317、ψ-2、ψ-AM、PA12、T19-14X、VT-19-17-H2、ψCRE、ψCRIP、GP+E-86、GP+envAM12和DNA細胞系,如Miller所描述(人類基因治療(Human GeneTherapy),卷1,5-14頁,1990),此處全文引入作為參考。可用本領域的已知方法用載體轉導包裝細胞系。這些方法包括但不限于,電穿孔、使用脂質體和磷酸鈣沉淀。一種可選擇的方法是將逆轉錄質粒載體包裹進脂質體中或與脂類偶聯,然后注入宿主中。
生產細胞系產生具感染性的逆轉錄病毒顆粒,此病毒顆粒中包含編碼這些多肽的核酸序列。這樣的逆轉錄病毒載體顆粒可用于體外或體內轉染真核細胞。被轉染的真核細胞將表達編碼多肽的核酸序列。可用于轉染的真核細胞包括但不限于,胚胎干細胞、胚胎癌細胞、造血干細胞、肝細胞、成纖維細胞、成肌細胞、角質細胞、內皮細胞和支氣管上皮細胞。
另一方面,利用反義技術可以改變本發明多肽的體內表達也以治療與多肽表達相關的的疾病。可以利用EGFLP基因編碼區、控制或調節區的反義分子(DNA,RNA,或肽核酸(PNA))。最近,文獻中報道了利用三螺旋DNA在治療中的應用(Gee,J.E.等人,(1994)in Huber,B.E.與B.I.Carr,分子及免疫學方法(Molecular and ImmunologicApproaches),Futura Publishing CoMt.Kisco,N.Y163-177頁)。互補序列或反義分子也可通過防止轉錄本與核糖體的結合以阻止mRNA的翻譯。
“肽核酸”是指一種反義分子或反基因物,其包含與以賴氨酸結尾的氨基酸殘基之肽骨架連接的寡核苷酸,寡核苷酸的長度至少為5個核苷酸。末端的賴氨酸賦予對組合物的溶解性。肽核酸優先結合互補性單鏈DNA或RNA,終止轉錄的延伸,也可延長其在細胞中的半壽期(Nielsen,P.E.等人,(1993)抗腫瘤藥物研究(Anticancer Drug Res.),853-63)。
多肽及其片段、衍生物或類似物或表達它們的細胞可用作免疫原以產生其抗體。這些抗體可以是多克隆或單克隆抗體。本發明也包含了嵌和的、單鏈的和人源化的抗體以及Fab片段、或Fab表達文庫的產物。本領域已知的各種方法可用于這樣的抗體和片段的產生。
所產生的針對本發明多肽的抗體可通過直接將本發明的多肽注射給動物或將其導入動物(最好不是人)而獲得。所得到的抗體可與多肽本身結合。用這種方法,甚至用只編碼本發明多肽的片段序列也能獲得結合整個天然多肽的抗體。然后,抗體可用來把多肽從表達它的組織中分離出來。
制備單克隆抗體可以用連續細胞系培養產生抗體的技術。例如,用雜交瘤技術(Kohle & Milstein自然256495-497,1975)、Trioma技術、人B細胞雜交瘤技術(Kozbor等人,今日免疫學(ImmunologyToday)472,1983)和EBV-雜交瘤技術產生人的單克隆抗體(Cole等人,單克隆抗體和癌癥治療(Monoclonal Antibodies and CancerTherapy),Alan R.Liss,Inc77-96,1985)。
單鏈抗體產生技術(美國專利4,946,778)適用于產生本發明的免疫原性多肽產物的單鏈抗體。轉基因動物也可用來表達本發明的免疫原性多肽產物的人源化抗體。
EGFLP特異性抗體可用于癌癥的診斷和治療,因為許多癌癥細胞在瘤形成和增生過程中上調TGF-α家族中的各種成員。這些抗體結合并滅活EGFLP。
抗體也可用于設計針對體內某一特殊部位的免疫毒素。如與本發明表皮生長因子樣蛋白有高親和性的單克隆抗體可與細菌或植物毒素(如白喉毒素,蓖麻蛋白,紅豆堿等)共價結合。一種通常的方法是用巰基交聯劑如SPDP,攻擊抗體的氨基,通過二硫鍵的交換,將毒素結合于抗體上,這種雜合抗體可用于殺滅該表皮生長因子樣蛋白陽性的細胞,特別是癌細胞。
本發明還涉及一種篩選EGFLP的激動劑、拮抗劑及抑制劑的方法,包括使用本發明的多肽或其片段篩選多肽庫或藥物候選物文庫用于尋找有治療價值的能抑制或刺激EGFLP功能的分子。本發明多肽的激動劑、拮抗劑以及抑制劑的篩選可利用本領域普通技術人員周知的方法進行。本發明也提供了篩選藥物以鑒定提高(激動劑)或阻遏(拮抗劑)EGFLP活性的藥物的方法。激動劑提高EGFLP刺激細胞增殖等生物功能,而拮抗劑阻止和治療與細胞過度增殖有關的紊亂如各種癌癥。例如,哺乳動物細胞或表達EGFLP的膜制劑能在藥物的存在下與標記的EGFLP一起培養。然后測定藥物提高或阻遏此相互作用的能力。EGFLP蛋白的拮抗劑可以與人EGFLP蛋白結合并消除其功能,或是抑制人EGFLP蛋白的產生,或是與多肽的活性位點結合使多肽不能發揮生物學功能。在篩選化合物作為拮抗劑時,可以將此種新的人EGFLP蛋白加入生物分析測定中,通過測定此種新的人EGFLP蛋白此種新的人EGFLP蛋白化合物影響和其受體之間的相互作用來確定化合物是否是拮抗劑。以上述篩選化合物的同樣方法,可以篩選出起拮抗劑作用的分子。這些通過本發明方法獲得的EGFLP或其片段的激動劑、拮抗劑及抑制劑可如上所述配制成藥物組合物用于上述疾病的治療。
本發明將在下面的實施例中進一步描述。但是本發明并不局限于這些實施例。所有的份和量,除非另有說明都按重量計。
DNA的“消化”指用限制酶對DNA進行催化性切割,限制酶只作用于DNA序列的特定位點。這里所用的各種限制酶可從商業獲得,它們的反應條件、輔助因子和其它的要求按照一般技術人員所知的應用。為了分析需要,通常在大約20μl的緩沖溶液中加入1μg質粒或DNA片段和大約2個單位的酶。為了分離DNA片段用于質粒構建,通常在一個較大的的體積中用20到250個單位的酶消化5到50μg的DNA。生產廠家會指明對特異限制酶合適的緩沖液和底物的量。通常所用的溫育時間大約是37℃一個小時,但根據廠家的指示可以有所改變。限制性消化之后直接在聚丙烯酰胺膠上進行電泳,分離出想要的片段。
根據所切割成的片段大小進行分離可用8%的聚丙烯酰胺凝膠(Goedde等人,核酸研究84057,1980)。
“連接”指在兩個雙鏈核酸片段間形成磷酸二酯鍵的過程。除非提供了別的方法,連接可以在已知的緩沖液和條件下進行,即每0.5mg約等摩爾量的用于連接的DNA片段加10個單位的T4 DNA連接酶(“連接酶”)。
除非另有說明,轉化均用Graham & Van der Eb病毒學(Virology)52456-457,1973中所描述的方法進行。實施例1EGFLP的cDNA的克隆用異硫氰酸胍/酚/氯仿一步法提取人胎腦總RNA。用Quik mRNA分離試劑盒(Qiegene)從總RNA中分離poly(A)mRNA。2μg poly(A)mRNA經逆轉錄形成cDNA.用Smart cDNA克隆試劑盒(購自Clontech)將cDNA片段定向插入到載體pBSK(+)(Clontech公司產品)的多克隆位點上,轉化大腸桿菌DH5α形成cDNA文庫。共獲得3028個克隆。用雙末端循環反應測序試劑盒(Perkin-Elmer公司產品)和ABI377型自動測序儀(Perkin-ELmer公司產品)測定所有克隆的5’和3’末端的序列。將測定的cDNA序列與已有的公共DNA序列數據庫(GeneBank)進行比較,結果發現有一個克隆0818c04的DNA序列為新的DNA。通過合成一系列引物對此克隆所含的DNA序列進行雙向序列測定。計算機分析表明,該克隆所含的全長cDNA是一個新的DNA序列(Seq ID No 1),從第577bp至1131bp有一個555bp的開放閱讀框架,編碼一個新的185個氨基酸殘基的多肽(Seq ID No2)。我們將此蛋白質命名為表皮生長因子樣蛋白(EGFLP)。實施例2用RT-PCR方法克隆EGFLP用胎腦細胞總RNA為模板,以oligo-dT為引物進行逆轉錄反應合成cDNA,用Qiagen的試劑盒純化后,用下列引物進行PCR擴增正向引物F1 5’-CAGTGCCTGCATGGCCACT-3’位于SEQ ID No1的起始處;反向引物R15’-ACAAATATTTATTAAGCGC-3’位于SEQ ID No1的1382-1499bp。擴增反應的條件在50μl的反應體積中含有50mmol/LKCl,10mmol/L Tris-Cl,(pH8.5),1.5mmol/L MgCl2,200μmol/LdNTP,25pmol引物,2.5U的Taq DNA聚合酶(Clontech公司產品)。在PE9600型DNA熱循環儀上按下列條件反應25個周期94℃ 30秒;55℃,30秒;72℃ 2分鐘。在RT-PCR時同時以模板空白為陰性對照。擴增產物QIAGEN試劑盒純化后,用TA克隆試劑盒連接到pCR載體上(Invitrogen),并測定DNA序列。結果PCR產物的DNA序列與Seq IDNo1所示的1-1403bp完全相同。實施例3重組EGFLP的體外表達、分離和純化分別在EGFLP的基因的起始密碼子處及終止密碼子處設計了一對引物,正向引物5’-GAATTCCTAGGCTATCCCCT-3’,反向引物5’-TCTAGACCTGTCCACGCAA-3’。其5’端分別帶有EcoRI和XbaI酶切位點。以質粒01818c04為模板進行PCR擴增獲得EGFLP的基因編碼區。經過酶切將擴增片段插入表達載體pGEM3Zf(+)(購自Promega公司),并轉化E.coli DH5α,在含氨芐青霉素和IPTG的LB平板上,篩選白色的5個重組轉化子進行DNA序列分析,結果與SEQ ID No的序列完全相同。
挑一環含重組質粒的重組菌株,接種于20ml LB培養基(含氨芐青霉素100μg/ml),37℃振蕩培養過夜作為種子液,取種子液按2%接種量轉接接于4升LB培養基,37℃振蕩培養至菌體A600=0.7時(對數生長期),加入IPTG至終濃度0.4mmol/L,再于25℃培養12小時,離心收集菌體。冰浴中超聲破碎,離心后收集上清。上清液過Sepharose層析柱,及反相高效液相層析柱,得到了純化的目的蛋白(EGFLP)。經SDS-PAGE電泳,在20KD處得到一條主帶。將該條帶轉移至PVDF膜上,用Edmans法進行N端氨基酸序列分析,結果N端15個氨基酸與SEQ ID NO.2所示的N端15個氨基酸完全相同。實施例4抗EGFLP的抗體的產生用多肽合成儀(PE-ABI)合成EGFLP特異性的多肽NH2-Ser-Cys-Thr Pro-Leu-Ala-Met-Gly-Thr-Pro-Pro-Ser-Leu-COOH。將該多肽分別與血藍蛋白和牛血清蛋白耦和形成復合物,方法參見Avrameas.等人,免疫化學(Immunochemistry),1969;643。用4mg上述血藍蛋白多肽復合物加上完全弗氏佐劑免疫家兔,15天后再用血藍蛋白多肽復合物加上不完全弗氏佐劑加強免疫一次。采用經15μg/ml牛血清蛋白多肽復合物包被的滴定板做ELISA測定抗體的滴度。用蛋白A-Sepharose從抗體陽性的家兔血清中分離總IgG。將多肽結合與溴化氰活化的Sepharose4B柱上,用親和層析法從總IgG中分離多肽抗體。免疫沉淀法證明純化的抗體可特異性的與EGFLP結合。
實施例5cDNA克隆的同源檢索用本發明提供的人EGFLP的多核苷酸的序列及其編碼的蛋白序列在Genbank、swissport等數據庫進行同源檢索,用于檢索的程序為Blast(Basic local alignment search tool)(Altschul,S.F.等,人生物化學雜志,215403-10)。用Blast找出了與EGFLP同源的許多基因,其中與EGFLP同源性最大的基因編碼的蛋白在Genbank的準入號為AB017167。該序列可以用GCG軟件包中的Pileup(多序列)和Gap(兩序列)程序與EGFLP做連配比較。同源檢索的結果如表1和表2所示,表中相同的氨基酸在兩個序列之間用其氨基酸單字符標出,相似的氨基酸用"+"標出。該結果顯示EGFLP與人Slit-1的相同性達到94/136(69%),相似性為98/136(72%)(見表1),EGFLP的C-末端107-185位氨基酸序列與人MEGF4的1-79位的氨基酸序列完全相同(100%)(見表2)。EGFLP蛋白一級序列用Motif程序進行分析,結果表明EGFLP含EGF樣基元,且為分泌多肽。
表1人EGFLP(上排,用Query表示)與人Slit-1蛋白(下排,用Sbjct表示)氨基酸序列比較結果>gi︱4507061 ref︱NP_003052.1︱pSLIL1︱slit(Drosophila)同源區1>dbj︱BAA35184︱(AB017167)Slit-1 蛋白質[Homo sapiens] 長度=1534得分=473(166.5bits),期望=1.6e-43,P=1.6e-43相同性=94/136(69%),相似性=98/136(72%)Query 50 ACACQ--WEAEVCWGQRWGLRAKGSTPQMLPSSSSSSCLGGSSYSWVCPEAFSWCLSHPE 107+C CQ + +C Q L Q L +S G VC FS L ESbjct1400 SCQCQDGYSGALC-NQAGALAEPCRGLQCLHGHCQAS-GTKGAHCVCDPGFSGELCEQE 1456Query 108 SECRGDPVRDFHQVQRGYAICQTTRPLSWVECRGSCPGQGCCQGLRLKRRKFTFECSDGT 167SECRGDPVRDFHQVQRGYAICQTTRPLSWVECRGSCPGQGCCQGLRLKRRKFTFECSDGTSbjct1457 SECRGDPVRDFHQVQRGYAICQTTRPLSWVECRGSCPGQGCCQGLRLKRRKFTFECSDGT 1516Query 168 SFAEEVEKPTKCGCALCA 185SFAEEVEKPTKCGCALCASbjct1517 SFAEEVEKPTKCGCALCA 1534表2.人EGFLP(上排,用Query表示)與人MEGF4(下排,用Sbjct表示)氨基酸序列比較結果>dbj︱BAA32465︱(AB011537)MEGF4[Homo sapiens] 長度=79得分=451(158.8bits),期望=1.3e-42,P=1.3e-42相同性=79/79(100%),相似性=79/79(100%)Query107 ESECRGDPVRDFHQVQRGYAICQTTRPLSWVECRGSCPGQGCCQGLRLKRRKFTFECSDG 166ESECRGDPVRDFHQVQRGYAICQTTRPLSWVECRGSCPGQGCCQGLRLKRRKFTFECSDGSbjct 1 ESECRGDPVRDFHQVQRGYAICQTTRPLSWVECRGSCPGQGCCQGLRLKRRKFTFECSDG 60Query167 TSFAEEVEKPTKCGCALCA 185TSFAEEVEKPTKCGCALCASbjct 61 TSFAEEVEKPTKCGCALCA 79
實施例6EGFLP的反義寡核苷酸抑制HL-60細胞的增殖采用392型DNA合成儀自動合成EGFLP的反義寡核苷酸(AS-ODN)和正義寡核苷酸(S-ODN),并以二硫四乙秋姆(Tetraethylthiuramdisulfide,TETD)進行化學修飾而成為AS-PS-ODN和S-PS-ODN,其堿基序列為AS-PS-ODN5’-CATTATGAAAAGGATTCATG-3’S-PS-ODN5’-CATGAATCCTTTTCATAATG-3’將濃度為5×105HL-60細胞分為3組在37.5%CO2培養箱中培養(1)對照組為單純HL-60細胞;(2)HL-60細胞+AS-PS-ODN(3)HL-60細胞+S-PS-ODN。AS-PS-ODN或AS-PS-ODN的終濃度為20μg/ml。細胞培養24小時后用臺酚藍染色檢測細胞的死亡率。結果表明,AS-PS-ODN組細胞死亡率為92.5%,而對照組和S-PS-ODN組死亡率為5%。表明EGFLP基因的反義寡核苷酸能有效地抑制HL-60細胞的增殖。
序列表(1)一般信息(ⅰ)申請人(A)姓名上海生元基因開發有限公司(B)街道北京東路668號610室(C)城市上海(E)國家中國(F)郵政編碼200001(ⅱ)發明名稱一種表皮生長因子樣蛋白及編碼它的多核苷酸序列(ⅲ)序列數2(2)SEQ ID NO1的信息(ⅰ)序列特征(A)長度1403個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲類型線性(ⅱ)分子類型cDNA(ⅰⅹ)特性(A)名稱/關鍵詞CDS(B)位置577..1131(ⅹⅰ)SEQ ID NO1的序列描述1 CAGTGCCTGCATGGCCACTGCCAGGCCTCAGGCACCAAGGGGGCACACTGTGTGTGTGAC61 CCCGGCTTTTCGGGCGAGCTGTGTGAGCAAGGTCAGGGGCCCCCCTCCTGACGTGCCCTC121 CCCAGGGTCCCCCACAAATTGCTTTAGCAATTTGACTCTTCCTCCCAGTCTCGGCAGCCC181 TTCTGTCCCTTCCCAGCCCTGTACCATGGGCTACTATGGGGCTTTCAGAGTCCCTCCACC241 CTCTGGGCACTGCTCCCAATCTCTCCTGGCCCAGTTTGCCCTGCAGCTCCCTTATTCAGG301 GTATGCGCCTCTTCTGGCTGGGGTCTCTCCTTGCAGAAGAGACCACCCAGGGTAACAGCT361 CCTGGCCCAACCTCTGCCTCTTGGCCCCATCACCTCATGACCTGGGAGCGGCAGCAGGAA421 GTCCGAGGGTTGGGGACTCCTTCCCAGGCCCTCCCTGGCCTGCTTGACCAAGATGGCTTC481 TGCTGGAATCCGGACTGCTAAGGCTGGGCAGGGAGAAGCTGGAGAAACCCAGAACTCAGG541 CACCTTAAGGGTCCCCTAGGCTATCCCCTCCCCAGCATGAATCCTTTTCATAATGTTATT601 GCCCCCGGGGCCTCCAGCCTCTCTTGCACGCCTCTAGCAATGGGGACCCCCCCCTCCCTC661 CAGCAGTTCAATCTTGTCCTGGAGGGCCTGACGCTAGGACCAGACTGTAGGCCCTGGGAG721 GAAGCTTGTGCATGTCAGTGGGAGGCGGAAGTATGCTGGGGACAGAGGTGGGGTCTGAGA781 GCCAAAGGATCCACCCCACAGATGCTGCCCTCCTCCTCCTCTTCCTCCTGCCTCGGAGGC841 AGCAGCTACTCATGGGTGTGCCCTGAGGCTTTCTCTTGGTGTCTGTCCCATCCAGAGTCC901 GAGTGCCGGGGGGACCCTGTCCGGGACTTTCACCAGGTCCAGAGGGGCTATGCCATCTGC961 CAGACCACGCGCCCCCTGTCATGGGTGGAGTGCCGGGGCTCGTGCCCAGGCCAGGGCTGC1021 TGCCAGGGCCTTCGGCTGAAGCGGAGGAAGTTCACCTTTGAGTGCAGCGATGGGACCTCT1081 TTTGCCGAGGAGGTGGAAAAGCCCACCAAGTGTGGCTGTGCCCTCTGCGCATAGCGTTTT1141 GCGTGGACAGGCCGGTGAGGGCGGGCAAGGGGCCCCAGCCGCTGCAGCAGCGGAGACAGT1201 CGCCAGCAGCTGGGCTGGGGTGCAGGTCATCACAGGACGGTTCCTGGGCAGCTGGGCCCT1261 CCTGGGTGGGGTGGTGCCAGAGCAGCCTTTTAAAAGCAAATTGCGCCATAGCTGGGGGCA1321 GCGGGGGTGGGCGAGGCCTGAGCTGCGGGCTGCCCTCTCCGGAAGTGCCTTGCACAAATA1381 GGCGCTTAATAAATATTTGTTGA(2)SEQ ID NO2的信息(i)序列特征(A)長度185個氨基酸(B)類型氨基酸(D)拓撲結構線性(ii)分子類型多肽(xi)序列描述SEQ ID NO21 Met Asn Pro Phe His Asn Val Ile Ala Pro Gly Ala Ser Ser Leu16 Ser Cys Thr Pro Leu Ala Met Gly Thr Pro Pro Ser Leu Gln Gln31 Phe Asn Leu Val Leu Glu Gly Leu Thr Leu Gly Pro Asp Cys Arg46 Pro Trp Glu Glu Ala Cys Ala Cys Gln Trp Glu Ala Glu Val Cys61 Trp Gly Gln Arg Trp Gly Leu Arg Ala Lys Gly Ser Thr Pro Gln76 Met Leu Pro Ser Ser Ser Ser Ser Ser Cys Leu Gly Gly Ser Ser91 Tyr Ser Trp Val Cys Pro Glu Ala Phe Ser Trp Cys Leu Ser His106 Pro Glu Ser Glu Cys Arg Gly Asp Pro Val Arg Asp Phe His Gln121 Val Gln Arg Gly Tyr Ala lle Cys Gln Thr Thr Arg Pro Leu Ser136 Trp Val Glu Cys Arg Gly Ser Cys Pro Gly Gln Gly Cys Cys Gln151 Gly Leu Arg Leu Lys Arg Arg Lys Phe Thr Phe Glu Cys Ser Asp166 Gly Thr Ser Phe Ala Glu Glu Val Glu Lys Pro Thr Lys Cys Gly181 Cys Ala Leu Cys Ala
權利要求
1.一種分離的多肽,它包含具有SEQ ID No.2氨基酸序列的多肽、或其保守性變體或其活性片段或衍生物。
2.如權利要求1所述的多肽,其是具有SEQ ID No.2氨基酸序列的多肽。
3.一種分離的多核苷酸,其包含選自下組的一種核苷酸序列或其變體(a)編碼如權利要求1或2所述多肽的多核苷酸;(b)與多核苷酸(a)互補的多核苷酸;(c)與(a)或(b)的多核苷酸序列具有至少80%相同性的多核苷酸。
4.如權利要求3所述的多核苷酸,其特征在于,該多核苷酸編碼具有SEQ ID No.2所示氨基酸序列的多肽。
5.如權利要求3所述的多核苷酸,其特征在于,該多核苷酸的序列選自下組的一種(a)具有SEQ ID No.1中577-1131位的序列;(b)具有SEQ ID No.1中1-1403位的序列。
6.一種含有權利要求3所述的多核苷酸的重組載體。
7.一種用權利要求3所述的多核苷酸或權利要求6所述的載體轉化、轉導或轉染的宿主細胞。
8.一種具有人表皮生長因子樣蛋白活性的多肽的制備方法,該方法包括(a)在適合表達人表皮生長因子樣蛋白的條件下,培養權利要求7所述的宿主細胞;(b)從培養物中分離出具有表皮生長因子樣蛋白活性的多肽。
9.一種能與權利要求1所述的表皮生長因子樣蛋白特異性結合的抗體。
10.一種篩選模擬、促進、拮抗或抑制表皮生長因子樣蛋白活性的化合物的方法,其包括利用權利要求1的多肽或其活性片段。
11.一種體外檢測與表皮生長因子樣蛋白異常表達相關的疾病或疾病的易感性的方法,包括檢測生物樣品中權利要求1所述多肽或其編碼多核苷酸序列的突變。
12.根據權利要求11的方法,其中所述多核苷酸是DNA或mRNA。
13.一種體外檢測與表皮生長因子樣蛋白異常表達相關的疾病或疾病的易感性的方法,包括檢測生物樣品中權利要求1所述多肽的含量或生物活性。
14.一種藥物組合物,它含有權利要求1所述的多肽或其模擬物、激活劑、拮抗劑或抑制劑或以上各個組分的組合,其還包括藥學上可接受的載體。
15.權利要求1的多肽或權利要求3的多核苷酸在制備用于調節血管平滑肌細胞增殖、恢復或增強神經功能、促進傷口愈合、組織再生、治療眼炎、腎病、肝病、潰瘍和脫發疾病的藥物中的用途。
16.EGFLP的拮抗劑或EGFLP編碼序列的反義多核苷酸在制備用于治療腫瘤、牛皮癬和糖尿病的藥物中的用途。
全文摘要
本發明公開了一種新的分離的表皮生長因子樣蛋白基因的多核苷酸序列及其編碼的多肽,以及制備這種多肽的方法。并且公開了通過檢測該基因核酸水平的突變及多肽水平的改變,檢測與該基因的核酸及其編碼的多肽異常有關的疾病的診斷方法,也公開了利用該基因的多核苷酸序列和多肽治療與該基因異常有關的疾病的用途和用于上述治療的藥物組合物。
文檔編號C07K14/485GK1293250SQ9912313
公開日2001年5月2日 申請日期1999年10月18日 優先權日1999年10月18日
發明者毛裕民, 謝毅 申請人:上海生元基因開發有限公司