專利名稱:人tsc403基因和人ing1l基因的制作方法
技術領域:
本發明涉及用作預防、診斷和治療人類疾病之指標的基因,更具體地涉及新的肺-特異性人基因,該基因與人1amp-1和-2同源[溶酶體膜糖蛋白;Saito,O等,生物化學雜志,267,5700-5711(1992);Sawada,R等,生物化學雜志,268,12675-12681(1993);Sawada,R等,生物化學雜志,269,1425-1431(1994)],并被懷疑是致癌基因。
本發明還涉及類似于大鼠、小鼠、酵母、線蟲、已知的人和其它基因的新的人基因,通過cDNA分析、染色體作圖及其cDNA的功能性分析,本發明的基因可用于基因診斷和新的治療藥物的開發。
另外,本發明涉及由所述基因編碼的新的蛋白質,及其特異性的抗體。
一般認為由基因至其翻譯產物蛋白質的上述流程中的任何異常都會導致在包括細胞增殖和分化的生命維持系統中出現錯誤,從而導致各種疾病。迄今為止所做的基因分析結果表明多種受體(如胰島素,LDL和其它受體)的基因,和與細胞生長和分化相關的代謝酶(如蛋白酶,ATP酶,超氧化物歧化酶等)的基因是開發藥物的有利工具。
然而,對人基因的分析及其功能和與多種疾病之關系的研究仍處于初級階段,很多情況是未知的。因此,對新基因的分析,對該基因的功能及其與疾病的關系的分析探索,利用所分析的基因來確立基因診斷的研究,和有關這些基因的藥物應用都是本領域很感興趣的主題。
同時,胰腺癌是消化系統的惡性腫瘤之一,預后情況最差,在日本和西方國家胰腺癌在與癌癥相關的死亡原因中分別排第四和第五位(Poston,J.G等,Gut.,32,800-812(1991))。癌癥研究最重要的目標是在癌癥發生的早期鑒定基因中的變化。這種變化的鑒定應能開發出早期診斷所用的遺傳工具以及能有效治療該致死性疾病的新的治療形式。
對這些基因生理學作用的解釋和所得信息對闡明致瘤性疾病的起源和發作機制是至關重要的,這不僅在基礎的科學研究領域是需要的,從藥學領域中鑒定和治療惡性腫瘤的觀點出發也是需要的。本發明的公開因此,假定提供了新的人基因,就可以闡明它在多種細胞中的表達水平及其結構和功能,通過分析基因的表達產物,與該基因相關之疾病(如遺傳病和癌癥)的病理學的闡明、診斷和治療也將變得容易。本發明的目的是提供這種新的人基因。
為了達到上述目的,本發明人如下所述作出了深入研究。因此,本發明人首先由提取自多種人組織(如人胎腦,成年血管和胎盤)的mRNA合成cDNA,將其克隆至載體中以構建文庫,在瓊脂培養基上培養被各個文庫轉化的大腸桿菌細胞,隨機挑選轉化子菌落,將其轉移至微滴定板中以制備并記錄含有多個人基因的大腸桿菌克隆。然后培養各個克隆,提取DNA并純化之,將所得cDNA用作模板,通過脫氧終止子法進行鏈終止特異于所述4個堿基的擴增反應,使用DNA自動測序儀測定各個記錄克隆中人基因5'-末端的約400個核苷酸的序列。根據如此所得的人基因核苷酸序列資料,探測出新的家族基因,所述基因類似于已知細菌、酵母、線蟲、鼠、人和其它動物和植物的基因。上述cDNA分析技術詳細描述于Fujiwara等人的報道[Fujiwara,Tsutomu,Saibo Kogaku(細胞工程),14,645-654(1995)]。
結果,本發明人在從人胎腦cDNA文庫中任意挑選的cDNA克隆中發現了攜有新基因的克隆,所述基因編碼與據認為是癌癥-抑制蛋白的p33ING1[GenBank A.C.No.AF001954,Garkavetsev等,Nature,Genet.,14,415-420(1996);Garkavetsev等,分子細胞生物學,17,2014-2019(1997);更新的GenBank A.C.No.AF044076]具有高同源性的氨基酸序列。本發明建立在上述發現的基礎之上。
另外,為了提供工業上需要的信息,尤其是與1amp-1基因和1amp-2基因具有同源性的編碼新蛋白質的基因,本發明人深入研究了多種人組織的基因,成功地分離和鑒定了符合上述目的的新的肺-特異性基因。本發明建立在上述發現的基礎之上。
因此,第一方面,本發明提供了含有編碼SEQ ID NO1之氨基酸序列的核苷酸序列的基因(下文稱之為TSC403基因),尤其是,所述基因為人基因。
另外,本發明提供了由所述TSC403基因編碼的新的蛋白質(下文稱之為TSC403蛋白)以及對所述蛋白質具有結合親和性的抗體。
另外,本發明提供了為下列多核苷酸(a),(b)和(c)中任一個的TSC403基因,尤其是,所述基因為人基因。
(a)含有SEQ ID NO2之核苷酸序列或其互補鏈的多核苷酸;(b)在嚴緊條件下與具有SEQ ID NO2之核苷酸序列的DNA雜交的多核苷酸;和
(c)與編碼含有SEQ ID NO1之氨基酸序列的多肽的多核苷酸具有至少95%同源性的多核苷酸。
本發明還提供了具有SEQ ID NO3之核苷酸序列的TSC403基因。
本發明還提供了具有由SEQ ID NO2之核苷酸序列中的至少15個連續的核苷酸組成的序列的寡核苷酸,和用作用于檢測具有所述寡核苷酸序列的基因的特異性探針或引物的DNA片斷。
另外,本發明還提供了含有編碼SEQ ID NO4之氨基酸序列的核苷酸序列的人基因(下文稱之為人ING1L基因)。
另外,本發明提供了由所述人ING1L基因編碼的蛋白質(下文稱之為人ING1L蛋白)以及能結合所述蛋白質的抗體。
另外,本發明提供了含有下列多核苷酸(a),(b)和(c)中任一個的人ING1L基因。
(a)含有SEQ ID NO5的核苷酸序列的多核苷酸;(b)含有在嚴緊條件下與具有SEQ ID NO5之核苷酸序列的DNA雜交的核苷酸序列的多核苷酸;和(c)與編碼含有SEQ ID NO4之氨基酸序列的多肽的多核苷酸具有至少95%同源性的多核苷酸。
本發明還提供了具有SEQ ID NO6之核苷酸序列的人ING1L基因。
另外,本發明還提供了具有由SEQ ID NO5之核苷酸序列中的至少15個連續的核苷酸組成的序列的寡核苷酸,和用作用于檢測具有所述寡核苷酸序列的基因的特異性探針或引物的DNA片斷。
本說明書中由縮寫表示氨基酸、肽、核苷酸序列、核苷酸等與IUPAC-IUB推薦的規則[有關生物學命名法的IUPAC-IUB通訊,歐洲生物化學雜志,138,9(1984)],“說明書或涉及核苷酸序列和/或氨基酸序列的說明書的撰寫指南”(日本專利局編)和本領域中使用密碼和符號的相關慣例一致。
下面將詳細描述本發明的TSC403基因。
作為本發明之TSC403基因的一個特例,可提及由下文實施例中所述的被稱為“TSC403”的PCR產物的DNA序列推斷出的基因。其核苷酸序列示于SEQ ID NO3。
該基因是編碼新的肺特異性蛋白質的人cDNA,所述蛋白質具有SEQ ID NO1所示的416個氨基酸殘基的序列(下文稱之為“TSC403”蛋白),該cDNA的全長為3198個核苷酸。
本發明的TSC403蛋白作為本發明基因的表達產物出現。使用針對GenBank/EMBL數據庫的FASTA程序[Person,W.R等,美國國家科學院院報(Proc.Natl.Acad.Sci.,USA),85,2444-2448(1988)]進行的同源性檢索揭示出該基因與人lamp-1基因和lamp-2基因同源(參見上述文獻)。
在這一點上,已知所述人的lamp基因在高度轉移的結腸癌細胞系中高水平表達,并且與血管內皮細胞上的E-選擇蛋白結合。因此,懷疑這些基因與癌癥的惡變有關(見上述文獻)。
本發明的TSC403基因也是癌癥相關基因,有望用作癌癥標記物。
另外,本發明基因的染色體基因座是3q27,在多種癌癥中檢測到該染色體基因座的異常。這一事實(僅有該事實足以)清楚說明本發明的基因與多種致瘤性疾病的關系。
另外還發現本發明的TSC403基因在多種癌癥樣本中顯示出高水平表達,這表明該基因可用作預測腫瘤發生和惡性腫瘤的標記物。
因此、本發明的TSC403基因及其基因產物為闡明、了解、診斷、預防和治療多種致瘤性疾病,如結腸癌、子宮癌、卵巢癌、肺癌和胰腺癌等提供了非常重要的資料或工具。另外,可使用本發明的基因開發新藥,該新藥可誘導基因表達以用于治療所述致瘤性疾病。
另外,檢測本發明基因及其產物在個體或給定組織中的表達以及檢測所述基因的突變(缺失或點突變)或表達異常將有利于闡明和診斷所述的多種致瘤性疾病。
下面將詳細描述本發明的ING1L基因。
作為本發明之ING1L基因的一個特例,可提及由下文實施例中所述的被稱為“GEN-146F11”的克隆所包含的DNA序列推斷出的基因。該基因的核苷酸序列示于序列表中,因此,由所述克隆包含的基因具有840個核苷酸長的可讀框(推定的氨基酸翻譯區域;該序列示于SEQ ID NO5),該可讀框編碼序列表中SEQ ID NO4所示的280個氨基酸殘基的序列,該cDNA克隆的全長核苷酸序列由SEQ ID NO6所示的1078個核苷酸組成。
在上述SEQ ID NO6的序列中,起始密碼子位于第92至94位,終止密碼子位于第932至934位。聚腺苷酸化信號樣序列(ATTAAA)位于第1058至1063位。
如上所述,本發明的人ING1L基因與p33ING1L具有高度同源性,可用于在其遺傳信息的基礎上分析人基因并研究所分析基因的多種功能與多種疾病之間的關系,再將所述基因用于與基因相關之疾病的基因診斷和基因治療,并研究基因在藥學領域的用途。因此,由已知同源基因的功能可推測出由本發明的ING1L基因編碼的蛋白質(基因產物)的功能,提供本發明的基因之后,即可通過將候選基因克隆至表達載體中來構建重組蛋白質并研究其酶解活性、結合活性和其它功能。具體地說,由于本發明的基因被懷疑為致癌基因,利用這一功能將有利于藥物如抗癌藥物的開發。
由本發明的人ING1L基因編碼的蛋白質(下文稱之為“人ING1L蛋白”)在其C末端區域具有鋅指基元樣序列,據認為該區域與所述p33ING1L的同源性尤其高。
在這一點上,據報道在幾個得自癌癥的細胞系,包括乳腺癌細胞系中,所述p33ING1L被滅活[文獻同上]。另外,最近還證明所述p33ING1L通過已知為癌癥抑制基因產物的p53對細胞增殖進行負調節[Garkavetsev等,自然,391,295-298(1998)]。另外,在多種致瘤性人組織中,人ING1L基因的表達水平被特異性地提高。從這些發現中看,我們懷疑人ING1L蛋白通過與p53的相互作用來正調節細胞增殖。
另外,在Northern印跡分析中,在受試的所有16個得自人成年器官的組織中都觀察到本發明人ING1L基因的表達,與正常組織相比,在包括結腸癌、食道癌、宮頸癌、胃癌的幾個致瘤性組織中觀察到該基因表達的增強。這些發現表明通過檢查本發明的基因在多種組織中的表達,可將該基因用于診斷致瘤性疾病和與其相關的其它疾病,結果發現,本發明的基因可用于篩選抗有絲分裂的化合物或抗癌化合物。
本發明的基因具體包括含有分別編碼SEQ ID NO1和4之氨基酸序列的SEQ ID NO2和5的核苷酸序列的多核苷酸,在嚴緊條件下與含有SEQ ID NO2和5的核苷酸序列的DNA雜交的多核苷酸,和與編碼SEQ ID NO1和4之氨基酸序列的多核苷酸具有至少95%的同源性的多核苷酸。
因此,本發明的基因包括編碼對應于上述氨基酸序列經過某些修飾后所得的氨基酸序列的基因以及與上述核苷酸序列具有一定程度的同源性的基因。
因此,本發明的基因包括含有編碼由SEQ ID NO1或4的氨基酸序列經缺失、取代或添加一個或多個氨基酸所得的氨基酸序列(即經修飾的氨基酸序列)的核苷酸序列的基因。具有編碼所述經修飾的氨基酸序列的核苷酸序列的基因需滿足的條件僅僅是通過利用它,可檢測到編碼未經修飾的氨基酸序列的本發明基因。
順便說一句,盡管氨基酸序列的修飾(突變等)可以是自發的,例如突變和翻譯后修飾,但也可以進行人工修飾,即,利用天然來源的基因(例如本發明的特定基因)進行修飾。
進行人工修飾的方法包括基因工程技術,如定點誘變[酶學方法,154350,367-382(1987);期刊名同前,100468(1983);核酸研究,129441(1984);Zoku Seikagaku Jikken Koza 1“Idenshi Kenkyuho Ⅱ”[實驗生物化學叢書1“基因研究方法Ⅱ”(日本生物化學學會編),p105(1986)]等,和化學合成技術,如磷酸三酯法和磷酸酰胺酯(phosphoamidate)法[J.Am.Chem.Soc.,894801(1967);期刊名同前,913350(1968);科學,150178(1968);Tetrahedron Lett.,221859(1981);期刊名同前,24245(1983)]以及上述技術的適當組合。
作為本發明基因的一個例子,應提及含有具有SEQ ID NO2或5之核苷酸序列或其互補序列的多核苷酸的基因。該核苷酸序列是上述氨基酸序列(SEQ ID NO1或4)之各個氨基酸殘基的密碼子組合的例子。當然,本發明的基因并不局限于上述組合,還可使用具有通過選擇各個所述氨基酸殘基的密碼子的任意組合而設計的核苷酸序列的基因。可按常規方法選擇所述密碼子。在選擇時,可考慮宿主所用的密碼子頻率[核酸研究,943(1981)]。
另外,盡管本發明的基因以例如SEQ ID NO3或6中所示的單鏈DNA核苷酸序列表示,但本發明的基因包括含有與該核苷酸序列互補的核苷酸序列的多核苷酸和包括這兩種核苷酸序列的多核苷酸,另外,本發明的基因并不局限于DNA,如cDNA。
另外,如上所述,本發明的基因并不局限于含有具有SEQ ID NO2或5之核苷酸序列或其互補序列的多核苷酸的基因,還包括含有與該核苷酸序列具有一定程度的同源性的核苷酸序列的基因。更具體地說,本發明包括的基因含有與編碼具有SEQ ID NO1或4之氨基酸序列的多肽的多核苷酸具有至少95%同源性的多核苷酸。
另外,具有所定同源性的所述核苷酸序列的基因包括在下文所述的嚴緊條件下與具有SEQ ID NO2或5之核苷酸序列的DNA雜交,并且甚至當在給定條件下洗滌所得雜合體時也不會失去所述DNA的基因。
例如,可以提及具有如下序列的基因,即當在65℃,6×SSC中或于37℃,在添加有50%甲醛的4×SSC中,與具有SEQ ID NO2或5之核苷酸序列的DNA雜交過夜,然后于65℃用2×SSC洗滌30分鐘而不會從DNA上脫離的核苷酸序列的基因。在這里,SSC表示標準的鹽水-檸檬酸鹽緩沖液(標準的檸檬酸鹽鹽水溶液;1×SSC=0.15MNaCl,0.015M檸檬酸鈉)。所述基因的優選例子是具有甚至在65℃,7%聚乙二醇(PEG)/10%十二烷基磺酸鈉(SDS)中與具有SEQ ID NO2或5之核苷酸序列的DNA雜交過夜,然后于65℃用0.1×SSC/0.1%SDS洗滌30分鐘而不會從DNA上脫離的核苷酸序列的基因。
根據SEQ ID NO3或6所示特例的序列資料,通過標準的基因工程技術[分子克隆,第2版,冷泉港實驗室出版社(1989);Zoku SeikagakuJikken Koza“Idenshi Kenkyuho Ⅰ,Ⅱ,Ⅲ”[新的實驗生物化學系列“基因研究方法Ⅰ,Ⅱ,Ⅲ”(日本生物化學學會編)(1986)等],易于產生和獲得本發明的基因。
更具體地說,通過使用已知方法[Proc.Natl.Acad.Sci.USA.,786613(1981);科學,222778(1983)等]由含有本發明基因的適當來源構建cDNA文庫,使用適當探針或特異于本發明基因的抗體從該cDNA文庫中選擇出所需克隆即可獲得目的基因。
在上述方法中,cDNA來源包括表達本發明基因的多種細胞或組織以及由其衍生的培養細胞。尤其是,對本發明的TSC403基因而言,可例舉肺組織。按常規方法從某一來源中分離總RNA,分離并純化出mRNA,合成cDNA并進行克隆。cDNA文庫也可以購買。在本發明的實踐中,也可使用購自,例如,Clontech Lab.公司的商購cDNA文庫。
對從cDNA文庫中篩選本發明基因的方法沒有特別的限制,但可選擇性地使用常規方法。具體例如,通過使用針對由cDNA產生的蛋白質的特異性抗體的免疫篩選技術,使用對目的DNA序列具有選擇性結合親和性的探針的噬斑雜交或菌落雜交技術或其組合來選擇cDNA克隆。
至于上述方法中使用的探針,一般可使用根據本發明基因的核苷酸序列資料化學合成的DNA。當然,也可以使用已得到的基因或其片斷作為所述探針。
可用作所述探針的核苷酸序列包括對應于SEQ ID NO2或5的部分核苷酸序列,但該序列由至少15個連續的核苷酸組成,優選為20至30個核苷酸。另外,含有上述各個序列的陽性克隆也可用作所述的探針。
可通過使用一套有義和反義引物作為篩選探針的方法進行所述篩選,所述引物基于自給定細胞系或組織分離和純化出的天然提取物的部分氨基酸序列資料。
另外,通過使用TSC403蛋白或人ING1L蛋白替代所述特異性抗體的蛋白質相互作用克隆方法也可進行所述篩選。
在本發明中,通過使用差異顯示法直接進行比較可研究不同條件下或多種細胞群體之間細胞中的mRNA表達[Liang,P等,科學,257,967-971(1992)]。
使用PCR擴增DNA/RNA也有利于得到本發明的基因[科學,230,1350(1985)]。尤其是在從文庫中難以得到全長cDNA時,使用RACE[快速擴增cDNA末端]法[Jikken Igaku(實驗醫學),12(6)35(1994)],尤其是5'-RACE法[Frohman,M.A等,Proc.Natl.Acad.Sci.,USA.,88998(1988)]是有利的。根據本發明基因的序列資料可明智地確立上述PCR法中所用的引物,而且通過常規方法可合成所述引物。
通過上文提及的常規技術,如凝膠電泳可將被擴增DNA/RNA片斷進行分離和純化。
可以常規方法,如雙脫氧法[Proe.Natl.Acad.Sci.,USA.,745463(1977)],Maxam-Gilbert法[酶學方法,65499(1980)]或更方便地,利用商購的測序試劑盒,測定本發明基因或其任何DNA片斷的核苷酸序列。
使用本發明的基因通過標準的基因工程技術可容易地在高的生產規模上以良好的再現性生產該基因的產物。
本發明還提供了攜有所述TSC403基因或人ING1L基因的載體(表達載體),用所述載體轉化的宿主細胞,和生產TSC403蛋白或人ING1L蛋白的方法,所述方法包括培養所述宿主細胞。
通過標準的重組DNA技術[科學,2241431(1984);生物物理研究通訊,130692(1985);Proc.Natl.Acad.Sci.,USA.,805990(1983)以及上述參考文獻]可進行所述TSC403蛋白或人ING1L蛋白的生產。
至于所述宿主細胞,使用原核細胞和真核細胞都可以。至于原核宿主,常規使用的多種原核細胞,如大腸桿菌和枯草芽孢桿菌都可以使用。優選的宿主細胞是衍生自大腸桿菌的細胞,尤其是大腸桿菌K12細胞。
真核宿主細胞包括脊椎動物和酵母細胞等。對于前一種細胞,例如有猴細胞系COS[細胞,23175(1981)],中國倉鼠卵巢細胞及其二氫葉酸還原酶-缺損的細胞系[Proc.Natl.Acad.Sci.,USA.,774216(1980)]。對于后一種細胞,例如可提及糖酵母屬的酵母細胞,但上述細胞不是排它性的選擇。
當原核細胞被用作宿主細胞時,選擇在宿主細胞中能被復制的載體,為了表達基因,可有利地使用表達質粒,該質粒含有位于本發明基因上游的啟動子和SD(Shine-Dalgarno)序列以及起始蛋白質合成所必需的起始密碼子(如ATG)。關于上述載體,通常使用衍生自大腸桿菌的質粒,如pBR322,pBR325,pUC12,pUC13等,但這些不是唯一的選擇,也可使用多種已知的其它載體。例如可提及的有大腸桿菌表達系統所用的商購載體pGEX-4T(Amersham Pharmacia Biotech),pMAL-c2,pMAL-p2(New England Biolabs),pET21,pET21/lacq(Invitrogen),pBAD/His(Invitrogen)等。
至于脊椎動物細胞所用的表達載體,其通常具有位于需表達之基因上游的啟動子區域,RNA剪接位點,聚腺苷酸化位點,轉錄終端序列等,必要時,所述載體還含有復制起點。上述載體的具體例子是含有SV40早期啟動子的pSV2dhfr[分子細胞生物學,1854(1981)]。
除此之外,還可使用多種其它已知的商購載體。利用動物細胞的表達系統所用的商購載體例如可是用于動物細胞的多種載體,如pEGFP-N,pEGFP-C(Clontech),pIND(Invitrogen),pcDNA3.1/His(Invitrogen)等,和可用于昆蟲細胞的載體,如pFastBacHT(GibcoBRL),pAcGHLT(PharMingen),pAc5/V5-His,pMT/V5-His和pMT/Bip/V5-His(都購自Invitrogen)。
當酵母細胞用作宿主細胞時,可使用的表達載體的特例為具有酸性磷酸酶基因啟動子的pAM82[Proc.Natl.Acad.Sci.,USA.,801(1983)]。酵母細胞所用的商購表達載體包括pPICZ(Invitrogen)和pPICZα(Invitrogen)。
對啟動子沒有什么特別的限制。當將腸埃希氏菌屬的細菌菌株用作宿主時,可使用色氨酸(trp)啟動子,1pp啟動子,lac啟動子,recA啟動子,PL/PR啟動子等。當宿主是芽孢桿菌屬微生物時,優選使用SP01啟動子,SP02啟動子,penP啟動子等。當將酵母用作宿主時,優選使用的啟動子包括pH05啟動子,PGK啟動子,GAP啟動子和ADH啟動子等。當將動物細胞用作所述宿主細胞時,優選的啟動子包括衍生自SV40的啟動子,逆轉錄病毒啟動子,金屬硫蛋白啟動子,熱激啟動子,巨細胞病毒啟動子和SR啟動子等。
至于本發明基因的表達載體,也可有利地使用常規的融合蛋白表達載體。這種類型的載體的例子為表達具有谷胱甘肽-S-轉移酶(GST)的融合蛋白的pGEX(Promega)。
對將所述目的重組DNA(表達載體)導入宿主細胞的方法(轉化方法)沒有特別的限制,但可以使用多種標準化的方法。可按常規方法培養所得的轉化子。通過培養,由本發明基因編碼的目的蛋白可在轉化細胞中表達、產生和積累,或分泌到細胞外或細胞膜上。
根據所用的宿主細胞類型,可從常規培養基中明智地選擇出培養所用的培養基,也可在適于宿主細胞增殖的條件下進行培養。
可任選通過利用其物理、化學和其它特性的多種分離方法分離和純化所產生的重組蛋白質[Seikagaku(生物化學)資料第Ⅱ冊,p1175-1259,第1版,第1次印刷,1980年6月23日,Tokyo Kagaku Dojin;生物化學,25(25)8274(1986);歐洲生物化學雜志,163313(1987)等]。上述方法具體包括標準的重建處理,用蛋白質沉淀劑處理(鹽析),離心,滲透休克法,超聲破碎,超濾,各種類型的層析,如分子篩層析(凝膠過濾)、吸附層析、離子交換層析、親和層析、高效液相層析(HPLC)等,透析及其組合。特別優選的方法是親和層析,該層析所用的柱上結合有針對本發明的TSC403蛋白或人ING1L蛋白的特異性抗體。
本發明還提供了可按上述方法和生產這些蛋白質的技術得到的新的TSC403蛋白或人ING1L蛋白。如上所述,本發明的蛋白質可用于藥物領域。
另外,本發明的蛋白質可用作構建抗所述蛋白質的特異性抗體的免疫原。此時用作抗原的成分可以是通過任一種所述基因工程技術大量生產的蛋白質或其片斷,通過使用該抗原可得到所需的抗血清(多克隆抗體)和單克隆抗體。
抗體的生產技術是本領域技術人員眾所周知的,也可根據已確立的技術[Zoku Seikagaku Koza“Men-eki Seikagaku Kenkyuho”(新的免疫生化叢書,“免疫生物化學方法”),日本生物化學學會編(1986)等]生產與本發明相關的抗體。
例如,可從普通動物,如兔、豚鼠、大鼠、小鼠、雞、山羊和綿羊中任意選擇免疫動物以用于收集抗血清,可按常規方法用所述抗原進行免疫并采集血液。
也可按常規方法制備所述單克隆抗體,即構建被所述免疫原免疫之動物的漿細胞與漿細胞瘤細胞的融合細胞,選擇產生目的抗體的克隆并培養該克隆。選擇免疫動物一般會考慮它與細胞融合所用的漿細胞瘤細胞的相容性,通常優選使用小鼠或大鼠。可按與制備所述抗血清相同的方法進行免疫,任選聯合使用普通的佐劑與抗原。
對用于所述融合的漿細胞瘤細胞沒有特別的限制,它可以是下列多種大鼠骨髓瘤細胞及其衍生細胞中的任一種如p3(p3/x63-Ag8)[自然,256495-497(1975)],p3-U1[微生物學和免疫學最新專題,811-7(1978)],NS-1[歐洲免疫學雜志,6511-519(1976)],MPC-11[細胞,8405-415(1976)],SP2/0[自然,276269-271(1978)]等,R210[自然,277131-133(1979)]等。
可根據已知方法,在常規融合促進劑,如聚乙二醇(PEG)、仙臺病毒(HVJ)等的存在下實現所述免疫細胞和漿細胞瘤細胞之間的融合。可通過已知方法分離所需的雜交瘤[酶學方法,733(1981);Zoku實驗生物化學叢書;等]。
產生目的抗體之細胞系的篩選和單克隆抗體的制備也可按常規方法進行。例如,通過一般用于檢測抗體的多種技術可找出產生抗體的細胞系,所述技術例如有使用本發明的蛋白質作為抗原的ELISA[酶學方法,70419-439(1980)],噬斑法,點法,凝集反應法,Ouchterlony法,放射性免疫測定法等。
從如上所得雜交瘤中分離本發明抗體的方法包括按常規方法培養雜交瘤,以培養物上清液的形式回收抗體的方法,或給相容的哺乳動物施用雜交瘤,使其在體內增殖并以腹水的形式回收抗體的方法。前一種方法適于制備高度純化的抗體,而后一種方法適于大量生產抗體。通過常規方法,如鹽析、凝膠過濾、親和層析等可純化按上述方法生產的抗體。
所得抗體的特征在于能與本發明的蛋白質結合。使用這一特征可將本發明的蛋白質純化,并通過免疫學技術檢測并鑒定蛋白質。本發明還提供了這種新抗體。
根據本發明生產的本發明基因的序列資料,通過使用所述基因的部分或全部核苷酸序列可檢測本發明的基因在個體或多種組織中的表達。
在本發明中,為了檢測其表達水平在癌組織中有所升高的TSC403基因或人ING1L基因的存在,可制備生物樣品,如血液或血清樣品,任選地提取DNA并進行分析以觀察所述樣品是否含有可疑的TSC403基因或人ING1L基因。
根據本發明,為了檢測細胞或組織中、惡性腫瘤至前驅癥狀紊亂的發展過程中或預后惡性腫瘤標記物的存在,制備惡性腫瘤的生物樣品,分析TSC403或人ING1L致癌基因的存在。利用該技術,可檢測細胞或組織中、惡性腫瘤至前驅癥狀紊亂的發展過程中或預后是否存在這種惡性腫瘤標記物。因此,本發明能診斷癌癥,評價癌癥療法的效果或預測癌癥的預后情況。
可按下述進行檢測例如,根據使用腫瘤患者之樣品得到的TSC403基因或人ING1L基因的資料,首先制備被設計用來篩選TSC403基因或人ING1L基因和/或擴增該基因的DNA片斷。上述DNA片斷包括(1)具有噬斑雜交、菌落雜交、Southern印跡、Northern印跡等所用探針之特性的片斷。
(2)具有通過PCR(用聚合酶擴增核苷酸序列的聚合酶鏈反應)擴增制備TSC403基因或人ING1L基因之全部或部分DNA片斷所用探針之特性的片斷。
為了構建所述DNA片斷,首先制備與TSC403基因或人ING1L基因具有相同序列的引物。使用該引物作為篩選探針,讓它與生物樣品(核酸樣品)反應以證實具有TSC403基因序列或人ING1L基因序列之基因的存在。
通過易于檢測靶序列的多種方法,如變性、限制性消化、電泳或點印跡可制備上述核酸樣品。
從敏感性的角度出發,所述篩選方法優選為PCR。該方法并不特別地局限于使用TSC403基因片斷或人ING1L基因片斷作為引物,它可以是任何已知方法[科學,2301350-1354(1985)]和新近開發的或有望在將來使用的所有PCR形式[Sakaki,Y等(編),Jikken Egaku(實驗醫學),增刊8(9)(1990),Yodosha;蛋白質·核酸·酶;增刊,Kyoritsu出版公司,35(17)(1990)]。
用作引物的DNA片斷是化學合成的寡聚-DNA。使用DNA自動合成儀,如Pharmacia LKB Gene Assembler Plus(Pharmacia)可合成寡聚-DNA。引物(有義引物或反義引物)的長度可以是例如等于約10-50個核苷酸,更優選約15-30個核苷酸。
用于上述篩選的探針通常是經標記的探針,但也可以是未經標記的探針。篩選有可能取決于與直接或間接標記的配體的特異性結合。標記探針或配體的方法是本領域已知的,相關的現有技術包括切口平移,隨機引發和激酶處理等。可用作標記物的物質包括經由已知方法可以采用的放射性同位素、生物素、熒光基團、化學發光基團、酶和抗體。
上述檢測可按常規方法進行,例如,總可以成功地使用通過RT-PCR[逆轉錄-聚合酶鏈反應;E.S.Kawasaki等,RNA的擴增,PCR方法,方法和應用指南,Academic出版社,SanDiego,21-27(1991)]進行的RNA擴增,Northern印跡分析[分子克隆,冷泉港實驗室(1989)],在細胞水平上進行檢測,如原位RT-PCR[核酸研究,213159-3166(1993)]和原位雜交,NASBA法[基于核酸序列的擴增,自然,35091-92(1991)],這些本領域已知技術的改良方法和各種其它方法。
利用檢測試劑盒檢測樣品中的TSC403基因或人ING1L基因可方便地實施本發明的檢測方法。本發明還提供了檢測TSC403基因或人ING1L基因的檢測試劑盒,其含有所述TSC403基因片斷或人ING1L基因片斷。
重要的是該檢測試劑盒至少含有與SEQ ID NO2或5之部分或全部核苷酸序列或其互補核苷酸序列雜交的DNA片斷作為必需成分。至于其它成分,該試劑盒可含有標記試劑和進行PCR必需的試劑,如Taq DNA聚合酶,脫氧核苷酸三磷酸和引物等。
上述標記試劑包括放射性同位素和化學修飾劑,如熒光物質。與DNA片斷預綴合時可使用這些標記物。
為了便于檢測,本發明的檢測試劑盒可含有適當的反應稀釋劑、標準的抗體、緩沖液、洗滌緩沖液、反應終止溶液等。
本發明還提供了利用上述檢測方法診斷癌癥的方法、該診斷方法所用的診斷試劑和診斷試劑盒。
通過常規方法,直接或間接測定經使用本發明的上述檢測方法所得受試樣品中TSC403基因或人ING1L基因的序列,可以發現新的TSC403或人ING1L-相關基因(突變基因),所述基因與野生型TSC403基因或野生型人ING1L基因高度同源。因此,本發明還提供了篩選受試樣品中TSC403相關基因或人ING1L相關基因的方法,所述方法包括進行所述檢測和測定樣品中TSC403基因或人ING1L基因的序列。
另外,通過利用由SEQ ID NO1或4之TSC403基因或人ING1L基因編碼的蛋白質、具有由SEQ ID NO1或4所述序列缺失、取代或添加一個或多個氨基酸所得的氨基酸序列的蛋白質、或針對該片斷的抗體(多克隆抗體或單克隆抗體;下文稱之為“TSC403抗體”或“人ING1L抗體”),可成功地檢測所述野生型TSC403基因、野生型人ING1L基因、突變的TSC403基因和突變的人ING1L基因。
本發明還提供了檢測野生型TSC403基因、野生型人ING1L基因、突變的TSC403基因和突變的人ING1L基因的方法。
根據該檢測方法學,可由野生型TSC403基因或野生型人ING1L基因中的變化檢測致瘤狀態紊亂的嚴重性或腫瘤的惡變。通過用上述任何常規的測序技術測定TSC403基因或人ING1L基因的序列,更優選通過使用所述TSC403抗體或人ING1L抗體的檢測方法測定或檢測上述變化。通過此方法可檢測受試樣品中TSC403蛋白或人ING1L蛋白異常(突變)的存在或TSC403蛋白或人ING1L蛋白的存在與否。
在利用抗TSC403抗體或抗人ING1L抗體的本發明檢測方法中,可使用所述抗體來免疫沉淀含有受試人之生物材料(如血液或血清)的溶液中的TSC403蛋白或人ING1L蛋白,或在聚丙烯酰胺凝膠Western印跡或免疫印跡上使抗體與TSC403蛋白或人ING1L蛋白發生反應。
另外,通過在免疫組化檢測方法中使用抗TSC403抗體或抗人ING1L抗體,可檢測石蠟切片或冷凍組織樣品中的TSC403蛋白或人ING1L蛋白。所述抗TSC403抗體或抗人ING1L抗體的生產技術和純化方法是本領域眾所周知的。可利用這些已知技術生產和純化所述抗體。
與檢測野生型TSC403或人ING1L或其突變體相關的優選方法包括使用單克隆抗體和/或多克隆抗體的夾心檢測法。其它優選的檢測技術是酶聯免疫吸附法(ELISA)、放射性免疫測定法(RIA)、免疫放射分析(IRMA)和免疫酶學分析(IEMA)。
本發明還提供了TSC403蛋白受體或人ING1L蛋白受體,所述受體存在于細胞膜組分中或細胞表面并具有與TSC403蛋白或人ING1L蛋白結合的活性。通過例如在含有受體的細胞膜組分或含有受體的生物樣品中加入經標記的TSC403蛋白或人ING1L蛋白,再經提取,分離和純化所得的受體-蛋白質結合物(TSC403蛋白質-結合反應產物或人ING1L蛋白質-結合反應產物)并鑒定所分離產物的氨基酸序列,即可生產和得到該TSC403蛋白受體或人ING1L蛋白受體。根據已知方法,本領域技術人員易于制備并對TSC403蛋白或人ING1L蛋白受體測序。
可使用本發明的TSC403蛋白受體或人ING1L蛋白受體或其片斷來篩選多種藥物。通過這種技術,可篩選出能與所述受體反應的化合物(低分子化合物,高分子化合物,蛋白質,蛋白質片斷,抗原,抗體等)。用于進行這類篩選的受體或其片斷可以以固定在適當固體基質上的固定化形式被使用或以溶液中的游離物質的形式被轉運至細胞表面。
上述藥物篩選的例子是在競爭結合試驗中優選使用被表達TSC403蛋白或人ING1L蛋白或其片斷的重組載體穩定轉化的原核或真核宿主細胞的篩選。或者,在標準的結合試驗中使用游離形式的或固定化的所述宿主細胞。更具體地說,上述藥物篩選法包括在候選藥物的存在下,將TSC403蛋白受體或人ING1L蛋白受體或其片斷與TSC403蛋白或人ING1L蛋白或其片斷反應以形成復合物,并檢測上述候選藥物對復合物形成的抑制程度。
因此,本發明提供了藥物篩選的方法,所述方法包括將候選藥物與TSC403蛋白受體或人ING1L蛋白受體或其片斷接觸,通過已知技術檢測所得復合物的存在或TSC403蛋白受體或人ING1L蛋白受體或其片斷與配體形成的復合物的存在。
另外,通過檢測TSC403蛋白受體的活性或人ING1L蛋白受體的活性,可以評價候選藥物是否能拮抗TSC403蛋白受體或人ING1L蛋白受體,從而能抑制TSC403蛋白活性或人ING1L蛋白活性,如促進有絲分裂的活性。
在這種競爭性結合試驗中,TSC403蛋白受體或人ING1L蛋白受體或其片斷是被標記了的。當游離的TSC403蛋白受體或人ING1L蛋白受體或其片斷與相應的復合物分開時,測定游離(未形成復合物)物質的標記量,測定值被當成衡量候選藥物與TSC403蛋白受體或人ING1L蛋白受體結合的尺碼。另外,測定值還可用于衡量對TSC403蛋白受體或人ING1L蛋白受體與TSC403蛋白或人ING1L蛋白結合的抑制作用。通過按這種方式分析TSC403蛋白或人ING1L蛋白的小肽(假肽),可將候選藥物作為具有TSC403蛋白受體拮抗活性或人ING1L蛋白受體拮抗活性的物質進行測定。
本發明的另一種藥物篩選方法是篩選與TSC403蛋白受體或人ING1L蛋白受體具有足夠結合親和性的化合物。簡單地說,該方法包括在固體支持物(如塑料別針或其它材料的表面)上合成大量不同的受試肽化合物,將所得受試化合物與TSC403蛋白受體或人ING1L蛋白受體反應,洗滌后,再通過已知方法對結合反應產物進行檢測[如PCT專利公開號WO 84-03564]。
可將純化的TSC403蛋白受體或人ING1L蛋白受體直接涂敷于板上以用于所述的藥物篩選法。另外,抗體可被針對多肽的非中和性的抗體捕獲,并可將TSC403蛋白受體或人ING1L蛋白受體固定于固相上。
本發明還涉及使用競爭性藥物篩選試驗。為了結合TSC403蛋白受體或人ING1L蛋白受體或其片斷,使能特異性結合TSC403蛋白受體或人ING1L蛋白受體的中和性抗體與候選化合物競爭。通過與中和性抗體的競爭反應,可檢測到任何具有TSC403蛋白受體或人ING1L蛋白受體的一個或多個抗原決定簇的肽的存在。
另外,另一種藥物篩選的方法包括使用含有非功能性TSC403基因或非功能性人ING1L基因的真核宿主細胞系或細胞。在候選藥物的存在下使宿主細胞系或細胞增殖預定的一段時間,測定宿主細胞的生長速度以觀察例如候選藥物是否能抑制細胞生長。測定生長速度的方法包括檢測TSC403蛋白受體或人ING1L蛋白受體之生物活性的方法。
另外,根據本發明,為了研制更具活性或更穩定的TSC403蛋白或人ING1L蛋白衍生物或能在體內增強或干擾TSC403蛋白或人ING1L蛋白之功能的藥物,可以構建生物活性蛋白質或所述蛋白可與之相互作用的其結構類似物,例如TSC403蛋白受體或人ING1L蛋白受體激動劑,TSC403蛋白受體或人ING1L蛋白受體拮抗劑或TSC403蛋白或人ING1L蛋白抑制劑。通過用X-射線晶體學或計算機模型設計或聯合使用此類技術來分析TSC403蛋白或人ING1L蛋白與第三組蛋白質之間所形成復合物的三維結構,即可鑒定上述結構類似物。通過根據同源蛋白質之結構的蛋白質模型設計也可得到這種結構類似物的結構資料。
至于提供更具活性或更穩定的TSC403蛋白衍生物或人ING1L蛋白衍生物的方法,可提及丙氨酸掃描技術。該技術包括用丙氨酸殘基取代所述蛋白質的某些氨基酸殘基并測定所述取代對所得蛋白質之活性的影響。換句話說,該技術通過取代蛋白質的氨基酸殘基并進行分析,從而測定對蛋白質活性或穩定性有重要作用的功能域。該技術可設計出更具活性或更穩定的TSC403蛋白衍生物或人ING1L蛋白衍生物。
另外,目前已可以分離出通過功能性試驗選出的靶特異性抗體并能分析其晶體結構。一般說來,通過此方法可得到藥物核心,從而為今后的藥物設計工作提供基礎。通過產生功能性藥物活性抗體的抗獨特型抗體,可從化學或生物法構建的肽庫中鑒定或分離肽,因此,所選定的肽也有望用作藥物核心。
因此,可以設計并研制具有TSC403蛋白或人ING1L蛋白的抑制劑、激動劑或拮抗劑活性的藥物,所述TSC403蛋白或人ING1L蛋白具有改進的活性、穩定性和其它特性。
通過使用克隆的TSC403基因或克隆的人ING1L基因,也可以制備足夠量的TSC403蛋白或人ING1L蛋白并進行X-射線晶體學和其它分析研究。另外,由于提供了根據本發明的SEQ ID NO1或4的TSC403蛋白或人ING1L蛋白,可以提供計算機模型設計程序或技術以替代X-射線晶體學或做為附助技術與其聯合使用。
本發明能構建攜有TSC403基因的剔除試驗小鼠(突變體小鼠)或攜有人ING1L基因的剔除試驗小鼠(突變體小鼠)。通過這一方法,可以確定TSC403基因或人ING1L基因之核苷酸序列的哪個區域會影響TSC403蛋白或人ING1L蛋白的體內趨異活性,也就是說,能夠確定TSC403基因產物、人ING1L基因產物、經修飾的TSC403基因產物或經修飾的人ING1L基因產物在體內具有什么功能。
這是通過利用基因的同源重組有意地修飾生物體的遺傳信息的技術,而且使用小鼠胚干細胞(ES細胞)的方法是已知的[Capeccchi.M.R.,科學,244,1288-1292(1989)]。
上述突變體小鼠的構建屬于本領域技術人員的專長,可對本發明的野生型TSC403基因、野生型人ING1L基因、突變的TSC403基因或突變的人ING1L基因進行這種修飾[Tetsuo Noda(編)Jikken Igaku(實驗醫學),增刊,14(20)(1996),Yodosha],從而方便地構建各個突變體小鼠。通過利用此項技術,可以設計和研制出對蛋白質具有TSC403蛋白或人ING1L蛋白的抑制劑、激動劑或拮抗劑活性的藥物,所述蛋白質具有改良的TSC403蛋白或人ING1L蛋白活性和穩定性。
因此,本發明還提供了檢測本發明的TSC403基因或人ING1L基因所用的特異性引物,和/或用作特異性引物的DNA片斷,利用所述引物診斷癌癥的方法和診斷試劑盒。
例如,通過使用兩種特異于本發明的TSC403基因的引物(有義引物和反義引物)進行標準的PCR技術即可產生和獲得本發明的TSC403基因探針。用如此構建的探針可檢測到本發明的基因在多種致瘤性組織和其它組織中的表達。
圖2是顯示根據實施例1-(4),多種正常組織和癌組織的RT-PCR分析結果的圖。
圖3是顯示根據實施例1-(5),經Northern印跡分析觀察到的TSC403基因在人組織中表達的圖。
圖4是顯示根據實施例1-(5),經Northern印跡分析觀察到的TSC403基因在人組織中表達的圖。
圖5是顯示根據實施例1-(5),經Northern印跡分析觀察到的TSC403基因在人組織中表達的圖。
圖6顯示的是根據實施例1-(6)的病灶形成試驗中的對照細胞。
圖7顯示的是在根據實施例1-(6)的病灶形成試驗中,被本發明的TSC403基因轉化的轉化細胞。
圖8顯示出由本發明的人ING1L基因編碼的蛋白質的推測氨基酸序列與p33ING1[GenBank A.C.No.AF044076]所編碼序列之間的同源性研究結果。
圖9顯示了根據實施例2-(2)對得自成年人16個器官的細胞的Northern印跡分析結果。
圖10顯示了根據實施例2-(2)對結腸癌患者組織的Northern印跡分析結果。
因此,在8微升經焦碳酸二乙酯處理的水中將分離自13種人組織(成年腦,胎腦,肺,肝臟,胃,胰腺,脾臟,乳腺,前列腺,胎盤,睪丸,腎臟和心臟;Clontech)的poly A RNA(0.2微克)與25pmol 3'-錨著的寡-dT引物G(T)15MA(M表示G,A和C的混合物)混合,于65℃將混合物加熱5分鐘。向此溶液中加入4微升5×第一鏈緩沖液(BRL),2微升0.1M DTT(BRL),1微升250mM dNTP(BRL),1微升RNA酶抑制劑(40單位;Toyobo)和1微升Superscript Ⅱ逆轉錄酶(200單位;BRL)。各反應混合物的終體積為20微升。將各溶液于37℃保溫1小時,加入30微升蒸餾水稀釋2.5倍,將稀釋液儲存于-20℃待用。
在[γ-33P]ATP標記的(Pharmacia)3'-錨著引物的存在下經PCR擴增cDNA,如下進行該cDNA的PCR擴增。
20微升PCR混合物含有2微升RT反應混合物,2微升10×PCR緩沖液(Takara),4微升2.5mM dNTP,0.25微升ExTaq DNA聚合酶(5U/ml;Takara),25pmol被[α-33P]ATP標記的3'-錨著的寡-dT引物和25pmol 5'-引物(No.20,10-聚體脫氧寡核苷酸引物,其具有SEQ ID NO7所示序列的隨機化序列)。在下列條件下進行PCR95℃ 3分鐘,40℃ 5分鐘和72℃ 5分鐘,1個循環;95℃ 0.5分鐘,40℃ 2分鐘和72℃ 1分鐘,40個循環;72℃退火5分鐘。
用乙醇提取PCR樣品,將樣品重新懸浮于甲酰胺-測序染料中,在6%丙烯酰胺-7.5M尿素測序凝膠中反應。無需固定,干燥凝膠,并進行放射自顯影過夜。
(1-2)經擴增的cDNA片斷的亞克隆用放射性的墨汁標記其上預先放置有上述干燥凝膠的3MM濾紙,放射自顯影圖可記錄標記情況。將含有目的cDNA帶的凝膠連同3MM濾紙一起切下,在300微升dH2O中攪拌1小時。除去聚丙烯酰胺凝膠和濾紙之后,在1微升10mg/ml糖原和作為載體的0.3M NaOAc的存在下通過乙醇沉淀回收cDNA,并重新溶解于10微升dH2O中。使用5微升該溶液重新進行擴增。PCR條件及所用引物與第一輪PCR中的相同。按與第一輪PCR產物相同的方法回收適當大小的再擴增產物,將此PCR產物克隆至pUC118載體(Takara)的HincⅡ位點,使用ABI377自動測序儀(Applied BioSystems)測定核酸序列。
通過比較用分離自13種人組織的mRNA所得的各種顯像模式,可鑒定出一個在肺中特異性表達的PCR產物。該產物被稱為TSC403DD。
該產物由252個核苷酸組成。使用FASTA程序[Person,W.R等,Proc.Natl.Acad.Sci.USA,85,2444-2448(1988)]將該核苷酸數據與GenBank/EMBL數據庫中的DNA序列進行比較,結果表明該PCR產物與任何已知的DNA序列都沒有同源性。
(1-3)cDNA篩選使用寡(dT)+由隨機六聚體引發的人正常肺cDNA和Uni-ZAPTMXR(Stratagene)構建人正常肺cDNA文庫。通過上述方法總共分離出1×106個克隆,使用[α-32P]-dCTP-標記的cDNA片斷進行篩選。選擇陽性克隆,在pBluescriptⅡ SK(-)中,cDNA的克隆位點被體內切除。
結果,針對上述TSC403DD鑒定出約100個噬斑。根據這一結果,總RNA群體的轉錄量被計算為約0.01%。
與TSC403DD同源的該被裝配的cDNA序列(TSC403)含有3198個核苷酸,其中包括1248個核苷酸的可讀框,其編碼416個氨基酸殘基的蛋白質,該蛋白質的計算分子量為44316道爾頓。
由一級序列可看出該基因產物(TSC403蛋白)為含有跨膜區的蛋白質。
發現其染色體基因座為3q27,在多種癌癥中可發現該基因座的染色體異常。
另外,本發明的TSC403基因與人1amp-1和1amp-2具有約30%的同源性。
(2)在組織中的表達為了描述TSC403在組織中的表達模式圖,使用多種人組織進行Northern印跡分析。
在Northern印跡分析中,使用了人MTN(多-組織Northern)印跡Ⅰ和Ⅱ(Clontech)。使用一套T3和T7啟動子序列的引物來制備cDNA片斷,并通過PCR用[α-32P]-dCTP進行標記。對含有擴增產物的膜進行預雜交(在產品上說明的條件下)并根據產品說明進行雜交。
雜交后,洗滌膜,在-80℃將其放射自顯影達24小時。結果示于圖1。
所用的和圖中示出的人組織是心臟、腦、胎盤、肺、肝臟、骨骼肌、腎臟、胰腺、脾臟、胸腺、前列腺、睪丸、卵巢、小腸、結腸和外周血白細胞(P.B.L.)。
從圖中可以看出,在肺中特異性地檢測到了與TSC403同源的轉錄物。
(3)FISH通過已知方法[Takahashi E等,人類遺傳學,86,14-16(1990)],使用0.5微克各種粘粒DNA作為探針進行用于染色體作圖的FISH。通過Provia 100膠片(Fuji;ISO 100)或CCD照相系統(Applied Imaging,Cyto Vision)獲得FISH。
結果,用處于典型的R-帶(前)中期相的細胞獲得的100個信號被定位于3q27帶。因此,將TSC403的染色體基因座鑒定為3q27。
(4)通過RT-PCR分析在癌癥細胞系和癌癥組織中的表達為了研究TSC403基因的表達在人癌癥細胞系和癌癥組織中是否會突變,對4個細胞系[Aspc1(轉移性腺瘤,國立癌癥研究雜志,67,563-569(1981)),Bxpc3(腺瘤,未分化的;癌癥研究.,4,15-23(1986)),MiaPaca2(腺瘤,國際癌癥雜志,19,128-135(1977))和PANC1(上皮樣的,胰管瘤,國際癌癥雜志,15,741-747(1975))]和9個癌癥組織(由東京大學醫學科學研究所的Nakamura博士惠贈)進行RT-PCR分析。
因此,用10個單位不含RNA酶的DNA酶Ⅰ(Boehringer Mannheim)將10微升通過使用ISOGEN(Wako Chemical Ind.)從各個細胞系或癌癥組織中分離出的總RNA處理15分鐘,用苯酚-氯仿提取2次,并用乙醇沉淀。使用寡-(dT)和隨機引物,通過Superscript ⅠTMRNA酶H-逆轉錄酶(Life Technology)合成單鏈cDNA。對每一產物各取2微升用于PCR擴增。
將具有SEQ ID NO8和SEQ ID No9所示核苷酸序列的引物P1和P2用于25輪循環的PCR擴增。
在20微升溶液中進行PCR,所述溶液含有25ng DNA,各為10μM的引物,2.5mM dNTP和0.25U Extaq DNA聚合酶(Takara)。將PCR產物溶解于經溴化乙錠染色的1.5%瓊脂糖凝膠中。
通過上述方法對4種細胞系(泳道1=AsPc-1,泳道2=BxPc-3,泳道3=MIApaca,泳道4=PANC-1),正常的胰腺組織(正常胰腺,泳道1和2),胰腺癌組織(胰腺癌,泳道1-11)和正常的肺組織(正常肺)進行RT-PCR分析所得的結果示于圖2。
從圖2可以清楚地看出在正常胰腺組織(正常胰腺,泳道1和2)中未發現TSC403的表達,而只在胰腺癌組織(胰腺癌,泳道1-11)和細胞系(泳道1-4)中觀察到表達。
順便說一句,上述4種細胞系已保藏于ATCC,其保藏號如下Aspc-1;CRL-1682BxPc-3;CRL-1687MIApaca;CRL-1420PANC-1;CRL-1469(5)TSC403基因在多種癌癥中的表達(Northern印跡分析)通過將TSC403基因與攜有下列各種癌組織和正常組織mRNA樣品(腫瘤Northern印跡分析)的印跡(Invitrogen)雜交,以研究TSC403基因的表達。所有癌癥組織和正常組織都購自Invitrogen。
結果示于圖3、圖4和圖5。各圖中示出的癌癥組織和正常組織如下。
圖3腦瘤、正常腦、腎臟腫瘤、正常腎臟、肝癌、正常肝臟、肺癌、正常肺、乳腺癌、正常乳腺、子宮癌、正常子宮、輸卵管腫瘤、正常輸卵管、卵巢癌、正常卵巢。
圖4食道癌、正常食道、胃癌、正常胃、結腸癌、正常結腸、直腸癌、正常直腸、甲狀腺癌、正常甲狀腺、腎上腺癌、正常腎上腺、腮腺癌、正常腮腺、淋巴瘤、正常淋巴結。
圖5腎臟腫瘤、正常腎臟、輸尿管腫瘤、正常輸尿管、膀胱癌、正常膀胱、胃癌、正常胃、卵巢癌(4例)、正常卵巢(4例)。
由上圖可以看出TSC403在正常肺中顯著表達。另外,在乳腺癌(圖3),輸卵管腫瘤(圖3),食道癌(圖4),結腸癌(圖4),直腸癌(圖4),甲狀腺癌(圖4),腮腺癌(圖4),輸尿管腫瘤(圖5),卵巢癌(圖5,4例中的2例)中觀察到TSC403基因的表達。
(6)通過表達TSC403基因的病灶形成試驗將TSC403基因的全長可讀框連接至pCDNA3.1/His(Invitrogen)載體的BamHⅠ-XhoⅠ位點,得到TSC403基因的表達載體。
然后,使用上述表達載體,根據文獻中所述的方法[Shin,C.,Shilo,B.,Goldfarb,M.P等,Proc.Natl.Acad.Sci.USA.,76,5714-5718(1979)],用NIH3T3細胞進行病灶形成試驗,以觀察TSC403基因對細胞是否有致瘤影響。
結果示于圖6(未被TSC403基因轉化的對照細胞)和圖7(被TSC403基因轉化的細胞)。
比較這兩個圖可清楚地看出當通過導入基因而在細胞中強迫表達TSC403基因時,如圖7顯示有一明確的病灶形成。因此,很顯然,當TSC403基因不得不過量表達時,會喪失對接觸抑制現象(細胞惡性轉化現象之一)的敏感性,因此,TSC403基因與細胞的致瘤性有密切的關系。
因此,提取自人胎腦的mRNA購自Clontech并被用作起始物質。由該mRNA合成cDNA并克隆至載體λZAPⅡ(Stratagene)中以構建cDNA文庫(Otsuka GEN Research Institute,Otsuka Pharmaceutical)。通過體內切除法[Short,J.M等,核酸研究,16,7583-7600(1988)],使攜有人基因的大腸桿菌菌落在瓊脂培養基上形成,隨機挑選菌落,將攜有上述人基因的大腸桿菌克隆標注于96孔微滴定板中,于-80℃儲存該被標注的克隆。
在1.5ml LB培養基中將每個被標注的克隆培養24小時,使用質粒自動提取儀PI-100(Kurabo)提取DNA并純化。通過用RNA酶處理將污染的大腸桿菌RNA分解并除去。最后將DNA溶解于30微升的體積中,取2微升通過微量凝膠法來粗略估計DNA大小和量。再取7微升用于測序反應,將其余21微升作為質粒DNA儲存于4℃。
然后,進行使用T3、T7或合成的寡核苷酸引物的桑格雙脫氧終止法[Sanger,F等,Proc.Natl.Acad.Sci.U.S.A.74,5463-5467(1977)]或循環測序法(雙脫氧終止法與PCR法相結合的方法)[Carothers,A.M等,生物技術,7,494-499(1989)]。這些方法是使用少量質粒DNA(約0.1-0.5g)為模板的鏈延伸反應,其終止特異于4種堿基的方法。
使用FITC(異硫氰酸熒光素)標記的引物作為序列引物,使用Taq聚合酶進行約25輪反應循環。在經熒光標記的DNA片斷中,用DNA自動測序儀ALFTMDNA測序儀(Pharmacia)測定cDNA 5'-末端約400個核苷酸的序列。
基因中3'-非翻譯區域的異質性高,適于各個基因的分化。因此,在某些情況下,也按與上相同的方法測定3'-末端區域的序列。
將用DNA測序儀測得的大量核苷酸序列資料輸入64位計算機DEC3400中以進行計算機化同源性分析。根據UWGCG的FASTA程序[Pearson,W.R和Lipman,D.J.,Proc.Natl.Acad.Sci.USA.,85,2444-2448(1988)],通過數據庫(GenBank,EMBL)檢索進行同源性分析。
分析人胎腦cDNA文庫的方法詳細描述于Fujiwara等[Fujiwara,T等,DNA研究,2,107-111(1991)]。
從按上述構建的人胎腦cDNA文庫中隨機選擇約5040個EST(被表達序列的標記物表達的基因片斷的部分DNA序列),然后進行測序。
在根據FASTA程序的GenBank/EMBL序列檢索中,發現被稱為GEN-146F11的克隆攜有編碼與p33ING1(GenBank A.C.No.AF001954)具有高同源性的氨基酸序列的基因。
為了弄清楚所述GEN-146F11克隆中的全長序列,使用T7DNA聚合酶和合成引物進行DNA測序反應。另外,將插入到載體(pBluescript載體;Stratagene)的雙鏈DNA用作模板,合成的寡核苷酸用作引物,通過桑格雙脫氧鏈終止法測定包括整個編碼區的cDNA的核苷酸序列,并將該序列與幾個其它相關基因的DNA序列進行比較。
SEQ ID NO6顯示出GEN-146F11克隆(cDNA)的核酸序列;SEQID NO5顯示出所述克隆編碼區的核酸序列;SEQ ID NO4顯示出推定的由所述核酸序列編碼的氨基酸序列。
在上述核苷酸序列中,發現起始信號序列位于第92-94位,懷疑它是翻譯起始密碼子。推測的終止密碼子位于第932-934位。
所得cDNA的長度為1078個核苷酸,其含有840個堿基對的編碼推測為280個氨基酸殘基蛋白質的可讀框。
通過使用FASTA程序進行同源性檢索,發現該基因編碼的氨基酸序列與p33ING1(GenBank A.C.No.AF044076)具有高度同源性,而核苷酸序列的同源性為60.0%。
在氨基酸序列的水平上,研究了由本發明基因編碼的蛋白質的推定氨基酸序列與p33ING1(GenBank A.C.No.AF044076)序列之間的同源性,結果示于圖8。
圖8顯示出以單字母表示的氨基酸序列;上面一行表示由本發明基因編碼的人ING1L蛋白質的序列(表示為hING1L),下面一行表示p33ING1的序列[Garkavetsev等,Nature.Genet.,14,415-420(1996);Garkavetsev等,分子細胞生物學,17,2014-2019(1997),GenBank A.C.No.AF001954;然而,該序列隨后被修正,修正后的序列示于GenBankA.C.No.AF044076;在圖中以p33ING1表示]。
另外,在同一圖中,實心區域(黑框)表示相同的氨基酸殘基,陰影區域(陰影框)表示類似的氨基酸殘基,hING1L一行中的符號----表示缺口。
從圖中可以看出由本發明基因編碼的氨基酸序列與p33ING1的氨基酸序列有58.9%的同源性(根據經修正的p33ING1序列計算)。
(2)Northern印跡分析使用經隨機寡核苷酸引發法標記的人cDNA克隆作為探針,通過Northern印跡評價正常人組織中人ING1L mRNA的表達。
根據產品說明書,使用人MTN印跡(人多組織Northern印跡;Clontech)進行Northern印跡分析。
因此,用PCR擴增所述克隆GEN-146F11的全長序列,用[32P]-dCTP(隨機引發的DNA標記試劑盒,Boehringer Mannheim)標記PCR產物以用作探針。
對印跡進行4小時的預雜交,然后于42℃在50%甲酰胺/5×SSC/10×Decherd溶液/2%SDS溶液(含有100微克/ml變性的鮭精DNA)的溶液中雜交過夜。室溫下用2×SSC/0.1%SDS洗滌2次后,于65℃用0.2×SSC/0.1%SDS再洗滌2次,各15分鐘。于-70℃將濾紙暴露于X-射線膠片(Kodak)。
18小時暴露的結果示于圖9。
從圖9可以看出,在所有16種人成年器官-衍生的受試組織(心臟,腦,胎盤,肺,肝臟,骨骼肌,腎臟,胰腺,脾臟,胸腺,前列腺,睪丸,子宮,小腸,結腸,外周血和白細胞;與圖中示出的名稱一致)中都發現了表達,并檢測到1.5kb和1.3kb的兩個轉錄物。
另外,根據產品說明書,使用人TP印跡(人腫瘤系列印跡;Invitrogen)對結腸癌、食道癌、輸卵管癌和胃癌幾個腫瘤組織進行類似的Northern印跡分析。
結腸癌患者組織的結果示于圖10。
在圖10中,T表示結腸癌組織(在圖中以T腫瘤表示),N表示正常的結腸組織(在圖中以N正常表示)。一套T和N是得自一個患者的組織,圖中顯示的是得自4個患者的組織的結果。
從圖中可以清楚地看出在各個患者中,相對于正常組織而言,癌組織中的人ING1L基因的表達水平升高。
根據上述發現,可以認為本發明的人ING1L基因可用于癌癥研究和治療,尤其可用于癌癥診斷,如果將來研制出人ING1L基因之表達產物的任何拮抗抑制劑,該抑制劑即可用作抗癌劑。
(3)通過FISH和輻射雜交技術進行染色體作圖使用0.5微克各種粘粒DNA作為探針通過已知技術[Takahashi,E等,人類遺傳學,86,14-16(1990)]進行FISH研究,以進行染色體排列,通過Provia 100膠片(Fuji;ISO 100)或CCD照相系統(Applied Imaging,Cyto Vision)獲得FISH。
結果,100個典型的R-帶(前)中期細胞的信號表明人ING1L基因在染色體上的基因座為4q35.1。
工業實用性根據本發明,不僅提供了新的肺特異性基因TSC403,還提供了由其編碼的蛋白質。通過利用它們,提供了能更清楚了解癌癥(如肺癌和胰腺癌)以及癌癥發生過程的技術,所述技術可用于診斷、預防和治療癌癥。
本發明還提供了新的人ING1L基因,該基因可檢測在多種組織中的基因表達;通過基因工程技術產生人ING1L蛋白,所述蛋白是該基因的表達產物;構建抗所述蛋白質的特異性抗體。這些反過來可研究多種細胞的細胞周期、生長抑制或激活,研究細胞代謝的老化和細胞的編程性死亡,以及探測、治療或診斷相關疾病,如上文提及的癌癥。另外,本發明還能用于研制或篩選出所述人ING1L蛋白的拮抗性抑制劑,即細胞生長抑制劑和抗癌藥物。
序列表<110>大塚制藥株式會社<120>TSC403基因和人ING1L基因<130>P99-04<140><141>(150>JP H10-38133,JP H10-73234 and JP H10-134679<151>1998-02-03,1998-03-05 and 1998-04-28<160>9<170>PatentIn Ver.2.0<210>1<211>416<212>PRT<213>人正常肺cDNA文庫<400>1Met Pro Arg Gln Leu Ser Ala Ala Ala Ala Leu Phe Ala Ser Leu Ala1 5 10 15Val Ile Leu His Asp Gly Ser Gln Met Arg Ala Lys Ala Phe Pro Glu20 25 30Thr Arg Asp Tyr Ser Gln Pro Thr Ala Ala Ala Thr Val Gln Asp Ile35 40 45Lys Lys Pro Val Gln Gln Pro Ala Lys Gln Ala Pro His Gln Thr Leu50 55 60Ala Ala Arg Phe Met Asp Gly His Ile Thr Phe Gln Thr Ala Ala Thr65 70 75 80Val Lys Ile Pro Thr Thr Thr Pro Ala Thr Thr Lys Asn Thr Ala Thr85 90 95Thr Ser Pro Ile Thr Tyr Thr Leu Val Thr Thr Gln Ala Thr Pro Asn100 105 110Asn Ser His Thr Ala Pro Pro Val Thr Glu Val Thr Val Gly Pro Ser115 120 125Leu Ala Pro Tyr Ser Leu Pro Pro Thr Ile Thr Pro Pro Ala His Thr130 135 140Ala Gly Thr Ser Ser Ser Thr Val Ser His Thr Thr Gly Asn Thr Thr145 150 155 160Gln Pro Ser Asn Gln Thr Thr Leu Pro Ala Thr Leu Ser Ile Ala Leu165 170 175His Lys Ser Thr Thr Gly Gln Lys Pro Asp Gln Pro Thr His Ala Pro180 185 190Gly Thr Thr Ala Ala Ala His Asn Thr Thr Arg Thr Ala Ala Pro Ala195 200 205Ser Thr Val Pro Gly Pro Thr Leu Ala Pro Gln Pro Ser Ser Val Lys210 215 220Thr Gly Ile Tyr Gln Val Leu Asn Gly Ser Arg Leu Cys Ile Lys Ala225 230 235 240Glu Met Gly Ile Gln Leu Ile Val Gln Asp Lys Glu Ser Val Phe Ser245 250 255Pro Arg Arg Tyr Phe Asn Ile Asp Pro Asn Ala Thr Gln Ala Ser Gly260 265 270Asn Cys Gly Thr Arg Lys Ser Asn Leu Leu Leu Asn Phe Gln Gly Gly275 280 285Phe Val Asn Leu Thr Phe Thr Lys Asp Glu Glu Ser Tyr Tyr Ile Ser290 295 300Glu Val Gly Ala Tyr Leu Thr Val Ser Asp Pro Glu Thr Val Tyr Gln305 310 315 320Gly Ile Lys His Ala Val Val Met Phe Gln Thr Ala Val Gly His Ser
325 330 335Phe Lys Cys Val Ser Glu Gln Ser Leu Gln Leu Ser Ala His Leu Gln340 345 350Val Lys Thr Thr Asp Val Gln Leu Gln Ala Phe Asp Phe Glu Asp Asp355 360 365His Phe Gly Asn Val Asp Glu Cys Ser Ser Asp Tyr Thr Ile Val Leu370 375 380Pro Val Ile Gly Ala Ile Val Val Gly Leu Cys Leu Met Gly Met Gly385 390 395 400Val Tyr Lys Ile Arg Leu Arg Cys Gln Ser Ser Gly Tyr Gln Arg Ile405 410 415<210>2<2ll>1248<212>DNA<2l3>人正常肺cDNA文庫<400>2atgccccggc agctcagcgc ggcggccgcg ctcttcgcgt ccctggccgt aattttgcac 60gatggcagtc aaatgagagc aaaagcattt ccagaaacca gagattattc tcaacctact120gcagcagcaa cagtacagga cataaaaaaa cctgtccagc aaccagctaa gcaagcacct180caccaaactt tagcagcaag attcatggat ggtcatatca cctttcaaac agcggccaca240gtaaaaattc caacaactac cccagcaact acaaaaaaca ctgcaaccac cagcccaatt300acctacaccc tggtcacaac ccaggccaca cccaacaact cacacacagc tcctccagtt360actgaagtta cagtcggccc tagcttagcc ccttattcac tgccacccac catcacccca420ccagctcata cagctggaac cagttcatca accgtcagcc acacaactgg gaacaccact480caacccagta accagaccac ccttccagca actttatcga tagcactgca caaaagcaca540accggtcaga agcctgatca acccacccat gccccaggaa caacggcagc tgcccacaat600accacccgca cagctgcacc tgcctccacg gttcctgggc ccacccttgc acctcagcca660tcgtcagtca agactggaat ttatcaggtt ctaaacggaa gcagactctg tataaaagca720gagatgggga tacagctgat tgttcaagac aaggagtcgg ttttttcacc tcggagatac780ttcaacatcg accccaacgc aacgcaagcc tctgggaact gtggcacccg aaaatccaac840cttctgttga attttcaggg cggatttgtg aatctcacat ttaccaagga tgaagaatca900tattatatca gtgaagtggg agcctatttg accgtctcag atccagagac agtttaccaa960ggaatcaaac atgcggtggt gatgttccag acagcagtcg ggcattcctt caagtgcgtg 1020agtgaacaga gcctccagtt gtcagcccac ctgcaggtga aaacaaccga tgtccaactt 1080caagcctttg attttgaaga tgaccacttt ggaaatgtgg atgagtgctc gtctgactac 1140acaattgtgc ttcctgtgat tggggccatc gtggttggtc tctgccttat gggtatgggt 1200gtctataaaa tccgcctaag gtgtcaatca tctggatacc agagaatc1248<210>3<211>3198<212>DNA<2l3>人正常肺cDNA文庫<220><221>CDS<222>(64)..(1311)<400>3ggcaccgatt cggggcctgc ccggacttcg ccgcacgctg cagaacctcg cccagcgccc60acc atg ccc cgg cag ctc agc gcg gcg gcc gcg ctc ttc gcg tcc ctg 108Met Pro Arg Gln Leu Ser Ala Ala Ala Ala Leu Phe Ala Ser Leu1 5 10 15gcc gta att ttg cac gat ggc agt caa atg aga gca aaa gca ttt cca 156Ala Val Ile Leu His Asp Gly Ser Gln Met Arg Ala Lys Ala Phe Pro20 25 30gaa acc aga gat tat tct caa cct act gca gca gca aca gta cag gac 204Glu Thr Arg Asp Tyr Ser Gln Pro Thr Ala Ala Ala Thr Val Gln Asp35 40 45ata aaa aaa cct gtc cag caa cca gct aag caa gca cct cac caa act 252Ile Lys Lys Pro Val Gln Gln Pro Ala Lys Gln Ala Pro His Gln Thr50 55 60tta gca gca aga ttc atg gat ggt cat atc acc ttt caa aca gcg gcc 300Leu Ala Ala Arg Phe Met Asp Gly His Ile Thr Phe Gln Thr Ala Ala65 70 75aca gta aaa att cca aca act acc cca gca act aca aaa aac act gca 348Thr Val Lys Ile Pro Thr Thr Thr Pro Ala Thr Thr Lys Asn Thr Ala80 85 90 95acc acc agc cca att acc tac acc ctg gtc aca acc cag gcc aca ccc 396Thr Thr Ser Pro Ile Thr Tyr Thr Leu Val Thr Thr Gln Ala Thr Pro100 105 110aac aac tca cac aca gct cct cca gtt act gaa gtt aca gtc ggc cct 444Asn Asn Ser His Thr Ala Pro Pro Val Thr Glu Val Thr Val Gly Pro115 120 125agc tta gcc cct tat tca ctg cca ccc acc atc acc cca cca gct cat 492Ser Leu Ala Pro Tyr Ser Leu Pro Pro Thr Ile Thr Pro Pro Ala His130 135 140aca gct gga acc agt tca tca acc gtc agc cac aca act ggg aac acc 540Thr Ala Gly Thr Ser Ser Ser Thr Val Ser His Thr Thr Gly Asn Thr145 150 155act caa ccc agt aac cag acc acc ctt cca gca act tta tcg ata gca 588Thr Gln Pro Ser Asn Gln Thr Thr Leu Pro Ala Thr Leu Ser Ile Ala160 165 170 175ctg cac aaa agc aca acc ggt cag aag cct gat caa ccc acc cat gcc 636Leu His Lys Ser Thr Thr Gly Gln Lys Pro Asp Gln Pro Thr His Ala180 185 190cca gga aca acg gca gct gcc cac aat acc acc cgc aca gct gca cct 684Pro Gly Thr Thr Ala Ala Ala His Asn Thr Thr Arg Thr Ala Ala Pro195 200 205gcc tcc acg gtt cct ggg ccc acc ctt gca cct cag cca tcg tca gtc 732Ala Ser Thr Val Pro Gly Pro Thr Leu Ala Pro Gln Pro Ser Ser Val210 215 220aag act gga att tat cag gtt cta aac gga agc aga ctc tgt ata aaa 780Lys Thr Gly Ile Tyr Gln Val Leu Asn Gly Ser Arg Leu Cys Ile Lys225 230 235gca gag atg ggg ata cag ctg att gtt caa gac aag gag tcg gtt ttt 828Ala Glu Met Gly Ile Gln Leu Ile Val Gln Asp Lys Glu Ser Val Phe240 245 250 255tca cct cgg aga tac ttc aac atc gac ccc aac gca acg caa gcc tct 876Ser Pro Arg Arg Tyr Phe Asn Ile Asp Pro Asn Ala Thr Gln Ala Ser260 265 270ggg aac tgt ggc acc cga aaa tcc aac ctt ctg ttg aat ttt cag ggc 924Gly Asn Cys Gly Thr Arg Lys Set Asn Leu Leu Leu Asn Phe Gln Gly275280 285gga ttt gtg aat ctc aca ttt acc aag gat gaa gaa tca tat tat atc 972Gly Phe Val Asn Leu Thr Phe Thr Lys Asp Glu Glu Ser Tyr Tyr Ile290 295 300agt gaa gtg gga gcc tat ttg acc gtc tca gat cca gag aca gtt tac 1020Ser Glu Val Gly Ala Tyr Leu Thr Val Ser Asp Pro Glu Thr Val Tyr305 310 315caa gga atc aaa cat gcg gtg gtg atg ttc cag aca gca gtc ggg cat 1068Gln Gly Ile Lys His Ala Val Val Met Phe Gln Thr Ala Val Gly His320 325 330 335tcc ttc aag tgc gtg agt gaa cag agc ctc cag ttg tca gcc cac ctg 1116Ser Phe Lys Cys Val Ser Glu Gln Ser Leu Gln Leu Ser Ala His Leu340 345 350cag gtg aaa aca acc gat gtc caa ctt caa gcc ttt gat ttt gaa gat 1164Gln Val Lys Thr Thr Asp Val Gln Leu Gln Ala Phe Asp Phe Glu Asp
355 360 365gac cac ttt gga aat gtg gat gag tgc tcg tct gac tac aca att gtg1212Asp His Phe Gly Asn Val Asp Glu Cys Ser Ser Asp Tyr Thr Ile Val370 375 380ctt cct gtg att ggg gcc atc gtg gtt ggt ctc tgc ctt atg ggt atg1260Leu Pro Val Ile Gly Ala Ile Val Val Gly Leu Cys Leu Met Gly Met385 390 395ggt gtc tat aaa atc cgc cta agg tgt caa tca tct gga tac cag aga1308Gly Val Tyr Lys Ile Arg Leu Arg Cys Gln Ser Ser Gly Tyr Gln Arg400 405 410 415atc taattgttgc ccggggggaa tgaaaataat ggaatttaga gaactctttc 1361Ileatcccttcca ggatggatgt tgggaaattc cctcagagtg tgggtccttc aaacaatgta 1421aaccaccatc ttctattcaa atgaagtgag tcatgtgtga tttaagttca ggcagcacat 1481caatttctaa atactttttg tttattttat gaaagatata gtgagctgtt tattttctag 1541tttcctttag aatattttag ccactcaaag tcaacatttg agatatgttg aattaacata 1601atatatgtaa agtagaataa gccttcaaat tataaaccaa gggtcaattg taactaatac 1661tactgtgtgt gcattgaaga ttttatttta cccttgatct taacaaagcc tttgctttgt 1721tatcaaatgg actttcagtg cttttactat ctgtgtttta tggtttcatg taacatacat 1781attcctggtg tagcacttaa ctccttttcc actttaaatt tgtttttgtt ttttgagacg 1841gagtttcact cttgtcaccc aggctggagt acagtggcac gatctcggct tatggcaacc 1901tccgcctccc gggttcaagt gattctcctg cttcagcttc ccgagtagct gggattacag 1961gcacacacta ccacgcctgg ctaatttttg tatttttatt atagacgggt ttcaccatgt 2021tggccagact ggtcttgaac tcttgacctc aggtgatcca cccacctcag cctcccaaag 2081tgctgggatt acaggcatga gccattgcgc ccggccttaa atgttttttt taatcatcaa 2141aaagaacaac atatctcagg ttgtctaagt gtttttatgt aaaaccaaca aaaagaacaa 2201atcagcttat attttttatc ttgatgactc ctgctccaga atgctagact aagaattagg 2261tggctacaga tggtagaact aaacaataag caagagacaa taataatggc ccttaattat 2321taacaaagtg ccagagtcta ggctaagcac tttatctata tctcatttca ttctcacaac 2381ttataagtga atgagtaaac tgagacttaa gggaactgaa tcacttaaat gtcacctggc 2441taactgatgg cagagccaga gcttgaattc atgttggtct gacatcaagg tctttggtct 2501tctccctaca ccaagttacc tacaagaaca atgacaccac actctgcctg aaggctcaca 2561cctcatacca gcatacgctc accttacagg gaaatgggtt tatccaggat catgagacat 2621tagggtagat gaaaggagag ctttgcagat aacaaaatag cctatcctta ataaatcctc 2681cactctctgg aaggagactg aggggctttg taaaacatta gtcagttgct catttttatg 2741ggattgctta gctgggctgt aaagatgaag gcatcaaata aactcaaagt atttttaaat 2801ttttttgata atagagaaac ttcgctaacc aactgttctt tcttgagtgt atagccccat 2861cttgtggtaa cttgctgctt ctgcacttca tatccatatt tcctattgtt cactttattc 2921tgtagagcag cctgccaaga attttatttc tgctgttttt tttgctgcta aagaaaggaa 2981ctaagtcagg atgttaacag aaaagtccac ataaccctag aattcttagt caaggaataa 3041ttcaagtcag cctagagacc atgttgactt tcctcatgtg tttccttatg actcagtaag 3101ttggcaaggt cctgacttta gtcttaataa aacattgaat tgtagtaaag gtttttgcaa 3161taaaaactta ctttggaaaa aaaaaaaaaa aaaaaaa3198<210>4<2ll>280<2l2>PRT<2l3>人胎腦cDNA文庫<400>4Met Leu Gly Gln Gln Gln Gln Gln Leu Tyr Ser Ser Ala Ala Leu Leu1 5 10 15Thr Gly Glu Arg Ser Arg Leu Leu Thr Cys Tyr Val Gln Asp Tyr Leu20 25 30Glu Cys Val Glu Ser Leu Pro His Asp Met Gln Arg Asn Val Ser Val35 40 45Leu Arg Glu Leu Asp Asn Lys Tyr Gln Glu Thr Leu Lys Glu Ile Asp50 55 60Asp Val Tyr Glu Lys Tyr Lys Lys Glu Asp Asp Leu Asn Gln Lys Lys65 70 75 80Arg Leu Gln Gln Leu Leu Gln Arg Ala Leu Ile Asn Ser Gln Glu Leu85 90 95Gly Asp Glu Lys Ile Gln Ile Val Thr Gln Met Leu Glu Leu Val Glu100 105 110Asn Arg Ala Arg Gln Met Glu Leu His Ser Gln Cys Phe Gln Asp Pro115 120 125Ala Glu Ser Glu Arg Ala Ser Asp Lys Ala Lys Met Asp Ser Ser Gln130 135 140Pro Glu Arg Ser Ser Arg Arg Pro Arg Arg Gln Arg Thr Ser Glu Ser145 150 155 160Arg Asp Leu Cys His Met Ala Asn Gly Ile Glu Asp Cys Asp Asp Gln165 170 175Pro Pro Lys Glu Lys Lys Ser Lys Ser Ala Lys Lys Lys Lys Arg Ser180 185 190Lys Ala Lys Gln Glu Arg Glu Ala Ser Pro Val Glu Phe Ala Ile Asp195 200 205Pro Asn Glu Pro Thr Tyr Cys Leu Cys Asn Gln Val Ser Tyr Gly Glu210 215 220Met Ile Gly Cys Asp Asn Glu Gln Cys Pro Ile Glu trp Phe His Phe225 230 235 240Ser Cys Val Ser Leu Thr Tyr Lys Pro Lys Gly Lys trp Tyr Cys Pro245 250 255Lys Cys Arg Gly Asp Asn Glu Lys Thr Met Asp Lys Ser Thr Glu Lys260 265 270Thr Lys Lys Asp Arg Arg Ser Arg275 280<210>5<211>840<212>DNA<213>人胎腦cDNA文庫<400>5atgttagggc agcagcagca gcaactgtac tcgtcggccg cgctcctgac cggggagcgg 60agccggctgc tcacctgcta cgtgcaggac taccttgagt gcgtggagtc gctgccccac120gacatgcaga ggaacgtgtc tgtgctgcga gagctggaca acaaatatca agaaacgtta180aaggaaattg atgatgtcta cgaaaaatat aagaaagaag atgatttaaa ccagaagaaa240cgtctacagc agcttctcca gagagcacta attaatagtc aagaattggg agatgaaaaa300atacagattg ttacacaaat gctcgaattg gtggaaaatc gggcaagaca aatggagtta360cactcacagt gtttccaaga tcctgctgaa agtgaacgag cctcagataa agcaaagatg420gattccagcc aaccagaaag atcttcaaga agaccccgca ggcagcggac cagtgaaagc480cgtgatttat gtcacatggc aaatgggatt gaagactgtg atgatcagcc acctaaagaa540aagaaatcca agtcagcaaa gaaaaagaaa cgctccaagg ccaagcagga aagggaagct600tcacctgttg agtttgcaat agatcctaat gaacctacat actgcttatg caaccaagtg660tcttatgggg agatgatagg atgtgacaat gaacagtgtc caattgaatg gtttcacttt720tcatgtgttt cacttaccta taaaccaaag gggaaatggt attgcccaaa gtgcagggga780gataatgaga aaacaatgga caaaagtact gaaaagacaa aaaaggatag aagatcgagg840<210>6<211>1078<212>DNA<213>人胎腦cDNA文庫<220><221>CDS<222>(92)..(931)<400>6tccaagctga gctgagggcc cgcggcggcc gcggccggtg catgtgcggc tgctggatgc 60ggaggcggcg gcgacggcgc ggatcggcag g atg tta ggg cag cag cag cag 112
Met Leu Gly Gln Gln Gln Gln1 5caa ctg tac tcg tcg gcc gcg ctc ctg acc ggg gag cgg agc cgg ctg 160Gln Leu Tyr Ser Ser Ala Ala Leu Leu Thr Gly Glu Arg Ser Arg Leu10 15 20ctc acc tgc tac gtg cag gac tac ctt gag tgc gtg gag tcg ctg ccc 208Leu Thr Cys Tyr Val Gln Asp Tyr Leu Glu Cys Val Glu Ser Leu Pro25 30 35cac gac atg cag agg aac gtg tct gtg ctg cga gag ctg gac aac aaa 256His Asp Met Gln Arg Asn Val Ser Val Leu Arg Glu Leu Asp Asn Lys40 45 50 55tat caa gaa acg tta aag gaa att gat gat gtc tac gaa aaa tat aag 304Tyr Gln Glu Thr Leu Lys Glu Ile Asp Asp Val Tyr Glu Lys Tyr Lys60 65 70aaa gaa gat gat tta aac cag aag aaa cgt cta cag cag ctt ctc cag 352Lys Glu Asp Asp Leu Asn Gln Lys Lys Arg Leu Gln Gln Leu Leu Gln75 80 85aga gca cta att aat agt caa gaa ttg gga gat gaa aaa ata cag att 400Arg Ala Leu Ile Asn Ser Gln Glu Leu Gly Asp Glu Lys Ile Gln Ile90 95 100gtt aca caa atg ctc gaa ttg gtg gaa aat cgg gca aga caa atg gag 448Val Thr Gln Met Leu Glu Leu Val Glu Asn Arg Ala Arg Gln Met Glu105 110 115tta cac tca cag tgt ttc caa gat cct gct gaa agt gaa cga gcc tca 496Leu His Ser Gln Cys Phe Gln Asp Pro Ala Glu Ser Glu Arg Ala Ser120 125 130 135gat aaa gca aag atg gat tcc agc caa cca gaa aga tct tca aga aga 544Asp Lys Ala Lys Met Asp Ser Ser Gln Pro Glu Arg Ser Ser Arg Arg140 145 150ccc cgc agg cag cgg acc agt gaa agc cgt gat tta tgt cac atg gca 592Pro Arg Arg Gln Arg Thr Ser Glu Ser Arg Asp Leu Cys His Met Ala155 160 165aat ggg att gaa gac tgt gat gat cag cca cct aaa gaa aag aaa tcc 640Asn Gly Ile Glu Asp Cys Asp Asp Gln Pro Pro Lys Glu Lys Lys Ser170 175 180aag tca gca aag aaa aag aaa cgc tcc aag gcc aag cag gaa agg gaa 688Lys Ser Ala Lys Lys Lys Lys Arg Ser Lys Ala Lys Gln Glu Arg Glu185 190 195gct tca cct gtt gag ttt gca ata gat cct aat gaa cct aca tac tgc 736Ala Ser Pro Val Glu Phe Ala Ile Asp Pro Asn Glu Pro Thr Tyr Cys200 205 210 215tta tgc aac caa gtg tct tat ggg gag atg ata gga tgt gac aat gaa 784Leu Cys Asn Gln Val Ser Tyr Gly Glu Met Ile Gly Cys Asp Asn Glu220 225 230cag tgt cca att gaa tgg ttt cac ttt tca tgt gtt tca ctt acc tat 832Gln Cys Pro Ile Glu trp Phe His Phe Ser Cys Val Ser Leu Thr Tyr235 240 245aaa cca aag ggg aaa tgg tat tgc cca aag tgc agg gga gat aat gag 880Lys Pro Lys Gly Lys trp Tyr Cys Pro Lys Cys Arg Gly Asp Asn Glu250 255 260aaa aca atg gac aaa agt act gaa aag aca aaa aag gat aga aga tcg 928Lys Thr Met Asp Lys Ser Thr Glu Lys Thr Lys Lys Asp Arg Arg Ser265 270 275agg tagtaaaggc catccacatt ttaaagggtt atttgactat tatataatcc 981Arg280gtttgctttc agaaaatgtt ttagggtaaa tgcataagac tatgcaataa ttattaatca 1041ttagtattaa tggtgtatta aaagttgttg tactttg1078<210>7<211>10<212>DNA<213>TSC403的PCR引物序列<400>7gatctgacac10<210>8<211>28<212>DNA<213>PCR引物P1<400>8gatcggatcc aggaggatgc gggtccgg28<210>9<211>30<212>DNA<213>PCR引物P2<400>9gatcctcgag ttactgtggt ggctgctgct 30
權利要求
1.一種基因,其具有編碼SEQ ID NO1所示氨基酸序列的核苷酸序列。
2.一種基因,其為選自下列(a)、(b)和(c)之一的多核苷酸(a)含有SEQ ID NO2所示核苷酸序列或其互補序列的多核苷酸;(b)在嚴緊條件下與(a)之多核苷酸雜交的多核苷酸;和(c)與編碼含有SEQ ID NO1之氨基酸序列的多肽的多核苷酸具有至少95%同源性的多核苷酸。
3.權利要求1或2的基因,其為人基因。
4.權利要求2的基因,其具有SEQ ID NO3所示的核苷酸序列。
5.一種寡核苷酸,其具有由SEQ ID NO2所示核苷酸序列中的至少15個連續的核苷酸組成的序列。
6.一種探針,其含有由SEQ ID NO2所示核苷酸序列中的至少15個連續的核苷酸組成的序列。
7.一種引物,其含有由SEQ ID NO2所示核苷酸序列中的至少15個連續的核苷酸組成的序列。
8.一種診斷癌癥的方法,其包括使用具有由SEQ ID NO2所示核苷酸序列中的至少15個連續的核苷酸組成的序列的探針或具有由SEQ ID NO2所示核苷酸序列中的至少15個連續的核苷酸組成的序列的引物檢測權利要求1所述基因的表達。
9.權利要求8的診斷方法,其中癌癥選自乳腺癌、輸卵管癌、食道癌、結腸癌、直腸癌、甲狀腺癌、腮腺癌、輸尿管癌、卵巢癌和胰腺癌。
10.一種診斷癌癥的試劑盒,其含有具有由SEQ ID NO2所示核苷酸序列中的至少15個連續的核苷酸組成的序列的探針或具有由SEQID NO2所示核苷酸序列中的至少15個連續的核苷酸組成的序列的引物作為必需成分。
11.一種蛋白質,其具有由權利要求1所述基因編碼的由SEQ IDNO1所示的氨基酸序列。
12.一種抗體,它對權利要求11所述的蛋白質具有結合親和性。
13.一種人基因,其含有編碼SEQ ID NO4所示氨基酸序列的核苷酸序列。
14.一種基因,其為選自下列(a)、(b)和(c)之一的多核苷酸(a)含有SEQ ID NO5所示核苷酸序列或其互補序列的多核苷酸;(b)在嚴緊條件下與(a)之多核苷酸雜交的多核苷酸;和(c)與編碼含有SEQ ID NO4所示氨基酸序列的多肽的多核苷酸具有至少95%同源性的多核苷酸。
15.權利要求14的基因,其為具有SEQ ID NO6所示核苷酸序列的人基因。
16.一種寡核苷酸,其具有由SEQ ID NO5所示核苷酸序列中的至少15個連續的核苷酸組成的序列。
17.一種探針,其具有由SEQ ID NO5所示核苷酸序列中的至少15個連續的核苷酸組成的序列。
18.一種引物,其具有由SEQ ID NO5所示核苷酸序列中的至少15個連續的核苷酸組成的序列。
19.一種診斷癌癥的方法,其包括使用具有由SEQ ID NO5所示核苷酸序列中的至少15個連續的核苷酸組成的序列的探針或具有由SEQ ID NO5所示核苷酸序列中的至少15個連續的核苷酸組成的序列的引物檢測權利要求13所述基因的表達。
20.權利要求19的診斷方法,其中癌癥選自結腸癌、食道癌、輸卵管癌和胃癌。
21.一種診斷癌癥的試劑盒,其含有具有由SEQ ID NO5所示核苷酸序列中的至少15個連續的核苷酸組成的序列的探針或具有由SEQID NO2所示核苷酸序列中的至少15個連續的核苷酸組成的序列的引物作為必需成分。
22.一種蛋白質,其具有由權利要求13所述基因編碼的由SEQ IDNO4所示的氨基酸序列。
23.一種抗體,它對權利要求22所述的蛋白質具有結合親和性。
全文摘要
本發明提供了具有編碼SEQ ID NO:1之氨基酸序列的核苷酸序列的TSC403基因,該基因為新基因,它在研究、診斷、治療肺癌等疾病中有廣泛用途。另外,本發明還提供了人ING1L基因,其含有編碼SEQ IDNO:4之氨基酸序列的核苷酸序列,該基因為新的人基因,它可用于調節細胞周期,抑制或激活細胞增殖,研究細胞代謝老化或細胞的編程性死亡、病理學探測、診斷和治療癌癥和其它疾病,篩選和研制新藥物。
文檔編號C12N15/12GK1289366SQ99802655
公開日2001年3月28日 申請日期1999年2月2日 優先權日1998年2月3日
發明者永田真粧美, 尾崎浩一, 嶋田良和, 崛江正人 申請人:大塚制藥株式會社