專利名稱:對dna損傷敏感的抑癌基因序列的制作方法
技術領域:
本發明涉及生物技術領域,具體是人類和小鼠的對DNA損傷敏感的抑癌基因全長 mRNA序列,分別編碼一個進化上高度同源的蛋白質。
背景技術:
腫瘤細胞的特征是基因組不穩定性(genomic instability),DNA損傷修復異常 和細胞周期調控異常是造成基因組不穩定性的原因。以基因組DNA為研究對象的微陣列比 較基因組雜交(microarray-basedcomparative genomic hybridization, Array-CGH)技 術是目前國際上發現腫瘤相關新基因的強有力手段。Array-CGH技術將覆蓋全基因組且已 知順序的DNA克隆做成微陣列,代替傳統CGH檢測中將中期染色體作為雜交靶,大大提高了 檢測DNA拷貝數異常位點的分辨率;再分別提取腫瘤組織和正常組織的基因組DN A,用cy3 和cy5熒光染料分別標記腫瘤組織和正常組織的DNA,進行雜交檢測,在雜交系統中加入 Cotl-DNA用于抑制基因組中重復序列的干擾,并用自動化的掃描儀分析雜交靶上熒光信號 的相對強弱,最后用自動化分析軟件進行定量分析。Array-CGH不僅使檢測染色體異常的分 辨率提高,而且還可以確定腫瘤相關基因并提供精確的定位。小分子RNA干擾(RNAi)是多數真核細胞本身固有的一種自我保護現象,既能對抗 病毒基因或人工轉基因所表達的mRNA等外源基因的侵害,又能降解自身異常基因產生的 mRNA,使靶向基因的轉錄水平降低或沉默,對含有其同源序列的基因表達進行干涉。RNAi過 程中,由雙鏈RNA分子加工成的19-23個核苷酸的RNAs就稱為siRNA,是誘導基因沉默的第 一步,它與RNAi特異性酶結合,形成沉默復合物,特異降解與siRNA同源的靶mRNA,針對同 一個靶mRNA的多種siRNA可以協同起作用。近年來,人們利用這一現象特異性阻斷要研究 的基因,從而產生相應的功能缺失表型,形成RNAi技術。染色體脆性位點(fragile site)是正常基因組中位點特異的不穩定區域,包括 39個稀有型脆性位點(rare fragile site)和88個普通型脆性位點(common fragile site, CFS)。正常細胞培養條件下不出現染色體脆性位點;當細胞中DNA復制被部分抑制 時,在有絲分裂中期染色體中形成缺口或斷裂區。CFS位點基因具有進化上保守、與癌癥發 生密切相關、可能參與DNA損傷反應信號調控等特征,極有可能是腫瘤發生早期起關鍵調 控作用的候選分子標志物。尋找確定CFS位點基因的新途徑、發掘和鑒定新的CFS基因并 闡明其重要功能和分子作用機制,不僅能發現癌癥的新型生物標志物,并用于癌癥的風險 預測和分子診斷研究,探索癌癥防治新方法,還能為抗癌新藥的創制提供具有市場開發前 景的分子靶標。因此發掘、鑒定和克隆有重要功能的癌癥相關新基因具有高科技研究和應 用的雙重價值,是當今生物醫學研究的制高點。
發明內容
本發明就是通過建立小鼠腫瘤模型,利用Array-CGH技術分析小鼠淋巴瘤基因組 中的DNA缺失和擴增區域,提供一個功能未知的定位于小鼠七號染色體末端一個高頻率缺失的普通型脆性位點的對DNA損傷敏感的抑癌基因序列,并將該基因編碼一個新蛋白,為候選抑癌基因。為抗癌新藥的創制提供具有市場開發前景的分子靶標。本發明所述一段對DNA損傷敏感的抑癌基因序列,其編碼蛋白的氨基酸序列在進 化上高度保守,在腫瘤基因組中缺失頻率高達70%,在多種癌細胞中表達沉默,并參與DNA 損傷反應信號傳導,具有維持細胞周期節點的功能,并具有抗腫瘤活性,其鼠與人的核酸序 列分別見序列表1和序列表2。所述的一段對DNA損傷敏感的抑癌基因序列,該基因序列在SKBR3,MCF-7, MDA-MB-468,神經膠質瘤細胞系,肺癌細胞系,卵巢癌細胞系,宮頸癌細胞系,以及結腸癌細 胞系中表達沉默。所述的一段對DNA損傷敏感的抑癌基因序列,該編碼蛋白的氨基酸序列人與鼠相 同氨基酸比例達65.4%。正常細胞存在細胞周期節點控制功能,在DNA損傷后被激活,阻止細胞在DNA損傷 修復完成之前進入有絲分裂(M期)。但我們研究發現用RNAi技術干擾FATS基因的正常 表達后,在DNA損傷后細胞進入M期的比例顯著上升,表明細胞周期G2節點功能嚴重受損, 證明FATS基因對于維持基因組穩定性有重要作用。上述本發明提供一個與腫瘤發生相關的對DNA損傷敏感的抑癌基因序列,為進一 步的腫瘤基因治療和分子機制研究、以及與FATS蛋白三維結構為基礎的抗癌藥物開發提 供了一個新的基礎。
圖1是小鼠的抑癌基因核酸序列;圖2是人源的抑癌基因核酸序列;圖3是蛋白質氨基酸順序比對圖;圖4是RT-PCR實驗分析結果;圖5是有絲分裂細胞數統計圖。
具體實施例方式下面結合附圖及實施對本發明進行詳細的說明。一.實驗材料來源小鼠模型用p53雜合子近交系C57BL/6小鼠建立。用Y -射線(4Gy)單劑量照射, 4-6月后收集胸腺淋巴瘤組織,提取基因組DNA。人癌細胞系MDA-MB-231,SKBR3, MCF-7, MDA-MB-468, U20S, H1299, SK0V3/ip-l, HeLa,以及HCT116 購自美國 American Type Culture Collection (ATCC) Cotl-DNA 購自 Invitrogen 公司。二.實施方法1. Array-CGH 實驗用覆蓋小鼠全基因組的BAC文庫DNA制備DNA芯片,每張玻璃芯片含19000個 微陣列BAC克隆。提取小鼠胸腺淋巴瘤組織DNA,以正常小鼠的基因組DNA作為對照, 分別用cy3和cy5熒光染料分別標記腫瘤組織和正常組織的DNA,進行雜交檢測,在雜交 系統中加入Cotl-DNA用于抑制基因組中重復序列的干擾,并用自動化的掃描儀ImaGene4.0(BiODiSCOVery公司)分析雜交靶上熒光信號的相對強弱,最后周自動化分析軟件 Excel-Macro進行定量分析。如圖1所示,圖中劃線處分別為蛋白質翻譯起始密碼和終止密碼。陰影部分是小 鼠FATS基因的最大外顯子序列。基因庫(Genbank)收錄號碼為NM-001081331。
該新基因的人源序列位于人類10號染色體10q26. 2區,恰好位于一個普通型 染色體脆性位點FARlOF內,我們將其命名為FATS (Fragile-site Associated Jumor Suppressor)。如圖2所示,圖中劃線處分別為FATS蛋白質翻譯起始密碼和終止密碼,藍色 區域為不同外顯子間隔,大寫字母區為蛋白翻譯區。基因庫(Genbank)收錄號碼為 NM-OO1004298。2.生物信息學分析通過比較基因組學分析,用美國國家國家衛生研究所網上提供的分析軟件(// www. ncbi. nlm. nih. gov)分析CGH結果,確認FATS基因定位和mRNA核酸序列,并用上述軟 件將人FATS基因和小鼠FATS基因的mRNA表達序列進行比對。氨基酸順序比對結果如圖3所示,黑底白字區為氨基酸殘基完全相同區,深灰色 區為氨基酸殘基保守區,淡灰色區為氨基酸殘基半保守區;FATS蛋白質氨基酸序列在人和 小鼠中高度保守。3. RT-PCR 實驗利用美國麻省理工大學在網上提供的設計軟件(//frodo. wi. mit. edu)選擇針對 人FATS基因的引物序列,合成以下FATS特異的引物5,-CAATAAGCGAAGCCCTGAAG-3,禾口 5’ -TTGGAGAGCTATCCCCAATG-3’。用Trizol試劑提取細胞的總RNA,電泳檢測質量,紫外分光定量。以相同量RNA作 為起始模板,逆轉錄反應合成cDNA。用PCR儀GeneAmp9700上進行PCR反應,反應體系為 94°C預變性2min,94°C變性30s,56°C退火30s,72°C延伸30s,循環30次。用瓊脂糖凝膠電 泳分析結果,參見圖4,mRNA表達水平,以GAPDH管家基因的mRNA表達水平作為對照,圖4 中1. FATS 基因在乳腺癌細胞系(MDA-MB-231)、2. SKBR3、3. MCF-7、4. MDA-MB-468、5.神經 膠質瘤細胞系(U20S)、6.肺癌細胞系(H1299)、7.卵巢癌細胞系(SK0V3/ip_l)、8.宮頸癌 細胞系(HeLa),9.結腸癌細胞系(HCT116)。FRA10F所在的10q26q區域與腫瘤有很強的相關性,證據表明10q26在黑色素瘤、 神經膠質瘤和子宮內膜癌中均是高頻率雜合子丟失(loss ofheterozygosity, L0H)位點。 RT-PCR檢測結果還表明FATS基因在多種癌細胞系中的表達水平顯著下降或不表達。以上 結果證實FATS不僅是脆性位點新基因,而且與腫瘤發生密切相關。4.制備針對FATS基因的特異性干擾RNAFATS 特異性干擾 RNA(siRNA)用 Block-iT RNAi topo 轉錄試劑盒(Invitrogen 公司)制備。首先用聚合酶鏈反應擴增一段160bp FATS特異性序列,所用引物順序為 (5' -CTCAGCCTCCGCTGTAGTTC-3‘和 5' -CCTTCCAGTGACCACCTTGT-3‘),模板來自小鼠心 臟cDNA。PCR產物與T7啟動子linkers連接,進行轉錄分別產生正義和反義的RNA模板 并進行退火形成雙鏈RNA。最后經Dicer酶消化和純化,得到FATS_siRNA混合物。稀釋至 0. 1 μ g/ μ 1并分裝儲存于-80C。
5.用RNA干擾技術分析FATS基因表達缺陷對基因組穩定性影響用FATS特異小分子干擾RNA(SiRNA)轉染正常胚胎成纖維細胞,對照組細胞 用非特異性siRNA轉染,24小時后,用Y-射線(IOGy)照射細胞引入DNA損傷,接著與 nocodazole (0. 2 μ g/ml)孵育24h,在熒光顯微鏡下觀察進入分裂期的細胞數,至少分析 200個細胞(P < 0.01),參見圖5。SEQUENCE LISTING〈110〉天津醫科大學附屬腫瘤醫院〈120〉對DNA損傷敏感的抑癌基因序列
<130>DNA<160>1<170>PatentIn version 3.1<210>1<211>2425<212>DNA<213>2 Ambystoma laterale χ Ambystoma jeffersonianum〈220〉〈221〉鼠〈222〉⑴·· (2425)〈223〉〈400〉1tacagaagaa gagaggccct gacagggtca gaatgctgaa gtcagagctg gtggccagcc 60ttccagtgtt caacacactc ctgggagcct tacctccaca agcccaggct gagagacact 120ggcatcacag aacacaagaa tgatatcacc tgtggtcatt tcccggctga ttgatgaaaa 180gaaatctatg gaaaatggag caatattgcc acaagccatt gctcagcctc agctgtgtcc 240cacaaagcca gctttggcca ggcgcgatgg agtgagcatg cacaggcgat ttgctttatc 300tccagacaga ctgggaattt tgactccatc agatgatcaa ggactggaga cagaaccgct 360gtctacaggg gacaatctag gcaaaggttc ccacagcggt ttctcgtcta tcaccattac 420tgcccgacgt gtgggccctc cagccagcag cttggtatgg gacactttta gggacccact 480gtgtcccaag tgcaaagcca aggatgctct gttccaagag cccccagttc tggctggtga 540tgcccatctc tgtcagcaca atagaccctt cacctgtaca gagtccccca gcaatggctc 600cgtagagggg atgaaggttt tccaggctca ctcaaggctg agtgcaaggc aggactactg 660ggtcacccac acgaatgaca atgaggacag tttttcttca gacaattcac catcgagaaa 720agtcccactg gtgttcagtt cttgtgtcca cttccgggtg tctcagcagt gtcccaatgc 780catttactat ttggacaagt ctctttctgt tccccttgag cgacctcaaa ttgctagccc 840caaaatgcac aggtctgtcc tgtctctcag cctccgctgt agttcccacc agttaacagc 900agatggagta gacagctcag ctaatggaga gccaatcagc acagctctat cacaggaact 960ctcggaggga aagcaggacc tcctaggtcc acaatggggc cagccacaag gtggtcactg 1020gaaggagagc ccagcattgg tgccagtaca tttggggagt ggcacatgcc ctcggactgg 1080ctcccctcca ctggaaaatg tcaaatttgc agacgtggga aggaaccagg tcccagtacg 1140aaaggagaaa gaggaccatg caacatgtac cagtagcagc cacaccaacc aactctccat 1200
ccatattccc ggctggagtt acagggctga aacaaaagta ctttctggaa gcaagaagca1260gcagcaagaa gcacaaagaa ctcttcctgc tttcccagtg ggacagaaga ccattaaaca1320cttccctcct gaaggggaca gttcaccaag cagtgatggt caacctagca tcctttcaga1380gtccaatgag aggcaacacc catacttcat gatacccaga gtccctctgc ctgggtttta1440ttgcccttta caaactgggt gtgcctctct gcaggaagat ggtgctgttc agatagaaac1500acacttcccc aaagattaca cgtgctgtga cttggttgta aaactaaagg aatgtgagaa1560gaacgaagac cccactgtca cccctgagcc ctcaccagca accccctctc catcaacccc1620agagggagca cagagctctg acccatcaga agatagttac gagcctctgc tggcaagttc1680tatgactttg caggaagcac tggaagtcca tagacctcag ttcatttctc gctcacaaga1740acggctgcaa aagcttaagc gcatggtaca gcaaaggaaa acccaacaaa aggagagcct1800ggggcagaag cagagcctac ttcctgtccg cgccaacaag aagcagttca ccattcccca1860tcctcttagt gataacttgt tcaaacccaa agaaagatgc atttcagaga aggagatgca1920tatgagatct aaaagaatct ataataattt gccggaagtt aaaaagaaaa aagaagagca1980gaagaaaaga atgatcttac agagtaaccg gctccgagca gaagtcttca aaaagcaatt2040actggaccag ctccttcaaa ggaatgcagt ttgatcccag gtggctctgc tagccctgga2100tctgggaaca cttctgacga cgacgctgga tggatgaacc attacattta acactatctc2160cacacgtgca agacaccttt actttactcc tgatttttct ttttcccaca aaggaaatgt2220cactttctga atgtcccaaa cagaagcaac agtccggcag gcaatggatc agcagtccat2280tgctgggact tcaacacctc gggacctacc agatttagtc ccttccaact tccttggctt2340gtgaatttta cccattgctt ctgaagtttc cattgtacca attccaccca agcaggaaag2400cttcatatac tcacgtgtgc ttgga2425<160>2<170>PatentIn version 3. 1<210>2<211>3097<212>DNA<213>2Ambystoma laterale χ Ambystoma jeffersonianum〈220〉〈221〉人〈222〉⑴·· (3097)〈223〉<400>1attactggcc tagccacaga ggtaaactcc ggacattttt ttctttcatg tcgccaaata60catccttgtc attaaaagac ctttgaaact gagtaaaatg gctttgaaac ctcagtagaa120tatgctcaaa ctgtctggag aaggattacg ggacagctac cacagtagaa gagatcaaat180tgcccttaaa aatctccagt ctgatgtcac agaggcaaaa tctgacttca ccaaggagac240cctggcatca aaatgatttc at catagtc atctcccaga tgattgatga300gaataagtca agagaaaaca gggcctcctt gcccctaccg tgtgccattg ctcagtctcg 360tgcacatcac gccaagcaat ctctggctaa ccgcagcgga gtcaacattc acagagcatt420
tgcgttacttccgggcagat taggaatccc ggcaccgtca gatgagcgag gacctgaggc480agagctgccg cccaaagagg agagaccctg tgggggcccc cgcagagggt ttgcatccat540caccatcacg gccagacgcg tgggcccccc agcccgcgcc ctggtgtggg ggactgctgg600ggactctctg tgccccaagt gcagggctga ggacacactg ttccaggcgc ccccggctct660ggccaatggcgcccatccag gtcggcatca gagatctttt gcctgcacag agttctccag720aaacagctccgtggtgcggc tgaaggttcc cgaggcccac actgggttgt gtgagagacg780caagtactgg gtcacccatg cagacgacaa agagaccagt ttttctccag acaccccact840gtcaggaaag agcccgctgg tgttcagttc ctgtgtccac ctcagggtgt ctcagcagtg900tccagattca atctattacg tagacaagtc tctctccgtc cccattgagc cacctcaaat960tgccagccccaaaatgcaca gatccgtcct gtcgctcaac ctcaattgta gttcccacag1020attaacagca gatggagtag atggcctagt gaacagagag ccaataagcg aagccctgaa1080gcaggagctcctggagggag accaggacct cgtaggccag cgctggaacc caggtttaca1140agaaagtcacttgaaggaaa ccccatcgtt gaggcgggtg catttgggga ccggcgcttg1200tccttggagtggttcttttc cattggaaaa cacagaattg gcaaatgtgg gagctaacca1260agtcactgtaagaaaagggg aaaaggacca tacaactcat tgtcacgcca gcgatcatgc1320caaccaactgtccattcaca ttcctggctg gagttacagg gcagtacaca caaaagtatt1380ttctggaagcagcaagaggc aacaaggaga agtatgtatg actgtgtctg ctcctccagt1440ggaacagaagcccactagac atttccttcc cattggggat agctctccaa gcgatgactg1500tctgtctagagacctttctg agcccacaga gagacgacat caaagcttcc tgaaacccag1560aatcctttttcctgggtttc tttgcccctt acaagatgta tgtgcatctc tgcaggaaga1620caatggtgttcagatagaaa gcaagttccc caaaggagat tacacatgct gtgacttggt1680tgtaaaaataaaggaatgta agaagagtga ggaccccacc acacctgagc cctccccagc1740agcaccctcgccagcacccc gcgatggagc agggagccct ggcctgtccg aagactgttc1800tgagtctcagcaaacgcctg caagatcttt gaccttgcaa gaagcactgg aagttcgtaa1860gcctcagttcatttctcgct cacaagaacg gctgaagaag cttgaacaca tggtccagca1920gaggaaagcccagcggaagg aggacctgag gcagaagcag agcctccttc ccatccgcac1980cagcaagaagcagttcacga ttccccatcc tctgagtgat aacttgttca aacccaaaga2040acggtgcatttcagagaagg agatgcatat gcgatctaag agaatctatg ataacttgcc2100ggaagttaaaaagaaaaaag aagaacaaag gaaaagggtg atcttacaaa gtaacagact2160ccgtgccgaagtcttcaaaa agcaattact ggaccagctc cttcaaagga atgcggtcta2220accacaggctgccctgctga ccacactacc tggacctggg aggacttcga atgctggata2280agccattaaacttagcatta tcttcatcat gggaaaacac ttattttact ttcgattttt2340tttttccataaaggaaaaca tcacttcctg aattactgac ccaagccaaa cagaaacaat2400aaccctcgagaaaataggtc aacaatctgt tgtggggaaa ccacctccat gtaacccact2460ggatacagtccccttaatgt ttttgcttct aaattgtacc ttttgcttct gatttcttct2520cccctgctgtttcctgccca tcagagaggc ctgatacaag caagtttgtt tacatccctg2580gggaatcttttacatcaaac ttttgggatc caaatccatc tccttttaaa tttcaatctc2640agcacctgccagttatgcaa atgccaaaat gtgggtcatc atatagtata tttgaaacct2700
ttctgaacatgtacaccacc caatgctaga ggctgacttg gaaaccggtg ggtgcaatgc2760
ccgaggctgtggaacaatcagcccatctct
gtcaccccgccccattcctcaccagagaaa
acttcagtgttttctacaatactcctcctg
agaaatagcctaatggtccaactttgctgt
atttataaatatgtctgtttgggaagctaa
aataaatgcaattattataa
ttgtgacctg gagcagtcag agggccctca2820
agaatccatt tctatggaag ctctgacgta2880
ccccgcccca ttaaaacagt tcttttgtta2940
ctgttcttcc aaatgtttat aatacacatt3000
gaacaagcta gtttttacaa cacaaatgga3060
aaaaaaa309權利要求
一段對DNA損傷敏感的抑癌基因序列,其特征是該編碼蛋白的氨基酸序列在進化上高度保守,在腫瘤基因組中缺失頻率高達70%,在多種癌細胞中表達沉默,并參與DNA損傷反應信號傳導,具有維持細胞周期節點的功能,并具有抗腫瘤活性,其人與鼠核酸序列分別見序列表1和序列表2。
2.根據權利要求1所述一段對DNA損傷敏感的抑癌基因序列,其特征是該基因序列 在SKBR3,MCF-7,MDA-MB-468,神經膠質瘤細胞系,肺癌細胞系,卵巢癌細胞系,宮頸癌細胞 系,以及結腸癌細胞系中表達沉默。
3.根據權利要求1所述一段對DNA損傷敏感的抑癌基因序列,其特征是該編碼蛋白 的氨基酸序列人與鼠相同氨基酸比例達65.4%。
全文摘要
本發明公開了一段對DNA損傷敏感的抑癌基因序列,屬于生物技術領域。該序列位于腫瘤基因組中的一個高頻缺失區域,在多種癌細胞中表達異常。該編碼蛋白的氨基酸序列在進化上高度保守,在腫瘤基因組中缺失頻率高達70%,在多種癌細胞中表達沉默,并參與DNA損傷反應信號傳導,具有維持細胞周期節點的功能,并具有抗腫瘤活性,用小分子RNA干擾技術抑制FATS基因的表達后,導致正常細胞的基因組穩定性被破壞,表現為DNA損傷后細胞周期G2節點功能受損。本發明為進一步的腫瘤基因治療和分子機制研究、以及與FATS蛋白三維結構為基礎的抗癌藥物開發提供了一個新的基礎。
文檔編號C12N15/12GK101798572SQ200910067829
公開日2010年8月11日 申請日期2009年2月6日 優先權日2009年2月6日
發明者李政 申請人:天津醫科大學附屬腫瘤醫院