專利名稱:瑞茲(riz)基因用于檢測和治療衛星染色體不穩定(msi)陽性腫瘤的制作方法
一、發明領域本專利發明涉及腫瘤領域,具體是利用RIZ腫瘤抑制基因來檢測和治療衛星染色體不穩定陽性(MSI+)腫瘤。
二、背景材料成視網膜細胞瘤蛋白(Retinoblastoma或RB)相關鋅手指(Zinc Finger)基因瑞茲(RIZ)是一個潛在的腫瘤抑制基因,它屬于PR(PRDI-BFI-RIZ-1)或SET(Suvar3-9,Enhancer-of zeste,Trithorax)相關蛋白家族,在染色體介導的基因激活和失活過程中起作用。此家族與染色體相關的基因激活或失活有關系。PR/SET區域家族在人類腫瘤中起重要作用,因為此家族中多個成員在腫瘤中有遺傳性改變。RIZ基因中的PR區域是與其它蛋白質相作用的位點并能與其自身羧基(C-端)的一個區域相結合。
RIZ基因一般有兩個蛋白質產物,RIZ1和RIZ2,其區別在于氨基端是否有PR區域。RIZ1(帶有PR區域)產物被認為是一個位于1號染色體短臂36區(1p36)的很強的潛在腫瘤抑制基因。1p36區在人類十二種以上腫瘤中有丟失。在多種腫瘤和腫瘤細胞株中,RIZ1而非RIZ2基因不再表達。這些腫瘤包括乳腺癌,肝癌,結腸癌,和神經內分泌系統腫瘤(He等,Cancer Research.58:4238-4244,1998;Jiang等,Int.J.Cancer.83:541-544,1999)。這些腫瘤的特性是RIZ1基因失活,而非RIZ1基因突變引起蛋白質結構變化。在這些腫瘤細胞中,外源性RIZ1基因表達導致細胞分裂周期在G2/M期阻斷,細胞凋亡,或二者兼有。然而在體內RIZ1表達在各種腫瘤中的作用還未被證實。
腫瘤發生是由于正常細胞內致癌基因遺傳性突變而形成的這一觀點已經被公認。這些突變引起遺傳不穩定性。在腫瘤中兩種主要遺傳不穩定性已經被確認,染色體不穩定性(CIN)和衛星染色體不穩定性(MSI)。CIN的主要特征是染色體異倍體和喪失異源性(LOH),相反MSI+腫瘤一般是染色體雙倍體,而在許多簡單的重復序列,衛星染色體中出現眾多不穩定性。
衛星染色體不穩定性被認為是由于細胞內脫氧核糖核酸(DNA)堿基錯誤配對修復系統失靈而造成的。這個系統在正常情況下,識別并修復在DNA復制中錯誤使用的堿基或堿基錯位。堿基配對錯誤修復機制的喪失引發突變進化和選擇過程,形成腫瘤。MSI陽性的腫瘤形成機制與衛星染色體重復序列錯位突變有關。當這些重復序列位于目標基因的編碼序列中時,錯位突變會引發腫瘤形成。Adnull或對照緩沖液,兩天后進行RIZ1,p53,或Apoptag細胞凋亡原位檢測(TUNEL分析)。
發明具體描述本發明提供一種抑制MSI陽性腫瘤生長的方法,包括在腫瘤中導入編碼有功能的RIZ多肽的DNA序列,并在腫瘤中表達足夠量的RIZ多肽以抑制腫瘤生長。象在發明實施例中展示的那樣,RIZ1多肽在體內和體外抑制MSI陽性腫瘤細胞和腫瘤生長。在具有RIZ多聚腺嘌呤(多聚A)錯位突變的MSI陽性腫瘤中,RIZ1多肽在體內和體外還具有誘導細胞凋亡的功能。
這里所指的衛星染色體不穩定性陽性腫瘤細胞或MSI陽性腫瘤細胞指細胞中至少20%的衛星染色體標記順序與正常細胞相比在長度上出現異常,更好的MSI陽性腫瘤是有40%以上測試過的衛星染色體出現異常;最好有60%以上出現異常。這些數據至少需在測定5個以上標記順序后得出。理想的情況是這些細胞在RIZ基因中有衛星染色體出現異常。然而由于在MSI陽性腫瘤中,RIZ1多聚A錯位突變出現的比例很高,不必要事先測定RIZ1是否有突變就可預測在大多數人群中會有有效的治療作用。
衛星染色體是簡單的遍布于染色體中的重復序列,包括一個,兩個,三個,或四個核苷酸。已經知道的有一系列標記順序是MSI陽性的標志(見Boland等,Cancer Res.58:5248-5257,1998)。而且市場上有現成的分析衛星染色體的引物。這些標記包括Boland等在上述文獻中提到的標志物組,單核苷酸重復的BAT25(基因庫Genbank序列9834508)和BAT26(基因庫Genbank序列9834505),雙核苷酸重復的D5S346(基因庫Genbank序列181171),D2S123(基因庫Genbank序列187953),和D17S250(基因庫Genbank序列177030)。其它合適的標記序列亦有描述,如Boland等在上述文獻中提到的,以及Mao等在Proc.Natl.Acad.Sci.USA 91:9871-9875,1994中提到的序列。在本發明中使用的標記序列是上述提到的五個標志物組。
衛星染色體不穩定性與很大一部分自發性和遺傳性腫瘤有關。本發明方法用于檢測MSI狀態和抑制自發性和遺傳性兩種腫瘤。
具體的講,MSI陽性已在頭頸癌(如未或極少分化的頭頸癌),結腸癌,甲壯腺癌,食道癌,胃癌,前列腺癌,子宮內膜癌,卵巢癌,子宮頸癌,乳腺癌,皮癌(擴散性皮癌),小細胞肺癌,非小細胞肺癌,和慢性骨髓癌(成骨細胞危機)等(見Claij等綜述,Exp.Cell.Res.246:1-10,1999)。
多數家族性的非息肉性結腸癌(HNPCC)也存在衛星染色體不穩定性。HNPCC是一種家族性腫瘤,占總結腸癌的10%。HNPCC的主要特點是腫瘤發生早,并同時有其它部位原發瘤,包括結腸,子宮內膜,卵巢,小腸,胃,尿道,和皮膚等。本發明方法尤其對HNPCC的檢測和治療有特別效用。
除了避免發生突變外,DNA錯配修復還決定用于腫瘤化療的DNA致變試劑的毒性。由于多種化療藥品,甲基化的試劑,如N-methyl-N’-nitro-nitroguanidine,N-methyl-N-nitrosourea,Streptozocin,temozolonide,和decarbazine;鉑化試劑,如Cisplatin和Carboplatin;堿基類似物,如6-thioguanine;及其他化療試劑,如busulfan,etoposide,和doxorubin等的殺死腫瘤細胞功能需要有正常的錯配修復系統,因此在MSI陽性的腫瘤細胞中進行化療效果不明顯。
利用腫瘤抑制基因進行腫瘤基因治療是一種簡單和能取代化療和放療的低毒性產品。正在進行的幾個臨床試驗將腫瘤抑制基因P53或RB基因利用逆轉錄病毒或腺病毒載體導入到帶有上述基因突變的腫瘤中(見Roth等,Oncology,13S5:148-153,1999)。然而在MSI陽性腫瘤中基本沒有RB或P53基因缺陷,因此不能用這些基因進行基因治療。至今還沒有發現一種有效用于MSI陽性腫瘤的基因治療方法。
因此有必要開發治療MSI陽性腫瘤的基因治療方法,并發現一種可靠的檢測MSI陽性腫瘤的標記,這個專利發明就能在這方面填補空白并有更多建樹。發明綜述本發明提供一種抑制衛星染色體不穩定性(MSI)陽性腫瘤生長的方法。這一方法將帶有編碼有功能的RIZ1多肽的DNA序列轉入到MSI陽性腫瘤中,并在腫瘤中表達足夠抑制腫瘤生長的RIZ1蛋白質。
同時此發明提供一種確定腫瘤MSI狀態的方法。這一方法通過確定RIZ1核酸基因中多聚腺嘌呤中腺嘌呤的數目來確定腫瘤是否為MSI陽性。RIZ1基因中存在非正常數目的腺嘌呤表明此腫瘤為MSI陽性。
圖例注釋
圖1表示人的RIZ蛋白質氨基酸順序(標識為hRIZ;SEQ ID No.4)與大鼠RIZ蛋白質氨基酸順序(標識為rRIZ;SEQ ID No.2)相關性比較。共同序列已標明。使用一氨基酸代號。在人與大鼠中不相同的氨基酸標識為“.”圖2在裸鼠異體腫瘤模型中利用AdRIZ1腺病毒載體對衛星染色體不穩定性陽性(MSI+)的結腸瘤進行基因治療。將帶有RIZ1基因突變的人類結腸瘤HCT116細胞注射到裸鼠的側腹部,治療前,帶有腫瘤的裸鼠根據腫瘤大小進行隨機分組。治療中在腫瘤內或腫瘤外周分別注射緩沖液(PBS),對照空白腺病毒載體(Adnull),帶p53基因的腺病毒載體(Adp53),或帶RIZ基因的腺病毒載體(AdRIZ1)。共注射四次,每次劑量為每個動物8×1010病毒顆粒。箭頭指示注射時間,每周兩次測量腫瘤體積,連續測量四周。
圖3在腺病毒轉導的腫瘤細胞中進行RIZ1,p53,和細胞凋亡的免疫組織化學染色分析。在體內已形成腫瘤的HCT116細胞在注射AdRIZ1,Adp53,
這里所述的腫瘤是指在局部腫瘤細胞的生長,可以是腫瘤原發位點或轉移位點。腫瘤細胞是指惡性轉化細胞,或在腫瘤,或轉移位點,或從腫瘤或轉移位點取出的腫瘤細胞。從腫瘤或轉移位點取出的腫瘤細胞可在體外培育多代。
這里所述的抑制腫瘤生長是指減緩腫瘤細胞生長速度,阻斷腫瘤細胞生長或在腫瘤內殺死腫瘤細胞,因此而使腫瘤生長速度與未處理的對照相比有所減緩。抑制生長亦指腫瘤的減小或消失或降低轉移能力。本技術領域的專業人士可用各種指標來確定腫瘤生長是否被抑制。
比如抑制腫瘤生長可以阻斷細胞生長周期。如實施例1所示,外源的RIZ1表達能使MSI陽性腫瘤細胞生長周期停留在G2/M期,不管這些細胞是否帶有RIZ基因多聚腺嘌呤重復序列錯位突變。
抑制腫瘤生長可以以直接或間接方式測定腫瘤大小來確定。如實施例2所示,外源的RIZ1表達能使MSI陽性腫瘤縮小。在腫瘤病人中,此類測量可用各種已知的顯影方法如核磁共振顯影,計算機軸向全息顯影,或X光照影。腫瘤生長也可間接測量。如測定血液中胚胎原抗原(CEA),前列腺特異抗原(PSA),或其它與腫瘤生長相關的腫瘤特異抗原。抑制腫瘤生長一般會導致延長生存和/或有益病人的健康,提高生活質量。
如下實施例1和實施例3所示,在MSI陽性腫瘤細胞株或腫瘤中,特別是在有RIZ基因多聚腺嘌呤重復序列錯位突變的MSI陽性腫瘤中,表達外源的RIZ1會引發細胞凋亡。這里用的引發細胞凋亡是指刺激以DNA斷裂為特征的一種程序性細胞死亡。細胞凋亡可以以已知的方式來確定。如實施例3所示,現有各種測試試劑盒利用原位組織化學雜交的方式來確定DNA片段的存在(如Apoptag試劑,由Intergen提供)。例外,如實施例1所示細胞凋亡亦可用熒光細胞分檢(FACS)的方法來確定。在FACS分析中存在的低于G1期DNA含量的細胞群表示這些處于細胞凋亡的細胞有DNA斷裂發生。
本發明適用于在MSI陽性腫瘤中引入能編碼RIZ1多肽的核酸分子,并表達有效劑量RIZ1蛋白質來治療腫瘤。這里所用的RIZ1多肽指具有RIZ1氨基酸序列的多肽。RIZ1多肽亦指這里所列4號序列(SEQ ID No.4)或其功能部分相同,或與其有一個或很小差異的序列,只要此序列具有抑制MSI陽性腫瘤或腫瘤細胞生長的功能。很小差異包括在4號序列中進行一個或多個氨基酸序列的增加,減少,或替代,但并不特別影響其抑制腫瘤或腫瘤細胞生長的功能。
克隆的人類RIZ基因序列(所列3號序列)編碼4號序列中的氨基酸序列。克隆的大鼠RIZ基因序列(所列1號序列)編碼2號序列中的氨基酸序列;小鼠RIZ基因序列(104號序列)已在美國專利號6069231,5831108,和5811304以及在Buyse等Proc.Natl.Acad.Sci.USA 92:4467-4471,1995中描述過。
一種可稱作RIZ1的多肽可與4號序列中描述的氨基酸序列有70%的相同之處,最好具有75%以上,包括80%,85%,90%,95%,98%,99%,或更多相同之處。理想的例子是從另一種哺乳動物中克隆的RIZ基因。如圖一所示,人的RIZ基因(所列4號序列)與大鼠RIZ基因序列(所列2號序列)有84%的相同之處。
已在本領域廣為接受的觀點是進化中保留下來的氨基酸或氨基酸區域比其它氨基酸或氨基酸區域更可能有更重要的生物學功能。因此可以推測用一個不具保留系數的氨基酸來替換一個在所有種類的RIZ多肽中保留下來的氨基酸將會帶來功能性災難,而用一個不具保留系數的氨基酸替換一個在各種類的RIZ多肽中變化大的氨基酸將不會對其功能有重大影響。
替換2號序列中的氨基酸可以是保留性的,也可以是非保留性的。保留性替換包括,但不限于用一個非極性氨基酸替代另一個非極性氨基酸,如用異亮氨酸,頡氨酸,丙氨酸,脯氨酸,苯丙氨酸,色氨酸,或蛋氨酸來替代亮氨酸;用一個帶電的氨基酸替代類似帶電的氨基酸,如天門冬氨酸替代谷氨酸,賴氨酸或組氨酸替代精氨酸;用一個不帶電荷的非極性氨基酸替代另一個不帶電荷的非極性氨基酸(如用甘氨酸,蘇氨酸,酪氨酸,胱氨酸,天門冬酰胺或谷酰胺替代絲氨酸;或用不同組分但帶有相似大小和形狀的氨基酸替代另一個,如用丙氨酸替代絲氨酸,用精氨酸替代蛋氨酸,或苯丙氨酸替代酪氨酸。
在RIZ多肽中增加序列包括,但不限于在氨基端,羥基端,或中間增加標記序列,此標記序列包括,但不限于功能序列,多聚組氨酸序列,GST序列,或類似序列及可分離的序列。這些序列可用來促進重組RIZ1表達或鑒別,包括分離。
對序列4中的RIZ1多肽修飾的事例包括正常的序列4的染色體正常異體,如序列102和103中所示RIZ1頭三個氨基酸變化。另一個染色體正常異體的事例為T969變成A969(969位的胸腺嘧啶變成腺嘌呤),導致氨基酸序列283由D變成E。T969異體估計比A969異體發生的幾率高一倍。序列4中的另一個染色體正常異體是704位的脯氨酸丟失。
在一種應用中,用在本發明使用方法在腫瘤中表達的RIZ1多肽由序列4的PR區域組成(此序列亦稱為序列99),或由與此序列具有95%以上相同的序列,如大鼠的RIZ1 PR區域組成。
在RIZ1氨基端有一個100多個氨基酸的區域叫PR區域,因為它與PRD1-BF1和Blimp-1蛋白的N-端具有42%的同源性。PR區域亦與Evi-1蛋白的N一端(見Morishita等,cell 54:831-840,1998;Morishita等,Oncogene,5:936-971,1990)和C.Elegans(細小線蟲)的egl-43蛋白的N-端(見Garriga等,Genes Devel.7:2097-2109,1993中圖13)具有同源性。
PR區域已被證明為RIZ1負調控作用所必需(見He等,Cancer Res.58:4238-4244,1998),并可能參與染色體介導的轉錄激活或抑制(Xie等,J.Biol.Chem.272:26360-26366,1997;Huang等,J.Biol.Chem.273:15933-15939,1998)。
總體來講,PR區域涵蓋100-120個氨基酸,有三個高度保留的位點,A,B,C群。每個有10-12個氨基酸,中間被20-35個氨基酸分開。每個A,B,C群由單一外顯子編碼。大鼠的RIZ1 PR區域序列2中(氨基酸36-151)和人類RIZPR區域(序列4中37-152,亦同序列99)基本相同,只是人的在70位氨基酸上是賴氨酸,而在相同位置上(69位),大鼠的是精氨酸。另外從DNA分析中得出編碼小鼠PR區域B和C群(序列號104和105)序列中推導的氨基酸順序(即序列105中的前75個氨基酸)與人類RIZ1中PR區域(即人類RIZ1序列99中42-116)完全相同。
RIZ1多肽還有幾個有趣的地方,包括與E1A腫瘤蛋白相似的RB結合位點;8個鋅手指序列;羧基端PR結合位點。N-端PR區域與C-端PR結合區域的相互作用可能為RIZ1形成同體或異體寡聚物所必需,亦可能參與與其它蛋白間的相互作用。
通過此發明所提供的方法,其它本行同仁會很容易決定一個經修飾序列4或其一部分后得到的RIZ1多肽是否具有抑制MIS陽性腫瘤或腫瘤細胞的功能。如實施例1和實施例3所示,一個能抑制體外MSI陽性腫瘤細胞生長的RIZ1多肽亦具有抑制MIS陽性腫瘤生長的功能。因此,可將一個修飾序列4或其一部分后得到的可編碼RIZ多肽的核酸序列導入MSI陽性腫瘤或MSI陽性腫瘤細胞,如HCT116,來決定其是否具有抑制腫瘤生長的功能。如果它仍具有抑制功能,則此核酸序列適用于本發明提供的方法。
可將帶有編碼RIZ多肽的核酸序列裝入適當的載體中用于在哺乳類動物中表達。合適的載體包括,但不限于病毒載體,如逆轉錄病毒(復制缺陷的MuLV,HTLV,和HIV載體),腺病毒載體,腺相關病毒載體,皰疹病毒載體,和非病毒載體,如病毒基因組,質粒DNA,和噬菌體質粒等(參見Kaplitt和Loewy,Viral Vectors.Gene Therapy and Neuroscience Applications.Acad.Press,San Diego,CA 1995;Chang,Somatic Gene Theraoy,CRC Press,Boca Raton,FL,1995)。克隆這些目的核酸的方法在同仁中已廣為所知。
腺病毒載體具有特殊的優越性,因為它們可以轉導處于生長期和靜止期的細胞,并能在體外大量培養,而且腺病毒載體不整合到細胞寄主的基因組上,具有更好的安全性。腺病毒載體已經被成功應用于轉導P53腫瘤抑制基因到腫瘤中,具有低毒性,高水平基因表達,和明顯治療效果(見Swisher等,J.Natl.Cancer.Inst.91:763-771,1999;Clayman,Seminars in Oncology2788:39-43,2000)。
合適的話,一個病毒載體或其它載體可通過在載體中加入組織特異性啟動子或增強子的方法用來在特定的組織中表達編碼RIZ基因的核酸(如Dai等,Proc.Natl.Acad.Sci.89:10892-10895,1992)。或者編碼RIZ基因的核酸不用載體而通過合適的可幫助轉錄和翻譯的核酸序列達到有效表達。
本技術領域中的技術人員可決定合適的可傳遞核酸分子的配方,如在載體類別(侵染性和非侵染性)和傳遞方式上作出合適選擇。合適的配方包括,但不限于如將核酸包含于脂質體中,將核酸與高價陽離子聚合物混合,將核酸分子與靶向性分子組合(如抗體,配體,融合性多肽,或HIV Tat蛋白質等)。基因治療方法,包括選擇合適載體,啟動子,和配方可在各種綜述中找到,如Anderson,Nature 392:25-30,1998。
編碼RIZ多肽的核酸可以各種途徑轉入到病人體內從而在腫瘤中表達有效劑量的蛋白質。在最佳狀態下,核酸轉入的途徑是局部性的,如通過腫瘤內或外周注射的方式達到。根據腫瘤的位置,局部導入可與手術同步進行或通過顯影方式指導導入儀器到腫瘤位點(如Swisher等,Supra,1999)。局部導入的優勢是載體沒有稀釋,因此會增加大多數腫瘤細胞能接觸到此核酸的機會。
導入編碼RIZ多肽的核酸的另一種方式是系統轉導,如腹下,靜脈注射,或皮下注射。系統轉導方法對治療擴散的腫瘤有優勢。
受體介導的DNA導入方式在將編碼RIZ多肽的核酸轉入到非腫瘤位點時有優勢。如一個病毒載體可與組織特異或腫瘤特異性配體或抗體以橋狀連接分子結合,導入體內后,病毒顆粒將在體內循環直到找到那些帶有特異性靶體的細胞進行結合和基因轉導。
本發明亦提供一種檢測MSI陽性特征的方法。其方法是確定腫瘤細胞中RIZ核酸中多聚腺嘌呤中腺嘌呤的個數。非正常數目的腺嘌呤數表明此腫瘤為MSI陽性。
如本文所述,在極大多數MSI陽性腫瘤細胞和細胞株中,包括結腸癌,胃癌,和子宮內膜癌細胞株中,存在多聚腺嘌呤錯位突變。相反在MSI陰性腫瘤細胞中,沒有檢測到RIZ多聚腺嘌呤錯位突變。因此檢測到腫瘤中含有RIZ基因多聚腺嘌呤錯位突變極高地預測此腫瘤為MSI陽性腫瘤。
通過檢查RIZ1 cDNA順序發現在外顯子8區域有兩處容易產生多聚腺嘌呤(PolyA)變化的高突變區。一個是在序列3的4393-4400中的A8,另一個是在序列3的4582-4590中的A9。RIZ基因A8多聚腺嘌呤序列位于含有鋅手指最多位點的C-端的上游,此處錯位突變造成翻譯時鋅手指斷開。A9序列在此同一鋅手指的下游,此處錯位突變將喪失RIZ蛋白C-端PR區域結合位點。
確定RIZ基因中A8或A9序列中腺嘌呤多少的方法在同行的同仁中廣泛知曉。例如,PCR擴增RIZ染色體DNA,RIZ轉錄DNA,然后進行單一核苷酸多型性(SSCP)分析,或直接進行DNA測序。在此實施例1和實施例2中有具體檢測多聚A數目的方法。
檢測的DNA樣品最好直接來源于腫瘤,如活檢組織。新鮮或處理后的組織切片亦可用來檢測。在特定的應用方法中,可分析尿液,血液,淋巴中,或培養后的腫瘤細胞。
由前所述,MSI陽性腫瘤比MSI陰性腫瘤對某些化療不敏感。因此在治療前確定腫瘤是否為MSI陽性很重要,這樣有利于選擇最佳治療方案。象這里描述的,MSI陽性腫瘤能被外源表達的RIZ1基因所抑制。因此RIZ基因治療可作為化療外的其它選擇,或與其它治療方法一起使用。
下述實施例只為了說明但不限制此發明的應用。實施例1、在MSI陽性腫瘤中RIZ1基因突變和外源RIZ基因表達的作用這個實施例表明在多種細胞起源的MSI陽性腫瘤中存在有高程度的RIZ1基因多聚A序列錯位突變。此實施例亦表明在含有RIZ基因多聚A序列錯位突變的MSI陽性腫瘤中導入能表達編碼RIZ多肽功能的核酸能夠導致細胞周期阻斷和腫瘤細胞凋亡。實驗材料和方法組織樣品和細胞株共研究了22個MSI陰性腫瘤細胞,其中8個的選擇是因為它們曾被確定有染色體不穩定性(CIN)表型,它們包括在1號染色體兩個相鄰的標記點D1S228(32.4摩爾根(cm))和D1S507(36.2cm)上喪失異源性(LOH)(Canzian等,Cancer Res.56:3331-3337,1996)。另14個腫瘤細胞在1號染色體上的LOH情況未知。3個MSI陰性腫瘤細胞株由美國標準細胞組織中心(ATCC)獲得,這三個株是MDAMB231,MDAMD435S,和SKBR3(乳腺癌),以前曾檢查過這些細胞中RIZ的表達(He等,Cancer Res.58:4238-4244,1998)。
另外研究了24個從家族型非肉息性結腸癌(HNPCC)病人身上取得的MSI陽性腫瘤(Aaltoren等,N.Eng.J.Med.338:1481-1487,1998),還研究了11個由ATCC獲得的MSI陽性腫瘤細胞株。它們是DLD1,LS411N,SW48,HCT116,LoVo,HCT15,和LS174T(結腸癌);MDAH2774,和SK-OV3(卵巢癌);AN3CA(子宮內膜癌);和DU145(前列腺癌)。喪失異源性(LOH)分析利用熒光標記衛星染色體方法分析正常和原發腫瘤細胞對。引物序列由基因組數據庫獲得(http://www.gdb.org)。衛星染色體擴增條件為在15ul反應液中有10ng相應的染色體DNA,8pMol引物(5’引物有熒光標記),100nM的四種脫氧核苷酸三磷酸(dNTPs),0.6單位(U)DNA聚合酶(AmpliTaq Gold,PE Biosystems,Foster City,CA),10mM Tris.HCL(pH 8.3),50mM氯化鉀(KCl),2mM氯化鎂(MgCl2)。PCR產物在377XL序列分析儀上進行分析(PE Biosystems)。染色體各體的大小和熒光強度由GENESCAN和GENOTYPER軟件(PE Biosystems)自動檢測。由分析染色體各體的強度比例關系即可計算LOH的程度(Canzian等,CancerRes.56:3331-3337,1996)。如果一個樣品染色體各體的比例小于0.67或大于1.5,則被認為存在LOH。
由于很多HNPCC腫瘤是MSI陽性,單一核苷酸多樣性(SNPs)方法亦可用來分析24個HNPCC正常和腫瘤DNA對。引物序列由人類SNP數據庫獲得(http://www.genome.wi.mit.deu/snp/human/index.html)。SNP擴增條件為在25ul反應液中有20ng相應的染色體DNA,8nMol相應的引物,100nM的四種脫氧核苷酸三磷酸(dNTPs),1.0單位(U)DNA聚合酶(AmpliTaq Gold,PE Biosystems,Foster City,CA),10mM Tris.HCL(pH8.3),50mM氯化鉀(KCl),2mM氯化鎂(MgCl2)。PCR產物經核酸外切酶1和蝦堿性磷酸化酶處理后,直接用其中一個引物進行單方向DNA測序。DNA測序不好的樣品再用另一個引物進行測序。LOH確定方式與上述衛星染色體分析方法相似。突變分析 目標基因的突變經直接測染色體PCR產物順序進行。為方便直接測序,所有引物都帶有M13前向(TGTAAAACGACGGCCAGT,序列號107)和M13反向(CAGGAAACAGCTATGACC,序列號108)序列。PCR條件是在25ul反應液中有20ng相應的染色體DNA,8nMol相應的引物,100nM的四種脫氧核苷酸三磷酸(dNTPs),1.0單位(U)DNA聚合酶(AmpliTaq Gold,PEBiosystems,Foster City,CA),10mM Tris.HCL(pH8.3),50mM氯化鉀(KCl),2mM氯化鎂(MgCl2)。PCR產物經核酸外切酶1和蝦堿性磷酸化酶處理后,直接用其中一個引物進行單方向DNA測序。基因表達分析 用于表達的RNA先用RNAease試劑盒(Qiagen,Chatsworth,CA)抽提。反轉錄時用Superscript RT(Life Technologys,Rockville,MD),然后用GeneAmp Gold RNA PCR試劑盒(PE Biosystems)進行cDNA擴增。用于確定RIZ1和RIZ2的特異性引物已有描述(見He等,Supra,1998)。對照為3-磷酸甘油醛脫氫酶(GADPH)特異性引物(Leygue等,Cancer Res.58:1348-1352,1998)。免疫沉淀和免疫轉移膜雜交分析 根據Buyse等在Proc.Natl.Acad.Sci.92:4467-4471(1995)中描述的方法進行免疫沉淀和免疫轉移膜雜交分析。用對應于RIZ2 N-端的RIZ抗體血清1637或免疫前血清(對照)將細胞裂解物進行免疫沉淀。沉淀物經5%的SDS電泳中分離,然后用對應于RIZ2 N-端的RIZ抗體血清KGSE進行免疫轉移膜雜交分析。分析外源性RIZ1在細胞中的表達對細胞周期和細胞凋亡的影響 外源性RIZ1基因的表達對細胞周期和細胞凋亡的作用分析方法詳見He等,Supra,1998。具體方法簡述如下。先將2×105結腸癌細胞種在6cm的培養皿中,然后用重組腺病毒載體侵染(病毒/細胞比率為100)。48小時后,對細胞進行DNA量分析。實驗結果1號染色體短臂丟失圖譜很多自發性結腸癌在1號染色體端點上有大致40cm大小的丟失。在這個區域有些腫瘤又回到具有異源性(見Chadwick等,Proc.Natl.Acad.Sci.97:2662-2667,2000中圖1)。在這個區域有幾個潛在的腫瘤基因和腫瘤抑制基因,包括在46.2cm的PAX7,在46.2cm的PLA2,在52.4cm的E2F2,和在71cm的MYCL。與MSI陰性腫瘤相比,有共同丟失區域的腫瘤更限于MSI陽性的HNPCC病人腫瘤。雖然大多數位于1號染色體末端的SNP標志物確定性不強,但位于32.2cm的標志物WIAF-481是一個常見的丟失位點,它在53%(15個中有8個,8/15)已確定的HNPCC腫瘤中有LOH。染色體各體在SNP中的不平衡可以重復檢測到,表明這個位點在檢測染色體丟失圖譜,特別是MSI陽性腫瘤中很有價值。相比之下,在22.9cm處的D1S450(1/11)和在32.4cm處的D1S228(1/8)LOH的比率就低得多。確定RIZ是1號染色體短臂變化的潛在基因我們對位于1 pTel 32.2cm處的功能基因進行突變分析,RIZ基因位于基因圖99號的32.2cm處(http://www.ncbi.nlm.nih.gov/genemap99)。由酵母人工染色體分析得出RIZ離D1S228標記點370kb遠(Leygue等,Supra,1998)。RIZ基因以3’到5’方向遠離1號染色體短臂末端。在HNPCC腫瘤中,從WIAF-481到RIZ 3’到RIZ 5’方向LOH頻率逐漸減少。對RIZ基因內三個位點,包括外顯子8中密碼子脯氨酸704丟失,在4號內顯子中的CA重復序列,和在4號外顯子邊的SNP(在4號外顯子3’端18個堿基的GAT變成GAC)進行了多型體分析。這些RIZ基因標記的LOH頻率分別為21%(3/14),9%(1/11),和0%(0/8)。5393T腫瘤表現在8號外顯子Pro-704有LOH,但在其它位點沒有變化,與其在RIZ基因中丟失斷開位點相一致。在MSI陰性但未事先做1號染色體短臂LOH分析選擇的腫瘤中發現這些位點的LOH頻率分別為30%(4/13),23%(3/13),和60%(3/5)。7T-OSU腫瘤在RIZ基因Pro-704上有LOH,但保留了4號內顯子中的CA序列的異源性,又表明其斷裂點在RIZ基因內部。由于RIZ基因位于常見的LOH位點附近,同時在RIZ基因中發現有斷裂點,提示RIZ基因在家族性和自發性結腸癌中是1號染色體短臂36位異常的潛在目的基因。
檢查RIZ基因編碼序列發現在其8號外顯子中有高突變的A8和A9多聚體。在37.5%(9/24)的MSI陽性HNPCC腫瘤中發現有A8(1個)和A9(8個)多聚體位點錯位突變。另外在幾個MSI陽性細胞株中有6個(HCT116,LoVo,LS411N,LS174T,MDAH2774,和AN3CA)有A9多聚體位點錯位突變。在HCT116和AN3CA細胞株中,突變是雙重的/半雙重的,是由于兩個染色體各體都參與的結果。在23個MSI陰性腫瘤中未發現有類似的錯位突變,表明這些位點只是在MSI陽性腫瘤中是突變熱點。RIZ錯位突變在腫瘤生成過程中有選擇優勢為探討在其它基因中類似的單核苷酸重復序列是否有相似的突變比例,我們分析了PMS2和DNA聚合酶中的A8多聚體。這些A8多聚體在MSI陽性腫瘤中沒有任何錯位突變(P=0.0005)。在MSI陽性腫瘤中又進行RECQL,BLM,和KIAA0355基因A9序列分析。在24個MSI陽性腫瘤中,只有一個在RECQL和KIAA0355基因中有一個堿基丟失(P=0.005)。綜合起來,上述數據表明RIZ基因錯位突變是結腸癌腫瘤生成中特異的進化選擇。細胞株中RIZ基因表達水平下降以前的數據表明RIZ基因有兩個轉錄產物,RIZ1和RIZ2(He等,Supra,1998)。在多種與1p36有關的腫瘤中,RIZ1表達喪失,而RIZ2表達不變(He等,Supra,1998; Jiang等,Int.J.Cancer 83:541-547,1999;Jiang等,Histol.Histopathol.15:109-117,2000)。為確定在有RIZ突變的結腸癌中RIZ表達是否受到影響,我們用RT-PCR方法來檢測RIZ1表達(He等,Supra,1998;Jiang等,Supra,1999;Jiang等,Supra,2000)。由于RIZ2全部包含在RIZ1中,因此無法單獨測定RIZ 2表達。 我們只能測RIZ1和RIZ1+RIZ2表達水平。乳腺癌細胞株MDAMB435S作為只表達RIZ2的對照,而MDAMB21作為表達RIZ1+RIZ2的對照(He等,Supra,1998)。
在檢測的11個MSI陽性結腸癌細胞株中有4個RIZ1表達降低或喪失而RIZ2表達存在,支持以前觀察到的RIZ1和RIZ2表達不平衡與細胞變化有關(He等,Supra,1998;Jiang等,Supra,1999;Jiang等,Supra,2000)。在3個RIZ1表達有變化的細胞中,包括HCT116,存在有多聚腺苷酸的錯位突變。在這些細胞中,LS411N只表達RIZ2 ,LoVo中RIZ1表達降低,SW48中RIZ1表達降低,但沒有RIZ基因多聚腺苷酸的錯位突變。整個RIZ基因很大,有8 Kb,可能在這個細胞中在RIZ基因其它地方,或在啟動子中有基因突變,影響基因表達。
在突變陽性的HNPCC腫瘤凍組織中抽提的RNA沒有RIZ1表達的特別變化,這可能是由于在抽提腫瘤的RNA時受到正常組織的污染。細胞株中滴度試驗表明,即使在90%的RIZ2中含有10%的RIZ1/RIZ2 RNA,RIZ1亦會被擴增。錯位突變導致RIZ蛋白質表達中斷由于在RIZ基因核苷酸4700位置的A9處的一個堿基丟失,造成一個融合RIZ1和RIZ2蛋白缺少C-端219個氨基酸,但增加了76個新氨基酸,最終表達的RIZ1和RIZ2蛋白比正常少157個氨基酸。為確定突變的染色體各體確實表達這樣的突變RIZ蛋白質,在有錯位突變的HCT116細胞中進行免疫沉淀和免疫轉移膜雜交實驗。我們首先確定在DLD1細胞中表達正常的RIZ1和RIZ2蛋白。在以前研究的所有腫瘤細胞株中,RIZ1表達量極低,很難檢測到,而RIZ2量很高(He等,Supra,1998;Buyse等,Supra,1995;Liu等,J.Biol.Chem.272:2984-2991,1997)。與此同時,在DLD1細胞中檢測到250KD的RIZ2,而沒有看到RIZ1。相反在HCT116細胞中,而全長的RIZ2不存在,而看到一個230KD的RIZ2品種,與錯位突變形成的RIZ2大小相一致。雖然此實驗并未證明RIZ1表達,但由RIZ2的結果可以推測RIZ1亦有翻譯中斷。RIZ1在結腸腫瘤細胞株中表達引起細胞周期阻斷和細胞凋亡 腺病毒介導的RIZ1表達已被證明在非MSI陽性的乳腺癌和肝癌中能造成G2/M細胞周期阻斷和細胞凋亡。我們探討了腺病毒介導的RIZ1表達在HCT116和DLD1結腸癌細胞株中的作用。免疫轉移分析確定在AdRIZ1侵染后(MOI=100),兩個細胞株都有全長的RIZ1蛋白表達。48小時后,兩個細胞中處于G2/M期的細胞量明顯增加。在AdRIZ1侵染后48小時和72小時,HCT116細胞中有低于G1期DNA含量的細胞,顯示有細胞凋亡發生(表一)。但在DLD1細胞中這類細胞很少,結果表明RIZ1在HCT116細胞中引起G2/M阻斷和細胞凋亡,而在DLD1細胞中只引起G2/M阻斷。表一 Table 1.RIZ1在結腸腫瘤細胞株JCT116和DLD1中表達引起細胞周期阻斷和細胞凋亡。
在AdRIZ1或AdNull病毒侵染72小時后,細胞進行DNA組分分析。表中數據為Ad RIZ1與AdNull侵染的細胞間差異百分比。
AdRIZ1侵染后比AdNull侵染增加的數目以正值表示,減少數以負值表示。數據為三次實驗的平均值和標準誤差。
上述結果表明在腫瘤中RIZ1功能可能由于至少兩種染色體變化而受影響。在MSI陽性腫瘤中,在基因3’端的錯位突變影響其C-端PR結合位點與N-端PR區域的相互作用。在MSI陰性腫瘤中(CIN途徑),RIZ1 PR區域的突變或丟失亦有同樣效果。在一系列檢測的腫瘤中,RIZ基因因LOH或錯位突變而受影響,表明二者在與RIZ相關的腫瘤生成中起作用。
實施例2、在MSI陽性的胃癌中的RIZ多聚核苷酸錯位突變這個實施例表明RIZ多聚核苷酸錯位突變在MSI陽性的胃癌中發生率很高。
為檢測RIZ在MSI陽性腫瘤中的作用,我們檢測了一系列從朝鮮病人身上取得的MSI陽性胃癌樣品,并通過PCR和SSCP以及測序等方法來分析RIZ基因A8和A9的變化。我們亦檢測了一系列MSI陽性細胞株,包括結腸癌(HCT116,SW-48,LoVo,HCT8),前列腺癌(DU145),乳腺癌(Cal-51),子宮癌(AN3CA,SK-UF18B)。以MSI陰性的SW620作為對照。
在33個MSI陽性的胃癌中,有16個(占48%),在13個MSI陽性的細胞株中有7個(占54,其中有HCT116,HCT8,LoVo,LS441N,LSL80,LSI74T,和AN3CA)有RIZ突變。這些突變是體細胞突變,因為在正常的相應細胞中無此突變。除了在KSI9細胞中有A8突變外,其他的都是A9位點突變。在70個MSI陰性的胃癌中未發現有RIZ突變,表明這些突變具有MSI陽性腫瘤特異性。
在21例RIZ突變中(16個胃癌和7個細胞株),4例(KS15,KS19,HCT116,AN3CA)是兩個染色體同時突變。KS15和HCT116是同源/半同源突變。KS19在一個染色體上的A8和A9中各有一個堿基丟失,另一個染色體上在A9位點有一個堿基丟失而AN3CA在一個染色體上A9中有一個堿基丟失,另一個染色體上在A9位點有二個堿基丟失。
為確定在MSI陽性胃癌中是否存在基因組丟失,我們在16個有錯位突變的胃癌中選14個,在17個沒有錯位突變的胃癌中選16個進行LOH檢測。他們都有正常的相應組織DNA。RIZ蛋白由于在基因8號外顯子的704位氨基酸丟失三個堿基造成704號脯氨酸的丟失多樣性,這一點可用來檢測LOH。在已經分析過的6個腫瘤中發現有2例可檢測到LOH,KS07和KS20,二者在一個染色體上有錯位突變。一共檢查到4個胃癌(KS07,KS15,KS19,KS20)和兩個細胞株(HCT-116,AN3CA)有雙染色體RIZ失活。
此例中檢測到的所有RIZ錯位突變都預測RIZ蛋白在其C-端中斷。在序列3的A9中丟失一個堿基導致在其后76位有終止密碼,其蛋白缺少C-端219個氨基酸;在A9中中丟失二個堿基導致在其后5位有終止密碼;在A8位中丟失一個腺嘌呤導致在其后2位有終止密碼,其蛋白缺少C-端293個氨基酸。
已知RIZ1的C-端有PR區域結合位點,可能在與RIZ1結合中起作用(Huang等,J.Biol.Chem.273:15933-15440,1998)。因而此C-端的缺失很可能會嚴重影響RIZ1功能。
觀察到的在MSI陽性胃癌中高頻率RIZ錯位突變(48%腫瘤,54%細胞株)表明RIZ失活與MSI陽性胃癌轉化有關。經常發現在RIZ中有雙個染色體的錯位突變或基因組突變支持這一預測。另外高頻率RIZ錯位突變亦在其他腫瘤,包括結腸癌(示實施例1)中發現過。實施例3、RIZ表達在體內抑制MSI陽性腫瘤發生,并導致腫瘤細胞凋亡為確定RIZ基因治療在MSI陽性治療中的效果,我們研究了在已經建立的固體腫瘤中,重組RIZ1表達對腫瘤生長的影響,同時也研究了P53表達的作用。
從ATCC取得的HCT116結腸癌細胞株帶有同源性RIZ1突變和野生型P53基因。將其培養在Delbecco調配的Eagle培養基內,添加10%的胎牛血清。
無胸腺雌性裸鼠(Nu/Nu)由Jackson實驗室(Bar Harbor,Maine)購得。在100微升PSB中的2×106HCT116腫瘤細胞接種到每一個裸鼠上,6天后腫瘤開始出現,大致直徑為0.5cm。治療前,將動物根據腫瘤大小隨機分組,每組5-11個。已長腫瘤的裸鼠接受腫瘤內或腫瘤外周注射PBS,或腺病毒懸浮液(8×1010病毒顆粒/劑量),每隔三天注射一次,共注射4次。
缺少基因插入的空腺病毒載體AdNull(由國家腫瘤研究所Prem Seth提供),或表達RIZ1的AdRIZ1,或表達p53蛋白的Adp53,腺病毒載體的制備,擴增,和滴度測定在293細胞上進行,見He等,Cancer Res.58:4328-4244,1998。
每周測量一次腫瘤大小,腫瘤體積計算公式為a×b2×0.5,其中a是長度,b是寬度,單位為毫米。用Student T測試來比較不同治療組在每天的腫瘤體積。
如圖2所示,在PBS,AdNull,Adp53治療的小鼠中腫瘤生長迅速,相反用AdRIZ1腫瘤的小鼠腫瘤生長卻明顯減緩。
我們亦確定了在建立的腫瘤中RIZ1和p53蛋白表達與細胞凋亡的關系。先將HCT116細胞接種到裸鼠中,讓其生長一個月,再在腫瘤中注射病毒。注射兩天后,將腫瘤取出,固定在10%福爾馬林溶液中,然后制成石蠟切片,進行組織免疫染色來檢定p53蛋白,RIZ表達及DNA片段的存在。
用于RIZ免疫染色的1637抗體血清需稀釋1∶400倍,用于p53蛋白染色的兔AB545抗血清稀釋1∶200倍。二級抗體是過氧化物標記的羊抗兔IgG。檢測細胞凋亡時,按試劑盒使用說明用Apotag原位雜交檢測試劑盒(Intergen,Purchase,NY)進行。簡單的講,去石蠟后,組織再充水,用蛋白酶處理,并與TdT培養,用Avidin-過氧化物酶聯合試劑和DAB染色。切片用Hematoxylin反向染色。
如圖3所示,大部分注射過p53或RIZ1病毒的腫瘤在注射部位附近分別在細胞核內表達p53或RIZ1蛋白質。在AdRIZ1病毒注射過的腫瘤,而非PBS,AdNull,或Adp53注射過的腫瘤中有很多很強的Apotag染色,證明在RIZ1表達的細胞中有明顯的細胞凋亡發生。
上述結果與在例1中體外觀察到的結果相一致,這里的動物試驗表明用RIZ基因表達系統來處理MSI陽性腫瘤可抑制腫瘤生長并引發腫瘤細胞凋亡。
所有上述所引述的文獻,參考資料,和專利都在此有備案以供參考。
雖然本發明由上述三個實施例證明,讀者應明白對上述三個實施例可做各種修改,但不離開本發明的宗旨。本發明只限于發明專利權利要求所涵蓋的范圍。
參考資料Aaltonen,et al.,1998,N.Engl.J.Med.338,1481-1487Anderson,1998,Nature 392:25-30Boland,C.R.,et al.,1998,Cancer Res.58,5248-57.Buyse,I.M.,et al.,1995,Proc.Natl.Acad.Sci.U.S.A.92,4467-4471Canzian,F.,et al.,1996,Cancer Res,56,3331-7Chadwick,R.B.,et al.,2000,Proc.Natl.Acad.Sci.USA.97,2662-2667Chang,Somatic Gene Theraoy,CRC Press,Boca Raton,FL,1995Claij,et al.,1999,Exp.Cell.Res.246,1-10Clayman,2000,Seminars in Oncology 2788,39-43Dai,et al.,1992,Proc.Natl.Acad.Sci.89,10892-10895Garriga,et al.,1993,Genes Devel.7,2097-2109He,L.,et al.,1998,Cancer Res.58,4238-4244Huang,S.,et al.,1998 J.Biol.Chem.273,15933-15940Jiang,G.-L.,et al.,1999,Int.J.Cancer 83,541-547Jiang,G.-L.and Huang,S.2000,Histol.Histopathol.15,109-117Kaplitt and Loewy,Viral Vectors.Gene Therapy and NeuroscienceApplications.Acad.Press,San Diego,CA 1995;Leygue,E.,et al.,1998,Cancer Res,58,1348-52.Liu,L.,et al.,1997,J.Biol.Chem.272,2984-2991Mao et al.,1994,Proc.Natl.Acad.Sci.USA 91,9871-9875Morishitaet al.,1998,cell 54,831-840Morishita et al.,1990,Oncogene,5,936-971Roth et al.,1999,Oncology,13S5,148-153Swisher,S.G.,et al.,1999,J.Nat.Cancer Ins.91,763-71Xie,M.,et al.,1997,J.Biol.Chem.272,26360-26366.
序列表所列序列均在本申請人的另一篇專利申請U.S.08/516,859(1995年8月18日)中有描述。SEQ ID NO.1(ⅰ)序列特征(A)長度6171堿基對 (B)類型核酸(C)股鏈雙 (D)結構線性(ⅱ)特征(A)命名/關鍵詞CDS (B)位置157-5275(ⅹⅰ)序列描述SEQ ID NO.1:GCCAAGATGG CGGCGGCGCG GCCGCGGGCG CCAGGGCGAC GGCGGCGGCT GAGGCTCTGG 60GCTCGCTGAA GCGTTGGCAC GTCGCGCTCT GGGCTCATGT AATCAAAGAA GTTTCTTTGT120TGTGTGTATC TTCACAGAAC ACAACAGGAA TTGAAA ATG CAT CAG AAC ACT GAG 174Met His Gln Asn Thr Glu1 5TCT GTG GCA GCC ACT GAG ACT CTG GCT GAG GTA CCT GAA CAT GTG CTT 222Ser Val Ala Ala Thr Glu Thr Leu Ala Glu Val Pro Glu His Val Leu10 15 20CGA GGA CTT CCA GAG GAA GTA AGA CTT TTC CCA TCT GCA GTC GAC AAG 270Arg Gly Leu Pro Glu Glu Val Arg Leu Phe Pro Ser Ala Val Asp Lys25 30 35ACT CGG ATT GGT GTC TGG GCT ACT AAA CCA ATT TTA AAA GGG AAA AAG 318Thr Arg Ile Gly Val Trp Ala Thr Lys Pro Ile Leu Lys Gly Lys Lys40 45 50TTT GGG CCA TTT GTT GGT GAT AAG AAG AAG AGA TCC CAG GTT AGG AAT 366Phe Gly Pro Phe Val Gly Asp Lys Lys Lys Arg Ser Gln Val Arg Asn55 60 65 70AAT GTG TAC ATG TGG GAG GTC TAC TAC CCA AAT TTG GGG TGG ATG TGC 414Asn Val Tyr Met Trp Glu Val Tyr Tyr Pro Asn Leu Gly Trp Met Cys75 80 85ATT GAT GCC ACC GAT CCG GAG AAG GGC AAC TGG CTA CGC TAT GTG AAC 462Ile Asp Ala Thr Asp Pro Glu Lys Gly Asn Trp Leu Arg Tyr Val Asn90 95 100TGG GCT TGC TCA GGA GAA GAG CAG AAT TTA TTT CCA CTG GAA ATC AAC 510Trp Ala Cys Ser Gly Glu Glu Gln Asn Leu Phe Pro Leu Glu Ile Asn105 110 115AGA GCC ATT TAC TAT AAA ACC TTA AAG CCA ATC GCG CCT GGC GAG GAG 558Arg Ala Ile Tyr Tyr Lys Thr Leu Lys Pro Ile Ala Pro Gly Glu Glu120 125 130CTC CTG GTC TGG TAC AAT GGG GAA GAC AAC CCT GAG ATA GCA GCT GCG 606Leu Leu Val Trp Tyr Asn Gly Glu Asp Asn Pro Glu Ile Ala Ala Ala135 140 145 150ATT GAG GAA GAG CGA GCC AGC GCC CGG AGC AAG CGG AGC TCC CCG AAG 654Ile Glu Glu Glu Arg Ala Ser Ala Arg Ser Lys Arg Ser Ser Pro Lys155 160 165AGC CGC AGA GGG AAG AAG AAA TCA CAC GAG AAC AAA AAC AAA GGC ATC 702Ser Arg Arg Gly Lys Lys Lys Ser His Glu Asn Lys Asn Lys Gly Ile170 175 180AGA ACC CAC CCC ACA CAG CTG AAG GCA AGT GAG CTG GAC TCT ACC TTT 750Arg Thr His Pro Thr Gln Leu Lys Ala Ser Glu Leu Asp Ser Thr Phe185 190 195GCA AAC ATG AGG GGC TCT GCA GAA GGT CCA AAA GAA GAG GAT GAG AGG 798Ala Asn Met Arg Gly Ser Ala Glu Gly Pro Lys Glu Glu Asp Glu Arg200 205 210CCT TTG GCT TCG GCA CCT GAG CAG CCA GCC CCT CTG CCG GAG GTG GGG 846Pro Leu Ala Ser Ala Pro Glu Gln Pro Ala Pro Leu Pro Glu Val Gly215 220 225 230AAT CAA GAT GCA GTT CCA CAG GTG GCC ATC CCT CTC CCT GCC TGC GAG 894Asn Gln Asp Ala Val Pro Gln Val Ala Ile Pro Leu Pro Ala Cys Glu235 240 245CCA CAG CCA GAG GTA GAT GGG AAA CAA GAA GTC ACA GAC TGT GAG GTC 942Pro Gln Pro Glu Val Asp Gly Lys Gln Glu Val Thr Asp Cys Glu Val250 255 260AAT GAT GTG GAG GAA GAG GAG CTG GAA GAG GAA GAG GAG CTG GAA GAG 990Asn Asp Val Glu Glu Glu Glu Leu Glu Glu Glu Glu Glu Leu Glu Glu265 270 275GAG GAG GAG GAG GAG TTG GGA GAA GAT GGG GTA GAA GAA GCA GAC ATG 1038Glu Glu Glu Glu Glu Leu Gly Glu Asp Gly Val Glu Glu Ala Asp MetCCG AAT GAA AGC TCT GCG AAA GAG CCG GAG ATC CGG TGT GAA GAA AAG 1086Pro Asn Glu Ser Ser Ala Lys Glu Pro Glu Ile Arg Cys Glu Glu Lys295 300 305 310CCA GAA GAC TTA TTA GAA GAG CCA CAG AGC ATG TCG AAT GAA GCT CGT 1134Pro Glu Asp Leu Leu Glu Glu Pro Gln Ser Met Ser Asn Glu Ala Arg315 320 325GAA GAC TCT CCA GAC GTG ACC CCT CCT CCC CAC ACT CCC AGA GCT AGA 1182Glu Asp Ser Pro Asp Val Thr Pro Pro Pro His Thr Pro Arg Ala Arg330 335 340GAG GAG GCC AAC GGT GAT GTA CTT GAG ACA TTT ATG TTT CCG TGT CAG 1230Glu Glu Ala Asn Gly Asp Val Leu Glu Thr Phe Met Phe Pro Cys Gln345 350 355CAC TGT GAA AGA AAA TTT GCA ACG AAG CAG GGG CTA GAG CGT CAC ATG 1278His Cys Glu Arg Lys Phe Ala Thr Lys Gln Gly Leu Glu Arg His Met360 365 370CAC ATC CAC ATT TCT ACC ATC AAT CAT GCT TTC AAG TGC AAG TAC TGT 1326His Ile His Ile Ser Thr Ile Asn His Ala Phe Lys Cys Lys Tyr Cys375 380 385 390GGG AAA CGG TTT GGC ACA CAG ATT AAC AGG AGG CGG CAT GAA CGG CGC 1374Gly Lys Arg Phe Gly Thr Gln Ile Asn Arg Arg Arg His Glu Arg Arg395 400 405CAC GAA ACG GGG TTG AAG AGA AGA CCC AGC ATG ACT TTA CAG TCC TCA 1422His Glu Thr Gly Leu Lys Arg Arg Pro Ser Met Thr Leu Gln Ser Ser410 415 420GAG GAT CCA GAT GAT GGC AAG GGG GAA AAT GTT ACT TCT AAA GAT GAG 1470Glu Asp Pro Asp Asp Gly Lys Gly Glu Asn Val Thr Ser Lys Asp Glu425 430 435TCA AGT CCA CCT CAA CTC GGG CAA GAC TGT TTG ATA TTG AAC TCA GAG 1518Ser Ser Pro Pro Gln Leu Gly Gln Asp Cys Leu Ile Leu Asn Ser Glu440 445 450AAA ACC TCA CAG GAA GTA CTG AAT TCA TCT TTT GTG GAA GAA AAT GGT1566Lys Thr Ser Gln Glu Val Leu Ash Ser Ser Phe Val Glu Glu Asn Gly455 460 465 470GAA GTT AAA GAA CTT CAT CCG TGC AAA TAC TGC AAA AAG GTA TTT GGA1614Glu Val Lys Glu Leu His Pro Cys Lys Tyr Cys Lys Lys Val Phe Gly475 480 485ACT CAC ACC AAT ATG AGA CGA CAT CAG CGT AGA GTT CAT GAG CGC CAC1662Thr His Thr Asn Met Arg Arg His Gln Arg Arg Val His Glu Arg His490 495 500CTG ATT CCC AAA GGT GTC AGG CGA AAA GGA GGA CTT CTG GAA GAG CCA1710Leu Ile Pro Lys Gly Val Arg Arg Lys Gly Gly Leu Leu Glu Glu Pro505 510 515CAG CCA CCA GCA GAG CAG GCT CCA CCC TCC CAG AAT GTC TAT GTC CCA1758Gln Pro Pro Ala Glu Gln Ala Pro Pro Ser Gln Asn Val Tyr Val Pro520 525 530AGC ACA GAG CCA GAG GAG GAA GGG GAA ACA GAT GAC GTG TAC ATC ATG1806Ser Thr Glu Pro Glu Glu Glu Gly Glu Thr Asp Asp Val Tyr Ile Met535 540 545 550GAC ATT TCT AGC AAC ATC TCT GAA AAC CTA AAT TAC TAT ATT GAC GGT1854Asp Ile Ser Ser Asn Ile Ser Glu Asn Leu Asn Tyr Tyr Ile Asp Gly555 560 565AAG ATT CAG ACC AAC AGC AGC ACT AGT AAC TGT GAT GTG ATT GAG ATG1902Lys Ile Gln Thr Asn Ser Ser Thr Ser Asn Cys Asp Val Ile Glu Met570 575 580GAG TCT AAT TCT GCA CAC TTG TAT GGC ATA GAC TGT CTG CTC ACT CCA1950Glu Ser Asn Ser Ala His Leu Tyr Gly Ile Asp Cys Leu Leu Thr Pro585 590 595GTG ACC GTG GAG ATT ACT CAG AAC ATA AAG AGC ACT CAG GTC TCT GTG1998Val Thr Val Glu Ile Thr Gln Asn Ile Lys Ser Thr Gln Val Ser Val600 605 610ACA GAT GAT CTT CTC AAA GAC TCT CCC AGC AGC ACA AAT TGT GAG TCT 2046Thr Asp Asp Leu Leu Lys Asp Ser Pro Ser Ser Thr Asn Cys Glu Ser615 620 625 630AAG AAA CGG AGG ACT GCC AGT CCA CCT GTG CTC CCC AAA ATT AAA ACG2094Lys Lys Arg Arg Thr Ala Ser Pro Pro Val Leu Pro Lys Ile Lys Thr635 640 645GAG ACG GAG TCT GAT TCC ACA GCA CCC TCG TGT TCC TTA AGT CTG CCC2142Glu Thr Glu Ser Asp Ser Thr Ala Pro Ser Cys Ser Leu Ser Leu Pro650 655 660CTG AGC ATA TCC ACA GCC GAG GTG GTG TCC TTC CAT AAA GAG AAG GGC2190Leu Ser Ile Ser Thr Ala Glu Val Val Ser Phe His Lys Glu Lys Gly665 670 675GTC TAT TTG TCG TCC AAG CTC AAG CAG CTT CTT CAG ACC CAG GAC AAG 2238Val Tyr Leu Ser Ser Lys Leu Lys Gln Leu Leu Gln Thr Gln Asp Lys680 685 690CTG ACC CTT CCT GCA GGG TTT TCA GCA GCT GAG ATT CCT AAG TTA GGT2286Leu Thr Leu Pro Ala Gly Phe Ser Ala ala Glu Ile Pro Lys Leu Gly695 700 705 710CCC GTG TGC GCG TCT GCT CCT GCA TCC ATG TTG CCC GTG ACC TCT AGT2334Pro Val Cys Ala Ser Ala Pro Ala Ser Met Leu Pro Val Thr Ser Ser715 720 725AGG TTT AAG AGA CGC ACC AGC TCT CCA CCG AGC TCT CCA CAG CAC AGC2382Arg Phe Lys Arg Arg Thr Ser Ser Pro Pro Ser Ser Pro Gln His Ser730 735 740CCT GCC CTT CGA GAC TTC GGG AAA CCA AAT GAT GGG AAA GCA GCA TGG2430Pro Ala Leu Arg Asp Phe Gly Lys Pro Asn Asp Gly Lys Ala Ala Trp745 750 755ACA GAC ACA GTC CTG ACT TCC AAG AAA CCC AAG TTA GAA AGT CGT AGT2478Thr Asp Thr Val Leu Thr Ser Lys Lys Pro Lys Leu Glu Ser Arg Ser760 765 770GAC TCA CCA GCA TGG AGT TTG TCT GGG AGA GAT GAA AGA GAA ACC GGA2526Asp Ser Pro Ala Trp Ser Leu Ser Gly Arg Asp Glu Arg Glu Thr Gly775 780 785 790AGC CCT CCT TGC TTT GAT GAA TAC AAA ATA TCA AAG GAA TGG GCA GCC2574Ser Pro Pro Cys Phe Asp Glu Tyr Lys Ile Ser Lys Glu Trp Ala Ala795 800 805AGT TCT ACT TTC AGC AGT GTG TGC AAC CAA CAG CCA TTG GAT TTA TCC2622Ser Ser Thr Phe Ser Ser Val Cys Asn Gln Gln Pro Leu Asp Leu Ser810 815 820AGC GGG GTC AAA CAG AAG TCA GAG GGC ACA GGC AAG ACT CCA GTC CCA2670Ser Gly Val Lys Gln Lys Ser Glu Gly Thr Gly Lys Thr Pro Val Pro825 830 835TGG GAA TCT GTA TTG GAT CTC AGT GTG CAT AAA AAG CCT TGC GAT TCT2718Trp Glu Ser Val Leu Asp Leu Ser Val His Lys Lys Pro Cys Asp Ser840 845 850GAA GGC AAG GAA TTC AAA GAG AAC CAT TTG GCA CAG CCA GCT GCA AAG2766Glu Gly Lys Glu Phe Lys Glu Asn His Leu Ala Gln Pro Ala Ala Lys855 860 865 870AAG AAA AAA CCA ACC ACC TGT ATG CTT CAA AAG GTT CTT CTC AAT GAG2814Lys Lys Lys Pro Thr Thr Cys Met Leu Gln Lys Val Leu Leu Asn Glu875 880 885TAT AAT GGT GTT AGC TTA CCT ACA GAA ACC ACA CCA GAG GTG ACC AGG2862Tyr Asn Gly Val Ser Leu Pro Thr Glu Thr Thr Pro Glu Val Thr Arg890 895 900AGC CCA AGT CCT TGT AAA TCC CCA GAT ACA CAG CCA GAT CCT GAA CTT2910Ser Pro Ser Pro Cys Lys Ser Pro Asp Thr Gln Pro Asp Pro Glu Leu905 910 915GGT CCT GAC TCA AGT TGC TCA GTC CCC ACT GCT GAG TCT CCA CCT GAA2958Gly Pro Asp Ser Ser Cys Ser Val Pro Thr Ala Glu Ser Pro Pro Glu920 925 930GTT GTT GGC CCT TCC TCA CCC CCT CTC CAG ACA GCC TCC TTA TCC TCC3006Val Val Gly Pro Ser Ser Pro Pro Leu Gln Thr Ala Ser Leu Ser Ser935 940 945 950GGT CAG CTG CCT CCT CTC TTA ACC CCC ACA GAG CCT TCT TCC CCT CCC3054Gly Gln Leu Pro Pro Leu Leu Thr Pro Thr Glu Pro Ser Ser Pro Pro955 960 965CCC TGC CCT CCT GTG TTA ACT GTT GCC ACT CCA CCA CCT CCC CTC CTT3102Pro Cys Pro Pro Val Leu Thr Val Ala Thr Pro Pro Pro Pro Leu Leu970 975 980CCA ACC GTC CCT CTC TCC CAC CCC TCT TCT GAT GCC TCC CCT CAG CAG3150Pro Thr Val Pro Leu Ser His Pro Ser Ser Asp Ala Ser Pro Gln Gln985 990 995TGT CCC TCT CCG TTC TCA AAC ACC ACT GCT CAG TCT CCT CTT CCC ATT3198Cys Pro Ser Pro Phe Ser Asn Thr Thr Ala Gln Ser Pro Leu Pro Ile100010051010CTC TCC CCA ACA GTG TCT CCC TCT CCC TCT CCC ATT CCT CCT GTA GAG3246Leu Ser Pro Thr Val Ser Pro Ser Pro Ser Pro Ile Pro Pro Val Glu1015102010251030CCA CTT ATG TCT GCT GCT TCC CCT GGT CCC CCA ACA CTT TCT TCC TCC3294Pro Leu Met Ser Ala Ala Ser Pro Gly Pro Pro Thr Leu Ser Ser Ser103510401045TCC TCT TCT TCC TCT TCC TTC CCT TCC TCT TCC TGC TCC TCC ACC TCC3342Ser Ser Ser Ser Ser Sar Phe Pro Ser Ser Ser Cys Ser Ser Thr Ser105010551060CCC TCC CCA CCC CCT CTT TCA GCA GTG TCA TCT GTG GTT TCC TCT GGG3390Pro Ser Pro Pro Pro Leu Ser Ala Val Ser Ser Val Val Ser Ser Gly106510701075GAC AAC CTG GAG GCA TCT CTG CCT GCA GTA ACT TTC AAA CAG GAG GAG3438Asp Asn Leu Glu Ala Ser Leu Pro Ala Val Thr Phe Lys Gln Glu Glu108010851090TCA GAG AGT GAA GGT CTG AAA CCC AAG GAA GAG GCC CCA CCT GCA GGG3486Ser Glu Ser Glu Gly Leu Lys Pro Lys Glu Glu Ala Pro Pro Ala Gly1095110011051110GGA CAG AGT GTG GTC CAA GAA ACA TTC AGC AAA AAC TTC ATT TGC AAT3534Gly Gln Ser Val Val Gln Glu Thr Phe Ser Lys Asn Phe Ile Cys Asn111511201125GTC TGT GAA TCG CCT TTT CTT TCC ATT AAA GAC CTA ACC AAA CAT TTA3582Val Cys Glu Ser Pro Phe Leu Ser Ile Lys Asp Leu Thr Lys His Leu113011351140TCC GTC CAT GCT GAA GAG TGG CCC TTC AAA TGT GAG TTT TGT GTG CAG3630Ser Val His Ala Glu Glu Trp Pro Phe Lys Cys Glu Phe Cys Val Gln114511501155CTG TTT AAG GTT AAG ACT GAT CTA TCA GAG CAT CGA TTT CTG CTT CAT3676Leu Phe Lys Val Lys Thr Asp Leu Ser Glu His Arg Phe Leu Leu His116011651170GGG GTT GGA AAT ATC TTT GTG TGT TCT GTA TGT AAG AAA GAA TTT GCC3726Gly Val Gly Asn Ile Phe Val Cys Ser Val Cys Lys Lys Glu Phe Ala1175118011851190TTC TTA TGC AAT CTG CAG CAG CAC CAG CGT GAT CTC CAC CCA GAT GAG3774Phe Leu Cys Asn Leu Gln Gln His Gln Arg Asp Leu His Pro Asp Glu119512001205GTA TGC ACA CAC CAC GAG TTT GAA AGT GGG ACC CTG AGG CCC CAG AAC3822Val Cys Thr His His Glu Phe Glu Ser Gly Thr Leu Arg Pro Gln Asn121012151220TTC ACA GAC CCC AGC AAG GCC AAT GTT GAG CAT ATG CCA AGT TTG CCA3870Phe Thr Asp Pro Ser Lys Ala Asn Val Glu His Met Pro Ser Leu Pro122512301235GAA GAG CCT TTA GAA ACT TCT AGA GAG GAG GAG TTA AAT GAT TCC TCT3918Glu Glu Pro Leu Glu Thr Ser Arg Glu Glu Glu Leu Asn Asp Ser Ser124012451250GAA GAG CTT TAC ACG ACC ATC AAA ATA ATG GCT TCT GGA ATA AAG ACG3966Glu Glu Leu Tyr Thr Thr Ile Lys Ile Met Ala Ser Gly Ile Lys Thr1255126012651270AAG GAT CCA GAT GTT CGA CTT GGT CTC AAC CAG CAC TAC CCG AGC TTT4014Lys Asp Pro Asp Val Arg Leu Gly Leu Asn Gln His Tyr Pro Ser Phe127512801285AAA CCT CCT CCA TTT CAG TAC CAC CAT CGA AAC CCT ATG GGG ATA GGG4062Lys Pro Pro Pro Phe Gln Tyr His His Arg Asn Pro Met Gly Ile Gly12901295 1300GTG ACA GCC ACC AAC TTC ACC ACC CAC AAT ATT CCA CAG ACT TTC ACT4110Val Thr Ala Thr Asn Phe Thr Thr His Asn Ile Pro Gln Thr Phe Thr130513101315ACT GCC ATC CGC TGC ACA AAG TGT GGG AAG GGC GTC GAC AAT ATG CCT4158Thr Ala Ile Arg Cys Thr Lys Cys Gly Lys Gly Val Asp Asn Met Pro132013251330GAG CTG CAT AAG CAT ATC TTG GCG TGT GCG TCT GCA AGT GAC AAG AAG4206Glu Leu His Lys His Ile Leu Ala Cys Ala Ser Ala Ser Asp Lys Lys1335134013451350AGG TAC ACC CCT AAG AAA AAC CCA GTG CCC CTG AAA CAA ACT GTG CAG4254Arg Tyr Thr Pro Lys Lys Asn Pro Val Pro Leu Lys Gln Thr Val Gln135513601365CCC AAA AAT GGA GTG GTG GTT CTA GAC AAC TCT GGG AAA AAT GCC TTC4302Pro Lys Asn Gly Val Val Val Leu Asp Asn Ser Gly Lys Asn Ala Phe137013751380AGA CGG ATG GGG CAG CCC AAG AGA CTG AGC TTC AAT GTT GAA CTG GGT4350Arg Arg Met Gly Gln Pro Lys Arg Leu Ser Phe Asn Val Glu Leu Gly138513901395AAA ATG TCT CCA AAC AAG CTC AAG CTG AGT GCG CTG AAG AAG AAA AAC4398Lys Met Ser Pro Asn Lys Leu Lys Leu Ser Ala Leu Lys Lys Lys Asn140014051410CAG CTG GTG CAG AAG GCC ATC CTT CAG AAG AAC AGA GCC GCG AAG CAG4446Gln Leu Val Gln Lys Ala Ile Leu Gln Lys Asn Arg Ala Ala Lys Gln1415142014251430AAG GCG GAC CTG AGG GAT ACT TCC GAG GCG TCC TCA CAC ATC TGC CCG4494Lys Ala Asp Leu Arg Asp Thr Ser Glu Ala Ser Ser His Ile Cys Pro143514401445TAC TGT GAC AGG GAG TTC ACA TAC ATT GGC AGC CTG AAT AAG CAT GCC4542Tyr Cys Asp Arg Glu Phe Thr Tyr Ile Gly Ser Leu Asn Lys His Ala145014551460GCC TTC AGC TGT CCT AAA AAA CCT CTT TCT CCT TCC AAA AGA AAA GTT4590Ala Phe Ser Cys Pro Lys Lys Pro Leu Ser Pro Ser Lys Arg Lys Val146514701475TCC CAT TCG TCT AAG AAA GGT GGC CAT GCA TCA TCT TCT AGC AGT GAC4638Ser His Ser Ser Lys Lys Gly Gly His Ala Ser Ser Ser Ser Ser Asp148014851490AGA AAC AGC AGC TGC CAC CCC CGG AGG CGG ACT GCA GAT ACC GAG ATC4686Arg Asn Ser Ser Cys His Pro Arg Arg Arg Thr Ala Asp Thr Glu Ile1495150015051510AAG ATG CAG AGC ACG CAG GCA CCC TTG GGC AAG ACC AGA GCT CGG AGT4734Lys Met Gln Ser Thr Gln Ala Pro Leu Gly Lys Thr Arg Ala Arg Ser151515201525ACA GGC CCC GCC CAG GCC TCA CTG CCC TCC TCG TCC TTC AGA TCC AGA4782Thr Gly Pro Ala Gln Ala Ser Leu Pro Ser Ser Ser Phe Arg Ser Arg153015351540CAG AAT GTC AAA TTT GCA GCT TCA GTG AAA TCC AAA AAA GCA AGC TCT4830Gln Asn Val Lys Phe Ala Ala Ser Val Lys Ser Lys Lys Ala Ser Ser154515501555TCA TCC TTG AGG AAT TCC AGT CCC ATA AGA ATG GCC AAA ATT ACT CAC4878Ser Ser Leu Arg Asn Ser Ser Pro Ile Arg Met Ala Lys Ile Thr His156015651570GTC GAG GGC AAA AAA CCC AAA GCT GTT GCC AAG AGT CAT TCT GCT CAG4926Val Glu Gly Lys Lys Pro Lys Ala Val Ala Lys Ser His Ser Ala Gln1575158015851590CTC TCA AGC AAA TCC TCC CGA GGC CTG CAT GTC AGA GTG CAG AAG AGC4974Leu Ser Ser Lys Ser Ser Arg Gly Leu His Val Arg Val Gln Lys Ser159516001605AAA GCT GTC ATA CAG AGC AAG ACT GCC CTG GCC AGT AAG AGG AGA ACA5022Lys Ala Val Ile Gln Ser Lys Thr Ala Leu Ala Ser Lys Arg Arg Thr161016151620GAC CGG TTC ATA GTG AAA TCT AGA GAG CGC AGC GGG GGC CCA ATC ACC5070Asp Arg Phe Ile Val Lys Ser Arg Glu Arg Ser Gly Gly Pro Ile Thr162516301635CGA AGC CTT CAG CTG GCA GCT GCT GCG GAC CTG AGT GAA AGC AGG AGA5118Arg Ser Leu Gln Leu Ala Ala Ala Ala Asp Leu Ser Glu Ser Arg Arg164016451650GAG GAC AGC AGT GCC AGG CAT GAG CTG AAG GAC TTC AGC TAC AGT CTC5166Glu Asp Ser Ser Ala Arg His Glu Leu Lys Asp Phe Ser Tyr Ser Leu1655166016651670CGC CTG GCA TCT CGA TGC GGC TCA TCA ACA GCC TCT TAC ATC ACC AGA5214Arg Leu Ala Ser Arg Cys Gly Ser Ser Thr Ala Ser Tyr Ile Thr Arg167516801685CAA TGC AGA AAG GTC AAG GCC GCC GCA GCA ACT CCG TTC CAG GGA CCC5262Gln Cys Arg Lys Val Lys Ala Ala Ala Ala Thr Pro Phe Gln Gly Pro169016951700TTC CTC AAA GAG T AGGCACTCTG TCTGCTCCTT AACAGCACCT GAAGTGACCT 5315Phe Leu Lys Glu1705GGAATCAGTG AAGCCAAAGG GACCAGCAGT CTGCCCTGCA GAGAGCACTG ACCTCTCCCA 5375GTTGTGAGAG TGAGAGAACG AGAGAGAGAG AGAGAGAGAG AGAGAGAGAG AGAGAGAGAG 5435AGAATGAGAA TGTGTGTGTG TGTGTGCTGG TGCATGTGTG TGGTCTTCAA GCCAAGGTCC 5495CAGCCTCAGG AGCAGGACCT TCCCATTTCC CGTCATCCTC TGGATGATCC TTGGACGTGG 5555CCCAGAACCG TGCTCTGTGG TGCAGCCATC CTGCCCGGGA GGGGCATCTC CTTCTATGCA 5615ATTTTTTTAA AGAGTTCCTT GGCCCTGCTT TGTGCTTCTT GAGCTGTCCG TTTGCCACCA 5675CTGGGACTTG GATCTGGCCC TGAGGGGTGG GGAAGAGGGC CTATCTAAGG ATAACCTTTC 5735AGAGGTCAAG CTCCCCTTCA TGCCACCCCT CCCCCCTGCC CTCACCGACC TTTTCCCCAC 5795ACTGTCTCTG GGAATCAATA GCAGATAGCA TATAGATCCA TCAGGGTTGA GCCTGAACCT 5855CGGCCCTAGC ACTAGGAAAT CCCCCTTTTC TCCCTAAGCA ACTGGAGCCG CCAGCTTTCA 5915AGTCATTTCC TCCTTTGAGG TTCTAGAGTC CGAGAGTCTG CTCCGAAGTC TCTCCTGGGA 5975ACCCGGGAGC CCTCGCACCC AGGACGCAGA CTCTGTGCCC ATTCTTAGAC CTGAGGTAGA 6035AGAAGCAGTG TTTTGGGACG ATAGGGTGGA GGCGTGCCTA CTTTGTCTCC TCTGGTGGGA6095CCTCCTACAT CATTGGCATC TGAACCTTGC AAGTTCGCTG CAAAGAGAAG CAAAGGAAAA6155AAAAAAAAAA AAAAAA6171SEQ ID NO.2(ⅰ)序列特征(A)長度1076氨基酸 (B)類型氨基酸(D)結構線性(ⅱ)分子類型蛋白質Met His Gln Asn Thr Glu Ser Val Ala Ala Thr Glu Thr Leu Ala Glu1 5 10 15Val Pro Glu His Val Leu Arg Gly Leu Pro Glu Glu Val Arg Leu Phe20 25 30Pro Ser Ala Val Asp Lys Thr Arg Ile Gly Val Trp Ala Thr Lys Pro35 40 45Ile Leu Lys Gly Lys Lys Phe Gly Pro Phe Val Gly Asp Lys Lys Lys50 55 60Arg Ser Gln Val Arg Asn Asn Val Tyr Met Trp Glu Val Tyr Tyr Pro65 70 75 80Asn Leu Gly Trp Met Cys Ile Asp Ala Thr Asp Pro Glu Lys Gly Asn85 90 95Trp Leu Arg Tyr Val Asn Trp Ala Cys Ser Gly Glu Glu Gln Asn Leu100 105 110Phe Pro Leu Glu Ile Asn Arg Ala Ile Tyr Tyr Lys Thr Leu Lys Pro115 120 125Ile Ala Pro Gly Glu Glu Leu Leu Val Trp Tyr Asn Gly Glu Asp Asn130 135 140Pro Glu Ile Ala Ala Ala Ile Glu Glu Glu Arg Ala Ser Ala Arg Ser145 150 155 160Lys Arg Ser Ser Pro Lys Ser Arg Arg Gly Lys Lys Lys Ser His Glu165 170 175Asn Lys Asn Lys Gly Ile Arg Thr His Pro Thr Gln Leu Lys Ala Ser180 185 190Glu Leu Asp Ser Thr Phe Ala Asn Met Arg Gly Ser Ala Glu Gly Pro195 200 205Lys Glu Glu Asp Glu Arg Pro Leu Ala Ser Ala Pro Glu Gln Pro Ala210 215 220Pro Leu Pro Glu Val Gly Asn Gln Asp Ala Val Pro Gln Val Ala Ile225 230 235 240Pro Leu Pro Ala Cys Glu Pro Gln Pro Glu Val Asp Gly Lys Gln Glu245 250 255Val Thr Asp Cys Glu Val Asn Asp Val Glu Glu Glu Glu Leu Glu Glu260 265 270Glu Glu Glu Leu Glu Glu Glu Glu Glu Glu Glu Leu Gly Glu Asp Gly275 280 285Val Glu Glu Ala Asp Met Pro Asn Glu Ser Ser Ala Lys Glu Pro Glu290 295 300Ile Arg Cys Glu Glu Lys Pro Glu Asp Leu Leu Glu Glu Pro Gln Ser305 310 315 320Met Ser Asn Glu Ala Arg Glu Asp Ser Pro Asp Val Thr Pro Pro Pro325 330 335His Thr Pro Arg Ala Arg Glu Glu Ala Asn Gly Asp Val Leu Glu Thr340 345 350Phe Met Phe Pro Cys Gln His Cys Glu Arg Lys Phe Ala Thr Lys Gln355 360 365Gly Leu Glu Arg His Met His Ile His Ile Ser Thr Ile Asn His Ala370 375 380Phe Lys Cys Lys Tyr Cys Gly Lys Arg Phe Gly Thr Gln Ile Asn Arg385 390 395 400Arg Arg His Glu Arg Arg His Glu Thr Gly Leu Lys Arg Arg Pro Ser405 410 415Met Thr Leu Gln Ser Ser Glu Asp Pro Asp Asp Gly Lys Gly Glu Asn420 425 430Val Thr Ser Lys Asp Glu Ser Ser Pro Pro Gln Leu Gly Gln Asp Cys435 440 445Leu Ile Leu Asn Ser Glu Lys Thr Ser Gln Glu Val Leu Asn Ser Ser450 455 460Phe Val Glu Glu Asn Gly Glu Val Lys Glu Leu His Pro Cys Lys Tyr465 470 475480Cys Lys Lys Val Phe Gly Thr His Thr Asn Met Arg Arg His Gln Arg485 490 495Arg Va1 His Glu Arg His Leu Ile Pro Lys Gly Val Arg Arg Lys Gly500 505510Gly Leu Leu Glu Glu Pro Gln Pro Pro Ala Glu Gln Ala Pro Pro Ser515 520 525Gln Asn Val Tyr Val Pro Ser Thr Glu Pro Glu Glu Glu Gly Glu Thr530 535 540Asp Asp Val Tyr Ile Met Asp Ile Ser Ser Asn Ile Ser Glu Asn Leu545 550 555 560Asn Tyr Tyr Ile Asp Gly Lys Ile Gln Thr Asn Ser Ser Thr Ser Asn565 570 575Cys Asp Val Ile Glu Met Glu Ser Asn Ser Ala His Leu Tyr Gly Ile580 585 590Asp Cys Leu Leu Thr Pro Val Thr Val Glu Ile Thr Gln Asn Ile Lys595 600605Ser Thr Gln Val Ser Val Thr Asp Asp Leu Leu Lys Asp Ser Pro Ser610 615 620Ser Thr Asn Cys Glu Ser Lys Lys Arg Arg Thr Ala Ser Pro Pro Val625 630 635 640Leu Pro Lys Ile Lys Thr Glu Thr Glu Ser Asp Ser Thr Ala Pro Ser645 650 655Cys Ser Leu Ser Leu Pro Leu Ser Ile Ser Thr Ala Glu Val Val Ser660 665 670Phe His Lys Glu Lys Gly Val Tyr Leu Ser Ser Lys Leu Lys Gln Leu675 680 685Leu Gln Thr Gln Asp Lys Leu Thr Leu Pro Ala Gly Phe Ser Ala Ala690 695 700Glu Ile Pro Lys Leu Gly Pro Val Cys Ala Ser Ala Pro Ala Ser Met705 710 715 720Leu Pro Val Thr Ser Ser Arg Phe Lys Arg Arg Thr Ser Ser Pro Pro725 730 735Ser Ser Pro Gln His Ser Pro Ala Leu Arg Asp Phe Gly Lys Pro Asn740 745 750Asp Gly Lys Ala Ala Trp Thr Asp Thr Val Leu Thr Ser Lys Lys Pro755 760 765Lys Leu Glu Ser Arg Ser Asp Ser Pro Ala Trp Ser Leu Ser Gly Arg770 775 780Asp Glu Arg Glu Thr Gly Ser Pro Pro Cys Phe Asp Glu Tyr Lys Ile785 790 795 800Ser Lys Glu Trp Ala Ala Ser Ser Thr Phe Ser Ser Val Cys Asn Gln805 810 815Gln Pro Leu Asp Leu Ser Ser Gly Val Lys Gln Lys Ser Glu Gly Thr820 825 830Gly Lys Thr Pro Val Pro Trp Glu Ser Val Leu Asp Leu Ser Val His835 840 845Lys Lys Pro Cys Asp Ser Glu Gly Lys Glu Phe Lys Glu Asn His Leu850 855 860Ala Gln Pro Ala Ala Lys Lys Lys Lys Pro Thr Thr Cys Met Leu Gln865 870 875 880Lys Val Leu Leu Asn Glu Tyr Asn Gly Val Ser Leu Pro Thr Glu Thr885 890 895Thr Pro Glu Val Thr Arg Ser Pro Ser Pro Cys Lys Ser Pro Asp Thr900 905 910Gln Pro Asp Pro Glu Leu Gly Pro Asp Ser Ser Cys Ser Val Pro Thr915 920 925Ala Glu Ser Pro Pro Glu Val Val Gly Pro Ser Ser Pro Pro Leu Gln930 935 940Thr Ala Ser Leu Ser Ser Gly Gln Leu Pro Pro Leu Leu Thr Pro Thr945 950 955 960Glu Pro Ser Ser Pro Pro Pro Cys Pro Pro Val Leu Thr Val Ala Thr965 970 975Pro Pro Pro Pro Leu Leu Pro Thr Val Pro Leu Ser His Pro Ser Ser980 985 990Asp Ala Ser Pro Gln Gln Cys Pro Ser Pro Phe Ser Asn Thr Thr Ala995 10001005Gln Ser Pro Leu Pro Ile Leu Ser Pro Thr Val Ser Pro Ser Pro Ser101010151020Pro Ile Pro Pro Val Glu Pro Leu Met Ser Ala Ala Ser Pro Gly Pro1025103010351040Pro Thr Leu Ser Ser Ser Ser Ser Ser Ser Ser Ser Phe Pro Ser Ser104510501055Ser Cys Ser Ser Thr Ser Pro Ser Pro Pro Pro Leu Ser Ala Val Ser106010651070Ser Val Val Ser Ser Gly Asp Asn Leu Glu Ala Ser Leu Pro Ala Val107510801085Thr Phe Lys Gln Glu Glu Ser Glu Ser Glu Gly Leu Lys Pro Lys Glu109010951100Glu Ala Pro Pro Ala Gly Gly Gln Ser Val Val Gln Glu Thr Phe Ser1105111011151120Lys Asn Phe Ile Cys Asn Val Cys Glu Ser Pro Phe Leu Ser Ile Lys112511301135Asp Leu Thr Lys His Leu Ser Val His Ala Glu Glu Trp Pro Phe Lys114011451150Cys Glu Phe Cys Val Gln Leu Phe Lys Val Lys Thr Asp Leu Ser Glu115511601165His Arg Phe Leu Leu His Gly Val Gly Asn Ile Phe Val Cys Ser Val117011751180Cys Lys Lys Glu Phe Ala Phe Leu Cys Asn Leu Gln Gln His Gln Arg1185119011951200Asp Leu His Pro Asp Glu Val Cys Thr His His Glu Phe Glu Ser Gly120512101215Thr Leu Arg Pro Gln Asn Phe Thr Asp Pro Ser Lys Ala Asn Val Glu122012251230His Met Pro Ser Leu Pro Glu Glu Pro Leu Glu Thr Ser Arg Glu Glu123512401245Glu Leu Asn Asp Ser Ser Glu Glu Leu Tyr Thr Thr Ile Lys Ile Met125012551260Ala Ser Gly Ile Lys Thr Lys Asp Pro Asp Val Arg Leu Gly Leu Asn1265127012751280Gln His Tyr Pro Ser Phe Lys Pro Pro Pro Phe Gln Tyr His His Arg128512901295Asn Pro Met Gly Ile Gly Val Thr Ala Thr Asn Phe Thr Thr His Asn130013051310Ile Pro Gln Thr Phe Thr Thr Ala Ile Arg Cys Thr Lys Cys Gly Lys131513201325Gly Val Asp Asn Met Pro Glu Leu His Lys His Ile Leu Ala Cys Ala133013351340Ser Ala Ser Asp Lys Lys Arg Tyr Thr Pro Lys Lys Asn Pro Val Pro1345135013551360Leu Lys Gln Thr Val Gln Pro Lys Asn Gly Val Val Val Leu Asp Asn136513701375Ser Gly Lys Asn Ala Phe Arg Arg Met Gly Gln Pro Lys Arg Leu Ser138013851390Phe Asn Val Glu Leu Gly Lys Met Ser Pro Asn Lys Leu Lys Leu Ser139514001405Ala Leu Lys Lys Lys Asn Gln Leu Val Gln Lys Ala Ile Leu Gln Lys141014151420Asn Arg Ala Ala Lys Gln Lys Ala Asp Leu Arg Asp Thr Ser Glu Ala1425143014351440Ser Ser His Ile Cys Pro Tyr Cys Asp Arg Glu Phe Thr Tyr Ile Gly144514501455Ser Leu Asn Lys His Ala Ala Phe Ser Cys Pro Lys Lys Pro Leu Ser146014651470Pro Ser Lys Arg Lys Val Ser His Ser Ser Lys Lys Gly Gly His Ala147514801485Ser Ser Ser Ser Ser Asp Arg Asn Ser Ser Cys His Pro Arg Arg Arg149014951500Thr Ala Asp Thr Glu Ile Lys Met Gln Ser Thr Gln Ala Pro Leu Gly1505151015151520Lys Thr Arg Ala Arg Ser Thr Gly Pro Ala Gln Ala Ser Leu Pro Ser152515301535Ser Ser Phe Arg Ser Arg Gln Asn Val Lys Phe Ala Ala Ser Val Lys154015451550Ser Lys Lys Ala Ser Ser Ser Ser Leu Arg Asn Ser Ser Pro Ile Arg155515601565Met Ala Lys Ile Thr His Val Glu Gly Lys Lys Pro Lys Ala Val Ala157015751580Lys Ser His Ser Ala Gln Leu Ser Ser Lys Ser Ser Arg Gly Leu His1585159015951600Val Arg Val Gln Lys Ser Lys Ala Val Ile Gln Ser Lys Thr Ala Leu160516101615Ala Ser Lys Arg Arg Thr Asp Arg Phe Ile Val Lys Ser Arg Glu Arg162016251630Ser Gly Gly Pro Ile Thr Arg Ser Leu Gln Leu Ala Ala Ala Ala Asp163516401645Leu Ser Glu Ser Arg Arg Glu Asp Ser Ser Ala Arg His Glu Leu Lys165016551660Asp Phe Ser Tyr Ser Leu Arg Leu Ala Ser Arg Cys Gly Ser Ser Thr1665167016751680Ala Ser Tyr Ile Thr Arg Gln Cys Arg Lys Val Lys Ala Ala Ala Ala168516901695Thr Pro Phe Gln Gly Pro Phe Leu Lys Glu17001705SEQ ID NO.3(ⅰ)序列特征(A)長度5868 堿基對 (B)類型核酸(C)股鏈雙 (D)結構線性(ⅱ)特征(A)命名/關鍵詞CDS (B)位置121-5278GGAAAATTTA TTCCCACTGG AAATCAACAG AGCCATTTAC TATAAAACTT TAAAGGGTTC 60ATGTAATCAA AGAAGTTTCT TGTGTGTGTG TATCTTTACA GAACACAACA GGAATTGAAA120ATG AAT CAG AAC ACT ACT GAG CCT GTG GCG GCC ACC GAG ACC CTG GCT 168Met Asn Gln Asn Thr Thr Glu Pro Val Ala Ala Thr Glu Thr Leu Ala1 5 10 15GAG GTA CCC GAA CAT GTG CTG CGA GGA CTT CCG GAG GAA GTG AGG CTT 216Glu Val Pro Glu His Val Leu Arg Gly Leu Pro Glu Glu Val Arg Leu20 25 30TTC CCT TCT GCT GTT GAC AAG ACC CGG ATT GGT GTC TGG GCC ACT AAA 264Phe Pro Ser Ala Val Asp Lys Thr Arg Ile Gly Val Trp Ala Thr Lys35 40 45CCA ATT TTA AAA GGG AAA AAA TTT GGG CCA TTT GTT GGT GAT AAG AAA 312Pro Ile Leu Lys Gly Lys Lys Phe Gly Pro Phe Val Gly Asp Lys Lys50 55 60AAA AGA TCT CAG GTT AAG AAT AAT GTA TAC ATG TGG GAG GTG TAT TAC 360Lys Arg Ser Gln Val Lys Asn Asn Val Tyr Met Trp Glu Val Tyr Tyr65 70 75 80CCA AAT TTG GGA TGG ATG TGC ATT GAT GCC ACT GAT CCA GAG AAG GGA 408Pro Asn Leu Gly Trp Met Cys Ile Asp Ala Thr Asp Pro Glu Lys Gly85 90 95AAC TGG CTG CGA TAT GTG AAT TGG GCT TGC TCA GGA GAA GAG CAA AAT 456Asn Trp Leu Arg Tyr Val Asn Trp Ala Cys Ser Gly Glu Glu Gln Asn100 105 110TTA TTC CCA CTG GAA ATC AAC AGA GCC ATT TAC TAT AAA ACT TTA AAG 504Leu Phe Pro Leu Glu Ile Asn Arg Ala Ile Tyr Tyr Lys Thr Leu Lys115 120 125CCA ATC GCG CCG GGC GAG GAG CTC CTG GTC TGG TAC AAT GGG GAA GAC 552Pro Ile Ala Pro Gly Glu Glu Leu Leu Val Trp Tyr Asn Gly Glu Asp130 135 140AAC CCT GAG ATA GCA GCT GCG ATT GAG GAA GAG CGA GCC AGC GCC CGG600Asn Pro Glu Ile Ala Ala Ala Ile Glu Glu Glu Arg Ala Ser Ala Arg145 150 155 160AGC AAG CGG AGC TCC CCC AAG AGC CGG AAA GGG AAG AAA AAA TCC CAG648Ser Lys Arg Ser Ser Pro Lys Ser Arg Lys Gly Lys Lys Lys Ser Gln165 170 175GAA AAT AAA AAC AAA GGA AAC AAA ATC CAA GAC ATA CAA CTG AAG ACA696Glu Asn Lys Asn Lys Gly Ash Lys Ile Gln Asp Ile Gln Leu Lys Thr180 185 190AGT GAG CCA GAT TTC ACC TCT GCA AAT ATG AGA GAT TCT GCA GAA GGT744Ser Glu Pro Asp Phe Thr Ser Ala Asn Met Arg Asp Ser Ala Glu Gly195 200 205CCT AAA GAA GAC GAA GAG AAG CCT TCA GCC TCA GCA CTT GAG CAG CCG792Pro Lys Glu Asp Glu Glu Lys Pro Ser Ala Ser Ala Leu Glu Gln Pro210 215 220GCC ACC CTC CAG GAG GTG GCC AGT CAG GAG GTG CCT CCA GAA CTA GCA840Ala Thr Leu Gln Glu Val Ala Ser Gln Glu Val Pro Pro Glu Leu Ala225 230 235 240ACC CCT GCC CCT GCC TGG GAG CCA CAG CCA GAA CCA GAC GAG CGA TTA888Thr Pro Ala Pro Ala Trp Glu Pro Gln Pro Glu Pro Asp Glu Arg Leu245 250 255GAA GCG GCA GCT TGT GAG GTG AAT GAT TTG GGG GAA GAG GAG GAG GAG936Glu Ala Ala Ala Cys Glu Val Asn Asp Leu Gly Glu Glu Glu Glu Glu260 265 270GAA GAG GAG GAG GAT GAA GAA GAA GAA GAA GAT GAT GAT GAT GAT GAG984Glu Glu Glu Glu Asp Glu Glu Glu Glu Glu Asp Asp Asp Asp Asp Glu275 280 285TTG GAA GAC GAG GGG GAA GAA GAA GCC AGC ATG CCA AAT GAA AAT TCT 1032Leu Glu Asp Glu Gly Glu Glu Glu Ala Ser Met Pro Asn Glu Asn Ser290 295 300GTG AAA GAG CCA GAA ATA CGG TGT GAT GAG AAG CCA GAA GAT TTA TTA 1080Val Lys Glu Pro Glu Ile Arg Cys Asp Glu Lys Pro Glu Asp Leu Leu305 310 315 320GAG GAA CCA AAA ACA ACT TCA GAA GAA ACT CTT GAA GAC TGC TCA GAG 1128Glu Glu Pro Lys Thr Thr Ser Glu Glu Thr Leu Glu Asp Cys Ser Glu325 330 335GTA ACA CCT GCC ATG CAA ATC CCC AGA ACT AAA GAA GAG GCC AAT GGT 1176Val Thr Pro Ala Met Gln Ile Pro Arg Thr Lys Glu Glu Ala Asn Gly340 345 350GAT GTA TTT GAA ACG TTT ATG TTT CCG TGT CAA CAT TGT GAA AGG AAG 1224Asp Val Phe Glu Thr Phe Met Phe Pro Cys Gln His Cys Glu Arg Lys355 360 365TTT ACA ACC AAA CAG GGG CTT GAG CGT CAC ATG CAT ATC CAT ATA TCC 1272Phe Thr Thr Lys Gln Gly Leu Glu Arg His Met His Ile His Ile Ser370 375 380ACC GTC AAT CAT GCT TTC AAA TGC AAG TAC TGT GGG AAA GCC TTT GGC 1320Thr Val Asn His Ala Phe Lys Cys Lys Tyr Cys Gly Lys Ala Phe Gly385 390 395 400ACA CAG ATT AAC CGG CGG CGA CAT GAG CGG CGC CAT GAA GCA GGG TTA 1368Thr Gln Ile Asn Arg Arg Arg His Glu Arg Arg His Glu Ala Gly Leu405 410 415AAG CGG AAA CCC AGC CAA ACA CTA CAG CCG TCA GAG GAT CTG GCT GAT 1416Lys Arg Lys Pro Ser Gln Thr Leu Gln Pro Ser Glu Asp Leu Ala Asp420 425 430GGC AAA GCA TCT GGA GAA AAC GTT GCT TCA AAA GAT GAT TCG AGT CCT 1464Gly Lys Ala Ser Gly Glu Asn Val Ala Ser Lys Asp Asp Ser Ser Pro435 440 445CCC AGT CTT GGG CCA GAC TGT CTG ATC ATG AAT TCA GAG AAG GCT TCC 1512Pro Ser Leu Gly Pro Asp Cys Leu Ile Met Asn Ser Glu Lys Ala Ser450 455 460CAA GAC ACA ATA AAT TCT TCT GTC GTA GAA GAG AAT GGG GAA GTT AAA 1560Gln Asp Thr Ile Asn Ser Ser Val Val Glu Glu Asn Gly Glu Val Lys465 470 475 480GAA CTT CAT CCG TGC AAA TAT TGT AAA AAG GTT TTT GGA ACT CAT ACT 1608Glu Leu His Pro Cys Lys Tyr Cys Lys Lys Val Phe Gly Thr His Thr485 490 495AAT ATG AGA CGG CAT CAG CGT AGA GTT CAC GAA CGT CAT CTG ATT CCC 1656Asn Met Arg Arg His Gln Arg Arg Val His Glu Arg His Leu Ile Pro500 505 510AAA GGT GTA CGG CGA AAA GGA GGC CTT GAA GAG CCC CAG CCT CCA GCA 1704Lys Gly Val Arg Arg Lys Gly Gly Leu Glu Glu Pro Gln Pro Pro Ala515 520 525GAA CAG GCC CAG GCC ACC CAG AAC GTG TAT GTA CCA AGC ACA GAG CCG 1752Glu Gln Ala Gln Ala Thr Gln Asn Val Tyr Val Pro Ser Thr Glu Pro530 535 540GAG GAG GAA GGG GAA GCA GAT GAT GTG TAC ATC ATG GAC ATT TCT AGC 1800Glu Glu Glu Gly Glu Ala Asp Asp Val Tyr Ile Met Asp Ile Ser Ser545 550 555 560AAT ATC TCT GAA AAC TTA AAT TAC TAT ATT GAT GGT AAA ATT CAA ACT 1848Asn Ile Ser Glu Asn Leu Asn Tyr Tyr Ile Asp Gly Lys Ile Gln Thr565 570 575AAT AAC AAC ACT AGT AAC TGT GAT GTG ATT GAG ATG GAG TCT GCT TCG 1896Asn Asn Asn Thr Ser Asn Cys Asp Val Ile Glu Met Glu Ser Ala Ser580 585 590GCA GAT TTG TAT GGT ATA AAT TGT CTG CTC ACT CCA GTT ACA GTG GAA 1944Ala Asp Leu Tyr Gly Ile Asn Cys Leu Leu Thr Pro Val Thr Val Glu595 600 605ATT ACT CAA AAT ATA AAG ACC ACA CAG GTC CCT GTA ACA GAA GAT CTT 1992Ile Thr Gln Asn Ile Lys Thr Thr Gln Val Pro Val Thr Glu Asp Leu610 615 620CCT AAA GAG CCT TTG GGC AGC ACA AAT AGT GAG GCC AAG AAG CGG AGA 2040Pro Lys Glu Pro Leu Gly Ser Thr Asn Ser Glu Ala Lys Lys Arg Arg625 630 635 640ACT GCG AGC CCA CCT GCA CTG CCC AAA ATT AAG GCC GAA ACA GAC TCT 2088Thr Ala Ser Pro Pro Ala Leu Pro Lys Ile Lys Ala Glu Thr Asp Ser645 650 655GAC CCC ATG GTC CCC TCT TGC TCT TTA AGT CTT CCT CTT AGC ATA TCA 2136Asp Pro Met Val Pro Ser Cys Ser Leu Ser Leu Pro Leu Ser Ile Ser660 665 670ACA ACA GAG GCA GTG TCT TTC CAC AAA GAG AAA AGT GTT TAT TTG TCA 2184Thr Thr Glu Ala Val Ser Phe His Lys Glu Lys Ser Val Tyr Leu Ser675 680 685TCA AAG CTC AAA CAA CTT CTT CAA ACC CAA GAT AAA CTA ACT CCT CCT 2232Ser Lys Leu Lys Gln Leu Leu Gln Thr Gln Asp Lys Leu Thr Pro Pro690 695 700GCA GGG ATT TCA GCA ACT GAA ATA GCT AAA TTA GGT CCT GTT TGT GTG 2280Ala Gly Ile Ser Ala Thr Glu Ile Ala Lys Leu Gly Pro Val Cys Val705 710 715 720TCT GCT CCT GCA TCA ATG TTG CCT GTG ACC TCA AGT AGG TTT AAG AGG 2328Ser Ala Pro Ala Ser Met Leu Pro Val Thr Ser Ser Arg Phe Lys Arg725 730 735CGG ACC AGC TCT CCT CCC AGT TCT CCA CAG CAC AGT CCT GCC CTT CGA 2376Arg Thr Ser Ser Pro Pro Ser Ser Pro Gln His Ser Pro Ala Leu Arg740 745 750GAC TTT GGA AAG CCA AGT GAT GGG AAA GCA GCA TGG ACC GAT GCC GGG 2424Asp Phe Gly Lys Pro Ser Asp Gly Lys Ala Ala Trp Thr Asp Ala Gly755 760 765CTG ACT TCC AAA AAA TCC AAA TTA GAA AGT CAC AGC GAC TCA CCA GCA 2472Leu Thr Ser Lys Lys Ser Lys Leu Glu Ser His Ser Asp Ser Pro Ala770 775 780TGG AGT TTG TCT GGG AGA GAT GAG AGA GAA ACT GTG AGC CCT CCA TGC 2520Trp Ser Leu Ser Gly Arg Asp Glu Arg Glu Thr Val Ser Pro Pro Cys785 790 795 800TTT GAT GAA TAT AAA ATG TCT AAA GAG TGG ACA GCT AGT TCT GCT TTT 2568Phe Asp Glu Tyr Lys Met Ser Lys Glu Trp Thr Ala Ser Ser Ala Phe805 810 815AGC AGT GTG TGC AAC CAG CAG CCA CTG GAT TTA TCC AGC GGT GTC AAA 2616Ser Ser Val Cys Asn Gln Gln Pro Leu Asp Leu Ser Ser Gly Val Lys820 825 830CAG AAG GCT GAG GGT ACA GGC AAG ACT CCA GTC CAG TGG GAA TCT GTC 2664Gln Lys Ala Glu Gly Thr Gly Lys Thr Pro Val Gln Trp Glu Ser Val835 840 845TTA GAT CTC AGT GTG CAT AAA AAG CAT TGT AGT GAC TCT GAA GGC AAG 2712Leu Asp Leu Ser Val His Lys Lys His Cys Ser Asp Ser Glu Gly Lys850 855 860GAA TTC AAA GAA AGT CAT TCA GTG CAG CCT ACG TGT AGT GCT GTA AAG 2760Glu Phe Lys Glu Ser His Ser Val Gln Pro Thr Cys Ser Ala Val Lys865 870 875 880AAA AGG AAA CCA ACC ACC TGC ATG CTG CAG AAG GTT CTT CTC AAT GAA 2808Lys Arg Lys Pro Thr Thr Cys Met Leu Gln Lys Val Leu Leu Asn Glu885 890 895TAT AAT GGC ATC GAT TTA CCT GTA GAA AAC CCT GCA GAT GGG ACC AGG 2856Tyr Asn Gly Ile Asp Leu Pro Val Glu Asn Pro Ala Asp Gly Thr Arg900 905 910AGC CCA AGT CCT TGT AAA TCC CTA GAA GCT CAG CCA GAT CCT GAC CTC 2904Ser Pro Ser Pro Cys Lys Ser Leu Glu Ala Gln Pro Asp Pro Asp Leu915 920 925GGT CCG GGC TCT GGT TTC CCT GCC CCT ACT GTT GAG TCC ACA CCT GAT 2952Gly Pro Gly Ser Gly Phe Pro Ala Pro Thr Val Glu Ser Thr Pro Asp930 935 940GTT TGT CCT TCA TCA CCT GCC CTG CAG ACA CCC TCC CTT TCA TCC GGT 3000Val Cys Pro Ser Ser Pro Ala Leu Gln Thr Pro Ser Leu Ser Ser Gly945 950 955 960CAG CTG CCT CCT CTC TTG ATC CCC ACA GAT CCC TCT TCC CCT CCA CCC 3048Gln Leu Pro Pro Leu Leu Ile Pro Thr Asp Pro Ser Ser Pro Pro Pro965 970 975TGT CCC CCG GTA TTA ACT GTT GCC ACT CCG CCC CCT CCC CTC CTT CCT 3096Cys Pro Pro Val Leu Thr Val Ala Thr Pro Pro Pro Pro Leu Leu Pro980 985 990ACC GTA CCT CTT CCA GCC CCC TCT TCC AGT GCA TCT CCA CAC CCA TGC 3144Thr Val Pro Leu Pro Ala Pro Ser Ser Ser Ala Ser Pro His Pro Cys995 10001005CCC TCT CCA CTC TCA AAT GCC ACC GCA CAG TCC CCA CTT CCA ATT CTG 3192Pro Ser Pro Leu Ser Asn Ala Thr Ala Gln Ser Pro Leu Pro Ile Leu101010151020TCC CCA ACA GTG TCC CCC TCT CCC TCT CCC ATT CCT CCC GTG GAG CCC 3240Ser Pro Thr Val Ser Pro Ser Pro Ser Pro Ile Pro Pro Val Glu Pro1025103010351040CTG ATG TCT GCC GCC TCA CCC GGG CCT CCA ACA CTT TCT TCT TCC TCC 3288Leu Met Ser Ala Ala Ser Pro Gly Pro Pro Thr Leu Ser Ser Ser Ser104510501055TCT TCA TCT TCC TCC TCC TCT TCG TTT TCT TCT TCA TCT TCC TCC TCT 3336Ser Ser Ser Ser Ser Ser Ser Ser Phe Ser Ser Ser Ser Ser Ser Ser106010651070TCT CCT TCT CCA CCT CCT CTC TCC GCA ATA TCA TCT GTT GTT TCC TCT 3384Ser Pro Ser Pro Pro Pro Leu Ser Ala Ile Ser Ser Val Val Ser Ser107510801085GGT GAT AAT CTG GAG GCT TCT CTC CCC ATG ATA TCT TTC AAA CAG GAG 3432Gly Asp Asn Leu Glu Ala Ser Leu Pro Met Ile Ser Phe Lys Gln Glu109010951100GAA TTA GAG AAT GAA GGT CTG AAA CCC AGG GAA GAG CCC CAG TCT GCT 3480Glu Leu Glu Asn Glu Gly Leu Lys Pro Arg Glu Glu Pro Gln Ser Ala1105111011151120GCT GAA CAG GAT GTT GTT GTT CAG GAA ACA TTC AAC AAA AAC TTT GTT 3528Ala Glu Gln Asp Val Val Val Gln Glu Thr Phe Asn Lys Asn Phe Val112511301135TGC AAC GTC TGT GAA TCA CCT TTT CTT TCC ATT AAA GAT CTA ACC AAA 3576Cys Asn Val Cys Glu Ser Pro Phe Leu Ser Ile Lys Asp Leu Thr Lys114011451150CAT TTA TCT ATT CAT GCT GAA GAA TGG CCC TTC AAA TGT GAA TTT TGT 3624His Leu Ser Ile His Ala Glu Glu Trp Pro Phe Lys Cys Glu Phe Cys115511601165GTG CAG CTT TTT AAG GAT AAA ACG GAC TTG TCA GAA CAT CGC TTT TTG 3672Val Gln Leu Phe Lys Asp Lys Thr Asp Leu Ser Glu His Arg Phe Leu117011751180CTT CAT GGA GTT GGG AAT ATC TTT GTG TGT TCT GTT TGT AAA AAA GAA 3720Leu His Gly Val Gly Asn Ile Phe Val Cys Ser Val Cys Lys Lys Glu1185119011951200TTT GCT TTT TTG TGC AAT TTG CAG CAG CAC CAG CGA GAT CTC CAC CCA 3768Phe Ala Phe Leu Cys Asn Leu Gln Gln His Gln Arg Asp Leu His Pro120512101215GAT AAG GTG TGC ACA CAT CAC GAG TTT GAA AGC GGG ACT CTG AGG CCC 3816Asp Lys Val Cys Thr His His Glu Phe Glu Ser Gly Thr Leu Arg Pro122012251230CAG AAC TTT ACA GAT CCC AGC AAG GCC CAT GTA GAG CAT ATG CAG AGC3864Gln Asn Phe Thr Asp Pro Ser Lys Ala His Val Glu His Met Gln Ser123512401245TTG CCA GAA GAT CCT TTA GAA ACT TCT AAA GAA GAA GAG GAG TTA AAT3912Leu Pro Glu Asp Pro Leu Glu Thr Ser Lys Glu Glu Glu Glu Leu Asn125012551260GAT TCC TCT GAA GAG CTT TAC ACG ACT ATA AAA ATA ATG GCT TCT GGA3960Asp Ser Ser Glu Glu Leu Tyr Thr Thr Ile Lys Ile Met Ala Ser Gly1265127012751280ATA AAG ACA AAA GAT CCA GAT GTT CGA TTG GGC CTC AAT CAG CAT TAC4008Ile Lys Thr Lys Asp Pro Asp Val Arg Leu Gly Leu Asn Gln His Tyr128512901295CCA AGC TTT AAA CCA CCT CCA TTT CAG TAC CAT CAC CGT AAC CCC ATG4056Pro Ser Phe Lys Pro Pro Pro Phe Gln Tyr His His Arg Asn Pro Met130013051310GGG ATT GGT GTG ACA GCC ACA AAT TTC ACT ACA CAC AAT ATT CCA CAG4104Gly Ile Gly Val Thr Ala Thr Asn Phe Thr Thr His Asn Ile Pro Gln131513201325ACT TTC ACT ACC GCC ATT CGC TGC ACA AAG TGT GGA AAA GGT GTC GAC4152Thr Phe Thr Thr Ala Ile Arg Cys Thr Lys Cys Gly Lys Gly Val Asp133013351340AAT ATG CCG GAG TTG CAC AAA CAT ATC CTG GCT TGT GCT TCT GCA AGT4200Asn Met Pro Glu Leu His Lys His Ile Leu Ala Cys Ala Ser Ala Ser1345135013551360GAC AAG AAG AGG TAC ACG CCT AAG AAA AAC CCA GTA CCA TTA AAA CAA4248Asp Lys Lys Arg Tyr Thr Pro Lys Lys Asn Pro Val Pro Leu Lys Gln136513701375ACT GTG CAA CCC AAA AAT GGC GTG GTG GTT TTA GAT AAC TCT GGG AAA4296Thr Val Gln Pro Lys Asn Gly Val Val Val Leu Asp Asn Ser Gly Lys138013851390AAT GCC TTC CGA CGA ATG GGA CAG CCC AAA AGG CTT AAC TTT AGT GTT4344Asn Ala Phe Arg Arg Met Gly Gln Pro Lys Arg Leu Asn Phe Ser Val139514001405GAG CTC AGC AAA ATG TCG TCG AAT AAG CTC AAA TTA AAT GCA TTG AAG4392Glu Leu Ser Lys Met Ser Ser Asn Lys Leu Lys Leu Asn Ala Leu Lys141014151420AAA AAA AAT CAG CTA GTA CAG AAA GCA ATT CTT CAG AAA AAC AAA TCT4440Lys Lys Asn Gln Leu Val Gln Lys Ala Ile Leu Gln Lys Asn Lys Ser1425143014351440GCA AAG CAG AAG GCC GAC TTG AAA AAT GCT TGT GAG TCA TCC TCT CAC4488Ala Lys Gln Lys Ala Asp Leu Lys Asn Ala Cys Glu Ser Ser Ser His144514501455ATC TGC CCT TAC TGT AAT CGA GAG TTC ACT TAC ATT GGA AGC CTG AAT4536Ile Cys Pro Tyr Cys Asn Arg Glu Phe Thr Tyr Ile Gly Ser Leu Asn146014651470AAA CAC GCC GCC TTC AGC TGT CCC AAA AAA CCC CTT TCT CCT CCC AAA4584Lys His Ala Ala Phe Ser Cys Pro Lys Lys Pro Leu Ser Pro Pro Lys147514801485AAA AAA GTT TCT CAT TCA TCT AAG AAA GGT GGA CAC TCA TCA CCT GCA4632Lys Lys Val Ser His Ser Ser Lys Lys Gly Gly His Ser Ser Pro Ala149014951500AGT AGT GAC AAA AAC AGT AAC AGC AAC CAC CGC AGA CGG ACA GCG GAT4680Ser Ser Asp Lys Asn Ser Asn Ser Asn His Arg Arg Arg Thr Ala Asp1505151015151520GCG GAG ATT AAA ATG CAA AGC ATG CAG ACT CCG TTG GGC AAG ACC AGA4728Ala Glu Ile Lys Met Gln Ser Met Gln Thr Pro Leu Gly Lys Thr Arg152515301535GCC CGC AGC TCA GGC CCC ACC CAA GTC CCA CTT CCC TCC TCA TCC TTC4776Ala Arg Ser Ser Gly Pro Thr Gln Val Pro Leu Pro Ser Ser Ser Phe154015451550AGG TCC AAG CAG AAC GTC AAG TTT GCA GCT TCG GTG AAA TCC AAA AAA4824Arg Ser Lys Gln Asn Val Lys Phe Ala Ala Ser Val Lys Ser Lys Lys155515601565CCA AGC TCC TCC TCT TTA AGG AAC TCC AGC CCG ATA AGA ATG GCC AAA4872Pro Ser Ser Ser Ser Leu Arg Asn Ser Ser Pro Ile Arg Met Ala Lys157015751580ATA ACT CAT GTT GAG GGG AAA AAA CCT AAA GCT GTG GCC AAG AAT CAT4920Ile Thr His Val Glu Gly Lys Lys Pro Lys Ala Va1 Ala Lys Asn His1585159015951600TCT GCT CAG CTT TCC AGC AAA ACA TCG CGG AGC CTG CAC GTG AGG GTA4968Ser Ala Gln Leu Ser Ser Lys Thr Ser Arg Ser Leu His Val Arg Val160516101615CAG AAA AGC AAA GCT GTT TTA CAA AGC AAA TCC ACC TTG GCG AGT AAG5016Gln Lys Ser Lys Ala Val Leu Gln Ser Lys Ser Thr Leu Ala Ser Lys162016251630AAA AGA ACA GAC CGG TTC AAT ATA AAA TCT AGA GAG CGG AGT GGG GGG5064Lys Arg Thr Asp Arg Phe Asn Ile Lys Ser Arg Glu Arg Ser Gly Gly163516401645CCA GTC ACC CGG AGC CTT CAG CTG GCA GCT GCT GCT GAC TTG AGT GAG5112Pro Val Thr Arg Ser Leu Gln Leu Ala Ala Ala Ala Asp Leu Ser Glu165016551660AAC AAG AGA GAG GAC GGC AGC GCC AAG CAG GAG CTG AAG GAC TTC AGC5160Asn Lys Arg Glu Asp Gly Ser Ala Lys Gln Glu Leu Lys Asp Phe Ser1665167016751680TAC AGC CTC CGC TTG GCG TCC CGA TGC TCT CCA CCA GCC GCC TCT TAC5208Tyr Ser Leu Arg Leu Ala Ser Arg Cys Ser Pro Pro Ala Ala Ser Tyr168516901695ATC ACC AGG CAG TAT AGG AAG GTC AAA GCT CCG GCT GCA GCC CAG TTC5256Ile Thr Arg Gln Tyr Arg Lys Val Lys Ala Pro Ala Ala Ala Gln Phe170017051710CAG GGA CCA TTC TTC AAA GAG T AGACACTCTG GCTGCTCCCT GACAGCACCT 5308Gln Gly Pro Phe Phe Lys Glu1715GAAGTGACCT GGAATCAGTG AAGCCAAAGG GACTGGCAGT CTGCCTGCAG GGAGTACCGA 5368CCTATCCCAG TTGTGTGAGG CTGCGAGAGA AAGGGAGTGC ATGTGCGCGC GTGCATGTGT 5428GCGTGCGTGT GTGTTCACGT GTTCTCGTGC GGGCCGTGAG TGGTCTTCAA ACGAGGGTCC 5488CGAACCCCGG GGCGGCAGGA AGGGGGCCGA CTCCACGCTG TCCTTTGGGA TGATACTTGG 5548ATGTCAGCTC TTGGGACCGT GTCTGCAGCC CAGCCTTCCT GTTGGGGTGG GGCCTCTCCT 5608ACTATGCAAT TTTTCAAGAG CTCCTTGACC CTGCTTTTTG CTTCTTGAGT TGTCTTTTGC 5668CATTATGGGG ACTTTGGTTT GACCCAGGGG TCAGCCCTTT AGGAAGGCCT TCAGGAGGAG 5728GCCGAGTTCC CCTTCAGTAC CACCCCTCTC TCCCCACCTG CCCGCTCCCG GCAACATCTC 5788TGGGAATCAA CAGCATATTG ACACGTTGGA GCCGAGCCTG AACATGCCCT GACCCCAGCA 5848CATGGAAAAC CCCCTTCCTT 5868SEQ ID NO.4(ⅰ)序列特征(A)長度1719氨基酸(B)類型氨基酸(D)結構線性(ⅱ)分子類型蛋白質Met Asn Gln Asn Thr Thr Glu Pro Val Ala Ala Thr Glu Thr Leu Ala1 5 10 15Glu Val Pro Glu His Val Leu Arg Gly Leu Pro Glu Glu Val Arg Leu20 25 30Phe Pro Ser Ala Val Asp Lys Thr Arg Ile Gly Val Trp Ala Thr Lys35 40 45Pro Ile Leu Lys Gly Lys Lys Phe Gly Pro Phe Val Gly Asp Lys Lys50 55 60Lys Arg Ser Gln Val Lys Asn Asn Val Tyr Met Trp Glu Val Tyr Tyr65 70 75 80Pro Asn Leu Gly Trp Met Cys Ile Asp Ala Thr Asp Pro Glu Lys Gly85 90 95Asn Trp Leu Arg Tyr Val Asn Trp Ala Cys Ser Gly Glu Glu Gln Asn100 105 110Leu Phe Pro Leu Glu Ile Asn Arg Ala Ile Tyr Tyr Lys Thr Leu Lys115 120 125Pro Ile Ala Pro Gly Glu Glu Leu Leu Val Trp Tyr Asn Gly Glu Asp130 135 140Asn Pro Glu Ile Ala Ala Ala Ile Glu Glu Glu Arg Ala Ser Ala Arg145 150 155 160Ser Lys Arg Ser Ser Pro Lys Ser Arg Lys Gly Lys Lys Lys Ser Gln165 170 175Glu Asn Lys Asn Lys Gly Asn Lys Ile Gln Asp Ile Gln Leu Lys Thr180 185 190Ser Glu Pro Asp Phe Thr Ser Ala Asn Met Arg Asp Ser Ala Glu Gly195 200 205Pro Lys Glu Asp Glu Glu Lys Pro Ser Ala Ser Ala Leu Glu Gln Pro210 215 220Ala Thr Leu Gln Glu Val Ala Ser Gln Glu Val Pro Pro Glu Leu Ala225 230 235 240Thr Pro Ala Pro Ala Trp Glu Pro Gln Pro Glu Pro Asp Glu Arg Leu245 250 255Glu Ala Ala Ala Cys Glu Val Asn Asp Leu Gly Glu Glu Glu Glu Glu260 265 270Glu Glu Glu Glu Asp Glu Glu Glu Glu Glu Asp Asp Asp Asp Asp Glu275 280 285Leu Glu Asp Glu Gly Glu Glu Glu Ala Ser Met Pro Asn Glu Asn Ser290 295 300Val Lys Glu Pro Glu Ile Arg Cys Asp Glu Lys Pro Glu Asp Leu Leu305 310 315 320Glu Glu Pro Lys Thr Thr Ser Glu Glu Thr Leu Glu Asp Cys Ser Glu325 330 335Val Thr Pro Ala Met Gln Ile Pro Arg Thr Lys Glu Glu Ala Asn Gly340 345 350Asp Val Phe Glu Thr Phe Met Phe Pro Cys Gln His Cys Glu Arg Lys355 360 365Phe Thr Thr Lys Gln Gly Leu Glu Arg His Met His Ile His Ile Ser370 375 380Thr Val Asn His Ala Phe Lys Cys Lys Tyr Cys Gly Lys Ala Phe Gly385 390 395 400Thr Gln Ile Asn Arg Arg Arg His Glu Arg Arg His Glu Ala Gly Leu405 410 415Lys Arg Lys Pro Ser Gln Thr Leu Gln Pro Ser Glu Asp Leu Ala Asp420 425 430Gly Lys Ala Ser Gly Glu Asn Val Ala Ser Lys Asp Asp Ser Ser Pro435 440 445Pro Ser Leu Gly Pro Asp Cys Leu Ile Met Asn Ser Glu Lys Ala Ser450 455 460Gln Asp Thr Ile Asn Ser Ser Val Val Glu Glu Asn Gly Glu Val Lys465 470 475 480Glu Leu His Pro Cys Lys Tyr Cys Lys Lys Val Phe Gly Thr His Thr485 490 495Asn Met Arg Arg His Gln Arg Arg Val His Glu Arg His Leu Ile Pro500 505 510Lys Gly Val Arg Arg Lys Gly Gly Leu Glu Glu Pro Gln Pro Pro Ala515 520 525Glu Gln Ala Gln Ala Thr Gln Asn Val Tyr Val Pro Ser Thr Glu Pro530 535 540Glu Glu Glu Gly Glu Ala Asp Asp Val Tyr Ile Met Asp Ile Ser Ser545 550 555 560Asn Ile Ser Glu Asn Leu Asn Tyr Tyr Ile Asp Gly Lys Ile Gln Thr565 570 575Asn Asn Asn Thr Ser Asn Cys Asp Val Ile Glu Met Glu Ser Ala Ser580 585 590Ala Asp Leu Tyr Gly Ile Asn Cys Leu Leu Thr Pro Val Thr Val Glu595 600 605Ile Thr Gln Asn Ile Lys Thr Thr Gln Val Pro Val Thr Glu Asp Leu610 615 620Pro Lys Glu Pro Leu Gly Ser Thr Asn Ser Glu Ala Lys Lys Arg Arg625 630 635 640Thr Ala Ser Pro Pro Ala Leu Pro Lys Ile Lys Ala Glu Thr Asp Ser645 650 655Asp Pro Met Val Pro Ser Cys Ser Leu Ser Leu Pro Leu Ser Ile Ser660 665 670Thr Thr Glu Ala Val Ser Phe His Lys Glu Lys Ser Val Tyr Leu Ser675 680 685Ser Lys Leu Lys Gln Leu Leu Gln Thr Gln Asp Lys Leu Thr Pro Pro690 695 700Ala Gly Ile Ser Ala Thr Glu Ile Ala Lys Leu Gly Pro Val Cys Val705 710 715 720Ser Ala Pro Ala Ser Met Leu Pro Val Thr Ser Ser Arg Phe Lys Arg725 730 735Arg Thr Ser Ser Pro Pro Ser Ser Pro Gln His Ser Pro Ala Leu Arg740 745 750Asp Phe Gly Lys Pro Ser Asp Gly Lys Ala Ala Trp Thr Asp Ala Gly755 760 765Leu Thr Ser Lys Lys Ser Lys Leu Glu Ser His Ser Asp Ser Pro Ala770 775 780Trp Ser Leu Ser Gly Arg Asp Glu Arg Glu Thr Val Ser Pro Pro Cys785 790 795 800Phe Asp Glu Tyr Lys Met Ser Lys Glu Trp Thr Ala Ser Ser Ala Phe805 810 815Ser Ser Val Cys Asn Gln Gln Pro Leu Asp Leu Ser Ser Gly Val Lys820 825 830Gln Lys Ala Glu Gly Thr Gly Lys Thr Pro Val Gln Trp Glu Ser Val835 840 845Leu Asp Leu Ser Val His Lys Lys His Cys Ser Asp Ser Glu Gly Lys850 855 860Glu Phe Lys Glu Ser His Ser Val Gln Pro Thr Cys Ser Ala Val Lys865 870 875 880Lys Arg Lys Pro Thr Thr Cys Met Leu Gln Lys Val Leu Leu Asn Glu885 890 895Tyr Asn Gly Ile Asp Leu Pro Val Glu Asn Pro Ala Asp Gly Thr Arg900 905 910Ser Pro Ser Pro Cys Lys Ser Leu Glu Ala Gln Pro Asp Pro Asp Leu915 920 925Gly Pro Gly Ser Gly Phe Pro Ala Pro Thr Val Glu Ser Thr Pro Asp930 935 940Val Cys Pro Ser Ser Pro Ala Leu Gln Thr Pro Ser Leu Ser Ser Gly945 950 955 960Gln Leu Pro Pro Leu Leu Ile Pro Thr Asp Pro Ser Ser Pro Pro Pro965 970 975Cys Pro Pro Val Leu Thr Val Ala Thr Pro Pro Pro Pro Leu Leu Pro980 985 990Thr Val Pro Leu Pro Ala Pro Ser Ser Ser Ala Ser Pro His Pro Cys995 10001005Pro Ser Pro Leu Ser Asn Ala Thr Ala Gln Ser Pro Leu Pro Ile Leu101010151020Ser Pro Thr Val Ser Pro Ser Pro Ser Pro Ile Pro Pro Val Glu Pro1025103010351040Leu Met Ser Ala Ala Ser Pro Gly Pro Pro Thr Leu Ser Ser Ser Ser104510501055Ser Ser Ser Ser Ser Ser Ser Ser Phe Ser Ser Ser Ser Ser Ser Ser106010651070Ser Pro Ser Pro Pro Pro Leu Ser Ala Ile Ser Ser Val Val Ser Ser107510801085Gly Asp Asn Leu Glu Ala Ser Leu Pro Met Ile Ser Phe Lys Gln Glu109010951100Glu Leu Glu Asn Glu Gly Leu Lys Pro Arg Glu Glu Pro Gln Ser Ala1105111011151120Ala Glu Gln Asp Val Val Val Gln Glu Thr Phe Asn Lys Asn Phe Val112511301135Cys Asn Val Cys Glu Ser Pro Phe Leu Ser Ile Lys Asp Leu Thr Lys114011451150His Leu Ser Ile His Ala Glu Glu Trp Pro Phe Lys Cys Glu Phe Cys115511601165Val Gln Leu Phe Lys Asp Lys Thr Asp Leu Ser Glu His Arg Phe Leu117011751180Leu His Gly Val Gly Asn Ile Phe Val Cys Ser Val Cys Lys Lys Glu1185119011951200Phe Ala Phe Leu Cys Asn Leu Gln Gln His Gln Arg Asp Leu His Pro120512101215Asp Lys Val Cys Thr His His Glu Phe Glu Ser Gly Thr Leu Arg Pro122012251230Gln Asn Phe Thr Asp Pro Ser Lys Ala His Val Glu His Met Gln Ser123512401245Leu Pro Glu Asp Pro Leu Glu Thr Ser Lys Glu Glu Glu Glu Leu Asn125012551260Asp Ser Ser Glu Glu Leu Tyr Thr Thr Ile Lys Ile Met Ala Ser Gly1265127012751280Ile Lys Thr Lys Asp Pro Asp Val Arg Leu Gly Leu Asn Gln His Tyr128512901295Pro Ser Phe Lys Pro Pro Pro Phe Gln Tyr His His Arg Asn Pro Met130013051310Gly Ile Gly Val Thr Ala Thr Asn Phe Thr Thr His Asn Ile Pro Gln131513201325Thr Phe Thr Thr Ala Ile Arg Cys Thr Lys Cys Gly Lys Gly Val Asp133013351340Asn Met Pro Glu Leu His Lys His Ile Leu Ala Cys Ala Ser Ala Ser1345135013551360Asp Lys Lys Arg Tyr Thr Pro Lys Lys Asn Pro Val Pro Leu Lys Gln136513701375Thr Val Gln Pro Lys Asn Gly Val Val Val Leu Asp Asn Ser Gly Lys1380385 1390Asn Ala Phe Arg Arg Met Gly Gln Pro Lys Arg Leu Asn Phe Ser Val139514001405Glu Leu Ser Lys Met Ser Ser Asn Lys Leu Lys Leu Asn Ala Leu Lys141014151420Lys Lys Asn Gln Leu Val Gln Lys Ala Ile Leu Gln Lys Asn Lys Ser1425143014351440Ala Lys Gln Lys Ala Asp Leu Lys Asn Ala Cys Glu Ser Ser Ser His1445450 1455Ile Cys Pro Tyr Cys Asn Arg Glu Phe Thr Tyr Ile Gly Ser Leu Asn146014651470Lys His Ala Ala Phe Ser Cys Pro Lys Lys Pro Leu Ser Pro Pro Lys147514801485Lys Lys Val Ser His Ser Ser Lys Lys Gly Gly His Ser Ser Pro Ala149014951500Ser Ser Asp Lys Asn Ser Asn Ser Asn His Arg Arg Arg Thr Ala Asp1505151015151520Ala Glu Ile Lys Met Gln Ser Met Gln Thr Pro Leu Gly Lys Thr Arg152515301535Ala Arg Ser Ser Gly Pro Thr Gln Val Pro Leu Pro Ser Ser Ser Phe154015451550Arg Ser Lys Gln Asn Val Lys Phe Ala Ala Ser Val Lys Ser Lys Lys155515601565Pro Ser Ser Ser Ser Leu Arg Asn Ser Ser Pro Ile Arg Met Ala Lys157015751580Ile Thr His Val Glu Gly Lys Lys Pro Lys Ala Val Ala Lys Asn His1585159015951600Ser Ala Gln Leu Ser Ser Lys Thr Ser Arg Ser Leu His Val Arg Val160516101615Gln Lys Ser Lys Ala Val Leu Gln Ser Lys Ser Thr Leu Ala Ser Lys162016251630Lys Arg Thr Asp Arg Phe Asn Ile Lys Ser Arg Glu Arg Ser Gly Gly163516401645Pro Val Thr Arg Ser Leu Gln Leu Ala Ala Ala Ala Asp Leu Ser Glu165016551660Asn Lys Arg Glu Asp Gly Ser Ala Lys Gln Glu Leu Lys Asp Phe Ser1665167016751680Tyr Ser Leu Arg Leu Ala Ser Arg Cys Ser Pro Pro Ala Ala Ser Tyr168516901695Ile Thr Arg Gln Tyr Arg Lys Val Lys Ala Pro Ala Ala Ala Gln Phe170017051710Gln Gly Pro Phe Phe Lys Glu1715SEQ ID NO.100(ⅰ)序列特征(A)長度115氨基酸 (B)類型氨基酸(D)結構線性Met Pro Gly Ala Gly Leu Gly Ile Trp Thr Lys Arg Lys Ile Glu Val1 5 10 15Gly Glu Lys Phe Gly Pro Tyr Val Gly Glu Gln Arg Ser Asn Leu Lys20 25 30Asp Pro Ser Tyr Gly Trp Glu Ile Leu Asp Glu Phe Tyr Asn Val Lys35 40 45Phe Cys Ile Asp Ala Ser Gln Pro Asp Val Gly Ser Trp Leu Lys Tyr50 55 60Ile Arg Phe Ala Gly Cys Tyr Asp Gln His Asn Leu Val Ala Cys Gln65 70 75 80Ile Asn Asp Gln Ile Phe Tyr Arg Val Val Ala Asp Ile Ala Pro Gly85 90 95Glu Glu Leu Leu Leu Phe Met Lys Ser Glu Asp Tyr Pro His Glu Thr100 105 110Met Ala Pro115SEQ ID NO.101(ⅰ)序列特征(A)長度110氨基酸 (B)類型氨基酸(D)結構線性Asp Glu Leu His Gly Asn Val Leu Ile Ala Val Thr Gln Ile Ala Leu1 5 10 15Gly Arg Thr Ile Gly Val Ile Asp Lys Ala Thr Pro Asn Asp Ser Asn20 25 30Ala Leu Leu Ile Leu Asn Leu Ile Lys Glu Ala Asp Asp Gly Glu Asp35 40 45Ala Asn Ile Cys Met Arg Gln Glu Asp Arg Lys Thr Phe Leu Gln Thr50 55 60Ser Lys Ile Ile Asn Ile Gly Glu Arg Leu Leu Leu Gln Arg Leu Ser65 70 75 80Glu Glu Glu Cys Asp Glu Glu Asp Gln Asp Asp Leu Glu Asn Leu Ile85 90 95Leu Leu Lys Asp Glu Asp Arg Pro Asp Ser Thr Gln Ser Cys100 105 110SEQ ID NO.102(ⅰ)序列特征(A)長度21氨基酸 (B)類型氨基酸(D)結構線性Glu Trp Gly Pro Val Thr Arg Ser Leu Gln Arg Ser Thr Lys Gln Glu1 5 10 15Leu Lys Asp Leu Gln20SEQ ID NO.103(ⅰ)序列特征(A)長度22氨基酸 (B)類型氨基酸(D)結構線性Gly Ala Glu Glu Thr Ala Ala Ala Ala Ala Ala Leu Gly Ala Leu Arg1 5 10 15Leu Gly Arg Arg Ala Arg20SEQ ID NO.104(ⅰ)序列特征(A)長度391堿基對 (B)類型核酸(C)股鏈單 (D)結構線性(ⅱ)特征(A)命名/關鍵詞CDS (B)位置1-391GTG TAC TAC CCA AAT TTG GGG TGG ATG TGC ATT GAT GCC ACT GAT CCG 48Val Tyr Tyr Pro Asn Leu Gly Trp Met Cys Ile Asp Ala Thr Asp Pro1 5 10 15GAG AAG GGC AAC TGG CTC CGC TAT GTG AAC TGG GCT TGC TCA GGA GAA 96Glu Lys Gly Asn Trp Leu Arg Tyr Val Asn Trp Ala Cys Ser Gly Glu20 25 30GAA CAG AAT TTA TTT CCA CTG GAA ATC AAC AGA GCC ATT TAC TAT AAA144Glu Gln Asn Leu Phe Pro Leu Glu Ile Asn Arg Ala Ile Tyr Tyr Lys35 40 45ACC TTA AAG CCA ATC GCG CCT GGC GAG GAG CTC CTG GTC TGG TAC AAT192Thr Leu Lys Pro Ile Ala Pro Gly Glu Glu Leu Leu Val Trp Tyr Asn50 55 60GGG GAA GAC AAC CCC GAG ATA GCA GCT GCG ATT GAG GAA GAG CGA GCC240Gly Glu Asp Asn Pro Glu Ile Ala Ala Ala Ile Glu Glu Glu Arg Ala65 70 75 80AGC GCC CGG AGC AAG CGG AGC TCC CCG AAG AGC CGG AGA GGG AAG AAG288Ser Ala Arg Ser Lys Arg Ser Ser Pro Lys Ser Arg Arg Gly Lys Lys85 90 95AAA TCA CAG GAG AAT AAA AAC AAA GGC ATC AGA ACC CAG GCT GCA GCG336Lys Ser Gln Glu Asn Lys Asn Lys Gly Ile Arg Thr Gln Ala Ala Ala100 105 110CGG AAG GCG AGC GAG CTG GAC TCC ACC TCT GCA AAC ATG AGG GGC TCT384Arg Lys Ala Ser Glu Leu Asp Ser Thr Ser Ala Asn Met Arg Gly Ser115 120 125GCA GAA G391Ala Glu130SEQ ID NO.105(ⅰ)序列特征(A)長度130氨基酸 (B)類型氨基酸(D)結構線性(ⅱ)分子類型蛋白質Val Tyr Tyr Pro Asn Leu Gly Trp Met Cys Ile Asp Ala Thr Asp Pro1 5 10 15Glu Lys Gly Asn Trp Leu Arg Tyr Val Asn Trp Ala Cys Ser Gly Glu20 25 30Glu Gln Asn Leu Phe Pro Leu Glu Ile Asn Arg Ala Ile Tyr Tyr Lys35 40 45Thr Leu Lys Pro Ile Ala Pro Gly Glu Glu Leu Leu Val Trp Tyr Asn50 55 60Gly Glu Asp Asn Pro Glu Ile Ala Ala Ala Ile Glu Glu Glu Arg Ala65 70 75 80Ser Ala Arg Ser Lys Arg Ser Ser Pro Lys Ser Arg Arg Gly Lys Lys85 90 95Lys Ser Gln Glu Asn Lys Asn Lys Gly Ile Arg Thr Gln Ala Ala Ala100 105 110Arg Lys Ala Ser Glu Leu Asp Ser Thr Ser Ala Asn Met Arg Gly Ser115 120 125Ala Glu130SEQ ID NO.106(ⅰ)序列特征(A)長度20堿基對(B)類型核酸(C)股鏈單 (D)結構線性(ⅹⅰ)序列描述SEQ ID NO.106GCGAGGAGCT CCTGGTCTGG
權利要求
1.一種用于抑制MSI陽性腫瘤的方法。這種方法由編碼RIZ1多肽的核酸分子組,能介導到腫瘤中,并在腫瘤中表達足夠量的這種多肽,以達到抑制腫瘤的效果。
2.權利要求1所要求的方法,所述腫瘤在RIZ多聚A位點有非正常數目的腺嘌呤。
3.權利要求2所要求的方法,其中RIZ多聚A位點在RIZ(A)8序列中。
4.權利要求2所要求的方法,其中RIZ多聚A位點在RIZ(A)9序列中。
5.權利要求2所要求的方法,其中非正常數目的腺嘌呤包括數目增加。
6.權利要求2所要求的方法,其中非正常數目的腺嘌呤包括數目減少。
7.權利要求1所要求的方法,其中所述核酸分子組在腫瘤中表達RIZ1導致腫瘤細胞凋亡。
8.權利要求1所要求的方法,其中RIZ1多肽含有與序列號99中有95%以上相同的PR氨基酸序列。
9.權利要求8所要求的方法,其中RIZ1多肽包括序列號99順序。
10.權利要求8所要求的方法,其中RIZ1多肽含有與序列號4有80%以上相同的氨基酸序列。
11.權利要求10所要求的方法,其中RIZ1多肽包括序列號4順序。
12.權利要求1所要求的方法,其中核酸序列處于一個病毒載體中。
13.權利要求12所要求的方法,其中病毒載體是一個腺病毒載體。
14.權利要求1所要求的方法,其中核酸以腫瘤內或腫瘤外周注射的方式導入腫瘤細胞。
15.權利要求1所要求的方法,其中MSI陽性腫瘤由部分結腸癌,胃癌,或子宮內膜癌組成。
16.權利要求15所要求的方法,其中MSI陽性腫瘤是家族型非息肉性結腸腫瘤。
17.一種測定MSI陽性狀態的方法,該方法通過測量腫瘤中RIZ基因上多聚A位點上腺嘌呤的數目來決定MSI狀態,RIZ基因上中非正常數目的多聚A表明此腫瘤為MSI陽性。
18.權利要求17所要求的方法,其中RIZ多聚A位點在RIZ(A)8序列中。
19.權利要求17所要求的方法,其中RIZ多聚A位點在RIZ(A)9序列中。
20.權利要求17所要求的方法,其中非正常數目的腺嘌呤包括數目增加。
21.權利要求17所要求的方法,其中非正常數目的腺嘌呤包括數目減少。
22.權利要求17所要求的方法,其中MSI陽性腫瘤由部分結腸癌,胃癌,或子宮內膜癌組成。
23.權利要求22所要求的方法,其中MSI陽性腫瘤是家族型非息肉性結腸腫瘤。
全文摘要
本發明提供一種抑制衛星染色體不穩定性(MSI)陽性腫瘤生長的方法。這一方法將帶有編碼有功能的RIZ1多肽的DNA序列轉入到MSI陽性腫瘤中,并在腫瘤中表達足夠抑制腫瘤生長的RIZ1蛋白質。同時本發明提供一種確定腫瘤MSI狀態的方法。這一方法通過確定RIZ1核酸基因中多聚腺嘌呤中腺嘌呤的數目來確定腫瘤是否為MSI陽性。RIZ1基因中存在非正常數目的腺嘌呤表明此腫瘤為MSI陽性。
文檔編號A61P35/00GK1313130SQ0110992
公開日2001年9月19日 申請日期2001年3月23日 優先權日2001年3月23日
發明者黃石 申請人:黃石