一種可視化標記基因組位點的方法與流程

文檔序號：12543248閱讀：1111來源：國知局

本發明屬于生物技術領域，具體涉及一種可視化標記基因組位點的方法。

背景技術：

在人類細胞的細胞核中，大約32億對堿基組合成龐大的人類基因組，并且進一步凝縮形成不同大小的23對染色體。盡管人類基因組計劃的完成幫助我們獲得了人類基因組的全部序列信息，但是這僅僅是我們認識人類基因組的結構，以及了解由基因組組成的染色質三維結構與人類發育、衰老和疾病等重要生物學過程之間關系的第一步。事實上，已有多項研究證明基因組結構失序是導致衰老和若干嚴重疾病的重要因素(Zhang,W.,etal.,Aging stem cells.A Werner syndrome stem cell model unveils heterochromatin alterations as a driver of human aging.Science,2015.348(6239):p.1160-3.2.Liu,G.H.,et al.,Progressive degeneration of human neural stem cells caused by pathogenic LRRK2.Nature,2012.491(7425):p.603-7.3.Misteli,T.,Higher-order genome organization in human disease.Cold Spring Harb Perspect Biol,2010.2(8):p.a000794.)。因此，明確人類基因組和由其構成的染色質的空間結構，及其與蛋白質和RNA調節子直接的相互作用，將非常有助于我們理解導致衰老和人類疾病的細胞生物學進程(Lopez-Otin,C.,etal.,The hallmarks of aging.Cell,2013.153(6):p.1194-217.2.Misteli,T.,Beyond the sequence:cellular organization of genome function.Cell,2007.128(4):p.787-800.3.Misteli,T.,The cell biology of genomes:bringing the double helix to life.Cell,2013.152(6):p.1209-12.)。

可視化的基因組標記技術可以大大提升對于基因組和染色質結構和功能研究的效率。盡管目前已有多種基因組可視化標記技術應用于科研，但是熒光標記Lac或Tet系統需要將約10kb的外源大片段整合進入基因組目的位點，因此存在低標記效率和潛在的基因組損傷等問題(Robinett,C.C.,etal.,In vivo localization of DNA sequences and visualization of large-scale chromatin organization using lac operator/repressor recognition.J Cell Biol,1996.135(6Pt 2):p.1685-700.2.Heun,P.,etal.,Chromosome dynamics in the yeast interphase nucleus.Science,2001.294(5549):p.2181-6.)；熒光原位雜交(FISH)是目前研究特定序列在基因組中定位的金標準，但是該方法需要在化學固定的細胞中進行操作，因此無法實現活細胞中的基因組可視化標記(Levsky,J.M.and R.H.Singer,Fluorescence in situ hybridization:past,present and future.J Cell Sci,2003.116(Pt 14):p.2833-8.)；盡管近年來興起的CRISPR/Cas9技術可以實現端粒等基因組特殊位點的活細胞精確標記，但是細胞核內的高背景導致的低信噪比以及復雜的系統等缺點導致其無法在腫瘤細胞系之外的其它人類細胞(如多能干細胞和終末分化細胞等)中實現基因組位點的精確標記(Levsky,J.M.and R.H.Singer,Fluorescence in situ hybridization:past,present and future.J Cell Sci,2003.116(Pt 14):p.2833-8.)；另一種被用做基因編輯技術的轉錄激活因子樣效應元件(TALE)同樣可以被用于基因組位點的可視化標記，然而現有的報道中既沒有用FISH金標準驗證TALE介導的基因組標記的正確性，同時顯示其在不同細胞類型中標記的強異質性(Ma,H.,P.Reyes-Gutierrez,and T.Pederson,Visualization of repetitive DNA sequences in human chromosomes with transcription activator-like effectors.Proc Natl Acad Sci USA,2013.110(52):p.21048-53.)。

綜上所述，現有的基因組可視化標記技術都存在缺陷，無法滿足精確標記人類細胞基因組元件和特殊位點的需要。因此，目前無論是科研還是臨床市場，都急需具備精確性、簡便性和長效性的活細胞基因組可視化標記技術來彌補空白，從而推動人類衰老和重要疾病的基礎研究和臨床診療技術的發展。

技術實現要素：

本發明的一個目的是提供一種用于可視化標記基因組位點的試劑盒。

本發明提供的用于可視化標記基因組位點的試劑盒為如下1)-8)中任一種：

1)包括融合蛋白，所述融合蛋白包括用于識別或結合基因組靶序列的轉錄激活樣效應元件蛋白TALE和硫氧還蛋白TRX；

2)包括融合蛋白，所述融合蛋白包括用于識別或結合基因組靶序列的轉錄激活樣效應元件蛋白TALE、熒光蛋白和硫氧還蛋白TRX；

3)包括蛋白組合物，所述蛋白組合物包括用于識別或結合基因組靶序列的轉錄激活樣效應元件蛋白TALE和硫氧還蛋白TRX；

4)包括蛋白組合物，所述蛋白組合物包括用于識別或結合基因組靶序列的轉錄激活樣效應元件蛋白TALE、熒光蛋白和硫氧還蛋白TRX；

5)編碼所述融合蛋白的DNA分子；

6)編碼所述蛋白組合物的DNA分子；

7)包括表達1)或2)所述融合蛋白的載體；

8)包括表達3)或4)所述蛋白組合物的載體。

上述試劑盒中，所述靶序列為端粒DNA、著絲粒DNA、核仁組織區核糖體RNA編碼基因或MUC4蛋白編碼基因。

上述試劑盒中，所述靶序列可以根據本領域公知常識，選擇它們的部分序列作為靶序列。優選的，本發明選擇了如下序列作為靶序列：

所述端粒DNA的靶序列為序列14；

所述著絲粒DNA的靶序列為序列15；

所述核仁組織區核糖體RNA編碼基因的靶序列為序列16；

所述MUC4蛋白編碼基因的靶序列為序列17。

上述試劑盒中，

用于識別或結合基因組中所述端粒DNA的靶序列的融合蛋白為a1)或a2)；

a1)由核定位序列、用于識別或結合基因組中端粒DNA的靶序列的轉錄激活樣效應元件蛋白TALE和硫氧還蛋白TRX融合得到的蛋白質；所述融合蛋白自N端至C端依次包括核定位序列、用于識別或結合基因組中端粒DNA的靶序列的轉錄激活樣效應元件蛋白TALE和硫氧還蛋白TRX；

a2)由核定位序列、用于識別或結合基因組中端粒DNA的靶序列的轉錄激活樣效應元件蛋白TALE、熒光蛋白和硫氧還蛋白TRX融合得到的蛋白質；所述融合蛋白自N端至C端依次包括核定位序列、用于識別或結合基因組中端粒DNA的靶序列的轉錄激活樣效應元件蛋白TALE、熒光蛋白和硫氧還蛋白TRX；

或用于識別或結合基因組中所述著絲粒DNA的靶序列的融合蛋白為a3)或a4)；

a3)由核定位序列、用于識別或結合基因組中著絲粒DNA的靶序列的轉錄激活樣效應元件蛋白TALE和硫氧還蛋白TRX融合得到的蛋白質；所述融合蛋白自N端至C端依次包括核定位序列、用于識別或結合基因組中著絲粒DNA的靶序列的轉錄激活樣效應元件蛋白TALE和硫氧還蛋白TRX；

a4)由核定位序列、用于識別或結合基因組中著絲粒DNA的靶序列的轉錄激活樣效應元件蛋白TALE、熒光蛋白和硫氧還蛋白TRX融合得到的蛋白質；所述融合蛋白自N端至C端依次包括核定位序列、用于識別或結合基因組中著絲粒DNA的靶序列的轉錄激活樣效應元件蛋白TALE、熒光蛋白和硫氧還蛋白TRX；

或用于識別或結合基因組中所述核仁組織區核糖體RNA編碼基因的靶序列的融合蛋白由核定位序列、用于識別或結合基因組中核仁組織區核糖體RNA編碼基因的靶序列的轉錄激活樣效應元件蛋白TALE、熒光蛋白和硫氧還蛋白TRX融合得到的蛋白質；所述融合蛋白自N端至C端依次包括核定位序列、用于識別或結合基因組中核仁組織區核糖體RNA編碼基因的靶序列的轉錄激活樣效應元件蛋白TALE、熒光蛋白和硫氧還蛋白TRX；

或用于識別或結合基因組中MUC4蛋白編碼基因的靶序列的融合蛋白由核定位序列、用于識別或結合基因組中MUC4蛋白編碼基因的靶序列的轉錄激活樣效應元件蛋白TALE、熒光蛋白和硫氧還蛋白TRX融合得到的蛋白質；所述融合蛋白自N端至C端依次包括核定位序列、用于識別或結合基因組中MUC4蛋白編碼基因的靶序列的轉錄激活樣效應元件蛋白TALE、熒光蛋白和硫氧還蛋白TRX。

上述試劑盒中，

所述熒光蛋白為EGFP蛋白或mCherry蛋白；

a1)中所述融合蛋白的氨基酸序列為序列4；

a2)中所述融合蛋白的氨基酸序列為序列7；

a3)中所述融合蛋白的氨基酸序列為序列5；

a4)中所述融合蛋白的氨基酸序列為序列8；

用于識別或結合基因組中所述核仁組織區核糖體RNA編碼基因的靶序列的融合蛋白的氨基酸序列為序列10；

用于識別或結合基因組中所述MUC4蛋白編碼基因的靶序列的融合蛋白的氨基酸序列為序列12。

上述試劑盒中，

所述融合蛋白的N端還帶有Flag標簽序列；所述FLAG標簽序列具體為3xFlag標簽序列。在實際應用中，本領域技術人員還可以利用N端的Flag標簽序列通過免疫熒光染色實驗的方法實現細胞基因組位點的可視化檢測。

上述試劑盒中，

所述EGFP蛋白的編碼基因為序列13第7382-8098位所示的DNA分子；

所述mCherry蛋白的編碼基因為序列6所示的DNA分子；

所述硫氧還蛋白TRX的編碼基因為序列3所示的DNA分子；

所述3xFlag標簽序列的編碼基因為序列1第2113-2181位所示的DNA分子；

所述核定位序列的編碼基因為序列1第2182-2232位所示的DNA分子；

所述用于識別或結合基因組中端粒DNA的靶序列的轉錄激活樣效應元件蛋白TALE的編碼基因為序列1第2233-4725位所示的DNA分子；

所述用于識別或結合基因組中著絲粒DNA的靶序列的轉錄激活樣效應元件蛋白TALE的編碼基因為序列2第121-2613位所示的DNA分子；

所述用于識別或結合基因組中核仁組織區核糖體RNA編碼基因的靶序列的轉錄激活樣效應元件蛋白TALE的編碼基因為序列9第121-2613位所示的DNA分子；

所述用于識別或結合基因組中MUC4蛋白編碼基因的靶序列的轉錄激活樣效應元件蛋白TALE的編碼基因為序列11第121-2613位所示的DNA分子。

上述試劑盒中，

表達a1)中所述融合蛋白的載體是以用于識別或結合端粒DNA的靶序列的TALE載體為骨架載體，將序列3所示的人硫氧還蛋白TRX的編碼基因序列插入骨架載體的KpnI和XhoI位點間得到的載體；其中，所述用于識別或結合端粒DNA的靶序列的TALE載體的核苷酸序列為序列1；

表達a2)中所述融合蛋白的載體是以用于識別或結合端粒DNA的靶序列的TTALE載體為骨架載體，將序列6所示的mCherry編碼基因序列插入骨架載體的HpaI和KpnI位點間得到的載體；其中，所述用于識別或結合端粒DNA的靶序列的TTALE載體是以所述用于識別或結合端粒DNA的靶序列的TALE載體為骨架載體，將序列3所示的人硫氧還蛋白TRX的編碼基因序列插入骨架載體的KpnI和XhoI位點間得到的載體；

表達a3)中所述融合蛋白的載體是以用于識別或結合著絲粒DNA的靶序列的TALE載體為骨架載體，將序列3所示的人硫氧還蛋白的編碼基因序列插入骨架載體的KpnI和XhoI位點間得到載體；其中，所述用于識別或結合著絲粒DNA的靶序列的TALE載體的核苷酸序列為將序列1中第2113-4725位所示的DNA片段替換為序列2所示的DNA片段后得到的序列；

表達a4)中所述融合蛋白的載體是以用于識別或結合著絲粒DNA的靶序列的TTALE載體為骨架載體，將序列13第7382-8098位所示的EGFP編碼基因序列插入骨架載體的HpaI和KpnI位點間得到的載體；其中，所述用于識別或結合著絲粒DNA的靶序列的TTALE載體是以所述用于識別或結合著絲粒DNA的靶序列的TALE載體為骨架載體，將序列3所示的人硫氧還蛋白TRX的編碼基因序列插入骨架載體的KpnI和XhoI位點間得到的載體；

表達用于識別或結合基因組中所述核仁組織區核糖體RNA編碼基因的靶序列的融合蛋白的載體是以用于識別或結合核仁組織區核糖體RNA編碼基因的靶序列的TALE載體為骨架載體，將序列3所示的人硫氧還蛋白TRX的編碼基因序列插入骨架載體的AscI和XhoI位點間得到的載體；其中，所述用于識別或結合核仁組織區核糖體RNA編碼基因的靶序列的TALE載體的核苷酸序列為將序列1第2113-4725位所示的DNA片段替換為序列9所示的DNA片段，且將序列13第7382-8098位所示的EGFP編碼基因序列插入序列1的HpaI和KpnI位點間后得到的序列；

表達用于識別或結合基因組中MUC4蛋白編碼基因的靶序列的融合蛋白的載體是以用于識別或結合MUC4蛋白編碼基因的靶序列的TALE載體為骨架載體，將序列3所示的人硫氧還蛋白TRX的編碼基因序列插入骨架載體的AscI和XhoI位點間得到的載體；其中，所述用于識別或結合MUC4蛋白編碼基因的靶序列的TALE載體的核苷酸序列為將序列1第2113-4725位所示的DNA片段替換為序列11所示的DNA片段，且將序列13第7382-8098位所示的EGFP編碼基因序列插入序列1的HpaI和KpnI位點間后得到的序列。

本發明的第二個目的是提供上述試劑盒或上述試劑盒中的融合蛋白或上述試劑盒中的蛋白組合物的新用途。

本發明提供了上述試劑盒或上述試劑盒中的融合蛋白或上述試劑盒中的蛋白組合物在基因組可視化中的應用。

本發明還提供了上述試劑盒或上述試劑盒中的融合蛋白或上述試劑盒中的蛋白組合物在制備基因組可視化的產品中的應用。

本發明還提供了上述試劑盒或上述試劑盒中的融合蛋白或上述試劑盒中的蛋白組合物在如下b1)-b14)中任一種中的應用：

b1)可視化標記基因組位點；

b2)制備可視化標記基因組位點的產品；

b3)可視化標記細胞基因組中的端粒；

b4)制備可視化標記細胞基因組中的端粒的產品；

b5)可視化標記細胞基因組中的著絲粒；

b6)制備可視化標記細胞基因組中的著絲粒的產品；

b7)可視化標記細胞基因組中的核仁組織區核糖體RNA；

b8)制備可視化標記細胞基因組中的核仁組織區核糖體RNA的產品；

b9)可視化標記細胞基因組中的MUC4編碼基因位點；

b10)制備可視化標記細胞基因組中的MUC4編碼基因位點的產品；

b11)可視化檢測端粒或著絲粒在細胞分裂不同時期的動態變化；

b12)制備可視化檢測端粒或著絲粒在細胞分裂不同時期的動態變化的產品；

b13)可視化檢測端粒在不同細胞衰老模型的動態變化；

b14)制備可視化檢測端粒在不同細胞衰老模型的動態變化的產品。

本發明還有一個目的是提供上述試劑盒中的融合蛋白或上述試劑盒中的蛋白組合物的新用途。

本發明提供了上述試劑盒中的融合蛋白或上述試劑盒中的蛋白組合物在作為基因組可視化工具中的應用。

編碼上述試劑盒中的融合蛋白或上述試劑盒中的蛋白組合物的DNA分子在制備基因組可視化工具中的應用也屬于本發明的保護范圍。

本發明的最后一個目的是提供一種可視化標記基因組位點的方法。

本發明提供的可視化標記基因組位點的方法包括將上述試劑盒中的融合蛋白或表達所述融合蛋白的載體導入細胞中，實現細胞基因組位點的可視化。

上述應用或上述方法中，

所述細胞為人或動物細胞；所述人或動物細胞為人腫瘤細胞、人胚胎腎細胞、人多能干細胞、人成體干細胞、人終末分化細胞或小鼠OP9細胞；所述人或動物細胞具體為人腫瘤細胞系(U2OS、HeLa、MCF7和HepG2)、人胚胎腎細胞系(HEK293)、人多能干細胞(胚胎干細胞hESC)、人多能干細胞(誘導多能干細胞iPSC)、成體干細胞(間充質干細胞)、成體干細胞(神經干細胞hNSC)、終末分化細胞(血管平滑肌細胞hVSMC)或小鼠OP9細胞。

本發明通過在傳統的轉錄激活樣效應元件(TALE)蛋白的C端融合硫氧還蛋白TRX，創建了新型的基因組可視化標記工具TTALE。通過實驗證明：TTALE可用于在腫瘤細胞系、胚胎干細胞、成體干細胞、終末分化細胞等不同類型的人類細胞中精確標記端粒、著絲粒和核糖體RNA編碼序列(Ribosomal DNA,rDNA)等基因組重復序列，以及編碼基因座(MUC4)。TTALE技術能夠彌補目前科研和臨床市場缺乏精確性、簡便性和長效性的活細胞基因組可視化標記技術的空白，從而推動人類衰老和重要疾病的基礎研究和臨床診療技術的發展。

附圖說明

圖1為本發明通過將硫氧還蛋白TRX融合在TALE的C端建立了能夠精確標記細胞基因組中的端粒(Telomere)和著絲粒(Centromere)的基因組可視化標記技術(TTALE)。其中，A為TTALE標記基因組位點的模式圖；B為識別端粒(Telomere)的TTALE在細胞核內的標記結果，從左到右依次為：FLAG標簽標記TTALE標記端粒的結果；FISH探針標記端粒的結果；前兩張圖片疊加的結果，說明TTALE與FISH信號很好的共定位效果；疊加圖片的局部放大結果；C為識別端粒(Telomere)的TTALE在細胞核內標記出的熒光點的分布圖；D為特異性標記端粒(Telomere)的FISH探針在細胞核內標記出的熒光點的分布圖；E為識別著絲粒(Centromere)的TTALE在細胞核內的標記結果；F為識別著絲粒(Centromere)的TTALE在細胞核內標記出的熒光點的分布圖；G為特異性標記著絲粒(Centromere)的FISH探針在細胞核內標記出的熒光點的分布圖。

圖2為利用TTALE精確標記人腫瘤細胞系中的端粒(Telomere)和著絲粒(Centromere)。其中，A為識別端粒(Telomere)的TTALE在處于細胞間期的人腫瘤細胞系中的標記結果；B為識別著絲粒(Centromere)的TTALE在處于細胞間期的人腫瘤細胞系中的標記結果；C為用熒光蛋白(EGFP或mCherry)融合表達的識別端粒(Telomere)或著絲粒(Centromere)的TTALE同時標記處于細胞分裂周期不同時期的HeLa細胞基因組的結果。

圖3為利用TTALE精確標記人多能干細胞(胚胎干細胞hESC或誘導多能干細胞iPSC)及其衍生的成體干細胞(間充質干細胞hMSC和神經干細胞hNSC)和終末分化細胞(神經細胞hNeuron和血管平滑肌細胞hVSMC)中的端粒(Telomere)和著絲粒(Centromere)。其中，A為識別著絲粒(Centromere)的TTALE的標記結果；B為識別端粒(Telomere)的TTALE的標記結果。

圖4為利用TTALE精確標記人類細胞中的核仁組織區核糖體RNA編碼序列(NOR-rDNA)。其中，A為識別核仁組織區核糖體RNA編碼序列的TALE載體的標記結果；B為在hMSC中證明識別NOR-rDNA的TTALE的標記結果能夠與NOR-rDNA的FISH雜交信號共定位，并且其標記信號圍繞核仁組織區的分子標志物Nucleolin和Fibrillarin；C為利用TTALE精確標記人腫瘤細胞(HeLa和U2OS)以及人多能干細胞(hESC，hMSC和hNSC)中的NOR-rDNA。

圖5為利用TTALE精確標記人類細胞中的基因編碼序列(MUC4)。A為與識別編碼基因位點(MUC4)的TALE載體的標記結果；B為利用TTALE精確標記人腫瘤細胞(HeLa)以及人多能干細胞(hMSC)中的MUC4基因位點；C為用熒光蛋白(mCherry)融合表達的識別MUC4基因位點的TTALE標記處于細胞分裂周期不同時期的HeLa細胞基因組的結果。

圖6為利用識別端粒(Telomere)的TTALE在不同的細胞衰老模型中可視化標記基因組中端粒(Telomere)隨細胞衰老進程的動態變化。A為不同細胞衰老模型的模式圖；B為利用識別端粒(Telomere)的TTALE在不同的細胞衰老模型中可視化標記基因組中端粒(Telomere)的結果；C為WRN基因缺失的間充質干細胞的驗證結果(WRN基因缺失驗證實驗)；D為HGPS患者來源的間充質干細胞的驗證結果(Progerin表達驗證實驗)；E為三種細胞衰老模型中端粒縮短的qPCR驗證；F為利用識別端粒(Telomere)的TTALE在不同的細胞衰老模型中可視化標記基因組中端粒(Telomere)的熒光強度統計結果。

圖7為利用識別端粒(Telomere)的TTALE在動物體內可視化標記基因組中端粒(Telomere)的結果。A為構建表達EGFP融合的TTALE的慢病毒載體(Lentivirus)的模式圖；B為利用表達EGFP融合的TTALE的慢病毒載體感染人腫瘤細胞U2OS的結果；C為利用表達EGFP融合的TTALE的慢病毒載體感染小鼠細胞OP9的結果；D為利用表達EGFP融合的TTALE的慢病毒載體(Lentivirus)在小鼠體內可視化標記基因組中端粒(Telomere)的模式圖；E為利用表達EGFP融合的TTALE的慢病毒載體(Lentivirus)在小鼠肌肉、肝臟和腦組織中可視化標記基因組中端粒(Telomere)的結果。

具體實施方式

下述實施例中所使用的實驗方法如無特殊說明，均為常規方法。

下述實施例中所用的材料、試劑等，如無特殊說明，均可從商業途徑得到。

下述實施例中的定量試驗，均設置三次重復實驗，結果取平均值。

下述實施例中的HGPS病人來源的iPSC(簡稱HGPS-iPSCs)：記載于“Liu,G.H.,Barkho,B.Z.,Ruiz,S.,Diep,D.,Qu,J.,Yang,S.L.,Panopoulos,A.D.,Suzuki,K.,Kurian,L.,Walsh,C.,et al.(2011a).Recapitulation of premature ageing with iPSCs from Hutchinson-Gilford progeria syndrome.Nature 472,221-225.”一文，公眾可從申請人處獲得，僅用于重復本發明實驗使用。HGPS病人來源的iPSC(HGPS-iPSCs)中的LMNA基因發生了突變(LMNA基因組序列為GenBank：NG_008692.2；cDNA序列為GenBank：NM_170707.3)，突變類型為C1824T(GGCGG突變為GGTGG)，該位點參比序列為LMNAcDNA序列GenBank：NM_170707.3中的CDS區域。

下述實施例中的HGPS-GC-iPSCs為與HGPS-iPSC具有相同遺傳背景的經過基因矯正的對照細胞系，記載于“Liu,G.H.,Suzuki,K.,Qu,J.,Sancho-Martinez,I.,Yi,F.,Li,M.,Kumar,S.,Nivet,E.,Kim,J.,Soligalla,R.D.,et al.(2011).Targeted gene correction of laminopathy-associated LMNA mutations in patient-specific iPSCs.Cell Stem Cell 8,688-694.”一文，公眾可從申請人處獲得，僅用于重復本發明實驗使用。

下述實施例中的WRN基因缺失的人胚胎干細胞系(WS-ESC)由第一發明人創建，記載于“Zhang,W.et al.Aging stem cells.A Werner syndrome stem cell model unveils heterochromatin alterations as a driver of human aging.Science 348,1160-1163”一文，公眾可從申請人處獲得，僅用于重復本發明實驗使用。WRN蛋白對于細胞核內組成型異染色質的結構維持至關重要，與細胞衰老密切相關，其功能缺失是成年早衰癥發生的直接原因，可引起多組織器官衰老和衰老相關疾病。

下述實施例中的pLE4載體記載于“Huize Pan,Di Guan,Xiaomeng Liu,Jingyi Li,Lixia Wang,Jun Wu,Junzhi Zhou,Weizhou Zhang,Ruotong Ren,Weiqi Zhang,Ying Li,Jiping Yang,Ying Hao,Tingting Yuan,Guohong Yuan,Hu Wang,Zhenyu Ju,Zhiyong Mao,Jian Li,Jing Qu,Fuchou Tang,Guang-Hui Liu(2016).SIRT6 safeguards human mesenchymal stem cells from oxidative stress by coactivating NRF2.Cell Research 26,190-205.”一文，公眾可從申請人處獲得，僅用于重復本發明實驗使用。

下述實施例中的人胚胎干細胞H9細胞系(WT-ESC)是WiCell公司的產品，貨號：WA09(H9)-DL-7。

實施例1、精確標記細胞基因組中的端粒(Telomere)和著絲粒(Centromere)的基因組可視化標記技術(TTALE)的建立

一、融合表達TALE和TRX的表達載體TTALE的構建

1、識別端粒和著絲粒的TALE載體

參照文獻“Zhang,F.,et al.,Efficient construction of sequence-specific TAL effector for modulating mammalian transcription.Nat Biotechnology,2011.29(2):p.149-53，通過Golden Gate Assembly”中的方法利用TALE Toolbox Kit(美國Addgene，貨號為1000000019)分別構建識別端粒的TALE載體和識別著絲粒的TALE載體。

(1)識別端粒的TALE載體

識別端粒的TALE載體的核苷酸序列如序列1所示。識別端粒的TALE載體表達融合蛋白TALE^telo，融合蛋白TALE^tel識別的端粒區DNA序列的靶序列如下：5’-AACCCTAACCCTAACCCT-3’(序列14)。

(2)識別著絲粒的TALE載體

識別著絲粒的TALE載體的核苷酸序列為將序列1中第2113-4725位所示的DNA片段替換為序列2所示的DNA片段后得到的序列。識別著絲粒的TALE載體表達融合蛋白TALE^centro，該融合蛋白N端帶有FLAG標簽序列和核定位序列NLS。融合蛋白TALE^centro識別的著絲粒區DNA序列的靶序列如下：5’-CCATTCCATTCCATTCCA-3’(序列15)。

2、識別端粒和著絲粒的TTALE載體

(1)識別端粒的TTALE載體

以步驟1中的識別端粒的TALE為骨架載體，將序列3所示的人硫氧還蛋白TRX的編碼基因序列插入骨架載體的KpnI和XhoI位點間，得到重組載體，將其記為識別端粒的TTALE載體(圖1A)。識別端粒的TTALE載體表達融合蛋白TALE^telo-TRX，該融合蛋白N端帶有FLAG標簽序列和核定位序列NLS。融合蛋白TALE^telo-TRX的氨基酸序列如序列4所示。

(2)識別著絲粒的TTALE載體

以步驟1中的識別著絲粒的TALE為骨架載體，將序列3所示的人硫氧還蛋白的編碼基因序列插入骨架載體的KpnI和XhoI位點間，得到重組載體，將其記為識別著絲粒的TTALE載體(圖1A)。識別著絲粒的TTALE載體表達融合蛋白TALE^centro-TRX，該融合蛋白N端帶有FLAG標簽序列和核定位序列NLS。融合蛋白TALE^centro-TRX的氨基酸序列如序列5所示。

二、細胞基因組中的端粒和著絲粒分布位點檢測

1、轉染

將步驟一中制備的識別端粒的TTALE載體和識別著絲粒的TTALE載體分別轉染U2OS細胞(美國ATCC，貨號：HTB-96)，同時以識別端粒的TALE載體和識別著絲粒的TALE載體為對照載體(NoTRX)，轉染24-48小時后，分別得到轉染后細胞。

2、免疫熒光染色實驗檢測細胞基因組中的端粒和著絲粒分布位點

利用識別端粒的TTALE載體、識別著絲粒的TTALE載體和對照載體N端的FLAG標簽序列進行免疫熒光染色實驗，檢測轉染后細胞基因組中的端粒和著絲粒分布位點。具體步驟如下：用4％多聚甲醛(北京鼎國昌盛生物技術有限責任公司，貨號：AR-0211)固定轉染后細胞，然后用含0.4％TritonX100(美國Sigma公司，貨號為T9284)的PBS室通透15分鐘，用一抗稀釋液(含有10％驢血清的PBS)室溫封閉30分鐘，用一抗稀釋液配制的小鼠抗FLAG抗體4度孵育過夜，用PBS室溫清洗3次，每次10分鐘，用ALEXA-488標記的驢抗小鼠IgG室溫孵育1小時，用PBS室溫清洗3次，每次10分鐘，用1：2000的Hoechst標記細胞核，最后利用熒光顯微鏡進行觀察，并利用ImageJ軟件進行熒光強度計算和統計分析。如需與FISH探針進行共定位分析，則在孵育小鼠抗FLAG抗體之后，進行FISH探針孵育，再用Biotin標記的抗小鼠IgG室溫孵育1小時，最后用ALEXA-488標記的Streptavidin(Vectorlabs，貨號為SA-5488)孵育1小時。

3、熒光原位雜交實驗檢測細胞基因組中的端粒和著絲粒分布位點

利用特異性識別端粒和著絲粒的FISH探針完成熒光原位雜交實驗。具體步驟為：用4％多聚甲醛固定轉染后細胞，然后用含0.4％TritonX100(美國Sigma公司，貨號為T9284)的PBS室通透15分鐘，再用100微克/毫升的RNAase A(美國Sigma公司，貨號為83831)于37度孵育30分鐘，用90度5分鐘變性過的濃度為50nM FISH探針(韓國PANAGENE公司，端粒FISH探針貨號為F1002；著絲粒FISH探針貨號為F3003)85度孵育10分鐘，之后于室溫避光孵育過夜，用PBS室溫清洗3次，每次10分鐘，用1：2000的Hoechst標記細胞核，最后利用熒光顯微鏡進行觀察，并利用ImageJ軟件進行熒光強度計算和統計分析。

結果如圖1所示。從圖1中可以看出：與識別端粒或著絲粒的TALE(圖1B中的No TRX，圖1E中的No TRX)相比，識別端粒或著絲粒的TTALE在細胞核中標記的熒光點與FISH探針標記的熒光點幾乎完全重合(圖1B和圖1E)，并且其熒光點分布與FISH探針標記的熒光點的分布非常相似(圖1C，1D，1F，1G)，說明本發明的TTALE能夠精確標記人類細胞基因組中的端粒或著絲粒位點。

實施例2、TTALE在精確標記不同類型人類細胞中的端粒、著絲粒、核仁組織區核糖體RNA編碼序列(NOR-rDNA)以及編碼基因位點(MUC4)中的應用

一、TTALE在精確標記不同類型人類細胞中的端粒和著絲粒中的應用

將實施例1中的U2OS細胞分別替換為如下細胞：人腫瘤細胞系(MCF7和HepG2，美國ATCC公司，貨號分別為HTB-22和HB-8065)、人胚胎腎細胞系(HEK293，美國ATCC公司，貨號為CRL-1573)、人多能干細胞(胚胎干細胞hESC，Wicell公司，貨號為WA-09)、人多能干細胞(誘導多能干細胞iPSC，Wicell公司，貨號為IISH6i-CML17)、成體干細胞(間充質干細胞，Lonza公司，貨號為PT-2501)、成體干細胞(神經干細胞hNSC，Wicell公司，貨號為NSC-H9)、終末分化細胞(血管平滑肌細胞hVSMC，Lonza公司，貨號為CC-2571)，且保持其他步驟不變，然后利用熒光顯微鏡進行觀察，并利用ImageJ軟件進行熒光強度計算和統計分析。

結果表明：TTALE可精確標記不同類型人類細胞基因組中的端粒和著絲粒，實現上述各個細胞中端粒和著絲粒的可視化(圖2A-B，圖3)。

二、熒光蛋白融合表達的識別端粒或著絲粒的TTALE在精確標記人類細胞中的端粒和著絲粒中的應用

1、mCherry熒光蛋白融合表達的識別端粒的TTALE的制備

以實施例1中的識別端粒的TTALE為骨架載體，將序列6所示的mCherry編碼基因序列插入骨架載體的HpaI和KpnI位點間，得到重組載體，將其記作mCherry融合表達的識別端粒的TTALE載體。mCherry融合表達的識別端粒的TTALE載體(mCherry-TTALE^telo)表達融合蛋白TTALE^telo-mCherry-TRX，該融合蛋白N端帶有FLAG標簽序列和核定位序列NLS。融合蛋白TTALE^telo-mCherry-TRX的氨基酸序列如序列7所示。

2、EGFP熒光蛋白融合表達的識別著絲粒的TTALE的制備

以識別著絲粒的TTALE為骨架載體，將序列13第7382-8098位所示的EGFP編碼基因序列插入骨架載體的HpaI和KpnI位點間，得到EGFP融合表達的識別著絲粒的TTALE。EGFP融合表達的識別著絲粒的TTALE(EGFP-TTALE^centro)表達融合蛋白TTALE^centro-EGFP-TRX，該融合蛋白N端帶有FLAG標簽序列和核定位序列NLS。融合蛋白TTALE^centro-EGFP-TRX的氨基酸序列如序列8所示。

3、熒光蛋白融合表達的識別端粒或著絲粒的TTALE標記HeLa細胞

分別將mCherry融合表達的識別端粒的TTALE(mCherry-TTALE^telo)和EGFP融合表達的識別著絲粒的TTALE(EGFP-TTALE^centro)轉染處于細胞分裂周期不同時期的HeLa細胞中，轉染24-48小時后，用4％多聚甲醛固定細胞，然后利用熒光顯微鏡進行觀察，并利用ImageJ軟件進行熒光強度計算和統計分析。

結果表明：熒光蛋白融合表達的識別端粒或著絲粒的TTALE可精確標記人類細胞中的端粒和著絲粒，實現處于細胞分裂周期不同時期的細胞中端粒和著絲粒的可視化(圖2C)。

三、TTALE在精確標記不同類型人類細胞中的核仁組織區核糖體RNA編碼序列(NOR-rDNA)中的應用

1、EGFP融合表達的識別核仁組織區核糖體RNA編碼基因的TALE的制備

參照文獻“Zhang,F.,et al.,Efficient construction of sequence-specific TAL effector for modulating mammalian transcription.Nat Biotechnology,2011.29(2):p.149-53，通過Golden Gate Assembly”中的方法利用TALE Toolbox Kit(美國Addgene，貨號為1000000019)構建識別核仁組織區核糖體RNA編碼序列的TALE載體。

識別核仁組織區核糖體RNA編碼基因的TALE載體的核苷酸序列為將序列1第2113-4725位所示的DNA片段替換為序列9所示的DNA片段，且將序列13第7382-8098位所示的EGFP編碼基因序列插入序列1的HpaI和KpnI位點間后得到的序列。識別核仁組織區核糖體RNA編碼基因的TALE載體表達融合蛋白TALE^rDNA-EGFP，該融合蛋白N端帶有FLAG標簽序列和核定位序列NLS。融合蛋白TALE^rDNA-EGFP識別的核仁組織區核糖體RNA編碼基因的靶序列如下：5’-ACCCTACTGATGATGTGT-3’(序列16)。

2、熒光蛋白融合表達的識別核仁組織區核糖體RNA編碼基因的TTALE的制備

以步驟1中的識別核仁組織區核糖體RNA編碼基因的TALE為骨架載體，將序列3所示的人硫氧還蛋白TRX的編碼基因序列插入骨架載體的AscI和XhoI位點間，得到重組載體，將其記為識別核仁組織區核糖體RNA編碼基因的TTALE載體(EGFP-TTALE^rDNA)。識別核仁組織區核糖體RNA編碼基因的TTALE載體(EGFP-TTALE^rDNA)表達融合蛋白TALE^rDNA-EGFP-TRX。融合蛋白TALE^rDNA-EGFP-TRX的氨基酸序列如序列10所示。

將識別核仁組織區核糖體RNA編碼序列的TTALE載體(EGFP-TTALE^rDNA)中的EGFP編碼基因替換為序列6所示的mCherry編碼基因，得到識別核仁組織區核糖體RNA編碼基因的TTALE載體(mCherry-TTALE^rDNA)。識別核仁組織區核糖體RNA編碼基因的TTALE載體(mCherry-TTALE^rDNA)表達融合蛋白TALE^rDNA-mCherry-TRX。

3、識別核仁組織區核糖體RNA編碼基因的TTALE標記細胞

分別將識別核仁組織區核糖體RNA編碼基因的TALE載體和識別核仁組織區核糖體RNA編碼基因的TTALE轉染人腫瘤細胞(HeLa和U2OS)以及人多能干細胞(hESC，hMSC和hNSC)中，轉染24-48小時后，用4％多聚甲醛固定細胞，然后利用熒光顯微鏡進行觀察，并利用ImageJ軟件進行熒光強度計算和統計分析，分別檢測不同細胞中的核仁組織區核糖體RNA編碼基因的熒光分布情況。

結果表明：與識別核仁組織區核糖體RNA編碼基因的TALE載體相比(圖4A)，識別核仁組織區核糖體RNA編碼基因的TTALE可精確標記人腫瘤細胞(HeLa和U2OS)以及人多能干細胞(hESC，hMSC和hNSC)中的核糖體RNA，實現核仁組織區核糖體RNA編碼基因的可視化(圖4B,4C)。

四、TTALE在精確標記不同類型人類細胞中的編碼基因位點(MUC4)中的應用

1、EGFP融合表達的識別編碼基因位點(MUC4)的TALE的制備

識別編碼基因位點(MUC4)的TALE載體的核苷酸序列為將序列1第2113-4725位所示的DNA片段替換為序列11所示的DNA片段，且將序列13第7382-8098位所示的EGFP編碼基因序列插入序列1的HpaI和KpnI位點間后得到的序列。識別編碼基因位點(MUC4)TALE載體表達融合蛋白TALE^MUC4-EGFP，該融合蛋白N端帶有FLAG標簽序列和核定位序列NLS。融合蛋白TALE^MUC4-EGFP識別的編碼基因位點(MUC4)的靶序列如下：5’-CCTGTCACCGACACTTCC-3’(序列17)。

2、熒光蛋白融合表達的識別編碼基因位點(MUC4)的TTALE的制備

以步驟1中的識別編碼基因位點(MUC4)的TALE為骨架載體，將序列3所示的人硫氧還蛋白TRX的編碼基因序列插入骨架載體的AscI和XhoI位點間，得到重組載體，將其記為識別編碼基因位點(MUC4)的TTALE載體(EGFP-TTALE^MUC4)。識別編碼基因位點(MUC4)的TTALE載體表達融合蛋白TTALE^MUC4-EGFP-TRX。融合蛋白TTALE^MUC4-EGFP-TRX的氨基酸序列如序列12所示。

將識別編碼基因位點(MUC4)的TTALE載體(EGFP-TTALE^MUC4)中的EGFP編碼基因替換為序列6所示的mCherry編碼基因，得到識別核仁組織區核糖體RNA編碼序列的TTALE載體(mCherry-TTALE^MUC4)。識別核仁組織區核糖體RNA編碼序列的TTALE載體(mCherry-TTALE ^MUC4)表達融合蛋白TALE^MUC4-mCherry-TRX。

3、識別編碼基因位點(MUC4)的TTALE標記細胞

分別將識別編碼基因位點(MUC4)的TALE和識別編碼基因位點(MUC4)的TTALE分別轉染處于細胞間期和細胞分裂周期的hMSC和HeLa細胞中，轉染24-48小時后，用4％多聚甲醛固定細胞，然后利用熒光顯微鏡進行觀察，并利用ImageJ軟件進行熒光強度計算和統計分析。

結果表明：與識別編碼基因位點(MUC4)的TALE載體相比(圖5A)，識別編碼基因位點(MUC4)的TTALE可精確標記細胞間期和細胞分裂周期的hMSC和HeLa細胞中的編碼基因位點(MUC4)，實現編碼基因位點(MUC4)的可視化(圖5B-C)。

實施例3、TTALE標記不同細胞衰老模型中端粒在可視化細胞衰老進程的動態變化中的應用

1、EGFP融合表達的識別端粒的TTALE載體的制備

將序列13第7382-8098位所示的EGFP編碼基因序列替換實施例2步驟二的1中mCherry熒光蛋白融合表達的識別端粒的TTALE載體(mCherry-TTALE^telo)中的mCherry編碼基因序列，得到EGFP融合表達的識別端粒的TTALE載體(EGFP-TTALE^telo)，該融合蛋白N端帶有FLAG標簽序列和核定位序列NLS。

2、EGFP融合表達的識別端粒的TTALE載體標記不同衰老模型的人類間充質干細胞

(1)不同衰老模型的人類間充質干細胞的建立

1)野生型人間充質干細胞(WT-MSC)和WRN基因缺失的人間充質干細胞(WS-MSC)的制備

本發明將野生型人胚胎干細胞H9細胞系(WT-ESC)和WRN基因缺失的人胚胎干細胞系(WS-ESC)，進一步體外定向分化為間充質干細胞(WT-MSC)和WRN基因缺失的人間充質干細胞(WS-MSC)，具體方法如下：

A、將野生型人胚胎干細胞H9細胞系(WT-ESC)和WRN基因缺失的人胚胎干細胞系(WS-ESC)分別進行擬胚體(EB)分化，獲得擬胚體(EB)。擬胚體(EB)分化具體步驟如下：準備含有300-500個細胞、大小均一的ESC克隆，用室溫PBS(Gibco，10010023)清洗一次，用Dispase(Invitrogen公司，貨號為17105041)37℃消化20-30min。待ESC克隆形成球體后，用CDF12培養基重懸后，加到低粘附培養板(Corning公司，貨號3471)中，37℃，5％CO₂條件培養1-3天后即形成擬胚體。

B、將步驟A獲得的擬胚體(EB)接種于基質膠(matrigel)包被的6孔板中進行培養，繼續培養2周至纖維狀細胞出現。再經過一次傳代后，利用流式細胞術分選其中的CD73、CD90和CD105均為陽性的細胞類群(圖1)，即為野生型間充質干細胞(記為WT-MSC)和WRN基因缺失的人間充質干細胞系(記為WS-MSC)。

2)HGPS病人來源的(HGPS-MSC)和經過基因矯正的人間充質干細胞(HGPS-GC-MSC)的制備

本實施例將HGPS-iPSCs和HGPS-GC-iPSCs進一步體外定向分化為間充質干細胞HGPS-MSC和HGPS-GC-MSC。具體方法如下：

分別將HGPS-iPSCs和HGPS-GC-iPSCs進行擬胚體(EB)分化，分化14天，將EB接種于基質膠(matrigel)包被的6孔板中進行培養，繼續培養2周至纖維狀細胞出現。再經過一次傳代后，利用流式細胞術分選其中CD73、CD90和CD105均為陽性的細胞類群，即為HGPS病人來源的間充質干細胞(記為HGPS-MSC)和經過基因矯正的人間充質干細胞(記為HGPS-GC-MSC)。

3)野生型間充質干細胞的早代細胞(EP-WT-MSC)與晚代細胞(LP-WT-MSC)的制備

將步驟(1)中的野生型間充質干細胞(WT-MSC)連續傳代培養至12代(記為P12代)，將P1-P6代細胞記為早代間充質干細胞(記為EP-WT-MSC)，將P10-P12代細胞記晚代間充質干細胞(記為LP-WT-MSC)。選取P6和P12代WT-MSC細胞作為EP-WT-MSC和LP-WT-MSC的代表進行下述相關實驗。

(2)EGFP融合表達的識別端粒的TTALE載體標記不同衰老模型的人類間充質干細胞

將EGFP融合表達的識別端粒的TTALE載體利用化學轉染方法導入不同衰老模型的人類間充質干細胞中(圖6A，6C和6D)，轉染24-48小時后，用4％多聚甲醛固定細胞，然后利用熒光顯微鏡進行觀察，并利用ImageJ軟件進行熒光強度計算和統計分析。

3、qPCR方法檢測不同衰老模型的人類間充質干細胞中端粒長度

以步驟2中不同衰老模型的人類間充質干細胞為供試細胞。分別從供試細胞中提取基因組DNA，通過實時定量PCR的方法檢測供試細胞中端粒長度。其中，以36B4為端粒長度檢測的對照基因。引物序列如下：

Tel-F：5’-GGTTTTTGAGGGTGAGGGTGAGGGTGAGGGTGAGGGT-3’；

Tel-R：5’-TCCCGACTATCCCTATCCCTATCCCTATCCCTATCCCTA-3’；

36B4u：5’-CAGCAAGTGGGAAGGTGTAATCC-3’；

36B4d：5’-CCCATTCTATCATCAACGGGTACAA-3’。

結果表明，利用識別端粒的TTALE能夠在不同的細胞衰老模型中可視化標記基因組中端粒，并能夠反映出衰老細胞中標記的端粒的熒光強度顯著降低(圖6B，6F)，該結果與利用qPCR方法檢測的衰老細胞中端粒長度縮短的結果一致(圖6E)，說明TTALE技術能夠精確地可視化標記基因組中端粒隨細胞衰老進程的動態變化。

實施例4、識別端粒的TTALE在體外和動物體內可視化標記基因組中端粒中的應用

一、識別端粒的TTALE在體外可視化標記基因組中端粒中的應用

1、EGFP融合表達的識別端粒的TTALE慢病毒載體質粒的制備及包裝

將EGFP融合表達的識別端粒的TTALE的編碼基因序列插入pLE4載體的限制性內切酶酶切位點MluI和SalI之間，且保持pLE4載體的其他序列不變，得到慢病毒載體質粒pLE4-EGFP-TTALE(其核苷酸序列如序列13所示)。然后將慢病毒載體質粒pLE4-EGFP-TTALE在HEK293T(美國ATCC，貨號：CRL-3216)細胞中進行慢病毒的病毒包裝，慢病毒包裝質粒購自Addgene，貨號如下：psPAX(12260)，pMD2.G(12259)。

將慢病毒載體質粒pLE4-EGFP-TTALE與包裝質粒psPAX和pMD.2G共轉染至HEK293T細胞中，與轉染后48小時收集培養上清，并通過超高速離心純化慢病毒顆粒。

2、EGFP融合表達的識別端粒的慢病毒載體質粒標記人或小鼠細胞

利用產生表達EGFP融合的識別端粒的TTALE的慢病毒感染人U2OS細胞(美國ATCC，貨號：HTB-96)和小鼠OP9細胞(美國ATCC，貨號：CRL-2749)，感染24-72小時后，用4％多聚甲醛固定細胞，然后利用熒光顯微鏡進行觀察。

結果表明，利用表達EGFP融合的識別端粒的TTALE的慢病毒載體能夠在體外可視化標記人和小鼠細胞基因組中端粒(圖7B，7C)。

二、EGFP融合表達的識別端粒的TTALE在動物體內可視化標記基因組中端粒中的應用

用Opti-MEM(ThermoFisher公司，貨號：51985042)將步驟一中制備的表達EGFP融合的識別端粒的TTALE的慢病毒載體稀釋為10⁸病毒/微升劑量，分別在小鼠的脛骨前肌、肝臟和大腦海馬區注射5微升病毒液(圖7D)，注射7-10天后，分離上述小鼠組織，用4％多聚甲醛固定后進行冰凍切片，分別用WGA抗體(肌肉)(ThermoFisher公司，貨號：W32464)、ALB抗體(肝臟)(Abcam公司，貨號：ab8940)和NeuN抗體(大腦海馬區)(Abcam公司，貨號：ab177487)進行免疫熒光染色，最后用熒光顯微鏡觀察。免疫熒光染色的具體步驟如下：用4％多聚甲醛(北京鼎國昌盛生物技術有限責任公司，貨號：AR-0211)室溫固定切片10分鐘，然后用含0.4％TritonX100(美國Sigma公司，貨號為T9284)的PBS室通透30分鐘，用一抗稀釋液(含有10％驢血清的PBS)室溫封閉45分鐘，用一抗稀釋液配制的WGA抗體(肌肉)(ThermoFisher公司，貨號：W32464)、ALB抗體(肝臟)(Abcam公司，貨號：ab8940)和NeuN抗體(大腦海馬區)(Abcam公司，貨號：ab177487)分別4度孵育過夜，用PBS室溫清洗3次，每次10分鐘，分別用ALEXA-488標記的IgG室溫孵育1小時，用PBS室溫清洗3次，每次10分鐘，用1：2000的Hoechst標記細胞核，最后利用熒光顯微鏡進行觀察，并利用ImageJ軟件進行熒光強度計算和統計分析。

結果表明：利用表達EGFP融合的識別端粒的TTALE的慢病毒載體能夠在小鼠不同組織內實現可視化標記基因組中端粒(圖7E)。

序列表

<110>中國科學院生物物理研究所

<120>一種可視化標記基因組位點的方法

<160>17

<210>1

<211>7746bp

<212>DNA

<213>人工序列

<220>

<223>

<400>1

ctcatgacca aaatccctta acgtgagtta cgcgcgcgtc gttccactga gcgtcagacc 60

ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct 120

tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa 180

ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact gttcttctag 240

tgtagccgta gttagcccac cacttcaaga actctgtagc accgcctaca tacctcgctc 300

tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg 360

actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca 420

cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat 480

gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg 540

tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc 600

ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc 660

ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc 720

cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg 780

cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga 840

gcgaggaagc ggaaggcgag agtagggaac tgccaggcat caaactaagc agaaggcccc 900

tgacggatgg cctttttgcg tttctacaaa ctctttctgt gttgtaaaac gacggccagt 960

cttaagctcg ggccccctgg gcggttctga taacgagtaa tcgttaatcc gcaaataacg 1020

taaaaacccg cttcggcggg tttttttatg gggggagttt agggaaagag catttgtcag 1080

aatatttaag ggcgcctgtc actttgcttg atatatgaga attatttaac cttataaatg 1140

agaaaaaagc aacgcacttt aaataagata cgttgctttt tcgattgatg aacacctata 1200

attaaactat tcatctatta tttatgattt tttgtatata caatatttct agtttgttaa 1260

agagaattaa gaaaataaat ctcgaaaata ataaagggaa aatcagtttt tgatatcaaa 1320

attatacatg tcaacgataa tacaaaatat aatacaaact ataagatgtt atcagtattt 1380

attatcattt agaataaatt ttgtgtcgcc cttaattgtg agcggataac aattacgagc 1440

ttcatgcaca gtggcgttga cattgattat tgactagtta ttaatagtaa tcaattacgg 1500

ggtcattagt tcatagccca tatatggagt tccgcgttac ataacttacg gtaaatggcc 1560

cgcctggctg accgcccaac gacccccgcc cattgacgtc aataatgacg tatgttccca 1620

tagtaacgcc aatagggact ttccattgac gtcaatgggt ggagtattta cggtaaactg 1680

cccacttggc agtacatcaa gtgtatcata tgccaagtac gccccctatt gacgtcaatg 1740

acggtaaatg gcccgcctgg cattatgccc agtacatgac cttatgggac tttcctactt 1800

ggcagtacat ctacgtatta gtcatcgcta ttaccatggt gatgcggttt tggcagtaca 1860

tcaatgggcg tggatagcgg tttgactcac ggggatttcc aagtctccac cccattgacg 1920

tcaatgggag tttgttttgg caccaaaatc aacgggactt tccaaaatgt cgtaacaact 1980

ccgccccatt gacgcaaatg ggcggtaggc gtgtacggtg ggaggtctat ataagcagag 2040

ctctctggct aactagagaa cccactgctt actggcttat cgaaattaat acgactcact 2100

ataggggcca ccatggacta taaggaccac gacggagact acaaggatca tgatattgat 2160

tacaaagacg atgacgataa gatggcccca aagaagaagc ggaaggtcgg tatccacgga 2220

gtcccagcag ccgtagattt gagaactttg ggatattcac agcagcagca ggaaaagatc 2280

aagcccaaag tgaggtcgac agtcgcgcag catcacgaag cgctggtggg tcatgggttt 2340

acacatgccc acatcgtagc cttgtcgcag caccctgcag cccttggcac ggtcgccgtc 2400

aagtaccagg acatgattgc ggcgttgccg gaagccacac atgaggcgat cgtcggtgtg 2460

gggaaacagt ggagcggagc ccgagcgctt gaggccctgt tgacggtcgc gggagagctg 2520

agagggcctc cccttcagct ggacacgggc cagttgctga agatcgcgaa gcggggagga 2580

gtcacggcgg tcgaggcggt gcacgcgtgg cgcaatgcgc tcacgggagc acccctcaac 2640

ctgaccccag agcaggtcgt ggcaattgcg agcaacatcg ggggaaagca ggcactcgaa 2700

accgtccaga ggttgctgcc tgtgctgtgc caagcgcacg gacttacgcc agagcaggtc 2760

gtggcaattg cgagcaacat cgggggaaag caggcactcg aaaccgtcca gaggttgctg 2820

cctgtgctgt gccaagcgca cggactaacc ccagagcagg tcgtggcaat tgcgagccat 2880

gacgggggaa agcaggcact cgaaaccgtc cagaggttgc tgcctgtgct gtgccaagcg 2940

cacgggttga ccccagagca ggtcgtggca attgcgagcc atgacggggg aaagcaggca 3000

ctcgaaaccg tccagaggtt gctgcctgtg ctgtgccaag cgcacggcct gaccccagag 3060

caggtcgtgg caattgcgag ccatgacggg ggaaagcagg cactcgaaac cgtccagagg 3120

ttgctgcctg tgctgtgcca agcgcacgga ctgacaccag agcaggtcgt ggcaattgcg 3180

agcaacggag ggggaaagca ggcactcgaa accgtccaga ggttgctgcc tgtgctgtgc 3240

caagcgcacg gacttacacc cgaacaagtc gtggcaattg cgagcaacat cgggggaaag 3300

caggcactcg aaaccgtcca gaggttgctg cctgtgctgt gccaagcgca cggacttacg 3360

ccagagcagg tcgtggcaat tgcgagcaac atcgggggaa agcaggcact cgaaaccgtc 3420

cagaggttgc tgcctgtgct gtgccaagcg cacggactaa ccccagagca ggtcgtggca 3480

attgcgagcc atgacggggg aaagcaggca ctcgaaaccg tccagaggtt gctgcctgtg 3540

ctgtgccaag cgcacgggtt gaccccagag caggtcgtgg caattgcgag ccatgacggg 3600

ggaaagcagg cactcgaaac cgtccagagg ttgctgcctg tgctgtgcca agcgcacggc 3660

ctgaccccag agcaggtcgt ggcaattgcg agccatgacg ggggaaagca ggcactcgaa 3720

accgtccaga ggttgctgcc tgtgctgtgc caagcgcacg gactgacacc agagcaggtc 3780

gtggcaattg cgagcaacgg agggggaaag caggcactcg aaaccgtcca gaggttgctg 3840

cctgtgctgt gccaagcgca cggcctcacc ccagagcagg tcgtggcaat tgcgagcaac 3900

atcgggggaa agcaggcact cgaaaccgtc cagaggttgc tgcctgtgct gtgccaagcg 3960

cacggactta cgccagagca ggtcgtggca attgcgagca acatcggggg aaagcaggca 4020

ctcgaaaccg tccagaggtt gctgcctgtg ctgtgccaag cgcacggact aaccccagag 4080

caggtcgtgg caattgcgag ccatgacggg ggaaagcagg cactcgaaac cgtccagagg 4140

ttgctgcctg tgctgtgcca agcgcacggg ttgaccccag agcaggtcgt ggcaattgcg 4200

agccatgacg ggggaaagca ggcactcgaa accgtccaga ggttgctgcc tgtgctgtgc 4260

caagcgcacg gcctgacccc agagcaggtc gtggcaattg cgagccatga cgggggaaag 4320

caggcactcg aaaccgtcca gaggttgctg cctgtgctgt gccaagcgca cggactgaca 4380

ccagagcagg tcgtggcaat tgcgagcaac ggagggggaa agcaggcact cgaaaccgtc 4440

cagaggttgc tgcctgtgct gtgccaagcg cacggactca cgcctgagca ggtagtggct 4500

attgcatcca acatcggggg cagacccgca ctggagtcaa tcgtggccca gctttcgagg 4560

ccggaccccg cgctggccgc actcactaat gatcatcttg tagcgctggc ctgcctcggc 4620

ggacgacccg ccttggatgc ggtgaagaag gggctcccgc acgcgcctgc attgattaag 4680

cggaccaaca gaaggattcc cgagaggaca tcacatcgag tggcaagtta acggcgcgcc 4740

ggtaccctcg agaaaatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg 4800

cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 4860

aaatgaggaa attgcatcac aacactcaac cctatctcgg tctattcttt tgatttataa 4920

gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 4980

gcgaattaat tctgtggaat gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag 5040

caggcagaag tatgcaaagc atgcatctca attagtcagc aaccaggtgt ggaaagtccc 5100

caggctcccc agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccatag 5160

tcccgcccct aactccgccc atcccgcccc taactccgcc cagttccgcc cattctccgc 5220

cccatggctg actaattttt tttatttatg cagaggccga ggccgcctct gcctctgagc 5280

tattccagaa gtagtgagga ggcttttttg gaggcctagg cttttgcaaa aagctcccgg 5340

gagcttgtat atccattttc ggatctgatc agcacgtgat gaaaaagcct gaactcaccg 5400

cgacgtctgt cgagaagttt ctgatcgaaa agttcgacag cgtctccgac ctgatgcagc 5460

tctcggaggg cgaagaatct cgtgctttca gcttcgatgt aggagggcgt ggatatgtcc 5520

tgcgggtaaa tagctgcgcc gatggtttct acaaagatcg ttatgtttat cggcactttg 5580

catcggccgc gctcccgatt ccggaagtgc ttgacattgg ggaattcagc gagagcctga 5640

cctattgcat ctcccgccgt gcacagggtg tcacgttgca agacctgcct gaaaccgaac 5700

tgcccgctgt tctgcagccg gtcgcggagg ccatggatgc gatcgctgcg gccgatctta 5760

gccagacgag cgggttcggc ccattcggac cgcaaggaat cggtcaatac actacatggc 5820

gtgatttcat atgcgcgatt gctgatcccc atgtgtatca ctggcaaact gtgatggacg 5880

acaccgtcag tgcgtccgtc gcgcaggctc tcgatgagct gatgctttgg gccgaggact 5940

gccccgaagt ccggcacctc gtgcacgcgg atttcggctc caacaatgtc ctgacggaca 6000

atggccgcat aacagcggtc attgactgga gcgaggcgat gttcggggat tcccaatacg 6060

aggtcgccaa catcttcttc tggaggccgt ggttggcttg tatggagcag cagacgcgct 6120

acttcgagcg gaggcatccg gagcttgcag gatcgccgcg gctccgggcg tatatgctcc 6180

gcattggtct tgaccaactc tatcagagct tggttgacgg caatttcgat gatgcagctt 6240

gggcgcaggg tcgatgcgac gcaatcgtcc gatccggagc cgggactgtc gggcgtacac 6300

aaatcgcccg cagaagcgcg gccgtctgga ccgatggctg tgtagaagta ctcgccgata 6360

gtggaaaccg acgccccagc actcgtccga gggcaaagga atagcacgtg ctacgagatt 6420

tcgattccac cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg 6480

gctggatgat cctccagcgc ggggatctca tgctggagtt cttcgcccac cccaacttgt 6540

ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 6600

catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 6660

tctgtatacc gtcgacctct agctagagct tggcgtaatc atggtcatta ccaatgctta 6720

atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc 6780

cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag cgctgcgatg 6840

ataccgcgag aaccacgctc accggctccg gatttatcag caataaacca gccagccgga 6900

agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt 6960

tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatc 7020

gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc 7080

caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc 7140

ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca 7200

gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag 7260

tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg 7320

tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa 7380

cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa 7440

cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga 7500

gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga 7560

atactcatat tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg 7620

agcggataca tatttgaatg tatttagaaa aataaacaaa taggggtcag tgttacaacc 7680

aattaaccaa ttctgaacat tatcgcgagc ccatttatac ctgaatatgg ctcataacac 7740

cccttg 7746

<210>2

<211>2613bp

<212>DNA

<213>人工序列

<220>

<223>

<400>2

atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60

gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120

gtagatttga gaactttggg atattcacag cagcagcagg aaaagatcaa gcccaaagtg 180

aggtcgacag tcgcgcagca tcacgaagcg ctggtgggtc atgggtttac acatgcccac 240

atcgtagcct tgtcgcagca ccctgcagcc cttggcacgg tcgccgtcaa gtaccaggac 300

atgattgcgg cgttgccgga agccacacat gaggcgatcg tcggtgtggg gaaacagtgg 360

agcggagccc gagcgcttga ggccctgttg acggtcgcgg gagagctgag agggcctccc 420

cttcagctgg acacgggcca gttgctgaag atcgcgaagc ggggaggagt cacggcggtc 480

gaggcggtgc acgcgtggcg caatgcgctc acgggagcac ccctcaacct gaccccagag 540

caggtcgtgg caattgcgag ccatgacggg ggaaagcagg cactcgaaac cgtccagagg 600

ttgctgcctg tgctgtgcca agcgcacgga cttacgccag agcaggtcgt ggcaattgcg 660

agccatgacg ggggaaagca ggcactcgaa accgtccaga ggttgctgcc tgtgctgtgc 720

caagcgcacg gactaacccc agagcaggtc gtggcaattg cgagcaacat cgggggaaag 780

caggcactcg aaaccgtcca gaggttgctg cctgtgctgt gccaagcgca cgggttgacc 840

ccagagcagg tcgtggcaat tgcgagcaac ggagggggaa agcaggcact cgaaaccgtc 900

cagaggttgc tgcctgtgct gtgccaagcg cacggcctga ccccagagca ggtcgtggca 960

attgcgagca acggaggggg aaagcaggca ctcgaaaccg tccagaggtt gctgcctgtg 1020

ctgtgccaag cgcacggact gacaccagag caggtcgtgg caattgcgag ccatgacggg 1080

ggaaagcagg cactcgaaac cgtccagagg ttgctgcctg tgctgtgcca agcgcacgga 1140

cttacacccg aacaagtcgt ggcaattgcg agccatgacg ggggaaagca ggcactcgaa 1200

accgtccaga ggttgctgcc tgtgctgtgc caagcgcacg gacttacgcc agagcaggtc 1260

gtggcaattg cgagcaacat cgggggaaag caggcactcg aaaccgtcca gaggttgctg 1320

cctgtgctgt gccaagcgca cggactaacc ccagagcagg tcgtggcaat tgcgagcaac 1380

ggagggggaa agcaggcact cgaaaccgtc cagaggttgc tgcctgtgct gtgccaagcg 1440

cacgggttga ccccagagca ggtcgtggca attgcgagca acggaggggg aaagcaggca 1500

ctcgaaaccg tccagaggtt gctgcctgtg ctgtgccaag cgcacggcct gaccccagag 1560

caggtcgtgg caattgcgag ccatgacggg ggaaagcagg cactcgaaac cgtccagagg 1620

ttgctgcctg tgctgtgcca agcgcacgga ctgacaccag agcaggtcgt ggcaattgcg 1680

agccatgacg ggggaaagca ggcactcgaa accgtccaga ggttgctgcc tgtgctgtgc 1740

caagcgcacg gcctcacccc agagcaggtc gtggcaattg cgagcaacat cgggggaaag 1800

caggcactcg aaaccgtcca gaggttgctg cctgtgctgt gccaagcgca cggacttacg 1860

ccagagcagg tcgtggcaat tgcgagcaac ggagggggaa agcaggcact cgaaaccgtc 1920

cagaggttgc tgcctgtgct gtgccaagcg cacggactaa ccccagagca ggtcgtggca 1980

attgcgagca acggaggggg aaagcaggca ctcgaaaccg tccagaggtt gctgcctgtg 2040

ctgtgccaag cgcacgggtt gaccccagag caggtcgtgg caattgcgag ccatggaggg 2100

ggaaagcagg cactcgaaac cgtccagagg ttgctgcctg tgctgtgcca agcgcacggc 2160

ctgaccccag agcaggtcgt ggcaattgcg agccatggag ggggaaagca ggcactcgaa 2220

accgtccaga ggttgctgcc tgtgctgtgc caagcgcacg gactgacacc agagcaggtc 2280

gtggcaattg cgagcaacat cgggggaaag caggcactcg aaaccgtcca gaggttgctg 2340

cctgtgctgt gccaagcgca cggactcacg cctgagcagg tagtggctat tgcatccaac 2400

ggagggggca gacccgcact ggagtcaatc gtggcccagc tttcgaggcc ggaccccgcg 2460

ctggccgcac tcactaatga tcatcttgta gcgctggcct gcctcggcgg acgacccgcc 2520

ttggatgcgg tgaagaaggg gctcccgcac gcgcctgcat tgattaagcg gaccaacaga 2580

aggattcccg agaggacatc acatcgagtg gca 2613

<210>3

<211>318bp

<212>DNA

<213>人工序列

<220>

<223>

<400>3

atggtgaagc agatcgagag caagactgct tttcaggaag ccttggacgc tgcaggtgat 60

aaacttgtag tagttgactt ctcagccacg tggtgtgggc cttgcaaaat gatcaagcct 120

ttctttcatt ccctctctga aaagtattcc aacgtgatat tccttgaagt agatgtggat 180

gactgtcagg atgttgcttc agagtgtgaa gtcaaatgca tgccaacatt ccagtttttt 240

aagaagggac aaaaggtggg tgaattttct ggagccaata aggaaaagct tgaagccacc 300

attaatgaat tagtctaa 318

<210>4

<211>979

<212>PRT

<213>人工序列

<220>

<223>

<400>4

Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp

1 5 10 15

Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val

20 25 30

Gly Ile His Gly Val Pro Ala Ala Val Asp Leu Arg Thr Leu Gly Tyr

35 40 45

Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val

50 55 60

Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His

65 70 75 80

Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val

85 90 95

Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala

100 105 110

Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala

115 120 125

Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp

130 135 140

Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val

145 150 155 160

Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn

165 170 175

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys

180 185 190

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

195 200 205

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly

210 215 220

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

225 230 235 240

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His

245 250 255

Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

260 265 270

Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

275 280 285

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

290 295 300

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala

305 310 315 320

Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

325 330 335

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val

340 345 350

Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val

355 360 365

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu

370 375 380

Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu

385 390 395 400

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

405 410 415

Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala

420 425 430

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

435 440 445

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys

450 455 460

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

465 470 475 480

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly

485 490 495

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

500 505 510

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His

515 520 525

Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

530 535 540

Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

545 550 555 560

Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

565 570 575

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala

580 585 590

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

595 600 605

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val

610 615 620

Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val

625 630 635 640

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu

645 650 655

Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu

660 665 670

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

675 680 685

Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala

690 695 700

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

705 710 715 720

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys

725 730 735

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

740 745 750

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly

755 760 765

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

770 775 780

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

785 790 795 800

Ile Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg

805 810 815

Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu

820 825 830

Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu

835 840 845

Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu

850 855 860

Arg Thr Ser His Arg Val Ala Ser Tyr Gln Gly Met Val Lys Gln Ile

865 870 875 880

Glu Ser Lys Thr Ala Phe Gln Glu Ala Leu Asp Ala Ala Gly Asp Lys

885 890 895

Leu Val Val Val Asp Phe Ser Ala Thr Trp Cys Gly Pro Cys Lys Met

900 905 910

Ile Lys Pro Phe Phe His Ser Leu Ser Glu Lys Tyr Ser Asn Val Ile

915 920 925

Phe Leu Glu Val Asp Val Asp Asp Cys Gln Asp Val Ala Ser Glu Cys

930 935 940

Glu Val Lys Cys Met Pro Thr Phe Gln Phe Phe Lys Lys Gly Gln Lys

945 950 955 960

Val Gly Glu Phe Ser Gly Ala Asn Lys Glu Lys Leu Glu Ala Thr Ile

965 970 975

Asn Glu Leu

<210>5

<211>972

<212>PRT

<213>人工序列

<220>

<223>

<400>5

Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp

1 5 10 15

Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val

20 25 30

Gly Ile His Gly Val Pro Ala Ala Val Asp Leu Arg Thr Leu Gly Tyr

35 40 45

Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val

50 55 60

Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His

65 70 75 80

Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val

85 90 95

Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala

100 105 110

Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala

115 120 125

Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp

130 135 140

Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val

145 150 155 160

Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn

165 170 175

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys

180 185 190

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

195 200 205

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly

210 215 220

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

225 230 235 240

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

245 250 255

Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

260 265 270

Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

275 280 285

Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

290 295 300

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala

305 310 315 320

Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

325 330 335

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val

340 345 350

Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val

355 360 365

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu

370 375 380

Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu

385 390 395 400

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

405 410 415

Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala

420 425 430

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

435 440 445

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys

450 455 460

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

465 470 475 480

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly

485 490 495

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

500 505 510

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His

515 520 525

Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

530 535 540

Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

545 550 555 560

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

565 570 575

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala

580 585 590

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

595 600 605

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val

610 615 620

Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val

625 630 635 640

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu

645 650 655

Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu

660 665 670

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

675 680 685

Pro Glu Gln Val Val Ala Ile Ala Ser His Gly Gly Gly Lys Gln Ala

690 695 700

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

705 710 715 720

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Gly Gly Gly Lys

725 730 735

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

740 745 750

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly

755 760 765

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

770 775 780

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

785 790 795 800

Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg

805 810 815

Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu

820 825 830

Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu

835 840 845

Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu

850 855 860

Arg Thr Ser His Arg Val Ala Val Ile Arg Glu Trp Ser Arg Ser Arg

865 870 875 880

Ala Arg Leu Leu Phe Arg Lys Pro Trp Thr Leu Gln Val Ile Asn Leu

885 890 895

Leu Thr Ser Gln Pro Arg Gly Val Gly Leu Ala Lys Ser Ser Leu Ser

900 905 910

Phe Ile Pro Ser Leu Lys Ser Ile Pro Thr Tyr Ser Leu Lys Met Trp

915 920 925

Met Thr Val Arg Met Leu Leu Gln Ser Val Lys Ser Asn Ala Cys Gln

930 935 940

His Ser Ser Phe Leu Arg Arg Asp Lys Arg Trp Val Asn Phe Leu Glu

945 950 955 960

Pro Ile Arg Lys Ser Leu Lys Pro Pro Leu Met Asn

965 970

<210>6

<211>711bp

<212>DNA

<213>人工序列

<220>

<223>

<400>6

atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat gcgcttcaag 60

gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga gggcgagggc 120

cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg ccccctgccc 180

ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta cgtgaagcac 240

cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa gtgggagcgc 300

gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc cctgcaggac 360

ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga cggccccgta 420

atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc cgaggacggc 480

gccctgaagg gcgagatcaa gcagaggctg aagctgaagg acggcggcca ctacgacgct 540

gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc ctacaacgtc 600

aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga acagtacgaa 660

cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaagta a 711

<210>7

<211>1229

<212>PRT

<213>人工序列

<220>

<223>

<400>7

Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp

1 5 10 15

Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val

20 25 30

Gly Ile His Gly Val Pro Ala Ala Val Asp Leu Arg Thr Leu Gly Tyr

35 40 45

Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val

50 55 60

Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His

65 70 75 80

Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val

85 90 95

Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala

100 105 110

Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala

115 120 125

Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp

130 135 140

Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val

145 150 155 160

Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn

165 170 175

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys

180 185 190

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

195 200 205

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly

210 215 220

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

225 230 235 240

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His

245 250 255

Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

260 265 270

Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

275 280 285

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

290 295 300

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala

305 310 315 320

Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

325 330 335

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val

340 345 350

Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val

355 360 365

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu

370 375 380

Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu

385 390 395 400

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

405 410 415

Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala

420 425 430

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

435 440 445

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys

450 455 460

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

465 470 475 480

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly

485 490 495

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

500 505 510

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His

515 520 525

Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

530 535 540

Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

545 550 555 560

Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

565 570 575

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala

580 585 590

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

595 600 605

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val

610 615 620

Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val

625 630 635 640

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu

645 650 655

Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu

660 665 670

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

675 680 685

Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala

690 695 700

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

705 710 715 720

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys

725 730 735

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

740 745 750

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly

755 760 765

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

770 775 780

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

785 790 795 800

Ile Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg

805 810 815

Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu

820 825 830

Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu

835 840 845

Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu

850 855 860

Arg Thr Ser His Arg Val Ala Ser Tyr Gln Gly Met Val Ser Lys Gly

865 870 875 880

Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe Met Arg Phe Lys Val

885 890 895

His Met Glu Gly Ser Val Asn Gly His Glu Phe Glu Ile Glu Gly Glu

900 905 910

Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu Lys Val

915 920 925

Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro Gln

930 935 940

Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His Pro Ala Asp Ile Pro

945 950 955 960

Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg Val

965 970 975

Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser Ser

980 985 990

Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys Leu Arg Gly Thr Asn

995 1000 1005

Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp

1010 1015 1020

Glu Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly Ala Leu Lys

1025 1030 1035

Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly His Tyr

1040 1045 1050

Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val Gln

1055 1060 1065

Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser

1070 1075 1080

His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu

1085 1090 1095

Gly Arg His Ser Thr Gly Gly Met Asp Glu Leu Tyr Lys Gly Thr

1100 1105 1110

Ser Gly Leu Arg Ser Arg Ala Gln Ala Ser Asn Ser Met Val Lys

1115 1120 1125

Gln Ile Glu Ser Lys Thr Ala Phe Gln Glu Ala Leu Asp Ala Ala

1130 1135 1140

Gly Asp Lys Leu Val Val Val Asp Phe Ser Ala Thr Trp Cys Gly

1145 1150 1155

Pro Cys Lys Met Ile Lys Pro Phe Phe His Ser Leu Ser Glu Lys

1160 1165 1170

Tyr Ser Asn Val Ile Phe Leu Glu Val Asp Val Asp Asp Cys Gln

1175 1180 1185

Asp Val Ala Ser Glu Cys Glu Val Lys Cys Met Pro Thr Phe Gln

1190 1195 1200

Phe Phe Lys Lys Gly Gln Lys Val Gly Glu Phe Ser Gly Ala Asn

1205 1210 1215

Lys Glu Lys Leu Glu Ala Thr Ile Asn Glu Leu

1220 1225

<210>8

<211>1212

<212>PRT

<213>人工序列

<220>

<223>

<400>8

Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp

1 5 10 15

Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val

20 25 30

Gly Ile His Gly Val Pro Ala Ala Val Asp Leu Arg Thr Leu Gly Tyr

35 40 45

Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val

50 55 60

Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His

65 70 75 80

Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val

85 90 95

Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala

100 105 110

Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala

115 120 125

Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp

130 135 140

Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val

145 150 155 160

Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn

165 170 175

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys

180 185 190

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

195 200 205

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly

210 215 220

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

225 230 235 240

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

245 250 255

Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

260 265 270

Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

275 280 285

Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

290 295 300

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala

305 310 315 320

Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

325 330 335

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val

340 345 350

Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val

355 360 365

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu

370 375 380

Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu

385 390 395 400

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

405 410 415

Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala

420 425 430

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

435 440 445

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys

450 455 460

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

465 470 475 480

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly

485 490 495

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

500 505 510

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His

515 520 525

Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

530 535 540

Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala

545 550 555 560

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

565 570 575

Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala

580 585 590

Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

595 600 605

Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val

610 615 620

Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val

625 630 635 640

Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu

645 650 655

Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu

660 665 670

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr

675 680 685

Pro Glu Gln Val Val Ala Ile Ala Ser His Gly Gly Gly Lys Gln Ala

690 695 700

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly

705 710 715 720

Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Gly Gly Gly Lys

725 730 735

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala

740 745 750

His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly

755 760 765

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

770 775 780

Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn

785 790 795 800

Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg

805 810 815

Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu

820 825 830

Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu

835 840 845

Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu

850 855 860

Arg Thr Ser His Arg Val Ala Val Ile Arg Glu Trp Ala Arg Ala Arg

865 870 875 880

Ser Cys Ser Pro Gly Trp Cys Pro Ser Trp Ser Ser Trp Thr Ala Thr

885 890 895

Thr Ala Thr Ser Ser Ala Cys Pro Ala Arg Ala Arg Ala Met Pro Pro

900 905 910

Thr Ala Ser Pro Ser Ser Ser Ala Pro Pro Ala Ser Cys Pro Cys Pro

915 920 925

Gly Pro Pro Ser Pro Pro Pro Thr Ala Cys Ser Ala Ser Ala Ala Thr

930 935 940

Pro Thr Thr Ser Ser Thr Thr Ser Ser Ser Pro Pro Cys Pro Lys Ala

945 950 955 960

Thr Ser Arg Ser Ala Pro Ser Ser Ser Arg Thr Thr Ala Thr Thr Arg

965 970 975

Pro Ala Pro Arg Ser Ser Arg Ala Thr Pro Trp Thr Ala Ser Ser Arg

980 985 990

Ala Ser Thr Ser Arg Arg Thr Ala Thr Ser Trp Gly Thr Ser Trp Ser

995 1000 1005

Thr Thr Thr Thr Ala Thr Thr Ser Ile Ser Trp Pro Thr Ser Arg

1010 1015 1020

Arg Thr Ala Ser Arg Thr Ser Arg Ser Ala Thr Thr Ser Arg Thr

1025 1030 1035

Ala Ala Cys Ser Ser Pro Thr Thr Thr Ser Arg Thr Pro Pro Ser

1040 1045 1050

Ala Thr Ala Pro Cys Cys Cys Pro Thr Thr Thr Thr Ala Pro Ser

1055 1060 1065

Pro Pro Ala Lys Thr Pro Thr Arg Ser Ala Ile Thr Trp Ser Cys

1070 1075 1080

Trp Ser Ser Pro Pro Pro Gly Ser Leu Ser Ala Trp Thr Ser Cys

1085 1090 1095

Thr Arg Val Pro Pro Asp Ser Asp Leu Glu Leu Lys Leu Arg Ile

1100 1105 1110

Pro Trp Ser Arg Ser Arg Ala Arg Leu Leu Phe Arg Lys Pro Trp

1115 1120 1125

Thr Leu Gln Val Ile Asn Leu Leu Thr Ser Gln Pro Arg Gly Val

1130 1135 1140

Gly Leu Ala Lys Ser Ser Leu Ser Phe Ile Pro Ser Leu Lys Ser

1145 1150 1155

Ile Pro Thr Tyr Ser Leu Lys Met Trp Met Thr Val Arg Met Leu

1160 1165 1170

Leu Gln Ser Val Lys Ser Asn Ala Cys Gln His Ser Ser Phe Leu

1175 1180 1185

Arg Arg Asp Lys Arg Trp Val Asn Phe Leu Glu Pro Ile Arg Lys

1190 1195 1200

Ser Leu Lys Pro Pro Leu Met Asn Ser

1205 1210

<210>9

<211>2613bp

<212>DNA

<213>人工序列

<220>

<223>

<400>9