專利名稱:具有促進小鼠nih/3t3細胞轉化功能的新的人蛋白及其編碼序列的制作方法
技術領域:
本發明屬于生物技術領域,具體地說,本發明涉及新的編碼具有促進3T3細胞轉化功能的人蛋白的多核苷酸,以及此多核苷酸編碼的多肽。本發明還涉及此多核苷酸和多肽的用途和制備。
背景技術:
人基因組學研究目前是國際上的熱點,除人染色體DNA大規模測序,表達序列測序(EST)的方法外,還缺少從功能開始的篩選具有功能基因的高通量的方法。
癌癥是危害人類健康的主要疾病之一。為了有效地治療和預防腫瘤,目前人們已越來越關注腫瘤的基因治療。因此,本領域迫切需要開發研究與癌細胞生長相關的人蛋白及其激動劑/抑制劑。
發明內容
本發明的目的是提供一類新的具有促進3T3細胞轉化功能的人蛋白多肽以及其片段、類似物和衍生物。
本發明的另一目的是提供編碼這些多肽的多核苷酸。
本發明的另一目的是提供生產這些多肽的方法以及該多肽和編碼序列的用途。
在本發明的第一方面,提供新穎的分離出的具有促進3T3細胞轉化功能的蛋白多肽,它包含具有選自下組的氨基酸序列的多肽SEQ ID NO3、6、9、12、15、18;或其保守性變異多肽、或其活性片段、或其活性衍生物。
較佳地,該多肽是具有選自下組的氨基酸序列的多肽SEQ ID NO3、6、9、12、15、18。
在本發明的第二方面,提供了一種分離的多核苷酸,它包含一核苷酸序列,該核苷酸序列與選自下組的一種核苷酸序列有至少85%相同性(a)編碼上述的具有促進3T3細胞轉化功能的蛋白多肽的多核苷酸;(b)與多核苷酸(a)互補的多核苷酸。較佳地,該多核苷酸編碼的多肽具有選自下組的氨基酸序列SEQ ID NO3、6、9、12、15、18。更佳地,該多核苷酸的序列選自下組SEQ ID NO2、5、8、11、14、17的編碼區序列或全長序列。
在本發明的第三方面,提供了含有上述多核苷酸的載體,以及被該載體轉化或轉導的宿主細胞或者被上述多核苷酸直接轉化或轉導的宿主細胞。
在本發明的第四方面,提供了制備具有促進3T3細胞轉化功能的蛋白活性的多肽的制備方法,該方法包含(a)在適合表達具有促進3T3細胞轉化功能的蛋白的條件下,培養上述被轉化或轉導的宿主細胞;(b)從培養物中分離出具有促進3T3細胞轉化功能的蛋白活性的多肽。
在本發明的第五方面,提供了與上述的具有促進3T3細胞轉化功能的蛋白多肽特異性結合的抗體。還提供了可用于檢測的核酸分子,它含有上述的多核苷酸中連續10個核苷酸至全長核苷酸,較佳地它含有連續的約10-800個核苷酸。
在本發明的第六方面,提供了一種藥物組合物,它含有安全有效量的本發明的具有促進3T3細胞轉化功能的蛋白多肽以及藥學上可接受的載體。這些藥物組合物可用于促進細胞的生長。本發明還提供了一種藥物組合物,它含有安全有效量的針對本發明的具有促進3T3細胞轉化功能的蛋白多肽的拮抗劑(如抗體)以及藥學上可接受的載體。該藥物組合物可治療癌癥以及細胞異常增殖等病癥。
本發明的其它方面由于本文的技術的公開,對本領域的技術人員而言是顯而易見的。
具體實施例方式
3T3細胞是一種小鼠成纖維細胞(J.Cell.Biol.,17299,1963)(也稱為NIH/3T3細胞)。在癌癥研究領域中,常將外源基因(尤其是人基因)引入3T3細胞,觀察其對3T3細胞生長的影響情況。通常認為,對3T3細胞生長(或惡性轉化或轉染)有影響的基因是癌癥相關基因,其中對3T3細胞生長或轉化有抑制作用的基因大多是抑癌基因,而對3T3細胞生長或轉化有促進作用的基因大多是(原)癌基因。
本發明采用大規模cDNA克隆轉染小鼠胚胎成纖維細胞3T3,在獲得具有促進生長作用的基礎上,經測序證明為新的基因,進一步得到全長cDNA克隆。DNA轉染試驗證明,本發明的具有促進3T3細胞轉化功能的蛋白對3T3細胞具有促進克隆形成的作用,其促進率≥50%。
如本文所用,“分離的”是指物質從其原始環境中分離出來(如果是天然的物質,原始環境即是天然環境)。如活體細胞內的天然狀態下的多聚核苷酸和多肽是沒有分離純化的,但同樣的多聚核苷酸或多肽如從天然狀態中同存在的其他物質中分開,則為分離純化的。
如本文所用,“分離的具有促進3T3細胞轉化功能的蛋白或多肽”是指具有促進3T3細胞轉化功能的蛋白多肽基本上不含天然與其相關的其它蛋白、脂類、糖類或其它物質。本領域的技術人員能用標準的蛋白質純化技術純化具有促進3T3細胞轉化功能的蛋白。基本上純的多肽在非還原聚丙烯酰胺凝膠上能產生單一的主帶。
本發明的多肽可以是重組多肽、天然多肽、合成多肽,優選重組多肽。本發明的多肽可以是天然純化的產物,或是化學合成的產物,或使用重組技術從原核或真核宿主(例如,細菌、酵母、高等植物、昆蟲和哺乳動物細胞)中產生。根據重組生產方案所用的宿主,本發明的多肽可以是糖基化的,或可以是非糖基化的。本發明的多肽還可包括或不包括起始的甲硫氨酸殘基。
本發明還包括具有促進3T3細胞轉化功能的人蛋白的片段、衍生物和類似物。如本文所用,術語“片段”、“衍生物”和“類似物”是指基本上保持本發明的天然具有促進3T3細胞轉化功能的人蛋白相同的生物學功能或活性的多肽。本發明的多肽片段、衍生物或類似物可以是(i)有一個或多個保守或非保守性氨基酸殘基(優選保守性氨基酸殘基)被取代的多肽,而這樣的取代的氨基酸殘基可以是也可以不是由遺傳密碼編碼的,或(ii)在一個或多個氨基酸殘基中具有取代基團的多肽,或(iii)成熟多肽與另一個化合物(比如延長多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前導序列或分泌序列或用來純化此多肽的序列或蛋白原序列)。根據本文的教導,這些片段、衍生物和類似物屬于本領域熟練技術人員公知的范圍。
本發明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因組DNA或人工合成的DNA。DNA可以是單鏈的或是雙鏈的。DNA可以是編碼鏈或非編碼鏈。以FP630蛋白(在本申請中,蛋白質的命名采用其克隆編號)為例,編碼成熟多肽的編碼區序列可以與SEQ ID NO2所示的編碼區序列相同或者是簡并的變異體。如本文所用,“簡并的變異體”對于FP630而言是指編碼具有SEQ ID NO3的蛋白質,但與SEQ ID NO2所示的編碼區序列有差別的核酸序列。再以FP2234蛋白(在本申請中,蛋白質的命名采用其克隆編號)為例,編碼成熟多肽的編碼區序列可以與SEQ ID NO5所示的編碼區序列相同或者是簡并的變異體。如本文所用,“簡并的變異體”對于FP2234而言是指編碼具有SEQ ID NO6的蛋白質,但與SEQ ID NO5所示的編碼區序列有差別的核酸序列。對于本發明其他具有促進3T3細胞轉化功能的蛋白,依此類推。
編碼成熟多肽的多核苷酸包括只編碼成熟多肽的編碼序列;成熟多肽的編碼序列和各種附加編碼序列;成熟多肽的編碼序列(和任選的附加編碼序列)以及非編碼序列。
術語“編碼多肽的多核苷酸”可以是包括編碼此多肽的多核苷酸,也可以是還包括附加編碼和/或非編碼序列的多核苷酸。
本發明還涉及上述多核苷酸的變異體,其編碼與本發明有相同的氨基酸序列的多肽或多肽的片段、類似物和衍生物。此多核苷酸的變異體可以是天然發生的等位變異體或非天然發生的變異體。這些核苷酸變異體包括取代變異體、缺失變異體和插入變異體。如本領域所知的,等位變異體是一個多核苷酸的替換形式,它可能是一個或多個核苷酸的取代、缺失或插入,但不會從實質上改變其編碼的多肽的功能。
本發明還涉及與上述的序列雜交且兩個序列之間具有至少50%,較佳地至少70%,更佳地至少80%相同性的多核苷酸。本發明特別涉及在嚴格條件下與本發明所述多核苷酸可雜交的多核苷酸。在本發明中,“嚴格條件”是指(1)在較低離子強度和較高溫度下的雜交和洗脫,如0.2×SSC,0.1%SDS,60℃;或(2)雜交時加有變性劑,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)僅在兩條序列之間的相同性至少在95%以上,更好是97%以上時才發生雜交。并且,可雜交的多核苷酸編碼的多肽與SEQ IDNO3所示的成熟多肽(以FP630蛋白為例)有相同的生物學功能和活性。
本發明還涉及與上述的序列雜交的核酸片段。如本文所用,“核酸片段”的長度至少含15個核苷酸,較好是至少30個核苷酸,更好是至少50個核苷酸,最好是至少100個核苷酸以上。核酸片段可用于核酸的擴增技術(如PCR)以確定和/或分離編碼具有促進3T3細胞轉化功能的蛋白的多聚核苷酸。
本發明中的多肽和多核苷酸優選以分離的形式提供,更佳地被純化至均質。
本發明的DNA序列能用幾種方法獲得。例如,用本領域熟知的雜交技術分離DNA。這些技術包括但不局限于1)用探針與基因組或cDNA文庫雜交以檢出同源性核苷酸序列,和2)表達文庫的抗體篩選以檢出具有共同結構特征的克隆的DNA片段。
編碼具有促進3T3細胞轉化功能的蛋白的特異DNA片段序列產生也能用下列方法獲得1)從基因組DNA分離雙鏈DNA序列;2)化學合成DNA序列以獲得所需多肽的雙鏈DNA。
當需要的多肽產物的整個氨基酸序列已知時,DNA序列的直接化學合成是經常選用的方法。如果所需的氨基酸的整個序列不清楚時,DNA序列的直接化學合成是不可能的,選用的方法是cDNA序列的分離。分離感興趣的cDNA的標準方法是從高表達該基因的供體細胞分離mRNA并進行逆轉錄,形成質粒或噬菌體cDNA文庫。提取mRNA的方法已有多種成熟的技術,試劑盒也可從商業途徑獲得(Qiagene)。而構建cDNA文庫也是通常的方法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold Spring HarborLaboratory.New York,1989)。還可得到商業供應的cDNA文庫,如Clontech公司的不同cDNA文庫。當結合使用聚合酶反應技術時,即使極少的表達產物也能克隆。
可用常規方法從這些cDNA文庫中篩選本發明的基因。這些方法包括(但不限于)(1)DNA-DNA或DNA-RNA雜交;(2)標志基因的功能出現或喪失;(3)測定具有促進3T3細胞轉化功能的蛋白的轉錄本的水平;(4)通過免疫學技術或測定生物學活性,來檢測基因表達的蛋白產物。上述方法可單用,也可多種方法聯合應用。
在第(1)種方法中,雜交所用的探針是與本發明的多核苷酸的任何一部分同源,其長度至少15個核苷酸,較好是至少30個核苷酸,更好是至少50個核苷酸,最好是至少100個核苷酸。此外,探針的長度通常在2kb之內,較佳地為1kb之內。此處所用的探針通常是在本發明的基因DNA序列信息的基礎上化學合成的DNA序列。本發明的基因本身或者片段當然可以用作探針。DNA探針的標記可用放射性同位素,熒光素或酶(如堿性磷酸酶)等。
在第(4)種方法中,檢測具有促進3T3細胞轉化功能的蛋白基因表達的蛋白產物可用免疫學技術如Western印跡法,放射免疫沉淀法,酶聯免疫吸附法(ELISA)等。
應用PCR技術擴增DNA/RNA的方法(Saiki,et al.Science 1985;2301350-1354)被優選用于獲得本發明的基因。特別是很難從文庫中得到全長的cDNA時,可優選使用RACE法(RACE-cDNA末端快速擴增法),用于PCR的引物可根據本文所公開的本發明的序列信息適當地選擇,并可用常規方法合成。可用常規方法如通過凝膠電泳分離和純化擴增的DNA/RNA片段。
如上所述得到的本發明的基因,或者各種DNA片段等的核苷酸序列的測定可用常規方法如雙脫氧鏈終止法(Sanger et al.PNAS,1977,745463-5467)。這類核苷酸序列測定也可用商業測序試劑盒等。為了獲得全長的cDNA序列,測序需反復進行。有時需要測定多個克隆的cDNA序列,才能拼接成全長的cDNA序列。
本發明也涉及包含本發明多核苷酸的載體,以及用本發明的載體或具有促進3T3細胞轉化功能的蛋白編碼序列經基因工程產生的宿主細胞,以及經重組技術產生本發明所述多肽的方法。
通過常規的重組DNA技術(Science,1984;2241431),可利用本發明的多聚核苷酸序列可用來表達或生產重組的具有促進3T3細胞轉化功能的蛋白多肽。一般來說有以下步驟
(1).用本發明的編碼具有促進3T3細胞轉化功能的人蛋白的多核苷酸(或變異體),或用含有該多核苷酸的重組表達載體轉化或轉導合適的宿主細胞;(2).在合適的培養基中培養的宿主細胞;(3).從培養基或細胞中分離、純化蛋白質。
本發明中,具有促進3T3細胞轉化功能的人蛋白多核苷酸序列可插入到重組表達載體中。術語“重組表達載體”指本領域熟知的細菌質粒、噬菌體、酵母質粒、植物細胞病毒、哺乳動物細胞病毒如腺病毒、逆轉錄病毒或其他載體。在本發明中適用的載體包括但不限于在細菌中表達的基于T7的表達載體(Rosenberg,et al.Gene,1987,56125);在哺乳動物細胞中表達的pMSXND表達載體(Lee and Nathans,J Bio Chem.2633521,1988)和在昆蟲細胞中表達的來源于桿狀病毒的載體。總之,只要能在宿主體內復制和穩定,任何質粒和載體都可以用。表達載體的一個重要特征是通常含有復制起點、啟動子、標記基因和翻譯控制元件。
本領域的技術人員熟知的方法能用于構建含具有促進3T3細胞轉化功能的人蛋白編碼DNA序列和合適的轉錄/翻譯控制信號的表達載體。這些方法包括體外重組DNA技術、DNA合成技術、體內重組技術等(Sambroook,et al)。所述的DNA序列可有效連接到表達載體中的適當啟動子上,以指導mRNA合成。這些啟動子的代表性例子有大腸桿菌的lac或trp啟動子;λ噬菌體PL啟動子;真核啟動子包括CMV立即早期啟動子、早期和晚期SV40啟動子和其他一些已知的可控制基因在原核或真核細胞或其病毒中表達的啟動子。表達載體還包括翻譯起始用的核糖體結合位點和轉錄終止子。
此外,表達載體優選地包含一個或多個選擇性標記基因,以提供用于選擇轉化的宿主細胞的表型性狀,如真核細胞培養用的二氫葉酸還原酶、新霉素抗性以及綠色熒光蛋白(GFP),或用于大腸桿菌的四環素或氨芐青霉素抗性。
包含上述的適當DNA序列以及適當啟動子或者控制序列的載體,可以用于轉化適當的宿主細胞,以使其能夠表達蛋白質。
宿主細胞可以是原核細胞,如細菌細胞;或是低等真核細胞,如酵母細胞;或是高等真核細胞,如哺乳動物細胞。代表性例子有大腸桿菌,鏈霉菌屬;鼠傷寒沙門氏菌的細菌細胞;真菌細胞如酵母;植物細胞;果蠅S2或Sf9的昆蟲細胞;CHO、COS或Bowes黑素瘤細胞的動物細胞等。
本發明的多核苷酸在高等真核細胞中表達時,如果在載體中插入增強子序列時將會使轉錄得到增強。增強子是DNA的順式作用因子,通常大約有10到300個堿基對,作用于啟動子以增強基因的轉錄。可舉的例子包括在復制起始點晚期一側的100到270個堿基對的SV40增強子、在復制起始點晚期一側的多瘤增強子以及腺病毒增強子等。
本領域一般技術人員都清楚如何選擇適當的載體、啟動子、增強子和宿主細胞。
用重組DNA轉化宿主細胞可用本領域技術人員熟知的常規技術進行。當宿主為原核生物如大腸桿菌時,能吸收DNA的感受態細胞可在指數生長期后收獲,用CaCl2法處理,所用的步驟在本領域眾所周知。可供選擇的是用MgCl2。如果需要,轉化也可用電穿孔的方法進行。當宿主是真核生物,可選用如下的DNA轉染方法磷酸鈣共沉淀法,常規機械方法如顯微注射、電穿孔、脂質體包裝等。
獲得的轉化子可以用常規方法培養,表達本發明的基因所編碼的多肽。根據所用的宿主細胞,培養中所用的培養基可選自各種常規培養基。在適于宿主細胞生長的條件下進行培養。當宿主細胞生長到適當的細胞密度后,用合適的方法(如溫度轉換或化學誘導)誘導選擇的啟動子,將細胞再培養一段時間。
在上面的方法中的重組多肽可包被于細胞內、細胞外或在細胞膜上表達或分泌到細胞外。如果需要,可利用其物理的、化學的和其它特性通過各種分離方法分離和純化重組的蛋白。這些方法是本領域技術人員所熟知的。這些方法的例子包括但并不限于常規的復性處理、用蛋白沉淀劑處理(鹽析方法)、離心、滲透破菌、超處理、超離心、分子篩層析(凝膠過濾)、吸附層析、離子交換層析、高效液相層析(HPLC)和其它各種液相層析技術及這些方法的結合。
重組的具有促進3T3細胞轉化功能的人蛋白或多肽有多方面的用途。這些用途包括(但不限于)直接做為藥物治療具有促進3T3細胞轉化功能的蛋白功能低下或喪失所致的疾病,和用于篩選促進或對抗具有促進3T3細胞轉化功能的蛋白功能的抗體、多肽或其它配體。例如,該抗體可用于治療癌癥或細胞異常增殖。用重組表達的本發明蛋白篩選多肽庫可用于尋找有治療價值的能抑制或刺激具有促進3T3細胞轉化功能的人蛋白功能的多肽分子。
本發明也提供了篩選藥物以鑒定提高(激動劑)或阻遏(拮抗劑)具有促進3T3細胞轉化功能的人蛋白的藥劑的方法。激動劑提高具有促進3T3細胞轉化功能的人蛋白刺激細胞增殖等生物功能,而拮抗劑阻止和治療與細胞過度增殖有關的紊亂如各種癌癥。
具有促進3T3細胞轉化功能的人蛋白的拮抗劑包括篩選出的抗體、化合物、受體缺失物和類似物等。具有促進3T3細胞轉化功能的人蛋白的拮抗劑可以與具有促進3T3細胞轉化功能的人蛋白結合并消除其功能,或是抑制具有促進3T3細胞轉化功能的人蛋白的產生,或是與多肽的活性位點結合使多肽不能發揮生物學功能。具有促進3T3細胞轉化功能的人蛋白的拮抗劑可用于治療用途。
在篩選作為拮抗劑的化合物時,可以將具有促進3T3細胞轉化功能的蛋白加入生物分析測定中,通過測定化合物影響具有促進3T3細胞轉化功能的蛋白和其受體之間的相互作用來確定化合物是否是拮抗劑。用上述篩選化合物的同樣方法,可以篩選出起拮抗劑作用的受體缺失物和類似物。
本發明蛋白的拮抗劑可直接用于疾病治療,例如,各種惡性腫瘤、和細胞異常增殖等。
本發明的多肽,及其片段、衍生物、類似物或它們的細胞可以用來作為抗原以生產抗體。這些抗體可以是多克隆或單克隆抗體。多克隆抗體可以通過將此多肽直接注射動物的方法得到。制備單克隆抗體的技術包括雜交瘤技術,三瘤技術,人B-細胞雜交瘤技術,EBV-雜交瘤技術等。
可以將本發明的多肽和拮抗劑與合適的藥物載體組合后使用。這些載體可以是水、葡萄糖、乙醇、鹽類、緩沖液、甘油以及它們的組合。組合物包含安全有效量的多肽或拮抗劑以及不影響藥物效果的載體和賦形劑。這些組合物可以作為藥物用于疾病治療。
本發明還提供含有一種或多種容器的藥盒或試劑盒,容器中裝有一種或多種本發明的藥用組合物成分。與這些容器一起,可以有由制造、使用或銷售藥品或生物制品的政府管理機構所給出的指示性提示,該提示反映出生產、使用或銷售的政府管理機構許可其在人體上施用。此外,本發明的多肽可以與其它的治療化合物結合使用。
藥物組合物可以以方便的方式給藥,如通過局部、靜脈內、腹膜內、肌內、皮下、鼻內或皮內的給藥途徑。具有促進3T3細胞轉化功能的蛋白或其特異性抗體,可按有效地治療和/或預防具體的適應癥的量來給藥。施用于患者的具有促進3T3細胞轉化功能的蛋白的量和劑量范圍將取決于許多因素,如給藥方式、待治療者的健康條件和診斷醫生的判斷。
具有促進3T3細胞轉化功能的人蛋白的多聚核苷酸也可用于多種治療目的。基因治療技術可用于治療由于具有促進3T3細胞轉化功能的蛋白的無表達或異常/無活性的具有促進3T3細胞轉化功能的蛋白的表達所致的細胞發育或代謝異常。重組的基因治療載體(如病毒載體)可設計成表達變異的具有促進3T3細胞轉化功能的蛋白,以抑制內源性的具有促進3T3細胞轉化功能的蛋白活性。例如,一種變異的具有促進3T3細胞轉化功能的蛋白可以是縮短的、缺失了信號傳導功能域的具有促進3T3細胞轉化功能的蛋白,雖可與下游的底物結合,但缺乏信號傳導活性。因此重組的基因治療載體可用于治療具有促進3T3細胞轉化功能的蛋白表達或活性異常所致的疾病。來源于病毒的表達載體如逆轉錄病毒、腺病毒、腺病毒相關病毒、單純皰疹病毒、細小病毒等可用于將具有促進3T3細胞轉化功能的蛋白基因轉移至細胞內。構建攜帶具有促進3T3細胞轉化功能的蛋白基因的重組病毒載體的方法可見于已有文獻(Sambrook,et al.)。另外重組具有促進3T3細胞轉化功能的人蛋白基因可包裝到脂質體中轉移至細胞內。
抑制具有促進3T3細胞轉化功能的人蛋白mRNA的寡聚核苷酸(包括反義RNA和DNA)以及核酶也在本發明的范圍之內。核酶是一種能特異性分解特定RNA的酶樣RNA分子,其作用機制是核酶分子與互補的靶RNA特異性雜交后進行核酸內切作用。反義的RNA和DNA及核酶可用已有的任何RNA或DNA合成技術獲得,如固相磷酸酰胺化學合成法合成寡核苷酸的技術已廣泛應用。反義RNA分子可通過編碼該RNA的DNA序列在體外或體內轉錄獲得。這種DNA序列已整合到載體的RNA聚合酶啟動子的下游。為了增加核酸分子的穩定性,可用多種方法對其進行修飾,如增加兩側的序列長度,核糖核苷之間的連接應用磷酸硫酯鍵或肽鍵而非磷酸二酯鍵。
多聚核苷酸導入組織或細胞內的方法包括將多聚核苷酸直接注入到體內組織中;或在體外通過載體(如病毒、噬菌體或質粒等)先將多聚核苷酸導入細胞中,再將細胞移植到體內等。由于本發明蛋白具有促進3T3細胞轉化的功能,因此本發明蛋白編碼序列的反義序列,可被引入細胞以抑制細胞的異常增殖(如癌變)。
本發明還提供了針對具有促進3T3細胞轉化功能的人蛋白抗原決定簇的抗體。這些抗體包括(但不限于)多克隆抗體、單克隆抗體、嵌合抗體、單鏈抗體、Fab片段和Fab表達文庫產生的片段。
抗具有促進3T3細胞轉化功能的人蛋白的抗體可用于免疫組織化學技術中,檢測活檢標本中的具有促進3T3細胞轉化功能的人蛋白。
與具有促進3T3細胞轉化功能的人蛋白結合的單克隆抗體也可用放射性同位素標記,注入體內可跟蹤其位置和分布。這種放射性標記的抗體可作為一種非創傷性診斷方法用于腫瘤細胞的定位和判斷是否有轉移。
本發明中的抗體可用于治療或預防與具有促進3T3細胞轉化功能的人蛋白相關的疾病。給予適當劑量的抗體可以阻斷具有促進3T3細胞轉化功能的人蛋白的產生或活性,從而抑制癌細胞的生長和/或細胞的異常增殖。
抗體也可用于設計針對體內某一特殊部位的免疫毒素。如具有促進3T3細胞轉化功能的人蛋白高親和性的單克隆抗體可與細菌或植物毒素(如白喉毒素,蓖麻蛋白,紅豆堿等)共價結合。一種通常的方法是用巰基交聯劑如SPDP,攻擊抗體的氨基,通過二硫鍵的交換,將毒素結合于抗體上,這種雜交抗體可用于殺滅有關的陽性細胞(如癌細胞)。
多克隆抗體的生產可用具有促進3T3細胞轉化功能的人蛋白或多肽免疫動物,如家兔,小鼠,大鼠等。多種佐劑可用于增強免疫反應,包括但不限于弗氏佐劑等。
具有促進3T3細胞轉化功能的人蛋白單克隆抗體可用雜交瘤技術生產(Kohler andMilstein.Nature,1975,256495-497)。將人恒定區和非人源的可變區結合的嵌合抗體可用已有的技術生產(Morrison et al,PNAS,1985,816851)。而已有的生產單鏈抗體的技術(U.S.Pat No.4946778)也可用于生產抗具有促進3T3細胞轉化功能的人蛋白的單鏈抗體。
能與具有促進3T3細胞轉化功能的人蛋白結合的多肽分子可通過篩選由各種可能組合的氨基酸結合于固相物組成的隨機多肽庫而獲得。篩選時,必須對具有促進3T3細胞轉化功能的人蛋白分子進行標記。
本發明還涉及定量和定位檢測具有促進3T3細胞轉化功能的人蛋白水平的診斷試驗方法。這些試驗為本領域所熟知,且包括FISH測定和放射免疫測定。試驗中所檢測的具有促進3T3細胞轉化功能的蛋白水平,可以用作解釋具有促進3T3細胞轉化功能的蛋白在各種疾病中的重要性和用于診斷具有促進3T3細胞轉化功能的蛋白起作用的疾病。
具有促進3T3細胞轉化功能的蛋白的多聚核苷酸可用于具有促進3T3細胞轉化功能的蛋白相關疾病的診斷和治療。在診斷方面,具有促進3T3細胞轉化功能的蛋白的多聚核苷酸可用于檢測具有促進3T3細胞轉化功能的蛋白的表達與否或在疾病狀態下具有促進3T3細胞轉化功能的蛋白的異常表達。如具有促進3T3細胞轉化功能的蛋白DNA序列可用于對活檢標本的雜交以判斷具有促進3T3細胞轉化功能的蛋白的表達異常。雜交技術包括Southern印跡法,Northern印跡法、原位雜交等。這些技術方法都是公開的成熟技術,相關的試劑盒都可從商業途徑得到。本發明的多核苷酸的一部分或全部可作為探針固定在微陣列(Microarray)或DNA芯片(即基因芯片)上,用于分析組織中基因的差異表達分析和基因診斷。用具有促進3T3細胞轉化功能的蛋白特異的引物進行RNA-聚合酶鏈反應(RT-PGR)體外擴增也可檢測具有促進3T3細胞轉化功能的蛋白的轉錄產物。
檢測具有促進3T3細胞轉化功能的蛋白基因的突變也可用于診斷具有促進3T3細胞轉化功能的蛋白相關的疾病。具有促進3T3細胞轉化功能的蛋白突變的形式包括與正常野生型具有促進3T3細胞轉化功能的蛋白DNA序列相比的點突變、易位、缺失、重組和其它任何異常等。可用已有的技術如Southern印跡法、DNA序列分析、PGR和原位雜交檢測突變。另外,突變有可能影響蛋白的表達,因此用Northern印跡法、Western印跡法可間接判斷基因有無突變。
本發明的序列對染色體鑒定也是有價值的。這些序列會特異性地針對某條人染色體具體位置且并可以與其雜交。目前,需要鑒定染色體上的各基因的具體位點。然而現在只有很少的基于實際序列數據(重復多態性)的染色體標記物可用于標記染色體位置。為了將這些序列與疾病相關基因相關聯。第一步就是將本發明DNA序列定位于染色體上。
簡而言之,根據cDNA制備PCR引物(優選15-35bp),可以將序列定位于染色體上。然后,將這些引物用于PCR篩選含各條人染色體的體細胞雜合細胞。只有那些含有相應于引物的人基因的雜合細胞會產生擴增的片段。
體細胞雜合細胞的PCR定位法,是將DNA定位到具體染色體的快捷方法。使用本發明的的寡核苷酸引物,通過類似方法,可利用一組來自特定染色體的片段或大量基因組克隆而實現亞定位。可用于染色體定位的其它類似策略包括原位雜交、用標記的流式分選的染色體預篩選和雜交預選,從而構建染色體特異的cDNA庫。
將cDNA克隆與中期染色體進行熒光原位雜交(FISH),可以在一個步驟中精確地進行染色體定位。此技術的綜述,參見Verma等,Human Chromosomesa Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到準確的染色體位置,此序列在染色體上的物理位置就可以與基因圖數據相關聯。這些數據可見于例如,V.Mckusick,Mendelian Inheritance in Man(可通過與Johns Hopkins University Welch Medical Library聯機獲得)。然后可通過連鎖分析,確定基因與業已定位到染色體區域上的疾病之間的關系。
接著,需要測定患病和未患病個體間的cDNA或基因組序列差異。如果在一些或所有的患病個體中觀察到某突變,而該突變在任何正常個體中未觀察到,則該突變可能是疾病的病因。比較患病和未患病個體,通常涉及首先尋找染色體中結構的變化,如從染色體水平可見的或用基于cDNA序列的PCR可檢測的缺失或易位。
本發明的具有促進3T3細胞轉化功能的蛋白核苷酸全長序列或其片段通常可以用PCR擴增法、重組法或人工合成的方法獲得。對于PCR擴增法,可根據本發明所公開的有關核苷酸序列,尤其是開放閱讀框序列來設計引物,并用市售的cDNA庫或按本領域技術人員已知的常規方法所制備的cDNA庫作為模板,擴增而得有關序列。當序列較長時,常常需要進行兩次或多次PCR擴增,然后再將各次擴增出的片段按正確次序拼接在一起。
一旦獲得了有關的序列,就可以用重組法來大批量地獲得有關序列。這通常是將其克隆入載體,再轉入細胞,然后通過常規方法從增殖后的宿主細胞中分離得到有關序列。
此外,還可用人工合成的方法來合成有關序列,尤其是片段長度較短時。通常,通過先合成多個小片段,然后再進行連接可獲得序列很長的片段。
目前,已經可以完全通過化學合成來編碼本發明蛋白(或其片段,或其衍生物)的DNA序列。然后可將該DNA序列引入本領域中的各種DNA分子(如載體)和細胞中。此外,還可通過化學合成將突變引入本發明蛋白序列中。
此外,由于本發明的具有促進3T3細胞轉化功能的蛋白具有源自人的天然氨基酸序列,因此,與來源于其他物種的同族蛋白相比,預計在施用于人時將具有更高的活性和/或更低的副作用(例如在人體內的免疫原性更低或沒有)。
下面結合具體實施例,進一步闡述本發明。應理解,這些實施例僅用于說明本發明而不用于限制本發明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規條件如Sambrook等人,分子克隆實驗室手冊(New YorkCold Spring Harbor LaboratoryPress,1989)中所述的條件,或按照制造廠商所建議的條件。注意,在核苷酸和氨基酸組合序列中,(1)給出的是起始和終止編碼子第一個核苷酸的位置,(2)分子量單位是道爾頓。
實施例1cDNA基因的獲得及對小鼠NIH/3T3細胞克隆形成的促進作用FP630、FP2234、FP6679、FP6779、FP14381和FP15331是從按常規方法構建的人胎兒cDNA文庫獲得的。取胎兒組織(FP克隆),用Trizol試劑(GIBCO BRL公司)按廠方說明書提取總RNA,用mRNA提純試劑盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文庫構建試劑盒(Stratagene公司)構建上述mRNA的cDNA文庫。其中反轉錄酶改用MMLV-RT-Superscript II(GIBCO BRL),反轉錄反應在42℃進行。轉化XL 10-Gold感受細胞,獲得了1×106cfu/μg滴度的cDNA文庫。第一輪隨機挑取cDNA克隆,其后以高豐度cDNA克隆和已證明有抑制癌細胞生長功能的cDNA克隆為探針,雜交篩選cDNA文庫,挑取弱陽性及陰性克隆。用Qiagen 96孔板質粒抽提試劑盒,按廠家說明書進行質粒DNA的提取。質粒DNA和空載體同時轉染小鼠NIH/3T3細胞。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待轉染。每份DNA樣品中加0.74μl脂質體及9.3μl無血清培液,混勻后,室溫放置10分鐘。每管中加150μl無血清培液,均分加入3孔生長于96孔板的小鼠NIH/3T3細胞中,37℃放置2小時,每孔再加50μl無血清培液,37℃24小時。每孔換100μl全培液,37℃24小時,換含G418的全培液100μl,37℃24-48小時,邊觀察,邊換G418濃度不等的培液。約2-3次后,直到鏡檢細胞有克隆形成,計數。發現上述克隆有促進細胞克隆形成作用,結果如下表所示。
cDNA克隆轉染細胞(3T3)克隆形成情況
對cDNA克隆采用雙脫氧終止法,在ABI377DNA自動測序儀上測定其一端近500bp的核苷酸序列。分析后,確定為新基因克隆,進行另一端測序,仍未獲得全長cDNA序列,設計引物,再次進行測序,直到獲得全長序列(SEQ ID NO1、4、7、10、13、16)。
實施例2從胎盤或胎兒cDNA中PCR獲得全長基因取胎兒組織(FP克隆),用Trizol試劑(GIBCO BRL公司)按廠方說明書提取總RNA,用mRNA提純試劑盒(Pharmacia公司)提取mRNA。用MMLV-RT-Superscript II(GIBCO BRL),反轉錄酶在42℃進行反轉錄反應,獲得胎盤或胎兒cDNA。利用各個基因的特異引物(如下表所示),按97℃3′1個循環。94℃30″60℃30″72℃ 1′35個循環,72℃10′1個循環進行PCR擴增,獲得含有完整開放閱讀框序列的各蛋白基因的擴增產物。擴增產物經測序驗證,與實施例1測得的序列相符,隨后用常規技術將擴增產物轉入宿主細胞,獲得重組蛋白(SEQ ID NO3、6、9、12、15、18)。
基因特異引物
實施例3cDNA克隆序列分析1.FP630A核苷酸序列(SEQ ID NO1)長度1837個堿基1 GCTAAATCCC CTTGTAAATT TAACTGTTAG TCCAAAGAGG AACAGCTCTT TGGACACTAG61 GAAAAAACCT TGTAGAGAGA GTAAAAAATT TAACACCCAT AGTAGGCCTA AAAGCAGCCA121 CCAATTAAGA AAGCGTTCAA GCTCAACACC CACTACCTAA AAAACCCCAT CTCTACTAAA181 AAAAAAAAAA TACAAAAAAT TAGCCAGGCA TGGTGGCGGG CGCCTGTAGT CCCAGCTACT241 CCGGAGGCTG AGGCAGGAGA ATCGCTTGAA CCTGGGAGGC TGAGGTTGCA GTGAGCCGAG301 ATCGCGCCAT TGCACTCCAG CCTCGACAAC AAGAGCCAAA CTCCGTCTCA AAAAAAAAAA361 TTAAATAACA GCAAGCAACT GCATGCACGT CTGGGGGCGG TGTCCGGGGT GAGAAAGGCC421 CCGCCAGCAA TCCATCCCAC AATCAGCGAT GGCTGAGGGG GTCTGGACCT CGCGGGACGG481 GGCTGCACGC CCCCAAGCAA ATGCACAGCG CGGCTAAATT GGATTCGACA GCACCGGAAA541 CGGCGACTCC CACTTGGGGC GCTGCGGACA CACGAGTCGA GGCTGCCTTC CAGGAAGCAA601 ACAAAAAAAG GGGGGAAAAG GGGGGGAAAG AAAGAAAGAG AAAAAGGAGG GCGAGTGGCG661 AGCAGGGGCC TCGGCCGCCA CCCACACGCC CCGAAGCGTG CTCGTCCCCC GCGCGGGGCT721 CCCGGCCGCC GCCCTCGGCC ATCGGCTGCT CCCCGGTGGC CCAGGCCTCG GACTCCGCGG781 CCGGCCCGGC GCGGCCCAGC GCCCTCAGGT GCGTACCCCG CCCCCGCCGC CGACGCCGCC841 GACGCCGCCA TTAAGGGCGG GTTGCCTTTC GGAACGTCCT CCTCCTGAGG GCCTGGGGAA901 GGGAGGCCGC CCGGCCGCAG CGGGAGGTGG CCCCCCGGGA CACCCCGGCG CCCCGAGGCG961 AGGCACCCCC GAACCCCGAT CCCTGCTGGC AGGACCAGAG GTGTGAGGGT GGGGGCGGAG1021 AAGCCTTGCC GCGGGGGCAA TGGTCGTACG CACGGAGCGC ACATCCCTCT CCTTCCTGAT1081 TGGCCGAGCG GGGGTGTGCG TGATGCCACG CTCCGCCCGT CGTACGTGGG GCGCTCGCGG1141 GGGCGGGGGC CGCCGCTGTT ACCAGGCAAC TGCGCCCCGG ATCCGCCCCC TGACGTCACG1201 CGTTGCCTAG AGGCCCAGGT TGTGGGTTTT GTCCGTGGGT ATGGTCCTCG CGACGGCCTC1261 CGGGGATCTG TTTGTTGGCG GAAAACCAAT CCAGACTCCC AAGGAAAAAG GCCGAGGCCC1321 GGGAATTTCC CGTTGCAATT CTGGTTTCGA GTTCTAGGGG GAAAAAGGCT CGCAAGGCTG1381 TATTCTCCAT CCCTCAAAGC CCAAGCTTTC TTGTTTCTTA ATAACAGCTT CGTTGAGATC1441 CATTGTAAAA TTCACGTTTT AAGAGTGAAT AATTCAGTGC ACAGAGCTGT GCAACCTTTG1501 CCACTAATTG CAGAACGCTT TCAGCACCCG AGGAGAAGAA ACCCCAACCC CATTAGGCCG1561 TCATTCCCCG GTCCCCACCC CGTCCCTATC CCCAGCCCCT GGCAATCACT TTTGTCTCCG1621 TGGATTTGCC TATTCTGGAC ATTTCGTGTG GATAGAATCA TCCCAAGAAG TTTTTTGTGT1681 GTCTGGCTTC TTTCCTTCTT TATGGCTGAA TAAAAATCCA TGATATGAAA AAAAAAAAAA1741 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA1801 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAB核苷酸序列(SEQ ID NO3)長度117個氨基酸1 MHSAAKLDST APETATPTWG AADTRVEAAF QEANKKRGEK GGKERKRKRR ASGEQGPRPP61 PTRPEACSSP ARGSRPPPSA IGCSPVAQAS DSAAGPARPS ALRCVPRPRR RRRRRRH
C.核苷酸及氨基酸組合序列(SEQ ID NO2)克隆號和蛋白名稱FP630起始編碼子501 ATG 終止編碼子852 TAA 蛋白質分子量12609.501 GC TAA ATC CCC TTG TAA ATT TAA CTG TTA GTC CAA AGA GGA ACA GCT CTT TGG ACA CTA 5960 GGA AAA AAC CTT GTA GAG AGA GTA AAA AAT TTA ACA CCC ATA GTA GGC CTA AAA GCA GCC119120 ACC AAT TAA GAA AGC GTT CAA GCT CAA CAC CCA CTA CCT AAA AAA CCC CAT CTC TAC TAA179180 AAA AAA AAA AAT ACA AAA AAT TAG CCA GGC ATG GTG GCG GGC GCC TGT AGT CCC AGC TAC239240 TCC GGA GGC TGA GGC AGG AGA ATC GCT TGA ACC TGG GAG GCT GAG GTT GCA GTG AGC CGA299300 GAT CGC GCC ATT GCA CTC CAG CCT CGA CAA CAA GAG CCA AAC TCC GTC TCA AAA AAA AAA359360 ATT AAA TAA CAG CAA GCA ACT GCA TGC ACG TCT GGG GGC GGT GTC CGG GGT GAG AAA GGC419420 CCC GCC AGC AAT CCA TCC CAC AAT CAG CGA TGG CTG AGG GGG TCT GGA CCT CGC GGG ACG479480 GGG CTG CAC GCC CCC AAG CAA ATG CAC AGC GCG GCT AAA TTG GAT TCG ACA GCA CCG GAA5391 Met His Ser Ala Ala Lys Leu Asp Ser Thr Ala Pro Glu 13540 ACG GCG ACT CCC ACT TGG GGC GCT GCG GAC ACA CGA GTC GAG GCT GCC TTC CAG GAA GCA59914 Thr Ala Thr Pro Thr Trp Gly Ala Ala Asp Thr Arg Val Glu Ala Ala Phe Gln Glu Ala 33600 AAC AAA AAA AGG GGG GAA AAG GGG GGG AAA GAA AGA AAG AGA AAA AGG AGG GCG AGT GGC65934 Asn Lys Lys Arg Gly Glu Lys Gly Gly Lys Glu Arg Lys Arg Lys Arg Arg Ala Ser Gly 53660 GAG CAG GGG CCT CGG CCG CCA CCC ACA CGC CCC GAA GCG TGC TCG TCC CCC GCG CGG GGC71954 Glu Gln Gly Pro Arg Pro Pro Pro Thr Arg Pro Glu Ala Cys Ser Ser Pro Ala Arg Gly 73720 TCC CGG CCG CCG CCC TCG GCC ATC GGC TGC TCC CCG GTG GCC CAG GCC TCG GAC TCC GCG77974 Ser Arg Pro Pro Pro Ser Ala Ile Gly Cys Ser Pro Val Ala Gln Ala Ser Asp Ser Ala 93780 GCC GGC CCG GCG CGG CCC AGC GCC CTC AGG TGC GTA CCC CGC CCC CGC CGC CGA CGC CGC83994 Ala Gly Pro Ala Arg Pro Ser Ala Leu Arg Cys Val Pro Arg Pro Arg Arg Arg Arg Arg113840 CGA CGC CGC CAT TAA GGG CGG GTT GCC TTT CGG AAC GTC CTC CTC CTG AGG GCC TGG GGA899114 Arg Arg Arg His ***118900 AGG GAG GCC GCC CGG CCG CAG CGG GAG GTG GCC CCC CGG GAC ACC CCG GCG CCC CGA GGC959960 GAG GCA CCC CCG AAC CCC GAT CCC TGC TGG CAG GAC CAG AGG TGT GAG GGT GGG GGC GGA 10191020 GAA GCC TTG CCG CGG GGG CAA TGG TCG TAC GCA CGG AGC GCA CAT CCC TCT CCT TCC TGA 10791080 TTG GCC GAG CGG GGG TGT GCG TGA TGC CAC GCT CCG CCC GTC GTA CGT GGG GCG CTC GCG 11391140 GGG GCG GGG GCC GCC GCT GTT ACC AGG CAA CTG CGC CCC GGA TCC GCC CCC TGA CGT CAC 11991200 GCG TTG CCT AGA GGC CCA GGT TGT GGG TTT TGT CCG TGG GTA TGG TCC TCG CGA CGG CCT 12591260 CCG GGG ATC TGT TTG TTG GCG GAA AAC CAA TCC AGA CTC CCA AGG AAA AAG GCC GAG GCC 13191320 CGG GAA TTT CCC GTT GCA ATT CTG GTT TCG AGT TCT AGG GGG AAA AAG GCT CGC AAG GCT 13791380 GTA TTC TCC ATC CCT CAA AGC CCA AGC TTT CTT GTT TCT TAA TAA CAG CTT CGT TGA GAT 14391440 CCA TTG TAA AAT TCA CGT TTT AAG AGT GAA TAA TTC AGT GCA CAG AGC TGT GCA ACC TTT 14991500 GCC ACT AAT TGC AGA ACG CTT TCA GCA CCC GAG GAG AAG AAA CCC CAA CCC CAT TAG GCC 15591560 GTC ATT CCC CGG TCC CCA CCC CGT CCC TAT CCC CAG CCC CTG GCA ATC ACT TTT GTC TCC 16191620 GTG GAT TTG CCT ATT CTG GAC ATT TCG TGT GGA TAG AAT CAT CCC AAG AAG TTT TTT GTG 16791680 TGT CTG GCT TCT TTC CTT CTT TAT GGC TGA ATA AAA ATC CAT GAT ATG AAA AAA AAA AAA 17391740 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA 17991800 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AA18372.FP2234
A核苷酸序列(SEQ ID NO4)長度2182個堿基1 GCAGAGAAAT TTGAAAATTG GCAGGTGCAC TTTCTTGACC TTTCCAAAAA TAGTCTGAGT61 CACTTTCACT TTCAGCCTTC AAACTGTGTT GAATGAAACC TTTGTGCAGT TTACAGAAAG121 TGAAGAACTG TTTGGCAAGA GAGAGAAGTT CGAGCTCCTA ATAGCCTCGG CTGCATTGAG181 TAACATTTCT TTTGAGTTGT CTATTAACAC TTTCCTGAAA CATGCTTTTT ATGACGCCTA241 GAACTTGTGT AAGAGTGACT GTAATTTGAG TTATTTAAAA ATGTAAGTAC AAGAAATGTG301 TCACACGCCA TAAGAGCTAG GAAATGACAG CTCACATTCA TCTTGGTGGA AGGAAACTCT361 AATTATTGGA AGATGTGATT GGAGTATTTG TTCTTAATAC CTACGGTGGC TCTGTTATAT421 GCTTGCCTAA CACCAGTATT GGCTTGCAAA TAACACTGAA AAGCTCCTTT CTTTTCCTCT481 GGTCTTTGTG GGAAGGCATG GTATGAGTCG AGATTGCTAA ACCACTCTTC TGAGAGGACT541 CAGAGAGAGT GTTTATCCTA GACTATCCAT GGCCCTGGTA CTTCTGAGTT CAGTTGTGGT601 GTGATCTCAT TAGTCCAGGC TCAGAATGGC TCGGTAACCT CAAAACTCCA AGCCCTCGGT661 GCTTGCTTTG CTTCCCTAGA CTTGCAGCTT ATGTACGCCC ACATGTGCTT CATGCGTATT721 AAAAATGCTT GCATGTGTAG ATAGGAAGAT ATATGTTGAC TGTCCTGAAA AACTTGACAT781 ACCTAACATT TAAAATTGTT TTGAGTTTCC CCCGGGGATA AACTAGTCTT CAAATGTAAA841 CGTGATGAGC AGCGTAGGGG CTATGGTACC AGAGAAAAGA GCCGAATCTC GGCCCTGGTC901 CAGCCCTACC TCTCGTGCTC TGTCACCTGC AGCAGAGGTG GAGTGGGGGC CATGTCTGTG961 AGCGGGACCT CATCTTGTCT ATTCCTCAGA CCCACCCAAG GGCAGGGATT CCCAAAACTG1021 CTGGTACCTG TAAGAGGTAT TGTATTCTTG GACTCCATTC CATAACCTCT CATCAGGATT1081 CTGGGTTTGG AACTCTAGAA TCAATGTTGA GGAAAAATAG AACTTGGCGA TTTTATTTTT1141 CTAGATATAA TTCACATACC ATAAAAGCCA CTCTTTAAAT TGTACAATTC AGTGGTTTTT1201 TAGTATATTC AGAGTTGTAC AGCCATGACC ACTAGCTAAT TCAGAATATT TTCATTGCCT1261 CCCAACAAGC CTAGTACTCA TGAGTAGTCA CTCCCTTGCC CATTCCCTCC ACCCCCAAGC1321 CCCTGGCAAC CACTAATCTA CTTTCTGTCT CTATGGATTT GCCTATTTGA GACATTCATA1381 TGAATGGAAT TATATAATAT GTAGACTTTT GTATCTGTTT TTTTTTCATT TAGCATAAAA1441 ATTTTCAAGA TTTGTCCACA GTGTAGTGGT GTCTCAGTAC TTCTTTCCTT TTTATCACTG1501 AAAATACTTC ATTGATGTAT ATGTCATATT TTGTTATCTA CTCATCAATT GATGAATACT1561 TGTATTGTTT CCACTTTGGC TGTTACAAAT AATGCTGTTA TGAACATGTG TGTACAAGTA1621 TTTGTGTGGG TACATGTTAT TTCTCTTGGG CATACCTACA GATGGAATTA CTGGATCATA1681 TGACAACTTT ATGTTTAACT TTTTGAAAAA CTACAAAACC AACAAGCTGT ACCATTTTGT1741 AATCCCACCA GCAATGAATA GGGTTCTAAT TTTTCCACAT CTTCATCAAT ATTTGTTATT1801 GATCTTTTTG ATTATAGCCA ATCTAGTGAG TGTGAACTGG TATCTTATTG TAATTGTGAT1861 TTTGATTTGC AATTCCCTAA TGATGTTGAA CAGATGTTCA TATAATTGTT GGCCATTTAT1921 ATAGTCTTTA GAGATATATC TGTTTTGCCC ATTTCTAACT GAGCAAAACA GACAAAAATT1981 GAGTTGTGAA TGTTCTTTAT GTATACTGTA TACAAGCCCC TTAACAGATA TATGATTTGC2041 AAATCTTTTC TGTTCTGTAG GTTGTTTCTC CATGTTCTTG TTGGTATGCT TGGAAGCATA2101 AAAGTTTTTA TTCTGGTGGA GTCCAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA2161 AAAAAAAAAA AAAAAAAAAA AAB核苷酸序列(SEQ ID NO6)長度96個氨基酸1 MLFLLGIPTD GITGSYDNFM FNFLKNYKTN KLYHFVIPPA MNRVLIFPHL HQYLLLIFLI61 IANLVSVNWY LIVIVILICN SLMMLNRCSY NCWPFIC.核苷酸及氨基酸組合序列(SEQ ID NO5)克隆號和蛋白名稱FP2234起始編碼子1634 ATG 終止編碼子1922 TAG 蛋白質分子量11333.151G CAG AGA AAT TTG AAA ATT GGC AGG TGC ACT TTC TTG ACC TTT CCA AAA ATA GTC TGA 5859 GTC ACT TTC ACT TTC AGC CTT CAA ACT GTG TTG AAT GAA ACC TTT GTG CAG TTT ACA GAA 118119 AGT GAA GAA CTG TTT GGC AAG AGA GAG AAG TTC GAG CTC CTA ATA GCC TCG GCT GCA TTG 178179 AGT AAC ATT TCT TTT GAG TTG TCT ATT AAC ACT TTC CTG AAA CAT GCT TTT TAT GAC GCC 238239 TAG AAC TTG TGT AAG AGT GAC TGT AAT TTG AGT TAT TTA AAA ATG TAA GTA CAA GAA ATG 298299 TGT CAC ACG CCA TAA GAG CTA GGA AAT GAC AGC TCA CAT TCA TCT TGG TGG AAG GAA ACT358359 CTA ATT ATT GGA AGA TGT GAT TGG AGT ATT TGT TCT TAA TAC CTA CGG TGG CTC TGT TAT418419 ATG CTT GCC TAA CAC CAG TAT TGG CTT GCA AAT AAC ACT GAA AAG CTC CTT TCT TTT CCT478479 CTG GTC TTT GTG GGA AGG CAT GGT ATG AGT CGA GAT TGC TAA ACC ACT CTT CTG AGA GGA538539 CTC AGA GAG AGT GTT TAT CCT AGA CTA TCC ATG GCC CTG GTA CTT CTG AGT TCA GTT GTG598599 GTG TGA TCT CAT TAG TCC AGG CTC AGA ATG GCT CGG TAA CCT CAA AAC TCC AAG CCC TCG658659 GTG CTT GCT TTG CTT CCC TAG ACT TGC AGC TTA TGT ACG CCC ACA TGT GCT TCA TGC GTA718719 TTA AAA ATG CTT GCA TGT GTA GAT AGG AAG ATA TAT GTT GAC TGT CCT GAA AAA CTT GAC778779 ATA CCT AAC ATT TAA AAT TGT TTT GAG TTT CCC CCG GGG ATA AAC TAG TCT TCA AAT GTA838839 AAC GTG ATG AGC AGC GTA GGG GCT ATG GTA CCA GAG AAA AGA GCC GAA TCT CGG CCC TGG898899 TCC AGC CCT ACC TCT CGT GCT CTG TCA CCT GCA GCA GAG GTG GAG TGG GGG CCA TGT CTG958959 TGA GCG GGA CCT CAT CTT GTC TAT TCC TCA GAC CCA CCC AAG GGC AGG GAT TCC CAA AAC 10181019 TGC TGG TAC CTG TAA GAG GTA TTG TAT TCT TGG ACT CCA TTC CAT AAC CTC TCA TCA GGA 10781079 TTC TGG GTT TGG AAC TCT AGA ATC AAT GTT GAG GAA AAA TAG AAC TTG GCG ATT TTA TTT 11381139 TTC TAG ATA TAA TTC ACA TAC CAT AAA AGC CAC TCT TTA AAT TGT ACA ATT CAG TGG TTT 11981199 TTT AGT ATA TTC AGA GTT GTA CAG CCA TGA CCA CTA GCT AAT TCA GAA TAT TTT CAT TGC 12581259 CTC CCA ACA AGC CTA GTA CTC ATG AGT AGT CAC TCC CTT GCC CAT TCC CTC CAC CCC CAA 13181319 GCC CCT GGC AAC CAC TAA TCT ACT TTC TGT CTC TAT GGA TTT GCC TAT TTG AGA CAT TCA 13781379 TAT GAA TGG AAT TAT ATA ATA TGT AGA CTT TTG TAT CTG TTT TTT TTT CAT TTA GCA TAA 14381439 AAA TTT TCA AGA TTT GTC CAC AGT GTA GTG GTG TCT CAG TAC TTC TTT CCT TTT TAT CAC 14981499 TGA AAA TAC TTC ATT GAT GTA TAT GTC ATA TTT TGT TAT CTA CTC ATC AAT TGA TGA ATA 15581559 CTT GTA TTG TTT CCA CTT TGG CTG TTA CAA ATA ATG CTG TTA TGA ACA TGT GTG TAC AAG 16181619 TAT TTG TGT GGG TAC ATG TTA TTT CTC TTG GGC ATA CCT ACA GAT GGA ATT ACT GGA TCA 16781 Met Leu Phe Leu Leu Gly Ile Pro Thr Asp Gly Ile Thr Gly Ser 151679 TAT GAC AAC TTT ATG TTT AAC TTT TTG AAA AAC TAC AAA ACC AAC AAG CTG TAC CAT TTT 173816 Tyr Asp Asn Phe Met Phe Asn Phe Leu Lys Asn Tyr Lys Thr Asn Lys Leu Tyr His Phe 351739 GTA ATC CCA CCA GCA ATG AAT AGG GTT CTA ATT TTT CCA CAT CTT CAT CAA TAT TTG TTA 179836 Val Ile Pro Pro Ala Met Asn Arg Val Leu Ile Phe Pro His Leu His Gln Tyr Leu Leu 551799 TTG ATC TTT TTG ATT ATA GCC AAT CTA GTG AGT GTG AAC TGG TAT CTT ATT GTA ATT GTG 185856 Leu Ile Phe Leu Ile Ile Ala Asn Leu Val Ser Val Asn Trp Tyr Leu Ile Val Ile Val 751859 ATT TTG ATT TGC AAT TCC CTA ATG ATG TTG AAC AGA TGT TCA TAT AAT TGT TGG CCA TTT 191876 Ile Leu Ile Cys Asn Ser Leu Met Met Leu Asn Arg Cys Ser Tyr Asn Cys Trp Pro Phe 951919 ATA TAG TCT TTA GAG ATA TAT CTG TTT TGC CCA TTT CTA ACT GAG CAA AAC AGA CAA AAA 197896 Ile *** 971979 TTG AGT TGT GAA TGT TCT TTA TGT ATA CTG TAT ACA AGC CCC TTA ACA GAT ATA TGA TTT 20382039 GCA AAT CTT TTC TGT TCT GTA GGT TGT TTC TCC ATG TTC TTG TTG GTA TGC TTG GAA GCA 20982099 TAA AAG TTT TTA TTC TGG TGG AGT CCA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA 21582159 AAA AAA AAA AAA AAA AAA AAA AAA 21823.FP6679A核苷酸序列(SEQ ID NO7)長度1962個堿基1 GCAAGAATTG GTTCTTTTCG GGGTTCTCTC CTATATCCCA TACAATCAAA CAATAAATAT61 GTGTTGAATA AATCACTTGT GCAAATTCTA AAATTCACAT ATGACCCTGT ATTTTATCAT121 ATCTCCCATA GAATAGGTGA GAACCAGAGA AAAATATTGT TAAGCCCAGG AGCCCAAGCT181 ATATGATCAA CTGGAAAGAC TCAGTAGGTA ATTTGTTCCT AGAAAGCAGC CTATGGCAAC241 AAATGATTGA AATTTCCACC TTGATAAAAT GACGAATTAC TACATGTCAG AGATTTCTAG301 TTTGCTTGTA AATAATGAAA GCTGTGATGA TAAATCCCAG ATTTTCACCC TGAGGTACCC361 TATCAGCAAA ACAGTAAATG CCATTCATTC TTCTGGAGGC CTTGCCAAAA AAAGTCATTG421 CCTAACTAAA AAATATGCTG GAGTCTCACA TTTTGTCTTA AAATTTCATG TGAATTTTGG481 ATTTTATGCC ACAATACATA TTTATTATAA TATTAACATT AAATTACCAG TTAAATTTCT541 TAAATTTTTC TAAAAAATTT TGAAAAAGCT GATAGTCCCA GAAGATGTAT TATGTTTAGC601 TTGTGTCTTG GCATATCATC AAGTCCAAGG AGCACATGAC AGATGAGAAA GGTGAGTGTA661 ATCCATGGAA CTTGGTCAAT GCAGTAGGTT GAATTGTGTC CCCCCAAAAG ATATGCACAA721 GCTCAGCTGG GTGTGGTGGC TCACACCTGT AATCCCAGCA CTGTGGGAGG CCAGGGCAGG781 CAGATCGCTG GAGGTCAGGA GTTTGAGACT AGGCTGGCCA ACATGGTGAA ATCCCATCTC841 TACTAAAAGT ACAAAAATTA GCCGGGCGTG ATGGCAGGTG CCCATAGTCC CAGCTACTCA901 GGAGGCTGAG GCAGGAGAAT CGCTTGAACC TGGGAGGCAG AGTTTGCAGT GAGACAAGAT961 TGCACCACTG CACTATAGCC TGGGTGACAG AGCAAGACTC TGCCTCAAAA AAAAAAAAAA1021 AAGATATGCA TAAGCTCTAG CTACCCCACT CCTTTTTCTG TGAATGTGAC CTTATTTGGA1081 TATACGGGTC TTTGCAGATA TAATTAAGTT GAGGATCTCA AAATGAGATA ATGTTGGATT1141 TAATCCAATG AGAGAGATCT GAGACCCAAA GAAACAGGGG AGACAGTCAT ATGAAGAAGG1201 AGGCTGCTAT GGTTTGGATG TGGTTTGTCC CCACTAAAAC TCCTGTTGAA ATTTGATCCC1261 CAGTGTGGCA GTATTGGGAG ATGGGAAGTG TTTTGGGGTC ATGGGAGCCA GGGTGTCTCA1321 TGAATAGGGT TAATGCCCTC CCAGTGGAGA GCATTCTCAT TCTTGTGGGA CTGGATTAAT1381 TACTGAAGAG CAGGTTGTTA TAACAAGTGA GTTCAGCCTC CTAGACTCTC TCTCTTGCTT1441 CCTCTCTCAC CATGTGATCT TTTGGCACAC ACCCGCTTCC CCTTCCTCTT TCTTCCATGA1501 GTTGAAGTGG TGTGGGACCC TGACCAGTTG CAGCTACCCA ATCTTGAATT TCCAGCCTAC1561 AGAACTGTGA GCTAAATAAG CCTCTTTTCT TTATAAATTA CCCAGTCTAA AGTGTTCTGT1621 TATAGCAACA AAAATAATGG ACTAAGAAAA TGGTAGGAGA CGCCCTGGCT TGGTGGCTCA1681 TGCCTGTAAT CCCAGCACTT TGGGAGGCCA AGGCAGGCGG ATCGCCTGAG GTCAGGAGTT1741 CAAGACCAGC CTGACCAACA TGGTGAAGCC CCATCTCTAC TAAAAATACA AAAATTAGCC1801 GGCCTTGGTG GCACACACCT ATAATCCCAG CTCCTTGGGA GGCTGAGGCA GGAGAATTTC1861 TTGAACCCAG GAGGCAGAGG TTGCAATGAG CTGAGATTCT GCCACTGCAC TCCAGCCTGG1921 GTGACAGAGC AAGACTGTGT CTGGAAAAAA AAAAAAAAAA AAB核苷酸序列(SEQ ID NO9)長度94個氨基酸1 MTNYYMSEIS SLLVNNESCD DKSQIFTLRY PISKTVNAIH SSGGLAKKSH CLTKKYAGVS61 HFVLKFHVNF GFYATIHIYY NINIKLPVKF LKFFC.核苷酸及氨基酸組合序列(SEQ ID NO8)克隆號和蛋白名稱FP6679起始編碼子;269 ATG 終止編碼子551 TAA 蛋白質分子量10833.101G CAA GAA TTG GTT CTT TTC GGG GTT CTC TCC TAT ATC CCA TAC AAT CAA ACA ATA AAT 5859 ATG TGT TGA ATA AAT CAC TTG TGC AAA TTC TAA AAT TCA CAT ATG ACC CTG TAT TTT ATC118119 ATA TCT CCC ATA GAA TAG GTG AGA ACC AGA GAA AAA TAT TGT TAA GCC CAG GAG CCC AAG178179 CTA TAT GAT CAA CTG GAA AGA CTC AGT AGG TAA TTT GTT CCT AGA AAG CAG CCT ATG GCA238239 ACA AAT GAT TGA AAT TTC CAC CTT GAT AAA ATG ACG AAT TAC TAC ATG TCA GAG ATT TCT2981 Met Thr Asn Tyr Tyr Met Ser Glu Ile Ser 10299 AGT TTG CTT GTA AAT AAT GAA AGC TGT GAT GAT AAA TCC CAG ATT TTC ACC CTG AGG TAC35811 Ser Leu Leu Val Asn Asn Glu Ser Cys Asp Asp Lys Ser Gln Ile Phe Thr Leu Arg Tyr 30359 CCT ATC AGC AAA ACA GTA AAT GCC ATT CAT TCT TCT GGA GGC CTT GCC AAA AAA AGT CAT41831 Pro Ile Ser Lys Thr Val Asn Ala Ile His Ser Ser Gly Gly Leu Ala Lys Lys Ser His 50419 TGC CTA ACT AAA AAA TAT GCT GGA GTC TCA CAT TTT GTC TTA AAA TTT CAT GTG AAT TTT47851 Cys Leu Thr Lys Lys Tyr Ala Gly Val Ser His Phe Val Leu Lys Phe His Val Asn Phe 70479 GGA TTT TAT GCC ACA ATA CAT ATT TAT TAT AAT ATT AAC ATT AAA TTA CCA GTT AAA TTT53871 Gly Phe Tyr Ala Thr Ile His Ile Tyr Tyr Asn Ile Asn Ile Lys Leu Pro Val Lys Phe 90539 CTT AAA TTT TTC TAA AAA ATT TTG AAA AAG CTG ATA GTC CCA GAA GAT GTA TTA TGT TTA59891 Leu Lys Phe Phe *** 95599 GCT TGT GTC TTG GCA TAT CAT CAA GTC CAA GGA GCA CAT GAC AGA TGA GAA AGG TGA GTG658659 TAA TCC ATG GAA CTT GGT CAA TGC AGT AGG TTG AAT TGT GTC CCC CCA AAA GAT ATG CAC718719 AAG CTC AGC TGG GTG TGG TGG CTC ACA CCT GTA ATC CCA GCA CTG TGG GAG GCC AGG GCA778779 GGC AGA TCG CTG GAG GTC AGG AGT TTG AGA CTA GGC TGG CCA ACA TGG TGA AAT CCC ATC838839 TCT ACT AAA AGT ACA AAA ATT AGC CGG GCG TGA TGG CAG GTG CCC ATA GTC CCA GCT ACT898899 CAG GAG GCT GAG GCA GGA GAA TCG CTT GAA CCT GGG AGG CAG AGT TTG CAG TGA GAC AAG958959 ATT GCA CCA CTG CAC TAT AGC CTG GGT GAC AGA GCA AGA CTC TGC CTC AAA AAA AAA AAA 10181019 AAA AGA TAT GCA TAA GCT CTA GCT ACC CCA CTC CTT TTT CTG TGA ATG TGA CCT TAT TTG 10781079 GAT ATA CGG GTC TTT GCA GAT ATA ATT AAG TTG AGG ATC TCA AAA TGA GAT AAT GTT GGA 11381139 TTT AAT CCA ATG AGA GAG ATC TGA GAC CCA AAG AAA CAG GGG AGA CAG TCA TAT GAA GAA 11981199 GGA GGC TGC TAT GGT TTG GAT GTG GTT TGT CCC CAC TAA AAC TCC TGT TGA AAT TTG ATC 12581259 CCC AGT GTG GCA GTA TTG GGA GAT GGG AAG TGT TTT GGG GTC ATG GGA GCC AGG GTG TCT 13181319 CAT GAA TAG GGT TAA TGC CCT CCC AGT GGA GAG CAT TCT CAT TCT TGT GGG ACT GGA TTA 13781379 ATT ACT GAA GAG CAG GTT GTT ATA ACA AGT GAG TTC AGC CTC CTA GAC TCT CTC TCT TGC 14381439 TTC CTC TCT CAC CAT GTG ATC TTT TGG CAC ACA CCC GCT TCC CCT TCC TCT TTC TTC CAT 14981499 GAG TTG AAG TGG TGT GGG ACC CTG ACC AGT TGC AGC TAC CCA ATC TTG AAT TTC CAG CCT 15581559 ACA GAA CTG TGA GCT AAA TAA GCC TCT TTT CTT TAT AAA TTA CCC AGT CTA AAG TGT TCT 16181619 GTT ATA GCA ACA AAA ATA ATG GAC TAA GAA AAT GGT AGG AGA CGC CCT GGC TTG GTG GCT 16781679 CAT GCC TGT AAT CCC AGC ACT TTG GGA GGC CAA GGC AGG CGG ATC GCC TGA GGT CAG GAG 17381739 TTC AAG ACC AGC CTG ACC AAC ATG GTG AAG CCC CAT CTC TAC TAA AAA TAC AAA AAT TAG 17981799 CCG GCC TTG GTG GCA CAC ACC TAT AAT CCC AGC TCC TTG GGA GGC TGA GGC AGG AGA ATT 18581859 TCT TGA ACC CAG GAG GCA GAG GTT GCA ATG AGC TGA GAT TCT GCC ACT GCA CTC CAG CCT 19181919 GGG TGA CAG AGC AAG ACT GTG TCT GGA AAA AAA AAA AAA AAA AA19624.FP6778A核苷酸序列(SEQ ID NO10)長度2263個堿基1 GCTGATCCCT CAATTTCTAG CACATAATTT CATCACTAGT TCACTTACAA ACCTCAGTTT61 TCCCATGTGT AAAATAGGAA TTAAGTGATC ACAAGGCCGC TCTATGGAGC CCTCATCCTA121 AGGTTACAAT GAGTACATAT CAGTTGTAGG AGTCCTTTTA TCCAACAGTG ACTCCGTCAA181 GCCCTTGCCG TATGCTAGGG CTTGTAGTGG ACACCCGAAG AACCATAAGG AGTAAGATGA241 GGCTGGTTGC AGAGAGTACA GTCTCATCAG AAGAACTTGC TCTTGTAATA AATTCAATCA301 TTGACAATCA TTATTTCCAC CCAATCTGTG AAACAGAATA CCGTTATTTC TTTTTTTTGA361 GAGAGAGTCT TCTTCTGTCG CCCAGGCTGG AGTGTAGTGG CGTGATCTCA GCTCACTGCA421 ACCTCCACCT CCACCTCCCG GGTTCAAGCA ATTCTCGTGC CTCAGCCTCC CAACTAGCTG481 GAGCTGCAGG CGCATACCAC CATGCCCAGC TAATTTTTGT ATTATTTGTA GAGATGGGGT541 TTTGCCACAT TGCCCAGGCT GGTCTTGAAC TCCTGTCCTC AGGTTATCCA CCTCCCAAAG601 TGCTGGGGTT ACAGGCATGA GCCACTGCGG GATCTCACTC GGTCACCCAG GCTGGAATGC661 AGTGGAGTGA TCATGGCTCG CTGTAGCCTT GACCTGGGCT CAAGCGATCC TCCTGCCTCA721 GCCTCCCAGG CTGGTCTCGA ACTCCTGACC TCAGGTGATC TGCCCACCTT GGCCTCCCTA781 AGTGCTGGGG TTACAGGCAA GAGCCACCGC GCCCAGCCGG AAATTCCATT TTAGACTGGA841 AGCCACAGTA TAAGGAAAAC AGCTCCTTGG AGTGCATTCA GAGTATGACT CCATGGCCAG901 GACAGGGAGG GGCTCTAACA TAAAAAGAAC TAGGGGGTTC GGAGACGTTC CTAATCTTGG961 GGTAGCAGGG AAAGACGGCA GCACCACTGG ACAGCAGGAG CAAGAGGAAT AATTTCAGGA1021 ATCTGGGACG CGAAAAGATA AGGGGGAAGG GTCATGGGGG CATTTGTGGG TTCTGTCCTT1081 GTAGTTCTCA AGAGCCGACC AGAAAGAAAG GCCAGGGGAC GGAGCCAGGC TTTTTCTGAG1141 AGACCCCTGT AGACCCCAGC CAAGCATAGA GGCTGGCGAG AGGAAACTTT TTTGTTTTTG1201 CTTCTGAGAC AGTCTTGCTC TGTTGCCCAG GCTGGAGTGC AGTGGCACAA TCTCAGCTCA1261 CTGCAACCTC CCCGTCCTGG GTTCAAGTGA TTCCCCTGCC TCAGCCTCCC AAATAGCTGG1321 GACTATGGGC ATATGGCTCC CCATCCTGGG TTCAAGCGAT TCTCCTGCCA CAGCCTCCCG1381 AGTAGCTGGG ACTACGGGCA TATGGCTCCC CATCCTGGGT TCAAGCGATT CTCCTGCCTC1441 AGCCTCCCGA GTAGCTGGGA CTACAGGCAT ATGGCACCAC GCATGGCTAA TTTTCTTATT1501 TTTAGTAGAG ATAACTCCTG GGCTCAAGCG ATCTGCCCAC CTCGGCCTCC CAAAGTGCTG1561 AGATTACAGG CACATGCCAC CACACCCAGC TAATTATTGT GTTTTTAGTA GAGACGGGGT1621 TTTGCCATGT TTGCCCAGGC TGCTCTTGAA CTCCTGGGCT CAAACGATCC ACCCACCTCT1681 GCCTCCCAAA GTTCTGGGGT TACAGGCATC AGCCACCATG CCCAGCCAGG AAGCTTATTC1741 CCAGTGGTCT GGCTCTCCAG AGTTGCCACG CTGAAAGATG CTTGCTCTGG AGAGAGTGAG1801 CTCCCTGTCA CCAGAGCTAT GCAAGCAGAT TCAGGCCAGC CCTCCCAGAG AGCATGAGAT1861 GGGGAATCAC GCACAGAGTG GACCGAAGGA GGGATTGAAC AAGAAGGCTC AAAGGGTCCC1921 TTTTGACCCT GAAGTCTAGG ATTTCGTGAA GCTACAGGTG AACCCATTGG CATGAGAAGC1981 ATCCAGGGAG GAAAGATGCA AGCCCTTGGA ATATCGAGAG AATATTTCCA GCAGGAAAAG2041 AAGTGGAAGG TTAAAGGAAA GCCAGAGAAG GGGACGTTGC CCTGGGCCAT CAACTAAGAG2101 AAAAGCTGCC CAGAGCCAGG CATGGTGGCG GCGGTGCCTA TAGTACCGGC AGTTGGAGAG2161 GCCGAGGCAG GAGCATCACT TGAGCCCATG AGTTTGAGAC CAGCCTGGGC AACATAGTGA2221 GACTTTTTTC TCTACAAAAA AGTTTAAAAA AAAAAAAAAA AAAB核苷酸序列(SEQ ID NO12)長度142個氨基酸1 MLGLVVDTRR TIRSKMRLVA ESTVSSEELA LVINSIIDNH YFHPICETEY RYFFFLRESL61 LLSPRLECSG VISAHCNLHL HLPGSSNSRA SASQLAGAAG AYHHAQLIFV LFVEMGFCHI121 AQAGLELLSS GYPPPKVLGL QAC.核苷酸及氨基酸組合序列(SEQ ID NO11)克隆號和蛋白名稱FP6778起始編碼子192 ATG 終止編碼子618 TGA 蛋白質分子量15625.221 GC TGA TCC CTC AAT TTC TAG CAC ATA ATT TCA TCA CTA GTT CAC TTA CAA ACC TCA GTT 5960 TTC CCA TGT GTA AAA TAG GAA TTA AGT GAT CAC AAG GCC GCT CTA TGG AGC CCT CAT CCT119120 AAG GTT ACA ATG AGT ACA TAT CAG TTG TAG GAG TCC TTT TAT CCA ACA GTG ACT CCG TCA179180 AGC CCT TGC CGT ATG CTA GGG CTT GTA GTG GAC ACC CGA AGA ACC ATA AGG AGT AAG ATG2391 Met Leu Gly Leu Val Val Asp Thr Arg Arg Thr Ile Arg Ser Lys Met 16240 AGG CTG GTT GCA GAG AGT ACA GTC TCA TCA GAA GAA CTT GCT CTT GTA ATA AAT TCA ATC29917 Arg Leu Val Ala Glu Ser Thr Val Ser Ser Glu Glu Leu Ala Leu Val Ile Asn Ser Ile 36300 ATT GAC AAT CAT TAT TTC CAC CCA ATC TGT GAA ACA GAA TAC CGT TAT TTC TTT TTT TTG35937 Ile Asp Asn His Tyr Phe His Pro Ile Cys Glu Thr Glu Tyr Arg Tyr Phe Phe Phe Leu 56360 AGA GAG AGT CTT CTT CTG TCG CCC AGG CTG GAG TGT AGT GGC GTG ATC TCA GCT CAC TGC41957 Arg Glu Ser Leu Leu Leu Ser Pro Arg Leu Glu Cys Ser Gly Val Ile Ser Ala His Cys 76420 AAC CTC CAC CTC CAC CTC CCG GGT TCA AGC AAT TCT CGT GCC TCA GCC TCC CAA CTA GCT47977 Asn Leu His Leu His Leu Pro Gly Ser Ser Asn Ser Arg Ala Ser Ala Ser Gln Leu Ala 96480 GGA GCT GCA GGC GCA TAC CAC CAT GCC CAG CTA ATT TTT GTA TTA TTT GTA GAG ATG GGG53997 Gly Ala Ala Gly Ala Tyr His His Ala Gln Leu Ile Phe Val Leu Phe Val Glu Met Gly116540 TTT TGC CAC ATT GCC CAG GCT GGT CTT GAA CTC CTG TCC TCA GGT TAT CCA CCT CCC AAA599117 Phe Cys His Ile Ala Gln Ala Gly Leu Glu Leu Leu Ser Ser Gly Tyr Pro Pro Pro Lys136600 GTG CTG GGG TTA CAG GCA TGA GCC ACT GCG GGA TCT CAC TCG GTC ACC CAG GCT GGA ATG659137 Val Leu Gly Leu Gln Ala ***143660 CAG TGG AGT GAT CAT GGC TCG CTG TAG CCT TGA CCT GGG CTC AAG CGA TCC TCC TGC CTC719720 AGC CTC CCA GGC TGG TCT CGA ACT CCT GAC CTC AGG TGA TCT GCC CAC CTT GGC CTC CCT779780 AAG TGC TGG GGT TAC AGG CAA GAG CCA CCG CGC CCA GCC GGA AAT TCC ATT TTA GAC TGG839840 AAG CCA CAG TAT AAG GAA AAC AGC TCC TTG GAG TGC ATT CAG AGT ATG ACT CCA TGG CCA899900 GGA CAG GGA GGG GCT CTA ACA TAA AAA GAA CTA GGG GGT TCG GAG ACG TTC CTA ATC TTG959960 GGG TAG CAG GGA AAG ACG GCA GCA CCA CTG GAC AGC AGG AGC AAG AGG AAT AAT TTC AGG 10191020 AAT CTG GGA CGC GAA AAG ATA AGG GGG AAG GGT CAT GGG GGC ATT TGT GGG TTC TGT CCT 10791080 TGT AGT TCT CAA GAG CCG ACC AGA AAG AAA GGC CAG GGG ACG GAG CCA GGC TTT TTC TGA 11391140 GAG ACC CCT GTA GAC CCC AGC CAA GCA TAG AGG CTG GCG AGA GGA AAC TTT TTT GTT TTT 11991200 GCT TCT GAG ACA GTC TTG CTC TGT TGC CCA GGC TGG AGT GCA GTG GCA CAA TCT CAG CTC 12591260 ACT GCA ACC TCC CCG TCC TGG GTT CAA GTG ATT CCC CTG CCT CAG CCT CCC AAA TAG CTG 13191320 GGA CTA TGG GCA TAT GGC TCC CCA TCC TGG GTT CAA GCG ATT CTC CTG CCA CAG CCT CCC 13791380 GAG TAG CTG GGA CTA CGG GCA TAT GGC TCC CCA TCC TGG GTT CAA GCG ATT CTC CTG CCT 14391440 CAG CCT CCC GAG TAG CTG GGA CTA CAG GCA TAT GGC ACC ACG CAT GGC TAA TTT TCT TAT 14991500 TTT TAG TAG AGA TAA CTC CTG GGC TCA AGC GAT CTG CCC ACC TCG GCC TCC CAA AGT GCT 15591560 GAG ATT ACA GGC ACA TGC CAC CAC ACC CAG CTA ATT ATT GTG TTT TTA GTA GAG ACG GGG 16191620 TTT TGC CAT GTT TGC CCA GGC TGC TCT TGA ACT CCT GGG CTC AAA CGA TCC ACC CAC CTC 16791680 TGC CTC CCA AAG TTC TGG GGT TAC AGG CAT CAG CCA CCA TGC CCA GCC AGG AAG CTT ATT 17391740 CCC AGT GGT CTG GCT CTC CAG AGT TGC CAC GCT GAA AGA TGC TTG CTC TGG AGA GAG TGA 17991800 GCT CCC TGT CAC CAG AGC TAT GCA AGC AGA TTC AGG CCA GCC CTC CCA GAG AGC ATG AGA 18591860 TGG GGA ATC ACG CAC AGA GTG GAC CGA AGG AGG GAT TGA ACA AGA AGG CTC AAA GGG TCC 19191920 CTT TTG ACC CTG AAG TCT AGG ATT TCG TGA AGC TAC AGG TGA ACC CAT TGG CAT GAG AAG 19791980 CAT CCA GGG AGG AAA GAT GCA AGC CCT TGG AAT ATC GAG AGA ATA TTT CCA GCA GGA AAA 20392040 GAA GTG GAA GGT TAA AGG AAA GCC AGA GAA GGG GAC GTT GCC CTG GGC CAT CAA CTA AGA 20992100 GAA AAG CTG CCC AGA GCC AGG CAT GGT GGC GGC GGT GCC TAT AGT ACC GGC AGT TGG AGA 21592160 GGC CGA GGC AGG AGC ATC ACT TGA GCC CAT GAG TTT GAG ACC AGC CTG GGC AAC ATA GTG 22192220 AGA CTT TTT TCT CTA CAA AAA AGT TTA AAA AAA AAA AAA AAA AA22635.FP14381A核苷酸序列(SEQ ID NO13)長度2283個堿基1 GGATCAATCA CCCCAGCCAA CACTGTAACT CCCTTCTTAG CCTGTTGACT TAAAGGTAGG61 AGGAGCCCAA AGTGTCTAGG TGGCAATCTC AGCTTCCGGT TTAATGGAAT CATTCTTGTG121 TCTCCTGGTG GCAGTGTTCC TCCCCCTGGA ACTAAGACCT CCAAGCCAGC AGAATGTAAT181 GTCATGGGAA CAGGAAGAAA AATTTTGCTT GTGGAACACT ATGGGTGATG GTGAGTTGTG241 CCACTTCTAC TTCCATCCCT TGATTCCTGG ACCCGTGAAT CCTGGCTATG GGAGAAACAC301 TATCATATAT TGGATGCTGA TTTAGAGCAT ACATGGCTTT CTAGAGAACT TTGCCCCAGG361 CCTGCAAAGT ATTGTCACCT AGTTGGCATT GTAATTGTGA CTTCAAAAGG CCATTCCACC421 ATTCTATCAA TCCAGCTGCT TCAGATGATG GGGAATATGG TAAGACCAGT AAATTCCATG481 GGCACGAGAC CACTGCCACA CTGCTTTTGC CATAAAGTGA ATGCGTTGGT CAGAGGCAAT541 GCTGTTGGGA ATACCATGAT GGTGGGTAAG GCATTTCATG AGTCCACGGA TGGTAGTCTT601 GGCAGAAGCA TTGCATGCAG GATAGGCAAA CCCATATCCC AAGTAAGTGT CTATTCCAGT661 GAGGACAAAG CTTTGACTTT TCCATGATGG GAGAGGTCCA ATATAATCAA CCTGCCACCA721 GGTAGCTGGC TGATTACCCC GAGGAATGGT GCCATATTGA GGACTCAGTG TTGGTGTCTG781 CTGCTGGCAA ATTTGGCACT CAGCAGTGGC TGTAGCCAGG TCAGCCTTGG TGAGTGGAAG841 TCCATATTGC TGAACCCATG TGTAACCTCC ATCCCTGCCA CGATGGCCAC TTTGTTCGTG901 GGCCCATTGG GCGATCACAG GGGTGGCTGG GGAAGGAGGC TGAGTGGTGT CCATAGATCG961 GGTCATCCTA TCCACTTGAT TATTAAAATC CTCCTCTGCT GAGGTCACCT GTTGGTGGGC1021 ACCTACATGG AATACAAAAG TATTCACAGT TTTTGACCAC GCAGAAGAGG TTCATCCACA1081 TACCTCTTCC CCAACTTTGT CACAAATTTT CCAGTCATGC TTCTTCCAAG TCCCTGACCA1141 TCCAGCCAAA CCACTGGCCA CAGCCAATGA ATCAGTATAT AATCACATAT CTGGCCATTT1201 CTCCTTCCAT GCAAAGTGCA CAACTAGGTG CACTGCTCAA AGTTCTGCTT ACTGGGAAGA1261 TTCCTCTTCA CTGCTGTCCT TCAGGGGTGT CCTAGAAAGG GGGGCTGTAG TGCTCCAGTT1321 GTCCACTTTT GTGGGGAAAA GAAAGAGAGA TCAGACTGTT ACTGTGTCTA AGTAGAAAGG1381 GAAGACATAA GACACTCCAT TTTGAAAAAG ACCTGTACTT TAAATAATTG CTTTGCTGAG1441 ATGTTGTTAA TTTGTAGCTT TGCCCCAGCC ACTTTGACCC AACCACTTTG ACACAACCTG1501 GAGCTCACAA AAACATGTGT TGTATGAAAT CAAGGTTTAA GGGATCTAGG ACTGTGCAGG1561 ACGTGCCTTG TTAACAAAAT GTTTACAAGC AGTATACTTG GTAAAAGTCA TCGCCATTCT1621 CTAGTCTCAA TAAACCAGGG GCACAATGCA CTGTGGAAAG CCACAGGGAC CTCCACCCTT1681 GAAAGCGGGG TATTGTCCAA GGTTTCTCCC CATGTGATAG TCTAAAATAT GGCCTCACAG1741 GATTAGAAAG ACCTGACTGT CCCCCAGCCC GACACCCATA AAGGGTCTGT GCTGAGGTGG1801 ATTAGTAAAA GAGGAAAGCC TCTTGCAGTT GAGATAGCGG AAAGCCAGTC TCCTGCCTGC1861 CCCTGGGAAC TGAATGTCTC AGTATAAAAC CCAGTTGTAC ATTTGTTCAA TTCTGAGATG1921 AAAGAAAAAC TGCCCTGTGG TGAGAGGTGA GACATGTTTG CAGCAATGCT GCTTTGTTAT1981 TCTTTACTCC ACTGAGATGT TTGGGTGGAG AGAAACATAA ATCTGGCTTA CGTGCACGTC2041 CAGTCATAGT ACCTTCCCTT GAACTTAATT ATGACATAGA TTCTATTGCT CACGTTTGTT2101 GTTGACCTTT CCCCTTATTA TCACCCTGCC CTCCTACTAC ATTCCTTTTT GCTGAAATAA2161 TGAAGATAAT AATCAATAAA AACTGAGGGA ACCCAGAGAC TGGTGTCGGT GCAGGTCCTT2221 GGTATGCTGA GCGCTGGTCC CCTGGGCCCA CTGTTGTTTC TCTATAAAAA AAAAAAAAAA2281 AAAB核苷酸序列(SEQ ID NO15)長度80個氨基酸1 MMGNMVRPVN SMGTRPLPHC FCHKVNALVR GNAVGNTMMV GKAFHESTDG SLGRSIACRI61 GKPISQVSVY SSEDKALTFPC.核苷酸及氨基酸組合序列(SEQ ID NO14)克隆號和蛋白名稱FP14381起始編碼子445 ATG 終止編碼子685 TGA 蛋白質分子量8594.621 GGA TCA ATC ACC CCA GCC AAC ACT GTA ACT CCC TTC TTA GCC TGT TGA CTT AAA GGT AGG 6061 AGG AGC CCA AAG TGT CTA GGT GGC AAT CTC AGC TTC CGG TTT AAT GGA ATC ATT CTT GTG120121 TCT CCT GGT GGC AGT GTT CCT CCC CCT GGA ACT AAG ACC TCC AAG CCA GCA GAA TGT AAT180181 GTC ATG GGA ACA GGA AGA AAA ATT TTG CTT GTG GAA CAC TAT GGG TGA TGG TGA GTT GTG240241 CCA CTT CTA CTT CCA TCC CTT GAT TCC TGG ACC CGT GAA TCC TGG CTA TGG GAG AAA CAC300301 TAT CAT ATA TTG GAT GCT GAT TTA GAG CAT ACA TGG CTT TCT AGA GAA CTT TGC CCC AGG360361 CCT GCA AAG TAT TGT CAC CTA GTT GGC ATT GTA ATT GTG ACT TCA AAA GGC CAT TCC ACC420421 ATT CTA TCA ATC CAG CTG CTT CAG ATG ATG GGG AAT ATG GTA AGA CCA GTA AAT TCC ATG4801 Met Met Gly Asn Met Val Arg Pro Val Asn Ser Met 12481 GGC ACG AGA CCA CTG CCA CAC TGC TTT TGC CAT AAA GTG AAT GCG TTG GTC AGA GGC AAT54013 Gly Thr Arg Pro Leu Pro His Cys Phe Cys His Lys Val Asn Ala Leu Val Arg Gly Asn 32541 GCT GTT GGG AAT ACC ATG ATG GTG GGT AAG GCA TTT CAT GAG TCC ACG GAT GGT AGT CTT60033 Ala Val Gly Asn Thr Met Met Val Gly Lys Ala Phe His Glu Ser Thr Asp Gly Ser Leu 52601 GGC AGA AGC ATT GCA TGC AGG ATA GGC AAA CCC ATA TCC CAA GTA AGT GTC TAT TCC AGT66053 Gly Arg Ser Ile Ala Cys Arg Ile Gly Lys Pro Ile Ser Gln Val Ser Val Tyr Ser Ser 72661 GAG GAC AAA GCT TTG ACT TTT CCA TGA TGG GAG AGG TCC AAT ATA ATC AAC CTG CCA CCA72073 Glu Asp Lys Ala Leu Thr Phe Pro *** 81721 GGT AGC TGG CTG ATT ACC CCG AGG AAT GGT GCC ATA TTG AGG ACT CAG TGT TGG TGT CTG780781 CTG CTG GCA AAT TTG GCA CTC AGC AGT GGC TGT AGC CAG GTC AGC CTT GGT GAG TGG AAG840841 TCC ATA TTG CTG AAC CCA TGT GTA ACC TCC ATC CCT GCC ACG ATG GCC ACT TTG TTC GTG900901 GGC CCA TTG GGC GAT CAC AGG GGT GGC TGG GGA AGG AGG CTG AGT GGT GTC CAT AGA TCG960961 GGT CAT CCT ATC CAC TTG ATT ATT AAA ATC CTC CTC TGC TGA GGT CAC CTG TTG GTG GGC 10201021 ACC TAC ATG GAA TAC AAA AGT ATT CAC AGT TTT TGA CCA CGC AGA AGA GGT TCA TCC ACA 10801081 TAC CTC TTC CCC AAC TTT GTC ACA AAT TTT CCA GTC ATG CTT CTT CCA AGT CCC TGA CCA 11401141 TCC AGC CAA ACC ACT GGC CAC AGC CAA TGA ATC AGT ATA TAA TCA CAT ATC TGG CCA TTT 12001201 CTC CTT CCA TGC AAA GTG CAC AAC TAG GTG CAC TGC TCA AAG TTC TGC TTA CTG GGA AGA 12601261 TTC CTC TTC ACT GCT GTC CTT CAG GGG TGT CCT AGA AAG GGG GGC TGT AGT GCT CCA GTT 13201321 GTC CAC TTT TGT GGG GAA AAG AAA GAG AGA TCA GAC TGT TAC TGT GTC TAA GTA GAA AGG 13801381 GAA GAC ATA AGA CAC TCC ATT TTG AAA AAG ACC TGT ACT TTA AAT AAT TGC TTT GCT GAG 14401441 ATG TTG TTA ATT TGT AGC TTT GCC CCA GCC ACT TTG ACC CAA CCA CTT TGA CAC AAC CTG 15001501 GAG CTC ACA AAA ACA TGT GTT GTA TGA AAT CAA GGT TTA AGG GAT CTA GGA CTG TGC AGG 15601561 ACG TGC CTT GTT AAC AAA ATG TTT ACA AGC AGT ATA CTT GGT AAA AGT CAT CGC CAT TCT 16201621 CTA GTC TCA ATA AAC CAG GGG CAC AAT GCA CTG TGG AAA GCCACA GGG ACC TCC ACC CTT16801681 GAA AGC GGG GTA TTG TCC AAG GTT TCT CCC CAT GTG ATA GTC TAA AAT ATG GCC TCA CAG 17401741 GAT TAG AAA GAC CTG ACT GTC CCC CAG CCC GAC ACC CAT AAA GGG TCT GTG CTG AGG TGG 18001801 ATT AGT AAA AGA GGA AAG CCT CTT GCA GTT GAG ATA GCG GAA AGC CAG TCT CCT GCC TGC 18601861 CCC TGG GAA CTG AAT GTC TCA GTA TAA AAC CCA GTT GTA CAT TTG TTC AAT TCT GAG ATG 19201921 AAA GAA AAA CTG CCC TGT GGT GAG AGG TGA GAC ATG TTT GCA GCA ATG CTG CTT TGT TAT 19801981 TCT TTA CTC CAC TGA GAT GTT TGG GTG GAG AGA AAC ATA AAT CTG GCT TAC GTG CAC GTC 20402041 CAG TCA TAG TAC CTT CCC TTG AAC TTA ATT ATG ACA TAG ATT CTA TTG CTC ACG TTT GTT 21002101 GTT GAC CTT TCC CCT TAT TAT CAC CCT GCC CTC CTA CTA CAT TCC TTT TTG CTG AAA TAA 21602161 TGA AGA TAA TAA TCA ATA AAA ACT GAG GGA ACC CAG AGA CTG GTG TCG GTG CAG GTC CTT 22202221 GGT ATG CTG AGC GCT GGT CCC CTG GGC CCA CTG TTG TTT CTC TAT AAA AAA AAA AAA AAA 22802281 AAA22836.FP15331A核苷酸序列(SEQ ID NO16)長度1073個堿基1 GGGGCCTGGC CTGGCCTGGT GATGCCACTA TTTCCTTAAG AGGAGAGTGG ACATTCCGGA61 TTATTGTCGG GGGAGTCTCA TTTCTGCTGC TGTAACAAAA TACCACAGAC TGGGTCATTT121 AGAAACCATA GAAACTGATT TCGTACTGTT CTAGAGGCTG GGAAGTCCCA GATCAAGGTG181 CCAGCAGGTT TGGTGTCGTG AGGGCCACTC TCTGCTTCCA AGATGGTCCC TCCTTGCTGT241 GTCCTCTGGA GGGGAAGACT GCTGTGTCCT CACGCTGCAG AAGGTGGAAG GGCGAGAGAT301 GGCAAACCAG GCTTACAAGC CCTTTGAAAA GGGCCCTCAT CCCATCCTGG AGAGCTCTGC361 CCTATCACAT TGGCGATTAT GTTTCAATAT GTAAATTTTG GGAGATGCAT TCAGACCACA421 GGAGGAAGGG AAAAGAAAGA GCCCCCAGGT TGAAAGCCAG TTTAGGTTTG AGTCCCAGCC481 TTTCCCCTTG CTGTGTGACC TGGAGTAAAT TCCTCAGCCT CTGTGAGTCT CCCATTCCAC541 CCCAGGATTG TTGTGAAAAC ACAGTAAGGC AAGCGGGTAA GAAAGCACCC AGCAAGGTGT601 CAAGTGCCCC ACCAGGAGGG GTGGGGTGGC AATTTCCAGC ATTGCTTGGA ACCAGAATAG661 CAACGTCTTC TGAGGTTCCA GAATTTGGAC TCTGAACCCA TTGAGAAGAA TGAAATCAAC721 TTTGGCGTCA ATCAGCCACT GATTGCCATG TGGCCTGGAC GAGTCATCTC ATTCAACTTC781 ACTTTCAGCC GGACGCTGTG ACTCGGGCCT GTAACCCCAG CACTTTGGGA AGCTGAGGTG841 GGTGGATCGC TTGAGCCCAG GAGTTAGAGA CCAGCCTGGG CAACCTGGCG AAACCTCGTC901 TCTACAAAAA AATACAAAAA ATTAGCTGGG CCTGGTGGCG TGTGCCTGTA GTCCCGGCTA961 CTCAGGAGTC TGAGGTGGGA AGATCCACTG AGCCCAGGAG GTTGAGGCTG CACTCCAGCC1021 TGGGCGACAG GAGTGAAACC CTGTCTCAAA AAGTTAAAAA AAAAAAAAAA AAAB核苷酸序列(SEQ ID NO18)長度96個氨基酸1 MHSDHRRKGK ERAPRLKASL GLSPSLSPCC VTWSKFLSLC ESPIPPQDCC ENTVRQAGKK61 APSKVSSAPP GGVGWQFPAL LGTRIATSSE VPEFGLC.核苷酸及氨基酸組合序列(SEQ ID NO17)克隆號和蛋白名稱FP15331起始編碼子405 ATG 終止編碼子693 TGA 蛋白質分子量10260.281 GG GGC CTG GCC TGG CCT GGT GAT GCC ACT ATT TCC TTA AGA GGA GAG TGG ACA TTC CGG 5960 ATT ATT GTC GGG GGA GTC TCA TTT CTG CTG CTG TAA CAA AAT ACC ACA GAC TGG GTC ATT119120 TAG AAA CCA TAG AAA CTG ATT TCG TAC TGT TCT AGA GGC TGG GAA GTC CCA GAT CAA GGT179180 GCC AGC AGG TTT GGT GTC GTG AGG GCC ACT CTC TGC TTC CAA GAT GGT CCC TCC TTG CTG239240 TGT CCT CTG GAG GGG AAG ACT GCT GTG TCC TCA CGC TGC AGA AGG TGG AAG GGC GAG AGA299300 TGG CAA ACC AGG CTT ACA AGC CCT TTG AAA AGG GCC CTC ATC CCA TCC TGG AGA GCT CTG359360 CCC TAT CAC ATT GGC GAT TAT GTT TCA ATA TGT AAA TTT TGG GAG ATG CAT TCA GAC CAC4191 Met His Ser Asp His 5420 AGG AGG AAG GGA AAA GAA AGA GCC CCC AGG TTG AAA GCC AGT TTA GGT TTG AGT CCC AGC4796 Arg Arg Lys Gly Lys Glu Arg Ala Pro Arg Leu Lys Ala Ser Leu Gly Leu Ser Pro Ser 25480 CTT TCC CCT TGC TGT GTG ACC TGG AGT AAA TTC CTC AGC CTC TGT GAG TCT CCC ATT CCA53926 Leu Ser Pro Cys Cys Val Thr Trp Ser Lys Phe Leu Ser Leu Cys Glu Ser Pro Ile Pro 45540 CCC CAG GAT TGT TGT GAA AAC ACA GTA AGG CAA GCG GGT AAG AAA GCA CCC AGC AAG GTG59946 Pro Gln Asp Cys Cys Glu Asn Thr Val Arg Gln Ala Gly Lys Lys Ala Pro Ser Lys Val 65600 TCA AGT GCC CCA CCA GGA GGG GTG GGG TGG CAA TTT CCA GCA TTG CTT GGA ACC AGA ATA65966 Ser Ser Ala Pro Pro Gly Gly Val Gly Trp Gln Phe Pro Ala Leu Leu Gly Thr Arg Ile 85660 GCA ACG TCT TCT GAG GTT CCA GAA TTT GGA CTC TGA ACC CAT TGA GAA GAA TGA AAT CAA71986 Ala Thr Ser Ser Glu Val Pro Glu Phe Gly Leu *** 97720 CTT TGG CGT CAA TCA GCC ACT GAT TGC CAT GTG GCC TGG ACG AGT CAT CTC ATT CAA CTT779780 CAC TTT CAG CCG GAC GCT GTG ACT CGG GCC TGT AAC CCC AGC ACT TTG GGA AGC TGA GGT839840 GGG TGG ATC GCT TGA GCC CAG GAG TTA GAG ACC AGC CTG GGC AAC CTG GCG AAA CCT CGT899900 CTC TAC AAA AAA ATA CAA AAA ATT AGC TGG GCC TGG TGG CGT GTG CCT GTA GTC CCG GCT959960 ACT CAG GAG TCT GAG GTG GGA AGA TCC ACT GAG CCC AGG AGG TTG AGG CTG CAC TCC AGC 10191020 CTG GGC GAC AGG AGT GAA ACC CTG TCT CAA AAA GTT AAA AAA AAA AAA AAA AAA 1073
序列表<110>上海新世界基因技術開發有限公司<120>具有促進小鼠NIH/3T3細胞轉化功能的新的人蛋白及其編碼序列<130>017520<160>18<170>PatentIn version 3.0<210>1<211>1837<212>DNA<213>智人(Homo sapiens)<400>1gctaaatccc cttgtaaatt taactgttag tccaaagagg aacagctctt tggacactag 60gaaaaaacct tgtagagaga gtaaaaaatt taacacccat agtaggccta aaagcagcca120ccaattaaga aagcgttcaa gctcaacacc cactacctaa aaaaccccat ctctactaaa180aaaaaaaaaa tacaaaaaat tagccaggca tggtggcggg cgcctgtagt cccagctact240ccggaggctg aggcaggaga atcgcttgaa cctgggaggc tgaggttgca gtgagccgag300atcgcgccat tgcactccag cctcgacaac aagagccaaa ctccgtctca aaaaaaaaaa360ttaaataaca gcaagcaact gcatgcacgt ctgggggcgg tgtccggggt gagaaaggcc420ccgccagcaa tccatcccac aatcagcgat ggctgagggg gtctggacct cgcgggacgg480ggctgcacgc ccccaagcaa atgcacagcg cggctaaatt ggattcgaca gcaccggaaa540cggcgactcc cacttggggc gctgcggaca cacgagtcga ggctgccttc caggaagcaa600acaaaaaaag gggggaaaag ggggggaaag aaagaaagag aaaaaggagg gcgagtggcg660agcaggggcc tcggccgcca cccacacgcc ccgaagcgtg ctcgtccccc gcgcggggct720cccggccgcc gccctcggcc atcggctgct ccccggtggc ccaggcctcg gactccgcgg780ccggcccggc gcggcccagc gccctcaggt gcgtaccccg cccccgccgc cgacgccgcc840gacgccgcca ttaagggcgg gttgcctttc ggaacgtcct cctcctgagg gcctggggaa900gggaggccgc ccggccgcag cgggaggtgg ccccccggga caccccggcg ccccgaggcg960aggcaccccc gaaccccgat ccctgctggc aggaccagag gtgtgagggt gggggcggag 1020aagccttgcc gcgggggcaa tggtcgtacg cacggagcgc acatccctct ccttcctgat 1080tggccgagcg ggggtgtgcg tgatgccacg ctccgcccgt cgtacgtggg gcgctcgcgg 1140gggcgggggc cgccgctgtt accaggcaac tgcgccccgg atccgccccc tgacgtcacg 1200cgttgcctag aggcccaggt tgtgggtttt gtccgtgggt atggtcctcg cgacggcctc 1260cggggatctg tttgttggcg gaaaaccaat ccagactccc aaggaaaaag gccgaggccc 1320gggaatttcc cgttgcaatt ctggtttcga gttctagggg gaaaaaggct cgcaaggctg 1380tattctccat ccctcaaagc ccaagctttc ttgtttctta ataacagctt cgttgagatc 1440cattgtaaaa ttcacgtttt aagagtgaat aattcagtgc acagagctgt gcaacctttg 1500ccactaattg cagaacgctt tcagcacccg aggagaagaa accccaaccc cattaggccg 1560tcattccccg gtccccaccc cgtccctatc cccagcccct ggcaatcact tttgtctccg 1620tggatttgcc tattctggac atttcgtgtg gatagaatca tcccaagaag ttttttgtgt 1680gtctggcttc tttccttctt tatggctgaa taaaaatcca tgatatgaaa aaaaaaaaaa 1740aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1800aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa1837<210>2<211>1837<212>DNA<213>智人(Homo sapiens)<220><221>CDS<222>(501)..(851)<400>2gctaaatccc cttgtaaatt taactgttag tccaaagagg aacagctctt tggacactag 60gaaaaaacct tgtagagaga gtaaaaaatt taacacccat agtaggccta aaagcagcca120ccaattaaga aagcgttcaa gctcaacacc cactacctaa aaaaccccat ctctactaaa180aaaaaaaaaa tacaaaaaat tagccaggca tggtggcggg cgcctgtagt cccagctact240ccggaggctg aggcaggaga atcgcttgaa cctgggaggc tgaggttgca gtgagccgag300atcgcgccat tgcactccag cctcgacaac aagagccaaa ctccgtctca aaaaaaaaaa360ttaaataaca gcaagcaact gcatgcacgt ctgggggcgg tgtccggggt gagaaaggcc420ccgccagcaa tccatcccac aatcagcgat ggctgagggg gtctggacct cgcgggacgg480ggctgcacgc ccccaagcaa atg cac agc gcg gct aaa ttg gat tcg aca gca533Met His Ser Ala Ala Lys Leu Asp Ser Thr Ala1 5 10ccg gaa acg gcg act ccc act tgg ggc gct gcg gac aca cga gtc gag 581Pro Glu Thr Ala Thr Pro Thr Trp Gly Ala Ala Asp Thr Arg Val Glu15 20 25gct gcc ttc cag gaa gca aac aaa aaa agg ggg gaa aag ggg ggg aaa 629Ala Ala Phe Gln Glu Ala Asn Lys Lys Arg Gly Glu Lys Gly Gly Lys30 35 40gaa aga aag aga aaa agg agg gcg agt ggc gag cag ggg cct cgg ccg 677Glu Arg Lys Arg Lys Arg Arg Ala Ser Gly Glu Gln Gly Pro Arg Pro45 50 55cca ccc aca cgc ccc gaa gcg tgc tcg tcc ccc gcg cgg ggc tcc cgg 725Pro Pro Thr Arg Pro Glu Ala Cys Ser Ser Pro Ala Arg Gly Ser Arg60 65 70 75ccg ccg ccc tcg gcc atc ggc tgc tcc ccg gtg gcc cag gcc tcg gac 773Pro Pro Pro Ser Ala Ile Gly Cys Ser Pro Val Ala Gln Ala Ser Asp80 85 90tcc gcg gcc ggc ccg gcg cgg ccc agc gcc ctc agg tgc gta ccc cgc 821Ser Ala Ala Gly Pro Ala Arg Pro Ser Ala Leu Arg Cys Val Pro Arg95 100 105ccc cgc cgc cga cgc cgc cga cgc cgc cat taagggcggg ttgcctttcg871Pro Arg Arg Arg Arg Arg Arg Arg Arg His110 115gaacgtcctc ctcctgaggg cctggggaag ggaggccgcc cggccgcagc gggaggtggc931cccccgggac accccggcgc cccgaggcga ggcacccccg aaccccgatc cctgctggca991ggaccagagg tgtgagggtg ggggcggaga agccttgccg cgggggcaat ggtcgtacgc 1051acggagcgca catccctctc cttcctgatt ggccgagcgg gggtgtgcgt gatgccacgc 1111tccgcccgtc gtacgtgggg cgctcgcggg ggcgggggcc gccgctgtta ccaggcaact 1171gcgccccgga tccgccccct gacgtcacgc gttgcctaga ggcccaggtt gtgggttttg 1231tccgtgggta tggtcctcgc gacggcctcc ggggatctgt ttgttggcgg aaaaccaatc 1291cagactccca aggaaaaagg ccgaggcccg ggaatttccc gttgcaattc tggtttcgag 1351ttctaggggg aaaaaggctc gcaaggctgt attctccatc cctcaaagcc caagctttct 1411tgtttcttaa taacagcttc gttgagatcc attgtaaaat tcacgtttta agagtgaata 1471attcagtgca cagagctgtg caacctttgc cactaattgc agaacgcttt cagcacccga 1531ggagaagaaa ccccaacccc attaggccgt cattccccgg tccccacccc gtccctatcc 1591ccagcccctg gcaatcactt ttgtctccgt ggatttgcct attctggaca tttcgtgtgg 1651atagaatcat cccaagaagt tttttgtgtg tctggcttct ttccttcttt atggctgaat 1711aaaaatccat gatatgaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1771aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1831aaaaaa 1837<210>3<211>117<212>PRT<213>智人(Homo sapiens)<400>3Met His Ser Ala Ala Lys Leu Asp Ser Thr Ala Pro Glu Thr Ala Thr1 5 10 15Pro Thr Trp Gly Ala Ala Asp Thr Arg Val Glu Ala Ala Phe Gln Glu20 25 30Ala Asn Lys Lys Arg Gly Glu Lys Gly Gly Lys Glu Arg Lys Arg Lys35 40 45Arg Arg Ala Ser Gly Glu Gln Gly Pro Arg Pro Pro Pro Thr Arg Pro50 55 60Glu Ala Cys Ser Ser Pro Ala Arg Gly Ser Arg Pro Pro Pro Ser Ala65 70 75 80Ile Gly Cys Ser Pro Val Ala Gln Ala Ser Asp Ser Ala Ala Gly Pro85 90 95Ala Arg Pro Ser Ala Leu Arg Cys Val Pro Arg Pro Arg Arg Arg Arg100 105 110Arg Arg Arg Arg His115<210>4<211>2182<212>DNA<213>智人(Homo sapiens)<400>4gcagagaaat ttgaaaattg gcaggtgcac tttcttgacc tttccaaaaa tagtctgagt60cactttcact ttcagccttc aaactgtgtt gaatgaaacc tttgtgcagt ttacagaaag120tgaagaactg tttggcaaga gagagaagtt cgagctccta atagcctcgg ctgcattgag180taacatttct tttgagttgt ctattaacac tttcctgaaa catgcttttt atgacgccta240gaacttgtgt aagagtgact gtaatttgag ttatttaaaa atgtaagtac aagaaatgtg300tcacacgcca taagagctag gaaatgacag ctcacattca tcttggtgga aggaaactct360aattattgga agatgtgatt ggagtatttg ttcttaatac ctacggtggc tctgttatat420gcttgcctaa caccagtatt ggcttgcaaa taacactgaa aagctccttt cttttcctct480ggtctttgtg ggaaggcatg gtatgagtcg agattgctaa accactcttc tgagaggact540cagagagagt gtttatccta gactatccat ggccctggta cttctgagtt cagttgtggt600gtgatctcat tagtccaggc tcagaatggc tcggtaacct caaaactcca agccctcggt660gcttgctttg cttccctaga cttgcagctt atgtacgccc acatgtgctt catgcgtatt720aaaaatgctt gcatgtgtag ataggaagat atatgttgac tgtcctgaaa aacttgacat780acctaacatt taaaattgtt ttgagtttcc cccggggata aactagtctt caaatgtaaa840cgtgatgagc agcgtagggg ctatggtacc agagaaaaga gccgaatctc ggccctggtc900cagccctacc tctcgtgctc tgtcacctgc agcagaggtg gagtgggggc catgtctgtg960agcgggacct catcttgtct attcctcaga cccacccaag ggcagggatt cccaaaactg 1020ctggtacctg taagaggtat tgtattcttg gactccattc cataacctct catcaggatt 1080ctgggtttgg aactctagaa tcaatgttga ggaaaaatag aacttggcga ttttattttt 1140ctagatataa ttcacatacc ataaaagcca ctctttaaat tgtacaattc agtggttttt 1200tagtatattc agagttgtac agccatgacc actagctaat tcagaatatt ttcattgcct 1260cccaacaagc ctagtactca tgagtagtca ctcccttgcc cattccctcc acccccaagc 1320ccctggcaac cactaatcta ctttctgtct ctatggattt gcctatttga gacattcata 1380tgaatggaat tatataatat gtagactttt gtatctgttt ttttttcatt tagcataaaa 1440attttcaaga tttgtccaca gtgtagtggt gtctcagtac ttctttcctt tttatcactg 1500aaaatacttc attgatgtat atgtcatatt ttgttatcta ctcatcaatt gatgaatact 1560tgtattgttt ccactttggc tgttacaaat aatgctgtta tgaacatgtg tgtacaagta 1620tttgtgtggg tacatgttat ttctcttggg catacctaca gatggaatta ctggatcata 1680tgacaacttt atgtttaact ttttgaaaaa ctacaaaacc aacaagctgt accattttgt 1740aatcccacca gcaatgaata gggttctaat ttttccacat cttcatcaat atttgttatt 1800gatctttttg attatagcca atctagtgag tgtgaactgg tatcttattg taattgtgat 1860tttgatttgc aattccctaa tgatgttgaa cagatgttca tataattgtt ggccatttat 1920atagtcttta gagatatatc tgttttgccc atttctaact gagcaaaaca gacaaaaatt 1980gagttgtgaa tgttctttat gtatactgta tacaagcccc ttaacagata tatgatttgc 2040aaatcttttc tgttctgtag gttgtttctc catgttcttg ttggtatgct tggaagcata 2100aaagttttta ttctggtgga gtccaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2160aaaaaaaaaa aaaaaaaaaa aa2182<210>5<211>2182<212>DNA<213>智人(Homo sapiens)<220><221>CDS<222>(1634)..(1921)<400>5gcagagaaat ttgaaaattg gcaggtgcac tttcttgacc tttccaaaaa tagtctgagt 60cactttcact ttcagccttc aaactgtgtt gaatgaaacc tttgtgcagt ttacagaaag120tgaagaactg tttggcaaga gagagaagtt cgagctccta atagcctcgg ctgcattgag180taacatttct tttgagttgt ctattaacac tttcctgaaa catgcttttt atgacgccta240gaacttgtgt aagagtgact gtaatttgag ttatttaaaa atgtaagtac aagaaatgtg300tcacacgcca taagagctag gaaatgacag ctcacattca tcttggtgga aggaaactct360aattattgga agatgtgatt ggagtatttg ttcttaatac ctacggtggc tctgttatat420gcttgcctaa caccagtatt ggcttgcaaa taacactgaa aagctccttt cttttcctct480ggtctttgtg ggaaggcatg gtatgagtcg agattgctaa accactcttc tgagaggact540cagagagagt gtttatccta gactatccat ggccctggta cttctgagtt cagttgtggt600gtgatctcat tagtccaggc tcagaatggc tcggtaacct caaaactcca agccctcggt660gcttgctttg cttccctaga cttgcagctt atgtacgccc acatgtgctt catgcgtatt720aaaaatgctt gcatgtgtag ataggaagat atatgttgac tgtcctgaaa aacttgacat780acctaacatt taaaattgtt ttgagtttcc cccggggata aactagtctt caaatgtaaa840cgtgatgagc agcgtagggg ctatggtacc agagaaaaga gccgaatctc ggccctggtc900cagccctacc tctcgtgctc tgtcacctgc agcagaggtg gagtgggggc catgtctgtg960agcgggacct catcttgtct attcctcaga cccacccaag ggcagggatt cccaaaactg 1020ctggtacctg taagaggtat tgtattcttg gactccattc cataacctct catcaggatt 1080ctgggtttgg aactctagaa tcaatgttga ggaaaaatag aacttggcga ttttattttt 1140ctagatataa ttcacatacc ataaaagcca ctctttaaat tgtacaattc agtggttttt 1200tagtatattc agagttgtac agccatgacc actagctaat tcagaatatt ttcattgcct 1260cccaacaagc ctagtactca tgagtagtca ctcccttgcc cattccctcc acccccaagc 1320ccctggcaac cactaatcta ctttctgtct ctatggattt gcctatttga gacattcata 1380tgaatggaat tatataatat gtagactttt gtatctgttt ttttttcatt tagcataaaa 1440attttcaaga tttgtccaca gtgtagtggt gtctcagtac ttctttcctt tttatcactg 1500aaaatacttc attgatgtat atgtcatatt ttgttatcta ctcatcaatt gatgaatact 1560tgtattgttt ccactttggc tgttacaaat aatgctgtta tgaacatgtg tgtacaagta 1620tttgtgtggg tac atg tta ttt ctc ttg ggc ata cct aca gat gga att 1669Met Leu Phe Leu Leu Gly Ile Pro Thr Asp Gly Ile1 5 10act gga tca tat gac aac ttt atg ttt aac ttt ttg aaa aac tac aaa 1717Thr Gly Ser Tyr Asp Asn Phe Met Phe Asn Phe Leu Lys Asn Tyr Lys15 20 25acc aac aag ctg tac cat ttt gta atc cca cca gca atg aat agg gtt 1765Thr Asn Lys Leu Tyr His Phe Val Ile Pro Pro Ala Met Asn Arg Val30 35 40cta att ttt cca cat ctt cat caa tat ttg tta ttg atc ttt ttg att 1813Leu Ile Phe Pro His Leu His Gln Tyr Leu Leu Leu Ile Phe Leu Ile45 50 55 60ata gcc aat cta gtg agt gtg aac tgg tat ctt att gta att gtg att 1861Ile Ala Asn Leu Val Ser Val Asn Trp Tyr Leu Ile Val Ile Val Ile65 70 75ttg att tgc aat tcc cta atg atg ttg aac aga tgt tca tat aat tgt 1909Leu Ile Cys Asn Ser Leu Met Met Leu Asn Arg Cys Ser Tyr Asn Cys80 85 90tgg cca ttt ata tagtctttag agatatatct gttttgccca tttctaactg 1961Trp Pro Phe Ile
95agcaaaacag acaaaaattg agttgtgaat gttctttatg tatactgtat acaagcccct 2021taacagatat atgatttgca aatcttttct gttctgtagg ttgtttctcc atgttcttgt 2081tggtatgctt ggaagcataa aagtttttat tctggtggag tccaaaaaaa aaaaaaaaaa 2141aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 2182<210>6<211>96<212>PRT<213>智人(Homo sapiens)<400>6Met Leu Phe Leu Leu Gly Ile Pro Thr Asp Gly Ile Thr Gly Ser Tyr1 5 10 15Asp Asn Phe Met Phe Asn Phe Leu Lys Asn Tyr Lys Thr Asn Lys Leu20 25 30Tyr His Phe Val Ile Pro Pro Ala Met Asn Arg Val Leu Ile Phe Pro35 40 45His Leu His Gln Tyr Leu Leu Leu Ile Phe Leu Ile Ile Ala Asn Leu50 55 60Val Ser Val Asn Trp Tyr Leu Ile Val Ile Val Ile Leu Ile Cys Asn65 70 75 80Ser Leu Met Met Leu Asn Arg Cys Ser Tyr Asn Cys Trp Pro Phe Ile85 90 95<210>7<211>1962<212>DNA<213>智人(Homo sapiens)<400>7gcaagaattg gttcttttcg gggttctctc ctatatccca tacaatcaaa caataaatat 60gtgttgaata aatcacttgt gcaaattcta aaattcacat atgaccctgt attttatcat120atctcccata gaataggtga gaaccagaga aaaatattgt taagcccagg agcccaagct180atatgatcaa ctggaaagac tcagtaggta atttgttcct agaaagcagc ctatggcaac240aaatgattga aatttccacc ttgataaaat gacgaattac tacatgtcag agatttctag300tttgcttgta aataatgaaa gctgtgatga taaatcccag attttcaccc tgaggtaccc360tatcagcaaa acagtaaatg ccattcattc ttctggaggc cttgccaaaa aaagtcattg420cctaactaaa aaatatgctg gagtctcaca ttttgtctta aaatttcatg tgaattttgg480attttatgcc acaatacata tttattataa tattaacatt aaattaccag ttaaatttct540taaatttttc taaaaaattt tgaaaaagct gatagtccca gaagatgtat tatgtttagc600ttgtgtcttg gcatatcatc aagtccaagg agcacatgac agatgagaaa ggtgagtgta660atccatggaa cttggtcaat gcagtaggtt gaattgtgtc cccccaaaag atatgcacaa720gctcagctgg gtgtggtggc tcacacctgt aatcccagca ctgtgggagg ccagggcagg780cagatcgctg gaggtcagga gtttgagact aggctggcca acatggtgaa atcccatctc840tactaaaagt acaaaaatta gccgggcgtg atggcaggtg cccatagtcc cagctactca900ggaggctgag gcaggagaat cgcttgaacc tgggaggcag agtttgcagt gagacaagat960tgcaccactg cactatagcc tgggtgacag agcaagactc tgcctcaaaa aaaaaaaaaa 1020aagatatgca taagctctag ctaccccact cctttttctg tgaatgtgac cttatttgga 1080tatacgggtc tttgcagata taattaagtt gaggatctca aaatgagata atgttggatt 1140taatccaatg agagagatct gagacccaaa gaaacagggg agacagtcat atgaagaagg 1200aggctgctat ggtttggatg tggtttgtcc ccactaaaac tcctgttgaa atttgatccc 1260cagtgtggca gtattgggag atgggaagtg ttttggggtc atgggagcca gggtgtctca 1320tgaatagggt taatgccctc ccagtggaga gcattctcat tcttgtggga ctggattaat 1380tactgaagag caggttgtta taacaagtga gttcagcctc ctagactctc tctcttgctt 1440cctctctcac catgtgatct tttggcacac acccgcttcc ccttcctctt tcttccatga 1500gttgaagtgg tgtgggaccc tgaccagttg cagctaccca atcttgaatt tccagcctac 1560agaactgtga gctaaataag cctcttttct ttataaatta cccagtctaa agtgttctgt 1620tatagcaaca aaaataatgg actaagaaaa tggtaggaga cgccctggct tggtggctca 1680tgcctgtaat cccagcactt tgggaggcca aggcaggcgg atcgcctgag gtcaggagtt 1740caagaccagc ctgaccaaca tggtgaagcc ccatctctac taaaaataca aaaattagcc 1800ggccttggtg gcacacacct ataatcccag ctccttggga ggctgaggca ggagaatttc 1860ttgaacccag gaggcagagg ttgcaatgag ctgagattct gccactgcac tccagcctgg 1920gtgacagagc aagactgtgt ctggaaaaaa aaaaaaaaaa aa 1962<210>8<211>1962<212>DNA<213>智人(Homo sapiens)<220><221>CDS<222>(269)..(550)<400>8gcaagaattg gttcttttcg gggttctctc ctatatccca tacaatcaaa caataaatat 60gtgttgaata aatcacttgt gcaaattcta aaattcacat atgaccctgt attttatcat120atctcccata gaataggtga gaaccagaga aaaatattgt taagcccagg agcccaagct180atatgatcaa ctggaaagac tcagtaggta atttgttcct agaaagcagc ctatggcaac240aaatgattga aatttccacc ttgataaa atg acg aat tac tac atg tca gag 292Met Thr Asn Tyr Tyr Met Ser Glu1 5att tct agt ttg ctt gta aat aat gaa agc tgt gat gat aaa tcc cag 340Ile Ser Ser Leu Leu Val Asn Asn Glu Set Cys Asp Asp Lys Ser Gln10 15 20att ttc acc ctg agg tac cct atc agc aaa aca gta aat gcc att cat 388Ile Phe Thr Leu Arg Tyr Pro Ile Ser Lys Thr Val Asn Ala Ile His25 30 35 40tct tct gga ggc ctt gcc aaa aaa agt cat tgc cta act aaa aaa tat 436Ser Ser Gly Gly Leu Ala Lys Lys Ser His Cys Leu Thr Lys Lys Tyr45 50 55gct gga gtc tca cat ttt gtc tta aaa ttt cat gtg aat ttt gga ttt 484Ala Gly Val Ser His Phe Val Leu Lys Phe His Val Asn Phe Gly Phe
60 65 70tat gcc aca ata cat att tat tat aat att aac att aaa tta cca gtt 532Tyr Ala Thr Ile His Ile Tyr Tyr Asn Ile Asn Ile Lys Leu Pro Val75 80 85aaa ttt ctt aaa ttt ttc taaaaaattt tgaaaaagct gatagtccca 580Lys Phe Leu Lys Phe Phe90gaagatgtat tatgtttagc ttgtgtcttg gcatatcatc aagtccaagg agcacatgac640agatgagaaa ggtgagtgta atccatggaa cttggtcaat gcagtaggtt gaattgtgtc700cccccaaaag atatgcacaa gctcagctgg gtgtggtggc tcacacctgt aatcccagca760ctgtgggagg ccagggcagg cagatcgctg gaggtcagga gtttgagact aggctggcca820acatggtgaa atcccatctc tactaaaagt acaaaaatta gccgggcgtg atggcaggtg880cccatagtcc cagctactca ggaggctgag gcaggagaat cgcttgaacc tgggaggcag940agtttgcagt gagacaagat tgcaccactg cactatagcc tgggtgacag agcaagactc 1000tgcctcaaaa aaaaaaaaaa aagatatgca taagctctag ctaccccact cctttttctg 1060tgaatgtgac cttatttgga tatacgggtc tttgcagata taattaagtt gaggatctca 1120aaatgagata atgttggatt taatccaatg agagagatct gagacccaaa gaaacagggg 1180agacagtcat atgaagaagg aggctgctat ggtttggatg tggtttgtcc ccactaaaac 1240tcctgttgaa atttgatccc cagtgtggca gtattgggag atgggaagtg ttttggggtc 1300atgggagcca gggtgtctca tgaatagggt taatgccctc ccagtggaga gcattctcat 1360tcttgtggga ctggattaat tactgaagag caggttgtta taacaagtga gttcagcctc 1420ctagactctc tctcttgctt cctctctcac catgtgatct tttggcacac acccgcttcc 1480ccttcctctt tcttccatga gttgaagtgg tgtgggaccc tgaccagttg cagctaccca 1540atcttgaatt tccagcctac agaactgtga gctaaataag cctcttttct ttataaatta 1600cccagtctaa agtgttctgt tatagcaaca aaaataatgg actaagaaaa tggtaggaga 1660cgccctggct tggtggctca tgcctgtaat cccagcactt tgggaggcca aggcaggcgg 1720atcgcctgag gtcaggagtt caagaccagc ctgaccaaca tggtgaagcc ccatctctac 1780taaaaataca aaaattagcc ggccttggtg gcacacacct ataatcccag ctccttggga 1840ggctgaggca ggagaatttc ttgaacccag gaggcagagg ttgcaatgag ctgagattct 1900gccactgcac tccagcctgg gtgacagagc aagactgtgt ctggaaaaaa aaaaaaaaaa 1960aa 1962<210>9<211>94<212>PRT<213>智人(Homo sapiens)<400>9Met Thr Asn Tyr Tyr Met Ser Glu Ile Ser Ser Leu Leu Val Asn Asn1 5 10 15Glu Ser Cys Asp Asp Lys Ser Gln Ile Phe Thr Leu Arg Tyr Pro Ile20 25 30Ser Lys Thr Val Asn Ala Ile His Ser Ser Gly Gly Leu Ala Lys Lys35 40 45Ser His Cys Leu Thr Lys Lys Tyr Ala Gly Val Ser His Phe Val Leu
50 55 60Lys Phe His Val Asn Phe Gly Phe Tyr Ala Thr Ile His Ile Tyr Tyr65 70 75 80Asn Ile Asn Ile Lys Leu Pro Val Lys Phe Leu Lys Phe Phe85 90<210>10<211>2263<212>DNA<213>智人(Homo sapiens)<400>10gctgatccct caatttctag cacataattt catcactagt tcacttacaa acctcagttt 60tcccatgtgt aaaataggaa ttaagtgatc acaaggccgc tctatggagc cctcatccta120aggttacaat gagtacatat cagttgtagg agtcctttta tccaacagtg actccgtcaa180gcccttgccg tatgctaggg cttgtagtgg acacccgaag aaccataagg agtaagatga240ggctggttgc agagagtaca gtctcatcag aagaacttgc tcttgtaata aattcaatca300ttgacaatca ttatttccac ccaatctgtg aaacagaata ccgttatttc ttttttttga360gagagagtct tcttctgtcg cccaggctgg agtgtagtgg cgtgatctca gctcactgca420acctccacct ccacctcccg ggttcaagca attctcgtgc ctcagcctcc caactagctg480gagctgcagg cgcataccac catgcccagc taatttttgt attatttgta gagatggggt540tttgccacat tgcccaggct ggtcttgaac tcctgtcctc aggttatcca cctcccaaag600tgctggggtt acaggcatga gccactgcgg gatctcactc ggtcacccag gctggaatgc660agtggagtga tcatggctcg ctgtagcctt gacctgggct caagcgatcc tcctgcctca720gcctcccagg ctggtctcga actcctgacc tcaggtgatc tgcccacctt ggcctcccta780agtgctgggg ttacaggcaa gagccaccgc gcccagccgg aaattccatt ttagactgga840agccacagta taaggaaaac agctccttgg agtgcattca gagtatgact ccatggccag900gacagggagg ggctctaaca taaaaagaac tagggggttc ggagacgttc ctaatcttgg960ggtagcaggg aaagacggca gcaccactgg acagcaggag caagaggaat aatttcagga 1020atctgggacg cgaaaagata agggggaagg gtcatggggg catttgtggg ttctgtcctt 1080gtagttctca agagccgacc agaaagaaag gccaggggac ggagccaggc tttttctgag 1140agacccctgt agaccccagc caagcataga ggctggcgag aggaaacttt tttgtttttg 1200cttctgagac agtcttgctc tgttgcccag gctggagtgc agtggcacaa tctcagctca 1260ctgcaacctc cccgtcctgg gttcaagtga ttcccctgcc tcagcctccc aaatagctgg 1320gactatgggc atatggctcc ccatcctggg ttcaagcgat tctcctgcca cagcctcccg 1380agtagctggg actacgggca tatggctccc catcctgggt tcaagcgatt ctcctgcctc 1440agcctcccga gtagctggga ctacaggcat atggcaccac gcatggctaa ttttcttatt 1500tttagtagag ataactcctg ggctcaagcg atctgcccac ctcggcctcc caaagtgctg 1560agattacagg cacatgccac cacacccagc taattattgt gtttttagta gagacggggt 1620tttgccatgt ttgcccaggc tgctcttgaa ctcctgggct caaacgatcc acccacctct 1680gcctcccaaa gttctggggt tacaggcatc agccaccatg cccagccagg aagcttattc 1740ccagtggtct ggctctccag agttgccacg ctgaaagatg cttgctctgg agagagtgag 1800ctccctgtca ccagagctat gcaagcagat tcaggccagc cctcccagag agcatgagat 1860ggggaatcac gcacagagtg gaccgaagga gggattgaac aagaaggctc aaagggtccc 1920ttttgaccct gaagtctagg atttcgtgaa gctacaggtg aacccattgg catgagaagc 1980atccagggag gaaagatgca agcccttgga atatcgagag aatatttcca gcaggaaaag 2040aagtggaagg ttaaaggaaa gccagagaag gggacgttgc cctgggccat caactaagag 2100aaaagctgcc cagagccagg catggtggcg gcggtgccta tagtaccggc agttggagag 2160gccgaggcag gagcatcact tgagcccatg agtttgagac cagcctgggc aacatagtga 2220gacttttttc tctacaaaaa agtttaaaaa aaaaaaaaaa aaa 2263<210>11<211>2263<212>DNA<213>智人(Homo sapiens)<220><221>CDS<222>(192)..(617)<400>11gctgatccct caatttctag cacataattt catcactagt tcacttacaa acctcagttt 60tcccatgtgt aaaataggaa ttaagtgatc acaaggccgc tctatggagc cctcatccta120aggttacaat gagtacatat cagttgtagg agtcctttta tccaacagtg actccgtcaa180gcccttgccg t atg cta ggg ctt gta gtg gac acc cga aga acc ata agg 230Met Leu Gly Leu Val Val Asp Thr Arg Arg Thr Ile Arg1 5 10agt aag atg agg ctg gtt gca gag agt aca gtc tca tca gaa gaa ctt 278Ser Lys Met Arg Leu Val Ala Glu Ser Thr Val Ser Ser Glu Glu Leu15 20 25gct ctt gta ata aat tca atc att gac aat cat tat ttc cac cca atc 326Ala Leu Val Ile Asn Ser Ile Ile Asp Asn His Tyr Phe His Pro Ile30 35 40 45tgt gaa aca gaa tac cgt tat ttc ttt ttt ttg aga gag agt ctt ctt 374Cys Glu Thr Glu Tyr Arg Tyr Phe Phe Phe Leu Arg Glu Ser Leu Leu50 55 60ctg tcg ccc agg ctg gag tgt agt ggc gtg atc tca gct cac tgc aac 422Leu Set Pro Arg Leu Glu Cys Ser Gly Val Ile Ser Ala His Cys Asn65 70 75ctc cac ctc cac ctc ccg ggt tca agc aat tct cgt gcc tca gcc tcc 470Leu His Leu His Leu Pro Gly Ser Ser Asn Ser Arg Ala Ser Ala Ser80 85 90caa cta gct gga gct gca ggc gca tac cac cat gcc cag cta att ttt 518Gln Leu Ala Gly Ala Ala Gly Ala Tyr His His Ala Gln Leu Ile Phe95 100 105gta tta ttt gta gag atg ggg ttt tgc cac att gcc cag gct ggt ctt 566Val Leu Phe Val Glu Met Gly Phe Cys His Ile Ala Gln Ala Gly Leu110 115 120 125gaa ctc ctg tcc tca ggt tat cca cct ccc aaa gtg ctg ggg tta cag 614Glu Leu Leu Ser Ser Gly Tyr Pro Pro Pro Lys Val Leu Gly Leu Gln130 135 140gca tgagccactg cgggatctca ctcggtcacc caggctggaa tgcagtggag 667Alatgatcatggc tcgctgtagc cttgacctgg gctcaagcga tcctcctgcc tcagcctccc727aggctggtct cgaactcctg acctcaggtg atctgcccac cttggcctcc ctaagtgctg787gggttacagg caagagccac cgcgcccagc cggaaattcc attttagact ggaagccaca847gtataaggaa aacagctcct tggagtgcat tcagagtatg actccatggc caggacaggg907aggggctcta acataaaaag aactaggggg ttcggagacg ttcctaatct tggggtagca967gggaaagacg gcagcaccac tggacagcag gagcaagagg aataatttca ggaatctggg 1027acgcgaaaag ataaggggga agggtcatgg gggcatttgt gggttctgtc cttgtagttc 1087tcaagagccg accagaaaga aaggccaggg gacggagcca ggctttttct gagagacccc 1147tgtagacccc agccaagcat agaggctggc gagaggaaac ttttttgttt ttgcttctga 1207gacagtcttg ctctgttgcc caggctggag tgcagtggca caatctcagc tcactgcaac 1267ctccccgtcc tgggttcaag tgattcccct gcctcagcct cccaaatagc tgggactatg 1327ggcatatggc tccccatcct gggttcaagc gattctcctg ccacagcctc ccgagtagct 1387gggactacgg gcatatggct ccccatcctg ggttcaagcg attctcctgc ctcagcctcc 1447cgagtagctg ggactacagg catatggcac cacgcatggc taattttctt atttttagta 1507gagataactc ctgggctcaa gcgatctgcc cacctcggcc tcccaaagtg ctgagattac 1567aggcacatgc caccacaccc agctaattat tgtgttttta gtagagacgg ggttttgcca 1627tgtttgccca ggctgctctt gaactcctgg gctcaaacga tccacccacc tctgcctccc 1687aaagttctgg ggttacaggc atcagccacc atgcccagcc aggaagctta ttcccagtgg 1747tctggctctc cagagttgcc acgctgaaag atgcttgctc tggagagagt gagctccctg 1807tcaccagagc tatgcaagca gattcaggcc agccctccca gagagcatga gatggggaat 1867cacgcacaga gtggaccgaa ggagggattg aacaagaagg ctcaaagggt cccttttgac 1927cctgaagtct aggatttcgt gaagctacag gtgaacccat tggcatgaga agcatccagg 1987gaggaaagat gcaagccctt ggaatatcga gagaatattt ccagcaggaa aagaagtgga 2047aggttaaagg aaagccagag aaggggacgt tgccctgggc catcaactaa gagaaaagct 2107gcccagagcc aggcatggtg gcggcggtgc ctatagtacc ggcagttgga gaggccgagg 2167caggagcatc acttgagccc atgagtttga gaccagcctg ggcaacatag tgagactttt 2227ttctctacaa aaaagtttaa aaaaaaaaaa aaaaaa 2263<210>12<211>142<212>PRT<213>智人(Homo sapiens)<400>12Met Leu Gly Leu Val Val Asp Thr Arg Arg Thr Ile Arg Ser Lys Met1 5 10 15Arg Leu Val Ala Glu Ser Thr Val Ser Ser Glu Glu Leu Ala Leu Val20 25 30Ile Asn Ser Ile Ile Asp Asn His Tyr Phe His Pro Ile Cys Glu Thr35 40 45Glu Tyr Arg Tyr Phe Phe Phe Leu Arg Glu Ser Leu Leu Leu Ser Pro50 55 60Arg Leu Glu Cys Ser Gly Val Ile Ser Ala His Cys Asn Leu His Leu65 70 75 80His Leu Pro Gly Ser Ser Asn Ser Arg Ala Ser Ala Ser Gln Leu Ala85 90 95Gly Ala Ala Gly Ala Tyr His His Ala Gln Leu Ile Phe Val Leu Phe100 105 110Val Glu Met Gly Phe Cys His Ile Ala Gln Ala Gly Leu Glu Leu Leu115 120 125Ser Ser Gly Tyr Pro Pro Pro Lys Val Leu Gly Leu Gln Ala130 135 140<210>13<211>2283<212>DNA<213>智人(Homo sapiens)<400>13ggatcaatca ccccagccaa cactgtaact cccttcttag cctgttgact taaaggtagg 60aggagcccaa agtgtctagg tggcaatctc agcttccggt ttaatggaat cattcttgtg120tctcctggtg gcagtgttcc tccccctgga actaagacct ccaagccagc agaatgtaat180gtcatgggaa caggaagaaa aattttgctt gtggaacact atgggtgatg gtgagttgtg240ccacttctac ttccatccct tgattcctgg acccgtgaat cctggctatg ggagaaacac300tatcatatat tggatgctga tttagagcat acatggcttt ctagagaact ttgccccagg360cctgcaaagt attgtcacct agttggcatt gtaattgtga cttcaaaagg ccattccacc420attctatcaa tccagctgct tcagatgatg gggaatatgg taagaccagt aaattccatg480ggcacgagac cactgccaca ctgcttttgc cataaagtga atgcgttggt cagaggcaat540gctgttggga ataccatgat ggtgggtaag gcatttcatg agtccacgga tggtagtctt600ggcagaagca ttgcatgcag gataggcaaa cccatatccc aagtaagtgt ctattccagt660gaggacaaag ctttgacttt tccatgatgg gagaggtcca atataatcaa cctgccacca720ggtagctggc tgattacccc gaggaatggt gccatattga ggactcagtg ttggtgtctg780ctgctggcaa atttggcact cagcagtggc tgtagccagg tcagccttgg tgagtggaag840tccatattgc tgaacccatg tgtaacctcc atccctgcca cgatggccac tttgttcgtg900ggcccattgg gcgatcacag gggtggctgg ggaaggaggc tgagtggtgt ccatagatcg960ggtcatccta tccacttgat tattaaaatc ctcctctgct gaggtcacct gttggtgggc 1020acctacatgg aatacaaaag tattcacagt ttttgaccac gcagaagagg ttcatccaca 1080tacctcttcc ccaactttgt cacaaatttt ccagtcatgc ttcttccaag tccctgacca 1140tccagccaaa ccactggcca cagccaatga atcagtatat aatcacatat ctggccattt 1200ctccttccat gcaaagtgca caactaggtg cactgctcaa agttctgctt actgggaaga 1260ttcctcttca ctgctgtcct tcaggggtgt cctagaaagg ggggctgtag tgctccagtt 1320gtccactttt gtggggaaaa gaaagagaga tcagactgtt actgtgtcta agtagaaagg 1380gaagacataa gacactccat tttgaaaaag acctgtactt taaataattg ctttgctgag 1440atgttgttaa tttgtagctt tgccccagcc actttgaccc aaccactttg acacaacctg 1500gagctcacaa aaacatgtgt tgtatgaaat caaggtttaa gggatctagg actgtgcagg 1560acgtgccttg ttaacaaaat gtttacaagc agtatacttg gtaaaagtca tcgccattct 1620ctagtctcaa taaaccaggg gcacaatgca ctgtggaaag ccacagggac ctccaccctt 1680gaaagcgggg tattgtccaa ggtttctccc catgtgatag tctaaaatat ggcctcacag 1740gattagaaag acctgactgt cccccagccc gacacccata aagggtctgt gctgaggtgg 1800attagtaaaa gaggaaagcc tcttgcagtt gagatagcgg aaagccagtc tcctgcctgc 1860ccctgggaac tgaatgtctc agtataaaac ccagttgtac atttgttcaa ttctgagatg 1920aaagaaaaac tgccctgtgg tgagaggtga gacatgtttg cagcaatgct gctttgttat 1980tctttactcc actgagatgt ttgggtggag agaaacataa atctggctta cgtgcacgtc 2040cagtcatagt accttccctt gaacttaatt atgacataga ttctattgct cacgtttgtt 2100gttgaccttt ccccttatta tcaccctgcc ctcctactac attccttttt gctgaaataa 2160tgaagataat aatcaataaa aactgaggga acccagagac tggtgtcggt gcaggtcctt 2220ggtatgctga gcgctggtcc cctgggccca ctgttgtttc tctataaaaa aaaaaaaaaa 2280aaa 2283<210>14<211>2283<212>DNA<213>智人(Homo sapiens)<220><221>CDS<222>(445)..(684)<400>14ggatcaatca ccccagccaa cactgtaact cccttcttag cctgttgact taaaggtagg 60aggagcccaa agtgtctagg tggcaatctc agcttccggt ttaatggaat cattcttgtg120tctcctggtg gcagtgttcc tccccctgga actaagacct ccaagccagc agaatgtaat180gtcatgggaa caggaagaaa aattttgctt gtggaacact atgggtgatg gtgagttgtg240ccacttctac ttccatccct tgattcctgg acccgtgaat cctggctatg ggagaaacac300tatcatatat tggatgctga tttagagcat acatggcttt ctagagaact ttgccccagg360cctgcaaagt attgtcacct agttggcatt gtaattgtga cttcaaaagg ccattccacc420attctatcaa tccagctgct tcag atg atg ggg aat atg gta aga cca gta 471Met Met Gly Asn Met Val Arg Pro Val1 5aat tcc atg ggc acg aga cca ctg cca cac tgc ttt tgc cat aaa gtg 519Asn Ser Met Gly Thr Arg Pro Leu Pro His Cys Phe Cys His Lys Val10 15 20 25aat gcg ttg gtc aga ggc aat gct gtt ggg aat acc atg atg gtg ggt 567Asn Ala Leu Val Arg Gly Asn Ala Val Gly Asn Thr Met Met Val Gly30 35 40aag gca ttt cat gag tcc acg gat ggt agt ctt ggc aga agc att gca 615Lys Ala Phe His Glu Ser Thr Asp Gly Ser Leu Gly Arg Ser Ile Ala45 50 55tgc agg ata ggc aaa ccc ata tcc caa gta agt gtc tat tcc agt gag 663Cys Arg Ile Gly Lys Pro Ile Ser Gln Val Ser Val Tyr Ser Ser Glu60 65 70gac aaa gct ttg act ttt cca tgatgggaga ggtccaatat aatcaacctg 714Asp Lys Ala Leu Thr Phe Pro75 80ccaccaggta gctggctgat taccccgagg aatggtgcca tattgaggac tcagtgttgg774tgtctgctgc tggcaaattt ggcactcagc agtggctgta gccaggtcag ccttggtgag834tggaagtcca tattgctgaa cccatgtgta acctccatcc ctgccacgat ggccactttg894ttcgtgggcc cattgggcga tcacaggggt ggctggggaa ggaggctgag tggtgtccat954agatcgggtc atcctatcca cttgattatt aaaatcctcc tctgctgagg tcacctgttg 1014gtgggcacct acatggaata caaaagtatt cacagttttt gaccacgcag aagaggttca 1074tccacatacc tcttccccaa ctttgtcaca aattttccag tcatgcttct tccaagtccc 1134tgaccatcca gccaaaccac tggccacagc caatgaatca gtatataatc acatatctgg 1194ccatttctcc ttccatgcaa agtgcacaac taggtgcact gctcaaagtt ctgcttactg 1254ggaagattcc tcttcactgc tgtccttcag gggtgtccta gaaagggggg ctgtagtgct 1314ccagttgtcc acttttgtgg ggaaaagaaa gagagatcag actgttactg tgtctaagta 1374gaaagggaag acataagaca ctccattttg aaaaagacct gtactttaaa taattgcttt 1434gctgagatgt tgttaatttg tagctttgcc ccagccactt tgacccaacc actttgacac 1494aacctggagc tcacaaaaac atgtgttgta tgaaatcaag gtttaaggga tctaggactg 1554tgcaggacgt gccttgttaa caaaatgttt acaagcagta tacttggtaa aagtcatcgc 1614cattctctag tctcaataaa ccaggggcac aatgcactgt ggaaagccac agggacctcc 1674acccttgaaa gcggggtatt gtccaaggtt tctccccatg tgatagtcta aaatatggcc 1734tcacaggatt agaaagacct gactgtcccc cagcccgaca cccataaagg gtctgtgctg 1794aggtggatta gtaaaagagg aaagcctctt gcagttgaga tagcggaaag ccagtctcct 1854gcctgcccct gggaactgaa tgtctcagta taaaacccag ttgtacattt gttcaattct 1914gagatgaaag aaaaactgcc ctgtggtgag aggtgagaca tgtttgcagc aatgctgctt 1974tgttattctt tactccactg agatgtttgg gtggagagaa acataaatct ggcttacgtg 2034cacgtccagt catagtacct tcccttgaac ttaattatga catagattct attgctcacg 2094tttgttgttg acctttcccc ttattatcac cctgccctcc tactacattc ctttttgctg 2154aaataatgaa gataataatc aataaaaact gagggaaccc agagactggt gtcggtgcag 2214gtccttggta tgctgagcgc tggtcccctg ggcccactgt tgtttctcta taaaaaaaaa 2274aaaaaaaaa 2283<210>15<211>80<212>PRT<213>智人(Homo sapiens)<400>15Met Met Gly Asn Met Val Arg Pro Val Asn Ser Met Gly Thr Arg Pro1 5 10 15Leu Pro His Cys Phe Cys His Lys Val Asn Ala Leu Val Arg Gly Asn20 25 30Ala Val Gly Asn Thr Met Met Val Gly Lys Ala Phe His Glu Ser Thr35 40 45Asp Gly Ser Leu Gly Arg Ser Ile Ala Cys Arg Ile Gly Lys Pro Ile50 55 60Ser Gln Val Ser Val Tyr Ser Ser Glu Asp Lys Ala Leu Thr Phe Pro65 70 75 80<210>16<211>1073<212>DNA<213>智人(Homo sapiens)<400>16ggggcctggc ctggcctggt gatgccacta tttccttaag aggagagtgg acattccgga 60ttattgtcgg gggagtctca tttctgctgc tgtaacaaaa taccacagac tgggtcattt120agaaaccata gaaactgatt tcgtactgtt ctagaggctg ggaagtccca gatcaaggtg180ccagcaggtt tggtgtcgtg agggccactc tctgcttcca agatggtccc tccttgctgt240gtcctctgga ggggaagact gctgtgtcct cacgctgcag aaggtggaag ggcgagagat300ggcaaaccag gcttacaagc cctttgaaaa gggccctcat cccatcctgg agagctctgc360cctatcacat tggcgattat gtttcaatat gtaaattttg ggagatgcat tcagaccaca420ggaggaaggg aaaagaaaga gcccccaggt tgaaagccag tttaggtttg agtcccagcc480tttccccttg ctgtgtgacc tggagtaaat tcctcagcct ctgtgagtct cccattccac540cccaggattg ttgtgaaaac acagtaaggc aagcgggtaa gaaagcaccc agcaaggtgt600caagtgcccc accaggaggg gtggggtggc aatttccagc attgcttgga accagaatag660caacgtcttc tgaggttcca gaatttggac tctgaaccca ttgagaagaa tgaaatcaac720tttggcgtca atcagccact gattgccatg tggcctggac gagtcatctc attcaacttc780actttcagcc ggacgctgtg actcgggcct gtaaccccag cactttggga agctgaggtg840ggtggatcgc ttgagcccag gagttagaga ccagcctggg caacctggcg aaacctcgtc900tctacaaaaa aatacaaaaa attagctggg cctggtggcg tgtgcctgta gtcccggcta960ctcaggagtc tgaggtggga agatccactg agcccaggag gttgaggctg cactccagcc 1020tgggcgacag gagtgaaacc ctgtctcaaa aagttaaaaa aaaaaaaaaa aaa 1073<210>17<211>1073<212>DNA<213>智人(Homo sapiens)<220><221>CDS<222>(405)..(692)<400>17ggggcctggc ctggcctggt gatgccacta tttccttaag aggagagtgg acattccgga 60ttattgtcgg gggagtctca tttctgctgc tgtaacaaaa taccacagac tgggtcattt120agaaaccata gaaactgatt tcgtactgtt ctagaggctg ggaagtccca gatcaaggtg180ccagcaggtt tggtgtcgtg agggccactc tctgcttcca agatggtccc tccttgctgt240gtcctctgga ggggaagact gctgtgtcct cacgctgcag aaggtggaag ggcgagagat300ggcaaaccag gcttacaagc cctttgaaaa gggccctcat cccatcctgg agagctctgc360cctatcacat tggcgattat gtttcaatat gtaaattttg ggag atg cat tca gac 416Met His Ser Asp1cac agg agg aag gga aaa gaa aga gcc ccc agg ttg aaa gcc agt tta 464His Arg Arg Lys Gly Lys Glu Arg Ala Pro Arg Leu Lys Ala Ser Leu5 10 15 20ggt ttg agt ccc agc ctt tcc cct tgc tgt gtg acc tgg agt aaa ttc 512Gly Leu Ser Pro Ser Leu Ser Pro Cys Cys Val Thr Trp Ser Lys Phe25 30 35ctc agc ctc tgt gag tct ccc att cca ccc cag gat tgt tgt gaa aac 560Leu Ser Leu Cys Glu Ser Pro Ile Pro Pro Gln Asp Cys Cys Glu Asn40 45 50aca gta agg caa gcg ggt aag aaa gca ccc agc aag gtg tca agt gcc 608Thr Val Arg Gln Ala Gly Lys Lys Ala Pro Ser Lys Val Ser Ser Ala55 60 65cca cca gga ggg gtg ggg tgg caa ttt cca gca ttg ctt gga acc aga 656Pro Pro Gly Gly Val Gly Trp Gln Phe Pro Ala Leu Leu Gly Thr Arg70 75 80ata gca acg tct tct gag gtt cca gaa ttt gga ctc tgaacccatt 702Ile Ala Thr Ser Ser Glu Val Pro Glu Phe Gly Leu85 90 95gagaagaatg aaatcaactt tggcgtcaat cagccactga ttgccatgtg gcctggacga762gtcatctcat tcaacttcac tttcagccgg acgctgtgac tcgggcctgt aaccccagca822ctttgggaag ctgaggtggg tggatcgctt gagcccagga gttagagacc agcctgggca882acctggcgaa acctcgtctc tacaaaaaaa tacaaaaaat tagctgggcc tggtggcgtg942tgcctgtagt cccggctact caggagtctg aggtgggaag atccactgag cccaggaggt 1002tgaggctgca ctccagcctg ggcgacagga gtgaaaccct gtctcaaaaa gttaaaaaaa 1062aaaaaaaaaa a1073<210>18<211>96<212>PRT<213>智人(Homo sapiens)<400>18Met His Ser Asp His Arg Arg Lys Gly Lys Glu Arg Ala Pro Arg Leu1 5 10 15Lys Ala Ser Leu Gly Leu Ser Pro Ser Leu Ser Pro Cys Cys Val Thr20 25 30Trp Ser Lys Phe Leu Ser Leu Cys Glu Ser Pro Ile Pro Pro Gln Asp35 40 45Cys Cys Glu Asn Thr Val Arg Gln Ala Gly Lys Lys Ala Pro Ser Lys50 55 60Val Ser Ser Ala Pro Pro Gly Gly Val Gly Trp Gln Phe Pro Ala Leu65 70 75 80Leu Gly Thr Arg Ile Ala Thr Ser Ser Glu Val Pro Glu Phe Gly Leu85 90 9權利要求
1.一種分離的具有促進3T3細胞轉化功能的人蛋白,其特征在于,它包含具有選自下組的氨基酸序列的多肽SEQ ID NO3、6、9、12、15、18;或其保守性變異多肽、或其活性片段、或其活性衍生物。
2.如權利要求1所述的多肽,其特征在于,該多肽是具有選自下組的氨基酸序列的多肽SEQ ID NO3、6、9、12、15、18。
3.一種分離的多核苷酸,其特征在于,它包含一核苷酸序列,該核苷酸序列與選自下組的一種核苷酸序列有至少85%相同性(a)編碼如權利要求1和2所述多肽的多核苷酸;(b)與多核苷酸(a)互補的多核苷酸。
4.如權利要求3所述的多核苷酸,其特征在于,該多核苷酸編碼的多肽具有選自下組的氨基酸序列SEQ ID NO3、6、9、12、15、18。
5.如權利要求3所述的多核苷酸,其特征在于,該多核苷酸的序列選自下組SEQ ID NO2、5、8、11、14、17的編碼區序列或全長序列。
6.一種載體,其特征在于,它含有權利要求3所述的多核苷酸。
7.一種遺傳工程化的宿主細胞,其特征在于,它是選自下組的一種宿主細胞(a)用權利要求6所述的載體轉化或轉導的宿主細胞;(b)用權利要求3所述的多核苷酸轉化或轉導的宿主細胞。
8.一種具有促進3T3細胞轉化功能的人蛋白活性的多肽的制備方法,其特征在于,該方法包含(a)在適合表達具有促進3T3細胞轉化功能的人蛋白的條件下,培養權利要求7所述的宿主細胞;(b)從培養物中分離出具有促進3T3細胞轉化功能的人蛋白活性的多肽。
9.一種能與權利要求1所述的具有促進3T3細胞轉化功能的人蛋白特異性結合的抗體。
10.一種核酸分子,它含有權利要求3所述的多核苷酸中連續的10-800個核苷酸。
全文摘要
本發明公開了一類新的具有促進3T3細胞轉化功能的人蛋白,編碼此多肽的多核苷酸和經重組技術產生該多肽的方法。本發明還公開了抗此多肽的拮抗劑及其治療作用。本發明還公開了編碼這類新的具有促進3T3細胞轉化功能的人蛋白的多核苷酸的用途。
文檔編號C07K14/47GK1429841SQ0114528
公開日2003年7月16日 申請日期2001年12月30日 優先權日2001年12月30日
發明者顧健人, 楊勝利 申請人:上海新世界基因技術開發有限公司