專利名稱:一種蛋白質混合物及其制備方法
技術領域:
本發明涉及重組蛋白融合技術,具體地涉及一種蛋白質混合物。此外,本發明還涉 及該蛋白質混合物的制備方法。
背景技術:
1.人誘導多功能干(iPS)細胞2006年,日本Yamanaka實驗室利用逆病毒轉導四種轉錄因子(KLF4,c_Myc,S0X2, 0CT-4)進入小鼠胚胎和成年成纖維細胞,成功地獲得了一種多功能干細胞,其特性與小鼠 胚胎干細胞非常相似。不久,使用同樣的方法轉導人成纖維細胞,誘導的人多功能干細胞也 被成功獲得。隨后,從多種遺傳病病人細胞誘導的iPS cells也被獲得。iPS cells具有與 胚胎干細胞非常相似的特征,胚胎干細胞能夠分化成所有類型的體細胞,這些分化的體細 胞可以被用于修復由于疾病或受傷造成的組織損傷,因此胚胎干細胞在再生醫學領域有非 常廣泛的應用前景。但是,胚胎干細胞在醫學上的應用有兩個重要的障礙(1)移植后的免 疫排斥;(2)使用人類胚胎的倫理學問題。即便使用體細胞核轉移的方法獲得的胚胎干細 胞,也存在倫理學方面的問題。而誘導的人多功能干細胞可以從病人細胞獲得,不存在免疫 排斥的問題。又由于不需要破壞人胚胎或者使用人卵細胞,因此不存在使用胚胎干細胞的 倫理問題。這些優點使得iPS細胞技術有更好的再生醫學應用前景。2.誘導多功能干細胞的技術最早人們在誘導多功能干細胞時,使用復制缺陷的逆轉錄病毒或慢病毒載體將所 需的重編程因子基因導入細胞,這些病毒載體都會整合到宿主細胞的基因組中。雖然這些 外源基因在iPS細胞中在絕大多數情況下是靜默的。但是一旦被重新激活,可能會導致腫 瘤。這些基因的泄漏表達,也有可能使iPS細胞分化和成熟的不完全,導致形成未成熟的畸 胎瘤危險性大增。病毒整合也有可能激活或終止內源基因的表達。在基因治療的歷史上, 使用逆轉錄病毒整合技術也曾由于激活原癌基因導致白血病。許多實驗室都嘗試使用非病 毒整合技術誘導多功能干細胞。腺病毒和質粒以及質粒都曾被用來載體將重編程因子導入 細胞,成功獲得iPS細胞。但是iPS細胞產生的機率非常低。OriP/EBNA-1質粒附加體也被 用來作為載體來誘導iPS細胞。有一些實驗室利用Cre/loxp,轉座子/轉座酶,在獲得iPS 細胞之后,將整合到基因組的外源基因切除。另外一種避免外源基因基因組整合的方法是 用化學物質來代替重編程轉錄因子,從目前已發表的結果來看,還沒有找到能完全替代重 編程轉錄化學物質或組合,只能替代一到兩種重編程因子。即使iPS細胞沒有整合的外源 基因,上述方法也不能完全避免基因組的改變,比如用質粒轉化的方法會有低機率的基因 組整合,化學物質可能會導致突變。3.蛋白轉導蛋白轉導最初來自于對于HIV TAT蛋白的研究,人們發現全長HIV TAT蛋白能夠 進入細胞激活病毒基因的轉錄。進一步研究表明,HIV TAT蛋白的一個區域(TAT PTD)負 責進入細胞的功能。人們發現將TAT PTD與大分子偶聯或融合能夠將大分子送入細胞。研究表明帶正電荷的精氨酸對于TAT PTD穿膜進入細胞質是必須的,任何一個精氨酸的突變 都會導致轉導功能的喪失。在此基礎上,人們發現多聚精氨酸同樣具有轉導的功能。利用 TAT PTD和其他蛋白轉導多肽的蛋白質轉導技術在解決于大分子藥物進入細胞發揮功能方 面具有巨大的潛力。4. SUM0融合蛋白的切割泛肽樣修飾物(SUM0)能夠共價修飾蛋白。SUM0修飾能夠調控多種細胞進程包括 核轉移,信號轉導和蛋白穩定性。uipl,一種SUM0蛋白酶,能夠特異性地識別SUM0的三級 結構,在SUM0與其修飾蛋白相連的位置切割。當SUM0與其他蛋白融合時(相當于SUM0修 飾目標蛋白的N端氨基),Ulpl也能特異性地將SUM0切除,將目標蛋白完整地釋放。5.蛋白誘導多功能干細胞用蛋白轉導的技術將重編程因子蛋白(KLF4,c-Myc, S0X2, 0CT-4)直接導入細胞, 是一種可以避免以上提到安全性問題的方法。一個來自Scripps研究所的實驗室成功的使 用大腸桿菌表達的四種重編程因子的重組蛋白加上一種化學物質(HDAC抑制劑)得到小鼠 iPS細胞。他們使用的重組重編程因子是0CT-4,KLF4,Sox2,C-MyC。利用c端融合的多聚 精氨酸將這四種重編程因子導入細胞。這種技術能夠完全排除所有利用DNA將重編程因子 導入細胞的弊端,從而使得iPS細胞在再生醫學上的應用的可能性向前推進了一大步。但 是,他們使用的蛋白轉導多肽-多聚精氨酸與重編程因子直接融合,由于轉導多肽帶強正 電荷,存在與帶負電荷的基因組的DNA非特異性結合的可能性,與轉導多肽融合的轉錄因 子可能會非特異地改變基因表達。這種非特異的基因表達的改變,可能會導致誘導多功能 干細胞的效率降低,還有可能導致某些基因表達的永久性改變,影響iPS細胞隨后的分化 和成熟。因此,獲得一種能夠克服上述缺點的制劑,來誘導人的多功能干細胞,對于人IPS 細胞在再生醫學中的實際應用具有重大意義。
發明內容
本發明要解決的技術問題在于提供一種具有潛在醫學應用價值的蛋白質混合物, 該蛋白質混合物能大大降低與基因組DNA非特異性結合的可能性,在轉導到細胞內后具有 轉錄激活活性,可用于誘導人多功能干細胞。為此,本發明還提供該蛋白質混合物的制備方 法。為了解決上述技術問題,本發明采用如下技術方案本發明提供了一種蛋白質混合物,該蛋白質混和物由C-myc,S0X2, KLF4,0CT-4的 融合蛋白組成,每一種融合蛋白的使用濃度為lng/ml-lmg/ml ;這些融合蛋白具有以下構 成PTD-SUM0-Protein ;PTD是一個蛋白轉導區,代表HIV-TAT,HSV-VP22,AntP或者多聚精 氨酸;SUM0是泛肽樣修飾物,代表酵母SMT3p或者其在各個物種的同源物,是融合蛋白進入 細胞后被切割的識別區域;Protein是C-myc,S0X2, KLF4或者0CT-4。所述蛋白轉導區PTD為HIV TAT蛋白的TAT PTD區域,或者其他具有蛋白轉導功 能的氨基酸序列;該蛋白轉導區PTD使該蛋白質混合物能夠進入人細胞。所述泛肽樣修飾物SUM0為酵母SMT3p,或者其他氨基酸序列,其三級結構能被 SUM0蛋白酶識別并切割,該泛肽樣修飾物SUM0使蛋白轉導多肽能夠從融合蛋白切除。優選地,在所述PTD和SUM0之間可以插入NES,所述融合蛋白具有以下構成PTD-NES-SUMO-Protein, NES是一個可選的核運出序列,決定融合蛋白的細胞質定位。所述可選的核運出序列NES為人IkBa的核運出序列,或者具有核運出序列功能的
氨基酸序列。所述PTD-NES-SUM0具有SEQ ID NO. 1所示的DNA序列,具有SEQ IDN0. 2所示的
氨基酸序列。所述PTD-NES-SUM0-S0X2 具有 SEQ ID NO. 3 所示的 DNA 編碼序列; PTD-NES-SUM0-0CT-4 具有 SEQ ID NO. 4 所示的 DNA 編碼序列;PTD-NES-SUM0-KLF4 具有 SEQ ID NO. 5所示的DNA編碼序列;PTD-NES-SUMO-C-myc具有SEQ ID NO. 6所示的DNA編碼序 列。優選地,在所述PTD和NES之間插入6個組氨酸以便純化。此外,本發明還提供一種蛋白質混合物的制備方法,包括如下步驟(1)構建PTD-NES-SUMO-Protein的表達質粒首先,分別合成8段長為75bp且相 互間有20bp重疊的寡核苷酸引物,經過三次重疊PCR,合成PTD-NES-SUM0 ;然后,從人胚胎 干細胞總RNA中擴增得到人0CT-4,S0X2,KLF4,C-myc cDNA,3,端含有Xhol位點,與合成的 TAT-NES-SUM0的順序通過PCR進行組裝,獲得的產物克隆到pET_24a⑴載體的Ndel/Xhol 位點上;(2)篩選表達菌株將步驟(1)得到的PTD-NES-SUMO-Protein表達質粒轉化到 BL21宿主菌中,小量培養篩選高表達克隆;(3)融合蛋白的大規模表達將表達菌種接種于瓶中,培養至0D0. 6,加入IPTG誘 導3小時;(4)分離純化融合蛋白采用疏水層析和離子交換來分離純化上述融合蛋白。本發明獲得的蛋白質混合物,能從根本上解決現有技術所存在的缺陷(非特異的 基因表達的改變,可能會導致誘導多功能干細胞的效率降低,還有可能導致某些基因表達 的永久性改變,影響iPS細胞隨后的分化和成熟)。PTD的融合使得融合蛋白能夠進入細胞。 SUM0在融合蛋白中的存在,使得蛋白轉導多肽能夠從融合蛋白切除,去除融合的PTD,NES, SUM0。這種混合物如果應用于誘導人多功能干細胞,能最大限度地降低在誘導多功能干細 胞的過程中,由于加入的誘導物對于最終得到的iPS細胞的不利影響,使得到的iPS細胞更 加適合于在再生醫學應用以及其他相關領域中的應用。
圖1是本發明實施例1中構建PTD-NES-SUM0的PCR反應示意圖;圖2是本發明實施例2融合蛋白的轉導實驗和細胞內切割結果示意圖(采用 western免疫印跡的方法);圖3是本發明實施例3融合蛋白的轉錄活性實驗結果示意圖。優選實施方式下面結合附圖和實施例對本發明作進一步詳細的說明。應理解,這些實施例僅用 于說明本發明而不用于限制本發明的范圍。下列實施例中未注明具體條件的實驗方法, 通常按照常規條件,例如Sambrook等人,分子克隆實驗室手冊(New York Co Id Spring Harbor Laboratory Press, 1989)中所述的條件,或按照制造廠商所建議的條件。
實施例1蛋白質混合物的制備1. TAT-NES-SUM0-重編程因子的表達質粒的構建根據文獻報道所報道的HIV TAT PTD和酵母SMT3p (SUMO),人IkBa的核運出 順序NES的氨基酸序列對密碼子進行優化,以便于在大腸桿菌中進行高水平表達。按照 TAT-NES-SMT3p的順序進行排列,并在TAT和NES之間插入6個Histidine (6聚組氨酸)以 便純化。這部分融合蛋白的編碼序列通過基于寡聚核苷酸,PCR組裝的方法合成,5’端含有 一個NdeI位點。實驗方法如下分別合成6段長為75bp左右且相互間有20bp重疊的寡核 苷酸引物,經過三次重疊PCR(見圖1)①將引物a(SEQ ID NO. 7所示序列)和引物b(SEQ ID NO. 8所示序列),引物c (SEQ ID NO. 9所示序列)和引物d (SEQ ID NO. 10所示序列), 引物e (SEQ ID NO. 11所示序列)和引物f (SEQ ID N0. 12所示序列)分別混合進行PCR反 應,得到產物ab、cd、ef.②將引物a、d與上一輪PCR產物ab、cd相混合后進行擴增,③將引 物a、f與上一輪PCR產物ad、第一輪產物ef相混合進行PCR擴增,得到產物af,瓊脂糖凝 膠電泳分離擴增產物,回收目的條帶。PCR采用Roche公司的高保真擴增系統,反應體系按 照說明書的要求配置。反應條件均為步驟①95°C 5分鐘;步驟②94°C 45秒,55°C 45秒, 72 0C 55秒,30個循環;步驟③72 °C 7分鐘。用Invitrogen公司的Trizol Reagent提取5 X IO6人胚胎干細胞總RNA。按照 Invitrogen公司的Superscript 111逆轉錄PCR試劑盒的說明書用隨機引物將RNA反轉錄 成cDNA,OCT-4, S0X2, KLF4, C-myc cDNA使用下列引物擴增得到C-myc 5,ATCGCGAACAGATTGGAGGTATGCCCCTCAACGTTAGCTTC(SEQ ID NO. 13)C-myc 3,CGACTCGAGTTACGCACAAGAGTTCCGTA(SEQ ID NO. 14)Klf45'ATCGCGAACAGATTGGAGGTATGGCTGTCAGCGACGCGCT(SEQ ID NO. 15)Klf43'CGACTCGAGTTAAAAATGCCTCTTCATGTG(SEQ ID NO. 16)Nanog5'ATCGCGAACAGATTGGAGGTATGAGTGTGGATCCAGCTTG(SEQ ID NO. 17)Nanog 3,CGACTCGAGTCACACGTCTTCAGGTTGCA(SEQ ID NO. 18)0ct-45,ATCGCGAACAGATTGGAGGTATGGCGGGACACCTGGCTTC(SEQ ID NO. 19)0ct-43,CGACTCGAGTCAGTTTGAATGCATGGGAG(SEQ ID NO. 20)這些引物中,5’引物都含有20個堿基與TAT-NES-SMT3p片段3’端完全相同,便于 拼裝。每個cDNA與合成的TAT-NES-SUM0的順序通過PCR (反應條件與拼裝 TAT-NES-SUM0的條件相同,使用引物a和各cDNA的3’引物)進行組裝。獲得的產物克隆 到 pET-24a(+)載體(Novagen)的 Ndel/Xhol 位點上。
TAT-NES-SUM0 具有 SEQ ID NO. 1 所示的 DNA 編碼序列;TAT-NES-SUM0具有SEQ ID NO. 2所示的氨基酸序列;TAT-NES-SUM0-S0X2 具有 SEQ ID NO. 3 所示的 DNA 編碼序列;TAT-NES-SUM0-0CT-4 具有 SEQ ID NO. 4 所示的 DNA 編碼序列;TAT-NES-SUM0-KLF4 具有 SEQ ID NO. 5 所示的 DNA 編碼序列;TAT-NES-SUMO-C-myc 具有 SEQ ID N0. 6 所示的 DNA 編碼序列。2.表達菌株的篩選將融合表達質粒轉化到BL21 (DE3)宿主菌中,小量培養篩選高表達克隆。在3ml OD 0. 6的大腸桿菌中加入0. ImM的IPTG誘導表達,誘導3小時后收集菌體,菌體加入上樣 緩沖液煮沸5分鐘,SDS聚丙烯酰胺凝膠電泳,考馬斯亮藍染色,選擇表達量最高的克隆作 為大規模表達用菌種。對高表達菌種的進一步分析發現,表達的融合蛋白大部分存在于包 涵體中。3.融合蛋白的大規模表達將表達菌種接種于10L LB中,37度培養至OD 0. 6,加入0. IM IPTG誘導3小時。 此時菌液濃度為OD 600在1. 0左右。將上述獲得的培養物離心,棄去培養基,獲得大約27. 4g菌體。加入300ml裂解液 (50mM PH 8.0 Tris-Cl, 500mM NaCl)重懸菌體。4度超聲裂解菌體。4度6000rpm離心,棄 去上清。用300ml裂解液洗滌沉淀,離心棄去上清。用增溶液(50mM PH 8. OTris-Cl,500mM NaCl,8M Urea)溶解包涵體。包涵體溶解后,用IMAC進行親和層析,上樣完畢后先用沖洗液 (8M Urea, 500mM NaCl,50mM Tris-HCl pH8. 0,20mM Imidazole)清洗非特異性結合的成分, 然后用(8M Urea PH 8. 050mM Tris-Hcl, 500mM NaC1250mM Imidazole)洗脫,紫外 280nM 吸收檢測,收集蛋白峰,共收集洗脫液80ml。疏水層析。上述洗脫液補加NaCl固體到2M,充分溶解后,10,000RPM離心15分鐘, 棄沉淀。上清直接上樣到平衡緩沖液(2M NaCl, 50mMTris-HCl pH8. 0)充分平衡的Phenyl Sepharose FF。上樣完成后,平衡緩沖液進一步沖洗3個柱長,洗脫緩沖液(50mM Tri s-HCl ρΗ8· 0)洗脫目標峰。目標蛋白用IM醋酸調節ρΗ至6. 0并用無熱源水稀釋三倍,上樣到平衡緩沖液 (IOmM NaAc-HAc, ρΗ6. 0)充分平衡的SP-HP柱,逐步提高NaCl濃度進行洗脫,收集目標蛋 白為純化的融合蛋白。0. 22微米微孔濾膜過濾除菌后用于功能檢測。實施例2.融合蛋白的轉導實驗Hela細胞培養于high-glucose DMEM(10 %胎牛血清)。在細胞大約鋪滿30%, 加入TAT-NES-SUM0-重編程因子(每種融合蛋白濃度均為5ug/ml),12小時后,更換培 養基,繼續培養12h,24h,72h。細胞用冷PBS洗兩次。在裂解液(PH 7. 520mM Tris-Cl, 200mM NaCl,l%NP-40,lmM PMSF)中裂解細胞,取含40ug總蛋白細胞裂解液,加5X上樣緩 沖液,SDS 聚丙烯酰胺凝膠電泳,轉 PVDF 膜,用 anti-0CT4, S0X2, c-Myc, (cellsignaling) KLF4(santa Cruz)進行免疫印跡實驗。結果表明(見圖2)本發明的融合蛋白能夠進入細胞內。實施例3.融合蛋白的細胞內切割實驗過程同實施例2。結果表明(見圖2),本發明所獲得的融合蛋白能夠在細胞內被切割,從而降低由于融合轉導區的DNA結合活性所導致的非特異轉錄改變。實施例4.融合蛋白在細胞內的活性Luciferase (熒光素酶)報告基因的構建0CT4報告基因質粒8串聯0CT4結合位點(ATGCAAAT)。引物A(SEQID NO. 21)引 物 B(SEQ ID NO. 22)退火后插入 PGL3_promoter luciferaseplasmid KpnI/Bglll 位點。KLF4報告基因質粒8串聯KLF4結合位點(AGGGTGC)。引物A(SEQ IDN0. 23)引 物 B(SEQ ID NO. 24)退火后插入 PGL3_promoter luciferaseplasmid KpnI/Bglll 位點。Sox2報告基因質粒Hesxl基因Hesxl翻譯起始位點上游570_bp PCR片段KpnI 酶切后插入 pGL3-basic vector (Promega)KpnI/Smal 位點。引物 5' -CGAGGTACCGAGTTCTC TGTTCTATAAAC-3‘ (SEQ ID NO. 25)和 5 ‘ -CGACCCGGGCCTCTCGTGGTCTGCACAGA-3‘ (SEQ ID N0. 26)。C-myc 報告基因質粒引物 A(5,-CCGGTACCGG GTTGTGGCAGCCAGTCACGT GCCCGCCGCG TAGCCACACC TCTGCTCCTCAGAGCAATGT CAAGCGGTCACGTGTGATAG CAACAGATCA CGTGGCTGCC ATCGCCCCTC-3,)(SEQ ID NO. 27)禾口 弓丨物 B (5,-ATGAATTCCG GACGTTCTGG GCACGTGACC GCCACCCATGCGCTGAGGGG CGGACAGGAG GTGCTTCGAC TGGGAGGAGG GCGAAGAGTG TAAGGGGGCGGAGGGGCGAT GGCAGCC-3,) (SEQ ID N0. 28)退火補齊,KpnI 酶切后插入 PGL3-promoter luciferase plasmid KpnI/Smal 位點。HeIa細胞在大約鋪滿50 %的時候,在12-we 11細胞培養板用fugene6 (購自 Roche)轉染重編程轉錄因子的轉錄報告基因(firefly luciferase)和內參報告質粒 ρRL-TK-Iuc (promega, Renilla luciferase)。轉染后 6 小時,更換培養基,加入 5ug/ml 融合 蛋白。繼續培養12h,24h,48h,72h。細胞用PBS洗兩次,用購自promega的importer lysis buffer (報告基因裂解緩沖液)裂解細胞,細胞裂解液用購自Promega的dual-luciferase kit (雙熒光素酶試劑盒)檢測luciferase的活性。實驗結果表明(見圖3),本發明得到的融合蛋白在加入培養基12小時后,報告基 因luciferase的活性就有就有較大的提升,一直持續到72h。說明本發明得到的融合蛋 白在轉導到細胞內后具有轉錄激活活性,本發明的蛋白質混合物可用于誘導人多功能干細 胞,在再生醫學鄰域有巨大的應用前景。序列表<110>上海欣百諾生物科技有限公司<120> 一種蛋白質混合物及其制備方法<130>NP-09-13208<160>28<170>PatentIn version 3. 3<210>1<211>381<212>DNA<213>人工序列<400>1tacggtcgta aaaaacgtcg tcagcgtcgt cgtatgggtc atcaccatca tcatcacatg 60
gtgaaagaactgcaggaaattcgtctggggtcggactcagaagtcaatcaagaagctaag120
ccagaggtcaagccagaagtcaagcctgagactcacatcaatttaaaggtgtccgatgga180
tcttcagagatcttcttcaagatcaaaaagaccactcctttaagaaggctgatggaagcg240
ttcgctaaaagacagggtaaggaaatggactccttaagattcttgtacgacggtattaga300
attcaagctgatcaggcccctgaagatttggacatggaggataacgatattattgaggct360
catcgcgaacagattggaggt381
<210>2
<211>128
<212>PRT
<213>人工序列
<400>2
MYGRKKRRQRRRMGHHHHHHMVKELQEIRLGSDSEVNQEAKPEVKPEVKPETHINLKVSD60
GSSEIFFKIKKTTPLRRLMEAFAKRQGKEM DSLRFLYDGIRIQADQAPEDLDMEDNDIIE120
AHREQIGG128
<210>3
<211>1338
<212>DNA
<213>人工序列
<400>3
atgtacggtcgtaaaaaacgtcgtcagcgtcgtcgtatgggtcatcaccatcatcatcac60
atggtgaaagaactgcaggaaattcgtctggggtcggactcagaagtcaatcaagaagct120
aagccagaggtcaagccagaagtcaagcctgagactcacatcaatttaaaggtgtccgat180
ggatcttcagagatcttcttcaagatcaaaaagaccactcctttaagaaggctgatggaa240
gcgttcgctaaaagacagggtaaggaaatggactccttaagattcttgtacgacggtatt300
agaattcaagctgatcaggcccctgaagatttggacatggaggataacgatattattgag360
gctcatcgcgaacagattggaggtatgtacaacatgatggagacggagctgaagccgccg420
ggcccgcagcaaacttcggggggcggcggcggcaactccaCCgCggCggCggccggcggc480
aaccagaaaaacagcccggaccgcgtcaagcggcccatgaatgccttcatggtgtggtcc540
cgcgggcagcggcgcaagatggcccaggagaaccccaagatgcacaactcggagatcagc600
aagcgcctgggcgccgagtggaaacttttgtcggagacggagaagcggccgttcatcgac660
gaggctaagcggctgcgagcgctgcacatgaaggagcacccggattataaataccggccc720
cggcggaaaaccaagacgctcatgaagaaggataagtacacgctgcccggcgggctgctg780
gcccccggcggcaatagcatggcgagcggggtcggggtgggcgccggcctgggcgcgggc840
gtgaaccagcgcatggacagttacgcgcacatgaacggctggagcaacggcagctacagc900
atgatgcaggaccagctgggctacccgcagcacccgggcctcaatgcgcacggcgcagcg960
cagatgcagcccatgcaccgctacgacgtgagcgccctgcagtacaactccatgaccagc1020
tcgcagacctacatgaacggctcgcccacctacagcatgtcctactcgcagcagggcacc1080
cctggcatggctcttggctccatgggttcggtggtcaagtccgaggccagctccagcccc1140
cctgtggttacctcttcctcccactccagggcgccctgccaggccggggacctccgggac12000132]atgatcagcatgtatctccccggcgccgaggtgccggaacccgccgcccccagcagactt12600133]cacatgtcccagcactacca gagcggcccg gtgcccggca cggccattaa cggcacactg13200134]cccctctcacacatgtga13380135]<210>40136]<211>14670137]<212>DNA0138]〈213〉人工序列0139]<400>40140]atgtacggtcgtaaaaaacgtcgtcagcgtcgtcgtatgggtcatcaccatcatcatcac600141]atggtgaaagaactgcaggaaattcgtctggggtcggactcagaagtcaatcaagaagct1200142]aagccagaggtcaagccagaagtcaagcctgagactcacatcaatttaaaggtgtccgat1800143]ggatcttcagagatcttcttcaagatcaaaaagaccactcctttaagaaggctgatggaa2400144]gcgttcgctaaaagacagggtaaggaaatggactccttaagattcttgtacgacggtatt3000145]agaattcaagctgatcaggcccctgaagatttggacatggaggataacgatattattgag3600146]gctcatcgcgaacagattggaggtatggcgggacacctggcttcggatttcgccttctcg4200147]ccccctccaggtggtggaggtgatgggccaggggggccggagccgggctgggttgatcct4800148]cggacctggctaagcttccaaggccctcctggagggccaggaatcgggccgggggttggg5400149]ccaggctctgaggtgtgggggattcccccatgccccccgccgtatgagttctgtgggggg6000150]atggcgtactgtgggccccaggttggagtggggctagtgccccaaggcggcttggagacc6600151]tctcagcctgagggcgaagcaggagtcggggtggagagcaactccgatggggcctccccg7200152]gagccctgcaccgtcacccctggtgccgtgaagctggagaaggagaagctggagcaaaac7800153]ccggaggagtcccaggacatcaaagctctgcagaaagaactcgagcaatttgccaagctc8400154]ctgaagcagaagaggatcaccctgggatatacacaggccgatgtggggctcaccctgggg9000155]gttctatttgggaaggtattcagccaaacgaccatctgccgctttgaggctctgcagctt9600156]agcttcaagaacatgtgtaagctgcggcccttgctgcagaagtgggtggaggaagctgac10200157]aacaatgaaaatcttcaggagatatgcaaagcagaaaccctcgtgcaggcccgaaagaga10800158]aagcgaaccagtatcgagaaccgagtgagaggcaacctggagaatttgttcctgcagtgc11400159]ccgaaacccacactgcagcagatcagccacatcgcccagcagcttgggctcgagaaggat12000160]gtggtccgagtgtggttctgtaaccggcgccagaagggcaagcgatcaagcagcgactat12600161]gcacaacgagaggattttgaggctgctgggtctcctttctcagggggaccagtgtccttt13200162]cctctggccccagggccccattttggtaccccaggctatgggagccctcacttcactgca13800163]ctgtactcctcggtccctttccctgagggggaagcctttccccctgtctccgtcaccact14400164]ctgggctctc ccatgcattc aaactga14670165]<210>50166]<211>17970167]<212>DNA0168]〈213〉人工序列0169]〈400>50170]atgtacggtcgtaaaaaacg tcgtcagcgtcgtcgtatgg gtcatcacca tcatcatcac0171]atggtgaaagaactgcaggaaattcgtctg gggtcggactcagaagtcaa tcaagaagct0172]aagccagaggtcaagccagaagtcaagcctgagactcaca tcaatttaaa ggtgtccgat0173]ggatcttcagagatcttcttcaagatcaaa aagaccactcctttaagaag gctgatggaa0174]gcgttcgctaaaagacagggtaaggaaatg gactccttaa gattcttgta cgacggtatt0175]agaattcaagctgatcaggcccctgaagatttggacatgg aggataacga tattattgag0176]gctcatcgcgaacagattggaggtatggctgtcagcgacg cgctgctcccatctttctcc0177]acgttcgcgtCtggCCCggCgggaagggagaagacactgcgtcaagcagg tgccccgaat0178]aaccgctggcgggaggagctctcccacatgaagcgacttcccccagtgcttcccggccgc0179]ccctatgacctggcggcggcgaccgtggccacagacctggagagcggcggagccggtgcg0180]gcttgcggcggtagcaacctggcgcccctacctcggagagagaccgaggagttcaacgat0181]ctcctggacctggactttattctctccaattcgctgacccatcctccggagtcagtggcc0182]gccaccgtgtcctcgtcagcgtcagcctcctcttcgtcgtcgccgtcgagcagcggccct0183]gccagcgcgccctccacctgcagcttcacctatccgatccgggccgggaacgacccgggc0184]gtggcgccgggcggcacgggcggaggcctcctctatggcagggagtccgctccccctccg0185]acggctcccttcaacctggcggacatcaacgacgtgagccCCtCgggCggcttcgtggcc0186]gagctcctgcggccagaattggacccggtgtacattccgccgcagcagccgcagccgcca0187]ggtggcgggctgatgggcaagttcgtgctgaaggcgtcgctgagcgcccctggcagcgag0188]tacggcagcccgtcggtcatcagcgtcagcaaaggcagccctgacggcagccacccggtg0189]gtggtggcgccctacaacggCgggCCgCCgcgcacgtgccccaagatcaagcaggaggcg0190]gtctcttcgtgcacccacttgggcgctggaccccctctcagcaatggccaCCggCCggCt0191]gcacacgacttccccctggggcggcagctccccagcaggactaccccgaccctgggtctt0192]gaggaagtgctgagcagcagggactgtcaccctgccctgccgcttcctcccggcttccat0193]ccccacccggggcccaattacccatccttcctgcccgatcagatgcagccgcaagtcccg0194]ccgctccattaccaagagctcatgccacccggttcctgcatgccagaggagcccaagcca0195]aagaggggaagacgatcgtggccccggaaaaggaccgccacccacacttgtgattacgcg0196]ggctgcggcaaaacctacacaaagagttcccatctcaaggcacacctgcg3.3.CCC3.C3.C3.0197]ggtgagaaaccttaccactgtgactgggacggctgtggatggaaattcgcccgctcagat0198]gaactgaccaggcactaccgtaaacacacggggcaccgcccgttccagtgccaaaaatgc0199]gaccgagcattttccaggtcggaccacctcgccttacacatgaagaggcatttttaa0200]<210>60201]<211>17040202]<212>DNA0203]<213>人工序列0204]<400>60205]atgtacggtcgtaaaaaacgtcgtcagcgtcgtcgtatgg gtcatcacca tcatcatcac0206]atggtgaaagaactgcaggaaattcgtctg gggtcggactcagaagtcaa tcaagaagct0207]aagccagaggtcaagccagaagtcaagcctgagactcaca tcaatttaaa ggtgtccgat0208]ggatcttcagagatcttcttcaagatcaaa aagaccactcctttaagaag gctgatggaa0209]gcgttcgctaaaagacagggtaaggaaatg gactccttaa gattcttgta cgacggtatt
120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1797
60 120 180 240 300
agaattcaagctgatcaggcccctgaagat
gctcatcgcgaacagattggaggtatgccc
gacctcgactacgactcggtgcagccgtat
cagcagcagcagcagagcgagctgcagccc
ttcgagctgctgcccaccccgcccctgtcc
tcctacgttgcggtcacacccttctccctt
ttctccacggccgaccagctggagatggtg
cagagtttcatctgcgacccggacgacgag
tgtatgtggagcggcttctcggccgccgcc
caggctgcgcgcaaagacagcggcagcccg
acctccagcttgtacctgcaggatctgagc
gtggtcttcccctaccctctcaacgacagc
tccagcgccttctctccgtcctcggattct
ggcagccccgagcccctggtgctccatgag
gaggaggaacaagaagatgaggaagaaatc
cctggcaaaaggtcagagtctggatcacct
agcccactggtcctcaagaggtgccacgtc
ccctccactcggaaggactatcctgctgcc
ctgagacagatcagcaacaaccgaaaatgc
aatgtcaagaggcgaacacacaacgtcttg
agcttttttgccctgcgtgaccagatcccg
gtagttatccttaaaaaagccacagcatac
ctcatttctgaagaggacttgttgcggaaa
cagctacgga actcttgtgc gtaa
<210>7
<211>78
<212>DNA
〈213〉人工序列
〈220〉
<221>misc_feature
〈223〉引物
<400>7
cgacatatgtacggtcgtaa aaaacgtcgt
catcacatgg tgaaagaa
<210>8
<211>75
<212>DNA
〈213〉人工序列
〈220〉
ttggacatgg aggataacga tattattgag360ctcaacgtta gcttcaccaa caggaactat420ttctactgcgacgaggaggagaacttctac480ccggcgcccagcgaggatatctggaagaaa540cctagccgccgctccgggctctgctcgccc600cggggagacaacgacggcggtggcgggagc660accgagctgctgggaggagacatggtgaac720accttcatcaaaaacatcatcatccaggac780aagctcgtctcagagaagctggcctcctac840aaccccgcccgcggccacagcgtctgctcc900gccgccgcctcagagtgcatcgacccctcg960agctcgcccaagtcctgcgcctcgcaagac1020ctgctctcctcgacggagtcctccccgcag1080gagacaccgcccaccaccagcagcgactct1140gatgttgtttctgtggaaaagaggcaggct1200tctgctggaggccacagcaaacctcctcac1260tccacacatcagcacaactacgcagcgcct1320aagagggtcaagttggacagtgtcagagtc1380accagccccaggtcctcggacaccgaggag1440gagcgccagaggaggaacgagctaaaacgg1500gagttggaaaacaatgaaaaggcccccaag1560atcctgtccgtccaagcagaggagcaaaag1620cgacgagaacagttgaaacacaaacttgaa16801704cagcgtcgtcgtatgggtcatcaccatcat60
<22 l>mi SC feature
<223>引物
<400>8
ctggcttagc ttcttgattg acttctgagt ccgaccccag acgaatttcc tgcagttctt60
tcaccatgtg atgat75
<2 10>9
<2l 1>75
<2 1 2>DNA
<213>人工序列
<220>
<22 l>mi SC feature
<223>引物
<400>9
caatcaagaa gctaagccag aggtcaagcc agaagtcaag cctgagactc acatcaattt60
aaaggtgtcc gatgg75
<210>10
<2l 1>75
<2 1 2>DNA
<213>人工序列
<220>
<22 l>mi SC feature
<223>引物
<400>10
catcagcctt cttaaaggag tggtcttttt gatcttgaag aagatctctg aagatccatc60
ggacaccttt aaatt75
<210>11
<211>110
<2 1 2>DNA
<213>人工序列
<220>
<22 l>mi SC feature
<223>引物
<400>11
ctcctttaag aaggctgatg gaagcgttcg ctaaaagaca gggtaaggaa atggactcct60
taagattctt gtacgacggt attagaattc aagctgatca ggcccctgaa110
<210>12
<2l 1>77
<2 1 2>DNA
<213>人工序列<220>
<221>misc_feature <223>引物 <400>12
acctccaatc tgttcgcgat gagcctcaat aatatcgtta tcctccatgt ccaaatcttc 60
aggggcctga tcagctt77
<210>13
<211>41
<212>DNA
<213>人工序列
<220>
<221>misc_feature <223>引物 <400>13
atcgcgaaca gattggaggt atgcccctca acgttagctt c41
<210>14
<211>29
<212>DNA
<213>人工序列
<220>
<221>misc_feature <223>引物 <400>14
cgactcgagt tacgcacaag agttccgta29
<210>15
<211>40
<212>DNA
<213>人工序列
<220>
<221>misc_feature <223>引物 <400>15
atcgcgaaca gattggaggt atggctgtca gcgacgcgct40
<210>16 <211>30 <212>DNA <213>人工序列 <220>
<221>misc feature
<223> 引物<400>16cgactcgagt taaaaatgcc tcttcatgtg30<210>17<211>40<212>DNA<213>人工序列<220><221>misc_feature<223> 引物<400>17atcgcgaaca gattggaggt atgagtgtgg atccagcttg40<210>18<211>29<212>DNA<213>人工序列<220><221>misc_feature<223> 引物<400>18cgactcgagt cacacgtctt caggttgca29<210>19<211>40<212>DNA<213>人工序列<220><221>misc_feature<223> 引物<400>19atcgcgaaca gattggaggt atggcgggac acctggcttc40<210>20<211>29<212>DNA<213>人工序列<220><221>misc_feature<223> 引物<400>20cgactcgagt cagtttgaat gcatgggag29<210>21
<211>66
<212>DNA
<213>人工序列
<220>
<221>misc_feature <223>引物 <400>21
catgcaaata tgcaaatatg caaatatgca aatatgcaaa tatgcaaata tgcaaatatg 60 caaata66
<210>22 <211>74 <212>DNA <213>人工序列 <220>
<221>misc_feature <223>引物 <400>22
ctagaatgca aatatgcaaa tatgcaaata tgcaaatatg caaatatgca aatatgcaaa 60
tatgcaaatg gtac74
<210>23
<211>58
<212>DNA
<213>人工序列
<220>
<221>misc_feature <223>引物 <400>23
cagggtgcag ggtgcagggt gcagggtgca gggtgcaggg tgcagggtgc agggtgca 58 <210>24 <211>66 <212>DNA <213>人工序列 <220>
<221>misc_feature <223>引物 <400>24
ctagagcacc ctgcaccctg caccctgcac cctgcaccct gcaccctgca ccctgcaccc 60 tggtac66
<210>25<211>29<212>DNA<213>人工序列<220><221>misc_feature<223> 引物<400>25cgaggtaccg agttctctgt tctataaac29<210>26<211>29<212>DNA<213>人工序列<220><221>misc_feature<223> 引物<400>26cgacccgggc ctctcgtggt ctgcacaga29<210>27<211>120<212>DNA<213>人工序列<220><221>misc_feature<223> 引物<400>27ccggtaccgg gttgtggcag ccagtcacgt gcccgccgcg tagccacaccagagcaatgt caagcggtca cgtgtgatag caacagatca cgtggctgcc<210>28<211>117<212>DNA<213>人工序列<220><221>misc_feature<223> 引物<400>28atgaattccg gacgttctgg gcacgtgacc gccacccatg cgctgagggg cggacaggag 60gtgcttcgac tgggaggagg gcgaagagtg taagggggcg gaggggcgat ggcagcc117
tctgctcctc 60 atcgcccctc 120
權利要求
一種蛋白質混合物,其特征在于,該蛋白質混和物由C myc,SOX2,KLF4,OCT 4的融合蛋白組成,每一種融合蛋白的使用濃度為1ng/ml 1mg/ml;這些融合蛋白具有以下構成PTD SUMO Protein;PTD是一個蛋白轉導區,代表HIV TAT,HSV VP22,AntP或者多聚精氨酸;SUMO是泛肽樣修飾物,代表酵母SMT3p或者其在各個物種的同源物,是融合蛋白進入細胞后被切割的識別區域;Protein是C myc,SOX2,KLF4或者OCT 4。
2.如權利要求1所述的蛋白質混合物,其特征在于,所述蛋白轉導區PTD為HIVTAT蛋 白的TAT PTD區域,或者其他具有蛋白轉導功能的氨基酸序列;該蛋白轉導區PTD使該蛋白 質混合物能夠進入人細胞。
3.如權利要求1所述的蛋白質混合物,其特征在于,所述泛肽樣修飾物SUMO為酵母 SMT3p,或者其他氨基酸序列,其三級結構能被SUMO蛋白酶識別并切割,該泛肽樣修飾物 SUMO使蛋白轉導多肽能夠從融合蛋白切除。
4.如權利要求1所述的蛋白質混合物,其特征在于,在所述PTD和SUMO之間插入NES, 所述融合蛋白具有以下構成=PTD-NES-SUMO-Protein, NES是一個可選的核運出序列,決定 融合蛋白的細胞質定位。
5.如權利要求4所述的蛋白質混合物,其特征在于,所述可選的核運出序列NES為人 IkBa的核運出序列,或者具有核運出序列功能的氨基酸序列。
6.如權利要求4所述的蛋白質混合物,其特征在于,所述PTD-NES-SUM0具有SEQID NO. 1所示的DNA序列,具有SEQ ID NO. 2所示的氨基酸序列。
7.如權利要求4所述的蛋白質混合物,其特征在于,所述PTD-NES-SUM0-S0X2具有SEQ ID NO. 3所示的DNA編碼序列;PTD-NES-SUM0-0CT-4具有SEQ ID NO. 4所示的DNA編碼序 列;PTD-NES-SUM0-KLF4 具有 SEQ ID N0. 5 所示的 DNA 編碼序列;PTD-NES-SUMO-C-myc 具有 SEQ ID N0. 6所示的DNA編碼序列。
8.如權利要求4所述的蛋白質混合物,其特征在于,所述PTD和NES之間插入6個組氨酸。
9.一種蛋白質混合物的制備方法,其特征在于,包括如下步驟(1)構建PTD-NES-SUMO-Protein的表達質粒首先,分別合成8段長為75bp且相互 間有20bp重疊的寡核苷酸引物,經過三次重疊PCR,合成PTD-NES-SUM0 ;然后,從人胚胎干 細胞總RNA中擴增得到人OCT-4,S0X2, KLF4,C-myc cDNA,3,端含有XhoI位點,與合成的 TAT-NES-SUM0的順序通過PCR進行組裝,獲得的產物克隆到pET_24a⑴載體的Ndel/Xhol 位點上;(2)篩選表達菌株將步驟(1)得到的PTD-NES-SUMO-Protein表達質粒轉化到BL21宿 主菌中,小量培養篩選高表達克隆;(3)融合蛋白的大規模表達將表達菌種接種于瓶中,培養至0D0.6,加入IPTG誘導3 小時;(4)分離純化融合蛋白采用疏水層析和離子交換來分離純化上述融合蛋白。
10.一種如權利要求1-8任一項所述的蛋白質混合物在誘導人多功能干細胞中的應用。
全文摘要
本發明公開了一種蛋白質混合物,由C-myc,SOX2,KLF4,OCT-4的融合蛋白組成,每一種融合蛋白的使用濃度為1ng/ml-1mg/ml;融合蛋白中包含PTD(蛋白轉導區),SUMO(泛肽樣修飾物)與上述四種蛋白質的融合。PTD的融合使得融合蛋白能夠進入細胞。融合的SUMO使得融合蛋白在進入細胞后能被切割,去除融合的PTD、SUMO。此外,本發明還公開了上述蛋白質混合物的制備方法。這種具有生物活性的蛋白質混合物,有可能應用于體外誘導人多功能干細胞,在再生醫學領域有巨大的應用前景。
文檔編號C12R1/19GK101993495SQ20091005774
公開日2011年3月30日 申請日期2009年8月12日 優先權日2009年8月12日
發明者丁劍鋒, 劉程, 梁巖, 蔡麗君, 趙智祥 申請人:上海近岸科技有限公司