專利名稱::增強蛋白表達和純化的方法和組合物的制作方法
技術領域:
:本發明涉及重組cDNA的表達和表達蛋白的純化領域。更具體地說,本發明提供了增強異源蛋白質從多種不同宿主物種中表達并利于其純化的材料和方法。
背景技術:
:貫穿本說明書引用了幾種出版物和專利文獻以描述本發明所屬
技術領域:
狀況。這些參考資料的全部引用可以在整個說明書中找到。每個引用通過援引并入本文,如同全部闡述了一樣。在異種的表達系統中不能統一的表達和純化具有生物學活性的蛋白已經妨礙了功能基因組研究(Ryan和Patterson(2002)TrendsBiotechnol,20:S45-51)。盡管在特定表達載體中使用了相同的轉錄和翻譯信號,仍觀察到表達蛋白水平的變化顯著(Weickert等(1996)Curr.Opin.Biotechnol.,7:494-9)。因此,人們已經開發了幾種策略,使用在細菌、酵母以及哺乳動物和昆蟲的細胞中將異源蛋白質作為基因融合物表達(Ecker等(1989)J.Biol.Chem.,264:7715-9;Butt等(1989)Proc.Natl.Acad.Sci.,86:2540-4;Kapust和Waugh(1999)ProteinSci.,8:1668-74;Ikonomou等(2003)Appl.Microbiol.Biotechnol.,62:1-20)。到目前為止,對于研究和商業目的來說,在細菌中表達異源基因是最簡單和最便宜的方法。然而,在大腸桿菌中某些異源基因產物不能獲得他們正確的三維構象,而其他異源基因產物過量生產時匯集(sequestered)為大的不溶解的集合物或"包含體"(Jonasson等(2002)Biotechno1.Appl.Biochem.,35:91-105;Georgiou和Valax(1999)MethodsEnzymol.,309:48-58.)。為了獲得合理的重組蛋白得率,經常需要大量變性劑誘導的增溶方法之后再在適宜再折疊的條件下除去變性劑。對于結構基因組項目,開放閱讀框(ORFs)的選擇也表明只有大約20%在大腸桿菌中表達的基因可以產生可溶的或正確折疊的蛋白質(Waldo等(1999)Nat.Biotechnol.,17:691-5)。這些數字是非常令人失望的,尤其是現在大多數的科學家依靠大腸桿菌來初始嘗試表達基因產物。幾種通過連接標簽如NUSA、麥芽糖結合蛋白(MBP)、谷胱甘肽S轉移酶(GST)和硫氧還蛋白(TRX)的蛋白表達系統已經開發出來(Jonasson等(2002)Biotechnol.Appl.Biochem.,35:91-105)。所有的這些系統都具有某些缺點,包括表達低效以及對期望結構切割不一致。在文獻(Jentsch和Py萌olakis(2000)TrendsCellBiol"10:335-42;Yeh等(2000)Gene,248:1-14;Larsen和Wang(2002)J.ProteomeRes.,l:411-9)中已經描述了泛素(Ub)和泛素類蛋白(Ubls)。SUMO系統也被描述(Muller等(2001)Nat.Rev.Mol.Cell.Biol.,2:202-10.)。SUMO(小泛素相關修飾物)是一種Ubl,在公開文獻中又被稱作Sentrin、SMT3、PIC1、GMP1和UBL1。在整個真核生物王國中都存在SUMO途徑,從酵母到人類SUMO蛋白都高度保守(Kim等(2002)J.Cell.Physiol.,191:257-68)。雖然泛素和SUMO之間的全序列同源性僅有18%,但通過核》茲共振(NMR)進行的結構測定顯示這兩種蛋白擁有共同的三維結構,特征為嚴密包裹的球狀折疊,由P-片層包圍oc-螺旋(Bayer等(1998)J.Mol.Biol.,280:275-86;Kim等(2000)J.Biol.Chem.,275:14102-6)。SUMO陪伴性質的實驗顯示它附著在不穩定蛋白的N端,能作為折疊的核,并保護蛋白免于聚集。所有的SUMO基因都編碼前體蛋白,前體蛋白具有短C末端序列,該序列超出保守C末端Gly-Gly基序而延伸(Muller等(2001)Nat.Rev.Mol.Cell.Biol.,2:202-10)。該延伸序列長度有所變化并通常為2-12氨基酸。在細胞內SUMO化(sumoylation)之前,SUMO蛋白酶(也稱為水解酶)除去C末端延伸(Coloma等(1992)J.Immunol.8Methods,152:89-104)。將SUMO的C未端連接到目標蛋白賴氨酸殘基的s-氨基叫做SUMO化。細胞蛋白的SUMO化被認為調節核轉運、信號轉導、應力反應以及細胞周期進程(Kretz-Remy和Tanguay(1999)Biochem.Cell.Biol.Biol"77:299-309)。很可能SUMO傳導將蛋白易位于不同細胞區室的信號,然而SUMO這種功能的準確的作用機制細節不清楚。如果容許這兩種蛋白修飾造成的不同作用,SUMO途徑和泛素途徑之間的相似性是很顯著的(Goettsch和Bayer(2002)Front.Biosci"7:al48隱62)。NusA是另一種融合標簽,可能由于它分子量大,能促進伙伴蛋白的溶解(Davis等(1999)Biotecno1.Bioeng.,65:382-8)。谷胱甘肽S-轉移酶(GST)(Smith和Johnson(1988)Gene,67:31-40)和麥芽糖結合蛋白(MBP)(diGuan等(1988)Gene,67:21-30)融合標簽也被認為可增加融合伙伴的表達和得率。然而使用GST時并非總會觀察到增強表達,因為它可形成二聚體并妨礙蛋白溶解。所有的這些融合系統的另一問題是期望的蛋白可能必須從融合體中移除。為了規避這個問題,經常在融合標簽下游設計蛋白酶位點,如因子Xa、凝血酶、腸激酶或Tev蛋白酶位點。然而因為蛋白酶識別的短的特異的氨基酸序列可能出現在融合物/目標蛋白內,所以經常覺察到不恰當的切割(Jonasson等(2002)Biotechnol.Appl.Biochem.,35:91-105)。本發明規避了這些問題。而且,不像SUMO蛋白酶,Tev蛋白酶是一種序列特異的蛋白酶,它在切割融合蛋白后會在所關心的蛋白的N未端留下不期望的序列。相反,SUMO蛋白酶從SUMOC末端切割任何序列,從而在融合蛋白中產生期望的N未端(除了脯氨酸)。發明概述依照本發明,提供工程SUMO蛋白,這種SUMO蛋白不能被野生型SUMO蛋白酶切割。也提供編碼該工程SUMO蛋白的核酸分子。在一種特定方案中,工程SUMO是其中在SUMO蛋白酶相互作用結構域中的至少一個精氨酸殘基已被改變為另一種氨基酸,優選非堿性氨基酸,的SUMO蛋白。在另一個實施方案中,工程SUMO蛋白包含氨基酸序列X!FX2X3X4GXsX6(SEQIDNO:2),其中X!和乂6是除了精氨酸的任何氨基酸,X2、X3、X4和Xs是任何氨基酸。在另一個實施方案中,X!從谷氨酰胺、蘇氨酸和苯丙氨酸中挑選,X6從亮氨酸和谷氨酸中挑選。在又一個實施方案中,工程SUMO與SEQIDNO:l之間具有至少90%的同一性。依照本發明,提供工程SUMO蛋白酶,該蛋白酶可以切割工程SUMO蛋白。也提供編碼該工程SUMO蛋白酶的核酸分子。在一種特定實施方案中,工程SUMO蛋白酶是其中SUMO相互作用結構域已被改變的SUMO蛋白酶。在一種更具體的實施方案中,工程SUMO蛋白酶包含氨基酸序列WLNXiX2X3X4Xs(SEQIDNO:6),其中X!和X5是任何非酸性氨基酸,X2、X3、X4和X5是任何氨基酸。在另一個實施方案中,Xi是絲氨酸;X2從甘氨酸和蘇氨酸中挑選;Xs從絲氨酸、丙氨酸和曱硫氨酸中挑選。在又一個實施方案中,工程SUMO蛋白酶與從SEQIDNO:3、SEQIDNO:4和SEQIDNO:5中選出的氨基酸序列具有至少90%的同源性。依照本發明的另一個方面,提供在宿主細胞中增強所關心的蛋白表達水平的方法。在一種特定實施方案中,這些方法包括i)將編碼工程SUMO的核酸可操作地連接到編碼所關心的蛋白的核酸序列上,由此產生編碼融合蛋白的構建體,ii)將該核酸導入宿主細胞,從而在融合蛋白中工程SUMO的存在增加了宿主細胞中所關心的蛋白的表達水平。在一種特定實施方案中,該方法進一步包括分離融合蛋白并任選地切割融合蛋白以釋放所關心的蛋白。依照本發明的另一個方面,提供了在宿主細胞中產生所關心的蛋白中改變的氨基末端的方法。在一個特定實施方案中,這些方法包括a)提供編碼所關心的蛋白的核酸序列;b)在核酸中改變編碼N末端氨基酸的序列;c)將編碼工程SUMO的核酸可才乘作地連4妄到編碼所關心的蛋白的核酸序列上;d)在宿主細胞中表達該核酸;和e)在宿主細胞中表達能夠切割工程SUMO的工程SUMO蛋白酶,由此該工程SUMO蛋白酶切割工程SUMO,從而在細胞中生產具有改變的氨基末端的所關心的蛋白。在一個特定實施方案中,該方法進一步包括具有改變的氨基末端的所關心的蛋白的分離。依照本發明的又一個的方面,提供了增強所關心的蛋白從宿主細胞中分泌的水平的方法。在一個特定實施方案中,這些方法包括i)將編碼工程SUMO的核酸分子可操作地連接到編碼所關心的蛋白的核酸序列上,從而生成編碼融合蛋白的構建體,和ii)將該核酸導入宿主細胞,由此融合蛋白中工程SUMO的存在增強了所關心的蛋白從宿主細胞的分泌。也提供重組載體,包括編碼工程SUMO的核酸分子,該核酸分子可操作地連接于啟動子和多克隆位點。在一種優選實施方案中,多克隆位點允許克隆編碼所關心的蛋白的核酸至編碼工程SUMO的Gly-Gly切割位點的核酸序列的3,。在一種特定實施方案中,重組載體包含在試劑盒內,該試劑盒可進一步包括宿主細胞和用于基于寡核苷酸位點定向誘變的試劑,所述誘變用于改變編碼所關心的蛋白的核酸以產生不同于天然所關心的蛋白的氨基末端。在另一個實施方案中,提供了用于從宿主細胞中純化蛋白的試劑盒,包括i)重組載體,含有a)編碼工程SUMO的核酸分子;b)啟動子;c)多克隆位點;和任選地d)編碼親和標簽的核酸序列;其中啟動子可操作地連接至編碼工程SUMO的核酸分子上,其中如果有編碼親和標簽的核酸序列,則其是符合讀框并可操作地連接至編碼工程SUMO的核酸分子上,并且其中多克隆位點允許克隆編碼所關心的蛋白的核酸至編碼工程SUMO的Gly-Gly切割位點的核酸序列的3,;和ii)組合物,包括工程SUMO蛋白酶或編碼工程SUMO蛋白酶的載體,其中工程SUMO蛋白酶在Gly-Gly切割位點之后特異地切割工程SUMO。在一個特定實施方案中,該試劑盒可進一步地包括至少一種宿主細胞、結合親和標簽的固體支持物、裂解緩沖劑、洗滌緩沖劑、洗脫緩沖劑、切割緩沖劑和指導材料。依照本發明的另一個方面,提供了包括融合蛋白的微陣列,該融合蛋白包括與所關心的蛋白連接的工程SUMO蛋白。圖l是示意圖,說明與野生型SUMO和野生型SUMO蛋白酶相比,工程SUMO標簽(例如SUMO"和相應的工程SUMO蛋白酶在從原核和真核細胞中生產和純化蛋白的潛在應用。圖2是考馬斯染色的SDS-PAGE凝膠照片,顯示了在細菌細胞中,與未加標簽的GFP相比SUMO+強烈地增加了它的融合伙伴(本實驗中為GFP)的表達量和溶解性,與野生型SUMO—樣。11=未誘導培養;ii1=誘導培養;S:可溶組分;IB-不溶包含體。圖3A和3B是蛋白質印跡照片,顯示SUMC^融合標簽不會被釀酒酵母(Saccharomycescerevisiae)的SUMO蛋白酶或昆蟲細胞SUMO蛋白酶所切割。圖3A中,用表達GFP(泳道1和2),SUMO-GFP(泳道3和4)或SUMO氣GFP(泳道5和6)的構建體轉化酵母。圖3B中,將SUMO*-GFP或SUMO-GFP在22°C孵育3小時,有(泳道1和2)或無(泳道3和4)昆蟲Sf9細胞提取物。蛋白用15Q/oSDS-PAGE凝膠分離,用抗GFP抗體4企測。*=GFP降解產物。圖4A和4B是Smt3和ULP1的晶體結構以及它們潛在的相互作用。特別描述了SUMO中的兩個殘基(精氨酸64和精氨酸71)和ULP1中的兩個殘基(谷氨酸455和天冬氨酸451),這些殘基是SUMO-ULP1的相互作用的部分。圖4A和4B中顯示了不同角度的視角。圖5是SUMO的區域圖解,預測該區域與ULP1相鄰。在R64和R71位的精氨酸是加亮的。提供了SEQIDNO:66。圖6提供了相同凝膠的考馬斯染色的SDS-PAGE(上欄)以及抗Smt3的蛋白印跡(下欄)照片,顯示了在體外野生型SUMO(Smt3)被ULP1和SENP2(SUMO蛋白酶1和2)切割,但SUM01突變Smt3)在體外不能被這些蛋白酶切割。圖7是一種實驗系統的示意圖,這種實驗系統應用于可切割工程SUMO的工程SUMO蛋白酶的篩選。在大腸桿菌中,只有當P-內酰胺酶外排進入周質間隙時,才可賦予對氨千青霉素的抗性。如圖7A所示,當卩-內酰胺酶在N未端與SUMO和不溶蛋白連4妄時,它^皮捕獲在細胞內,細菌不能在含氨千青霉素的平板上生長。除了(3內酰胺酶復合物之外,如果在細胞中再引入SUMO蛋白酶,SUMO蛋白酶可將P-內酰胺酶釋放出來并隨后外泌進入周質,在那里它賦予對氨卡青霉素的抗性(圖7B)。如果在(3-內酰胺酶上SUMO標簽以某種方式突變以至于它不能被野生型SUMO蛋白酶切割(例如,該SUMO為SUMO*),細胞變得對氨節青霉素敏感(圖7C)。只有當SUMO蛋白酶以某一方式突變/改變而可以切割突變的SUMO+(圖7D),細菌細^/恢復對氨芐青霉素的抗性。Insol.蛋白=不溶蛋白;WTSUMO蛋白酶=野生型SUMO蛋白酶;BLA二卩-內酰胺酶;SUMO承工程SUMO。圖8是體內P-內酰胺酶篩選的培養照片,顯示當蛋白酶不能切割包含SUMO的底物時大腸桿菌不能在氨卡青霉素上生長。為了誘導蛋白酶,平板含有0.02%阿拉伯糖。圖9提供在野生型SUMO蛋白酶ULPl中區域的示意圖以及某些在突變時恢復針對SUMO+的酶活性的特異殘基。提供了SEQIDNO:24。圖10A-10D是考馬斯染色的SDS-PAGE凝膠照片,顯示SUMO*蛋白酶有效地從具有GFP的融合蛋白上切割SUMO*,4旦ULP1不能切割該SUMC^標簽。斜面顯示了蛋白酶滴定,其中每個連續的泳道含有的蛋白酶是前一個泳道的二分之一。圖10A表明ULP1切割SMT3標簽。圖IOB表明SUMC^蛋白酶1切割SUMO承標簽。圖IOC表明ULP1不能切割SUM(P標簽。圖IOD顯示SUMO+蛋白酶1切割野生型SUMO,但是比切割SUMC^的效率低。11=未切割的SUMO或SUMO氣GFP(無蛋白酶存在);PH"又有蛋白酶的泳道,相同量蛋白酶一皮用于第一次的切割反應。圖11A-11C提供了不同物種來源的SUMO蛋白序列。下劃線區域為與SUMO蛋白酶相互作用的區域。圖12A和12B提供不同物種來源的SUMO蛋白酶序列。下劃線區域為與SUMO蛋白相互作用的區域。圖13為考馬斯染色SDS-PAGE凝膠的照片,顯示在昆蟲細胞中加SUMC^標簽的類胰蛋白酶與加6xHis標簽的類胰蛋白酶相比被以較高水平表達并不^皮切割。圖14為蛋白質印跡照片,顯示在畢赤酵母細胞中,與加6xHis標簽的GzmB相比,力口SUMC^標簽的GzmB凈皮以較高水平表達并分泌、并不^^刀割。圖15A為考馬斯染色SDS-PAGE凝膠照片,顯示在昆蟲Sf9細胞中SUMO承融合大大增加了異源表達的UBP43蛋白。箭頭指示了未融合或SUMO+融合的UBP43的大小。圖15B提供蛋白質印跡的照片,顯示了在HEK293T細胞中小鼠組X磷脂酶2A(mXPLA2;左欄)和去泛素酶JOSD2(右欄)的表達。只有PLA2與SUMC^融合物被分泌至培養基,而6xHis與野生型SUMO的融合物不被分泌。6xHis-PLA2和徹底切割的SUMO-PLA2在細胞抽提物中剛剛能被檢測到。箭頭指出了PLA2、切割后野生型SUMO和SUMO*-PLA2的預期大小。JOSD2在細胞內表達并且SUMO*大大地增強它的表達。H=6xHis;S=SUMO;S*=SUMO*。圖16提供了來自初始的小鼠sPLA2-X構建體(包括活性的(圖16A)和非活性的(圖16B)形式)轉染(HEK-293T)后48小時時的培養基(15^1)蛋白質印跡的照片。以下五種N末端融合標簽被測定:6xHis、6xHis-CTHS、6xHis-SUMOmut、6xHis-SUMO和6xHis-hSUM03。全部構建載體也都包含了小鼠IgGK分泌信號。結果代表了至少3次獨立實驗。圖17提供來自修飾(revised)后的小鼠sPLA2-X構建體(包括非活性(圖17A)和活性(圖17B)形式)在轉染(HEK-293T)后48小時時的培養基(15|ul)蛋白質印跡的照片。以下7種N末端融合標簽被測定6xHis、6xHis-SUMO、6xHis-SUMOmut、6xHis-hS畫01、6xHis隱hSUM01mut、6xHis誦hSUM03和6xHis畫hSUM03mut。全部構建體包含小鼠IgGK分泌信號。結果代表至少3次獨立實驗。圖18提供了sPLA2-IIC(圖18A,細胞內組分)、IIE(圖18B,培養基(15pl))、III(培養基(15pl))和V(培養基(15pl))構建體轉染(HEK-293T)后48小時時的蛋白質印跡照片。對每種sPLA2,通過使用突變和野生型形式的三種SUMOs而進行比較,6xHis標簽作為對照。全部構建體包含小鼠IgGk分泌信號。結果代表2-3次獨立實驗。發明詳述本發明提供新型的工程SUMO蛋白,該蛋白不能被真核生物系統中的野生型SUMO蛋白酶切割,以及其使用方法。實際上,為了利用SUMO的表達增強性質,已經開發了新型的工程SUMO標簽(例如,SUMO*),這種標簽在真核細胞中不會被切割。SUMO蛋白酶存在于所有真核細胞。因此與本發明的工程SUMO蛋白相反,野生型SUMO的融合物在真核細胞中表達時會被切割。值得注意的是,原核生物沒有SUMO途徑或SUMO蛋白酶。因此,SUMO融合物(野生型或工程的)在原核生物中表達時不會被切割。同時提供可切割工程SUMO蛋白的新型工程SUMO蛋白酶。工程SUMO蛋白和SUMO蛋白酶能完成融合至工程SUMO的所關心的蛋白的表達和純化,無論是在真核生物還是原核生物系統中(參見例如14圖1)。該系統也允許產生具有期望的N末端的天然蛋白質。人們可以生產重組蛋白,例如通過將生物的核酸序列插入進外源的宿主生物中。該外源宿主從插入的核酸分子來合成重組蛋白質(所關心的蛋白)。然后生產的蛋白一般在隨后的純化步驟中從該細胞中分離。原核的、真核的、細菌、酵母、昆蟲和哺乳動物細胞都能夠應用于重組蛋白質的表達。人們已經開發出了蛋白"標簽,,,其中將DNA序列插入到編碼所關心的蛋白的區域之前或之后。產生的融合蛋白包含了該標簽和所關心的重組蛋白質。蛋白標簽可以增強所關心的蛋白的溶解性、正確折疊、表達水平和純化能力。在過去數年里已經開發了許多不同的蛋白標簽來增強在細菌大腸桿菌(五.co//)中的蛋白表達和溶解性。這些蛋白標簽包括,不限于,GST(谷胱甘肽S-轉移酶)、MBP(麥芽糖結合蛋白)、Thx(硫氧還蛋白)、NusA、Ub(泛素)和SUMO。雖然這些標簽在細菌中的使用成功,但由于各種局限性,如異源蛋白的低表達量或在Ub或SUMO標簽的情況下由于內源性蛋白酶使得不能保持為融合蛋白,因而它們不能轉移至真核細胞。SUMO蛋白作為融合伙伴無i侖在細菌和真核細胞中都可以大大地增強重組蛋白質的表達水平和質量(參見例如美國專利7060461;美國專利申請公開Nos.20040018591和20060040335;以及PCT/US04/20778)。SUMO家族的蛋白在真核生物蛋白上可以作為細胞調控的一部分天然地加入和除去。SUMO的結構和SUMO蛋白加上和除去的過程在真核細胞中高度保守。SUMO蛋白中高度的的結構保守性引起SUMO融合標簽與外源宿主的內源性SUMO修飾酶類的物種間交叉反應。真核細胞因此能切割SUMO標簽并在很多情況里這導致了標簽和重組蛋白質的分離。從真核細胞中表達并純化"未切割的"或未加工的野生型SUMO融合蛋白經常是不可能的。為了在真核細胞中克服這種"成熟前"標簽切割的障礙而實現增加蛋白產量,新型的SUMO蛋白被設計出來以抵抗內源性SUMO蛋白酶。當前的發現解決了蛋白表達領域的至少四個主要問題。第一,如在上文所述,由于真核細胞中天然存在的水解酶瞬時切割融合鍵而使在真核細胞中使用SUMO、Ub和其它類泛素蛋白融合物受到限制。因為這種切割作用,親和標簽需放于SUMO-水解酶的切割位點之后或在過客蛋白的c末端以幫助純化所關心的蛋白。如果為了融合蛋白的后續應用而需除去該親和標簽,那必須設計蛋白酶位點。在此提出的系統解決了SUMO標簽僅使用于原核系統的局限,因此允許在所有系統包括真核生物系統中使用本發明的突變SUMO蛋白或附著于突變SUMO蛋白氨基端的親和標簽來用于親和純化融合蛋白。在此提供的工程SUMO蛋白酶在體外或體內都可有效地除去該標簽。第二,許多蛋白在真核和原核細胞中不穩定或弱表達。與未融合的蛋白對應物比較(例如見圖3A),甚至與融合于野生型SUMO的蛋白比較(例如見實施例4),與工程SUMO蛋白融合可使蛋白表達明顯升高。另外,如下文所述,與工程SUMO蛋白融合可以有利于所關心的蛋白相對于未融合的蛋白或甚至與野生型SUMO融合的蛋白更高水平地分泌。附著SUMOP分子到所關心的蛋白也可以l吏蛋白穩定。第三,某些蛋白對細胞來說有毒性,特別是在異源表達時。附著SUMO到這些毒性蛋白可以降低或除去該蛋白的毒性并允許更大地和持續地表達以前難于表達的毒性蛋白。例如,在蛋白的氨基未端存在SUMO分子可以抑制定位于該蛋白區域的該蛋白的任何毒性。實際上,如下文實施例4所示,當與工程SUMO融合時,蛋白PLA2,其對細胞是有毒/致死的并且需要游離的N未端以表現活性,可以在真核細胞中高水平表達。在表達和純化時,SUMO分子可從有毒蛋白上切割下來,從而回復其毒性和/或活性。第四,在原核細胞中表達的各種融合物可以在體外或體內被切割而產生新的N未端,這是至今不能產生的,因為自然開始的蛋白質合成只能從甲硫氨酸開始。該系統的這個特征對于那些需要特殊N末端來維持生理和生化活性的蛋白(例如RNA-聚合酶,蛋白酶和細胞因子)是特別有用的。I.定義提供以下定義以利于對本發明的理解在此使用的"核酸"或"核酸分子"指任何DNA或RNA分子,包括單鏈或雙鏈,如果是單鏈,其互補序列分子可以是線型或環型。在討論核酸分子時,在此可能根據從5'至3'方向提供序列的正常習慣描述特定核酸分子的序列或結構。關于本發明的核酸,有時使用術語"分離的核酸"。該術語當用于DNA時,指與在它來源生物的天然存在基因組中與之直接相鄰的序列分離的DNA分子。例如,"分離的核酸"可以包括插入載體,比如質粒或病毒載體,或整合進入原核或真核細胞或宿主生物體的基因組DNA中的DNA分子。當應用于RNA,術語"分離的核酸"可以指由上文定義的分離的DNA分子編碼的RNA分子。或者,該術語也可以指已經充分地與其它核酸分離的RNA分子,所述其它核酸是所述RNA分子在它的自然狀態下(細胞或組織中)與其聯合在一起的。分離的核酸(無論DNA或生產過;呈中出現的組分分離的分子。''、''關于單鏈核酸,特別是寡核普酸,術語"特異雜交"指兩條具有充分互補序列的單鏈核苷酸分子之間的結合,這種充分互補序列允許在本領域常規使用的預定條件下實現雜交(有時又叫做"基本互補")。特別地,該術語指寡核苷酸與包含在本發明單鏈DNA分子中的基本互補序列之間的雜交,以基本排除該寡核苷酸與非互補序列的單鏈核酸域人員所熟知。例如,一種計算具有特定序列同源性的核酸分子之間雜交所需的嚴格條件的通用方程式列在下面(Sambrook等,1989):Tm=81.5°C+16.6Log[Na+]+0.41(%G+C)-0.63(%曱酰胺)-600/雙鏈體中的弁bp如以上方程式所述,使用[Na+]=和50%曱酰胺,42%GC含量以及平均探針大小200石威基,Tm是57。C。同源性每減少1%,DNA雙鏈體的Tm降低l-1.5。C。因此,使用42。C雜交溫度時具有大于約75%序列同一性的靶標將被觀察到。例如,按照Sambrook等的方法,4吏用含5XSSC,5XDenhardt,s試劑,1.0%SDS,100pg/ml變性的鮭精DNA片段,0.05%焦磷酸鈉和最高至50%曱酰胺的雜交液可以完成雜交。雜交在37-42。C下進行至少6小時。雜交后,按以下步驟洗滌濾器:(l)室溫下,在2XSSC和1%SDS中5分鐘;(2)室溫下,在2XSSC和0.1。/oSDS中15分鐘;(3)37。C下,在1XSSC和1%SDS中30分鐘-1小時;(4)42-65°C下,在1XSSC和1%SDS中2小時,17每30分鐘更換溶液。雜交和洗滌的嚴格性主要依賴于溶液的鹽濃度和溫度。通常為了使探針與它的靶標退火率最大,雜交通常在鹽和低于計算的雜合體Tm值20-25。C的溫度條件下進行。洗滌條件應該盡可能嚴格以達到探針對靶標的同一性程度。通常,洗滌條件選擇低于雜合體Tm值大約12-20°C。至于本發明的核酸,中度嚴格性的雜交被確定為在6XSSC,5XDenhardt,s溶液,0.5%SDS和100pg/ml變性鮭精DNA中42°C雜交并在2XSSC和0.5%SDS,55°C洗滌15分鐘。高嚴格性的雜交被確定為在6XSSC,5XDenhardt,s溶液,0.5%SDS和100|ig/ml變性鮭精DNA中42°C雜交并在IXSSC和0.5%SDS中65°C洗滌15分鐘。很高嚴格性的雜交被確定為在6XSSC,5XDenhardt,s溶液,0.5%SDS和100pg/ml變性鮭精DNA中42。C雜交并在0.1XSSC和0.5%SDS中于65。C洗滌15分鐘。在此使用的術語"探針"指寡核苷酸、多核苷酸或DNA分子,不論是天然存在的,如用純化的限制性酶消化獲得,或人工生產的,這種探針能和與之序列互補的核酸退火或特異雜交。探針可以是單鏈也可以是雙鏈。探針的準確長度將依賴許多因素,包括溫度、探針的來源和使用的方法。例如,雖然核苷酸探針可以包含更少的核苷酸,但對于診斷應用,根據靶序列的復雜性,寡核苷酸探針一般包含15-25或更多的核苷酸。在此選取的探針是為了與特定靶核酸序列的不同鏈互補。意思是探針必須有充分的互補性以致于能在一套預先確定的條件下"特異地雜交"它們相應的靶鏈或與它們相應的靶鏈退火。因此探針序列無須反映靶的準確互補序列。例如非互補的核苷酸片段可以連于探針的5'或3,末端,而探針序列的其余部分是與靶鏈互補的。或者,假如探針序列與靶核酸序列有足夠的互補性以至于能與之特異性地退火,非互補堿基或更長的序列可以散布于探針中。在此使用的術語"引物"指DNA寡核苷酸,單鏈或者雙鏈,來源于生物系統,用限制性酶消化產生,或人工生產,當引物被置于合適的情況中時,能作為模板依賴的核酸合成作用的功能性啟動物。當與適當的核酸模板,適當的核酸的三磷酸核苷前體、聚合酶、適當的輔因子和條件如適當的溫度和pH值共存時,引物可以通過聚合酶或類似活性的作用下在它的3,未端加上核苷酸而延伸以得到引物延伸產物。根據本申請的特定條件和要求,引物可以有不同的長度。例如,在診斷應用中,寡核苷酸引物長度一般為15-25或更多的核普酸。引物必須與期望模板有足夠的互補性以啟動期望延伸產物的合成,亦即能與期望模板鏈以足以在適當的毗鄰位置提供引物的3,羥基部分的方式退火,以用于通過聚合酶或類似酶的合成的啟動。并不需要引物序列為期望;f莫板的準確互補序列。例如,非互補的核苷酸序列可以連接于其他方面互補的引物的5,末端。或者,假如引物序列與期望模板鏈序列具有足夠的互補性以能功能性地提供用于合成延伸產物的模板-引物復合物,非-互補堿基可以散布于寡核苷酸引物序列之中。"互補DNA(cDNA),,是單鏈DNA分子,通過逆轉錄酶從mRNA模板形成。一般來說,用與mRNA的部分互補的引物來啟動逆轉錄。術語"cDNA"也可以指雙鏈DNA分子,其由這種單鏈DNA分子和它的互補DNA鏈組成。術語"cDNA,,也可以指從RNA模板合成的cDNA分子的克隆。聚合酶鏈式反應(PCR)在美國專利Nos:4683195,4800195和4965188中已有描述,它們全文通過援引并入本文。術語"相似性百分比"、"同一性百分比"和"同源性百分比"當指特定序列時,按威斯康星大學GCG軟件程序的闡述進行使用。在此使用的術語"功能性的"意思是核酸或氨基酸序列對于所述的檢驗或目的是功能性的。核酸特定序列的"天然等位變異體","突變體"和"衍生體"指與特定序列緊密相關的核酸序列但可能在序列或結構中具有天然地或人為設計的變化。通過緊密相關,表示至少大約75%,但通常超過90%的序列的核普酸與用特定SEQIDNO指代的核酸序列的限定長度相匹配。緊密相關核酸序列之間的核苷酸序列變化或差異可代表在特定核酸序列天然的正常復制(replication)或倍增(duplication)過程中出現的序列中的核普酸改變。其它的變化可以被特異設計并為了達到特定的目的引入序列,以致在核酸的調控區域改變氨基酸密碼子或序列。這種特異改變可以在體外用多種的突變技術產生或者將宿主生物體放在誘導或選擇該變化的特定選擇條件下而產生。這種特異產生的序列變異體可以被稱為原始序列的"突變體"或"衍生體"。短語"基本由......組成"當指特定核苦酸或氨基酸時,意思是具有指定SEQIDNO性質的序列。當用于指氨基酸序列時,該短語包^"序列本身和分子修飾,這種分子修飾不會影響該序列基本的和新的特征。在此使用的術語"復數的啟動子"或"啟動子"指DNA序列,這種DNA序列的位置鄰接于編碼重組產物的DNA序列。啟動子優選可操作地連接于相鄰的DNA序列。與沒有啟動子存在時表達的重組產物的量相比,啟動子一般能增加DNA序列表達的重組產物的量。來自生物體的啟動子可被用于增加來源于另一種生物體的DNA序列的重組產物表達。例如,脊推動物啟動子可以用于水母GFP在脊推動物中的表達。此外,對于多重串接的DNA序列,啟動子元件可提高重組表達產物的量。因此,啟動子元件可增強一種或更多種重組產物的表達。多種啟動子元件已為本領域普通的技術人員所熟知。在此使用的術語"復數的增強子"或"增強子"指DNA序列,該DNA序列的位置與編碼重組產物的DNA序列毗連。增強子元件一般定位錄:翻譯成為重組;i:DNA序一列)。因此,增強子^元件可位于編碼重組產物DNA序列上游或下游100石咸基對、200石成基對或300或更多堿基對處。增強子元件可將從DNA序列表達的重組產物量升高到超過啟動子元件帶來的升高的表達。本領域普通技術人員可容易地利用多種增強子元件。在此使用的術語"轉染的"和"轉染"是指將外源性DNA導入細胞的方法。這些方法涉及多種技術,如用高濃度鹽、電場、脂質體、多聚陽離子微團或去污劑處理細胞,以使得宿主細胞外膜或壁對于所關心的核酸分子是可滲透的。這些特定方法并不受限制,并且本發明涉及本領域普通技術人員熟知的任何轉化技術。"復制子"是指任何遺傳元件,例如,質粒、粘粒、桿粒、噬菌體或病毒,其能在自身控制下大量復制。復制子可以是RNA或DNA,可以是單鏈或雙鏈。"載體"是復制子,如質粒、粘粒、桿粒、噬菌體或病毒,另外的基因序列或元件(DNA或RNA)可以連接于載體上,而4吏連接序列或元件得到復制。"表達操縱子"指核酸片段,該核酸片段可能具有轉錄和翻譯控制序列,如啟動子、增強子、翻譯起始信號(例如ATG或AUG密碼子)、聚腺苷酸化信號、終止子等等,這些表達操縱子有利于多肽編碼序列在宿主細胞或生物體中的表達。在此使用的術語"寡核苷酸"指本發明中的序列、引物和探針,并定義為由兩個或更多核糖核普酸或脫氧核糖核苷酸組成,優選超過三個。寡核苷酸的確切大小將取決于多種因素以及寡核苷酸的特定應用和用途。術語"基本純"指包括按重量計算至少50-60%給定物質的制劑(例如,核酸、寡核普酸、蛋白等等)。更優選地,該制劑包括至少75%以及最優選90-95%比重的給定化合物。純度用適合于給定化合物的方法進行測定(例如色譜法、瓊脂糖或聚丙烯酰胺凝膠電泳、HPLC分析等等)。術語"基因,,指包括編碼多肽的開放閱讀框的核酸,包括外顯子以及(任選)內含子序列。該核酸也可任選包括非編碼序列如啟動子或增強子序列。術語"內含子"指存在于給定基因的DNA序列,該序列不會被翻譯成蛋白并通常的發現在外顯子之間。在此使用的短語"可操作連接的",可以指與另一段核酸序列形成功能關系的核酸序列。可操作連接的核酸序列實例包括,但不局限于,啟動子、切割位點、純化標簽、轉錄終止子、增強子或活化子以及異源基因,當轉錄并如果適合的話翻譯時,其可生產功能性產物如蛋白、核糖酶或RNA分子。短語"可操作連接的"也可以指例如編碼所關心的蛋白的核酸序列,這種核酸序列與編碼Ubl羧基末端結構域的核酸形成功能關系,這樣在蛋白質形成中Ubl羧基末端結構域的催化切割活性能使所關心的蛋白釋放出來。短語"固體支持物"指任何固體表面包括,但不局限,任何芯片(例如基于硅石的、玻璃的或金的芯片)、玻片、膜、珠、固體顆粒(例如瓊脂糖、sepharose、聚苯乙烯或磁珠)、柱子(或柱材料)、試管或微量滴定盤。短語"親和標簽"、"純化標簽"以及"表位標簽"都可以指可用于影響所關心的蛋白純化的標簽。純化/親合/表位標簽為該領域人員所熟知(見Sambrook等,2001,分子克隆,冷泉港實驗室),包括但不局限于多組氨酸標簽(例如6xHis)、多精氨酸標簽、谷胱甘肽-S-轉移酶(GST)、麥芽糖結合蛋白(MBP)、S標簽、流感病毒HA標簽、硫氧還蛋白、葡萄球菌蛋白A標簽、FLAGTm表位,AviTag表位(用于隨后的生物素化)、二氫葉酸還原酶(DHFR)、抗體表位(例如^皮抗體識別并結合的氨基酸序列)、C-myc表位以及血紅素結合肽。在此使用的術語"有毒蛋白"指在宿主細胞中表達時引起細胞死亡或抑制細胞生長的蛋白。在此使用的"指導材料"包括出版物、記錄、圖表或任何表達介質,例如,本i明試劑盒的指導材料可附加^包含本發明試劑盒的容器上以便與包含試劑盒的容器一起運輸。或者,為了指導材料與試劑盒可為使用者協作使用,指導材料可與容器分開運輸。在此使用的術語"修飾的""工程的"或"突變的"指改變的多核苦酸或氨基酸序列。在一種實施方案中,編碼SUMO或SUMO蛋白酶的多核苦酸序列通過導入一個或更多個突變,特別是位點定向突變,而被修飾/工程化/突變。另外,包括至少一個突變的突變多聚核苷酸庫也可以利用隨枳z秀變或DNA改組(shuffling)4支術來制備。在一種特定實施方案中,隨機誘變被限制于多核苷酸的期望區域,特別是被認為是編碼負責SUMO和SUMO蛋白酶相互作用的氨基酸的區域。常規的誘變技術在CurrentProtocolsinMolecularBiology,Ausubel,F.等eds.,JohnWiley(2006)和美國專利5605793;5811238;5830721;5834252和5837458中進行了描述。在此使用的"突變"或"改變"指與天然存在或正常核苷酸或氨基酸序列相比,在基因的核苷酸或氨基酸序列中的變化。突變可以是由于至少一個核苷酸或氨基酸的缺失、插入或取代引起。在一種優選實施方案中,突變是取代,即用不同的核苷酸或氨基酸殘基替代至少一個核苷酸或氨基酸。在此使用的術語"結構域"意思是蛋白或多肽的功能部分、節段或區域。"相互作用結構域"專門指蛋白、多肽或蛋白片段的部分、節段或區域,它是造成該蛋白、蛋白片段或分離的結構域對于另一種蛋白、蛋白片段或分離的結構域的物理親合力的原因。在蛋白的一級序列中,相互作用結構域可以是連續的氨基酸殘基,也可以由在一級序列互相不接近,但是會通過肽鏈三級折疊聚在一起的肽鏈部分的氨基酸殘基組成。22在此使用的術語"多克隆位點"或"多接頭,,指人為生成的核苷酸序列,該核香酸序列包括至少一個限制性位點以將核酸片段克隆入另一核酸,如載體之中。II.工程SUMO蛋白本發明包括了不能被SUMO蛋白酶(例如Ulpl)切割的SUMO蛋白。該SUMO可來自于任<可真核生物物種或為<壬何SUMO分子的突變形式。在一種特定實施方案中,SUMO來源于酵母或人。與酵母相對,在脊推動物中,迄今已描述了SUMO的四個成員SUMO-l和接近的同系物SUMO-2、SUMO-3和SUMO-4。本發明包括了所有的這些脊推動物SUMO蛋白。SUMO蛋白的實施例在圖11A-11C中4是供。編碼人SUMO蛋白的核酸序列的實施例也在GenBank登錄號NM—003352.4(SUMOl)、NM—001005781.1(SUMOl)、NM_001005782.1(SUMOl)、NM—006937.3(SUM02)、NM—001005849.1(SUM02)、NM—006936.2(SUM03)和NM—001002255.1(SUM04)中4是供。在一種特定實施方案中,本發明的工程SUMO蛋白僅能被SUMO蛋白酶切割小于10%,而該酶在相同的的反應條件(例如標準體外切割實驗或在真核細胞中表達)下可切割至少90%,優選至少95%,更優選至少99%以及更優選100%的野生型SUMO。在一種更優選實施方案中,工程SUMO會被切割小于5%,優選小于1%,更優選小于0.1%,甚至0%或低于檢測水平。如下文所討論,工程SUMO蛋白可以被工程SUMO蛋白酶切割。工程SUMO蛋白可以通過改變或轉變至少一個與SUMO蛋白酶相互接觸或互相作用的殘基而產生。該殘基可以被改變為任何其它的20種天然氨基酸或改變為合成或修飾的氨基酸(參見例如MPEP§2422表4)。該變化可以為保守的或非保守的。保守的變化是用擁有類似性質的氨基酸替代。例如天冬氨酸和谷氨酸都是酸性氨基酸;賴氨酸、精氨酸和組氨酸是堿性氨基酸;天冬酰胺、谷氨酰胺、絲氨酸、蘇氨酸和酪氨酸具有無電荷的極性側鏈;丙氨酸、甘氨酸、纈氨酸、亮氨酸、異亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸和半胱氨酸具有無極性的側鏈;丙氨酸、甘氨酸和亮氨酸是小氨基酸;苯丙氨酸、酪氨酸和色氨酸具有大的芳香族側鏈;苯丙氨酸、酪氨酸、色氨酸、纈氨酸、異亮氨酸基和蘇氨酸具有大的無電荷側鏈。因此,用谷氨酸替代天冬氨酸可以被認為是保守的變化,用組氨酸替代天冬氨酸則不能認為是保守改變。在一種特定實施方案中,造成的改變在與SUMO蛋白酶互相作用的區域之內。如圖ll所示,與SUMO蛋白酶相互作用的SUMO區域通常在從大約殘基53到大約殘基72的區域之內。例如對于酵母SUMO(Smt3)該區域為從大約殘基63到殘基72。在一種特定實施方案中,改變至少一個精氨酸殘基,優選兩個精氨酸殘基(或更多,如果有的話)(例如在Smt3中,在SUMO蛋白酶相互作用結構域中的精氨酸殘基位于64和71位)。在一種優選實施方案中,精氨酸殘基^皮改變為非堿性氨基酸。在一種特定實施方案中,在64位的精氨酸被改變為蘇氨酸以及在71位的精氨酸被改變為谷氨酸。該構建體是SUMO*,具有以下的氨基酸序列(SEQIDNO:1):MetSerAspSerGluValAsnGin15GluValLysProGluThrHislie20SerGluliePhePheLyslieLys3540MetGluAlaPheAlaLysArgGin5055PheLeuTyrAspGlylieGlulie6570LeuAspMetGluAspAsnAsplie85GlyGlyGluAlaLysProGluValLysPro1015AsnLeuLysValSerAspGlySer2530LysThrThrProLeuArgArgLeu45GlyLysGluMetAspSerLeuThr60GinAlaAspGinThrProGluAsp7580lieGluAlaHisArgGluGinlie9095在另一個實施方案中,本發明的工程SUMO與SEQIDNO:1具有至少75%、80%、85%、90%、95%、97%、99%或100%的同源性,特別是至少90%或95%同源性。在一種特定實施方案中,64和71位的殘基都不是精氨酸。在另一個實施方案中,本發明的工程SUMO是SUMO蛋白(例如酵母SUMO(Smt3)或人SUMOl),這種蛋白被改變以包括序列(SUMO蛋白酶相互作用結構域)XiFXAX-GXA(SEQIDNO:2)其中Xj口X6是除了精氨酸的任何氨基酸,X2、X3、X4和X5是任何氨基酸并可以是野生型(即未突變的)。在一種特定實施方案中,X!和X6是任何非堿性氨基酸。在一種優選實施方案中,X2是L或R;X3是F、W或Y,X4是D或E;Xs是I、Q或R。在一種特定實施方案中,Xi是在谷氨酰胺、蘇氨酸和苯丙氨酸之中選擇,和/或X6是在71位的亮氨基酸和谷氨酸之中選擇。在另一個實施方案中,本發明的工程SUMO是SUMO蛋白(例如人SUM02,SUM03和SUM04),這種蛋白被改變以包括序列(SUMO蛋白酶相互作用結構域)X!FX2F(SEQIDNO:65)其中X!和X2是除了精氨酸的任何氨基酸。在一種特定實施方案中,Xi和X2是任何非-堿性氨基酸。在一種特別的實施方案中,Xi是具有無電荷側鏈的氨基酸,特別是蘇氨酸,X2是酸性氨基酸,特別是谷氨酸。優選地,工程SUMO蛋白保留了至少一種野生型SUMO的性質。例如,優選地該工程SUMO與野生型SUMO—樣或更好地增加融合的所關心的蛋白的表達量。該工程SUMO也可以提高所關心的蛋白的分泌和/或溶解性,和/或改變融合的所關心的蛋白的細胞定位。本發明也包括了編碼不能被切割的SUMO蛋白的核酸分子。編碼本發明工程SUMO的核酸分子可以通過任何該領域已知的方法制備。該核酸分子可以在任何方便的載體中保存,特別是表達載體。根據表達核酸的宿主細月包,可應用不同的啟動子以驅動該核酸序列的表達。這些載體也包含抗生素抗性標識物以能夠選擇轉化細胞。本發明編碼工程SUMO的核酸分子包括cDNA、DNA、RNA和其片段,這些分子可以是單鏈或雙鏈。本發明也包括引物、寡核苷酸、探針、反義分子和siRNA分子,其定向于(directedto)編碼工程SUMO蛋白的核酸分子或與之雜交,優選定向于從野生型序列突變的區域,這樣相對于野生型SUMO它們能優先或排他地與突變SUMO雜交。本發明也包含能夠免疫特異地結合工程SUMO蛋白的抗體。定向于工程SUMO的多克隆和單克隆抗體可以按照標準方法制備。在一種優選實施方案中,相對于野生型SUMO,該抗體與突變的不可切割的SUMO的改變區域進行免疫特異性地反應。與突變的不可切割的SUMO蛋白進行免疫特異性作用的多克隆或單克隆抗體能被應用于鑒定和純化這些蛋白。抗體可以是對工程SUMO具有免疫特異性而排25除了野生型SUMO或者可以具有對兩者的交叉反應性。本發明的工程SUMO蛋白也可以被翻譯后修飾。工程SUMO蛋白可以在細胞中或體外進行翻譯后修飾。氨基酸的翻譯后修飾(PTM)可改變蛋白的結構、活性、功能和穩定性。PTMs通常包括添加生化官能團如,但不局限于,乙酸酯、磷酸酯、脂類和糖類到蛋白的氨基酸上。蛋白的翻譯后修飾方法可以通過變更蛋白氨基酸序列而改變。例如變更蛋白的氨基酸序列而使之含有Asn-X-Ser或Asn-X-Thr序列可以使天冬酰胺被糖基化。PTMs包括,^旦不局限于,乙酰化(添加乙酰基,通常在蛋白的N末端)、烷化(添加烷基(例如甲基、乙基))、曱基化(添加曱基,通常加在賴氨酸或精氨酸殘基上)、生物素化(保守的賴氨酸殘基與生物素附加物的酰化)、谷氨酰化(共價連接谷氨酸殘基到微管蛋白或其它蛋白)、甘氨酰化(共價連接至少一個甘氨酸殘基到微管蛋白C末端的尾部),糖基化(添加糖基基團至天冬酰胺、羥基賴氨酸、絲氨酸或蘇氨酸上,從而產生糖蛋白)、異戊二烯化(添加類異戊二烯基團(例如金合歡醇和櫳牛兒基雜牛兒醇(geranylgeraniol)))、脂化(添加脂類)、硫辛酰化(lipoylation)(連接硫辛酸酯(lipoate)官能團)、磷酸泛酰巰基乙胺化(phosphopantethdnylation)(添加源于輔酶A的4'-石粦酸泛酰巰基乙胺(phosphopantetheinyl)部分,如在脂肪酸、聚酮化合物、非核醣體多肽和亮氨基酸生物合成中)、磷酸化(添加磷酸酯基,通常到絲氨酸、酪氨酸、蘇氨酸或組氨酸上),硫酸化(添加硫酸酯基到酪氨酸)、硒酸化和C末端酰胺化。翻譯后修飾為本領域技術人員所熟知(見例如Creighton,T.E.,蛋白-結構和分子性質.第二版,W.H.Freeman和Company,紐約,1993;Wold,F.,蛋白的翻譯后共價修飾,AcademicPress,紐約.1983;Seifter等,"蛋白質修飾和非蛋白質輔因子的分析,,(1990)Meth.Enymol.,182:626-646;以及Rattan等"蛋白質合成:翻譯后修飾和老化"(1992)Ann.N.Y.Acad.Sci.,663:48-62)。本發明的工程SUMO蛋白可以包括至少一個親和標簽,優選在氨基未端。在一個特定實施方案中,親和標簽是血紅素結合肽。全長細胞色素C(CYC7,GenBank登錄號AAA34940)—旦與血紅素輔因子結合就具有過氧化物酶活性(SanderC.C型細胞色素的轉運和成熟。Ph.D.學位論文。2001.Osnabrueck大學,德國)。包含細胞色素C,如CYC7,的血紅素結合基序的肽可作為本發明工程SUMO蛋白或任何所關心的蛋白的親和標簽。示范性的血紅素結合肽包括血紅素結合基序CQQCH(SEQIDNO:63)。血紅素結合肽的特定實施例是GSAKKGATLFKTRCQQCH(SEQIDNO:64)。血紅素結合肽可以為大約5至大約50個氨基酸的長度,優選大約5至大約25個氨基酸長度,更優選大約5至大約20個氨基酸長度,以及更優選大約5至大約15個氨基酸。血紅素結合肽具有過氧化物酶活性。值得注意的是,將該肽進行變性SDS-PAGE分析以及印跡到膜時,其活性不會被破壞。因此,該親和標簽可以不用抗體檢測而僅使用過氧化物酶底物。另外,血紅素結合肽引起共價結合的所關心的蛋白變紅,使之在純化過程中容易^r測和跟蹤。血紅素結合肽對于細胞色素裂解酶(CYC3,例如,GenBank登錄號AAC04992.l)具有很高的結合親合力。CYC3可以固定在固體表面并用作純化包含血紅素結合肽的蛋白的親合樹脂。III工程SUMO蛋白酶本發明也包含工程SUMO蛋白酶,該蛋白酶可切割不能被野生型SUMO蛋白酶切割的工程SUMO蛋白。SUMO蛋白酶可來自于任何真核生物物種。在一種特定實施方案中,SUMO蛋白酶與期望被切割的工程SUMO來自相同的物種。SUMO蛋白酶的實例包括ULPl和SENP1至5以及圖12A-12B中提供的某些氨基酸序列。在一種特定實施方案中,本發明的工程SUMO蛋白酶可切割至少50%,優選至少75%,90%,或95%,更優選至少99%以及更優選100%的工程SUMO。工程SUMO蛋白酶可以通過變更或轉變至少一個與野生型SUMO或工程SUMO接觸或互相作用的殘基而產生。該殘基可以#皮改變至任何另外的20個天然氨基酸或改變為合成或修飾的氨基酸。該變化可以是保守的或非保守的。在一種特定實施方案中,是在SUMO蛋白酶的SUMO相互作用結構域之內進行改變(參見例如圖12)。例如,酵母ULP1的SUMO相互作用結構域大約對應于殘基446至460,更優選大約451至455。在一種特定實施方案中,殘基451、452以及455中的至少一個被改變。優選地,至少殘基451和455被改變,更優選所有的三個氨基酸27都被改變。特別地,451位天冬氨酸被改變為絲氨酸,452位的蘇氨酸殘基被改變成甘氨酸以及455位的谷氨酸殘基被改變為絲氨酸。該構建體具有以下氨基酸序列(SEQIDNO:3):61121181241301361421481541601msvevdkhrnrfnylndrrvveasgnsdvestspisslasafirkkkvakkdtglkksiilkfdrsilefsrentergyqgvrrwsfailtdlqkykda工rmrrftlqyhkknpylsmeesmkdgsrssgsrssdQKSNCDSDNSQNINNTKLVSDLTEKIKTIIiekdfkryneidnieitvrdfmkrkktqidkyvmeeskhtiiahliltdalsplfspistysdraskagfivpyglrenysitfsrdpfgwraqseevtylienni髓:lqtlnerkkiqedktlaprrwlnldkiftpinlgedfdlihldkrcyprvlnnpGGIRETLWNSsdtrkhkfdtnkwktsaigs即fngeykvrnendddlvflkkk卿laksgiisftmkynqshwalgiicpqqpngydcsesrrsasfsGKYl;WHTFVKSTWALPNKRRNSENNTSDQKpkilkeerervkekkisslekklvpelnekiekstpntvadlkkktigyvgiyvcmntlygiykkrtntsneprnfdgseriesegvgtpnsydrrqygtqlk:lmdmdkerkhkdylnqk'dddqvqkalafnsffyt肌sdslsngpnamgsadapldfd在一種特定實施方案中,SUMO蛋白酶可能具有氨基未端或在其之內的缺失(例如,最多至并包括殘基402)。截短的SUMO蛋白酶的氨基酸序列例子是(SEQIDNO:4):401mglvpelnekdddqvgkala421srentqlmnrdnieitvrdfktlaprrwlnsgiisff"mkyiekstpntvafnsffytnls481ergyqgvrrwmkrkktqidkldkietpinlnqshwalgiidlkkktigyvdslsngpnam541se7ultdlqkyvmeeskhtigedfdlihldcpqqpngydcgiyvcmntlygsadapldfd601ykdairmrrfiahliltdalkSUMC^蛋白酶1是具有6x組氨酸標簽的截短的SUMO蛋白酶,具有氨基酸序列(SEQIDNO:5):401mglvpelnekdddqvqkala421srentqlmnrdnieitvrdfktlaprrwln481ergyqgvrrwmkrkktqidkldkiftpinl541sfailtdlqkyvmeeskhtigedfdlihld601ykdairmrrfiahliltdalklehhhhhhsgiisftmkyiekstpntvafnsffytnlsnqshwalgiidlkkktigyvdslsngpnamcpqqpngydcgiyvcmntlygsadapldfd在另一個實施方案中,本發明的工程SUMO蛋白酶與SEQIDNO:3、4或5具有至少75%、80%、85%、90%、95%、97%、99%或100%的同源性,特別至少有90%或95%的同源性。在一種特定實施方案中,451位的殘基不是天冬氨酸,更優選不是酸性氨基酸;455位的殘基不是谷氨酸,更優選不是酸性氨基酸;并且任選地,452位的殘基不是蘇氨酸。在另一個實施方案中,本發明的工程SUMO蛋白酶是已經被工程化而包括以下序列的SUMO蛋白酶WLNX'XaXAXs(SEQIDNO:6)其中Xi和Xs是任何非酸性氨基酸,X2、X3和X4被任何氨基酸并可以是野生型(即未突變的)。在一種特定實施方案中,Xi是無電荷的極性側鏈氨基酸、非極性側鏈氨基酸或小氨基酸。Xs可以是無電荷極性側鏈氨基酸、非極性側鏈氨基酸或小氨基酸。在另一個實施方案中,X3是I或V,X4是I或T。在一種特定實施方案中,Xi是絲氨酸;X2選自甘氨酸和蘇氨酸;和/或Xs從絲氨酸、丙氨酸和甲硫氨酸中選擇。本發明也包括了編碼工程SUMO蛋白酶的核酸分子。編碼本發明工程SUMO蛋白酶的核酸分子可以通過任何該領域已知的方法制備。該核酸分子可以在任何方便的載體中保存,特別是表達載體。根據表達核酸的宿主細胞,可應用不同的啟動子以驅動該核酸序列的表達。這些載體中也包含抗生素抗性標識物以能夠選擇轉化細胞。本發明編碼工程SUMO蛋白酶的核酸分子包括cDNA、DNA、RNA和其片段,這些核酸可以是單鏈或雙鏈的。本發明也包括定向于編碼工程SUMO蛋白酶的核酸分子或與之雜交的引物、寡核苷酸、探針、反義分子和siRNA分子,優選定向于從野生型序列突變的區域,這樣該核酸分子與野生型SUMO蛋白酶相比優先或排他地結合工程SUMO蛋白酶。本發明也包含能夠免疫特異結合工程SUMO蛋白酶的抗體。定向于工程SUMO蛋白酶的多克隆和單克隆抗體可以按照標準方法制備。在一種優選實施方案中,相對于野生型SUMO蛋白酶,該抗體能與工程SUMO蛋白酶的改變區域進行免疫特異性反應。能與工程SUMO蛋白酶進行免疫特異性反應的多克隆或單克隆抗體能被應用于鑒定和純化這些蛋白。抗體可以是對工程SUMO蛋白酶具有免疫特異性而排除了野生型SUMO蛋白酶或者可以對兩者都具有交叉反應性。本發明的工程SUMO蛋白酶也可以#皮如上文所述的翻譯后纟務飾。工程SUMO蛋白酶可以在細胞內或體外進行翻譯后修飾。本發明的工程SUMO蛋白酶可以包括至少一個親和標簽,優選在氨基末端。在一種特定方案中,親和標簽是血紅素結合肽,如上文描述。IV.使用方法.本發明的融合蛋白工藝在蛋白和肽的生產和純化上有若干應用。使用該工藝的示例方法包括但不局限于(1)通過將C-末端融合至工程SUMO蛋白以增強蛋白和肽(所關心的蛋白)的表達,特別是那些弱表達的蛋白和肽。無論在原核生物(例如大腸桿菌;參見圖2)或真核細胞(酵母和昆蟲細胞;參見圖3)中,SUMO-融合蛋白結構在表達過程中不會被切割,除非工程SUMO蛋白酶也被轉化進入該細胞。作為例子的所關心的蛋白包括,但不局限于多聚蛋白、細胞因子、疫苗、酶、生長因子、受體、干擾素、造血劑(hematopoeiticagents)、白蛋白、胰島素和激素。(2)工程SUMO蛋白可與親和標簽融合。優選地,親和標簽置于工程SUMO的氨基末端而所關心的蛋白加至工程SUMO蛋白的羧基末端。親和標簽允許融合蛋白的純化,再通過用本發明的工程SUMO蛋白酶切割該工程SUMO而獲得所關心的蛋白。(3)該工程SUMO可用于純化所關心的蛋白,即,沒有親和標簽。工程SUMO可連接于所關心的蛋白的N末端。融合蛋白被表達后可通過特異結合工程SUMO的試劑,如免疫特異性抗體加以純化。然后所關心的蛋白可用本發明的工程SUMO蛋白酶而從融合蛋白中切割出來。(4)工程SUMO蛋白酶可以用于在體外切割包含工程SUMO的融合蛋白。例如,當融合蛋白通過與SUMO或親和標簽(如果有的話)的相互作用而被結合到固體支持物上時,切割可以在溶液中發生。(5)可通過用帶有特異結合工程SUMO和/或SUMO蛋白酶的試劑,如免疫特異性抗體的固體支持物與反應混合物接觸而將工程SUMO和SUMO蛋白酶從含工程SUMO的融合蛋白的切割后混合物,其還可能含,親,標簽,,除去。、、—、。可通過用帶有親和配體的固體支持物與反應混合物接觸而從切割后的混合物中除去(例如帶六個組氨酸標簽的工程SUMO或SUMO蛋白酶可使用金屬螯合親和層析除去)。(7)本發明可產生在氨基末端帶有任何氨基酸的所關心的蛋白。例如,可以產生所關心的蛋白連接至工程SUMO的羧基末端的融合蛋白。編碼所關心的蛋白氨基末端殘基的密碼子可通過定向誘變加以變更以編碼期望氨基酸或產生包括超過一種的突變密碼子編碼的氨基酸的庫。在連接至工程SUMO的前后都可誘變。在融合蛋白,任選包含親和標簽,表達之后,可在體內或體外使用工程SUMO蛋白酶來從融合蛋白上切割工程SUMO而釋出具有改變的氨基末端的所關心的蛋白。(8)包括工程SUMO的融合蛋白可在原核和/或真核細胞中表達以產生肽文庫。(9)包含連接至所關心的蛋白和任選親和標簽的工程SUMO的融合蛋白可以在原核和/或真核細胞中表達以產生肽文庫。表達蛋白庫可通過工程SUMO或親和標簽得以純化。任選地,工程SUMO和親和標簽(如果有)可以用工程SUMO蛋白酶從融合蛋白上切割下,以通過將庫與切割下的標簽相分離以產生純蛋白或肽庫。(10)可以制備包括工程SUMO和任選親和標簽的融合蛋白cDNA文庫。這些cDNA文庫可以用于在任何宿主中表達融合蛋白。(11)包括工程SUMO和任選親和標簽的表達的融合蛋白也可以固定于固體支持物上。在一種特定實施方案中,融合蛋白包括了所關心的蛋白庫并在固體支持物上排成陣列。融合蛋白可以通過SUMO標簽或親和標簽而固定至固體支持物上。產生的陣列可以用于,例如檢測和/或定量蛋白與固定的所關心的蛋白質的相互作用。V試劑盒本發明也包括用于增強所關心的蛋白的表達、分泌、純化、定位和氨基末端變更的試劑盒。這些試劑盒包括至少一種重組載體,該重組載體包含編碼工程SUMO的核酸序列,這段核酸序列可操作地連接適于在期望宿主細胞中表達的啟動子以及適合克隆與編碼工程SUMO核酸序列符合讀框的編碼所關心的蛋白的核酸的多克隆位點。啟動子優選強啟動子并可以是構成型的或調節的。這種啟動子為本領域人員所熟知,包括但不局限于CMV、RSV、SV40、ADH1、T7和CUP1啟動子。重組載體也可以包含與編碼工程SUMO的序列符合讀框的編碼至少一種親和標簽的核酸序列。優選地,編碼親和標簽的核酸序列是可操作地連接于編碼工程SUMO的序列的5,末端。試劑包括但不限31于至少一種固體支持物(例如,能夠結合至少一種親和標簽的固體支持物),裂解緩沖劑、洗滌緩沖劑和洗脫緩沖劑也可以包括在試劑盒中以輔助表達的融合蛋白的純化。試劑盒可以進一步包括至少一種工程SUMO蛋白酶,用于切割工程SUMO。該工程SUMO蛋白酶可以按編碼該工程SUMO的核酸分子(例如表達載體)的形式和/或已表達蛋白的溶液的形式來提供。工程SUMO蛋白酶也可任選地帶有親和標簽,該親和標簽可以與附著于工程SUMO的親和標簽相同或不同。該試劑盒也可以進一步包括至少一種切割緩沖劑、冷存的宿主細胞和/或指導手冊。試劑盒也可以進一步包括用于改變編碼所關心的蛋白的核酸以產生不同于天然野生型蛋白的氨基末端的試劑。用于改變核酸的方法為本領域人員所熟知,包括但不局限于位點定向突變和基于寡核苷酸的位點定向突變(例如見Ausubel等,eds.,2006,CurrentProtocolsinMolecularBiology,JohnWileyandSons,Inc.)。示范'I"生"i式劑包^^旦不局限于DNA聚合酶、PCR緩沖劑和dNTPs溶液。提供以下實施例來舉例說明本發明的各種實施方案。這些實施例是為例示性的而不是以任何方式限制本發明。實施例I材泮牛和方法為了在同一個大腸桿菌細胞中共表達SMT3-GFP和ULPl蛋白酶,使用引物23(5,-GGCGCTCGAGTCCCGCGAAATTAATACGACTCA陽3,;SEQIDNO:7)和46(5,-CGCAAAGCTTGAGCTCTTACTTGTACAGCTCGTCCATGCCGA-3,;SEQIDNO:8),從pET24d-Smt3-GFP載體中擴增T7-SMT3-GFP盒(Malakhov等(2004)J.Struct.Funct.Genomics,5:75-86),用Xhol和Hindlll消化后插入用Xhol和Hindlll切割的pACYC177載體(GenBank登錄No.X06402)中。該操作用SMT3-GFP表達盒置換了pACYC177中的Kan抗性基因,生成pACYC-SMT3-GFP載體。將pACYC-SMT3-GFP轉化進入BL21(DE3)感受態細胞中。帶有pACYC-SMT3-GFP的細胞在含氨芐青霉素的培養基上培養并使用標準氯化鈣方法制成感受態。用另一個攜帶在可誘導T7啟動子之下的ULP1蛋白酶的載體,pET24-ULPl,如之前所述(Malakhov等(2004)J.Struct.Funct.Genomics,5:75-86),轉化這些感受態細胞。轉化子在含有氨卡青霉素和卡那霉素的LB培養基上篩選。當用IPTG誘導時,在共表達ULP1蛋白酶的細胞中的SMT3-GFP融合物被處理成為SMT3(20kD)和GFP(28kD)。而不共表達ULP1的細胞產生全長SMT3-GFP融合物,大小為48kD。為了隨機化位置R64和R71,使用pACYC-SMT3-GFP作為模板產生兩個重疊的PCR產物。用引物23和80(5,-AATACCGTCGTACAAGAANNNTAAGGAGTCCA-3,;SEQIDNO:9)進行第一個PCR,用引物79(5,-TCTTGTACGACGGTATTNNNATTCAAGCTGATCAGA-3';SEQIDNO:10)和46進行第二個PCR。兩個PCR片段進行凝膠分離,混合并作為使用引物23和46進行第二輪PCR的模板。結果產生的突變SUMO-GFP片段庫被克隆進入用XhoI-HindIII消化的pACYC177載體。連接混合物被轉化進入帶有pET24-ULP1質粒的BL21(DE3)感受態細胞。為了選擇工程SUMOs,轉化的菌落在補充有氨芐青霉素和卡那霉素的LB培養基中培養至OD值為0.5,然后用lmMIPTG誘導。誘導在20。C持續12小時。收獲以后,冷凍細胞并存儲于-8(TC。使用pH8.0含lmMEDTA和1單位/ml溶菌酶的10mMTRIS緩沖液重懸沉淀。在室溫下孵育10分鐘后,加入MgCl2至終濃度10mM,并加入DNaseI至10單位/ml的濃度。10分鐘孵育之后,在樣品中加入lpl染料并加在無十二烷基硫酸鈉(SDS)的12%天然聚丙烯酰胺凝膠上。凝膠在15V/cm下電泳1小時并在365nM紫外匣中觀察。圖7中展示的|3內酰胺酶構建體用下列方式產生。使用寡聚引物對65(5,-33CGCGACATATGAGGGTGCTTGTACTAGCTCTTGCTGTGGCTCTCGCAGT-3,;SEQIDNO:11)/61(5'-CGCGAGGTCTCAACCTCCAATCTGTTCGCGGTGAGCCT-3,;SEQIDNO:12)和66(5,-CGCGCAGGTCTCTAGGTAGGGTGCTTGTACTAGCTCTTGCTGTGGCT-CTCGCAGT-3,;SEQIDNO:13)/61或67(5,-CGCGCAGGTCTCTAGGTCCTAGGGTGCTTGTACTAGCTCTTGCTGTGGCTCTCGCAGT-3';SEQIDNO:14)/61進行兩個連續的PCR反應擴增P-內酰胺酶基因,使(3-內酰胺酶使用脯氨酸作為開端。產生的(3-內酰胺酶具有15個氨基酸的分泌信號與卩-內酰胺酶開放閱讀框(ORF)融合。使用寡核普酸26(5,TGTACAGAGCTCACGCGTGCATGCTCGGACTCAGAAGTCAATCA-3,;SEQIDNO:15)和61擴增突變的SUMO。產生的SUMO和卩-內酰胺酶PCR產物用Eco311限制性核酸內切酶進行消化并連接在一起。連接產物作為用引物26和59(5,-CGCGAGTCGACTTACCAATGCTTAATCAGTGAGGCA-3,;SEQIDNO:16)進行PCR反應的模板,產生融合產物(突變SUMO)-(分泌信號)-(P-內酰胺酶)。為了加入不溶蛋白MMP13至突變SUMO的N末端,表達盒內的MMP13的ORF連同T7啟動子用寡核苷酸60(5,-GGCGAAGCTTTCCCGCGAAATTAATACGACTCA-3,;SEQIDNO:17)和35(5,-CGCAGCATGCGGGGTCTTCATCTCCTGGACCA-3,;SEQIDNO:18).從p24d-MMP13載體中擴增。產生的產物T7-MMP13用HindIII和SphI消化,在三段連接中連同用Sphl-Sall消化的(突變SUMO)-(分泌信號)-((3內酰胺酶)一起克隆進入用HindIII-SalI消化的pACYC184中。這樣就產生pACYC-mutSUMO-Lac質粒。為了產生在阿拉伯糖可誘導啟動子P-BAD下的ULP1表達載體,在pET24d-ULPl中的Lacl基因與T7啟動子用AraC基因和P-BAD啟動子加以置換。特別地,將pBAD/His/A載體(Invitrogen)用Ncol和Accl消化,并將帶有araC基因和P-BAD啟動子的片段進行凝膠分離。該片段連接進入用Ncol-Accl消化的pET24d-ULPl載體中,產生pARA-6His-ULP質粒。為了誘變ULPl,該基因的5'端用寡核苷酸88(5,-GGAATTAACCATGGGTCATCACCATCATCATCACGGAGGT-3,;SEQIDNO:19)和91(5'-TTAGCCATCTTCGTGGTGCCAAGGTCT-3,;SEQIDNO:20),進行擴增,而3'部分用寡核苷酸191(5,-AAGACCTTGGCACCACGAAGATGGCTAAATNNNNNNATCATTNNNTTTTTTATGA-3';SEQIDNO:21)和89(5,-GTGGTGCTCGAGTCATTTTAAAGCGTCGGTTA-3';SEQIDNO:22),或192(5,-AAGACCTTGGCACCACGAAGATGGCTAAATNNNNNNNNNNNNNNNTTTTTTATGA-3,;SEQIDNO:23)和89進行擴增導入突變。5,和3'部分進行凝膠分離并在第二輪PCR中作為模板,用引物88和89來擴增誘變的ULP1(即突變SUMO蛋白酶)。PCR產物用Ncol和Xhol消化并克隆進入pARA-6His載體。突變SUMO蛋白酶庫被轉化進入帶有pACYC-mutSUMO-Lac質粒的感受態TOP10大腸桿菌中。在42。C熱激之后,細月包在2xYT培養基中37。C復活1小時。然后加入四體積的LB培養基并在37。C攪拌2小時。將細胞平板接種于補充了34mg/L氯霉素、50mg/L卡那霉素、50mg/L氨千青霉素和0.02%阿拉伯糖的LB平板上。帶有未突變的Ulpl基因的質粒不支持在氨爺青霉素上生長。將生長起來的陽性突變克隆測序并用于蛋白酶純化以用于體外切割。突變SUMO蛋白酶用標準Ni-sepharose法純化并在前述的標準切割反應(Marblestone等(2006)ProteinSci.,15:182-9)中使用。(突變SUMO)-GFP作為切割反應的底物。潛^當SUMO蛋白作為融合伙伴與所關心的蛋白連接時,無論在細菌和真核細胞中,它都可以大大增強重組蛋白質的表達水平和質量(參見圖2和圖3A;Malakhov等(2004)J.Struct.Funct.Genom.,5:75-86)。SUMO家族蛋白作為細胞調控的部分在天然狀況下能加在真核生物蛋白上并能從上面除去。SUMO的結構和SUMO蛋白添加和除去的過程在真核細胞中高度保守。SUMO蛋白在結構上的高度保守使SUMO融合標簽與外源宿主的內源性SUMO修飾酶類有交叉物種反應。因此,真核細胞能切割SUMO標簽并且這種切割通常引起標簽從重組蛋白上分離。從真核細胞表達并純化"未切割的"或未加工的野生型SUMO融合蛋白因此是不輕易可能的。為了在真核細胞中提高蛋白產量,克服"成熟前"標簽被切割的障礙,新的SUMO蛋白,叫SUMO*,被設計出來以抵抗內源性的SUMO蛋白酶。釀酒酵母(Saccharomycescerevisiae)基因SMT3被用作遺傳基礎以開發這種SUMO標簽。在評估Smt3的晶體結構以及它相應的蛋白酶Ulpl(蛋白數據庫弁1EUV)(圖4)之后,誘變處理Smt3蛋白可能與Ulpl進行相互作用的區域(圖5)。首先,使用常規PCR突變技術隨機化編碼氨基酸64-71的區域。然后,因為在位置64和71的精氨酸(R64和R71)直接面對Ulpl(圖4A和4B),使用PCR突變法特異地突變這些殘基。產物SUMO-GFP突變體用新的體內切割檢-驗,即用Ulp1轉化大腸桿菌,進行篩選。在大腸桿菌內存在ULP1時也不體內切割的突變體包括在64位用蘇氨酸(theronine)代替精氨酸以及在71位用谷氨酸代替精氨酸。在此涉及的這個特別的突變體為SUMO*。在下面的表1中提供了某些SUMO突變體。<table>tableseeoriginaldocumentpage36</column></row><table>表1-某些SUMO突變體在R64和R71位上的氨基酸變化以及它們能-陂ULPl切割的能力。如圖3A和3B所示,分別使用酵母和昆蟲SUMO蛋白酶都能幾乎完全地切割SUMO-GFP,而SUMO*-GFP則不凈皮切割。另外,與未加標簽的GFP相比(比較泳道1和2與5和6),SUMO+融合物大大的增強了GFP的表達。純化SUMO*-GFP并用于體外的切割反應。測定了SUMO蛋白酶l(Ulpl)和SUMO蛋白酶2(SENP2)(圖6)。兩種蛋白酶均不能切割SUMO,圖6)。實際上,有SUMC^標簽的融合物用最高至完全切割SUMO所需酶濃度1000倍的增加量的Ulp1進行孵育,仍沒有檢出切割(圖10)。另外,當SUMO氣GFP在酵母或昆蟲細胞中表達時,該突變標簽,不像野生型Smt3標簽,是不會被這些生物的天然SUMO蛋白酶所切割的(圖3)。最理想的融合標簽,必須能在隨后的純化步驟中被除去,而只剩下所關心的蛋白。為了設計能切割SUMO+標簽的蛋白酶,篩選了水解酶的在大腸桿菌中從它們的融合伙伴中切割突變SUMOs的能力(圖7)。如果在細胞中表達氨節青霉素抗性蛋白,P-內酰胺酶,篩選基于大腸桿菌在含有抗生素氨千青霉素的培養基上的生長能力來進行。已經證明只有未融合的p-內酰胺酶可以賦予氨爺青霉素抗性。因此,如果SUMO標簽被融合至P-內酰胺酶上,它不會賦予氨卡青霉素抗性。P-內酰胺酶^皮融合至SUMC^的C-末端并與不同的水解酶進4亍共表達。只有當標簽被切割,p-內酰胺酶才能以其活性形式釋放,從而通過賦予氨爺青霉素抗性而使細胞生存。已知道如果蛋白以脯氨酸開端,那么Ulpl不能切割該SUMO-蛋白融合體。因此Smt3-pro-BLA融合蛋白,在Smt3標簽之后的第一個氨基酸是脯氨酸的融合物,被構建起來作為構思證據用于篩選(圖8)。分析Ulp1的結構,與SUMO氨基酸R64和R71相互作用的氨基酸殘基被確定位于殘基450和456之間的區域。與R64和R71相互作用的潛在氨基酸分別是位于451和455位的天冬氨酸和谷氨酸,以及在452位的蘇氨酸(圖4和9)。使用PCR飽和誘變技術隨機突變在Ulp1中的這三個殘基。誘變之后,突變體用體內(3-內酰胺酶檢定在含有氨芐青霉素的平板進行選擇。使用切割效率的不同程度在篩選中鑒定Ulpl突變體。選擇最有效率的突變體2.2,并命名為"SUMC^蛋白酶l"(圖10)。突變體范例在下面表2中提供。"7/化5^祐/£>iVQj勿^/%野生型-DTII(24)E-0%mut2.2(SUMO*蛋白酶)-SGII(25)S-100%mut2.3-AMilA-10%(26)mut1.38_STIIA_75%(27)itiut1.48-STII(28)M—75%表2在野生型ULP1和某些突變體的451和455位之間的氨基酸序列以及它們切割SUMC^的能力。實施例II如同野生型SUMO—樣,工程SUMOs能夠增加異源蛋白質的表達。實際上,圖3A表明,同未加標簽的GFP比較,當蛋白與SUMO承融合時,在釀酒酵母中GFP以更高的水平表達。另外,圖13提供SUM(F增強異源蛋白質在昆蟲細胞中表達的證據。特別地,將類胰蛋白酶與6xHis標簽或SUMC^標簽一起克隆進入pFastBac載體。該融合蛋白在昆蟲Sf9細胞中表達。用考馬斯染色的細胞內蛋白SDS-PAGE凝膠清楚地表明與帶6xHis標簽的類胰蛋白酶相比SUMO氣類胰蛋白酶表達提高。值得注意的是,SUMC^-類胰蛋白酶融合物在昆蟲細胞中不凈皮切割。.另外,與野生型SUMO類似,本發明的工程SUMOs提高了異源蛋白質的分泌。圖14是表達帶6xHis標簽或融合SUMO+的粒酶B(GzmB)的巴斯德畢赤酵母(Pichiapastoris)培養基蛋白的蛋白質印跡。該培養基與細胞分離并用SDS-PAGE和蛋白質印跡進行分析,蛋白質印跡分析使用抗GzmB抗體以顯現SUMO*-GzmB以及6xHis-GzmB。值得注意的是,SUMO*-GzmB融合物在畢赤酵母細胞中不^皮切割。.實施例III昆蟲表達載體基于pFastBac(Invitrogen,Carlsbad,CA)并以兩步進行構建,類似于畢赤酵母。首先,6xHis、SUMO以及SUMC^融合標簽被克隆在P-polh啟動子之后。然后與融合標簽符合讀框地將UBP43,—種泛素蛋白酶(Liu等(1999)Mo1.Cell.Biol.,19:3029-3038),插入用BsmBI-XbaI預先消化的載體。小鼠UBP43用引物#265(CGCGACCTGCATCGAGGTATGGGCAAGGGGTTTGGGCTCCTGAGG;SEQIDNO:29)和#266(CGCGACCTGCATGTCTAGATTAGaATCCAGTCTTCGTGTAAACCAAG;SEQIDNO:30),進行擴增,再用BfuAI消化。桿粒在DH10bac大腸桿菌細胞中產生。獲得并滴定病毒之后,轉染Sf9細胞,72小時之后分析樣品檢測蛋白質產量。pCDNA3.1載體被用于哺乳動物表達。將小鼠IgGK分泌信號和三個蛋白標簽,6xHis、6xHis-SUMO、和6xHis-SUMO*,克隆進CMV啟動子后的HindIII-BamHI位點。用引物576(ATCACGTCTCGAGGTGGACTCCTGGAGCTGGCAGGGAC;SEQIDNO:31)和285(GCATCGTCTCACTAGTCAATTGCACTTGGGAGAGT;SEQIDNO:32),擴增小鼠分泌組XPLA2后,用BsmBI限制性核酸內切酶消化并克隆在6xHis、SUMO或SUM(F融合標簽之后。無k分泌標簽的JOSD2在細胞內表達。JOSD2開放閱讀框用寡聚DNA344(ATGATGGGTCTCAAGGTATGTCCCAGGCCCCGGGAGCA;SEQIDNO:33)和345(ATGATGGGTCTCTCTAGATCAGTCTGTCCGCAGCCA;SEQIDNO:34)擴增并克隆進基于pCDNA3.1的載體中,在6xHis或SUMC^標簽之后。用2.5微克的各種純化質粒來轉染包含2ml培養基中的HEK293T細胞的6孔平板的各孔。48小時之后,收集細胞和培養基樣品并用蛋白質印跡法分析。如圖15A和15B所示,SUMC^融合標簽增強了融合伙伴蛋白的表達,并在昆蟲和哺乳動物細胞中不被切割。實施例IVsPLA2酶以它們催化磷脂sn-2酯鍵的反應,一種水解反應,受到人們關注。在水解后,得到溶血磷脂和游離脂肪酸。這些脂肪酸可以作為信號轉導的第二信使,而值得注意的是溶血磷脂有助于磷脂重塑。PLA2首先于1890年在眼鏡蛇毒中被發現(Six和Dennis(2000)Biochim.Biophys.Acta,1488:1-19)。目前,已有ll種不同的sPLA2組在小鼠中得到鑒定,根據氨基酸序列同源和結構相似性進行分類。在已知的ll組中,組IIC、IIE、III、V和X被用于這些研究。(字母指特定組中不同的同系物。)組IIC,有8個二硫鍵,在嚙齒動物睪丸、腦和胰腺中都發現,但在人類中不表達(Six和Dennis(2000)Biochim.Biophys.Acta"1488:1-19)。組IIE,在體內有炎性反應,在人(肺組織)和小鼠(腦、心臟和肝組織)中被發現。有趣的是,組III,原來從蜂毒分離,在人體中誘導樹突成熟,在病理性的人內皮細胞中高度表達并似乎在腫瘤細胞中增加血管生成(Murakami等(2005)J.Biol.Chem.,280:24987-24998)。組VPLA2,—種具有6個二石克4建的14kDa蛋白,在它的結構中并無獨特的環并在有炎性刺激的情況下在大鼠和人心臟中表達(Six和Dennis(2000)Biochim.Biophys.Acta"1488:1-19)。組X,最近解析出的PLA2S,包含123個氨基酸并與組I、II和V有27-35%序列同一性。它在人的脾、白細胞、肺泡組織和胸腺以及小鼠的胃中有發現。與大多數PLA2S—樣,組XPLA2S在炎性刺激下出現并也參與信號轉導。為了正確折疊和活性許多真核生物蛋白需要復雜的翻譯和翻譯后環境。這些條件在像大腸桿菌或酵母類的生物中并不存在,在這些宿主中嘗試重組表達時這可能導致不正確的加工和/或較差的得率。分泌的磷脂酶A2S是一類在大腸桿菌中難于生產的蛋白家族,經常被表達于包含體中。此外,由于相對多的二硫鍵數目,通常在5至8之間,PLA2s在增溶之后難以重折疊。表達通常比較低并且隨后的重折疊步驟經常導致較差的產量。盡管有精致的方案和艱苦的努力,但重折疊的蛋白活性與它的天然形式仍然不同,而不能正確表征。之先嘗試在哺乳動物細胞中表達sPLA2S,通常會得到較低的表達水平。然而,如在此所述,通過與小的類泛素修飾物(SUMO)家族的成員融合,在大腸桿菌、巴斯德畢赤酵母和桿狀病毒/昆蟲細胞系統中都可以提高異源蛋白質的表達。因此,通過類似于以前使用的方法可能在哺乳動物細胞中使sPLA2生產量提高,特別是小鼠PLA2組。另夕卜,PLA2的游離N末端對PLA家族蛋白的生物活性必不可少。生產活性的PLA2對細胞有害,過量生產活性PLA2將殺死細胞。在PLA2的N末端包含有工程SUMO的融合蛋白在細胞中不被切割,這樣可使休眠的/非活性的PLA2在細胞內積累或被分泌至培養基中(細胞外)。工程SUMO-PLA2融合物可以在體外純化后用工程SUMO蛋白酶切割以生產活性的PLA2蛋白。因此,工程SUMO融合物提供了更好的工具來表達活性的有毒蛋白,特別是當該蛋白的毒性與蛋白的N末端有關時。值得注意的是,其它蛋白如胰蛋白酶、因子X、凝血酶和粒酶B當過表達時可能對細胞有毒,并且這些蛋白表現活性都需要游離N末端。像PLA2那樣,這些蛋白可以以工程SUMO融合物的形式表達,然后用工程SUMO蛋白酶除去SUMO標簽。材料與方法一々建/fi合標吝減謬對于所有載體構建體,pCDNA3.1/V5-His(Invitrogen)都被用作主鏈。所有的PCR反應都使用高保真PlatinumTaqDNA聚合酶(Invitrogen),而所有限制性酶和T4DNA連4妻酶來源于Fermentas(Burlington,Ontario,力o拿大)。克隆按照標準技術進行。所有克隆以測序法進行鑒定。最初,通過具有兩者之間同源區域的重疊引物產生KS.S.和6xHis標簽(分別使用引物1+2和3+4;見引物序列表3)。將kS.S和His標簽用引物1+4在第二輪PCR反應中連接在一起。k-6xHis融合體通過HindIII和BamHI限制性位點插入pCDNA3.1中,生成pCDNA3.1-k-6xHis。設計引物3和44吏His標簽之后4妾上兩個甘氨酸以及產生在相反鏈BamHI位點上游區的Esp3I/BsmBI限制性位點。用Esp3I消化,從雙甘氨酸ggaggt編碼序列產生非編碼鏈上的由tcca組成的四堿基突出。用引物5+6,7+6,7+6和8+9分別擴增CTHS、SUMO、SUMOmut和hSUM03。當下游使用第二個Esp31識別位點時,所有反向引物再次在不同的SUMO末端雙甘氨酸密碼子下游產生Esp31識別位點。通過Eco311和BamHI限制性位點將SUMO標簽插入pCDNA3.1-K-6xHis,以生成以下載體pCDNA3.1-K-6xHis-CTHS、pCDNA3.1-K-6xHis-SUMO、pCDNA3.1-K-6xHis-SUMOmut、pCDNA3.1隱K畫6xHis-hSUM03。初始的小鼠sPLA,-X構建體產生使用引物10+11PCR擴增活性的sPLA2-X。使用引物12+11從相同的克隆中PCR擴增非活性的sPLA2-X。通過用Esp3I消化PCR產物和載體產生活性的和非活性的sPLA2-X質粒。凝合標蕃我沐^^增使用引物13+14從cDNA中PCR擴增人SUMO-l并通過Esp31和Xbal卩艮制性位點克隆進入pcDNA3.1-K-6xHis中產生pcDNA3.1-K-6xHis-hSUM01。通過使用PCR位點-定向誘變法產生突變的人SUMO-l和3,其中N末端和C末端的半段在單獨的反應中產生,凝膠分離,并在后續的PCR反應中連接。人SUMO-l的第一步PCR分別4吏用引物13+15和16+14進行N和C-末端反應。人SUMO-3的第一步PCR分別使用引物8+17和18+9進行N和C末端反應。在第二步PCR中,對于每種人SUMO將純化的的第一步產物混合起來,使用引物13+14產生hSUMOlmut,而用引物8+9產生hSUM03mut。產物被被插入pCDNA3.1-K-6xHis中生成pCDNA3.1-K-6xHis陽hSUM01mut和pCDNA3.1-K-6xHis-hSUM03mut。V、》£s尸"2V鍵傳,小鼠sPLA2-IIC、IIE、III和V的cDNAs購買于OpenBiosystems(Huntsville,AL)。設計PLA2引物以能在純化和除去標簽后生成成熟蛋白質。因此基于參考文獻綜述和SignalP分析在引物設計中省略分泌信號和前肽。用引物19+20從cDNA克隆小鼠sPLA2-IIC,對應于GenBank登錄號BC029347。用引物21+22從cDNA中克隆小鼠sPLA2-IIE,對應于GenBank登錄號BC027524。用引物23+24從cDNA中克隆全長的小鼠sPLA2-III,對應于GenBank登錄號BC079556。用引物25+26從cDNA中克隆小鼠sPLA2-V,對應于GenBank登錄號BC030899。用引物27+28從cDNA中克隆小鼠sPLA2-III活性結構域(Murakami等(2005)J.Biol.Chem.,280:24987-24998),對應于GenBank登錄號BC079556。所有的sPLA2基因包括活性和非活性sPLA2-X被亞克隆進入pCDNA3.1-K-6xHis,pCDNA3.1-K-6xHis-SUMO,pCDNA3.1-K-6xHis-SUMOmut,pCDNA3.1-K隱6xHis-hSUM01,pCDNA3.1-K畫6xHis匿hSUM01mut,pCDNA3.1-K匪6xffis國hSUM03和pCDNA3.1-K-6xHis-hSUM03mut中。在/ffi1《-293勿應哞HEK-293T細胞以含有10%胎牛血清培養基的DMEM中500,000細胞每孔的密度被接種于6孔板中(BectonDickinson;Sparks,MD)并在37。C、95%空氣/(:02中孵育過夜。按制造商(Invitrogen)所述使用Lipofectamine-LTX將在pCDNA3.1載體中的不同的PLA2cDNA構建體(2.5貼/孔)瞬時轉染細胞。轉染之后,細胞在37°C下再孵育48小時以分析PLA2表達。轉染并孵育48小時之后,收集培養基和細胞進行分析。從各孔中移出培養基(1.5ml)并離心分離碎片。100|Lil的培養基與6xSDS上樣緩沖液混合并煮沸5分鐘以用于SDS-PAGE/蛋白質印跡。剩余培養基存儲于-80。C以用于隨后檢驗。從平板中的每孔洗滌細胞、離心分離、再懸浮于180^1的冷RIPA緩沖液中,短暫超聲破碎,混合于6xSDS上樣緩沖液并煮沸5分鐘。所有樣品用帶有4%丙烯酰胺疊加層的15%變性丙烯酰胺凝膠解析。凝膠用Trans-BlotSD半干式轉移槽(BioRad;Hercules,CA)轉移至ImmoblinTM硝化纖維素(Millipore;Billerica,MA)上。轉移之后,印跡使用pH7.5含0.05%Tween-20的PBS(PBST)中的5%脫脂奶封閉1小時。封閉之后,印跡在PBST十奶中的1:1000單克隆抗-His抗體(Sigma)中孵育1小時。用PBST洗滌印跡三次,用PBST+奶中的1:2500抗-小鼠的HRP綴合抗體(Sigma;圣路易斯,MO)孵育l小時。印跡再用PBST洗滌三次。用SuperSignalWestPico化學發光底物(Pierce;Rockford,IL)檢測HRP綴合物。印跡用LAS畫3000(FujifilmLifeScience;Stamford,CT)成像。43<table>tableseeoriginaldocumentpage44</column></row><table>13hSUMOlCGCAGGTCTCTAGGTTCTGACCAGGAGGCAAAACCTEco31I47F14hS畫OlCGCGTCTAGAGAGACGGCATGCCGTCTCAACCTCCCGTTTGTTCCTGATAAXbal,Esp3I48R15hSUMOlmutATGATTATCAGCAATTTCCTGACCCTCAAAGAGAAACGTGAGTGAATTCATTGGAA49R16hS畫OlmutCCAATGAATTOACTCACGTTTCTCTTTGAGGGTCAGGAAATTGCTGATAATCATAC50F17hSUM03mutTGGCTGCCCGTCGAACTCGAATGTGATCTGCCTCATTGACA51R18hSUM03mutTCAATGAGGCAGATCACATTCGAGTTCGACGGGCAGCCAAT52F19sPLA2-IICGCGCCGTCTCTAGGTAGTTTCTGGCAGTTCCAGAGGAEsp3I53F20sPLA2陽IICGCGCCGTCTCTCTAGATTAGCACTGGAGTTTGTCCCTGCEsp3I54R21sPLA2-IIEGCGCGGTCTCTAGGTAAGCTGGTCCAGTTTGGAGTGAEco31I55F22sPLA2-IIEGCGCGGTCTCTCTAGATTAGCAGGGTGGGGTGGGCEco31I56R23sPLA2-mGCGCGAAGACATAGGTCGTCACTGGGACAGTACCTCCTGBpil57F24sPLA2-HIGCGCGAAGACATCTAGATTATGAGCTCCAGAATTTCTTCTGTCCBpil58R25sPLA2陽VGCGCCGTCTCTAGGTGGCTTGCTAGAACTCAAGTCCATGEsp3I59F26sPLA2-VGCGCCGTCTCTCTAGATTAGCAGAGGAAGTTGGGGTAATACEsp3I60R27sPLA2-IIIcoreGCGCCGTCTCTAGGTGGCTGGACCATTCCTGGCACGEsp3I61F28sPLA2-IIIcoreGCGCCGTCTCTCTAGATTAATATGAGGTGGCCTCAGCCTTCCAGEsp3I62R表3:引物結果為了評價在哺乳動物分泌途徑中表達SUMO-融合蛋白的潛在作用,小鼠sPLA2-X被用作模型蛋白。首先測定以下四個N末端融合物:Smt3(SUMO),包括AA45-99的Smt3C末端的一半(CTHS),雙重突變體Smt3R64TR71E(SUMOmut(SUMO*)),該突變體不能被SUMO蛋白酶和人SUMO-3(hSUMO)所切割。所有標簽產生為具有6個組氨酸(6xHis)的N-末端并定向于利用IgGK分泌信號從小鼠分泌。用于對照目的,建立了只有信號序列和6xHis標簽的載體,一共建立了五種載體,僅在它們基于SUMO的標簽上不同。與Smt3的融合已經顯出45在大腸桿菌中的異源蛋白表達增強,而當與人SUMO-3融合則導致在大腸桿菌和巴斯德畢赤酵母中的表達提高。在表4中提供了某些表達數據。.<table>tableseeoriginaldocumentpage46</column></row><table>表4開發的CTHS最初用于桿狀病毒/昆蟲細胞表達,因為觀察到全長的SUMO融合物可^皮內源性的去SUMO酶(desumoylase)所切割(如見PCT/US04/20778和US專利申請No.10/504,785)。基于分離的泛素(split畫ubiquitin)的開發(Johnsson和Varshavsky(1994)PNAS91:10340-10344),CTHS僅在存在它的N端一半序列(NTHS)的情況下才會被切割。已經發現當避免了內源性切割時,CTHS融合可以增加融合伙伴的產量。如在此所描述,開發突變體Smt3以產生SUMO融合物,該融合物在真核生物宿主體內不被切割,而維持了在原核生物中所顯示的Smt3融合的所有正向增強。在對結合于它的天然蛋白酶Ulpl的Smt3進行廣泛的晶體結構分析之后,合理的誘變篩選產生了兩個相鄰的(interfacial)氨基酸的修飾。這些修飾,R64T和R71E,產生了在各種酶濃度下都不能被Ulpl切割的SUMO。在篩選中,新的SUMO顯示出與野生型Smt3相當的融合伙伴表達的增強程度。在產生突變Smt3之后,也將Ulpl進行合理的誘變篩選并開發出了能夠在體外切割突變Smt3融合物的突變酶。如圖16A所示,在HEK-293T細胞中表達sPLA2-X。與其它標簽相比,SUMOmut清楚地顯示了sPLA2-X在產量上的增強;然而Smt3和hSUM03培養物在48小時的最后顯得融合性較差。重復若干次轉染都得到相同的結果。sPL八2-X是天然產生的酶原,其成熟形式克隆在各種標簽之后。在它可能從它的融合伙伴上釋放出來的情形中過量表達sPLA2-X可能對細胞有毒。為了評價所述sPLA2-X毒性是否是由于切割造成的,我們通過去除sPLA2-X的N末端甘氨酸來產生一系列非活性的sPLA2-X融合物。在HEK-293T細胞中表達那些非活性sPLA2-X的融合物見圖16B。結果證明雖然沒有可見的裂解產物,sPLA2-X活性和它N末端前肽對切割的敏感度顯然在過表達中起有重要作用。比較人SUMO-l、2、3和Smt3的晶體結構,顯示出在各SUMO結構之間具有很強的保守性,兩個相鄰精氨酸殘基位于幾乎相同的位置。值得注意的是,SUMO-2和3具有97%的同一性。因此,研究hSUMO-1和3希望SUMO-2表現與SUMO-3相同的情況。在hSUMO1中,在63位的精氨酸被改變為蘇氨酸(R63T),而70位精氨酸^皮改變為谷氨酸(R70E)。對于hSUM03,58位的精氨酸被改變為蘇氨酸(R58T)以及60位的精氨酸被改變為谷氨酸(R60E)。用突變型和野生型Smt3、hSUMOl和3制備出活性的和非活性的sPLA2-X融合物。圖17A和B分別顯示了表達非活性的和活性的融合物48小時的結果。表達野生型Smt3、hSUMOl和hSUM03的培養物也沒生長,同時也不表達sPLA2-X。這種情況可能由于融合蛋白被切割后釋放了有毒的PLA2。有趣的是,某些帶His標簽的hSUMOl在17A中可見,而在其它的具有活性sPLA2-X的野生型SUMO融合物中則不可見。給出的表達數據使用的是小鼠sPLA2-X,測定了其它的sPLA2組。基于在以前報道中重組表達的不同水平(Rouault等(2007)Biochemistry46:1647-1662)測定了四個額外的小鼠sPLA2基因。以前,小鼠sPLA2-IIC和III在昆蟲細胞中的生產分別具有150和70ng/L的產量。對于每種sPLA2目前沒有重折疊方案而且兩種酶都是天然糖基化的,這使得真核生物生產成為必需。小鼠sPLA2-IIE代表了報道的在細菌中的最低產量,為800ng/L,而sPLA2-V代表了最高產量,為20mg/L。小鼠sPLA2-X在大腸桿菌中表達量為10mg/L。活性形式的小鼠sPLA2-IIC、IIE、III和V被測定。圖18A展示了sPLA2-IIC48小時之后的細胞內表達。帶His標簽的蛋白在培養基中不能被檢測出。盡管帶上所有的SUMO標簽的表達都明顯地增加了,但分泌在某種程度上被抑制了。sPLA2-IIE的表達和分泌見圖18B。48小時之后,明顯更多的sPLA2-IIE在大多數的SUMO融合物中可以被看到了,密度法分析顯示,比起單獨的His標簽,SUMOmut是140倍而hSUM03mut是190倍。小鼠和人sPLA2-III都作為55kD的蛋白表達,但經過翻譯后和細胞特異性的蛋白水解加工,成熟為28kD的活性結構域(Murakami等(2003)J.Biol.Chem.,278:10657-10667;Murakami等(2005)J.Biol.Chem.,280:24987-24998.)。活性的或S結構域之前是N結構域,之后是C結構域。最初,制備了具有全長sPLA2-III的融合物,僅僅使用SUMO和K信號更換了天然分泌信號。在HEK-293細胞中,所有sPLA2-III融合物在它們的第一個切割位點上被切割,而分開了N和S結構域,如圖18C所示,這時帶His標簽的蛋白只有12kD或具有不同的SUMOs時大約32kD。胞內印跡顯示了55kD蛋白的產生而無其它的形式可見。sPLA2-V的表達和分泌見于圖18D。類似于組X,在表達sPLA2-V時對突變SUMO融合物有強的偏好性。雖然野生型SUMO融合物的表達明顯缺少,但在sPLA2-V例子中,沒有看到類似的細胞培養問題。雖然本發明的某些優選方案已經進行了如上描述和特別例證,但并不意圖將本發明限于這些方案。在不偏離本發明的范圍和精神的前提下可以進行各種的修改,如以下權利要求所闡述的。48權利要求1.編碼工程SUMO的分離的核酸分子,其中所述的工程SUMO是其中SUMO蛋白酶相互作用結構域中的至少一個精氨酸殘基已經被改變為非堿性氨基酸的SUMO蛋白。2.根據權利要求1的核酸,其中所述的SUMO蛋白酶相互作用結構域包括氨基酸序列XpXzX^GXsXs(SEQIDNO:2),其中Xi和X6是非堿性氨基酸,并且X2、X3、X4和Xs是任何氨基酸。3.根據權利要求2的核酸分子,其中是蘇氨酸,并且X6是谷氨酸。4.根據權利要求1的核酸,其中所述的SUMO蛋白酶相互作用結構域包括氨基酸序列X艮F(SEQIDNO:65),其中Xi和X2是除了精氨酸之外的任何氨基酸。5.根據權利要求2的核酸分子,其中X!是蘇氨酸,并且X2是谷氨酸。6.根據權利要求1的核酸分子,其中所述的工程SUMO是SEQIDNO:1。7.根據權利要求1的核酸,其中所述的工程SUMO選自人SUMOl、人SUM02、人SUM03、非洲爪蟾(Xenopuslaevis)Smt3、酵母Smt3、黑腹果蠅(DrosophilaMelanogaster)Smt3、擬南芥(ArabidopsisThaliana)SUMOl和擬南芥SUM02。8.根據權利要求1的核酸,其中所述的工程SUMO選自a)人SUMOl,其中63位的精氨酸和70位的精氨酸中至少之一已被改變為非堿性氨基酸;b)人SUM02,其中59位的精氨酸和61位的精氨酸中至少之一已被改變為非堿性氨基酸;c)人SUM03,其中58位的精氨酸和60位的精氨酸中至少之一已被改變為非堿性氨基酸;d)非洲爪蟾Smt3,其中59位的精氨酸和61位的精氨酸中至少之一已被改變為非堿性氨基酸;e)酵母Smt3,其中64位的精氨酸和71位的精氨酸中至少之一已被改變為非堿性氨基酸。f)黑腹果蠅Smt3,其中54位的精氨酸和56位的精氨酸中至少之一已被改變為非堿性氨基酸;g)擬南芥SUMOl,其中65位的精氨酸和66位的精氨酸中至少之一已被改變為非堿性氨基酸;和h)擬南芥SUM02,其中64位的精氨酸和65位的精氨酸中至少之一已被改變為非堿性氨基酸。9.分離的工程SUMO蛋白,由權利要求1的核酸分子所編碼。10.根據權利要求1的核酸分子,該分子可操作地連接于多克隆位點;其中所述的多克隆位點允許符合讀框并且直接地將編碼所關心的蛋白的核酸克隆到編碼工程SUMO的Gly-Gly切割位點的核酸序列的3,。11.根據權利要求1的核酸分子,進一步包括編碼親和標簽的核酸序列;其中所述的編碼親和標簽的核酸序列符合讀框并可操作地連接于編碼所述的工程SUMO的核酸序列的5,。12.包含權利要求1的核酸分子的表達載體。13.編碼工程SUMO蛋白酶的分離的核酸分子,其中所述的工程SUMO蛋白酶包括SUMO相互作用結構域,該結構域包括氨基酸序列WLNX^XAXs(SEQIDNO:6),其中X!和Xs是任何非酸性氨基酸,X2、X3和X4是任何氨基酸。14.根據權利要求13的分離的核酸分子,其中X!是絲氨酸,并且Xs選自絲氨酸、丙氨酸和曱硫氨酸。15.根據權利要求13的分離的核酸分子,其中X!是絲氨酸;X2是甘氨酸;并且Xs是絲氨酸。16.根據權利要求13的分離的核酸分子,其中X2選自甘氨酸和蘇氨酸;X3是異亮氨酸或纈氨酸;并且X4是異亮氨酸或蘇氨酸。17.根據權利要求13的分離的核酸分子,其中所述的工程SUMO蛋白酶選自SEQIDNO:3、SEQIDNO:4和SEQIDNO:5。18.權利要求13的核酸分子所編碼的分離的工程SUMO蛋白酶。19.增強在宿主細胞中所關心的蛋白表達水平的方法,包括i)可操作地連接權利要求1的核酸至編碼所述所關心的蛋白的核酸序列上,從而生成編碼融合蛋白的構建體,和ii)將所述的核酸導入所述的宿主細胞,由此在所述融合蛋白中SUMO的存在增加所述所關心的蛋白在所述宿主細胞中的表達水平。20.根據權利要求19的方法,其中所述的宿主細胞選自原核細胞、哺乳動物細胞、酵母細胞、大腸桿菌、昆蟲細胞和真核細胞。21.根據權利要求19的方法,進一步包括所述的融合蛋白的分離。22.根據權利要求21的方法,進一步包括所述融合蛋白的切割以釋放所述所關心的蛋白。23.在宿主細胞中產生所關心的蛋白中改變的氨基末端的方法,包括a)提供編碼所述所關心的蛋白的核酸序列;b)在所述的核酸中改變N末端氨基酸編碼序列;c)可操作地連接權利要求1的核酸至編碼所述所關心的蛋白的所述核酸序列上;d)在宿主細胞中表達所述的核酸;和e)在所述的宿主細胞中表達能夠切割工程SUMO的工程SUMO蛋白酶,由此該工程SUMO蛋白酶切割工程SUMO,從而生產具有改變的氨基末端的所關心的蛋白。24.根據權利要求23的方法,進一步包括具有改變的氨基末端的所關心的蛋白的分離。25.增強所關心的蛋白從宿主細胞分泌的水平的方法,包括i)可操作地連接權利要求1的核酸分子至編碼所述所關心的蛋白的核酸序列上,從而生成編碼融合蛋白的構建體,和ii)將所述的核酸導入所述的宿主細胞,由此在所述融合蛋白中工程SUMO的存在增加了所述所關心的蛋白>^人所述宿主細^<的分泌。26.試劑盒,包括重組載體,所述重組載體含有可操作地連接于啟動子和多克隆位點的權利要求1的核酸分子;其中所述的多克隆位點允許符合讀框并且直接地將編碼所關心的蛋白的核酸克隆到編碼工程SUMO的Gly-Gly切割位點的核酸序列的3,。27.根據權利要求26的試劑盒,其中所述的試劑盒進一步包括宿主細胞。28.根據權利要求27的試劑盒,其中所述的宿主細胞選自原核細胞、哺乳動物細胞、酵母細胞、大腸桿菌、昆蟲細胞和真核細胞。29.根據權利要求26的試劑盒,其中所述的的試劑盒進一步包括用于基于寡核苷酸的位點定向誘變的試劑,所述誘變用于改變編碼所述所關心的蛋白的核酸而產生不同于天然的所關心的蛋白的氨基末端。30.用于從宿主細胞中純化蛋白的試劑盒,包括i)重組載體,包括a)權利要求1的核酸分子;b)啟動子;c)多克隆位點;和任選,d)編碼親和標簽的核酸序列;并且其中所述的啟動子可操作地連接于權利要求1的所述核酸分子上,其中所述的編碼親和標簽的核酸序列,如果有的話,符合讀框并可操作地連接于權利要求1的核酸分子,并且其中所述的多克隆位點允許符合讀框并且直接地將編碼所關心的蛋白的核酸克隆到編碼工程SUMO的Gly-Gly切割位點的核酸序列的3,,和ii)組合物,包括在Gly-Gly切割位點之后特異切割工程SUMO的蛋白酶。31.根據權利要求30的試劑盒,其中所述的試劑盒進一步包括宿主纟田月包。32.根據權利要求30的試劑盒,其中所述的宿主細胞選自原核細胞、哺乳動物細胞、酵母細胞、大腸桿菌、昆蟲細胞以及真核細胞。33.根據權利要求30的試劑盒,進一步包括至少一種以下物質i)用于結合親和標簽的固體支持物,ii)裂解緩沖劑,iii)洗滌緩沖劑,iv)洗脫緩沖劑,V)切割緩沖劑,和Vi)指導材料。34.根據權利要求26的試劑盒,進一步包括編碼切割工程SUMO的工程SUMO蛋白酶的表達載體。35.根據權利要求30的試劑盒,進一步包括編碼切割工程SUMO的工程SUMO蛋白酶的表達載體。36.表達載體,包括權利要求13的核酸分子。37.分離的細胞,包括權利要求12的表達載體。38.分離的細胞,包括權利要求36的表達載體。39.微陣列,包括融合蛋白,所述融合蛋白包括與所關心的蛋白連接的權利要求9的工程SUMO蛋白。40.根據權利要求19的方法,其中所述所關心的蛋白是有毒蛋白。全文摘要公開了用于在宿主細胞中增強異源融合蛋白的表達水平、分泌和純化的方法。文檔編號C12P21/00GK101679989SQ200780051492公開日2010年3月24日申請日期2007年12月28日優先權日2006年12月29日發明者A·卡瓦,J·G·馬布勒斯通,R·J·佩魯特卡,T·R·巴特,T·帕納瓦斯申請人:生命感應器公司