專利名稱:蛋白質表面重建的制作方法
技術領域:
無
背景技術:
蛋白質是細胞的主要組成成分。蛋白質催化化學反應,在生物系統中轉導信號,在 細胞和細胞外基質中提供結構元件,充當信使等。蛋白質不良表現的主要原因之一是聚 集。這不僅是實驗室中的問題,而且是諸如阿爾茨海默病(Alzheimer's disease)等許多 疾病的問題。在達到計算設計的蛋白質時,聚集是尤其煩惱的問題。舉例來說,TOP7 是具有新穎折疊的計算設計的蛋白質。TOP7的較長形式(延長的TOP7(TOP7 extended)) 極易聚集。TOP7ex主要表達為不可溶的聚集體。
隨著更多蛋白質被設計或修飾以用作研究生物系統的工具或隨著更多野生型或修 飾蛋白質被用作治療劑,需要常規上將這些蛋白質修飾為更穩定和/或防止聚集的系統。
發明內容
本發明提供一種修飾蛋白質以使其更穩定的系統。本發明的產生是基于對修飾蛋白 質表面上的疏水性區域可提高蛋白質的超熱力學性質的認識。本發明系統尤其適用于提 高所關注蛋白質的溶解性,提高蛋白質的抗聚集性,和/或提高蛋白質的復性能力。所有 這些特性尤其適用于蛋白質生產、蛋白質純化以及使用蛋白質作為治療劑和研究工具。
在一方面,本發明提供一種改變蛋白質的一級序列以增加寬范圍條件下蛋白質的抗 聚集性、溶解性、重折疊能力和/或總體穩定性的方法。修飾蛋白質的活性優選大致或大 體上與未修飾的蛋白質相同。在某些實施例中,修飾蛋白質保留至少50%、 75%、 90% 或95%的野生型蛋白質的活性。在一實施例中,所述方法包括以下步驟(a)鑒別所關
10注蛋白質的表面殘基;(b)鑒別特定表面殘基在與所關注蛋白質相關的其它蛋白質中是 非高度保守的(即,確定哪些氨基酸對蛋白質活性或功能來說不是不可缺少的);(c) 確定所鑒別的非保守表面殘基的疏水性;以及(e)用在生理pH值下極性更高或帶電的 氨基酸置換至少一個或一個以上所鑒別的疏水性非保守殘基。各以上步驟均可以使用所 屬領域中己知的任何技術、計算機軟件、算法、范式等進行。產生修飾蛋白質后,可測 試其活性和/或所尋求的預期性質。在某些實施例中,修飾蛋白質更加穩定。在某些實施 例中,修飾蛋白質不易聚集。本發明方法通常增加在生理pH值下蛋白質的凈電荷(正 或負)。
在另一方面,本發明提供一種通過使蛋白質"超帶電(s叩ercharging)"來改變蛋白 質的一級序列以增加寬范圍條件下蛋白質的抗聚集性、溶解性、重折疊能力和/或總體穩 定性的方法。也就是說,與野生型蛋白質相比,修飾蛋白質上總的凈電荷增加(正電荷 或負電荷)。修飾蛋白質的活性優選大致或大體上與未修飾的蛋白質相同。在某些實施 例中,所述方法包括以下步驟(a)鑒別所關注蛋白質的表面殘基;(b)鑒別特定表面 殘基在與所關注蛋白質相關的其它蛋白質中是非高度保守的(即,確定哪些氨基酸對蛋 白質活性或功能來說不是不可缺少的);(c)確定所鑒別的非保守表面殘基的親水性; 以及(e)用在生理pH值下帶電的帶電氨基酸置換至少一個或一個以上所鑒別的帶電或 極性、溶劑暴露非保守殘基。在某些實施例中,為制備帶負電的"超帶電"蛋白質,使 所鑒別用于修飾的殘基突變為天冬氨酸(Asp)或谷氨酸(Glu)殘基。在某些其它實施 例中,為制備帶正電的"超帶電"蛋白質,使所鑒別用于修飾的殘基突變為賴氨酸(Lys) 或精氨酸(Arg)殘基。各以上步驟都可以使用所屬領域中已知的任何技術、計算機軟 件、算法、范式等進行。產生修飾蛋白質后,可測試其活性和/或所尋求的預期性質。在 某些實施例中,修飾蛋白質("超帶電蛋白質")更加穩定。在某些實施例中,修飾蛋白 質不易聚集。本發明方法通常增加在生理pH值下蛋白質的凈電荷(正或負)。
編入蛋白質數據庫(Protein Data Bank, PDB)中的超過80%的蛋白質的理論凈電 荷在±10范圍內。本發明所產生的修飾蛋A質通常具有小于-IO或人于+ 10的凈電荷。 在某些實施例中,修飾蛋白質具有小于-20或大于+20的凈電荷。在某些實施例中,修 飾蛋白質具有小于-30或大于+30的凈電荷。在某些實施例中,修飾蛋白質具有小于-40 或大于+40的凈電荷。在某些實施例中,修飾蛋白質具有小于-50或大于+50的凈電荷。 修飾蛋白質能夠恰當折疊并保留其生物活性。
可使用本發明系統修飾任何蛋白質,并且本發明系統所產生的蛋白質變異體以及編 碼變異蛋白質的多核苷酸或載體和表達變異蛋白質的細胞都視為本發明的一部分。已經
11使用本發明系統產生了數種新穎的綠色熒光蛋白(green fluorescent protein, GFP)變異 體。這些變異體保留其熒光性;然而,其在寬范圍環境下比GFP的現有形式更穩定。本 發明GFP即使經過很長時間和在誘導聚集的環境中也不會聚集,并且即使通過煮沸變性 后也能夠重折疊為熒光蛋白。也已經使用本發明系統產生了新穎的鏈霉親和素 (streptavidin)和谷胱甘肽-S-轉移酶(glutathione-S-transferase, GST)變異體。這些變 異體保留其生物活性并且在加熱時仍可溶。本發明還包括編碼本發明GFP、鏈霉親和素 以及GST蛋白序列的多核苷酸序列;包括任何這些核苷酸序列的載體;以及包括這樣的 多核苷酸序列或載體或表達本發明變異體的細胞。在某些實施例中,本發明包括過度表 達本發明變異體的細菌或其它細胞。本發明變異體可用于所屬領域己知的多種生物測定 中。舉例來說,超帶電GFP可用于目前使用GFP作為報告蛋白的任何測定中。
在另一方面,本發明提供已經由本發明系統修飾的其它蛋白質。這些修飾蛋白質優 選保留其顯著比例的初始活性。在某些實施例中,修飾蛋白質保留至少99%、 98%、 95% 或90%的未修飾形式的活性。修飾蛋白質在多種條件可更可溶,抗聚集,重折疊能力增 加和/或穩定性更高。由本發明系統修飾的蛋白質包括疏水性蛋白、重組蛋白、膜蛋白、 結構蛋白、酶、細胞外蛋白、治療蛋白(例如,胰島素、細胞激素、免疫球蛋白、免疫 球蛋白片段等)、受體、細胞信號傳導蛋白、胞漿蛋白、核內蛋白、轉錄因子等。在某 些特定實施例中,蛋白質是用于人類或獸醫學的治療蛋白。在某些實施例中,蛋白質是 非天然蛋白質,例如計算設計的蛋白質。在其它實施例中,蛋白質是雜合蛋白、融合蛋 白、變構蛋白、突變蛋白、基因工程蛋白或已經通過人工改變的任何其它蛋白質。
還提供用于實施本發明的試劑盒。試劑盒可包括修飾所關注蛋白質以使其更抗聚 集、增加其復性能力或增加其總體穩定性所需的試劑。這些試劑盒可包括所有或部分以 下各物多核苷酸、計算機軟件、核苷酸、引物、載體、細胞系、說明書、培養板、培 養基、緩沖液、酶、艾本德管(Eppendorf tube)、定點誘變試劑盒等。試劑盒優選經簡 便包裝以供實驗室裝置使用。研究員通常提供待使用本發明技術修飾的蛋白質的DNA 編碼序列。
定義
"氨基酸"術語"氨基酸"是指蛋白質的基本結構亞單元(subunit)。 a-氨基酸由 氨基、羧基、氫原子以及側鏈(即,R基團)組成,均鍵結于中心碳原子。這個屮心碳 原子因為與羧基相鄰而稱為a碳。存在二十種天然氨基酸,包括甘氨酸、丙氨酸、纈氨 酸、亮氨酸、異亮氨酸、苯丙氨酸、酪氨酸、色氨酸、半胱氨酸、蛋氨酸、絲氨酸、蘇 氨酸、賴氨酸、精氨酸、組氨酸、天冬氨酸、谷氨酸、天冬酰胺、谷氨酸以及脯氨酸。疏水性氨基酸包括丙氨酸、纈氨酸、亮氨酸、異亮氨酸以及苯丙氨酸。芳香族氨基酸包 括苯丙氨酸、酪氨酸、色氨酸以及組氨酸。極性氨基酸包括酪氨酸、半胱氨酸、絲氨酸、 蘇氨酸、賴氨酸、精氨酸、組氨酸、天冬氨酸、谷氨酸、天冬酰胺以及谷氨酰胺。含硫 氨基酸包括半胱氨酸和蛋氨酸。堿性氨基酸包括賴氨酸、精氨酸以及組氨酸。酸性胺基 酸包括天冬氨酸和谷氨酸。也有蛋白質中被插入非天然氨基酸。在某些實施例中,當使 用術語"氨基酸"時是指二十種天然氨基酸。
"抗體"術語"抗體"是指天然或者完全或部分合成產生的免疫球蛋白。維持特異 性結合能力的所有其衍生物也包括在這一術語內。這一術語也涵蓋具有與免疫球蛋白結 合域同源或者基本上同源的結合域的任何蛋白質。這些蛋白質可源自天然來源或者部分 或完全合成產生。抗體可為單克隆抗體或多克隆抗體。抗體可為任何免疫球蛋白類別(包 括人類類別IgG、 IgM、 IgA、 IgD以及IgE中的任一類別)的成員。
"保守"術語"保守"是指多核苷酸序列或氨基酸序列的相應核苷酸或氨基酸殘基 在所比較的兩個或兩個以上相關序列的相同位置未發生變化。相對保守的核苷酸或氨基 酸是在相關序列中比序列中其它地方所出現的核苷酸或氨基酸保守的那些核苷酸或氨 基酸。
"同源"如本文中所使用的術語"同源"是所屬領域通曉的術語,是指核酸或蛋白
質在核苷酸或氨基酸序列層面高度相關。彼此同源的核酸或蛋白質稱為同源物。同源可 指兩個序列(即,核苷酸序列或氨基酸)之間的序列相似性程度。本文屮所提及的同源 性%數字反映兩個序列之問的最大可能同源性,即,比對兩個序列以具有最大數目的匹 配(同源)位置時的同源性%。同源性可由已知方法容易地加以計算,諸如以下文獻中
所述的方法計算分子生物學(Computational Molecular Biology),萊斯克(Lesk, A. M,) 編,牛津大學出版社(Oxford University Press),紐約(New York) ,1988;生物計算 信息學和基因組計劃(Biocomputing: Informatics and Genome Projects),史密斯(Smith, D. W.)編,學術出版社(Academic Press),紐約(New York) ,1993;分子生物學中的 序歹U分析(Sequence Analysis in Molecular Biology),凡.海耳卩(von Heinje, G.),學術出 版社(Academic Press) ,1987;序列數據的計算機分析第I部分(Computer Analysis of Sequence Data, Parti),格里菲因(Griffin, A. M.)和格里菲因(Griffin, H. G.)編,胡瑪 納出版社(Humana Press),新澤西州(New Jersey) , 1994;和序列分析引物(Sequence Analysis Primer),吉布考夫(Gribskov, M.)和德夫萊克(Devereux, J.)編,米斯托克 頓出版社(M Stockton Press),紐約(New York) , 1991;各自以引用的方式并入本文 中。測定序列之間同源性的常用方法包括(但不限于)以下文獻中所揭示的方法卡里
13羅(Carillo, H.)和里皮曼(Lipman, D.) , SIAM應用數學(SIAM J Applied Math.) , 48:1073 (1988);其以引用的方式并入本文中。測定同源性的技術被編成了公開可用的計算機程 序。測定兩個序列之間同源性的示范性計算機軟件包括(但不限于)GCG程序包(德夫 萊克(Deve,, J.)等人,核酸研究(Nucleic Acids Research) , 12(1), 387 (1984))、 BLASTP、 BLASTN以及FASTA( P可特舒(Atschul, S. F.)等人,分子生物學雜志(J Molec. Biol.) , 215, 403(1990))。
術語"同源"必定指至少兩個序列(核苷酸序列或氨基酸序列)之間的比較。根據 本發明,如果兩個核苷酸序列所編碼的多肽有至少一段的至少20個氨基酸至少約 50-60%—致,優選約70%—致,那么將其視為同源。同源核苷酸序列的特征優選還在于 編碼一段至少4-5個特別指定的氨基酸的能力。關于待考慮同源性的核苷酸序列,必須 考慮這些氨基酸彼此之間的一致性和大致間隔。對于長度小于60個核苷酸的核苷酸序 列,由編碼一段至少4-5個特別指定的氨基酸的能力確定同源性。
"肽"或"蛋白質"根據本發明,"肽"或"蛋白質"包含一串通過肽鍵連接在一 起的至少三個氨基酸。術語"蛋白質"和"肽"可互換使用。本發明的肽優選僅含有天 然氨基酸,但也可使用所屬領域已知的非天然氨基酸(即,自然界中不存在但可并入多 肽鏈中的化合物)和/或氨基酸類似物。同時,可修飾本發明的肽中的一個或一個以上氨 基酸,例如通過添加碳水化合物基團、磷酸根基、法呢基(farnesyl)、異法呢基、脂肪 酸基團、用于連接、官能化或其它修飾(例如,a酰胺化)的連接基團等化學實體來修 飾。在優選實施例中,對肽修飾產生更穩定的肽(例如,活體內半衰期更高)。這些修 飾可包括使肽環化、并入D-氨基酸等。這些修飾均不應對肽的預期生物活性產生實質性 的干擾。在某些實施例中,對肽修飾產生生物學活性更高的肽。
"多核苷酸"或"寡核苷酸"多核苷酸或寡核苷酸是指核苷酸的聚合物。多核苷酸 通常包含至少三個核苷酸。聚合物可包括天然核苷(即,腺苷、胸苷、鳥苷、胞苷、尿 苷、脫氧腺苷、脫氧胸苷、脫氧鳥苷以及脫氧胞苷)、核苷類似物(例如,2-氨基腺苷、 2-硫代胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、C5-丙炔基胞苷、C5-丙炔基尿苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-甲基胞苷、7-脫氮腺苷(7-deazaadenosine)、 7-脫 氣鳥昔(7匿deazaguanosine)、 8-氧代月泉昔(8-oxoadenosine)、 8—氧4戈鳥昔(8-oxoguanosine)、 0(6)-甲基鳥嘌呤以及2-硫代胞苷)、化學修飾堿基、生物修飾堿基(例如,甲基化堿基)、 插入堿基、修飾糖(例如,2'-氟核糖、核糖、2'-脫氧核糖、阿拉伯糖(arabinose)以及 己醣)和/或修飾磷酸根基(例如,硫代磷酸根基和5'-N-亞磷酰胺鍵聯)。
"小分子"如本文中所使用的術語"小分子"是指實驗室中制備或自然界中可見的非肽、非寡聚有機化合物。如本文中所使用的小分子可指"天然產物樣"化合物,然而 術語"小分子"不限于"天然產物樣"化合物。更確切地說,小分子的特征通常在于其 含有數個碳碳鍵并且具有小于1500的分子量,但出于本發明的目的,這一特征不打算 限制本發明。在某些其它優選實施例中,利用天然產物樣小分子。
"穩定"如本文中所使用的術語"穩定"提及蛋A質時是指蛋A質穩定性的任何方 面。與初始野生型蛋白質相比,穩定的修飾蛋白質具有一個或一個以上的以下特征更 可溶、更抗聚集、更抗變性、更抗解折疊、更抗不適當或不希望的折疊、復性能力更強、 熱穩定性增加、在多種環境(例如,pH值、鹽濃度、存在洗滌劑、存在變性劑等)下 穩定性增加以及非水性環境下穩定性增加。在某些實施例中,穩定的修飾蛋白質顯示至 少兩個上述特征。在某些實施例中,穩定的修飾蛋白質顯示至少三個上述特征。這些特 征可使活性蛋白質在更高水平下生產。舉例來說,可在比蛋白質未修飾形式高的水平下 過度表達修飾蛋白質而無聚集。這些特征也可使蛋白質用作治療劑或研究工具。
激7,超帶電綠色熒光蛋白(GFP)。 (a) GFP變異體的蛋白質序列,形成熒光團的 殘基突出為綠色、帶負電殘基突出為紅色,而帶正電殘基突出為藍色;(b)sfGFP(左)、 GFP(+36)(中)以及GFP(-30)(右)的表面靜電勢,自-25kT/e (紅色)至+25 kT/e (藍 色)著色。
激2, GFP變異體的分子內性質。(a)純GFP變異體的染色和紫外熒光。各泳道和 試管含有0.2 ug蛋白質。(b) GFP變異體的圓二色性譜。(c) GFP變異體的熱力學穩 定性,由胍鹽誘導的解折疊測量。
激丄.超帶電蛋白質的分子間性質。(a)純GFP變異體的紫外照射樣品("天然"), 在IO(TC加熱1分鐘的樣品("煮沸")和隨后在25。C冷卻2小時的樣品("冷卻")。(b) 在25。C下用40免TFE誘導GFP變異體聚集并通過直角光散射監測。(c)超帶電GFP可 逆地粘附于帶相反電荷的大分子。樣品1:于30pl25mMTris(pH7.0)和100 mM NaCl 中的6貼GFP(+36)。樣品2:向樣品1中添加6 pg GFP(-30)。樣品3:向樣品1中添加 30 ng鮭魚精DNA。樣品4:向樣品1中添加20^g大腸桿菌(E. coli) tRNA。樣品5: 向樣品4中添加NaCl達1 M。樣品6-8:除使用sfGFP代替GFP(+36)外,分別與樣品1、 2以及4相同。使所有樣品在微型離心機中短暫旋轉并且在紫外光下觀察。(d) GST變 異體的酶法測定。反應含有0.5 mg/mLGST變異體、20mM二硝基氯苯、20 mM谷胱甘 肽以及100mM磷酸鉀(pH6.5)。在340 nm下監測產物的形成,得到反應速率觀察值(k。bs),野生型GST為6 min",GST(-40)為2.2 min"而煮沸和冷卻后GST(-40)為0.9 min-1 。 厲4, GFP變異體的(a)激發光譜和(b)發射光譜。各樣品含有通過在490nm下 發色團吸光度所定量,等量的蛋白質。
激5,鏈霉親和素變異體的生物素結合活性,如先前所述(卡達(Kada)等人,利 用熒光猝滅或熒光偏振快速估算抗生物素蛋白和鏈霉親和素(Rapid estimation of avidin and streptavidin by fluorescence quenching or fluorescence polarization). 生物化學與生物 物理學報(Biochim. Biophys. Acta) 1427, 44-48 (1999),其以引用的方式并入本文中) 通過監測生物素-4-熒光素(英杰公司(Invitrogen))依賴性結合而測量。向0.3 生物 素-4-熒光素(B4F)、 100 mM NaCl、 1 mM EDTA、 0.1 mg/mL牛血清白蛋白(bovine serum albumin BSA)、 50 mM磷酸鉀(pH 7.5)中滴定蛋白質樣品。在470 nm下激發的 Perkin-Elmer LS50B熒光分光光度儀上測量526 nm下的熒光猝滅。相對于含有600倍過 量的無熒光生物素的對照滴定,將測量結果歸一化。包括圖例下部的二個蛋白質作為陰 性對照。
具體實施例方式
本發明提供一種修飾蛋白質以使其更加穩定的系統。所述系統通過將蛋白質表面上 的非保守氨基酸變成極性更大或帶電的氨基酸殘基來運行。待修飾的氨基酸殘基可以呈 疏水性、親水性或其組合。可通過使用本發明系統修飾任何蛋白質來產生更穩定的變異 體。已發現對表面殘基進行這些修飾可以提高蛋白質的超熱力學性質。隨著蛋白質日益 用作治療劑和隨著其繼續用作研究工具,用于改變蛋白質以使其更加穩定的系統也變得 重要和適用。由本發明方法修飾的蛋白質通常抗聚集,重折疊能力增加,抗不適當折疊, 溶解性提高并且在包括變性條件(諸如熱或存在洗滌劑)在內的寬范圍條件下通常更加 穩定。
可通過使用木發明系統修飾任何蛋白質來產生更穩定的變異體。可修飾天然和非天 然蛋白質(例如,工程蛋白質)。可被修飾的蛋白質實例包括受體、膜結合蛋白、跨膜 蛋白、酶、轉錄因子、細胞外蛋白、治療蛋白、細胞因子、信使蛋白、DNA結合蛋白、 RNA結合蛋白、參與信號轉導的蛋白質、結構蛋白、胞漿蛋白、核內蛋白、疏水性蛋白、 親水性蛋白等。待修飾的蛋白質可源自植物、動物或微生物的任何物種。在某些實施例 中,蛋白質是哺乳動物蛋白質。在某些實施例中,蛋白質是人類蛋白質。在某些實施例 中,蛋白質源自研究中通常使用的生物體。舉例來說,待修飾的蛋白質可來自靈長類動 物(例如,猿、猴)、嚙齒動物(例如,兔子、倉鼠、沙鼠)、豬、狗、貓、角.(例如,
16斑馬魚(z^ra力'W))、線蟲(例如,秀麗線蟲(C. e/eg"w))、酵母(例如,釀酒酵母 (Sac由ram戸s cerWw'ae))或細菌(例如,大腸桿菌(£. co/0)。
本發明系統尤其適用于修飾易聚集或具有穩定性問題的蛋白質。本系統也可用于修 飾被過度表達的蛋白質。舉例來說,重組產生的治療蛋白可以從本發明系統的修飾中受 益。這些經過修飾的治療蛋白不僅更易生產和純化,而且就蛋白質的保存和使用來說可 能更加穩定。
本發明系統包括鑒別所關注蛋白質的非保守表面殘基和用在生理pH值下為親水 性、極性或帶電的殘基置換這些殘基中的一些。本發明系統不僅包括修飾蛋白質的方法, 而且包括適用于修飾蛋白質以使其更穩定的試劑和試劑盒。
使用所屬領域中已知的任何方法鑒別待修飾的蛋白質的表面殘基。在某些實施例 中,通過計算機模擬蛋白質鑒別表面殘基。在某些實施例中,已知和/或測定蛋白質的三 維結構,并通過觀察蛋白質的結構鑒別表面殘基。在其它實施例中,使用計算機軟件預 測表面殘基。在某些特定實施例中,使用每個側鏈原子的平均相鄰原子(Average Neighbor Atoms per Sidechain Atom, AvNAPSA)預測表面暴露。AvNAPSA是一種已作為計算機 程序實施的自動化表面暴露法。參見附錄A。低AvNAPSA值表示表面暴露的殘基,而 高值表示位于蛋白質內部的殘基。在某些實施例中,使用所述軟件預測蛋白質的二級結 構和/或三級結構并基于這一預測鑒別表面殘基。在其它實施例中,表面殘基的預測是基 于殘基的疏水性和親水性以及其于蛋白質一級序列中的聚類分析。除計算機模擬(in silico)方法外,也可使用多種生物化學技術(例如蛋白酶裂解、表面修飾等)鑒別蛋白 質的表面殘基。
然后確定表面殘基中哪些是保守的或對蛋白質的功能來說是重要的。可使用所屬領 域中已知的任何方法確定保守殘基的鑒別。在某些實施例中,通過比對所關注蛋白質的 一級序列與相關蛋白質來鑒別保守殘基。這些相關蛋白質可來自同--蛋白質家族。舉例 來說,如果蛋白質是免疫球蛋白,那么可使用其它免疫球蛋白序列。相關蛋白質也可以 是來自不同物種的相同蛋白質。舉例來說,可通過比對來自不同物種的相同蛋白質的序 列來鑒別保守殘基。作為另一實例,可比對具有類似功能或生物活性的蛋白質。優選使 用2、 3、 4、 5、 6、 7、 8、 9或10個不同序列來確定蛋白質的保守氨基酸。在某些實施 例中,如果超過50%、 60%、 70%、 75%、 80%或90%的序列在特定位置具有相同氨基 酸,那么殘基就被視為是保守的。在其它實施例中,如果超過50%、 60%、 70%、 75%、 80%或90%的序列在特定位置具有相同或類似(例如,纈氨酸、亮氨酸以及異亮氨酸; 甘氨酸和丙氨酸;谷氨酰胺和天冬酰胺;或天冬氨酸和谷氨酸)氨基酸,那么殘基就被視為是保守的。許多軟件包可用于比對和比較如本文中所述的蛋白質序列。所屬領域的 技術人員應了解可首先確定保守殘基或者可首先確定表面殘基。順序并不重要。在某些 實施例中,計算機軟件包可同時確定表面殘基和保守殘基。也可通過誘變蛋白質來鑒別 蛋白質中的重要殘基。舉例來說,可使用蛋白質的丙氨酸掃描來確定蛋白質中的重要氨 基酸殘基。在其它實施例中,可使用定點誘變。
一旦鑒別出蛋白質的非保守表面殘基,就將各殘基鑒別為呈疏水性或親水性。在某 些實施例中,給殘基指定疏水性評分。舉例來說,可給各非保守表面殘基指定辛醇/水分 配系數的對數值(logP)。也可使用其它疏水性參數。這些氨基酸標度已論述于以下文獻 中:簡因(Janin),球狀蛋白中的表面和內部體積("Surface and Inside Volumes in Globular Proteins",自然(Wa諫)277:491-92,1979;沃爾芬頓(Wolfenden)等人,氨基酸側 鏈對溶劑水的親和力("Affinities of Amino Acid Side Chains for Solvent Water"),生物化 學(fi/oc/zem^oO 20:849-855, 1981:卡特(Kyte)等人,呈現蛋白質水療特性的簡單 方法("A Simple Method for Displaying the Hydropathic Character of a Protein"),分子生 物學雜志(/. Mo/. 5!'。/.) 157:105-132,1982;羅絲(Rose)等人,球狀蛋白中的氨基酸 殘基的疏水性("Hydrophobicity of Amino Acid Residues in Globular Proteins"),禾斗學 (Sdewce) 229:834-838,1985;考納特(Cornette)等人,檢測蛋白質中的兩親結構的疏 7K性標度禾卩計算技術("Hydrophobicity Scales and Computational Techniques for Detecting Amphipathic Structures in Proteins"),分子生物學雜志(丄Afo/. ) 195:659-685, 1987; 査頓(Charton)和查頓(Charton),氨基酸疏水性參數的結構依賴性("The Structure Dependence of Amino Acid Hydrophobicity Parameters"),理論生物學雜志( /. 77^6>/-.
99:629-644, 1982;各自以引用的方式并入本文中。本發明方法中可使用任何這 些疏水性參數來確定修飾哪些非保守殘基。在某些實施例中,鑒別親水性或帶電殘基來 修飾。
然后選擇至少一個所鑒別的非保守或非重要表面殘基加以修飾。在某些實施例中, 選擇疏水性殘基加以修飾。在其它實施例中,選擇親水性和/或帶電殘基加以修飾。在某 些實施例中,選擇不止一個殘基加以修飾。在某些實施例中,選擇l、 2、 3、 4、 5、 6、 7、 8、 9或IO個所鑒別的殘基加以修飾。在某些實施例中,選擇超過10個、超過15個 或超過20個殘基加以修飾。所屬領域的技術人員應了解,蛋白質越大,則需要修飾的 殘基將越多。同時,蛋白質疏水性越高或者越易聚集或沉淀,則需要修飾的殘基將越多。 在某些實施例中,產生多個各具有不同修飾的蛋白質變異體并加以測試以確定就生物活 性和穩定性來說最佳的變異體。
18在某些實施例中,使選擇加以修飾的殘基突變為更親水的殘基(包括帶電殘基)。 通常使殘基突變為更親水的天然氨基酸。在某些實施例中,使殘基突變為在生理pH值 下帶電的氨基酸。舉例來說,殘基可變為精氨酸、天冬氨酸、谷氨酸、組氨酸或賴氨酸。 在某些實施例中,使待修飾的所有殘基變為同一種不同殘基。舉例來說,使所選擇的殘 基全部變為谷氨酸殘基。在其它實施例中,使所選擇的殘基變為不同殘基;然而,可使 所有最終殘基在生理pH值下帶正電或帶負電。在某些實施例中,為產生帶負電的蛋白 質,使待突變的所有殘基轉化為谷氮酸和/或天冬氨酸殘基。在某些實施例中,為產生帶 正電的蛋白質,使待突變的所有殘基轉化為賴氨酸殘基。舉例來說,所有所選擇的待修 飾殘基是天冬酰胺、谷氨酰胺、賴氨酸和/或精氨酸,并且使這些殘基突變為天冬氨酸或 谷氨酸殘基。作為另一實例,所有所選擇的待修飾殘基是天冬氨酸、谷氨酸、天冬酰胺 和/或谷氨酰胺,并且使這些殘基突變為賴氨酸。這種方法允許在最大程度上修飾蛋白質 上的凈電荷。
在其它實施例中,蛋白質可在修飾后在修飾蛋白質上保持與未修飾蛋白質上相同的 凈電荷。在其它實施例中,蛋白質可在修飾后減少蛋白質上的總凈電荷,而增加表面上 帶電殘基的總數。在某些實施例中,理論凈電荷增加至少+1、 +2、 +3、 +4、 +5、 +10、 + 15、 +20、 +25、 +30或+35。在某些實施例中,理論凈電荷減少至少-1、 -2、 -3、 -4、 -5、 -10、 -15、 -20、 -25、 -30或-35。在某些實施例中,使所選擇的氨基酸變為非離子極性殘 基(例如,半胱氨酸、絲氨酸、蘇氨酸、酪氨酸、谷氨酰胺、天冬酰胺)。
蛋白質中的這些修飾或突變可使用所屬領域中已知的任何技術來實現。所屬領域中 熟知在蛋白質序列中引入這些變化的重組DNA技術。在某些實施例中,通過定點誘變 編碼所述蛋白質的多核苷酸進行修飾。引入突變的其它技術論述于以下文獻中分子克 隆實驗室手冊(Mo/ecw/ar C/om'wg: A Z^joratory ManwaO ,第2版,山姆布魯克 (Sambrook),福里茨(Fritsch)以及曼尼亞提斯(Maniatis)編,(冷泉港實驗室出版社 (Cold Spring Harbor Laboratory Press) : 1989); 論文酶學中的方法(Mef/zoA ^Tzymo/ogy)(學術出版社(Academic Press, Inc.),紐約(N.Y.));奧蘇貝爾(Ausubel) 等人,最新分子生物學實驗方法匯編(Cwrenf PTOtoco"Mo/ecw/arBZo/ogy)(約翰威 利父子出版社(John Wiley & Sons, Inc.),紐約(New York) ,1999);各自以引用的方 式并入本文中。表達并測試所述修飾蛋白質。在某些實施例中,制備一系列變異體并測 試各變異體確定其生物活性和其穩定性。選擇用于后續使用的變異體可為最穩定的變異 體、最具活性的變異體或者活性和穩定性的組合總體最大的變異體。制備第一組變異體 后,可以基于從第一組變異體學到的知識制備另一組變異體。通常使用所屬領域中已知
19的重組技術產生和過度表達變異體。
已使用本發明系統產生了 GFP變異體。已顯示這些變異體更加穩定并且保留其熒光 性。來自維多利亞水母Ue《wo/ra v!'cfon'a)的GFP描述于基因庫寄存編號P42212屮, 其以引用的方式并入本文中。這一野生型GFP的氨基酸序列如下
MSKGTEELFTGVWILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPWW PTLVTTFSYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVK FEGDTLWRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGKVNFKIRHNI EDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMV1XEFVTAA GriHGMDELYK (SEQ ID NO: 1)
野生型GFP的理論凈電荷為-7。使用本發明系統已產生理論凈電荷為-29、 -30、 -25、 +36、 +48以及+49的變異體。即使加熱+36 GFP到95'C后,100%的變異蛋白質也是可 溶的并且蛋白質保留>70%的熒光性。
已產生的GFP變異體的氨基酸序列包括
GFP-NEG25
MGHH朋HHGGASKGEELFTGVWILVELDGDVNGHEFSVRGEGEGDATEGELTLKF ICTTGELPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTISFKDD GTYKTRAEVKFEGDTLVNR1ELKGIDFKEDGNILGHKLEYNFNSHDVYITADKQENGI KAEFEIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDDHYLSTESALSKDPNEDRDHM VLLEFVTAAGIDHGMDELYK (SEQ ID NO: 2)
GFP-NEG29
MG朋HH朋GGASKGEELFDGEVPILVELDGDVNGHEFSVRGEGEGDATEGELTLKF ICTTGBLPVPWPTLVTTLTYGVQCFSRYPDHMDQHDFFKSAMPEGYV卿TISFKDD GTYKTRAEVKFEGDTLVNR正LKGIDFKEDGNILGHKLEYNFNSHDVY1TADKQENGI KAEFEIRHNVEDGSVQLADHYQQ離IGDGPVLLPDDHYLSTESALSKDPNEDRDHM VLLEFVTAAGIDHGMDELYK (SEQ ID NO: 3)
GFP-NEG30
MGHHHHHHGGASKGEELFDGVVP1LVELDGDVNGHEFSVRGEGEGDATEGELTLKF ICTTGELPVPWPTLVTTLTYGVQCFSDYPDHMDQHDFFKSAMPEGYVQERTISFKDD GTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHDVYITADKQENGI
KAEFEIRHNVEDGSVQLADHY,TPIGDGPVLLPDDHYLSinESALSKDPNEDRD應 VLLEFVTAAGIDHGMDELYK (SEQ ID NO: 4)
GFP-POS36
MGHHHHHHGGASKGERLFRGKVPILVELKGDVNGHKFSVRGKGKGDATRGKLTLK FICTTGKLPVPWPTLVTTLTYGVQCFSRYPKHMKR抑FFKSAMPKGYVQERTISFKK DGKYKTRAEVKFEGRTLVNRIKLKGRDFKEKGNILGHKLRYNFNSHKVYITADKRK NGIKAKFKIRHNVKDGSVQLADHYQQ匿IGRGPVLLPRNHYLSTRSKLSKDPKEKR D顧VLLEFVTAAGIKHGRDERYK (SEQ ID NO: 5)
GFP-POS42
20MGHHHH朋GGRSKGKRLFRGKVPILVELKGDVNGHKFSVRGKGKGDATRGKLTLK FICTTGKXPVPWPTLVTTLTYGVQCFSRYPKHMKRHDFFKSAMPKGYV卿TISFKK DGKYKTRAEVKFEGRTLVNRIKLKGRDFKEKGNILGHKLRYNFNSHKVYITADKRK NGIKAKJFKIRHNVKDGSVC LADHYQQ證KmGPVLLPRKHYLSTRSKLSKDPKEKR DHMVLLEFVTAAGIK恥RKERYK (SEQ ID NO: 6)
GFP-POS49
MGHHHHHHGGRSKGKRLFRGKVPILVKLKGDVNGHKFSVRGKGKGDATRGKLTLK FICTTGKLPVPWPTLVTTLTYGVQCFSRYPKHMKRHDFFKSAMPKGYVQERTISFKK DGKYKTRAEVKFKGRTLVNRIKLKGRDFKEKGNILGHKLRYNFNSHKVYITADKRK NGIKAKFK1RHNVKDGSVQLAKHYQQNTPIGRGPVLLPRKHYLSTRSKLSKDPKEKR DHMVLKEFVTAAGIKHGRKERYK (SEQ ID NO: 7)
所屬領域的技術人員應了解,同源蛋白質同樣視為在本發明范圍內。舉例來說,任 何包括一段20、 30、 40、 50或IOO個氨基酸與任何上述序列60%、 70%、 80%、 90%、 95%或100%同源的蛋白質視為本發明的一部分。另外,本發明還涵蓋添加和缺失變異體。 在某些實施例中,具有如任何上述序列中所示的突變殘基的任何GFP視為本發明的一部 分。在某些實施例中,序列包括2、 3、 4、 5、 6、 7、 8、 9、 10個或10個以上如任何以 上序列中所示的突變。
編碼上述G F P變異體的任何D N A序列也包括在本發明范圍內。編碼以上各變異體 的示范性DNA序列如下
GFP-NEG25
ATGGGGCATCACCATCATCATCATGGCGGTGCGTCTAAGGGGGAGGAGTTATTTA
CGGGTGTGGTGCCGATCCTGGTGGAGCTTGATGGCGATGTTAACGGCCATGAATT
TTCTGTCCGCGGTGAAGGGGAGGGTGATGCCACGGAAGGGGAGCTGACACTTAA
ATTTATTTGCACCACCGGTGAACTCCCGGTCCCGTGGCCGACCCTGGTGACCACC
CTGACCTACGGCGTTCAATGCTTTTCACGTTATCCGGATCACATGAAGCAACACG
ACTTCTTTAAAAGCGCGATGCCTGAAGGCTATGTTCAAGAACGTACAATTAGTTT
TAAAGATGACGGCACCTACAAGACCCGTGCGGAAGTAAAATTTGAAGGGGACAC
TTTAGTGAACCGCATCGAGCTGAAAGGGATCGATTTTAAAGAAGATGGGAATAT
CCTGGGACACAAACTTGAATACAACTTTAATAGTCATGACGTCTATATCACGGCG
GACAAACAGGAAAACGGAATTAAGGCAGAATTTGAGATTCGGCATAATGTCGAA
GATGGCTCGGTACAGTTGGCTGATCACTATCAGCAGAATACGCCGATTGGAGAT
GGTCCGGTTTTATTACCAGACGATCACTATCTGTCCACCGAATCCGCCCTGAGCA
AAGATCCGAATGAAGACCGGGACCATATGGTTCTGCTGGAATTTGTTACGGCGG
CTGGTATTGACCATGGCATGGATGAGCTGTATAAGTAG (SEQ ID NO: 8)
GFP-NEG29<formula>formula see original document page 22</formula><formula>formula see original document page 23</formula>已使用本發明系統產生了鏈霉親和素變異體。已顯示這些變異體形成結合生物素的 可溶性四聚體。這一野生型鏈霉親和素的氨基酸序列如下
AAEAGITGTWYNQLGSTFIVTAGADGALTGTYESAVGNAESRYVLTGRYDSAPATD GSGTALGWTVAWKNNYRNAHSATTWSGQYVGGAEARrNTGWIXTSGTTEANAWK STLVGHDTFTKVKPSAAS (SEQ ID NO: XX)
野生型鏈霉親和素的理論凈電荷為-4。使用本發明系統已產生理論凈電荷為-40禾口 +52的變異體。即使加熱變異體到IOO'C后,蛋白質仍可溶。 已產生的鏈霉親和素變異體的氨基酸序列包括 SAV-NEG40
MGHHHHHHGGAEAG汀GTWYNQLGSTFIVTAGADGALTGTYESAVGDAESEYVLT GRYDSAPATDGSGTALGWTVAWKNDYENAHSATTWSGQYVGGAEARINTQWLLT SGTTEADAWKSTLVGHDTFTKVEPSAAS (SEQ ID NO: XX)
SAV-POS52
MGHHHHHHGGAKAGITGTWYNQLGSTFIVTAGAKGALTGTYESAVGNAKSRYVLT GRYDSAPATKGSGTALGWTVAWKNKYRNAHSATTWSGQYVGGAKARINTQWLLT SGTTKAKAWKSTLVGHDTFTKVKPSAAS (SEQ ID NO: XX)
所屬領域的技術人員應了解,同源蛋白質同樣視為在本發明范圍內。舉例來說,任 何包括一段20、 30、 40、 50或100個氨基酸與任何上述序列60%、 70%、 80%、 90%、 95%或100%同源的蛋白質視為本發明的一部分。另外,本發明還涵蓋添加和缺失變異體。 在某些實施例中,具有如任何上述序列中所示的突變殘基的任何鏈霉親和素視為本發明 的一部分。在某些實施例中,序列包括2、 3、 4、 5、 6、 7、 8、 9、 10個或10個以上如 任何以上序列中所示的突變。
編碼上述鏈霉親和素變異體的任何DNA序列也包括在本發明范圍內。編碼上述各 變異體的示范性DNA序列如下
SAV-NEG40
TTTAGGTTGGACCGTAGCGTGGAAGAATGATTATGAAAACGCACATAGCGCAAC AACGTGGTCAGGGCAGTACGTTGGCGGAGCTGAGGCGCGCATTAACACGCAGTG GTTATTAACTAGCGGCACCACTGAAGCTGATGCCTGGAAGAGCACGTTAGTGGG TCATGATACCTTCACTAAAGTGGAACCTTCAGCTGCGTCATAATAATGACTCGAG ACCTGCA (SEQK)NO: XX)
SAV-POS52
G P
c c
A c
c T
c c
A G
c G
c A
d訂
c G
A A
S c
T c
A A
c A
G T
G G
丁 G
A T
c c
c c
A T
H c
G c
G A
G A
A G
T c
G G
T G
c a
y c
M G
w G
T G
c K
c 5
G G
G c
c T
c G
c A
G T
G G
c c
A: AGGTTCAGCCATGGGTCATCACCACCACCATCACGGTGGCGCCAAAGCAGGTATT ACCGGTACCTGG丁ATAACCAGTTAGGCTCAACCTTTATTGTGACCGCGGGAGCGA
ACGTATTAACCGGTCGTTATGATAGCGCGCCGGCGACTAAAGGTAGCGGTACTG
CTTTAGGTTGGACCGTAGCGTGGAAGAATAAGTATCGTAATGCGCACAGTGCTAC
CACTTGGTCAGGGCAGTACGTAGGGGGAGCCAAAGCACGTATCAACACGCAGTG
GTTATTAACATCAGGTACCACCAAAGCGAAAGCCTGGAAGAGCACGTTAGTGGG TCATGATACCTTCACTAAAGTGAAACCTTCAGCTGCGTCATAATAATGACTCGAG ACCTGCA (SEQIDNO: XX)
與上述序列同源的多核苷酸序列也在本發明范圍內。在某些實施例中,多核苷酸序 列包括與任何一個上述序列60%、 70%、 80%、 90%、 95%、 98%、 99%或100%同源的 一段50、 100或150個核苷酸。本發明也包括一個上述序列中插入或缺失一個或一個以 上核苷酸的序列。任何具有任何上述序列中所示的突變的多核苷酸序列都視為本發明的 一部分。在某些實施例中,序列包括2、 3、 4、 5、 6、 7、 8、 9、 10個或10個以上如任 何以上序列中所示的突變。
本發明也提供包含使用本發明系統修飾的本文中的f壬何本發明序列或任何其它序 列(DNA或蛋白質)的載體(例如,質體、粘粒、病毒等)。在某些實施例中,載體包 括適用于在細胞'l'過度表達本發明鏈霉親和素變異體的元件(諸如啟動子、增強子、核 糖體結合位點等)序列。本發明也包括包含本發明序列或載體的細胞。在某些實施例中, 細胞過度表達變異鏈霉親和素。細胞可為細菌細胞(例如,大腸桿菌)、真菌細胞(例 如,巴斯德畢赤酵母)、酵母細胞(例如,釀酒酵母)、哺乳動物細胞(例如,CHO細胞) 或人類細胞。
已使用本發明系統產生了谷胱甘肽-S-轉移酶(glutathione-S-transferase, GST)的變
異體。已顯示這些變異體保留野生型GST的催化活性。這一野生型GST的氨基酸序列 如下
MGHHHH冊GGPPYTITYFPVRGRCEAMRMLLADQDQSWKEEVVTMETWPPLKPSC LFRQLPKFQDGDLTLYQS函LRHLGRSFGLYGKDQKEAALVDMVNDGVEDLRCKY ATLIYTNYEAGKEKYVKELPEHLKPFETLLSQNQGGQAFWGSQISFADYNLLDLLRI HQVLNPSCLDAFPLLSAYVARLSARPKIKAFLASPEHVNRPINGNGKQ (SEQ ID NO: XX)
野生型GST的理論凈電荷為+2。使用本發明系統已產生理論凈電荷為-40的變異體。 這一變異體催化谷胱甘肽添加至二硝基氯苯,其比活性僅為野生型GST的1/2.7。即使 加熱變異體到IO(TC后,蛋白質仍可溶,并且經冷卻時蛋白質恢復其40%的催化活性。
GST變異體的氨基酸序列包括
GST-NEG40MGHHHHHHGGPPYTITYFPVRGRCEAMRMLLADQDQSWEEEVVTMETWPPLKPSC LFRQLPKFQDGDLTLYQS函LRHLGRSFGLYGEDEEEAALVDMVNDGVEDLRCKY ATLIYTDYEAGKEEYVEELPEHLKPFETLLSENEGGEAFVVGSEISFADYNLLDLLRIH QVLNPSCLDAFPLLSAYVARLSARPE正AFLASPEHVDRPINGNGKQ (SEQ IDNO: XX)
GST-POS50
MGHHHHHHGGPPYTITYFPVRGRCEAMRMLLADQKQSWKEEVVTMKTWPPLKPSC LFRQLPKFQDGKLTLYQS函LRHLGRSFGLYGKKQKEAALV而VNDGVEDLRCKY ATUYTKYKAGKKKYVKKLPKHLKPFETLLSKNKGGKAFVVGSKISFADYNLLDLLR IHQVLNPSCLKAFPLLSAYVARLSARPKIKAFLASPEHVKRPINGNGKQ (SEQ ID NO: XX)
所屬領域的技術人員應了解,同源蛋白質同樣視為在本發明范圍內。舉例來說,任 何包括一段20、 30、 40、 50或IOO個氨基酸與任何上述序列60%、 70%、 80%、 90%、 95%或100%同源的蛋白質視為本發明的一部分。另外,本發明還涵蓋添加和缺失變異體。 在某些實施例中,具有如任何上述序列中所示的突變殘基的任何鏈霉親和素視為本發明 的一部分。在某些實施例中,序列包括2、 3、 4、 5、 6、 7、 8、 9、 10個或10個以上如 任何以上序列中所示的突變。
編碼上述GST變異體的任何DNA序列也包括在本發明范圍內。編碼上述各變異體 的示范性DNA序列如下
GST-NEG40
ACCAGTCTAACGCGATCTTACGTCATTTAGGTCGCTCATTTGGTTTATACGGTGA AGATGAAGAAGAAGCAGCCTTAGTGGATATGGTGAATGATGGCGTGGAAGACTT ACGTTGTAAATACGCGACGTTAATTTACACTGATTATGAAGCCGGTAAAGAGGA GTACGTGGAAGAATTACCTGAACACCTGAAGCCGTTTGAAACATTACTGAGCGA
GCTTTCTTAGCGTCACCTGAACACGTAGACCGCCCGATTAACGGAAACGGCAAG CAGTAATAATGAGGTACCACCTGCA (SEQ ID NO: XX)
GST-POS50
c c
A
G
P A
c
T
c T
孤w
2 G
G a
G K
乂 G
t" G
A訂
y c
b G
G
t G
1 c
G
T T
G c
G C
c t
A:
G
A t
S c
G t
A: r
K G
T
Ac G
c A
G c
G G
26GGTTCAGCCATGGGTCATCACCACCACCATCACGGTGGCCCGCCGTACACCATTA
CATACTTTCCGGTACGTGGTCGTTGTGAAGCGATGCGTATGTTATTAGCGGACCA
GAAACAATCATGGAAAGAAGAAGTAGTGACAATGAAGACCTGGCCGCCGTTAAA
GCCTAGCTGTTTATTCCGTCAATTACCGAAGTTTCAGGATGGTAAATTAACCTTAT
ACCAGTCTAACGCGATCTTACGTCATTTAGGTCGCTCATTTGGTTTATACGGTAA
GAAGCAGAAAGAAGCAGCCTTAGTGGATATGGTGAATGATGGCGTGGAAGACTT
ACGTTGTAAATACGCGACGTTAATTTACACTAAATATAAAGCCGGTAAAAAGAA
GTACGTGAAAAAATTACCTAAACACCTGAAGCCGTTTGAAACATTACTGAGCAA
AAATAAAGGAGGTAAGGCGTTCGTAGTTGGTAGCAAGATTAGCTTCGCTGATTA丁
TTTCCCGTTACTGAGCGCATATGTAGCGCGCCTGAGCGCCCGTCCGAAGATCAAA GCTTTCTTAGCGTCACCTGAACACGTGAAGCGCCCGATTAACGGAAACGGCAAG CAGTAATAATGAGGTACCACCTGCA (SEQ ID NO: XX)
本發明也提供包含使用本發明系統修飾的本文中的任何本發明序列或任何其它序 列(DNA或蛋白質)的載體(例如,質體、粘粒、病毒等)。在某些實施例中,載體包 括適用于在細胞中過度表達本發明GST變異體的元件(諸如啟動子、增強子、核糖體結 合位點等)序列。本發明也包括包含本發明序列或載體的細胞。在某些實施例中,細胞 過度表達變異GST。細胞可為細菌細胞(例如,大腸桿菌)、真菌細胞(例如,巴斯德 畢赤酵母)、酵母細胞(例如,釀酒酵母)、哺乳動物細胞(例如,CHO細胞)或人類細 胞。
本發明也包括用于修飾所關注蛋白質以產生更穩定的蛋白質變異體的試劑盒。這些 試劑盒通常包括產生蛋白質的更穩定變異體所需的所有或大部分試劑。在某些實施例 中,試劑盒包括輔助研究員基于本發明方法設計更穩定變異蛋白質的計算機軟件。試劑 盒還可包括以下所有或部分試劑、引物、寡核苷酸、核苷酸、酶、緩沖液、細胞、培 養基、培養板、試管、說明書、載體等。使用本試劑盒的研究通常提供用于突變以產生 更穩定變異體的DNA序列。通常包裝這些內含物以便于在實驗室中使用。
在考慮下文實例部分后,將會進一步了解本發明的這些和其它方面,這些實例旨在 說明本發明的某些特定實施例,但不打算限制如權利要求書所定義的本發明的范圍。
實例
實例1-使蛋白質超帶電可賦予極大的恢復力(Resilience)
蛋白質聚集,是人類疾病一個眾所周知的原因(考漢(Cohen,F.E.);凱莉(Kelly, J.W.),自然(淑匿)2003, 426, (6968), 905-9;池蒂(Chiti,F.);多伯森(Dobson, C. M),生物化學年鑒U"朋7 ev fl!'oc/ eAnJ 2006,75,333-66;各自以引用的方式并入本 文中),也是使用蛋白質作為治療或診斷劑所面臨的主要問題(福羅克杰(Frokjaer,S.); 奧特珍(Otzen, D. E.),自然.評論藥物發現(Waf 7 ev Z)rwg D"cov) 2005, 4, (4), 298-306; 法沃勒(Fowler, S. B.);普恩(Poon, S.);墨佛(Muff, R.);池蒂(Chiti, F,);多伯
27森(Dobson, C. M.);佐多(Zurdo,J.),美國國家科學院院刊(尸rac Waf/Acad Sd f/SA) 2005,102,(29), 10105-10;各自以引用的方式并入本文中)。已經從對天然蛋白質的研究 中獲得對蛋白質聚集問題的了解。我們已經知道,蛋白質在攜帶零凈電荷的等電點時可 溶性最小(李伯(Loeb,J.),普通生理學雜志(JGe"/^;^!'o/) 1921,4,547-555,以引 用的方式并入本文中)。新近,已顯示凈電荷的微小差異(±3電荷單位)可以預測球狀 蛋白變異體間(池蒂(Chiti,F.);斯泰法尼(Stefani,M);泰戴(Taddei,N.);雷姆普 尼(Ramponi,G.);多伯森(Dobson, C. M.),自然2003, 424, (6950), 805-8, 以引用的方式并入本文中)以及固有無序肽間(帕瓦(Pawar,A.P.);督拜(Dubay, K. F.); 佐多(Zurdo, J.);池蒂(Chiti, F.);文德斯可羅(Vendruscolo, M.);多伯森(Dobson, C. M),分子生物學雜志(/Mo/別oZ) 2005, 350, (2), 379-92,以引用的方式并入本文 中)的聚集傾向。這些觀察結果連同一些蛋白質可忍受凈電荷顯著變化的最近證據(例 如,發現碳酸酐酶在其表面賴氨酸徹底化學乙酰化后保留催化活性(古迪克森(Gudiksen) 等人,美國化學會志(/A n C7zew Soc) 2005, 127, (13), 4707-14,以引用的方式并入本 文中)) 一起,使我們推斷通過使表面大范圍突變以顯著增加凈電荷(我們在本文中稱 之為"超帶電"的過程)可能會明顯增強一些蛋白質的溶解性和抗聚集性而不消除其折 疊或功能。
我們以最近報導的在折疊效率和變性劑抗性方面已高度優化的綠色熒光蛋白(GFP) 的現有技術變異體(稱為"超折疊GFP" (sfGFP))(派德拉克(Pedelacq)等人,國家 生物技術(Waffiz'ofec/mo/) 2006, 24, (1), 79-88,以引用的方式并入本文中)開始。超 折疊GFP的凈電荷為-7,與野生型GFP類似。根據計算氨基酸的溶劑暴露的簡單算法 (參見"#奔*方法"部分),我們通過使29個最溶劑暴露的(most solvent-exposed)殘 基突變為帶正電的氨基酸而設計出理論凈電荷為+36的GFP超帶電變異體(圖1)。編碼 sfGFP或GFP(+36)的基因的表達濃密地產生綠色熒光菌。蛋白質純化后,測量GFP(+36) 的熒光性質并且發現與sfGFP的熒光性質非常類似。受這一發現鼓勵,我們設計和純化 了凈電荷為+48、 -25以及-30的其它超帶電GFP,同樣發現全部顯示類似sfGFP的熒光 性(圖2a)。所有超帶電GFP變異體顯示類似于sfGFP的圓二色性譜,表明蛋白質具有 類似的二級結構內容(圖2b)。超帶電GFP變異體雖然存在多達36處突變,但其熱力 學穩定性僅比sfGFP稍低(1.0-4.1 kcal/mo1,圖2c和表1)。
雖然sfGFP是GFP優化的歷史悠久的產物(吉普曼斯(Giepmans)等人,科學 (Sc/ence) 2006, 312, (5771), 217-24;以引用的方式并入本文中),但其仍容易受到熱或 化學解折疊誘導而聚集。加熱sfGFP到10(TC誘導其定量沉淀和熒光性不可逆喪失(圖3a)。相反,超帶電GFP(+36)和GFP(-30)當加熱到IOO'C時仍可溶,而冷卻后恢復明顯 的熒光性(圖3a)。重要的是,407。2,2,2-三氟乙醇(TFE)在25'C下幾分鐘內就誘導sfGFP 完全聚集,而+36和-30超帶電GFP變異體在相同條件下數小時都未經歷明顯的聚集或 熒光性喪失(圖3b)。
除這一顯著的抗聚集性之外,超帶電GFP變異體顯示對具有相反電荷的高度帶電的 大分子具有強大的可逆親合力(圖3c)。當GFP(+36)和GFP(-30)以1:1化學計量混合在 一起時立即形成綠色熒光共沉淀,表明折疊蛋白質締合。GFP(+36)類似地與高濃度RNA 或DNA共沉淀。添加NaCl足以溶解這些復合物,這一點與其形成的靜電基礎一致。相 反,sfGFP不受添加GFP (-30)、 RNA或DNA影響(圖3c)。
我們接著需要確定超帶電原理是否可能適用于除GFP以外的蛋白質,GFP是單體并 且具有屏蔽良好的熒光團。為此目的,我們對兩種與GFP無關的蛋白質應用超帶電過程。 鏈霉親和素是總凈電荷為-4的四聚體。使用溶劑暴露算法,我們設計出兩種凈電荷為-40 或+52的超帶電鏈霉親和素變異體。兩種超帶電鏈霉親和素變異體都能夠形成結合生物 素的可溶性四聚體,但親和力減小。
使谷胱甘肽-S-轉移酶(GST)(總凈電荷為+2的二聚體)超帶電來產生凈電荷為-40 的二聚體,其催化谷胱甘肽至二硝基氯苯的加成,比活性僅為野生型GST的1/2.7 (圖 3d)。此外,超帶電鏈霉親和素和超帶電GST在加熱到IO(TC時仍可溶,這與其野生型 對應物相反,后者類似于sfGFP發生定量且不可逆的沉淀(表l)。另外,GST(-40)冷卻 后恢復其催化活性的40% (圖3d)。
總之,我們已經證明可通過簡單地用帶類似電荷的氨基酸置換大多數溶劑暴露的殘 基來使具有不同結構和功能的單體和多聚蛋白質"超帶電"。超帶電可大大改變蛋白質 的分子間性質,賦予明顯的抗聚集性和以折疊形式與帶相反電荷的大分子(如"分子維 可牢(molecular Vdcro)")締合的能力。我們注意到這些不尋常的分子間性質是源于高 凈電荷,而不是源于帶電氨基酸的總數,帶電氨基酸的總數并不因超帶電過程明顯改變 (表1)。
與這些顯著的分子間效應相反,此處研究的7種超帶電蛋白質的分子內性質(包括
折疊、熒光性、配體結合以及酶促催化)仍基本上完好。因此,超帶電可能是一種降低 聚集傾向和提高蛋白質溶解性而不消除其功能的有效方法。這些原理可能尤其適用于新
穎(&加w)蛋白質的設計工作,其中包括聚集在內的不可預測的蛋白質處理性質仍是 一項重大挑戰。根據使天然蛋白質超帶電的上述結果,人們不禁推測所設計的蛋白質的 抗聚集性亦可能通過使設計過程偏向于增加帶類似電荷的氨基酸在預測位于折疊蛋白
29200780027139.3
質外部的位置上的頻率來提高。
蛋白質超帶電說明蛋白質表面的顯著可塑性并突出源于溶劑暴露殘基的突變忍受 性(mutational tolerance)的機會。舉例來說,最近顯示一些蛋白質的熱力學穩定性可通 過合理地工程改造電荷-電荷相互作用來增強(斯曲克勒(Strickler)等人,生物化學 (BZoc/iem"f 7) 2006, 45, (9), 2761-6,以引用的方式并入本文中)。蛋白質超帶電證明 這種可塑性如何能以不同的方式加以利用從而賦予極強的蛋白質聚集抗性。我們的發現 與補充研究的結果一致,在補充研究中從泛素去除所有電荷,其折疊性保持完好而其溶 解性明顯受損(勞拉茲(Loladze)等人,蛋白質科學(PraW"Sd) 2002, ll,(l), 174-7, 以引用的方式并入本文中)。
這些觀察結果也可說明天然蛋白質的適度(modest)凈電荷分布(卡耐特(Knight) 等人.,美國同家科學院院刊(尸rac淑Mc。"d脂)2004, 101, (22), 8390-5;吉特林 (Gitlin)等人,德國應用化學雜志C/^m/W五d&ig/) 2006, 45, (19), 3022-60, 各自以引用的方式并入本文中)例如,84%的蛋白質數據庫(PDB)多肽的凈電荷在土10 范圍內。我們的結果與高凈電荷產生足夠的靜電推斥從而迫使解折疊的假設相沖突。的 確,GFP(+48)具有高于目前PDB中的任何多肽的正凈電荷,但仍保留折疊和發熒光的 能力。實際上,我們的發現提示非特異性分子間粘附可能不贊成太多高電荷天然蛋白質 的演化。幾乎所有具有極高凈電荷的天然蛋白質(諸如結合RNA的核糖體蛋白L3(+36) 和L15(+44)或結合鈣陽離子的肌集鈣蛋白(-80))都與帶相反電荷的物質締合,作為其必 需細胞功能的一部分。
鼎/〃方法
設計程序和超帶電的蛋白質序列從公開的結構數據鑒別AvNAPSA < 150 (其中 AvNAPSA是每個側鏈原子的平均相鄰原子(在10 A范圍內))的溶劑暴露殘基(以下 以灰色顯示)(韋伯(Weber, P.C.),奧蘭多夫(Ohlendorf, D.H.),文多羅斯奇(Wendoloski, J丄)以及莎勒麥(Salemme, F.R.),與鏈霉親和素結合的高親和力生物素的結構起因 (Structural origins of high-affinity biotin binding to streptavidin).禾斗學(Sc/ewce) 243, 85-88 (1989);迪爾(Dirr,H.),瑞納默(Reinemer, P.)以及胡伯(Huber,R.) 2.1 A分 辨率下豬類兀谷胱甘肽S-轉移酶(pGST PI-1)的細化晶體結構(Refined crystal structure of porcine class Pi glutathione S-transferase (pGST PI-1) at 2.1 A resolution),分子生物學 雜志(/Mo/腺)243, 72-92 (1994);普德拉克(Pedelacq, J.D.),卡班特斯(Cabantous, S.),曲恩(Tran,T.),特威爾格(Terwilliger, T,C.)以及瓦爾多(Waldo, G.S.) 超折 疊綠色熒光蛋白的工程改造禾口表征(Engineering and characterization of a superfolder
30green fluorescent protein).自然生物技術(A^fli'Wec/i"oD 24,79-88 (2006),各自以弓l 用的方式并入本文中)。突變帶電或高極性的溶劑暴露殘基(DERKNQ):對于超帶負電 (紅色),突變為Asp或Glu;或對于超帶正電(藍色),突變為Lys或Arg。綠色熒光蛋 白(GFP)變異體中待突變的其它表面暴露位置根據GFP同源物中這些位置的序列變異 性來選擇。鏈霉親和素(SAV)和谷胱甘肽-S-轉移酶(GST)的超帶電設計過程是全自 動的首先通過溶劑暴露分選殘基,然后突變最溶劑暴露的帶電或高極性殘基對于超 帶正電,突變為Lys;或對于超帶負電,突變為Glu (除非開始殘基是Asn,在此狀況下 突變為Asp)。
SAV(-40〉 wtSAV SAV(+52)
SAV (-40) LGWTVAW,^llAlSMrWSGQYp與辨INTQWLLTSG象驟,W^ST:LVGHD^瞎灘育操; wtSAV IiGWTVAW^(^lA^SATTWSGQ碌離驗INTQWIjliTSG翁磁lwilsTLV。HDlFl^1^^
wtGST GST(+50)
GST(-40) wtGST GST(+50)
GST(-4 0) wtGST (3ST( + 50)
'、-i"c鄰;^ZW'一二^i' @ ^ PS^VS" W
船HHHteHGGPg魂TYFgVRGRCEAMRMLLAD趣SW腿每
75 —
ILRHLO一pJLYG^鵬AALVD醒DGVEDLR彈Y竭ill^^^辟0Y^每:L魏HI^PFE旁L]^g^!^F
1:LRHLGR臺,gliYG系D.0《^AAIiVDMVNDGVEr)IiR:^^Y、iilLIi^ ^!^^^:一.!^i:扭I^每HX^PFE^;;LI^&k^ -Q^ ILRHLGRg賴LYG纖線AAIiVDMVWDGVEDIiR^yAtL:i;突I^S^^^Yi^2L^HI^PFE^LL^[g^i^^F
151
W@|gl S FADYNIiliDli!iR工
蛋白質的表達和純化從DNA2.0購得針對大腸桿菌密碼子使用進行優化的合成基 因,克隆入pET表達載體(諾瓦杰公司(Novagen))并在15°C下在大腸桿菌BL21 (DE3) pLysS中過度表達5-10小時。通過離心收集細胞并通過超聲波作用溶解。通過Ni-NTA 瓊脂糖色譜法(凱杰公司(Qiagen)純化蛋白質,將緩沖液換成100 mM NaCl、 50 mM 磷酸鉀(pH 7.5),并通過超濾(密理博公司(Millipore))濃縮。在天然條件下純化所 有GFP變異體。從普洛麥格公司(Promega)購買野生型鏈霉親和素。在變性條件下純 化超帶電的鏈霉親和素變異體并且如先前關于野生型鏈霉親和素所報導進行重折疊(賽 姆普森(Thompson)等人.合成鏈霉親和素編碼基因在大腸桿菌中的構建和表達 (Construction and expression of a synthetic streptavidin-encoding gene in Escherichia coli). 基因(Gwe) 136,243-246 (1993),以引用的方式并入本文中),超帶電GST也是如此。在天然或變性條件下純化野生型GST,得到具有可比活性的蛋白質。
表面靜電勢計算(圖lb): -30和+48超帶電GFP變異體的模型是基于超折疊GFP 的晶體結構(普德拉克(Pedelacq)等人,超折疊綠色熒光蛋白的工程改造和表征 (Engineering and characterization of a superfolder green fluorescent protein). 自然生物技 術(A^£!Wec/mo/) 24,79-88 (2006),以引用的方式并入本文中)。使用-25 kT/e (紅色) 至+25kT/e(藍色)的標度,使用APBS (貝克(Baker)等人,納米系統的靜電學對微管 蛋白禾卩核糖體的應用 (Electrostatics of nanosystems: application to microtubules and the ribosome).美國國家科學院院刊(尸r。c Ato/Ac"""'眼)98, 10037-10041 (2001), 以引用的方式并入本文中)計算靜電勢并用PyMol (德拉諾(Delano, W丄.),PyMOL 分子制圖系統(The PyMOL Molecular Graphics System) , www.pvmol.org (2002),以引 用的方式并入本文中)表現。
蛋白質染色和紫外光誘導的熒光性(圖2a):在10%變性聚丙烯酰胺凝膠中通過電 泳分析0.2微克的各GFP變異體并用考馬斯亮藍(Coomassie brilliant blue)染料染色。 在0.2 mL艾本德管(Eppendorf tube)中放入0.2微克于具有100 mM NaCl的25 mM Tris (pH8.0)中的相同蛋白質樣品并在紫外光(360 nm)下拍照。
熱變性和聚集(圖3a):將純GFP變異體在25 mM Tris (pH 8.0)、 100 mM NaCl 以及lOmMe-巰基乙醇(BME)中稀釋為2 mg/mL,然后在紫外光照射下拍照("天然")。 加熱樣品到IO(TC持續1分鐘,然后再次在紫外光照射下拍照("煮沸")。最后,在室溫 下冷卻樣品2小時并再次在紫外光照射下拍照("冷卻")。
化學誘導的聚集(圖3b):添加2,2,2-三氟乙醇(TFE)以產生具有1.5 mg/mL蛋白 質、25 mM Tris (pH7.0)、 10 mM BME以及40% TFE的溶液。在25。C下通過直角光散 射監測聚集。
尺寸排阻色譜法(表l):通過在休珀代克斯75 (S叩erdex 75)凝膠過濾柱上分析 20-50微克蛋白質來確定SAV和GST變異體的多聚狀態。緩沖液為100 mM NaCl、50 mM 磷酸鉀(pH7.5)。通過與一組在相同條件下單獨分析的具有已知分子量的單體蛋白質標 準物作比較確定分子量。
表l:計算的和實驗確定的蛋白質性質
名稱 MW長度n正n負n帶屯Q凈pi AG 天然MW(kD)b煮沸后
(kD) (aa) (kcal/mol)a 的可溶
百分率e
GFP(-30)27.8 248 19 4968 -30 4.810.2 n.d. 98<formula>formula see original document page 33</formula>#!/usr/local/bin/perl
林#祐弁并#柳祐羅###弁杯杯謹#弁#弁#####祐祐弁弁,嚇弁,扭祐弁祐#弁謹,謹##弁祐#祐, 弁
# ervnapsa
#
# prints list of AvNAPSA values for the specified PDB
#
# Mike Lawrence/Kevin Phillips 3/17/200S
#歸弁##祐弁弁弁弁并括函弁弁祐弁歸弁祐#弁 梓#弁#封弁##幹祐弁##弁弁,祐弁祐#祐弁弁祐#柳,祐 sub show—usage print "\n",
"Usage : avnapsa <sta:rt_jpdb> [params] \n",
"-3use 3-letter aa abbreviations (default》\n",
"-1 use 1-letter abbreviations\n",
"-onecol print one column only only the AvNAPSA results)\n\n
##弁#弁弁#祐#杯祐弁弁弁弁## global variables扭弁杉#杯##杯#弁##弁祐#弁#祐#弁#杯弁弁#祐存##祐弁#
atoms,'
# fields loaded f:rom PDB:
弁type 祐atOTrtNum 弁atomNanie 弁resName 祐chain 祐r&sNura ft x, y, z
# computed fields
祐neighborCcnmt
distances;
residues,*
祐fields copied from PDB
# re幼um (PDB numbering)
弁rssNaiTis 祐 computed fields
轉謹麵弁弁弁弁#祐弁弁坊# ,###弁祐卿接#娜弁并######弁羅弁弁弁弁弁弁#括弁弁函#,飼 #杯parse co腳and line
$onec!ol—f lag = 0;
$start_pdb = $ARGV〖0];
for (my $a = 1〖$a < @ARGV; ++$a)
if ($ARGV$a〕 eq "-1") { $use3orl = 1; }
34elsif ($ARGV$a〗eq "-3") { $use3orl = 3; } elsif ($ARGVI$a] eg "-onecol") { $onecol—flag =1; } else { show—usage () ; die "Invalid argument $ARGV[$aj \nn} } 一
unless {1c $start_pdb =~ /\,pdb/) { show—usage () ,' die "No starting pdb specif ied, ; }
read PDB and compute molecular parameters
read—PDB (祭startjdb〉 / tabulate—residues(); $mres - residues/
compute—distances(); compute—neighbor—counts(》; ccompute—residue—avNapsa ();
print—residues();
# print—residues
祐 —
接
sub print—residues
{ _
for <my $r - 0; $r - residues$r++)
my $name - $residues [$rj {resName};
$natne - toggle31 ($name) if ($use3ofl豕碟1);
printf "Sd %s AvNAPSA ", $residues [$r〗{resNum}, $natne unless $onecol—f lag,'
printf "%.0f\n" ,$:residueB [$r〗{avNapsa};
print "\nNum residues - ", $#residLues+!L, "\n\n" unless $onecol—flag
弁 tabulate—residues 井 一
# goes through list of atoms and makes a list of amino acid residues
祐and stores it in global variable接residues
弁
sub tabulate—residues
{ 一
for =0; $a < atoms; $a++)
$resNutn - $atoms I$a] {resNum); if ( ! resNiim—exists ($resNum))
push residues.resName =:> $atoms I$a) {resName}
扭
# resNum—exists
# —
# returns 1 if resNum is contained in residues
sub resNutn—exists ($)
{ 一
my ($resNum) -您—;
foa: ($r - 0; $r < residues,' $r++)
return 1 if ($residues$r〗(resNum) -= $resWutn),'
return 0/
# resNum—to—resindex 杯 一 —
# converts PDB numbering to index in residues 祐
sub rfesNum_to_jresindex ($) tny ($resNum)=您—;
fo;r - 0; $r c residues,' $r++)
return $r if ($residues〖$r].{res:KuTn} -- $resNum》; return "none";
弁
# readTOB(filename) 扭
# reads the atoms from a Pt)B and returns them as an array of hashes 林
sub read PDB《$)
{ 一
my ($filename)@一,'
open $filename》or die("Cou2d not open $filename\ii"),'
$#atoms - —1; # clear atoms storage
36弁read the file
foreach UPD:B>) {
my $type = triTti《substr($—' 0'6) ); # RTyp field is columns 1-6
next unless ($type eg "ATOM" |j $type eq ,'HETATM");
20
my $resNaine = tr:im<substr<$—, 17, 3〉》; my車atomNa頂e - trim(subBtr($—, 12, 4)〉;
next if uc $resName eg "HOH";
next if uc $atomNatne =— /A
*\,
+\
{resNum} ,* my $resNum2 = $residues [$r2〗{aresNum};
my $min—dlst = 100000D
for 0; $al < @atoms,' —$al)
next unless ( $atoms[$al] {resNuni} c= $resNuna ); for ($a2 >= D; $汰2 <通atoms,' ++$a2)
next unless ( $atoms$a2] {resNum} $:resN"UTn2 )z my $dist - $distances$al] t"2〗,
dist e $dist if ($dist - $Tnin—ciist〉;
retum $min—dist;
弁
# compute—distances
# —
祐 computes the distances between all atoms 祐
sub compute—distances
for (my $atoml=0,' $atom;i < @atoms'' $atotni++)
for(Tny $atom2=$atoml; $atom2 < atoms; $atom2++)my ($xl, $yl, $z;l〉 - ($atoms [$atonaJ ->{x}, $atonis [$atoml] ->{y},$atoms$atoml] ->{z})
ray ($x2, "2, $2;2) -《$atoms [$atotu2〗->{x}, $at。ms [$atom2〗->{y},$atoms [$atom2〕 ->{z})-
my $distance = sgrt(($xl-$x2〉**2 + ($yl-$y2)**2 + ($zl-$22);
$distances$atoml〗[$atom2〗 e $distance〖$distances〖$atotn2] [$atoml〗 》 $distance;
#
對 compute—neighbor—counts
# 一 —
# computes the number of neighbors that each atom has.
衫par汰mter is the cutoff, in Angstroms, for atomic neighborhood
轉
sub compute—neighbor__co"unts
5D工STANCE—CUTOFF 10,' 祐criterion for neighborhood, in Angstroms
for ($atom:i=0; $atoml <船tonis; $atotnl++)my $count = 0;
for ($atoxn2-D,' $atom2 < atoms; $Eitotri2++)
$count++ if <$dtistances f$atoral〗〖$atoTn2J$DISTAWCE—CUTOFF$atoml Ik $atom2〉,,
$atoras [$atoml〗{neighborCount} ■ $count;
祐 compute—residue—avNapsa弁 "" 一
# for each residue, compute
# Average Neighbor Atoms Per Sidechain Atom 《AvNAPSA)祐 (sidechain atoms axe all those except N, C, O, CA)
# for glycines, just use CA祐
sub com;pute一residue一avNapsa
for (tny $r = 0; $r < residues; $r+ + )
my $numSideChainAtoms k
my* $totalNeighbors - 0;
my $resName = $resiciues$r] {resName},'
my $resKum = $residues I$r〗{resNutn};
39<formula>formula see original document page 40</formula><formula>formula see original document page 41</formula>
權利要求
1. 一種提高所關注蛋白質的穩定性的方法,所述方法包含以下步驟鑒別所關注蛋白質的表面殘基在與所關注的所述蛋白質相關的其它蛋白質中是非高度保守的;和用在生理pH值下帶正電的氨基酸殘基置換多個非保守表面殘基。
2. —種提高所關注蛋白質的穩定性的方法,所述方法包含以下步驟鑒別所關注蛋白質的表面殘基在與所關注的所述蛋白質相關的其它蛋白質中是非高度保守的;和用在生理pH值下帶負電的氨基酸殘基置換多個非保守表面殘基。
3. 根據權利要求l或2所述的方法,其中所述非保守表面殘基是疏水性的。
4. 根據權利要求1所述的方法,其中所述非保守表面殘基是親水性的或帶負電的。
5. 根據權利要求2所述的方法,其中所述非保守表面殘基是親水性的或帶正電的。
6. —種提高所關注蛋白質的穩定性的方法,所述方法包含以下步驟鑒別所關注蛋白質的表面殘基;鑒別所關注的所述蛋白質的表面殘基在與所關注的所述蛋白質相關的其它蛋白質中是非高度保守的;給每一個所述所鑒別的非保守表面殘基指定疏水性值;和用在生理pH值下帶電的氨基酸殘基置換至少一個表面殘基,其中所述被置換的 殘基全部突變為相同類型的殘基,其中所述類型的殘基是帶正電殘基或帶負電殘 基。
7. 根據權利要求6所述的方法,其中所述置換步驟包含置換至少一個疏水性表面殘基。
8. 根據權利要求6所述的方法,其中所述置換步驟包含置換至少一個親水性表面殘 基。
9. 根據權利要求6所述的方法,其中所述置換步驟包含置換至少一個帶電表面殘基。
10. 根據權利要求6所述的方法,其中所述置換步驟包含用賴氨酸殘基置換至少一個表 面殘基。
11. 根據權利要求6所述的方法,其中所述置換步驟包含用天冬氨酸或谷氨酸殘基置換 至少一個表面殘基。
12. 根據權利要求l、 2或6所述的方法,其中所述置換步驟包含置換至少兩個表面殘
13. 根據權利要求l、 2或6所述的方法,其中所述置換步驟包含置換至少五個表面殘 基。
14. 根據權利要求l、 2或6所述的方法,其中所述置換步驟包含置換至少十個表面殘 基。
15. 根據權利要求1、 2或6所述的方法,其中所述置換步驟包含置換至少二十個表面 殘基。
16. 根據權利要求l、 2或6所述的方法,其中所述置換步驟包含置換至少三十個表面
17. 根據權利要求1、 2或6所述的方法,其中所述方法產生在生理pH值下凈電荷比 所關注的初始蛋白質高的修飾蛋白質。
18. 根據權利要求2或6所述的方法,其中所述方法產生在生理pH值下所帶負電荷比 所關注的初始蛋白質多的所關注的修飾蛋白質。
19. 根據權利要求2或6所述的方法,其中所述方法產生在生理pH值下所帶負電荷比 所關注的初始蛋白質多至少-5的所關注的修飾蛋白質。
20. 根據權利要求2或6所述的方法,其中所述方法產生在生理pH值下所帶負電荷比 所關注的初始蛋白質多至少-10的所關注的修飾蛋白質。
21. 根據權利要求2或6所述的方法,其中所述方法產生在生理pH值下所帶負電荷比 所關注的初始蛋白質多至少-15的所關注的修飾蛋白質。
22. 根據權利要求2或6所述的方法,其中所述方法產生在生理pH值下所帶負電荷比 所關注的初始蛋白質多至少-20的所關注的修飾蛋白質。
23. 根據權利要求1或6所述的方法,其中所述方法產生在生理pH值下所帶正電荷比 所關注的初始蛋白質多的所關注的修飾蛋白質。
24. 根據權利要求1或6所述的方法,其中所述方法產生在生理pH值下所帶正電荷比 所關注的初始蛋白質多至少+5的所關注的修飾蛋白質。
25. 根據權利要求1或6所述的方法,其中所述方法產生在生理pH值下所帶正電荷比 所關注的初始蛋白質多至少+ 10的所關注的修飾蛋白質。
26. 根據權利要求1或6所述的方法,其中所述方法產生在生理pH值下所帶正電荷比 所關注的初始蛋白質多至少+ 15的所關注的修飾蛋白質。
27. 根據權利要求1或6所述的方法,其中所述方法產生在生理pH值下所帶正電荷比 所關注的初始蛋白質多至少+20的所關注的修飾蛋白質。
28. 根據權利要求1、 2或6所述的方法,其中所述所關注蛋白質是易聚集的蛋白質。
29. 根據權利要求1、 2或6所述的方法,其中所述所關注蛋白質是疏水性蛋白質。
30. 根據權利要求l、 2或6所述的方法,其中所述所關注蛋白質是膜蛋白。
31. 根據權利要求l、 2或6所述的方法,其中所述所關注蛋白質是很難過度表達的蛋 白質。
32. 根據權利要求1、 2或6所述的方法,其中所述所關注蛋白質是很難純化的蛋白質。
33. 根據權利要求l、 2或6所述的方法,其中所述所關注蛋白質是受體。
34. 根據權利要求l、 2或6所述的方法,其中所述所關注蛋白質是轉錄肉子。
35. 根據權利要求l、 2或6所述的方法,其中所述所關注蛋白質是酶。
36. 根據權利要求l、 2或6所述的方法,其中所述所關注蛋白質是結構蛋白。
37. 根據權利要求l、 2或6所述的方法,其中所述所關注蛋白質是熒光蛋白。
38. 根據權利要求1、2或6所述的方法,其中所述所關注蛋白質是綠色熒光蛋白(GFP)。
39. 根據權利要求l、 2或6所述的方法,其中所述所關注蛋白質是細胞外蛋白。
40. 根據權利要求l、 2或6所述的方法,其中所述所關注蛋白質是鏈霉親和素。
41. 根據權利要求1、2或6所述的方法,其中所述所關注蛋白質是谷胱甘肽-S-轉移酶。
42. 根據權利要求l、 2或6所述的方法,其中所述鑒別所述表面殘基的步驟包含計算 機模擬所述蛋白質的三維結構。
43. 根據權利要求l、 2或6所述的方法,其中所述鑒別所述表面殘基的步驟包含使用 算法預測殘基是否可見于蛋白質的表面。
44. 根據權利要求l、 2或6所述的方法,其中所述鑒別所述表面殘基的步驟包含鑒別 AvNAPSA值小于閾值的殘基。
45. 根據權利要求1、 2或6所述的方法,其中所述鑒別所述非高度保守的表面殘基的 步驟包含比對所述蛋白質的氨基酸序列與來自同一蛋白質家族的至少--個其它蛋 白質。
46. 根據權利要求1、 2或6所述的方法,其中所述鑒別所述非高度保守的表面殘基的 步驟包含比對所述蛋白質的氨基酸序列與來自不同物種的所述蛋白質的至少一個 其它氨基酸序列。
47. 根據權利要求45或46所述的方法,其中所述比對以至少兩個其它蛋白質序列進行。
48. 根據權利要求45或46所述的方法,其中所述比對以至少三個其它蛋白質序列進行。
49. 根據權利要求45或46所述的方法,其中所述比對以至少五個其它蛋白質序列進行。
50. 根據權利要求6所述的方法,其中所述指定疏水性值的步驟包含使用辛醇/水分配系數值。
51. 根據權利要求l、 2或6所述的方法,其中所述置換步驟包含誘變所述蛋白質的序 列以用在生理pH值下帶電的天然氨基酸殘基置換所述鑒別的疏水性表面殘基。
52. 根據權利要求51所述的方法,其中所述天然氨基酸殘基選自由賴氨酸、谷氨酸、 天冬氨酸、組氨酸以及精氨酸組成的群組。
53. 根據權利要求51所述的方法,其中所述天然氨基酸殘基選自由賴氨酸、組氨酸以 及精氨酸組成的群組。
54. 根據權利要求51所述的方法,其中所述天然氨基酸殘基是賴氨酸。
55. 根據權利要求51所述的方法,其中所述天然氨基酸殘基選自由谷氨酸和天冬氨酸 組成的群組。
56. 根據權利要求1、 2或6所述的方法,其中所述置換步驟包含定點誘變所述鑒別的 表而殘基。
57. 根據權利要求1、 2或6所述的方法,其中所述置換步驟包含PCR誘變所述鑒別的 表面殘基。
58. —種綠色熒光蛋白(+36GFP),其具有以下氨基酸序列:MG冊朋冊GGASKGERLFRGKVPILVELKGDVNG服FSVRGKGKGDATOGKLTLK FICTTGKLPVPWPTLVTTLTYGVQCFSRYPKHMKRHDFFKSAMPKGYVQERTISFKK DGKYKTRAEVKFEGRTLVNRIKLKGRDFKEKGNILGHKLRYNFNSHKVYITADKRK NGIKAKFKIRHNVKDGSVQLADHYQQNTP1GRGPVLLPRNHYLSTRSKLSKDPKEKR DHMVLLEFVTAAGIKHGRDERYK.
59. —種多核苷酸,其編碼根據權利要求58所述的綠色熒光蛋白。
60. 根據權利要求59所述的多核苷酸,其具有以下序列ATGGGGCATCATCATCATCACCACGGCGGGGCGTCTAAGGGAGAGCGCTTGTTTC GCGGCAAAGTCCCGATTCTTGTGGAGCTCAAAGGTGATGTAAATGGTCATAAATT TAGTGTGCGCGGGAAAGGGAAAGGAGATGCTACGCGGGGCAAGCTCACCCTGAACTGACGTACGGTGTTCAGTGCTTTTCTCGCTATCCCAAACACATGAAACGCCATGCCTGGTCAACCGCATTAAACTGAAAGGTCGTGACTTCAAAGAGAAAGGTAATAT TCTTGGTCACAAACTGCGCTATAATTTCAACTCTCACAAAGTTTATATTACGGCGGGTCCAGTGCTGCTGCCGCGTAACCATTATCTGTCGACCCGCAGCAAACTCAGCA CAGGCATTAAACATGGCCGCGATGAACGTTACAAATAG.
61. —種綠色熒光蛋白(+49GFP),其具有以下氨基酸序列MG朋HHHHGGRSKGKRLFRGKVPILVKLKGDVNGHKFSVRGKGKGDATRGKLTLKFICTTGKLPVPWPTLVTILTYGVQCFSRYPKHMKRHDFFKSAMPKGYVQERTISFKKDGKYKTRAEVKFKGRTLVNR1KLKGRDFKEKGNILGHKLRYNFNSHKVYITADKRKNGKAKFKIRHNVKDGSVQLAKHYQQNTPIGRGPVLLPRKHYLSTRSKLSKDPKEKRDHMVLKEFVTAAG腿GRKERYK.
62. —種多核苷酸,其編碼根據權利要求61所述的綠色熒光蛋白。
63. 根據權利要求62所述的多核苷酸,其具有以下序列TTAACCTATGGTGTTCAATGCTTCTCACGTTATCCGAAGCATATGAAACGTCATGATTTTTTCAAATCGGCTATGCCGAAAGGTTACGTCCAGGAGCGCACCATCTCATTTAAGAAAGACGGTAAGTATAAAACCCGTGCTGAAGTAAAATTCAAAGGACGCACCCTGGTGAATCGCATTAAACTGAAAGGTCGTGATTTCAAAGAAAAGGGAAATATTTTAGGGCATAAGCTCCGTTATAATTTTAACAGTCATAAGGTGTATATTACCGCTGATAAACGCAAAAACGGAATCAAAGCGAAATTTAAGATCCGTCATAATGTAAAAGGTCCTGTGCTTCTGCCGCGTAAACACTACTTGTCGACCCGGTCAAAATTGAGTA AAGATCCGAAGGAAAAGCGTGATCACATGGTCTTGAAGGAATTTGTAACTGCAG CAGGTATTAAACACGGGCGCAAAGAACGTTACAAATAG.
64. —種綠色熒光蛋白(-29GFP),其具有以下氨基酸序列MGHHH朋恥GASKGEELFDGEVPILVELDGDVNGHEFSVRGEGEGDATEGELTLKF1CTTGELPVPWPTLVTTLTYGVQCFSRYPDHMDQHDFFKSAMPEGYVQERT1SFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKXEYNFNSHDVY1TADKQENGIKAEFEIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDDHYLSTESALSKDPNEDRDHMVLLEFVTAAGIDHGMDELYK.
65. —種多核苷酸,其編碼根據權利要求64所述的綠色熒光蛋白。
66. 根據權利要求65所述的多核苷酸,其具有以下序列ATGGTGAAGTGCCGATCCTGGTGGAGCTTGATGGCGATGTTAACGGCCATGAATTTTCTGTCCGCGGTGAAGGGGAGGGTGATGCCACGGAAGGGGAGCTGACACTTAAATTTATTTGCACCACCGGTGAACTCCCGGTCCCGTGGCCGACCCTGGTGACCACCCTGACCTACGGCGTTCAATGCTTTTCACGTTATCCGGATCACATGGACCAACACGACTTCTTTAAAAGCGCGATGCCTGAAGGCTATGTTCAAGAACGTACAATTAGTTTTAAAGATGACGGCACCTACAAGACCCGTGCGGAAGTAAAATTTGAAGGGGACACTTTAGTGAACCGCATCGAGCTGAAAGGGATCGATTTTAAAGAAGATGGGAATATGGTCCGGTTTTATTACCAGACGATCACTATCTGTCCACCGAATCCGCCCTGAGCA AAGATCCGAATGAAGACCGGGACCATATGGTTCTGCTGGAATTTGTTACGGCGG CTGGTATTGACCATGGCATGGATGAGCTGTATAAGTAG.
67. —種鏈霉親和素(-40SAV),其具有以下氨基酸序列MGHHHHHHGGAEAGITGTWYNQLGSTFIVTAGADGALTGTYESAVGDAESEYVLT GRYDSAPATDGSGTALGWTVAWKNDYENAHSATTWSGQYVGGAEARINTQWLLT SGTTEADAWKSTLVGHDTFTKVEPSAAS.
68. —種多核苷酸,其編碼根據權利要求67所述的鏈霉親和素。
69. 根據權利要求68所述的多核苷酸,其具有以下序列ACGGCGCCTTAACCGGTACCTACGAATCAGCTGTAGGTGACGCGGAATCAGAGT ACGTATTAACCGGTCGTTATGATAGCGCGCCGGCGACTGACGGTAGCGGTACTGC TTTAGGTTGGACCGTAGCGTGGAAGAATGATTATGAAAACGCACATAGCGCAAC AACGTGGTCAGGGCAGTACGTTGGCGGAGCTGAGGCGCGCATTAACACGCAGTGACCTGCA.
70. —種鏈霉親和素(+52SAV),其具有以下氨基酸序列MG冊H朋HGGAKAGITGTWYNQLGSTFIVTAGAKGALTGTYESAVGNAKSRYVLT GRYDSAPATKGSGTALGWTVAWKNKYRNAHSATTWSGQYVGGAKARINTQWLLT SGTTKAKAWKSTLVGHDTFTKVKPSAAS.
71. —種多核苷酸,其編碼根據權利要求70所述的鏈霉親和素。
72. 根據權利要求71所述的多核苷酸,其具有以下序列-GGTTCAGCCATGGGTCATCACCACCACCATCACGGTGGCGCCAAAGCAGGTATTACCGGTACCTGGTATAACCAGTTAGGCTCAACCTTTATTGTGACCGCGGGAGCGAAAGGCGCCTTAACCGGTACCTACGAATCAGCTGTAGGAAACGCAAAATCACGCTCACTTGGTCAGGGCAGTACGTAGGGGGAGCCAAAGCACGTATCAACACGCAGTG GTTATTAACATCAGGTACCACCAAAGCGAAAGCCTGGAAGAGCACGTTAGTGGG TCATGATACCTTCACTAAAGTGAAACCTTCAGCTGCGTCATAATAATGACTCGAG ACCTGCA.
73. —種谷胱甘肽-S-轉移酶(-40GST),其具有以下氨基酸序列:MGHH冊HHGGPPYTITYFPVRGRCEAMRMLLADQDQSWEBEVVTMETWPPLKPSC LFRQLPKFQDGDLTLYQSNAILRHLGRSFGLYGEDEEEAALVDMVNDGVEDLRCKY ATLIYTDYEAGKEEYVEELPEHLKPFETLLSENEGGEAFWGSESFADYNLLDIXRm QVLNPSCLDAFPLLSAYVARLSARPEIEAFLASPEHVDRPINGNGJCQ.
74. —種多核苷酸,其編碼根據權利要求73所述的鏈霉親和素。
75. 根據權利要求74所述的多核苷酸,其具有以下序列CATACTTTCCGGTACGTGGTCGTTGTGAAGCGATGCGTATGTTATTAGCGGACCAGGACCAATCATGGGAAGAAGAAGTAGTGACAATGGAAACCTGGCCGCCGTTAAAGCCTAGCTGTTTATTCCGTCAATTACCGAAGTTTCAGGATGGTGATTTAACCTTATACCAGTCTAACGCGATCTTACGTCATTTAGGTCGCTCATTTGGTTTATACGGTGAAGATGAAGAAGAAGCAGCCTTAGTGGATATGGTGAATGATGGCGTGGAAGACTTACGTTGTAAATACGCGACGTTAATTTACACTGATTATGAAGCCGGTAAAGAGGAGTACGTGGAAGAATTACCTGAACACCTGAAGCCGTTTGAAACATTACTGAGCGAAAATGAAGGAGGTGAGGCGTTCGTAGTTGGTAGCGAAATTAGCTTCGCTGATTATAACTTATTAGACTTATTACGCATTCACCAGGTTTTAAATCCTAGCTGTTTAGACGCTTTCCCGTTACTGAGCGCATATGTAGCGCGCCTGAGCGCCCGTCCGGAAATTGAAGCTTTCTTAGCGTCACCTGAACACGTAGACCGCCCGATTAACGGAAACGGCAAGCAGTA ATA ATGAGGT ACC ACCTGC A.
76. —種蛋白質,其由根據權利要求1-57中任一權利要求所述的方法修飾。
77. —種多核苷酸,其編碼根據權利要求76所述的蛋白質。
78. —種試劑盒,其用于進行根據權利要求1-57中任一權利要求所述的方法。
全文摘要
聚集是蛋白質不良表現的主要原因。本發明提供一種修飾蛋白質以產生更穩定的變異體的系統。所述方法包括鑒別蛋白質表面上適合于突變為更親水的殘基(例如,帶電氨基酸)的非保守疏水性氨基酸殘基。可改變表面上任何數目的殘基來產生更可溶、抗聚集、重折疊能力更高和/或在多種條件下更穩定的變異體。本發明還提供本發明技術所產生的理論凈電荷增加的GFP、鏈霉親和素以及GST變異體。還提供用于對任何所關注蛋白質進行所述修飾的試劑盒。
文檔編號G01N33/50GK101490548SQ200780027139
公開日2009年7月22日 申請日期2007年6月1日 優先權日2006年6月2日
發明者凱文·約翰·菲利普斯, 大衛·R·劉, 邁克爾·S·勞倫斯 申請人:哈佛大學校長及研究員協會