專利名稱:內含肽修飾酶及其制備和工業用途的制作方法
技術領域:
本發明涉及對蛋白活性進行控制。
背景技術:
許多蛋白都具有有用的特性,但在特定情況下,蛋白也會變得難以利用。例如,水解酶具有重要的工業應用和農業應用,但它們在一些表達宿主內的表達和產生可能又與不需要的表型效果相關。細胞壁降解酶,包括纖維素酶、木聚糖酶、木質素酶、酯酶、過氧化物酶及其它水解酶,在植物內表達時常常會與植物的生長、生理學表現和農藝表現上的不利影響相關。木聚糖酶是能催化β -I, 4-木聚糖的水解的酶β -I, 4-木聚糖是植物細胞壁內所含半纖維素中的直鏈多糖成分。纖維素酶是能催化纖維素、各種聚合度的纖維素種類和纖維二糖內所含的以i3_l,4-D-糖苷鍵連接的葡萄糖聚合物發生內部水解或端部水解的酶。基于上述活性,木聚糖酶或纖維素酶在植物內的表達可能導致非期望的植物成分的降解。一些酶也可能由于其水解活性而在微生物宿主內低表達。
發明內容
一方面,本發明涉及一種分離蛋白,該分離蛋白具有與選自由SEQ IDNOS:2059-2089所組成的組中的序列具有至少90%的同一性的氨基酸序列。一方面,本發明涉及一種分離核酸,該分離核酸具有編碼氨基酸序列的核苷酸序列,該氨基酸序列與選自由SEQ ID NOS :2059-2089所組成的組中的序列至少具有90%的同一性。—方面,本發明涉及一種轉基因植物,該轉基因植物含有分離蛋白,所述分離蛋白的氨基酸序列與選自由SEQ ID N0S:2059-2089所組成的組中的序列至少具有90%的同一性。一方面,本發明涉及一種分離的氨基酸序列,該分離的氨基酸序列所含的連續氨基酸序列與蛋白中的6個、10-50個、10-100個、10-150個、10-300個、10-400個、10-500個、10-600個,或10-658個連續氨基酸殘基具有至少90%的同一性,所述蛋白具有SEQ IDNOS:2059-2089中任意一個的序列。所述蛋白具有內含肽序列、酶序列、上游內含肽-外顯 肽接頭、下游內含肽-外顯肽接頭和至少一種有關SEQ ID NO: 111或SEQ ID NO: :91中至少一個的氨基酸改變。所述分離的氨基酸序列具有上游內含肽-外顯肽接頭、下游內含肽-外顯肽接頭中的至少一種,或至少一種有關SEQ ID N0:111或SEQ ID N0:91中至少一個的氨基酸改變中的一種或多種。
一方面,本發明涉及一種抗體,該抗體識別分離的氨基酸序列上的抗原表位,該分離的氨基酸序列所含的連續氨基酸序列與蛋白中的6個、10-50個、10-100個、10-150個、10-300個、10-400個、10-500個、10-600個,或10-658個連續氨基酸殘基具有至少90%的同一性,所述蛋白具有SEQ ID N0S:2059-2089中任意一個的序列。所述蛋白具有內含肽序列、酶序列、上游內含肽-外顯肽接頭、下游內含肽-外顯肽接頭和至少一種有關SEQ IDNO: 111或SEQ ID N0:91中至少一個的氨基酸改變。所述分離的氨基酸序列具有上游內含肽-外顯肽接頭、下游內含肽-外顯肽接頭中的至少一種,或至少一種有關SEQ ID NO: 111或SEQ ID N0:91中至少一個的氨基酸改變中的一種或多種。一方面,本發明涉及一種分離的核酸,該核酸具有編碼連續氨基酸序列的序列,所述連續氨基酸序列與蛋白中的6個、10-50個、10-100個、10-150個、10-300個、 10-400個、10-500個、10-600個,或10-658個連續氨基酸殘基具有至少90%的同一性,所述蛋白具有SEQ ID NOS :2059-2089中的任意序列。所述蛋白具有內含肽序列、酶序列、上游內含肽-外顯肽接頭、下游內含肽-外顯肽接頭和至少一種有關SEQ ID N0:111或SEQ ID N0:91中至少一個的氨基酸改變。所述分離核酸編碼上游內含肽-外顯肽接頭、下游內含肽接頭中的至少一種,或至少一種有關SEQ ID N0:111或SEQ ID N0:91中至少一個的氨基酸改變中的一種或多種。
結合附圖閱讀將能更好地理解下文中對優選實施方式進行的具體描述。出于闡釋本發明的目的,附圖所示為本發明優選的實施方式。但是,應當理解的是,本發明不限于所展示的精確安排和手段。圖中圖I顯示了在遠離蛋白活性位點處的內含肽插入位點。菱形表示插入位點,方形表不未插入內含肽的其它c/s/τ位點。圖2A顯示了一種植物表達載體,將其命名為pAG2005 (SEQ ID N0:1)。圖2B 顯示了更詳細的 pAG2005 (SEQ ID NO: I)。圖3A-3L顯示了針對Tth內含肽修飾的P77853的蛋白質印跡數據,其中,內含肽插入在P77853酶中的絲氨酸158處(S158)或蘇氨酸134 (T134)處。在部分圖3A-3L中,遮住了部分蛋白質印跡來突出特定的泳道組。泳道上方示出了針對各個樣品的瓊脂平板表型。所述瓊脂平板表型用“SW”代表轉化表型(switcher phenotype), TSP代表溫敏轉化剪接表型(temperature sensitive switcher splicer phenotype), P 代表許可表型(permissive phenotype)。每幅圖3A-3L中的NIC代表內含肽修飾蛋白中的N-外顯肽、內含肽和C-外顯肽;NC代表含有N-外顯肽和C-外顯肽的剪接蛋白。圖3A顯示了反映P77853-Tth-S 158-2蛋白(SEQ ID NO: 1672)的蛋白質印跡,該蛋白在37°C (系列2,左泳道)或55°C (系列2,右泳道)下進行了 4小時的預熱處理。同時該圖還顯示了含有空載體對照(VCT)蛋白和野生型P77853蛋白(P77)的泳道,以相同的方式對這兩種蛋白進行預熱處理。圖3B顯示了反映P77853-Tth_s 158-4蛋白(SEQ ID NO: 1673)的蛋白質印跡,該蛋白在37°C (系列4,左泳道)或55°C (系列4,右泳道)下進行了 4小時的預熱處理。同時該圖還顯示了含有空載體對照(VCT)蛋白和野生型P77853蛋白(P77)的泳道,以相同的方式對這兩種蛋白進行預熱處理。圖3C 顯示了反映 P77853-Tth-S 158-7 蛋白(SEQ ID NO: 1674)的蛋白質印跡,該蛋白在37°C (系列7,左泳道)或55°C (系列7,中泳道)下進行了 4小時的預熱處理,并在70°C (系列7,右泳道)下進行了 I小時的預熱處理。同時該圖還顯示了含有空載體對照(VCT)蛋白和野生型P77853蛋白(P77)的泳道。圖3D顯示了反映P77853-Tth-S158-19蛋白(SEQ ID NO: 1675)的蛋白質印跡,該蛋白在37°C (系列19,左泳道)或55°C (系列19,中泳道)下進行了 4小時的預熱處理,并在70°C (系列19,左泳道)下進行了 I小時的預熱 處理。同時該圖還顯示了含有空載體對照(VCT)蛋白和野生型P77853蛋白(P77)的泳道。圖3E顯示了反映P77853-Tth-S158-20蛋白(SEQ ID NO: 1676)的蛋白質印跡,該蛋白在37°C (系列20,左泳道)或55°C (系列20,中泳道)下進行了 4小時的預熱處理,并在70°C (系列20,右泳道)下進行了 I小時的預熱處理。同時該圖還顯示了含有空載體對照(VCT)蛋白和野生型P77853蛋白(P77)的泳道。圖3F顯示了反映P77853-Tth-S158-21蛋白(SEQ ID NO: 1677)的蛋白質印跡,該蛋白在37°C (系列21,左泳道)或70°C (系列21,右泳道)下進行了 I小時的預熱處理。同時該圖還顯示了含有空載體對照(VCT)蛋白和野生型P77853蛋白(P77)的泳道,以相同的方式對這兩種蛋白進行預熱處理。圖3G顯示了反映P77853-Tth-S158-25蛋白(SEQ ID NO: 1678)的蛋白質印跡,該蛋白在37°C (系列25,左泳道)或70°C (系列25,右泳道)下進行了 I小時的預熱處理。同時該圖還顯示了含有空載體對照(VCT)蛋白和野生型P77853蛋白(P77)的泳道,以相同的方式對這兩種蛋白進行預熱處理。圖3H顯示了反映P77853-Tth-S158-38蛋白(SEQ ID NO: 1679)的蛋白質印跡,該蛋白在37°C (系列38,左泳道)或55°C (系列38,右泳道)下進行了 4小時的預熱處理。同時該圖還顯示了含有空載體對照(VCT)蛋白和野生型P77853蛋白(P77)的泳道,以相同的方式對這兩種蛋白進行預熱處理。圖31 顯示了反映 P77853-Tth-S 158-39 蛋白(SEQ ID NO: 1680)的蛋白質印跡,該蛋白在37°C (系列39,左泳道)或55°C (系列39,中泳道)下進行了 4小時的預熱處理,并在70°C (系列39,右泳道)下進行了 I小時的預熱處理。同時該圖還顯示了含有空載體對照(VCT)蛋白和野生型P77853蛋白(P77)的泳道。圖3J顯示了反映P77853-Tth-S158-42蛋白(SEQ ID NO: 1681)的蛋白質印跡,該蛋白在37°C (系列42,左泳道)或55°C (系列42,中泳道)下進行了 4小時的預熱處理,并在70°C (系列42,右泳道)下進行了 I小時的預熱處理。同時該圖還顯示了含有空載體對照蛋白和野生型P77853蛋白(P77)的泳道。圖3K 顯示了反映 P77853-Tth-S158-138 蛋白(SEQ ID NO: 1691)的蛋白質印跡,該蛋白在37°C (系列42,左泳道)或59°C (左泳道數起第二條)下進行了 4小時的預熱處理。同時該圖還顯示了含有空載體對照蛋白和野生型P77853蛋白(P77853)的泳道。圖3L 顯示了反映 P77853-Tth-T134-1 蛋白(SEQ ID NO: 1629)(系列 I)、P77853-Tth-T134-2 蛋白(SEQ ID NO:1630)(系列 2)、P77853-Tth-T134_3 蛋白(SEQ ID NO: 1631)(系列 3)、P77853-Tth-T134_9 蛋白(SEQ ID NO: 1632)(系列 9)、P77853-Tth-T134-91 蛋白(SEQ ID NO: 1644)(系列 91)、P77853-Tth-T134_48 蛋白(SEQID NO: 1638)(系列 48)、P77853-Tth-T134-80 蛋白(SEQ ID NO: 1640)(系列 80)和P77853-Tth-T134-95蛋白(SEQ ID NO: 1645)(系列95)的蛋白質印跡,這些蛋白在37°C(前述每個系列的左泳道)和70°C (前述每個系列的游泳道)下進行了 I小時的預熱處理。同時該圖還顯示了含有空載體對照(VCT)蛋白和野生型P77853蛋白(P77)的泳道,以相同的方式對這兩種蛋白進行預熱處理。將各個蛋白表型列于其對應的泳道上方。圖4A-4C顯示了針對S158Tth內含肽修飾的P77853木聚糖酶突變體的蛋白質印跡分析。圖4A顯示了針對S158-19Tth內含肽修飾的P77853木聚糖酶(SEQ IDN0:1675)的蛋白質印跡分析。將蛋白樣品在59°C下進行不同時間的培養(O小時、I小時、2小時、3小時、4小時和6小時)。空載體(V)和野生型P77853對照樣品按分子量梯度顯示在最右側。灰色標出的中間區域遮蓋了含有其它樣品的泳道。圖4B顯示了針對S158-30-103Tth內含肽修飾的P77853木聚糖酶(SEQ ID NO: 1701)的蛋白質印跡分析。如圖所示地,使蛋白樣品在37°C、50°C、59°C和65°C下進行不同時間的培養(I小時、2小時、3小時、4小時和6小時)。空載體(V)和野生型P77853對照
樣品按分子量梯度顯示在最右側。圖4C顯示了針對T134-100-101Tth內含肽修飾的P77853木聚糖酶(SEQIDNO: 1711)的蛋白質印跡分析。如圖所示,將蛋白樣品在37°C、50°C、59°C和65°C下進行不同時間的培養(I小時、2小時、4小時、6小時和17小時)。空載體(V)和野生型P77853對照
樣品按分子量梯度顯示在最右側。圖5顯示了在酵母細胞中表達和分泌內含肽修飾蛋白,例如來源于解纖維熱酸菌(Acidothermus cellulolyticus)的內切葡聚糖酶的質粒載體;。圖6顯示了對能表達P07981 (在里氏木霉(Trichoderma reesei)中的內切葡聚糖酶EG-1)、P54583或白蛋白(作為陰性對照)的畢赤酵母株(Pichia)進行的活性分析。圖7顯示了對釀酒酵母(S. cerevisiae)中P54583的分泌進行的平板分析。圖8顯示了 P54583在不同pH水平及不同溫度下的活性。圖9顯示了 P54583在不同時間點及不同溫度下的活性。圖10 顯示了 P54583 的 PNP-C 分析。圖11顯示了用微晶纖維素對P54583進行的提純。圖12顯示了野生型P54583的蛋白質印跡檢測。圖13顯示了 P54583中的候選內含肽插入點。圖14顯示了對內含肽修飾的內切葡聚糖酶進行編碼的基因的裝配策略(assembly strategy)。圖15顯示了針對內含肽修飾的內切葡聚糖酶在不同溫度處理下作出反應行為的評分。圖16顯示了針對內含肽修飾的內切葡聚糖酶的活性分析。圖17顯示了針對多種內含肽修飾的P54583蛋白的蛋白質印跡分析。圖18A-C 顯不了產生誘變處理文庫(mutangenized libraries)的易錯 PCR(errorprone PCR)0
圖19顯示了缺陷內含肽(crippled intein)對P54583酶活性的影響。圖20顯示了在不同溫度的預溫育下的酶活性恢復。圖21顯示了 P54583在不同溫度下進行預溫育后的酶活性恢復,該P54583攜帶有位于S237位點的微小內含肽。圖22顯示了預溫育時間和內含肽修飾的內切葡聚糖酶的活化。每個系列(1、2、3和4)中從左至右連續的條形代表進行了 O小時、2小時、4小時、6小時和10小時預溫育。圖23顯示了針對內含肽修飾的內切葡聚糖酶文庫的高通量內切葡聚糖酶分析結
果O圖24顯示了經誘變處理后的內含肽修飾的內切葡聚糖酶文庫篩選。圖25顯示了對經誘變處理后的內含肽修飾的內切葡聚糖酶文庫中的候選者進行的重復活性分析。圖26顯示了內含肽修飾的內切葡聚糖酶的熱誘導酶活性,該內含肽修飾的內切葡聚糖酶攜帶有位于Tth內含肽中R51位點的突變。圖26A總結了針對使用4-甲基傘形酮-纖二糖苷(4_methylumbelliferylcellobioside)的實施例Ila的克隆體的活性分析結果。圖27顯示了內切葡聚糖酶的系統樹。圖28顯示了表達和分泌內含肽修飾蛋白的質粒載體;例如,酵母中表達和分泌來源于白蟻的內切葡聚糖酶的質粒載體。圖29顯示了表達空表達載體(empty expression vector)、編碼NtEG的表達載體、編碼不含天然信號肽(native signal peptide)的NtEG突變體的表達載體的酵母。圖30顯示了 NtEG及不含天然信號肽的NtEG突變體在一定范圍的溫度下的內切葡聚糖酶活性。 圖31顯示了不含天然信號肽的NtEG突變體和P54583在一定范圍的pH下的內切葡聚糖酶活性。圖32顯示了不含天然信號肽的NtEG突變體在具有或不具有組氨酸標簽情況下的內切葡聚糖酶活性。圖33顯示了能編碼內含肽修飾的NtEG內切葡聚糖酶的基因的裝配策略。圖34顯示了酵母細胞酶活性的時間進程,該酵母細胞能對內含肽修飾的白蟻酶切葡聚糖酶進行表達。圖35顯示了 λ ΖΛΡ:.Β; II載體中的表達盒。
具體實施例方式除非另有說明,本文使用的技術和科技術語具有本發明所屬領域技術人員公知的意義。本文實施方式中的方法可以與本領域技術人員已知的其它篩選和應用方法進行替換或結合。“至少一種”短語之后跟隨有一種或多種項目清單,例如“Α、B或C”,表示Α、Β或C中的任意一個或它們的任意組合。本文中使用的“外顯肽”指的是內含肽修飾蛋白中不屬于內含肽的部分。本文中使用的“氨基末端外顯肽(amino terminal extein)”、“N_末端外顯肽”或“N-外顯肽”具有相同的意思,指的是位于內含肽N-末端殘基之前的外顯肽。在裝配的內含肽修飾蛋白中,將氨基末端外顯肽、N-末端外顯肽或N-外顯肽的羧基端融合到內含肽的氨基端上。本文使用的“羧基末端外顯肽”、“C-末端外顯肽”或“C-外顯肽”具有相同的意思,指的是位于內含肽C-末端殘基之后的外顯肽。在裝配的內含肽修飾蛋白中,將羧基末端外顯肽、C-末端外顯肽或C-外顯肽的氨基端融合到內含肽的羧基端上。本文使用的“靶蛋白”是其中插入了內含肽的蛋白,或者是將要插入內含肽的候選者。插入內含肽之前,可以根據將要進行插入的位點將靶蛋白的各個部分稱為外顯肽、氨基末端外顯肽或羧基末端外顯肽。“靶蛋白”可以是酶,因此術語“靶酶”表示這樣的“靶蛋白”該靶蛋白是一種酶。本文使用的“許可型”或“P”指的是這樣的內含肽修飾其中,內含肽修飾蛋白在插入內含肽后保持了功能,或者將內含肽從蛋白質中切開或剪接出來后,剩下了具有功能 的外顯肽或連接蛋白。本文中使用的“非許可型”或“NP”指的是這樣的內含肽修飾,其中,內含肽修飾蛋白在插入內含肽后具有減弱了的功能。本文使用的“熱敏”指的是這樣的內含肽修飾其中,內含肽修飾蛋白在暴露在一定溫度或一定范圍的溫度下時具有更強的功能,或者將內含肽從蛋白質中剪接出來后,剩下了在暴露在一定溫度或一定范圍的溫度下時具有更強的功能的外顯肽或連接蛋白。本文中使用的“轉化”指的是內含肽修飾蛋白響應物理或化學條件的改變而發生的活性變化。能產生“轉化”或“轉化子(switcher)”內含肽修飾蛋白的內含肽修飾在條件發生改變前是非許可型,在條件發生改變后成為許可型。轉化可以在存在內含肽、內含肽從外顯肽上切開、或內含肽發生切開且外顯肽發生連接時產生。本文中的“熱敏轉化剪接”或“TSP”指的是這樣的內含肽修飾蛋白其中,內含肽對誘導溫度或誘導溫度范圍作出應答發生剪接。所述內含肽修飾蛋白可以在暴露于非誘導溫度或誘導溫度范圍之外的溫度之前時是非許可型,當暴露在于誘導溫度或誘導溫度范圍之后為許可型。本文中使用的“分離核酸”、“分離多核苷酸”、“分離寡核苷酸”、“分離DNA”或“分離RNA”指的是從產生它們的生物中,或者從經常與其有關的天然存在的基因組、地點、或分子中分離出來的,或者通過合成工藝制得的核酸、多核苷酸、寡核苷酸、DNA或RNA。本文中使用的“分離蛋白”、“分離多肽”、“分離寡肽”或“分離肽”指的是從產生它們的生物中,或者從經常與其有關的天然存在的地點或分子中分離出來的,或者通過合成工藝制得的蛋白、多肽、寡肽或肽。本文中使用的“變體”指的是保持了與原始序列相同或基本相似的生物活性的分子。所述變體可以是來自相同或不同的物種,或者是基于天然分子或優先分子(priormolecule)合成的序列。本文中提到的核酸、核苷酸序列、蛋白質或氨基酸序列可以是分離的、提純的、化學合成的、或通過重組DNA技術制得。上述方法均為本領域所公知。本文中使用的“可操作地連接”指的是兩個或更多個生物分子或部分的一個或多個生物分子中在彼此相關的結構中的關系,使所述生物分子的正常功能得以發揮。涉及核苷酸序列時,“可操作地連接”指的是兩個或更多個核酸序列通過酶的連接作用或其它方式在彼此相關的結構中的關系,使所述序列的正常功能得以發揮。例如,如果編碼前序列或分泌前導區的核苷酸序列能表達為參與多肽分泌的前蛋白,則該核苷酸序列是可操作地連接到多肽的核苷酸序列中的;如果啟動子或增強子能影響編碼序列的轉錄,則該啟動子或增強子是可操作地連接到所述編碼序列上的;如果核糖體結合位點的位置有利于翻譯編碼序列,則該核糖體結合位點可操作地連接到所述編碼序列上。提供了具有可控活性的分離蛋白、能編碼所述分離蛋白的分離核酸、測定內含肽插入位點的方法以及控制蛋白活性的方法。可以將所述蛋白或核酸提供在植物、微生物和其它生物內。通過控制作用,可以將一種或多種蛋白或核酸用于燃料、纖維、生面、化學制品、糖類、織物、漿料、紙張、人類食物或動物飼料的制造。優選地,表達宿主的一種或多種的生長、生理或其它性能特征不會輕易受到所述蛋白或核酸的干擾。待受控蛋白可以是一種酶,也可以是任意種類的蛋白,包括非酶、結構蛋白或激素。使用內含肽是一種控制蛋白活性的方法,這種控制允許內含肽修飾蛋白以預定義的活性水平進行表達。內含肽是能夠自切割和自連接的多肽。將同時具備自切割和自連接的屬性總稱為“自剪接”或“剪接”。內含肽從蛋白中切割出來,并對其所切割的蛋白序列(外顯肽)的連接作用進行介導,從而對該蛋白進行剪接。內含肽可以插入蛋白序列內部或 與蛋白末端融合。蛋白中的內含肽插入物可以通過這種方式來對蛋白進行控制產生的蛋白在內含肽存在時具有一種活性,當內含肽被切割或剪接后該蛋白具有另一種活性。在某些情況下,通過不同誘導條件中的一種或多種能對內含肽剪接反應進行控制。當通常情況下對宿主有害的活性被降低后,內含肽就可以保護表達宿主不受到蛋白對生長、生理學或產量造成的不利影響。對蛋白進行表達后,可以通過使被修飾的蛋白暴露在能誘發內含肽剪接的反應條件中來改變蛋白活性。剪接后產生的蛋白可能具有更強的活性。在一種實施方式中,內含肽修飾在低溫下是非許可型而在較高溫度下是許可型,因此內含肽修飾蛋白會在溫度從低溫向較高溫度變化時發生轉化。但是,在一些實施方式中,經過切割和/或連接的酶具有較低的活性。能編碼內含肽修飾蛋白的核酸可以是在植物中進行表達的最佳密碼子。可以用本發明實施方式的內含肽進行修飾的靶蛋白包括但不限于細胞壁降解酶、木素纖維素降解酶、木聚糖酶和纖維素酶。本文公開的全部蛋白都可以作為進行內含肽修飾的靶蛋白。可以用選自由Mth內含肽、Psp-Pol內含肽、微小Psp-Pol (mPsp-Pol)內含肽、RecA內含肽、Tac內含肽、Tag內含肽、Tth內含肽、微小Tth內含肽,或它們的衍生物所組成的組中的內含肽對靶蛋白進行修飾。Mth內含肽、Psp-Pol內含肽、微小Psp-Pol內含肽、RecA內含肽、Tac內含肽、Tag內含肽、Tth內含肽和微小Tth (mTth)內含肽可以分別含有SEQ ID N0S:2、3、4-87、88、89、90、91和92-103所示的序列。但內含肽也可以有其它來源,或者是被修飾的天然內含肽形式。提供了分離的內含肽修飾的木聚糖酶。發生內含肽切割或內含肽剪接之前和之后的內含肽修飾的木聚糖酶的實施方式具有不同的活性。在一種實施方式中,通過將內含肽修飾的木聚糖酶暴露在誘導條件下來誘發內含肽的切割或剪接。所述誘導條件可以是提高溫度,但不僅限于此。提高的溫度可以是但不限于50-70°C的范圍,包括50°C和70°C的溫度,或者是在上述范圍內任意兩個整數溫度之間的子區間。所提高的溫度可以大于或等于在25-70°C內以整數遞增的溫度。所提高的溫度可以大于或等于50°C、55°C、59. 9°C、60°C、65°C或70°C。編碼內含肽修飾的木聚糖酶的核酸是優選但非必要的為在植物中進行表達而進行了密碼子優化的。在一種實施方式中,可以使內含肽修飾的木聚糖酶在轉基因植物中進行表達。提供了分離的內含肽修飾的纖維素酶。發生內含肽切割或內含肽剪接之前和之后的內含肽修飾的纖維素酶的實施方式具有不同的活性。在一種實施方式中,通過將內含肽修飾的纖維素酶暴露在誘導條件下來誘發內含肽的切割或剪接。所述誘導條件可以是提高溫度,但不僅限于此。提高的溫度可以是但不限于50-70°C的范圍,包括50°C和70°C的溫度,或者是在上述范圍內任意兩個整數溫度之間的子區間。所提高的溫度可以大于或等于在25-70 V內以整數遞增的溫度。所提高的溫度可以大于或等于45°C、50°C、55°C、60 V、62°C或65°C。編碼內含肽修飾的纖維素酶的核酸是優選但非必要的為在植物中進行表達而進行了密碼子優化的。在一種實施方式中,可以使內含肽修飾的纖維素酶在轉基因植物中進行表達。可以作為祀蛋白的木聚糖酶包括但不限于來自嗜熱網球菌(Dictyoglomus thermophilum)的β-1,4-木聚糖酶229B(登錄號為P77853,SEQ ID NO: 104)、來自熱纖梭菌(Clostridium thermocellum)的內-1,4-β -木聚糖酶(登錄號為 P51584, SEQ ID NO: 105)、來自芽孢桿菌(Bacillus sp. )NG_27的堿性耐熱內木聚糖酶前驅體(登錄號為030700,SEQID NO: 106),來自疏棉狀嗜熱絲孢菌(Thermomyces Ianuginosus)的內-1,4-β -木聚糖酶(登錄號為 043097, SEQ ID NO: 107)和來自幾堆梭菌(Clostridium stercorarium)的耐熱胞外木聚糖酶(celloxylanase)(登錄號為P40942,SEQ ID NO: 108)。可以用一種或多種不同的內含肽對木聚糖酶進行修飾,包括但不限于選自由Mth內含肽、Psp-Pol內含肽、微小Psp-Pol內含肽、RecA內含肽、Tac內含肽、Tag內含肽、Tth內含肽、微小Tth內含肽或它們的衍生物所組成的組中的至少一種。在一種實施方式中,所述Mth內含肽、Psp-Pol內含肽、微小Psp-Pol內含肽、RecA內含肽、Tac內含肽、Tag內含肽、Tth內含肽、或微小Tth內含肽的分別具有SEQ ID N0S:2、3、4-87、88、89、90、91、或92-103所示的序列。可以在木聚糖酶內多個候選位點中的一個或多個位點上插入一個或多個內含肽。可以作為靶蛋白的纖維素酶包括但不限于熱纖梭菌celK (Clostridiumthermocellum celK)纖維素酶(登錄號為 068438 (SEQ ID NO: 109))、揭色熱單胞菌 celB(Thermomonospora fusca celB)纖維素酶(登錄號為 P26222 (SEQ ID NO: 110))、來自角軍纖維熱酸菌(Acidothermus cellulolyticus)的Acel內切葡聚糖酶El (登錄號為P54583(SEQ ID NO: 111))以及高山象白蟻(Nasutitermes takasagoensis) NtEG 纖維素酶(登錄號為077044 (SEQID N0:112))。可以用一種或多種不同的內含肽對纖維素酶進行修飾,所述內含肽包括但不限于選自由Mth內含肽、Psp-Pol內含肽、微小Psp-Pol內含肽、RecA內含肽、Tac內含肽、Tag內含肽、Tth內含肽、微小Tth內含肽或它們的衍生物所組成的組中的至少一種。在一種實施方式中,所述Mth內含肽、Psp-Pol內含肽、微小Psp-Pol內含肽、RecA內含肽、Tac內含肽、Tag內含肽、Tth內含肽、或微小Tth內含肽的分別具有SEQ IDN0S: 2、3、4-87、88、89、90、91、或92-103所示的序列。可以在纖維素酶內多個候選位點中的一個或多個位點上插入一個或多個內含肽。可以通過標準分子生物學技術制備內含肽修飾蛋白,然后進行篩選。可以使內含肽、靶蛋白或內含肽修飾蛋白發生突變,然后進行篩選。可用的篩選系統包括λ噬菌體、酵母或其它允許蛋白產生和/或能測試該蛋白的物理和/或功能特性的表達系統。可以將候選者從內含肽修飾蛋白或突變內含肽修飾蛋白群中分離出來,并進一步進行分析。進一步進行的分析可以包括DNA測序、功能分析法、結構分析、酶活性分析和監測活性、結構發生的變化,或者對誘導條件作出應答而發生的剪接。誘導條件可以包括將內含肽修飾蛋白暴露在變化的物理或化學條件發生中,例如但不限于溫度、pH、剪接抑制劑的濃度、配體濃度、光、鹽條件和壓力方面的改變。可以通過對天然內含肽或突變內含肽進行的篩選來測定誘導條件。此外,也可以從能適應所期待的誘導條件下生活的生物中獲得內含肽。例如,可以從嗜冷菌(psychrophile)、中溫菌或嗜熱菌(例如,騎行納古菌(Nanoarchaeum equitans)、深海火球 菌(Pyrococcus abyssi)或火球菌(Pyrococcus sp.))中分離出溫度誘導型內含肽;可以從嗜酸菌、嗜堿菌或嗜中性菌(例如,火球菌、結核分枝桿菌(Mycobacterium tuberculosis)、釀酒酵母(Saccharomycescerevisiae))中分離出pH誘導型內含肽;同時可以從嗜鹽菌中分離出鹽誘導型內含肽。還對化學誘導或化學抑制的內含肽進行了確認。作為化學誘導或化學抑制的內含肽的非限制性實例,從釀酒酵母中分離出來的液泡ATP酶亞基(VMA)內含肽通過暴露在DTT、NH2OH或半胱氨酸中而發生了誘導性的切割;存在Zn2+的時候,從分枝桿菌(Mycobacterium)中分離出來的內含肽和從酵母菌屬(Saccharomyces)中分離出來的其它內含肽呈現出受抑制的剪接。可以通過撤去抑制條件來對受抑制的內含肽進行誘導。可以使天然內含肽發生突變并對其進行篩選,以測定在期望誘導條件下可誘導的內含肽中是否產生了突變。可以在內含肽修飾蛋白中提供上述任意來源的內含肽。可以通過實驗測定內含肽的插入位點。為了測定插入位點是否允許進行內含肽剪接,可以使用本領域已知的方法構造和克隆內含肽-蛋白融合基因、使該內含肽修飾蛋白得到表達,并測試內含肽修飾蛋白自發地或在誘導條件下發生剪接的能力。為了避免將任何額外的氨基酸引入蛋白中,并可能由此使蛋白功能或活性發生改變的情況,可以將蛋白質中存在的天然半胱氨酸、絲氨酸和蘇氨酸篩選為潛在的內含肽插入位點。插入后,可以在以改變蛋白功能為目的的內含肽切割和/或連接之前和之后對蛋白進行測試。 通過在新接頭位點弓I入半胱氨酸、絲氨酸或蘇氨酸可以將內含肽插入到蛋白中任意位置。可以通過對蛋白內的氨基酸進行取代反應或者通過插入半胱氨酸、絲氨酸或蘇氨酸來引入半胱氨酸、絲氨酸或蘇氨酸。在新接頭位點處插入內含肽時,該內含肽的羧基端將與羧基外顯肽氨基端的第一氨基酸發生融合。如果引入的半胱氨酸、絲氨酸或蘇氨酸在蛋白內的位置能促進內含肽的插入,那么在隨后的剪接反應中將該氨基酸留在所述蛋白內。剪接反應后留在成熟蛋白中的引入氨基酸可能對蛋白的功能或活性產生干擾,因此人們需要對經這種剪接反應后得到含有引入氨基酸的所有蛋白的功能和活性進行證實。本領域已知通過功能分析法來對所有已被賦予了功能的蛋白的功能進行測定。鑒于許多蛋白中含有多個半胱氨酸、絲氨酸和蘇氨酸,因此希望對那些經測試能進行內含肽剪接的插入位點進行等級排序,或者甚至對這些插入位點的數量進行限制。可以用三個特點來預測內含肽插入位點是A)支持向量機(support vector machine, SVM)所描述的局部序列,B)插入位點到活性位點殘基的距離,以及C)插入位點與局部二級結構的鄰近程度(例如,在α-螺旋結構或β-片狀結構端部處或附近)。在一種實施方式中,使用局部序列和到活性位點的距離來縮小推薦插入位點的選擇范圍,而二級結構元件信息則能用于對相似的插入位點進行優選。A)局部序列可使用SVM法來對內含肽插入位點進行預測或評價。可以由已知的天然內含肽插入位點裝配成合適的已知內含肽插入位點訓練組(訓練組)。可以在Perler,F.B. (2002),InBase, The Intein Database (內含妝數據庫),Nuc. Acids Res. 30:383-384 中記載的NEB inbase數據庫中找到用于該目的的已知內含肽插入位點序列,通過引用該文獻全部記載而將其整體與本文結合。優選地,訓練組內含肽插入位點具有SEQ ID N0S: 1233-1512的序列。用于上述目的的蛋白序列的一種來源是NCBI數據庫,也可以使用其它的來源。含有對應于SEQ ID N0S: 1233-1512訓練組內含肽插入位點的內含肽的蛋白分別具有SEQID NOS:393-672序列。基于內含肽序列(SEQ ID N0S: 113-392)和含內含肽的蛋白序列(SEQ ID N0S:393-672),可以將各個含內含肽的蛋白的外顯肽序列從每個內含肽序列中分 離出來。SEQ ID NOS:393-672蛋白序列中的N-外顯肽分別以SEQ ID NOS:673-952表示,而SEQID NOS:393-672蛋白序列中的C-外顯肽分別以SEQ ID N0S:953_1232表示。為了SVM序列預測的生成,對N-外顯肽及C-外顯肽中的含有插入位點X和環繞X的序列的盒(cassette)進行測定。優選地,被分析的序列包括環繞X的_3號到+2號(總計6個氨基酸,編號為-3、-2、-I、O、I、2)的氨基酸盒(NNNXNN序列中,X為O號氨基酸)。下面以NNNXNN盒作為SVM模型進行描述。如果采用了 NNNXNN以外的盒,則根據本文的描述可以顯然得知需要對SVM進行修改。用下面的等式將盒換算成向量V :V=[位點_3位點_2位點—位點。位點+1位點+2]其中,位點^EaaiALAaaiARG…aaJRP aajTYR]如果位點i存在氨基酸型N時,aaiN=l ;否則,N=O0這將6個氨基酸的盒序列換算成1X120的向量。將用于含有內含肽的SEQ ID N0S:393-672蛋白的插入位點盒分別提供在SEQ ID N0S: 1233-1512中。將這一組插入位點盒的向量用作真陽性對照組來訓練SVM。在每個具有真陽性的蛋白中,同時還從N-外顯肽序列和C-外顯肽序列中選擇3個在X (O)處具有半胱氨酸、蘇氨酸和絲氨酸(本文中稱為“C/T/S”)但不含內含肽插入無的隨機NNNXNN盒(優選來自序列SEQ ID N0S:673_1232)作為真陰性。然后對來自外顯肽序列的真陰性組進行編譯。被選擇的真陰性可以來自與真陽性插入位點相同的蛋白,并在X處具有與真陽性相同的殘基類型。在整套內含肽插入位點序列上對用來預測內含肽插入位點的總SVM進行訓練,同時除去全部相同的序列。這可以通過執行多種不同方法或程序中的任何一種來進行。一種可以用來預測內含肽插入位點的SVM程序為SVM_light V6. 02 (2008年8月14日),該程序可商購自Thorsten Joachims Weichgut LLC, Ithaca,NY,通過引用其全部內容將其與本文結合。同時參見Thorsten Joachims的“產生大量SVM學習實踐”(Making Iarge-Scale
SVM Learning Practical)。在Kernel法中進行了改進-支持向量學習,B. Scholkopf和
C. Burges和A. Smola (編譯),MIT_出版社,1999,通過引用其全部內容將其與本文結合。簡而言之,SVM light V6. 02是上述提到的Joachims 1999出版物(該出版物解釋了與大量問題有關的較大訓練組的困難)的支持向量機訓練法的實踐。通過以高效方式選擇工作組變量,將算法構建在在解決上述問題的分解策略的基礎上。通過SVM light V6. 02采用了線性核(linear kernel)和設定至I的成本因素,從而使陽性組和陰性組中的差錯具有同等
重要性。為了測試該方法的正確性,可以選擇較小組的插入位點盒按照下面的方法進行訓練和測試1)隨機選擇m組具有單一序列的真陽性訓練組插入位點(在一種實施方式中,m為1-250,所述序列選自SEQ ID N0S: 1233-1512) ;2)針對每個真陽性插入位點,從同一個含內含肽蛋白(在一種實施方式中,SEQ ID N0S:673-1232)中與所述真陽性插入位點有關的外顯肽中隨機選擇三個對應的真陰性盒,其中,真陰性插入位點具有相同的中心氨基酸X但不含有內含肽插入物,和3)可以將步驟I)組內未被選擇的余下其它單一序列選為測試組(例如,SEQ ID N0S: 1233-1512中余下的序列)。接著,采用與進行總量預測的相同方法來對支持向量進行訓練,然后用這些支持向量對測試組進行評分,所述支持向量包括已知插 入位點盒一以正值表示,和選自在O位具有半胱氨酸、蘇氨酸或絲氨酸的外顯肽(SEQ IDN0S:673-1232)的全部其它非插入位點盒——以負值表示。然后將對每個蛋白的大量位點進行的評分進行比較,并根據其分值將插入位點進行分級。為了得到用于比較的基度(metric),可以為每個內含肽插入位點指定一個數值,該數值是通過將SVM評分低于插入位點(L)的位點數量除以測試組中全部位點數量減去I((Nn)之后計算得到的比值,或表示為L/Nn。結果為I的基度意味著插入位點的數量大于全部其它位點的數量,而結果為O的基度則意味著插入位點的數量小于全部其它位點的數量。可以將上述過程在各個不同大小的訓練組中重復進行25次,其中,每次過程都是基于 SEQ ID N0S: 1233-1512中的插入位點盒進行的隨機選擇之上,而相應的真陰性插入位點對應地選自待訓練和測試的SEQ ID N0S:673-1232中。下表I顯示了使用上述訓練和測試程序的針對已知內含肽插入位點的基度。表I中針對已知內含肽插入位點的平均基度以及各個不同大小訓練組的標準偏差是建立在優選實施方式的基礎上的,該優選實施方式包括選自SEQ ID N0S:673-1512的訓練和測試組序列。對于大小為25個或更多的訓練組來說,內含肽插入位點的平均值為O. 75個基度。由此具有150個插入位點盒的訓練組的P值大約為10_1(1顯示出統計學上的顯著性。基于局部序列的特征,可以通過SVM對任意靶蛋白的潛在內含肽插入物位點進行篩選,進而對能用來調整靶蛋白活性的插入位點進行預測。在一種實施方式中,選擇等級為O. 75或更高的候選插入位點作為插入內含肽的位點。表I
權利要求
1.一種分離蛋白,該分離蛋白具有與選自由SEQ ID NOS: 2059-2089所組成的組中的序列具有至少90%的同一性的氨基酸序列。
2.根據權利要求I所述的分離蛋白,其中,所述氨基酸序列與選自由SEQIDNOS:2059-2089所組成的組中的序列具有至少95%的同一性。
3.根據權利要求I所述的分離蛋白,其中,所述氨基酸序列為選自由SEQIDNOS:2059-2089所組成的組中的序列。
4.一種分離核酸,該分離核酸具有編碼氨基酸序列的核苷酸序列,該氨基酸序列與選自由SEQ ID NOS:2059-2089所組成的組中的序列具有至少90%的同一性。
5.根據權利要求4所述的分離核酸,其中,所述氨基酸序列與選自由SEQIDNOS:2059-2089所組成的組中的序列具有至少95%的同一性。
6.根據權利要求4所述的分離核酸,其中,所述氨基酸序列為選自由SEQIDNOS:2059-2089所組成的組中的序列。
7.—種轉基因植物,該轉基因植物含有分離蛋白,所述分離蛋白具有與選自由SEQ IDNOS:2059-2089所組成的組中的序列具有至少90%的同一性的氨基酸序列。
8.根據權利要求7所述的轉基因植物,其中,所述氨基酸序列與選自由SEQIDNOS:2059-2089所組成的組中的序列具有至少95%的同一性。
9.根據權利要求7所述的轉基因植物,其中,所述氨基酸序列為選自由SEQIDNOS:2059-2089所組成的組中的序列。
10.一種轉基因植物,該轉基因植物含有分離核酸,所述分離核酸具有編碼氨基酸序列的核苷酸序列,該氨基酸序列與選自由SEQ ID NOS:2059-2089所組成的組中的序列具有至少90%的同一性。
11.根據權利要求10所述的轉基因植物,其中,所述氨基酸序列與選自由SEQIDNOS:2059-2089所組成的組中的序列具有至少95%的同一性。
12.根據權利要求10所述的轉基因植物,其中,所述氨基酸序列為選自由SEQIDNOS:2059-2089所組成的組中的序列。
13.根據權利要求10所述的轉基因植物,其中,所述分離核酸還含有表達構建體。
14.根據權利要求13所述的轉基因植物,其中,所述表達構建體具有SEQID NO: I的序列,且所述分離核酸通過如下方式被克隆到所述表達構建體中用具有與KpnI/EcoRI末端匹配的分離核酸替換通過表達構建體的KpnI/EcoRI酶切而將被釋放的SEQ ID NO: I序列,所述通過表達構建體的KpnI/EcoRI酶切而將被釋放的SEQ ID NO: I序列位于SEQ IDN0S: I的KpnI位點和EcoRI位點之間,所述KpnI位點在SEQ ID N0S: I的核苷酸9945-9950處,所述EcoRI位點在SEQ ID N0S: I的核苷酸12311-12315處。
15.一種分離的氨基酸序列,該分離的氨基酸序列含有與蛋白中的6個、10-50個、10-100 個、10-150 個、10-300 個、10-400 個、10-500 個、10-600 個,或 10-658 個連續氨基酸殘基具有至少90%的同一性的連續氨基酸序列,所述蛋白具有SEQ ID NOS:2059-2089中任意一個的序列;其中,所述蛋白具有內含肽序列、酶序列、上游內含肽-外顯肽接頭、下游內含肽-外顯肽接頭和至少一種有關SEQ ID NO: 111或SEQ ID N0:91中至少一個的氨基酸改變,且所述分離的氨基酸序列含有上游內含肽-外顯肽接頭、下游內含肽-外顯肽接頭中的至少一種,或至少一種有關SEQ ID N0:111或SEQ ID N0:91中至少一個的氨基酸改變中的一種或多種。
16.根據權利要求15所述的分離的氨基酸序列,其中,所述連續氨基酸序列與蛋白中的 6 個、10-50 個、10-100 個、10-150 個、10-300 個、10-400 個、10-500 個、10-600 個,或10-658個連續氨基酸殘基具有100%的同一性,所述蛋白具有SEQ ID NOS: 2059-2089中的任意序列。
17.一種抗體,該抗體識別權利要求15所述的分離的氨基酸序列上的抗原表位。
18.一種分離核酸,該分離核酸具有編碼連續氨基酸序列的序列,所述連續氨基酸序列與蛋白中的 6 個、10-50 個、10-100 個、10-150 個、10-300 個、10-400 個、10-500 個、10-600個,或10-658個連續氨基酸殘基具有至少90%的同一性,所述蛋白具有SEQ IDNOS:2059-2089中的任意一個的序列;其中,所述蛋白具有內含肽序列、酶序列、上游內含肽-外顯肽接頭、下游內含肽-外顯肽接頭和至少一種有關SEQ ID NO: 111或SEQ ID NO:91中至少一個的氨基酸改變,且所述分離的氨基酸序列編碼上游內含肽-外顯肽接頭、下游內含肽-外顯肽接頭中的至少一種,或至少一種有關SEQ ID N0:111或SEQ ID N0:91中至少一個的氨基酸改變中的一種或多種。
19.根據權利要求18所述的分離核酸,其中,所述連續氨基酸序列與蛋白中的6個、10-50 個、10-100 個、10-150 個、10-300 個、10-400 個、10-500 個、10-600 個,或 10-658 個連續氨基酸殘基具有至少95%的同一性,所述蛋白具有SEQ ID NOS:2059-2089中的任意一個的序列。
20.根據權利要求18所述的分離核酸,其中,所述連續氨基酸序列與蛋白中的6個、10-50 個、10-100 個、10-150 個、10-300 個、10-400 個、10-500 個、10-600 個,或 10-658 個連續氨基酸殘基具有100%的同一性,所述蛋白具有SEQ ID NOS:2059-2089中的任意一個的序列。
全文摘要
提供了內含肽修飾蛋白、編碼內含肽修飾蛋白的分離核酸、內含肽修飾蛋白的片段、編碼內含肽修飾蛋白片段的分離核酸、含有前述物質的轉基因植物,以及對內含肽修飾蛋白上的抗原表位進行識別的抗體。
文檔編號C07K14/415GK102712681SQ201080060601
公開日2012年10月3日 申請日期2010年11月5日 優先權日2009年11月6日
發明者B·沈, G·拉扎爾, H·德拉維加, J·阿普加, M·R·萊布, P·萊薩德 申請人:谷萬達公司