表達序列的制作方法
【專利說明】表達序列
[0001] 本發明涉及巴斯德畢赤酵母(P. pastoris)表達系統的調節元件,以及它們在生 產目標蛋白(POI)的方法中的用途。
【背景技術】
[0002] 已在原核和真核宿主中成功實現蛋白分泌。最突出的例子是細菌如大腸桿菌,酵 母菌如釀酒酵母、巴斯德畢赤酵母、漢遜酵母(Hansenula polymorpha),絲狀真菌如泡盛曲 霉或里氏木霉,或哺乳動物細胞如CHO細胞。盡管一些蛋白可以容易地實現高效率分泌,但 是很多其他蛋白僅以相對較低的水平分泌。
[0003] 基因在宿主生物體內的異源表達需要一載體,允許宿主生物體的穩定轉化。該載 體或表達組件需為基因提供一功能性啟動子,該啟動子位于編碼序列的5'末端附近。轉錄 因此而受該啟動子序列調節和啟動。
[0004] 分泌途徑通常開始于跨膜多肽和旨在分泌到內質網(ER)內腔的多肽的易位。為 此,這些蛋白具有氨基末端先導序列(precursing sequence),也被稱作"前導序列",其包 含一信號肽和一可選的分泌前導肽原,或由其組成。信號肽通常由13-36個相當疏水的氨 基酸組成。信號肽有一個共同的結構:一短的帶正電荷的氨基末端區域(n-區域);一中 央疏水區域(h-區域);和一極性較強的羧基末端區域(c區域),其中羧基末端區域包含 被信號肽酶切割的位點。在ER的內腔側,信號肽被信號肽酶切除。在通過ER伴侶和折 疊酶成功折疊新生多肽后,該蛋白進一步被引導移出ER。這一進程可得到N末端原序列 (pro-sequence)的支持,因為其存在于例如釀酒酵母交配因子a (MFa)的前體中。該蛋白 然后被運輸到高爾基網絡并最終到達質膜從而分泌到上清液中。前導肽原(推測)被高爾 基內的蛋白酶如釀酒酵母的Kex2蛋白酶從該蛋白上切除。
[0005] 由于大多數酵母并不分泌大量的內源性蛋白,并且它們的細胞外蛋白質組學目前 并未廣泛表征,因此,可獲得的用于酵母的分泌序列的數量是有限的。因此,采用融合目標 蛋白和釀酒酵母的交配因子a前導肽(MFa)的方式來驅動在多種酵母(包括畢赤酵母 屬、克魯維酵母屬、接合酵母屬)中的分泌表達。很可惜,由Kex2蛋白酶進行的MFa蛋白 酶解處理經常在產品中產生異源的N末端氨基酸殘基。
[0006] EP324274B1介紹了在酵母中的改進的異源蛋白的表達和分泌,其采用截短的釀酒 酵母a因子前導序列,EP301669B1描述了用于分泌異源蛋白的克魯維酵母a因子前導序 列。
[0007] 或者,可用釀酒酵母磷酸酶(PH05, DK3614)、釀酒酵母蔗糖轉化酶(SUC, W084/01153),以及酵母天冬氨酸蛋白酶3(YAP3, EP792367B1)的信號肽用于酵母中的分泌 表達。EP0438200(A1)披露了用于在巴斯德畢赤酵母中表達的釀酒酵母SUC2的信號肽序 列。
[0008] US5268273描述了巴斯德畢赤酵母酸性磷酸酶(PHOl)信號序列,其在大多數情況 下弱于MFa。
[0009] US7741075描述了用于重組蛋白表達的巴斯德畢赤酵母PIRl分泌信號肽,以及用 于重組表面展示的巴斯德畢赤酵母PIRl和PIR2錨定域肽。
[0010] Khasa等人2011年(Yeast. 28(3):213-26)描述了巴斯德畢赤酵母PIR基因的 分離以及在細胞表面展示和重組蛋白分泌方面的應用,尤其是利用PpPirlp蛋白的前原 (pre-pro)信號在巴斯德畢赤酵母中進行的重組蛋白分泌,沒有與MFa進行對比。
[0011] W02011073367A1 和 Kottmeier 等人 2011 年(Applied Microbiology and Biotechnology. 91: 1,133-141)描述了一疏水蛋白信號序列,其介導重組蛋白在巴斯德畢 赤酵母中的高效分泌,尤其是使用里氏木霉疏水蛋白的前序列或原序列用于eGFP在巴斯 德畢赤酵母中的分泌。
[0012] 在巴斯德畢赤酵母基因組測序過程中列出了 54種不同的序列作為預測的信號 肽,其包括一切割位點以提供蛋白的分泌。(De Schutter et al. Nature Biotechnology doi:10.1038/nbt. 15442009)。
[0013] US2011/0021378A1描述了經過鑒定的一組54個巴斯德畢赤酵母基因,其包括一 信號序列,在它們之中SEQ ID 8的第1-21個殘基列于US2011/0021378A1中,也包括一切 割位點以提供蛋白分泌。
[0014] EP2258855A1描述了巴斯德畢赤酵母來源的表達系統的調節序列,其中巴斯德畢 赤酵母Epxl蛋白的信號和前導肽序列用作57氨基酸先導序列以便于目標POI蛋白的表達 和分泌。用于信號肽酶的切割位點預計跟隨信號序列,即在位置20和21之間,顯示為切割 位點序列中的連字符:VSA-AP(SEQ ID 6)。
[0015] 最好是能夠提供適合在重組真核宿主細胞內表達POI的替代的調節兀件,以及在 真核細胞內產生分泌性蛋白的簡單、高效的方法,該方法最好能使POI產生同種N末端。
【發明內容】
[0016] 可通過本發明要求保護的主題來實現這個目標。
[0017] 本發明提供一編碼前導序列的分離的核酸,該前導序列選自:
[0018] a)具有SEQ ID 10的氨基酸序列的前導肽或其具有一個或兩個點突變的功能變 體,
[0019] b)具有選自由SEQ ID 11、12、13和14組成的組的氨基酸序列的前導肽,
[0020] c)具有SEQ ID 1的氨基酸序列的信號肽或其具有一個或兩個點突變的功能變體 (優選排除SEQ ID 2),以及
[0021] d)具有選自由SEQID2、3、4和5組成的組(優選排除SEQID2)的氨基酸序列 的信號肽。
[0022] 本發明進一步提供一前導序列,其選自:
[0023] a)具有SEQID 10的氨基酸序列的前導肽或其具有一個或兩個點突變的功能變 體,
[0024] b)具有選自由SEQ ID 11、12、13和14組成的組的氨基酸序列的前導肽,
[0025] c)具有SEQID 1的氨基酸序列的信號肽或其具有一個或兩個點突變的功能變體 (優選排除SEQID2),以及
[0026] d)具有選自由SEQID2、3、4和5組成的組(優選排除SEQID2)的氨基酸序列 的信號肽。
[0027] 特異性前導肽因此通過一 36個氨基酸(aa)前導序列表征,其中N末端的20aa序 列是一特異性信號肽。
[0028] 特異性信號肽因此通過一 20aa信號序列表征,特別地,排除C末端延伸序列,例如 一包括通過另外的氨基酸例如丙氨酸實現的C末端延伸的21aa序列。
[0029] SEQIDI:MKJSTNLILAIAAASXWSA,其中
[0030] 位置3處的X是F或者L
[0031] 位置16處的X是A或者T
[0032] 例如,EpxL-A,一 20個氨基酸(aa)的信號肽,具有SEQID1的氨基酸序列,其中 位置3處的X是L,并且位置16處的X是A(SEQID2)。
[0033] 根據一特定實例,該EpxL-A,一 20個氨基酸(aa)的信號肽,具有SEQID1的氨基 酸序列,其中位置3處的X是F,并且位置16處的X是A(SEQID3)。
[0034] 具體而言,本發明提供一信號肽或一編碼該信號肽的核酸,該信號肽具有選自由 SEQID2、3、4和5組成的組的氨基酸序列。
[0035]SEQID2 :MKLSTNLILAIAAASAVVSA
[0036]SEQID3 :MKF;STNLILAIAAASAVVSA
[0037]SEQID4 :MKF;STNLILAIAAASTVVSA
[0038] SEQID5 :MKLSTNLILAIAAASTVVSA
[0039] 在位置3和16處的氨基酸替換以粗體和下劃線標示。
[0040] 編碼本發明的信號肽的核酸分子在此也稱作"信號序列"。
[0041] 本發明上述定義的前導序列特別地具有SEQID10的氨基酸序列。
[0042] SEQID10 :
[0043]MK$STNLILAIAAASIVVSAAPVAPAEEAANHLHKR,其中
[0044] 位置3處的X是F或者L
[0045] 位置16處的X是A或者T
[0046] 具體而言,本發明提供一前導序列或一編碼該前導序列的核酸,該前導序列具有 選自由SEQID11、12、13和14組成的組的氨基酸序列。
[0047] SEQ ID 11 :MKL;STNLILAIAAAS A VVSAAPVAPAEEAANHLHKR
[0048] SEQ ID 12 :MKF; STNLILAIAAASAVVSAAPVAPAEEAANHLHKR
[0049] SEQ ID 13 :MKf; STNLILAIAAASTVVSAAPVAPAEEAANHLHKR
[0050]SEQID14 :MKLSTNLILAIAAASTVVSAAPVAPAEEAANHLHKR
[0051] 在位置3和16處的氨基酸替換以粗體和下劃線標示。
[0052] 例如,EpxL-KR,一 36個氨基酸(aa)的截短前導序列,具有SEQID10的氨基酸序 列,其中位置3處的X是L,并且位置16處的X是A。
[0053] 根據一特定實例,EpxL-KR,一 36個氨基酸(aa)的前導肽,具有SEQID10的氨基 酸序列,其中位置3處的X是F,并且位置16處的X是A(SEQ ID 12)。
[0054] 本發明的具有SEQ ID 10、11、12、13或14的氨基酸序列的前導序列,或其具有一 個或兩個點突變的功能變體,在此也被稱作"截短前導序列"。
[0055] 具體而言,編碼截短前導序列的核酸包括一編碼信號肽的核酸或由其組成,其中, 該信號肽選自由SEQ ID 2、3、4和5組成的組,優選排除SEQ ID 2。特別地,編碼截短前導 序列的核酸包括一編碼前導肽的核酸或由其組成,其中,該前導肽選自由SEQ ID 11、12、13 和14組成的組。
[0056] 特別地,該截短前導序列包括選自由SEQID2、3、4和5組成的組,優選排除SEQ ID2的信號肽,或由其組成,或由前導肽組成,所述前導肽選自由SEQID11、12、13和14組 成的組。
[0057] -特別優選的核酸編碼SEQ ID 3的氨基酸序列的信號肽或者SEQ ID 12的前導 肽;優選地,編碼該信號肽或前導肽的核酸序列分別是SEQ ID 16或SEQ ID 19。一特別優 選的前導序列是具有SEQ ID 3的氨基酸序列的信號肽或者具有SEQ ID 12的氨基酸序列 的前導肽。
[0058] 因此,本發明的一具體實例是指一前導序列或編碼這種前導序列的核酸,該前導 序列為
[0059] a)具有SEQID3的氨基酸序列的信號肽,優選地,其中該編碼核酸由SEQID16 的核苷酸序列或SEQID16的密碼子優化的變體組成;或
[0060] b)具有或包括SEQ ID 12的氨基酸序列,或者由其組成的前導肽,優選地,其中該 編碼核酸由SEQ ID 19的核苷酸序列或SEQ ID 19的密碼子優化的變體組成。
[0061] 具體而言,本發明的核酸具有
[0062] a)編碼信號肽的核苷酸序列,選自由SEQ ID 15、16和17組成的組(優選排除SEQ ID15),或者
[0063] b)編碼前導肽的核苷酸序列,選自由SEQ ID 18、19和20組成的組,或者
[0064] c) -核苷酸序列,其為SEQ ID 15、16、17、18、19或20的密碼子優化的變體。
[0065] 本發明的一特定核酸編碼一前導序列,該前導序列為SEQ ID 3的氨基酸序列的信 號肽,優選地,其中該核酸由SEQ ID 16的核酸序列或SEQ ID 16的密碼子優化的變體組 成。
[0066] 本發明的一特定核酸編碼一前導序列,該前導序列為一前導肽或截短前導序列, 具有SEQ ID 12的氨基酸序列,優選地,其中該核酸由SEQ ID 19的核苷酸序列或SEQ ID 19的密碼子優化的變體組成。
[0067] SEQ ID 15:獲自巴斯德畢赤酵母 CBS7435 株(CBS-KNAW Fungal Biodiversity Centre (CBS-KNAW 真菌生物多樣性中心),Centraalbureau voor Schimmelcultures, Utrecht, The Netherlands (荷蘭烏得勒支))的核苷酸序列:
[