r>[0182] 由真核細胞分泌的蛋白通常具有一融合到蛋白N末端的前導序列,其從完整的或 "全長"蛋白切除以產生分泌的或"成熟"形式的蛋白。
[0183] 本發明的前導序列的特定實例是一由信號肽組成的前導序列,或一由信號肽和原 序列組成的前導序列,例如本文描述的截短前導序列。由SEQ ID 1的信號肽組成的前導序 列,或SEQ ID 10的截短前導序列,在本文中也被稱為調節序列。
[0184] 本文使用的術語特別指可以調節POI表達的控制序列。前導序列,也被稱為前導 肽,其連接到POI氨基酸序列的N末端。編碼前導序列的核酸是上游的并可操作地連接到 編碼POI的核酸序列的5'末端。可使用本發明的在選擇的宿主細胞內具有功能活性的任 何前導序列。
[0185] 術語"天然N末端氨基酸殘基"或"天然N末端氨基酸序列"指N末端序列的一個 或多個氨基酸,例如所述POI的N末端氨基酸殘基,與待表達的所述POI的序列相比,該氨 基酸殘基被認為是正確的。因此,天然N末端氨基酸殘基提供POI的一天然N末端或N末 端區域,其是獲得一正確的完整的氨基酸序列的先決條件,例如獲得一不含任何對POI來 說是外來的的額外(多余的)N末端氨基酸殘基的功能性化合物。通常,任意野生型蛋白理 解為具有一天然N末端氨基酸殘基。此外,重組蛋白也可具有一天然的N末端氨基酸殘基, 其被預定義并展示出所需的蛋白特性。
[0186] 具體而言,當本發明的信號肽或截短前導序列直接連接到POI的天然N末端氨基 酸殘基時,釋放的蛋白將至少在某種程度上包含一天然N末端氨基酸殘基,并通常不包含 可變長度的N末端延伸。優選的POI組成的特征是包含一正確的N末端的天然N末端氨基 酸殘基,至少達到優選主要是POI分子的程度,或者至少60、65、70、75、80、85、90、95、98或 100% (w/w)為POI分子,而在N末端不含有額外的氨基酸殘基,例如源自信號肽或原序列 或其片段的那些。
[0187] 本文使用的術語"原序列"是指可操作地連接到POI的N末端的前體氨基酸序列。 該原序列也可具有一可操作地連接到原序列的N末端的信號序列。通常,原序列從POI切 除以留下成熟形式的POI。
[0188] 本發明的原序列的一特定實例是截短前導序列的一部分,具有以下氨基酸序列:
[0189] SEQ ID 7 :APVAPAEEAANHLHKR
[0190] 即,截短原序列:SEQ ID 10的截短前導序列的第21-36個氨基酸。
[0191] 本文使用的術語"可操作地連接"指核苷酸序列以一種方式連接到單個核酸分 子上,例如一載體,使得一個或多個核苷酸序列的功能受到存在于所述核酸分子上的至少 一個其他核苷酸序列的影響。例如,一啟動子可操作地連接到重組基因的一編碼序列,當 啟動子能夠影響該編碼序列表達時。作為一進一步的實例,編碼信號肽的核酸可操作地 連接到一編碼POI的核酸序列,當其能夠表達分泌形式的蛋白時,例如成熟蛋白的原形式 (proform)或成熟蛋白。具體而言,這類可操作地相互連接的核酸可立即進行連接,即在編 碼信號肽的核酸和編碼POI的核酸之間沒有進一步的元件或核酸序列。
[0192] 本文使用的"啟動子"是指能夠控制編碼序列或功能RNA表達的DNA序列。啟動 子活性可通過其轉錄效率進行評估。這可直接通過測量來自啟動子的mRNA轉錄量進行測 定,例如,通過Nor them雜交,或間接地通過由啟動子表達的基因產物的量進行測量。
[0193] 本文使用的術語"目標蛋白(POI) "是指通過重組技術在宿主細胞內產生的多肽或 蛋白,也稱為重組POI或由重組宿主細胞產生的P0I。更具體而言,重組POI可以是非天然 產生于宿主細胞內的,即異源蛋白,也可以是宿主細胞本身存在的,即宿主細胞同源蛋白, 但其通過例如包含編碼POI的核酸序列的自我復制載體進行轉化產生,或者通過重組技術 將編碼POI的一個或多個核酸序列拷貝整合到宿主基因組中而產生,或者通過重組修飾控 制編碼POI基因表達的一個或多個調節序列而產生,例如啟動子或信號序列修飾。在特定 情況下,重組POI,不管是異源還是同源POI,通過重組宿主細胞過量表達,以獲得高產量產 物。在一些情形下,本文使用的術語POI還指通過重組表達的蛋白介導的宿主細胞的任何 代謝產物。
[0194] 本文使用的術語"分泌"是指多肽或蛋白特別是POI易位通過宿主植物細胞的細 胞膜和細胞壁。分泌的POI可以是細胞膜的一部分,作為膜結合蛋白錨定在細胞壁中,或者 作為可溶性蛋白釋放到細胞上清液中。
[0195] 應理解的是,本文使用的與POI相關的術語"分泌物"尤其包含成熟形式(包括活 性蛋白的原形式或活性蛋白)的POI表達物,作為膜結合POI或細胞外POI。
[0196] 本文使用的術語"重組"意思是"由基因工程制備或基因工程的結果"。因此,一 "重組微生物"包括至少一個"重組核酸"。重組微生物尤其包括表達載體或克隆載體,或者 其通過基因工程改造而包含重組核酸序列。"重組蛋白"是通過在宿主中表達相應的重組核 酸來產生的。
[0197] 本發明的核酸分子或肽/多肽/蛋白優選是重組的,以提供前導序列與POI的融 合體。本文使用的"重組"是指人工結合兩種原本分開的序列片段,例如通過化學合成或通 過基因工程技術操作分離的核酸片段。"重組"還包括涉及細胞或表達組件,其通過引入異 源核酸進行修飾,或涉及衍生自該修飾細胞的細胞,但不包括自然發生事件(例如自發突 變、自然轉化/轉導/轉座)導致的細胞或載體的改變,例如不通過有意的人為干預發生的 那些。
[0198] 本文使用的術語"信號序列"是指編碼信號肽的核酸,其通常是短(3-60個氨基酸 長度)肽鏈,其引導蛋白運輸。信號肽也可稱為靶信號、轉運肽或定位信號。信號肽尤其包 括沿著分泌途徑待運輸的表達蛋白。通常而言,運輸到周質空間、細胞膜內或細胞外的膜蛋 白或分泌蛋白包含這種N末端信號序列。通常,一旦實現初生蛋白鏈易位到內質網,就通過 信號肽酶將信號肽從成熟蛋白切除。
[0199] 本發明使用的信號肽的一個特定實例是SEQ ID 1的信號肽,或其具有一個或兩個 點突變的功能變體。本發明使用的信號肽通常具有固有特性,即使不存在SEQ ID 6的切割 位點,其也能切除丙氨酸20之后的氨基酸。
[0200] 信號肽由通常在編碼POI的核酸序列之前的核酸序列編碼,可選地在信號序列下 游和POI編碼序列上游具有一原序列。
[0201] 本文使用的術語"基本上純的"或"純化的"指的是制備物包含至少50% (w/w), 優選地至少60 %、70 %、80 %、90 %或95 %的化合物,如核酸分子或POI。通過適當的方法來 測量該化合物的純度(例如層析法、聚丙烯酰胺凝膠電泳、HPLC分析等等)。
[0202] 在鑒定和表征本發明的編碼特定信號肽的新分離的核酸時,令人驚訝的是,發現 該信號肽包含一固有特征,其獨立于后面的氨基酸殘基,切割C末端。這在本文也被稱為C 末端的"固有分泌位點"。因此,一旦前導序列被切除,在信號肽序列之后的氨基酸序列將具 有一正確的、天然N末端氨基酸序列。
[0203] 意外的是,當使用編碼本發明信號肽的核酸時,本領域已知的信號肽酶的切割位 點位于天然巴斯德畢赤酵母Epxl前導序列的信號序列和原序列之間,即在位置20和21 之間,以切割位點的序列中的連字符表示:VSA-AP(SEQ ID 6),其中該切割位點可以省略。 因此,可提供一改進的表達系統,用于至少在某種程度上提供正確的、天然的POI的N末端 氨基酸殘基,其尤其不包括額外的丙氨酸作為N末端氨基酸殘基,例如,大多數(直至高達 100% )的POI分子包含天然N末端序列(通過LC-MS測定)。
[0204] 因此,這是第一次可以使用即用型的編碼20個氨基酸的信號肽的分離的核酸。現 有技術的信號序列(例如US20110021378A1的信號序列)總是在C末端包含至少一個額外 的氨基酸殘基,其為丙氨酸,這可導致待表達蛋白的N末端錯誤。
[0205] 同樣,發現本發明的截短前導序列包含一固有特征,其獨立于后面的氨基酸殘基, 切割C末端。這在本文也被稱為C末端的"固有切割位點"。因此,一旦前導序列被切除,截 短前導序列的C末端或截短前導序列的原序列的C末端之后的氨基酸序列將具有一正確的 天然的N末端氨基酸序列。
[0206] 本發明的分離的核酸和表達載體因此提供具有天然N末端氨基酸殘基的POI的表 達和分泌。這更令人驚訝,因為具有20個氨基酸信號肽的情況下的分泌量遠遠高于用具有 21個氨基酸序列(即如US20110021378A1提出的,在C末端添加一額外的丙氨酸從而延長 該20個氨基酸的信號肽)進行的實驗的分泌量。
[0207] 因此,本發明的另一種實施方式是使用本發明的核酸或前導肽用于分泌POI和/ 或增加POI從宿主細胞的分泌,優選地,其中在本發明的前導序列被切除后,至少60、65、 70、75、80、85、90、95、98、或100%的P0I包含一天然的N末端氨基酸序列。優選地,與已知 的信號肽 SEQ ID 21 相比,分泌量增加 L 15、1.5、2、5、10、20、30、40、50、60、70、80、90 倍或 更多倍。最優選地,POI是一抗體或其片段或衍生物,如下文進一步定義的。
[0208] 進一步,意外地發現可使用截短的前導序列,其長度僅為現有的天然全長前導序 列的63%,因而少于SEQ ID 8的全長前導序列的有效部分。令人驚訝的是,與使用全長前 導序列進行的實驗相比,使用截短前導序列甚至增加了分泌量。
[0209] 根據本發明,分離的核酸或表達組件或載體可使用其他的天然采用的或通常用于 重組表達系統的常規的調節元件或序列,例如以提供高產量生產重組蛋白的構建體。調控 序列的實例包括啟動子、操縱子和增強子、核糖體結合位點,以及控制轉錄和翻譯起始和終 止的序列。
[0210] 為了證明相關序列的功能,可構建表達組件或載體以驅動POI表達,并且將表達 和/或分泌量與具有傳統調節元件的構建體進行比較。實驗程序的詳細描述見下述實例。
[0211] 鑒定的序列使用特定的核苷酸引物從巴斯德畢赤酵母通過PCR擴增,克隆到酵母 表達載體,該載體功能性連接到POI的N末端或者POI序列的上游,并轉化到酵母宿主細胞 系,例如巴斯德畢赤酵母,用于高水平生產各種不同的分泌形式的P0I。為了評估調節序列 (例如本發明的信號序列和截短前導序列)對POI產量的影響,根據本發明獲得的酵母宿主 細胞系可在培養于搖瓶實驗中及分批補料(fedbatch)或恒化器發酵,與包含傳統調節元 件的細胞株進行比較。
[0212] 通過使用本發明的調節元件,特別是編碼信號肽或截短前導序列和表達載體的序 列,本發明方法優選不僅通過提高分泌來增加產量,還提高酵母宿主細胞特別是巴斯德畢 赤酵母宿主細胞中的POI質量。POI分泌增加的確定基于在調節序列特別是信號序列或截 短前導序列存在時,其分泌量的對比,與現有元件相比,其增加蛋白分泌。
[0213] 該POI可以是真核的、原核的或合成的多肽。它可以作為一成熟蛋白分泌,作為膜 結合蛋白或胞外表達蛋白。本發明還提供了天然存在蛋白的功能等價的變體、衍生物和生 物活性片段的重組生產。功能等價的變體優選具有實質相同的功能特征或活性。
[0214] 本文提到的POI可以是一產物,其與真核宿主細胞同源或異源,優選用于治療、預 防、診斷、分析或工業用途。
[0215] POI優選是酵母細胞生產的異源重組多肽或蛋白。
[0216] 特別地,POI是真核蛋白,優選是哺乳動物蛋白。
[0217] 根據本發明產生的POI可以是一多聚體蛋白,優選是二聚體或三聚體。
[0218] 根據本發明的一個方面,POI是重組的或異源的蛋白,優選選自治療性蛋白,包括 抗體或其片段、酶和肽類、蛋白質抗生素、毒素融合蛋白、碳水化合物_蛋白質結合物、結構 蛋白、調節蛋白、疫苗和類疫苗蛋白或顆粒、過程酶、生長因子、激素和細胞因子,或者POI 的代謝物。
[0219] -特定的POI是抗原結合分子,例如抗體或其片段。在各種特異性POI中,有抗體, 例如單克隆抗體(mAbs)、免疫球蛋白(Ig)或G類免疫球蛋白(IgG)、重鏈抗體(HcAb's)、或 其片段,例如片段-抗原結合物(Fab)、Fd、單鏈可變片段(scFv),或者其經過改造的變體例 如Fv二聚體(雙特異抗體)、Fv三聚體(三特異性抗體)、Fv四聚體,或者微抗體和單域抗 體如VH或VHH或V-NAR。
[0220] 進一步的特異性抗體是抑肽酶、組織因子途徑抑制劑或其他蛋白酶抑制劑,以及 胰島素或胰島素前體、胰島素類似物、生長激素、白細胞介素、組織纖溶酶原激活物、轉化生 長因子a或b、胰高血糖素、胰高血糖素樣肽I (GLP-I)、胰高血糖素樣肽2 (GLP-2)、GRPP、因 子VII、因子VIII、因子XIII、血小板源生長因子1、血清白蛋白、酶,例如脂酶或蛋白酶,或 與天然