專利名稱:使用寡糖基轉移酶的多肽的糖綴合的制作方法
使用寡糖基轉移酶的多肽的糖綴合
與相關申請的交叉參照
本申請要求于2008年1月8日提交的美國臨時專利申請號61/019,805的利益, 所述美國臨時專利申請號的內容為了所有目的通過引用整體合并入本文。發明領域
本發明涉及通過糖基化的多肽修飾領域。特別地,本發明涉及使用短的酶識別的 N聯糖基化序列制備糖基化多肽的方法。
發明背景
用于造成特定的生理學應答的糖基化和非糖基化多肽的施用是醫學領域眾所周 知的。例如,經純化的和重組的人生長激素(hGH)用于治療與hGH缺陷相關的病狀和疾病, 例如兒童中的侏儒癥。其他例子涉及具有已知的抗病毒活性的干擾素,以及刺激白血細胞 產生的粒細胞集落刺激因子(G-CSF)。
可以用于制造具有野生型糖基化模式的多肽的表達系統的缺乏已限制了此類多 肽作為治療試劑的用途。本領域已知不適當或不完全糖基化的多肽可以是免疫原性,導致 肽的快速中和和/或變應性應答的發展。重組產生的糖肽的其他缺陷包括亞最佳的效力和 從血流中的快速清除。
解決糖基化多肽治療劑產生中固有的問題的一種方法已在其表達后在體外修飾 多肽。多肽的表達后體外修飾已用于現有聚糖結構的修飾和糖基部分與非糖基化的氨基酸 殘基的附著。重組真核生物糖基轉移酶的廣泛選擇已變得可獲得的,使得具有定制設計的 糖基化模式和糖基結構的哺乳動物糖綴合物的體外酶促合成成為可能。參見例如,美國專 利號 5,876,980 ;6,030,815 ;5, 728,554 ;5,922,577 ;以及 W0/9831826 ;US2003180835 ;和 WO 03/031464。
此外,糖肽已用一種或多種非糖修飾基團例如水溶性聚合物進行衍生。已與肽綴 合的示例性聚合物是聚(乙二醇)(“PEG”)。增加多肽的分子大小的PEG綴合已用于減少 免疫原性,并且延長PEG綴合的多肽的血液清除時間。例如,給予Davis等人的美國專利號 4,179,337公開了與聚乙二醇(PEG)或聚丙二醇(PPG)偶聯的非免疫原性多肽,例如酶和多 肽-激素。
用于使PEG及其衍生物與多肽附著的主要方法涉及通過氨基酸殘基的非特異性 鍵合(參見例如,美國專利號4,088,538美國專利號4,496,689、美國專利號4,414,147、美 國專利號4,055,635和PCT W087/00056)。PEG綴合的另一種方法涉及糖肽的糖基殘基的 非特異性氧化(參見例如,WO 94/05332)。
在這些非特異性方法中,PEG以隨機、非特異性方式加入多肽主鏈上的反應殘基 中。這種方法具有明顯缺點,包括最終產物的同質性的缺乏,和經修飾的多肽的生物學或酶 促活性減少的可能性。因此,高度需要用于治療多肽的衍生方法,所述方法導致特異性標記 的、可容易表征和基本上同質的產物的形成。
特異性修飾的、同質的多肽治療劑可以通過使用酶在體外產生。與用于使修飾基團例如合成聚合物與多肽附著的非特異性方法不同,基于酶的合成具有區域選擇性和立體 選擇性的優點。用于在經標記的多肽的合成中使用的2個主要類別的酶是糖基轉移酶(例 如,唾液酸轉移酶、寡糖基轉移酶、N-乙酰葡糖氨基轉移酶)和糖苷酶。這些酶可以用于糖 的特異性附著,所述糖隨后可以經改變以包括修飾基團。備選地,糖基轉移酶和經修飾的糖 苷酶可以用于將經修飾的糖直接轉移給多肽主鏈(參見例如,美國專利6,399,336以及美 國專利申請公開 20030040037、20040132640、20040137557、20040126838 和 20040142856, 其各自通過引用合并入本文)。使化學和酶促方法相組合的方法也是已知的(參見例如, Yamamoto 等人,Carbohydr. Res. 305 :415-422(1998)和美國專利申請公開 20040137557,其 通過引用合并入本文)。
碳水化合物以幾種方法與糖肽附著,其中N聯至天冬酰胺和0聯至絲氨酸和蘇氨 酸是對于重組糖蛋白治療劑最相關的。
并非所有多肽都包括糖基化序列作為其氨基酸序列的部分。此外,現有的糖基化 序列可能不適合于附著修飾基團。此類修飾可以例如引起經修飾的多肽的生物活性中不希 望有的降低。因此,本領域需要精確和可重現的糖基化和糖修飾方法。本發明解決了這些 和其他需要。
發明概述
本發明包括酶促糖綴合或糖基PEG化反應可以特異性靶向多肽內的特定N聯糖基 化序列的發現。在一個例子中,通過突變將所靶向的糖基化序列引入親本多肽(例如野生 型多肽)內,產生包括N聯糖基化序列的突變體多肽,其中N聯糖基化序列不存在于相對應 的親本多肽(外源N聯糖基化序列)中,或不存在于相同位置處。此類突變體多肽命名為 “序列子(sequon)多肽”。
在一個方面,本發明提供了包括至少一個外源N聯糖基化序列的多肽和制備此類 多肽的方法。本發明還提供了序列子多肽的文庫。在一個代表性實施方案中,文庫包括多 個不同成員,其中文庫的每個成員與共同的親本多肽相對應,并且其中文庫的每個成員包 括本發明的外源N聯糖基化序列。還提供的是制備且使用此類文庫的方法。
在一個實施方案中,每個N聯糖基化序列是酶的底物,所述酶例如寡糖基轉移酶, 例如本文描述的那些(例如,?818或乂〖3),所述酶可以將經修飾的或未經修飾的糖基部分 從糖基供體種類轉移到N聯糖基化序列的天冬酰胺殘基上。因此,在另一個方面,本發明提 供了在糖基化多肽和修飾基團(例如,聚合修飾基團)之間的共價綴合物,其中多肽包括外 源N聯糖基化序列。聚合修飾基團經由糖基連接基團在N聯糖基化序列內的天冬酰胺殘基 處與多肽綴合,所述糖基連接基團插入多肽和聚合修飾基團之間,并且與多肽和聚合修飾 基團共價連接,其中糖基連接基團是選自單糖和寡糖的成員。本發明進一步提供了包括本 發明的多肽綴合物的藥物組合物。
在本發明的多肽中使用的示例性N聯糖基化序列選自SEQ ID NO :1和SEQ ID NO: 2
X1NX2X3X4 (SEQ ID NO 1);禾口
X1DX2 ‘ NX2X3X4 (SEQ ID NO 2),
其中N是天冬酰胺;D是天冬氨酸;X3是選自蘇氨酸⑴和絲氨酸⑶的成員;X1 存在或不存在,并且當存在時是氨基酸;X4存在或不存在,并且當存在時是氨基酸;并且X2
其中w是選自1至20的整數。在一個例子中,w選自1-8。整數ρ選自0和1。F 是脂質部分;Ζ*是選自單糖和寡糖的糖基部分;每個La是獨立地選自單鍵、官能團、取代或 未取代的烷基、取代或未取代的雜烷基、取代或未取代的芳基、取代或未取代的雜芳基、和 取代或未取代的雜環烷基的連接體部分;每個Rfk是獨立地選擇的修飾基團,例如本文描述 的線性或分支聚合修飾基團(例如,PEG) ;A1是選自P(磷)和C(碳)的成員;Y3是選自氧 (0)和硫(S)的成員;Y4是選自0、S、SR1、OR1、0Q、CR1R2和NR3R4的成員;E2、E3和E4是獨立 地選自CR1! 2、0、S和NR3的成員;并且每個W是獨立地選自SR1、OR1、0Q、NR3R4、取代或未取 代的烷基、取代或未取代的雜烷基、取代或未取代的芳基、取代或未取代的雜芳基、和取代 或未取代的雜環烷基的成員,其中每個Q是獨立地選自H、單個負電荷和陽離子(例如,Na+ 或K+)的成員。每個R1、每個R2、每個R3和每個R4是獨立地選自H、取代或未取代的烷基、取 代或未取代的雜烷基、取代或未取代的芳基、取代或未取代的雜芳基、和取代或未取代的雜 環烷基的成員。
本發明的另外方面、優點和目的由于下述詳述將是顯而易見的。
附圖簡述
圖IA和
圖1B(分別為SEQ ID NO 8禾口 SEQ ID NO 9)各自顯示因子VIII的示例性氨基酸序列。
圖2是示例性因子VIII氨基酸序列,其中B結構域(氨基酸殘基741-1648)被去和X2'是獨立地選擇的氨基酸。在一個實施方案中,X2和X2'不是脯氨酸(P)。
本發明進一步提供了制備且使用多肽綴合物的方法。在一個例子中,使用無細胞 的體外方法形成在多肽和修飾基團(例如,聚合修飾基團)之間的多肽綴合物。多肽包括 包含天冬酰胺殘基的本發明的N聯糖基化序列。修飾基團經由糖基連接基團在天冬酰胺殘 基處與多肽共價連接,所述糖基連接基團插入多肽和修飾基團之間,并且與多肽和修飾基 團共價連接。該方法包括在寡糖基轉移酶的存在下,在足以使寡糖基轉移酶將糖基部分從 糖基供體種類轉移到N聯糖基化序列的天冬酰胺殘基上的條件下,使本發明的多肽和糖基 供體種類相接觸。
形成多肽和修飾基團(例如,聚合修飾基團)之間的共價綴合物的另一個示例性 方法涉及多肽在其中表達的宿主細胞內的細胞內糖基化。該方法利用內源和/或共表達的 寡糖基轉移酶。該方法包括在細胞內酶(例如,寡糖基轉移酶)的存在下,在足以使酶將糖 基部分從糖基供體種類轉移到N聯糖基化序列的天冬酰胺殘基上的條件下,使包括N聯糖 基化序列的多肽(例如,本發明的多肽)和糖基供體種類相接觸。在一個例子中,將糖基供 體種類加入細胞培養基中,被宿主細胞內在化,并且用作通過細胞內(內源或共表達)寡糖 基轉移酶的底物。
在另一個方面,本發明提供了在本發明的方法中使用的糖基供體種類。示例性糖 基供體種類具有根據式(X)的結構
除(SEQ ID NO :3)。本發明的示例性多肽包括其中缺失的B結構域用至少一個氨基酸殘基 替換的那些(B結構域替換序列)。在一個實施方案中,在Arg74°和Glu1649之間的B結構域 替換序列包括至少一個0聯或N聯糖基化序列。
圖3是B結構域缺失的因子VIII的示例性氨基酸序列(SEQ IDNO 4)。
圖4是B結構域缺失的因子VIII的示例性氨基酸序列(SEQ IDNO 5)。
圖5B結構域缺失的因子VIII的示例性氨基酸序列(SEQ ID NO 6)。
圖6是描述本發明的示例性實施方案的表,其中本發明的特定多肽與本發明的特 定N聯糖基化序列結合使用。圖6中的每行代表本發明的一個示例性實施方案,其中在多 肽的氨基酸序列內的所示位置處將N聯糖基化序列引入多肽內。
發明詳述
I.縮寫
PEG,聚(乙二醇);m-PEG,甲氧基-聚(乙二醇);PPG,聚(丙二醇);m_PPG,甲氧 基-聚(丙二醇);Fuc,巖藻糖或巖藻糖基;foil,半乳糖或半乳糖基;GalNAc,N-乙酰半乳 糖胺或N-乙酰半乳糖胺基;Glc,葡萄糖或葡萄糖基;GlcNAc,N-乙酰葡糖胺或N-乙酰葡糖 胺基;Man,甘露糖或甘露糖基;ManAc,乙酸甘露糖胺或乙酸甘露糖胺基;Sia,唾液酸或唾 液酸基;和NeuAc,N-乙酰神經酰胺或N-乙酰神經酰胺基。
II.定義
除非另有說明,本文使用的所有技術和科學術語一般具有與本發明所屬領域普通 技術人員通常理解相同的含義。一般地,本文使用的命名法以及細胞培養、分子遺傳學、有 機化學和核酸化學和雜交中的實驗室操作是本領域眾所周知且通常采用的那些。標準技術 用于核酸和肽合成。技術和操作一般根據本領域的常規方法和各種一般參考文獻來執行 (一般參見,Sambrook 等人Molecular Cloning :A Laboratory Maniml,第 2 版(1989) Cold Spring Harbor Laboratory Press, Cold SpringHarbor, N. Y.,其通過弓I用合并入本文), 所述參考文獻在本文件自始至終提供。本文使用的命名法以及下文描述的分析化學和有機 合成化學的實驗室操作是本領域眾所周知且通常采用的那些。標準技術或其修飾用于化學 合成和化學分析。
本文描述的所有寡糖用關于非還原糖的名稱或縮寫(S卩,Gal)進行描述,隨后為 糖苷鍵的構型(α或β )、環鍵(1或2)、鍵中涉及的還原糖的環位置0、3、4、6或8),并且 隨后為還原糖的名稱或縮寫(即,GlcNAc)。每種糖優選是吡喃糖。關于標準糖生物學命名 法的綜述,參見例如,Essentials of Glycobiology Varki 等人編輯 CSHL Press (1999)。 寡糖可以包括糖基模擬部分作為糖組分之一。寡糖被視為具有還原末端和非還原末端,糖 是否在還原末端處事實上是還原糖。
術語“糖基部分”意指衍生自糖殘基的任何原子團。“糖基部分”包括單和寡糖并 且包括“糖基模擬部分”。
如本文所使用的,術語“糖基模擬部分”指在結構上與糖基部分(例如己糖或戊 糖)類似的部分。“糖基模擬部分”的例子包括這樣的部分,其中糖基部分的糖苷氧或環氧 或兩者已用鍵或另一個原子(例如,硫)或另一個部分(例如碳(例如,CH2)或含氮基團 (例如,NH))替換。例子包括取代或未取代的環己基衍生物、環硫醚、環仲胺、包括硫代糖苷 鍵的部分等。在一個例子中,“糖基模擬部分”在酶促催化的反應中轉移到多肽的氨基酸殘基或糖肽的糖基部分上。這可以例如通過用離去基團例如鹵素激活“糖基模擬部分”來完 成。
術語“核酸”或“多核苷酸”指以單鏈或雙鏈形式的脫氧核糖核酸(DNA)或核糖 核酸(RNA)及其聚合物。除非明確限制,否則該術語包括包含天然核苷酸的已知類似物的 核酸,所述天然核苷酸的已知類似物具有與參考核酸相似的結合性質,并且以與天然存在 的核苷酸相似的方式代謝。除非另有說明,否則特定核酸序列還暗示包括其保守修飾的變 體(例如簡并密碼子置換)、等位基因、直向同源物、SNP和互補序列以及明確指示的序列。 特別地,簡并密碼子置換可以通過產生這樣的序列來達到,在所述序列中一個或多個所選 擇的(或所有)密碼子的第三個位置由混合堿基和/或脫氧肌苷殘基置換(Batzer等人, Nucleic AcidRes. 19:5081(1991) ;Ohtsuka 等人,J. Biol. Chem. 260 :2605-2608 (1985);和 Rossolini 等人,Mol. Cell. Probes 8:91-98(1994))。術語核酸可與基因、cDNA 和由基因 編碼的mRNA互換使用。
術語“基因”意指涉及產生多肽鏈的DNA區段。它可以包括在編碼區前和后的區 域(前導區和尾部)以及個別編碼區段(外顯子)之間的間插序列(內含子)。
術語“經分離的”當應用于核酸或蛋白質時,指核酸或蛋白質基本上不含它在自然 狀態下與之結合的其他細胞組分。它優選處于同質狀態,盡管它可以在干燥或水溶液中。純 度和同質性一般使用分析化學技術進行測定,所述分析化學技術例如聚丙烯酰胺凝膠電泳 或高效液相色譜法。其為制劑中存在的占優勢種類的蛋白質或核酸是基本上純化的。特別 地,經分離的基因與開放讀碼框分開,所述開放讀碼框側接基因并且編碼除目的基因外的 蛋白質。術語“經純化的”指核酸或蛋白質在電泳凝膠中基本上產生一個條帶。特別地,它 意指核酸或蛋白質是至少85%純的,更優選至少95%純的,并且最優選至少99%純的。
術語“氨基酸”指天然存在的和合成氨基酸,以及以與天然存在的氨基酸相似的方 式起作用的氨基酸類似物和氨基酸模擬物。天然存在的氨基酸是由遺傳密碼編碼的氨基 酸,以及隨后被修飾的氨基酸,例如羥脯氨酸、Y-羧基谷氨酸和0-磷酸絲氨酸。氨基酸類 似物指這樣的化合物,其具有與天然存在的氨基酸相同的基本化學結構,即與氫結合的α 碳、羧基、氨基和R基,例如高絲氨酸、正亮氨酸、甲硫氨酸亞砜、甲硫氨酸甲锍。此類類似物 具有經修飾的R基(例如,正亮氨酸)或經修飾的肽主鏈,但保留與天然存在的氨基酸相同 的基本化學結構。“氨基酸模擬物”指這樣的化學化合物,其具有與氨基酸的一般化學結構 不同的結構,但以與天然存在的氨基酸相似的方式起作用。
術語“不帶電的氨基酸”指不包括酸性(例如,-C00H)或堿性(例如,-NH2)官能團 的氨基酸。堿性氨基酸包括賴氨酸(K)和精氨酸(R)。酸性氨基酸包括天冬氨酸(D)和谷 氨酸(E)。“不帶電的氨基酸”包括例如甘氨酸(G)、纈氨酸(V)、亮氨酸(L)、異亮氨酸(I)、 苯丙氨酸(F),以及包括-0H、-SH或-SCH3基團的氨基酸(例如,蘇氨酸(T)、絲氨酸(S)、酪 氨酸(Y)、半胱氨酸(C)和甲硫氨酸(M))。
存在允許以位點特異性方式將非天然氨基酸衍生物或類似物摻入多肽鏈內的本 領域已知的各種方法,參見例如,WO 02/086075。
氨基酸在本文中可以通過通常已知的三字母符號或通過由IUPAC-Ira Biochemical Nomenclature Commission推薦的單字母符號提及。同樣地,核苷酸可以通過 其通常公認的單字母編碼提及。
“保守修飾的變體”應用于氨基酸和核酸序列。就特定的核酸序列而言,“保守修 飾的變體”指編碼等同或基本上等同的氨基酸序列的核酸,或當核酸不編碼氨基酸序列時, 指基本上等同的序列。由于遺傳密碼的簡并性,大量功能上等同的核酸編碼任何給定蛋白 質。例如,密碼子GCA、GCC、GCG和G⑶全都編碼氨基酸丙氨酸。因此,在其中丙氨酸由密 碼子指定的每個位置處,密碼子可以改變為所述的任何相對應密碼子而不改變所編碼的多 肽。此類核酸變異是“沉默變異”,其為保守修飾的變體的一個種類。本文編碼多肽的每一 個核酸序列也描述核酸的每一個可能的沉默變異。技術人員應認識到核酸中的每個密碼子 (除AUG和TGG外,所述AUG通常為甲硫氨酸的唯一密碼子,所述TGG通常為色氨酸的唯一 密碼子)可以進行修飾,以產生功能上等同的分子。因此,編碼多肽的核酸的每個沉默變異 在每個所述序列中暗示。
就氨基酸序列而言,技術人員應認識到關于核酸、肽、多肽或蛋白質序列的個別置 換、缺失或添加(其改變、添加或缺失編碼序列中的單個氨基酸或小百分比的氨基酸)是 “保守修飾的變體”,其中改變導致氨基酸由化學上相似的氨基酸置換。提供功能上相似的 氨基酸的保守置換表是本領域眾所周知的。此類保守修飾的變體附加于并且不排除本發明 的多態變體、種間同系物和等位基因。
下述8個組各自包含彼此為保守置換的氨基酸
1)丙氨酸(A)、甘氨酸(G);
2)天冬氨酸(D)、谷氨酸(E);
3)天冬酰胺(N)、谷氨酰胺(Q);
4)精氨酸(R)、賴氨酸(K);
5)異亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、纈氨酸(V);
6)苯丙氨酸(F)、酪氨酸⑴、色氨酸(W);
7)絲氨酸(S)、蘇氨酸(T);和
8)半胱氨酸(C)、甲硫氨酸(M)
(參見例如,Creighton, Proteins (1984))
“肽”指包括通過酰胺鍵連接在一起的衍生自氨基酸的單體。本發明的肽在大小方 面可以從例如2個氨基酸到數百或數千個氨基酸不等。較大的肽(例如至少10、至少20、至 少30或至少50個氨基酸殘基)備選地稱為“多肽”或“蛋白質”。另外,還包括非天然氨基 酸,例如β-丙氨酸、苯基甘氨酸、高精氨酸和高苯丙氨酸。非基因編碼的氨基酸也可以在 本發明中使用。此外,已進行修飾以包括反應基團、糖基化序列、聚合物、治療部分、生物分 子等的氨基酸也可以在本發明中使用。在本發明中使用的所有氨基酸都可以是D-或L-同 分異構體。L-同分異構體一般是優選的。此外,其他模擬肽在本發明中也是有用的。如本 文所使用的,“肽”或“多肽”指糖基化和非糖基化的肽或“多肽”。還包括的是通過表達多肽 的系統不完全糖基化的多肽。關于一般綜述,參見Spatola,A.F.,inChemistry and Biochemistry ofAmino Acids,Peptides and Proteins'B· Weinstein,Marcel Dekker7NewYork,% 267 ]λΙ (1983)。 術語“多肽”還包括那種多肽的所有可能形式,例如突變形式(一個或多個突變)、截短形 式、延長形式、包括多肽的融合蛋白、加標記的多肽、變體,其中特定結構域被去除或部分去 除。術語“多肽”包括那種多肽的單體、寡聚物和聚合物。例如,術語“血管性血友病因子 (von Willebrand Factor) " (vffF)包括vWF的單體、二聚和寡聚形式。19
在本申請中,氨基酸殘基根據其距離多肽的N末端氨基酸(例如,N末端甲硫氨 酸)的相對位置進行編號(一般為上標),所述N末端氨基酸編號為“1”。N末端氨基酸可 以是甲硫氨酸(M),編號為“1”。如果多肽的N末端不由甲硫氨酸開始,那么與每個氨基酸 殘基相關的編號可以容易地進行調整,以反映N末端甲硫氨酸的不存在。應當理解示例性 多肽的N末端可以由或不由甲硫氨酸開始。
術語“親本多肽”指這樣的任何多肽,其具有不包括本發明的“外源”N聯糖基化序 列的氨基酸序列。然而,“親本多肽”可以包括一個或多個天然存在的(內源)N聯糖基化序 列。例如,野生型多肽可以包括N聯糖基化序列“NLT”。術語“親本多肽”指任何多肽,包括 野生型多肽、融合多肽、合成多肽、重組多肽(例如,治療多肽)以及其任何變體(例如,先 前通過氨基酸的一個或多個替換、氨基酸插入、氨基酸缺失等進行修飾的),只要此類修飾 不等于形成本發明的N聯糖基化序列。在一個實施方案中,親本多肽的氨基酸序列、或編碼 親本多肽的核酸序列是限定的且是以任何方式可公開獲得的。例如,親本多肽是野生型多 肽,并且野生型多肽的氨基酸序列或核苷酸序列是可公開獲得的蛋白質數據庫(例如,EMBL Nucleotide Sequence Database、NCBIEntrez、ExPasy、Protein Data Bank ^ ) ^^Pio 在另一個例子中,親本多肽不是野生型多肽,但用作治療多肽(即,經認可的藥物),并且此 類多肽的序列可在科學出版物或專利中公開獲得。在另外一個例子中,親本多肽的氨基酸 序列或編碼親本多肽的核酸序列在本發明的時間處以任何方式是可公開獲得的。在一個實 施方案中,親本多肽是較大結構的部分。例如,親本多肽與抗體的恒定區(F。)或(^2結構域 相對應,其中這些結構域可以是完整抗體的部分。在一個實施方案中,親本多肽不是具有已 知序列的抗體。
術語“突變體多肽”或“多肽變體”指這樣的多肽形式,其中它的氨基酸序列不同 于其相對應野生型形式、天然存在的形式或其他親本形式的氨基酸序列。突變體多肽可以 包含一個或多個突變,例如替換、插入、缺失等,這導致突變體多肽。
術語“序列子多肽”指在其氨基酸序列中包括“外源N聯糖基化序列”的多肽變體。 “序列子多肽”包含至少一個外源N聯糖基化序列,還可以包括一個或多個內源(例如,天然 存在的)N聯糖基化序列。
術語“外源N聯糖基化序列”指引入親本多肽(例如,野生型多肽)的氨基酸序列 內的N聯糖基化序列,其中親本多肽不包括N聯糖基化序列,或包括在不同位置處的N聯糖 基化序列。在一個例子中,將N聯糖基化序列引入不具有N聯糖基化序列的野生型多肽內。 在另一個例子中,野生型多肽天然地包括在第一個位置處的第一個N聯糖基化序列。將第 二個N聯糖基化在第二個位置處引入這個野生型多肽內。這種修飾導致在第二個位置處具 有“外源N聯糖基化序列”的多肽。外源N聯糖基化序列可以通過突變引入親本多肽內。備 選地,具有外源N聯糖基化序列的多肽可以通過化學合成進行制備。
術語“與親本多肽相對應”(或這個術語的語法變異)用于描述本發明的序列子 多肽,其中序列子多肽的氨基酸序列僅由于本發明的至少一個外源N聯糖基化序列的存在 而不同于相對應親本多肽的氨基酸序列。一般地,序列子多肽和親本多肽的氨基酸序列顯 示高同一性百分比。在一個例子中,“與親本多肽相對應”意指序列子多肽的氨基酸序列與 親本多肽的氨基酸序列具有至少約50 %同一性,至少約60 %、至少約70 %、至少約80 %、至 少約90%、至少約95%或至少約98%同一性。在另一個例子中,編碼序列子多肽的核酸序列與編碼親本多肽的核酸序列具有至少約50%同一性,至少約60%、至少約70%、至少約 80%、至少約90%、至少約95%或至少約98%同一性。。
術語“將糖基化序列(例如,N聯糖基化序列)引入(或加入等)親本多肽”(或 其語法變異)內,或“修飾親本多肽”以包括糖基化序列(或其語法變異),不一定意指親本 多肽是用于此類轉變的物理原材料,而是意指親本多肽提供用于制備另一個多肽的指導氨 基酸序列。在一個例子中,“將糖基化序列引入親本多肽內”意指關于親本多肽的基因通過 合適突變進行修飾,以產生編碼序列子多肽的核苷酸序列。在另一個例子中,“將糖基化序 列引入親本多肽內”意指所得到的多肽使用親本多肽序列作為指導在理論上進行設計。所 設計的多肽隨后可以通過化學或其他方式產生。
術語“引導多肽”指本發明的序列子多肽,其可以是例如通過本發明的方法有效糖 基化的和/或糖綴合的(例如,糖基PEG化的)。對于作為引導多肽合適的本發明的序列子 多肽,當實施合適的發育條件時,此類多肽優選是糖基化的或糖綴合的(例如,糖基PEG化 的),其中反應得率為至少約50 %,優選至少約60 %,更優選至少約70 %,并且更加優選約 80%、約85%、約90%或約95%。最優選的是這樣的本發明的引導多肽,其可以是糖基化的 或糖綴合的(例如,糖基PEG化的),其中反應得率超過80 %、超過85 %、超過90 %、或超過 95%。在一個優選實施方案中,引導多肽是以這樣的方式糖基化的或糖基PEG化的,使得每 個N聯糖基化序列的僅一個氨基酸殘基是糖基化的或糖綴合的(例如,糖基PEG化的)(單 糖基化)。在各種實施方案中,糖基化的或糖綴合的單個氨基酸殘基位于外源N聯糖基化序 列內。
術語“文庫”指不同多肽的集合,文庫的每個成員與共同的親本多肽相對應。文庫 中的每個多肽種類稱為文庫的“成員”。優選地,本發明的文庫是具有足夠數目和多樣性的 多肽的集合,以提供從其中鑒定引導多肽的群體。文庫包括至少2個不同多肽。在一個實 施方案中,文庫包括約2至約10個成員。在另一個實施方案中,文庫包括約10至約20個 成員。在另外一個實施方案中,文庫包括約20至約30個成員。在一個進一步的實施方案 中,文庫包括約30至約50個成員。在另一個實施方案中,文庫包括約50至約100個成員。 在另外一個實施方案中,文庫包括超過100個成員。文庫的成員可以是混合物的部分或可 以彼此分離。在一個例子中,文庫的成員是任選包括其他組分的混合物的部分。例如,至少 2個序列子多肽存在于大量細胞培養肉湯中。在另一個例子中,文庫的成員可以各自分開表 達并且是任選分離的。經分離的序列子多肽可以任選包含在多孔容器中,其中每個孔包含 不同類型的序列子多肽。
術語本發明的“CH2”結構域意欲描述免疫球蛋白重鏈恒定Ch2結構域。在限定免 疫球蛋&CH2結構域中,參考一般而言的免疫球蛋白且特別參考如通過Kabat Ε. A. (1978) Adv. Protein Chem. 32 :1-75應用于人IgGl的免疫球蛋白的結構域結構。
術語“包括CH2結構域的多肽”或“包括至少一個CH2結構域的多肽”意欲包括完 整抗體分子、抗體片段(例如,Fc結構域)、或包括與免疫球蛋白的(^2區域等價的區域的 融合蛋白。
術語“多肽綴合物”指其中如本文所述多肽用糖部分(例如,經修飾的糖)進行糖 綴合的本發明的種類。在一個代表性例子中,多肽是具有外源0聯糖基化序列的序列子多 肽。
如本文所使用的,“接近脯氨酸殘基”或“與脯氨酸殘基接近”指這樣的氨基酸,其 遠離脯氨酸殘基小于約10個氨基酸,優選地,遠離脯氨酸殘基小于約9、8、7、6或5個氨基 酸,更優選地,遠離脯氨酸殘基小于約4、3或2個氨基酸。“接近脯氨酸殘基”的氨基酸可以 在脯氨酸殘基的C或N末端側上。
術語“唾液酸”指九碳羧化糖家族的任何成員。唾液酸家族的最常見成員是N-乙 酰-神經氨酸(2-酮-5-乙酰胺-3,5-雙脫氧-D-甘油-D-galactononulopyranos-Ι-酮酸 (通常縮寫為Neu5AC、NeuAC或NANA)。該家族的第二個成員是N-羥乙酰-神經氨酸(Neu5Gc 或NeuGc),其中NeuAc的N-乙酰基是羥基化的。第三個唾液酸家族成員是2-酮-3-脫 氧-nonulosonic acid (KDN)(Nadano 等人(1986)J. Biol. Chem. 261 11550—11557 ; Kanamori 等人,J. Biol. Chem. 265 :21811-21819 (1990))。還包括的是 9-取代唾液酸例如 9-0-C「C6 酰基-Neu5Ac,如 9_0_ 乳酰-Neu5Ac 或 9_0_ 乙酰-Neu5Ac、9_ 脫氧-9-氟-Neu5Ac 和9-疊氮基-9-脫氧-Neu5Ac。關于唾液酸家族的綜述,參見例如,Varki,Glycobiology 2 :25-40 (1992) ;Sialic Acids :Chemistry, Metabolism and Function, R. Schauer,編輯 (Springer-Verlag,New York(1992))。在唾液酸化操作中唾液酸化合物的合成和使用公開 于1992年10月1日公開的國際申請WO 92/16640中。
如本文所使用的,術語“經修飾的糖”指天然或非天然存在的碳水化合物。在一個 實施方案中,“經修飾的糖”使用本發明的方法酶促加入多肽的氨基酸或糖基殘基上。經修 飾的糖選自許多酶底物,包括但不限于糖核苷酸(單、二和三磷酸鹽)、活化糖(例如,糖基 鹵化物、糖基甲磺酸鹽)和既未活化也不是核苷酸的糖。“經修飾的糖”用“修飾基團”共價 官能化。有用的修飾基團包括但不限于,聚合修飾基團(例如,水溶性聚合物)、治療部分、 診斷部分、生物分子等。在一個實施方案中,修飾基團不是天然存在的糖基部分(例如,天 然存在的多糖)。修飾基團優選是非天然存在的。在一個例子中,“非天然存在的修飾基團” 是聚合修飾基團,其中至少一個聚合部分是非天然存在的。在另一個例子中,非天然存在的 修飾基團是經修飾的碳水化合物。用修飾基團官能化的部位這樣進行選擇,使得它不阻止 “經修飾的糖”酶促加入多肽。“經修飾的糖”也指任何糖基模擬部分,其用修飾基團官能化, 并且是天然或經修飾的酶例如糖基轉移酶的底物。
如本文所使用的,術語“聚合修飾基團”是包括至少一個聚合部分(聚合物)的修 飾基團。在一個例子中,當加入多肽時,聚合修飾基團可以改變此類多肽的至少一種生物學 性質,例如它的生物利用度、生物活性、它的體內半衰期或免疫原性。示例性聚合物包括水 溶性和水不溶性聚合物。聚合修飾基團可以是線性或分支的,并且可以包括一個或多個獨 立選擇的聚合部分,例如聚(亞烷基二醇)及其衍生物。在一個例子中,聚合物是非天然存 在的。在一個示例性實施方案中,聚合修飾基團包括水溶性聚合物,例如聚(乙二醇)及其 衍生物(PEG,m-PEG)、聚(丙二醇)及其衍生物(PPG,m_PPG)等。在一個優選實施方案中, 聚(乙二醇)或聚(丙二醇)具有基本上均勻分散的分子量。在一個實施方案中,聚合修 飾基團是天然存在或非天然存在的多糖(例如,多唾液酸)。
術語“水溶性的”指在水中具有一定可檢測程度的溶解性的部分。檢測和/或定 量水溶性的方法是本領域眾所周知的。示例性水溶性聚合物包括肽、寡糖和多糖、聚(醚)、 聚(胺)、聚(羧酸)等。肽可以具有混合序列或可以由單一氨基酸組成[聚(氨基酸), 例如聚(賴氨酸)]。示例性多糖是多(唾液酸)。示例性聚(醚)是聚(乙二醇),例如,m-PEG。聚(乙烯亞胺)是示例性聚胺,并且聚(丙烯)酸是代表性聚(羧酸)。
水溶性聚合物的聚合物主鏈可以是聚(乙二醇)(S卩,PEG)。然而,應當理解其他 相關聚合物也適合于在本發明的實踐中使用,并且術語PEG或聚(乙二醇)的使用在這方 面意欲是包括的而不是排除的。術語PEG包括以其任何形式的聚(乙二醇),包括烷氧基 PEG、雙功能PEG、多臂PEG、叉狀PEG、分支PEG、懸垂PEG (即,具有與聚合物主鏈懸垂的一個 或多個官能團的PEG或相關聚合物)、或其中具有可降解連接的PEG。同樣地,術語聚(環 氧烷)意欲包括此類材料的所有形式,并且包括摻入超過一個類型的聚(環氧烷)的材料, 例如PEG和PPG的組合。
聚合物主鏈可以是線性或分支的。分支聚合物主鏈是本領域一般已知的。一般 地,分支聚合物具有中心分支核心部分和與中心分支核心連接的多條線性聚合物鏈。PEG通 常以分支形式使用,其可以通過將環氧乙烷加入各種多元醇中進行制備,所述多元醇例如 甘油、季戊四醇和山梨糖醇。中心分支部分也可以衍生自幾種氨基酸,例如賴氨酸或半胱氨 酸。在一個例子中,分支聚(乙二醇)可以以一般形式表示為R(-PEG-0H)m,其中R表示核心 部分,例如甘油或季戊四醇,并且m表示臂的數目。多臂PEG分子例如美國專利號5,932,462 中描述的那些也可以用作聚合物主鏈,所述專利通過引用整體合并入本文。
許多其他聚合物也適合于本發明。非肽和水溶性的聚合物主鏈在本發明中特別有 用。合適的聚合物的例子包括但不限于,其他聚(亞烷基二醇),例如聚(丙二醇)(“PPG”)、 乙二醇和丙二醇的共聚物等、聚(氧乙基化多元醇)、聚(烯屬醇)、聚(乙烯吡咯烷酮)、 聚(羥丙基甲基丙烯酰胺)、聚(α-羥酸)、聚(乙烯醇)、聚膦腈、聚噁唑啉、聚(N-丙酰基 嗎啉),例如通過引用整體合并入本文的美國專利號5,629,384中描述的,以及其共聚物、 三聚物和混合物。盡管聚合物主鏈的每條鏈的分子量可以改變,但它一般為約IOODa至約 100,OOODa,通常約 5,OOODa 至約 80,OOODa0
如本文所使用的,術語“糖綴合”指酶促介導的經修飾的糖種類與多肽的氨基酸或 糖基殘基的綴合,所述多肽例如本發明的突變型人生長激素。在一個例子中,經修飾的糖與 一個或多個修飾基團共價附著。“糖綴合”的亞屬是“二醇glycol-PEG化”或“糖基PEG化”, 其中經修飾的糖的修飾基團是聚(乙二醇)或其衍生物,例如烷基衍生物(例如,m-PEG)或 具有反應性官能團的衍生物(例如,H2N-PEG, H00C-PEG)。
術語“大規模”和“工業規模”可互換使用,并且指這樣的反應循環,其在單個反應 循環完成時產生至少約250mg、優選至少約500mg、和更優選至少約1克糖綴合物。
術語“N聯糖基化序列”或“序列子”指包括至少一個天冬酰胺(N)殘基的任何氨 基酸序列(例如包含約3至約9個氨基酸、優選約3至約6個氨基酸)。在一個實施方案 中,N聯糖基化序列是酶例如寡糖基轉移酶的底物,優選當多肽的氨基酸序列的部分時。在 一個一般的實施方案中,酶通過修飾上述天冬酰胺殘基的氨基將糖基部分轉移到N聯糖基 化序列上,所述天冬酰胺殘基被稱為“糖基化位點”。本發明區分在野生型多肽或其任何其 他親本形式中天然存在的N聯糖基化序列(內源N聯糖基化序列)和“外源N聯糖基化序 列”。包括外源N聯糖基化序列的多肽被稱為“序列子多肽”。親本多肽的氨基酸序列可以 通過重組技術、化學合成或其他方式進行修飾,以包括外源N聯糖基化序列。
如本文所使用的,術語“糖基連接基團”指修飾基團(例如,PEG部分、治療部分、 生物分子)與之共價附著的糖基殘基;所述糖基連接基團使修飾基團與綴合物的其余部分連接。在本發明的方法中,“糖基連接基團”變得與糖基化或未糖基化的多肽共價附著,從 而使修飾基團與多肽的氨基酸和/或糖基殘基連接。“糖基連接基團” 一般通過“經修飾的 糖”與多肽的氨基酸和/或糖基殘基的酶促附著而衍生自“經修飾的糖”。糖基連接基團可 以是糖衍生的結構,其在修飾基團-經修飾的糖盒形成過程中降解(例如,氧化一希夫堿形 成一還原),或糖基連接基團可以是“完整的糖基連接基團”。“糖基連接基團”可以包括糖 基模擬部分。例如,用于將經修飾的糖加入糖基化多肽中的糖基轉移酶(例如,唾液酸轉移 酶)顯示出對于糖基模擬底物的耐受性(例如,其中糖部分是糖基模擬部分例如唾液酸模 擬部分的經修飾的糖)。經修飾的糖基模擬糖的轉移導致具有糖基連接基團的綴合物,所述 糖基連接基團為糖基模擬部分。
術語“完整的糖基連接基團”指衍生自糖基部分的糖基連接基團,其中使修飾基團 與綴合物的其余部分連接的糖單體未降解,例如使用的酶促氧化。例如,環結構通過經由高 碘酸鈉氧化而打開,或其中。本發明的示例性“完整的糖基連接基團”是唾液酸部分,其中 C-6 側鏈是完整的(choh-choh-ch2oh)。
如本文所使用的,術語“靶向部分”指將選擇性定位在身體的特定組織或區域中 的種類。定位通過分子決定簇的特異性識別、靶向試劑或綴合物的分子大小、離子相互作 用、疏水性相互作用等介導。使試劑靶向特定組織或區域的其他機制是本領域技術人員已 知的。示例性靶向部分包括抗體、抗體片段、轉鐵蛋白、HS-糖蛋白、凝血因子、血清蛋白質、 β _ 糖蛋白、G-CSF、GM-CSF、M-CSF, EPO 等。
術語“連接基團”是使2個部分連接的任何化學基團。在一個例子中,連接基團包 括至少一個雜原子。示例性連接基團包括醚、硫醚、胺、甲酰胺、磺胺、胼、羰基、氨基甲酸鹽、 尿素、硫脲、酯和碳酸酯。
如本文所使用的,“治療部分”指對于治療有用的任何試劑,包括但不限于抗生素、 抗炎劑、抗腫瘤藥物、細胞毒素和放射性試劑。“治療部分”包括生物活性試劑的藥物前體、 其中超過一個治療部分與載體結合的構建體,例如多價試劑。治療部分還包括蛋白質和包 括蛋白質的構建體。示例性蛋白質包括但不限于,促紅細胞生成素(EPO)、粒細胞集落刺激 因子(GCSF)、粒細胞巨噬細胞集落刺激因子(GMCSF)、干擾素(例如,干擾素-α、-β、-Y)、 白介素(例如,白介素II)、血清蛋白質(例如,因子VII、Vila、VIII、IX和X)、人絨毛膜促 性腺素(HCG)、促卵泡激素(FSH)和促黃體激素(LH)和抗體融合蛋白(例如腫瘤壞死因子 受體((TNFR)/Fe結構域融合蛋白))。
如本文所使用的,“抗腫瘤藥物”意指對抗癌癥有用的任何試劑,包括但不限于細 胞毒素和試劑例如抗代謝藥、烷化劑、蒽環類、抗生素、抗有絲分裂藥、丙卡巴胼、羥基脲、天 冬酰胺酶、皮質類固醇、干擾素和放射性試劑。在術語“抗腫瘤藥物”的范圍內還包括的是 具有抗腫瘤活性的多肽例如TNF-α的綴合物。綴合物包括但不限于在治療蛋白質和本發 明的糖蛋白之間形成的那些。代表性綴合物是在PSGL-I和TNF-α之間形成的那種。
如本文所使用的,“細胞毒素或細胞毒素劑”意指對細胞有害的任何試劑。例子 包括泰素、細胞松弛素B、短桿菌肽D、溴化乙啶、依米丁、絲裂霉素、依托泊苷、替尼泊苷 (tenoposide)、長春新堿、長春堿、秋水仙堿、多柔比星、柔紅霉素、二羥基蒽二酮、米托蒽 醌、光輝霉素、放線菌素D、l-去氫睪酮、糖皮質激素、普魯卡因、丁卡因、利多卡因、普萘洛 爾和嘌呤霉素及其類似物或同系物。其他毒素包括但不限于例如蓖麻蛋白、CC-1065和類似物——多卡米星。另外其他的毒素包括白喉毒素和蛇毒(例如,眼鏡蛇毒)。
如本文所使用的,“放射性試劑”包括在診斷或破壞腫瘤中有效的任何放射性同位 素。例子包括但不限于銦-111、鈷-60。此外,天然存在的放射性元素例如鈾、鐳和釷(其 一般代表放射性同位素的混合物)是放射性試劑的合適例子。金屬離子一般與有機螯合部 分進行螯合。
許多有用的螯合基團、冠醚、穴狀配體等是本領域已知的,并且可以摻入本發明的 化合物內(例如,EDTA、DTPA、DOTA、NTA、HDTA等及其膦酸酯類似物,例如DTPP、EDTP、HDTP、 NTP 等)。參見例如 Pitt 等人,"The Design of Chelating Agents for the Treatment oflron Overload,”In,Inokganic Chemistey in BiologyandMedicine ;Martel 1, ;American Chemical Society, Washington, D. C. , 1980,第 279-312 頁;Lindoy, The Chemistey of MaceocyclicLigand Complexes ;Cambridge University Press, Cambridge, 1989 ;Dugas, B100RGANIC Chemistey ; Springer-Verlag, New York, 1989,和其中包含的參考文獻。
此外,允許螯合劑、冠醚和環糊精與其他分子附著的許多途徑是本領域技術人員 可用的。參見例如,Meares 等人,"Properties of In VivoChelate-Tagged Proteins and Polypeptides. In,Modification ofProteins :Food‘ Nutriti0nal,and Pharmacological Aspects ; Feeney, 人’編輯,American Chemical Society, Washington, D. C. , 1982,第 370-387 頁;Kasina 等 人,Bioconjugate Chem. ,9 :108-117 (1998) ;Song 等 人’ Bioconjugate Chem. ,8 249-255(1997)。
如本文所使用的,“藥學上可接受的載體”包括這樣的任何材料,當與綴合物相組 合時,所述材料保留綴合物的活性并且與受試者的免疫系統不反應。“藥學上可接受的載 體”包括固體和液體例如媒介物、稀釋劑和溶劑。例子包括但不限于,標準藥學載體中的任 何,例如磷酸鹽緩沖鹽水溶液、水、乳狀液例如油/水乳狀液、和各種類型的濕潤劑。其他載 體還可以包括無菌溶液、片劑包括包衣片和膠囊。一般地,此類載體包含賦形劑例如淀粉、 乳、糖、特定類型的粘土、明膠、硬脂酸或其鹽、硬脂酸鎂或鈣、滑石、蔬菜脂肪或油、樹膠、二 醇或其他已知賦形劑。此類載體還可以包括調味和顏色添加劑或其他成分。包括此類載體 的組合物通過眾所周知的常規方法進行配制。
如本文所使用的,“施用”意指經口施用,作為栓劑施用,局部接觸,靜脈內、腹膜 內、肌內、損傷內或皮下施用,通過吸入施用,或給受試者植入緩慢釋放裝置例如微型滲透 泵。施用通過任何途徑包括腸胃外和經粘膜(例如,經口、鼻、陰道、直腸或經皮),特別是 通過吸入。腸胃外施用包括例如靜脈內、肌內、小動脈內、真皮內、皮下、腹膜內、心室內和顱 內。此外,當注射是治療腫瘤例如誘導細胞凋亡時,施用可以直接對于腫瘤和/或進入腫瘤 周圍的組織內。其他遞送方式包括但不限于,脂質體制劑的使用、靜脈內輸注、經皮貼劑等。
術語“改善”指病理狀態或病狀的治療中的任何成功標記,包括任何客觀或主觀參 數,例如癥狀的減輕、緩解或減少,或患者的身體或精神正常中的改善。癥狀的改善可以基 于客觀或主觀參數;包括體格檢查和/或精神評估的結果。
術語“療法”指疾病或病狀的“治療”或“處理”,包括預防疾病或病狀在受試者(例 如,人)中發生,所述受試者可能對該疾病易感但仍未經歷或顯示出疾病的癥狀(預防治 療),抑制疾病(減緩或阻止其發展)、提供來自疾病的癥狀或副作用的緩解,和緩解疾病 (引起疾病的消退)。
術語“有效量”或“有效的量”或“治療有效量”或任何語法上等價的術語意指這樣 的量,當施用于動物或人用于治療疾病時,所述量足以實現對于那種疾病的治療。
術語“經分離的”指基本上或實際上不含用于產生材料的組分的材料。對于本發 明的多肽綴合物,術語“經分離的”指基本上或實際上不含組分的材料,所述組分通常在用 于制備多肽綴合物的混合物中伴隨材料。“經分離的”和“純的”可互換使用。一般地,本發 明的經分離的多肽綴合物具有優選表示為范圍的純度水平。關于多肽綴合物的純度范圍的 下限是約60 %、約70 %或約80 %,并且純度范圍的上限是70 %、約80 %、約90 %或超過約 90%。
當多肽綴合物超過約90%純時,其純度也優選表示為范圍。純度范圍的下限是約 90 %、約92 %、約94 %、約96 %或約98 %。純度范圍的上限是約92 %、約94 %、約96 %、約 98%或約100%純度。
純度通過任何領域公認的分析方法(例如,在銀染色的凝膠上的條帶強度、聚丙 烯酰胺凝膠電泳、HPLC、質譜法或相似方法)進行測定。
如本文所使用的,“群體的基本上每個成員”描述本發明的多肽綴合物群體的特 征,其中將加入多肽中的所選擇百分比的經修飾的糖加入多肽上的多個等同的受體位點 中。“群體的基本上每個成員”說的是與經修飾的糖綴合的多肽上的位點的“同質性”,并且 指本發明的綴合物,所述本發明的綴合物是至少約80%、優選至少約90%和更優選至少約 95%同質的。
“同質性”指跨越經修飾的糖與之綴合的受體部分群體的結構一致性。因此,在其 中每個經修飾的糖部分與受體位點(其具有和每一個其他經修飾的糖與之綴合的受體位 點相同的結構)綴合的本發明的多肽綴合物中,多肽綴合物被說成是約100%同質的。同質 性一般表示為范圍。關于多肽綴合物的同質性范圍的下限是約50%、約60%、約70%或約 80 %,并且純度范圍的上限是約70 %、約80 %、約90 %或超過約90 %。
當多肽綴合物超過或等于約90%同質時,其同質性也優選表示為范圍。同質性 范圍的下限是約90 %、約92 %、約94 %、約96 %或約98 %。純度范圍的上限是約92 %、約 94%、約96%、約98%或約100%同質性。多肽綴合物的純度一般通過本領域技術人員已知 的一種或多種方法進行測定,例如液相色譜法-質譜法(LC-MQ、基質輔助的激光解吸飛行 時間質譜法(MALDIT0F)、毛細管電泳法等。
“基本上均勻的糖型”或“基本上均勻的糖基化模式”當指糖肽種類時,指通過目的 糖基轉移酶(例如,GalNAc轉移酶)而被糖基化的受體部分的百分比。例如,在α 1,2巖 藻糖基轉移酶的情況下,如果基本上所有(如下定義)Gali3 l,4-GlcNAc-R及其唾液酸化類 似物在本發明的肽綴合物中是巖藻糖基化的,那么顯示基本上均勻的巖藻糖基化模式。本 領域技術人員應當理解,原材料可以包含糖基化的受體部分(例如,巖藻糖基化的Galii 1, 4-GlcNAc-R部分)。因此,經計算的糖基化百分比將包括通過本發明的方法糖基化的受體 部分,以及在原材料中已糖基化的那些受體部分。
在“基本上均勻的”上文定義中的術語“基本上”一般意指對于特定糖基轉移酶至 少約40 %、至少約70 %、至少約80 %,或更優選至少約90 %,且更加優選至少約95 %的受體 部分是糖基化的。
當取代基通過其從左到右書寫的常規化學式指定時,它們相等地包括化學上等同26的取代物,這將起因于從右到左書寫結構,例如-CH2O-意欲還描述-0CH2_。
除非另有說明,否則術語“烷基”本身或作為另一個取代物的部分意指直鏈或支 鏈、或環狀(即環烷基)烴原子團,或其組合,其可以是完全飽和的、單或多不飽和的,并且 可以包括具有指定碳原子數目(即,C1-Cltl意指1至10個碳)的二價(例如烷撐)和多價原 子團。飽和烴原子團的例子包括但不限于基團,例如甲基、乙基、正丙基、異丙基、正丁基、叔 丁基、異丁基、仲丁基、環己基、(環己基)甲基、環丙基甲基,例如正戊基、正己基、正庚基、 正辛基的同系物和同分異構體等。不飽和的烷基是具有一個或多個雙鍵或三鍵的基團。不 飽和的烷基的例子包括但不限于,乙烯基、2-丙烯基、丁烯基、2-異戊烯基、2-( 丁二烯基)、 2,4-戊二烯基、3-(1,4-戊二烯基)、乙炔基、1和3-丙炔基、3- 丁炔基、以及更高級的同系 物和同分異構體。除非另有說明,否則術語“烷基”也意欲包括在下文更詳細地定義的那些 烷基衍生物,例如“雜烷基”。局限于烴基團的烷基命名為“同烷基(homoalkyl) ”。
術語“烷撐”本身或作為另一個取代物的部分意指衍生自烷烴的二價原子團,例如 但不限于-CH2CH2CH2CH2-,并且進一步包括下文描述為“雜烷撐”的那些基團。一般地,烷基 (或烷撐)基團將具有1至M個碳原子,其中具有10個或更少碳原子的那些基團在本發明 中優選。“低級烷基”或“低級烷撐”是一般具有8個或更少碳原子的較短鏈的烷基或烷撐 基團。
術語“烷氧基”、“烷氨基”和“烷硫基”(或硫代烷氧基)以其常規意義使用,并且 分別指經由氧原子、氨基或硫原子與分子的其余部分附著的那些烷基。
除非另有說明,否則術語“雜烷基”本身或與另一個術語相組合意指穩定的直鏈或 支鏈、或環狀烴原子團、或其組合,由所述數目的碳原子和選自0、N、Si和S的至少一個雜 原子組成,并且其中氮和硫原子可以任選是氧化的,并且氮雜原子可以任選是季銨化的。雜 原子0、N、S和Si可以置于雜烷基的任何內部位置處或在其上烷基與分子的其余部分附著 的位置處。例子包括但不限于-CH2-CH2-O-CH3、-CH2-CH2-NH-CH3、-CH2-CH2-N(CH3) -CH3> -CH2 -S-CH2-CH3、-CH2-CH2, -S (0) -CH3、-CH2-CH2-S (0) 2_CH3、-CH = CH-O-CH3、-Si (CH3) 3、-CH2-CH =N-OCH3、和-CH = CH-N (CH3) -CH3。高達2個雜原子可以是相鄰的,例如-CH2-NH-OCH3 和-CH2-O-Si (CH3) 3。類似地,術語“雜烷撐”本身或作為另一個取代物的部分意指衍生自雜 烷基的二價原子團,例如但不限于-CH2-CH2-S-CH2-CH2-和-CH2-S-CH2-CH2-NH-CH2-。對于雜 烷撐基團,雜原子也可以占據一個或兩個鏈末端(例如,烷撐氧基(alkyleneoxy)、烷撐二 氧基、烷撐氨基、烷撐二氨基等)。再進一步地,對于烷撐和雜烷撐連接基團,連接基團的方 向不由其中連接基團的式書寫的方向暗示。例如,式-CO2R'-代表-C(O)OR’和-0C(0)R,。
除非另有說明,否則術語“環烷基”和“雜環烷基”本身或與其他術語相組合分別 代表“烷基”和“雜烷基”的環狀形式。此外,對于雜環烷基,雜原子可以占據在其上雜環 與分子的其余部分附著的位置。環烷基的例子包括但不限于環戊基、環己基、1-環己烯基、 3-環己烯基、環庚基等。雜環烷基的例子包括但不限于,1-(1,2,5,6_四氫吡啶基)、1_哌 啶基、2-哌啶基、3-哌啶基、4-嗎啉基、3-嗎啉基、四氫呋喃-2-基、四氫呋喃-3-基、四氫 噻吩-2-基、四氫噻吩-3-基、1-哌嗪基、2-哌嗪基等。
除非另有說明,否則術語“鹵素”或“鹵代”本身或作為另一個取代物的部分意指 氟、氯、溴或碘原子。此外,術語例如“鹵烷基”意欲包括單鹵烷基和多鹵烷基。例如,術語 “鹵(C1-C4)烷基”意欲包括但不限于,三氟甲基、2,2,2_三氟乙基、4-氯丁基、3-溴丙基等。
除非另有說明,否則術語“芳基”意指其可以為單環或多環(優選1至3個環)的 多不飽和、芳香族取代基,所述環融合在一起或共價連接。術語“雜芳基”指包含選自N、0、 S、Si和B的1至4種雜原子的芳基(或環),其中氮和硫原子任選是氧化的,并且氮原子 任選是季銨化的。雜芳基可以通過雜原子與分子的其余部分附著。芳基和雜芳基的非限制 性例子包括苯基、1-萘基、2-萘基、4-聯苯基、1-吡咯基、2-吡咯基、3-吡咯基、3-吡唑基、 2-咪唑基、4-咪唑基、批嗪基、2-噁唑基、4-噁唑基、2-苯基-4-噁唑基、5-噁唑基、3-異 噁唑基、4-異噁唑基、5-異噁唑基、2-噻唑基、4-噻唑基、5-噻唑基、2-呋喃基、3-呋喃基、 2-噻吩基、3-噻吩基、2-吡啶基、3-吡啶基、4-吡啶基、2-嘧啶基、4-嘧啶基、5-苯并噻唑 基、嘌呤基、2-苯并咪唑基、5-吲哚基、1-異喹啉基、5-異喹啉基、2-喹噁啉基、5-喹噁啉 基、3-喹啉基、和6-喹啉基。關于上述芳環和雜芳環系統各自的取代物選自下文描述的可 接受的取代物。
為了間短起見,術語“芳基”當與其他術語相組合使用時(例如,芳氧基、芳硫氧基 (arylthioxy)、芳烷基)包括如上定義的芳環和雜芳環。因此,術語“芳烷基”意欲包括其 中芳基與烷基附著的那些原子團(例如苯甲基、苯乙基、吡啶甲基等),包括其中碳原子(例 如,亞甲基)已由例如氧原子替換的那些烷基(例如,苯氧甲基、2-吡啶氧基甲基、3-(1-萘 氧基)丙基等)。
上述術語(例如,“烷基”、“雜烷基”、“芳基”和“雜芳基”)各自意欲包括取代或未 取代形式的所示原子團。關于每種類型原子團的優選取代物在下文提供。
關于烷基和雜烷基原子團(包括通常稱為烷撐、烯基、雜烷撐、雜烯基、炔基、環烷 基、雜環烷基、環烯基和雜環烯基的那些基團)的取代物在屬類上稱為“烷基取代物”,并且 它們可以是選自但不限于下述的各種基團中的一種或多種數目為0至Cm’ +1)的取代 或未取代的芳基、取代或未取代的雜芳基、取代或未取代的雜環烷基、-OR’、= 0、= NR’、= N-0R,、-NR,R”、-SR,、_ 鹵素、-SiR,R” R”,、-OC (0) R,、-C (0) R,、_0)2R,、-C0NR,R”、-OC(O) NR,R,,、-NR,,C(0)R,、-NR,-C (0) NR,,R,”、-NR" C (O)2R', -NR-C (NR,R,,R,,,)= NR,,”、-NR-C (NR,R”) = NR”,、_S (0) R,、_S (0) 2R,、_S (0) 2NR,R”、-NRS&R,、_CN 和-NO2,其中 m’是此類原子團中的碳原子的總數目。R’、R”、R”’和R””各自優選獨立地指氫,取代或未 取代的雜烷基,取代或未取代的芳基例如由1-3個鹵素取代的芳基,取代或未取代的烷基、 烷氧基或硫代烷氧基、或芳烷基。當本發明的化合物包括超過一個R基團時,例如R基團各 自獨立地選擇為每個R’、R”、R”’和R””基團,當存在這些基團中的超過一個時。當R’和R” 與相同氮原子附著時,它們可以與氮原子相組合,以形成5-、6_或7-成員環。例如,-NR’R” 意欲包括但不限于,1-吡咯烷基和4-嗎啉基。根據取代物的上文討論,本領域技術人員應 當理解術語“烷基”意欲包括包含這樣的基團,其包括與除氫基團外的基團結合的碳原子, 例如鹵烷基(例如,-CF3 和-CH2CF3)和芳基(例如,-C (0) CH3、-C (0) CF3、-C (0) CH2OCH3 等)。
類似于對于烷基原子團描述的取代物,關于芳基和雜芳基的取代物在屬類上稱 為“芳基取代物”。取代物選自例如取代或未取代的烷基、取代或未取代的雜烷基、取代 或未取代的芳基、取代或未取代的雜芳基、取代或未取代的雜環烷基、-OR’、= 0、= NR’、= N-0R,、-NR,R”、-SR,、_ 鹵素、-SiR,R” R”,、-OC (0) R,、-C (0) R,、_C02R,、-C0NR,R”、-OC(O) NR,R,,、-NR,,C(0)R,、-NR,-C (0) NR,,R,”、-NR" C (O)2R', -NR-C (NR,R,,R,,,)= NR,”,、-NR-C (NR,R,,)= NR,”、-S (0) R,、-S (0) 2R,、-S (0) 2NR,R,,、-NRSO2R'、-CN和-N02、-R,、-N3、-CH(Ph)2、氟(C1-C4)烷氧基和氟(C1-C4)烷基,數目為0至芳環系統上的 開放效價的總數目;并且其中R’、R”、R”’和R””優選獨立地選自氫、取代或未取代的烷基、 取代或未取代的雜烷基、取代或未取代的芳基、和取代或未取代的雜芳基。當本發明的化合 物包括超過一個R基團時,例如R基團各自獨立地選擇為每個R’、R”、R”’和R””基團,當存 在這些基團中的超過一個時。
芳環或雜芳環的鄰近原子上的2個取代物可以任選由式-T-C(O) _(CRR’ ) q-U_的 取代物替換,其中τ和U獨立地是-NR-、-0-、-CRR'-或單鍵,并且q是0至3的整數。備 選地,芳環或雜芳環的鄰近原子上的2個取代物可以任選由式-A-(CH2)^B-的取代物替換, 其中 A 和 B 獨立地是-CRR,-、-0-、-NR-、-S-、-S (0) -、-S (0) 2_、-S (0) 2NR,-或單鍵,并且 r 是1至4的整數。如此形成的新環的單鍵之一可以任選由雙鍵替換。備選地,芳環或雜芳 環的鄰近原子上的2個取代物可以任選由式-(CRR’)S-X-(CR”R”’ )d-的取代物替換,其中 s 和 d 獨立地是 0 至 3 的整數,并且 X 是-0-、-NR,-、-S-、-S (0) -、-S (0) 2_ 或-S (0) 2NR,-。 取代物R、R’、R”和R”’優選獨立地選自氫或取代或未取代的(C1-C6)烷基。
如本文所使用的,術語“酰基”描述包含羰基殘基C(O)R的取代物。關于R的示例 性種類包括H、鹵素、烷氧基、取代或未取代的烷基、取代或未取代的芳基、取代或未取代的 雜芳基、和取代或未取代的雜環烷基。
如本文所使用的,術語“融合的環系統”意指至少2個環,其中每個環具有與另一 個環共同的至少2個原子。“融合的環系統可以包括芳香族以及非芳香族環。“融合的環系 統”的例子是萘、噴哚、喹啉、色烯等。
如本文所使用的,術語“雜原子”包括氧(0)、氮(N)、硫(S)、硅(Si)、硼(B)和磷 ⑵。
符號“R”是代表取代基的一般縮寫。示例性取代基包括取代或未取代的烷基、取 代或未取代的雜烷基、取代或未取代的芳基、取代或未取代的雜芳基、和取代或未取代的雜環烷基。
術語“藥學上可接受的鹽”包括依賴于在本文描述的化合物上發現的具體取代物, 用分別地無毒酸或堿制備的鹽。當本發明的化合物包含相對酸性的功能性時,通過使此類 化合物(例如,其中性形式)與足夠量的所需堿純粹或在合適的惰性溶劑中相接觸,可以 獲得堿加成鹽。藥學上可接受的堿加成鹽的例子包括鈉、鉀、鈣、銨、有機氨基或鎂鹽、或相 似鹽。當本發明的化合物包括相對堿性的功能性時,通過使此類化合物(例如,其中性形 式)與足夠量的所需酸純粹或在合適的惰性溶劑中相接觸,可以獲得酸加成鹽。藥學上可 接受的酸加成鹽的例子包括衍生自無機酸的那些,所述無機酸如鹽酸、磺酸、氫溴酸、硝酸、 碳酸、單氫碳酸、磷酸、單氫磷酸、二氫磷酸、硫酸、單氫硫酸、氫碘酸或亞磷酸等,以及衍生 自相對無毒的有機酸的鹽,所述有機酸如乙酸、丙酸、異丁酸、馬來酸、丙二酸、苯甲酸、琥 珀酸、辛二酸、延胡索酸、乳酸、扁桃酸、苯二甲酸、苯磺酸、對甲苯磺酸、檸檬酸、酒石酸、甲 磺酸等。還包括的是氨基酸的鹽例如精氨酸鹽(arginate)等,和有機酸例如葡糖醛酸或 半乳糖醛酸)的鹽等(參見例如,Berge 等人,Journal ofPharmaceutical Science,66 1-19(1977))。本發明的特定特異性化合物包含堿性和酸性功能性,其允許化合物轉變成堿 或酸加成鹽。
化合物的中性形式優選通過使鹽與堿或酸相接觸并且以常規方式分離親本化合物而再生。化合物的親本形式在特定物理性質(例如在極性溶劑中的溶解性)方面不同于 各種鹽形式,但在其他方面鹽等價于化合物的親本形式用于本發明的目的。
除鹽形式外,本發明提供了以藥物前體形式的化合物。本文描述的化合物的藥物 前體是在生理條件下容易地經歷化學變化以提供本發明的化合物的那些化合物。此外,藥 物前體可以在離體環境中通過化學或生物化學方法轉變成本發明的化合物。例如,當與合 適的酶或化學試劑一起置于經皮貼劑儲庫中時,藥物前體可以緩慢地轉變成本發明的化合 物。
本發明的特定化合物可以以非溶劑化形式以及溶劑化形式包括水合物形式存在。 一般而言,溶劑化形式等價于非溶劑化形式,并且包括在本發明的范圍內。本發明的特定化 合物可以以多結晶或無定形形式存在。一般而言,所有物理形式對于由本發明考慮的用途 是等價的,并且預期在本發明的范圍內。
本發明的特定化合物具有不對稱碳原子(光學中心)或雙鍵;外消旋物、非對映異 構體、幾何異構體和個別同分異構體包括在本發明的范圍內。
本發明的化合物可以制備為單一同分異構體(例如,對映體、順式-反式、位置、 非對映體)或制備為同分異構體的混合物。在一個優選實施方案中,化合物制備為基本上 單一的同分異構體。制備基本上同分異構純的化合物的方法是本領域已知的。例如,對映 體富集的混合物和純的對映體化合物可以通過使用對映體純的合成中間產物與這樣的反 應相組合進行制備,所述反應使得手性中心處的立體化學不改變或導致其完全倒置。備選 地,沿著合成途徑的最終產物或中間產物可以解析(resovle)成單一立體異構體。用于 使特定立體中心倒置或不改變的技術,以及用于解析立體異構體的混合物的技術,是本領 域眾所周知的,并且選擇用于特定情況的合適方法完全在本領域技術人員的能力內。一 般參見,Furniss 等人(編輯),V0GEL,s Encyclopedia of PeacticalOkganic Chemistey 第 5 版,Longman Scientific and Technical Ltd. , Essex,1991,第 809-816 頁;禾口 Heller, Acc. Chem. Res. 23 :128(1990)。
本文使用的外消旋、ambiscalemic和scalemic或對映體純的化合物的圖示取自 Maehr, J. Chem. Ed. ,62 :114-120(1985)實心和折斷的(broken)楔形用于指示手性單元的 絕對構型;波浪線指示它代表的鍵可以產生的任何立體化學牽涉的否認;實心和折斷的粗 線是指示所示相對構型但不暗示任何絕對立體化學的幾何學描述符;并且楔形輪廓和虛線 或折線指示不確定的絕對構型的對映體純的化合物。
術語“對映體過量”和非對映體過量”在本文中可互換使用。具有單個立體中心的 化合物被稱為以“對映體過量”存在,具有至少2個立體中心的化合物被稱為以“非對映體過量”存在。
本發明的化合物還可以包含在構成此類化合物的一個或多個原子處的非天然比 例的原子同位素。例如,化合物可以用放射性同位素進行放射性標記,所述放射性同位素例 如氘(3H)、碘-125 (125I)或碳-14(1 )。放射性或非放射性的本發明的化合物的所有同位素 變異意欲包括在本發明的范圍內。
如本文所使用的,“活性官能團”指基團,包括但不限于,烯屬烴、乙炔、醇、酚、醚、 氧化物、商化物、醛、酮、羧酸、酯、酰胺、氰酸酯、異氰酸酯、硫氰酸酯、異硫氰酸酯、胺、胼、 腙、酰胼、重氮基、重氮、硝基、腈、硫醇、硫化物、二硫化物、亞砜、砜、磺酸、亞磺酸、縮醛、縮酮、酐、硫酸鹽、次磺酸異腈、脒、酰亞胺、亞氨酸酯(imidates)、硝酮、羥胺、肟、羥肟酸、硫 羥肟酸、丙二烯、原酸酯、亞硫酸鹽、烯胺、炔胺、尿素、假尿素、氨基脲、碳化二亞胺、氨基甲 酸酯、亞胺、疊氮化物、偶氮化合物、氧化偶氮化合物、和亞硝基化合物。反應性官能團還包 括用于制備生物綴合物的那些,例如,N-羥基琥珀酰亞胺酯、馬來酰亞胺等。制備這些官 能團中每一種的方法是本領域眾所周知的,并且其用于具體用途的應用或修飾在本領域技 術人員的能力內(參見例如,Sandler和Karo,編輯Okganic Functional GeoupP reparations‘ Academic Press,San Diego,1989)。
“非共價蛋白質結合基團”是以結合方式與完整或變性多肽相互作用的部分。相互 作用在生物環境中可以是可逆的或不可逆的。“非共價蛋白質結合基團”摻入本發明的螯合 劑或復合物內,給試劑或復合物提供了以非共價方式與多肽相互作用的能力。示例性非共 價相互作用包括疏水性-疏水性和靜電相互作用。示例性“非共價蛋白質結合基團”包括 陰離子基團,例如磷酸鹽、硫代磷酸鹽、膦酸鹽、羧酸鹽、硼酸鹽、硫酸鹽、砜、磺酸鹽、硫代硫 酸鹽和硫代磺酸鹽。
“酶截短”或“截短的酶”或語法變體以及“結構域缺失的酶”或語法變體指這樣的 酶,其具有比相對應天然存在的酶更少的氨基酸殘基,但保留特定酶促活性。可以缺失任何 數目的氨基酸殘基,只要酶保留活性。在某些實施方案中,可以缺失結構域或結構域的部 分,例如,可以缺失膜錨著結構域,留下可溶性酶。某些feilNAcT酶例如fetlNAc-T2具有C 末端凝集素結構域,其可以缺失而不減少酶促活性。
“重折疊表達系統”指具有氧化細胞內環境的細菌或其他微生物,當在這種微生物 中表達時,其具有以其正確/活性形式重折疊含二硫化物蛋白質的能力。例子包括基于大 腸桿菌的系統(例如,Origami (經修飾的大腸桿菌trxB-/g0r-),Origami 2 等、假單 胞菌屬(I^eudomonas)(例如,熒光)。關于Origami 技術的示例性參考文獻,參見例如, Lobel 等人(2001) Endocrine 14 (2),205-212 ;和 Lobel 等人(2002) Protein Express. Purif. 25(1),124-133。
III.前言
本發明提供了包括至少一個外源N聯糖基化序列(序列子多肽)的多肽。每個多 肽與親本多肽相對應。親本多肽可以是任何多肽,包括野生型多肽和對于其氨基酸序列或 核苷酸序列是已知的其他多肽(例如藥學藥物)。在一個實施方案中,親本多肽不包括N 聯糖基化序列。在另一個實施方案中,親本多肽(例如,野生型多肽)天然地包括N聯糖基 化序列。與此類親本多肽相對應的序列子多肽包括在不同位置處的另外N聯糖基化序列。 在一個實施方案中,親本多肽是治療多肽,例如人生長激素(hGH)、促紅細胞生成素(EPO)、 治療抗體、骨形態生成蛋白(例如,BMP-7)或血液因子(例如,因子VI、因子VIII或因子 IX)。因此,本發明提供了治療多肽變體,其在其氨基酸序列內包括一個或多個外源N聯糖 基化序列。
在一個實施方案中,N聯糖基化序列是酶(例如寡糖基轉移酶,例如I^glB)的底 物。酶催化糖基部分從糖基供體種類(例如,脂質-焦磷酸鹽連接的糖基部分)到天冬酰 胺(N)殘基的轉移,所述天冬酰胺(N)殘基是N聯糖基化序列的部分。可以與糖基化序 列綴合的示例性糖基部分包括 GlcNAc、GlcNH、bacillosamine、6-hydroybacillosamine、 GalNAc, GalNH、GlcNAc—GlcNAc、GlcNAc—GlcNH、GlcNAc-Gal、GlcNAc—GlcNAc—Gal—Sia、GlcNAc-Gal-Sia,GlcNAc-GlcNAc-Man 和 GlcNAc-GlcNAc-Man (Man) 2。示例性糖基供體種類 在本文中描述。
因此,本發明提供了多肽綴合物,其中經修飾的或未經修飾的糖部分與本發明的N 聯糖基化序列附著。本發明進一步提供了制備此類多肽綴合物的方法。在一個代表性實 施方案中,該方法是無細胞的體外方法,其中在糖基供體種類是其的底物的寡糖基轉移酶 的存在下,使多肽與糖基供體種類(例如脂質-焦磷酸鹽連接的糖基部分,例如十一異戊 烯-焦磷酸鹽連接的糖基部分)相接觸(例如,在反應容器中)。在這個糖基供體種類中的 糖基部分是任選用修飾基團例如水溶性聚合修飾基團衍生的。該酶將經修飾的或未經修飾 的糖基部分轉移到多肽上,從而產生多肽綴合物。當修飾基團包括至少一個聚(乙二醇) 部分時,那么此類糖基化反應被稱為糖基PEG化。
在另一個代表性方法中,上述酶促反應在多肽在其中表達的宿主細胞內發生。寡 糖基轉移酶可以內源存在于宿主細胞中,或可以在宿主細胞中過表達。根據這種方法的細 胞內糖基化提供了超過無細胞的體外糖基化的各種優點。例如,不需要在糖基化前從細胞 培養中純化多肽。此外,可以利用其他內源或共表達的酶,其可以用于進一步修飾最初形成 的糖基化多肽。
本發明的糖修飾(例如糖基PEG化)方法可以對摻入N聯糖基化序列的任何多肽 進行實踐。在一個實施方案中,由于例如通過免疫系統或網狀內皮系統(RES)減少的清除 率或減少的攝取率,本發明的方法提供了具有增加的治療半衰期的多肽綴合物。在另一個 實施方案中,本發明的方法提供了用于掩蔽多肽上的抗原決定簇的方法,從而減少或消除 針對多肽的宿主免疫應答。使用合適的經修飾的糖使靶向試劑與多肽選擇性附著,可以用 于將多肽靶向對于特定靶向試劑特異的特定組織或細胞表面受體。還提供的是顯示出針對 經由蛋白水解的降解增強的抗性的多肽,通過改變多肽上由蛋白水解酶切割或識別的特定 位點達到的結果。在一個實施方案中,此類位點由本發明的N聯糖基化序列替換,或部分由 本發明的N聯糖基化序列替換。
此外,本發明的方法可以用于調節親本多肽的“生物活性譜”。本發明人已認識 到使用本發明的方法使修飾基團例如水溶性聚合物(例如,mPEG)與親本多肽附著,不僅 可以改變所得到的多肽種類的生物利用度、藥效性質、免疫原性、代謝穩定性、生物分布和 水溶性,還可以導致不希望有的治療活性的減少或所需治療活性的增加。例如,前者已對 于造血試劑促紅細胞生成素(EPO)觀察到。例如,特定以化學方法PEG化的EPO變體顯示 減少的促紅細胞生成素活性,而野生型多肽的組織保護活性得到維持。此類結果在例如美 國專利 6,531,121 ;W02004/096148、W02006/014466、W02006/014349、W02005/025606 和 W02002/053580中描述。對于評估所選多肽的差異生物活性有用的示例性細胞系概括于下 表1中
表1 用于多種多肽的牛物學評估的細胞系
多肽細胞系生物活性EPOUT7紅血球生成SY5Y神經保護BMP-7MG-63骨誘導HK-2腎毒性NT-3Neuro2神經保護(TrkC結合)NIH3T3神經保護(p75結合)
在一個實施方案中,本發明的多肽綴合物顯示對于生物學靶蛋白質(例如,受 體)、天然配體或非天然配體例如抑制劑減少或增強的結合親和力。例如,取消對于一類特 異性受體的結合親和力可以減少或消除相關的細胞信號傳導和下游生物學事件(例如,免 疫應答)。因此,本發明的方法可以用于制備多肽綴合物,和綴合物與之相對應的親本多肽 相比較,其具有等同、相似或不同的治療譜。本發明的方法可以用于鑒定具有特定(例如, 改善的)生物學功能的糖基PEG化治療劑,并且用于“微調”任何治療多肽或其他生物學活 性多肽的治療譜。GlycoPEGylation 是Neose Technologies的商標,并且指共同擁有的 專利和專利申請例如,(W02007/053731 ;W02007/022512 ;W02006/127896 ;W02005/055946 ; W02006/121569 ;和 W02005/070138)中公開的技術。
IV.組合物
^li
在一個方面,本發明提供了具有氨基酸序列的多肽,所述氨基酸序列包括本發明 的至少一個外源N聯糖基化序列(序列子多肽)。N聯糖基化序列在本文下文中描述。在 一個實施方案中,多肽的氨基酸序列包括外源N聯糖基化序列,其是一種或多種野生型、突 變型或截短的寡糖基轉移酶的底物。示例性寡糖基轉移酶在本文下文中描述,并且包括本 文描述的那些酶的全長或截短形式(例如,SEQ ID NO 102至114)。
在一個示例性實施方案中,通過重組技術經由改變相對應親本多肽(例如,野生 型多肽)的氨基酸序列來產生本發明的多肽。用于制備重組多肽的方法是本領域技術人員 已知的。示例性方法在本文下文中描述。多肽的氨基酸序列可以包括天然存在的和外源 (即,非天然存在的)N聯糖基化序列的組合。
本發明的多肽或親本多肽可以是任何多肽。在多種實施方案中,多肽是治療多肽。 在一個例子中,多肽是重組多肽。多肽可以是糖肽并且可以具有任何數目的氨基酸。在一 個實施方案中,本發明的多肽具有約5kDa至約500kDa的分子量。在另一個實施方案中,多 肽具有約IOkDa至約400kDa、約IOkDa至約350kDa、約IOkDa至約300kDa、約IOkDa至約 250kDa、約IOkDa至約200kDa或約IOkDa至約150kDa的分子量。在另一個實施方案中,多 肽具有約IOkDa至約IOOkDa的分子量。在另外一個實施方案中,多肽具有約IOkDa至約 50kDa的分子量。在一個進一步的實施方案中,多肽具有約IOkDa至約25kDa的分子量。
示例性多肽包括野生型多肽及其片段,以及由其天然存在的配對物進行修飾(例 如,通過突變或截短)的多肽。多肽還可以是融合蛋白。示例性融合蛋白包括其中多肽與 熒光蛋白質(例如,GFP)、治療多肽、抗體、受體配體、蛋白質性質的毒素、MBP、His-標簽等 融合的融合蛋白。
在一個例子中,本發明的多肽包括本發明的N聯糖基化序列,并且另外包括0聯糖 基化序列。示例性O聯糖基化序列和用于糖基化0聯糖基化序列的示例性酶在2007年7 月23日提交的美國專利申請11/781,885中描述,所述美國專利申請通過引用整體合并入 本文。使用GIcNAC轉移酶的0聯糖基化序列在2008年6月4日提交的美國臨時專利申請 60/941,926和PCT/US2008/065825中描述,所述專利的公開內容也整體合并入本文。
在一個實施方案中,多肽是治療多肽,例如目前用作藥學試劑(即,經認可的藥 物)的那些。多肽的非限制性選擇顯示于2006年6月8日提交的美國專利申請10/552,896 的圖觀中,所述美國專利申請通過引用合并入本文。
示例性多肽包括生長因子,例如肝細胞生長因子(HGF)、神經生長因子(NGF)、表 皮生長因子(EGF)、成纖維細胞生長因子(例如,FGF-I、FGF-2、FGF-3、FGF-4、FGF-5、FGF-6、 FGF-7、FGF-8、FGF-9、FGF-10、FGF-IU FGF-12, FGF-13, FGF-14、FGF-15, FGF-16、FGF-17, FGF-18、FGF-19、FGF-20、FGF-21、FGF-22 和 FGF-23)、角質化細胞生長因子(KGF)、巨核細 胞生長和發育因子(MGDF)、血小板衍生的生長因子(PDGF)、轉化生長因子(例如,TGF-α、 TGF-β、TGF-β 2、TGF-β 3)、血管內皮生長因子(VEGF ;例如,VEGF-2)、VEGF抑制劑例如 VEGF-TRAP(Aflibercept)、骨生長因子(BGF)、神經膠質生長因子、肝素結合的促神經突生 長因子(HBNF)、C1酯酶抑制劑,激素例如人生長激素(hGH)、促卵泡激素(FSH)、促甲狀腺激 素(TSH)和甲狀旁腺激素、促濾泡素(例如,促濾泡素-α、促濾泡素-β)、濾泡抑素、促黃 體激素(LH),以及細胞因子,例如白介素(例如,IL-1、IL-2、IL-3、IL_4、IL_5、IL_6、IL-7、 IL-8、IL-9、IL-10、IL-IU IL-12、IL-13、IL-14、IL-15、IL-16、IL-17、IL-18)、干擾素(例 如,INF-α、INF-β、INF- γ , INF-ω、INF- τ )禾口月夷島素。
其他示例性多肽包括酶,例如葡糖腦苷酯酶、α-半乳糖苷酶(例如, Fabrazyme )、酸性- α -葡糖苷酶(酸性麥芽糖酶)、艾杜糖醛酸酶例如α -L-艾杜糖醛 酸酶(例如,Aldurazyme )、甲狀腺過氧化物酶(TPO)、β-葡糖苷酶(參見例如,美國 專利申請號10/411,044中描述的酶)、芳基硫酸酯酶、天冬酰胺酶、α -葡糖神經酰胺酶 (glucoceramidase)(例如,伊米苷酶)、鞘磷脂酶、丁酰膽堿酯酶、尿激酶和α-半乳糖苷酶 A(參見例如,美國專利號7,125,843中描述的酶)。
其他示例性親本多肽包括骨形態發生蛋白質(例如,BMP-I、ΒΜΡ-2、ΒΜΡ-3、ΒΜΡ-4、 BMP-5、BMP-6、BMP-7、BMP-8、BMP-9、BMP-10, BMP-IU BMP-12, BMP-13, BMP-14、BMP-15)、 神經營養素(例如,NT-3、NT-4、NT-5)、促紅細胞生成素(EPO)、新紅細胞生成刺激蛋白質 (NESP;例如,Aranesp)、生長分化因子(例如,⑶F-5)、神經膠質細胞系衍生的神經營養 因子(⑶NF)、腦源性神經營養因子(BDNF)、肌肉生長抑制素(myostatin)、神經生長因子 (NGF)、粒細胞集落刺激因子(G-CSF ;例如,Neupogeu 、Neulasta )、粒細胞-巨噬 細胞集落刺激因子(GM-CSF)、α 1-抗胰蛋白酶(ATT或α _1蛋白酶抑制劑)、組織型纖溶酶 原激活物(TPA)、水蛭素、瘦素、尿激酶、人DNA酶、胰島素、乙型肝炎表面蛋白質(HbsAg)、人 絨毛膜促性腺素(hCG)、骨橋蛋白、護骨素(osteoprotegrin)、蛋白質C、生長調節素-1、促 生長素、生長激素、嵌合白喉毒素-IL-2、胰高血糖素樣肽(例如,GLP-I和GLP-2)、凝血酶、 血小板生成素、凝血酶敏感蛋白-2、抗凝血酶III (AT-III)、前動力蛋白(prokinetisin)、 CD4、α -CD20、腫瘤壞死因子(例如,TNF- α ) ,TNF- α抑制劑、TNF受體(TNF-R)、Ρ_選擇素 糖蛋白配體-1 (PSGL-I)、補體、轉鐵蛋白、糖基化依賴性細胞粘附分子(GlyCAM)、神經細胞粘附分子(N-CAM)、TNF受體-IgG Fc區融合蛋白、extendin-4、BDNF、β -2-微球蛋白、睫 狀神經營養因子(CNTF)、淋巴毒素-β受體(LT-β受體)、纖維蛋白原、⑶F(例如,⑶F-1、 GDF-2、GDF-3、GDF-4、GDF-5、GDF-6、GDF-7、GDF-8、GDF-9、⑶ F-10、⑶ F-11、⑶ F-12、⑶ F-13、 ⑶F-14、⑶F-15)、GLP-1、胰島素樣生長因子(例如,IGF1)、胰島素樣生長因子結合蛋白(例 如,IGB-5)、IGF/IBP-2、IGF/IBP-3、IGF/IBP-4、IGF/IBP-5、IGF/IBP-6、IGF/IBP-7、IGF/ IBP-8、IGF/IBP-9、IGF/IBP-10、IGF/IBP-11、IGF/IBP-12 和 IGF/IBP-13。關于上文列出的 多肽中的某些的示例性氨基酸序列在美國專利號7,214,660中描述,所述所有專利通過 引用合并入本文。
在一個例子中,多肽是血管性血友病因子(vWF)或vWF的部分。重組vWF已得到描 述(參見例如,Fischer B. Ε.等人,Cell. Mol. Life Sci. 1997,53 :943_950,其通過引用合 并入本文。在另一個例子中,多肽是切割vWF的蛋白酶(vWF-蛋白酶、vWF-降解蛋白酶)。
在一個例子中,本發明的多肽是血液凝固因子(血液因子)。示例性血液因子包括 因子V、因子VII、因子VIII (例如,因子VIII-2、因子VIII-3)、因子IX、因子X和因子XIII。 在另一個例子中,多肽是血液因子抑制劑(例如,因子)(a抑制劑)。
在一個具體例子中,多肽是因子VIII。因子VIII和因子VIII變體是本領域已知 的。例如,美國專利號5,668,108描述了因子VIII變體,其中在位置1241處的天冬氨酸由 谷氨酸替換。美國專利號5,149,637描述了包括糖基化或未糖基化的C末端部分的因子 VIII變體,并且美國專利號5,661,008描述了包括通過至少3個氨基酸殘基與氨基酸1649 至2332連接的氨基酸1-740的因子VIII變體。因此,因子VIII的變體、衍生物、修飾和復 合物是本領域眾所周知的,并且包括在本發明的范圍內。用于產生因子VIII的表達系統也 是本領域眾所周知的,并且包括原核和真核細胞,如美國專利號5,633,150,5, 804,420和 5,422,250中例示的。上文討論的因子VIII序列中的任何都可以進行修飾,以包括外源0 聯、S聯或N聯糖基化序列。
在一個例子中,因子VIII是全長或野生型因子VIII多肽。關于全長因子VIII多 肽的示例性氨基酸序列顯示于圖IA和IB(SEQ ID N0:8,SEQ ID NO 9)中。在另外一個例 子中,多肽是因子VIII多肽,其中B結構域包括比野生型或全長因子VIII的B結構域更 少的氨基酸殘基。這些因子VIII多肽被稱為B結構域缺失的或部分B結構域缺失的因子 VIII。本領域技術人員將能夠鑒定在給定因子VIII多肽內的B結構域。在一個例子中,B 結構域包括在2個側翼序列IEPR(在N末端側上)和EITR(在C末端側上)之間的氨基酸 殘基。然而,本領域技術人員應當理解這2個側翼序列可以不存在,或可以例如通過突變進 行修飾。在因子VIII多肽內的B結構域的一般定位在下圖中舉例說明
在示例性因子VIII多肽內的B結構域
......IEPR-B 結構域-EITR...。
在一個例子中,B結構域在全長因子VIII序列(例如,圖IB中所示的序列)的氨 基酸殘基Arg74°和Glu1649之間發現
... IEPR740-B 結構域-E1649ITR. · ·。
在一個實施方案中,本發明的因子VIII多肽不包括通常與B結構域結合的任何氨 基酸殘基(完全B結構域缺失)。根據這個實施方案的示例性氨基酸序列顯示于圖2中, 其中全長因子VIII序列(圖1B)的Arg74tl和Glu1649之間的所有氨基酸殘基被去除。在另35一個實施方案中,原始B結構域替換為另一個序列(B結構域替換序列)。在一個例子中, 因子VIII多肽的B結構域替換序列包括至少2個氨基酸。例如,至少2、至少3、至少4、至 少5、至少6、至少7、至少8、至少9或至少10個氨基酸殘基在圖2中的Arg74°和Glu1649之 間發現。替換序列可以包括任何數目的氨基酸殘基,并且可以具有任何氨基酸序列。
在一個例子中,替換B結構域的序列包括部分B結構域序列。例如,替換B結構域 的序列包括B結構域的約2、約4、約6、約8、約10、約12、約14或超過14個N末端氨基酸 (例如,在圖2中的Arg740和Glu1649之間)。例如,替換序列可以包括選自SFSQN、SFSQNS, SFSQNSR和SFSQNSRH的部分N末端B結構域序列。在另一個例子中,替換B結構域的序列 包括原始B結構域的約2、約4、約6、約8、約10、約12、約14或超過14個C末端氨基酸(例 如,在圖2中的Arg74tl和Glu1649之間)。例如,替換序列可以包括選自QR、HQR、RHQR、KRHQR、 LKRHQR、VLKRHQR和PPVLKRHQR的部分C末端B結構域序列。在另外一個例子中,替換B結 構域的氨基酸序列包括超過一個部分序列的組合。例如,替換序列包括與原始B結構域的 部分C末端序列連接的部分N末端序列,其中N末端和C末端B結構域任選經由另外的氨 基酸殘基例如一個或多個精氨酸殘基連接。關于B結構域缺失的因子VIII多肽的示例性 氨基酸序列包括圖3-5 (SEQ ID NO :4-6)中所示的那些序列。
在一個實施方案中,B結構域替換序列包括天然或非天然存在的(例如,外源)N 聯或0聯糖基化序列。在一個例子中,原始B結構域以這樣的方式進行截短,以便使得原始 B結構域中天然存在的0聯或N聯糖基化序列中的至少一個保持完整。在另一個例子中, 如上所述的部分B結構域序列的組合導致糖基化序列的形成。例子可以在圖5中觀察到 P749SQNP0
在另外一個例子中,B結構域替換序列包括天然存在的B結構域中不存在的氨基 酸序列,其中這個非天然存在的序列包括外源0聯或N聯糖基化序列(例如,本發明的0聯 糖基化序列)。在一個例子中,B結構域替換序列包括本發明的外源0聯糖基化序列,例如 PTP、PTE I、PTE IP、PTQA、PTQAP、PTINT、PTINTP、PTTVS、PTTVL、PTQGAM、PTQGAMP、TETP、PTVL、 PTVLP、PTLSP、PTDAP、PTENP、PTQDP、PTASP、PTTVSP、PTQGA、PTSAV、PTTLYV、PTTLYVP、PSSGP 或PSDGP。在另一個例子中,B結構域替換序列包括本發明的外源N聯糖基化序列,例如NLT。
在一個實施方案中,本發明提供了這樣的因子VIII多肽,其包括根據圖1A、圖1B、 圖2、圖3、圖4或圖5的氨基酸序列,并且進一步包括在N末端處或在選自1至740的氨基 酸位置處(重鏈)引入所述氨基酸序列內的外源N聯糖基化序列。在另一個示例性實施方 案中,本發明提供了這樣的因子VIII多肽,其包括根據圖4的氨基酸序列,并且進一步包括 在選自782至1,465的氨基酸位置處(輕鏈)引入所述氨基酸序列內的外源N聯糖基化序 列。在另一個示例性實施方案中,本發明提供了這樣的因子VIII多肽,其包括根據圖1A、 圖1B、圖2、圖3、圖4或圖5的氨基酸序列,并且進一步包括在所述因子VIII多肽的輕鏈內 的氨基酸位置處弓I入所述氨基酸序列內的外源N聯糖基化序列。在另一個示例性實施方案 中,本發明提供了這樣的因子VIII多肽,其包括根據圖4的氨基酸序列,并且進一步包括在 選自741至781的氨基酸位置處(B結構域片段)引入所述氨基酸序列內的外源N聯糖基 化序列。在另一個示例性實施方案中,本發明提供了這樣的因子VIII多肽,其包括根據圖 1A、圖1B、圖2、圖3、圖4或圖5的氨基酸序列,并且進一步包括在所述因子VIII多肽的B 結構域或B結構域片段內引入所述氨基酸序列內的外源N聯糖基化序列。在一個例子中,本發明的因子VIII多肽在CHO細胞中產生。在另一個例子中,因子VIII多肽使用本領域 已知的trxB gor突變型大腸桿菌表達系統(Origami)產生。
在另一個例子中,多肽是2個或更多個多肽之間的融合蛋白。在另一個例子中,多 肽是2個或更多個多肽之間的復合物。在一個示例性實施方案中,復合物包括血液因子。在 另一個示例性實施方案中,復合物包括因子VIII。這種復合物中的因子VIII多肽可以是 全長、B結構域缺失、或部分B結構域缺失的因子VIII。在一個例子中,復合物在因子VIII 和血管性血友病因子(vWF)之間形成。
還在本發明的范圍內是其為抗體的多肽。術語抗體意欲包括免疫球蛋白、抗體片 段(例如,Fc結構域)、單鏈抗體、Lama抗體、納米抗體等。在該術語中還包括的是抗體融 合蛋白,例如Ig嵌合體。優選的抗體包括人源化、單克隆抗體或其片段。此類抗體的所有 已知同種型在本發明的范圍內。示例性抗體包括針對生長因子的那些,所述生長因子例如 內皮生長因子(EGF)、血管內皮生長因子(例如針對VEGF-A的單克隆抗體,例如雷尼珠單 抗(ranibizumab) (Lucentis ))和成纖維細胞生長因子,例如FGF_7、FGF_21和FGF-23)和 針對其分別受體的抗體。其他示例性抗體包括抗TNF抗體,例如抗TNF-α單克隆抗體(參 見例如,美國專利申請號10/411,043)、TNF受體-IgG Fc區融合蛋白(例如,Enbre 1 )、 抗HER2單克隆抗體(例如,Herceptin )、針對呼吸道合胞病毒的蛋白質F的單克隆抗體 (例如,Synagis )、針對TNF-α的單克隆抗體(例如,Remicade ),針對糖蛋白例如IIb/ IIIa 的單克隆抗體(例如,Reopro ),針對 CD20 (例如,Rituxan )、⑶4、α -CD3、CD40L 和 CD154(例如,魯利單抗)的單克隆抗體,針對PSGL-I和CEA的單克隆抗體。上文列出的多 肽中任何的任何經修飾的(例如突變的)形式也在本發明的范圍內。
在一個示例性實施方案中,親本多肽是包括(SEQ ID NO 7)的氨基酸序列的ΕΡ0, 其在下文顯示
Ala Pro Pro Arg Leu lie Cys Asp Ser Arg Val Leu Glu Arg Tyr LeuLeu Glu Ala Lys Glu Ala Glu Asn24Ile Thr Thr Gly Cys Ala Glu HisCys Ser Leu Asn Glu Asn38 lie Thr Val Pro Asp Thr Lys Val Asn PheTyr Ala Trp Lys Arg Met Glu Val Gly Gln Gln Ala Val Glu Val TrpGln Gly Leu Ala Leu Leu Ser Glu Ala Val Leu Arg Gly Gln Ala LeuLeu Val Asn83 Ser Ser Gln Pro Trp Glu Pro Leu Gln Leu His Val AspLys Ala Val Ser Gly Leu Arg Ser Leu Thr Thr Leu Leu Arg Ala LeuGly Ala Gln Lys Glu Ala lie Ser Pro Pro Asp Ala Ala Ser126 Ala Ala ProLeu Arg Thr lie Thr Ala Asp Thr Phe Arg Lys Leu Phe Arg Val Tyr SerAsn Phe Leu Arg Gly Lys Leu Lys Leu Tyr Thr Gly Glu Ala Cys ArgThr Gly Asp。
在一個示例性實施方案中,親本多肽包括具有由不帶電的氨基酸(例如甘氨酸或 丙氨酸)替換堿性氨基酸殘基(例如精氨酸或賴氨酸)的至少一個突變的氨基酸序列。在 另一個實施方案中,EPO多肽包括具有選自Arg139至Ala139、Arg143至Ala143和Lys154至Ala154 的至少一個突變的氨基酸序列。
N聯糖基化序列
本發明的N聯糖基化序列可以是任何的短氨基酸序列。在一個實施方案中,N聯 糖基化序列包括約3至約20、優選約3至約10、更優選約3至約9且最優選約3至約7個 氨基酸殘基。本發明的N聯糖基化序列包括具有氨基的至少一個氨基酸殘基。在一個實施方案中,本發明的N聯糖基化序列包括至少一個天冬酰胺(N)殘基。在另一個實施方案中, 當對序列子多肽實施酶促糖基化或糖綴合反應時,天冬酰胺殘基的氨基是糖基化的。在這 個反應過程中,氨基的氫原子由糖基部分替換。接受糖基部分的氨基酸殘基被稱為“糖基化 的位點”或“糖基化位點”。
在一個實施方案中,本發明的N聯糖基化序列天然存在于野生型多肽中。此類野 生型多肽的多肽綴合物在本發明的范圍內。在另一個實施方案中,N聯糖基化序列不存在 于相對應的親本多肽(外源N聯糖基化序列)中,或不存在于其的相同位置處。外源N聯 糖基化序列引入親本多肽內產生本發明的序列子多肽。N聯糖基化序列可以通過突變引入 親本多肽內。在另一個例子中,N聯糖基化序列通過序列子多肽的化學合成引入親本多肽 的氨基酸序列內。
在一個實施方案中,本發明的N聯糖基化序列包括根據式⑴(SEQID NO 1)的氨 基酸序列。在另一個實施方案中,N聯糖基化序列包括根據式(II) (SEQ ID NO 2)的氨基 酸序列。在另外一個實施方案中,N聯糖基化序列由根據式(I)的氨基酸序列組成。在一 個進一步的實施方案中,N聯糖基化序列由根據式(II)的氨基酸序列組成
X1NX2X3X4(I) (SEQ ID NO 1)
X1DX2' N X2X3X4(II) (SEQ ID NO :2)。
在式⑴和式(II)中,N是天冬酰胺,并且D是天冬氨酸。在一個實施方案中,X3 是蘇氨酸(T)。在另一個實施方案中,X3是絲氨酸(S)。X1存在或不存在。當存在時,X1可 以是任何氨基酸。在一個實施方案中,X1是選自甘氨酸(G)、丙氨酸(A)、纈氨酸(V)、亮氨酸 (L)、異亮氨酸(I)、苯丙氨酸(F)、甲硫氨酸(M)、天冬酰胺(N)、谷氨酸(E)、谷氨酰胺(Q)、 組氨酸(H)、賴氨酸(K)、精氨酸(R)、絲氨酸(S)、蘇氨酸(T)、酪氨酸(Y)、色氨酸(W)、半胱 氨酸(C)和脯氨酸(P)的成員。X4存在或不存在。當存在時,X4可以是任何氨基酸。在一個 實施方案中,X4是選自甘氨酸(G)、丙氨酸(A)、纈氨酸(V)、亮氨酸(L)、異亮氨酸(I)、苯丙 氨酸(F)、甲硫氨酸(M)、天冬酰胺(N)、谷氨酸(E)、谷氨酰胺(Q)、組氨酸(H)、賴氨酸(K)、 精氨酸(R)、絲氨酸(S)、蘇氨酸(T)、酪氨酸(Y)、色氨酸(W)、半胱氨酸(C)、脯氨酸(P)的 成員。
在式(I)和式(II)中,X2可以是任何氨基酸。在一個優選實施方案中,X2不是脯 氨酸(P)。X2’可以是任何氨基酸。在一個實施方案中,X2’不是脯氨酸。在一個實施方案 中,X2和X2,是獨立地選自甘氨酸(G)、丙氨酸(A)、纈氨酸(V)、亮氨酸(L)、異亮氨酸(I)、 苯丙氨酸(F)、甲硫氨酸(M)、天冬酰胺(N)、谷氨酸(E)、谷氨酰胺⑴)、組氨酸(H)、賴氨酸 (K)、精氨酸(R)、絲氨酸(S)、蘇氨酸(T)、酪氨酸(Y)、色氨酸(W)和半胱氨酸(C)的成員。 N聯糖基化序列可以包括另外的C或N末端氨基酸殘基。在一個實施方案中,另外的氨基酸 用于調節在糖基化位點附近的多肽的三級結構。
在一個實施方案中,式(I)中的X2是不帶電的氨基酸。在一個示例性實施方案中, N 聯糖基化序列是選自 X1NGSX4 J1NGTX4 J1NASX4 J1NATX4 JiNVSX4J1NVTX^ XWLSX4、X^LTX4、 X1NISX4, X1NITX4, X1NFSX4, X1NFTX4, X1NSSX4, X1NSTX4, X1NTSX4, X1NTTX4, X1NCSX4, X1NCTX4, X1NYSX4和X1NYTX4的成員,其中X1和X4如上定義。在根據這個實施方案的一個例子中,X1 不存在。在另一個例子中,X4不存在。在另外一個實施方案中,X1和X4都不存在。
因此,在另一個例子中,N聯糖基化序列是選自NGS、NGT、NAS、NAT、NVS、NVT、NLS、NLT、NIS、NIT、NFS、NFT、NSS、NST、NTS、NTT、NCS, NCT、NYS 和 NYT 的成員。
在一個實施方案中,N聯糖基化序列是根據式(II)的延長的糖基化序列。在另一 個實施方案中,當寡糖基轉移酶是細菌起源的酶(例如,PglB)時,使用延長的糖基化序列。 在另一個實施方案中,式(II)中的X2是不帶電的氨基酸。在根據這個實施方案的一個例 子中,N 聯糖基化序列是選自 Xl X2' NGSX4, X1DX2' NGTX4, X1DX2' NASX4, X1DX2' NATX4, X1DX2 ‘ NVSX4、X1DX2 ‘ NVTX4、X1DX2 ‘ NLSX4、X1DX2 ‘ NLTX4、X1DX2 ‘ NISX4, X1DX2 ‘ NITX4, X1DX2‘ NFSX4和XlX2' NFTX4的成員,其中X1J2'禾Π X4如上定義。
在另一個例子中,N聯糖基化序列是選自D X2' NGS, DX2 ‘ NGT, DX2 ‘ NAS, DX2' NAT, DX2' NVS, DX2' NVT, DX2' NLS,DX2' NLT,DX2' NIS, DX2' NIT, DX2' NFS 和 DX2' NFT的成員,其中X2'如上定義。在另一個例子中,上述實施方案的任何中的X2'選 自不帶電的氨基酸。在一個例子中,X2'是G。在另一個例子中,X2'是A。在另外一個例 子中,X2'是V。在一個進一步的例子中,X2'是L。在一個進一步的例子中,X2'是I。在 一個進一步的實施方案中,X2'是F。
N聯糖基化序列的定位
在一個實施方案中,當多肽的部分(例如,本發明的序列子多肽)時,N聯糖基化 序列是寡糖基轉移酶(例如,Stt3p或I^glB)的底物。在另一個例子中,糖基化序列是經修 飾的酶例如具有缺失或截短的膜錨著結構域的酶的底物。本發明的每個N聯糖基化序列在 合適的糖基化反應過程中糖基化的效率可以依賴于酶的類型和性質,并且還可以依賴于糖 基化序列的前后關系,特別是糖基化位點周圍的多肽的三維結構。
一般地,N聯糖基化序列可以在多肽的氨基酸序列內的任何位置處引入。在一個 優選實施方案中,N聯糖基化序列(在所使用的反應條件下)對于寡糖基轉移酶是易接近 的。在一個例子中,糖基化序列在親本多肽的N末端處引入(即,在第一個氨基酸前或緊在 第一個氨基酸后)(氨基末端突變體)。在另一個例子中,N聯糖基化序列接近親本多肽的 氨基末端引入(例如,在N末端的10個氨基酸殘基內)。在另一個例子中,N聯糖基化序列 緊在親本多肽的最后一個氨基酸后定位于親本多肽的C末端處(羧基末端突變體)。在另 外一個例子中,N聯糖基化序列接近親本多肽的C末端引入(例如,在C末端的10個氨基 酸殘基內)。在另外一個例子中,N聯糖基化序列定位于親本多肽的N末端和C末端之間的 任何地方(內部突變體)。一般優選經修飾的多肽是生物活性的,即使該生物活性由相對應 的親本多肽的生物活性改變。
影響序列子多肽的糖基化效率的重要因素是糖基化位點(例如,天冬酰胺側鏈) 對于糖基/糖基(saccharyl)轉移酶和其他反應配偶體包括溶劑分子的易接近性。如果糖 基化序列定位在多肽的內部結構域內,那么糖基化將可能是無效的。因此,在一個實施方案 中,糖基化序列在與多肽的溶劑暴露表面相對應的多肽區域處引入。示例性多肽構象是其 中糖基化序列的靶氨基不在內部定向的構象,與多肽的其他區域形成氫鍵。另一個示例性 構象是其中氨基不太可能與附近蛋白質形成氫鍵的構象。
在一個例子中,N聯糖基化序列在親本蛋白質的預先選擇的特定區域內產生。在 自然界中,多肽主鏈的糖基化通常在多肽的環區域內出現,并且一般不在螺旋或β -片層 結構內出現。因此,在一個實施方案中,通過將N聯糖基化序列引入與環結構域相對應的親 本多肽區域內來產生本發明的序列子多肽。
例如,蛋白質BMP-7的晶體結構包含在Ala72和Ala86以及Ilei36和Proltl3之間的2 個延長的環區域。產生其中N聯糖基化序列置于多肽序列的這些區域內的BMP-7突變體, 可以導致其中突變引起多肽的原始三級結構的很少破壞或無破壞的多肽。
然而,在β-片層或α-螺旋構象內包括的氨基酸位置處引入N聯糖基化序列也 可以導致序列子多肽,其在新近引入的N聯糖基化序列處被有效糖基化。N聯糖基化序列引 入β-片層或α-螺旋結構域內可以引起多肽的結構改變,這進而使有效糖基化成為可能。
蛋白質的晶體結構可以用于鑒定野生型或親本多肽的結構域,所述結構域最適合 于引入N聯糖基化序列,并且可以允許預先選擇有希望的修飾位點。
當晶體結構無法獲得時,多肽的氨基酸序列可以用于預先選擇有希望的修飾位點 (例如,環結構域與α-螺旋結構域的預測)。然而,即使多肽的三級結構是已知的,但結構 動力學和酶/受體相互作用在溶液中也是可變的。因此,合適的突變位點的鑒定以及合適 的糖基化序列的選擇,可能涉及幾種序列子多肽(例如,本發明的序列子多肽的文庫)的產 生,并且使用合適的篩選方案例如本文描述的那些就所需特征測試這些變體。
在一個實施方案中,其中親本多肽是抗體或抗體片段,抗體或抗體片段的恒定區 (例如,CH2結構域)用本發明的N聯糖基化序列進行修飾。在一個例子中,N聯糖基化序 列以這樣的方式引入,使得天然存在的糖基化序列被替換或在功能上受損。關于抗體的恒 定區的氨基酸和核酸序列是本領域技術人員已知的。
在一個實施方案中,經過CH2結構域的所選區域執行序列子掃描,產生各自包括本 發明的外源N聯糖基化序列的抗體的文庫。在另外一個實施方案中,對所得到的多肽變體 實施旨在給糖基化序列添加糖基部分的酶促糖基化反應。充分糖基化的那些變體可以就 其結合合適受體(例如,F。受體,例如F。γ RIIIa)的能力進行分析。在一個實施方案中, 當與親本抗體或其天然糖基化形式相比較時,此類糖基化抗體或抗體片段顯示出對于F。受 體增加的結合親和力。本發明的這個方面在2007年1月18日提交的美國臨時專利申請 60/881,130中進一步描述,所述美國臨時專利申請的公開內容整體合并入本文。所述修飾 可以改變抗體的效應子功能。在一個實施方案中,糖基化的抗體變體顯示出減少的效應子 功能,例如對于天然殺傷細胞表面上或殺傷T細胞表面上發現的受體減少的結合親和力。 在另一個例子中,當與未經修飾的抗體相比較時,抗體的糖綴合用于修飾經修飾的抗體的 藥代動力學和/或藥效性質。例如,糖綴合的抗體具有比未經修飾的抗體更長的體內半衰 期。
包括N聯糖基化序列的肽連接體片段
在另一個實施方案中,不是將N聯糖基化序列引入親本多肽序列內,而是通過將 肽連接體片段加入親本多肽的N或C末端來延長親本多肽的序列,其中肽連接體片段包括 本發明的N聯糖基化序列,例如“NLT”或“DFNVS”。肽連接體片段可以具有任何數目的氨 基酸。在一個實施方案中,肽連接體片段包括至少約5、至少約10、至少約15、至少約20、至 少約30、至少約50或超過50個氨基酸殘基。肽連接體片段任選包括內部或末端氨基酸殘 基,其具有反應性官能團,例如氨基(例如,賴氨酸)或巰基(例如,半胱氨酸)。此類反應 性官能團可以用于使多肽與另一個部分連接,所述另一個部分例如另一個多肽、細胞毒素、 小分子藥物或本發明的另一個修飾基團。本發明的這個方面在2007年1月18日提交的美 國臨時專利申請60/881,130中進一步描述,所述美國臨時專利申請的公開內容整體合并入本文。
在一個實施方案中,由本發明的肽連接體片段修飾的親本多肽是抗體或抗體片 段。在根據這個實施方案的一個例子中,親本多肽是scFv。本文描述的方法可以用于制 備本發明的scFv,其中scFv或連接體用糖基部分或通過糖基連接基團與肽附著的修飾基 團進行修飾。糖基化和糖綴合的示例性方法在例如PCT/US02/32263和美國專利申請號 10/411,012中闡述,所述專利各自通過引用整體合并入本文。
在一個實施方案中,特定氨基酸殘基包括在N聯糖基化序列內,以調節突變多肽 在特定生物體例如大腸桿菌的表達性、蛋白水解穩定性、多肽的結構特征和/或其他性質。
示例性多肽
本發明的N聯糖基化序列可以引入任何親本多肽內,產生本發明的序列子多肽。 本發明的序列子多肽可以使用本領域已知和本文下文描述的方法來產生(例如,通過重組 技術或化學合成)。在一個實施方案中,親本序列以這樣的方式進行修飾,使得N聯糖基化 序列插入親本序列內,給親本多肽的氨基酸序列添加氨基酸的整個長度和各自的數目。在 另一個實施方案中,N聯糖基化序列替換親本多肽的一個或多個氨基酸。在另一個實施方案 中,使用一個或多個預先存在的氨基酸將N聯糖基化序列引入親本多肽,以成為糖基化序 列的部分。例如,維持親本肽中的天冬酰胺殘基,并且使緊在脯氨酸后的那些氨基酸突變, 以產生本發明的N聯糖基化序列。在另外一個實施方案中,采用氨基酸插入和已有氨基酸 替換的組合,產生N聯糖基化序列。
在特定實施方案中,本發明的特定親本多肽與本發明的特定N聯糖基化序列結合 使用。示例性親本多肽/N聯糖基化序列組合概括于圖6中。圖6中的每行代表本發明的 一個示例性實施方案。所示組合可以在本發明的所有方面使用,包括單個序列子多肽、多肽 的文庫、多肽綴合物和本發明的方法。本領域技術人員應當理解對于所示親本多肽在圖6 中所述的實施方案可以同樣地應用于本文闡述的其他親本多肽。本領域技術人員還應當理 解所列出的多肽可以以舉例說明性方式與本文闡述的任何糖基化序列一起使用。
多肽的文庫
用于鑒定多肽(當實施糖基化或糖綴合(例如,糖基PEG化)時,其是有效(例如, 具有滿意的得率)糖基化或糖綴合的(例如,糖基PEGKW))的一個策略是在親本多肽的 氨基酸序列內的各種不同位置處插入本發明的N聯糖基化序列,例如包括β -片層結構域 和α -螺旋結構域,并且隨后就其充當寡糖基轉移酶的有效底物的能力測試許多所得到的 序列子多肽。
因此,在另一個方面,本發明提供了包括多個不同成員的序列子多肽的文庫,其中 文庫的每個成員與共同的親本多肽相對應,并且包括至少一個獨立選擇的本發明的外源N 聯糖基化序列。在一個實施方案中,文庫的每個成員包括相同的N聯糖基化序列,各自在親 本多肽內的不同氨基酸位置處。在另一個實施方案中,文庫的每個成員包括不同的N聯糖 基化序列,然而,在親本多肽的相同氨基酸位置處。與本發明的文庫結合有用的N聯糖基化 序列在本文中描述。在一個實施方案中,在本發明的文庫中有用的N聯糖基化序列具有根 據式(I) (SEQ ID NO 1)的氨基酸序列。在另一個實施方案中,在本發明的文庫中有用的N 聯糖基化序列具有根據式(II) (SEQ ID NO 2)的氨基酸序列。式(I)和式(II)在本文上 文中描述。
在一個優選實施方案中,與本發明的文庫結合有用的N聯糖基化序列具有 選自下述的氨基酸序列 iNGSX4、X1NGTX4, X1NASX4, X1NATX4, X1NVSX4, X1NVTX4, X1NLSX4, X1NLTX4、X1NISX4, X1NITX4, X1NFSX4 和 X1NFTX^ X1D X2 ‘ NGSX4、X1DX2 ‘ NGTX4、X1DX2 ‘ NASX4、 X1DX2 ‘ NATX4, X1DX2' NVSX4, X1DX2' NVTX4, X1DX2' NLSX4, X1DX2' NLTX4, X1DX2' NISX4s, X1DX2 ‘ NITX^XiDX2' NFSX4SnX1DX2' NFTX4,其中 X1、X2 ‘和 X4 如上定義。
在一個實施方案中,其中文庫的每個成員具有共同的N聯糖基化序列,親本多肽 具有包括“III”個氨基酸的氨基酸序列。在一個例子中,序列子多肽的文庫包括(a)在親本 多肽內的第一個氨基酸位置(AA)n處具有N聯糖基化序列的第一個序列子多肽,其中η是 選自1至m的成員;和(b)至少一個另外的序列子多肽,其中在每個另外的序列子多肽中, N聯糖基化序列在另外的氨基酸位置處引入,每個另外的氨基酸位置處選自(AA)n+x和(AA) n-x’其中χ是選自1至(m-n)的成員。例如,第一個序列子多肽通過在第一個氨基酸位置處 引入所選N聯糖基化序列而產生。后續序列子多肽隨后可以通過在氨基酸位置處引入相同 的N聯糖基化序列而產生,所述N聯糖基化序列進一步朝向親本多肽的N或C末端定位。
在這個背景中,當n-x是O(AAtl)時,那么糖基化序列緊在親本多肽的N末端氨基 酸前引入。示例性序列子多肽可以具有部分序列ZNLTM1...,,
第一個氨基酸位置(AA)n可以是親本多肽的氨基酸序列內的任何地方。在一個實 施方案中,選擇第一個氨基酸位置處(例如,在環結構域的開始處)。
每個另外的氨基酸位置可以是親本多肽內的任何地方。在一個例子中,序列子多 肽的文庫包括在選自(AA)n+p和(AA) n_p的氨基酸位置處具有N聯糖基化序列的第二個序列 子多肽,其中P選自1至約10、優選1至約8、更優選1至約6、更加優選1至約4且最優選 1至約2。在一個實施方案中,序列子多肽的文庫包括在氨基酸位置(AA)n處具有N聯糖基 化序列的第一個序列子多肽,和在氨基酸位置(AA) _或(AA)lri處具有N聯糖基化序列的第 二個序列子多肽。
在另一個例子中,另外的氨基酸位置各自與先前選擇的氨基酸位置緊鄰。在另外 一個例子中,每個另外的氨基酸位置確切地遠離先前選擇的氨基酸位置1、2、3、4、5、6、7、8、 9或10個氨基酸。
在親本多肽的“給定氨基酸位置處”引入N聯糖基化序列意指突變緊接著給定氨 基酸位置(朝向C末端)的開始引入。引入可以通過完全插入(不替換任何已有氨基酸) 或通過替換任何數目的已有氨基酸而發生。
在一個示例性實施方案中,如下產生序列子多肽的文庫通過在親本多肽的連續 氨基酸位置處引入N聯糖基化序列,各自定位緊鄰先前選擇的氨基酸位置,從而在氨基酸 鏈中“掃描”序列子多肽,直至達到所需的最終氨基酸位置。緊鄰意指進一步朝向親本多肽 的N或C末端確切地一個氨基酸位置。例如,第一個突變體通過在氨基酸位置AAn處引入 糖基化序列而產生。文庫的第二個成員通過在氨基酸位置AAn+1處引入糖基化位點而產生, 第三個突變體在AAn+2處,等等。這個操作已命名為“序列子掃描”。本領域技術人員應當理 解序列子掃描可以涉及如此設計文庫,使得第一個成員具有在氨基酸位置(AA)n處的糖基 化序列,第二個成員在氨基酸位置(AA)M處,第三個在(AA)n+4處等。同樣地,文庫的成員可 以通過糖基化序列的其他策略放置進行表征。例如
A)成員 1 (AA)n ;成員 2 (AA) n+3 ;成員 3 (AA) n+6 ;成員 4 (AA) n+9 等。
B)成員 1 (AA)n ;成員 2 (AA) n+4 ;成員 3 (AA) n+8 ;成員 4 (AA) n+12 等。
C)成員 1 (AA)n ;成員 2 (AA) n+5 ;成員 3 (AA) n+10 ;成員 4 (AA) n+15 等。
在一個實施方案中,通過在親本多肽的特定區域(例如從特定環區域的開始到那 個環區域的結束)中掃描本發明的所選N聯糖基化序列,制備序列子多肽的第一個文庫。隨 后通過在多肽的另一個區域中掃描相同糖基化序列,制備第二個文庫,“跳過”定位在第一 個區域和第二個區域之間的那些氨基酸位置。省去的多肽鏈的部分可以例如對應于對于生 物活性重要的結合結構域或已知不適合于糖基化的多肽序列的另一個區域。通過對于另外 的多肽段執行“序列子掃描”,可以制備任何數目的另外文庫。在一個示例性實施方案中,通 過在整個多肽中掃描N聯糖基化序列,在親本多肽內的每個氨基酸位置引入突變而制備文 庫。
在一個實施方案中,文庫的成員可以是多肽的混合物的部分。例如,用多種表達載 體感染細胞培養,其中每個載體包括關于本發明的不同序列子多肽的核酸序列。在表達后, 培養肉湯可以包含多個不同的序列子多肽,并且因此包括序列子多肽的文庫。這種技術可 以用于測定文庫的哪個序列子多肽在給定表達系統中最有效地表達。
在另一個實施方案中,文庫的成員彼此分離存在。例如,可以分離上述混合物的至 少2個序列子多肽。經分離的多肽一起代表文庫。備選地,分開表達文庫的每個序列子多 肽,并且任選分離序列子多肽。在另一個例子中,文庫的每個成員通過化學方法進行合成并 且任選進行純化。
示例性多肽和多肽文庫
示例性親本多肽是重組人BMP-7。BMP-7作為示例性親本多肽的選擇用于舉例說 明性目的,并且不意欲限制本發明的范圍。本領域技術人員應當理解任何親本多肽(例如, 本文闡述的那些)同樣地適合于下述示例性修飾。因此獲得的任何多肽變體都包括在本發 明的范圍內。本發明的生物活性的BMP-7變體包括部分或完整的任何BMP-7多肽,其包括 不導致其生物活性基本上或完全喪失的至少一個修飾,如通過本領域技術人員已知的任何 合適的功能測定法測量的。下述序列(140個氨基酸)代表全長BMP-7序列(序列S. 1)的 生物活性部分
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC EGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO 10)
基于上述親本多肽序列的示例性BMP-7變體多肽在下表3_11中列出。
在一個示例性實施方案中,將突變引入野生型BMP-7氨基酸序列S. 1 (SEQ ID NO 10)內,替換親本序列中相對應數目的氨基酸,導致包含與親本多肽相同數目的氨基酸殘基 的序列子多肽。例如,用N聯糖基化序列“精氨酸-亮氨酸-蘇氨酸”(NLT)直接置換通常 在BMP-7中的3個氨基酸,并且隨后朝向多肽的C末端順次移動NLT序列,提供各自包括 NLT的137個BMP-7變體。根據這個實施方案的示例性序列在下表3中列出。
表3 包括140個氨基酸的BMP-7變體的示例性文庫,其中3個已有氨基酸由N聯 糖基化序列“NLT”替換
在位置1處的引入,替換3個已有氨基酸
M'NLTSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC43EGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO 11)
^W 2處的引入,替換3個^有氨某酸
M'SNLTKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC EGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO 12)
^W 3處的引入,替換3個^有氨某酸
M'STNLTQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC EGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO 13)
通過以上述方式在整個序列中“掃描”糖基化序列,可以產生另外的BMP-7變體。 因此獲得的所有變體BMP-7序列在本發明的范圍內。如此產生的最終序列子多肽具有下述 序列
^W 137處的引入,替換3個^有氨某酸
M'STGSKQRSQNRSKTPKNQEALRMANVAENS S SDQRQACKKHELYVSFRDLGffQDffIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACNLT(SEQ ID NO 14)
在另一個示例性實施方案中,通過給親本序列添加一個或多個氨基酸,將N聯糖 基化序列引入野生型BMP-7氨基酸序列S. 1 (SEQ ID NO=IO)內。例如,將N聯糖基化序列 NLT加入親本BMP-7序列中,替換親本序列中的2、1或0個氨基酸。在這個例子中,所加入的 氨基酸殘基的最大數目與所插入的糖基化序列的長度相對應。在一個示例性實施方案中, 親本序列延長確切地一個氨基酸。例如,將N聯糖基化序列NLT加入親本BMP-7肽中,替換 通常存在于BMP-7中的2個氨基酸。根據這個實施方案的示例性序列在下表4中列出。
表4 包括141個氨基酸的突變型BMP-7多肽的示例性文庫,其中2個已有氨基酸 由N聯糖基化序列“NLT”替換
在位置1處的引入,替換2個氨基酸(ST)
M'NLTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDW IIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDD S SNVILKKYRNMVVRACGCH(SEQ ID NO :15)
在位置2處的引入,替換2個氨基酸(TG)
M'SNLTSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO 16)
在位置3處的引入,替換2個氨基酸(GS)
M'STNLTKQRSQNRSKTPKNQEALRMANVAENS S SDQRQACKKHELYVSFRDLGffQD WIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMVVRACGCH(SEQ ID NO :17)
在位置4處的引入,替換2個氨基酸(SK)
M'STGNLTQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO 18)
在位置5處的引入,替換2個氨基酸O(Q)
M'STGSNLTRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO 19)
通過以上述方式在整個序列中“掃描”糖基化序列直至達到下述序列,可以產生另 外的BMP-7變體
^W 138處的引入,替換2個^有氨某酸(CH)
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC EGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGNLT(SEQ ID NO 20)
因此獲得的所有BMP-7變體在本發明的范圍內。
另一個例子涉及給親本多肽(例如,BMP-7)添加N聯糖基化序列(例如,NLT),替 換親本多肽中通常存在的1個氨基酸(雙重氨基酸插入)。根據這個實施方案的示例性序 列在下表5中列出。
表5 包括NLT的BMP-7突變體的示例性文庫;1個已有氨基酸的替換(142個氨基 酸)
在位置1處的引入,替換1個氨基酸(S)
M'NLTTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQD WIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMVVRACGCH(SEQ ID NO :21)
在位置2處的引入,替換1個氨基酸(T)
M'SNLTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAA YYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪WRACGCH( SEQ ID NO 22)
在位置3處的引入,替換1個氨基酸(G)
M'STNLTSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAA YYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪WRACGCH ( SEQ ID NO 23)
在位置4處的引入,替換1個氨基酸(S)
M'STGNLTKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAA YYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪WRACGCH( SEQ ID NO 24)
在位置5處的引入,替換1個氨基酸(K)
M'STGSNLTQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQD WIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMVVRACGCH(SEQ ID NO :25)
通過以上述方式在整個序列中“掃描”糖基化序列直至達到下述序列,可以產生另外的BMP-7變體
^W 139處的引入,替換1個^有氨某酸(H)
M'STGSKQRSQNRSKTPKNQEALRMANVAENS S SDQRQACKKHELYVSFRDLGffQD WIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMVVRACGCNLT(SEQ ID NO :26)
因此獲得的所有BMP-7變體在本發明的范圍內。
另外一個例子涉及在親本多肽(例如,BMP-7)內的N聯糖基化序列(例如,NLT) 的制備,不替換親本多肽中通常存在的氨基酸,并且添加糖基化序列的整個長度(例如,關 于NLT的三重氨基酸插入)。根據這個實施方案的示例性序列在下表6中列出。
表6 包括NLT的BMP-7變體的示例性文庫;3個氨基酸的添加(143個氨基酸)
在位置1處的引入,添加3個氨基酸
M'NLTSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYA AYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪VVRACGC H(SEQ ID NO 27)
在位置2處的引入,添加3個氨基酸
M'SNLTTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQD WIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMVVRACGCH(SEQ ID NO :28)
在位置3處的引入,添加3個氨基酸
M'STNLTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYA AYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪VVRACGC H(SEQ ID NO 29)
在位置4處的引入,添加3個氨基酸
M'STGNLTSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYA AYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪VVRACGC H(SEQ ID NO 30)
通過以上述方式在整個序列中“掃描”糖基化序列直至達到最終序列,可以產生另 外的BMP-7突變體
在位置140處的引入,添加3個氨基酸
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCHNL T(SEQ ID NO 31)
因此獲得的所有BMP-7變體在本發明的范圍內。
使用本發明的任何N聯糖基化序列,可以產生與表3-6中的這些例子類似的 BMP-7變體。所有所得到的BMP-7變體在本發明的范圍內。例如,代替NLT,可以使用序列 DRNLT(SEQ ID NO :32)。在一個示例性實施方案中,將DRNLT引入親本多肽內,替換BMP-7 中通常存在的5個氨基酸。根據這個實施方案的示例性序列在下表7中列出
表7 包括DRNLT的BMP-7變體的示例性文庫;5個氨基酸的替換(140個氨基酸)
M'DRNLTQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYCegecafplnsymnatnhaivqtlvhfinpetvpkpccaptqlnaisvlyfdds snvilkkyrnmvvracgch(seq id no 33)
M'SDRNLTRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC egecafplnsymnatnhaivqtlvhfinpetvpkpccaptqlnaisvlyfddssnvilkkyrnmvvracgch(seq id no 34)
M'STDRNLTSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC egecafplnsymnatnhaivqtlvhfinpetvpkpccaptqlnaisvlyfddssnvilkkyrnmvvracgch(seq id no 35)
MiTCDRNLTQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC egecafplnsymnatnhaivqtlvhfinpetvpkpccaptqlnaisvlyfddssnvilkkyrnmvvracgch(seq id no 36)
通過以上述方式在整個序列中“掃描”糖基化序列直至達到最終序列,可以產生另 外的bmp-7突變體
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC egecafplnsymnatnhaivqtlvhfinpetvpkpccaptqlnaisvlyfdds snvilkkyrnmvvrdrnlt(seq id no 37)
因此獲得的所有突變型bmp-7序列在本發明的范圍內。
在另一個例子中,將n聯糖基化序列drnlt加入親本多肽(例如,bmp-7)中在親 本序列的n或c末端處或接近于親本序列的n或c末端,給親本多肽添加1至5個氨基酸。 根據這個實施方案的示例性序列在下表8中列出。
表8 包括drnlt的bmp-7變體的示例性文庫
(141-145 個氨基酸)
氨基末端突變體
在位置1處的引入,添加5個氨基酸
M'DRNLTSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQ dwiiapegyaayycegecafplnsymnatnhaivqtlvhfinpetvpkpccaptqlnaisvlyfdds snvilkkyrnmvvracgch(seq id no :38)
^l1 1處的弓丨入,添力d 41個氨(s)
M'DRNLTTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQ dwiiapegyaayycegecafplnsymnatnhaivqtlvhfinpetvpkpccaptqlnaisvlyfdds snvilkkyrnmvvracgch(seq id no :39)
^l1 1 處的弓丨入,添力d 32 個氨(st)
M'DRNLTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYV SFRDLGffQ dwiiapegyaayycegecafplnsymnatnhaivqtlvhfinpetvpkpccaptqlnaisvlyfdds snvilkkyrnmvvracgch(seq id no :40)
在位置1處的引入,添加2個氨基酸,替換3個氨基酸(STG)
MiDrnltskqrsqnrsktpknqealrmanvaens s sdqrqackkhelyvsfrdlgwqdwiiapegyaayycegecafplnsymnatnhaivqtlvhfinpetvpkpccaptqlnaisvlyfddssnvilkkyrnmvvracgch(s eq id no 41)
^W 1處的引入,添加1個氨某酸,替換4個氨某酸(STGS)
MiDrnltkqrsqnrsktpknqealrmanvaens s sdqrqackkhelyvsfrdlgwqdWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMVVRACGCH(SEQ ID NO :42)
羧基末端突變體
在位置140處的引入,添加5個氨基酸
M'STGSKQRSQNRSKTPKNQEALRMANVAENS S SDQRQACKKHELYVSFRDLGffQDffIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCHDRNL T(SEQ ID NO 43)
^W 139處的引入,添加4個M某酸,替換1個M某酸(H)
M'STGSKQRSQNRSKTPKNQEALRMANVAENS S SDQRQACKKHELYVSFRDLGWQD WIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMWRACGCDRNLT(SEQ ID NO :44)
^W 138處的引入,添加3個氨某酸,替換2個M某酸(CH)
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRAC⑶RNL T(SEQ ID NO 45)
^W 137處的引入,添加2個氨某酸,替換3個氨某酸(GCH)
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪WRACDRNLT( SEQ ID NO 46)
在位置136處的引入,添加1個氨基酸,替換4個氨基酸(CGCH)
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC EGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRADRNLT(SEQ ID NO 47)
另外一個例子涉及將N聯糖基化序列DFNVS (SEQ ID NO 48)插入親本多肽(例 如,BMP-7)內,給親本多肽添加1至5個氨基酸。根據這個實施方案的示例性序列在下表9 中列出。
表9 包括DFNVS的BMP-7變體的示例性文庫
1個氨基酸的插入
M'DFNVSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO 49)
M'SDFNVSQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO 50)
M'STDFNVSRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYV SFRDLGffQDffIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(SEQ ID NO 51)
通過以上述方式在整個序列中“掃描”糖基化序列直至達到最終序列,可以產生另 外的BMP-7突變體
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYYC EGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRADFNVS(SEQ ID NO 52)
因此獲得的所有BMP-7變體在本發明的范圍內。
2個氨基酸的插入
M'DFNVSSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAA YYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH( SEQ ID NO 53)
M'SDFNVSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAA YYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪WRACGCH( SEQ ID NO 54)
M'STDFNVSQRSQNRSKTPKNQEALRMANVAENS S SDQRQACKKHELYVSFRDLGffQDffIIAPEGYAA YYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH(S EQ ID NO 55)
通過以上述方式在整個序列中“掃描”糖基化序列直至達到最終序列,可以產生另 外的BMP-7變體
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪WRACDFNVS ( SEQ ID NO 56)
因此獲得的所有BMP-7變體在本發明的范圍內。
3個氨基酸的插入
M'DFNVSGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYA AYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪VVRACGC H(SEQ ID NO 57)
M'SDFNVSSKQRSQNRSKTPKNQEALRMANVAENS S SDQRQACKKHELYVSFRDLGffQDffIIAPEGYA AYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH( SEQ ID NO 58)
MiStdfnVSKQRS QNRSKTPKNQEALRMANVAENS S SDQRQACKKHELYVSFRDLGffQDffIIAPEGY AAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH (SEQ ID NO 59)
通過以上述方式在整個序列中“掃描”糖基化序列直至達到最終序列,可以產生另 外的BMP-7變體
M'STGSKQRSQNRSKTPKNQEALRMANVAENS S SDQRQACKKHELYVSFRDLGffQDffIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGDFNVS( SEQ ID NO 60)
因此獲得的所有BMP-7變體在本發明的范圍內。
4個氨基酸的插入
M'DFNVSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGY AAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪WRACGC H(SEQ ID NO 61)
M'SDFNVSGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQ DWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMVVRACGCH(SEQ ID NO :62)
MiSTDFNVS SKQRS QNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGY AAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYRNMVVRACGCH (SEQ ID NO 63)
通過以上述方式在整個序列中“掃描”糖基化序列直至達到最終序列,可以產生另 外的BMP-7變體
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪WRACGCDFNV S (SEQ ID NO 64)
因此獲得的所有BMP-7變體在本發明的范圍內。
5個氨基酸的插入
M'DFNVSSTGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEG YAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪WRACG CH(SEQ ID NO 65)
M'SDFNVSTGSKQRSQNRSKTPKNQEALRMANVAENS S SDQRQACKKHELYVSFRDLGff QDffIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMVVRACGCH(SEQ ID NO :66)
M'STDFNVSGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQ DWIIAPEGYAAYYCEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDS SNVILKKYRNMVVRACGCH(SEQ ID NO :67)
通過以上述方式在整個序列中“掃描”糖基化序列直至達到最終序列,可以產生另 外的BMP-7變體
M'STGSKQRSQNRSKTPKNQEALRMANVAENSSSDQRQACKKHELYVSFRDLGWQDWIIAPEGYAAYY CEGECAFPLNSYMNATNHAIVQTLVHFINPETVPKPCCAPTQLNAISVLYFDDSSNVILKKYR匪WRACGCHDFN VS (SEQ ID NO 68)
因此獲得的所有BMP-7變體在本發明的范圍內。
在一個例子中,通過已有氨基酸的置換和/或通過插入,將N聯糖基化序列(例 如,NLT或NVQ放置在所選擇的多肽區域內的所有可能的氨基酸位置處。根據這個實施方 案的示例性序列在下表10和11中列出。
表10 包括在A73和A82之間的NLT的BMP-7變體的示例性文庫
已有氨基酸的置換
---A73FPLNSYMNA82TNHAIVQTLVHFI95NPETVPKP103—(SE Q IDNO 69)(親本)
---N73LTLNSYMNA82TNHAIVQTLVHFI95NPETVPKP103—(SEQID NO :70)
---A73NLTNSYMNA82TNHAIVQTLVHFI95NPETVPKP103—(SEQID NO :71)50—a73fnltsymna82tnhaivqtlvhfi95npetvpkp103-—(seqidno :72)---a73fpnltymna82tnhaιvqtlvhfι95Npetvpkp103--- (seqidno :73)---a73fplnltmna82tnha ι vqtlvhf ι 95Npetvpkp103---(seqidno :74)---a73fplnnltna82tnha ι vqtlvhf ι 95Npetvpkp103---(seqidno :75)---a73fplnsnlta82tnha ι vqtlvhf ι 95Npetvpkp103---(seqidno :76)-—a73fplnsynlt82tnhaivqtlvhfi95npetvpkp103-—(seqidno :77) 表11 :何括在i95和pltl3之間的nlt的bmp-7變體的示例性文庫 r有氨某酸的置換—a73fplnsymna82tnhaivqtlvhfn95ltetvpkp103-—(seqid no :78)—a73fplnsymna82tnhaivqtlvhfi95nlttvpkp103-—(seqidno :79)-—a73fplnsymna82tnhaivqtlvhfi95nnltvpkp103—(seqidno :80)—a73fplnsymna82tnhaivqtlvhfi95npnltpkp103-—(seqidno :81)—a73fplnsymna82tnhaivqtlvhfi95npenltkp103-—(seqidno :82)—a73fplnsymna82tnhaivqtlvhfi95npetnltp103-—(seqidno :83)—a73fplnsymna82tnhaivqtlvhfi95npetvnlt103-—(seqidno :84) 在r有氨某丨旬6勺捅入(添加1個氨某酸)
---n73ltplnsymna83tnhaivqtlvhfi96npetvpkp104-—(seqidno:85)
---a73nltlnsymna83tnhaivqtlvhfi96npetvpkp104-—(seqidno:86)
---a73fnltnsymna83tnhaivqtlvhfi96npetvpkp104-—(seqidno:87)
---a73fpnltsymna83tnhaivqtlvhfi96npetvpkp104-—(seqidno:88)
---a73fplnltymna83tnhaivqtlvhfi96npetvpkp104-—(seqidno:89)
---a73fplnnltmna83tnhaivqtlvhfi96npetvpkp104-—(seqidno:90)
---a73fplnsnltna83tnhaivqtlvhfi96npetvpkp104-—(seqidno:91)
---a73fplnsynlta83tnhaivqtlvhfi96npetvpkp104-—(seqidno:92)
---a73fplnsymnlt83tnhaivqtlvhfi96npetvpkp104-—-(seqidno:93)在酸少間的插入(添加1個氨基酸)
---a73fplnsymna82tnhaivqtlvhfn95ltpetvpkp104-—(seqidno:94)
---a73fplnsymna82tnhaivqtlvhfi95nltetvpkp104-—(seqidno:95)
---a73fplnsymna82tnhaivqtlvhfi95nnlttvpkp104-—-(seqidno:96)
---a73fplnsymna82tnhaivqtlvhfi95npnltvpkp104-—-(seqidno:97)
---a73fplnsymna82tnhaivqtlvhfi95npenltpkp104-—-(seqidno:98)
---a73fplnsymna82tnhaivqtlvhfi95npetnltkp104-—-(seqidno:99)
---a73fplnsymna82tnhaivqtlvhfi95npetvnltp104-—-(seqidno:100)
---a73fplnsymna82tnhaivqtlvhfi95npetvpnlt104-—-(seqidno:101)
上述置換和插入可以使用本發明的任何n聯糖基化序列例如nlt 禾口 seq32和48來進行。因此獲得的所有bmp-7變體在本發明的范圍內。
在另一個示例性實施方案中,將一個或多個n聯糖基化序列(例如上文闡述的那 些)插入血液凝固因子內,例如因子vii、因子viii或因子ix多肽。如在bmp-7背景中所 述,n聯糖基化序列可以插入用bmp-7例示的多種基序中的任何中。例如,n聯糖基化序列可以插入野生型序列內而不替換野生型序列天然的任何一個或多個氨基酸。在一個示例性 實施方案中,N聯糖基化序列插入在多肽的N或C末端處或接近多肽的N或C末端。在另 一個示例性實施方案中,在插入N聯糖基化序列前,去除野生型多肽序列天然的一個或多 個氨基酸殘基。在另外一個示例性實施方案中,野生型多肽序列天然的一個或多個氨基酸 殘基是N聯糖基化序列的組分(例如,天冬酰胺),并且N聯糖基化序列包括一個或多個野 生型氨基酸。一個或多個野生型氨基酸可以在N聯糖基化序列的任一末端處或N聯糖基化 序列的內部。
此外,任何預先存在的N聯或0聯糖基化序列可以替換為本發明的N聯糖基化序 列。此外,N聯糖基化序列可以插入鄰近一個或多個0聯糖基化序列。在一個實施方案中, N聯糖基化序列的存在阻止0聯糖基化序列的糖基化。
在一個代表性例子中,親本多肽是因子VIII。在這個實施方案中,N聯糖基化序列 可以插入根據上文闡述的任何基序的A、B或C結構域內。超過一個N聯糖基化序列可以插 入單個結構域或超過一個結構域內;再次,根據上文的任何基序。例如,N聯糖基化序列可 以插入A、B和C結構域、A和C結構域、A和B結構域或B和C結構域各自內。備選地,N聯 糖基化序列可以側接A和B結構域或B和C結構域。關于因子VIII的示例性氨基酸序列 在圖2中提供。
在另一個示例性實施方案中,因子VIII多肽是B結構域缺失(BDD)的因子VIII 多肽。在這個實施方案中,N聯糖基化序列可以插入使因子VIII異二聚體的SOKd和90Kd 亞單位連接的肽連接體內。備選地,N聯糖基化序列可以側接A結構域和連接體或C結構域 和連接體。如上文在BMP-7背景中所述,N聯糖基化序列可以插入而不替換已有氨基酸,或 可以插入而替換親本多肽的一個或多個氨基酸。關于B結構域缺失(BDD)的因子VIII的 示例性序列在圖3中提供。
其他B結構域缺失的因子VIII多肽也適合于與本發明一起使用,包括例如 Sandberg 等人,kminars in Hematology 38(2) :4-12(2000)中公開的 B 結構域缺失的因 子VIII多肽,其公開內容通過引用合并入本文。
如對于本領域技術人員顯而易見的,包括本發明的超過一個突變型N聯糖基化序 列的多肽也在本發明的范圍內。可以引入另外的突變,以允許調節多肽性質,例如生物活 性、代謝活性(例如,減少的蛋白水解)、藥代動力學等。
制備多種變體后,它們可以就其充當用于N聯糖基化或糖基PEG化的底物的能力 進行評估。成功的糖基化和/或糖基PEG化可以使用本領域已知的方法進行檢測且定量, 所述方法例如質譜法(例如,MALDI-T0F或Q-T0F)、凝膠電泳(例如,與光密度法相組合) 或色譜分析(例如,HPLC)。生物測定法例如酶抑制測定法、受體結合測定法和/或基于細 胞的測定法可以用于分析給定多肽或多肽綴合物的生物活性。評估策略在本文下文中更詳 細地描述(參見例如,“引導多肽的鑒定”)。選擇和/或開發用于每種多肽的化學和生物評 估的合適測定法系統在本領域技術人員的能力內。
多肽綴合物
在另一個方面,本發明提供了在多肽(例如,序列子多肽)和所選擇的修飾基團 (例如,聚合修飾基團)之間的共價綴合物,其中修飾基團經由糖基連接基團(例如,完整 的糖基連接基團)與多肽綴合。糖基連接基團插入多肽和修飾基團之間,并且與多肽和修飾基團連接。在制備目前的多肽綴合物中有用的示例性方法在本文中闡述。其他有用的 方法在美國專利號 5,876,980 ;6,030,815 ;5,728,554 ;和 5,922,577,以及 WO 98/31826 ; W02003/031464 ;W02005/070138 ;W02004/99231 ;W02004/10327 ;W02006/074279 ;和美國專 利申請公開2003180835中闡述,所有所述專利為了所有目的通過引用合并入本文。
本發明的綴合物將一般對應于一般結構
權利要求
1.在糖基化或非糖基化多肽和聚合修飾基團之間的共價綴合物,所述多肽包括選自 SEQ ID NO 1和SEQ ID NO 2的外源N聯糖基化序列X1N X2X3X4 (SEQ ID NO 1);禾口 X1D X2’ N X2X3X4 (SEQ ID NO 2), 其中N是天冬酰胺; D是天冬氨酸;X3是選自蘇氨酸⑴和絲氨酸⑶的成員; X1存在或不存在,并且當存在時是氨基酸; X4存在或不存在,并且當存在時是氨基酸;和 X2和X2,是獨立地選擇的氨基酸,前提是X2和X2,不是脯氨酸(P), 其中所述聚合修飾基團經由糖基連接基團在所述N聯糖基化序列的所述天冬酰胺殘 基處與所述多肽共價綴合,所述糖基連接基團插入所述天冬酰胺和所述聚合修飾基團之 間,并且與所述天冬酰胺和所述聚合修飾基團共價連接,其中所述糖基連接基團是選自單 糖和寡糖的成員。
2.根據權利要求1的共價綴合物,其中所述外源N聯糖基化序列是選自NX2T和N X2S 的成員。
3.根據權利要求1的共價綴合物,其中所述聚合修飾基團是選自線性和分支聚合部分 的成員。
4.根據權利要求3的共價綴合物,其中所述聚合修飾基團是水溶性聚合物。
5.根據權利要求4的共價綴合物,其中所述水溶性聚合物是選自聚環氧烷、右旋糖酐 和多唾液酸的成員。
6.根據權利要求5的共價綴合物,其中所述聚環氧烷是選自聚(乙二醇)(PEG)、聚(丙 二醇)(PPG)及其衍生物的成員。
7.根據權利要求1的共價綴合物,所述多肽與親本多肽相對應,所述親本多肽是治療 性多肽。
8.根據權利要求1的共價綴合物,其中所述多肽與親本多肽相對應,所述親本多肽是 選自下述的成員肝細胞生長因子(HGF)、神經生長因子(NGF)、表皮生長因子(EGF)、成 纖維細胞生長因子-I (FGF-I)、FGF-2、FGF-3、FGF-4、FGF-5、FGF-6、FGF-7、FGF-8、FGF-9、 FGF-10、FGF-ll、FGF-12、FGF-13、FGF-14、FGF-15、FGF-16、FGF-17、FGF-18、FGF-19、FGF-20、 FGF-21、FGF-22、FGF-23、角質化細胞生長因子(KGF)、巨核細胞生長和發育因子(MGDF)、血 小板衍生的生長因子(PDGF)、轉化生長因子-α (TGF- α )、TGF- β、TGF- β 2、TGF- β 3、血管 內皮生長因子(VEGF)、VEGF抑制劑、骨生長因子(BGF)、神經膠質生長因子、肝素結合的促 神經突生長因子(HBNF)、Cl酯酶抑制劑、人生長激素(hGH)、促卵泡激素(FSH)、促甲狀腺 激素(TSH)、甲狀旁腺激素、促濾泡素-α、促濾泡素-β、濾泡抑素、促黃體激素(LH)、白介 素-1 (IL-I)、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、 IL-14、IL-15、IL-16、IL-17、IL_18、干擾素- a (INF-α )、INF-β、INF-γ、INF-ω、INF- τ、 胰島素、葡糖腦苷酯酶、α-半乳糖苷酶、酸性-α-葡糖苷酶(酸性麥芽糖酶)、艾杜糖醛 酸酶、甲狀腺過氧化物酶(TPO)、β -葡糖苷酶、芳基硫酸酯酶、天冬酰胺酶、α -葡糖神經酰胺酶、鞘磷脂酶、丁酰膽堿酯酶、尿激酶、α -半乳糖苷酶Α、骨形態發生蛋白質-1 (BMP-I)、 ΒΜΡ-2、ΒΜΡ-3、ΒΜΡ-4、ΒΜΡ-5、ΒΜΡ-6、ΒΜΡ-7、ΒΜΡ-8、ΒΜΡ-9、BMP-10、BMP-11、BMP-12、BMP-13、 BMP-14、BMP-15, NT_3、NT_4、NT_5、促紅細胞生成素(EPO)、新紅細胞生成刺激蛋白質 (NESP)、生長分化因子(⑶F)、神經膠質細胞系衍生的神經營養因子(⑶NF)、腦源性神經營 養因子(BDNF)、肌肉生長抑制素、神經生長因子(NGF)、血管性血友病因子(vWF)、切割vWF 的蛋白酶(vWF-蛋白酶、vWF-降解蛋白酶)、粒細胞集落刺激因子(G-CSF)、粒細胞-巨噬 細胞集落刺激因子(GM-CSF)、Ci1-抗胰蛋白酶(ATT或α-1蛋白酶抑制劑)、組織型纖溶酶 原激活物(TPA)、水蛭素、瘦素、尿激酶、人DNA酶、胰島素、乙型肝炎表面蛋白質(HbsAg)、人 絨毛膜促性腺素(hCG)、骨橋蛋白、護骨素、蛋白質C、生長調節素-1、促生長素、生長激素、 嵌合白喉毒素-IL-2、胰高血糖素樣肽(GLP)、凝血酶、血小板生成素、凝血酶敏感蛋白-2、 抗凝血酶 III (AT-III)、prokinetisin、CD4、α -CD20、腫瘤壞死因子(TNF) ,TNF- α 抑制劑、 TNF受體(TNF-R)、Ρ-選擇素糖蛋白配體-I(PSGL-I)、補體、轉鐵蛋白、糖基化依賴性細胞粘 附分子(GlyCAM)、神經細胞粘附分子(N-CAM)、TNF受體-IgG Fc區融合蛋白、extendin_4、 BDNF, β-2-微球蛋白、睫狀神經營養因子(CNTF)、淋巴毒素-β受體(LT-β受體)、纖維 蛋白原、⑶F-1、GDF-2、GDF-3、GDF-4、GDF-5、GDF-6、GDF-7、GDF-8、GDF-9、⑶F-10、⑶F-11、 ⑶F-12、⑶F-13、⑶F-14、⑶F_15、GLP-1、胰島素樣生長因子、胰島素樣生長因子結合蛋白 (IGB)、IGF/IBP-2、IGF/IBP-3、IGF/IBP-4、IGF/IBP-5、IGF/IBP-6、IGF/IBP-7、IGF/IBP-8、 IGF/IBP-9、IGF/IBP-10、IGF/IBP-11、IGF/IBP-12、IGF/IBP-13、因子 V、因子 VII、因子 VIII、因子IX、因子X、血管性血友病因子(vWF)和因子VIII之間的復合物、針對內皮生長 因子(EGF)的抗體、針對血管內皮生長因子(VEGF)的抗體、針對成纖維細胞生長因子(FGF) 的抗體、抗TNF抗體、TNF受體-IgG Fc區融合蛋白、抗HER2抗體、針對呼吸道合胞病毒的 蛋白質F的抗體、針對TNF-α的抗體、針對糖蛋白nb/IIIa的抗體、針對CD20的抗體、針 對⑶4的抗體、針對α -⑶3的抗體、針對⑶40L的抗體、針對⑶IM的抗體、針對PSGL-I的 抗體和針對癌胚抗原(CEA)的抗體。
9.根據權利要求1的共價綴合物,其中所述外源N聯糖基化序列是寡糖基轉移酶的底物。
10.根據權利要求9的共價綴合物,其中所述寡糖基轉移酶是重組酶。
11.根據權利要求9的共價綴合物,其中所述寡糖基轉移酶是選自I^glB和Stt3p及其 可溶性變體的成員。
12.根據權利要求1的共價綴合物,其中所述糖基連接基團是完整的糖基連接基團。
13.根據權利要求1的共價綴合物,其中所述糖基連接基團是其為選自下述的成 員的殘基GlcNAc、GlcNH、baci 1 losamine、6-hydroxybaci 1 losamine、 GalNAc、 GalNH、 GlcNAc-GlcNAc, GlcNAc-GlcNH,6-hydroxybaciIlosamine-GalNAc, GalNAc-Gal-Sia, GlcNAc-GlcNAc-Gal-Sia、GlcNAc-Gal 、GlcNAc-Gal-Sia、GlcNAc-GlcNAc-Man, GlcNAc-GlcNAc-Man (Man)2 及其組合。
14.組合物,其包括根據權利要求1的共價綴合物和所述多肽在其中表達的細胞。
15.藥物組合物,其包括根據權利要求1的共價綴合物和藥學上可接受的載體。
16.化合物,其具有根據式(X)的結構
17.根據權利要求16的化合物,其中所述聚合修飾基團是選自線性和分支聚合部分的 成員。
18.根據權利要求17的化合物,其中所述聚合修飾基團是水溶性聚合物。
19.根據權利要求18的化合物,其中所述水溶性聚合物是選自聚環氧烷、右旋糖酐和 多唾液酸的成員。
20.根據權利要求19的化合物,其中所述聚環氧烷是選自聚(乙二醇)(PEG)、聚(丙 二醇)(PPG)及其衍生物的成員。
21.根據權利要求16的化合物,其中Z*是選自單觸角、二觸角、三觸角和四觸角聚糖的 成員。
22.根據權利要求16的化合物,其中Z*是選自下述的成員GlcNAc、GlcNH、 bacillosamine、6_hydroxybacillosamine、GalNAc、GalNH、GlcNAc—GlcNAc、GlcNAc—GlcNH、 6-hydroxybacilIosamine-GalNAc> GalNAc-Gal-Sia 、GlcNAc-GlcNAc-Gal-Sia 、 GlcNAc-Gal 、GlcNAc-Gal-Sia、GlcNAc-GlcNAc-Man、GlcNAc-GlcNAc-Man (Man)2 及其組口 O
23.根據權利要求16的化合物,其中所述脂質部分包括在直鏈或支鏈中排列的1至約 100個碳原子,所述鏈包括獨立地選自飽和和不飽和的碳-碳鍵,所述鏈任選包括一個或多 個芳香族或非芳香族環結構且任選包括至少一個官能團。
24.根據權利要求23的化合物,其中所述官能團是選自醚、硫醚、胺、甲酰胺、磺胺、胼、 羰基、氨基甲酸酯、尿素、硫脲、酯和碳酸酯的成員。
25.根據權利要求16的化合物,其中所述脂質部分是取代的烷基。
26.根據權利要求25的化合物,其中所述脂質部分是選自多萜醇、還原或部分還原的 多萜醇、異戊二烯基部分、還原的異戊二烯基部分、聚-異戊二烯基部分和還原或部分還原 的聚-異戊二烯基部分的成員。
27.根據權利要求沈的化合物,其中所述聚-異戊二烯基部分是十一異戊烯。
28.根據權利要求25的化合物,其中所述脂質部分具有選自下述的成員的結構
29.根據權利要求16的化合物,其中Rfc具有選自下述的成員的結構
30.根據權利要求16的化合物,其具有下述結構
31.根據權利要求30的化合物,其具有選自下述的成員的結構
32.根據權利要求31的化合物,其具有選自下述的成員的結構
33.組合物,其包括細胞和根據權利要求16的化合物。
34.多肽,其包括選自SEQID NO 1和SEQ ID NO 2的外源N聯糖基化序列 X1N X2X3X4 (SEQ ID NO 1);禾口X1D X2' NX2X3X4 (SEQ ID NO 2), 其中N是天冬酰胺; D是天冬氨酸;X3是選自蘇氨酸⑴和絲氨酸⑶的成員;X1存在或不存在,并且當存在時是氨基酸;X4存在或不存在,并且當存在時是氨基酸;和X2和X2,是獨立地選擇的氨基酸,前提是X2和X2,不是脯氨酸(P)。
35.經分離的核酸,其編碼權利要求34的所述多肽。
36.表達載體,其包括權利要求35的所述核酸。
37.細胞,其包括權利要求35的所述核酸。
38.包括多個不同成員的多肽的文庫,其中所述文庫的每個成員與共同的親本多肽相 對應,并且其中所述文庫的每個成員包括外源N聯糖基化序列,其中所述N聯糖基化序列各 自是獨立地選自SEQ ID NO 1和SEQ ID NO 2的成員X1NX2X3X4 (SEQ ID NO 1);禾口 X1D X2,N X2X3X4(SEQ ID NO 2) 其中N是天冬酰胺; D是天冬氨酸;X3是選自蘇氨酸⑴和絲氨酸⑶的成員;X1存在或不存在,并且當存在時是氨基酸;X4存在或不存在,并且當存在時是氨基酸;和X2和X2'是獨立地選擇的氨基酸,前提是X2和X2,不是脯氨酸(P)。
39.根據權利要求38的文庫,其中所述外源N聯糖基化序列是選自NX2T和N X2S的 成員。
40.根據權利要求38的文庫,其中所述文庫的每個成員包括在所述親本多肽內的不同 氨基酸位置處的相同N聯糖基化序列。
41.根據權利要求38的文庫,其中所述文庫的每個成員包括在所述親本多肽內的相同 氨基酸位置處的不同N聯糖基化序列。
42.根據權利要求38的文庫,其中所述N聯糖基化序列是寡糖基轉移酶的底物。
43.根據權利要求42的文庫,其中所述寡糖基轉移酶是重組酶。
44.根據權利要求42的文庫,其中所述寡糖基轉移酶是選自I^glB和及其可溶性 變體的成員。
45.根據權利要求38的文庫,其中所述親本多肽是選自下述的成員肝細胞生長因子 (HGF)、神經生長因子(NGF)、表皮生長因子(EGF)、成纖維細胞生長因子-I(FGF-I)、FGF-2、 FGF-3、FGF-4、FGF-5、FGF-6、FGF-7、FGF-8、FGF-9、FGF-10、FGF-11、FGF-12、FGF-13、FGF-14、 FGF-15、FGF-16、FGF-17、FGF-18、FGF-19、FGF-20、FGF-21、FGF-22、FGF-23、角質化細胞生長 因子(KGF)、巨核細胞生長和發育因子(MGDF)、血小板衍生的生長因子(PDGF)、轉化生長因 子-α 0^^-0)、16卩-0、16卩-0 2、16卩-0 3、血管內皮生長因子(VEGF)、VEGF抑制劑、骨生 長因子(BGF)、神經膠質生長因子、肝素結合的促神經突生長因子(HBNF)、Cl酯酶抑制劑、 人生長激素(hGH)、促卵泡激素(FSH)、促甲狀腺激素(TSH)、甲狀旁腺激素、促濾泡素-α、促濾泡素- β、濾泡抑素、促黃體激素(LH)、白介素-1 (IL-I)、IL-2、IL-3、IL-4、IL-5、IL-6、 IL-7、IL-8、IL-9、IL-10、IL-IU IL-12、IL-13、IL-14、IL-15、IL-16、IL-17、IL-18、干擾 素-a (INF- α ), INF-β、INF- γ , INF-ω, INF-τ、胰島素、葡糖腦苷酯酶、α -半乳糖苷 酶、酸性-α-葡糖苷酶(酸性麥芽糖酶)、艾杜糖醛酸酶、甲狀腺過氧化物酶(ΤΡ0)、β_葡 糖苷酶、芳基硫酸酯酶、天冬酰胺酶、α -葡糖神經酰胺酶、鞘磷脂酶、丁酰膽堿酯酶、尿激 酶、α -半乳糖苷酶 Α、骨形態發生蛋白質-1 (BMP-I)、ΒΜΡ-2、ΒΜΡ-3、ΒΜΡ-4、ΒΜΡ-5、ΒΜΡ-6、 ΒΜΡ-7、ΒΜΡ-8、ΒΜΡ-9、BMP-10、BMP-11、BMP-12、BMP-13、BMP-14、BMP-15、ΝΤ-3、ΝΤ-4、ΝΤ-5、 促紅細胞生成素(EPO)、新紅細胞生成刺激蛋白質(NESP)、生長分化因子(⑶F)、神經膠質 細胞系衍生的神經營養因子(⑶NF)、腦源性神經營養因子(BDNF)、肌肉生長抑制素、神經 生長因子(NGF)、血管性血友病因子(vWF)、切割vWF的蛋白酶(vWF-蛋白酶、vWF-降解蛋白 酶)、粒細胞集落刺激因子(G-CSF)、粒細胞-巨噬細胞集落刺激因子(GM-CSF)、α r抗胰 蛋白酶(ATT或α-1蛋白酶抑制劑)、組織型纖溶酶原激活物(TPA)、水蛭素、瘦素、尿激酶、 人DNA酶、胰島素、乙型肝炎表面蛋白質(HbsAg)、人絨毛膜促性腺素(hCG)、骨橋蛋白、護 骨素、蛋白質C、生長調節素-1、促生長素、生長激素、嵌合白喉毒素-IL-2、胰高血糖素樣肽 (GLP)、凝血酶、血小板生成素、凝血酶敏感蛋白-2、抗凝血酶III (AT-III)、prokinetisin、 CD4、α-CD20、腫瘤壞死因子(TNF)、TNF-α抑制劑、TNF受體(TNF-R)、P-選擇素糖蛋白配 體-1 (PSGL-I)、補體、轉鐵蛋白、糖基化依賴性細胞粘附分子OnyCAM)、神經細胞粘附分子 (N-CAM)、TNF受體-IgG Fc區融合蛋白、extendin_4、BDNF、β -2-微球蛋白、睫狀神經營養 因子(CNTF)、淋巴毒素-β受體(LT-β受體)、纖維蛋白原、⑶F-1、⑶F-2、⑶F-3、⑶F-4、 GDF-5, GDF-6, GDF-7, GDF-8, GDF-9, GDF-10, GDF-IU GDF-12, GDF-13, GDF-14, GDF-15, GLP-1、胰島素樣生長因子、胰島素樣生長因子結合蛋白(IGB)、IGF/IBP-2、IGF/IBP-3、 IGF/IBP-4、IGF/IBP-5、IGF/IBP-6、IGF/IBP-7、IGF/IBP-8、IGF/IBP-9、IGF/IBP-10、IGF/ IBP-IU IGF/IBP-12、IGF/IBP-13、因子 V、因子 VII、因子 VIII、因子 IX、因子 X、血管性血 友病因子(vWF)和因子VIII之間的復合物、針對內皮生長因子(EGF)的抗體、針對血管內 皮生長因子(VEGF)的抗體、針對成纖維細胞生長因子(FGF)的抗體、抗TNF抗體、TNF受 體-IgG Fc區融合蛋白、抗HER2抗體、針對呼吸道合胞病毒的蛋白質F的抗體、針對TNF- α 的抗體、針對糖蛋白Ilb/IIIa的抗體、針對⑶20的抗體、針對⑶4的抗體、針對α -⑶3的 抗體、針對CD40L的抗體、針對CDlM的抗體、針對PSGL-I的抗體和針對癌胚抗原(CEA)的 抗體。
46.形成在多肽和聚合修飾基團之間的共價綴合物的無細胞的體外方法,其中所述多 肽包括包含天冬酰胺殘基的N聯糖基化序列,所述修飾基團經由糖基連接基團在所述天冬 酰胺殘基處與所述多肽共價連接,所述糖基連接基團插入所述天冬酰胺和所述修飾基團之 間,并且與所述天冬酰胺和所述修飾基團共價連接,所述方法包括在寡糖基轉移酶的存在 下,在足以使所述寡糖基轉移酶將糖基部分從所述化合物轉移到所述N聯糖基化序列的所 述天冬酰胺殘基上的條件下,使所述多肽和根據權利要求16的化合物相接觸,從而形成所 述共價綴合物。
47.根據權利要求46的方法,其進一步包括在宿主細胞中表達所述多肽。
48.根據權利要求47的方法,其進一步包括產生包括編碼所述多肽的核酸序列的表 達載體。
49.根據權利要求48的方法,其進一步包括用所述表達載體轉染所述宿主細胞。
50.根據權利要求46的方法,其進一步包括分離所述共價綴合物。
51.根據權利要求46的方法,其中所述聚合修飾基團是選自線性和分支聚合部分的成員O
52.根據權利要求51的方法,其中所述聚合修飾基團是水溶性聚合物。
53.根據權利要求52的方法,其中所述水溶性聚合物是選自聚環氧烷、右旋糖酐和多 唾液酸的成員。
54.根據權利要求53的方法,其中所述聚環氧烷是選自聚(乙二醇)(PEG)、聚(丙二 醇)(PPG)及其衍生物的成員。
55.根據權利要求46的方法,其中所述多肽與親本多肽相對應,所述親本多肽是治療 多肽。
56.根據權利要求46的方法,其中所述多肽與親本多肽相對應,所述親本多肽是選自 下述的成員肝細胞生長因子(HGF)、神經生長因子(NGF)、表皮生長因子(EGF)、成纖維細 胞生長因子-I (FGF-I)、FGF-2、FGF-3、FGF-4、FGF-5、FGF-6、FGF-7、FGF-8、FGF-9、FGF-10、 FGF-11、FGF-12、FGF-13、FGF-14、FGF-15、FGF-16、FGF-17、FGF-18、FGF-19、FGF-20、FGF-21、 FGF-22、FGF-23、角質化細胞生長因子(KGF)、巨核細胞生長和發育因子(MGDF)、血小板衍 生的生長因子(PDGF)、轉化生長因子-α (TGF-α)、TGF-β、TGF-β 2、TGF-β 3、血管內皮 生長因子(VEGF)、VEGF抑制劑、骨生長因子(BGF)、神經膠質生長因子、肝素結合的促神 經突生長因子(HBNF)、Cl酯酶抑制劑、人生長激素(hGH)、促卵泡激素(FSH)、促甲狀腺激 素(TSH)、甲狀旁腺激素、促濾泡素-α、促濾泡素-β、濾泡抑素、促黃體激素(LH)、白介 素-1 (IL-I)、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、 IL-14、IL-15、IL-16、IL-17、IL_18、干擾素- a (INF-a )、INF-β、INF-γ、INF-ω、INF- τ、 胰島素、葡糖腦苷酯酶、α-半乳糖苷酶、酸性-α-葡糖苷酶(酸性麥芽糖酶)、艾杜糖醛 酸酶、甲狀腺過氧化物酶(TPO)、β -葡糖苷酶、芳基硫酸酯酶、天冬酰胺酶、a -葡糖神經酰 胺酶、鞘磷脂酶、丁酰膽堿酯酶、尿激酶、a -半乳糖苷酶A、骨形態發生蛋白質-1 (BMP-I)、 BMP-2、BMP-3、BMP-4、BMP-5、BMP-6、BMP-7、BMP-8、BMP-9、BMP-10、BMP-11、BMP-12、BMP-13、 BMP-14、BMP-15, NT_3、NT_4、NT_5、促紅細胞生成素(EPO)、新紅細胞生成刺激蛋白質 (NESP)、生長分化因子(⑶F)、神經膠質細胞系衍生的神經營養因子(⑶NF)、腦源性神經營 養因子(BDNF)、肌肉生長抑制素、神經生長因子(NGF)、血管性血友病因子(vWF)、切割vWF 的蛋白酶(vWF-蛋白酶、vWF-降解蛋白酶)、粒細胞集落刺激因子(G-CSF)、粒細胞-巨噬 細胞集落刺激因子(GM-CSF)、Ci1-抗胰蛋白酶(ATT或a-1蛋白酶抑制劑)、組織型纖溶酶 原激活物(TPA)、水蛭素、瘦素、尿激酶、人DNA酶、胰島素、乙型肝炎表面蛋白質(HbsAg)、人 絨毛膜促性腺素(hCG)、骨橋蛋白、護骨素、蛋白質C、生長調節素-1、促生長素、生長激素、 嵌合白喉毒素-IL-2、胰高血糖素樣肽(GLP)、凝血酶、血小板生成素、凝血酶敏感蛋白-2、 抗凝血酶 III (AT-III)、prokinetisin、CD4、a -CD20、腫瘤壞死因子(TNF) ,TNF- α 抑制劑、 TNF受體(TNF-R)、P-選擇素糖蛋白配體-I(PSGL-I)、補體、轉鐵蛋白、糖基化依賴性細胞粘 附分子(GlyCAM)、神經細胞粘附分子(N-CAM)、TNF受體-IgG Fc區融合蛋白、extendin_4、 BDNF, β-2-微球蛋白、睫狀神經營養因子(CNTF)、淋巴毒素-β受體(LT-β受體)、纖維 蛋白原、⑶F-1、GDF-2、GDF-3、GDF-4、GDF-5、GDF-6、GDF-7、GDF-8、GDF-9、⑶F-10、⑶F-11、⑶F-12、⑶F-13、⑶F-14、⑶F_15、GLP-1、胰島素樣生長因子、胰島素樣生長因子結合蛋白 (IGB)、IGF/IBP-2、IGF/IBP-3、IGF/IBP-4、IGF/IBP-5、IGF/IBP-6、IGF/IBP-7、IGF/IBP-8、 IGF/IBP-9、IGF/IBP-10、IGF/IBP-11、IGF/IBP-12、IGF/IBP-13、因子 V、因子 VII、因子 VIII、因子IX、因子X、血管性血友病因子(vWF)和因子VIII之間的復合物、針對內皮生長 因子(EGF)的抗體、針對血管內皮生長因子(VEGF)的抗體、針對成纖維細胞生長因子(FGF) 的抗體、抗TNF抗體、TNF受體-IgG Fc區融合蛋白、抗HER2抗體、針對呼吸道合胞病毒的 蛋白質F的抗體、針對TNF-α的抗體、針對糖蛋白nb/IIIa的抗體、針對CD20的抗體、針 對⑶4的抗體、針對α -⑶3的抗體、針對⑶40L的抗體、針對⑶154的抗體、針對PSGL-I的 抗體和針對癌胚抗原(CEA)的抗體。
57.根據權利要求46的方法,其中所述寡糖基轉移酶是重組酶。
58.根據權利要求46的方法,其中所述寡糖基轉移酶是選自I^glB和及其可溶性 變體的成員。
59.根據權利要求46的方法,其中所述糖基連接基團是完整的糖基連接基團。
60.根據權利要求46的方法,其中所述糖基連接基團是其為選自下述的成員 的殘基GlcNAc、GlcNH、bacillosamine、6-hydroxybacillosamine、 GalNAc、GalNH、 GlcNAc-GlcNAc, GlcNAc-GlcNH,6-hydroxybacillosamine-GalNAc, GalNAc-Gal-Sia, GlcNAc-GlcNAc-Gal-Sia 、GlcNAc-Gal 、GlcNAc-Gal-Sia 、GlcNAc-GlcNAc-Man, GlcNAc-GlcNAc-Man (Man) 2 及其組合。
61.形成在多肽和聚合修飾基團之間的共價綴合物的方法,所述多肽包括包含天冬酰 胺殘基的N聯糖基化序列,所述修飾基團經由糖基連接基團在所述天冬酰胺殘基處與所述 多肽共價連接,所述糖基連接基團插入所述天冬酰胺和所述修飾基團之間,并且與所述天 冬酰胺和所述修飾基團共價連接,所述方法包括(i)在寡糖基轉移酶的存在下,在足以使所述寡糖基轉移酶將與所述修飾基團共價連 接的糖基部分從所述化合物轉移到所述N聯糖基化序列的所述天冬酰胺殘基上的條件下, 使所述多肽和根據權利要求16的化合物相接觸,其中所述接觸在所述多肽在其中表達的 宿主細胞內發生,從而形成所述共價綴合物。
62.根據權利要求61的方法,其進一步包括( )使所述宿主細胞與所述化合物相接觸;和(iii)在足以使所述宿主細胞內在化所述化合物的條件下溫育所述宿主細胞。
63.根據權利要求61的方法,其中所述細胞存在于細胞培養基中,所述細胞培養基補 充有所述化合物。
64.根據權利要求61的方法,其進一步包括分離所述共價綴合物。
65.根據權利要求61的方法,其進一步包括產生包括編碼所述多肽的核酸序列的表 達載體。
66.根據權利要求65的方法,其進一步包括用所述表達載體轉染所述宿主細胞。
67.根據權利要求61的方法,其中所述聚合修飾基團是選自線性和分支聚合部分的成員。
68.根據權利要求61的方法,其中所述聚合修飾基團是水溶性聚合物。
69.根據權利要求68的方法,其中所述水溶性聚合物是選自聚環氧烷、右旋糖酐和多 唾液酸的成員。
70.根據權利要求69的方法,其中所述聚環氧烷是選自聚(乙二醇)(PEG)、聚(丙二 醇)(PPG)及其衍生物的成員。
71.根據權利要求61的方法,其中所述多肽與親本多肽相對應,所述親本多肽是治療 性多肽。
72.根據權利要求61的方法,其中所述多肽與親本多肽相對應,所述親本多肽是選自 下述的成員肝細胞生長因子(HGF)、神經生長因子(NGF)、表皮生長因子(EGF)、成纖維細 胞生長因子-I (FGF-I)、FGF-2、FGF-3、FGF-4、FGF-5、FGF-6、FGF-7、FGF-8、FGF-9、FGF-10, FGF-11、FGF-12、FGF-13、FGF-14、FGF-15、FGF-16、FGF-17、FGF-18、FGF-19、FGF-20、FGF-21、 FGF-22、FGF-23、角質化細胞生長因子(KGF)、巨核細胞生長和發育因子(MGDF)、血小板衍 生的生長因子(PDGF)、轉化生長因子-α (TGF-α)、TGF-β、TGF-β 2、TGF-β 3、血管內皮 生長因子(VEGF)、VEGF抑制劑、骨生長因子(BGF)、神經膠質生長因子、肝素結合的促神 經突生長因子(HBNF)、Cl酯酶抑制劑、人生長激素(hGH)、促卵泡激素(FSH)、促甲狀腺激 素(TSH)、甲狀旁腺激素、促濾泡素-α、促濾泡素-β、濾泡抑素、促黃體激素(LH)、白介 素-1 (IL-I)、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、 IL-14、IL-15、IL-16、IL-17、IL_18、干擾素- a (INF-a )、INF-β、INF-γ、INF-ω、INF- τ、 胰島素、葡糖腦苷酯酶、α-半乳糖苷酶、酸性-α-葡糖苷酶(酸性麥芽糖酶)、艾杜糖醛 酸酶、甲狀腺過氧化物酶(TPO)、β -葡糖苷酶、芳基硫酸酯酶、天冬酰胺酶、a -葡糖神經酰 胺酶、鞘磷脂酶、丁酰膽堿酯酶、尿激酶、a -半乳糖苷酶A、骨形態發生蛋白質-1 (BMP-I)、 BMP-2、BMP-3、BMP-4、BMP-5、BMP-6、BMP-7、BMP-8、BMP-9、BMP-10、BMP-11、BMP-12、BMP-13、 BMP-14、BMP-15, NT_3、NT_4、NT_5、促紅細胞生成素(EPO)、新紅細胞生成刺激蛋白質 (NESP)、生長分化因子(⑶F)、神經膠質細胞系衍生的神經營養因子(⑶NF)、腦源性神經營 養因子(BDNF)、肌肉生長抑制素、神經生長因子(NGF)、血管性血友病因子(vWF)、切割vWF 的蛋白酶(vWF-蛋白酶、vWF-降解蛋白酶)、粒細胞集落刺激因子(G-CSF)、粒細胞-巨噬 細胞集落刺激因子(GM-CSF)、Ci1-抗胰蛋白酶(ATT或a-1蛋白酶抑制劑)、組織型纖溶酶 原激活物(TPA)、水蛭素、瘦素、尿激酶、人DNA酶、胰島素、乙型肝炎表面蛋白質(HbsAg)、人 絨毛膜促性腺素(hCG)、骨橋蛋白、護骨素、蛋白質C、生長調節素-1、促生長素、生長激素、 嵌合白喉毒素-IL-2、胰高血糖素樣肽(GLP)、凝血酶、血小板生成素、凝血酶敏感蛋白-2、 抗凝血酶 III (AT-III)、prokinetisin、CD4、a -CD20、腫瘤壞死因子(TNF) ,TNF- α 抑制劑、 TNF受體(TNF-R)、P-選擇素糖蛋白配體-I(PSGL-I)、補體、轉鐵蛋白、糖基化依賴性細胞粘 附分子(GlyCAM)、神經細胞粘附分子(N-CAM)、TNF受體-IgG Fc區融合蛋白、extendin_4、 BDNF, β-2-微球蛋白、睫狀神經營養因子(CNTF)、淋巴毒素-β受體(LT-β受體)、纖維 蛋白原、⑶F-1、GDF-2、GDF-3、GDF-4、GDF-5、GDF-6、GDF-7、GDF-8、GDF-9、⑶F-10、⑶F-11、 ⑶F-12、⑶F-13、⑶F-14、⑶F_15、GLP-1、胰島素樣生長因子、胰島素樣生長因子結合蛋白 (IGB)、IGF/IBP-2、IGF/IBP-3、IGF/IBP-4、IGF/IBP-5、IGF/IBP-6、IGF/IBP-7、IGF/IBP-8、 IGF/IBP-9、IGF/IBP-10、IGF/IBP-11、IGF/IBP-12、IGF/IBP-13、因子 V、因子 VII、因子 VIII、因子IX、因子X、血管性血友病因子(vWF)和因子VIII之間的復合物、針對內皮生長 因子(EGF)的抗體、針對血管內皮生長因子(VEGF)的抗體、針對成纖維細胞生長因子(FGF)的抗體、抗TNF抗體、TNF受體-IgG Fc區融合蛋白、抗HER2抗體、針對呼吸道合胞病毒的 蛋白質F的抗體、針對TNF-α的抗體、針對糖蛋白Ilb/IIIa的抗體、針對CD20的抗體、針 對⑶4的抗體、針對α -⑶3的抗體、針對⑶40L的抗體、針對⑶154的抗體、針對PSGL-I的 抗體和針對癌胚抗原(CEA)的抗體。
73.根據權利要求61的方法,其中所述寡糖基轉移酶是在所述宿主細胞中共表達的重 組酶。
74.根據權利要求61的方法,其中所述寡糖基轉移酶對于所述宿主細胞是內源的。
75.根據權利要求61的方法,其中所述寡糖基轉移酶是選自I^glB和及其可溶性 變體的成員。
76.根據權利要求61的方法,其中所述糖基連接基團是完整的糖基連接基團。
77.根據權利要求61的方法,其中所述糖基連接基團是其為選自下述的成員 的殘基GlcNAc、GlcNH、bacillosamine>6-hydroxybacillosamine> GalNAc> GalNH、 GlcNAc-GlcNAc, GlcNAc-GlcNH,6-hydroxybacillosamine-GalNAc, GalNAc-Gal-Sia, GlcNAc-GlcNAc-Gal-Sia、 GlcNAc-GaU GlcNAc-Gal_Sia、 GlcNAc_GlcNAc_Man、 GlcNAc-GlcNAc-Man (Man)2 及其組合。
全文摘要
本發明提供了包括外源N聯糖基化序列的多肽和多肽綴合物。N聯糖基化序列優選是寡糖基轉移酶(例如,細菌PglB)的底物,其可以催化糖基部分從脂質結合的糖基供體分子(例如,脂質-焦磷酸鹽連接的糖基部分)到糖基化序列的天冬酰胺(N)殘基的轉移。在一個例子中,天冬酰胺殘基是本發明的外源N聯糖基化序列的部分。本發明進一步提供了制備多肽綴合物的方法,其包括在寡糖基轉移酶的存在下,在足以使酶將糖基部分轉移至N聯糖基化序列的天冬酰胺殘基的條件下,使具有本發明的N聯糖基化序列的多肽和脂質-焦磷酸鹽連接的糖基部分(或磷脂連接的糖基部分)相接觸。可以與糖基化序列綴合的示例性糖基部分包括GlcNAc、GlcNH、bacillosamine、6-hydroybacillosamine、GalNAc、GalNH、GlcNAc-GlcNAc 、GlcNAc-GlcNH、GlcNAc-Gal、GlcNAc-GlcNAc-Gal-Sia、GlcNAc-Gal-Sia、GlcNAc-GlcNAc-Man和GlcNAc-GlcNAc-Man(Man)2。經轉移的糖基部分任選由修飾基團例如聚合物(例如,PEG)進行修飾。在一個例子中,經修飾的糖基部分是GlcNAc或唾液酸部分。
文檔編號C07K1/107GK102037004SQ200980106134
公開日2011年4月27日 申請日期2009年1月8日 優先權日2008年1月8日
發明者S·德弗里斯 申請人:生物種屬學股份公司