包含具有減小的免疫原性的經修飾的噬菌體g3p氨基酸序列的多肽的制作方法
【專利說明】包含具有減小的免疫原性的經修飾的噬菌體G3P氨基酸序列 的多肽
[0001] 本發明涉及多肽,所述多肽包含足以結合和/或解聚淀粉樣蛋白的絲狀噬菌體基 因3蛋白(g3p)的一部分,例如,g3p的N1-N2部分及其突變體和片段,其中g3p氨基酸序列已 通過氨基酸取代被修飾來當在體內使用時具有比對應的野生型g3p氨基酸序列顯著更小的 免疫原性。本發明的多肽保留它們結合和/或解聚淀粉樣蛋白的能力。本發明還涉及這些經 修飾的g3p多肽用于治療和/或預防與淀粉樣蛋白的錯誤折疊或聚集相關的疾病的用途。
[0002] 已證明絲狀噬菌體g3p蛋白以及特別地包含g3p的N1-N2區的其多肽部分結合并解 聚各種淀粉樣蛋白,諸如淀粉樣蛋白、τ蛋白和朊病毒蛋白。參見共同未決的PCT申請PCT/ US2012/066793以及美國臨時申請US 61 /801,349和US 61 /801,849,所述每一個申請的公 開內容通過引用并入本文。也參見,R.Krishnan等,J.Mol.Biol. (2014)。盡管存在該功效, 但預期包含g3p或其Ν1-Ν2區的多肽的全身性施用可引起有害的免疫答應。然而,這些教導 都未鑒定導致g3p的免疫原性性質的特定T細胞表位或建議此處提供的減少或消除這些免 疫原性性質的特定修飾。
[0003] 許多重組或另外地非天然治療性蛋白質或多肽的功效可受患者與所述治療性蛋 白質或多肽的不希望的免疫反應限制。蛋白質對免疫響應的誘導的主要因素是蛋白質內的 T細胞表位,即可通過在組織相容性復合物(MHC)II類分子上的呈遞刺激T細胞的活性的氨 基酸序列的存在。T細胞表位通常被定義為具有結合MHC II類分子的能力的任何氨基酸殘 基序列。當結合于MHC分子時,T細胞表位可被T細胞受體(TCR)識別,并可通過銜接T細胞受 體以促進T細胞響應來引起T細胞的活化。然而,通常應理解,結合MHC II類分子的某些T細 胞表位不刺激T細胞響應,因為這些肽在向其施用所述蛋白質的生物體內被識別為"自身 的"。
[0004] -些T細胞表位可在治療性蛋白質或多肽在細胞內降解過程中被作為肽釋放,隨 后被MHC的分子呈遞以觸發T細胞的活化。對于由MHC II類分子呈遞的肽,T細胞的此類活化 則可通過直接刺激B細胞產生此類抗體來產生例如所述抗體響應。
[0005] MHC II類分子是一組在輔助T細胞選擇和活化中起著中心作用的高度多態的蛋白 質。人白細胞抗原組DR(HLA-DR)是該組蛋白質的占優勢的同種型。然而,同種型HLA-DQ和 HLA-DP進行相似的功能。在人中,已知DR同種型的約70種不同的同種異型,對于DQ,存在30 種不同的同種異型以及對于DP,已知47種不同的同種異型。每一個個體具有2至4個DR等位 基因,2個DQ和2個DP等位基因。
[0006] 個體中針對蛋白質或多肽的免疫響應嚴重受到T細胞表位識別影響,所述T細胞表 位識別是該個體的HLA-DR同種異型的肽結合特異性的函數。為了在全球人口的背景中鑒定 蛋白質或多肽內的T細胞表位,期望考慮盡可能多樣的一組HLA-DR同種異型的結合性質,從 而覆蓋盡可能高的百分比的世界人口。
[0007] T細胞表位鑒定是表位消除的第一步驟。使得能夠檢測T細胞表位的方法在本領域 中是已知的并且公開于WO 98/52976、W0 00/34317、US2007/0269435;US 7,208,147、Kern 等,Nature Medicine4:975_978(1998);和Kwok等,Trends in Immunology 22:583-588 (2001)中。在這些方法中,通過在治療性蛋白質或多肽的一級序列內使用明智的氨基酸取 代來除去預測的或鑒定的T細胞表位。雖然這些參考資料使得能夠進行T細胞表位的假定鑒 定,但避免對生物活性的負面影響的氨基酸取代的選擇不能被合理地預測。這僅可通過測 試經修飾的多肽的每一個的此類活性來測定。
[0008] 因此,可能期望檢查和減小g3p的N1-N2部分的免疫原性而不破壞其淀粉樣蛋白-結合/解聚性質,以便可為了治療和/或診斷目的長期全身性施用包含N1-N2部分的多肽。本 發明通過鑒定N1-N2序列內的潛在T細胞表位來滿足該需要。本發明還鑒定了在這些潛在T 細胞表位內的特定氨基酸取代以產生變體N1-N2序列,所述變體N1-N2序列將減少或消除T 細胞表位的免疫原性而不破壞變體N1-N2結合淀粉樣蛋白、阻止淀粉樣蛋白聚集和/或實現 淀粉樣蛋白斑的解聚的能力。
[0009] 在一個實施方案中,本發明還提供了多肽,所述多肽包含N1-N2氨基酸序列的變體 或其突變體或片段,由于一個或多個鑒定的T細胞表位內的一個或多個氨基酸取代而具有 減小的免疫原性。在一個方面,本發明提供了包含與人免疫球蛋白Fc區融合的變體NI -N2序 列的融合蛋白。
[0010] 在另一個實施方案中,本發明提供了包含本發明的多肽的藥物組合物,以及通過 向患有與錯誤折疊和/或聚集的淀粉樣蛋白蛋白質相關的疾病或對所述疾病易感的受試者 施用此類藥物組合物來治療或預防此類疾病的方法。
[0011]在其它實施方案中,本發明提供了編碼本發明的多肽的核酸分子,以及包含那些 核酸分子的載體和具有此類載體的細胞。
[0012] 在另一個實施方案中,本發明提供了用于產生本發明的多肽的方法。具體地,此類 方法使用所述核酸分子和/或具有包含此類核酸分子的載體的細胞。
[0013] 附圖簡述
[0014]圖1顯示具有5個通過粗體和下劃線標識的T細胞表位的Nl-N2-hIgGl-Fc融合蛋白 的氨基酸序列(SEQ ID N0:1)。氨基酸1-217構成野生型g3p序列的N1-N2部分。氨基酸218-256代表由存在于M13噬菌體中的野生型g3p的富含甘氨酸的N2-C末端接頭組成的接頭區。 該區域通過陰影來標識。氨基酸257-261代表由用于構建編碼融合蛋白的核酸分子的多克 隆位點編碼的氨基酸。蛋白質的IgG-Fc部分始于氨基酸262。
[0015] 圖2代表具有4個通過下劃線標識的T細胞表位的g3p-hIgGl-FC融合蛋白(SEQ ID NO:2)的替代實施方案的氨基酸序列。已通過刪除對應于SEQ ID NO: 1的氨基酸258至259的 氨基酸來消除第五T細胞表位。
[0016] 圖3顯示具有3個通過粗體和下劃線標識的T細胞表位的g3p-hIgGl-Fc融合蛋白 (SEQ ID勵:3)的另一個替代實施方案的氨基酸序列。已通過¥2154和622(^的取代(相較于 SEQ ID NO: 1)消除了第四T細胞表位,以及已通過刪除對應于SEQ ID NO: 1的氨基酸258和 259的氨基酸消除了第五T細胞表位。
[0017] 圖4A顯示編碼具有N末端哺乳動物信號序列的SEQ ID N0:1的g3p-hIgGl-FC融合 蛋白的DNA序列(SEQ ID NO:4)。圖4B顯示編碼具有N末端哺乳動物信號序列的SEQ ID NO:2 的g3p-hIgGl-Fc融合蛋白的DNA序列(SEQ ID N0:5)。
[0018] 圖5顯示編碼具有N末端哺乳動物信號序列的SEQ ID N0:3的g3p-hIgGl-Fc融合蛋 白的DNA序列(SEQ ID NO:6)。
[0019] 圖6提供在實施例1中描述的研究中表達的供體同種異型的頻率的比較。
[0020] 圖7顯示具有3個通過粗體和下劃線標識的T細胞表位的g3p-hIgGl-Fc融合蛋白 (SEQ ID N0:7)的另一個替代實施方案的氨基酸序列。已通過V215G取代(如相較于SEQ ID NO: 1)消除第四T細胞表位。
[0021 ]圖8顯示編碼具有N末端哺乳動物信號序列的SEQ ID N0:7的g3p-hIgGl-Fc融合蛋 白的DNA序列(SEQ ID NO:8)。
[0022] 發明詳述
[0023]在本申請中,關于參照(未修飾的)氨基酸或核酸序列的術語"經修飾的"(及其同 源詞)是指含有一個或多個氨基酸取代或對應的密碼子取代的序列。修飾不一定需要參照 序列的物理操作。只要序列含有如相較于參照序列的此類取代,其就可被認為是"經修飾 的",無論其是如何合成的。術語"變體"是指已被修飾來相較于參照序列減小免疫原性的氨 基酸或核酸序列。如本文中所用,"變體g3p"或"變體N1-N2"是指這樣的氨基酸序列(或編碼 其的核酸序列),所述序列包含絲狀噬菌體g3p蛋白的N1-N2部分(例如,SEQ ID N0:1的氨基 酸1-217),或(b)結合和/或解聚淀粉樣蛋白的該氨基酸序列的突變體或片段(例如,SEQ ID N0:3的氨基酸1-217),其中所述氨基酸序列(或編碼其的核酸序列)已被修飾來相較于參照 (未修飾的)氨基酸序列減小免疫原性;以及其中所述修飾由選自表1、表2、表6或表7的任一 個中所示的氨基酸取代或對應取代的組的1至9個選自氨基酸取代組成。如本文中所用,術 語"對應取代"意指當將此類突變體或片段與SEQ ID NO: 1的氨基酸1-217比對時,對應于表 1、表2、表6或表7中的等同氨基酸取代的SEQ ID NO: 1的突變體或氨基酸1-217的片段中的 取代。
[0024]結合和/或解聚淀粉樣蛋白的SEQ ID NO: 1的氨基酸1-217的片段的實例包括,但 不限于,包含SEQ ID NO: 1的氨基酸1-67的任何片段。結合和/或解聚淀粉樣蛋白的SEQ ID N0:1的氨基酸1 -217的片段的突變體的實例包括,但不限于:(I)SEQ ID N0: 3的氨基酸1 -217; (2)在氨基酸43-45處具有AAA對VVV的取代的SEQ ID NO: 1的氨基酸1-217、SEQ ID NO: 3的氨基酸1-217或SEQ ID N0:7的氨基酸1-217; (3)具有取代C53W的SEQ ID NO: 1的氨基酸 1- 217、SEQ ID NO:3的氨基酸 1-217或SEQ ID NO:7的氨基酸 1-217; (4)具有氨基酸96-103 的缺失的SEQ ID N0:1的氨基酸1-217、SEQ ID N0:3的氨基酸1-217或SEQ ID N0:7的氨基 酸1-217; (5)在氨基酸212-214處具有AGA對QPP的取代的SEQ ID NO: 1的氨基酸1-217、SEQ IDN0:3的氨基酸1-217或SEQIDN0:7的氨基酸1-217;(6)具有取代W181A、F190A和F194A 的SEQ ID NO: 1的氨基酸1-217、SEQ ID NO: 3的氨基酸1-217或SEQ ID NO: 7的氨基酸1-217;(7)PCT/US2012/066793中公開的其它活性突變體和片段;(8)SEQIDN0:7的氨基酸1-217; (9)SEQ ID NO: 1 的氨基酸2-217、SEQ ID NO:3的氨基酸2-217或SEQ ID NO:7的氨基酸 2- 217;(10)SEQ ID N0:1 的氨基酸3-217、SEQ ID N0:3的氨基酸3-217或SEQ ID N0:7的氨 基酸3-217。
[0025]先前已顯示絲狀噬菌體g3p蛋白的N1-N2部分具有淀粉樣蛋白結合和解聚性質(參 見PCT/US2012/066793)。天然M13噬菌體的N1-N2部分由SEQ ID N0:1的氨基酸1-217代表。 相同的N1-N2氨基酸序列也存在于fd和Π 絲狀噬菌體中。應當理解,SEQ ID NO: 1的氨基酸 218-256也是天然g3p序列的部分并且通常被稱為將g3p的N2區連接至g3p(CT)的C末端的富 含甘氨酸的接頭,也稱為N3結構域。SEQ ID NO: 1的氨基酸257-261代表由用于構建編碼SEQ ID NO: 1的融合蛋白的核酸分子的多克隆位點編碼的氨基酸。
[0026] MX
[0027]因此,在一個實施方案中,本發明提供包含變體g3p或變體N1-N2的多肽。本發明的 更具體的實施方案提供了包含選自SEQ ID NO: 1的氨基酸1-217、SEQ ID NO: 3的氨基酸1-217和SEQ ID N0:7的氨基酸1-217的起始氨基酸序列的變體的多肽,其中:(a)所述多肽結 合和/或解聚淀粉樣蛋白;(b)所述多肽相較于包含起始氨基酸序列的對應多肽具有減小的 免疫原性;和(c)所述變體相較于所述起始氨基酸序列具有1至9個氨基酸取代,其中每一個 氨基酸取代選自表1和表2中所示的氨基酸取代的組。如本文中所用,術語"包含起始氨基酸 序列的對應多肽"意指除取代外具有與包含所述起始氨基酸序列的多肽相同的氨基酸序列 的多肽。
[0028]表1.針對SEQ ID N0:1、SEQ ID N0:2、SEQ ID N0:3或SEQ ID N0:7的氨基酸 1-217 的去免疫化氨基酸取代。
[0030]表2.針對SEQ ID N0:1、SEQ ID N0:2、SEQ ID N0:3或SEQ ID N0:7的氨基酸 1-217 的替代性或另外的去免疫化氨基酸取代。
[0032] *在表1和2中,每一個指定的氨基酸在SEQ ID NOS: 1、3和7中是相同的。
[0033]通過鑒定完全存在于N1-N2氨基酸序列內的T細胞表位來導出表1和2中所示的氨 基酸取代。這通過將N1-N2序列的不同重疊肽部分針對來自一個組群的最佳地代表HLA-DR 同種異型的世界人口的社區供血者的外周血單核細胞(PBMC)進行孵育以鑒定潛在T細胞表 位來進行。隨后將該信息經歷針對已知T細胞表位的數據庫的軟件分析以鑒定那些潛在表 位內的最佳氨基酸取代。這些方法詳細地描述于實施例中。
[0034] 在這些實施方案的一個方面,1-9個氨基酸取代選自表1中所示的那些氨基酸取 代。在上文所示的實施方案的更具體方面,所述多肽包含僅具有特定的單氨基酸取代的SEQ ID NO: 1的氨基酸1-217的變體或SEQ ID NO:3的氨基酸1-217的變體或SEQ ID NO:7的氨基 酸1 -217的變體,其中所述取代選自表3中所示的取代之一:
[0035] 表3.SEQ ID N0:1 的氨基酸 1-217、SEQ ID N0:3的氨基酸 1-217或SEQ ID N0:7的 氨基酸1-217中的特定去免疫化單氨基酸取代
[0037] 在一些實施方案中,多肽包含具有2-9個氨基酸取代的SEQ ID NO: 1的氨基酸1-217的變體或SEQ ID N0:3的氨基酸1-217的變體、或SEQ ID N0:7的氨基酸1-217的變體,其 中所述取代存在于表位1、2和3的至少兩個中,并且其中所述取代選自表1和2中所示的那些 表位。在更具體方面,SEQ ID NO: 1的氨基酸1-217的變體或SEQ ID N0:3的氨基酸1-217的 變體或SEQ ID N0:7的氨基酸1-217的變體中的至少2個取代選自表1中所示的那些取代。在 甚至更具體方面,所述多肽包含僅具有2個氨基酸取代的SEQ ID NO: 1或SEQ ID NO:3或SEQ ID NO: 7的變體,其中所述取代選自表4中所示的任何特定的二氨基酸取代:
[0038] 表4.SEQ ID N0:1 的氨基酸 1-217、SEQ ID N0:3的氨基酸 1-217或SEQ ID N0:7的 氨基酸1-217中的特定的去免疫化的二氨基酸取代:
[0041 ]在另一個實施方案中,所述多肽包含具有3-9個氨基酸取代的SEQ ID NO: 1的氨基 酸1-217的變體或SEQ ID N0:3的氨基酸1-217的變體、或SEQ ID N0:7的氨基酸1-217的變 體,其中至少一個氨基酸取代存在于表位1、2和3的每一個中,并且其中所述取代選自表1和 表2中所示的取代。在更具體方面,SEQ ID NO: 1的氨基酸1-217的變體或SEQ ID N0:3的氨 基酸1-217的變體或SEQ ID NO:7的氨基酸1-217的變體中的至少3個氨基酸取代選自表2中 所示的取代。在甚至更具體方面,包含SEQ ID NO: 1的氨基酸1-217的變體或SEQ ID NO:3的