專利名稱:具有增加的體內和/或體外穩定性的生物學活性蛋白的制作方法
具有增加的體內和/或體外穩定性的生物學活性蛋白本發明涉及包含至少兩個結構域的生物學活性蛋白,其中所述至少兩個結構域的第一結構域包含具有和/或介導所述生物學活性的氨基酸序列,所述至少兩個結構域的第 二結構域包含形成無規卷曲構象的由優選至少約100個氨基酸殘基構成的氨基酸序列,其 中所述無規卷曲構象介導了所述生物學活性蛋白增加的體內和/或體外穩定性。此外,還 公開了編碼本發明生物學活性蛋白的核酸分子以及包含所述核酸分子的載體和細胞。另 夕卜,本發明提供了包含本發明化合物的組合物以及本發明生物學活性蛋白、核酸分子、載體 和細胞的具體用途。常見的血漿蛋白如人血清白蛋白(HSA)和免疫球蛋白(Ig),包括人源化抗體,都 顯示出長半衰期,一般為2至3周,這可歸結于它們與新生兒Fc受體(FcRn)的特異相互 作用,而這導致內體循環(Ghetie (2002) Immunol Res, 25 :97_113)。相反,大多數從藥物學 角度受到關注的其它蛋白,尤其是重組抗體片段、激素、干擾素等,遭遇到快速(血液)清 除。對于大小低于約70kDa的腎過濾閾值的蛋白而言尤其如此(Caliceti (2003)Adv Drug Deliv Rev 55 :1261_1277)。這些情況下,未修飾藥物蛋白的血漿半衰期可能大大低于1小 時,因此使得其對于大多數治療應用而言基本上是無價值的。為了實現持續的藥理作用并 且改善患者順從性,將所需的給藥間隔延長至幾天或甚至幾星期,出于生物制藥學藥物開 發的目的之前已建立了幾種策略。首先,通過產生與Ig的Fc部分融合的或者與血清白蛋白融合的蛋白來利用天 然血漿蛋白的循環機制,例如Enbrel 為TNFα受體的胞外結構域與人IgGl的結合體 (Goldenberg (1999) Clin Ther 21 :75_87),而Albuferon .為 IFN α 與 HSA 的相應融合物 (Osborn (2002) J Pharmacol ExpTher 303 :540_548)。具有 600 μ M 的高血菜濃度的白蛋白 也以間接方式被利用,用作例如通過與來自鏈球菌蛋白G的細菌白蛋白結合結構域(ABD) 融合(Makrides (1996) J Pharmacol Exp Ther 277:534-542)或者與從噬菌體展示文庫 中針對 HSA 選擇的肽融合(Dennis (2002) J Biol Chem, 277 35035-35043 ;Nguyen (2006) Protein Eng Des Sel 19:291-297)而具備白蛋白結合功能的生物藥物的運載工具。其次,延長生物藥物的血漿半衰期的完全不同的方法為偶聯高度溶劑化的和生 理學上惰性的化學聚合物,由此有效地擴大治療蛋白的流體動力學半徑,超出約3-5nm 的腎小球孔徑(Caliceti (2003)上文引用)。在溫和的生物化學條件下,經由Lys側 鏈隨機地(Clark(1996) J Biol Chem271 :21969_21977)或通過特異引入的Cys殘基 (Rosendahl (2005)BioProcess International 52-60)與活化的聚乙二醇(PEG)衍生 物的共價偶聯已取得中等成功,目前用于幾種被批準的藥物。特別是在與具有特異藥 理學活性的小蛋白結合中已經獲得了相應的優勢,例如Pegasys ,一種PEG化的重組 IFN- α -2a(Harris(2003)Nat Rev Drug Discov,2 214~221 ;Walsh(2003)Nat Biotechnol 21 865-870)。但是,就生物藥物開發和生產而言,生物學活性蛋白與合成聚合物的化學偶聯可 能有缺點。適合的PEG衍生物昂貴,尤其是當需要高純度時,并且它們與重組蛋白的偶聯需 要額外的體外加工和純化步驟,這降低了產率且增加了生產成本。事實上,PEG經常被醛類和過氧化物類污染(Ray (1985) Anal Biochem 146 :307_312),并且在氧存在下儲存時易于 化學降解。另外,如果治療蛋白的生物化學活性位點附近的氨基酸側鏈被PEG化過程所修 飾,其藥物功能則可能被損害。此外,與合成聚合物的化學偶聯一般產生不均一的分子混合 物,它們可能在體內活性方面顯示出重大差異。第三,已提出了使用在其中引入了新的N連接糖基化共有序列的生物學活性蛋白 的糖基化類似物來延長血清半衰期;參見WO 02/02597 ;Perlman(2003) J Clin Endocrinol Metab 88 :2327_2335 ;或 Elliott (2003)NatBiotechnol 21:414-420)。但是,所述經糖基 化改造的蛋白表現出改變的體內活性,這表明新碳水化合物側鏈影響了工程化蛋白的生物 學活性。此外,該額外的碳水化合物側鏈很可能增加所得到的生物學活性分子的抗原性,這 又引起了重大的安全性問題。此外,據報道包含來源于枯氏錐蟲(Trypanosoma cruzi)的人工重復序列PSTAD 的融合蛋白誘使反式唾液酸酶的血漿半衰期延長(Alvarez (2004)PNAS 279 :3375_3381)。 然而,報道稱這種枯氏錐蟲衍生的重復序列引起了體液免疫應答(Alvarez (2004)上文引 用)。因此,需要延長生物學活性蛋白的作用的其它手段。本發明基本的技術問題是提供具有增加的體內和/或體外穩定性的生物學活性 蛋白。通過提供在權利要求書中表征的實施方案實現了對以上技術問題的解決。 因此,本發明涉及包含至少兩個結構域的生物學活性蛋白,其中(a)所述至少兩個結構域的第一結構域包含具有和/或介導所述生物學活性的氨 基酸序列,以及(b)所述至少兩個結構域的第二結構域包含形成無規卷曲構象的由優選至少約 100個氨基酸殘基構成的氨基酸序列。根據本發明,形成/采取無規卷曲構象的所述第二結構域能夠介導所述生物學活 性蛋白的體內和/或體外穩定性的增加。因此,所述第二結構域導致具有和/或介導指定 生物學活性的指定蛋白(或其片段)的體內和/或體外穩定性增加,如下文所定義的。如下文以及所附的實施例中所記載的,令人驚訝地發現,與未經修飾(即缺乏所 述無規卷曲結構域)的生物學活性蛋白相比,靜脈內給予的經修飾而包含無規卷曲結構域 /部分的生物學活性蛋白顯示出出乎意料的延長的血漿半衰期。用在本文時,術語“無規卷曲”指包括氨基酸聚合物在內的聚合物分子的任 何構象,其中形成所述聚合物結構的各個單體元件相對于鄰近單體元件基本上隨機地 定向,而仍與所述鄰近單體元件化學結合。具體來說,采取/具有/形成“無規卷曲構 象”的多肽或氨基酸聚合物基本上缺乏確定的二級和三級結構。多肽無規卷曲的性質 和它們的實驗鑒定方法為本領域技術人員所知,并在科學文獻中有描述(Cantor(1980) Biophysical Chemistry,2nd ed. ,W. H. Freeman and Company,New York ;Creighton(1993) Proteins-Structures and Molecular Properties,2nd ed. , W. H. Freeman and Company, New York ;Smith (1996) Fold Des 1 :R95_R106)。本發明的生物學活性蛋白包含在生理條件下采取/形成無規卷曲構象的結構域 (上文中定義為本發明生物學活性蛋白的所述“第二結構域”)。術語“生理條件”在本領 域中是已知的,指蛋白通常在其中采取它們的天然構象的那些條件。更具體地,術語“生理 條件”指生物物理參數,它們通常對于高等形式的生命(尤其是哺乳動物,最優選人)是有效的。術語“生理條件”可以指生物化學和生物物理參數,它們正常地存在于哺乳動物體內 (特別是體液內),尤其是人體內。所述“生理條件”可以指存在于健康身體內的相應參數 以及存在于患病的哺乳動物或人患者中的參數。例如,當所述哺乳動物或所述人發熱時,該 患病哺乳動物或人患者可以具有較高的、但仍為“生理”的溫度狀況。就蛋白采取它們的天 然構象/狀態的“生理條件”而言,最重要的參數為溫度(對人為37°C )、pH(對人血液為 7. 35-7. 45)、滲透壓(280-300mmol/kg H2O),如果需要,還有蛋白含量(66_85g/l血清)。然 而,本領域技術人員了解,在生理條件下,這些參數可以變動,例如溫度、PH、滲透壓和蛋白 含量在指定的體液或組織液,諸如血液、腦脊液、腹膜液和淋巴中可能不同(Klinke (2005) Physiologie, 5th ed. , Georg Thieme Verlag, Stuttgart)。在腦脊液中,例如滲透壓可以 為290mmol/kg H2O,蛋白濃度可以在0. 15g/l至0. 45g/l之間。在淋巴中,pH可以為約7. 4, 蛋白濃度可以在3g/l至5g/之間。當采用下文描述的方法在實驗條件下確定氨基酸聚合物/序列是否形成/采取無 規卷曲構象時,諸如溫度、pH、滲透壓和蛋白含量的生物物理參數可能與體內一般存在的生 理條件不同。1°C至42°C或優選4°C至25°C的溫度可以被認為是可用于在體外生理條件下 檢驗和/或確認蛋白的生物物理性能和生物學活性。幾種緩沖液,尤其是在實驗情景中(例如在確定蛋白結構中,特別是在使得本 領域技術人員能確定一段蛋白/氨基酸的結構特性的圓二色性(CD)測量以及其它方法 中)或在用于藥物組合物的緩沖液、溶劑和/或賦形劑中,被認為可以在體外代表“生理溶 液”/“生理條件”。這類緩沖液的實例有例如磷酸鹽緩沖鹽水(PBS :115mM NaCl,4mM KH2PO4, 16mMNa2HP04pH 7. 4)、Tris緩沖液、醋酸鹽緩沖液、檸檬酸緩沖液或諸如那些用在所附實施 例中的類似緩沖液。一般地,代表“生理溶液條件”的緩沖液的pH應位于6. 5至8. 5的范 圍、優選7. O至8. O的范圍、且最優選7. 2至7. 7的范圍內,滲透壓應位于10至lOOOmmol/ kg H2O的范圍、更優選50至500mmol/kg H2O的范圍、且最優選200至350mmol/kg H2O的范 圍內。任選地,代表生理溶液條件的緩沖液的蛋白含量可以位于0至100g/l的范圍內,忽 略具有生物學活性的蛋白本身,由此可以使用典型的穩定化蛋白,例如人或牛血清白蛋白。相應地,在本發明上下文中還設想,包含在以上定義的本發明生物學活性蛋白的 “第二結構域”中的無規卷曲構象在藥物組合物(如液體藥物)中得以保持。優選地,“生 理條件”要用于相應的緩沖系統、溶劑和/或賦形劑。然而,例如在凍干的或干燥的組合物 (例如藥物組合物)中,可以想像包含在本發明生物學活性蛋白的“第二結構域”中的無規 卷曲構象暫時不存在和/或不能被檢測到。但是,根據本發明的蛋白構建體,所述“第二結 構域”在相應的緩沖液/溶液/賦形劑/溶劑中重建后將重新采取/形成其無規卷曲。例 如,當本發明的蛋白構建體被凍干或干燥時(例如,處于藥物組合物的形式)就是這樣。在 包含如本文所定義的“第一”和“第二”結構域的這種凍干/干燥的本發明蛋白構建體重建 后,無規卷曲部分/結構域再次存在,并且相應的本發明構建體可例如給予需要醫療干預 的哺乳動物或人患者。如上文所提及的,本發明的生物學活性蛋白包含生理條件時/生理條件下采取/ 形成無規卷曲構象的結構域(上文定義為本發明生物學活性蛋白的所述“第二結構域”)。與本發明的生物學活性蛋白相反,變性蛋白為喪失了它們的功能性構象的蛋白, 并且因為所述變性而部分地采取無規卷曲構象。可通過各種手段使蛋白變性,包括暴露于非生理溫度、PH和/或鹽濃度,或暴露于變性劑如脲/鹽酸胍和去垢劑。因此,當在生理條 件下研究蛋白時應避免存在有已知對蛋白有變性作用的化合物,如脲、鹽酸胍或十二烷基 磺酸鈉。當研究蛋白生理條件下在人血液或尿中的應用時,分別可以忍耐至多lOmmol/1或 甚至300mmol/l的脲。與變性多肽相反,本發明蛋白構建體中包含的無規卷曲結構域(所述“第二結構 域”)的氨基酸序列天然地采取/具有無規卷曲構象,尤其是在體內以及當給予需要醫療干 預的哺乳動物或人患者時。因此,可以想像本發明的蛋白構建體(包含以上定義的“第一” 和“第二結構域”)可以包含本文鑒定的丙氨酸、絲氨酸和脯氨酸段(或在生理條件下形成 /具有/采取無規卷曲的其它氨基酸段)形式的“第二”形成/采取無規卷曲的結構域,但 是可以(例如,處于特定的組合物形式,如凍干或干燥組合物)暫時或臨時不為無規卷曲形 式。然而,重要的是,例如在相應的緩沖液(優選“生理”緩沖液/賦形劑和/或溶劑)中 重建后,本發明蛋白構建體的“第二結構域”重新采取本文所定義的無規卷曲。所述“第二 結構域”(在相應的重建后)能夠介導本發明生物學活性蛋白的增加的體內和/或體外穩 定性。本發明的生物學活性蛋白與不包含額外的這里定義的“第二結構域”的相同“目的蛋 白” / “第一結構域”相比具有更長的體內和/或體外半衰期和穩定性。用在本文時,術語“結構域”指能夠自主地采取特異結構和/或功能的任何氨基酸 序列區域/部分。相應地,在本發明上下文中,“結構域”可以代表功能性結構域或結構性結 構域。如本文所述,本發明的蛋白包含至少一個具有和/或介導生物學活性的結構域/部 分以及至少一個形成無規卷曲構象的結構域/部分。然而,本發明的蛋白還可以由兩個以 上的結構域組成,并且在本文所定義的兩結構域/部分之間可以包含例如其它連接分子結 構或另一結構域/部分,如蛋白酶敏感的切割位點、諸如His6標簽或Strep標簽的親和標 簽、信號肽、保留肽(retention ρ印tide)、靶向肽如膜轉位肽,或其它的效應子結構域,如 與抗腫瘤毒素結合的用于腫瘤靶向的抗體片段或者用于前藥活化的酶等。確定氨基酸聚合物是否形成/采取無規卷曲構象的方法在本領域是已知的 (Cantor (1980)上文引用;Creighton (1993)上文引用;Smith (1996)上述引文)。這類方法 包括如下文舉例說明的圓二色性(CD)光譜法。CD光譜法代表了光吸收光譜法,其中測量物 質吸收右和左旋圓偏振光的差異。可采用波長在約190和250nm之間的遠紫外光譜通過CD 光譜法確定蛋白的二級結構。在這些波長,由于α-螺旋、平行和反平行β-折疊以及無規 卷曲構象各自產生特征性形狀和數值的CD光譜,可以分析多肽中常見的不同二級結構。因 此,通過⑶光譜測定法,技術人員能夠容易地確定氨基酸聚合物是否在生理條件下形成/ 采取無規卷曲構象。其它成熟的生物物理方法包括核磁共振(NMR)光譜法、吸收光譜測定 法、紅外和拉曼光譜測定法、通過大小排阻層析法測量流體力學體積、分析超速離心或動態 /靜態光散射,以及測量摩擦系數或特性粘度(Cantor (1980)上文引用;Creighton(1993) 上文引用;Smith (1996)上文引用)。在另一實施方案中,通過分析凝膠過濾(也稱為大小排阻層析,SEC)確定,本發 明的生物學活性蛋白具有至少70kDa、優選至少80kDa、更優選至少90kDa、甚至更優選至少 lOOkDa、特別優選至少125kDa以及最優選至少150kDa的流體力學體積。本領域技術人員 能夠容易地確定特定蛋白的流體力學體積。這類方法可以包括如下文舉例說明的動態/靜 態光散射、分析超速離心或分析凝膠過濾。分析凝膠過濾代表了本領域中測量高分子的流
7體力學體積的已知方法。可選擇地,球狀多肽的流體力學體積可通過其分子量估計。但是, 如下文所述,與根據分子量估計的相應折疊、球狀蛋白的流體力學體積相比,包含以上定義 的第二結構域(即包含至少100個氨基酸殘基且具有無規卷曲構象的結構域)的本發明蛋 白的流體力學體積具有出人意料的高流體力學體積。除了上述方法,還描述了預測蛋白中二級結構的理論方法。這種理論方法的一個 ^J Chou-Fasman ^ (Chou and Fasman (1974) Biochemistry 13 222-245),
以X射線晶體學解析的已知蛋白結構中每種氨基酸在α-螺旋、β-折疊以及轉角中的相 對頻率的分析。但是,蛋白二級結構的理論預測已知是不可信的。如下文舉例說明的,根據 Chou-Fasman法預期采取α-螺旋二級結構的氨基酸序列被發現形成了無規卷曲。因此,諸 如Chou-Fasman算法的理論方法對于指定氨基酸聚合物是否采取無規卷曲構象僅具有有 限的預測價值。在一個實施方案中,采取/具有/形成無規卷曲構象的氨基酸序列由至少約100 個氨基酸殘基、優選至少約150個氨基酸殘基、更優選至少約200個氨基酸殘基、甚至更優 選至少約250個氨基酸殘基、特別優選至少約300個氨基酸殘基、更特別優選至少約350個 氨基酸殘基、以及最優選至少約400個氨基酸殘基組成。在另一實施方案中,形成無規卷曲 構象的氨基酸序列由最多約1000個氨基酸殘基、優選最多約900個氨基酸殘基、更優選最 多約800個氨基酸殘基、甚至更優選最多約700個氨基酸殘基、尤其優選最多約600個氨基 酸殘基組成。因此,形成無規卷曲構象的氨基酸序列可以由最多約500個氨基酸殘基或最 多約450個氨基酸殘基組成。這里還設想形成無規卷曲構象的氨基酸序列可以由最多約 1200個、約1500個以及至多約3000個氨基酸殘基組成。因此,形成無規卷曲構象的氨基酸 序列可以由約100個至約3000個氨基酸殘基組成。在具體實施方案中,所述形成無規卷曲 構象的氨基酸序列由約100個至1000個本文描述的氨基酸殘基組成,即如下定義的包含丙 氨酸、絲氨酸和脯氨酸作為主要或唯一的殘基種類。因此,本發明的關鍵在于提供在生理條 件下形成無規卷曲構象并主要由這三種氨基酸殘基組成的氨基酸聚合物,其中脯氨酸殘基 占該無規卷曲形成結構域的優選約4%至約40%。丙氨酸和絲氨酸殘基構成所述無規卷曲 形成結構域的剩余至少60%至96%。但是,如下文詳述的,所述無規卷曲形成結構域還可 以包含不同于丙氨酸、絲氨酸和脯氨酸的其它氨基酸,即作為次要成分。用語“至少約100/150/200/250/300/300/350 (等)個氨基酸殘基”并不限于所述 確切數量的氨基酸殘基,而是還包含含有增加10%至20%殘基或含有減少10%至20%殘 基的氨基酸段。例如“至少約100個氨基酸殘基”也可以包含80至100個以及約100至120 個氨基酸殘基,而不脫離本發明的要點。優選地,本發明生物學活性蛋白/多肽的“第二結 構域”包含最長約1000個氨基酸殘基。但是,在本發明上下文中還設想了更長的“第二結構 域”,即“第二結構域”在生理條件下提供所期望的無規卷曲構象并包含至多約3000個氨基 酸殘基。還有,本文中用語“約”不限于或約束至確定量的氨基酸殘基,而是還包含+/_約 10%或+/-約20%,而不脫離本發明。在本發明上下文中,令人驚訝地發現,主要由丙氨酸和絲氨酸殘基組成的氨基酸 聚合物,或者在優選的實施方案中主要由丙氨酸、絲氨酸和脯氨酸殘基組成的氨基酸聚合 物在生理條件下形成無規卷曲構象。因此,本發明提供了由丙氨酸、絲氨酸和脯氨酸組成的 模塊/序列單元/聚合物重復/聚合物盒/構建板塊,其可用作本文定義的生物學活性蛋白/多肽的“第二結構域”的一個或多個部分。然而,技術人員了解,當不同于丙氨酸、絲氨 酸和脯氨酸的其它殘基作為次要成分包含進所述“第二結構域”中時,氨基酸聚合物也可以 形成無規卷曲構象。用在本文時,用語“次要組分”指最多10%,S卩100個氨基酸中最多10 個氨基酸可以不同于丙氨酸、絲氨酸和脯氨酸;優選最多8%,即100個氨基酸中最多8個 氨基酸可以不同于丙氨酸、絲氨酸和脯氨酸;更優選最多6%,即100個氨基酸中最多6個 氨基酸可以不同于丙氨酸、絲氨酸和脯氨酸;甚至更優選最多5%,即100個氨基酸中最多5 個氨基酸可以不同于丙氨酸、絲氨酸和脯氨酸;特別優選最多4%,即100個氨基酸中最多4 個氨基酸可以不同于丙氨酸、絲氨酸和脯氨酸;更特別優選最多3%,即100個氨基酸中最 多3個氨基酸可以不同于丙氨酸、絲氨酸和脯氨酸;甚至更特別優選最多2%,即100個氨 基酸中最多2個氨基酸可以不同于丙氨酸、絲氨酸和脯氨酸;以及最優選最多1%,即編碼 該無規卷曲形成結構域的100個氨基酸中最多1個氨基酸可以不同于丙氨酸、絲氨酸和脯 氨酸。所述不同于丙氨酸、絲氨酸和脯氨酸的氨基酸可以選自Arg、Asn、ASp、CyS、Gln、Glu、 Gly、His、lie、Leu、Lys、Met、Phe、Thr、Trp、Tyr 禾口 Val。令人驚訝地發現,本文描述的并根據本發明由丙氨酸、絲氨酸和脯氨酸種類組成 的氨基酸聚合物在生理條件下采取無規卷曲構象。因此,它們為提供這里定義的發明所述 生物學活性蛋白/多肽的“第二結構域”的有利分子,即在生理條件下形成無規卷曲構象并 由此介導生物學活性(功能性)蛋白或多肽增加的體內和/或體外穩定性的多肽段。與 所述無規卷曲結構域融合的功能性蛋白的流體力學體積顯著增加,這可通過采用本文提到 的標準方法來評估,并且也在所附實施例中有闡述。因為該無規卷曲結構域自身被認為不 會采取穩定結構或功能,所以與其融合的目的功能性蛋白所介導的生物學活性基本上保持 了。此外,本文所公開的形成無規卷曲結構域的氨基酸聚合物被認為是生物學惰性的,尤其 是就它們在血漿中的蛋白水解、免疫原性、等電點/靜電行為、結合細胞表面受體以及內化 而言,但是仍然是可生物降解的,這相對于諸如PEG的合成聚合物提供了明顯的優勢。在另一實施方案中,在生理條件下采取無規卷曲構象的氨基酸聚合物包含多個 “氨基酸重復” / “氨基酸盒” / “盒式重復”,其中所述“氨基酸重復” / “氨基酸盒” / “盒式 重復”由Ala、Ser和Pro殘基組成(本文中描述為“PAS”或“APS”),其中至多6個連續氨 基酸殘基相同,且所述脯氨酸殘基構成形成無規卷曲的所述第二結構域氨基酸的4%以上 和40%以下。在生理條件下采取無規卷曲構象的氨基酸聚合物可以包含多個相同氨基酸 重復/盒式重復或多個不同氨基酸重復。下文提供了由Ala、Ser和Pro殘基組成的“氨基 酸重復”、“構件”、“模塊”、“氨基酸盒”等的非限定性實例;參見SEQ ID N0:18、SEQ ID NO 20,SEQ ID NO 22,SEQ ID NO 24、SEQ ID NO :26 禾口 SEQ ID NO :28 或這些序列的片段或多 聚體。“片段”包含至少3個氨基酸且包含至少一個丙氨酸、一個絲氨酸和/或一個脯氨酸。根據本發明,氨基酸重復可以由至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、 18、19、20、21、22、23、24、25、26、27、28、29、30或更多個氨基酸殘基組成,其中每一重復都包 含Ala、Ser和Pro殘基。在一個實施方案中,根據本發明,所述氨基酸重復包含不超過100 個氨基酸殘基。優選地,本文中定義的氨基酸重復/盒式重復包含約4%以上、優選約5%以 上、甚至更優選約6%以上、特別優選約8%以上、更特別優選約10%以上、甚至更特別優選 約15%以上以及最優選約20%以上的脯氨酸殘基。本文定義的這種氨基酸重復/盒式重 復優選包含約40%以下或約35%以下的脯氨酸殘基;還可以參見下文提供的PAS構建體。
在另一實施方案中,在生理條件下形成無規卷曲構象的氨基酸聚合物具有通式 ⑴SerJAlay SerJn其中根據式(I)的所述氨基酸聚合物如本文定義還包含脯氨酸殘基,其中χ獨立 地選自0至6的整數。另外,對于每一 n,y都獨立地選自1至6的整數,每一 ζ都獨立地選 自1至6的整數。最后,η為使得所述第二結構域由至少約100個氨基酸殘基組成的任何整 數,尤其是由至少約100至約3000個氨基酸殘基、優選至約2000個并更優選至約1000個 氨基酸殘基組成的任何整數。在優選的實施方案中,包含以上定義的“氨基酸重復”/ “氨基酸盒”/ “盒式重復” 并形成無規卷曲構象的氨基酸聚合物包含至多5個相同的連續氨基酸殘基、更優選至多4 個相同的連續氨基酸殘基并最優選最多3個相同的連續氨基酸殘基。如上文已經說明的,形成無規卷曲構象的本發明氨基酸聚合物包含脯氨酸殘基, 其中所述脯氨酸殘基占組成無規卷曲形成結構域的氨基酸的約4%以上,優選約5%以上, 甚至更優選約6%以上,特別優選約8%以上,更特別優選約10%以上,甚至更特別優選約 15%以上以及最優選約20%以上。形成無規卷曲構象的這種本發明氨基酸聚合物優選占組 成無規卷曲形成結構域的氨基酸的約40%以下,或約35%以下。如所附實施例13中所顯 示的,具有較小比例Pro殘基的PAS#1P2聚合物在其⑶光譜中200nm附近顯示了較不明顯 的最小值,表明本發明氨基酸聚合物的無規卷曲特征依賴于脯氨酸殘基的含量。在另一優選實施方案中,包含以上定義的“氨基酸重復” / “氨基酸盒” / “盒式重 復”并形成無規卷曲構象的氨基酸聚合物在組成該無規卷曲形成結構域的氨基酸中包含約 4%以上但約50%以下、優選約10%以上但約50%以下且最優選約20%以上但約50%以下 的丙氨酸殘基。在另一優選的實施方案中,包含以上定義的“氨基酸重復” / “氨基酸盒” / “盒式 重復”并形成無規卷曲構象的氨基酸聚合物在組成該無規卷曲形成結構域的氨基酸中包含 約4%以上但約50%以下、優選約10%以上但約50%以下且最優選約20%以上但約50% 以下的絲氨酸殘基。因此,形成無規卷曲構象的氨基酸聚合物可以在組成該無規卷曲形成結構域的氨 基酸中包含約35%脯氨酸殘基、約50%丙氨酸殘基和約15%絲氨酸殘基。或者,形成無規 卷曲構象的氨基酸聚合物可以在組成該無規卷曲形成結構域的氨基酸中包含約35%脯氨 酸殘基、約15%丙氨酸殘基和約50%絲氨酸殘基。用在本文時,用語“約”還指給定百分比 的精確值。本文還描述了包含選自下述氨基酸序列的氨基酸聚合物 AAAASSASSASSSSSAAASA(piSA ;SEQ ID NO 2)AASAAASSAAASAAAASASS (SEQ ID NO: 4),ASASASASASASSAASAASA(SEQ ID NO :6),SAASSSASSSSAASSASAAA (SEQ ID NO 8), SSSSAASAASAAAAASSSAS(SEQ ID NO 10),SSASSSAASSSASSSSASAA(SEQ ID NO: 12), SASASASASASAASSASSAS (SEQ ID NO 14)和 ASSAAASAAAASSAASASSS (SEQ ID NO: 16)。如果 如上文所定義,在所得到的氨基酸序列中還包含脯氨酸殘基,則所述丙氨酸_絲氨酸模塊/ 序列單元的多聚體可以形成無規卷曲構象。這些示例性模塊/序列單元可以由包含以下序 列的核酸分子編碼
GCCGCTGCTGCATCCTCTGCAAGCTCCGCTTCTTCCTCTAGCTCCGCAGCTGCATCTGCT (SEQ ID NO 1),GCTGCTTCCGCTGCTGCTTCCTCCGCTGCTGCTTCCGCTGCTGCTGCTTCCGCTTCCTCC(SEQ ID NO 3),GCTTCCGCTTCCGCTTCCGCTTCCGCTTCCGCTTCCTCCGCTGCTTCCGCTGCTTCCGCT(SEQIDN0 5),TCCGCTGCTTCCTCCTCCGCTTCCTCCTCCTCCGCTGCTTCCTCCGCTTCCGCTGCTGCT(SEQ ID NO 7),TCCTCCTCCTCCGCTGCTTCCGCTGCTTCCGCTGCTGCTGCTGCTTCCTCCTCCGCTTCC(SEQ ID NO 9),TCCTCCGCTTCCTCCTCCGCTGCTTCCTCCTCCGCTTCCTCCTCCTCCGCTTCCGCTGCT(SEQ ID NO 11),TCCGCTTCCGCTTCCGCTTCCGCTTCCGCTTCCGCTGCTTCCTCCGCTTCCTCCGCTTCC(SEQ ID NO: 13)以及GCTTCCTCCGCTGCTGCTTCCGCTGCTGCTGCTTCCTCCGCTGCTTCCGCTTCCTCCTCC(SEQ ID NO :15)。在優選的實施方案中,形成無規卷曲構象的氨基酸聚合物包含選自下述的氨基 酸序列ASPAAPAPASPAAPAPSAPA(PAS#1 ;SEQ ID NO 18), AAPASPAPAAPSAPAPAAPS(PAS#2 ; SEQ ID NO: 20),SAPSSPSPSAPSSPSPASPS (修飾的 PAS#3 ;修飾的 SEQ ID NO 22), APSSPSPSAPSSPSPASPSS (PAS#3,SEQ ID No. 22,未修飾的)。在備選方案中,稍稍改動, 但依然有活性的PAS#3可以具有以上列出的序列SAPSSPSPSAPSSPSPASPS (SEQ ID NO 63)。該序列對應這里提供的SEQID No. 22的循環重排列的形式,其中最后的絲氨酸被 移除,添加了另一絲氨酸作為起始氨基酸。結果,本發明的這一修飾的序列的多聚體具 有與未改動序列的多聚體基本上相同的內部重復單元,除了第一個和最后一個殘基。因 此,這種修飾的PAS#3(SEQ ID NO :63)可以被認為是文中提供的本發明氨基酸聚合物的 另外的“模塊” / “構件”的實例。本領域技術人員清楚的是,這里提供的氨基酸聚合物的 其它“模塊”和(較短)片段或循環重排列的形式也可以用作提供的生物學活性蛋白的 文中定義的“第二結構域”的“模塊”、“重復”和/或構件。然而,形成無規卷曲構象的其 它和闡述性氨基酸聚合物可以包含選自SSPSAPSPSSPASPSPSSPA(PAS#4 ;SEQ ID NO 24), AASPAAPSAPPAAASPAAPSAPPA(PAS#5 ; SEQ ID NO 26)和 ASAAAPAAASAAASAPSAAA(PAS#1P2 ; SEQ ID NO 28)的氨基酸序列。還有,這些序列和上文提供的序列的片段或多聚體或循環 重排列形式在本發明情境中可以作為本發明生物學活性蛋白/多肽的文中定義的“第二結 構域”的構件。本領域技術人員能夠容易地生成在生理條件下形成無規卷曲構象并如本文 所定義主要由丙氨酸、絲氨酸和脯氨酸構成的其它氨基酸聚合物。可用作本發明生物學活 性蛋白/多肽的本文定義“第二結構域”的構件的無規構象形成氨基酸聚合物的這類其它 和進一步的實例可以包含以上顯示的具體“構件”、“聚合物盒”或“聚合物重復”的組合和/ 或片段或循環重排列形式,等等。因此,所述無規卷曲結構域的示例性模塊/序列單元/聚 合物重復/聚合物盒也可以提供單獨片段,所述單獨片段可以重組組合以形成本發明的其 它模塊/序列單元/聚合物重復/聚合物盒。術語“模塊”、“序列單元”、“聚合物重復”、“聚合物盒”和“構件”在本文中作為同 義詞使用,指可以用于形成本發明生物學活性蛋白/多肽的本文定義的“第二結構域”的各 氨基酸段。所述第二結構域包含由至少約100個氨基酸殘基組成并在生理條件下形成無規 卷曲構象的氨基酸序列。以上舉例說明的本發明生物學活性蛋白/多肽的無規卷曲結構域(即所述生物學 活性蛋白/多肽的本文定義的“第二結構域”)的模塊/序列單元/聚合物重復/聚合物盒 /構件可以由包含以下序列的核酸分子編碼
11
GCCTCTCCAGCTGCACCTGCTCCAGCAAGCCCTGCTGCACCAGCTCCGTCTGCTCCTGCT(SEQ ID NO 17),GCTGCTCCGGCTTCCCCGGCTCCGGCTGCTCCGTCCGCTCCGGCTCCGGCTGCTCCGTCC(SEQ ID NO 19),GCTC0GTCCTCCC0GTCCC0GTC0GCTC0GTCCTCCC0GTCCC0GGCTTCCC0GTCC-TCC(SEQ ID NO 21),TCCTCCCCGTCCGCTCCGTCCCCGTCCTCCCCGGCTTCCCCGTCCCCGTCCTCCCCGGCT(SEQ ID NO 23),GCCGCTTCTCCAGCAGCTCCTTCTGCTCCACCAGCAGCTGCAAGCCCTGCTGCACCAAGCGCACCTCCT GCT(SEQ ID NO 25)和 / 或 GCCTCTGCTGCAGCACCTGCAGCAGCAAGCGCAGCTGCATCTGCTCCATCTGC AGCTGCT(SEQ ID NO 27)。如上文描述的經修飾的PAS#3 GfWWSEQ ID NO 22)可以由以下核酸序列編碼 TCCGCTCCGTCCTCCCCGTCCCCGTCCGCTCCGTCCTCCCCGTCCCCGGCTTCCCCGTCC GfWWSEQ ID NO 21)。對本發明而言值得注意且非限定性的是,按照技術人員的理解,根據簡并性遺傳 密碼,即不同的核苷酸三聯體密碼子可以編碼相同的氨基酸殘基,這里描述并舉例說明的 無規卷曲結構域的模塊/序列單元/聚合物重復/聚合物盒/構件(或其片段或多聚體或 其循環重排列形式)可以由不同核酸序列編碼。另外,取決于本發明核苷酸序列盒的設計 和用于獲得其多聚體的連接策略,末端殘基可以不同。例如,SEQ ID NO :18和30中顯示的 “模塊”PAS#1可以分別由核酸序列SEQ ID NO 17和29編碼。與SEQ ID NO 18不同,SEQ ID NO :30在C末端包含了額外的丙氨酸,如果各個核苷酸序列盒如所附實施例中所描述的 通過粘末端連接則其密碼子可以刪除。根據上文,形成無規卷曲構象的氨基酸聚合物可以包含由具有上文公開的SEQ ID NO :18、20、22、24、26或28的氨基酸序列中任一種組成的多聚體,或者包含由氨基酸序列 SEQ ID N0:18、20、22、24、26和28中的一種以上組成的多聚體。另外,也設想了這些示例 性序列的片段或循環重排列形式用于構建本發明生物學活性蛋白/多肽的無規卷曲結構 域(“第二結構域”)的其它模塊/序列單元/聚合物重復/聚合物盒/構件。在另一實施方案中,形成無規卷曲構象的氨基酸聚合物可以包含由選自 ASPAAPAPASPAAPAPSAPA (SEQ ID NO 18)、AAPASPAPAAPSAPAPAAPS(SEQ ID NO :20)、 APSSPSPSAPSSPSPASPSS (SEQ ID NO :22 或作為修飾的序列 S-APSSPSPSAPSSPSPASPS (SEQ ID NO :63)、SSPSAPSPSSPASPSPSSPA(SEQ ID NO :24)、AASPAAPSAPPAAASPAAPSAPPA(SEQ ID NO: 26)和ASAAAPAAASAAASAPSAAA(SEQ ID NO 28)的氨基酸序列的(循環)重排列組成的多 聚體,或者這些(循環)重排列序列的多聚體。在另一實施方案中,形成無規卷曲構象的氨基酸聚合物可以包含由選自 ASPAAPAPASPAAPAPSAPA(SEQ ID NO 18)、AAPASPAPAAPSAPAPAAPS(SEQ ID NO :20)、 APSSPSPSAPSSPSPASPSS (SEQ ID NO 22 ;或作為修飾的序列 S-APSSPSPSAPSSPSPASPS ((SEQ ID NO :63))、SSPSAPSPSSPASPSPSSPA(SEQ ID NO :24)、AASPAAPSAPPAAASPAAPSAPPA(SEQ ID NO 26)和ASAAAPAAASAAASAPSAAA(SEQ ID NO 28)的氨基酸序列的片段/部分組成的多聚 體,或者這些示例性模塊/序列單元/聚合物重復/聚合物盒/建筑模塊的多聚體。根據 本發明所使用的用于生成本發明生物學活性蛋白/多肽的“第二結構域”的這些序列的“片 段”可以由選自所述SEQ IDNOs :18、20、22、24、26和28的氨基酸序列中至少3個、優選至 少4個、更優選至少5個、甚至更優選至少6個、還更優選至少8個、特別優選至少10個、更 特別優選至少12個、甚至更特別優選至少14個、還更特別優選至少16個、以及最優選至少18個連續氨基酸組成。如上文所提及的,文中提供的無規卷曲結構域的模塊/序列單元/構件等僅為在 生理條件下形成無規卷曲構象的本發明氨基酸聚合物的實例。根據本發明的要點,這些“模 塊”、“序列單元”和/或“重復”包含以上確認的丙氨酸、絲氨酸和脯氨酸含量/份額。因 此,普通技術人員能夠生成其它的這種本發明“模塊”、“序列單元”和/或“重復”。例如,這 里確認的本發明“模塊”、“序列單元”和/或“重復”的各個片段可以組合成其它的各個“模 塊”、“序列單元”和/或“重復”,只要遵守以上確認的關于丙氨酸、絲氨酸和脯氨酸的總體分 布和含量規則。另外,這些“模塊”、“序列單元”和/或“重復”也可以包含其它氨基酸殘基, 但是僅作為最少的或次要的組分(最多占各個“模塊”、“序列單元”和/或“重復”的10%, 優選最多2% )。根據本發明,所述各個“模塊”、“序列單元”和/或“重復”由至少100個 氨基酸殘基組成。各個“模塊”、“序列單元”和/或“重復”可以組合以形成更長的無規卷 曲形成氨基酸聚合物,由此生物學活性蛋白的本文定義“第二結構域”的最大長度為約3000 個氨基酸。在本發明上下文中,生物學活性蛋白優選包含至少兩個結構域,其中所述至少兩 個結構域的上文定義第一結構域包含具有和/或介導所述生物學活性的氨基酸序列;本文 定義的所述至少兩個結構域的第二結構域包含由優選至少約100個氨基酸殘基組成并在 生理條件下形成無規卷曲構象的氨基酸序列。本文所定義并主要由丙氨酸、絲氨酸和脯氨 酸組成的所述無規卷曲構象介導了所述生物學活性蛋白的增加的體內和/或體外穩定性。 所述第二結構域可以由本文提供的各個“模塊”、“序列單元”和/或“重復”構成,或者可以 包含這些單獨的示例性“模塊”、“序列單元”和/或“重復”的片段或部分。但是,所述第二 結構域可以由其它單個“模塊”、“序列單元”、“構件”和/或“重復”構建,它們遵守和遵循本 文提供的教導,并且在以下的說明書和所附實施例中有舉例說明。例如,所附的實驗部分顯 示了充分證據,說明與未修飾的生物學活性蛋白相比,包含在生理條件下提供無規卷曲構 象的本文定義的額外“第二結構域”(例如由約200或約400或約600個氨基酸殘基組成并 包含 PAS#1/SEQ IDNO. 18、PAS#2/SEQ ID No. 20、PAS#3/SEQ ID N022、PAS#5/SEQ ID NO. 26 和/或PAS#1P2/SEQ ID NO 28作為“構件”的聚合物)的蛋白具有有利的血清穩定性或血 漿半衰期,甚至在體內也是如此。作為本發明的非限定性實例,將未修飾的IFNa2b的體內 穩定性與經修飾IFNa2b的體內穩定性進行比較,所述經修飾IFNa2b包含在生理條件下采 取無規卷曲構象的額外的本文定義“第二結構域”。大多數氨基酸,尤其是疏水氨基酸的同聚物,通常在水溶液中是不溶的 (Bamford(1956)Synthetic Polypeptides-Preparation, Structure, andProperties,2nd ed. ,Academic Press, New York)。幾種親水氨基酸的同聚物已知形成二級結構,例如對 于 Ala 為 α -螺旋(Shental-Bechor (2005) BiophysJ 88 2391-2402),對于 Ser 為 β -折 疊(Quadrifoglio (1968) J Am Chem Soc90 :2760_2765),而最堅硬的同聚寡肽聚脯氨酸 (Schimmel (1967)Proc NatlAcad Sci USA 58:52-59)則在水溶液中形成 II 型反式螺旋 (Cowan (1955) Nature 176:501-503)。采用聚合物生物物理學理論原則,例如對于聚甘氨酸,200個氨基酸殘基鏈 的無規卷曲直徑總計約75 a-計算為末端距離的平均均方根
權利要求
包含至少兩個結構域的生物學活性蛋白,其中(a)所述至少兩個結構域的第一結構域包含具有和/或介導所述生物學活性的氨基酸序列;以及(b)所述至少兩個結構域的第二結構域包含形成無規卷曲構象的優選由至少約100個氨基酸殘基組成的氨基酸序列,其中所述無規卷曲構象介導所述生物學活性蛋白體內和/或體外穩定性的增加。
2.如權利要求1所述的生物學活性蛋白,其中所述形成無規卷曲構象的第二結構域由 丙氨酸、絲氨酸和脯氨酸殘基組成。
3.如權利要求1或2所述的生物學活性蛋白,其中所述形成無規卷曲構象的第二結構 域包含多個氨基酸重復,其中所述重復由Ala、Ser和Pro殘基組成,并且不超過6個連續氨 基酸殘基是相同的。
4.如權利要求1至3中任一項所述的生物學活性蛋白,其中所述脯氨酸殘基占所述形 成無規卷曲構象的第二結構域的氨基酸的4%至40%。
5.如權利要求1至4中任一項所述的生物學活性蛋白,其中第二結構域包含選自下述 的氨基酸序列ASPAAPAPASPAAPAPSAPA(SEQ ID NO 18);AAPASPAPAAPSAPAPAAPS(SEQ ID NO 20);APSSPSPSAPSSPSPASPSS(SEQ ID NO 22),SAPSSPSPSAPSSPSPASPS(SEQ ID NO 63),SSPSAPSPSSPASPSPSSPA(SEQ ID NO 24),AASPAAPSAPPAAASPAAPSAPPA (SEQ ID NO 26)以及ASAAAPAAASAAASAPSAAA (SEQ ID NO :28),或者這些序列的整體或部分的循環重排列形 式或多聚體。
6.如權利要求1至5中任一項所述的生物學活性蛋白,其中所述至少兩個結構域的所 述第二結構域包含形成無規卷曲構象的由約100至3000個氨基酸殘基組成的氨基酸序列。
7.如權利要求1至6中任一項所述的生物學活性蛋白,其中所述具有生物學活性的多 肽選自結合分子、抗體片段、細胞因子、生長因子、激素或酶。
8.如權利要求7所述的生物學活性蛋白,其中所述結合分子選自抗體、Fab片段、 F(ab' )2片段、⑶R衍生的擬肽類、單鏈可變片段(scFv)、凝集素類和脂質運載蛋白類。
9.如權利要求1至8中任一項所述的生物學活性蛋白,其中所述具有生物學活性的多 肽選自粒細胞集落刺激因子、人生長激素、α -干擾素、β -干擾素、γ -干擾素、腫瘤壞死因 子、紅細胞生成素、凝血因子VIII、gpl20/gpl60、可溶性腫瘤壞死因子I和II受體、瑞替普 酶、exendin-4、阿那白滯素、白介素-2和嗜中性粒細胞明膠酶相關脂質運載蛋白。
10.如權利要求1至9中任一項所述的生物學活性蛋白,其中所述生物學活性蛋白的所 述增加的體內穩定性為,當與缺乏所述無規卷曲形成第二結構域的所述生物學活性蛋白相 比時,包含所述無規卷曲形成第二結構域的所述生物學活性蛋白的延長的血漿半衰期。
11.包含權利要求1至10中任一項所述的生物學活性蛋白的組合物。
12.如權利要求11所述的組合物,其為藥物組合物,任選地還包含藥物可接受的載體。
13.編碼權利要求1至10中任一項所述的生物學活性蛋白的核酸分子。
14.包含權利要求13的核酸的載體。
15.包含權利要求13所述的核酸或權利要求14所述的載體的細胞。
16.制備權利要求1至10中任一項所述的生物學活性蛋白的方法,包括培養權利要求 15所述的細胞并從培養物中分離所述生物學活性蛋白。
17.權利要求1至10中任一項所述的生物學活性蛋白、權利要求13所述的核酸、權利 要求14所述的載體或權利要求15所述的細胞在制備具有所述生物學活性蛋白的增加的體 內和/或體外穩定性的藥物中的用途,所述藥物用于治療激素缺陷相關病癥、自身免疫疾 病、癌癥、貧血癥、新生血管性疾病、感染/炎性疾病、血栓形成、心肌梗死、糖尿病和再灌注 損傷或其它腎病。
18.權利要求1至10中任一項所述的生物學活性蛋白、權利要求13所述的核酸、權利 要求14所述的載體或權利要求15所述的細胞作為具有所述生物學活性蛋白的增加的體內 和/或體外穩定性的藥物的用途。
19.試劑盒,其包含權利要求1至10中任一項所述的生物學活性蛋白、權利要求13所 述的核酸、權利要求14所述的載體或權利要求15所述的細胞。
全文摘要
本發明涉及包含至少兩個結構域的生物學活性蛋白,其中所述至少兩個結構域的第一結構域包含具有和/或介導所述生物學活性的氨基酸序列,所述至少兩個結構域的第二結構域包含形成無規卷曲構象的由優選至少約100個氨基酸殘基構成的氨基酸序列,其中所述無規卷曲構象介導了所述生物學活性蛋白增加的體內和/或體外穩定性。此外,還公開了編碼本發明生物學活性蛋白的核酸分子以及包含所述核酸分子的載體和細胞。另外,本發明提供了包含本發明化合物的組合物以及本發明生物學活性蛋白、核酸分子、載體和細胞的具體用途。
文檔編號C12N15/62GK101970678SQ200880019017
公開日2011年2月9日 申請日期2008年6月20日 優先權日2007年6月21日
發明者伊納·希奧伯德, 阿恩·斯科拉, 馬丁·斯拉珀斯其 申請人:慕尼黑科技大學