涉及核酸-蛋白質復合物的組合物和方法
【專利說明】潰及核酸-蛋白質復合物的組合物和方法
[0001] 相關申請
[0002] 本申請要求2013年7月10日提交的標題為乂OMPOSmONS AND MET冊DS RELATING TO NUCLEIC ACID-PROTEIN COMPLEXES"的美國臨時申請號61/844,818的權益,其完整內容 通過引用并入本文。
[0003] 聯邦政府資助的研究
[0004] 本發明是在美國國立衛生研究院授予的DC002281下由美國政府資助進行的。美國 政府具有本發明的某些權利。
[0005] 發明背景
[0006] DNA已成為所選擇的用于構建自組裝納米結構的支架。隨著用于運些結構的程序 圖形化的技術已取得進展,現在可能產生復雜的組裝體(Linko and Dietz, Curr. Opin. Biotechnol. 24: 555-561,2013)。為了利用運些結構元件并將它們制成功能性 納米機器,常常需要在非常特異的位點上滲入蛋白質(Niemeyer,化ends in Biotech 20: 395-401,2002)。遇到的阻礙是將目標蛋白質偶聯于DNA的成功方法。常規用于將蛋白質連 接于寡核巧酸(寡聚物)的化學過程包括二硫鍵聯和硫醇-伯胺鍵聯(Cecconi C.等, Eur.Bio地ys.J.37(6):729-38,2008);Halvorsen等,化notechnol.22:494005-494012, 2011;Niem巧er and Sacca,化em. Soc. Rev. 40: 5910-5921,2011)。雖然運些化學過程有時 是有效的,但它們與生物學中常見的官能團反應。因此當目標蛋白質具有內源半脫氨酸時 或當想要附接于特定的伯胺(除了N末端W外,每個賴氨酸提供伯胺)時,不能使用運些技 術。為了克服許多的運些問題,研究小組已著手開發生物正交技術諸如無銅點擊化學 (Gordon等,J. Am. Chem. Soc. 134:9199-9208,2012)。雖然運些技術克服了特異性和化學計 量的問題,但它們遭受面向所有巧巾技術的問題。所有運些技術需要在亞最佳的生理條件下 進行反應。由于長期處于室溫、氧化/還原條件或高/低pH條件下,當利用許多在運些條件下 不是非常熱穩定的并且具有聚集和/或從溶液沉淀出來的傾向的蛋白質進行作用時運些化 學過程開始失效。除了關于運些化學過程的障礙W外,必需針對不同的蛋白質謹慎地改變 條件,并且不存在選擇性純化出所需產物的方法。
[0007] 發明概述
[000引本公開內容部分地提供用于將核酸綴合于蛋白質的新型和穩健的方法,所述方法 克服了現有技術的缺點。運些方法前置待對核酸(包括寡核巧酸)和小(通常合成的)膚進行 的化學過程。運樣的核酸和膚對于可用于進行本公開內容中設及的某些化學過程的非生理 條件通常是更加耐受的。
[0009] 本公開內容提供了兩步法及其變型,其包括首先將核酸(例如,DNA)綴合于短的通 常合成的膚,W形成核酸-膚綴合物,隨后使用轉膚酶(例如,分選酶)反應將核酸-膚綴合物 綴合于目標蛋白質。兩步法的至少一個有利方面是將蛋白質與不利的反應環境分離的能 力,所述不利的反應環境可能降低所述蛋白質的活性。通過該兩步法,在第一步驟中使用運 些不利的反應條件,并在第二步驟中引入所述蛋白質。
[0010] 因此,在一些情況下,本公開內容的方法包括將核酸(諸如寡核巧酸)綴合于包含 一個或多個連續的N-末端甘氨酸(G)殘基的氨基酸序列。在一些實施方案中,氨基酸序列包 含3個連續的N末端甘氨酸殘基。氨基酸序列通常被包含在短膚(通常為合成膚)中。N-末端 GGG基序由本公開內容的方法中使用的分選酶識別。
[0011] 氨基酸序列還可包含可用于純化目的的額外氨基酸序列。運些氨基酸序列在本文 中可被稱為純化標簽或親和標記,并且包括但不限于化S-標簽和Flag序列(或Flag標簽), 其氨基酸序列在本領域中是已知的并且提供于本文中。
[0012] 寡核巧酸至膚的綴合可使用例如生物正交銅催化點擊化學反應來實現。待綴合于 膚的寡核巧酸可包含疊氮化物。疊氮化物可位于3'末端或5'末端,或者它可W是內部的疊 氮化物。待被綴合的膚可包含烘控,其用作互補點擊試劑。或者,所述膚可包含疊氮化物并 且所述寡核巧酸可包含烘控。應當理解,可使用其它綴合方法來實現核酸至膚的綴合。例 如,該第一步驟還可使用橫基班巧酷亞胺-4-(N-馬來酷亞胺甲基)環己燒-1-簇酸醋(SMCC) 將脫氨酸(膚中的)偶聯于胺官能化的寡核巧酸來實現。
[0013] 該第一反應步驟的所得產物是綴合于包含一個或多個(例如3個)甘氨酸殘基和任 選地純化標簽諸如(但不限于)Flag氨基酸序列的氨基酸序列(即,膚)的核酸(例如,寡核巧 酸)。偶聯于膚的核酸可W被移除(例如,與其它反應物分離)和任選地通過利用純化標簽從 反應混合物中純化。一種方法是使用珠粒諸如磁珠,或基于柱的珠漿體,其中的任一種包含 結合純化標簽的針對純化標簽的結合伴侶(例如,所述結合伴侶可W是特異于所述純化標 簽的抗體)。
[0014] 氨基酸序列還可含有額外的可切割序列。運樣的序列可在酶存在的情況下或通過 另一種機制被切割。運樣,將綴合的核酸與其它反應物分離后,可從綴合的核酸除去純化標 簽,只留下隨后可接近第二步驟中所使用的分選酶的一個或多個(例如3個)末端甘氨酸殘 基。在一些實施方案中,酶可切割的氨基酸序列可由煙草蝕紋病毒(TEV)蛋白酶切割。可由 TEV蛋白酶切割的氨基酸序列的實例是包含E化YFQ(SEQ ID N0:1)的氨基酸序列。或者,可 切割的序列可通過非酶促方法(例如,光)切割。可切割的序列通常位于純化標簽與一個或 多個(例如3個)甘氨酸殘基之間。
[0015] 在方法的第二步驟中,所得的綴合于一個或多個(例如,3個)末端甘氨酸殘基的核 酸隨后與目標蛋白質反應。目標蛋白質可天然地含有還是分選酶或另一種轉膚酶的祀序列 的氨基酸序列,或者可選擇地所述蛋白質可被工程化W含有運樣的氨基酸序列。運些氨基 酸序列在本文中可被稱為分選酶(或轉膚酶)祀序列。
[0016] 分選酶祀序列的一個實例為LPXTGX'n(SEQ ID N0:2),其中X和X'是獨立選擇的氨 基酸,并且η為大于0的任何數值或任何數值的范圍,包括例如1-90、1-99或I-IOOdX'。從而 意欲表示所述氨基酸序列可在一個末端含有任意數目的氨基酸殘基(即,η個數目的X'氨基 酸殘基,其中每個X'氨基酸殘基獨立地選自每個其它X'氨基酸殘基,其中η可W為1-100,或 1-99或1-90,或其間的任何數值)。一個運樣的序列為LPETGX'n(SEQ ID ^:3),其中乂'為氨 基酸并且η為大于0的任何數值或任何數值的范圍,包括例如1-90、1-99或1-100。術語"氨基 酸"和"氨基酸殘基"在本文中可互換使用。還應理解,X和X'可W是本文中所述的任何實施 方案中的任何氨基酸。如本文中所述,分選酶祀序列還可包含純化標簽。
[0017] 目標蛋白質與寡核巧酸-膚綴合物之間的反應在分選酶或另一種轉膚酶存在的情 況下發生。在一些實施方案中,所述分選酶為分選酶Α。在一些實施方案中,所述分選酶為分 選酶A的進化變體,諸如由化en等,PNAS 108:11399-11404,2011所描述的。術語"分選酶"和 "分選酶類"在本文中可互換使用。分選酶執行綴合于核酸(通過綴合的膚)的甘氨酸殘基與 存在于目標蛋白質中或綴合于目標蛋白質的分選酶祀序列中的甘氨酸殘基的換位。
[0018] 該第二反應的產物是通過氨基酸接頭綴合于目標蛋白質的核酸。所述氨基酸接頭 可具有LPXTGn(SEQ ID ^):17)的序列,其中11表示6殘基的數目并且是大于0的任何數值或 任何數值的范圍。在一些實施方案中,所述氨基酸接頭可具有LPXTGGG(SEQ ID N0:9)的序 列。在一些實施方案中,所述氨基酸接頭可具有LPETGn(SEQ ID N0:4)的序列,其中η表示G 殘基的數目并且是大于0的任何數值或任何數值的范圍。在一些實施方案中,所述接頭具有 口^了666(569 10^:5)的序列。
[0019] 隨后可使用例如珠粒或其它基于親和力的方法純化該最終的綴合產物。運樣的純 化可使得將核酸-蛋白質綴合物與其它反應組分諸如分選酶、TEV酶和/或在分選酶介導的 換位后從蛋白質釋放的任何氨基酸序列分離。此情形通過在分選酶介導的作用后純化標簽 的差異使用或存在來實現。例如,可將反應組分諸如分選酶、TEV酶和/或在分選酶介導的換 位后從目標蛋白質釋放的氨基酸序列綴合于純化標簽,并且該標簽可用于從最終的目標綴 合產物除去運些組分。在優選實施方案中,將待例如從終產物除去的所有組分綴合于相同 的純化標簽。適合的純化標簽包括化S-標簽(例如,6His殘基,(SEQ ID N0:6))或包含 DYKDD孤K(SEQ ID NO: 7)或由其組成的Flag氨基酸序列。運樣的純化步驟可用于使目標核 酸-蛋白質綴合物/復合物不含任何副產物和反應物。
[0020] 因此,在一個方面,本公開內容提供了方法,所述方法包括在分選酶存在的情況 下,將(1)綴合于包含一個或多個N末端甘氨酸(G)殘基的氨基酸序列的核酸(例如,DNA)與 (2)包含LPXTGX'n(其中X和X'是任意獨立選擇的氨基酸并且η為范圍1-99內的任何數值) (SEQ ID Ν0:8)的C末端氨基酸序列的蛋白質反應,W形成包含通過具有LPXTGGG(SEQ ID N0:9)的氨基酸序列的氨基酸接頭共價綴合于蛋白質的核酸的復合物,其中X為任意氨基 酸。接頭和核酸可存在于綴合后的目標蛋白質的C末端上或其附近。
[0021] 在另一個方面,本公開內容提供了方法,所述方法包括在分選酶存在的情況下,將 (1)綴合于包含末端甘氨酸(G)殘基的氨基酸序列的核酸(例如,DNA)與(或用)(2)包含 1口6了6乂。(其中乂是氨基酸并且11為大于0的數值或大于0的數值的范圍)(56〇10^:10)的末 端氨基酸序列的蛋白質反應,^形成包含通過具有1^^了666(56〇10^:5)的氨基酸序列的 氨基酸接頭共價綴合于蛋白質的核酸的復合物。在一些實施方案中,V'在長度上可W是1- 99個氨基酸。在一些實施方案中,V'為大于1的數值。
[0022] 在一些實施方案中,分選酶和包含LPETGXn(SEQ ID ^:10)的末端例如(:末端氨基 酸序列的蛋白質各自包含化S-標簽。在目標蛋白質的情況下,可將化S標簽提供在分選酶祀 序列的Xn(或X'n)氨基酸序列中或作為其部分。
[0023] 在一些實施方案中,通過核酸與包含一個或多個優選3個G殘基的膚之間的生物正 交銅催化的點擊化學反應形成綴合于包含末端甘氨酸(G)殘基的氨基酸序列的核酸。在一 些實施方案中,所述生物正交銅催化的點擊化學反應形成綴合物(其在本文中可被稱為核 酸中間產物),其包含綴合于包含一個或多個甘氨酸(G)殘基和任選純化標簽(諸如但不限 于Flag序列)W及還任選地可切割的氨基酸序列(諸如但不限于TEV祀(切割)序列,優選地 位于G殘基與純化標簽之間)的氨基酸序列的核酸。
[0024] 所述方法從而還可包括從核酸中間產物切割純化標簽,W使得甘氨酸殘基可接近 分選酶。例如,在一些實施方案中,所述方法還包括將核酸中間產物與TEV蛋白酶反應。在一 些實施方案中,將TEV蛋白酶綴合于化S-標簽。His-標簽可W是包含6個組氨酸殘基或由其 組成的氨基酸序列(SEQ ID N0:6)。
[0025] 在另一個方面,本發明提供了包含通過具有LPETGGG(氨基至簇基)或GGGTEPL(簇 基至氨基KSEQ ID N0:5)的氨基酸序列的氨基酸接頭共價綴合于蛋白質的核酸的復合物。 在附圖中舉例說明了該接頭在核酸與目標蛋白質之間的放置。
[0026] 在一些實施方案中,所述蛋白質是天然存在的蛋白質并且所述分選酶祀序列或接 頭序列諸如如上定義的^^了6乂'。(569 10顯:2)或1?6了666(569 10^:5)不存在于天然存 在的蛋白質中。
[0027] 在一些實施方案中,所述核酸的長度為1-100個核巧酸。在一些實施方案中,所述 核酸在綴合至膚之前包含DNA或由其組成。
[0028] 在另一個方面,本發明提供了包含分離形式的任何前述復合物或綴合物的組合 物,無論運樣的復合物或綴合物是中間產物還是終產物。因此,本公開內容提供了各自包含 綴合于膚的核酸的一種或多種綴合物,其中所述膚包含一個或多個(例如,3個)甘氨酸。運 些綴合物可在它們的核酸序列上彼此相異,但可具有相同的氨基酸序列。本公開內容類似 地提供了各自包含分選酶祀序列諸如上文中定義的LPXTGX'n(SEQ ID N0:2)的一種或多種 不同的蛋白質。本公開內容類似地提供了用于制備核酸-蛋白質復合物或綴合物的多種前 述核酸-膚綴合物和蛋白質。本公開內容還提供了各自包含通過具有LPXTGGG(SEQ ID NO: 9)的氨基酸序列的氨基酸接頭綴合于蛋白質的核酸的一種或多種綴合物。運些綴合物可在 它們的核酸序列和/或它們的氨基酸序列上彼此不同。因此,它們可具有相同的核酸序列, 或它們可具有相同的氨基酸序列,或它們可具有不同的核酸和氨基酸序列。因此,本公開內 容提供了各自呈分離形式的多個任何前述復合物或該群體為分離形式(任選地文庫形式)。
[0029] 在另一個方面,本發明提供了包含W下的兩種或更多種的任意組合的組合物:綴 合于包含末端甘氨酸(G)殘基(包括3個G殘基)的氨基酸序列的核酸、包含LPXTGX'n(其中X 和