專利名稱:活化誘導胞苷脫氨酶(aid)突變體及使用方法
活化誘導胞苷脫氨酶(AID)突變體及使用方法相關申請的交叉引用本專利申請要求于2009年4月3日提交的美國臨時專利申請第61/166,349號的權益,其援引加入本文。電子提交材料的援引加入同時提交的計算機可讀取的核苷酸/氨基酸序列表整體援引加入本文,并且如下所示一個2010年4月1日創建的名為‘3equenceListing.TXT”的140,103字節的 ASCII(Text)文件。
背景技術:
產生抗體多樣化的自然機制利用體細胞高變(SHM)的過程以引發免疫球蛋白可變區的進化,從而迅速產生與體液應答相關的第二抗體所有組成成分。在體內,SHM代表一個高效的過程,其能夠迅速以代表抗體優化的自然過程的方式探索生產性折疊結構并進化出高親和力抗體。因此,對于嘗試在體外復制SHM有很大的興趣,以便創造簡單、穩健的方法,其能夠直接在哺乳動物細胞環境內模擬親和力成熟的自然過程以選擇和進化免疫原性耐受并且在哺乳動物細胞中高表達的抗體(Cumbers et al.,Nat Biotechnol., 20(11) :1129-1134(2002) ;Wang et al. , Prot. Eng. Des. Sel. , 17(9) :569-664(2004); Wang et al. ,Proc. Natl. Acad. Sci. USA. , 101 (48) :16745-16749(2004) ;Ruckerl et al., Mol. Immunol. ,43(10) :1645-1652(2006) ;Todo et al. , J. Biosci. Bioeng. ,102(5) 478-81(2006) ;Arakawa et al.,Nucleic Acids Res. ,36(1) :eK2008))。然而,已從單個人或動物分離的天然抗體常不能證明最佳親和力屬性,因為免疫系統固有的內在親和力上限阻止體內辨別并因此選擇具有大于約IOOpM親和力的抗體(Batista and Neuberger, Immunity,8(6) :751-91998, (1998)禾口 EMBO J. ,19(4) 513-20(2000)。使用噬菌體展示文庫可以解決一些問題,并且已證實基于噬菌體展示的方法能夠常規地產生高親和力抗體。然而,從理論角度來看,這樣的靜態文庫的大小和范圍本質上是有限的,因為即使最大的(1012)文庫僅可以探索小部分潛在的先天免疫組成成分。此外,不可以同時在良好的哺乳動物表達和高親和力的基礎上通過噬菌體展示方法共進化抗體,從而引起另外由在哺乳動物宿主細胞中低表達所導致的潛在的下游生產問題。此外,使用隨機誘變結合噬菌體展示缺少在抗體親和力成熟的自然過程中發現的內在選擇性譜,這常導致人抗人免疫性或不期望的交叉反應性譜的問題。最初利用人伯基特淋巴瘤細胞系Ramos證實了在體外利用體細胞高變來使用培養細胞系進化特異性靶抗原的抗體(Cumbers et al. , Nat. Biotechnol. ,20(11) 11^-1134(2002))。Ramos和其他B細胞系還成功地用于進化隨機整合入宿主細胞染色體 DNA 的非抗體基因(Wang et al.,Prot. Eng. Des. Sel. , 17(9) :569-664(2004)和 Proc. Natl. Acad. Sci. USA. ,101(48) 16745-16749 (2004))。此外,利用有或無 Ig 特異性順式調控元件的游離型載體在B細胞系中在非抗體基因上證實了高效的體細胞高變(Ruckerl etal.,Mol. Immunol.,43 (10) 1645-1652 (2006))。雖然一些 Ramos 細胞系表現出相對高的組成型高變率,但是B細胞系一般表現出相對低的細胞分裂速率并且難以高效轉染,這限制了其用于定向進化的實際效用。雞法氏囊細胞系DT40通過假V基因模板基因轉換來多樣化其重排的Ig輕基因。然而,如果基因轉換被Rad51種內同源基因XRCC2的缺失(Sale et al. , Nature, 412 :921-6^001))或假基因轉換供體的缺失(Arakawa et al.,Nucleic Acids Res., 36(1) :el (2008))阻斷,該細胞系在培養中表現出組成型高變。與Ramos細胞相比,DT40 細胞具有明顯更短的世代時間(12小時),適合定向基因靶向并且成功用于內源抗體 (Seo et al.,Nat. Biotechnol.,23 (6) :731-5(2005) ;Nat. Protoc.,1 (3) :1502-6(2006); Biotechnol. Genet. Eng. Rev. , 24 179-93 (2007) ;Todo et al. , J. Biosci. Bioeng., 102(5) :478-81(2006))和非抗體蛋白(Arakawa et al.,Nucleic Acids Res. ,36(1) el (2008))的定向進化。雖然諸如Ramos和DT40的B細胞衍生物成功用于定向進化,但是由于許多因素,在定向進化的穩健方法中可靠使用這些細胞是復雜的,所述因素包括(i)需要將所關注的基因插入宿主細胞Ig基因座中的確定位點以實現高水平誘變(Parsa et al. , Mol Immunol. ,44(4) :567-75 (2007),和(ii)這些細胞中在內源性免疫球蛋白基因座發揮作用的體細胞高變的復雜的自然生物學。此外,這樣的工程細胞系在SHM率中表現出顯著的克隆不穩定性(Zhang et al.,Int. Immunol. , 13 :1175-1184(2001), Martin et al.,Proc. Natl. Acad. Sci. USA. ,99(19) :12304-12308(2002)和 Nature,415 (6873) :802-806(2002); Ruckerl et al.,Mol. Immunol. ,41 :1135-1143 (2004)),并且不提供任何簡單的方法以調節或控制高變,即在完成期望表型的選擇之后關閉誘變。許多研究組已成功描述了使用非B細胞在所關注的基因中啟動靶向體細胞高變(Martin et al. , Proc. Natl. Acad. Sci. USA. , 99 (19) :12304-12308(2002)和 Nature, 415(6873) :802-806(2002) ;McBride et al. , Proc. Natl. Acad. Sci. USA, 103 (23) 8798-803(2006) Jovanic et al.,PLoS ONE, 23 ;3(1) :el480(2008);美國專利申請公開 09/0075378 ;國際專利申請公開WO 08/10;3474Α1和WO 08/103475A1),而且這些細胞系還可以提供高效基因轉移、高水平蛋白表達、最佳生長特征,并且很容易適合懸浮培養和流式細胞術。活化誘導胞苷脫氨酶(AID)屬于胞苷脫氨酶的APOBEC家族。AID在活化的B細胞內表達,并且是通過在編碼抗體基因的基礎DNA中產生點突變(Martin et al. , Proc. Natl. Acad. Sci. USA. ,99(19) :12304-12308(2002)和 Nature,415 (6873) :802-806(2002); Petersen-Mart et al. , Nature, 418 (6893) :99-103 U002))來啟動體細胞高變(Muramatsu et al.,Cell,102 (5) :553-63 (2000) ;Revy et al.,Cell,102 (5) :565-75 (2000); Yoshikawa et al.,Science, 296 (5575) :2033-6(2002))所需要的。AID 還是類別轉換重組和基因轉換的必需蛋白因子(Muramatsu et al.,Cell, 102(5) :553-63(2000) ;Revy et al. ,Cell,102(5) :565-75(2000))。AID負責啟動體細胞高變的發現開啟了使用體細胞高變的利用非B細胞系產生更多確定、穩定和可控的系統的可能性。雖然有這些進展,但是仍然存在關于體細胞高變的實用系統開發的關鍵挑戰,這包括(1)將體細胞高變靶向所關注的基因并遠離結構基因的能力,(2)與體內體細胞高變相比利用外源AID所獲得的相對低的突變率和突變性質,和( 在誘變周期之間從單細胞克隆生長為細胞群體所需的相對長的細胞倍增時間。因此,對改進的組合物和方法有特別需要以提高體細胞高變系統的效率。本發明提供了這樣的組合物和方法。發明概述本發明提供了一種分離或純化的核酸分子,其包含編碼功能性突變活化誘導胞苷脫氨酶(AID)蛋白的核苷酸序列,所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白的氨基酸序列與人AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于至少一個氨基酸取代。在一實施方案中,所述功能性突變AID蛋白的氨基酸序列與人AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于在選自殘基34、殘基82和殘基156 的殘基處的至少一個氨基酸取代。在另一實施方案中,所述功能性突變AID蛋白的氨基酸序列與人AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于在殘基10處的至少一個氨基酸取代和在殘基156處的至少一個氨基酸取代。在另一實施方案中,所述功能性突變AID蛋白的氨基酸序列與人AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于在殘基35處的至少一個氨基酸取代和在殘基145處的至少一個氨基酸取代。在另一實施方案中,所述功能性突變AID蛋白的氨基酸序列與人AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于在殘基34處的至少一個氨基酸取代和在殘基160處的至少一個氨基酸取代。在另一實施方案中,所述功能性突變AID蛋白的氨基酸序列與人AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于在殘基43處的至少一個氨基酸取代和在殘基120處的至少一個氨基酸取代。本發明還提供了一種分離或純化的核酸分子,其包含編碼功能性突變AID蛋白的核苷酸序列,所述功能性突變AID蛋白的氨基酸序列與人AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于至少兩個氨基酸取代,其中至少一個取代在殘基57 處且至少一個取代在殘基145或81處,并且其中所述功能性突變AID蛋白在細菌乳突形成 (papillation)測定中與所述人AID蛋白相比活性提高至少10倍。在另一實施方案中,所述功能性突變AID蛋白的氨基酸序列與人AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于在殘基156處的至少一個氨基酸取代和在殘基82處的至少一個氨基酸取代。在另一實施方案中,所述功能性突變AID蛋白的氨基酸序列與人AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于在殘基156處的至少一個氨基酸取代和在殘基34處的至少一個氨基酸取代。在另一實施方案中,所述功能性突變AID蛋白的氨基酸序列與人AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于在殘基156處的至少一個氨基酸取代和在殘基157處的至少一個氨基酸取代。
在另一實施方案中,所述功能性突變AID蛋白的氨基酸序列與人AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于在殘基10、82和156處的至少一個
氨基酸取代。本發明還提供了一種分離或純化的核酸分子,其包含編碼功能性突變活化誘導胞苷脫氨酶(AID)蛋白的核苷酸序列,所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白的氨基酸序列與選自犬AID蛋白(SEQ ID N0:3)、小鼠(murine)AID蛋白(SEQ ID NO :4)、大鼠 AID 蛋白(SEQ ID NO :5)、牛 AID 蛋白(SEQ ID NO :6)和雞 AID 蛋白(SEQ ID NO :7)的氨基酸序列的不同之處在于在選自殘基;34、殘基82和殘基156的殘基處的至少一個氨基酸取代,其中所述功能性突變AID蛋白在細菌乳突形成測定中與所述人AID蛋白相比活性提高至少10倍。本發明還提供了包含核酸分子的表達載體,所述核酸分子包含編碼功能性突變活化誘導胞苷脫氨酶(AID)的核苷酸序列。本發明還提供了分離的細胞,其包含編碼功能性突變AID蛋白的核酸分子。本發明還提供了轉基因動物,其包含編碼功能性突變AID蛋白的核酸分子。本發明還提供了一種用于制備具有期望特性的基因產物的方法,所述方法包括在細胞群體中表達編碼所述基因產物的核酸,其中所述細胞群體表達或能夠被誘導以表達功能性突變AID蛋白,由此所述功能性突變AID蛋白的表達在編碼所述基因產物的核酸中誘導突變。本發明還提供了一種用于將生物體突變以具有期望表型的方法,所述方法包括在所述生物體中表達或誘導表達功能性突變AID蛋白,由此所述功能性突變AID蛋白的表達在所述生物體的染色體DNA內誘導突變。
圖Ia包括表達或不表達人AID的細菌菌落中乳突的圖像。圖Ib為量化表達人 AID、AP0BEC1 (Al)或AP0BEC3G(A3G)的細菌菌落中的乳突的柱狀圖。圖Ic為示出通過從人脾cDNA文庫篩選乳突所獲得的2個AP0BEC3G cDNA的示意圖。圖Id包括表達所示AID蛋白的細菌菌落中乳突的圖像,并且列出了相對于載體的突變頻率。圖Ie包括作為阿拉伯糖濃度函數的AID Mutl. 1乳突形成圖像。圖If為示出人AID突變體的平板接種效率的圖。圖2為說明選擇乳突形成篩選中鑒定的人功能性AID突變體的圖表。數字示出了相對于載體每個人AID突變體突變為Rif的平均頻率。圖3a為人AID的序列圖,其說明在人和河豚(pufferfish)AID中鑒定的功能性突變的位置和性質。圖北通過蛋白印跡比較了 GST-AID突變體融合蛋白的表達水平。圖3c、 d為量化GST-AID突變體融合蛋白的脫氨酶活性和靶標特異性的圖。圖如為說明選擇乳突形成篩選中鑒定的河豚AID突變體的圖表。圖4b為比較在 18°C和37°C下河豚AID突變體至Riflr的相對突變頻率的柱狀圖。圖5a包括表達所示AID蛋白的單個DT40克隆中IgM和GFP表達的流式細胞術圖。 圖如還含有表達所示蛋白的12個獨立克隆轉染子中IgM缺失的圖。圖恥含有在轉染的 DT40細胞中觀察到的IgVX突變的分布圖。圖恥還含有示出分選IgM缺失之后IgV λ突變數的圓內扇形圖。圖恥還通過蛋白印跡示出了 AID表達。圖5c包括用所示反轉錄病毒轉導的AID缺陷B細胞中轉換至IgGl的流式細胞術圖。圖5c中的柱狀圖量化了相對于野生型AID的IgGl轉換,并且圖5c中的蛋白印跡通過蛋白印跡示出了 AID表達。圖6a為說明c-myc和IgH基因座之間的相互易位以及示出用于檢測易位的引物 (箭頭)和探針(P)的示意圖。圖6b為通過PCR擴增來自用所示反轉錄病毒轉導的AID缺陷B細胞的基因組DNA之后來源于染色體15和12的c-myc-IgH易位的DNA印跡。圖7為LOGO比對,其說明細菌乳突形成篩選中鑒定的功能性突變帶來更接近 AP0BEC3序列的AID序列。圖8列出了用于產生圖7的哺乳動物AID和AP0BEC3序列的GenBank/Ensembl登錄號。圖9為人AID和河豚(河豚(fugu))AID的序列圖,其說明鑒定的功能性突變的位
置和性質。圖IOa為實施例14所述的細胞實驗中所用的AID序列的核酸序列比對。 方框中的殘基表示wt和7. 3突變體序列之間的變化。圖IOb為實施例14所述的
細胞實驗中所用的AID序列的氨基酸序列比對。方框中的殘基表示wt和7. 3突變體序列之間的變化。MutE和Mut 7. 3中L至A的突變使核輸出信號失去功能。句點表示終止密碼子,并且虛線指明沒有相應氨基酸的位置。發明詳述本發明提供了一種分離或純化的核酸分子,其包含編碼功能性突變AID蛋白的核苷酸序列,所述功能性突變AID蛋白的氨基酸序列與人AID蛋白的氨基酸序列(SEQ ID NO 1或SEQ ID NO 2)的不同之處在于至少一個氨基酸取代,其中所述功能性突變AID蛋白在細菌乳突形成測定中與所述人AID蛋白相比活性提高至少10倍。“核酸分子”涵蓋DNA或RNA的聚合物,即多核苷酸,其可以為單鏈或雙鏈并且其可以含有非天然或改變的核苷酸。如本文所用的術語“核酸”和“多核苷酸”指任何長度的聚合形式的核苷酸,核糖核苷酸(RNA)或脫氧核糖核苷酸(DNA)。這些術語指分子的一級結構,并且因此包括雙鏈和單鏈DNA以及雙鏈和單鏈RNA。作為等同物,該術語包括由核苷酸類似物和修飾的多核苷酸形成的RNA或DNA類似物,所述核苷酸類似物和修飾的多核苷酸例如但不限于甲基化和/或加帽的多核苷酸。如本文所用的術語“核苷酸”指多核苷酸的單體單元,其由雜環堿基、糖和一個或多個磷酸基團組成。天然存在的堿基(鳥嘌呤(G)、腺嘌呤(A)、胞嘧啶(C)、胸腺嘧啶 (T)和尿嘧啶(U))為嘌呤或嘧啶的典型衍生物,雖然應當理解還包括天然和非天然存在的堿基類似物。天然存在的糖為戊糖(五碳糖)脫氧核糖(其形成DNA)或核糖(其形成RNA),雖然應當理解還包括天然或非天然存在的糖類似物。核酸典型地通過磷酸鍵連接以形成核酸或多核苷酸,雖然本領域已知許多其他鍵(例如,硫代磷酸酯、硼烷磷酸酯 (boranophosphate)等)0如本文所用的術語“合成多核苷酸”、“合成基因”或“合成多肽”表示相應的多核苷酸序列或其部分,或者氨基酸序列或其部分來源于與相當的天然存在的序列相比經設計、 或從頭合成、或修飾的序列。合成多核苷酸或合成基因可以通過本領域已知的方法制備,包括但不限于核酸或氨基酸序列的化學合成或者通過PCR(或相似的酶促擴增系統)擴增。合成基因通常在氨基酸水平或多核苷酸水平(或兩者)與未修飾的基因或天然存在的基因不同,并且通常位于合成的表達控制序列之內。例如,合成基因序列可以包括通過例如一個或多個氨基酸或核苷酸的替代、缺失或添加來改變的氨基酸或多核苷酸序列,從而提供與源序列不同的氨基酸序列或多核苷酸編碼序列。合成基因或多核苷酸序列可以不必需編碼與天然基因相比具有不同氨基酸的蛋白。例如,其還可以涵蓋并入不同但編碼相同氨基酸的密碼子的合成多核苷酸序列;即核苷酸變化在氨基酸水平代表沉默突變。在一實施方案中, 與天然存在或未修飾的基因相比,合成基因表現出改變的對SHM的敏感性。利用本文所述方法可以迭代修飾合成基因,并且在每個連續迭代中,相應的多核苷酸序列或氨基酸序列整個或部分來源于與相當的未修飾的序列相比經設計、或從頭合成、或修飾的序列。如本文所用,“密碼子”指當轉錄和翻譯時編碼單個氨基酸殘基的3個核苷酸;或者在UUA、UGA或UAG的情況下編碼終止信號。編碼氨基酸的密碼子為本領域眾所周知。最優密碼子使用由表達基因的密碼子使用頻率表示,例如,如來自Wisconsin Sequence Analysis Package, Version 8. 1, Genetics Computer Group, Madison, Wise 的程序“Human-High, cod”的密碼子使用圖所示。密碼子使用還如R. Nussinov, "Eukaryotic Dinucleotide Preference Rules and Their Implications for Degenerate Codon Usage,” J. Mol. Biol.,149 :125-131(1981)所述。在高表達的人基因中最常使用的密碼子據推測為在人宿主細胞中表達的最優密碼子,并且因此形成構建合成編碼序列的基礎。“分離”表示從其自然環境取得核酸。“純化”表示無論從自然取得(包括基因組 DNA和mRNA)或者在實驗室條件下合成(包括cDNA)和/或擴增的給定核酸的純度增加,其中“純度”為相對術語,不是“絕對純度”。然而,應當理解核酸和蛋白可以與稀釋劑或輔助劑配制,并且仍然為了實用目的而分離。例如,當用于引入細胞時,核酸會與可接受的媒介物或稀釋劑混合。術語“活化誘導胞苷脫氨酶”或(“AID”)指能夠介導DNA序列內胞嘧啶至尿嘧啶的脫氨基作用的RNA/DNA編輯胞苷脫氨酶的AID/AP0BEC家族成員。(參見,例如,ConticelIo et al.,Mol. Biol. Evol.,22 :367-377 (2005)和美國專利 6,815,194)。術語“野生型AID”指天然存在的AID蛋白的氨基酸序列。合適的野生型AID蛋白包括所有脊椎動物形式的AID,包括,例如,靈長類、嚙齒類、禽類和硬骨魚。野生型AID氨基酸序列的代表性實例不限制地包括人AID (SEQ ID NO :1或SEQ ID NO 2)、犬AID (SEQ ID NO :3)、小鼠 AID (SEQ ID NO :4)、大鼠 AID (SEQ ID NO :5)、牛 AID (SEQ ID NO :6)、雞AID (SEQ ID NO :7)、豬 AID (SEQ ID NO :8)、黑猩猩 AID (SEQ ID NO :9)、稱猴 AID (SEQ ID NO: 10)、馬 AID (SEQ ID NO :11)、爪蟾 AID (SEQ ID NO :12)、河豚(河豚)AID (SEQ ID NO :13)和斑馬魚 (SEQ ID NO 14)。術語“AID同系物”指Apobec家族的酶,并且包括,例如,Apobec-U Apobec3C或 Apobec3G(例如,Jarmuz et al. ,Genomics, 79 :285-296(2002)所述)。術語“AID 活性”包括AID和AID同系物介導的活性。如本文所用的“AID突變體”或“AID的突變體”指與野生型AID氨基酸序列的不同之處在于至少一個氨基酸的AID氨基酸序列。可以通過本領域已知的任何合適的方法突變野生型氨基酸序列以產生AID突變體,例如,通過插入、缺失和/或取代。例如,可以隨機或以位點特異性方式將突變引入編碼野生型AID的核酸序列。例如,可以通過AID模板序列的易錯PCR來產生隨機突變。用于引入隨機突變的優選方法為Genemorph II隨機誘變試劑盒(Stratagene,LaJolla, CA)。例如,可以通過將包含修飾位點的合成寡核苷酸連接入表達載體來引入位點特異性突變。可選地,可以使用寡核苷酸定向位點特異性誘變方法,如 Walder et al.,Gene, 42 :133(1986) ;Bauer et al.,Gene, 37 :73(1985) ;Craik, Biotechniques, 12-19 (January 1995);和美國專利第 4,518,584 號和第 4,737,462 號所公開的方法。用于引入位點特異性突變的優選方法為QuikChange位點定向誘變試劑盒 (Stratagene, LaJolla, CA) 0術語“AID的功能性突變體”、“功能性AID突變體”或“功能性突變AID蛋白”每個均指保留野生型AID的所有或部分生物活性,或者表現出與野生型AID蛋白相比增加的生物活性的突變AID蛋白。野生型AID的生物活性包括但不限于在DNA序列內胞嘧啶至尿嘧啶的脫氨基作用,細菌誘變測定中的乳突形成,靶基因的體細胞高變和免疫球蛋白類別轉換。突變AID蛋白可以保留野生型AID蛋白生物活性的任何部分。期望地,突變AID蛋白保留野生型AID生物活性的至少75% (例如,75%、80%、90%或更多)。優選地,突變AID 蛋白保留野生型AID生物活性的至少90% (例如,90%、95%、100%或更多)。在一優選實施方案中,突變AID蛋白表現出與野生型AID蛋白相比增加的生物活性。在這方面,當通過細菌乳突形成測定測量時,功能性AID突變體與野生型AID蛋白相比活性提高至少10倍。本領域已知細菌乳突形成測定對于篩選在DNA修復的某些方面缺陷的大腸桿菌(E.Coli)突變體是有用的(Nghiem et al.,Proc. Natl. Acad. Sci. USA,85 2709-2713(1988)和 Ruiz et al.,J. Bacteriol.,175 :4985-4989 (1993))。細菌乳突形成測定可以采用在IacZ基因內含有錯義突變的大腸桿菌(Escherichia coli) CC102細胞。大腸桿菌CC102細胞在MacConkey-乳糖平板上產生白色菌落。在這樣的白色菌落內,常可以看見少量紅色小菌落或“乳突(papilli) ”(典型每個菌落0-2個),其反映自發產生的Lac+ 回復突變體。表現出升高的自發突變頻率的細菌克隆(即,“增變克隆”)可以憑借增加的乳突數來鑒定。細菌乳突形成測定可以用于篩選與野生型AID相比具有增加的活性的功能性AID突變體。細菌乳突形成測定在實施例中詳述。在一實施方案中,在細菌乳突形成測定中功能性AID突變體與野生型AID蛋白相比活性提高至少10倍(例如,10倍、30倍、50倍或更多)。優選地,功能性AID突變體與野生型AID相比活性提高至少100倍(例如,100倍、200倍、300倍或更多)。更優選地,功能性AID突變體與野生型AID相比活性提高至少400倍(例如,400倍、500倍、1000倍或更多)。功能性突變AID蛋白包含與野生型AID蛋白的氨基酸序列的不同之處在于至少一個氨基酸取代的氨基酸序列。野生型AID蛋白可以是任何脊椎動物AID蛋白,包括本文所述的AID蛋白。期望地,野生型AID蛋白為人AID蛋白,其有至少兩種已知變體(S卩,SEQ ID NO :1和SEQ ID NO :2)。其他脊椎動物AID蛋白包括但不限于犬AID (SEQ ID NO: 3)、小鼠 AID (SEQ ID NO :4)、大鼠 AID (SEQ ID NO :5)、牛 AID (SEQ ID NO :6)、雞 AID (SEQ ID NO: 7)、豬 AID (SEQ ID NO :8)、黑猩猩 AID (SEQ ID NO :9)、稱猴AID (SEQ ID NO :10)、馬 AID (SEQ ID NO :11)、爪蟾 AID (SEQ ID NO: 12)、河豚(河豚)AID (SEQ ID NO :13)或斑馬魚(SEQ ID NO 14)。本領域普通技術人員會理解雖然在脊椎動物AID蛋白之間有高度同源性,但是相對于人AID(SEQ ID NO :1或SEQ ID NO 2)在每種脊椎動物AID蛋白中有可變數量的氨基酸取代、缺失和插入。因此,本發明涵蓋并入在任何脊椎動物AID蛋白的類似位置的本文所述的突變。本領域普通技術人員可以通過利用任何本領域已知的基于計算機的比對程序 (例如,BLAST或ClustalW2)進行同源脊椎動物AID蛋白與人AID (SEQ ID NO :1或SEQ ID NO 2)的序列比對來確定任何脊椎動物AID蛋白中的類似位置。野生型AID蛋白典型地在該蛋白的C端附近含有核輸出序列。在本發明的一實施方案中,可以突變介導野生型AID的核輸出的一個殘基或多個殘基,并且可以產生功能性突變AID蛋白,其包含與具有突變的核輸出序列的AID蛋白的氨基酸序列的不同之處在于至少一個額外的氨基酸取代的氨基酸序列。具有可以作為參考序列的突變核輸出序列的犬 AID 蛋白的實例包括 L198A 突變體(SEQ ID NO 70)以及 D187E、D188E、D191E、T195I 和 L198A突變體(SEQ ID NO :71),本文鑒定為產生功能性AID突變體的突變可以插入所述核輸出序列。氨基酸“取代”指多肽序列內在給定位置的一個氨基酸或一個殘基被在相同位置的另一個氨基酸或另一個殘基代替。氨基酸大體上分為“芳香族”或“脂肪族”。芳香族氨基酸包含芳環。“芳香族”氨基酸的實例包括組氨酸(H或His)、苯丙氨酸(F或Wie)、酪氨酸(Y或Tyr)和色氨酸(W或 Trp)。非芳香族氨基酸大體上分類為“脂肪族”。“脂肪族”氨基酸的實例包括甘氨酸(G或 Gly)、丙氨酸(A或Ala)、纈氨酸(V或Val)、亮氨酸(L或Leu)、異亮氨酸(I或lie)、甲硫氨酸(M或Met)、絲氨酸(S或kr)、蘇氨酸(T或Thr)、半胱氨酸(C或Cys)、脯氨酸(P或 Pro)、谷氨酸(E或Glu)、天冬氨酸(A或Asp)、天冬酰胺(N或Asn)、谷氨酰胺⑴或Gln)、 賴氨酸(K或Lys)和精氨酸(R或Arg)。脂肪族氨基酸可以細分為4個亞類。“大脂肪族非極性亞類”由纈氨酸、亮氨酸和異亮氨酸組成,“脂肪族輕微極性亞類”由甲硫氨酸、絲氨酸、蘇氨酸和半胱氨酸組成,“脂肪族極性/帶電亞類”由谷氨酸、天冬氨酸、天冬酰胺、谷氨酰胺、賴氨酸和精氨酸組成,以及 “小殘基亞類”由甘氨酸和丙氨酸組成。帶電/極性氨基酸類可以細分為3個亞類由賴氨酸和精氨酸組成的“帶正電亞類”,由谷氨酸和天冬氨酸組成的“帶負電亞類”以及由天冬酰胺和谷氨酰胺組成的“極性亞類”。芳香族氨基酸可以細分為2個亞類由組氨酸和色氨酸組成的“氮環亞類”以及由苯丙氨酸和酪氨酸組成的“苯基亞類”。短語“保守性氨基酸取代”或“保守性突變”指一個氨基酸被另一個具有共同特性的氨基酸代替。定義單個氨基酸之間的共同特性的實用方法是分析同源生物的相應蛋白之間氨基酸變化的歸一化頻率(Schulz, G. Ε. and R. H. Schirmer, Principles of Protein Structure, Springer-Verlag, New York(1979)) 根據這樣的分析,可以定義氨基酸類另IJ,其中類別內的氨基酸優選互相交換,并且因此它們對整體蛋白結構的影響互相最相似 (Schulz, G. Ε. and R. H. Schirmer,見上文)。保守性突變的實例包括上文亞類之內氨基酸的氨基酸取代,例如,賴氨酸取代精氨酸并且反之亦然,從而可以保持正電荷;谷氨酸取代天冬氨酸并且反之亦然,從而可以保持負電荷;絲氨酸取代蘇氨酸,從而可以保持游離的-OH ;以及谷氨酰胺取代天冬酰胺,從而可以保持游離的-NH2。“半保守性突變”包括具有上文所列相同類別的氨基酸的氨基酸取代,其不共享相同的亞類。例如,天冬氨酸突變為天冬酰胺或天冬酰胺突變為賴氨酸,每個涉及在相同類別但是不同亞類之內的氨基酸。“非保守性突變”涉及不同類別之間的氨基酸取代,例如賴氨酸取代色氨酸或苯丙氨酸取代絲氨酸等。在一優選實施方案中,所述核酸分子編碼功能性AID突變體,所述功能性AID突變體的氨基酸序列與野生型AID的氨基酸序列的不同之處在于在選自殘基34、殘基82和殘基 156的殘基處的至少一個氨基酸取代。可以單獨或任意組合取代這些殘基。在取代殘基34 賴氨酸(K)的實施方案中,優選用谷氨酸(E)或天冬氨酸(D)殘基取代。在取代殘基82蘇氨酸(T)的實施方案中,優選用異亮氨酸(I)或亮氨酸(L)殘基取代。在取代殘基156谷氨酸(E)的實施方案中,優選用甘氨酸(G)或丙氨酸(A)殘基取代。此外,當取代氨基酸殘基 156時(單獨或與在殘基34和/或殘基82處的取代組合),還可以期望用在殘基9、13、38、 42、96、115、132、157、180、181、183、197、198或其組合處的氨基酸取代產生功能性AID突變蛋白。特別地,(a)在殘基9處的氨基酸取代可以為甲硫氨酸(M)或賴氨酸(K),(b)在殘基13處的氨基酸取代可以為苯丙氨酸(F)或色氨酸(W),(c)在殘基38處的氨基酸取代可以為甘氨酸(G)或丙氨酸(A),(d)在殘基42處的氨基酸取代可以為異亮氨酸(I)或亮氨酸(L),(e)在殘基96處的氨基酸取代可以為甘氨酸(G)或丙氨酸㈧,(f)在殘基115處的氨基酸取代可以為酪氨酸(Y)或色氨酸(W),(g)在殘基132處的氨基酸取代可以為谷氨酸(E)或天冬氨酸(D),(h)在殘基180處的氨基酸取代可以為異亮氨酸(I)或丙氨酸(A), (i)在殘基181處的氨基酸取代可以為甲硫氨酸(M)或纈氨酸(V),(j)在殘基183處的氨基酸取代可以為異亮氨酸(I)或脯氨酸(P),(k)在殘基197處的氨基酸取代可以為精氨酸 (R)或賴氨酸(K),(1)在殘基198處的氨基酸取代可以為纈氨酸(V)或亮氨酸(L),和(m) 在殘基157處的氨基酸取代可以為蘇氨酸(T)或賴氨酸(K)。在另一實施方案中,所述核酸分子編碼功能性AID突變體,所述功能性AID突變體的氨基酸序列與野生型AID的氨基酸序列的不同之處在于在殘基10處的至少一個氨基酸取代和在殘基156處的至少一個氨基酸取代。可以單獨或以任意組合取代這些殘基。在取代氨基酸殘基10(賴氨酸)的實施方案中,優選用谷氨酸(E)或天冬氨酸(D)殘基取代。在取代殘基156(谷氨酸)的實施方案中,優選用甘氨酸(G)或丙氨酸(A)殘基取代。在取代在殘基10和156處的氨基酸的實施方案中,還可以期望包括在殘基13、34、82、95、115、120、 134、145或其組合處的氨基酸取代。特別地,(a)在殘基13處的氨基酸取代可以為苯丙氨酸(F)或色氨酸(W),(b)在殘基34處的氨基酸取代可以為谷氨酸(E)或天冬氨酸(D),(c) 在殘基82處的氨基酸取代可以為異亮氨酸(I)或亮氨酸(L),(d)在殘基95處的氨基酸取代可以為絲氨酸( 或亮氨酸(L),(e)在殘基115處的氨基酸取代可以為酪氨酸(Y)或色氨酸(W),(f)在殘基120處的氨基酸取代可以為精氨酸(I )或天冬酰胺(N),和(g)在殘基145處的氨基酸取代可以為亮氨酸(L)或異亮氨酸(I)。在另一實施方案中,所述核酸分子編碼功能性AID突變體,所述功能性AID突變體的氨基酸序列與野生型AID的氨基酸序列的不同之處在于在殘基35處的至少一個氨基酸取代和在殘基145處的至少一個氨基酸取代。可以用任何合適的氨基酸取代在殘基35和 145處的氨基酸。優選用甘氨酸(G)或丙氨酸(A)取代在殘基35處的氨基酸。優選用亮氨酸(L)或異亮氨酸(I)取代在殘基145處的氨基酸。
在另一實施方案中,所述核酸分子編碼功能性AID突變體,所述功能性AID突變體的氨基酸序列與野生型AID的氨基酸序列的不同之處在于在殘基34處的至少一個氨基酸取代和在殘基160處的至少一個氨基酸取代。可以用任何合適的氨基酸取代在殘基34和 160處的氨基酸。優選用谷氨酸(E)或天冬氨酸(D)取代在殘基34處的氨基酸。優選用谷氨酸(E)或天冬氨酸(D)取代在殘基160處的氨基酸。在另一實施方案中,所述核酸分子編碼功能性AID突變體,所述功能性AID突變體的氨基酸序列與野生型AID的氨基酸序列的不同之處在于在殘基43處的至少一個氨基酸取代和在殘基120處的至少一個氨基酸取代。可以用任何合適的氨基酸取代在殘基43和 120處的氨基酸。優選用脯氨酸(P)取代在殘基43處的氨基酸。優選用精氨酸(I )取代在殘基120處的氨基酸。在另一實施方案中,所述核酸分子編碼功能性AID突變體,所述功能性AID突變體的氨基酸序列與野生型AID的氨基酸序列的不同之處在于至少兩個氨基酸取代,其中至少一個取代在殘基57處并且至少一個取代在殘基145或81處。可以單獨或以任意組合取代這些殘基(例如,殘基57和145的取代或者殘基57和81的取代)。優選地,用甘氨酸(G) 或丙氨酸(A)取代在殘基57處的氨基酸。當取代在殘基145處的氨基酸時,優選用亮氨酸 (L)或異亮氨酸(I)取代。當取代在殘基81處的氨基酸時,優選用酪氨酸(Y)或色氨酸(W) 取代。在另一實施方案中,所述核酸分子編碼功能性AID突變體,所述功能性AID突變體的氨基酸序列與野生型AID的氨基酸序列的不同之處在于在殘基156處的至少一個氨基酸取代和在殘基82處的至少一個氨基酸取代。可以用任何合適的氨基酸取代在殘基156和 82處的氨基酸。優選用甘氨酸(G)或丙氨酸(A)取代在殘基156處的氨基酸。優選用亮氨酸(L)或異亮氨酸(I)取代在殘基82處的氨基酸。在另一實施方案中,所述核酸分子編碼功能性AID突變體,所述功能性AID突變體的氨基酸序列與野生型AID的氨基酸序列的不同之處在于在殘基156處的至少一個氨基酸取代和在殘基34處的至少一個氨基酸取代。可以用任何合適的氨基酸取代在殘基156和 34處的氨基酸。用甘氨酸(G)或丙氨酸(A)取代在殘基156處的氨基酸。優選用谷氨酸 (E)或天冬氨酸(D)取代在殘基34處的氨基酸。在另一實施方案中,所述核酸分子編碼功能性AID突變體,所述功能性AID突變體的氨基酸序列與野生型AID的氨基酸序列的不同之處在于在殘基156處的至少一個氨基酸取代和在殘基157處的至少一個氨基酸取代。可以用任何合適的氨基酸取代在殘基156和 157處的氨基酸。優選用甘氨酸(G)或丙氨酸(A)取代在殘基156處的氨基酸。優選用精氨酸00或天冬酰胺(N)取代在殘基120處的氨基酸。在另一實施方案中,所述核酸分子編碼功能性AID突變體,所述功能性AID突變體的氨基酸序列與野生型AID的氨基酸序列的不同之處在于在殘基10、82和156處的至少一個氨基酸取代。可以單獨或以任意組合取代這些殘基。在一優選實施方案中,所述核酸分子編碼功能性AID突變體,所述功能性AID突變體的氨基酸序列與野生型AID的氨基酸序列的不同之處在于在殘基10、82和156處的氨基酸取代。在取代在殘基10、82和156處的氨基酸的實施方案中,還可以期望包括在殘基9、15、18、30、34、;35、36、44、53、59、66、74、77、 88、93、100、104、115、118、120、142、145、157、160、184、185、188、192 或其組合處的氨基酸取代。特別地,(a)在殘基9處的氨基酸取代可以為絲氨酸(S)、甲硫氨酸(M)或色氨酸(W), (b)在殘基10處的氨基酸取代可以為谷氨酸(E)或天冬氨酸(D),(c)在殘基15處的氨基酸取代可以為酪氨酸(Y)或亮氨酸(L),(d)在殘基18處的氨基酸取代可以為丙氨酸(A) 或亮氨酸(L),(e)在殘基30處的氨基酸取代可以為酪氨酸(Y)或絲氨酸(S),(f)在殘基 34處的氨基酸取代可以為谷氨酸(E)或天冬氨酸(D),(g)在殘基35處的氨基酸取代可以為絲氨酸( 或賴氨酸(K),(h)在殘基36處的氨基酸取代可以為半胱氨酸(C),(i)在殘基44處的氨基酸取代可以為精氨酸(I )或賴氨酸(K),(j)在殘基53處的氨基酸取代可以為酪氨酸(Y)或谷氨酰胺⑴),(k)在殘基57處的氨基酸取代可以為丙氨酸(A)或亮氨酸 (L),⑴在殘基59處的氨基酸取代可以為甲硫氨酸(M)或丙氨酸㈧,(m)在殘基66處的氨基酸取代可以為蘇氨酸(T)或丙氨酸(A),(η)在殘基74處的氨基酸取代可以為組氨酸 (H)或賴氨酸(K),(ο)在殘基77處的氨基酸取代可以為絲氨酸( 或賴氨酸(K),(ρ)在殘基82處的氨基酸取代可以為異亮氨酸(I)或亮氨酸(L),(q)在殘基88處的氨基酸取代可以為絲氨酸( 或蘇氨酸(T),(r)在殘基93處的氨基酸取代可以為亮氨酸(L)、精氨酸 (R)或賴氨酸(K),(s)在殘基100處的氨基酸取代可以為谷氨酸(E)、色氨酸(W)或苯丙氨酸F,(t)在殘基104處的氨基酸取代可以為異亮氨酸(I)或丙氨酸(A),(u)在殘基115 處的氨基酸取代可以為酪氨酸(Y)或亮氨酸(L),(ν)在殘基118處的氨基酸取代可以為谷氨酸(E)或纈氨酸(V),(χ)在殘基120處的氨基酸取代可以為精氨酸(I )或亮氨酸(L), (y)在殘基142處的氨基酸取代可以為谷氨酸(E)或天冬氨酸(D),(ζ)在殘基145處的氨基酸取代可以為亮氨酸(L)或酪氨酸(Y),(aa)在殘基156處的氨基酸取代可以為甘氨酸 (G)或丙氨酸(A),(bb)在殘基157處的氨基酸取代可以為甘氨酸(G)或賴氨酸(K),(cc) 在殘基160處的氨基酸取代可以為谷氨酸(E)或天冬氨酸(D),(dd)在殘基184處的氨基酸取代可以為天冬酰胺(N)或谷氨酰胺⑴),(ee)在殘基185處的氨基酸取代可以為甘氨酸(G)或天冬氨酸(D),(ff)在殘基188處的氨基酸取代可以為甘氨酸(G)或谷氨酸(E), 和(gg)在殘基192處的氨基酸取代可以為蘇氨酸(T)或絲氨酸(S)。功能性AID突變蛋白與野生型AID蛋白的不同之處可以在于單獨或任意組合的本文所公開的任何氨基酸取代。可選地,與野生型AID氨基酸序列(例如,人AID氨基酸序列 SEQ ID NO :1或SEQ ID NO 2)相比,功能性AID突變蛋白可以具有額外的氨基酸取代。例如,功能性AID突變蛋白可以具有關于SEQ ID NO :1或SEQ ID NO 2的以下氨基酸取代的任一種或以下氨基酸取代的組合N7K、R8Q、Q14H、R25H、Y48H、N52S、H156R、R158K、L198A、 R9K、G100W、A138G、S173T、T195I、F42C、A138G、H156R、L198F、M6K、K10Q、A39P、N52A、E118D、 K10L、Q14N、N52M、D67A、G100A、V135A、Y145F、R171H、Q175K、R194K、在殘基 118 之后插入 K、 和 D119E。本發明還提供了編碼包含C端截短突變的功能性AID突變體的核酸分子。C端截短突變的產生在本領域普通技術之內,并且可以根據例如上文所述用于產生AID突變體的方法進行。例如,可以通過在AID氨基酸序列的殘基181處或在殘基181的遠端插入終止密碼子來產生C端截短突變。在本發明的上下文中產生功能性AID突變蛋白的優選氨基酸取代的實例如圖2所
7J\ ο在本發明的上下文中,功能性AID突變體還包括編碼野生型AID蛋白的核酸序列,其中部分該核酸序列缺失并用來自AID同系物(例如,Ap0bec-l、Ap0bec3C或ApobeC3G)的核酸序列代替。在這方面,人AP0BEC3蛋白像人AID—樣能夠將DNA中的胞嘧啶(C)脫氨基,然而AID優選靶向位于5’ -側翼嘌呤側面的C殘基,AP0BEC3優選5’ -嘧啶側翼,對于特異性5,-側翼核苷酸偏好單個AP0BEC3是不同的。人AP0BEC3基因序列的比較提示位于距蛋白的羧基端約60個殘基的一段約8個氨基酸的結構域在決定這個側翼核苷酸偏好中起著重要作用。鑒于AP0BEC2的晶體結構和與寡核苷酸底物形成復合物的TadA tRNA-腺苷脫氨酶的晶體結構,AID和AP0BEC3中的這60個氨基酸序列可能形成與DNA底物的接觸。 因此,在本發明的一實施方案中,功能性AID突變體可以包含編碼野生型AID蛋白的核酸序列,其中去除人AID的氨基酸殘基115-223,并且用來自AP0BEC3蛋白(例如,AP0BEC3C、 AP0Bec3F和AP0BEC3G)的相應序列代替。本發明還提供了編碼融合蛋白的核酸分子,所述融合蛋白包含符合讀框(in frame)地融合在一起的功能性AID突變體和第二多肽。例如,融合蛋白的產生在本領域普通技術之內,并且可以涉及使用限制性內切酶或重組克隆技術。在一實施方案中,所述融合蛋白的第二多肽可以包含“核定位信號”或“NLS”。術語“核定位信號”和“NLS”指能夠介導蛋白或多核苷酸的核輸入或者其滯留在細胞核內的結構域或多個結構域。“強核輸入信號”代表當可操作地連接至所關注的蛋白時能夠介導大于90%亞細胞定位在核中的結構域或多個結構域。NLS的代表性實例包括但不限于單組分核定位信號、雙組分核定位信號以及N端和C端基序。N端堿性結構域通常符合共有序列 K-K/R-X-K/R,其最初在SV40大T抗原中發現并且代表單組分NLS。N端堿性結構域NLS的一個非限制性實例為PKKKRKV(SEQ ID NO :76)。還已知雙組分核定位信號,其含有被約10 個氨基酸的間隔分開的兩簇堿性氨基酸,如來自核質蛋白的NLS所例示KR[PAATKKAGQA] KKKK (SEQ ID NO :77)。N端和C端基序包括,例如,hnRNP Al的酸性M9結構域,酵母轉錄阻抑物Matα2中的序列KIPIK(SEQ ID NO 78)和U snRNP的復合信號。這些NLS的大部分看來直接被輸入蛋白β家族的特異性受體識別。在另一實施方案中,所述第二多肽可以為本領域已知的融合伴侶以促進純化并提高其融合的多肽的溶解度,例如,多聚組氨酸標簽、NusA、細菌鐵蛋白(BFR)、GrpE、硫氧還蛋白(TRX)或谷胱甘肽-S-轉移酶(GST)。融合蛋白的純化在本領域普通技術之內。在另一實施方案中,所述第二多肽可以為報告多肽,如自發熒光蛋白(例如,GFP、 EGFP)。自發熒光蛋白提供用于鑒定所關注的多核苷酸(和多肽產物)的表達的容易測定。 因為可以利用流式分選儀定量監測報告多肽的活性(和由此推斷其表達水平),可以順序或在大量群體中測定許多獨立的轉染子。然后可以從群體篩選或選擇具有最好表達的細胞。當選擇包含本發明的功能性AID突變體的重組細胞時這是有用的。在本發明的另一實施方案中,可以將編碼本發明的功能性AID突變體的核酸分子密碼子優化以減少或增加體細胞高變(SHM)基序的數量。如本文所用,“體細胞高變”或 “SHM”指由AID、功能性AID突變體、尿嘧啶糖基化酶和/或易錯聚合酶對多核苷酸序列的作用所啟動或與之相關的多核苷酸序列的突變。該術語包括作為初期損害的易錯修復的結果而發生的誘變,包括錯配修復機制和相關酶所介導的誘變。術語“SHM的底物”指AID和/或易錯DNA聚合酶所作用的合成或半合成多核苷酸序列,以便在該合成或半合成多核苷酸序列的核酸序列中產生變化。
如本文所用,術語“SHM熱點”或“熱點”指如通過抗體基因中SHM突變的統計學分析所確定的,表現出進行體細胞高變的趨勢增加的3-6個核苷酸的多核苷酸序列或基序。 同樣地,如本文所用,“SHM冷點,,或“冷點,,指如通過抗體基因中SHM突變的統計學分析所確定的,表現出進行體細胞高變的趨勢減少的3-6個核苷酸的多核苷酸或基序。各種SHM 的基序的相對排名以及抗體基因中的典型熱點和冷點如美國專利申請公開09/0075378和國際專利申請公開WO 08/103475所述,并且可以如其中所述將統計學分析外推至非抗體基因(例如,AID基因)中SHM突變的分析。術語“體細胞高變基序”或“SHM基序”指包括或可以改變為包括一個或多個熱點或冷點的多核苷酸序列,并且其編碼一組確定的氨基酸。SHM基序可以為任何大小,但是便于基于大小為約2至約20個核苷酸,或者大小為約3至約9個核苷酸的多核苷酸。SHM基序可以包括熱點和冷點的任何組合,或者可以缺少熱點或冷點。術語“優選熱點SHM密碼子”、“優選熱點SHM基序”、“優選SHM熱點密碼子”和“優選SHM熱點基序”均指密碼子,其包括但不限于密碼子AAC、TAC、TAT、AGT或AGC。這樣的序列可以潛在嵌入更大的SHM基序的背景之內,募集SHM介導的誘變并且在該密碼子產生靶向氨基酸多樣性。如本文所用,如果已改變核酸序列或其部分以增加或減少所述核酸序列內熱點和 /或冷點的頻率和/或位置,則所述核酸序列已“為SHM而被優化”。如果已改變核酸序列或其部分以增加所述核酸序列內熱點的頻率和/或位置,或者以減少所述核酸序列內冷點的頻率(密度)和/或位置,則已使所述核酸序列“對SHM敏感”。相反地,如果已改變核酸序列或其部分以減少所述核酸序列開放閱讀框內熱點的頻率(密度)和/或位置,則已使所述核酸序列“對SHM耐受”。總的來說,可以通過改變密碼子使用和/或核酸序列所編碼的氨基酸來產生序列,使其具有進行SHM介導的誘變的更大或更小的傾向。核酸序列的優化指修飾所述核酸序列中約1 %、約2 %、約3 %、約4 %、約5 %、 約 10%、約 20%、約 25%、約 50%、約 75%、約 90%、約 95%、約 96%、約 97%、約 98%、約 99%、約100%或其中任何范圍的核苷酸。多核苷酸序列的優化還指修飾所述核酸序列中約1個、約2個、約3個、約4個、約5個、約10個、約20個、約25個、約50個、約75個、約 90個、約95個、約96個、約97個、約98個、約99個、約100個、約200個、約300個、約400 個、約500個、約750個、約1000個、約1500個、約2000個、約2500個、約3000個或更多個或者其中任何范圍的核苷酸,從而為SHM介導的誘變優化一些或所有核苷酸。減少熱點和/ 或冷點的頻率(密度)指在核酸序列中減少約1 %、約2 %、約3 %、約4%、約5 %、約10 %、 約 20%、約 25%、約 50%、約 75%、約 90%、約 95%、約 96%、約 97%、約 98%、約 99%、約 100%或其中任何范圍的熱點或冷點。增加熱點和/或冷點的頻率(密度)指在核酸序列中增加約1%、約2%、約3%、約4%、約5%、約10%、約20%、約25%、約50%、約75%、約 90 %、約95 %、約96 %、約97 %、約98 %、約99 %、約100 %或其中任何范圍的熱點或冷點。熱點或冷點的位置或閱讀框也是控制SHM介導的誘變是否可以導致對于所得氨基酸序列沉默的突變,或者在氨基酸水平引起保守性、半保守性或非保守性變化的因素。可以操縱設計參數以進一步增加核苷酸序列對SHM的相對敏感性或耐受性。因此在SHM敏感和SHM耐受核酸序列的設計中考慮到SHM募集程度和基序的閱讀框。本發明還提供了一種包含編碼功能性AID突變體的核酸分子的載體。“載體”或“克隆載體”為復制子,如質粒、噬菌體或粘粒,可以將另一多核苷酸片段引入其中,以導致所插入片段的復制。載體典型地作為環狀、雙鏈DNA存在,并且大小范圍從幾千堿基(1Λ) 至幾百1Λ。從天然存在的質粒修飾優選克隆載體以促進多核苷酸序列的克隆和重組操作。 許多這樣的載體為本領域眾所周知;參見例如,Sambrook et al, "Molecular Cloning A Laboratory Manual,,,second edition, Cold Spring Harbor Laboratory, (1989), 禾口 Maniatis et al. , Cell Biology :A Comprehensive Treatise, Vol. 3, Gene Sequence Expression, Academic Press, NY, pp. 563-608 (1980)。如本文所用的術語“表達載體”指用于在宿主細胞或體外表達系統內表達某些多核苷酸的載體。該術語包括質粒、附加體、粘粒、反轉錄病毒或噬菌體。表達載體可以用于表達編碼期望蛋白的DNA序列,并且在一方面包括轉錄單元,所述轉錄單元包含一套表達控制序列。啟動子和其他調控元件的選擇一般根據預期的宿主細胞或體外表達系統變化。如本文所用,“體外表達系統”指使得能夠轉錄或者偶聯轉錄和翻譯DNA模板的無細胞系統。這樣的系統包括,例如,兔網織紅細胞系統以及新的無細胞合成系統 (J. Biotechnol.,110 :257-63(2004) ;Biotechnol. Annu. Rev.,10 1_3(K2004))。“表達控制序列”為DNA調控序列,如啟動子、增強子、多腺苷酸化信號、轉錄終止子、內部核糖體進入位點(IREQ等,其在宿主細胞中提供編碼序列的表達。示例性表達控制序列為本領域己知并且如Goeddel ;Gene Expression Technology =Methods in Enzymology 185, Academic Press, San Diego, Calif. (1990)所述。“啟動子”是能夠在細胞中結合RNA聚合酶并啟動下游(3'方向)編碼序列轉錄的 DNA序列。如本文所用,啟動子序列的界限在其3'端轉錄起始位點并向上游(5'方向)延伸至包括啟動在背景以上可檢測水平的轉錄所必需的最低數目的堿基或元件。在啟動子序列內會發現轉錄起始位點(通過用Sl核酸酶作圖方便地定義)以及負責結合RNA聚合酶的蛋白結合結構域(共有序列)。真核啟動子會經常但不總是含有“TATA”框和“CAT”框。 原核啟動子除-10和-35共有序列之外還含有夏因-達爾加諾(Shine-Dalgarno)序列。來自各種不同來源的大量啟動子為本領域眾所周知,包括組成型、誘導型和阻抑型啟動子。代表性來源包括例如,病毒、哺乳動物、昆蟲、植物、酵母和細菌細胞類型,并且基于在線上可公開獲得的序列或者從諸如ATCC以及其他商業或個人來源的保藏中心,來自這些來源的合適的啟動子可以很容易獲得或者合成。啟動子可以為單向(即,啟動一個方向的轉錄)或雙向(S卩,啟動3’或5’方向的轉錄)。啟動子的非限制性實例包括,例如,T7細菌表達系統、pBAD(araA)細菌表達系統、巨細胞病毒(CMV)啟動子、SV40啟動子、 RSV啟動子。誘導型啟動子包括Tet系統(美國專利第5,464,758號和第5,814,618號)、 蛻皮素誘導系統(No et al.,Proc. Natl. Acad. Sci. ,93 :3346-3351 (1996)、T-REx 系統 (Invitrogen, Carlsbad, CA) >LacSwitch (Stratagene, San Diego, CA)禾口 Cre-ERT 三苯氧胺誘導重組酶系統(Indra et al.,Nuc. Acid. Res. ,27 :4324-4327(1999) ;Nuc. Acid. Res., 28 :e99(2000);美國專利 7,112,715)。一般參見 Kramer & Fussenegger,Methods Mol. Biol.,308 :123-144(2005))或者本領域已知的適合在期望細胞中表達的任何啟動子。如果使用誘導系統,如Tet控制的系統,可以將多西環素加入培養基以誘導編碼功能性AID突變體的核酸在通過適當的測定分析之前表達一段時間(例如,1小時(hr)、 2hr、4hr、6hr、8hr、1 Ohr、15hr、20hr、24hr或任何其他時間)。可以允許細胞生長一定時間以提供持續的多樣化,例如,1-3個細胞世代,或者在某些情況下3-6個世代,或者在某些情況下6-10個世代,或者更長。如本文所用,“最小啟動子”指部分啟動子序列,其定義轉錄起始位點但如果完全通過其本身則不能有效地啟動轉錄。這樣的最小啟動子的活性依賴于諸如四環素控制的反式激活蛋白的激活蛋白的結合以可操作地連接至結合位點。術語“IRES”或“內部核糖體進入位點”指發揮作用以增強用多順反子信使RNA 編碼的編碼序列的翻譯的多核苷酸原件。IRES原件通過直接募集和結合核糖體至信使 RNA(mRNA)分子來介導翻譯的啟動,避開典型核糖體掃描中涉及的7-甲基鳥苷帽。IRES序列的存在可以增加期望蛋白的帽獨立翻譯的水平。早期出版物描述性地將IRES序列稱為 “翻譯增強子”。例如,心臟病毒RNA“翻譯增強子”,如美國專利第4,937,190和第5,770,428 號所述。如本文所用的術語“增強子”指增加例如其可操作連接的基因或編碼序列的轉錄的DNA序列。增強子可以距離編碼序列許多千堿基,并且可以介導調控因子的結合、DNA 甲基化的模式或DNA結構的變化。來自各種不同來源的大量增強子為本領域眾所周知,并且可以作為克隆多核苷酸或在克隆多核苷酸內獲得(從,例如,諸如ATCC以及其他商業或個人來源的保藏中心)。許多包含啟動子(如常用的CMV啟動子)的多核苷酸還包含增強子序列。可操作地連接的增強子可以位于編碼序列的上游、內部或下游。術語“Ig增強子”指來源于定位在Ig基因座之內的增強子區的增強子元件(這樣的增強子包括例如,重鏈(μ)5'增強子、輕鏈(κ)5'增強子、κ和μ內含增強子,以及3'增強子(一般參見 Paul WE(ed)Fundamental Immunology,3rd Edition, Raven Press, New York(1993)pages 353-363 ;美國專利 5,885,827))。“終止序列”是導致轉錄終止的序列。終止序列為本領域已知,并且包括但不限于 poly A(例如,Bgh Poly A和SV40 Poly A)終止子。轉錄終止信號會典型地包括3'非翻譯區的區域(或“3'此”)、任選的內含子(也稱為間插序列或“1¥5”)以及一個或多個多腺苷酸化信號(“P (A) ”或“pA”)。終止序列還可以稱為“IVS-pA”、“IVS+p (A),,、“3' ut+p (A),, 或“3' ut/p(A)”。天然或合成的終止子可以用作終止區。術語“多腺苷酸化”、“多腺苷酸化序列”和“多腺苷酸化信號”、“Poly A”、“p㈧,, 或“PA”指存在于RNA轉錄物中的核酸序列,當多聚腺嘌呤(polyadenyl)轉移酶存在時其允許該轉錄物被多腺苷酸化。本領域已知許多多腺苷酸化信號。非限制性實例包括人變異生長激素多腺苷酸化信號、SV40晚期多腺苷酸化信號和牛生長激素多腺苷酸化信號。“游離型表達載體”能夠在宿主細胞中復制,并且在適當的選擇壓力存在下在宿主細胞內作為染色體外DNA片段存在(參見,例如,Conese et al.,Gene Therapy 11: 1735-1742 (2004) ) 0代表性可商購的游離型表達載體包括但不限于利用EB病毒核抗原 KEpstein Barr Nuclear Antigen Ι,ΕΒΝΑΙ)禾Π EB 病毒(EBV)復制起點(oriP)的游離型質粒。來自 Invitrogen 的載體 pREP4、pCEP4、pREP7,來自 Invitrogen 的 pcDNA3. 1 和來自 Stratagene的pBK-CMV代表使用T-抗原和SV40復制起點代替EBNAl和oriP的游離型載體的非限制性實例。“整合型表達載體”可以隨機整合入宿主細胞的DNA,或者可以包括重組位點以使得表達載體和宿主細胞染色體之間能夠特異性重組。這樣的整合型表達載體可以利用宿主細胞染色體的內源表達控制序列來影響期望蛋白的表達。以位點特異性方式整合的載體的實例包括,例如,來自hvitrogen的flp-in系統的組件(例如,pcDNA 5/FRT),或者 cre-lox系統,如可以在來自Mratagene的pExchange-6核心載體中發現。以隨機方式整合入宿主細胞染色體的載體的實例包括,例如,來自^ivitrogen的pcDNA3. 1 (當在沒有T-抗原的情況下引入時),來自Promega的pCI或pFNIOA(ACT)Flexi 。代表性可商購的病毒表達載體包括但不限于可從Crucell,Inc.獲得的基于腺病毒的Per. C6系統,來自hvitrogen的基于慢病毒的pLPl,和來自Mratagene的反轉錄病毒載體 pFB-ERV 加上 pCFB-EGSH。可選地,表達載體可以用于將強啟動子或增強子序列引入和整合入細胞中的基因座,以便調節所關注的內源基因的表達(Capecchi MR. Nat Rev Genet. ,6(6) 507-12(2005) ;Schindehutte et al.,Stem Cells,23(1) 10-5 (2005)) 這種方法還可以用于將諸如Tet-On啟動子(美國專利第5,464,758號和第5,814,618號)的誘導型啟動子插入細胞的基因組DNA,以便提供所關注的內源基因的誘導型表達。激活構建體還可以包括靶向序列以使激活序列能夠同源或非同源重組入對所關注的基因特異性的期望基因座(參見,例如,Garcia-Otin and Guillou, Front. Biosci. , 11 1108-36 (2006)) 可選地,諸如Cre-ER系統的誘導性重組酶系統可以用于在4-羥基三苯氧胺存在下激活轉基因。(Indra et al.,Nuc. Acid. Res.,27 (22) :4324-4327(1999) ;Nuc. Acid. Res. ,28(23) e99(2000);美國專利 7,112,715)。本發明的載體可以包含“選擇標記基因”。如本文所用的術語“選擇標記基因”指在相應選擇劑的存在下允許攜帶多核苷酸的細胞被特異性選擇或不選擇的多核苷酸。選擇標記可以為正、負或雙功能的。正選擇標記允許選擇攜帶該標記的細胞,而負選擇標記允許攜帶該標記的細胞被選擇性消除。選擇標記多核苷酸可以直接連接至待表達的多核苷酸,或者通過共轉染引入相同細胞。已描述了各種這樣的標記多核苷酸,包括,例如,雙功能(即正/負)標記(參見,例如,國際專利申請公開WO 92/08796和WO 94/28143), 耐藥基因(例如,氨芐青霉素),和賦予細胞抑制藥或殺細胞藥抗性的蛋白(例如,DHFR蛋白)(參見,例如,Wigler et al. , Proc. Natl. Acad. Sci. USA, 77 :3567 (1980), 0' Hare et al.,Proc. Natl. Acad. Sci. USA, 78 :1527(1981), Mulligan & Berg,Proc. Natl. Acad. Sci. USA, 78 :2072 (1981),Colberre-Garapin et al. ,J. Mol. Biol. ,150 1 (1981),Santerre et al.,Gene,30 :147(1984),Kent et al. , Science,237 :901-903(1987), Wigler et al., Cell, 11:223(1977),Szybalska & Szybalski,Proc. Natl. Acad. Sci. USA,48 :2026(1962), Lowy et al.,Cell, 22 :817 (1980),和美國專利第 5,122,464 號和第 5,770,359 號)。所述載體可以包含“報告基因”。“報告基因”指典型地當用所關注的細胞表達時賦予被特異性檢測(或者檢測和選擇)能力的多核苷酸。本領域已知許多報告基因系統, 并且包括例如堿性磷酸酶(Berger, J.,et al.,Gene, 66 :1-10(1988) ;Kain, SR.,Methods Mol. Biol. ,63 :49-60 (1997))、β -半乳糖苷酶(美國專利5,070,012)、氯霉素乙酰轉移酶 (Gorman et al.,Mol. Cell. Biol.,2 :1044-51 (1982) )、β 葡糖醛酸酶、過氧化物酶、β 內酰胺酶(美國專利第5,741,657號和第5,955,604號)、催化性抗體、螢光素酶(美國專利第 5,221,623 號;第 5,683,888 號;第 5,674,713 號;第 5,650,289 號;第 5,843,746 號)和天然熒光蛋白 CTsien,RY, Annu. Rev. Biochem. ,67 :509-544 (1998))。術語“報告基因,,還包括在使用一種或多種能夠或期望(或期望不)與所關注的肽相互作用以產生可檢測信號的抗體、表位、結合伴侶、底物、修飾酶、受體或配體的基礎上能夠被特異性檢測的任何肽。報告基因還包括可以調節細胞表型的基因。當為這樣的檢測目的時,報告蛋白不需要與突變 AID蛋白融合。其可以通過也編碼突變AID蛋白的相同多核苷酸(例如,載體)編碼,并且共引入靶細胞和在靶細胞中共表達。表達載體還可以包括反義、核酶或SiRNA多核苷酸以減少靶序列的表達(參見,例如,Sioud M, & Iversen,Curr. Drug Targets,6 :647-53 (2005) ;Sandy et al., Biotechniques,39 :215-24(2005)) 本發明還提供了包含編碼功能性AID突變體的核酸分子的細胞或者包含編碼功能性AID突變體的核酸分子的載體。術語“細胞”、“細胞培養物”、“細胞系”、“重組宿主細胞”、“受體細胞”和“宿主細胞”常可交換使用,并且包括原代主體細胞(primary subject cell)及其任何子代,不考慮傳代次數。應當理解不是所有子代與親代細胞完全相同(由于有意或無意的突變或者環境的差異)。然而,這樣改變的子代包括在這些術語中,只要該子代保持與原始轉化的細胞相同的功能性。例如,但是不限于,這樣的特征可以是產生特定重組蛋白的能力。“增變基因陽性細胞系”是含有足以與其他載體元件聯合工作以影響高變的細胞因子的細胞系。該細胞系可以是本領域已知或本文所述的任何細胞系。“克隆”是通過有絲分裂來源于單個細胞或共同祖先的細胞群體。基于細胞的表達和高變系統包括任何合適的原核或真核表達系統。優選系統是可以容易和可靠生長,具有相當快的生長速率,具有良好表征的表達系統并且可以容易和高效轉化或轉染的系統。有用的微生物細胞包括但不限于來自芽孢桿菌屬、埃希氏菌屬(如大腸桿菌)、假單胞菌屬、鏈霉菌屬、沙門氏菌屬、歐文氏菌屬、枯草芽孢桿菌(Bacillus subtilis)、短芽孢桿菌(Bacillus brevis)的細胞。特別有用的原核細胞包括大腸桿菌的各種菌株(例如, K12、HBlOl、(ATCC NO. 33694)DH5α、DH10、MC1061 (ATCC NO. 53338)和 CC102)。本領域技術人員已知的許多酵母細胞菌株也可作為宿主細胞用于多肽的表達,包括來自漢遜酵母屬、克魯維酵母屬、畢赤酵母屬、紅冬孢酵母屬(Miino-sporidium)、酵母屬和裂殖酵母屬以及其他真菌的細胞。優選的酵母細胞包括,例如,釀酒酵母(Saccharomyces cerivisae)禾口畢赤酵母(Pichia pastoris)。另外,在需要時,在本發明的方法中可以使用昆蟲細胞系統。這樣的系統例如 Kitts et al. , Biotechniques,14 :810-817(1993) ;Lucklow, Curr. Opin.Biotechnol. ,4 564-572(1993);和 Lucklow et al. , J. Virol. , 67 :4566-4579 (1993)所述。優選的昆蟲細胞包括 Sf-9 和 HI5 (Invitrogen, Carlsbad, Calif.)。包含編碼功能性AID突變體的核酸的細胞優選為哺乳動物細胞。本領域也已知許多合適的哺乳動物宿主細胞,并且許多可從美國典型培養物保藏中心(ATCC,Manassas,VA) 獲得。合適的哺乳動物細胞的實例包括但不限于中國倉鼠卵巢細胞(CHO) (ATCC No. CCL61) CHO DHFR 細胞(Urlaub et al.,Proc. Natl. Acad. ki. USA,97 :4216-4220 (1980)),人胚腎(HEK) 293 或 293T 細胞(ATCC No. CRL1573),和 3T3 細胞(ATCC No. CCL92)。本領域已知合適的哺乳動物宿主細胞的選擇以及用于轉化、培養、擴增、篩選及產物產生和純化的方法。其他合適的哺乳動物細胞系為猴C0S-1 (ATCC No. CRL1650)和C0S-7細胞系(ATCCNo. CRL1651),以及CV-I細胞系(ATCC No. CCL70)。其他示例性哺乳動物宿主細胞包括靈長類細胞系和嚙齒類細胞系,包括轉化的細胞系。來源于初生組織以及初級外植體的體外培養的正常二倍體細胞、細胞株也是合適的。候選細胞可以為選擇基因基因型缺陷,或者可以含有顯性作用的選擇基因。其他合適的哺乳動物細胞系包括但不限于小鼠成神經細胞瘤 N2A細胞,HeLa,小鼠細胞,來源于Swiss、Balb_c或NIH小鼠的3T3系,BHK或HaK倉鼠細胞系,它們可以從ATCC獲得。淋巴或淋巴來源的細胞系也在本發明的范圍之內,如前B淋巴細胞來源的細胞系。具體實例不限制地包括 RAMOS (CRL-1596)、Daudi (CCL-213)、EB-3 (CCL-85)、 DT40(CRL-2111),18-81(Jack et al.,Proc. Natl. Acad. Sci. USA, 85 1581-1585 (1988)), Raji細胞(CCL-86)及其衍生物。可以通過“轉染”、“轉化”或“轉導”將本發明的功能性AID突變體引入細胞。如本文所用的“轉染”、“轉化”、或“轉導”指通過利用一種或物理或化學方法將一種或多種外源多核苷酸引入宿主細胞。本領域普通技術人員已知許多轉染技術,其包括但不限于磷酸鈣 DNA共沉淀(參見Methods in Molecular Biology, Vol. 7,Gene Transfer and Expression Protocols, Ed. E. J. Murray, Humana Press (1991)) ;DEAE-葡聚糖;電穿孔;陽離子脂質體介導的轉染;鎢粒促進的微粒轟擊(Johnston,S. A. ,Nature,346 :776-777(1990));和磷酸鍶 DNA 共沉淀(Brash D. Ε. et al. Molec. Cell. Biol.,7 :2031-2034 (1987)。在感染性顆粒在可商購的包裝細胞中生長之后,可以將噬菌體或反轉錄病毒載體引入宿主細胞。本發明還提供了一種用于制備具有期望特性的基因產物的方法,所述方法包括在細胞群體中表達編碼所述基因產物的核酸,其中所述細胞群體表達或能夠被誘導以表達本發明的功能性AID突變蛋白,由此所述功能性AID突變蛋白的表達在編碼所述基因產物的核酸中誘導突變。上文所示與本發明的其他實施方案有關的功能性AID突變體、細胞以及將核酸分子轉染入細胞并在其中表達的方法的描述也可以應用于上述方法的相同方面。期望地,功能性AID突變蛋白通過體細胞高變(SHM)的方式在編碼基因產物的核酸中誘導突變。SHM系統中AID的用途在美國專利申請公開09/0075378以及國際專利申請公開W0/08103474和WO 08/103475中詳述。如本文所用,術語“所關注的基因產物”或 “所關注的蛋白”涉及蛋白或其部分,對其期望為了 SHM通過功能性AID突變體優化編碼基因產物的核酸,以便快速產生、選擇和鑒定該基因產物的改進變體。作為密碼子使用的結果可以使這樣優化的核酸序列對SHM更敏感(如本文所述),從而在多核苷酸面對功能性AID 突變體時誘導氨基酸變化,并且篩選改進的功能。相反地,作為密碼子使用的結果可以使這樣優化的核酸序列對SHM更耐受(如本文所述),從而在多核苷酸面對功能性AID突變體時減少氨基酸變化,并且篩選改進的功能。氨基酸或相應核苷酸序列已知或可用(例如,如本文所述可以克隆入載體),并且表型或功能可以改進的任何蛋白是用于本發明方法的候選。合適的蛋白的實例包括,例如, 來自任何未修飾或合成來源的表面蛋白、胞內蛋白、膜蛋白和分泌蛋白。所述基因產物優選為抗體重鏈或其部分、抗體輕鏈或部分、酶、受體、結構蛋白、輔因子、多肽、肽、胞內抗體、選擇標記、毒素、生長因子、肽類激素或者可以被優化的任何其他蛋白。所述基因產物可以是任何合適的酶,包括與微生物發酵、代謝途徑工程、蛋白生產、生物除污以及植物生長和發育有關的酶(參見,例如,Olsen et al. , Methods Mol.Biol. ,230 :329-349(2003) ;Turner, Trends Biotechnol.,21(11) :474-478(2003) ;Zhao et al. , Curr. Opin. Biotechnol. ,13(2) :104-110(2002);禾口 Mastrobattista et al., Chem. Biol.,12(12) 1291—300(2005))。用于本發明方法的合適的受體包括但不限于諸如抗體的結合細胞的受體(B細胞受體)、T細胞受體、Fc受體、G偶聯蛋白受體、細胞因子受體、糖受體和基于Avimer 的受體。可以通過SHM改變這樣的受體以改進一種或多種以下性狀親和力、親和性、選擇性、熱穩定性、蛋白水解穩定性、溶解度、二聚化、折疊、免疫毒性、偶聯至信號轉導級聯系統和表達。用于本發明方法的合適的基因產物還包括能夠調節其他生物活性蛋白的藥物代謝動力學和/或藥物動力學的分子,例如,脂質和聚合物,如聚胺、聚酰胺、聚乙二醇和其他聚醚。用于本發明方法的合適的基因產物的其他實例包括多肽,如VEGF、VEGF受體、白喉毒素亞基A、百日咳桿菌(B. pertussis)毒素、CC趨化因子(例如,CCL1_CCI^8)、CXC趨化因子(例如,CXCLI-CXCL16)、C趨化因子(例如,XCLl和XCL2)和CX3C趨化因子(例如, CX3CL1)、IFN- y , IFN-α、IFN-β、TNF-α、TNF-β、IL-U IL-2, IL-3, IL-4, IL-5, IL-6, IL-7、IL-10、IL-12、IL-13、IL-15、TGF- β、TGF- α、GM-CSF、G-CSF、M-CSF、TPO、EPO、人生長因子、成纖維細胞生長因子、核輔因子、家族成員、諸如趨化因子受體的G蛋白信號分子、JNK、Fos-Jun、NF-K Β、Ι-κ B、CD40、CD4、CD8、B7、C^8 和 CTLA-4。用于選擇所關注的基因產物(例如,蛋白)作為通過SHM的突變和優化的合適候選的方法以及相關篩選測定在美國專利申請公開09/0075378以及國際專利申請公開W0/08103474和WO 08/103475 中進一步公開。在本發明的一優選實施方案中,通過功能性AID突變蛋白進行突變的核酸序列編碼抗體或其部分。編碼所有天然存在的種系、親和力成熟、合成或半合成的抗體以及其片段的核酸序列可以用于本發明。總的來說,可以通過SHM改變這樣的抗體編碼序列以改進一種或多種以下功能性狀親和性、親和力、選擇性、熱穩定性、蛋白水解穩定性、溶解度、折疊、免疫毒性和表達。根據抗體形式,可以產生包含分離的重鏈和輕鏈文庫的文庫,所述重鏈和輕鏈文庫可以在宿主細胞中共表達。在某些實施方案中,全長抗體可以被分泌(或釋放),和/或在宿主細胞的質膜表面展示。在其他實施方案中,可以將重鏈和輕鏈文庫插入相同表達載體或不同表達載體以使兩條抗體鏈能夠同時共進化。因此,本發明方法提供了繞過需要體內免疫來選擇結合至關鍵表面表位的抗體的能力,其與產生對靶蛋白功能最穩健的生物學影響一致。此外,哺乳動物抗體本質上具有靶向SHM的最優密碼子使用模式,這大大簡化了模板設計方法。對于某些抗原,體內免疫導致不影響靶功能的表位選擇,從而阻礙選擇有力和有效的抗體候選。在其他實施方案中,本發明方法可以通過決定靶蛋白功能的表位的作用的性質提供具有有效活性的位點定向抗體的快速進化。這提供了掃描靶蛋白的最佳表位位置和產生用于臨床的同類中最佳的抗體藥物的能力。本發明方法可以用于增加抗體或其片段(例如,F(ab' )2、Fab'、Fab、FV、ScFV、 dsFv、dAb或單鏈結合多肽)的特定亞結構域中的熱點密度,這可以導致特征的改進(例如, 增加的結合親和力、增加的結合親和性和/或減少的非特異性結合)。本發明方法還可以用于產生在恒定結構域(例如,Fe)中具有增加的熱點的合成抗體,這可以導致對Fc受體(FcR)的結合親和力增加,從而調節信號級聯。利用本文所述的方法可以同時修飾重鏈和輕鏈或者其部分。可以利用本發明方法修飾胞內抗體以改善或促進重鏈和/或輕鏈在胞漿的還原環境中的折疊。可選地或另外,可以修飾sFv胞內抗體以穩定可以在沒有域內二硫鍵的情況下正確折疊的框架。還可以修飾胞內抗體以增加例如一種或多種以下特征結合親和力、 結合親和性、表位可接近性、與內源蛋白競爭靶表位、半衰期、靶螯合、靶蛋白的翻譯后修飾等。因為胞內抗體在細胞內發揮作用,所以其活性與用于酶活性測定的測定方法更類似。本領域已知用于設計和創建抗體文庫的方法,以及用于鑒定提供具有優良選擇性的抗體的選擇、跨物種反應性和阻斷活性的最優表位的方法(參見,例如,美國專利申請公開09/0075378以及國際專利申請公開WO 08/103474和WO 08/103475)。檢測和選擇具有改進性狀的表面暴露或分泌抗體的特異性篩選為本領域眾所周知。這樣的篩選可以包括幾輪選擇,所述選擇基于諸如親和力、親和性、選擇性和熱穩定性的多個參數的同時選擇,以便進化整體最佳的抗體。應當理解有各種其他組成核苷酸序列,如編碼序列和遺傳元件,本領域普通技術人員會優選功能性突變AID蛋白不突變以保持整個系統完整性。這些組成核苷酸序列如本文所述,并且包括但不限于(i)選擇標記,(ii)報告基因,(iii)基因調控信號,(iv)用于高水平增強的SHM或者其調控或測量的酶或輔助因子(例如,AID或功能性AID突變體、pol eta、轉錄因子和MSH2,(ν)信號轉導組分(例如,激酶、受體、轉錄因子),和(vi)蛋白的結構域或亞結構域(例如,核定位信號、跨膜結構域、催化結構域、蛋白-蛋白相互作用結構域以及其他蛋白家族保守基序、結構域和亞結構域)。根據所關注的基因產物的性質,和可獲得的關于所關注的基因產物的信息量,本領域普通技術人員可以在實施本發明方法之前或與之聯合進行以下策略的任何組合以制備具有期望特性的所關注的基因產物。1.無SHM優化雖然可以期望增加在編碼所關注的基因產物的核酸序列內的熱點數,但是應當注意到預期任何未修飾的核酸序列進行一定量的SHM,并且可以用于本發明方法,而不需要優化或實際序列的任何具體知識。而且,某些蛋白(例如,抗體)天然包含進化出合適的密碼子使用的核酸序列,并且不需要密碼子修飾。可選地,可以期望增加在編碼所關注的基因產物的核酸序列(例如,抗體或其片段的框架區)內的冷點數。2.整體SHM熱點優化在一些方面,可以增加編碼基因產物的核酸序列中的熱點數,如美國專利申請公開09/0075378和國際專利申請公開WO 08/103475所詳述。這種方法可以應用于所述核酸序列的整個編碼區,從而使整個核酸序列對SHM更敏感。如果關于基因產物或者相關同種型之間的結構活性關系知道的相對較少,可以優選這種方法。3.選擇性SHM熱點修飾可選地,可以如美國專利申請公開09/0075378和國際專利申請公開WO 08/103475所述,通過用合成的可變區靶向代替所關注的區域來選擇性和/ 或系統性修飾編碼所關注的蛋白的核酸序列,這提供高密度的熱點并且通過在特定基因座的SHM種下最大多樣性。基于上文所述,本領域普通技術人員會理解任何或全部上述方法可以與本發明方法聯合進行。然而,用于整體SHM熱點優化和選擇性SHM熱點修飾的方法可能導致蛋白功能更快和更高效優化。
設計編碼所關注的基因產物的SHM優化的核酸序列之后,可以利用標準方法合成并測序以證實正確合成。一旦證實所述核酸序列的序列,可以將所述核酸序列插入如本文所述的載體,然后可以將該載體引入如本文所述的宿主細胞。可以將增強子(例如,Ig增強子)插入載體以增加表達,和/或將功能性AID突變蛋白啟動的SHM靶向編碼所關注的基因產物的核酸序列。按照本發明方法,可以將本文所述的任何載體與含有編碼如本文所述的功能性 AID突變體的核酸序列的不同載體共轉染入宿主細胞。在一方面,可以將本文所述載體轉染入含有(和表達)內源性AID蛋白的宿主細胞。在另一方面,可以將本文所述載體與含有功能性AID突變體的核酸序列的不同載體共轉染入含有內源性AID蛋白的宿主細胞,從而功能性AID突變體在細胞中過量表達。在另一方面,可以修飾本文所述載體以包含編碼功能性AID突變體的核酸序列,用于轉染入含有或不含有內源性AID蛋白的宿主細胞。在一優選實施方案中,功能性AID突變體是由SHM耐受的核酸序列編碼的合成AID。將一種或多種核酸引入表達載體之后,可以將所述載體擴增,純化,利用標準轉染技術引入宿主細胞和利用標準分子生物學技術表征。可以利用標準轉染/轉化技術將純化的質粒DNA引入宿主細胞,并且使所得的轉化子/轉染子在含有抗生素、選擇劑和/或激活 /反式激活蛋白信號(例如,誘導劑,如多西環素)的適當培養基中生長以誘導編碼所關注的基因產物的核酸序列的表達。本發明方法還可以包括將以下一種或多種核酸序列引入細胞或細胞群體(i)至少一種核酸序列,其全部或部分從相應的野生型核酸序列改變為正面影響該核酸序列所經歷的SHM率,或者在任何修飾之前天然具有高百分比熱點的核酸序列,和/或(ii)全部或部分改變為負面影響SHM率的核酸序列。在一方面,本發明方法還可以包括將一種或多種核酸序列引入細胞或細胞群體, 所述核酸序列從相應的野生型核酸序列改變為負面影響SHM率。所述核酸序列可以編碼, 例如,一種或多種用于SHM的因子(例如AID、Pol eta、UDG)、一種或多種選擇標記基因或者一種或多種報告基因。在另一方面,本發明方法還可以包括將一種或多種核酸序列引入細胞或細胞群體,所述核酸序列全部或部分從相應的野生型核酸序列改變為正面影響SHM率。所述核酸序列可以編碼,例如,所關注的酶、受體、轉錄因子、結構蛋白、毒素、輔因子或特異性結合蛋白。在另一方面,本發明方法還可以包括將本質上具有高SHM率的核酸序列引入細胞或細胞群體,例如,編碼免疫球蛋白重鏈或免疫球蛋白輕鏈的核酸序列,或者抗體基因的高變區。本發明方法的細胞或細胞群體還可以包含一種或多種以下額外的元件(i)誘導系統,以調控AID、AID同系物或本發明的功能性AID突變體的表達,(ii) 一種或多種Ig增強子,(iii) 一種或多種E框,(iv) —種或多種SHM的輔助因子,(ν) —種或多種用于穩定游離型表達的因子,如EBNA1、EBP2或ori-P,(vi) 一種或多種選擇標記基因,(vii) 一種或多種含有AID、AID同系物或本發明的功能性AID突變體的基因的第二載體,或者(viii)它們的組合。在本發明的另一方面,所述方法包括表達兩個核酸序列,每個核酸序列編碼一種所關注的基因產物,其中兩個核酸序列均靠近啟動子,并且在相同細胞中同時表達和共進化。所述啟動子可以是雙向啟動子,如雙向CMV啟動子。在另一實施方案中,將所關注的兩個核酸序列置于兩個單向啟動子之前。所述兩個啟動子可以是相同啟動子或不同啟動子。 所關注的兩個核酸序列可以在相同載體中或在不同載體上。所述細胞或細胞群體組成型表達或能夠被誘導以表達如本文所述的功能性突變 AID蛋白。功能性突變AID蛋白的表達在編碼所述基因產物的核酸序列中誘導突變。所述細胞或細胞群體還可以表達增強AID介導的所述核酸序列突變的其他因子。作為本發明方法的結果,實現了編碼所關注的基因產物的核酸序列的持續序列多樣化。經過一段適當的時間之后(例如,2-10次細胞分裂),可以篩選包含所關注的基因產物的變體的所得宿主細胞,鑒定改進的突變體并從所述細胞群體分離。可以如本文所述使細胞迭代生長、測定和選擇,以選擇性富集表現出期望特性的表達編碼所關注的基因產物的核酸序列的細胞。合適的測定和富集方法(例如,熒光激活細胞分選術(FACS)、親和分離、酶活性、毒性、受體結合、生長刺激等)為本領域已知,并且如美國專利申請公開09/0075378以及國際專利申請公開 W008/103475 和 WO 08/103474 所述。在本發明的一實施方案中,可以改造編碼所關注的基因產物的核酸序列,從而將所關注的基因產物展示在細胞表面。在這個方面,可以通過創造將所關注的蛋白符合讀框地偶聯至合適的跨膜結構域的嵌合分子來創造細胞表面展示的蛋白。在哺乳動物細胞表達的情況下,例如,可以使用MHCl型跨膜結構域,如來自ffikk(包括周跨膜結構域 (peri-transmembrane domain)、跨膜結構域和胞漿結構域;NCBI基因登錄號AK15;3419) 的跨膜結構域。同樣地,本領域很好地建立了原核細胞(如大腸桿菌和葡萄球菌)、昆蟲細胞和酵母中蛋白的表面表達(參見,例如,Winter et al.,Annu. Rev. Immunol. ,12 433-55(1994) ;Pluckthun A. Bio/Technology,9 :545-551(1991) ;Gunneriusson et al., J.Bacteriol.,78 :1341-1346(1996) ;Ghiasi et al. , Virology,185 :187-194(1991); Boder and ffittrup, Nat. Biotechnol. ,15 :553-557(1997);禾口 Mazor et al. , Nat. Biotechnol. ,25(5) :563-565(2007)) 可以通過分泌然后結合(或締合)細胞表面上的分泌蛋白來產生表面展示的抗體或蛋白。抗體或蛋白綴合至細胞膜可以在蛋白合成期間或蛋白從細胞分泌之后發生。綴合可以通過共價鍵、結合相互作用(例如,特異性結合成員所介導的)或者共價和非共價鍵的組合發生。還可以通過創造抗體或結合蛋白融合蛋白來將蛋白偶聯至細胞,所述融合蛋白包含特異性結合至所關注的靶標的第一特異性結合成員,該第一特異性結合成員融合至特異性展示在細胞表面的第二結合成員(例如,在利用A蛋白和Fc結構域的結合的情況下 A蛋白在細胞表面表達并附著至細胞表面,并且結合和定位分泌抗體(或作為Fc融合蛋白表達的所關注的蛋白))。在有些情況下可以期望將表面展示的蛋白轉換為從細胞釋放或脫落的蛋白用于進一步表征。可以通過使用特異性接頭來完成轉換,所述接頭可以通過與選擇性蛋白酶孵育來切割,如χ因子、凝血酶或任何其他選擇性蛋白水解劑。還可以包括使得能夠在載體中遺傳操作所編碼的蛋白(即,允許從蛋白閱讀框切除表面附著信號)的核酸序列。這樣的遺傳操作可以利用重組系統完成。如本文所用,“重組系統”指為了并入所關注的基因而允許載體和染色體之間重組的系統。重組系統為本領域已知,并且包括,例如,Cre/Lox系統和 FLP-IN 系統(參見,例如,Abremski et al.,Cell,32 :1301-1311 (1983),和美國專利4,959,317號、5,654,182號和5,677,177號)。例如,插入一個或多個單一限制位點, 或cre/lox元件,或其他重組元件,使得能夠按需要選擇性去除附著信號并隨后在細胞內積累(或分泌)所關注的蛋白。其他實例包括在附著信號(如跨膜結構域)周圍插入側翼 IoxP位點,以允許所關注的蛋白的高效細胞表面表達。然而,當在細胞中表達ere重組酶時,LoxP位點之間發生重組,導致附著信號的丟失,并且因此導致所關注的蛋白的釋放或脫落。可以利用各種標準生理、藥理和生化方法篩選通過本發明方法所產生的基因產物的期望特性(例如,可選擇或改進的表型)。這樣的測定包括例如,生化測定,如結合測定、 熒光偏振測定、溶解度測定、折疊測定、熱穩定性測定、蛋白水解穩定性測定和酶活性測定 (一般參見 Glickman et al. , J. Biomolecular Screening, 7 (1) :3-10(2002) ; Salazar et al.,Methods. Mol. Biol.,230 :85-97 (2003)),以及一系列基于細胞的測定,包括基于信號轉導、游動性、全細胞結合、流式細胞術和熒光激活細胞分選術(FACS)的測定。當所述基因產物為抗體或其片段時,可以利用本領域公知的測定(例如,酶聯免疫吸附測定(ELISA)、 酶聯免疫吸附斑點(ELISP0T測定)、突變IgH鏈的凝膠檢測和熒光檢測、斯卡查德分析、 BIACOR分析、蛋白印跡、聚丙烯酰胺凝膠(PAGE)分析、放射免疫測定等,其可以測定結合親和力、結合親和性等)進一步分析所述抗體或其片段的表型/功能。可以通過任何本領域公知的測定來富集表達如本文所述的合成或半合成文庫編碼的所關注的蛋白的細胞,所述測定包括但不限于將肽偶聯至微粒的方法。許多FACS和高通量篩選系統是可商購的(參見,例如,Zymark Corp.,Hopkinton, Mass. ;Air Technical Industries, Mentor, Ohio ;Beckman Instruments Inc., Fullerton, Calif. ;Precision Systems, Inc.,Natick, Mass.),使得這些測定能夠以高通量模式運行。這些系統典型地自動化整個過程,包括所有樣品和試劑移液,液體分配定時孵育和在適合所述測定的檢測器中的微量培養板的最終讀數。這些可配置的系統提供高通量和快速的啟動以及高度的靈活性和定制性。這樣的系統的制造商提供各種高通量系統的詳細方案。因此,例如,Zymark Corp.提供描述用于檢測基因轉錄、配體結合等的調節的篩選系統的技術公告。可以在本發明方法的上下文使用的示例性篩選測定如美國專利申請公開 09/0075378以及國際專利申請公開WO 08/103475和WO 08/103474所述。一旦獲得所關注的細胞群體,就可以獲得(rescue)所關注的核酸序列,并且測序和鑒定相應的突變。例如,可以通過SV40T抗原的共表達擴增總mRNA或染色體外質粒 DNA (J. Virol.,62 (10) :3738-3746 (1988)),和/或從細胞提取總mRNA或染色體外質粒DNA 并用作聚合酶鏈反應(PCR)或反轉錄(RT)-PCR的模板以利用適當的引物克隆修飾的核酸序列。可以將突變核酸序列亞克隆入載體并在大腸桿菌中表達。可以將標簽(例如,His-6 標簽)加至羧基端以利用層析促進蛋白純化。所得的數據可以用于填充數據庫,連接特定氨基酸取代與一種或多種期望特性的變化。然后這樣的數據庫可以用于重組有利突變或者在新鑒定的所關注的區域中設計具有靶向多樣性的下一代多核苷酸文庫,例如編碼蛋白的功能性部分的核酸序列。當所關注的基因產物為抗體或其片段時,可以利用可變重鏈(Vh)前導區和/或可變輕鏈前導區特異性有義引物和同種型特異性反義引物通過PCR提取DNA。可選地,可以從選擇分選的細胞群體分離總RNA,并且利用可變重鏈(Vh)前導區和/或可變輕鏈前導區特異性有義引物和同種型特異性反義引物使其進行RT-PCR。可以利用標準方法將克隆測序,并且可以分析所得序列的核苷酸插入和缺失頻率、受體修正(revision)和V基因選擇。然后可以使細胞重新生長,重新誘導SHM和重新篩選,經過若干循環以引起期望功能的迭代改進。在任何點,可以獲得編碼所關注的基因產物的核酸序列和/或進行測序以監測正在進行的誘變。本發明還提供了一種用于將生物體突變以具有期望表型的方法,所述方法包括在所述生物體中表達或誘導表達功能性AID突變蛋白,由此所述功能性突變AID蛋白的表達在所述生物體的染色體DNA內誘導突變。所述生物體期望為原核生物(例如,細菌)或真核生物。所述真核生物可以為無脊椎動物或脊椎動物,但是優選為脊椎動物。更優選地,所述生物體為哺乳動物。最優選地,所述生物體為小鼠。包含編碼功能性突變AID蛋白的核酸序列的本文所述的載體可以用于上述將生物體突變的方法。實際上,這樣的載體可以用于利用本領域已知的常規方法產生功能性突變AID蛋白的轉基因小鼠(參見,例如,Methods Mol. Med.,99 :255-67 (2004))。在一實施方案中,包含編碼功能性突變AID蛋白的核酸的載體可以用于產生轉基因小鼠,其中內源性AID基因未被破壞。在另一實施方案中,包含編碼功能性突變AID蛋白的核酸的載體可以用于產生轉基因小鼠,其中將編碼功能性AID突變體的核酸序列插入內源(即,染色體)AID基因座以產生“敲入”小鼠,從而阻止內源性AID的表達。在某些實施方案中,轉基因小鼠包含功能性突變AID蛋白,其表達可以通過例如組織特異性啟動子或其他誘導型啟動子來調控(例如,多西環素或四環素(參見,例如,Curr. Opin. Biotechnol. ,13(5) 448-52(2002)).在另一實施方案中,所述生物體包含至少一種為SHM而被密碼子優化的核酸序列以增加上文所述方法的SHM基序的數量。無論什么方法用于產生轉基因小鼠,功能性突變AID蛋白的表達在小鼠的染色體 DNA內誘導突變。一旦按照本發明方法在生物體中發生誘變,則優選利用本領域已知和本文所述的方法選擇和/或篩選所述生物體內的一個細胞或多個細胞的期望表型。本文所述的發明方法還可以用于產生轉基因動物,其產生針對所關注的抗原或其表位的抗體。在一方面,本發明方法優選用于產生轉基因小鼠,其產生單克隆抗體。用于產生單克隆抗體的方法為本領域已知,并且例如,參見IOjhler and Milstein, Eur. J. Immunol. ,5 :511-519(1976), Harlow and Lane(eds.), Antibodies :A Laboratory Manual, CSH Press (1988), 禾口 C.A. Janeway et al. (eds. ), Immunobiology,5th Ed., Garland Publishing, New York, NY(2001))所述。期望抗體可以是如本文所述的任何天然或合成來源的抗體,或者其任何抗原結合片段。此外,所述抗體可以是非人抗體、人源化抗體或全人抗體。優選地,所述抗體為人源化抗體。非人(例如,小鼠)抗體的“人源化”形式是嵌合抗體,其含有來源于非人免疫球蛋白的最小序列。對于大部分,人源化抗體為人免疫球蛋白(受體抗體),其中所述受體的高變區殘基被來自諸如小鼠、大鼠、兔或非人靈長類的非人物種(供體抗體)的具有期望特異性、親和力和能力的高變區殘基所代替。在某些情況下,人免疫球蛋白的框架區(FR)殘基被相應的非人殘基代替。此外,人源化抗體可以包含在受體抗體或供體抗體中未發現的殘基。進行這些修飾以進一步完善抗體性能。人源化抗體基本上可以包含所有的至少一個和在某些情況下兩個可變結構域,其中所有或基本上所有高變區對應非人免疫球蛋白的高變區,并且所有或基本上所有FR為人免疫球蛋白序列的FR。所述人源化抗體還會任選包含至少部分免疫球蛋白恒定區(Fe),典型為人免疫球蛋白恒定區。為了了解詳情,參見Jones et al.,Nature,321 :522-525(1986),Reichmann et al.,Nature,332 :323-329(1988),和 Presta, Curr. Op. Struct. Biol.,2 :593-596 (1992)。在另一實施方案中,可以通過將小鼠 CDR移植入人抗體框架來人源化單克隆抗體而基本上不干擾所述抗體結合抗原的能力。制備人源化抗體的方法一般為本領域眾所周知,并且可以容易地應用于本文所述方法所產生的抗體。在本發明的一優選實施方案中,利用包含用小鼠轉基因株培育的功能性AID突變蛋白的轉基因小鼠產生人源化或全人抗體,所述小鼠轉基因中的內源小鼠抗體基因表達被抑制并且被人抗體基因表達有效代替。其中內源抗體基因被人抗體基因有效代替的轉基因小鼠的實例包括但不限于HuMAb-Mouse 、Kirin TC MouseTM禾Π KM-Mouse (參見,例如,Lonberg N. Nat. Biotechnol. ,23(9) :1117-25(2005)禾口 Lonberg N. Handb. Exp. Pharmacol.,181 :69-97(2008))。
實施例以下實施例進一步說明本發明,但是不應當理解為以任何方式限制其范圍。實施例1本實施例說明了利用乳突形成測定篩選DNA的活性增變基因的方法。乳突形成測定已用于篩選在DNA修復的某些方面缺陷的大腸桿菌突變體(Nghiem et al.,Proc. Natl. Acad. ki.USA,85 :2709-17(1988)和 Ruiz et al. ,J. Bacteriol. , 175 4985-89(1993))。對于乳突形成測定,將質粒pTrc9944中的AID/AP0BEC cDNA轉化入攜帶 F’lacI-Z-proAB+附加體的大腸桿菌K12菌株CC102 araA (IacproB) ΧΙΠ,其中IacZ基因在密碼子 461 處攜帶 GAG- > GGG 錯義突變(Cupples et al. ,Proc. Natl. Acad. Sci. USA, 86 5345-49 (1989)),并且平板接種在補充了氨芐青霉素(100 μ g/ml)和異丙基β-D-I-硫代半乳糖苷(IPTG;lmM)的MacConkey-乳糖瓊脂(BD Biosciences)上。將平板在37°C下孵育4天,乳突在3天后可見。通過將在補充了氨芐青霉素(100 μ g/ml)和IPTG(ImM)的LB培養基中生長過夜至飽和的培養物平板接種在M9+0. 2%乳糖瓊脂上來測定CC102 [pTrc99-AID/AP0BEC]轉化子回復突變為Lac+的頻率。通過用從12個獨立培養物測定的每個中位數確定平板接種的每IO7個活細胞選擇存活的菌落形成細胞的中位數來測量突變頻率。通過將PCR擴增的 IacZ的相關部分測序來確定突變的性質(5,-AGAATTCCTGAAGTTCAGATGT(SEQ ID NO :79)禾口 5,-GGAATTCGAAACCGCCAAGAC(SEQ ID NO :80))。在IacZ內帶有錯義突變的大腸桿菌細胞在MacConkey-乳糖平板上產生白色菌落在這樣的白色菌落內,經常可以看到少量紅色小菌落(乳突,典型每個菌落0-2個),這反映自發產生的Lac+回復突變體。可以憑借乳突數目的增加來鑒定表現出自發突變頻率升高的細菌增變克隆。
大腸桿菌菌株CC102在IacZ的密碼子461中攜帶錯義突變,由于A:T至G:C 的轉換突變谷氨酸被甘氨酸取代(Cupples et al.,Proc. Natl. Acad. Sci. USA, 86 5345-49(1989))。如果CC102中AID的表達增加在密碼子461處的胞嘧啶脫氨基作用的速率,可以預期這增加Lac+回復突變體的頻率。CC 102的AID表達轉化子在MacConkey-乳糖平板上給出增加的乳突形成頻率(圖la,b)。培養6天之后測定的每個菌落的乳突數目從0-2個每個菌落增加至8-10個,這與在最小乳糖平板上所判斷的過夜培養物中Lac+回復突變體的頻率增加3倍以上相關。6個這樣的Lac+回復突變體的序列分析證實它們的確通過在密碼子461處的回復突變而出現。當AID相關脫氨酶AP0BEC1 (Al)和AP0BEC3G (A3G) 在CC102細胞中表達時也觸發乳突形成增加(圖lb)。這個測定還可以用于確定是否可以從總脾cDNA文庫分離活性增變基因。將人脾 cDNA文庫引入CC102細胞,并且為了增強的乳突形成篩選50,000個菌落。鑒定了 36個可能的候選,通過在MacConkey乳糖平板上劃線來重新測試。證實僅2個菌落給出乳突形成增加。序列分析顯示它們攜帶來源于AP0BEC3G的不同cDNA。圖Ic示出了野生型全長 AP0BEC3GmRNA和人脾cDNA文庫篩選中獲得的兩個AP0BEC3G cDNA,其中相對于開放閱讀框的開始(+1)來編號核苷酸殘基。本實施例證實大腸桿菌乳突形成測定可以用作活性增變基因的高通量篩選。實施例2本實施例說明了鑒定AID突變體的測定。通過利用Taq聚合酶(2. 5U ;Bioline)在Ing模板DNA上易錯PCR產生第一代和第二代人AID突變文庫,使用Taq緩沖液中的1 μ M正向和反向引物(5 ’-ATGGAATTCATGGACAGC CTCTTG(SEQ ID NO 81) ;5‘-CTGAAGCTTTCAAAGTCCCAAAGTA(SEQ ID NO :82))、250μ M-dNTP、 10mM-MgC12,94°C (2min),然后 30 個 94°C (30s)、65°C (30s)和 72°C (Imin)的循環。利用 Genemorph II隨機誘變試劑盒(Stratagene)根據制造商的說明在0. Ing DNA模板上產生第三代人AID突變文庫。如實施例1所述進行乳突形成測定,除了將平板在37°C下孵育3-6天,乳突在3 天之后變得可見并且其數目增加直至第7天。對于阿拉伯糖-誘導型表達的分析,在質粒 PBAD30 中表達 AID (Guzman et al.,J. Bacteriol,177 :4121-30 (1995))。如實施例1所述測定CC102[pTrc99_AID]轉化子回復突變為Lac+的頻率,然而在轉化入大腸桿菌菌株KL 16 (Hfr (P0-45)relAl spoTl thi-1)以及在利福平(50 μ g/ml)和阿拉伯糖(0% -0. 5% )的存在下菌落生長之后評價突變為利福平抗性(RifO的突變。如實施例1所述測量突變頻率,通過如實施例1所述的PCR擴增的IacZ的相關部分或者PCR 擴增的 rpoB 的相關部分(5' -TTGGCGAAATGGCGGAAAACC-3 ‘ (SEQ ID NO :83)和 5 ‘ -CACC GACGGATACCACCTGCTG-3‘ (SEQ ID NO :84))的測序來確定突變的性質。圖Id和圖2所示的結果證實這種測定可以鑒定AID上升突變體(upmutant)。來自4個獨立PCR-誘變實驗的總計60,000個菌落產生了 13個在MacConkey-乳糖平板上表現出乳突形成增加的克隆。然后在重新轉染的大腸桿菌菌株KL16中測試這些突變體中的 9個產生利福平抗性菌落的頻率,并且所有9個均表現出在rpoB基因座的突變頻率增加。然后使來自第一代上升突變體中的兩個的AID cDNA,即Mutl和Mut7本身進行PCR 誘變,并且獲得了表現出乳突形成增加的第二代突變體(圖幻。這些第二代突變體所表現的高乳突形成使得難以視覺上辨別乳突形成的任何額外增加。為了在第三輪突變/選擇中篩選增變活性的進一步增強,將編碼AID Mutl. 1和Mut7. 3的cDNA克隆入阿拉伯糖誘導表達載體,從而可以通過改變培養基中的阿拉伯糖濃度來調控CC102轉化子中獲得的乳突數目(圖le)。通過在低(0.02%)阿拉伯糖下篩選乳突形成獲得了第三代AID上升突變體, 如通過突變為利福平抗性的頻率所判斷的,其中一些給出比野生型AID高幾乎400倍的突變頻率(圖2)。圖2示出了通過乳突形成篩選所選擇的AID上升突變體的代(dynasty)。在三輪連續誘變中獲得的上升突變體與從單個PCR-誘變實驗中獲得的突變體分組為兄弟姐妹家族。示出了每輪誘變中引入的額外的氨基酸取代,所示取代下面的數字給出了相對于載體突變為Riflr的平均頻率。*表示在所示密碼子處引入提前終止密碼子所引起的C端截短。根據其代來源編號單個突變體因此,例如,Mut7(K10E/E156G)是Mut7. 1 (K10E/E156G/ F115Y)的親本。正如當在誘導條件下生長時的更小菌落大小所判斷的,幾個第三代突變體看起來在大腸桿菌中表現出毒性;這伴隨著在生長至飽和的細菌培養物中活細胞計數減少。這個結果在圖If中證實,其示出了相對于從在沒有誘導的情況下生長的培養物所獲得的滴度, 在IPTG誘導條件下在LB/Amp中生長至飽和的表達不同AID上升突變體的CC102轉化子的細菌滴度。這種毒性可以導致一些高乳突形成突變體給出異常低的突變為Riflr的頻率(例如,Mut7. 3. 4 ;圖2),并且在過夜培養期間AID表達可能下調。本實施例證實大腸桿菌乳突形成測定可以鑒定表現出與野生型AID蛋白相比活性提高至少10倍的功能性AID突變蛋白。實施例3本實施例證實細菌乳突形成測定可以鑒定具有增加的活性的AID突變體的熱點。圖3a比較了含有賦予增加的活性的特定突變的人AID(SEQ ID NO : 的一級序列與河豚(河豚)AID序列中的上升突變。推斷在加上星號的殘基處的突變賦予增加的增變活性,因為它們構成了在rpoB的突變頻率中表現出> 2倍差異的至少一對AID序列之間的唯一差別。雙下劃線的殘基表示在多個獨立上升突變體中鑒定取代但是存在一個或多個其他取代的位點。在加上星號或雙下劃線的殘基之上或之下的方框示出了取代突變的性質和在全部9個獨立文庫中檢測到的每個取代的頻率。如通過殘基是在河豚上升突變體中鑒定的唯一突變或在多個河豚上升突變體中鑒定了取代(盡管與其他取代一起)的事實所判斷的,在河豚AID中的相應位置看起來也是所選上升突變位點的殘基通過粗體、單下劃線來識別。鋅配位基序(HVE和PCYDC(SEQ ID NO :86))和提示的多核苷酸接觸的區域(FCEDRKA (SEQ ID NO 87) (Cupples et al.,Proc. Natl. Acad. Sci. USA, 86 5345-49(1989) ;Conticello et al. , Nat. Struct. Mol. Biol. , 14 7-9 (2007);禾口 Chen et al. , Nature,452 :116-119(2008))通過方框來突出表示。除了在AID上升突變體中的3個(Mut5、Mutl. 3和Mutl. 5)中鑒定的提前終止密碼子突變,各種AID上升突變體的序列分析揭示了對某些氨基酸取代的顯著偏好。例如,在獨立實驗中選擇了 K34E、T82I和E156G取代(每個本身足以增加AID活性)。在來自PCR 產生的文庫的48個隨機(即,未選擇)克隆的序列中未發現這些突變,其中觀察到廣譜的突變,未顯示誘變過程本身的任何主要熱點。因此,少量氨基酸取代的重復鑒定提示在AID中存在有限數量的單個氨基酸取代,其產生增加的乳突形成。雖然在某些情況下(特別在第三代中)在單輪中引入的突變的多重性阻止明確鑒定負責乳突形成增加的那些突變,但是在許多情況下可以確定地鑒定相關上升突變,因為其構成一對不同乳突形成的AID序列之間的唯一差別,或者(稍微較少確定)因為其在多個PCR中獨立獲得。這樣的上升突變的位置如圖3a所示,其中可見一些位于鋅配位基序周圍在可能的催化部位附近(V57A ;T82I),而其他在相當于先前已提示涉及多核苷酸結合的部分 AP0BEC3 的區域中(F115Y ;K120R) (Conticello et al.,Nat. Struct. Mol. Biol.,14 7-9(2007) ;Chen et al.,Nature,452 :116-119(2008);禾口 Holden et al.,Nature,456 121-124(2008)),幾個則聚集在功能未知的區域中。本實施例說明了用于鑒定具有增加的活性的AID突變體的方法。實施例4本實施例證實在細菌乳突形成篩選中鑒定的上升突變增加AID的特異性活性。從大腸桿菌菌株Rosetta (DE3) pLysS的pOPTG_AID轉化子純化GST-AID融合蛋白 (pOPTG 載體,0. Perisic, Cambridge, UK 贈送)。使細胞在 37°C下在含有 100 μ g/ml 氨芐青霉素和IOOnM ZnCl2的2XTY中生長直至培養物達到600nm的吸光度為0. 8,這時用ImM IPTG 在 18°C下誘導 16h,然后通過在裂解緩沖液(20mM-Tris ρΗ 7. 4、IOOmM-NaCl、0· 1 % Triton X-100、5mM_DTT、4 μ g/ml RNase A 和完全無EDTA 蛋白酶抑制劑雞尾酒(Roche))中在冰上孵育30min然后超聲來裂解沉淀的細胞。通過離心(95,000g;lh)來澄清細胞裂解物,并且通過在4°C下吸附至谷胱甘肽-瓊脂糖(Amersham Wiarmacia)釙和用補充了 50mM 還原型谷胱甘肽且不含Triton X100的裂解緩沖液廣泛洗滌之后洗脫來從這些裂解物純化 GST-AID。洗脫的樣品在4°C下儲存達一周。通過蛋白印跡監測GST-AID融合蛋白的豐度(圖北)。如通過蛋白印跡分析所判斷的,大量上升突變體的超聲提取物的初始篩選未顯示表現出可溶性蛋白的部分產量顯著增加的任何上升突變體。在37°C 下在 10μ 1 反應緩沖液(8mM-Tris、pH 8. 0、8mM_KCl、10mM_NaCl、2. 5mM EDTA、0. 2mM-二硫蘇糖醇、5μ g RNase A和0. 4單位尿嘧啶-DNA糖基化酶(NEB))中用 0. 5pmol 寡脫氧核糖核苷酸(熒光素-5 ‘ -ATATGAATAGAATAGAGGGGTGAGCTGGGGTGAGCTGGG GTGAG-3'-生物素(SEQ ID NO :85))測定半純化的GST-AID(100_400ng)的脫氨酶活性。 通過加入等體積的加樣染料(甲酰胺、0. 5mM EDTA)和在98°C下加熱3分鐘來在指定時間終止反應。使所得的切割的寡核苷酸在10% PAGE-尿素凝膠中電泳,并且用Typhoon Phosphoimager(Molecular Dynamics)檢測熒光。從掃描圖像確定脫氨基作用的程度,將切割產物條帶的像素量(減去背景之后)表達為產物和殘余底物條帶合并的像素量的百分率。當從人上升突變體Mutl. 1和Mut7. 3. 6產生GST-融合蛋白時,如通過在寡核苷酸底物上進行的體外脫氨基作用測定所判斷的,特異性活性的明顯增加是顯著的(圖:3b,c)。 根據初始速率的分析,這些上升突變體的特異性脫氨基活性與野生型相比增加了約5倍。rpoB內的11個C:G對中的任一個的轉換突變可以導致Rif1。對于AID上升突變 # MutSU. 1、1· 2,7. 3. 5和7. 3. 6,這樣的突變在Rifr菌落中的分布如圖3d所示。增加的比活看起來未伴隨靶特異性的任何總變化,因為利用幾個人AID突變體獲得的rpoB突變的分析未揭示突變譜中的任何主要差異(圖3d)。本實施例證實在細菌乳突形成篩選中鑒定的突變增加AID的特異性活性。實施例5本實施例描述了河豚(河豚)AID中導致AID活性增加的突變的產生。 利用Genemorph 11隨機誘變試劑盒(Stratagene),根據制造商的說明,在0. Ing DNA模板上產生含有河豚AID突變體的文庫。如實施例1所述進行河豚突變體文庫的細菌乳突形成篩選。對于所示用編碼野生型或突變河豚AID的質粒轉化的大腸桿菌K16,在18°C 或37°C下相對于僅有載體的轉化子的突變為Riflr的頻率如圖4b所示。構建了 Mut4. 3和 4. 10的衍生物,其中在190處的無義突變已被回復,從而產生野生型C端。當在37°C下測定時,來自河豚(其生活在約)的AID表現出很少的細菌增變活性,而在18°C下可以檢測到增變活性(Conticello et al. , Mol. Biol. Evol. ,22 367-377 000 )。在細菌乳突形成測定中鑒定了在37°C下給出穩健的乳突形成的河豚AID 突變體。如圖如所示,分離的所有第一代突變體均包含C端截短突變(如“*”所示,其中 “、”和“、”表示導致提前終止密碼子的在密碼子190處的不同單核苷酸取代),獲得的6 個突變體包含5種不同截短突變。還鑒定了導致C端區域異讀框閱讀的突變,其在圖如中被命名為“hs200a”和“Ins200b”以表示在密碼子200處的不同單核苷酸插入突變。然而,然后在第二代突變體中各種氨基酸取代可以導致增強的乳突形成(圖如), 這些氨基酸取代中的幾個發生在與人AID中所鑒定的上升突變類似的位置(圖3a和4a)。 因此,負責河豚AID Mutl. 3的活性增加的突變(C88L)發生在與人AID中的T82I突變相當的位置。相似地,河豚AID中的殘基F121、L124和L128 (每個為兩個或三個河豚上升突變體中突變的靶標)全部位于對應也獲得上升突變的人AID中的115-121的一段河豚AID中。雖然在人AID上升突變體組中檢測到C端截短,并且先前已證實這樣的截短在大腸桿菌中給出更高的增變活性(Barreto et al. ,Mol. Cell, 12 :501-508(2003) ;Ta et al, Nat. Immunol.,4 :843-848 Q003)),但是在37°C下所選的所有河豚AID第一代突變體均攜帶在C端的截短。對這個觀察的一個可信的解釋是加強(imderpirmed)的C端突變增加熱穩定性,以及在第二代河豚上升突變體中導致乳突形成增加的氨基酸取代在37°C下在沒有 C端截短突變的情況下可能是不可識別的。然而,這的確看來是可能的解釋。如在18°C下所測定的,在存在或不存在C端截短的情況下,C88L和L128P取代均給出突變為Rifr的頻率增加。然而,當在37°C下測定時,在沒有C端截短的情況下,這些氨基酸取代未給出突變頻率的任何可識別的增加(圖4b)。本實施例證實河豚(河豚)AID中增加其活性的突變與人AID中鑒定的某些突變類似。實施例6本實施例說明了利用本發明的功能性AID突變蛋白在細胞中增加抗體多樣化的方法。通過流式細胞術監測用基于pEXpreSSPuro2的AID編碼載體穩定轉染的 AID+ φV"7" SlgM+ DT40 細胞(Teng et al.,Immunity, 28 :621-629(2008))中的表面 IgM
缺失來測定IgV的體細胞突變。對于每個構建體,在流式細胞術之前,在選擇(0. 25μ g/ml 嘌呤霉素)下擴增3周的12- 個獨立轉染子中監測slgM—細胞的百分率。
通過將從100,000個未分選或從(GFP+ ;sIgM_)-分選的細胞等同物PCR擴增的基因組 DNA 測序來表征 IgVA 區的突變(Sale et al.,Nature, 412 :921-926 (2001))。為了測定類別轉換,如先前所述在從AID+小鼠純化并在LPS+IL4存在下培養 (48h)然后用編碼AID的反轉錄病毒感染24h的B細胞中通過流式細胞術分析表面IgGl表達(Di Noia,J.Exp. Med.,204 :3209-3219 (2007))。為了促進轉導的 B 細胞中 AID 過量表達程度的減少,如(McBride et al.,J. Exp. Med.,205 :2199-2206(2008))所述使用具有突變的Kozak序列的反轉錄病毒載體。通過在50 μ 1還原SDS樣品緩沖液中加熱細胞(IO6個) 來制備提取物,SDS/PAGE之后利用兔抗AID抗血清(Abeam)通過蛋白印跡分析監測該提取物中的AID豐度;利用HRP綴合的山羊抗GFP抗血清(Abeam)檢測GFP。在AID缺陷的雞DT40B細胞系中表達突變體3(T82I)、8(Κ34Ε、Κ160Ε)和 7. 3(K10E、E156G、Τ82Ι),其中IgV的體細胞突變可以從產生slgM缺失變體的頻率來推斷 (Arakawa et al.,PLoS Biol.,2 :E179 (2004))。如通過這種 slgM缺失測定所判斷的,Mut3 和Mut7. 3看來均給出顯著增加的體細胞突變(圖fe)。此外,序列分析顯示在一個月的克隆擴增之后,表達這些突變AID的細胞的確在IgGX基因中攜帶比表達野生型酶的對照細胞更高的突變負荷(圖恥)。不僅更高比例的序列攜帶突變,而且那些攜帶突變的序列還攜帶更高的突變負荷。當考慮到在這些轉染子中突變AID以比其野生型相對部分更低的豐度表達這一事實時,這種效果尤其顯著。相比之下,突變體8未給出增加的體細胞突變,這表明了 K34E和/或K160E取代可能在B細胞中減少AID功能的方面。有趣的是,在DT40轉染子中發現MirtS多肽的豐度比Mut3或7. 3多肽高很多。這與其他工作中的觀察(例如, Conticello et al. ,Mol. Cell, 31 :474-484(2008)) 一致,即在DT40 細胞中在抗體多樣化/ 基因組突變中表現出折中活性的AID突變體傾向于以更高豐度表達,而在細胞內定位中沒有任何明顯變化。對于表達水平中的這些差異,一種可能的解釋是在細胞轉染子中有針對表達高水平的在染色體突變中活躍的AID蛋白的細胞的選擇。使用基于將突變酶反轉錄病毒轉導入AID缺陷的小鼠B細胞的測定來測定類別轉換重組中突變AID的活性。為了限制可能飽和轉換測定的AID過量表達程度,利用常規的 PMX-Ig病毒以及其中通過Kozak序列的突變使轉導的AID以低水平表達的變體來進行測定(McBride et al.,J. Exp. Med.,2005 :2585-2594 (2008))。如圖 5c 所示,其示出了轉換為IgGl的代表性流式細胞術圖,其中‘mK’表示利用具有突變的Kozak序列的載體進行轉導,雖然以較低水平表達,但是Mut7. 3在促進類別轉換重組中比野生型相對物更有效。本實施例證實了按照本發明方法使用功能性突變AID蛋白增加抗體多樣化。實施例7本實施例證實AID突變體增加染色體易位。使用基于PCR 的測定(Janz et al. , Proc. Natl. Acad. Sci. USA. , 90 7361-7365(1993))檢測B細胞中的c-myc/IgH易位。如實施例6中的類別轉換測定所述, 用表達AID的反轉錄病毒轉導來自AID缺陷小鼠的B細胞,并且在含有LPS (20 μ g/ml)和 IL4(50ng/ml)的培養基中培養,在6孔板中以SxlO5個細胞/ml接種。如(Ramiro et al., Nature,440 :105-109(2006))所述,通過Expand Long Template PCR系統(Roche),使從轉導之后3 分選的GFPW細胞利用DirectPCR(Viatech)制備的來自2xl05個細胞的基因組 DNA進行2輪巢式PCR,然后進行DNA印跡以擴增和檢測derl2c_myc/Ig μ和derl5c-myc/IgU易位以及特異性產物。圖6(頂部)示出了 c-myc和IgH基因座之間相互易位的示意圖,并且指示了用于PCR擴增的引物(箭頭)和用于DNA印跡雜交的探針(P)。為了 AID表達,反轉錄病毒轉導來自AID缺陷小鼠的B細胞,并且體外培養1_2天。 AID Mut7.3導致比野生型酶顯著更高比例的含有c-myc/IgH易位的培養物(圖6(底部))。本實施例證實了利用功能性AID突變蛋白增加染色體易位的方法。實施例8本實施例證實編碼具有增加活性的AID突變體的核酸序列比野生型AID更接近 AP0BEC3脫氨酶的核酸序列。進行了網絡LOGO 比對(Crooks et al. ,Genome Research, 14 1188-1190 (2004)) (圖7),其示出了 AID上升突變的主要位點周圍的氨基酸保守性和哺乳動物AP0BEC3的Zl、 Z2和結構域中的同源區(牛、羊、豬、狗、野豬、馬、貓、狗、小鼠、大鼠、人和獼猴序列登錄號如圖8所提供)。從LOGO譜的生成中丟棄與任何其他序列具有超過90 %氨基酸相同性的任何序列。AID上升突變在編號的殘基上方的方框中示出。比對底部的箭頭突出AP0BEC3 中的同源殘基。圖7說明AP0BEC3家族蛋白在較高等的動物中快速進化并存在多個拷貝通過序列同源性可以將其鋅配位結構域歸類入三個亞組(Z1、Z2和中的一個(Conticello et al.,Mol. Biol. Evol. ,22 :367-377 (2005)) AID 序列與 AP0BEC3 序列的比對顯示人 AID 中經常選擇的上升突變的大部分有助于使AID的序列更接近其AP0BEC3相關物(relative) 的序列(圖7)。事實上,雖然在F115處的AID上升突變取代了在AP0BEC3Z2結構域中相應位置的優選氨基酸(Y),但是在K34、T82和Ε156處的上升突變全部取代了在AP0BEC3Z1結構域中相應位置的優選氨基酸。有趣的是,發現催化上最活躍的AP0BEC3結構域正是這些 Z 1 結構域(LaRue et al. , J. Virol. , 83 =494-497 (2009)) 因此,看來雖然 AID 活性的脫氨基作用可以通過特定上升突變人工增加,但是在AID進化期間而不是在AP0BEC3進化期間反選這樣的上升突變。本實施例證實編碼具有增加活性的AID突變體的核酸序列比野生型AID更接近 AP0BEC3脫氨酶的核酸序列。實施例9本實施例比較了人(SEQ ID NO 2)和河豚(河豚)(SEQ ID NO 13) AID上升突變。利用ClustalW2比對人和河豚AID —級序列(例如,Larkin et al., Bioinformatics, 23 =2947-2948 (2007))(圖9)。如實施例3所述通過星號或雙下劃線表示人AID上升突變(圖3a)。河豚AID上升突變因為它們在河豚上升突變體中構成唯一突變或因為該殘基在多個河豚上升突變體中突變而被鑒定,這通過插入符(“~”)表示。如圖 3a,取代的性質如突出的殘基上方或下方的方框所示。框出了鋅配位基序(HVE,PCYDC)和提示的多核苷酸接觸的區域(FCEDRKA)。本實施例比較了人和河豚(河豚)AID上升突變。實施例10本實施例描述了產生功能性AID突變體的方法,其包括用來自AID同系物的相應氨基酸序列代替野生型AID蛋白的氨基酸序列。將其中氨基酸殘基115-123 被來自 AP0BEC3C (AID/3C)、AP0BEC3F (AID/3F)和AP0BEC3G(AID/3G)的相當區域代替的人AID突變體克隆入細菌表達質粒。通過監測轉化入大腸桿菌之后產生利福平抗性菌落的頻率來測定這些修飾的AID序列的增變活性。具體來說,使轉化了 p^Trcgg/AID質粒的大腸桿菌菌株KL16[Hfr(P0-^)relAl spoTl thi-1] 在補充了氨芐青霉素(IOOyg πιΓ1)和異丙基β-D-I-硫代半乳糖苷(IPTG;lmM)的LB培養基中生長過夜至飽和,并且平板接種至含有氨芐青霉素(IOOyg ml—1)和利福平(50 μ g ml—1)的LB低鹽瓊脂。通過測定每IO7個平板接種的活細胞從選擇中存活的菌落形成細胞的中位數來測量突變頻率,每個中位數從12個獨立的培養物測定。利用寡核苷酸 5' -TTGGCGAAATGGCGGAAAACC(SEQ ID NO :8 和 5' -CACCGACGGATACCACCTGCTG-3‘ (SEQ ID而89斤0 擴增之后,通過將印勸的相關部分(典型地來自25-200個單菌落)測序來確定突變的性質。AID/3C和AID/3F蛋白保持良好的增變活性,同時AID/3G以難以和背景區分的頻率產生利福平抗性菌落。利福平抗性由rpoB中有限數量的突變中的一個提供, 所獲得的突變的性質使得對脫氨酶的靶標特異性有深入了解(Harris et al. ,Mol. Cell., 10 :1247-1253(2002)).野生型AID優選將在rpoB位置1576的具有5,側翼嘌呤(G)殘基的C殘基(C1576)脫氨基。相比之下,其中殘基115-123被來自AP0BEC3C/F/G的相應區域代替的AID變體表現出對在-1位置的嘧啶的偏好(AP0BEC3本身也是如此)。因此,AID/3C 和AID/3F表現出rpoB突變譜轉移至偏好具有5,-T的靶標(C1535、C1565和C1592),而 AID/3G轉化子幾乎僅靶向具有5,-C的C1691。本實施例的這個結果證實用來自AP0BEC3蛋白的相應序列代替人AID的氨基酸殘基115-123改變了 AID的特異性活性。實施例11本實施例描述了產生功能性AID突變體的方法,其包括用來自AID同系物的相應氨基酸序列代替野生型AID蛋白的氨基酸序列。雖然實施例10證實AID/3G的增變活性足以產生利福平抗性大腸桿菌中所觀察到的rpoB突變分布的轉移,但是AID/3G突變體的增變活性顯著低于野生型AID,因為其沒有產生高于背景的突變為利福平抗性的總頻率。為了提高AID/3G突變體的增變活性,產生了 2個AID/3G上升突變體(命名為AID1/3G和AID2/3G),其中將3個額外的氨基酸取代(即, AIDl :K10E、T82I、E156G ;AID2 :K34E、E156G、R157T)引入這些蛋白。如通過 rpoB 突變譜所測定的,這兩個AID/3G上升突變體看起來均保留了親本AID/3G蛋白對5’側翼C殘基的偏好。還產生了 AID變體(命名為AID*、AID*/3F、AID173G等),其中AID的C端部分 (包括其核輸出序列)缺失。在細菌突變測定中C端截短沒有產生對AID突變靶位點偏好的可檢測的影響。為了更詳細地分析上述突變AID的生化靶標特異性,作為重組GST-融合蛋白從大腸桿菌提取物部分純化了各種AID酶,并且在M13缺口雙鏈體測定的背景下用于將單鏈 IacZ IE DNA 脫氨基(Bebenek and Kunkel,Methods Enzymo 1. ,262 :217-232(1995); Pham et al. ,Nature, 424 103-107 (2003)) 在這個測定中,將重組GST-AID 與缺口雙鏈體 M131acZ DNA孵育,然后轉化入大腸桿菌。在每個實驗中,30-50個突變的M131acZ克隆的分析產生了 471-685個突變的數據庫,全部為在C:G對的轉換。在AIDl的情況下,74%的C突變在側翼為5’ -嘌呤的位點。相比之下,攜帶從AP0BEC3蛋白移植的片段的AID突變體表現為向對側翼嘧啶的偏好的轉移,這在AID/3C和AID/3G蛋白的情況下尤其顯著(分別為85%和77%嘧啶)。側翼核苷酸偏好的這種變化伴隨沿IacZ突變分布的變化。考慮到對于大部分AID變體,在分析的 475個核苷酸段的單鏈底物上突變序列攜帶平均10-16個轉換突變,憑借選擇IacZ失活,所觀察到的突變主要反映突變過程的內在偏好而不廣泛偏離。本實施例的結果證實用來自AP0BEC3蛋白的相應序列代替人AID的氨基酸殘基 115-123改變了 AID的特異性活性。實施例12本實施例證實突變AID蛋白在B細胞中表現出改變的突變譜。為了確定改變AID的催化特異性是否導致B細胞中SHM期間引入的核苷酸取代分布的改變,在AID缺陷、ψν缺失的雞DT40B細胞系中表達實施例10和11所述的突變AID。 在DT40B細胞系中,突變主要局限于在C:G對的核苷酸取代,其具有很少來自聚合酶η觸發的高變的貢獻(Arakawa et al.,PLoS Biol.,2 :E179(2004) ;Di Noia and Neuberger, Nature,419 :43-48(2002) ;Sale et al.,Nature,412 :921_擬6 Q001)),這意味著在 C:G 的突變可以主要歸因于AID的直接影響,而不可能是突變創造的第二階段的結果。在IgV 的SHM頻率可以從產生slgM缺失變體的頻率來推斷(Buerstedde et al.,EMBO J. ,9 921-927(1990) ;Sale et al. , Nature, 412 :921-926 (2001)) 這個測定證實 AID/3C 和 AID/3F在SHM中都是好用的。實際上,AID/3C甚至比野生型酶更有效,尤其是當考慮到B 細胞提取物中AID/3C多肽的豐度較低。AID/3C的低豐度在多個獨立轉染子中是明顯的。 這種低表達的原因反映了過量DNA脫氨酶活性的細胞毒性。與AID/3C和AID/3F突變體相比,AID1/3G突變體僅給出非常低頻率的slgM缺失變體。然而,通過缺失AID C端部分這種頻率顯著增加。為了表征表達各種修飾的AID蛋白的DT40B細胞轉染子中的IgV基因高變譜,克隆擴增8周之后,PCR擴增來自每個表達構建體的多個獨立轉染子的IgVX片段并測序。結果顯示AID活性位點的修飾導致IgVX突變譜的實質改變。因此,與其中僅19%的突變靶向具有5’側翼嘧啶的C殘基的野生型酶相比,AID/3C和AID173G主要靶向具有5’側翼嘧啶殘基的C殘基(分別為68%和75%)。突變譜的這種顯著變化在綜合數據集以及來自獨立克隆的每個數據集中都是明顯的。相比之下,AID/3F保持親本酶對側翼嘌呤殘基的偏好,但是如在缺口雙鏈體IacZ底物上的體外測定所發現的(實施例11),存在向對側翼鳥嘌呤而不是腺嘌呤的偏好的轉移。通過5’側翼核苷酸的性質所判斷的突變靶向的變化大體上與通過沿IgVX片段的核苷酸取代分布所確定的改變的突變譜相關。因此,例如,當比較野生型AID與AID173G 時,發現IgVX突變熱點在不同位置。通過野生型AID (以及在AIDl上升突變體中),熱點簇在⑶Rl內是明顯的,朝向⑶R2的5’端,并且也在⑶R3內,而且如先前所觀察的這些熱點大部分符合 WRC 共有序列(Arakawa et al.,PLoS Biol.,2 :E179(2004) ;Sale et al., Nature,412 :921-926(2001) ;Saribasak et al.,J. Immunol.,176 :365-371 (2006) ;Wang et al. ,Nat Struct Mol Biol.,16 :769-76 Q009))。相比之下,利用 AID1*/3G獲得的 IgV λ 突變顯示減少聚集在CDRl和CDR3中,而集中在具有5’ -嘧啶側翼且在野生型酶的情況下相對少見的區域(FRl和FR3)的熱點。
本實施例的結果證實改變AID的活性位點改變通過體外DNA脫氨基作用和通過B 細胞轉染子中的抗體高變獲得的突變譜。實施例13本實施例描述了 AID突變體“熱點”的鑒定。雖然在體內(DT40 IgVA)和體外(缺口雙鏈體IacZ)突變測定中,AID/3C和 AID1V3G中的活性位點修飾導致從對側翼5’ -嘌呤的偏好至對側翼5’ -嘧啶的偏好的轉移,但是在兩個測定中所述轉移的性質并不相同。因此,對于AID/3G,雖然在DT40 IgVA突變譜中T是選擇的側翼嘧啶,但是在體外測定中優選側翼C。這種差異實質上是由于DT40 IgVA譜中幾個主要熱點的傾斜效果,這提示在B細胞中一些方面的高變可以導致產生體外缺口雙鏈體測定中未概括的優勢熱點。為了證實這一點,在IgVX (而不是IacZ)靶序列上進行缺口雙鏈體突變測定,并且將所得的體外突變譜與在DT40B細胞中在相當的(非轉錄的)IgV λ DNA鏈上觀察到的突變譜比較。觀察到突變靶向的顯著差異。如果將高度突變的序列從用于推斷體外突變靶向模式的數據庫排除,這些差異同樣明顯。為了發現靶向的差異是否反映體內突變可能發生在轉錄的雙鏈DNA上,而缺口雙鏈體測定使用單鏈DNA靶標這一事實,利用Bransteitter et al.,J. Biol. Chem.,279 51612-21(2004)所述的測定,進行突變靶向。這種突變靶向測定包括將重組AID與雙鏈DNA 孵育,同時從連接的T7聚合酶啟動子轉錄底物內的靶基因(IacZ)。在這個測定中,AID173G 顯然不同于野生型AID,仍然優選5’ -嘧啶,特別是5’ -C,而不是在DT40B細胞中觀察到的 5’-T。為了評價體外轉錄偶合測定中IgVX底物內的突變靶向,修改Τ7連接測定以產生底物,其中IgVX短片段中未選擇的突變可以在遭受緊密連鎖的GFP報告基因突變失活的克隆中評分。然而,在這樣的測定中發現,正如缺口雙鏈體測定,DT40細胞中在高變期間觀察到的在IgVX位置141(野生型AID)或252(AIDf/3G)的主要熱點的相對優勢未重新獲得。事實上,在轉錄連接測定中突變靶向看起來與缺口雙鏈體測定中獲得的突變靶向更相似,而不是在DT40B細胞中觀察到的突變靶向模式。因此,體外測定沒有完全概括在B細胞中觀察到的IgV熱點優勢模式。本實施例的結果證實表達修飾的AID蛋白的B細胞產生改變的熱點使用。實施例14本實施例描述了將Mut7. 3突變轉移入犬AID和人AID的效果。通過將共表達的抗體模板測序來測量HEK293-C18細胞中AID的功能。用含有獨特選擇標記的三種游離型載體共轉染細胞,一種表達抗體重鏈與嘌呤霉素選擇,一種表達抗體輕鏈與潮霉素選擇,以及一種表達AID與殺稻瘟素選擇。轉染之后,始終用嘌呤霉素和潮霉素培養細胞,但是用殺稻瘟素區別處理。對于用AID “脈沖(pulse)”的細胞,不將殺稻瘟素加入培養物,并且在實驗的每周重復AID載體的瞬時轉染。對于“穩定IID細胞,將殺稻瘟素加入培養基,而對于“穩定+脈沖”,則除了每周用AID載體轉染之外,用殺稻瘟素培養細胞。在這些實驗中檢測了 3種不同的AID突變體犬AID(“MutE”)、含有Mut7.3的犬 AID ( "Mut 7. 3E”)和含有 Mut7. 3 的人 AID ( “人 7. 3 (Human 7. 3)) (SEQ ID NO :88-93 以及圖IOa和IOb),并且測試了 2種不同載體構建體的AID表達(S卩,IRES載體和pEpi載體)。 對于IRES載體,通過同一啟動子控制AID和殺稻瘟素表達,IRES元件在基因之間。在pEpi載體中,通過不同的啟動子控制殺稻瘟素表達。培養約一個月之后,通過PCR恢復重鏈可變區用于測序。對于每個獨立的細胞轉染實驗,將94個模板測序,每個實驗返回平均88個完整序列。檢查測序層析譜以驗證觀察到的突變的質量,并且通過用突變數除以測序的核苷酸總數然后除以培養的天數來計算突變頻率。HEK293-C18細胞的倍增時間為約M小時,因此將培養天數用于歸一化每代的突變率。對于每個AID載體,脈沖、穩定或穩定+脈沖組之間突變頻率沒有顯著差異。此外, 對于MutE AID, IRES和pEpi載體之間沒有顯著差異,Mut 7. 3E和人7. 3之間也沒有任何顯著差異。然而,PEpi中的Mut 7. 3E與IRES中的Mut 7. 3E的突變頻率差異在統計學上是顯著的(P = 0. 0003)。本實施例證實Mut7. 3可以翻譯為犬AID和人AID。包括出版物、專利申請和專利在內的本文所引用的所有參考文獻援引加入本文, 與單獨和特別指出每個參考文獻援引加入本文并在本文中整體示出是相同程度的。在描述本發明的上下文中(特別是所附權利要求的上下文中),使用術語“一個 (a),,和“一個(an),,和“這個(the),,和相似指代應當理解為涵蓋單數和復數,除非本文另有指明或者與上下文明確相抵觸。除非另有注明,術語“包含”、“具有”、“包括”和“含有” 應當理解為開放式術語(即,表示“包括,但不限于”)。除非本文另有指明,本文中值范圍的列舉僅僅為了作為單獨指落在該范圍之內的每個獨立值的速記方法,并且如在本文中單獨列舉一樣將每個獨立值并入本說明書。本文所述的所有方法可以按照任何合適的順序進行,除非本文另有指明或者與上下文明確相抵觸。除非另有要求,本文所提供的任何和所有實例或者示例性語言(如,“例如”)的使用僅為了更好地說明本發明,而不是構成對本發明范圍的限制。在本說明書中沒有語言應當理解為表示對本發明的實施必需的任何未要求保護的元素。本文描述了本發明的優選實施方案,包括發明人已知的用于進行本發明的最佳模式。通過閱讀前面的描述,這些優選實施方案的變化對于本領域普通技術人員可以變得顯而易見。本發明人預期技術人員適當采用這樣的變化,并且本發明人意圖除了如本文特別描述之外實施本發明。因此,如適用的法律所允許的,本發明包括所附權利要求所列舉的主題的所有修飾和等同物。此外,本發明涵蓋在其所有可能的變化中的上文所述元素的任何組合,除非本文另有指明或者與上下文明確相抵觸。
權利要求
1.一種分離或純化的核酸分子,其包含編碼功能性突變活化誘導胞苷脫氨酶(AID)蛋白的核苷酸序列,所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白的氨基酸序列與人AID 蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于在選自殘基34、殘基82 和殘基156的殘基處的至少一個氨基酸取代,其中所述功能性突變AID蛋白在細菌乳突形成測定中與所述人AID蛋白相比活性提高至少10倍。
2.如權利要求1所述的分離或純化的核酸分子,其中在殘基34處的氨基酸是被取代的。
3.如權利要求2所述的分離或純化的核酸分子,其中所述在殘基34處的氨基酸取代為脂肪族氨基酸取代。
4.如權利要求3所述的分離或純化的核酸分子,其中所述在殘基34處的脂肪族氨基酸取代為K34E或K34D。
5.如權利要求1-4中任一項所述的分離或純化的核酸分子,其中在殘基82處的氨基酸是被取代的。
6.如權利要求5所述的分離或純化的核酸分子,其中所述在殘基82處的氨基酸取代為脂肪族氨基酸取代。
7.如權利要求6所述的分離或純化的核酸分子,其中所述在殘基82處的脂肪族氨基酸取代為T82I或T82L。
8.如權利要求1-7中任一項所述的分離或純化的核酸分子,其中在殘基156處的氨基酸是被取代的。
9.如權利要求8所述的分離或純化的核酸分子,其中所述在殘基156處的氨基酸取代為脂肪族氨基酸取代。
10.如權利要求9所述的分離或純化的核酸分子,其中所述在殘基156處的脂肪族氨基酸取代為E156G或E156A。
11.如權利要求8-10中任一項所述的分離或純化的核酸分子,其中所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白還包含在選自殘基34、82和157的殘基處的至少一個氨基酸取代。
12.如權利要求8-11中任一項所述的分離或純化的核酸分子,其中所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白還包含在殘基34和157處的氨基酸取代。
13.如權利要求11或權利要求12所述的分離或純化的核酸分子,其中所述在殘基34、 82和157處的氨基酸取代為脂肪族氨基酸取代。
14.如權利要求11-13中任一項所述的分離或純化的核酸分子,其中(a)所述在殘基34處的氨基酸取代為谷氨酸(E)或天冬氨酸(D),(b)所述在殘基82處的氨基酸取代為異亮氨酸(I)或亮氨酸(L),和(c)所述在殘基157處的氨基酸取代為蘇氨酸(T)或賴氨酸(K)。
15.如權利要求12所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白還包含在選自殘基9、38和180的殘基處的至少一個氨基酸取代。
16.如權利要求12或權利要求15所述的分離或純化的核酸分子,其中所述功能性突變 AID蛋白還包含在殘基9、38和180處的氨基酸取代。
17.如權利要求12所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白還包含在選自殘基42、115、132、183和198的殘基處的至少一個氨基酸取代。
18.如權利要求12所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白還包含在殘基42、115、132、183和198處的氨基酸取代。
19.如權利要求12所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白還包含在選自殘基9、96和181的殘基處的至少一個氨基酸取代。
20.如權利要求12所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白還包含在殘基9、96和181處的氨基酸取代。
21.如權利要求12所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白還包含在殘基13和/或殘基197處的至少一個氨基酸取代。
22.如權利要求12所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白還包含在殘基13和197處的氨基酸取代。
23.如權利要求15-22中任一項所述的分離或純化的核酸分子,其中所述氨基酸取代為脂肪族氨基酸取代。
24.如權利要求15-23中任一項所述的分離或純化的核酸分子,其中(a)所述在殘基9處的氨基酸取代為甲硫氨酸(M)或賴氨酸(K),(b)所述在殘基13處的氨基酸取代為苯丙氨酸(F)或色氨酸(W),(c)所述在殘基38處的氨基酸取代為甘氨酸(G)或丙氨酸(A),(d)所述在殘基42處的氨基酸取代為異亮氨酸(I)或亮氨酸(L),(e)所述在殘基96處的氨基酸取代為甘氨酸(G)或丙氨酸(A),(f)所述在殘基115處的氨基酸取代為酪氨酸(Y)或色氨酸(W),(g)所述在殘基132處的氨基酸取代為谷氨酸(E)或天冬氨酸(D),(h)所述在殘基180處的氨基酸取代為異亮氨酸(I)或丙氨酸(A),(i)所述在殘基181處的氨基酸取代為甲硫氨酸(M)或纈氨酸(V),(j)所述在殘基183處的氨基酸取代為異亮氨酸(I)或脯氨酸(P),(k)所述在殘基197處的氨基酸取代為精氨酸(I )或賴氨酸(K),和(1)所述在殘基198處的氨基酸取代為纈氨酸(V)或亮氨酸(L)。
25.一種分離或純化的核酸分子,其包含編碼功能性突變活化誘導胞苷脫氨酶(AID) 蛋白的核苷酸序列,所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白的氨基酸序列與人 AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于在殘基10處的至少一個氨基酸取代和在殘基156處的至少一個氨基酸取代,其中所述功能性突變AID蛋白在細菌乳突形成測定中與所述人AID蛋白相比活性提高至少10倍。
26.如權利要求25所述的分離或純化的核酸分子,其中所述在殘基10和156處的氨基酸取代為脂肪族氨基酸取代。
27.如權利要求沈所述的分離或純化的核酸分子,其中用谷氨酸(E)或天冬氨酸(D) 取代在殘基10處的氨基酸,并且用甘氨酸(G)或丙氨酸(A)取代在殘基156處的氨基酸。
28.如權利要求25-27中任一項所述的分離或純化的核酸分子,其中所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白包含在選自殘基13、34、82、95、115、120、134和145的殘基處的至少一個其他氨基酸取代。
29.如權利要求25-28中任一項所述的分離或純化的核酸分子,其中所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白還包含在殘基13處的至少一個氨基酸取代。
30.如權利要求25-29中任一項所述的分離或純化的核酸分子,其中所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白還包含在殘基34處的至少一個氨基酸取代。
31.如權利要求25-30中任一項所述的分離或純化的核酸分子,其中所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白還包含在殘基82處的至少一個氨基酸取代。
32.如權利要求25-31中任一項所述的分離或純化的核酸分子,其中所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白還包含在殘基95處的至少一個氨基酸取代。
33.如權利要求25-32中任一項所述的分離或純化的核酸分子,其中所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白還包含在殘基115處的至少一個氨基酸取代。
34.如權利要求25-33中任一項所述的分離或純化的核酸分子,其中所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白還包含在殘基120處的至少一個氨基酸取代。
35.如權利要求25-34中任一項所述的分離或純化的核酸分子,其中所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白還包含在殘基134處的至少一個氨基酸取代。
36.如權利要求25-35中任一項所述的分離或純化的核酸分子,其中所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白還包含在殘基145處的至少一個氨基酸取代。
37.如權利要求觀-36中任一項所述的分離或純化的核酸分子,其中所述氨基酸取代為脂肪族氨基酸取代。
38.如權利要求觀-37中任一項所述的分離或純化的核酸分子,其中(a)所述在殘基13處的氨基酸取代為苯丙氨酸(F)或色氨酸(W),(b)所述在殘基34處的氨基酸取代為谷氨酸(E)或天冬氨酸(D),(c)所述在殘基82處的氨基酸取代為異亮氨酸(I)或亮氨酸(L),(d)所述在殘基95處的氨基酸取代為絲氨酸( 或亮氨酸(L),(e)所述在殘基115處的氨基酸取代為酪氨酸(Y)或色氨酸(W),(f)所述在殘基120處的氨基酸取代為精氨酸(R)或天冬酰胺(N),和(g)所述在殘基145處的氨基酸取代為亮氨酸(L)或異亮氨酸(I)。
39.一種分離或純化的核酸分子,其包含編碼功能性突變活化誘導胞苷脫氨酶(AID) 蛋白的核苷酸序列,所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白的氨基酸序列與人 AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于在殘基35處的至少一個氨基酸取代和在殘基145處的至少一個氨基酸取代,其中所述功能性突變AID蛋白在細菌乳突形成測定中與所述人AID蛋白相比活性提高至少10倍。
40.如權利要求39所述的分離或純化的核酸分子,其中所述在殘基35和145處的氨基酸取代為脂肪族氨基酸取代。
41.如權利要求39所述的分離或純化的核酸分子,其中用甘氨酸(G)或丙氨酸(A)取代在殘基35處的氨基酸,并且用亮氨酸(L)或異亮氨酸(I)取代在殘基145處的氨基酸。
42.一種分離或純化的核酸分子,其包含編碼功能性突變活化誘導胞苷脫氨酶(AID) 蛋白的核苷酸序列,所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白的氨基酸序列與人 AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于在殘基34處的至少一個氨基酸取代和在殘基160處的至少一個氨基酸取代,其中所述功能性突變AID蛋白在細菌乳突形成測定中與所述人AID蛋白相比活性提高至少10倍。
43.如權利要求42所述的分離或純化的核酸分子,其中所述在殘基34和160處的氨基酸取代為脂肪族氨基酸取代。
44.如權利要求42所述的分離或純化的核酸分子,其中用谷氨酸(E)或天冬氨酸(D) 取代在殘基34處的氨基酸,并且用谷氨酸(E)或天冬氨酸(D)取代在殘基160處的氨基酸。
45.一種分離或純化的核酸分子,其包含編碼功能性突變活化誘導胞苷脫氨酶(AID) 蛋白的核苷酸序列,所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白的氨基酸序列與人 AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于在殘基43處的至少一個氨基酸取代和在殘基120處的至少一個氨基酸取代,其中所述功能性突變AID蛋白在細菌乳突形成測定中與所述人AID蛋白相比活性提高至少10倍。
46.如權利要求45所述的分離或純化的核酸分子,其中所述在殘基43處的氨基酸取代為芳香族氨基酸取代,并且所述在殘基120處的氨基酸取代為脂肪族氨基酸取代。
47.如權利要求46所述的分離或純化的核酸分子,其中用脯氨酸(P)取代在殘基43處的氨基酸,并且用精氨酸00取代在殘基120處的氨基酸。
48.一種分離或純化的核酸分子,其包含編碼功能性突變活化誘導胞苷脫氨酶(AID) 蛋白的核苷酸序列,所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白的氨基酸序列與人 AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于至少兩個氨基酸取代,其中至少一個取代在殘基57處且至少一個取代在殘基81或145處,并且其中所述功能性突變AID蛋白在細菌乳突形成測定中與所述人AID蛋白相比活性提高至少10倍。
49.如權利要求48所述的分離或純化的核酸分子,其中所述至少兩個氨基酸取代在殘基57和145處。
50.如權利要求49所述的分離或純化的核酸分子,其中所述在殘基57和145處的氨基酸取代為脂肪族氨基酸。
51.如權利要求50所述的分離或純化的核酸分子,其中用甘氨酸(G)或丙氨酸(A)取代在殘基57處的氨基酸,并且用亮氨酸(L)或異亮氨酸(I)取代在殘基145處的氨基酸。
52.如權利要求48所述的分離或純化的核酸分子,其中所述至少兩個氨基酸取代在殘基57和81處。
53.如權利要求52所述的分離或純化的核酸分子,其中所述在殘基57處的氨基酸取代為脂肪族氨基酸取代,并且所述在殘基81處的氨基酸取代為芳香族氨基酸取代。
54.如權利要求53所述的分離或純化的核酸分子,其中用甘氨酸(G)或丙氨酸(A)取代在殘基57處的氨基酸,并且用酪氨酸(Y)或色氨酸(W)取代在殘基81處的氨基酸。
55.一種分離或純化的核酸分子,其包含編碼功能性突變活化誘導胞苷脫氨酶(AID) 蛋白的核苷酸序列,所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白的氨基酸序列與人 AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于在殘基156處的至少一個氨基酸取代和在殘基82處的至少一個氨基酸取代,其中所述功能性突變AID蛋白在細菌乳突形成測定中與所述人AID蛋白相比活性提高至少10倍。
56.如權利要求55所述的分離或純化的核酸分子,其中所述在殘基156和82處的氨基酸取代為脂肪族氨基酸。
57.如權利要求56所述的分離或純化的核酸分子,其中用甘氨酸(G)或丙氨酸(A)取代在殘基156處的氨基酸,并且用亮氨酸(L)或異亮氨酸(I)取代在殘基82處的氨基酸。
58.一種分離或純化的核酸分子,其包含編碼功能性突變活化誘導胞苷脫氨酶(AID) 蛋白的核苷酸序列,所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白的氨基酸序列與人 AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于在殘基156處的至少一個氨基酸取代和在殘基34處的至少一個氨基酸取代,其中所述功能性突變AID蛋白在細菌乳突形成測定中與所述人AID蛋白相比活性提高至少10倍。
59.如權利要求58所述的分離或純化的核酸分子,其中所述在殘基156和34處的氨基酸取代為脂肪族氨基酸。
60.如權利要求59所述的分離或純化的核酸分子,其中用甘氨酸(G)或丙氨酸(A)取代在殘基156處的氨基酸,并且用谷氨酸(E)或天冬氨酸(D)取代在殘基34處的氨基酸。
61.一種分離或純化的核酸分子,其包含編碼功能性突變活化誘導胞苷脫氨酶(AID) 蛋白的核苷酸序列,所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白的氨基酸序列與人 AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于在殘基156處的至少一個氨基酸取代和在殘基157處的至少一個氨基酸取代,其中所述功能性突變AID蛋白在細菌乳突形成測定中與所述人AID蛋白相比活性提高至少10倍。
62.如權利要求61所述的分離或純化的核酸分子,其中所述在殘基156和157處的氨基酸取代為脂肪族氨基酸。
63.如權利要求62所述的分離或純化的核酸分子,其中用甘氨酸(G)或丙氨酸(A)取代在殘基156處的氨基酸,并且用賴氨酸(K)或天冬酰胺(N)取代在殘基157處的氨基酸。
64.一種分離或純化的核酸分子,其包含編碼功能性突變活化誘導胞苷脫氨酶(AID) 蛋白的核苷酸序列,所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白的氨基酸序列與人 AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于在選自殘基10、82 和156的殘基處的至少一個氨基酸取代,其中所述功能性突變AID蛋白在細菌乳突形成測定中與所述人AID蛋白相比活性提高至少10倍。
65.如權利要求64所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白還包含在選自殘基9、36、44、88、93和142的殘基處的至少一個氨基酸取代。
66.如權利要求65所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白還包含在殘基9、36、44、88、93和142處的氨基酸取代。
67.如權利要求64所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白包含在選自殘基66、104和160的殘基處的至少一個其他氨基酸取代。
68.如權利要求67所述的分離或純化的核酸分子,其中所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白還包含在殘基66、104和160處的氨基酸取代。
69.如權利要求64所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白還包含在選自殘基15、115和185的殘基處的至少一個氨基酸取代。
70.如權利要求69所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白還包含在殘基15、115和185處的氨基酸取代。
71.如權利要求64所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白還包含在選自殘基9、30、34、100和184的殘基處的至少一個氨基酸取代。
72.如權利要求71所述的分離或純化的核酸分子,其中所述功能性突變AID)蛋白還包含在殘基9、30、34、100和184處的氨基酸取代。
73.如權利要求64所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白還包含在選自殘基34、35、59、120和157的殘基處的至少一個氨基酸取代。
74.如權利要求73所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白還包含在殘基34、35、59、120和157處的氨基酸取代。
75.如權利要求64所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白還包含在選自殘基9、74、77、118、157和188的殘基處的至少一個氨基酸取代。
76.如權利要求75所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白還包含在殘基9、74、77、118、157和188處的氨基酸取代。
77.如權利要求64所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白還包含在殘基53和/或殘基145處的至少一個氨基酸取代。
78.如權利要求77所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白還包含在殘基53和145處的氨基酸取代。
79.如權利要求64所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白還包含在選自殘基18、93、100、160和192的殘基處的至少一個氨基酸取代。
80.如權利要求79所述的分離或純化的核酸分子,其中所述功能性突變AID蛋白還包含在殘基18、93、100、160和192處的氨基酸取代。
81.如權利要求64-80中任一項所述的分離或純化的核酸分子,其中所述氨基酸取代為脂肪族或芳香族氨基酸取代。
82.如權利要求65-80中任一項所述的分離或純化的核酸分子,其中(a)所述在殘基9處的氨基酸取代為絲氨酸(S)、甲硫氨酸(M)或色氨酸(W),(b)所述在殘基10處的氨基酸取代為谷氨酸(E)或天冬氨酸(D),(c)所述在殘基15處的氨基酸取代為酪氨酸(Y)或亮氨酸(L),(d)所述在殘基18處的氨基酸取代為丙氨酸(A)或亮氨酸(L),(e)所述在殘基30處的氨基酸取代為酪氨酸(Y)或絲氨酸(S),(f)所述在殘基34處的氨基酸取代為谷氨酸(E)或天冬氨酸(D),(g)所述在殘基35處的氨基酸取代為絲氨酸( 或賴氨酸(K),(h)所述在殘基36處的氨基酸取代為半胱氨酸(C),(i)所述在殘基44處的氨基酸取代為精氨酸(I )或賴氨酸(K), (j)所述在殘基53處的氨基酸取代為酪氨酸(Y)或谷氨酰胺(Q), (k)所述在殘基57處的氨基酸取代為丙氨酸(A)或亮氨酸(L), (1)所述在殘基59處的氨基酸取代為甲硫氨酸(M)或丙氨酸(A), (m)所述在殘基66處的氨基酸取代為蘇氨酸(T)或丙氨酸(A), (η)所述在殘基74處的氨基酸取代為組氨酸(H)或賴氨酸(K), (ο)所述在殘基77處的氨基酸取代為絲氨酸( 或賴氨酸(K), (P)所述在殘基82處的氨基酸取代為異亮氨酸(I)或亮氨酸(L), (q)所述在殘基88處的氨基酸取代為絲氨酸( 或蘇氨酸(T),(r)所述在殘基93處的氨基酸取代為亮氨酸(L)、精氨酸(I )或賴氨酸(K), (s)所述在殘基100處的氨基酸取代為谷氨酸(E)、色氨酸(W)或苯丙氨酸(F), (t)所述在殘基104處的氨基酸取代為異亮氨酸(I)或丙氨酸(A),(u)所述在殘基115處的氨基酸取代為酪氨酸(Y)或亮氨酸(L), (ν)所述在殘基118處的氨基酸取代為谷氨酸(E)或纈氨酸(V), (x)所述在殘基120處的氨基酸取代為精氨酸(I )或亮氨酸(L), (y)所述在殘基142處的氨基酸取代為谷氨酸(E)或天冬氨酸(D), (ζ)所述在殘基145處的氨基酸取代為亮氨酸(L)或酪氨酸(Y), (aa)所述在殘基156處的氨基酸取代為甘氨酸(G)或丙氨酸(A), (bb)所述在殘基157處的氨基酸取代為甘氨酸(G)或賴氨酸(K), (cc)所述在殘基160處的氨基酸取代為谷氨酸(E)或天冬氨酸(D), (dd)所述在殘基184處的氨基酸取代為天冬酰胺(N)或谷氨酰胺(Q), (ee)所述在殘基185處的氨基酸取代為甘氨酸(G)或天冬氨酸(D), (ff)所述在殘基188處的氨基酸取代為甘氨酸(G)或谷氨酸(E),和 (gg)所述在殘基192處的氨基酸取代為蘇氨酸(T)或絲氨酸(S)。
83.一種分離或純化的核酸分子,其包含編碼功能性突變活化誘導胞苷脫氨酶(AID) 蛋白的核苷酸序列,所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白的氨基酸序列與人 AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于在殘基115處的至少一個氨基酸取代,其中所述功能性突變AID蛋白在細菌乳突形成測定中與所述人AID蛋白相比活性提高至少10倍。
84.如權利要求83所述的分離或純化的核酸分子,其中用酪氨酸(Y)、色氨酸(W)或亮氨酸(L)取代在殘基115處的氨基酸。
85.一種分離或純化的核酸分子,其包含編碼功能性突變活化誘導胞苷脫氨酶(AID) 蛋白的核苷酸序列,所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白的氨基酸序列與人 AID蛋白的氨基酸序列(SEQ ID NO :1或SEQ ID NO 2)的不同之處在于在殘基120處的至少一個氨基酸取代,其中所述功能性突變AID蛋白在細菌乳突形成測定中與所述人AID蛋白相比活性提高至少10倍。
86.如權利要求85所述的分離或純化的核酸分子,其中所述在殘基120處的氨基酸取代為脂肪族氨基酸。
87.如權利要求86所述的分離或純化的核酸分子,其中用精氨酸(R)、天冬酰胺(N)或亮氨酸(L)取代在殘基120處的氨基酸。
88.如權利要求1-87中任一項所述的分離或純化的核酸分子,其中所述功能性突變 AID蛋白包含C端截短、融合蛋白或者在殘基181處或在殘基181的遠端的終止密碼子。
89.如權利要求1-88中任一項所述的分離或純化的核酸分子,其中所述功能性突變 AID 蛋白還包含以下氨基酸取代N7K、R8Q、Q14H、R25H、Y48H、N52S、H156R、R158K 和 L198A。
90.如權利要求1-88中任一項所述的分離或純化的核酸分子,其中所述功能性突變 AID 蛋白還包含以下氨基酸取代N7K、R8Q、R9K、Q14H、R25H、Y48H、N52S、G100W、A138G、 S173T 和 T195I。
91.如權利要求1-88中任一項所述的分離或純化的核酸分子,其中所述功能性突變 AID 蛋白還包含以下氨基酸取代N7K、R8Q、R9K、Q14H、R25H、F42C、Y48H、N52S、G100W、 A138G、H156R、S173T、T195I 和 L198F。
92.如權利要求1-88中任一項所述的分離或純化的核酸分子,其中所述功能性突變AID 蛋白還包含以下氨基酸取代M6K、N7K、R8Q、K10Q、R25H、A39P、Y48H、N52A、E118D、在 118 之后插入K、和D119E。
93.如權利要求1-88中任一項所述的分離或純化的核酸分子,其中所述功能性突變 AID 蛋白還包含以下氨基酸取代N7K、R9K、K10L、Q14N、F42C、N52M、D67A、G100A、V135A, Y145F、H156R、R171H、Q175K 和 R194K。
94.如權利要求1-93中任一項所述的分離或純化的核酸分子,其中將所述分離或純化的核酸序列密碼子優化以減少體細胞高變(SHM)基序的數量。
95.一種分離或純化的核酸分子,其包含編碼功能性突變活化誘導胞苷脫氨酶(AID) 蛋白的核苷酸序列,所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白的氨基酸序列與犬 AID蛋白的氨基酸序列(SEQ ID NO 3)的不同之處在于在選自殘基34、殘基82和殘基156 的殘基處的至少一個氨基酸取代,其中所述功能性突變AID蛋白在細菌乳突形成測定中與人AID蛋白相比活性提高至少10倍。
96.一種分離或純化的核酸分子,其包含編碼功能性突變活化誘導胞苷脫氨酶(AID) 蛋白的核苷酸序列,所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白的氨基酸序列與小鼠 AID蛋白的氨基酸序列(SEQ ID NO 4)的不同之處在于在選自殘基34、殘基82和殘基156 的殘基處的至少一個氨基酸取代,其中所述功能性突變AID蛋白在細菌乳突形成測定中與人AID蛋白相比活性提高至少10倍。
97.一種分離或純化的核酸分子,其包含編碼功能性突變活化誘導胞苷脫氨酶(AID) 蛋白的核苷酸序列,所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白的氨基酸序列與大鼠 AID蛋白的氨基酸序列(SEQ ID NO 5)的不同之處在于在選自殘基34、殘基82和殘基156 的殘基處的至少一個氨基酸取代,其中所述功能性突變AID蛋白在細菌乳突形成測定中與人AID蛋白相比活性提高至少10倍。
98.一種分離或純化的核酸分子,其包含編碼功能性突變活化誘導胞苷脫氨酶(AID) 蛋白的核苷酸序列,所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白的氨基酸序列與牛 AID蛋白的氨基酸序列(SEQ ID NO 6)的不同之處在于在選自殘基34、殘基82和殘基156 的殘基處的至少一個氨基酸取代,其中所述功能性突變AID蛋白在細菌乳突形成測定中與人AID蛋白相比活性提高至少10倍。
99.一種分離或純化的核酸分子,其包含編碼功能性突變活化誘導胞苷脫氨酶(AID) 蛋白的核苷酸序列,所述功能性突變活化誘導胞苷脫氨酶(AID)蛋白的氨基酸序列與雞 AID蛋白的氨基酸序列(SEQ ID NO 7)的不同之處在于在選自殘基34、殘基82和殘基156 的殘基處的至少一個氨基酸取代,其中所述功能性突變AID蛋白在細菌乳突形成測定中與人AID蛋白相比活性提高至少10倍。
100.一種表達載體,其包含權利要求1-99中任一項所述的核酸分子。
101.一種分離的真核細胞,其包含權利要求1-99中任一項所述的核酸分子或權利要求100所述的載體。
102.一種分離的原核細胞,其包含權利要求1-99中任一項所述的核酸分子或權利要求100所述的載體。
103.一種轉基因動物,其包含權利要求1-99中任一項所述的核酸。
104.如權利要求103所述的轉基因動物,其中所述動物為小鼠。
105.如權利要求103所述的轉基因動物,其中所述動物為兔。
106.如權利要求103所述的轉基因動物,其中所述動物為駱駝(camelid)。
107.如權利要求103所述的轉基因動物,其中所述動物為山羊。
108.如權利要求103所述的轉基因動物,其中所述動物為大鼠。
109.一種用于制備具有期望特性的基因產物的方法,所述方法包括在細胞群體中表達編碼所述基因產物的核酸,其中所述細胞群體表達或能夠被誘導以表達權利要求1-99中任一項所述的核酸分子所編碼的功能性突變活化誘導胞苷脫氨酶(AID)蛋白,由此所述功能性突變AID蛋白的表達在編碼所述基因產物的核酸中誘導突變。
110.如權利要求109所述的方法,其中所述方法還包括在表達編碼所述具有期望特性的基因產物的突變核酸序列的群體內選擇一個細胞或多個細胞的步驟。
111.如權利要求109或權利要求110所述的方法,其中所述細胞為真核細胞或原核細胞。
112.如權利要求109-111中任一項所述的方法,其中所述細胞為哺乳動物細胞。
113.如權利要求109-112中任一項所述的方法,其中所述細胞為B細胞或B細胞衍生物。
114.如權利要求109-113中任一項所述的方法,其中所述細胞包含至少一種為SHM而被密碼子優化以增加SHM基序數量的核酸序列。
115.一種用于將生物體突變以具有期望表型的方法,所述方法包括在所述生物體中表達或誘導表達權利要求1-99中任一項所述的核酸分子所編碼的功能性突變活化誘導胞苷脫氨酶(AID)蛋白,由此所述功能性突變AID蛋白的表達在所述生物體的染色體DNA內誘導突變。
116.如權利要求115所述的方法,其中所述方法還包括在表現出所述期望表型的生物體內選擇一個細胞或多個細胞的步驟。
117.如權利要求115或權利要求116所述的方法,其中所述生物體為真核生物或原核生物。
118.如權利要求115-117中任一項所述的方法,其中所述生物體包含至少一種為SHM 而被密碼子優化以增加SHM基序數量的核酸序列。
全文摘要
本發明提供了活化誘導胞苷脫氨酶(AID)蛋白的功能性突變體,與野生型AID蛋白相比其具有增加的活性。本發明還提供了編碼所述功能性AID突變體的核酸,以及包含所述核酸的載體和細胞。本發明還提供了使用所述功能性突變AID蛋白的方法。
文檔編號C12N5/00GK102482639SQ201080023311
公開日2012年5月30日 申請日期2010年4月5日 優先權日2009年4月3日
發明者C·拉達, M·王, M·紐伯格, Z·楊 申請人:醫學研究會