專利名稱::外源核酸序列的靶向整合和表達(dá)的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及基因組工程、基因靶向、靶向染色體整合和蛋白質(zhì)表達(dá)領(lǐng)域。發(fā)明背景基因組生物學(xué)中感興趣的主要領(lǐng)域,特別是就許多基因組的完整核苷酸序列的測(cè)定而言,是如何靶向改變基因組的序列。提供一個(gè)例子,人P-珠蛋白基因中的一對(duì)核苷酸的突變引起鐮狀細(xì)胞貧血。因此,若能以穩(wěn)定方式將此對(duì)突變核苷酸內(nèi)源性基因組拷貝轉(zhuǎn)變成野生型序列而產(chǎn)生正常(3-珠蛋白就能夠治愈鐮狀細(xì)胞貧血,例如可將有功能的P-珠蛋白基因引入含有突變P-珠蛋白基因的基因組中。已嘗試?yán)猛粗亟M的天然現(xiàn)象來(lái)改變培養(yǎng)細(xì)胞的基因組序列。參見(jiàn)例如,Capecchi(1989)5We騰244:1288-1292;美國(guó)專利號(hào)6,528,313和6,528,314。如果某多核苷酸與含有待改變序列的基因組區(qū)域同源性足夠高,可通過(guò)同源重組用該多核苷酸的部分或所有序列取代此基因組序列。然而,在這些情況下同源重組的頻率極低。而且,外源性多核苷酸插入缺少序列同源性的基因組位置的頻率比同源重組的頻率高幾個(gè)數(shù)量級(jí)。已證明使與外源性多核苷酸具有同源性的基因組區(qū)域雙鏈斷裂而引入基因組DNA,能刺激培養(yǎng)細(xì)胞該位點(diǎn)處的同源重組,提高數(shù)千倍。Rouet等(1994)ikfo/.CW/.說(shuō)o/.14:8096-8106;Choulika等(l995)Mo/.Ce〃,所o/.15:1968-1973;Donoho等(1998)Mo/.Ce〃.歷o/.18:4070-4078。還參見(jiàn)Johnson等(2001)所oc/zew,7>a"&29:196-201;禾卩Yanez等(1998)Ge""/zera;^5:149-159。在這些方法中,將大范圍核酸酶(即其識(shí)別序列非常大,以致于在感興趣基因組中不存在或非常罕見(jiàn)的核酸內(nèi)切酶)識(shí)別位點(diǎn)插入所需基因組區(qū)域,從而在所需基因組區(qū)域中進(jìn)行DNA切割。然而,大范圍核酸酶切割-刺激的同源重組依賴于在準(zhǔn)備改變的基因組區(qū)域附近偶然存在或定點(diǎn)插入合適的大范圍核酸酶識(shí)別位點(diǎn)。由于在典型的哺乳動(dòng)物基因組中大范圍核酸酶識(shí)別位點(diǎn)罕見(jiàn)(或不存在),所以插入合適的大范圍核酸酶識(shí)別位點(diǎn)遇到了與其它基因組改變同樣的困難,這些方法無(wú)法廣泛應(yīng)用。因此,仍然需要耙向改變?nèi)魏位蚪M序列的組合物和方法以及將外源序列靶向引入基因組的組合物和方法。發(fā)明概述本發(fā)明提供了在細(xì)胞中表達(dá)外源核酸序列產(chǎn)物(即蛋白質(zhì)或RNA分子)的方法和組合物。所述外源核酸序列可包括(例如)一種或多種基因或cDNA分子,或者任何類型的編碼或非編碼序列,將其引入細(xì)胞中,使其整合到細(xì)胞基因組中預(yù)定的感興趣區(qū)域中。對(duì)基因組的感興趣區(qū)域進(jìn)行靶向雙鏈切割有助于整合外源核酸序列。通過(guò)采用含有鋅指結(jié)合域(經(jīng)工程改造可結(jié)合感興趣區(qū)域中所選的任何序列)和切割域或切割半域的融合蛋白使切割靶向特定位點(diǎn)。這種切割能刺激外源性多核苷酸序列整合于切割位點(diǎn)或其附近??赏ㄟ^(guò)同源依賴性和同源非依賴性機(jī)制進(jìn)行所述外源序列的整合。本發(fā)明還提供了通過(guò)靶向整合(同源依賴性或同源非依賴性)一種或多種外源序列,調(diào)節(jié)內(nèi)源性細(xì)胞基因的表達(dá)的方法和組合物。這種外源序列可包括(例如)轉(zhuǎn)錄控制序列,如啟動(dòng)子和增強(qiáng)子。調(diào)節(jié)可包括轉(zhuǎn)錄激活(如,通過(guò)(例如)插入啟動(dòng)子和/或增強(qiáng)子序列提高轉(zhuǎn)錄水平)和轉(zhuǎn)錄抑制(如,通過(guò)(例如)將外源序列插入內(nèi)源性轉(zhuǎn)錄調(diào)節(jié)序列、插入促進(jìn)轉(zhuǎn)錄抑制的序列、或插入打斷編碼區(qū)的序列進(jìn)行功能性"敲除")。本發(fā)明還提供通過(guò)同源依賴性或同源非依賴性機(jī)制將將外源序列耙向插入基因組的方法和組合物,其中所述外源序列不表達(dá)產(chǎn)物或不調(diào)節(jié)內(nèi)源性基因的表達(dá)。例如,可將序列特異性DNA切割酶的識(shí)別序列引入基因組中的預(yù)定位置,以便該切割酶在基因組的預(yù)定位置上靶向切割。示范性DNA切割酶包括但不限于限制性酶、大范圍核酸酶和尋靶核酸內(nèi)切酶。在一個(gè)方面,本文公開(kāi)了在細(xì)胞中表達(dá)外源核酸序列產(chǎn)物的方法,所述方法包括(a)在所述細(xì)胞中表達(dá)第一種融合蛋白,所述第一種融合蛋白含有第一鋅指結(jié)合域和第一切割半域,其中所述第一鋅指結(jié)合域經(jīng)工程改造能結(jié)合于所述細(xì)胞基因組中感興趣區(qū)域的第一靶位點(diǎn);(b)在所述細(xì)胞中表達(dá)第二種融合蛋白,所述第二種融合蛋白含有第二鋅指結(jié)合域和第二切割半域,其中所述第二鋅指結(jié)合域結(jié)合于所述細(xì)胞基因組中感興趣區(qū)域的第二靶位點(diǎn),其中所述第二靶位點(diǎn)與所述第一靶位點(diǎn)不同;和(C)使所述細(xì)胞與含有外源核酸序列和第一核苷酸序列的多核苷酸相接觸,所述第一核苷酸序列與所述感興趣區(qū)域中的第一序列同源;其中所述第一種融合蛋白與所述第一靶位點(diǎn)的結(jié)合和所述第二種融合蛋白與所述第二靶位點(diǎn)的結(jié)合使所述切割半域定位,從而在所述感興趣區(qū)域切割所述細(xì)胞基因組,導(dǎo)致所述外源序列整合到所述細(xì)胞基因組的感興趣區(qū)域中,表達(dá)所述外源序列的產(chǎn)物。所述外源核酸序列可包含cDNA和/或啟動(dòng)子。在其它實(shí)施方式中,該外源核酸序列編碼siRNA。所述第一核苷酸序列可能與所述感興趣區(qū)域中的第一序列相同。在某些實(shí)施方式中,該多核苷酸還包含與所述感興趣區(qū)域中第二序列同源的第二核苷酸序列。所述第二核苷酸序列可能與所述感興趣區(qū)域中第二序列相同。而且,在含有第一和第二核苷酸序列的實(shí)施方式中,所述第一核苷酸序列可與所述感興趣區(qū)域中第一序列相同,所述第二核苷酸序列可能與所述感興趣區(qū)域中第二序列同源但不相同。在本文所述的任何方法中,所述第一和第二核苷酸序列側(cè)接于所述外源序列。在某些實(shí)施方式中,所述多核苷酸是質(zhì)粒。在其它實(shí)施方式中,所述多核苷酸是線性DNA分子。在本文所述的任何方法中,所述感興趣區(qū)域位于細(xì)胞染色質(zhì)、染色體和/或某基因(如含有突變?nèi)琰c(diǎn)突變、取代、缺失、插入、重復(fù)、倒位和/或易位的基因)的可及區(qū)中。在某些實(shí)施方式中,該外源核酸序列包含所述基因野生型序列。在其它實(shí)施方式中,該外源核酸序列包含所述基因的野生型序列的一部分。在其它實(shí)施方式中,該外源核酸序列包含所述基因的轉(zhuǎn)錄產(chǎn)物的cDNA拷貝。在本文所述的任何方法中,所述感興趣區(qū)域位于對(duì)細(xì)胞活力而言不是必需的基因組區(qū)域中。在其它實(shí)施方式中,該感興趣區(qū)域位于有轉(zhuǎn)錄活性的基因組區(qū)域中。該感興趣區(qū)域位于有轉(zhuǎn)錄活性但對(duì)細(xì)胞活力而言不是必需的基因組區(qū)域(如人Rosa26基因組、鼠Rosa26基因的人同源物或CCR5基因)中。在另一方面,本文提供了將外源序列整合到細(xì)胞基因組的感興趣區(qū)域內(nèi)的方法,所述方法包括(a)在所述細(xì)胞中表達(dá)第一種融合蛋白,所述第一種融合蛋白含有第一鋅指結(jié)合域和第一切割半域,其中所述第一鋅指結(jié)合域經(jīng)工程改造能結(jié)合于所述細(xì)胞基因組中感興趣區(qū)域的第一耙位點(diǎn);(b)在所述細(xì)胞中表達(dá)第二種融合蛋白,所述第二種融合蛋白含有第二鋅指結(jié)合域和第二切割半域,其中所述第二鋅指結(jié)合域結(jié)合于所述細(xì)胞基因組中感興趣區(qū)域的第二靶位點(diǎn),其中所述第二靶位點(diǎn)與所述第一靶位點(diǎn)不同;和(C)使所述細(xì)胞與含有外源核酸序列的多核苷酸相接觸;其中所述第一種融合蛋白與所述第一靶位點(diǎn)的結(jié)合和所述第二種融合蛋白與所述第二靶位點(diǎn)的結(jié)合使所述切割半域定位,從而在所述感興趣區(qū)域切割所述細(xì)胞基因組,導(dǎo)致所述外源序列整合到所述細(xì)胞基因組的所述感興趣區(qū)域中。在某些實(shí)施方式中,該整合使所述感興趣區(qū)域中的基因表達(dá)失活。所述外源核酸序列可包含(例如)長(zhǎng)度為1-50個(gè)核苷酸的序列。而且,該外源核酸序列可編碼可檢測(cè)的氨基酸序列。所述感興趣區(qū)域可位于細(xì)胞染色質(zhì)的可及區(qū)中。在本文所述的任何方法中,所述第一和第二切割半域來(lái)自ns型限制性核酸內(nèi)切酶,例如FoW或5fal。而且,在本文所述的任何方法中,至少一種融合蛋白在其切割半域二聚化界面的氨基酸序列中包含改變。在本文所述的任何方法中,所述細(xì)胞可以是哺乳動(dòng)物細(xì)胞,如人細(xì)胞。而且,所述細(xì)胞可以阻滯在細(xì)胞周期的G2期。因此,本發(fā)明主題包括但不限于以下實(shí)施方式1.一種在細(xì)胞中表達(dá)外源核酸序列產(chǎn)物的方法,所述方法包括(a)在所述細(xì)胞中表達(dá)第一種融合蛋白,所述第一種融合蛋白含有第一鋅指結(jié)合域和第一切割半域,其中所述第一鋅指結(jié)合域經(jīng)工程改造能結(jié)合于所述細(xì)胞基因組中感興趣區(qū)域的第一靶位點(diǎn);(b)在所述細(xì)胞中表達(dá)第二種融合蛋白,所述第二種融合蛋白含有第二鋅指結(jié)合域和第二切割半域,其中所述第二鋅指結(jié)合域能結(jié)合于所述細(xì)胞基因組中感興趣區(qū)域的第二靶位點(diǎn),所述第二靶位點(diǎn)與所述第一靶位點(diǎn)不同;和(C)使所述細(xì)胞與含有外源核酸序列的多核苷酸相接觸;其中所述第一種融合蛋白與所述第一耙位點(diǎn)的結(jié)合和所述第二種融合蛋白與所述第二靶位點(diǎn)的結(jié)合能使所述切割半域定位,從而在所述感興趣區(qū)域切割該細(xì)胞基因組,導(dǎo)致所述外源序列整合到所述細(xì)胞基因組的感興趣區(qū)域中,而表達(dá)所述外源序列的產(chǎn)物。2.如l所述的方法,其特征在于,所述外源核酸序列包含cDNA。3.如l所述的方法,其特征在于,所述外源序列包含啟動(dòng)子。4.如l所述的方法,其特征在于,所述多核苷酸還包含與所述感興趣區(qū)域中第一序列相同的第一核苷酸序列。5.如4所述的方法,其特征在于,所述多核苷酸還包含與所述感興趣區(qū)域中第二序列相同的第二核苷酸序列。6.如l所述的方法,其特征在于,所述多核苷酸還包含與所述感興趣區(qū)域中第一序列同源但不相同的第一核苷酸序列。7.如6所述的方法,其特征在于,所述多核苷酸還包含與所述感興趣區(qū)域中第二序列同源但不相同的第二核苷酸序列。8.如l所述的方法,其特征在于,所述多核苷酸還包含與所述感興趣區(qū)域中第一序列相同的第一核苷酸序列和與所述感興趣區(qū)域中第二序列同源但不相同的第二核苷酸序列。9.如5所述的方法,其特征在于,所述第一和第二核苷酸序列側(cè)接于所述外源序列。10.如7所述的方法,其特征在于,所述第一和第二核苷酸序列側(cè)接于所述外源序列。11.如8所述的方法,源序列。12.如1所述的方法,13.如l所述的方法,14.如1所述的方法,中。15.如1所述的方法,必需的基因組區(qū)域中。16.如1所述的方法,區(qū)域中。17.如1所述的方法,其特征在于,所述第一和第二核苷酸序列側(cè)接于所述外其特征在于,其特征在于,其特征在于,其特征在于,其特征在于,所述多核苷酸是質(zhì)粒。所述多核苷酸是線性DNA分子。所述感興趣區(qū)域位于細(xì)胞染色質(zhì)的可及區(qū)所述感興趣區(qū)域位于對(duì)細(xì)胞活力而言不是所述感興趣區(qū)域位于有轉(zhuǎn)錄活性的基因組所述感興趣區(qū)域位于有轉(zhuǎn)錄活性但對(duì)細(xì)胞其特征在于,活力而言不是必需的基因組區(qū)域中。18.如17所述的方法,其特征在于,所述感興趣區(qū)域是人Rosa26基因。19.如17所述的方法,其特征在于,所述感興趣區(qū)域是鼠Rosa26基因的人同源物。20.如1所述的方法,其特征在于,所述第一和第二切割半域來(lái)自IIS型限制性核酸內(nèi)切酶。21,如20所述的方法,其特征在于,所述IIS型限制性核酸內(nèi)切酶選自FoW或加I。22.如l所述的方法,其特征在于,所述感興趣區(qū)域位于染色體中。23.如1所述的方法,24.如13所述的方法,25.如14所述的方法,重復(fù)、倒位或易位。26.如24所述的方法,序列。27.如24所述的方法,序列的一部分。28.如24所述的方法,的cDNA拷貝。29.如1所述的方法,30.如1所述的方法,31.如1所述的方法,的氨基酸序列中包含改變。32.如1所述的方法,33.如32所述的方法,其特征在于,所述感興趣區(qū)域包含基因。其特征在于,所述基因包含突變。其特征在于,所述突變選自點(diǎn)突變、取代、缺失、插入、其特征在于,所述外源核酸序列包含所述基因的野生型其特征在于,所述外源核酸序列包含所述基因的野生型其特征在于,所述外源核酸序列包含所述基因轉(zhuǎn)錄產(chǎn)物其特征在于,其特征在于,其特征在于,所述外源核酸序列編碼siRNA。所述細(xì)胞阻滯在細(xì)胞周期的G2期。至少一種融合蛋白的切割半域二聚化界面其特征在于,所述細(xì)胞是哺乳動(dòng)物細(xì)胞。其特征在于,所述細(xì)胞是人細(xì)胞。附圖簡(jiǎn)要說(shuō)明圖1顯示了編碼蛋白質(zhì)的氨基末端部分的人hSMClLl基因的一部分雙鏈形式的核苷酸序列(SEQIDNO:l)和其編碼的氨基酸序列(SEQIDNO:2)。下劃線標(biāo)明了hSMCl-特異性ZFP的靶序列(各DNA鏈上有一個(gè))。圖2顯示了編碼耙向切割hSMCl基因的ZFP-FoM融合物質(zhì)粒的示意圖。圖3A-D顯示了hSMCl基因的示意圖。圖3A顯示了包含hSMCl基因人X染色體的一部分的示意圖。圖3B顯示了hSMCl基因一部分的示意圖,其包括上游區(qū)(+1左邊)、第一外顯子(+l和箭頭標(biāo)記的"SMC1編碼序列"的右端之間)和第一內(nèi)含子的一部分。還提供了與初始擴(kuò)增引物和染色體特異性引物(見(jiàn)表3)同源的序列位置。圖3C顯示了人X染色體中SMC1起始密碼子區(qū)域的核苷酸序列(SEQIDNO:3)、其編碼的氨基酸序列(SEQIDNO:4)和SMCl-特異性鋅指蛋白的靶位點(diǎn)。圖3D顯示了供體分子對(duì)應(yīng)區(qū)域的序列(SEQIDNO:5),下劃線標(biāo)出了供體和染色體序列之間的差異。用雙下劃線標(biāo)出了供體特異性擴(kuò)增引物(表3)中所含的序列。圖4顯示了hSMCl供體構(gòu)建物的示意圖。圖5顯示了轉(zhuǎn)染HEK293細(xì)胞的DNA的PCR分析。從左起,各泳道顯示了用編碼GFP的質(zhì)粒(對(duì)照質(zhì)粒)轉(zhuǎn)染細(xì)胞、用各自編碼兩種hSMCl-特異性ZFP-FoH融合蛋白(僅ZFP)之一的兩種質(zhì)粒轉(zhuǎn)染細(xì)胞、用兩種濃度的hSMCl供體質(zhì)粒(僅供體)轉(zhuǎn)染細(xì)胞和用兩種ZFP編碼質(zhì)粒和供體質(zhì)粒(ZFP+供體)轉(zhuǎn)染細(xì)胞的結(jié)果。詳見(jiàn)實(shí)施例1。圖6顯示了通過(guò)耙向同源重組產(chǎn)生的衍生自突變hSMCl基因的擴(kuò)增產(chǎn)物的核苷酸序列(SEQIDN0:6)。用單下劃線表示衍生自其中克隆了擴(kuò)增產(chǎn)物的載體的序列,虛線下劃線表示供體分子中不存在的染色體序列(核苷酸32-97),供體和染色體的共有序列沒(méi)有下劃線(核苷酸98-394和402-417),用雙下劃線表示供體的獨(dú)特序列(核苷酸395-401)。小寫(xiě)字母代表染色體和供體之間不同的序列。圖7顯示了包含第二內(nèi)含子3'端和第三外顯子5'端的人IL2Ry基因一部分的核苷酸序列(SEQIDNO:7)和由第三外顯子所示部分編碼的氨基酸序列(SEQIDNO:8)。用下劃線表示第二對(duì)IL2Ry-特異性ZFP的靶序列。詳見(jiàn)實(shí)施例2。圖8顯示了編碼靶向切割I(lǐng)L2RY基因的ZFP-FokI融合物的質(zhì)粒的示意圖。圖9A-D顯示了IL2Ry基因的示意圖。圖9A顯示了包含IL2Ry基因的人X染色體一部分的示意圖。圖9B顯示了包含第二內(nèi)含子一部分、第三外顯子和第三內(nèi)含子一部分的IL2RY基因的一部分示意圖。還提供了與初始擴(kuò)增引物和染色體特異性引物(見(jiàn)表5)同源的序列位置。圖9C顯示了人X染色體中IL2Ry基因第三外顯子區(qū)域的核苷酸序列(SEQIDNO:9)、其編碼的氨基酸序列(SEQIDNO:10)和第一對(duì)IL2R,特異性鋅指蛋白的耙位點(diǎn)。圖9D顯示了供體分子對(duì)應(yīng)區(qū)域的序列(SEQIDNO:11),用下劃線表示供體和染色體序列之間的差異。用雙劃線標(biāo)出了供體特異性擴(kuò)增引物(表5)中所含的序列。圖10顯示了IL2RY供體構(gòu)建物的示意圖。圖11顯示了轉(zhuǎn)染K652細(xì)胞的DNA的PCR分析。從左起,各泳道顯示了用各自編碼一對(duì)IL2R,特異性ZFP-FokI融合蛋白(僅ZFP,泳道l)之一的兩種質(zhì)粒轉(zhuǎn)染細(xì)胞、用兩種濃度的IL2R丫供體質(zhì)粒(僅供體,泳道2和3)轉(zhuǎn)染細(xì)胞和用兩種ZFP-編碼質(zhì)粒和供體質(zhì)粒(ZFP+供體,泳道4-7)轉(zhuǎn)染細(xì)胞的結(jié)果。分別采用兩對(duì)IL2RY-特異性ZFP-FoW融合物(標(biāo)為"第1對(duì)"和"第2對(duì)"),使用這兩對(duì)導(dǎo)致產(chǎn)生診斷用擴(kuò)增產(chǎn)物(圖中標(biāo)記為"預(yù)計(jì)的嵌合產(chǎn)物")。詳見(jiàn)實(shí)施例2。圖12顯示了靶向同源重組產(chǎn)生的衍生自突變IL2RY基因的擴(kuò)增產(chǎn)物的核苷酸序列(SEQIDNO:12)。用單下劃線表示衍生自其中克隆了擴(kuò)增產(chǎn)物的載體的序列,虛線下劃線表示供體分子中不存在的染色體序列(核苷酸460-552),供體和染色體的共有序列沒(méi)有下劃線(核苷酸32-42和59-459),用雙下劃線表示含有區(qū)別供體序列與染色體序列的核苷酸序列部分(核苷酸44-58)。小寫(xiě)字母代表染色體和供體之間序列不同的核苷酸。圖13顯示了核心啟動(dòng)子、前兩個(gè)外顯子和第一內(nèi)含子的人p-珠蛋白基因編碼節(jié)段部分的核苷酸序列(SEQIDNO:13)。染色體11上5212541位(BLAT,UCSC基因組生物信息學(xué)站點(diǎn))的A(用粗體和下劃線表示)變?yōu)門(mén)的錯(cuò)義突變可導(dǎo)致鐮狀細(xì)胞貧血。設(shè)計(jì)第一鋅指/尸oM融合蛋白,主要與下劃線的12-核苷酸序列AAGGTGAACGTG(SEQIDNO:13的核苷酸305-316)接觸,設(shè)計(jì)第二鋅指/FoM融合蛋白,主要與下劃線的12-核苷酸序列CCGTTACTGCCC(SEQIDNO:13的核苷酸325-336)的互補(bǔ)物接觸。圖14是編碼靶向切割人|3珠蛋白基因的ZFP-FokI融合物的質(zhì)粒的示意圖。圖15是顯示克隆的含上游區(qū)、第一和第二外顯子、第一內(nèi)含子和引物結(jié)合位點(diǎn)的人卩珠蛋白基因的示意圖。圖16是(3珠蛋白供體構(gòu)建物,pCR4-TOPO-HBB供體的示意圖。圖17顯示了用兩對(duì)(3-珠蛋白-特異性ZFP核酸酶和卩珠蛋白供體質(zhì)粒轉(zhuǎn)染細(xì)胞的DNA的PCR分析。左圖是加樣對(duì)照,其中采用起始擴(kuò)增引物1和起始擴(kuò)增引物2(表7)進(jìn)行擴(kuò)增。在右圖顯示的實(shí)驗(yàn)中,采用"染色體特異性"和"供體特異性"引物(表7)進(jìn)行擴(kuò)增。各圖中最左邊的泳道含有分子量標(biāo)記物,下一條泳道顯示獲自模擬-轉(zhuǎn)染細(xì)胞的擴(kuò)增產(chǎn)物。其余泳道(從左至右)顯示用以下物質(zhì)轉(zhuǎn)染細(xì)胞的擴(kuò)增產(chǎn)物GFP-編碼質(zhì)粒、100ng各ZFP/尸oM-編碼質(zhì)粒、200ng各ZFP/FMI-編碼質(zhì)粒、200ng供體質(zhì)粒、600ng供體質(zhì)粒、200ng供體質(zhì)粒+100ng各ZFP/FoA:I-編碼質(zhì)粒和600ng供體質(zhì)粒+200ng各ZFP/^oM-編碼質(zhì)粒。圖18顯示了靶向同源重組產(chǎn)生的衍生自突變P-珠蛋白基因的擴(kuò)增產(chǎn)物的核苷酸序列(SEQIDNO:14)。虛線下劃線表示供體分子中不存在的染色體序列(核苷酸1-72),供體和染色體的共有序列沒(méi)有下劃線(核苷酸73-376),用雙下劃線表示含有區(qū)別供體序列與染色體序列的核苷酸序列部分(核苷酸377-408)。小寫(xiě)字母代表染色體和供體之間序列不同的核苷酸。圖19顯示了白介素-2受體Y鏈(IL-2R力基因第五外顯子一部分的核苷酸序列(SEQIDNO:15)。也顯示了(下劃線)5-8和5-10ZFP/尸oW融合蛋白的靶序列。詳見(jiàn)實(shí)施例5。圖20顯示了靶向人IL-2Ry基因外顯子5的5-8ZFP/尸oW融合物的氨基酸序列(SEQIDNO:16)。氨基酸殘基1-17含有核定位序列(NLS,下劃線);殘基18-130含有ZFP部分,粗體表示鋅指組件的識(shí)別區(qū);ZFP-FoM接頭(ZC接頭,下劃線)從殘基131延伸至140,F(xiàn)oH切割半域從殘基141處開(kāi)始,延伸至該蛋白末端的殘基336。改變?cè)摎埢援a(chǎn)生Q486E突變,用下劃線和粗體表示。圖21顯示了耙向人IL-2Ry基因的外顯子5的5-10ZFP/尸oM融合物的氨基酸序列(SEQIDNO:17)。氨基酸殘基1-17含有核定位序列(NLS,下劃線);殘基18-133含有ZFP部分,粗體表示鋅指組件的識(shí)別區(qū);ZFP-FoM接頭(ZC接頭,下劃線)從殘基134延伸至143,F(xiàn)oM切割半域由殘基144處開(kāi)始,延伸至該蛋白末端的殘基339。改變?cè)摎埢援a(chǎn)生E490K突變,用下劃線和粗體表示。圖22顯示了衍生自維克多水母C4e《wowaw'"oWa)GFP基因的增強(qiáng)綠色熒光蛋白基因的核苷酸序列(SEQIDNO:18)(Tsien(1998)」朋.iev.67:509-544)。用下劃線表示ATG啟動(dòng)密碼子和誘變區(qū)域。圖23顯示了突變?nèi)毕菪蚭GFP基因的核苷酸序列(SEQIDNO:19)。用下劃線表示ZFP-核酸酶的結(jié)合位點(diǎn),此結(jié)合位點(diǎn)之間的區(qū)域?qū)?yīng)于修飾區(qū)域。圖24顯示了編碼耙向eGFP基因的鋅指核酸酶的質(zhì)粒的結(jié)構(gòu)。圖25顯示了分析鋅指核酸內(nèi)切酶靶向DNA切割突變eGFP基因的10%丙烯酰胺凝膠放射自顯影圖。詳見(jiàn)實(shí)施例8。圖26顯示了質(zhì)粒pcDNA4/TO/GFPmut的結(jié)構(gòu)(參見(jiàn)實(shí)施例9)。圖27顯示了轉(zhuǎn)染人HEK293細(xì)胞獲得的各種細(xì)胞系中按GAPDHmRNA標(biāo)準(zhǔn)化的eGFPmutmRNA水平。白色柱顯示了未處理細(xì)胞的水平;黑色柱顯示了用2ng/ml強(qiáng)力霉素處理細(xì)胞的水平。詳見(jiàn)實(shí)施例9。圖28顯示了質(zhì)粒pCR(R)4-TOPO-GFP供體5的結(jié)構(gòu)。詳見(jiàn)實(shí)施例10。圖29顯示了pCR(R)4-TOPO-GFP供體5中eGFP插入物的核苷酸序列(SEQIDNO:20)。該插入物含有編碼未修飾的增強(qiáng)綠色熒光蛋白部分、但缺少起始密碼子的序列。詳見(jiàn)實(shí)施例10。圖30顯示了用編碼兩種ZFP核酸酶的質(zhì)粒和編碼供體序列的質(zhì)粒轉(zhuǎn)染的T18細(xì)胞的FACS分析,轉(zhuǎn)染后24小時(shí),用100ng/ml諾考達(dá)唑處理48小時(shí),使細(xì)胞阻滯在細(xì)胞周期的G2期。更換培養(yǎng)基,允許細(xì)胞再恢復(fù)48小時(shí),用FACS分析測(cè)定基因校正。詳見(jiàn)實(shí)施例11。圖31顯示了用編碼兩種ZFP核酸酶的質(zhì)粒和編碼供體序列的質(zhì)粒轉(zhuǎn)染T18細(xì)胞的FACS分析,轉(zhuǎn)染后24小時(shí),用0.2)iM長(zhǎng)春堿處理48小時(shí),使細(xì)胞阻滯在細(xì)胞周期的G2期。更換培養(yǎng)基,允許細(xì)胞再恢復(fù)48小時(shí),用FACS分析測(cè)定基因校正。詳見(jiàn)實(shí)施例11。圖32顯示了pCR(R)4-T0P0中1,527個(gè)核苷酸的eGFP插入物的核苷酸序列(SEQIDNO:21)。該序列編碼缺少起始密碼子的未修飾的增強(qiáng)綠色熒光蛋白。詳見(jiàn)實(shí)施例13。圖33顯示了測(cè)定內(nèi)源性人IL-2Ry基因編輯頻率的實(shí)驗(yàn)的示意圖。詳見(jiàn)實(shí)施例14。圖34顯示了測(cè)定通過(guò)靶向切割和同源重組編輯內(nèi)源性細(xì)胞基因的頻率的丙烯酰胺凝膠的放射自顯影圖。標(biāo)為"GFP"的泳道顯示了用eGFP編碼載體轉(zhuǎn)染細(xì)胞對(duì)照的測(cè)定結(jié)果;標(biāo)為"僅ZFP"的泳道顯示了用兩種ZFP/核酸酶-編碼質(zhì)粒(各50ng)而不用供體序列轉(zhuǎn)染細(xì)胞的另一對(duì)照實(shí)驗(yàn)的結(jié)果。標(biāo)為"僅供體"的泳道顯示了用1pg供體質(zhì)粒而不用ZFP/核酸酶-編碼質(zhì)粒轉(zhuǎn)染細(xì)胞的對(duì)照實(shí)驗(yàn)的結(jié)果。在實(shí)驗(yàn)泳道中,50Z指用ZFP/核酸酶表達(dá)質(zhì)粒各50ng轉(zhuǎn)染的細(xì)胞,100Z指用ZFP/核酸酶表達(dá)質(zhì)粒各100ng轉(zhuǎn)染的細(xì)胞,0.5D指用0.5嗎供體質(zhì)粒轉(zhuǎn)染的細(xì)胞,1D指用1.0昭供體質(zhì)粒轉(zhuǎn)染的細(xì)胞。"+"指接觸0.2長(zhǎng)春堿的細(xì)胞;"-"指未接觸長(zhǎng)春堿的細(xì)胞。"wt"指獲自含有野生型染色體IL-2RY基因的染色體擴(kuò)增產(chǎn)物經(jīng)SwBI消化后獲得的片段;"rflp"指獲自含有同源重組整合的供體質(zhì)粒的序列的染色體擴(kuò)增產(chǎn)物經(jīng)5wBI消化后獲得的兩種片段(分子量大約相同)。圖35顯示了測(cè)定耙向重組于K562細(xì)胞中人IL-2RY基因座的試驗(yàn)所用凝膠放射4小時(shí)后的自顯影圖。"wt"標(biāo)明診斷為含有天然K562IL-2Ry序列的染色體DNA的條帶;"rflp"標(biāo)明診斷為含有供體DNA分子中存在的改變的IL-2RY序列的染色體DNA的雙條帶。泳道上方的符號(hào)"+"表示用0.2pM長(zhǎng)春堿處理該細(xì)胞;符號(hào)"-"表示不用長(zhǎng)春堿處理該細(xì)胞。"ZFP+供體"泳道中的數(shù)字表示含有最初存在于供體DNA分子中的序列占整個(gè)染色體DNA的百分?jǐn)?shù),按照生產(chǎn)商手冊(cè)(分子動(dòng)力學(xué)圖像夸特用戶指南(MolecularDynamicsImageQuantUser'sGuide);第218-415部分)的第8章所述,用分子動(dòng)力學(xué)圖像夸特(MolecularDynamics'ImageQuant)軟件5.1版的"峰找尋器、自動(dòng)基線"函數(shù)計(jì)算此百分?jǐn)?shù)。"未處理"表示未轉(zhuǎn)染的細(xì)胞。詳見(jiàn)實(shí)施例15。圖36顯示了測(cè)定耙向重組于K562細(xì)胞中人IL-2Ry基因座的試驗(yàn)所用凝膠放射4小時(shí)后的自顯影圖。"wt"標(biāo)明了診斷為含有天然K562IL-2Ry序列的染色體DNA的條帶;"rflp"標(biāo)明診斷為含有供體DNA分子中存在的改變的IL-2RY序列的染色體DNA的條帶。泳道上方的符號(hào)"+"表示用0.2iiM長(zhǎng)春堿處理該細(xì)胞;符號(hào)"-"表示不用長(zhǎng)春堿處理該細(xì)胞。"ZFP+供體"泳道下面的數(shù)字表示含有最初存在于供體DNA分子中的序列占整個(gè)染色體DNA的百分?jǐn)?shù),其計(jì)算方法如實(shí)施例35所述。詳見(jiàn)實(shí)施例15。圖37顯示了用人IL-2RY基因特異性片段檢測(cè)的DNA印跡放射4小時(shí)后的自顯影圖。圖右邊的箭頭表示對(duì)應(yīng)于通過(guò)同源重組改變其序列的基因組DNA的條帶位置。泳道上方的符號(hào)"+"表示用0.2pM長(zhǎng)春堿處理該細(xì)胞;符號(hào)"-"表示不用長(zhǎng)春堿處理該細(xì)胞。"ZFP+供體"泳道下面的數(shù)字表示含有最初存在于供體DNA分子中的序列占整個(gè)染色體DNA的百分?jǐn)?shù),其計(jì)算方法如實(shí)施例35所述。詳見(jiàn)實(shí)施例15。圖38顯示了測(cè)定耙向重組于CD34+人骨髓細(xì)胞中人IL-2Ry基因座試驗(yàn)所用凝膠的放射自顯影圖。左圖顯示了參比標(biāo)準(zhǔn),其中所示百分?jǐn)?shù)的正常人基因組DNA(含有位點(diǎn))加入在Jurkat細(xì)胞的基因組DNA(缺少位點(diǎn))中,用PCR擴(kuò)增該混合物產(chǎn)生放射性標(biāo)記的擴(kuò)增產(chǎn)物,用M^II消化該擴(kuò)增產(chǎn)物。"wt"標(biāo)示出代表未消化DNA的條帶,"rflp"標(biāo)示出MmII消化產(chǎn)生的條帶。右圖顯示了用含有BwBI位點(diǎn)的供體DNA和編碼鋅指-尸oM融合核酸內(nèi)切酶的質(zhì)粒轉(zhuǎn)染CD34+細(xì)胞的實(shí)驗(yàn)結(jié)果。然后擴(kuò)增并標(biāo)記相關(guān)的基因組區(qū)域,用SwBI消化標(biāo)記的擴(kuò)增產(chǎn)物。"GFP"指用GFP-編碼質(zhì)粒轉(zhuǎn)染的對(duì)照細(xì)胞;"僅供體"表示僅用供體DNA轉(zhuǎn)染的對(duì)照細(xì)胞,"ZFP+供體"表示用供體DNA和編碼鋅指/FoM核酸酶的質(zhì)粒轉(zhuǎn)染的細(xì)胞。"wt"標(biāo)示診斷為含有天然IL-2RY序列的染色體DNA的條帶;"rflp"標(biāo)示診斷為含有供體DNA分子中存在的已改變的IL-2RY序列的染色體DNA的條帶。最右端泳道含有DNA大小標(biāo)記。詳見(jiàn)實(shí)施例16。圖39顯示了用于檢測(cè)用Ku70-耙向siRNA轉(zhuǎn)染的細(xì)胞中Ku70蛋白水平的免疫印跡圖。用兩種濃度的來(lái)自兩種不同siRNA庫(kù)的siRNA分別轉(zhuǎn)染T7細(xì)胞系(實(shí)施例9,圖27)(參見(jiàn)實(shí)施例18)。泳道1:70ngsiRNA庫(kù)D;泳道2:140ngsiRNA庫(kù)D;泳道3:70ngsiRNA庫(kù)E;泳道4:140ngsiRNA庫(kù)E。"Ku70"表示代表Ku70蛋白的條帶;"TFIIB"表示代表TFIIB轉(zhuǎn)錄因子的條帶,用作對(duì)照。圖40顯示了耙向人P-珠蛋白基因的四種鋅指結(jié)構(gòu)域的氨基酸序列sca-29b(SEQIDNO:22);sca-36a(SEQIDNO:23);sca隱36b(SEQIDNO:24)和sca-36c(SEQIDNO:25)。sca-29b結(jié)構(gòu)域的耙位點(diǎn)在一條DNA鏈上,sca-36a、sca-36b和sca-36c結(jié)構(gòu)域的耙位點(diǎn)在另一條鏈上。詳見(jiàn)實(shí)施例20。圖41顯示了檢測(cè)鋅指/FoM融合核酸酶(ZFN)的不同組合的序列-特異性DNA切割的體外試驗(yàn)結(jié)果。標(biāo)為"U"的泳道顯示DNA模板樣品(的結(jié)果)。接下來(lái)的四條泳道顯示了用四種P-珠蛋白-靶向ZFN(這些ZFN的鑒定參見(jiàn)實(shí)施例20)分別培育該DNA模板的結(jié)果。最右邊的三條泳道顯示了用sca-29bZFN和sca-36a、sca-36b或sca-36cZFN(都耙向sca-29b耙向鏈的相對(duì)鏈)中的一種培育模板DNA的結(jié)果。圖42顯示了T18細(xì)胞中的eGFPmRNA水平(柱)與強(qiáng)力霉素濃度(橫坐標(biāo))的函數(shù)關(guān)系。各柱上方的數(shù)字代表用供體DNA和編碼eGFP-靶向鋅指核酸酶的質(zhì)粒轉(zhuǎn)染細(xì)胞中eGFP突變的校正百分?jǐn)?shù),為強(qiáng)力霉素濃度的函數(shù)。圖43A-C顯示了不同融合蛋白構(gòu)型的示意圖。圖43A顯示了兩種融合蛋白,其中鋅指域最接近N-末端,F(xiàn)oM切割半域最接近C-末端,它們結(jié)合于5'端互相接近的相對(duì)鏈上的DNA靶位點(diǎn)。圖43B顯示了兩種融合蛋白,其中尸oM切割半域最接近N-末端,鋅指域最接近C-末端,它們結(jié)合于3'端互相接近的相對(duì)鏈上的DNA靶位點(diǎn)。圖43C顯示了第一種蛋白和第二種蛋白,第一種蛋白中FoW切割半域最接近N-末端且鋅指域最接近C-末端,第二種蛋白中鋅指域最接近N-末端且尸oW切割半域最接近C-末端,它們結(jié)合于同一鏈上的DNA靶位點(diǎn),其中第一種蛋白的靶位點(diǎn)位于第二種蛋白結(jié)合位點(diǎn)的上游(即5'側(cè))。在所有例子中,三指蛋白顯示結(jié)合于9個(gè)核苷酸的靶位點(diǎn)。顯示了該DNA鏈的5'和3'極性,標(biāo)出了該融合蛋白的N末端。圖44是檢測(cè)鋅指核酸內(nèi)切酶對(duì)模式底物切割的丙烯酰胺凝膠的放射自顯影圖。泳道1顯示了微切割底物的遷移。泳道2顯示了用IL2-1R鋅指/尸oM融合蛋白培育后的底物。泳道3顯示了用5-9DR鋅指/F^:I融合蛋白培育后的底物。泳道4顯示了用這兩種蛋白培育后的底物。底物及其切割產(chǎn)物的大概大小(以堿基對(duì)計(jì))顯示在此圖右側(cè)。此圖下面,顯示了含有5-9D和IL2-l鋅指結(jié)合域的結(jié)合位點(diǎn)的底物部分核苷酸序列(SEQIDNO:211)。用下劃線標(biāo)出和指出了此結(jié)合位點(diǎn)。圖45是檢測(cè)鋅指核酸內(nèi)切酶對(duì)模式底物切割的丙烯酰胺凝膠的放射自顯影圖。泳道1顯示了微切割底物的遷移。泳道2顯示了用IL2-1C鋅指/FoH融合蛋白培育后的底物。泳道3顯示了用IL2-lR鋅指/FoM融合蛋白培育后的底物。泳道4顯示了用5-9DR鋅指/FoW融合蛋白培育后的底物。泳道5顯示了用IL2-1R和5-9DR融合蛋白培育后的底物。泳道6顯示了用IL2-1C和5-9DR蛋白培育后的底物。底物及其切割產(chǎn)物的大概大小(以堿基對(duì)計(jì))顯示在此圖右側(cè)。此圖下面,顯示了含有5-9D和IL2-l鋅指結(jié)合域的結(jié)合位點(diǎn)的底物部分核苷酸序列(SEQIDNO:212)。用下劃線標(biāo)出和指出了此結(jié)合位點(diǎn)。圖46是含有突變eGFP編碼序列的質(zhì)粒的示意圖,此序列中插入了IL-2Ry基因外顯子5的序列。詳見(jiàn)實(shí)施例29。圖47顯示了用限制性酶&wI培育經(jīng)轉(zhuǎn)染K562細(xì)胞的DNA擴(kuò)增產(chǎn)物的凝膠的放射自顯影圖。泳道上方的標(biāo)題表示用GFP-編碼質(zhì)粒轉(zhuǎn)染的細(xì)胞的DNA(GFP);用編碼5-8G和5-9DZFP/FoM融合蛋白的載體轉(zhuǎn)染的細(xì)胞的DNA(ZFN);用含有12-核苷酸對(duì)外源序列(含有^wl識(shí)別位點(diǎn))的質(zhì)粒轉(zhuǎn)染的細(xì)胞的DNA,該外源序列兩側(cè)側(cè)接于與il-2Ry基因外顯子5同源的序列的750個(gè)核苷酸對(duì),其中在野生型il-2ry基因中兩個(gè)外顯子5-同源序列相鄰(供體);和用編碼5-8G和5-9DZFP/尸oM融合蛋白的載體和含有12-核苷酸對(duì)外源序列(含有識(shí)別位點(diǎn))的質(zhì)粒轉(zhuǎn)染的細(xì)胞的dna,所述外源序列兩側(cè)側(cè)接于與IL-2Ry基因外顯子5同源的序列的750個(gè)核苷酸對(duì),其中在野生型IL-2Ry基因中兩個(gè)外顯子5-同源序列相鄰(ZFN+供體)。顯示了含有野生型IL-2R序列的染色體("WT")和其中整合入外源序列的染色體("+補(bǔ)丁")產(chǎn)生的條帶。最右端的泳道含有分子量標(biāo)記物。還參見(jiàn)實(shí)施例33。圖48顯示了分析經(jīng)轉(zhuǎn)染K562細(xì)胞的DNA的擴(kuò)增產(chǎn)物的凝膠圖。泳道上方的標(biāo)題表示用編碼5-8G和5-9DZFP/Fokl融合蛋白的載體轉(zhuǎn)染的細(xì)胞的DNA(ZFN);用含有編碼eGFP的720個(gè)核苷酸對(duì)的開(kāi)放閱讀框的質(zhì)粒轉(zhuǎn)染的細(xì)胞的DNA(供體1);用包含含有eGFP開(kāi)放閱讀框和下游聚腺苷酸化信號(hào)的924個(gè)核苷酸對(duì)序列的質(zhì)粒轉(zhuǎn)染的細(xì)胞的DNA(供體2);用編碼5-8G和5-9DZFP/Fokl融合蛋白的載體和含有編碼eGFP的720個(gè)核苷酸對(duì)開(kāi)放閱讀框的質(zhì)粒轉(zhuǎn)染的細(xì)胞的DNA(ZFN+供體1),和用編碼5-8G和5-9DZFP/Fil融合蛋白的載體和包含含有eGFP開(kāi)放閱讀框和下游聚腺苷酸化信號(hào)的924個(gè)核苷酸對(duì)序列的質(zhì)粒轉(zhuǎn)染的細(xì)胞的DNA(ZFN+供體2)。上圖中最左邊和最右邊的泳道含有分子量標(biāo)記物。上圖是溴乙錠-染色凝膠的照片;下圖顯示了分析標(biāo)記的擴(kuò)增產(chǎn)物不同實(shí)驗(yàn)的凝膠放射自顯影圖。還參見(jiàn)實(shí)施例34。圖49是描述將"治療性半基因"引入內(nèi)源性人IL-2RY基因的實(shí)驗(yàn)的示意圖。上面一條線代表染色體IL-2Ry序列,中間一條線代表供體序列,加框表示外顯子,水平線表示內(nèi)含子??騼?nèi)的數(shù)字標(biāo)示IL-2RY基因的外顯子,"5"代表染色體IL-2R基因的第五外顯子,"5u"代表第五外顯子的上游部分,"5d"代表第五外顯子的下游部分,"5d(m)"代表含有幾處沉默序列改變(即不改變編碼氨基酸序列的改變)的第五外顯子下游部分。對(duì)角線劃分出供體與染色體序列之間同源性區(qū)域的界限。下面一條線顯示了同源重組的預(yù)計(jì)產(chǎn)物,其中將外顯子5d(m)、6、7和8插入染色體基因第五外顯子內(nèi)。還參見(jiàn)實(shí)施例35。圖50顯示了分析經(jīng)轉(zhuǎn)染K562細(xì)胞的DNA擴(kuò)增產(chǎn)物的凝膠放射自顯影圖。泳道上方的標(biāo)題表示用編碼綠色熒光蛋白的載體轉(zhuǎn)染的對(duì)照細(xì)胞的DNA("GFP")和用編碼5-8G和5-9DZFP/FoM融合蛋白的載體和含有720-核苷酸cDNA構(gòu)建物的質(zhì)粒轉(zhuǎn)染的實(shí)驗(yàn)細(xì)胞的DNA,所述構(gòu)建物含有IL-2RY基因的外顯子5和外顯子6、7和8部分,兩側(cè)側(cè)接于與IL-2Ry基因外顯子5和周?chē)鷧^(qū)域同源的750個(gè)核苷酸對(duì)序列,其中在野生型IL-2RY基因中這兩個(gè)外顯子5-同源序列相鄰(ZFN+供體)。標(biāo)出了含有野生型IL-2R序列的染色體("WT,,)和其中整合入外源序列的染色體("+ORF")產(chǎn)生的條帶。還參見(jiàn)實(shí)施例35。圖51顯示了將7.7kbp抗體表達(dá)構(gòu)建物插入內(nèi)源性染色體IL-2Ry基因的實(shí)驗(yàn)設(shè)計(jì)和結(jié)果。該圖上部是顯示將7.7千堿基對(duì)表達(dá)構(gòu)建物(陰影)同源依賴性靶向整合到內(nèi)源性染色體IL-2Ry基因外顯子5中的結(jié)果示意圖。箭頭表示檢測(cè)由靶向整合導(dǎo)致外源性與內(nèi)源性序列之間連接所用擴(kuò)增引物的位置和極性。該圖下部顯示了分析擴(kuò)增產(chǎn)物的溴乙錠染色凝膠照片。左圖顯示了用檢測(cè)上游連接的引物(引物組A)擴(kuò)增細(xì)胞DNA的產(chǎn)物,右圖顯示了用檢測(cè)下游連接的引物(引物組B)擴(kuò)增細(xì)胞DNA的產(chǎn)物。在凝膠下方標(biāo)示出用作擴(kuò)增模板的DNA樣品如下用編碼綠色熒光蛋白的載體轉(zhuǎn)染的細(xì)胞的DNA(GFP);僅用含有7.7kbp表達(dá)構(gòu)建物的供體DNA分子轉(zhuǎn)染的細(xì)胞的DNA(供體);用編碼5-8G和5-9DZFP/FoM融合蛋白的載體和供體DNA分子轉(zhuǎn)染的細(xì)胞的DNA(ZFN+供體)。也標(biāo)出了供體DNA的拓?fù)浣Y(jié)構(gòu)(環(huán)狀或線狀)。還參見(jiàn)實(shí)施例36。圖52是用Cel-l試驗(yàn)分析CHODHFR基因錯(cuò)配擴(kuò)增產(chǎn)物的凝膠放射自顯影圖。由野生型CHO細(xì)胞DNA(W)或用鋅指核酸酶處理的CHO細(xì)胞的DNA(Mu)獲得擴(kuò)增產(chǎn)物,使之接觸Cd-l核酸酶(+)或不接觸該酶(-),如凝膠上的標(biāo)注。在凝膠右側(cè),標(biāo)注了代表野生型DHFR序列(WT)和含有157-核苷酸插入的突變型DHFR序列(突變體)的條帶。詳見(jiàn)實(shí)施例37。圖53顯示了CHO二氫葉酸還原酶(DHFR)基因的一部分核苷酸序列(上面一行)和通過(guò)同源依賴性靶向整合外源序列產(chǎn)生的突變DHFR基因的一部分核苷酸序列(下面一行)。加框標(biāo)示出表28所述的鋅指核酸酶的靶序列;用下劃線表示與野生型序列的不同改變。還參見(jiàn)實(shí)施例37。圖54顯示了野生型FMI切割半域和二聚化界面的氨基酸序列中發(fā)生改變的幾種突變型切割半域的氨基酸序列。用下劃線標(biāo)示出序列改變的位置(氨基酸486、490和538)。發(fā)明詳述本發(fā)明公開(kāi)了用于靶向切割細(xì)胞染色質(zhì)和靶向改變細(xì)胞核苷酸序列的組合物和方法,例如,靶向切割后的非同源性末端連接(它們之間插入或未插入外源序列),或者靶向切割后在外源性多核苷酸(含有與細(xì)胞核苷酸序列同源的一個(gè)或多個(gè)區(qū)域)與基因組序列之間的同源重組。基因組序列包括染色體、附加體、細(xì)胞器基因組(如線粒體、葉綠體)、人工染色體中存在的序列和細(xì)胞中存在的任何其它類型的核酸,例如,擴(kuò)增序列、雙微染色體以及內(nèi)源性或感染的細(xì)菌和病毒的基因組。基因組序列可以是正常序列(即野生型)或突變序列;突變序列可包含(例如)插入、缺失、易位、重排和/或點(diǎn)突變?;蚪M序列也可包含多種不同等位基因中的一種。用于耙向切割和重組的組合物包括含有切割域(或切割半域)和鋅指結(jié)合域的融合蛋白、編碼這些蛋白的多核苷酸以及多肽和編碼多肽的多核苷酸的組合。鋅指結(jié)合域可包含一個(gè)或多個(gè)鋅指(如2、3、4、5、6、7、8、9或更多個(gè)鋅指),經(jīng)工程改造,可結(jié)合于任何基因組序列。因此,鑒定需要進(jìn)行切割或重組的感興趣的靶基因組區(qū)域,可按照本文公開(kāi)方法構(gòu)建含有切割域(或切割半域)和經(jīng)工程改造能識(shí)別所述基因組區(qū)域中的耙序列的鋅指域的一種或多種融合蛋白。細(xì)胞中存在這類融合蛋白(或蛋白質(zhì))將導(dǎo)致該融合蛋白結(jié)合于其結(jié)合位點(diǎn),并在所述基因組區(qū)域內(nèi)或其附近切割。而且,如果此種細(xì)胞中還存在與該基因組區(qū)域同源的外源性多核苷酸,還可在該基因組區(qū)域與該外源性多核苷酸之間發(fā)生高頻率的同源重組。概述除非另有說(shuō)明、本發(fā)明方法的實(shí)施以及本文所述組合物的制備和應(yīng)用均采用分子生物學(xué)、生物化學(xué)、染色質(zhì)結(jié)構(gòu)和分析、計(jì)算化學(xué)、細(xì)胞培養(yǎng)、重組DNA和相關(guān)領(lǐng)域技術(shù)人員已知的常規(guī)技術(shù)。文獻(xiàn)中全面解釋了這些技術(shù)。參見(jiàn)例如,Sambrook等,MOLECULARCLONING:ALABORATORYMANUAL(分子克隆實(shí)驗(yàn)室手冊(cè)),第二版,冷泉港實(shí)驗(yàn)室出版社(ColdSpringHarborLaboratoryPress),1989和第三版,2001;Ausubel等,CURRENTPROTOCOLSINMOLECULARBIOLOGY(新編分子生物學(xué)實(shí)驗(yàn)指南),約翰韋利出版社(JohnWiley&Sons),紐約,1987和定期更新;METHODSINENZYMOLOGY(酶學(xué)方法)叢書(shū),學(xué)術(shù)出版社(AcademicPress),圣地亞哥;Wolffe,CHROMATINSTRUCTUREANDFUNCTION(染色質(zhì)結(jié)構(gòu)和功能),第三版,學(xué)術(shù)出版社,圣地亞哥,1998;METHODSINENZYMOLOGY(酶學(xué)方法),第304巻,"Chromatin(染色質(zhì))"(P.M.Wassarman和A.P.Wolffe編),學(xué)術(shù)出版社,圣地亞哥,1999;和METHODSINMOLECULARBIOLOGY(分子生物學(xué)方法),第119巻,"ChromatinProtocols(染色質(zhì)方法)"(P.B.Becker編)HumanaPress(休曼出版社),多多瓦(Totowa),1999。定義術(shù)語(yǔ)"核酸"、"多核苷酸"和"寡核苷酸"可互換使用,指線狀或環(huán)狀構(gòu)象的單鏈或雙鏈脫氧核糖核苷酸或核糖核苷酸聚合物,出于本公開(kāi)的目的,并不認(rèn)為這些術(shù)語(yǔ)所指聚合物的長(zhǎng)度有限制。該術(shù)語(yǔ)可包括天然核苷酸的已知同類物及堿基、糖和/或磷酸部分(如硫代磷酸酯主鏈)被修飾的核苷酸。通常,具體核苷酸的同類物具有相同的堿基配對(duì)特異性,即A的同類物與T堿基配對(duì)。術(shù)語(yǔ)"多肽"、"肽"和"蛋白質(zhì)"可互換使用,指氨基酸殘基的聚合物。此術(shù)語(yǔ)也應(yīng)用于其中一個(gè)或多個(gè)氨基酸是相應(yīng)天然氨基酸的化學(xué)同類物或修飾衍生物的氨基酸聚合物。"結(jié)合"指大分子(如蛋白質(zhì)和核酸)之間的序列特異性非共價(jià)相互作用。結(jié)合作用的所有組分不一定都需要是序列特異性(如與DNA主鏈中的磷酸殘基接觸)的,只要相互作用整體上是序列特異性的。這種相互作用的一般特征是解離常數(shù)(Kd)為l(T6M—'或更低。"親和力"指結(jié)合強(qiáng)度高結(jié)合親和力與較低Kd相關(guān)聯(lián)。"結(jié)合蛋白"是能夠非共價(jià)結(jié)合于另一分子的蛋白質(zhì)。結(jié)合蛋白可以結(jié)合(例如)DNA分子(DNA結(jié)合蛋白)、RNA分子(RNA結(jié)合蛋白)和/或蛋白質(zhì)分子(蛋白質(zhì)結(jié)合蛋白)。在蛋白質(zhì)結(jié)合蛋白的情況下,蛋白質(zhì)可自身結(jié)合(形成同源二聚體、同源三聚體等)和/或可結(jié)合不同蛋白質(zhì)的一種或多種分子。結(jié)合蛋白可具有一種以上類型的結(jié)合活性。例如鋅指蛋白具有DNA結(jié)合、RNA結(jié)合和蛋白質(zhì)結(jié)合活性。"鋅指DNA結(jié)合蛋白"(或結(jié)合域)是以序列特異性方式通過(guò)一個(gè)或多個(gè)鋅指結(jié)合DNA的蛋白質(zhì)或較大蛋白的結(jié)構(gòu)域,鋅指是通過(guò)鋅離子配位穩(wěn)定結(jié)構(gòu)的結(jié)合結(jié)構(gòu)域中的氨基酸序列區(qū)域。術(shù)語(yǔ)鋅指DNA結(jié)合蛋白常常簡(jiǎn)稱為鋅指蛋白或ZFP。鋅指結(jié)合域可經(jīng)"工程改造"而結(jié)合預(yù)定的核苷酸序列。工程改造鋅指蛋白的方法的非限制性例子是設(shè)計(jì)和選擇。設(shè)計(jì)的鋅指蛋白是天然不存在的蛋白質(zhì),其設(shè)計(jì)/組成主要來(lái)自合理標(biāo)準(zhǔn)。設(shè)計(jì)的合理標(biāo)準(zhǔn)包括應(yīng)用取代規(guī)則和計(jì)算機(jī)算法,加工儲(chǔ)存現(xiàn)有ZFP設(shè)計(jì)和結(jié)合數(shù)據(jù)信息數(shù)據(jù)庫(kù)中的信息。參見(jiàn)例如美國(guó)專利6,140,081;6,453,242和6,534,261;也參見(jiàn)WO98/53058;WO98/53059;WO98/53060;WO02/016536和WO03/016496。"選擇的"鋅指蛋白是天然未發(fā)現(xiàn)的蛋白質(zhì),其產(chǎn)生主要來(lái)自經(jīng)驗(yàn)過(guò)程,如噬菌體呈現(xiàn)、相互作用阱或雜交選擇。參見(jiàn)例如US5,789,538;US5,925,523;US6,007,988;US6,013,453;US6,200,759;W095/19431;WO96/06166;WO98/53057;和W098/54311;WO00/27878;WO01/60970;WOO1/88197和WO02/099084。術(shù)語(yǔ)"序列"指任何長(zhǎng)度的核苷酸序列,可以是DNA或RNA;可以是線狀、環(huán)狀或分支狀,可以是單鏈或雙鏈。術(shù)語(yǔ)"供體序列"指要插入基因組中的核苷酸序列。供體序列可以是任何長(zhǎng)度,例如長(zhǎng)2-10,000個(gè)核苷酸(或者它們之間或之上的任何整數(shù)值),優(yōu)選長(zhǎng)約100-1,000個(gè)核苷酸(或者它們之間的任何整數(shù)),更優(yōu)選長(zhǎng)約200-500個(gè)核苷酸。"同源但不相同的序列"指第一種序列與第二種序列有一定程度的序列相同性,但其序列與第二種序列不完全相同。例如,含有突變基因的野生型序列的多核苷酸與該突變基因同源但不相同。在某些實(shí)施方式中,這兩種序列之間的同源性程度足以使它們之間利用正常細(xì)胞機(jī)制發(fā)生同源重組。兩種同源但不相同的序列可以是任何長(zhǎng)度,它們的非同源程度可以小到一個(gè)核苷酸(如通過(guò)靶向同源重組校正基因組的點(diǎn)突變)或者可大到一萬(wàn)或更多個(gè)堿基(如在染色體的預(yù)定異位位點(diǎn)上插入一個(gè)基因)。含有同源但不相同序列的兩種多核苷酸不一定等長(zhǎng)。例如,可采用20-10,000個(gè)核苷酸或核苷酸對(duì)的外源性多核苷酸(即供體多核苷酸)。測(cè)定核酸和氨基酸序列相同性的技術(shù)是本領(lǐng)域熟知的。此類技術(shù)一般包括測(cè)定一個(gè)基因mRNA的核苷酸序列和/或測(cè)定其編碼的氨基酸序列,并將這些序列與另一核苷酸或氨基酸序列作比較。利用此法也可測(cè)定和比較基因組序列。通常,相同性分別指兩個(gè)多核苷酸或多肽序列中的核苷酸-核苷酸或氨基酸-氨基酸精確對(duì)應(yīng)。通過(guò)檢測(cè)序列相同性百分?jǐn)?shù)可比較兩個(gè)或多個(gè)(多核苷酸或氨基酸)序列。將兩個(gè)比對(duì)序列之間精確匹配的核酸或氨基酸數(shù)目除以較短序列長(zhǎng)度乘以100得到兩個(gè)序列的相同性百分?jǐn)?shù)。Smith禾口Waterman,AdvancesinAppliedMathematics(應(yīng)用數(shù)學(xué)進(jìn)展)2:482-489(1981)的局部同源性算法提供了核酸序列的近似比對(duì)。利用Dayhoff,AtlasofProteinSequencesandStructure(蛋白質(zhì)序列和結(jié)構(gòu)圖表),M.O,Dayhoff編,5增干U,3:353-358,國(guó)家生物醫(yī)學(xué)研究基金會(huì)(NationalBiomedicalResearchFoundation),美國(guó)華盛頓特區(qū)開(kāi)發(fā)和Gribskov,Nucl.AcidsRes.14(6):6745-6763(1986)標(biāo)準(zhǔn)化的評(píng)分矩陣可將此算法應(yīng)用于氨基酸序列。遺傳學(xué)計(jì)算機(jī)研究組(威斯康星州麥迪遜)在"最佳擬合(BestFit),,實(shí)際應(yīng)用中示范了該算法的執(zhí)行,測(cè)定序列相同性百分?jǐn)?shù)。威斯康星(Wisconsin)序列分析軟件包程序手冊(cè)第8版(1995)(可獲自威斯康星州麥迪遜遺傳學(xué)計(jì)算機(jī)研究組)描述了該方法的默認(rèn)參數(shù)。本公開(kāi)內(nèi)容中確定相同性百分?jǐn)?shù)的優(yōu)選方法是采用愛(ài)丁堡大學(xué)版權(quán)所有的、JohnF.Collins和ShaneS.Sturrok開(kāi)發(fā)的、加州芒廷維尤的因特遺傳學(xué)公司(IntelliGenetics,Inc.)發(fā)行的MPSRCH程序包??墒褂迷撥浖氖访芩?沃特曼(Smith-Waterman)算法,其中的默認(rèn)參數(shù)用于評(píng)分表(例如缺口開(kāi)放罰12分、缺口延伸罰1分和一個(gè)缺口6分)。所生成數(shù)據(jù)中"匹配(Match)"值反應(yīng)了序列相同性。本領(lǐng)域技術(shù)人員熟知計(jì)算序列間相同性或相似性百分?jǐn)?shù)的其它合適程序,例如另一比對(duì)程序是BLAST(使用默認(rèn)參數(shù))。例如可采用以下默認(rèn)參數(shù)的BLASTN和BLASTP算法遺傳密碼=標(biāo)準(zhǔn);過(guò)濾=無(wú);鏈=雙鏈;截止值=60;期望值=10;矩陣BLOSUM62;說(shuō)明=50個(gè)序列;分選二HIGHSCORE;數(shù)據(jù)庫(kù)=非冗余,GenBank+EMBL+DDBJ+PDB+GenBankCDS翻譯+瑞士蛋白(Swissprotein)+Spupdate+PIR。可以在互聯(lián)網(wǎng)上找到這些程序的詳述。至于本文所述序列,序列相同性程度的所需范圍約為80%到100%和二者之間的任何整數(shù)值。序列之間相同性百分?jǐn)?shù)一般至少為70-75%,優(yōu)選80-82%,更優(yōu)選85-90%,更優(yōu)選92%,更優(yōu)選95%,最優(yōu)選98%序列相同?;蛘?,可用多核苷酸雜交方法測(cè)定多核苷酸間的序列相似性程度,雜交條件應(yīng)能使同源區(qū)間形成穩(wěn)定的雙鏈體,用單鏈特異性核酸酶消化,隨后測(cè)定消化片段的大小。當(dāng)利用上述方法測(cè)定兩個(gè)核酸或兩個(gè)多肽序列確定分子長(zhǎng)度的序列相同性顯示至少約為70%-75%,優(yōu)選80%-82%,更優(yōu)選85%-90%,更優(yōu)選92%,更優(yōu)選95%,最優(yōu)選98%時(shí),則認(rèn)為它們基本同源。如本文所用,基本同源也指特定DNA或多肽序列完全相同的序列。在例如該具體系統(tǒng)規(guī)定的嚴(yán)謹(jǐn)條件下的Southern雜交試驗(yàn)鑒定基本同源的DNA序列。本領(lǐng)域技術(shù)人員能夠確定合適的雜交條件。參見(jiàn)例如Sambrook等,同上;NucleicAcidHybridization:APracticalApproach(核酸雜交實(shí)用方法),B.D.Hames和S.J.Higgins編,(1985)Oxford;華盛頓特區(qū);IRL出版社)。可用下述方法測(cè)定兩個(gè)核酸片段的選擇性雜交。兩個(gè)核酸分子間的序列相同性程度影響二分子間的雜交效率和強(qiáng)度。部分相同的核酸序列至少能部分抑制與靶分子完全相同序列的雜交??衫孟铝斜绢I(lǐng)域內(nèi)熟悉的雜交試驗(yàn)測(cè)定完全相同序列的雜交抑制(如Southern(DNA)印跡,Northern(RNA)印跡,溶液雜交等,參見(jiàn)Sambrook等,MolecularCloning:ALaboratoryManual(分子克隆實(shí)驗(yàn)室手冊(cè)),第二版,(1989),紐約冷泉港)。此類實(shí)驗(yàn)可在不同程度選擇性下進(jìn)行,如利用從低到高的不同嚴(yán)謹(jǐn)性。若使用低嚴(yán)謹(jǐn)條件,可利用缺少甚至部分序列相同性的第二探針(例如與靶分子序列相同性少于30%的探針)評(píng)價(jià)不存在非特異結(jié)合,當(dāng)缺少非特異性結(jié)合時(shí),第二探針不會(huì)與耙分子雜交。當(dāng)利用基于雜交的檢測(cè)系統(tǒng)時(shí),應(yīng)選擇與參比核酸序列互補(bǔ)的探針核酸,然后選擇合適條件使探針與參比序列選擇性雜交或互相結(jié)合形成雙鏈體分子。能在中等嚴(yán)謹(jǐn)條件下與參比序列選擇性雜交的核酸分子一般能夠在以下條件下雜交,該條件能夠檢測(cè)至少長(zhǎng)10-14個(gè)核苷酸且至少約70%序列與所選核酸探針序列相同的靶核酸序列。嚴(yán)謹(jǐn)雜交條件一般能檢測(cè)與所選核酸探針序列的序列相同性大于約90-95%的至少長(zhǎng)約10-14個(gè)核苷酸的靶核酸序列。探針和參比序列具有特定程度的序列相同性時(shí),用于探針/參比序列雜交的條件可按本領(lǐng)域所知技術(shù)確定(參見(jiàn)例如《核酸雜交實(shí)用方法》(NucleicAcidHybridization:APracticalApproach),B,D.Hames禾口S丄Higgins編,(1985)Oxford;華盛頓特區(qū);IRL出版社)。雜交條件為本領(lǐng)域?qū)I(yè)人員熟知。雜交嚴(yán)謹(jǐn)性指雜交條件不利于包含錯(cuò)配核苷酸的雜交體形成的程度,較高的嚴(yán)謹(jǐn)性與對(duì)錯(cuò)配雜交體的較低容忍度相關(guān)。影響雜交嚴(yán)謹(jǐn)性的因素為本領(lǐng)域?qū)I(yè)人員熟知,包括但不限于溫度、pH、離子強(qiáng)度和有機(jī)溶劑例如甲酰胺和二甲基亞砜的濃度。如本領(lǐng)域技術(shù)人員所知,較高的溫度、較低的離子強(qiáng)度和較低的溶劑濃度可提高雜交的嚴(yán)謹(jǐn)性。至于雜交的嚴(yán)謹(jǐn)性條件,本領(lǐng)域熟知可采用許多等效條件通過(guò)改變(例如)以下因素來(lái)建立特定的嚴(yán)謹(jǐn)性序列的長(zhǎng)度和特性、各種序列的堿基組成、雜交溶液的鹽濃度和其它組分濃度、雜交溶液中存在或不存在阻斷劑(如硫酸右旋糖苷和聚乙二醇)、雜交反應(yīng)溫度和時(shí)間參數(shù)、以及不同的洗滌條件。按照本領(lǐng)域標(biāo)準(zhǔn)方法(參見(jiàn)例如Sambrook,等,MolecularCloning:ALaboratoryManual(分子克隆實(shí)驗(yàn)室手冊(cè)),第二版,(1989),紐約冷泉港)來(lái)選擇具體設(shè)定雜交條件。"重組"指兩條多核苷酸之間交換遺傳信息的過(guò)程。出于本發(fā)明目的,"同源重組(HR)"指在(例如)修復(fù)細(xì)胞內(nèi)雙鏈斷裂的過(guò)程中所發(fā)生的這種交換的特殊形式。這一過(guò)程需要核苷酸序列同源,采用"供體"分子為模板來(lái)修復(fù)"靶"分子(即發(fā)生雙鏈斷裂的分子),稱為"無(wú)交換基因的轉(zhuǎn)化"或"短段基因轉(zhuǎn)化",因?yàn)樗鼘?dǎo)致遺傳信息由供體轉(zhuǎn)移到耙序列上。如果不希望受限于任何特定理論,這類轉(zhuǎn)移可包括斷裂校正耙位點(diǎn)和供體之間形成的異源雙鏈體DNA的錯(cuò)配,和/或"合成依賴性鏈退火",其中用供體再次合成遺傳信息(該信息將變成靶位點(diǎn)的一部分)和/或相關(guān)過(guò)程。這些特殊HR常常導(dǎo)致靶分子序列改變,以使供體多核苷酸序列的一部分或全部摻入耙多核苷酸中。"切割"指使DNA分子的共價(jià)主鏈斷裂??赏ㄟ^(guò)各種方法啟動(dòng)切割,這些方法包括但不限于磷酸二酯鍵的酶促或化學(xué)水解。有可能進(jìn)行單鏈切割和雙鏈切割,兩單鏈的各自切割可導(dǎo)致雙鏈切割。DNA切割可產(chǎn)生鈍端或交錯(cuò)端。在某些實(shí)施方式中,采用融合多肽來(lái)靶向切割雙鏈DNA。"切割域"包含具有DNA切割催化活性的一種或多種多肽序列。切割域可包含在一條多肽鏈中,或者切割活性可由兩種(或多種)多肽聯(lián)合產(chǎn)生。"切割半域"是與第二種多肽(相同或不同)一起形成具有切割活性(優(yōu)選雙鏈切割活性)的復(fù)合物的多肽序列。"染色質(zhì)"是包含細(xì)胞基因組的核蛋白結(jié)構(gòu)。細(xì)胞染色質(zhì)包含核酸(主要是DNA)和蛋白質(zhì),蛋白質(zhì)包括組蛋白和非組蛋白染色體蛋白。大多數(shù)真核細(xì)胞的染色質(zhì)以核小體的形式存在,其中核小體核心包含約150個(gè)堿基對(duì)的DNA,與包含組蛋白H2A、H2B、H3和H4各一對(duì)的八聚物相連;接頭DNA(各生物體的長(zhǎng)度可不同)位于核小體核心之間。組蛋白H1分子通常與接頭DNA相連。出于本發(fā)明目的,術(shù)語(yǔ)"染色質(zhì)"旨在包括所有類型細(xì)胞,包括原核和真核細(xì)胞的核蛋白。細(xì)胞染色質(zhì)包括染色體和附加體染色質(zhì)。"染色體"是包含全部細(xì)胞基因組或其一部分的染色質(zhì)復(fù)合物。細(xì)胞基因組的特征常常是其核型,它是包含該細(xì)胞基因組的所有染色體的集合。細(xì)胞基因組可包括一條或多條染色體。"附加體"是可復(fù)制性核酸、核蛋白復(fù)合物或其它結(jié)構(gòu),其包含的核酸不是細(xì)胞染色體核型一部分。附加體的例子包括質(zhì)粒和某些病毒基因組。"可及區(qū)"是位于核酸中存在的耙位點(diǎn)可被識(shí)別該靶位點(diǎn)的外源性分子結(jié)合的細(xì)胞染色質(zhì)中的位點(diǎn)。如果不希望受限于任何具體理論,應(yīng)相信可及區(qū)是核小體結(jié)構(gòu)中沒(méi)包括的區(qū)域。通??赏ㄟ^(guò)對(duì)化學(xué)探針和酶探針如核酶的敏感性檢測(cè)可及區(qū)的獨(dú)特結(jié)構(gòu)。"靶位點(diǎn)"或"靶序列"是某種核酸序列,定義為只要存在足以結(jié)合的條件,結(jié)合分子(如結(jié)合蛋白)能結(jié)合的核酸部分。例如序列5'-GAATTC-3'是EcoRI限制性核酸內(nèi)切酶的耙位點(diǎn)。"外源性"分子是正常不存在于細(xì)胞中、但可用一種或多種遺傳、生化或其它方法引入細(xì)胞中的分子。根據(jù)細(xì)胞的具體發(fā)育階段和環(huán)境條件確定"正常存在于細(xì)胞中"。因此,例如僅在胚胎發(fā)育期間的肌肉中存在的分子對(duì)成人肌肉細(xì)胞而言是外源性分子。相似地,熱激誘生的分子對(duì)非熱激細(xì)胞而言是外源性分子。外源性分子可包括(例如)功能失常內(nèi)源性分子的有功能類型或功能正常的內(nèi)源性分子的功能失常類型。外源性分子可以是小分子或大分子,小分子例如是組合化學(xué)方法產(chǎn)生的分子,大分子例如有蛋白質(zhì)、核酸、糖、脂質(zhì)、糖蛋白、脂蛋白、多糖、上述分子的修飾衍生物,或包含一種或多種上述分子的復(fù)合物。核酸包括DNA和RNA,可以是單鏈或雙鏈;可以是直鏈、支鏈或環(huán)形;可以是任何長(zhǎng)度。核酸包括能夠形成雙鏈體的核酸,以及形成三鏈體的核酸。參見(jiàn)例如美國(guó)專利號(hào)5,176,996和5,422,251。蛋白質(zhì)包括但不限于DNA結(jié)合蛋白、轉(zhuǎn)錄因子、染色質(zhì)重塑因子、甲基化DNA結(jié)合蛋白、聚合酶、甲基化酶、去甲基化酶、乙?;D(zhuǎn)移酶、脫乙酰酶、激酶、磷酸酶、整合酶、重組酶、連接酶、拓?fù)洚悩?gòu)酶、促旋酶和解旋酶。外源性分子可以是與內(nèi)源性分子類型相同的分子,如外源性蛋白質(zhì)或核酸。例如,外源性核酸包括感染性病毒基因組、引入細(xì)胞的質(zhì)?;蚋郊芋w或正常不存在于細(xì)胞中的染色體。將外源性分子引入細(xì)胞的方法是本領(lǐng)域技術(shù)人員已知的,包括但不限于脂質(zhì)介導(dǎo)的轉(zhuǎn)移(S卩脂質(zhì)體,包括中性和陽(yáng)離子脂質(zhì))、電穿孔、直接注射、細(xì)胞融合、粒子轟擊、磷酸鈣共沉淀、DEAE-右旋糖苷介導(dǎo)的轉(zhuǎn)移和病毒載體介導(dǎo)的轉(zhuǎn)移。相反,"內(nèi)源性"分子是在具體環(huán)境條件下、具體發(fā)育階段的具體細(xì)胞中正常存在的分子。例如,內(nèi)源性核酸包括染色體,線粒體、葉綠體或其它細(xì)胞器的基因組,或天然產(chǎn)生的附加體核酸。其它內(nèi)源性分子包括蛋白質(zhì),例如轉(zhuǎn)錄因子和酶。"融合"分子是兩個(gè)或多個(gè)亞基分子連接,優(yōu)選共價(jià)連接的分子。亞基分子可以是相同化學(xué)類型的分子,或者可以是不同化學(xué)類型的分子。第一種類型的融合分子的例子包括但不限于融合蛋白(例如ZFPDNA結(jié)合域和切割域之間的融合物)和融合核酸(例如編碼上述融合蛋白的核酸)。第二種類型的融合分子的例子包括但不限于形成三鏈體的核酸和多肽之間的融合物以及小溝結(jié)合物和核酸之間的融合物。可將融合蛋白遞送到細(xì)胞中或?qū)⒕幋a融合蛋白的多核苷酸遞送到細(xì)胞中使融合蛋白在細(xì)胞中表達(dá),在細(xì)胞中多核苷酸被轉(zhuǎn)錄,轉(zhuǎn)錄物被翻譯,以產(chǎn)生融合蛋白。在細(xì)胞中表達(dá)蛋白質(zhì)也可包括反式剪接、多肽切割和多肽連接。本公開(kāi)其它地方列出將多核苷酸和多肽遞送到細(xì)胞中的方法。出于本公開(kāi)目的,"基因"包括編碼基因產(chǎn)物的DNA區(qū)域(見(jiàn)下),以及調(diào)節(jié)基因產(chǎn)物產(chǎn)生的所有DNA區(qū)域,不管此種調(diào)節(jié)序列是否毗連編碼和/或轉(zhuǎn)錄序列。因此,基因包括但不限于啟動(dòng)子序列、終止子、翻譯調(diào)節(jié)序列如核糖體結(jié)合位點(diǎn)和內(nèi)部核糖體進(jìn)入位點(diǎn)、增強(qiáng)子、沉默子、絕緣子、邊界元件、復(fù)制起點(diǎn)、基質(zhì)附著位點(diǎn)和基因座控制區(qū)。"基因表達(dá)"指將基因所含信息轉(zhuǎn)變?yōu)榛虍a(chǎn)物?;虍a(chǎn)物可以是基因的直接轉(zhuǎn)錄產(chǎn)物(如mRNA、tRNA、rRNA、反義RNA、核酶、結(jié)構(gòu)RNA或任何其它類型的RNA)或mRNA翻譯產(chǎn)生的蛋白質(zhì)。基因產(chǎn)物也包括通過(guò)一些方法如加帽、聚腺苷酸化、甲基化和編輯修飾的RNA,以及通過(guò)(例如)甲基化、乙?;?、磷酸化、泛素化、ADP-核糖基化、十四垸基化和糖基化修飾的蛋白質(zhì)。基因表達(dá)的"調(diào)節(jié)"指改變基因活性。表達(dá)調(diào)節(jié)可包括但不限于基因活化和基因抑制。"真核"細(xì)胞包括但不限于真菌細(xì)胞(如酵母)、植物細(xì)胞、動(dòng)物細(xì)胞、哺乳動(dòng)物細(xì)胞和人細(xì)胞。"感興趣區(qū)域"是細(xì)胞染色質(zhì)的任何區(qū)域,例如基因或者基因內(nèi)或與基因毗鄰的非編碼序列,其中需要該區(qū)域結(jié)合外源性分子。結(jié)合可以是為了靶向DNA切割和/或靶向重組。感興趣區(qū)域可存在于(例如)染色體、附加體、細(xì)胞器基因組(如線粒體、葉綠體)或感染性病毒基因組中。感興趣區(qū)域可位于基因的編碼區(qū)內(nèi),轉(zhuǎn)錄的非編碼區(qū)如前導(dǎo)序列、尾隨序列或內(nèi)含子內(nèi),或者位于編碼區(qū)上游或下游的非轉(zhuǎn)錄區(qū)內(nèi)。感興趣區(qū)域可以短至單個(gè)核苷酸對(duì)或長(zhǎng)達(dá)2,000個(gè)核苷酸對(duì),或任何整數(shù)值的核苷酸對(duì)。術(shù)語(yǔ)"操作性連接"和"操作性連接的"(或"可操作連接的")可互換使用,指并列的兩個(gè)或多個(gè)部件(如序列元件),其中各部件的安排能使其發(fā)揮正常功能,并能使至少一個(gè)部件介導(dǎo)對(duì)至少一個(gè)其它部件施加作用。例如,如果某轉(zhuǎn)錄調(diào)節(jié)序列在對(duì)一種或多種轉(zhuǎn)錄調(diào)節(jié)因子的存在或缺失的反應(yīng)中能控制某編碼序列的轉(zhuǎn)錄水平,那么就說(shuō)該轉(zhuǎn)錄調(diào)節(jié)序列(如啟動(dòng)子)操作性連接于該編碼序列。轉(zhuǎn)錄調(diào)節(jié)序列通常與編碼序列順式操作性連接,但不一定直接與其毗連。例如,增強(qiáng)子是操作性連接于編碼序列的一種轉(zhuǎn)錄調(diào)節(jié)序列,即使它們不毗連。提到融合多肽時(shí),術(shù)語(yǔ)"操作性連接"可以指各部件與其它部件連接時(shí)可執(zhí)行與不這樣連接時(shí)同樣的功能。例如,提到ZFPDNA結(jié)合域融合于切割域的融合多肽時(shí),如果在此融合多肽中ZFPDNA-結(jié)合域部分能夠結(jié)合其靶位點(diǎn)和/或其結(jié)合位點(diǎn),而切割域能夠切割靶位點(diǎn)附近的DNA,那么就稱ZFPDNA結(jié)合域和切割域操作性相連。蛋白質(zhì)、多肽或核酸的"功能片段"是序列與全長(zhǎng)蛋白質(zhì)、多肽或核酸不同,但保留全長(zhǎng)蛋白質(zhì)、多肽或核酸相同功能的蛋白質(zhì)、多肽或核酸。功能片段的殘基數(shù)量可以比對(duì)應(yīng)的天然分子多、少或相同,和/或功能片段可含有一個(gè)或多個(gè)氨基酸或核苷酸取代。測(cè)定核酸功能(如編碼功能、與另一核酸雜交的能力)的方法是本領(lǐng)域熟知的。類似地,測(cè)定蛋白質(zhì)功能的方法是熟知的。例如,可通過(guò)(例如)濾膜結(jié)合、電泳遷移率變動(dòng)或免疫沉淀試驗(yàn)測(cè)定多肽的DNA結(jié)合功能。可通過(guò)凝膠電泳測(cè)定DNA切割。參見(jiàn)Ausubel等,同上。可通過(guò)(例如)免疫共沉淀、雙雜交試驗(yàn)或互補(bǔ)(遺傳和生化)試驗(yàn)測(cè)定蛋白質(zhì)與另一種蛋白質(zhì)相互作用的能力。參見(jiàn)例如Fields等(19S9)Nature340:245-246;美國(guó)專利號(hào)5,585,245和PCTWO98/44350。耙位點(diǎn)本發(fā)明方法和組合物包括含有切割域(或切割半域)和鋅指域的融合蛋白,其中鋅指域通過(guò)結(jié)合于細(xì)胞染色質(zhì)中的某序列(如靶位點(diǎn)或結(jié)合位點(diǎn)),將切割域(或切割半域)的活性導(dǎo)向該序列附近,從而誘導(dǎo)在靶序列附近進(jìn)行切割。如本發(fā)明其它地方所述,經(jīng)工程改造,鋅指域可結(jié)合于基本上任何所需序列。因此,鑒定含有需要切割或重組的序列的感興趣區(qū)域后,可工程改造一個(gè)或多個(gè)鋅指結(jié)合域,使其結(jié)合于感興趣區(qū)域中的一個(gè)或多個(gè)序列。在細(xì)胞中表達(dá)含有鋅指結(jié)合域和切割域的融合蛋白(或表達(dá)各自含有鋅指結(jié)合域和切割半域的兩種融合蛋白)能夠?qū)崿F(xiàn)在感興趣區(qū)域中切割。可按照(例如)共有美國(guó)專利6,453,242(2002年9月17日)所述的方法選擇細(xì)胞染色質(zhì)中鋅指域結(jié)合的序列(如耙位點(diǎn)),所述專利還公開(kāi)了設(shè)計(jì)能結(jié)合所選序列的ZFP的方法。本領(lǐng)域技術(shù)人員明白,也可簡(jiǎn)單地觀察核苷酸序列來(lái)選擇耙位點(diǎn)。因此,要求權(quán)利的方法中可采用任何靶位點(diǎn)選擇方式。靶位點(diǎn)通常由多個(gè)毗鄰的子靶位點(diǎn)組成。子靶位點(diǎn)指單個(gè)鋅指所結(jié)合的序列(通常是核苷酸三聯(lián)體,或可與毗鄰四聯(lián)體重疊一個(gè)核苷酸的核苷酸四聯(lián)體)。參見(jiàn)例如,WO02/077227。如果與鋅指蛋白結(jié)合程度最高的鏈被稱為靶鏈"主要識(shí)別鏈"或"主要接觸鏈",那么一些鋅指蛋白結(jié)合于靶鏈中的三堿基三聯(lián)體和非靶鏈上的第四堿基。靶位點(diǎn)長(zhǎng)度通常為至少9個(gè)核苷酸,因此,含有至少三個(gè)鋅指的鋅指結(jié)合域與其結(jié)合。然而,也可能是(例如)4-指結(jié)合域與12-核苷酸靶位點(diǎn)、5-指結(jié)合域與15-核苷酸靶位點(diǎn)或6-指結(jié)合域與18-核苷酸耙位點(diǎn)結(jié)合。本領(lǐng)域顯然了解,也可能是較大結(jié)合域(如7-、8-、9-指和更大)與較長(zhǎng)靶位點(diǎn)結(jié)合。靶位點(diǎn)不一定是多個(gè)三聯(lián)體核苷酸。例如,在發(fā)生交叉鏈相互作用的情況下(參見(jiàn)例如,美國(guó)專利6,453,242和WO02/077227),多指結(jié)合域中一個(gè)或多個(gè)單鋅指可結(jié)合于重疊的四聯(lián)體子位點(diǎn)。因此,三指蛋白可結(jié)合10-核苷酸序列,其中第十個(gè)核苷酸是末端指結(jié)合的四聯(lián)體的一部分,四指蛋白可結(jié)合13-核苷酸序列,其中第十三個(gè)核苷酸是末端指結(jié)合的四聯(lián)體的一部分,等等。多指結(jié)合域中各鋅指之間的氨基酸接頭序列的長(zhǎng)度和特性也影響其與靶序列的結(jié)合。例如,多指結(jié)合域中毗鄰鋅指之間存在所謂的"非經(jīng)典接頭"、"長(zhǎng)接頭"或"結(jié)構(gòu)化接頭"能使這些指結(jié)合非緊鄰的子位點(diǎn)。這類接頭的非限制性例子參見(jiàn)例如,美國(guó)專利號(hào)6,479,626和WO01/53480。因此,可通過(guò)1、2、3、4、5或更多個(gè)核苷酸使鋅指結(jié)合域靶位點(diǎn)中的一個(gè)或多個(gè)子位點(diǎn)相互分隔開(kāi)。為了提供一個(gè)例子,四指結(jié)合域可結(jié)合于序列中含有兩個(gè)毗連3-核苷酸子位點(diǎn)、中間核苷酸和兩個(gè)毗連三聯(lián)體子位點(diǎn)的13-核苷酸耙位點(diǎn)。序列(如靶位點(diǎn))之間的距離指從兩個(gè)序列最接近的邊緣計(jì)算,位于兩個(gè)序列之間的核苷酸或核苷酸對(duì)的數(shù)量。在切割取決于兩個(gè)鋅指域/切割半域融合分子與各自耙位點(diǎn)結(jié)合的實(shí)施方式中,這兩個(gè)靶位點(diǎn)可位于相對(duì)的DNA鏈上。在其它實(shí)施方式中,兩個(gè)耙位點(diǎn)在同一條DNA鏈上。鋅指結(jié)合域鋅指結(jié)合域包含一個(gè)或多個(gè)鋅指。Miller等(1985)五M50丄4:1609-1614;Rhodes(1993)&/e"^/c^mm'ca"Feb.:56-65;美國(guó)專利號(hào)6,453,242。一般地,一個(gè)鋅指域的長(zhǎng)度約為30個(gè)氨基酸。結(jié)構(gòu)研究證明,各鋅指域(基序)含有兩個(gè)卩片層(保持在含有兩個(gè)不變的半胱氨酸殘基的P轉(zhuǎn)角中)和一個(gè)a螺旋(含有兩個(gè)不變的組氨酸殘基),通過(guò)這兩個(gè)半胱氨酸和這兩個(gè)組氨酸與鋅原子的配位作用保持在特定構(gòu)象中。鋅指包括經(jīng)典的C2H2鋅指(即其中鋅離子與兩個(gè)半胱氨酸和兩個(gè)組氨酸殘基配位)和非經(jīng)典鋅指,例如C3H鋅指(其中鋅離子與三個(gè)半胱氨酸殘基和一個(gè)組氨酸殘基配位)和C4鋅指(其中鋅離子與四個(gè)半胱氨酸殘基配位)。還參見(jiàn)WO02/057293。經(jīng)工程改造,鋅指結(jié)合域可結(jié)合于所選序列。參見(jiàn)例如,Beerli等(2002)Atow說(shuō)ofec/z"o/.20:135-141;Pabo等(2001)j"".iev.S/oc/em.70:313-340;Isalan等(2001)iVaft^e5/ofec/mo/.19:656-660;Segal等(2001)Cw/r.Qp/仏5/oec/mo/.12:632-637;Choo等(2000)C臟.爭(zhēng)".廳.10:411-416。與天然產(chǎn)生的鋅指蛋白相比,經(jīng)工程改造的鋅指結(jié)合域可具有新的結(jié)合特異性。工程改造方法包括但不限于合理設(shè)計(jì)和各種類型的選擇。合理設(shè)計(jì)包括例如含有三聯(lián)體(或四聯(lián)體)核苷酸序列和各個(gè)鋅指氨基酸序列的數(shù)據(jù)庫(kù),其中每個(gè)三聯(lián)體或四聯(lián)體核苷酸序列與結(jié)合特定三聯(lián)體或四聯(lián)體序列的一個(gè)或多個(gè)鋅指氨基酸序列相連。參見(jiàn)例如,共有的美國(guó)專利6,453,242和6,534,261。示范性選擇方法,包括噬菌體呈現(xiàn)和雙雜交系統(tǒng),參見(jiàn)美國(guó)專利5,789,538;5,925,523;6,007,988;6,013,453;6,410,248;6,140,466;6,200,759;和6,242,568;以及WO98/37186;WO98/53057;WO00/27878;WO01/88197和GB2,338,237。提高鋅指結(jié)合域的結(jié)合特異性可參見(jiàn)(例如)共有的WO02/077227。由于一個(gè)鋅指結(jié)合于3-核苷酸(即三聯(lián)體)序列(或可能與毗鄰鋅指的4-核苷酸結(jié)合位點(diǎn)有1個(gè)核苷酸重疊的4-核苷酸序列),所以經(jīng)工程改造的鋅指結(jié)合域結(jié)合的序列(如靶序列)長(zhǎng)度將決定工程改造鋅指結(jié)合域中鋅指的數(shù)量。例如,對(duì)于其指基序不結(jié)合于重疊子位點(diǎn)的ZFP而言,6-核苷酸靶序列與2指結(jié)合域結(jié)合;9-核苷酸靶序列與3-指結(jié)合域結(jié)合等。如本文所述,靶位點(diǎn)中各鋅指的結(jié)合位點(diǎn)(即子位點(diǎn))不一定毗連,但可通過(guò)一個(gè)或幾個(gè)核苷酸隔開(kāi),這取決于多指結(jié)合域中個(gè)鋅指之間的氨基酸序列(即指間接頭)的長(zhǎng)度和性質(zhì)。在多指鋅指結(jié)合域中,毗鄰的鋅指可用約5個(gè)氨基酸的氨基酸接頭序列(所謂的"經(jīng)典"指間接頭),或者一個(gè)或多個(gè)非經(jīng)典接頭間隔開(kāi)。參見(jiàn)例如,共有的美國(guó)專利6,453,242和6,534,261。對(duì)于含有三指以上的工程改造的鋅指結(jié)合域而言,可優(yōu)選在某些鋅指之間插入較長(zhǎng)("非經(jīng)典")指間接頭,因?yàn)檫@可提高該結(jié)合域結(jié)合的親和力和/或特異性。參見(jiàn)例如,美國(guó)專利號(hào)6,479,626和WO01/53480。因此,也可根據(jù)非經(jīng)典指間接頭的存在和位置特征鑒定多指鋅指結(jié)合域。例如,包含三個(gè)指(由兩個(gè)經(jīng)典指間接頭連接)、長(zhǎng)接頭和三個(gè)其它指(由兩個(gè)經(jīng)典指間接頭連接)的六指鋅指結(jié)合域稱作2x3構(gòu)型。相似地,包含二個(gè)指(它們之間含有經(jīng)典接頭)、長(zhǎng)接頭和兩個(gè)其它指(由經(jīng)典接頭連接)的結(jié)合域稱作2x2蛋白。含有三個(gè)二指單元(其中兩個(gè)指各自通過(guò)經(jīng)典接頭連接在一起)的蛋白質(zhì)稱作3x2蛋白質(zhì),其中每個(gè)二指單元通過(guò)長(zhǎng)接頭連接于毗鄰的二指單元。多指結(jié)合域中兩個(gè)毗鄰鋅指之間存在一個(gè)長(zhǎng)或非經(jīng)典指間接頭常常使得這兩個(gè)指能結(jié)合于靶序列中非緊鄰的子位點(diǎn)。因此,靶位點(diǎn)中子位點(diǎn)之間可能存在一個(gè)或多個(gè)核苷酸的缺口;即,靶位點(diǎn)可含有鋅指不接觸的一個(gè)或多個(gè)核苷酸。例如,2x2鋅指結(jié)合域可結(jié)合1個(gè)核苷酸隔開(kāi)的兩個(gè)6-核苷酸序列,g卩能結(jié)合13-核苷酸耙位點(diǎn)。還參見(jiàn)Moore等(2001a)Proc.Natl.Acad.Sci.USA98:1432-1436;Moore等(2001b)Pro"Natl.Acad.Sci.USA98:1437-1441和WO01/53480。如前所述,子靶位點(diǎn)是由一個(gè)鋅指結(jié)合的3-或4-核苷酸序列。出于某些目的,2-指單元稱作結(jié)合模塊。可通過(guò)(例如)選擇能結(jié)合特定6-核苷酸靶序列的多指蛋白質(zhì)(通常是三指)中兩個(gè)毗鄰指來(lái)獲得結(jié)合模塊?;蛘?,可通過(guò)組裝各個(gè)鋅指構(gòu)建模塊。還參見(jiàn)WO98/53057和WO01/53480。切割域可采用任何核酸內(nèi)切酶或外切核酸酶獲得本文所述的融合蛋白的切割域部分??僧a(chǎn)生切割域的示范性核酸內(nèi)切酶包括但不限于限制性核酸內(nèi)切酶和尋靶核酸內(nèi)切酶。參見(jiàn)例如,2002-2003目錄,NewEnglandBiolabs(新英格蘭生物實(shí)驗(yàn)室公司),馬薩諸塞州貝弗利;和Belfort等(1997)A^c/e/cA^^i"25:3379-3388。已知能切割DNA的其它酶(如Sl核酸酶;綠豆核酸酶;胰DNA酶I;微球菌核酸酶;酵母HO核酸內(nèi)切酶;還參見(jiàn)Li皿等(編)A^c/eo^(核酸酶),冷泉港實(shí)驗(yàn)室出版社,1993)。這些酶中的一種或多種(或其功能片段)可用作切割域和切割半域來(lái)源。相似地,如上所述,切割半域(如含有鋅指結(jié)合域和切割半域的融合蛋白)可衍生自切割活性所需要的二聚化的任何核酸酶或其部分。通常,如果融合蛋白包含切割半域,那么切割需要兩種融合蛋白。或者,可采用含有兩個(gè)切割半域的一種蛋白。兩個(gè)切割半域可衍生自同一核酸內(nèi)切酶(或其功能片段),或各切割半域衍生自不同的核酸內(nèi)切酶(或其功能片段)。此外,優(yōu)選安排兩種融合蛋白靶位點(diǎn)的相互位置,使兩種融合蛋白與各自靶位點(diǎn)結(jié)合而將二切割半域定位于使該二切割半域形成功能性切割域(例如通過(guò)二聚化)的空間取向上。因此,在某些實(shí)施方式中,靠近靶位點(diǎn)的邊緣間隔有5-8個(gè)核苷酸或15-18個(gè)核苷酸。然而,可將任何整數(shù)數(shù)量的核苷酸或核苷酸對(duì)插入兩個(gè)靶位點(diǎn)之間(如2-50個(gè)或更多個(gè)核苷酸)。通常,切割點(diǎn)位于靶位點(diǎn)之間。許多物種中存在限制性核酸內(nèi)切酶(限制性酶),它們能夠序列特異性結(jié)合與DNA(在識(shí)別位點(diǎn)處),并在其結(jié)合位點(diǎn)上或其附近切割DNA。某些限制性酶(如IIS型)在遠(yuǎn)離識(shí)別位點(diǎn)的位置上切割DNA,具有分開(kāi)的結(jié)合域和切割域。例如,IIS型酶FoM能在一條鍵上距離識(shí)別位點(diǎn)9個(gè)核苷酸處和另一條鏈上距離識(shí)別位點(diǎn)13個(gè)核苷酸處催化切割DNA雙鏈。參見(jiàn)例如,美國(guó)專利5,356,802、5,436,150和5,487,994;以及Li等(1992)Proc.Natl.Acad.Sci.USA89:4275-4279;Li等(1993)Proc.Natl.Acad.Sci.USA90:2764-2768;Kim等(1994a)Proc.Natl.Acad.Sci.USA91:883-887;Kim等(1994b)J.Biol.Chem.269:31,978-31,982。因此,在一個(gè)實(shí)施方式中,融合蛋白包含至少一種IIS型限制性酶的切割域(或切割半域)以及一個(gè)或多個(gè)鋅指結(jié)合域,該鋅指結(jié)合域可經(jīng)過(guò)或未經(jīng)工程改造。切割域與結(jié)合域分開(kāi)的示范性ns型限制性酶是,OAI。此種特殊酶的二聚體形式有活性。Bitinaite等(1998)Prac.A^/.t/&495:10,570-10,575。因此,出于本發(fā)明目的,認(rèn)為用于所述融合蛋白的FoH酶的一部分是切割半域。因此,為了用鋅指-FoH融合物進(jìn)行耙向雙鏈切割和/或耙向置換細(xì)胞序列,可采用各自含有尸oM切割半域的兩種融合蛋白來(lái)重建有催化活性的切割域。或者,還可采用含有一個(gè)鋅指結(jié)合域和兩個(gè)FMI切割半域的一種多肽分子。在本文其它地方提供了用鋅指-i^H融合物進(jìn)行靶向切割和耙向序列改變的參數(shù)。切割域或切割半域可以是保留了切割活性,或保留了多聚化(如二聚化)形成功能性切割域能力的蛋白質(zhì)的任何部分。示范性ns型限制性酶見(jiàn)表i。其它限制性酶也含有分開(kāi)的結(jié)合域和切割域,本發(fā)明也考慮了這些限制性酶。參見(jiàn)例如,Roberts等(2003)M",/e/c^cz'^yi仏31:418-420。表l:一些IIS型限制性酶<table>tableseeoriginaldocumentpage32</column></row><table>BinIGdiIIBmglGsulBpulOIHgalBsaXIHin4IIBsblHphlBscAIKsp632IBscGIMboIIBseRIMlyIBseYIMmeIBsilMnllBsmlPflll08IBsmAIPieIBsmFIPpilBsp24IPsrlBspGIRleAIBspMISapIBspNCISfaNIBsrlSimI鋅指域-切割域融合物本領(lǐng)域技術(shù)人員了解設(shè)計(jì)和構(gòu)建融合蛋白(和編碼它們的多核苷酸)的方法。例如,設(shè)計(jì)和構(gòu)建含有鋅指蛋白的融合蛋白(和編碼它們的多核苷酸)的方法參見(jiàn)共有美國(guó)專利6,453,242和6,534,261。在某些實(shí)施方式中,構(gòu)建編碼這類融合蛋白的多核苷酸。可將這些多核苷酸插入載體中,將該載體引入細(xì)胞中(關(guān)于載體和將多核苷酸引入細(xì)胞的方法的內(nèi)容見(jiàn)下)。在本文所述方法的某些實(shí)施方式中,融合蛋白包含鋅指結(jié)合域和來(lái)自FoH限制性酶的切割半域,在細(xì)胞中表達(dá)兩種這類融合蛋白。可將兩種蛋白遞送到細(xì)胞中;將一種蛋白質(zhì)和編碼一種蛋白質(zhì)的一種核酸遞送到細(xì)胞中;將各自編碼一種蛋白的兩種核酸遞送到細(xì)胞中;或?qū)⒕幋a兩種蛋白質(zhì)的核酸遞送到細(xì)胞中,從而在細(xì)胞中表達(dá)兩種融合蛋白。在其它實(shí)施方式中,融合蛋白包含含有兩個(gè)切割半域和一個(gè)鋅指結(jié)合域的一條多肽鏈。在這種情況下,在細(xì)胞中表達(dá)一種融合蛋白,如果不希望受限于理論,認(rèn)為是通過(guò)二切割半域形成的分子內(nèi)二聚體而切割DNA。在某些實(shí)施方式中,安排融合蛋白(如ZFP-FoA:I融合物)的組件,使鋅指域最接近該融合蛋白的氨基末端,而切割半域最接近羧基末端。這鏡像反映出天然產(chǎn)生的二聚化切割域如衍生自尸oH酶的二聚化切割域中切割域的相對(duì)取向,此二聚化切割域中DNA-結(jié)合域最接近氨基末端,切割半域最接近羧基末端。在這些實(shí)施方式中,融合蛋白與相對(duì)DNA鏈上的位點(diǎn)結(jié)合,二結(jié)合位點(diǎn)的5,端互相靠近,而導(dǎo)致切割半域二聚化形成有功能的核酸酶。見(jiàn)圖43A。在其它實(shí)施方式中,安排融合蛋白(如ZFP-尸WI融合物)的各組件,使切割半域最接近融合蛋白的氨基末端,鋅指域最接近羧基末端。在這些實(shí)施方式中,融合蛋白與相對(duì)DNA鏈上的位點(diǎn)結(jié)合,二結(jié)合位點(diǎn)的3'端互相靠近,導(dǎo)致切割半域二聚化形成有功能的核酸酶。見(jiàn)圖43B。在其它實(shí)施方式中,第一種融合蛋白所含的切割半域最接近該融合蛋白氨基末端,鋅指域最接近羧基末端,安排第二種融合蛋白,以使鋅指域最接近該融合蛋白的氨基末端,切割半域最接近羧基末端。在這些實(shí)施方式中,兩種融合蛋白均結(jié)合于同一條DNA鏈,所含鋅指域最接近羧基末端的第一種融合蛋白的結(jié)合位點(diǎn)位于所含鋅指域最接近氨基末端的第二種融合蛋白的結(jié)合位點(diǎn)的5'側(cè)。見(jiàn)圖43C。在所述融合蛋白中,鋅指域和切割域(或切割半域)之間的氨基酸序列稱為"ZC接頭"。ZC接頭與上述指間接頭不同。出于測(cè)定ZC接頭長(zhǎng)度的目的,采用Pabo等(2001)Aev.歷oc/zem.70:313-340描述的以下鋅指結(jié)構(gòu)X-X-C-X2-4-C-X12-H-X3-5-H(SEQIDNO:201)在這種結(jié)構(gòu)中,鋅指的第一個(gè)殘基是位于第一個(gè)保守半胱氨酸殘基的氨基末端一側(cè)兩個(gè)殘基處的氨基酸。在大多數(shù)天然產(chǎn)生的鋅指蛋白中,該位置被疏水性氨基酸占據(jù)(通常是苯丙氨酸或酪氨酸)。因此,在所述融合蛋白中,鋅指的第一個(gè)殘基常常是疏水性殘基,但可以是任何氨基酸。鋅指的最后一個(gè)氨基酸殘基(如上所述)是第二保守的組氨酸殘基。因此,在所述鋅指結(jié)合域的極性位于切割域(或切割半域)的氨基末端的融合蛋白中,所述ZC接頭是鋅指C末端的第二保守組氨酸殘基和切割域(或切割半域)的N末端氨基酸之間的氨基酸序列。例如,在實(shí)施例部分舉例說(shuō)明其結(jié)構(gòu)的某些融合蛋白中,切割半域的N-末端氨基酸是谷胺酰胺(Q)殘基,對(duì)應(yīng)于Looney等(1989)Gwe80:193-208所述的FoW序列中的第384號(hào)氨基酸。在極性為切割域(或切割半域)位于鋅指結(jié)合域氨基末端的融合蛋白中,所述zc接頭是位于切割域(或半域)C末端氨基酸殘基和鋅指結(jié)合域N末端鋅指第一個(gè)殘基(即位于第一個(gè)保守的半胱氨酸殘基上游兩個(gè)殘基處的殘基)之間的氨基酸序列。在某些示范性融合蛋白中,切割半域C末端氨基酸是苯丙氨酸(F)殘基,對(duì)應(yīng)于Looney等(1989)80:193-208所述的FoM序列中的第579號(hào)氨基酸。所述zc接頭可以是任何氨基酸序列。為了獲得最優(yōu)切割,zc接頭的長(zhǎng)度與靶位點(diǎn)(結(jié)合位點(diǎn))之間的距離相關(guān)聯(lián)。參見(jiàn)例如,Smith等(2000)A^c/e/cA油28:3361-3369;Bibikova等(2001)Mo/.Ce〃.Ao/.21:289-297,注意其接頭長(zhǎng)度的記法與本文所用方法不同。例如,在鋅指結(jié)合域位于切割半域氨基末端、ZC接頭長(zhǎng)度為4個(gè)氨基酸(如本文所述)的ZFP-FoH融合物(其它地方稱為L(zhǎng)0)中,該融合蛋白的結(jié)合位點(diǎn)相隔6或16個(gè)核苷酸(由各結(jié)合位點(diǎn)的近邊測(cè)定)時(shí)發(fā)生最優(yōu)切割。參見(jiàn)實(shí)施例4。靶向切割的方法可采用本發(fā)明所述方法和組合物在細(xì)胞染色質(zhì)感興趣區(qū)域(如基因組中,如突變型或野生型基因中所需或預(yù)定的位點(diǎn))切割DNA。就這種靶向DNA切割而言,可工程改造鋅指結(jié)合域,使其在預(yù)定的切割位點(diǎn)或附近結(jié)合靶位點(diǎn),和在細(xì)胞中表達(dá)含有工程改造的鋅指結(jié)合域和切割域的融合蛋白。融合蛋白的鋅指部分與靶位點(diǎn)結(jié)合后,切割域在耙位點(diǎn)附近切割DNA。準(zhǔn)確的切割位點(diǎn)可能取決于ZC接頭的長(zhǎng)度?;蛘?,在細(xì)胞中表達(dá)各自含有鋅指結(jié)合域和切割半域的兩種融合蛋白,這兩種融合蛋白以并列方式結(jié)合靶位點(diǎn),從而得于以重建功能性切割域和在靶位點(diǎn)附近切割DNA。在一個(gè)實(shí)施方式中,在兩個(gè)鋅指結(jié)合域的靶位點(diǎn)之間進(jìn)行切割。可工程改造一個(gè)或兩個(gè)鋅指結(jié)合域。在采用鋅指結(jié)合域-切割域融合多肽的耙向切割中,結(jié)合位點(diǎn)可包括切割位點(diǎn),或者結(jié)合位點(diǎn)的近邊可距離切割位點(diǎn)1、2、3、4、5、6、10、25、50或更多個(gè)核苷酸(或1-50個(gè)核苷酸之間的任何整數(shù)值)。結(jié)合位點(diǎn)相對(duì)于切割位點(diǎn)的準(zhǔn)確位置將取決于具體的切割域和ZC接頭的長(zhǎng)度。在采用各自含有鋅指結(jié)合域和切割半域的兩種融合多肽的方法中,結(jié)合位點(diǎn)通??缭?straddle)切割位點(diǎn)。因此,第一個(gè)結(jié)合位點(diǎn)的近邊可距切割位點(diǎn)一側(cè)1、2、3、4、5、6、10、25或更多個(gè)核苷酸(或1-50個(gè)核苷酸之間的任何整數(shù)值),第二個(gè)結(jié)合位點(diǎn)的近邊可距切割位點(diǎn)另外一側(cè)1、2、3、4、5、6、10、25或更多個(gè)核苷酸(或l-50個(gè)核苷酸之間的任何整數(shù)值)。本領(lǐng)域技術(shù)人員熟知繪制體外和體內(nèi)切割位點(diǎn)的方法。因此,本文所述方法可利用融合于切割域的工程改造的鋅指結(jié)合域。在這些情況下,結(jié)合域經(jīng)工程改造能結(jié)合需要切割的靶序列或其附近。將融合蛋白或編碼它的多核苷酸引入細(xì)胞中。一旦引入細(xì)胞或在細(xì)胞中表達(dá)后,融合蛋白就能結(jié)合于靶序列并在靶序列上或其附近切割。精確的切割位點(diǎn)取決于切割域的性質(zhì)和/或結(jié)合域和切割域之間存在的接頭序列和/或性質(zhì)。在采用各自包含切割半域的兩種融合蛋白情況下,結(jié)合位點(diǎn)近邊的距離可以有1、2、3、4、5、6、7、8、9、10、25或更多個(gè)核苷酸(或1-50個(gè)核苷酸之間的任何整數(shù)值)。最優(yōu)的切割水平也可取決于兩種融合蛋白的結(jié)合位點(diǎn)之間的距離(參見(jiàn)例如,Smith等(2000)Wwc/e/c^c/A28:3361-3369;Bibikova等(2001)Mo/.Ce〃.5/o/.21:289-297)和各融合蛋白中ZC接頭的長(zhǎng)度。在ZFP-FoH融合核酸酶中,ZFP和FoM切割半域之間的接頭(即ZC接頭)長(zhǎng)度可能影響切割效率。在利用含有4個(gè)氨基酸殘基的ZC接頭的ZFP-尸oW融合物的一個(gè)實(shí)驗(yàn)系統(tǒng)中,兩種ZFP-FoW核酸酶的結(jié)合位點(diǎn)的近邊被6個(gè)堿基對(duì)分隔開(kāi)時(shí),獲得最優(yōu)切割。這種具體的融合核酸酶的鋅指部分和核酸酶半域之間包含以下氨基酸序列HORTHONKKOLV(SEQIDNO:26)其中用下劃線表示出鋅指的C末端部分中兩個(gè)保守組氨酸和FoW切割半域中前三個(gè)殘基。因此,此構(gòu)建物中的ZC接頭序列是QNKK。Bibikova等(2001)Mo/.Ce//.21:289-297。本發(fā)明者構(gòu)建了具有各種長(zhǎng)度和序列ZC接頭的許多ZFP-FoM融合核酸酶,分析這些核酸酶對(duì)ZFP結(jié)合位點(diǎn)之間距離不同的一系列底物的切割效率。參見(jiàn)實(shí)施例4。在某些實(shí)施方式中,切割域包含兩個(gè)切割半域,它們都是含有結(jié)合域、第一個(gè)切割半域和第二個(gè)切割半域的一條多肽的一部分。切割半域可具有相同氨基酸序列或不同氨基酸序列,只要它們能切割DNA。也可用不同分子提供切割半域。例如,可將兩種融合多肽引入細(xì)胞中,各多肽包含結(jié)合域和切割半域。切割半域可具有相同氨基酸序列或不同氨基酸序列,只要它們能切割DNA。另外,該結(jié)合域結(jié)合于靶序列,通常安排的方式是當(dāng)融合多肽結(jié)合時(shí),兩個(gè)切割半域的相互空間取向能夠重建切割域(如通過(guò)半域的二聚化),從而確定半域的相對(duì)定位以形成功能性切割域,導(dǎo)致切割細(xì)胞染色質(zhì)中的感興趣區(qū)域。通常,重組切割域在位于兩個(gè)耙序列之間的位點(diǎn)上進(jìn)行切割??晒こ谈脑煲环N或兩種蛋白質(zhì)使之能結(jié)合其靶位點(diǎn)。兩種融合蛋白可以相同或相對(duì)的極性結(jié)合感興趣區(qū)域,它們的結(jié)合位點(diǎn)(即靶位點(diǎn))之間間隔任何數(shù)量的核苷酸,如0-200個(gè)核苷酸或其間任何整數(shù)值。在某些實(shí)施方式中,由各結(jié)合位點(diǎn)最接近其它結(jié)合位點(diǎn)的邊緣測(cè)定,各自包含鋅指結(jié)合域和切割半域的兩種融合蛋白的結(jié)合位點(diǎn)之間可間隔5-18個(gè)核苷酸,例如,5-8個(gè)核苷酸,或15-18個(gè)核苷酸,或6個(gè)核苷酸,或16個(gè)核苷酸,可在結(jié)合位點(diǎn)之間進(jìn)行切割。切割DNA的位點(diǎn)通常位于兩種融合蛋白的結(jié)合位點(diǎn)之間。DNA雙鏈的斷裂常因兩條單鏈斷裂,或偏離l、2、3、4、5、6或更多個(gè)核苷酸斷裂產(chǎn)生的"缺口"所引起(例如,天然FoH切割雙鏈DNA是通過(guò)偏離4個(gè)核苷酸的單鏈斷裂產(chǎn)生的)。因此,切割不一定發(fā)生在各DNA鏈的精確相對(duì)位點(diǎn)上。此外,融合蛋白的結(jié)構(gòu)和靶位點(diǎn)之間的距離可能影響切割是否發(fā)生在單個(gè)核苷酸對(duì)附近,或是否在幾個(gè)位點(diǎn)上發(fā)生切割。然而,在許多應(yīng)用,包括靶向重組和靶向誘變(見(jiàn)下)中,在一定范圍核苷酸內(nèi)切割通常足矣,不需要在特定堿基對(duì)之間進(jìn)行切割。如上所述,融合蛋白可作為多肽和/或多核苷酸引入。例如,可將各自含有編碼一種上述多肽的序列的兩種多核苷酸引入細(xì)胞中,當(dāng)表達(dá)的多肽各自結(jié)合其靶序列時(shí),在靶序列處或附近切割?;蛘?,將包含編碼兩種融合多肽的序列的一種多核苷酸引入細(xì)胞中。多核苷酸可以是DNA、RNA或者任何修飾形式的DNA和/或RNA或類似物。為了提高切割特異性,其它組合物也可用于本文所述方法。例如,一個(gè)切割半域的雙鏈切割活性有限。在將各自含有三指鋅指域和切割半域的兩種融合蛋白引入細(xì)胞的方法中,每種蛋白質(zhì)確定了大約9個(gè)核苷酸的靶位點(diǎn)。雖然18個(gè)核苷酸的集合靶序列可能是哺乳動(dòng)物基因組中獨(dú)特的,但任何給定的9-核苷酸靶位點(diǎn)在人類基因組中大約平均出現(xiàn)23,000次。因此,由一個(gè)半域產(chǎn)生的位點(diǎn)-特異性結(jié)合,可能發(fā)生非特異性切割。因此,本文所述方法考慮了采用切割半域如的顯性-負(fù)突變體(或者編碼它的核酸)在細(xì)胞中與兩種融合蛋白一起表達(dá)。此顯性-負(fù)突變體能夠二聚化,但不能切割,也能阻斷與其二聚化半域的切割活性。通過(guò)向融合蛋白提供摩爾過(guò)量的該顯性負(fù)突變體,只有在兩種融合蛋白結(jié)合的區(qū)域中功能性切割半域的局部濃度足夠高而發(fā)生二聚化和切割。在僅結(jié)合兩種融合蛋白之一的位點(diǎn)上,其切割半域與顯性負(fù)突變體半域形成二聚體,而不會(huì)發(fā)生不良的非特異性切割。已鑒定到FoH切割半域中的三個(gè)催化性氨基酸殘基Asp450、Asp467和Lys469。Bitinaite等(1998)iVa〃.v4cadScz'.t/&495:10,570-10,575。因此,可使這些殘基中的一個(gè)發(fā)生一種或多種突變而產(chǎn)生顯性負(fù)突變體。另外,已知和/或可測(cè)定其它IIS型核酸內(nèi)切酶的許多催化性氨基酸殘基,所述測(cè)定方法例如與尸OA:I序列比對(duì)和/或產(chǎn)生和檢測(cè)突變體的催化活性。切割半域中的二聚化結(jié)構(gòu)域突變靶向切割方法包括采用ZFP與切割半域的融合物(如ZFPAFWI融合物),該方法需要采用兩種這類融合分子,通常各針對(duì)不同的靶序列。如上所述,可選擇這兩種融合蛋白的耙序列,以使靶向切割針對(duì)基因組中的獨(dú)特位點(diǎn)。切割特異性降低的可能原因是兩種ZFP/切割半域融合物中的一種發(fā)生同源二聚化。例如,由于基因組中存在兩種ZFP/切割半域融合物中一種融合物的靶序列的反向重復(fù)序列,這種情況可能發(fā)生,其定位使得同一融合蛋白的兩個(gè)拷貝以能夠形成功能性二聚體的取向和間隔結(jié)合。減少對(duì)除所需靶位點(diǎn)外的序列的這種類型異常切割概率的一種方法包括產(chǎn)生能最大程度減少或防止同源二聚化的切割半域變體。優(yōu)選改變半域區(qū)域中參與二聚化的一個(gè)或多個(gè)氨基酸。在,oW蛋白二聚體的晶體結(jié)構(gòu)中,據(jù)報(bào)道切割半域的結(jié)構(gòu)類似于用FoM切割DNA的過(guò)程中切割半域的排列。Wah等(1998)尸rac.Ato/.95:10564-10569。此結(jié)構(gòu)表明,位置483和487的氨基酸殘基在FoW切割半域二聚化過(guò)程中起到關(guān)鍵作用。該結(jié)構(gòu)也表明,位置446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537和538上的氨基酸殘基都很接近二聚化界面,足以影響二聚化。因此,上述位置中一個(gè)或多個(gè)位置上的氨基酸序列改變可能改變?cè)撉懈畎胗虻亩刍阅?。例如,可通過(guò)構(gòu)建含有(或編碼)這些位置上的不同氨基酸殘基的文庫(kù)和選擇具有所需性能的突變體,或通過(guò)合理設(shè)計(jì)各個(gè)突變體而引入這些改變。除了防止同源二聚化外,一些突變還可能將切割效率提高到高于用兩種野生型切割半域獲得的水平。因此,改變Fo/cI切割半域中影響二聚化的任何氨基酸殘基可用于防止一對(duì)ZFP/Fo/tl融合物中的一種融合物發(fā)生二聚化,二聚化可能導(dǎo)致在不需要的序列上發(fā)生切割。因此,就采用一對(duì)ZFP/FoM融合物進(jìn)行靶向切割而言,一種或兩種融合蛋白可包含能抑制自身二聚化、但允許兩種融合蛋白發(fā)生異源二聚化以便在所需靶位點(diǎn)上進(jìn)行切割的一個(gè)或多個(gè)氨基酸改變。在某些實(shí)施方式中,兩種融合蛋白中都存在改變,這些改變具有加成作用;即最大程度減少或消除導(dǎo)致異常切割的融合物的同源二聚化,而與野生型切割半域相比,促進(jìn)了兩種融合蛋白的異源二聚化。參見(jiàn)實(shí)施例5。耙向改變基因組序列和靶向重組的方法本文還描述了用同源但不相同的序列取代基因組序列(如細(xì)胞染色質(zhì)中的感興趣區(qū)域)的方法(即靶向重組)。曾經(jīng)嘗試取代具體序列的方法包括使細(xì)胞接觸含有與染色體區(qū)域(即供體DNA)有同源性的序列的多核苷酸,然后選擇供體DNA分子通過(guò)同源重組整合到其基因組中的細(xì)胞。由于同源重組的效率低和供體DNA非特異性插入耙位點(diǎn)以外的基因組區(qū)域的頻率高,所以這些方法的成功率很低。本發(fā)明提供了靶向改變序列的方法,其特征是靶向重組的效率較高和非特異性插入的頻率較低。該方法包括制備和使用融合于切割域(或切割半域)的工程改造的鋅指結(jié)合域,該切割域能在細(xì)胞DNA中產(chǎn)生一處或多處靶向雙鏈斷裂。因?yàn)榧?xì)胞DNA中的雙鏈斷裂會(huì)刺激細(xì)胞修復(fù)機(jī)制,使切割位點(diǎn)附近的細(xì)胞修復(fù)機(jī)制提高數(shù)千倍,所以這類耙向切割能夠在基因組中基本上任何位點(diǎn)中產(chǎn)生序列改變或取代(通過(guò)同源性指導(dǎo)的修復(fù))。除本文所述的融合分子外,靶向取代所選基因組序列也要求引入取代(或供體)序列。可在表達(dá)融合蛋白之前、同時(shí)或之后將供體序列引入細(xì)胞中。供體多核苷酸與基因組序列有足夠的同源性,以支持它與具有同源性的基因組序列之間發(fā)生同源重組(或同源性指導(dǎo)的修復(fù))。供體與基因組序列之間有約25、50、100、200、500、750、l,OOO、1,500、2,000個(gè)核苷酸或更多個(gè)(10-2,000個(gè)核苷酸之間的任何整數(shù),或更多)同源時(shí),將支持它們之間發(fā)生同源重組。供體序列的長(zhǎng)度范圍可以是10-5,000個(gè)核苷酸(或它們之間的任何整數(shù)值的核苷酸)或更長(zhǎng)。不難理解,供體序列一般與其取代的基因組序列不同。例如,相對(duì)于基因組序列,供體多核苷酸序列可能含有一個(gè)或多個(gè)單堿基改變、插入、缺失、倒位或重排,只要與染色體序列存在足夠的同源性?;蛘?,供體序列可含有側(cè)接于兩個(gè)同源區(qū)的非同源序列。此外,供體序列可包含含有與細(xì)胞染色質(zhì)的感興趣區(qū)域不同源的序列的載體分子。通常,供體序列的同源區(qū)與需要進(jìn)行重組的基因組序列的序列相同性至少為50%。在某些實(shí)施方式中,序列相同性為60%、70%、80%、90%、95%、98%、99%或99.9%。序列相同性可以是1%和100%之間的任何值,這取決于供體多核苷酸的長(zhǎng)度。供體分子可含有與細(xì)胞染色質(zhì)同源的數(shù)個(gè)不連續(xù)區(qū)域。例如,為了靶向插入通常在感興趣區(qū)域中不存在的序列,所述序列可存在于供體核酸分子中,并側(cè)接于與感興趣區(qū)域中的序列同源的區(qū)域。為了簡(jiǎn)化用于測(cè)定成功插入供體序列的試驗(yàn)(如雜交、PCR、限制性酶消化),與基因組序列相比供體序列中可存在某些序列差異。優(yōu)選地,如果位于編碼區(qū),這種核苷酸序列差異不會(huì)改變氨基酸序列,或者產(chǎn)生沉默性氨基酸改變(即,這種改變不會(huì)影響蛋白質(zhì)的結(jié)構(gòu)或功能)。供體多核苷酸中對(duì)應(yīng)于感興趣區(qū)域中鋅指域結(jié)合位點(diǎn)的序列可任選地含有改變,以防止同源重組引入細(xì)胞染色質(zhì)中的供體序列被切割。供體多核苷酸可以是單鏈或雙鏈DNA或RNA,可以線狀或環(huán)狀形式引入細(xì)胞中。如果以線狀形式引入,可通過(guò)本領(lǐng)域技術(shù)人員已知的方法保護(hù)供體序列的末端(如避免核外溶解性降解)。例如,將一個(gè)或多個(gè)二脫氧核苷酸殘基加入線狀分子的3'端和/或?qū)⒆陨砘パa(bǔ)性寡核苷酸連接于一端或兩端。參見(jiàn)例如,Chang等(19S7)Ato/.84:4959-4963;Nehls等(1996)Sc/ewce272:886-889。保護(hù)外源性多核苷酸不被降解的其它方法包括但不限于加入末端氨基和采用修飾的核苷酸間連接,例如,硫代磷酸酯、氨基磷酸酯和O-甲基核糖或脫氧核糖殘基。可將多核苷酸作為載體分子的一部分引入細(xì)胞,載體分子還含有其它序列如復(fù)制起點(diǎn)、啟動(dòng)子和抗生素抗性編碼基因。而且,可作為裸露核酸、與某種物質(zhì)如脂質(zhì)體或泊洛沙姆復(fù)合的核酸引入供體多核苷酸,或者可通過(guò)病毒(如腺病毒、AAV、皰疹病毒、逆轉(zhuǎn)錄病毒、慢病毒)遞送供體多核苷酸。如果不希望受限于理論,看來(lái)細(xì)胞序列中存在雙鏈斷裂、和存在與該斷裂相鄰區(qū)域或周?chē)鷧^(qū)域有同源性的外源性DNA分子,它們激活了通過(guò)將序列信息由供體分子轉(zhuǎn)移到細(xì)胞(如基因組或染色體)序列中,即通過(guò)同源性指導(dǎo)修復(fù)過(guò)程,也稱為"基因轉(zhuǎn)變"的修復(fù)斷裂的細(xì)胞機(jī)制。本申請(qǐng)人的方法的優(yōu)點(diǎn)是,將工程改造ZFP的有效靶向能力與切割域(或切割半域)結(jié)合,以使雙鏈斷裂特異性靶向基因組中需要插入外源序列的區(qū)域。為了改變?nèi)旧w序列,不一定需要將整個(gè)供體序列拷貝到染色體中,只要拷貝的供體序列能導(dǎo)致所需的序列改變。同源重組插入供體序列的效率與細(xì)胞DNA中雙鏈斷裂和需要重組的位點(diǎn)之間的距離逆相關(guān)。換言之,當(dāng)雙鏈斷裂更接近需要重組的位點(diǎn)時(shí),觀察到較高的同源重組效率。在沒(méi)有預(yù)先確定準(zhǔn)確的重組位點(diǎn)(如所需重組可發(fā)生在基因組序列的某間隔中)時(shí),應(yīng)選擇供體核酸的長(zhǎng)度和序列以及切割位點(diǎn),以獲得所需的重組。在設(shè)計(jì)所需重組以改變基因組序列中單個(gè)核苷酸對(duì)序列時(shí),可在該核苷酸對(duì)兩側(cè)10,000個(gè)核苷酸內(nèi)切割細(xì)胞染色質(zhì)。在某些實(shí)施方式中,在序列待改變的核苷酸對(duì)兩側(cè)1,000、500、200、100、90、80、70、60、50、40、30、20、10、5或2個(gè)核苷酸,或2-1,000個(gè)核苷酸之間的任何整數(shù)值內(nèi)切割。如上所述,由各結(jié)合位點(diǎn)最接近其它結(jié)合位點(diǎn)的邊緣測(cè)定,各自含有鋅指結(jié)合域和切割半域的兩種融合蛋白的結(jié)合位點(diǎn)可能相隔5-8或15-18個(gè)核苷酸,并在結(jié)合位點(diǎn)之間切割。無(wú)論在結(jié)合位點(diǎn)之間的單個(gè)位點(diǎn)或多個(gè)位點(diǎn)切割都不重要,因?yàn)榍谐幕蚪M序列已被供體序列取代。因此,為了通過(guò)靶向重組有效改變單個(gè)核苷酸對(duì)的序列,結(jié)合位點(diǎn)之間區(qū)域的中點(diǎn)在該核苷酸對(duì)(兩側(cè))的10,000個(gè)核苷酸內(nèi),優(yōu)選在l,OOO個(gè)核苷酸、或500個(gè)核苷酸、或200個(gè)核苷酸、或100個(gè)核苷酸、或50個(gè)核苷酸、或20個(gè)核苷酸、或10個(gè)核苷酸、或5個(gè)核苷酸、或2個(gè)核苷酸、或1個(gè)核苷酸內(nèi)、或在感興趣核苷酸對(duì)外。在某些實(shí)施方式中,同源性染色體可用作供體多核苷酸。因此,例如,可通過(guò)工程改造融合蛋白使之能結(jié)合和切割一條染色體上的突變序列、但不切割同源染色體上的野生型序列,而校正雜合子中的突變。攜帶突變的染色體上的雙鏈斷裂刺激基于同源性的"基因轉(zhuǎn)變"過(guò)程,此過(guò)程中同源染色體的野生型序列拷貝到切割的染色體中,從而恢復(fù)兩個(gè)拷貝的野生型序列。還提供了可提高靶向重組水平的方法和組合物,包括但不限于采用其它ZFP-功能域融合物來(lái)激活參與同源重組基因的表達(dá),這些基因例如,RAD52異位顯性組的成員(如WflW0、iA!必7、ifl必IB、ia&7C、ia必ID、Wa必2、ia必4B、Afre//、義iCC2、義iCC3)、產(chǎn)物能與上述基因產(chǎn)物相互作用的基因(如BRCA1、BRCA2)和/或NBS1復(fù)合物中的基因。相似的,可采用ZFP功能域融合物,結(jié)合本文所述的方法和組合物來(lái)抑制參與非同源末端連接的基因(如Ku70/80、XRCC4、聚(ADP核糖)聚合酶,DNA連接酶4)的表達(dá)。參見(jiàn)例如,Yanez等(1998)GeneTherapy5:149-159;Hoeijmakers(2001)Atowre411:366-374;Johnson等(2001)7>ara.29:196-201;Tauchi等(2002)(9"coge"e21:8967-8980。利用鋅指結(jié)合域與功能域之間的融合物激活和抑制基因表達(dá)的方法參見(jiàn)例如,共有美國(guó)專利6,534,261;6,824,978和6,933,113。其它抑制方法包括采用靶向待抑制基因序列的反義寡核苷酸和/或小干擾RNA(siRNA或RNAi)?;蛘?,或此外,可利用激活參與同源重組的基因產(chǎn)物表達(dá)、這些蛋白質(zhì)(或其功能片段)與靶向感興趣區(qū)域的鋅指結(jié)合域的融合物,將這些蛋白(重組蛋白)征集到感興趣區(qū)域提高其局部濃度,進(jìn)一步刺激同源重組過(guò)程。或者,上述參與同源重組的多肽(或其功能片段)可以是含有鋅指結(jié)合域、切割域(或切割半域)和重組蛋白(或其功能片段)的三體融合蛋白的一部分??捎糜谏鲜龇椒ê徒M合物的參與基因轉(zhuǎn)變和重組相關(guān)染色質(zhì)重塑的其它蛋白質(zhì),包括組蛋白乙?;D(zhuǎn)移酶(如Esalp、Tip60)、組蛋白甲基轉(zhuǎn)移酶(如Dotlp)、組蛋白激酶和組蛋白磷酸酶。已報(bào)道,p53蛋白在抑制同源重組(HR)中起到核心作用。參見(jiàn)例如,Valerie等(2003)O"coge"e22:5792-5812;Janz等(2002)(9"coge"e21:5929-5933。例如,p53缺陷型人腫瘤細(xì)胞系中HR的發(fā)生率比原代人成纖維細(xì)胞高IO,OOO倍,與功能性p53相比,含有無(wú)功能p53的腫瘤細(xì)胞中HR的發(fā)生率提高100倍。Mekeel等(1997)CVicoge"e14:1847-1857。此外,p53顯性負(fù)突變體的過(guò)度表達(dá)導(dǎo)致自發(fā)性重組增加20倍。Bertrand等(1997)O"coge"e14:1117-1122。對(duì)不同p53突變的分析顯示,p53在轉(zhuǎn)錄轉(zhuǎn)移活化和Gl細(xì)胞周期檢查點(diǎn)控制中的作用可與其參與HR分開(kāi)。Saintigny等(1999)(9"coge"e18:3553-3563;Boehden等(2003)(9"coge"e22:4111-4117。因此,下調(diào)p53活性可用于提高采用本文所述的方法和組合物進(jìn)行靶向同源重組的效率。可采用任何方法下調(diào)p53活性,包括但不限于按照(如)共有美國(guó)專利號(hào)6,534,261所述的方法共轉(zhuǎn)染和過(guò)度表達(dá)p53顯性負(fù)突變體或靶向抑制p53基因表達(dá)。當(dāng)同源性驅(qū)動(dòng)的修復(fù)過(guò)程活性最大時(shí),可通過(guò)將細(xì)胞阻滯在細(xì)胞周期的G2期,進(jìn)一步提高含有鋅指/核酸酶融合分子和供體DNA分子細(xì)胞中靶向重組的效率。可通過(guò)多種方式實(shí)現(xiàn)這種阻滯。例如,可采用(如)影響細(xì)胞周期進(jìn)展的藥物、化合物和/或小分子處理細(xì)胞,使細(xì)胞阻滯在G2期。這種類型的示范性分子包括但不限于影響微管聚合的化合物(如長(zhǎng)春堿、諾考達(dá)唑、泰素)、與DNA相互作用的化合物(如順鉑(II)二胺二氯化物、順鉑、多柔比星)和/或影響DNA合成的化合物(如胸苷、羥基脲、L-含羞草堿、依托泊甙、5-氟尿嘧啶)。通過(guò)采用改變?nèi)旧|(zhì)結(jié)構(gòu)、從而使得細(xì)胞重組機(jī)器更易達(dá)到基因組DNA的組蛋白脫乙酰酶(HDAC)抑制劑(如丁酸鈉、曲古抑菌素A),來(lái)進(jìn)一步提高重組效率。其它細(xì)胞周期阻滯方法包括(例如),將編碼抑制CDK細(xì)胞周期激酶活性的蛋白的cDNA引入細(xì)胞或?qū)⒛軌蚣せ钤摰鞍拙幋a基因表達(dá)的工程改造ZFP引入細(xì)胞,從而過(guò)度表達(dá)該蛋白。還可(例如)采用RNAi法(如美國(guó)專利號(hào)6,506,559)或?qū)⒛芤种茀⑴c細(xì)胞周期進(jìn)展的一種或多種基因(如細(xì)胞周期蛋白和/或CDK基因)的表達(dá)的工程改造ZFP引入細(xì)胞,來(lái)抑制細(xì)胞周期蛋白和CDK的活性,從而實(shí)現(xiàn)細(xì)胞周期阻滯。參見(jiàn)例如,共有美國(guó)專利號(hào)6,534,261中用于調(diào)節(jié)基因表達(dá)的工程改造鋅指蛋白的合成方法?;蛘撸谀承┣闆r下,在不存在供體多核苷酸的情況下(優(yōu)選在S或G2期)進(jìn)行靶向切割和在同源染色體之間進(jìn)行重組。篩選促進(jìn)同源重組的細(xì)胞因子的方法由于同源重組是需要修飾DNA末端和使幾種細(xì)胞因子征集到蛋白質(zhì)復(fù)合物中的多步驟過(guò)程,所以可加入一種或多種外源性因子,以及供體DNA和編碼鋅指-切割域融合物的載體來(lái)促進(jìn)靶向同源重組。鑒定這種因子的示范性方法采用微陣列(如阿非麥克斯基因芯片(AffymetrixGeneChipf陣歹ij)分析基因表達(dá),以比較不同細(xì)胞的mRNA表達(dá)模式。例如,可分析在供體DNA和鋅指-切割域融合物存在下刺激雙鏈斷裂-驅(qū)動(dòng)同源重組的能力較高的細(xì)胞(沒(méi)有輔助或在己知能提高基因校正水平的條件下)的基因表達(dá)模式,與缺少這種能力的細(xì)胞作比較。從而鑒定以與同源重組水平提高直接相關(guān)的方式上調(diào)或下調(diào)的基因,可將其克隆到任何一種表達(dá)載體中。這些表達(dá)構(gòu)建物可與鋅指-切割域融合物和供體構(gòu)建物一起共同轉(zhuǎn)染,以產(chǎn)生實(shí)現(xiàn)高效同源重組的改進(jìn)方法?;蛘?,可采用調(diào)節(jié)(激活或抑制)一種或多種這類基因的表達(dá)的工程改造鋅指蛋白適當(dāng)調(diào)節(jié)這類基因的表達(dá)。參見(jiàn)例如,共有美國(guó)專利號(hào)6,534,261中用于調(diào)節(jié)基因表達(dá)的工程改造鋅指蛋白的合成方法。例如,觀察到用供體DNA和編碼鋅指-切割域融合物的質(zhì)粒轉(zhuǎn)染時(shí),實(shí)施例9和圖27所示的實(shí)驗(yàn)中獲得的不同克隆具有范圍廣泛的同源重組頻率。因此,可將靶向重組頻率高的克隆基因表達(dá)與頻率低的克隆作比較,而鑒定前一克隆的獨(dú)特表達(dá)模式。例如,采用細(xì)胞周期抑制劑(如諾考達(dá)唑或長(zhǎng)春堿,參見(jiàn)例如,實(shí)施例11、14和15)的研究證明,阻滯在細(xì)胞周期G2期的細(xì)胞發(fā)生同源重組的頻率較高,這表明負(fù)責(zé)同源重組的細(xì)胞因子可能在G2期優(yōu)先表達(dá)或有活性。鑒定這些因子的一種方式是比較穩(wěn)定轉(zhuǎn)染的HEK293細(xì)胞克隆(如克隆T18與克隆T7)之間以高和低水平校正基因的mRNA表達(dá)模式。在對(duì)使細(xì)胞阻滯在G2期的化合物的反應(yīng)中,在這些細(xì)胞系之間進(jìn)行相似比較。鑒定、克隆以較高速率進(jìn)行同源重組(沒(méi)有輔助或響應(yīng)于使細(xì)胞阻滯在G2期的化合物)的細(xì)胞中差異表達(dá)的候選基因,并將其再次引入細(xì)胞,以確定它們的表達(dá)是否足以重現(xiàn)提高的頻率?;蛘?,采用工程改造的鋅指轉(zhuǎn)錄因子激活所述候選基因的表達(dá),如共有的美國(guó)專利號(hào)6,534,261所述。表達(dá)載體可將編碼一種或多種ZFP或ZFP融合蛋白的核酸克隆入載體,以轉(zhuǎn)化入原核或真核細(xì)胞進(jìn)行復(fù)制和/或表達(dá)。載體可以是原核載體如質(zhì)粒,或穿梭載體、昆蟲(chóng)載體或真核載體。也可將編碼ZFP的核酸克隆入表達(dá)載體中,以給予植物細(xì)胞、動(dòng)物細(xì)胞、真菌細(xì)胞、細(xì)菌細(xì)胞或原生動(dòng)物細(xì)胞,動(dòng)物細(xì)胞優(yōu)選哺乳動(dòng)物細(xì)胞或人細(xì)胞。為了表達(dá)克隆的基因或核酸,一般將編碼ZFP或ZFP融合蛋白的序列亞克隆入含有啟動(dòng)子的表達(dá)載體中以指導(dǎo)轉(zhuǎn)錄。本領(lǐng)域熟知合適的細(xì)菌和真核啟動(dòng)子,參見(jiàn)例如Sambrook等,MolecularCloning,ALaboratoryManual(分子克隆,實(shí)驗(yàn)室手冊(cè))(第2版,1989;第三版,2001);Kriegler,Ge"eam/五x戸肌'o".'丄fl60rato7Af朋M/(基因轉(zhuǎn)移和表達(dá)實(shí)驗(yàn)室手冊(cè))(1990);《新編分子生物學(xué)實(shí)驗(yàn)指南》(Ausubel等,同上)。用于表達(dá)ZFP的細(xì)菌表達(dá)系統(tǒng)可獲自(如)大腸桿菌(Kco//)、芽孢桿菌CSac/〃船^.)和沙門(mén)菌(Sa/mo"e〃fl)(Palva等,22:229-235(1983))??少?gòu)得這些表達(dá)系統(tǒng)的試劑盒。本領(lǐng)域技術(shù)人員熟知用于哺乳動(dòng)物細(xì)胞、酵母和昆蟲(chóng)細(xì)胞的真核表達(dá)系統(tǒng),它們也可購(gòu)得。用于指導(dǎo)編碼ZFP的核酸表達(dá)的啟動(dòng)子取決于具體應(yīng)用。例如,一般將強(qiáng)效組成型啟動(dòng)子用于表達(dá)和純化ZFP。相反,當(dāng)體內(nèi)給予ZFP用于基因調(diào)節(jié)時(shí),采用組成型或誘導(dǎo)型啟動(dòng)子,這取決于ZFP的具體用途。此外,用于給予ZFP的優(yōu)選啟動(dòng)子可以是弱啟動(dòng)子,如HSVTK或具有相似活性的啟動(dòng)子。一般地,該啟動(dòng)子也可包括對(duì)轉(zhuǎn)移活化起反應(yīng)的元件,如缺氧反應(yīng)元件、Gal4反應(yīng)元件、lac阻抑物反應(yīng)元件和小分子控制系統(tǒng)如tet-調(diào)節(jié)系統(tǒng)和RU-486系統(tǒng)(參見(jiàn)例如Gossen和Bujard,尸M4S89:5547(1992);Oligino等,TTzer.5:491-496(1998);Wang等,7Tzer4:432-441(1997);Neering等,祝ood88:1147-1155(1996);和Rendahl等,A^.5/o&c/wo/.16:757-761(1998))。還可采用MNDU3啟動(dòng)子,它偏愛(ài)在CD34+造血干細(xì)胞中有活性。除啟動(dòng)子外,表達(dá)載體包含的轉(zhuǎn)錄單元或表達(dá)盒一般含有在原核或真核宿主細(xì)胞中表達(dá)核酸所需的所有其它元件。因此,表達(dá)盒一般含有操作性連接于(例如)編碼ZFP的核酸序列的啟動(dòng)子和(例如)轉(zhuǎn)錄物的有效聚腺苷酸化、轉(zhuǎn)錄終止、核糖體結(jié)合位點(diǎn)或翻譯終止所需的信號(hào)。該盒的其它元件可包括例如,增強(qiáng)子和異源剪接信號(hào)。根據(jù)ZFP的所需用途,如在植物、動(dòng)物、細(xì)菌、真菌、原生動(dòng)物等中表達(dá)(參見(jiàn)下述表達(dá)載體)選擇用于將遺傳信息轉(zhuǎn)運(yùn)到細(xì)胞內(nèi)的具體表達(dá)載體。標(biāo)準(zhǔn)的細(xì)菌表達(dá)載體包括質(zhì)粒如基于pBR322、pSKF、pET23D的質(zhì)粒,以及市售融合表達(dá)系統(tǒng)如GST和LacZ。一種示范性融合蛋白是麥芽糖結(jié)合蛋白"MBP。"這種融合蛋白用于純化ZFP。也可將表位標(biāo)簽如c-myc或FLAG加入重組蛋白,以提供分離、監(jiān)測(cè)表達(dá)以及監(jiān)測(cè)細(xì)胞和亞細(xì)胞定位的方便方法。含有真核病毒的調(diào)控元件的表達(dá)載體常常用于真核表達(dá)載體,如SV40載體、乳頭瘤病毒載體和衍生自EB病毒的載體。其它示范性真核載體包括pMSG、pAV009/A+、pMTO10/A+、pMAMneo-5、桿狀病毒pDSVE和能在以下啟動(dòng)子的指導(dǎo)下表達(dá)蛋白的任何其它載體SV40早期啟動(dòng)子、SV40晚期啟動(dòng)子、金屬硫蛋白啟動(dòng)子、鼠乳房腫瘤病毒啟動(dòng)子、勞氏肉瘤病毒啟動(dòng)子、多角體蛋白啟動(dòng)子或經(jīng)證明能有效在真核細(xì)胞中表達(dá)的啟動(dòng)子。一些表達(dá)系統(tǒng)含有用于選擇穩(wěn)定轉(zhuǎn)染細(xì)胞系的標(biāo)記,如胸苷激酶、潮霉素B磷酸轉(zhuǎn)移酶和二氫葉酸還原酶。高產(chǎn)表達(dá)系統(tǒng)也是合適的,如在昆蟲(chóng)細(xì)胞中采用桿狀病毒載體,其中ZFP編碼序列在多角體蛋白啟動(dòng)子或其它強(qiáng)效桿狀病毒啟動(dòng)子的指導(dǎo)下。表達(dá)載體一般包括的元件也包括在大腸桿菌中起作用的復(fù)制子、用于選擇攜帶重組質(zhì)粒的細(xì)菌的編碼抗生素抗性的基因和用于插入重組序列的質(zhì)粒非必需區(qū)中的獨(dú)特限制性位點(diǎn)。用標(biāo)準(zhǔn)轉(zhuǎn)染方法產(chǎn)生表達(dá)大量蛋白的細(xì)菌、哺乳動(dòng)物、酵母或昆蟲(chóng)細(xì)胞系,然后用標(biāo)準(zhǔn)技術(shù)純化這些蛋白(參見(jiàn)例如Colley等,脂.C/z亂264:17619-17622(1989);G"/cfeto尸rafe/"尸wnyca/o"(蛋白質(zhì)純化指南),MethodsinEnzymology(酶學(xué)方法),第182巻(Deutscher編,1990))。真核和原核細(xì)胞的轉(zhuǎn)化按照標(biāo)準(zhǔn)技術(shù)進(jìn)行(參見(jiàn)例如Morrison,丄S虹132:349-351(1977);Clark-Curtiss和Curtiss,MethodsinEnzymology(酶學(xué)方法)101:347-362(Wu等編,1983)。可釆用將外來(lái)核苷酸序列引入宿主細(xì)胞的任何熟知方法。它們包括采用磷酸l丐轉(zhuǎn)染、聚凝胺(polybrene)、原生質(zhì)體融合、電穿孔、超聲方法(如聲穿孔)、脂質(zhì)體、顯微注射、裸DNA、質(zhì)粒載體、病毒載體、附加體和整合體(integrative),以及將克隆的基因組DNA、cDNA、合成DNA或其它外來(lái)遺傳物質(zhì)引入宿主細(xì)胞的任何其它熟知方法(參見(jiàn)例如Sambrook等,同上)。僅需要所用具體遺傳工程方法能夠?qū)⒅辽僖环N基因成功引入能夠表達(dá)所選蛋白的宿主細(xì)胞中。編碼融合蛋白的核酸和細(xì)胞遞送可采用基于病毒和非病毒的常規(guī)基因轉(zhuǎn)移方法將編碼工程改造的ZFP的核酸引入細(xì)胞(如哺乳動(dòng)物細(xì)胞)和靶組織中。也可采用這種方法在體外將編碼ZFP的核酸給予細(xì)胞。在某些實(shí)施方式中,給予編碼ZFP的核酸進(jìn)行體內(nèi)或離體基因治療應(yīng)用。非病毒載體遞送系統(tǒng)包括DNA質(zhì)粒、裸核酸和與遞送載體如脂質(zhì)體或泊洛沙姆復(fù)合的核酸。病毒載體遞送系統(tǒng)包括DNA和RNA病毒,遞送給細(xì)胞后它們成為附加體或整合入基因組?;蛑委煼椒ǖ木C述參見(jiàn)Anderson,256:808-813(1992);Nabel和Feigner,77S7EO/11:211-217(1993);Mitani和Caskey,11:162-166(1993);Dillon,7Y^EC/n1:167-175(1993);Miller,淑匿357:455-460(1992);VanBrunt,腸fec/mo/ogy6(10):1149陽(yáng)1154(1988);Vigne,ie加ra"veA^e膨/。gyam/7Vewroyc/e"ce8:35-36(1995);Kremer和Perricaudet,5h似/zAfecfca/5w〃",w51(l):31-44(1995);Haddada等,Cw廳ew/7bp/cs/"Af/craZ,o/ogy/www"o/o^(微生物禾口免疫學(xué)前沿)Doerfler和B(ihm(編)(1995);和Yu等,7T^ra;^1:13-26(1994)。編碼工程改造ZFP的核酸的非病毒遞送方法包括電穿孔、脂轉(zhuǎn)染、顯微注射、生物射彈、病毒體、脂質(zhì)體、免疫脂質(zhì)體、聚陽(yáng)離子或脂質(zhì):核酸偶聯(lián)物、裸DNA、人工病毒顆粒和試劑增強(qiáng)的DNA攝取。也可采用(例如)瑞星公司(Rich-Mar)的索尼龍2000系統(tǒng)(Sonitron2000system)進(jìn)行聲穿孔,以遞送核酸。其它示范性核酸遞送系統(tǒng)包括德國(guó)科隆(Cologne,Germany)的艾瑪科薩生物系統(tǒng)公司(AmaxaBiosystems)、馬里蘭州羅克維爾(Rockville,Maryland)的馬克薩特公司(Maxcyte,Inc.)和馬薩諸塞州浩立司頓(Holliston,MA)的BTX分子遞送系統(tǒng)公司(BTXMolecularDeliverySystems)提供的系統(tǒng)。脂轉(zhuǎn)染的描述參見(jiàn)例如US5,049,386、US4,946,787和US4,897,355,脂轉(zhuǎn)染試劑是市售的(如川司菲坦(Transfectam)TM和利普菲汀(Lipofectin)TM)。適用于多核苷酸的有效受體識(shí)別脂轉(zhuǎn)染的陽(yáng)離子和中性脂質(zhì)包括Feigner,WO91/17424,WO91/16024??梢赃f送給細(xì)胞(離體給予)或靶組織(體內(nèi)給予)。脂質(zhì):核酸復(fù)合物,包括耙向脂質(zhì)體如免疫脂質(zhì)復(fù)合物的制備是本領(lǐng)域技術(shù)人員熟知的(參見(jiàn)例如Crystal,&/e"ce270:404-410(1995);Blaese等,Ca"cer77zm2:291-297(1995);Behr等,所oco"y"gWeCAe/w.5:382-389(1994);Remy等,5〖o(jì)co"乂wgafe5:647-654(1994);Gao等,r/zerapy2:710-722(1995);Ahmad等,Ca"cw52:4817-4820(1992);美國(guó)專利號(hào)4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028和4,946,787)。用于遞送編碼工程改造ZFP的核酸的基于RNA或DNA病毒的系統(tǒng)利用了能將病毒靶向體內(nèi)特定細(xì)胞和能將病毒負(fù)載運(yùn)輸至細(xì)胞核的高度進(jìn)化過(guò)程。病毒載體可直接給予患者(體內(nèi)),或用它們體外處理細(xì)胞,然后將修飾的細(xì)胞給予患者(離體)。遞送ZFP的基于病毒的常規(guī)系統(tǒng)包括但不限于用于基因轉(zhuǎn)移的逆轉(zhuǎn)錄病毒、慢病毒、腺病毒、腺伴隨病毒、牛痘和單純皰疹病毒載體。用逆轉(zhuǎn)錄病毒、慢病毒和腺伴隨病毒基因轉(zhuǎn)移方法整合入宿主基因組,常常導(dǎo)致插入的轉(zhuǎn)基因長(zhǎng)期表達(dá)。此外,在許多不同細(xì)胞類型和靶組織中觀察到高轉(zhuǎn)導(dǎo)效率??赏ㄟ^(guò)摻入外來(lái)的包膜蛋白、擴(kuò)展靶細(xì)胞的潛在靶群體改變逆轉(zhuǎn)錄病毒的嗜性(tropism)。慢病毒載體是能夠轉(zhuǎn)導(dǎo)或感染非分裂細(xì)胞的逆轉(zhuǎn)錄病毒載體,一般產(chǎn)生高病毒效價(jià)。逆轉(zhuǎn)錄病毒基因轉(zhuǎn)移系統(tǒng)的選擇取決于靶組織。逆轉(zhuǎn)錄病毒載體由順式作用長(zhǎng)末端重復(fù)序列組成,包裝容量高達(dá)6-10kb的外來(lái)序列。最小的順式作用LTR足以復(fù)制和包裝載體,然后用載體將治療基因整合入靶細(xì)胞,以提供永久的轉(zhuǎn)基因表達(dá)。廣泛采用的逆轉(zhuǎn)錄病毒載體包括基于鼠白血病病毒(MuLV)、長(zhǎng)臂猿白血病病毒(GaLV)、猿免疫缺陷病毒(SIV)、人體免疫缺陷病毒(HIV)及其組合的載體(參見(jiàn)例如Buchscher等,乂66:2731-2739(1992);Johann等J66:1635-1640(1992);Sommerfelt等,P7ra/.176:58-59(1990);Wilson等,/63:2374-2378(1989);Miller等,J.P7ra/.65:2220-2224(1991);PCT/US94/05700)。在優(yōu)選瞬時(shí)表達(dá)ZFP融合蛋白的應(yīng)用中,可采用基于腺病毒的系統(tǒng)?;谙俨《镜妮d體能夠在許多細(xì)胞類型中非常高效地轉(zhuǎn)導(dǎo),并且不需要細(xì)胞分裂。用這種載體獲得了高效價(jià)和高水平表達(dá)??稍谙鄬?duì)簡(jiǎn)單的系統(tǒng)中大量產(chǎn)生這種載體。腺伴隨病毒("AAV")載體也用于以靶核酸轉(zhuǎn)導(dǎo)細(xì)胞,如在體外產(chǎn)生核酸和肽,以及用于體內(nèi)和離體基因治療方法(參見(jiàn)例如West等,Pra/ogy160:38-47(1987);美國(guó)專利號(hào)4,797,368;WO93/24641;Kotin,ifwma"T7iera/^5:793-801(1994);Muzyczka,J.C//"./we沈94:1351(1994)。許多文獻(xiàn),包括美國(guó)專利號(hào)5,173,414;Tratschin等,嵐Ce〃.編.5:3251-3260(1985);Tratschin等,Mo/.Ce〃,脂.4:2072-2081(1984);He畫(huà)nat和Muzyczka,/WW81:6466-6470(1984);和Samulski等,F(xiàn)ra/.63:03822-3828(1989)中描述了重組AAV載體的構(gòu)建。在臨床試驗(yàn)中,目前至少有六種病毒載體方法可用于基因轉(zhuǎn)移,它們利用的方法包括用插入輔助細(xì)胞系的基因補(bǔ)充載體缺陷,以產(chǎn)生轉(zhuǎn)導(dǎo)物質(zhì)。pLASN和MFG-S是用于臨床試驗(yàn)的逆轉(zhuǎn)錄病毒載體的例子(Dunbar等,歷ood85:3048-305(1995);Kohn等,M^/.1:1017-102(1995);Malech等,iWAS94:2212133-12138(1997))。PA317/pLASN是用于基因治療試驗(yàn)的第一治療載體。(Blaese等,Sc/e"ce270:475-480(1995))。在MFG-S包裝載體中觀察到的轉(zhuǎn)導(dǎo)效率為50%或更高。(Ellem等,/mmw"o//mww"oAer44(1):10-20(1997);Dranoff等,//wm.T7w.1:111-2(1997)。重組腺伴隨病毒載體(rAAV)是有希望的另一種基因遞送系統(tǒng),它基于缺陷型和非致病性細(xì)小病毒2型腺伴隨病毒病毒。所有載體都衍生自僅保留側(cè)接于轉(zhuǎn)基因表達(dá)盒的AAV145bp末端反向重復(fù)序列的質(zhì)粒。由于整合入轉(zhuǎn)導(dǎo)細(xì)胞的基因組中,有效的基因轉(zhuǎn)移和穩(wěn)定的轉(zhuǎn)基因遞送是這種載體系統(tǒng)的關(guān)鍵特征。(Wagner等,351:91171702-3(1998),Kearns等,G認(rèn)77^9:748-55(1996))??僧a(chǎn)生高效價(jià)的復(fù)制缺陷型重組腺病毒載體(Ad),它們?nèi)菀赘腥驹S多不同細(xì)胞類型。工程改造大多數(shù)腺病毒載體,以使轉(zhuǎn)基因替代其AdEla、Elb和/或E3基因;隨后在反式提供缺失的基因功能的人293細(xì)胞中增殖復(fù)制該缺陷型載體。Ad載體可體內(nèi)轉(zhuǎn)導(dǎo)多種組織類型,包括非分裂的分化細(xì)胞,如肝、腎和肌肉中的細(xì)胞。常規(guī)Ad載體具有大攜帶容量。臨床試驗(yàn)所用Ad載體的一個(gè)例子包括肌肉內(nèi)注射抗腫瘤免疫的多核苷酸治療(Sterman等,//w肌7%"7:1083-9(1998))。腺病毒載體用于臨床試驗(yàn)的基因轉(zhuǎn)移的其它例子包括Rosenecker等,/"/e"/o"24:15-10(1996);Sterman等'/^w.T7zw9:71083-1089(1998);Welsh等'Z/wm.7%"2:205-18(1995);Alvarez等,//wm.7Tz^:5:597-613(1997);Topf等,77^5:507-513(1998);Sterman等,/f扁,G認(rèn)77^7:1083-1089(1998)。用包裝細(xì)胞形成能夠感染宿主細(xì)胞的病毒顆粒。這種細(xì)胞包括293細(xì)胞、v2細(xì)胞或PA317細(xì)胞,293細(xì)胞能包裝腺病毒,v(/2細(xì)胞或PA317細(xì)胞能包裝逆轉(zhuǎn)錄病毒。通常用將核酸載體包裝到病毒顆粒中的生產(chǎn)細(xì)胞系產(chǎn)生用于基因治療的病毒載體。載體一般包含包裝和隨后整合入宿主(如果可行)所需的最小病毒序列,其它病毒序列被編碼待表達(dá)蛋白的表達(dá)盒替代。包裝細(xì)胞系反式提供丟失的病毒功能。例如,用于基因治療的AAV載體一般僅具有包裝和整合入宿主基因組所必需的AAV基因組的末端反向重復(fù)(ITR)序列。將病毒DNA包裝到含有輔助質(zhì)粒的細(xì)胞系中,該輔助質(zhì)粒編碼其它AAV基因,即r印和c印,但沒(méi)有ITR序列。也用腺病毒作為輔助病毒感染該細(xì)胞系。輔助病毒促進(jìn)AAV載體的復(fù)制和輔助質(zhì)粒中AAV基因的表達(dá)。由于缺少I(mǎi)TR序列,不能包裝大量的輔助質(zhì)粒??赏ㄟ^(guò)(例如)熱處理降低腺病毒污染,腺病毒對(duì)熱處理的敏感性高于AAV。在許多基因治療應(yīng)用中,需要以高度特異性將基因治療載體遞送至特定組織類型。因此,可修飾病毒載體,使其通過(guò)表達(dá)配體而對(duì)給定細(xì)胞具有特異性,該配體能與病毒外表面的病毒外殼蛋白形成融合蛋白。選擇配體應(yīng)對(duì)已知存在于感興趣細(xì)胞類型上的受體具有親和力。例如Han等,尸rac.A^/.^cat/.f/5L492:9747-9751(1995)的報(bào)道,可修飾莫洛尼鼠白血病病毒使之表達(dá)融合于gp70的人異調(diào)蛋白,該重組病毒能感染表達(dá)人表皮生長(zhǎng)因子受體的某些人乳腺癌細(xì)胞。這個(gè)原則可延伸至其它病毒-靶細(xì)胞對(duì),這種對(duì)中靶細(xì)胞表達(dá)一種受體,而病毒表達(dá)包含該細(xì)胞表面受體的配體的融合蛋白。例如,可工程改造絲狀噬菌體,使之呈現(xiàn)對(duì)基本上任何所選細(xì)胞受體都具有特異性結(jié)合親和力的抗體片段(如FAB或Fv)。雖然上述描述主要用于病毒載體,但同樣的原理也可用于非病毒載體??晒こ谈脑爝@些載體,使其含有有利于特定耙細(xì)胞攝取的特異性攝取序列??赏ㄟ^(guò)給予患者個(gè)體,一般是通過(guò)全身給藥(如靜脈內(nèi)、腹膜內(nèi)、肌肉內(nèi)、皮下或顱內(nèi)輸注)或局部應(yīng)用體內(nèi)遞送基因治療載體,如下所述。或者,可將載體離體遞送至細(xì)胞中,例如,從患者個(gè)體體內(nèi)取出細(xì)胞(如淋巴細(xì)胞、抽吸的骨髓、活組織檢查樣品)或通用供體造血干細(xì)胞,然后,通常在選擇摻入該載體的細(xì)胞后將該細(xì)胞再植入患者體內(nèi)。本領(lǐng)域技術(shù)人員熟知用于診斷、研究或基因治療的離體細(xì)胞轉(zhuǎn)染方法(如將轉(zhuǎn)染細(xì)胞再輸注到宿主生物體中)。在一個(gè)優(yōu)選實(shí)施方式中,細(xì)胞分離自對(duì)象生物體,用ZFP核酸(基因或cDNA)轉(zhuǎn)染,再輸注回對(duì)象生物體(如患者)內(nèi)。本領(lǐng)域技術(shù)人員熟知適用于離體轉(zhuǎn)染的各種細(xì)胞類型(參見(jiàn)例如Freshney等,Cw/ft^o/Jm'ma/Ce&,爿Ma歴a/o/5aWc7k^m々we(動(dòng)物細(xì)胞培養(yǎng),基本技術(shù)手冊(cè))(第3版,1994)),其中引用的參考文獻(xiàn)中關(guān)于如何分離和培養(yǎng)患者細(xì)胞的論述)。在一個(gè)實(shí)施方式中,在細(xì)胞轉(zhuǎn)染和基因治療的離體方法中釆用干細(xì)胞。采用干細(xì)胞的優(yōu)點(diǎn)是它們可在體外分化為其它細(xì)胞類型,或者可將其引入哺乳動(dòng)物(如細(xì)胞供體)中,隨后遷移到骨髓中。用細(xì)胞因子如GM-CSF、IFN-y和TNF-a使CD34+細(xì)胞體外分化為臨床上重要的免疫細(xì)胞類型的方法是己知的(參見(jiàn)Inaba等,丄五xp.M^/.176:1693-1702(1992》。用已知方法分離用于轉(zhuǎn)導(dǎo)和分化的干細(xì)胞。例如,用結(jié)合不想要細(xì)胞,如CD4十和CD8+(T細(xì)胞)、CD45+(泛B細(xì)胞(panBcell))、GR-1(粒細(xì)胞)和Iad(分化的抗原遞呈細(xì)胞)的抗體淘選骨髓細(xì)胞,從而分離骨髓細(xì)胞中的干細(xì)胞(參見(jiàn)Inaba等,/£x/7.Met/.176:1693-1702(1992))。也可將含有治療性ZFP核酸的載體(如逆轉(zhuǎn)錄病毒、腺病毒、脂質(zhì)體等)直接給予生物體進(jìn)行體內(nèi)細(xì)胞轉(zhuǎn)導(dǎo)。或者,可給予裸DNA。通過(guò)通常用于使分子最終與血液或組織細(xì)胞接觸的途徑進(jìn)行給藥,這些途徑包括但不限于注射、輸注、局部應(yīng)用和電穿孔。已有適合給予這種核酸的方法,它們是本領(lǐng)域技術(shù)人員熟知的,雖然可采用一種以上途徑給予具體組合物,但某具體途徑常常可提供比其它途徑更直接和更有效的反應(yīng)。將DNA引入造血干細(xì)胞的方法參見(jiàn)例如美國(guó)專利5,928,638。用于將轉(zhuǎn)基因引入造血干細(xì)胞,如CD34+細(xì)胞的載體包括35型腺病毒。適用于將轉(zhuǎn)基因引入免疫細(xì)胞(如T細(xì)胞)的載體包括非整合型慢病毒載體。參見(jiàn)例如Ory等(1996)尸rac.A^/.USA93:11382-11388;Dull等(1998)JWra/.72:8463-8471;Zuffery等(1998)Wra/.72:9873-9880;Follenzi等(2000)AtowwGe""/cs25:217-222。藥學(xué)上可接受的運(yùn)載體部分取決于給予的具體組合物,以及用于給予該組合物的具體方法。因此,可采用各種合適的藥物組合物劑型,如下所述(參見(jiàn)例如ie脂'"gto":尸/2armaceW/ca/S"W7C^(雷明頓藥物科學(xué)),第17版,1989)??赏ㄟ^(guò)各種常規(guī)技術(shù)將DNA構(gòu)建物引入所需植物宿主的基因組中。這些技術(shù)的綜述參見(jiàn)例如Weissbach和Weissbach,MeAoA/orP/a^Mo/ecw/ar5/o/ogy(植物分子生物學(xué)方法)(1988,學(xué)術(shù)出版社,紐約)第VIII章,第421-463頁(yè);和Grierson和Corey,尸/a",Mo/ec"/ar所o/ogy(植物分子生物學(xué))(1988,第2版),Blackie,倫敦,第7-9章。例如,可采用諸如植物細(xì)胞原生質(zhì)體的電穿孔和顯微注射等技術(shù)將DNA構(gòu)建物直接引入植物細(xì)胞的基因組DNA中,或者可用生物射彈法,如DNA粒子轟擊將DNA構(gòu)建物直接引入植物組織(參見(jiàn)例如Klein等(1987)A/fl&re327:70-73)?;蛘?,DNA構(gòu)建物可與合適的T-DNA側(cè)接區(qū)組合后引入常規(guī)的根癌土壤桿菌G4gra6a"en'wm^me/flc/em)宿主載體中??茖W(xué)文獻(xiàn)中詳細(xì)描述了根癌土壤桿菌-介導(dǎo)的轉(zhuǎn)化技術(shù),包括去武裝(disarming)和采用雙載體。參見(jiàn)例如Horsch等(1984)Sc/e"ce233:496-498和Fraley等(1983)A^7.^cfldL/5L480:4803。采用雙TDNA載體(Bevan(1984)Wwc.7es,12:871l-8721)或共培育法(Horsch等(1985)&/e"ce227:1229-1231)用細(xì)菌感染細(xì)胞時(shí),根癌土壤桿菌宿主的毒力功能將指導(dǎo)將構(gòu)建物和毗鄰標(biāo)記物插入植物細(xì)胞DNA中。通常,用土壤桿菌04gra6flcfehwm)轉(zhuǎn)化系統(tǒng)工程改造雙子葉植物(Bevan等(1982)^朋.iev.16:357-384;Rogers等(1986)Me^oA^2zymo/.118:627-641)。也可用土壤桿菌轉(zhuǎn)化系統(tǒng)將DNA轉(zhuǎn)化和轉(zhuǎn)移到單子葉植物和植物細(xì)胞中。參見(jiàn)Hemalsteen等(1984)五M50/3:3039-3041;Hooykass-VanSlogteren等(1984)Atowe311:763-764;Grimsley等(1987)A^wre325:1677-179;Boulton等(1989)尸/a^Mo/.歷o/.12:31-40;禾卩Gould等(1991)尸/a"f95:426-434。其它基因轉(zhuǎn)移和轉(zhuǎn)化法包括但不限于通過(guò)轉(zhuǎn)-、聚乙二醇(PEG)-或電穿孔-介導(dǎo)的裸DNA攝取進(jìn)行原生質(zhì)體轉(zhuǎn)化(參見(jiàn)Paszkowski等(1984)£M5<9■/3:2717-2722,Potrykus等(1985)Mo/ec.199:169-177;Fromm等(1985)尸rac.Ato.(cat/.USA82:5824-5828;和Shimamoto(1989)淑置338:274-276)和植物組織的電穿孔(D'Halluin等(1992)尸/aWCe〃4:1495-1505)。植物細(xì)胞轉(zhuǎn)化的其它方法包括顯微注射、碳化硅介導(dǎo)的DNA攝取(Kaeppler等(19卯)尸/"WCe〃^/o故r9:415-418)和微粒轟擊(參見(jiàn)Klein等(1988)Ato.JcW.Scz'.t/W85:4305-4309;和Gordon-Kamm等(19卯)尸/a"Ce//2:603-618)。可采用本文公開(kāi)的方法和組合物將外源性序列插入植物細(xì)胞基因組的預(yù)定位置中。由于引入植物基因組的轉(zhuǎn)基因表達(dá)主要取決于其整合位點(diǎn),所以這點(diǎn)很有用。因此,可通過(guò)耙向重組將編碼(例如)營(yíng)養(yǎng)物、抗生素或治療性分子的基因插入利于表達(dá)的植物基因組區(qū)域中??膳囵B(yǎng)用上述轉(zhuǎn)化技術(shù)產(chǎn)生的轉(zhuǎn)化的植物細(xì)胞,使之再生成具有轉(zhuǎn)化基因型和所需表型的整株植物。這種再生技術(shù)依賴于對(duì)組織生長(zhǎng)培養(yǎng)基中某些植物激素的操縱,一般依賴于與所需核苷酸序列一起引入的抗微生物劑和/或除草劑標(biāo)記。Evans,等,"ProtoplastsIsolationandCulture"(原生質(zhì)體分離和培養(yǎng)),77aw/6oo&o/P/aWCe//a/to"(植物細(xì)胞培養(yǎng)手冊(cè)),第124-176頁(yè),MacmillianPublishingCompany(麥克米蘭出版公司),紐約,1983;禾BBinding,iege"era"ow0/尸/a"&,尸/a^尸ratop/(zyto(植物、植物原生質(zhì)體再生),第21-73頁(yè),CRC出版社,伯克萊屯,1985描述了從培養(yǎng)的原生質(zhì)體再生植物。再生也可獲自植物愈傷組織、外植體、器官、花粉、胚胎或其部分。通常,在Klee等(1987)爿朋.iev.0/尸/朋fP/^.38:467-486中描述了這種再生技術(shù)??衫靡胫参锛?xì)胞的核酸來(lái)賦予基本上任何植物所需的性狀。可用本發(fā)明核酸構(gòu)建物和上述各種轉(zhuǎn)化方法工程改造各種植物和植物細(xì)胞系統(tǒng),使其具有本文所述的所需生理和農(nóng)業(yè)經(jīng)濟(jì)特征。在一個(gè)優(yōu)選實(shí)施方式中,用于工程改造的耙植物和植物細(xì)胞包括但不限于單子葉和雙子葉植物,如農(nóng)作物,包括谷類作物(如小麥、玉米、大米、小米、大麥)、果實(shí)作物(如番茄、蘋(píng)果、梨、草莓、橙)、飼料作物(如苜蓿)、根菜作物(如胡蘿卜、馬鈴薯、甜菜、薯蕷)、葉菜作物(如萵苣、菠菜);開(kāi)花植物(如矮牽?;?、玫瑰、菊花)、針葉樹(shù)和松樹(shù)(如松樹(shù)、冷杉、云杉);植物除污所用植物(如重金屬累積植物);油料作物(如向日葵、油菜籽)和實(shí)驗(yàn)用植物(如擬南芥G4ra6Wo;w&))。因此,所述方法和組合物可廣泛用于各種植物,包括但不限于天門(mén)冬屬0^paragw"、燕麥屬04ve"fl)、蕓苔屬(5raw/cfl)、柑橘屬(C"n^y)、西瓜屬(C"rw〃w力、辣椒屬(Ca;w/cww)、南瓜屬(Cmcw6"")、胡羅卜屬CDawcw力、大豆屬(G7少c/"e)、大麥屬(//o油畫(huà))、萵苣屬CLcicfwca)、番茄屬(Z^co戸s〖cow)、蘋(píng)果屬(Ma/—、木薯屬(M麵7zW)、煙草屬(Wco^wa)、稻屬((9o^a)、鱷梨屬(尸e"ea)、豌豆屬(尸^ww)、梨屬(尸;;my)、李屬(/V,w力、蘿卜屬(iap/z朋w力、黑麥屬(&ca/e)、茄屬0So/a肌m)、高粱屬(Sorg/mm)、小麥屬(7hY/c訓(xùn))、葡萄屬(附/力、豇豆屬(F^"a)和玉蜀黍?qū)?Zea)的種。本領(lǐng)域技術(shù)人員將知道,在表達(dá)盒穩(wěn)定摻入轉(zhuǎn)基因植物并確認(rèn)可操作后,可通過(guò)有性雜交(sexualcrossing)將其引入其它植物。可采用許多標(biāo)準(zhǔn)的育種技術(shù)中的任何一種,這取決于準(zhǔn)備雜交的植物種類。可通過(guò)選擇或篩選工程改造植物物質(zhì)中轉(zhuǎn)化DNA上存在的標(biāo)記基因編碼的性狀來(lái)鑒定和分離轉(zhuǎn)化的植物細(xì)胞、愈傷組織、組織或植物。例如,可在含有抑制量的抗生素或除草劑的培養(yǎng)基上培養(yǎng)工程改造的植物質(zhì)進(jìn)行選擇,轉(zhuǎn)化的基因構(gòu)建物可賦予抗性。而且,也可通過(guò)篩選重組核酸構(gòu)建物上存在的可見(jiàn)標(biāo)記物基因(如p-葡糖醛酸糖苷酶、熒光素酶、B或Cl基因)的活性鑒定轉(zhuǎn)化的植物和植物細(xì)胞。本領(lǐng)域技術(shù)人員熟知這種選擇和篩選方法。也可采用生理和生化方法鑒定含有插入基因構(gòu)建物的植物或植物細(xì)胞轉(zhuǎn)化物。這些方法包括但不限于l)檢測(cè)或測(cè)定重組DNA插入物結(jié)構(gòu)的Southern分析或PCR擴(kuò)增;2)檢測(cè)和檢査基因構(gòu)建物的RNA轉(zhuǎn)錄物的Northern印跡、S1RNA酶保護(hù)、引物延伸或逆轉(zhuǎn)錄酶-PCR擴(kuò)增;3)檢測(cè)酶或核酶活性的酶試驗(yàn),其中所述基因產(chǎn)物由所述基因構(gòu)建物編碼;4)蛋白質(zhì)凝膠電泳、Western印跡技術(shù)、免疫沉淀或酶聯(lián)免疫試驗(yàn),其中基因構(gòu)建物產(chǎn)物是蛋白質(zhì)。也可采用其它技術(shù),如原位雜交、酶染色和免疫染色來(lái)檢測(cè)特定植物器官和組織中重組構(gòu)建物的存在或表達(dá)。本領(lǐng)域技術(shù)人員熟知進(jìn)行所有這些試驗(yàn)的方法??赏ㄟ^(guò)(例如)分離自感興趣組織的RNA(如mRNA)的Northern印跡觀察采用本文所述方法進(jìn)行基因操作的效果。一般地,如果mRNA含量增加,可推定相應(yīng)的內(nèi)源基因表達(dá)速率比以前高。可采用測(cè)定基因和/或CYP74B活性的其它方法??刹捎貌煌愋偷拿冈囼?yàn),這取決于所用底物和檢測(cè)反應(yīng)產(chǎn)物或副產(chǎn)物的增加或減少的方法。此外,可通過(guò)免疫化學(xué)方法,即ELISA、RIA、EIA和本領(lǐng)域技術(shù)人員熟知的其它基于抗體的試驗(yàn),如電泳檢測(cè)試驗(yàn)(與染色或Western印跡一起)測(cè)定表達(dá)CYP74B蛋白的水平。轉(zhuǎn)基因可以在一些植物組織中或某發(fā)育階段選擇性表達(dá),或者,轉(zhuǎn)基因可以在基本上所有植物組織中、基本上整個(gè)生命周期中表達(dá)。然而,也可采用任何組合表達(dá)方式。本發(fā)明也包括上述轉(zhuǎn)基因植物的種子,所述種子含有所述轉(zhuǎn)基因或基因構(gòu)建物。本發(fā)明還包括上述轉(zhuǎn)基因植物的后代、克隆、細(xì)胞系或細(xì)胞,其中所述后代、克隆、細(xì)胞系或細(xì)胞具有所述轉(zhuǎn)基因或基因構(gòu)建物。遞送載體給予多肽化合物,如ZFP融合蛋白的重要因素是保證該多肽能夠穿過(guò)細(xì)胞質(zhì)膜,或細(xì)胞內(nèi)區(qū)室如細(xì)胞核的膜。細(xì)胞膜由脂蛋白雙層組成,它允許小分子非離子親脂性化合物自由通透,本質(zhì)上不允許極性化合物、大分子和治療或診斷物質(zhì)通透。然而,已報(bào)道了一些蛋白和其它化合物如脂質(zhì)體能夠跨細(xì)胞膜轉(zhuǎn)運(yùn)多肽如ZFP。例如"膜轉(zhuǎn)運(yùn)多肽"含有能通過(guò)細(xì)胞膜轉(zhuǎn)運(yùn)的運(yùn)載體的兩性或疏水性氨基酸亞序列。在一個(gè)實(shí)施方式中,同源域蛋白能夠跨細(xì)胞膜轉(zhuǎn)運(yùn)。發(fā)現(xiàn)同源域蛋白的最短可內(nèi)化肽觸角肽(Antennapedia)是該蛋白上氨基酸位置43到58的第三個(gè)螺旋(參見(jiàn)例如Prochiantz,Cwre"〖Qp/"/o"/"A^wra&'o/ogy6:629-634(1996))。發(fā)現(xiàn)信號(hào)肽的另一亞序列h(疏水)結(jié)構(gòu)域具有相似的細(xì)胞膜轉(zhuǎn)運(yùn)特征(參見(jiàn)例如Lin等,丄說(shuō)o/.270:14255-14258(1995》.可連接于蛋白質(zhì)而有利于蛋白質(zhì)攝取到細(xì)胞中的肽序列的例子包括但不限于HIV的tat蛋白的11個(gè)氨基酸肽;對(duì)應(yīng)于p16蛋白氨基酸84-103的20個(gè)殘基肽序列(參見(jiàn)Fahraeus等,Cwre"/5z'o/ogy6:84(1996));觸角肽的60個(gè)氨基酸長(zhǎng)同源域的第三個(gè)螺旋(Derossi等,J.所o/.CAem.269:10444(1994));信號(hào)肽的h區(qū)如開(kāi)氏(Kaposi)成纖維細(xì)胞生長(zhǎng)因子(K-FGF)的h區(qū)(Lin等,同上);或HSV的VP22轉(zhuǎn)運(yùn)結(jié)構(gòu)域(Elliot和O'Hare,Ce//88:223-233(1997))。也可將提高細(xì)胞攝取的其它合適化學(xué)部分化學(xué)連接于ZFP。膜轉(zhuǎn)運(yùn)結(jié)構(gòu)域(即內(nèi)化結(jié)構(gòu)域)也可選自隨機(jī)化肽序列文庫(kù)。參見(jiàn)例如Yeh等(2003)Mo/ecw/ar7T^ra外7(5):S461,摘要#1191。毒素分子也能夠跨細(xì)胞膜轉(zhuǎn)運(yùn)多肽。這種分子(稱為"雙毒素")常常由至少兩部分轉(zhuǎn)運(yùn)/結(jié)合域或多肽和分離的毒素結(jié)構(gòu)域或多肽組成。一般轉(zhuǎn)運(yùn)結(jié)構(gòu)域或多肽能結(jié)合細(xì)胞受體,然后將毒素轉(zhuǎn)運(yùn)入細(xì)胞中。已利用幾種細(xì)菌毒素,包括產(chǎn)氣莢膜梭菌(C7o^n'Wwm/er/n'wgem)i毒素、白喉毒素(DT)、假單胞菌CPsez^omowa力夕卜毒素A(PE)、百日咳毒素(PT)、炭疽桿菌CBad//^a"Arac/力毒素和百日咳腺苷酸環(huán)化酶(CYA)將肽作為內(nèi)部或氨基末端融合物遞送到細(xì)胞胞漿中(Arora等,丄歷o/.CAem.,268:3334-3341(1993);Perelle等,/"/e"./mmw".,61:5147-5156(1993);Stenmark等,,Ce〃歷o/.113:1025-1032(1991);Donnelly等,尸7V^S90:3530-3534(1993);Carbonetti等,J6w廣A/eet爿w.Soc.Af/cro6/o/.95:295(1995);Sebo等,Tmww".63:3851-3857(1995);Klimpel等,"5"乂89:10277-10281(1992);和Novak等,說(shuō)'o/.C7^柳.267:17186-171931992))??刹捎眠@種肽序列跨細(xì)胞膜轉(zhuǎn)運(yùn)ZFP。ZFP可方便地融合于這類序列或用其衍生。一般地,作為融合蛋白的一部分提供轉(zhuǎn)運(yùn)序列。任選地,可用接頭連接ZFP與轉(zhuǎn)運(yùn)序列。可采用任何合適的接頭,如肽接頭。也可通過(guò)脂質(zhì)體和脂質(zhì)體衍生物如免疫脂質(zhì)體將ZFP引入動(dòng)物細(xì)胞,優(yōu)選哺乳動(dòng)物細(xì)胞。術(shù)語(yǔ)"脂質(zhì)體"指由一層或多層同心排列的脂質(zhì)雙層組成的包裹著水相的囊泡。水相一般含有準(zhǔn)備遞送給細(xì)胞的化合物,即ZFP。脂質(zhì)體與質(zhì)膜融合,從而將藥物釋放到胞槳中。或者,脂質(zhì)體被吞噬或在轉(zhuǎn)運(yùn)囊泡中被細(xì)胞攝取。一旦進(jìn)入內(nèi)體或吞噬體中,脂質(zhì)體或降解或與該轉(zhuǎn)運(yùn)囊泡的膜融合,并釋放其內(nèi)容物。在通過(guò)脂質(zhì)體進(jìn)行藥物遞送的現(xiàn)有方法中,脂質(zhì)體最終變?yōu)榭赏ㄍ覆⒃诎薪M織或細(xì)胞釋放包裹的化合物(此例為ZFP)。對(duì)于全身或組織特異性遞送,可通過(guò)(例如)被動(dòng)方式完成遞送,其中脂質(zhì)體雙層通過(guò)各種體內(nèi)物質(zhì)的作用隨時(shí)間推移而降解。或者,活性藥物釋放包括用藥物誘導(dǎo)脂質(zhì)體囊泡的通透性改變??蓸?gòu)建脂質(zhì)體膜,使它們?cè)谥|(zhì)體膜附近環(huán)境變?yōu)樗嵝詴r(shí)變得不穩(wěn)定(參見(jiàn)例如尸A^4S84:7851(1987);5/0c/zem&卿28:908(1989))。當(dāng)脂質(zhì)體被靶細(xì)胞內(nèi)吞時(shí),例如,它們變得不穩(wěn)定并釋放其內(nèi)容物。這種去穩(wěn)定過(guò)程稱為融合體形成。二油酰磷脂酰乙醇胺(DOPE)是許多"融合體形成"系統(tǒng)的基礎(chǔ)。這些脂質(zhì)體一般包含ZFP和脂質(zhì)組分,如中性和/或陽(yáng)離子脂質(zhì),任選地包括受體識(shí)別分子,如結(jié)合預(yù)定的細(xì)胞表面受體或配體(如抗原)的抗體??捎酶鞣N方法制備脂質(zhì)體,如Szoka等,爿朋.7ev.歷o;7/^.5/oe"g.9:467(1980),美國(guó)專利號(hào)4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028、4,946,787,PCT發(fā)明者E·J·瑞巴,F·諾弗,M·C·霍姆斯,P·D·格雷戈里,S·M·布倫南申請(qǐng)人:桑格摩生物科學(xué)股份有限公司