植物Cas9變體蛋白VQR及其編碼基因與應用
【技術領域】
[0001] 本發明設及生物技術領域,是對植物基因進行編輯的化s9蛋白變體VQR及其編碼 基因的應用。
【背景技術】
[0002] 近年來,CRISPR-化S9W其高效、簡便的技術特點,在植物中迅速成為最為重要的 基因組編輯手段。CRI SPR-CaS原為廣泛分布存在于原核生物中的免疫系統,CRI SPRs (Clustered regularly interspaced short palin化omic r邱eats)即規律成簇間隔短回 文重復,化s蛋白則是一種受RNA引導的核酸酶。
[0003] 目前所使用的CRISPR-Cas9系統,是基于II型CRISPR-Cas所開發的基因組編輯技 術。該技術所設及到的化S蛋白僅有化s9-種,受化acrRNA和crRNA組成的引導RNA(后被優 化為sgRNA)所引導,Cas9蛋白的HNH結構域及RuvC結構域在PAMs(p;rotospacer adjacent motif s)序列上游的3-8bp處進行雙鏈切割并造成雙鏈斷裂。當雙鏈斷裂發生,細胞便會啟 動兩套修復機制,即非同源末端鏈接(Non-homologous ending-joining,NHEJ)與同源重組 (Homologous recombination,皿)。非同源末端鏈接通常造成雙鏈斷裂處產生單個或多個 堿基的缺失、插入,W該方式修復的個體常常產生某個基因的定點突變。同源重組則是W同 源序列作為模板,進行高保真修復。
[0004] 在CRISPR/Cas9系統中,前間區序列鄰近基序(protospacer adjacent motif, PAM)序列決定了整個基因組中祀序列的分布。PAM是位于目標DM附近的一段序列,具有識 別祀DNA的功能,只有當正確結合PM序列時,才能活化化s9的兩個內切酶活性區。祀序列末 端的Ξ核巧酸區域PAM(5'-NGG-3')為化s9識別位點,是實現剪切功能的關鍵。然而運并不 能完全滿足人們對于植物基因編輯范圍的需求。由于CRI SPR-Cas9系統祀位點的選擇受到 PAM序列NGG的限制,因此在植物中發現及改造能識別新PAM的化s9變體變得十分重要。
【發明內容】
[000引本發明要解決的技術問題是提供一種新型植物化s9變體蛋白VQR及其編碼基因和 應用。
[0006] 為了解決上述技術問題,本發明提供一種植物化s9變體蛋白VQR,該蛋白質的氨基 酸序列如SEQ ID No:2所示。
[0007] 作為本發明的植物化s9變體蛋白VQR的改進:所述蛋白質還包括在SEQ ID N0:2所 示的氨基酸序列中添加、取代、插入和缺失一個或多個氨基酸生成的衍生物。
[000引本發明還同時提供了一種植物化s9變體基因 VQR,該基因編碼植物化s9變體蛋白 VQR,所述基因的核巧酸序列如SEQ ID N0:1所示。
[0009] 作為本發明的植物化s9變體基因 VQR的改進:所述基因還包括在SEQ ID NO: 1所示 的核巧酸序列中添加、取代、插入和缺失一個或多個核巧酸生成的突變體、等位基因和衍生 物。
[0010] 本發明還同時提供了一種重組表達載體,包含上述基因。
[0011] 本發明還同時提供了上述植物化s9變體蛋白VQR的用途,其特征是:能夠在PAM區 為5 ' -NGA-3 '的情況下實現基因組編輯功能。N代表A,T,C,G任意一種核巧酸。
[0012] 本發明的方案具體如下:
[0013] 本發明提供的蛋白,是如下(a)或(b):
[0014] (a)由序列表中序列2所示的氨基酸序列組成的蛋白質;
[0015] (b)將序列表中序列2所示的氨基酸序列經過一個或幾個氨基酸殘基的取代和/或 缺失和/或添加且具有相同活性功能由序列2衍生的蛋白質。
[0016] 上述蛋白中,一個或幾個氨基酸殘基的取代和/或缺失和/或添加是指不多于十個 氨基酸殘基的取代和/或缺失和/或添加。
[0017] 編碼上述蛋白的基因也是本發明保護的范圍。
[001引上述基因是如下(1)-(3)中任一所述的DNA分子:
[0019] 1)序列表中序列1的DM序列;
[0020] 2)編碼序列表中序列2蛋白質序列的多核巧酸;
[0021] 3)與序列表中序列1限定的DNA序列具有90% W上同源性,且編碼相同功能蛋白質 的DNA序列;
[0022] 含有W上任一所述基因的重組載體也屬于本發明的保護范圍,如重組表達載體。
[0023] 可用現有的植物表達載體構建含有所述基因的重組表達載體。
[0024] 所述植物表達載體包括雙元農桿菌載體(如pBI121、pBinl9、pCAMBIA2301、 pCAMBIA3301、pCAMBIA1301-加 iN、pCAMBIA1300等)和可用于植物微彈轟擊的載體等。
[0025] 上述蛋白、上述基因或上述重組載體、表達盒、轉基因細胞系或重組菌在編輯植物 基因組中的應用也是本發明保護的范圍。
[0026] 本發明經對編碼化s9的基因進行突變,產生一種編碼新型Cas9變體蛋白VQR的基 因,識別的PAM為NGA。在水稻WNGA為PAM序列篩選祀位點并編輯化1 -1等基因的實驗中,經 轉基因手段,成功得到化1-1等功能缺失的突變體植株,表明該蛋白能夠識別5'-NGA作為 PAM序列并對祀位點進行編輯。本發明在擴大植物基因編輯范圍上有廣闊的應用前景。
[0027] 本發明的用途是:用于對植物基因組特定的祀位點進行基因編輯,即PAM區為5'- NGA-3'的祀位點。作為基因編輯技術CRISPR-Cas9系統中的一員,相較于傳統化s9蛋白只能 編輯PAM區為5'-NGG-3'的祀位點的限制,擴大了該系統在植物基因組中可編輯的范圍。
【附圖說明】
[0028] 下面結合附圖對本發明的【具體實施方式】作進一步詳細說明。
[0029] 圖1為重組載體部分元件及突變位點示意圖。
[0030] 圖2為化1-1祀位點酶切檢測結果;Μ為marker ;6,10,15,17為敲除雜合體植株;最 后兩個泳道分別為酶切和未經酶切的野生型;其余泳道則為敲除陰性植株,酶切結果與酶 切的野生型無異。
[0031] 圖3為化1-1祀位點測序結果;下劃波浪線標示的為祀位點;單下劃線標示的為PAM 序列;框標示的為酶切識別位點;缺失W短橫杠表示,插入W小寫字母表示。
[0032] 圖4為野生型中花11及突變體GL1-1的表型。
[0033] 圖5為NALl祀位點測序結果;下劃波浪線標示的為祀位點;單下劃線標示的為PAM 序列;框標示的為酶切識別位點;缺失W短橫杠表示,插入W小寫字母表示。
【具體實施方式】
[0034] 下述實施例中所使用的實驗方法如無特殊說明,均為常規方法。
[0035] 下述實施例中所用的材料、試劑等,如無特殊說明,均可從商業途徑得到。
[0036] 實施例lXas9變體VQR的獲得
[0037] 通過重疊延伸PCR技術將突變引入化s9編碼基因中的特定位點。需將完整的化s9 W1135位的氨基酸和1336位氨基酸處為界,分為3段,再通過PC時尋其編碼序列擴出。所使用 的引物如表1所示;K0D FX DNA聚合酶(購自東洋紡生物科技有限公司)PCR擴增目的條帶, 反應條件如下:
[003引
[0039]
[0040] 備注說明:pC1300-Cas9可來自申請號201510485573.2。
[0041 ] 反應程序:94°C,變性2分鐘;然后98°C變性10秒,58°C退火30秒,68°C延伸 (lOOObp/min),擴增35個循環;最后在68°C下延伸5分鐘。
[0042] 1,2和2,3段之間包含20bp重疊區域;第一段和第Ξ段分別包含與載體上、下游同 源的區域。在設計引物之初,將特定突變包含在兩個片段的重疊部分。片段1的反向引物和 片段2的正向引物的重疊部分包含氨基酸?'的密碼子,替換原來1135位的氨基酸"護。片段 2的反向引物和片段3的正向引物的重疊部分包含氨基酸和"R"的密碼子,分別替換原來 1335位的氨基酸"R"和1337位氨基酸叩'。片段1的正向引物和片段3的反向引物則分別包含 與載體上、下游同源的序列。隨后通過多片段的重組技術,將數個的擴增片段重疊拼接成完 整的Cas9變體VQR編碼序列。多片段重組試劑盒購自南京諾唯贊生物科技有限公司,載體 PC1300-化s9經Aatll和Spel(購自肥B公司)雙酶切線性化,雙酶切反應體系如下:
[0043]
[0044] 37°C酶切3小時,用Biomed膠回收試劑盒(Biomed,DR0103)按產品說明書進行純 化;得片段 pC1300-Cas9/AatII+SpeI。
[004引重組反應體系如下: 姑戰0 υρ1:020μ]^ 5xCE MulliS BulTcr 4μL pCl激0-C泌狼?狙牛聲知 200 ng
[0046] 片段 1 40 ng 片段2 40 ng 片段3 40 ng ?拙ase霞 Μuli iS 2 μL^.
[0047] 置于37°C反應30min。待反應完成后,立即將反應管置于冰水浴中冷卻5min。產物 轉化大腸桿菌感受態細胞D冊α得到重組質粒PC1300-VQR,測序重組質粒確定突變引入正 確。即,該重組質粒PC1300-VQR中包含如沈Q ID Ν0:1所示的基因。
[004引備注說明:
[0049] SEQ ID Ν0:1為VQR DNA序列;下劃線為核定位信號區域(NLS);大寫為終止密碼 子;其余部分為VQR蛋白編碼序列,改造位點計數從VQR蛋白編碼序列開始。
[0050] SEQ ID Ν0:2為相應的VQR蛋白序列;下劃線為核定位信號區域(化S)