專利名稱:丹參一細胞色素P450(SmP450)基因及其編碼的蛋白和應用的制作方法
技術領域:
本發明屬于生物技術領域,主要涉及利用cDNA芯片技術克隆丹參中各種跟其活 性成分生物合成相關的酶基因及其編碼產物與應用,尤其涉及丹參主要活性成分酚酸類和 二萜醌類化合物在生物合成中的參與其結構修飾的酶基因及其編碼產物與應用,屬于藥用 植物基因工程領域。
背景技術:
藥用植物有效成分(次生代謝產物)的形成是植物次生代謝途徑中特有基因群的 產物。隨著植物功能基因組研究的廣泛及深入,獨具特色又有廣闊應用前景的藥用植物次 生代謝合成相關功能基因的研究逐漸成為研究的熱點,這些基因的克隆將為解析藥用植物 有效成分的生物合成途徑及其調控機制和解釋藥材品質的形成提供理論基礎,同時為利用 生物技術提高目標成分含量或直接生產有效成分或中間體帶來廣闊的應用空間。藥用植物中有很多活性成分如紫杉醇、青蒿素、人參皂苷Rg3、喜樹堿、長春堿、丹 參酮IIA、雷公藤甲、乙素等等。這些化合物的體內生物合成過程中,均涉及到不同程度的生 物結構修飾,其中細胞色素P450的修飾作用非常關鍵。由于大多數P450在植物體內的含量 很低且不穩定,直接分離純化P450酶非常困難,因此克隆P450基因,研究P450基因的表達 與調控,通過異源表達、缺失突變和突變體互補等方法研究P450的功能就成為一條重要途 徑。基因芯片技術是20世紀80年代發展起來的一項高新技術,它可以對生物整個基因組的 所有基因表達同時進行實時監測,作為一個全新的、強有力的技術平臺,已廣泛地應用于功 能基因組的研究中,也成為挖掘新基因的強有力手段。藥用植物丹參Salvia miltiorrhiza Bge.為一味常用中藥,含有豐富的生物活性成分,其中主要有兩類活性成分脂溶性的二 萜醌類化合物和水溶性的酚酸類化合物,它們結構上基本存在細胞色素P450修飾作用的 痕跡。本發明系為應用Gene-Chip技術,結合5’RACE對丹參中與有效成分密切相關的細胞 色素P450進行克隆和分析,并且應用生物工程技術對其進行了研究與開發。在本發明被公 布之前,尚未有任何公開或報道過本專利申請中所提及的細胞色素P450基因及其氨基酸 序列。
發明內容
本發明的目的在于提供一種丹參細胞色素P450(SmP450)基因。本發明第二個目的是提供該基因編碼的蛋白質。本發明還提供了含有該基因的重組載體和宿主細胞。本發明的另一個目的在于提供該基因的應用。本發明所提供的丹參細胞色素P450 (SmP450),為以下核苷酸序列之一(1)具有SEQ ID NO. 1所示的核苷酸序列;(2)SEQ ID NO. 1所示的核苷酸序列添加、取代、插入或缺失一個或多個核苷酸的同源序列或者其等位基因及其衍生的核苷酸序列。該基因所編碼的蛋白質為丹參細胞色素P450(SmP450),是以下氨基酸序列之一(1)具有SEQ ID NO. 2所示的氨基酸序列;(2) SEQ ID NO. 2添加、取代、插入或缺失一個或多個氨基酸的同源序列。含有本發明的丹參細胞色素P450(SmP450)基因全序列或部分序列的重組載體, 如原核表達類載體,真核類表達載體及RNAi載體均屬于本發明的保護范圍。含有本發明的丹參細胞色素P450(SmP450)基因全序列或部分序列的宿主細胞, 如含有上述的重組載體的宿主細胞也屬于本發明的保護范圍。所述宿主細胞為有價值的活體材料。本發明的丹參細胞色素P450(SmP450)基因的應用,包括用所述的重組載體,如植 物過表達載體或干擾載體轉化的植物細胞;或者用所述含重組載體的農桿菌與相關活體材 料共培養,得到轉基因的植物發根系和轉基因植株;或者用所述的丹參法呢基焦磷酸合酶 (SmFPS)基因全序列或部分序列轉化獲得轉基因生物體。本發明技術方案中涉及的概念具體內容如下所說的丹參細胞色素P450(SmP450)基因的DNA分子包括編碼具有丹參細胞色素 P450 (SmP450)活性的多肽的核苷酸序列,而且所述的核苷酸序列與SEQ ID NO. 1中從核苷 酸第1-1512位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在40-55°C條 件下與SEQ ID NO. 1中從核苷酸第1-1512的核苷酸序列雜交。較佳地,所述的序列編碼具 有SEQID NO. 2所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQ ID NO. 1中從核苷 酸第1-1512位的核苷酸序列。本發明分離出的丹參細胞色素P450(SmP450)基因多肽包括 具有SEQ ID NO. 2氨基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生 物。較佳地,該多肽是具有SEQ ID NO. 2序列的多肽。本發明中的DNA分子包含所述的DNA 分子中8-100個連續核苷酸。在本發明中,“分離的”、“純化的”DNA是指,該DNA或片段已 從天然狀態下位于其兩側的序列中分離出來,還指該DNA或片段已經與天然狀態下伴隨核 酸的組分分開,而且已經與在細胞中伴隨其的蛋白質分開。本發明中術語“丹參細胞色素P450 (SmP450)(或多肽),,基因指編碼具有丹參細 胞色素P450(SmP450)活性的多肽的核苷酸序列,如SEQ ID NO. 1中第1-1512位核苷酸序列 及其簡并序列。該簡并序列是指,位于SEQ ID NO. 1序列的編碼框第1-1512位核苷酸中, 有一個或多個密碼子被編碼相同氨基酸的簡并密碼子所取代后而產生的序列。由于密碼子 的簡并性,所以與SEQ ID NO. 1,中第1-1512位核苷酸序列同源性低至約70%的簡并序列 也能編碼出SEQ ID NO. 2所述的序列。還包括能在中度嚴謹條件下,更佳的在高度嚴謹條 件下與SEQ ID NO. 1中從核苷酸第1-1512位的核苷酸序列雜交的核苷酸序列。還包括與 SEQID NO. 1中從核苷酸第1-1512位的核苷酸序列的同源性至少70%,較佳地至少80%, 更佳地至少90%,最佳地至少95%的核苷酸序列。還包括能編碼具有與天然的丹參細胞色 素P450(SmP450)相同功能的蛋白的SEQ ID NO. 1中開放閱讀框序列的變異形式。這些變 異形式包括(但并不限于)若干個(通常為,1-90個,較佳地,1-60個,更佳地,1-20個,最 佳地1-10個)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加數個(通常為 60個以內,較佳地為30個以內,更佳地為10個以內,最佳地為5個以內)核苷酸。本發明中術語“丹參細胞色素P450(SmP450)蛋白或多肽”指具有丹參細胞色素P450(SmP450)活性的SEQ ID NO. 2序列的多肽。該術語還包括具有與天然丹參細胞色素 P450(SmP450)相同功能的SEQ ID NO. 2序列的變異形式。這些變異形式包括(但并不限 于)若干個(通常為1-50個,較佳地1-30個,更佳地1-20個,最佳地1-10個)氨基酸的 缺失、插入和/或取代,以及在C末端和/或N末端添加一個或數個(通常為20個以內,較 佳地為10個以內,更佳地為5個以內)氨基酸。例如,在本領域中,用性能相近或相似的氨 基酸進行取代時,通常不會改變蛋白質的功能。又比如,在C末端和/或N末端添加一個 或數個氨基酸通常也不會改變蛋白質的功能。該術語還包括丹參細胞色素P450(SmP450) 的活性片段和活性衍生物,還包括能夠可操作地連于信號肽、啟動子或者核糖體結合位點 序列所組成的衍生物。本發明的丹參丹參細胞色素P450(SmP450)多肽的變異形式包括 同源序列、保守性變異體、等位變異體、天然突變體、誘導突變體、在高或低的嚴謹條件下 能與丹參細胞色素P450 (SmP450)DNA雜交的DNA所編碼的蛋白、以及利用丹參細胞色素 P450 (SmP450)多肽的血清獲得的多肽或蛋白。本發明中丹參細胞色素P450 (SmP450)保守性變異多肽指與SEQ ID NQ. 2的氨基 酸序列相比,有至多10個,較佳地至多8個,更佳地至多5個氨基酸性質相似或相近的氨基 酸所替換而形成多肽。這些保守性變異多肽可根據表1,進行替換而產生。本發明還包括丹參細胞色素P450(SmP450)或多肽的類似物。這些類似物與天然 丹參細胞色素P450(SmP450)多肽的差別可以是氨基酸序列上的差異,也可以是不影響序 列的修飾形式上的差異,或者兼而有之。這些多肽包括天然或誘導的遺傳變異體。誘導 變異體可以通過各種技術得到,如通過輻射或暴露于誘變劑而產生隨機誘變,還可通過定 點誘變法或其他已知分子生物學的技術。類似物還包括具有不同于天然L-氨基酸的殘基 (如D-氨基酸)的類似物,以及具有非天然存在的或合成的氨基酸(如0、氨基酸) 的類似物。應理解,本發明的多肽并不限于上述例舉的代表性的多肽。所述修飾(通常不 改變一級結構)形式包括體內或體外的多肽的化學衍生形式如乙酰化或羧基化。修飾還 包括糖基化,如那些在多肽的合成和加工中或進一步加工步驟中進行糖基化修飾而產生的 多肽。這種修飾可以通過將多肽露于進行糖基化的酶(如哺乳動物的糖基化酶或去糖基化 酶)而完成。修飾形式還包括具有磷酸化氨基酸殘基(如磷酸酪氨酸,磷酸絲氨酸,磷酸蘇 氨酸)的序列。還包括被修飾從而提高了其蛋白水解性能或優化了溶解性能的多肽。在本發明中,可選用本領域已知的各種載體,如市售的載體,包括質粒,粘粒等。表1 保守性變異多肽中的取代殘基
最初的殘基代表性的取代殘基優選的取代殘基Ala⑷Val ;Leu ;lieValArg(R)Lys;Gin ;AsnLysAsn(N)Gin ;His ;Lys ;ArgGinAsp(D)GluGluCys(C)SerSerGln(Q)AsnAsnGlu(E)AspAspGly(G)Pro ;AlaAlaHis(H)Asn ;Gin ;Lys ;ArgArgIMI)Leu ;Val ;Met ;Ala ;PheLeu
5
在生產本發明的丹參細胞色素P450(SmP450)原酶多肽時,可以將丹參細胞色 素P450(SmP450)基因的核苷酸序列可操作地連于表達調控序列,從而形成丹參細胞色素 P450(SmP450)表達載體。所述“可操作地連于”指這樣一種狀況,即線性DNA序列的某些部 分能夠影響同一線性DNA序列其他部分的活性。例如,如果信號肽DNA作為前體表達并參 與多肽的分泌,那么信號肽(分泌前導序列)DNA就是可操作地連于多肽DNA ;如果啟動子 控制序列的轉錄,那么它是可操作地連于編碼序列;如果核糖體結合位點被置于能使其翻 譯的位置時,那么它是可操作地連于編碼序列。一般,“可操作地連于”意味著相鄰,而對于 分泌前導序列則意味著在閱讀框中相鄰。本發明中宿主細胞為原核細胞或者真核細胞。常 用的原核宿主細胞包括大腸桿菌;常用的真核宿主細胞包括酵母細胞、煙草細胞和其它植 物細胞。本發明還可用Northern印跡法技術分析丹參細胞色素P450 (SmP450)基因產物的 表達,即分析丹參細胞色素P450 (SmP450)的RNA轉錄物在細胞中的存在和數量。此外,本發明中可用作探針的核酸分子通常具有丹參細胞色素P450(SmP450)核 苷酸編碼序列的8-100個連續核苷酸,較佳地具有15-50個連續核苷酸。該探針可用于檢測 樣品中是否存在編碼丹參細胞色素P450(SmP450)的核酸分子。本發明涉及檢測樣品中是 否存在丹參細胞色素P450(SmP450)核苷酸序列的方法,它包括用上述的探針與樣品進行 雜交,然后檢測探針是否發生了結合。較佳地,該樣品是PCR擴增后的產物,其中PCR擴增 引物對應于丹參細胞色素P450(SmP450)核苷酸編碼序列,并可位于該編碼序列的兩側或 中間。引物長度一般為15-50個核苷酸。此外,根據本發明的丹參細胞色素P450(SmP450) 核苷酸序列和氨基酸序列,可以在核酸同源性或表達蛋白質的同源性基礎上,篩選丹參細 胞色素P450(SmP450)源基因或同源蛋白。為了得到與丹參細胞色素P450(SmP450)相關的丹參cDNAs的點陣,可以用DNA探 針篩選丹參cDNA文庫,這些探針是在低嚴謹條件下,用32P對丹參細胞色素P450 (SmP450) 基因的全部或部分做放射活性標記而得的。最適合于篩選的cDNA文庫是來自丹參的文庫。 構建來自感興趣的細胞或者組織的cDNA文庫的方法是分子生物學領域眾所周知的。另外, 許多這樣的cDNA文庫也可以購買到,例如購自Clontech, Stratagene, Palo Alto, Cal.。 這種篩選方法可以識別丹參細胞色素P450(SmP450)的基因家族的核苷酸序列。本發明的丹參細胞色素P450(SmP450)的基因家族的核苷酸全長序列或其片段通 常可以用PCR擴增法、重組法或人工合成的方法獲得。對于PCR擴增法,可根據本發明所 公開的有關核苷酸序列,尤其是開放閱讀框序列來設計引物,并用市售的cDNA庫或按本領
6域技術人員已知的常規方法所制備的cDNA庫作為模板,擴增而得有關序列。當序列較長 時,常常需要進行兩次或多次PCR擴增,然后再將各次擴增出的片段按正確次序拼接在一 起。一旦獲得了有關的序列,就可以用重組法來大批量地獲得有關序列。這通常是將其克 隆入載體,再轉入細胞,然后通過常規方法從增殖后的宿主細胞中分離得到有關序列。此 外,還可通過化學合成將突變引入本發明蛋白序列中。除了用重組法產生之外,本發明蛋白 的片段還可用固相技術,通過直接合成肽而加以生產(Stewart等人,(1969) Solid-Phase Peptide Synthesis, WHFreeman Co., San Francisco ;Merrifield J. (1963)J. Am Chem. Soc85 :2149-2154)。在體外合成蛋白質可以用手工或自動進行。例如,可以用Applied Biosystems的431A型肽合成儀(Foster City,CA)來自動合成肽。可以分別化學合成本 發明蛋白的各片段,然后用化學方法加以連接以產生全長的分子。利用本發明的丹參細胞 色素P450(SmP450),通過各種常規篩選方法,可篩選出與丹參細胞色素P450 (SmP450)發生 相互作用的物質,或者受體、抑制劑或拮抗劑等。本發明所提供的丹參細胞色素P450(SmP450)基因是首次從丹參中克隆制備的, 填補了從我國藥物植物丹參細胞色素P450(SmP450)基因的空白。利用本發明可以通過基 因工程技術來提高丹參等植物中萜類活性成分丹參酮類物質的含量,轉基因結果顯示,丹 參丹參細胞色素P450(SmP450)基因對促進丹參酮類含量的提高有明顯作用。丹參細胞色 素P450(SmP450)基因可通過轉基因技術用于提高丹參酮含量的研究和產業化,尤其可用 于中藥材丹參的品質改良,能緩解丹參酮類藥源嚴重匾乏問題,對提高丹參酮類物質產量 具有較好的促進作用,具有很好的應用前景。
圖1 :SmP450的功能域預測(來源于NCBI數據庫);圖2 :YE+Ag+處理丹參毛狀根后,SmP450RNA相對含量及隱丹參酮和丹參酮IIA增 長倍數;圖3 :SmP450轉基因載體;圖4 :SmP450轉基因毛狀根端口部分愈傷組織GFP驗證;圖5 :SmP450轉基因毛狀根四個丹參酮類主要成分含量分析。
具體實施例方式實施例1、丹參cDNA芯片的制作1、丹參總RNA的分離和檢測取陜西商洛丹參(Salvia Miltiorrhiza Bge)根2g,在研缽中用液氮 快速研磨成粉末,快速轉移至65 °C預熱的10mL提取緩沖液中(CTAB(W/V)2 %, Tris-HCl (pH8. 0) lOOmmol I71,EDTA 25m mol I71,NaCl 2. Omol I71,PVP402%,亞精胺 0.58/1,巰基乙醇2%),充分振蕩混勻;用等體積氯仿抽提兩次,7500g離心15分鐘。上清 液加入1/4體積的10M LiCl,混勻后放置4°C沉淀過夜;7500g離心20分鐘,沉淀用500 u L SSTE(SDS 0. 5%, NaCl lmol L-1,Tris-HCl (pH8. 0) lOmmol L-1,EDTA lmmol I71,在 65°C 溶解5分鐘。用等體積氯仿抽提,13000g離心5分鐘;上清液加入2倍體積無水乙醇,-70°C 放置2h ;4°C 13000g離心20分鐘,沉淀室溫干燥10分鐘后溶于100 u L DEPC處理的水中,用1. 0%瓊脂糖電泳檢測RNA的完整性,用GenQuant核酸定量儀測定A260、A280比值和濃 度。置于-80°C冰箱備用。2、cDNA文庫的構建采用mRNA 純化試劑盒(QuichprepTM Micro mRNA Purification Kit,Pharmacia 公司)分離mRNA后,通過在cDNA分子兩端加上EcoR I/Not I接頭,在T4多核苷酸 激酶的作用下磷酸化,與表達載體XZAP Express Predigested Vector (ZAP Express Predigested VectorKit, stratagene 公司)連接,然后采用 stratagene 公司的 ZAP Express Pridigested Gigapack CloningKits (EcoRI/CIAP-Treated)將包裝蛋白在體外 包裝連接產物,感染E. coli XLl-Blue MRF’構建成cDNA文庫。3、cDNA芯片的制備3. 1PCR 擴增挑取分離良好的噬菌斑溶于100 uL SM緩沖液(Amresco公司)中混勻后作為 PCR模板。PCR擴增引物為XZAP Express多克隆位點兩側的部分序列M13-20引物 5' -GTAAAACGACGGCCAGTG-3 ‘,BK 反向引物5 ‘ -GGAAACAGCTATGACCTTG-3 ‘。96 孑L 板PCR反應體系,準備如下混合物:dNTP(25mmol 廠1),600 y L ;Mg2+600 y L,10X緩沖液 1000 u L ;Taq(Takara Ex Taq,5U. ii L-1),40 ii L ;M13_20 引物(12. 5 ii mol L-1),200 ii L ; BK反向引物(12. 5umol L—1) 200 y L ;高純水補足至10mL。混合均勻后,用排槍分裝至96 孔PCR板。然后各加入6iiL DNA模板,混合均勻。在ABI9700型基因擴增儀上進行PCR反 應,反應條件為94°C預變性3分鐘,然后進行35個循環,為94°C 30s, 54°C 30s, 72°C 2分鐘, 循環結束后72°C后延伸5分鐘。取L反應產物在含EB的1. 5%的瓊脂糖凝膠上電泳, 在SYNGENE型凝膠成像系統下觀察、拍照。3. 2PCR產物純化使用% 孔 Multiscreen filter plates (Millipore 公司)純化板進行 PCR 產物 的純化。將瓊脂糖凝膠檢測為單一條帶的PCR產物(100 yL)轉入純化板中;將純化板放于 Millipore的真空裝置上,于15mmHg真空抽濾10分鐘,直至抽干;加入100 y L水,15mmHg 真空抽濾10分鐘,直至抽干;從真空抽濾裝置上取下PCR純化板,加入40 uL(pH8. 0左右) 的水,將純化板放至搖床上輕搖20 30分鐘重懸DNA ;將純化產物吸出,置于酶標板上測 定濃度和純度;取1 PL純化產物在1.5%的瓊脂糖凝膠上電泳檢測;將純化產物真空干燥。3.3cDNA 芯片點制根據上述測定的濃度差異加入適量50% DMS0作為點樣液,調節濃度至約 250ng u L—1后,將樣品轉移至384孔板中準備芯片點制。點樣儀為GeneMachine公司 OmniGrid 100。點樣參數為針2 X 12,X :8000,Y 6000 ;點間距:300microns ;點陣 13X14 ;點陣間距:500microns ;矩陣模式4X12。實施例2 丹參SmP450基因的克隆1、芯片雜交分析丹參毛狀根為發根農桿菌15834直接感染的方式進行Ri_質粒轉化誘導的毛狀 根。取生長良好的丹參毛狀根(各0. lg)繼代培養于6,7V固體培養基上,置于25°C培養箱 中暗培養,分別于30天、45天、60天收獲復。將30天材料作為參照,分別與45天和60天 的材料進行雜交,重復兩次,每組均采用正反標記以消除染料的誤差。
采用間接標記法進行探針標記,包括雙鏈cDNA合成、T7介導的RNA體外轉錄合成 cRNA、隨機引物反轉錄、cDNA用KLEN0W酶標記等步驟。(1)雙鏈 cDNA 合成取 5g 總 RNA,以 T7_01igo (dT) 15,5' -AAACGACGGCCAGTGAATG TAATACGACTCACTATAGGCGCTTTTTTTTTTTTTTTTV-3 ‘,V 可以是 G、C 禾口 A,上海博亞生物技術有 限公司)為引物,用cDNA Synthesis Kit(TaKaRa公司)合成雙鏈cDNA ;雙鏈合成以后用 QIAquick PCR Purification Kit(Qiagen 公司)純化。(2)體外轉錄合成 cRNA 用 T7 RiboMAX Express Large Scale RNA Production System (Promega公司)將雙鏈cDNA進行體外轉錄合成cRNA ;然后用RNeasy試劑盒 (Qiagen公司)純化。(3)隨機引物反轉錄取2g cRNA,用Superscriptll反轉錄酶, ZOOU.iil^dnvitrogen公司),9 Random Primer進行反轉錄,反轉錄產物用 QIAquick PCR Purification Kit (Qiagen 公司)純化。(4)cDNA用KLEN0W酶標記取lg cRNA反轉錄產物,用隨機引物進行KLEN0W標記, 標記產物用QIAquick PCR Purification Kit (Qiagen公司)純化,純化后抽干。標記過程 中dATP,dGTP, dTTP使用濃度為120M,dCTP使用濃度為60M,Cy5_dCTP,Cy3_dCTP使用濃度 為 40M。將不同樣品分別用cy3、cy5 (Amersham公司)進行標記,然后溶于30L雜交液中 (3XSSC,0. 2%SDS,5X Denhart,s,25 %甲酰胺),于42°C雜交過夜。雜交結束后,先在42°C 左右含0. 2% SDS,2XSSC的液體中洗5分鐘,而后在0. 2XSSC中室溫洗5分鐘,玻片甩干 后進行掃描。將不同樣品分別用cy3、cy5 (Amersham公司)進行標記,然后溶于30L雜交液 中(3XSSC,0.2% SDS,5XDenhart,s,25%甲酰胺),于42°C雜交過夜。雜交結束后,先在 42°C左右含0. 2% SDS,2XSSC的液體中洗5分鐘,而后在0. 2XSSC中室溫洗5分鐘,玻片 甩干后進行掃描。芯片用LuxScan 10K/A雙通道激光掃描儀(CapitalBio公司)進行掃描。 采用GenePix Pro 4.0圖像分析軟件(Axon Instruments公司)對芯片圖像進行分析,把 圖像信號轉化為數字信號;然后對芯片上的數據用Lowess方法進行歸一化;最后用Ttest 方法結合兩倍差異的標準來確定差異表達基因。2、差異基因的獲得和分析將每組芯片兩次重復的共同差異基因進行5’單向測序,獲得的EST序列采用 Windows 系統下的 Staden Pachage (gap4) (http://staden. sourceforge. net)軟件進行序 列前處理以及拼接聚類。去掉載體、接頭以及低質量序列和較短的序列。使用BLASTX(6 December 2005 :BLAST2. 2. 13 released ;http://www. ncbi. nih. gov/BLAST/)將處理 后的EST序列在蛋白質水平上與NCBI非冗余蛋白質數據庫(non-redundant protein database)進行同源性比較,結果目標點樣點在60/30天雜交結果中表現為上調基因, B1ASTX注釋為丹參細胞色素P450(SmP450)基因,命名為SmP450,該片段具有終止密碼子, 為丹參SmP450基因的3’末端。3、5:RACE采用SMART RACE cDNA Amplification Kit (Clontech 公司)試劑盒進行擴增 SmP450的5’末端,按照說明書進行操作。總RNA用Trizol (Invitrogene公司)試劑盒提 取,步驟詳見試劑盒操作手冊。根據上述SmP450基因基因設計特異引物為GSP1 :5:gtaggcgaggacgtcctgcgccacccc-3~,進行 cDNA5,末端的擴增。PCR 條件為 94°C 5min,94°C 30s, 68°C 30s,72°C 3min (35個循環),72°C 7min。擴增出約400bp的DNA片段,瓊脂糖凝膠回收 試劑盒(Takara)回收目的片段,按pMD19T載體(Takara)試劑盒操作手冊將上述片段克隆 至PMD19-T載體中,鑒定陽性克隆并測序(北京三博遠志生物有限公司)。通過cDNA雜交所得EST序列和5’ -RACE獲得的部分片段測序結果可得到序列表 SEQID NO. 1所示的SmP450基因全長cDNA序列,其所推導的氨基酸序列如SEQ ID NO. 2所不。4、全長cDNA的克隆和測序根據5:RACE的結果和已知部分的序列,采用5、和;T末端引物直接擴增 5~-RACE 所逆轉錄的 5:RACE_Ready cDNA,使用 LA Taq (Takara)進行 LA-PCR 方法擴增 SmP450 全長序列。弓| 物:SmP450-F 5~-atgaaatctcacatcatggagctaaac-3~ ;SmP450_R
-tcacgcacgcaaag-gccgcttcaa-3~ 0擴增出約1500bp片段,瓊脂糖凝膠回收試劑盒 (Takara)回收目的片段,按上述方法克隆至pMD19_T載體中(Takara),鑒定陽性克隆并進 行雙向測序(北京三博遠志生物有限公司)。實施例3、SmP450基因的生物信息學分析本發明涉及的丹參二萜合酶基因全長cDNA的長度為1512bp,詳細序列見序列表 中的序列1,其中開放讀碼框位于1 1512bp。將丹參全長cDNA序列用BLAST程序在Non -redundantGenBank+EMBL+DDBJ+PDB禾口Non-redundant GenBank CDS translation+PDB+Sw issprot+Superdate+PIR數據庫中進行核苷酸同源性檢索。該基因在氨基酸水平上與其它 物種中的P450有較高的同源性,同時具有的FxxGxRxCxG特征結構域。圖1。實施例4、YE+Ag+處理后SmP450基因表達與隱丹參酮、丹參酮IIA含量的分析利用YE+Ag+處理丹參毛狀根,收集不同時間點的材料用于丹參SmP450基 因表達量與隱丹參酮、丹參酮IIA的含量分析。SmP450基因表達量采用熒光實時定 量PCR。總RNA用Trizol (Invitrogene公司)試劑盒提取,步驟詳見試劑盒操作手 冊。取1 P g RNA模板按RT試劑盒(Takara公司)說明書反轉錄得到cDNA。Real-time 定量 PCR 米用 ABI Prism 7000 SequenceDetection System(Applied Biosystems, USA)和 SYBGREEN PCR Master Mix (AppliedBiosystems, UK)試劑盒,以丹參 actin 基 因(GenBank 登錄號 DQ243702)(引物序列 actin-222 :5,-GGTGCCCTGAGGTCCTGTT-3,, actin-488 5 ’ -AGGAACCACCGATCCAGACA-3,)作為對照,確證不同時間都符合要求而且 cDNA 的量都相差不多。SmP450 基因引物為SmP450F 5-gagatcccagcagggacc_3,;SmP450R 5'-caagtattgcagatcgtt-3'。按 94°C for 5min, (94°C for 30sec, 55°C for 30sec and 72V for lmin) 40 cycles,72°C 7min的PCR條件進行擴增。結果表明經過YE+Ag+處理 處理后,SmP450基因表達水平于24h內迅速升高,之后逐漸降低到對照組水平。經actin 內參基因均一化之后,與對照組比較,處理后2處,¥£+48+處理處理組是同時期對照組的5.6 倍,說明丹參毛狀根經YE+Ag+處理后,SmP450基因表達水平內迅速升高,從而有利于提高 SmP450活性,有利于推動代謝流向目的產物丹參酮類成分流動。采用HPLC測定隱丹參酮和丹參酮IIA含量,色譜條件為WaterS 2695高效液相 色譜儀,Waters 2996 二極管陣列檢測器,Millennium 32工作站,色譜甲醇(天津);水為 三重蒸餾水,氯仿(分析純),無水乙醇(分析純)。RP-Waters C18 (150mmX3. 9mm, 5 u m)
10柱,檢測波長270nm ;柱溫30°C,其流動相條件為流速1. OmL. mirT1,流動相為0. 5%醋酸 甲醇(A)和0. 5%醋酸水(B)線性梯度洗脫0 25min,30% 60% A ;25 30min,60% 65% A ;30 50min,65% 70% A ;50 60min,70% 80% A ;60 61min,80% 30% A。結果顯示經過YE+Ag+處理后ld、2d、4d、6d、9d,隱丹參酮含量分別是對照組的3. 5,3. 9, 10. 2,15. 7,38. 5倍;丹參酮IIA含量分別是對照組的3. 2,3. 1,5. 2,7. 4,9. 0倍;結果表明 丹參毛狀根經YE+Ag+處理后,丹參SmFPS基因表達量能被顯著的誘導表達,且伴隨隱丹參 酮,丹參酮IIA的迅速積累。可知所得到的丹參SmFPS基因為丹參酮類成分生物合成途徑 的關鍵酶基因,如圖2。實施例5、SmP450轉基因發根毛狀根丹參酮類含量分析1. Gateway過表達載體的構件設計擴SmP450 基因全長的引物(SmP450_Bl :GCACAAGTTTGTACAAAAAAGCAGGCTTCAC C-atgaaatctcacatcatggag ; SmP450_B2 :GCACCACTTTGTACAAGAAAGCTGGGTT_tcacgcacgcaaag gccgctt)。應用高保真酶進行PCR,將產物切膠回收。BP 反應
PCR產物50-100ng(3. 5uL)PD0NR22150-100ng(0. 5uL)BP Clonase 酶l.OuL (用前輕輕混合下)A.反應體系置25度溫育12小時(PCR儀),B.加入0. 5uL蛋白酶K溶液37度溫育10分鐘,終止BP反應。C.將BP反應產物經過DH5 a克隆。D.含40ug/ml kan (卡那霉素)LB培養板上過夜,PCR驗證,測序驗證,提質粒。LR 反應 A.反應體系置25度溫育12小時(PCR儀),B.加入0. 5uL蛋白酶K溶液37度溫育10分鐘,終止BP反應。C.將BP反應產物經過DH5 a克隆。D.含50ug/ml Spe (壯觀霉素)LB培養板上過夜,PCR驗證,測序驗證。所得質粒,然后提質粒并通過電擊轉化的方法轉入農桿菌中,同時用敲出毒基因 的空載體做對照,如圖3。2. ACCC10060介導基因轉化1.外植體預培養選取10天的丹參無菌苗,將葉片剪成0. 5X0. 5cm 2的小塊,并用刀片將葉片表面 劃傷,以背面向上的方式將葉片置于MS固體培養基上,于25°C左右光照16h/黑暗8h的條 件下預培養2天。3.農桿菌的活化擴增
4°C保存的平板上挑取單菌落于新的含有50mg/L Rif和100mg/L壯觀霉素的YEB 培養基上,劃線,20°C培養過夜(活化),挑取單菌落接種于15ml含50mg/L Rif和lOOmg/ L壯觀霉素的YEB的液體培養基中,于28°C振蕩培養至0D2600. 5左右(250rpm約23h),將 菌液倒入無菌離心管中,4000rpm離心lOmin,棄上清液,用等體積的MS液體培養基重懸沉 淀菌體,用于浸染。4、浸染及共培養將預培養材料放入MS重懸液中,浸染lOmin,取出外植體,用無菌濾紙吸去菌液, 放入新的MS固體培養基上,黑暗中共培養48-72h。5、選擇培養將共培養的外植體用無菌水清洗3次,400mg/L cef水浸泡5min左右,無菌水清 洗1次,吸干水分而后移入含Hgy (潮霉素)2. 5mg/L和400mg/L cef的MS固體培養基上, 于黑暗中進行篩選培養,每10天更換一次培養基。選擇生長迅速長至2. Ocm 3. Ocm的抗 性毛狀根,將其切下,單獨標號轉入2. 5mg/L Hgy和400mg/L cef的MS固體培養基上,將除 菌后的陽性毛狀根轉入含2. 5mg/LHgy的MS培養基繼代。5、丹參酮類含量測定6、選擇培養毛狀根經過綠色熒光顯微鏡檢測(GFP),再經過特異引物PCR檢測,選擇陽性株系 進行放大培養(6,7V培養基),圖4。7、丹參酮類含量測定取鮮毛狀根500mg真空干燥,用MeOH提取,HPLC條件同上,測定丹參脂溶性成分 含量。結果表明,在過表達SmP450基因的轉基因發根高產株系中二氫丹參酮,隱丹參酮,丹 參酮I和丹參酮IIA含量比對照組分別提高1. 2,3. 0,2. 0和1. 7倍,如圖5。因此轉基因 結果證明,丹參SmP450基因對促進丹參酮類含量的提高有明顯作用,SmP450基因可用于利 用轉基因技術來提高丹參酮含量的研究和產業化中,具有很好的應用前景。SEQUENCE LISTING<110>中國中醫科學院中藥研究所<120>丹參一細胞色素P450(SmP450)基因及其編碼的蛋白和應用<160>2<170>PatentIn version 3. 5<210>1<211>1512<212>DNA<213> 丹參 Salvia miltiorrhiza Bge.<400>1atgaaatctcacatcatgga gctaaacacttcatcaacactcatagctctactttccttc60
ctctttctcttcatctttctcaaatatgtaacaatcacaaaatccgcaaaccgctactca120
cacatcccaactcccaaaaccctccctctcatcggaaaccttcacctcatgctcggcacc180
gacgccccccaccgcctcttccgggagctcgccgccaagcacggccccctcatgcacctc240
cagctcggcg agatccacttcatcatcgtctcgtccgtggatctcgccaagcaggtgctc300
120118]aaaatccacgacatcaacttcgccaaccggcccccgggggtggcgcaggacgtcctcgcc3600119]tacaacatgaccgacgtcgtggccgccccctacggcgactactggcgcttgctgcggaag4200120]atctgcacgctcgagcttctgagcacgcggcgcgtgcagtccttccgccccataagagaa4800121]gaggagaatctgaatctttgcagatacctcgcttcctgcgggggatcgccggcgaatctg5400122]tcggagaagatccatctgtcgtcgtacgacgtgatcacgagggcggcggtggggacgaga6000123]acgacggggcgcgtgatggagagttcggtgatttcagagatttcggaggtggggtcggga6600124]ttcatgaccgccgatttctatccttccgtcagatcactgcggtggatcaccatagcgccg7200125]tacaagatccaacacattcgccgcaaattggacaagctgttcgacagcatcatcgaggag7800126]cataaatcaaacagagataaggatgccaagtatgaagattttgtggatgttctccttcag8400127]attcaaaaagacgggagtataactactgacaacatcaaagcagtgctcgtggatgtgttc9000128]agtgctggaactggcacgtcagccacagccacagagtgggcaatgacagagttgatgaaa9600129]aatcctagcacactcaccaaggctcaagaggaggtaagaagggttttcgacgacaaggga10200130]tacgtggacgaagacaagttcgaggagctcaaatacctcaaactgatcatcaaagagaca10800131]ctgagattccacccgccaacgccgcttttaatccccagaatcaacacagagagatgcgaa11400132]atcaatggatacgagatcccagcagggaccagtttgatcgtgaatgcgtgggcactggga12000133]agagaccccgagtattggaacgatccggagaagtttataccagaaagatttgaggaaagc12600134]gccgttgatttcaaagggaacgatctgcaatacttgccctttggttcgggaaggagaatg13200135]tgccccggcataatctacggcctcgcgaacgtcgagttcattcttgcgacgcttctctat13800136]catttcgattggaagttgccgaaagggatgaaaatagatgaattggatgtggtggaggca14400137]tttggctcgagtctaaaaaggaaaaatcctttgcttttgattcccgttttgaagcggcct15000138]ttgcgtgcgtga1512
0139]
0140]
0141]
0142]
0143]
0144]
0145]
0146]
0147]
0148]
0149]
0150]
0151]
0152]
0153]
0154]
0155]
0156]
<210>2
<211>503
<212>PRT
<213> Salvia miltiorrhiza Bge. <400>2
Met 1
Leu
Lys Ser His
lie Met Glu Leu Asn 5
Leu Phe Leu Phe
Leu Ser Phe Leu Phe Leu Phe lie 2025
Thr Lys Ser Ala Asn Arg Tyr Ser His
Pro
Arg
65
Gin
Leu
50
Leu
Ser
35
lie
Phe Arg Glu
Ser 40
Leu Met Leu Gly
Gly Asn Leu His 55
Ala Ala Lys His
Thr Ser Ser Thr Leu lie Ala 1015
Phe Leu Lys Tyr Val Thr lie 30
lie Pro Thr Pro Lys Thr Leu 45
Asp Ala Pro His
Leu Gly Glu lie 85
Lys Gin Val Leu Lys
Leu
70
His
Gly
75
Ser
Thr 60
Pro Leu Met His
Ser Val Asp
Phe lie lie Val 90
lie His Asp lie Asn Phe Ala Asn Arg
Leu
95
Pro
Leu
80
Ala
Pro
13
100105110
GlyValAlaGinAspValLeuAlaTyrAsnMetThrAspValValAla
115120125
AlaProTyrGlyAspTyrTrpArgLeuLeuArgLyslieCysThrLeu
130135140
GluLeuLeuSerThrArgArgValGinSerPheArgProlieArgGlu
145150155160
GluGluAsnLeuAsnLeuCysArgTyrLeuAlaSerCysGlyGlySer
165170175
ProAlaAsnLeuSerGluLyslieHisLeuSerSerTyrAspVallie
180185190
ThrArgAlaAlaValGlyThrArgThrThrGlyArgValMetGluSer
195200205
SerVallieSerGlulieSerGluValGlySerGlyPheMetThrAla
210215220
AspPheTyrProSerValArgSerLeuArgTrplieThrlieAlaPro
225230235240
TyrLyslieGinHislieArgArgLysLeuAspLysLeuPheAspSer
245250255
lielieGluGluHisLysSerAsnArgAspLysAspAlaLysTyrGlu
260265270
AspPheValAspValLeuLeuGinlieGinLysAspGlySerlieThr
275280285
ThrAspAsnlieLysAlaValLeuValAspValPheSerAlaGlyThr
290295300
GlyThrSerAlaThrAlaThrGluTrpAlaMetThrGluLeuMetLys
305310315320
AsnProSerThrLeuThrLysAlaGinGluGluValArgArgValPhe
325330335
AspAspLysGlyTyrValAspGluAspLysPheGluGluLeuLysTyr
340345350
LeuLysLeulielieLysGluThrLeuArgPheHisProProThrPro
355360365
LeuLeulieProArglieAsnThrGluArgCysGlulieAsnGlyTyr
370375380
GlulieProAlaGlyThrSerLeulieValAsnAlaTrpAlaLeuGly
385390395400
ArgAspProGluTyrTrpAsnAspProGluLysPhelieProGluArg
405410415
PheGluGluSer
420
ProPheGlySer
435
AlaAsnValGlu
450
LysLeuProLys
465
PheGlySerSer
LeuLysArgPro
500
Ala Val Asp Phe Lys Gly 425
Gly Arg Arg Met Cys Pro 440
Phe lie Leu Ala Thr Leu 455
Gly Met Lys lie Asp Glu 470
Leu Lys Arg Lys Asn Pro 485490
Leu Arg Ala
Asn Asp Leu Gin Tyr Leu 430
Gly lie lie Tyr Gly Leu 445
Leu Tyr His Phe Asp Trp 460
Leu Asp Val Val Glu Ala 475480
Leu Leu Leu lie Pro Val 49權利要求
丹參細胞色素P450(SmP450)基因,其特征在于,它是下列核苷酸序列之一(1)SEQ ID No.1的DNA序列;(2)SEQ ID No.1所示的核苷酸序列添加、取代、插入或缺失一個或多個核苷酸的同源序列或者其等位基因及其衍生的核苷酸序列。
2.丹參細胞色素P450(SmP450),其特征在于,是以下氨基酸序列之一(1)具有SEQID No. 2所示的氨基酸序列;(2)SEQ ID No. 2添加、取代、插入或缺失一個或多個氨基酸的同源序列。
3.重組載體,其特征在于含有權利要求1所述的丹參細胞色素P450(SmP450)基因全 序列或部分序列。
4.活體材料,其特征在于所述活體材料含有權利要求1所述的丹參細胞色素 P450 (SmP450)基因全序列或部分序列。
5.權利要求1所述的基因在丹參育種中的應用。
全文摘要
本發明公開了一種細胞色素P450(SmP450)基因及其編碼的蛋白酶和用途,該基因為首次利用cDNA芯片技術從丹參中克隆而得,填補了從我國傳統名貴中藥材丹參中分離克隆出結構修飾型功能基因細胞色素P450(SmP450)基因的空白。本發明所提供的細胞色素P450(SmP450)基因具有SEQ ID NO.1所示的核苷酸序列或者添加、取代、插入或缺失一個或多個核苷酸的同源序列或其等位基因及其衍生的核苷酸序列。所述基因編碼的蛋白質具有SEQ ID NO.2所示的氨基酸序列或者添加、取代、插入或缺失一個或多個氨基酸的同源序列。本發明提供的細胞色素P450(SmP450)基因可以通過生物技術提高丹參中二萜類活性成分丹參酮類的含量,有助于丹參藥材的品質改良,同時可以進行品種選育,具有很好的應用前景。
文檔編號C12N15/63GK101928715SQ20091014859
公開日2010年12月29日 申請日期2009年6月30日 優先權日2009年6月30日
發明者崔光紅, 張夏楠, 戴住波, 黃璐琦 申請人:中國中醫科學院中藥研究所