專利名稱:牦牛的七種乳蛋白基因序列的制作方法
技術領域:
本發明涉及生物工程領域,尤其是涉及牦牛的七種乳蛋白基因的全序列或部分序列。
動物生物反應器是目前世界范圍內轉基因研究的熱點之一,不僅各國政府投資,一些私人財團也不惜投入大量資金加以研究和開發。
用相似的轉基因動物制作程序,從動物身上獲取外源藥用蛋白質最可能的途徑有幾條,主要為血漿、精液和乳汁等。從轉基因動物血漿中提取重組蛋白質,這是一種可行的辦法,采血不需要殺死動物,這一方法的缺點一方面是采血量受到限制,另一方面一些具有生物活性的蛋白質分泌進血漿對動物健康有一定的影響。而精液中表達外源基因經常會給轉基因動物的育性帶來不良影響。相比之下,泌乳是動物的一種生理活動,對動物健康沒有影響,加之乳腺攝取、合成、分泌蛋白質的能力很強,并且能對重組蛋白質進行多種翻譯后加工,包括β-羥基化,糖基化,γ羥基化等,同時能將重組蛋白質折疊成有功能的構象。因此乳腺成為公認的生產重組蛋白質的理想器官。應用乳腺生產重組蛋白質,一般要求所使用的表達載體的啟動子具有表達上的組織和器官以及發育時期的特異性。目前已有多種具有生物活性的人類蛋白質可以從轉基因動物的乳汁中獲得,這些動物包括小鼠,大鼠,兔、豬、綿羊、山羊等,獲取的重組蛋白包括tPA,α1-AT,蛋白C,hSA,bGH,hAFP,LAtPA等,構建乳腺特異性表達載體使用較多的啟動子有牛、綿羊、山羊的珠蛋白上游調空區,牛β-乳球蛋白基因啟動子(bBLG),綿羊β-乳球蛋白基因啟動子(oBLG),小鼠乳清酸性蛋白啟動子(mWAP),大鼠乳清酸性蛋白啟動子(rWAP)以及兔乳清酸性蛋白啟動子(rWAP)。比較上述幾種上游調空區,其特點為β-珠蛋白基因啟動子驅動下游基因的表達與轉基因插入位點無關、表達水平與整合的拷貝數正相關,但其調控的表達特異性地發生在紅細胞內;bBLG、oBLG具有較強的驅動下游基因表達的能力,所驅動的表達似乎也不表現位置效應;小鼠、大鼠以及兔WAP基因具有很強的驅動下游基因表達的能力,每毫升乳汁中的表達量可達數毫克甚至十多毫克,但其缺點是表達的特異性較差,除了乳汁外,血液中也有相當水平的表達,對動物可能會有某些不良的影響。轉基因動物研究同時還存在著一個及其令人頭痛的問題就是大部分轉基因表達水平極低,而極少部分轉基因表達水平過高。由于位置效應的影響,大部分轉基因(尤其是cDNA)表達水平低得難以檢測,而個別轉基因的表達水平又太高。如Wright等(1991)制作的轉hα1AT基因綿羊,其中一只轉基因羊在產羔后泌乳時,乳汁中hα1AT的水平高達60g/L,泌乳中期乳汁的hα1AT水平仍維持在35g/L,外源基因的這種高水平表達是宿主動物難以承受的。
因此對乳蛋白基因的表達調控進行廣泛深入的研究是非常必要的。對基因表達調控的研究方法很多,其中之一就是對具有不同表達效率的物種的基因表達的調控區成分進行對比分析,從中獲取有用的信息。已有文獻報道牦牛奶蛋白含量約5.5克/100克干物質,其中酪蛋白與奶蛋白總量的61%α-乳清白蛋白約占6.08%,β-乳球蛋白占16.76%,其它蛋白約占16.16%(KattsinA,E.V.1993)而牛的奶蛋白含量約為3.7克/100克干物質,其中酪蛋白占總蛋白含量的80%,β-乳球蛋白約占總蛋白含量的4~5%,α-乳清白蛋白約占總蛋白含量的12%,其它蛋白約占3.5%。因此從奶蛋白的總含量奶蛋白的各成分所占的比例都是有很大差異別的。而牦牛的乳蛋白基因的調控區還沒有人克隆分析過。克隆測定牦牛七種奶蛋白基因序列(全基因或部分序列),分析其調控區所包含的調控成分,并與牛的相應結構進行比較,可能能獲得一些有用的信息。
另外,牦牛(Bos grunniens)是牛亞科牛屬牛亞屬中的一個物種,主要分布在中亞高原地區,一般認為它是由野牦牛馴化而來,是高寒地區的一種主要馱運工具,其品質優良的肉和奶是高原地區人民的主要食品來源,皮毛又是抵御風寒的極品。我國牦牛的數量占世界牦牛總數的90%以上,主要分布在青藏高原,是我國重要的物種資源,然而目前牦牛數量正以驚人的速度下降且有最終絕跡的危險,因此,為了加強牦牛資源的保護和開發利用,對牦牛進行廣泛深入的研究已勢在必行。
作為反芻動物,產乳性狀是一個重要的經濟性狀,牦牛的乳汁具有一些普通牛所不及的特點,如其乳汁具有較高的抗菌活性,而且蛋白含量要比普通牛乳高,但牦牛的產奶量卻很低,因此提高其奶產量同時又保持其優良的奶品質是牦牛育種的一個重要課題。要實現上述目標開發與牦牛產奶性能有關的遺傳標記是一個重要的先決條件,而開發與牦牛產奶性能有關的遺傳標記其首選的候選基因便是奶蛋白基因,然而由于牦牛所處的特殊地理位置和其他的一些原因對牦牛的研究還很有限,分子水平的研究更是如此,目前尚無關于牦牛奶蛋白基因研究的相關報道,因此我們克隆測定的牦牛的七種奶蛋白基因序列為與牦牛產奶性能有關的遺傳標記的開發奠定了基礎。
本發明的目的之一系統地開展了牦牛七種奶蛋白基因的克隆測序工作,獲得了牦牛的七種乳蛋白基因全序列或部分序列。本發明又一目的是為轉基因動物的研究與制作DNA疫苗的開發,基因治療以及與牦牛產奶性能相關的遺傳標記的開發與應用等方面的工作提供了一套全新的調控元件和DNA序列信息。
本發明是按照如下所述實現的本發明根據已發表的普通牛的七種奶蛋白基因相應序列設計并合成了15對引物其引物序列如下引物 擴增范圍(注根據牛的已知序列設計并確定)α-乳白蛋白引物1號F15′TATTTAGTGGTATTGGTGGTTGG 3′ 從68nt到1292nt包括該基因的5′側翼區698ntF25′TATTCTGTGCTGTCATTGTTTTG 3′ 及第一外顯子,第一內含子和部分第二外顯子。2號F35′TCGTCTTTCTTTCAGGGGTC 3 從1205nt到1655nt包括該基因第二外顯子,部F45′AACTTCATCAACCAACTTAG 3′ 分第二內含子。3號F55′GACCAGAACCCTCACTCAAGC 3′ 從1332nt到2519nt包括該基因部分第二外顯F65′CAGAAGCAGCAAAGACAGCAG 3′ 子,第二內含子,第二外顯子,第三內含子,第四外顯子。4號F75′CCATAAAGCACTCTGTTCTG 3′ 從2437nt到3070nt包括該基因的部分第四外F85′CCTTGTGGGCTACCGTCTAT 3′ 顯子和包括加尾信號在內的3’側翼區。β-乳球蛋白引物5號F95′TGTCCAGCCTCCCTCCCATAG 3′從14nt到1200nt位于基因5′側翼區上游
F105′GGGTAGGGGAACAGGAGCAAG 3′6號 F115′CCCCGCTATCAGGAGACACC3′ 從1155nt到2182nt位于基因5′側翼區C號引F125′AGGGAGTGGAGGGCTGAGAC3′ 物下游5′端與C片段重疊45堿基,3′端包括該基因第一外顯子的前11個堿基7號 F135′CGGCTCTCCCTCCCCCACAG3′ 從6259nt到7355nt包括了部分第5內含子,F145′CCCCTTCCAACCGTGACCTC3′ 第6-7外顯子及該基因3′側翼區部分序列β-酪蛋白引物8號 F155′GCTTTCATTTTCTTTCTTCC3′ 從-991nt到-9nt為該基因的5′側翼區F165′ATCTGATTTTGTGGTTGTTT3′ 序列9號 F175′AGAGGATTTCAATGTGAATGC 3′ 從7412nt到8578nt,包括了該基因第8外顯子F185′ATGCCTAAGGGTTAATTTATT 3′,第8內含子及第9外顯子全部序列。Kappa-酪蛋白引物10號 F195′ATTACTTCATACTCAGGTTCTT 3′ 從-397nt到41nt包括該基因的部分第F205′GCTTGGCAGTAGGTTCAGTTGG 3′ 一內含子和5′側翼區序列。11號 F215′CGCTGTGAGAAAGATGAAAGATTC3′ 從1530nt到11310nt包括該基因的第4外顯子F225′AGATTCAAGGAGTATACCAATTGTTG 3′ 和部分第4內含子序列α-S1酪蛋白引物12號 F235′ATGGAAAATCAGAGTTATGGTT 3′ 從-806nt到103nt包括了該基因的第一外顯F245′ATGATGAGACAGAGGAAAAT3′ 子,部分第一內含子及5′側翼區部分序列。13號 F255′GATTTTGTCTTTCTTCTTTTC 3′ 從19596nt到20577nt包括了該基因第19外F265′TTGTGTTTTCCTGATTCTTTG 3′ 顯子43序列及3′側翼部分序列。α-S2酪蛋白引物14號 F275′TAAGCAATAGAAGATAAACTGG 3′ 從-902nt到82nt包括了該基因部分第一內F285′AGGTACATAGAATAACAAAAAG 3′ 含子,全部第一外顯子及5′側翼部分序列。乳鐵蛋白引物15號 F295′CACAAAACAACACAAGGGGTAG 3′ 從-707nt到66nt包括該基因部分第F305′CAGCAGGGCGGGGACGAAGAG 3′ 一外顯子和部分5′側翼序列。應用PCR的方法以牦牛的基因組DNA為模板進行PCR擴增,以獲得各基因的5′側翼序列。其PCR反應條件如下表1 PCR反應的循環參數94℃5分鐘 1個循環94℃1分鐘X℃(具體溫度見附表2)1分鐘30個循環72℃ 2分鐘4℃ 20分鐘 1個循環表2不同引物PCR反應的退火溫度引物序號 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15退火溫度(℃)61 60 68 61 72 68 68 61 61 61 58 61 61 61 68PCR反應體系1~14號引物PCR反應體系為2.5μl 10×Taq DNA聚合酶緩沖液(500mmol/L KCl,100mmol/L Tris·Cl,20mmol/L MgCl2,0.01%明膠),2μl dNTPs(2.5mmol/L for each),1μl引物I(50pmol/μl),引物II(50pmol/μl),1U Taq DNA聚合酶,模板DNA 200ng,終反應體積為25μl。第15對引物的PCR反應體系為2.5μl 10×無鎂離子Taq DNA聚合酶緩沖液(500mmol/L KCl,100mmol/L Tris·Cl,0.01%明膠),1.5μl MgCl2(25mol/μl)2μl dNTPs(2.5mmol/L for each),1μl引物I(50pmol/μl),引物II(50pmol/μl),1U Taq DNA聚合酶,模板DNA 200ng,終反應體積為25μl。
將PCR產物克隆到Invitrogen公司生產的pCRTMII T-載體上,用ABI377 DNA測序儀進行序列分析,重復3次以確保所測序列的準確性。
用GENTYP-MAX8.5等序列分析軟件進行序列分析用Http//www.rwcp.or.ip/lab/pdappl/papia.html網站的TFSEARCHDNA Transcription Factor Binding Site Prediction軟件進行轉錄調控因子結合位點的預測。發明的效果本發明克隆測定了牦牛7種奶蛋白基因(α-乳清蛋白基因全序列、beta-乳球蛋白基因5′及3′端序列、αS1-酪蛋白基因5′及3′端序列、αS2-酪蛋白基因5′及序列、β-酪蛋白基因5′端序列及其第8到第9外顯子的一段序列、kappa-酪蛋白基因5′側翼序列及其第四外顯子和第四內含子序列和乳鐵蛋白基因5′端序列等)的序列,并對這些基因的調控區序列的轉錄調控因子的結合位點進行了預測,證明我們所克隆的α-乳清蛋白、β-乳球蛋白、αS1-酪蛋白、αS2-酪蛋白、β-酪蛋白基因的5′側翼序列包含了乳腺高效特異性表達所需要的大部分轉錄調控因子結合位點序列可直接用于轉基因動物的研究和制作,我們所克隆的kappa-酪蛋白和乳鐵蛋白基因的5′側翼序列包含了該基因完整的啟動子區序列可和其他基因的組織特異性相關序列融合形成嵌合5′調控序列用于轉基因動物的制作、基因治療以及DNA疫苗的研究與開發,而我們所克隆的α-乳清蛋白、β-乳球蛋白、αS1-酪蛋白、kappa-酪蛋白和β-酪蛋白等基因的3′端序列能夠為哺乳動物表達載體的構建提供很好的PolyA加尾信號結構。
另外我們所克隆的上述牦牛奶蛋白基因的所有序列,為開發與牦牛產奶性能相關的分子標記提供了必備的參考信息。
附圖的簡要說明
圖1.為牦牛α-乳清白蛋白基因5′側翼序列,經掃描發現它有兩個潛在功能的TATA盒分別位于-25~-33和-239~-247的位置,契合序列分別為CAAATAAAA和TAAATAAA。其乳腺組織特異性轉錄因子(MGF)的結合位點可能位于-454~-467的位置,核苷酸序列為CACTTCTTTTGTTT,這段序列幾乎在所有的奶蛋白基因中都是保守的(Maritien a.M.1993),另一種乳腺特異性轉錄因子叫做奶蛋白結合因子(MPBF),首先從乳球蛋白基因啟動區中發現,這種因子的結合位點,可能位于-267~-279的位置。另外在-263~-635的位置有一個比較典型的PMF(懷孕特異性核因子)的結合位點(Maritien a.M.1993),在-583~-588的位置上有一個糖皮質激素受體的結合位點(岳軍明,1995),在-55~-67的位置上的這段序列,與溶菌酶基因序列中TGGCA結合蛋白的識別位點的序列有85%的同源性,可能與α-乳清白蛋白的轉錄調控有關。該位點在溶菌酶中起著轉錄調控的作用(Jean Lac Vilotte,1987)。
上述分析結果表明我們所克隆的牦牛的α-乳清白蛋白的這段調控區序列,基本具備了在乳腺中特異性高效表達的各種調控區成分,可它做為外源基因的調控區進行轉基因動物的實驗研究。與牛的相應的調控因子識別位點進行比較,只有AGF識別位點稍有些變化,即比較結果列于此牦牛 CACTTCTTTTGTTT(-454~-467)***** ********牛CACTTGTTTTGTTT(-454~-467)模式序列-RNTTCYTRGAAYY與1993年Martien A.M.等所總結出的MPBF/MGF的模式識別序列相比牦牛的序列似乎比牛的更好一些,當然究竟這種差異有沒有意義,還需進一步的實驗證實。
圖2.為牦牛β-乳球蛋白5′側翼序列,經掃描發現,它有兩潛在的TATA框,分別位于-25~-29和-690~696,它們的序列分別為TATAA和TTTAAAA在-75區附近沒能找到較為典型的CAAT結構,而在-915~-922的位置有一個比較典型的CAAT結構其序列為GTCAATTG。同時我們還找到了5個比較典型的MPBF識別位點,它們分別位于-193~205,-653~664,-1300~-1312,-1967~-1979和-2045~-2056,其序列分別為CCTACCAGGAACC,GGGTCCTGTAGG,TGTTGCAAGAATT,GCAGCTTGGACGT,GTTCCTGGAAGT。有兩個MGF識別位點分別位于-205~-216和-923~-935。它們的序列為CACTTCTGGGGC和AGTTGCTTAGAAT。在-1956~-1964的位置上有一個因子識別位點因子是一種反式調控子,它的抑制基因表達的作用通過激素的作用被解除(岳軍明等1998),在-582~-597的位置上有一個TRE(甲狀腺素受體)識別位點,其序列為CGCAGGGTCAGGTCA。在-1870~-1875處有一個糖皮質激素受體結合位點。與牛的相應序列進行比較(下面僅列出了有差異的序列比較結果)牦牛 MPBF1 GCAGCTTGGACT-1967~-1979牛 MPBF1 GCAGCTCGGACGT -1967~-1979牦牛 MPBF2 CCTACCAGGAACC -193~-205牛 MPBF2 CGTACCAGGAACC -193~205牦牛 MGF AGTTGCTTAGAAT -923~-935牛 MGF ACTTGCTTAGAAT -923~-935模式序列 RNTTCYTRGAAYY (李寧,1997)注R表示嘌呤Y表示嘧啶比較結果表明它們與模式序列的符合度相同,因此它們可能在功能沒有差異。
圖3.為牦牛αS1-酪蛋白5′側翼序列,經掃描可以看出,它具有兩個具有潛在功能的TATA盒分別位于-23~29和-83~-89。其序列都為TTTAAAT。其乳腺組織特異性轉錄因子(MGF)的結合位點位于-87~-100的位置,核苷酸序列為AATTCTTAGAATT另一種乳腺特異性轉錄因子一奶蛋白結合因子(MPBF),基可能的結合位點有兩個分別位于-11~-24和-333~-346的位置,其序列分別為ATAGCTTGGAAGCA和TTGTCCCAAGAATT。但其-139~-158的位置上的序列TCTCCTTAGAATTTCTTGGG,叫做“奶盒”(milk box),是一種類似于CTF/NF-1活性的一般性核轉錄因子的結合位點。而另一種一般性核轉錄因子oct-1在牦牛αS1酪蛋白基因序列上的核心結合位點可能位于-47~-54的位置,序列則是AATTAGCA。因此牦牛αS1酪蛋白基因的乳腺特異性轉錄因子結合位點及其他一些重要調控元件均位于-400~-10之間,在-109~-125處一段鈣敏感蛋白共有序列。其序列為AGAACATTGATTTCCTA與牛的相應的調控元件相比較,沒有發現任何差異。
圖4.為牦牛αS2-酪蛋白基因5′側翼序列,經掃描發現,在-24~-30位置上為一個TATA盒。其序列為TATAAT。在-46~-66位置上鈣敏感酪蛋白的共有序列,它可分類為兩部分,前一部分序列CAAACCAC是與SV40增強電子出版系統很相似的一段序列,后部分為AATTACCATAT是一個Occ1因子識別因子。另一個一般性核轉錄因子Oct1還有三個識別位點,分別位于-208~-218,-257~267和-469~-478的位置。在-87~-100的位置有一個乳腺特異性轉錄因子(MGF)的識別位點,在-330~-344的位置有一個另一種乳腺特異情轉錄因子的識別序列,其序列為TCGTGACTAGAAGAG。在-232~-246的位置上有一段序列與雞的卵黃生成素基因II以上雌激素受體結合位點的序列同源性很高。其序列為GAGCTACACAAACAT。可能與雌激素對奶蛋白的表達調控有關。在-176~-181位置上的TGTTCT是糖皮質激素受體的一部分,可能與糖皮質激素對奶蛋白表達調控有關。在-109~-123的位置上,有一個三種鈣敏感蛋白的共有序列,其序列為AGAAAA GCAATTCTAA,與牛相應的轉錄因子識別位點進行比較,兩個乳腺特異性轉錄識別位點有一些差異茲列如下Yak MPBF TCGTGAC-TAGAACattle MPBF TCGTGACGTAGAAYak MPBF2 CCTACCAGGAACCYak MGFGACTTCTTAGGATCattle MGFGACTTCTTAGGAT圖5.為牦牛β-酪蛋白基因5′側翼序列,經掃描發現,在-26~-35為一個具潛在功能的TATA盒,β-酪蛋白5′側翼區缺乏典型的CCAAT盒。在-45~-65區是αS1、αS2,β-酪蛋白的一段共有序列,其序列為CAAACCACAAAATTAGCATGC,它可被分為兩個部分,其5′端部分CAAACCAC與SV40的增強子結構很相似,而3′端部分ATTAGCAT是一個0ct-1的結合位點。在-90~-103的位置有一個MGF的結合位點其序列為GATTTCTAGGAATT。在-111~-127的位置上,還有另外一個αS1、αS2和β-酪蛋白的共有的一段序列,具體功能還不清楚,其序列為AAGAATTCATTTTCTAA。在-142~-160的位置有一個“奶盒”結構,其序列為GCTCCCCAGAATTTTTGGG。此序列的前半部分即GCTCCCCAGAATT為MPBF的一個結合位點。與牛的相應的轉錄因子契合序列進行比較,沒有發現任何差異。
圖6.為牦牛κ-酪蛋白基因5′側翼序列,由于所克隆的片段太短沒能找到更多的轉錄因子結合位點,在-47~-53處有一個激活蛋白(AP-1)的結合位點,其序列為TGACGCA,在-268~-275的位置上有一個反式調控因子D的結合位點。TATA盒位于-25~-32的位置,其序列為TTTAATTA。在-75~-78的位置上有一個CAAT盒。由此可見牦牛κ酪蛋白基因的轉錄調控因子主要分布在5′側翼區的遠端,因此我們所克隆的此段序列,不適合用作調控區,來表達外源基因。
圖7.為牦牛乳鐵蛋白5′側翼序列,通過掃描我們僅找到兩SP-1蛋白結合位點分別位于-57~-64和-191~-196的位置上,未能找到乳腺特異性轉錄因子的結合位點。其TATA盒位于-24~-28的位置,而一個互補的CAAT盒位于-71~-75的位置。由此可見我們所克隆這一片段不適合于用作調控元件來表達外源基因。
綜上所述,我們所克隆測定了牦牛7種奶蛋白基因(α-乳清蛋白、β-乳球蛋白、αS1-酪蛋白、αS2-酪蛋白、β-酪蛋白、kappa-酪蛋白和乳鐵蛋白基因等)的5′側翼序列,并對這些序列的轉錄調控因子的結合位點進行了預測,證明我們所克隆的α-乳清蛋白、β-乳球蛋白、αS1-酪蛋白、αS2-酪蛋白、β-酪蛋白基因的5′側翼序列包含了乳腺高效特異性表達所需要的大部分轉錄調控因子結合位點序列可直接用于轉基因動物的研究和制作,我們所克隆的kappa-酪蛋白和乳鐵蛋白基因的5′側翼序列包含了該基因完整的啟動子區序列可和其他基因的組織特異性相關序列融合形成嵌合5′調控序列用于轉基因動物的制作、基因治療以及DNA疫苗的研究與開發。
圖8.牦牛α-乳清蛋白基因序列及預測的氨基酸序列注圖中大寫不加邊框的序列為外顯子序列,字母小寫序列為側翼序列或內含子序列,大寫斜體加邊匡的序列為各種表達調控因子識別位點序列,斜體下劃線序列為在牛的序列中為回文結構,但在牦牛的序列中被堿基突變(突變堿基以黑體書寫)打斷而不再是回文結構,印刷體下劃線序列在牦牛和普通牛的序列中都為回文結構,圖中小寫黑體序列為內含子剪切識別位點。
序列分析結果表明牦牛的α-乳清蛋白基因具有與普通牛相似的基因結構即都是由5′側翼區、四個外顯子、三個內含子和3′側翼區構成,通過與牛(Vilotte J.L.et al.1987)的相應序列比較表明牦牛α-乳清蛋白基因全序列與牛的該基因全序列同源性為98%,其中5′側翼序列、外顯子的編碼區和3′側翼區同源性為99%,其所編碼的氨基酸序列同源性也為99%,內含子和3′非編碼區的同源性為98%,5′非編碼區的同源性為93%。
詳細的序列比較結果顯示,在牛的該基因非編碼序列中,存在的一些5至10堿基的回文結構在牦牛的序列中因堿基突變而消失(如圖4所示)。尤其是其中的-1~-10和+16~+25的序列在牛的序列中為回文結構,而在牦牛的序列中因兩個堿基的變異而被破壞,由于基因結構中非編碼序列的回文結構對基因的表達調控有一定的作用,而牦牛乳中的α-乳清白蛋白占總奶蛋白的6.08%(王永等,1998;汪玉松等,1995),在普通牛卻只占3.6%(汪玉松等,1995),因此可以推斷這些回文結構的破壞是該基因在牦牛中有較高水平表達的原因。
圖9牦牛αS1-酪蛋白基因3′端序列其包括的外顯子部分為黑體大寫部分,下劃線部分為PolyA加尾信號結構。
圖10牦牛β-乳球蛋白基因3′端序列字母小寫部分為內含子序列或3′側翼序列,大寫部分為外顯子序列,下劃線部分為PolyA加尾信號。
圖11牦牛kappa-酪蛋白基因3′端序列大寫字母部分為第四外顯子部分,大寫字母并斜體部分為編碼區部分,非斜體部分為3′非編碼區,小寫字母部分為3′側翼序列,下劃線部分為PolyA加尾信號部分。
圖12牦牛β-酪蛋白基因3′端序列大寫字母部分為外顯子部分,小寫字母部分為內含子序列部分,下劃線部分為PolyA加尾信號結構部分從圖8-12可以看出我們所克隆測定的牦牛α-乳清蛋白基因、β-乳球蛋白基因、αS1-酪蛋白基因、kappa-酪蛋白基因以及β-酪蛋白基因的3′端序列都具備了制作哺乳動物表達載體所需要的PolyA加尾信號結構,可用與哺乳動物表達載體的構建,從而用于轉基因動物的制作、基因治療以及DNA疫苗等。
實施例材料與方法一、材料1.①奶牛血樣中國Holstein奶牛血樣采用北京市雙橋農場雙橋牛場。②牦牛血樣青海高原型牦牛,采自青海省大通牛場。牦牛組織樣其中30頭采自青海省西寧市,由青海海北畜牧科學研究所何成基先生負責采集。另外30頭由青海畜牧獸醫研究所的羅曉林先生提供這60頭牦牛均屬于青海高原型。2.菌種大腸桿菌DH5α、大腸桿菌JM101及大腸桿菌JM109均為本室保存。3.質粒pCRTMII購自Invertrogen公司。4.酶及試劑各種限制性內切酶、RNase、蛋白酶K、IPTG、X Gal、堿性磷酸酶、T 4 DNA連接酶等購自華美生物工程公司和美國Promega公司。Taq酶為本室提供。其余化學試劑為國產、進口分裝或進口。5.試劑盒GENECLEANII Kit為美國Bio 101公司產品。Dyeprimer sequencing Kit購自PE公司二、溶液配制培養基、試劑的配制若無特別要求,均以重蒸水為溶劑,高壓滅菌條件為15lbf/in 2(1.034×105Pa)蒸氣滅菌20分鐘。1.培養基配制(1)LB液體培養基蛋白胨10g,酵母粉5g,NaCl 10g,溶于800ml水中,調節pH值至7.5,定容至1000ml,高壓滅菌。(2)LB固體培養基蛋白胨10g,酵母粉5g,NaCl 10g,溶于800ml水中,加瓊脂粉15g,調節pH值至7.5,定容至1000ml,高壓滅菌。2.STE緩沖液0.1mol/L NaCl,10mmol/L Tris·Cl(pH8.0),1mmol/L EDTA(pH8.0),高壓滅菌。3.質粒提取溶液I50mmol/L葡萄糖,25mmol/L Tris·Cl(pH8.0),10mmol/L EDTApH8.0),10 lbf/in 2(6.895×104Pa)高壓下蒸氣滅菌15分鐘。4.質粒提取溶液II0.2mmol/L NaOH,1%SDS,現用現配。5.質粒提取溶液III5mol/L乙酸鉀60ml,冰乙酸11.5ml,水28.5ml,4℃保存。6.4N NaOH80g NaOH溶于400ml水中,定容至500ml。7.10%SDS100g SDS溶于90ml水中,加熱至68℃助溶,用HCl調pH值至7.2,定容至1000ml。8.1mol/L Tris·Cl(pH8.0)121.1g Tris堿,溶于800ml水中,用HCl調節pH值至8.0,定容至1000ml。高壓滅菌。9.0.5mol/L EDTA(pH8.0)186.1g二水乙二胺四乙酸二鈉加入800ml水中,加NaOH調pH值至8.0,定容至1000ml。高壓滅菌。10.10mol/L乙酸銨770g乙酸銨溶解于800ml水中,加水定容到1000ml后過濾除菌。11.13%(w/v)PEG800將0.13g PEG8000溶于1ml 1.6mol/L NaCl中(現用現配)。12.溶菌酶溶液10mg/ml,溶于10mol/L Tris·Cl(pH8.0)中。13.RNase溶液將RNase溶于10mol/L Tris·Cl(pH8.0)中,15mmol/LNaCl中,配成10mg/ml的濃度,于100℃,煮沸15分鐘。14.TE緩沖液(pH8.0)10mmol/L NaCl,10mmol/L Tris·Cl(pH8.0),1mmol/L EDTA(pH8.0),高壓滅菌。15.5mol/L LiClLiCl·2H2O 302.05g完全溶于800ml水后定容至1000ml,高壓滅菌。16.50×TAE242g Tris堿,57.1ml冰乙酸,100ml 0.5mol/L EDTA(pH8.0),溶解后定容至1000ml。17.氨芐青霉素(Amp)貯存液100mg/ml氨芐青霉素鈉,保存于-20℃。18.5mol/L NaCl292.2g NaCl溶于800ml水中,定容至1000ml,高壓滅菌。19.IPTG溶液1g IPTG溶于5ml水中,過濾除菌分裝成1ml/份,貯存于-20℃。20.x-gal用二甲基甲酰胺溶解5-溴-4-氯-3-吲哚-β-D-半乳糖苷配成20mg/ml貯存液,避光保存于-20℃。21.3mol/L NaAc(pH5.2)24.604g無水乙酸鈉溶于80ml水中,用冰乙酸調節pH值至5.2,定容至100ml,高壓滅菌。22.1mol/L CaCl2在200ml水中溶解54g CaCl2·6H2O,過濾除菌,分裝成10ml每份,貯于-20℃,制備感受態時取出一份稀釋至100ml,過濾除菌,預冷備用。23.溴化乙錠貯存液在100ml水中加入1g溴化乙錠,溶解后于4℃棕色瓶內保存。24.6×凝膠加樣緩沖液0.25%溴酚藍,0.25%二甲苯青FF,30%甘油水溶液,4℃保存。25.ACD抗凝劑0.48g檸檬酸,1.32g檸檬酸鈉,1.47g葡萄糖,溶于100ml水中;高壓滅菌。26.DNA提取抽提緩沖液1mmol/L Tris·Cl(pH8.0),0.1mol/L EDTA(pH8.0),20μg/ml胰RNase,0.5%SDS。27.2×Cracking buffer0.2N NaOH,0.5%SDS,20%蔗糖。28.飽和酚新蒸苯酚,加入羥基喹啉至終濃度0.1%,加入等體積0.5mol/L Tris·Cl(pH8.0)混合攪拌15分鐘,兩相分開后移去上層,用等體積0.1mol/L Tris·Cl(pH8.0)重復抽提至酚相pH值大于7.8,保存于4℃棕色瓶中并處于10mmol/L Tris·Cl(pH8.0)覆蓋之下。29.酚∶仿(1∶1)等體積苯酚、氯仿混合,保存于4℃,棕色瓶中。30.蛋白酶(K溶液)用水配成20mg/ml,-20℃保存。31.磷酸緩沖液(PBS)在800ml蒸餾水中溶解8g NaCl,0.2g KCl,1.44g Na2HPO4和0.24g KH2PO4,用于HCl調節pH值至7.4,加水定容到1000ml,高壓滅菌。32.10×Taq酶buffer100mmol/L Tris·Cl(pH8.0),500mmol/L KCl,20mmol/L MgCl2,0.1%明膠。三、實驗步驟1.哺乳動物基因組DNA提取(血樣)(1)凍存血樣(20ml)室溫(或55℃水浴)融化,加入等體積磷酸緩沖液,混勻,3500g離心15分鐘,棄上清,加入15ml抽提液重懸沉淀。(2)37℃保溫1小時。(3)加蛋白酶K至終濃度為100μg/ml,混勻。(4)55℃水浴中消化,時間視溶液變粘稠至透亮為止,消化過程中不時輕輕搖勻反應液。(5)加入等體積的苯酚、酚∶氯仿各抽提一次。抽提時,溫和轉動離心管,混合兩相,然后室溫5000g,離心15分鐘,吸出上層水相,移至另一干凈離心管中。(6)加入0.2倍體積的10mol/L乙酸銨和2倍體積的無水乙醇,室溫下輕輕搖勻。(7)DNA量多時,挑出乳白色絮狀沉淀。無明顯沉淀形成時,可放于-20℃過夜,5000g離心15分鐘,收集沉淀。70%醇洗。(8)真空抽干,但不能將DNA抽得太干,不見管底與管壁上的酒精即可。(9)加適量TE溶解。(10)檢測DNA質量與濃度。2.組織中基因組DNA的提取(高鹽法)風干組織后取少量剪碎后直接按下進行,70%酒精浸泡過的組織剪碎后,真空抽干后再按下步進行。(1)加入1ml DNA抽提液,10μl蛋白酶K(10mg/ml),于55℃消化24小時,中間補加1次等量蛋白酶K。(2)分裝為400μl管,每管加預熱5M NaCl 170μl,使NaCl終濃度為1.5M,混勻。(3)加570μl苯酚∶氯仿(1∶1)抽提1次。(4)12000rpm離心15分鐘,界面上可見一深色蛋白層,取上清液,加2倍體積無水乙醇沉淀DNA,70%乙醇洗2次,稍抽干,溶于TE中,4℃或-20℃長期保存。3.基因組DNA的純化(參見《分子克隆實驗指南》,第二版〖美國〗J.薩姆布魯克等編,全冬雁等譯的相關章節)。4.PCR引物的設計引物 擴增范圍(注根據牛的已知序列設計并確定)α-乳白蛋白引物1號 F15′ TATTTAGTGGTATTGGTGGTTGG 3′ 從68nt到1292nt包括該基因的5′側翼區698ntF25′ TATTCTGTGCTGTCATTGTTTTG 3′ 及第一外顯子,第一內含子和部分第二外顯子。2號 F35′ TCGTCTTTCTTTCAGGGGTC 3′ 從1205nt到1655nt包括該基因第二外顯子,部F45′ AACTTCATCAACCAACTTAG 3′ 分第二內含子。3號 F55′ GACCAGAACCCTCACTCAAGC 3′ 從1332nt到2519nt包括該基因部分第二外顯F65’ CAGAAGCAGCAAAGACAGCAG 3′ 子,第二內含子,第二外顯子,第三內含子,第四外顯子。4號 F75′ CCATAAAGCACTCTGTTCTG 3′ 從2437nt到3070nt包括該基因的部分第四外F85′ CCTTGTGGGCTACCGTCTAT 3′ 顯子和包括加尾信號在內的3’側翼區。β-乳球蛋白引物5號 F95′ TGTCCAGCCTTCCCTCCCATAG3′ 從14nt到1200nt位于基因5′側翼區上游F105′GGGTAGGGGAACAGGAGCAAG 3′6號 F115′CCCCGCTATCAGGAGACACC 3′ 從1155nt到2182nt位于基因5′側翼區C號引F125′AGGGAGTGGAGGGCTGAGAC 3′ 物下游,5′端與C片段重疊45堿基,3′端包括該基因第一外顯子的前11個堿基7號 F135′CGGCTCTCCCTCCCCCACAG3′從6259nt到7355nt包括了部分第5內含子,F145′CCCCTTCCAACCGTGACCTC3′第6-7外顯子及該基因3′側翼區部分序列β-酪蛋白引物8號 F155′GCTTTCATTTTCTTTCTTCC3′從-991nt到-9nt為該基因的5′側翼區F165′ATCTGATTTTGTGGTTGTTT3′序列9號 F175′AGAGGATTTCAATGTGAATGC 3′從7412nt到8578nt,包括了該基因第8外顯子F185′ATGCCTAAGGGTTAATTTATT 3′,第8內含子及第9外顯子全部序列。Kappa-酪蛋白引物10號F195′ATTACTTCATACTCAGGTTCTT 3′從-397nt到41nt包括該基因的部分第F205′GCTTGGCAGTAGGTTCAGTTGG 3′一內含子和5′側翼區序列。11號F215′CGCTGTGAGAAAGATGAAAGATTC3′從1530nt到11310nt包括該基因的第4外顯子F225′AGATTCAAGGAGTATACCAATTGTTG 3′和部分第4內含子序列α-S1酪蛋白引物12號F235′ATGGAAAATCAGAGTTATGGTT 3′從-806nt到103nt包括了該基因的第一外顯F245′ATGATGAGACAGAGGAAAAT3′子,部分第一內含子及5′側翼區部分序列。13號F255′GATTTTGTCTTTCTTCTTTTC 3′從19596nt到20577nt包括了該基因第19外F265′TTGTGTTTTCCTGATTCTTTG 3′顯子43序列及3′側翼部分序列。α-S2酪蛋白引物14號F275′TAAGCAATAGAAGATAAACTGG 3′從-902nt到82nt包括了該基因部分第一內F285′AGGTACATAGAATAACAAAAAG 3′含子,全部第一外顯子及5′側翼部分序列。乳鐵蛋白引物15號F295′CACAAAACAACACAAGGGGTAG 3′從-707nt到66nt包括該基因部分第F305′CAGCAGGGCGGGGACGAAGAG 3′一外顯子和部分5′側翼序列。5.引物濃度的測定分光光度計測OD260值,引物濃度按下式計算C(μM)=OD260×100×稀釋倍數/1.54×NA+0.74×NC+0.87×NT+0.74×NGN代表各堿基的數目。根據測定結果,將部分引物稀釋到50pmol/μl。6.PCR反應條件此次所用引物其PCR反應條件中除退火條件外,其它可完全相同,故為簡便起見,下面先列出一個模板程序見表3,然后再將各引物的退火溫度列出見表4表3 PCR反應的循環參數94℃5分鐘 1個循環94℃1分鐘X℃(具體溫度見附表2)1分鐘30個循環72℃2分鐘4℃ 20分鐘 1個循環表4不同引物PCR反應的退火溫度引物序號 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15退火溫度(℃)61 60 68 61 72 68 68 61 61 61 58 61 61 61 68PCR反應體系1~14號引物PCR反應體系為2.5μl 10×Taq DNA聚合酶緩沖液(500mmol/L KCl,100mmol/L Tris·Cl,20mmol/L MgCl2,0.01%明膠),2μl dNTPs(2.5mmol/L for each),1μl引物I(50pmol/μl),引物II(50pmol/μl),1U Taq DNA聚合酶,模板DNA 200ng。第15對引物的PCR反應體系為2.5μl 10×無鎂離子Taq DNA聚合酶緩沖液(500mmol/L KCl,100mmol/L Tris·Cl,0.01%明膠),1.5μl MgCl2(25mol/μl)2μl dNTPs(2.5mmol/L for each),1μl引物I(50pmol/μl),引物II(50pmol/μl),1U Taq DNA聚合酶,模板DNA 200ng。7.連接反應(1)計算外源片段與載體的量插入DNA(ng)=載體(ng)×插入DNA的大小(kb)/載體的大小(kb)×插入片段與載體的分子比。一般插入片段分子∶載體分子=3~8∶1(2)連接反應體系(10μl)50ng 載體DNA適量 外源DNA1μl T4DNA連接酶10×buffer1~2U T4DNA連接酶補加水至10μl(3)14~16℃溫育8~12小時。(4)取5μl連接液轉化,其余-20℃凍存。8.感受態細胞的制備(參見《分子克隆實驗指南》,第二版〖美國〗J.薩姆布魯克等編,全冬雁等譯的相關章節)9.DNA轉化(參見《分子克隆實驗指南》,第二版〖美國〗J.薩姆布魯克等編,全冬雁等譯的相關章節)10.重組質粒快速初步鑒定(1)取一加有X gal,IPTG和Amp的LB平板。(2)挑取轉化白斑劃線,同時挑一藍斑劃線為對照。(3)37℃培養12小時。(4)挑取培養好的菌體懸浮于50μl預冷STET溶液離心管中。(5)100℃水浴中煮費40秒。(6)12000rpm,離心5分鐘。(7)用槍頭將離管中底部沉淀挑出。(8)取上清10μl點樣電泳。(9)紫外燈下比較來自白色菌落及藍色菌落的DNA遷移速率,條帶明顯滯后的質粒可能含有插入片段,為重組質粒。11.質粒DNA的小規模提取(堿裂解法)(參見《分子克隆實驗指南》,第二版〖美國〗J.薩姆布魯克等編,全冬雁等譯的相關章節)12.質粒DNA的大規模提取(堿裂解法)(參見《分子克隆實驗指南》,第二版〖美國〗J.薩姆布魯克等編,全冬雁等譯的相關章節)13.質粒DNA純化方法(參見《分子克隆實驗指南》,第二版〖美國〗J.薩姆布魯克等編,全冬雁等譯的相關章節)14.DNA的酶切(用于制備外源片段、鑒定陽性克隆)(參見《分子克隆實驗指南》,第二版〖美國〗J.薩姆布魯克等編,全冬雁等譯的相關章節等)(1)取一定量載體pGEM 5zf(+)用Sca I酶切完全。(2)酚∶仿抽提。(3)乙醇沉淀。(4)離心棄上清,真空抽干,適當水溶解。(5)測定DNA的濃度及純度。15.DNA片段電泳(參見《分子克隆實驗指南》,第二版〖美國〗J.薩姆布魯克等編,全冬雁等譯的相關章節)16.DNA片段的回收(參見《分子克隆實驗指南》,第二版〖美國〗J.薩姆布魯克等編,全冬雁等譯的相關章節)17.測序測序反應按Dyeprimer Sequencing試劑盒(PE公司)說明書進行,核苷酸順序確定在ABI377全自動序列儀(ABI公司)上進行。每一克隆的序列測定需經三次重復以確保所測序列的準確性。18.序列分析用GENTYP-MAX8.5等序列分析軟件進行序列分析用Http//www.rwcp.or.ip/lab/pdappl/papia.html網站的TFSEARCHDNA Transcription Factor Binding Site Prediction軟件進行轉錄調控因子結合位點的預測。
通過上述步驟我們克隆測定了牦牛7種奶蛋白基因(α-乳清蛋白、β-乳球蛋白、αS1-酪蛋白、αS2-酪蛋白、β-酪蛋白、kappa-酪蛋白和乳鐵蛋白基因等)的序列(全序列或部分序列),并對這些序列調控區部分的轉錄調控因子的結合位點進行了預測,證明我們所克隆的α-乳清蛋白、β-乳球蛋白、αS1-酪蛋白、αS2-酪蛋白、β-酪蛋白基因的5′側翼序列包含了乳腺高效特異性表達所需要的大部分轉錄調控因子結合位點序列可直接用于轉基因動物的研究和制作,我們所克隆的kappa-酪蛋白和乳鐵蛋白基因的5′側翼序列包含了該基因完整的啟動子區序列可和其他基因的組織特異性相關序列融合形成嵌合5′調控序列用于轉基因動物的制作、基因治療以及DNA疫苗的研究與開發。我們所克隆測定的牦牛α-乳清蛋白、β-乳球蛋白、αS1-酪蛋白、kappa-酪蛋白和β-酪蛋白等基因的3′端序列具備了構建哺乳動物表達載體所需要的PolyA加尾信號結構,可用于哺乳動物表達載體的構建。這些表達載體可用于轉基因動物的制作、DNA疫苗的研制、基因治療等方面。同時我們所克隆得到的牦牛七種奶蛋白基因序列有為與牦牛奶產量相關的遺傳標記的開發提供了必備的參考信息。
權利要求
1.牦牛α-乳清蛋白基因序列,它是附圖8所述的序列。
2.牦牛α-乳清白蛋白基因5′側翼序列,它是附
圖1所述的序列。
3.牦牛β-乳球蛋白5′側翼序列,它是附圖2所述的序列。
4.牦牛α S1-酪蛋白5′側翼序列,它是附圖3所述的序列。
5.牦牛α S2-酪蛋白基因5′側翼序列,它是附圖4所述的序列。
6.牦牛β-酪蛋白基因5′側翼序列,它是附圖5所述的序列。
7牦牛κ-酪蛋白基因5′側翼序列,它是附圖6所述的序列。
8.牦牛乳鐵蛋白5′側翼序列,它是附圖7所述的序列。
9.牦牛αS1-酪蛋白基因3′端序列,它是附圖9所述的序列。
10.牦牛β-乳球蛋白基因3′端序列,它是附
圖10所述的序列。
11.牦牛kappa-酪蛋白基因3′端序列,它是附
圖11所述的序列。
12.牦牛β-酪蛋白基因3′端序列,它是附
圖12所述的序列。
全文摘要
本發明公開了牦牛的7種乳蛋白基因全序列和部分序列:α-乳清蛋白基因全序列,α-乳清白蛋白基因5′側翼序列,β-乳球蛋白基因5′側翼和3′端序列,αS1-酪蛋白基因5′側翼和3′端序列,αS2-酪蛋白基因5′側翼序列,β-酪蛋白基因5′側翼和3′端序列,kappa-酪蛋白基因5′側翼和3′端序列,和乳鐵蛋白基因5′側翼序列。
文檔編號C12N15/12GK1357627SQ00134189
公開日2002年7月10日 申請日期2000年12月8日 優先權日2000年12月8日
發明者李寧, 樊寶良, 吳常信 申請人:李寧