專利名稱:一種牛的miRNA靶基因預測分析方法
技術領域:
本發明屬于生物技術領域,涉及一種牛的miRNA靶基因預測分析方法,適用于牛的miRNA靶基因預測分析。
背景技術:
miRNA是一種長度為18 25核苷酸單鏈的內源性非編碼性小RNA。它主要通過與靶標基因3'非翻譯區的完全或不完全配對,抑制其翻譯,從而參與調控個體發育、細胞凋亡、增殖及分化等生命活動。在病理條件下,miRNA可通過調控其靶標基因及其參與的信號通路,影響腫瘤的發生和發展,發揮著類似于癌基因或抑癌基因的功能。實驗表明在很多腫瘤中,一些類型的miRNA是高表達的,這些高表達的miRNA與腫瘤的侵入性、轉移性等有一定的相關性。這些miRNA為腫瘤診斷和治療提供了新的策略。要研究miRNA的作用機制,關鍵在于研究miRNA的靶基因以及它們相互之間的作用,而miRNA的靶基因預測便成了 miRNA首要任務。與miRNA基因預測相比,靶基因的預測具有更大的難度.因為目前已知的miRNA靶基因數量非常有限,不能為預測提供充足的依據,而且對預測的候選基因的鑒定步驟相對繁瑣,很難實現高通量和規模化.從已知的miRNA與靶基因的相互作用中,人們得出小RNA5'端的2 8個核苷酸幾乎無一例外地與靶mRNA 3'端UTR區完全互補,這一特點也被人們用來研究了許多的預測miRNA靶基因的算法。然而,目前大多miRNA預測的算法和軟件都基于miRNA與靶基因的結合位點都在基因的3’ -UTR這一觀點,實際上從2008年末發表的一系列文章表明miRNA與靶基因的結合位點也可能在基因編碼區。本發明所提出的miRNA靶基因預測方法,便是針對這種可能,將預測結果指向于位于序列編碼區的miRNA靶基因。
發明內容
本發明針對牛miRNA靶基因預測,設計了一種新方法,該方法主要的分析步驟為:步驟1、3’ -UTR數據庫的建立。步驟2、對于沒有3 ’ -UTR序列的物種,獲得牛的mRNA序列。步驟3、獲得牛的蛋白序列。步驟4、我們通過編寫PERL腳本程序從mRNA序列中減除編碼蛋白的序列(OTS)從而獲得基因的5’ -UTR和5’ -UTR序列。其中的3’ -UTR序列被收集起來,建立其3’ -UTR序列數據庫。步驟5、對于有公開的3’ -UTR的物種,則直接下載相關的數據。步驟6、靶基因預測由多個軟件分別進行預測,對于有些無法對應的HiiCT0RNA,則參考了 miRGator軟件。我們一般取幾種軟件預測結果的交集,即overlap部分。步驟7、統計分析,將預測得到的靶基因進行統計,以確定最有可能的靶基因。目標是找到對應miRNA最多的5-10個目標靶基因
圖1是本發明所述的一種牛的miRNA靶基因預測分析方法的流程圖。
具體實施例方式我們以牛的miRNA靶基因預測為例,闡述本發明的方法實施過程:(I)、建立編碼區序列數據庫從http://www.ncb1.nlm.nih.gov下載牛的mRNA序列。通過編寫PERL腳本程序從mRNA序列中獲得編碼蛋白的序列,建立編碼區序列數據庫。(2)、在哺乳動物內比對編碼區序列,尋找保守區段。利用在線BLAST 程序(http://www.ncb1.nlm.nih.gov/blast)對哺乳動物編碼區序列進行序列比對,去掉保守性差的編碼區序列,進行下一步的工作。(3)、獲取牛miRNA序列信息從http://microrna.sanger.ac.uk/sequences/ 下載獲得牛的所有已知的 miRNA成熟體序列。(4)、靶基因的預測對于每一個HiiCT0RNA,利用靶基因預測程序掃描所有基因的編碼區,從保守序列中獲得結合位點。使用國際上公認的祀基因預測程序miRanda vl.0b (http://www.microrna.0rg/microrna/getDownloads.do)軟件進行 microRNA 結合位點的預測。以上是對本發明的描述而非限定,基于本發明思想的其它實施方式,均在本發明的保護范圍之中。
權利要求
1.一種基于已有序列數據庫及計算機軟件輔助的、預測分析牛miRNA靶基因的方法,其主要特征在于: 步驟1、3’ -UTR數據庫的建立; 步驟2、對于沒有3’ -UTR序列的物種,獲得牛的mRNA序列; 步驟3、獲得牛的蛋白序列; 步驟4、我們通過編寫PERL腳本程序從mRNA序列中減除編碼蛋白的序列(CDS)從而獲得基因的5’ -UTR和5’ -UTR序列。其中的3’ -UTR序列被收集起來,建立其3’ -UTR序列數據庫; 步驟5、對于有公開的3’ -UTR的物種,則直接下載相關的數據; 步驟6、靶基因預測由多個軟件分別進行預測,對于有些無法對應的microRNA,則參考了 miRGator軟件。我們一般取幾種軟件預測結果的交集,即overlap部分; 步驟7、統計分析,將預測得到的靶基因進行統計,以確定最有可能的靶基因。目標是找到對應miRNA最多的5-10個目標靶基因。
全文摘要
本發明涉及一種牛miRNA靶基因預測分析方法,適用于牛miRNA靶基因的預測。本發明包括如下流程步驟1、3’-UTR數據庫的建立。步驟2、對于沒有3’-UTR序列的物種,獲得牛的mRNA序列。步驟3、獲得牛的蛋白序列。步驟4、我們通過編寫PERL腳本程序從mRNA序列中減除編碼蛋白的序列(CDS)從而獲得基因的5’-UTR和5’-UTR序列。其中的3’-UTR序列被收集起來,建立其3’-UTR序列數據庫。步驟5、對于有公開的3’-UTR的物種,則直接下載相關的數據。步驟6、靶基因預測由多個軟件分別進行預測,對于有些無法對應的microRNA,則參考了miRGator軟件。我們一般取幾種軟件預測結果的交集,即overlap部分。步驟7、統計分析,將預測得到的靶基因進行統計,以確定最有可能的靶基因。
文檔編號G06F19/20GK103164633SQ20111040732
公開日2013年6月19日 申請日期2011年12月9日 優先權日2011年12月9日
發明者曾華宗 申請人:上海聚類生物科技有限公司