專利名稱:組合物以及用于生產蛋白質的方法
技術領域:
本發明提供了大體上關于蛋白質生產領域的方法。確切地,本發明提供了一種選擇用于生產感興趣多肽的mRNA的方法。
背景技術:
許多因素影響蛋白質生產,包括基因拷貝數目、基因位點、轉錄以及翻譯效率、轉錄因子以及mRNA穩定性。已經將努力集中在為了增加蛋白質生產而操縱這些因素以及其他因素的技術的開發上。因此,例如,在文獻中發現眾多通過改變密碼子的使用來增加蛋白質表達的報道,使得這種合成基因趨近為一種用于蛋白質表達的常見的策略。盡管有報道的優點,實驗的觀察常常強調在異源蛋白生產效率的確定中其他因素的重要性。因此,還沒有設計出用于提供在所需蛋白質生產中的可預測性水平的方法。因此,本發明通過那些提供用于對以所希望的量生產一種感興趣蛋白質的一種mRNA進行選擇的方法來解決本領域中的上述缺點。發明概述本發明的一個第一方面提供了一種選擇用于生產感興趣多肽的mRNA的方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列山)對(a)的每個單獨mRNA序列確定一種或多種下列參數:(i)整體自由能(EFE) ;(ii)在一種熱力學整體中的最小自由能頻率(FMFE) RNA 二級結構;以及(iii)整體多樣性(ED) ;c)根據在步驟(b)中確定的這些參數,對該陣列中的這些單獨mRNA序列評等級;并且d)選擇來自步驟(c)的分等級陣列中的一個mRNA序列,其中該選擇的mRNA生產該感興趣多肽。本發明的另一方面提供了一種選擇用于生產感興趣多肽的mRNA的方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列山)對(a)中的每個單獨mRNA序列的最小自由能(MFE)RNA 二級結構進行確定;c)對(a)中的每個單獨mRNA序列的一種或多種下列參數進行確定:(i)在一種熱力學整體中的最小自由能頻率(FMFE)RNA 二級結構;以及(ii)整體多樣性(ED);d)根據在以上步驟(b)和(c)中確定的這些參數的聯合分布,對該陣列中的這些單獨mRNA序列評等級;并且e)選擇來自步驟(d)的該分等級陣列中的一個mRNA序列,其中該選擇的mRNA生廣該感興趣多妝。
在其他方面,本發明提供了一種選擇用于生產感興趣多肽的mRNA的方法,該方法包括:a)生產一個陣列的單獨的mRNA序列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列山)對(a)中的每個單獨mRNA序列的整體自由能(EFE)進行確定;
c)對(a)每個單獨mRNA序列確定一種或多種下列參數:(i)在一種熱力學整體中的最小自由能頻率(FMFE) RNA 二級結構;以及(ii)整體多樣性(ED);d)根據在以上步驟(b)和(c)中確定的這些參數的聯合分布,對該陣列中的這些單獨mRNA序列評等級;并且e)選擇來自步驟(d)的該分等級陣列中的一個mRNA序列,其中該選擇的mRNA生產該感興趣多肽。本發明進一步提供了一種選擇用于增強生產感興趣多肽的mRNA方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列山)對(a)中的每個單獨mRNA序列的最小自由能(MFE)RNA 二級結構以及(a)中的每個單獨mRNA序列的在一個熱力學整體中的最小自由能頻率(FMFE) RNA 二級結構進行確定;c)根據以上步驟(b)中這些確定的MFE和FMFE的聯合分布對該陣列中的這些單獨mRNA序列評等級;并且d)從步驟(c)的該分等級陣列中選擇一種mRNA序列,其中該mRNA是選自具有MFE RNA 二級結構最高值以及FMFE RNA 二級結構最低值的分等級陣列中大約0.0001%至大約20%的這些序列之中,或選自具有如在室溫下測量的在從大約Okcal/mol至大約_2kcal/mol范圍內的MFE RNA 二級結構以及FMFE RNA 二級結構最低值的這些mRNA序列的mRNA之中,其中與野生型mRNA序列相比,該選擇的mRNA序列的表達導致該感興趣多肽的增強生產。本發明的另外一方面提供了一種選擇用于減少生產感興趣多肽的mRNA方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列山)對(a)中的每個單獨mRNA序列的最小自由能(MFE)RNA 二級結構以及(a)中的每個單獨mRNA序列的在一個熱力學整體中的最小自由能頻率(FMFE)RNA二級結構進行確定;c)根據以上步驟(b)中這些確定的MFE和FMFE的聯合分布對該陣列中的這些單獨mRNA序列評等級;并且d)從步驟(c)的該分等級陣列中選擇一種mRNA序列,其中該mRNA是選自該具有MFERNA 二級結構最低值以及FMFE RNA 二級結構最高值的分等級陣列中的大約0.0001%至大約20%的這些序列之中,或選自具有如在室溫下測量的在從大約_9kcal/mol至大約-18kcal/mol范圍內的MFE RNA 二級結構以及FMFERNA 二級結構最高值的這些mRNA 序列之中,其中與野生型mRNA序列相比,該選擇的mRNA序列的表達導致該感興趣多肽的減少生產。本發明的其他方面提供了一種選擇用于增強生產感興趣多肽的mRNA方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同的核苷酸序列山)對(a)中的每個單獨mRNA序列的整體自由能(EFE)以及(a)中的每個單獨mRNA序列的在一個熱力學整體中的最小自由能頻率(FMFE) RNA 二級結構進行確定;并且c)根據以上步驟(b)中這些確定的EFE和FMFE的聯合分布對該陣列中的這些單獨mRNA序列評等級;并且d)從步驟(c)的該分等級陣列中選擇一種mRNA序列,其中該mRNA是選自該具有EFE最高值以及FMFE RNA 二級結構最低值的分等級陣列中的大約0.0001%至大約20%的這些序列之中,其中與野生型mRNA序列相比,該選擇的mRNA序列的表達導致該感興趣多肽的增強生產。在仍其他方面中,本發明提供了一種選擇用于減少生產感興趣多肽的mRNA方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同的核苷酸序列;b)對(a)中的每個單獨mRNA序列的整體自由能(EFE)以及在一個熱力學整體中的最小自由能頻率(FMFE)RNA 二級結構進行確定;c)根據以上步驟
(b)中這些確定的EFE和FMFE的聯合分布對該陣列中的這些單獨mRNA序列評等級;并且d)從步驟(c)的該分等級陣列中選擇一種mRNA序列,其中該mRNA是選自該具有EFE最低值以及FMFE RNA 二級結構最高值的分等級陣列中的大約0.0001%至大約20%的這些序列之中,其中與野生型mRNA序列相比,該選擇的mRNA序列的表達導致該感興趣多肽的減少生產。本發明進一步提供了一種選擇用于生產感興趣多肽的mRNA的方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同的核苷酸序列;b)對(a)中的每個單獨mRNA序列的最小自由能(MFE) RNA 二級結構進行確定;c)根據在(b)中該確定的MFERNA 二級結構,從最高的MFE RNA 二級結構至最低的MFERNA 二級結構,對該陣列中的這些單獨mRNA序列評等級;并且d)從步驟(c)的該分等級陣列中選擇一種mRNA序列,其中該mRNA是選自下列各項:具有在從大約Okcal/mol至大約-2kcal/mol范圍內的MFE RNA 二級結構的mRNAs組,具有在從大約_2kcal/mol至大約_9kcal/mol范圍內的MFERNA 二級結構的mRNAs組,或具有在從大約_9kcal/mol至大約-18kcal/mol范圍內的MFE RNA 二級結構的mRNAs組,其中該選擇的mRNA生產該感興趣多肽。此外還提供了一種選擇用于增強生產感興趣多肽的mRNA方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列山)對(a)中的每個單獨mRNA序列的最小自由能(MFE) RNA 二級結構進行確定;并且c)選擇(a)中的一種具有在從大約Okcal/mol至大約_2kcal/mol范圍內的MFE RNA二級結構的mRNA序列,其中與野生型mRNA序列相比,該選擇的mRNA序列的表達導致該感興趣多肽的增強生產。在本發明的另外一方面中,提供了一種選擇用于減少生產感興趣多肽的mRNA方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列山)對(a)中的每個單獨mRNA序列的最小自由能(MFE) RNA二級結構以及(a)中的每個單獨mRNA序列的表達水平進行確定;c)選擇(a)中的一種具有在從大約_9kcal/mol至大約-18kcal/mol范圍內的MFE RNA 二級結構的mRNA序列,其中與野生型mRNA序列相比,該選擇的mRNA序列的表達導致該感興趣多肽的增強生產。在本發明的某些實施方案中,提供了對一種生物細胞中的感興趣多肽的生產進行修飾的方法,該方法包括:(a)根據本發明的這些方法選擇一種對感興趣多肽進行編碼的mRNA ; (b)對(a)中mRNA的核苷酸序列進行突變以生產一種突變的mRNA,與(a)中mRNA的核苷酸序列的MFE RNA 二級結構相比,該突變的mRNA具有增加的或減少的MFE RNA 二級結構,并且與(a)中mRNA編碼的多肽序列相比,該突變的mRNA編碼一種突變的多肽序列;其中該突變的多肽序列保留了由(a)的mRNA編碼的多肽的功能,并且在一種生物細胞中該突變的mRNA序列與野生型mRNA序列相比其表達導致該感興趣多肽的修飾的生產。在本發明的另外的實施方案中,提供了對一種生物細胞中的感興趣多肽的生產進行修飾的方法,該方法包括:(a)根據本發明的這`些方法選擇一種對感興趣多肽進行編碼的mRNA ; (b)對在這種根據(a)選擇的mRNA的核苷酸序列與所述生物的一種野生型內源核苷酸序列之間的差別進行鑒別,其中該野生型內源核苷酸序列編碼了一種感興趣多肽,該感興趣的多肽與這種根據(a)選擇的mRNA所編碼的多肽相同;并且(c)對這種編碼該感興趣多肽的內源核苷酸序列進行原位突變以將(b)中所鑒別的核苷酸的每個差別合并進該內源核苷酸序列中,由此在該生物的細胞中來自該原位突變的內源核苷酸序列的該感興趣多肽的生產被修飾。通過閱讀以下說明書并且參照形成其一部分的附圖、或出于披露目的給出的本發明的實施方案的任何實例,其他的以及進一步的目的、特征以及優點將會清楚并且更易于理解。附圖簡要說明
圖1是一個流程圖,展示了根據本發明的某些實施方案的操作。圖2是一個框圖,展示了根據本發明的某些實施方案的系統。圖3顯示了用載體構建體滲入的葉的樣品中,在煙草瞬態系統中用AmCyan (CFP)對N-末端ssRubisco (核酮糖-1,5- 二磷酸羧化酶)葉綠體轉運肽的不同變體[表2]進行編碼的AmCyan轉錄物的水平(A)以及AmCyan相對于PPO的mRNA水平(B)。圖4顯示了 CFP (AmCyan)變體的蛋白質生產水平(ELISA)與它們的最小自由能水平(A)以及它們的整體自由能水平(B)之間的相關性。
圖5顯示了 AmCyan (CFP)變體的蛋白質生產水平(ELISA)與它們的最小自由能水平(A)以及它們的整體自由能水平(B)之間的相關性。CFP=AmCyan[藍綠色熒光蛋白]表達水平;CFP*(23.3PP0)=CFP表達水平,相對于PPO (來自相同的煙草瞬態載體)表達水平的歸一化。圖6顯示在酵母系統中計算的mRNA折疊能量與蛋白質(ELISA)生產的相關性,相對于測量的轉錄水平(qRT-PCR)歸一化。圖7顯示了酵母系統中AmCyan (CFP)變體的蛋白質生產水平(ELISA)與它們的整體自由能水平之間的相關性。發明詳細說明本說明書并非旨在成為實施本發明的所有的不同方法、或所有的加至本發明的特征的詳細目錄。例如,對于一個實施方案所展示的特征可以結合在其他實施方案中,并且對于一個特定的實施方案所展示的特征可以從那個實施方案中刪除。此外,鑒于本披露內容,在此建議的不偏離本發明的多種變體以及對不同實施方案的增添對于本領域的普通技術人員將是清楚的。因此,以下說明書旨在說明本發明的一些具體的實施方案,并且不是窮盡性地限定所有的排列、組合以及其變體。本發明諸位發明人通過對一種編碼感興趣蛋白質的mRNA 二級結構的一個或多個(例如1、2、3、4、5個、等)、或者兩個或更多個(例如2、3、4、5個、等)熱力學變量進行確定,已經發現可以選擇一種對感興趣多肽進行編碼的mRNA,該mRNA以希望的或預選的速率和/或水平和/或在特定的生產條件下生產了一種蛋白質。因此,本發明的一些實施方案提供了選擇一種mRNA的方法,該mRNA用于感興趣多肽的調整的(增強的或減弱的(例如減少的))生產。因此,在本發明的一些實施方案中,可以選擇一種對感興趣多肽進行編碼的mRNA,與由編碼相同的感興趣多肽的野生型(即天然的)mRNA生產的蛋白質的量相比,該mRNA生產的蛋白質的量是增強的或增加的。在本發明的仍其他的實施方案中,可以選擇一種對感興趣多肽進行編碼的mRNA,與由編碼相同的感興趣多肽的野生型mRNA生產的蛋白質的量相t匕,該mRNA生產的蛋白質的量是減少的或減弱的。在本發明的另外方面,可以選擇對感興趣多肽進行編碼的一種第一 mRNA,與由編碼相同感興趣多肽的一種第二 mRNA (例如,非天然的mRNA)生產的蛋白質的量相比,該第一 mRNA生產的蛋白質的量是增強的或增加的。在本發明的仍另外的方面,可以選擇對感興趣多肽進行編碼的一種第一 mRNA,與由編碼相同的感興趣多肽的一種第二 mRNA生產的蛋白質的量相比,該第一 mRNA生產的蛋白質的量是減弱的或減少的。基于使用本發明的方法對mRNA的選擇,增強(例如增加)或減弱(例如減少、降低)的量可以按照希望的改變。因此,可以通過使用本發明的方法選擇基于天然或第二 mRNA生成的陣列的任意mRNA,與野生型或天然的mRNA或第二 mRNA相比,該陣列的任意mRNA生產改變的量的感興趣多肽。此外,可以使用此處描述的這些方法作為一種工具以克服RNA沉默。作為一個實例,強的啟動子經常被用來產生一種高水平的RNA轉錄物。但是,本領域的普通技術人員所熟知的是強的啟動子常常導致基因沉默。反而,一種中等的或弱的啟動子可以與一種包括根據本發明的方法選擇的mRNA的基因構建體組合使用以生產一種更高效地被翻譯的mRNA轉錄物。因此,盡管使用一種弱的或中等的啟動子,通過使用本發明的方法可以獲得高水平的蛋白質生產,這種啟動子可以識別被更高效地翻譯的mRNA轉錄物,并且在同時避免了由于高轉錄水平導致的基因沉默。因此,本發明的一個方面提供了選擇用于生產感興趣多肽的mRNA的方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列山)對(a)每個單獨mRNA序列確定一種或多種下列參數:(i)整體自由能(EFE);(ii)在一種熱力學整體中的最小自由能頻率(FMFE) RNA 二級結構;以及(iii)整體多樣性(ED);c)根據在步驟(b)中確定的這些 參數,對該陣列中的這些單獨mRNA序列評等級;并且d)選擇來自步驟(c)的分等級陣列中的一個mRNA序列,其中該選擇的mRNA生產該感興趣多肽。在某些實施方案中,如上所述的,當確定兩種或更多種參數時,根據在步驟(b)中確定的這些參數的聯合分布,對在步驟(c)的該陣列中的這些單獨mRNA序列評等級。本發明的另一方面提供了一種選擇用于生產感興趣多肽的mRNA的方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列山)對(a)中的每個單獨mRNA序列的最小自由能(MFE)RNA 二級結構進行確定;c)對(a)中每個單獨mRNA序列確定一種或多種下列參數:(i)在一種熱力學整體中的最小自由能頻率(FMFE)RNA 二級結構;以及(ii)整體多樣性(ED);d)根據在以上步驟(b)和(c)中確定的這些參數的聯合分布,對該陣列中的這些單獨mRNA序列評等級;并且e)選擇來自步驟(d)的該分等級陣列中的一個mRNA序列,其中該選擇的mRNA生產該感興趣多妝。在其他方面,本發明提供了一種選擇用于生產感興趣多肽的mRNA的方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列山)對(a)中的每個單獨mRNA序列的整體自由能(EFE)進行確定;c)對(a)中每個單獨mRNA序列確定一種或多種下列參數:(i)在一種熱力學整體中的最小自由能頻率(FMFE) RNA 二級結構;以及(ii)整體多樣性(ED);d)根據在以上步驟(b)和(c)中確定的這些參數的聯合分布,對該陣列中的這些單獨mRNA序列評等級;并且e)選擇來自步驟(d)的該分等級陣列中的一個mRNA序列,其中該選擇的mRNA生產該感興趣多肽。因此,在本發明的某些實施方案中,可以對一個陣列的每個單獨mRNA序列的下列參數或參數的組合進行確定,并且可以使用下列參數或參數的組合對單獨mRNA序列評等級(應指出當確定兩種或更多種參數時根據這些參數的聯合分布進行評等級):(I)EFE ; (2)FMFE ; (3) MFE ; (4) ED ; (5) EFE 和 FMFE ; (6) EFE 和 ED ; (7) FMFE 和 ED ; (8) EFE, FMFE 和 ED ;
(9)MFE和FMFE ; (IO)MFE和ED ;以及(Il)MFE, FMFE和ED。進一步地,在一些方面,本發明進一步包括除了對以上所述的這些參數或參數的組合之外還對于每個單獨mRNA序列的堿基配對概率(BPP)進行確定。因此,如在此進一步提供的,可以對于一個陣列中的每個單獨mRNA序列確定下列參數的組合,并且對于單獨的mRNA序列可以根據聯合分布使用下列參數的組合評等級:(I)EFE 和 BPP ; (2)FMFE 和 BPP ; (3)ED 和 BPP ; (4)EFE, FMFE 和 BPP ; (5)EFE、ED 和 BPP ; (6) FMFE、ED 和 BPP ; (7) EFE、FMFE、ED 和 BPP ; (8) MFE、FMFE 和 BPP ; (9) MFE,ED 和 BPP ;以及(10)MFE、FMFE、ED 和 BPP。將理解的是雖然術語“第一(first)”、“第二( second)”等可以在此使用以描述不同的要素,這些要素不應被這些術語限制。這些術語僅僅用于將一種要素與彼此區分。因此,以下討論的一種“第一”要素(例如,第一 mRNA序列)還可以在不偏離本發明所傳授的內容下稱為一種“第二”要素(例如,第二 mRNA序列)。“野生型”核苷酸、核苷酸序列、多肽或氨基酸序列指的是天然發生的(“天然的(native)”)或內源核酸、核苷酸序列、多肽或氨基酸序列。因此,“野生型mRNA”是一種生物內天然發生的或內源性的mRNA。如在此使用的,術語“熱力學優化方法”是指用來確定核酸分子的最小自由能結構的Zuker算法的任意實現方式(Zuker等人,《核酸研究》(NucleicAcidsResearch), 9, 133-148 (1981);還參見,Mathews 等人,《分子生物學期刊》(J.Mol.Biol.)288:911-940 (1999)以及 Walter 等人,PNAS91:9218-9222 (1994))。
在此使用的術語“最小自由能RNA 二級結構”(MFE)是指經熱力學優化(即Zuker算法(M.Zuker 以及 P.Stiegler.,《核酸研究》(Nucleic AcidsResearch)9:133-148 (1981))的一種實現方式)發現的具有最低的自由能值的結構。術語“最小自由能頻率RNA 二級結構”(FMFE)是指在熱力學整體中的MFE結構的部分,該FMFE為:(e~ (-E/kT))/Z,其中E是結構的最小自由能,k是玻爾茲曼常數,T是溫度并且Z是配分函數(Wuchty等人,《生物聚合物》(Biopolymers) 49:145-165 (1999))。因此,配分函數以及熱力學整體的結構被用來確定FMFE RNA 二級結構。在此使用的術語“配分函數”是指由J.S.McCasldll在《生物聚合物》(Biopolymers)29:1105-1119(1990)中定義的配分函數:Z=和(e~ [Ei/kT]),其中對于給出序列,Ei是結構i的自由能并且和(sum)是對所有的結構(從i=l至i=n)進行求和。在此使用的術語“整體自由能”(EFE)是指_kT*ln Z,其中k、T、以及Z是如上所定義的并且例如在ViennaRNA軟件包中被執行(1.L.Hofacker等人,《化學月刊》(Monatsh.Chem.),125:167-188 (1994))。整體自由能是由 J.S.McCaskill 在《生物聚合物》(Biopolymers) 29:1105-1119(1990)中定義。在此使用的術語“整體多樣性”(ED)是指在熱力學整體中的所有結構之間的堿基配對平均差:sum_a, b p_a*p_b*d(a, b),其中該和(sum)是對所有可能的結構的堿基對進行求和a, b, p_a是結構a的玻爾茲曼重量,并且d(a,b)是堿基對距離,其中堿基對距離是由Wuchty等人在《生物聚合物》(Biopolymers) 49:145-165 (1999)中所定義。
參數的“聯合分布”以特定的確定參數(例如MFE、EFE、FMFE, ED和/或BPP)的形式限定了事件的概率。因此,當參數MFE、EFE、FMFE、ED和/或BPP中的兩種或更多種參數確定時,根據對于每個單獨mRNA的各個參數確定的值,使用一種聯合分布來對mRNA評等級。因此,在此使用的“聯合分布”可以通過選擇感興趣序列的一個起始部分(例如較高的5%的如上定義的MFE結構)、并且然后通過使用確定的其他參數(如FMFE)選擇該起始部分的一部分來限定。例如,取較高和較低10%的MFE結構(例如對應地對于增強的和減少的表達),然后根據它們的FMFE值取這些部分各自的前50%。在此使用的術語“堿基配對概率”(BPP)是指在每個位置具有香農熵的核苷酸序列中的所有位置的平均堿基配對概率。堿基配對概率的計算是由J.S.McCaskill在《生物聚合物》(Biopolymers)29:1105-1119 (1990)中定義的,并且被實施于,例如ViennaR A軟件包中(1.L.Hofacker 等人,《化學月刊》(Monatsh.Chem.),125:167-188(1994))。熵值的計算由M.Huynen在《分子生物學期刊》(J Mol.Biol.) 267:1104-1112 (1997)中描述。在本發明的具體實施方案中,這些方法包括:生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列。在本發明的某些實施方案中,通過將感興趣多肽回譯來生產一個陣列以生產對該感興趣多肽進行編碼的mRNAs。在具體實施方案中,通過將感興趣多肽的N末端回譯來生產一個陣列以生產對該感興趣多肽的N末端進行編碼的mRNAs。在另外的實施方案中,通過將感興趣多肽的N末端回譯來生產一個陣列以生產對該感興趣多肽的N末端進行編碼的mRNAs,其中這些生產的單獨mRNAs包括一個起始密碼子和一個大約20至70個核苷酸長度的序列。因此,在某些實施方案中,生產單獨mRNA序列的一個陣列,其中這些單獨mRNA序列各自包括該起始密碼子以及一個長度的核苷酸,該長度是大約20至大約25個核苷酸、大約20至大約30個核苷酸、大約20至大約35個核苷酸、大約20至大約40個核苷酸、大約20至大約45個核苷酸、大約20至大約50個核苷酸、大約20至大約55個核苷酸、大約20至大約55個核苷酸、大約20至大約60個核苷酸、大約20至大約65個核苷酸、大約25至大約30個核苷酸、大約25至大約35個核苷酸、大約25至大約40個核苷酸、大約25至大約45個核苷酸、大約25至大約50個核苷酸、大約25至大約55個核苷酸、大約25至大約60個核苷酸、大約25至大約65個核苷酸、大約25個核苷酸至大約70個核苷酸、大約30至大約35個核苷酸、大約30至大約40個核苷酸、大約30至大約45個核苷酸、大約30至大約55個核苷酸、大約30至大約55個核苷酸、大約30至大約60個核苷酸、大約30至大約65個核苷酸、大約30個核苷酸至大約70個核苷酸、大約35至大約40個核苷酸、大約35至大約45個核苷酸、大約35至大約50個核苷酸、大約35至大約55個核苷酸、大約35至大約60個核苷酸、大約35至大約65個核苷酸、大約35至大約70個核苷酸、大約40至大約45個核苷酸、大約40至大約50個核苷酸、大約40至大約55個核苷酸、大約40至大約60個核苷酸、大約40至大約6 5個核苷酸、大約40至大約70個核苷酸、大約45至大約50個核苷酸、大約45至大約55個核苷酸、大約45個核苷酸至大約60個核苷酸、大約45至大約65個核苷酸、大約45至大約70個核苷酸、大約50至大約55個核苷酸、大約50至大約60個核苷酸、大約50至大約65個核苷酸、大約50至大約70個核苷酸、大約55至大約60個核苷酸、大約55至大約65個核苷酸、大約55至大約70個核苷酸、大約60至大約65個核苷酸、大約60至大約70個核苷酸、大約65至大約70個核苷酸、等等。因此,在另外的實施方案中,一個陣列的這些單獨mRNA序列包括一個起始密碼子以及一個長度的核苷酸,該長度是大約20個核苷酸、大約21個核苷酸、大約22個核苷酸、大約23個核苷酸、大約24個核苷酸、大約25個核苷酸、大約26個核苷酸、大約27個核苷酸、大約28個核苷酸、大約29個核苷酸、大約30個核苷酸、大約31個核苷酸、大約32個核苷酸、大約33個核苷酸、大約34個核苷酸、大約35個核苷酸、大約36個核苷酸、大約37個核苷酸、大約38個核苷酸、大約39個核苷酸、大約40個核苷酸、大約41個核苷酸、大約42個核苷酸、大約43個核苷酸、大約44個核苷酸、大約45個核苷酸、大約46個核苷酸、大約47個核苷酸、大約48個核苷酸、大約49個核苷酸、大約50個核苷酸、大約51個核苷酸、大約52個核苷酸、大約53個核苷酸、大約54個核苷酸、大約55個核苷酸、大約56個核苷酸、大約57個核苷酸、大約58個核苷酸、大約59個核苷酸、大約60個核苷酸、大約61個核苷酸、大約62個核苷酸、大約63個核苷酸、大約64個核苷酸、大約65個核苷酸、大約66個核苷酸、大約67個核苷酸、大約68個核苷酸、大約69個核苷酸、或大約70個核苷酸。在本發明的具體實施方案中,一個陣列的這些單獨mRNA序列包括一個起始密碼子以及大約40個核苷酸。 在本發明的另外的實施方案中,這些陣列中的單獨mRNA序列包括相對于該起始密碼子在-20至50位置(即起始密碼子ATG (AUG)的A是O位)的核苷酸。在本發明的某些具體實施方案中,這些單獨mRNA序列的5’端包括相對于該起始密碼子在-4至35位置的核苷酸。在本發明的另外的實施方案中,這些單獨mRNA序列的5’端包括相對于該起始密碼子在-4至37位置的核苷酸。在其他實施方案中,這些單獨mRNA序列包括以下各項:相對于該起始密碼子在-15至50位置的核苷酸、相對于該起始密碼子在-10至50位置的核苷酸、相對于該起始密碼子在-5至50位置的核苷酸、相對于該起始密碼子在-20至45位置的核苷酸、相對于該起始密碼子在-15至45位置的核苷酸、相對于該起始密碼子在-10至45位置的核苷酸、相對于該起始密碼子在-5至45位置的核苷酸、相對于該起始密碼子在-20至40位置的核苷酸、相對于該起始密碼子在-15至40位`置的核苷酸、相對于該起始密碼子在-10至40位置的核苷酸、相對于該起始密碼子在-5至40位置的核苷酸、相對于該起始密碼子在-20至35位置的核苷酸、相對于該起始密碼子在-15至35位置的核苷酸、相對于該起始密碼子在-10至35位置的核苷酸、相對于該起始密碼子在-5至35位置的核苷酸、相對于該起始密碼子在-20至30位置的核苷酸、相對于該起始密碼子在-15至30位置的核苷酸、相對于該起始密碼子在-10至30位置的核苷酸、相對于該起始密碼子在-5至30位置的核苷酸、相對于該起始密碼子在-20至25位置的核苷酸、相對于該起始密碼子在-15至25位置的核苷酸、相對于該起始密碼子在-10至25位置的核苷酸、相對于該起始密碼子在-5至25位置的核苷酸、相對于該起始密碼子在-20至20位置的核苷酸、相對于該起始密碼子在-15至20位置的核苷酸、相對于該起始密碼子在-10至20位置的核苷酸、相對于該起始密碼子在-5至20位置的核苷酸、相對于該起始密碼子在-20至15位置的核苷酸、相對于該起始密碼子在-15至15位置的核苷酸、相對于該起始密碼子在-10至15位置的核苷酸、相對于該起始密碼子在-5至15位置的核苷酸、相對于該起始密碼子在-20至10位置的核苷酸、相對于該起始密碼子在-15至10位置的核苷酸、相對于該起始密碼子在-10至10位置的核苷酸、等等。因此,在某些具體實施方案中,一個陣列的這些單獨mRNA序列包括一個起始密碼子以及大約40個核苷酸,這些單獨mRNA序列的5’端包括相對于該起始密碼子在_4至35位置的核苷酸。在本發明的某些實施方案中,生產的一個陣列包括對該感興趣多肽進行編碼的所有可能的mRNAs。在本發明的其他實施方案中,生產的一個陣列是一種“代表性陣列”。因此,如在此使用的,代表性陣列是指一種其中不是對所有的可能編碼感興趣多肽的mRNAs進行生產并且對在此所述的這些參數進行評估的陣列,而是對代表了編碼該感興趣多肽的mRNAs的分布的一種亞群或子群進行生產并且評估。可以通過使用本領域中已知的有偏協議或無偏協議對一個代表性陣列進行生產。一種生成代表性陣列的無偏方法的非限制性實例開始于一種氨基酸序列的輸入。使用一種自動隨機取樣程序以生成對所輸入的氨基酸序列進行編碼的核苷酸序列(例如,BioPerl)。(Stajich等人,《基因組研究》(Genome Res)12(10):1611-8(2002))。對氨基酸序列中的各個位置,通過對來自均勻分布的可能的密碼子進行取樣來選擇那個位置的密碼子。因此,在某些實施方案中,用這種方式對于每一個輸入的氨基酸序列生產了 I萬種核苷酸序列。在其他的實施方案中,生產了更多或更少數目的核苷酸序列。生產的序列的數目將依賴于許多因素,這些因素包括該輸入的氨基酸序列的長度。因此,在本發明的某些實施方案中,一個陣列包括大約IO3至大約IO8個單獨mRNA序列。在其他實施方案中,本發明的一個陣列包括大約103、大約2\103、大約4\103、大約6父103、大約8父103、大約104、大約2X104、大約4X 104、大約6X 104、大約8X 104、大約105、大約2X105、大約4X105、大約6X105、大約8X105、大約106、大約2X106、大約4X106、大約6X106、大約8X106、大約107、大約2X107、大約4X 107、大約6X 107、大約8X107、或大約IO8個單獨mRNA序列。如在此描述的,本發明提供了選擇mRNA的多種方法,該mRNA具有所希望的感興趣多肽的生產水平。因此,在某些實 施方案中,本發明提供了一種選擇用于生產感興趣多肽的mRNA的方法,其中該感興趣多肽 的生產增強了。在其他實施方案中,提供了一種選擇用于生產感興趣多肽的mRNA的方法,其中該感興趣多肽的生產減少了。如在此描述的選擇的mRNA可以具有輕微增強的、中等增強的或極大增強的蛋白質生產。在本發明的其他實施方案中,可以選擇一種mRNA,該mRNA具有所希望水平的蛋白質生產,該所希望水平的蛋白質生產是輕微減少的、中等減少的或極大減少的。在某些實施方案中,與由野生型mRNA生產的相同感興趣多肽相比,由選擇的mRNA生產的蛋白質的水平被增強或減少。在某些實施方案中,選擇一種mRNA序列,該序列與由野生型mRNA生產的相同感興趣多肽相比,生產了相同量的蛋白質(0%增強或減少)。如在此使用的,輕微增強的或輕微減少的可以是指與天然mRNA或其他選擇的mRNA相比,在感興趣多肽的生產中的變化為:大約0.0001%、0.0005%、0.001%、0.005%、0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、等等。中等增強的或中等減少的可以是指與天然mRNA或其他選擇的mRNA相比,在感興趣多肽的生產中的變化為:25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、等等。極大增強的或極大減少的可以是指與天然mRNA或其他選擇的mRNA相比,在感興趣多肽的生產中的變化為:大約 45% 至大約 100% (例如,45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、等)。在其他實施方案中,本發明提供了一種選擇用于生產感興趣多肽的第一 mRNA (選擇的mRNA)的方法,其中與由一種第二 mRNA生產該多肽相比,由該第一 mRNA對該感興趣多肽的生產增強或減少了,該第二 mRNA編碼與由第一 mRNA所編碼的相同的感興趣多肽。因此,本發明提供了用于選擇mRNA的方法,該選擇是基于對該mRNA的評等級,它的評等級是在對于陣列中這些單獨mRNA序列的各個確定的參數值的分布之內進行。因此,例如將一個陣列的這些mRNAs從對于各個確定參數(即,MFE RNA 二級結構、EFE、FMFE RNA二級結構、ED和/或BPP)的最高值至最低值分等級;因此,提供了對于單個感興趣多肽進行編碼的但是具有不同的確定參數值(即,MFE RNA 二級結構、EFE、FMFERNA 二級結構、ED、和/或BPP)的mRNAs的分布。可以將該分布描述為從在100%的最高值至在小于1% (例如0.0001%,0.0005%,0.001%,0.005%,0.01%、等)的最低值的范圍。可以沿著這種分布從小于1% (例如 0.0001%, 0.0005%, 0.001%, 0.005%, 0.01%、等)至 100% 的任何地方選擇一種 mRNA O因此,通過選擇一種如在此描述的mRNA,可以獲得所希望水平的蛋白質生產。因此,在本發明的某些實施方案中,可以從給出的陣列的mRNAs中選擇一種mRNA,該給出的陣列具有一種MFE RNA 二級結構值,該MFE RNA 二級結構值是在對該序列的陣列所確定的MFE最高值的大約95%-100%之間。在其他實施方案中,可以從具有下列MFE值的mRNA序列中選擇一種mRNA,該MFE值是對mRNA序列陣列所確定的在大約90%_100%、85%-100%,90%-95%、85%-95%、80%_95%、85%_90%、80%_90%、75%_90%、80%_85%、75%_85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、50%_55%、45%_55%、40%-55%、45%-50%、40%-50%、35%-50%、40%-45%、35%-45%、30%-45%、35%-40%、30%-40%、25%-40%、30%-35%、25%-35%、20%-35%、25%-30%、20%-30%、15%-30%、20%-25%、15%-25%、10%-25%、15%-20%、10%-20%、5%-20%、10%-15%、5%-15%、0%-15%、5%-10%、0%_5%、等等之間的范圍內。因此,在某些 實施方案中,可以從具有下列MFE值的mRNA序列中選擇一種mRNA,該MFE值是對該序列陣列所確定的MFE最高值的大約0.0001%,0.0005%,0.001%,0.005%、0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%。 在其他實施方案中,該MFE RNA 二級結構(MFE)值相對于在該陣列內的這些mRNA的蛋白質生產的水平沒有形成一種線性模式但是反而形成了一種分段模式,該分段模式中mRNAs分成多個組,其中對于各組之內的mRNAs盡管具有不同的MFE值但是其表達水平或蛋白質生產是相同的。確切地,在一個分段模式中,當影響蛋白質表達的其他因素保持不變,具有落入特定的范圍內的MFE值的mRNAs可以具有相同的蛋白質表達水平。因此,在某些實施方案中mRNAs的分組是基于計算的MFE。表達水平的分段模式可以發生,這是因為對于具有不同MFE值的mRNAs,打開給出的用于翻譯的mRNA結構所要求的能量可以是相同的。因此,例如,在25° C下對于單個GTP至⑶P的水解的AG。是-6.95kcal/mol (在37° C下該AG。是-7.14)。因此,在某些實例中,某些具有不同MFE值的mRNAs為了打開它們用于翻譯的結構,可以各自要求單個GTP的能量(一種“單個能量包”)。因此,盡管MFE值不同,來自那些要求“單個能量包”(例如ATP、GTP等等)的mRNAs的表達水平或蛋白質生產可以是相同的或相似的,并且因此可以通過從特定范圍內的MFE值選擇任意的RNA來獲得相似的蛋白質生產水平。作為一個實例,一種具有_3kcal/mol的MFE值的mRNA以及另一種具有_6kcal/mol的MFE值的mRNA兩者都可以為了打開它們的翻譯結構要求一種或少于一種的能量包。所以,對于這兩種mRNA其蛋白質生產效率是相同的,并且因此可以不用考慮蛋白質生產水平的結果而選擇兩者之中的任一個。通過水解的“能量包”(例如GTP、ATP等)以及對應的釋放的能量的數目對在范圍之間的邊界進行確定。因此,例如,第一個范圍可以對應于O個GTP水解,第二個范圍對應于I個GTP水解,等等。這些邊界在某些程度上可以是可變的,并且在相鄰的范圍之間存在一些重疊,這是因為(I)從水解釋放的能量隨著溫度、以及體內水生的和離子的環境而變化并且(2)對于mRNAs的MFE的計算可以是近似的。通常,這些邊界可以通過實驗來計算并且在這些邊界附近的mRNAs被避免。如在此所述的,計算MFE的方程在本領域中是已知的(即(e~(_E/kT))/Z,其中E是結構的最小自由能,k是玻爾茲曼常數,T是溫度并且Z是配分函數(Wuchty等人,《生物聚合物》(Biopolymers) 49:145-165 (1999))。因此,在某些實施方案中,可以從一組mRNAs選擇一種mRNA,該組mRNAs是在給出的陣列中,該陣列具有在從大約Okcal/mol至大約_2kcal/mol范圍內的、在從大約_2kcal/mol至大約_9kcal/mol范圍內的、或在從大約_9kcal/mol至大約-18kcal/mol范圍內的MFE RNA 二級結構值。從哪個組選擇的選擇將依賴于所希望的蛋白質生產水平。因此,在某些實施方案中,當希望增強的蛋白質生產時,可以從以下一組mRNAs中選擇該mRNA,該組mRNAs具有在從大約Okcal/mol至大約-2kcal/mol范圍內的MFE RNA 二級結構值。因此,可以選擇的 mRNA 具有以下 MFE 值:大約 Okcal/mol、-0.lkcal/mol、_0.2kcal/mol、_0.3kcal/mol、-0.4kcal/mol、-0.5kcal/mol、-0.6kcal mol、-0.7kcal/mol、-0.9kcal/mol、-lkcal/mol、-l.lkcal/mol、-l.2kcal/mol、_l.3kcal/mol、_l.4kcal/mol、_l.5kcal/mol、_l.6cal/mol、-1.7kcal/mol、-1.8kcal/mol、-1.9kcal/mol、_2kcal/mol、等等。在其他實施方案中,當希望減少的蛋白質生產時,可以從以下一組mRNAs中選擇該mRNA,該組mRNAs具有在從大約-9kcal/mol至大約-18kcal/mol范圍內的MFE RNA 二級結構值。在某些實施方案中,當希望減少的蛋白質生產時,可以從以下一組mRNAs中選擇該mRNA,該組mRNAs具有在從大約-9kcal/mol至大約-23kcal/mol范圍內的MFE RNA二級結構值。在其他實施方案中,當希望減少的蛋白質生產時,可以從以下一組mRNAs中選擇該mRNA,該組mRNAs具有在從大約_9kcal/mol至大約-30kcal/mol范圍內的MFERNA 二級結構值。因此,在某些實施方案中,當希望減少的蛋白質生產時,可以選擇一種具有以下 MFE 值的 mRNA:大約 _9kcal/mol、-9.lkcal/mol、-9.2kcal/mol、-9.3kcal/mol>-9.4kcal/mol、_9. 5kcal/mol、_9.6kcal/mol、_9.7kcal/mol、_9.9kcal/mol、_10kcal/mol、 -10.lkcal/mol、 -10.2kcal/mol、 -10.3kcal/mol、 -10.4kcal/mol、 -10.5kcal/mol、-10.6cal/mol、-10.7kcal/mol、-10.8kcal/mol、-10.9kcal/mol、-1lkcal/mol、-11.lkcal/mol、-11.2kcal/mol、-11.3kcal/mol、-11.4kcal/mol、-11.5kcal/mol、-11.6cal/mol、-11.7kcal/mol、-11.8kcal/mol、-11.9kcal/mol、-12kcal/mol、-12.lkcal/mol、-12.2kcal/mol、-12.3kcal/mol、-12.4kcal/mol、-12.5kcal/mol、-12.6cal/mol、-12.7kcal/mol、-12.8kcal/mol、-12.9kcal/mol、-13kcal/mol、-13.lkcal/mol、-13.2kcal/mol、-13.3kcal/mol、-13.4kcal/mol、-13.5kcal/mol、-13.6cal/mol、-13.7kcal/mol、-13.8kcal/mol、-13.9kcal/mol、-14kcalmol、-14.lkcal/mol、-14.2kcal/mol、-14.3kcal/mol、-14.4kcal/mol、-14.5kcal/mol、-14.6cal/mol、-14.7kcal/mol、-14.8kcal/mol、-14.9kcal/mol、-15kcal/mol、-15.lkcal/mol、-15.2kcal/mol、-15.3kcal/mol、-15.4kcal/mol、-15.5kcal/mol、-15.6cai/mol、-15.7kcal/mol、-15.8kcal/mol、-15.9kcal/mol、-16kcal/mol、-16.lkcal/mol、-16.2kcal/mol、-16.3kcal/mol、-16.4kcal/mol、-16.5kcal/mol、-16.6cal/mol、-16.7kcal/mol、-16.8kcal/mol、-16.9kcal/mol、-17kcal/mol、-17.lkcal/mol、-17.2kcal/mol、-17.3kcal/mol、-17.4kcal/mol、-17.5kcal/mol、-17.6cal/mol、-17.7kcal/mol、-17.8kcal/mol、-17.9kcal/mol、-18kcal/mol、-18.lkcal/mol、-18.2kcal/mol、-18.3kcal/mol、-18.4kcal/mol、-18.5kcal/mol、-18.6cal/mol、-18.7kc al/mol、-18.8kcal/mol、-18.9kcal/mol、_19kcal/mol、-19.5kcal/mol、-20kcal/mol、-20.5kcal/mol、-21kcal/mol、-21.5kcal/mol λ -22kcal/mol λ -22.5kcal/mol、-23kcal/mol、-23.5kcal/mol、-24cal/mol、-24.5kcal/mol、 -25kcal/mol、 -25.5kcal/mol、 -26kcal/mol、 -26.5kcal/mol、 -27kcal/mol、-27.5kcal/mol、-28.5kcal/mol、-29kcal/mol、-29.5kcal/mol、-30kcal/mol、等。在仍其他實施方案中,依據所希望的表達水平,可以從以下一組mRNAs中選擇該mRNA,該組mRNAs具有在從大約_2kcal/mol至大約_9kcal/mol范圍內的MFE RNA 二級結構值。因此,可以選擇一種具有以下MFE值的mRNA:大約_2kcal/mol、-2.lkcal/mol、-2.2kcal/mol、-2.3kcal/mol、-2.4kcal/mol、-2.5kcal/mol、-2.6kcal/mol、-2.7kcal/mol、-2.9kcal/mol、-3kcal/mol、-3.lkcal/mol、-3.2kcal/mol、-3.3kcal/molλ-3.4kcal/mol、-3.5kcal/mol、-3.6cal/mol、-3.7kcal/mol、-3.8kcal/mol、-3.9kcal/mol、-4kcal/mol、-4.lkcal/mol、-4.2kcal/mol、-4.3kcal/mol、-4.4kcal/mol、-4.5kcal/mol、-4.6cal/mol、-4.7kcal/mol、-4.8kcal/mol、-4.9kcal/mol、-5kcal/mol、-5.lkcal/mol λ-5.2kcal/mol、-5.3kcal/mol、-5.4kcal/mol、-5.5kcal/mol、-5.6cal/mol、-5.7kcal/mol、-5.8kcal/mol、-5.9kcal/mol、-6kcal/mol、-6.lkcal/mol、-6.2kcal/mol、-6.3kcal/molλ-6.4kcal/mol、-6.5kcal/mol、-6.6cal/mol、-6.7kcal/mol、-6.8kcal/mol、-6.9kcal/mol、-7kcal/mol、-7.lkcal mol、-7.2kcal/mol、-73kcal/mol、-7.4kcal/mol、-7.5kcal/mol、-7.6cal mol、-7.7kcal mol、-7.8kcal/mol、-7.9kcal/mol、-8kcal/mol、-8.lkcal/mol λ-8.2kcal/mol、_8.3kcal/mol、_8.4kcal/mol、_8.5kcal/mol、_8.6cal/mol、_8.7kcal/mol、-8.8kcal/mol、-8.9kcal/mol、_9kcal/mol、等。因此,在本發明的某些實施方案中,提供了一種選擇用于生產感興趣多肽的mRNA方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同的核苷酸序列山)對(a)中的每個單獨mRNA序列的最小自由能(MFE)RNA 二級結構進行確定;c)根據在(b)中該確定的MFERNA 二級結構,從最高的MFE RNA 二級結構至最低的MFE RNA 二級結構,對該陣列中的這些單獨mRNA序列評等級;并且d)從步驟(c)的該分等級陣列中選擇一種mRNA序列,其中該mRNA是選自下列各項:具有在大約Okcal/mol至大約_2kcal/mol范圍內的MFE RNA二級結構的mRNAs組,具有在大約_2kcal/mol至大約_9kcal/mol范圍內的MFE RNA 二級結構的mRNAs組,或具有在大約_9kcal/mol至大約-18kcal/mol范圍內的MFE RNA 二級結構的mRNAs組,其中該選擇的mRNA生產該感興趣多妝。在其他實施方案中,本發明提供了一種選擇選擇用于增強生產感興趣多肽的mRNA的方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列山)對(a)中的每個單獨mRNA序列的最小自由能(MFE)RNA 二級結構進行確定;并且c)選擇(a)中的一種具有在大約Okcal/mol至大約_2kcal/mol范圍內的MFE RNA 二級結構的mRNA序列,其中與野生型mRNA序列相比,該選擇的mRNA序列的表達導致該感興趣多肽的增強生產。在另外的實施方案中,提供了一種選擇用于減少生產感興趣多肽的mRNA的方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列山)對(a)中的每個單獨mRNA序列的最小自由能(MFE)RNA 二級結構以及(a)中的每個單獨mRNA序列的表達水平進行確定;c)選擇(a)中的一種具有在大約_9kcal/mol至大約-18kcal/mol范圍內的MFE RNA 二級結構的mRNA序列,其中與野生型mRNA序列相比,該選擇的mRNA序列的表達導致該感興趣多肽的增強生產。在其他實施方案中,可以從給出陣列的mRNAs中選擇一種mRNA,該給出的陣列具有一種EFE值,該EFE值是在對該序列的陣列所確定的大約95%-100%的EFE最高值之間。在其他實施方案中,可以從具有以下EFE值的mRNA序列中選擇一種mRNA,該EFE值是在對該mRNA序列陣列所確定的EFE最高值的大約90%-100%、85%-100%、90%-95%、85%_95%、80%-95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%_70%、60%_65%、55%_65%、50% 65%、55%-60%、50%-60%、45%-60%、50%-55%、45%-55%、40%-55%、45%-50%、40%-50%、35%_50%、40%-45%、35%-45%、 30%-45%、35%-40%、30%-40%、25%-40%、30%-35%、25%-35%、20%-35%、25%-30%、20%-30%、15%-30%、20%-25%、15%-25%、10%-25%、15%-20%、10%-20%、5%-20%、10%-15%、5%-15%、0%-15%、5%-10%、0%-5%、等等之間的范圍內。因此,在某些實施方案中,可以從具有以下EFE值的mRNA序列中選擇一種mRNA,該EFE值是對于該序列陣列所確定的的 EFE 最高值的大約 0.0001%、0.0005%,0.001%、0.005%,0.01%、0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、
100% O 在仍其他實施方案中,可以從給出陣列的mRNA序列中選擇一種mRNA,該給出的陣列具有一種FMFE RNA 二級結構值,該FMFE RNA 二級結構值是在對該序列陣列所確定的大約95%-100%的FMFE最高值之間。在其他實施方案中,可以從具有以下FMFE值的mRNAs中選擇一種mRNA,該FMFE值是在對該序列陣列所確定的EFE最高值的大約90%_100%、85%-100%,90%-95%、85%-95%、80%_95%、85%_90%、80%_90%、75%_90%、80%_85%、75%_85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、50%-55%、45%-55%、40%-55%、45%-50%、40%-50%、35%-50%、40%-45%、35%-45%、30%-45%、35%-40%、30%-40%、25%-40%、30%-35%、25%-35%、20%-35%、25%-30%、20%-30%、15%-30%、20%-25%、15%-25%、10%-25%、15%-20%、10%-20%、5%-20%、10%-15%、5%-15%、0%-15%、5%-10%、0%_5%、等等之間的范圍內。因此,在另外的實施方案中,可以從具有下列FMFE值的mRNA序列中選擇一種mRNA,該FMFE值是對該序列陣列所確定的FMFE最高值的大約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%。在另外的實施方案中,可以從給出陣列的mRNA序列中選擇一種mRNA,該給出的陣列具有一種MFE RNA 二級結構值,該MFE RNA 二級結構值是在對該序列陣列所確定的MFE最高值的大約95%-100%之間。在其他實施方案中,可以從具有以下MFE值的mRNAs中選擇一種mRNA,該MFE值是在對該序列陣列所確定的MFE最高值的大約90%-100%、85%_100%、90%-95%、85%-95%、80%-95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、50%-55%、45%-55%、40%-55%、45%-50%、40%-50%、35%-50%、40%-45%、35%-45%、30%-45%、35%-40%、30%-40%、25%-40%、30%-35%、25%-35%、20%-35%、25%-30%、20%-30%、15%-30%、20%-25%、15%-25%、10%_25%、15%-20%、10%-20%、5%-20%、10%-15%、5%-15%、0%-15%、5%-10%、0%_5%、等等之間的范圍內。因此,在另外的實施方案中,可以從具有下列MFE值的mRNA序列中選擇一種mRNA,該MFE值是對該序列陣列所確定的MFE最高值的大約`0.0001%,0.0005%,0.001%,0.005%,0.01%、0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%。在本發明的仍是另外的實施方案中,可以從一種給出陣列的mRNAs中選擇一種mRNA,該給出的陣列具有的ED是在對該序列陣列所確定的最高值的大約95%-1009ffiD之間。在其他實施方案中,可以從具有以下ED值的mRNA序列中選擇一種mRNA,該ED值是在對該序列陣列所確定的ED最高值的大約90%-100%、85%-100%、90%-95%、85%-95%、80%-95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、50%-55%、45%-55%、40%-55%、45%-50%、40%-50%、35%-50%、40%-45%、35%-45%、30%-45%、35%-40%、30%-40%、25%-40%、30%-35%、25%-35%、20%-35%、25%-30%、20%-30%、15%-30%、20%-25%、15%-25%、10%-25%、15%-20%、10%-20%、5%-20%、10%-15%、5%-15%、0%-15%、5%-10%、0%-5%、等等之間的范圍內。因此,在某些實施方案中,可以從具有下列ED值的mRNA序列中選擇一種mRNA,該ED值是對該序列陣列所確定的ED最高值的大約 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%。在本發明的另外方面,可以從給出陣列的mRNA序列中選擇一種mRNA,該給出的陣列具有的BPP值是在對該序列陣列所確定的最高值的大約95%-100%的BPP之間。在其他實施方案中,可以從具有以下BPP值的mRNA序列中選擇一種mRNA,該BPP值是在對該序列陣列所確定的 BPP 最高值的大約 90%-100%、85%-100%、90%-95%、85%-95%、80%-95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、50%-55%、45%-55%、40%-55%、45%-50%、40%-50%、35%-50%、40%-45%、35%-45%、30%-45%、35%-40%、30%-40%、25%-40%、30%-35%、25%-35%、20%-35%、25%-30%、20%-30%、15Q/『30%、20%-25%、15%-25%、10%_25%、15%_20%、10%-20%、5%_20%、10%_15%、5%-15%、0%-15%、5%-10%、0%-5%、等等之間的范圍內。因此,在另外的實施方案中,可以從具有下列BPP值的mRNA序列中選擇一種mRNA,該BPP值是對該序列陣列所確定的BPP最高值的大約 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%。在本發明的另外方面,當選擇一種mRNA用于在此所述的感興趣多肽的增強的生產,并且MFE RNA 二級結構、EFEJP /或ED是對于陣列中每個單獨mRNA序列所確定的一個或多個參數(用來對陣列中的單獨mRNA序列進行評等級)時,于是從具有對該mRNA序列陣列所確定的MFE RNA 二級結構、EFEJP /或ED最高值的mRNA序列之中選擇該mRNA。因此,在本發明的特定方面,當選擇一種mRNA用于感興趣多肽的增強的生產時,可以從以下mRNA序列中選擇該mRNA:這些mRNA序列所具有的MFERNA 二級結構、EFEjP /或ED的值是對該陣列的序列所確定的該參數值的最高值的大約95%-100%。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的增強的生產時,可以從具有以下值的mRNAs中選擇該mRNA,該值是在對于該序列陣列所確定的MFE RNA 二級結構、EFEjP /或ED的最高值的大約 90%-100%、85%-100%、90%-95%、85%-95%、80%_95%、85%_90%、80%_90%、75%_90%、80%_85%、75%-85%、70%-85%、75%- 80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%_65%、50%_65%、55%_60%、50%_60%、45%_60%、等的范圍內。在仍其他實施方案中,當選擇一種mRNA用于感興趣多肽的增強的生產時,可以從具有以下值的陣列的mRNA序列中選擇該mRNA,該值是對于該序列陣列所確定的MFE RNA 二級結構、EFEJP / 或 ED 的最高值的大約 100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、50%、49%、48%、47%、46%、45%、等。在本發明的其他方面,當選擇一種mRNA用于在此所述的感興趣多肽的增強的生產,并且FMFE RNA二級結構是對于陣列中每個單獨mRNA序列所確定的一種參數(該參數被用來對陣列中的單獨mRNA序列進行評等級)時,于是從具有對該mRNA序列陣列所確定的FMFE RNA 二級結構最低值的mRNA序列之中選擇該mRNA。因此,在本發明的特定方面,可以從具有以下FMFE值的mRNAs中選擇該mRNA,該值是在對該序列陣列所確定的FMFE 二級結構最高值的大約0-5%之間。在其他實施方案中,可以從具有以下FMFE RNA 二級結構值的mRNAs中選擇該mRNA,該值是對于該序列陣列所確定的FMFE RNA 二級結構最高值的大約 0%-10%、5%-10%、0%-15%、0%-20%、5%-15%、10%_15%、5%_20%、10%_20%、15%_20%、10%_25%、15%-25%、20%-25%、15%-30%、20%-30%、25%-30%、20%-35%、25%-35%、30%-35%、25%-40%、30%-40%、35%-40%、30%-45%、35%-45%、40%-45%、35%-50%、40%-50%、45%-50%、40%-55%、45%-55%、等的范圍內。在仍其他實施方案中,當選擇一種mRNA用于感興趣多肽的增強的生產時,可以從具有以下FMFE值的陣列的mRNA序列中選擇該mRNA,該值是對于該序列陣列所確定的 FMFE 最高值的大約 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、等。在本發明的另外方面,當選擇一種mRNA用于在此所述的感興趣多肽的增強的生產,并且BPP是對于陣列中每個單獨mRNA序列所確定的一種參數(該參數被用來對陣列中的單獨mRNA序列進行評等級)時,于是從具有對該mRNA序列陣列所確定的BPP最聞值的mRNA序列中選擇該mRNA。因此,在本發明的特定方面,當選擇一種mRNA用于感興趣多肽的增強的生產時,可以從具有以下BPP值的mRNA序列中選擇該mRNA,該值是對該序列陣列所確定的該參數的最大值的大約95%-100%。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的增強的生產時,可以從具有以下BPP值的mRNAs中選擇該mRNA,該值是在對于序列陣列所確定的 BPP 最高值的大約 90%-100%、85%-100%、90%-95%、85%-95%、80%-95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、等的范圍內。在仍其他實施方案中,當選擇一種mRNA用于感興趣多肽的增強的生產時,可以從具有以下BPP值的陣列的mRNA序列中選擇該mRNA,該BPP值是對于序列陣列所確定的 BPP 最高值的大約 100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、50%、49%、48%、47%、46%、45%、等。
在本發明的另外方面,當選擇一種mRNA用于在此所述的感興趣多肽的減少的生產,并且MFE RNA 二級結構、EFEJP /或ED是對于陣列中每個單獨mRNA序列所確定的一個或多個參數(該(這些)參數被用來對陣列中的單獨mRNA序列進行評等級)時,于是從具有對該mRNA序列陣列對應地確定的MFE RNA 二級結構、EFEjP /或ED最低值的mRNA序列之中選擇該mRNA。因此,在本發明的特定方面,當選擇一種mRNA用于感興趣多肽的減少的生產時,可以從具有以下值的mRNAs中選擇該mRNA,該值是對該序列陣列所確定的MFE RNA 二級結構、EFEJP /或ED最高值的大約0-5%。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的減少的生產時,可以從具有以下值的mRNAs中選擇該mRNA,該值是在對于該序列陣列所確定的MFE RNA 二級結構、EFEJP /或ED的最高值的大約0%-10%、5%-10%、0%_15%、0%-20%、5%-15%、10%-15%、5%-20%、10%_20%、15%_20%、10%_25%、15%_25%、20%_25%、15%_30%、20%-30%、25%-30%、20%-35%、25%-35%、30%-35%、25%-40%、30%-40%、35%-40%、30%-45%、35%-45%、40%-45%、35%_50%、40%_50%、45%_50%、40%_55%、45%_55%、等的范圍內。在仍其他實施方案中,當選擇一種mRNA用于感興趣多肽的減少的生產時,可以從具有以下值的陣列的mRNA序列中選擇該mRNA:該值是對于該序列陣列所確定的MFE RNA 二級結構、EFEjP/ 或 ED 最高值的大約 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、等。在本發明的另外方面,當選擇一種mRNA用于在此所述的感興趣多肽的減少的生產,并且FMFE RNA二級結構是對于陣列中每個單獨mRNA序列所確定的一個或多個參數(該(這些)參數被用來對陣列中的單獨mRNA序列進行評等級)時,于是從具有對該mRNA序列陣列所確定的FMFE RNA 二級結構最高值的mRNA序列之中選擇該mRNA。因此,在本發明的特定方面,當選擇一種mRNA用于感興趣多肽的減少的生產時,可以從具有以下FMFE RNA二級結構值的mRNAs中選擇該mRNA,該值是對該序列陣列所確定的FMFE最高值的大約95%-100%。因此,在某些實施方案中,當選擇一種mRNA用于感興趣多肽的減少的生產時,可以從具有以下FMFERNA 二級結構值的mRNAs中選擇該mRNA,該值是在對于該序列陣列所確定的 FMFE RNA 二級結構最 高值的大約 90%-100%、85%-100%、90%-95%、85%-95%、80%_95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、等的范圍內。在仍其他的實施方案中,當選擇一種mRNA用于感興趣多肽的減少的生產時,該mRNA是選自具有以下FMFE值的陣列的mRNA序列中,該值是對該序列陣列所確定的FMFE最高值的大約100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、50%、49%、48%、47%、46%、45%、等。在另外的實施方案中,當選擇一種mRNA用于感興趣多肽的增強的生產,并且MFERNA 二級結構是對于陣列中每個單獨mRNA序列確定的并且被用于該陣列的單獨mRNA序列的評等級中時,于是該mRNA是選自對于該陣列具有所確定的MFE RNA 二級結構最高值的分等級陣列中的mRNA序列的從大約0.0001%至大約20%(例如大約0.0001%,0.0005%,0.001%、0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%)。因此,在本發明的另外方面,當選擇一種mRNA用于感興趣多肽的增強的生產時,該mRNA可以是選自具有MFE RNA 二級結構最高值的分等級陣列中的mRNA序列的從大約0.0001%至大約10%、大約1%至大約10%、大約5%至大約15%、大約10%至大約15%、大約10%至大約20%、大約15%至大約20%、或它們的任意組合。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的增強的生產時,該mRNA是選自具有MFE RNA 二級結構最高值的該分等級陣列中的mRNA序列的大約0.0001%、0.0005%、0.001%、0.005%、0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它們的任意組合。在本發明的其他方面,當選擇一種mRNA用于如在此所述的感興趣多肽的增強的生產,并且EFE是一種對于陣列中每個單獨mRNA序列確定的參數(該參數被用于該陣列的單獨mRNA序列的評等級中)時,于是該mRNA是選自具有EFE最高值的分等級陣列中的mRNA序列的從大約 0.0001% 至大約 20% (例如 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%)。因此,在本發明的另外方面,當選擇一種mRNA用于感興趣多肽的增強的生產時,該mRNA可以是選自具有EFE最高 值的分等級陣列中的mRNA序列的從大約0.0001%至大約10%、大約1%至大約10%、大約5%至大約15%、大約10%至大約15%、大約10%至大約20%、大約15%至大約20%、或它們的任意組合。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的增強的生產時,該mRNA是選自具有EFE最高值的分等級陣列中的mRNA序列的大約0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它們的任意組合。在本發明的其他方面,當選擇一種mRNA用于如在此所述的感興趣多肽的增強的生產,并且ED是一種對于陣列中的每個單獨mRNA序列所確定的參數(該參數用來對該陣列中的單獨mRNA序列評等級)時,于是該mRNA是選自具有ED最高值的分等級陣列中的mRNA序列的從大約 0.0001% 至大約 20% (例如 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它們的任意組合)。因此在本發明的另外方面,當選擇一種mRNA用于如在此所述的感興趣多肽的增強的生產時,該mRNA是選自具有ED最高值的分等級陣列中的mRNA序列的約0.0001%至約10%、約1%至約10%、約5%至約15%、約10%至約15%、約10%至約20%、約5%至約20%、或它們的任何組合。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的增強的生產時,該mRNA是選自具有ED最高值的該分等級陣列中的mRNA序列的大約0.0001%、0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它們的任意組合。在本發明的仍其他的方面,當選擇一種mRNA用于如在此所述的感興趣多肽的增強的生產,并且FMFE RNA二級結構是一種對于陣列中每個單獨mRNA序列確定的參數(該參數被用于該陣列的單獨mRNA序列的評等級)時,于是該mRNA是選自具有FMFE RNA 二級結構最低值的分等級陣列中的mRNA序列的從大約0.0001%至大約20%(例如0.0001%,0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%)。因此,在本發明的另外方面,當選擇一種mRNA用于感興趣多肽的增強的生產時,該mRNA可以選自具有FMFE RNA 二級結構最低值的分等級陣列中的mRNA序列的從大約0.0001%至大約10%、大約1%至大約10%、大約5%至大約15%、大約10%至大約15%、大約10%至大約20%、大約15%至大約20%、或它們的任意組合。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的增強的生產時,該mRNA是選自具有FMFE RNA二級結構最低值的分等級陣列中這些mRNA序列的大約0.0001%,0.0005%,0.001%,0.005%、0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它們的任意組合。本發明進一步提供了當選擇一種mRNA用于在此所述的感興趣多肽的增強的生產,并且BPP是對于陣列中每個單獨mRNA序列所確定的一種參數(該參數被用來對陣列中的單獨mRNA序列進行評等級)時,于是該mRNA是選自具有BPP最高值的分等級陣列中這些mRNA序列的從大約0.0001%至大約20%。因此,在本發明的另外方面,當選擇一種mRNA用于感興趣多肽的增強的生產時,該mRNA可以選自具有BPP最高值的分等級陣列中的mRNA序列的從大約0.0001%至大約10%、大約1%至大約10%、大約5%至大約15%、大約10%至大約15%、大約10%至大約20%、大約15%至大約20%、或它們的任意組合。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的增強的生產時,該mRNA是選自具有BPP最高值的分等級陣列中的 mRNA 序列的大約 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它們的任意組合。在本發明的仍另外的方面,當選擇一種mRNA用于如在此所述的感興趣多肽的減少的生產,并且MFE RNA 二級結構是一種對于陣列中每個單獨mRNA序列確定的參數(該參數被用于該陣列的單獨mRNA序列的評等級)時,于是該mRNA是選自具有MFE RNA 二級結構最低值的分等級陣列中的mRNA序列的從大約0.0001%至大約20%(例如0.0001%,0.0005%、0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%)。因此,在本發明的另外方面,當選擇一種mRNA用于感興趣多肽的減少的生產時,該mRNA可以選自具有MFE RNA 二級結構最低值的分等級陣列中的mRNA序列的從大約0.0001%至大約10%、大約1%至大約10%、大約5%至大約15%、大約10%至大約15%、大 約10%至大約20%、大約15%至大約20%、或它們的任意組合。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的減少的生產時,該mRNA是選自具有MFE RNA 二級結構最低值的該分等級陣列中這些mRNA序列的大約0.0001%,0.0005%,0.001%,0.005%、0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它們的任意組合。在本發明的仍另外的方面,當選擇一種mRNA用于在此所述的感興趣多肽的減少的生產,并且EFE是對于陣列中每個單獨mRNA序列所確定的一種參數(該參數被用來對陣列中的單獨mRNA序列進行評等級)時,于是該mRNA是選自具有EFE最低值的分等級陣列中的mRNA序列的從大約0.0001%至大約20%。因此,在本發明的另外方面,當選擇一種mRNA用于感興趣多肽的減少的生產時,該mRNA可以選自具有EFE最低值的分等級陣列中的mRNA序列的從大約0.0001%至大約10%、大約1%至大約10%、大約5%至大約15%、大約10%至大約15%、大約10%至大約20%、大約15%至大約20%、或它們的任意組合。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的減少的生產時,該mRNA是選自具有EFE最低值的分等級陣列中這些 mRNA 序列的大約 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它們
的任意組合。在本發明的一些方面,當選擇一種mRNA用于在此所述的感興趣多肽的減少的生產,并且ED是對于陣列中每個單獨mRNA序列所確定的一種參數(該參數被用來對陣列中的單獨mRNA序列進行評等級)時,于是該mRNA是選自具有ED最低值的分等級陣列中的mRNA序列的從大約0.0001%至大約20%的mRNA。因此,在本發明的另外方面,當選擇一種mRNA用于感興趣多肽的減少的生產時,該mRNA可以選自具有ED最低值的分等級陣列中這些mRNA序列的從大約0.0001%至大約10%、大約1%至大約10%、大約5%至大約15%、大約10%至大約15%、大約10%至大約20%、大約15%至大約20%、或它們的任意組合。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的減少的生產時,該mRNA是選自具有ED最低值的分等級陣列中這些 mRNA 序列的大約 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它們的任意組合或范圍。在本發明的其他方面,當選擇一種mRNA用于在此所述的感興趣多肽的減少的生產,并且FMFE RNA 二級結構是對于陣列中每個單獨mRNA序列所確定的一種參數(該參數被用來對陣列中的單獨mRNA序列進行評等級)時,于是該mRNA是選自具有FMFE RNA 二級結構最高值的分等級陣列中的mRNA序列的從大約0.0001%至大約20%。因此,在本發明的另外方面,當選擇一種mRNA用于感興趣多肽的減少的生產時,該mRNA可以選自具有FMFERNA 二級結構最高值的分等級陣列中這些mRNA序列的從大約0.0001%至大約10%、大約1%至大約10%、大約5%至大約15%、大約10%至大約15%、大約10%至大約20%、大約15%至大約20%、或它們的任意組合。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的減少的生產時,該mRNA是選自具有FMFE RNA 二級結構最高值的分等級陣列中這些mRNA序列的大約 0.0001%, 0.0005%, 0.001%, 0.005%, 0.01%, 0.05%, 0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15`%、16%、17%、18%、19%、20%、或它們的任意組合或范圍。本發明進一步提供了當選擇一種mRNA用于在此所述的感興趣多肽的減少的生產,并且BPP是對于陣列中每個單獨mRNA序列所確定的一種參數(該參數被用來對陣列中的單獨mRNA序列進行評等級)時,于是該mRNA是選自具有BPP最低值的分等級陣列中這些mRNA序列的從大約0.0001%至大約20%。因此,在本發明的另外方面,當選擇一種mRNA用于感興趣多肽的減少的生產時,該mRNA可以選自具有BPP最低值的分等級陣列中這些mRNA序列的從大約0.0001%至大約10%、大約1%至大約10%、大約5%至大約15%、大約10%至大約15%、大約10%至大約20%、大約15%至大約20%、或它們的任意組合。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的減少的生產時,該mRNA是選自具有BPP最低值的分等級陣列中這些 mRNA 序列的大約 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它們的任意組合或范圍。因此,在本發明的一些方面,提供了一種選擇用于增強生產感興趣多肽的mRNA的方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列山)對(a)中的每個單獨mRNA序列的最小自由能(MFE)RNA 二級結構以及(a)中的每個單獨mRNA序列的在一個熱力學整體中的最小自由能頻率(FMFE) RNA 二級結構進行確定;c)根據以上步驟(b)中這些確定的MFE和FMFE的聯合分布對該陣列中的這些單獨mRNA序列評等級;并且d)從步驟(c)的該分等級陣列中選擇一種mRNA序列,其中該mRNA是選自具有MFERNA 二級結構最高值以及FMFE RNA 二級結構最低值的分等級陣列中大約0.0001%至大約20%的這些序列之中,或選自具有如在室溫下測量的在大約Okcal/mol至大約_2kcal/mol范圍內的MFE RNA 二級結構以及FMFE RNA 二級結構最低值的這些mRNA序列的mRNA之中,其中與野生型mRNA序列相比,該選擇的mRNA序列的表達導致該感興趣多肽的增強生產。因此,在本發明的另外方面,當選擇一種mRNA用于感興趣多肽的增強的生產時,該mRNA可以選自具有MFE RNA 二級結構最高值以及FMFERNA 二級結構最低值的分等級陣列中的mRNA序列的從大約0.0001%至大約10%、大約1%至大約10%、大約5%至大約15%、大約10%至大約15%、大約10%至大約20%、大約15%至大約20%、或它們的任意組合。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的增強的生產時,該mRNA是選自具有MFE RNA二級結構最高值以及FMFE RNA二級結構最低值的分等級陣列中這些 mRNA 序列的大約 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它們的任意組合。進一步地,在一些方面,本發明進一步包括除了對MFE和FMFE之外還對于每個單獨mRNA序列的堿基配對概率(BPP)進行確定。因此,當選擇一種mRNA用于在此所述的感興趣多肽的增強的生產,并且BPP是確定的并且是根據聯合分布用于對陣列中的單獨mRNA序列進行評等級時,于是該mRNA是選自具有BPP最高值的分等級陣列中的這些序列的從大約0.0001%至大約20%。因此,在本發明的另外方面,當選擇一種mRNA用于感興趣多肽的增強的生產時,該mRNA可以選自具有BPP最高值的分等級陣列中這些mRNA序列的從大約0.0001%至大約10%、大約1%至大約10%、大約5%至大約15%、大約10%至大約15%、大約10%至大約20%、大約15%至大約20%、或它們的任意組合。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的增強的生產時,該mRNA是選自具有BPP最高值的分等級陣列中這些mRNA序列的大約 0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它們的任意組合。在本發明的 另外方面提供了一種選擇用于減少生產感興趣多肽的mRNA的方法,該方法包括:a)制造一個陣列的包含編碼該感興趣多肽的不同的核苷酸序列的單獨mRNA序列山)對(a)中的每個單獨mRNA序列的RNA 二級結構最小自由能(MFE)以及(a)中的每個單獨mRNA序列的在一個熱力學整體中的RNA二級結構最小自由能頻率(FMFE)進行確定;c)根據以上步驟(b)中這些確定的MFE和FMFE的聯合分布對該陣列中的這些單獨mRNA序列評等級;并且d)從步驟(c)的該分等級陣列中選擇一種mRNA序列,其中該mRNA是選自具有MFE RNA 二級結構最低值以及RNA 二級結構FMFE最高值的在從大約0.0001%至大約20%之間的該分等級陣列中的這些序列,或該mRNA序列是選自具有在室溫下測量的在從大約_9kcal/mol至大約-18kcal/mol范圍之內的MFE RNA 二級結構以及RNA 二級結構FMFE最高值的這些mRNA序列之中。因此,在本發明的另外方面,當選擇一種mRNA用于感興趣多肽的減少的生產時,該mRNA可以選自該具有MFE RNA二級結構最低值以及FMFE RNA二級結構最高值的分等級陣列中這些mRNA序列的從大約0.0001%至大約10%、大約1%至大約10%、大約5%至大約15%、大約10%至大約15%、大約10%至大約20%、大約15%至大約20%、或它們的任意組合。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的減少的生產時,該mRNA是選自具有MFE RNA 二級結構最低值以及FMFE RNA 二級結構最高值的分等級陣列中這些 mRNA 序列的大約 0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它們的任意組合。進一步地,在一些方面,本發明進一步包括除了對MFE和FMFE之外還對于每個單獨mRNA序列的堿基配對概率(BPP)進行確定。在本發明的一些方面,該方法進一步包括除了對MFE和FMFE之外還對于每個單獨mRNA序列的堿基配對概率(BPP)進行確定。因此,當選擇一種mRNA用于在感興趣多肽的減少的生產時,并且BPP被確定并且是根據聯合分布用于對陣列中的單獨mRNA序列進行評等級時,于是該mRNA是選自具有BPP最低值的分等級陣列中這些序列的從大約0.0001%至大約20%。因此,在本發明的另外方面,當選擇一種mRNA用于感興趣多肽的減少的生產時,該mRNA可以選自具有BPP最低值的分等級陣列中這些mRNA序列的從大約0.0001%至大約10%、大約1%至大約10%、大約5%至大約15%、大約10%至大約15%、大約10%至大約20%、大約15%至大約20%、或它們的任意組合。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的減少的生產時,該mRNA是選自具有BPP最低值的分等級陣列中這些 mRNA 序列的大約 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%、1%、2%、3%、4%、5%、6%、7%、 8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它們的任意組合。本發明另外提供了一種選擇用于增強生產感興趣多肽的mRNA的方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同的核苷酸序列山)對(a)中的每個單獨mRNA序列的整體自由能(EFE)以及(a)中的每個單獨mRNA序列的在一個熱力學整體中的最小自由能頻率(FMFE) RNA 二級結構進行確定;并且c)根據以上步驟(b)中這些確定的EFE和FMFE的聯合分布對該陣列中的這些單獨mRNA序列評等級;并且d)從步驟(c)的該分等級陣列中選擇一種mRNA序列,其中該mRNA是選自該具有EFE最高值以及FMFERNA 二級結構最低值的分等級陣列中的大約0.0001%至大約20%的這些序列之中。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的增強的生產時,該mRNA是選自具有EFE最高值以及FMFE RNA 二級結構最低值的分等級陣列中這些 mRNA 序列的大約 0.0001% 至大約 10%、大約 0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它們的任意組合。在本發明的一些方面,該方法進一步包括除了對EFE和FMFE之外還對于每個單獨mRNA序列的堿基配對概率(BPP)進行確定。因此,當選擇一種mRNA用于在此所述的感興趣多肽的增強的生產,并且BPP被確定并且是根據聯合分布用于對陣列中的單獨mRNA序列進行評等級時,于是該mRNA是選自具有BPP最高值的分等級陣列中這些序列的從大約0.0001%至大約20%。因此,在本發明的另外方面,當選擇一種mRNA用于感興趣多肽的增強的生產時,該mRNA可以選自具有BPP最高值的分等級陣列中這些mRNA序列的從大約0.0001%至大約10%、大約1%至大約10%、大約5%至大約15%、大約10%至大約15%、大約10%至大約20%、大約15%至大約20%、或它們的任意組合。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的增強的生產時,該mRNA是選自具有BPP最高值的分等級陣列中這些mRNA序列的大約 0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它們的任意組合。在其他實施方案中,本發明提供了一種選擇用于減少生產感興趣多肽的mRNA的方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同的核苷酸序列山)對(a)中的每個單獨mRNA序列的整體自由能(EFE)以及(a)中的每個單獨mRNA序列的在一個熱力學整體中的最小自由能頻率(FMFE) RNA 二級結構進行確定;c)根據以上步驟(b)中這些確定的EFE和FMFE的聯合分布對該陣列中的這些單獨mRNA序列評等級;并且d)從步驟(c)的該分等級陣列中選擇一種mRNA序列,其中該mRNA是選自該具有EFE最低值以及FMFE RNA 二級結構最高值的分等級陣列中的大約0.0001%至大約20%的這些序列之中。因此,在本發明的另外方面,當選擇一種mRNA用于感興趣多肽的減少的生產時,該mRNA可以選自具有EFE最低值以及FMFE RNA 二級結構最高值的分等級陣列中這些mRNA序列的從大約0.0001%至大約10%、大約1%至大約10%、大約5%至大約15%、大約10%至大約15%、大約10%至大約20%、大約15%至大約20%、或它們的任意組合。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的減少的生產時,該mRNA是選自具有EFE最低值以及FMFE RNA 二級結構最高值分等級陣列中這些mRNA序列的大約 0.0001%, 0.0005%, 0.001%, 0.005%, 0.01%, 0.05%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它們的任意組合。在本發明的另外方面,該方法進一步包括除了對EFE和FMFE之外還對于每個單獨mRNA序列的堿基配對概率(BPP)進行確定。因此,當選擇一種mRNA用于在此所述的感興趣多肽的減少的生產,并且BPP是確定的并且是根據聯合分布用于對陣列中的單獨mRNA序列進行評等級時,于是該mRNA是選自具有BPP最低值的分等級陣列中這些序列的從大約0.0001%至大約20%。因此,在本發明的另外方面,當選擇一種mRNA用于感興趣多肽的減少的生產時,該mRNA可以選自具有BPP最低值的分等級陣列中這些mRNA序列的從大約0.0001%至大約10%、大約1%至大約10%、大約5%至大約15%、大約10%至大約15%、大約10%至大約20%、大約15%至大約20%、或它們的任意組合。在其他實施方案中,當選擇一種mRNA用于感興趣多肽的減少的生產時,該mRNA是選自具有BPP最低值的分等級陣列中這些mRNA序列的大約 0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它們的任意組合。本發明的這些選擇的mRNAs可以被進一步修飾以用于蛋白質生產。作為一個實例,在所選擇的對感興趣多肽進行編碼的mRNA的起始密碼子(AUG)中和/或起始密碼子(AUG)周圍的堿基配對可以被進一步修飾以使得該選擇的mRNA的起始密碼子更多開放(例如,具有用于蛋白質生產/翻譯起始的較少的堿基配對或沒有堿基配對)或更少開放(例如,具有更多的用于降低蛋白質生產/翻譯起始的堿基配對)。將所選擇的mRNA的起始密碼子的堿基配對的量(即更多打開的或更少開放的)與對該感興趣多肽進行編碼的野生型(天然)mRNA的起始密碼子作比較,或與對該多肽進行編碼的第二 mRNA (不同于該選擇的mRNA(例如,第一 mRNA))的起始密碼子作比較。在本發明的另外的實施方案中,本發明中這些選擇的mRNAs可以與其他修飾蛋白質生產的因子(例如轉錄和翻譯增強子)組合。在本發明的某 些實施方案中,為了獲得所希望水平的蛋白質生產,這些選擇的mRNA序列被進一步改變(即突變),以所編碼的該感興趣多肽的氨基酸序列發生突變以結合成一種或多種無結果突變(nonconsequentialmutation)(例如一種或多種保守的氨基酸替換),這導致了所希望的mRNA的MFE值的改變以及對應的所希望的的蛋白質生產水平的改變。因此,盡管該突變的mRNA序列對突變的氨基酸序列進行編碼,與野生型多肽序列相比,在該氨基酸序列中的突變沒有改變該多肽的功能。因此,在本發明的某些實施方案中,提供了對一種生物細胞中的感興趣多肽的生產進行修飾的方法,該方法包括:(a)根據以上權利要求中任一項選擇一種對感興趣多肽進行編碼的mRNA ; (b)對(a)中mRNA的核苷酸序列進行突變以生產一種突變的mRNA,與(a)中mRNA的核苷酸序列的MFERNA 二級結構相比,該突變的mRNA具有增加的或減少的MFERNA 二級結構,并且與(a)中mRNA編碼的多肽序列相比,該突變的mRNA編碼一種突變的多肽序列;其中該突變的多肽序列保留由(a)的mRNA編碼的多肽的功能,并且與野生型mRNA序列相比在一種生物細胞中該突變的mRNA序列的表達導致該感興趣多肽的修飾的生產。保守的或無結果突變包括點突變(單個堿基核苷酸被另一個核苷酸置換)。導致無結果突變(即不影響功能)的點突變的類型在本領域中是熟知的(參見,例如D.Bordo和P.Argos,《對于在位點定向誘變中“安全”殘基的替換的建議》(Suggestionsfor"Safe〃Residue Substitutions in Site-DirectedMutagensis),《分子生物學期刊》(J.Mol.Biol.)217:721-729(1991);圖2)。因此,例如,可以生成一個mRNA序列的陣列,其中保守位點突變被引入該mRNA序列并且可以從這個陣列中選擇一種具有所希望的MFE值并對經突變但是仍保留野生型功能的(例如無結果突變)多肽進行編碼的mRNA。因此,本發明中所選擇的mRNA的MFE可以進一步地經對具有突變的mRNA序列進行突變來操作,從而導致多肽中的無結果突變。這類突變為用于獲得所希望的蛋白質生產水平的用途的mRNA序列的選擇提供了另外的靈活性。在另外的實施方案中,可以通過使用優選的密碼子進一步對該感興趣多肽進行優化以提高在感興趣的特定生物中的表達,或能夠以優選的密碼子使用頻率使用密碼子對該感興趣多肽進行合成。因此, 在某些實施方案中,這種基因的GC含量將會增加。參見,例如Campbell和Gowri (1990)《植物生理學》(Plant Physiol.)92:1-11中關于宿主優選密碼子的使用的討論。可替代地,相對于野生型mRNA或另一個選擇的mRNA的蛋白質生產,被認為可阻止或減慢翻譯的稀有密碼子對于調整(例如減少)蛋白質生產是有用的。基于具體物種對稀有密碼子進行確定(即具體的密碼子在一個物種中可能是稀有的但在另一個物種中不是稀有的)。因此,如在此使用的,“稀有密碼子”是一種由tRNA編碼的密碼子,該tRNA具有占全體tRNAs的少于大約15%的豐度,這些全體tRNAs對在特定物種或在一種物種之內的細胞型中的特定氨基酸進行編碼。因此,在本發明的某些實施方案中,根據本發明的這些方法選擇的單獨的mRNA序列可以包括在起始密碼子附近的一種或多種稀有密碼子。可替代地,在本發明的其他實施方案中,包含稀有密碼子的mRNA序列可以從該陣列中去除。包含稀有密碼子的序列的去除可以通過使用軟件程序進行。如在此使用的,“在起始密碼子附近”是指那些編碼最前12個氨基酸(AUG至+12氨基酸)的密碼子。在多肽水平上,“在起始密碼子附近”包括核苷酸I至+36。如在此使用的,“一種/ 一個(a/an)”或“該”(the)可以表示一個或多于一個。例如,“一個”細胞可以表示一個單一的細胞或許多細胞。如在此使用的,“和/或”表示并包括一個或多個相關地列出的項的任何的與所有的可能組合,并且當用可替代地(“或”)解釋時組合的缺少。此外,當提到一種可測量的值(例如本發明的一種化合物(如mRNA)或試劑的量、劑量、時間、百分比、溫度、等等)時,在此使用的術語“大約”是指包括該指定量的±20%、±10%、±5%、±1%、±0.5%、或甚至 ±0.1% 的變化。如在此使用的,除非另外指明,術語“多肽”包括肽以及蛋白質兩者。如在此使用的,“分離的”多肽或多肽片段是指從天然發生的生物的至少一些其他組分中分離的或基本上游離的一種多肽或多肽片段,例如通常被發現是與該多肽相關聯的細胞組分或其他多肽或核酸。如在此使用的,過渡型短語“基本上由……組成”表示一種權利要求的范圍是要解釋為包括該權利要求中所述的指定材料或步驟以及并不實質上影響本發明的一種或多種基本特征或新穎特征的那些。因此,術語“基本上由……組成”當用于本發明的權利要求中時,并不意在解釋為與“包括”(“comprising”)等同。在此使用的術語“減少(reduce)”、“減少的(reduced)”、“減少(reducing)”、“減少(reduction)”、“減弱(diminish)”、以及“減少(decrease)”(以及其語法上的變體)描述的是由選擇的mRNA編碼的感興趣多肽的生產的減少。這中種減少可以通過對選擇的mRNA的感興趣多肽的生產與編碼相同的感興趣多肽的野生型(即天然的)mRNA的感興趣多肽的生產進行比較而觀察到;或者可以通過對選擇的mRNA的感興趣多肽的生產與同所選擇的mRNA編碼相同的感興趣多肽的另一個(第二)mRNA (不同于選擇的(第一)mRNA)對該多肽的生產進行比較而觀察到。在此使用的術語“增強 (enhance)”、“增強的(enhanced)”^增強(enhancing)”、“增強(enhancement) ”、“增加(increase ) ”(以及其語法上的變體)描述的是由選擇的mRNA編碼的感興趣多肽的生產的增加。這種增加可以通過對選擇的mRNA的感興趣多肽的生產與野生型(即天然的)mRNA的感興趣多肽的生產進行比較而觀察到,該野生型mRNA與該選擇的mRNA編碼相同的感興趣多肽;或者這種增加可以通過對選擇的mRNA的感興趣多肽的生產與另一個(第二)mRNA (不同于選擇的(第一)mRNA)對該多肽的生產進行比較而觀察到,該第二 mRNA與該選擇的mRNA編碼相同的感興趣多肽。術語“調整(modulate)”、“調整(modulates)”、“調整的(modulated)”或“調整(mo du I at i on ) ”指的是指定的活性(例如調整的蛋白質生產)的增強(例如一種增加)或抑制(例如一種減少)。感興趣多肽可以是任意多肽。適合用于植物中表達的感興趣多肽的非限制性實例包括導致農藝學上重要性狀的那些,這些性狀例如是除草劑抗性、病毒抗性、細菌性病原體抗性、昆蟲抗性、線蟲抗性、以及真菌抗性。參見例如美國專利號5,569,823,5, 304,730、5,495,071,6, 329,504、以及6,337,431。感興趣的多肽還可以是導致植物活力或產量增加的多肽(包括允許植物在不同的溫度、土壤條件以及日光和沉淀水平下生長的多肽),或是允許鑒定展現感興趣的性狀(例如,選擇性標記基因、種皮顏色等)的植物的多肽。除草劑抗性還有時被稱為除草劑耐受性。賦予對抑制生長點或分生組織的除草劑(例如咪唑啉酮或磺酰脲)的抗性的基因可以是合適的。對于突變ALS和AHAS酶在這一分類號中的示例性基因如描述在例如在美國專利號5,767,366和5,928,937中。美國專利號4,761,373和5,013, 659是針對抗不同的咪唑啉酮或磺酰脲除草劑的植物。美國專利號4,975,374涉及包含編碼抵抗除草劑的抑制作用的谷氨酰胺合成酶(GS)突變體的基因的植物細胞以及植物,已知這些除草劑(例如草胺膦和蛋氨酸亞砜亞胺)抑制GS。美國專利號5,162,602披露了抵抗環己二酮和芳氧苯氧丙酸除草劑的抑制作用的植物。該抗性是由改變的乙酰輔酶A羧化酶(ACCase)賦予的。由抗草甘膦的基因編碼的感興趣多肽也是適合的。參見例如美國專利號4,940,835和美國專利號4,769,061。美國專利號5,554,798披露了轉基因抗草甘磷玉米植物,它的抗性是由改變的5-烯醇丙酮酰莽草酸-3-磷酸(EPSP)合成酶基因賦予的。抵抗磷酰基化合物(例如草銨膦或草胺膦、以及吡啶氧丙酸或苯氧丙酸以及環己酮)的基因也是適合的。參見歐洲專利申請號0242246。還參見美國專利號5,879,903、5,276,268 和 5,561,236。其他合適的除草劑包括抑制光合作用的那些,例如三嗪和苯基氰(腈水解酶)。參見美國專利號4,810, 648。其他適合的除草劑包括2,2- 二氯丙酸、稀禾定、吡氟氯禾靈、咪唑啉酮除草劑、磺酰脲除草劑、三唑嘧啶除草劑、均三嗪除草劑以及溴草腈。同樣適合的是賦予對原卟啉原氧化酶的抗性或者提供增強的對植物疾病的抗性、增強的對不利環境條件(非生物脅迫)的耐受性(這些條件包括但不限于干旱、極冷、極熱、或極端的土壤鹽度或極端的酸度或堿度)、以及在植物 構型或發育中的改變(包括發育時間方面的變化)的基因。參見例如美國專利申請公開號2001/0016956和美國專利號6,084, 155。對本發明有用的殺蟲蛋白可以按一個足以控制昆蟲害蟲的量(即昆蟲控制量)進行表達。應當理解的是,在植物中對控制昆蟲必要的殺蟲蛋白的表達量可以變化,這取決于栽培變種、昆蟲的類型、環境因素等。對于昆蟲抗性或害蟲抗性有用的基因包括,例如編碼在桿菌生物體中已鑒定的毒素的基因。已經克隆了編碼來自幾個亞種的蘇云金芽孢桿菌(Bacillus thuringienSiS,Bt)毒素的基因,并且已經發現這些重組克隆對鱗翅類、雙翅類和鞘翅類昆蟲幼蟲是有毒的(例如不同的δ -內毒素基因例如CrylAa、CrylAb, CrylAc,Cry IB > DylC、Cry ID > CrylEa、CrylFa、Cry3A> Cry9A> Cry9C 以及 Cry9B ;連同編碼營養期殺蟲蛋白例如Vipl、Vip2和Vip3的基因)。Bt毒素的完整清單可以在萬維網在蘇塞克斯大學維護的蘇蕓金芽胞桿菌毒素命名法數據庫中找到(也參見,例如克里克摩爾(Crickmore)等人(1998)《微生物分子生物學綜述》(Microbiol.Mol.Biol.Rev.) 62:807-813)。適合于在植物中表達的的感興趣的多肽進一步包括改進或通過其他方式有助于所收獲的甘蔗轉化成為一種商業上有用的產品(包括例如增加的或改變的碳水化合物含量和/或分布、改進的發酵特性、增加的油含量、增加的蛋白含量、提高的消化率、以及增加的營養成分含量(例如,增加的植物留醇含量、增加的生育酚含量、增加的留烷醇含量或增加的維生素含量))的那些多肽。感興趣的多肽還包括,例如在一種收獲的作物中導致或促成不需要的成分,例如植酸、或降解糖的酶類的含量降低的那些多肽。“導致”或“促成”意指這種感興趣的多肽可以直接地或間接地促成一種感興趣的性狀的存在(例如,通過異源表達一種纖維素酶來增加纖維素的降解)。在一個實施方案中,感興趣的多肽促成了改進的食品或飼料的可消化度。木聚糖酶是半纖維素分解酶,這些酶改進了植物細胞壁的分解,這導致動物更好地利用這些植物營養素。這導致了改進的生長率和飼料轉化。同樣,可以減小包含木聚糖的飼料的粘度。木聚糖酶在植物細胞中的表達還可以潛在地作用以協助在工業加工中木質纖維素到可發酵糖的轉化。眾多的來自真菌和細菌微生物的木聚糖酶已經被鑒別并表征(參見例如美國專利號5,437,992 ;Coughlin,等人(1993);“關于里氏木霉以及其他水解酶的第二次TRICEL討論會會干1J,,(“Proceedings of the Second TRlCELSymposium on Trichoderma reeseiCeilulases and Other Hydrolases”),Espoo ;Souminen 和 Reinikainen 編寫(1993),《生物技術以及工業發酵研究基礎》(Foundation for Biotechnical and IndustrialFermentation Research) 8:125-135 (1993);美國專利申請公開號 2005/0208178 ;以及TO03/16654)。特別地,在里氏木霉(T.reesei)中已經鑒定出三個特異性的木聚糖酶(XYL-1、XYL-11、以及 XYL-1II) (Tenkanen 等人,(1992)《微生物酶技術》(EnzymeMicrob.Technol.) 14:566;Torronen 等人,(1992)《生物 / 工程》Bio/TechnologylO: 1461 ;以及Xu,等人,(1998)《應用微生物生物技術》(Appl.Microbiol.Biotechnol.) 49:718)。在另一個實施方案中,該感興趣的多肽是一種多糖降解酶。此類植物可以用于產生例如用于生物加工的發酵原料。在一些實施方案中,對于發酵工藝有用的酶類包括α淀粉酶類、蛋白酶類、支鏈淀粉酶類、異淀粉酶類、纖維素酶類、半纖維素酶類、木聚糖酶類、環糊精糖基轉移酶類(glycotransferases)、脂肪酶類、植酸酶類、漆酶類、氧化酶類、酯酶類類、角質酶類(cutinases)、顆粒淀粉水解酶類和其他葡糖淀粉酶類。多糖降解酶包括:淀粉降解酶類,例如,α-淀粉酶類(EC3.2.1.1)、葡萄糖醛酸酶類(E.C.3.2.1.131);外切1.4-a-D葡聚糖酶類,例如淀粉糖化酶類以及葡糖淀粉酶(EC3.2.1.3)、β-淀粉酶類(EC3.2.1.2)、α -糖苷酶類(EC3.2.1.20)、以及其他外切型淀粉酶類;以及淀粉脫支酶類,例如a)異淀粉酶(EC3.2.1.68)、支鏈淀粉酶化03.2.1.41)、以及類似物;b)纖維素酶類,例如外切-1,4-3-纖維素二糖水解酶(EC3.2.1.91)、外切-l,3-13-D-葡聚糖酶(EC3.2.1.39)、β-糖苷酶(EC3.2.1.21) ;c)L-阿拉伯糖酶類(arabinases),例如內切_1,5- a -L-阿拉伯糖酶(EC3.2.1.99)、α -阿拉伯糖苷酶類(EC3.2.1.55)以及類似物;d)半乳聚糖酶類(galactanases),例如內切-1,4-β-D-半乳聚糖酶(EC3.2.1.89)、內切-1,3-β- -半乳聚糖酶(EC3.2.1.90)、α-半乳糖苷酶(EC3.2.1.22)、β -半乳糖苷酶(EC3.2.1.23)以及類似物;e)甘露聚糖酶類(mannanases),例如內切-1,4-β- -甘露聚糖酶(EC3`.2.1.78)、β -甘露糖苷酶(EC3.2.1.25)、α-甘露糖苷酶(EC3.2.1.24)以及類似物;f)木聚糖酶類,例如內_1,4_β-木聚糖酶(EC3.2.1.8)、β-D-木糖苷酶(EC3.2.1.37)、1,3-β-D-木聚糖酶、以及類似物;g)其他酶類,例如a-L-巖藻糖苷酶(EC3.2.1.51)、a-L-鼠李糖苷酶(EC3.2.1.40)、果聚糖酶(EC3.2.1.65)、菊粉酶化03.2.1.7)、以及類似物。其他可以使用的額外的酶類包括蛋白酶類,例如真菌和細菌蛋白酶類。真菌蛋白酶類包括但不限于從曲霉屬、木霉屬、毛霉屬以及根霉屬(例如黑曲霉、泡盛曲霉(A.awamori)、米曲霉、以及米黑毛霉(M.miehei ))獲得的那些酶類。在某些實施方案中,該感興趣多肽是纖維二糖水解酶(CBH)酶類(EC3.2.1.91)。在一個實施方案中,該纖維二糖水解酶是CBHl或CBH2。其他酶類(感興趣多肽)包括但不限于:半纖維素酶類,例如甘露聚糖酶類以及阿拉伯呋喃糖酶類(EC3.2.1.55);木素酶類;脂肪酶類(例如,E.C.3.1.1.3)、葡萄糖氧化酶類、果膠酶類、木聚糖酶類、轉葡萄糖苷酶類、α 1,6糖苷酶類(例如,Ε.C.3.2.1.20);酯酶類,例如阿魏酸酯酶(EC3.1.1.73)以及乙酰基木聚糖酯酶類(EC3.1.1.72);以及角質酶類(例如,E.C.3.1.1.74)。在本發明的某些實施方案中,感興趣多肽進一步包括一種前導肽。如在本領域中所熟知的,前導肽是一種由更大開放的閱讀框的上游(5’端編碼序列)編碼的肽。可以用本發明的這些方法使用任何前導肽。前導肽可以是一種天然發現的肽或可以是一種被設計具有前導肽功能的合成肽。因此,在本發明的某些實施方案中,感興趣多肽包括一種前導肽,并且因此該編碼感興趣多肽的mRNA的5’端包括一種前導序列,該前導序列對一個開放閱讀框的前導肽上游(5’端編碼序列)進行編碼。因此,在某些實施方案中,由這些單獨mRNA序列的陣列對融合于感興趣多肽的前導序列進行編碼,這些mRNA序列包括對該感興趣多肽進行編碼的不同核苷酸序列。在某些實施方案中,可以通過對融合于該感興趣多肽的前導序列的表達的調整而對該感興趣多肽的生產進行調整。因此,根據本發明的任意方法選擇一種編碼前導肽的mRNA并且將該前導肽融合于該感興趣多肽中。通過調整該前導肽的表達,可以對該前導序列融合到其中的多肽的表達進行調整。因此,可以對該感興趣多肽的表達進行調整,而不用改變編碼該感興趣多肽的核苷酸序列或該感興趣多肽的氨基酸序列。前導肽的非限制性實例包括信號肽、轉運肽、靶向肽、信號序列、以及類似物。如在本領域中熟知的,信號/轉運肽將由一種核基因編碼的蛋白質靶向或運送至特定的細胞器,這些細胞器例如線粒體、質體(如頂質體(apicoplast)、色質體、葉綠體、藍色小體、類囊體、造粉體、以及類似物)、微體(如單膜界定的小細胞器,諸如過氧化物酶體、氫化酶體、乙醛酸循環體、以及糖酵解酶體)。前導肽在本領域中是熟知的,并且可以在公共數據庫中找到,例如:“信號肽網址:信號序列以及信號肽的信息平臺”(WWW.signalp印tide, de);“信號肽數據庫(Signal Peptide Database),,(proline.bic.nus.edu.Sg/spdb/index, html) (Choo 等人,《BMC 生物信息學》(BMC Bioinformatics) 6:249 (2005))(在 www.biomedcentral.com/1471-2105/6/249/abstract 中是可獲得的);Ch1roP (www.cbs.dtu.dk/services/ChloroP/ ;預測在蛋白質序列中葉綠體轉運肽(cTP)的存在以及潛在cTP切割位點的位置);LipoP (www.cbs.dtu.dk/services/LipoP/ ;預測革蘭氏陰性菌中的脂蛋白以及信號肽);MIT0PR0T (mg2.helmholtz-muenchen.de/ihg/mitoprot.html ;預測線粒體的革巴向序列);PlasMit (gecc0.0rg.chemie.unifrankfurt.de/plasmit/index.html ;預測鍵狀痕原蟲中的線粒體轉運妝);Predotar (urg1.Versailles, inra.fr/predotar/predotar.html ;預測線粒體以及質體的革巴向序列);PTS1 (mendel.1mp.ac.at/mendeljsp/sat/ptsl/PTSlpredictor.jsp ;預測包含蛋白質的過氧化物酶體的革巴向信號I) ;SignalP (www.cbs.dtu.dk/services/SignalP/ ;預測來自不同生物的氨基酸序列中的信號肽切割位點的存在以及位置,這些生物是:革蘭氏陽性原核生物、革蘭氏陰性原核生物、以及真核生物。該方法基于一些人工神經網絡以及隱馬爾可夫模型,將對切割位點的預測與信號肽/非信號肽的預測結合在一起);以及TargetP (www.cbs.dtu.dk services/TargetP/ ;預測真核蛋白質的亞細胞的位置-該位置分配是基于預測的任何N-末端的前序列的存在,這些N-末端的前序列為葉綠體轉運肽(cTP)、線粒體靶向肽(mTP)或分泌途徑信號肽(SP))。(還參見,von Heijne, G.,《歐洲生物化學期刊》(Eur J Biochem) 133 (I) 17-21 (1983) ;Martoglio等人,《細胞生物學動向》(Trends Cell Biol) 8 (10):410-5 (1998) ;Hegde等人,《生物化 學科學動向》(Trends Biochem Sci) 31 (10):563-71 (2006) ;Dultz等人,《生物化學期刊》 (J Biol Chem)283 (15):9966-76(2008) ;Emanuelsson 等人,《自然研究步驟期刊》(Nature Protocols) 2 (4) 953-971 (2007) ;Zuegge 等人,280 (1-2): 19-26 (2001) ;Neuberger 等人, 《分子生物學期刊》(J Mol Biol )328(3):567-79(2003);以及Neuberger等人,《分子生物 學期刊》(J Mol Biol) 328(3):581-92(2003))。具體的轉運肽的非限制性實例在表I中提供。表1.將蛋白質定向至不同細胞器(包括葉綠體、內質網、過氧化物酶體、線粒體以及液泡)的前導肽。
權利要求
1.一種選擇用于生產感興趣多肽的mRNA的方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列;b)對(a)的每個單獨mRNA序列確定以下一個或多個參數:⑴整體自由能(EFE);( )在一種熱力學整體中的最小自由能頻率(FMFE) RNA 二級結構;(iii)整體多樣性(ED);c)根據在步驟(b)中確定的這些參數的聯合分布,對該陣列的這些單獨mRNA序列評等級;并且d)選擇來自步驟(c)的該分等級陣列中的一個mRNA序列,其中該選擇的mRNA生產該感興趣多妝。
2.根據權利要求1所述的方法,其中步驟(b)進一步包括對(a)中的每個單獨mRNA序列的堿基配對概率進行確定。
3.根據權利要求1或權利 要求2所述的方法,其中該感興趣多肽的生產增強。
4.根據權利要求1或權利要求2所述的方法,其中該感興趣多肽的生產減少。
5.根據權利要求3所述的方法,其中在步驟(b)中該確定的一個或多個參數是EFE并且步驟(d)中的該mRNA是選自該具有EFE最高值的分等級陣列中大約0.0001%至大約20%的這些序列之中。
6.根據權利要求4所述的方法,其中在步驟(b)中該確定的一個或多個參數是EFE并且該步驟(d)中的mRNA是選自該具有最低EFE值的分等級陣列中大約0.0001%至大約20%的這些序列之中。
7.根據權利要求3所述的方法,其中在步驟(b)中該確定的一個或多個參數是FMFERNA 二級結構并且該步驟(d)中的mRNA是選自該具有FMFE RNA 二級結構最低值的分等級陣列中大約0.0001%至大約20%的這些序列之中。
8.根據權利要求4所述的方法,其中在步驟(b)中該確定的一個或多個參數是FMFERNA 二級結構并且該步驟(d)中的mRNA是選自該具有FMFE RNA 二級結構最高值的分等級陣列中大約0.0001%至大約20%的這些序列之中。
9.根據權利要求3所述的方法,其中在步驟(b)中該確定的一個或多個參數是ED并且該步驟(d)中的mRNA是選自該具有ED最高值的分等級陣列中大約0.0001%至大約20%的這些序列之中。
10.根據權利要求4所述的方法,其中在步驟(b)中該確定的一個或多個參數是ED并且該步驟(d)中的mRNA是選自該具有最低ED值的分等級陣列中大約0.0001%至大約20%的這些序列之中。
11.根據權利要求3所述的方法,其中在步驟(b)中該確定的一個或多個參數是EFE和FMFE,并且該步驟(d)中的mRNA是選自該具有EFE最高值以及FMFE RNA 二級結構最低值的分等級陣列中大約0.0001%至大約20%的這些序列之中。
12.根據權利要求4所述的方法,其中在步驟(b)中該確定的一個或多個參數是EFE和FMFE,并且該步驟(d)中的mRNA是選自該具有最低EFE值以及FMFE RNA 二級結構最高值的分等級陣列中大約0.0001%至大約20%的這些序列之中。
13.根據權利要求3所述的方法,其中在步驟(b)中該確定的一個或多個參數是EFE和ED,并且該步驟(d)中的mRNA是選自該具有EFE最高值以及ED最高值的分等級陣列中大約0.0001%至大約20%的這些序列之中。
14.根據權利要求4所述的方法,其中在步驟(b)中該確定的一個或多個參數是EFE和ED,并且該步驟(d)中的mRNA是選自該具有EFE最低值以及ED最低值的分等級陣列中大約0.0001%至大約20%的這些序列之中。
15.根據權利要求3所述的方法,其中在步驟(b)中該確定的一個或多個參數是EFE和FMFE RNA 二級結構以及ED,并且該步驟(d)中的mRNA是選自該具有EFE最高值和FMFE最低值以及ED最高值的分等級陣列中大約0.0001%至大約20%的這些序列之中。
16.根據權利要求4所述的方法,其中在步驟(b)中該確定的一個或多個參數是EFE和FMFE RNA 二級結構以及ED,并且該步驟(d)中的mRNA是選自該具有EFE最低值和FMFE最高值以及ED最低值的分等級陣列中大約0.0001%至大約20%的這些序列之中。
17.根據權利要求5、7、9、11、13或15中任一項所述的方法,其中在步驟(d)中該確定的一個或多個參數是堿基配對概率。
18.根據權利要求6、8、10、12、14或16中任一項所述的方法,其中在步驟(d)中該確定的一個或多個參數是堿基配對概率。
19.根據權利要求1所述的方法,其中當來自步驟(b)的兩種或更多種參數被確定時,根據這些確定的參數的聯合分布,對在步驟(C)的該陣列中的這些單獨序列評等級。
20.根據權利要求1至9中任一項所述的方法,其中在步驟(d)中該選擇的單獨mRNA序列包括在起始密碼子附近的一種或多種稀有密碼子。
21.一種選擇用于生 產感興趣多肽的mRNA的方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列;b)對(a)中的每個單獨mRNA序列的最小自由能(MFE)RNA 二級結構進行確定;以及c)對(a)每個單獨mRNA序列確定一種或多種下列參數:(i)在一種熱力學整體中的最小自由能頻率(FMFE)RNA 二級結構;以及(ii)整體多樣性(ED);d)根據在以上步驟(b)和(C)中確定的這些參數的聯合分布,對該陣列中的這些單獨mRNA序列評等級;并且e)選擇來自步驟(d)的該分等級陣列中的一個mRNA序列,其中該選擇的mRNA生產該感興趣多妝。
22.根據權利要求21所述的方法,其中步驟(c)進一步包括對(a)中的每個單獨mRNA序列的堿基配對概率進行確定。
23.根據權利要求21所述的方法,其中該步驟(e)中的mRNA是選自以下各項:具有在從大約Okcal/mol至大約_2kcal/mol范圍內的MFE RNA 二級結構的mRNA的組,具有在從大約-2kcal/mol至大約_9kcal/mol范圍內的MFERNA 二級結構的mRNA的組,或具有在從大約_9kcal/mol至大約-18kcal/mol范圍內的MFE RNA 二級結構的mRNA的組。
24.根據權利要求21-23中任一項所述的方法,其中該感興趣多肽的生產增強。
25.根據權利要求21-23中任一項所述的方法,其中該感興趣多肽的生產減少。
26.根據權利要求24所述的方法,其中在步驟(c)中該確定的一個或多個參數是ED并且該步驟(e)中的mRNA是選自該具有MFE RNA 二級結構最高值以及ED最高值的分等級陣列中大約0.0001%至大約20%的這些序列之中。
27.根據權利要求25所述的方法,其中在步驟(c)中該確定的一個或多個參數是ED并且該步驟(e)中的mRNA是選自該具有MFE RNA 二級結構最低值以及ED最低值的分等級陣列中大約0.0001%至大約20%的這些序列之中。
28.根據權利要求24所述的方法,其中在步驟(c)中該確定的一個或多個參數是FMFERNA 二級結構以及ED,并且該步驟(e)中的mRNA是選自具有該MFE RNA 二級結構最高值、FMFE RNA 二級結構最低值以及ED最高值的分等級陣列中大約0.0001%至大約20%的這些序列之中。
29.根據權利要求25所述的方法,其中在步驟(c)中該確定的一個或多個參數是FMFERNA 二級結構以及ED,并且該步驟(e)中的mRNA是選自具有該MFE RNA 二級結構最低值、FMFE RNA 二級結構最高值以及ED最低值的分等級陣列中大約0.0001%至大約20%的這些序列之中。
30.根據權利要求26或權利要求28所述的方法,其中在步驟(c)中該確定的一個或多個參數是堿基配對概率。
31.根據權利要求27或權利要求29所述的方法,其中在步驟(c)中該確定的一個或多個參數是堿基配對概率。
32.根據權利要求24所述的方法,其中該步驟(e)中的mRNA是選自具有如在室溫下測量的在從大約Okcal/mol至大約_2kcal/mol范圍內的MFERNA 二級結構的mRNA之中。
33.根據權利要求25所述的方法,其中該步驟(e)中的mRNA是選自具有如在室溫下測量的在從大約-9kcal/mol至大約-18kcal/mol范圍內的MFERNA 二級結構的mRNA之中。
34.一種選擇用于生產感興趣多肽的mRNA的方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列;b)對(a)中的每個單獨mRNA序列的整體自由能(EFE)進行確定;c)對(a)每個單獨mRNA序列確定一種或多種下列參數:(i)在一種熱力學整體中的最小自由能頻率(FMFE)RNA 二級結構;以及(ii)整體多樣性(ED);d)根據在以上步驟(b)和(C)中確定的這些參數的聯合分布,對該陣列中的這些單獨mRNA序列評等級;并且e)選擇來自步驟(d)的該分等級陣列中的一個mRNA序列,其中該選擇的mRNA生產該感興趣多妝。
35.根據權利要求34所述的方法,其中步驟(c)進一步包括對(a)中的每個單獨mRNA序列的堿基配對概率進行確定。
36.根據權利要求34或35所述的方法,其中該感興趣多肽的生產增強。
37.根據權利要求34或35所述的方法,其中該感興趣多肽的生產減少。
38.根據權利要求36所述的方法,其中在步驟(c)中該確定的一個或多個參數是ED并且該步驟(e)中的mRNA是選自該具有EFE最高值以及ED最高值的分等級陣列中大約·0.0001%至大約20%的這些序列之中。
39.根據權利要求37所述的方法,其中在步驟(c)中該確定的一個或多個參數是ED并且該步驟(e)中的mRNA是選自該具有EFE最低值以及ED最低值的分等級陣列中大約0.0001%至大約20%的這些序列之中。
40.根據權利要求36所述的方法,其中在步驟(c)中該確定的一個或多個參數是FMFERNA 二級結構以及ED,并且該步驟(e)中的mRNA是選自該具有EFE最高值、FMFE RNA 二級結構最低值以及ED最高值的分等級陣列中大約0.0001%至大約20%的這些序列之中。
41.根據權利要求37所述的方法,其中在步驟(c)中該確定的一個或多個參數是FMFERNA 二級結構以及ED,并且該步驟(e)中的mRNA是選自該具有EFE最低值、FMFE RNA 二級結構最高值以及ED最低值的分等級陣列中大約0.0001%至大約20%的這些序列之中。
42.根據權利要求38或權利要求40所述的方法,其中在步驟(c)中該確定的一個或多個參數是堿基配對概率。
43.根據權利要求39或權利要求41所述的方法,其中在步驟(c)中該確定的一個或多個參數是堿基配對概率。
44.根據權利要求21至43中任一項所述的方法,其中在步驟(e)中該選擇的單獨mRNA序列包括在起始密碼子附近的一種或多種稀有密碼子。
45.一種選擇用于增強生產感興趣多肽的mRNA的方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列; b)對(a)中的每個單獨mRNA序列的最小自由能(MFE)RNA二級結構以及(a)中的每個單獨mRNA序列的在一個熱力學整體中的最小自由能頻率(FMFE) RNA 二級結構進行確定;c)根據以上步驟(b)中這些確定的MFE和FMFE的聯合分布對該陣列中的這些單獨mRNA序列評等級;并且d)從步驟(c)的該分等級陣列中選擇一種mRNA序列,其中該mRNA是選自該具有MFERNA 二級結構最高值以及FMFE RNA 二級結構最低值的分等級陣列中大約0.0001%至大約20%的這些序列之中,或選自具有如在室溫下測量的在從大約Okcal/mol至大約_2kcal/mol范圍內的MFE RNA 二級結構以及FMFE RNA 二級結構最低值的這些mRNA序列之中,其中與野生型mRNA序列相比,該選擇的mRNA序列的表達導致該感興趣多肽的增強生產。
46.根據權利要求45所述的方法,其中步驟(b)進一步包括對(a)中的每個單獨mRNA序列的堿基配對概率進行確定。
47.一種選擇用于減少生產感興趣多肽的mRNA的方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列;b)對(a)中的每個單獨mRNA序列的最小自由能(MFE)RNA二級結構以及(a)中的每個單獨mRNA序列的在一個熱力學整體中的最小自由能頻率(FMFE) RNA 二級結構進行確定;c)根據以上步驟(b)中這些確定的MFE和FMFE的聯合分布對該陣列中的這些單獨mRNA序列評等級;并且d)從步驟(c)的該分等級陣列中選擇一種mRNA序列,其中該mRNA是選自該具有MFERNA 二級結構最低值以及FMFE RNA 二級結構最高值的分等級陣列中大約0.0001%至大約20%的這些序列之中,或選自具有如在室溫下測量的在從大約_9kcal/mol至大約_18kcal/mol范圍內的MFERNA 二級結構以及FMFE RNA 二級結構最高值的這些mRNA序列之中,其中與野生型mRNA序列相比,該選擇的mRNA序列的表達導致該感興趣多肽的減少生產。
48.根據權利要求47所述的方法,其中步驟(b)進一步包括對(a)中的每個單獨mRNA序列的堿基配對概率進行確定。
49.一種選擇用于增強生產感興趣多肽的mRNA的方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含編碼該感興趣多肽的不同核苷酸序列;b)對(a)中的每個單獨mRNA序列的整體自由能(EFE)以及(a)中的每個單獨mRNA序列的在一個熱力學整體中的最小自由能頻率(FMFE) RNA 二級結構進行確定;并且c)根據以上步驟(b)中這些確定的EFE和FMFE的聯合分布對該陣列中的這些單獨mRNA序列評等級;并且d)從步驟(c)的該分等級陣列中選擇一種mRNA序列,其中該mRNA是選自該具有EFE最高值以及FMFE RNA 二級結構最低值的分等級陣列中大約0.0001%至大約20%的這些序列之中,其中與野生型mRNA序列相比,該選擇的mRNA序列的表達導致該感興趣多肽的增強生產。
50.根據權利要求49所述的方法,其中步驟(b)進一步包括對(a)中的每個單獨mRNA序列的堿基配對概率進 行確定。
51.一種選擇用于減少生產感興趣多肽的mRNA的方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含編碼該感興趣多肽的不同核苷酸序列;b)對(a)中的每個單獨mRNA序列的整體自由能(EFE)以及在一個熱力學整體中的最小自由能頻率(FMFE) RNA 二級結構進行確定;c)根據以上步驟(b)中這些確定的EFE和FMFE的聯合分布對該陣列中的這些單獨mRNA序列評等級;并且d)從步驟(c)的該分等級陣列中選擇一種mRNA序列,其中該mRNA是選自該具有EFE最低值以及FMFE RNA 二級結構最高值的分等級陣列中大約0.0001%至大約20%的這些序列之中,其中與野生型mRNA序列相比,該選擇的mRNA序列的表達導致該感興趣多肽的減少生產。
52.根據權利要求51所述的方法,其中步驟(b)進一步包括對(a)中的每個單獨mRNA序列的堿基配對概率進行確定。
53.一種選擇用于生產感興趣多肽的mRNA的方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列;b)對(a)中的每個單獨mRNA序列的最小自由能(MFE)RNA 二級結構進行確定;c)根據在(b)中該確定的MFERNA 二級結構,從最高的MFERNA 二級結構至最低的MFERNA 二級結構,對該陣列中的這些單獨mRNA序列評等級;并且d)從步驟(c)的該分等級陣列中選擇一種mRNA序列,其中該mRNA是選自下列各項:具有在從大約Okcal/mol至大約_2kcal/mol范圍內的MFE RNA 二級結構的mRNA的組,具有在從大約_2kcal/mol至大約_9kcal/mol范圍內的MFE RNA 二級結構的mRNA的組,或具有在從大約_9kcal/mol至大約-18kcal/mol范圍內的MFE RNA 二級結構的mRNA的組,其中該選擇的mRNA生產該感興趣多肽。
54.根據權利要求53所述的方法,其中該mRNA被選擇用于一種感興趣多肽的增強生產,并且是選自具有一種在從大約Okcal/mol至大約_2kcal/mol范圍內的MFE的mRNA的組。
55.根據權利要求53所述的方法,其中該mRNA被選擇用于一種感興趣多肽的減少生產,并且是選自具有一種在從大約_9kcal/mol至大約-18kcal/mol范圍內的MFE的mRNA的組。
56.根據權利要求45至55中任一項所述的方法,其中在步驟(d)中該選擇的單獨mRNA序列包括在起始密碼子附近的一種或多種稀有密碼子。
57.一種選擇用于增強生產感興趣多肽的mRNA方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列;b)對(a)中的每個單獨mRNA序列的最小自由能(MFE)RNA 二級結構進行確定;并且c)選擇(a)中的一種具有在從大約Okcal/mol至大約_2kcal/mol范圍內的MFERNA二級結構的mRNA序列,其中與野生型mRNA序列相比,該選擇的mRNA序列的表達導致該感興趣多肽的增強生產。
58.一種選擇用于減少生產感興趣多肽的mRNA方法,該方法包括:a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列;b)對(a)中的每個單獨mRNA序列的最小自由能(MFE)RNA 二級結構以及(a)中的每個單獨mRNA序列的表達水平進行確定;c)選擇(a)中的一種具有在從大約_9kcal/mol至大約_18kcal/MFE范圍內的MFERNA二級結構的mRNA序列,其中與野生型mRNA序列相比,該選擇的mRNA序列的表達導致該感興趣多肽的增強生產。
59.根據權利要求57或權利要求58所述的方法,其中在步驟(e)中該選擇的單獨mRNA序列包括在起始密碼子附近的一種或多種稀有密碼子。
60.根據權利要求1-19、21-43、44-55、57或58中任一項所述的方法,該方法進一步包括除去來自步驟(a)的該單獨mRNA陣列中的包含在起始密碼子附近的一種或多種稀有密碼子的單獨mRNA序列。
61.—種對生物細胞中的感興趣多肽的生產進行修飾的方法,該方法包括:(a)根據以上權利要求中的任一項,選擇一種對感興趣多肽進行編碼的mRNA ;(b)對(a)中的該mRNA的核苷酸序列進行突變以生產一種突變的mRNA,與(a)中的該mRNA的核苷酸序列的MFERNA 二級結構相比,該突變的mRNA具有增強的或減少的MFE RNA 二級結構;其中與由(a)中的mRNA編碼的多肽序列相比,該突變的mRNA編碼一種突變的多肽序列,該突變的多肽序列保留了由(a)中的mRNA編碼的多肽序列的功能,并且與野生型mRNA序列相比,該突變的mRNA序列的表達導致該感興趣多肽的修飾的生產。
62.—種用于對生物細胞中的感興趣多肽的生產進行修飾的方法,該方法包括:(a)根據權利要求1-60中的任一項,選擇一種對感興趣多肽進行編碼的mRNA;(b)對在這種根據(a)選擇的mRNA的核苷酸序列與一種所述生物的野生型內源核苷酸序列之間的差別進行鑒別,其中該野生型內源核苷酸序列編碼了與根據(a)選擇的mRNA所編碼的相同的一種感興趣多肽;并且(c)對編碼該感興趣多肽的該內源核苷酸序列進行原位突變以將(b)中所鑒別的核苷酸的每個差別合并進該內源核苷酸序列中,由此在該生物的細胞中來自該原位突變的內源核苷酸序列的該感興趣多肽的生 產被修飾。
全文摘要
本發明提供了一種選擇用于生產感興趣多肽的mRNA的方法,該方法包括a)生產單獨mRNA序列的一個陣列,這些單獨mRNA序列包含對該感興趣多肽進行編碼的不同核苷酸序列;b)對(a)的每個單獨mRNA序列確定一種或多種或者兩種或更多種下列參數(i)最小自由能(MFE)RNA二級結構;(ii)整體自由能(EFE);(iii)在一種熱力學整體中的最小自由能頻率(FMFE)RNA二級結構;以及(iv)整體多樣性(ED);c)根據步驟(b)中確定的這些參數,對該陣列中的單獨mRNA序列評等級;并且d)選擇來自步驟(c)的該分等級陣列中的一個mRNA序列,其中該選擇的mRNA生產該感興趣多肽。本發明進一步提供了一種選擇用于增強或減少生產感興趣多肽的mRNA的方法。
文檔編號C07H21/04GK103080123SQ201180038845
公開日2013年5月1日 申請日期2011年6月9日 優先權日2010年6月11日
發明者S.S.巴蘇, K.K.丹格, K.阿扎卡南達姆, T.Z.麥克尼爾, S.郭 申請人:先正達參股股份有限公司