專利名稱::在哺乳動物細胞中將非天然氨基酸遺傳摻入蛋白質的制作方法
技術領域:
:本發明屬于翻譯生物化學領域。本發明涉及制備和利用正交(orthogonal)tRNA、正交氨酰-tRNA合成酶和它們的配對將非天然氨基酸摻入蛋白質的組合物和方法。本發明還涉及用這種配對在細胞中產生蛋白質的方法以及用這種方法產生的蛋白質。
背景技術:
:己有描述在哺乳動物細胞中將非天然氨基酸定點插入蛋白的方法。分別將化學氨酰化的抑制子tRNA顯微注射或電穿孔到CHO細胞或神經元中,并用一系列的非天然氨基酸抑制無義琥珀突變(Monahan等(2003),"將非天然氨基酸定點摻入哺乳動物細胞中表達的受體"(Site-specificincorporationofunnaturalaminoacidsintoreceptorsexpressedinMammaliancells)CTzem5/o/10:573-580)。然而,使用氨酰化tRNA作為化學計量試劑嚴重限制了能夠產生的蛋白的量。此外,工程改造不與宿主tRNA、aaRS或氨基酸(正交tRNA/aaRS)交叉反應的異源抑制子tRNA/aaRS對使蛋白,選擇性摻入非天然氨基酸。例如,Yokoyama及其同事對脂肪嗜熱芽孢桿菌CSac///^Wefl/^/^mo;Mz^)琥珀抑制子tRNA^(5對RNAg^)以及大腸桿菌CE.co/z')酪氨酰-tRNA合成酶(五cTyrRS)進行修飾使3-碘-L-酪氨酸摻入到CHO細胞的蛋白中(Sakamoto等(2002),"在哺乳動物細胞中將非天然氨基酸定點慘入蛋白質中"(Site-specificincorporationofanunnaturalaminoacidintoproteinsinmammaliancells)TVwc/e/ci^30:4692-4699)。同樣,Zhang及其同事對正交枯草桿菌(5ac/〃usw6"fc)抑制子tRNA/色氨酸-tRNA合成酶對進行工程改造使5-羥色氨高保真的摻入到哺乳動物細胞的蛋白中(Zhang等(2004)"將5-羥色氨選擇性摻入到哺乳動物細胞蛋白中"(Selectiveincorporationof5-hydroxytryptophanintoproteinsinmammaliancells)/Voc^caof101:8882-8887).然而,使用基于結構的誘變產生氨酰化側鏈與野生型底物顯著不同的氨基酸的aaRS變體需要突變多個活性位點殘基,而這些殘基難以事先預測(Zhang等(2002),"基于結構設計突變詹氏甲垸球菌(MW/z朋ococc^y'朋"wc/^)酪氨酰-tRNA合成酶以摻入O-甲基-L-酪氨酸"(Structure-baseddesignofmutantMethanococcusjannaschiityrosyl-tRNAsynthetaseforincorporationofO-methyl-L-tyrosine)PracA^/JcadS".t/S爿99:6579-6584;Turner等(2005)'"對-乙酰苯丙氨酸氨酰基tRNA合成酶的結構鑒定"(Structuralcharacterizationofap-acetylphenylalanylaminoacyl-tRNAsynthetase)J爿mCAem&c127:14976-14977;Turner等(2006),"氨酰-tRNA合成酶活性位點的結構可塑十生"(Structuralplasticityofanaminoacyl-tRNAsynthetaseactivesite)/VocAto/Jcad&/103:6483-6488)。此外,工程改造的突變體仍可識別宿主氨基酸,如使關聯tRNAg^攜帶3-碘-L-酪氨酸的突變aaRS(Sakamoto等(2002),"在哺乳動物細胞中將非天然氨基酸定點慘入蛋白質中"(Site-specificincorporationofanunnaturalaminoacidintoproteinsinmammaliancells)■/Vwc/eZc爿d^Tm30:4692-4699;以及Kiga等(2002),"一種在真核翻譯中將非天然氨基酸定點摻入蛋白的工程改造的大腸桿菌酪氨酰-tRNA合成酶及其在麥芽無細胞體系中白勺應用,,(AnengineeredEscherichiacolityrosyl-tRNAsynthetaseforsite-specificincorporationofanunnaturalaminoacidintoproteinsineukaryotictranslationanditsapplicationinawheatgermcell-freesystem)/Voc7Va,/Jcat/t/S爿99:9715-9720)。此外,可嘗試在哺乳動物細胞中直接演化特異性改變的aaRS。例如,Wang及其同事最近在人B細胞系中使用體細胞超變異直接演化具有增強的光穩定性和遠紅發射的單體形式的紅色熒光蛋白(Wang等(2004),"通過反復體細胞超變異使新非抗體蛋白演化"(Evolutionofnewnonantibodyproteinsviaiterativesomatichypermutation)尸mcA^/爿cadt/&4101:16745-16749)。然而,體細胞超變異在整個蛋白中引入隨機突變,其有效性小于演化底物特異性改變的突變體時進行的活性位點靶向誘變中產生的遺傳多樣性。然而后者受限于在哺乳動物細胞中產生大的穩定文庫的困難。正交翻譯技術已開發出能將結構多樣的非天然氨基酸體外定點摻入原核生物和酵母蛋白的常用方法,這些非天然氨基酸具有非天然的物理、化學和生物學屬性。這些方法依賴于在體內多肽翻譯中能識別合適選擇編碼子并在感興趣基因的明確位點插入期望的非天然氨基酸的正交蛋白翻譯組件。這些方法使用識別選擇編碼子(如無義琥珀編碼子)的正交tRNA(O-tRNA),并且對應的特定正交氨酰-tRNA合成酶(O-RS)使該O-tRNA特異性攜帶非天然氨基酸。這些組件不與宿主有機體內任意內源性tRNA或RS交叉反應(即工程改造的tRNA和RS是正交的)。在大腸桿菌宿主系統中使用此技術,由詹氏甲烷球菌tRNATy7TyrRS對、古細菌tRNAG'u/嗜熱古菌(尸,ococcz^/^汰ay/H7)谷氨酰-tRNA合成酶對、以及古細菌tRNA"7嗜熱古菌賴氨酰-tRNA合成酶對產生功能性琥珀和移碼抑制子tRNA/aaRS對。在酉良酒酵母(Sacc/w;nmyc^cereWw'ae,S.cerew;s7'ae)中,功能性tRNACUA/aaRS對衍生自對應的大腸桿菌tRNATy7TyrRS以及tRNA"7亮氨酰-tRNA合成酶對。使用正向和反向選擇組合對這些抑制子tRNA/aaRS對的定向演化能夠在大腸桿菌和釀酒酵母中有效、高選擇性地體內摻入大量不同的非天然氨基酸。這些包括熒光、糖基化、硫酸化、金屬離子結合和氧化還原活性氨基酸以及具有新化學和光化學反應性的氨基酸。該方法為在體內外探索蛋白結構和功能以及產生諸如具有新的或增強特性的治療性蛋白等蛋白質提供了有力的工具。將這些方法擴展至哺乳動物細胞,如靈長類和嚙齒動物細胞系將顯著增強該方法的實用性。本領域普遍知道利用適合于在體內制備含一個或多個非天然氨基酸的蛋白質的正交翻譯系統。例如,參見國際公布號WO2002/086075,其名為"METHODSANDCOMPOSITIONFORTHEPRODUCTIONOFORTHOGONALtRNA-AMINOACYL-tRNASYNHETASEPAIRS(產生正交tRNA-氨酰-tRNA合成酶配對的方法和組合物)";WO2002/085923,其名氨基酸的體內摻入)";WO2004/094593,其名為"EXPANDINGTHEEUKARYOTICGENETICCODE(擴展真核遺傳密碼)";2004年7月7日提交的WO2005/019415;2004年7月7日提交的WO2005/007870;2004年7月7日提交的WO2005/007624;和2005年10月27日提交的WO2006/110182,其名為"ORTHOGONALTRANSLATIONCOMPONENTSFORTHEINVIVOINCORPORATIONOFUNNATURALAMINOACIDS(體內慘入非天然氨基酸的正交翻譯組分)"。這些申請各自通過引用全文納入本文。正交翻譯系統的其它討論參見如Wang等(2001),"擴展大腸桿菌的遺傳密石馬"(Expandingthegeneticcodeoffcc/zen'c/^aco//)5We"ce292:498-500;Wang和Schultz(2002),"擴展遺傳密碼"(ExpandingtheGeneticCode)Comm,.^Ojm^l:1-11;Alfonta等(2003),"在蛋白中定點摻入氧化還原活性氨基酸"(Site-SpecificIncorporationofaRedox-ActiveAminoAcidintoProteins)■/爿wC7z謹Socl25:14662-14663;Santoro等(2003),"用于在大腸桿菌中對蛋白進行非天然氨基酸誘變的古細菌起源的谷氨酰-tRNA合成酶和tRNA"(Anarchaebacteria-derivedglutamyl-tRNAsynthetaseandtRNApairforunnaturalaminoacidmutagenesisofproteinsinEsr/zm.c/z/a7Vwc/e/cJc油31:6700-6709;Chin等(2003)'"擴展的真核遺傳密碼"(Anexpandedeukaryoticgeneticcode)Sc/ewce301,964-967;Chin等(2003),"擴展的真核遺傳密碼進展"(Progresstowardanexpandedeukaryoticgeneticcode)Oew10,511-519;以及Wu等(2004),"遺傳編碼的光籠蔽氨基酸"(Ageneticallyencodedphotocagedaminoacid)J」wCAem&c126,14306-14307;Summerer等(2006),"遺傳編碼的熒光氨基酸"(AGeneticallyEncodedFluorescentAminoAcid)尸M46"103(26):9785-9789;Anderson等(2004),"具有功能性四聯密碼子的擴展遺傳密碼"(Anexpandedgeneticcodewithafunctionalquadrupletcodon)/VocAto/」cad^4101:7566-7571;Zhang等(2004),"合成糖蛋白的新策略"(Anewstrategyforthesynthesisofglycoproteins)Sc,e"ce303,371-373;Wang和Schultz"擴展遺傳密碼"(ExpandingtheGeneticCode)爿wge麗w血CTzem/e/"A44(1):34-66(2005);Xie和Schultz"擴展的遺傳密碼"(AnExpandingGeneticCode)M"toA36(3):227-238(2005);Xie和Schultz"在遺傳庫中加入氨基酸"(AddingAminoAcidstotheGeneticRepertoire)Cwr.0/〖"/owz'wC7zemz'ca/5fo/ogy9(6):548-554(2005);Wang等"擴展遺傳密碼"(ExpandingtheGeneticCode)j朋".及ev.歷o尸/^.所omo/.^r"",35:225-249(2006);Xie和Schultz(2006)"蛋白化學工具箱-擴展遺傳密碼"(AChemicalToolkitforProteins-anExpandedGeneticCode)A^.iev.Mo/.Ce〃歷o/.,7(10):775-782;Summerer等(2006),"遺傳編碼的熒光氨基酸"(AGeneticallyEncodedFluorescentAminoAcid)/VociVa〃爿cfld&z'f/SJ103,9785-9789;Wang等(2006),"遺傳編碼的熒光氨基酸"(AGeneticallyEncodedFluorescentAminoAcid)/C7z,Soc128,8738-8739;以及Liu和Schultz(2006),"在大腸桿菌中重組表達選擇性硫酸化的蛋白"(RecombinantExpressionofSelectivelySulfatedProteinsin五.co/z〕歷ofec/z"o/.,24(11):1436-1440。上述每一出版物的內容均通過引用納入本文。本領域需要開發在期望將非天然氨基酸摻入設定位點時,能夠在哺乳動物細胞宿主系統,例如靈長類和嚙齒類宿主細胞系統中將非天然氨基酸摻入蛋白質的改良的正交翻譯組件。本領域需要用于篩選和鑒別能用于哺乳動物細胞如嚙齒類和人細胞的正交翻譯組件(如突變的氨酰-tRNA合成酶)的改良方法。本文所述發明滿足此類及其它需求,在瀏覽下述公開文本后將明了。
發明內容本發明提供了允許在哺乳動物細胞如嚙齒類和靈長類細胞中遺傳表達具有多種理化和生物學屬性的非天然氨基酸的常用方法。首先在酵母中演化突變的大腸桿菌(^c/2eWc/u'aco//,£.co/z')氨酰-tRNA合成酶(RS),以選擇性使用感興趣的非天然氨基酸。使用突變RS及來自真細菌如脂肪嗜熱芽孢桿菌(及他araAennopMM5))的琥珀抑制子tRNA在哺乳動物細胞中響應于琥珀無義密碼子而將非天然氨基酸定點摻入蛋白質中。將十種非天然氨基酸(圖1提供的非天然氨基酸)獨立摻入中國倉鼠卵巢(CHO)細胞或人293T表達的模式蛋白中,蛋白表達效率高達每2x107個細胞產生1pg蛋白。質譜確認非天然氨基酸的高翻譯保真度。該方法利于在蛋白中引入生物學探針進行細胞研究,并可能最終利于在哺乳動物細胞如嚙齒類和靈長類細胞中合成含非天然氨基酸的治療性蛋白。本發明提供了在宿主細胞如嚙齒類宿主細胞或靈長類宿主細胞體內,響應選擇者密碼子如琥珀終止密碼子,在延伸的多肽鏈中摻入非天然氨基酸的組合物和方法。這些組合物包括宿主細胞、以及不與宿主細胞翻譯機器相互作用的正交-tRNA(O-tRNA)和正交氨酰-tRNA合成酶(O-RS)對。也就是說,宿主細胞的內源性氨酰-tRNA合成酶未使(或未顯著使)該O-tRNA攜帶(天然的或非天然的)氨基酸。同樣,本發明提供的O-RS未使任意內源性tRNA攜帶顯著或可檢測水平的氨基酸(天然的或非天然的)。這些新組合物允許在哺乳動物宿主細胞系統中產生大量翻譯摻入非天然氨基酸的蛋白質。在一些方面,本發明提供了翻譯系統。這些系統包含(a)哺乳動物宿主細胞如嚙齒類或靈長類宿主細胞,含有(b)第一正交氨酰-tRNA合成酶(O-RS),(c)第一正交tRNA(O-tRNA)以及(d)第一非天然氨基酸,其中第一O-RS優選用第一非天然氨基酸氨酰化第一O-tRNA。非天然氨基酸可以是,但不限于對-甲氧基苯丙氨酸(pMpa);對-乙酰基苯丙氨酸(pApa);對-苯甲酰苯丙氨酸(pBpa);對-碘代苯丙氨酸(plpa);對-疊氮基苯丙氨酸(pAzpa);對-炔丙基氧基苯丙氨酸(pPpa);a-氨基辛酸;鄰-硝基芐基半胱氨酸(o-NBC);1,5-丹磺酰丙氨酸;和11鄰-硝基芐基絲氨酸(o-NBS).在一些方面,O-RS優選用所述非天然氨基酸氨酰化O-tRNA,其效率至少為包含相同O-tRNA、非天然氨基酸和含有選自SEQIDNO:57-101的氨基酸序列的氨酰-tRNA合成酶的翻譯系統效率的50%。該翻譯系統可使用衍生自多種來源的組分。在一個實施方式中,第一O-RS衍生自大腸桿菌氨酰-tRNA合成酶,如野生型大腸桿菌酪氨酰或亮氨酰合成酶。在一些實施方式中,O-tRNA包含SEQIDNO:3或由SEQIDNO:3編碼。系統中所用O-RS可包含氨基酸序列SEQIDNOS:57-101以及該序列的保守變體。在一些方面,宿主細胞可包含一種或多種編碼翻譯系統組件,包括O-RS或O-tRNA的多核苷酸。在一些實施方式中,編碼O-RS的多核苷酸包含選自SEQIDNO:8-56的核苷酸序列。在一些方面,該翻譯系統還包含編碼感興趣蛋白的核酸,其中所述核酸具有至少一個能被O-tRNA識別的選擇者密碼子。在一些方面,該翻譯系統(即宿主細胞)納入使用第二非天然氨基酸的第二正交對(即第二O-RS和第二O-tRNA),因此該系統現在能夠將至少兩種不同非天然氨基酸摻入到多肽的不同所選位點。在這個雙重系統中,第二O-RS優選用不同于第一非天然氨基酸的第二非天然氨基酸氨酰化第二O-tRNA,并且第二O-tRNA識別的選擇者密碼子不同于第一O-tRNA識別的選擇者密碼子。翻譯系統中所用的哺乳動物宿主細胞不受特別限制,只要O-RS和O-tRNA在宿主細胞環境中保留其正交性。宿主細胞可以是嚙齒類宿主動物細胞如小鼠細胞和大鼠細胞。當宿主細胞為靈長類細胞時,細胞可為,例如人宿主細胞、黑猩猩宿主細胞、倭黑猩猩宿主細胞、大猩猩宿主細胞、猩猩宿主細胞、長臂猿宿主細胞、短尾猿宿主細胞、絹毛猴宿主細胞或狨宿主細胞。宿主細胞可為,例如CHO細胞或人293T。在另一些方面,本發明提供了產生在所選位置具有一個或多個非天然氨基酸的感興趣蛋白質的方法。這些方法使用上述翻譯系統。通常,這些方法從提供翻譯系統的步驟開始,該翻譯系統包括(i)第一非天然氨基酸(如圖1中非天然氨基酸);(ii)第一正交氨酰-tRNA合成酶(O-RS);(iii)第一正交tRNA(O-tRNA),其中O-RS優選用非天然氨基酸氨酰化O-tRNA;以及(i力編碼感興趣蛋白的核酸,其中該核酸包含至少一個能被第一O-tRNA識別的選擇者密碼子,并且選擇者密碼子在核酸中的位置對應感興趣蛋白中的所選位置。所有這些系統組件均包含于合適的宿主細胞,如嚙齒類或靈長類細胞中。產生具有非天然氨基酸的蛋白質的方法通常需要在上述翻譯系統所有組件存在下培養宿主細胞。在這些方法中,非天然氨基酸可選自(但不限于)對-甲氧基苯丙氨酸(pMpa);對-乙酰基苯丙氨酸(pApa);對-苯甲酰苯丙氨酸(pBpa);對-碘代苯丙氨酸(plpa);對-疊氮基苯丙氨酸(pAzpa);對-炔丙基氧基苯丙氨酸(pPpa);a-氨基辛酸;鄰-硝基芐基半胱氨酸(o-NBC);1,5-丹磺酰丙氨酸;和鄰-硝基芐基絲氨酸(o-NBS).在這些方法的一些方面,O-RS優選用非天然氨基酸氨酰化O-tRNA,其效率至少為包含相同O-tRNA、非天然氨基酸和含有選自SEQIDNO:57-101的氨基酸序列的氨酰-tRNA合成酶的翻譯系統效率的50%。該方法可利用多種試劑進行廣泛應用。在本方法的一些實施方式中,O-tRNA包含SEQIDNO:3或由SEQIDNO:3編碼。在一些實施方式中,提供了編碼O-RS禾P/或O-tRNA的多核苷酸。在一些實施方式中,O-RS衍生自大腸桿菌氨酰-tRNA合成酶,如野生型大腸桿菌酪氨酰或亮氨酰-tRNA合成酶。一些實施方式中,提供步驟包括提供含有選自SEQIDNO:57-101的氨基酸序列及其保守變體的O-RS。在這些方法的一些方面,提供了編碼O-RS的多核苷酸。例如,編碼O-RS的多核苷酸可包含選自SEQIDNO:8-56的核苷酸序列。在這些方法的一些實施方式中,提供O-RS需要通過定點誘變技術突變野生型氨酰-tRNA合成酶的氨基酸結合口袋,和選擇優先用非天然氨基酸氨酰化O-tRNA的所得的O-RS。選擇步驟可包括在定點誘變后從得到的氨酰-tRNA合成酶分子庫中正向和負向選擇O-RS。還可改進這些方法以在蛋白質中摻入一個以上非天然氨基酸。在那些方法中,聯用第二正交翻譯系統與第一翻譯系統,其中第二系統具有不同的氨基酸和選擇者密碼子特異性。例如,提供步驟可包括提供第二O-RS和第二O-tRNA,其中第二O-RS優先用不同于第一非天然氨基酸的第二非天然氨基酸氨酰化第二O-tRNA,且第二O-tRNA識別核酸中不同于第一O-tRNA所識別的選擇者密碼子的選擇者密碼子。定義在詳細描述本發明前,應該知道本發明不局限于具體的生物系統,本發明當然可以有各種變化。還應知道本文所用的術語只是為了描述具體的實施方式,而非限制性的。除非另有明確指出,本說明書和隨附的權利要求書中使用的單數形式"一個"、"一種"和"該"也包括復數對象。因此,例如述及"一個細胞"包括兩個或多個細胞的組合;"一個多核苷酸"實際上包括該多核苷酸的多份拷貝。除了此處和說明書以下其余部分所定義的,本文所用的所有技術和科學術語都與本發明所屬領域普通技術人員常規理解的意義相同。正交:本文所用的術語"正交"指與某細胞或翻譯系統的內源性相應分子相比,某分子(例如,正交tRNA(0-tRNA)禾卩/或正交氨酰tRNA合成酶(O-RS))與該細胞內源性組分起作用的效率降低,或不能與該細胞的內源性組分起作用。就tRNA和氨酰-tRNA合成酶而言,正交指與和內源性tRNA合成酶起作用的內源性tRNA相比,正交tRNA不能與內源性tRNA合成酶起作用或起作用的效率降低;或者與和內源性tRNA起作用的內源性tRNA合成酶相比,正交氨酰tRNA合成酶與內源性tRNA不起作用或起作用的效率降低,所述效率降低例如,小于20%的效率,小于10%的效率,小于5%的效率,或小于1%的效率。正交分子缺乏細胞中功能正常的內源性互補分子。例如,與內源性RS氨酰化內源性tRNA相比,細胞的任何內源性RS氨酰化細胞中正交tRNA的效率降低或者甚至為0。在另一例子中,與內源性RS氨酰化內源性tRNA相比,正交RS氨酰化感興趣細胞中任何內源性tRNA的效率降低或者甚至為0。可將能與第一正交分子一起起作用的第二正交分子引入細胞。例如,正交tRNA/RS配對包括在細胞中共同起作用且與對照,例如相應的tRNA/RS內源性配對相比其效率是,例如45%效率、50%效率、60%效率、70%效率、75%效率、80%效率、90%效率、95%效率或99%效率,或更高的引入補充組分,或活性正交配對(如酪氨酰或亮氨酰衍生的正交tRNA/RS配對)。正交酪氨酰-tRNA:本文所用的正交酪氨酰-tRNA(酪氨酰-O-tRNA)是與感興趣翻譯系統正交的tRNA,其中所述tRNA是(1)與天然酪氨酰-tRNA相同或基本類似;(2)通過天然或人工誘變衍生自天然酪氨酰tRNA;(3)由考慮了(1)或(2)的野生型或突變型酪氨酰tRNA序列的任何方法產生;(4)與野生型或突變型酪氨酰tRNA同源;(5)與稱為酪氨酰tRNA合成酶底物的任何tRNA同源;或(6)稱為酪氨酰tRNA合成酶底物的任何示例性tRNA的保守變體。酪氨酰tRNA可加載有氨基酸,或處于非負載狀態。還應知道"酪氨酰-0-tRNA"任選被關聯(cognate)合成酶分別加載(氨酰化)除酪氨酸以外的氨基酸,例如非天然氨基酸。應該知道,實際上優選利用本發明酪氨酰-O-tRNA在翻譯期間響應于選擇者密碼子而將基本上任何氨基酸(無論天然或非天然的)摻入延伸的多肽內。正交酪氨酰氨基酸合成酶:本文所用的正交酪氨酰氨基酸合成酶(酪氨酰-O-RS)是在感興趣翻譯系統內用氨基酸優先氨酰化酪氨酰-O-tRNA的酶。酪氨酰-O-RS加載到酪氨酰-O-tRNA上的氨基酸可以是任何氨基酸,無論是天然的、非天然的還是人工的,并且不限于本文所述的氨基酸。該合成酶任選與天然酪氨酰氨基酸合成酶相同或同源,或者本文提供的稱為O-RS的合成酶相同或同源。例如,所述O-RS可以是圖16的酪氨酰-O-RS的保守變體,和/或與圖16中O-RS的序列(SEQIDNO:57-101)至少有50。/。、60%、70%、80%、90%、95%、98%、99%或以上相同。TH交亮氨酰-tRNA:如本文所用,正交亮氨酰-tRNA(亮氨酰-O-tRNA)是對感興趣翻譯系統正交的tRNA,其中tRNA是(l)與天然發生的亮氨酰-tRNA相同或基本相似,(2)通過天然或人工誘變衍生自天然發生的亮氨酰-tRNA,(3)由考慮了(l)或(2)的野生型或突變型亮氨酰-tRNA序列的任何方法產生,(4)與野生型或突變型酪氨酰-tRNA同源;(5)與稱為亮氨酰-tRNA15合成酶底物的任何tRNA同源,或(6)稱為亮氨酰-tRNA合成酶底物的任何示范性tRNA的保守變體。亮氨酰-tRNA可以加載有氨基酸,或處于非負載狀態。還應知道,"亮氨酰-O-tRNA"任選被關聯合成酶分別加載(氨酰化)除亮氨酸外的氨基酸,如非天然氨基酸。事實上,應理解優選利用本發明亮氨酰-O-tRNA在翻譯期間響應于選擇密碼子而將基本上任何氨基酸(無論是天然或是非天然)摻入延伸的多肽中。正交亮氨酰氨基酸合成酶本文所用的正交亮氨酰氨基酸合成酶(亮氨酰-O-RS)是感興趣翻譯系統中用氨基酸優先氨酰化亮氨酰-O-tRNA的酶。被亮氨酰-O-RS加載到亮氨酰-O-tRNA上的氨基酸可以是任何氨基酸,如天然、非天然或人工氨基酸,在本文中不作限制。所述合成酶任選與天然產生的亮氨酰氨基酸合成酶相同或同源,或者與本文中稱為O-RS的合成酶相同或同源。例如,O-RS可以是圖16的亮氨酰-O-RS的保守變體,和/或可能與圖16的O-RS有至少50%、60%、70%、80%、90%、95%、98%、99%或更多序列相同。關聯(co四ate):術語"關聯"指共同起作用或彼此具有一定特異性的組分,例如正交tRNA和正交氨酰-tRNA合成酶。這些組分也可互稱為"互補的"。優先氨酰化:對于本文所用正交翻譯系統而言,當某表達系統中O-RS使O-tRNA帶上氨基酸的效率高于其使任何內源性tRNA帶上氨基酸的效率時,該O-RS"優先氨酰化"關聯O-tRNA。g卩,當翻譯系統中存在摩爾比大致相等的O-tRNA與任何給定的內源性tRNA時,O-RS加載O-tRNA的頻率高于它加載內源性tRNA的頻率。當翻譯系統中存在等摩爾濃度的O-tRNA與內源性tRNA時,由O-RS加載的O-tRNA與由O-RS加載的內源性tRNA的相對比例優選較高,最好導致O-RS僅加載或幾乎僅加載O-tRNA。當存在等摩爾濃度的O-tRNA與O-RS時,O-RS加載的O-tRNA與內源性tRNA的相對比例大于1:1,優選至少約2:1,更優選5:1,更優選10:1,更優選20:1,更優選50:1,更優選75:1,更優選95:1、98:1、99:1、100:1、500:1、1,000:1、5,000:1或更當(a)與內源性tRNA相比,O-RS優先氨酰化O-tRNA,禾口(b)與O-RS用任何天然氨基酸氨酰化O-tRNA相比,氨酰化對非天然氨基酸特異時,稱O-RS"優先用非天然氨基酸氨酰化O-tRNA"。即,當包含O-RS和O-tRNA的翻譯系統中存在等摩爾量的非天然和天然氨基酸時,O-RS用非天然氨基酸加載O-tRNA的頻率高于用天然氨基酸加載的頻率。加載有非天然氨基酸的O-tRNA與加載有天然氨基酸的O-tRNA的相對比例優選較高。O-RS最好使O-tRNA僅加載,或者幾乎僅加載有非天然氨基酸。當翻譯系統中存在等摩爾濃度的天然和非天然氨基酸時,使O-tRNA帶上非天然氨基酸與使O-tRNA帶上天然氨基酸的相對比例大于l:l,優選至少約2:1,更優選5:1,更優選10:1,更優選20:1,更優選50:1,更優選75:1,更優選95:1、98:1、99:1、100:1、500:1、1,000:1、5,000:1或更高。選擇者密碼子:術語"選擇者密碼子"指翻譯過程中為O-tRNA所識別而不為內源性tRNA所識別的密碼子。O-tRNA反密碼子環識別mRNA上的選擇者密碼子并在多肽的此位置摻入其氨基酸,例如非天然氨基酸。選擇者密碼子可包括,例如無義密碼子,如終止密碼子(如,琥珀、赭石和乳白密碼子);四堿基或四堿基以上密碼子;罕用密碼子;衍生自天然或非天然堿基對的密碼子,等等。抑制子tRNA:抑制子tRNA是在多肽翻譯期間通常響應于終止密碼子而摻入氨基酸(即,"連讀")來改變給定的翻譯系統中信使RNA(mRNA)閱讀的tRNA。在一些方面,本發明的選擇者密碼子是抑制子密碼子,例如,終止密碼子(如,琥珀、赭石和乳白密碼子)、四堿基密碼子、罕用密碼子等。抑制活性:本文所用的術語"抑制活性"總體上指tRNA(例如,抑制子tRNA)能翻譯連讀在其它情況中可導致翻譯終止或錯譯(例如,移碼)的密碼子(例如,作為選擇者密碼子的琥珀密碼子或四個或以上個堿基的密碼子)的能力。抑制子tRNA的抑制活性可表示為與第二抑制子tRNA,或與對照系統,例如缺乏O-RS的對照系統相比,觀察到的翻譯連讀活性的百分比。本發明提供定量測定抑制活性的各種方法。特定O-tRNA和O-RS對感興趣選擇者密碼子(例如,琥珀密碼子)的抑制百分比指,在感興趣的翻譯系統中,在編碼表達測試標記的核酸中含有選擇者密碼子的該給定表達測試標記(例如,LacZ)的活性與陽性對照構建物相比的百分比,所述感興趣的翻譯系統包含O-RS禾BO-tRNA,所述陽性對照沒有O-tRNA、O-RS和選擇者密碼子。因此,例如,如果在給定翻譯系統中觀察到不含選擇者密碼子的活性陽性對照標記構建物的活性為X(其單位與所述標記試驗相關),則含有選擇者密碼子的測試構建物的抑制百分比是在與陽性對照標記的表達基本相同的環境條件下(除了該測試標記構建物在也含有O-tRNA和O-RS的翻譯系統中表達外),該測試標記構建物顯示的X百分比。表達該測試標記的翻譯系統一般也包含O-RS和O-tRNA識別的氨基酸。可任選通過將測試標記與"背景"或"陰性"對照標記構建物比較來校正抑制百分比的測量值,所述"背景"或"陰性"對照標記構建物含有與測試標記相同的選擇者密碼子,但其所在的系統不含O-tRNA、O-RS和/或O-tRNA和域O-RS識別的相關氨基酸。該陰性對照可用于標準化抑制百分比測定值以補償感興趣的翻譯系統中標記的背景信號的影響。可通過本領域已知的許多試驗測定抑制效率。例如,可采用^半乳糖苷酶報道試驗,如可將衍生的lacZ質粒(該構建物在lacZ核酸序列中含有選擇者密碼子)連同含有本發明的O-tRNA的質粒引入合適生物(例如,可利用正交組分的生物)的細胞。還可引入關聯合成酶(可以是多肽或表達時能編碼該關聯合成酶的多核苷酸)。細胞在培養基中生長至所需密度,例如至OD,約為0.5,進行P-半乳糖苷酶試驗,例如用諾瓦金公司(Novagen)的BetaFluorTM(3-半乳糖苷酶試驗試劑盒。可將抑制百分比計算為樣品相對于可比較對照,例如,衍生的lacZ構建物的觀察值的活性百分比,該構建物在所需位置具有相應的有義密碼子而非選擇者密碼子。翻譯系統:術語"翻譯系統"指將氨基酸摻入延伸中的多肽鏈(蛋白質)的各組分。翻譯系統的組分可包括,例如核糖體、tRNA、合成酶、mRNA等。本發明的O-tRNA禾n/或O-RS可加入體外或體內翻譯系統或是其一部分,例如存在于哺乳動物細胞,如嚙齒動物細胞、靈長動物細胞。非天然氨基酸:本文所用的術語"非天然氨基酸"指不在20種常見天然氨基酸或硒代半胱氨酸或吡咯賴氨酸(pyrrolysine)之列的任何氨基酸,修飾的氨基酸和/或氨基酸類似物。參見例如圖l提供的非天然氨基酸。衍生自:本文所用的術語"衍生自"指分離自特定分子或生物,或是用特定分子或生物的信息制得的某組份。例如,衍生自第二多肽的多肽含有與該第二多肽的氨基酸序列相同或基本上類似的氨基酸序列。以多肽為例,可通過,例如天然產生的誘變、人工定向誘變或人工隨機誘變獲得衍生的種類。用于衍生多肽的誘變可以是有意定向或有意隨機的,或混用兩種方法。誘變多肽以產生衍生自第一(多肽)的不同多肽可以是隨機的(例如,聚合酶失真所致),可通過合適的篩選方法,例如本文所述的方法鑒定衍生的多肽。誘變多肽通常需要對編碼該多肽的多核苷酸進行操作。正選擇或篩選標記:本文所用的術語"正選擇或篩選標記"指當存在該標記時(例如被表達或激活等)可從不具有特征的細胞中鑒定出具有特征的細胞,例如具有正選擇標記的細胞。負選擇或篩選標記:本文所用的術語"負選擇或篩選標記"指當存在該標記時(例如被表達或激活等)可鑒定不含有所選特性或特征的細胞(例如,與確實具有該特性或特征的細胞相比)。報道分子:本文所用的術語"報道分子"是指可用于鑒定和/或選擇感興趣系統的耙組分的組分。例如,報道分子可以包括蛋白質,如能賦予抗生素抗性或敏感性的酶(如(3-內酰胺酶、氯霉素乙酰轉移酶(CAT)等)、熒光篩選標記(如綠色熒光蛋白(如GFP)、YFP、EGFP、RFP等)、冷光標記(如螢火蟲螢光素酶蛋白)、親和力篩選標記,或者可選擇的正或負標記基因如lacZ、(3-gal/lacZ((3-半乳糖苷酶)、ADH(乙醇脫氫酶)、his3、ura3、leu2、lys2等°真核生物:本文所用的術語"真核生物"指屬于真核生物界(KingdomEucarya)的生物。真核生物通常因其以下特征而區別于原核生物典型的多細胞組織(但不都是多細胞,例如酵母),存在膜限制的核與其它膜限制的細胞器,線形遺傳物質(即,線形染色體),不存在操縱子,存在內含子、信使(RNA)加帽和聚-AmRNA,以及其它生物化學特征,如不同的核糖體結構。真核生物包括,例如動物(如哺乳動物、昆蟲、爬行動物、鳥等),纖毛蟲,植物(如單子葉植物、雙子葉植物、藻類等)、真菌、酵母菌、鞭毛蟲類、微孢子蟲、原生動物等。原核生物:本文所用的術語"原核生物"指屬于原核生物界(也稱為原核生物(Procarya))的生物。原核生物通常因其以下特征而區別于真核生物單細胞組織,通過出芽或分裂的無性生殖,缺乏膜限制的核與其它膜限制的細胞器,環狀染色體,存在操縱子,不存在內含子、信使(RNA)加帽和聚-AmRNA,以19及其它生物化學特征,如不同的核糖體結構。原核生物包括真細菌和古細菌(Archaea)(有時稱為"古細菌(Archaebacteria)")亞界。在原核生物界有時將藍細菌(藍綠藻)與支原體(歷史上認為是細菌)分為不同類別。真細菌:本文所用的術語"真細菌"和"細菌"指不同于古細菌的原核生物。類似地,古細菌指不同于真細菌的原核生物。可根據許多形態和生物化學標準區分真細菌和古細菌。例如,可采用核糖體RNA序列、RNA聚合酶結構的差異,內含子的存在與否,抗生素敏感性,細胞壁肽聚糖和其它細胞壁組分的存在與否,膜脂質的分枝與不分枝結構,存在/不存在組蛋白和組蛋白樣蛋白而將某生物指定為真細菌或古細菌。真細菌的例子包括大腸桿菌C&c/2en'c/z/aco//)、嗜熱棲熱菌(TTz^vm^^^mo//2//z)、枯草芽孢桿菌(5acz7/wss"6"fc)和嗜熱脂肪芽孢桿菌(5ac/〃wstearaAermo;^//^)等)。古細菌的例子包括詹氏甲烷球菌(7W"/za"ococcwy'aw7fl^c/n7)(A0、梅氏甲烷八疊球菌(Af"/zaworarc/"amaze/)CMm)、嗜熱堿甲烷桿菌(Me^za"o6fl"en'wmAe削oawto^o/7/w'c謂)(M0、海沼甲院球菌(Me決anococcMSman》a/w(iz'力、甲烷嗜熱菌(AfeAflwopjTMSA:a"tZ/erz〕、鹽細菌(7a/o6a"en'ww)(例如沃氏富鹽菌(/fa/o/eraxvo/cam7)和鹽細菌種A^C-7入閃爍古生球菌04rc/zaeog/o6w51/zz/g/(i—(4/)、激烈火球菌(尸"coccz^/鵬.。愿)(尸/)、極端嗜熱古菌CPyrococcws/zor汰as/zz》(尸/z)、好氧火球菌(尸;vro6acw/訓aen9/Mw附)、深海火球斷尸jrococcwsa6戸Z)、硫磺礦硫化葉斷iS^o/o6wsso(/^to〃-cm)(&)、超嗜熱泉古菌(^w//0/06^to/totto//)、嗜熱泉生古細菌04ewra外'ram^rm'x卩G^)、口耆酸熱原體(T7^rmo//asw。ac/c/op/H'/wm)禾口火山熱原體(T7zerwop/as7Wflvo/cam.臓)。保守變體:就翻譯組分而言,本文所用的術語"保守變體"指某翻譯組份,例如保守變體O-tRNA或保守變體O-RS,其所執行的功能與與其相似的基本組分(例如O-tRNA或O-RS)相類似,但與參比O-tRNA或O-RS相比序列中有變異的。例如,O-RS或該O-RS的保守變體可用非天然氨基酸,例如圖1的非天然氨基酸氨酰化關聯O-tRNA。在該例子中,所述O-RS及保守變體O-RS的氨基酸序列不相同。所述保守變體在序列中可具有例如一處變異、兩處變異、三處變異、四處變異或五處或更多處變異,只要該保守變體仍與關聯的相應O-tRNA或O-RS互補(例如,與之起作用)。在一些實施方式中,保守變體O-RS與衍生其的O-RS相比,含有一個或多個保守性氨基酸取代。在一些實施方式中,保守變體O-RS與衍生其的O-RS相比,含有一個或多個保守性氨基酸取代,此外還保留了O-RS的生物學活性;例如,保守變體O-RS保留了衍生其的親本O-RS分子至少10%,或者至少20%,至少30%,或至少40%的生物學活性。在一些優選實施方式中,所述保守變體O-RS保留了衍生其的親本O-RS分子至少50%的生物學活性。保守變體O-RS的保守性氨基酸取代可出現在該O-RS的任何結構域內,包括氨基酸結合袋。選擇或篩選試劑:本文所用的術語"選擇或篩選試劑"指當存在時可從某群體中選擇/篩選某些組分的試劑。例如,選擇或篩選試劑可以是但不限于,如營養物、抗生素、某波長的光、抗體、表達的多核苷酸等。選擇試劑可因例如濃度、強度等而有所不同。響應:本文所用的術語指本發明的O-tRNA識別選擇者密碼子并介導與該tRNA偶聯的非天然氨基酸摻入延伸中的多肽鏈的過程。編碼:本文所用的術語"編碼"指用多聚大分子或序列鏈中的信息來指導不同于該第一分子或序列鏈的第二種分子或序列鏈產生的任何過程。本文所用的該術語應用廣泛,可用于各領域。在一些方面,術語"編碼"描述了半保留DNA復制的過程,其中雙鏈DNA分子的一條鏈用作模板,借助依賴DNA的DNA合成酶來編碼新合成的互補姊妹鏈。在另一方面,術語"MM"指用一種分子的信息來指導產生化學性質不同于該第一分子的第二種分子的任何過程。例如,DNA分子可編碼RNA分子(例如,包含依賴DNA的RNA聚合酶的轉錄過程)。RNA分子也可編碼多肽,例如翻譯過程。當術語"編碼"用于描述翻譯過程時,其含義也延伸至編碼氨基酸的三聯密碼子。在一些方面,RNA分子可編碼DNA分子,例如通過包含依賴RNA的DNA合成酶的逆轉錄過程。在另一方面,DNA分子可編碼多肽,應該知道該情況用"編碼"同時包括轉錄和翻譯過程。附圖簡述圖l提供非天然氨基酸對-甲氧基苯丙氨酸(pMpa)、對-乙酰基苯丙氨酸(pApa)、對-苯甲酰苯丙氨酸(pBpa)、對-碘代苯丙氨酸(pIpa)、對-疊氮基苯丙氨酸(pAzpa)、對-炔丙基氧基苯丙氨酸(pPpa)、a-氨基辛酸、鄰-硝基芐基半胱氨酸(o-NBC)、1,5-丹磺酰丙氨酸和鄰-硝基節基絲氨酸(o-NBS)的化學結構和命名。使用其它命指代多數這些非天然氨基酸,圖中也有標明。圖2顯示使用正交fotRNA^和五cTyrRS對在英杰(Invitrogen)tmT-RExTMCHO細胞中表達全長GFP的Western印跡分析。用質粒pcDNA4-GFP37TAG、PcDNA4-£cTyrRS變體和pUC18-3&tRNA^共轉染細胞,并在存在或不存在非天然氨基酸的條件下培養。第一泳道是pcDNA4-GFP瞬時轉染的T-rexCHO細胞中野生型GFP的表達。第二泳道是野生型五cTyrRS和5rfRNA^抑制下的GFP37TAG的全長表達。后隨的泳道是在存在或不存在非天然氨基酸的條件下,五cTyrRS變體和ArtRNA^抑制下的GFP37TAG全長表達。pMpaRS代表pMpa-tRNA合成酶等。用抗-c-myc抗體分析每一反應40|_ig細胞裂解物(第一泳道上樣10pg細胞裂解物)。用于蛋白表達的非天然氨基酸濃度為10mMpMpa、10mMpApa、1mMpBpa、8mMplpa、5mMpAzpa以及1mMpPpa。圖3顯示使用如圖2所示正交fctRNA^^和汝TyrRS対在英杰tmT-REx293細胞中表達全長GFP的Western印跡分析。用抗-His-HRP抗體分析每一反應20(ig細胞裂解物(對照反應5pg)。試劑、非天然氨基酸濃度和泳道定義同圖2所示。圖4A提供pSWAN-pMpaRS的質粒圖。圖4B提供pSWAN-GFP37TAG的質粒圖。圖5提供野生型GFP和GFP-pMpa肽的氨基酸序列。Y'表示野生型GFP中的酪氨酸或GFP-pMpa中的pMpa。顯示了肽FSVSGEGEGDATY'GK(SEQIDNO:103)片段化過程中產生的y-和b-型離子。圖6提供圖5中野生型GFP肽FSVSGEGEGDATY'GK(SEQIDNO:103)的注釋的串聯質譜圖。為了比較和明確起見,僅對富集的Y^離子系列以及使pMpa明確定位于37位的bi3離子作注釋。用抗-myc親和柱純化蛋白并用SDS-PAGE分析。切下GFP條帶進行MS分析。圖7提供來自GFP-pMpa的肽FSVSGEGEGDATY*GK(SEQIDNO:103)的注釋串連質譜圖。Y:離子系列的串連質譜圖顯示了預期的14Da的質量漂移。圖8提供親和純化的GFP-pMpa的完整蛋白ESITOF-MS譜圖。解巻積電荷狀態包絡線(插圖所示)顯示一種29696Da的主組分,這與修飾蛋白減去N-末端甲硫氨酸再加上乙酰化的預期質量(理論質量29696.52)在實驗誤差內吻合。29654Da的小特征峰指定為GFP-pMpa減去N-末端甲硫氨酸。兩側條帶可能是由非特異性修飾產生的。圖9提供含pApa的突變GFP的串連質譜圖。與野生型GFP譜圖中相同離子相比,Y'-離子的質量漂移為26Da。圖10提供含pBpa的突變GFP的串連質譜圖。清楚觀察到突變GFP和野生型GFP之間86Da的特征性質量漂移。圖11提供含pAzpa的突變GFP的串連質譜圖。多數pAzpa衰變為pAmpa(對募基苯兩嚴激胰蛋白酶消化后含pAmpa的片段的串連質譜圖參見圖15)。然而,與野生型GFP信號相比,仍清晰觀察到Y^離子25Da的特征性質量漂移。圖12提供含pPpa的突變GFP的串連質譜圖。背景掩蓋了大部分pPpa片段信號。盡管如此,通過搜索MSDB數據庫中的圖譜仍然具有很好的分辨率。觀察到特征性質量漂移為38Da的較強的Y'-離子。圖13A和13B顯示在英杰tmT-RExCHO和英杰tmT-REx293細胞中琥珀抑制依賴于EcTyrRS和BstRNA^,基因。圖13A提供不同構建物瞬時轉染的英杰tmT-REXtmCHO細胞的綠色熒光圖像。在第一張圖中,用pcDNA4-GFP轉染細胞。在第二張圖中,用pcDNA4-五cTyrRS和pcDNA4-GFP37TAG轉染細胞。在第三張圖中,用pUC18-3&tRNAg力和pcDNA4-GFP37TAG轉染細胞。在第四張圖中,用pUC18-3&tRNA^、PcDNA4-£cTyrRS和pcDNA4-GFP37TAG轉染細胞。圖13B提供不同構建物瞬時轉染的英杰TMT-RExTM293細胞的綠色熒光圖像。不同圖中使用的構建物與圖13A中所示相同。圖14提供在英杰tmT-RExCHO和293細胞中六種五cTyrRS變體表達的Western印跡分析。用抗-c-myc抗體分析每一反應的40pg細胞裂解物。23五cTyrRS變體的表達不受活性位點突變的影響。T-RExCHO和T-REx293細胞系中變體表達相等。圖15提供來自含pAzpa的突變GFP的肽FSVSGEGEGDATY*GK(SEQIDNO:103)的注釋串連質譜圖。Y'代表pAmpa(對募基苯厲賓熟。為明確起見僅注釋了Y^離子系列。pAzpa多數衰變成pAmpa,因為pAzpa肽的信號強度很弱(參見圖11),并且在野生型GFP的片段和含pAzpa的突變型GFP的片段之間檢測到的質量差異為lDa。圖16提供了核苷酸和氨基酸序列。發明詳述本發明提供了快速篩選和分離突變型氨酰-tRNA合成酶(RS)的常用方法,這些突變型氨酰-tRNA合成酶能夠在哺乳動物宿主系統中使合適的正交抑制子tRNA帶上不同理化和生物學屬性的非天然氨基酸,此外,其中篩選方法也消除了對在哺乳動物細胞中進行緩慢的有技術挑戰性的篩選的需求。在這些方法中,突變的大腸桿菌氨酰-tRNA合成酶(RS)在酵母中演化,能夠選擇性使用感興趣的非天然氨基酸。然后使用同樣的突變RS以及來自嗜熱脂肪芽孢桿菌的琥珀抑制子tRNA在哺乳動物細胞中響應選擇者密碼子(如琥珀無義密碼子)將非天然氨基酸定點摻入感興趣的蛋白質中。通過工程改造編碼感興趣蛋白的多核苷酸使其包含轉導非天然氨基酸摻入信號的選擇者密碼子,可對非天然氨基酸摻入蛋白進行編程使其發生在任何需要的位置上。本發明也提供了新的翻譯系統,該系統包含了至今尚未考慮過的宿主細胞。例如,本發明的翻譯系統包括(i)非天然氨基酸、(ii)正交tRNA(O-tRNA)、(iii)衍生自真細菌的氨酰-tRNA合成酶,通常為X^好慮RS的正交氨酰-tRNA合成酶(O-RS),以及(iv)包含這些組件的哺乳動物宿主細胞,其中哺乳動物宿主細胞可為嚙齒類細胞(如小鼠細胞或大鼠細胞),或靈長類細胞,即屬于通常稱為猿(包括猿、人和舊大陸猴)、新大陸猴和原猴(pro-simian)(^/7狐猴)的類群的任何細胞。人細胞對本發明尤其有用。然而,上述列舉的細胞并非意在限制本發明的范圍,本發明也可使用其它宿主細胞。本發明也提供了用于制造在選定位置具有至少一個非天然氨基酸的蛋白質的方法,所述方法使用上述翻譯系統。該方法在蛋白質翻譯期間通過在選擇者密碼子的位點程序性摻入非天然氨基酸,導致非天然氨基酸摻入。本發明提供了使用突變RS(最初在釀酒酵母中演化)以及來自合適真細菌如嗜熱脂肪芽孢桿菌(及她aro^rmo;Mw力的琥珀抑制子在哺乳動物宿主細胞如嚙齒類細胞和靈長類細胞中將多種非天然摻入蛋白的常用方法。作為驗證,已經成功使用本方法響應琥珀無義密碼子將總共十種不同非天然氨基酸定點摻入到模型蛋白中,在中國倉鼠卵巢(CHO)細胞和人239T宿主細胞中具有優秀的保真性和良好的效率。例如,將非天然氨基酸獨立摻入CHO細胞表達的綠色熒光蛋白(GFP)中,效率高達每2x107個細胞1嗎蛋白質。質譜確認了非天然氨基酸的高翻譯保真度。該方法利于在蛋白質中引入生物學探針進行細胞研究,并可能最終利于在哺乳動物細胞中合成含非天然氨基酸的治療性蛋白。在一些方面,為了展示(而非限制)本發明,本文的公開文本提出可在哺乳動物細胞中將非天然氨基酸部分摻入到不同模型蛋白中。不應理解非天然氨基酸的摻入僅限于任一感興趣的特定蛋白。從本公開文本中能清楚了解,將不同非天然氨基酸摻入感興趣的特定蛋白中可用于各種不同的蛋白質和目的。應當注意的是,控制在酵母中演化的突變型大腸桿菌氨酰-tRNA合成酶(O-RS)和O-tRNA表達的基因并不能直接用于哺乳動物宿主細胞(如嚙齒類或人細胞)。必須用合適的調節元件重新工程改造這些基因,驅動其在哺乳動物細胞背景中表達。原本與O-tRNA和O-RS基因相關的酵母轉錄調節元件在哺乳動物細胞中無效(或者并非最佳)。本領域熟練技術人員應該意識到這一點。已對哺乳動物基因表達元件進行很好的鑒定,隨時可用于需要優化(如最大化)與其相關的基因序列的各種重組構建物。本發明使用的非天然氨基酸本發明提供能在哺乳動物宿主細胞系統如靈長類和嚙齒類宿主細胞系統中產生含非天然氨基酸的多肽的正交翻譯系統。這些翻譯系統中使用的非天然氨基酸不受特別限制。通常,本發明使用的非天然氨基酸通常為大腸桿菌衍生的突變型氨酰-tRNA合成酶用來在釀酒酵母宿主系統中加載到相應正交tRNA上的那些氨基酸。例如本文所用,本發明使用下列非天然氨基酸對-甲氧基苯丙氨酸(pMpa)對-乙酰基苯丙氨酸(pApa)對-苯甲酰苯丙氨酸(pBpa)對-碘代苯丙氨酸(plpa)對-疊氮基苯丙氨酸(pAzpa)對-炔丙基氧基苯丙氨酸(pPpa)圖1顯示了這六種非天然氨基酸的每一種的結構。還標出了這些氨基酸的其它命名和不同的縮寫,如圖1所示。如實施例所示,在人和嚙齒類宿主細胞中,使用最初由酵母宿主細胞系統篩選和分離的大腸桿菌衍生的O-RS物質將這六種非天然氨基酸獨立摻入綠色熒光蛋白(GFP)中。除了上述列舉的以外,本發明還使用了其它非天然氨基酸。下文列舉的非天然氨基酸曾成功用于酵母宿主細胞系統中,由大腸桿菌衍生的正交RS將其加載于O-tRNA上。這些非天然氨基酸包括a-氨基辛酸鄰-硝基芐基半胱氨酸(o-NBC)1,5-丹磺酰丙氨酸鄰-硝基芐基絲氨酸這些非天然氨基酸的結構及其不同的命名和簡寫如圖1所示。所有這些非天然氨基酸在酵母宿主細胞中的成功使用已有記錄,如Chin等(2003),"擴展的真核遺傳密碼"(Anexpandedeukaryoticgeneticcode)&/ewce301:964-967;Deiters等(2003),"在釀酒酵母的遺傳密碼中加入具有新反應性的氨基酸"(Addingaminoacidswithnovelreactivitytothegeneticcodeof)/JmC/zemSoc125:11782-11783;Summerer等(2006),"遺傳編碼的熒光氨基酸"(AGeneticallyEncodedFluorescentAminoAcid)/WAS103(26):9785-9789;Deiters箏游2004年4月16日提交的WO2005/003294"非天然反應性氨基酸遺傳密碼增加"(UNNATURALREACTIVEAMINOACIDGENETICCODEADDITIONS);Deiters牟9^27^楚:^"/效WO2006/034410"在遺傳密碼中加入光調節性氨基酸"(ADDINGPHOTOREGULATEDAMINOACIDSTOTHEGENETICCODE),以及2005年10月27日提交的WO2006/110182"用于體內摻入非天然氨基酸的正交翻26譯組件"(ORTHOGONALTRANSLATIONCOMPONENTSFORTHEVIVOINCORPORATIONOFUNNATURALAMINOACIDS)。本發明使用的宿主細胞本發明提供了新型翻譯系統,該系統使用迄今為止尚未考慮過的宿主細胞。例如,本發明翻譯系統包括(i)非天然氨基酸、(ii)正交tRNA(O-tRNA)、(iii)衍生自大腸桿菌氨酰-tRNA合成酶的正交氨酰-tRNA合成酶(O-RS),以及(iv)包含這些組件的哺乳動物宿主細胞,其中哺乳動物宿主細胞可為嚙齒類細胞(如小鼠細胞或大鼠細胞),或靈長類細胞,即屬于通常稱為猿(包括猿、人和舊大陸猴)、新大陸猴和原猴(》膽瓜猴)的類群的任何細胞。人細胞對本發明尤其有用。用于本發明的動物細胞系可衍生自該動物的任何組織。上述列舉的細胞并非意在限制本發明的范圍,本發明也可使用其它宿主細胞。本文所用術語"宿主細胞"也包括多個獨立細胞,通常指"細胞系",在該情況下是"宿主細胞系"。用于產生含有至少一個非天然氨基酸的多肽的宿主細胞可為任一類型的宿主細胞,但是一些宿主細胞尤其有用。例如,可使用一些宿主細胞類型產生用于生產重組治療性多肽的多肽。當宿主細胞為嚙齒類細胞時,嚙齒類細胞的類型不受特別限制。如實施例所述,中國倉鼠卵巢(CHO)細胞可作為宿主細胞。CHO細胞被廣泛采用并且是公眾接受的重組蛋白表達系統。然而,并不意味本發明僅限于這種嚙齒動物細胞類型。事實上,本領域熟練技術人員了解可用作生產重組蛋白的宿主細胞的大量嚙齒動物細胞系。嚙齒動物細胞系包括任一衍生自哺乳動物嚙齒目的細胞系,嚙齒目包括但不限于真鼠(truemice)、大鼠、倉鼠、花栗鼠、海貍和松鼠。嚙齒類細胞系包括衍生自普通家鼠一小鼠(A/wm^cw/^)及其所有品系的細胞系。同樣,嚙齒類細胞系包括衍生自大鼠,如家鼠屬的任一種,如褐家鼠(iam^"orveg/cwW(挪威大鼠)和屋頂鼠(i加^ra"w力(黑鼠)及其任何和所有品系的細胞系。本發明的宿主細胞可為靈長類細胞。靈長類細胞類型不受特別限制。如實施例中所述,人胚腎細胞(也稱作HEK細胞、HEK293或293)可用作宿主細胞。293細胞被廣泛采用并且是公眾接受的重組蛋白表達系統。然而,并不意味本發明僅限于該種人的細胞類型。事實上,本領域熟練技術人員了解可用作生產重組蛋白的宿主細胞的大量人或其它靈長動物細胞系。靈長類細胞系包括任一起源于哺乳動物靈長目的細胞系,靈長目包括但不限于(i)猿,包括舊大陸猿猴,包括人),(ii)新大陸猴以及(iii)原猴(勿狐猴)。靈長類細胞系可衍生自任一靈長類物種。例如但不限于,靈長類細胞系可衍生自黑猩猩、狒狒、狨、短尾猿和非洲綠銜如COS-l細胞系)。下表提供了靈長類物種的非窮舉列表,衍生自這些物種的細胞系可用于本發明。<table>tableseeoriginaldocumentpage28</column></row><table><table>tableseeoriginaldocumentpage29</column></row><table>可在促進靈長類分子生物學研究組織(ResearchInfrastructuretoPromotePrimateMolecularBiology)(INPRIMAT;西班牙巴塞羅那)以及生物醫學靈長類研究中心(BiomedicalPrimateResearchCentre)(BPRC;荷蘭瑞斯維基克(Rijswijk))的網站上找到衍生自這些靈長類物種的細胞系。使用人細胞系生產重組多肽已經廣為接受并在本發明的范圍內。人宿主細胞系可為任一來源,衍生自任一組織。適合生產重組蛋白的人細胞系廣為人知,并可獲自本領域技術人員熟知的大量商業來源。此外,衍生自其它多種哺乳動物物種的宿主細胞系也在本發明的范圍之內。包括牛、豬、綿羊、犬、馬和山羊細胞系。源于這些物種的細胞系為本領域所知,并且本領域一般技術人員易于使用。本領域已建立嚙齒類細胞系、靈長類細胞系和多種其它哺乳動物群來源的細胞系,以及培養這些動物細胞系的材料和方法,它們可從多種來源獲得。例如,參見美國典型培養物保藏中心(AmericanTypeCultureCollection(ATCC;弗吉尼亞州瑪納薩斯(Manassas,VA)))以獲取更多可利用細胞系的列表。可從數種來源獲取細胞培養基,例如吉布科(GIBCOf品牌(英杰TM)細胞培養基以及Cellgr(^的MT公司(Mediatech,Inc.)培養基。此外,本發明也可使用全新建立的細胞系(原代細胞系或建立細胞系)作為宿主細胞,用于產生含有至少一個非天然氨基酸的重組蛋白。本發明使用的O-RS物質本發明提供了新的正交翻譯系統,該系統能夠在以前未關注的哺乳動物宿主細胞,例如靈長類和嚙齒類宿主細胞系統中產生含非天然氨基酸的多肽。本發明的翻譯系統包括(i)非天然氨基酸、(ii)正交tRNA(O-tRNA)、(iii)衍生自大腸桿菌氨酰-tRNA合成酶的正交氨酰-tRNA合成酶(O-RS),以及(iv)包含這些組件的哺乳動物宿主細胞,其中哺乳動物宿主細胞可以是,例如嚙齒類細胞(如小鼠細胞或大鼠細胞),或靈長類細胞(如人或小鼠細胞)。本發明還提供了產生在選定位置具有至少一個非天然氨基酸的蛋白質的方法,所述方法使用上述翻譯系統。該方法在蛋白質翻譯期間通過在選擇者密碼子的位點程序性摻入非天然氨基酸,導致在哺乳動物宿主細胞中摻入非天然氨基酸。本發明所用O-RS物質不受特別限制,但通常具有下列屬性。本發明所用O-RS通常衍生自大腸桿菌氨酰-tRNA合成酶,如野生型大腸桿菌亮氨酰-tRNA合成酶CEcLeuRS;SEQIDNO:4提供了氨基酸序列,SEQIDNO:5提供了多核苷酸序列)或者野生型大腸桿菌酪氨酰-tRNA合成酶(五cTyrRS;SEQIDNO:6提供了氨基酸序列,SEQIDNO:7提供了多核苷酸序列)。本發明使用的突變的O-RS物質(例如,衍生自SEQIDNO:4或6的合成酶)最初在釀酒酵母宿主細胞系統中演化和選擇。本領域已知大量本發明使用的此類O-RS物質。在釀酒酵母中,功能性tRNACUA/RS對已成功衍生自對應的大腸桿菌tRNATy7TyrRS和tRNALe7亮氨酰-tRNA合成酶對。參見例如Chin等(2003),"擴展的真核遺傳密碼"(Anexpandedeukaryoticgeneticcode)5Wence301:964-967;Chin等,"擴展真核遺傳密石馬進展"(ProgressTowardanExpandedEukaryoticGeneticCode)C7zem10,511-519(2003);Deiters等(2003),"在釀酒酵母的遺傳密碼中加入具有新反應性白勺氣基酸"(AddingaminoacidswithnovelreactivitytothegeneticcodeofSacc/zaramycescereWs/ae)/」mC/zemSoc125:11782-11783;Summerer等(2006),"遺傳編碼的熒光氨基酸"(AGeneticallyEncodedFluorescentAminoAcid)/WJS103(26):9785-9789;Wu等(2004),"遺傳編碼的光籠蔽氨基酸"(Ageneticallyencodedphotocagedaminoacid)J"JmCTem/Sbc126,14306-14307。授權Deiters箏游2004年4月16日提交的WO2005/003294"非天然反應性氨基酸遺傳密碼增加"(UNNATURALREACTIVEAMINOACIDGENETICCODEADDITIONS);Deiters#"游2005牟9^"斤連^"游WO2006/034410"在遺傳密碼中加入光調節性氨基酸"(ADDINGPHOTOREGULATEDAMINOACIDSTOTHEGENETICCODE),以及2005年10月27日提交的WO2006/110182"用于體內摻入非天然氨基酸的正交翻譯組件"(ORTHOGONALTRANSLATIONCOMPONENTSFORTHEVIVOINCORPORATIONOFUNNATURALAMINOACIDS)。每一參考文獻均通過引用全文納入本文。本領域這些教導為構建本發明使用的其它O-RS物質提供了充分的指導。圖16提供本發明所使用的O-RS物質的例子。SEQIDNO:8-56提供編碼O-RS的多核苷酸序列。SEQIDNO:57-101提供對應的O-RS多肽序列。應當注意的是,本發明對RS進行操作時未必需要全長O-RS。僅表達RS活性位點片段足以滿足本發明的使用,如圖16所示的一些序列。圖16中每一O-RS序列均為本領域所知,如本文引用參考文獻所述。應了解,本發明并不局限于使用圖16提供的0-RS。本文鑒定的任何用于本發明的O-RS物質均可作為模板衍生其它本發明可用的O-RS物質,例如,通過在現有O-RS物質內進行保守氨基酸取代。只要新衍生的O-RS保持優選用非天然氨基酸氨酰化對應的O-tRNA的生物學活性,則允許的取代數目不受限制。O-RS的生物學活性可表示為己證明可為本發明使用的另一"參考"O-RS的生物學活性的百分數。例如,本發明所用O-RS可包括優選用非天然氨基酸氨酰化O-tRNA,其效率為含有O-tRNA、非天然氨基酸和己知序列的氨酰-tRNA合成酶(RS)的"參考"翻譯系統效率的至少50%的O-RS。任意選擇活性閾值,"50%"僅作為示例。事實上,本發明所用O-RS可包括優選用非天然氨基酸氨酰化O-tRNA,其效率至少為"參考"翻譯系統效率的20%、30%、40%、50%、60%、70%、80%、90%、95%、98%或99%的O-RS。本發明使用的O-TRNA物質本發明使用的突變O-RS物質最初在酵母宿主細胞系統中演化和選擇。在酵母宿主細胞系統中演化的O-RS物質與O-tRNA聯合行使功能,所述O-tRNA被O-RS用非天然氨基酸優先氨酰化。例如,在酵母宿主系統中有功能的抑制子O-tRNA物質可為,例如SEQIDNO:1或2的tRNA。相反,本發明翻譯系統使用在哺乳動物宿主細胞(如嚙齒類或靈長類細胞)中正交的不同O-tRNA。例如,本發明使用的O-tRNA可為嗜熱脂肪芽孢桿菌的琥珀抑制子酪氨酰-tRNAcuA(5&tRNATyrCUA),如SEQIDNO:3所示。這并不意味本發明僅限于使用這一種tRNA物質,也考慮使用該tRNA序列的變體、衍生自嗜熱脂肪芽孢桿菌的其它tRNA以及衍生自其它有機體(如其它真細菌種類)的tRNA物質。正交tRNA/氨酰-tRNA合成酶技術理解與正交tRNA和正交氨酰-tRNA合成酶配對有關的活性有助于理解本發明的新型組合物和方法。為在遺傳密碼中加入額外的非天然氨基酸,需要含有氨酰-tRNA合成酶和適當tRNA的新正交配對,它們可在宿主翻譯機制中有效起作用,但對于所述翻譯系統是"正交"的,這意味著它可不依賴于翻譯系統的內源性合成酶和tRNA而起作用。正交配對的所需特征包括能解碼或識別不由任何內源性tRNA解碼的僅一種特定密碼子(例如選擇者密碼子)的tRNA,和只能優先用一種特定非天然氨基酸氨酰化(或"加載")其關聯tRNA的氨酰-tRNA合成酶。內源性合成酶通常不氨酰化O-tRNA(或氨酰化,即加載不佳)。例如,在大腸桿菌宿主系統中,正交配對包括不與任何內源性tRNA(例如,大腸桿菌中有40種)交叉反應的氨酰-tRNA合成酶和不被任何內源性合成酶(例如,大腸桿菌中有21種)氨酰化的正交tRNA。本領域已知適于制備含有一個或多個非天然氨基酸的蛋白質的正交翻譯系統的通用原則,例如制備正交翻譯系統的通用方法。例如,可參見國際公開號WO2002/086075,名為"METHODSANDCOMPOSITIONSFORTHEPRODUCTIONOFORTHOGONAL簡A-AMINOACYL-tRNASYNTHETASEPAIRS"(產生正交tRNA-氨酰-tRNA合成酶配對的方法和組合物);WO2002/085923,名為"INVIVOINCORPORATIONOFUNNATURALAMINOACIDS"(非天然氨基酸的體內摻入);WO2004/094593,名為"EXPANDINGTHEEUKARYOTICGENETICCODE"(擴展真核遺傳密碼);2004年7月7日提交的WO2005/019415;2004年7月7日提交的WO2005/007870;2004年7月7日提交的WO2005/007624;2005年10月27日提交的國際申請號PCT/US2005/039210,名為"ORTHOGONALTRANSLATIONCOMPONENTSFORTHEINVIVOINCORPORATIONOFUNNATURALAMINOACIDS"(用于體內摻入非天然氨基酸的正交翻譯組分)和2007年3月7日提交的美國臨時申請序列號60/783,497,名為"SYSTEMSFORTHEEXPRESSIONOFORTHOGONALTRANSLATIONCOMPONENTSINEUBACTERIALHOSTCELLS(在真細菌宿主細胞中表達正交翻譯組分的系統)"。這些申請各自通過引用全文納入本文。摻入非天然氨基酸的正交翻譯系統和它們的產生及使用方法的討論還可參見Wang和Schultz,"ExpandingtheGeneticCode(擴展遺傳密碼)",^"gewam^eC/zem/e/"f.五d,44(l):34-66(2005);Xie禾口Schultz,"AnExpandingGeneticCode(擴展的遺傳密碼)",臉A油36(3):227-238(2005);Xie和Schultz,"AddingAminoAcidstotheGeneticRepertoire(將氨基酸加入遺傳庫)",Cwr.(9;/m'ow&Ozew/ca/9(6):548-554(2005);禾BWang等,"ExpandingtheGeneticCode(擴展遺傳密碼)",iev.歷o//y^.S/omo/.Sfrw".,35:225-249(2006);這些文獻的內容通過引用全文納入本文。正交翻譯系統正交翻譯系統一般包括含有正交tRNA(O-tRNA)、正交氨酰tRNA合成酶(O-RS)和非天然氨基酸的細胞(可以是哺乳動物細胞,例如嚙齒動物細胞或靈長動物細胞),其中所述O-RS用所述非天然氨基酸氨酰化所述O-tRNA。本發明的正交配對可以包括O-tRNA,例如抑制itRNA、移碼tRNA等和關聯O-RS。本發明的正交系統通常包含處于宿主細胞環境中或無宿主細胞的0-tRNA/0-RS配對。除多組分系統外,本發明還提供單組分,例如,正交氨酰-tRNA合成酶多肽(例如,SEQIDNO:57-101)和編碼那些多肽的多核苷酸(例如,SEQIDNO:8-56)。當正交配對識別選擇者密碼子并對該選擇者密碼子起反應而加載氨基酸時,通常稱該正交配對"抑制"該選擇者密碼子。即,不被翻譯系統的(例如,細胞的)內源性機制識別的選擇者密碼子通常不被加載,從而阻斷了多肽產生,否則可自核酸翻譯該多肽。在正交配對系統中,O-RS用特定的非天然氨基酸氨酰化O-tRNA。加載的O-tRNA識別選擇者密碼子并抑制選擇者密碼子所致的翻譯阻斷。在一些方面,與包含本文序列表所示多核苷酸序列或由其編碼的O-tRNA的抑制效率相比,本發明的O-tRNA識別選擇者密碼子并在關聯合成酶存在下對選擇者密碼子起反應而具有至少約,例如,45%、50%、60%、75%、80%或90%或更高的抑制效率。在一些實施方式中,聯用O-RS和O-tRNA的抑制效率是缺乏O-RS的O-tRNA的抑制效率的約,例如5倍、10倍、15倍、20倍或25倍或更高。在一些方面,聯用O-RS和O-tRNA的抑制效率是本文序列表所示正交合成酶配對的抑制效率的至少約,例如35%、40%、45%、50%、60%、75%、80%或90%或更高。宿主細胞利用0-tRNA/0-RS配對將非天然氨基酸摻入延伸中的多肽鏈,例如經由包含編碼感興趣多肽的多核苷酸的核酸,其中所述多核苷酸包含所述O-tRNA識別的選擇者密碼子。在某些優選方面,細胞可包含一種或多種其它O-tRNA/0-RS配對,其中所述其它O-RS用不同的非天然氨基酸加載所述其它O-tRNA。例如,O-tRNA之一可識別四堿基密碼子,其它O-tRNA可識別終止密碼子。或者,多個不同的終止密碼子或多個不同的四堿基密碼子可用于同一編碼核酸。應注意,在一些實施方式中,細胞或其它翻譯系統中可存在多個0-tRNA/0-RS配對,從而能將多個非天然氨基酸摻入多肽。例如,細胞還可包含額外的不同O-tRNA/0-RS配對和第二非天然氨基酸,其中該額外的O-tRNA識別第二選擇者密碼子,該額外的O-RS優先用該第二非天然氨基酸氨酰化該額外的O-tRNA。例如,包含O-tRNA/0-RS配對的細胞(其中所述O-tRNA識別,例如琥珀選擇者密碼子)還可包含第二正交配對,其中該第二O-tRNA識別不同的選擇者密碼子,例如乳白密碼子、四堿基密碼子等。不同的正交配對優選衍生自不同來源,從而有助于識別不同的選擇者密碼子。在某些實施方式中,系統包含例如哺乳動物細胞等細胞,例如但不限于嚙齒動物和靈長動物細胞,這些細胞含有正交tRNA(O-tRNA)、正交氨酰tRNA合成酶(O-RS)、非天然氨基酸和包含編碼感興趣多肽的多核苷酸的核酸,其中所述多核苷酸包含所述O-tRNA識別的選擇者密碼子。翻譯系統還可以是無細胞系統,例如與本文所述O-tRNA/0-RS配對和非天然氨基酸組合的各種市售可得"體外"轉錄/翻譯系統。O-tRNA和/或0-RS可以是天然產生的,或者可以是,例如天然tRNA和/或RS經突變衍生,例如,通過產生各種生物的tRNA文庫和/或RS文庫和/或采用各種可用的突變方案。例如,產生正交tRNA/氨酰-tRNA合成酶配對的一種方案包括將,例如得自除宿主細胞外的來源或多個來源的異源(對宿主細胞而言)tRNA/合成酶配對輸入宿主細胞。候選異源合成酶的特性包括,例如不加載任何宿主細胞tRNA,候選異源tRNA的特性包括,例如不被任何宿主細胞合成酶所氨酰化。此外,異源tRNA對于所有宿主細胞合成酶是正交的。產生正交配對的第二種方案包括產生用于篩選和/或選擇O-tRNA或O-RS的突變體文庫。也可聯用這些方案。IH交t脂A(O-tRNA)本發明的正交tRNA(O-tRNA)優選在例如體內或體外介導將非天然氨基酸摻入蛋白質內,所述蛋白質由含選擇者密碼子的多核苷酸編碼,而這種選擇者密碼子可被該O-tRNA識別。在某些實施方式中,與包含本文序列表中04RNA序列所示多核苷酸序列或由其編碼的O-tRNA相比,本發明的O-tRNA在關聯合成酶存在下,對選擇者密碼子起反應而具有至少45%、50%、60%、75%、80%、90%或更高的抑制效率。可通過本領域已知的多種試驗測定抑制效率。例如,可采用卩半乳糖苷酶報道分子試驗,例如,將衍生的lacZ質粒(該構建物在lacZ核酸序列中含有選擇者密碼子)和含有本發明O-tRNA的質粒一起導入合適生物(如可利用正交組分的生物)的細胞內。還可導入關聯合成酶(多肽或表達時可編碼關聯合成酶的多核苷酸)。將細胞在培養基內培養到所需密度,如OD600約0.5時,采用例如諾瓦金公司(Novagen)的BetaFluorP-半乳糖苷酶檢測試劑盒進行(3半乳糖苷酶試驗。抑制百分率可以計算為樣品相對于可比較對照(如衍生的lacZ構建物的觀察值,所述構建物在所需位置上含有相應的有義密碼子而不是選擇者密碼子)的活性百分數。本發明所用的O-tRNA的例子見本文序列表,例如參見圖16和SEQIDNO:3。本文內容還提供了設計其它等價O-tRNA的指導。在RNA分子(例如O-RSmRNA或O-tRNA分子)中,與給定序列(或對編碼DNA而言反之亦然)或其互補序列相比,胸腺嘧啶(T)被尿嘧啶(U)取代。還可存在堿基的其它修飾以大量產生功能等同分子。本發明還包括對應于本文具體O-tRNA的O-tRNA保守性變體。例如,O-tRNA保守性變體包括功能與具體O-tRNA(例如本文序列表中的)相似的,和因合適的自身互補性而保留了tRNA的L-形結構但不具有與例如序列表或圖16所示那些(序列)相同的序列并且最好也不是野生型tRNA分子的那些分子。含O-tRNA的組合物還可包含正交氨酰-tRNA合成酶(O-RS),其中所述O-RS優先用非天然氨基酸氨酰化O-tRNA。在某些實施方式中,含有O-tRNA的組合物還可包含(例如體外或體內)翻譯系統。細胞中也可存在含有編碼感興趣多肽的多核苷酸的核酸或這些物質中一個或多個的組合,其中所述多核苷酸含有O-tRNA能識別的選擇者密碼子。產生正交tRNA(O-tRNA)的方法也是本發明的特征之一。通過該方法產生的正交tRNA(0-tRNA)也是本發明的特征之一。在本發明的某些實施方式中,可通過構建突變體文庫來產生O-tRNA。可采用本領域已知的各種誘變技術構建突變體tRNA文庫。例如,可通過位點特異性突變、隨機位點突變、同源重組、DNA改組或其它遞歸誘變(recursivemutagenesis)方法、嵌合體構建、或者這些技術的任何組合產生突變體tRNA,例如SEQIDNO:3所示O-tRNA。也可將其它突變引入特定位置,例如tRNA的所需環或區域(如反密碼子環、接納莖、D臂或環、可變環、TPC臂或環、tRNA分子的其它區域或其組合)中一個或多個非保守位置、保守位置、一個或多個隨機位置或者二者的組合位置。tRNA中的突變通常包括使突變型tRNA文庫內各成員的反密碼子環突變以使其能識別選擇者密碼子。該方法還可包括給O-tRNA加上額外序列。與起始材料(例如多種tRNA序列)相比,O-tRNA通常提高了對所需生物的正交性,同時保留其對所需RS的親和力。這些方法任選包括分析tRNA和/或氨酰-tRNA合成酶序列的相似性(和/或所推斷的同源性)以確定顯示與特定生物正交的潛在候選O-tRNA、O-RS和/或其配對。可利用本領域已知和本文所述的計算機程序進行這種分析,例如可用BLAST和堆積(pileup)程序。在一個實施例中,為篩選用于哺乳動物細胞如嚙齒動物細胞和靈長動物細胞的可能的正交翻譯組分,可選擇與宿主生物不顯示接近的序列相似性的合成酶和/或tRNA。通常可通過,例如負選擇第一物種的細胞群以獲得O-tRNA,其中所述細胞含有多種潛在O-tRNA的某成員。負選擇可去除含有被細胞內源性氨酰-tRNA合成酶(RS)氨酰化的潛在0-tRNA文庫某成員的細胞。這樣就可以得到第一物種細胞的正交tRNA庫。某些實施方式在負選擇中將選擇者密碼子引入編碼負選擇標記(例如能賦予抗生素抗性的酶如(3內酰胺酶;能得到可檢測產物的酶如p半乳糖苷酶、氯霉素乙酰轉移酶(CAT),所述產物例如是毒性產物,如芽孢桿菌RNA酶)的多核苷酸的非必須位置(例如,仍能產生功能性芽孢桿菌RNA酶)等。還任選在選擇性試劑(比如抗生素,如氨芐青霉素)存在下培養細胞群來進行篩選/選擇。在一個實施方式中,選擇性試劑的濃度不同。例如,為檢測抑制子tRNA的活性,可利用基于選擇者密碼子的體內抑制的選擇系統,例如將無義(如終止)或移碼突變引入編碼負選擇標記的多核苷酸(如編碼(3-內酰胺酶的基因(6/fl))中。例如,構建在某位置(如,A184)含有選擇者密碼子的多核苷酸變體,如Wa變體。用這些多核苷酸轉化細胞,如細菌。以不能被內源性大腸桿菌合成酶有效加載的正交tRNA為例,抗生素抗性(例如氨芐青霉素抗性)應約為或小于未用質粒轉化的細菌的抗生素抗性。如果tRNA不是正交的,或者能加載該tRNA的異源合成酶在此系統內共同表達,應可觀察到更高水平的抗生素(如氨芐青霉素)抗性。選出那些在抗生素濃度與未用質粒轉化的細胞大致相等的LB瓊脂平板上不能生長的細胞,如細菌。以毒性產物(如核糖核酸酶或芽孢桿菌RNA酶)為例,當多種潛在的tRNA中的成員被內源性宿主(如大腸桿菌)合成酶(即與宿主如大腸桿菌合成酶不是正交的)氨酰化時,選擇者密碼子被抑制,所產生的毒性多核苷酸產物導致細胞死亡。而含有正交tRNA或非功能性tRNA的細胞可存活。然后,在一個實施方式中,對與所需生物正交的tRNA庫進行正選擇,其中將選擇者密碼子置于正選擇標記中(例如抗藥性基因(如(3內酰胺酶基因)編碼的標記)。對以下細胞進行正選擇含有編碼與該細胞正交的tRNA庫某成員的多核苷酸或包含該成員的多核苷酸、含有編碼正選擇標記的多核苷酸和含有編碼關聯RS的多核苷酸。在某些實施方式中,第二群細胞含有不能通過負選擇除去的細胞。該多核苷酸在胞內表達,細胞在有選擇試劑(如氨芐青霉素)存在下生長。然后選擇能被共同表達的關聯合成酶氨酰化以及對此選擇者密碼子起反應而插入氨基酸的tRNA。與一種或多種含有非功能性tRNA或不能被感興趣合成酶有效識別的tRNA的細胞相比,這些細胞通常顯示抑制效率升高。含有非功能性tRNA或不能被感興趣合成酶有效識別的tRNA的細胞對該抗生素敏感。因此在兩次選擇中能保留下的tRNA是(i)不是內源性宿主(如大腸桿菌)合成酶的底物;(ii)能被感興趣的合成酶氨酰化;以及(iii)能在翻譯過程中起作用。因此,根據篩選所處的環境,同一標記可以是正或負標記。g卩,如果為了篩選該標記,則它是正標記,但如果為了抵御該標記則它是負標記。上述方法中,篩選,如正選擇、負選擇或者正負選擇的嚴格性任選包括改變選擇的嚴格性。例如,由于芽孢桿菌RNA酶是毒性極高的蛋白質,可通過將不同數目的選擇者密碼子引入到芽孢桿菌RNA酶基因內和/或使用可誘導啟動子來控制負選擇的嚴格性。在另一實施例中,選擇或篩選試劑的濃度(如氨芐青霉素的濃度)可以不同。在本發明的一些方面,因為在前幾輪中所需活性較低,嚴格性可以不同。因此,前幾輪適用較低的嚴格性篩選標準,而后幾輪選擇適用更嚴謹的標準。在某些實施方式中,負選擇、正選擇或者正負選擇可重復多次。也可使用多個不同的負選擇標記、正選擇標記或正負選擇標記。在某些實施方式中,正選擇標記和負選擇標記可以相同。其他類型的選擇/篩選方法也可用于本發明以制備正交翻譯組分,如O-tRNA、O-RS和能對選擇者密碼子起反應而加載非天然氨基酸的0-tRNA/0-RS配對。例如,負選擇標記、正選擇標記或正負選擇標記可包括發熒光的或在合適反應物存在下能催化發光反應的標記。在另一實施方式中,可通過熒光激活細胞分選(FACS)或發光檢測標記的產物。標記任選可包括親和篩選標記。也參見Francisco,J.A.等(1993》"/Voc/mc"owaw<i,omscewce-ac"v她(ie;c&ma/犯r/ace(在外表面表達功能性抗體片段的大腸桿菌的制備與熒光激活細胞分選)",ProcNatlAcadSciUSA.,90:10444-8。制備重組正交tRNA的其它方法可見,例如名為"METHODSANDCOMPOSITIONSFORTHEPRODUCTIONOFORTHOGONALtRNAAMINOACYL-tRNASYNTHETASEPAIRS(制備正交tRNA-氨酰-tRNA合成酶配對的方法和組合物)"的國際申請公開號WO2002/086075;名為"EXPANDINGTHEEUKARYOTICGENETICCODE(擴展真核生物遺傳密碼)"的WO2004/094593;與2004年7月7日提交的WO2005/019415。也參見Forster等,(2003),"iVograww/"g/e/"t/ow/me"c■sywf/ze^wesfnms7a""g爐"/cco<^(ie^g"ec/<ie"ovo(通過箭l譯從頭設計的遺傳密碼來編程肽模擬合成酶)",PNAS,100(11):6353-6357;和Feng等,(2003),c/zcmge(通過單氨基酸改變擴大tRNA合成酶的tRNA識別)",PNAS,100(10):5676-5681。正交氨酰-tRNA合成酶(O-RS)本發明的O-RS在體外或體內優先用非天然氨基酸氨酰化O-tRNA。可通過含O-RS的多肽和/或編碼O-RS或其部分的多核苷酸將本發明的O-RS提供給翻譯系統,如細胞。例如,示例性O-RS包含選自SEQIDNO:57-101的氨基酸序列或其保守變體。在另一實施例中,O-RS或其部分是由編碼本文序列表和實施例所示的氨基酸序列的多核苷酸序列或其互補多核苷酸序列編碼。可參見,例如選自SEQIDNO:8-56的多核苷酸。鑒定可與O-tRNA—起應用的正交氨酰-tRNA合成酶(O-RS),例如O-RS的方法也是本發明的特征之一。例如,一種方法包括選擇(如正選擇)第一物種的細胞群,其中所述細胞各自含有1)多種氨酰-tRNA合成酶(RS)的成員之一(例如,所述多種RS可包括突變型RS、衍生自第一物種之外的物種的RS,或突變型RS和衍生自第一物種之外的物種的RS二者);2)正交tRNA(O-tRNA)(例如,一個或多個物種的);以及3)編碼選擇(例如正選擇)標記并含有至少一個選擇者密碼子的多核苷酸。與缺乏所述多種RS的成員或成員數目少的細胞相比,選擇或篩選顯示抑制效率提高的那些細胞。可用本領域已知和本文所述的方法測定抑制效率。抑制效率提高的細胞包含能氨酰化O-tRNA的活性RS。將第一物種的第一組tRNA的活性RS氨酰化的水平(體外或體內)與第二物種的第二組tRNA被活的RS氨酰化的水平作比較。通過可檢測物質(例如,標記的非天然氨基酸)測定氨酰化水平。通常選擇與第一組tRNA相比更有效地氨酰化第二組tRNA的活性RS,從而獲得能與O-tRNA聯用的有效(如優化)正交氨酰-tRNA合成酶。采用這種方法鑒定的O-RS也是本發明的特征之一。可用許多試驗來測定氨酰化。這些試驗可在體外或體內進行。例如,體外氨酰化試驗可見例如Hoben和Soll,(1985),MethodsEnzymol.,113:55-59。也可聯用報道分子和正交翻譯組分并檢測細胞中的報道分子來測定氨酰化,所述細胞表達含有至少一個選擇者密碼子并編碼某蛋白質的多核苷酸。也參見名為"INVIVOINCORPORATIONOFUNNATURALAMINOACIDS(非天然氨基酸的體內摻入)"的WO2002/085923和名為"EXPANDINGTHEEUKARYOTICGENETICCODE(擴展真核生物遺傳密碼)"的WO2004/094593。還可進一步改造鑒定的O-RS以改變該合成酶的底物特異性,從而使得O-tRNA只加載上所需的非天然氨基酸,而不是任何常見的20種氨基酸。產生對非天然氨基酸具有底物特異性的正交氨酰tRNA-合成酶的方法包括,例如通過組合合成酶的不同結構域而使合成酶在其活性位點、在其編輯機制位點、在不同位點發生突變等,并應用選擇方法。也可以采用先正選擇再負選擇的方案。在正選擇中,抑制引入陽性標記的一個或多個非重要位置的選擇者密碼子使得細胞在正選擇壓力下存活。在同時有天然和非天然氨基酸存在時,如此存活的細胞編碼使正交抑制itRNA帶有天然或非天然氨基酸的活性合成酶。在負選擇中,抑制引入陰性標記的一個或多個非重要位置的選擇者密碼子使合成酶失去天然氨基酸特異性。經正、負選擇而存活的細胞編碼只用非天然氨基酸氨酰化(加載)正交抑制子tRNA的合成酶。然后通過例如DNA改組或其它遞歸誘變方法進一步誘變這些合成酶。可采用本領域已知的各種誘變技術產生突變型O-RS文庫。例如,可用位點特異性突變、隨機點突變、同源重組、DNA改組或其它遞歸誘變方法,嵌合構建或它們的組合來制備突變型RS。例如,可從兩種或更多種其它如較小、多樣性較低的"亞文庫"來制備突變型RS文庫。本發明也包括RS的嵌合文庫。應注意,可以構建各種生物(例如微生物,如真細菌或古細菌)的tRNA合成酶文庫,例如具有天然多樣性的文庫(參見,例如授予Short等的美國專利號6,238,884;授予Schallenberger等的美國專利號5,756,316;授予Petersen等的美國專利號5,783,431;授予Thompson等的美國專利號5,824,485;授予Short等的美國專利號5,958,672),并任選構建和篩選正交配對。一旦合成酶經歷正和負選擇/篩選方法,就可進一步誘變這些合成酶。例如可分離編碼O-RS的核酸;從該核酸產生編碼突變O-RS的一組多核苷酸(例如通過隨機誘變、位點特異性誘變、重組或它們的任何組合);可重復各步驟或各步驟的組合直至獲得優先用非天然氨基酸氨酰化O-tRNA的突變O-RS。在本發明的一些方面,這些步驟可進行多次,例如至少兩次。本發明方法也可采用其它水平的選擇/篩選嚴格性來產生O-tRNA、O-RS或其配對。可改變O-RS產生方法中一個或兩個步驟的選擇或篩選嚴格性。這包括,例如,改變選擇/篩選試劑的用量等。也可額外進行幾輪正和/或負選擇。選擇或篩選也可包括以下一種或多種改變氨基酸滲透性、翻譯效率、翻譯保真度(tmnslationalfidelity)等。一種或多種改變通常依據用正交tRNA-tRNA合成酶配對來產生蛋白質的生物中一種或多種基因突變。產生O-RS并改變合成酶底物特異性的其它常規細節見名為"METHODSANDCOMPOSITIONSFORTHEPRODUCTIONOFORTHOGONALtRNAAMINOACYL-tRNASYNTHETASEPAIRS(產生正交tRNA-氨酰基tRNA合成酶配對的方法和組合物)"的WO2002/086075和名為"EXPANDINGTHEEUKARYOTICGENETICCODE(擴展真核生物遺傳密碼)"的WO2004/094593。也可參見Wang和Schultz,"ExpandingtheGeneticCode(擴展遺傳密碼)",Jwgewaw^eC/zem/e/W.£d,44(1):34-66(2005),其內容以引用方式全文納入。來源和宿主生物本發明正交翻譯組分(O-tRNA和O-RS)可得自任何生物(或生物的組合),可用于任何其它物種的宿主翻譯系統,只要所述O-tRNA/O-RS組分與宿主系統能以正交方式起作用。某正交配對中的O-tRNA和O-RS無需得自同一生物。在一些方面,正交組分得自用于哺乳動物宿主系統(如嚙齒動物或靈長動物宿主系統)的大腸桿菌(即,真細菌)基因。例如,正交O-tRNA可衍生自古菌生物,例如古細菌,如詹氏甲垸球菌、嗜熱堿甲垸桿菌;鹽細菌,如沃氏富鹽菌和鹽細菌種A^C-/;閃爍古生球菌、激烈火球菌、極端嗜熱古菌、嗜熱泉生古細菌、海沼甲烷球菌、甲烷嗜高熱菌(M^z^o/7F^fe^^/en;;、梅氏甲垸八疊球菌(Mm)、耐超高溫熱棒菌(7>"o6acM/wmGwo/7/n7ww」、深海火球菌、硫磺礦硫化葉菌(&)、超嗜熱古菌G^/yb/o/^to/^^/;、嗜酸熱原體、火山熱原體等;或真細菌,如大腸桿菌、嗜熱棲熱菌、枯草芽胞桿菌(^flc///^^&//&)、嗜熱脂肪芽孢桿菌等;而正交O-RS可得自以下生物(或生物的組合),例如古細菌,如詹氏甲烷球菌、嗜熱堿甲垸桿菌;鹽細菌,如沃氏富鹽菌和鹽細菌種A^CW;閃爍古生球菌、激烈火球菌、極端嗜熱古菌、嗜熱泉生古細菌、海沼甲垸球菌、甲烷嗜高熱菌、梅氏甲烷八疊球菌、耐超高溫熱棒菌、深海火球菌、硫磺礦硫化葉菌、超嗜熱古菌、嗜酸熱原體、火山熱原體等;或真細菌,如大腸桿菌、嗜熱棲熱菌、枯草芽胞桿菌、嗜熱脂肪芽孢桿菌等。在一個實施方式中,真核生物來源,例如植物、藻類、原生動物、真菌、酵母菌、動物(例如哺乳動物、昆蟲、節肢動物等)等也可用作O-tRNA和O-RS的來源。O-tRNA/0-RS配對的各組分可得自同一生物或不同生物。在一個實施方式中,0-tRNA/0-RS配對可來自同一生物。或者,O-tRNA/0-RS配對的O-tRNA和O-RS可來自不同生物。O-tRNA、O-RS或O-tRNA/0-RS配對可在體內或體外選擇或篩選和/或可用于細胞,例如哺乳動物細胞,如嚙齒動物或靈長動物細胞,從而產生含有非天然氨基酸的多肽。不特別限制所用的哺乳動物宿主細胞。含本發明翻譯組分的哺乳動物細胞組合物也是本發明特征之一。為在一種生物中篩選O-tRNA和/或O-RS以用于另一種生物,也可參見2004年4月16日提交的名為"EXPANDINGTHEEUKARYOTICGENETICCODE(擴展真核生物遺傳密碼)"的國際申請公布號WO2004/094593。雖然正交翻譯系統(例如,含有O-RS、O-tRNA和非天然氨基酸)可利用培養的宿主細胞產生含非天然氨基酸的蛋白質,但并非要求本發明的正交翻譯系統需要完整的、有活力的宿主細胞。例如,在細胞提取物存在下,正交翻譯系統可利用無細胞系統。實際上,使用無細胞的體外轉錄/翻譯系統產生蛋白質是公認的技術。利用本文所述的正交翻譯系統組分,使這些體外系統適用于產生含非天然氨基酸的蛋白質也屬于本發明的范圍。選擇者密碼子本發明的選擇者密碼子擴大了蛋白質生物合成機理的遺傳密碼子框架。例如,選擇者密碼子包括,如獨特的三堿基密碼子、無義密碼子(如終止密碼子(如琥珀密碼子(UAG)或乳白密碼子(UGA)))、非天然密碼子、至少四堿基的密碼子、罕用密碼子等。可將許多選擇者密碼子引入所需基因,例如一個以上、兩個以上、三個以上等。利用不同的選擇者密碼子,可利用多對正交tRNA/合成酶配對,從而能利用這些不同的選擇者密碼子同時位點特異性地摻入多個非天然氨基酸,例如包含至少一個非天然氨基酸。在一個實施方式中,這些方法包括利用作為終止密碼子的選擇者密碼子在細胞中體內摻入非天然氨基酸。例如,制備能識別終止密碼子的O-tRNA,并由O-RS用非天然氨基酸氨酰化該O-tRNA。宿主的天然氨酰-tRNA合成酶不識別該O-tRNAc可采用常規的定點誘變將終止密碼子引入編碼感興趣多肽的多核苷酸中感興趣的位點。可參見,例如Sayers,J.R.等,(1988),"5',3'Exonucleaseinphosphorothioate-basedoligonucleotide-directedmutagenesis(硫代磷酸酯寡核苷酸定向誘變中的5,,3'核酸外切酶)",泡c/e/cJc/&b,791-802。當例如在體內聯用O-RS、O-tRNA和編碼感興趣多肽的核酸時,可對終止密碼子起反應而摻入非天然氨基酸,從而獲得在特定位點含有非天然氨基酸的多肽。在本發明的一個實施方式中,用作選擇者密碼子的終止密碼子是琥珀密碼子UAG和/或乳白密碼子UGA。在一實施例中,UAG和UGA都用作選擇者密碼子的遺傳密碼可編碼22個氨基酸,同時保留赭石無義密碼子,UAA,其是最豐富的終止信號。體內摻入非天然氨基酸不會顯著干擾宿主細胞。例如,在非真核細胞,如大腸桿菌中,由于UAG密碼子的抑制效率依賴于O-tRNA(如琥珀抑制子tRNA)與釋放因子l(RFl)(其可結合UAG密碼子,進而引起延伸中的肽從核糖體釋放)之間的競爭,因此可通過,例如提高O-tRNA(如抑制子tRNA)的表達水平,或利用RF1缺陷型菌株調節抑制效率。在真核細胞中,由于UAG密碼子的抑制效率依賴于O-tRNA(如琥珀抑制子tRNA)和真核釋放因子(如eRF)(其可結合終止密碼子,進而引起延伸中的肽從核糖體釋放)之間的競爭,因此可通過,例如提高O-tRNA(如抑制子tRNA)的表達水平調節抑制效率。此外,也可存在其它化合物,例如還原劑,如二硫蘇糖醇(DTT)。非天然氨基酸也可由罕用密碼子編碼。例如,當體外蛋白合成反應中的精氨酸濃度下降時,證實罕用的精氨酸密碼子AGG可利用丙氨酸酰化的合成tRNA而有效插入ala。可參見Ma等,Aoc/zew&^y,32:7939(1993)。在此情況中,合成tRNA可與大腸桿菌中作為次要成分存在的天然tRNAAfg競爭。此外,一些生物不能利用所有三聯密碼子。已可在體外轉錄/翻譯提取物中利用藤黃微球菌(^f/crococa^/w&w)的未指定密碼子AGA插入氨基酸。可參見,例如Kowal和Oliver,7Vwc/.,25:4685(1997)。可產生本發明的各組分以體內利用這些罕用密碼子。選擇者密碼子也可包括延伸密碼子,例如四個或四個以上堿基的密碼子,如四個、五個、六個或更多堿基的密碼子。四堿基密碼子的例子包括,CCCU等。五堿基密碼子的例子包括,例如AGGAC、CCCCU、CCCUC、CUAGA、CUACU、UAGGC等。本發明方法可包括使用基于移碼抑制的延伸密碼子。四個或四個以上堿基的密碼子可將例如一個或多個非天然氨基酸插入同一蛋白質。在其它實施方式中,反密碼子環可解碼例如至少一種四堿基密碼子、至少一種五堿基密碼子或至少一種六堿基密碼子或更多。由于可能的四堿基密碼子有256種,所以同一細胞中可用四個或四個以上堿基的密碼子編碼多種非天然氨基酸。也可參見,Anderson等,(2002),"ExploringtheLimitsofCodonandAnticodonSize(密碼子和反密碼子大小極限的研究)",C/zem/^o;朋d5/o/ogy,9:237-244禾口Magliery,(2001),"ExpandingtheGeneticCode:SelectionofEfficientSuppressorsofFour-baseCodonsandIdentificationof"Shifty"Four-baseCodonswithaLibraryApproachinEscherichiacoli(擴增遺傳密石馬在大腸桿菌中選擇有效的四堿基密碼子抑制劑并用文庫方法鑒定"變化的"四堿基密碼子)",乂Mo/.5/o/.,307:755-769。例如,已采用體外生物合成方法利用四堿基密碼子將非天然氨基酸摻入蛋白質。參見,例如Ma等,(1993),A'oc/z簡.勿,32:7939和Hohsaka等,(1999),J爿m.C/zem.Soc.,121:34。聯用CGGG和AGGU及兩種化學酰化的移碼抑制子tRNA在體外將2-萘基丙氨酸和賴氨酸的NBD衍生物同時摻入鏈霉親和素。可參見,例如Hohsaka等,(1999),」m.C/zem.Soc.,121:12194。在體內研究中,Moore等檢測了含NCUA反密碼子的tRNA"11衍生物抑制UAGN密碼子(N可以是U、A、G或C)的能力,發現含UCUA反密碼子的tRNA"u能解碼四聯UAGA,其效率為13到26%,而在0或-l讀框中幾乎不解碼。可參見Moore等,(2000),/JIA/.所o/.,298:195。在一個實施方式中,本發明可利用基于罕用密碼子或無義密碼子的延伸密碼子,它們能降低在其它不期望位點的錯義連讀(missensereadthrough)和移碼抑制。四堿基密碼子已在各種正交系統中用作選擇者密碼子。可參見,例如,WO2005/019415;WO2005/007870和WO2005/07624。也可參見Wang和Schultz,"ExpandingtheGeneticCode(擴展遺傳密碼)",C/zem/e/W.,44(1):34-66(2005),其內容通過引用的方式全文納入。雖然以下例子利用琥珀選擇者密碼子,但通過改進本文的實例使之包含四堿基O-tRNA和經修飾包含與之前描述的各非天然氨基酸O-RS的突變相似的突變的合成酶,也可使用四堿基或更多堿基的密碼子。對于給定系統,選擇者密碼子還可包括天然三堿基密碼子中內源性系統不用(或很少用)的那個天然堿基密碼子。例如,這包括缺乏能識別該天然三堿基密碼子的tRNA的系統,和/或該三堿基密碼子是罕用密碼子的系統。選擇者密碼子任選包含非天然堿基對。這些非天然堿基對進一步擴大了現有的遺傳字符集(geneticalphabet)。一種額外的堿基對可將三聯密碼子的數目從64增加至125。第三堿基對的特性包括穩定和選擇性的堿基配對,利用聚合酶高保真地有效酶促摻入DNA,新生非天然堿基對合成后引物繼續有效延伸。適用于這些方法和組合物的非天然堿基對的描述包括例如Hirao等,(2002),"Anunnaturalbasepairforincorporatingaminoacidanaloguesintoprotein(將氨基酸類似物摻入蛋白質的非天然堿基對)",Atoz^e5/o&c/mo/ogy,20:177-182。也可參見Wu,Y.等,(2002),,力w.CTzem.Soc.,124:14626-14630。下文列出了其它的相關出版物。對于體內使用,非天然核苷是膜可滲透的,并可磷酸化形成相應的磷酸三酯。此外,增加的遺傳信息穩定且不為細胞酶所破壞。Benner與他人先前的工作利用了不同于經典Watson-Crick配對的氫鍵模式,其中最值得注意的例子是異-C:異-G配對(iso-C:iso-Gpair)。參見,例如Switzer等,(1989),/Jw.C/z纖,<Soc.,111:8322;Piccirilli等,(1990),淑臟,343:33;Kool,(2000),Cw/r.(9;/".CAem.5/o/.,4:602。這些堿基通常與天然堿基有一定程度的錯配,因而不能酶促復制。Kool和同事證明,堿基間的疏水包裝相互作用(hydrophobicpackinginteraction)可替代氫鍵以驅動堿基對形成。參見Kool,(2000),Cwr.pp/".CAem.所o/.,4:602;Guckian和Kool,(1998),C/zem.五d.£"g/.,36:2825。在致力于開發符合以上所有要求的非天然堿基對的過程中,Schultz、Romesberg和同事已系統地合成并研究了一系列非天然疏水堿基。發現PICS:PICS自身配對比天然堿基對更穩定,并可用大腸桿菌DNA聚合酶I的Klenow片段(KF)有效地摻入DNA。可參見,例如McMinn等,(1999),乂爿m.C/zew.,121:11586;和Ogawa等,(2000),/力m.C/zew.Soc.,122:3274。就生物學功能而言,KF合成3MN:3MN自身配對的效率和選擇性足夠。可參見,例如Ogawa等,(2000),C/zem.Soc.,122:88Q3。然而,這兩種堿基均作為進一步復制的鏈終止子而起作用。近來開發了可用于復制PICS自身配對的突變型DNA聚合酶。此外,可復制7AI自身配對。可參見,例如Tae等,(2001),/爿附,C/zem.Soc.,123:7439。還已開發了與Cu(II)結合后可形成穩定配對的金屬堿基(metallobase)對Dipis:Py。可參見,Meggers等,(2000),顛.C/ze肌Soc.,122:10714。因為延伸密碼子和非天然密碼子在本質上與天然密碼子正交,所以本發明方法可利用該特性產生它們的正交tRNA。還可利用翻譯旁路系統將非天然氨基酸摻入所需多肽。在翻譯旁路系統中,可將一個大序列插入基因,但該序列不翻譯成蛋白質。該序列含有可作為提示的結構,從而能誘導核糖體跳過該序列然后恢復該插入序列的下游翻譯。非天然氨基酸本文所用的非天然氨基酸指除硒代半胱氨酸和/或吡咯賴氨酸和以下20種遺傳編碼的a-氨基酸以外的任何氨基酸、修飾的氨基酸或氨基酸類似物丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、組氨酸、異亮氨酸、亮氨酸、賴氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、絲氨酸、蘇氨酸、色氨酸、酪氨酸、纈氨酸。a-氨基酸的通用結構如式I所示<formula>formulaseeoriginaldocumentpage47</formula>非天然氨基酸一般具有式I所示的任何結構,其中R基團是除20種天然氨基酸中所用以外的任何取代基。20種天然氨基酸的結構可參見,例如《生物化學》(Biochemistry),L.Stryer編,第三版,1988,福里曼公司(FreemanandCompany),紐約。注意,本發明的非天然氨基酸可以是除以上20種a-氨基酸以外的天然化合物。由于本發明的非天然氨基酸與天然氨基酸通常區別在側鏈,所以非天然氨基酸與其它氨基酸(例如天然或非天然的)形成酰胺鍵的方式與天然蛋白質中酰胺鍵的形成方式相同。然而,非天然氨基酸的側鏈不同于天然氨基酸的側鏈。雖然本文所述實施例中主要感興趣的是圖l所示的非天然氨基酸,但并非要將本發明嚴格限制于這些結構。實際上,不難制備各種易于獲得且結構相關的類似物,這些類似物保留產生它們的結構(即圖1所示結構)的主要特性,而且本文參考的氨酰-tRNA合成酶(例如,SEQIDNO:57-101所示O-RS)還特異性識別這些類似物。這些相關的氨基酸類似物屬于本發明的范圍。在其它非天然氨基酸中,例如式I中的R可任選含有垸基-、芳基-、酰基-、肼、氰基-、鹵代-、酰肼、烯基、醚、硼酸基(borate)、硼酸酯基(boronate)、磷、膦酰基、膦、烯酮、亞胺、酯、羥胺、胺等,或上述基團的任何組合。感興趣的其它非天然氨基酸包括但不限于含光可活化交聯劑的氨基酸、自旋-標記的氨基酸、熒光氨基酸、金屬結合氨基酸、含金屬的氨基酸、放射性氨基酸、含有新官能團的氨基酸、能與其它分子共價或非共價相互作用的氨基酸、光鎖定(photocaged)和/或光致異構(photoisomerizable)的氨基酸、含生物素或生物素類似物的氨基酸、含酮基的氨基酸、糖基化的氨基酸、與氨基酸側鏈相連的糖部分、含聚乙二醇或聚醚的氨基酸、重原子取代的氨基酸、化學方法可切割或光可切割的氨基酸、與天然氨基酸相比側鏈延長的氨基酸(如聚醚或長鏈烴,如超過約5個、約10個碳原子等)、含碳連接糖的氨基酸、含氨基硫代酸的氨基酸以及含一個或多個毒性部分的氨基酸。本發明另一方面提供具有以下式IV所示通用結構的非天然氨基酸具有此結構的非天然氨基酸一般可以是任何結構,其中&是20種天然氨基酸之一(例如,酪氨酸或苯丙氨酸)所用的取代基,R2是取代基。因此,此類非天然氨基酸可視作天然氨基酸衍生物。除了含有圖1所示非天然氨基酸結構外,非天然氨基酸還可任選含有經修飾的骨架結構,例如式II和III所示的結構<formula>formulaseeoriginaldocumentpage49</formula>其中,Z—般包含OH、NH2、SH、NH-R'或S-R';X和Y可以相同或不同,一般包含S或O,R和R'可任選相同或不同,通常選自與上述式I所示非天然氨基酸的R基團相同的組成以及氫。例如,本發明的非天然氨基酸還任選在式II和III所示氨基或羧基中包含取代基。該類型的非天然氨基酸包括但不限于例如含有20種常見氨基酸的相應側鏈或非天然側鏈的a-羥酸、a-硫代酸、a-氨基硫代羧酸酯等。另外,a碳上的取代基還任選包括L、D或a-a-雙取代氨基酸,如D-谷氨酸、D-丙氨酸、D-甲基-O-酪氨酸、氨基丁酸等。其它替代結構包括環形氨基酸,如脯氨酸類似物以及3、4、6、7、8和9元環脯氨酸類似物,(3和Y氨基酸,如取代的P丙氨酸和Y-氨基丁酸。在一些方面,本發明使用L-構型的非天然氨基酸。然而,本發明并非僅限于使用L-構型的非天然氨基酸。還考慮了這些非天然氨基酸的D-對映體可用于本發明。本發明所用的非天然氨基酸不嚴格局限于圖1所示的非天然氨基酸。本領域技術人員知道不難獲得天然氨基酸的各種非天然類似物。例如,但不限于不難制備衍生自苯丙氨酸或酪氨酸的非天然氨基酸。酪氨酸類似物包括,例如對位取代的酪氨酸、鄰位取代的酪氨酸和間位取代的酪氨酸,其中該取代的酪氨酸含有炔基、乙酰基、苯甲酰基、氨基、肼、羥胺、巰基、羧基、異丙基、甲基、C6-C2C直鏈或支鏈烴、飽和或不飽和的烴、0-甲基、聚醚基團、硝基等。此外,也包括多取代的芳環。本發明的谷氨酰胺類似物包括但不限于a-羥基衍生物、y-取代的衍生物、環形衍生物和酰胺取代的谷氨酰胺衍生物。苯丙氨酸類似物的例子包括但不限于對位取代的苯丙氨酸、鄰位取代的苯丙氨酸和間位取代的苯丙氨酸,其中所述取代基含有炔基、羥基、甲氧基、甲基、烯丙基、醛基、硝基、巰基或酮基等。非天然氨基酸的具體例子包括但不限于磺基酪氨酸、對-乙基硫代羰基-L-苯丙氨酸、對-(3-氧代丁酰基)-L-苯丙氨酸、1,5-丹酰-丙氨酸、7-氨基-香豆素氨基酸、7-羥基-香豆素氨基酸、硝基芐基-絲氨酸、0-(2-硝基芐基)丄-酪氨酸、對-羧甲基-L-苯丙氨酸、對-氰基-L-苯丙氨酸、間-氰基-L-苯丙氨酸、聯苯基丙氨酸、3-氨基-L-酪氨酸、聯吡啶基丙氨酸、對-(2-氨基-l-羥乙基)-L-苯丙氨酸、對-異丙基硫代羰基-L-苯丙氨酸、3-硝基-L-酪氨酸和對-硝基-L-苯丙氨酸。還包括對-炔丙氧基苯丙氨酸、3,4-二羥基-L-苯丙氨酸(DHP)、3,4,6-三羥基-L-苯丙氨酸、3,4,5-三羥基-L-苯丙氨酸、4-硝基-苯丙氨酸、對-乙酰基-L-苯丙氨酸、O-甲基-L-酪氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、0-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、3-硝基-酪氨酸、3-巰基-酪氨酸、三-0-乙酰基-GlcNAc(3-絲氨酸、L-多巴(Dopa)、氟化苯丙氨酸、異丙基-L-苯丙氨酸、對-疊氮基-L-苯丙氨酸、對-酰基-L-苯丙氨酸、對-苯甲酰基-L-苯丙氨酸、L-磷酸絲氨酸、膦酰絲氨酸、膦酰酪氨酸、對-碘代-苯丙氨酸、對-溴代苯丙氨酸、對-氨基-L-苯丙氨酸以及異丙基-L-苯丙氨酸等。本文引用的參考文獻披露了各種非天然氨基酸的結構。還可參見國際申請公開號WO2004/094593,題為"EXPANDINGTHEEUKARYOTICGENETICCODE(擴展真核遺傳密碼)"和2005年10月27日提交的國際申請PCT/US2005/039210,題為"ORTHOGONALTRANSLATIONCOMPONENTSFORTHE,(9INCORPORATIONOFUNNATURALAMINOACIDS(體內掾入非天然氨基酸的正交翻譯組分)"。非天然氨基酸的化學合成上述許多非天然氨基酸可以從,例如美國的西格瑪公司(Sigma)或美國威斯康星州密爾沃基市的阿爾得里奇公司(Aldrich)等購得。那些不能商品化購得的非天然氨基酸可任選如各種出版物所述或采用本領域技術人員己知的標準方法合成。有機合成技術可參見,例如Fessendon和Fessendon,OrganicChemistry(有機化學),(1982,第二版,威拉德格蘭特出版社(WillardGrantPress),波士頓,馬薩諸塞州);March,AdvancedOrganicChemistry(高級有機化學)(第三版,1985,威立父子公司(WileyandSons),紐約);以及Carey和Sundberg的AdvancedOrganicChemistry(高級有機化學)(第三版,A和B部分,1990,普萊納姆出版社(PlenumPress),紐約)。其它描述非天然氨基酸合成的出版物包括名為"非天然氨基酸的體內摻入"的國際專利申請WO2002/085923;Matsoukas等,(1995)J!MedCAem.,38,4660-4669;King和Kidd,(1949)"ANewSynthesisofGlutamineandofDipeptidesofGlutamicAcidfromPhthylatedIntermediates"(從令卩苯二甲酰化中間體合成谷氨酰胺和y-二肽的新方法)./C/zem.Soc.,3315-3319;Friedman禾口Chatterrji,(1959)"SynthesisofDerivativesofGlutamineasModelSubstratesforAnti-tumorAgents(合成谷氨酰胺衍生物作為抗腫瘤藥物的模擬底物)".J^w.C/zem.Soc.81,3750-3752;Craig等,(1988)"AbsoluteConfigurationoftheEnantiomersof7-Chloro-4amino]quinoline(Chloroquine)(7-氯-4[[4-(二乙基氨基)-l-甲基丁基]氨基]喹啉(氯喹)對映體的絕對構型)".,Og.CZzem.53,1167-1170;Azoulay等(1991)"GlutamineanaloguesasPotentialAntimalarials(谷氨酰胺類似物作為潛在的抗癥藥)",五wr乂Met/.C/zem.26:201-205;Koskinen禾口Rapoport,H.(1989)"Synthesisof4-SubstitutedProlinesasConformationallyConstrainedAminoAcidAnalogues(合成4-取代的月甫氨酸作為構象約束的氨基酸類似物)".乂Og.CTzem.54:1859-1866;Christie禾口Rapoport(1985)"SynthesisofOpticallyPurePipecolatesfromL-Asparagine.ApplicationtotheTotalSynthesisof(+)-ApovincaminethroughAminoAcidDecarbonylationandIminiumIonCyclization(從L-天冬酰月安合成光學純的哌啶酸酯,應用于通過氨基酸脫羰基和亞氨鏡離子環化總合成(+)-阿撲長春胺)".JOg.C&m.1989:1859-1866;Barton等,(1987)"SynthesisofNovela-Amino-AcidsandDerivativesUsingRadicalChemistry:SynthesisofL-andD-a-Amino-AdipicAcids,L-a-aminopimelicAcidandAppropriateUnsaturatedDerivatives(采用自由基化學方法合成新的a-氨基酸和衍生物合成L-和D-a氨基酸、L-a-氨基庚二酸以及合適的不飽和衍生物)".r"ra/ze^謂丄e".43:4297-4308;以及Subasinghe等,(1992)"Quisqualicacidanalogues:synthesisofbeta-heterocyclic2-aminopropanoicacidderivativesandtheiractivityatanovelquisqualate-sensitizedsite(使君子氨酸類似物|3-雜環2-氨基丙酸衍生物的合成及其在使君子氨酸敏化部位的活性)".J.^ed.C/zem.35:4602-7。還可參見2003年12月22日提交的名為"ProteinArrays(蛋白質陣列)"的國際專利申請WO2004/058946。非天然氨基酸的細胞攝取細胞攝取非天然氨基酸通常是設計和選擇非天然氨基酸,例如用于摻入蛋白質中應考慮的問題之一。例如,a-氨基酸的高電荷密度提示這些化合物不可能透過細胞。天然氨基酸通過蛋白質轉運系統的收集(作用)攝取入細胞,這些系統往往顯示程度不同的氨基酸特異性。可進行快速篩選來評估細胞將攝取哪種非天然氨基酸(如果有的話)。可參見,例如2003年12月22日提交的名為"ProteinArrays(蛋白質陣列)"的國際公布WO2004/058946中的毒性試驗;Liu禾口Schultz,(1999),"Progresstowardtheevolutionofanorganismwithanexpandedgeneticcode(含擴增遺傳密碼的生物演化的進展)",PNAS,96:4780-4785。雖然不難采用各種試驗分析攝取情況,但設計適合于細胞攝取途徑的非天然氨基酸的另一種方法是提供生物合成途徑,從而能在體內產生氨基酸。非天然氨基酸的生物合成細胞中己有許多生物合成途徑來產生氨基酸和其它化合物。雖然自然界中,例如細胞中,可能不存在特定非天然氨基酸的生物合成方法,但本發明提供了這種方法。例如,通過加入新的酶或修飾現有的宿主細胞途徑可以在宿主細胞中任選產生非天然氨基酸的生物合成途徑。其它新的酶任選是天然產生的酶或人工開發的酶。例如,生物合成對氨基苯丙氨酸(如WO2002/085923(同上)中的實施例所示)依賴加入其它生物的已知酶的混合物。可通過用含這些酶的基因的質粒轉染細胞而將這些基因引入細胞。當這些基因在細胞中表達時,它們提供了合成所需化合物的酶途徑。可任選加入的酶類型的例子見以下實施例。其它酶序列見例如Genbank。也可以相同方式將人工開發的酶任選加入細胞。可以此方式操控細胞機理和資源用以產生非天然氨基酸。實際上,可采用各種方法產生新的酶從而在體內或體外用于生物合成途徑,改進現有途徑,產生非天然氨基酸。開發酶和其它生物合成途徑組分的許多現有方法適用于本發明以產生非天然氨基酸(或者,實際上,用于開發合成酶使之具有新的底物特異性或其它感興趣的活性)。例如,可任選采用DNA改組來開發新的酶和/或這些酶的途徑,從而能在體外或體內產生非天然氨基酸(或產生新的合成酶)。可參見,例如Stemmer,(1994),"RapidevolutionofaproteininvitrobyDNAshuffling(通過DNA改組在體外快速進化蛋白質)",淑臟,370(4):389-391;Stemmer,(1994),"DNAshufflingbyrandomfragmentationandreassembly:Invitrorecombinationformolecularevolution(通過隨機斷裂和裝配的DNA改組分子進化的體外重組)",iVoc.Wa".」cW.OSA,91:10747-10751。相關方法改組關聯的(例如同源的)基因家族,從而能快速開具有所需特性的酶。這種"家族基因改組"方法的例子見Crameri等,(1998),"DNAshufflingofafamilyofgenesfromdiversespeciesacceleratesdirectedevolution(不同禾中類基因家方矣的DNA改組加速了定向進化)",A^a"",391(6664):288-291。也可采用稱為"產生雜交酶的遞增截短"(ITCHY)的DNA重組方法來產生新的酶(無論是生物合成途徑組分或合成酶),例如Ostermeier等,(1999),"AcombinatorialapproachtohybridenzymesindependentofDNAhomology(不依賴DNA同源性的雜交酶的組合方法)",A^wre歷o&c/z,17:1205中所述。該方法也可用于產生用作一種或多種體外或體內重組方法底物的酶或其它途徑變體的文庫。也可參見,Ostermeier等,(1999),"CombinatorialProteinEngineeringbyIncrementalTruncation(采用遞增截矢豆的組合蛋白質工程)",尸亂淑/Jca"c/.,,96:3562-67;Ostermeier等,(1999),"IncrementalTruncationasaStrategyintheEngineeringofNovelBiocatalysts(作為工程改造新生物催化劑的方法的遞增截短)",5/0/0g/ca/a"ofMe&c/"a/C7z麵勿,7:2139-44。另一種方法采用指數集合誘變(exponentialensemblemutagenesis)來產生酶或其它途徑變體的文庫,其能例如催化與產生非天然氨基酸(或新合成酶)有關的生物合成反應。在該方法中,平行地隨機選取(randomized)感興趣序列中的小基團殘基,以在各不同位置鑒定可產生功能性蛋白質的氨基酸。適用于本發明以產生新酶進而產生非天然氨基酸(或新合成酶)的此類方法的例子見Delegrave和Youvan,(1993),5/o&c/z"o/ogyWe"arc/z,11:1548-1552。在另一方法中,利用摻雜或簡并寡核苷酸的隨機或半隨機誘變可用于工程改造酶和/或途徑成分,例如采用如以下文獻所述的通用誘變方法Arkin和Youvan,(1992),"Optimizingnucleotidemixturestoencodespecificsubsetsofaminoacidsforsemi-randommutagenesis"(優化核苷酸混合物來編碼用于半隨機誘變的特定氨基酸亞組),5Zo&c/mo/ogy10:297-300;或Reidhaar-Olson等,(1991),"Randommutagenesisofproteinsequencesusingoligonucleotidecassettes"(用寡核苷酸盒隨機誘變蛋白質序列),M^o&^7"mo/.,208:564-86。利用多核苷酸重裝配和位點飽和誘變的另一種方法(常稱為"非隨機"誘變)可用于產生酶和/或途徑組分,然后篩選它們行使一種或多種合成酶或生物合成途徑功能(例如在體內產生非天然氨基酸)的能力。可參見,例如Short,"NON-STOCHASTICGENERATIONOFGENETICVACCINESANDENZYMES(遺傳疫苗和酶的非隨機產生)",WO00/46344。這種突變方法的替代方法包括重組生物的整個基因組并選擇得到的后代的特定途徑功能(常稱為"全基因組改組")。該方法適用于本發明,例如通過基因組重組并選擇能夠產生非天然氨基酸(或其中間體)的生物(大腸桿菌或其它細胞)。例如,以下出版物所指導的方法可應用于途徑設計,從而能開發細胞中現有和/或新的途徑進而在體內產生非天然氨基酸Patnaik等,(2002),"Genomeshufflingoflactobacillusforimprovedacidtolerance(乳酸桿菌基因組改組來提高酸耐受性)",A^化re歷o&cA"o/ogy,20(7):707-712;禾口Zhang等,(2002),"Genomeshufflingleadstorapidphenotypicimprovementinbacteria(基因組改組導致細菌表型快速改善)",A^rt^e,2月7日,415:644-646。其它可用于生物和代謝途徑工程改造(例如為產生所需化合物)的技術也適用于產生非天然氨基酸。指導有用的路徑工程改造方法的出版物的例子包括Nakamura禾卩White,(2003),"Metabolicengineeringforthemicrobialproductionof1,3propanediol(微生物生產1,3丙二醇的代謝工程)",C鮮.(9;z".所o,ec/zwo/,,14(5):454-9;Berry等,(2002),"ApplicationofMetabolicEngineeringtoimproveboththeproductionanduseofBiotechIndigo(應用代謝工程來提高BiotechIndigo的生產和用途)",J/"c^Wn'a/M/cro6/o/ogyaw/5/o&c/mo/ogy,28:127-133;Banta等,(2002),"Optimizinganartificialmetabolicpathway:EngineeringthecofactorspecificityofCorynebacterium2,5-diketo-D-gluconicacidreductaseforuseinvitaminCbiosynthesis(優化人工代謝途徑工程改造用于維生素C生物合成的棒狀桿菌2,5-二酮基-D-葡糖酸還原酶的輔助因子特異性)",5/oc/zem/^o;,41(20):6226-36;Selivonova等,(2001),"RapidEvolutionofNovelTraitsinMicroorganisms(微生物中新特性的快速進化)",4////e(iami£>zv/romne"to/jVf/cro6/o/ogy,67:3645,和許多其它出版物。無論采用什么方法,用本發明工程改造的生物合成途徑產生的非天然氨基酸的濃度足以有效地生物合成蛋白質,例如天然細胞含量,但不應達到顯著影響其它細胞氨基酸的濃度或耗盡細胞資源的程度。以此方式在體內所產生的濃度一般為約10mM到約0.05mM。一旦細胞被工程改造從而產生了特定途徑所需的酶和非天然氨基酸,為了核糖體蛋白質合成和細胞生長,可任選采用體內選擇以進一步優化非天然氨基酸的產生。摻入非天然氨基酸的正交組分本發明提供制備正交組分從而能在體內對選擇者密碼子,如琥珀終止密碼子、無義密碼子、四堿基或多堿基密碼子等起反應而將圖1所示的非天然氨基酸摻入延伸的多肽鏈中的方法和組合物。例如,本發明提供了正交-tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)及其配對。這些配對可用于將非天然氨基酸摻入延伸的多肽鏈中。本發明的組合物包含正交氨酰-tRNA合成酶(O-RS),所述O-RS優先用圖1的非天然氨基酸氨酰化O-tRNA。在某些實施方式中,O-RS包含選自SEQIDNO:57-101的氨基酸序列及其保守變體。在本發明的某些實施方式中,O-RS優先用特定的非天然氨基酸氨酰化O-tRNA勝過任何內源性tRNA,其中所述O-RS對O-tRNA有偏好(bias),其中加載有非天然氨基酸的O-tRNA與加載有相同非天然氨基酸的內源性tRNA的比例大于1:1,更優選O-RS排他性地或者幾乎排他性地加載O-tRNA。含O-RS的組合物還可任選含有正交tRNA(O-tRNA),該O-tRNA識別選擇者密碼子。與包含本文序列表(例如,SEQIDNO:l)和實施例所列的多核苷酸序列或由其編碼的O-tRNA的抑制效率相比,在關聯合成酶存在下,本發明O-tRNA對選擇者密碼子起反應而通常具有至少約,例如45%、50%、60%、75%、80%、90%或更高的抑制效率。在一個實施方式中,O-RS結合O-tRNA的抑制效率至少是沒有O-RS存在下O-tRNA的抑制效率高,例如5倍、10倍、15倍、20倍、25倍或更高。在一些方面,O-RS與O-tRNA一起的抑制效率至少是衍生自大腸桿菌(五.Co/Z)的正交亮氨酰或酪氨酰-tRNA合成酶的抑制效率的45%。包含O-tRNA的組合物還可任選包含宿主細胞(例如哺乳動物細胞,如嚙齒動物細胞或靈長動物細胞)和/或完整翻譯系統。本發明還提供包含翻譯系統的細胞(如嚙齒動物細胞或靈長動物細胞),所述翻譯系統包含正交-tRNA(O-tRNA);正交氨酰-tRNA合成酶(O-RS)和圖1所示非天然氨基酸。O-RS通常優先用非天然氨基酸氨酰化O-tRNA勝過任何內源性tRNA,該O-RS對O-tRNA有偏好,加載有非天然氨基酸的O-tRNA與加載有相同非天然氨基酸的內源性tRNA的比例大于1:1,更優選該O-RS排他性地或者幾乎排他性地加載O-tRNA。O-tRNA識別第一選擇者密碼子,O-RS優先用非天然氨基酸氨酰化O-tRNA。在一個實施方式中,O-tRNA含有SEQIDNO:3所示多核苷酸序列或其互補多核苷酸序列,或者由其編碼。在一個實施方式中,該O-RS含有選自SEQIDNO:57-101的氨基酸序列和其保守變體。本發明的細胞還可任選包含其它不同的O-tRNA/O-RS配對和第二非天然氨基酸,例如,此O-tRNA識別第二選擇者密碼子,此O-RS優先用第二非天然氨基酸氨酰化相應的O-tRNA,其中所述第二氨基酸不同于第一非天然氨基酸。本發明的細胞可任選包含含有編碼感興趣多肽的多核苷酸的核酸,所述多核苷酸含有所述O-tRNA能識別的選擇者密碼子。在某些實施方式中,本發明的宿主細胞是哺乳動物細胞(如嚙齒動物細胞或靈長動物細胞),所述細胞含有正交-tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)、非天然氨基酸和含有編碼感興趣多肽的多核苷酸的核酸,其中所述多核苷酸含有該O-tRNA能識別的選擇者密碼子。在本發明的某些實施方式中,所述Q-RS優先用所述非天然氨基酸氨酰化所述O-tRNA,其效率高于該O-RS氨酰化任何內源性tRNA的效率。在本發明的某些實施方式中,本發明的O-tRNA含有本文序列表(例如,SEQIDNO:3)或實施例中所示的多核苷酸序列或其互補多核苷酸序列,或由這些序列編碼。在本發明的某些實施方式中,O-RS含有序列表中所示氨基酸序列或其保守變體。在一個實施方式中,O-RS或其部分由編碼本文序列表和實施例所示氨基酸序列的多核苷酸序列或其互補的多核苷酸序列編碼。本發明的0-tRNA和/或0-RS可衍生自各種生物(如真核和/或非真核生物)。多核苷酸也是本發明的特征。本發明的多核苷酸(例如,SEQIDNO:8-56)包括人工的(如人造的和非天然產生的)多核苷酸,所述多核苷酸序列含有編碼本文序列表所示多肽的核苷酸序列,和/或與該多核苷酸序列互補。本發明的多核苷酸還可包括在高度嚴謹條件下能與上述多核苷酸在基本全長的核酸上雜交的核酸。本發明的多核苷酸還包括與天然tRNA或相應編碼核酸的序列具有,例如至少75%、至少80%、至少90%、至少95%、至少98%或更高相同性的多核苷酸(但是本發明的多核苷酸不是天然tRNA或相應的編碼核酸),所述tRNA識別選擇者密碼子,如四堿基密碼子。與上述任何多核苷酸序列和/或含上述任何序列的保守變體的多核苷酸有,例如至少80%、至少90%、至少95%、至少98%或更高相同性的人工多核苷酸也包括在本發明的多核苷酸內。含本發明多核苷酸的載體也是本發明的特征。例如,本發明的載體可以是質粒、粘粒、噬菌體、病毒、表達載體等。含本發明載體的細胞也是本發明的特征。O-tRNA/0-RS配對組分的制備方法也是本發明的特征。用這些方法制備的組分也是本發明的特征。例如,產生至少一種與細胞正交的tRNA(O-tRNA)的方法包括制備突變體tRNA文庫;使突變體tRNA文庫中各成員的反密碼子環突變使得其能識別選擇者密碼子,藉此提供潛在的O-tRNA文庫,并對第一物種的第一細胞群進行負選擇,所述細胞含有潛在O-tRNA文庫的成員。負選擇可去除含潛在O-tRNA文庫成員的細胞,該潛在O-tRNA可被細胞的內源性氨酰-tRNA合成酶(RS)氨酰化。由此提供與第一物種的細胞正交的tRNA庫,從而至少提供一種O-tRNA。還提供用本發明方法產生的O-tRNA。在某些實施方式中,這些方法還包括正選擇第一物種的第二細胞群,其中所述細胞含有與第一物種的細胞正交的tRNA庫的成員、關聯氨酰-tRNA合成酶和陽性選擇標記。采用正選擇可選擇或篩選出含有能被關聯氨酰-tRNA合成酶氨酰化而且在陽性選擇標記存在下可顯示所需反應的tRNA庫成員的那些細胞,藉此提供O-tRNA。在某些實施方式中,第二細胞群含有未被負選擇去除的細胞。還提供能用非天然氨基酸加載O-tRNA的正交-氨酰-tRNA合成酶的鑒定方法。例如,該方法包括對第一物種的細胞群進行篩選,其中所述細胞各自含有1)多種氨酰-tRNA合成酶(RS)的成員(例如,所述多種RS可包括突變型RS、衍生自第一物種以外的物種的RS、或者突變型RS和衍生自第一物種以外的物種的RS二者);2)正交-tRNA(O-tRNA)(如衍生自一個或多個物種);和3)編碼陽性選擇標記并且包含至少一個選擇者密碼子的多核苷酸。選擇或篩選與不含所述多種RS的成員或所含成員數目較少的細胞相比細胞(如宿主細胞)中顯示抑制效率提高的那些細胞。這些選擇/篩選的細胞含有能氨酰化O-tRNA的活性RS。用這些方法鑒定到的正交氨酰-tRNA合成酶也是本發明的特征。在宿主細胞(例如哺乳動物,如嚙齒動物細胞或靈長動物細胞等)內產生在所選位置含有非天然氨基酸的蛋白質的方法也是本發明的特征。例如,一種方法包括在適當的培養基內培養細胞,其中所述細胞含有核酸,而該核酸含有至少一個選擇者密碼子并編碼一種蛋白,從而提供非天然氨基酸并在含所述至少一個選擇者密碼子的核酸的翻譯過程中將該非天然氨基酸摻入該蛋白質的特定位置,從而產生該蛋白質。細胞還含有在細胞內起作用并識別選擇者密碼子的正交-tRNA(O-tRNA);以及優先用非天然氨基酸氨酰化O-tRNA的正交氨酰-tRNA合成酶(O-RS)。用這種方法產生的蛋白質也是本發明的特征。本發明還提供含有蛋白質的組合物,其中所述蛋白質包含非天然氨基酸。在某些實施方式中,蛋白質包含的氨基酸序列與己知蛋白,如治療蛋白、診斷蛋白和工業用酶或其一部分的氨基酸序列有至少75%相同性。組合物任選包含藥學上可接受的載體。核酸和多肽序列及變體如本文所述,本發明提供編碼例如O-tRNA和O-RS的多核苷酸序列,多肽氨基酸序列,例如O-RS,以及例如包含所述多核苷酸或多肽序列的組合物、系統和方法。本文披露了所述序列的例子,如O-tRNA和O-RS的氨基酸和核苷酸序列(見圖16,例如SEQIDNO:3和8-101)。然而,本領域技術人員應知道本發明并不限于本文,例如實施例和序列表中披露的那些序列。本領域技術人員應知道本發明還提供具有本文所述功能的許多相關序列,例如編碼本文所披露O-RS的保守變體的多核苷酸和多肽。本領域已知構建和分析能夠在酵母宿主系統中用非天然氨基酸氨酰化O-tRNA的正交合成酶物質(O-RS)的通用方法。本發明提供多肽(O-RS)和多核苷酸,如O-tRNA、編碼O-RS或其諸部分的多核苷酸,用于分離氨酰-tRNA合成酶克隆的寡核苷酸等。本發明的多核苷酸包括編碼本發明的感興趣蛋白或多肽并含有一個或多個選擇者密碼子的那些多核苷酸。另外,本發明多核苷酸包括,例如含有選自SEQIDNO:8-56的核苷酸序列的多核苷酸;與其多核苷酸序列互補或編碼其多核苷酸序列的多核苷酸。本發明的多核苷酸還包括編碼選自SEQIDNO:57-101的O-RS氨基酸序列的任何多核苷酸。類似地,在高嚴謹條件下,可與上述多核苷酸在基本全長的核酸上雜交(并且不是天然多核苷酸序列)的人工核酸也是本發明多核苷酸。在一個實施方式中,組合物包含本發明的多肽和賦形劑(如緩沖液、水、藥學上可接受的賦形劑等)。本發明還提供可與本發明多肽發生特異性免疫反應的抗體或抗血清。人工多核苷酸是人造而不是天然產生的多核苷酸。本發明的多核苷酸還包括人工多核苷酸,即與天然tRNA具有如至少75%、至少80%、至少卯%、至少95%、至少98%或更高相同性(但不是天然tRNA)。多核苷酸還包括與天然tRNA具有如至少75%、至少80%、至少90%、至少95%、至少98%或更高相同性(但不是100%相同)的人工多核苷酸。在某些實施方式中,載體(如質粒、粘粒、噬菌體、病毒等)含有本發明的多核苷酸。在一個實施方式中,所述載體是表達載體。在另一個實施方式中,所述表達載體包含與本發明的一種或多種多核苷酸操作性相連的啟動子。在另一個實施方式中,細胞包含含有本發明多核苷酸的載體。本領域技術人員還知道本發明包括所披露序列的多種變體。例如,產生功能相同序列的所披露序列的保守變體也屬于本發明。核酸多核苷酸序列的變體也屬于本發明,所述變體與至少一種所披露序列雜交。本文披露序列的獨特亞序列,例如可通過標準序列比較技術測定的獨特亞序列也屬于本發明。保守性變異由于遺傳密碼的簡并性,"沉默取代"(即,核酸序列中的取代不導致所編碼多肽改變)是編碼氨基酸序列的每條核酸序列所隱含的特征。類似地,也不難鑒定氨基酸序列中有一個或少數氨基酸被具有高度相似特性的不同氨基酸取代的"保守性氨基酸取代",因為它與披露的構建物高度相似。披露的各序列的這種保守性變異是本發明的特征之一。具體核酸序列的"保守性變異"指編碼相同或基本相同的氨基酸序列的那些核酸,或者,如果核酸不編碼氨基酸序列,則指基本上相同的序列。技術人員知道改變、加入或刪除所編碼序列中一個氨基酸或少部分氨基酸(一般低于5%、更常見低于4%、2%或1%)的各種取代、缺失或插入是"保守性修飾變異",這些改變導致氨基酸的缺失、插入或被化學性質相似的氨基酸所取代。因此,本發明所列舉多肽序列的"保守性變異"包括用同一保守性取代組的氨基酸取代該多肽序列的少部分(通常低于5%,更常見是低于2%或1%)的氨基酸。最后,加入不改變某核酸分子所編碼活性的序列(例如加入無功能序列)是基礎核酸的保守性變異。本領域熟知提供功能類似的氨基酸的保守性取代表,其中一個氨基酸殘基被另一個具有相似化學特性(例如芳族側鏈或帶正電荷的側鏈)的氨基酸殘基取代,因此基本上不改變該多肽分子的功能特性。以下例舉多組化學特性相似的天然氨基酸,其中,各組內的取代即"保守性取代"。保守性氨基酸取代非極性和/或脂族極性,不帶電帶正電荷帶負電荷的側鏈荷的側鏈萬跌WJ班的側鏈側鏈甘氨酸絲氨酸丙氨酸蘇氨酸苯丙氨酸賴氨酸天冬氨酸纈氨酸半胱氨酸酪氨酸精氨酸亮氨酸甲硫氨酸谷氨酸色氨酸組氨酸異亮氨酸精氨酸脯氨酸谷氨酰胺核酸雜交可采用比較雜交來鑒定本發明的核酸,包括本發明核酸的保守性變體,該比較雜交方法是區別本發明核酸的優選方法。此外,在高度、超高度和超超高度嚴謹性條件下能與SEQIDNO:8-56所示核酸雜交的靶核酸是本發明的特征。這種核酸的例子包括與某給定的核酸序列相比,含有一個或少許沉默或保守性核酸取代的核酸。當測試核酸與探針的雜交程度是與完美匹配的互補耙標雜交程度的至少50%,即信噪比至少是該探針與靶標在完美匹配的探針與完美匹配的互補靶標結合的條件下雜交的信噪比的一半高時,可稱該測試核酸與探針核酸特異性雜交;此條件下,完美匹配的探針與完美匹配的互補耙核酸結合的信噪比至少是與任何不匹配靶核酸雜交所觀察到的信噪比的約5-10倍。當核酸結合(一般在溶液中)時,稱其"雜交"。核酸因各種已充分表征的理化力,例如氫鍵、溶劑排斥、堿基堆積等而雜交。核酸雜交的廣泛指南見Tijssen,(1993),LaboratoryTechniquesinBiochemistryandMolecularBiology—HybridizationwithNucleicAcidProbes(生物化學與分子生物學的實驗室技術——核酸探針雜交),第一部分第二章,"Overviewofprinciplesofhybridizationandthestrategyofnucleicacidprobeassays(雜交原理概述與核酸探針試驗方法)",(艾爾賽弗公司(Elsevier),紐約);以及CurrentProtocolsinMolecularBiology(最新分子生物學方法),Ausubel等編,"CurrentProtocols"(最新方法),格林出版合伙公司(GreenePublishingAssociates,Inc.)和約翰威立父子公司(JohnWiley&Sons)的合資企業,(2004年增補);Hames和Higgins,(1995),GeneProbesl(基因探針l)和GeneProbes2(基因探針2),IRL出版社,牛津大學出版社,牛津,英格蘭,它們提供了合成、標記、檢測和定量測定DNA及RNA,包括寡核苷酸的細節。在Southern或northern印跡濾膜上具有100個以上互補殘基的互補核酸雜交的嚴謹性雜交條件的例子是含lmg肝素的50。/。福爾馬林,42'C雜交過夜。嚴謹性洗滌條件的例子是65。C,用0.2XSSC洗滌15分鐘(SSC緩沖液的描述可參見Sambrook等;MolecularCloning-ALaboratoryManual(分子克隆-實驗室手冊),(第三版),第1-3巻,冷泉港實驗室,冷泉港,紐約,2001)。通常先進行低嚴謹性洗滌除去背景探針信號,再進行高嚴謹性洗滌。示例性低嚴謹性洗滌是4(TC,用2XSSC洗滌15分鐘。具體雜交試驗中信噪比是無關探針觀察到的信噪比的5倍(或更高)通常表示檢測到特異性雜交。核酸雜交實驗(例如,Southern和northern雜交)的"嚴謹性雜交洗滌條件"取決于序列,并隨不同的環境參數而不同。核酸雜交的廣泛指南見Tijssen,(1993),生物化學與分子生物學的實驗室技術——核酸探針雜交,第一部分第二章,"雜交原理概述與核酸探針試驗方法",(艾爾賽弗公司,紐約);Hames禾BHiggins,(1995),基因探針l,IRL出版社,牛津大學出版社,牛津,英格蘭,禾卩Hames禾卩Higgins,(1995),基因探針2,IRL出版社,牛津大學出版社,牛津,英格蘭。不難憑經驗確定適合任何測試核酸的嚴謹性雜交和洗滌條件。例如,在確定嚴謹性雜交和洗滌條件時,可逐漸提升雜交和洗滌條件(例如,通過升高雜交或洗滌的溫度、降低雜交或洗滌中的鹽濃度、增加雜交或洗滌中的洗滌劑濃度和/或增加雜交或洗滌中的有機溶劑如福爾馬林的濃度)直至符合選定的標準。例如,在高度嚴謹性雜交和洗滌條件中,逐漸提升雜交和洗滌條件直至探針與完美匹配的互補靶標結合的信噪比至少是該探針與不匹配靶標雜交所觀察到的信噪比的5倍。選擇的"非常嚴謹"的條件等于具體探針的熱解鏈溫度(TJ。Tm是50M的測試序列與完美匹配的探針雜交時的溫度(在規定的離子強度和pH下)。為本發明的目的,"高度嚴謹"的雜交和洗滌條件一般選擇為在規定的離子強度和pH下比具體序列的Tm約低5'C。"超高嚴謹"的雜交和洗滌條件指,增加雜交和洗滌條件的嚴謹性直至探針與完美匹配的互補靶核酸結合的信噪比至少是任何不匹配靶核酸雜交時觀察到的信噪比的10倍。靶核酸在這種條件下與探針雜交的信噪比至少是完美匹配的互補靶核酸的1/2時,可稱其在超高嚴謹性條件下與探針結合o類似地,可通過逐漸提升相關雜交試驗的雜交和/或洗滌條件來確定甚至更高的嚴謹性水平。例如,提升雜交和洗滌的條件的嚴謹性直至探針與完美匹配的互補耙核酸結合的信噪比至少是任何不匹配靶核酸雜交信噪比的10、20、50、100或500倍或更高。靶核酸在這種條件下與探針雜交的信噪比至少是完美匹配的互補靶核酸的1/2時,可稱其在超超高度嚴謹性條件下與探針結合。如果在嚴謹性條件下彼此不雜交的核酸所編碼的多肽基本相同,則這些核酸仍基本相同。例如,當利用遺傳密碼所允許的最大密碼簡并性產生核酸的拷貝時會發生這種情況。獨特亞序列在一些方面,本發明提供含有選自本文披露的O-tRNA和O-RS序列的核酸中獨特亞序列的核酸。與對應于任何已知O-tRNA或O-RS核酸序列的核酸相比,所述獨特亞序列是獨特的。可采用,例如設置默認參數的BLAST進行核酸比對。任何獨特亞序列可用作,例如探針來鑒定本發明核酸或相關核酸。類似地,本發明包括含有選自本文披露的O-RS序列的多肽中獨特亞序列的多肽。與對應于任何已知多肽序列的多肽相比,本文的獨特亞序列是獨特的。本發明還提供能在嚴謹性條件下與獨特的編碼寡核苷酸雜交的靶核酸,所述寡核苷酸編碼選自O-RS序列的多肽中的獨特亞序列,其中與對應于任何對照多肽(例如,通過突變獲得本發明合成酶的親代序列)的多肽相比,所述獨特亞序列是獨特的。可如上所述測定獨特序列。序列比較、相同性和同源性對于兩個或多個核酸或多肽序列,術語"相同的"或"相同性百分比"指當用下文所述序列比較算法(或技術人員可用的其它算法)或通過目測觀察來比較和比對最大相應性時,這兩個或多個序列或亞序列相同,或者有特定百分比的氨基酸殘基或核苷酸相同。對于兩個核酸或多肽(例如,編碼O-tRNA或O-RS的DNA,或O-RS的氨基酸序列),術語"基本相同"指當利用序列比較算法或通過目測觀察來比較和比對最大相應性時,兩個或多個序列或亞序列至少有約60%、約80%、約90-95%、約98%、約99%或更多的核苷酸或氨基酸殘基相同。這種"基本相同"的序列通常認為是"同源的",而不論實際祖先。優選在至少長約50個殘基的序列區域,更優選在至少約100個殘基的區域存在"基本相同性",待比較兩條序列最好在至少約150個殘基或者在全長上基本相同。當蛋白質和/或蛋白質序列(天然或人工地)衍生自同一祖先蛋白或蛋白序列時,它們是"同源的"。類似地,當核酸和/或核酸序列(天然或人工地)衍生自同一祖先核酸或核酸序列時,它們是"同源的"。例如,可通過任何可用的誘變方法來修飾任何天然核酸使之含有一個或多個選擇者密碼子。當該誘變的核酸表達時,它編碼的多肽含有一個或多個非天然氨基酸。當然,該突變方法還可改變一個或多個標準密碼子,從而也改變了所得突變型蛋白質中的一個或多個標準氨基酸。通常可從兩種或多種核酸或蛋白質(或其序列)間的序列相似性推斷同源性。可用于確認同源性的序列間精確的相似性百分比因所研究的核酸與蛋白質而有所不同,但常規利用低至25%的序列相似性來確認同源性。還可用更高水平的序列相似性,例如30%、40%、50%、60%、70%、80%、90%、95%或99%或更高來確認同源性。本文描述了測定序列相似性百分比的方法(例如,采用參數默認的BLASTP和BLASTN),這些方法眾所周知。對于序列比較和同源性測定,通常將一條序列用作參比序列與測試序列相比較。當采用序列比較算法時,將測試序列與參比序列輸入計算機,如果需要可指定亞序列坐標,并指定序列算法程序參數。然后根據所指定的程序參數,序列比較算法可計算測試序列相比于參比序列的序列相同性百分比。可用以下方法進行比較序列的最佳比對,例如Smith和Waterman的局部同源性算法,Jdv./^//.M。仇,2:482,(1981);Needleman和Wunsch的同源性比對算法,J,Mo/.5z'o/.,48:443,(1970);Pearson和Lipman的相似性檢索方法,尸亂淑'"ca""'.腦,85:2444,(1988);計算機執行這些算法(威斯康星遺傳軟件包中的GAP,BESTFIT,FASTA和TFASTA,遺傳學計算機組(GeneticsComputerGroup),575ScienceDr.,麥迪遜,威斯康星州);或者目測觀察(一般可參見Cw〃eW/Vo"co"Mo/ecw/arS/o/ogy(最新分子生物學方法),Ausubel等編,"Cw廳eW/VWoco&(最新方法)",格林出版合伙公司和約翰威立父子公司的合資企業,2006年增補)。適用于測定序列相同性和序列相似性百分比的算法的一個例子是Altschul等,J.Mol.Biol.,215:403-410,(1990)所述的BLAST算法。進行BLAST分析的軟件由國家生物技術信息中心對公眾開放。該算法包括首先通過在査詢序列中鑒定長為W的短字串來鑒定高評分序列配對(HSP),這些字串與數據庫序列中相同長度的字串比對時符合或滿足某些正值閾值評分T。T稱為鄰近字串評分閾值(Altschul等,J.Mol.Biol.,215:403-410(1990))。這些原始鄰近字串選中(hit)作為啟動檢索的種子來找尋含有它們的較長HSP。然后使這些字串選中沿著各條序列雙向延伸,以致累積比對評分增加。對于核苷酸序列,用參數M(—對匹配殘基的獎勵評分;恒大于O)和N(錯配殘基的罰分;恒小于O)計算累積評分。對于氨基酸序列,則用評分矩陣來計算累積評分。當出現以下情況時終止各方向的字串選中延伸累積比對評分從其達到的最高值下降X;因一個或多個負評分殘基比對的累積導致累積評分降至0或0以下;或者到達各序列的末端。BLAST算法參數W、T和X決定比對的靈敏度和速度。BLAST程序(用于核苷酸序列)默認11為字長(W)、IO為期望值(E)、100為截斷值、M=5、N=-4,并進行雙鏈比較。對于氨基酸序列,BLAST程序默認3為字長(W)、10為期望值(E)并采用BLOSUM62評分矩陣(參見Henikoff和Henikoff,(1989),尸roc.A^f/.JcfldSc/.t/&4,89:10915)。除了計算序列相同性百分比外,BLAST算法也可對兩條序列間的相似性進行統計學分析(參見,例如Karlin和Altschul,尸roc.淑7.JcadSc/.C/W,90:5873-5787,(1993))。BLAST算法提供的相似性量度之一是最小總概率(P(N)),其指示兩條核苷酸或氨基酸序列之間發生隨機匹配的概率。例如,如果在測試核酸與參比核酸的比較中最小總概率小于約0.1,更優選小于約0.01,最優選小于約0.001,則可認為該核酸與參比核酸相似。誘變與其它分子生物學技術可采用分子生物學技術操作本發明的和用于本發明的多核苷酸和多肽。描述分子生物學的通用教材包括Berger和Kimmel,GuidetoMolecularCloningTechniques(分子克隆技術指南),MefAotfe//7五""wo/ogy(酶學方法),第152巻,學術出版社公司(AcademicPress,Inc.),圣迭戈,加利福尼亞州;Sambrook等,MolecularCloning-ALaboratoryManual(分子克隆-實驗室手冊),(第三版),第l-3巻,冷泉港實驗室,冷泉港,紐約,2001和Owre^/VotocoAuMo/ecw/ar歷o/ogy(最新分子生物學方法),Ausubel等編;"O^reW/Vo^co/s/"Mo/ecw/ar歷o/ogy(分子生物學最新方法)",格林出版合伙公司和約翰威立父子公司的合資企業,(2006年增補)。這些教材描述了誘變、載體的應用、啟動子和涉及,例如產生含有選擇者密碼子的基因從而產生含非天然氨基酸的蛋白質,正交tRNA、正交合成酶及其配對的許多其它相關課題。本發明可采用各種類型的誘變,例如以使tRNA分子突變、產生tRNA文庫、產生合成酶文庫、插入編碼感興趣蛋白質或多肽中的非天然氨基酸的選擇者密碼子。它們包括但不限于定點誘變、隨機點誘變、同源重組、DNA改組或其它遞歸誘變方法、嵌合構建、利用含尿嘧啶的模板誘變、寡核苷酸指導的誘變、硫代磷酸酯修飾的DNA誘變、利用缺口雙螺旋DNA的誘變等,或者是它們的任何組合。其它合適的方法包括點錯配修復、利用修復缺陷宿主株的誘變、限制性選擇和限制性純化、缺失誘變、總基因合成誘變、雙鏈斷裂修復等。本發明也包括,例如涉及嵌合構建物的誘變。在一個實施方式中,可用天然分子或經改變或突變的天然分子的已知信息,例如序列,序列比較、物理特性、晶體結構等來指導誘變。可利用本發明多核苷酸或含有本發明多核苷酸的構建物,例如本發明的載體(例如可以是克隆載體或表達載體)來遺傳改造(例如轉化、轉導或轉染)宿主細胞。例如,可將正交tRNA、正交tRNA合成酶和待衍生蛋白質的編碼區操作性連接于可在所需宿主細胞中起作用的基因表達控制元件。典型的載體含有轉錄和翻譯終止子、轉錄和翻譯起始序列和用于調節具體靶核酸表達的啟動子。這些載體可任選地包含遺傳表達盒,所述表達盒含有至少一個獨立的終止子序列,允許該表達盒在真核細胞或原核細胞或二者中復制的序列(例如,穿梭載體),和適用于原核與真核系統的選擇標記。載體適用于在原核細胞、真核細胞或優選二者中復制和/或整合。參見Giliman和Smith,G匿,8:81,(1979);Roberts等,淑訓,328:731,(1987);Schneider等,五xpr,i^〃y:,6435:10,(1995);Berger和Kimmel,分子克隆技術指南,酶學方法,第152巻,學術出版社公司,圣迭戈,加利福尼亞州;Sambrook等,分子克隆-實驗室手冊,(第三版),第1-3巻,冷泉港實驗室,冷泉港,紐約,2001;和最新分子生物學方法,Ausubel等編;最新方法,格林出版合伙公司和約翰威立父子公司的合資企業,(2006年增補)。例如,載體可以是質粒、細菌、病毒、裸多核苷酸或綴合的多核苷酸形式。可通過標準方法將載體導入細胞和/或微生物,所述方法包括電穿孔(From等,TVoc.A^/.爿cacf.5W.C7&4,82,5824,(1985)),病毒載體感染,利用在小珠或顆粒的基質內或其表面上含有核酸的小顆粒的高速彈丸穿透(Klein等,A^&re,327:70-73(1987))等。本領域技術人員廣泛了解用于克隆的細菌和噬菌體,它們可由各種來源獲得。參見例如美國典型培養物保藏中心(弗吉尼亞州瑪納薩斯(Manassas,VA)的ATCC)和ATCC出版的77^爿rCCCato/ogweo/5a"eW。5a"en'o;/2flge(ATCC細菌和細菌噬菌體目錄),(1996),Gherna等編。測序、克隆的其它基本方法和分子生物學的其它方面及基礎理論思考也可參見Sambrook等,分子克隆-實驗室手冊,(第三版),第1-3巻,冷泉港實驗室,冷泉港,紐約,2001;最新分子生物學方法,Ausubel等編;最新方法,格林出版合伙公司和約翰威立父子公司的合資企業,(2006年增補);和Watson等,(1992),iecom6/"flWDAM(重組DNA),第二版,科學美國書籍公司(ScientificAmericanBooks),紐約。此外,可以向各種商業來源定制或標準定購基本上任何核酸(和實際上任何標記的核酸,無論標準或非標準的),例如得克薩斯州米德蘭的米德蘭檢定試劑公司(MidlandCertifiedReagentCompany,Midland,TX)、加利福尼亞州雷蒙納市的大美國基因公司(TheGreatAmericanGeneCompany,Ramona,CA)、伊利諾斯州芝加哥市的表達基因公司(ExpressGenInc.)、加利福尼亞州阿拉米達市的操縱子技術公司(OperonTechnologiesInc.)禾口許多其它公司。可利用為例如篩選步驟、激活啟動子或選擇轉化子的活性而作適當改進的常規營養培養基培養工程改造的宿主細胞。這些細胞任選培養成轉基因生物。其它可用的參考文獻,例如細胞分離和培養(例如,用于隨后核酸分離)的文獻包括Freshney,(1994),Cm/&"o/jm'ma/CW&,Sw/crec/m/卯e(動物細胞培養,基本技術手冊),第三版,威立利斯公司(Wiley-Liss),紐約及其所引用的參考文獻;Payne等,(1992),P』CW/T7^raeC"/^re/"h々wW辦We/7m(液體系統中的植物細胞與組織培養),約翰威立父子公司,紐約,紐約州;Gamborg和Phillips編,(1995),尸/耐Ce〃,200780039015.7說明書第64/85頁T7^"ea"c/C^we(植物細胞、組織和器官培養);尸ww^mewto/Me^o&(基本方法),SpringerLabManual(斯普林格實驗室手冊),S-V公司(Springer-Verlag)(伯林海德爾堡紐約);Atlas禾BParks編,7Tzei/a"Wooto/M/craWo/og/ca/Me&a(微生物培養基手冊),(1993),CRC出版社(CRCPress),伯克萊屯,佛羅里達州。感興趣的蛋白質與多肽在細胞中產生在特定位置含非天然氨基酸的蛋白質的方法也是本發明特征之一。例如,一種方法包括用適當的培養基培養細胞,其中所述細胞包含含有至少一個選擇者密碼子并編碼蛋白質的核酸;和提供非天然氨基酸;其中所述細胞還包含在細胞內具有功能并識別選擇者密碼子的正交-tRNA(O-tRNA);和優先用非天然氨基酸氨酰化O-tRNA的正交氨酰-tRNA合成酶(O-RS)。該方法所產生的蛋白質也是本發明特征之一。在某些實施方式中,與表達系統中任何內源性tRNA相比,O-RS偏向于氨酰化關聯的O-tRNA。當O-tRNA和O-RS以等摩爾濃度存在時,O-RS所加載的O-tRNA與內源性tRNA的相對比例大于1:1,優選至少約2:1,更優選5:1,更優選10:1,更優選20:1,更優選50:1,更優選75:1,更優選95:1,98:1,99:1,100:1,500:1,1,000:1,5,000:1或更高。本發明還提供包含蛋白質的組合物,所述蛋白質含有非天然氨基酸。在某些實施方式中,所述蛋白質含有的氨基酸序列與治療性蛋白、診斷性蛋白、工業用酶或其部分的序列至少有75%相同。本發明的組合物和本發明方法制備的組合物任選處于細胞中。然后可將本發明的0-tRNA/0-RS配對或各組分用于宿主系統的翻譯機制中,從而將非天然氨基酸摻入蛋白質。2004年4月16日提交的,名為"EXPANDINGTHEEUKARYOTICGENETICCODE(擴展真核遺傳密碼)"的國際公布號WO2004/094593和名為"INVIVOINCORPORATIONOFUNNATURALAMINOACIDS(非天然氨基酸的體內摻入)"的國際公布號WO2002/085923描述了該方法,這兩篇文獻以引用的方式納入本文。例如,當O-tRNA/O-RS配對引入宿主,例如嚙齒動物或靈長動物細胞時,該配對對選擇者密碼子起反應而將非天然氨基酸(如圖l所示非天然氨基酸)在體內摻入蛋白質。加入系統的非天然氨基酸可以是合成氨基酸,例如可以外源性加入生長培養基的苯丙氨酸或酪氨酸衍生物。本發明的組合物任選為體外翻譯系統,或體內系統。本發明的細胞能大量合成包含非天然氨基酸的蛋白質。在一些方面,組合物任選包含,例如至少10微克、至少50微克、至少75微克、至少100微克、至少200微克、至少250微克、至少500微克、至少1毫克、至少10毫克或更多含非天然氨基酸的蛋白質,或者體內蛋白質產生方法所能達到的含量(本文提供重組蛋白質制備和純化的細節)。在另一方面,組合物中包含在例如細胞裂解液、緩沖液、藥學緩沖液或其它液體混懸液中(例如,體積為約lnL-約100L)的蛋白質濃度任選是,例如每升至少10微克蛋白質、每升至少50微克蛋白質、每升至少75微克蛋白質、每升至少100微克蛋白質、每升至少200微克蛋白質、每升至少250微克蛋白質、每升至少500微克蛋白質、每升至少1毫克蛋白質或每升至少10毫克蛋白質或更高。在細胞中制備大量(例如,大于采用其它方法如體外翻譯通常可能得到的量)包含至少一個非天然氨基酸的蛋白質是本發明特征之一。可摻入非天然氨基酸來,例如改變蛋白質結構和/或功能,如改變大小、酸性、親核性、氫鍵、疏水性、蛋白酶耙位的易接近性、對某部分的耙向(如用于蛋白陣列)、摻入標記物或反應基團等。含有非天然氨基酸的蛋白質的催化或物理特性可得到改善,甚至獲得全新的催化或物理特性。例如,可通過將非天然氨基酸摻入蛋白質來任選改進以下特性毒性、生物分布、結構特性、光譜特性、化學和/或光化學特性、催化能力、半衰期(例如血清半衰期)、與其它分子的反應能力(如共價或非共價的)等。包含含有至少一個非天然氨基酸的蛋白質的組合物可用作,例如新型治療劑、診斷劑、催化酶、工業用酶、結合蛋白(如抗體)以及用于例如研究蛋白質結構和功能。參見例如Dougherty,(2000),"t/n"a/wra/Jw/woJc〖cfaas/Vo6eso//Vo/e/wadF朋c^M(1乍為蛋白質結構和功能探針的非天然氨基酸"),CwrenZOp/m'o"C7z謹/ca/所o/ogy,4:645-652。在本發明的一些方面,組合物包含至少一種含有至少一個,例如至少兩個、至少三個、至少四個、至少五個、至少六個、至少七個、至少八個、至少九個或至少十個或更多非天然氨基酸的蛋白質。所述非天然氨基酸可以相同或不同,例如蛋白質中可以在1、2、3、4、5、6、7、8、9或10個或更多不同的位點上含有l、2、3、4、5、6、7、8、9或10個或更多不同的非天然氨基酸。在另一方面,組合物包含蛋白質,該蛋白質中存在的至少一個(但不是全部)具體氨基酸是非天然氨基酸。對于給定的含多個非天然氨基酸的蛋白質,所述非天然氨基酸可以相同或不同(如蛋白質可包含兩個或多個不同類型的非天然氨基酸,或者可包含兩個相同的非天然氨基酸)。對于含兩個以上非天然氨基酸的給定蛋白質,所述非天然氨基酸可以相同,不同,或是多個同一類型的非天然氨基酸與至少一個不同的非天然氨基酸的組合。利用本文組合物和方法可制備基本上任何含非天然氨基酸的蛋白質(或其一部分)(與任何相應的編碼核酸,例如含有一個或更多選擇者密碼子的核酸)。未試圖鑒定成百上千的已知蛋白質,可修飾它們中的任一種使之含有一個或多個非天然氨基酸,例如通過改進任何可用的突變方法從而使相關翻譯系統中包含一個或多個合適的選擇者密碼子。已知蛋白質的共有序列庫包括GenBankEMBL、DDBJ和NCBI。通過檢索互聯網不難鑒定其它庫。這些蛋白質通常與任何可用的蛋白質(例如,治療性蛋白、診斷性蛋白、工業用酶或其一部分等)有,例如至少60%、至少70%、至少75%、至少80%、至少90%、至少95%或至少99%或更高的相同性,同時這些蛋白質含有一個或多個非天然氨基酸。可經修飾包含一個或多個非天然氨基酸的治療性、診斷性和其它蛋白質的例子參見但不限于2004年4月16日提交的名為"ExpandingtheEukaryoticGeneticCode(擴展真核生物遺傳密碼)"的國際公布號WO2004/094593和名為"INVIVOINCORPORATIONOFUNNATURALAMINOACIDS.(非天然氨基酸的體內慘入")的WO2002/085923。可經修飾包含一個或多個非天然氨基酸的治療性、診斷性和其它蛋白質的例子包括但不限于例如蛭素、oc-1抗胰蛋白酶、血管生成抑制素、抗溶血因子(Antihemolyticfactor)、抗體(抗體的其它細節見下文)、載脂蛋白、脫輔蛋白、心房利鈉因子、心房利鈉多肽、心房肽(Atrialpeptides)、C-X陽C趨化因子(如T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-IO、GCP-2、NAP-4、SDF-1、PF4、MIG)、降轉素、CC趨化因子(如單核細胞趨化蛋白-1、單核細胞趨化蛋白-2、單核細胞趨化蛋白-3、單核細胞炎性蛋白-la、單核細胞炎性蛋白-l(J、RANTES、1309、R83915、R91733、HCC1、T58847、D31065、T64262)、CD40配體、C-kit配體、胱冬酶、膠原、集落剌激因子(CSF)、補體因子5a、補體抑制劑、補體受體l、細胞因子(如,上皮嗜中性活化肽-78(epithelialNeutrophilActivatingPeptide-78)、GROa/MGSA、GRO(J、GROy、MIP-la、MIP-15、MCP-1)、表皮生長因子(EGF)、促紅細胞生成素("EPO")、剝落性毒素A和B、因子IX、因子VII、因子VIII、因子X、成纖維細胞生長因子(FGF)、血纖蛋白原、纖連蛋白、G-CSF、GM-CSF、葡糖腦苷脂酶、促性腺激素、生長因子、Hedgehog蛋白(如Sonic,Indian,Desert)、血紅蛋白、肝細胞生長因子(HGF)、水蛭素、人血清白蛋白、胰島素、胰島素樣生長因子(IGF)、干擾素(如,IFN-a、IFN隱卩、IFN陽y)、白介素(如,IL-1、IL-2、IL隱3、IL隱4、IL-5、IL陽6、IL-7、IL-8、IL-9、IL-10、IL-ll、IL-12等)、角質形成細胞生長因子(KGF)、乳鐵蛋白、白血病抑制因子、螢光素酶、神經營養因子(Neurturin)、嗜中性白細胞抑制因子(NIF)、抑瘤蛋白M、成骨蛋白、甲狀腺激素、PD-ECSF、PDGF、肽激素(如,人生長激素)、多效營養因子、胱冬酶原-3、胱冬酶原-9、A蛋白、G蛋白、熱源性外毒素A、B和C、松弛素、腎素、SCF、可溶性補體受體I、可溶性I-CAM1、可溶性白介素受體(IL-1、2、3、4、5、6、7、9、10、11、12、13、14、15)、可溶性TNF受體、生長調節素、促生長素抑制劑、促生長素、鏈激酶、超抗原,即葡萄球菌腸毒素(SEA、SEB、SEC1、SEC2、SEC3、SED、SEE)、超氧化物岐化酶(SOD)、中毒性休克綜合征毒素(TSST-1)、胸腺素al、組織纖溶酶原激活物、腫瘤壞死因子P(TNF(3)、腫瘤壞死因子受體(TNFR)、腫瘤壞死因子-a(TNFa)、血管內皮生長因子CVEGEF)、尿激酶和許多其它蛋白。可采用本文所述能在體內摻入非天然氨基酸的組合物和方法制備的一類蛋白質包括轉錄調節劑或其一部分。示例性轉錄調節劑包括調節細胞生長、分化、調控等的基因和轉錄調節蛋白。轉錄調節劑存在于原核生物、病毒和真核生物(包括真菌、植物、酵母菌)、昆蟲和動物(包括哺乳動物)中,從而提供了廣泛的治療靶點。應該理解表達和轉錄激活物通過許多機理調控轉錄,例如通過與受體結合、刺激信號轉導級聯反應、調控轉錄因子表達、與啟動子和增強子結合、與結合啟動子和增強子的蛋白質結合、DNA解鏈、前-mRNA剪接、RNA聚腺苷酸化和RNA降解。本發明的一類蛋白質(例如,含有一個或多個非天然氨基酸的蛋白質)包括生物學活性蛋白,例如蛭素、細胞因子、炎性分子、生長因子、它們的受體和癌基因產物,如白介素(如IL-1、IL-2、IL-8等)、干擾素、FGF、IGF-I、IGF-II、FGF、PDGF、TNF、TGF-a、TGF-卩、EGF、KGF、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-l、ICAM-1/LFA-1和透明素(hyalurin)/CD44;信號轉導分子和相應的癌基因產物,例如Mos、Ras、Raf和Met;轉錄激活物和阻遏物,例如p53、Tat、Fos、Myc、Jun、Myb、Rel和類固醇激素受體,例如雌激素、孕酮、睪酮、醛甾酮的那些受體,LDL受體配體和皮質酮。本發明也提供含有至少一個非天然氨基酸的酶(例如工業用酶)或其一部分。酶的例子包括但不限于酰胺酶、氨基酸消旋酶、酰基轉移酶、脫鹵酶、雙加氧酶、二芳基丙垸過氧化物酶(diarylpropaneperoxidases),差向異構酶、環氧化物水解酶、酯酶、異構酶、激酶、葡糖異構酶、糖苷酶、糖基轉移酶、鹵素過氧化物酶(haloperoxidases)、單加氧酶(例如p450)、脂酶、木質素過氧化物酶、腈水合酶、腈水解酶、蛋白酶、磷酸酶、枯草桿菌蛋白酶、轉氨酶和核酶。許多這些蛋白質可商品化購得(參見,例如西格瑪生物科學公司(SigmaBiosciences)),相應的蛋白質序列和基因及其許多變體通常是熟知的(參見,例如Genbank)。可根據本發明通過插入一個或多個非天然氨基酸來修飾任何這些蛋白,從而(例如)改變這些蛋白質一種或多種感興趣的治療、診斷或酶活性。治療相關特性包括血清半衰期、保存半衰期、穩定性、免疫原性、治療活性、可檢測性(例如,通過在非天然氨基酸中加入報道基團(如標記物或標記結合位點))、LD5Q或其他負效應的降低、通過胃腸道進入體內的能力(如口服利用度)等。診斷特性的例子包括保存半衰期、穩定性、診斷活性、可檢測性等。相關的酶特性的例子包括保存半衰期、穩定性、酶活性、生產能力等。也可采用本發明方法和組合物修飾各種其它蛋白質使之包含一個或多個非天然氨基酸。例如,本發明可包括用非天然氨基酸取代一種或多種疫苗蛋白質中的一個或多個天然氨基酸,例如以下來源的蛋白質感染性真菌,如曲霉(A^erg///^)、假絲酵母(OmAWa)種;細菌,特別是用作病原性細菌模型的大腸桿菌,以及醫學上重要的細菌,如葡萄球菌屬(Stoj^y/ococc/)(如,金黃色葡萄球菌)或鏈球菌屬0^"印fOCOCC/)(如,肺炎鏈球菌);原生動物,如孢子綱(如,瘧原蟲(尸/(Xmoflf/a))、根足蟲(r/n'zo;0(iy)(如,內變形蟲(五Wamoe6a))和鞭毛蟲類(錐蟲(7V;;/7a"(Woma)、利什曼原蟲(丄e^/zmam'a)、毛滴蟲(7Wc/zwnowa力、賈第蟲(G/aWZa)等);病毒,如(+)RNA病毒(例子包括痘病毒,如痘苗病毒(vac"'m'a);小RNA病毒,如脊髓灰質炎病毒(/7o/Zo);披膜病毒,如風疹病毒(ra6e〃a);黃病毒(Flavivimses),如HCV;和冠狀病毒)、(-)RNA病毒(如棒狀病毒(Rhabdovirus),如VSV;副粘病毒,如RSV;正粘病毒,如流感病毒;布尼亞病毒和嵌沙樣病毒)、dsDNA病毒(如呼腸孤病毒)、RNA到DNA的病毒,即逆轉錄病毒,如HIV和HTLV和某些DNA到RNA的病毒,如乙肝病毒。農業相關的蛋白也是非天然氨基酸修飾的合適靶位,例如抗蟲蛋白(如Cry蛋白)、淀粉和脂質產生酶、植物和昆蟲毒素、毒素耐受性蛋白、真菌毒素解毒蛋白、植物生長酶(如核酮糖1,5-二磷酸羧化酶/加氧酶,"RUBISCO")、脂氧合酶(LOX)和磷酸烯醇式丙酮酸(PEP)羧化酶。在某些實施方式中,本發明方法和/或組合物中的感興趣多肽或蛋白質(或其一部分)由核酸編碼。所述核酸通常含有至少一個、至少兩個、至少三個、至少四個、至少五個、至少六個、至少七個、至少八個、至少九個、十個或更多個選擇者密碼子。可采用本領域技術人員熟知和本文在"誘變與其它分子生物學技術"中所述的方法誘變編碼感興趣蛋白質或多肽的基因,從而使之含有(例如)一個或多個選擇者密碼子來摻入非天然氨基酸。例如,可誘變感興趣蛋白質的核酸,使之含有一個或多個選擇者密碼子以插入一個或多個非天然氨基酸。本發明包括任何蛋白質的這種變體(例如突變體)形式,例如含有至少一個非天然氨基酸。類似地,本發明也包括相應的核酸,即具有編碼一個或多個非天然氨基酸的一個或多個選擇者密碼子的任何核酸。為制備含有非天然氨基酸的蛋白質,可利用適合通過正交tRNA/RS配對在體內摻入非天然氨基酸的宿主細胞和生物。可用表達正交tRNA、正交tRNA合成酶的一個或多個載體和編碼待衍生蛋白質的載體來遺傳改造(例如轉化、轉導或轉染)宿主細胞。各組分可以位于同一載體或各自位于不同載體,或者可以兩個組分位于一個載體而第三組分位于第二載體。載體可以是例如質粒、細菌、病毒、裸多核苷酸或偶聯多核苷酸的形式。通過免疫反應性測定多肽因為本發明多肽提供了各種新的多肽序列(例如,以在本文翻譯系統中合成的蛋白質為例,多肽含有非天然氨基酸;或者,以新的合成酶為例,則是標準氨基酸的新序列),這些多肽也提供了可在例如免疫測定中識別的新結構特征。產生能與本發明多肽特異性結合的抗血清以及能與這種血清結合的多肽是本發明的特征之一。本文所用的術語"抗體"包括但不限于基本上由一個或多個免疫球蛋白基因編碼的多肽,或其能特異性結合并識別分析物(抗原)的片段。例子包括多克隆、單克隆、嵌合型和單鏈抗體等。本文所用的術語"抗體"也包括免疫球蛋白片段,包括Fab片段和由表達文庫(包括噬菌體展示文庫)產生的片段。抗體的結構與術語可參見,例如Paul,Fwm/ame"a〃wm""o/ogX基礎免疫學),第四版,1999,雷文出版社(RavenPress),紐約。為產生用于免疫測定的抗血清,可如本文所述產生并純化一種或多種免疫原性多肽。例如,可在重組細胞中產生重組蛋白。采用標準小鼠免疫方案(關于用于測定特異性免疫反應性的抗體產生、免疫測定形式和條件的標準說明可參見,例如Harlow禾卩Lane,(1988),爿""60^//^,^Z^6oraforyMawwfl/(抗體,實驗室手冊),冷泉港出版社,紐約),用免疫原性蛋白和標準佐劑(如弗氏佐劑)免疫小鼠的近交品系(此類小鼠因其實際遺傳相同性使得實驗結果重現性較高而用于測定)。蛋白質、抗體、抗血清等的其它細節可見名為"EXPANDINGTHEEUKARYOTICGENETICCODE(擴展真核生物遺傳密碼)"的國際公布號WO2004/094593;名為"INVIVOINCORPORATIONOFUNNATURALAMINOACIDS(非天然氨基酸的體內摻入)"的WO2002/085923;名為"GLYCOPROTEINSYNTHESIS(糖蛋白合成)"的WO2004/035605和名為"PROTEINARRAYS(蛋白質陣列)"的WO2004/058946。O-tRNA和O-RS以及O-tRNA/O-RS配對的應用本發明的組合物和用本發明方法制備的組合物任選存在于細胞內。然后可將本發明的O-tRNA/O-RS配對或各組分用于宿主系統的翻譯機制中,從而將非天然氨基酸摻入蛋白質。Schultz等人的名為"非天然氨基酸的體內摻入"的國際公布號WO2002/085923描述了該方法,該篇文獻以引用的方式納入本文。例如,當O-tRNA/O-RS配對引入宿主,例如大腸桿菌細胞或酵母時,該配對對選擇者密碼子,例如琥珀無義密碼子起反應而將可外源性加入生長培養基的非天然氨基酸在體內摻入蛋白質,例如肌紅蛋白測試蛋白或治療蛋白中。本發明的組合物可以任選處于體外翻譯系統,或細胞體內系統中。含非天然氨基酸的蛋白質的應用范圍廣泛。例如摻入蛋白質的非天然部分可作為廣泛修飾的靶標,如與其它蛋白質、與小分子如標記物或染料和/或生物分子交聯。通過這些修飾,摻入非天然氨基酸可產生改進的治療蛋白,可用于改變或提高酶的催化功能。在一些方面,蛋白質中摻入非天然氨基酸和隨后進行修飾有助于研究蛋白質的結構、與其它蛋白質的相互作用,等等。試劑盒試劑盒也是本發明特征之一。例如,提供用于在嚙齒動物或靈長動物細胞中產生含至少一個非天然氨基酸的蛋白質的試劑盒,所述試劑盒中裝有至少一個容器,而該容器含有編碼O-tRNA的多核苷酸序列和/或編碼O-RS的多核苷酸序列、和/或0-RS多肽。在一個實施方式中,所述試劑盒還包含非天然氨基酸。在另一實施方式中,所述試劑盒還包含制備含有非天然氨基酸的蛋白質的使用說明材料。實施例提供以下實施例只是為了說明,并非要限制本發明。技術人員應該知道可以改變各種非關鍵性參數而不會脫離本發明的范圍。應該知道,本文所述的實施例和實施方式只是為說明目的,本領域技術人員借鑒這些實施例和實施方式可以作出各種改進或改變而仍屬于本申請的構思和權限以及隨附權利要求書的范圍內。實施例l用非哺乳動物翻譯組件進行無義抑制的技術限制在哺乳動物細胞中遺傳編碼非天然氨基酸的一種策略是使現有的大腸桿菌或釀酒酵母宿主系統中生成的突變tRNA/aaRS對適應(哺乳動物細胞)。因為大腸桿菌的tRNA^鑒別元件,包括可變臂和接納莖中G1:C72堿基對,與哺乳動物細胞不同(Wang和Schultz"擴展遺傳密碼"(ExpandingtheGeneticCode)v4"geuw2^eC7zem/e五d,44(1):34-66(2005);以及Bonnefond等(2005),"tRNA(Tyr)/TyrRS氨酰化系統的演化"(EvolutionofthetRNA(Tyr)/TyrRSaminoacylationsystems)歷oc/z/m/e87:873-883),不幸的是,細菌中使用的tRNA/aaRS對不大可能在真核細胞中正交。相反,釀酒酵母和哺乳動物細胞中的tRNA經相似處理并具有同樣的鑒別元件(Bonnefond等(2005),"tRNA(Tyr)/TyrRS氨酰化系統的演化"(EvolutionofthetRNA(Tyr)/TyrRSaminoacylationsystems)歷oc/z/脂'e87:873-883)。此外,因為釀酒酵母的翻譯機器也與高等真核生物同源,因此可能將酵母中演化的經修飾的正交tRNA/aaRS對轉移到哺乳動物細胞中。事實上,Yokoyama及其同事在CHO細胞中使用酵母中演化的EcTyrRS變體來接受對-苯甲酰-L-苯丙氨酸(pBpa),將該光反應性氨基酸摻入到人Grb2蛋白中(Hino等(2005),"哺乳動物細胞中通過定點摻入光反應性氨基酸進行蛋白光交聯"(Proteinphoto-cross-linkinginmammaliancellsbysite-specificincorporationofaphotoreactiveaminoacid,"AtoMe/Zzcxis12,201-206)。不幸的是,具有功能活性的大腸桿菌tRNA〖^不能在哺乳動物細胞中很好地表達,嚴重限制了突變蛋白的產率(Sakamoto等(2002),"在哺乳動物細胞中將非天然氨基酸定點摻入蛋白質中"(Site-specificincorporationofanunnaturalaminoacidintoproteinsinmammaliancells)_iVwc/eZc爿c/cfe30:4692-4699)。實施例2在哺乳動物細胞中創建新的無義抑制系統為了克服上述正交tRNA表達的局限性,本發明提供了一種常用方法允許將酵母中演化的突變抑制tRNA/aaRS對轉移到哺乳動物細胞中使用。本文所展示的該方法以及新的正交系統在嚙齒類CHO宿主細胞和靈長類(人)293T宿主細胞中將數種非天然氨基酸有效引入到綠色熒光蛋白中。盡管用這兩種細胞進行實驗,但本發明能夠廣泛應用于來自多種物種的哺乳動物宿主細胞中。創建新的哺乳動物無義抑制系統真核細胞中tRNA由RNA聚合酶III轉錄,該聚合酶識別兩個保守的基因內部轉錄控制元件,即A和B盒(Sprague,《真核tRNA基因轉錄》(rramc〃;p"owo/£wtoo;o"cfiA^Gewe^,AMS出版社,華盛頓特區;1994)。大腸桿菌tRNATyr僅具有B盒元件,研究表明引入假-A盒產生不能被五cTyrRS識別的無功能tRNA(Sakamoto等,"在哺乳動物中將非天然氨基酸定點摻入蛋白質中"(Site-specificincorporationofanunnaturalaminoacidintoproteinsinmammaliancells)A^c/e/cJc^si^30:4692-4699(2002))。不同于大腸桿菌tRNATyr,來自嗜熱脂肪芽孢桿菌的tRNATyr(其具有相似的鑒別元件并且仍可被EcTyrRS加載,Bedouelle,"酪氨酰-tRNA合成酶識別tRNA(Tyr)"(RecognitionoftRNA(Tyr)bytyrosyl-tRNAsynthetase)72,589-598(1990))具有天然產生的內部A和B盒。因此,該tRNA與五cTyrRS能夠在哺乳動物細胞中行使正交tRNA/aaRS對的功能(Sakamoto等(2002),"在哺乳動物中將非天然氨基酸定點摻入蛋白質中"(Site-specificincorporationofanunnaturalaminoacidintoproteinsinmammaliancells)TVwc/e/cJc/<is30:4692-4699)。構建并表達琥珀抑制子正交tRNA為提供琥珀抑制子SytRNAg^,將^tRNATyr三核苷反密碼子改變為C(34)UA。因為原核tRNATyr的G34僅為TyrRS的一個弱鑒別元件(Hou和Schimmel(1989),"用體外動力學參數建模詳述體內轉移RNA種類"(Modelingwithw>okineticparametersfortheelaborationoftransferRNAidentityv/vo)說oc/zem^^y28:4942-4947),所以G34C突變體應當不顯著影響EcTyrRS與5stRNA〖的結合。此外,因為哺乳動物基因組TAG終止密碼子的出現頻率較低(智人的TAG,23%;TAA,30%;TGA,47%),所以在哺乳動物細胞中無義琥珀抑制應當比蛋白石或赭石抑制更加耐受。因為真核生物中5對RNAg,基因的表達也依賴于5'側接序列,所以將人tRNA^的5'側接序列加到^tRNA^上以增強其在哺乳動物中的轉錄。為進一步增加5對RNA然,的轉錄,構建了含三個串連重復的5dRNA^基因的基因簇,將該基因簇插入到pUC18質粒中得到pUC18-35對RNA^。對提取自pUC18-35stRNA^轉染CHO細胞的總tRNA進行Northern印跡分析,顯示RrtRNA^的水平是僅含單一拷貝5rtRNA^的pUC18質粒轉染細胞的兩倍。正交合成酶的表達下一步,將野生型EcTyrRS基因插入哺乳動物表達載體pcDNA4/TO/myc-HisA中得到pcDNA4-五cTyrRS,其表達受到四環素(Tet)-調節的CMV啟動子的控制。使用誘導型表達意在降低在哺乳動物細胞中異源表達五cTyrRS可能產生的毒性。展示功能性五cTyrRS/BstRNA忠力正交對在哺乳動物細胞中檢測所得抑制子&tRNA〖^/£cTyrRS對有效抑制模型綠色熒光蛋白GFP(GFP37TAG)Y37位的琥珀密碼子突變的能力。因為Y37位于GFP表面,并遠離熒光團,因此預計在此位點引入非天然氨基酸不會影響蛋白的折疊和熒光屬性(Ormo等(1996),"水母04e《wo^flv/cto^綠色熒光蛋白的晶體結構"(CrystalstructureoftheJegworeav/"on'agreenfluorescentprotein)&/ece273:1392-1395)。并且GFP37TAG的琥珀抑制導致全長GFP表達,提供快速定量測定琥珀抑制效率的實驗方法。將突變GFP37TAG基因插入pcDNA4/TO/myc-HisA得到pcDNA4-GFP37TAG,其中GFP與myc和6xHis表位在C末端融合,并處于Tet-調節的啟動子的控制下。在英杰tmT-RExTM嚙齒類CHO和人293細胞中檢測fetRNA^/五cTyrRS對抑制GFP37TAG無義琥珀密碼子的能力。兩種細胞系均組成型表達四環素阻抑物并適合使用pcDNA4/TO/myc-HisA質粒進行Tet-調節的蛋白表達。細胞生長至80-90。/。鋪滿(英杰tmT-RExCHO細胞生長于含10%FBS、1%青鏈霉素、2mML-谷氨酰胺、10pg/ml殺稻瘟素的F12培養基中;英杰頂T-RExTM293細胞生長于含10%FBS、1%青鏈霉素、2mML-谷氨酰胺和5pg/ml殺稻瘟素的DMEM中),使用羅氏應用科學部(RocheAppliedScience)的FuGENE⑧進行瞬時轉染,每2x106個細胞使用3嗎質粒(0.5|igpUC18-3&tRNA^、0.5嗎pcDNA4UyrRS、2(igpcDNA4-GFP37TAG;當pUC18-3&tRNAg;或pcDNA4-EcTyrRS不存在時用等量pUC18替換)。轉染6小時后加入1|ig/ml四環素誘導蛋白質表達,細胞在37。C生長兩天。在兩種細胞系中,全長GFP的表達依賴于5rfRNA^和EcTyrRS基因的存在(參見圖13A和13B)。當用pcDNA4-GFP37TAG和pcDNA4-£cTyrRS或單獨pUC18-3&tRNA^轉染時,細胞不呈現綠色熒光。這些實驗證明,僅五cTyrRS使AtRNA〖^獲得負載,并且fctRNA〖^/五cTyrRS對在靈長類細胞和嚙齒類細胞中有效行使抑制無義琥珀密碼子的功能。實施例3用6種非天然氨基酸證明系統的普遍性驗證該正交系統的一般性。在該測試系統中,檢測了5對RNA〖^和6種五cTyrRS変體在英杰tmT-RExCHO和293細胞系中將各種對應的非天然氨基酸摻入GFP37TAG的能力。6種五cTyrRS變體最初在釀酒酵母中演化并編碼下列非天然氨基酸對-甲氧基-L-苯丙氨酸(pMpa);對-乙酰基-L-苯丙氨酸(pApa);對-苯甲酰-L-苯丙氨酸(pBpa);對-碘代-L-苯丙氨酸(plpa);對-疊氮基-L-苯丙氨酸(pAzpa);對-炔丙基氧基苯丙氨酸(pPpa)圖1結構1-6顯示了這些非天然氨基酸的結構。選擇和分離這些合成酶變體的方法參見例如Chin等(2003),"擴展的真核遺傳密碼"(Anexpandedeukaryoticgeneticcode)Sc/ewce301,964-967;Deiters等(2003),"在釀酒酵母的遺傳密碼中力卩入新反應性的氨基酸"(AddingaminoacidswithnovelreactivitytothegeneticcodeofiSacc/zarowycescerev/s/ae)J"CTzem<Soc125:11782-11783;Deiters,2004年4月16日提交的WO2005/003294"非天然反應性氨基酸遺傳密碼增加"(UNNATURALREACTIVEAMINOACIDGENETICCODEADDITIONS);Deiters,2膨牟9y727:連爻游WO2006/034410"在遺傳密碼中加入光調節性氨基酸"(ADDINGPHOTOREGULATEDAMINOACIDSTOTHEGENETICCODE)。將6種AcTyrRS基因中的每一種插入到pcDNA4/TO/myc-HisA中得到pcDNA4-五cTyrRS衍生物,Western印跡分析aaRS在T-RExCHO和293細胞中的表達(圖14)。所有6種EcTyrRS變體在T-RExCHO和T-RExTM293細胞中顯示相似的表達水平。然后在培養基中存在或不存在非天然氨基酸的條件下檢測6種五cTyrRS變體和^tRNA^—起抑制GFP37TAG中琥珀密碼子的能力。如對野生型EcTyrRS所述用質粒瞬時轉染細胞。轉染6小時后,換用新鮮培養基,其中含1嗎/ml四環素并補充相應的非天然氨基酸(pMpa,10mM;pApa,10mM;pBpa,ImM;plpa,8mM;pAzpa,5mM;或pPpa,1mM)。T-RExTMCHO細胞培養24小時,T-RExTM293細胞培養48小時,然后收獲細胞。在T-RExTMCHO和293細胞中,全長GFP37TAG的表達依賴于生長培養基中非天然氨基酸的存在,如圖2和3所示。在缺少非天然氨基酸時,未檢測到GFP表達(〈1。/。),表明EcTyrRS變體特異性、高保真地使S對RNA^攜帶其關聯非天然氨基酸。觀察到T-RExCHO細胞中含plpaGFP表達水平低,而在T-REx293細胞中無含plpaGFP表達,這也許是因為plpa有細胞毒性(在8mMplpa存在條件下,T-RExTM293細胞在6小時內死亡)。實施例4表達摻入對-甲氧基-L-苯丙氨酸的正交組件的改良質粒表達系統因為異源表達對-甲氧基-L-苯丙氨酸-tRNA合成酶(pMpaRS)在所用生長條件下未顯示出任何明顯的細胞毒性,因此修飾含pMpaRS基因的質粒,以編碼(a)3個串聯重復的^tRNA^基因,以及(b)pMpaRS基因(圖4A中pSWAN-pMpaRS)。在非調節CMV啟動子后直接插入pMpaRS基因用于有效持續表達pMpaRS。構建另一質粒(圖4B中pSWAN-GFP37TAG),同時含有三個串聯重復&tRNA^基因和GFP37TAG基因。在Tet-調節的CMV啟動子后插入編碼GFP37TAG的基因以最小化哺乳動物細胞內源性琥珀抑制引起的無義琥拍密碼子通讀的可能。然后檢測這兩個質粒的抑制效率。因為兩個質粒均含有三個串聯重復的5對RNAg,基因,所以預計無法通過改變兩種質粒的比例增加抑制水平來改變轉染細胞的^rtRNAg,基因的總量。在優化的轉染條件下(每2x106個細胞O.5嗎pSWAN-pMpaRS和2.5嗎pSWAN-GFP37TAG),抑制水平大概是使用三個質粒pUC18-35對RNA^、pcDNA4-pMpaRS和pcDNA4-GFP37TAG的兩倍(通過熒光細胞數測定抑制水平)。誘導后細胞生長1-2天,在收集前保持活力。對含pMpa的突變GFP(GFP-pMpa)的產量進行定量。在培養基中存在10mMpMpa時,可從2x107個貼壁T-RExTMCHO細胞中得到1|_ig突變GFP。實施例5質譜和保真度分析為進一步鑒定GFP-pMpa,在用pSWAN-pMpaRS和pSWAN-GFP37TAG瞬時轉染的T-RExCHO細胞中表達突變蛋白。用抗-myc抗體瓊脂糖柱純化蛋白并用SDS-PAGE分離。用胰蛋白酶消化來自SDS-PAGE凝膠的GFP-pMpa條帶并用納米反相液相層析/質譜/質譜(納米-RPLC/MS/MS)進行分析。平行的,從轉染pcDNA4-GFP的細胞中純化野生型GFP并進行相同分析。含片段FSVSGEGEGDATY*GK(參見圖5和SEQIDNO:103,其中Y*代表酪氨酸或pMpa)的突變蛋白的胰蛋白酶解Y37的串聯質譜圖揭示了強pMpa峰,表明有效的pMpa摻入(參見圖6和圖7)。與野生型GFP相比,含離子(ys-yi4)的Y+都發生14Da的質量漂移,這與酪氨酸和pMpa的質量差準確吻合。Y離子系列的質量漂移以及圖7中觀察到bn離子的相同質量漂移明確指示了pMpa的摻入位點是GFP的37位。也獲得了含pMpa肽和含酪氨酸肽的MS峰的比值。FSVSGEGEGDATY*GK(參見圖5和SEQIDNO:103)前體離子的單一離子色譜的積分表明pMpa摻入的高保真度(>99.9%)。根據監測串聯質譜數據中3個最豐富的片段離子(y9、yn和yu)作出的推測表明甚至更高的純度(99.93。/c0。為了獲取親本蛋白的質量,將抗-myc抗體柱純化的突變蛋白進行ESITOF-MS分析。缺少N-末端甲硫氨酸的乙酰化突變蛋白的理論質量為29,696.00Da,這與圖8中帶電態解巻積ESITOF-MS譜觀察到的29,696.0Da的主要組分良好吻合。29,654.0Da的一個較小特征峰指定為缺少N-末端乙酰化的GFP-pMpa的質量。未檢測到野生型GFP信號或表明摻入多個pMpa的信號。該結果進一步確認在GFP37位選擇性摻入pMpa。實施例6用于表達摻入pApa、pBpa、plpa、pAzpa和pPpa的正交組件的改良質粒表達系統通過亞克隆編碼不同合成酶變體的基因重新工程改造質粒,以提供其它pSWAN-EcTyrRS變體雙質粒系統。這些合成酶變體為對-乙酰基-L-苯丙氨酸-tRNA合成酶(pApaRS)對-苯甲酰-L-苯丙氨酸-tRNA合成酶(pBpaRS)對-碘代-L-苯丙氨酸-tRNA合成酶(pIpaRS)對-疊氮基-L-苯丙氨酸-tRNA合成酶(pAzpaRS)對-炔丙基氧基-L-苯丙氨酸-tRNA合成酶(pPpaRS)pSWANUyrRS變體和pSWAN-GFP37TAG(每2xl06個細胞0.5嗎pSWAN-五cTyrRS變體和2.5嗎pSWAN-GFP37TAG)瞬時轉染T-RExCHO和293細胞所提供的抑制水平均為三種質粒pUC18-3BMRNA^、pcDNA4-五cTyrRS變體和pcDNA4-GFP37TAG轉染時的大約兩倍(plpa特異性變體除外)。也在pSWAN-五cTyrRS變體和pSWAN-GFP37TAG轉染的T-RExCHO細胞中表達含pApa、pBpa、pAzpa或pPpa的突變GFP,在含對應非天然氨基酸的培養基(pApa,10mM;pBpa,1mM;pAzpa,5mM或pPpa,1mM)中培養細胞l-2天,并用抗-myc抗體柱純化。含pApa和pAzpa突變蛋白的產率與pMpa接近(每2x107個細胞約1pg蛋白),含pBpa和pPpa突變蛋白的產率較低(每2x107個細胞0.7|ig蛋白)。因為五cTyrRS變體在T-RExCHO細胞中的表達水平相似,所以含pBpa和pPpa突變蛋白的產率較低也許是因為培養基中非天然氨基酸濃度較低。同樣利用納米-RPLC/MS艇S分析突變GFP蛋白,獲取胰蛋白酶解片段FSVSGEGEGDATY*GK(圖5和SEQIDNO:103)的串聯質譜圖。串聯質譜數據(圖9-12)清楚顯示在GFP37位摻入非天然氨基酸。僅可檢測到微弱的含pAzpa的突變GFP。更仔細的分析數據揭示了存在含對-氨基苯丙氨酸的肽(圖15),考慮到疊氮基的化學反應性和光不穩定性這不足為奇(曾經從含pAzpa肽的質譜分析中觀察到pAmpa;Chin等(2003),"擴展的真核遺傳密碼進展"(Progresstowardanexpandedeukaryoticgeneticcode)CTzew5/o/10,5U-519)。鑒別出pBpa樣品中痕量的野生型肽,但信號太弱無法準確計算pBpa/酪氨酸比值。在pApa、pAzpa和pPpa樣品中未探測到野生型信號。來自所有5種突變蛋白的數據表明非天然氨基酸摻入的高選擇性和保真度。實施例7討論/結論在哺乳動物基因組中,琥珀終止密碼子的出現頻率較高(人23%),而大腸桿菌相比較低(7%)。因此,如果必需蛋白未被正確終止,琥珀抑制也許具有細胞毒性。Yokoyama和同事證明,使關聯tRNA攜帶3-碘代-L-酪氨酸的突變五cTyrRS的誘導表達將可能的細胞毒性降到最低,這種毒性來自在缺少3-碘代-L-酪氨酸時突變aaRS造成的內源性酪氨酸背景摻入。本發明提供了該問題的解決方案。所有五cTyrRS變體都曾在釀酒酵母中由兩步正向/負向選擇方案演化,從而去除了摻入內源性氨基酸的aaRS變體。pSWAN-£cTyrRS變體和pSWAN-GFP37TAG共轉染細胞后,在缺少非天然氨基酸的條件下觀察不到GFP37TAG中無義琥珀密碼子的通讀,表明在缺少非天然氨基酸的條件下tRNA/aaRS對不足以有效抑制天然TAG終止密碼子。因此在缺少非天然氨基酸的條件下穩定表達tRNA和aaRS蛋白的細胞系能夠存活。因為未觀察到內源性琥珀抑制,含非天然氨基酸的靶蛋白的表達也無須誘導。產生維持tRNA、aaRS和耙蛋白基因的穩定細胞系能夠在補充非天然氨基酸時有效產生含非天然氨基酸的靶蛋白。在當前所述原理論證實驗中,宿主哺乳動物細胞能夠存活至加入非天然氨基酸3天后,這大概足夠重組蛋白的表達。這些實驗已成功擴展到其它非天然氨基酸中,包括1,5-丹磺酰丙氨酸、鄰-硝基芐基半胱氨酸和(x-氨基辛酸。并不意味本發明僅限于本文所述細胞系或非天然氨基酸。實施例8哺乳動物細胞中的光調節性蛋白序列在要求保護的翻譯系統和方法的一些實施方式中,所述非天然氨基酸是光調節性氨基酸,如鄰-硝基芐基絲氨酸、鄰-硝基芐基半胱氨酸、(X-氨基辛酸及其它。可使用光調節性氨基酸(如光致變每的、光切割的、光異構化的等)從空間和時間上控制許多生物學過程,如通過直接調節酶、受體、離子通道等的活性,或通過調節不同信號分子的細胞內濃度。參見,如Shigeri等,尸/zwmaco/.7Tzera;e化,2001,91:85+;Curley等,尸/zarmaco/.77zera/ew"1999,82:347+;Curley等,CwmQp.Oiem.1999,3:84+;"籠蔽化合物"(CagedCompounds)《酶學方法》(MethodsinEnzvmologv),Marriott,G.編,科學出版社,紐約,1998,291巻;Adams等,j臓.化v.尸—。/"1993,55:755+;以及Bochet等,/Oem.6bc.,尸erh7z2002,125+。為了提高源自大腸桿菌tRNALeu的琥珀抑制子tRNA的轉錄水平,將抑制子tRNA置于人起始子(initiator)tRNAMet5,-和3,-側接序列的控制之下。在CHO細胞和人293T細胞中使用過度轉錄的琥珀抑制子tRNA以及對鄰-硝基芐基半胱氨酸有特異性的突變大腸桿菌亮氨酰-tRNA合成酶將該非天然氨基酸定點摻入人胱冬酶原-3活性位點。在鄰-硝基節基半胱氨酸存在條件下表達蛋白,然后將細胞暴露于紫外線5分鐘觸發細胞死亡,表明紫外線誘導從非天然半胱氨酸殘基上切割硝基芐基,恢復了胱冬酶原-3的活性,觸發了細胞凋亡。該實驗證實了在活哺乳動物細胞中用鄰-硝基芐基半胱氨酸選擇性取代蛋白質中的活性位點半胱氨酸可用于,例如,通過使用諸如紫外線等從空間上控制蛋白活性。用具有不同反應性位點基團的蛋白可獲取相似結果(例如,在絲氨酸蛋白酶活性位點殘基上使用-/TJ^If^^A^^o關于光籠蔽和光調節氨基酸的進一步細節可在如下PCT公開文本中找到WO2006/034410,Dieters等(2006年3月30日),"在遺傳密碼中加入光調節性氨基酸"(ADDINGPHOTOREGULATEDAMINOACIDSTOTHEGENETICCODE),通過引用將其內容整體納入本文。實施例9材料和方法:哺乳動物細胞轉染和Western印跡分析T-RExTMCHO和T-RExTM293細胞(英杰TM)組成型表達四環素抑制子,其調節插入pcDNA4/TO/myc-HisA質粒的基因的表達。用含10%FBS(英杰頂)、1。/。青鏈霉素(英杰tm)、2mML-谷氨酰胺(英杰tm)和io昭/ml系稻瘟素(英杰tm)的F-12培養基(英杰tm),在含5%C02的37°C潮濕環境中培養T-RExCHO細胞。用含有10n/。FBS、1%青鏈霉素、2mML-谷氨酰胺和5ng/ml殺稻瘟素的吉布科D-MEM培養基(英杰tm),在含5%C02的37°C潮濕環境中培養T-REx293細胞。細胞在克斯塔(Costarf6-孔培養板中生長至80-90%鋪滿,然后利用質粒和FuGENE6(羅氏應用科學部)(9piFuGENE+3|ig質粒)進行轉染。轉染6小時后,換成含1|ig/ml四環素的新鮮培養基。為了檢測在對應非天然氨基酸存在下EcTyrRS變體的琥珀抑制,在新鮮培養基中加入非天然氨基酸。培養基中非天然氨基酸的濃度為10mMpMpa(巴凱公司(Bachem,Inc》、10mMpApa(新凱公司(Synchem,Inc))、1mMpBpa(巴凱公司)、8mMpIpa(巴凱公司)、5mMpAzpa(巴凱公司)以及1mMpPpa。如前所述合成手性純pPpa(Deiters等(2003),"在釀酒酵母的遺傳密碼中加入具有新反應性的氨基酸"(AddingaminoacidswithnovelreactivitytothegeneticcodeofiSWcc/wrowycescereWw'ae)C7zem<Sbc125:11782-11783)。在力卩入四環素后繼續培養T-RExCHO細胞24小時,收集細胞;T-RExTM293細胞則在孵育48小時后收集。為了進行Western印跡分析,在含1:100稀釋的蛋白酶抑制劑混合物(西格瑪公司(sigma))的RIPA緩沖液(UB公司/密理博公司(UpstateBiotechnology/Millipore))中裂解收集的細胞。在變性條件下用SDS-PAGE分離上清,并轉移到0.45fim硝酸纖維素膜(英杰tm)上。對于T-RExTMCHO細胞,固化于膜上的蛋白質用抗-myc抗體(英杰tm;1:5000稀釋)作為一抗,抗-小鼠IgG-HRP(英杰tm)作為二抗進行檢測。用皮爾斯公司(PIERCE)ECLWestern印跡底物進行化學發光檢測。對于T-RExTM293細胞,用抗-His-HRP(英杰tm;1:5000稀釋)探測并用皮爾斯公司(P正RCE)ECLWestern印跡底物進行檢測材料和方法細菌細胞轉染使用前10位的大腸桿菌細胞(英杰tm)克隆、維持并擴增質粒。使用P/c高保真DNA聚合酶(英杰tm)進行聚合酶鏈反應(PCR)。使用FuGENE6(羅氏應用科學部)作為轉染試劑。所有質粒均經測序校驗。實施例10材料和方法質粒構建PUC18-355TRNA^通過使四種寡聚脫氧核苷酸退火構建^tRNAg,基因(集成DNA技術公司(IntegratedDNATechnologies,Inc))。該基因由缺少人tRNA7"基因的3'-CCA和5'-側接序列的相應tRNA序列組成(SEQIDNO:104)將兩個限制性位點整合到合成DNA雙鏈體中,五coi/整合入5'端,Sam歷整合入3'端,然后將其插入pUC18得到pUC18-5對RNA^。然后,通過PCR擴增pUC-5對RNA^中的^tRNA^。將5'端含有5g///限制性位點且3'端含有5flm/Z/位點的擴增的&tRNA^插入pUC18-B對RNA^的Bami//限制性位點中,得到pUC18-2BstRNA[:。質粒pUC18-25stRNA^僅含有一個5ami//限制性位點,用該位點引入另一個拷貝的5rtRNA^,得到pUC18-35對RNA^。通過PCR擴增p£"cTyrRS/tRNACUA得到五cTyrRS和其六種變體(Chin等(2003),"擴展的真核遺傳密碼"(Anexpandedeukaryoticgeneticcode),Sc/e"ce301:964-967),然后將其插入pcDNA4/TO/myc-HisA質粒(英杰(Invitrogen)TM)的力a/和^a/位點中,得到pcDNA4-五cTyrRS載體。將五cTyrRS基因設置在兩個四環素操縱子序列和CMV啟動子之后,CMV啟動子能在英杰TMT-RExTM細胞系中指導四環素調節的基因表達。也將它們連接于c-myc表位,以便進行Western印跡分析。六種五cTyrRS變體中的突變是pMpaRS:Y37V/D182S/F183MpApaRS:Y37I/D182G/F183M/L186ApBpaRS:Y37G/D182G/F183Y/L186MpIpaRS:Y37I/D183S/F183MpAzpaRS:Y37L/D182S/F183M/L186ApPpaRS:Y37S/D182T/F183M/L186VpcDNA4-JgcTvrRS和pcDNA4-GFP37TAG將野生型增強的GFP基因插入載體pcDNA4/TO/myc-HisA的^&a/和j;a/位點內,產生pcDNA4-GFP。在pcDNA4-GFP中,在C末端將該GFP基因與myc表位和6xHis標簽連接,以便對表達的蛋白質進行Western印跡分析和親和純化。通過(^^1^11&1^6@定點誘變試劑盒(司查塔基公司(8&&1&§6116))產生Y37的三聯體密碼子突變成TAG琥珀密碼子的質粒cDNA4-GFP37TAG。pSWAN-五cTvrRS變體和pSWAN-GFP37TAG為了構建pSWAN-汝TyrRS變體,利用5am///和五coi7限制性酶由pUC18-3&tRNA^分離3&tRNA^,將其插入pcDNA3.1/hygro(+)(英杰頂)的5g/7/和Tl^e/位點中,得到pcDNA-35stRNA^。然后,將編碼此六種五cTyrRS變體的基因插入pcDNA-3&tRNA^的^a/和^a/位點中,得到pSWANUyrRS變體。為了產生pSWAN-GFP37TAG,擴增pSWANUyrRS載體并用Mw/和戶c//限制性酶消化。通過瓊脂糖凝膠電泳分離消化的片段,通過QIAquicl^凝膠純化試劑盒(凱杰(QIAGENf)純化含有3ArtRNA^的片段。通過PCR擴增從CMV啟動子到BGH聚A位點的pcDNA4-GFP37TAG片段,用M"/和尸c//限制性酶消化,然后與含有3S對RNA^的pSWAN-五cTyrRS片段連接,得到pSWAN-GFP37TAG(4000bp)。實施例11材料和方法蛋白質表達和純化利用pSWAN-五cTyrRS變體和pSWAN-GFP37TAG表達含有非天然氨基酸的突變GFP。在75cm4且織培養瓶(BD生物科學公司(BDBiosciences))中培養T-RExCHO細胞(英杰tm)至80-90%鋪滿,用60piFuGENE6以及2嗎pSWAN-五cTyrRS和10嗎pSWAN-GFP37TAG轉染。培育過夜后,將培養基更換為含有非天然氨基酸(pMpa,10mM;pApa,10mM;pBpa,1mM;pAzpa,5mM;和pPpa,1mM)和1(ig/ml四環素的新鮮培養基。然后,37°C培養細胞l-2天,收獲細胞,用RIPA裂解緩沖液裂解。細胞裂解物的上清液用PBS緩沖液透析和平衡,然后加載到抗-myc抗體瓊脂糖柱(西格馬公司(Sigma))上。用15倍柱體積的PBS緩沖液洗柱,然后用O.lM氫氧化銨洗脫。純化的蛋白質用0.1M乙酸中和,并用SDS-PAGE分析。剪下對應于GFP的條帶進行質譜分析。為了測定產率和獲得完整蛋白質質譜,洗脫后將該蛋白濃縮至0.1mg/ml。實施例12材料和方法蛋白酶解用測序級改良的胰蛋白酶(普洛麥格公司(Promega》于37°C培育蛋白質過夜,以便使親和純化的蛋白質發生蛋白酶解(對野生型和pBpa樣品進行這種操作),其中根據100mM三乙銨碳酸氫鹽緩沖液(pH8.5)中的蛋白質濃度估計值,底物/酶的比例為10:1(wt/wt)。按照改良的EMBL方法(參見德國海德爾堡(Heidelberg,Germany)的EMBL的網站,生物分析研究組(BioanalyticalResearchGroup))進行凝膠中消化(對pMpa、pAzpa、pApa和pPpa樣品進行)。簡要說,將凝膠塊切成約1mmx1mm的小塊,用水洗滌5分鐘,用乙腈洗滌15分鐘,真空離心干燥,然后用50mM三乙銨碳酸氫鹽緩沖液(pH8.5)配制的12.5納克/微升測序級改良的胰蛋白酶在0°C再水化30分鐘。去除過量緩沖液,將20微升50mM三乙銨碳酸氫鹽緩沖液(pH8.5)加入該凝膠塊,然后于37°C培育過夜。如方案部分所述從所述凝膠塊中提取肽。實施例13材料和方法納米-RPLC/MS/MS用HPLC泵、自動取樣器(加州帕洛阿爾托的安捷倫技術公司(AgilentTechnologies,PaloAlto,CA))和LTQOrbitmp雜交質譜用儀(加州圣何塞的熱電公司(ThermoElectron,SanJose,CA))進行納米-RPLC/MS/MS。用壓力泵(pressurebomb)將胰蛋白酶消化物加載到內徑為75微米的預裝4厘米5微米MonitorC18顆粒的預裝柱(加州安大略的柱工程公司(ColumnEngineering,Ontario,CA))上,流速約為2微升/分鐘。然后,將該預裝柱連接于HPLC泵,用溶劑A洗滌數分鐘后,串聯集成有發射尖頭(emittertip)的分析柱(360微米外徑x75微米內徑;10厘米5微米C18,5微米尖頭)。用100%溶劑A(0.1%乙酸水溶液)至50%溶劑B(0.1%乙酸的乙腈溶液)進行色譜40分鐘;通過分析柱的流速約為100納升/分鐘。在依賴數據的實驗中,在質譜儀上設定程序,以便首先記錄高分辨Orbitrap掃描,然后記錄全掃描離子阱譜(m/z500-2,000)。然后進行10次依賴數據的MS/MS掃描(相對碰撞能量二35。/。;3-Da分離窗),觸發離子阱掃描,最后是兩次耙定MS/MS掃描。第一次靶定MS/MS掃描能分離和片段化預測的非天然氨基酸修飾肽(FSVSGEGEGDATY'GK;SEQIDNO:103)的雙電荷前體離子。第二次靶定MS/MS掃描總是能分離和片段化野生型肽(FSVSGEGEGDATYGK;SEQIDNO:102)的雙電荷前體離子,其m/z為752.3。用MASCOT(英國倫敦的MS公司(Matrixscience,London,UK))搜索MSDB數據庫的原始數據,以便隨著變量改變鑒定蛋白質和發現包含含有非天然氨基酸的靶肽的掃描。為了估計GFP-pMpa的Y*37上的保真度,用Xcalibur軟件包(力口州圣何塞的熱電公司)對單一離子色譜(野生型雙電荷前體離子的m/z為752.3,pMpa雙電荷前體離子的m/z為759.3)和所選離子色譜(y9、yu和》2)進行積分。在裝有自動取樣器的毛細管LC和QTOF2質譜儀組成的自動化LC/MS系統(馬薩諸塞州米爾福德沃特公司(Waters,Milford,MA))上獲得完整蛋白質質譜。將GFP-pMpa(O.lmg/ml)加載到反相蛋白質Captrap(加州奧本的MB公司(MichromBioresources,Auburn,CA))上,用0.1%乙酸水溶液脫鹽,并用80%乙腈/0.1%乙酸以5微升/分鐘的速率洗脫到質譜儀的ESI源中。利用MassLynx(馬薩諸塞州米爾福德沃特公司)軟件包,以MaxEntl算法對譜圖進行求和、平滑和解巻積處理。實施例14哺乳動物轉錄的啟動子在哺乳動物細胞中,tRNA轉錄的強啟動子包括大腸桿菌阻抑物tRNALeu5(CUAW々5'側接序列GATCCGACCGTGTGCTTGGCAGAAC(SEQIDNO:105)和大腸桿菌阻抑物tRNALe,CUA)的3'側接序列GTCCTTTTTTTG(SEQIDNO:106)。承*氺雖然出于闡述和理解的目的詳細描述了上述發明,但本領域技術人員應明了,通過閱讀該公開,可在不背離本發明真實范圍的情況下對其形式和細節進行各種改變。通過引用將本申請引用的所有發表物、專利、專利申請和/或其它文件全文納入本文用于所有目的,其程度就好像通過引用將各篇發表物、專利、專利申請和/或其它文件單獨納入本文用于所有目的那樣。權利要求1.一種翻譯系統,其包括(a)選自下組的第一非天然氨基酸i)對-甲氧基苯丙氨酸(pMpa);ii)對-乙酰基苯丙氨酸(pApa);iii)對-苯甲酰苯丙氨酸(pBpa);iv)對-碘代苯丙氨酸(pIpa);v)對-疊氮基苯丙氨酸(pAzpa);vi)對-炔丙基氧基苯丙氨酸(pPpa);vii)α-氨基辛酸;viii)鄰-硝基芐基半胱氨酸(o-NBC);ix)1,5-丹磺酰丙氨酸;和x)鄰-硝基芐基絲氨酸(o-NBS);(b)第一正交tRNA(O-tRNA);(c)衍生自真細菌氨酰-tRNA合成酶的第一正交氨酰-tRNA合成酶(O-RS),其中所述O-RS優先用所述非天然氨基酸氨酰化所述O-tRNA;和(d)包含(a)、(b)和(c)的宿主細胞,所述細胞選自嚙齒動物細胞或靈長動物細胞。2.如權利要求1所述的翻譯系統,其特征在于,所述第一O-RS優先用所述第一非天然氨基酸氨酰化所述第一O-tRNA,其效率至少為包含所述0-tRNA、所述非天然氨基酸和含有選自SEQIDNO:57-101的氨基酸序列的氨酰-tRNA合成酶的翻譯系統效率的50%。3.如權利要求1所述的翻譯系統,其特征在于,所述第一O-tRNA包含SEQIDNO:3所示的多核苷酸序列或由其編碼。4.如權利要求1所述的翻譯系統,其特征在于,所述第一O-RS衍生自大腸桿菌氨酰-tRNA合成酶。5.如權利要求1所述的翻譯系統,其特征在于,所述第一O-RS包含選自SEQIDNO:57-101的氨基酸序列或其保守變體。6.如權利要求1所述的翻譯系統,其特征在于,所述宿主細胞還包含編碼感興趣蛋白質的核酸,所述核酸包含至少一個選擇者密碼子,其中所述選擇者密碼子被所述第一O-tRNA識別。7.如權利要求6所述的翻譯系統,其特征在于,所述宿主細胞還包含不同于所述第一非天然氨基酸的第二非天然氨基酸、第二O-RS和第二O-tRNA,其中所述第二O-RS優先用所述第二非天然氨基酸氨酰化所述第二O-tRNA,所述第二O-tRNA識別由核酸編碼的選擇者密碼子,其不同于所述第一O-tRNA識別的選擇者密碼子。8.如權利要求1所述的翻譯系統,其特征在于,所述宿主細胞包含編碼所述第一O-RS的多核苷酸。9.如權利要求8所述的翻譯系統,其特征在于,所述多核苷酸包含選自SEQIDNO:8-56的核苷酸序列。10.如權利要求l所述的翻譯系統,其特征在于,所述宿主細胞包含編碼所述第一O-tRNA的多核苷酸。11.如權利要求1所述的翻譯系統,其特征在于,所述嚙齒動物宿主細胞選自大鼠宿主細胞或小鼠宿主細胞。12.如權利要求1所述的翻譯系統,其特征在于,所述靈長動物宿主細胞選自人宿主細胞、黑猩猩宿主細胞、倭黑猩猩宿主細胞、大猩猩宿主細胞、猩猩宿主細胞、長臂猿宿主細胞、短尾猿宿主細胞、絹毛猴宿主細胞或狨宿主細胞。13.如權利要求l所述的翻譯系統,其特征在于,所述嚙齒動物宿主細胞是CHO宿主細胞。14.如權利要求l所述的翻譯系統,其特征在于,所述靈長動物宿主細胞是293T宿主細胞。15.—種產生在選定位置含有非天然氨基酸的蛋白質的方法,所述方法包括(a)提供(i)選自下組的第一非天然氨基酸A)對-甲氧基苯丙氨酸(pMpa);B)對-乙酰基苯丙氨酸(pApa);C)對-苯甲酰苯丙氨酸(pBpa);D)對-碘代苯丙氨酸(plpa);E)對-疊氮基苯丙氨酸(pAzpa);F)對-炔丙基氧基苯丙氨酸(pPpa);G)a-氨基辛酸;H)鄰-硝基芐基半胱氨酸(o-NBC);I)1,5-丹磺酰丙氨酸;和J)鄰-硝基芐基絲氨酸(o-NBS);(ii)第一正交tRNA(O-tRNA);(iii)第一正交氨酰-tRNA合成酶(O-RS),其中所述第一O-RS優先用所述非天然氨基酸氨酰化所述第一O-tRNA;(hO編碼所述蛋白質的核酸,其中所述核酸包含至少一個所述第一O-tRNA識別的選擇者密碼子,該選擇者密碼子在所述核酸中的位置對應于所述蛋白質的所選位置;和(v)包含(i)、(ii)、(iii)和(iv)的宿主細胞,所述宿主細胞選自嚙齒動物細胞或靈長動物細胞;和(b)在所述蛋白質翻譯期間,在所述非天然氨基酸、O-tRNA和O-RS存在下,響應所述選擇者密碼子而將所述非天然氨基酸摻入所述蛋白質中的所述所選位置,從而產生在所述所選位置上含有所述非天然氨基酸的所述蛋白質。16.如權利要求15所述的方法,其特征在于,所述第一O-RS優先用所述第一非天然氨基酸氨酰化所述第一O-tRNA,其效率至少為包含所述0-tRNA、所述非天然氨基酸和含有選自SEQIDNO:57-101的氨基酸序列的氨酰-tRNA合成酶的翻譯系統效率的50%。17.如權利要求15所述的方法,其特征在于,所述第一O-tRNA包含SEQIDNO:3所示的多核苷酸序列或由其編碼。18.如權利要求15所述的方法,其特征在于,提供第一O-RS包括提供編碼所述第一O-RS的多核苷酸。19.如權利要求15所述的方法,其特征在于,所述第一O-RS衍生自大腸桿菌氨酰-tRNA合成酶。20.如權利要求15所述的方法,其特征在于,所述第一O-RS包含選自SEQIDNO:57-101的氨基酸序列或其保守變體。21.如權利要求15所述的方法,其特征在于,所述提供第一O-RS包括提供編碼所述O-RS的多核苷酸。22.如權利要求21所述的方法,其特征在于,所述多核苷酸包含選自SEQIDNO:8-56的核苷酸序列。23.如權利要求15所述的方法,其特征在于,所述提供第一O-RS包括通過定點誘變技術突變野生型氨酰-tRNA合成酶的氨基酸結合口袋,和選擇優先用所述第一非天然氨基酸氨酰化所述第一O-tRNA的所得的O-RS。24.如權利要求23所述的方法,其特征在于,所述選擇步驟包括在定點誘變后從得到的氨酰-tRNA合成酶分子庫中正向和負向選擇所述第一O-RS。25.如權利要求15所述的方法,其特征在于,所述提供第一O-tRNA包括提供編碼所述第一O-tRNA的多核苷酸。26.如權利要求15所述的方法,其特征在于,所述蛋白質包含不同于所述第一非天然氨基酸的第二非天然氨基酸,所述方法還提供所述第二非天然氨基酸、第二O-RS和第二O-tRNA,其中所述第二O-RS優先用所述第二非天然氨基酸氨酰化所述第二O-tRNA,所述第二O-tRNA識別核酸中的選擇者密碼子,其不同于所述第一O-tRNA識別的選擇者密碼子。27.如權利要求15所述的方法,其特征在于,所述摻入步驟包括培養所述宿主細胞。28.如權利要求15所述的方法,其特征在于,所述第一非天然氨基酸包括光籠蔽氨基酸,所述方法還包括使所述宿主細胞暴露于紫外線。29.如權利要求29所述的方法,其特征在于,使所述宿主細胞暴露于紫外線能夠從空間上控制所述宿主細胞中的蛋白質活性。全文摘要本發明涉及能在哺乳動物宿主細胞,如靈長類宿主細胞和嚙齒動物細胞中將非天然氨基酸摻入蛋白質的tRNA和氨酰-tRNA合成酶的正交對。本發明提供,例如但不限于包括宿主細胞(如靈長類或嚙齒類細胞),衍生自真細菌合成酶的正交氨酰-tRNA合成酶、正交tRNA以及非天然氨基酸的翻譯系統。本發明還涉及在哺乳動物宿主細胞系統中產生含有至少一個非天然氨基酸的感興趣蛋白質的方法。文檔編號C07K14/00GK101535338SQ200780039015公開日2009年9月16日申請日期2007年10月17日優先權日2006年10月18日發明者P·G·舒爾茨,劉文設申請人:斯克利普斯研究院