專利名稱::與組氨酰-tRNA合成酶的蛋白片段相關的治療、診斷和抗體組合物的創新發現的制作方法
技術領域:
:本發明大體涉及包含氨酰-tRNA合成酶和其他蛋白的新鑒定的蛋白片段的組合物,編碼它們的多核苷酸及其互補物,相關劑,及其在診斷、藥物發現、研究和治療應用中的使用方法。
背景技術:
:在過去的四十年,氨酰-tRNA合成酶(AARS)被認為是催化tRNA分子氨酰化所必需的管家蛋白,而tRNA分子氨酰化是蛋白翻譯過程中遺傳信息解碼的一部分。AARS在這方面已經得到廣泛研究,并且克隆了許多它們的全長序列以進行序列分析并提供生化實驗的豐富來源。然而,一些AARS片段和其他蛋白具有意想不到的與氨酰化無關的活性,包括調節超出蛋白翻譯的途徑的細胞外信號傳導活性。一般而言,在全長或親本蛋白序列的情況下未發現這些意想不到的活性;反而在從其親本序列去除或切除AARS蛋白片段之后,或者通過表達并充分純化AARS片段序列,然后測試新的非合成酶相關的活性,發現了這些活性。雖然AARS的全長序列已經知道了一段時間,但是還沒有進行系統的實驗分析來闡釋此類AARS蛋白片段或來自有關或相關蛋白的蛋白片段,或者評價全長AARS蛋白在氨基酸合成之外的新生物活性方面的潛在作用。在本說明書的多個部分,此類AARS蛋白片段、AARS結構域或AARS選擇性剪接變體在本文被稱為“切除蛋白(resectin)”。在其最廣的范圍內,術語“切除蛋白”指已經從其天然的全長或親本蛋白序列切離或限制(通過蛋白水解、選擇性剪接、誘變或重組基因工程)的一部分蛋白,否則其常常掩蓋其新的生物活性。同樣,還沒有進行系統的實驗分析以考察此類切除蛋白在治療各種醫學病癥中作為生物治療劑、診斷劑或藥物靶的用途,或者它們與人類疾病的潛在關聯。作為具有對哺乳動物生命至關重要的已知功能的必需的管家基因,AARS既沒有被考慮作為哺乳動物的藥物靶,也沒有通過標準的基因組測序、生物信息學或類似工作分析它們以鑒定具有非合成酶活性的切除蛋白。同樣,標準的生化研究工作已經遠離鑒定AARS切除蛋白的生物性質及其潛在的治療和診斷相關性的方向,這主要歸因于之前所理解的其相應的全長親本AARS的作用。附圖簡述圖1顯示與N端AARS多肽的相對位置和大小重疊的組氨酰tRNA合成酶的域結構示意圖。圖1A代表通過質譜分析鑒定的片段,圖1B代表通過轉錄組的深度測序鑒定的片段,以及圖1C代表通過生物信息學分析鑒定的片段。圖2顯示與C端AARS多肽的相對位置和大小重疊的組氨酰tRNA合成酶的域結構示意圖。圖2A代表通過轉錄組的深度測序鑒定的片段,以及圖2B代表通過生物信息學分析鑒定的片段。圖3顯示通過生物信息學分析鑒定的與內部AARS多肽的相對位置和大小重疊的組氨酰tRNA合成酶的域結構示意圖。發明概述本發明的實施方案一般涉及氨酰-tRNA合成酶(AARS)的蛋白片段的發現,所述蛋白片段具有非規范的生物活性,例如細胞外信號傳導活性,和/或治療和診斷相關的其他特性。AARS是所有生物中存在的蛋白合成器的通用且必要元件,但是人類AARS及其相關蛋白具有天然存在的切除變體,具有強大的細胞信號傳導活性,促進人類的正常功能。這些蛋白片段的活性不同于AARS公知的蛋白合成活性,并且本發明包括發現和開發這些切除蛋白作為新治療劑、新發現研究試劑和定向生物制劑和診斷劑的新抗原/靶,可能用于治療或診斷許多人類疾病,例如炎性、血液學、神經退行性、自身免疫性、血細胞生成、心血管和代謝疾病或疾患。因此,本發明的AARS蛋白片段可以被稱為“切除蛋白”或者“appendacrine”。如上所述,術語“切除蛋白”源自從其全長親本AARS序列環境切割或切除給定的AARS蛋白片段的過程,而其全長親本AARS序列通常掩蓋其非規范活性。在某些情況下,本發明的AARS蛋白片段和多核苷酸通過該切除過程的發生被鑒定,而不論是天然存在的(例如,蛋白水解的、剪接變體)、人工誘導的還是預測的。術語“appendacrine”衍生自“附加”(來自拉丁語-appender)和“分離”或“分辨”(來自希臘語_crines),并且也反映了AARS蛋白片段的一個或多個附加結構域與其相應的全長或親本AARS序列分離。盡管之前已經顯示幾種AARS片段具有非合成酶活性,但是有關生物治療、發現或診斷功用的此類片段的表達、分離、純化和表征是有限的,并且本領域技術人員不容易將此類活性與整個AARS家族的每個成員或替代片段相聯系。在此,利用了系統的方法發現并證實了用于生物治療發現和診斷功用的20個線粒體AARS和20個胞質AARS(和相關蛋白)的AARS蛋白片段。例如,使用主要鑒定蛋白水解片段的質譜(MS)從生物樣品鑒定了本發明的AARS蛋白片段和編碼它們的多核苷酸中的某些,并且通過主要鑒定剪接變體的深度測序技術鑒定了其他。使用計算機模擬預測氨基酸序列,例如通過計算機比較來自人類和低等生物的合成酶以及關鍵區別(例如蛋白酶位點),鑒定了其他AARS蛋白片段;該方法利用了全長AARS的序列分析,基于分辨具有非規范生物活性的蛋白水解片段和功能結構域的具體標準。AARS的新的切除蛋白是意想不到的,并且它們的差異表達也是意想不到的。特定的切除通常見于不同的處理(例如,從在有或沒有血清的培養基中生長的細胞)、不同的生長階段(例如,成體腦相對于胎兒腦)和不同的組織類型(例如,胰腺相對于肝臟)。盡管在相同的細胞位置以相對比例的量需要所有氨酰tRNA合成酶的規范功能,但所有氨酰tRNA合成酶的表達模式是不同的。人們不會預期一種氨酰tRNA合成酶活性的水平在其他氨酰tRNA合成酶活性不增加的同時增加。質譜和深度測序數據指示氨酰tRNA合成酶切除蛋白確實具有不同的水平并且出現在不同的部位和不同的階段。此外,AARS蛋白片段可以被表達和純化至足夠高的純度以分辨其生物性質。之前,片段常常不具有足夠的純度、折疊和穩定性來實現非合成酶活性的適當的生物表征。例如,配合足夠純的、穩定的、可溶的且折疊的切除蛋白使用基于細胞的測定,以揭示其重要的生物治療、發現或診斷活性。具體說,本發明涉及具有生物治療、發現或診斷功用的組氨酰tRNA合成酶的蛋白片段,相關劑和組合物及其使用方法。如本文所描述的,本發明的組合物用于許多診斷、藥物發現和治療應用。優選地,AARS蛋白和片段是純化的并且保存在適合條件下,達到所述生物治療、發現或診斷用途所需的程度。某些實施方案包括組合物,包含至少約100、90、80、70、60、50或40個氨基酸的分離的氨酰-tRNA合成酶(AARS)蛋白片段,所述蛋白片段包含表1-3或表4-6或表7-9任一個中所列的氨基酸序列,并且具有至少約5mg/mL的溶解度,并且其中所述組合物以蛋白基計具有至少約95%的純度和小于約IOEU內毒素/mg蛋白。一方面,所述組合物是治療組合物。在具體實施方案中,組合物基本沒有血清。在一些實施方案中,AARS蛋白片段包含非規范活性。在一些實施方案中,非規范生物活性選自:細胞外信號傳導的調節、細胞增殖的調節、細胞分化的調節、基因轉錄的調節、細胞因子生成或活性的調節、細胞因子受體活性的調節、和炎癥的調節。在一些實施方案中,對于基于細胞的非規范生物活性,AARS蛋白片段具有小于約InMJ^]5nM、約IOnMj^J50nM、約IOOnM或約200nM的EC5(I。在某些實施方案中,AARS蛋白片段與異源多肽融合。在一些實施方案中,AARS融合蛋白基本上保持所述AARS蛋白片段的非規范活性。在一些實施方案中,AARS融合蛋白抑制所述AARS蛋白片段的非規范活性。在某些實施方案中,異源多肽與AARS蛋白片段的N端連接。在某些實施方案中,異源多肽與AARS蛋白片段的C端連接。一方面,在這些實施方案的任何一個中,異源多肽選自由以下組成的組:純化標簽、表位標簽、祀向序列、信號肽、膜轉位序列和PK調節劑。在某些實施方案中,組合物包含濃度最少約10mg/mL的AARS蛋白片段。在某些實施方案中,組合物包含至少90%單分散的AARS蛋白片段。在某些實施方案中,組合物包含小于約3%的高分子量聚集蛋白。在某些實施方案中,組合物在4°C下在PBS中以至少IOmg/mL的濃度保存I周時表現出小于3%的聚集。在某些實施方案中,組合物在室溫下在PBS中以至少10mg/mL的濃度保存I周時表現出小于3%的聚集。本文描述了用于測量切除蛋白的此類特征的各種測定,并可以用來限定本發明的各方面。在某些方面中,這些特征對于本文描述的AARS蛋白片段的生物治療功用是優選的。某些實施方案包括組合物,包含至少60個氨基酸的分離的氨酰-tRNA合成酶(AARS)蛋白片段,該蛋白片段與表1-3或表4-6或表7-9任一個中所列的氨基酸序列相差約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個氨基酸的取代、缺失和/或添加,其中改變的蛋白片段基本上保持未改變蛋白的非規范活性或者具有與非規范活性相關的顯性負表型,其中所述蛋白片段具有至少約5mg/mL的溶解度,并且其中所述組合物以蛋白基計具有至少約95%的純度和小于約IOEU內毒素/mg蛋白。在具體實施方案中,組合物基本沒有血清。其他實施方案包括組合物,包含與表1-3或表4-6或表7-9中所列的分離的氨酰-tRNA合成酶(AARS)蛋白片段特異性結合的分離的抗體,其中所述抗體對所述AARS蛋白片段的親和力比所述抗體對相應的全長AARS多肽的親和力強約10X。本發明的令人驚訝的一個方面包括具有抗體或其他定向生物制劑可及的“新”表面的某些切除蛋白,而全長AARS“隱藏”或用其他序列或相鄰結構域覆蓋這些表面。切除過程還能產生更大的水可及性,用于揭示之前未鑒定的生物性質。一些實施方案包括組合物,包含與表1-3或表4-6或表7-9所列的分離的氨酰-tRNA合成酶(AARS)蛋白片段特異性結合的分離的抗體,其中所述抗體具有至少約IOnM的對所述AARS蛋白片段的親和力,和至少約IOOnM的對相應全長AARS多肽的親和力。在某些實施方案中,抗體結合位于表1-3或表4-6或表7_9任一個中所列的AARS多肽獨特剪接點內的表位,或者結合該剪接位點的C端氨基酸序列。在某些實施方案中,抗體拮抗AARS蛋白片段的非規范活性。此類拮抗劑可以任選地結合相應的親本或全長AARS。其他方面涉及生物測定系統,包含至少60個氨基酸的基本上純的氨酰-tRNA合成酶(AARS)蛋白片段和結合所述AARS蛋白片段的結合配體,所述蛋白片段包含表1_3或表4-6或表7-9中所列的氨基酸序列。一方面,結合配體選自由以下組成的組:細胞表面受體蛋白、核酸、脂質膜、細胞調節蛋白、酶和轉錄因子。任選地,此類受體可以是細胞的部分,所述細胞優選是與所揭示的切除蛋白生物學相關的細胞。某些實施方案包括細胞組合物,包含:至少60個氨基酸的分離的氨酰-tRNA合成酶(AARS)蛋白片段,所述蛋白片段包含表1-3或表4-6或表7-9中所列的氨基酸序列;和工程化的細胞群,其中至少一個細胞包含編碼所述AARS蛋白片段的多核苷酸。一方面,所述細胞能夠在無血清培養基中生長。還包括檢測系統,包含:至少50或100個氨基酸的基本上純的氨酰-tRNA合成酶(AARS)蛋白片段,所述蛋白片段包含表1-3或表4-6或表7_9中所列的氨基酸序列;包含與所述蛋白片段結合的細胞表面受體或其細胞外部分的細胞;和調節所述AARS蛋白片段和細胞外受體的結合或相互作用的小于約2000道爾頓的分子或第二多肽。特定實施方案包括診斷系統,包含:至少60個氨基酸的基本上純的氨酰-tRNA合成酶(AARS)蛋白片段,所述蛋白片段包含表1-3或表4-6或表7_9中所列的氨基酸序列;和包含與所述AARS蛋白片段結合的細胞表面受體或其細胞外部分的細胞,其中所述系統或細胞包含指示分子,所述指示分子允許檢測所述細胞表面受體或其細胞外部分的水平或活性的變化。某些實施方案包括細胞生長裝置,包含:至少60個氨基酸的分離的氨酰-tRNA合成酶(AARS)蛋白片段,所述蛋白片段包含表1-3或表4-6或表7-9中所列的氨基酸序列;工程化的細胞群,其中至少一個細胞包含編碼所述AARS蛋白片段的多核苷酸;至少約10升的無血清生長培養基;和無菌容器。在具體實施方案中,英語本文描述的方法或組合物的任何一種的細胞能夠在無血清培養基中生長,所述培養基任選含有抗生素和誘導物。一些實施方案涉及反義或RNA干擾(RNAi)劑,包含靶向對抗表1_3或表4_6或表7-9中所列的AARS剪接變體的獨特剪接點的序列。還包括治療組合物,包含至少60個氨基酸的分離的氨酰-tRNA合成酶(AARS)蛋白片段,所述蛋白片段包含表1-3或表4-6或表7-9中所列的氨基酸序列,其中所述蛋白片段特異性結合結合配體并且具有至少約5mg/mL的溶解度,并且其中所述組合物以蛋白基計具有至少約95%的純度。在一些方面,所述組合物可以具有小于IOEU內毒素/mg蛋白。還包括組合物,包含至少60個氨基酸的分離的氨酰-tRNA合成酶(AARS)蛋白片段,該蛋白片段與表1-3或表4-6或表7-9中所列的氨基酸序列至少80%、85%、90%、95%、98%或100%同一,其中所述蛋白片段具有至少約5mg/mL的溶解度,并且其中所述組合物以蛋白基計具有至少約95%的純度和小于約IOEU內毒素/mg蛋白。在這些實施方案的任何一個中,組合物可以包含就其表觀分子量而言是至少約50%、約60%、約70%、約80%、約90%或約95%單分散的AARS蛋白片段。在這些實施方案的任何一個的另一方面,組合物包含小于約10%(以蛋白基計)高分子量聚集蛋白,或小于約5%高分子量聚集蛋白,或小于約4%高分子量聚集蛋白,或小于約3%高分子量聚集蛋白,或小于2%高分子量聚集蛋白,或小于約1%高分子量聚集蛋白。在這些實施方案的任何一個的另一方面,組合物在4°C下在PBS中以至少10mg/mL的濃度保存I周時表現出小于10%的聚集,或者在4°C下在PBS中以至少10mg/mL的濃度保存I周時表現出小于5%的聚集,或者在4°C下在PBS中以至少10mg/mL的濃度保存I周時表現出小于3%的聚集,或者在4°C下在PBS中以至少10mg/mL的濃度保存I周時表現出小于2%的聚集,或者在4°C下在PBS中以至少10mg/mL的濃度保存I周時表現出小于1%的聚集。某些實施方案包括組合物,包含至少60個氨基酸的基本上純的氨酰-tRNA合成酶(AARS)蛋白片段和至少一個與之共價或非共價連接的部分,所述蛋白片段包含表1-3或表4-6或表7-9中所列的氨基酸序列。在某些實施方案中,所述部分時可檢測的標記物。在某些實施方案中,所述部分是水溶性聚合物。在某些實施方案中,所述部分是PEG。在這些實施方案的任何一個的一個方面,所述部分與所述蛋白片段的N端連接。在這些實施方案的任何一個的一個方面,所述部分與所述蛋白片段的C端連接。具體實施方案包括組合物,包含與至少60個氨基酸的分離的氨酰-tRNA合成酶(AARS)蛋白片段或其生物活性片段或變體連接的固體基底,所述蛋白片段包含表1-3或表4-6或表7-9中所列的氨基酸序列,其中所述蛋白片段具有至少約5mg/mL的溶解度,并且所述組合物以蛋白基計具有至少約95%的純度。還包括組合物,包含與表1-3或表4-6或表7-9中所列的分離的氨酰-tRNA合成酶(AARS)蛋白片段特異性結合的結合劑,其中所述結合劑具有至少約InM的對所述蛋白片段的親和力。一方面,所述結合劑結合位于表1-3或表4-6或表7-9任一個中所列的AARS多肽獨特剪接點內的表位,或者結合該剪接位點的C端氨基酸序列。在某些實施方案中,所述結合劑拮抗AARS多肽的非規范活性。某些實施方案包括分離的氨酰-tRNA合成酶(AARS)多肽,包含本文所述的AARS蛋白片段的氨基酸序列、由本文所述的AARS多核苷酸編碼的氨基酸序列、或其變體或片段。某些AARS多肽包含與表1-3或表4-6或表7-9或表E2中公開的AARS參照序列至少80%、85%、90%、95%、98%或100%同一的氨基酸序列。某些AARS多肽基本上由與表1_3或表4-6或表7-9或表E2中公開的AARS參照序列至少80%、85%、90%、95%、98%或100%同一的氨基酸序列組成。在某些實施方案中,所述多肽包含非規范生物活性。在具體實施方案中,非規范生物活性選自:細胞信號傳導(例如細胞外信號傳導)的調節、細胞增殖的調節、細胞遷移的調節、細胞分化的調節、凋亡或細胞死亡的調節、血管生成的調節、細胞結合的調節、細胞代謝的調節、細胞攝取的調節、基因轉錄的調節、或分泌的調節、細胞因子生成或活性的調節、細胞因子受體活性的調節、和炎癥的調節。其他方面包括抗體和其他結合劑,其表現出本文描述的分離的AARS多肽、所述AARS多肽的結合配體或兩者復合物的結合特異性。在某些實施方案中,抗體或結合劑對AARS多肽的親和力比其對相應的全長AARS多肽的親和力強約10X。在具體實施方案中,結合劑選自肽、肽模擬物、adnectin、適體和小分子。在某些實施方案中,抗體或結合劑拮抗AARS多肽的非規范活性。在其他實施方案中,抗體或結合劑激動AARS多肽的非規范活性。某些實施方案包括分離的氨酰-tRNA合成酶(AARS)多核苷酸,包含本文所述的AARS多核苷酸的核苷酸序列、編碼本文描述的AARS蛋白片段的核苷酸序列、或其變體、片段或互補物。某些AARS多核苷酸包含與表1-3或表4-6或表7-9或表E2中公開的AARS參照多核苷酸至少80%、85%、90%、95%、98%或100%同一的核苷酸序列或其互補物。在某些實施方案中,核苷酸序列是為細菌表達而密碼子優化的。一方面,核苷酸序列與表E2中公開的多核苷酸序列至少80%同一。具體的AARS多核苷酸由與表1-3或表4_6或表7-9或表E2中公開的AARS參照多核苷酸至少80%、85%、90%、95%、98%或100%同一的核苷酸序列或其互補物組成。其他AARS多核苷酸包含與表1-3或表4-6或表7-9或表E2中公開的AARS參照多核苷酸特異性雜交的核苷酸序列,或者基本由與表1-3或表4-6或表7-9或表E2中公開的AARS參照多核苷酸特異性雜交的核苷酸序列組成。在某些實施方案中,多核苷酸選自引物、探針和反義寡核苷酸。在具體實施方案中,引物、探針或反義寡核苷酸靶向AARS多核苷酸內的特異性或獨特的剪接點、和/或該剪接位點的3,序列。某些實施方案包括測定樣品中AARS蛋白片段的存在或水平的方法,所述方法包括使所述樣品與特異性結合本文描述的AARS蛋白片段的一種或多種結合劑接觸,檢測所述結合劑的存在或不存在,并從而測定所述AARS蛋白片段的存在或水平。其他實施方案包括測定樣品中AARS蛋白片段的存在或水平的方法,所述方法包括用能夠特異性鑒定本文描述的蛋白片段的檢測器分析所述樣品,并從而測定所述AARS蛋白片段的存在或水平。在具體實施方案中,所述檢測器是質譜儀(MS)、流式細胞儀、蛋白成像設備、酶聯免疫吸附測定(ELISA)或蛋白微陣列。某些實施方案包括將AARS蛋白片段的存在或水平與對照樣品或預定值相比較。某些實施方案包括表征樣品的狀態以使之與所述對照相區分。在具體實施方案中,樣品和對照包含細胞或組織,并且所述方法包括區分不同物種的細胞或組織、不同組織或器官的細胞、不同細胞發育狀態的細胞、不同細胞分化狀態的細胞、不同生理狀態的細胞、或健康細胞與患病細胞。例如,選擇的切除蛋白可以在諸如應激或刺激條件下更豐邑O某些實施方案包括用于鑒定特異性結合本文描述的氨酰-tRNA合成酶(AARS)多肽或其細胞結合配體的一種或多種的化合物的發現方法和相關組合物,所述方法包括a)使所述AARS多肽或其細胞結合配體或兩者與至少一種測試化合物在適合條件下混合,并b)檢測所述AARS多肽或其細胞結合配體或兩者與所述測試化合物的結合,從而鑒定特異性結合所述AARS多肽或其細胞結合配體或兩者的化合物。在某些實施方案中,測試化合物是多肽或肽、抗體或其抗原結合片段、肽模擬物或小分子。在某些實施方案中,測試化合物激動所述AARS多肽或其細胞結合配體的非規范生物活性。在其他實施方案中,測試化合物拮抗所述AARS多肽或其細胞結合配體的非規范生物活性。某些實施方案包括通過上述方法鑒定的化合物,例如激動劑(例如,小分子、肽)。某些實施方案包括測定樣品中AARS剪接變體的多核苷酸序列的存在或水平的方法,所述方法包括使所述樣品與特異性雜交本文所述的AARS多核苷酸的一種或多種寡核苷酸接觸,檢測所述樣品中所述寡核苷酸的存在或不存在,并從而測定所述AARS剪接變體的多核苷酸序列的存在或水平。其他實施方案包括測定樣品中AARS剪接變體的多核苷酸序列的存在或水平的方法,所述方法包括使所述樣品與特異性擴增本文所述的AARS多核苷酸的至少兩種寡核苷酸接觸,進行擴增反應,檢測擴增產物的存在或不存在,并從而測定所述AARS剪接變體的多核苷酸序列的存在或水平。在具體實施方案中,所述寡核苷酸特異性雜交或特異性擴增所述AARS剪接變體獨特的剪接點。某些實施方案包括將所述AARS蛋白片段或剪接變體的存在或水平與對照樣品或預定值相比較。某些實施方案包括表征所述樣品的狀態以使之與所述對照相區分。在具體實施方案中,所述樣品和對照包含細胞或組織,并且所述方法包括區分不同物種的細胞或組織、不同組織或器官的細胞、不同細胞發育狀態的細胞、不同細胞分化狀態的細胞、或健康細胞與患病細胞。一些實施方案包括藥物組合物,包含本文所述的AARS多核苷酸、本文所述的AARS多肽、本文所述的結合劑或通過上述方法鑒定的或本文描述的化合物,和藥學上可接受的賦形劑或載體。某些實施方案包括調節細胞的細胞活性的方法,所述方法包括使所述細胞與本文描述的AARS多核苷酸、本文描述的AARS多肽、本文描述的結合劑、上述方法或本文描述的化合物或本文描述的藥物組合物接觸。在具體實施方案中,所述細胞活性選自細胞增殖、細胞遷移、細胞分化、凋亡或細胞死亡、細胞信號傳導、血管生成、細胞結合、細胞攝取、細胞分泌、代謝、細胞因子生成或活性、細胞因子受體活性、基因轉錄和炎癥。一方面,所述細胞選自由以下組成的組:前脂肪細胞、骨髓、嗜中性粒細胞、血細胞、肝細胞、星形細胞、充質干細胞和骨骼肌細胞。在某些實施方案中,所述細胞在受試者中。某些實施方案包括治療受試者,其中所述受試者具有與腫瘤疾病相關的病癥、免疫系統疾病或病癥、感染性疾病、代謝疾病、炎性疾患、神經元/神經系統疾病、肌肉/心血管疾病、與異常血細胞生成相關的疾病、與異常血管生成相關的疾病或與異常細胞存活相關的疾病。還包括制備藥物化合物的方法,包括:a)在包含表1-3或表4_6或表7-9中所列的氨基酸序列的至少60個氨基酸的AARS蛋白片段存在下進行一種或多種候選化合物的體外篩選,以鑒定特異性結合所述AARS蛋白片段的化合物;b)使用步驟a)中鑒定的化合物進行基于細胞的或生化或受體測定,以鑒定調節所述AARS蛋白片段的一種或多種非規范活性的化合物;c)任選地評估在步驟b)中鑒定的化合物的結構-活性關系(SAR),以使其結構與所述非規范活性的調節相關聯,并任選地衍生化所述化合物以改變其調節所述非規范活性的能力;和(1)產生對于人類使用而言足量的在步驟b)中鑒定的化合物或在步驟c)中衍生的化合物,從而制備所述藥物化合物。其他實施方案包括制備藥物化合物的方法,包括:a)在特異性結合表1-3或表4-6或表7-9的AARS蛋白片段的細胞表面受體或其細胞外部分存在下進行一種或多種候選化合物的體外篩選,以鑒定特異性結合所述細胞表面受體或其細胞外部分的化合物山)使用步驟a)中鑒定的化合物進行基于細胞的或生化或受體測定,以鑒定調節所述AARS蛋白片段的一種或多種非規范活性的化合物;c)任選地評估在步驟b)中鑒定的化合物的結構-活性關系(SAR),以使其結構與所述非規范活性的調節相關聯,并任選地衍生化所述化合物以改變其調節所述非規范活性的能力;和d)產生對于人類使用而言足量的在步驟b)中鑒定的化合物或在步驟c)中衍生的化合物,從而制備所述藥物化合物。一些實施方案包括細胞組合物,包含工程化的細胞群,其中至少一個細胞包含編碼異源全長半胱氨酰-tRNA合成酶(AARS)蛋白的多核苷酸,其中所述細胞能夠在無血清培養基中生長。一方面,所述全長氨酰-tRNA合成酶(AARS)蛋白包含異源純化標簽或表位標簽以利于AARS蛋白片段的純化。另一方面,所述全長氨酰-tRNA合成酶(AARS)蛋白包含異源蛋白水解位點以使AARS蛋白片段能夠在裂解時生成。一些實施方案包括在細胞內原位生成表1-3或表4-6或表7-9或表E2所列的AARS多肽的方法,所述方法包括:i)在所述細胞內表達異源全長半胱氨酰-tRNA合成酶(AARS)蛋白,其中所述細胞包含能夠裂解所述異源全長氨酰-tRNA合成酶(AARS)蛋白以生成所述AARS多肽的蛋白酶。一些實施方案包括生成表1-3或表4-6或表7-9或表E2所列的AARS多肽的方法,所述方法包括使分離的全長氨酰-tRNA合成酶(AARS)蛋白與能夠裂解所述異源全長氨酰-tRNA合成酶(AARS)蛋白并產生AARS多肽的蛋白酶接觸。一些實施方案包括工程化的全長氨酰-tRNA合成酶(AARS)蛋白,包含能夠實現表1-3或表4-6或表7-9或表E2任一個中所列的AARS蛋白片段的蛋白水解生成的異源蛋白水解位點。一些實施方案包括組合物,包含分離的全長氨酰-tRNA合成酶蛋白,其中所述組合物以蛋白基計具有至少約95%的純度,小于約IOEU內毒素/mg蛋白,并且基本上沒有血清。一方面,所述全長氨酰-tRNA合成酶蛋白以至少10mg/mL的濃度存在,并且是至少90%單分散的。另一實施方案包括治療由tRNA合成酶的表達、活性或時空位置的異常調節介導的疾病或疾患的方法,所述方法通過施用表1-3或表4-6或表7-9或表E2任一個中所列的AARS蛋白片段或編碼所述ARRS蛋白片段的核酸。在該實施方案的一個方面,所述疾病選自癌癥、神經病、糖尿病和炎性疾患。發明詳述目錄1.概述15I1.定義16II1.純化的AARS蛋白片段和變體28IV.AARS多核苷酸63V.抗體76V1.抗體替代物和其他結合劑81VI1.生物測定和分析測定86VII1.表達和純化系統88IX.診斷方法和組合物101X.反義劑和RNAi劑117A.反義劑118B.RNA干擾劑127X1.藥物發現134XI1.使用方法143XII1.藥物制劑、施用和藥盒147XIV.實施例1561.概述本發明至少部分涉及新的AARS多肽的發現,及其制備和使用方法,這代表天然野生型蛋白轉化成與天然存在的全長組氨酰tRNA合成酶基因相比表現出明顯不同特性的新形式。此類AARS多肽的鑒定是基于廣泛序列和在不同組織中表達的組氨酰tRNA合成酶的質譜分析,隨后系統生成并測試每個潛在AARS多肽以鑒定代表穩定且可溶的蛋白結構域的蛋白序列,其表現出新的生物活性和有利的治療藥物特性。基于該分析,已經鑒定了源自組氨酰tRNA合成酶的AARS多肽的多個新家族。一方面,此類組氨酰tRNA合成酶衍生的AARS多肽包括包含組氨酰tRNA合成酶的大約氨基酸1-141,1-408,1-113,l_244+26aa,191-333,405-509,(1-60+175-509),(1-100+211-509),(1-60+101-509),(1-100+175-509),(1-60+399-509),(1-100+399-509)或氨基酸369-509的多肽序列。這些新的AARS多肽家族代表了新的之前未知的蛋白產物,尤其表現出i)新的生物活性,ii)有利的蛋白穩定性和聚集特性,和iii)在原核表達系統中以高水平表達和生成的能力,這些是未在完整的野生型蛋白中發現的顯著不同的特性。II定義除非另外指明,本文所用的所有技術和科學術語都具有與本發明所屬領域普通技術人員所通常理解的含義相同的含義。盡管在實施或檢驗本發明時可以使用與本文所述的相似或等同的任何方法和材料,但是本文描述了優選的方法和材料。出于本發明的目的,下文定義了以下術語。本文使用冠詞“a(—個)”和“an(—個)”指一個或多于一個(即,指至少一個)的該冠詞的語法對象。舉例來說,“一個元件”表示一個元件或多于一個的元件。“約”表示與參照的量、水平、值、數、頻率、百分比、尺度、尺寸、數額、重量或長度相比,改變多達30、25、20、25、10、9、8、7、6、5、4、3、2或1%的量、水平、值、數、頻率、百分比、尺度、尺寸、數額、重量或長度。“激動劑”是指增強或模擬活性的分子。例如,AARS或另一蛋白的非規范生物活性。激動劑可以包括蛋白、核酸、碳水化合物、小分子或任何其他化合物或組合物,這些激動劑通過與AARS或其結合配體直接相互作用或通過對AARS參與的生物途徑中的成分起作用來調節AARS的活性。包括部分激動劑和完全激動劑。如本文所用的,術語“氨基酸”意圖表示天然存在的和非天然存在的氨基酸以及氨基酸類似物和模擬物。天然存在的氨基酸包括蛋白生物合成中使用的20種(L)-氨基酸以及其他氨基酸,例如4-羥脯氨酸、羥賴氨酸、鎖鏈素、異鎖鏈素、高半胱氨酸、瓜氨酸和鳥氨酸。非天然存在的氨基酸包括例如(D)-氨基酸、正亮氨酸、正纈氨酸、P-氟苯丙氨酸、乙基硫氨酸等,其是本領域技術人員已知的。氨基酸類似物包括天然和非天然存在的氨基酸的修飾形式。這種修飾可以包括例如取代或替代氨基酸上的化學基團和部分,或者通過氨基酸的衍生化。氨基酸模擬物包括例如表現出功能上類似性質的有機結構,所述性質例如參照氨基酸的電荷和電荷空間特性。例如,模擬精氨酸(Arg或R)的有機結構具有位于類似分子空間并且具有與天然存在的Arg氨基酸的側鏈的e-氨基相同程度的移動性的正電荷部分。模擬物還包括約束結構以維持氨基酸或氨基酸官能團的最佳空間和電荷相互作用。本領域技術人員知道或者可以確定什么結構構成功能上等效的氨基酸類似物和氨基酸模擬物。在某些方面,非天然氨基酸的使用可用于修飾(例如增加)AARS蛋白片段的選定的非規范活性,或者改變蛋白的體內或體外半衰期。可以使用非天然氨基酸來促進AARS蛋白的(選擇性)化學修飾(例如,聚乙二醇化)。例如,某些非天然氨基酸允許聚合物例如PEG與給定蛋白連接,從而改善其藥代動力學性質。氨基酸類似物和模擬物的具體實例可以參見例如Roberts和Vellaccio,ThePiptides:Analysis,Synthesis,Biology,編輯Gross和Meinhofer,第5卷,ρ.341,AcademicPress,Inc.,NewYork,N.Y.(1983),其全卷通過引用并入本文。其他實例包括全燒基化氨基酸,特別是全甲基化氨基酸。參見例如CombinatorialChemistry,編輯WiIson和Czarnik,Ch.11,p.235,JohnWiley&SonsInc.,NewYork,N.Y.(1997),其全書通過引用并入本文。而其他實例包括其酰胺部分(和因此,得到的肽的酰胺骨架)已經被例如糖環、類固醇、苯并二氮雜環庚烷或碳環所替代的氨基酸。參見例如,Burger,sMedicinalChemistryandDrugDiscovery,編輯ManfredE.Wolff,Ch.15,pp.619-620,JohnWiley&SonsInc.,NewYork,N.Y.(1995),其全書通過引用并入本文。用于合成肽、多肽、肽模擬物和蛋白的方法是本領域公知的(參見例如,美國專利號5,420,109;M.Bodanzsky,PrinciplesofPeptideSynthesis(第I版&第2修訂版),Springer-Verlag,NewYork,N.Y.(1984&1993),見第7章;Stewart和Young,SolidPhasePeptideSynthesis,(第2版),PierceChemicalC0.,Rockford,111.(1984),其各自通過引用并入本文)。因此,本發明的AARS多肽可以由天然存在和非天然存在的氨基酸以及氨基酸類似物和模擬物構成。術語“拮抗劑”指減小或減弱一種活性的分子。例如,AARS或另一蛋白的非規范活性生物活性。拮抗劑可以包括諸如抗體的蛋白、核酸、碳水化合物、小分子或任何其他化合物或組合物,這些拮抗劑通過與AARS或其結合配體直接相互作用或通過對AARS參與的生物途徑中的組分起作用來調節AARS或其結合配體的活性。包括部分和完全拮抗劑。術語“氨酰-tRNA合成酶”(AARS)—般指以其天然或野生型形式能夠催化特定氨基酸或其前體酯化成所有其相容的相關tRNA之一以形成氨酰-tRNA的酶。在這種“規范”活性中,氨酰-tRNA合成酶催化一個兩步驟反應:首先,它們通過形成氨酰-腺苷酸而活化其各自的氨基酸,其中氨基酸的羧基通過替代焦磷酸而與ATP的α-磷酸連接,然后,當結合正確的tRNA時,氨酰-腺苷酸的氨酰基被轉移至tRNA的2’或3’末端0H。I類氨酰-tRNA合成酶通常具有兩個高度保守的序列基序。這些酶在腺苷核苷酸的2’-OH處氨基酰化,并且通常是單體或二聚體。II類氨酰-tRNA合成酶通常具有三個高度保守的序列基序。這些酶在同一腺苷的3’-OH處氨基酰化,并且通常是二聚體或四聚體。II類酶的活性位點主要由側翼為α-螺旋的七鏈反平行β-片層構成。盡管苯丙氨酸-tRNA合成酶是II類,但是它在2’-OH處氨基酰化。AARS多肽包括酪氨酰-tRNA合成酶(TyrRS)、色氨酰-tRNA合成酶(TrpRS)、谷氨酰胺酰-tRNA合成酶(GlnRS)、甘氨酰-tRNA合成酶(GlyRS)、組氨酰-tRNA合成酶(HisRS)、絲氨酰-tRNA合成酶(SerRS)、苯丙氨酰-tRNA合成酶(PheRS)、丙氨酰-tRNA合成酶(AlaRS)、天冬酰胺酰-tRNA合成酶(AsnRS)、天冬氨酰-tRNA合成酶(AspRS)、半胱氨酰-tRNA合成酶(CysRS)、谷氨酰-tRNA合成酶(GluRS)、脯氨酰-tRNA合成酶(ProRS)、精氨酰-tRNA合成酶(ArgRS)、異亮氨酰-tRNA合成酶(IleRS)、亮氨酰-tRNA合成酶(LeuRS)、賴氨酰-tRNA合成酶(LysRS)、蘇氨酰-tRNA合成酶(ThrRS)、甲硫氨酰-tRNA合成酶(MetRS)或纈氨酰-tRNA合成酶(ValRS)的線粒體和胞質形式。這些AARS多肽的野生型或親本序列是本領域已知的。“編碼序列”表示負責編碼基因的多肽產物的任何核酸序列。與之相反,術語“非編碼序列”是指并非負責編碼基因的多肽產物的任何核酸序列。整個說明書中,除非上下文另外要求,詞語“包含(comprise)”、“包含(comprises)”和“包含(comprising)”應理解為意指包括陳述的步驟或元素或者步驟或元素的組,但不排除任何其他的步驟或元素或者步驟或元素的組。“由...組成”表示包括且限于跟隨在短語“由...組成”后的任何內容。因此,短語“由...組成”表明所列出的元素是必需的或強制性的,并且可以不存在其他元素。“基本上由...組成”表示包括列在該短語后所列的任何元`素,并限于不妨礙或不促進在所列元素的公開內容中指明的活性或作用的其他元素。因此,短語“基本上由...組成”表明所列元素是必需的或強制性的,但其他元素是任選的,可以存在或可以不存在,這取決于它們是否實質影響所列元素的活性或作用。“不含內毒素”或“基本不含內毒素”的表述一般涉及含有至多痕量(例如,對受試者沒有臨床上不良的生理效應的量)內毒素并且優選不可檢測的量的內毒素的組合物、溶劑和/或容器。內毒素是與某些細菌、通常是革蘭氏陰性細菌有關的毒素,但是內毒素也可存在于革蘭氏陽性細菌中,例如產單核細胞李斯特菌。最普遍的內毒素是存在于各種革蘭氏陰性細菌外膜的脂多糖(LPS)或脂寡糖(LOS),并且其代表了這些細菌引起疾病的能力的主要致病特征。人類中的小量內毒素可以產生發熱、血壓降低和炎癥和凝血的激活,以及其他不良的生理效應。因此,在AARS多肽的藥物生產中,經常希望從藥物產品和/或藥物容器去除大部分或所有痕量的內毒素,因為即使小量也可能引起人類的不良反應。除熱源的烘箱可用于該目的,因為超過300°C的溫度通常是分解大多數內毒素所需要的。例如,基于主要的包裝材料,例如注射器或管形瓶,250°C的玻璃溫度與30分鐘的維持時間的組合經常足以實現內毒素水平減少3個數量級。考慮去除內毒素的其他方法,包括例如色譜和過濾方法,如本文所述和本領域已知的。還包括在真核細胞例如哺乳動物細胞中產生AARS多肽并從中分離它們的方法,以減少(如果不是消除)本發明組合物中存在的內毒素的風險。在無血清細胞中產生AARS多肽并從中分離它們的方法是優選的。這種包含AARS多肽的組合物代表了新制劑,表現出污染了血清或內毒素的AARS多肽組合物所沒有的新穎的生物和治療特性,血清或內毒素具有結合AARS多肽并改變AARS多肽的新穎生物性質的潛力。可以使用本領域的規范技術檢測內毒素。例如,利用了鱟的血液的鱟變形細胞溶解物測定是用于測定內毒素存在的非常靈敏的測定,并且基于該測定檢測內毒素的試劑、試劑盒和儀器可商業途徑獲自例如LonzaGroup。在該測試中,非常低水平的LPS可以引起可檢測的鱟溶解物的凝結,這歸因于放大該反應的強大的酶促級聯。還可以通過酶聯免疫吸附測定(ELISA)來定量內毒素。要成為基本上無內毒素的,內毒素水平可以小于約0.001、0.005、0.0U0.02,0.03,0.04,0.05,0.06,0.08,0.09,0.U0.5、1.0、1.5、2、2.5、3、4、5、6、7、8、9或10EU/mg蛋白。通常,Ing脂多糖(LPS)對應于約1-1OEU0在某些實施方案中,組合物中任何給定劑(例如,AARS蛋白片段)的“純度”可以是具體限定的。例如,某些組合物可以包含至少80、85、90、91、92、93、94、95、96、97、98、99或100%純的劑,包括其間所有小數,例如但不限于通過高效液相色譜(HPLC)所測量的,高效液相色譜(HPLC)是生物化學和分析化學中用于分離、鑒定和定量化合物的常用公知形式的柱色譜。如本文所使用的,“功能”和“功能的”等術語是指生物學功能、酶血功能或治療功倉泛。“基因”表示可以占據染色體上的特定基因座的遺傳單元,并且由轉錄調節序列和/或翻譯調節序列、和/或編碼區、和/或非翻譯序列(即,內含子、5'和3'非翻譯序列)組成。“同源性”是指同一的或組成型保守取代的氨基酸的百分數。同源性可以利用諸如GAP(Deveraux等人,1984,NucleicacidsResearchl2,387-395)的序列比較程序來確定,其通過引用并入本文。通過這種方式,可以通過在比對中插入空位來比較與本文中所引用的序列相似或明顯不同長度的序列,這種空位可以通過例如利用GAP的比較算法來確定。術語“宿主細胞”包括個體細胞或細胞培養物,其可以是或已經是本發明的任何重組載體或分離的多核苷酸的接受者。宿主細胞包括單個宿主細胞的子代,且由于天然的、偶然的或有意的突變和/或改變,該子代可以不必與原始的親代細胞完全一致(在形態學上或在總DNA互補物中)。宿主細胞包括用本發明的重組載體或多核苷酸在體內或體外轉染或感染的細胞。包含本發明的重組載體的宿主細胞是重組宿主細胞。“分離的”表示基本上或實質上不含在其天然狀態下通常伴隨它的組分的物質。例如,本文使用的“分離的多核苷酸”包括已經從天然存在狀態中位于其側翼的序列中純化的多核苷酸,例如,從通常鄰近DNA片段的序列中移出所述片段。可選地,本文所用的“分離的肽”或“分離的多肽”等包括從其天然的細胞環境中以及從與細胞的其他組分的結合中體外分離和/或純化的肽或多肽分子,即,它明顯不與體內物質結合。如本文所使用的,術語“mRNA”或有時稱為“mRNA轉錄物”包括但不限于:前mRNA轉錄物、轉錄加工中間體、準備用于翻譯的成熟mRNA以及一個或多個基因的轉錄物,或來源于mRNA轉錄物的核酸。轉錄物加工可以包括剪接、編輯和降解。如本文所使用的,來源于mRNA轉錄物的核酸是指所述mRNA轉錄物或其子序列被最終用作模板所合成的核酸。從mRNA逆轉錄的cDNA,從該cDNA轉錄的RNA,從該cDNA擴增的DNA,從擴增的DNA轉錄的RNA等都是來源于該mRNA的轉錄物,并且多這種來源的產物的檢測能指示樣品中原始轉錄物的存在和/或豐度。因此,mRNA來源的樣品包括但不限于,一個或多個基因的mRNA轉錄物、從該mRNA逆轉錄的cDNA、從該cDNA轉錄的cRNA、從基因擴增的DNA、從擴增的DNA轉錄的RNA等。本文使用的“非規范的”活性通常是指i)本發明的AARS多肽所具有的新活性,而在任何顯著程度上,完整的全長親本蛋白不具有該活性,或ii)完整的天然全長親本蛋白所具有的活性,其中AARS多肽與完整的天然全長親本蛋白相比表現出顯著更高(即,至少大20%)的比活性,或者表現出新環境中的活性;例如,與完整的天然全長親本蛋白具有的其他活性相獨立的活性。在AARS多肽的情況下,非規范活性的非限制性實例包括細胞外信號傳導、RNA結合、氨基酸結合、細胞增殖的調節、細胞遷移的調節、細胞分化的調節(例如血細胞生成、神經發生、肌發生、骨發生和脂肪生成)、基因轉錄的調節、細胞凋亡或其它形式的細胞死亡的調節、細胞信號傳導的調節、細胞攝取或分泌的調節、血管生成的調節、細胞結合的調節、細胞代謝的調節、細胞因子產生或活性的調節、細胞因子受體活性的調節、炎癥的調節等。術語“半數有效濃度”或“EC5(I”指本文所述的AARS蛋白片段、抗體或其他劑在一段指定的暴露時間之后誘導介于基線和最大值中間的響應的濃度;因此,分級劑量響應曲線的EC5tl代表觀察到其最大效應的50%時的化合物濃度。在某些實施方案中,本文提供的劑的EC5tl是與如上所述的“非規范”活性相關的。EC5tl還代表在體內獲得最大效應的50%所需的血漿濃度。類似地,“EC9(I”指觀察到其最大效應的90%時的劑或化合物的濃度。“EC9Q”可以從“EC5(I”和Hill斜率計算,或者可以使用本領域的規范知識從數據直接確定。在一些實施方案中,AARS蛋白片段、抗體或其他劑的EC5tl小于約0.01,0.05,0.1,0.2,0.3,0.4、0.5,0.6,0.7,0.8,0.9、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50、60、70、80、90或ΙΟΟηΜ。優選地,生物治療組合物將具有約InM或更小的EC5tl值。術語“調節”包括與對照相比,通常以統計學上顯著或生理上顯著的量“增加”或“刺激”,以及“減少”或“降低”。因此,根據使用條件,“調節劑”可以是激動劑、拮抗劑或其任何混合物。“增加的”或“提高的”量通常是“統計學上顯著的”量,并且可以包括沒有組合物(缺乏試劑或化合物)或有對照組合物時所產生的量的1.1、1.2、2、3、4、5、6、7、8、9、10、15、20、30或更大倍數(例如,500、1000倍)(包括其間大于I的所有整數和小數,例如1.5、1.6、1.7、1.8等)的增加。“減少的”或降低的量通常是“統計學上顯著的”量,并且可以包括沒有組合物(缺乏試劑或化合物)或有對照組合物時所產生的量的1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的降低,包括其間所有整數。作為一個非限制性實例,比較規范和非規范活性時的對照可能包括與其相應的全長AARS相比感興趣的AARS蛋白片段,或者具有與其相應的全長AARS相當的規范活性的片段AARS。“統計學上顯著的”量的其他實例在下文描述。“獲自”表示諸如例如,多核苷酸提取物或多肽提取物的樣品分離自或源自受試者的特定來源。例如,提取物可以獲自從受試者直接分離的組織或生物流體。“源自”或“獲自”還可以指多肽或多核苷酸序列的來源。例如,本發明的AARS序列可以“源自”AARS蛋白水解片段或AARS剪接變體或其部分的序列信息,不管它們是天然存在的還是人工產生的,并因此可以包括該序列,基本上由該序列組成,或者由該序列組成。術語“多肽”和“蛋白”在本文可互換使用,指氨基酸殘基的聚合物及其變體和合成的和天然存在的類似物。因此,這些術語適用于其中一個或多個氨基酸殘基是合成的非天然存在的氨基酸(諸如相應的天然存在的氨基酸的化學類似物)的氨基酸聚合物,以及適用于天然存在的氨基酸聚合物及其天然存在的化學衍生物。此類衍生物包括例如翻譯后修飾和降解產物,包括AARS參照片段的焦谷氨酰、異天冬氨酰、蛋白水解的、磷酸化的、糖基化的、氧化的、異構化的和脫氨基化的變體。本文所用的表述“序列同一性”或者例如包含“與...50%同一的序列”指序列在比較窗內在逐個核苷酸基礎或逐個氨基酸基礎上同一的程度。因此,“序列同一性百分比”可以通過以下來計算:在比較窗中比較兩個最優比對的序列,確定兩條序列中出現的相同的核酸堿基(例如A、T、C、G、I)或相同的氨基酸殘基(例如,Ala、Pro、Ser、Thr、Gly、Val、Leu、lie、Phe>Tyr>Trp>Lys、Arg、His、Asp、Glu、Asn、Gin、Cys和Met)的位置數量以得到匹配位置數,將該匹配位置數除以比較窗中的位置總數(即,窗大小),并將結果乘以100以得到序列同一性百分比。用于描述兩個或更多個多核苷酸或多肽間的序列關系的術語包括“參照序列”、“比較窗”、“序列同一性”、“序列同一性百分比”和“基本同一性”。“參照序列”的長度為至少12個,但通常是15至18個,經常是至少25個單體單元(包括核苷酸和氨基酸殘基)。因為兩個多核苷酸各自可以包含(I)在兩個多核苷酸間相似的序列(即,完整多核苷酸序列的僅一部分)和(2)在兩個多核苷酸間不同的序列,兩個(或更多個)多核苷酸間的序列比較通常通過比較“比較窗”中的兩個多核苷酸的序列來進行以鑒定和比較序列相似性的局部區域。“比較窗”指至少6個連續位置、通常為約50至約100個、更通常約100至150個的連續位置的概念節段,其中在一序列與具有相同連續位置數的參照序列最優比對后,將該序列與參照序列比較。比較窗可以包含與參照序列(其不包含添加或缺失)相比約20%或更少的添加或缺失(即空位)用于兩個序列的最優比對。用于比對比較窗的序列的最優比對可以通過算法的計算機運行(Wisconsin遺傳學軟件包發行版7.0(GeneticsSoftwarePackageRelease7.0)中的GAP、BESTFIT、FASTA和TFASTA,GeneticsComputerGroup,575Sci`enceDriveMadison,WI,USA)或通過目視檢查以及選擇的各種方法的任一種產生的最佳比對(即,產生整個比較窗的最高同源性百分比)來實施。例如Altschul等人,1997,Nucl.AcidsRes.25:3389公開的BLAST程序家族也可以作為參考。可以在Ausubel等人,“CurrentProtocolsinMolecularBiology,^JohnWiley&Sonslnc,1994-1998,第15章的19.3單元中找到序列分析的詳細討論。兩序列間的序列相似性或序列同一性(術語在本文可互換使用)的計算如下實施。為了確定兩個氨基酸序列或兩個核酸序列的同一性百分比,出于最優比較的目的,將序列比對(例如,可以在第一和第二氨基酸或核酸序列中的一個或兩者中弓I入空位以用于最優比對,出于比較目的,可以不管非同源性序列)。在某些實施方案中,出于比較目的比對的參照序列的長度是參照序列的長度的至少30%,優選至少40%,更優選至少50%、60%和甚至更優選至少70%、80%、90%、100%ο然后比較在對應氨基酸位置或核苷酸位置的氨基酸殘基或核苷酸。當在第一序列的一個位置被與在第二序列的對應位置相同的氨基酸殘基或核苷酸占據時,則所述分子在該位置是同一的。兩序列間的同一性百分比是被所述序列共享的相同位置數的函數,將空位數和每一空位的長度考慮在內,其需要被引入用于兩序列的最優比對。兩序列間的序列比較和同一性百分比的確定可以利用數學算法來實現。在一個優選的實施方案中,兩氨基酸序列間的同一性百分比利用已并入GCG軟件包(可以在http://www.gcg.com得到)的GAP程序的Needleman和Wunsch算法(1970,J.Mo1.Biol.48:444-453)來確定,利用Blossum62矩陣或PAM250矩陣,空位權重為16、14、12、10、8、6或4以及長度權重為1、2、3、4、5或6。在另一優選的實施方案中,兩核苷酸序列間的同一性百分比利用GCG軟件包(可以在http://www.gcg.com得到)的GAP程序來確定,利用NWSgapdna.CMP矩陣和40、50、60、70或80的空位權重以及1、2、3、4、5或6的長度權重。特別優選組的參數(除非特別指明,應該利用的一組)是BloSSum62得分矩陣,空位罰分為12,空位延伸罰分為4,以及移碼空位罰分為5。兩氨基酸或核苷酸序列之間的同一性百分比可以利用E.Meyers和ff.Miller(1989,Cabios,4:11-17)的算法來確定,該算法并入ALIGN程序(2.0版)中,利用PAM120權重殘基表,空位長度罰分為12,空位罰分為4。本文描述的核酸和蛋白序列可以用作“查詢序列”以進行對公開數據庫的檢索,例如,以鑒定其他家族成員或相關序列。可以利用Altschul,等人,(1990,J.Mol.Biol,215:403-10)的NBLAST和XBLAST程序(2.0版)進行這類檢索。可以利用NBLAST程序,得分=100,字長=12來進行BLAST核苷酸檢索以獲得與本發明的核酸分子同源的核苷酸序列。可以利用XBLAST程序,得分=50,字長=3來進行BLAST蛋白檢索以獲得與本發明的蛋白分子同源的氨基酸序列。為了獲得用于比較目的的帶空位的比對,可以利用Altschul等人,(1997,NucleicacidsRes,25:3389-3402)中描述的帶空位的BLAST。當利用BLAST和帶空位的BLAST程序時,可以利用各自程序(例如,XBLAST和NBLAST)中的缺省參數。術語“溶解度”指本文提供的劑在液體溶劑中溶解并形成均質溶液的性質。溶解度通常表示為濃度,借助每單位體積溶劑的溶質質量(g溶質/kg溶劑、g/dL(IOOmL)>mg/ml等)、摩爾濃度、重量克分子濃度、摩爾分數或其他類似的濃度描述。在指定條件下,單位量的溶劑可以溶解的溶質的最大平衡量是該溶質在該溶劑中的溶解度,所述指定條件包括溫度、壓力、pH和溶劑性質。在某些實施方案中,在生理pH下測量溶解度。在某些實施方案中,在水或生理緩沖液例如PBS中測量溶解度。在某些實施方案中,在諸如血液或血清的生物液體(溶劑)中測量溶解度。在某些實施方案中,溫度可以是約室溫(例如,約20、21、22、23、24、25°C)或約體溫(37°C)。在某些實施方案中,諸如AARS蛋白片段的劑在室溫或37°C下具有至少約0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25或30mg/ml的溶解度。本文所使用的“剪接點”包括成熟mRNA轉錄物或所編碼的多肽中第一個外顯子的3’端與第二個外顯子的5’端連接的區域。該區域的大小可以變化,并在一個外顯子的3’端與另一個外顯子的5’端連接處的確切殘基的任一端可以包括2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多個(包括其間所有整數)核苷酸或氨基酸殘基。“外顯子”指已經通過順式剪接移除前體RNA的一部分(內含子)或已經通過反式剪接將兩個或更多個前體RNA分子連接在一起后,在成熟形式的RNA分子中呈現的核酸序列。成熟RNA分子可以是信使RNA或諸如rRNA或tRNA的非編碼RNA的功能形式。取決于上下文,外顯子可以指DNA或其RNA轉錄物中的序列。“內含子”指基因中不翻譯成蛋白的非編碼核酸區域。非編碼的內含子節段被轉錄到前體mRNA(前mRNA)和某些其他RNA(例如長的非編碼RNA)中,并隨后在加工為成熟RNA的過程中通過剪接去除。“剪接變體”指通過選擇性剪接產生的成熟mRNA或其編碼的蛋白,所述選擇性剪接是指在RNA剪接期間,RNA(初級基因轉錄物或前mRNA)的外顯子以多種途徑重新連接的過程。所得的不同mRNA可以翻譯成不同的蛋白異構體,從而允許單一基因編碼多種蛋白。本文所用的“受試者”包括呈現能夠用本發明的AARS多核苷酸或多肽治療或診斷的癥狀或處于呈現該癥狀風險中的任何動物。還包括為診斷或其他目的需要描繪本發明AARS多肽和/或多核苷酸水平的受試者。合適的受試者(患者)包括實驗室動物(諸如小鼠、大鼠、兔或豚鼠)、農場動物、和家養動物或寵物(諸如貓或狗)。包括非人靈長類動物和優選人類患者。如本文所用的治療(treatment)”或“治療(treating)”包括對能夠被本文所述的AARS多核苷酸或多肽的非規范活性影響的疾病或病癥的癥狀或病理產生的任何期望的效應,并且可以包括被治療的疾病或病癥的一個或多個可測量的標志物的甚至極小的變化或改善。還包括與非AARS療法相關的治療,其中本文所述的AARS序列提供治療的臨床標志物。“治療(treatment)”或“治療(treating)”并不必然表示疾病或病癥或其相關癥狀的徹底根除或治愈。接受該治療的受試者是有相應需要的任何受試者。臨床改善的示例性標志物對本領域技術人員是明顯的。除非文中有明確相反指示,本發明的實施可利用本
技術領域:
內的規范分子生物學方法和重組DNA技術,為了說明的目的,其中很多方法和技術在下文進行了描述。這些技術在文獻中有充分的講解。參見,例如Sambrook,等人,MolecularCloning:ALaboratoryManual(第3版,2000);DNACloning:APracticalApproach,第I&II卷(D.Glover編輯);01igonucleotideSynthesis(N.Gait編輯,1984);OligonucleotideSynthesis:MethodsandApplications(P.Herdewijn編輯,2004);NucleicacidHybridization(B.Hames&S.Higgins編輯,1985);NucleicacidHybridization:ModernApplications(BuzdinandLukyanov編輯,2009)!TranscriptionandTranslation(B.Hames&S.Higgins編輯,1984);AnimalCellCulture(R.Freshney,ed.,1986);Freshney,R.1.(2005)CultureofAnimalCells,aManualofBasicTechnique,第5版.HobokenNJ,JohnWiley&Sons;B.Perbal,APracticalGuidetoMolecularCloning(第3版2010);Farrell,R.,RNAMethodologies:ALaboratoryGuideforIsolationandCharacterization(第3版2005),MethodsofEnzymology:DNAStructurePartA:SynthesisandPhysicalAnalysisofDNAMethodsinEnzymology,AcademicPress;UsingAntibodies:ALaboratoryManual:PortableProtocolN0.1,EdwardHarlow,DavidLane,EdHarlow(1999,ColdSpringHarborLaboratoryPress,ISBN0-87969-544-7);Antibodies:ALaboratoryManual,EdHarlow(編輯),DavidLane(編輯)(1988,ColdSpringHarborLaboratoryPress,ISBN0-87969-3,4-2),1855.HandbookofDrugScreening,RamakrishnaSeethala,PrabhavathiB.Fernandes編輯(2001,NewYork,N.Y.,MarceIDekker,ISBN0-8247-0562-9);和LabRef:AHandbookofRecipes,Reagents,andOtherReferenceToolsforUseattheBench,編輯JaneRoskams和LindaRodgers,(2002,ColdSpringHarborLaboratory,ISBN0-87969-630-3)。本文引用的所有出版物、專利和專利申請通過引用整體并入本文。II1.用于治療劑和其他應用的純化的AARS蛋白片段和變體令人驚訝地,不同于僅知道其氨酰化活性的其全長親本序列,已經發現AARS片段具有對于生物治療、發現和診斷應用重要的生物活性。因此,本發明的實施方案包括氨酰-tRNA合成酶(AARS)的全長蛋白、成熟蛋白同種型和蛋白片段及其生物活性變體和片段。在某些實施方案中,蛋白和片段可以通過內源性蛋白水解、體外蛋白水解、剪接變化或計算機模擬預測以及其他機制產生。本文描述的AARS蛋白片段及其變體可以具有至少一種“非規范”生物活性。本發明的AARS蛋白片段在本文還稱為“AARS多肽”或“AARS參照多肽”。在某些實施方案中,本文提供的AARS多肽包括以下或主要由以下組成:以下表1-3或表4-6或表7-9列出的AARS多肽“參照序列”的全部或一部分,其代表各種組氨酰tRNA合成酶片段的氨基酸序列。小鼠和人AARS蛋白序列是高度相關的,通常在完整序列、特定結構域或特定蛋白片段內相差不超過幾個氨基酸。N端AARS多狀:(表1、2&3)權利要求1.一種組合物,包含至少60個氨基酸的分離的氨酰-tRNA合成酶(AARS)蛋白片段,所述蛋白片段包含表1-3、或表4-6、或表7-9任一個中所列的氨基酸序列,其中所述蛋白片段具有至少約5mg/mL的溶解度,并且其中所述組合物以蛋白基計具有至少約95%的純度,小于約IOEU內毒素/mg蛋白,并且基本上沒有血清。2.權利要求1所述的組合物,其中所述AARS蛋白片段包含與選自以下的序列至少90%同一的氨基酸序列:SEQ.1D.N0.12、SEQ.1D.N0.14、SEQ.1D.N0.35、SEQ.1D.N0.28、SEQ.1D.N0.83、SEQ.1D.N0.48、SEQ.1D.N0.50、SEQ.1D.N0.52、SEQ.1D.N0.54、SEQ.1D.N0.56、SEQ.1D.N0.58、SEQ.1D.N0.60、SEQ.1D.N0.62、SEQ.1D.N0.64、和SEQ.1D.N0.109。3.權利要求1-2中任一項所述的組合物,其中所述AARS蛋白片段包含非規范生物活性。4.權利要求3所述的組合物,其中所述非規范生物活性選自:細胞外信號傳導的調節、嗜中性粒細胞活化的調節、細胞粘附或趨化的調節、轉錄的調節、細胞因子生成或活性的調節、炎癥的調節、和細胞因子受體活性的調節。5.權利要求4所述的組合物,其中所述非規范生物活性是基因轉錄的調節。6.權利要求1-5中任一項所述的組合物,其中所述AARS蛋白片段與異源多肽融合。7.權利要求6所述的AARS融合蛋白,其中所述AARS融合蛋白基本上保持所述AARS蛋白片段的非規范活性。8.權利要求6所述的AARS融合蛋白,其中所述AARS融合蛋白抑制所述AARS蛋白片段的非規范活性。9.權利要求6所述的AARS融合蛋白,其中所述異源多肽與所述AARS蛋白片段的N端連接。`10.權利要求6所述的AARS融合蛋白,其中所述異源多肽與所述AARS蛋白片段的C端連接。11.權利要求6所述的AARS融合蛋白,其中所述異源多肽選自:純化標簽、表位標簽、靶向序列、信號肽、膜易位序列、和PK調節物。12.權利要求1-5中任一項所述的組合物,其中所述組合物包含濃度為最少約10mg/mL的AARS蛋白片段。13.權利要求12所述的組合物,其中所述AARS蛋白片段是至少90%單分散的。14.權利要求12或13所述的組合物,其中所述組合物包含小于約3%的高分子量聚集蛋白。15.權利要求12至14中任一項所述的組合物,其中所述組合物在4°C下在PBS中以至少10mg/mL的濃度保存I周時表現出小于3%的聚集。16.一種組合物,包含至少60個氨基酸的分離的氨酰-tRNA合成酶(AARS)蛋白片段,所述蛋白片段與表1-3、或表4-6、或表7-9任一個中所列的氨基酸序列相差約1、2、3、4、5、6、7、8、9、10、或11個氨基酸的置換、缺失和/或添加,其中改變的蛋白片段基本上保持未改變的蛋白的非規范活性,其中所述蛋白片段具有至少約10mg/mL的溶解度,并且其中所述組合物以蛋白基計具有至少約95%的純度,小于約IOEU內毒素/mg蛋白,并且基本上沒有血清污染。17.—種組合物,包含特異性結合表1-3、或表4-6、或表7-9任一個中所列的分離的氨酰-tRNA合成酶(AARS)蛋白片段的分離的抗體,其中所述抗體對所述AARS蛋白片段的親和力比所述抗體對相應的全長AARS多肽的親和力強約10X,并且其中所述抗體拮抗所述AARS蛋白片段的非規范活性。18.—種組合物,包含特異性結合表1-3、或表4-6、或表7-9任一個中所列的分離的氨酰-tRNA合成酶(AARS)蛋白片段的分離的抗體,其中所述抗體具有至少約IOnM的對所述AARS蛋白片段的親和力,和至少約IOOnM的對相應全長AARS多肽的親和力。19.權利要求17或18中任一項所述的組合物,其中所述抗體結合位于表1-3、或表4-6、或表7-9任一個中所列的AARS多肽獨特剪接點內的表位,或者結合該剪接位點的C端氨基酸序列。20.權利要求17或18中任一項所述的組合物,其中所述抗體結合包含選自以下的至少5個連續氨基酸的表位:SEQ.1D.N0.31,SEQ.1D.N0.33,SEQ.1D.N0.67,SEQ.1D.N0.69,SEQ.1D.N0.71,SEQ.1D.N0.73、SEQ.1D.N0.75、SEQ.1D.N0.77和SEQ.1D.N0.79。21.權利要求17或18中任一項所述的組合物,其拮抗所述AARS多肽的非規范活性。22.—種生物測定系統,包含至少60個氨基酸的基本上純的氨酰-tRNA合成酶(AARS)蛋白片段和結合所述AARS蛋白片段的結合配偶體,所述蛋白片段包含表1-3、或表4-6、或表7-9任一個中所列的氨基酸序列。23.權利要求22所述的生物測定系統,其中所述結合配偶體選自:細胞表面受體蛋白、核酸、脂質膜、細胞調節蛋白、酶和轉錄因子。24.權利要求22所述的組合物,其中所述AARS蛋白片段包含與選自以下的序列至少90%同一的氨基酸序列:SEQ.1D.N0.12、SEQ.1D.N0.14、SEQ.1D.N0.35、SEQ.1D.N0.28、SEQ.1D.N0.83、SEQ.1D.N0.48、SEQ.1D.N0.50、SEQ.1D.N0.52、SEQ.1D.N0.54、SEQ.1D.N0.56、SEQ.1D.N0.58、SEQ.1D.N0.60、SEQ.1D.N0.62、SEQ.1D.N0.64、和SEQ.1D.N0.109。25.—種細胞組合物,包含:至少60個氨基酸的分離的氨酰-tRNA合成酶(AARS)蛋白片段,所述蛋白片段包含表1-3、或表4-6、或表7-9任一個中所列的氨基酸序列;和工程化的細胞群,其中至少一個細胞包含編碼所述AARS蛋白片段的多核苷酸,其中所述細胞能夠在無血清培養基中生長。26.—種檢測系統,包含:至少60個氨基酸的基本上純的氨酰-tRNA合成酶(AARS)蛋白片段,所述蛋白片段包含表1-3、或表4-6、或表7-9任一個中所列的氨基酸序列;包含結合所述蛋白片段的細胞表面受體或其細胞外部分的細胞;和調節所述AARS蛋白片段和細胞外受體的結合或相互作用的小于約2000道爾頓的分子或第二多肽。27.—種診斷系統,包含:至少60個氨基酸的基本上純的氨酰-tRNA合成酶(AARS)蛋白片段,所述蛋白片段包含表1-3、或表4-6、或表7-9任一個中所列的氨基酸序列;和包含特異性結合所述AARS蛋白片段的細胞表面受體或其細胞外部分的細胞,其中所述細胞包含指示分子,所述指示分子允許檢測所述細胞表面受體或其細胞外部分的水平或活性的變化。28.—種細胞生長裝置,包含:至少60個氨基酸的分離的氨酰-tRNA合成酶(AARS)蛋白片段,所述蛋白片段包含表1-3、或表4-6、或表7-9任一個中所列的氨基酸序列;工程化的細胞群,其中至少一個細胞包含編碼所述AARS蛋白片段的多核苷酸;至少約10升的無血清生長培養基;和無菌容器。29.一種反義或RNA干擾(RNAi)劑,包含靶向對抗表1_3、或表4_6、或表7_9任一個中所列的AARS剪接變體的獨特剪接點的序列。30.一種治療組合物,包含至少60個氨基酸的分離的氨酰-tRNA合成酶(AARS)蛋白片段,所述蛋白片段包含表1-3、或表4-6、或表7-9任一個中所列的氨基酸序列,其中所述蛋白片段特異性結合結合配偶體以發揮生理效應并且具有至少約5mg/mL的溶解度,并且其中所述組合物以蛋白基計具有至少約95%的純度和小于約IOEU內毒素/mg蛋白。31.權利要求29所述的治療組合物,其中所述AARS蛋白片段包含與選自以下的序列至少90%同一的氨基酸序列:SEQ.1D.N0.12,SEQ.1D.N0.14、SEQ.1D.N0.35,SEQ.1D.N0.28、SEQ.1D.N0.83、SEQ.1D.N0.48、SEQ.1D.N0.50、SEQ.1D.N0.52、SEQ.1D.N0.54、SEQ.1D.N0.56,SEQ.1D.N0.58,SEQ.1D.N0.60,SEQ.1D.N0.62,SEQ.1D.N0.64、和SEQ.1D.N0.109。32.權利要求29或30所述的治療組合物,其中所述結合配偶體選自:細胞表面受體、核酸、脂質膜、調節蛋白、酶和轉錄因子。33.權利要求29或30所述的治療組合物,其中所述AARS蛋白片段與異源多肽融合。34.權利要求32所述的治療組合物,其中所述AARS融合蛋白基本上保持所述AARS蛋白片段的非規范活性。35.權利要求32所述的治療組合物,其中所述AARS融合蛋白抑制所述AARS蛋白片段的非規范活性。36.權利要求32所述的治療組合物,其中所述異源多肽與所述AARS蛋白片段的N端連接。37.權利要求32所述的治療組合物,其中所述異源多肽與所述AARS蛋白片段的C端連接。38.權利要求32所述的治療組合物,其中所述異源多肽選自:純化標簽、表位標簽、靶向序列、信號肽、膜易位序列、和PK調節物。39.權利要求29-30中任一項所述的治療組合物,其中所述組合物包含濃度為最少約10mg/mL的AARS蛋白片段。40.權利要求29-30中任一項所述的治療組合物,其中所述AARS蛋白片段是至少90%單分散的。41.權利要求39所述的治療組合物,其中所述組合物包含小于約3%的高分子量聚集蛋白。42.權利要求39所述的治療組合物,其中所述組合物在4°C下在PBS中以至少10mg/mL的濃度保存I周時表現出小于3%的聚集。43.一種組合物,包含至少60個氨基酸的分離的氨酰-tRNA合成酶(AARS)蛋白片段,所述蛋白片段與表1-3、或表4-6、或表7-9任一個中所列的氨基酸序列至少80%、85%、90%、95%、98%、或100%同一,其中所述蛋白片段具有至少約5mg/mL的溶解度,并且其中所述組合物以蛋白基計具有至少約95%的純度和小于約IOEU內毒素/mg蛋白。44.一種組合物,包含至少60個氨基酸的基本上純的氨酰-tRNA合成酶(AARS)蛋白片段和至少一個與之共價或非共價連接的部分,所述蛋白片段包含表1-3、或表4-6、或表7-9任一個中所列的氨基酸序列。45.權利要求42所述的組合物,其中所述AARS蛋白片段包含與選自以下的序列至少90%同一的氨基酸序列:SEQ.1D.N0.12、SEQ.1D.N0.14、SEQ.1D.N0.35、SEQ.1D.N0.28、SEQ.1D.N0.83、SEQ.1D.N0.48、SEQ.1D.N0.50、SEQ.1D.N0.52、SEQ.1D.N0.54、SEQ.1D.N0.56、SEQ.1D.N0.58、SEQ.1D.N0.60、SEQ.1D.N0.62、SEQ.1D.N0.64、和SEQ.1D.N0.109。46.權利要求42或43所述的組合物,其中所述部分是可檢測的標記物。47.權利要求42或43所述的組合物,其中所述部分是水溶性聚合物。48.權利要求42或43所述的組合物,其中所述水溶性聚合物是PEG。49.權利要求42或43所述的組合物,其中所述部分與所述蛋白片段的N端連接。50.權利要求42或43所述的組合物,其中所述部分與所述蛋白片段的C端連接。51.—種組合物,包含與至少60個氨基酸的分離的氨酰-tRNA合成酶(AARS)蛋白片段連接的固體基底,所述蛋白片段包含表1-3、或表4-6、或表7-9任一個中所列的氨基酸序列,其中所述蛋白片段具有至少約5mg/mL的溶解度,并且所述組合物以蛋白基計具有至少約95%的純度。52.—種組合物,包含特異性結合表1-3、或表4-6、或表7-9任一個中所列的分離的氨酰-tRNA合成酶(AARS)蛋白片段的結合劑,其中所述結合劑具有至少約InM的對所述蛋白片段的親和力。53.權利要求52所述的組合物,其中所述結合劑結合位于表1-3、或表4-6、或表7-9任一個中所列的AARS多肽獨特剪接點內的表位,或者結合該剪接位點的C端氨基酸序列。54.權利要求52所述的組合物,其中所述結合劑結合包含選自以下的至少5個連續氨基酸的表位:SEQ.1D.N0.31、SEQ.1D.N0.33、SEQ.1D.N0.67、SEQ.1D.N0.69、SEQ.1D.N0.71、SEQ.1D.N0.73、SEQ.1D.N0.75、SEQ.1D.N0.77和SEQ.1D.N0.79。55.權利要求52所述的組合物,其拮抗所述AARS多肽的非規范活性。56.一種分離的氨酰-tRNA合成酶(AARS)多肽,包含表1_3、或表4_6、或表7_9任一個中所列的AARS蛋白片段的氨基酸序列。57.權利要求56所述的分離的氨酰-tRNA合成酶(AARS)多肽,其中所述AARS多肽包含選自以下的氨基酸序列:SEQ.1D.N0.12,SEQ.1D.N0.14、SEQ.1D.N0.35,SEQ.1D.N0.28,SEQ.1D.N0.83、SEQ.1D.N0.48、SEQ.1D.N0.50、SEQ.1D.N0.52、SEQ.1D.N0.54、SEQ.1D.N0.56、SEQ.1D.N0.58、SEQ.1D.N0.60、SEQ.1D.N0.62、SEQ.1D.N0.64、和SEQ.1D.N0.109。58.一種分離的氨酰-tRNA合成酶(AARS)多肽,包含與表1_3、或表4_6、或表7_9任一個中的序列至少80%、85%、90%、95%、98%、或100%同一的氨基酸序列。59.權利要求58所述的分離的氨酰-tRNA合成酶(AARS)多肽,其中所述AARS多肽選自:SEQ.1D.N0.12、SEQ.1D.N0.14、SEQ.1D.N0.35、SEQ.1D.N0.28、SEQ.1D.N0.83、SEQ.1D.N0.48、SEQ.1D.N0.50、SEQ.1D.N0.52、SEQ.1D.N0.54、SEQ.1D.N0.56、SEQ.1D.N0.58、SEQ.1D.N0.60、SEQ.1D.N0.62、SEQ.1D.N0.64、和SEQ.1D.N0.109。60.一種分離的氨酰-tRNA合成酶(AARS)多肽,基本上由與表1_3、或表4_6、或表7_9任一個中的序列至少80%、85%、90%、95%、98%、或100%同一的氨基酸序列組成。61.權利要求60所述的分離的氨酰-tRNA合成酶(AARS)多肽,其中所述AARS多肽選自:SEQ.1D.N0.12、SEQ.1D.N0.14、SEQ.1D.N0.35、SEQ.1D.N0.28、SEQ.1D.N0.83、SEQ.1D.N0.48、SEQ.1D.N0.50、SEQ.1D.N0.52、SEQ.1D.N0.54、SEQ.1D.N0.56、SEQ.1D.N0.58、SEQ.1D.N0.60、SEQ.1D.N0.62、SEQ.1D.N0.64、和SEQ.1D.N0.109。62.權利要求61所述的多肽,其中所述多肽包含非規范生物活性。63.權利要求62所述的多肽,其中所述非規范生物活性選自:細胞外信號傳導的調節、嗜中性粒細胞活化的調節、細胞粘附或趨化的調節、轉錄的調節、細胞因子生成或活性的調節、炎癥的調節、和細胞因子受體活性的調節。64.權利要求63所述的多肽,其中所述非規范生物活性是轉錄的調節。65.權利要求62所述的多肽,其中所述AARS蛋白片段與異源多肽融合。66.權利要求65所述的AARS融合蛋白,其中所述AARS融合蛋白基本上保持所述AARS蛋白片段的非規范活性。67.權利要求65所述的AARS融合蛋白,其中所述AARS融合蛋白抑制所述AARS蛋白片段的非規范活性。68.權利要求65所述的AARS融合蛋白,其中所述異源多肽與所述AARS蛋白片段的N端連接。69.權利要求65所述的AARS融合蛋白,其中所述異源多肽與所述AARS蛋白片段的C端連接。70.權利要求65所述的AARS融合蛋白,其中所述異源多肽選自:純化標簽、表位標簽、靶向序列、信號肽、膜易位序列、和PK調節物。71.權利要求62所述的組合物,其中所述組合物包含濃度為最少約10mg/mL的AARS蛋白片段。72.權利要求62所述的組合物,其中所述組合物包含至少90%單分散的AARS蛋白片段。73.權利要求62所述的組合物,其中所述組合物包含小于約3%的高分子量聚集蛋白。74.權利要求62所述的治療組合物,其中所述組合物在4°C下在PBS中以至少10mg/mL的濃度保存1周時表現出小于3%的聚集。75.一種抗體,其表現出對權利要求60所述的分離的AARS多肽、所述AARS多肽的結合配偶體、或兩者的結合特異性,其中所述抗體對所述AARS多肽的親和力比所述抗體對相應的全長AARS多肽的親和力強約10X。76.權利要求75所述的抗體,其中所述抗體結合位于表1-3、或表4-6、或表7-9任一個中所列的AARS多肽獨特剪接點內的表位,或者結合該剪接位點的C端氨基酸序列。77.權利要求75或76中任一項所述的抗體,其中所述抗體結合包含選自以下的至少5個連續氨基酸的表位:SEQ.1D.N0.31,SEQ.1D.N0.33,SEQ.1D.N0.67,SEQ.1D.N0.69,SEQ.1D.N0.71,SEQ.1D.N0.73、SEQ.1D.N0.75、SEQ.1D.N0.77和SEQ.1D.N0.79。78.一種抗體,其與權利要求75至77中任一項所述的抗體競爭結合分離的AARS多肽。79.—種結合劑,其表現出對權利要求62所述的分離的AARS多肽或所述AARS多肽的結合配偶體的結合特異性。80.權利要求79所述的結合劑,選自肽、可溶性受體、adnectin、小分子、和適配體。81.權利要求75-80中任一項所述的抗體或結合劑,其拮抗所述AARS多肽的非規范活性。82.權利要求75-80中任一項所述的抗體或結合劑,其激動所述AARS多肽的非規范活性。83.一種分離的氨酰-tRNA合成酶(AARS)多核苷酸,包含編碼表1_3、或表4_6、或表7-9任一個中所列的AARS蛋白片段的核苷酸序列,其具有至少80%序列同一性的變體,其片段,或互補物。84.權利要求83所述的多核苷酸,其中所述核苷酸序列與選自以下的序列至少80%同一:SEQ.1D.N0.13、SEQ.1D.N0.15、SEQ.1D.N0.36、SEQ.1D.N0.29、SEQ.1D.N0.84、SEQ.1D.N0.49、SEQ.1D.N0.51、SEQ.1D.N0.53、SEQ.1D.N0.55、SEQ.1D.N0.57、SEQ.1D.N0.59、SEQ.1D.N0.61、SEQ.1D.N0.63、SEQ.1D.N0.65、和SEQ.1D.N0.110。85.權利要求83所述的多核苷酸,其中所述核苷酸序列是為細菌表達而密碼子優化的。86.權利要求85所述的多核苷酸,其中所述多核苷酸與選自以下的序列至少80%同一:SEQ.1D.N0.44、SEQ.1D.N0.45、SEQ.1D.N0.46、SEQ.1D.N0.47、SEQ.1D.N0.101、SEQ.1D.N0.102、SEQ.1D.N0.103、SEQ.1D.N0.104、SEQ.1D.N0.105、SEQ.1D.N0.106、SEQ.1D.N0.107、SEQ.1D.N0.108、和SEQ.1D.N0.113。87.權利要求83所述的多核苷酸,包含與之至少80%、85%、90%、95%、98%、或100%同一的核苷酸序列,或其互補物。88.權利要求83所述的多核苷酸,基本上由與之至少80%、85%、90%、95%、98%、或100%同一的核苷酸序列或其互補物組成。89.—種分離的氨酰-tRNA合成酶(AARS)多核苷酸,包含與權利要求83所述的多核苷酸特異性雜交的核苷酸序列。90.權利要求89所述的多核苷酸,選自引物、探針、和反義寡核苷酸。91.權利要求90所述的多核苷酸,其與所述AARS多核苷酸的獨特剪接點特異性雜交。92.一種測定樣品中AARS蛋白片段的存在或水平的方法,所述方法包括使所述樣品與特異性結合表1-3、或表4-6、或表7-9任一個中所列的AARS蛋白片段的一種或多種結合劑接觸,檢測所述結合劑的存在或不存在,并從而測定所述AARS蛋白片段的存在或水平。93.一種測定樣品中AARS蛋白片段的存在或水平的方法,所述方法包括用能夠特異性鑒定表1-3、或表4-6、或表7-9任一個中所列的蛋白片段的檢測器分析所述樣品,并從而測定所述AARS蛋白片段的存在或水平。94.權利要求93所述的方法,其中所述檢測器是質譜儀(MS)、流式細胞儀、蛋白成像設備、酶聯免疫吸附測定(ELISA)、或蛋白微陣列。95.一種測定樣品中AARS剪接變體的多核苷酸序列的存在或水平的方法,所述方法包括使所述樣品與特異性雜交權利要求83所述的AARS多核苷酸的一種或多種寡核苷酸接觸,檢測所述樣品中所述寡核苷酸的存在或不存在,并從而測定所述AARS剪接變體的多核苷酸序列的存在或水平。96.一種測定樣品中AARS剪接變體的多核苷酸序列的存在或水平的方法,所述方法包括使所述樣品與特異性擴增權利要求83所述的AARS多核苷酸的至少兩種寡核苷酸接觸,進行擴增反應,檢測擴增產物的存在或不存在,并從而測定所述AARS剪接變體的多核苷酸序列的存在或水平。97.權利要求95或96所述的方法,其中所述寡核苷酸特異性雜交或特異性擴增所述AARS剪接變體獨特的剪接點。98.權利要求95-97中任一項所述的方法,還包括將所述AARS蛋白片段或剪接變體的存在或水平與對照樣品或預定值相比較。99.權利要求98所述的方法,還包括表征所述樣品的狀態以使之與所述對照相區分。100.權利要求98所述的方法,其中所述樣品和對照包括細胞或組織,并且所述方法包括區分不同物種的細胞或組織、不同組織或器官的細胞、不同細胞發育狀態的細胞、不同細胞分化狀態的細胞、或健康細胞與患病細胞。101.一種鑒定特異性結合表1-3、或表4-6、或表7-9任一個中所列的氨酰-tRNA合成酶(AARS)多肽或其細胞結合配偶體的一種或多種的化合物的方法,所述方法包括:a)使所述AARS多肽或其細胞結合配偶體或兩者與至少一種測試化合物在適合條件下混合,并b)檢測所述AARS多肽或其細胞結合配偶體或兩者與所述測試化合物的結合,從而鑒定特異性結合所述AARS多肽或其細胞結合配偶體或兩者的化合物。102.權利要求101所述的方法,其中所述測試化合物是多肽或肽、抗體或其抗原結合片段、肽模擬物、或小分子。103.權利要求101所述的方法,其中所述測試化合物完全或部分激動所述AARS多肽或其細胞結合配偶體的非規范生物活性。104.權利要求101所述的方法,其中所述測試化合物完全或部分拮抗所述AARS多肽或其細胞結合配偶體的非規范生物活性。105.—種由權利要求101-104中任一項所述的方法鑒定的化合物。106.—種藥物組合物,包含權利要求56-74中任一項所述的AARS多肽、權利要求75-82中任一項所述的抗體或結合劑、權利要求83-91中任一項所述的AARS多核苷酸、或權利要求105所述的化合物,和藥學上可接受的載體。107.權利要求106所述的藥物組合物,其不刺激受試者的免疫應答。108.權利要求106所述的藥物組合物,包含刺激受試者的免疫應答的至少一種佐劑。109.一種調節細胞或蛋白的細胞活性的方法,所述方法包括使所述細胞或蛋白與權利要求56-74中任一項所述的AARS多肽、權利要求75-82中任一項所述的抗體或結合劑、權利要求83-91中任一項所述的AARS多核苷酸、權利要求105所述的化合物、或權利要求108所述的藥物組合物接觸。110.權利要求109所述的方法,其中所述細胞活性選自細胞增殖、細胞分化、細胞信號傳導、基因轉錄、血管生成、細胞結合、代謝、細胞因子生成或活性、細胞因子受體活性、和炎癥。111.權利要求110所述的方法,其中所述細胞類型選自:前脂肪細胞、骨髓、嗜中性粒細胞、血細胞、肝細胞、星形細胞、充質干細胞、和骨骼肌細胞。112.權利要求111所述的方法,其中所述細胞在受試者中。113.權利要求112所述的方法,包括治療受試者,其中所述受試者具有與腫瘤疾病相關的病癥、免疫系統疾病或病癥、炎性障礙、感染性疾病、代謝疾病、神經元/神經疾病、肌肉/心血管疾病、與異常血細胞生成相關的疾病、與異常血管生成相關的疾病、或與異常細胞存活相關的疾病。114.一種用于制備藥物化合物的方法,所述方法包括:a)在包含表1-3、或表4-6、或表7-9任一個中所列的氨基酸序列的至少60個氨基酸的AARS蛋白片段存在下進行一種或多種候選化合物的體外篩選,以鑒定特異性結合所述AARS蛋白片段的化合物;b)使用在步驟a)中鑒定的化合物進行基于細胞的測定,以鑒定調節所述AARS蛋白片段的一種或多種非規范活性的化合物;c)任選地評估在步驟b)中鑒定的化合物的結構-活性關系(SAR),以使其結構與所述非規范活性的調節相關聯,并任選地衍生化所述化合物以改變其調節所述非規范活性的能力;和d)產生對于人類使用而言足量的在步驟b)中鑒定的化合物或在步驟c)中衍生的化合物,從而制備所述藥物化合物。115.一種用于制備藥物化合物的方法,所述方法包括:a)在特異性結合表1-3、或表4-6、或表7-9任一個的AARS蛋白片段的細胞表面受體或其細胞外部分存在下進行一種或多種候選化合物的體外篩選,以鑒定特異性結合所述細胞表面受體或其細胞外部分的化合物;b)使用在步驟a)中鑒定的化合物進行基于細胞的測定,以鑒定調節所述AARS蛋白片段的一種或多種非規范活性的化合物;c)任選地評估在步驟b)中鑒定的化合物的結構-活性關系(SAR),以使其結構與所述非規范活性的調節相關聯,并任選地衍生化所述化合物以改變其調節所述非規范活性的能力;和d)產生對于人類使用而言足量的在步驟b)中鑒定的化合物或在步驟c)中衍生的化合物,從而制備所述藥物化合物。116.一種細胞組合物,包含`工程化的細胞群,其中至少一個細胞包含編碼異源全長組氨酰-tRNA合成酶(AARS)蛋白的多核苷酸,其中所述細胞能夠在無血清培養基中生長。117.權利要求116所述的細胞組合物,其中所述全長氨酰-tRNA合成酶(AARS)蛋白包含異源純化或表位標簽以利于AARS蛋白片段的純化。118.權利要求116或117所述的細胞組合物,其中所述全長氨酰-tRNA合成酶(AARS)蛋白包含異源蛋白水解位點以使AARS蛋白片段能夠在切割時生成。119.一種用于在細胞內原位生成權利要求56-74中任一項所述的AARS多肽的方法,所述方法包括:i)在所述細胞內表達異源全長組氨酰-tRNA合成酶(AARS)蛋白,其中所述細胞包含能夠切割所述異源全長氨酰-tRNA合成酶(AARS)蛋白以生成所述AARS多肽的蛋白酶。120.—種用于生成權利要求56-74中任一項所述的AARS多肽的方法,所述方法包括使分離的全長組氨酰-tRNA合成酶(AARS)蛋白與能夠切割所述全長氨酰-tRNA合成酶(AARS)蛋白并產生AARS多肽的蛋白酶接觸。121.—種工程化的全長組氨酰-tRNA合成酶(AARS)蛋白,包含使表1_3、或表4_6、或表7-9任一個中所列的AARS蛋白片段能夠蛋白水解生成的異源蛋白水解位點。122.—種組合物,包含分離的全長組氨酰-tRNA合成酶蛋白,其中所述組合物以蛋白基計具有至少約95%的純度,小于約IOEU內毒素/mg蛋白,并且基本上沒有血清。123.權利要求122所述的組合物,其中所述全長組氨酰-tRNA合成酶蛋白以至少10mg/mL的濃度存在,并且是至少90%單分散的。124.—種治療由tRNA合成酶的表達、活性或時空位置的異常調節介導的疾病或障礙的方法,所述方法通過施用表I_3、或表4-6、或表7-9、或表E2任一個中所列的AARS蛋白片段或編碼所述ARRS蛋白片段的核酸。125.權利要求124所述的方法,其中所述疾病選自癌癥、神經病、糖尿病、和炎性障礙。全文摘要本文提供了包含氨酰-tRNA合成酶的新鑒定的蛋白片段的組合物、編碼所述蛋白片段的多核苷酸及其互補物、相關劑、及其在診斷、藥物發現、研究和治療應用中的使用方法。文檔編號A61P35/00GK103108649SQ201180032071公開日2013年5月15日申請日期2011年7月12日優先權日2010年7月12日發明者萊斯利·安·格林尼,凱爾·P·基昂格,洪非,阿蘭·P·瓦瑟洛特,羅詠詩,杰弗里·D·沃特金斯,謝麗爾·L·奎恩,約翰·D·門德萊恩申請人:Atyr醫藥公司,盤古生物制藥有限公司