專利名稱:能夠結合rna帽的流感病毒pb2蛋白可溶性片段的制作方法
技術領域:
本發明涉及流感病毒RNA依賴性RNA聚合酶亞基PB2的可溶性片段及其變體,及 其包含RNA帽(RNA cap)類似物的結晶復合物。本發明還涉及使用所述復合物的結構坐標 來篩選和設計與RNA帽結合口袋(RNA cap binding pocket)相互作用之化合物的計算方 法。另外,本發明涉及通過使用PB2多肽片段來鑒定(優選以高通量形式鑒定)與包含RNA 帽結合口袋的PB2多肽片段相結合(優選抑制與RNA帽或其類似物的相互作用)之化合物 的方法。本發明還涉及用于治療由負鏈單鏈RNA病毒引起的病毒感染疾病狀況的包含所鑒 定化合物的化合物和藥物組合物。
背景技術:
流行性感冒在世界范圍內導致很高的發病率和死亡率,被許多人認為是對人類來 說最為重要的病毒威脅。每年流行性感冒席卷全球,偶見的新毒株導致破壞力巨大的大范 圍流行。目前,控制流感病毒的主要方法是接種疫苗。但是,很快產生避開接種疫苗作用的 突變流感病毒。由于產生新的流感疫苗需要約6個月,所以尤其需要替代性治療方法(即 抗病毒藥物)來作為對抗迅速傳播的大流行的第一道防線。開發抗病毒藥物的一個很好的出發點是病毒必需蛋白的結構數據。因此,對流感 病毒表面抗原神經氨酸酶的晶體結構測定(von Itzstein等,1993)直接導致開發出了具 有抗病毒活性的神經氨酸酶抑制劑,其阻止病毒從細胞釋放,但是不阻止病毒產生。這些藥 物及其衍生物隨后被開發成抗流感藥物扎那米韋(Glaxo)和奧司他韋(Roche),許多國家 都儲備它們用作對抗萬一發生的大流行的第一道防線。但是,這些藥物僅僅提供臨床疾病 持續時間的縮短。或者,其它抗流感化合物例如金剛烷胺和金剛乙胺靶向病毒包膜中的離 子通道蛋白,即M2蛋白,干擾病毒在細胞內部的脫殼。但是,由于其副作用和抗性病毒突變 株的迅速產生,它們尚未被廣泛應用(Magden等,2005)。另外,更加非特異性的病毒藥物 (例如利巴韋林)已經顯示出可用于治療流感感染(Eriksson等,1977)。但是,可能由于嚴 重的副作用,利巴韋林僅在少數國家得到批準(Furuta等,2005)。顯然,需要新型抗病毒化 合物,其優選針對不同的靶標。流感病毒以及索戈托病毒(Thogotovirus)屬于正粘病毒科 (Orthomyxoviridae),其與布尼亞病毒禾斗(Bunyaviridae)(包括漢坦病毒(Hantavirus)、 P^^'MM (Nairovirus)(Orthobunyavirus)禾口(Phlebovirus)) 都是負鏈RNA病毒。它們的基因組是分段的,并作為核蛋白微粒,其包含RNA依賴性RNA聚 合酶,其進行(i)最初將單鏈病毒體RNA(vRNA)復制為病毒mRNA以及(ii)vRNA復制。對 于病毒mRNA的產生來說,所述聚合酶利用所謂的“帽攫取(cap-snatching)”機制(Plotch 等,1981 ;Kukkonen 等,2005 ;Leahy 等,1997 ;Noah and Krug,2005)。其與細胞mRNA 分子的 5' RNA帽結合,并將RNA帽與一段核苷酸一起切割下來。加帽的RNA片段用作病毒mRNA 合成的引物。所述聚合酶由三個亞基構成PB1 (聚合酶堿性蛋白)、PB2和PA。PBl具有核 酸內切酶和聚合酶活性,而PB2含有RNA帽結合結構域。
所述聚合酶復合物似乎是合適的抗病毒藥物靶標,因為其對于病毒mRNA的合成 和病毒復制來說是必需的,并含有幾個很可能顯著區別于宿主細胞蛋白質中的功能性活性 位點(Magden等,2005)。因此,例如,嘗試了通過類似于PBl內PA結合結構域的25個氨基酸 的肽干擾聚合酶亞基的裝配(Ghanem等,2007)。此外,已靶向了所述聚合酶的核酸內切酶 活性,并已鑒定出一系列4-取代的2,4-二氧代丁酸化合物作為流感病毒中此活性的選擇 性抑制劑(Tomassini等,1994)。另外,氟他胺(在真菌Delitschia confertaspora的提取 物中鑒定到的取代的2,6_ 二酮哌嗪)已經顯示出抑制流感病毒的核酸內切酶(Tomassini 等,1996)。此外,也已經嘗試了通過核苷類似物干擾病毒轉錄,例如2'-脫氧-2'-氟鳥 苷(Tisdale等,1995),并已經顯示T-105(取代的吡嗪化合物)可用作流感病毒RNA聚合 酶的特異性抑制劑(Furuta等,2005)。最后,通過對人帽結合蛋白eIF4E與RNA帽結構之 間結合模式與流感病毒RNP與RNA帽結構相互作用的比較研究,Hooker等(2003)鑒定出 與流感病毒選擇性相互作用但是不與人帽結合蛋白相互作用的新型帽類似物。但是,目前 為止,鑒定與PB2的RNA帽結合口袋相互作用并且可能干擾RNA帽結合并由此干擾RNA聚 合酶活性的化合物的主要障礙在于,所述結合口袋的結構和身份是未知的。
已經有一些努力試圖闡明RNA帽結合位點,但是結果有爭論。交聯實驗顯示,PB2 的兩個獨立的序列(一個臨近N端(242-282)的區段,一個臨近C端(538-577)的區段) 組成流感病毒RNA聚合酶的RNA帽結合位點(Honda等,1999)。另外的交聯實驗鑒定了 PB2 蛋白亞基中從533位氨基酸至564位氨基酸的序列(特別是氨基酸殘基Trp552)作為RNA 帽的潛在相互作用位點(Li等,2001)。此外,突變分析得到PB2中的潛在RNA帽結合氨基 酸殘基 Phe363 和 Phe404 (Fechter 等,2003)。本發明的一個目的是(i)通過X射線晶體衍射提供RNA帽結合口袋的高分辨率 結構數據,( )提供鑒定可結合PB2的RNA結合口袋(優選與RNA帽結合競爭并由此干擾 RNA聚合酶活性)的化合物的計算機和體外方法,優選高通量形式,以及(iii)提供針對由 利用帽攫取機制合成病毒mRNA的病毒所致感染性疾病的包含這些化合物的藥物組合物。本發明使得第一次可以對獨立折疊的結構域中PB2RNA帽結合位點進行精確定 義。迄今為止,對于所述位點可能位于哪里還有很多爭論。通常認為功能性帽結合位點需 要全部三個聚合酶亞基,可能還需要病毒RNA (Cianci等,1995 ;Li等,2001)。本發明人出 人意料的成果是重組產生包含RNA帽結合口袋的可溶性PB2多肽片段,這使得能夠使用易 于從直接表達系統得到的材料對流感病毒聚合酶功能性位點的抑制劑進行體外高通量篩 選。之前對帽結合抑制劑的工作已經使用了例如從流感病毒體中純化的完整核糖核蛋白顆 粒(Hooker等,2003)。此外,通過提供PB2內RNA帽結合口袋的詳細結構坐標,本發明人使 得可以使用基于結構的帽結合抑制劑設計方法,即計算機(in silico)篩選并導致最優化。
發明內容
在第一方面中,本發明涉及可溶性多肽片段,其中所述多肽片段(i)來源于流感 病毒RNA依賴性RNA聚合酶亞基PB2或其變體,并且(ii)能夠結合RNA帽或其類似物。在另一個方面中,本發明涉及包含本發明可溶性多肽片段以及RNA帽或其類似物 的復合物。在又一個方面中,本發明涉及編碼本發明分離可溶性多肽片段的分離的多核苷酸。
在另一個方面中,本發明涉及包含本發明分離多核苷酸的重組載體。在另一個方面中,本發明涉及包含本發明分離多核苷酸或者本發明重組載體的重 組宿主細胞。在又一個方面中,本發明涉及用于鑒定與PB2的RNA帽結合口袋或者PB2多肽變 體的結合口袋的全部或一部分相結合的化合物的方法,其包括以下步驟(a)構建如圖18所示本發明復合物的結構坐標所定義的所述結合口袋的計算機 模型;(b)通過選自下組的方法選擇潛在的結合化合物(i)將分子片段組裝成所述化合物,(ii)從小分子數據庫中選擇化合物,和(iii)對所述化合物進行配體的從頭設計;(c)利用計算機方法進行所述化合物與所述結合口袋的計算機模型之間的擬合程 序運算,以提供所述化合物在所述結合口袋中能量最低的構型;以及(d)評價所述擬合運算的結果來對所述化合物和所述結合口袋模型之間的結合進 行定量,其中對所述化合物與所述結合口袋相結合的能力進行評價。在又一個方面中,本發明涉及可通過本發明計算機方法鑒定的化合物,前提為所 述化合物不是 m7G> m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、 m7GpppU、m7GpppUm、2-氨基-7-苯甲基-9- (4-羥基丁基)_1,9- 二氫嘌呤 _6_ 酮或 T-705, 并且能夠結合PB2或其變體的RNA帽結合口袋。在又一個方面中,本發明涉及可通過本發明計算機方法鑒定的化合物,前提為所 述化合物不是 m7G> m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、 m7GpppU、m7GpppUm、2-氨基-7-苯甲基-9- (4-羥基丁基)_1,9- 二氫嘌呤 _6_ 酮或 T-705, 并且能夠抑制PB2多肽、其變體或其片段與RNA帽或其類似物之間的結合。在另一個方面中,本發明涉及鑒定與PB2的RNA帽結合口袋或PB2多肽變體的結 合口袋相結合的化合物的方法,包括以下步驟(i)將本發明的多肽片段或本發明的重組 宿主細胞與測試化合物相接觸,以及(ii)分析所述測試化合物結合PB2的能力。在又一個方面中,本發明涉及可根據本發明的體外方法產生的藥物組合物。在又一個方面中,本發明涉及可通過本發明體外方法鑒定的化合物,前提為所述 化合物不是 m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、 m7GpppU、m7GpppUm、2-氨基-7-苯甲基-9- (4-羥基丁基)_1,9- 二氫嘌呤 _6_ 酮或 T-705, 并且能夠結合PB2多肽、其變體或其片段。在另一個方面,本發明涉及可通過本發明的體外方法鑒定的化合物,前提為所述 化合物不是 m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、 m7GpppU、m7GpppUm、2-氨基-7-苯甲基-9- (4-羥基丁基)_1,9- 二氫嘌呤 _6_ 酮或 T-705, 并且能夠抑制PB2多肽、其變體或其片段與RNA帽或其類似物之間的結合。在另一個方面中,本發明涉及針對PB2的RNA帽結合結構域的抗體。在又一個方面中,本發明涉及本發明化合物、本發明藥物組合物或本發明抗體在 制備用于治療、改善或預防負鏈ssRNA病毒感染所引起疾病的藥物中的用途。
圖1顯示了具有與流感病毒聚合酶PBl亞基之潛在結合位點以及現有技術所預 測的潛在RNA帽結合位點(Cap-N/Cap-C參見Honda等(1999),Cap-C (Trp552)參見Li等 (2001),Cap-M參見Fechter等(2003))的全長PB2。另外,顯示了為進行細菌表達而產生 的PB2片段。所有這些構建體均以高水平表達并且是可溶性的。從上到下顯示了由13個 分離的克隆編碼的PB2片段的長度,其編碼7個獨特的PB2片段。所分離的克隆跨越SEQ ID NO 25的以下核苷酸克隆68:886位至1449位,克隆16:871至1452位,克隆15:871 至1452位,克隆57:844至1449位,克隆13:844至1449位,克隆10832至1443位,克隆 28:805 至 1452 位,克隆 23:805 至 1452 位,克隆 12:723 至 1425 位,克隆 4:706 至 1491 位, 克隆30:706至1491位,克隆07:706至1491位,以及克隆05:706至1491位。
圖2A顯示了在Superdex 75凝膠過濾柱上純化PB2多肽片段318位至483位氨 基酸的示意圖。將以任意單位(arbitrary unit)計的280nm吸光度對洗脫時間和級分號 作圖。圖2B顯示凝膠過濾之后PB2多肽片段(318位至483位氨基酸)的級分24_34的 考馬斯染色的SDS PAGE凝膠。分子量標準品具有以下大小116-66. 2-45-35-25-18. 4和 14. 4kD。圖3A顯示使用沉淀溶液1. 6M甲酸鈉、0. IM檸檬酸pH 4. 6形成的與m7GTP (5mM) 形成復合物的PB2多肽片段(318位至483位氨基酸)的天然結晶。圖3B顯示了使用沉淀溶液1. 6M甲酸鈉、0. IM檸檬酸pH 4. 6與m7GTP (5mM)形成 復合物的部分硒代甲硫氨酸化PB2多肽片段(318位至483位氨基酸)的結晶。圖4顯示在歐洲同步加速器輻射設施(European SynchrotronRadiation Facility)以光束線BM14在天然晶體上獲得的X射線衍射圖樣。衍射圖樣指標位于空間群 C2221,晶胞大小為a = 92. 2,b = 94. 4,c = 220. 4埃。右上插圖顯示衍射擴展至2. 4埃解 析度。右下插圖顯示用于數據收集的冷凍晶體,其大小約為15Χ15Χ50μπι3。圖5顯示與Hi7GTP形成復合物的ΡΒ2多肽片段(318至483位氨基酸)結構的帶 狀圖。根據DSSP計算標出二級結構元件(Holm,L和Sander,C.,1993),深灰色為α螺旋, 淺灰色為β鏈。GTP以球棒模型顯示,如Phe323、Phe404和His357的側鏈。標出了以348 和420位為中心的重要的環,如在該結構中可見N端和C端殘基(分別為320和483位)。圖6顯示與Hi7GTP形成復合物的PB2多肽片段(318至483位氨基酸)結構的另 一視圖,顯示420-環伸入溶劑中。圖7顯示被形成PB2中RNA帽結合口袋的一些氨基酸所圍繞的Hi7GTP的構象和無 偏實驗性電子密度。所述電子密度對應于使用實驗相和在0.95 ο處等高的非晶體學對稱 平均化通過RESOLVE獲得的圖像。圖8顯示包埋于PB2中具有潛在相互作用原子的RNA帽結合口袋中的帽類似物 m7GTP。推定氫鍵由虛線表示。圖9顯示來自甲型流感病毒(Influenza Α)(毒株A/Victoria/3/1975)和乙型 流感病毒(毒株B/Lee/40)的PB2RNA帽結合結構域的氨基酸序列比對。在序列比對上 方顯示 A/Victoria/3/1975 的二級結構(由 DSSP(Holm 和 Sander, 1993)計算)。使用ESPRIPT(http://espript. ibcp. fr/ESPript/cgi-bin/ESPript. cgi)對基于結構的序列比 對進行作圖。實心黑色背景上的殘基在兩個序列中是相同的。三角表示與帽類似物Hi7GTP 相互作用的主要殘基。 圖10顯示來自甲型流感病毒(Influenza Α)(毒株A/Victoria/3/1975)、乙型流 感病毒(毒株B/Lee/40)和丙型流感病毒(毒株Ann Arbor/1/50)的PB2RNA帽結合結構 域的氨基酸序列比對。注釋同圖9。圖11顯示了 RNA帽類似物Hi7GTP與PB2內RNA帽結合口袋之間的相互作用。帽 類似物Hi7GTP (標記為M7G)以深灰色條繪制,蛋白質殘基以中等灰色條繪制,水分子以淺灰 色圓繪制。氫鍵以虛線顯示,供體和受體之間的距離以埃計。深灰色圓的細線條部分顯示 與配體發生范德華力接觸的殘基。該圖對應于坐標文件中具有B鏈的分子。非對稱單元中 的四個其它分子(A、B、D和F鏈)給出相似的圖,在距離和水的位置上略有差異。該圖使用 LIGPLOT(Wallace 等,1995)制成。圖12顯示在4°C下與Hi7GTP Sepharose 4B樹脂結合之后,所示野生型和單點突變 PB2帽結合結構域洗脫結果的考馬斯染色SDS PAGE凝膠。在野生型蛋白發生結合的條件 下,突變體 E361A、F404A、H357A 和 K376A 無法與 m7GTP S印harose 4B 樹脂結合,而 F323A 有弱的殘余結合活性,F325A幾乎與野生型一樣與樹脂結合,但是,此結合活性在37°C下顯 著降低(見表3)。還制備了 H357W突變體,因為甲型和乙型流感病毒在此位置具有此殘基。 可溶性地純化此突變體,發現與Hi7GTP Sepharose 4B樹脂的結合與野生型相比略微增強。 突變體八州通過將殘基¥&1421-6111426替換為三個甘氨酸(420-環)來產生,并顯示帽結 合活性。圖13顯示野生型或突變體重組聚合酶復合物的帽結合活性。將HEK293T細胞培 養物共轉染表達PBl和ΡΑ(Φ)的質粒,或者共轉染表達ΡΒ1、PB2-His或其突變體以及PA 的質粒。通過在4°C下使用m 7GTP-S印harose的下拉測定(pull down)分析細胞提取物。 通過使用PA特異性抗體的Western印跡顯示保留并被Hi7GTP洗脫的聚合酶復合物。IN和 E分別表示輸入細胞提取物和洗脫蛋白。PA特異性條帶的位置在右側標出,分子量標準品 的移動在左側顯示。突變體八州通過將殘基¥£11421-6111426替換為三個甘氨酸(420-環) 來產生。圖14顯示野生型或突變體聚合酶的復制活性。在體內重構野生型和突變體微RNP 并使用Ni2+-NTA-瓊脂糖通過親和色譜進行純化。通過使用抗PA和抗NP抗體的Western印 跡測定后代RNP的累積。數據以野生型值的百分比顯示,為兩個實驗的平均值和范圍。突 變體八¥0通過將殘基¥&1421-6111426替換為三個甘氨酸(420-環)來產生。圖15顯示純化的野生型或突變體RNP使用ApG作為引物的體外轉錄活性。數據 顯示為兩個實驗的平均值和范圍。突變體八州通過將殘基¥&1421-6111426替換為三個甘 氨酸(420-環)來產生。圖16顯示純化的野生型或突變體RNP使用β -珠蛋白mRNA作為引物的體外轉錄 活性。數據顯示為兩個實驗的平均值和范圍。突變體八州通過將殘基¥&1421-6111426替 換為三個甘氨酸(420-環)來產生。圖17顯示純化的野生型或突變體RNP的ApG依賴性與β -珠蛋白mRNA依賴性 體外轉錄活性的比值。數據顯示為兩個實驗的平均值和范圍。突變體AVQ通過將殘基Val421-Gln426替換為三個甘氨酸(420-環)來產生。
圖18列舉了具有Lys389的SEQ ID NO. 1PB2多肽片段318位至483位氨基酸的精 細原子結構坐標。該片段具有SEQ ID NO :11的氨基酸序列,其與RNA帽類似物7-甲基-鳥 苷三磷酸(m7GTP)形成復合物。具有鏈A、B、D、E、F的不對稱單元中有5個分子。RNA帽類 似物Hi7GTP是每個鏈的第一個殘基。有293個水分子。文件頭給出了有關結構精細化的信 息。“Atom”指其坐標被測定的元素。該列中的第一個字母定義元素。給出各個氨基酸的三 字母代碼以及氨基酸序列位置。“Atom”列中的前3個值定義所測元素的原子位置。第四個 值對應于占位率(occupancy),第五個(最后一個)值是溫度因子(B因子)。占位因子指 分子中每個原子占據以坐標表示之位置的比例。值為“1”表示各個原子在晶體的所有分子 中均具有相同的構象,即相同位置。B是溫度因子,其度量原子圍繞其原子中心的運動。在 標記為“ANIS0U”的列中給出各向異性溫度因子。此命名對應于PDB文件格式。發明詳述在下文對本發明詳細描述之前,應理解本發明不局限于本文所述的具體方法、方 案和試劑,因為它們可發生變化。還應理解,本文所用術語僅用于描述具體的實施方案,而 不意欲限制本發明的范圍,本發明的范圍僅僅由所附加權利要求限定。除非另外定義,否則 本發明中所有的技術和科學名詞具有與本發明所屬領域技術人員通常所理解相同的含義。優選地,本文所用術語如‘‘Amultilingual glossary of biotechnologicalterms (IUPAC Recommendations) " , H. G. W. Leuenberger, B. Nagel 禾口 H. KSlbl編輯,Helvetica Chimica Acta, CH-4010Basel, Switzerland, (1995)中所述。在本說明書及其權利要求書通篇中,除非上下文另有要求,否則“包含”這一用語 及其變化例如“包括”和“含有”應理解為表示包含所述整體、步驟或者整體或步驟的組,但 是不排除任何其它的整體、步驟或者整體或步驟的組。在本說明書中引用了一些文獻。本文所引用的每個文獻(包括所有專利、專利申 請、科技出版物、制造商說明、說明書等),不論上文所述或下文所述,都通過引用以整體并 入本文。本文中的任何內容均不視作認可本發明不能由于在先發明而早于這些公開內容。術語“多肽片段”指單個氨基酸鏈構成的蛋白質的一部分。術語“蛋白質”包括呈 現二級和三級結構的多肽片段,還指由形成四級結構的數個氨基酸鏈(即數個亞基)組成 的蛋白質。術語“肽”指最多50個氨基酸的短氨基酸鏈,其不一定呈現二級或三級結構。 “擬肽”是由N-取代的甘氨酸寡聚裝配產生的肽類似物。如果兩個或多個多肽中的殘基在多肽結構中占據類似的位置,則所述殘基稱為 彼此“對應”。如現有技術中公知的,兩個或多個多肽中的類似位置可基于氨基酸順序或 結構相似性通過多肽序列比對來確定。這樣的比對工具對本領域技術人員來說是公知 的,可以例如獲得自萬維網(WouldWide Web),例如使用標準設置的Clustalff (www, ebi. ac. uk/clustalw)或 Align(http//www, ebi. ac. uk/emboss/align/index, html),優選 AlignEMBOSS: :needle, Matrix :Blosum62,缺口打開 10. 0,缺口延伸 0. 5。本領域技術人員 理解,為產生滿意的比對,可能需要在序列中引入缺口。例如,甲型流感病毒PB2亞基中的 220至510位殘基分別對應于乙型和丙型流感病毒PB2亞基中的222至511位殘基和227 至528位殘基。這樣產生的對三個PB2亞基的比對在圖10中顯示。如果兩個或更多流感 病毒PB2亞基中的殘基在最佳序列比對中對齊,則稱其為“對應”。兩個多肽之間的“最佳序列比對”定義為產生最大數量對齊的相同殘基的比對。如果兩個比對序列的序列相似性 (優選同一性)在10、20或30個氨基酸的長度上降至低于30%,優選低于20%,更優選低 于10%,更優選在10、20或30個氨基酸的長度上低于30%,則"最佳序列比對區域"結束 并由此確定為測定相似性分數的比較序列的長度邊界。甲型(315至498位aa)、乙型(317 至499位aa)和丙型(327至516位aa)流感病毒PB2亞基的最佳序列比對部分顯示于圖 9 禾口 10。本發明包括流感病毒RNA依賴性RNA聚合酶PB2亞基的可溶性片段,其能夠結合 RNA帽或其類似物。術語“RNA依賴性RNA聚合酶亞基PB2”優選表示甲型流感病毒、乙型流 感病毒和丙型流感病毒的PB2,優選具有SEQ ID NO :1、2或3所示的氨基酸序列。“RNA依 賴性RNA聚合酶亞基PB2變體”與SEQ ID NO :1、2或3所示氨基酸序列使用最佳序列比對 在整個片段的長度上和/或在最佳序列比對區域上具有至少60%、65%、70%、80%、81%、 82%,83%,84%,84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%, 96%,97 %、98%、99 %序列相似性,優選序列同一性,其中所述最佳序列比對可使用本領域 已知工具獲得,例如Align,其使用標準設置,優選EMBOSS: :needle,Matrix :Blosum62,缺 口打開10. 0,缺口延伸0.5。優選地,當天然PB2變體與SEQ ID NO :1、2或3的PB2亞基比 對時,比對在兩個蛋白質的全長上進行,因此在此基礎上確定比對得分。但是,有可能天然 變體可包含C端/N端或內部的缺失或添加,例如通過N端或C端的融合。在此情況下,僅 將最佳比對區域用于分別評估相似性和同一性。優選地,并且如下文詳細描述地,來源于這些變體的可溶性片段分別顯示所示相 似性 和同一性,優選在RNA帽結合所需的區域內。因此,SEQID NO :1、2或3與PB2變體之 間的任意比對應優選包含RNA帽結合口袋。因此,上述序列與SEQ ID N0:l、2或3的相似 性和同一性分別至少對應于 100、110、120、130、140、150、160、165、170、180、190、200、210、 220、230、240、250、300或更多個氨基酸的長度,優選包含RNA帽結合口袋。因此,在一個優 選實施方案中,RNA依賴性RNA聚合酶亞基PB2變體與SEQ ID NO :1在100個氨基酸的長 度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性,優選序列 同一性,與SEQ ID吣1在110個氨基酸的長度上具有至少60%、65%、70%、80%、81%、 82%,83%,84%,84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%, 96%、97%、98%、99%的序列相似性,優選序列同一性,與SEQ ID NO :1在120個氨基酸 的長度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性,優選 序列同一性,與SEQ ID NO :1在130個氨基酸的長度上具有至少60%、65%、70%、80%、 81 82%,83%,84%,84%,85%,86%,87%,88%,89%,90%,91 92%,93%,94%, 95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與SEQ ID NO :1在140個氨 基酸的長度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性, 優選序列同一性,與SEQ ID N0:1在150個氨基酸的長度上具有至少60%、65%、70%、 80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%, 94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與SEQ ID NO 1在160個氨基酸的長度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、 86%、87%、88%、89%、90%、91 %、92%、93%、94%、95%、96%、97%、98%、99% 的序列 相似性,優選序列同一性,與SEQ ID N0:1在165個氨基酸的長度上具有至少60%、65%、 70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%,91 93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與SEQ ID NO 1 在170個氨基酸的長度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 的 序列相似性,優選序列同一性,與SEQ ID NO :1在180個氨基酸的長度上具有至少60%、 65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%,91 92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與SEQ ID NO :1在190個氨基酸的長度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性,優選序列同一性,與SEQ ID NO :1在200個氨基酸的長度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與 SEQ ID NO :1 在 210 個氨基酸的長度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性,優選序列同一性,與SEQ ID NO :1在220個氨基酸的長度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與 SEQ ID NO :1 在 230個氨基酸的長度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性,優選序列同一性,與SEQ ID NO :1在240個氨基酸的長度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與 SEQ ID NO :1 在 250 個氨基酸的長度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性,優選序列同一性,與SEQ ID NO :1在300個氨基酸的長度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性,優選序列同一性。
在一個優選實施方案中,RNA依賴性RNA聚合酶亞基PB2變體與SEQ ID NO 2 在100個氨基酸的長度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 的 序列相似性,優選序列同一性,與SEQ ID NO 2在110個氨基酸的長度上具有至少60%、 65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%,91 92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與SEQ ID NO :2在120個氨基酸的長度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性,優選序列同一性,與SEQ ID NO 2在130個氨基酸的長度上具有至少91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與 SEQ ID NO :2在 140個氨基酸的長度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性,優選序列同一性,與SEQ ID NO :2在150個氨基酸的長度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與 SEQ ID NO :2 在 160 個氨基酸的長度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性,優選序列同一性,與SEQ ID NO 2在165個氨基酸的長度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與 SEQ ID NO :2在 170個氨基酸的長度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性,優選序列同一性,與SEQ ID NO 2在180個氨基酸的長度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與 SEQ ID NO :2 在 190 個氨基酸的長度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性,優選序列同一性,與SEQ ID NO :2在200個氨基酸的長度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與 SEQ ID NO :2 在 210 個氨基酸的長度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性,優選序列同一性,與SEQ ID NO 2在220個氨基酸的長度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與 SEQ ID NO :2 在 230個氨基酸的長度上具有至少 60%、65%、70%、80% 、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性,優選序列同一性,與SEQ ID NO :2在240個氨基酸的長度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與 SEQ ID NO :2 在 250 個氨基酸的長度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性,優選序列同一性,與SEQ ID NO 2在300個氨基酸的長度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性,優選序列同一性。
在一個優選實施方案中,RNA依賴性RNA聚合酶亞基PB2變體與SEQ ID NO 3 在100個氨基酸的長度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 的 序列相似性,優選序列同一性,與SEQ ID NO :3在110個氨基酸的長度上具有至少60%、 65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%,91 92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與SEQ ID NO :3在120個氨基酸的長度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性,優選序列同一性,與SEQ ID NO :3在130個氨基酸的長度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與 SEQ ID NO :3在 140個氨基酸的長度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%, 95%,96%,97%,98%, 99%的序列相似性,優選序列同一性,與SEQ ID NO :3在150個氨基酸的長度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與 SEQ ID NO :3 在 160 個氨基酸的長度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性,優選序列同一性,與SEQ ID NO :3在165個氨基酸的長度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與 SEQ ID NO :3在 170個氨基酸的長度上具有至少60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性,優選序列同一性,與SEQ ID NO 3在180個氨基酸的長度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與 SEQ ID NO :3在 190 個氨基酸的長度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性,優選序列同一性,與SEQ ID NO :3在200個氨基酸的長度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與 SEQ ID NO :3 在 210 個氨基酸的長度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性,優選序列同一性,與SEQ ID NO 3在220個氨基酸的長度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與 SEQ ID NO :3 在 230個氨基酸的長度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性,優選序列同一性,與SEQ ID NO :3在240個氨基酸的長度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,與 SEQID NO :3 在 250 個氨基酸的長度上具有至少 60%、65%、70%、80%、81%、82%、83%、84%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99%的序列相似性,優選序列同一性,與SEQ ID NO 3在300個氨基酸的長度上具有至少 60%,65%,70%,80%,81 %,82%,83%,84%,84%,85%,86%,87%,88%,89%,90%, 91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性,優選序列同一性。SEQ ID NO :1、2或3的大量天然PB2序列變體是已知的,并已記載于文獻中。所 有這些PB2變體均包括在內,并可以是本發明可溶性片段的基礎。對于甲型流感病毒,如 果SEQ ID NO :1用作參考序列的話,優選實例包含一個或多個下列氨基酸位置的突變 Val227、Arg251、Ile255、Ser271、Gln288、Ile338、Val344、Arg355、Ile373、Leu374、Asn456、 Val 461和/或Ser497。在一個優選實施方案中,所述變體包含下列突變中的一個或多 個Val227Met、Arg251Lys、Ile255Val、Ile255Thr、Ser271Ala、Gln288Leu、Ile338Val、 Ile338Thr、Val344Leu、Arg355Lys、Ile373Thr、Leu374Ile、Asn456Ser、Val461Ile 和 / 或 Ser497Asn0優選的甲型流感病毒PB2亞基變體包含導致氨基酸從精氨酸變成賴氨酸的389 位突變(例如SEQ ID NO :11),其任選地與上述突變中的一個或多個相組合。如果SEQID NO 2用作參考序列的話,乙型流感病毒PB2亞基的優選變體包含一個或多個下列氨基酸 位置的突變Thr254、Met261、Ile269、Thr30U Ile303、Leu319、Ile346、Lys380、Arg382、 Met383、Lys385、Lys397、Asn442、Ser456、Glu467、Leu468 和 / 或 Thr494。在一個優選實施 方案中,PB2亞基變體包含下列突變中的一個或多個Thr254Ala、Met261Thr、Ile269Val、 Thr301Ala、Ile303Leu、Leu319Gln、Ile346Val、Lys380Gln、Arg382Lys、Met383Leu、 Lys385Arg、Lys397Arg、Asn442Ser、Ser456Pro、Glu467Gly、Leu468Ser 和 / 或 Thr494Ile。 如果SEQ ID NO 3用作參考序列的話,乙型流感病毒PB2亞基的優選變體包含下列一個或 多個氨基酸位置的突變Leu311、Pro330和/或Ser436。在一個優選實施方案中,所述突變 為:Leu311Pro,Pro3 30Gln 和 / 或 Ser436Thr0因此,本發明可溶性片段基于如上定義的RNA依賴性RNA聚合酶亞基PB2或其變 體。因此,在下面的說明中,術語“可溶性多肽片段”和“PB2多肽片段”均包括來自SEQ ID NO :1、2或3所示PB2蛋白的片段以及來自如上所述其PB2蛋白變體的片段,其能夠結合RNA 帽或其類似物。但是,本說明書也使用術語“PB2多肽片段變體”或“PB2片段變體”具體表 示來自RNA依賴性RNA聚合酶亞基PB2變體的能夠結合RNA帽或其類似物的可溶性PB2片 段。因此,本發明的可溶性PB2片段優選包含天然流感病毒亞基PB2的序列、基本由其組成 或者由其組成。但是,也認為?82片段變體還含有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15 或更多個氨基酸位置處的氨基酸取代,并在使用最佳序列比對的全長上和/或在最佳序列 比對區域中與SEQ ID NO :1、2或3所示氨基酸序列具有至少60%、65%、70%、80%、81%、 82%,83%,84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%, 97%,98%,99%的序列相似性,優選序列同一性,其中最佳序列比對可使用本領域已知工 具獲得,例如Align,其使用標準設置,優選EMBOSS: :needle、Matrix :Blosum62、缺口打開 10. 0、缺口延伸0. 5。應理解,本發明的PB2片段可包含不來自于PB2的其它氨基酸,例如標 簽、酶等等,在此類比對中不考慮這些其它氨基酸,即在比對得分的計算中將其排除在外。 在一個優選實施方案中,在將片段序列與SEQ ID而1、2或3比對時在至少100、110、120、 130、140、150、160、165、170、180、190、200、210、220、230、240、250、260 或 270 個氨基酸的長度上獲得上述比對分數,其中SEQ IDNO :1、2或3的各自序列優選包含RNA帽結合口袋。 在一個優選實施方案中,可溶性PB2多肽片段變體包含至少對應于甲型流感病 毒PB2的323至404位氨基酸殘基(SEQ ID NO 13)的氨基酸殘基,或者由其組成,并且在 使用最佳序列比對的片段全長上和/或在最佳序列比對區域中與SEQ ID N0:13所示氨 基酸序列具有至少 80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,其中最佳序 列比對可使用本領域已知工具獲得,例如Align,其使用標準設置,優選EMBOSS :needle. Matrix :Blosum62、缺口打開10. 0、缺口延伸0. 5,更優選所述PB2多肽片段變體包含至少 對應于甲型流感病毒PB2的318至483位氨基酸殘基(SEQ ID NO :11)的氨基酸殘基,并 且在使用最佳序列比對的片段全長上和/或在最佳序列比對區域中與SEQID NO 11所示 氨基酸序列具有至少70%、更優選75%、更優選80%、81%、82%、83%、84%、85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性, 優選序列同一性,其中最佳序列比對可使用本領域已知工具獲得,例如Align,其使用標準 設置,優選EMBOSS: needle、Matrix :Blosum62、缺口打開10. 0、缺口延伸0. 5,更優選所述 PB2多肽片段變體包含至少對應于甲型流感病毒PB2的235至496位氨基酸殘基(SEQ ID NO 4)的氨基酸殘基,并且在使用最佳序列比對的片段全長上和/或在最佳序列比對區域 中與SEQ IDNO :4所示氨基酸序列具有至少60%、更優選65%、更優選70%、更優選75%、 更優選 80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%, 94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,其中最佳序列比對可 使用本領域已知工具獲得,例如Align,其使用標準設置,優選EMBOSS: :needle. Matrix Blosum62、缺口打開10. 0、缺口延伸0. 5,更優選所述PB2多肽片段變體包含至少對應于甲 型流感病毒PB2的220至510位氨基酸殘基的氨基酸殘基,并且與SEQ ID NO=I中所示氨 基酸序列在使用最佳序列比對的全長上和/或在最佳序列比對區域中具有至少60%、更優 選 65%、更優選 70%、更優選 75%、更優選 80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性,優選 序列同一性,其中最佳序列比對可使用本領域已知工具獲得,例如Align,其使用標準設置, 優選 EMBOSS: :needle、Matrix :Blosum62、缺口打開 10. 0、缺口延伸 0. 5。在一些優選實施 方案中,本發明的甲型流感病毒PB2多肽片段變體與SEQ ID NO :1相比包含突變,優選天然 突變,例如下列氨基酸殘基中一個或多個的突變Val227、Arg251、Ile255、Ser271、Gln288、 Ile338、Val344、Arg355、Ile373、Leu374、Lys389、Asn456、Val 461 和 / 或 Ser497。在一些優 選實施方案中,所述突變如下Val227Met、Arg251Lys、Ile255Val、Ile255Thr、Ser271Ala、 Gln288Leu、Ile338Val、Ile338Thr、Val344Leu、Arg355Lys、Ile373Thr、Leu374Ile、Lys389、 Asn456Ser、Val461Ile和/或Ser497Asn。甲型流感病毒PB2亞基片段的一個優選變體包 含導致氨基酸由精氨酸變成賴氨酸的389位突變(例如SEQ ID NO 11),其任選地與一個 或多個前述突變相組合。在一個優選實施方案中,PB2多肽片段變體包含至少對應于乙型流感病毒PB2的 325至406位氨基酸殘基(來自于SEQ ID NO 2)的氨基酸殘基,或者由其組成,并且與SEQ ID NO 2所示氨基酸序列在使用最佳序列比對的全長上和/或在最佳序列比對區域中具 有至少 80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,其中最佳序列比對可 使用本領域已知工具獲得,例如Align,其使用標準設置,優選EMBOSS: :needle. Matrix Blosum62、缺口打開10. 0、缺口延伸0. 5,更優選地,所述PB2多肽片段變體包含至少對應于 乙型流感病毒PB2的320至484位氨基酸殘基(來自于SEQ ID NO 2)的氨基酸殘基,并 且與SEQ ID NO :2所示氨基酸序列在使用最佳序列比對的全長上和/或在最佳序列比對 區域中具有至少 70%,更優選 75%,更優選 80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 的序列相似性,優選 序列同一 性,其中最佳序列比對可使用本領域已知工具獲得,例如Align,其使用標準設置, 優選EMBOSS: :needle,Matrix :Blosum62、缺口打開 10. 0、缺口延伸 0· 5,更優選地,所述PB2 多肽片段變體包含至少對應于乙型流感病毒PB2的237至497位氨基酸殘基(來自于SEQ ID NO 2)的氨基酸殘基,并且與SEQ ID NO :2中所示氨基酸序列在使用最佳序列比對的全 長上和/或在最佳序列比對區域中具有至少60 %,更優選65 %,更優選70 %,更優選75 %, 更優選 80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%, 94%、95%、96%、97%、98%、99%的序列相似性,優選序列同一性,其中最佳序列比對可 使用本領域已知工具獲得,例如Align,其使用標準設置,優選EMBOSS: meedle、Matrix Blosum62、缺口打開10. 0、缺口延伸0. 5,更優選地,所述PB2多肽片段變體包含至少對應于 乙型流感病毒PB2的222至511位氨基酸殘基(來自于SEQ ID NO 2)的氨基酸殘基,并且 與SEQ ID NO :2中所示氨基酸序列在使用最佳序列比對的全長上和/或在最佳序列比對區 域中具有至少60%,更優選65%,更優選70%,更優選75%,更優選80%、81%、82%、83%、 84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%,98%, 99 %的序列相似性,優選序列同一性,其中最佳序列比對可使用本領域已知工具獲得,例如 Align,其使用標準設置,優選 EMBOSS: :needle、Matrix :Blosum62、缺口打開 10. 0、缺口延 伸0.5。。在一些優選實施方案中,本發明的乙型流感病毒PB2多肽片段變體與SEQ ID NO 2相比包含下列氨基酸殘基中一個或多個的突變,優選天然突變Thr254、Met261、Ile269、 Thr301、Ile303、Leu319、Ile346、Lys380、Arg382、Met383、Lys385、Lys397、Asn442、Ser456、 Glu467、Leu468和/或Thr494。在一些優選實施方案中,所述片段變體包含一個或多個下 列突變Thr254Ala、Met261Thr、Ile269Val、Thr301Ala、Ile303Leu、Leu319Gln、Ile346Val、 Lys380Gln、Arg382Lys、Met383Leu、Lys385Arg、Lys397Arg、Asn442Ser、Ser456Pro、 Glu467Gly、Leu468Ser 和 / 或 Thr494Ile。 在一個優選實施方案中,所述PB2多肽片段變體包含至少對應于丙型流感病毒 PB2的335至416位氨基酸殘基(來源于SEQ ID NO 3)的氨基酸殘基或由其組成,并且在 片段全長上與SEQ ID NO :3所示氨基酸序列具有至少80%,優選85%,更優選90%,最優選 95%的序列相似性,更優選地,所述PB2多肽片段變體包含至少對應于丙型流感病毒PB2的 330至501位氨基酸殘基(來源于SEQ ID NO 3)的氨基酸殘基,并且在片段全長上與SEQ ID NO 3所示氨基酸序列具有至少70 %,更優選75 %,更優選80 %,優選85 %,最優選90 % 的序列相似性,更優選地,所述PB2多肽片段變體包含至少對應于丙型流感病毒PB2的242 至514位氨基酸殘基(來源于SEQ ID NO :3)的氨基酸殘基,并且在片段全長上與SEQ IDNO 3所示氨基酸序列具有至少60 %,更優選65 %,更優選70 %,更優選75 %,更優選80 %,優 選85 %,最優選90 %的序列相似性,更優選地,所述PB2多肽片段變體包含至少對應于丙型流感病毒PB2的227至528位氨基酸殘基(來源于SEQ ID NO 3)的氨基酸殘基,并且在片 段全長上與SEQ ID NO: 3所示氨基酸序列具有至少60%,更優選65%,更優選70%,更優 選75 %,更優選80 %,優選85 %,最優選90 %的序列相似性。在一些優選實施方案中,本發 明的丙型流感病毒PB2多肽片段變體與SEQID NO 3相比包含突變,優選天然突變,例如一 個或多個下列氨基酸殘基的突變Leu311、Pro330和/或Ser436。在一個優選實施方案中, 所述片段變體包含一個或多個下列突變Leu311Pro、Pro330Gln和/或Ser436Thr。術語“序列相似性”表示最佳序列比對中相同位置處的氨基酸相同或相似,優選相 同。“相似氨基酸”具有相似的特征,例如極性、溶解度、親水性、疏水性、電荷或者大小。相似 氨基酸優選為亮氨酸、異亮氨酸和纈氨酸;苯丙氨酸、色氨酸和酪氨酸;賴氨酸、精氨酸和 組氨酸;谷氨酸和天冬氨酸;甘氨酸、丙氨酸和絲氨酸;蘇氨酸、天冬酰胺、谷氨酰胺和甲硫 氨酸。本領域技術人員非常了解序列相似性檢索工具,例如可從萬維網(World Wide Web) 獲得(例如 www, ebi. ac. uk/Tools/similarity, html)。本文所用的術語“可溶”表示在生理等滲條件(例如0. 14M氯化鈉或蔗糖)下, 在蛋白質濃度高達5mg/ml時,不含有效濃度變性劑(例如胍或尿素)的水性緩沖液中以 IOOOOOXg離心30分鐘后保留在上清液中的多肽片段。檢測其溶解度的蛋白質片段優選 在下文所述細胞表達系統之一中表達。特別優選地,這些蛋白質片段的表達(優選還有純 化)如下文實施例2中更詳細描述地那樣進行。 涉及多肽時,術語“純化的”不需要是絕對純化的,例如均一制備物,而是表示所 述多肽相對于自然環境中來說相對更純。通常,純化的多肽基本上不含其它蛋白質、脂類、 碳水化合物或與其天然相關的物質,優選為功能顯著性水平,例如至少85%純,更優選至 少95%純,最優選至少99%純。表述“純化至適于結晶的程度”指蛋白質的純度為85%至 100%,優選90%至100%,更優選95%至100%,并可濃縮至高于3mg/ml,優選高于IOmg/ ml,更優選高于18mg/ml,而沒有沉淀。本領域技術人員可使用蛋白質純化的標準技術來純 化多肽。基本純化的多肽會在非還原性聚丙烯酰胺凝膠上產生單個主要條帶。在使用本發明方法鑒定化合物的上下文中使用的術語“相結合”表示部分(即化 學實體或化合物或其部分或片段)與PB2的結合口袋之間接近的狀態。所述結合可以是非 共價的,即例如氫鍵、范德華力、靜電或疏水性相互作用在能量上有利于接近,或者也可以 是共價的。術語“RNA帽”指可見于mRNA分子5'端的帽結構,其由通過非常見5'至5'三磷 酸鍵連接到mRNA的鳥苷酸組成。此鳥苷在7位甲基化。其它修飾包括mRNA 5'端前三個核 糖中2'羥基的可能的甲基化。“RNA帽類似物”指類似于RNA帽結構的結構。RNA帽類似物 的實例包括-J-甲基鳥苷(m7G)、7_甲基鳥苷單磷酸(m7GMP)、7-甲基鳥苷三磷酸(m7GTP)、 通過5’至5’三磷酸鍵連接到鳥苷的7-甲基鳥苷(m7GpppG)、通過5’至5’三磷酸鍵連接 到在核糖2’ OH位發生甲基化之鳥苷的7-甲基鳥苷(m7GpppGm)、通過5’至5’三磷酸鍵連 接到腺苷的7-甲基鳥苷(m7GpppA)、通過5’至5’三磷酸鍵連接到在核糖2’ OH位發生甲 基化之腺苷的7-甲基鳥苷(m7GpppAm)、通過5’至5’三磷酸鍵連接到胞苷的7-甲基鳥苷 (m7GpppC)、通過5’至5’三磷酸鍵連接到在核糖2’ OH位發生甲基化之胞苷的7-甲基鳥苷 (m7GpppCm)、通過5’至5’三磷酸鍵連接到尿苷的7-甲基鳥苷(m7GpppU)、通過5’至5’三 磷酸鍵連接到在核糖2’ OH位發生甲基化之尿苷的7-甲基-鳥苷(m7GpppUm)。因此,在本發明的一個優選實施方案中,所述帽類似物選自m7G、m7GMP、m7GTP、m7GpppN,m7GpppNm,其中 N是核苷酸,優選G、A、U或C。在另一個優選實施方案中,RNA帽類似物可包含另外的例如 1至15個核苷酸,即1、2、3、4、5、6、7、8、9、10、11、12、13、14或15個,其中所述核苷酸優選獨 立地選自A、C、G、U和/或T。這些另外的核苷酸優選通過磷酸酯、磷酸二酯或者磷酸三酯 鍵或者其不可水解的類似物連接至m7GpppN或m7GpppNm中的第一核苷酸N。本文使用的術語“核苷酸”表示由在Γ位與戊糖相連的嘌呤、氮雜嘌呤或嘧啶 核苷酸堿基(例如腺嘌呤、鳥嘌呤、胞嘧啶、尿嘧啶、胸腺嘧啶、氮雜腺嘌呤、氮雜鳥嘌呤 等)組成的化合物,包括2'-脫氧和2'-羥基形式,例如Kornberg and Baker, DNA R印lication,第二版(Freeman,SanFrancisco, 1992)中所述的,還包括但不限于具有經修 飾堿基部分和/或經修飾糖部分的合成核苷,例如由Scheit,Nucleotide Analogs (John Wiley, N. Y.,1980)中一般性描述的。
術語“結合口袋”表示由本發明多肽片段形成的三維結構,即PB2的RNA帽結合結 構域,其由直接接觸RNA帽的氨基酸殘基或者使直接接觸RNA帽的氨基酸殘基定位的氨基 酸殘基(第二層氨基酸殘基)排列而成,所述氨基酸殘基為例如Arg332和Ser337。由于其 形狀,所述結合口袋接納RNA帽或其類似物。PB2的RNA帽結合口袋由結構坐標所定義,所 述結構坐標來自于對包含RNA帽結合位點的PB2多肽片段與RNA帽類似物之間的復合物的 晶體結構數據分析。術語“結合口袋”還包含PB2多肽片段變體的結合口袋。術語“PB2的RNA帽結合結構域”表示在其天然三維結構中包含RNA結合口袋的 PB2最小多肽片段。術語“分離的多核苷酸”表示這樣的多核苷酸,其為(i)從其天然環境中分離, (ii)通過聚合酶鏈式反應擴增的,或者(iii)全部或部分合成的,還表示脫氧核糖核苷酸 或核糖核苷酸堿基的單鏈或雙鏈多聚體,包括DNA和RNA分子,有義和反義鏈。該術語包括 cDNA,基因組DNA以及重組DNA。多核苷酸可由完整基因或其部分組成。本文使用術語“重組載體”包括本領域技術人員已知的任何載體,包括質粒載體、 粘粒載體、噬菌體載體(例如λ噬菌體)、病毒載體(例如腺病毒或桿狀病毒載體)、或者 人工染色體載體(例如細菌人工染色體(BAC)、酵母人工染色體(YAC)或者Pl人工染色體 (PAC))。所述載體包括表達載體及克隆載體。表達載體包括質粒和病毒載體,一般含有所 需的編碼序列以及在特定宿主生物(例如細菌、酵母、植物、昆蟲或哺乳動物)中或體外表 達系統中表達與其有效連接之編碼序列的合適DNA序列。克隆載體一般用于改造和擴增某 些需要的DNA片段,可能缺乏表達所需DNA片段需要的功能序列。本文使用的“重組宿主細胞”表示包含編碼目的多肽片段(即本發明的ΡΒ2多肽 片段或其變體)的多核苷酸的宿主細胞。此多核苷酸可以如下方式存在于宿主細胞中(i) 自由分散的,( )并入重組載體中,或者(iii)整合在宿主細胞基因組或線粒體DNA中。重 組細胞可用于表達目的多核苷酸,或者用于擴增本發明的多核苷酸或重組載體。術語“重組 宿主細胞”包括以本發明多核苷酸或重組載體進行轉化、轉染或感染的原始細胞的后代。重 組宿主細胞可以是細菌細胞,例如大腸桿菌細胞;酵母細胞例如釀酒酵母(Saccharomyces cerevisiae)或巴斯德畢赤酵母(Pichia pastoris);植物細胞;昆蟲細胞例如SF9或Hi5 細胞;或者哺乳動物細胞。優選的哺乳動物細胞實例有中國倉鼠卵巢(CHO)細胞、非洲綠猴 腎(COS)細胞、人胚腎(HEK293)細胞、HELA細胞,等等。
本文使用的術語“晶體”或“結晶”表示這樣的結構(例如三維固體聚集體),其中 平面以確定的角度相交,并且其中化學組成物質有規則的結構(例如內部結構)。術語“晶 體”可包括下列任一項固體物理晶形例如實驗制備的晶體,來源于晶體的晶體結構(包括 二級和/或三級和/或四級結構元件),基于晶體結構的2D和/或3D模型,其表示例如其 略圖或者圖示,或者用于計算機的其數據集。在一個方面中,所述晶體可用于X射線晶體 衍射技術。在這里,所用的晶體可承受暴露于X射線束并用于產生解析X射線晶體結構所 需的衍射圖樣數據。晶體可以表征為能夠以T.L. Blundell和L.N.Johnson,‘‘ Protein Crystallography" ,Academic Press,New York(1976)所示晶形之一所定義的衍射 X 射線 圖樣。 術語“晶胞”指基本的平行六面體形的單元。晶體的整個體積可以由規則裝配的 這些單元構建而成。每個晶胞包含圖樣單元的完整表示,對其進行重復而構建出所述晶體。術語“空間群”指晶體對稱元素的排布。在空間群的命名中,大寫字母表示晶格類 型,其它符號表示可以在不改變外觀的情況下對不對稱單元內容進行的對稱操作。術語“結構坐標”指定義一個或多個氨基酸殘基相對于坐標系的位置的一組數值。 該術語指定義分子三維結構的數據集(例如笛卡兒坐標、溫度因子和占位率)。結構坐標可 略微改變,但仍保持幾乎相同的三維結構。獨特結構坐標組的度量是所得結構的均方根差。 本領域普通技術人員可以將產生均方根差小于3埃、2埃、1. 5埃、1. 0埃或0. 5埃的彼此偏 差的三維結構(特別是結合口袋的三維結構)的結構坐標視為非常類似的。術語“均方根差”表示與平均值的偏差的平方的算術平均值的平方根。這是表示 與趨勢或目標的偏差或偏離的一種方法。出于本發明的目的,“均方根差”定義了 PB2多肽 片段變體主鏈或者其中RNA帽結合口袋與圖18的PB2-m7GTP復合物的結構坐標所定義的 PB2主鏈或者其中RNA帽結合口袋之間的偏差。本文所使用的術語“構建計算機模型”包括基于原子結構信息和相互作用模型進 行的分子結構和/或功能的定量和定性分析。術語“建模”包括常規基于數字的分子動力 學和能量最低化模型,交互式計算機圖像模型,經修改的分子力學模型,距離幾何以及其它 基于結構的約束模型。術語“擬合程序操作”表示利用化學實體、結合口袋、分子或分子復合物或其部分 的結構坐標從而將所述化學實體與結合口袋、分子或分子復合物或其部分相結合的操作。 這可通過在所述結合口袋中定位、旋轉或移動所述化學實體以匹配所述結合口袋的形狀和 靜電互補性來實現。可對共價相互作用、非共價相互作用(例如氫鍵、靜電、疏水、范德華力 相互作用以及非互補靜電相互作用例如排斥電荷_電荷、偶極_偶極和電荷_偶極相互作 用)進行優化。或者,可使得所述化學實體與所述結合口袋的結合形變能量最小化。本文使用的術語“測試化合物”指包含測試其結合所述目的多肽片段之能力的化 合物、分子或復合物的物質,即包含RNA帽結合口袋的本發明PB2多肽片段或其變體。測試 化合物可以是任何物質,包括但不限于肽、擬肽、多肽、蛋白質(包括抗體)、脂類、金屬、核 苷酸、核苷酸類似物、核苷、核酸、小有機或無機分子、化合物、元素、糖類、同位素、碳水化合 物、造影劑、脂蛋白、糖蛋白、酶、分析探針、聚胺以及其組合和衍生物。術語“小分子”指分 子量為50至約2500道爾頓、優選200-800道爾頓的分子。另外,本發明的測試化合物可任 選地包含檢測標記。這些標記包括但不限于,酶標記、放射性同位素或者放射性化合物或元素、熒光化合物或金屬、化學發光化合物和生物發光化合物。可使用公知方法將這些檢測標 記連接到測試化合物。本發明的測試化合物還可包含物質的復雜混合物,例如含有天然產 物的提取物,或者混合的組合合成的產物。它們也可以被測試,并且可在后續步驟中從所述 混合物中純化出結合靶標多肽片段的組分。測試化合物可衍生自或選自合成或天然化合 物的文庫。例如,合成化合物文庫可購自Maybridge Chemical Co. (Trevillet,Cornwall, UK), ChemBridge Corporation (San Diego, CA) ^Aldrich (Milwaukee, WI) 。 文庫例如可得自TimTec LLC (Newark,DE)。或者,可使用細菌、真菌、植物和動物細胞以及 組織提取物形式的天然化合物文庫。另外,測試化合物可使用組合化學法作為單個化合物 或混合物合成產生。使用組合化學法制成的化合物集合在本文中稱為組合文庫。術語“高通量形式”指多種類型的高通量篩選測定和技術,其用于篩選測試化合物 文庫結合目的多肽片段的能力。通常,以多孔形式進行高通量測定,其包括無細胞測定以及 基于細胞的測定。術語“抗體”表示單克隆和多克隆抗體,即任何免疫球蛋白或其能夠識別抗原或半 抗原的部分,即識別PB2的RNA帽結合結構域或其肽。抗原結合部分可通過重組DNA技術或 者酶或化學切割完整抗體的方法產生。在一些實施方案中,抗原結合部分包括Fab、Fab'、 F(ab' )2、Fd、Fv、dAb以及互補性決定區(OTR)片段、單鏈抗體(scFv)、嵌合抗體例如人源 化抗體、雙抗體以及含有抗體中至少足以賦予與多肽特異性抗原結合的部分的多肽。
術語“可藥用鹽”指可通過本發明方法鑒定的化合物或本發明化合物的鹽。合適 的可藥用鹽包括酸加成鹽,其可以例如通過將本發明化合物的溶液與可藥用酸(如鹽酸、 硫酸、延胡索酸、馬來酸、琥珀酸、乙酸、苯甲酸、檸檬酸、酒石酸、碳酸或磷酸)的溶液混合 來形成。此外,當所述化合物帶有酸性部分時,合適的可藥用鹽可包括堿金屬鹽(例如鈉 鹽或鉀鹽);堿土金屬鹽(例如鈣或鎂鹽);以及由合適的有機配體形成的鹽(例如銨,季 銨,以及使用反陰離子(counteranion)例如鹵化物、氫氧化物、羧酸根、硫酸根、磷酸根、 硝酸根、烷基磺酸根和芳基磺酸根形成的胺陽離子)。可藥用鹽的示例性實例包括但不限 于乙酸鹽、己二酸鹽、藻酸鹽、抗壞血酸鹽、天冬氨酸鹽、苯磺酸鹽、苯甲酸鹽、碳酸氫鹽、硫 酸氫鹽、酒石酸氫鹽、硼酸鹽、溴化物、丁酸鹽、乙二胺四乙酸鈣、樟腦酸鹽、樟腦磺酸鹽、右 旋樟腦磺酸鹽、碳酸鹽、氯化物、檸檬酸鹽、克拉維酸鹽、環戊烷丙酸鹽、二葡萄糖酸鹽、二鹽 酸鹽、十二烷基硫酸鹽、依地酸鹽、乙二磺酸鹽、依托酸鹽、乙磺酸鹽(esylate)、乙磺酸鹽 (ethanesulfonate)、甲酸鹽、延胡索酸鹽、葡庚糖酸鹽、葡萄糖酸鹽、葡糖酸鹽、谷氨酸鹽、 甘油磷酸鹽、羥乙酰基對氨基苯基砷酸鹽、半硫酸鹽、庚酸鹽、己酸鹽、己基間苯二酸鹽、海 胺鹽(hydrabamine)、氫溴酸鹽、鹽酸鹽、氫碘酸鹽、2-羥基-乙磺酸鹽、羥基萘酸鹽、碘化 物、異硫代硫酸鹽(isothionate)、乳酸鹽、乳糖酸鹽、月桂酸鹽、月桂基硫酸鹽、蘋果酸鹽、 馬來酸鹽、丙二酸鹽、扁桃酸鹽、甲磺酸鹽(mesylate)、甲磺酸鹽(methanesulfonate)、甲 基硫酸鹽、粘酸鹽、2-萘磺酸鹽、萘磺酸鹽、煙酸鹽、硝酸鹽、N-甲基葡糖胺銨鹽、油酸鹽、草 酸鹽、撲酸鹽(雙羥萘酸鹽)、軟脂酸鹽、泛酸鹽、pectinate、過硫酸鹽、3-苯基丙酸鹽、磷 酸鹽/ 二磷酸鹽、苦味酸鹽、特戊酸鹽、多聚半乳糖醛酸鹽、丙酸鹽、水楊酸鹽、硬脂酸鹽、硫 酸鹽、堿式醋酸鹽、琥珀酸鹽、單寧酸鹽、酒石酸鹽、茶氯酸鹽、甲苯磺酸鹽、三乙基碘化物、 -j^一酸鹽、戊酸鹽等(參見例如 S. M. Berge等,〃 Pharmaceutical Salts",J. Pharm. Sci., 66,1-19 頁(1977))。
在用于本文時術語“賦形劑”用于表示藥物制劑中不是活性成分的所有物質,例如 載體、粘合劑、潤滑劑、增稠劑、表面活性劑、防腐劑、乳化劑、緩沖劑、調味劑或著色劑。術語“可藥用載體”包括例如碳酸鎂、硬脂酸鎂、滑石、糖、乳糖、果膠、糊精、淀粉、 明膠、黃芪膠、甲基纖維素、羧甲基纖維素鈉、低熔點蠟、可可脂等。
本發明人發現了來自流感病毒RNA依賴性RNA聚合酶亞基PB2的片段,其為可溶 性的并且能夠結合RNA帽或其類似物,因此適于進行結晶以得到結構信息,同時還使用重 組蛋白質進行了結合研究。本發明的一個方面提供了可溶性多肽片段,其中所述多肽片段 (i)來自流感病毒RNA依賴性RNA聚合酶亞基PB2,并且(ii)能夠結合RNA帽或其類似物。 作為本發明可溶性片段之來源的RNA依賴性RNA聚合酶亞基PB2優選來自甲型、乙型或丙 型流感病毒。本發明可溶性片段的最小長度由結合RNA帽或其類似物的能力決定。因此, 優選本發明的PB2多肽片段包含至少SEQ ID NO 1的323至404位或320至483位氨基酸 殘基或者例如PB2多肽片段變體中相應的氨基酸,或者由其組成;包含至少SEQ ID N0:2的 325至406位或者320至484位氨基酸殘基,或者例如PB2多肽片段變體中相應的氨基酸或 者由其組成;包含至少SEQ ID NO 3的335至416位或者330至501位氨基酸殘基或者例 如PB2多肽片段變體中相應的氨基酸,或者由其組成。另一方面,已觀察到,如果長度超出 某些C端和/或N端邊界,則所述片段的溶解度降低。對于來自甲型流感的可溶性片段,優 選這些邊界(參照SEQ ID NO 1)在N端為220位氨基酸或者變體中與其對應的氨基酸,C 端為510位氨基酸或者變體中與其對應的氨基酸。對于來自乙型流感的可溶性片段,優選 這些邊界(參照SEQ ID NO 2)在N端為222位氨基酸或者變體中與其對應的氨基酸,在C 端為511位氨基酸或者變體中與其對應的氨基酸。對于來自丙型流感的可溶性片段,優選 這些邊界(參照SEQ ID NO :3)在N端為227位氨基酸或者變體中與其對應的氨基酸,在 C端為528位氨基酸或者變體中與其對應的氨基酸。在此背景下,術語“可溶”表示多肽片 段能以至少0. lmg/ml溶劑的濃度溶解,更優選至少0. 5mg/ml,更優選至少lmg/ml,更優選 5mg/ml或更高。合適的溶劑是緩沖體系,其包含濃度0. OlM至3M的TrisHCl,優選0. 05M 至2M,更優選0. IM至1M,pH3至pH9,優選pH4至pH9,更優選pH7至pH9,并任選地包含濃 度為ImM至20mM的還原劑例如二硫蘇糖醇(DTT)或者TCEP. HCl (Tris (2-羧乙基)膦鹽酸
^rt. ) ο在一個優選實施方案中,所述多肽片段純化至適于結晶的程度。優選地,純度 為至少 95%,96%,98%,99%,99. 1 % ,99. 2 % ,99. 3 % ,99. 4 % ,99. 5 % ,99. 6 % ,99. 7 %, 99. 8%,99. 9%。可通過標準方法評估蛋白質的純度,包括SDS聚丙烯酰胺凝膠電泳和通過 銀染進行染色,或者HPLC并在280nm檢測。在另一個優選實施方案中,(i)所述多肽片段的N端與SEQ ID NO=I的PB2氨基酸序列中220位更高位或 例如 225、230、235、240、245、250、255、260、265、270、275、280、285、290、295、300、305、310、 315、320或323位的氨基酸相同或相對應,所述多肽片段的C端與SEQ ID N0:1的PB2氨基 酸序列中510位或更低位例如505、500、495、490、489、488、487、486、485、484或483位的氨 基酸相同或相對應,更優選地,所述多肽片段的N端與220位氨基酸相同或相對應,所述多 肽片段的 C 端與 510、505、500、495、490、489、488、487、486、485、484 或 483 位的氨基酸相同 或相對應;更優選地,所述多肽片段的N端與225位或更高位氨基酸相同或相對應,所述多肽片段的C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相對應;更優選地,所述多肽片段的N端與230位或更高位氨基酸相同 或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相對應;更優選地,所述多肽片段的N端與235位或更高位氨基酸相同 或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相對應;更優選地,所述多肽片段的N端與240位或更高位氨基酸相同 或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相對應;更優選地,所述多肽片段的N端與245位或更高位氨基酸相同 或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相對應;更優選地,所述多肽片段的N端與250位或更高位氨基酸相同 或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相對應;更優選地,所述多肽片段的N端與255位或更高位氨基酸相同 或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相對應;更優選地,所述多肽片段的N端與260位或更高位氨基酸相同 或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相對應;更優選地,所述多肽片段的N端與265位或更高位氨基酸相同 或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相對應;更優選地,所述多肽片段的N端與270位或更高位氨基酸相同 或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相對應;更優選地,所述多肽片段的N端與275位或更高位氨基酸相同 或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相對應;更優選地,所述多肽片段的N端與280位或更高位氨基酸相同 或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相對應;更優選地,所述多肽片段的N端與280位或更高位氨基酸相同 或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相對應;更優選地,所述多肽片段的N端與285位或更高位氨基酸相同 或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相對應;更優選地,所述多肽片段的N端與290位或更高位氨基酸相同 或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相對應;更優選地,所述多肽片段的N端與295位或更高位氨基酸相同 或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相對應;更優選地,所述多肽片段的N端與300位或更高位氨基酸相同 或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相對應;更優選地,所述多肽片段的N端與305位或更高位氨基酸相同 或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相對應;更優選地,所述多肽片段的N端與310位或更高位氨基酸相同 或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相對應;更優選地,所述多肽片段的N端與315位或更高位氨基酸相同 或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或
24483位氨基酸相同或相對應;更優選地,所述多肽片段的N端與320位或更高位氨基酸相同 或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、484或 483位氨基酸相同或相對應;或者;更優選地,所述多肽片段的N端與323位或更高位氨基 酸相同或相對應,C端與510位或更低位,特別是505、500、495、490、489、488、487、486、485、 484或483位氨基酸相同或相對應; (ii)所述多肽片段的N端與根據SEQ ID NO 2的PB2氨基酸序列中222位或更 高位例如 225、230、235、240、245、250、255、260、265、270、275、280、285、290、295、300、305、 310、315、320、325位氨基酸相同或相對應,C端與根據SEQ ID NO :2的PB2氨基酸序列 中 511 位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、490、489、 488、487、486、485或484位氨基酸相同或相對應;更優選地,所述多肽片段的N端與222位 氨基酸相同或相對應,C端與511位或更低位例如510、505、500、499、498、497、496、495、 494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相對應;更優選地, 所述多肽片段的N端與225位或更高位氨基酸相同或相對應,C端與511位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485 或 484 位氨基酸相同或相對應;更優選地,所述多肽片段的N端與230位或更高位氨基酸相同或相 對應,C 端與 511 位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、 490、489、488、487、486、485或484位氨基酸相同或相對應;更優選地,所述多肽片段的N端 與235位或更高位氨基酸相同或相對應,C端與511位或更低位例如510、505、500、499、 498、497、496、495、494、493、492、491、490、489、488、487、486、485 或 484 位氨基酸相同或相 對應;更優選地,所述多肽片段的N端與240位或更高位氨基酸相同或相對應,C端與511位 或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、 486,485或484位氨基酸相同或相對應;更優選地,所述多肽片段的N端與245位或更高 位氨基酸相同或相對應,C端與511位或更低位例如510、505、500、499、498、497、496、495、 494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相對應;更優選地, 所述多肽片段的N端與250位或更高位氨基酸相同或相對應,C端與511位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485 或 484 位氨基酸相同或相對應;更優選地,所述多肽片段的N端與255位或更高位氨基酸相同或相 對應,C 端與 511 位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、 490、489、488、487、486、485或484位氨基酸相同或相對應;更優選地,所述多肽片段的N端 與260位或更高位氨基酸相同或相對應,C端與511位或更低位例如510、505、500、499、 498、497、496、495、494、493、492、491、490、489、488、487、486、485 或 484 位氨基酸相同或相 對應;更優選地,所述多肽片段的N端與265位或更高位氨基酸相同或相對應,C端與511位 或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、 486,485或484位氨基酸相同或相對應;更優選地,所述多肽片段的N端與270位或更高 位氨基酸相同或相對應,C端與511位或更低位例如510、505、500、499、498、497、496、495、 494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相對應;更優選地, 所述多肽片段的N端與275位或更高位氨基酸相同或相對應,C端與511位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485 或 484 位氨基酸相同或相對應;更優選地,所述多肽片段的N端與280位或更高位氨基酸相同或相
25對應,C 端與 511 位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、 490、489、488、487、486、485或484位氨基酸相同或相對應;更優選地,所述多肽片段的N端 與285位或更高位氨基酸相同或相對應,C端與511位或更低位例如510、505、500、499、 498、497、496、495、494、493、492、491、490、489、488、487、486、485 或 484 位氨基酸相同或相 對應;更優選地,所述多肽片段的N端與290位或更高位氨基酸相同或相對應,C端與511位 或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、 486,485或484位氨基酸相同或相對應;更優選地,所述多肽片段的N端與295位或更高 位氨基酸相同或相對應,C端與511位或更低位例如510、505、500、499、498、497、496、495、 494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相對應;更優選地, 所述多肽片段的N端與300位或更高位氨基酸相同或相對應,C端與511位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485 或 484 位氨基酸相同或相對應;更優選地,所述多肽片段的N端與305位或更高位氨基酸相同或相 對應,C 端與 511 位或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、 490、489、488、487、486、485或484位氨基酸相同或相對應;更優選地,所述多肽片段的N端 與310位或更高位氨基酸相同或相對應,C端與511位或更低位例如510、505、500、499、 498、497、496、495、494、493、492、491、490、489、488、487、486、485 或 484 位氨基酸相同或相 對應;更優選地,所述多肽片段的N端與315位或更高位氨基酸相同或相對應,C端與511位 或更低位例如 510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、 486,485或484位氨基酸相同或相對應;更優選地,所述多肽片段的N端與320位或更高 位氨基酸相同或相對應,C端與511位或更低位例如510、505、500、499、498、497、496、495、 494、493、492、491、490、489、488、487、486、485或484位氨基酸相同或相對應;或者更優選 地,所述多肽片段的N端與325位或更高位氨基酸相同或相對應,C端與511位或更低位例 如 510、505、500、499、498、497、496、495、494、493、492、491、490、489、488、487、486、485 或 484位氨基酸相同或相對應;或者 (iii)所述多肽片段的N端與根據SEQ ID NO :3的PB2氨基酸序列中227位或更 高位例如 230、235、240、245、250、255、260、265、270、275、280、285、290、295、300、305、310、 315、320、325、330或335位氨基酸相同或相對應,C端與根據SEQ ID NO 3的PB2氨基酸 序列中 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、509、
508、507、506、505、504、503、502或501位氨基酸相同或相對應;更優選地,所述多肽片段 的N端與227位或更高位氨基酸相同或相對應,C端與528位或更低位例如525、520、519、
518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或 501 位 氨基酸相同或相對應;更優選地,所述多肽片段的N端與230位或更高位氨基酸相同或相 對應,C 端與 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、
509、508、507、506、505、504、503、502或501位氨基酸相同或相對應;更優選地,所述多肽 片段的N端與235位或更高位氨基酸相同或相對應,C端與528位或更低位例如525、520、
519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502或 501 位氨基酸相同或相對應;更優選地,所述多肽片段的N端與240位或更高位氨基酸相同或相 對應,C 端與 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、 509、508、507、506、505、504、503、502或501位氨基酸相同或相對應;更優選地,所述多肽片段的N端與245位或更高位氨基酸相同或相對應,C端與528位或更低位例如525、520、 519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502 或 501 位氨基酸相同或相對應;更優選地,所述多肽片段的N端與250位或更高位氨基酸相同或相 對應,C 端與 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、 509、508、507、506、505、504、503、502或501位氨基酸相同或相對應;更優選地,所述多肽 片段的N端與255位或更高位氨基酸相同或相對應,C端與528位或更低位例如525、520、 519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502 或 501 位氨基酸相同或相對應;更優選地,所述多肽片段的N端與260位或更高位氨基酸相同或相 對應,C 端與 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、 509、508、507、506、505、504、503、502或501位氨基酸相同或相對應;更優選地,所述多肽 片段的N端與265位或更高位氨基酸相同或相對應,C端與528位或更低位例如525、520、 519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502 或 501 位氨基酸相同或相對應;更優選地,所述多肽片段的N端與270位或更高位氨基酸相同或相 對應,C 端與 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、 509、508、507、506、505、504、503、502或501位氨基酸相同或相對應;更優選地,所述多肽 片段的N端與275位或更高位氨基酸相同或相對應,C端與528位或更低位例如525、520、 519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502 或 501 位氨基酸相同或相對應;更優選地,所述多肽片段的N端與280位或更高位氨基酸相同或相 對應,C 端與 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、 509、508、507、506、505、504、503、502或501位氨基酸相同或相對應;更優選地,所述多肽 片段的N端與285位或更高位氨基酸相同或相對應,C端與528位或更低位例如525、520、 519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502 或 501 位氨基酸相同或相對應;更優選地,所述多肽片段的N端與290位或更高位氨基酸相同或相 對應,C 端與 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、 509、508、507、506、505、504、503、502或501位氨基酸相同或相對應;更優選地,所述多肽 片段的N端與295位或更高位氨基酸相同或相對應,C端與528位或更低位例如525、520、 519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502 或 501 位氨基酸相同或相對應;更優選地,所述多肽片段的N端與300位或更高位氨基酸相同或相 對應,C 端與 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、 509、508、507、506、505、504、503、502或501位氨基酸相同或相對應;更優選地,所述多肽 片段的N端與305位或更高位氨基酸相同或相對應,C端與528位或更低位例如525、520、 519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502 或 501 位氨基酸相同或相對應;更優選地,所述多肽片段的N端與227位或更高位相同或相對應, C 端與 310 位氨基酸或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、 509、508、507、506、505、504、503、502或501位氨基酸相同或相對應;更優選地,所述多肽 片段的N端與315位或更高位氨基酸相同或相對應,C端與528位或更低位例如525、520、 519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502 或 501 位氨基酸相同或相對應;更優選地,所述多肽片段的N端與320位或更高位氨基酸相同或相 對應,C 端與 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、
27509、508、507、506、505、504、503、502或501位氨基酸相同或相對應;更優選地,所述多肽 片段的N端與325位或更高位氨基酸相同或相對應,C端與528位或更低位例如525、520、 519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502 或 501 位氨基酸相同或相對應;更優選地,所述多肽片段的N端與330位或更高位氨基酸相同或相 對應,C 端與 528 位或更低位例如 525、520、519、518、517、516、515、514、513、512、511、510、 509、508、507、506、505、504、503、502或501位氨基酸相同或相對應;或者更優選地,所述多 肽片段的N端與335位或更高位氨基酸相同或相對應,C端與528位或更低位例如525、520、 519、518、517、516、515、514、513、512、511、510、509、508、507、506、505、504、503、502 或 501 位氨基酸相同或相對應。在另一個實施方案中,所述多肽片段由選自下列的氨基酸序列組成、基本由其組 成或者與其對應根據SEQ ID NO 4至13的氨基酸序列及其變體,其保留與RNA帽或其類 似物相結合的能力并且可溶。在一些優選實施方案中,所述多肽片段中包含氨基酸取代、插 入或缺失,優選如上文所述的天然突變。優選地,本發明的PB2多肽片段具有235至496位 (SEQID NO 4)、241 至 483 位(SEQ ID NO 5)、268 至 483 位(SEQ ID NO 6)、277 至 480 位 (SEQ ID NO 7)、281 至 482 位(SEQ ID NO 8)、290 至 483 位(SEQ ID NO 9)、295 至 482 位 (SEQ ID NO :10)、318 至 483 位(SEQID NO :11)、320 至 483 位(SEQ ID NO 12)或者 323 至 404位(SEQ IDNO=I3)氨基酸殘基或與其對應。在另一個方面中,本發明提供了包含如上所述PB2多肽片段和RNA帽或其類似 物的復合物。優選地,所述帽類似物選自m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、 m7GpppAm、m7GpppC、m7GpppCm、m7GpppU和m7GpppUm。在本發明的一個實施方案中,所述復合 物中的多肽片段由SEQ ID NO :11的氨基酸序列組成,所述帽類似物是m7GTP,所述復合物具 有圖18所示結構坐標所定義的結構。在一個優選實施方案中,任何本發明的復合物包含晶 型,優選空間群C2221;晶胞尺寸a = 9. 2納米,b = 9. 4納米,e = 22. 0納米士0. 3納米。 優選地,所述晶體以3. 0埃或更高的解析度衍射X射線,優選地2. 8埃或更高,更優選2. 6 埃或更高,最優選2. 4埃或更高。在一個實施方案中,適于結晶的蛋白質溶液可在水溶液中包含5mg/ml至20mg/ ml、優選8mg/ml至18mg/ml、更優選llmg/ml至15mg/ml濃度的PB2多肽片段或其變體,2mM 至10mM、優選3mM至8mM、更優選4mM至6mM濃度的RNA帽類似物,并任選地包含緩沖體系 例如濃度為0. OlM至3M、優選0. 05M至2M、更優選0. IM至1Μ,ρΗ3至pH9、優選pH4至pH9、 更優選PH7至pH9的Tris-HCl,并任選地包含還原劑例如濃度為ImM至20mM的二硫蘇糖 醇(DTT)或TCEP.HCl(Tris(2-羧乙基)膦鹽酸鹽)。在結晶溶液中,PB2多肽片段或其變 體或者包含所述PB2多肽片段或其變體和RNA帽或其類似物的復合物的純度優選為85%至 100%,更優選90%至100 %,甚至更優選95%至100%。為了產生晶體,將適于結晶的蛋白 質溶液與等體積的沉淀劑溶液例如甲酸鈉、硫酸銨、多種大小的聚乙二醇相混合。在一個優 選實施方案中,結晶介質包含0. 05至2 μ 1、優選0. 8至1. 2 μ 1適于結晶的蛋白質溶液,其 與相似體積、優選等體積的包含1. 5至2Μ甲酸鈉和0. 05至0. 15Μ檸檬酸ρΗ4至ρΗ5的沉 淀劑溶液混合。在另一個實施方案中,所述沉淀劑溶液包含7%PEG6000、lMLiCl、0. IM檸檬 酸pH5. 0,IOmM TCEP. HCl。可通過任何本領域技術人員已知的方法生長晶體,包括但不限于懸滴和坐滴技術
28(sitting drop)、夾心滴(sandwich-drop)、透析以及微批量或微管批量設備。對本領域技 術人員來說很明顯的是,可以改變上述結晶條件,來鑒定產生單獨或與化合物相復合的本 發明PB2多肽片段或其變體的晶體的其它結晶條件。這些變化包括但不限于改變pH、蛋白 質濃度和/或結晶溫度,改變所用鹽和/或沉淀劑的種類或濃度,使用不同的結晶方法,或 者引入添加劑例如去污劑(例如吐溫20(單月桂酯)、0)(^、81~士」30(4月桂基醚))、糖(例 如葡萄糖、麥芽糖)、有機化合物(例如二噁烷、二甲基甲酰胺)、鑭系元素離子或者幫助結 晶的多聚離子化合物。可使用高通量結晶測定來幫助發現或優化結晶條件。可使用微接種(microseeding)來增加晶體的尺寸和品質。簡言之,將微晶體破碎 以產生原種(Stock seed)溶液。對所述原種溶液進行系列稀釋。使用針、玻璃棒或毛繩, 將來自每個稀釋液的小樣品添加到一組平衡滴中,其中含有蛋白質,其濃度等于或小于在 沒有種子時產生晶體所需的濃度。目的是最后得到用在滴中發揮晶體生長晶核作用的單個 晶種。如本文所述,獲得如圖18所示結構坐標、對所述坐標的解讀及其在了 解蛋白質結構中的應用的方式為本領域技術人員公知,并參考標準教科書,例 如 J. Drenth, 〃 Principles of protein X-ray crystallography 〃,第二 片反, Springer Advanced Texts in Chemistry, New York (1999); 禾口 G.Ε·Schulz 禾口 R. H. Schirmer, “ Principles of Protein Structure “,SpringerVerlag,New York(1985)。例如,首先獲得X射線衍射數據,經常使用冷凍至100K的低溫保護(例如 用20%至30%甘油)的晶體,例如,使用同步加速器設備的線束或者旋轉陽極作為X射 線源。然后,通過公知的方法解決相位問題,例如多波長異常衍射(multiwavelength anomalousdiffraction, MAD)、多重同晶置換(multiple isomorphous replacement, MIR)、單波長異常衍射(single wavelength anomalous diffraction, SAD)或者分子置 換(molecular replacement, MR)。可使用 SHELXD 解出亞結構(Schneider 和 Sheldrick, 2002),使用SHARP計算相位(Vonrhein等,2006),以及使用溶劑平滑化及非結晶學對稱平 均化進行改進(例如使用RESOLVE (Terwilliger,2000))。可使用例如ARP/wARP (Perrakis 等,1999)進行模型自構建并使用例如REFMAC進行精細化(Murshudov,1997)。此外,本發 明所提供PB2片段的結構坐標(圖18)可用于正粘病毒科其他屬的PB2多肽或者使用分子 替換方法具有氨基酸取代、缺失和/或插入的PB2多肽變體的結構測定。本發明的另一個方面是提供編碼上述PB2多肽片段及其變體的分離的多核苷酸。 用于獲得這些分離核苷酸片段的分子生物學方法是本領域技術人員公知(對于標準分子 生物學方法,參見 Sambrook 等編輯,“MolecularCloning :A Laboratory Manual" ,Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York(1989),其通過弓|用 并入本文)。例如,可從被流感病毒感染的細胞中分離RNA,應用逆轉錄聚合酶鏈式反應 (RT-PCR)產生cDNA,其中使用隨機引物(例如隨機六聚體或十聚體)或者用于產生目的片 段的特異性引物。可通過標準PCR使用片段特異性引物擴增目的片段。在一個優選實施方案中,編碼可溶性PB2多肽片段的優選實施方案的分離多核苷 酸來源于SEQ ID N0:23(甲型流感病毒)、26(乙型流感病毒)或者27(丙型流感病毒)。 在一個優選實施方案中,編碼可溶性甲型流感病毒PB2多肽片段或其變體的分離多核苷酸 來源于SEQ ID N0:25,其與SEQ NO 1相比包含389位精氨酸變成賴氨酸的氨基酸替換。
29在一個更優選的實施方案中,編碼甲型流感病毒PB2多肽片段或其變體的分離多核苷酸來 源于SEQ ID NO :26,它是針對大腸桿菌密碼子使用而進行了優化的DNA序列。在這種情況 下,“來源于”表示SEQ ID NO :23、24、25、26或27編碼全長PB2多肽,因此編碼優選PB2多 肽片段的多核苷酸根據各個所編碼PB2多肽片段的需要而在多核苷酸的5'和3'端包含缺失。在一個實施方案中,本發明涉及包含所述分離多核苷酸的重組載體。本領域技 術人員十分了解用于將目的多核苷酸序列引入載體的技術(也參見Sambrook等,1989)。 這些載體包括任何本領域技術人員已知的載體,包括質粒載體、粘粒載體、噬菌體載體例 如λ噬菌體、病毒載體例如腺病毒或桿狀病毒,或者人工染色體載體例如細菌人工染色體 (BAC)、酵母人工染色體(YAC)或Pl人工染色體(PAC)。所述載體可以是適于原核或真核表 達的表達載體。所述質粒可包含復制起點(ori)、多克隆位點和調節序列例如啟動子(組 成型或誘導型)、轉錄起始位點、核糖體結合位點、轉錄終止位點、多腺苷酸信號以及選擇 標記,例如抗生素抗性或基于對突變或缺失進行回補(complementation)的營養缺陷型標 記。在一個實施方案中,所述目的多核苷酸序列與調節序列有效連接。在另一個實施方案中,所述載體包含編碼有助于純化目的多肽片段的表位、肽或 蛋白質標簽的核苷酸序列。這些表位、肽、或蛋白質標簽包括但不限于紅細胞凝集素(HA-)、 FLAG、myc標簽、多His標簽、谷胱甘肽-S-轉移酶(GST)、麥芽糖結合蛋白(MBP)、NusA以及 硫氧還蛋白標簽,或者熒光蛋白標簽例如(增強型)綠色熒光蛋白((E)GFP)、(增強型)黃 色熒光蛋白((E)YFP)、來源于海葵(Discosoma)物種(DsRed)或者單體(mRFP)的紅色熒光 蛋白(RFP)、青色熒光蛋白(CFP),等等。在一個優選實施方案中,可將表位、肽或蛋白質標 簽從目的多肽片段上切下,例如,使用如凝血酶、因子Xa、PreScission, TEV蛋白酶等等的 蛋白酶。這些蛋白酶的識別位點是本領域技術人員公知的。在另一個實施方案中,所述載 體包括導致目的多肽片段分泌到重組寄主細胞培養基中或者細菌的周質間隙中的功能性 序列。所述信號序列片段通常編碼信號肽,其由引導所述蛋白質從細胞中分泌出來的疏水 氨基酸構成。所述蛋白質分泌到培養基中(革蘭氏陽性菌)或者位于細胞外膜和內膜之間 的周質間隙中(革蘭氏陰性菌)。優選地,在信號肽片段與外源基因之間編碼有加工位點, 其可被體內或體外切割。在另一個方面中,本發明提供包含所述分離多核苷酸或所述重組載體的重組宿主 細胞。所述重組宿主細胞可以是原核細胞例如古細菌和細菌細胞或者真核細胞例如酵母、 植物、昆蟲或哺乳動物細胞。在一個優選實施方案中,所述宿主細胞是細菌細胞例如大腸桿 菌細胞。本領域技術人員了解將所述多核苷酸或所述重組載體引入所述宿主細胞的方法。 例如,細菌細胞可直接使用例如化學轉化(如氯化鈣法)或者電穿孔容易地進行轉化。酵 母細胞可以例如使用醋酸鋰轉化法或電穿孔進行轉化。其它真核細胞可例如使用市售基于 脂質體的轉染試劑盒例如Lip0fectamineTM(Invitr0gen)、市售的基于脂類的轉染試劑盒例 如Fugene (RocheDiagnostics)、基于聚乙二醇的轉染、磷酸鈣沉淀、基因槍(生物射彈)、電 穿孔或者病毒感染進行轉染。在本發明的一個優選實施方案中,所述重組宿主細胞表達目 的多核苷酸片段。在一個更優選的實施方案中,所述表達產生本發明的可溶性多肽片段。 這些多肽片段可利用本領域技術人員公知的蛋白質純化方法進行純化,任選地利用上述表 位、肽或蛋白質標簽。
在另一個方面中,本發明涉及鑒定與PB2的RNA帽結合口袋或者PB2多肽變體的 結合口袋的全部或一部分相結合的化合物的方法,其包括下列步驟(a)構建由圖18所示 復合物的結構坐標定義的所述結合口袋的計算機模型;(b)通過選自下列的方法選自可能 的結合化合物(i)將分子片段組裝成所述化合物,(ii)從小分子數據庫中選擇化合物,和(iii)從頭設計所述化合物的配體;(C)利用計算工具進行所述化合物與所述結合口袋的計算機模型之間的擬合程序 運算,以提供所述化合物在所述結合口袋中的能量最小化構型;以及(d)評價所述擬合運算的結果,以對所述化合物和所述結合口袋模型之間的結合 進行定量,由此對所述化合物與所述結合口袋相結合的能力進行評價。本發明首次允許使用分子設計技術,基于圖18所述結合口袋的結構坐標來鑒定、 選擇或設計PB2的RNA帽結合口袋或者PB2多肽變體的RNA帽結合口袋的潛在結合配偶體, 優選RNA帽結合的抑制劑。鑒于制備和測試多種可能結合所述結合口袋的化合物的更高成 本,這樣的預測模型非常有價值。為了使用針對與RNA帽類似物形成復合物的PB2多肽片 段的結構坐標,必須將該結構坐標轉變為三維形狀。這通過使用市售軟件完成,所述軟件能 夠從一組結構坐標產生分子或其部分的三維圖示。這樣的計算機程序的實例有MODELER (A. Sali 和 T.L.Blundell,J.Mol.Biol.,234,779-815 頁(1993),在 Insight II Homology 軟 件包(Insight II (97. 0), Molecular Simulations Incorporated, San Diego, CA)中)。本領域技術人員可使用多種方法來篩選化學實體或片段結合PB2或PB2多肽變體 RNA帽結合口袋的能力。此過程可從對例如基于根據圖18的結構坐標的PB2RNA帽結合口 袋的三維計算機模型進行肉眼觀察開始。然后,可將選定的片段或化合物以多種方向置于 或者對接入結合口袋內。可使用軟件例如Cerius、Quanta和Sybyl (Tripos Associates, St. Louis, M0)完成對接,然后是具有標準分子動力學力場的能量最小化和分子動力學,例 如0PLS-AA、CHARMM和AMBER。其它可在選擇合適化合物或片段的過程中協助本領域技術 人員的專門計算機程序包括,例如(i)AUTODOCK(D. S. Goodsell等,“Automated Docking of Substrates toProteins by Simulated Annealing " , Proteins :Struct. , Funct., Genet.,8,195-202頁(1990) ;AUT0D0CK可獲得自 Scripps Research Institute,LaJolla, CA)以及(ii) DOCK (I. D. Kuntz 等,"A Geometric Approach toMacromoIecule-Ligand Interactions “,J.Mol.Biol. , 161,269-288 頁(1982) ;DOCK 可獲得自 University of California, San Francisco, CA)。一旦選擇了合適的化合物或片段,則可將其設計或組裝成單個化合物或復合物。 這一手動模型構建利用軟件例如Quanta或Sybyl進行。在單個化合物或片段的連接中 協助本領域技術人員的可用程序包括,例如(i)CAVEAT(P.A. Bartlett等,‘‘CAVEAT: A Program to Facilitate theStructure-Derived Design of Biologically Active Molecules " , in MolecularRecognition in Chemical and Biological Problems " , Special Publication, Royal Chem. Soc,78,182-196 頁(1989) ;G. Lauri 禾口 P. A. Bartlett, " CAVEAT :A Program to Facilitate the Design of Organic Molecules “,J. Comp. Aid. Mol. Des.,8,51-66 頁(1994) ; CAVEAT 可獲得自 University
31ofCalifornia,Berkley,CA),(ii) 3D Database 系統例如 ISIS (MDLInformation Systems, San Leandro, CA ;綜述于 Y· C· Martin,〃 3DDatabase Searching in Drug Design “, J.Med. Chem.,35,2145-2154 頁(1992)),禾口 (iii)HOOK(M. B. Eisen 等,“HOOK A Program for FindingNovel Molecular Architectures that Satisfy the Chemical and StericRequirements of a Macromolecule Binding Site",Proteins :Struct.,Funct., Genet.,19,199-221 頁(1994) ;HOOK 可獲得自 Molecular Simulationslncorporated, San Diego, CA)ο實現本發明的另一種方法是在小分子數據庫中用計算機篩選可與PB2的RNA帽 結合口袋或者PB2多肽變體的結合口袋的整體或一部分相結合的化合物。在此篩選中, 這些化合物與所述結合口袋的合適程度可由形狀互補性或者由估計的相互作用能來判斷 (E. C. Meng 等,J. Comp. Chem.,13,505-524 頁(1992))。或者,PB2的RNA帽結合口袋的可能結合配偶體(優選RNA帽結合抑制劑)可基于 與根據圖18的RNA帽類似物復合的PB2多肽片段的3D結構從頭設計。有本領域技術人員 可得到的多種從頭設計配體的方法。這些方法包括(i)LUDI(H.-J.Bohm,“ The Computer Program LUDI :ANew Method for the De Novo Design of Enzyme Inhibitors" ,J. Comp. Aid. Mol.Des.,6,61—78 頁(1992) ;LUDI 可得自 Molecular Simulationslncorporated, San Diego, CA), (ii) LEGEND(Y. Nishibata 禾口 A.Itai, Tetrahedron,47,8985—8990 頁(1991) ;LEGEND 可得自 MolecularSimulations Incorporated, San Diego, CA), (iii) LeapFrog (可得自 TriposAssociates,St. Louis,MO),(iv)SPROUT(V. Gillet 等,'’ SPROUT =AProgram for Structure Generation" , J. Comp. Aid. Mol. Des. , 7,127-153 頁(1993) ;SPROUT 可得自 University of Leeds, UK), (v)GROUPBUILD(S. H. Rotstein 和 Μ. A. Murcko" GroupBuild :A Fragment-BasedMethod for De Novo Drug Design" ,J.Med· Chem.,36,1700-1710頁(1993)),以及(vi)GROW(J. B. Moon和W. J. Howe, “ ComputerDesign of Bioactive Molecules :A Method for Receptor-Based De NovoLigand Design ", Proteins,11,314-328 頁(1991))。另外,可支持本領域技術人員從頭設計潛在的RNA帽結合口袋相互作用化合物 以及建模的若干分子建模方法已有描述,包括如N. C. Cohen等,‘‘Molecular Modeling Software and Methods for Medicinal Chemistry “ , J. Med. Chem. ,33,883-894 M (1990) ;M. A. Navia 禾口 M. A. Murcko, “ TheUse of Structural Information in Drug Design " , Curr. Opin. Struct. Biol. , 2, pp. 202-210 (1992) ;L. M. Balbes φ, “ A Perspective in Modern Methods inComputer-Aided Drug Design " , Reviews in Computational Chemistry, Vol. 5, K. B. Lipkowitz 禾口D. B. Boyd編輯,VCH,New York, 37-380 頁(1994) ;W. C. Guida, " Software for Structure-Based Drug Design" , Curr. Opin. Struct.Biol.,4,777-781 頁(1994)。被設計或選擇用作與PB2的RNA帽結合口袋或者PB2變體的結合口袋相結合 的分子可以進一步通過計算進行優化,從而使其在結合狀態下優選與目標區域不存在排 斥性靜電相互作用。這些非互補性(例如靜電)相互作用包括排斥性電荷-電荷、偶 極-偶極以及電荷-偶極相互作用。具體地,在結合狀態下所述結合化合物與所述結合 口袋之間所有靜電相互作用的總和優選地對結合焓有中性的或有利的貢獻。本領域有
32可評價化合物形變能和靜電相互作用的具體計算機程序可用。合適的程序實例包括(i) Gaussian 92 修訂版 C(M. J. Frisch, Gaussian, Incorporated, Pittsburgh, PA), (ii) AMBER,4. 0 版(P. A. KolIman, University of California, SanFrancisco, CA), (iii) QUANTA/CHARMM(Mo1ecu1ar Simulationslncorporated, San Diego, CA), (iv)OPLS-AA(W. L.Jorgensen, " OPLSForce Fields " , Encyclopedia of Computational Chemistry, Schleyer 編輯,Wiley, New York(1998)Vol. 3,1986-1989 頁),以及(ν)Insight 11/ Discover (Biosysm Technologies Incorporated, San Diego, CA)。這些禾呈序可使用例如 Silicon Graphics工作站、IRIS 4D/35或IBM RISC/6000工作站550型來執行。其它硬件 系統和軟件包是本領域技術人員已知的。 一旦如上所述選擇或設計了目的分子,就可對其進行一些原子或側鏈基團進行取 代以改進或改變其結合特性。一般來說,最初的取代是保守的,即,取代基團與原始基團具 有大致相同的大小、形狀、疏水性和電荷。當然,應理解的是,應避免本領域中已知改變構象 的組分。然后可通過如上詳細所述相同的計算方法分析這些取代化合物與PB2的RNA帽結 合口袋或者PB2變體的結合口袋匹配的效率。 在本發明上述方法的一個實施方案中,PB2的RNA帽結合口袋或者PB2多肽變體的 結合口袋包含根據SEQ ID N0:1的PB2的Phe323、His357和Phe404氨基酸或者其對應氨基 酸。在另一個實施方案中,所述結合口袋包含根據SEQ ID N0:1的氨基酸Phe323、Phe404、 Phe325、Phe330和Phe363或者其相應氨基酸。在另一個實施方案中,所述結合口袋包含 根據 SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Phe325、Phe330 和 Phe363 或者其相 應氨基酸。在又一個實施方案中,所述結合口袋包含根據SEQ ID N0:1的氨基酸Phe323、 His357、Phe404、Glu361和Lys376或者其相應氨基酸。在又一個實施方案中,所述結合口袋 包含根據 SEQ ID NO :1 的氨基酸Phe323、His357、Phe404、Ser320、Arg332、Ser337 和Gln406 或者其相應氨基酸。在另一個實施方案中,所述結合口袋包含根據SEQ ID NO :1的氨基酸 Phe323、His357、Phe404、Lys339、Arg355、Asn429 和 His432 或者其相應氨基酸。在另一個實 施方案中,所述結合口袋包含根據SEQ ID NO :1的氨基酸Phe323、His357、Phe404、Phe325、 Phe330、Phe363、Glu361和Lys376或者其相應氨基酸。在又一個實施方案中,所述結合口袋 包含根據 SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Ser320、 Arg332、Ser337和Gln406或者其相應氨基酸。在又一個實施方案中,所述結合口袋包含 根據 SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Lys339、 Arg355、Asn429和His432或者其相應氨基酸。在又一個實施方案中,所述結合口袋包含根 據 SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Glu361、Lys376、Ser320、Arg332、Ser337 和Gln406或者其相應氨基酸。在又一個實施方案中,所述結合口袋包含根據SEQ ID N0 1 的氨基酸 Phe323、His357、Phe404、Glu361、Lys376、Lys339、Arg355、Asn429 和 His432 或者其相應氨基酸。在又一個實施方案中,所述結合口袋包含根據SEQ ID N0:1的氨基 酸 Phe323、His357、Phe404、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429 和 His432或者其相應氨基酸。在又一個實施方案中,所述結合口袋包含根據SEQ ID NO :1的 氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、 Ser337和Gln406或者其相應氨基酸。在又一個實施方案中,所述結合口袋包含根據SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Lys339、
33Arg355、Asn429和His432或者其相應氨基酸。在又一個實施方案中,所述結合口袋包含根 據 SEQID NO 1 的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Ser320、Arg332、 Ser337、Gln406、Lys339、Arg355、Asn429和His432或者其相應氨基酸。在又一個實施方 案中,所述結合口袋包含根據SEQ ID NO :1的氨基酸Phe323、His357、Phe404、Glu361、 Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429 和 His432 或者其相應 氨基酸。在又一個實施方案中,所述結合口袋包含根據SEQ ID N0:1的氨基酸Phe323、 His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、 LyS339、Arg355、ASn429和His432或者其相應氨基酸。在又一個實施方案中,所述結合口袋 包含根據SEQ ID NO :1的氨基酸Phe323、His357、Phe404和Met431或者其相應氨基酸。在另 一個實施方案中,所述結合口袋包含根據SEQ ID N0:1的氨基酸Phe323、HiS357、Phe404、 Phe325、Phe330、Phe363和Met431或者其相應氨基酸。在另一個實施方案中,所述結合 口袋包含根據 SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、 Glu361、Lys376和Met431或者其相應氨基酸。在又一個實施方案中,所述結合口袋包含根 據 SEQ IDNO 1 的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、 Ser320、Arg332、Ser337、Gln406和Met431或者其相應氨基酸。在又一個實施方案中,所 述結合 口袋包含根據 SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、 Phe363、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429、His432 和Met431或者其相應氨基酸。在另一個實施方案中,所述結合口袋包含根據SEQ ID NO 1的氨基酸Phe323、His357、Phe404、Phe325、Glu361和Lys376或者其相應氨基酸。在另 一個實施方案中,所述結合口袋包含根據SEQ ID NO :1的氨基酸Phe323、HiS357、Phe404、 Phe325、Phe363、Glu361和Lys376或者其相應氨基酸。在另一個實施方案中,所述結合口 袋包含根據SEQ ID NO 1的氨基酸Phe323、His357、Phe404、Glu361和Lys376或者其相 應氨基酸。在另一個實施方案中,所述結合口袋包含根據SEQ ID N0:1的氨基酸Phe323、 His357、Phe404、Phe325、Phe330、Phe363、Glu361 和 Ser337 或者其相應氨基酸。在另一個實 施方案中,所述結合口袋包含根據SEQ ID NO :1的氨基酸His357、Phe404、Phe325、Glu361、 Lys376、Arg332、Ser337和Met431或者其相應氨基酸。在又一個實施方案中,所述結合口袋 包含根據 SEQ ID NO 1 的氨基酸 His357、Phe404、Phe325、Glu361、Lys376、Arg332、Ser337、 Met431、Lys339、Arg355、Asn429和His432或者其相應氨基酸。在又一個實施方案中,所 述結合口袋包含根據SEQ ID NO 1的氨基酸Phe323、His357、Phe404和Phe325或者其相 應氨基酸。在又一個實施方案中,所述結合口袋包含根據SEQ ID N0:1的氨基酸Phe323、 His357、Phe404和Glu361或者其相應氨基酸。在又一個實施方案中,所述結合口袋包含 根據SEQ ID NO 1的氨基酸Phe323、His357、Phe404和Lys376或者其相應氨基酸。在另 一個實施方案中,所述結合口袋包含根據SEQ ID N0:1的氨基酸Phe323、HiS357、Phe404、 Glu361和Lys376或者其相應氨基酸。在又一個實施方案中,所述結合口袋包含根據SEQID NO 1的氨基酸Phe323、His357、Phe404、Phe325和Glu361或者其相應氨基酸。在又一個實 施方案中,所述結合口袋包含根據SEQ ID NO :1的氨基酸Phe323、His357、Phe404、Phe325 和Lys376或者其相應氨基酸。此外,在其它一些實施方案中,上述定義的結合口袋可任選 地包含對應于根據SEQ ID NO 1的氨基酸Met431的氨基酸或者其相應氨基酸。
在本發明上述方法的另一個方面中,PB2的RNA帽結合口袋由根據圖18的PB2SEQ
34ID N0:1的氨基酸Phe323、His357和Phe404的結構坐標來定義。在另一個實施方案中,所 述結合口袋由根據圖18的PB2SEQ ID NO 1的氨基酸Phe323、Phe404、Phe325、Phe330和 Phe363的結構坐標來定義。在另一個實施方案中,所述結合口袋由根據圖18的PB2SEQ ID NO 1的氨基酸Phe323、His357、Phe404、Phe325、Phe330和Phe363的結構坐標來定義。在又 一個實施方案中,所述結合口袋由根據圖18的PB2SEQ ID NO 1的氨基酸Phe323、His357、 Phe404、Glu361和Lys376的結構坐標來定義。在另一個實施方案中,所述結合口袋由根據 圖 18 的 PB2 SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Ser320、Arg332、Ser337 和 Gln406的結構坐標來定義。在另一個實施方案中,所述結合口袋由根據圖18的PB2SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Lys339、Arg355、Asn429 和 His432 的結構坐標來定 義。在另一個實施方案中,所述結合口袋由根據圖18的PB2SEQ IDN0:1的氨基酸Phe323、 His357、Phe404、Phe325、Phe330、Phe363Glu361 和 Lys376 的結構坐標來定義。在又一個實 施方案中,所述結合口袋由根據圖18的PB2SEQ ID NO 1的氨基酸Phe323、His357、Phe404、 Phe325、Phe330、Phe363Ser320、Arg332、Ser337 和 Gln406 的結構坐標來定義。在又一個實 施方案中,所述結合口袋由根據圖18的PB2SEQID NO 1的氨基酸Phe323、His357、Phe404、 Phe325、Phe330、Phe363、Lys339、Arg355、Asn429 和 His432 的結構坐標來定義。在又一 個實施方案中,所述結合口袋由根據圖18的PB2SEQ ID NO 1的氨基酸Phe323、His357、 Phe404、Glu361、Lys376、Ser320、Arg332、Ser337 和 Gln406 的結構坐標來定義。在又一個實 施方案中,所述結合口袋由根據圖18的PB2SEQ ID NO 1的氨基酸Phe323、His357、Phe404、 Glu361、Lys376、Lys339、Arg355、Asn429和His432的結構坐標來定義。在又一個實施方案 中,所述結合口袋由根據圖18的PB2SEQ IDNO 1的氨基酸Phe323、His357、Phe404、Ser320、 Arg332、Ser337、Gln406、Lys339、Arg355、Asn429 和 His432 的結構坐標來定義。在又一 個實施方案中,所述結合口袋由根據圖18的PB2 SEQ ID NO 1的氨基酸Phe323、His357、 Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337 和 Gln406 的結 構坐標來定義。在又一個實施方案中,所述結合口袋由根據圖18的PB2 SEQ ID NO 1的氨 基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Lys339、Arg355、 Asn429和His432的結構坐標來定義。在又一個實施方案中,所述結合口袋由根據圖18 的 PB2SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Ser320、 Arg332、Ser337、Gln406、Lys339、Arg355、Asn429 和 His432 的結構坐標來定義。在又一個實 施方案中,所述結合口袋由根據圖18的PB2SEQID NO 1的氨基酸Phe323、His357、Phe404、 Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429 和 His432 的結構 坐標來定義。在又一個實施方案中,所述結合口袋由根據圖18的PB2SEQ ID NO :1的氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337、 Gln406、Lys339、Arg355、Asn429和His432的結構坐標來定義。在又一個實施方案中,所述 結合口袋由根據圖18的PB2SEQ ID NO 1的氨基酸Phe323、His357、Phe404和Met431的結 構坐標來定義。在另一個實施方案中,所述結合口袋由根據圖18的PB2SEQ ID N0:1的氨 基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363 和 Met431 的結構坐標來定義。在另 一個實施方案中,所述結合口袋由根據圖18的PB2SEQ IDNO 1的氨基酸Phe323、His357、 Phe404、Phe325、Phe330、Phe363Glu361、Lys376 和 Met431 的結構坐標來定義。在又一個實 施方案中,所述結合口袋由根據圖18的PB2SEQ ID NO 1的氨基酸Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406 和 Met431 的結 構坐標來定義。在又一個實施方案中,所述結合口袋由根據圖18的PB2 SEQ ID NO 1的氨 基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、 Ser337、Gln406、Lys339、Arg355、Asn429、His432 和 Met431 的結構坐標來定義。在另一 個實施方案中,所述結合口袋由根據圖18的PB2SEQ ID NO :1的氨基酸Phe323、His357、 Phe404、Phe325、Glu361和Lys376的結構坐標來定義。在另一個實施方案中,所述結合口袋 由根據圖 18 的 PB2SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Phe325、Phe363、Glu361 和Lys376的結構坐標來定義。在另一個實施方案中,所述結合口袋由根據圖18的PB2SEQ ID NO 1的氨基酸Phe323、His357、Phe404、Glu361和Lys376的結構坐標來定義。在另一 個實施方案中,所述結合口袋由根據圖18的PB2SEQ ID NO :1的氨基酸Phe323、His357、 Phe404、Phe325、Phe330、Phe363、Glu361和Ser337的結構坐標來定義。在另一個實施方 案中,所述結合口袋由根據圖18的PB2 SEQ ID NO 1的氨基酸His357、Phe404、Phe325、 Glu361、Lys376、Arg332、Ser337和Met431的結構坐標來定義。在又一個實施方案中,所 述結合口袋由根據圖 18 的 PB2 SEQ ID NO 1 的氨基酸 His357、Phe404、Phe325、Glu361、 Lys376、Arg332、Ser337、Met431、Lys339、Arg355、Asn429 和 His432 的結構坐標來定義。 在又一個實施方案中,所述結合口袋由根據圖18的PB2 SEQ ID NO :1的氨基酸Phe323、 His357、Phe404和Phe325的結構坐標來定義。在又一個實施方案中,所述結合口袋由根 據圖18的PB2SEQ ID NO 1的氨基酸Phe323、His357、Phe404和Glu361的結構坐標來定 義。在又一個實施方案中,所述結合口袋由根據圖18的PB2SEQ ID NO :1的氨基酸Phe323、 His357、Phe404和Lys376的結構坐標來定義。在另一個實施方案中,所述結合口袋由根據 圖 18 的 PB2 SEQ ID NO 1 的氨基酸 Phe323、His357、Phe404、Glu361 和 Lys376 的結構坐 標來定義。在另一個實施方案中,所述結合口袋由根據圖18的PB2SEQ ID NO :1的氨基酸 Phe323、His357、Phe404、Phe325和Glu361的結構坐標來定義。在另一個實施方案中,所 述結合口袋由根據圖18的PB2SEQ ID NO 1的氨基酸Phe323、His357、Phe404、Phe325和 Lys376的結構坐標來定義。此外,在其它一些實施方案中,如上定義的結合口袋可任選地另 外由根據圖18的PB2SEQ ID NO 氨基酸Met431定義。 在一個方面中,本發明提供了根據上述方法用計算機篩選能夠與根據圖18的PB2 的RNA帽結合口袋變體的結合口袋相結合的化合物的方法。在一個實施方案中,根據圖 18,所述結合口袋的所述變體與下列氨基酸主鏈的均方根差不超過3埃氨基酸Phe323、 His357 和 Phe404 ;氨基酸 Phe323、Phe404、Phe325、Phe330 和 Phe363 ;氨基酸 Phe323、 His357、Phe404、Phe325、Phe330 和 Phe363 ;氨基酸 Phe323、His357、Phe404、Glu361 和 Lys376 ;氨基酸 Phe323、His357、Phe404、Ser 320、Arg332、Ser337 和 Gln406 ;氨基酸 Phe323、His357、Phe404、Lys339、Arg355、Asn429 和 His432 ;氨基酸 Phe323、His357、 Phe404、Phe325、Phe330、Phe363、Glu361 和 Lys376 ;氨基酸 Phe323、His357、Phe404、 Phe325、Phe330、Phe363、Ser320、Arg332、Ser337 和 Gln406 ;氨基酸 Phe323、His357、 Phe404、Phe325、Phe330、Phe363、Lys339、Arg355、Asn429 和 His432 ;氨基酸 Phe323、 His357、Phe404、Glu361、Lys376、Ser320、Arg332、Ser337 和 Gln406 ;氨基酸 Phe323、 His357、Phe404、Glu361、Lys376、Lys339、Arg355、Asn429 和 His432 ;氨基酸 Phe323、 His357、Phe404、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429 和 His432 ;氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、 Ser337 和 Gln406 ;氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、 Lys376、Lys339、Arg355、Asn429 和 His432 ;氨基酸 Phe323、His357、Phe404、Phe325、 Phe330、Phe363、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429 和 His432 ;氨 基酸 Phe323、His357、Phe404、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、 Arg355、Asn429 和 His432 ;氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、 Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、Asn429 和 His432、氨 基酸 Phe323、His357、Phe404 和 Met431、氨基酸 Phe323、His357、Phe404、Phe325、Phe330、 Phe363 和 Met431、氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、 Lys376 和 Met431、氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361、 Lys376、Ser320、Arg332、Ser337、Gln406 和 Met431、氨基酸 Phe323、His357、Phe404、 Phe325、Phe330、Phe363、Glu361、Lys376、Ser320、Arg332、Ser337、Gln406、Lys339、Arg355、 Asn429、His432 和 Met431、氨基酸 Phe323、His357、Phe404、Phe325、Glu361 和 Lys376、氨 基酸 Phe323、His357、Phe404、Phe325、Phe363、Glu361 和 Lys376、氨基酸 Phe323、His357、 Phe404、Glu361 和 Lys376、氨基酸 Phe323、His357、Phe404、Phe325、Phe330、Phe363、Glu361 和 Ser337、氨基酸 His357、Phe404、Phe325、Glu361、Lys376、Arg332、Ser337 和 Met431、氨 基酸 His357、Phe404、Phe325、Glu361、Lys376、Arg332、Ser337、Met431、Lys339、Arg355、 Asn429 和 His432、氨基酸 Phe323、His357、Phe404 和 Phe325、氨基酸 Phe323、His357、 Phe404 和 Glu361、氨基酸 Phe323、His357、Phe404 和 Lys376、氨基酸 Phe323、His357、 Phe404、Glu361 和 Lys376、氨基酸 Phe323、His357、Phe404、Phe325 和 Glu361、氨基酸 Phe323、His357、Phe404、Phe325和Lys376,上述氨基酸組合任選地包含氨基酸Met431。在 另一個實施方案中,所述均方根差不超過2. 5埃。在另一個實施方案中,所述均方根差不超 過2埃。在另一個實施方案中,所述均方根差不超過1.5埃。在另一個實施方案中,所述均 方根差不超過1埃。在另一個實施方案中,所述均方根差不超過0. 5埃。在一個優選實施方案中,Hi7GTP夾在溶劑側的His357與蛋白側5個苯丙氨酸的簇 之間,主要是Phe323和Phe404,還有Phe325、Ph330和Phe363。在該優選實施方案中,鳥 苷堿基的特異性識別主要由Glu361氫鍵鍵合到鳥苷的N2和m位來實現,這也有助于中和 Hi7GTP的離域正電荷。Lys376也與06形成長氫鍵。在配體口袋中有兩個有序的埋藏水分 子,其與G1u361、Lys376和Gln406相互作用而不是直接與配體相互作用。重要的第二層 殘基優選為Arg332和Ser337,其與His357成氫鍵。在堿基N2的氫鍵距離內有水分子或 Ser320。N7甲基與Gln406的側鏈以范德華力接觸(3. 4埃),Phe404的羰基氧(3. 4埃) 略遠地與Met431的側鏈相接觸。在該實施方案中,三磷酸向堿基彎曲。α-磷酸與His432 和Asn429相互作用,Y -磷酸與堿性殘基His357、Lys339和Arg355相互作用。如果根據本文上述方法的計算機建模顯示化合物與PB2的RNA結合口袋或者 PB2多肽變體的結合口袋結合,則可合成所述化合物,并任選地體外或體內測試所述化合 物與所述結合口袋結合的能力,其包括另外的步驟(e)合成所述化合物,以及任選地(f) 將所述化合物與PB2多肽片段或其變體或者本發明的重組宿主細胞以及RNA帽或其類似 物相接觸,以測定所述化合物抑制所述多肽片段與所述RNA帽或其類似物之間結合的能 力。這些化合物與所述結合口袋的合適程度可由形狀互補性或者預計的相互作用能來判斷
37(E. C. Meng等,J. Comp. Chem.,13,505-524頁(1992)。用于合成所述化合物的方法是本領 域技術人員公知的,或者這些化合物可以是市售的。用于測定所鑒定化合物的RNA帽結合 抑制作用的方法實例在下文有述。本發明的另一個方面是提供可通過上述方法鑒定的化合物,前提是所述化合物不 是選自下列的任何 RNA 帽類似物m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、 m7GpppC和m7GpppCm、m7GpppU、以及m7GpppUm或者RNA帽結合的小分子抑制劑2-氨 基-7-苯甲基-9-(4-羥基丁基)-1,9_ 二氫嘌呤-6-酮(R00794238、Hooker 等、2003)或 者T-705 (Furuta等、2005),并且能夠結合PB2的RNA帽結合口袋。在另一個方面中,本發 明涉及可通過上述方法鑒定的化合物,前提是所述化學不是選自下列的RNA帽類似物m7G、 m7GMPλ m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、禾口 m7GpppCm、m7GpppU、以及 Hi7GpppUm或者RNA帽結合的小分子抑制劑2-氨基-7-苯甲基-9- (4-羥基丁基)-I,9- 二氫 嘌呤-6-酮或者T-705,并且能夠抑制PB2多肽片段與RNA帽或其類似物之間的結合。本發 明的化合物可以是包括下列但不限于此的任何物質肽、擬肽、多肽、蛋白質(包括抗體)、 脂類、金屬、核苷酸、核苷、核酸、有機或無機小分子、化合物、元素、糖類、同位素、碳水化合 物、造影劑、脂蛋白、糖蛋白、酶、分析用探針、多胺及其組合和衍生物。術語“小分子”表示 分子量在50至約2500道爾頓優選200-800道爾頓的分子。另外,根據本發明的測試化合 物可任選地包含檢測標記。這些標記包括但不限于酶標記、放射性同位素或放射性化合物 或元素、熒光化合物或金屬、化學發光化合物和生物發光化合物。在另一個方面中,本發明提供了鑒定與PB2的RNA帽結合口袋或者PB2多肽變體 的結合口袋相結合的化合物的方法,其包括以下步驟(i)將本發明的PB2多肽片段或重組 宿主細胞與測試化合物相接觸以及(ii)分析所述測試化合物與PB2多肽片段或其變體結 合的能力。在一個實施方案中,可以下拉測定的形式分析PB2多肽片段或其變體與測試化合 物之間的相互作用。例如,PB2多肽片段可以是純化的或者固定在珠上。在一個實施方案 中,可以將固定在珠的PB2多肽片段與例如⑴另一種純化的蛋白質、多肽片段或肽,(ii) 蛋白質、多肽片段或肽的混合物,或者(iii)細胞或組織提取物相接觸,可通過聚丙烯酰胺 凝膠電泳結合考馬斯染色或western印跡驗證蛋白質、多肽片段或肽的結合。可通過質譜 分析鑒定未知的結合配偶體。在另一個實施方案中,可以基于酶聯免疫吸附測定(ELISA)實驗的形式分析PB2 多肽片段或其變體與測試化合物之間的相互作用。在一個實施方案中,根據本發明的PB2 多肽片段或其變體可以固定于ELISA板的表面上并與測試化合物相接觸。可例如針對帶有 蛋白質、多肽、肽和表位標簽的化合物,通過測試化合物或表位標簽的特異性抗體來驗證測 試化合物的結合。這些抗體可以直接偶聯到酶或者用與所述酶偶聯的二抗檢測,所述酶與 合適的底物相組合發生化學發光反應(例如辣根過氧化物酶)或顯色反應(例如堿性磷酸 酶)。在另一個實施方案中,不能被抗體檢測到的化合物結合可通過直接與所述測試化合物 偶聯的標記來驗證。這些標記可包括但不限于酶標記、放射性同位素或放射性化合物或元 素、熒光化合物或金屬、化學發光化合物和生物發光化合物。在另一個實施方案中,所述測 試化合物可以固定于ELISA板上并與根據本發明的可溶性PB2多肽片段或其變體相接觸。 可通過如上所述的PB2多肽片段特異性抗體和化學發光或顯色反應來驗證所述多肽的結
38口 O在另一個實施方案中,純化的可溶性PB2多肽片段可以與肽陣列一起孵育,并可 通過例如PB2多肽特異性抗體、針對與所述PB2多肽片段融合的表位標簽的抗體、或者通過 由于PB2多肽片段偶聯的熒光標簽發射的熒光信號來分析所述PB2多肽片段與對應于特定 肽序列的特異性肽斑點的結合。在另一個實施方案中,將根據本發明的重組宿主細胞與測試化合物相接觸。這可 以通過將測試蛋白質或多肽的共表達并通過熒光能量共振轉移(FRET)或免疫共沉淀驗證 相互作用來實現。在另一個實施方案中,可將直接標記的測試化合物添加到重組宿主細胞 的培養基中。例如可通過所述多肽的免疫沉淀與驗證所述標記的存在來驗證測試化合物穿 透膜并與所述PB2多肽片段結合的可能性。在一個優選實施方案中,上述用于鑒定與PB2的RNA帽結合口袋或者PB2多肽變 體的結合口袋相結合的化合物的方法包括添加RNA帽或其類似物的額外步驟。在所述方法 的另一個實施方案中,分析所述測試化合物在所述RNA帽或其類似物存在下與PB2結合的 能力,或者所述測試化合物抑制所述RNA帽或其類似物與PB2結合的能力。如果所述化合物 在與RNA帽或RNA帽類似物相同的摩爾濃度下使結合減少超過20 %、超過30 %、超過40 %、 超過50 %、優選超過60 %、優選超過70 %、優選超過80 %、優選超過90 %,則認為化合物抑 制RNA帽或RNA帽類似物結合。在一些優選實施方案中,上述下拉、ELISA、肽陣列、FRET以 及免疫共沉淀實驗可以在RNA帽結構或其類似物(優選帶標記的RNA帽結構或其類似物) 存在下并在測試化合物存在或者不存在時進行。在一個實施方案中,在添加所述測試化合 物之前添加RNA帽或其類似物。在另一個實施方案中,在添加所述測試化合物的同時添加 RNA帽或其類似物。在又一個實施方案中,在添加所述測試化合物之后添加RNA帽或其類似 物。在一個優選實施方案中,可通過在存在或不存在所述化合物的情況下將所述多肽 片段與7-甲基-GTP Sepharose 4B樹脂(GE Healthcare) 一起孵育并比較(優選定量) 所結合的帶有和不帶有所述化合物的PB2多肽片段(例如在考馬斯染色的SDS PAGE凝膠 上或者使用Western印跡分析)來測定可鑒定測試化合物干擾本發明PB2多肽片段與RNA 帽或其類似物相互作用的能力。在測試化合物存在或不存在的情況下評價RNA帽或其類似物與本發明PB2片段或 其變體相結合的能力。在一個實施方案中,這可使用熒光標記的RNA帽類似物、熒光標記的 7-甲基鳥苷單磷酸酯(m7GMP)在如Natarajan等(2004)所述的熒光極化測定中來實現。 或者,在另一個實施方案中,核糖二醇修飾的熒光帽類似物氨茴酰基-m7GTP可用于如Ren 等(1996)所示的熒光分光光度測定中。在另一個實施方案中,放射性標記的RNA帽可以在 存在或不存在測試化合物的情況下與PB2多肽片段或其變體一起孵育,其中RNA帽可在添 加所述測試化合物之前、同時或之后添加。通過如Hooker等(2003)所述的凝膠電泳對帽 結合反應進行UV-交聯、變性和分析。在另一個實施方案中,本發明的PB2多肽片段可固定 于微滴定板上,在存在或不存在測試化合物的情況下與帶標記的RNA帽或其類似物一起孵 育,其中可在添加所述測試化合物之前、同時或之后添加RNA帽或其類似物,通過在徹底清 洗所述板之后驗證標記的存在來分析帽結合。將含有測試化合物的孔中RNA帽或RNA帽類 似物標記的信號強度與不含測試化合物的所述標記的信號強度進行比較,如上所述,如果
39結合減少超過50 %、優選超過60 %、優選超過70 %、優選超過80 %、優選超過90 %,則認為 化合物抑制RNA帽或RNA帽類似物結合。在一個優選實施方案中,用于鑒定與PB2的RNA帽結合口袋或者PB2多肽變體 的結合口袋相結合(優選抑制RNA帽或其類似物結合)的化合物的上述方法以高通量方 式進行。在一個優選實施方案中,所述方法如上所述使用根據本發明已固定PB2多肽片段 或其變體以及帶標記的RNA帽或其類似物在多孔微滴定板中進行。在一個優選實施方案 中,所述測試化合物來自合成或天然化合物文庫。例如,合成化合物文庫可購自Maybridge Chemical Co. (Trevillet, Cornwall, UK), ChemBridgeCorporation(San Diego, CA),或 Aldrich (Milwaukee,WI)。天然化合物文庫例如可獲得自TimTec LLC (Newark,DE)。或者, 可使用細菌、真菌、植物和動物提取物形式的天然化合物文庫。另外,可使用組合化學法以 合成方式產生單種化合物或者混合物形式的測試化合物。RNA帽或其類似物可在添加文庫 化合物之前、同時或者之后添加。可如上所述評估所述化合物抑制RNA帽結合的能力。在另一個實施方案中,可在體內形式中檢測所鑒定化合物對流感病毒生命周期的 抑制作用。可以在存在或不存在已鑒定化合物的情況下用流感病毒感染對流感病毒感染敏 感的細胞系例如293T人胚腎細胞、Madin-Darby狗腎細胞或者雞胚胎成纖維細胞。在一個 優選實施方案中,可將多種濃度的已鑒定化合物添加到所述細胞培養基中。病毒蝕斑的形 成可用作流感病毒感染能力的讀出值,可將用已鑒定化合物處理的細胞與未處理的細胞進 行比較。在本發明的另一個實施方案中,在任意上述方法中應用的測試化合物是小分子。 在一個優選實施方案中,所述小分子來源于文庫,例如小分子抑制劑文庫。在另一個實施方 案中,所述測試化合物是肽或蛋白質。在一個優選實施方案中,所述肽或蛋白質來源于肽或 蛋白質文庫。在用于對與本發明PB2多肽片段或變體的RNA帽結合口袋相結合的化合物和/或 抑制RNA帽結合所述結合口袋的化合物進行計算機以及體外鑒定的上述方法的另一個實 施方案中,所述方法還包括將可鑒定的化合物或其可藥用鹽與一種或多種可藥用賦形劑和 /或載體配制在一起的步驟。在另一個方面中,本發明提供了可根據上述方法產生的藥物組 合物。根據本發明的化合物可單獨施用,但是在人療法中,一般會與根據預定施用途徑和標 準藥物實踐所選擇的合適藥物賦形劑、稀釋劑或載體混合施用(參見下文)。在PB2的RNA帽結合口袋或者PB2變體的結合口袋的結合配偶體進行計算機建模 或者篩選的方面中,可以將對作為藥物施用的分子有利的化學部分引入目的分子。例如, 可以將可能并非直接影響所述分子與靶區域結合而是例如對所述分子在可藥用載體中的 總體溶解度、所述分子的生物利用度和/或所述分子的毒性有貢獻的化學部分引入目的分 子或者從中除去。優化目的分子的藥理學情況的注意事項和方法可見于,例如"Goodman and Gilman' s The Pharmacological Basis of Therapeutics",第八版,L. S. Goodman, A. Gilman, T. W. Rail, A. S. Nies, & P. Taylor 編輯,Pergamon Press (1985) ;W. L. Jorgensen & E.M. Duffy,Bioorg. Med. Chem. Lett,10,1155-1158 頁(2000)。另外,計算機程序〃 Qik Prop"可用于提供對身體重要性描述和有機目的分子藥物相關性質的快速預測。“五項標 準(Rule of Five) ”概率圖表可用于預測新合成化合物的口服吸收(C. A. Lipinski等,Adv. Drug Deliv. Rev.,23,3-25頁(1997))。適于藥效團選擇和設計的程序包括(i) DISCO (Abbot
40Laboratories, Abbot Park, IL),(ii)Catalyst (Bio-CAD Corp.,Mountain View, CA),禾口 (iii)Chem DBS-3D(Chemical Design Ltd. , Oxford, UK)。本發明涉及的藥物組合物可以本領域技術人員公知的多種方式進行配制。例如, 本發明的藥物組合物可以是固體形式例如片劑、丸劑、膠囊劑(包括軟膠囊劑)、扁囊劑、錠 劑、卵形劑、粉劑、顆粒劑或者栓劑,或者液體形式例如酊劑、溶液劑、乳劑或者混懸劑。固體施用形式可含有賦形劑例如微晶纖維素、乳糖、檸檬酸鈉、碳酸鈣、磷酸氫 鈣、甘氨酸和淀粉(優選玉米、馬鈴薯或木薯淀粉),崩解劑例如羥乙酸淀粉鈉、交聯羧甲 基纖維素鈉和某些復合硅酸鹽,以及顆粒粘合劑例如聚乙烯吡咯烷酮、羥丙基甲基纖維素 (HPMC)、羥丙基纖維素(HPC)、蔗糖、明膠和阿拉伯膠。另外,可包含潤滑劑例如硬脂酸鎂、硬 脂酸、山崳酸甘油酯以及滑石。相似類型的固體組合物還可用作明膠膠囊的填充劑。在這 一點上優選的賦形劑包括乳糖、淀粉、纖維素、乳糖或者高分子量聚乙二醇。對于適于經口施用的水混懸劑、溶液、酊劑和乳劑,可以將所述化合物與多種甜味 劑或調味劑、著色物質或染料、乳化劑和/或混懸劑以及與稀釋劑例如水、乙醇、丙二醇和 甘油以及其組合相組合。本發明的藥物組合物可含有釋放速率修飾劑,包括例如羥丙基甲基纖維素、甲基 纖維素、羧甲基纖維素鈉、乙基纖維素、醋酸纖維素酯、聚氧化乙烯、黃原膠、卡波姆、銨甲丙 烯酸共聚物、氫化蓖麻油、加拿巴蠟、石蠟、醋酸鄰苯二甲酸纖維素、鄰苯二甲酸羥丙基甲基 纖維素、甲基丙烯酸共聚物及其混合物。本發明的藥物組合物可以是快速分散或溶解的劑量形式(fastdispersing or dissolving dosage formulation, FDDF)的形式,并且可含有下列成分阿司帕坦、乙酰磺 胺酸鉀、檸檬酸、交聯羧甲纖維素鈉、交聚維酮、diascorbic acid、丙烯酸乙酯、乙基纖維 素、明膠、羥丙基甲基纖維素、硬脂酸鎂、甘露醇、甲基丙烯酸甲酯、薄荷調味劑、聚乙二醇、 煅制二氧化硅、二氧化硅、淀粉羥基乙酸鈉、硬脂酰基反丁烯二酸鈉、山梨醇、木糖醇。對于制備栓劑而言,可首先熔化低熔點蠟例如脂肪酸甘油酯的混合物或可可脂, 然后通過如攪拌將活性組分均勻地分散于其中。接著,將熔化的均勻混合物傾倒入便利大 小的模,使之冷卻,由此固化。適于胃腸外施用的本發明藥物組合物最佳地以無菌水溶液的形式使用,其可含有 其它物質,例如足夠的鹽或葡萄糖以使得溶液與血液等滲。如果需要,水溶液應該合適地緩 沖(優選pH 3至9)。適于鼻內施用和吸入施用的藥物組合物最佳地以下列形式遞送干粉吸入器或來 自使用合適推進劑的加壓容器、泵、噴霧器或噴灑器的氣溶膠噴霧形式,所述推進劑例如二 氯二氟甲烷、三氯氟甲烷、克立氟烷、氫氟烷例如1,1,1,2-四氟乙烷(HFA 134A.TM)或者1, 1,1,2,3,3,3-六氟丙烷(HFA 227EA. TM),二氧化碳或者其它合適氣體。所述加壓容器、泵、 噴霧器或噴灑器可含有所述活性化合物的溶液或懸液,例如使用乙醇和推進劑的混合物作 為溶劑,其可另外包含潤滑劑,例如三油酸山梨坦。在另一個實施方案中,本發明提供了可由上述方法鑒定的化合物,其包括將本發 明的PB2多肽片段或者PB2多肽片段變體或者本發明的重組宿主細胞與測試化合物接 觸的步驟,所述測試化合物不同于選自下列的RNA帽類似物m7G、Hi7GMP, m7GTP, m7GpppG、 m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU 和 m7GpppUm 以及帽結合的小分子
41抑制劑2-氨基-7-苯甲基-9- (4-羥基丁基)-1,9-二氫嘌呤-6-酮(R00794238、Hooker等、 2003)和T-705 (Furuta等、2005),并且能夠結合PB2。在一個優選方面中,本發明涉及可通 過上述方法鑒定的化合物,其包括將本發明的PB2多肽片段或者其變體或者本發明的重組 宿主細胞與測試化合物接觸的步驟,所述測試化合物不同于選自下列的RNA帽類似物m7G、 m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU 禾口 m7GpppUm 以及帽結合的小分子抑制劑2-氨基-7-苯甲基-9- (4-羥基丁基)-1,9- 二氫嘌呤-6-酮 和T-705,并且能夠抑制PB2和RNA帽或其類似物的結合。在另一個方面中,本發明提供了針對PB2的RNA帽結合結構域的抗體。在一個優 選實施方案中,所述抗體識別如上所述多肽片段或片段變體的RNA帽結合結構域,特別的 選自SEQ ID NO :14至22定義的多肽。特別的,所述抗體特異性結合包含一個或多個上述 定義結合口袋之氨基酸的表位。在這一點上,術語“表位”具有本領域公認的意義,優選表 示4至20個氨基酸、優選5至18、6至16或7至14個氨基酸的片段。因此,優選表位具有 4至20、5至18優選6至16或7至14個氨基酸的長度,并包含SEQ ID NO 1的Ser320、 Phe323、Phe325、Phe330、Arg332、Ser337、Lys339、Arg355、His357、Glu361、Phe363、Lys376、 Phe404、Gln406、Met431和/或His432中的一個或多個或者相應的氨基酸。本發明的抗體 可以是單克隆或多克隆抗體或其部分。可通過重組DNA技術或者酶或化學切割完整抗體 的方法產生抗原結合部分。在一些實施方案中,抗原結合部分包括Fab、Fab'、F(ab' )2、 Fd.Fv.dAb以及互補性決定區(CDR)片段、單鏈抗體(scFv)、嵌合抗體例如人源化抗體、雙 抗體以及至少含有抗體中足以賦予多肽特異性抗原結合的部分的多肽。本發明的抗體根 據標準方案產生。例如,可根據本領域技術人員公知的標準方法通過使用目的抗原任選地 與佐劑例如弗氏完全或不完全佐劑、RIBI (胞壁酰二肽)或ISCOM(免疫刺激復合物)相組 合來免疫動物,例如小鼠、大鼠、兔、山羊、綿羊、豬、牛或馬,從而產生多克隆抗體。針對PB2 或其片段的RNA帽結合結構域的多克隆抗血清通過對所免疫的動物放血或處死而獲得自 該動物。所述血清(i)可以以從動物處獲得的形式原樣使用,( )可從所述血清獲得免疫 球蛋白級分,或者(iii)可從所述血清純化PB2或其片段的RNA帽結合結構域的特異性抗 體。單克隆抗體可通過本領域技術人員公知的方法產生。簡言之,在免疫后處死動物,通過 本領域已知的任何方式使淋巴結和/或脾B細胞永生化。使細胞永生化的方法包括但不限 于用癌基因對其進行轉染、用致癌病毒對其進行感染以及在選擇永生化細胞的條件下對 其進行培養,使其經受致癌或致突變化合物,將其與永生化細胞(例如骨髓瘤細胞)融合, 以及使腫瘤抑制基因失活。使用PB2或其片段的RNA帽結合結構域篩選永生化細胞。選擇 產生抗PB2或其片段的RNA帽結合結構域的抗體的細胞,例如雜交瘤,克隆,并對其理想的 特征進行進一步篩選,包括生長健壯、高抗體產生以及理想的抗體特征。在(i)同基因動 物體內,(ii)缺少免疫系統的動物,例如裸鼠,或者(iii)體外細胞培養物中擴增雜交瘤。 選擇、克隆和擴增雜交瘤的方法是本領域技術人員公知的。本領域技術人員可參考標準教 科書例如"Antibodies =ALaboratory Manual" , Ε· Harlow 禾P D. Lane 編輯,Cold Spring HarborLaboratory Press,Cold Spring Harbor,New York(1990),其通過弓|用并入本文,以 作為針對抗體產生的支持。在另一個方面中,本發明涉及可通過上述方法鑒定的能夠結合PB2多肽的RNA帽 結合口袋或者PB2多肽變體的結合口袋和/或能夠抑制RNA帽或其類似物與所述結合口
42袋結合的化合物、如上所述藥物組合物或者本發明的抗體在制備用于治療、緩解或預防單 鏈負鏈RNA病毒感染所造成疾病的藥劑上的用途。在一個優選實施方案中,所述疾病由不 分段單鏈負鏈RNA病毒的病毒感染造成,即單鏈負鏈病毒目,包括博爾納病毒科、絲狀病毒 科、副粘病毒科和彈狀病毒科。在一個更優選的實施方案中,所述疾病由分段單鏈負鏈RNA 病毒引起,包括正粘病毒科,包括甲型流感病毒屬、乙型流感病毒屬、丙型流感病毒屬、索戈 托病毒屬和感染性鮭魚貧血病毒屬(Isavirus),沙粒病毒科和布尼亞病毒科,包括漢坦病 毒屬、內羅病毒屬、正布尼亞病毒屬、白蛉病毒屬和番茄斑萎病毒屬(Tospovirus)。在一個 更優選的實施方案中,所述疾病由選自下列的病毒物種感染造成博納病毒、馬爾堡病毒、 埃博拉病毒、仙臺病毒、腮腺炎病毒、麻疹病毒、人呼吸道合胞體病毒、火雞鼻氣管炎病毒、 印第安納型水皰性口炎病毒、尼帕病毒、亨德拉病毒(henda virus)、狂犬病毒、牛流行熱病 毒、傳染性造血組織壞死病毒、索戈托病毒、甲型流感病毒、乙型流感病毒、丙型流感病毒、 漢坦病毒、克里米亞_剛果出血熱病毒、裂谷熱病毒、La Crosse病毒,優選甲型流感病毒、 乙型流感病毒、丙型流感病毒、索戈托病毒或漢坦病毒,更優選甲型流感病毒、乙型流感病 毒、丙型流感病毒,最優選甲型流感病毒。為治療、減輕或預防所述疾病狀態,本發明的藥劑可經口、口腔、舌下、鼻內、通過 肺途徑例如通過吸入、通過直腸途徑或者胃腸外,例如海綿體內、靜脈內、動脈內、腹膜內、 鞘內、心室內、尿道內、胸內、顱內、肌內或皮下施用給動物患者,優選哺乳動物患者,優選人 患者,它們可通過輸注或者無針注射技術進行施用。本發明涉及的藥物組合物可以本領域技術人員公知的多種方式進行配制。例如, 本發明的藥物組合物可以是固體形式例如片劑、丸劑、膠囊劑(包括軟膠囊劑)、扁囊劑、錠 劑、卵形劑、粉劑、顆粒劑或者栓劑,或者液體形式例如酊劑、溶液劑、乳劑或者混懸劑。固體施用形式可含有賦形劑例如微晶纖維素、乳糖、檸檬酸鈉、碳酸鈣、磷酸氫 鈣、甘氨酸和淀粉(優選玉米、馬鈴薯或木薯淀粉),崩解劑例如羥乙酸淀粉鈉、交聯羧甲 基纖維素鈉和某些復合硅酸鹽,以及顆粒粘合劑例如聚乙烯吡咯烷酮、羥丙基甲基纖維素 (HPMC)、羥丙基纖維素(HPC)、蔗糖、明膠和阿拉伯膠。另外,可包含潤滑劑例如硬脂酸鎂、硬 脂酸、山崳酸甘油酯以及滑石。相似類型的固體組合物還可用作明膠膠囊的填充劑。在這 一點上優選的賦形劑包括乳糖、淀粉、纖維素、乳糖或者高分子量聚乙二醇。對于適于經口施用的水混懸劑、溶液、酊劑和乳劑,可以將所述化合物與多種甜味 劑或調味劑、著色物質或染料、乳化劑和/或混懸劑以及與稀釋劑例如水、乙醇、丙二醇和 甘油以及其組合相組合。本發明的藥物組合物可含有釋放速率修飾劑,包括例如羥丙基甲基纖維素、甲基 纖維素、羧甲基纖維素鈉、乙基纖維素、醋酸纖維素酯、聚氧化乙烯、黃原膠、卡波姆、銨甲丙 烯酸共聚物、氫化蓖麻油、加拿巴蠟、石蠟、醋酸鄰苯二甲酸纖維素、鄰苯二甲酸羥丙基甲基 纖維素、甲基丙烯酸共聚物及其混合物。本發明的藥物組合物可以是快速分散或溶解的劑量形式(fastdispersing or dissolving dosage formulation, FDDF)的形式,并且可含有下列成分阿斯巴甜、乙酰 磺胺酸鉀、檸檬酸、交聯羧甲纖維素鈉、交聚維酮、二抗壞血酸(diascorbic acid)、丙烯酸 乙酯、乙基纖維素、明膠、羥丙基甲基纖維素、硬脂酸鎂、甘露醇、甲基丙烯酸甲酯、薄荷調味 劑、聚乙二醇、煅制二氧化硅、二氧化硅、淀粉羥基乙酸鈉、硬脂酰基反丁烯二酸鈉、山梨醇、木糖醇。對于制備栓劑而言,可首先熔化低熔點蠟例如脂肪酸甘油酯的混合物或可可脂, 然后通過如攪拌將活性組分均勻地分散于其中。接著,將熔化的均勻混合物傾倒入便利大 小的模,使之冷卻,由此固化。適于胃腸外施用的本發明藥物組合物最佳地以無菌水溶液的形式使用,其可含有 其它物質,例如足夠的鹽或葡萄糖以使得溶液與血液等滲。如果需要,水溶液應該合適地緩 沖(優選pH 3至9)。適于鼻內施用和吸入施用的藥物組合物最佳地以下列形式遞送干粉吸入器或來 自使用合適拋射劑的加壓容器、泵、噴霧器或噴灑器的氣溶膠噴霧形式,所述拋射劑例如二 氯二氟甲烷、三氯氟甲烷、克立氟烷、氫氟烷例如1,1,1,2-四氟乙烷(HFA 134A.TM)或者1, 1,1,2,3,3,3-六氟丙烷(HFA 227EA. TM),二氧化碳或者其它合適氣體。所述加壓容器、泵、 噴霧器或噴灑器可含有所述活性化合物的溶液或懸液,例如使用乙醇和推進劑的混合物作 為溶劑,其可另外包含潤滑劑,例如三油酸山梨坦。所述藥物制劑優選地是單位劑型。在這樣的形式中,所述制劑被分成含有合適量 活性組分的單位劑量。所述單位劑型可以是包裝的制劑,所述包裝含有離散的制劑量,例如 包裝的片劑、膠囊劑以及瓶或安瓿中的粉劑。另外,所述單位劑型可以是膠囊、片劑、扁囊劑 或錠劑本身,或者可以是合適數量的任何這些包裝形式。根據具體應用和所述活性成分的效力,在本發明用途中在單位劑量制劑中施用的 活性成分的量可以從約Img至約lOOOmg/m2變化或者調節,優選5mg至約150mg/m2。本發明醫學用途中使用的化合物以約每天0. 05mg/kg至約20mg/kg的初始劑量施 用。優選約0. 05mg/kg至約2mg/kg的每日劑量范圍,最優選約0. 05mg/kg至約lmg/kg的 每日劑量。但是,所述劑量可以根據患者的需要、所治療狀況的嚴重程度以及所使用的化合 物而有所不同。特定狀況的合適劑量的確定在醫師的技能范圍之內。一般地,治療從較小 的劑量開始,其低于化合物的最適劑量。之后,少量的增加劑量,直至達到在該情況下的最 佳效果。為了方便起見,如果需要,可將每天的總劑量分為一天中的幾部分并施用。
實施例為了進一步闡釋本發明并更好地理解,設計了實施例。不以任何方式將它們視作 對本發明范圍的限制。實施例1 產生PB2表達構建體將基于甲型流感病毒/Victoria/3/1975(H3N2)PB2氨基酸序列(dela Luna 等,1989)的經大腸桿菌密碼子優化的PB2基因(Geneart) SEQ IDNO :25克隆到 pET9a(Novagen)載體中,其經過修飾引入了 5' Aatll/AscI和3' Nsil/NotI限制性位點 對,以用于定向截短核酸外切酶III,并提供編碼C端生物素受體肽GLNDIFEAQKIEWHE的3’ 序列。從3’端產生了第一非定向截短質粒文庫(Tarendeau等,2007),合并并用作5’缺失 反應的底物。從瓊脂糖凝膠中分離編碼150至250個氨基酸的插入片段的線性化質粒,再 連接,然后用于轉化含有RIL質粒(Stratagene)的大腸桿菌BL21A1,以使用Alexa488鏈霉 親和素(Invitrogen)與菌落印跡雜交進行表達篩選(Tarendeau等,2007)。根據其熒光信 號對克隆進行排名,通過M2+親和色譜對前36個克隆測試可純化蛋白的表達。鑒定到13
44個克隆,對其測序,顯示目的區域中的7個獨特構建體(參見圖1)nt 703-1488(aa 235-496),nt 721-1449(aa 241-483),nt 802-1449(aa 268-483),nt 829-1440(aa 277-480),nt 841-1446(aa 281-482),nt 868-1449(aa 290-483),nt 883-1446(aa 295-482)通過使用合成基因作為模板的聚合酶鏈式反應(PCR)產生這些PB2多核苷酸片 段,并將其克隆進表達載體PETMll質粒(EMBL)的NcoI和XhoI位點之間。pETMll表達載 體允許表達帶His6標簽的融合蛋白。可使用TEV蛋白酶將His6標簽從融合蛋白上切下。實施例2 鑒定最小帽結合片段使用實施例1中所述的質粒構建體和實施例3中所述的一般性表達和純化方案在 大腸桿菌中表達PB2多肽片段235-496、241-483、268-483和290-483。發現純化的PB2片 段235-496僅在低濃度下可溶,而片段241-483、268-483和290-483溶解度更好并且可特 異性結合m7GTPS印harose柱,指示了帽結合活性。對于這些測定,將0. 2mg蛋白質上樣到 50 μ 1 7-甲基-GTP Sepharose 4Β樹脂(GE Healthcare)上,在4°C下孵育3小時進行結 合。在用含有50mM Tris. HCKpH 8. 0)、200mM NaCl、2mM DTT的緩沖液清洗之后,使用含有 ImM Hi7GTP的相同緩沖液通過離心洗脫蛋白質,在SDS-PAGE進行分析。在這些實驗的過程 中,注意到較小的降解片段也可結合m7GTP,這可通過N端測序及質譜鑒定為殘基318-483, 此外,此片段對于蛋白水解是穩定的。將相應的多核苷酸片段(nt952-1449)如實施例1所 述克隆進PETMll中。實施例3 :PB2片段的表達和純化使用化學轉化將所述質粒轉化進大腸桿菌。在LB培養基中的大腸桿菌菌 株BL21-CodonPlus-RIL(Stratagene)中表達所述蛋白質。在25 °C下用0. 2mM異丙 基-β-硫代半乳糖苷(IPTG)誘導16至20小時后,收獲細胞,重懸于裂解緩沖液中 (50mM Tris ‘ HCl (pH 8.0)、300mM NaCl、5mM 2-巰基乙醇)并超聲處理。離心后,將澄 清的裂解液直接上樣于鎳親和柱(來自GE Healthcare的螯合s印harose,載有Ni2+離 子)。用50mMTris · HCl (pH 8. 0) UM NaClU5mM咪唑、mM 2-巰基乙醇緩沖液徹底清洗 Ni-s印harose 樹脂,然后用 50mM Tris 'HCl (pH 8.0)、200mM NaCl、50mM 咪唑、5mM 2-巰基 乙醇緩沖液清洗。然后,用50mM Tris · HCl (pH8.0)、200mM NaCl、0. 5M咪唑、5mM 2-巰基 乙醇緩沖液洗脫蛋白質。在10°C下將純化的蛋白質孵育過夜進行TEV蛋白酶切割。在以 50mMTris 'HCl (pH 8. 0)、200mM NaCl、15mM咪唑、5mM 2-巰基乙醇緩沖液透析之后,進行第 二鎳親和步驟,以除去以His標簽標記的TEV蛋白酶。回收未結合的蛋白質,濃縮為5-8mg/ ml在Superdex 75柱(GE Healthcare)上進行凝膠過濾,以提高純度。PB2多肽片段(318 至483位氨基酸)的凝膠過濾結果在圖2A中顯示。可以將該片段(318至483位氨基酸) 濃縮至高達24mg/ml。通過SDS PAGE和考馬斯染色評價所述蛋白質的純度(參見圖2B)。 典型產率為120mg純蛋白質/升細菌培養物。實施例4 :PB2和Hi7GTP的共結晶
45
使用50mM Tris-HCl (pH 8.0)、200mM NaCl、2mM 二 硫蘇糖醇(DTT)、5mM Hi7GTP(Sigma)中ll_15mg/ml的PB2片段318-483的蛋白質溶液進行結晶試驗。使用機 器人(Cartesian)篩選576種結晶條件,其使用坐滴蒸發擴散法(sitting drop vapor diffusion method),通過將100 μ 1蛋白質溶液與0. 1 μ 1不同沉淀溶液混合來進行。在 兩種不同條件下鑒定晶體。使用懸滴蒸發擴散法手動優化這些條件,其使用與 μ 1沉淀 溶液混合的1μ 1蛋白質溶液。使用包含0. IM檸檬酸pH 4.6、1.6-1.8Μ甲酸鈉的沉淀溶 液獲得最佳的晶體。這些晶體為空間群C2221;晶胞尺寸為a = 9. 2nm, b = 9. 4nm, c = 22.0nm±0.3nn^^。一些較小的晶體得到分辨率為至少2. 4埃的X射線衍射。發現較大 的晶體無法使用,因為它們不是單晶。在所發現的第二結晶條件下,沉淀溶液包含 PEG6000UM LiCUO. IM檸檬酸pH 5. OUOmM TCEP HCl0該條件得到薄的片狀晶體,空間群 未確定,顯示至少3. 3埃分辨率的衍射,但是衍射品質差得多,不再繼續研究這些晶體。實施例5 制備以硒代甲硫氨酸標記的蛋白質如所述在基本M9培養基中產生硒代甲硫氨酸化的蛋白質(VanDuyne,1993)。因 為完全硒代甲硫氨酸化的蛋白質不結晶,所以使用50mg/l硒代甲硫氨酸和5mg/l甲硫氨 酸(而不是60mg/l硒甲硫氨酸)產生部分標記的蛋白質。表達、裂解和純化條件如同天然 蛋白質一樣(實施例3)。電噴霧質譜顯示,對應于11/11個甲硫氨酸被取代,完全硒代甲 硫氨酸化蛋白質具有19654道爾頓的MW,而部分標記的蛋白質具有19578的平均分子質量 (9. 4/11,即85%被取代),對于具有7-11個硒的蛋白質種類獲得了各個峰。實施例6 結構確定和精細化使用單波長異常衍射(SAD)法確定結構,其使用如實施例5中所述的部分硒代甲 硫氨酸化蛋白質。部分硒代甲硫氨酸化蛋白質實際上產生比野生型更大的單晶體。在ESRF 的射束BM14上,在空間群C222i以及晶胞尺寸為a = 92. 2,b = 94. 4,c = 220. 4埃的小晶體 (尺寸15x15x50微米)上收集2. 4埃分辨率的原始數據(圖4)。在ID29上以2. 9埃的分 辨率測定部分硒代甲硫氨酸標記的蛋白質晶體,以確定精細化結構,然后對于較大的晶體 在ID14-EH1上以2. 3埃的分辨率測定,以精制結構。通過SAD法使用AUT0SHARP解析結構 (Vonrhein 等,2006)。發現 50/55 個硒原子位。使用 RESOLVE (TerwiIliger,2000)利用由 硒位置確定的4次非晶體學對稱改進相位和圖,盡管發現在非對稱單元中實際有五個分子 (溶劑含量55%)。它們以不常見的方式排列。命名為A-D的4個有序的分子(平均B因子 約30A2)以4次點對稱排列。第五個分子介導了晶體學C-軸方向上的四聚體堆積,但是 是部分無序的(平均B因子約51A2)。在將相位轉移成原始數據之后,ARP/VARP(Perrakis 等,1999)能夠自動構建大部分結構。觀察到與每個分子結合的Hi7GTP的明顯剩余電子密 度。利用REFMAC (Murshudov,1997),對于每個分子中的大部分使用緊密NCS約束,對于作為 整體的每個分子使用TLS參數,進行精制。最終R因子(R-自由度)為0. 186 (0. 235),具有 293個水分子。根據M0LPR0BITY (Lovell等,2003),如該服務器輸出所示,結構品質非常優 秀REMARK 40REMARK 40M0LPR0BITY STRUCTURE VALIDATIONREMARK 40M0LPR0BITY OUTPUT SCORESREMARK 40ALL-AT0M CLASHSC0RE 8 40
46
REMARK 40BAD R0TAMERS 34% 24/708 (TARGET 0-1% )REMARK 40RAMACHANDRAN OUTLIERS 00% 0/795 (TARGET 02% )REMARK 40RAMACHANDRAN FAVORED 977% 777/795 (TARGET 98 0% )PB2的帽結合結構域具有致密、高度有序的混合α 折疊,其具有顯著的反向平 行β -片層,包含鏈β 1、β 2、β 5、β 6和β 7,其堆積在包含α 、α 2、α 3和α 4螺旋的 束上,最長的螺旋α 1和α 3大致以反向平行排列。β 2和β 5之間的連接延伸為長β發 夾,其包含鏈β3和β4以及348-環,其與分子的螺旋側相交叉。α2和α3之間晶序差 的環稱為420-環,突出到溶劑中(圖4和圖5)。在甲型流感病毒ΡΒ2帽結合結構域中,m7G 位于主要由Phe_323(來自β 1,更加朝向核糖堆疊)和Phe_404(來自螺旋α 的C端,更 加朝向堿基堆疊)形成的疏水平臺上,但是兩者都不是精確地與堿基平行。這兩個芳香殘 基是顯著的五苯丙氨酸簇的一部分,其還包括Phe-325、Phe-330和Phe_363。在配體的溶 劑側,由之前未在此功能中觀察到的殘基類型His-357(來自β4的C末端)完成夾心。關 鍵酸性殘基是Glu-361,其與鳥嘌呤的附和N2位以氫鍵鍵合,Lys-376也通過與06的相互 作用參與堿基特異性識別(圖6、7和10)。對于帽結合蛋白來說不尋常的是,沒有與核糖羥 基的直接相互作用。三磷酸向堿基彎曲。α-磷酸與His-432和Asn-429相互作用,γ-磷 酸與堿性殘基His-357、Lys-339和Arg-355相互作用。實施例7 帽結合位點的突變分析為了驗證結構上觀察到的蛋白質-配體相互作用對于體外帽結合是重要的,我們 使用QuickChange位點定向誘變試劑盒(Stratagene)制備了與Hi7GTP接觸的七個殘基的丙 氨酸突變(F323,F325,E361,F363,F404,H357,K376)。這些單點突變體預期顯示帽結合活性 降低,通過其在4°C下結合Hi7GTP-S印harose樹脂的能力對其進行評估(表4,圖12)。如實 施例3中針對野生型PB2所述對突變體進行純化。在大腸桿菌中突變體F363A表達不佳,并 且溶解度差,可能是由于錯誤折疊,不對其進行進一步的研究。突變體H357A、E361A、K376A 和F404A良好地表達為可溶形式,但是在測定條件下不結合Hi7GTP-S印harose,而F323A具 有弱的結合活性(圖12)。出人意料地,突變體F325A盡管表達不佳,但幾乎與野生型一樣 地結合樹脂。我們顯示該突變體的活性是強溫度依賴性的(表3)。還制備了 H357W取代, 與預計改善朝向堿基的堆疊一致,該突變體結構域顯示Hi7GTP結合增強。結果顯示于圖12 和表4。實施例8 使用表面等離振子共振測定對帽結合親和件講行定量分析為了對多種突變體的結合親和性提供更為量化的比較,我們用具有固定化的帽結 合結構域和m7GTP作為分析物進行了表面等離振子共振(surface ρlasmon resonance, SPR)測定。SPR 分析在裝有 CM5 傳感器芯片(Biacore AB Uppsala, Sweden)的 Biacore T100儀器上進行。將野生型和突變體PB2帽結合結構域在IOmM醋酸鈉pH6. 0中稀釋到 50 μ g/mL,并使用標準胺偶聯化學將其固定在傳感器表面。活化/去活化的傳感器表面作 為參比。將0. 47-lmM的m7GTP、m7GpppG和GTP兩倍連續稀釋物以30 μ 1/分鐘的流速注射 到已固定ΡΒ2蛋白和參比表面上。運行緩沖液是IOmM Hepes, ρΗ 7. 4,其含有150mM NaCl 和ImM DTT。為了測試溫度對結合的作用,在5、15、25和37°C下進行實驗。使用雙參比處 理所有獲得的傳感圖,通過使用Biacore T100評價軟件進行的穩態親和評價確定平衡解離 常數。由于與固定化相關的表面化學和分子取向可影響該值,所以這些被稱為“表觀”解離常數。誤差與軟件所報告的擬合相關。使用不同蛋白質固定的實驗之間的變異<25% (數 據未顯示)。在25°C下獲得的表觀平衡解離常數Kd結果(表1)顯示與Hi7GTP-S印harose 結合結果一致的趨勢,H357W突變體具有最高的親和力(Kd = 24士3uM),然后是野生型(Kd =177士34uM),E361A和K376A突變體具有最低的親和力(KD > 1500uM)。表1 在25°C下由SI3R測定的Hi7GTP與PB2帽-結合結構域的不同點突變體之間 相互作用的表觀平衡解離常數(Kd)。
權利要求
可溶性多肽片段,其中所述多肽片段(i)來自流感病毒RNA依賴性RNA聚合酶亞基PB2或其變體,并且(ii)能夠結合RNA帽或其類似物。
2.權利要求1的多肽片段,其中所述多肽片段被純化至適于進行結晶的程度。
3.權利要求1或2的多肽片段,其中流感病毒RNA依賴性RNA聚合酶亞基PB2來自甲 型、乙型或丙型流感病毒或其變體。
4.根據權利要求1至3任一項的多肽片段,其中(i)N端與SEQID NO 1的PB2氨基酸序列中220位或更高位氨基酸相同或相對應,C 端與其510位或更低位氨基酸相同或相對應,(ii)N端與SEQID NO 2的PB2氨基酸序列的222位或更高位氨基酸相同或相對應,C 端與其511位或更低位氨基酸相同或相對應,或者(iii)N端與SEQID NO :3的PB2氨基酸序列的227位或更高位氨基酸相同或相對應, C端與其528位或更低位氨基酸相同或相對應,以及以上的變體,其保留與RNA帽或其類似物相結合的能力。
5.根據權利要求4的多肽片段,其中所述多肽片段具有選自以下的氨基酸序列或者與 其相對應SEQ ID NO :4至13的氨基酸序列及其變體,其保留與RNA帽或其類似物相結合 的能力。
6.包含權利要求1至5中任一項所述多肽片段以及RNA帽或其類似物的復合物。
7.根據權利要求6的復合物,其中所述帽類似物選自m7G、Hi7GMP,m7GTP, m7GpppG、η77111rJm GpppGmλ m GpppAΛ m GpppAmΛ m GpppC、m GpppCm、m GpppU 禾口 m GpppUm0
8.根據權利要求6的復合物,其中所述多肽片段由SEQID NO :11的氨基酸序列組成, 所述帽類似物是m7GTP,所述復合物具有如圖18所示結構坐標定義的結構。
9.根據權利要求8的復合物,其中所述復合物具有空間群為C222i的晶型,晶胞尺寸為 a = 9. 2nm,b = 9. 4nm ;c = 22. Onm (士 0. 3nm)。
10.根據權利要求8和9的復合物,其中所述晶體以為3.0埃或更高、優選2. 4埃或更 高的分辨率衍射X射線。
11.編碼權利要求1至5中任一項所述分離多肽的分離的多核苷酸。
12.包含權利要求11所述分離多核苷酸的重組載體。
13.包含權利要求11所述分離多核苷酸或者權利要求12所述重組載體的重組宿主細胞。
14.鑒定與PB2的RNA帽結合口袋或者PB2多肽變體的結合口袋的全部或一部分相結 合的化合物的方法,其包括下列步驟(a)構建如圖18所示權利要求8所述復合物的結構坐標所定義的所述結合口袋的計算 機模型;(b)通過選自下列的方法選擇潛在的結合化合物 (i)將分子片段組裝成所述化合物,( )從小分子數據庫中選擇化合物,和 (iii)從頭設計所述化合物的配體;(c)利用計算工具進行所述化合物與所述結合口袋的計算機模型之間的擬合程序運 算,以提供所述化合物在所述結合口袋中的能量最小化構型;以及(d)評價所述擬合運算的結果,以對所述化合物與所述結合口袋模型之間的結合進行 定量,由此評價所述化合物與所述結合口袋相結合的能力。
15.根據權利要求14的方法,其中所述結合口袋包含SEQID NO=I的PB2的氨基酸 Phe323、His357和Phe404或與其相對應的氨基酸。
16.根據權利要求15的方法,其中所述結合口袋還包含SEQID NO 1的PB2的氨基酸 Phe325、Phe330和Phe363或與其相對應的氨基酸。
17.根據權利要求15或16的方法,其中所述結合口袋還包含SEQIDNO 1的PB2的氨 基酸Glu361和Lys376或與其相對應的氨基酸。
18.根據權利要求15至17中任一項的方法,其中所述結合口袋還包含氨基酸Ser320、 Arg332、Ser337 和 Gln406。
19.根據權利要求15至18中任一項的方法,其中所述結合口袋還包含SEQID NO :1的 PB2的氨基酸Lys339、Arg355、Asn429和His432或與其相對應的氨基酸。
20.根據權利要求14的方法,其中所述結合口袋由圖18中PB2SEQID NO 1的氨基酸 Phe323、His357和Phe404的結構坐標來定義。
21.根據權利要求20的方法,其中所述結合口袋還由圖18中PB2SEQIDN0:1的氨基 酸Phe325、Phe330和Phe363的結構坐標來定義。
22.根據權利要求20或21的方法,其中所述結合口袋還由圖18中PB2SEQID NO :1的 氨基酸Glu361和Lys376的結構坐標來定義。
23.根據權利要求20或22中任一項的方法,其中所述結合口袋還由圖18中PB2SEQID NO 1的氨基酸Ser320、Arg332、Ser337和Gln406的結構坐標來定義。
24.根據權利要求20至23中任一項的方法,其中所述結合口袋還由圖18中PB2SEQID NO 1的氨基酸Lys339、Arg355、Asn429和His432的結構坐標來定義。
25.根據權利要求20的方法,其中PB2多肽變體的結合口袋與所述結合口袋的氨基酸 Phe323、His357和Phe404的主鏈原子具有不超過2. 5埃的均方根差。
26.根據權利要求14至25中任一項的方法,其還包括下列步驟(e)合成所述化合物,并任選地將所述化合物或其可藥用鹽與一種或多種可藥用賦形 劑和/或載體配制在一起。
27.根據權利要求26的方法,其還包括下列步驟(f)將所述化合物、權利要求1至4中任一項的多肽片段或者根據權利要求12的重組 宿主細胞與RNA帽或其類似物相接觸,以確定所述化合物抑制所述PB2多肽片段與所述RNA 帽或其類似物之間結合的能力。
28.可通過權利要求14至27的方法鑒定的化合物,前提為所述化合物不是m7G、m7GMP、 m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU、m7GpppUm、2_ 氨 基-7-苯甲基-9- (4-羥基丁基)-1,9- 二氫嘌呤-6-酮、T-705或m7Gppp (N) ,其中N是 A、Am、G、Gm、C、Cm、U或Um,并且能與PB2或其變體的RNA帽結合口袋結合。
29.可通過權利要求14至27的方法鑒定的化合物,前提為所述化合物不是m7G、m7GMP、 m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU、m7GpppUm、2_ 氨 基-7-苯甲基-9- (4-羥基丁基)-1,9- 二氫嘌呤-6-酮、T-705或m7Gppp (N) ,其中N是 A、Am、G、Gm、C、Cm、U或Um,并且能夠抑制PB2多肽、其變體或其片段與RNA帽或其類似物之間的結合。
30.一種鑒定與PB2的RNA帽結合口袋或者PB2多肽變體的結合口袋相結合的化合物 的方法,包括以下步驟⑴將權利要求1至4的所述多肽片段或權利要求13的所述重組 宿主細胞與測試化合物相接觸,以及(ii)分析所述測試化合物結合PB2的能力。
31.根據權利要求30的方法,其還包括添加RNA帽或其類似物的步驟。
32.根據權利要求31的方法,其中分析所述測試化合物在所述RNA帽或其類似物存在 下與PB2或其變體結合的能力,或者分析所述測試化合物抑制所述RNA帽或其類似物與PB2 或其變體結合的能力。
33.根據權利要求31或32的方法,其中所述RNA帽或其類似物在添加所述測試化合物 之前、同時或之后添加。
34.根據權利要求30至33中任一項的方法,其以高通量形式進行。
35.根據權利要求30至34中任一項的方法,其中所述測試化合物是小分子。
36.根據權利要求30至34中任一項的方法,其中所述測試化合物是肽或蛋白質。
37.根據權利要求26、27或者30至36中任一項的方法,其中所述方法還包括將所述化 合物或其可藥用鹽與一種或多種可藥用賦形劑和/或載體配制在一起的步驟。
38.可根據權利要求27或37的方法產生的藥物組合物。
39.可通過權利要求30至37中任一項的方法鑒定的化合物,前提為所述化合物不 是 m7G、m7GMP λ m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU、 m7GpppUm.2-氨基-7-苯甲基-9_(4_羥基丁基)_1,9_ 二氫嘌呤-6-酮、T-705或 ITi7Gppp (N) H5,其中N是A、Am、G、Gm、C、Cm、U或Um,并且能與PB2多肽、其變體或其片段結
40.可通過權利要求29至36中任一項的方法鑒定的化合物,前提為所述化合物不 是 m7G、m7GMP、m7GTP、m7GpppG、m7GpppGm、m7GpppA、m7GpppAm、m7GpppC、m7GpppCm、m7GpppU、 m7GpppUm、2-氨基-7-苯甲基-9_(4_羥基丁基)_1,9_ 二氫嘌呤-6-酮、T-705或 m7Gppp (N) H5,其中N是A、Am、G、Gm、C、Cm、U或Um,并且能夠抑制PB2多肽、其變體或其片 段與RNA帽或其類似物之間的結合。
41.針對PB2的RNA帽結合結構域的抗體。
42.根據權利要求41的抗體,其中所述抗體識別選自SEQID NO 14至22所定義多肽 的多肽片段。
43.根據權利要求28、29、39或40的化合物、根據權利要求36的藥物組合物或者根據 權利要求41或42的抗體在制備用于治療、改善或預防負鏈ssRNA病毒感染引起的疾病的 藥物中的用途。
44.根據權利要求43的用途,其中所述疾病是由包含博爾納病毒科(Bornaviridae)、 絲狀病毒科(Filoviridae)、副粘病毒科(Paramyxoviridae)和彈狀病毒科 (Rhabdoviridae)的單鏈負鏈病毒目(Mononegavirales)的病毒感染引起的。
45.根據權利要求43的用途,其中所述疾病由正粘病毒科(Orthomyxoviridae)、沙粒 病毒禾斗(Arenaviridae)或布尼亞病毒禾斗(Bunyaviridae)弓丨起。
46.根據權利要求43的用途,其中所述疾病由選自以下的病毒引起博納病毒、馬爾堡 病毒、埃博拉病毒、仙臺病毒、腮腺炎病毒、麻疹病毒、人呼吸道合胞病毒、火雞鼻氣管炎病毒、印第安納型水皰性口炎病毒、尼帕病毒、亨德拉病毒、狂犬病毒、牛流行熱病毒、感染性 造血組織壞死病毒、索戈托病毒、甲型流感病毒、乙型流感病毒、丙型流感病毒、漢坦病毒、 克里米亞_剛果出血熱病毒、裂谷熱病毒和La Crosse病毒
47.根據權利要求43的用途,其中所述疾病由選自以下的病毒引起甲型流感病毒、乙 型流感病毒、丙型流感病毒、索戈托病毒和漢坦病毒。
全文摘要
本發明涉及流感病毒RNA依賴性RNA聚合酶亞基PB2的可溶性片段及其變體,及其包含RNA帽(RNA cap)類似物的結晶復合物。本發明還涉及使用所述復合物的結構坐標來篩選和設計與RNA帽結合口袋(RNA cap binding pocket)相互作用之化合物的計算方法。另外,本發明涉及通過使用PB2多肽片段(優選以高通量形式)來鑒定與包含RNA帽結合口袋的PB2多肽片段相結合的化合物的方法,所述化合物優選抑制與RNA帽或其類似物的相互作用。本發明還涉及用于治療由負鏈單鏈RNA病毒引起的病毒感染疾病狀況的包含所鑒定化合物的化合物和藥物組合物。
文檔編號A61K38/00GK101970465SQ200880119968
公開日2011年2月9日 申請日期2008年10月9日 優先權日2007年10月9日
發明者弗蘭克·塔倫多, 德爾菲娜·吉利蓋, 斯蒂芬·庫薩克, 達倫·哈特 申請人:歐洲分子生物學實驗室(Embl)