專利名稱:蜘蛛神經毒素及其生產方法
技術領域:
本發明涉及一種新的毒素以及生產毒素的方法,尤其不僅僅限于一種昆蟲特異性神經毒素δ-毒蛛昆蟲毒素(Latroinsectotoxin)(δ-LIT)以及它們的生產方法。
在毒寇蛛(Latrodectus mactans Tredecimguttatus)的毒液中已發現一個高分子量的神經毒素家族。這些毒素中一些已被鑒定為具有脊椎動物或無脊椎動物特異性。α-毒蛛毒素(α-LT)和α-毒蛛昆蟲毒素(LIT)為已被分別表明為具有脊椎動物和無脊椎動物特異性的兩種神經毒素。這些蛋白質的一級結構已被確定,但由于不能實現它們基因的功能表達,因此不可能表征被克隆毒素的結構特征。
本發明的目的是提供一種新的毒素及利用重組技術生產一種通常由前體蛋白的翻譯后修飾自然產生的毒素的方法。
根據本發明提供了一種由基因序列的截短形式表達產生截短多肽如毒素或它的類似物。
多肽優選多神經毒素,優選對應于由基因序列編碼的基本上無毒的前體多肽的毒性衍生物。多肽可包含對應于基本上無毒的前體多肽的氨基酸序列的截短形式。多肽的氨基酸序列優選對應于主要在羧基(C)端被截短,且合意的截短發生在約150至200個氨基酸的前體多肽的氨基酸序列。此外,多肽的氨基酸序列還可對應于在氨基(N)端被截短優選少于50個氨基酸,且合意的為7或28個氨基酸的前體多肽氨基酸序列。
多肽的氨基酸序列可能與昆蟲特異性神經毒素δ-毒蛛昆蟲毒素(δ-LIT)或它的活性衍生物的氨基酸序列同源,優選包括如序列1和序列2所示的氨基酸序列或它的活性衍生物。毒素優選由包括序列1所示序列的基因序列的核苷酸結構物或其截短形式或它的活性變異體表達。毒素優選由基本上如保藏在The National Collecticns of Industrialand Marine Bacterinl ILimited,保藏號為NCIMB 40632中的微生物所提供的序列表達。
本發明還提供了一種用作毒素的蛋白質,包括基本上如序列1和序列2所示的氨基酸序列或其活性衍生物。
根據本發明的另一方面,提供了一種核苷酸序列,包括基因序列的截短形式或其類似物,用于多肽如毒素的表達。
核苷酸序列優選對應于編碼前體多肽并在3’端被截短的基因或其活性衍生物。核苷酸序列優選對應于被截短400至650個核苷酸堿基,且合意的為550至600個之間的核苷酸堿基的基因。
核苷酸序列也可對應于在其5’端被截短的基因,優選截短少于100個核苷酸堿基,且合意的為84或21個核苷酸堿基。
核苷酸序列優選對應于部分編碼毒寇蛛的毒液中的神經毒素或其活性衍生物的基因。
核苷酸序列可對應于部分編碼昆蟲特異性毒素δ-毒蛛昆蟲毒素(δ-LIT)的前體多肽或其活性衍生物的基因。核苷酸序列優選編碼包含991個氨基酸序列的多肽。
核苷酸序列優選包含序列1所示的堿基序列或其活性衍生物,優選如保藏在The National Collecticns of Industrial and MarineBacterinl Limited,保藏號為NCIMB 40632的微生物所包含的堿基序列。
核苷酸序列優選編碼具有如序列1和序列2所示的氨基酸序列的多肽或其活性衍生物。
核苷酸序列可為使用酶如逆轉錄酶從mRNA衍生而來的cDNA。用另一種方法,核苷酸序列可為使用聚合酶鏈反應(PCR)產生的寡核苷酸DNA結構物。
根據本發明的另一個方面,提供了一種生產多肽的方法,該方法包括制備包含基因截短形式的重組DMA分子,并在宿主表達系統,如病毒或細菌表達系統中表達截短形式生產多肽。
生產的多肽優選為活性毒素,且合意的為基本上如上所定義的神經毒素。截短形式優選包含編碼非毒性的前體多肽的基因的部分。
截短形式優選包含基本上如上所定義和如序列1所示的核苷酸序列或其活性衍生物。表達系統包含用包含該序列截短形式的載體pT7-7轉化的E.coli BL21(DE3)細菌細胞,且合意的為基本上如保藏在The National Collecticns of Industrial and Marine BacterinaLimited,保藏號為NCIMB 40632。表達系統可包含桿狀病毒系統。
在本發明的另一方面,提供了一種重組DNA分子,如病毒,尤其是包含編碼通常如上定義的毒素的基因的截短形式和基本上如保藏號NCIMB 40632中的微生物所提供的基因的桿狀病毒。
本發明另一方面還提供了一種包含基因的截短形式的表達載體,該截短形式編碼通常如上定義的毒素。
本發明還提供了一種細胞,如用如上定義的重組分子轉化的病毒或細菌細胞。
還提供了一種包含如上定義的毒素的殺蟲劑。該殺蟲劑可口服或局部施用。殺蟲劑可包含噴霧用液。
本發明還提供了一種殺蟲劑系統,它包括在昆蟲體內表達基因的截短形式來產生一種上面描述的毒素,以殺死或使昆蟲喪失能力的方法。殺蟲劑系統可包含病毒表達系統且合意的的桿狀病毒表達系統。
根據另一方面,提供一種包含含有基本上如上所定義的基因序列的截短形式的被遺傳修飾的細胞的植物。
還進一步根據本發明,提供了一種包含含有基本上如上所定義的基因序列的截短形式被遺傳修飾的細胞的非人類動物。
根據本發明的另一個方面,提供了一種通過基本上分離的無毒性的前體多肽的加工產生的毒素。
毒素優選為神經毒素,并優選通過向前體多肽的羧基(C)端截短產生,優選通過定點誘變產生。且合意的毒素的氨基酸序列通常對應于被截短150至200個氨基酸的前體多肽的氨基酸序列。毒素氨基酸序列還可通過向前體多肽氨基酸序列的氨基(N)端截短產生,從中酶切下來的片段優選為明顯小于從羧基端酶切下來的片段,可包含7或28個氨基酸。
毒素優選具有對應于由毒寇蛛基因的部分編碼的多肽的氨基酸序列。毒素可包含或為昆蟲特異性神經毒素δ-毒蛛昆蟲毒素(δ-LIT)的類似物或其活性衍生物。
毒素優選包含如序列1和序列2所示的氨基酸序列或其活性衍生物。
在本發明的另一方面,提供了一種從無活性前體多肽制備活性多肽的方法,該方法包括截短分離的前體多肽。
分離的前體多肽優選在羧基端截短,可使用蛋白酶酶切,優選通過定點誘變。也可提供N末端的截短。活性多肽優選為毒素并且基本上如上所描述。
根據本發明的另一方面,提供一種編碼如上所定義的毒素前體多肽,并優選具有如序列4所示的氨基酸序列或其活性衍生物的分離核苷酸堿基序列。堿基序列優選包含序列3所示的序列或其衍生物。核苷酸堿基序列優選編碼神經毒素δ-毒蛛昆蟲毒素(LIT)的前體多肽。堿基序列優選為基本上如保藏號為NCIMB 40633的微生物所提供的。
另一方面提供了一種重組DNA分子如病毒,尤其為包含如前面段落所定義的序列的桿狀病毒。
在本發明的另一方面,還提供了一種細胞,如用前面段落所述的重組DNA分子轉化的細菌細胞或病毒細胞。
本發明還提供了一種殺蟲劑系統,它包括表達如上所述的基因產生如上所述的前體多肽并加工前體多肽在昆蟲體內產生毒素來殺死或使昆蟲喪失能力的方法。殺蟲劑系統可包含病毒表達系統且合意的是桿狀病毒表達系統。
根據本發明的另一方面,提供了一種包含含有如上所定義的基因的被遺傳修飾的細胞的植物。
進一步根據本發明,提供了一種包含含有如上所定義的基因的被遺傳修飾的細胞的非人類動物。
現將參考所附序列僅通過實施例描述本發明的優選具體例,其中根據本發明的一個方面,序列1表示基因截短形式的核苷酸堿基序列和由此編碼的多肽的相應的氨基酸序列。
序列2表示序列1的多肽序列。
根據本發明的另一方面,序列3表示基因的核苷酸堿基序列和由此編碼的多肽的相應的氨基酸序列;以及序列4表示序列3的多肽序列。
參照這些序列,如序列2所示的多肽如毒素通過基因序列(序列1)的截短形式或其類似物的表達產生。
來自毒寇蛛毒液(BWSV)的毒素δ-毒蛛昆蟲毒素(δ-LIF)已被純化并顯示具有昆蟲特異性毒素。δ-LIT的結構基因已被克隆和序列測定,天然(前體)和功能蛋白毒素的N端和C端已按如下所描述地被確定。δ-LITcDNA的定點誘變使細菌中成熟蛋白產物(毒素)的表達成為可能,并且顯示出對蝗蟲具有毒性。
細胞表達系統中的這些和其它類似毒素的表達和產生以前向來是不可能的。本發明包括酶解位點的識別,以裂解前體蛋白以產生毒素,以及基因序列的截短的精確位點的識別,以使毒素在細菌中表達,及其他合適的宿主。
根據布達佩斯條約,于1994年5月3日,在The NationalCollecticns of Industrial and Marine Bacteria Limited, of 23st.Machar Drive,Aberdeen,Scotland,United Kingdom進行了微生物保藏。用基因序列的截短形式克隆的大腸桿菌(XL-1Blue pT7.δM)保藏號為40632,用基本上全部基因序列克隆的大腸桿菌保藏號為NO.40633。
cDNA克隆和序列測定更詳細地如下進行,從毒寇蛛的毒液腺中分離出poly(A+)-RNA,在質粒載體pSP65中建立cDNA文庫(根據Kiyatkin et al, 1993)。用基于δ-LIT(氨基酸殘基1-8)-5’GA(C/T)GA(A/G)GA(A/G)GA(C/T)GG(A/T)GAAATGAC 3’的末端標記的具23個單體的寡核苷酸探針篩選具有6×104克隆的文庫。進行雜交。克隆純化陽性克隆,通過限制性內切酶譜分析來分析,通過如(Sambrooket al,1989)所述的超聲處理切除和斷裂插入片段,接著將其克隆至pBluescript II SKt和SK-載體的SmaI位點(Stratagene,USA)。用輔助噬菌體感染后獲得序列測定的單鏈模板(Stratagene)。通過使用測序酶2.0版本盒(USB Corporation)和T7, T3載體特異性引物(Stratagene)的鏈終止法(Sanger et al,1977)測定DNA序列。在每個序列兩條鏈上測定至少兩次。合成引物用于測序沒有被分離的亞克隆片段覆蓋的區域。
使用計算機軟件DNASTAR(Dnastar Inc)和PCGENE(Intelligenetics Inc)進行DNA和蛋白質序列分析。該項工作得益于安裝在SERC Daresbury SEQMET設備上的GCG程序(Devereux,Haeberli and Smithies,(1984),核酸研究12(1);387-395)。
如下進行全長cDNA構建。兩組寡核苷酸引物用于通過聚合酶鏈反應產生δ-LIT編碼序列的N-端和C-端重疊部分。為了便于亞克隆至表達載體,5’有義引物(P1) (TTGGGATCCGATGAAGAAGATGGAGAA)和3’反義引物(P8)(CAATGGTCGACACAGAAGGAATGGTA)含有BamHI和SalI限制性內切酶位點。兩個其它引物-P9,有義(GTCTGAACCATTTACTGTCC)(位置1283-1302)和P3,反義(GTAAGATTACCATCTGCAAC)(互補于位置2253-2272)被選擇用來產生具有內NcoI(2056)限制性位點的重疊片段。設計了一段寡核苷酸用來終止氨基酸991-5’CGTTTCGTCGACTCATTCCGGTAAAGTACGACGAAA 3’之后的蛋白質序列。在標準條件下(30循環,55℃下1分鐘,72℃下3分鐘,94℃下1分鐘,100pmol/引物,1-10ng首鏈cDNA)使用1單位的Taq-聚合酶(Promega)進行聚合酶鏈反應。在第一個循環中,變性時間延長至5分鐘。被擴增物質的分子質量在瓊脂糖凝膠上檢測。使用由制造商推薦的帶有隨機和特異性引物的首鏈cDNA合成盒(Pharmacia)進行首鏈cDNA合成。使用GeneClean盒(Bio 101 Inc.)從瓊脂糖凝膠中純化PCR產物,用適宜酶對(N-末端部分為BamHI和NdeI,C-末端為SolI-NdeI)酶解,并克隆至用同樣的酶對限制的pT7-7載體中,N-末端BamHI/NdeI-片段,C-末端NdeI/SalI-片段與pT7-7 BamHI/SalI-酶解載體之間的三種方法的連接的結果產生了全長cDNA,最終構建物在氨基末端(MARIRARG)具有八個另外的氨基酸殘基。所有質粒結構通過從兩端及連接區域的序列測定來鑒定。全長的構建物被稱為pTδ.FL,它的樣品保藏號為NCIMB 40633,截短克隆稱為pT7.δM.(NCIMB 40632)。
為了證實δ-LIF cDNA的同一性,將這個克隆在E.coli BL 21(DE3)細胞中的細菌pT7-7載體中表達。構建序列4的1214個氨基酸殘基的全長的毒性cDNA(對應于Asp殘基29至1186),并稱之為pT7.δFL。第一個28個氨基酸殘基被認為存在于蜘蛛毒液腺中的前體多肽中,但在N-末端加工期間被酶切掉。重組蛋白質構成全部細菌溶胞產物蛋白質的約10%。建立人蜘蛛毒液腺純化的δ-LIT的特異性多克隆抗體,并且它被證實對δ-毒素具有特異性。在表達重組全長δ-LIT的細菌中,該蛋白質特異性地檢測出的130KDa的蛋白質細菌表達的全長的δ-LIT和從毒液腺中純化的毒素的比較顯示出約23KDa的大小差異,與計算的分子量一致。全長δ-LIT對昆蟲無毒性,被認為是毒素無活性的前體形式。
從毒液腺純化的δ-LIT通過質譜測量法分析,產生m/z+比率為110916的顯著的分子離子。(在Kratos Kompact MALDI 3質譜儀中,用芥子酸作為基質。氮激光激發為337nm。在線性圖中檢測陽離子)。這接近于在氨基酸991被截短的δ-LIT的預期分子質量。比較起來,細菌表達的全長的δ-LIT產生m/z+比率為133631的分子離子(VK,DRB,PNRV,未顯示數據),在計算值的100Da之內。定點誘變用于產生在δ-LIT序列(序列2)的氨基酸991之后被截短的新的δ-LITcDNA克隆(pT7δM)。將這種蛋白在細菌中表達,產生與從蜘蛛毒液分離出的成熟毒素類似分子質量的蛋白質。
在30℃下將用pT7克隆轉化的E.coli BL21(DE3)分子生長在含100mg氨芐青霉素/ml的LB培養基中直至A600nm為約0.5。接著通過加入ZPTG(1mM)至培養基誘導表達,繼續保溫1小時。為了功能研究,洗滌細菌,并將其重新懸浮在50mM Tris HCl,100mM NaCl,,100mMKcl,0.4%Triton X-100,12%(W/V)蔗糖, 5mM DTT,2μg/ml aprotonin,2mM EDTA pH 8中并在冰上超聲處理。將硫酸銨加到澄清上清液中直至20%飽和的最終濃度,并將沉淀重懸浮在沒有DTT的緩沖液中。這些樣品(5-15μl)用于胸部注射至蝗蟲內(100-300mg體重);每一試驗在多于4個蝗蟲上進行,這些蝗蟲用于試驗24小時毒性。
pT7-7和pT7.δ FL的提取液對蝗蟲不產生作用,攜帶pT7.δM的細菌的提取液導致迅速死亡。蝗蟲的死亡時間從5分鐘到4小時不等,它取決于各批毒素的潛能。
在從成體(雄性和雌性)蝗蟲(Usherwood and Machili,1968)的后胸足分離的神經系統興奮和靜止的爪牽縮肌的神經-肌肉標本上進行初步研究。δ-LIT被在標準蝗蟲鹽水(mMNaCl,180;Kcl,10;CaCl2,2;Hepes,10(pH 6.8)中使用。使用其中省去CaCl2的鹽水進行了一些研究。運用與Grass描筆式記錄器相連的Grass形變傳感器記錄機械反應。運用細胞內微電極(約10mΩ電阻)從成體蝗蟲(一種性別)的后胸伸肌脛肌的纖維得到微型刺激性突觸后電位的記錄。δ-LIT被在標準蝗蟲鹽水,其中CaCl2被省去的鹽水或含有MgCl2代替NaCl的鹽水中使用。小終板電位被記錄在錄象磁帶上,并被使用家庭軟件在MassComp計算機上進行分析。在斑紋吸管(直徑1-2μm,由ClarkElectromedical glass制造)頂端,運用吸管沉浸技術(Montal andMuller,198),由單層的植物醇磷脂酰膽堿或9份同工凝集素和1份膽甾醇的混合物形成雙膜雙分子層。用類似的斑紋吸管從蝗蟲后胸伸肌脛肌纖維(Huddie et al)切去膜碎片。為了降低內源鉀通道的活性,將KCl從吸管和浴器鹽水中省去。
蝗蟲牽縮肌爪肌的神經誘發顫搐收縮被10-11M的δ-LIT(在標準鹽水中使用)減少約40%,并在使用10-10M毒素期間被消除。在δ-LIT使用期間有時發生小的自發性收縮。顫搐幅度的變化伴隨有不可逆的肌肉攣縮。當δ-LIT濃度降低時,攣縮的出現延遲,幅度減小。肌肉攣縮也發生在肌肉沒有神經興奮而使用毒素時。在沒有鈣的鹽水中不發生顫搐收縮,當10-10M的毒素被用于以這種鹽水平衡的標本時,甚至在施用毒素30分鐘后,仍不發生攣縮。
當從蝗蟲肌肉纖維切下的里面向外翻的碎片在斑紋吸管被暴露于10-11M的α-LIT中時,觀察到通道開放和約40pS的最大電導。這種類型的通道開放在不存在毒素時從末觀察到。當斑紋吸客和浴器含有相同的鹽水時(包括2mM CaCl2),通道電流顯示出內部調整,在負吸管電位時通道開放時間比在正吸管電位時長。當有10倍Ca2+梯度通過碎片時,通道電流的逆轉電位為+/-15mV,這是依賴于Ca2+梯度的信號。
在其中10-11M的δ-LIT被置于斑紋吸管的人工雙分子層研究中,觀察到約30pS電導的單通道開放。當毒素從斑紋吸管省去時,沒有看到這些通道。在斑紋吸管和浴器中具有相同的鹽水(含2mM CaCl2)時,α-LITx通道的電流-電壓特征與0mV時的逆轉電位為S形。通過控制斑紋吸管和浴器的離子狀況,通道表現為Ca選擇性。
用對應于δ-LIT的N-末端序列(如上所述)的23個bP的寡核苷酸探針對來自毒液腺cDNA的cDNA文庫進行篩選。為了減少核苷酸錯讀的數目,參考從α-LT和α-LIT cDNA的核苷酸序列得到的密碼子使用數據(Kiyatkin et al,1990,Kiyatkin et al,1993)。克隆2純化和序列測定五個陽性cDNA克隆。最大的克隆(pDT-1)包含多于2(kb)的δ-LIT編碼區。用PstI-3’片段再篩選cDNA文庫以尋找編碼毒素C-末端部分的克隆。分離覆蓋δ-LIT C-末端編碼區的另外的cDNA克隆pDT-17。覆蓋整個開放讀碼的兩個重疊克隆全部序列已被測定。通過利用兩組不同的引物,跨越重疊區域進行聚合酶鏈反應,兩個克隆已被證實為來自毒液腺的單鏈連續RNA的一部分。該復合克隆編碼帶有從第一個框內甲硫氨酸開始,到TAA終止密碼子結束的3642個堿基對框架的cDNA(序列3)。
甲硫氨酸殘基之前是證明推斷序列全長的框內終止密碼子。
通過根據(Krasnoperov et al,1992)的三次柱層析從毒寇蛛毒液中將δ-LIT純化均一。序列測定δ-LIT的N-末端序列的23個氨基酸殘基。用胰蛋白酶酶解純的毒素,分離出七種單獨的肽并進行部分序列測定。
直接N-末端序列測定證明成熟蛋白從序列DEEDGEM開始,因此序列1和2中的第一個殘基為這個序列的第一個Asp。推斷的從Asp(+1)開始的多肽由1186個氨基酸(如序列3+4所示, Asp殘基29至殘基1214)殘基組成,預測的分子質量為132671道爾頓,pI為5.4。它含有由氨基酸序列分析所測定的全部多肽序列。在成熟蛋白的N-末端(如序列3所示)的上游有兩個框內甲硫氨酸殘基(-7和-28),它可作為翻譯起始位點。Met(-7)的密碼子ATG周圍的核苷酸序列與典型的Kozak共有序列(Kozak,1989)較為有關,但Met(-28)的核苷酸排序穩定地對應于從蛛形綱分離出的至少兩種其它已知蛋白的起始點主要家庭塵螨過敏原(AAAATGA)(Yuuki et al,1991)和用α-毒蛛毒素(AAATGA)共純化的低分子量蛋白(Kiyatkin et al,1992)。在這兩種情況下,在成熟蛋白N-末端之前的推斷序列不對應于典型的信號肽結構。我們總結出δ-LIT N-末端的翻譯后修飾只限于去掉7或28個氨基酸殘基。可作為可能的內肽酶酶切位點的一簇陽性氨基酸殘基Arg-X-Iys-Arg(-1-4)的存在支持了翻譯后加工發生在N-末端的假設。
利用PEST(Pogets,S.et al,1986)對δ-LIT推斷結構的分析揭示了富含P,E,S和T的氨基酸序列的存在,它在前面已與細胞內蛋白的快速降解有關(Gottesman & Maurizi,1992)。這個區域具有序列EESGAPEGSFDSPSS,位于殘基956-970之間。在δ-LIT C-末端部分的PEST-區域的出現與蛋白的C-末端加工是一致的。
δ-LIT的計算機分析預測三種假定的跨膜螺旋,其中二種位于末端區域(殘基39-67和221-240),最小長度的第三種位于中心區域。第二種假定的跨膜螺旋(殘基221-2407)在所有的蜘蛛高分子量蛋白神經毒素中屬于一個非常保守的區域(Kiyatkin et al,1993)。
預測的δ-LIT氨基酸序列的斑點-基質分析揭示出在蛋白分子的中心部分的重復基序的存在。δ-LIT的一級結構的460個氨基酸殘基包括串聯排列的錨蛋白樣重復單元的不完全復制體。(Michaely &Bennett,1992)。而αLT和α-LIT(Kiyatkin et al,1990,Kiyatkin etal,1993)具有不少于20個的重復單元,δ-LIT已發現僅具有不少于20個的重復單元,δ-LIT已發現僅具有13個連續的重復單元。它們的最佳定位是具有當初在(Lux et al,1990)中提出的相位。根據與共有序列良好的相關性,在第一個重復單元之前的13個氨基酸序列可被看作是被減少了的重復單元。大多數的δ-LIT重復單元為33-34個氨基酸長度。但兩個重復單元分別含35(R1)和36(R6)個殘基。
PCOMPARE程序分析顯示出兩種昆蟲特異性毒素的重復單元之間的線性相關。通過α-LIT類似重復單元與δ-LIT重復單元R2-R9的比較發現極大的線性對應(Kiyatkin et al,1993)。δ-LIT的第一個重復單元不完全對應于α-LIT的第一個重復單元,而表現出與來自α-LIT的R7的高度相似性。δ-LIT的重復單元R10與來自α-LIT的R7最為相似,這個重復單元異常地在位置8和31分別具有Ser和Gly殘基,下一個相似的范圍被發現在δ-LIT的R11-R13與α-LIT的R10-R12之間。我們已發現R7,R2和R9重復單元在殺蟲毒素中最為高度保守,這意味著是殺蟲毒性的功能角色。已表明紅細胞錨蛋白重復單元就它們與不同蛋白結合的作用能力而言,是不相同的(Davis etal,1991),因此毒素的重復單元也被期望對它們的功能做出不同的貢獻。
δ-和α-LIT的斑點-基質比較表明它們具有相似的總體結構,曾經具有強烈的中心對角斷裂(在δ-LIT的900和1130氨基酸殘基之間)并復原為兩種毒素的最后160個氨基酸。中心對角的位移反映了毒素長度的不同;δ-LIT比其昆蟲特異性對應物短190個氨基酸。
成熟蛋白質可被分成一些結構功能區由約470個氨基酸殘基組成,與α-LIT具有高度線性同源性的N-末端;約430個氨基酸,差不多完全由串聯排列的錨蛋白樣重復單元組成的中心功能區和約160個氨基酸的C-末端功能區。
殺蟲毒素蛋白質序列的排列表明N和C-末端結構功能區證明了被頗為不同的序列分開的高度同一性的功能區的存在,具有N-末端功能區為44.9%,C-末端為37.1%的高水平的同一性。兩種殺蟲毒素一級結構最令人注目的變化集中在含重復單元的域的C-末端部分。同源的范圍定位于δ-LIT的13錨蛋白重復單元。這個區域的后面是與α-LIT或α-LT的及與來自NBRF-PIR數據庫的任何其它蛋白沒有明顯同源性的約110個氨基酸殘基。有意思地是,δ-LIT所缺少的這個域形成了α-LIT一級結構的一個特有的域,它具有異常簇的Cys-殘基,并與哺乳動物特異性的α LT具有同源性(Kiyatkin et al,1993)。兩種昆蟲特異性的神經毒素之間的如此顯著的結構差異意味著錨蛋白樣重復功能域的C-末端部分在提供它們不同的功能特征的結構基礎中起著特殊的作用。
來自毒寇蛛毒液的高分子量蛋白質毒素是有效的,具有特異性的一類毒素。這些毒素為說明神經蛋白質的功能及提供昆蟲特異性毒素提供了很大的可能。然而由于不能表達具任一功能的這些蛋白質毒素,這種可能在以前沒有被認識到。本發明提供了在細菌中的編碼新的昆蟲特異性毒素的新的DNA轉錄本的克隆,這種毒素及其它多肽的功能表達。
用基于毒素的1-23氨基酸序列的寡核苷酸克隆δ-LIT cDNA,并通過另外的肽序列證明它的同一性,使用δ-LIT特異性抗體證明免疫化學同一性。推斷出的δ-LIT的一級結構與哺乳動物特異性的αLT和昆蟲特異性的α-LIT具有相當大的相似性,這意味著這些毒素是具有相似結構的一族的一部分。這三種蛋白質具有由“錨蛋白樣”的重復單元組成的中心功能區,在δ-LIT中具有13個重復單元。錨蛋白族的蛋白質將血蛋白偶聯至各種膜內在蛋白上(Bennett,1992),人們認為錨蛋白的“錨蛋白重復”功能域負責與蛋白質特異性的結合(Davis andBennett,1990 J.Biol Chem 25610589-10596,Davis et al(1991)J.Biol Chem 266 11163-11169)。與錨蛋白族的這種結構相似性反映在毒蛛毒素的已知的功能特性上;已知αLT與受體結合具有高度親和性(Kd 10-9M)。與αLT受體的特異性結合是否借助于毒素的錨蛋白重復域來傳遞還有待確定。
意外地,δ-LIT與昆蟲特異性α-LIT的相似性(38%)不大于與哺乳動物特異性αLT(37%)。然而δ-LIT僅具有13個重復單元,αLT和α-LIT分別具有19和20個錨蛋白重復單元。后者6/7的重復在δ-LIT中不具對應物,可能為結構單元,因為α-毒素在這個區域都含有6個半胱氨酸殘基和部分保守的間隔。然而,由于αLT和α-LIT的靶毒性差異,不可能識別具有昆蟲特異性毒性的這種結構特征。
δ-LIT在由cDNA序列推斷出的毒素分子量與從毒液純化而來的純毒素的相對遷移率之間顯示明顯的差異。雖然通過蛋白質序列測定已清楚地鑒定了蛋白質的N-末端,但難以證明C-末端的準確位置。細菌中全長的δ-LIT cDNA的表達證明計算的分子質量被精確地反映在SDS-PAGE中蛋白質的相對遷移率中,天然毒液獲得物如果不是全部則主要來自蛋白酶解的C-末端加工。將全長的重組蛋白質純化。但在任何條件下對蝗蟲無毒。全長的蛋白質是功能毒素的無活性前體。通過MALDI-質譜測定法分析從毒液純化的δ-LIT的C-末端的準確位點,將酶解位點定位于蛋白質的第991個氨基酸。cDNA突變產生一具有如序列2所示的序列的991個氨基酸的蛋白質,并在細菌中表達,成熟的重組蛋白質是可溶性的,對蝗蟲具有致死性。蛋白質的不完全純化意味著毒素為高毒性的。
從使用由如上所述的全部基因的截短形式而來的成熟毒素的表達具有相當多的優點。第一,通過在細菌系統中截短形式的功能表達,可相對容易地產生毒素,因而免除需要從蜘蛛毒液腺純化毒素。這使毒素的工業化生產和今后的商業開發成為可能,例如作為殺蟲劑系統的主要成分。
而且它提供了除常規方法如噴霧外的毒素作為殺蟲劑的可能的施用系統。例如可以產生一種含有摻入了截短序列的重組分子的被修飾的植物細胞或植物,如作物。該系統包含含有截短形式的重組桿狀病毒。這種病毒在體內為高感染性的,并且抵抗宿主細胞中的失活,在宿主昆蟲細胞中能夠高水平地表達插入的核苷酸序列。這被期望對植物甚至哺乳動物無害。在攝食植物組織時,昆蟲將吸收重組分子和/或毒素,最終導致了昆蟲的死亡。因為毒素是昆蟲特異性的,它被期望對消費它的人類或動物不具有有害影響。
這是本發明的一個實施方案用于在細菌表達系統中表達通常通過生物系統中前體蛋白質的翻譯后修飾而產生毒素的例子。它將被理解為編碼其它蛋白質的其它基因的截短形式可以這種方式表達,并處于本發明的范圍內。
本發明還提供了由全長分離基因表達產生,接著被翻譯后修飾的前體多肽形成的毒素。前體多肽具有如序列4所示的氨基酸序列,毒素具有如序列2所示的序列。
編碼毒素δLIT的前體多肽的分離基因(序列3)(或類似物)可被克隆至表達前體多肽的載體中。可使用桿狀病毒表達系統。接著通過定點誘變可將由此產生的前體多肽在如上所述的位點截短來產生活性毒素。這使毒素δLIT或它的活性衍生物能夠與毒寇蛛無關地而被產生。因此在工業規模上用作如上所述的殺蟲劑。
雖然在前面說明書努力引起被認為是對本發明具有特別重要性的那些特征的注意,它應被理解為對關于上文涉及和/或圖中所示的任何可專利的特征或特征的組合的申請人權利要求的保護,無論是否重點強調,均已被置于其中。
序列表(1)一般信息(i)申請人(A)名稱BRITISH TECHNOLOGY GROUP LIMITED(B)街道101 NEWINGTON CAUSEWAY(C)城市LONDON(E)國家UNITED KINGDOM(F)郵政編碼(ZIP)SEI 6BU(ii)發明名稱新的毒素和生產毒素的方法(iii)序列數目4(iv)計算機可讀形式(A)媒介類型Floppy軟盤(B)計算機IBM PC,兼容(C)操作系統PC-DOD/MS-DOS(D)軟件PatentIn Release E1.0,Version E1.30(EPO)(2)序列1的信息(i)序列特征(A)長度2976個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構末知(ii)分子類型其它核酸(A)說明/desc=“質粒DNA”(vi)起始來源(A)生物LATRODECTUS MACTANSTREDECIMGUTTATUS(vii)中間來源(B)克隆pT7.deltaM(ix)特性(A)名稱/關鍵詞CDS(B)位置1..2976(xi)序列描述序列1GAT GAA GAA GAT GGA GAA ATG ACT CTA GAA GAA AGA CAA GCA CAA TGC48Asp Glu Glu Asp Gly Glu Met Thr Leu Glu Glu Arg Gln Ala Gln Cys1 5 10 15AAA GCA ATA GAG TAC AGC AAT TCA GTT TTT GGG ATG ATC GCT GAT GTA96Lys Ala Ile Glu Tyr Ser Asn Ser Val Phe Gly Met Ile Ala Asp Val20 25 30GCT AAC GAC ATC GGT TCC ATT CCT GTA ATT GGC GAA GTA GTT GGC ATT 144Ala Asn Asp Ile Gly Ser Ile Pro Val Ile Gly Glu Val Val Gly Ile35 40 45GTA ACT GCC CCA ATT GCC ATC GTA AGT CAC ATT ACT AGC GCA GGC TTG 192Val Thr Ala Pro Ile Ala Ile Val Ser His Ile Thr Sar Ala Gly Leu50 55 60GAT ATA GCT TCT ACG GCA TTA GAT TGT GAT GAT ATA CCT TTT GAT GAG 240Asp Ile Ala Ser Thr Ala Leu Asp Cys Asp Asp Ile Pro Phe Asp Glu65 70 75 80ATT AAG GAA ATA TTA GAA GAA AGA TTC AAT GAA ATA GAT AGA AAG TTG 288Ile Lys Glu Ile Leu Glu Glu Arg Phe Asn Glu Ile Asp Arg Lys Leu85 90 95GAC AAG AAC ACA GCT GCT TTG GAA GAG GTC TCT AAA CTG GTA AGT AAA 336Asp Lys Asn Thr Ala Ala Leu Glu Glu Val Ser Lys Leu Val Ser Lys100 105 110ACT TTT GTT ACG GTG GAA AAA ACA AGG ATT GAA ATG AAC GAA AAT TTT 384Thr Phe Val Thr Val Glu Lys Thr Arg Asn Glu Met Asn Glu Asn Phe115 120 125AAG CTT GTT TTG GAA ACT ATA GAA AGC AAA GAA ATA AAA TCA ATT GTA 432Lys Leu Val Leu Glu Thr Ile Glu Ser Lys Glu Ile Lys Ser Ile Val130 135 140TTC AAA ATA AAT GAT TTT AAA AAG TTT TTT GAA AAA GAA CGA CAA AGA 480Phe Lys Ile Asn Asp Phe Lys Lys Phe Phe Glu Lys Glu Arg Gln Arg145 150 155 160ATT AAA GGT TTG CCT AAA GAT AGG TAT GTT GCT AAG CTT CTA GAA CAA 528Ile Lys Gly Leu Pro Lys Asp Arg Tyr Val Ala Lys Leu Leu Glu Gln165 170 175AAA GGT ATT TTA GGT TCT TTA AAA GAA GTA AGA GAA CCA TCT GGA AAC 576Lys Gly Ile Leu Gly Ser Leu Lys Glu Val Arg Glu Pro Ser Gly Asn180 185 190AGT CTG AGC TCC GCG TTA AAT GAA CTC TTA GAC AAA AAC AAC AAC TAT 624Ser Leu Ser Ser Ala Leu Asn Glu Leu Leu Asp Lys Asn Asn Asn Tyr195 200 205GCC ATC CCA AAA GTG GTT GAT GAT AAT AAG GCC TTT CAG GCG CTG TAT 672Ala Ile Pro Lys Val Val Asp Asp Asn Lys Ala Phe Gln Ala Leu Tyr210 215 220GCT TTA TTT TAT GGA ACT CAG ACT TAT GCA GCC GTT ATG TTT TTC TTA 720Ala Leu Phe Tyr Gly Thr Gln Thr Tyr Ala Ala Val Met Phe Phe Leu225 230 235 240CTC GAA CAA CAT TCT TAT CTG GCT GAT TAT TAT TAC CAA AAA GGT GAT768Leu Glu Gln His Ser Tyr Leu Ala Asp Tyr Tyr Tyr Gln Lys Gly Asp245 250 255GAT GTA AAT TTT AAT GCA GAA TTT AAT AAT GTA GCA ATT ATT TTT GAT816Asp Val Asn Phe Asn Ala Glu Phe Asn Asn Val Ala Ile Ile Phe Asp260 265 270GAC TTT AAA TCA TCA CTA ACA GGA GGA GAT GAC GGA TTA ATA GAT AAT864Asp Phe Lys Ser Ser Leu Thr Gly Gly Asp Asp Gly Leu Ile Asp Asn275 280 285GTC ATT GAG GTT CTT AAC ACC GTG AAA GCA TTA CCA TTT ATA AAG AAC912Val Ile Glu Val Leu Asn Thr Val Lys Ala Leu Pro Phe Ile Lys Asn290 295 300GCC GAC AGT AAA CTA TAC AGA GAA TTA GTA ACT AGA ACA AAA GCT TTA960Ala Asn Ser Lys Leu Tyr Arg Glu Leu Val Thr Ars Thr Lys Ala Leu305 310 315 320GAG ACT CTT AAA AAT CAA ATC AAA ACG ACT GAT TTG CCT CTT ATA GAT 1008Glu Thr Lau Lys Asn Gln Ile Lys Thr Thr Asp Leu Pro Leu Ile Asp325 330 335GAT ATA CCC GAA ACT TTG TCT CAA GTG AAC TTT CCG AAT GAC GTT AAT 1056Asp Ile Pro Glu Thr Leu Ser Gln Val Asn Phe Pro Asn Asp Glu Asn340 345 350CAA TTG CCT ACA CCA ATA GGA AAT TGG GTT GAT GGC GTA GAA GTT AGG 1104Gln Leu Pro Thr Pro Ile Gly Asn Trp Val Asp Gly Val Glu Val Arg355 360 365TAC GCA GTA CAG TAT GAA AGT AAG GGC ATG TAT TCG AAA TTC AGT GAA 1152Tyr Ala Val Gln Tyr Glu Ser Lys Gly Met Tyr Ser Lys Phe Ser Glu370 375 380TGG TCT GAA CCA TTT ACT GTC CAA GGT AAC GCT TGT CCG ACT ATA AAA 1200Trp Ser Glu Pro Phe Thr Val Gln Gly Asn Ala Cys Pro Thr Ile Lys385 390 395 400GTT CGT GTT GAT CCG AAA AAG AGA AAT AGA CTT ATC TTT AGG AAG TTC 1248Val Arg Val Asp Pro Lys Lys Arg Asn Arg Leu Ile Phe Arg Lys Phe405 410 415AAC TCA GGA AAA CCT CAG TTT GCT GGA ACC ATG ACT CAT TCA CAA ACA 1296Asn Ser GTy Lys Pro Gln Phe Ala Gly Thr Met Thr His Ser Gln Thr420 425 430AAT TTT AAA GAT ATT CAT CGT GAT CTA TAC GAT GCA GCC TTA AAT ATT 1344Asn Phe Lys Asp Ile His Arg Asp Leu Tyr Asp Ala Ala Leu Asn Ile435 440 445AAT AAG TTG AAA GCA GTG GAT GAA GCT ACA ACT TTG ATT GAA AAG GGT 1392Asn Lys Leu Lys Ala Val Asp Glu Ala Thr Thr Leu Ile Glu Lys Gly450 455 460GCA GAC ATA GAA GCA AAA TTT GAC AAT GAC AGA AGT GCA AGT CAC GCA1440Ala Asp Ile Glu Ala Lys Phe Asp Asn Asp Arg Ser Ala Met Mls Ala465 470 475 480GTT GCA TAT CGA GGA AAT AAC AAA ATA GCC TTA AGA TTT CTT TTG AAA1488Val Ala Tyr Arg Gly Asn Asn Lys Ile Ala Leu Arg Phe Leu Leu Lys485 490 495AAT CAA TCC ATT GAG ATC GAG TTA AAA GAT AAA AAC GGC TTT ACT CCT1536Asn Gln Ser Ile Asp Ile Glu Leu Lys Asp Lys Asn Gly Pha Thr Pro500 505 510CTA CAC ATC GCA GCT GAA GCA GGT CAG GCA GGA TTT GTT AAG TTA CTA 1584Leu His Ile Ala Ala Glu Ala Gly Gln Ala Gly Phe Val Lys Leu Leu515 520 525ATA AAT CAT GGA GCT GAT GTG AAT GCA AAA ACA AGT AAG ACA AAT TTG 1632Ile Asn His Gly Ala Asp Val Asn Ala Lys Thr Ser Lys Thr Asn Leu530535 540ACA CCA TTA CAT CTT GCA ACA CGT AGT GGA TTT TCA AAA ACT GTA AGA 1680Thr Pro Leu His Leu Ala Thr Arg Ser Gly Phe Ser Lys Thr Val Arg545 550 555 560AAT TTA CTA GAA AGC CCA AAT ATT AAG GTA AAT GAA AAG GAG GAT GAC 1728Asn Leu Leu Glu Ser Pro Asn Ile Lys Val Asn Glu Lys Glu Asp Asp565 570 575GGA TTT ACA CCT TTG CAT ACT GCA GTA ATG AGT ACT TAT ATG GTT GTC 1776Gly Phe Thr Pro Leu His Thr Ala Val Met Ser Thr Tyr Met Val Val580 585 590GAT GCT TTG CTA AAT CAT CCA GAC ATT GAT AAA AAT GCG CAG TCT ACG 1824Asp Ala Leu Leu Asn His Pro Asp Ile Asp Lys Asn Ala Gln Ser Thr595 600 605TCA GGA TTG ACT CCT TTC CAT TTA GCA ATT ATT AAT GAA AGT CAA GAA 1872Ser Gly Leu Thr Pro Phe His Leu Ala Ile Ile Asn Glu Ser Gln Glu610 615 620GTT GCA GAA TCT TTA GTG GAA AGT AAT GCT GAT CTA AAT ATT CAG GAT 1920Val Ala Glu Ser Leu Val Glu Ser Asn Ala Asp Leu Asn Ile Gln Asp625 630 635 640GTT AAC CAT ATG GCT CCT ATT CAT TTT GCA GCT TCA ATG GGT AGT ATT 1968Val Asn His Met Ala Pro Ile His Phe Ala Ala Ser Met Gly Ser Ile645 650 655AAA ATG CTT AGA TAT CTC ATT TCC ATA AAA GAT AAA GTT AGT ATT AAT 2016Lys Met Leu Arg Tyr Leu Ile Ser Ile Lys Asp Lys Val Ser Ile Asn660 665 670TCT GTG ACT GAG AAT AAT AAC TGG ACA CCT TTA CAT TTT GCT ATA TAT 2064Ser Val Thr Glu Asn Asn Asn Trp Thr Pro Leu His Phe Ala Ile Tyr675 680 685TTT AAA AAA GAT GAT GCT GCA AAA GAA TTG TTG AAA CAA GAT GAC ATA 2112Phe Lys Lys Glu Asp Ala Ala Lys Glu Leu Leu Lys Gln Asp Asp Ile690 695 700AAT TTA ACA ATT GTT GCA GAT GGT AAT CTT ACC GTT TTA CAT CTT GCT 2160Asn Leu Thr Ile Val Ala Asp Gly Asn Leu Thr Val Leu His Leu Ala705 710 715 720GTT TCG ACA GGA CAA ATA AAT ATA ATT AAA GAA TTA TTG AAG AGA GGC 2208Val Ser Thr Gly Gln Ile Asn Ile Ile Lys Glu Leu Leu Lys Arg Gly725 730 735TCC AAT ATA GAA GAA AAA ACT GGA GAA GGA TAT ACA TCT CTC CAC ATC 2256Ser Asn Ile Glu Glu Lys Thr Gly Glu Gly Tyr Thr Ser Leu His Ile740 745 750GCT GCG ATG CGA AAG GAG CCA GAG ATA GCT GTT GTT TTG ATT GAA AAC 2304Ala Ala Met Arg Lys Glu Pro Glu Ile Ala Val Val Leu Ile Glu Asn755 760 765GGT GCT GAC ATA GAA GCT CGA TCA GCT GAT AAT TTA ACA CCT TTA CAT 2352Gly Ala Asp Ile Glu Ala Arg Ser Ala Asp Asn Leu Thr Pro Leu His770 775 780TCT GCC GCA AAA ATA GGA AGG AAA TCT ACA GTA CTT TAC TTA TTA GAA 2400Ser Ala Ala Lys Ile Gly Arg Lys Ser Thr Val Leu Tyr Leu Leu Glu785 790 795 800AAA GGA GCT GAC ATT GGA GCT AAA ACA GCA GAC GGT TCT ACT GCC TTG 2448Lys Gly Ala Alp Ile Gly Ala Lys Thr Ala Asp Gly Ser Thr Ala Leu805 810 815CAT TTA GCT GTA TCT GGT CGT AAA ATG AAA ACT GTT GAA ACT CTA TTA 2496His Leu Ala Val Ser Gly Arg Lys Met Lys Thr Val Glu Thr Leu Leu820 825 830AAT AAA GGA GCA AAT TTA AAA GAA TAC GAT AAC AAT AAA TAT TTG CCA 2544Aan Lys Gly Ala Asn Leu Lys Glu Tyr Asp Asn Asn Lys Tyr Leu Pro835 840 845ATA CAT AAA GCT ATT ATT AAT GAT GAC CTT GAC ATG GTA CGT TTG TTT 2592Ile His Lys Ala Ile Ile Asn Asp Asp Leu Asp Met Val Arg Leu Phe850 855 860CTT GAA AAA GAT CCC AGT CTC AAA GAT GAT GAA ACA GAA GAG GGT AGA 2640Leu Glu Lys Asp Prp Ser Leu Lys Asp Asp Glu Thr Glu Glu Gly Arg865 870 875 880ACT TCA ATT ATG TTA ATT GTT CAG AAA TTG CTT CTT GAA TTA TAT AAC 2688Thr Ser Ile Mel Leu Ile Val Gln Lys Leu Leu Leu Glu Leu Tyr Asn885 890 895TAT TTT ATA AAT AAT TAT GCT GAA ACT TTG GAT GAA GAA GCT TTA TTC 2736Tyr Phe Ile Asn Asn Tyr Ala Glu Thr Leu Asp Glu Glu Ala Leu Phe900 905 910AAC CGC TTA GAT GAA CAA GGG AAA TTA GAG CTT GCA TAT ATC TTC CAT 2784Asn Arg Leu Asp Glu Gln Gly Lys Leu Glu Leu Ala Tyr Ile Phe His915 920 925AAT AAA GAA GGT GAT GCA AAA GAG GCT GTT AAG CCA ACT ATC CTT GTT 2832Asn Lys Glu Gly Asp Ala Lys Glu Ala Val Lys Pro Thr Ile Leu Val930 935 940ACA ATT AAA CTT ATG GAA TAC TGC TTA AAA AAA CTT CGC GAA GAG TCT 2880Thr Ile Lys Leu Met Glu Tyr Cys Leu Lys Lys Leu Arg Glu Glu Ser945 950 955 960GCA GCT CCT GAA GGT AGT TTC GAT TCT CCA TCT TCA AAG CAA TGT ATT 2928Gly Ala Pro Glu Gly Ser Phe Asp Ser Pro Ser Ser Lys Gln Cys Ile960 970 975TCT ACC TTT TCA GAG GAT GAA ATG TTT CGT CGT ACT TTA CCG GAA TGA 2976Ser Thr Phe Ser Glu Asp Glu Met Phe Arg Arg Thr Leu Pro Glu *980 985 990(2)序列2的信息(i)序列特征(A)長度922個氨基酸(B)類型氨基酸(D)拓撲結構線性(ii)分子類型蛋白質(xi)序列描述序列2Asp Glu Glu Asp Gly Glu Met Thr Leu Glu Glu Arg Gln Ala Gln Cly1 5 10 15Lys Ala Ile Glu Tyr Ser Asn Ser Val Phe Gly Met Ile Ala Asp Val20 25 30Ala Asn Asp Ile Gly Ser Ile Pro Val Ile Gly Glu Val Val Gly Ile35 40 45Val Thr Ala Pro Ile Ala Ile Val Ser His Ile Thr Ser Ala Gly Leu50 55 60Asp Ile Ala Ser Thr Ala Leu Asp Cys Asp Asp Ile Pro Phe Asp Glu65 70 75 80Ile Lys Glu Ile Leu Glu Glu Arg Phe Asn Glu Ile Asp Arg Lys Leu85 90 95Asp Lys Asn Thr Ala Ala Leu Glu Glu Val Ser Lys Lev Val Ser Lys100 105 110Thr Pne Val Thr Val Glu Lys Thr Arg Asn Glu Met Asn Glu Asn Pne115 120 125Lys Leu Val Leu Glu Thr Ile Glu Ser Lys Glu Ile Lys Ser Ile Val130 135 140Phe Lys Ile Asn Asp Phe Lys Lys Phe Phe Glu Lys Glu Arg Gln Arg145 150 155 160Ile Lys Gly Leu Pro Lys Asp Arg Tyr Val Ala Lys Leu Leu Glu Gln165 170 175Lys Gly Ile Leu Gly Ser Leu Lys Glu Val Arg Glu Pro Ser Gly Asn180 185 190Ser Leu Ser Ser Ala Leu Asn Glu Leu Leu Asp Lys Asn Asn Asn Tyr195 200 205Ala Ile Pro Lys Val Val Asn Asp Asn Lys Ala Phe Gln Ala Leu Tyr210 215 220Ala Leu Phe Tyr Gly Thr Gln Thr Tyr Ala Ala Val Met Phe Phe Leu225 230 235 240Leu Glu Gln His Ser Tyr Leu Ala Asp Tyr Tyr Tyr Gln Lys Gly Asp245 250 255Asp Val Asn Phe Asn Ala Glu Phe Asn Asn Val Ala Ile Ile Phe Asp260 265 270Asp Phe Lys Ser Ser Leu Thr Gly Gly Asp Asp Gly Leu Ile Asp Asn275 280 285Val Ile Glu Val Leu Asn Thr Val Lys Ala Leu Pro Phe Ile Lys Asn290 295 300Ala Asp Ser Lys Leu Tyr Arg Glu Leu Val Thr Arg Thr Lys Ala Leu305 310 315 320Glu Thr Leu Lys Asn Gln Ile Lys Thr Thr Asp Leu Pro Leu Ile Asp325 330 335Asp Ile Pro Glu Thr Leu Ser Gln Val Asn Phe Pro Asn Asp Glu Asn340 345 350Gln Leu Pro Thr Pro Ile Gly Asn Trp Val Asp Gly Val Glu Val Arg355 360 365Tyr Ala Val Gln Tyr Glu Ser Lys Gly Met Tyr Ser Lys Phe Ser Glu370 375 380Trp Ser Glu Pro Phe Thr Val Gln Gly Asn Ala Cys Pro Thr Ile Lys385 390 395 400Val Arg Val Asp Pro Lys Lys Arg Asn Arg Leu Ile Phe Arg Lys Phe405 410 415Ash Ser Gly Lys Pro Gln Phe Ala Gly Thr Met Thr His Ser Gln Thr420 425 430Asn Phe Lys Asp Ile His Arg Asp Leu Tyr Asp Ala Ala Leu Asn Ile435 440 445Asn Lys Leu Lys Ala Val Asp Glu Ala Thr Thr Leu Ile Glu Lys Gly450 455 460Ala Asp Ile Glu Ala Lys Phe Asp Asn Asp Arg Ser Ala Met His Ala465 470 475 480Val Ala Tyr Arg Gly Asn Asn Lys Ile Ala Leu Arg Phe Leu Leu Lys485 490 495Asn Gln Ser Ile Asp Ile Glu Leu Lys Asp Lys Asn Gly Phe Thr Pro500 505 510Leu His Ile Ala Ala Glu Ala Gly Gln Ala Gly Phe Val Lys Leu Leu515 520 525Ile Asn His Gly Ala Asp Val Asn Ala Lys Thr Ser Lys Thr Asn Leu530 535 540Thr Pro Leu His Leu Ala Thr ArG Ser Gly Phe Ser Lys Thr Val Arg545 550 555 560Asn Leu Leu Glu Ser Pro Asn Ile Lys Val Asn Glu Lys Glu Asp Asp565 570 575Gly Phe Thr Pro Leu His Tnr Ala Val Met Ser Thr Tyr Met Val Val580 585 590Asp Ala Leu Leu Asn His Pro Asp Ile Asp Lys Asn Ala Gln Ser Thr595 600 605Ser Gly Leu Thr Pro Phe His Leu Ala Ile Ile Asn Glu Ser Gln Glu610 615 620Val Ala Glu Ser Leu Val Glu Ser Asn Ala Asp Leu Asn Ile Gln Asp625 630 635 640Val Asn His Met Ala Pro Ile His Phe Ala Ala Ser Met Gly Ser Ile645 650 655Lys Met Leu Arg Tyr Leu Ile Ser Ile Lys Asp Lys Val Ser Ile Asn660 665 670Ser Val Thr Glu Asn Asn Asn Trp Thr Pro Leu His Phe Ala Ile Tyr675 680 685Phe Lys Lys Glu Asp Ala Ala Lys Glu Leu Leu Lys Gln Asp Asp Ile690 695 700Asn Leu Thr Ile Val Ala Asp Gly Asn Leu Thr Val Leu His Leu Ala705 710 715 720Val Ser Thr Gly Gln Ile Asn Ile Ile Lys Glu Leu Leu Lys Arg Gly725 730 735Ser Asn Ile Glu Glu Lys Thr Gly Glu Gly Tyr Thr Ser Leu His Ile740 745 750Ala Ala Met Arg Lys Glu Pro Glu Ile Ala Val Val Leu Ile Glu Asn755 760 765Gly Ala Asp Ile Glu Ala Arg Ser Ala Asp Asp Leu Thr Pro Leu His770 775 780Ser Ala Ala Lys Ile Gly Arg Lys Ser Thr Val Leu Tyr Leu Leu Glu785 790 795 800Lys Gly Ala Asp Ile Gly Ala Lys Thr Ala Asp Gly Ser Thr Ala Leu805 810 815His Leu Ala Val Ser Gly Arg Lys Met Lys Thr Val Glu Thr Leu Leu820 825 830Asn Lys Gly Ala Asn Leu Lys Glu Tyr Asp Asn Asn Lys Tyr Leu Pro835 840 845Ile His Lys Ala Ile Ile Asn Asp Asp Leu Asp Met Val Arg Leu Phe850 855 860Leu Glu Lys Asp Pro Ser Leu Lys Asp Asp Glu Thr Glu Glu Gly Arg865 870 875 880Thr Ser Ile Met Leu Ile Val Gln Lys Leu Leu Leu Glu Leu Tyr Asn885 890 895Tyr Phe Ile Asn Asn Tyr Ala Glu Thr Leu Asp Glu Glu Ala Leu Phe900 905 910Asn Arg Leu Asp Glu Gln Gly Lys Leu Glu Leu Ala Tyr Ile Phe His915 920 925Asn Lys Glu Gly Asp Ala Lys Glu Ala Val Lys Pro Thr Ile Leu Val930 935 940Thr Ile Lys Leu Met Glu Tyr Cys Leu Lys Lys Leu Arg Glu Glu Ser945 950 955 960Gly Ala Pro Glu Gly Ser Phe Asp Ser Pro Ser Ser Lys Gln Cys Ile965 970 975Ser Thr Phe Ser Glu Asp Glu Met Phe Arg Arg Thr Leu Pro Glu *980 985 990(2)序列3的信息(i)序列特征(A)長度3706個堿基對(B)類型核酸
(C)鏈型雙鏈(D)拓撲結構環狀(ii)分子類型其它核酸(A)描述/desc=“質粒DNA”(vi)起始來源(A)生物LATRODECTUS MACTANSTREDECIMGUTTATUS(vii)中間來源(B)克隆pT7.deltaFL(ix)特點(A)名稱/關鍵詞CDS(B)位置45..3686(xi)序列描述序列3EGTCAATTGA AACTTTATGA TAGGATTCAC TTTCTTATAT AGAA ATG CAT TCC AAA 56Met His Ser Lys995GAA TTA CAA ACT ATT TCA GCA GCG GTA GCA CGA AAA GCA GTA CCC AAT 104Glu Leu Gln Thr Ile Ser Ala Ala Val Ala Arg Lys Ala Val Pro Asn100010051010AGT ATG GTT ATT CGG TTG AAA AGA GAT GAA GAA GAT GGA GAA ATG ACT 152Thr Met Val Ile Arg Leu Lys Arg Asp Glu Glu Asp Gly Glu Met Thr101510201025CTA GAA GAA AGA CAA GCA CAA TGC AAA GCA ATA GAG TAC AGC AAT TCA 200Leu Glu Glu Arg Gln Ala Gln Cys Lys Ala Ile Glu Tyr Ser Asn Ser103010351040GTT TTT GGG ATG ATC GCT GAT GTA GCT AAC GAC ATC GGT TCC ATT CCT 248Val Phe Gly Met Ile Ala Asp Val Ala Asn Asp Ile Gly Ser Ile Pro1045105010551060GTA ATT GGC GAA GTA GTT GGC ATT GTA ACT GCC CCA ATT GCC ATC GTA 296Val Ile Gly Glu Val Val Gly Ile Val Thr Ala Pro Ile Ala Ile Val106510701075AGT CAC ATT ACT AGC GCA GGC TTG HAT ATA GCT TCT ACG GCA TTA GAT 344Ser His Ile Thr Ser Ala Gly Leu Asp Ile Ala Ser Thr Ala Leu Asp108010851090TGT GAT GAT ATA CCT TTT GAT GAG ATT AAG GAA ATA TTA GAA GAA AGA 392Cys Asp Asp Ile Pro Phe Asp Glu Ile Lys Glu Ile Leu Glu Glu Arg109511001105TTC AAT GAA ATA GAT AGA AAG TTG GAC AAG AAC ACA GCT GCT TTG GAA 440Phe Asn Glu Ile Asp Arg Lys Leu Asp Lys Asn Thr Ala Ala Leu Glu111011151120GAG GTC TCT AAA CTG GTA AGT AAA ACT TTT GTT ACG GTG GAA AAA ACA 488Glu Val Ser Lys Leu Val Ser Lys Thr Phe Val Thr Val Glu Lys Thr1125113011351140AGG AAT GAA ATG AAC GAA AAT TTT AAG CTT GTT TTG GAA ACT ATA GAA 536Arg Asn Glu Met Asn Glu Asn Phe Lys Leu Val Leu Glu Thr Ile Glu114511501155AGC AAA GAA ATA AAA TCA ATT GTA TTC AAA ATA AAT GAT TTT AAA AAG 584Ser Lys Glu Ile Lys Ser Ile Val Phe Lys Ile Asn Asp Phe Lys Lys116011651170TTT TTT GAA AAA GAA CGA CAA AGA ATT AAA GGT TTG CCT AAA GAT AGG 632Phe Phe Glu Lys Glu Arg Gln Arg Ile Lys Gly Leu Pro Lys Asp Arg117511801185TAT GTT GCT AAG CTT CTA GAA CAA AAA GGT ATT TTA GGT TCT TTA AAA 680Tyr Val Ala Lys Leu Leu Glu Gln Lys Gly Ile Leu Gly Ser Leu Lys119011951200GAA GTA AGA GAA CCA TCT GGA AAC AGT CTG AGC TCC GCG TTA AAT GAA 728Glu Val Arg Glu Pro Ser Gly Asn Ser Leu Ser Ser Ala Leu Asn Glu1205121012151220CTC TTA GAC AAA AAC AAC AAC TAT GCC ATC CCA AAA GTG GTT GAT GAT 776Leu Leu Asp Lys Asn Asn Asn Tyr Ala Ile Pro Lys Val Val Asp Asp122512301235AAT AAG GCC TTT CAG GCG CTG TAT GCT TTA TTT TAT GGA ACT CAG ACT 824Asn Lys Ala Phe Gln Ala Leu Tyr Ala Leu Phe Tyr Gly Thr Gln Thr124012451250TAT GCA GCC GTT ATG TTT TTC TTA CTC GAA CAA CAT TCT TAT CTG GCT 872Tyr Ala Ala Val Met Phe Phe Leu Leu Glu Glu His Sar Tyr Leu Ala125512601265GAT TAT TAT TAC CAA AAA GGT GAT GAT GTA AAT TTT AAT GCA GAA TTT 920Asp Tyr Tyr Tyr Gln Lys Gly Asp Asp Val Asn Phe Asn Ala Glu Phe127012751280AAT AAT GTA GCA ATT ATT TTT GAT GAC TTT AAA TCA TCA CTA ACA GGA 968Asn Asn Val Ala Ile Ile Phe Asp Asp Phe Lys Ser Ser Leu Thr Gly1285129012951300GGA GAT GAC GGA TTA ATA GAT AAT GTC ATT GAG GTT CTT AAC ACC GTG 1016Gly Asp Asp Gly Leu Ile Asp Asn Val Ile Glu Val Lau Asn Thr Val130513101315AAA GCA TTA CCA TTT ATA AAG AAC GCC GAC AGT AAA CTA TAC AGA GAA 1064Lys Ala Leu Pro Phe Ile Lys Asn Ala Asp Ser Lys Leu Tyr Arg Glu132013251330TTA GTA ACT AGA ACA AAA GCT TTA GAG ACT CTT AAA AAT CAA ATC AAA 1112Leu Val Thr Arg Thr Lys Ala Leu Glu Thr Leu Lys Asn Gln Ile Lys133513401345ACG ACT GAT TTG CCT CTT ATA GAT GAT ATA CCC GAA ACT TTG TCT CAA 1160Thr Thr Asp Leu Prp Leu Ile Asp Asp Ile Pro Glu Thr Leu Ser Gln135013551360GTG AAC TTT CCG AAT GAC GAA AAT CAA TTG CCT ACA CCA ATA GGA AAT 1208Val Asn Phe Pro Asn Asp Glu Asn Gln Leu Pro Thr Pro Ile Gly Asn1365137013751380TGG GTT GAT GGC GTA AAA GTT AGG TAC GCA GTA CAG TAT GAA AGT AAG 1256Trp Val Asp Gly Val Glu Val Arg Tyr Ala Val Gln Tyr Glu Ser Lys138513901395GGC ATG TAT TCG AAA TTC AGT GAA TGG TCT GAA CCA TTT ACT GTC CAA 1304Gly Met Tyr Ser Lys Phe Ser Glu Trp Ser Glu Pro Phe Thr Val Gln140014051410GGT AAC GCT TGT CCG ACT ATA AAA GTT CGT GTT GAT CCG AAA AAG AGA 1352Gly Asn Ala Cys Pro Thr Ile Lys Val Arg Val Asp Pro Lys Lys Arg141514201425AAT AGA CTT ATC TTT AGG AAG TTC AAC TCA GGA AAA CCT CAG TTT GCT 1400Asn Arg Leu Ile Phe Arg Lys Phe Asn Ser Gly Lys Pro Gln Phe Ala143014351440GGA ACC ATG ACT CAT TCA CAA ACA AAT TTT AAA GAT ATT CAT CGT GAT 1448Gly Thr Met Thr His Ser Gln Thr Asn Phe Lys Asp Ile His Arg Asp1445145014551460CTA TAC GAT GCA GCC TTA AAT ATT AAT AAG TTG AAA GCA GTG GAT GAA 1496Leu Tyr Asp Ala Ala Leu Asn Ile Asn Lys Leu Lys Ala Val Asp Glu146514701475GCT ACA ACT TTG ATT GAA AAG GGT GCA GAC ATA GAA GCA AAA TTT GAC 1544Ala Thr Thr Leu Ile Glu Lys Gly Ala Asp Ile Glu Ala Lys Phe Asp148014851490AAT GAC AGA AGT GCA ATG CAC GCA GTT GCA TAT CGA GGA AAT AAC AAA 1592Asn Asp Arg Ser Ala Met His Ala Val Ala Tyr Arg Gly Asn Asn Lys149515001505ATA GCC TTA AGA TTT CTT TTG AAA AAT CAA TCC ATT GAC ATC GAG TTA 1640Ile Ala Leu Arg Phe Leu Leu Lys Asn Gln Ser Ile Asp Ile Glu Leu151015151520AAA GAT AAA AAC GGC TTT ACT CCT CTA CAC ATC GCA GCT GAA GCA GGT 1688Lys Asp Lys Asn Gly Phe Thr Pro Leu His Ile Ala Ala Glu Ala Gly1525153015351540CAG GCA GGA TTT GTT AAG TTA CTA ATA AAT CAT GGA GCT GAT GTG AAT 1736Gln Ala Gly Phe Val Lys Leu Leu Ile Asn His Gly Ala Asp Val Asn154515501555GCA AAA ACA AGT AAG ACA AAT TTG ACA CCA TTA CAT CTT GCA ACA CGT 1784Ala Lys Thr Ser Lys Thr Asn Leu Thr Pro Leu His Leu Ala Thr Arg156015651570AGT GGA TTT TCA AAA ACT GTA AGA AAT TTA CTA GAA AGC CCA AAT ATT 1832Ser Gly Phe Ser Lys Thr Val Arg Asn Leu Lau Glu Ser Pro Asn Ile157515801585AAG GTA AAT GAA AAG GAG GAT GAC GGA TTT ACA CCT TTG CAT ACT GCA 1880Lys Val Asn Glu Lys Glu Asp Asp Gly Phe Thr Pro Leu His Thr Ala159015951600GTA ATG AGT ACT TAT ATG GTT GTC GAT GCT TTG CTA AAT CAT CCA GAC 1928Val Met Ser Thr Tyr Met Val Val Asp Ala Leu Leu Asp His Pro Asp1605161016151620ATT GAT AAA AAT GCG CAG TCT ACG TCA GGA TTG ACT CCT TTC CAT TTA 1976Ile Asp Lys Asp Ala Gln Ser Thr Ser Gly Leu Thr Prp Phe His Leu162516301635GCA ATT ATT AAT GAA AGT CAA GAA GTT GCA GAA TCT TTA GTG GAA AGT 2024Ala Ile Ile Asn Glu Ser Gln Glu Val Ala Glu Ser Leu Val Glu Ser164016451650AAT GCT GAT CTA AAT ATT CAG GAT GTT AAC CAT ATG GCT CCT ATT CAT 2072Asn Ala Ase Leu Asn Ile Gln Asp Val Asn His Met Ala Pro Ile His165516601665TTT GCA GCT TCA ATG GGT AGT ATT AAA ATG CTT AGA TAT CTC ATT TCC 2120Phe Ala Ala Ser Met Gly Ser Ile Lys Mer Leu Arg Tyr Leu Ile Ser167016751680ATA AAA GAT AAA GTT AGT ATT AAT TCT GTG ACT GAG AAT AAT AAC TGG 2168Ile Lys Asp Lys Val Ser Ile Asn Ser Val Thr Glu Asn Asn Asn Trp168516901695ACA CCT TTA CAT TTT GCT ATA TAT TTT AAA AAA GAA GAT GCT GCA AAA 2216Thr Pre Leu His Phe Ala Ile Tyr Phe Lys Lys Glu Asp Ala Ala Lys170517101715GAA TTG TTG AAA CAA GAT GAC ATA AAT TTA ACA ATT GTT GCA GAT GGT 2264Glu Leu Leu Lys Gln Asp Asp Ile Asn Leu Thr Ile Val Ala Asp Gly172017251730AAT CTT ACC GTT TTA CAT CTT GCT GTT TCG ACA GGA CAA ATA AAT ATA 2312Asn Leu Thr Val Leu His Leu Ala Val Ser Thr Gly Gln Ile Asn Ile173517401745ATT AAA GAA TTA TTG AAG AGA GGC TCC AAT ATA GAA GAA AAA ACT GGA 2360Ile Lys Glu Leu Leu Lys Ars Gly Ser Asn Ile Glu Glu Lys Thr Gly17501755 1760GAA GGA TAT ACA TCT CTC CAC ATC GCT GCG ATG CGA AAG GAG CCA GAG 2408Glu Gly Tyr Thr Ser Leu His Ile Ala Ala Met Arg Lys Glu Pro Glu1765177017751780ATA GCT GTT GTT TTG ATT GAA AAC GGT GCT GAC ATA GAA GCT CGA TCA 2456Ile Ala Val Val Leu Ile Glu Asn Gly Ala Asp Ile Glu Ala Arg Ser1785l7901795GCT GAT AAT TTA ACA CCT TTA CAT TCT GCC GCA AAA ATA GGA AGG AAA 2504Ala Asp Asn Leu Thr Pro Leu His Ser Ala Ala Lys Ile Gly Arg Lys180018051810TCT ACA GTA CTT TAC TTA TTA GAA AAA GGA GCT GAC ATT GGA GCT AAA 2552Ser Thr Val Leu Tyr Leu Leu Glu Lys Gly Ala Asp Ile Gly Ala Lys181518201825ACA GCA GAC GGT TCT ACT GCC TTG CAT TTA GCT GTA TCT GGT CGT AAA 2600Thr Ala Asp Gly Ser Thr Ala Leu His Leu Ala Val Ser Gly Arg Lys183018351840ATG AAA ACT GTT GAA ACT CTA TTA AAT AAA GGA GCA AAT TTA AAA GAA 2648Met Lys Thr Val Glu Thr Leu Leu Asn Lys Gly Ala Asn Leu Lys Glu1845185018551860TAC GAT AAC AAT AAA TAT TTG CCA ATA CAT AAA GCT ATT ATT AAT GAT 2696Tyr Asp Asn Asn Lys Tyr Leu Pro Ile His Lys Ala Ile Ile Asn Asp186518701875GAC CTT GAC ATG GTA CGT TTG TTT CTT GAA AAA GAT CCC AGT CTC AAA 2744Asp Leu Asp Met Val Arg Leu Phe Leu Glu Lys Asp Pro Ser Leu Lys188018851890GAT GAT GAA ACA GAA GAG GGT AGA ACT TCA ATT ATG TTA ATT GTT CAG 2792Asp Asp Glu Thr Glu Glu Gly Arg Thr Ser Ile Met Leu Ile Val Gln189519001905AAA TTG CTT CTT GAA TTA TAT AAC TAT TTT ATA AAT AAT TAT GCT GAA 2840Lys Leu Leu Leu Glu Leu Tyr Asn Tyr Phe Ile Asn Asn Tyr Ala Glu191019151920ACT TTG GAT GAA GAA GCT TTA TTC AAC CGC TTA GAT GAA CAA GGG AAA 2888Thr Leu Asp Glu Glu Ala Leu Phe Asn Arg Leu Asp Glu Gln Gly Lys1925193019351940TTA GAG CTT GCA TAT ATC TTC CAT AAT AAA GAA GGT CAT GCA AAA GAG 2936Leu Glu Leu Ala Tyr Ile Phe His Asn Lys Glu Gly Asp Ala Lys Glu194519501955GCT GTT AAG CCA ACT ATC CTT GTT ACA ATT AAA CTT ATG GAA TAC TGC 2984Ala Val Lys Pro Thr Ile Leu Val Thr Ile Lys Leu Met Glu Tyr Cys196019651970TTA AAA AAA CTT CGC GAA GAG TCT GGA GCT CCT GAA GGT AGT TTC GAT 3032Leu Lys Lys Leu Arg Glu Glu Ser Gly Ala Pro Glu Gly Ser Phe Asp197519801985TCT CCA TCT TCA AAG CAA TGT ATT TCT ACC TTT TCA GAG GAT GAA ATG 3080Ser Pro Ser Ser Lys Gln Cys Ile Ser Thr Phe Ser Glu Asp Glu Met199019952000TTT CGT CGT ACT TTA CCG GAA ATT GTA AAA GAA ACG AAC AGC AGA TAT 3128Phe Arg Arg Thr Leu Pro Glu Ile Val Lys Glu Thr Asn Ser Arg Tyr2005201020152020TTA CCA CTA AAG GGC TTT TCT CGC AGC CTA AAT AAG TTT CTC CCT TCT 3176Leu Pro Leu Lys Gly Phe Ser Arg Sar Leu Asn Lys Phe Leu Pro Ser202520302035CTA AAA TTT GCC GAA AGT AAG AAT AGC TAC AGA TCT GAA AAT TTT GTT 3224Leu Lys Phe Ala Glu Ser Lys Asn Ser Tyr Arg Sar Glu Asn Phe Val204020452050AGC AAT ATT GAT TCC AAC GGA GCA TTA CTT TTA CTC GAT GTA TTT ATC 3272Ser Asn Ile Asp Ser Asn Gly Ala Leu Leu Leu Leu Asp Val Phe Ile205520602065AGA AAG TTT ACT AAT GAG AAA TAC AAT TTG ACT GGA AAA GAA GCT GTA 3320Arg Lys Phe Thr Asn Glu Lys Tyr Asn Leu Thr Gly Lys Glu Ala Val207020752080CCC TAT CTG GAA GCA AAG GCT TCA TCA TTA CGT ATC GCT TCT AAA TTT 3368Pro Tyr Leu Glu Ala Lys Ala Ser Ser Leu Arg Ile Ala Ser Lys Phe2085209020952100GAA GAA CTT CTA ACT GAA GTT AAA GGT ATT CCG GCT GGA GAG CTA ATT 3416Glu Glu Leu Leu Thr Glu Val Lys Gly Ile Pro Ala GLy Glu Leu Ile210521102115AAT ATG GCC GAA GTG AGT TCC AAC ATA CAT AAG GCA ATT GCA AGT GGT 3464Asn Met Ala Glu Val Ser Ser Asn ILe His Lys Ala Ile ALa Ser Gly212021252130AAG CCT GTA TCA AAA GTC TTA TGT TCG TAT TTG GAT ACC TTT TCT GAA 3512Lys Pro Val Ser Lys Val Leu Cys Ser Tyr Leu Asp Thr Phe Ser Glu213521402145TTA AAT TCT CAA CAA ATG GAA GAA TTA GTT AAC ACA TAC TTA TCC ACC 3560Leu Asn Ser Gln Gln Met Glu Glu Leu Val Asn Thr Tyr Leu Ser Thr215021552160AAA CCT TCT GTA ATT ACG TCA GCA TCT GCA GAT TAC CAG AAA CTT CCT 3608Lys Pro Ser Val Ile Thr Ser Ala Ser Ala Asp Tyr Gln Lys Leu Pro21652170 2175 2180AAT TTG TTA ACT GCA ACT TGC TTA GAA CCA GAA AGA ATG GCT CAA CTT 3656Asn Leu Leu Thr Ala Thr Cys Leu Glu Pro Glu Arg Met Ala Gln Leu218521902195ATA GAT GTG CAT CAA AAG ATG TTT TTA CGT TAAAATACCA TTCCTTCTGT 3706Ile Asp Val His Gln Lys Met Phe Leu Arg22002205(2)序列4的信息(i)序列特征(A)長度1214個氨基酸(B)類型氨基酸(D)拓撲結構線性(ii)分子類型蛋白質(xi)序列描述序列4Met His Ser Lys Glu Leu Gln Thr Ile Ser Ala Ala Val Ala Arg Lys1 5 10 15Ala Val Pro Asn Thr Met Val Ile Arg Leu Lys Arg Asp Glu Glu Asp20 25 30Gly Glu Met Thr Leu Glu Glu Arg Gln Ala Gln Cys Lys Ala Ile Glu35 40 45Tyr Ser Asn Ser Val Phe Gly Met Ile Ala Asp Val Ala Asn Asp Ile50 55 60Gly Ser Ile Pro Val Ile Gly Glu Val Val Gly Ile Val Thr Ala Pro55 70 75 80Ile Ala Ile Val Ser His Ile Thr Ser Ala Gly Leu Asp Ile Ala Ser85 90 95Thr Ala Leu Asp Cys Asp Asp Ile Pro Phe Asp Glu Ile Lys Glu Ile100 105 110Leu Glu Glu Arg Phe Asn Glu Ile Asp Arg Lys Leu Asp Lys Asn Thr115 120 125Ala Ala Leu Glu Glu Val Ser Lys Leu Val Ser Lys Thr Phe Val Thr130 135 140Val Glu Lys Thr Arg Asn Glu Met Asn Glu Asn Phe Lys Leu Val Leu145 150 155 160Glu Thr Ile Glu Ser Lys Glu Ile Lys Ser Ile Val Phe Lys Ile Asn165 170 175Asp Phe Lys Lys Phe Phe Glu Lys Glu Arg Gln Arg Ile Lys Gly Leu180 185 190Pro Lys Asp Arg Tyr Val Ala Lys Leu Leu Glu Gln Lys Gly Ile Leu195 200 205Gly Ser Leu Lys Glu Val Arg Glu Pro Ser Gly Asn Ser Leu Ser Ser210 215 220Ala Leu Asn Glu Leu Leu Asp Lys Asn Asn Asn Tyr Ala Ile Pro Lys225 230 235 240Val Val Asp Asp Asn Lys Ala Phe Gln Ala Leu Tyr Ala Leu Phe Tyr245 250 255Gly Thr Gln Thr Tyr Ala Ala Val Met Phe Phe Leu Leu Glu Gln Mls260 265 270Ser Tyr Leu Ala Asp Tyr Tyr Tyr Gln Lys Gly Asp Asp Val Asn Phe275 280 285Asn Ala Glu Phe Asn Asn Val Ala Ile IlE Phe Asp Asp Phe Lys Ser290 295 300Ser Leu Thr Gly Gly Asp Asp Gly Leu Ile Asp Asn Val Ile Glu Val305 310 315 320Leu Asn Thr Val Lys Ala Leu Pro Phe Ile Lys Asn Ala Asp Ser Lys325 330 335Leu Tyr Arg Glu Leu Val Thr Arg Thr Lys Ala Leu Glu Thr Leu Lys340 345 350Asn Gln Ile Lys Thr Thr Asp Leu Pro Leu Ile Asp Asp Ile Pro Glu355 360 365Thr Leu Ser Gln Val Asn Phe Pro Asn Asp Glu Asn Gln Leu Pro Thr370 375 380Pro Ile Gly Asn Trp Val Asp Gly Val Glu Val Arg Tyr Ala Val Gln385 390 395 400Tyr Glu Ser Lys Gly Met Tyr Ser Lys Phe Ser Glu Trp Ser Glu Pro405 410 415Phe Thr Val Gln Gly Asn Ala Cys Pro Thr Ile Lys Val Arg Val Asp420 425 430Pro Lys Lys Arg Asn Arg Leu Ile Phe Arg Lys Phe Asn Ser Gly Lys435 440 445Pro Gln Phe Ala Gly Thr Met Thr His Ser Gln Thr Asn Pna Lys Asp450 455 460Ile His Arg Asp Leu Tyr Asp Ala Ala Leu Asn Ile Asn Lys Leu Lys465 470 475 480Ala Val Asp Glu Ala Thr Thr Leu Ile Glu Lys Gly Ala Asp Ile Glu485 490 495Ala Lys Phe Asp ASn Asp Arg Ser Ala Met His Ala Val Ala Tyr Arg500 505 510Gly Asn Asn Lys Ile Ala Leu Arg Phe Leu Leu Lys Asn Gln Ser Ile515 520 525Asp Ile Glu Leu Lys Asp Lys Asn Gly Phe Thr Pro Leu His Ile Ala530 535 540Ala Glu Ala Gly Gln Ala Gly Phe Val Lys Leu Leu Ile Asn His Gly545 550 555 560Ala Asp Val Asn Ala Lys Thr Ser Lys Thr Asn Leu Thr Pro Leu His565 570 575Leu Ala Thr Arg Ser Gly Phe Ser Lys Thr Val Arg Asn Leu Leu Glu580 585 590Ser Pro Asn Ile Lys Val Asn Glu Lys Glu Asp Asp Gly Phe Thr Pro595 600 605Leu His Thr Ala Val Met Ser Thr Tyr Met Val Val Asp Ala Leu Leu610 615 620Asn His Pro Asp Ile Asp Lys Asn Ala Gln Ser Thr Ser Gly Leu Thr625 630 635 640Pro Phe His Leu Ala Ile Ile Asn Glu Ser Gln Glu Val Ala Glu Ser645 650 655Leu Val Glu Ser Asn Ala Asp Leu Asn Ile Gln Asp Val Asn His Met660 665 670Ala Pro Ile His Phe Ala Ala Ser Met Gly Ser Ile Lys Met Leu Arg675 680 685Tyr Leu Ile Ser Ile Lys Asp Lys Val Ser Ile Asn Ser Val Thr Glu690 695 700Asn Asn Asn Trp Thr Pro Leu His Phe Ala Ile Tyr Phe Lys Lys Glu705 710 715 720Asp Ala Ala Lys Glu Leu Leu Lys Gln Asp Asp Ile Asn Leu Thr Ile725 730 735Val Ala Asp Gly Asn Leu Thr Val Leu His Leu Ala Val Ser Thr Gly740 745 750Gln Ile Asn Ile Ile Lys Glu Leu Leu Lys Arg Gly Ser Asn Ile Glu755 760 765Glu Lys Thr Gly Glu Gly Tyr Thr Ser Leu His Ile Ala Ala Met Arg770 775 780Lys Glu Pro Glu Ile Ala Val Val Leu Ile Glu Asn Gly Ala Asp Ile785 790 795 800Glu Ala Arg Ser Ala Asp Asn Leu Thr Pro Leu His Ser Ala Ala Lys805 810 815Ile Gly Arg Lys Ser Thr Val Leu Tyr Leu Leu Glu Lys Gly Ala Asp820 825 830Ile Gly Ala Lys Thr Ala Asp Gly Ser Thr Ala Leu His Leu Ala Val835 840 845Ser Gly Arg Lys Met Lys Thr Val Glu Thr Leu Leu Asn Lys Gly Ala850 855 860Asn Leu Lys Glu Tyr Asp Asn Asn Lys Tyr Leu Pro Ile His Lys Ala865 870 875 880Ile Ile Asn Asp Asp Leu Asp Met Val Arg Leu Phe Leu Glu Lys Asp885 890 895Pro Ser Leu Lys Asp Asp Glu Thr Glu Glu Gly Arg Thr Ser Ile Met900 905 910Leu Ile Val Gln Lys Leu Leu Leu Glu Leu Tyr Asn Tyr Phe Ile Asp915 920 925Asn Tyr Ala Glu Thr Leu Asp Glu Glu Ala Leu Phe Asn Arg Leu Asp930 935 940Glu Gln Gly Lys Leu Glu Leu Ala Tyr Ile Phe His Asn Lys Glu Gly945 950 955 960Asp Ala Lys Glu Ala Val Lys Pro Thr Ile Leu Val Thr Ile Lys Leu965 970 975Met Glu Tyr Cys Leu Lys Lys Leu Arg Glu Glu Ser Gly Ala Pro Glu980 985 990Gly Ser Phe Asp Ser Pro Ser Ser Lys Gln Cys Ile Ser Thr Phe Ser995 10001005Glu Asp Glu Met Phe Arg Arg Thr Leu Pro Glu Ile Val Lys Glu Thr10l010151020Asn Ser Arg Tyr Leu Pro Leu Lys Gly Phe Ser Arg Ser Leu Asn Lys1025103010351040Phe Leu Pro Ser Leu Lys Phe Ala Glu Ser Lys Asn Ser Tyr Arg Ser104510501055Glu Asn Phe Val Ser Asn Ile Asp Ser Asn Gly Ala Leu Leu Leu Leu106010651070Asp Val Phe Ile Arg Lys Phe Thr Asn Glu Lys Tyr Asn Leu Thr Gly107510801085Lys Glu Ala Val Pro Tyr Leu Glu Ala Lys Ala Ser Ser Leu Arg Ile109010951100Ala Ser Lys Phe Glu Glu Leu Leu Thr Glu Val Lys Gly Ile Pro Ala1105111011151120Gly Glu Leu Ile Asn Met Ala Glu Val Ser Ser Asn Ile His Lys Ala112511301135Ile Ala Ser Gly Lys Pro Val Ser Lys Val Leu Cys Ser Tyr Leu Asp114011451150Thr Phe Ser Glu Leu Asn Ser Gln Gln Mer Glu Glu Leu Val Asn Thr115511501165Tyr Leu Ser Thr Lys Pro Ser Val Ile Thr Ser Ala Ser Ala Asp Tyr117011751180Gln Lys Leu Pro Asn Leu Leu Thr Ala Thr Cys Leu Glu Pro Glu Arg1185119011951200Met Ala Gln Leu Ile Asp Val His Gln Lys Met Phe Leu Arg12051210
權利要求書按照條約第19條的修改1.一種活性昆蟲特異性神經毒素多肽,通過表達對應于編碼存在于毒寇蛛(Latrodectus mactans Tredecimguttatus)毒液中的昆蟲特異性神經毒素的基因的一部分的基因序列的截短形式,或它的類似物而產生。
2.上述任一權利要求的多肽,其中多肽對應于由基因序列編碼的基本上無毒的前體多肽的毒性衍生物。
3.上述任一權利要求的多肽,其中多肽包含對應于基本上無毒的前體多肽的氨基酸序列的截短形式的氨基酸序列。
4.權利要求3的多肽,其中多肽的氨基酸序列對應于主要在羧基(C)端被截短的前體多肽的氨基酸序列。
5.權利要求4的多肽,其中截短為約150至200個氨基酸。
6.權利要求3-5任一項的多肽,其中多肽的氨基酸序列另外還對應于在氨基端(N)截短的前體多肽的氨基酸序列。
7.權利要求6的多肽,其中截短為少于50個氨基酸,更理想為7或28個氨基酸。
8.上述任一項權利要求的多肽,其中多肽的氨基酸序列同源于昆蟲特異性神經毒素δ-毒蛛昆蟲毒素(δ-LIT)或它的活性衍生物的氨基酸序列。
9.上述任一項權利要求的多肽,其中多肽包含序列1和序列2所示的氨基酸序列或它的活性衍生物。
10.上述任一項權利要求的多肽,其中毒素由包含如序列1所示序列的基因序列的截短形式或核苷酸構建物或它的活性變異體表達。
11.上述任一項權利要求的多肽,其中多肽基本上由保藏在國立工業和海洋微生物保藏有限公司,保藏號為NCIMB 40632的微生物提供的序列表達。
12.用作毒素的一種蛋白質,它包含基本上如序列1和序列2所示的氨基酸序列或它的活性衍生物。
13.一種包含對應于編碼存在于毒寇蛛毒液中的昆蟲特異性神經毒素的基因的一部分的基因序列的截短形式或它的類似物的核苷酸序列,用于活性昆蟲特異性神經毒素多肽的表達中。
14.權利要求13的核苷酸序列,其中核苷酸序列對應于編碼前體多肽,并在它的3’端被截短的基因,或它的活性衍生物。
15.權利要求14的核苷酸序列,其中核苷酸序列對應于被截短約400至650個核苷酸堿基,更理想的為550至600個核苷酸堿基的基因。
16.權利要求13至15任一項的核苷酸序列,其中核苷酸對應于在它的5’端被截短的基因。
17.權利要求16的核苷酸序列,其中截短為少于100個核苷酸堿基,更理想的為84或21個核苷酸堿基。
18.權利要求13至17任一項的核苷酸序列,其中核苷酸序列對應于編碼昆蟲特異性毒素δ-毒蛛昆蟲毒素(δ-LIT)的前體多肽的基因的一部分,或它的活性衍生物。
19.權利要求13至18任一項的核苷酸序列,其中核苷酸序列編碼包含991個氨基酸序列的多肽。
20.權利要求1至19任一項的核苷酸序列,其中核苷酸序列包含如序列1所示的堿基序列,或它的活性衍生物。
21.權利要求13至20任一項的核苷酸序列,其中核苷酸序列包含基本上如包含在保藏在國立工業和海洋微生物保藏有限公司中,保藏號為NCIMB 40632的微生物中的堿基序列。
22.權利要求13至21任一項的核苷酸序列,其中核苷酸序列編碼具有如序列1和序列2所示的氨基酸序列的多肽,或它的活性衍生物。
23.權利要求13至22任一項的核苷酸序列,其中核苷酸序列為通過使用酶,如逆轉錄酶,從mRNA衍生而來的cDNA。
24.權利要求13至23任一項的核苷酸序列,其中核苷酸序列為多半使用聚合酶鏈反應(PCR)產生的寡核苷酸DNA構建物。
25.一種生產如權利要求1所述多肽的方法,該方法包括制備包含如權利要求13所述的基因的截短形式的重組DNA分子,在宿主表達系統如細菌表達系統表達截短形式來產生多肽。
26.權利要求25的方法,其中產生的多肽為基本上如上述任一項權利要求所述的活性毒素。
27.權利要求25或26的方法,其中截短形式包含編碼非毒性前體多肽的基因的一部分。
28.權利要求25至27任一項的方法,其中截短形式包含基本上如權利要求14至24任一項所述的核苷酸序列。
29.權利要求25至28任一項的方法,其中表達系統包含用含有序列截短形式的pT7-1載體轉化的E.coli BL21(DE3)細菌細胞。
30.權利要求25至29任一項的方法,其中表達系統包含桿狀病毒系統。
31.一種包含編碼通常如上述任一項權利要求所述的毒素的基因的截短形式的重組DNA分子。
32.權利要求31所述的重組DNA分子,其中該分子包含病毒。
33.權利要求32所述的重組DNA分子,其中該分子包含桿狀病毒。
34.基本上如保藏號為NCIMB 40632的微生物所提供的重組DNA分子。
35.一種包含通常如權利要求14至24任一項所述的基因的截短形式的表達載體。
36.一種如用基本上如權利要求31或35所述的重組分子轉化的細胞,如病毒或細菌細胞。
37.一種包含基本上如權利要求1至12任一項所述的毒素的殺蟲劑。
38.權利要求37的殺蟲劑,其中殺蟲劑為口服或局部施用。
39.權利要求37或38的殺蟲劑,其中殺蟲劑包含噴霧用液。
40.一種殺蟲劑系統,包含在昆蟲中表達如權利要求13至24任一項所述的基因的截短形式來產生基本上如上述任一項權利要求所述的毒素以殺死或使昆蟲喪失能力的方法。
41.權利要求40的殺蟲劑系統,其中殺蟲劑系統包含病毒表達系統。
42.權利要求41的殺蟲劑系統,其中病毒表達系統包含桿狀病毒表達系統。
43.一種包含含有基本上如權利要求13至24任一項所述的基因序列的截短形式的遺傳修飾細胞的植物。
44.一種包含含有基本上如權利要求13至24任一項所述的基因序列的截短形式的遺傳修飾細胞的非人類動物。
45.一種毒素,通過加工具有對應于存在于毒寇蛛毒液中的昆蟲特異性神經毒素的氨基酸序列的基本上分離的非毒性前體多肽而產生。
46.權利要求45的毒素,其中毒素通過截短前體多肽的羧基(C)端而產生。
47.權利要求46的毒素,其中毒素的氨基酸序列通常對應于被截短150至200個氨基酸的前體多肽的氨基酸序列。
48.權利要求45至47任一項的毒素,其中毒素的氨基酸序列通過朝前體多肽的氨基酸序列的氨基(N)端截短而產生。
49.權利要求48的毒素,其中從氨基端切下的片段明顯短于從羧基端切下的片段。
50.權利要求48或49的毒素,其中切下來的片段包含7個或28個氨基酸。
51.權利要求45至50的毒素,其中毒素包含或為昆蟲特異性神經毒素δ-毒蛛昆蟲毒素(LIT)的類似物,或它的活性衍生物。
52.權利要求45至51任一項的毒素,其中毒素包含如序列1和序列2所示的氨基酸序列或它的活性衍生物。
53.一種生產具活性的昆蟲特異性神經毒素多肽的方法,該多肽從具有對應于存在于毒寇蛛毒液中的昆蟲特異性神經毒素的氨基酸序列的分離的非活性前體多肽產生,該方法包括截短分離的前體多肽。
54.權利要求53的方法,其中分離的前體多肽在羧基端被截短。
55.權利要求53或54的方法,其中截短使用蛋白水解切斷,優選通過定點誘變完成。
56.權利要求53至55任一項的方法,其中提供了N-末端的截短。
57.權利要求53至56任一項的方法,其中活性多肽為毒素,并基本上如權利要求1至12、45至52任一項所述。
58.一種分離的核苷酸堿基序列,編碼具有如序列4所示的氨基酸序列的毒性前體多肽或它的衍生物。
59.一種分離的堿基序列,包含如序列3所示的堿基序列或它的衍生物。
60.權利要求58或59的分離的堿基序列,其中核苷酸堿基序列編碼神經毒素δ-毒蛛昆蟲毒素(LIT)的前體多肽。
61.一種基本上如保藏號為NCIMB 40633的微生物所提供的分離堿基序列。
62.一種重組DNA分子,包含基本上如權利要求58至61任一項所述的序列。
63.權利要求62的重組DNA分子,其中該分子包含病毒。
64.權利要求63的重組DNA分子,其中病毒包含桿狀病毒。
65.用基本上如權利要求62至64任一項的重組DNA分子轉化的細胞,如細菌或病毒細胞。
66.一種殺蟲劑系統,包括在昆蟲中表達基本上如權利要求58至61任一項所述的堿基序列來產生前體多肽,并加工前體多肽產生毒素,從而殺死或使昆蟲喪失能力的方法。
67.權利要求66的殺蟲劑系統,其中系統包含病毒表達系統。
68.權利要求67的殺蟲劑系統,其中病毒表達系統包含桿狀病毒。
69.一種包含含有基本上如權利要求58至61任一項所述的核苷酸序列的被遺傳修飾的細胞的植物。
70.一種包含含有基本上如權利要求58至61任一項所述的核苷酸序列的被遺傳修飾的細胞的非人類動物。
71.一種新的毒素,基本上如上文序列1和序列2所描述。
72.一種核苷酸序列,基本上如上文序列1所描述。
73.一種分離的多肽,基本上如上文序列3和序列4所描述。
74.一種分離的核苷酸序列,基本上如上文序列3所描述。
權利要求
1.一種由截短形式的基因序列或其類似物表達形成的多肽,例如一種毒素。
2.權利要求1的多肽,其中多肽為一種神經毒素。
3.上述任一項權利要求的多肽,其中多肽對應于基因序列編碼的基本上無毒性的前體多肽的毒性衍生物。
4.上述任一項權利要求的多肽,其中多肽包含對應于基本上無毒性的前體多肽的氨基酸序列的截短形式的氨基酸序列。
5.權利要求4的多肽,其中多肽的氨基酸序列對應于主要在它的羧基(C)端被截短的前體多肽的氨基酸序列。
6.權利要求5所述的多肽,其中截短約150至200個氨基酸。
7.權利要求4-6任一項所述的多肽,其中多肽氨基酸序列還對應于在氨基端(N)截短的前體多肽的氨基酸序列。
8.權利要求7的多肽,其中截短少于50個氨基酸,更理想的為7或28個氨基酸。
9.上述任一項權利要求所述的多肽,其中多肽的氨基酸序列同源于昆蟲特異性神經毒素δ-毒蛛昆蟲毒素(δ-LIT)的氨基酸序列或它的活性衍生物。
10.上述任一項權利要求所述的多肽,其中多肽包含如序列1和序列2所示的氨基酸序列或它的活性衍生物。
11.上述任一項權利要求所述的多肽,其中毒素由包含序列1所示序列的基因序列的核苷酸構建物或截短形式或它的活性變異體表達。
12.上述任一項權利要求所述的多肽,其中多肽由基本上如保藏在國立工業和海洋微生物保藏有限公司,保藏號為NCIMB 40632的微生物所提供的序列表達。
13.一種用作毒素的蛋白質,包含基本上如序列1和序列2所示的氨基酸序列,或它的活性衍生物。
14.一種可用于多肽,如毒素的表達的核苷酸序列,包含基因序列的截短形式或它的類似物。
15.權利要求14的核苷酸序列,其中核苷酸序列對應于編碼前體多肽,并在它的3’端被截短的基因,或它的活性衍生物。
16.權利要求15的核苷酸序列,其中核苷酸序列對應于被截短約400至650個核苷酸堿基,更理想的為550至600個核苷酸堿基的基因。
17.權利要求14-16任一項的核苷酸序列,其中核苷酸序列對應于在它的5’端被截短的基因。
18.權利要求17的核苷酸序列,其中截短少于100個核苷酸堿基,更理想的為84或21個核苷酸堿基。
19.權利要求14-18任一項的核苷酸序列,其中核苷酸序列對應于編碼毒寇蛛(Latrodectus Mactans Tredecimguttatus)毒液中的神經毒素的基因的一部分或它的活性衍生物。
20.權利要求19所述的核苷酸序列,其中核苷酸序列對應于編碼昆蟲特異性毒素δ-毒蛛昆蟲毒素(δ-LIT)的前體多肽的基因的一部分或它的活性衍生物。
21.權利要求14-20任一項的核苷酸序列,其中核苷酸序列編碼包含991個氨基酸序列的多肽。
22.權利要求14-21任一項所述的核苷酸序列,其中核苷酸序列包含如序列1所示的堿基序列,或它的活性衍生物。
23.權利要求14-22任一項所述的核苷酸序列,其中核苷酸序列包含基本上如包含在保藏在國立工業和海洋微生物保藏有限公司中,保藏號為NCIMB 40632的微生物中的堿基序列。
24.權利要求14-23任一項的核苷酸序列,其中核苷酸序列編碼具有如序列1和序列2所示的氨基酸序列的多肽,或它的活性衍生物。
25.權利要求14-24任一項的核苷酸序列,其中核苷酸序列為通過使用酶,如逆轉錄酶從mRNA衍生而來的cDNA。
26.權利要求14-25任一項的核苷酸序列,其中核苷酸序列為可能使用聚合酶鏈反應(PCR)產生的寡核苷酸DNA構建物。
27.一種生產多肽的方法,該方法包括產生包含基因截短形式的重組DNA分子,在宿主表達系統中如病毒或細菌表達系統中表達截短形式來生產多肽。
28.權利要求27的方法,其中產生的多肽為基本上如上述任一項權利要求所述的活性毒素。
29.權利要求27或28的方法,其中截短形式包含編碼非毒性前體多肽的基因的一部分。
30.權利要求27-29的方法,其中截短形式包含基本上如權利要求14-26任一項所述的核苷酸序列。
31.權利要求27至30任一項的方法,其中表達系統包含用含有序列截短形式的pT7-1載體轉化的大腸桿菌BL21(DE3)細菌細胞。
32.權利要求27至31任一項的方法,其中表達系統包含桿狀病毒系統。
33.一種重組DNA分子,包含編碼通常如上述任一項權利要求所述的毒素的基因的截短形式。
34.權利要求33的重組DNA分子,其中該分子包含病毒。
35.權利要求34的重組DNA分子,其中該分子包含桿狀病毒。
36.一種基本上如保藏號為NCIMB 40632的微生物所提供的重組DNA分子。
37.一種包含通常如權利要求14至26任一項的基因的截短形式的表達載體。
38.一種細胞,如用基本上如權利要求33-37任一項所述的重組分子轉化的病毒或細菌細胞。
39.一種包含基本上如權利要求1-13任一項所述的毒素的殺蟲劑。
40.權利要求39的殺蟲劑,其中殺蟲劑為口服或局部施用。
41.權利要求39或40的殺蟲劑,其中殺蟲劑包含噴霧用液。
42.一種殺蟲劑系統,包含在昆蟲中表達基因的截短形式來產生基本上如上述任一項權利要求所述的毒素以殺死或使昆蟲喪失活動能力的方法。
43.權利要求42的殺蟲劑系統,其中該殺蟲劑系統包含病毒表達系統。
44.權利要求43的殺蟲劑系統,其中病毒表達系統包含桿狀病毒系統。
45.一種包含含有基本上如權利要求14-26任一項的基因序列的截短形式的遺傳修飾細胞的植物。
46.一種包含含有基本上如權利要求14-26任一項所述的基因序列的截短形式的遺傳修飾細胞的非人類的動物。
47.一種通過加工分離的基本上無毒性的前體多肽而產生的毒素。
48.如權利要求47的毒素,其中毒素通過截短前體多肽的羧基(C)端而產生。
49.如權利要求48所述的毒素,其中毒素的氨基酸序列通常對應于被截短150至200個氨基酸的前體多肽的氨基酸序列。
50.如權利要求47至49任一項的毒素,其中毒素的氨基酸序列通過截短前體多肽的氨基酸序列的氨基(N)端而產生。
51.如權利要求50的毒素,其中從氨基端切下的片段明顯短于從羧基端切下的片段。
52.如權利要求50或51的毒素,其中切下來的片段包含7個或28個氨基酸。
53.如權利要求47-52的毒素,其中毒素具有對應于被毒寇蛛(Latrodectus mactans Tredecimgutttus)的基因的一部分編碼的多肽的氨基酸序列。
54.如權利要求47-53任一項的毒素,其中毒素包含或為昆蟲特異性神經毒素δ-毒蛛昆蟲毒素(δ-LIT)的類似物,或它的活性衍生物。
55.如權利要求47-54任一項所述的毒素,其中毒素包含如序列1和序列2所示的氨基酸序列或它的活性衍生物。
56.從分離的非活性的前體多肽生產活性多肽的方法,該方法包括截短分離的前體多肽。
57.如權利要求56的方法,其中分離的前體多肽在羧基端被截短。
58.如權利要求56或57的方法,其中截短使用蛋白水解,優選通過定點誘變完成。
59.如權利要求56至58任一項的方法,其中可提供N-末端的截短。
60.如權利要求56至59任一項的方法,其中活性多肽為毒素,并基本上如權利要求1至13、47至55任一項所述。
61.一種分離的核苷酸堿基序列,編碼具有如序列4所示的氨基酸序列的毒性前體多肽,或它的衍生物。
62.一種分離的堿基序列,它包含如序列3所示的堿基序列,或它的衍生物。
63.如權利要求61或62任一項所述的分離的堿基序列,其中核苷酸堿基序列編碼神經毒素δ-毒蛛昆蟲毒素(δ-LIT)的前體多肽。
64.一種基本上如保藏號為NO. NCIMB 40633的微生物所提供的分離的堿基序列。
65.一種重組DNA分子,包含基本上如權利要求61~64任一項的序列。
66.如權利要求65的重組分子,其中該分子包含病毒。
67.如權利要求66所述的重組分子,其中病毒包含桿狀病毒。
68.一種用基本上如權利要求65至67任一項的重組DNA分子轉化的細胞,如細菌或病毒細胞。
69.一種殺蟲劑系統,包括在昆蟲體中表達基本上如權利要求61至64任一項所述堿基序列來產生前體多肽,并加工前體多肽以產生毒素,從而殺死或使昆蟲喪失活動能力的方法。
70.如權利要求69所述的殺蟲劑系統,其中該系統包含病毒表達系統。
71.如權利要求69所述的殺蟲劑系統,其中病毒表達系統包含桿狀病毒。
72.一種包含含有基本上如權利要求61至64任一項的核苷酸序列的被遺傳修飾的細胞的植物。
73.一種包含含有基本上如權利要求61至64任一項的核苷酸序列的被基因修飾的細胞的非人類的動物。
74.一種新的毒素,基本上如上文序列1和序列2所描述。
75.一種核苷酸序列,基本上如上文序列1所描述。
76.一種分離的多肽,基本上如上文序列3和序列4所描述。
77.一種分離的核苷酸序列,基本上如上文序列3所描述。
78.所公開的任何新的主題或其組合,無論是否落在與任何上述權利要求相同的發明范圍內或與其有關。
全文摘要
一種包含分離的無脊椎動物特異性神經毒素δ-毒蛛昆蟲毒素(LIT)的衍生物或類似物的毒素。毒素通過在細菌宿主中表達對應于來自毒寇蛛的基因組的基因的截短形式的核苷酸序列而產生。基因編碼無毒性前體蛋白質,而截短形式編碼活性毒素。
文檔編號C12N15/09GK1147272SQ95192820
公開日1997年4月9日 申請日期1995年4月24日 優先權日1994年4月27日
發明者D·R·貝爾, P·N·R·烏舍伍德, I·杜盧波瓦, T·沃科瓦, E·格里辛, V·克拉斯諾佩羅夫, T·G·加金納, M·V·科沃切夫, K·A·普盧尼科夫, O·G·申莫廷科 申請人:英國技術集團有限公司