專利名稱:具有堿性支鏈淀粉酶和堿性α-淀粉酶兩種活性的酶的基因的制作方法
技術領域:
本發明涉及了一種編碼顯示出了堿性支鏈淀粉酶活性和堿性α-淀粉酶活性(堿性淀粉支鏈淀粉酶)兩種活性的酶的基因,本發明也涉及可從編碼完整的堿性淀粉支鏈淀粉酶的基因片段的表達中獲得的堿性α-淀粉酶和堿性支鏈淀粉酶,本發明也涉及編碼這些酶促活性的基因和其片段,本發明還涉及攜帶這些基因和其片段的重組DNA和轉化體。
背景技術:
α-淀粉酶長期用于各種領域。例如,它已用于在發酵工業中糖化谷物和土豆,在紡織的工業中作為淀粉糊狀物清除劑,在制藥工業上中作為消化劑,在食品工業中制造濃的麥芽糖糖漿。α-淀粉酶是這樣一種酶,它作用于直鏈淀粉或支鏈淀粉之類的與淀粉相關的多糖類,可單獨切割多糖分子的α-1,4-葡糖苷鍵。從包括細菌、真菌、植物種子和動物消化腺在內的大量不同來源中,已獲得α-淀粉酶的晶體樣品或電泳上均一樣品。支鏈淀粉酶是這樣一種酶,它可單獨水解存在于淀粉、糖原、支鏈淀粉和茁芽多糖中的α-1,6-葡糖苷鍵。在一特定的產氣氣桿菌菌株中首先發現支鏈淀粉酶(Bender,H.和Wallenfels,K.,生物化學雜志,334,79(1961)),此后,也在包括芽孢桿菌屬、鏈球菌屬和梭狀芽胞桿菌屬在內的許多其它微生物中發現該酶。由于支鏈淀粉酶在與外型淀粉酶和內型淀粉酶一起使用時,能夠從淀粉產生麥芽寡糖(如葡萄糖,麥芽糖,麥芽三糖,麥芽戊糖和麥芽己糖),在淀粉制造業中人們已產生了對支鏈淀粉酶的興趣。
為了簡化如上所述的使用兩種或多種酶的糖類的制造過程,非常需要也作用于α-1,4-葡糖苷鍵的支鏈淀粉酶,即顯示出α-淀粉酶活性的支鏈淀粉酶。已知枯草芽孢桿菌TU菌株產生支鏈淀粉酶-淀粉酶復合酶(Takasaki,Y.,農業生物化學,51,9(1987),日本專利出版物(kokoku) No.1-18717)。此外,已報道上述顯示出兩種不同的酶促活性的酶或所謂的淀粉支鏈淀粉酶(amylopul lulanase)由許多細菌產生,這些細菌包括環狀芽胞桿菌(日本專利申請公開(kokai)No.64-60376)、Bacillus sp.(Saha,B.C.,等,酶微生物技術,11,760(1989))、布氏熱厭氧細菌(Co1eman,R.D.,等.細菌學雜志,169,4302(1987))、Thermoanaerobium sp.(Plant,A.R.,等,應用微生物生物技術,26,427(1987))、Clostidiumthermohydrosulfuricum(Saha,B.C.,等,生物化學雜志,252,343(1988))、熱產硫梭菌(Spreinat,A.等,應用微生物生物技術,33,511(1990))、水生棲熱菌(Plant,A.R.,等,酶微生物技術,8,668(1986))、Thermus sp.(Nakamura,N.等,淀粉/Starke,41,112(1989))、Thermoanaerobacteriu Msaccharolyticum(Saha,B.C.,等,應用環境微生物,56,881(1990))以及激烈熱球菌和Thermococcuslitoralis(Brown,S.H.和Kelley,R.M.,應用環境微生物,59,2614(1993))。
發明人最近發現,當α-淀粉酶和支鏈淀粉酶摻入去垢劑中時,洗碟去垢劑和洗衣去垢劑的功效能夠大大地得到提高(日本專利申請放置-打開(kokai)No.2-132-193),特別是對淀粉污垢而言。然而,大多數以前在自然界中發現的α-淀粉酶和支鏈淀粉酶,在中性到堿性的pH值范圍內顯示出了最大的和穩定的酶促活性,而在pH值9-10的堿性溶液中的幾乎不起作用。在堿性的pH值范圍內存在很少的可顯示出最大活性的酶(堿性支鏈淀粉酶),僅有兩份報告報到過這樣的酶(Nakamura,N.和Horikoshi,K.,生物化學和生物物理學報,397,188(1975),日本專利出版物(kokoku)No.53-27786和Ara等,日本專利出版物(kokoku)No.6-32613)。此外,直到本發明發明人發現在堿性范圍內具有其最佳生長pH值的嗜堿Bacillussp.KSM-AP1378(FERM BP-3048,1989年7月24日保藏在的工業科學和技術機構的發酵研究所,1-3 Higashi 1-chome,Tsukuba-shi,Ibaraki,305日本)產生一種新的具有堿性支鏈淀粉酶和堿性α-淀粉酶兩種活性的堿性淀粉支鏈淀粉酶(正式命名為支鏈淀粉酶Y)之前,具有堿性α-淀粉酶和堿性支鏈淀粉酶兩種活性的酶還未見報道。本發明發明人指出這種酶可用作為自動洗碗機的去垢組合物和衣服的去垢組合物中的添加劑(日本專利中請公開(kakai)No.3-290498)。這種酶雖然由單一的酶分子構成,但是它顯示出堿性α-淀粉酶活性和堿性支鏈淀粉酶活性。這種酶的開發已證明與這兩種酶分別由不同的細菌獨立地產生的現狀相比,這種酶的開發在細菌培養及酶的純化中具有極大的優點。
本發明發明人曾試圖通過培養方法的優化來提高堿性淀粉支鏈淀粉酶(正式命名為支鏈淀粉酶Y)產生細菌Bacillus sp.KSM-AP1378的生產力。然而,這仍然需要進一步提高細菌的酶生產力,以便在工業規模上有利地生產堿性淀粉支鏈淀粉。值得注意的是,通過基因工程,酶的生產力可以進一步提高;同時,通過利用蛋白質工程方法改變編碼酶的基因,酶本身的活性可以得到提高。這些方法的應用均需要有編碼堿性淀粉支鏈淀粉的基因。
因此,本發明的目的是提供編碼堿性淀粉支鏈淀粉酶的基因、包含該基因的重組DNA以及包含該重組DNA的轉化體。
還可以用編碼堿性淀粉支鏈淀粉酶的基因的DNA來產生探針,該探針用于把其它同源堿性淀粉支鏈淀粉酶基因從其它微生物中分離出來。因而,本發明的另一個目的是提供一種篩選和分離其它堿性淀粉支鏈淀粉酶的方法。
發明的說明本發明發明人利用鳥槍法克隆和聚合酶鏈式反應從嗜堿Bacillus菌株的染色體DNA分離出了一種編碼堿性淀粉支鏈淀粉酶的DNA片段。當他們用連接到適當載體上的這一DNA片段轉移微生物時,證實了所形成的重組微生物產生堿性淀粉支鏈淀粉酶。此外,還發現,由該DNA片段編碼的堿性淀粉支鏈淀粉酶的氨基酸序列完全有別于以前已知的淀粉酶和支鏈淀粉酶的氨基酸序列,而且,這種酶有一個特征,即酶分子的氨基末端部分是堿性α-淀粉酶,酶分子的羧基末端部分是堿性支鏈淀粉酶。本發明是基于這個發現完成的。
因此,本發明提供了一種編碼堿性淀粉支鏈淀粉酶的DNA片段。
本發明也提供了具有下文的3號序列所描述的氨基酸序列的堿性α-淀粉酶以及編碼該堿性α-淀粉酶的DNA片段。
本發明也提供了具有下文的4號序列所描述的氨基酸序列的堿性支鏈淀粉酶以及編碼該堿性支鏈淀粉酶的DNA片段。
本發明也提供了包含一種DNA片段的重組DNA,所述DNA片段編碼上述堿性淀粉支鏈淀粉酶,堿性α-淀粉酶或堿性支鏈淀粉酶。
本發明也提供了一包含重組DNA的轉移微生物,該重組體包含一個編碼上述的堿性淀粉支鏈淀粉酶、堿性α-淀粉酶或堿性支鏈淀粉酶的DNA片段。
本發明還提供了一種產生堿性淀粉支鏈淀粉酶、堿性α-淀粉酶或堿性支鏈淀粉酶的方法。該方法的特征是培養上述轉化過的微生物并收集任何一種所表達的酶。
附圖簡要描述
圖1顯示得自Bacillus sp.KSM-AP1378的堿性淀粉支鏈淀粉酶基因的限制酶圖和引物的位置。
圖2顯示得自Bacillus sp.KSM-AP1378的堿性淀粉支鏈淀粉酶基因的亞克隆方案。
圖3是顯示堿性淀粉支鏈淀粉酶的α-淀粉酶和支鏈淀粉酶活性的pH值關系圖。
圖4顯示得自Bacillus sp.KSM-AP1378的KSM-AP1378菌株的染色體DNA的PstI消化產物的Southern雜交分析結果(用片段A為探針)。在Southern濾膜的左側,同時經歷電泳的λDNA-HindIII消化產物(Boehringer Mannheim)的大小標記的位置與各自的DNA片段的大小一道標明。
圖5顯示得自Bacillus sp.KSM-AP1378的KSM-AP1378菌株的染色體DNA的XbaI消化產物的Southern雜交分析結果(用片段C為探針)。在Southern濾膜的左側,同時經歷電泳的λDNA-HindIII消化產物(Boehringer Mannheim)的大小標記的位置與各自的DNA片段的大小一道標明。
圖6顯示用于聚合酶鏈式反應的引物的核苷酸序列。引物1、3、5和B用作互補序列。
圖7顯示得自Bacillus sp.KSM-AP1378的KSM-AP1378菌株的染色體DNA的EcoRI消化產物的Southern雜交分析結果(用片段D為探針)。在Southern濾膜的左側,同時經歷電泳的λDNA-HindIII消化產物(Boehringer Mannheim)的大小標記的位置與各自的DNA片段的大小一道標明。
圖8顯示得自Bacillus sp.KSM-AP1378的KSM-AP1378菌株的染色體DNA的XbaI消化產物的Southern雜交分析結果(用片段E為探針)。在Southern濾膜的左側,同時經歷電泳的λDNA-HindIII消化產物(Boehringer Mannheim)的大小標記的位置與各自的DNA片段的大小一道標明。
優選實施方案的詳盡描述在本發明中,一種用作堿性淀粉支鏈淀粉酶基因供體的有用微生物,可以是如Bacillus sp.KSM-AP1378,其是嗜堿芽孢桿菌。該菌株由本發明發明人從位于日本Tochigi Prefeture的Tochigi市附近的土壤中分離出來,并且鑒定為可產生大量的堿性淀粉支鏈淀粉酶的菌株。該菌株已以保藏號BP-3048保藏在發酵研究所。
為了從微生物供體中獲得染色體DNA,可以使用由Marmur,J.(分子生物學雜志,3,208(1961))及Saito,H.和Miura,K.(Biochim.Biophys.Acta.,72,619(1963))提出的方法。也可以使用其它類似的方法。
使用限制酶切割這樣獲得的染色體DNA,制備包含堿性淀粉支鏈淀粉酶基因的DNA片段。對所使用的限制酶沒有特別的限制,只要它們不破壞所述基因。也可由聚合酶鏈式反應獲得堿性淀粉支鏈淀粉酶基因。例如,可以通過合成引物(具有與位于必需區5-末端的上游側和3′-末端的下游側的序列相對應的序列,所述必需區基于在2號序列中所描述的核苷酸序列)、用產生堿性淀粉支鏈淀粉酶的微生物的染色體DNA作為模板進行聚合酶鏈式反應獲得所述基因。另外,可以用以下兩種方法中的任何一種方法獲得一個完整的基因首先用任一方法從產生堿性淀粉支鏈淀粉酶的微生物中獲得堿性支鏈淀粉酶基因片段,而后經聚合酶鏈式反應擴增一個存在于前一片段上游側的堿性α-淀粉酶基因片段;或者反過來,首先獲得堿性α-淀粉酶基因,其后經聚合酶鏈式反應擴增存在于該基因下游側的堿性支鏈淀粉酶基因片段。
克隆這樣制備的片段。可利用的受體/載體系統沒有特別的限制,只要受體細菌菌株能表達本發明的堿性淀粉支鏈淀粉酶基因;重組DNA能夠在受體細菌中復制;并且重組DNA能夠穩定地攜帶整合的基因。例如,可以使用其中受體是E.coli k-12的EK系統的成員和其中受體是枯草芽胞桿菌Marburg的BS系統的成員。EK系統包括許多種載體且在遺傳學上進行了廣泛的研究,使用該系統可以提供良好的結果,因而是優選的。受體細菌的特定的例子包括EK系統的HB101、C600和JM109菌株以及BS系統的BD170、MI11和ISW1214菌株。載體的特定的例子包括EK系統的pBR322和pUC18以及BS系統的pUB110和pHY300PLK。用限制酶切割載體,隨后與以上提到的染色體DNA或聚合酶鏈式反應擴增的DNA片段連接來獲得重組質粒DNA。可以通過使用例如DNA連接酶完成該連接。
對用重組DNA轉化受體細菌菌株的方法沒有特別的限制。例如,在EK系統的受體的情況下可以使用氯化鈣方法(Mandel,M.,和Higa,A.,分子生物學雜志,53,159(1970)),而在BS系統的受體的情況下可以使用原生質體方法(Chang,C.和Cohen,S.N.,分子基因遺傳學(Mol.Gen.Genet.),168,111(1978))。
重組微生物的選擇按如下步驟進行。第一,使用作為指示的載體DNA編碼的抗生素抗性(其不被外源染色體DNA片段和聚合酶鏈式反應擴增的DNA片段的插入滅活)之類的特征,選擇已由包含載體來源的DNA片段的DNA轉化過的微生物。例如在其中EK系統的pBR322用作載體并且將染色體DNA的BamHI片段插入到pBR322的BamHI切割位點的特定的情況下,四環素抗性基因被滅活,因此,可以利用在基因中不具有BamHI切割位點的氨芐青霉素抗性作為指示進行初步選擇。其次,使用例如復制方法,把所選擇的微生物轉移到包含直鏈淀粉或者支鏈淀粉的瓊脂平板上,然后培養該微生物形成菌落。檢測分解淀粉、在包含直鏈淀粉的瓊脂平板上形成暈圈,也在包含支鏈淀粉的瓊脂平板上形成暈圈的菌落。
可以用制備質粒或噬菌體DNA的標準步驟(Maniatis,T.等,分子克隆,冷泉港實驗室,紐約(1982))提取如此獲得的重組微生物所攜帶的重組DNA。利用各種限制酶切割所提取的重組DNA,并分析電泳裂解模式,這兩個步驟證實重組DNA是載體DNA和包含堿性淀粉支鏈淀粉酶基因的DNA片段的連接產物。
編碼堿性支鏈淀粉酶活性,本發明的堿性淀粉支鏈淀粉酶部分的片段包含在一個約9.4kb的DNA片段中(如圖1的限制酶圖所示)并存在于約6.2kb的區段上(如斜劃線條所示)。
包含堿性淀粉支鏈淀粉酶基因的大小約6.2kb的片段具有如2號序列所示的核苷酸序列。在這個序列中,5末端和3末端分別對應于約6.2kb的片段的左側和右側。在這個序列中觀察到一個開放讀框,該開放讀框在第145個ATG上開始翻譯,并編碼由1號序列所描述的1938個氨基酸殘基形成的序列。在該開放讀框上游的15個堿基(15b)中,存在序列GAAAGGGG,該序列高度互補于枯草芽胞桿菌的16s核糖體RNA的3末端序列(McLaughlin,J.R.等,生物化學雜志,256,11283(1981))。在從35位核苷酸中延伸的較遠上游側上,存在一個序列TTTACA......20B......TAAATT,該序列與σA型啟動子的共有序列具有高度同源性(Gitt,M.A.等,生物化學雜志,260,7178(1985))。在5959位核苷酸的翻譯終止密碼子TAA的下游側上,存在一個反向重復序列(核苷酸編號5961-6015),該序列大概是一個轉錄終止子。此外,通過純化Bacillus sp.KSM-AP1378的培養物,獲得堿性淀粉支鏈淀粉酶中的氨基末端側上的14個殘基的氨基酸序列,該序列與由本發明的DNA片段的核苷酸序列推定的從第一個氨基酸延伸的序列(2號序列中1-14位氨基酸)相符合。
通過將本發明的基因的核苷酸序列和推定的氨基酸序列同迄今為止已知的α-淀粉酶和支鏈淀粉酶的核苷酸序列和氨基酸序列進行比較,證實本發明的基因是一種具有獨特的核苷酸序列的新基因,該基因編碼的氨基酸序列不同于α-淀粉酶或支鏈淀粉酶的氨基酸序列。
此外,本發明的基因的特征在于該基因編碼具有兩個活性中心的酶,一個活性中心是堿性α-淀粉酶的,另一個是堿性支鏈淀粉酶的,兩個活性中心都在蛋白質的一個單一肽鏈中。存在從淀粉酶(430-613位氨基酸)和支鏈淀粉酶(1364-1549位氨基酸)的活性中心唯一觀察到的四種序列中的每一種(區域I-IV;Nakajima,R.等,應用微生物生物技術,23,355(1986))。具體地說,在2號序列的氨基酸序列中,I區的堿性α-淀粉酶=430-435,II區的堿性α-淀粉酶=514-522,III區的堿性α-淀粉酶=547-550,IV區的=608-613,I區的堿性支鏈淀粉酶=1364-1369,II區的堿性支鏈淀粉酶=1428-1436,III區的堿性支鏈淀粉酶=1461-1464,IV區的堿性支鏈淀粉酶=1544-1549。此外,在可能是分別編碼α-淀粉酶和堿性支鏈淀粉酶的結構基因之間,一種由33個氨基形成的間插序列出現了兩次(在2號序列的氨基酸中,802-834和912-944)。因此,利用這個典型特征,以一種獨立方式表達堿性α-淀粉酶部分和堿性支鏈淀粉酶部分也是可能的。例如,如果將編碼從起始密碼子開始延伸到間插序列之前的氨基酸骨架的基因插入到質粒載體DNA中,并把該氨基酸引入到一種合適的受體細菌中,那么就可能單獨產生堿性α-淀粉酶(3號序列)。同樣地,如果編碼從間插序列之后延伸到1906位氨基酸的氨基酸骨架的基因插入到質粒載體DNA中,并把該氨基酸引入到一種合適的受體細菌中,那么就可能單獨產生堿性支鏈淀粉酶(4號序列)。
一種包含堿性淀粉支鏈淀粉酶基因的整個區的優選的重組DNA的實例是質粒pAP101(圖2)。該質粒大小為13.4kb,具有包含6.2kb的堿性淀粉支鏈淀粉酶基因及pHY300PLK和pUC18的部分片段。一種包含重組DNA的優選的重組微生物的實例是大腸桿菌HB101(pAP101)菌株。該菌株是利用標準轉化方法用重組質粒pAP101轉化大腸桿菌HB101菌株獲得的一種產物。當利用日常用于培養大腸桿菌的培養基培養該菌株時,該菌株產生堿性淀粉支鏈淀粉酶。這樣產生的酶的最佳反應pH,對α-淀粉酶活性而言是pH值8-9,對支鏈淀粉酶活性而言是pH值9-10。這與為堿性淀粉支鏈淀粉酶(由基因供體細菌Bacillus Sp.KSM-AP1378產生)測定的酶活性-pH值關系輪廓(圖3)吻合得很好。
本發明的DNA片段不必僅限于那些編碼以下序列表中所顯示的氨基酸的DNA片段,只要這些片段能編碼一種具有人們感興趣的酶促活性的蛋白質,并且它們包含編碼其中一個或多個氨基酸被取代、添加、缺失、反向、或插入的氨基酸序列的DNA片段。一種這樣的DNA的例子是編碼等同于1號序列所描述的氨基酸序列(從中N-末端側上32個氨基酸被缺失)的DNA。因此本發明包括1號序列所示的堿性淀粉支鏈淀粉酶,其中1至32位之間的氨基酸已從氨基末端缺失。
用已知方法培養這樣獲得的轉化體時,可產生堿性α-淀粉酶,堿性支鏈淀粉酶或堿性淀粉支鏈淀粉酶。那就是說,如果利用一種包含僅能編碼堿性α-淀粉酶的結構域的轉化體,將獲得堿性α-淀粉酶;如果利用一種包含僅能編碼堿性支鏈淀粉酶的結構域的轉化體,將獲得堿性支鏈淀粉酶;如果利用一種包含編碼整個堿性淀粉支鏈淀粉酶的結構域的轉化體,將獲得堿性淀粉支鏈淀粉酶。
本發明的DNA片段還可用作探針,從其它有機體分離同源堿性淀粉支鏈淀粉酶基因。
實施例下一步將通過實施例更詳細地描述本發明,但不應該理解為是對本發明的限制。在實施例中的濃度都是依據重量%的。實施例1-染色體DNA的分離把產生堿性淀粉支鏈淀粉酶的Bacillus sp.KSM-AP1378接種到5毫升培養基A(表1)中,并使之在30℃下經歷24小時的震蕩培養。把1毫升培養物接種在100毫升相同的培養基中,隨后在30℃下再震蕩培養12小時。其后,離心收集細胞,按照Saito和Miura提出的方法(Saito,H.和Miura K.,生物化學生物物理學報,72,619(1963)),獲得約1毫克染色體DNA。
表1培養基A的組成支鏈淀粉 1.0%胰化蛋白胨 0.2%酵母提取物 0.1%KH2PO40.03%(NH4)2SO40.1%MgSO4·7H2O 0.02%CaCl2·2H2O 0.02%FeSO4·7H2O 0.001%MnCL2·4H2O 0.0001%Na2CO30.5%(已單獨地滅菌)PH值10實施例2-編碼堿性支鏈淀粉酶的DNA片段的分離利用限制酶PstI切割由實施例1所獲得的染色體DNA(10微克),而后,添加同樣被限制酶PstI切割的載體質粒pBR322(1微克,BoehringerMannheim),并且利用T4 DNA連接酶進行連接反應,進而產生重組質粒的混合物。經重組質粒混合物的轉化產生大腸桿菌的懸液,把該懸液擴散到包含15微克/毫升四環素的LB瓊脂平板培養基(1.0%胰胨(Difco)、0.5%酵母抽提物(Difco)、1.0%NaCl及1.5%瓊脂(Wako化學純化的))上,并在37℃下培養12小時。在出現的轉化細胞菌落中,覆蓋包含0.2%支鏈淀粉的0.8%瓊脂、0.8%紅色支鏈淀粉(red pullulan)(Kanno,M.和Tomiura,E.,農業生物化學,49,1529(1985))、1毫克/毫升的溶菌酶和甘氨酸-NaCl-NaOH緩沖液(pH值9.0);并在37℃下進行反應5小時。結果獲得一種單一菌株,由于紅色支鏈淀粉的分解,該菌株在其菌落周圍形成一個透明暈圈。分離該菌株作為能夠產生堿性支鏈淀粉酶的重組微生物。實施例3-具有堿性支鏈淀粉酶的DNA質粒的限制圖把實施例2所獲得的重組微生物接種到包含15微克/毫升四環素的5毫升LB培養基(1.0%胰胨(Difco)、0.5%酵母抽提物(Difco)、1.0%NaCl)中,并在37℃下培養一夜。此后,把培養物轉移到500毫升LB培養基中,然后震蕩培養24小時。從培養物中分離收集細胞,利用標準方法(Maniatis,T.等,分子克隆,冷泉港實驗室(1982)),獲得約500毫克重組質粒。如圖1所示,從所形成的重組質粒的限制酶圖譜中可以看出該質粒包含約6.3kb的PstI片段。該質粒命名為pPU100。而利用質粒pPU100所轉化的大腸桿菌HB101菌株則命名為HB101(pPU100)。實施例4-堿性支鏈淀粉酶活性的測量
將菌株HB101(pPU100)在5毫升LB培養基(包含四環素)培養一整夜,獲得該菌株的的培養物,把1毫升培養物接種到100毫升LB培養基(包含四環素)中,而后在37℃下震蕩培養24小時。其后,把通過離心分離的細胞懸浮在Tris-HCl緩沖液(pH值8.0)中,并超聲處理破裂這些細胞。通過離心分離除去細胞碎片,上清液則用作無細胞提取物。同樣地,利用菌株HB101(pBR322)制備對照的無細胞提取物。測量這些提取物的支鏈淀粉酶活性。測量支鏈淀粉酶活性的步驟是首先進行一個反應,該反應在包含40mM甘氨酸-NaCl-NaOH緩沖液(pH值10)和支鏈淀粉(最后的濃度=0.25%)的反應混合物中進行;同時,利用3,5-二硝基水楊酸(DNS)方法(Miller,G.L.等,Anal.Biochem.,2,127(1960))定量測定所產生的還原糖。把每分鐘產生數量相當于1μmol葡萄糖的還原糖時的酶量作為一個單位。結果檢測到在菌株HB101(pPU100)的無細胞提取物中存在支鏈淀粉酶活性。另外,測量產生支鏈淀粉酶的最佳作用pH值時發現支鏈淀粉酶實際上是一種具有最佳作用pH值為9.5的堿性支鏈淀粉酶。為了測量酶促活性,需要利用下列緩沖液(各40mM)pH值3.5-5.5醋酸緩沖液pH值5.5-8.5Tris-順丁烯二酸緩沖液pH值8.5-10.5甘氨酸-NaCl-NaOH緩沖液pH值10.5-11.0Na2CO3-NaHCO3緩沖液實施例5-堿性淀粉支鏈淀粉酶基因與用PstI消化的Bacillus sp.KSM-AP1378染色體DNA的Southern雜交用限制酶PstI切割約5微克的pPU100,并使之在瓊脂糖凝膠上電泳。利用Geneclean試劑盒(Biolol公司),從該凝膠中分離出約0.5微克的大小約6.3kb的PstI片段。用DNA標記檢測試劑盒(Boehringer Mannheim)標記PstI片段制備DNA探針。獨立地,用PstI切割來源于Bacillus sp.KSM-AP1378的染色體DNA(各3μg),在瓊脂糖凝膠上電泳;并利用由Southern提出的方法(Southern,E.M.,分子生物學雜志,98,503(1975)),把DNA帶轉移至尼龍膜(Amersham)上。利用DNA標記和檢測試劑盒研究用DNA探針雜交的情況。結果表明如圖4所示,KSM-AP1378菌株的染色體DNA的PstI裂解產物中,檢測到一種大小約6.3kb的與DNA探針雜交的DNA片段的存在。這樣可以證實包含在質粒pPU100中的大小約6.3kb的PstI片段是來源于Bacillus sp.KSM-AP1378染色體DNA的片段。實施例6-包含編碼堿性支鏈淀粉酶的DNA片段之質粒的構建在質粒pHY300PLK的PstI位點和BamHl位點之間,通過插入約3.5kb大小的片段(片段B,圖1)產生重組質粒pHYPUL,所述3.5kb片段通過用BamHI切割包含在質粒pPU100中的大小約6.3kb的PstI片段獲得。用這樣產生的重組質粒轉移大腸桿菌,同時,通過類似于實施例4的方法測量支鏈淀粉酶活性。結果觀察到支鏈淀粉酶活性,該活性在pH值9-10范圍內具有最佳作用pH。這說明堿性支鏈淀粉酶的必需結構域是從PstI位點到BamHI位點的大小約3.5kb的一段。實施例7-編碼堿性支鏈淀粉酶的DNA片段的測序用實施例6中獲得的片段B、市售的缺失試劑盒(千序列缺失試劑盒,Takara Shuzo)和兩種合適的限制酶,產生包含所產生的已被還原的片段的重組質粒DNA,并測定所插入的片段的核苷酸序列。依據使用熒光標記引物的方法(Smith L.M.等,自然,321,674(1986)),利用DNA測序儀序列(370A型,應用生物系統)和Taq-Dydeoxy循環測序試劑盒(應用生物系統測定核苷酸序列。從各自的DNA樣品中重疊具有約300-450個bp大小的核苷酸序列,從而測定在片段B的Pst1位點側面上的3038bp序列。結果發現堿性支鏈淀粉酶基因的開放讀框(開放讀框)延續到PstI位點的上游側,其是所獲得的約6.3kb大小的片段的末端。堿性淀粉支鏈淀粉酶基因的限制性作圖實施例8使用如圖1所示的約6.3kb大小的片段,產生約1.5kb大小的PstI-XbaI片段(片段C),同時以類似于實施例5所描述的的方式標記該片段,從而制備DNA探針(探針1)。單獨地,使已用XbaI(各3微克)切割的Bacillus sp.KSM-AP1378的染色體DNA在瓊脂糖凝膠上電泳;同時,用類似于實施例5所描述的方式把所產生的DNA帶轉移至尼龍膜(Amersham)上,其后以探針雜交該DNA帶。結果發現探針1同具有約2.3kb大小的Xba1片段雜交,且從這推論出,在約6.3kb大小的片段PstI-PstI的上游約0.8 kb存在XbaI位點,片段PstI-PstI位于KSM-AP1378菌株的染色體DNA上(圖1)。按照反向聚合酶鏈式反應方法(Triglia,T.等,核酸研究,16,81(1988);一個循環=94℃×1分鐘+55℃×1分鐘+72℃×3分鐘,30個循環),用聚合酶鏈式反應試劑盒(應用生物系統),以環狀DNA(通過分子內連接用XbaI切割的KSM-AP1378的染色體DNA獲得)作為模板,用引物1和引物2(各引物都具有24個核苷酸并基于實施例7所測定的核苷酸序列合成)(圖1和圖6)擴增從PstI位點到XbaI位點的一段大小約0.8kb片段。以類似于實施例7所描述的方式,測定經過上述擴增的0.8kb片段(片段D)的序列。結果發現堿性支鏈淀粉酶的開放讀框從片段C延伸至片段D的上游(圖1)。實施例9以類似于實施例5所描述的方法,標記實施例8所獲得的從XbaI伸展至PstI的大小約0.8kb的片段,從而制備DNA探針(探針2)。單獨地,使已由EcoRI(各3微克)切割的Bacillus sp.KSM-AP1378的染色體DNA在瓊脂糖凝膠上進行電泳;并以類似于實施例5所描述的方式,把所產生的DNA帶轉移到尼龍膜(Amersham)上,其后以探針2雜交該染色體。從雜交后的EcoRI片段的大小(3.6kb,圖7),可以推論出在實施例8所獲得的片段D上游1.2kb存在EcoRI位點。按照類似實施例8所描述的反向聚合酶鏈式反應方法,以環狀DNA(通過分子內連接用EcoRI切割的KSM-AP1378的染色體DNA獲得)作為模板,用引物3和引物4(各引物都具有24個核苷酸并基于實施例8所測定的核苷酸序列合成)(圖1和圖6)擴增從XbaI位點到這一位點上游1.2kb的一段(片段E)。以類似于實施例7所描述的方式,測定經過上述擴增的1.2kb片段的序列。結果發現堿性支鏈淀粉酶的開放讀框從片段D延伸至片段E的上游。實施例10以類似于實施例5中所描述的方式,標記實施例9所獲得的片段E,從而制備DNA探針(探針3)。以類似于實施例8和9的方式,在菌株KSM-AP1378的染色體DNA的XbaI裂解產物上進行雜交分析(圖8)。從圖1顯示的結果可推論出在片段D的EcoRI位點的上游1.1kb存在XbaI位點,片段D位于菌株KSM-AP1378的染色體DNA中。按照類似實施例8所描述的反向聚合酶鏈式反應方法,以環狀DNA(通過分子內連接用XbaI切割的KSM-AP1378的染色體DNA獲得)作為模板,用引物5和引物6(各引物都具有24個核苷酸并基于實施例9所測定的核苷酸序列合成)(圖1和圖6)擴增從EcoRI位點到這一位點上游1.1kb的一段。以類似于實施例7所描述的方式,測定經過上述擴增的1.1kb片段(片段E)的序列。結果證實堿性支鏈淀粉酶基因開放讀框的5區從存在于這一片段中的片段E延伸。2號序列描述了本發明基因的完整的核苷酸序列和推定的氨基酸序列。推定的1號序列14個氨基酸與用堿性淀粉支鏈淀粉酶在Bacillus sp.KSM-AP1378上實際測定的氨基末端序列相符合,基于這個事實,可以假定本發明基因編碼堿性淀粉支鏈淀粉酶。實施例11按照聚合酶鏈式反應方法(循環=94℃×1分鐘+55℃×1分鐘+72℃×3分鐘,30個循環),用聚合酶鏈式反應試劑盒(應用生物系統),以菌株KSM-AP1378的染色體DNA為模板,使用各具有25個核苷酸的引物A和B(基于實施例7和10所測定的核苷酸序列合成)(圖1和6)擴增包含堿性淀粉支鏈淀粉酶基因的α-淀粉酶域的3.5kb片段。把所產生的DNA片段插入到pUC18質粒載體的SmaI位點中,然后利用市售的大腸桿菌HB101感受態細胞進行轉化。把獲得的轉化體復制到包含0.4%藍色淀粉(天青淀粉,σ)和50微克/毫升氨芐青霉素的LB培養基上,其后在37℃下培養12個小時。分離分解藍色淀粉從而在它的菌落周圍形成暈圈的單一菌株。按類似于實施例3所描述的方式,從該菌株中制備質粒(pAMY100)。實施例12-堿性淀粉支鏈淀粉酶的重組產生經采用T4連接酶、7.7kb片段(通過切割包含堿性淀粉支鏈淀粉酶的堿性支鏈淀粉酶域的質粒pHYPUL獲得(實施例3))以及pAMY100(包含相同基因的堿性α-淀粉酶域(實施例11))連接制備重組質粒混合物。用該重組質粒混合物轉化大腸桿菌HB101;把出現的各轉化體分別復制到兩種LB培養基上,一種LB培養基包含0.4%藍色淀粉和50微克/毫升的氨芐青霉素,另一種LB培養基包含0.8%紅色支鏈淀粉(Kanno,M.和Tomiura,E.,農業生物化學,49,1529(1985))和50微克/毫升的氨芐青霉素;隨后在37℃下生長培養12小時。一種菌株在兩個平板上的其菌落周圍形成暈圈,分離該菌株作為能夠產生堿性淀粉支鏈淀粉酶的重組大腸桿菌。實施例13利用實施例12所獲得的重組大腸桿菌,以類似于實施例3所描述的方式制備約500微克的重組質粒。從所產生的重組質粒的限制性圖譜中可以發現如圖1中所示,該質粒包含約7.0kb的DNA片段(片段H)。這一質粒命名為pAP101(圖2),用質粒pAP101轉化的大腸桿菌HB101命名為HB101(pAP101)。實施例14以類似于在實施例4所描述的方式,使用大腸桿菌HB101(pAP101)制備無細胞提取物。同時,利用HB101(pBR322)菌株制備對照無細胞提取物。測定這些提取物的α-淀粉酶和支鏈淀粉酶活性。測定α-淀粉酶的活性的方法是在包含50mM甘氨酸-NaCl-NaOH緩沖液(pH值10)和可溶淀粉的反應混合物中,在50℃下進行反應15分鐘;同時,用DNS方法定量測定所產生的還原糖。以類似于在實施例4中所描述的方式測量支鏈淀粉酶活性。在這兩種情況下,把每分鐘產生數量相當于1μmol葡萄糖的還原糖時的酶量作為一個單位。結果檢測到在菌株HB101(pAP101)的無細胞提取物中存在α-淀粉酶和支鏈淀粉酶活性。當用如實施例4所描述的方法測量α-淀粉酶和支鏈淀粉酶的最佳作用pH值時,發現在pH值8-9和9-10的范圍內,分別觀測到最大的α-淀粉酶活性和最大的支鏈淀粉酶活性。實施例15-堿性淀粉支鏈淀粉酶的特征確定從Bacillus sp.KSM-AP1378的培養物中,純化50毫克堿性淀粉支鏈淀粉酶(210kDa;日本專利出版物(kokoku)No.6-32613),將0.1毫克木瓜蛋白酶(σ,5U/微克)添加到該堿性淀粉支鏈淀粉酶中,同時讓其在30℃下水解2分鐘。其后,向其中添加10微克的抗蛋白酶(Furuka),停止該反應。利用DEAE 5PW層析柱(7.5mm×7.5cm;Tsoh)分級分離所形成的分解產物,從而獲得具有114kDa和102kDa的蛋白質片段。這兩種蛋白質片段的酶促活性測定表明102kDa蛋白質片段僅具有堿性支鏈淀粉酶活性,114kDa蛋白質片段僅具有堿性α-淀粉酶活性。在僅具有支鏈淀粉酶活性的102kDa蛋白質片段的氨基酸序列N-末端測定中,測出有序列蘇氨酸-纈氨酸-脯氨酸-亮氨酸-丙氨酸-亮氨酸-纈氨酸-絲氨酸-甘氨酸-谷氨酸-纈氨酸-亮氨酸-絲氨酸-天冬氨酸-賴氨酸-亮氨酸,這完全同從2號序列所描述的核苷酸序列中推論出的第1014至第1029位氨基酸的序列一致。同樣地,在僅具有α-淀粉酶活性的114kDa蛋白質片段的氨基酸序列N-末端的測定中,測出有序列谷氨酸-蘇氨酸-甘氨酸-天冬氨酸-賴氨酸-精氨酸-異亮氨酸-谷氨酸-苯丙氨酸-絲氨酸-酪氨酸-谷氨酸-精氨酸-脯氨酸的測定,該序列完全同從2號序列所描述的核苷酸序列中推論出的第1至第14位氨基酸的序列一致。這些結果也證明本發明基因編碼堿性淀粉支鏈淀粉酶蛋白質,該蛋白質具有不同的活性中心,具體地說,即支鏈淀粉酶活性的活性中心和α-淀粉酶活性的活性。實施例16把重組質粒pAP101引入枯草芽孢桿菌ISW1214中,同時通過振蕩,在31℃下使轉化細胞在包含15微克/毫升四甘氨酸的LB培養基中生長60小時。根據堿性支鏈淀粉酶活性,發現堿性淀粉支鏈淀粉酶以每升60個單位的水平分泌。所表達的酶具有一定的最佳pH值范圍直鏈淀粉酶活性最佳pH值約為8-9,支鏈淀粉酶活性最佳pH值約為9.5,其值接近于各自的Bacillus sp.KSM-AP1378的堿性淀粉支鏈淀粉酶的酶促活性的最佳pH值。通過十二烷磺酸鈉凝膠電泳測定,所表達的淀粉支鏈淀粉酶蛋白質的分子質量大約是200-210kDa,其值接近于菌株KSM-AP1378的酶的質量。參考實施例1
把產生堿性淀粉支鏈淀粉酶的Bacillus sp.KSM-AP1378菌株接種到10ml的A培養基(表1)中,并使之在30℃下經歷2天的震蕩培養。把10ml培養物接種到1升的相同培養基中,接著在30℃下再震蕩培養3天。其后,離心處理細胞,獲得一種包含堿性淀粉支鏈淀粉酶的粗酶液。通過包括在DEAE纖維素上吸附、在瓊脂糖凝膠-α-環(化)糊精的層析柱上親和層析和在聚丙烯酰氨葡萄糖s-200的層析柱上凝膠過濾等在內的各種處理,純化該粗酶液,獲得一種該酶的電泳上均一的樣品。利用蛋白質測序儀476A(應用生物系統)測定這種酶的氨基酸序列的N-末端,測定表明該N-末端具有序列谷氨酸-蘇氨酸-甘氨酸-天冬氨酸-賴氨酸-精氨酸-異亮氨酸-谷氨酸-苯丙氨酸-絲氨酸-酪氨酸-谷氨酸-精氨酸-脯氨酸。參考實施例2利用實施例4和14所描述的方法,測定參考實施例1所獲得的堿性淀粉支鏈淀粉酶的α-淀粉酶活性和支鏈淀粉酶活性的最佳pH。結果觀測到α-淀粉酶活性的最佳pH值在8.5附近,支鏈淀粉酶活性的最佳pH值在9.5附近。
工業適用性按照本發明,獲得一種編碼在堿性pH值范圍內顯示出最大活性的堿性淀粉支鏈淀粉酶基因以及一種包含該基因的微生物是可能的。本發明的應用有利于堿性淀粉支鏈淀粉酶的大量生產。堿性淀粉支鏈淀粉酶的特點是在該酶中有不同的活性中心,一個是支鏈淀粉酶的,一個是α-淀粉酶的,二者都存在于該酶的單一蛋白質中。
序列表1號序列的信息(i)序列特征(A)長度1938個氨基酸(B)型氨基酸(D)拓撲結構線性(ii)分子類型肽(xi)序列描述1號序列Met Lys Lys Arg Phe Gln Arg Gly Met Ala Gly Leu Leu Ser Ile Leu-30 -25 -20Leu I1e Val Ser Met Phe Ala Gly Tyr Leu Pro Ala Arg Ala Ala Ala-15 -10 -5Glu Thr Gly Asp Lys Arg Ile Glu Phe Ser Tyr Glu Arg Pro Asp Gly1 5 10 15Asn Tyr Glu Gly Trp Asn Leu Trp Val Trp Gly Thr Gly Val Lys Asp20 25 30Asp Gln Ile Asp Phe Thr Glu Phe Lys Glu Gly Lys Ala Tyr Ala Asp35 40 45Ile Ala Val Ser Asp Asn Ala Asp Lys Val Gly Phe Ile Ile Arg Lys50 55 60Gly Asp Trp Glu Glu Lys Asp Phe Asp Gly Asp Arg Ser Ile Thr Ile65 70 75 80Asn Lys Ile Asp Asn Ile Thr Lys Val His Val Thr Ser Gln Gln Glu85 90 95Lys Phe Gly Gln Ile Pro Asp Gly Ser Pro Pro Val Val Ala Asp Gly100 105 110Asn Ala Asp Phe Phe Phe Arg Asp Lys Glu Leu Tyr Ala Ala Gly Glu115 120 125Met Asp Lys Val Glu Lys Val Glu Leu Ser Ile Leu Gly Glu Lys Tyr130 135 140Glu Met Asn Gly Glu Pro Glu Lys Glu Arg Phe Thr Tyr Thr Leu Ser145 150 155 160Asp Leu Pro Thr Gly Glu His Glu Tyr Thr Tyr Leu Val Thr Val Asp165 170 175Gly Gln Thr Glu Glu Val Thr Asp Pro Tyr Asn Thr Val Asp Gly Arg180 185 190Ser Val Val Glu Tyr Val Thr Ser Asp Val Gln Val Ser Ala Ser Phe195 200 205Ile Pro Ala Lys Val Asp Tyr Asn Gln Asn Ala Val Val Lys Val Asp210 215 220Ile Glu Ser Glu Thr Glu Thr Lys Ile Arg Glu Met Ser Ile Asn Leu225 230 235 240Ser Glu Ile Gly Gly Lys Glu Lys Ala Thr Ile Asp Pro Ala Leu Asn245 250 255Glu Leu Thr Val Ala Val Lys Gln Gly Val Thr Ala Gly Val Lys Asn260 265 270Leu Pro Ile Thr Ala Ile Asp Glu Phe Gly Asn Arg His Glu Gly Ser275 280 285Ala Thr Leu Glu Val Gln Ala Arg Thr Ile Thr Gly Glu Lys Ala Asp290 295 300Phe Asp Trp Asp Gln Ser Val Val Tyr Phe Met Leu Thr Asp Arg Phe305 310 315 320Phe Asp Gly Asp Ser Ser Asn Asn Asp Pro His Gly Ile Gly Tyr Asp325 330 335Thr Ser Lys Ser Gly Thr Tyr Gln Gly Gly Asp Phe Lys Gly Ile Thr340 345 350Gln Arg Leu Asp Tyr Leu Asp Glu Leu Gly Ile Asn Thr Ile Trp Ile355 360 365Ser Pro Val Val Asp Asn Ile Lys Phe Asp Val Arg His Ser Glu Gly
370 375 380Pro Asp Thr Pro Tyr Tyr Ala Tyr His Gly Tyr Trp Ala Asp Asn Phe385 390 395 400Gly Glu Leu Asn Pro His Phe Gly Ser Met Ala Asp Phe His Glu Met405 410 415Ile Asp Ala Ala His Glu Arg Gly Ile Lys Ile Met Val Asp Val Val420 425 430Leu Asn His Thr Gly Tyr Gly Leu Lys Pro Gly Asp Ser Ser Ser Val435 440 445Ala Asn Phe Pro Thr Asp Glu Asp Arg Ala Arg Phe Asp Gly Met Leu450 455 460Arg Asp Gly Gly Ser Gly Glu Val Arg Gly Glu Leu Ala Gly Leu Pro465 470 475 480Asp Phe Leu Thr Glu Asn Pro Asp Val Arg Glu Gln Val Val Gln Trp485 490 495Gln Thr Asp Trp Ile Glu Lys Ser Arg Thr Ala Lys Gly Asn Thr Ile500 505 510Asp Tyr Phe Arg Val Asp Thr Val Lys His Val Glu Asp Thr Thr Trp515 520 525Met Ala Phe Lys Asn Ala Leu Thr Lys Ala Met Pro Glu His Lys Leu530 535 540Ile Gly Glu Ala Trp Gly Ala Asn Val Asn Asp Asp Leu Gly Tyr Leu545 550 555 560Asn Ser Gly Met Met Asp Ser Leu Leu Asp Phe Asp Phe Lys Asn Tyr565 570 575Ala Arg Asp Phe Ala Asn Gly Gln Leu Asp Ala Val Gln Gln Lys Leu580 585 590Glu Ala Arg Asn Ser Lys Leu Asn Asn Thr Ala Thr Leu Gly Gln Phe595 600 605Leu Gly Ser His Asp Glu Asp Arg Phe Tyr Glu Val Val Glu Gly Asp610 615 620Leu Gly Lys Tyr Gln Val Ala Ala Ser Leu Gln Leu Thr Ala Lys Gly625 630 635 640Gln Pro Val Ile Tyr Tyr Gly Glu Glu Leu Gly Leu Pro Gly Lys Asn645 650 655Asp Tyr Pro Tyr Tyr Thr Asn Arg Gln Asn Met Pro Trp Asp Asp Val660 665 670Asp Gly Asn Glu Ile Leu Glu His Tyr Gln Lys Leu Leu Ala Phe Arg675 680 685Asn Asp Asn Pro Asn Thr Phe Ala Lys Gly Asp Arg Lys Lys Val Ala690 695 700Gly Ser Asp Ser Glu Gly Tyr Leu Leu Phe Ser Arg Thr Tyr Gly Glu705 710 715 720Asn Ser Val Tyr Val Gly Leu Asn Thr Glu Ala Ala Ala Lys Asp Val725 730 735Thr Leu Asn Phe Gly Ser Ser Glu Ala Val Val Thr Asp Arg Tyr Ser740 745 750Gly Gln Glu Tyr Gln Ala Asn Glu Glu Gly Gln Val Thr Phe Ser lle755 760 765Pro Ala Met Glu Asp Gly Gly Thr Val Leu Leu Glu Val Glu Asn Gly770 775 780Ala Val Pro Pro Val Glu Glu Glu Pro Thr Glu Pro Gly Glu Ile Glu785 790 795800Glu Asn Thr Leu Arg Ile His Tyr Gln Arg Thr Asp Asn Ser Tyr Glu805 810 815Asn Leu Gly Leu Trp Leu Trp Gly Asp Val Ala Ala Pro Ser Glu Asn820 825 830Trp Pro Ser Gly Gly Thr Pro Phe Gln Ala Gly Asn Val Thr Asp Tyr
835 840 845Gly Ala Tyr Val Asp Val Glu Leu Ala Glu Asp Ala Gln Asn Ile Gly850 855 860Phe Leu Val Leu Asn Thr Thr Asn Gly Asp Lys Asp Gly Gly Asp Lys865 870 875 880Ala Val Glu Leu Phe Ser Pro Asp Leu Asn Glu Ile Trp Ile Lys Gln885 890 895Gly Ser Asp Glu Val Phe Leu Tyr Glu Pro Val Asp Leu Pro Ala Asn900 905 910Thr Val Arg Ile His Tyr Glu Arg Thr Asn Ala Asp Tyr Glu Gly Trp915 920 925Gly Leu Trp Asn Trp Glu Asp Val Glu Ser Pro Ser Asp Gly Trp Pro930 935 940Asn Gly Ala Ala Asp Ala Ala Gly Ile Gly Lys Tyr Gly Ala Tyr Tyr945 950 955 960Asp Ile Lys Leu Lys Glu Asp Ala Asn Lys Ile Gly Phe Leu Phe Val965 970 975Asn Lys Gln Ser Gly Gly Gln Thr Gly Asp Met Thr Phe Asp Met Leu980 985 990Lys Gln Tyr Asn Gln Leu Phe Val Lys Glu Gly Glu Asp Lys Val Tyr9951000 1005Thr Asn Pro Tyr Gly Thr Val Pro Leu Ala Leu Val Ser Gly Glu Val101010151020Leu Ser Asp Lys Leu Ile Ser Leu Thr Phe Thr Arg Thr Glu Gly Leu1025 1030 1035 1040Asp Leu Glu Glu Leu Lys Glu Gln Leu Glu lle Lys Asp Val Asp Gly104510501055Asn Asp Val Ser Phe Thr Asp Val Thr lle Glu Gly Glu Lys Thr Val106010651070His Va1 His Gly Glu Phe Asp Leu Glu Lys Ile Pro Phe Ser Val Thr107510801085Tyr Leu Asp Arg Thr Ile Ser Val Lys Ser Gly Trp Lys Leu Ile Asp109010951100Glu Met Tyr Ala Tyr Asp Gly Lys Leu Gly Ala Glu Leu His Glu Asp11051l1011151120Gly Thr Ala Thr Leu Lys Val Trp Ser Pro Lys Ala Asp Asn Val Ser112511301135Val Val Leu Tyr Asp Lys Val Asp Gln Asn Glu Val Val Asp Thr Ile114011451150Glu Met Val Lys Gly Asp Arg Gly Val Trp Ser Val Lys Leu Thr Lys115511601165Asp Asn Thr Gly Leu Asp Ser Leu Lys Gly Tyr Tyr Tyr His Tyr Glu117011751180Ile Thr His Gly Asp Val Thr Asn Leu Ala Leu Asp Pro Tyr Ala Lys11851190 1195 1200Ser Met Ala Ala Trp Asn Asn Glu Ala Gly Asp Lys Val Gly Lys Ala120512101215Ala Ile Val Asp Ile Gly Ser Ile Gly Pro Glu Leu Asp Tyr Ala Asp122012251230Ile Pro Gly Phe Glu Lys Arg Glu Asp Thr Ile lle Tyr Glu Val His123512401245Val Arg Asp Phe Thr Ser Asp Pro Asn Ile Gly Glu Asp Leu Lys Ala125012551260Gln Phe Gly Thr Phe Ala Ser Phe Val Glu Lys Leu Asp Tyr Ile Gln1265127012751280Glu Leu Gly Val Thr His Ile Gln Leu Leu Pro Val Met Ser Tyr Tyr128512901295Phe Ser Asn Glu Phe Glu Ser Gly Glu Arg Met Leu Glu Tyr Ala Ser
130013051310Thr Gly Thr Asn Tyr Asn Trp Gly Tyr Asp Pro His Asn Tyr Phe Ser131513201325Leu Ser Gly Met Tyr Ser Glu Asn Pro Glu Asp Pro Glu Leu Arg Ile133013351340Lys Glu Phe Lys Asn Leu Ile Asn Glu Ile His Lys Arg Asp Met Gly1345135013551360Val Val Leu Asp Val Val Phe Asn His Thr Ala Gln Val His Ile Phe136513701375Glu Asp Leu Val Pro Asn Tyr Tyr His Phe Met Asp Ala Asp Gly Thr138013851390Pro Arg Thr Ser Phe Gly Gly Gly Arg Leu Gly Thr Thr His Glu Met139514001405Ser Arg Arg Val Leu Val Asp Ser Ile Lys His Trp Val Asp Glu Tyr141014151420Lys Val Asp Gly Phe Arg Phe Asp Met Met Gly Asp His Asp Ala Glu1425143014351440Ser Ile Gln Ile Ala Phe Asp Glu Ala Lys Lys Leu Asn Pro Asn Ile144514501455Val Met Ile Gly Glu Gly Trp Val Thr Phe Ala Gly Asp Glu Gly Glu146014651470Pro Val Gln Ala Ala Asp Gln Gln Trp Met Gln Tyr Thr Glu Ala Val147514801485Gly Ser Phe Ser Asp Glu Phe Arg Asn Glu Leu Lys Ser Gly Phe Gly149014951500Ser Glu Gly Gln Pro Arg Phe Ile Thr Gly Gly Ala Val Asn Val Gln1505151015151520Gln Ile Phe Asp Asn Ile Lys Ala Gln Pro His Asn Phe Met Ala Asp152515301535Gln Pro Gly Asp Val Val Gln Tyr lle Glu Ala His Asp Asn Leu Thr154015451550Leu Tyr Asp Val Ile Ala Gln Ser Ile Lys Lys Asp Pro Glu Ile Ala155515601565Glu Asn Asp Leu Glu Ile His Lys Arg Ile Arg Val Gly Asn Ala Met157015751580Val Leu Thr Ser Gln Gly Thr Ala Phe Leu His Ala Gly Gln Glu Phe1585159015951600Gly Arg Thr Lys Gln Trp Arg Ala Pro Ala Thr Glu Ala Pro Tyr Lys160516101615Ser Thr Tyr Met Thr Asp Ala Asp Gly Asn Pro Phe Val Tyr Pro Tyr162016251630Phe lle His Asp Ser Tyr Asp Ser Ser Asp lle Ile Asn Arg Phe Asp163516401645Trp Glu Lys Ala Thr Asp Ala Glu Lys Tyr Pro Val Asn Asn Val Thr165016551660Arg Asp Tyr Thr Ala Gly Leu lle Glu Leu Arg Arg Ser Ser Asp Ala1665167016751680Phe Arg Leu Gly Ser Arg Glu Leu Val Asp Ser Asn Val Thr Met Val168516901695Asp Ala Pro Glu Ile Lys Glu Gln Asp Leu Val Val Ala Tyr Arg Ser170017051710Val Ser Thr Ala Gly Val Glu Tyr Tyr Thr Phe Val Asn Ala Asp Thr171517201725Ser Ser Arg Thr Leu Thr Leu Gly Gln Asp Leu Thr Glu Gly Val Val173017351740Val Val Asp Ala Glu Glu Ala Asn Val Ala Gly Val Ala Glu Pro Ala1745175017551760Gly Phe Glu Leu Thr Ala Glu Gly Ile Thr Leu Glu Pro Leu Thr Thr
176517701775Val Val Val Arg Val Gly Glu Gln Glu Gly Thr Asp Pro Gly Asp Gly178017851790Asp Gly Asp Gly Asn Thr Pro Pro Pro Gly Asp Gly Asp Gly Asp Gly179518001805Asn Thr Pro Pro Pro Gly Asp Gly Asp Gly Asp Gly Asn Thr Pro Pro181018151820Pro Gly Asn Gly Asn Gly Asn Asn Pro Gly Thr Pro Pro Gly Lys Gly1825183018351840Gly Glu Asn Pro Gly Lys Gly Lys Asn Asp Lys Thr Pro Pro Gly Lys184518501855Gly Gly Asp Asn Pro Gly Lys Gly Asn Lys Leu Pro Leu Thr Ala Thr186018651870Gly Thr Leu Asn Tyr Ile Leu Phs Gly Ala Ile Met Leu Val Leu Gly187518801885Thr Leu Leu Tyr Leu Gly Val Arg Arg Lys Ala Gly Leu Lys Glu Lys189018951900Thr Leu19052號序列的信息(i)序列特征(A)長度6142個堿基對(B)型核酸(C)鏈型雙鏈(D)拓撲結構線性(ii)分子類型DNA(基因組)(vi)來源(A)生物體Bacillus sp.
(B)菌株KSM-AP1378(xi)序列描述2號序列
TCTA GATGTGCAAT TTTGCGCAAA 24CGATTTCACA TTTACATAAA CAATCTTGGC ATCAATTAAA TTATTTATTG TGCAACTTTG 84TGCAAACGCT TCCACATTTT AGCAAGAAAT GCAAATCATT GTATGGAAAG GGGCAGGGAT 144ATG AAG AAA AGG TTT CAA AGG GGT ATG GCT GGT TTA CTT TCT ATT TTA 192Met Lys Lys Arg Phe Gln Arg Gly Met Ala Gly Leu Leu Ser Ile Leu-30 -25 -20CTT ATT GTT TCC ATG TTT GCA GGC TAT CTA CCG GCA AGA GCA GCG GCC 240Leu Ile Val Ser Met Phe Ala Gly Tyr Leu Pro Ala Arg Ala Ala Ala-15 -10 -5GAA ACG GGA GAC AAG CGG ATA GAA TTC AGT TAT GAA CGG CCA GAT GGA 288Glu Thr Gly Asp Lys Arg Ile Glu Phe Ser Tyr Glu Arg Pro Asp Gly1 5 10 15AAT TAT GAA GGC TGG AAT TTA TGG GTC TGG GGA ACT GGT GTG AAG GAT 336Asn Tyr Glu Gly Trp Ash Leu Trp Val Trp Gly Thr Gly Val Lys Asp20 25 30GAC CAG ATA GAC TTT ACA GAA TTC AAG GAA GGC AAG GCA TAT GCC GAC 384Asp Gln Ile Asp Phe Thr Glu Phe Lys Glu Gly Lys Ala Tyr Ala Asp35 40 45ATA GCA GTA AGC GAT AAT GCG GAT AAA GTC GGT TTC ATT ATC CGT AAA 432Ile Ala Val Ser Asp Asn Ala Asp Lys Val Gly Phe Ile Ile Arg Lys50 55 60GGG GAT TGG GAA GAA AAG GAC TTT GAT GGG GAC AGG TCG ATT ACG ATC 480Gly Asp Trp Glu Glu Lys Asp Phe Asp Gly Asp Arg Ser Ile Thr Ile65 70 75 80AAT AAG ATC GAT AAC ATC ACC AAA GTG CAT GTA ACA AGC CAG CAG GAA 528Asn Lys Ile Asp Asn Ile Thr Lys Val His Val Thr Ser Gln Gln Glu85 90 95AAA TTC GGG CAA ATT CCT GAC GGC AGC CCA CCT GTT GTT GCG GAC GGG 576Lys Phe Gly Gln Ile Pro Asp Gly Ser Pro Pro Val Val Ala Asp Gly100 105 110AAT GCT GAC TTC TTT TTC CGT GAT AAA GAA CTG TAC GCA GCA GGA GAA 624Asn Ala Asp Phe Phe Phe Arg Asp Lys Glu Leu Tyr Ala Ala Gly Glu115 l20 125ATG GAT AAG GTT GAG AAA GTC GAA CTG TCC ATT TTA GGC GAA AAA TAC 672Met Asp Lys Val Glu Lys Val Glu Leu Ser Ile Leu Gly Glu Lys Tyr130 l35 140GAG ATG AAT GGT GAG CCG GAA AAG GAG CGT TTT ACA TAT ACA TTA AGC 720Glu Met Asn Gly Glu Pro Glu Lys Glu Arg Phe Thr Tyr Thr Leu Ser145 150 155 160GAT CTT CCT ACA GGC GAG CAT GAA TAT ACT TAT TTG GTG ACA GTG GAT 768Asp Leu Pro Thr Gly Glu His Glu Tyr Thr Tyr Leu Val Thr Val Asp165 170 175GGA CAG ACA GAG GAA GTT ACC GAT CCA TAT AAC ACG GTG GAT GGA AGG 816Gly Gln Thr Glu Glu Val Thr Asp Pro Tyr Asn Thr Val Asp Gly Arg180 185 190TCT GTT GTG GAG TAT GTG ACA TCC GAT GTG CAA GTA TCG GCT TCA TTT 864Ser Val Val Glu Tyr Val Thr Ser Asp Val Gln Val Ser Ala Ser Phe195 200 205ATA CCC GCA AAG GTT GAT TAT AAC CAG AAC GCT GTG GTG AAG GTA GAC 912Ile Pro Ala Lys Val Asp Tyr Asn Gln Asn Ala Val Val Lys Val Asp210 215 220ATC GAA TCA GAA ACG GAG ACA AAA ATC CGT GAG ATG TCT ATC AAT CTT 960Ile Glu Ser Glu Thr Glu Thr Lys Ile Arg Glu Met Ser Ile Asn Leu225 230 235 240TCA GAA ATC GGC GGC AAA GAG AAA GCA ACC ATT GAT CCT GCG CTG AAT 1008Ser Glu Ile Gly Gly Lys Glu Lys Ala Thr Ile Asp Pro Ala Leu Asn245 250 255GAA TTG ACA GTT GCG GTC AAG CAA GGT GTG ACG GCA GGT GTG AAA AAC 1056Glu Leu Thr Val Ala Val Lys Gln Gly Val Thr Ala Gly Val Lys Asn260 265 270TTG CCT ATC ACT GCG ATT GAT GAA TTC GGA AAT CGC CAT GAG GGA TCT 1104Leu Pro Ile Thr Ala Ile Asp Glu Phe Gly Asn Arg His Glu Gly Ser275 280 285GCT ACC TTA GAA GTT CAG GCG CGT ACT ATT ACA GGT GAA AAA GCA GAT 1152Ala Thr Leu Glu Val Gln Ala Arg Thr Ile Thr Gly Glu Lys Ala Asp290 295 300TTC GAC TGG GAT CAG TCT GTG GTT TAT TTT ATG CTG ACA GAT CGA TTC 1200Phe Asp Trp Asp Gln Ser Val Val Tyr Phe Met Leu Thr Asp Arg Phe305 310 315 320TTT GAT GGG GAT TCA TCG AAC AAT GAC CCT CAT GGT ATT GGC TAT GAC 1248Phe Asp Gly Asp Ser Ser Asn Asn Asp Pro His Gly Ile Gly Tyr Asp325 330 335ACA AGC AAG TCT GGT ACA TAC CAA GGC GGA GAT TTT AAG GGG ATC ACG 1296Thr Ser Lys Ser Gly Thr Tyr Gln Gly Gly Asp Phe Lys Gly Ile Thr340 345 350CAA AGG CTT GAT TAC TTG GAC GAG CTT GGA ATC AAT ACG ATC TGG ATC 1344Gln Arg Leu Asp Tyr Leu Asp Glu Leu Gly Ile Asn Thr Ile Trp Ile355 3G0 365AGT CCG GTT GTC GAT AAT ATC AAA TTT GAT GTT CGA CAC AGT GAA GGA 1392Ser Pro Val Val Asp Asn Ile Lys Phe Asp Val Arg His Ser Glu Gly370 375 380CCT GAT ACA CCA TAT TAT GCT TAC CAC GGC TAT TGG GCG GAT AAT TTC 1440Pro Asp Thr Pro Tyr Tyr Ala Tyr His Gly Tyr Trp Ala Asp Asn Phe385 390 395 400GGG GAA TTG AAC CCG CAT TTC GGT TCC ATG GCG GAT TTC CAT GAA ATG 1488Gly Glu Leu Asn Pro His Phe Gly Ser Met Ala Asp Phe His Glu Met
405 410 415ATT GAT GCG GCA CAT GAA CGC GGC ATT AAA ATC ATG GTT GAT GTG GTG 1536Ila Asp Ala Ala His Glu Arg Gly Ile Lys Ile Met Val Asp Val Val420 425 430TTG AAT CAC ACT GGT TAT GGA TTG AAA CCA GGT GAC AGC AGC AGT GTG 1584Leu Asn His Thr Gly Tyr Gly Leu Lys Pro Gly Asp Ser Ser Ser Val435 440 445GCG AAC TTC CCG ACA GAT GAG GAC CGA GCT CGC TTT GAC GGA ATG CTT 1632Ala Asn Phe Pro Thr Asp Glu Asp Arg Ala Arg Phe Asp Gly Met Leu450 455 460CGT GAT GGC GGA TCT GGT GAA GTT CGA GGC GAG CTT GCT GGC CTT CCA 1680Arg Asp Gly Gly Ser Gly Glu Val Arg Gly Glu Leu Ala Gly Leu Pro465 470 475 480GAT TTT CTG ACG GAA AAC CCG GAT GTC CGT GAA CAG GTG GTG CAA TGG 1728Asp Phe Leu Thr Glu Asn Pro Asp Val Arg Glu Gln Val Val Gln Trp485 490 495CAG ACG GAC TGG ATC GAA AAG TCC AGG ACG GCA AAG GGC AAC ACC ATC 1776Gln Thr Asp Trp Ile Glu Lys Ser Arg Thr Ala Lys Gly Asn Thr Ile500 505 510GAT TAT TTC CGT GTC GAC ACC GTC AAG CAT GTG GAA GAC ACC ACT TGG 1824Asp Tyr Phe Arg Val Asp Thr Val Lys His Val Glu Asp Thr Thr Trp515 520 525ATG GCG TTT AAA AAT GCT TTG ACA AAA GCG ATG CCG GAA CAC AAG CTG 1872Met Ala Phe Lys Asn Ala Leu Thr Lys Ala Met Pro Glu His Lys Leu530 535 540ATT GGG GAA GCA TGG GGA GCA AAT GTC AAT GAC GAC CTA GGT TAT CTG 1920Ile Gly Glu Ala Trp Gly Ala Asn Val Asn Asp Asp Leu Gly Tyr Leu545 550 555 560AAC AGC GGA ATG ATG GAT TCT TTA CTG GAT TTT GAT TTC AAA AAT TAT 1968Asn Ser Gly Met Met Asp Ser Leu Leu Asp Phe Asp Phe Lys Asn Tyr565 570 575GCC CGT GAC TTT GCA AAC GGA CAG CTG GAT GCG GTT CAG CAA AAA CTT 2016Ala Arg Asp Phe Ala Asn Gly Gln Leu Asp Ala Val Gln Gln Lys Leu580 585 590GAG GCG CGT AAC AGC AAG TTG AAC AAT ACT GCA ACA CTT GGT CAA TTT 2064Glu Ala Arg Asn Ser Lys Leu Asn Asn Thr Ala Thr Leu Gly Gln Phe595 600 605TTA GGA AGC CAT GAC GAA GAC CGC TTC TAT GAG GTG GTG GAA GGA GAC 2112Leu Gly Ser His Asp Glu Asp Arg Phe Tyr Glu Val Val Glu Gly Asp610 615 620CTT GGC AAG TAT CAA GTT GCT GCA TCC CTT CAA CTG ACG GCA AAG GGT 2160Leu Gly Lys Tyr Gln Val Ala Ala Ser Leu Gln Leu Thr Ala Lys Gly625 630 635 640CAG CCT GTT ATC TAT TAC GGA GAA GAG CTG GGC TTG CCT GGT AAG AAC 2208Gln Pro Val Ile Tyr Tyr Gly Glu Gln Leu Gly Leu Pro Gly Lys Asn645 650 655GAT TAT CCG TAT TAT ACG AAC CGC CAG AAC ATG CCT TGG GAT GAT GTG 2256Asp Tyr Pro Tyr Tyr Thr Asn Arg Gln Asn Met Pro Trp Asp Asp Val660 665 670GAT GGT AAT GAA ATT CTA GAG CAT TAT CAA AAA TTA CTG GCA TTC CGT 2304Asp Gly Asn Glu Ile Leu Glu His Tyr Gln Lys Leu Leu Ala Phe Arg675 680 685AAT GAT AAT CCG AAC ACA TTT GCT AAA GGA GAC CGC AAA AAG GTA GCG 2352Asn Asp Asn Pro Asn Thr Phe Ala Lys Gly Asp Arg Lys Lys Val Ala690 695 700GGA TCT GAC AGT GAA GGA TAT CTT TTA TTT TCA CGG ACG TAC GGG GAA 2400Gly Ser Asp Ser Glu Gly Tyr Leu Leu Phe Ser Arg Thr Tyr Gly Glu705 710 715 720AAT TCC GTT TAT GTA GGT TTG AAT ACG GAA GCT GCT GCG AAA GAC GTA 2448Asn Ser Val Tyr Val Gly Leu Asn Thr Glu Ala Ala Ala Lys Asp Val725 730 735ACC TTG AAC TTC GGT TCT TCA GAA GCA GTG GTG ACG GAC CGC TAT TCC 2496Thr Leu Asn Phe Gly Ser Ser Glu Ala Val Val Thr Asp Arg Tyr Ser740 745 750GGT CAG GAG TAC CAA GCA AAT GAA GAA GGC CAA GTG ACG TTC TCT ATT 2544Gly Gln Glu Tyr Gln Ala Asn Glu Glu Gly Gln Val Thr Phe Ser Ile755 760 765CCG GCG ATG GAA GAC GGG GGA ACG GTC CTG CTT GAA GTG GAA AAT GGA 2592Pro Ala Met Glu Asp Gly Gly Thr Val Leu Leu Glu Val Glu Asn Gly770 775 780GCA GTG CCA CCT GTG GAG GAA GAA CCA ACT GAG CCA GGT GAA ATC GAA 2640Ala Val Pro Pro Val Glu Glu Glu Pro Thr Glu Pro Gly Glu Ile Glu785 790 795 800GAA AAC ACG CTT CGG ATT CAC TAC CAG CGC ACA GAC AAC AGC TAC GAA 2688Glu Asn Thr Leu Arg Ile His Tyr Gln Arg Thr Asp Asn Ser Tyr Glu805 810 815AAC CTT GGT CTA TGG TTA TGG GGA GAC GTC GCG GCA CCA TCT GAA AAC 2736Asn Leu Gly Leu Trp Leu Trp Gly Asp Val Ala Ala Pro Ser Glu Asn820 825 830TGG CCA TCA GGC GGC ACA CCG TTC CAA GCA GGT AAT GTA ACA GAC TAT 2784Trp Pro Ser Gly Gly Thr Pro Phe Gln Ala Gly Asn Val Thr Asp Tyr835 840 845GGT GCA TAT GTC GAT GTG GAA TTG GCA GAA GAT GCT CAA AAT ATT GGA 2832Gly Ala Tyr Val Asp Val Glu Leu Ala Glu Asp Ala Gln Asn Ile Gly850 855 860TTC CTT GTT TTG AAC ACC ACA AAC GGT GAC AAG GAC GGC GGC GAC AAA 2880Phe Leu Val Leu Asn Thr Thr Asn Gly Asp Lys Asp Gly Gly Asp Lys865 870 875 880GCA GTA GAA TTG TTC AGT CCG GAT TTA AAT GAG ATT TGG ATC AAA CAA 2928Ala Val Glu Leu Phe Ser Pro Asp Leu Asn Glu Ile Trp Ile Lys Gln885 890 895GGC TCT GAT GAA GTA TTT TTA TAT GAA CCG GTG GAC CTT CCG GCA AAT 2976Gly Ser Asp Glu Val Phe Leu Tyr Glu Pro Val Asp Leu Pro Ala Asn900 905 910ACG GTC CGC ATT CAT TAT GAA AGA ACC AAT GCC GAC TAT GAA GGC TGG 3024Thr Val Arg Ile His Tyr Glu Arg Thr Asn Ala Asp Tyr Glu Gly Trp915 920 925GGG TTA TGG AAC TGG GAG GAT GTC GAG TCC CCA TCT GAC GGG TGG CCG 3072Gly Leu Trp Asn Trp Glu Asp Val Glu Ser Pro Ser Asp Gly Trp Pro930 935 940AAC GGT GCC GCA GAT GCT GCA GGT ATC GGT AAA TAC GGT GCT TAC TAC 3120Asn Gly Ala Ala Asp Ala Ala Gly Ile Gly Lys Tyr Gly Ala Tyr Tyr945 950 955 960GAC ATC AAG CTG AAA GAA GAT GCT AAT AAA ATT GGT TTC CTT TTT GTG 3168Asp Ile Lys Leu Lys Glu Asp Ala Asn Lys Ile Gly Phe Leu Phe Val965 970 975AAC AAA CAA TCT GGT GGC CAA ACG GGA GAT ATG ACG TTT GAT ATG CTG 3216Asn Lys Gln Ser Gly Gly Gln Thr Gly Asp Met Thr Phe Asp Met Leu980 985 990AAA CAA TAC AAC CAA CTT TTT GTA AAA GAG GGC GAG GAC AAG GTC TAC 3264Lys Gln Tyr Asn Gln Leu Phe Val Lys Glu Gly Glu Asp Lys Val Tyr99510001005ACC AAT CCT TAC GGG ACC GTG CCA TTG GCG CTT GTG TCT GGA GAG GTA 2312Thr Asn Pro Tyr Gly Thr Val Pro Leu Ala Leu Val Ser Gly Glu Val101010151020TTG TCA GAC AAG TTG ATC AGT CTT ACT TTT ACC AGG ACA GAA GGA TTG 3360Leu Ser Asp Lys Leu Ile Ser Leu Thr Phe Thr Arg Thr Glu Gly Leu1025103010351040GAT TTG GAG GAA TTG AAA GAA CAG CTA GAA ATC AAG GAT GTG GAC GGG 3408Asp Leu Glu Glu Leu Lys Glu Gln Leu Glu Ile Lys Asp Val Asp Gly104510501055AAC GAT GTT TCG TTT ACA GAT GTG ACA ATT GAA GGC GAG AAA ACG GTC 3456Asn Asp Val Ser Phe Thr Asp Val Thr Ile Glu Gly Glu Lys Thr Val106010651070CAT GTC CAC GGC GAG TTT GAC TTG GAG AAA ATC CCG TTC TCT GTG ACC 3504His Val His Gly Glu Phe Asp Leu Glu Lys Ile Pro Phe Ser Val Thr107510801085TAT CTG GAC CGC ACC ATT TCT GTA AAA TCA GGC TGG AAA CTG ATC GAC 3552Tyr Leu Asp Arg Thr Ile Ser Val Lys Ser Gly Trp Lys Leu Ile Asp109010951100GAA ATG TAT GCC TAT GAT GGA AAG CTT GGG GCA GAA TTG CAT GAA GAC 3600Glu Met Tyr Ala Tyr Asp Gly Lys Leu Gly Ala Glu Leu His Glu Asp1105111011151120GGG ACG GCT ACT TTG AAA GTA TGG TCG CCA AAA GCG GAC AAT GTG TCT 3648Gly Thr Ala Thr Leu Lys Val Trp Ser Pro Lys Ala Asp Asn Val Ser112511301135GTT GTA CTT TAT GAC AAA GTT GAC CAG AAC GAG GTT GTA GAC ACC ATT 3696Val Val Leu Tyr Asp Lys Val Asp Gln Asn Glu Val Val Asp Thr Ile114011451150GAA ATG GTA AAA GGG GAC CGC GGT GTC TGG TCT GTA AAG CTA ACT AAG 3744Glu Met Val Lys Gly Asp Arg Gly Val Trp Ser Val Lys Leu Thr Lys115511601165GAT AAT ACA GGC CTT GAT AGT TTG AAA GGT TAC TAT TAC CAC TAT GAA 3792Asp Asn Thr Gly Leu Asp Ser Leu Lys Gly Tyr Tyr Tyr His Tyr Glu117011751180ATC ACG CAT GGT GAC GTA ACG AAT CTT GCT CTA GAT CCG TAT GCC AAA 3840Ile Thr His Gly Asp Val Thr Asn Leu Ala Leu Asp Pro Tyr Ala Lys1185119011951200TCA ATG GCG GCG TGG AAT AAC GAA GCG GGG GAC AAG GTA GGA AAA GCG 3888Ser Met Ala Ala Trp Asn Asn Glu Ala Gly Asp Lys Val Gly Lys Ala120512101215GCG ATC GTG GAC ATC GGC TCC ATT GGG CCT GAG CTT GAT TAT GCC GAC 3936Ala Ile Val Asp Ile Gly Ser Ile Gly Pro Glu Leu Asp Tyr Ala Asp122012251230ATC CCT GGC TTT GAA AAG CGC GAA GAC ACC ATC ATC TAC GAG GTG CAT 3984Ile Pro Gly Phe Glu Lys Arg Glu Asp Thr Ile IIe Tyr Glu Val His123512401245GTA CGT GAC TTC ACT TCC GAC CCG AAT ATC GGT GAG GAC CTG AAG GCA 4032Val Arg Asp Phe Thr Ser Asp Pro Asn Ile Gly Glu Asp Leu Lys Ala125012551260CAG TTC GGT ACA TTT GCT TCT TTC GTG GAA AAG CTG GAT TAC ATT CAA 4080Gln Phe Gly Thr Phe Ala Ser Phe Val Glu Lys Leu Asp Tyr Ile Gln1265127012751280GAG TTA GGT GTC ACT CAC ATT CAA TTG TTG CCT GTG ATG AGC TAT TAT 4128Glu Leu Gly Val Thr His Ile Gln Leu Leu Pro Val Met Ser Tyr Tyr128512901295TTC AGC AAT GAA TTT GAG TCT GGG GAG CGC ATG CTG GAG TAT GCT TCA 4176Phe Ser Asn Glu Phe Glu Ser Gly Glu Arg Met Leu Glu Tyr Ala Ser130013051310ACG GGG ACG AAT TAC AAT TGG GGC TAT GAC CCG CAC AAT TAC TTC TCC 4224Thr Gly Thr Asn Tyr Asn Trp Gly Tyr Asp Pro His Asn Tyr Phe Ser131513201325TTA TCC GGC ATG TAC TCC GAA AAC CCT GAG GAC CCG GAA CTG AGA ATC 4272Leu Ser Gly Met Tyr Ser Glu Asn Pro Glu Asp Pro Glu Leu Arg Ile
133013351340AAA GAA TTC AAG AAT CTG ATC AAC GAG ATT CAT AAG CGC GAC ATG GGT 4320Lys Glu Phe Lys Asn Leu Ile Asn Glu Ile His Lys Arg Asp Met Gly1345135013551360GTG GTA CTT GAT GTG GTG TTT AAC CAC ACC GCA CAG GTT CAC ATT TTC 4368Val Val Leu Asp Val Val Phe Asn His Thr Ala Gln Val His Ile Phe136513701375GAG GAC CTT GTA CCA AAC TAC TAT CAC TTC ATG GAT GCG GAC GGA ACC 4416Glu Asp Leu Val Pro Asn Tyr Tyr His Phe Met Asp Ala Asp Gly Thr138013851390CCA AGA ACT AGC TTT GGC GGT GGA CGT CTT GGA ACG ACA CAT GAA ATG 4464Pro Arg Thr Ser Phe Gly Gly Gly Arg Leu Gly Thr Thr His Glu Met139514001405TCC CGC CGT GTG CTC GTA GAT TCC ATC AAG CAT TGG GTG GAT GAA TAT 4512Ser Arg Arg Val Leu Val Asp Ser Ile Lys His Trp Val Asp Glu Tyr141014151420AAG GTG GAC GGA TTC CGT TTT GAC ATG ATG GGT GAC CAT GAT GCA GAG 4560Lys Val Asp Gly Phe Arg Phe Asp Met Met Gly Asp His Asp Ala Glu1425143014351440AGT ATT CAG ATT GCT TTT GAC GAA GCC AAA AAA TTG AAC CCG AAT ATC 4608Ser Ile Gln Ile Ala Phe Asp Glu Ala Lys Lys Leu Asn Pro Asn Ile144514501455GTC ATG ATC GGG GAA GGC TGG GTA ACA TTT GCT GGT GAC GAG GGC GAG 4656Val Met Ile Gly Glu Gly Trp Val Thr Phe Ala Gly Asp Glu Gly Glu146014651470CCG GTC CAG GCG GCC GAT CAA CAA TGG ATG CAA TAT ACC GAA GCA GTG 4704Pro Val Gln Ala Ala Asp Gln Gln Trp Met Gln Tyr Thr Glu Ala Val147514801485GGT AGC TTC TCG GAT GAA TTC CGC AAC GAG CTG AAA TCC GGT TTC GGA 4752Gly Ser Phe Ser Asp Glu Phe Arg Asn Glu Leu Lys Ser Gly Phe Gly149014951500AGC GAA GGA CAG CCA CGT TTC ATC ACA GGT GGC GCG GTC AAT GTG CAA 4800Ser Glu Gly Gln Pro Arg Phe Ile Thr Gly Gly Ala Val Asn Val Gln1505151015151520CAA ATT TTC GAT AAC ATC AAA GCA CAG CCT CAT AAC TTT ATG GCC GAT 4848Gln Ile Phe Asp Asn Ile Lys Ala Gln Pro His Asn Phe Met Ala Asp152515301535CAA CCA GGC GAT GTG GTC CAA TAC ATC GAG GCC CAT GAC AAC CTG ACG 4896Gln Pro Gly Asp Val Val Gln Tyr Ile Glu Ala His Asp Asn Leu Thr154015451550TTA TAC GAT GTC ATC GCA CAA TCT ATC AAA AAA GAT CCG GAA ATC GCG 4944Leu Tyr Asp Val Ile Ala Gln Ser Ile Lys Lys Asp Pro Glu Ile Ala155515601565GAA AAC GAT TTA GAG ATT CAT AAG CGT ATT CGC GTG GGT AAT GCC ATG 4992Glu Asn Asp Leu Glu Ile His Lys Arg Ile Arg Val Gly Asn Ala Met157015751580GTC TTG ACG TCT CAA GGT ACG GCA TTC TTA CAC GCA GGA CAG GAA TTT 5040Val Leu Thr Ser Gln Gly Thr Ala Phe Leu His Ala Gly Gln Glu Phe1585159015951600GGT CGT ACA AAG CAA TGG AGA GCA CCT GCA ACG GAG GCA CCG TAC AAG 5088Gly Arg Thr Lys Gln Trp Arg Ala Pro Ala Thr Glu Ala Pro Tyr Lys160516101615TCT ACG TAT ATG ACA GAT GCT GAT GGC AAT CCG TTC GTG TAT CCA TAT 5136Ser Thr Tyr Met Thr Asp Ala Asp Gly Asn Pro Phe Val Tyr Pro Tyr162016251630TTC ATC CAC GAT TCC TAT GAT TCC TCG GAT ATC ATC AAT CGT TTT GAT 5184Phe Ile His Asp Ser Tyr Asp Ser Ser Asp Ile Ile Asn Arg Phe Asp163516401645TGG GAA AAA GCG ACA GAT GCC GAG AAA TAC CCT GTC AAC AAT GTG ACA 5232Trp G1u Lys Ala Thr Asp Ala Glu Lys Tyr Pro Val Asn Asn Val Thr165016551660CGT GAC TAC ACG GCA GGC TTG ATC GAG CTG CGT CGT TCA TCT GAT GCT 5280Arg Asp Tyr Thr Ala Gly Leu Ile Glu Leu Arg Arg Ser Ser Asp Ala1665167016751680TTC CGT TTA GGT TCT CGT GAA TTG GTC GAT TCC AAT GTG ACA ATG GTT 5328Phe Arg Leu Gly Ser Arg Glu Leu Val Asp Ser Asn Val Thr Met Val168516901695GAT GCC CCG GAA ATC AAG GAG CAG GAT CTC GTT GTT GCC TAC CGC AGT 5376Asp Ala Pro Glu Ile Lys Glu Gln Asp Leu Val Val Ala Tyr Arg Ser170017051710GTT TCG ACT GCC GGT GTG GAG TAT TAC ACA TTC GTG AAT GCG GAC ACT 5424Val Ser Thr Ala Gly Val Glu Tyr Tyr Thr Phe Val Asn Ala Asp Thr171517201725TCC AGT AGA ACA TTG ACC TTA GGG CAG GAT TTG ACA GAG GGC GTA GTG 5472Ser Ser Arg Thr Leu Thr Leu Gly Gln Asp Leu Thr Glu Gly Val Val173017351740GTG GTC GAT GCA GAA GAG GCT AAT GTA GCC GGT GTA GCT GAG CCT GCT 5520Val Val Asp Ala Glu Glu Ala Asn Val Ala Gly Val Ala Glu Pro Ala1745175017551760GGT TTC GAA TTG ACG GCA GAA GGC ATC ACA CTT GAG CCA TTG ACT ACG 5568Gly Phe Glu Leu Thr Ala Glu Gly Ile Thr Leu Glu Pro Leu Thr Thr176517701775GTT GTC GTC CGT GTA GGC GAG CAG GAA GGG ACA GAC CCG GGT GAT GGG 5616Val Val Val Arg Val Gly Glu Gln Glu Gly Thr Asp Pro Gly Asp Gly178017851790GAC GGC GAT GGC AAT ACG CCG CCA CCA GGC GAC GGC GAT GGC GAT GGA 5664Asp Gly Asp Gly Asn Thr Pro Pro Pro Gly Asp Gly Asp Gly Asp Gly
179518001805AAC ACG CCA CCA CCA GGG GAT GGG GAT GGC GAT GGA AAC ACG CCT CCT 5712Asn Thr Pro Pro Pro Gly Asp Gly Asp Gly Asp Gly Asn Thr Pro Pro181018151820CCA GGC AAC GGT AAT GGC AAT AAT CCA GGA ACA CCA CCA GGA AAG GGT 5760Pro Gly Asn Gly Asn Gly Asn Asn Pro Gly Thr Pro Pro Gly Lys Gly1825183018351840GGA GAA AAC CCT GGT AAA GGC AAA AAC GAC AAA ACA CCG CCT GGC AAA 5808Gly Glu Asn Pro Gly Lys Gly Lys Asn Asp Lys Thr Pro Pro Gly Lys184518501855GGT GGG GAC AAT CCA GGT AAG GGG AAC AAG CTA CCA CTT ACC GCA ACC 5856Gly Gly Asp Asn Pro Gly Lys Gly Asn Lys Leu Pro Leu Thr Ala Thr186018651870GGA ACA CTT AAT TAC ATC CTG TTT GGT GCA ATA ATG TTG GTT CTT GGG 5904Gly Thr Leu Asn Tyr Ile Leu Phe Gly Ala Ile Met Leu Val Leu Gly1875l8801885ACG CTG CTG TAT CTA GGG GTC AGA AGA AAA GCA GGA TTG AAA GAA AAA 5952Thr Leu Leu Tyr Leu Gly Val Arg Arg Lys Ala Gly Leu Lys Glu Lys189018951900ACC TTA TAA AAACAACGGA AAAGTGTGGC AGGGGAATAT CCCGCCACAC 6001Thr Leu1905TTTTTCGTTA TTATAAGGCA TTATTTGCTT GTAGATTAAG GATTCGCTAT 6051AGGTTATTTT GTGTAACGTA CATTACTTTT CCGTTGGGCC ATATTTATTT 6101TCCATACCGC TCATTTTTCT TTTCCATTGG GACCACATTT A 61423號序列的信息(i)序列特征(A)長度801個氨基酸(B)類型氨基酸(D)拓撲結構線性(ii)分子類型肽(xi)序列描述3號序列Met Lys Lys Arg Phe Gln Arg Gly Met Ala Gly Leu Leu Ser Ile Leu-30 -25 -20Leu lle Val Ser Met Phe Ala Gly Tyr Leu Pro Ala Arg Ala Ala Ala-15 -10 -5Glu Thr Gly Asp Lys Arg Ile Glu Phe Ser Tyr Glu Arg Pro Asp Gly1 5 l0 15Asn Tyr Glu Gly Trp Asn Leu Trp Val Trp Gly Thr Gly Val Lys Asp20 25 30Asp Gln Ile Asp Phe Thr Glu Phe Lys Glu Gly Lys Ala Tyr Ala Asp35 40 45Ile Ala Val Ser Asp Asn Ala Asp Lys Val Gly Phe Ile Ile Arg Lys50 55 60Gly Asp Trp Glu Glu Lys Asp Phe Asp Gly Asp Arg Ser Ile Thr Ile65 70 75 80Asn Lys Ile Asp Asn lle Thr Lys Val His Val Thr Ser Gln Gln Glu85 90 95Lys Phe Gly Gln Ile Pro Asp Gly Ser Pro Pro Val Val Ala Asp Gly100 105 110Asn Ala Asp Phe Phe Phe Arg Asp Lys Glu Leu Tyr Ala Ala Gly Glu115 l20 125Met Asp Lys Val Glu Lys Val Glu Leu Ser lle Leu Gly Glu Lys Tyr130 l35 140Glu Met Asn Gly Glu Pro Glu Lys Glu Arg Phe Thr Tyr Thr Leu Ser145 150 155 160Asp Leu Pro Thr Gly Glu His Glu Tyr Thr Tyr Leu Val Thr Val Asp165 170 175Gly Gln Thr Glu Glu Val Thr Asp Pro Tyr Asn Thr Val Asp Gly Arg180 185 190Ser Val Val Glu Tyr Val Thr Ser Asp Val Gln Val Ser Ala Ser Phe195 200 205Ile Pro Ala Lys Val Asp Tyr Asn Gln Asn Ala Val Val Lys Val Asp210 215 220Ile Glu Ser Glu Thr Glu Thr Lys Ile Arg Glu Met Ser Ile Asn Leu225 230 235 240Ser Glu Ile Gly Gly Lys Glu Lys Ala Thr Ile Asp Pro Ala Leu Asn245 250 255Glu Leu Thr Val Ala Val Lys Gln Gly Val Thr Ala Gly Val Lys Asn260 265 270Leu Pro Ile Thr Ala Ile Asp Glu Phe Gly Asn Arg His Glu Gly Ser275 280 285Ala Thr Leu Glu Val Gln Ala Arg Thr Ile Thr Gly Glu Lys Ala Asp290 295 300Phe Asp Trp Asp Gln Ser Val Val Tyr Phe Met Leu Thr Asp Arg Phe30 5310 315 320Phe Asp Gly Asp Ser Ser Asn Asn Asp Pro His Gly Ile Gly Tyr Asp325 330 335Thr Ser Lys Ser Gly Thr Tyr Gln Gly Gly Asp Phe Lys Gly Ile Thr340 345 350Gln Arg Leu Asp Tyr Leu Asp Glu Leu Gly Ile Asn Thr Ile Trp Ile355 360 365Ser Pro Val Val Asp Asn Ile Lys Phe Asp Val Arg His Ser Glu Gly370 375 380Pro Asp Thr Pro Tyr Tyr Ala Tyr His Gly Tyr Trp Ala Asp Asn Phe385 390 395 400Gly Glu Leu Asn Pro His Phe Gly Ser Met Ala Asp Phe His Glu Met
405 410 415Ile Asp Ala Ala His Glu Arg Gly Ile Lys Ile Met Val Asp Val Val420 425 430Leu Asn His Thr Gly Tyr Gly Leu Lys Pro Gly Asp Ser Ser Ser Val435 440 445Ala Asn Phe Pro Thr Asp Glu Asp Arg Ala Arg Phe Asp Gly Met Leu450 455 460Arg Asp Gly Gly Ser Gly Glu Val Arg Gly Glu Leu Ala Gly Leu Pro465 470 475 480Asp Phe Leu Thr Glu Asn Pro Asp Val Arg Glu Gln Val Val Gln Trp485 490 495Gln Thr Asp Trp Ile Glu Lys Ser Arg Thr Ala Lys Gly Asn Thr Ile500 505 510Asp Tyr Phe Arg Val Asp Thr Val Lys His Val Glu Asp Thr Thr Trp515 520 525Met Ala Phe Lys Asn Ala Leu Thr Lys Ala Met Pro Glu His Lys Leu530 535 540Ile Gly Glu Ala Trp Gly Ala Asn Val Asn Asp Asp Leu Gly Tyr Leu545 550 555 560Asn Ser Gly Met Met Asp Ser Leu Leu Asp Phe Asp Phe Lys Asn Tyr565 570 575Ala Arg Asp Phe Ala Asn Gly Gln Leu Asp Ala Val Gln Gln Lys Leu580 585 590Glu Ala Arg Asn Ser Lys Leu Asn Asn Thr Ala Thr Leu Gly Gln Phe595 600 605Leu Gly Ser His Asp Glu Asp Arg Phe Tyr Glu Val Val Glu Gly Asp610 615620Leu Gly Lys Tyr Gln Val Ala Ala Ser Leu Gln Leu Thr Ala Lys Gly625 630635640Gln Pro Val Ile Tyr Tyr Gly Glu Glu Leu Gly Leu Pro Gly Lys Asn645 650 655Asp Tyr Pro Tyr Tyr Thr Asn Arg Gln Asn Met Pro Trp Asp Asp Val660 665 670Asp Gly Asn Glu Ile Leu Glu His Tyr Gln Lys Leu Leu Ala Phe Arg675 680 685Asn Asp Asn Pro Asn Thr Phe Ala Lys Gly Asp Arg Lys Lys Val Ala690 695 700Gly Ser Asp Ser Glu Gly Tyr Leu Leu Phe Ser Arg Thr Tyr Gly Glu705 710 715 720Asn Ser Val Tyr Val Gly Leu Asn Thr Glu Ala Ala Ala Lys Asp Val725 730 735Thr Leu Asn Phe Gly Ser Ser Glu Ala Val Val Thr Asp Arg Tyr Ser740 745 750Gly Gln Glu Tyr Gln Ala Asn Glu Glu Gly Gln Val Thr Phe Ser Ile755 760 765Pro Ala Met Glu Asp Gly Gly Thr Val Leu Leu Glu Val Glu Asn Gly770 775 780Ala Val Pro Pro Val Glu Glu Glu Pro Thr Glu Pro Gly Glu Ile Glu785 790 795 800Glu4號序列的信息(i)序列特征(A)長度893個堿基對(B)類型核酸(D)拓撲結構線性(i i)分子類型肽(xi)序列描述4號序列Thr Val Pro Leu Ala Leu Val Ser Gly Glu Val Leu Ser Asp Lys Leu1 5 10 15Ile Ser Leu Thr Phe Thr Arg Thr Glu Gly Leu Asp Leu Glu Glu Leu20 25 30Lys Glu Gln Leu Glu Ile Lys Asp Val Asp Gly Asn Asp Val Ser Phe35 40 45Thr Asp Val Thr Ile Glu Gly Glu Lys Thr Val His Val His Gly Glu50 55 60Phe Asp Leu Glu Lys Ile Pro Phe Ser ValThr Tyr Leu Asp Arg Thr65 70 75 80Ile Ser Val Lys Ser Gly Trp Lys Leu Ile Asp Glu Met Tyr Ala Tyr85 90 95Asp Gly Lys Leu Gly Ala Glu Leu His Glu Asp Gly Thr Ala Thr Leu100 105 110Lys Val Trp Ser Pro Lys Ala Asp Asn Val Ser Val Val Leu Tyr Asp115 120 125Lys Val Asp Gln Asn Glu Val Val Asp Thr Ile Glu Met Val Lys Gly130 135 140Asp Arg Gly Val Trp Ser Val Lys Leu Thr Lys Asp Asn Thr Gly Leu145150155160Asp Ser Leu Lys Gly Tyr Tyr Tyr His Tyr Glu Ile Thr His Gly Asp165 170 175Val Thr Asn Leu Ala Leu Asp Pro Tyr Ala Lys Ser Met Ala Ala Trp180 185 190Asn Asn Glu Ala Gly Asp Lys Val Gly Lys Ala Ala Ile Val Asp Ile195 200 205Gly Ser IIe Gly Pro Glu Leu Asp Tyr Ala Asp Ile Pro Gly Phe Glu210 215 220Lys Arg Glu Asp Thr Ile Ile Tyr Glu Val His Val Arg Asp Phe Thr225 230 235 240Ser Asp Pro Asn Ile Gly Glu Asp Leu Lys Ala Gln Phe Gly Thr Phe245 250 255Ala Ser Phe Val Glu Lys Leu Asp Tyr Ile Gln Glu Leu Gly Val Thr260 265 270His Ile Gln Leu Leu Pro Val Met Ser Tyr Tyr Phe Ser Asn Glu Phe275 280 285Glu Ser G1y Glu Arg Met Leu Glu Tyr Ala Ser Thr Gly Thr Asn Tyr290 295 300Asn Trp Gly Tyr Asp Pro His Asn Tyr Phe Ser Leu Ser Gly Met Tyr305 310 315 320Ser Glu Asn Pro Glu Asp Pro Glu Leu Arg Ile Lys Glu Phe Lys Asn325 330 335Leu Ile Ash Glu Ile His Lys Arg Asp Met Gly Val Val Leu Asp Val340 345 350Val Phe Asn His Thr Ala Gln Val His Ile Phe Glu Asp Leu Val Pro355 360 365Asn Tyr Tyr His Phe Met Asp Ala Asp Gly Thr Pro Arg Thr Ser Phe370 375 380Gly Gly Gly Arg Leu Gly Thr Thr His Glu Met Ser Arg Arg Val Leu385 390 395 400Val Asp Ser Ile Lys His Trp Val Asp Glu Tyr Lys Val Asp Gly Phe405 410 415Arg Phe Asp Met Met Gly Asp His Asp Ala Glu Ser Ile Gln Ile Ala420 425 430Phe Asp Glu Ala Lys Lys Leu Asn Pro Asn Ile Val Met Ile Gly Glu435 440 445Gly Trp Val Thr Phe Ala Gly Asp Glu Gly Glu Pro Val Gln Ala Ala450 455 460Asp Gln Gln Trp Met Gln Tyr Thr Glu Ala Val Gly Ser Phe 5er Asp465 470 475 480Glu Phe Arg Asn Glu Leu Lys Ser Gly Phe Gly Ser Glu Gly Gln Pro485 490 495Arg Phe Ile Thr Gly Gly Ala Val Asn Val Gln Gln Ile Phe Asp Asn500 505 510Ile Lys Ala Gln Pro His Asn Phe Met Ala Asp Gln Pro Gly Asp Val515 520 525Val Gln Tyr Ile Glu Ala His Asp Asn Leu Thr Leu Tyr Asp Val Ile530 535 540Ala Gln Ser Ile Lys Lys Asp Pro Glu Ile Ala Glu Asn Asp Leu Glu545 550 555 560Ile His Lys Arg Ile Arg Val Gly Asn Ala Met Val Leu Thr Ser Gln565 570 575Gly Thr Ala Phe Leu His Ala Gly Gln Glu Phe Gly Arg Thr Lys Gln580 585 590Trp Arg Ala Pro Ala Thr Glu Ala Pro Tyr Lys Ser Thr Tyr Met Thr595 600 605Asp Ala Asp Gly Asn Pro Phe Val Tyr Pro Tyr Phe Ile His Asp Ser610 615 620Tyr Asp Ser Ser Asp Ile Ile Asn Arg Phe Asp Trp Glu Lys Ala Thr625 630 635 640Asp Ala Glu Lys Tyr Pro Val Asn Asn Val Thr Arg Asp Tyr Thr Ala645 650 655Gly Leu Ile Glu Leu Arg Arg Ser Ser Asp Ala Phe Arg Leu Gly Ser660 665 670Arg Glu Leu Val Asp Ser Asn Val Thr Met Val Asp Ala Pro Glu Ile675 680 685Lys Glu Gln Asp Leu Val Val Ala Tyr Arg Ser Val Ser Thr Ala Gly
690 695 700Val Glu Tyr Tyr Thr Phe Val Asn Ala Asp Thr Ser Ser Arg Thr Leu705 710 715 720Thr Leu Gly Gln Asp Leu Thr Glu Gly Val Val Val Val Asp Ala Glu725 730 735Glu Ala Asn Val Ala Gly Val Ala Glu Pro Ala Gly Phe Glu Leu Thr740 745 750Ala Glu Gly Ile Thr Leu Glu Pro Leu Thr Thr Val Val Val Arg Val755 760 765Gly Glu Gln Glu Gly Thr Asp Pro Gly Asp Gly Asp Gly Asp Gly Asn770 775 780Thr Pro Pro Pro Gly Asp Gly Asp Gly Asp Gly Asn Thr Pro Pro Pro785 790 795 800Gly Asp Gly Asp Gly Asp Gly Asn Thr Pro Pro Pro Gly Asn Gly Asn805 810 815Gly Asn Asn Pro Gly Thr Pro Pro Gly Lys Gly Gly Glu Asn Pro Gly820 825 830Lys Gly Lys Asn Asp Lys Thr Pro Pro Gly Lys Gly Gly Asp Asn Pro835 840 845Gly Lys Gly Asn Lys Leu Pro Leu Thr Ala Thr Gly Thr Leu Asn Tyr850 855 860Ile Leu Phe Gly Ala Ile Met Leu Val Leu Gly Thr Leu Leu Tyr Leu865 870 875 880Gly Val Arg Arg Lys Ala Gly Leu Lys Glu Lys Thr Leu885 890
權利要求
1.一種DNA片段,該片段編碼一種顯示出堿性支鏈淀粉酶和堿性α-淀粉酶活性的堿性淀粉支鏈淀粉酶。
2.如權利要求1所限定的DNA片段、該片段編碼1號序列的氨基酸序列。
3.一種DNA片段,該片段編碼顯示出堿性α-淀粉酶活性和堿性支鏈淀粉酶活性并具有修飾過的1號序列所描述的氨基酸序列的蛋白質,其中所述修飾是以取代、添加、缺失、反向、或者插入一個或多個氨基酸的方式進行的。
4.堿性α-淀粉酶,該淀粉酶具有3號序列所描述的氨基酸序列。
5.一種DNA片段,該片段編碼具有3號序列所描述的氨基酸序列的堿性α-淀粉酶。
6.一種DNA片段,該片段編碼顯示出堿性α-淀粉酶活性的并具有修飾過的3號序列所描述的氨基酸序列的蛋白質,其中所述的修飾該是以取代、添加、缺失、反向、或者插入一個或多個氨基酸的方式進行的。
7.一種堿性支鏈淀粉酶,該淀粉酶具有4號序列所描述的氨基酸序列。
8.一種DNA片段,該片段編碼具有4號序列所描述的氨基酸序列的堿性支鏈淀粉酶。
9.一種DNA片段,該片段編碼顯示出堿性支鏈淀粉酶活性的蛋白質并且具有修飾過的4號序列所描述的氨基酸序列的蛋白質,其中所述的修飾該是以取代、添加、缺失、反向、或者插入一個或多個氨基酸的方式進行的。
10.一種如權利要求1、2、3、5、6、8、9或10之任一所限定的DNA片段,該片段還包含能夠調節基因表達的核苷酸序列。
11.一種重組DNA,該DNA包含如權利要求1、2、3、5、6、8、9或10之任一所描述的DNA片段。
12.一種轉化過的微生物,該微生物包含權利要求11的重組DNA。
13.一種用于產生堿性淀粉支鏈淀粉酶、堿性α-淀粉酶或者堿性支鏈淀粉酶的方法,該方法包括培養權利要求12的轉化過的微生物和分離由該微生物產生的堿性淀粉支鏈淀粉酶、堿性α-淀粉酶或堿性支鏈淀粉酶。
14.一種DNA片段,該片段與互補于2號序列的DNA序列雜交。
15.一種蛋白質,該蛋白質由權利要求14的DNA片段編碼。
16.一種DNA片段,該片段與互補于2號序列的cDNA序列雜交,其中所說的片段編碼具有堿性支鏈淀粉酶活性和/或者堿性α-淀粉酶活性的蛋白質。
17.一種蛋白質,該蛋白質由權利要求16的DNA片段編碼。
全文摘要
本發明提供了一種編碼顯示出堿性α-淀粉酶活性的堿性支鏈淀粉酶的DNA片段、具有3號序列所描述的氨基酸序列和編碼該淀粉酶的DNA片段的堿性α-淀粉酶、具有4號序列所描述的氨基酸序列和編碼該支鏈淀粉酶的DNA片段的堿性支鏈淀粉酶、包含所述DNA片段的重組DNA以及包含該重組DNA的轉化過的微生物。本發明的技術使得可以大量生產顯示出堿性α-淀粉酶活性的堿性支鏈淀粉酶。
文檔編號C12N9/24GK1183808SQ96193821
公開日1998年6月3日 申請日期1996年5月10日 優先權日1995年5月10日
發明者秦田勇二, 五十嵐一曉, 尾崎克也, 荒勝俊, 川合修次, 伊藤進 申請人:花王株式會社