專利名稱::生物素生物合成基因Ⅱ的制作方法
技術領域:
:本發明涉及利用基因工程有機體通過發酵產生生物素的方法。生物素是動物、植物和微生物營養的必需維生素之一,而且對于醫藥或者是食品添加劑也是十分重要的。充分研究了大腸桿菌的生物素生物合成,并且闡明生物素是從pimelyl輔酶A經7-酮基-8-氨基壬酸(KAPA)、7,8-二氨基壬酸(DAPA)和脫硫生物素(DTB)合成的[大腸桿菌和沙門氏菌,細胞和分子生物學,544,(1987)]。在大腸桿菌[生物化學雜志,263,19577,(1988)]和圓形芽孢桿菌上(美國專利5096823)和生物素的生物合成相關的遺傳信息分析已有很好的進展。至少知道了這個生物合成途徑包括的四種酶。這四種酶是由bioA、bioB、bioD和bioF基因編碼。bioF基因編碼催化把pimelyl輔酶A轉化為KAPA的KAPA合成酶。bioA基因編碼把KAPA轉化成為DAPA的DAPA轉氨酶。bioD基因編碼把DAPA轉化成為DTB的DTB合成酶。bioB基因編碼把DTB轉化成為生物素的生物素合酶。同時也報告了在大腸桿菌中參與pimelyl輔酶A合成的bioC和bioH基因。進行了許多發酵產生生物素的研究。利用了大腸桿菌(日本專利公開149091/1986和日本專利公開155081/1987)、圓形芽孢桿菌(日本專利公開180174/1991)、粘質沙雷氏菌(日本專利公開27980/1990)和Brevibacteriumflavum(日本專利公開240489/1991)。但是由于它們的生產力低,這些方法還不適合用于工業生產過程。此外,大量的DTB(生物素前體)在這些細菌的發酵中積累。因此,已經假定生物素生物合成的最后步驟(從DTB到生物素)是一個限速步驟。另一方面,發現屬于庫爾特氏桿菌屬的細菌菌株產生DBT和少量的生物素。而且通過對生物素抗代謝物酸酶素(ACM)的抗性、5-(2-噻吩基)-頡草酸(TVA)和α-甲基脫硫生物素(MeDTB)的抗性的選擇,從庫爾特氏桿菌屬的野生型菌株中分離出產生大量生物素的突變體。然而,鑒于仍然低的生物素值,最好是運用基因工程提高這種突變體的生物素產量。因此本發明涉及攜帶和Kurthiasp.生物素生物合成相關的基因的染色體DNA片段。此分離的染色體DNA片段攜帶bioA,bioB,bioC,bioD,bioF,bioFII,bioH和bioHII等8個基因和轉錄調節序列。bioFII基因編碼bioF基因產物的酶。本發明還涉及Kurthiasp.菌株,其中至少擴增了一個參與生物素生物合成的基因,同時也涉及通過基因工程Kurthiasp.菌株產生生物素的方法。雖然以上提及的DNA片段可以具有各種起源,但優選的是利用屬于庫爾特氏桿菌屬的菌株。這些菌株的特定例子包括,例如,Kurthiasp.538-6(DSM9454)和通過選擇對生物素抗代謝物的抗性的突變菌株,如Kurthiasp.538-KA26(DSM10609)。一般地說,本發明針對編碼以SEDIDNO.2、4、6、8、10、12、14或16為代表的多肽和這些多肽的包含一個或多個氨基酸殘基的加成、插入、缺失和/或取代的功能性衍生物的DNA序列,以及包含一個或多個這些DNA序列的載體,其中所說的DNA序列和啟動子序列功能性地連接。本發明的另一個目的是研究由以上所限定的一個或多個DNA序列或載體轉化的細胞和產生生物素的方法(包括在培養基中培養以上限定的細胞和用本領域公知的方法從培養基中分離最后產生的生物素),并且具體地說,這種方法是在pH值5至9,優選的是6至8下,于10℃至45℃,優選的是25℃至30℃的溫度范圍內將培養進行1至10天,優選的是2至7天。最后本發明的目的也在于研究制備藥學、食品或飼料組合物的方法,這種方法的特征在于把通過這些方法獲得的生物素與一種或多種通常使用的添加劑混合,本領域的技術人員熟知這種方法。分離攜帶編碼參與這些細菌菌株進行生物素生物合成的酶之基因的DNA片段的詳盡的方法在以下的部分進行描述。因此通過已知的苯酚法可以把DNA從Kurthiasp.538-KA26提取出來。然后,用SauSAI部分消化這種DNA,并將其連接到用BamHI消化的pBR322;以構建一個Kurthiasp.538-KA26的基因文庫。用以上獲得的基因文庫轉化缺乏生物合成能力的生物素營養缺陷型突變體,以產生生物素的,選擇表現為生物素原養型的轉化體。在生物素營養缺陷型突變體中選擇的轉化體具有基因組的DNA片段(這種DNA片斷補充了缺失的基因)。大腸桿菌R875(bioB-)、R877(bioD)、BM7086(bioH)和R878(bioC)(細菌學雜志,112,830-839,(1972),和細菌學雜志,143,789-800,(1980))都能用作生物素素營養缺陷型突變體。按照常規的方法,例如感受態細胞法,進行這些大腸桿菌菌株的轉化[分子克隆,冷泉港實驗室出版社,252,(1982)]。在本發明中,通過以上所描述的方法獲得了補充大腸桿菌bioB缺失突變體的雜交質粒。獲得的雜交質粒命名pKB100。pKB100攜帶一個Kurthiasp.538-KA26的5.58Kb基因組DNA片段的質粒pBR322相對應,它的限制切割圖譜如圖1和圖2所示。通過以上所述的方法也獲得了命名為pKB200的補充大腸桿菌的bioD缺失突變體的雜交質粒。PKB200和Kurthiasp.538-KA26的攜帶一個7.87Kb基因組DNA片段的質粒pBR322相對應,它的限制切割圖譜如圖1和圖3所示。pKB200中的基因組DNA片段和pKB100的插入片段完全重疊,并且攜帶4bioF、bioB、bioD、ORF1和ORF2基因和如圖9-A所示的Kurthiasp.538-KA26的一部分bioA基因。通過常規的方法(如菌落雜交)利用在pKB200中一部分基因組DNA片段作為探針,能夠分離Kurthiasp.538-KA26的整個bioA基因。用限制性內切酶如HindIII消化Kurthiasp.538-KA26的總DNA,并且用相同的限制性內切酶切割的質粒載體連接。然后,大腸桿菌用攜帶Kurthiasp.538-KA26的基因組DNA片段的雜交質粒轉化以構建基因組文庫。pUC19[TakaraShuzo公司(Higashiira,Higashinotohin,Shimogyo-Mu,Kyoto-shi,日本)]和大腸桿菌JM109(TakaraShuzo公司)都能分別用作載體與大腸桿菌菌株。通過菌落雜交獲得了命名為pKB300的攜帶Kurthiasp.538-KA26的8.44Kb基因組DNA片段的雜交質粒,它的限制切割圖譜如圖1所示。在pKB300中的攜帶參與Kurthiasp.538-KA26的生物素生物合成的兩個基因簇的基因組DNA片段如圖9-A所示。一個族由ORF1、bioD和bioA基因組成。另一個族由ORF2、bioF和bioB基因組成。bioD和bioA基因的核苷酸序列分別顯示在SEQIDNO.1和SEQIDNO.3中。推測的bioD和bioA基因的氨基酸序列產物分別顯示在SEQIDNO.2和SEQIDNO.4中。編碼236個氨基酸殘基的多肽(分子量為26,642)。bioA基因編碼一個460個氨基酸殘基的多肽(分子量為51,731)。ORF1基因編碼一個194個氨基酸殘基的多肽(分子量為21,516),但是此基因的產物的生物功能還不清楚。BioF和bioB基因的氨基酸序列分別顯示在SEQIDNO.5和SEQIDNO.7中。推測的BioF和bioB基因產物的氨基酸序列分別顯示在SEQIDNO.6和SEQIDNO.8中。bioF基因編碼一個387個氨基酸殘基的多肽(分子量為42,619)。bioB基因編碼一個338個氨基酸殘基的多肽(分子量為37,438)。ORF2基因編碼一個63個氨基酸殘基的多肽(分子量為7,447),但是此基因產物的生物功能還不清楚。在bioA和bioB基因的下游發現作為轉錄終止區信號的反向重復序列。發現在ORF1和ORF2基因之間有兩個在兩個方向開始轉錄的轉錄啟動子序列(如圖10所示)。而且,在每種啟動子序列和翻譯起始密碼子之間有兩個命名為Box1和Box2、參與轉錄負調節的反向重復序列。另外,通過以上描述的相同方式得到了補充大腸桿菌生物素營養缺陷型突變體的兩個雜交質粒。命名為pKH100的雜交質粒補充bioH缺失突變體,命名為pKC100的雜交質粒補體bioC突變體。pKH100(圖4和圖5)有一個Kurthiasp.538-KA26的1.91Kb的基因組DNA片段,其攜帶在圖9-B中所示的由bioH和ORF3基因組成的的基因簇。bioH基因的核苷酸序列和這種基因產物的推測的氨基酸序列分別顯示在SEQIDNO.9和SEQIDNO.10中。bioH基因編碼一個267個氨基酸殘基的多肽(分子量為29,423)。ORF3基因編碼一個86個氨基酸殘基的多肽(分子量為9,995),但是這種基因產物的生物功能還不知道。如圖11所示在bioH基因的上游發現一個啟動子序列,在ORF3基因的下游有作為轉錄終止子的反向重復序列。因為在啟動子區域沒有如Box1和Box2的反向重復序列,所以可以預見這些基因的表達是不被調節的。另一方面,pKC100攜帶Kurthiasp.538-KA26的6.76Kb基因組DNA片段(如圖6和圖7所示)。在pKC100中的基因組DNA片段攜帶一個由bioFII、bioHII和bioC基因組成的基因簇,如圖9-C所示。bioHII和bioFII基因分別為bioH和bioF基因編碼酶的基因,因為bioHII和bioFII基因分別補充了大腸桿菌的bioH缺失和bioFII缺失突變體。bioHII、bioFII和bioC基因的核苷酸序列分別顯示在SEQIDNo.11、SEQIDNO.13和SEQIDNO.15中。推測的bioHII、bioFII和bioC基因產物的氨基酸序列分別顯示在SEQIDNO.12、SEQIDNO.14和SEQIDNO.16中。BioFII基因編碼一個398個氨基酸殘基的多肽(分子量為44,776)。BioHII基因編碼一個248個氨基酸殘基的多肽(分子量為28,629)。BioC基因編碼一個276個氨基酸殘基的多肽(分子量為31,599)。如圖12所示在bioFII基因的上游發現一個啟動子序列,在啟動子區域有一個命名為Box3的反向重復序列上。這些基因的轉錄終止在位于bioC基因下游的反向重復序列,因為Box3的核苷酸序列和Box1和Box2的核苷酸序列非常類似,所以估計這些基因表達的調節和bioA和bioB基因簇的相同。更不用說,從以上基因分離出的核苷酸序列和氨基酸的序列在某些情況下可以人工改變,例如,起始密碼子GTG或TTG可以轉化成為ATG密碼子。因此,本發明也直接針對本發明的多肽的功能性衍生物。在本發明的氨基酸序列的基礎上通過添加、插入、缺失和/或取代一個或多個這些序列的氨基酸殘基來限定這些功能性衍生物(其中的這些衍生物還具有和本發明的相應的多肽相同類型的酶活性)。利用本領域公知的分析方法或本文以下的描述來測定其活性。也將以通過本領域公知的化學肽合成方法或在本文所公開的DNA序列基礎上的重組方式(由Sambrook等公開的、本領域?公知的方法)(分子克隆,冷泉港實驗室出版社,紐約,美國,第二版1989)合成這些功能性衍生物。本領域已知在蛋白質和多肽中一般不改變該分子的活性的氨基酸變化,并且,例如由H.Neurath和R.L.HILL在“蛋白質”中描述過(Academix出版社,紐約,1979,尤其參見14頁圖6)。最普遍發生的變化是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、AZa/Thr、Ser/Asn、AlaNal、Ser/Gly、Thy/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Nal、Ala/Glu和Asp/Gly以及相反的變化。進而,本發明不僅直接針對于如在序列表中公開的DNA序列以及它們的互補鏈,而且也直接針對于那些包括以下的序列,即在標準的條件下同以上DNA序列或其片段雜交的DNA序列、和由于遺傳密碼的退化在標準的條件下不能和以上序列雜交但其的確編碼具有相同的氨基酸序列多肽的DNA序列。在此文中雜交的″標準條件″意味著本領域技術人員檢測特異性的雜交信號普遍使用的條件,和如Sambrook等(同上)描述的條件或者優選地稱為嚴格雜交和非嚴格的洗滌條件或者本領域技術人員公知的更優選地稱為嚴格雜交和非嚴格洗滌條件及Sambrook等(同上)描述的條件。源于本發明的DNA序列,因為它們和這些DNA序列(參見上文)雜交或者能通過使用以這些DNA序列為基礎設計的引物利用聚合酶鏈反應構建而成,所以可以通過PCR反應以及位點直接誘變[參見Smith,Ann.V.Genet.19,423(1985)]或者如在EP747483中描述的合成方法或者通過Sambrook等(同上)中描述的分子克隆常用的方法來制備。至于用于本發明的表達和/或DNA序列擴增的宿主菌株,任何微生物都可以利用,例如在EP635572中鑒別出來的,但更優選的是利用屬于庫爾特氏桿菌屬的菌株,尤其是Kurthiasp.538-6(DSMNO.9454)4和Kurthiasp.538-51F9(DSMNO.10610)。為了獲得高生物素生產力的轉化體,在這些宿主細胞中有效的啟動子控制下利用了本發明的DNA序列。本發明的DNA序列能通過攜帶這些DNA序列的質粒轉化以引入宿主細胞或者整合到宿主細胞的染色體上。當Kurthiasp.538-51F9用作宿主細胞時,Kurthiasp.538-51F9可以用從以上Kurthiasp.菌株中分離出來的攜帶至少一個參與生物素生物合成的基因之雜交質粒來轉化。至于用作雜交質粒的載體質粒,pUB110[細菌學雜志,154,1184-1194,(1983)]、pHP13(mol.Gen.Genet.,209,335-342,1987)或在Kurthiasp.菌株中其它的包含復制起點的功能質粒都可以使用。至于在Kurthiasp.中用作擴增和/或表達的DNA序列,本發明的任何DNA序列都能加以利用,但是與編碼生物素合酶的bioB基因相應的DNA序列是優選的。這種雜交質粒的實施例是在圖14中所示的pYK114。在這種質粒中,bioB基因處于bioH基因的啟動子調節下并且攜帶pUB110的復制起點。可以利用通過原生質體轉化方法獲得的以上所述的pYK114轉化Kurthiasp.538-51F9[用于芽孢桿菌屬的分子生物方法,150,(1990)]。然而,由于Kurthiasp.538-51F9從原生質體的再生效率很低,這種菌株的轉化效率十分低。因此,優選的是利用具有由原生質體再生效率高的菌株,如本發明的實施例14中所描述的方法制備的Kurthiasp.538-51F9-RG21。本發明也提供了通過培養所獲得的轉化體、分離和純化產生的生物素來生產生物素的方法。利用本領域公知的方法培養本發明的轉化體。可以利用包含可同化的碳源、可消化的氮源、無機鹽和其它的轉化體的生長所必需的營養的培養基。至于碳源,如葡萄糖、果糖、乳糖、半乳糖、蔗糖、麥芽糖、淀粉、糊精或者甘油都可以使用。至于氮源,如胨、大豆粉、玉米漿、肉膏、銨硫酸鹽、硝酸銨、尿素或者以上各種的混合物都可以使用。并且,至于無機鹽,硫酸鹽,鹽酸硫胺素或者鈣、鎂、鋅、錳、鈷和鐵的磷酸鹽都可以使用。如果需要的話,可以添加常規的營養成分或者消泡劑(如動物油、植物油或者礦物油)。如果所獲得的轉化體具有抗生素抗性標記,各自的抗生素應該補充到培養基中。培養基的pH值可以在5至9之間,優選的為6-8。培養溫度可以是10℃-45℃,優選的是25℃-30℃。培養時間為是1至10天,優選地2至7天。通過本領域公知的方法很容易地回收以上所述條件下產生的生物素。因此,例如,在固體材料從溶液中除去之后,把在濾液中的生物素吸附在活性碳上,然后洗脫,用離子交換樹脂進一步純化。另外,把濾液直接用離子交換樹脂純化,在洗脫之后,把所要求的產物從酒精和水的混合物中重結晶出來。在引用下面的實施例詳細地解釋本發明之前,給出附圖的簡要描述圖.1pKB100、pKB200和PKB300的限制性圖譜。圖.2pKB100的結構。圖.3pKB200的結構。圖.4pKH100、pKH101和pKH102的限制性圖譜和互補結果。圖.5pKH100的結構。圖.6pKC100、pKC101和pKC102的限制性圖譜。圖.7pKC100的結構。圖.8由pKB100、pKB200和pKB300衍生的質粒的結構。圖.9參與Kurthiasp.538-KA26生物素生物合成的基因簇基因結構。圖.10Kurthiasp.538-KA26中ORF1和ORF2基因之間的核苷酸序列。圖.11bioH基因簇啟動子區的核苷酸序列。圖.12bioFII基因簇啟動子區的核苷酸序列。圖.13穿梭載體pYK1的構建體。圖.14bioB表達質粒pYK114的構建體。實施例實施例1克隆Kurthiasp.538-KA26的bioB和bioF基因。1.基因組文庫的制備。把Kurthiasp.538-KA26(DSMNO.10609)的酸霉素抗性菌株培養在100ml的營養肉湯中(KyokutoSeiyakuCO;Honcho31,Nihonbashi,Chuoh-Ku,東京,日本),在30℃培養過夜,通過離心回收細菌細胞。利用酚提取法[基因熔合試驗,冷泉港實驗室,137-138,(1984)]從細菌細胞提取總DNA,獲得了1.9mg的總DNA。將總DNA(10μg)用1.2單位的SauSAI在37℃下部分地消化1小時以產生大約10kb長的片段。通過凝膠電泳獲得了5-15KbDNA片段。將載體pBR322(TakaraShuzo公司)用BamHI完全消化,然后利用堿性磷酸酶處理以避免自身連接。利用DNA連接試劑盒(TakaraShuzo公司)按照廠商的說明,用切割的pBR322連接DNA片段。利用感受態細胞法[分子克隆,冷泉港實驗室,252-253,(1982)]把連接混合物轉移到大腸桿菌JM109(TakaraShuzo公司)中,在瓊脂平面LB培養基(1%Bacto-胰胨、0.5%Bacto-酵母抽提物、0.5%NaCl、pH7.5)上選擇對氨芐青霉素(100μg/ml)具有抗性的菌株。大約獲得了5000個具有基因組DNA片段的克隆體,把它們作為基因文庫。把Kurthiasp.538-KA26的基因組文庫中氨芐青霉素抗性的菌株,在包含100μg/ml氨芐青霉素的50mlLB培養基中37℃培養過夜,通過離心收集細菌細胞。利用堿變性方法[分子克隆,冷泉港實驗室,90-91,(1982)]從細菌細胞中提取質粒DNA。2.從基因文庫選擇攜帶bioB基因的克隆。利用感受態細胞法把質粒DNA轉移到大腸桿菌的沒有生物素合成酶活性的bioB缺失突變體R875(J.Bacteriol.112,830-839,1972)。轉化的大腸桿菌R875細胞用0.85%NaCl洗滌兩次,并且平板接種在含有100μg/ml氨芐青霉素的100M9CT培養基(0.6%NaH2PO4、0.3%KH2PO4、0.1%NH4Cl、2mMMgSO4、0.1mMCaCl2、0.2%葡萄糖、0.6%無維生素的酪蛋白氨基酸、1μg/mlthiamin)中,把此平板在37℃下培養40小時。獲得了具有生物素原養型表型的轉化體。把轉化體培養在含有100μg/ml氨芐青霉素的LB培養基上,從細胞中提取雜交質粒。此雜交質粒攜帶5.58Kb的插入片斷,并命名為pKB100。限制性圖譜如圖1和圖2所示。3.用pKB100補充大腸桿菌生物素缺失突變體。利用感受態細胞法把pKB100轉移到大腸桿菌R875(bioB-)、W602(bioA-)、R878(bioC-)、R877(bioD-)、R874(bioF-)或BM7086(bioH-)[細菌學雜志,112,830-839,(1972),和細菌學雜志,143,789-800,(1980)]的生物素缺失突變體中。轉化的突變體用0.85%NaCl洗滌三次,并在包含100μg/ml氨芐青霉素和0.1ng/ml生物素的M9CT瓊脂培養基中平板接種,把平板在37℃培養過夜。把平板上的菌落復制在具有100μg/ml氨芐青霉素、存在或缺乏0.1ng/ml生物素的M9CT瓊脂平板中,把平板在37℃培養24小時以完成互補作用分析。如表1所示,pKB100不僅能補充bioB突變體,而且能補充bioF突變體。相反,bioA、bioC、bioD和bioH突變體不能由pKB100補充。從這個結果中可以確認pKB100攜帶Kurthiasp.538-KA26的bioB和bioF基因。表1</tables></tables>實施例2攜帶Kurthiasp.538-KA26的bioD基因的雜交質粒之分離。1.攜帶bioD基因的雜交質粒之分離。把實施例1-1中的Kurthiasp.538-KA26的基因文庫轉移到大腸桿菌bioD缺失突變體R877中,以和實施例1-2中所描述的相同方式選擇具有氨芐青霉素抗性和生物素原養型表型的轉化體。把轉化體在具有100μg/ml氨芐青霉素的LB培養基中37℃下培養過夜。然后通過離心收集細菌細胞。利用堿變性方法從細胞中提取質粒DNA。雜交質粒具有7.87Kb插入DNA片段,把它命名為pKB200。利用各種限制性核酸內切酶(HindIII、NcoI、EcoRI、BglII、SalI和PstI)分析pKB200的切割模型,并把它和pKB100的相比較。限制性核酸內切酶分析表明兩個雜交質粒有完全相同的切割位點,并且1.5KbDNA片段延伸到pKB100左側,0.8Kb片段延伸到pKB200的右側(圖1和圖3)。2.用pKB200補充大腸桿菌生物素缺失突變體。把pKB200轉移到大腸桿菌R875(bioB-)、W602(bioA-)、R878(bioC-)、R877(bioD-)、R874(bioF-)或BM7086(bioH-)的生物素缺失突變體中。利用實施例1-3中所描述的方法進行互補作用分析。pKB200補充bioD和bioB突變體,但是不能補充bioA、bioC、bioF和bioH突變體。盡管pKB200在整個長度的pKB100上重疊,但是它不能補充bioF突變體。實施例3攜帶Kurthiasp.538-KA26bioH基因的雜交質粒的分離。1.攜帶bioH基因的雜交質粒之分離。把實施例1-1中的Kurthiasp.538-KA26的基因文庫轉移到大腸桿菌bioH缺失突變體BM7086中,以和實施例1-2中所描述的相同方式選擇具有bioH克隆的轉化體,利用堿變性方法從轉化體細胞中提取雜交質粒,并利用限制性核酸內切酶分析雜交質粒。雜交質粒具有1.91Kb的插入DNA片段,把它命名為pKH100。由于以上所利用的基因文庫具有5-15Kb基因組DNA片段,所以可以認為在大腸桿菌菌株中pKH100易受到修飾(如缺失)。pKH100的限制性圖譜如圖4和圖5所示。pKH100的斷裂模式與pKB100和pKB200斷裂模式是完全不同的。因此,pKH100攜帶了不同于pKB100和pKB200的Kurthia染色體的DNA片段。2.用pKB200補充大腸桿菌的生物素缺失突變體。利用實施例1-3中所描述的方法進行互補作用分析。把pKH100轉移到大腸桿菌R875(bioB-)、W602(bioA-)、R878(bioC-)、R877(bioD-)、R874(bioF-)或BM7086(bioH-)的生物素缺失突變體中。pKH200只補充bioH和bioB突變體,但是不能補充bioB、bioA、bioC、bioD和bioF突變體(如表1所示)。這樣,pKH100只攜帶了bioH基因。實施例4攜帶Kurthiasp.538-KA26bioC基因的雜交質粒的分離。1.攜帶bioC基因的雜交質粒的分離。把實施例1-1中的Kurthiasp.538-KA26的基因文庫轉移到大腸桿菌bioD缺失突變體R878中,以和實施例1-2中所描述的相同的方式選擇生物素原養型的、具有bioC克隆的轉化體,利用堿變性方法從轉化體細胞中提取雜交質粒,并利用限制性核酸內切酶分析雜交質粒。雜交質粒具有一個6.76Kb的插入DNA片段,把它命名為pKC100。pKC100的限制性圖譜如圖6和圖7所示。pKC100的斷裂模式與pKB100、pKB200和pKH100的斷裂模式是完全不同的。因此,pKC100攜帶了不同于pKB100、pKB100和pKH100的Kurthia染色體區域。2.用pKC100補充大腸桿菌的生物素缺失突變體。利用實施例1-3中所描述的方法進行互補作用分析。把pKC100轉移到大腸桿菌R875(bioB-)、W602(bioA-)、R878(bioC-)、R877(bioD-)、R874(bioF-)或BM7086(bioH-)的生物素缺失突變體中。PKC100補充如表1所示的bioC、bioF和bioH突變體。由于在pKC100中插入的DNA片段不同于pKB100和pKH100中的插入片斷,所以pKC100不僅攜帶了bioC基因,而且攜帶了bioF基因產物(KAPA合成酶)和bioH基因產物的同工酶基因。實施例5攜帶Kurthiasp.538-KA26bioA基因的雜交質粒的分離。1.pKB200中染色體DNA左區的分離。通過雜交方法,我們從Kurthiasp.538-KA26染色體DNA中分離出pKB200的染色體DNA左區。Kurthiasp.538-KA26的總DNA用HindIII完全消化并且進行瓊脂糖凝膠電泳。在凝膠上的DNA片段變性后按照廠商介紹的方法轉移到尼龍膜(Hybond-N,Amersham)上。用NcoI完全消化pKB200,通過瓊脂糖凝膠電泳分離出2.1Kb的NcoI片段(圖1)。通過多引物DNA標記系統(Amersham)用32P標記NcoI片段并且把它作為雜交探針。利用“快速雜交緩沖液”(Amersham)按照廠商的說明在上面制備的膜上進行雜交。探針同大約8.5Kb的HindIII片段強烈雜交。為了分離出8.5Kb的片段,整個Kurthiasp.538-KA26的DNA用HindLII完全消化,通過瓊脂糖凝膠電泳獲得7.5-9.5Kb的DNA片段。pUC19(TakaraShuzo公司)載體質粒用HindIII完全消化,并且用堿性磷酸酶處理以免自身連接。7.5-9.5KbDNA片段用切開的pUC19通過DNA連接試劑盒(TakaraShuzo公司)連接,利用感受態細胞法把反應混合物轉移到大腸桿菌JM109中。獲得大約1,000個攜帶這些基因組DNA片段的單獨克隆體,并把它作為基因文庫。按照Maniatis等描述的方案利用菌落雜交的方法進行選擇[分子克隆,冷泉港實驗室,312-328,(1982)]。在瓊脂平板上生長的菌落轉移到尼龍膜上(Hybond-N,Amersham),并用堿裂解。變性的DNA固定在膜上。把以上描述制備的32P標記的NcoI片段作為雜交探針,利用“快速雜交緩沖液”(Amersham)按照廠商的說明進行雜交。獲得和探針DNA雜交的三個菌落,用堿變性方法提取這些菌落中的雜交質粒。利用限制性內切酶(BamHI、HindIII、NcoI、EcoRI、BglII、SalI和PstI)進行結構分析。所有三個雜交質粒都有8.44Kb插入的DNA片段,三個雜交質粒都具有完全相同的斷裂模式。這些結果表明它們是相同的。這個雜交質粒命名為pKB300。pKB300的限制性圖譜如圖1所示。在pKB300中大約一半長度的基因組DNA片段和pKB200的重疊。2.用pKB300補充大腸桿菌的bioA缺失突變體。利用實施例1-3中所描述的方法對帶有pKB300的大腸桿菌W602(bioA-)進行互補作用分析。由于pKB3100補充bioA突變體(表1),所以pKB300攜帶了Kurthiasp.的bioA基因。實施例6Kurthiasp.538-KA26的bioA、B、D和F基因的亞克隆。1.雜交質粒pKB103和pKB104的構建。用HindIII完全消化pKB100,分離出一個3.3Kb的HindIII片段。把3.3Kb片段通過DNA連接試劑盒連接到用HindIII切開的載體pUC18(TakaraShuzo公司)上以構建雜交質粒pKB103和pKB104。在pKB103和pKB104中,把3.3Kb片段相對于pUC18乳糖基因的啟動子-操縱基因以兩個方向插入。它們的限制性圖譜如圖8所示。利用實施例1-3中所描述的相同方法用pKB103和pKB104進行大腸桿菌(R875或R874)互補作用分析。pKB103和pKB104補充bioB和bioF突變體(表2)。2.pKB200衍生物的構建。由于pKB200補充bioD突變體,并覆蓋攜帶bioB和bioF基因之全長的pKB100,構建了pKB200的一系列缺失突變體以精確定位bioB、bioD和bioF。把pKB200的4.0Kb的SalI-HindIII片段插入到pUC18和pUC19的SalI和HindIII位點以得到pKB221和pKB222,在pKB221和pKB222中SalI-HindIII片段以兩種方向存在。用NruI完全消化pKB200,通過瓊脂糖凝膠電泳分離出一個7.5Kb的NruI片段,利用DNA連接試劑盒重新環化此NruI片段。用NruI完全消化pKB200,通過凝膠電泳分離出一個4.8Kb的NruI片段并把它在兩個方向上克隆到pUC18的HindIII位點中以產生pKB224和pKB225。用NcoI部分消化pKB200,通過瓊脂糖凝膠電泳分離出一個3.1Kb的NcoI片段,利用DNA聚合酶I(TakaraShuzo公司)克列諾片段使NcoI片段的末端成為平端并且和HindIII接頭(TakaraShuzo公司)連接。利用HindIII處理得到3.1Kb的HindIII片段并且把它在兩個方向上克隆到pUC1S的HindIII位點上,從而得到pKB228和pKB229。以相同的方式,通過用克列諾片段處理pKB200的2.1KbNcoI片段的兩個末端并附加HindIII接頭,將該片斷轉移到HindIII位點上。然后把獲得的HindIII片段在兩個方向插入到pUC19的HindIII位點中,從而得到pKB230和pKB231。通過把pKB230的1.6KbHindIII-NruI片段分別插入到pUC19和pUC18的HindIII和SmaI位點中,產生pKB234和pKB235。pKB200衍生物的限性圖譜如圖8所示3.用pKB200衍生物對大腸桿菌的生物素缺失突變體的互補作用分析。利用實施例1-3中描述的相同方式用pKB200衍生物進行互補作用分析。表2總結了把互補作用結果。bioB缺失突變體由pKB221、pKB222、pKB224和pKB225補充,但不能由pKB223、pKB228、pIB229、pKB230、pKB231、pKB234和pKB235補充。bioF缺失突變體能由pKB223、pKB224、pKB225、pKB228和pKB229補充,但不能由pKB221、pKB222、pKB230、pKB231、pKB234和pKB235補充。另一方面,bioD缺失突變體能由pKB223、pKB224和pKB225補充,但不能由KB221和pKB222補充。連同pKB103和pKB104的互補作用分析,這些結果表明bioF基因存在于pKB103的第一個NruI位點左邊,而bioB基因定位在左側帶有短重疊區的相同NruL位點上,結果還表明bioD基因存在于pKB200左邊至多1.5個Kb的區域中,這樣,pKB100和pKB200的各種衍生物的互補作用結果表明bioD、bioF和bioB基因依次位于pKB200的HindIII位點左邊的4.4Kb區域中。4.雜交質粒pKB361的構建。為確定bioA基因的位置,構建了pKB300的衍生物。通過把一個pKB300的2.8KbBamHI-SalI片段插入到pUC19的BamHI和SalI位點中產生pKB361(圖8)。把pKB361轉移到大腸桿菌(W602)的bioA缺失突變體中,利用實施例1-3中描述的相同的方式進行互補作用分析。bioA突變體能由pKB361補充,這表明bioA基因位于pKB300的BamHI和SaLI位點之間的2.8Kb區域內。表2</tables>實施例7Kurthiasp.538-KA26的bioH基因的亞克隆。1.雜交質粒pKH101和pKH102的構建。用BamHI完全消化pKH100,利用DNA連接試劑盒重新環化以產生從pKH100中缺失了0.75KbBamHI片段的pKH101(圖4)。在pKH100中,通過用HindIII處理接著用DNA連接試劑盒重新環化構建pKH102。pKH10缺乏pKH100的1.07KbHindIII片段(圖4)。利用實施例1-3中所描述的方法用pKH101和pKH102對大腸桿菌bioH突變體(R878)進行互補作用分析。pKH101補充bioH突變體,但pKH102不能(圖4)。結果表明bioH基因位于pKH100的BamHI位點的左邊區域(1.16Kb)。實施例8Kurthiasp.538-KA26的bioC基因的亞克隆。用BamHI完全消化pKC100,通過凝膠電泳分離出1.81KbBamHI片段。把BamHI片段連接到經DNA連接試劑盒用BamHI和克列諾片段處理的pBR322中。最后,得到了以兩個方向插入的BamHI片段的pKC101和pKC102(圖6)。把pKC101和pKC102轉化到大腸桿菌bioC突變體R878中,以與實施例1-3中相同的方式進行互補作用分析。bioC突變體與pKC101和pKC102互補,因此確認bioC基因,位于1.81KbBamHI片段中。實施例9在pKB100、pKB200和pKB300上插入的DNA片段的核苷酸序列。為了分析pKB100、pKB200和pKB300的插入的DNA片段的核苷酸序列,重復相互的若干subclones利用pUC18、pUC19、M13mp18和M13mp19(TakaraShuzo公司)構建了一些相互重疊的亞克隆,并且利用Kilo-測序缺失試劑盒(TakaraShuzo公司)獲得了一系列亞克隆缺失衍生物。然后,利用雙脫氧鏈終止法進行缺失衍生物的核苷酸序列分析(利用7-deaza-dGTP測序酶版2.0DNA測序試劑盒,美國生物化學公司)。利用軟件開發公司的計算機程序(GENETYX)分析結果。這種序列的計算機分析揭示了克隆的DNA片段有能力編碼六種開放讀框(ORF)。這種基因操縱子有進行雙向編碼的兩個基因簇(圖9-A)。在左邊基因簇中的第一個ORF開始于TTG密碼子(之前是和圓形芽孢桿菌16SrRNA的3′末端同源的核糖體結合位點(RBS)),且編碼具有21,516分子量的194個氨基酸殘基的蛋白質。不可能通過互補作用分析來確定基因產物的功能,因此,這個ORF命名為ORF1。在左邊基因簇中的第二個ORF核苷酸序列如SEQIDNO.1所示。此基因編碼一個分子量為26,642,具有236個氨基酸殘基的蛋白質。這種基因產物推測的氨基酸序列在SEQIDNO.2中所示。在ATG起始密碼子的上游發現推定的RBS。互補作用分析(實施例6-3)表明此ORF是bioD基因。在左邊基因簇的第三ORF具有推定的ATG起始密碼子上游RBS,這個基因的核苷酸序列如SEQIDNO.3所示。此基因編碼分子量為51,731具有460個氨基酸殘基的蛋白質。這種基因產物推測的氨基酸序列在SEQIDNO.4中所示。確認此ORF與bioA基因(實施例6-3)相對應。發現反向重復序列位于終止密碼子大約3bp的下游。這種結構可能作為一個轉錄終止區。在右邊基因簇中的第一個ORF(命名為ORF2)開始于ATG密碼子,前面是推定的RBS。此基因產物是由63個氨基酸殘基組成的蛋白質,其計算的分子量為7,447。我們不能通過互補作用分析和氨基酸序列同源搜索來鑒別這種基因產物的功能。因此,此ORF命名為ORF2。在右邊基因簇中的第二個ORF的核苷酸序列如在SEQIDNO.5中所示。此這基因中有三個潛在的ATG起始密碼子,其分別于第一個、第二十五個和第三十二個氨基酸殘基相對應。互補作用分析(實施例6-3)表明此ORF和bioF基因相對應。這種基因產物推測的氨基酸序列在SEQIDNO.6中所示。推測的具有387個氨基酸殘基蛋白質的分子量經計算為42,619,其開始于第一個起始密碼子。在右邊基因簇中的第三個ORF的核苷酸序列如SEQIDNO.7中所示。此基因有三個潛在的ATG起始密碼子、兩個ATG密碼子(第一個和第十八個氨基酸殘基)和一個GTG密碼子(第十二個氨基酸殘基)。這種基因產物推測的氨基酸序列如SEQIDNO.8中所示。推測的具有338個氨基酸殘基的從第一起始密碼子翻譯的蛋白質分子量經計算為37,438。互補作用分析(實施例6-3)表明此ORF和bioB基因相對應。終止密碼子16bp下游的反向重復序列的存在表明其具有轉錄終止區的性質。有兩個可能的啟動子序列面對面地形成ORF1和ORF2之間的啟動子,如SEQIDNO.10中所示。轉錄向左進行進入到ORF1、bioD和bioA基因簇,向右進入到ORF2、bioF和bioB基因簇。此外,兩個轉錄終止區定位在bioA和bioB基因的終止密碼子的下游。因此,在兩個方向中的轉錄產生兩個不同的mRNA。我們發現反向重復序列的兩個組分(Box1和Box2)位于ORF1和ORF2基因的開始位點之間(圖10)。Box1和Box2的所有的同源部分是82.5%。,比較Box1或Box2與大腸桿菌生物素操縱子[自然,276,689-694,(1978)]的操縱區,表明具有高水平的保守性(它們有54.6%的同源性)。大腸桿菌的生物素操縱區的反向重復序列之間的相似性表明Box1和Box1一定通過生物素參與生物素合成的負調節。實施例10pKH100插入的DNA片段之核苷酸序列。以實施例9中描述同樣的方式對pKH100的插入DNA片段之核苷酸序列進行分析。在插入的DNA片段上發現一個包含兩個ORFs的基因簇(圖9-B)。此外,已經證明了一部分載體質粒pBR322和插入的DNA片段缺失了。在SEQIDNO.中所示的第ORF編碼一個267個氨基酸殘基、計算的分子量為29,423的蛋白質。推測的這種基因產物的氨基酸序列如SEQIDNO.10所示。一個推定的RBS定位在ATG起始密碼子6bp上游。如實施例7所示,互補作用分析表明此ORF和bioH基因相對應。在bioH基因的下游發現帶有潛在RBS的第二個ORF。此ORF編碼一個86個氨基酸殘基分子量為9,955的蛋白質。這個由ORF編碼的蛋白質與大腸桿菌和圓形芽孢桿菌的生物素基因產物沒有同源性。把這個ORF命名為ORF3。如圖11中所示,在bioH基因的起始密碼子的上游發現一種可能的啟動子序列。由于在bioH基因的5′非編碼區沒有發現如Box1和Box2的反向重復序列,所以這個基因簇的轉錄一定不受調節。此外,有一個反向重復序列和ORF3的終止密碼子相重疊。由于這種結構能作為轉錄終止區,所以推定的bioH啟動子將允許bioH和ORF3基因的轉錄。實施例11pKC100的插入DNA片段的核苷酸序列。用在實施例9中描述的相同方式對pKC100插入的DNA片段之核苷酸序列進行分析。在插入的DNA片段上發現由三個ORF組成的基因簇(圖9-C)。第三個ORF具有起始密碼子的推定的RBS上游,這個基因的核苷酸序列如SEQIDNO.15所示。此基因編碼一個有276個氨基酸殘基、計算分子量為31,599的蛋白質。推測的這種基因產物的氨基酸序列如SEQIDNO.16所示。在實施例8中所示的互補作用分析表明這個ORF與bioC基因相對應。在SEQIDNO.11所示的第一個ORF編碼一個分子量為44,776具有398個氨基酸殘基的蛋白質。推定的RBS定位在起始密碼子的上游。在SEQIDNO.12中顯示的此推測的基因產物的氨基酸序列和實施例9中的Kurthiasp.538-KA26的bioF基因產物的氨基酸序列有43.0%同源性。此外,pKC100補充實施例4所示的大腸桿菌bioF突變體。因此,結論認為這個ORF為bioF基因產物的同工酶的基因,即KAPA合成酶。因此,把這個ORF命名為bioFII基因。在SEQIDNO.13所示的第二個ORF3具有起始密碼子的上游推定的RBS。此基因編碼分子量為28,629的具有248氨基酸殘基的蛋白質。在SEQIDNO.14中所示的此基因產物的推測的氨基酸序列和在實施例10中Kurthiasp.538-KA26的bioH基因產物的氨基酸序列有24.2%同源性。在實施例4中所示,pKC100也補充大腸桿菌bioH突變體。這些結果表明此ORF是bioH基因產物的同工酶基因,因此,此ORF命名為bioHII基因。在圖12中所示的bioFII基因的起始密碼子上游發現一種可能的啟動子序列。反向重復序列定位在啟動子序列和bioFII基因的RBS之間。把此命名為Box3的這個反向重復序列與定位在ORF1和ORF2基因之間的Box1和Box2相比較(實施例9)。Box1、Box2和Box3互相之間特別類似(Box1和Box3具有80.0%同源性,Box2和Box3有77.5%同源性)。因此,bioC基因簇一定受和bioA簇及bioB簇相同的負控制調節。此外,在bioC基因的終止密碼子下游具有的一個254bp的反向重復序列。認為這種結構是作為轉錄終止區。實施例12大腸桿菌和Kurthiasp.菌株穿梭載體的構建。利用圖13所示的方法構建了大腸桿菌和Kurthiasp.的穿梭載體。用EcoRI和PvuII完全消化金黃色葡萄球菌質粒pUB110(芽孢桿菌屬基因貯存中心;俄亥俄州立大學,生物化學部,484西十二大街,哥倫布,俄亥俄,43210,美國)。利用瓊脂糖凝膠電泳分離出一個包含Kurthiasp.的復制起點和卡那霉素抗性基因的3.5KbEcoRI-PvuII片段。用EcoRI和DraI完全消化pUC19,同時通過瓊脂糖凝膠電泳分離出具有大腸桿菌的復制起點的1.2KbEcoRI-DraI片段。然后,把這些片段利用DNA連接試劑盒進行連接以產生穿梭載體pYK1。pYK1能在大腸桿菌和Kurthiasp.中復制,由pYK1轉化的大腸桿菌或Kurthiasp.表現為卡那霉素抗性。實施例13Kurthiasp.的bioB基因的表達質粒構建。通過圖14所示的方法構建了pYK114(其中KurthiabioH基因啟動子的下游插入了KurthiabioB基因)。用BanII完全消化實施例7的pKH101,利用DNA聚合酶的克列諾片段使BanII片段的末端成為平端。然后,BanII片段用EcoRI處理,通過瓊脂糖凝膠電泳分離出包含bioH啟動子的0.6KbEcoRI平端片段。用KpnI完全消化實施例6中的pKB104,通過利用克列諾片段處理將KpnI末端轉化成平端。在用HindIII消化之后,通過瓊脂糖電泳分離出1.3Kb攜帶bioB基因的平端HindIII片段。利用EcoRI和HindIII消化的pYK1連接平端EcoRI和平端HindIII片段以構建pYK114。bioB基因在pYK114的bioH啟動子控制下進行結構表達。實施例14分離具有高轉化效率的Kurthiasp.538-51F9的衍生菌株。在28℃50mlTripticase大豆肉湯(BectonDickinson)中培養Kurthiasp.538-51F9(DSMNo.10610),一直培養到在600nm下(OD600)具有1.0光密度。通過離心收集生長的細胞并且于OD60016下在SMM中懸浮(0.5M蔗糖、0.02M順丁烯二酸鈉、0.02MMgCl26H2O)。然后把溶菌酶(Sigma)加入到200μg/ml的細胞懸液中,把懸液在30℃培養90分鐘以形成原生質體。原生質體用SMM洗滌兩次后,把它們懸浮在0.5mlSMM中。把1.5mlPEG溶液(SMM中有30%w/v的聚乙二醇4000)加入到原生質體懸液中,此懸液在冰上培養2分鐘。然后加入6ml的SMM,并且通過離心收集原生質體。把收集的原生質體培養物懸浮在SMM,并且在30℃培養90分鐘。把含有0.6%瓊脂糖(Sigma,VII型)的DM3培養基(0.5M琥珀酸鈉pH7.3、0.5%W/V酪蛋白氨基酸、0.5%W/V酵母抽提物、0.3%W/VKH2PO4、0.7%w/vK2HPO4、0.5%W/V葡萄糖、0.02MMgCl26H2O、0.01%W/V牛血清蛋白)加入到原生質體懸液中,然后把懸液擱置在DM3培養基瓊脂平板上。把平板在30℃培養3天。在DM3平板上總共獲得了新生的65個菌落。用實施例12的pYK1研究再生的菌株轉化效率。結果,選擇了40個菌株,并把它們在30℃50mlTripticase大豆肉湯中培養,直到OD600為1.0。通過離心收集生長的細胞并把它們在OD60016下懸浮在SMM中。然后通過以上所描述的方法用溶菌酶處理細胞獲得原生質體。把原生質體培養物懸浮在0.5ml的SMM中,并且把pYK1(1μg)加入到原生質體懸液中。在加入1.5ml的PEG溶液后,懸浮液在冰上培養2分鐘。再加入6ml的SMM,然后通過離心收集原生質體。此后,把原生質體懸浮在SMM中,并且在30℃培養90分鐘。把含有0.6%瓊脂糖的DM3培養基加入到原生質體懸液中,然后把懸液擱置在DM3培養基瓊脂平板上。把平板在30℃培養3天。收集包括在平板上新生菌落的DM3-瓊脂糖,并且把它擴散在含有5μg/ml卡那霉素的營養肉湯瓊脂平板上來選擇轉化體。把平板在30℃培養過夜。最后,得到了具有高轉化效率特征(每μgDNA有2,000個轉化體)的衍生菌株--Kurthiasp.538-51F9-RG21。實施例15Kurthiasp.538-51F9-RG21中的bioB基因之擴增。1.Kurthiasp.538-51F9-RG21的轉化。如實施例13中所描述的,構建Kurthia菌株bioB基因的表達質粒--pYK114。用pYK114和實施例14中描述的轉化載體質粒pYK1轉化Kurthiasp.538-51F9-RG21。把攜帶pYK1或是pYK114的Kurthiasp.538-51F9-RG21分別命名為Kurthiasp.538-51F9-RG21(pYK1)或Kurthiasp.538-51F9-RG21(pYK114)。2.通過發酵產生生物素。把Kurthiasp.538-51F9-RG21(pYK1)和Kurthiasp.538-51F9-RG21(pYK114)接種在含有5μg/ml卡那霉素的50ml的產物培養基中(6%甘油、5.5%protense蛋白胨、0.1%KH2PO4、0.05%MgSO47H2O、0.05%FeSO47H2O、0.001%MnSO45H2O;pH值為7.0)。把Kurthiasp.538-51F9-RG21接種在50ml的產物培養基中作為對照。培養物在28℃培養120小時。在培養之后,把2ml培養肉湯離心以除去細菌細胞得到上清液。通過微生物測定方法利用Lactobacillusplantarum(ATCC8014)測定上清液中的生物素產物。所產生的生物素量列于表3。表3序列表(1)SEQIDNO.1序列長度711個堿基對序列類型核酸鏈型雙鏈拓撲結構線性分子類型基因組DNA起始來源生物Kurthiasp.菌株538-KA25特征特征關鍵詞CDS位置1..708定義方法E序列描述ATGGGTCAAGCCTACTTTATAACCGGAACTGGCACGGATATCGGAAAAACCGTCGCCACG60AGTTTACTCTATATGTCTCTTCAAACAATGGGAAAAAGCGTCACAATATTTAAGCCGTTT120CAAACAGGATTGATTCACGAAACGAATACATACCCTGACATCTCTTGGTTTGAGCAGGAA180CTTGGTGTAAAGGCACCTGGGTTTTACATGCTTGAACCCGAAACATCTCCACACTTAGCT240ATAAAATTAACAGGGCAACAAATCGACGAGCAAAAGGTCGTGGAACGAGTTCACGAACTC300GAACAAATGTATGACATCGTGTTAGTCGAGGGCGCTGGGGGATTGGCCGTACCACTCATT360GAACGAGCGAACAGTTTCTATATGACAACCGATTTAATTAGAGATTGCAACATGCCAGTC420ATTTTCGTTTCTACAAGCGGTTTAGGATCGATTCATAATGTCATAACTACGCATTCGTAT480GCCAAATTGCATGATATTAGCGTTAAAACTATTTTATATAACCATTATCGGCCCGACGAT540GAAATTCATCGTGACAATATCCTAACCGTTGAAAAGCTCACAGGACTCGCTGACCTCGCC600TGCATACCAACATTTGTCGACGTAAGAAAAGATCTGAGAGTCTACATACTTGATTTACTT660AGTAATCATGAATTTACTCAACAACTAAAAGAGGTGTTCAAGAATGAATAG711(1)SEQIDNO.2序列長度236個殘基序列類型氨基酸拓撲結構線性分子類型多肽起始來源生物Kurthiasp.菌株538-KA26特征定義方法E序列描述MetGlyGlnAlaTyrPheIleThrGlyThrGlyThrAspIleGly151015LysThrValAlaThrSerLeuLeuTyrMetSerLeuGlnThrMet202530GlyLysSerValThrIlePheLysProPheGlnThrGlyLeuIle354045HisGluThrAsnThrTyrProAspIleSerTrpPheGluGlnGlu505560LeuGlyValLysAlaProGlyPheTyrMetLeuGluProGluThr657075SerProHisLeuAlaIleLysLeuThrGlyGlnGlnIleAspGlu808590GlnLysValValGluArgValHisGluLeuGluGlnMetTyrAsp95100105IleValLeuValGluGlyAlaGlyGlyLeuAlaValProLeuIle110115120GluArgAlaAsnSerPheTyrMetThrThrAspLeuIleArgAsp125130135CysAsnMetProValIlePheValSerThrSerGlyLeuGlySer140145150IleHisAsnValIleThrThrHisSerTyrAlaLysLeuHisAsp155160165IleSerValLysThrIleLeuTyrAsnHisTyrArgProAspAsp170175180GluIleHisArgAspAsnIleLeuThrValGluLysLeuThrGly185190195LeuAlaAspLeuAlaCysIleProThrPheValAspValArgLys200205210AspLeuArgValTyrIleLeuAspLeuLeuSerAsnHisGluPhe215220225ThrGlnGlnLeuLysGluValPheLysAsnGlu230235(3)SEQIDNO.3序列長度1383個堿基對序列類型核酸鏈型雙鏈拓撲結構線性分子類型基因組DNA起始來源生物Kurthiasp.菌株538-KA26特征特征關鍵詞CDS位置1..1380定義方法E序列描述ATGAATAGTCATGACTTAGAAAAGTGGGATAAGGAATATGTATGGCATCCGTTTACACAA60ATGAAAACGTATCGAGAAAGTAAACCGCTAATCATTGAACGCGGGGAAGGGAGCTACCTT120TTTGACATAGAAGGCAATCGGTACTTGGACGGTTATGCTTCATTATGGGTCAACGTACAT180GGCCATAATGAACCAGAGCTAAACAACGCTCTCATTGAACAAGTTGAAAAAGTCGCACAC240TCAACACTACTAGGATCTGCAAATGTACCATCCATATTACTGGCTAAGAAATTAGCAGAG300ATTACTCCTGGTCATTTATCGAAAGTCTTTTACTCGGACACTGGATCAGCTGCTGTAGAA360ATCTCCCTTAAAGTCGCTTATCAATATTGGAAAAATATCGATCCTGTAAAGTATCAACAT420AAAAATAAATTTGTCTCCCTGAACGAGGCGTACCACGGTGATACAGTTGGAGCAGTGAGT480GTCGGCGGAATGGATTTATTCCATAGAATCTTTAAACCACTACTATTTGAACGGATTCCA540ACTCCTTCTCCTTATACATATCGCATGGCTAAACACGGGGATCAAGAAGCAGTGAAAAAC600TATTGTATTGATGAGCTGGAAAAGTTGCTTCAAGACCAAGCAGAGGAAATTGCAGGATTG660ATTATCGAACCGCTTGTTCAAGGAGCAGCAGGCATCATTACCCACCCTCCTGGCTTTTTA720AAAGCGGTCGAACAATTGTGCAAGAAGTACAATATATTATTGATTTGTGACGAAGTAGCG780GTAGGATTTGGTCGCACCGGTACATTATTTGCCTGTGAACAAGAAGATGTCGTCCCTGAT840ATTATGTGTATCGGTAAAGGAATTACTGGCGGCTATATGCCTCTGGCGGCCACTATCATG900AACGAACAAATCTTTAATTCTTTTTTAGGAGAGCCCGATGAACATAAAACCTTCTATCAC960GGCCACACCTACACAGGGAATCAACTAGCCTGTGCCCTGGCGCTGAAGAATATCGAACTA1020ATAGAAAGACGAGATCTCGTCAAAGACATCCAGAAGAAATCCAAGCAGCTATCTGAAAAA1080CTGCAATCGCTATATGAACTCCCGATTGTCGGTGATATCCGCCAGCGCGGCCTCATGATT1140GGAATAGAAATCGTTAAAGATCGCCAAACAAAAGAACCGTTCACAATCCAAGAAAATATC1200GTTTCAAGCATCATCCAAAACGCTCGGGAAAATGGCCTGATCATTCGGGAACTTGGCCCT1260GTCATCACAATGATGCCCATTCTTTCCATGTCAGAAAAGGAACTGAATACTATGGTCGAA1320ACTGTCTACCGTTCGATACAGGACGTTTCTGTGCACAACGGATTAATCCCAGCAGCAAAC1380TGA1383(4)SEQIDNO.4序列長度460個殘基序列類型氨基酸拓撲結構線性分子類型多肽起始來源生物Kurthiasp.菌株538-KA26特征定義方法E序列描述MetAsnSerHisAspLeuGluLysTrpAspLysGluTyrValTrp151015HisProPheThrGlnMetLysThrTyrArgGluSerLysProLeu202530IleIleGluArgGlyGluGlySerTyrLeuPheAspIleGluGly354045AsnArgTyrLeuAspGlyTyrAlaSerLeuTrpValAsnValHis505560GlyHisAsnGluProGluLeuAsnAsnAlaLeuIleGluGlnVal657075GluLysValAlaHisSerThrLeuLeuGlySerAlaAsnValPro808590SerIleLeuLeuAlaLysLysLeuAlaGluIleThrProGlyHis95100105LeuSerLysValPheTyrSerAspThrGlySerAlaAlaValGlu110115120IleSerLeuLysValAlaTyrGlnTyrTrpLysAsnIleAspPro125130135ValLysTyrGlnHisLysAsnLysPheValSerLeuAsnGluAla140145150TyrHisGlyAspThrValGlyAlaValSerValGlyGlyMetAsp155160165LeuPheHisArgIlePheLysProLeuLeuPheGluArgIlePro170175180ThrProSerProTyrThrTyrArgMetAlaLysHisGlyAspGln185190195GluAlaValLysAsnTyrCysIleAspGluLeuGluLysLeuLeu200205210GlnAspGlnAlaGluGluIleAlaGlyLeuIleIleGluProLeu215220225ValGlnGlyAlaAlaGlyIleIleThrHisProProGlyPheLeu230235240LysAlaValGluGlnLeuCysLysLysTyrAsnIleLeuLeuIle245250255CysAspGluValAlaValGlyPheGlyArgThrGlyThrLeuPhe260265270AlaCysGluGlnGluAspValValProAspIleMetCysIleGly275280285LysGlyIleThrGlyGlyTyrMetProLeuAlaAlaThrIleMet290295300AsnGluGlnIlePheAsnSerPheLeuGlyGluProAspGluHis305310315LysThrPheTyrHisGlyHisThrTyrThrGlyAsnGlnLeuAla320325330CysAlaLeuAlaLeuLysAsnIleGluLeuIleGluArgArgAsp335340345LeuValLysAspIleGlnLysLysSerLysGlnLeuSerGluLys350355360LeuGlnSerLeuTyrGluLeuProIleValGlyAspIleArgGln365370375ArgGlyLeuMetIleGlyIleGluIleValLysAspArgGlnThr380385390LysGluProPheThrIleGlnGluAsnIleValSerSerIleIle395400405GlnAsnAlaArgGluAsnGlyLeuIleIleArgGluLeuGlyPro410415420ValIleThrMetMetProIleLeuSerMetSerGluLysGluLeu425430435AsnThrMetValGluThrValTyrArgSerIleGlnAspValSer440445450ValHisAsnGlyLeuIleProAlaAlaAsn455460(5)SEQIDNO.5序列長度1164個堿基對序列類型核酸鏈型雙鏈拓撲結構線性分子類型基因組DNA起始來源生物Kurthiasp.菌株538-KA26特征特征關鍵詞CDS位置1..1161定義方法E序列描述ATGATTTGGGAGAAGGAACTAGAAAAGATTAAAGAAGGAGGGCTTTACAGACAACTCCAA60ACCGTTGAAACAATGAGCGATCAAGGGTATGCCATGGTGAACGGAAAAAAAATGATGATG120TTTGCCTCCAATAATTACTTAGGGATTGCCAATGATCAACGATTAATTGAGGCTTCTGTC180CAAGCGACTCAAAGATTTGGTACGGGTTCTACTGGTTCACGATTAACCACTGGCAATACA240ATTGTCCATGAAAAACTAGAGAAAAGACTTGCAGAGTTTAAGCAAACGGATGCAGCGATA300GTATTAAACACAGGGTATATGGCTAACATAGCAGCGTTAACGACCCTTGTTGGTAGTGAC360GATCTCATTTTATCCGATGAGATGAATCATGCCAGTATTATTGATGGCTGCCGTTTATCA420CGTGCGGAAACTATCATTTATCGTCATGCTGATTTACTTGACTTGGAAATGAAACTCCAG480ATTAATACCCGCTACAGGAAAAGAATAATTGTAACGGATGGCGTCTTTTCGATGGATGGT540GATATTGCGCCATTGCCAGGTATTGTCGAACTTGCCAAGCGTTATGATGCACTTGTTATG600GTGGATGACGCACATGCGACGGGTGTTTTAGGTAAAGACGGAAGGGGAACTTCTGAACAT660TTTGGACTGAAGGGGAAGATAGATATCGAGATGGGGACACTCTCCAAAGCTGTTGGTGCA720GAAGGAGGGTATATCGCTGGAAGCAGGTCTTTAGTTGACTATGTCTTAAATCGAGCCAGA780CCGTTTGTCTTCTCTACCGCCTTATCAGCAGGAGTAGTAGCAAGTGCACTTACAGCAGTC840GATATCATTCAATCAGAACCTGAACGCAGAGTACGCATTCGAGCCATGAGCCAGCGTCTT900TATAATGAATTAACCTCCCTTGGCTACACAGTTTCGGGGGGAGAAACTCCGATTCTTGCC960ATTATTTGCGGAGAACCGGAACAGGCCATGTTCCTTTCGAAAGAATTACATAAGCACGGA1020ATTTATGCACCAGCTATCCGTTCGCCAACGGTACCTCTTGGAACTTCGCGCATTCGACTT1080ACGTTAATGGCGACACATCAAGAAGAACAAATGAATCATGTTATCGACGTGTTCAGAACA1140ATCCTTACCAATAGATACAAATAG1164(6)SEQIDNO.6序列長度387個殘基序列類型氨基酸拓撲結構線性分子類型多肽起始來源生物Kurthiasp.菌株538-KA26特征定義方法E序列描述MetIleTrpGluLysGluLeuGluLysIleLysGluGlyGlyLeu151015TyrArgGlnLeuGlnThrValGluThrMetSerAspGlnGlyTyr202530AlaMetValAsnGlyLysLysMetMetMetPheAlaSerAsnAsn354045TyrLeuGlyIleAlaAsnAspGlnArgLeuIleGluAlaSerVal505560GlnAlaThrGlnArgPheGlyThrGlySerThrGlySerArgLeu657075ThrThrGlyAsnThrIleValHisGluLysLeuGluLysArgLeu808590AlaGluPheLysGlnThrAspAlaAlaIleValLeuAsnThrGly95100105TyrMetAlaAsnIleAlaAlaLeuThrThrLeuValGlySerAsp110115120AspLeuIleLeuSerAspGluMetAsnHisAlaSerIleIleAsp125130135GlyCysArgLeuSerArgAlaGluThrIleIleTyrArgHisAla140145150AspLeuLeuAspLeuGluMetLysLeuGlnIleAsnThrArgTyr155160165ArgLysArgIleIleValThrAspGlyValPheSerMetAspGly170175180AspIleAlaProLeuProGlyIleValGluLeuAlaLysArgTyr185190195AspAlaLeuValMetValAspAspAlaHisAlaThrGlyValLeu200205210GlyLysAspGlyArgGlyThrSerGluHisPheGlyLeuLysGly215220225LysIleAspIleGluMetGlyThrLeuSerLysAlaValGlyAla230235240GluGlyGlyTyrIleAlaGlySerArgSerLeuValAspTyrVal245250255LeuAsnArgAlaArgProPheValPheSerThrAlaLeuSerAla260265270GlyValValAlaSerAlaLeuThrAlaValAspIleIleGlnSer275280285GluProGluArgArgValArgIleArgAlaMetSerGlnArgLeu290295300TyrAsnGluLeuThrSerLeuGlyTyrThrValSerGlyGlyGlu305310315ThrProIleLeuAlaIleIleCysGlyGluProGluGlnAlaMet320325330PheLeuSerLysGluLeuHisLysHisGlyIleTyrAlaProAla335340345IleArgSerProThrValProLeuGlyThrSerArgIleArgLeu350355360ThrLeuMetAlaThrHisGlnGluGluGlnMetAsnHisValIle365370375AspValPheArgThrIleLeuThrAsnArgTyrLys380385(7)SEQIDNO.7序列長度1017個堿基對序列類型核酸鏈型雙鏈拓撲結構線性分子類型基因組DNA起始來源生物Kurthiasp.菌株538-KA26特征特征keyCDS位置1..1014定義方法E菌株538-KA26序列描述ATGAGAAAAGAGGGATTAGGTTTGGAAACATTGGTGAAAAAGGATTGGAAGATGCTAGCG60GAAAACGTAATCAAAGGATATAAAGTAACAGCGGAAGAAGCACTTGCTATTGTACAAGCA120CCTGACAACGAGGTTTTAGAGATTTTGAATGCAGCTTTCCTTATTCGTCAGCACTATTAT180GGAAAAAAGGTTAAATTGAATATGATCATTAATACGAAGTCAGGTCTATGTCCTGAAGAT240TGTGGCTATTGTTCGCAGTCAATCGTGTCGGAAGCTCCTATCGATAAATATGCTTGGCTG300ACCAAAGAGAAGATTGTTGAAGGTGCTCAAGAATCAATTCGTCGCAAAGCTGGCACGTAT360TGTATCGTTGCTTCTGGCCGTCGTCCGACCAATAGGGAAATTGATCATGTCATTGAAGCT420GTGAAAGAAATTCGCGAGACAACGGATCTTAAAATATGCTGCTGTCTAGGTTTCTTAAAT480GAAACGCATGCCAGTAAGCTAGCTGAAGCTGGGGTTCATCGCTACAAGCACAACTTAAAT540ACATCTCAAGATAATTATAAGAATATTACATCCACACATACTTATGAGGACCGTGTAGAT600ACAGTCGAAGCTGTAAAAGAGGCCGGAATGTCTCCATGCTCGGGTGCCATTTTTGGTATG660AATGAGTCTAATGAAGAAGCAGTAGAGATTGCCCTATCCCTACGCAGTCTTGACGCGGAT720TCTATTCCTTGTAATTTCCTCAATGCGATTGACGGTACACCACTTGAGGGAACTTCCGAG780TTGACTCCAACTAAATGTTTGAAATTAATTTCGATGATGAGATTTGTTAATCCAAGTAAG840GAAATCCGTCTTGCTGGAGGTCGCGAGGTGAACCTCCGTTCCATGCAACCCATGGCACTT900TATGCAGCCAATTCTATCTTCGTCGGCGATTATCTAACAACAGCTGGACAAGAACCTACG960GCGGATTGGGGCATTATCGAAGACCTTGGTTTTGAAATTGAAGAATGCGCTCTTTAA1017(8)SEQIDNO.8序列長度338個殘基序列類型氨基酸拓撲結構線性分子類型多肽起始來源生物Kurthiasp.菌株538-KA26特征定義方法E序列描述MetArgLysGluGlyLeuGlyLeuGluThrLeuValLysLysAsp151015TrpLysMetLeuAlaGluAsnValIleLysGlyTyrLysValThr202530AlaGluGluAlaLeuAlaIleValGlnAlaProAspAsnGluVal354045LeuGluIleLeuAsnAlaAlaPheLeuIleArgGlnHisTyrTyr505560GlyLysLysValLysLeuAsnMetIleIleAsnThrLysSerGly657075LeuCysProGluAspCysGlyTyrCysSerGlnSerIleValSer808590GluAlaProIleAspLysTyrAlaTrpLeuThrLysGluLysIle95100105ValGluGlyAlaGlnGluSerIleArgArgLysAlaGlyThrTyr110115120CysIleValAlaSerGlyArgArgProThrAsnArgGluIleAsp125130135HisValIleGluAlaValLysGluIleArgGluThrThrAspLeu140145150LysIleCysCysCysLeuGlyPheLeuAsnGluThrHisAlaSer155160165LysLeuAlaGluAlaGlyValHisArgTyrLysHisAsnLeuAsn170175180ThrSerGlnAspAsnTyrLysAsnIleThrSerThrHisThrTyr185190195GluAspArgValAspThrValGluAlaValLysGluAlaGlyMet200205210SerProCysSerGlyAlaIlePheGlyMetAsnGluSerAsnGlu215220225GluAlaValGluIleAlaLeuSerLeuArgSerLeuAspAlaAsp230235240SerIleProCysAsnPheLeuAsnAlaIleAspGlyThrProLeu245250255GluGlyThrSerGluLeuThrProThrLysCysLeuLysLeuIle260265270SerMetMetArgPheValAsnProSerLysGluIleArgLeuAla275280285GlyGlyArgGluValAsnLeuArgSerMetGlnProMetAlaLeu290295300TyrAlaAlaAsnSerIlePheValGlyAspTyrLeuThrThrAla305310315GlyGlnGluProThrAlaAspTrpGlyIleIleGluAspLeuGly320325330PheGluIleGluGluCysAlaLeu335(9)SEQIDNO.9序列長度804個堿基對序列類型核酸鏈型雙鏈拓撲結構線性分子類型基因組DNA起始來源生物Kurthiasp.菌株538-KA26特征特征關鍵詞CDS位置1..801定義方法E序列描述ATGCCATTCGTAAATCATGACAATGAAAGCCTTTACTATGAGGTTCACGGACAAGGTGAT60CCTTTATTGTTGATTATGGGGCTCGGCTATAACTCTTTATCCTGGCATAGAACGGTGCCC120ACTTTAGCTAAGCGCTTTAAAGTAATCGTTTTTGATAATCGTGGTGTTGGTAAGAGCAGT180AAGCCTGAACAGCCATATTCTATTGAAATGATGGCTGAGGATGCAAGAGCGGTCCTTGAT240GCTGTTTCGGTTGACTCAGCACATGTATATGGGATTTCAATGGGTGGAATGATTGCCCAA300AGGCTGGCAATCACATATCCAGAACGTGTTCGTTCTCTTGTTCTAGGTTGTACCACTGCG360GGTGGTACTACTCATATTCAACCTTCTCCAGAAATATCTACTTTAATGGTATCTCGAGCC420TCCCTTACAGGTTCTCCAAGGGATAATGCCTGGTTAGCGGCACCAATAGTTTATAGTCAA480GCTTTTATTGAGAAGCACCCTGAATTAATTCAGGAAGATATCCAAAAGCGAATAGAAATC540ATTACTCCGCCAAGCGCCTATCTGTCTCAACTACAAGCTTGTCTAACTCATGATACATCC600AATGAACTTGATAAAATAAACATACCAACATTGATTATACACGGTGATGCAGATAATTTG660GTTCCATATGAAAACGGTAAAATGTTAGCTGAACGTATTCAGGGTTCTCAGTTTCACACC720GTATCCTGTGCTGGCCACATTTATTTAACAGAAGCAGCTAAGGAAGCAAATGACAAAGTT780ATACAGTTTCTAGCTCATCTATAA804(10)SEQIDNO.10序列長度267個殘基序列類型氨基酸拓撲結構線性分子類型多肽起始來源生物Kurthiasp.菌株538-KA26特征定義方法E序列描述MetProPheValAsnHisAspAsnGluSerLeuTyrTyrGluVal151015HisGlyGlnGlyAspProLeuLeuLeuIleMetGlyLeuGlyTyr202530AsnSerLeuSerTrpHisArgThrValProThrLeuAlaLysArg354045PheLysValIleValPheAspAsnArgGlyValGlyLysSerSer505560LysProGluGlnProTyrSerIleGluMetMetAlaGluAspAla657075ArgAlaValLeuAspAlaValSerValAspSerAlaHisValTyr808590GlyIleSerMetGlyGlyMetIleAlaGlnArgLeuAlaIleThr95100105TyrProGluArgValArgSerLeuValLeuGlyCysThrThrAla110115120GlyGlyThrThrHisIleGlnProSerProGluIleSerThrLeu125130135MetValSerArgAlaSerLeuThrGlySerProArgAspAsnAla140145150TrpLeuAlaAlaProIleValTyrSerGlnAlaPheIleGluLys155160165HisProGluLeuIleGlnGluAspIleGlnLysArgIleGluIle170175180IleThrProProSerAlaTyrLeuSerGlnLeuGlnAlaCysLeu185190195ThrHisAspThrSerAsnGluLeuAspLysIleAsnIleProThr200205210LeuIleIleHisGlyAspAlaAspAsnLeuValProTyrGluAsn215220225GlyLysMetLeuAlaGluArgIleGlnGlySerGlnPheHisThr230235240ValSerCysAlaGlyHisIleTyrLeuThrGluAlaAlaLysGlu245250255AlaAsnAspLysValIleGlnPheLeuAlaHisLeu260265(11)SEQIDNO.11序列長度1197個堿基對序列類型核酸鏈型雙鏈拓撲結構線性分子類型基因組DNA起始來源生物Kurthiasp.菌株538-KA26特征特征關鍵詞CDS位置1..1194定義方法E序列描述ATGCACAGTGAAAAACAATTACCTTGTTGGGAAGAAAAAATTAAGAAAGAACTGGCTTAT60TTAGAAGAGATATCGCAAAAACGTGAACTCGTTTCAACGGAATTCGCCGAGCAGCCATGG120CTTATGATCAACGGGTGCAAGATGCTAAATCTAGCTTCTAATAACTATTTAGGATATGCA180GGGGATGAGCGGCTGAAAAAGGCTATGGTAGATGCAGTACATACATATGGTGCAGGAGCG240ACGGCTTCACGTTTAATTATTGGCAATCACCCTCTTTACGAGCAAGCAGAACAAGCTCTT300GTCAATTGGAAGAAAGCCGAAGCAGGACTCATTATTAACAGTGGATATAACGCGAACCTT360GGAATTATCTCCACCTTGCTGTCCCGTAACGATATTATTTATAGCGATAAATTGAATCAT420GCAAGCATTGTCGATGGAGCTCTCTTAAGCCGTGCAAAGCATCTACGCTATCGTCATAAT480GATTTAGATCATTTAGAAGCATTATTGAAAAAATCATCGATGGAAGCACGTAAATTAATT540GTGACGGATACGGTCTTCAGCATGGACGGTGACTTTGCTTATCTTGAAGACCTTGTTCGG600TTAAAAGAACGTTATAACGCTATGTTAATGACAGATGAAGCACACGGAAGCGGCATCTAC660GGTAAAAACGGTGAAGGTTATGCCGGTCATCTCCATCTTCAAAATAAAATAGATATCCAA720ATGGGAACATTCAGTAAAGCGCTCGGTTCATTCGGGGCCTATGTCGTCGGGAAAAAATGG780CTCATCGACTATTTAAAAAATCGCATGCGCGGATTCATATATTCAACTGCACTCCCCCCG840GCCATACTCGGTGCTATGAAAACAGCGATAGAACTTGTACAGCAAGAACCAGAACGCCGC900TCACTGCTCCAAACACATTCAGAACACTTTAGAGAAGAACTCACATATTACGGGTTTAAT960ATTTGTGGAAGTCGATCACAAATTGTTCCTATCGTCATCGGGGAAAACGAAAAAGCGATG1020GAATTTGCCACACGTTTGCAGAAAGAAGGAATTGCAGCTATTGCTGTCAGGCCGCCGACC1080GTTCCTGAAAATGAGGCGAGAATCCGTTTTACTGTAACAGCTCTCCACGATAAAAAAGAT1140CTTGATTGGGCAGTTGAAAAAGTTTCGATCATTGGAAAAGAAATGGGTGTTATTTAA1197(12)SEQIDNO.12序列長度398個殘基序列類型氨基酸拓撲結構線性分子類型多肽起始來源生物Kurthiasp.菌株538-KA26特征定義方法E序列描述MetHisSerGluLysGlnLeuProCysTrpGluGluLysIleLys151015LysGluLeuAlaTyrLeuGluGluIleSerGlnLysArgGluLeu202530ValSerThrGluPheAlaGluGlnProTrpLeuMetIleAsnGly354045CysLysMetLeuAsnLeuAlaSerAsnAsnTyrLeuGlyTyrAla505560GlyAspGluArgLeuLysLysAlaMetValAspAlaValHisThr657075TyrGlyAlaGlyAlaThrAlaSerArgLeuIleIleGlyAsnHis808590ProLeuTyrGluGlnAlaGluGlnAlaLeuValAsnTrpLysLys95100105AlaGluAlaGlyLeuIleIleAsnSerGlyTyrAsnAlaAsnLeu110115120GlyIleIleSerThrLeuLeuSerArgAsnAspIleIleTyrSer125130135AspLysLeuAsnHisAlaSerIleValAspGlyAlaLeuLeuSer140145150ArgAlaLysHisLeuArgTyrArgHisAsnAspLeuAspHisLeu155160165GluAlaLeuLeuLysLysSerSerMetGluAlaArgLysLeuIle170175180ValThrAspThrValPheSerMetAspGlyAspPheAlaTyrLeu185190195GluAspLeuValArgLeuLysGluArgTyrAsnAlaMetLeuMet200205210ThrAspGluAlaHisGlySerGlyIleTyrGlyLysAsnGlyGlu215220225GlyTyrAlaGlyHisLeuHisLeuGlnAsnLysIleAspIleGln230235240MetGlyThrPheSerLysAlaLeuGlySerPheGlyAlaTyrVal245250255ValGlyLysLysTrpLeuIleAspTyrLeuLysAsnArgMetArg260265270GlyPheIleTyrSerThrAlaLeuProProAlaIleLeuGlyAla275280285MetLysThrAlaIleGluLeuValGlnGlnGluProGluArgArg290295300SerLeuLeuGlnThrHisSerGluHisPheArgGluGluLeuThr305310315TyrTyrGlyPheAsnIleCysGlySerArgSerGlnIleValPro320325330IleValIleGlyGluAsnGluLysAlaMetGluPheAlaThrArg335340345LeuGlnLysGluGlyIleAlaAlaIleAlaValArgProProThr350355360ValProGluAsnGluAlaArgIleArgPheThrValThrAlaLeu365370375HisAspLysLysAspLeuAspTrpAlaValGluLysValSerIle380385390IleGlyLysGluMetGlyValIle395(13)SEQIDNO.13序列長度747個堿基對序列類型核酸鏈型雙鏈拓撲結構線性分子類型基因組DNA起始來源生物Kurthiasp.菌株538-KA26特征特征關鍵詞CDS位置1..744定義方法E序列描述ATGAAACAGCCGAATTTAGTCATGCTTCCTGGCTGGGGAATGGAAAAAGATGCGTTTCAA60CCGTTAATCAAACCGCTGTCAGAAGTATTTCACCTCTCATTCATAGAATGGAGAGATATG120AAAACACTAAATGACTTTGAAGAACGAGTCATAGACACAATCGCTTCTATTGATGGTCCT180GTTTTTTTACTTGGCTGGTCATTAGGATCTCTATTATCACTTGAACTTGTAAGTTCGTAT240CGAGAAAAAATAAAAGGTTTTATACTAATTGGCGCAACAAGTCGTTTTACCACAGGAGAT300AATTATTCATTTGGCTGGGATCCACGAATGGTCGAGCGCATGAAGAAACAACTGCAGCGC360AATAAAGAGAAGACTTTGACTTCTTTCTATGAAGCAATGTTTTCCGAAGCTGAAAAAGAA420GAAGGTTTTTATCATCAATTCATCACGACAATTCAAAGCGAGTTTCATGGGGATGACGTA480TTTTCGCTTCTTATAGGTTTGGATTATTTACTTCAGAAAGATGTTAGAGTAAAGCTCGAC540CAGATTGAAACTCCCATTTTATTGATCCATGGGAGAGAAGACAAAATTTGTCCACTCGAA600GCCTCATCTTTCATTAAAGAAAATCTGGGTGGGAAAGCCGAGGTTCATATTATCGAAGGC660GCTGGTCATATTCCATTTTTCACAAAACCACAGGAATGTGTGCAGCTTATAAAAACATTT720ATTCAAAAGGAGTACATTCATGATTGA747(14)SEQIDNO.14序列長度248個殘基序列類型氨基酸鏈型雙鏈拓撲結構線性分子類型多肽起始來源生物Kurthiasp.菌株538-KA26特征定義方法E序列描述MetLysGlnProAsnLeuValMetLeuProGlyTrpGlyMetGlu151015LysAspAlaPheGlnProLeuIleLysProLeuSerGluValPhe202530HisLeuSerPheIleGluTrpArgAspMetLysThrLeuAsnAsp354045PheGluGluArgValIleAspThrIleAlaSerIleAspGlyPro505560ValPheLeuLeuGlyTrpSerLeuGlySerLeuLeuSerLeuGlu657075LeuValSerSerTyrArgGluLysIleLysGlyPheIleLeuIle808590GlyAlaThrSerArgPheThrThrGlyAspAsnTyrSerPheGly95100105TrpAspProArgMetValGluArgMetLysLysGlnLeuGlnArg110115120AsnLysGluLysThrLeuThrSerPheTyrGluAlaMetPheSer125130135GluAlaGluLysGluGluGlyPheTyrHisGlnPheIleThrThr140145150IleGlnSerGluPheHisGlyAspAspValPheSerLeuLeuIle155160165GlyLeuAspTyrLeuLeuGlnLysAspValArgValLysLeuAsp170175180GlnIleGluThrProIleLeuLeuIleHisGlyArgGluAspLys185190195IleCysProLeuGluAlaSerSerPheIleLysGluAsnLeuGly200205210GlyLysAlaGluValHisIleIleGluGlyAlaGlyHisIlePro215220225PhePheThrLysProGlnGluCysValGlnLeuIleLysThrPhe230235240IleGlnLysGluTyrIleHisAsp245(15)SEQIDNO.15序列長度831個堿基對序列類型核酸鏈型雙鏈拓撲結構線性分子類型基因組DNA起始來源生物Kurthiasp.菌株538-KA26特征特征關鍵詞CDS位置1..828定義方法E序列描述ATGATTGATAAACAATTGTTAAGTAAGCGATTCAGTGAACATGCGAAAACATATGATGCA60TATGCCAATGTTCAAAAAAACATGGCGAAACAATTAGTGGATTTGCTCCCTCAAAAAAAC120AGCAAACAAAGAATTAACATCCTTGAAATTGGCTGCGGTACTGGTTACTTAACCAGGTTA180CTCGTTAATACATTTCCTAATGCTTCTATTACCGCTGTTGATTTAGCACCAGGGATGGTT240GAAGTGGCGAAAGGAATAACAATGGAAGACCGTGTTACTTTTTTATGTGCTGATATCGAA300GAAATGACGCTTAATGAAAATTACGACTTAATTATTTCTAATGCAACGTTTCAATGGCTG360AATAATCTTCCTGGAACCATTGAACAATTGTTTACACGATTAACGCCTGAAGGAAACCTG420ATATTTTCAACGTTTGGAATTAAAACCTTTCAAGAGCTTCATATGTCCTATGAACATGCG480AAAGAAAAGCTTCAACTTTCAATTGATAGTTCACCAGGCCAACTGTTTTACGCTCTAGAA540GAATTATCCCAAATTTGTGAAGAAGCAATCCCTTTTTCATCAGCATTTCCATTAGAGATA600ACAAAAATAGAAAAGCTTGAACTAGAGTACTTTCAGACAGTACGTGAATTTTTCACTTCA660ATTAAAAAGATTGGTGCAGCTAACAGCAACAAAGAAAACTACTGCCAGCGCCCTTCTTTT720TTTCGAGAGTTAATCAACATATACGAAACAAAATACCAAGATGAATCAGGTGTGAAGGCA780ACCTATCACTGTTTGTTTTTTAAGATAATAAAACATGCCCCCCTACCCTAA831(16)SEQIDNO.16序列長度276個殘基序列類型氨基酸拓撲結構線性分子類型多肽起始來源生物Kurthiasp.菌株:538-KA26特征定義方法E序列描述MetIleAspLysGlnLeuLeuSerLysArgPheSerGluHisAla151015LysThrTyrAspAlaTyrAlaAsnValGlnLysAsnMetAlaLys202530GlnLeuValAspLeuLeuProGlnLysAsnSerLysGlnArgIle354045AsnIleLeuGluIleGlyCysGlyThrGlyTyrLeuThrArgLeu505560LeuValAsnThrPheProAsnAlaSerIleThrAlaValAspLeu657075AlaProGlyMetValGluValAlaLysGlyIleThrMetGluAsp808590ArgValThrPheLeuCysAlaAspIleGluGluMetThrLeuAsn95100105GluAsnTyrAspLeuIleIleSerAsnAlaThrPheGlnTrpLeu110115120AsnAsnLeuProGlyThrIleGluGlnLeuPheThrArgLeuThr125130135ProGluGlyAsnLeuIlePheSerThrPheGlyIleLysThrPhe140145150GlnGluLeuHisMetSerTyrGluHisAlaLysGluLysLeuGln155160165LeuSerIleAspSerSerProGlyGlnLeuPheTyrAlaLeuGlu170175180GluLeuSerGlnIleCysGluGluAlaIleProPheSerSerAla185190195PheProLeuGluIleThrLysIleGluLysLeuGluLeuGluTyr200205210PheGlnThrValArgGluPhePheThrSerIleLysLysIleGly215220225AlaAlaAsnSerAsnLysGluAsnTyrCysGlnArgProSerPhe230235240PheArgGluLeuIleAsnIleTyrGluThrLysTyrGlnAspGlu245250255SerGlyValLysAlaThrTyrHisCysLeuPhePheLysIleIle260265270LysHisAlaProLeuPro27權利要求1.一種DNA序列,該序列編碼以SEQIDN0.2、4、6、8、10、12、14或16為代表的多肽和包含一個或多個氨基酸殘基的添加、插入、缺失和/或取代的所述多肽的功能性衍生物。2.一種載體,該載體包含如權利要求1所限定的一個或多個DNA序列。3.權利要求2所限定的載體,其中所說的DNA序列與啟動子序列功能性地連接。4.一種細胞,該細胞是由一種或多種權利要求1的DNA序列或權利要求2或3所限定的載體轉化的細胞。5.一種產生生物素的方法,該方法包括在培養基中培養權利要求4所限定的細胞和利用本領域公知的方法從培養基中分離形成的生物素。6.權利要求5的方法,其中所說的培養在pH值5至9,優選的是6至8下,于10℃至45℃,優選的是25℃至30℃的溫度范圍內進行1至10天,優選的是2至7天。7.一種制備食品或飼料組合物的方法,其特征在于把用權利要求5或6的方法獲得的生物素與一種或多種通常應用的添加劑混合。全文摘要本發明涉及利用基因工程生物體通過發酵產生生物素的方法、DNA序列以及用于這種方法的載體。文檔編號A23K1/16GK1178834SQ97119679公開日1998年4月15日申請日期1997年9月26日優先權日1996年9月27日發明者古市泰宏,星野達雄,木村均,喜安達也,長橋喜惠申請人:弗·哈夫曼-拉羅切有限公司