專利名稱:對鮑氏志賀氏菌13型的o-抗原特異的核苷酸及其應用的制作方法
技術領域:
本發明涉及鮑氏志賀氏菌13型(Shigella bodyii 13)中控制O-抗原合成的基因簇的核苷酸全序列,特別是涉及鮑氏志賀氏菌13型中控制O-抗原合成的基因簇中的寡核苷酸,可利用這些對O-抗原特異的寡核苷酸快速、準確地檢測人體及環境中的鮑氏志賀氏菌13型并鑒定這些致病菌中的O-抗原。
O-抗原是革蘭氏陰性細菌脂多糖中的O特異性多糖成分,它由許多重復的寡糖單位組成。O-抗原的合成過程研究得較清楚先由糖基轉移酶將核苷二磷酸單糖轉移到一個固定在細胞內膜的脂分子上,然后在內膜的內側合成寡糖單位,O-抗原的寡糖單位再通過轉運酶被轉移到內膜外側,而后通過聚合酶聚合成多糖,再被連接到一個糖脂分子上形成脂多糖分子[Whitfield,C.(1995)“Biosynthesis of lipopolysaccharide Oantigens”.Trends in Microbiology.3178-185;Schnaitman,C.A.andJ.D.Klena.(1993)“Genetics of lipopolysaccharide biosynthesis inentericbacteria”.Microbiological Reviews,57(3)655-682]。編碼負責O-抗原合成的所有酶分子的基因一般在染色體上相鄰排列,形成一個基因簇[Reeves,P.R.,et al.(1996)“Bacterial polysaccharide synthesis and genenomenclature”Trends in Microbiology,4495-503]。在志賀氏菌、大腸桿菌和沙門氏菌中,O-抗原基因簇位于galF和gnd基因之間[Lei Wang.et al(2001)“Sequence analysis of four Shigella boydii O-antigen lociimplicationfor Escherichia coli and Shigella relationships”.Infection andImmunity,116923-6930;Lei Wang and Peter Reeves(2000)“TheEscherichia coli O111 and Salmonella enterica O35 gene clustersgeneclusters encoding the same colitose-containing O antigen are highlyconserved”.Journal of Bacteriology.1825256-5261]。O-抗原基因簇含有三類基因糖合成路徑基因,糖基轉移酶基因,寡糖單位處理基因,其中糖合成路徑基因編碼的酶合成O-抗原所需的核苷二磷酸單糖;糖基轉移酶基因編碼的酶將核苷二磷酸單糖及其它分子轉到單糖上從而使單糖聚合成寡糖單位;寡糖單位處理基因包括轉運酶基因和聚合酶基因,它們將寡糖單位轉移到細菌內膜外側,再聚合成多糖。糖基轉移酶基因和寡糖單位處理基因只存在于攜帶這些基因的基因簇里。O-抗原中單糖的不同,單糖間聯結鍵的不同和寡糖單位之間聯結鍵的不同構成了O-抗原的多樣性,而單糖的組成、單糖間的聯結鍵及寡糖單位之間的聯結鍵是由O-抗原基因簇中的基因控制著,所以O-抗原基因簇決定了O-抗原的合成,也決定了O-抗原的多樣性。
因為O-抗原是極強的抗原,是志賀氏菌重要的致病因素之一,同時它又具有極強的多樣性,這啟示我們能研究一種快速、準確地檢測志賀氏菌及其O-抗原的特異性好、靈敏度高的方法。以表面多糖為目標的血清學免疫反應自上世紀30年代以來一直被用于對細菌的分型和鑒定,是鑒定致病菌的唯一的手段。這種診斷方法需要大量的抗血清,而抗血清一般種類不全,數量不足,大量的抗血清在制備和儲存中也存在一些困難。另一方面此法耗時長、靈敏度低、漏檢率高、準確性差,所以,現在普遍認為這種傳統的血清學檢測方法將為現代分子生物學方法取代。1993年,Luk,J.M.C et.al用沙門氏菌(S.enterica)O-抗原基因簇的特異核苷酸序列通過PCR方法鑒定了沙門氏菌的O-抗原[Luk,J.M.C.et.al.(1993)“Selective amplification ofabequose and paratose synthase genes(rfb)by polymerase chain reactionfor identification of S.enterica major serogroups(A,B,C2,andD)”,J.Clin.Microbiol.312118-2123]。Luk,et.al的方法是將相應于沙門氏菌血清型E1,D1,A,B和C2的O-抗原內的CDP-阿比可糖和CDP-泰威糖的合成基因的核苷酸序列排列后得到對不同血清型的沙門氏菌特異的寡核苷酸。1996年,Paton,A.W et.al用對E.coli O111的O-抗原特異的源于wbdI基因的寡核苷酸鑒定了一株產毒素的E.coli O111的血清型[“Molecular microbiologicalinvestigation of an outbreak of Hemolytic-Uremic Syndrome caused bydry fermented sausage contaminated with Shiga-like toxin producingEscherichia coli”.j.Clin.Microbiol.341622-1627],但是后來的研究表明Paton,A.W et.al的用源于wbdI基因的寡核苷酸鑒定E.coli O111的血清型的方法有假陽性結果出現。Bastin D.A.and Reeves,P.R.認為,這是由于wbdI基因是一個推測的糖合成路徑基因[Bastin D.A.andReeves,P.R.(1995)Sequence and analysis of the O antigen gene(rfb)cluster of Escherichia coli O111.Gene 16417-23],而在其它細菌的O-抗原的結構中也可能有這個糖,所以糖合成路徑基因對于O-抗原并不是高度特異的。
志賀氏菌有46種血清型,大腸桿菌有166種不同的O-抗原,二者親緣關系非常近,并且有12種O-抗原是大腸桿菌和志賀氏菌共有的[Ewing,W.H.(1986)“Edwards and Ewing’s identification of theEnterobacteriaceae”.Elsevier Science Publishers,Amsterdam,TheNetherlands;T.cheasty,et al.(1983)“Antigenic relationships betweenthe enteroinvasive Escherichia coli antigensO28ac,O112ac,O124,O136,O143,O144,O152 and O164 and Shigella Oantigens”J.clin Microbiol,17(4)681-684],傳統的血清學方法不能將它們區分。
本發明的次一目的是提供了鮑氏志賀氏菌13型的O-抗原基因簇的全長核苷酸序列。
本發明的另一個目的是提供了構成鮑氏志賀氏菌13型的O-抗原基因簇的基因轉運酶的基因即wzx基因或與wzx有相似功能的基因;聚合酶基因即wzy基因或與wzy有相似功能的基因;糖基轉移酶基因,包括orf4、orf5、orf6、wbjE、orf11、orf12基因;糖合成路徑基因,包括wbjB、wbjC、wbjD。
本發明的又一個目的是提供了寡核苷酸,它們分別源于鮑氏志賀氏菌13型的O-抗原基因簇中編碼糖基轉移酶的基因包括orf4、orf5、orf6、wbjE、orf11、orf12基因;源于編碼轉運酶的基因即wzx基因或與wzx有相似功能的基因、源于編碼聚合酶的基因即wzy基因或與wzy有相似功能的基因;它們是上述基因內的寡核苷酸,長度在10-20nt;它們對鮑氏志賀氏菌13型的O-抗原是特異的;尤其是表1中列出的寡核苷酸,它們對鮑氏志賀氏菌13型的O-抗原是高度特異的,而且這些寡核苷酸還可重新組合,組合后的寡核苷酸對鮑氏志賀氏菌13型的O-抗原也是高度特異的。
本發明的再一個目的是提供的上述寡核苷酸可作為引物用于核酸擴增反應,或者作為探針用于雜交反應,或者用于制造基因芯片或微陣列,從而通過這些方法來檢測和鑒定鮑氏志賀氏菌13型的O-抗原及檢測和鑒定鮑氏志賀氏菌13型。
本發明的還一個目的是提供了分離鮑氏志賀氏菌13型的O-抗原基因簇的全序列的方法。按照本方法操作可以獲得其他細菌的O-抗原基因簇的全序列,也可以獲得編碼其他多糖抗原的細菌的基因簇的全序列。
本發明的目的是由以下技術方案實現的。
本發明對鮑氏志賀氏菌13型的O-抗原特異的核苷酸,其是如SEQ ID NO1所示的分離的核苷酸,全長14504個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。
前述的對鮑氏志賀氏菌13型的O-抗原特異的核苷酸,其由12個基因組成,都位于galF基因和gnd基因之間。
前述的對鮑氏志賀氏菌13型的O-抗原特異的核苷酸,其中所述的基因是轉運酶基因,包括wzx基因或與wzx有相似功能的基因;聚合酶基因,包括wzy基因或與wzy有相似功能的基因;糖基轉移酶基因,包括orf4、orf5、orf6、wbjE、orf11、orf12基因;其中所述的基因wzx是SEQ ID NO1中的1695至3032堿基的核苷酸;wz y是SEQ ID NO1中的3019至4197堿基的核苷酸;orf4是SEQ ID NO1中的4184至4969堿基的核苷酸;orf5是SEQ ID NO1中的4972至6042堿基的核苷酸;orf6是SEQ ID NO1中的6138至7172堿基的核苷酸;wbjE是SEQ ID NO1中的10193至11410堿基的核苷酸;orf11是SEQ ID NO1中的11412至11930堿基的核苷酸;orf12是SEQID NO1中的11935至13056堿基的核苷酸。
前述的對鮑氏志賀氏菌13型的O-抗原特異的核苷酸,其中源于所述的wzx基因、wzy基因或糖基轉移酶基因orf4、orf5、orf6、wbjE、orf11、orf12基因;或糖合成路徑基因中的寡核苷酸;以及它們的混合或它們的重組。
前述的對鮑氏志賀氏菌13型的O-抗原特異的核苷酸,其中所述的源于wzx基因的寡核苷酸對是SEQ ID NO1中的2012至2030堿基的核苷酸和2931至2949堿基的核苷酸SEQ ID NO1中的1887至1904堿基的核苷酸和2599至2616堿基的核苷酸;SEQ ID NO1中的2009至2026堿基的核苷酸和2493至2510堿基的核苷酸;源于wzy基因的寡核苷酸對是SEQ ID NO1中的3252至3269堿基的核苷酸和4081至4099堿基的核苷酸;SEQ ID NO1中的3206至3224堿基的核苷酸和4160至4176堿基的核苷酸;SEQ ID NO1中的3565至3582堿基的核苷酸和4083至4100堿基的核苷酸;源于orf4基因的寡核苷酸對是SEQ ID NO1中的4399至4417堿基的核苷酸和4943至4962堿基的核苷酸;SEQ ID NO1中的4368至4385堿基的核苷酸和4670至4688堿基的核苷酸;SEQ ID NO1中的4227至4244堿基的核苷酸和4821至4840堿基的核苷酸;源于orf5基因的寡核苷酸對是SEQ ID NO1中的5242至5261堿基的核苷酸和5677至5694堿基的核苷酸;SEQ ID NO1中的5071至5088堿基的核苷酸和5774至5791堿基的核苷酸;SEQ ID NO1中的5600至5617堿基的核苷酸和5889至5908堿基的核苷酸;源于orf6基因的寡核苷酸對是SEQ ID NO1中的6089至6106堿基的核苷酸和6904至6921堿基的核苷酸;SEQ ID NO1中的6306至6324堿基的核苷酸和6906至6923堿基的核苷酸;SEQ ID NO1中的6050至6067堿基的核苷酸和6996至7013堿基的核苷酸;源于wbjE的寡核苷酸對是SEQ ID NO1中的10379至10397堿基的核苷酸和10953至10970堿基的核苷酸;SEQ ID NO1中的10448至10465堿基的核苷酸和10813至10830堿基的核苷酸;SEQ ID NO1中的10199至10217堿基的核苷酸和10098至11115堿基的核苷酸;源于orf11基因的寡核苷酸對是SEQ ID NO1中的11472至11489堿基的核苷酸和11878至11894堿基的核苷酸;SEQ ID NO1中的11500至11517堿基的核苷酸和11686至11703堿基的核苷酸;SEQ ID NO1中的11689至11708堿基的核苷酸和11906至11923堿基的核苷酸;源于orf12基因的寡核苷酸對是SEQ ID NO1中的11971至11990堿基的核苷酸和12872至12891堿基的核苷酸;SEQ ID NO1中的11973至11990堿基的核苷酸和12998至13015堿基的核苷酸;SEQ ID NO1中的12682至12700堿基的核苷酸和12997至13014堿基的核苷酸。
前述的對鮑氏志賀氏菌13型的O-抗原特異的核苷酸在檢測表達O-抗原的細菌、在診斷中鑒定細菌的O-抗原和細菌的其它多糖抗原的應用。
前述的對鮑氏志賀氏菌13型的O-抗原特異的核苷酸的重組分子,而且通過插入表達可提供表達鮑氏志賀氏菌13型的O-抗原,并成為細菌疫苗。
前述的對鮑氏志賀氏菌13型的O-抗原特異的核苷酸的應用,其作為引物用于PCR、作為探針用于雜交反應與熒光檢測、或者用于制造基因芯片或微陣列,可用這些方法檢測人體和環境中的細菌。
前述的對鮑氏志賀氏菌13型的O-抗原特異的核苷酸的分離方法,其中包括下述步驟(1)基因組的提取在5mL的LB培養基中37℃過夜培養鮑氏志賀氏菌13型,離心收集細胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時,再加入3ul 10mg/ml的RNase,65℃ 30分鐘。加等體積酚抽提混合物,取上清液再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)抽提兩次,取上清液再用等體積的乙醚抽提以除去殘余的酚。上清液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,將DNA重懸于30ul TE中,基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴增鮑氏志賀氏菌13型中的O-抗原基因簇鮑氏志賀氏菌13型的O-抗原基因簇通過Long PCR擴增。首先根據經常發現于O-抗原基因簇啟動子區的JumpStart序列設計上游引物(5’-ATT GTG GCT GCA GGG ATCAAA GAA AT-3’),再根據O-抗原基因簇下游的gnd基因設計下游引物(5’-TAGTCG CGT GNG CCT GGA TTA AGT TCG C-3’)。用Boehringer Mannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應程序如下在94℃預變性2分鐘;然后94℃變性10秒,60℃退火30秒,68℃延伸15分鐘,這樣進行30個循環。最后,在68℃繼續延伸7分鐘,得到PCR產物,用0.8%的瓊脂糖凝膠電泳檢測PCR產物的大小及其特異性。合并6管long PCR產物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產物;(3)構建O-抗原基因簇文庫用被修改的Novagen DNaseI Shot Gun法構建O-抗原基因簇文庫。反應體系是300ng PCR純化產物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應在室溫中進行。酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而后加入2ul 0.1M EDTA終止反應。合并4管同樣的反應體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中。隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25 ul100mM DTT和5單位的T4DNA聚合酶,11℃ 30分鐘,將酶切產物補成平端,75℃終止反應后,加入5單位的Tth DNA聚合酶及其相應的緩沖液并將體系擴大為80ul,70℃反應20分鐘,使DNA的3’端加dA尾。此混合物經等體積氯仿∶異戊醇(24∶1)抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接24小時,總體積為90ul。其中有9ul的10×buffer和25單位的T4DNA連接酶。最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產物;用BiO-Rad公司的電轉化感受態細胞的制備方法制備感受態大腸桿菌DH5a細胞,取2-3ul連接產物與50ul感受態大腸桿菌DH5a混合后,轉到BiO-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒至6.0毫秒,電擊后立即在杯中加入1ml的SOC培養基使菌復蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養基上,在37℃過夜培養,次日得到藍白菌落,將得到的白色菌落即白色克隆轉到含有氨卞青霉素的LB固體培養基上培養,同時從每個克隆中提取質粒,并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構成了鮑氏志賀氏13型的O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在700bp以上的120個克隆由上海生物工程有限公司用ABI377型DNA自動測序儀對克隆中的插入片段單向進行測序,使序列達到80%的覆蓋率。剩余20%的序列再根據已得到的序列設計引物,再從鮑氏志賀氏菌13型的基因組DNA中直接PCR并對PCR產物測序或對已知序列進行反向測序及測通,獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical Research Council)分子生物學實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到鮑氏志賀氏菌13型的O-抗原基因簇的核苷酸全長序列,序列的質量主要由兩個方面來保證1)對鮑氏志賀氏菌13型的基因組作6個Long PCR反應,然后混合這些產物以產生文庫。2)對每個堿基,保證3個以上高質量的覆蓋率。在得到鮑氏志賀氏菌13型O-抗原基因簇的核苷酸序列后,用美國國家生物技術信息學中心(The National Center forBiotechnology Information,NCBI)的orffinder發現基因,找到12個開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發現這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質序列間的精確比對,最后得到鮑氏志賀氏菌13型的O-抗原基因簇的結構;(6)特異基因的篩選針對鮑氏志賀氏菌13型的O-抗原基因簇中的wzx、wzy、orf4、orf5、orf6、wbjE、orf11、orf12基因設計引物;在每個基因內各設計了三對引物,每對引物分布在相應基因內的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,所有引物都在鮑氏志賀氏菌13型中得到陽性結果,在其他組中都沒有擴增到任何大小正確的帶,即在大多數組中沒有得到任何PCR產物帶,雖然在少數組中得到PCR產物帶,但其大小不符合預期大小,所以wzx、wzy、orf4、orf5、orf6、wbjE、orf11、orf12基因對鮑氏志賀氏菌13型的O-抗原都是高度特異的。
也就是本發明的第一個方面,提供了鮑氏志賀氏菌13型的O-抗原基因簇的全長核苷酸序列,它的全序列如SEQ ID NO1所示,全長14504個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。通過本發明的方法得到了鮑氏志賀氏菌13型的O-抗原基因簇的結構(在
圖1中列出),它總共由12個基因組成。在圖1中每個基因用方框表示,并在方框內寫入基因的名稱,數字表示的是O-抗原基因簇中的開放閱讀框(orf)的順序。開放閱讀框的起始密碼子可以是ATG,也可以是GTG。在O-抗原基因簇的兩端是galF基因和gnd基因,這兩個基因不負責O-抗原的合成,我們只是用它們的一段序列設計引物來擴增O-抗原基因簇的全長序列。
本發明的第二個方面,提供了鮑氏志賀氏菌13型的O-抗原基因簇中的基因,即轉運酶基因(wzx基因或與wzx有相似功能的基因);聚合酶基因(wzy基因或與wzy有相似功能的基因);糖基轉移酶基因,包括orf4、orf5、orf6、wbjE、orf11、orf12基因;細菌多糖抗原中特殊的糖合成路徑基因,包括wbjB、wbjC、wbjD基因,它們在O-抗原基因簇中的起始位置和終止位置及核苷酸序列都列在表4中。本發明尤其涉及到糖基轉移酶基因、轉運酶基因和聚合酶基因,因為糖合成路徑基因即合成核苷二磷酸單糖的基因現在被預示對較多胞外多糖是常見的、共同的,對細菌的O-抗原并不是很特異的,而本發明涉及到的糖基轉移酶基因、轉運酶基因和聚合酶基因對鮑氏志賀氏菌13型的O-抗原是高度特異的。
本發明的第三個方面,提供了源于鮑氏志賀氏菌13型的O-抗原基因簇中的wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因和糖基轉移酶基因,包括orf4、orf5、orf6、wbjE、orf11、orf12基因的寡核苷酸,它們是這些基因中的任何一段寡核苷酸。但是,優先被用的是列于表1中的寡核苷酸對,在表1中也列出了這些寡核苷酸對在O-抗原基因簇中的位置及以這些寡核苷酸對為引物所做的PCR反應的產物的大小,這些PCR反應可用表中的退火溫度進行。這些引物只在以鮑氏志賀氏菌13型為模板進行的PCR擴增中得到預期大小的產物,而在以表2所列的其它菌為模板進行的PCR擴增中都未得到預期大小的產物。更詳細地說,以這些寡核苷酸對為引物所做的PCR反應在大多數細菌中均未得到任何產物,雖然在有些菌中得到了PCR產物帶,但其大小不符合預期大小,這是由于引物結合到基因組的別的位置造成,這種問題可通過用基因內的其它引物做PCR來避免。所以,可以確定這些引物即表1所列的寡核苷酸對鮑氏志賀氏菌13型及其O-抗原是高度特異的。
所述的對鮑氏志賀氏菌13型的O-抗原特異的核苷酸的分離方法包括下述步驟1)基因組的提取;2)PCR擴增鮑氏志賀氏菌13型中的O-抗原基因簇;3)構建O-抗原基因簇文庫;4)對文庫中的克隆測序;5)核苷酸序列的拼接及分析;6)特異基因的篩選。
本發明的其他方面由于本文的技術的公開,對本領域的技術人員而言是顯而易見的。
如本發明所用,“寡核苷酸”主要是指來源于O-抗原基因簇中的編碼糖基轉移酶的基因、編碼轉運酶的基因和編碼聚合酶的基因內的一段核苷酸分子,它們在長度上可改變,一般在10到20個核苷酸范圍內改變。更確切的說這些寡核苷酸是源于wzx基因(核苷酸位置是從SEQ ID NO1的1695至3032堿基),wzy基因(核苷酸位置是從SEQ ID NO1的3019至4197堿基),orf4基因(核苷酸位置是從SEQ ID NO1的4184至4969堿基),orf5基因(核苷酸位置是從SEQ ID NO1的4972至6042堿基),orf6基因(核苷酸位置是從SEQID NO1的6138至7172堿基),wbjE基因(核苷酸位置是從SEQ ID NO1的10193至11410堿基),orf11基因(核苷酸位置是從SEQ ID NO1的11472至11930堿基)orf12(核苷酸位置是從SEQ ID NO1的11935至13056堿基)。源于以上基因內的寡核苷酸對鮑氏志賀氏菌13型(SEQ ID NO1)是高度特異的。
此外,有時兩個遺傳相似的編碼不同O-抗原的基因簇通過基因重組或突變產生新的O-抗原,從而產生新的細菌類型,新的突變株。在這種環境中,需要篩選出多對寡核苷酸同重組基因雜交以提高檢測的特異性。因此,本發明提供了一整套多對寡核苷酸的混合物,它們源于糖基轉移酶基因;源于轉運酶和聚合酶基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因;也源于糖合成路徑基因。這些基因的混合物對一個特殊的細菌多糖抗原來說是特異的,從而使這套寡核苷酸對這個細菌的多糖抗原是特異的。更具體地說,這些寡核苷酸的混合物是源于糖基轉移酶基因、wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因中的寡核苷酸與源于糖合成路徑基因中的寡核苷酸的組合。
在另一方面,本發明涉及寡核苷酸的鑒定,它們可以用于檢測表達O-抗原的細菌和在診斷中鑒定細菌的O-抗原。
本發明涉及到一種檢測食品中的一個或多個細菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個基因的寡核苷酸特異性雜交,這些基因是(i)編碼糖基轉移酶的基因(ii)編碼轉運酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個寡核苷酸能與至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交,這些細菌是鮑氏志賀氏菌13型。可用PCR方法檢測,更可以將本發明方法中的核苷酸標記后作為探針通過雜交反應如southern-blot或熒光檢測,或者通過基因芯片或微陣列檢測樣品中的抗原及細菌。
本發明者考慮到以下情況當單個的特異的寡核苷酸檢測無效時,寡核苷酸的混合物能與靶區域特異性雜交以檢測樣品。因此本發明提供了一套寡核苷酸用于本發明所述的檢測方法。這里所說的寡核苷酸是指源于編碼糖基轉移酶的基因、編碼轉運酶的基因和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因的寡核苷酸。這套寡核苷酸對一個特殊的細菌的O-抗原來說是特異的,這一特殊的細菌O-抗原是由鮑氏志賀氏菌13型表達的。
另一方面,本發明涉及到一種檢測排泄物中的一個或多個細菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個基因的寡核苷酸特異性雜交,這些基因是(i)編碼糖基轉移酶的基因(ii)編碼轉運酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個寡核苷酸能與至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交。這些細菌是鮑氏志賀氏菌13型。可用本發明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發明中的寡核苷酸分子標記后作為探針通過雜交反應如southern-blot或熒光檢測,或者通過基因芯片或微陣列檢測樣品中的抗原及細菌。
一般一對寡核苷酸可能與同樣的基因雜交也可與不同的基因雜交,但它們中必須有一個寡核苷酸能特異性雜交到特殊抗原型的特異序列上,另一個寡核苷酸可雜交于非特異性區域。因此,當特殊的多糖抗原基因簇中的寡核苷酸被重新組合時,至少能選出一對寡核苷酸與多糖抗原基因簇中特異基因混合物雜交,或者選出多對寡核苷酸與特異基因的混合物雜交。甚至即使當一個特殊的基因簇中所有基因都獨一無二時,此方法也能應用于識別此基因簇內的基因混合物的核苷酸分子。因此本發明提供了一整套用于檢測本發明方法的多對寡核苷酸,在這里多對寡核苷酸是源于編碼糖基轉移酶的基因、編碼轉運酶和聚合酶的基因包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因,這套寡核苷酸對一個特殊的細菌多糖來說是特異的,這套寡核苷酸可能是糖合成中必須基因的核苷酸。
另一方面,本發明也涉及到一種檢測源于病人的樣品中的一個或多個細菌多糖抗原的方法。樣品中的一個或多個細菌多糖抗原可以使樣品能與以下至少一個基因中的一對寡核苷酸中的一個特異性雜交,這些基因是(i)編碼糖基轉移酶的基因(ii)編碼轉運酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個寡核苷酸能與樣品中的至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交,這些細菌是鮑氏志賀氏菌13型。可用本發明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發明中的寡核苷酸標記后作為探針通過雜交反應,或者通過基因芯片或微陣列檢測樣品中的抗原及細菌。
更詳細地說,以上描述的方法可以理解為當寡核苷酸對被使用時,其中的一個寡核苷酸分子能雜交到一個并不是來源于糖基轉移酶基因、wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因的序列上。此外,當兩個寡核苷酸都能雜交上時,它們可能雜交于同一基因也可能雜交到不同基因上。也即,當交叉反應出現問題時,可選擇寡核苷酸的混合物來檢測混合的基因以提供檢測的特異性。
本發明者相信本發明不必限于以上所提的核苷酸序列編碼的特定的O-抗原,而且廣泛應用于檢測所有表達O-抗原和鑒定O-抗原的細菌。而且,由于O-抗原合成和其他多糖抗原(如細菌胞外抗原)合成之間的相似性,發明者相信本發明的方法和分子也應用于這些其他的多糖抗原。
本發明首次公開了鮑氏志賀氏菌13型的O-抗原基因簇的全長序列,而且可從這個未被克隆的全長基因簇的序列中產生重組分子,通過插入表達可產生表達鮑氏志賀氏菌13型的O-抗原,并成為有用的疫苗。
其次是感受態細胞的制備參照Bio-Rad公司提供的方法制備感受態細胞大腸桿菌DH5α。取一環大腸桿菌DH5α單菌落于5ml的LB培養基中,180rpm培養10小時后,取2ml培養物轉接到200ml的LB培養基中,37℃ 250rpm劇烈振蕩培養到OD600 0.5左右,然后冰浴冷卻20分鐘,于4℃ 4000rpm離心15分鐘。傾盡上清液,用冷的冰預冷的去離子滅菌水200ml吹散菌體,于4℃ 4000rpm離心15分鐘。再用冷的冰預冷的去離子滅菌水100ml吹散菌體,于4℃ 4000rpm離心15分鐘。用冷的冰預冷的10%的甘油懸浮細胞,4℃6000rpm離心10分鐘,棄上清液,最后沉淀用1ml冰預冷的10%的甘油懸浮細胞,即為感受態細胞。將制得的感受態細胞分裝為50ul一管,-70℃保存。
最后是電轉化感受態細胞取2-3ul連接產物與50ul感受態大腸桿菌DH5α混合后,轉到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒-6.0毫秒。電擊后立即在杯中加入1ml的SOC培養基使菌復蘇。然后立即將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養基上37℃倒置過夜培養,次日得到藍白菌落。將得到的白色菌落即白色克隆轉到含有氨芐青霉素的LB固體培養基上培養,同時從每個克隆中提取質粒并用EcoRI酶切鑒定其中的插入片段的大小,得到白色克隆群構成了鮑氏志賀氏菌13型的O-抗原基因簇文庫。實施例4對文庫中的克隆測序從文庫中挑選插入片段在700bp以上的120個克隆由上海生物工程有限公司用ABI377型DNA自動測序儀對克隆中的插入片段單向進行測序,使序列達到80%的覆蓋率。剩余20%的序列再根據已得到的序列設計引物,再從鮑氏志賀氏菌13型的基因組DNA中直接PCR并對PCR產物測序或對已知序列進行反向測序及測通,獲得O-抗原基因簇的所有序列。實施例5核苷酸序列的拼接及分析用英國劍橋MRC(Medical Research Council)分子生物學實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到鮑氏志賀氏菌13型的O-抗原基因簇的核苷酸全長序列,序列的質量主要由兩個方面來保證1)對鮑氏志賀氏菌13型的基因組作6個Long PCR反應,然后混合這些產物以產生文庫。2)對每個堿基,保證3個以上高質量的覆蓋率。在得到鮑氏志賀氏菌13型O-抗原基因簇的核苷酸序列后,用美國國家生物技術信息學中心(The National Center for BiotechnologyInformation,NCBI)的orffinder發現基因,找到12個開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發現這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質序列間的精確比對,最后得到鮑氏志賀氏菌13型的O-抗原基因簇的結構,如表3所示。
通過檢索和比較,發現orf1是一個轉座子,它帶有插入序列元件IS200的轉座酶,命名為orf1。orf2與Yersinia pseudotuberculosis及其他菌的類似于O-抗原轉運酶的蛋白在447個氨基酸的序列中有25%的相同性,此外與Shigella boydii的wzx基因在301個氨基酸的序列中有21%的相同性。并且通過Eisenberg等人的算法[Eisenberg,D,Schwarz,E.etal(1984).Analysisof membrane and surface protein sequences with the hydrophobic momentplot.J.Mol.Biol.179125-142]發現orf2有12個潛在的穿膜區,它與許多wzx蛋白相似,而且在wzx蛋白的氨基端有一個大約50個氨基酸的保守基序,所以可以確定orf2是wzx基因,命名為wzx。orf3與Escherichia coli K12的wzy基因在391個氨基酸的序列中有20%的相同性,與Shewanellaoneidensis MR-1的脂多糖生物合成中的聚合酶在400個氨基酸的序列中有20%的相同性。另外通過Eisenberg算法得知orf3有10個潛在的穿膜區,與其他的O-抗原聚合酶有相似的二級結構,所以確定orf3是wzy基因,命名為wzy。orf4與Neisseria meningitidis的LgtB蛋白在174個氨基酸中有24%的相同性,與Pasteurella multocida的LosA蛋白在212個氨基酸中有26%的相同性,所以確定orf4是一個糖基轉移酶,命名為orf4。orf5與Bacillussubtilis的tagB蛋白在55個氨基酸中有40%的相同性,tagB蛋白是一個轉移酶,orf5與其他菌的轉移酶也表現出相同性,所以確定orf5也是一個轉移酶,命名為orf5。 orf6與Pseudomonas aeruginosa的糖基轉移酶WbpX在30個氨基酸中有56%的相同性,與Salmonella enterica subsp.Enterica的推測的糖基轉移酶在62個氨基酸中有33%的相同性,所以orf6也是一個糖基轉移酶基因,命名為orf6。orf7與Pseudomonas aeruginosa和Pasteurella multocida的WbjB蛋白在344個氨基酸中有74%的相同性,與Escherichia coli的Fnl1蛋白在343個氨基酸中有76%的相同性,這兩個蛋白的功能是一樣的,都與L-FucAc的合成有關[Bernd Kneidinger et al.“Three Highly Conserved Proteins Catalyze the Conversion ofUDP-N-acetyl-D-Glucosamine to Precursors for the Biosynthesis of Oantigen in Pseudomonas aeruginosa O11 and Capsule in Staphylococcusaureus Type 5-Implications for the UDP-N-Acetyl-L-FucosamineBiosynthetic Pathway.JBC Papers in Press.Published on December 2,2002as manuscript M203867200]。合成L-FucAc需要三個酶催化五步反應完成,WbjB蛋白是催化L-FucAc合成的第一個酶。所以可以確定orf7是關于L-FucAc的糖合成基因,命名為wbjB。orf8與Vibrio cholerae O37的還原酶基因在284個氨基酸中有51%的相同性,而在L-FucAc的合成反應中WbjC蛋白是一個還原酶,它是催化L-FucAc合成的第二個酶,所以可以確定orf8也編碼WbjC蛋白,將此基因命名為wbjC。orf9與Escherichia coli的Fn13蛋白在369個氨基酸序列中有68%的相同性,81%的相似性,與Pseudomonasaeruginosa的WbjD蛋白在374個氨基酸序列中有66%的相同性,79%的相似性,這兩個蛋白的功能是一樣的,是催化L-FucAc合成的最后一個酶。所以可以確定orf9也編碼WbjD蛋白,將此基因命名為wbjD。orf10與Pseudomonasaeruginosa的WbjE蛋白在238個氨基酸序列中有24%的相同性,WbjE蛋白是L-Fucose的轉移酶。另外,orf10還與Bacillus anthracis的第一組糖基轉移酶的基序“Glycos-transf-1”一樣,所以orf10是一個糖基轉移酶,轉移L-Fucose,將此基因命名為WbjE。 orf11與Escherichia coli的WbuC蛋白在133個氨基酸中有45%的相同性,WbuC蛋白是一個糖基轉移酶。此外,orf11與Escherichia coli F632的waaK及Escherichia coli K-12的RfaK基因具有相同性,這兩個基因是糖基轉移酶基因,所以確定orf11也是一個糖基轉移酶,命名為orf11。orf12與Mesorhizobium loti的乙酰基轉移酶在371個氨基酸中有32%的相同性,與Micromonospora megalomicea subsp nigra的乙酰基轉移酶在352個氨基酸中有26%的相同性,另外orf12是一個穿膜蛋白,所以確定orf12也是一個乙酰基轉移酶,命名為orf12。實施例6特異基因的篩選針對鮑氏志賀氏菌13型的O-抗原基因簇中的wzx、wzy、orf4、orf5、orf6、wbjE、orf11、orf12基因設計引物,這些基因在核苷酸序列中的位置見表1。
表1列出了鮑氏志賀氏菌13型的O抗原基因簇中糖基轉移酶基因和寡糖單位處理基因及基因內的引物及PCR數據。在表中列出了鮑氏志賀氏菌13型的O抗原基因簇的糖基轉移酶基因、轉運酶基因和聚合酶基因及它們的相應的功能和大小。在每個基因內,我們各設計了三對引物,每對引物分布在相應基因內的不同地方以確保其特異性。在表中還列出了每個引物在SEQ IDNO1中的位置和大小。以每對引物用表中所列的相應的退火溫度以表2中的所有菌的基因組為模板進行PCR,得到了相應的PCR產物,其大小也列于表中。
mdh(malate dehydrogenase)基因是存在于所有的大腸桿菌的基因組中且高度保守的一個基因,所以我們根據mdh基因設計了引物上游引物(5’-TTCATC CTA AAC TCC TTA TT-3’)和下游引物(5’-TAA TCG CAG GGG AAA GCAGG-3’),然后從166株大腸桿菌中提取基因組,方法如前所述。用這對引物從166株大腸桿菌的基因組中PCR以鑒定大腸桿菌并檢測其基因組的質量。
表2是用于篩選特異基因的166株大腸桿菌和43株志賀氏菌及它們的來源,為了檢測的方便,我們將它們每8-10個菌分為一組,總共27組,它們的來源都列于表中。在第23組中含有鮑氏志賀氏菌13型的基因組DNA作為陽性對照。以每組菌做模板,用表1中的每對引物按如下條件做PCR在94℃預變性2分鐘后,94℃變性15秒,退火溫度因引物的不同而不同(參照表1),退火時間是50秒,72℃延伸2分鐘,這樣進行30個循環。最后在72℃繼續延伸10分鐘,反應體系是25ul。反應完畢后,取10ulPCR產物通過0.8%瓊脂糖凝膠電泳檢測擴增出的片段。
對于wzx、wzy、orf4、orf5、orf6、wbjE、orf11、orf12基因,每個基因都有三對引物被檢測,每對引物只在第23組中做PCR后得到了預期大小的正確的一條帶,在其他組中都未得到同樣大小的特異性帶。以第23組中的每個菌的基因組DNA做模板PCR后,發現只在鮑氏志賀氏菌13型中得到了陽性結果。更詳細地說,以上每個基因的每一對引物都在鮑氏志賀氏菌13型中得到預期大小的正確的PCR產物帶,在大多數組中都沒有得到任何PCR產物帶,雖然在少數組中得到PCR產物帶,但其大小不符合預期大小,是非特異性帶,所以wzx、wzy、orf4、orf5、orf6、wbjE、orf11、orf12基因對鮑氏志賀氏菌13型及其O-抗原都是高度特異的。
最后,通過PCR從鮑氏志賀氏菌13型中篩選到對鮑氏志賀氏菌13型的O-抗原高度特異的基因wzx、wzy、orf4、orf5、orf6、wbjE、orf11、orf12基因。而這些基因內的任何一段10-20nt的寡核苷酸對鮑氏志賀氏菌13型的O-抗原是特異的,尤其是上述每個基因中的引物即寡核苷酸對經PCR檢測后證實對鮑氏志賀氏菌13型是高度特異的。所有的這些寡核苷酸都可用于快速準確地檢測人體和環境中的鮑氏志賀氏菌13型,并能鑒定它的O-抗原。
表3是鮑氏志賀氏菌13型的O-抗原基因簇的結構表,在表中列出了鮑氏志賀氏菌13型的O-抗原基因簇的結構,共由12個基因組成。
表4是鮑氏志賀氏菌13型的O-抗原基因簇中的基因的位置表,在表中列出了鮑氏志賀氏菌13型的O-抗原基因簇中的所有開放閱讀框在全序列中的準確位置,在每個開放閱讀框的起始密碼子和終止密碼子的下面劃線。
序列列表SEQUENCE LISTING<110>南開大學<120>對鮑氏志賀氏菌13型的O-抗原特異的核苷酸及其應用<130>對鮑氏志賀氏菌13型的O-抗原特異的核苷酸及其應用<160>1<170>PatentIn version 3.1<210>1<211>14504<212>DNA<213>Shigella boydii<400>1attgtggctg cagggatcaa agaaatcctc ctggtgactc atgcgtccaa gaacgcagtc60gaaaaccact tcgacacttc ttatgaacta gaatctctcc ttgaactgcg cgtaaaacgc120cagttgctgg cagaggttca gtccatctgc ccaccgggcg ttaccattat gaacgtgcgt 180cagggcgaac ctttaggttt gggccactcc attctgtgtg ccagacctgc cattggcgac 240aatccattcg ttgtggtgct gccggatgtc gttattgatg acgccagcgc cgatccgctg 300cgttacaacc ttgccgccat gattgcgcga ttcaacgaaa cgggtcgtag ccaggttctg 360gcaaaacgta tgccgggtga cctttctgaa tactctgtca tccagactaa agaaccgctg 420gatcgtgaag gcaaagttag tcgcattgtt gaatttatcg aaaaacccga tcagccgcag 480acgctggact cagacattat ggcggttggt cgctatgtgc tttctgcgga catttggcct 540gaactggagc ggactcaacc cggtgcatgg ggacgtattc agctaactga tgcaattgct 600gaactggcga aaaaacagtc cgttgacgca atgttaatga cgggtgacag ctacgattgc 660ggtaagaaaa tgggctacat gcaggcattt gtgaagtacg gactacgcaa cctgaaagaa 720ggagcgaagt tccgcaaagg gattgagaag ctgttgttag aataagatat tgcgcgacgg 780gatagaatgt tggtgatgta acagaacggc agatgattgt ggttgaggaa gagctcactt 840cacagtaact gccgtatttg ttgtccctaa actacctttg gggaggtggt gattaatcct 900gtaaggatat attctgaata atgttcactt accacaagta aaaggggaca aaccgacaga 960ggaatttaca gaagttcatc aaatatgcat tgcgttgtaa atatcacata gtctggacgc1020caaagtaccg cttcaggagc cagcaggata aattgggtaa agagctgtac agagccacct1080atattttgtg cagaataaaa gattgcgagg ttcaggagtt aaatatacaa ccagatcatg1140tgcatcttgt agcaatagtg cttctaaaaa tctcaatata tactctaatg gggcacctga1200aggtcgcagt gcaatcaggc tctacaatcg gttttcgcat atcaggaaga aactatggaa1260atcatttttg gccatggggc tgtgttgccg atatggtagg cgtatcagac gatatgtgat1320acatcaggaa aagatagaac aaacatatga acagtaaatg gtgttgctag agtagaacgc1380gggatatgac ggttgccccc ttatcggaga gtattctgaa aagctacctc atcaggagat1440gatcttttat tattaaaaac aaccactaaa attagtgatt gcatggcgtt ttttgacaaa1500aatgtcggat ttttccttgt tttataaagg gattgtgctc aaaatagtgg gctgaattgg1560aagggagggt tcctcgcaaa cgcgaaggtt ggcgggagtt ggcttgcgac acacagaatt1620ttgtgcagtg cactggtagc tgttgagcca ggggcggtag cgtttctgat gtgtgtgatt1680tttacccatt taaaatgttc agcggaaaaa ttatgaagag tgccattagg agtggtaaag1740agcaattttt aatgggagtc atctataaag cattatttat gttgataaca tcaataaatg1800ctttagtaat agtaaagcta ctgactcctg aagagttagg tatttggtat atttttatgg1860cgcttcaaac gcttttattt atcttaaata gcgccttgac tccgaatatt tcaagacagt1920acagcattgc atttacggat attggtgagg gatttgatcc ccgtcttttt cacacaaaag1980taattattat ttataataag ataattttag tggcaacagt catgggagtg ttttttactc2040tgacttatct taactatgtg cttgatatat ttaggttggc taatgtttct atattactat2100cttgggtaat tgtttttgct tccattttga tggaaattta ttttacatcg tatgagtgtg2160cattaaatgg gtttggtgaa ttccaaaaag ttaacaaagt aaattttata tcgagattga2220ttctaacgtt aagcattttt acactgttgt tatctgatgt gcatagtaat ggcttgctaa2280tattctgtgg gttatatttt tttagtaata taataaaaag ggttatggtt attaatcttt2340ttaatcatac ctttaaagac aaagggctaa aagaatcgcg gaaaacaata gatttttttg2400atagaatcag ctgtaagcta caaaaactgt cctttttatc actactttca tcaattgggg2460gggtcctcat tgtcagaagc ggaatgttta ttttgccctt ctatgtgcca atggaccaag2520tagcatctta tggattaacc tatcagcttt ttgagctcgg gtttaatgtc atatttacta2580tttctataat agcaactccc gcatggatct cagcctataa aaataatcca gaaggattaa2640aaaaatcctt cacttgggta aagtatatat ctctattgct aatgttaatt tgtgggctgt2700taattacatt tctgggtaat atcatattag agtttgctga tgttgaaacc agagtgcagt2760cagttatcct ttgtttttat ttgctggtaa tttttgtgtt gcaaattaat cacagtattt2820ctgggcaact cctaactatt cagaataaaa ttccttttgc ttatgcatca ttcttgagtg2880ggatttttac attagtgtta tcggttgttt taattaaata ttattcagtt cttggcgcta2940tttatgcgat attaatcagt cagctaatat ataataattg gaagtggcca tatgaagcat3000ataaattctt gagggtgcat ggaaatgtat gagggaaaat taaaaaacaa aatattaagt3060cttttcctct tatgtgaaac cttttgcttt atatatataa tatataataa ggaattagtt3120tccgattatt tggggagggc gataacttta agtgagttta caataagttg tatttttttt3180ctgctattgt tattttattt tttgttccat actttgtggg tgatttcaga aaaaataatt3240aaatccagga aaaagattgg tagcgtcggg aatttgaatc tttttgttct tgttcttata3300ttcttatatt ttatattaaa tttaaaaaca ggtattggta aagttggtca agaggataat3360attactttaa caggattaga taaattatta tttgcagcac caatattttt taaaataaat3420tttctcatgt atatttacgc tgcggggaat agaaataaga atcgtctgta ttactttaat3480ttgttctttt tcgcatttgc agaattaact cggggagtat cttttacaat attgttgttg3540ttgataatag aatacaataa gattagacgc ttcatttccc ttaggtattt tttattttca3600ttgctttttg gtatattgtt aattaatgtg atttacaatg tgaaatttta cgttaggatg3660ggggcgaaat acgagtatat tgatatctac acgtctttaa ttatgttgat gggacgtttg3720agtatattgt ccaatttact atttattcat gataatctct ctgatataag attatatttt3780tatggctcag ggtaccaagg agttgttcat gagtttttag agtcgttgac acctgtacca3840tcattattcg gtattaacga gaaagtgttg gagtttggta aaatattatt ctcatattcg3900aatgttactt ttaccagcgc aactgcagca tcgctattag gtatcattta tatttatcca3960aattcaattt tcaatgcgat tacaataata tgtcttagtt ggatttatat acatataatt4020acgggttatc ttgagtttag tcgaatgcaa cgagtagtcg cgtacttttt tgtgctgctt4080gcactttacc agggcttcat ggccatatta agtaattata tatatgcatt aacaatatat4140ttccttatag cctgtgccag aaatctttta ttgagtaaga aatatgaaac aatttagtat4200taaaatcttg tcattggcag atgctatcga gcgtaggagg aaagtatcta gagagtttga4260gctgaaatca gtactgccat tctcattttt taacggtatt tatggtaaga cactaagtaa4320agaaaaatta gatacaatat actcttcaga gctggcgcag aaagtactcc atcggcaact4380aactgcgggg gaaattggtg caacctactc acattacttg attttccgtg aggcatatga4440gcgtggggat gagtttgttg ttgttctgga agatgactgt tatatagata gaaattttga4500taccgtgtta acatcaattc ttgataagaa aaatcctaca gatgatgaaa ttatctttat4560tcaaagacat acgagcgaaa actcacatat aataagatct ttaggcagtg agaagataaa4620taaaaattat accttacatc gtatgctagg tagcgcgcag tattttgttg gtgcatacgg4680gtatatcgta actagagctg caatgaaaaa aatgatcgat acatacttgc caatatattg4740tgtatgtgat cattggtatt ttataaagaa gaaatgtcag atagaaaaat ttagtgtatt4800atccccagct attgttttca caaatgatga ggatgttagg aaaatagata gttttgtaga4860cattgaaaga agagaaatcg ctgttttcaa atcagtaggt aaaatagcaa aactaaaaat4920tttaattaag aaaattattt taccaatatt aaataaagac tgggaataaa agtgctgcgc4980tattataaag tattgactgt tctgcttaga ttaattatag cttttatatt gtaccctatt5040gcatatgttt ttttgaatca caaaaaatat ttcatcattg gcacacgcaa tggtgttcga5100gggcatgata atgctgagta ttttttgtct tattgtacaa gacacaatat taatacaaaa5160gtaatttata atgatgctta tcagaaagat gaattatgca aaaactctat aaaaagtata5220ttgtatatct tatgtgcaaa caatgtttac ataacgcact ctgaatcaga tgttttagat5280tatttttggc gttttattcc cggtataaag tatatattta tacagcatgg agttattgga5340ataaaaaaac ttccggatta tgaaaagaaa agatatcata gatatgtttc tagtagtgaa5400tatgaaacag aaatttttag gaatttcttc catttgaaca gtgataaaat tattaaatct5460ggacttccac gttttgattt ctatgactat aaccgttcaa aaaatgatga aattaaatcc5520tgcttaatta tgtttacctg gagaaaatcg gattctggca aggctaaatt aattaaaaaa5580tatactgaga tggttacttg cctgtcaaat gaagctctca ataaaattta catttgtgtt5640catgaagcaa acttaagtac atttaaggtc ttgcttgaag aatcgcttga attggatgat5700aggttttcat ttatagaaaa tgataaatta tcatgtatta ttcaaagtac agaactttta5760atcactgact actcgagtgt tgcatgggat tatttatatc agaataaata tattttattt5820tataccccag atattgatga ttataaaaat acaactggat tgtattgtga tttttccgat5880ttttttggcg cacatcttat gaatttcagt agaatcaatt atccagtttt ggcatggatt5940atgcaagaaa atgaaattaa aaataaaaac tttcttgcaa ggtataaatt ttataacatg6000catgcaggca tacactctga gtatatagtg aagaatagtt aaaattatga gggcgaacat6060tgacaactat tattgtctca gcaactgcat tggctaagag cggtgcatta acaatattaa6120atgagtttat tgagtatgtg tcaaatttaa aaaaatataa gtttataatt tttattcctg6180atagcattaa tttgcctaaa gcagttaata tcagatatat ccctgtgcct aaaaaaaatt6240ggctatctag gatatattgg gatagttatg gcttaagaaa atatattcga gtaaatcggc6300ttcaatatca ggcggtcatt tctcttcaga atacatctgt aaatgtagaa ggaaaacaga6360taatatatct tcaccaatct ataccattta tagattttga tattccactg acaagtttat6420ttaatttaaa attatggcta tacaagcgat tttattctta ttttatattt ttatttgtta6480acaagaatac ttcttttatt gtccaagcca aatggctgaa agagctcctt tctgataagt6540atcatatcga tgcaaaaaaa atatctatca taaagcccaa agcaagatat gttcctctag6600caactaactc tattcataat gtagccaact tatctaagca attctgtaat attatttatc6660cagcaacacc aatattttat aaaaatcatt gtgttattat tgatgctctt aggattttaa6720gagaacagcg caatattgat aacttatgtt ttaatgtcac cttttcaaaa ggtgagtatg6780ctaagtttga cgatttggtt aggcgttata acttgggtaa gaatattcgc tatttgggat6840atttgacccg agatgaatta tatcaacatt atgataatag cgcttttatg gtctacccca6900gttatgtgga aacctgtggg cttccgttgc tggaggctgc ttctaagcag ttgccaataa6960tcgctagtga tctgccttat gcatgtgaaa tgcttgaggc ttatactggc gtcgtttatg7020ttaagttcaa tgtctctacc gaatgggctc gagaaattga tacgatggcc cgagctggtg7080aaactcgaat tattccgccg ttattaaaag cggagaatga ttctgattgg aataagttag7140ataatattat tgaaggaaaa gatgatgttt aaaaataaaa cactactaat tacaggtgga7200actggatcgt ttggtaatgc tgtgctccgt cgttttttat cgacggatat tggcgaaata7260aggatcttta gtcgcgatga aaagaaacaa gatgatatgc gtaaaaaata ttcggatccg7320aagttgaagt tttatattgg cgacgtaagg gattataaca gtattttgtc tgcaactcgc7380ggagttgatt atatctatca tgccgcagca ttgaagcagg ttccttcctg cgagttttat7440ccaatggaag cagtaaaaac taacgttatt ggtacagata atgtgttaga agctgcaata7500gcgaataaag ttcagcgtat agtctgtttg agtacggata aagccgtata tcctatcaat7560gcaatgggaa catcaaaagc aatgatggaa aaagtaattg ttgcaaaatc acgcaatttg7620cctgaaggca taactatttg tgctacccgt tatggaaatg taatggcttc gcgtggatcg7680gtgataccat tatttataaa tcaaattaaa aatggtaacc ctataactat taccgatccc7740gatatgactc gctttatgat gacccttgat gatgccgtcg atttagtatt acatgcgttc7800gaatacggaa ataatggtga tattttcgta caaaaggctc ctgcggcaac aattgaaaca7860cttactaaag caattcaaca ggttacaaac gcacttgatc atcagataaa tattatcggg7920acacgtcatg gtgaaaaatt gtatgaagtt ctctgtagcc gtgaagaaat ggctgtagca7980gaagatcagg gaaattacta ccgtatccct gctgacaatc gagatttaaa ctatgagaaa8040tactttgaga agggtaacaa agatgtttcc ttactcgagg attataattc gcataatact8100attagacttg acgttgatgg tatggttgct ttgctgcgta aactcgaatt tatccgcaaa8160gtggaagctg gttatgatgc aaatccagat gagtaaagca tgaaaatact tgttataggt8220gctacaggaa tgctcggagg aagtttgctt cgttatttcg ctgacaagac cgagcatgat8280gtatatggaa ctgttcgtga tagtaacgct gaaagtaggc tagtctcgaa agctaacgcc8340aatataatct gcggtattga tgttcacaat gtgaataaaa tacgcagcat aatagaggaa8400gtaagacctg actatgtaat taattgtgtt ggtgtagtta agcagcttaa agagtctaaa8460tatcctattc attctattac tataaattca ttgctgcccc atcgattagc tgagatctgt8520tcgcataata attcgaaatt aattcatttc tctacagatt gtgtattctc tggtaataga 8580ggtaattatt cggttaatga tgttcctgat gcctttgatc tttatggacg ttctaaatta 8640cttggtgaag taagttatgc tccacacctt acgttaagaa catcaataat tgggcatgag 8700caggggtcac agcatagttt aattgattgg tttttaaatc aatcaggtga ggtaaaagga 8760tttactaaag ctgtattctc cggagttcct actgtctata tggcggagct attaaataat 8820tatgttttta ctaatcctga tatcacaggg ttgtatcagg tgagtgttga acctattgat 8880aagtattctc ttctttcatt agttaaagat atttatggta aagatataga tattaatgcg 8940gatgatagtc ttgttattga cagaagtttg aactcaactg aatttaaaat tcgtacgggg 9000atgaataatc cctcttggaa agatttgata gagaagatgt acaatgaata tagaacatat 9060ttccaaaaag cttaaagtta ttacttttgt tggtacccgt cctgaaataa ttcgattgtc 9120tagaataatt gctttgttgg ataaatattg tgaccatatt ttggttcata ctggacaaaa 9180ttatgattat gagttgaatg aggttttttt ctccgattta ggaattagaa agcccgatta 9240ctttttgaat gctgcgggta aaaatgcggc agagactatt gggcaaatta ttattaaatc 9300tgatagtatt ctggaacaag ttaatccgca ggcactatta attttaggtg ataccaatag 9360tgccttggtt gcaatatctg caaaaagaag aaaaatccct attttccata tggaagcagg 9420gaatcgttgt tttgatttta gggttcctga agaaatcaat agaaaattgg ttgatcatat 9480ttctgatatt aatctgacct atagtcatat agctcgtgat tatttactac gtgaaggcat 9540tcccgctgat caggtgatca aaacgggatc tccgatgcgt gaagttttga attactatcg 9600tgatgatatc caaaagtcgg ttgtacttga aacgttgaaa cttagtaata acaactattt 9660tgttgtcagc tcccatcgcg aagagaatgt tgattcgcca gagagactta gacaactgct 9720ggagatcctc aatgagcttg ctgaaagata taatttgcct gtcattgttt caactcatcc 9780aagaaccaga aaaagattcg aagacttaag ttttaatgtt caccctaata tctctttcat 9840gaagccattc ggatttattg actacatcac tttacagttg catgccagag ctgtactttc 9900agatagtggt actattactg aagaatcttc tattcttaac ttcccagcac ttaatttacg 9960tgaggttcat gaacgtcctg aaggtttcga agaagcctca gtgatgtttg tcggtctgaa 10020taaagagcga gtattacagg ctcttgacat attaaatgag caaccaagat acgaatcacg 10080cctcttgaac cttgtagagg actacaaacc cgataacgta tcagagaaag ttctcaggat 10140tattatgagc tatactgatt ttgttaataa taaagtatgg aagaaataat cgatgcgcat 10200tgcgttaatt tgtgatgact atctccccgg tagtactcga gttagtgcaa aaatgatgca 10260tgaattggct cgtgaacttc tgcaaagagg tcatgagcca attgttgtga ctccggattg 10320ttacattaag tcaatttaca aagttgagca actggatggc gttgatatct tacgttttcg 10380taacggaaga atcaaagatg tgtccaaaat taaacgtgca atgtgtgaaa cactactctc 10440atataatggt tggaaggcgg taaatagtta tttttccaat gatgtgattg atgctgtcat 10500atattactca ccttctatat tctttggtcc tctggttaat aaaattaaga ggaaatggtc 10560atgtccatct tttcttatct tacgtgacag ttttcctcag tgggtaatcg atgaaggatt 10620aattagagag ggttctctga tatgtagata ttttagattt tttgagaaaa taaactatca 10680agcagcagat actattggag ttatgtcgga gaggaataga gaactttttt taaatatgca 10740tccaaatatt cagagtgttg aagtcttata taactggtgc gatactaggg cggatgcaga 10800actggacttg gtgaataaac ctgactgtat tactaagatc gcagataaaa ttatttttct 10860ctatggtgga aatataggca aggcacagga tatgggaaat ttaatccgtc ttgcaattgc 10920tatgaaaacc tactcaaatg ttcatttcat ttttattggg cagggtgatg aatacgattt 10980tgtaagtgat agtataaaaa aatattcact gagcaacgtt agcttgtttc catctgtttc 11040acaacatgat tttaaagtta ttctcaaatt tgttcatgtt gggttattta gtttgtctaa 11100gaaacatacc gcccataatt tccctggcaa gttacttggc tatatgaaaa atagtttacc 11160catactaggt agtgtaaata gtggtaatga tctgtcagat gttattaata ataatgaggc 11220gggttgtgtt tgtgacaatg gcgatgataa tgcattatta cgtgcggcaa taaggttagc 11280aactgatcag gattatcgtt acatgtgtgg acaaaaggct aatcagctac tacatgagaa 11340attttctgtt acttctgcta ttgacaatat aatgaagcac ttaagtaaaa aaactcagga 11400ctataattaa catgaccttt aaattattgg actttaatct aaataatgag ttgaaagcta 11460atgcaaagaa gagtgagcgt ttgcgatatc acttgagctt gcatggctct tataacgaac 11520ccgttcagag aattattata tcgctaatgc gtggtacata tattcctcca cactaccatg 11580aattcgagta tcaatgggag tattttaatg ttatatcagg taatatatgt gtgattattt 11640ttgatcagaa tggtactgtg actgataagt ttaaattggg tcaaaatact ggtgcttacg 11700gagttgagtt ttcttcaaac acaattcata caattctctg tgagagtgaa gatagtatta 11760ttttagagtt aaaagaaggt cctttttttc caagtaaagc taaagttata ccgagttggg 11820cgcctgatga gcaatattgc acatactctc gagcagaaat agtaagtgtt ttagaaaaaa 11880tcaaaccagg ccaaaatctt cctgaagcat tattggcgca ggaacaataa tgctatggaa 11940aaaaaacgat tttttgcact tgatagtttt cgtggtctat gcgctttgtg tgtagtcatt 12000tttcacatga aaatattgaa tgctttttcc gagtgggatt tttttcgaaa tagtcgactg 12060tttgttgaat ttttctttat tcttagtggg tttgttttaa cccacagcta tttaaaaaaa 12120gaaactaatg gtttttacaa atacgctatc gctcgaacgt ttcgaatttt tccacttcac 12180atttttatgc tttgtgtgta tgttattctt gaatctttta aattagttgc acaacagaaa 12240ggttttgtct ttaatacacc tccttttcag ggaggaaatt cattaaaaga atttcttcct 12300aatctgcttt taattcagtc gtggtcatcg agttttgaat acttaagctt caattatcca 12360tcatggagta taagtgttga atattattta tattttattt tttatctggt gatatgtcca 12420cgaacgataa ttggtagagt ttttgctggc atagtgtttt ttattatatt tctttttcaa 12480gaatattcct cttttaagat ttttaccagc gaagtgatta gaggtggaat ttgctttggc 12540gctggaattt tagtttatta tctttattca ttaattcatc taagtcatgc aactcgattt 12600ttatctgtgg tttttactat actagagtct agttctcttg cattaatttg gtttgttgta 12660agtatgactg attatgaaag tgaattattg gtggtggttg tcttttcgtc atcagttttt 12720ctatttgcat ttgaattagg gatgatttct ttttttctga aaaaaaaacc atttcagttt 12780tttggtaaac tatcttactc tatatatctt actcatgctt cagttctttt tgttcttata 12840tcagcaatga tggtattaca aaagataacg ggggtggcat ttacacagca tattgataat 12900ttacgttatc ttaattttgg aagttcattg ataaataatt ttatgatttt tgcagtgctt 12960ggatgtgtaa tatttttttc gatgctaacc tataaattta ttgagttgcc tgcgcaaaga 13020aagggtaaag agttatatga gcattattct aaataattgc tttaaagtta atgtgtcatt 13080ttatttctag actatgttac tttaacaaga ctaatttaat atattgtaca cacctaatcg 13140catcccccct gacaggagta aacaatgtca aagcaacaga tcggcgtcgt cggtatggca 13200gtgatggggc gcaaccttgc gctcaacatc gaaagccgtg gttataccgt ctctattttc 13260aaccgttcct gtgaaaagac ggaagaagtg attgccgaaa atccaggcaa gaaactggtt 13320ccttactata cggtgaaaga gtttgttgaa tctcttgaaa cgcctcgtcg tatcttgtta 13380atggtgaaag caggtgcagg cacggatgct gctattgatt cccttaagcc ataccttgaa 13440aaaggcgaca tcatcattga tggcggtaac accttcttcc aggacaccat tcgtcgtaac 13500cgtgagcttt ctgctgaagg ttttaacttc attggtacgg gggtttccgg tggtgaagag 13560ggcgcgctga aaggtccttc tatcatgcct ggtggtcaga aagaagccta tgaactggtt 13620gcaccgatcc tgaccaaaat tgctgccgta gctgaagatg gcgaaccgtg cgttacctat 13680attggtgcag acggtgctgg tcactatgtg aagatggttc acaacggtat tgaatacggt 13740gatatgcagt tgattgctga agcctattca ctgctgaaag gtggtctgaa tctctccaac 13800gaagaactgg cacaaacctt tactgagtgg aataacggtg aactgagcag ctacctgatc 13860gacatcacta aagacatttt caccaagaaa gatgaagacg gtaattatct ggttgacgtg 13920atcctggatg aagcggctaa taaaggcacc ggtaaatgga ccagtcagag tgcgctggat 13980ctcggcgagc cgctgtcgtt gattaccgag tctgtgtttg ctcgttatat ctcttctctg 14040aaagagcagc gtgttgctgc atctaaagtt ctgtctggtc ctcaggcaca gccagcaggc 14100gacaaagcgg agttcatcga gaaggttcac cgtgcgctgt atcttggcaa aatcgtttct 14160tatgcacagg gcttctctca actgcgtgcc gcgtctgaag agtacaactg ggatctgaac 14220tacggtgaaa tcgcgaagat tttccgtgctggttgcatta ttcgtgcgca gttcttgcag 14280aaaatcaccg atgcctatgc cgaaaatcca aaaatcgcta acctgctgtt agctccgtat 14340ttcaagaaaa tcgccgatga ctaccagcag gcactgcgtg atgtcgtcgc ttatgcagtg 14400caaaacggta tcccagttcc aaccttctct gcggcggttg cttattacga cagctatcgt 14460gccgctgtcc tgcctgcgaa cctaatccag gcccagcgcg acta 14504表1 鮑氏志賀氏菌13型O抗原基因簇中的糖基轉移酶基因和寡糖單位處理基因及其中的引物及PCR數據
*在一組中得到一條錯誤大小的帶;**在兩組中都得到一條錯誤大小的帶;***在三組中得到一條錯誤大小的帶;****在四組中得到一條錯誤大小的帶表2 166株大腸桿菌和43株志賀氏菌及它們的來源組號該組中含有的菌株 來源1野生型大腸桿菌O1,O2,O3,O4,O10,O16,O18,O39 IMVSa2野生型大腸桿菌O40,O41,O48,O49,O71,O73,O88,O100IMVS3野生型大腸桿菌O102,O109,O119,O120,O121,O125,O126,O137 IMVS4野生型大腸桿菌O138,O139,O149,O7,O5,O6,O11,O12 IMVS5野生型大腸桿菌O13,O14,O15,O17,O19ab,O20,O21,O22 IMVS6野生型大腸桿菌O23,O24,O25,O26,O27,O28,O29,O30 IMVS7野生型大腸桿菌O32,O33,O34,O35,O36,O37,O38,O42 IMVS8野生型大腸桿菌O43,O44,O45,O46,O50,O51,O52,O53 IMVS9野生型大腸桿菌O54,O55,O56,O57,O58,O59,O60,O61 IMVS10 野生型大腸桿菌O62,O63,O64,O65,O66,O68,O69,O70 IMVS11 野生型大腸桿菌O74,O75,O76,O77,O78,O79,O80,O81 IMVS12野生型大腸桿菌O82,O83,O84,O85,O86,O87,O89,O90 IMVS13野生型大腸桿菌O91,O92,O95,O96,O97,O98,O99,O101IMVS14野生型大腸桿菌O112,O162,O113,O114,O115,O116,O117,O118 IMVS15野生型大腸桿菌O123,O165,O166,O167,O168,O169,O170,O171 See b16野生型大腸桿菌O172,O173,O127,O128,O129,O130,O131,O132, See c17野生型大腸桿菌O133,O134,O135,O136,O140,O141,O142,O143 IMVS18野生型大腸桿菌O144,O145,O146,O147,O148,O150,O151,O152 IMVS19野生型大腸桿菌O153,0154,O155,O156,O157,O158,O159,O164 IMVS20野生型大腸桿菌O160,O161,O163,O8,O9,O124,O111 IMVS21野生型大腸桿菌O103,O104,O105,O106,O107,O108,O110 IMVS22鮑氏志賀氏菌血清型B4,B5,B6,B8,B9,B11,B12,B14 See d23鮑氏志賀氏菌血清型B1,B3,B7,B8,B10,B13,B15,B16,B17,B18 See d24痢疾志賀氏菌血清型D1,D2,D3,D4,D5,D6,D7,D8 See d25痢疾志賀氏菌血清D9,D10,D11,D12,D13 See d26弗氏志賀氏菌F6a,F1a,F1b,F2a,F2b,F3,F4a,F4b,F5(v7)F5(v4) See d27宋內氏志賀氏菌D5,DR See da. Institude of Medical and Veterinary Science,Anelaide,Australiab. O123 from IMVS;the rest from Statens Serum Institut,Copenhagen,Denmarkc. 172and 173 from Statens Serum Institut,Copenhagen,Denmark,the rest from IMVSd. 中國預防醫學科學院流行病學研究所表3是鮑氏志賀氏菌13型的O-抗原基因簇的結構表 表4是鮑氏志賀氏菌13型的O-抗原基因簇中的基因的位置表attgtggctg cagggatcaa agaaatcctc ctggtgactc atgcgtccaa gaacgcagtc 60gaaaaccact tcgacacttc ttatgaacta gaatctctcc ttgaactgcg cgtaaaacgc120cagttgctgg cagaggttca gtccatctgc ccaccgggcg ttaccattat gaacgtgcgt180cagggcgaac ctttaggttt gggccactcc attctgtgtg ccagacctgc cattggcgac240aatccattcg ttgtggtgct gccggatgtc gttattgatg acgccagcgc cgatccgctg300cgttacaacc ttgccgccat gattgcgcga ttcaacgaaa cgggtcgtag ccaggttctg360gcaaaacgta tgccgggtga cctttctgaa tactctgtca tccagactaa agaaccgctg420gatcgtgaag gcaaagttag tcgcattgtt gaatttatcg aaaaacccga tcagccgcag480acgctggact cagacattat ggcggttggt cgctatgtgc tttctgcgga catttggcct540gaactggagc ggactcaacc cggtgcatgg ggacgtattc agctaactga tgcaattgct600gaactggcga aaaaacagtc cgttgacgca atgttaatga cgggtgacag ctacgattgc 660ggtaagaaaa tgggctacat gcaggcattt gtgaagtacg gactacgcaa cctgaaagaa 720ggagcgaagt tccgcaaagg gattgagaag ctgttgttag aataagatat tgcgcgacgg 780gatagaatgt tggtgatgta acagaacggc agatgattgt ggttgaggaa gagctcactt 840cacagtaact gccgtatttg ttgtccctaa actacctttg gggaggtggt gattaatcct 900orf1的起始gtaaggatat attctgaata atgttcactt accacaagta aaaggggaca aaccgacaga 960ggaatttaca gaagttcatc aaatatgcat tgcgttgtaa atatcacata gtctggacgc1020caaagtaccg cttcaggagc cagcaggata aattgggtaa agagctgtac agagccacct1080atattttgtg cagaataaaa gattgcgagg ttcaggagtt aaatatacaa ccagatcatg1140tgcatcttgt agcaatagtg cttctaaaaa tctcaatata tactctaatg gggcacctga1200aggtcgcagt gcaatcaggc tctacaatcg gttttcgcat atcaggaaga aactatggaa1260orf1的終止atcatttttg gccatggggc tgtgttgccg atatggtagg cgtatcagac gatatgtgat 1320acatcaggaa aagatagaac aaacatatga acagtaaatg gtgttgctag agtagaacgc1380gggatatgac ggttgccccc ttatcggaga gtattctgaa aagctacctc atcaggagat1440gatcttttat tattaaaaac aaccactaaa attagtgatt gcatggcgtt ttttgacaaa1500aatgtcggat ttttccttgt tttataaagg gattgtgctc aaaatagtgg gctgaattgg1560aagggagggt tcctcgcaaa cgcgaaggtt ggcgggagtt ggcttgcgac acacagaatt1620ttgtgcagtg cactggtagc tgttgagcca ggggcggtag cgtttctgat gtgtgtgatt1680orf2的起始tttacccatt taaaatgttc agcggaaaaa ttatgaagag tgccattagg agtggtaaag 1740agcaattttt aatgggagtc atctataaag cattatttat gttgataaca tcaataaatg1800ctttagtaat agtaaagcta ctgactcctg aagagttagg tatttggtat atttttatgg1860cgcttcaaac gcttttattt atcttaaata gcgccttgac tccgaatatt tcaagacagt1920acagcattgc atttacggat attggtgagg gatttgatcc ccgtcttttt cacacaaaag1980taattattat ttataataag ataattttag tggcaacagt catgggagtg ttttttactc2040tgacttatct taactatgtg cttgatatat ttaggttggc taatgtttct atattactat2100cttgggtaat tgtttttgct tccattttga tggaaattta ttttacatcg tatgagtgtg2160cattaaatgg gtttggtgaa ttccaaaaag ttaacaaagt aaattttata tcgagattga2220ttctaacgtt aagcattttt acactgttgt tatctgatgt gcatagtaat ggcttgctaa2280tattctgtgg gttatatttt tttagtaata taataaaaag ggttatggtt attaatcttt2340ttaatcatac ctttaaagac aaagggctaa aagaatcgcg gaaaacaata gatttttttg2400atagaatcag ctgtaagcta caaaaactgt cctttttatc actactttca tcaattgggg2460gggtcctcat tgtcagaagc ggaatgttta ttttgccctt ctatgtgcca atggaccaag2520tagcatctta tggattaacc tatcagcttt ttgagctcgg gtttaatgtc atatttacta2580tttctataat agcaactccc gcatggatct cagcctataa aaataatcca gaaggattaa2640aaaaatcctt cacttgggta aagtatatat ctctattgct aatgttaatt tgtgggctgt2700taattacatt tctgggtaat atcatattag agtttgctga tgttgaaacc agagtgcagt2760cagttatcct ttgtttttat ttgctggtaa tttttgtgtt gcaaattaat cacagtattt2820ctgggcaact cctaactatt cagaataaaa ttccttttgc ttatgcatca ttcttgagtg2880ggatttttac attagtgtta tcggttgttt taattaaata ttattcagtt cttggcgcta2940tttatgcgat attaatcagt cagctaatat ataataattg gaagtggcca tatgaagcat3000orf3的起始 orf2的終止ataaattctt gagggtgcat ggaaatgtat gagggaaaat taaaaaacaa aatattaagt3060cttttcctct tatgtgaaac cttttgcttt atatatataa tatataataa ggaattagtt3120tccgattatt tggggagggc gataacttta agtgagttta caataagttg tatttttttt3180ctgctattgt tattttattt tttgttccat actttgtggg tgatttcaga aaaaataatt3240aaatccagga aaaagattgg tagcgtcggg aatttgaatc tttttgttct tgttcttata3300ttcttatatt ttatattaaa tttaaaaaca ggtattggta aagttggtca agaggataat3360attactttaa caggattaga taaattatta tttgcagcac caatattttt taaaataaat3420tttctcatgt atatttacgc tgcggggaat agaaataaga atcgtctgta ttactttaat3480ttgttctttt tcgcatttgc agaattaact cggggagtat cttttacaat attgttgttg3540ttgataatag aatacaataa gattagacgc ttcatttccc ttaggtattt tttattttca3600ttgctttttg gtatattgtt aattaatgtg atttacaatg tgaaatttta cgttaggatg3660ggggcgaaat acgagtatat tgatatctac acgtctttaa ttatgttgat gggacgtttg3720agtatattgt ccaatttact atttattcat gataatctct ctgatataag attatatttt3780tatggctcag ggtaccaagg agttgttcat gagtttttag agtcgttgac acctgtacca3840tcattattcg gtattaacga gaaagtgttg gagtttggta aaatattatt ctcatattcg3900aatgttactt ttaccagcgc aactgcagca tcgctattag gtatcattta tatttatcca3960aattcaattt tcaatgcgat tacaataata tgtcttagtt ggatttatat acatataatt4020acgggttatc ttgagtttag tcgaatgcaa cgagtagtcg cgtacttttt tgtgctgctt4080gcactttacc agggcttcat ggccatatta agtaattata tatatgcatt aacaatatat4140orf4的起始 orf3的終止ttccttatag cctgtgccag aaatctttta ttgagtaagaaatatgaaacaatttagtat 4200taaaatcttg tcattggcag atgctatcga gcgtaggagg aaagtatcta gagagtttga4260gctgaaatca gtactgccat tctcattttt taacggtatt tatggtaaga cactaagtaa4320agaaaaatta gatacaatat actcttcaga gctggcgcag aaagtactcc atcggcaact4380aactgcgggg gaaattggtg caacctactc acattacttg attttccgtg aggcatatga4440gcgtggggat gagtttgttg ttgttctgga agatgactgt tatatagata gaaattttga4500taccgtgtta acatcaattc ttgataagaa aaatcctaca gatgatgaaa ttatctttat 4560tcaaagacat acgagcgaaa actcacatat aataagatct ttaggcagtg agaagataaa 4620taaaaattat accttacatc gtatgctagg tagcgcgcag tattttgttg gtgcatacgg 4680gtatatcgta actagagctg caatgaaaaa aatgatcgat acatacttgc caatatattg 4740tgtatgtgat cattggtatt ttataaagaa gaaatgtcag atagaaaaat ttagtgtatt 4800atccccagct attgttttca caaatgatga ggatgttagg aaaatagata gttttgtaga 4860cattgaaaga agagaaatcg ctgttttcaa atcagtaggt aaaatagcaa aactaaaaat 4920orf4的終止orf5的起始tttaattaag aaaattattt taccaatatt aaataaagac tgggaataaaagtgctgcgc4980tattataaag tattgactgt tctgcttaga ttaattatag cttttatatt gtaccctatt 5040gcatatgttt ttttgaatca caaaaaatat ttcatcattg gcacacgcaa tggtgttcga 5100gggcatgata atgctgagta ttttttgtct tattgtacaa gacacaatat taatacaaaa 5160gtaatttata atgatgctta tcagaaagat gaattatgca aaaactctat aaaaagtata 5220ttgtatatct tatgtgcaaa caatgtttac ataacgcact ctgaatcaga tgttttagat 5280tatttttggc gttttattcc cggtataaag tatatattta tacagcatgg agttattgga 5340ataaaaaaac ttccggatta tgaaaagaaa agatatcata gatatgtttc tagtagtgaa 5400tatgaaacag aaatttttag gaatttcttc catttgaaca gtgataaaat tattaaatct 5460ggacttccac gttttgattt ctatgactat aaccgttcaa aaaatgatga aattaaatcc 5520tgcttaatta tgtttacctg gagaaaatcg gattctggca aggctaaatt aattaaaaaa 5580tatactgaga tggttacttg cctgtcaaat gaagctctca ataaaattta catttgtgtt 5640catgaagcaa acttaagtac atttaaggtc ttgcttgaag aatcgcttga attggatgat 5700aggttttcat ttatagaaaa tgataaatta tcatgtatta ttcaaagtac agaactttta 5760atcactgact actcgagtgt tgcatgggat tatttatatc agaataaata tattttattt 5820tataccccag atattgatga ttataaaaat acaactggat tgtattgtga tttttccgat 5880ttttttggcg cacatcttat gaatttcagt agaatcaatt atccagtttt ggcatggatt 5940atgcaagaaa atgaaattaa aaataaaaac tttcttgcaa ggtataaatt ttataacatg 6000orf5的終止catgcaggca tacactctga gtatatagtg aagaatagtt aaaattatga gggcgaacat 6060tgacaactat tattgtctca gcaactgcat tggctaagag cggtgcatta acaatattaa 6120orf6的起始atgagtttat tgagtatgtg tcaaatttaa aaaaatataa gtttataatt tttattcctg 6180atagcattaa tttgcctaaa gcagttaata tcagatatat ccctgtgcct aaaaaaaatt 6240ggctatctag gatatattgg gatagttatg gcttaagaaa atatattcga gtaaatcggc 6300ttcaatatca ggcggtcatt tctcttcaga atacatctgt aaatgtagaa ggaaaacaga 6360taatatatct tcaccaatct ataccattta tagattttga tattccactg acaagtttat 6420ttaatttaaa attatggcta tacaagcgat tttattctta ttttatattt ttatttgtta6480acaagaatac ttcttttatt gtccaagcca aatggctgaa agagctcctt tctgataagt6540atcatatcga tgcaaaaaaa atatctatca taaagcccaa agcaagatat gttcctctag6600caactaactc tattcataat gtagccaact tatctaagca attctgtaat attatttatc6660cagcaacacc aatattttat aaaaatcatt gtgttattat tgatgctctt aggattttaa6720gagaacagcg caatattgat aacttatgtt ttaatgtcac cttttcaaaa ggtgagtatg6780ctaagtttga cgatttggtt aggcgttata acttgggtaa gaatattcgc tatttgggat6840atttgacccg agatgaatta tatcaacatt atgataatag cgcttttatg gtctacccca6900gttatgtgga aacctgtggg cttccgttgc tggaggctgc ttctaagcag ttgccaataa6960tcgctagtga tctgccttat gcatgtgaaa tgcttgaggc ttatactggc gtcgtttatg7020ttaagttcaa tgtctctacc gaatgggctc gagaaattga tacgatggcc cgagctggtg7080aaactcgaat tattccgccg ttattaaaag cggagaatga ttctgattgg aataagttag7140orf7的起始 orf6的終止ataatattat tgaaggaaaa gatgatgttt aaaaataaaa cactactaat tacaggtgga7200actggatcgt ttggtaatgc tgtgctccgt cgttttttat cgacggatat tggcgaaata7260aggatcttta gtcgcgatga aaagaaacaa gatgatatgc gtaaaaaata ttcggatccg7320aagttgaagt tttatattgg cgacgtaagg gattataaca gtattttgtc tgcaactcgc7380ggagttgatt atatctatca tgccgcagca ttgaagcagg ttccttcctg cgagttttat7440ccaatggaag cagtaaaaac taacgttatt ggtacagata atgtgttaga agctgcaata7500gcgaataaag ttcagcgtat agtctgtttg agtacggata aagccgtata tcctatcaat7560gcaatgggaa catcaaaagc aatgatggaa aaagtaattg ttgcaaaatc acgcaatttg7620cctgaaggca taactatttg tgctacccgt tatggaaatg taatggcttc gcgtggatcg7680gtgataccat tatttataaa tcaaattaaa aatggtaacc ctataactat taccgatccc7740gatatgactc gctttatgat gacccttgat gatgccgtcg atttagtatt acatgcgttc7800gaatacggaa ataatggtga tattttcgta caaaaggctc ctgcggcaac aattgaaaca7860cttactaaag caattcaaca ggttacaaac gcacttgatc atcagataaa tattatcggg7920acacgtcatg gtgaaaaatt gtatgaagtt ctctgtagcc gtgaagaaat ggctgtagca7980gaagatcagg gaaattacta ccgtatccct gctgacaatc gagatttaaa ctatgagaaa8040tactttgaga agggtaacaa agatgtttcc ttactcgagg attataattc gcataatact8100attagacttg acgttgatgg tatggttgct ttgctgcgta aactcgaatt tatccgcaaa8160orf7的終止 orf8的起始gtggaagctg gttatgatgc aaatccagat gagtaaagca tgaaaatact tgttataggt8220gctacaggaa tgctcggagg aagtttgctt cgttatttcg ctgacaagac cgagcatgat8280gtatatggaa ctgttcgtga tagtaacgct gaaagtaggc tagtctcgaa agctaacgcc8340aatataatct gcggtattga tgttcacaat gtgaataaaa tacgcagcat aatagaggaa8400gtaagacctg actatgtaat taattgtgtt ggtgtagtta agcagcttaa agagtctaaa8460tatcctattc attctattac tataaattca ttgctgcccc atcgattagc tgagatctgt8520tcgcataata attcgaaatt aattcatttc tctacagatt gtgtattctc tggtaataga8580ggtaattatt cggttaatga tgttcctgat gcctttgatc tttatggacg ttctaaatta8640cttggtgaag taagttatgc tccacacctt acgttaagaa catcaataat tgggcatgag8700caggggtcac agcatagttt aattgattgg tttttaaatc aatcaggtga ggtaaaagga8760tttactaaag ctgtattctc cggagttcct actgtctata tggcggagct attaaataat8820tatgttttta ctaatcctga tatcacaggg ttgtatcagg tgagtgttga acctattgat8880aagtattctc ttctttcatt agttaaagat atttatggta aagatataga tattaatgcg8940gatgatagtc ttgttattga cagaagtttg aactcaactg aatttaaaat tcgtacgggg9000orf9的起始atgaataatc cctcttggaa agatttgata gagaagatgt acaatgaata tagaacatat 9060orf8的終止ttccaaaaag cttaaagtta ttacttttgt tggtacccgt cctgaaataa ttcgattgtc 9120tagaataatt gctttgttgg ataaatattg tgaccatatt ttggttcata ctggacaaaa9180ttatgattat gagttgaatg aggttttttt ctccgattta ggaattagaa agcccgatta9240ctttttgaat gctgcgggta aaaatgcggc agagactatt gggcaaatta ttattaaatc9300tgatagtatt ctggaacaag ttaatccgca ggcactatta attttaggtg ataccaatag9360tgccttggtt gcaatatctg caaaaagaag aaaaatccct attttccata tggaagcagg9420gaatcgttgt tttgatttta gggttcctga agaaatcaat agaaaattgg ttgatcatat9480ttctgatatt aatctgacct atagtcatat agctcgtgat tatttactac gtgaaggcat9540tcccgctgat caggtgatca aaacgggatc tccgatgcgt gaagttttga attactatcg9600tgatgatatc caaaagtcgg ttgtacttga aacgttgaaa cttagtaata acaactattt9660tgttgtcagc tcccatcgcg aagagaatgt tgattcgcca gagagactta gacaactgct9720ggagatcctc aatgagcttg ctgaaagata taatttgcct gtcattgttt caactcatcc9780aagaaccaga aaaagattcg aagacttaag ttttaatgtt caccctaata tctctttcat9840gaagccattc ggatttattg actacatcac tttacagttg catgccagag ctgtactttc9900agatagtggt actattactg aagaatcttc tattcttaac ttcccagcac ttaatttacg9960tgaggttcat gaacgtcctg aaggtttcga agaagcctca gtgatgtttg tcggtctgaa 10020taaagagcga gtattacagg ctcttgacat attaaatgag caaccaagat acgaatcacg 10080cctcttgaac cttgtagagg actacaaacc cgataacgta tcagagaaag ttctcaggat 10140orf9的終止 orf10的起始tattatgagc tatactgatt ttgttaataa taaagtatgg aagaaataatcgatgcgcat10200tgcgttaatt tgtgatgact atctccccgg tagtactcga gttagtgcaa aaatgatgca 10260tgaattggct cgtgaacttc tgcaaagagg tcatgagcca attgttgtga ctccggattg 10320ttacattaag tcaatttaca aagttgagca actggatggc gttgatatct tacgttttcg10380taacggaaga atcaaagatg tgtccaaaat taaacgtgca atgtgtgaaa cactactctc10440atataatggt tggaaggcgg taaatagtta tttttccaat gatgtgattg atgctgtcat10500atattactca ccttctatat tctttggtcc tctggttaat aaaattaaga ggaaatggtc10560atgtccatct tttcttatct tacgtgacag ttttcctcag tgggtaatcg atgaaggatt10620aattagagag ggttctctga tatgtagata ttttagattt tttgagaaaa taaactatca10680agcagcagat actattggag ttatgtcgga gaggaataga gaactttttt taaatatgca10740tccaaatatt cagagtgttg aagtcttata taactggtgc gatactaggg cggatgcaga10800actggacttg gtgaataaac ctgactgtat tactaagatc gcagataaaa ttatttttct10860ctatggtgga aatataggca aggcacagga tatgggaaat ttaatccgtc ttgcaattgc10920tatgaaaacc tactcaaatg ttcatttcat ttttattggg cagggtgatg aatacgattt10980tgtaagtgat agtataaaaa aatattcact gagcaacgtt agcttgtttc catctgtttc11040acaacatgat tttaaagtta ttctcaaatt tgttcatgtt gggttattta gtttgtctaa11100gaaacatacc gcccataatt tccctggcaa gttacttggc tatatgaaaa atagtttacc11160catactaggt agtgtaaata gtggtaatga tctgtcagat gttattaata ataatgaggc11220gggttgtgtt tgtgacaatg gcgatgataa tgcattatta cgtgcggcaa taaggttagc11280aactgatcag gattatcgtt acatgtgtgg acaaaaggct aatcagctac tacatgagaa11340attttctgtt acttctgcta ttgacaatat aatgaagcac ttaagtaaaa aaactcagga11400orf10的終止orf11的起始ctataattaacatgacctttaaattattgg actttaatct aaataatgag ttgaaagcta 11460atgcaaagaa gagtgagcgt ttgcgatatc acttgagctt gcatggctct tataacgaac11520ccgttcagag aattattata tcgctaatgc gtggtacata tattcctcca cactaccatg11580aattcgagta tcaatgggag tattttaatg ttatatcagg taatatatgt gtgattattt11640ttgatcagaa tggtactgtg actgataagt ttaaattggg tcaaaatact ggtgcttacg11700gagttgagtt ttcttcaaac acaattcata caattctctg tgagagtgaa gatagtatta11760ttttagagtt aaaagaaggt cctttttttc caagtaaagc taaagttata ccgagttggg11820cgcctgatga gcaatattgc acatactctc gagcagaaat agtaagtgtt ttagaaaaaa11880orf11的終止orf12的起始tcaaaccagg ccaaaatctt cctgaagcat tattggcgca ggaacaataatgctatggaa 11940aaaaaacgat tttttgcact tgatagtttt cgtggtctat gcgctttgtg tgtagtcatt12000tttcacatga aaatattgaa tgctttttcc gagtgggatt tttttcgaaa tagtcgactg12060tttgttgaat ttttctttat tcttagtggg tttgttttaa cccacagcta tttaaaaaaa12120gaaactaatg gtttttacaa atacgctatc gctcgaacgt ttcgaatttt tccacttcac12180atttttatgc tttgtgtgta tgttattctt gaatctttta aattagttgc acaacagaaa12240ggttttgtct ttaatacacc tccttttcag ggaggaaatt cattaaaaga atttcttcct12300aatctgcttt taattcagtc gtggtcatcg agttttgaat acttaagctt caattatcca 12360tcatggagta taagtgttga atattattta tattttattt tttatctggt gatatgtcca 12420cgaacgataa ttggtagagt ttttgctggc atagtgtttt ttattatatt tctttttcaa 12480gaatattcct cttttaagat ttttaccagc gaagtgatta gaggtggaat ttgctttggc 12540gctggaattt tagtttatta tctttattca ttaattcatc taagtcatgc aactcgattt 12600ttatctgtgg tttttactat actagagtct agttctcttg cattaatttg gtttgttgta 12660agtatgactg attatgaaag tgaattattg gtggtggttg tcttttcgtc atcagttttt 12720ctatttgcat ttgaattagg gatgatttct ttttttctga aaaaaaaacc atttcagttt 12780tttggtaaac tatcttactc tatatatctt actcatgctt cagttctttt tgttcttata 12840tcagcaatga tggtattaca aaagataacg ggggtggcat ttacacagca tattgataat 12900ttacgttatc ttaattttgg aagttcattg ataaataatt ttatgatttt tgcagtgctt 12960ggatgtgtaa tatttttttc gatgctaacc tataaattta ttgagttgcc tgcgcaaaga 13020orf12的終止aagggtaaag agttatatga gcattattct aaataattgc tttaaagtta atgtgtcatt13080ttatttctag actatgttac tttaacaaga ctaatttaat atattgtaca cacctaatcg 13140catcccccct gacaggagta aacaatgtca aagcaacaga tcggcgtcgt cggtatggca 13200gtgatggggc gcaaccttgc gctcaacatc gaaagccgtg gttataccgt ctctattttc 13260aaccgttcct gtgaaaagac ggaagaagtg attgccgaaa atccaggcaa gaaactggtt 13320ccttactata cggtgaaaga gtttgttgaa tctcttgaaa cgcctcgtcg tatcttgtta 13380atggtgaaag caggtgcagg cacggatgct gctattgatt cccttaagcc ataccttgaa 13440aaaggcgaca tcatcattga tggcggtaac accttcttcc aggacaccat tcgtcgtaac 13500cgtgagcttt ctgctgaagg ttttaacttc attggtacgg gggtttccgg tggtgaagag 13560ggcgcgctga aaggtccttc tatcatgcct ggtggtcaga aagaagccta tgaactggtt 13620gcaccgatcc tgaccaaaat tgctgccgta gctgaagatg gcgaaccgtg cgttacctat 13680attggtgcag acggtgctgg tcactatgtg aagatggttc acaacggtat tgaatacggt 13740gatatgcagt tgattgctga agcctattca ctgctgaaag gtggtctgaa tctctccaac 13800gaagaactgg cacaaacctt tactgagtgg aataacggtg aactgagcag ctacctgatc 13860gacatcacta aagacatttt caccaagaaa gatgaagacg gtaattatct ggttgacgtg 13920atcctggatg aagcggctaa taaaggcacc ggtaaatgga ccagtcagag tgcgctggat 13980ctcggcgagc cgctgtcgtt gattaccgag tctgtgtttg ctcgttatat ctcttctctg 14040aaagagcagc gtgttgctgc atctaaagtt ctgtctggtc ctcaggcaca gccagcaggc 14100gacaaagcgg agttcatcga gaaggttcac cgtgcgctgt atcttggcaa aatcgtttct 14160tatgcacagg gcttctctca actgcgtgcc gcgtctgaag agtacaactg ggatctgaac 14220tacggtgaaa tcgcgaagat tttccgtgct ggttgcatta ttcgtgcgca gttcttgcag 14280aaaatcaccg atgcctatgc cgaaaatcca aaaatcgcta acctgctgtt agctccgtat 14340
ttcaagaaaa tcgccgatga ctaccagcag gcactgcgtg atgtcgtcgc ttatgcagtg 14400caaaacggta tcccagttcc aaccttctct gcggcggttg cttattacga cagctatcgt 14460gccgctgtcc tgcctgcgaa cctaatccag gcccagcgcg acta 14504以上所述,僅是本發明的較佳實施例而已,并非對本發明作任何形式上的限制,凡是依據本發明的技術實質對以上實施例所作的任何簡單修改、等同變化與修飾,均仍屬于本發明技術方案的范圍內。
權利要求
1.一種對鮑氏志賀氏菌13型的O-抗原特異的核苷酸,其特征在于,其是如SEQ ID NO1所示的分離的核苷酸,全長14504個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ IDNO1的核苷酸。
2.按照權利要求1所述的對鮑氏志賀氏菌13型的O-抗原特異的核苷酸,其特征在于,其由12個基因組成,都位于galF基因和gnd基因之間。
3.按照權利要求2所述的對鮑氏志賀氏菌13型的O-抗原特異的核苷酸,其特征在于,所述的基因是轉運酶基因,包括wzx基因或與wzx有相似功能的基因;聚合酶基因,包括wzy基因或與wzy有相似功能的基因;糖基轉移酶基因,包括orf4、orf5、orf6、wbjE、orf11、orf12基因;其中所述的基因wzx是SEQ ID NO1中的1695至3032堿基的核苷酸;wz y是SEQ IDNO1中的3019至4197堿基的核苷酸;orf4是SEQ ID NO1中的4184至4969堿基的核苷酸;orf5是SEQ ID NO1中的4972至6042堿基的核苷酸;orf6是SEQ ID NO1中的6138至7172堿基的核苷酸;wbjE是SEQ ID NO1中的10193至11410堿基的核苷酸;orf11是SEQ ID NO1中的11412至11930堿基的核苷酸;orf12是SEQ ID NO1中的11935至13056堿基的核苷酸。
4.按照權利要求1或2所述的對鮑氏志賀氏菌13型的O-抗原特異的核苷酸,其特征在于,其源于所述的wzx基因、wzy基因或糖基轉移酶基因orf4、orf5、orf6、wbjE、orf11、orf12基因;或糖合成路徑基因中的寡核苷酸;以及它們的混合或它們的重組。
5.按照權利要求4所述的對鮑氏志賀氏菌13型的O-抗原特異的核苷酸,其特征在于,所述的源于wzx基因的寡核苷酸對是SEQ ID NO1中的2012至2030堿基的核苷酸和2931至2949堿基的核苷酸;SE9 ID NO1中的1887至1904堿基的核苷酸和2599至2616堿基的核苷酸;SEQ ID NO1中的2009至2026堿基的核苷酸和2493至2510堿基的核苷酸;源于wzy基因的寡核苷酸對是SEQ ID NO1中的3252至3269堿基的核苷酸和4081至4099堿基的核苷酸;SEQ ID NO1中的3206至3224堿基的核苷酸和4160至4176堿基的核苷酸;SEQ ID NO1中的3565至3582堿基的核苷酸和4083至4100堿基的核苷酸;源于orf4基因的寡核苷酸對是SEQ ID NO1中的4399至4417堿基的核苷酸和4943至4962堿基的核苷酸;SEQ ID NO1中的4368至4385堿基的核苷酸和4670至4688堿基的核苷酸;SEQ ID NO1中的4227至4244堿基的核苷酸和4821至4840堿基的核苷酸;源于orf5基因的寡核苷酸對是SEQ ID NO1中的5242至5261堿基的核苷酸和5677至5694堿基的核苷酸;SEQ ID NO1中的5071至5088堿基的核苷酸和5774至5791堿基的核苷酸;SEQ ID NO1中的5600至5617堿基的核苷酸和5889至5908堿基的核苷酸;源于orf6基因的寡核苷酸對是SEQ ID NO1中的6089至6106堿基的核苷酸和6904至6921堿基的核苷酸;SEQ ID NO1中的6306至6324堿基的核苷酸和6906至6923堿基的核苷酸;SEQ ID NO1中的6050至6067堿基的核苷酸和6996至7013堿基的核苷酸;源于wbjE的寡核苷酸對是SEQ ID NO1中的10379至10397堿基的核苷酸和10953至10970堿基的核苷酸;SEQ IDNO1中的10448至10465堿基的核苷酸和10813至10830堿基的核苷酸;SEQID NO1中的10199至10217堿基的核苷酸和10098至11115堿基的核苷酸;源于orf11基因的寡核苷酸對是SEQ ID NO1中的11472至11489堿基的核苷酸和11878至11894堿基的核苷酸;SEQ ID NO1中的11500至11517堿基的核苷酸和11686至11703堿基的核苷酸;SEQ ID NO1中的11689至11708堿基的核苷酸和11906至11923堿基的核苷酸;源于orf12基因的寡核苷酸對是SEQ ID NO1中的11971至11990堿基的核苷酸和12872至12891堿基的核苷酸;SEQ ID NO1中的11973至11990堿基的核苷酸和12998至13015堿基的核苷酸;SEQ ID NO1中的12682至12700堿基的核苷酸和12997至13014堿基的核苷酸。
6.權利要求1所述的對鮑氏志賀氏菌13型的O-抗原特異的核苷酸在檢測表達O-抗原的細菌、在診斷中鑒定細菌的O-抗原和細菌的其它多糖抗原的應用。
7.權利要求1所述的對鮑氏志賀氏菌13型的O-抗原特異的核苷酸的重組分子,而且通過插入表達可提供表達鮑氏志賀氏菌13型的O-抗原,并成為細菌疫苗。
8.按照權利要求1所述的對鮑氏志賀氏菌13型的O-抗原特異的核苷酸的應用,其特征在于,其作為引物用于PCR、作為探針用于雜交反應與熒光檢測、或者用于制造基因芯片或微陣列,可用這些方法檢測人體和環境中的細菌。
9.權利要求1所述的對鮑氏志賀氏菌13型的O-抗原特異的核苷酸的分離方法,其特征在于,它包括下述步驟(1)基因組的提取在5mL的LB培養基中37℃過夜培養鮑氏志賀氏菌13型,離心收集細胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時,再加入3ul 10mg/ml的RNase,65℃ 30分鐘。加等體積酚抽提混合物,取上清液再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)抽提兩次,取上清液再用等體積的乙醚抽提以除去殘余的酚。上清液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,將DNA重懸于30ul TE中,基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴增鮑氏志賀氏菌13型中的O-抗原基因簇鮑氏志賀氏菌13型的O-抗原基因簇通過Long PCR擴增。首先根據經常發現于O-抗原基因簇啟動子區的JumpStart序列設計上游引物(5’-ATT GTG GCT GCA GGG ATCAAA GAA AT-3’),再根據O-抗原基因簇下游的gnd基因設計下游引物(5’-TAGTCG CGT GNG CCT GGA TTA AGT TCG C-3’)。用Boehringer Mannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應程序如下在94℃預變性2分鐘;然后94℃變性10秒,60℃退火30秒,68℃延伸15分鐘,這樣進行30個循環。最后,在68℃繼續延伸7分鐘,得到PCR產物,用0.8%的瓊脂糖凝膠電泳檢測PCR產物的大小及其特異性。合并6管long PCR產物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產物;(3)構建O-抗原基因簇文庫用被修改的Novagen DNaseI Shot Gun法構建O-抗原基因簇文庫。反應體系是300ng PCR純化產物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應在室溫中進行。酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而后加入2ul 0.1M EDTA終止反應。合并4管同樣的反應體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中。隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul100mM DTT和5單位的T4DNA聚合酶,11℃ 30分鐘,將酶切產物補成平端,75℃終止反應后,加入5單位的Tth DNA聚合酶及其相應的緩沖液并將體系擴大為80ul,70℃反應20分鐘,使DNA的3’端加dA尾。此混合物經等體積氯仿∶異戊醇(24∶1)抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接24小時,總體積為90ul。其中有9ul的10×buffer和25單位的T4DNA連接酶。最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產物;用BiO-Rad公司的電轉化感受態細胞的制備方法制備感受態大腸桿菌DH5a細胞,取2-3ul連接產物與50ul感受態大腸桿菌DH5a混合后,轉到BiO-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒至6.0毫秒,電擊后立即在杯中加入1ml的SOC培養基使菌復蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養基上,在37℃過夜培養,次日得到藍白菌落,將得到的白色菌落即白色克隆轉到含有氨卞青霉素的LB固體培養基上培養,同時從每個克隆中提取質粒,并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構成了鮑氏志賀氏13型的O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在700bp以上的120個克隆由上海生物工程有限公司用ABI377型DNA自動測序儀對克隆中的插入片段單向進行測序,使序列達到80%的覆蓋率。剩余20%的序列再根據已得到的序列設計引物,再從鮑氏志賀氏菌13型的基因組DNA中直接PCR并對PCR產物測序或對已知序列進行反向測序及測通,獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical Research Council)分子生物學實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到鮑氏志賀氏菌13型的O-抗原基因簇的核苷酸全長序列,序列的質量主要由兩個方面來保證1)對鮑氏志賀氏菌13型的基因組作6個Long PCR反應,然后混合這些產物以產生文庫。2)對每個堿基,保證3個以上高質量的覆蓋率。在得到鮑氏志賀氏菌13型O-抗原基因簇的核苷酸序列后,用美國國家生物技術信息學中心(The National Center forBiotechnology Information,NCBI)的orffinder發現基因,找到12個開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發現這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質序列間的精確比對,最后得到鮑氏志賀氏菌13型的O-抗原基因簇的結構;(6)特異基因的篩選針對鮑氏志賀氏菌13型的O-抗原基因簇中的wzx、wzy、orf4、orf5、orf6、wbjE、orf11、orf12基因設計引物,在每個基因內各設計了三對引物,每對引物分布在相應基因內的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,所有引物都在鮑氏志賀氏菌13型中得到陽性結果,在其他組中都沒有擴增到任何大小正確的帶,即在大多數組中沒有得到任何PCR產物帶,雖然在少數組中得到PCR產物帶,但其大小不符合預期大小,所以wzx、wzy orf4、orf5、orf6、wbjE、orf11、orf12基因對鮑氏志賀氏菌13型的O-抗原都是高度特異的。
全文摘要
本發明提供一種對鮑氏志賀氏菌13型(Shigella dysenteriae 13)的O-抗原特異的核苷酸,它是鮑氏志賀氏菌13型中控制O-抗原合成的基因簇的核苷酸全序列。還包括O-抗原基因簇的結構以及源于鮑氏志賀氏菌13型的O-抗原基因簇中的糖基轉移酶基因和寡糖單位處理基因(包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因)的寡核苷酸,并且包括獲得細菌O-抗原基因簇的方法。本發明通過PCR證實寡核苷酸對鮑氏志賀氏菌13型的O-抗原有高度的特異性。本發明還公開了用本發明的寡核苷酸檢測和鑒定人體及環境中的鮑氏志賀氏菌13型的方法。
文檔編號C12Q1/68GK1438229SQ0310053
公開日2003年8月27日 申請日期2003年1月20日 優先權日2003年1月20日
發明者王磊, 楊靜華, 馮露 申請人:南開大學