專利名稱:人激素原轉化酶4的制作方法
背景技術:
許多以前體形式合成的蛋白質和激素均經過高度特異性的、屬于激素原轉化酶家族的蛋白酶加工而成為成熟形式。這一哺乳動物內切蛋白酶家族在它們的底物多肽中二堿性氨基酸位點的羧基側進行胞內切割。此激素原轉化酶(PC)家族的成員均為與酵母二堿性氨基酸特異性內切蛋白酶Kex2相關的Ca++依賴性絲氨酸蛋白酶(Smeekins,S.P.,Bio/Technology 11182-186,1993)。而且其催化區的構成與細菌性的枯草桿菌蛋白酶相似。至少已發現6種哺乳動物激素原轉化酶PC2,PC3/PC1,PC4,PC5/6,弗林蛋白酶/成對堿性氨基酸切割酶(furin/PACE)和PACE4(Smeekins,S.P.,同出處,Seidah,N.G.等,Biochimie(France)76197-209,1994)。
哺乳動物激素原轉化酶作用于多種有生物學活性排列的前體分子。胰島素原是第一個得到鑒定的底物前體。隨后,從酵母到哺乳動物已發現超過150種底物;包括神經肽、肽激素、生長因子及其受體、血漿和凝固蛋白、逆轉錄病毒包膜蛋白和細胞毒素如碳疽。切割位點處包括堿性氨基酸,切割發生在成對的堿性殘基處,通常在Lys-Arg或Arg-Arg之后,較少見在Arg-Lys或Lys-Lys之后(Smeekins,S.P.,同出處)。
激素原轉化酶家族有組織特異性表達和細胞區室化性質,這可能與生物學功能有關。例如,PC1/3和PC2只在神經內分泌組織中表達。這些蛋白質的生物學活性局限在神經內分泌細胞中、特別是分泌顆粒中受調節的分泌途徑上;且這兩種蛋白質均在顆粒中前體如胰高血糖素原,阿黑皮素原(POMC)和胰島素原的加工過程中有重要作用。故,其胞內定位和組織特異性看來反映了這些內切蛋白酶顯示其生物學活性的所在部位。
PC4的基因表達有高特異性的組織選擇性。PC4已從小鼠和大鼠中分離得到,且只表達于睪丸中。在小鼠體內,PC4基因表達發生在與精子發生第一階段相應的妊娠第20天左右。在生殖細胞中發現有高水平的PC4m RNA表達,但在間質細胞(Leydig’s Cell),足細胞(Sertoli’s Cell)或生精小管周圍細胞(peritubular cell)中未有發現。原位雜交證實在粗線期精母細胞和圓精子細胞中有mRNA表達,但在延長的精子細胞中不表達(N.G.Seidah等,分子內分泌學,61559-1570,1992)。而且,在大鼠和小鼠中均發現三種PC4 mRNA;這些RNA可能是由于不同的剪接和/或外顯子跳躍事件產生的。衍生自主要剪接形式或其它剪接形式的小鼠和大鼠PC4蛋白質的生物學功能尚不清楚。
精子發生是發生在生精小管(生殖細胞或稱精細胞在此最終成熟為精子)中的連續過程。睪丸中產生的肽均為介導睪丸細胞相互作用的潛在旁分泌因子和自分泌因子。大部分已知的這些潛在肽底物均產生于間質細胞和足細胞這些非生殖細胞中。位于生精小管中的足細胞與生殖細胞接觸,并可能直接產生影響生殖細胞成熟的睪丸特異性因子。影響生殖細胞的其它因子可能是旁分泌因子或內分泌因子;產生于生精小管外的這些分子中大多數由足細胞表達的轉運和結合蛋白運送進生殖細胞微環境中。此外,能穿過細胞屏障并進入精子細胞微環境的旁分泌因子包括間質細胞分泌的分子。間質細胞位于生精小管之間存在的胞間隙內,產生好幾種可能在成熟過程中很重要的因子,如睪酮,間質因子(Leydig factor),IGF-1,抑制素和prohibin。這些因子及其它因子可能在精子發生周期中的某一確定階段內特異作用。而且,與足細胞十分接近的生殖細胞中表達的某些肽激素是潛在的介導睪丸細胞相互作用的旁分泌因子和自分泌因子。例如阿片樣肽,POMC和腦啡肽原均在生殖細胞中表達并可能會被加工。有趣的是,鼠腦啡肽原的mRNA表達與精子發生期間鼠PC4的mRNA表達形式相似(S.Torii,等,FEBS Let.31612-16,1993)。鼠PC4的階段特異性表達暗示它在加工睪丸的激素原因子的過程中有生物學作用。雖然推測PC4在精子發生中有作用,但PC4的功能實際上并不清楚。
因此要尋找人類同系物。本發明便利地提供了鼠PC4的人類同系物的分離。
發明概要本發明提供了編碼人激素原轉化酶4多肽的分離多核苷酸,該多肽所含的一段氨基酸序列至少90%等同于選自下組的氨基酸序列(a)SEQ ID No2所示114位氨基酸(Ser)至443位氨基酸(Ala)的氨基酸序列;(b)SEQ ID No2所示114位氨基酸(Ser)至755位氨基酸(Thr)的氨基酸序列;(c)SEQ ID No2所示20位氨基酸(Arg)至755位氨基酸(Thr)的氨基酸序列;及(d)SEQ ID No2所示1位氨基酸(Met)至755位氨基酸(Thr)的氨基酸序列。在另一個實施方案中,上文公開的分離的人激素原轉化酶4多核苷酸選自下組(a)SEQ ID No1所示400位至1389位核苷酸的多核苷酸序列;(b)SEQ ID No1所示400-2325位核苷酸的多核苷酸序列;(c)SEQ ID No1所示118-2325位核苷酸的多核苷酸序列;及(d)SEQ ID No1所示61-2325位核苷酸的多核苷酸序列。在另一個實施方案中,上文公開的分離的人激素原轉化酶4多核苷酸包含SEQ ID No3所示1-2265位核苷酸。在另一個實施方案中,上述分離的人激素原轉化酶4多核苷酸編碼的人激素原轉化酶4多肽基本上由至少90%等同于SEQ ID No2所示20位(Arg)-755位(Thr)氨基酸序列的氨基酸殘基序列組成。在另一個實施方案中,上述分離的多核苷酸編碼的人激素原轉化酶4多肽基本上由SEQ IDNo2所示20位(Arg)-755位(Thr)氨基酸殘基的序列組成。
第二方面,本發明提供含有以下可操作連接在一起的元件的表達載體轉錄啟動子;編碼至少90%等同于SEQ ID No2中20位(Arg)-755位(Thr)所示氨基酸序列的激素原轉化酶多肽的DNA區段;轉錄終止子。在另一實施方案中,上述表達載體進一步包含與該DNA區段可操作連接的分泌信號序列。
第三方面,本發明提供已導入上述表達載體的培養細胞,其中所述細胞表達該DNA區段編碼的多肽。
另一方面,本發明提供編碼融合蛋白的DNA構建體,該DNA構建體包含至少90%等同于選自下組之氨基酸殘基序列的多肽的第一DNA編碼區段(a)SEQ ID No2中1位(Met)-21位(Pro)殘基的氨基酸序列;(b)SEQ ID No2中20位(Arg)至113位(Arg)殘基的氨基酸序列;(c)SEQ ID No2中114位(Ser)-443位(Ala)殘基的氨基酸序列;(d)SEQ ID No2中444位(Arg)-561位(Tyr)殘基的氨基酸序列;(e)SEQ ID No2中562位(Tyr)-755位(Thr)殘基的氨基酸序列;(f)SEQ ID No2中114位(Ser)-755位(Thr)殘基的氨基酸序列;(g)SEQ ID No2中20位(Arg)-755位(Thr)殘基的氨基酸序列;以及另含編碼額外多肽的至少一個其它DNA區段,其中該第一DNA區段和該其它DNA區段讀框一致地連接,并編碼融合蛋白。另一實施方案中,本發明提供由以下方法產生的融合蛋白培養已導入了含有以下可操作連接在一起的元件的載體的宿主細胞(a)轉錄啟動子;(b)編碼上述融合蛋白的DNA構建體;及(c)轉錄終止子;然后回收由該DNA區段編碼的蛋白質。
另一方面,本發明提供分離的多肽,其所含的一段氨基酸序列至少90%等同于選自下組的氨基酸序列(a)SEQ ID No2中114位(Ser)-443位(Ala)氨基酸的氨基酸序列;(b)SEQ ID No2中114位(Ser)-755位(Thr)的氨基酸序列;(c)SEQ ID No2中20位(Arg)-755位(Thr)的氨基酸序列;及(d)SEQ ID No2中1位(Met)至755位(Thr)的氨基酸序列。另一個實施方案中,上述分離的多肽基本上由至少90%等同于SEQ ID No2中20位(Arg)-755位(Thr)之氨基酸序列的序列組成。另一實施方案中,上述分離的多肽就是SEQ ID No2中20位(Arg)-755位(Thr)所示的氨基酸序列。
另一方面,本發明提供產生人激素原轉化酶4多肽的方法,包括培養上述細胞;分離由上述細胞產生的人激素原轉化酶多肽。
另一方面,本發明提供測定人激素原轉化酶4多肽的多肽激素原底物的方法,包括培養已導入有上述表達載體的細胞,其中該細胞表達由該DNA區段編碼的人激素原轉化酶多肽,并同時表達檢驗底物激素原多肽;檢測人激素原轉化酶4切割該檢驗底物而產生的切割產物。另一實施方案中,測定人激素原轉化酶4多肽的多肽激素原底物的方法包括體外將權利要求11的激素原轉化酶4多肽與檢驗底物多肽混合;檢測因人激素原轉化酶4多肽切割檢驗底物而產生的切割產物。
另一方面,本發明提供檢測待檢樣品中有無人激素原轉化酶多肽活性的調節子的方法,包括在有或無待檢樣品的情況下培養已導入上述表達載體的細胞,其中該細胞表達由上述DNA區段編碼的人激素原轉化酶多肽,并同時表達已知的指示性激素原多肽底物;用生物學或生物化學方法比較有或沒有待檢樣品時,因人激素原轉化酶多肽切割底物而產生的切割產物水平;并通過比較確定檢驗樣品中是否存在人激素原轉化酶活性的調節子。
另一方面,本發明提供生產人激素原轉化酶4多肽的抗體的方法,包括用選自下組的多肽接種動物(a)含9-755個氨基酸的多肽,其中該多肽至少90%等同于SEQ ID NO2所示20位(Arg)-755位(Ser)序列中的一段連續序列;(b)上述多肽;(c)其序列至少90%等同于SEQ ID No2中444位(Arg)至561位(Tyr)氨基酸的多肽;及(d)其氨基酸序列至少90%等同于SEQ ID No2中562位(Tyr)氨基酸至755位(Thr)的多肽,其中該多肽在動物體內能激發免疫應答;然后從動物內分離抗體。另一實施方案中,上述方法產生的抗體可與人激素原轉化酶4多肽結合。另一實施方案中,上述抗體為單克隆抗體。
另一方面,本發明提供可與上述多肽特異性結合的抗體。
本發明的這些及其它方面在參考了以下詳細說明和附圖
之后將變得明顯。
圖的簡述此圖是人PC1、人PC2、大鼠PC4、小鼠PC4、本發明的新型人PC4、小鼠弗林蛋白酶及人弗林蛋白酶的多重對比。
發明詳述詳述本發明之前,確定以下術語可能將有助于理解本發明術語“親和標記”表示一段多肽區段,它能附著于第二多肽,以便純化或檢測第二多肽,或使第二多肽可通過它提供的位點附著于底物上。原則上,有抗體或其它特異性結合因子可供使用的任何肽或蛋白質均可用作親和標記。親和標記包括多聚組氨酸段,蛋白A(Nilsson等,EMBO J.41075,1985;Nilsson等,酶學方法,1983,1991),谷胱苷肽S-轉移酶(Smith和Johnson,基因6731,1988),Glu-Glu親和標記(Grussenmeyer等,美國國家科學院院報827952-4,1985),物質P,FlagTM肽(Hopp等,生物技術學61204-1210,1988;可由Eastman Kodak公司,New Haven,CT提供),鏈霉抗生物素蛋白結合肽,或其它抗原性表位或結合區。總見Ford等,蛋白質表達和純化295-107,1991。編碼親和標記的DNA可由生產商(如PharmaciaBiotech,Piscataway,NJ)提供。
術語“等位變體”表示一個基因占據相同染色體位點的兩種或多種可互換形式的任一種。等位變體通過突變自然產生,并可能導致種群內表型多樣化。基因突變可以是沉默的(編碼的多肽沒有改變),或可以編碼有改變的氨基酸序列的多肽。術語等位變體此處也用于表示由基因的等位變體編碼的蛋白質。
“氨基末端”和“羧基末端”用來表示多肽中的位置。在內容允許之處,這些術語用于表示參照某一多肽特定序列或部分的接近度或相對位置。例如,位于多肽中參照序列羧基端的某序列即是在參照序列羧基末端附近,但不必在完整多肽的羧基末端。
術語“切割產物”表示由激素原轉化酶切割未加工的激素原多肽而產生的激素原多肽片段。
“互補物/反互補物對”表示在適當條件下形成非共價結合的穩定對的非相同部分。如,生物素和抗生物素蛋白(或鏈霉抗生物素蛋白)就是互補物/反互補物對的典型。其它互補物/反互補物對的例子有受體/配體對,抗體/抗原(或半抗原或表位)對,有義/反義多核苷酸對等等。在互補物/反互補物對需要隨后解離之處,互補物/反互補物對優選結合親和力小于109M-1。
“多核苷酸分子的互補物”是與參照序列相比有互補堿基序列并方向相反的多核苷酸分子。例如序列5’ATGCACGGG3’與5’CCCGTGCAT3’互補。
“簡變核苷酸序列”表示含一個或多個簡變密碼子(與編碼多肽的參照多核苷酸分子相比)的核苷酸序列。簡變密碼子包含不同的核苷酸三聯體,但通常編碼相同的氨基酸殘基(即,GAU和GAC三聯密碼均編碼Asp)。
“DNA構建體”為單或雙鏈的線性或環狀DNA分子,包含以自然界沒有的方式結合和并列的DNA區段。DNA構建體是人為操作的結果,包括被操作分子的克隆及其它拷貝。
“DNA區段”是大DNA分子的有特定意義的部分。如編碼特定多肽的DNA區段是更長DNA分子(如質粒或質粒片段)的一部分,當從5’至3’方向閱讀時可編碼特定多肽的氨基酸序列。
“表達載體”表示線性或環狀DNA分子,其中有編碼目的多肽的區段與提供其轉錄的其它區段可操作連接。這類其它區段包括啟動子和終止子序列,還可能包括一個或多個復制起點,一個或多個選擇標記,增強子,多聚腺苷酸化信號等。表達載體一般來源于質粒或病毒DNA,或可能有兩者的元件。
“分離的”,當用于多核苷酸時,表示該多核苷酸已脫離其天然遺傳環境,并因此不含其它無關或不需要的編碼序列,并且是適于在基因工程性蛋白質生產系統中應用的形式。這類分離分子是那些與其天然環境分開的分子,包括cDNA和基因組克隆。本發明的分離DNA分子不含正常與之相關的其它基因,但可能包含天然存在的5’和3’非翻譯區,如啟動子和終止子等。相關區域的鑒定對本領域內的技術人員是顯而易見的(見如,Dynan和Tijan,自然316774-78,1985)。
“分離的”多肽或蛋白質是在不同于其天然環境的條件(如與血液和動物組織分開)下存在的多肽或蛋白質。優選地,分離多肽基本上不含其它多肽,尤其不含其他動物源性多肽。優選提供高度純化形式的多肽,即大于95%純,更優選地大于99%純。應用于本文中時,術語“分離的”不排除相同多肽以其它物理形式存在,如二聚體或者糖基化的或衍生的形式。
“可操作地連接的”,當用于DNA區段時,表示各區段經安排能發揮預期功能,如在啟動子內起始轉錄并延伸通過編碼區段直至終止子。
“正同系物(ortholog)”表示得自一個物種的多肽或蛋白質為另一物種的多肽或蛋白質的功能相對物。正同系物之間的序列差異是物種形成的結果。
“副同系物(paralog)”是由一種生物體產生的相互區別但又結構相關的蛋白質。副同系物被認為是通過基因重復產生的。例如α-珠蛋白,β-珠蛋白和肌紅蛋白互為副同系物。
“多核苷酸”為從5’末端讀至3’末端的脫氧核糖核苷酸或核糖核苷酸堿基的單鏈或雙鏈多聚體。多核苷酸包括RNA和DNA,可分離自天然來源,可體外合成,或結合天然分子與合成分子而制成。多核苷酸的大小表示為堿基對(縮寫“bp”),核苷酸(“nt”),或千堿基(“kb”)。只要內容允許,后兩個術語可描述單鏈或雙鏈的多核苷酸。當用于指雙鏈分子時,表示的是全長,應理解為等同于術語“堿基對”。本領域內技術人員將認識到雙鏈多核苷酸的兩條鏈長度可能稍有不同,其末端可能因酶切而成交錯切口狀;因而雙鏈多核苷酸分子中的所有核苷酸不一定配對。這些未配對的末端長度一般不超過20nt。
“多肽”是天然產生的或合成的以肽鍵連接的氨基酸殘基多聚體。不足約10個氨基酸殘基的多肽通常稱為“肽”。
“啟動子”在此用其本領域公認的含義表示含有可結合RNA聚合酶并起始轉錄的DNA序列的基因部分。啟動子序列常發現位于基因的5’非編碼區,但并不總是這樣。
“蛋白質”是包含一條或多條多肽鏈的大分子。蛋白質也可含非肽成分,如糖基。糖和其它非肽取代基可由產生該蛋白質的細胞加在蛋白質上,且在不同細胞類型中各不相同。蛋白質在本文以其氨基酸骨架結構限定;取代基如糖基通常不特別指明,但可存在。
“分泌信號序列”表示編碼一種多肽(“分泌肽”)的DNA序列,該多肽作為較大多肽的一個成分,可指導該較大多肽穿過合成它的細胞的分泌途徑。該較大多肽常在經分泌途徑的轉運期間被切除掉分泌肽。分泌信號序列將多肽導入細胞的分泌途徑,但可能引導或不引導含該序列的多肽從細胞中真正分泌出來。
“剪接變體”表示由基因轉錄出來的的RNA的諸可互換形式。剪接變體一般通過利用轉錄RNA分子內(或較少情況下是分別轉錄的RNA分子之間)的可互換剪接位點而天然產生,并可由同一基因轉錄好幾種mRNA。剪接變體可編碼含不同氨基酸序列的多肽。術語剪接變體用在本文中還表示由基因轉錄出來的mRNA的剪接變體編碼的蛋白質。
由不精確分析法(如凝膠電泳)測定的聚合體分子量和長度應理解為近似值。當這樣一個值表示為“約”X或“近似”X時,X值應被理解為精確至±10%。
本文引用的所有文獻均全文引入作為參考文獻。
本發明部分基于一個新DNA序列的發現,該DNA序列編碼同源于激素原轉化酶家族(如小鼠和大鼠PC4,PC2,PC1,弗林蛋白酶)的蛋白質。該DNA序列命名為人激素原轉化酶4,本文縮寫為“人PC4”。分析對應于這種新cDNA的mRNA的組織分布發現,mRNA僅限于睪丸中表達。這種組織特異性表達說明它能夠作為激素原轉化酶起作用,完全或部分地加工生長或分化因子的激素原多肽,使之成為睪丸特異性和非睪丸細胞類型的成熟或活化形式。
哺乳動物激素原轉化酶有共同的結構特征。總見Smeekins.S.P.,文獻同上,和Seidah,N.,酶學方法(Methods in Enz.),244175-188,1995。所有這類分子均包含一個N-末端分泌肽,可指導該蛋白質進入分泌途徑。該區后隨有Homo-A區(似乎與蛋白酶折疊有關)。經自我催化去除Homo-A區是蛋白酶解活化必需的。Homo-A區之后是催化區(為活性所必需)。催化區的氨基酸序列與枯草桿菌蛋白酶催化區極其相似。緊鄰催化區是Homo-B區(亦為酶活性所必需)。此區之外,在C末端,激素原轉化酶出現結構多樣化。C末端區的功能未知,但似乎與哺乳動物激素原轉化酶的細胞和細胞器特異性定向有關。
本發明提供新型人激素原轉化酶。對編碼激素原轉化酶的人cDNA(SEQ ID No1)的分析揭示,其中有編碼755個氨基酸(SEQ ID No2)的一個開放讀框,包含一段假定的分泌肽(見SEQ ID No2的1位(Met)至19位(Val)殘基)和一段成熟肽(見SEQ ID No2的20位(Arg)至755位(Thr)殘基)。如圖所示,該成熟多肽與Kex2內切蛋白酶家族中包括大鼠和小鼠PC4,人弗林蛋白酶,人PC1和人PC2在內的其它成員有同源性。如上所述,該蛋白質家族的特征是有保守的枯草桿菌蛋白酶樣催化區(見SEQ ID No2的114位(Ser)至443位(Ala)殘基),該區氨基末端和羧基末端側翼分別為不那么保守的Homo-A區(見,SEQ IDNo2的20位(Arg)至113位(Arg)殘基)和Homo-B區(見,SEQ ID No2的444位(Arg)至561位(Tyr)殘基)(Nakayama等,生物化學雜志(東京),109803-806,1991)。大鼠和小鼠PC4中的活性位點Asp,His和Ser殘基以及對催化比較重要的殘基Asn在人PC4中是保守的(見,SEQ ID No2,殘基Asp-158,His-198,Ser-372和Asn-300)。信號肽酶切割位點預計在人激素原轉化酶比對中的19號殘基(Val)之后。發現于所有已知哺乳動物激素原轉化酶內的保守的Arg-Gly-Asp序列(見SEQ ID No2的503-505號殘基)存在于人PC4中(Nakayama,文獻同上,及其中的參考文獻)。預計人PC4合成為前體酶(酶原),需在C末端側自我催化切除Arg-Arg-Val-Lys-Arg(SEQID No4;亦見SEQ ID No2的109位(Arg)至113位(Arg)殘基)序列才產生活性酶。Kex2和大鼠PC4中已發現有相似的酶原活化序列(Nakayama等,生物化學雜志(東京),109803-806,1991)。人PC4唯一的C末端區(見,SEQ ID No2的562位(Tyr)至755位(Thr)殘基)與弗林蛋白酶的序列高度相同。此區的功能可能涉及細胞和細胞器特異性定向。
位于如人PC4的枯草桿菌蛋白酶樣催化區中高度保守的氨基酸可用作鑒定新家族成員的工具。例如,可用逆轉錄-聚合酶鏈式反應(RT-PCR),從各種組織來源或細胞系的RNA擴增編碼保守的枯草桿菌蛋白酶樣催化區的序列。尤其,根據人PC4序列設計的高度簡并引物可用于此目的。
本發明還提供編碼本文所公開的人PC4多肽的多核苷酸分子(包括DNA和RNA分子)。本領域內技術人員易于認識到,由于遺傳密碼的簡并性,這些多核苷酸分子之中可能有相當量的序列變異。SEQ ID No3是包括所有編碼SEQ ID No2的人PC4多肽的DNA的簡并DNA序列。本領域內技術人員將認識到,SEQ ID No3的簡并序列通過以T代替U也可提供所有編碼SEQ ID No2的RNA序列。因此,包含SEQ ID No31-2265位核苷酸的編碼人PC4多肽的多核苷酸及其RNA對應體均包括在本發明中。表1公開了SEQ ID No3中用于表示簡并核苷酸位置的單字母密碼。“解析”為密碼字母所表示的核苷酸。“互補物”表示互補核苷酸的密碼。例如,密碼Y表示C或T,它的互補物R表示A或G,A為T的互補,G為C的互補。
表1核苷酸解析核苷酸互補物A A T TC C G GG G C CT T A AR A|G Y C|TY C|T R A|GM A|C K G|TK G|T M A|CS C|G S C|GW A|T W A|TH A|C|T D A|G|TB C|G|T V A|C|GV A|C|G B C|G|TD A|G|T H A|C|TN A|C|G|T N A|C|G|T表2給出了SEQ ID NO3中所用的簡并密碼子,包括一個給定氨基酸的所有可能密碼子。表2氨基酸單字母 密碼子 簡并密碼子密碼子Cys C TGC TGTTGYSer S AGC AGT TCA TCC TCG TCTWSNThr T ACA ACC ACG ACTACNPro P CCA CCC CCG CCTCCNAla A GCA GCC GCG GCTGCNGly G GGA GGC GGG GGTGGNAsn N AAC AATAAYAsp D GAC GATGAYGlu E GAA GAGGARGln Q CAA CAGCARHis H CAC CATCAYArg R AGA AGG CGA CGC CGG CGTMGNLys K AAA AAGAARMet M ATGATGIle I ATA ATC ATTATHLeu L CTA CTC CTG CTT TTA TTGYTNVal V GTA GTC GTG GTTGTNPhe F TTC TTTTTYTyr Y TAC TATTAYTrp W TGGTGGTer . TAA TAG TGATRRAsn|Asp B RAYGlu|Gln Z SARAny X NNN
本領域內技術人員將贊賞在確定編碼每種氨基酸的所有可能密碼子的簡并密碼子時導入某些模糊用法。例如,絲氨酸的簡并密碼子(WSN)有時可編碼精氨酸(AGR),精氨酸的簡并密碼子(MGN)有時編碼絲氨酸(AGY)。相似的關系存在于編碼苯丙氨酸和亮氨酸的密碼子之間。故,簡并序列包括的某些多核苷酸可編碼氨基酸序列變體,而本領域內技術人員能輕易地參照SEQ ID No2的氨基酸序列鑒別出這種變異序列。本文所述變體序列可易于檢驗其功能。
本領域內技術人員還能夠理解不同物種可存在“偏愛密碼子用法”。其可參見,Grantham,等,核酸研究,81893-912,1980;Haas,等,Curr.Biol.6315-24,1996;Wain-Hobson,等,基因13355-64,1981;Grosjean和Fiers,基因18199-209,1982;Holm,核酸研究143075-87,1986;Ikemura,分子生物學雜志158573-97,1982。本文所用術語“偏愛密碼子用法”或“偏愛密碼子”指在某一物種的細胞中使用最頻繁的蛋白質翻譯密碼子,故優選編碼每種氨基酸的可能密碼子中的一個或幾個代表(見表2)。例如,蘇氨酸(Thr)可由ACA,ACC,ACG或ACT編碼,但在哺乳動物細胞中ACC最為常用;在其它物種,如昆蟲細胞,酵母,病毒或細菌中可能優選其它Thr密碼子。某一特定物種的偏愛密碼子可通過本領域內已知的各種方法導入本發明的多核苷酸。將偏愛密碼子序列導入重組DNA能,例如,通過使蛋白質在特定細胞類型或物種中更有效地翻譯而增加該蛋白質的產量。因此,SEQ ID No3中公開的簡并密碼子序列可作為模板用于優化多核苷酸在本領域常用的和本文公開的各種細胞類型和物種中的表達。可檢驗并優化含偏愛密碼子的序列在不同物種中的表達,并如本文所述檢驗功能。
在本發明的優選實施方案中,所分離的多核苷酸能在嚴緊條件下與SEQ ID No1中的大小相似區,或與其互補序列雜交。通常所選嚴緊條件為在確定的離子強度和pH下比特定序列的解鏈溫度(Tm)低約5℃。Tm為有50%靶序列與完全匹配的探針雜交上的溫度(在確定的離子強度和pH下)。典型的嚴緊條件是其中NaCl濃度在pH7時高達約0.03M,溫度至少約60℃。
如前文已述,本發明的分離的多核苷酸包括DNA和RNA。制備DNA和RNA的方法為本領域內熟知。通常,RNA分離自可生產大量人PC4 RNA的組織或細胞。這樣的組織和細胞由Northern印跡鑒定(Thomas,美國國家科學院院報775201,1980),包括睪丸組織及睪丸衍生的細胞系。總RNA的制備可以是用鹽酸胍抽提再經CsCl梯度離心分離(Chirgwin等,生物化學1852-94,1979)。poly(A)+RNA可用Aviv和Leder的方法從總RNA中制備(美國國家科學院院報691408-12,1972)。互補DNA(cDNA)可用已知方法從Poly(A)+RNA制備。或者,可分離基因組DNA。再經如雜交或PCR鑒定并分離編碼人PC4多肽的多核苷酸。
編碼人PC4的全長克隆可經經典克隆程序獲得。優選互補DNA(cDNA)克隆,但有些應用中(如轉基因動物中的表達)優選應用基因組克隆,或修飾cDNA克隆使其包含至少一個基因組內含子。制備cDNA和基因組克隆的方法為本領域內熟知并在本領域普通技術人員的水平范圍之內,包括應用本文所公開的序列,或其部分去探測或引發一個文庫。表達文庫可用人PC4的抗體,受體片段,或其它特異性結合對應物探測。本發明還提供編碼人激素原轉化酶4的人基因組序列的分離。從SEQ ID No1衍生的探針可用于篩選人源基因組文庫以克隆人PC4的人基因組序列,方法按本領域已知的標準程序,及本文所公開的進行。
本領域內技術人員能意識到SEQ ID No1公開的序列代表人PC4的一個等位基因,而預期還會有等位變異和其它剪接形式。該序列的等位變體可通過用標準程序對不同個體的cDNA或基因組文庫進行探測而克隆。SEQ ID No1所示DNA序列的等位變體,包括那些含沉默突變的、及那些突變導致了氨基酸序列變化的等位變體,均包含在本發明的范圍內,同時包含的還有SEQ ID No2的等位變體蛋白質。本發明還提供所述分離多核苷酸的mRNA剪接變體形式,它們可能是人激素原轉化酶4的基因表達天然產生的結果。mRNA經另一種剪接產生的、保留了人PC4多肽特點的cDNA也包括在本發明的范圍內,還包括由這些cDNA和mRNA編碼的多肽。該序列的剪接變體可按標準程序對人cDNA文庫,如人睪丸cDNA文庫探查而克隆。
本發明還提供基本同源于SEQ ID No2多肽的分離的人激素原轉化酶4多肽及其正同系物。在一優選形式中,分離的多肽基本上不含其它多肽,特別是其它動物源多肽。優選提供高度純化的多肽,即純度超過95%,優選純度超過99%。“基本同源”在本文指序列有至少85%相同于SEQ ID No2的序列或SEQ ID No2的剪接變體序列的多肽。這樣的多肽將更優選至少90%、或最優選95%或更多相同于SEQ IDNo2或SEQ ID No2的剪接變體。序列相同性百分比用經典方法測定。見,如,Altschul等,Bull.Math.Bio.48603-616,1986和Henikoff和Henikoff,美國國家科學院院報8910915-10919,1992。簡單說,將兩個氨基酸序列一一對比,間隙開口罰10分,間隙延伸罰1分,以及示于表3的Henikff和Henikoff(文獻同上)“blosum62”得分矩陣使一一對比的得分最佳化(表3中氨基酸均以標準的單字母代碼表示)。表3A R N DC Q E G H I L K M F P S T W Y VA 4R -1 5N -2 0 6D -2 -2 1 6C 0 -3 -3 -39Q -1 1 0 0 -3 5E -1 0 0 2 -4 2 5G 0 -2 0 -1 -3 -2 -2 6H -2 0 1 -1 -3 0 0 -2 8I -1 -3 -3 -3 -1 -3 -3 -4 -3 4L -1 -2 -3 -4 -1 -2 -3 -4 -3 2 4K -1 2 0 -1 -3 1 1 -2 -1 -3 -2 5M -1 -1 -2 -3 -1 0 -2 -3 -2 1 2 -1 5F -2 -3 -3 -3 -2 -3 -3 -3 -1 0 0 -3 0 6P -1 -2 -2 -1 -3 -1 -1 -2 -2 -3 -3 -1 -2 -4 7S 1 -1 1 0 -1 0 0 0 -1 -2 -2 0 -1 -2 -1 4T 0 -1 0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1 1 5W -3 -3 -4 -4 -2 -2 -3 -2 -2 -3 -2 -3 -1 1 -4 -3 -2 11Y -2 -2 -2 -3 -2 -1 -2 -3 2 -1 -1 -2 -1 3 -3 -2 -2 2 7V 0 -3 -3 -3 -1 -2 -2 -3 -3 3 1 -2 1 -1 -2 -2 0 -3 -1 4
最佳對比的相同性百分比計算如下
多核苷酸分子間的序列相同性用相似的方法測定,用如上文所公開的比率表示。
人PC4多肽的變體或基本同源物均有一或多個氨基酸替代,缺失或增加。這些變化優選為微小特征的變化,即為保守型氨基酸替代(見表4)和其它不明顯影響多肽的折疊或活性的替代;小缺失,通常為1至約30個氨基酸的缺失;氨基-或羧基-末端的小延伸,如氨基末端增加一個甲硫氨酸殘基,或多達約20-25個殘基的連接小肽,或一個親和標記,如一個便于純化的小延伸(如一個多組氨酸串,一個抗原性表位或一個結合區)。總見,Ford等,蛋白質表達和純化295-107,1991。含親和標記的多肽可進一步在人PC4多肽和該親和標記之間包含一個蛋白酶切割位點。這樣的切割位點包括,如,凝血酶切割位點和Xa因子切割位點。
表4保守的氨基酸替換堿性氨基酸 精氨酸賴氨酸組氨酸酸性氨基酸 谷氨酸天冬氨酸極性氨基酸 谷氨酰胺天冬酰胺疏水氨基酸 亮氨酸異亮氨酸纈氨酸芳香族氨基酸 苯丙氨酸色氨酸酪氨酸小氨基酸 甘氨酸丙氨酸絲氨酸蘇氨酸甲硫氨酸本發明的蛋白質還包括非天然存在的氨基酸殘基。它們有,但不限于,反式-3-甲基脯氨酸、2,4-甲醇基脯氨酸、順式-4-羥脯氨酸、反式-4-羥脯氨酸、N-甲基甘氨酸、異-蘇氨酸(allo-threonine)、甲基蘇氨酸、羥乙基半胱氨酸、羥乙基高半胱氨酸、硝基谷氨酰胺、高谷氨酰胺、六氫吡啶羧酸、噻唑烷羧酸、脫氫脯氨酸、3-和4-甲基脯氨酸、3,3-二甲基脯氨酸、叔-亮氨酸、正纈氨酸、2-氮雜苯丙氨酸(2-azaphenylalanine)、3-氮雜苯丙氨酸、4-氮雜苯丙氨酸、和4-氟苯丙氨酸。本領域已知有很多方法可將非天然存在的氨基酸殘基導入蛋白質。如可利用一個體外系統,其中無義突變均用化學氨酰化抑制子tRNA進行抑制。合成氨基酸和氨酰tRNA的方法為本領域內已知。含無義突變的質粒的轉錄和翻譯在包含大腸桿菌S30提取物,商業化酶及其它試劑的無細胞體系中進行。蛋白質經層析純化。見,如,Robertson等,美國化學協會雜志1132722,1991;Ellman等,酶學方法.202301,1991;Chung等,科學259806-9,1993;及Chung等,美國國家科學院院報9010145-9,1993)。在第二種方法中,翻譯在非洲爪蟾卵母細胞中進行,方法是將突變的mRNA和化學氨酰化抑制子tRNA顯微注射進該卵母細胞(Turcatti等,生物化學雜志,27119991-8,1996)。第三個方法中,將大腸桿菌細胞在缺乏將被取代的天然氨基酸(如苯丙氨酸)而有所需非天然氨基酸(如2-氮雜苯丙氨酸,3-氮雜苯丙氨酸,4-氮雜苯丙氨酸,或4-氟苯丙氨酸)的情況下培養。這樣,非天然氨基酸將代替其天然對應物而摻入蛋白質中。見,Koide等,生物化學337470-6,1994。天然氨基酸殘基可用體外化學修飾法轉換成非天然類型。化學修飾可結合定點誘變進行,以進一步擴大取代的范圍(Wynn和Richards,蛋白質科學2395-403,1993)。
可用有限量的非保守氨基酸、不由遺傳密碼編碼的氨基酸、非天然氨基酸、和不正常氨基酸取代人PC4的氨基酸殘基。
本發明多肽中的必需氨基酸可按本領域內已知的方法,如定點誘變或丙氨酸掃描誘變進行鑒定(Cunningham和Wells,科學244,1081-1085,1989;Bass等,美國國家科學院院報884498-502,1991)。在后一技術中,在分子中的每個殘基處導入單個丙氨酸突變,如下文述檢驗所得突變分子的生物學活性,以鑒定對分子活性比較關鍵的氨基酸殘基。亦見,Hilton等,生物化學雜志,2714699-708,1996。人PC4催化區中與其底物作用的關鍵位點也可通過對用核酸磁共振技術,晶體學技術,電子衍射技術或光親和標記技術確定的結構進行物理分析,結合假定接觸位點氨基酸的突變而測定。見,如,De Vos等,科學255306-12,1992;Smith等,分子生物學雜志224899-904,1992;Wlodaver等,FEBS Lett.30959-64,1992。必需氨基酸的同一性也可由本領域內技術人員經分析與相關激素原轉化酶的同源性而推論。
可以由已知的誘變和篩選方法制備并檢驗多重氨基酸取代,如Reidhaar-Olson和Sauer所公開的方法(科學24153-57,1988)或如Bowie和Sauer所公開的方法(美國國家科學院院報862152-2156,1989)。簡單說,這些作者公開的方法是同時使多肽中的兩個或多個位置隨機化,選擇功能性多肽,再測序經誘變的多肽,以確定每個位置的容許替代范圍。其它可用的方法包括噬菌體展示(如Lowman等,生物化學3010832-10837,1991;Ladner等,美國專利號5,223,409;Huse,WIPO公開WO 92/06204)和區域定向誘變(Derbyshire等,基因46145,1986;Ner等,DNA7127,1988)。
所公開的人PC4 DNA和多肽序列的變體可通過Stemmer,自然370389-91,1994;Stemmer.美國國家科學院院報9110747-51,1994;有WIPO公開WO97/20078所公開的DNA改組而產生。簡單說,體外經親代DNA隨機片段化后用PCR重新組裝而同源重組,產生隨機導入的點突變,就產生了變體DNA。該技術可改用親代DNA的一個家族,如等位變體或來自不同物種的DNA進行,以便在加工中導入另外的變異。對所需活性進行選擇或篩選,再重復誘變過程并分析,可通過選出所需突變而同時選擇去除不利變化而使序列進行快速“進化”。
本文所公開的誘變方法可結合高容量、自動化篩選方法,以檢測宿主細胞中克隆的誘變多肽的活性。編碼活性多肽(如切割已知多肽底物指示劑)的誘變DNA分子可從宿主細胞中回收,并用現代儀器快速測序。這些方法能夠快速確定單個氨基酸殘基在目的多肽中的重要性,并可用于未知結構的多肽。而且,這些誘變方法可用于加工蛋白質,如人激素原轉化酶4,改變其反應動力學,縮小或擴大其底物特異性,改變多肽的組織和細胞定位。
本領域內技術人員可用上述方法制備基本同源于SEQ ID No2的1-755位殘基或其等位變體或其剪接變體并保留野生型蛋白質活性的各種多肽。
而且,用本領域內描述的方法,可將本發明人激素原轉化酶4的各區域或結構域與其它已知或未知激素原轉化酶蛋白質(如PC2和PC1)的各區結合,或與異源蛋白質結合,而構建出多肽融合體,或雜合的激素原轉化酶蛋白質(Sambrook等,文獻同上,Altschul等,文獻同上,Picard,D.,Cur.Opin.Biology 5511-515,1994,及其中的參考文獻)。利用這些方法能夠確定目的多肽中較大區的生物學重要性。這些雜合體改變了反應動力學,縮小或擴大了底物特異性,或改變了多肽的組織和細胞定位,并能應用于未知結構的多肽。
融合蛋白可用本領域內技術人員熟知的方法制備。按正確讀框編碼融合蛋白中每一成分的多核苷酸分子可用已知技術產生,并按本文所述方法表達。例如,本發明人PC4的生物學功能區的部分或全部可與另一種激素原轉化酶(如PC2或PC1)的相應區互換。這樣的區包含但不限于本文所述分子的分泌信號序列,Homo-A區,催化區,Homo-B區和C末端部分。可通過連接多核苷酸區段成為正確讀框,產生編碼融合蛋白好幾個區的一個DNA多區段,而以此形式交換一個或幾個區(如上述那些區)。產生這樣的融合蛋白的方法為本領域內熟知(Sambrook等,同出處,Altschul等,同出處,Picard,D.,同出處)。這樣的融合蛋白包含至少一個人PC4區,并預期有相同或類似于本發明的多肽或其他已知或未知激素原轉化酶(如PC2和PC1)的生物學功能性質,這依賴于所構建的融合體。而且這樣的融合蛋白可具有其它如上所述的特點。
對于任何人PC4多肽,包括變體和融合蛋白,本領域內技術人員均可用本文所公開的并示于上文表1和表2的資料輕易地產生編碼該變體的一個完全簡并性多核苷酸序列。
本發明的多肽,包括全長多肽、生物學活性片段及融合多肽,可按常規技術在經基因工程改造過的宿主細胞中產生。適當的宿主細胞是能用外源DNA轉化或轉染并生長于培養基中的那些細胞類型,包括細菌、真菌細胞及培養的較高等真核細胞。真核細胞,尤其是多細胞生物體的培養細胞較為優選。操作克隆化DNA分子并將外源DNA導入各類宿主細胞的技術均公開在Sambrook等,分子克隆實驗室手冊,第二版,冷泉港實驗室出版,冷泉港,NY,1989及Ausubel等編輯,分子生物學最新實驗程序(Current Protocols in MolecularBiology),John Wiley and Sons,公司,NY,1987)中。
通常,在表達載體內,編碼人激素原轉化酶4多肽的DNA序列與表達所需其它遺傳元件可操作連接(一般包括轉錄啟動子和終止子)。載體還常包含一或多個選擇標記及一或多個復制起點,盡管本領域技術人員將認識到,某些系統中,選擇標記可提供在另外的載體上,復制外源DNA可通過向宿主細胞基因組整合而完成。選擇啟動子,終止子,選擇標記,載體和其它元件是本領域內普通技術人員的常規設計程序。很多這樣的元件在文獻中有述,并可由生產商提供。
為將人激素原轉化酶4多肽導入宿主細胞的分泌途徑,可在表達載體中提供分泌信號序列(也稱前導序列,前原序列或前序列)。分泌信號序列可以是人激素原轉化酶4多肽的序列,也可衍生自定向于分泌途徑的另一蛋白質(如t-PA),也可從頭合成。分泌信號序列以正確閱讀框架加入人激素原轉化酶4 DNA序列中,其所處位置可引導新合成的多肽進入宿主細胞的分泌途徑。分泌信號序列通常位于目的多肽編碼DNA序列的5’端,不過某些分泌信號序列可位于目的DNA序列中的其它位置(見,如,Welch等,美國專利號5,037,743;Holland等,美國專利號5,143,830)。
或者,包含在本發明多肽中的分泌信號序列可用于引導其它多肽進入分泌途徑。本發明提供這類融合多肽。信號融合多肽可制成其中編碼SEQ ID No2的1位(Met)至19位(Val)氨基酸殘基的分泌信號序列可操作連接于編碼另一多肽的DNA區段上,所用方法為本領域已知并為本文所公開。由此產生的本發明融合多肽中所包含的分泌肽優選在其氨基末端融合另一肽,以引導這另一肽進入分泌途徑。這類構建體具有本領域內已知的多種用途。例如,這些新型分泌信號序列融合構建體可引導如通常不能徹底分泌的蛋白質的活性成分(如細胞表面受體)或其它非分泌蛋白質的分泌。這類融合體可體內或體外用于引導肽通過分泌途徑。
培養的哺乳動物細胞為本發明的適宜宿主。將外源DNA導入哺乳動物宿主細胞的方法包括磷酸鈣介導的轉染(Wigler等,細胞14725,1978;Corsaro和Pearson,體細胞遺傳學7603,1981;Graham和Van der Eb,病毒學52456,1973),電穿孔(Neumann等,EMBO J1841-845,1982),DEAE-葡聚糖介導的轉染(Ausubel等,同出處),及脂質體介導的轉染(Hawley-Nelson等,Focus 1573,1993;Ciccarone等,Focus 1580,1993),和病毒載體(Miller和Rosman,生物技術7980-90,1989;Wang和Finer,醫學自然(Nature Med.)2714-6,1996)。培養的哺乳動物細胞中重組多肽的生產公開于,如,Levinson等的美國專利第4,713,339號;Hagen等的美國專利第4,784,950號;Palmiter等的美國專利第4,579,821號;及Ringold的美國專利第4,656,134號。適合的培養哺乳動物細胞包括COS-1(ATCC No.CRL 1650),COS-7(ATCC No.CRL 1651),BHK(ATCC No.CRL 1632),BHK 570(ATCC No.CRL 10314),293(ATCC No.CRL 1573;Graham等,普通病毒學雜志(J.Gen.Virol.)3659-72,1977)及中國倉鼠卵巢(如CHO-K1;ATCC No CCL 61)細胞系。其它優選細胞系為培養的睪丸細胞,包括海豚DB1.Tes細胞(CRL-6258);小鼠GC-1spg細胞(CRL-2053);TM3細胞(CRL-1714);TM4細胞(CRL-1715);及豬ST細胞(CRL-1746),可由美國典型培養物保藏中心,Rockyille,MD.提供。其它適合的細胞系為本領域內已知,可由公共保藏機構如美國典型培養物保藏中心,Rockyille,馬里蘭提供。通常優選強轉錄啟動子,如SV-40或巨細胞病毒的啟動子。見,如,美國專利號4,956,288。其它適合的啟動子包括來自金屬硫蛋白基因的啟動子(美國專利號4,579,821和4,601,978)和腺病毒主要晚期啟動子。
藥物選擇通常用于挑選其中已插入外源DNA的培養哺乳動物細胞。這類細胞通常稱為“轉染子”。在選擇劑存在時培養的、并能將目的基因傳給子代的細胞稱為“穩定轉染子”。優選的選擇標記為新霉素抗性編碼基因。選擇在有新霉素型藥物(如G-418等)存在時進行。選擇系統還可用于增加目的基因的表達水平,該過程稱為“擴增”。擴增的執行是通過在有低水平選擇劑時培養轉染子,然后增加選擇劑的量,以選出產生導入基因的高水平產物的細胞。優選的可擴增選擇標記為二氫葉酸還原酶基因,它能賦予對氨甲蝶呤的抗性。其它抗藥基因(如潮霉素抗性,多藥物抗性,嘌呤霉素乙酰轉移酶)也可應用。會導入改變表型的其它標記,如綠熒光蛋白,或細胞表面蛋白(如CD4,CD8,MHCI類分子),胎盤堿性磷酸酶均可通過FACS分選術或磁珠分離技術而用于從未轉染細胞中選出轉染細胞。
其它較高等真核細胞也可用作宿主,包括植物細胞,昆蟲細胞和禽細胞。用發根農桿菌作載體在植物細胞中表達基因已由Sinkar等人綜述(生物科學雜志(Bangalore)1147-58,1987)。昆蟲細胞的轉化及其中外源多肽的生產已公開于Guarino等的美國專利號5,162,222和WIPO公開WO94/06463中。昆蟲細胞可用桿狀病毒重組體(通常衍生自苜蓿銀紋夜蛾多核型多角體病毒(AcNPV)感染。見King,L.A.和Possee,R.D.,桿狀病毒表達系統實驗室指南,倫敦,Chapman & Hall;O’Reilly,D.R.等,桿狀病毒表達載體實驗室手冊,紐約,牛津大學出版社,1994;以及,Richardson,C.D.,編輯,桿狀病毒表達方案,分子生物學方法,Totowa,NJ,Humana出版社,1995。第二種制備重組人PC4桿狀病毒的方法應用了基于轉座子的系統,該系統述于Luckow,V.A,等,病毒學雜志674566-79,1993中。這一應用了轉移載體的系統在Bac-to-BacTM試劑盒(Life Technologies,Rockville,MD)中有售。見Hill-Perkins,M.S.和Possee,R.D.,普通病毒學雜志71971-6,1990;Bonning,B.C.等,普通病毒學雜志751551-6,1994;和,Chazenbalk,G.D.,和Rapoport,B.,生物化學雜志2701543-9,1995。此外,轉移載體可包含在人PC4多肽C-末端或N-末端融合一個表位標記(如Glu-Glu表位標記)的編碼DNA的框內融合體(Grussenmeyer,T.等,美國國家科學院院報,827952-4,1985)。用本領域內已知技術,可將含人PC4的轉移載體轉化進大腸桿菌,并篩選出含有指示重組桿狀病毒的間斷Lac Z基因的桿粒。含重組桿狀病毒基因組的桿粒DNA用常規技術分離,并用于轉染草地夜蛾細胞(如Sf9細胞)。表達人PC4的重組病毒隨后產生。經本領域內常用方法可制備重組病毒體貯存物。
重組病毒可用于感染宿主細胞,通常是衍生自秋粘蟲(草地夜蛾)的細胞系。總見,Glick和Pasternak,分子生物技術重組DNA的原理和應用,ASM出版社,華盛頓特區,1994。另一種適合的細胞系是High Five OTM細胞系(Invitrogen),它衍生自粉紋夜蛾(美國專利號5,300,435)。生產商提供的無血清培養基可用于培養和維持細胞。適合的培養基對sf9細胞為sf900IITM(Life Technologies)或ESF921TM(表達系統);對粉紋夜蛾細胞為Ex-Cell O405TM(JRHBiosciences,Lenexa,KS)或Express FiveOTM(LifeTechnologies),。細胞的接種密度約2-5×105個細胞,生長至細胞密度為1-2×106個細胞時,以0.1至10(更通常為近3)的感染復數(MOI)加入重組病毒貯存物。所用程序常描述于實驗室手冊中(King,L.A.和Possee,R.D.,同出處;O’Reilly,D.R.等,同出處;Richardson,C.D.,同出處)。隨后可用本文所述方法從上清純化出人PC4多肽。
真菌細胞,包括酵母細胞,也可用于本發明。在這方面特別有用的酵母種包括釀酒酵母,巴斯德畢赤酵母,Pichia methanolica。用外源DNA轉化釀酒酵母并從中生產重組多肽的方法公開在如Kawasaki的美國專利第4,599,311號;Kawasaki等的美國專利第4,931,373號;Brake的美國專利第4,870,008號;Welch等的美國專利第5,037,743號;Murray等的美國專利第4,845,075號。轉化的細胞通過由選擇標記(通常為耐藥性或在缺乏某特殊營養物(如亮氨酸)時生長的能力)決定的表型進行挑選。可在釀酒酵母中使用的較優選載體系統為POT1載體系統,由Kawasaki等公開(美國專利號4,931,373),它能使轉化的細胞通過在含葡萄糖的培養基上生長而被選出。適用于酵母的啟動子和終止子包括來自糖酵解酶基因的(見如Kawasaki的美國專利第4,599,311號;Kingsman等的美國專利第4,615,974號;及Bitter的美國專利第4,977,092號)和來自醇脫氫酶基因的那些。亦見美國專利第4,990,446;5,063,154;5,139,936和4,661,454號。適于其它酵母的轉化系統為本領域已知,所述其它酵母包括多形漢遜酵母、粟酒裂殖酵母、乳酸克魯維酵母、脆壁克魯維酵母、玉蜀黍黑粉菌、巴斯德畢赤酵母、Pichia methanolica,季也蒙畢赤酵母和Candida maltosa。見如Gleeson等,普通微生物學雜志1323459-3465,1986和Cregg,美國專利號4,882,279。曲霉細胞也可根據Mcknight等的美國專利第4,935,349號的方法應用。轉化產黃枝頂孢(Acremonium chrysogenum)的方法述于Sumino等的美國專利第5,162,228號中。轉化脈孢菌的方法述于Lambowitz的美國專利第4,486,533號中。
用Pichia methanolica作為宿主生產重組蛋白述于WIPO公開WO97/17450,WO 97/17451,WO98/02536,和WO 98/02565中。用于轉化P.methanolica的DNA分子通常制成雙鏈環狀質粒,在轉化之前優選先線性化。為了在P.methanolica中生產多肽,優選質粒中的啟動子和終止子為P.methanolica基因的那些,如P.methanolica醇利用基因(AUG1或AUG2)。其它有用的啟動子包括二羥基丙酮合成酶(DHAS)基因,甲酸脫氫酶(FMD)基因和過氧化氫酶(CAT)基因的啟動子。為便于DNA向宿主染色體整合,優選質粒的完整表達片段兩側均為宿主DNA序列。優選用于P.methanolica的選擇標記為P.methanolica ADE2基因,它編碼磷酸核糖-5-氨基咪唑羧化酶(AIRC;EC 4.1.1.21),此酶允許ade2宿主細胞在缺腺嘌呤時可以生長。為進行希望少用甲醇的大批量工業化生產,優選用其中兩個甲醇利用基因(AUG1和AUGF2)均缺失的宿主細胞。為生產分泌型蛋白質,優選液泡蛋白酶基因(PEP4和PRB1)中有缺陷的宿主細胞。電穿孔用于促進含目的多肽編碼DNA的質粒導入P.methanolica細胞。轉化P.methanolica細胞優選用電穿孔方法,所用電場為指數級衰減的脈沖電場,電場強度從2.5-4.5kV/cm,優選約3.7SkV/cm,時間常數為1-40毫秒,最優選約20毫秒。將P.methanolica細胞培養于含適當碳源、氮源和微量營養物的培養基上,溫度約25-35℃。液體培養物中用常規方法充分通氣,方法如振蕩小燒瓶或向發酵罐噴氣。優選的P.methanolica培養基為YEPD(2%D-葡萄糖、2%BactoTM蛋白胨(Difco實驗室,底特律,MI),1%BactoTM酵母浸膏(Difco實驗室),0.004%腺嘌呤和0.006%L-亮氨酸)。
原核宿主細胞,包括大腸桿菌,芽孢桿菌屬及其它屬的菌株也可用作本發明的宿主細胞。轉化這些宿主并表達克隆其中的外源DNA的技術為本領域內已知(見,如,Sambrook等,同出處)。當在細菌如大腸桿菌中表達人PC4多肽時,該多肽可保留在細胞質中(通常為不溶顆粒),或可由細菌分泌序列引導至壁膜間隙中。在前一種情況中,將細胞裂解,回收顆粒并用如異硫氰酸胍或尿素變性。變性多肽再通過稀釋變性劑而重新折疊和二聚體化,稀釋方法如對尿素溶液透析和結合使用還原型和氧化型谷胱甘肽,然后對緩沖鹽溶液透析。在后一種情況中,多肽可從壁膜間隙中以可溶性有功能形式回收,方法是破碎細胞(如超聲處理或滲透休克)以釋放壁膜間隙的內含物并回收蛋白質,這樣一來可不必變性并再折疊。
轉化的或轉染的細胞根據常規程序培養于含有所選宿主細胞生長必需的營養物和其它成分的培養基中。多種適宜的培養基(包括已知成分培養基和復合培養基)均為本領域內已知,并通常包含碳源、氮源、必需氨基酸、維生素和礦物質。如有必要,培養基中還可包含生長因子或血清之類成分。生長培養基選擇含外源加入的DNA的細胞通常通過,如,藥物選擇或由攜于表達載體上或共轉染入宿主細胞中的選擇標記彌補必需營養物的缺陷進行。
優選將本發明多肽純化至超過80%的純度,更優選超過90%的純度,甚至更優選超過95%的純度,尤其優選藥學上的純度,即相對于雜質大分子,特別是其它蛋白質和核酸,純度超過99.9%,且不含傳染因子和致熱因子。優選地,純化多肽基本不含其它多肽,特別是其它動物源多肽。
根據本發明制備的人激素原轉化酶4多肽用本領域內眾所周知的方法純化,這些方法如基于蛋白質的大小、電荷、溶解性和其它特征的親和層析和分離。當蛋白質產生于培養的哺乳動物細胞中時,優選將細胞培養于不含血清的培養基中,以便減少雜質蛋白質的量。細胞經收獲,裂解和分級分離。分級分離的優選方法包括親和層析,Q-FastFlow Sepharose、Mono Q樹脂、FPLC、苯基Sepharose、羥基磷灰石、MonoS和/或S-Sepharose。蛋白質也可用固相化親和標記(如多組氨酸,基質P或有抗體或其它特異性結合因子可供應用的其它多肽或蛋白質)純化。可在目的蛋白與親和標記之間提供一個特異性切割位點。優選的親和標記包括如多組氨酸串,利用它可在固相化鎳上純化融合蛋白(Houchuli等,Bio/Technol.61321-1325,1988)。也可構建多肽的截短形式(如缺跨膜區或分泌信號區)并用于更簡便地純化有催化活性的激素原轉化酶(Nakayama,K.,酶學方法,244167-175,1995)。原核表達系統中,麥芽糖結合蛋白(MBP)融合體可能是有利的親和標記。若欲自宿主細胞的胞質或壁膜間隙回收蛋白質,則首先將細胞破碎,回收包含蛋白質在內的粗提物并進行進一步純化。而且,人激素原多肽底物和它們的被本發明切割出的產物均可用本領域內眾所周知的上述方法(稍作改動)純化。例如,分泌的蛋白質(如切割產物)從細胞條件培養基中回收,優選在濃縮條件培養基之后回收。特殊的分級分離步驟的選擇及其順序安排部分基于所選宿主細胞類型及表達系統。本領域內的一般技術人員均可作出這些決定。特殊方法的選擇是常規設計的問題,部分取決于所選支持物的特點。見,如,親和層析原理及方法,Pharmacia LKB Biotechnology,Uppsala,瑞典,1988。
本發明的多肽可利用它們的結構特點和生化特點進行分離。例如,可用固相化金屬離子吸附(IMAC)層析來純化富含組氨酸的蛋白質,包括那些帶多組氨酸標記的蛋白質。簡單說,凝膠先充以二價金屬離子,形成螯合物(Sulkowski,生化動態31-7,1985)。富含組氨酸的蛋白質將以不同親和力吸附于該基質上(取決于所用金屬離子),然后通過競爭性洗脫作用,降低pH,或用強螯合劑而洗脫。其它純化方法包括用凝集素親和層析和離子交換層析純化糖基化的蛋白質(酶學方法,182卷,“蛋白質純化指南”,M.Deutscher,(編),Acad出版社,San Diego,1990,529-39頁)。本發明另外的實施方案中,構建目的多肽與親和標記(如麥芽糖結合蛋白,免疫球蛋白區)的融合體以有助于純化。
人PC4多肽還可用于制備可特異性結合人PC4表位、肽或多肽的抗體。將人PC4多肽或其片段作為抗原(免疫原)接種至動物中,引起免疫應答。合適的抗原包括本文所公開的SEQ ID NO2中的各種人PC4多肽區,或為SEQ ID No2內9-755位的連續氨基酸片段。由該免疫應答產生的多克隆和單克隆抗體經分離并用本領域內已知方法純化。見,如,免疫學最新實驗程序(Current Protocols inImmunology),Cooligan等(編),National Institutes of Health,John Wiley & Sons公司,1995;Sambrook等,分子克隆實驗室手冊,第二版,冷泉港,NY,1989;及Hurrell,J.G.R.,編,單克隆雜交瘤抗體技術和應用,CRC出版公司,Boca Raton,FL,1982。
對本領域內技術人員而言,很顯然的是,多克隆抗體可通過將人PC4多肽或其片段接種于各種不同的溫血動物如馬、牛、山羊、綿羊、狗、雞、兔、小鼠和大鼠而制備。人PC4多肽的免疫原性可通過佐劑,如鋁(氫氧化鋁)或弗氏完全或不完全佐劑的應用而增強。可用于免疫的多肽還包括融合多肽,如人PC4或其部分與免疫球蛋白多肽或與麥芽糖結合蛋白的融合體。多肽免疫原可以是全長分子或其部分。若多肽部分為“半抗原樣”,則該部分可加入或連接至大分子載體(如匙孔血藍蛋白(KLH),牛血清白蛋白(BSA)或破傷風類毒素)中以備免疫。
如本文所用,術語“抗體”包括多克隆抗體,親和純化的多克隆抗體,單克隆抗體及抗原結合片段,如F(ab’)2和Fab’蛋白酶解片段。還包括基因改造的完整抗體或片段,如嵌合抗體,Fv片段,單鏈抗體等,及合成性抗原結合肽和多肽。非人抗體可通過將非人CDR移植在人抗體的框架區和恒定區上、或摻入完整的非人可變區(可選地通過取代暴露的殘基而覆蓋以人樣表面,結果產生“鑲蓋”抗體)而人源化。在某些例子中,人源化抗體可在人可變區的框架區之內保留非人殘基以增強正確的結合特性。通過抗體的人源化,可增加其生物學半衰期,并減少施用于人時產生不利免疫反應的潛能。
產生或選擇本文可用抗體的其它技術包括使淋巴細胞體外暴露于人激素原轉化酶4多肽或其衍生肽,選擇噬菌體或類似載體中的抗體展示文庫(如,通過用固相化的或標記的人PC4蛋白或肽)。帶有潛在的人PC4多肽結合區的多肽編碼基因可通過對展示于噬菌體(噬菌體展示)或展示于細菌(如大腸桿菌)上的隨機肽文庫進行篩選而獲得。編碼多肽的核苷酸序列可經多種方法獲得,如通過隨機誘變和隨機多核苷酸合成。這些隨機肽展示文庫可用于篩選能與已知靶相互作用的肽,其中的靶可以是蛋白質或多肽,如配體或受體,生物學的或合成的大分子,或有機物或無機物。產生和篩選這類隨機肽展示文庫的技術為本領域內已知(Ladner等,美國專利號5,223,409;Ladner等,美國專利號4,946,778;Ladner等,美國專利號5,403,484和Ladner等,美國專利號5,571,698),而隨機肽展示文庫及篩選這些庫的試劑盒可從生產商處獲得,如Clontech(Palo Alto,CA),InvitrogenInc.(San Diego,CA),New England Biolabs,Inc.(Beverly,MA)和Pharmacia LKB Biotechnology Inc.(Piscataway,NJ)。隨機肽展示文庫可用本文公開的人PC4序列篩選,以鑒定能結合人PC4的蛋白質。這些能與人PC4多肽相互作用的“結合蛋白”可用于標記細胞;用于經親和純化分離多肽同系物;它們可直接或間接偶聯于藥物、毒素、放射性核素等上。這些結合蛋白也可用于分析法如篩選表達文庫和中和活性的分析法中。結合蛋白還可用于組織中多肽水平測定的診斷分析;用于作為潛在病理或疾病標志的多肽的檢測或定量。這些結合蛋白還可發揮人PC4“拮抗物”的作用,在體外和體內封閉人PC4的切割活性。
抗體在以下情況下可確定為特異性結合1)它們的結合活性有一個臨界值;并且2)它們與相關多肽分子無明顯交叉反應。首要的是,本文的抗體如果發生結合,只有當它們與人激素原轉化酶4多肽、肽或表位結合的親和力比與對照多肽(非人PC4)的結合親和力大至少10倍時方為特異性結合。優選抗體的結合親和力(Ka)達106M-1或更大,優選107M-1或更大,更優選108M-1或更大,最優選109M-1或更大。抗體的結合親和力可輕易地由本領域內技術人員通過如Scatchard分析法測定(Scatchard,G.,紐約科學院年鑒(Ann.NY Acad.Sci)51660-672,1949)。
其次,如果抗體不與相關多肽發生明顯交叉反應,即可確定抗體為特異性結合。抗體不與相關的多肽分子發生明顯交叉反應,例如,用它們通過標準的Western印跡分析(Ausubel等,同出處)可檢測人PC4,但不能檢測相關的多肽。已知相關多肽的實例有正同系物(如鼠PC4),副同系物,如其它已知的人激素原轉化酶(如PCl和PC2),或突變的人PC4多肽,及非哺乳動物的激素原轉化酶(如枯草桿菌蛋白酶或Kex2)。而且,抗體可用已知的相關多肽進行“篩選”,以分離能與本發明多肽特異性結合的類群。如人PC4的抗體可吸附在粘附于不溶性基質的相關多肽上;用正確的緩沖條件可使人PC4的特異性抗體流過基質。這樣的篩選可分離對密切相關的多肽沒有交叉反應性的多克隆和單克隆抗體(抗體實驗室手冊,Harlow和Lane(編),冷泉港實驗室出版社,1988;免疫學最新實驗程序,Cooligan等(編),National Institutes of Heath,John Wiley and Sons公司,1995)。特異性抗體的篩選和分離為本領域內所知。見,基礎免疫學(Fundamental Immunology),Paul(編),Raven出版社,1993;Getzoff等,免疫學進展431-98,1988;單克隆抗體原理與實踐,Goding,J.W.(編),Academic Press Ltd.,1996;Benjamin等,免疫學年鑒267-101,1984。
本領域內技術人員已知的多項試驗可用于檢測和純化能與人PC4蛋白或肽特異性結合的抗體。典型的分析方法詳述于《抗體實驗室手冊》,Harlow和Lane(編),冷泉港實驗室出版社,1988。這類分析方法的代表性實例包括平行免疫電泳、放射免疫分析、放射免疫沉淀、酶聯免疫吸附試驗(ELISA),點印跡或Western印跡試驗、抑制或競爭試驗,及夾心試驗。
此外,可篩選出分別能結合野生型及突變型人PC4蛋白或多肽的抗體。人PC4的抗體可用于標記表達人PC4的細胞;用于經親和純化分離人PC4;用于體外或體內測定細胞和組織裂解物中人激素原轉化酶4多肽水平的診斷分析;用于原位免疫定位以確定體內組織分布;用于檢測或定量測定作為潛在病理學或疾病標志的人激素原轉化酶4蛋白,用于應用流式細胞儀或FACS的分析方法中;用于篩選表達文庫;用于產生抗獨特型抗體;及作為中和抗體;或作為體外和體內封閉人PC4催化活性的拮抗劑。以這種方式應用抗體的方法為本領域內已知。適當的直接標記物包括放射性核素、酶、底物、輔因子、抑制物、熒光標記、化學發光標記、磁粒等;間接標記可能以應用生物素-抗生物素蛋白或其它互補物/反互補物對作中間體為特色。此處抗體也可直接或間接與藥物、毒素、放射性核素等偶聯,而這些偶聯物可用于體內診斷或治療。而且,可在體外利用人PC4或其片段的抗體,以在一些試驗(如Western印跡或其它本領域內已知試驗)中檢測變性人PC4或其片段。
睪丸特異性加工酶(如人激素原轉化酶4)參與對睪丸細胞表達的激素或結合蛋白的加工。故,如下所述,人激素原轉化酶4可用于鑒別和測定睪丸激素原的生物學功能并鑒定新型激素原。人PC4可能在生育,和/或與精子發生相關的睪丸功能中發揮作用,最近有篇描述純合型雄性PC4突變小鼠其生育力嚴重受損的論文(Mbikay,M.等,美國國家科學院院報946842-6846,1997)支持了這一假設。而且,作者在這些突變小鼠中未觀察到明顯的精子發生異常,而由這些精子發育成的受精卵不能生長至胚泡期,暗示人PC4不僅在受精中起作用,而且在早期胚胎發育中也起作用。
本發明的蛋白質可用于加工或部分加工已知或未知的激素原多肽,使之成為成熟或有生物學活性的形式,從而可以例如刺激睪丸細胞的增殖或分化。而且,本發明的蛋白質,其拮抗劑和興奮劑可在雄性生育力中起作用。為檢驗人PC4是否作用于底物,可在表達人PC4的相同細胞中共表達潛在的激素原多肽底物,或體外與人PC4混合。構建這樣一個細胞或體外混合蛋白的方法為本領域內已知并示于此。若人PC4對潛在激素原底物有作用,則會產生切割產物。本發明蛋白質的活性可通過分析與被激素原轉化酶4切割的激素原前體多肽切割產物相關的生物學活性而測量。此外,若切割產物的生物學活性無法測量,則可利用其它方法,如Western印跡來測定人PC4是否切割了底物激素原。
本發明的多肽可用于測定人激素原轉化酶4的多肽激素原底物。應用本領域內已知的方法,可培養已導入表達人激素原轉化酶4成熟形式并且還表達檢驗底物激素原多肽的表達載體的細胞。人激素原轉化酶4切割檢驗底物產生的切割產物可用本文所述生物學或生物化學試驗測定。而且,這種檢測人激素原轉化酶4多肽的多肽激素原底物的方法可在體外應用。分離或純化的人PC4多肽或表達人PC4的細胞的裂解物可在體外與諸如檢驗底物激素原多肽或包含一個二堿性切割位點的合成多肽這樣的檢驗底物多肽混合。人PC4多肽切割檢驗底物激素原多肽產生的切割產物可用本文所述生物學或生物化學試驗檢測。
多種試驗可用于測定切割產物的生物學活性。例如,可用培養的睪丸細胞或對適當的動物模型體內施用由本發明多肽切割或加工的激素原分子而測定增殖和分化。培養的睪丸細胞包括海豚DB1.Tes細胞(CRL-6258);小鼠GC-1 spg細胞(CRL-2053);TM3細胞(CRL-1714);TM4細胞(CRL-1715);及豬ST細胞(CRL-1746),均可由美國典型培養物保藏中心,Rockville,MD提供。測量細胞增殖或分化的方法為本領域內熟知。如,測量增殖的方法包括對中性紅染料的化學敏感性(chemosensitivity)試驗(Cavanaugh等,InvestigationalNew Drugs 8347-354,1990),放射標記核苷酸摻入法(Cook等,分析生物化學(Analytical Biochem.)1791-7,1989),增殖細胞DNA中5-溴-2’-脫氧尿苷(BrdU)摻入法(Porstmann等,免疫學方法雜志82169-179,1985),及四唑鎓鹽的應用(Mosmann,免疫學方法雜志6555-63,1983;Alley等,癌癥研究48589-601,1988;Marshall等,生長調控(Growth Reg),569-84,1995;及Scudiero等,癌癥研究484827-4833,1988)。測定分化的方法包括,如測定與組織的階段特異性表達、酶活性、功能活性或形態學改變相關的細胞表面標記(Watt,FASEB,5281-284,1991;Francis,分化5763-75,1994;Raes,Adv.Anim.Cell Biol.Technol.Bioprocesses,161-171,ESACT,第九次會議,1989)。
評估人PC4對睪丸多肽因子的作用的體內試驗為本領域內熟知。如,切割產物可在特定時間段行腹膜內注射。處理階段過后,殺死動物,取出睪丸稱重。勻漿睪丸并進行精子頭計數(Meistrich等,實驗細胞研究(Exp.Cell Res.)9972-78,1976)。
可能與本發明蛋白質加工的多肽切割產物相關的其它活性,如趨化活性也可進行分析。如精子發生的晚期因子可能參與精子-受精卵相互作用及精子游動。評估這類活性的試驗為已知(Fuchs,ZentralblGynakol 11117-120,1993;Neurwinger等,Andrologia 22335-339,1990;Harris等,Human Reprod.(人類生殖)3856-860,1988;及Jockenhovel,Andrologica 22171-178,1990)。
此外,標準生化分析技術(如Western印跡)可用于檢測人PC4加工未知活性的底物激素原而產生的切割產物(Sambrook等,同出處,及Ausubel,等,同出處)。應用這樣的方法,表達人PC4和檢驗激素原底物的細胞分泌的切割產物可通過分析從細胞收集到的培養物而測定。
本發明的蛋白質還可用于在細胞上進行的對人PC4調節子的篩選中。調節子(如拮抗劑和興奮劑)可以好幾種方式影響激素原轉化酶,如影響催化活性、基因表達、或與底物多肽的相互作用。這類拮抗劑和興奮劑可分別通過減弱或增強人PC4的切割活性而影響本發明之激素原轉化酶。該增強或減弱可通過評估人PC4所作用的激素原的切割產物而測定。在該應用中,在表達人PC4的同一細胞中表達已知可被本發明之多肽切割的指示性激素原底物。構建這種細胞的方法為本領域內已知并公開于此。優選的指示性激素原多肽被激素原轉化酶切割后從細胞中分泌出來,并具有與切割產物相關的易于測定的生物學活性。這樣的活性試驗實例已公開于上文中。通過與各種下文討論的試劑接觸后篩選細胞所分泌的切割產物而鑒定拮抗劑和興奮劑。對指示性底物加工中的變化反映了相對于未接受試劑的對照細胞,試劑對本發明之人PC4蛋白的增強或抑制激素原轉化酶的活性。如相對于對照,增強人PC4活性的興奮劑將導致切割增加,因而由指示劑底物產生更多有生物學活性的切割產物。相反,相對于對照,減弱人PC4活性的拮抗劑將導致切割減少,從而由指示性底物產生較少的或可能不產生有生物學活性的切割產物。可調節人PC4,并可在檢驗樣品中評估或利用的試劑的來源包括,但不限于任何天然來源或化學來源,包括但不限于植物、微生物和真菌提取物、化學文庫,及組合化學文庫。建立并應用這類基于細胞的篩選試驗的方法為本領域內已知。
這類基于細胞的篩選可用于檢測檢驗樣品中有無人激素原轉化酶多肽活性調節子。表達成熟人PC4蛋白并表達已知的指示性激素原多肽底物的細胞可在有或無檢驗樣品時培養。構建這樣一個細胞可通過本領域已知并述于此的方法進行。例如,可將指導成熟人PC4蛋白表達的表達載體和指導已知指示性激素原多肽底物表達的表達載體導入相同細胞中。無檢驗樣品的細胞可作對照,與有檢驗樣品時的分子活性進行對比。用生物學或生物化學試驗可比較有和無檢驗樣品時由人PC4切割底物產生的切割產物的水平。通過這種比較,可如上述說明檢驗樣品中有無人激素原轉化酶活性的調節子。
本發明的多肽還可用于檢測人19號染色體上與疾病或其它人類特征相關的異常。本發明之多核苷酸位于人19號染色體的19p13.3區。激素原轉化酶基因位點處可檢測的染色體畸變包括但不限于非整倍性、基因拷貝數改變、插入、缺失、限制性位點改變和重排。這些畸變可用本發明之多核苷酸應用分子遺傳學技術(如限制性片段長度多態性(RFLP)分析、應用PCR的短串聯重復序列(STR)分析,及本領域內已知的其它遺傳學連鎖分析技術)進行檢測(Sambrook等,同出處;Ausubel等,同出處;Marian,A.J.,Chest 108255-265,1995)。
本發明還包括診斷用試劑。如人PC4基因,含人PC4 DNA或RNA或其亞序列(Subsequence)的探針,可用于測定人PC4基因是否存在于19號染色體上或是否有突變發生。人PC4基因位點處的可檢測性染色體畸變包括,但不限于非整倍體、基因拷貝數改變、插入、缺失、限制位點改變和重排。這些畸變可發生在編碼序列內,內含子內,或側翼序列內(包括上游啟動子和調節區),并可證實為編碼序列中的物理學改變或基因表達水平的改變。分析性探針通常至少20個核苷酸長,有時可用較短的探針(14-17個核苷酸)。PCR引物至少5個核苷酸長,優選15或更多個核苷酸,更優選20-30個核苷酸。當將分析基因的較小區時,可用短的多核苷酸。粗略分析基因時,多核苷酸探針可包含一個完整外顯子或更多。探針通常包含與信號產生部分如放射標記的核苷酸連接的多核苷酸。這些診斷方法一般包含以下步驟(a)獲得一個病人的遺傳學樣品;(b)在多核苷酸能與互補的多核苷酸序列雜交產生第一反應產物的條件下,將遺傳學樣品與上述多核苷酸探針或引物一起溫育;及(c)將第一反應產物與對照反應產物比較。第一反應產物與對照反應產物的差異可指示病人的遺傳學異常。本發明中可應用的遺傳學樣品包括基因組DNA,cDNA和RNA。多核苷酸探針或引物可以是RNA或DNA,并包含SEQ ID No1的一部分,SEQ ID No1的互補物,或其RNA等價物。關于這一點的合適分析方法包括本領域內已知的分子遺傳學技術,如限制性片段長度多態性(RFLP)分析、應用PCR技術的短串聯重復序列(STR)分析、連接鏈反應(Barany,PCR方法及應用,15-16,1991),核糖核酸酶保護試驗,及本領域內已知的其它遺傳學連鎖分析技術(Sambrook等,同出處;Ausubel等,同出處;A.J.Marian,同出處,1995)。核糖核酸酶保護試驗(見,如,Ausubel等,同出處,第4章)包含RNA探針與病人RNA樣品的雜交,然后使反應產物(RNA-RNA雜交體)暴露于RNase。RNA的已雜交區受到保護而不被消化。PCR試驗中,將病人的遺傳學樣品與一對多核苷酸引物共同溫育,擴增引物之間的區域并回收。回收產物的大小或量的變化可指示病人的突變。另一個可應用的基于PCR的技術是單鏈構象多態性(SSCP)分析(Hayashi,PCR方法及應用134-38,1991)。
實施例實施例1人激素原轉化酶4的克隆A.摘要用鼠PC4 cDNA探針篩選人睪丸cDNA文庫,揭示一段分離的cDNA(克隆pSLHPC4-5)與鼠PC4 cDNA同源。該cDNA編碼人激素原轉化酶4(人PC4)。B.人睪丸cDNA文庫的制備通過篩選λZAPII(Stratagene,La Jolla,CA)人睪丸cDNA文庫獲得全長人PC4 cDNA。睪丸cDNA文庫的構建如下第一鏈cDNA反應包含15μl濃度為1.0μg/μl的人睪丸雙polyd(T)選擇的poly(A)+mRNA(Clontech Laboratories)和3μl20pmole/μl包含一個XhoI限制性位點的第一鏈引物ZC6091(SEQ IDNo5)。該混合物加熱至70℃4分鐘,在冰上冷卻。向RNA-引物混合物中加入12μl第一鏈緩沖液(5X SUPERSCRIPTTM緩沖液;LifeTechnologies,Gaithersburg,MD),6μl 100mM的二硫蘇糖醇,及3μl含dTTP,dATP,dGTP和5-甲基-dCTP各10mM的脫氧核苷三磷酸溶液(Pharmacia LKB Biotechnology,Piscataway,NJ)而啟動第一鏈cDNA合成。反應混和物37℃溫育2分鐘,然后加入15μl 200U/μl RNase H-逆轉錄酶(SUPERSCRIPT II;Life Technologies)。第一鏈合成效率在平行反應中通過向取自反應混合物之一以用于標記反應進行分析的5μl等份中加入5μCi32P-αdCTP進行分析。反應于37℃溫育10分鐘,45℃1小時,然后50℃10分鐘。標記反應中未摻入的32P-αdCTP在400孔大小的凝膠過濾柱(Clontech Laboratories)上經層析去除。未標記的第一鏈反應物中未摻入的核苷酸和引物在400孔大小的凝膠過濾柱(Clontech Laboratories)上經層析去除。標記的第一鏈cDNA長度經瓊脂糖凝膠電泳測定。
第二鏈反應包含120μl未標記的第一鏈cDNA,36μl 5X聚合酶I緩沖液(125mM Tris-HCl,pH7.5,500mM KCl,25mM MgCl2,50mM(NH4)2SO4),2.4μl 100mM二硫蘇糖醇,3.6μl含每種脫氧核苷三磷酸各10mM的溶液,6μl 5mMβ-NAD,3.6μl 3μ/μl大腸桿菌DNA連接酶(New England Biolabs;Beverly,MA),9μl 10U/μl大腸桿菌DNA聚合酶I(New England Biolabs),及1.8μl 2U/μlRNase H(Life Technologies)。其中一份10μl的第二鏈合成反應經加入10μCi32P-αdCTP而標記,以監控第二鏈合成效率。反應于16℃溫育2小時,然后加15μl T4 DNA聚合酶(10U/μl,BoerhingerMannheim,Indianapolis,IN)并再于16℃溫育5分鐘。在瓊脂糖凝膠電泳分析之前,經400孔大小的凝膠過濾柱(Clontech Laboratories)層析去除標記反應中未摻入的32P-αdCTP。加入20μl 0.5EDTA,并用苯酚/氯仿和氯仿抽提,然后在有2.5M醋酸銨和4μg糖原載體時用乙醇沉淀而使反應終止。由15μg起始mRNA模板產生的cDNA約接近3μg。
將EcoRI銜接子連接在上述cDNA的5’末端,以便能克隆進入表達載體。10μl等份的cDNA(約1.5μg)和5μl 65pmole/μl EcoRI銜接于(Pharmacia LKB Biotechnology公司)與2μl 10X連接酶緩沖液(660mM Tris-HCl pH7.5,100mM MgCl2),2μl 10mM ATP和1μl 15U/μl T4 DNA連接酶(Promega公司,Madison,WI)混合。反應于5℃溫育2小時,7.5℃2小時,10℃2小時,12.5℃10小時。經70℃溫育20分鐘終止反應。
為便于cDNA定向克隆進入1ZapII載體(stratagene),cDNA用XhoI消化,產生具有5’EcoRI粘性末端和3’XhoI粘性末端的一段cDNA。該cDNA 3’末端的XhoI限制性位點已事先用ZC6091引物(SEQ IDNo5)導入。在含上述cDNA 20μl,10μl 10X H緩沖液(BoehringerMannbeim),69μl H2O,及1.0μl 40U/μl XhoI(Boehringer Mannheim)的反應混合物中進行限制酶消化。消化在37℃進行40分鐘。反應的終止通過在70℃溫育10分鐘并經400孔大小的凝膠過濾柱(ClontechLaboratories)層析而完成。
cDNA經乙醇沉淀,用70%乙醇洗滌,風干,再重新懸浮于14μlH2O,2μl連接酶緩沖液(Promega公司,Madison WI),2μl T4多核苷酸激酶(10U/μl,Life Technologies)中。37℃溫育30分鐘后,將cDNA加熱至65℃5分鐘,冰上冷卻,在0.8%低熔點瓊脂糖凝膠上電泳。從凝膠中切除污染的銜接子及長度小于0.6Kb的cDNA。電極對調,cDNA電泳直至濃縮于泳道出發點附近。含濃縮cDNA的凝膠區被切下并置于微量管中,確定凝膠片的近似體積。向管中加入近三倍于凝膠片體積(300μl)的水及35μl 10X β-瓊脂糖酶I緩沖液(NewEngland Biolabs),將瓊脂糖于65℃加熱5分鐘熔化。將樣品平衡于45℃后,加入3μl 1U/μlβ-瓊脂糖酶I(New England Biolabs),混合物于45℃溫育60分鐘以消化瓊脂糖。溫育后,向樣品中加入40μl 3M醋酸鈉,混合物置于冰上15分鐘。將樣品于室溫下14,000Xg離心15分鐘以去除未消化的瓊脂糖。cDNA經乙醇沉淀,70%乙醇洗滌,風干并再懸于10μl水中。
將所得cDNA克隆進入已事先用EcoRI和XhoI消化并去磷酸化的Lamda噬菌體載體λZapII(strotegene)中。cDNA與λZapII載體的連接在含1.0μl預制載體,1.0μl人睪丸cDNA,1.0μl 10X連接酶緩沖液(Promega公司),1.0μl 10mM ATP,5μlH2O,及1.0μl 15U/μl的T4 DNA連接酶(Promega公司)的反應混合物中完成。連接混合物在5℃-15℃溫度梯度中溫育過夜。溫育后,連接混合物用體外包裝提取物(GigapackIII Gold包裝提取物,Stratagene)包裝成噬菌體,所得文庫按廠家說明測定滴度。C.多核苷酸的分離用人睪丸λZapII文庫感染大腸桿菌宿主細胞(XL1-BlueTMMRF’菌株;Stratagene),將1.5×106pfu鋪到150mm NZY板上,使密度為約40,000pfu/板。接種板37℃溫育過夜。用尼龍膜(HybondTM-N;Amersham公司,Arlington Heights,IL)按廠家建議的程序制成濾膜噬斑浸提物。濾膜在含1.5M NaCl和0.5M NaOH的溶液中室溫變性7分鐘。將濾膜用濾紙稍微吸一下,以去除剩余變性溶液,然后在1MTris-HCl,pH7.5及1.5M NaCl中中和5分鐘。噬菌體DNA在UVCrosslinker(Stratalinker;Stratagene)中用1,200微焦耳的紫外線(UV)能量固定于濾膜上。然后濾膜在雜交溶液(5XSSC,5XDenhardt’s溶液,0.2%SDS和1mM EDTA)中預雜交。加入熱變性的剪切鮭精DNA至終濃度為100μg/ml。濾膜于65℃預雜交過夜。
用寡核苷酸經PCR擴增相應于SEQ ID No6的45位至1033位核苷酸的大鼠激素原轉化酶編碼區,制得探針。起始的第一輪PCR反應混合物包含2μl ZC11,808(SEQ ID No7)和2μl ZC11,809(SEQ IDNo8),1μl 400 fg/μl大鼠睪丸cDNA,1μl 10mM dNTP,10μl 10×Klentaq緩沖液(Clontech),83μl水,及2μl Klentag DNA聚合酶(Clontech)。第一輪PCR反應運行如下先95℃30秒;再95℃30秒,57℃30秒,68℃2分鐘共30個循環;然后68℃10分鐘。第一輪PCR產物用水稀釋至1∶2000。對1μl稀釋的第一輪PCR產物進行第二輪PCR,所用巢式引物為ZC11,870(SEQ ID No9)和ZC11,871(SEQ IDNo10),它們設計為可擴增第一輪PCR產物內部的DNA。第二輪PCR反應運行如下先95℃30秒;再95℃30秒,58℃30秒,68℃2分鐘,共30個循環;然后68℃10分鐘。第二輪PCR產物在1.5%低熔點瓊脂糖凝膠上凝膠純化,以用作探針去篩選人睪丸cDNA文庫,獲得人PC4。
25ng PCR產物用MEGAPRIMETMDNA標記系統(Amersham)按廠家建議通過隨機引發法而標記上放射性α-32P-dCTP。預雜交溶液用新鮮的含6.5×105cpm/ml標記探針的雜交溶液取代,60℃雜交過夜。然后去除雜交溶液,濾膜在含1xSSC,0.25%SDS和1mM EDTA的洗滌液中45℃下漂洗。將濾膜置于放射自顯影膠片上,用增感屏在-70℃曝光96小時。
對放射自顯影的檢查揭示有多個可與標記探針雜交的區。從39個區挑取瓊脂塞進行純化。將每個瓊脂塞在含1%(v/v)氯仿的0.5mlSM中浸泡過夜(Sambrook等,分子克隆實驗室手冊,第二版,冷泉港實驗室出版社,冷泉港,NY,1989)。溫育后,將每個瓊脂塞的噬菌體在SM中稀釋至1∶1000。取50μl等分液鋪板于大腸桿菌XL-1 BlueTMMRF’細胞上。平板37℃溫育過夜,如上述制備濾膜浸提物、預雜交、雜交、洗滌并放射自顯影。對所得放射自顯影圖的檢查揭示10個濾膜浸提物上有陽性信號。從這些區挑取瓊脂塞進行另一輪噬斑純化。
質粒用ExASSIST/SOLRTM系統(Stratagene)按廠商建議切割。這些質粒經PCR擴增以測定插入子的大小并對其測序。命名為pSLHPC4-5的克隆顯示包含SEQ ID No1中所示序列。
實施例2組織分布從pSLHPC4-5的全長編碼序列制備探針,用于探測人多組織Northern印跡(Human Multiple Tissue Northern Blot)(Clontech)。Northern分析揭示了一條只存在于睪丸中的約2.8Kb的帶。
實施例3基于PCR的人PC4基因染色體作圖用商品化“GeneBridge 4 Radiation Hybrid Panel”(ResearchGenetics公司,Huntsville,AL)將人PC4定位于19號染色體。GeneBridge 4 Radiation Hybrid Panel包含93個放射雜交克隆每一個的DNA,外加2個對照DNA(HFL供體和A23受體)。公開可應用的WWW服務器 (http//www-genome,wi.mit.edu/cgibin/contig/rhmapper.pl)可用來相對于用GeneBridge 4 RadiationHybrid Panel所構建的Whitehead研究所/MIT中心人類基因組圖譜(“WICGR”人類基因組圖譜)作圖。B.
為了用“GeneBridge 4 RH Panel”對人PC4作圖,在96孔微滴板(Stratagene)中設立20μl PCR反應,并用于“RoboCycler Gradient96”熱循環儀(Stratagene)中。95份PCR反應物的每份組成為2μl10XKenTaq PCR反應緩沖液(Clontech Laboratories公司,Palo Alto,CA),1.6μl dNTP混合物(每種2.5mM,Perkin-Elmer,Foster City,CA),1μl有義引物ZC13,557(SEQ ID NO11),1μl反義引物ZC13,558(SEQ ID No12),2μl“RediLoad”(Research Genetics公司,Huntsville,AL),0.4μl 50X Advantage Klentaq聚合酶混合物(Clontech Laboratories公司),25ng來自單個雜交克隆或對照的DNA,及ddH2O至總體積20μl。反應物用等量礦物油覆蓋并密封。PCR循環儀條件如下先95℃變性5分鐘進行一個初始循環,再95℃變性1分鐘,68℃退火1分鐘,72℃延伸1.5分鐘共35個循環,然后72℃延伸7分鐘。在3%NuSieve GTG瓊脂糖凝膠(FMC Bioproducts,Rockland,ME)上經電泳分離反應物。
結果顯示人PC4作圖于WICGR放射雜交圖上距離19號染色體框架標記IB1264 10.54cR-3000處。它指示人PC4位于完整LDB 19號染色體圖譜中19p13.3區。(The Genetic Location Database,Southhampton 大學,WWW 網址http//cedar.genetics.soton.al.Uk/publ ic-html/)。
實施例4人PC4哺乳動物表達載體PPC4-5/pHZ1的構建制備表達載體,用于在哺乳動物細胞中表達人PC4多肽。哺乳動物表達載體pHZ1有受控于SV40早期啟動子的新霉素基因,SV40多聚腺苷化位點,一個可插入受控于金屬硫蛋白(MT-1)啟動子的目的基因的多克隆位點(多接頭),及人生長激素(hGH)多聚腺苷化位點。該表達載體保存于美國典型培養物保藏中心,12301 Parklawn Drive,Rockville,MD.
將人PC4亞克隆進pHZ1多接頭中的EcoRI/XbaI位點。用EcoRI和XbaI(Boehringer-Mannbeim)切割pHZ1,再經QiaquickTM柱(Qiagen)分離片段,制備載體片段。用限制酶EcoRI和AatII從實施例1的人PC4克隆切出一個1644bp片段(5’片段),產生人PC4序列含5’UTR的5’末端(如SEQ ID No1所示)。用跨越人PC4 AatII位點的引物ZC13,359(SEQ ID No13)及含XbaI位點的引物ZC13,358(SEQID No14),從實施例1的人PC4克隆中PCR擴增出一段約681bp的PCR片段,產生人PC4序列含3’UTR的3’末端(如SEQ ID No1所示)。PCR反應條件為94℃1分鐘一個循環;再94℃30秒,50℃20秒,72℃30秒共35個循環;然后72℃10分鐘。PCR產物用AatII和XbaI切割,片段按上述純化,產生681bp的PCR片段(3’片段)。
將切出的5’片段和3’片段DNA亞克隆進入pHZ1載體片段中。約20ng EcoRI/AatII消化的人PC45’片段,約20ng AatII/XbaI消化的人PC43’片段,及約40ng相應載體片段于室溫下,在標準連接緩沖液中連接5小時。取1μl這樣的連接反應物,按廠商建議電穿孔進入25μl DH10B感受態細胞(GIBCO BRL,Gaithersburg,MD)中,鋪于含100mg/ml氨芐青霉素的LB平板上,37℃溫育過夜。
用引物ZC12,634(SEQ ID No15)和ZC12,945(SEQ ID No16)在下列PCR條件下篩選菌落94℃1分鐘;再94℃20秒,50℃30秒,72℃1分鐘共25個循環;然后72℃10分鐘。陽性克隆的插入序列經序列分析檢驗。大批量質粒用QIAGEN大量制備試劑盒(Qiagen)按廠家建議制備。
盡管本文為了舉例說明的目的而描述了本發明的特殊實施例,但應理解,在不偏離本發明的精神及范圍的前提下可作各種修改。相應地,本發明除了權利要求書所限內容之外,其它方面不受限制。
序列表(1)基本信息(i)申請人ZymoGenetics,Inc.
1201 Eastlake Avenue EastSeattle,WAUSA98102(ii)發明名稱人激素原轉化酶4(iii)序列數目11(iv)聯系地址(A)收件人ZymoGenetics,Inc.
(B)街道1201 Eastlake Avenue East(C)城市Seattle(D)州名WA(E)國家USA(F)郵政編碼98102(v)計算機可讀形式(A)介質類型軟盤(B)計算機IBM兼容機(C)操作系統DOS(D)軟件FastSEQ,Windows版本2.0(vi)目前申請資料(A)申請號(B)遞交日(C)分類(vii)在先申請資料(A)申請號
(B)遞交日(viii)代理人/代理信息(A)姓名Parker,Gary E.
(B)登記號31,648(C)參考/文檔號97-05PC(ix)電信信息(A)電話206-442-6673(B)傳真206-442-6678(C)電傳(2)關于SEQ ID NO1的信息(i)序列特征(A)長度2744個堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線性(ii)分子類型cDNA(ix)特征(A)名稱/關鍵詞編碼序列(B)位置61…2325(D)其它信息(xi)序列描述SEQ ID NO1GAATTCGGCA CGAGGCGGGA GGGAGGGGAT TTGCGCAGGC CCCGCTCCCG CCCCGCCTCC60ATG CGG CCC GCC CCG ATT GCG CTG TGG CTG CGC CTG GTC TTG GCC CTG 108Met Arg Pro Ala Pro Ile Ala Leu Trp Leu Arg Leu Val Leu Ala Leu1 5 10 15GCC CTT GTC CGC CCC CGG GCT GTG GGG TGG GCC CCG GTC CGA GCC CCC 156Ala Leu Val Arg Pro Arg Ala Val Gly Trp Ala Pro Val Arg Ala Pro20 25 30ATC TAT GTC AGC AGC TGG GCC GTC CAG GTG TCC CAG GGT AAC CGG GAG 204Ile Tyr Val Ser Ser Trp Ala Val Gln Val Ser Gln Gly Asn Arg Glu35 40 45GTC GAG CGC CTG GCA CGC AAA TTC GGC TTC GTC AAC CTG GGG CCG ATC 252Val Glu Arg Leu Ala Arg Lys Phe Gly Phe Val Asn Leu Gly Pro Ile50 55 60TTC CCT GAC GGG CAG TAC TTT CAC CTG CGG CAC CGG GGC GTG GTC CAG 300Phe Pro Asp Gly Gln Tyr Phe His Leu Arg His Arg Gly Val Val Gln65 70 75 80CAG TCC CTG ACC CCG CAC TGG GGC CAC CGC CTG CAC CTG AAG AAA AAC 348Gln Ser Leu Thr Pro His Trp Gly His Arg Leu His Leu Lys Lys Asn85 90 95CCC AAG GTG CAG TGG TTC CAG CAG CAG ACG CTG CAG CGG CGG GTG AAA 396Pro Lys Val Gln Trp Phe Gln Gln Gln Thr Leu Gln Arg Arg Val Lys100 105 110CGC TCT GTC GTG GTG CCC ACG GAC CCC TGG TTC TCC AAG CAG TGG TAC 444Arg Ser Val Val Val Pro Thr Asp Pro Trp Phe Ser Lys Gln Trp Tyr115 120 125ATG AAC AGC GAG GCC CAA CCA GAC CTG AGC ATC CTG CAG GCC TGG AGT 492Met Asn Ser Glu Ala Gln Pro Asp Leu Ser Ile Leu Gln Ala Trp Ser130 135 140CAG GGG CTG TCA GGC CAG GGC ATC GTG GTC TCT GTG CTG GAC GAT GGC 540Gln Gly Leu Ser Gly Gln Gly Ile Val Val Ser Val Leu Asp Asp Gly145 150 155 160ATC GAG AAG GAC CAC CCG GAC CTC TGG GCC AAC TAC GAC CCC CTG GCC 588Ile Glu Lys Asp His Pro Asp Leu Trp Ala Asn Tyr Asp Pro Leu Ala165 170 175AGC TAT GAC TTC AAT GAC TAC GAC CCG GAC CCC CAG CCC CGC TAC ACC 636Ser Tyr Asp Phe Asn Asp Tyr Asp Pro Asp Pro Gln Pro Arg Tyr Thr180 185 190CCC AGC AAA GAG AAC CGG CAC GGG ACC CGC TGT GCT GGG GAG GTG GCC 684Pro Ser Lys Glu Asn Arg His Gly Thr Arg Cys Ala Gly Glu Val Ala195 200 205GCG ATG GCC AAC AAT GGC TTC TGT GGT GTG GGG GTC GCT TTC AAC GCC 732Ala Met Ala Asn Asn Gly Phe Cys Gly Val Gly Val Ala Phe Asn Ala210 215 220CGA ATC GGA GGC GTA CGG ATG CTG GAC GGT ACC ATC ACC GAT GTC ATC 780Arg Ile Gly Gly Val Arg Met Leu Asp Gly Thr Ile Thr Asp Val Ile225 230 235 240GAG GCC CAG TCG CTG AGC CTG CAG CCG CAG CAC ATC CAC ATT TAC AGC 828Glu Ala Gln Ser Leu Ser Leu Gln Pro Gln His Ile His Ile Tyr Ser245 250 255GCC AGC TGG GGT CCC GAG GAC GAC GGC CGC ACG GTG GAC GGC CCC GGC 876Ala Ser Trp Gly Pro Glu Asp Asp Gly Arg Thr Val Asp Gly Pro Gly260 265 270ATC CTC ACC CGC GAG GCC TTC CGG CGT GGT GTG ACC AAG GGC CGC GGC 924Ile Leu Thr Arg Glu Ala Phe Arg Arg Gly Val Thr Lys Gly Arg Gly275 280 285GGG CTG GGC ACG CTC TTC ATC TGG GCC TCG GGC AAC GGC GGC CTG CAC 972Gly Leu Gly Thr Leu Phe Ile Trp Ala Ser Gly Asn Gly Gly Leu His290 295 300TAC GAC AAC TGC AAC TGC GAC GGC TAC ACC AAC AGC ATC CAC ACG CTT 1020Tyr Asp Asn Cys Asn Cys Asp Gly Tyr Thr Asn Ser Ile His Thr Leu305 310 315 320TCC GTG GGC AGC ACC ACC CAG CAG GGC CGC GTG CCC TGG TAC AGC GAA 1068Ser Val Gly Ser Thr Thr Gln Gln Gly Arg Val Pro Trp Tyr Ser Glu325 330 335GCC TGC GCC TCC ACC CTC ACC ACC ACC TAC AGC AGC GGC GTG GCC ACC 1116Ala Cys Ala Ser Thr Leu Thr Thr Thr Tyr Ser Ser Gly Val Ala Thr340 345 350GAC CCC CAG ATC GTC ACC ACG GAC CTG CAT CAC GGG TGC ACA GAC CAG 1164Asp Pro Gln Ile Val Thr Thr Asp Leu His His Gly Cys Thr Asp Gln355 360 365CAC ACG GGC ACC TCG GCC TCA GCC CCA CTG GCG GCC GGC ATG ATC GCC 1212His Thr Gly Thr Ser Ala Ser Ala Pro Leu Ala Ala Gly Met Ile Ala370 375 380CTA GCG CTG GAG GCC AAC CCG TTC CTG ACG TGG AGA GAC ATG CAG CAC 1260Leu Ala Leu Glu Ala Asn Pro Phe Leu Thr Trp Arg Asp Met Gln His385 390 395 400CTG GTG GTC CGC GCG TCC AAG CCG GCG CAC CTG CAG GCC GAG GAC TGG 1308Leu Val Val Arg Ala Ser Lys Pro Ala His Leu Gln Ala Glu Asp Trp405 410 415AGG ACC AAC GGC GTG GGG CGC CAA GTG AGC CAT CAC TAC GGA TAC GGG 1356Arg Thr Asn Gly Val Gly Arg Gln Val Ser His His Tyr Gly Tyr Gly420 425 430CTG CTG GAC GCC GGG CTG CTG GTG GAC ACC GCC CGC ACC TGG CTG CCC 1404Leu Leu Asp Ala Gly Leu Leu Val Asp Thr Ala Arg Thr Trp Leu Pro435 440 445ACC CAG CCG CAG AGG AAG TGC GCC GTC CGG GTC CAG AGC CGC CCC ACC 1452Thr Gln Pro Gln Arg Lys Cys Ala Val Arg Val Gln Ser Arg Pro Thr450 455 460CCC ATC CTG CCG CTG ATC TAC ATC AGG GAA AAC GTA TCG GCC TGC GCC 1500Pro Ile Leu Pro Leu Ile Tyr Ile Arg Glu Asn Val Ser Ala Cys Ala465 470 475 480GGC CTC CAC AAC TCC ATC CGC TCG CTG GAG CAC GTG CAG GCG CAG CTG 1548Gly Leu His Asn Ser Ile Arg Ser Leu Glu His Val Gln Ala Gln Leu485 490 495ACG CTG TCC TAC AGC CGG CGC GGA GAC CTG GAG ATC TCG CTC ACC AGC 1596Thr Leu Ser Tyr Ser Arg Arg Gly Asp Leu Glu Ile Ser Leu Thr Ser500 505 510CCC ATG GGC ACG CGC TCC ACA CTC GTG GCC ATA CGA CCC TTG GAC GTC 1644Pro Met Gly Thr Arg Ser Thr Leu Val Ala Ile Arg Pro Leu Asp Val515 520 525AGC ACT GAA GGC TAC AAC AAC TGG GTC TTC ATG TCC ACC CAC TTC TGG 1692Ser Thr Glu Gly Tyr Asn Asn Trp Val Phe Met Ser Thr His Phe Trp530 535 540GAT GAG AAC CCA CAG GGC GTG TGG ACC CTG GGC CTA GAG AAC AAG GGC 1740Asp Glu Asn Pro Gln Gly Val Trp Thr Leu Gly Leu Glu Asn Lys Gly545 550 555 560TAC TAT TTC AAC ACG GGG ACG TTG TAC CGC TAC ACG CTG CTG CTC TAT 1788Tyr Tyr Phe Asn Thr Gly Thr Leu Tyr Arg Tyr Thr Leu Leu Leu Tyr565 570 575GGG ACG GCC GAG GAC ATG ACA GCG CGG CCT ACA GGC CCC CAG GTG ACC 1836Gly Thr Ala Glu Asp Met Thr Ala Arg Pro Thr Gly Pro Gln Val Thr580 585 590AGC AGC GCG TGT GTG CAG CGG GAC ACA GAG GGG CTG TGC CAG GCG TGT 1884Ser Ser Ala Cys Val Gln Arg Asp Thr Glu Gly Leu Cys Gln Ala Cys595 600 605GAC GGC CCC GCC TAC ATC CTG GGA CAG CTC TGC CTG GCC TAC TGC CCC 1932Asp Gly Pro Ala Tyr Ile Leu Gly Gln Leu Cys Leu Ala Tyr Cys Pro610 615 620CCG CGG TTC TTC AAC CAC ACA AGG CTG GTG ACC GCT GGG CCT GGG CAC 1980Pro Arg Phe Phe Asn His Thr Arg Leu Val Thr Ala Gly Pro Gly His625 630 635 640ACG GCG GCG CCC GCG CTG AGG GTC TGC TCC AGC TGC CAT GCC TCC TGC 2028Thr Ala Ala Pro Ala Leu Arg Val Cys Ser Ser Cys His Ala Ser Cys645 650 655TAC ACC TGC CGC GGC GGC TCC CCG AGG GAC TGC ACC TCC TGT CCC CCA 2076Tyr Thr Cys Arg Gly Gly Ser Pro Arg Asp Cys Thr Ser Cys Pro Pro660 665 670TCC TCC ACG CTG GAC CAG CAG CAG GGC TCC TGC ATG GGA CCC ACC ACC 2124Ser Ser Thr Leu Asp Gln Gln Gln Gly Ser Cys Met Gly Pro Thr Thr675 680 685CCC GAC AGC CGC CCC CGG CTT AGA GCT GCC GCC TGT CCC CAC CAC CGC 2172Pro Asp Ser Arg Pro Arg Leu Arg Ala Ala Ala Cys Pro His His Arg690 695 700TGC CCA GCC TCG GCC ATG GTG CTG AGC CTC CTG GCC GTG ACC CTC GGA 2220Cys Pro Ala Ser Ala Met Val Leu Ser Leu Leu Ala Val Thr Leu Gly705 710 715 720GGC CCC GTC CTC TGC GGC ATG TCC ATG GAC CTC CCA CTA TAC GCC TGG 2268Gly Pro Val Leu Cys Gly Met Ser Met Asp Leu Pro Leu Tyr Ala Trp725 730 735CTC TCC CGT GCC AGG GCC ACC CCC ACC AAA CCC CAG GTC TGG CTG CCA 2316Leu Ser Arg Ala Arg Ala Thr Pro Thr Lys Pro Gln Val Trp Leu Pro740 745 750GCT GGA ACC TGAAGTTGTC AGCTCAGAAA GCGACCTTGC CCCCGCCTGG GTCCCTGAC2374Ala Gly Thr755AGGCACTGCT GCCATGCTGC CTCCCCAGGC TGGCCCCAGA GGAGCGAGCA CCAGCACCCG2434ACGCCTGGCC TGCCAGGGAT GGGCCCCGTG GAACCCCGAA GCCTGGCGGG AGAGAGAGAG2494AGAGAAGTCT CCTCTGCATT TTGGGTTTGG GCGGGAGTGG GCTGGGGGGA GAGGCTGGAG2554CACCCCAAAA GCCAGGGGAA AGTGGAGGGA GAGAAACGTG ACACTGTCCG CCTCGGGCAC2614CGCATCCAAC CTCAGAGTTT GCAAATAAAG GTTGCTTAGA AGGTGAAAAA AAAAAAAAAA2674AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA2734AAGCGGCCGC 2744(2)關于SEQ ID NO2的信息(i)序列特征(A)長度755個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型蛋白質(v)片段類型內部的(xi)序列描述SEQ ID NO2Met Arg Pro Ala Pro Ile Ala Leu Trp Leu Arg Leu Val Leu Ala Leu1 5 10 15Ala Leu Val Arg Pro Arg Ala Val Gly Trp Ala Pro Val Arg Ala Pro20 25 30Ile Tyr Val Ser Ser Trp Ala Val Gln Val Ser Gln Gly Asn Arg Glu35 40 45Val Glu Arg Leu Ala Arg Lys Phe Gly Phe Val Asn Leu Gly Pro Ile50 55 60Phe Pro Asp Gly Gln Tyr Phe His Leu Arg His Arg Gly Val Val Gln65 70 75 80Gln Ser Leu Thr Pro His Trp Gly His Arg Leu His Leu Lys Lys Asn85 90 95Pro Lys Val Gln Trp Phe Gln Gln Gln Thr Leu Gln Arg Arg Val Lys100 105 110Arg Ser Val Val Val Pro Thr Asp Pro Trp Phe Ser Lys Gln Trp Tyr115 120 125Met Asn Ser Glu Ala Gln Pro Asp Leu Ser Ile Leu Gln Ala Trp Ser130 135 140Gln Gly Leu Ser Gly Gln Gly Ile Val Val Ser Val Leu Asp Asp Gly145 150 155 160Ile Glu Lys Asp His Pro Asp Leu Trp Ala Asn Tyr Asp Pro Leu Ala165 170 175Ser Tyr Asp Phe Asn Asp Tyr Asp Pro Asp Pro Gln Pro Arg Tyr Thr180 185 190Pro Ser Lys Glu Asn Arg His Gly Thr Arg Cys Ala Gly Glu Val Ala195 200 205Ala Met Ala Asn Asn Gly Phe Cys Gly Val Gly Val Ala Phe Asn Ala210 215 220Arg Ile Gly Gly Val Arg Met Leu Asp Gly Thr Ile Thr Asp Val Ile225 230 235 240Glu Ala Gln Ser Leu Ser Leu Gln Pro Gln His Ile His Ile Tyr Ser245 250 255Ala Ser Trp Gly Pro Glu Asp Asp Gly Arg Thr Val Asp Gly Pro Gly260 265 270Ile Leu Thr Arg Glu Ala Phe Arg Arg Gly Val Thr Lys Gly Arg Gly275 280 285Gly Leu Gly Thr Leu Phe Ile Trp Ala Ser Gly Asn Gly Gly Leu His290 295 300Tyr Asp Asn Cys Asn Cys Asp Gly Tyr Thr Asn Ser Ile His Thr Leu305 310 315 320Ser Val Gly Ser Thr Thr Gln Gln Gly Arg Val Pro Trp Tyr Ser Glu325 330 335Ala Cys Ala Ser Thr Leu Thr Thr Thr Tyr Ser Ser Gly Val Ala Thr340 345 350Asp Pro Gln Ile Val Thr Thr Asp Leu His His Gly Cys Thr Asp Gln355 360 365His Thr Gly Thr Ser Ala Ser Ala Pro Leu Ala Ala Gly Met Ile Ala370 375 380Leu Ala Leu Glu Ala Asn Pro Phe Leu Thr Trp Arg Asp Met Gln His385 390 395 400Leu Vai Val Arg Ala Ser Lys Pro Ala His Leu Gln Ala Glu Asp Trp405 410 415Arg Thr Asn Gly Val Gly Arg Gln Val Ser His His Tyr Gly Tyr Gly420 425 430Leu Leu Asp Ala Gly Leu Leu Val Asp Thr Ala Arg Thr Trp Leu Pro435 440 445Thr Gln Pro Gln Arg Lys Cys Ala Val Arg Val Gln Ser Arg Pro Thr450 455 460Pro Ile Leu Pro Leu Ile Tyr Ile Arg Glu Asn Val Ser Ala Cys Ala465 470 475 480Gly Leu His Asn Ser Ile Arg Ser Leu Glu His Val Gln Ala Gln Leu485 490 495Thr Leu Ser Tyr Ser Arg Arg Gly Asp Leu Glu Ile Ser Leu Thr Ser500 505 510Pro Met Gly Thr Arg Ser Thr Leu Val Ala Ile Arg Pro Leu Asp Val515 520 525Ser Thr Glu Gly Tyr Asn Asn Trp Val Phe Met Ser Thr His Phe Trp530 535 540Asp Glu Asn Pro Gln Gly Val Trp Thr Leu Gly Leu Glu Asn Lys Gly545 550 555 560Tyr Tyr Phe Asn Thr Gly Thr Leu Tyr Arg Tyr Thr Leu Leu Leu Tyr565 570 575Gly Thr Ala Glu Asp Met Thr Ala Arg Pro Thr Gly Pro Gln Val Thr580 585 590Ser Ser Ala Cys Val Gln Arg Asp Thr Glu Gly Leu Cys Gln Ala Cys595 600 605Asp Gly Pro Ala Tyr Ile Leu Gly Gln Leu Cys Leu Ala Tyr Cys Pro610 615 620Pro Arg Phe Phe Asn His Thr Arg Leu Val Thr Ala Gly Pro Gly His625 630 635 640Thr Ala Ala Pro Ala Leu Arg Val Cys Ser Ser Cys His Ala Ser Cys645 650 655Tyr Thr Cys Arg Gly Gly Ser Pro Arg Asp Cys Thr Ser Cys Pro Pro660 665 670Ser Ser Thr Leu Asp Gln Gln Gln Gly Ser Cys Met Gly Pro Thr Thr675 680 685Pro Asp Ser Arg Pro Arg Leu Arg Ala Ala Ala Cys Pro His His Arg690 695 700Cys Pro Ala Ser Ala Met Val Leu Ser Leu Leu Ala Val Thr Leu Gly705 710 715 720Gly Pro Val Leu Cys Gly Met Ser Met Asp Leu Pro Leu Tyr Ala Trp725 730 735Leu Ser Arg Ala Arg Ala Thr Pro Thr Lys Pro Gln Val Trp Leu Pro740 745 750Ala Gly Thr755(2)關于SEQ ID NO3的信息(i)序列特征(A)長度5個氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型肽(xi)序列描述SEQ ID NO3
Arg Arg Val Lys Arg15(2)關于SEQ ID NO4的信息(i)序列特征(A)長度49個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(vii)直接來源(B)克隆ZC6091(xi)序列描述SEQ ID NO4GAGCACAGAA TTCACTACTC GAGGCGGCCG CTTTTTTT TTTTTTTTTTT 49(2)關于SEQ ID NO5的信息(i)序列特征(A)長度2458個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型其它(xi)序列描述SEQ ID NO5ATGCGGCCCT CCCAGACAGC GCTGTGGCTG GGTCTGGTTT TGTCTTTGGC CCTCCTGGCT60GTGGGGTGGG CCTCAGCCCG ACCACCCATC TATGTCAGCA GCTGGGCAGT GCGGGTGACC120AAAGGTTACC AGGAGGCTGA GCGCCTGGCA CGTAAATTTG GCTTCGTCAA CCTGGGACAG180ATCTTTCCTG ATGACCAGTA TTTCCATCTG AGGCACCGGG GTGTGGCCCA GCAGTCCCTG240ACTCCGCACT GGGGCCACCG TCTGCGCCTG AAGAAAGAGC CCAAGGTGCG GTGGTTTGAG300CAGCAGACTT TGAGGCGGCG GGTGAAGCGC TCCCTGGTGG TACCCACAGA CCCCTGGTTT360TCCAAGCAGT GGTACATGAA CAAGGAGATA GAACAAGATC TCAACATCCT AAAGGTTTGG420AACCAGGGAC TGACTGGCCG GGGAGTGGTG GTCTCCATCT TGGATGATGG CATTGAGAAG480GACCATCCGG ACCTCTGGGC TAATTATGAC CCCCTGGCCA GCTATGACTT CAATGATTAC540GACCCAGATC CCCAGCCTCG ATACACACCC AACGATGAGA ACCGGCATGG AACACGCTGC600GCTGGGGAGG TGTCTGCCAC AGCAAACAAC GGTTTCTGTG GTGCCGGTGT GGCCTTCAAT660GCCAGAATTG GAGGCGTGCG CATGTTGGAT GGAGCCATCA CTGACATCGT GGAGGCTCAG720TCCCTCAGCC TGCAGCCGCA ACACATACAC ATCTATAGCG CCAGTTGGGG CCCCGAGGAT780GATGGGCGCA CAGTGGACGG ACCCGGCCTC CTCACGCAGG AGGCCTTCAG GCGTGGTGTA840ACCAAGGGCC GCCAAGGGCT GGGCACGCTG TTCATCTGGG CCTCGGGAAA CGGTGGCCTC900CACTACGACA ACTGCAATTG TGACGGCTAC ACCAACAGCA TCCACACGCT GTCAGTGGGC960AGTACCACGC GGCAGGGCCG AGTGCCCTGG TACAGCGAGG CCTGCGCCTC CACGTTCACC1020ACCACCTTCA GCAGCGGTGT GGTCACCGAC CCACAGATCG TCACCACGGA CCTACACCAT1080CAATGCACCG ACAAGCACAC GGGCACCTCG GCCTCCGCCC CGCTGGCCGC TGGCATGATC1140GCCCTGGCGC TGGAGGCCAA CCCGCTGCTG ACCTGGAGGG ACCTGCAGCA CCTGGTGGTC1200CGCGCGTCCA GGCCGGCGCA GCTGCAGGCG GAGGACTGGA GGATCAACGG CGTGGGGCGC1260CAAGTGAGCC ACCACTATGG CTATGGGCTG CTGGACGCGG GGCTGCTGGT AGACCTGGCT1320CGCGTGTGGC TCCCTACTAA GCCTCAGAAG AAATGCACCA TTCGGGTGGT GCACACCCCA1380ACCCCCATCC TGCCTCGGAT GCTGGTGCCA AAGAACGTGA CTGTATGCTG CGATGGCTCG1440CGCCGCCGCC TCATCCGCTC GCTAGAGCAT GTTCAGGTCC AGCTGTCGCT CTCCTACAGC1500CGCCGCGGGG ACCTGGAGAT CTTCCTCACC AGCCCCATGG GCACGCGCTC CACGCTTGTG1560GCCATCAGAC CCTTGGATAT CAGCGGCCAA GGCTACAACA ACTGGATCTT CATGTCTACT1620CACTACTGGG ATGAGGACCC GCAGGGCCTG TGGACCCTGG GGCTGGAGAA TAAGGGCTAC1680TATTATAACA CAGGAACTCT GTACTACTGC ACGCTGCTGC TGTATGGGAC GGCAGAGGAC1740ATGACAGCGC GGCCCCAGAC CCCCCAGGTG ACCAGCTGCG CGCACGCATG TGCAGAGGGA1800CACAGAGGGG CTGTGCCAGG AAAGTCATTG TCCCCTCTCC ATTGTGGCAG AACTCTGCCT1860CATCTCCAGC AAGCAGTGGT GGTGGCTCTA CAGCCACACA CAGCAGCCAG TGACCAAGGG1920ACAGGACAGC TGTCACCCTC CTACCACACC TGCTCGGCAG CTTGACCAGC GACTACACTG1980CCTGTTCCCT GCCCCTCATG CTGGGAGTGC TTCAGAGCCC CTCCAAGGCT TGTCACCTCT2040GGCAGCCATC CTGGCTATCA GTCTTGGGCC ATGGTGCTGT CCCTGCTAAC CAGGGCCTTT2100GGAAGGCCCC TCATCTTGAG GAAGGCCCAC CTCTCCCCAG GCTGGATACC CCTGGGGAGC2160CAGAGATGCC CCACTCTCAG GACAGAAGGC CGGTACCCCA AGGCCCTGCT CCCAGGCCGG2220GATAGGAATA TGCCCCAGAA GGCCACGGCA GAGAGCTGCA TGGGTCACGT GACAGCCCGC2280AGCTCAGCCT CAGCTGCTCC CAGTGGAAGA GACGTTTCCT CATTCTTTTT GGAGCAGGTA2340TGGCAGACAA GAGGTCAGAC CACAGCCACC AACCACCTGC CCCTTCCCTG TCTCCAAACC2400ATCCCCATGT CTAACCTCAT AGTTGGCAAA TAAAGTTAAA CAGAAAAAAA AAAAAAAA 2458(2)關于SEQ ID NO6的信息(i)序列特征(A)長度25個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(vii)直接來源(B)克隆ZC11808(xi)序列描述SEQ ID NO6TGGCTGGGTC TGGTTTTGTC TTTGG 25(2)關于SEQ ID NO7的信息(i)序列特征(A)長度24個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(vii)直接來源(B)克隆ZC11809(xi)序列描述SEQ ID NO7GCATTGATGG TGTAGGTCCG TGGT24(2)關于SEQ ID NO8的信息(i)序列特征(A)長度24個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(vii)直接來源(B)克隆ZC11870(xi)序列描述SEQ ID NO8TTTGGCCCTC CTGGCTGTGG GGTG24(2)關于SEQ ID NO9的信息(i)序列特征(A)長度24個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(vii)直接來源
(B)克隆ZC11871(xi)序列描述SEQ ID NO9TGCTGAAGGT GGTGGTGAAC GTGG24(2)關于SEQ ID NO10的信息(i)序列特征(A)長度26個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(vii)直接來源(B)克隆ZC13557(xi)序列描述SEQ ID NO10CAGCCGCAGC ACATCCACAT TTACAG 26(2)關于SEQ ID NO11信息(i)序列特征(A)長度21個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(vii)直接來源(B)克隆ZC13558(xi)序列描述SEQ ID NO11GGGTGAGGAT GCCGGGGCCG T 2權利要求
1.編碼包含與選自下組之氨基酸序列至少90%相同的一段氨基酸殘基序列的人激素原轉化酶4多肽的分離多核苷酸(a)SEQ ID No2所示114位(Ser)至443位(Ala)氨基酸的氨基酸序列;(b)SEQ ID No2所示114位(Ser)至755位(Thr)氨基酸的氨基酸序列;(c)SEQ ID No2所示20位(Arg)至755位(Thr)氨基酸的氨基酸序列;和(d)SEQ ID No2所示1位(Met)至755位(Thr)氨基酸的氨基酸序列。
2.權利要求1的分離多核苷酸,其中所述多核苷酸選自下組(a)SEQ ID No1所示400位-1389位核苷酸的多核苷酸序列;(b)SEQ ID No1所示400位-2325位核苷酸的多核苷酸序列;(c)SEQ ID No1所示118位-2325位核苷酸的多核苷酸序列;和(d)SEQ ID No1所示61位-2325位核苷酸的多核苷酸序列。
3.權利要求1的分離多核苷酸序列,其中該多核苷酸包含SEQ IDNo3的1位至2265位核苷酸。
4.權利要求1的分離多核苷酸,其中人激素原轉化酶4多肽基本上由與SEQ ID No2所示20位(Arg)至755位(Thr)氨基酸的序列至少90%相同的氨基酸殘基序列組成。
5.權利要求4的分離多核苷酸,其中所述激素原轉化酶4多肽基本上由SEQ ID No2所示20位(Arg)至755位(Thr)氨基酸的氨基酸殘基序列組成。
6.含以下可操作連接在一起的元件的表達載體轉錄啟動子;編碼與SEQ ID No2所示20位(Arg)至755位(Thr)氨基酸序列至少90%相同的激素原轉化酶多肽的DNA片段;及轉錄終止子。
7.權利要求6的表達載體,其中進一步包含可操作連接于所述DNA片段的一段分泌信號序列。
8.導入了權利要求6的表達載體的培養細胞,其中該細胞表達由所述DNA片段編碼的多肽。
9.編碼融合蛋白的DNA構建體,其包含編碼與選自下組之氨基酸殘基序列至少90%相同的多肽的第一DNA區段(a)SEQ ID No2的1位(Met)至21位(Pro)氨基酸的序列;(b)SEQ ID No2的20位(Arg)至113位(Arg)氨基酸的序列;(c)SEQ ID No2的114位(Ser)至443位(Ala)氨基酸的序列;(d)SEQ ID No2的444(Arg)至561位(Tyr)氨基酸的序列;(e)SEQ ID No2的562位(Tyr)至755位(Thr)氨基酸的序列;(f)SEQ ID No2的114位(Ser)至755位(Thr)氨基酸的序列;(g)SEQ ID No2的20位(Arg)至755位(Thr)氨基酸的序列;及編碼其它多肽的至少一個其它DNA區段,其中所述第一和其它DNA區段在框架內連接;并編碼融合蛋白。
10.由包含下述步驟的方法產生的融合蛋白培養已導入含以下可操作連接在一起的元件的載體的宿主細胞(a)轉錄啟動子;(b)權利要求9的編碼融合蛋白的DNA構建體;及(c)轉錄終止子;及回收該DNA區段編碼的蛋白質。
11.含有與選自下組之氨基酸序列至少90%相同的氨基酸殘基序列的分離多肽(a)SEQ ID No2所示114位(Ser)至443位(Ala)的氨基酸序列;(b)SEQ ID No2所示114位(Ser)至755位(Thr)的氨基酸序列;(c)SEQ ID No2所示20位(Arg)至755位(Thr)的氨基酸序列;(d)SEQ ID No2所示1位(Met)至755位(Thr)的氨基酸序列。
12.權利要求11的分離多肽,其中該多肽基本上由與SEQ ID No2所示20位(Arg)至755位(Thr)氨基酸序列至少90%相同的氨基酸殘基序列組成。
13.權利要求12的分離多肽,其中該氨基酸殘基序列為SEQ IDNo2所示20位(Arg)至755位(Thr)氨基酸序列。
14.產生人激素原轉化酶4多肽的方法,包括培養權利要求8的細胞;并分離該細胞所產生的人激素原轉化酶多肽。
15.測定人激素原轉化酶4多肽的多肽激素原底物的方法,包括培養已導入權利要求6的表達載體的細胞,其中該細胞表達該DNA區段編碼的人激素原轉化酶多肽,還表達檢驗底物激素原多肽;及檢測因人激素原轉化酶4多肽切割所述檢驗底物產生的切割產物。
16.測定人激素原轉化酶4多肽的多肽激素原底物的方法,包括體外將權利要求11的激素原轉化酶4多肽與檢驗底物多肽混合;并檢測因人激素原轉化酶4多肽切割檢驗底物產生的切割產物。
17.檢測檢驗樣品中是否有人激素原轉化酶多肽活性調節子的方法,包括在有或無檢驗樣品時培養已導入權利要求6的表達載體的細胞,其中該細胞表達該DNA區段編碼的人激素原轉化酶多肽,還表達已知的指示性激素原多肽底物;及經生物學或生物化學分析,比較在有和無檢驗樣品時由人激素原轉化酶多肽切割該底物產生的切割產物的水平;并通過該項比較,確定檢驗樣品中有無人激素原轉化酶活性的調節子。
18.產生人激素原轉化酶4多肽的抗體的方法,包括用選自下組的多肽接種動物(a)由9至755個氨基酸組成的多肽,其中該多肽與SEQ ID No2中20位(Arg)至755位(Thr)氨基酸內的一段連續序列至少90%相同;(b)權利要求11的多肽;(c)其具有的一段氨基酸序列與SEQ ID No2中444位(Arg)至561位(Tyr)殘基至少90%序列相同的多肽;及(d)其具有的一段氨基酸序列與SEQ ID No2中562位(Tyr)至755位(Thr)殘基至少90%序列相同的多肽,其中該多肽在動物體內可引起免疫應答;及從動物體內分離該抗體。
19.由權利要求18的方法產生的抗體,其可結合人激素原轉化酶4多肽。
20.權利要求19的抗體,其中該抗體為單克隆抗體。
21.可與權利要求11的多肽特異性結合的抗體。
全文摘要
本發明提供新型人激素原轉化酶4的多核苷酸和多肽。編碼人激素原轉化酶4的多核苷酸位于19號染色體上,并可用于如鑒定與人類疾病狀況相關的基因組區。本發明還包括生產這種蛋白質及其相應抗體的方法。
文檔編號C07K19/00GK1257543SQ98805475
公開日2000年6月21日 申請日期1998年5月1日 優先權日1997年5月6日
發明者S·羅克, S·R·加斯比斯 申請人:津莫吉尼蒂克斯公司