染色體區(qū)域縮放。
[0085] 圖4B示出了用戶可通過(guò)其放大到特定基因的替代方法。屏幕截圖410示出了由 用戶調(diào)用的鍵盤(pán)412,鍵盤(pán)412然后可W用來(lái)輸入感興趣的基因的名稱或位置到捜索框中 411。然后,系統(tǒng)選擇合適的染色體并放大到基因所處位置的染色體內(nèi)區(qū)域。放大倍率由系 統(tǒng)選擇,W適應(yīng)基因(包括內(nèi)含子,外顯子,和控制序列)的已知長(zhǎng)度,將基因置于每一側(cè)的 旁側(cè)序列之間的中屯、。
[0086] 圖4C是顯示出左側(cè)的標(biāo)記422之間的染色體17 421的較窄的區(qū)域的擴(kuò)大視圖 420。用戶可W通過(guò)擴(kuò)大完整染色體17的視圖,在特定的基因放大,或者通過(guò)按照其名稱 (TP53)捜索基因來(lái)獲得該視圖。該顯示示出兩個(gè)重疊的基因的圖譜;TP53 426,其被定向 從左至右426,和WRAP53的部分,其恰好部分地與TP53重疊,并且被定向從右向左427。每 一個(gè)基因被描繪為具有在5'端和3'端的垂直線和指示方向的方向指示("<"或">") 的水平線。未處理的翻譯產(chǎn)物的編碼區(qū)在每個(gè)基因內(nèi)的相應(yīng)位置處W框的形式指示。
[0087] 圖4D是示出在染色體14 431上的特定基因的進(jìn)一步的放大圖的顯示430。用戶 可W通過(guò)如之前從較低的分辨率放大達(dá)到該種放大的等級(jí),或者可W通過(guò)點(diǎn)擊較低的分辨 率的顯示中的特定SNV(對(duì)應(yīng)于圖4C的帶425中所示的SNV)達(dá)到該種放大的等級(jí)。同樣, 顯示出拷貝數(shù)433和等位基因特定的拷貝數(shù)434。在該放大的等級(jí),基因組序列顯示為單個(gè) 堿基435。測(cè)試序列和參考序列是相同的,除非存在變化;在該案例中,SNV437。最底層的 圖形436是使用單字母代碼描繪的編碼氨基酸序列。
[0088] 圖5A、5B、5C和抓示出用于選擇可應(yīng)用于數(shù)據(jù)的過(guò)濾器的菜單,W便簡(jiǎn)化和聚焦 所選擇的區(qū)域內(nèi)所示的變化。使特別感興趣的序列變化在顯示上顯示,而其他不太感興趣 的變化或測(cè)序噪音被過(guò)濾掉,并不會(huì)出現(xiàn)。
[0089] 圖5A顯示過(guò)濾器500的菜單,W集中在對(duì)潛在的感興趣的或具有重要性的某些變 化的分析。用戶可W選擇特定基因501或特定染色體位置502用于分析。小核巧酸變化 (SNV)可W根據(jù)預(yù)測(cè)的致病性、基因區(qū)、對(duì)編碼的氨基酸序列的影響,SNV類型(例如,單核 巧酸多態(tài)性、缺失、插入、多核巧酸置換),接合性(純合或雜合)進(jìn)行過(guò)濾,不論它是否在特 定的數(shù)據(jù)庫(kù)(如化SNP數(shù)據(jù)庫(kù))中發(fā)現(xiàn),W排除在健康人群中常見(jiàn)的變化,W及測(cè)序質(zhì)量過(guò) 濾器(如V卵IGH與WLOW,和最小讀數(shù))。標(biāo)記為V卵IGH的雜合子變化通常需要每個(gè)等位 基因至少兩個(gè)高質(zhì)量的、圖譜化的讀取。標(biāo)記為V卵IGH的純合子變化通常需要至少走個(gè)讀 取。標(biāo)記為VQL0W的變化可能有更少的支持調(diào)用的讀取,并伴隨著表示在調(diào)用中較低信屯、 的較低的評(píng)分??截悢?shù)變化(CNV)可W根據(jù)預(yù)測(cè)的致病性、基因區(qū)、拷貝數(shù)、重復(fù)類別重疊 進(jìn)行過(guò)濾,無(wú)論它是否在特定的外部數(shù)據(jù)庫(kù)(如DGV)中發(fā)現(xiàn),W及測(cè)序質(zhì)量過(guò)濾器,如倍體 質(zhì)量分?jǐn)?shù),和CNV類型質(zhì)量分?jǐn)?shù)。
[0090] 圖5B示出了菜單505,通過(guò)菜單505用戶可W裝配特別感興趣的基因面板。在該 個(gè)案例中,選擇了 15個(gè)基因的面板。圖5C示出了菜單510,其中用戶通過(guò)應(yīng)包含在分析中 的功能511選擇基因區(qū)域。用戶可W選擇顯示編碼區(qū)域(CD巧、上游轉(zhuǎn)錄起始位點(diǎn)(TSS)、 內(nèi)含子、在5'和/或3'端重疊的外顯子、剪接供體和受體位點(diǎn)的mRNA,W及在5'和/或 3'端的非翻譯區(qū)扣TR),而不是顯示整個(gè)基因序列。
[0091] 圖抓示出了允許用戶根據(jù)它們?cè)谒幋a的蛋白質(zhì)或它W下的表達(dá)上的效果521 選擇SNV的菜單:例如,沒(méi)有改變,同義變化(即導(dǎo)致編碼的氨基酸序列沒(méi)有改變的沉默 突變),無(wú)義變化(導(dǎo)致過(guò)早終止密碼子),錯(cuò)義變化(導(dǎo)致單個(gè)氨基酸的機(jī)會(huì)),錯(cuò)始 (misstart)變化(導(dǎo)致起始密碼子的錯(cuò)位),非移碼插入或缺失(導(dǎo)致氨基酸序列的小變 化,但保留大部分蛋白質(zhì)完整),移碼插入或缺失(導(dǎo)致下游核酸序列在框架外,由此編碼 完全不同的氨基酸序列),剪接位點(diǎn)破壞(防止正常轉(zhuǎn)錄后處理),和未知或不確定的變化。 [009引在該實(shí)施方式中,用戶有選項(xiàng)W施用過(guò)濾器到單核巧酸變化(SNV)或拷貝數(shù)變化 (CNV),或兩者。對(duì)于SNV,用戶可W限制對(duì)變化的其中在系統(tǒng)中的一些信息表明其致病性的 分析。其他SNV過(guò)濾器包括基因區(qū)域(變化落入哪個(gè)地區(qū),如CDS、5'UTR、3'UTR),功能 性影響(如同義、錯(cuò)義、無(wú)義、或移碼),SNV類型(例如,插入、刪除、或替代),結(jié)合性(純 合子或雜合子),化SNP(是否在化SNP中找到),1000個(gè)基因組的次要等位基因頻率,W潛 在過(guò)濾出在健康群體中常見(jiàn)的變化,并針對(duì)序列的質(zhì)量和最小計(jì)數(shù)過(guò)濾。對(duì)于CNV,用戶可 W針對(duì)CNV選擇過(guò)濾器;是否應(yīng)包括它們(例如,CNV大于給定數(shù)目)、致病性、拷貝數(shù)狀態(tài)、 重復(fù)類別重疊(例如DNA,LI肥,Low_Complexity,SI肥,Satellite,Se曲up,Self-chain, Simple_Itepeats,scRNA,tRNA,snRNA)、它是否會(huì)出現(xiàn)在遺傳變化的數(shù)據(jù)庫(kù)值GV)和質(zhì)量過(guò) 濾器(如倍體質(zhì)量得分,CNV類型質(zhì)量分?jǐn)?shù))。Voyager系統(tǒng)允許用戶可W創(chuàng)建他們自己的 具有他們期望的過(guò)濾特性過(guò)濾器。
[0093] 圖6示出具有W各種感興趣尺寸為特征的分析的數(shù)據(jù)的概要的顯示600。每種基 因601針對(duì)其預(yù)期功能影響列表;SNV是否是同義602,是否引起沒(méi)有變化603,具有未知的 或不確定的結(jié)果604,構(gòu)成錯(cuò)義突變605和總計(jì)606。表中的號(hào)碼被設(shè)置為鏈接。如果用戶 點(diǎn)擊號(hào)碼,該變體列表被過(guò)濾,W顯示所選擇的變體。用戶可W在點(diǎn)擊功能影響行旁邊的基 因W導(dǎo)航回到前一個(gè)畫(huà)面,進(jìn)行捜索并呈現(xiàn)所選的基因的擴(kuò)大顯示。
[0094] 該系統(tǒng)還提供了與外部數(shù)據(jù)庫(kù)的鏈接和瀏覽器,如UCSC或化sembl,W便用戶可 W更詳細(xì)研究感興趣的基因區(qū)域的基因結(jié)構(gòu)或保存信息,查找在GeneReviews中的信息或 進(jìn)行更全球化的NCBI捜索。
[0095] 圖7示出顯示700具有通過(guò)將測(cè)試序列與參考序列進(jìn)行比較已經(jīng)檢測(cè)的特定序列 變化的社區(qū)評(píng)估。在任何時(shí)候,用戶可W創(chuàng)建評(píng)估W獲得研究筆記和所收集的其他證據(jù)。 當(dāng)準(zhǔn)備好后,用戶可W指示服務(wù)器與該系統(tǒng)的其他用戶共享評(píng)估。由于用戶創(chuàng)建和共享評(píng) 估,然后Voyager針對(duì)整個(gè)案例的特定的變化聚總評(píng)估并提供針對(duì)所述變化的平均社區(qū)評(píng) 估。當(dāng)在特定案例中再次觀察到所述變化時(shí),用戶可W使用該總評(píng)估作為在過(guò)濾、分類和評(píng) 估變化中的附加信息W適應(yīng)具體案例的背景。
[0096] 條形圖表701顯示社區(qū)評(píng)估按排名的分配。在圖表的下方,用戶可W訪問(wèn)來(lái)自每 個(gè)評(píng)估的貢獻(xiàn)者書(shū)面評(píng)論702。隨著創(chuàng)建新的評(píng)估或?qū)υu(píng)估發(fā)布評(píng)論,社區(qū)的其他成員得到 通知,有新的活動(dòng)。在用戶尚未登錄到Voyager的情況下,他們會(huì)看到iPad通知。如果用 戶已經(jīng)在Voyager,他們將會(huì)看到呈現(xiàn)為顯示的部分的新聞饋送圖標(biāo)上的指示。在用戶是在 特定的案例的背景中的情況下,新聞饋送被自動(dòng)過(guò)濾到針對(duì)給定的案例的社區(qū)活動(dòng)。在主 頁(yè)上還有顯示所有案例的活動(dòng)的新聞饋送。
[0097] 圖8示出包括第一窗口801的屏幕截圖800,第一窗口801用變化的數(shù)目總結(jié)案 例,并指示何時(shí)有新的評(píng)論。第二窗口802示出了與其他用戶共享的序列變化的圖譜。第 S窗口804提供了從第一用戶輸入的信息,典型地該用戶提供正在討論的序列。第四窗口 803被編程和被配置為交換評(píng)注,其中系統(tǒng)的其他用戶公布答復(fù)信息,它可W發(fā)起來(lái)自第一 用戶和其他人的進(jìn)一步的對(duì)話。 VII. 信息的流
[009引圖9是表示系統(tǒng)和過(guò)程的流程圖,通過(guò)該過(guò)程用戶可W提交用于處理的序列并獲 得具有所得分析的顯示。在用戶已安全登錄到系統(tǒng)921之后,他們呈現(xiàn)來(lái)自存儲(chǔ)在安全的 樣本序列數(shù)據(jù)庫(kù)923中的測(cè)試樣本922的序列。然后,用戶可W從參考數(shù)據(jù)庫(kù)925選擇匹 配測(cè)試序列的一個(gè)或多個(gè)特定參考序列924,或讓服務(wù)器選擇合適的參考序列。然后對(duì)準(zhǔn)測(cè) 試和參考序列926,和識(shí)別序列變化927。
[0099] 然后,服務(wù)器創(chuàng)建變化的圖譜931,其中,所述測(cè)試樣本和參考樣本之間的差異相 對(duì)于已知的染色體標(biāo)記物被定位。然后,服務(wù)器編譯該變化中的圖形顯示932,然后將其呈 現(xiàn)給客戶端933。該顯示可W在感興趣的特定預(yù)選染色體區(qū)域中被呈現(xiàn)。替代地,如下面更 詳細(xì)描述的,該差異可W根據(jù)測(cè)試序列的范圍(例如,染色體組型或染色體視圖)呈現(xiàn),該 用戶從該范圍可放大W聚焦特定區(qū)域934的細(xì)節(jié),或縮小回到該范圍。顯示被調(diào)整935,并 根據(jù)請(qǐng)求呈現(xiàn)給客戶端933。如下所述,用戶也可W要求一個(gè)或多個(gè)過(guò)濾器936,其用于選 擇測(cè)試和參考樣本937之間是顯著特別感興趣的變化。然后過(guò)濾之后剩余的變化用于創(chuàng)建 圖譜931和用于顯示給客戶端933的圖形顯示932。用戶可W為各變化提供他們自己的注 釋941,將其引入942到顯示932。在多用戶系統(tǒng)中,其他用戶可回復(fù)943第一用戶的注釋。 回復(fù)信息隨后作為直接注釋或作為鏈接注釋并入顯示942。 VIII. 計(jì)算機(jī)實(shí)施
[0100] 作為一般事項(xiàng),在本發(fā)明的上下文中提到的計(jì)算機(jī)系統(tǒng)、其設(shè)計(jì)、制造、控制和編 程可W根據(jù)任何合適的技術(shù)進(jìn)行。任何在此公開(kāi)內(nèi)容中提到的計(jì)算機(jī)系統(tǒng)可W使用任何適 當(dāng)?shù)臄?shù)目的子系統(tǒng)。計(jì)算機(jī)系統(tǒng)可包括單個(gè)計(jì)算機(jī)裝置,其中所述子系統(tǒng)可W是計(jì)算機(jī)裝 置的部件。替代地,計(jì)算機(jī)系統(tǒng)可w包括多個(gè)計(jì)算機(jī)裝置,每個(gè)計(jì)算機(jī)裝置都是具有內(nèi)部組 件的子系統(tǒng)。
[0101] 在圖10中所示的子系統(tǒng)經(jīng)由系統(tǒng)總線1012互連。示出另外的子系統(tǒng),諸如打印 機(jī)1004、鍵盤(pán)1008、固定磁盤(pán)1009、禪合到顯示適配器1005的監(jiān)視器1006,W及其他裝置。 禪合到I/O控制器1001的外圍設(shè)備和輸入/輸出(I/O)設(shè)備通過(guò)任何數(shù)目的本領(lǐng)域中已 知的方法可W連接到計(jì)算機(jī)系統(tǒng),如串行端口 1〇〇7(例如USB)。例如,串行端口 1007或外 部接口 1011可W用于將計(jì)算機(jī)系統(tǒng)1000連接到廣域網(wǎng)(例如因特網(wǎng))、鼠標(biāo)輸入設(shè)備、或 掃描儀。通過(guò)系統(tǒng)總線1012的互連允許中央處理器1003能與每個(gè)子系統(tǒng)進(jìn)行通信,并控 制來(lái)自系統(tǒng)存儲(chǔ)器1002或固定磁盤(pán)1009的指令的執(zhí)行,W及子系統(tǒng)之間的信息交換。系 統(tǒng)存儲(chǔ)器1002和/或固定磁盤(pán)1009可W具體表現(xiàn)為計(jì)算機(jī)可讀介質(zhì)。本文提及的任何值 都可W是從一個(gè)組件到另一組件的輸出并可被輸出給用戶。
[0102] 計(jì)算機(jī)系統(tǒng)可包括多個(gè)通過(guò)外部接口 1011或通過(guò)內(nèi)部接口連接在一起的相同的 部件或子系統(tǒng)。任選地,計(jì)算機(jī)系統(tǒng)、子系統(tǒng)或裝置可W通過(guò)網(wǎng)絡(luò)進(jìn)行通信。在該種情況 下,一臺(tái)計(jì)算機(jī)可W被認(rèn)為是客戶端,另一臺(tái)計(jì)算機(jī)可W被認(rèn)為是服務(wù)器,其中每個(gè)可W是 相同的計(jì)算機(jī)系統(tǒng)的一部分。客戶端和服務(wù)器可W各自包括多個(gè)系統(tǒng)、子系統(tǒng)、或組件。
[0103] 本發(fā)明的任何實(shí)施