一種智能比對的基因序列分析裝置的制造方法
【專利摘要】本發明公開了一種智能比對的基因序列分析裝置,本發明通過對醫院各種治療設備存儲的基因庫的設計出包含基因庫服務器、序列比對模塊、智能比拼模塊、健康分析模塊四部分。本裝置利用一定數量的標準用例基因作為標準基因序列,將用戶個人的基因序列與標準基因序列通過一定的比對生成進行比對,對相似度結果進行分析,得出該用戶存在亞健康或者不健康的可能性結論,并給出生產生活指導,用戶可以與好友進行智能比對,得出勝負,以智能比對結果友好地提示用戶的基因潛在亞健康的概率高低,引起用戶自身的注意。
【專利說明】
一種智能比對的基因序列分析裝置
技術領域
[0001] 本發明涉及一種全國性基因服務器中的基因序列分析裝置,具體涉及一種基于基 因序列比對的智能分析裝置。
【背景技術】
[0002] 基因是生物體的遺傳物質,它由特定的編碼序列決定生物體不同的性狀表現。人 類的諸多亞健康等疑難癥狀,與人類的基因密切相關,如果我們能通過分析人的基因序列 來檢測是否有發生潛在的亞健康的可能,那么我們就能夠提前采取措施預防或,以達到更 好的效果,為社會造福。
[0003] 該技術的前提是基因測序技術和序列比對技術,隨著生物信息科學的迅速發展基 因測序和序列比對的技術已經非常先進,為基于基因序列比對的趣味性亞健康分析技術的 出現提供了可能。
[0004] 目前,隨著二代測序技術的日臻成熟,人類基因組測序已從開始的30億美金下降 到約1000美金。不久的將來就會實現數百美金甚至更低來測序一個人的整個基因組序列。 個性化基因序列分析,亞健康分析等與基因組信息相關的產業將隨著測序價格的下調呈井 噴式增長。
[0005] 另一方面,隨著生活水平的提高,人們對于健康的生活方式越來越關心,通過基因 比對分析得到的對健康生活的指導性意義也越來越受歡迎。而且現在人們生活富足了,會 有更多的人愿意拿錢去測序自己的基因。
[0006] 隨著海量生物信息數據的涌現,通過大量基因庫服務器中的個人生物信息數據 (基因、蛋白質序列)分析和生物信息數據將成為新的潮流。
【發明內容】
[0007] 本發明為了檢測可能會處于的某些由遺傳基因決定的亞健康狀態,并提前采取相 應措施進展預防和防護,提供一種智能比對的基因序列分析裝置,其利用一定數量的標準 用例基因作為標準基因序列,將用戶個人的基因序列與標準基因序列通過一定的比對生成 進行比對,對相似度結果進行分析,得出該用戶患得某種亞健康的可能性結論,并給出健康 指導和日常生活建議。
[0008] 本發明所采用的技術方案為,一種智能比對的基因序列分析裝置,其特征在于,包 括:
[0009] 基因庫服務器,按照不同類別、不同程度存儲用戶個人的基因序列和標準用例的 基因序列;
[0010] 序列比對模塊,用于將用戶個人的基因序列與相對應類別的標準用例的基因序列 進行相似度比對,并返回與標準用例的基因序列的相似度值;
[0011]智能比拼模塊,用于用戶之間相同類別的基因序列與標準用例的基因序列的相似 度比拼;
[0012] 健康分析模塊,用于通過分析某一類別的用戶個人的基因序列與標準用例的基因 序列在不同程度下的基因序列的相似度,得出用戶健康的發展趨勢,并給出健康指導以及 日常生活建議;
[0013] 基因庫服務器具體包括:數據庫存儲單元、數據庫控制單元;
[0014] 數據庫存儲單元,用于存儲相互關聯的"用戶"、"基因類別"、"表現程度"信息,通 過合理的數據庫設計,將標準用例的基因序列和用戶個人的基因序列與"表現程度"與"基 因類別"聯系,將標準用例的基因序列和用戶個人的基因序列與"用戶"相聯系;每個用戶只 能訪問自己的基因庫,不能訪問其他用戶的用戶個人的基因序列和標準用例的基因庫;
[0015] 數據庫控制單元,對數據庫存儲單元進行添加、修改、刪除等操作;
[0016] 序列比對模塊包括:序列比對生成單元,用于用戶個人的基因序列與標準用例的 基因序列之間進行相似度比對,并提取將得到的相似度比對的結果進行返回,智能比對生 成包括以下步驟:
[0017] 步驟1:對參與比對的兩條序列對進行字母表劃分得到十個點位的特征向量;
[0018] 步驟2:通過十個點位的特征向量的數據期望的值,根據公式:
[0019] 通過標準用例的基因序列的標準數據期望的值1^進行計算,得出與用戶個人的基 因序列的特征差,記A h,并根據下列公式對典型亞健康的平均數據期望kave的值通過下列 公式生成序列第i點位的分值信息:
[0020]
[0021]其中e為自然常數;
[0022]通過得到的&1創建打分矩陣;
[0023] 步驟3:根據得到的打分矩陣打分;
[0024] 步驟4:對由步驟3得到的高于一定閾值的參與比對的兩條序列對進行兩端延伸;
[0025] 步驟5:對由步驟4得到的高于一定閾值的參與比對的兩條序列對進行評估,得出 最后的尚分片段;
[0026] 計算統計單元,用于統計由步驟5得出的高分片段,并根據參與比對的參與比對的 兩條序列對的長度計算出相似度值;
[0027]智能比拼模塊具體包括:
[0028]智能比對單元,用于用戶之間進行相同類型基因的比拼,即以各自帳戶里的用戶 個人的基因序列與標準用例的基因序列的比對值為比拼依據,按分值的高低分出勝負,從 分數中得出勝者可能向該基因的表達性狀發展趨勢更大,記為智能比對結果并記錄;
[0029]健康分析模塊具體包括:
[0030] 健康分析單元,用于在用戶的各自帳戶里分析用戶個人的基因序列與對應類別下 全部程度的標準用例的基因序列的比對結果值,比對結果值的目的是分析用戶的用戶個人 的基因序列是否與某種亞健康的基因序列類似,如果類似,記為A,并生成目前用戶個人身 體狀態要達到這種亞健康程序所需要的時間^和可能性μ,以及這種亞健康通常持續時間 t2,根據不同的用戶特征把類似A、tjPt2與這種亞健康進行進行映射,其映射公式f(A)為:
[0031]
[0032] 從而得出用戶由某一類型基因決定的潛在的亞健康發展趨勢,并將潛在的亞健康 發展趨勢結果返回;由于用戶個人的基因序列受環境控制容易產生變化,可以將映射公式f (A)為存儲在一個可以查詢的循環鏈表,用于序列表的匹配,如果發生個人基因序列的異常 狀態,便把結果發送給指導建議單元;
[0033] 指導建議單元,用于針對健康分析單元所得出的結果,給出合理的健康生活指導, 以及生活生產建議。
【附圖說明】
[0034]圖1為本發明的結構示意圖;
【具體實施方式】
[0035] 為了使本發明所要解決的技術問題、技術方案及有益效果更加清楚明白,以下結 合附圖及實施例,對本發明進行詳細的說明。應當說明的是,此處所描述的具體實施例僅用 以解釋本發明,并不用于限定本發明,能實現同樣功能的產品屬于等同替換和改進,均包含 在本發明的保護范圍之內。具體方法如下:
[0036] 實施例1:如圖1所示,本發明通過對醫院治療設備存儲的基因庫的改造,可以實現 包含基因庫服務器、序列比對模塊、智能比拼模塊、健康分析模塊,共四大部分。基因庫服務 器,用于按不同類別、不同程度存儲標準用例的基因序列和用戶個人的基因序列;序列比對 模塊,用于將用戶個人的基因序列與對應類別的標準用例的基因序列進行相似度比對,并 返回與每一種程度的標準用例的基因序列的相似度值;智能比拼模塊,用于用戶之間相同 類別的基因序列與標準用例的基因序列的相似度比拼;健康分析模塊,用于通過分析用戶 的某一類別的基因序列與標準用例的基因序列不同程度下的基因序列的相似度,得出用戶 健康的發展趨勢,并給出健康指導以及日常生活建議。
[0037] 本實施例開始前應該先由技術使用不同的亞健康基因方式選擇一定數量的足夠 標準用例患病人群,抽取血樣,通過各種通信方式進行全國范圍內的基因庫構建,并通過調 用基因庫服務器將得到的基因序列,按照不同的亞健康、不同的表現程度上傳到基因庫服 務器中。
[0038] 用戶首先要在基因測序公司或醫院的各種設備測序自己的基因序列,并轉換成與 本基于基因序列智能比對的健康分析裝置要求相符的文件。然后在本基于基因序列智能比 對的健康分析裝置注冊賬號并登錄,然后進入醫院的設備個人中心的個人基因庫,按照相 應的基因類別上傳自己的基因序列文件,此時基因庫服務器中的數據庫單元使用相應的操 作方法將序列文件保存到數據庫中,并與用戶賬號和基因類別關聯。
[0039] 序列比對模塊中的序列比對生成單元,通過數據庫模塊將某一類別下的用戶個人 的基因序列和標準用例的基因序列從數據庫中查詢出來,把用戶個人的基因序列與每個表 現程度下的標準用例的基因序列一一進行比對。具體流程如下:對參與比對的兩條序列進 行劃分字母表;然后創建合理的打分矩陣;把兩條序列的基因序列進行一一比對并根據打 分矩陣打分;得到的高于一定閾值的序列對進行兩端延伸,并再次打分,高于一定閾值的序 列對進行評估,得出最后的高分片段。計算統計單元根據參與比對的序列的長度計算出相 似度值,將每一表現程度下的比對結果求取平均值,然后每個表現程度的平均值再經過計 算求得各自所占的比例,得出每一種表現程度的概率作為最后結果統計出,并保存在數據 庫中,與用戶關聯。
[0040] 基因庫服務器,按照不同類別、不同程度存儲用戶個人的基因序列和標準用例的 基因序列;
[0041] 序列比對模塊,用于將用戶個人的基因序列與相對應類別的標準用例的基因序列 進行相似度比對,并返回與標準用例的基因序列的相似度值;
[0042] 智能比拼模塊,用于用戶之間相同類別的基因序列與標準用例的基因序列的相似 度比拼;
[0043] 健康分析模塊,用于通過分析某一類別的用戶個人的基因序列與標準用例的基因 序列在不同程度下的基因序列的相似度,得出用戶健康的發展趨勢,并給出健康指導以及 日常生活建議;
[0044] 基因庫服務器具體包括:數據庫存儲單元、數據庫控制單元;
[0045] 數據庫存儲單元,用于存儲相互關聯的"用戶"、"基因類別"、"表現程度"信息,通 過合理的數據庫設計,將標準用例的基因序列和用戶個人的基因序列與"表現程度"與"基 因類別"聯系,將標準用例的基因序列和用戶個人的基因序列與"用戶"相聯系;每個用戶只 能訪問自己的基因庫,不能訪問其他用戶的用戶個人的基因序列和標準用例的基因庫;
[0046] 數據庫控制單元,對數據庫存儲單元進行添加、修改、刪除等操作;
[0047] 序列比對模塊包括:序列比對生成單元,用于用戶個人的基因序列與標準用例的 基因序列之間進行相似度比對,并提取將得到的相似度比對的結果進行返回,智能比對生 成包括以下步驟:
[0048] 步驟1:對參與比對的兩條序列對進行字母表劃分得到十個點位的特征向量;
[0049] 步驟2:通過十個點位的特征向量的數據期望的值,根據公式:
[0050] 通過標準用例的基因序列的標準數據期望的值1^進行計算,得出與用戶個人的基 因序列的特征差,記A h,并根據下列公式對典型亞健康的平均數據期望kave的值通過下列 公式生成序列第i點位的分值信息:
[0051]
[0052]其中e為自然常數;
[0053]通過得到的ai創建打分矩陣;
[0054]步驟3:根據得到的打分矩陣打分;
[0055] 步驟4:對由步驟3得到的高于一定閾值的參與比對的兩條序列對進行兩端延伸;
[0056] 步驟5:對由步驟4得到的高于一定閾值的參與比對的兩條序列對進行評估,得出 最后的尚分片段;
[0057] 計算統計單元,用于統計由步驟5得出的高分片段,并根據參與比對的參與比對的 兩條序列對的長度計算出相似度值;
[0058]用戶軟件平臺搜索其他用戶,并互相加為好友,則可以使用智能比拼模塊進行相 同類別基因的比拼。智能比拼模塊中的智能比對單元兩個用戶的相同類別的基因比對結果 進行比較,得出勝負,以智能比對結果友好地提示用戶的基因潛在患病的概率高低,引起用 戶自身的注意。
[0059] 在實際中智能比拼模塊具體包括:智能比對單元,用于用戶之間進行相同類型基 因的比拼,即以通過基因庫設備中各自帳戶里的用戶個人的基因序列與標準用例的基因序 列的比對值為比拼依據,按分值的高低分出勝負,從分數中得出勝者可能向該基因的表達 性狀發展趨勢更大,記為智能比對結果并記錄;
[0060] 健康分析模塊具體包括:健康分析單元,用于在用戶的各自帳戶里分析用戶個人 的基因序列與對應類別下全部程度的標準用例的基因序列的比對結果值,比對結果值的目 的是分析用戶的用戶個人的基因序列是否與某種亞健康類似,如果類似,記為A,并生成目 前用戶個人身體狀態要達到這種亞健康程序所需要的時間七和可能性μ以及這種亞健康通 常治療時間t 2,根據不同的用戶特征把類似A、tjPt2與這種亞健康進行進行映射,其映射公 式f(A)為:
[0061]
[0062] 從而得出用戶由某一類型基因決定的潛在的健康發展趨勢,并將潛在的健康發展 趨勢結果返回;
[0063] 健康分析模塊的健康分析單元分析用戶個人的基因序列與對應類別下全部程度 的標準用例的基因序列的比對結果值,得出用戶由該類型基因決定的潛在的健康發展趨 勢;指導建議單元專業的角度針對該結果給出合理的健康生活指導,以及日常生活建議。
[0064] 實施例2:如圖1所示,一種基于序列比對的趣味性健康分析裝置,包括基因庫服務 器,用于按不同類別、不同程度存儲標準用例的基因序列和用戶個人的基因序列;
[0065] 序列比對模塊,用于將用戶個人的基因序列與對應類別的標準用例的基因序列進 行相似度比對,并返回與每一種程度的標準用例的基因序列的相似度值;
[0066] 智能比拼模塊,用于用戶之間相同類別的基因序列與標準用例的基因序列的相似 度比拼;
[0067] 健康分析模塊,用于通過分析用戶的某一類別的基因序列與標準用例的基因序列 不同程度下的基因序列的相似度,得出用戶健康的發展趨勢,并給出健康指導以及日常生 活建議。
[0068] 首先技術使用方要通過基因存儲設備按照不同的亞健康選擇一定數量的足夠標 準用例患病人群,抽取血樣,進行基因測序。將得到的基因序列,按照不同的亞健康、不同的 表現程度上傳到基因庫服務器中。用戶取自己的血樣測序基因,并將自己的基因序列按照 相應分類上傳到自己的基因庫中。
[0069] 基因序列比對模塊將用戶上傳的基因序列與基因庫中相應分類的各個程度標準 基因序列使用智能比對序列比對生成進行比對。某一類別的亞健康下有多個表現程度,每 個表現程度下有多個基因序列,每個基因序列都與用戶基因序列比對,每個表現程度的多 個相似度結果求得平均值,每個表現程度的平均值再經過計算求得各自所占的比例,得出 每一種表現程度的概率作為最后結果統計出,并保存在用戶的數據庫中。
[0070] 用戶可以與好友進行智能比對比拼,兩個用戶的相同類別的基因比對結果進行比 較,得出勝負,以智能比對結果友好地提示用戶的基因潛在患病的概率高低,引起用戶自身 的注意。
[0071] 健康分析模塊分析用戶個人的基因序列與對應類別下全部程度的標準用例的基 因序列的比對結果值,得出用戶由該類型基因決定的潛在的健康發展趨勢,并以專業的角 度針對該結果給出合理的健康生活指導,以及日常生活建議。
[0072]本發明的有益效果是,可以利用先進的技術分析亞健康導致的基因序列變化的可 能性和用戶身體健康的發展趨勢,并給出合理的生活指導和日常生活建議,及時采取措施 預防和治療亞健康,為社會造福。
【主權項】
1. 一種智能比對的基因序列分析裝置,其特征在于,包括: 基因庫服務器,按照不同類別、不同程度存儲用戶個人的基因序列和標準用例的基因 序列; 序列比對模塊,用于將所述用戶個人的基因序列與相對應類別的所述標準用例的基因 序列進行相似度比對,并返回與標準用例的基因序列的相似度值; 智能比拼模塊,用于用戶之間相同類別的基因序列與所述標準用例的基因序列的相似 度比拼; 健康分析模塊,用于通過分析某一類別的所述用戶個人的基因序列與所述標準用例的 基因序列在不同程度下的基因序列的相似度,得出用戶亞健康的發展趨勢,并給出健康指 導W及日常生活建議; 所述基因庫服務器具體包括:數據庫存儲單元、數據庫控制單元; 所述數據庫存儲單元,用于存儲相互關聯的"用戶"、"基因類別"、"表現程度"信息,通 過合理的數據庫設計,將所述用戶個人的基因序列和所述標準用例的基因序列與所述"表 現程度"與所述"基因類別"聯系,將所述用戶個人的基因序列和所述標準用例的基因序列 與所述"用戶'相聯系;每個用戶只能訪問自己的基因庫,不能訪問基因庫服務器中其他用 戶的所述用戶個人的基因序列和標準用例的基因序列; 所述數據庫控制單元,對所述數據庫存儲單元進行添加、修改、刪除等操作; 所述序列比對模塊包括:序列比對生成單元,用于所述用戶個人的基因序列與所述標 準用例的基因序列之間進行相似度比對,并提取將得到的所述相似度比對的結果進行返 回,智能比對生成包括W下步驟: 步驟1:對所述參與比對的兩條序列對進行字母表劃分得到十個點位的特征向量; 步驟2:通過十個點位的特征向量的數據期望的值ki,根據公式: 通過對所述十個點位的特征向量的數據期望的值ki進行計算,得出與所述標準用例的 基因序列的標準數據期望的值kp的特征差,記Aki,并根據對所述用戶個人的基因序列的平 均數據期望kave的值通過下列公式生成序列第i點位的分值信息:其中e為自然常數; 通過得到的所述曰1創建打分矩陣; 步驟3:根據得到的所述打分矩陣打分; 步驟4:對由步驟3得到的高于一定闊值的所述參與比對的兩條序列對進行兩端延伸; 步驟5:對由步驟4得到的高于一定闊值的所述參與比對的兩條序列對進行評估,得出 最后的局分片段; 計算統計單元,用于統計由所述步驟5得出的高分片段,并根據參與比對的所述參與比 對的兩條序列對的長度計算出相似度值; 所述智能比拼模塊具體包括: 智能比對單元,用于用戶之間進行相同類型基因的比拼,即W各自帳戶里的所述用戶 個人的基因序列與所述標準用例的基因序列的比對值為比拼依據,按分值的高低分出勝 負,從分數中得出勝者可能向該基因的表達性狀發展趨勢更大,記為智能比對結果并記錄; 所述健康分析模塊具體包括: 健康分析單元,用于在用戶的各自帳戶里分析所述用戶個人的基因序列與對應類別下 全部程度的所述標準用例的基因序列的比對結果值,比對結果值的目的是分析用戶的所述 用戶個人的基因序列是否與某種亞健康的基因序列類似,如果類似,記為A,并生成目前用 戶個人身體狀態要達到運種亞健康程序所需要的時間ti和可能性μ, W及所述運種亞健康 通常持續時間t2,根據不同的用戶特征把所述類似Α、所述tl和t2與所述運種亞健康進行進 行映射,其映射公式f(A)為:從而得出用戶由某一類型基因決定的潛在的亞健康發展趨勢,并將所述潛在的亞健康 發展趨勢結果返回;由于所述用戶個人的基因序列受環境控制容易產生變化,可W將所述 映射公式f(A)為存儲在一個可W查詢的循環鏈表,用于序列表的匹配,如果發生個人基因 序列的異常狀態,便把結果發送給指導建議單元; 所述指導建議單元,用于針對健康分析單元所得出的結果,給出合理的健康生活指導, W及日常生活建議。
【文檔編號】G06F19/22GK105975811SQ201610301745
【公開日】2016年9月28日
【申請日】2016年5月9日
【發明人】管仁初, 賀冠楠, 梁艷春
【申請人】管仁初