一種利用神經網絡的高血壓預測方法
【專利摘要】本發明涉及醫療過程中依據個人的基本信息、健康信息進行高血壓患病預測【技術領域】,尤其是涉及一種利用神經網絡遺傳算法的高血壓預測方法。包括以下步驟:(1)找出影響高血壓的危險因素;(2)取出影響高血壓的健康調查數據;(3)確立真正影響高血壓的危險因素;(4)搜集這些危險因素的健康信息調查數據;(5)對數據進行篩選;(6)對合法數據進行標準化處理;(7)建立BP神經網絡的MLP(多層感知器)模型,通過該模型對個人是否患高血壓進行預測。(8)將預測結果與實際是否患有高血壓進行比值,得到該方法預測患高血壓概率大小和預測不患高血壓概率大小。其為老年人提前預防高血壓疾病提供科學依據,對高血壓做到早發現、早干預、早治療。
【專利說明】-種利用神經網絡的高血壓預測方法
【技術領域】
[0001] 本發明設及醫療過程中依據個人的基本信息、健康信息進行高血壓患病預測技術 領域,尤其是設及一種利用神經網絡遺傳算法的高血壓預測方法。
【背景技術】
[0002] 高血壓是全球重大可控性慢性疾病,已成為腦卒中、冠屯、病和屯、腎功能衰竭等的 主要原因。目前,我國高血壓患病率大于20%,患者超過2億,且發病率呈逐年上升趨勢,因 此,高血壓的防治是我國人口與健康領域面臨的重大問題。
[0003] 高血壓藥物療效正從群體化研究走向個體化研究,因此一個有效的預測模型為人 們藥物治療高血壓提供了科學的依據,也為建立一個健全合理的高血壓預測方案提供了研 究方向。對高血壓的早防早治、個體化藥物治療的療效具有十分重要的科學意義。目前,針 對高血壓患病預測的模型道路尚不明確,部分方法也不成熟。
【發明內容】
[0004] 本發明的目的在于避免現有技術的不足提供一種利用神經網絡的高血壓預測方 法,從而有效解決現有技術的問題。
[0005] 為實現上述目的,本發明采取的技術方案為;所述的一種利用神經網絡的高血壓 預測方法,其特點是包括如下步驟:
[0006] (1)根據人口統計學、人體測量學、行為信息等因素,首先確定了一些可能影響高 血壓患病的因素,該些因素在此定義為自變量,包括十=種;年齡、性別、身高、體重、婚姻 狀況、教育狀況、家庭年收入、鍛煉狀況、是否糖尿病、是否高血脂、抽煙是否超過100根、抽 煙、飲酒;同時確立一種因變量因素為高血壓;
[0007] (2)依據世界上最大的不間斷的調查系統BRFSS提供的健康信息數據,取出W上 相關因素的數據;
[000引 (3)將W上的收集到的數據導入SPSS軟件,選擇分析一一回歸一一二元 Logistic,將因變量選擇為高血壓,自變量選擇為其他十S種因素;
[0009] (4)依據二元Logistic回歸方法進行相關性分析,得到P值相關性分析;其結果 如下:
[0010]
【權利要求】
1. 一種利用神經網絡的高血壓預測方法,其特征是包括如下步驟: (1) 根據人口統計學、人體測量學、行為信息等因素,首先確定了一些可能影響高血壓 患病的因素,這些因素在此定義為自變量,包括十三種:年齡、性別、身高、體重、婚姻狀況、 教育狀況、家庭年收入、鍛煉狀況、是否糖尿病、是否高血脂、抽煙是否超過100根、抽煙、飲 酒;同時確立一種因變量因素為高血壓; (2) 依據世界上最大的不間斷的調查系統BRFSS提供的健康信息數據,取出以上相關 因素的數據; (3) 將以上的收集到的數據導入SPSS軟件,選擇分析--回歸--二元Logistic,將 因變量選擇為高血壓,自變量選擇為其他十三種因素; (4) 依據二元Logistic回歸方法進行相關性分析,得到P值相關性分析得到抽煙的P 值為〇. 27,其它因素的P值為0 ;依據P值小于0. 05具有統計學意義,故而排除了"抽煙" 對高血壓的影響;其中自變量"抽煙是否超過100根"由于接近常值被剔除; (5) 依據上述分析得到了影響高血壓患病的因素為十一種:年齡,性別,身高,體重,婚 姻狀況,教育狀況,家庭年收入,鍛煉狀況,糖尿病,高血脂,飲酒,篩選出了影響高血壓的 十一種因素; (6) 對影響高血壓因素的數據進行采集,其方法是:通過電話訪問方式對老年人基本 信息進行收集;通過現場讓老年人填寫調查問卷形式收集;老年人登錄自己的百合智慧養 老云平臺,完善個人基本健康信息; (7) 將第六步驟中收集到的數據都是通過具體的數字形式存儲在后臺數據庫;如果數 據填寫未完整,視為無效數據; (8) 刪除無效數據后,對剩余數據進行標準化處理,當各個指標間的水平相差很大時, 如果直接使用原始指標值進行分析,就會突出數值較高的指標在綜合分析中的作用,相對 削弱數值水平較低指標的作用,為了保證結果可靠性,對原始數據進行標準化處理,此處將 數據標準化處理在[〇, 1]之間; (9) 建立按誤差逆向傳播算法訓練的多層前饋網絡的神經網絡模型,依據上述數據進 行高血壓預測,該模型分為輸入層、隱含層、輸出層,該模型輸入層個數為InCode = 11,包 括篩選出的影響高血壓的i^一種因素,隱含層個數為HideCode = 2*InCode+l = 23,輸出 層個數為 OutCode = 1,學習速率為 Study_Efficient = 0? 01,運行次數 Echo_Num = 200, 判斷精度Precision = 0. 5 ;預測過程中的變量參數定義為,輸入層到隱含層的權值W_I_ H、隱含層到輸出層的權值W_H_0、隱含層的閾值Bias_H、輸出層的閾值Bias_0進行定義到 [_1,1]之間; (10) 通過計算隱含層的純輸入、輸出,輸出層的純輸入和輸出、輸出層的誤差、隱含 層的誤差,將這些參數反饋到神經網絡,將權值更新為W_RefreSh,將閾值更新為Bias_ Refresh,最后將輸入層到隱含層的權值以及隱含層到輸出層的權值更新為saveWV ;依據 輸出層最終輸出值為R作為判斷,根據R〈〇. 5為患有高血壓,R>0. 5為不患高血壓。統計預 測出正確患高血壓人數的個數Numl,以及預測出正確不患高血壓人數的個數Num2,分別與 數據集中的患高血壓人數與不患高血壓人數進行比值,得到該方法正確預測患高血壓的準 確率和正確預測不患高血壓的準確率。
【文檔編號】G06F19/00GK104504297SQ201510028877
【公開日】2015年4月8日 申請日期:2015年1月21日 優先權日:2015年1月21日
【發明者】安寧, 頡云華, 汪泳, 李璞 申請人:甘肅百合物聯科技信息有限公司