分析系統以及保健事業支援方法
【專利摘要】一種分析系統及保健事業支援方法,高精度地預測有關系的將來的現象。具備:因果/轉移構造計算部,基于醫療信息和體檢信息制作圖形構造,將制作的圖形構造保存到數據庫,該圖形構造包含與病態及關于病態的發病概率變量對應的病態節點、與表示對病態的變化產生影響的因子的因子概率變量對應的因子節點以及在病態節點與因子節點之間由有向邊或無向邊定義的概率依賴性;節點生成部,制作概率變量的現象空間;概率表計算部,計算圖形構造的附條件概率;模型重構部,利用由所指定的概率變量構成的圖形構造、現象空間以及附條件概率重構模型;病態轉移/醫療費預測部,預測病態轉移概率和醫療費;以及保健指導支援部,選定保健指導的對象者和保健指導內容。
【專利說明】分析系統以及保健事業支援方法
【技術領域】
[0001]本發明涉及一種數據分析技術,特別是涉及一種對醫療數據進行分析的保健事業支援系統。
【背景技術】
[0002]健康保險組合為了降低醫療費而進行著實施用于生活習慣病的預防和重癥化的預防的保健指導的保健事業。但是,為保健指導所能夠確保的保健師以及用于保健指導的費用等資源有限。因此,期望支援有效且高效的保健事業的運營的系統。
[0003]作為支援保健事業的運營的方法,專利文獻I中記載了如下保健事業支援系統:該保健事業支援系統基于診療費用賬單信息、體檢信息以及保健指導信息選擇保健指導對象者,該保健事業支援系統具備:醫療費模型制作部,制作表示針對每個健康保險加入者的重癥度和檢查值的預測醫療費的醫療費模型;檢查值改善模型制作部,制作表示針對每個重癥度和檢查值的改善量的檢查值改善模型;預測醫療費削減效果計算部,針對每個重癥度和檢查值計算保健指導所帶來的預測醫療費削減量;以及對象者選擇部,選擇屬于預測醫療費削減量高的重癥度和檢查值的健康保險加入者作為保健指導對象者。
[0004]專利文獻1:日本特開2012-128670號公報
[0005]為了在健康保險組合的資源中進行有效且高效的保健事業,需要選擇優先實施保健指導的對象者。另外,保健指導的內容也需要選擇適于各個對象者的內容。
[0006]在專利文獻I中,在預測醫療費時,基于當前的重癥度和檢查值預測將來的醫療費。例如基于當前的糖尿病的重癥度和血糖值預測將來的糖尿病的重癥度,將該重癥度的平均的醫療費作為預測醫療費。
[0007]但是,關于對于將來的醫療費和重癥度的預測有效的因子(在糖尿病中為血糖值),需要作為事前知識通過人工進行設定。另外,重癥度的定義也需要通過人工進行設定。
[0008]關于對于將來的醫療費的預測有效的因子,除了血糖值以外,還考慮年齡、性別、其它檢查值、藥品的處方狀況以及生活習慣等各種因子,通過考慮它們,能夠進行精度更高的預測。但是,難以通過人工列出這些因子。另外,需要針對每個疾病根據事前知識設定這些因子。因此,難以針對所有疾病進行分析。
【發明內容】
[0009]示出在本申請中公開的發明的代表性一例則如下。即,一種分析系統,具有執行程序的處理器以及保存所述程序的存儲器,通過執行所述程序來對醫療數據進行分析,該分析系統的特征在于,所述分析系統能夠訪問包含醫療信息、費用信息及體檢信息的數據庫,所述醫療信息包含加入者的傷病名和對所述加入者進行的醫療行為,所述費用信息為所述醫療行為的費用信息,所述體檢信息包含所述加入者的健康診斷的檢查值,所述分析系統具備:因果/轉移構造計算部,所述處理器基于所述醫療信息和所述體檢信息制作圖形構造,將所述制作的圖形構造保存到所述數據庫,其中,該圖形構造包含與病態及關于所述病態的發病概率變量對應的病態節點、與表示對所述病態的變化產生影響的因子的因子概率變量對應的因子節點、以及在所述病態節點與所述因子節點之間由有向邊或無向邊定義的概率依賴性;節點生成部,所述處理器基于所述醫療信息和所述體檢信息,制作所述發病概率變量和所述因子概率變量的現象空間,將所述制作的現象空間保存到所述數據庫;概率計算部,所述處理器基于所述醫療信息、所述體檢信息以及所述現象空間,計算所述圖形構造的附條件概率,將所述計算的附條件概率保存到所述數據庫;模型重構部,所述處理器基于由所述圖形構造、所述現象空間以及所述附條件概率構成的模型,利用由所指定的概率變量構成的圖形構造、現象空間以及附條件概率重構模型,將所述重構的模型保存到所述數據庫;病態轉移/醫療費預測部,所述處理器基于所述醫療行為的費用信息和所述重構的模型,預測病態轉移概率和醫療費;以及健康指導支援部,所述處理器基于所述預測的病態轉移概率和醫療費,選定健康指導的對象者和健康指導內容。
[0010]發明效果
[0011]根據本發明的代表性實施方式,能夠基于各種數據高精度地預測有關系的將來的現象。前述以外的問題、結構以及效果會通過以下的實施例的說明而變得清楚。
【專利附圖】
【附圖說明】
[0012]圖1是表示第I實施例的醫療數據分析系統的結構的框圖。
[0013]圖2是表示第2實施例的分析系統的結構的框圖。
[0014]圖3是表示第I實施例的醫療數據分析系統的其它結構的框圖。
[0015]圖4是表示第I實施例的醫療數據分析系統的其它結構的框圖。
[0016]圖5是表示第I實施例的醫療數據分析系統的其它結構的框圖。
[0017]圖6是說明第I實施例的診療費用賬單基本信息的圖。
[0018]圖7是說明第I實施例的體檢信息的圖。
[0019]圖8是說明第I實施例的問診信息的圖。
[0020]圖9是說明第I實施例的傷病名信息的圖。
[0021]圖10是說明第I實施例的傷病名分類信息的圖。
[0022]圖11是說明第I實施例的診療行為信息的圖。
[0023]圖12是說明第I實施例的診療行為分類信息的圖。
[0024]圖13是說明第I實施例的藥品信息的圖。
[0025]圖14是說明第I實施例的藥品分類信息的圖。
[0026]圖15是說明第I實施例的整形信息的一例的圖。
[0027]圖16是說明第I實施例的整形信息的另一例的圖。
[0028]圖17是說明由兩個概率變量構成的模型和概率變量的圖。
[0029]圖18是說明由三個概率變量構成的模型和概率變量的圖。
[0030]圖19是說明作為貝葉斯網絡的模型的圖。
[0031]圖20是說明第I實施例的因果/轉移構造計算部的處理的圖。
[0032]圖21是說明今年和下一年的醫療行為的節點的模型的圖。
[0033]圖22是說明今年的醫療行為、檢查值以及生活習慣與下一年的醫療行為的節點的模型的圖。
[0034]圖23A是說明因果/轉移關系的邊沿的圖。
[0035]圖23B是說明因果/轉移關系的邊沿的圖。
[0036]圖23C是說明因果/轉移關系的邊沿的圖。
[0037]圖24是說明第I實施例的節點離散化處理中的事例數的變化的圖。
[0038]圖25是第I實施例的節點離散化處理的流程圖。
[0039]圖26是說明第I實施例的節點的匯集化的圖。
[0040]圖27是第I實施例的節點匯集化處理的流程圖。
[0041]圖28是說明第I實施例的節點匯集化處理中的事例數的變化的圖。
[0042]圖29是第I實施例的節點離散化處理的流程圖。
[0043]圖30是說明第I實施例的節點信息存儲部中存儲的信息的例子的圖。
[0044]圖31是說明第I實施例的節點的匯集化的圖。
[0045]圖32是說明第I實施例的因果轉移模型存儲部中存儲的信息的例子的圖。
[0046]圖33是說明第I實施例的模型重構部的處理的圖。
[0047]圖34A是第I實施例的面向健康保險事業者的支援功能的處理的流程圖。
[0048]圖34B是第I實施例的面向擔當者/對象者的支援功能的處理的流程圖。
[0049]圖35是說明以糖尿病為對象來簡化的模型的圖。
[0050]圖36是說明具有有向邊沿的路徑的模型的圖。
[0051]圖37是說明第2實施例中處理的數據的圖。
[0052]圖38A是說明預測具有圖23A所示的邊沿的下一年的醫療費的模型的圖。
[0053]圖38B是說明預測具有圖23B所示的邊沿的下一年的醫療費的模型的圖。
[0054]圖38C是說明預測具有圖23C所示的邊沿的下一年的醫療費的模型的圖。
[0055]附圖標記說明
[0056]101:醫療數據分析裝置
[0057]102:輸入部
[0058]103:輸出部
[0059]104:運算裝置
[0060]105:存儲器
[0061]106:存儲介質
[0062]107:數據整形部
[0063]108:病態因果/轉移模型制作部
[0064]109:因果/轉移構造計算部
[0065]110:節點生成部
[0066]111:概率表計算部
[0067]112:發病概率/醫療費預測部
[0068]113:模型重構部
[0069]114:病態轉移概率/醫療費預測部
[0070]115:保健指導支援部
[0071]116:數據庫
[0072]117:醫療信息存儲部
[0073]118:整形信息存儲部
[0074]119:因果轉移模型存儲部
[0075]120:節點信息存儲部
[0076]121:重構模型存儲部
[0077]122:預測結果存儲部
[0078]201:數據分析裝置
[0079]202:輸入部
[0080]2O3:輸出部
[0081]204:運算裝置
[0082]205:存儲器
[0083]206:存儲介質
[0084]207:圖形模型制作部
[0085]208:圖形模型構造計算部
[0086]209:節點生成部
[0087]210:概率表計算部
[0088]211:預測部
[0089]212:簡易圖形模型重構部
[0090]213:概率推斷部
[0091]214:數據庫
[0092]215:表形式信息存儲部
[0093]216:圖形模型存儲部
[0094]217:節點信息存儲部
[0095]218:重構模型存儲部
[0096]219:預測結果存儲部
【具體實施方式】
[0097]<實施例1>
[0098]在第I實施例中,說明為了疾病的發病預防和重癥化預防而基于醫療數據(例如診療費用賬單信息、體檢信息、問診信息)選擇保健指導的對象者、建議保健指導方法并預測保健指導效果的醫療數據分析系統的例子。
[0099]診療費用賬單信息是記錄了在健康保險的加入者接受了醫療機關的診斷時的傷病名、所處方的藥品、被實施的診療行為以及醫療費(分數)的信息,使用圖6說明其一例。此外,將所處方的藥品以及被實施的診療行為統稱為醫療行為。
[0100]另外,體檢信息是存儲了在健康保險的加入者接受了健康診斷的情況下的檢查值的信息,后面使用圖7說明其一例。問診信息是存儲了在健康保險的加入者接受了健康診斷的情況下的生活習慣、既往病歷、自覺癥狀等問診結果的信息,后面使用圖8說明其一例。
[0101]在第I實施例中,基于醫療數據,將疾病的因果關系和病態的轉移構造模型化。然后,基于該模型提供保健指導對象者的選擇、保健指導方法的建議、保健指導效果的預測等各種功能。
[0102]圖1是表示第I實施例的醫療數據分析系統的結構的框圖。另外,圖3、圖4以及圖5是表示第I實施例的醫療數據分析系統的其它結構的框圖。
[0103]第I實施例的醫療數據分析系統具有醫療數據分析裝置101和數據庫116。
[0104]醫療數據分析裝置101具有輸入部102、輸出部103、運算裝置104、存儲器105以及存儲介質106。
[0105]輸入部102是鼠標、鍵盤等人機接口,受理對醫療數據分析裝置101的輸入。輸出部103是輸出由醫療數據分析系統得到的運算結果的顯示器、打印機。存儲介質106是保存用于實現由醫療數據分析系統進行的醫療數據分析處理的各種程序以及醫療數據分析處理的執行結果等的存儲裝置,例如是非易失性存儲介質(磁盤驅動器、非易失性存儲器等)。存儲器105中展開存儲介質106中保存的程序。運算裝置104是執行被加載到存儲器105的程序的運算裝置,例如是CPU、GPU等。以下說明的處理和運算是由運算裝置104執行的。
[0106]第I實施例的醫療數據分析系統既可以是由一個計算機構成的計算機系統,也可以是由服務器和客戶終端構成的計算機系統。另外,醫療數據分析裝置101的數據整形部107、病態因果/轉移模型制作部108、發病概率/醫療費預測部112也可以如圖3、圖4、圖5所示那樣由不同的裝置構成。在該情況下,圖3、圖4所示的裝置基于醫療數據制作模型。圖5所示的裝置提供制作用于基于所制作的模型進行各種保健指導的信息的保健指導支援功能。用戶使用圖5所示的裝置。用戶所使用的圖5的裝置不需要保持作為模型制作的基礎的醫療數據,因此對于個人信息的隱匿以及泄漏的防止有效。
[0107]醫療數據分析系統是在一個計算機上或在邏輯上或物理上構成的多個計算機上構成的計算機系統,既可以在同一計算機上在不同的線程中動作,也可以在構建于多個物理計算機資源上的虛擬計算機上動作。
[0108]由運算裝置104執行的程序經由可移動介質(⑶-ROM、快閃存儲器等)或網絡被提供至各服務器,被保存到作為非臨時性存儲介質的非易失性存儲裝置。因此,計算機系統最好具有讀取可移動介質的接口。
[0109]首先,說明第I實施例中處理的醫療數據。
[0110]醫療信息存儲部117保存被輸入到輸入部102的醫療數據。醫療數據包含診療費用賬單信息、體檢信息以及問診信息。診療費用賬單信息包含診療費用賬單基本信息、傷病名信息、診療行為信息、藥品信息、傷病名分類信息、診療行為分類信息以及藥品分類信息。
[0111]接著,說明診療費用賬單信息。
[0112]圖6是說明診療費用賬單基本信息601的圖。
[0113]診療費用賬單基本信息601是保持診療費用賬單與健康保險的加入者的對應關系的信息。診療費用賬單基本信息601包含搜索號602、健康保險加入者ID603、性別604、年齡605、診療年月606以及合計分數607。
[0114]搜索號602是用于唯一地識別診療費用賬單的標識符。健康保險加入者ID603是用于唯一地識別健康保險的加入者的標識符。性別604和年齡605是該加入者的性別和年齡。
[0115]診療年月606是加入者接受了醫療機關的診斷的年和月。合計分數607是表示一件診療費用賬單的合計分數的信息。此外,若對合計分數相乘“10”則計算出醫療費(日元)。此外,在圖9所示的傷病名信息901中的多個傷病名被登記在一個搜索號的情況下,在合計分數607中登記對于多個傷病的醫療行為的合計分數。
[0116]圖9是說明傷病名信息901的圖。
[0117]傷病名信息901包含搜索號602、傷病名碼902、傷病名903。
[0118]搜索號602是用于唯一地識別診療費用賬單的標識符,使用與診療費用賬單基本信息601的搜索號(圖6)相同的號。傷病名碼902是記載在診療費用賬單中的傷病名碼。傷病名903是與該傷病名碼對應的傷病的名稱。
[0119]此外,一件診療費用賬單中能夠記載多個傷病名。例如在圖9所示的傷病名信息901中,搜索號602為“11,,的入口的傷病名903是“糖尿病”和“高血壓”,搜索號為“ 11”的診療費用賬單中記載有糖尿病和高血壓的傷病名。
[0120]圖10是說明傷病名分類信息的圖。
[0121]傷病名分類信息1001是使傷病分類與屬于該傷病分類的傷病名相對應的信息,包含傷病分類1002、傷病名碼902、傷病名903以及并發癥有無1003。
[0122]傷病分類1002是該傷病所屬的分類。傷病名碼902是診療費用賬單中記載的傷病名碼,使用與傷病名信息901的傷病名碼902 (圖9)相同的號。傷病名903是與該傷病名碼對應的傷病的名稱,使用與傷病名信息901的傷病名903 (圖9)相同的名稱。并發癥有無1003表示該傷病是否為并發癥的傷病名。
[0123]圖11是說明診療行為信息的圖。
[0124]診療行為信息1101包含搜索號602、診療行為碼1102、診療行為名1103以及診療行為分數1104。
[0125]搜索號602是用于唯一地識別診療費用賬單的標識符,使用與診療費用賬單基本信息601的搜索號(圖6)相同的號。診療行為碼1102是用于唯一地識別診療費用賬單中記載的診療行為的標識符。診療行為名1103是與該診療行為碼對應的診療行為的名稱。診療行為分數1104是該診療行為的保險分數。
[0126]在圖11中,例如在搜索號602為“11”的診療費用賬單中記載有“診療行為A”和“診療行為C”的診療行為名1103。
[0127]圖12是說明診療行為分類信息的圖。
[0128]診療行為分類信息1201包含傷病分類1002、診療行為碼1102以及診療行為名1103。
[0129]傷病分類1002使用與傷病名分類信息1001的傷病分類1002(圖10)相同的分類。診療行為碼1102是識別根據傷病分類1002的傷病進行的診療行為的診療行為碼,使用與診療行為信息1101的診療行為碼1102(圖11)相同的碼。診療行為名1103是與該診療行為碼對應的診療行為的名稱,使用與診療行為信息1101的診療行為名1103(圖11)相同的碼。
[0130]圖13是說明藥品/[目息的圖。
[0131]藥品信息1301包含搜索號602、藥品碼1302、藥品名1303以及藥品分數1304。
[0132]搜索號602是用于唯一地識別診療費用賬單的標識符,使用與診療費用賬單基本信息601的搜索號602 (圖6)相同的號。藥品碼1302是用于唯一地識別診療費用賬單中記載的藥品的藥品碼。藥品名1303是診療費用賬單中記載的藥品的名稱。藥品分數1304是藥品的保險分數。
[0133]在圖13中,例如搜索號602為“11”的診療費用賬單記載有糖尿病口服藥A和高血壓口服藥A的藥品名。
[0134]圖14是說明藥品分類信息的圖。
[0135]藥品分類信息1401包含傷病分類1002、藥品碼1302以及藥品名1303。
[0136]傷病分類1002使用與傷病名分類信息1001的傷病分類1002(圖10)相同的分類。藥品碼1302是識別根據傷病分類1002中登記的分類所處方的藥品的藥品碼,使用與藥品信息1301的藥品碼1302(圖13)相同的碼。藥品名1303是與該藥品碼對應的藥品的名稱,使用與藥品信息1301的藥品名1303(圖13)相同的名稱。
[0137]此外,將圖11所示的診療行為信息1101和圖13所示的藥品信息統稱為醫療行為信息。另外,將圖12所示的診療行為分類信息1201和圖14所示的藥品分類信息統稱為醫療行為分類信息。
[0138]接著,說明體檢信息。
[0139]圖7是說明體檢信息的圖。
[0140]體檢信息701是用于管理多個加入者的多年的體檢信息的信息,包含健康保險加入者ID603、體檢受診日702以及健康診斷中的各種檢查值(例如、BMI703、腰圍704、空腹時血糖705、收縮期血壓706、中性脂肪707)。
[0141]健康保險加入者ID603是接受了健康診斷的健康保險的加入者的標識符,使用與診療費用賬單基本信息601的健康保險加入者ID603(圖6)相同的標識符。體檢受診日702是接受了健康診斷的年月日。BMI703至中性脂肪707是健康診斷的檢查的結果。
[0142]存在未接受特定的檢查的情況等體檢信息的數據欠缺的情況。例如在圖7中,健康保險加入者ID “K0004”在2004年受診的檢查項目中的收縮期血壓706的數據欠缺。
[0143]接著,說明問診信息。
[0144]圖8是說明問診信息的圖。
[0145]問診信息801是用于管理多個加入者的多年的問診信息的信息,包含健康保險加入者ID603、問診受診日802以及問診的回答(例如煙803、飲酒804、步行805)。此外,問診也可以包含生活習慣、既往病歷、過敏等體質、自覺癥狀等。
[0146]健康保險加入者ID603是接受了問診的健康保險的加入者的標識符,使用與診療費用賬單基本信息601的健康保險加入者ID603(圖6)相同的標識符。問診受診日802是接受了問診的年月日。煙803至步行805是問診的結果。煙803在有吸煙習慣的情況下是一日的平均吸煙根數,在不吸煙的情況下是“無”。飲酒804在有飲酒習慣的情況下是一日的平均飲酒量(單位=ml),在沒有飲酒習慣的情況下是“無”。步行805是一日的平均步行時間(單位=分鐘)。
[0147]此外,在問診信息中,也有時無法得到步數、飲酒量、吸煙根數等詳細的信息。有時不是具體的飲酒量,而是對預先在問診表中區分的頻度中所符合的頻度進行回答。例如是在只得到有無吸煙、飲酒的信息的情況下將飲酒的頻度分為幾個程度(例如、(I)不飲酒、
(2)—周I?2次、(3) —周3次以上)來進行回答的情況等。在該情況下,問診信息的值是沒有定量的含義的號。
[0148]在不存在對于特定的項目的回答的情況下,有時問診信息的數據欠缺。例如在圖8中,健康保險加入者ID “K0003”在2004年受診的問診項目中對于步行805的數據欠缺。
[0149]接著,說明數據整形部107的處理。數據整形部107根據醫療信息存儲部117中存儲的醫療數據對每個加入者的每個期間的診療費用賬單信息、體檢信息以及問診信息進行總計/合并,整形為表形式。下面,將一個期間設為I年來進行說明,但是也可以是半年、2年、3年等其它期間。
[0150]圖15是說明整形信息1501的一例的圖。使用圖15說明數據整形部107的處理。
[0151]整形信息1501包含對2004年的診療費用賬單信息進行整形所得的診療費用賬單整形信息。整形信息1501的各行是對與一個健康保險加入者ID對應的一年的數據進行總計所得的。
[0152]健康保險加入者ID603、性別604、年齡605以及合計分數607分別與診療費用賬單基本信息601的健康保險加入者ID603、性別604、年齡605以及合計分數607 (圖6)相同。數據年1502是成為制作該整形信息的基礎的數據的年。
[0153]傷病名碼10(1503)是該健康保險加入者ID的診療費用賬單中傷病名碼為10的診療費用賬單的數量。傷病名碼20 (1504)也同樣地是該健康保險加入者ID的診療費用賬單中傷病名碼為20的診療費用賬單的數量。診療行為碼1000(1505)是該健康保險加入者ID的診療費用賬單中進行了診療行為碼為1000的診療行為的診療費用賬單的數量。藥品碼110(1506)是該健康保險加入者ID的診療費用賬單中處方了藥品碼為110的藥品的診療費用賬單的數量。
[0154]關于數據整形部107的處理,具體說明對2004年的數據進行整形的情況。
[0155]首先,選擇一個健康保險加入者ID。從診療費用賬單基本信息601獲取診療年月為2004年的該健康保險加入者ID的診療費用賬單的搜索號。接著,參照傷病名信息901,針對每個傷病名碼對記載有該傷病名碼的診療費用賬單的數量進行計數。由此,得到各傷病名碼的診療費用賬單的數量。同樣地,參照診療行為信息1101,對每個診療行為碼的診療費用賬單的數量進行計數,參照藥品信息1301,對每個藥品碼的診療費用賬單的數量進行計數。由此,生成所選擇的健康保險加入者ID的2004年的數據行。對作為分析對象的所有健康保險加入者ID與年的組合進行該處理。
[0156]例如在圖15所示的整形信息1501中,第I行的健康保險加入者ID “K0001”的2004年的數據能夠從搜索號為“11” “12” “13”的診療費用賬單基本信息601獲取。當參照傷病名信息901時,這三個診療費用賬單中傷病名碼為“10”的診療費用賬單是搜索號“11”和“13”這兩個。因而,在整形信息1501的第I行傷病名碼10的欄中登記有2。
[0157]圖15所示的整形信息1501還包含從體檢信息整形得到的體檢整形信息。各行是對與一個健康保險加入者ID對應的數據進行總計所得的。
[0158]各項目的值是健康保險加入者ID603和數據年1502所示的加入者和年的體檢數據的值。該體檢數據能夠從體檢信息701獲取。在體檢信息701包含同一健康保險加入者ID的同一年的體檢數據的情況下,既可以使用某一個受診日的數據,也可以使用該年的多次體檢結果的平均。在使用一個受診日的數據的情況下,可以使用每年幾乎相同時期實施的同時體檢日的數據。另外,也可以選擇缺失少的數據。缺失數據使用預先確定的表示缺失的數值。在圖15所示的例子中使用了 -1。此外,設沒有問診信息的加入者的值全部為缺失數據。
[0159]圖15所示的整形信息1501還包含從問診信息整形所得的問診整形信息。各行是對與一個健康保險加入者ID對應的數據進行總計所得的。
[0160]各項目的值是健康保險加入者ID603和數據年1502所示的加入者和年的問診數據的值。該問診數據能夠從問診信息801獲取。在問診信息801包含同一健康保險加入者ID的同一年的問診數據的情況下,既可以使用某一個受診日的數據,也可以使用該年的多次問診結果的平均。在使用一個受診日的數據的情況下,可以使用每年幾乎相同的時期實施的同時體檢日的數據。或者,也可以選擇缺失少的數據。缺失數據使用預先確定的表示缺失的數值。在圖15所示的例子中使用了 -1。此外,設沒有體檢信息的加入者的值全部為缺失數據。
[0161]通過以上的處理,能夠生成診療費用賬單整形信息、體檢整形信息以及問診整形信息。此外,圖15中僅示出了 2004年的數據,但是還制作其它年的整形數據。
[0162]在此,在制作診療費用賬單整形信息時,也可以匯總類似的項目來合并多個項目。例如在藥品的項目中糖尿病口服藥A的功能與糖尿病口服藥B的功能類似的情況下,也可以將它們匯總來視為一個項目進行處理。此時,將使同一年度的糖尿病口服藥A的處方次數與糖尿病口服藥B的處方次數相加所得的值設為新匯總的項目的值。用于判斷項目是否類似的基準可以設為如下。將診療行為分類信息1201中屬于同一傷病分類的診療行為名設為類似項目。另外,將藥品分類信息1401中屬于同一傷病分類的藥品名設為類似項目。另外,預先通過人工制作類似項目信息。
[0163]圖16是說明將診療費用賬單整形信息的傷病名碼10與傷病名碼20合并所得的整形信息1501的例子的圖。傷病名碼1601的值是將圖15的傷病名碼1503的值與傷病名碼1504的值相加所得的值,是傷病名碼為“10”的診療費用賬單的數量與傷病名碼為“20”的診療費用賬單的數量的合計。
[0164]圖15、圖16所示的所制作的診療費用賬單整形信息、體檢整形信息以及問診整形信息由數據庫116的整形信息存儲部118存儲。整形信息1501是表形式的數值數據。
[0165]此外,診療費用賬單整形信息的值是以診療費用賬單的數量、即處方次數進行總計所得的,但是也可以是有無處方的信息。即,也可以將處方次數為I以上的(有處方)情況匯總為1,將處方次數為O的(無處方)的情況設為0,以2值來表示。另外,也可以認為處方次數表示重癥度,診療費用賬單整形信息的值是將處方次數分類為等級的值。例如,也可以將處方次數為O次的情況設為0,將處方次數為I?4次的情況設為1,將處方次數為5次以上的情況設為2等以3等級來表示。
[0166]在前述的例子中,以每I年的期間對診療費用賬單信息、體檢信息以及問診信息進行了匯總,但是例如也可以是每2年、每3年等不同的期間。此外,下面,以每I年的期間進行匯總的情況為例進行說明。
[0167]接著,說明病態因果/轉移模型制作部108。
[0168]病態因果/轉移模型制作部108具有因果/轉移構造計算部109、節點生成部110以及概率表計算部111。病態因果/轉移模型制作部108使用整形信息存儲部118中存儲的整形信息,制作利用圖形模型表示疾病的因果和病態的轉移的模型。
[0169]能夠利用病態因果/轉移模型并根據某年(X年)的個人的健康診斷、問診、診療費用賬單數據計算以后的年(X+n年)的醫療費的期待值,能夠預測發病概率。另外,能夠計算X年處于特定狀態的集(例如血糖值處于某范圍的集)的下一年的醫療費的期待值,能夠預測疾病的發病概率。此外,以下說明下一年(η = I的情況)的醫療費、疾病的狀態的預測,但是也可以預測2年后、3年后等其它期間后。
[0170]此時,模型制作中至少需要隔著η年的年所獲取的醫療數據。例如在η = 3的情況下,需要如2004年和2007年的醫療數據等那樣隔著3年的年所獲取的醫療數據。下面,設醫療信息存儲部117中存儲有隔著η年的年所獲取的醫療數據,由數據整形部107根據該醫療數據制作的整形信息被存儲在整形信息存儲部118中,來進行說明。
[0171]病態因果/轉移模型制作部108使用整形信息存儲部118中存儲的整形信息制作表示疾病的因果關系和病態的轉移的模型。
[0172]首先,簡單說明圖形模型。
[0173]圖形模型是由節點和邊沿構成的模型,節點表示概率變量,邊沿表示節點間(概率變量間)的依賴關系。邊沿中有有向邊和無向邊這兩種。
[0174]現在,考慮兩個概率變量X1、Χ2。
[0175]在圖17(A)所示的構造1701中,利用圓形表示兩個概率變量X1、Χ2,利用箭頭表示從Xl向Χ2的有向邊。有向邊表示概率變量Χ2取各狀態的概率依賴于概率變量Xl的狀態。即,通過附條件概率P (Χ2 IXI)提供概率變量Χ2的各狀態的概率。將概率變量Xl稱為概率變量Χ2的母體,將概率變量Χ2稱為概率變量Xl的子樣。
[0176]概率變量Xl中沒有母節點,因此通過事前概率P(Xl)提供Xl的概率分布。因而,通過Ρ(Χ1,Χ2) = P(Xl)P(Χ2 IXI)提供X1、Χ2的聯合概率分布。X1、Χ2均取1、2、3這三個值(狀態)。此時,為了表現,只要存在概率分布P(Xl)和概率分布Ρ(Χ2|Χ1)即可。概率分布P (Xl)和概率分布P (Χ2 IXI)分別由概率表1702和概率表1703來表示(參照圖17 (B)、圖17(C))。a1、aij是概率值,因此是O以上且I以下的實數值。該概率值例如表示P(X1=2) = a2、P(X2 = 3|X1 = 2) = a23 等。概率值為 Sai = I (Σ 是關于 i 的和)、Xaij=1(Σ是關于j的和)。
[0177]在圖17⑶所示的構造1704中,兩個概率變量Xl和X2由無向邊來連接。無向邊表示概率變量間不獨立。概率變量Xl與X2獨立是指,Xl與X2的聯合分布P (XI,X2)能夠分解為 P (XI,X2) =P (Xl) P (X2)。概率表 1702 表示 P (XI,X2) ^ P (Xl) P (X2)的狀況。其中,在不清楚概率變量Xl與X2是否獨立的情況下,考慮在概率變量間具有依賴性的可能性,有時如構造1704那樣表現。該概率分布由概率表1705來表示(參照圖17(E))。bij是O以上且I以下的實數值,Sbij = I (Σ是關于i和j這兩者的和)。
[0178]由此,能夠表現概率變量間的依賴關系。
[0179]在第I實施例中,節點(概率變量)是從X年的整形信息的項目和X+n年的整形信息的項目中選擇的。例如,圖15的X年的傷病名碼10、X年的BM1、X年的吸煙、X+n年的傷病名碼10、X+n年的BM1、X+n年的吸煙等成為節點。這些對應于診療費用賬單信息、體檢信息、問診信息的項目或者將診療費用賬單信息的多個項目合并所得的項目。
[0180]關于這些項目的數量,例如在將診療費用賬單的項目限定為與糖尿病關聯而考慮診療費用賬單、健康診斷、問診的情況下為數百?數千左右,在考慮所有診療費用賬單項目、所有體檢項目、所有問診項目的情況下為數十萬個。也就是說,節點數為數百以上,多的情況下為數十萬。
[0181]在病態因果/轉移模型制作部108中,使用根據過去的診療費用賬單信息、體檢信息以及問診信息制作的整形信息制作用于根據某年的加入者的診療費用賬單信息、體檢信息以及問診信息預測η年后的該加入者的疾病的發病概率、醫療費等的模型。此時,至少需要η年相當的過去的整形信息。例如在η = 3的情況下,使用2004年和2007年這兩年的過去的整形信息制作預測3年后的疾病發病概率和醫療費的模型。然后,在當前為2008年且被提供了某加入者的診療費用賬單信息、體檢信息以及問診信息的全部或一部分數據的情況下,能夠預測該加入者的2011年的發病概率和醫療費等。
[0182]圖35是說明以糖尿病為對象來簡化的模型的圖。
[0183]圖35所示的模型是用于根據X年的糖尿病口服藥、胰島素的處方狀況以及血糖值預測X+n年的糖尿病口服藥和胰島素制劑的處方狀況的模型。例如,通過X年的糖尿病口服藥、胰島素制劑的處方狀況以及血糖值的附條件概率提供X+n年的糖尿病口服藥的處方狀況。病態因果/轉移模型制作部108根據整形信息自動制作邊沿和附條件概率。在預測時,基于該模型對X年的節點設定當前的值,能夠求出變為X+n年的節點各自的狀態的概率。關于X年的節點的值,不需要提供全部的值,只要提供一部分值即可。
[0184]下面,設η = I來進行說明。
[0185]因果/轉移構造計算部109基于這些節點間的依賴性構建邊沿。在節點生成部110中,制作各節點的值所取的空間(現象空間)。在概率表計算部111中計算附條件概率。
[0186]因果/轉移構造計算部109根據數據構建這些節點(概率變量)間的邊沿(依賴關系)。對此,使用簡單的例子進行說明。
[0187]考慮具有兩個傳感器的系統,考慮根據傳感器的狀態判定系統的正常、異常的模型。將表示兩個傳感器的狀態的概率變量分別設為Χ1、Χ2,該概率變量取兩個狀態。另外,系統取正常、異常這兩個狀態,將其概率變量設為Χ3。以O和I來表示各狀態。
[0188]如下進行定義:在傳感器處于I的狀態的情況下,表示系統異常的可能性高。例如在Xl是溫度傳感器且表示比某值高的溫度的情況下Xl = 1,在Χ2是聲音傳感器且檢測出與通常不同的聲音的情況下Χ2 = I。這表示,在兩個傳感器對于系統的正常、異常的判定有效的情況下成為圖18(A)的構造1801所表示的構造。在被提供了構造1801和概率表1802的情況下,據此得到的觀測數據例如由表1803來表示。表1803的各行是一個觀測數據,在各傳感器表示異常的情況下,系統異常的可能性高。
[0189]在此,與圖18(A)所示的例進行比較來說明。在如表1803所示那樣被提供了 X1、Χ2、Χ3的觀測數據的情況下,構建符合該數據的構造1801。在實施例的情況下,X1、Χ2、Χ3等概率變量相當于整形信息的項目,一個觀測數據相當于一個健康保險加入者ID的數據。
[0190]在此,在概率變量存在N個的情況下,當考慮概率變量間的邊沿的有無時,在前述的模型中,兩個概率變量的組合存在從N個選擇2個的組合的數量(設為Μ)。因此,節點間的邊沿的有無為2的M乘方。當還考慮邊沿的方向時,模型的種類更多。因此,不可能調查所有的可能性。因此,存在通過限定為被稱為貝葉斯網絡的構造來搜索適于表現數據的構造的方法。
[0191]貝葉斯網絡是所有邊沿為有向邊的構造,是跟蹤有向邊而從某變量Xl至某變量Χ2的路徑不存在多個的網絡。例如,圖19⑷所示的構造1901是貝葉斯網絡,圖19⑶所示的構造1902不是貝葉斯網絡。
[0192]提出了用于根據數據自動學習貝葉斯網絡的構造的各種方法,但是即使使用該方法,如果節點數多,則也難以調查所有的可能性。另外,在如第I實施例中處理的那樣的規模大、種類或性質不同的數據混合存在的情況下,難以自動地學習精度高的網絡。
[0193]因此,第I實施例的圖形模型構造計算部208首先基于診療費用賬單、健康診斷、問診的各項目的特征定義因果和轉移關系來作為節點間的邊沿。接著,基于項目間的定量依賴度和同現依賴度這兩個依賴度計算節點間的依賴度。然后,刪除依賴性低的節點間的邊沿。在第I實施例的圖形模型中,考慮表示病態的因果的邊沿和表示病態的轉移的邊沿這兩種邊沿。
[0194]下面,使用圖20說明因果/轉移構造計算部109的處理。
[0195]在圖20(A)的因果/轉移構造定義步驟2001中,基于診療費用賬單、健康診斷、問診的各項目的特征對節點進行分類,定義因果和轉移關系來作為所分類的節點間的邊沿。第I實施例的模型以描述疾病的因果并預測病態的轉移(發病)為目的。因此,將項目分類為與傷病名、醫療行為、檢查值、生活習慣、基本信息有關的項目。
[0196]傷病名是診療費用賬單整形信息的傷病名碼1503、1504的項目群,醫療行為是診療費用賬單整形信息的診療行為碼1505和藥品碼1506的項目群。檢查值是利用體檢整形信息得到的檢查值的項目群。生活習慣是利用問診整形信息得到的問診的與生活習慣和自覺癥狀有關的項目群。基本信息是年齡、性別。
[0197]基于前述的項目的分類對節點進行分類。即,在節點與診療費用賬單信息、體檢信息以及問診信息的項目對應的情況下,分到該項目所屬的分類,在節點與將多個項目合并所得的項目對應的情況下,分到合并所得的項目所屬的分類。通過以上,節點被分類為傷病名、醫療行為、檢查值、生活習慣以及基本信息。
[0198]下面,為了說明處理,使用圖來說明一些代表性項目。在圖中,將傷病名碼10(傷病名)、藥品碼110 (醫療行為)、藥品碼120 (醫療行為)、血糖值(檢查值)等設為節點(概率變量)。括弧內表示節點所屬的分類。另外,在圖中,為了便于理解,將藥品碼120(醫療行為)等節點置換為表示該節點的更易理解的用語,表示為“糖尿病口服藥(醫療行為)”
坐寸ο
[0199]第I實施例的模型以根據今年的各個人的數據預測將來的疾病的轉移(發病)概率、醫療費以及/或者確定疾病的轉移的原因為目的。因此,希望預測下一年的醫療行為。此時,認為今年的醫療行為的狀況是對于下一年的醫療行為的預測有用的信息。因此,如圖21(A)所示的構造2101那樣,在今年的醫療行為的節點與下一年的醫療行為的節點之間制作從今年的項目向下一年的項目的邊沿。圖21 (A)所示的構造2101表示下一年被處方胰島素的概率依賴于今年的被處方糖尿病口服藥的概率、被處方胰島素的概率以及被處方透析的概率。一般,如果糖尿病的癥狀發生重癥化時,醫療行為按口服藥、胰島素、透析的順序被處方。
[0200]能夠通過使用如圖21(B)所示的表2102和圖21(C)所示的表2106那樣的兩年的診療費用賬單整形信息的數據來計算該模型的附條件概率。由此,能夠計算今年僅接受口服藥的處方的人接受下一年的胰島素的處方或透析的處方的概率。將這種波及多年的同一分類項目之間的依賴關系稱為轉移,將其它關系稱為因果。
[0201]在此認為,轉移的概率依賴于個人的檢查值、生活習慣而不同。例如關于今年被處方了糖尿病口服藥的人在下一年被處方胰島素的概率,預計血糖值高的人其概率更高。這樣,通過得到個人的更詳細的信息,能夠得到更嚴密的轉移的概率。
[0202]另外,認為被處方下一年的各醫療行為的概率還依賴于今年的檢查值,因此定義從今年的檢查值向下一年的醫療行為的有向邊。同樣地,認為生活習慣也對下一年的醫療行為產生影響,因此定義從今年的生活習慣向下一年的醫療行為的有向邊。在圖22(A)的構造2201中示出以上定義。
[0203]并且,醫療費是基于醫療行為計算的,因此在預測醫療費的情況下,定義從今年的醫療行為向下一年的合計分數(醫療費)的有向邊。并且,為了提高醫療費的精度,定義從今年的合計分數向下一年的合計分數的有向邊。在圖22(B)的構造2202中示出以上定義。
[0204]匯總以上的因果/轉移關系的邊沿則如表2301 (參照圖23A)。表2301中,行項目是母體,列項目是子樣,在母子間存在邊沿的情況下記載轉移或因果,在不存在邊沿的情況下空白。該模型是根據今年的檢查值、生活習慣以及醫療行為預測下一年的醫療行為、并根據今年的醫療行為、下一年的醫療行為的預測結果以及今年的醫療費預測下一年的醫療費的模型。圖38A中,利用一個〇來表示屬于各分類的節點,示意性地示出分類間的邊沿。
[0205]圖23B和圖23C中示出因果/轉移關系的其它定義。
[0206]在由圖23B所示的表2302表示的模型中,根據今年的檢查值和今年的生活習慣預測下一年的檢查值,基于下一年的檢查值預測下一年的醫療行為。
[0207]由圖23C所示的表2303表示的模型是將表2301和表2302的模型混合所得的類型,根據今年的生活習慣和今年的檢查值預測下一年的檢查值。另外,根據今年的檢查值、今年的醫療行為以及預測出的下一年的檢查值預測下一年的醫療行為。
[0208]在圖38B、圖38C中示意性地示出與圖23B、圖23C所示的因果/轉移關系對應的分類間的邊沿。
[0209]在此說明邊沿的方向。如圖38A、圖38B、圖38C所示,邊沿被定義為從生活習慣向檢查值的方向。這表示生活習慣的結果對檢查值產生影響。另外,同樣地,邊沿被定義為從生活習慣向醫療行為的方向以及從生活習慣向合計分數的方向。這表示生活習慣的結果對醫療行為和合計分數產生影響。另外,邊沿被定義為從檢查值向醫療行為的方向以及從檢查值向合計分數的方向。這表示檢查值的結果對醫療行為和合計分數產生影響。另外,邊沿被定義為從醫療行為向合計分數的方向。這表示醫療行為對合計分數產生影響。并且,邊沿被定義為從X年的分類向X+n年的分類的方向。除了前述的對以外,也可以使用這些組合來定義構造。
[0210]在圖20(A)的因果/轉移構造定義步驟2001中,作為基本信息的年齡和性別是對所有項目廣泛地產生影響的項目,因此可以按年齡和性別進行劃分來制作不同的模型。例如,可以將男女分開,每5歲進行劃分來制作模型。在不按年齡和性別制作不同的模型而僅制作一個模型的情況下,從今年的基本信息對下一年的所有項目定義有向邊。除醫療行為、檢查值、生活習慣、合計分數以外的項目從模型排除,或者從今年的該項目對下一年的所有項目定義有向邊。
[0211]通過以上的處理,定義屬于不同的分類的節點間的邊沿的有無的方向。例如在按照圖23A所示的模型的情況下,從屬于X年的檢查值的分類的節點向屬于X+n年的醫療行為的分類的節點定義有向邊。另外,從屬于X年的生活習慣的分類的節點向屬于x+η年的生活習慣的分類的節點不定義邊沿。
[0212]通過以上,結束因果/轉移構造定義步驟2001的處理的說明。下面,設期間不同的節點屬于不同的分類來進行處理。也就是說,將X年的檢查值的分類和x+n年的檢查值的分類視為不同的分類來處理。
[0213]接著,計算通過因果/轉移構造定義步驟2001定義的屬于不同的分類的節點(概率變量)間的轉移、因果邊沿中的該概率變量間的依賴度,刪除依賴度低的概率變量間的邊沿。
[0214]在節點間依賴度計算步驟2002中,計算節點(概率變量)間的依賴度。此時,各節點分別具有性質不同的值。例如,BM1、空腹時血糖等檢查值是連續值,其值的刻度也不同。另外,診療費用賬單整形信息的醫療行為的項目是表示處方的次數的整數值。另外,問診的、例如自覺癥狀的回答號是不具有定量的含義的值。并且,存在缺失的值。在這種狀況下需要用于比較性質不同的變量之間的依賴度的方法。
[0215]在第I實施例中,示出使用定量依賴度基準和同現依賴度基準這兩個基準計算節點間的依賴度的例子。定量依賴度基準是用于計算具有定量的含義的值之間的類似度的基準,同現依賴度基準是用于計算不具有定量的含義的值之間或具有定量的含義的值與不具有定量的含義的值之間的類似度的基準。
[0216]首先,說明定量依賴度的計算方法。現在,計算兩個概率變量X1、X2的依賴度。作為X1、X2的觀測數據,分別被提供xl = (xll, xl2,…,xln)、x2 = (x21, x22,…,x2n)。以下說明的定量依賴度是基于將xl和x2視為矢量時的相關系數的例子。
[0217]在此,將矢量xl與x2的相關系數設為r (xl,x2)。但是,xl、x2中有缺失值。因此去除xl、x2的某一個中有缺失值的元素。例如在xli缺失的情況下,去除x2i。通過這樣,將從xl、x2去除缺失維度后的矢量重新設為vl = (vll, vl2,…,vim)、v2 = (v21, v22,...,v2m)。
[0218]另外,即使相關值r(vl,v2)的值具有相同程度的依賴性,也由于vl、v2的值的性質的差異而在其值中產生偏差。因而,首先,能夠設想將vl、v2的元素獨立地隨機重新排列的矢量wl、w2中不具有依賴度。使用它計算|r(vl, v2) |-|r(wl, w2) I。在|r(vl,v2) |<|r(wl,w2)的情況下,能夠判斷為不具有定量依賴度。因此,將該情況下的定量依賴度設為0,將除此以外的情況下的定量依賴度設為|r(vl,v2) |-|r(wl,w2) |。由此,能夠計算與隨機的情況(不具有依賴性的情況)相比較的定量依賴度。
[0219]在此,定量依賴度對于具有定量的值的數據之間的比較有效。例如在圖20(B)所示的例子2005中,xl與x2之間明顯具有定量的相關。另外,在圖20(C)所示的例子2006中,在xl與x2之間,雖比例子2005小,但是也具有定量的相關。在問診的回答號等的情況下,能夠設想這種狀況。因此,需要作為對值彼此同現的程度進行計量的指標的同現依賴度。
[0220]關于同現依賴度的計算方法,以計算兩個概率變量X1、X2的依賴度的情況為例進行說明。
[0221]作為X1、X2的觀測數據,分別被提供xl = (xll, xl2,…,xln)、x2 = (x21, x22,…,x2n)。以下說明的同現依賴度是基于xl與x2的熵的例子。
[0222]首先,與定量依賴度的情況同樣地將去除缺失值后的矢量設為vl、v2。接著,將矢量vl、v2的元素對的集合設為S = {(vli, v2i)} (i是I至m的整數值)。S的元素數為m個。對于S的元素P= (pl,p2),將與P相等的S的元素的個數設為np。另外,將S的不同的元素的數量設為L。此時,用下式表示以L標準化的vl、v2的對的熵。
[0223]e (vl, v2) = Σ [ (_np/m) log (_np/m) ]/L
[0224]在此,Σ是S的所有元素p的和。與定量依賴度的情況同樣地,針對隨機化的wl、w2也計算e (wl, w2)。e (vl, v2)是正的值,vl、v2的同現度越大則成為越小的值。因此,在隨機的情況下標準化的6(¥1,¥2)/6(?1,《2)大于I的情況下,能夠判斷為vl與v2之間沒有依賴關系。另外,e(vl,v2)/e(wl,w2)是O以上的值。因此,將e (vl,v2)/e (wl,w2)大于I的情況下的同現依賴度設為0,將除此以外的情況下的同現依賴度設為l_e(vl,v2)/e (wl, w2)。
[0225]如前所述那樣定義的定量依賴度和同現依賴度是O以上且I以下的值,值越大則依賴度越大。對此,針對具有在因果/轉移構造定義步驟2001中定義的邊沿的所有概率變量的對進行計算。以下,將定量依賴度設為Q,將同現依賴度設為C。
[0226]在圖20(A)的依賴度校準步驟2003中,校正定量依賴度Q和同現依賴度C的值。利用f(C)來表示校正函數f。在校正僅為刻度變換的情況下,f既可以是一次函數,也可以是更復雜的函數。在f是二次函數的情況下,能夠用下式表示。
[0227]f (C) = a C*C+ β C+ Y
[0228]在此,說明確定f的參數(在上述的情況下為α、β、Y )的方法。例如在圖20⑶(C)所示的例子2005的情況和例子2006的情況下,期望例子2005的xl、x2的定量依賴度Q(xl,x2)的值與例子2006的同現依賴度C(xl,x2)的值接近。因此,準備具有各種定量依賴度的矢量xl、x2的多個組合,計算Q(xl,x2),其中,準備將x2的值隨機變更后的x2,計算C(xl,x2)。期望Q(xl,x2)與f(C(xl,x2))為接近的值,因此例如以使f (C(xl,x2))與Q(xl,x2)的最小二乘誤差變小的方式確定f的參數。在例子2005和例子2006中,例子2006的x2是將例子2005的x2的值以O — 1、I — 0、2 — 3、3 — 2的方式變換所得的。
[0229]通過以上,利用D = max{Q,f(C)}定義依賴度。
[0230]在圖20(A)的低依賴節點間邊沿刪除步驟2004中,刪除通過因果/轉移構造定義步驟2001確定的邊沿中、D小于預先確定的閾值的節點間的邊沿。
[0231]通過以上,定義屬于不同的分類的節點間的邊沿的方向和有無。即,在節點NI和節點N2是屬于不同的分類的節點的情況下,在因果/轉移構造定義步驟2001中定義節點NI與節點N2之間的邊沿,且在節點NI與節點N2的依賴度為預先確定的閾值以上的情況下,在節點NI與節點N2之間定義通過因果/轉移構造定義步驟2001定義的邊沿。除此以外的情況下,在節點NI與節點N2之間不定義邊沿。
[0232]在帶限制的構造學習步驟2007中,決定最終的節點間的邊沿構造。在此,說明三個例。
[0233]首先,說明第I例。在第I例中,僅將通過到低依賴節點間邊沿刪除步驟2004為止的處理定義的屬于不同的分類且依賴度為閾值以上的節點間的邊沿設為最終的病態轉移/因果模型的邊沿。此時,不定義屬于同一期間且同一分類的節點間的邊沿。
[0234]說明第2例。通過第I例的方法定義屬于不同的分類的節點間,使用現有的構造學習方法學習屬于同一分類的節點間的邊沿構造。通過將學習的結果所構建的邊沿構造例如限定為貝葉斯網絡的構造,能夠高效地進行學習。由此,在屬于同一分類的節點間定義邊沿的有無,并且在邊沿有向的情況下定義邊沿的方向。另外,不同的分類間的邊沿構造是已經定義的。關于通過以上的處理所制作的邊沿構造,即使屬于同一分類的節點間的構造是貝葉斯網絡的構造,作為整體也未必是貝葉斯網絡的構造。
[0235]說明第3例。基于通過到低依賴節點間邊沿刪除步驟2004為止的處理定義的邊沿,限制屬于不同的分類的節點間的邊沿的有無和方向。有在節點間不存在邊沿的情況、存在無向邊沿的情況、存在有向邊沿(根據方向有兩種)的情況這四種定義。而在屬于不同的分類的節點間通過到低依賴節點間邊沿刪除步驟2004為止的處理定義了邊沿的情況下,限制為節點間沒有邊沿或存在同一方向的邊沿這兩種。另外,在通過到低依賴節點間邊沿刪除步驟2004為止的處理而沒有邊沿的情況下,限制為節點間無邊沿。在該限制下,使用現有的構造學習方法學習節點整體的邊沿構造。
[0236]此外,在上述的第2例、第3例中,在需要使用現有的構造學習方法將節點的值離散化的情況下,也可以使用稍后在節點生成部209中說明的根據人數的比例進行離散化的方法。
[0237]通過以上,因果/轉移構造計算部109的處理結束。由此,確定節點間的構造(邊沿)。
[0238]為了由概率表計算部111制作概率表,節點生成部110定義節點的現象空間,匯集節點。節點中如檢查值那樣有連續值。另外,在將診療費用賬單的醫療行為的值設為處方次數的情況下,如果該處方次數的粒度細,則預測精度降低。因此,可以以適當的粒度進行離散化。例如,如果將各處方次數另外處理,則存在各處方次數的事例數變少,概率表的精度降低,或者概率表的制作困難等問題。
[0239]此外,也可以預先通過人工來定義現象空間。例如,也可以將體重以5kg劃分來表示,將對應的節點的現象空間設為{...,50?54,55?59,…}。在該情況下,將從50kg至54kg的體重值匯總為一個現象來處理。
[0240]進一步說明其它現象空間的定義的例子。在前述的方法中,需要針對每個節點定義現象空間。例如,身高和體重其值的含義、刻度不同,因此需要定義不同的劃分。在此處說明的例子中,以人數的比例來劃分值。因此,能夠通過不依賴于節點的一樣的方法來定義現象空間。具體地說,以k%為刻度,將低位p%?p+k%總括到一起。例如,當以5%為刻度來將體重的所有加入者的體重中的低位5 %為wl千克以下、將低位5 %?10 %設為wl千克?《2千克等時,現象空間成為{?wl,wl?《2,…}。在5%為刻度的情況下,狀態數為20。
[0241]另外,節點也可以不匯集。在通過前述的方法提供現象空間而不匯集節點的情況下,進入概率表計算部111的處理。在不匯集節點的情況下,有時用于計算附條件概率的事例數為O。因此,需要用于對此進行估計的處理,后面說明該處理。
[0242]接著,說明進行節點的現象空間的定義和節點的匯集的例子。
[0243]首先,說明節點的現象空間的定義。節點的現象空間用于定義概率變量所取的狀態(值),通過對應的項目的值空間的離散化來制作。
[0244]接著說明離散化的方法。在第I實施例中,節點的離散化是使用兩個基準來進行。第I基準是,以能夠充分地得到對于離散化后的該節點的各狀態的事例數的方式進行離散化。在離散化粗的情況下,更能夠充分地得到事例數,因此能夠制作統計上可靠性高的概率表。另一方面,如果離散化過粗,則無法充分表現子節點的概率分布對于該節點的狀態的依賴性。因此,第2基準是以不喪失子節點的附條件概率分布對于離散化后的該節點的狀態的依賴性的表現的方式進行離散化。
[0245]圖25是對節點進行離散化的處理的流程圖。下面,說明以使事例數優先的同時不喪失子節點的概率依賴性的表現的方式對節點進行離散化的處理的例子。
[0246]首先,使用圖17(A)所示的例子1701說明離散化的必要性。
[0247]為了制作模型,需要制作Xl的概率表1702和X2的概率表1703。例如,概率表1703的a22是在Xl = 2時成為X2 = 2的概率,其需要Xl = 2且X2 = 2的足夠數量的事例數。如果Xl的粒度細,則事例數變少,根據情況而成為O。由于沒有足夠的事例數,因此存在無法預測概率值或概率值的可靠性降低等問題。因此,需要向適當的粒度進行離散化。另外,在Xl = I且Xl = 2的情況下,在X2的概率分布P (X2 I Xl = I)與P(X2|X1 = 2)的概率分布幾乎相同的情況下,狀態Xl = I和X2 = 2在匯總為一個狀態的情況下從事例數、計算量的觀點來看更有利。
[0248]首先,說明用于充分地得到對于離散化后的該節點的各狀態的事例數的離散化方法。
[0249]將所關注的節點設為XI,將其子節點設為X2,X2已經被適當地離散化。圖24所示的事例數2401是Xl的各狀態下的事例數。從左向右,表示狀態的值變大。檢查值等在含義上是連續值,但是當細分至有效位的粒度時被離散地表示,因此能夠這樣表示。例如在以小數點2位的精度表示BMI值的情況下,2401的最左端的欄是0.00?0.01的事例數,從左第二個欄是0.01?0.02的事例數、…、等。
[0250]首先,在最小值狀態選擇步驟2501中,選擇Xl的最左端的狀態。在此,事例數2402是Xl為以最小值表示的狀態的情況下的X2的各狀態的事例數。事例數2402也與2401同樣地,從左向右,表示狀態的值變大。同樣地,事例數2403是Xl取比最小值大一個的狀態的情況下的X2的各狀態的事例數。
[0251]在下面的說明中,將當前選擇的狀態設為S。S的初始狀態是以Xl的最小值表示的狀態。
[0252]在步驟2502中,將Xl = S的帶條件的X2的各狀態的事例數與規定的閾值進行比較。在事例數小于規定的閾值的情況下,判定為事例數不夠,與右鄰的狀態結合(2503)。在不存在右鄰的狀態的情況下,也可以與左鄰的狀態結合。當將Xl的左的兩個狀態匯總時,事例數為圖24所示的事例數2404、2405,匯總后的Xl的狀態的事例數增加。之后,將結合所得的狀態設為S,返回到步驟2502。但是,在所有狀態被結合而狀態成為一個的情況下,結束處理。
[0253]另一方面,在事例數足夠的情況下,將S設為完成狀態,在步驟2504中調查是否存在未完成狀態(右鄰的狀態)(2504)。在存在未完成狀態的情況下,將該狀態設為S,返回到步驟2502。另一方面,在不存在未完成狀態的情況下,進入步驟2505。
[0254]通過該處理,能夠以各狀態具有穩定的事例數的方式進行離散化,能夠得到如事例數2407那樣的離散化(參照圖24)。
[0255]并且,以不喪失子節點對母節點的概率依賴性的方式進行離散化。具體地說,選擇事例數2407的左端的狀態O及其相鄰的狀態1 (2505),在?(乂2|父1 = O)與P(X2|X1 = I)這兩個概率分布上沒有大的差異的情況下(2506中“否”),將狀態O與狀態I結合(2507)。反復進行該處理直到在概率分布上出現差異為止。接著,轉移到Xl的右鄰的狀態(2508中“是”),通過同樣的方法將狀態結合。關于P(X2|X1 = O)與P(X2|X1 = I)是否不同,例如在存在P(X2 = a|Xl = O)與P(X2 = b|Xl = O)具有預先確定的閾值以上的差的X2的狀態a和b的情況下,判定為在概率分布上有大的差異。
[0256]具體地說,在步驟2501中選擇結合后的最小的兩個狀態,在事例數2407的例子中選擇左端的狀態及其相鄰的狀態。將所選擇的狀態分別設為S1、S2。接著,在步驟2506中,將P (X2 |X1 = SI)與P(X2|X1 = S2)的差異如前述那樣進行判定,如果沒有兩者的差異則進入步驟2507。在步驟2507中,將SI的狀態與S2的狀態結合,將結合所得的狀態新設為SI,進入步驟2508。如果在步驟2506中概率分布上沒有大的差異,則將S2新設為SI,進入步驟2508。在步驟2508中,如果存在SI的右鄰的狀態,則將該狀態設為S2,進入步驟2506。如果不存在SI的右鄰的狀態,則結束處理。
[0257]通過前述的處理,能夠在子節點X2被離散化的狀態下對Xl進行離散化。
[0258]因此,從作為不具有子節點的節點的葉子節點起按順序進行離散化。在存在表示醫療費的合計分數節點的情況下,合計分數節點成為葉子節點。合計分數節點被預先離散化成得到預測所需的粒度。另外,在不存在合計分數節點的情況下,與醫療行為有關的節點成為葉子節點。該離散化方法也預先確定。例如在根據處方的有無來區分的情況下,以O和I以上這兩個狀態來進行離散化。在需要更細的粒度的情況下,例如以0、1?5、6以上這三個狀態等來進行離散化。
[0259]通過以上,以歸納方式從葉子節點按順序朝向根節點(不具有母體的節點)進行離散化。
[0260]接著,在節點生成部209中,匯集節點。
[0261]如已經說明的那樣,在離散化中,僅關注與子節點之間的關系來進行了離散化。但是,在如圖26(A)所示的構造2601那樣某節點具有兩個以上的母節點的情況下,概率表需要對于母節點所有概率變量的狀態的組合的事例。例如在圖26(A)所示的情況下,X4有三個母節點X1、X2、X3。在該情況下,對于X1、X2、X3所有狀態的組合需要事例。因此,如圖26 (B)所示,將母節點匯集化,將匯集化的節點的狀態結合。
[0262]圖27是將節點匯集化的處理的流程圖。
[0263]考慮將某節點匯集化并將狀態結合。首先,在步驟2701中,判定母節點的所有狀態的組合中是否有預先確定的數量以上的事例數。如果事例數足夠,則結束該處理。
[0264]在事例數不夠的情況下,在最大依賴度對匯集步驟2702中,通過與節點間依賴度計算步驟2002相同的方法計算母節點之間的依賴度,選擇具有最大的依賴度的節點的對。認為依賴度高而類似的節點對子節點產生的影響類似。因此,將依賴度高的兩個節點匯集,設為新的節點。在原來的兩個節點的狀態數是nl、n2的情況下,新的節點的狀態數成為兩個節點的狀態的組合即nlXn2個。構造2602示出節點X2與節點X3被結合成節點X5的狀態(圖26(B))。
[0265]接著,在狀態結合步驟2703中將匯集的節點的狀態結合。使用圖28和圖29說明匯集的節點的狀態結合處理。
[0266]圖28與圖24同樣地表示節點的狀態。但是,與圖24不同地,X5的狀態是X2與X3的組合,因此如狀態2801那樣以二維表示。以如下方式配置事例數:從左向右,X2的值變大,從上向下,X3的值變大。
[0267]首先,在左上端狀態選擇步驟2901中,選擇左上端的狀態。S卩,是X2和X3均為最小值的組合。下面,將所選擇的狀態設為S。最初,S是左上端的狀態。接著,在步驟2902中,附帶X5 = S的條件下調查X4的各狀態的事例數,判定是否存在足夠的事例數。在X4的各狀態的事例數足夠的情況下,與該狀態有關的處理完成,進入步驟2905。在步驟2905中,從2801的最上層向下、且從各層的左端向右端搜索未完成的狀態,將最初發現的未完成的狀態設為S并返回到2902。
[0268]另一方面,在X4的各狀態的事例數不夠的情況下,在最佳鄰接狀態選擇步驟2903中,選擇最適于結合的鄰接狀態。鄰接狀態是在上下左右方向上與當前選擇的狀態鄰接的未完成的狀態,這些狀態中的、在結合的情況下對子節點X4的附條件概率分布的影響小的狀態是最適于結合的狀態。在不存在未完成的狀態的情況下,從鄰接的已完成的狀態中選擇最佳的狀態,并與所選擇的狀態結合。將結合后的狀態新設為S,返回到步驟2902。
[0269]說明步驟2903中的計算對子節點X4的附條件概率分布的影響的方法的例子。現在,將所選擇的狀態設為a,將鄰接狀態設為b,I (b) = max | P (X4 = s | X5 = a) -P (X4 = s | X5=a) I。max是將所有對于X4的狀態s的鄰接狀態b中I (b)的值最小的狀態選擇為最佳狀態的函數。
[0270]通過以上,狀態以二維結合。狀態2804中示意性地示出該情形。在狀態2804中,刪除被結合的狀態間的格線來示出。
[0271]通過從葉子節點朝向根節點以歸納方式反復進行該處理,節點的匯集完成。由此,通過將母節點的狀態數組合而事例數變少,能夠解決難以進行預測或預測精度降低的問題。
[0272]接著,節點生成部110制作節點匯集后的因果/轉移構造。節點生成部110刪除被匯集的節點,插入通過匯集而新制作的匯集節點。此時,將被匯集節點的所有母節點設為匯集節點的母節點。例如如圖31所示,從原來的構造3101(圖31(A))匯集X2和X3(圖31 (B)),得到作為X5新插入的構造3103(圖31(C))。
[0273]最后在節點生成部110中,將該構造的信息存儲到因果轉移模型存儲部119,將該節點的匯集和狀態結合的信息存儲到節點信息存儲部120。圖32中示出因果轉移模型存儲部119中存儲的信息的例子。表3201表示構造3103的信息,表示各節點的母節點。圖30中示出節點信息存儲部120中存儲的信息的例子。狀態結合信息3001表示節點的狀態結合,是通過離散化的處理(圖25)生成的。根據狀態結合信息3001,BMI值的18.01?20.00的范圍的值是一個狀態。被匯集節點信息3002是表示匯集節點和被匯集節點的表。根據被匯集節點信息3002,匯集節點I是將身高節點和體重節點結合而成的。匯集節點的狀態結合信息與狀態結合信息3001同樣。
[0274]概率表計算部111制作由節點生成部110制作并存儲在因果轉移模型存儲部119中的構造的附條件概率表。這相當于,當將各節點X的母節點設為X1、X2、…、Xn時,針對X、X1、.'Xn 的各狀態計算 P (X |X1,X2,...,Xn)。
[0275]以圖31的(C)的構造3103為例說明處理。現在,考慮制作P (X5 | X6,X7)。在X5、X6、X7都取O和I這兩個狀態的情況下,P (X5 = a | X6 = b, X7 = c),需要計算使a、b、c變為O和I時的8個值。例如在計算P (X5 = O IX6 = O,X7 = O)時,首先提取X6 = O、X7 =O的所有事例。將所提取的事例數設為P。接著,將該P個事例中X5 = O的事例數設為q。此時,P(X5 = O IX6 = 0,X7 = O)= q/p。
[0276]例如,X6是X年的血糖值,X7是X年的糖尿病口服藥處方的有無,X5是X+n年的胰島素制劑處方的有無,以I來表示有處方。此時,設X年有糖尿病口服藥的處方,將糖尿病的值處于以S表示的值的加入者設為P人,將該P人中在η年后接受胰島素制劑的處方的加入者的人數設為q人。此時,P(X5 = I |X6 = S,X7 = I) = q/p。
[0277]在沒有事例數而無法計算附條件概率的情況下,例如也可以通過均勻分布來置換。在前述的例子中,在P = O的情況下,無法計算P(X5|X6 = S,X7 = I)。因此,設X5的分布均勻,在如前述的例子那樣X5取2值的情況下,設P(X5 = 1|X6 = S,X7 = I) = 1/2、P(X5 = O I X6 = S,X7 = I) = 1/2。
[0278]概率表計算部111針對所有節點計算該概率值,將所制作的概率表存儲到因果轉移模型存儲部119。
[0279]以上是病態因果/轉移模型制作部108的處理。
[0280]接著,說明發病概率/醫療費預測部112。發病概率/醫療費預測部112具有模型重構部113、病態轉移概率/醫療費預測部114以及保健指導支援部115。
[0281]模型重構部113根據來自保健指導支援部115的要求,根據因果轉移模型存儲部119中存儲的因果轉移模型重構與用戶的目的相應的模型。所重構的模型被存儲到重構模型存儲部121。病態轉移概率/醫療費預測部114使用由模型重構部113制作的重構模型預測發病概率、醫療費。預測結果被存儲到預測結果存儲部122。
[0282]首先,說明模型重構部113的處理。
[0283]由病態因果/轉移模型制作部108制作的模型是大量的節點相互有關系的大規模的模型。但是,用戶感興趣的通常是該模型的一部分。因而,模型重構部113提供僅重構與用戶需要的節點有關的模型的功能。由此,成為不僅能夠削減計算量、對于用戶來說也容易使用的模型。
[0284]另外,在根據用戶的要求從最初開始構建模型的情況下,需要大量的計算量。但是,重構的計算成本小。因此,通過如第I實施例那樣的制作精細的模型的病態因果/轉移模型制作部以及重構與目的相應的緊湊的模型的模型重構部的2級結構,能夠高效且有效地利用從大規模的數據得到的信息。另外,在如圖3、圖4、圖5所示那樣由不同的裝置構成系統的情況下,用戶只要僅使用圖5所示的裝置即可。一旦由圖3、圖4所示的裝置制作模型之后,用戶所使用的圖5的裝置不需要保持作為模型制作的基礎的醫療數據,因此對于個人信息的隱匿以及泄漏的防止有效。
[0285]模型重構部113根據保健指導支援部115的要求重構與用戶的目的相應的模型。即,模型重構部113在被提供了想要包含在重構模型中的節點的列表時,構建與該節點有關的模型。節點的列表是匯集前的節點。即,是與整形信息的項目對應的節點。例如在關注糖尿病關聯的病態因果和轉移的情況下,將與關聯的醫療行為有關的項目、檢查值以及問診結果設為節點的列表。
[0286]首先,說明在節點生成部110中沒有匯集節點而由病態因果/轉移模型制作部108制作的圖形模型是有向圖形的情況下的模型重構部113的處理。
[0287]作為節點的列表,選擇N1、N2、…、Nk。首先,關于邊沿構造在由病態因果/轉移模型制作部108制作的模型中存在追蹤從Ni向Nj的有向邊沿的路徑的情況下設定從Ni向Nj的有向邊沿,在存在追蹤從Nj向Ni的有向邊沿的路徑的情況下設定從Nj向Ni的有向邊沿,在除此以外的情況下設為無邊沿。接著,通過列表中沒有的節點的周邊化來求出由此定義的附條件概率。
[0288]例如,圖36所示的模型為原始模型,Xl和X3被提供為節點的列表。此時,由于存在從Xl向X3的有向邊沿的路徑,因此在重構模型中制作從Xl向X3的有向邊沿。附條件概率P(X3 IXI)是基于原始模型將X2周邊化來提供的。即,P(X3 = s3 IXl = si) = ΣΡ(Χ3=s3|X2 = s2)P(X2 = s2|X3 = s3)。在此,Σ是關于所有X2的狀態s2的和。
[0289]基于圖33所示的例子說明有節點的匯集的情況下的模型重構部113的處理。構造3301是由病態因果/轉移模型制作部108制作并存儲在因果轉移模型存儲部119中的模型。X2和X3被匯集而成為X5。另外,作為節點的列表,被提供X3、X4、X8。此時,作為重構模型的節點,從因果轉移模型存儲部119中存儲的模型選擇所提供的節點以及將該節點匯集所得的節點,即,在構造3103中選擇X5、X4、X8。
[0290]接著,模型重構部113重構僅包含X5、X4、X8的模型。此時,如果存在將作為重構模型的節點選擇的節點間連接的路徑,則在重構模型中也在該節點間構成有向邊。在構造3302的情況下如構造3303。
[0291]接著,為了完成重構模型而計算附條件概率。通過說明P(X4|X5)的計算的例子來說明處理。能夠通過ΣΡ(Χ4|Χ1 = s、X5)來計算P(X4|X5)。在此,Σ是關于Xl的所有狀態的和。在其它情況下,也能夠根據因果轉移模型存儲部119中存儲的模型求出附條件概率。
[0292]通過以上,在有節點的匯集的情況下,重構由作為節點的列表選擇的節點構成的模型,以及在節點被匯集的情況下重構由匯集后的節點構成的模型。之后的邊沿的定義和附條件概率的計算與沒有節點匯集的情況同樣。
[0293]此外,在將所有節點指定為列表的情況下不需要重構,因此模型重構部113使用由病態因果/轉移模型制作部108制作的模型。另外,病態轉移概率/醫療費預測部114在預測中使用的模型也可以使用由病態因果/轉移模型制作部108制作的模型,模型重構部113僅將在保健指導支援部115中顯示在顯示裝置上的網絡圖設為重構模型。該情況下的網絡圖、概率表基于前述的重構模型。
[0294]病態轉移概率/醫療費預測部114使用模型重構部113所重構的模型、或病態因果/轉移模型制作部108制作并由因果轉移模型存儲部119存儲的模型,預測疾病的發病概率、醫療費。
[0295]使用構造3302說明該處理。在求出X5 = s的概率(例如,X5是與下一年的胰島素的處方次數有關的項目)的情況下,是胰島素的處方次數為以s表示的次數的概率。通過下式提供乂13435、乂63738的聯合分布。
[0296]P (XI,X4, X5, X6, X7, X8) = P (Xl) P (X6) P (X8) P (X7 | X8) P (X5 | X6, X7) P (X4 | XI,X5)
[0297]通過下式提供P(X5 = s)。此外,Σ是關于Χ5以外的所有概率變量的狀態的和。
[0298]P (Χ5 = s) = Σ P (XI,Χ4, Χ5, Χ6, Χ7, Χ8)
[0299]對此,能夠通過使用概率表計算部111制作并因果轉移模型存儲部119存儲的概率表來計算。但是,在X5以外的概率變量中存在已計算的概率變量的情況(例如Xl = t的情況)下,通過下式提供概率變量P (X5 = S)。Σ是關于除了觀測節點Xl和想要預測的節點X5以外的所有概率變量的狀態的和。
[0300]P (X5 = s) = Σ P (XI = t, X4, X5, X6, X7, X8)
[0301]這相當于如下情況:例如在得到了今年的健康診斷的檢查值的情況下將該節點的狀態固定來預測下一年的醫療行為和醫療費。
[0302]通過以上,在得到了今年的信息的狀態下能夠預測與下一年的醫療行為和醫療費相當的節點的狀態。當將醫療費節點設為X來求P(X)時,對于醫療費的各分數得到預測概率值。作為其期待值,能夠預測下一年的醫療費。
[0303]前述的式計算所有狀態的和,因此計算時間大。提出了高效地求出它的算法,例如有消息傳遞算法、Junct1n Tree Algorithm等。病態轉移概率/醫療費預測部114還可以使用這些算法。
[0304]保健指導支援部115提供支援用于預防將來的疾病的發病的指導的功能。說明用于健康保險事業者制定保健指導計劃的支援功能以及支援保健指導擔當者或對象者個人的功能這兩個。
[0305]首先,說明用于健康保險事業者制作保健指導計劃的支援功能。健康保健事業者期望在預算內優先選擇保健指導所產生的預防效果高的對象者,進行適于各對象者的指導。健康保險事業者所能夠提供的保健指導服務有多個(保健指導服務1、保健指導服務
2、…、等)。例如,保健指導服務I是主要用于減小BMI值的指導,保健指導服務2是用于降低膽固醇值的指導等。
[0306]說明面向健康保險事業者的支援功能的處理。
[0307]圖34A是面向健康保險事業者的支援功能的處理的流程圖。
[0308]首先,在對象疾病設定步驟3401中,設定作為處理的對象的疾病。例如在將作為三大生活習慣病的糖尿病、血脂異常癥以及高血壓癥設為對象的情況下,使用診療費用賬單整形信息的項目中的符合糖尿病、血脂異常癥以及高血壓癥的醫療行為的項目、健康診斷的項目以及問診的項目,模型重構部113重構模型。在將所有疾病設為對象的情況下,使用病態因果/轉移模型制作部108制作并因果轉移模型存儲部119所存儲的模型。
[0309]接著,在保健指導服務設定步驟3402中,設定保健指導服務的種類和各保險指導服務的設想效果。例如,保健指導服務I的設想效果是減體重5kg等。
[0310]接著,在保健指導效果預測步驟3403中,針對保健指導服務與保健指導對象候選者的所有組合預測醫療費削減效果。首先,說明針對保健指導服務I與保健指導對象候選者I的組合計算醫療費削減效果的方法。
[0311]最初,預測不進行保健指導服務的情況下的保健指導對象候選者I的下一年的醫療費。對此,基于今年的保健指導對象候選者I的診療費用賬單、健康診斷以及問診的值,設定與今年的項目對應的節點的狀態,病態轉移概率/醫療費預測部114預測醫療費(Cl)。接著,將通過保健指導服務改善了檢查值后的值設定為今年的保健指導對象候選者I的值,病態轉移/醫療費預測部114預測下一年的醫療費(C2)。Cl為不進行保健指導的情況下的預測醫療費,C2為進行了保健指導的情況下的預測醫療費,因此,當將保健指導所需的費用設為C3時,醫療費削減費用對效果能夠通過E = C1-C2-C3來計算。針對保健指導服務與保健指導對象候選者的所有組合進行該處理,計算醫療費削減費用對效果E。
[0312]接著,在保健指導內容制定步驟3404中,從保健指導服務與保健指導對象候選者的組合中選擇醫療費削減費用對效果最高的組合。然后,將所選擇的保健指導對象候選者設為已選擇。接著,從對于未被選擇的保健指導對象候選者的保健指導服務與保健指導對象候選者的組合中選擇醫療費削減費用對效果最高的組合。然后,將所選擇的保健指導對象候選者設為已選擇。通過這樣,能夠按效果從高到低的順序選擇保健指導服務與保健指導對象候選者的組合。最后,在保健指導的預算的范圍內選擇效果高的組合,設定保健指導對象者和保健指導內容。
[0313]在效果預測步驟3405中,對通過保健指導內容制定步驟3404選擇的組合的醫療費削減費用對效果進行合計,輸出從醫療費削減效果減去保健指導成本所得的值作為效果O
[0314]接著,說明面向擔當者和對象者的支援功能的處理。
[0315]圖34B是面向擔當者/對象者的支援功能的處理的流程圖。
[0316]首先,在對象疾病設定步驟3401中,設定作為處理的對象的疾病。例如在將作為三大生活習慣病的糖尿病、血脂異常癥以及高血壓癥設為對象的情況下,使用診療費用賬單整形信息的項目中的符合糖尿病、血脂異常癥以及高血壓癥的醫療行為的項目、健康診斷的項目、以及問診的項目,由模型重構部113重構模型。在將所有疾病設為對象的情況下,使用病態因果/轉移模型制作部108制作并因果轉移模型存儲部119存儲的模型。
[0317]說明對象疾病設定步驟3401的處理的其它例。對象者或擔當者選擇希望處理的疾病。即,選擇與某醫療行為對應的項目。接著,通過與步驟2002?2003同樣的方法計算該項目與其它所有項目的依賴度。然后,提取與該選擇的項目之間的依賴度為一定程度以上的項目,基于該選擇項目以及所提取的項目的列表,使用模型重構部113重構的模型。
[0318]在發病概率計算步驟3406中,將所有節點的狀態設為未設定的狀態下病態轉移概率/醫療費預測部114預測下一年的各疾病的病態轉移概率以及醫療費。關于各疾病,能夠作為下一年的有關與該疾病相當的醫療行為的節點的處方次數為I以上的概率來求出。這可認為是疾病的平均發病概率。接著,基于對象者的今年的診療費用賬單、健康診斷以及問診的值,設定與今年的項目對應的節點的狀態,病態轉移概率/醫療費預測部114預測下一年的各疾病的病態轉移概率和醫療費。此時的各疾病的發病概率是該對象者的疾病的發病概率。因此,對于各疾病,通過將對象者的疾病的發病概率除以疾病的平均發病概率,計算對象者的發病風險是平均的幾倍。
[0319]在高風險疾病提示步驟3407中,提示發病風險比平均高預先確定的閾值以上的疾病及其風險。由此,對象者或保健指導擔當者能夠獲知對象者的疾病風險。
[0320]在改善項目提示步驟3408中,提示與通過高風險疾病提示步驟3407計算的高風險疾病對應的醫療行為節點之間具有一定程度以上的依賴度的檢查值。通過與圖20的(A)的步驟2002?2003同樣的方法來計算依賴度。
[0321]接著,在目標值用戶輸入步驟3409中,促使用戶輸入關于通過改善項目提示步驟3408提示的檢查項目的改善目標值(例如體重的目標值)。
[0322]最后,在效果預測步驟3410中,目標值更新通過目標值用戶輸入步驟3409輸入的檢查項目,通過與步驟3406同樣的方法預測目標達到后的疾病的發病概率來提示發病風險的變化。用戶通過觀察發病風險的變化,能夠設定改善目標或使用于自己管理。
[0323]此外,在保健指導支援部115中,也可以將分析中使用的模型顯示為網絡圖。另夕卜,也可以將發病風險顯示在邊沿的附近。由此,用戶能夠容易地掌握疾病的狀態變化的情形、對其產生影響的要因,在保健指導內容的制作以及保健指導所產生的改善目標的設定等時有效。
[0324]在第I實施例的結構中,病態因果/轉移模型制作部108構建由基于診療費用賬單信息、體檢信息、問診信息的項目的節點構成的圖形模型。然后,模型重構部113重構與目的相應的適當的規模的圖形模型。通過該結構,能夠使用緊湊的模型進行預測,能夠進行高速的預測。另外,不需要處理包含目的外的節點的大規模的模型,因此用戶容易理解模型的構造,可讀性提聞,分析變得容易。
[0325]另一方面,還考慮按目的根據醫療數據制作模型的研究。但是,在該方法中,如果不始終保持醫療數據,則無法應對各種目的。因此,在個人信息的隱匿的觀點上存在問題。另外,在不保持醫療數據的情況下,預先設想用途,制作各目的的模型,因此只能應對特定疾病等特定目的。另外,根據醫療數據進行的模型的制作與重構相比計算量大,因此在計算量的觀點上也不利。在第I實施例的結構中,能夠如圖3、圖4以及圖5所示那樣分割裝置,只要使用圖3、圖4的裝置制作一次模型,用戶就能夠僅使用圖5的裝置來重構模型并進行預測。
[0326]因果/轉移構造計算部109限制了表示醫療費、醫療行為、檢查值以及生活習慣的節點間的邊沿的方向。這表示,生活習慣對檢查值產生影響,檢查值對醫療行為產生影響,醫療行為對醫療費產生影響,過去的它們的狀態對將來的它們的狀態產生影響。通過追加這種對節點間的限制,能夠削減構造學習的計算量,能夠得到直觀上也容易理解的模型。
[0327]節點生成部110基于制作附條件概率表時的事例數的確保和子節點的概率分布對母節點的依賴性的維持這兩個觀點匯集節點,定義現象空間。由此,能夠制作統計上的可靠性高的附條件概率表,能夠提高預測精度。另外,能夠使節點(概率變量)的現象空間小,因此在計算量的觀點上也有利。
[0328]保健指導支援部115使用所重構的模型預測將來的疾病的狀態、醫療費。在第I實施例的模型中,考慮各種要因,因此能夠進行精度高的預測。另外,只要有診療費用賬單信息,就能夠應對任何疾病對象。并且,通過將保險加入者的當前的檢查值置換為保健指導所產生的改善設想值來進行預測,能夠預測保健指導所產生的介入效果。
[0329]并且,通過將這些分析中使用的模型顯示為網絡圖,用戶能夠掌握疾病的狀態變化所引起的影響,對于保健指導內容的制作以及保健指導所達到的改善目標的設定等有效。該模型是重構模型,因此是由用戶關注的節點構成的圖,因此用戶感興趣的可讀性高。
[0330]如以上所說明的那樣,根據第I實施例,基于診療費用賬單信息、體檢信息、問診信息等醫療數據高精度地預測將來的疾病的發病概率和醫療費。另外,基于數據能夠自動選擇對于預測有效的因子,能夠進行考慮到了大量的要因的預測。并且,能夠針對診療費用賬單信息所包含的疾病進行分析,因此能夠針對各種疾病選擇費用對效果高的保健指導對象者和保健指導內各。
[0331]另外,通過由模型制作功能(因果/轉移構造計算部109)和模型重構功能(模型重構部113)構成,個人信息的隱匿性高,能夠以各種疾病為對象來高速地進行預測。
[0332]S卩,通過由模型制作功能和模型重構功能構成,模型制作功能制作以所有疾病(所有診療費用賬單項目、體檢項目)為對象的精細且大規模的模型,模型重構功能重構與目的相應的緊湊的模型。例如,如果僅利用模型制作功能,則模型的規模變大,預測的計算量增大,因此模型難以使用。另外,在想要僅分析特定疾病的情況下,還包含無關的疾病的模型難以使用。另外,作為其它研究,也可以按目的(例如糖尿病、血脂異常癥、高血壓癥等)制作模型,但是存在如下問題:模型構建中需要大的計算量,需要保持原始數據(診療費用賬單信息、體檢信息)。
[0333]在第I實施例中,通過模型制作功能制作以所有疾病為對象的大規模且精細的模型,根據所制作的模型重構與目的相應的模型。涉及模型重構的計算量不大,因此能夠容易地重構模型。另外,所重構的模型緊湊,因此預測的計算成本小。另外,只要保持通過模型制作功能制作的模型即可,不需要原始數據,因此在預測時不需要保持機密信息(個人信息)。由此,能夠有效且高效地利用大規模的數據。
[0334]另外,將診療費用賬單和健康診斷等項目作為節點,將節點的狀態作為項目的值,將節點間的概率依賴性作為邊沿來通過圖形模型制作節點。因此,子節點的狀態依賴于母節點的狀態,能夠通過母節點的附條件概率提供子節點的狀態。
[0335]另外,根據轉移和因果對圖形模型的邊沿附加特征。例如,當前的生活習慣與當前的檢查值之間具有因果關系,當前的檢查值與當前的診療行為之間具有因果關系,當前的診療行為與將來的診療行為之間具有轉移關系,將來的診療行為與將來的醫療費之間具有轉移關系。另外,當前的生活習慣與當前的檢查值之間具有因果關系,當前的檢查值與將來的檢查值之間具有轉移關系,將來的檢查值與將來的診療行為之間具有因果關系,將來的診療行為與將來的醫療費之間具有轉移關系。另外,當前的醫療費一將來的醫療費之間具有轉移關系。
[0336]并且,為了通過前述的模型制作功能制作大規模的模型,存在由于模型的規模的增大而用于定義各節點的母附條件概率的事例數不足的問題。在母節點大的情況下,由于通過母節點的狀態的組合提供子節點的狀態的概率分布,因此需要對于母節點的狀態的所有組合足夠的事例數。因此,母節點的狀態的分辨率和母節點的數小為宜。但是,如果母節點的狀態的分辨率和母節點的數小,則模型的精度下降。因此,節點生成部110以對子節點的概率分布的影響小且充分收集事例數的方式進行母節點的匯集和離散化。從葉子節點按順序朝向根節點進行該處理。
[0337]另外,模型制作功能按必須區分的項目、即按加入者的年齡且性別制作模型,由此能夠構建便利性高的模型。
[0338]另外,通過由保健指導支援部選擇糖尿病、高血壓癥以及血脂異常癥的全部或一部分的概率變量的列表,能夠針對成為使醫療費高漲的原因的主要成人病進行分析。
[0339]<實施例2>
[0340]在第2實施例中,基于由項目和數據入口構成的表形式信息構建圖形模型。并且,說明基于所構建的模型預測新得到的數據的未知的值的分析系統的例子。
[0341]圖2是表示第2實施例的分析系統的結構的框圖。
[0342]第2實施例的分析系統具有數據分析裝置201和數據庫214。
[0343]數據分析裝置201具有輸入部202、輸出部203、運算裝置204、存儲器205以及存儲介質206。這些元素的結構和功能分別與第I實施例1的力部102、輸出部103、運算裝置104、存儲器105以及存儲介質106相同。
[0344]首先,說明第2實施例中處理的數據。第2實施例中處理的數據是圖37(A)所示的表形式數據3701,X1、X2、…是項目名,一個數據入口表示為I行。各列保存有對于一個項目的數據入口的值。該表形式數據3701被存儲到表形式信息存儲部215。
[0345]在第2實施例中,構建以項目X1、X2、…為節點(概率變量)的圖形模型。下面,利用表示項目名的Xi表示節點。此外,各行與第I實施例的健康保險加入者對應,項目與診療費用賬單信息、體檢信息、問診信息的項目對應。
[0346]圖形模型制作部207構建以項目X1、X2、…為節點的圖形模型。
[0347]圖形模型構造計算部208定義項目間的邊沿。在存在事前知識的情況下,也可以進行與節點的有無、其種類有關的限制。當將構造假定為貝葉斯網絡時,存在學習邊沿構造的高效的算法。此時,也可以通過與因果/轉移構造計算部109同樣的方法計算項目間的依賴度,在依賴度為閾值以下的情況下,限制為沒有邊沿來學習構造。所制作的邊沿構造被存儲到圖形模型存儲部216。
[0348]節點生成部209進行與第I實施例的節點生成部110同樣的處理。所制作的節點信息被保存到節點信息存儲部217。
[0349]概率表計算部210進行與第I實施例的概率表計算部111同樣的處理。所制作的概率表被存儲到圖形模型存儲部216。
[0350]預測部211預測被提供的新的數據入口所包含的未知的值。例如在得到了圖37(B)所示的數據3702的情況下,數據3702中項目X4、X5的值是未知的。因此,基于數據3702的已知的值以及圖形模型制作部207所構建的模型預測項目X4、X5的值。已知的值與第I實施例的今年的診療費用賬單信息、體檢信息以及問診信息的值對應,未知的值與第I實施例的來年的診療費用賬單信息、體檢信息以及問診信息的值對應。
[0351]簡易圖形模型重構部212重構由所指定的節點的列表構成的模型。簡易圖形模型重構部212進行與第I實施例的模型重構部113同樣的處理。所重構的模型被存儲到重構模型存儲部218。
[0352]為了由簡易圖形模型重構部212重構模型,概率推斷部213根據目的指定所需的節點的列表。并且,概率推斷部213使用簡易圖形模型重構部212所重構的模型,預測從輸入部202輸入的數據的未知的值。預測結果被存儲到預測結果存儲部219。
[0353]第2實施例的分析系統既可以是由一個計算機構成的計算機系統,也可以是由服務器和客戶終端構成的計算機系統。另外,數據分析裝置201的圖形模型制作部207、預測部211也可以由不同的裝置構成。
[0354]分析系統是在一個計算機上或在邏輯上或物理上構成的多個計算機上構成的計算機系統,既可以在同一計算機上在不同的線程中動作,也可以在構建于多個物理計算機資源上的虛擬計算機上動作。
[0355]由運算裝置204執行的程序經由可移動介質(⑶-ROM、快閃存儲器等)或網絡被提供至各服務器,被保存到作為非臨時性存儲介質的非易失性存儲裝置。因此,計算機系統可以具備讀取可移動介質的接口。
[0356]如以上所說明的那樣,根據第2實施例,能夠基于醫療數據以外的各種數據高精度地預測將來產生的現象。
[0357]此外,本發明不限定于前述的實施例,包括所附的權利要求書的宗旨內的各種變形例以及同等的結構。例如,前述的實施例是為了容易理解本發明而詳細說明的,本發明不限定于具備所說明的所有結構。另外,也可以將某實施例的結構的一部分置換為其它實施例的結構。另外,也可以對某實施例的結構追加其它實施例的結構。另外,關于各實施例的結構的一部分,也可以進行其它結構的追加/刪除/置換。
[0358]另外,關于前述的各結構、功能、處理部、處理單元等,例如可以通過集成電路對它們的一部分或全部進行設計等來以硬件實現,也可以通過由處理器解釋并執行實現各個功能的程序來以軟件實現。
[0359]實現各功能的程序、表、文件等信息能夠保存到存儲器、硬盤、SSD(Solid StateDrive:固態硬盤)等存儲裝置或IC卡、SD卡、DVD等記錄介質。
[0360]另外,控制線、信息線表示認為在說明上所需要的,不限于表示實際安裝上需要的全部控制線、信息線。實際上,可認為幾乎所有的結構相互連接。
【權利要求】
1.一種分析系統,具有執行程序的處理器以及保存所述程序的存儲器,通過執行所述程序來對醫療數據進行分析,該分析系統的特征在于, 所述分析系統能夠訪問包含醫療信息、費用信息及體檢信息的數據庫,所述醫療信息包含加入者的傷病名和對所述加入者進行的醫療行為,所述費用信息為所述醫療行為的費用信息,所述體檢信息包含所述加入者的健康診斷的檢查值, 所述分析系統具備: 因果/轉移構造計算部,所述處理器基于所述醫療信息和所述體檢信息制作圖形構造,將所述制作的圖形構造保存到所述數據庫,其中,該圖形構造包含與病態及關于所述病態的發病概率變量對應的病態節點、與表示對所述病態的變化產生影響的因子的因子概率變量對應的因子節點、以及在所述病態節點與所述因子節點之間由有向邊或無向邊定義的概率依賴性; 節點生成部,所述處理器基于所述醫療信息和所述體檢信息,制作所述發病概率變量和所述因子概率變量的現象空間,將所述制作的現象空間保存到所述數據庫; 概率計算部,所述處理器基于所述醫療信息、所述體檢信息以及所述現象空間,計算所述圖形構造的附條件概率,將所述計算的附條件概率保存到所述數據庫; 模型重構部,所述處理器基于由所述圖形構造、所述現象空間以及所述附條件概率構成的模型,利用由所指定的概率變量構成的圖形構造、現象空間以及附條件概率重構模型,將所述重構的模型保存到所述數據庫; 病態轉移/醫療費預測部,所述處理器基于所述醫療行為的費用信息和所述重構的模型,預測病態轉移概率和醫療費;以及 健康指導支援部,所述處理器基于所述預測的病態轉移概率和醫療費,選定健康指導的對象者和健康指導內容。
2.根據權利要求1所述的分析系統,其特征在于, 具備數據整形部,在該數據整形部中,所述處理器從所述醫療信息和所述體檢信息獲取進行了醫療行為的次數、醫療行為的費用以及所述體檢信息,制作將所述獲取的信息按每個所述加入者且每個規定期間匯總而得到的整形信息,將所述制作的整形信息保存到所述數據庫。
3.根據權利要求2所述的分析系統,其特征在于, 所述因果/轉移構造計算部將所述整形信息中的進行了醫療行為的次數和所述體檢信息的內容作為概率變量來制作圖形構造。
4.根據權利要求1所述的分析系統,其特征在于, 所述因果/轉移構造計算部制作如下圖形構造,其包含從與第I期間的檢查值對應的節點向與比所述第I期間在規定期間之后的第2期間的醫療行為對應的節點的方向定義的有向邊、以及從與所述第I期間的醫療行為對應的節點向與所述第2期間的醫療行為對應的節點的方向定義的有向邊。
5.根據權利要求1所述的分析系統,其特征在于, 所述因果/轉移構造計算部制作如下圖形構造,其包含從與第I期間的檢查值對應的節點向與比所述第I期間在規定期間之后的第2期間的檢查值對應的節點的方向定義的有向邊、從與第I期間的生活習慣對應的節點向與所述第2期間的檢查值對應的節點的方向定義的有向邊、從與所述第2期間的檢查值對應的節點向與所述第2期間的醫療行為對應的節點的方向定義的有向邊、以及從與所述第I期間的醫療行為對應的節點向與所述第2期間的醫療行為對應的節點的方向定義的有向邊。
6.根據權利要求1所述的分析系統,其特征在于, 所述因果/轉移構造計算部制作如下圖形構造,其包含從與第I期間的醫療費對應的節點向與比所述第I期間在規定期間之后的第2期間的醫療費對應的節點的方向定義的有向邊、以及從與所述第2期間的醫療行為對應的節點向與所述第2期間的醫療費對應的節點的方向定義的有向邊。
7.根據權利要求2所述的分析系統,其特征在于, 所述因果/轉移構造計算部制作以所述整形信息的事例中、在所述兩個概率變量中不缺失值的事例的值為元素的兩個矢量vl和v2, 制作將所述兩個矢量vl和v2的元素分別獨立地重新排列而得到的矢量wl和w2, 求出基于從所述矢量vl的相關系數減去所述矢量《I的相關系數而得到的值與從所述矢量v2的相關系數減去所述矢量w2的相關系數而得到的值之間的定量關聯性的類似度, 求出由所述wl和w2的各元素的組構成的集合的熵與由vl和v2的各元素的組構成的集合的熵之比作為基于同現性的類似度, 計算通過以使同一矢量下的所述求出的兩個類似度的值接近的方式制作變換函數來校正了值的兩個類似度中的大的值作為兩個概率變量間的概率依賴度。
8.根據權利要求7所述的分析系統,其特征在于, 所述因果/轉移構造計算部在所述節點間的概率依賴度為規定的基準以下的節點間既不定義無向邊,也不定義有向邊。
9.根據權利要求7所述的分析系統,其特征在于, 所述節點生成部將所述節點間的概率依賴度為規定的基準以上的節點彼此匯集,定義為新的一個節點, 利用所述新定義的節點的圖形構造來重構模型。
10.根據權利要求2所述的分析系統,其特征在于, 所述節點生成部針對具有子節點的母節點,以使與所述母節點的值和所述子節點的值的各個組一致的事例數在所述整形信息中存在規定的基準以上的方式,將所述節點的事例數少的現象進行合并,由此確定所述節點的現象空間。
11.根據權利要求1所述的分析系統,其特征在于, 所述節點生成部通過將具有子節點的母節點的現象中、所述子節點的附條件概率分布的變化為規定的基準以下的現象進行合并,來確定所述節點的現象空間。
12.根據權利要求1所述的分析系統,其特征在于, 所述健康指導支援部從所述加入者的預測醫療費減去將所述加入者的檢查值置換為保健指導服務所產生的改善后檢查值而得到的第2預測醫療費和所述保健指導服務的費用,來計算預測效果, 將所述計算的預測效果高的加入者與健康指導服務的組選定為健康指導的對象者和健康指導內容。
13.根據權利要求1所述的分析系統,其特征在于, 所述健康指導支援部根據所述加入者的病態的轉移概率與病態的平均轉移概率之比,計算第I發病風險, 通過由用戶輸入檢查值改善目標值,使用將所述加入者的檢查值置換為所述改善目標值而得到的病態的轉移概率,計算第2發病風險, 通過比較所述第I發病風險與所述第2發病風險,生成用于顯示改善所產生的風險降低效果的數據。
14.一種分析系統,具有執行程序的處理器以及保存所述程序的存儲器,通過執行所述程序來對數據進行分析,該分析系統的特征在于, 所述分析系統能夠訪問保存表形式信息的數據庫,該表形式信息在列中記載數據的屬性項目,在行中記載數據入口, 所述分析系統具備: 圖形模型構造計算部,所述處理器基于所述表形式信息,制作由有向邊或無向邊定義了表示屬性項目的概率變量間的概率依賴性的圖形構造,將所述制作的圖形構造保存到所述數據庫; 節點生成部,所述處理器基于所述表形式信息,制作所述概率變量的現象空間,將所述制作的現象空間保存到所述數據庫; 概率表計算部,所述處理器基于所述表形式信息和所述現象空間,計算所述圖形構造的附條件概率,將所述計算的附條件概率保存到所述數據庫; 模型重構部,所述處理器基于由所述圖形構造、所述現象空間以及所述附條件概率構成的模型,利用由所指定的概率變量構成的圖形構造、現象空間、附條件概率重構模型,將所述重構的模型保存到所述數據庫;以及 概率推斷部,所述處理器基于所述重構的模型,計算各概率變量取各狀態的概率。
15.一種健康事業支援方法,使用具有執行程序的處理器以及保存所述程序的存儲器的計算機支援健康指導,該健康事業支援方法的特征在于, 所述計算機能夠訪問保存醫療信息、體檢信息及費用信息的數據庫,所述醫療信息包含加入者的傷病名和對所述加入者進行的醫療行為,所述體檢信息包含所述加入者的健康診斷的檢查值,所述費用信息為所述醫療行為的費用信息, 所述健康事業支援方法包括如下步驟: 因果/轉移構造計算步驟,所述處理器基于所述醫療信息和所述體檢信息制作圖形構造,將所述制作的圖形構造保存到所述數據庫,其中,該圖形構造中,由有向邊或無向邊定義了與表示疾病的狀態的概率變量對應的節點和與表示對疾病的狀態的變化產生影響的因子的概率變量對應的節點之間的概率依賴性; 節點生成步驟,所述處理器基于所述醫療信息和體檢信息,制作所述概率變量的現象空間,將所述制作的現象空間保存到所述數據庫; 概率計算步驟,所述處理器基于所述醫療信息、所述體檢信息以及所述現象空間,計算所述圖形構造的附條件概率,將所述計算的附條件概率保存到所述數據庫; 模型重構步驟,所述處理器基于由所述圖形構造、所述現象空間以及所述附條件概率構成的模型,利用由所指定的概率變量構成的圖形構造、現象空間以及附條件概率重構模型,將所述重構的模型保存到所述數據庫; 病態轉移/醫療費預測步驟,所述處理器基于所述醫療行為的費用信息和所述重構的模型,預測病態轉移概率和醫療費;以及 健康指導支援步驟,所述處理器基于所述預測的病態轉移概率和醫療費,選定健康指導的對象者和健康指導內容。
【文檔編號】G06F17/30GK104166667SQ201410208444
【公開日】2014年11月26日 申請日期:2014年5月16日 優先權日:2013年5月17日
【發明者】三好利升, 長谷川泰隆, 伴秀行, 永崎健, 新莊廣 申請人:株式會社日立制作所