本發明涉及醫療數據處理,更具體地說,本發明涉及一種預測胃腸道腫瘤患者術后并發癥的模型構建方法。
背景技術:
1、胃腸道腫瘤患者術后并發癥預測模型的構建是指基于患者術前、術中和術后收集的臨床數據,利用統計學方法、機器學習算法和時間序列分析技術,提取出與術后并發癥相關的關鍵特征,并將這些特征輸入到預測模型中,以預測患者術后可能出現的并發癥。該模型旨在通過對大量患者數據的分析,識別出高風險患者,并為臨床決策提供支持,從而提高患者的術后管理質量,減少并發癥的發生率,改善患者的預后。例如在公開號為cn114822821a的發明一種預測胃腸道腫瘤患者術后并發癥發生概率的列線圖模型及構建方法中,通過對患者臨床特征數據的分析選擇,得到與術后并發癥相關性顯著的因素,進一步構建相應的列線圖模型;提供2種列線圖模型,分別用于預測胃腸道腫瘤患者術后7天內、30天內的并發癥發生概率,以達到提早識別術后并發癥高危人群并及早干預的目的;模型預測準確度和區分度高,簡單、直觀、易于臨床推廣應用,可輔助醫生提早判斷胃腸道腫瘤患者的術后并發癥發生,同時利于臨床醫生對胃腸道腫瘤疾病進行個體化管理。
2、在進行胃腸道腫瘤患者術后并發癥預測模型的構建過程中,對胃腸道腫瘤患者的全面數據的時間序列數據的處理和特征提取是關鍵步驟。時間序列數據中蘊含了大量關于患者術后健康變化的信息,這些信息對預測并發癥的發生具有重要意義。
3、在時間序列數據中特征提取中,若不能準確的對提取特征的準確性進行評估,可能會導致所選特征在模型中的表現不穩定,這種不穩定性會導致預測模型對特征的依賴性不合理,進而影響模型的整體預測性能和可靠性。此外,現有方法在面對數據的多樣性和復雜性時,缺乏系統性的分析工具來有效篩選和驗證這些關鍵時間依賴特征。這種不足不僅影響了特征的選擇質量,也削弱了模型在實際應用中的魯棒性和可靠性。
4、為了解決上述問題,現提供一種技術方案。
技術實現思路
1、為了克服現有技術的上述缺陷,本發明的實施例提供一種預測胃腸道腫瘤患者術后并發癥的模型構建方法以解決上述背景技術中提出的問題。
2、為實現上述目的,本發明提供如下技術方案:
3、一種預測胃腸道腫瘤患者術后并發癥的模型構建方法,包括如下步驟:
4、s1:收集胃腸道腫瘤患者的全面數據,胃腸道腫瘤患者的全面數據包括術前數據、術中數據以及術后數據;
5、s2:對收集的胃腸道腫瘤患者的全面數據進行標準化處理,建立全面數據集;
6、s3:利用統計方法和時間序列分析技術從全面數據集中提取關鍵時間依賴特征;引入神經網絡中的門控機制,動態調整不同時間點關鍵時間依賴特征的權重;
7、s4:采用bootstrap技術對全面數據集進行重采樣,通過多次提取關鍵時間依賴特征,結合kl散度與js散度,評估關鍵時間依賴特征的穩定性;
8、s5:引入變點檢測方法來評估關鍵時間依賴特征的時間依賴性是否隨時間發生顯著改變;
9、s6:基于步驟s4和步驟s5綜合判斷提取的關鍵時間依賴特征可信度是否達標。
10、在一個優選的實施方式中,對收集的胃腸道腫瘤患者的全面數據進行標準化處理,建立全面數據集,具體為:
11、將術前數據、術中數據以及術后數據整合到統一的數據庫中;
12、將所有數據轉換為統一格式;對數值數據進行量綱統一處理;識別數據中的缺失值并進行填充;
13、對分類數據進行編碼處理;對數值型數據進行歸一化處理;
14、將處理后的數據編譯成最終的全面數據集,用于后續的模型訓練和分析。
15、在一個優選的實施方式中,利用統計方法和時間序列分析技術從全面數據集中提取關鍵時間依賴特征;引入神經網絡中的門控機制,動態調整不同時間點關鍵時間依賴特征的權重,具體包括:
16、s301:應用自回歸移動平均模型,從全面數據集中提取基礎的時間依賴特征;
17、s302:運用傅里葉變換分析方法識別全面數據中的周期性和趨勢性特征;
18、s303:使用門控循環單元處理和優化時間序列數據的關鍵時間依賴特征:
19、門控循環單元的更新門表示為:;門控循環單元的重置門表示為:;其中,和分別為更新門和重置門,為上一個時刻的隱藏狀態,為當前輸入,和分別為更新門和重置門的權重矩陣;為sigmoid激活函數;
20、使用adam優化器對gru模型進行訓練;
21、s304:在神經網絡中集成注意力機制,根據模型在訓練過程中的表現動態調整各時間點關鍵時間依賴特征的權重:
22、根據每個時間步的重要性分配權重,具體公式為:;其中,用于計算輸入序列中每個元素的加權和,為查詢矩陣,為鍵矩陣,為值矩陣,為softmax激活函數,為查詢矩陣與鍵矩陣的轉置矩陣的點積,為鍵矩陣的維度。
23、在一個優選的實施方式中,采用bootstrap技術對全面數據集進行重采樣,通過多次提取關鍵時間依賴特征,結合kl散度與js散度,評估關鍵時間依賴特征的穩定性,具體包括:
24、s401:應用bootstrap技術對全面數據集進行多次重采樣:確定重采樣的次數,對于每一次重采樣,通過從原始全面數據集中隨機抽取多個數據點生成樣本集;
25、s402:在每個重采樣樣本集中提取關鍵時間依賴特征:在每個重采樣樣本集中應用預先定義的統計方法和時間序列分析技術提取關鍵時間依賴特征;
26、s403:對每次重采樣后提取的特征進行概率分布估計,建立每次重采樣的特征分布:
27、對提取的關鍵時間依賴特征進行概率分布估計的常用方法包括使用核密度估計和直方圖來估計特征的概率分布;
28、通過對每個重采樣樣本中的特征進行概率分布估計,構建每個重采樣樣本集的特征分布;
29、s404:使用kl散度計算每個重采樣樣本與原始數據特征分布的差異,衡量特征一致性;通過js散度評估重采樣樣本與原始數據特征分布的相似性,測度特征的差異性;
30、s405:結合kl散度和js散度,計算動態bootstrap一致性和差異性測度來評估關鍵時間依賴特征的穩定性。
31、在一個優選的實施方式中,步驟s404具體為:
32、使用kl散度計算每個重采樣樣本與原始數據特征分布的差異,公式為:;
33、為kl散度,為原始數據中特征的概率分布值,為第次重采樣中對應特征的概率分布值,為關鍵時間依賴特征的第個取值;
34、通過js散度評估重采樣樣本與原始數據特征分布的相似性,公式為:;其中,;
35、為js散度,為原始數據特征分布與均值分布之間的kl散度,為第次重采樣的特征分布與均值分布之間的kl散度,為原始數據特征分布,為第次重采樣特征分布。
36、在一個優選的實施方式中,步驟s405具體為:通過綜合考慮kl散度和js散度,計算關鍵時間依賴特征的動態bootstrap一致性和差異性測度;公式為:;其中,為特征的穩定性測度,是重采樣的總次數。
37、在一個優選的實施方式中,引入變點檢測方法來評估關鍵時間依賴特征的時間依賴性是否隨時間發生顯著改變,具體包括:
38、s501:將關鍵時間依賴特征在時間維度上構建為時間序列;
39、s502:選用貝葉斯變點檢測識別時間序列中的潛在變點:定義貝葉斯模型的先驗分布,模型使用事后概率評估每個時間點作為變點的可能性;通過動態規劃算法計算貝葉斯后驗概率,識別時間序列中的潛在變點;
40、s503:對時間序列進行窗口劃分,通過滑動窗口計算檢測特征在不同時間段內的穩定性:設定窗口大小,將時間序列按窗口劃分為多個子序列;在每個窗口內,計算關鍵時間依賴特征的局部均值和方差以評估特征在不同時間段內的穩定性;
41、s504:對檢測到的潛在變點進行顯著性測試,評估變點是否在統計意義上顯著;
42、s505:結合變點檢測結果,評估關鍵時間依賴特征的時間依賴性是否發生顯著改變:將通過顯著性測試驗證的變點信息整合到時間序列分析結果中;評估在檢測到的變點處,關鍵時間依賴特征的時間依賴性是否發生顯著改變;根據變點檢測和時間依賴性評估的結果,判斷關鍵時間依賴特征的時間依賴性是否在整個時間序列中保持穩定。
43、在一個優選的實施方式中,基于步驟s4和步驟s5綜合判斷提取的關鍵時間依賴特征可信度是否達標,具體為:
44、獲取關鍵時間依賴特征的時間依賴性是否隨時間發生顯著改變的判斷結果;
45、設定特征的穩定性測度對應的特征穩定評估閾值,將特征的穩定性測度與特征穩定評估閾值進行比較:
46、當特征的穩定性測度小于等于特征穩定評估閾值時,則判定關鍵時間依賴特征的穩定性正常;當特征的穩定性測度大于特征穩定評估閾值時,則判定關鍵時間依賴特征的穩定性差;
47、當關鍵時間依賴特征的時間依賴性未隨時間發生顯著改變,且關鍵時間依賴特征的穩定性正常時,則判定提取的關鍵時間依賴特征可信度達標;否則,則判定提取的關鍵時間依賴特征可信度不達標。
48、本發明一種預測胃腸道腫瘤患者術后并發癥的模型構建方法的技術效果和優點:
49、1、通過整合和分析胃腸道腫瘤患者的術前、術中及術后數據,提供了準確預測術后并發癥的堅實基礎,通過標準化處理,確保了數據的一致性和可比性,提高了后續分析的準確度和效率,利用統計方法和時間序列分析技術,結合神經網絡中的門控機制,增強了數據分析的深度,提升了模型對時間變化的敏感性和適應性,這些處理確保從復雜醫療數據中提取的關鍵特征能夠真實反映患者的健康狀態和術后風險,從而大幅提升預測模型的準確性和實用性。
50、2、通過引入bootstrap技術和變點檢測方法,進一步增強了對關鍵時間依賴特征的分析精度和可信度,bootstrap技術通過對數據集進行多次重采樣,配合kl散度與js散度分析,提供了一種量化特征穩定性的科學方法,這種方法有效識別出在不同條件下保持一致性的特征,從而篩選出更為可靠的預測指標,變點檢測使得模型能夠識別數據中的關鍵變化點,對特征的時間依賴性進行精確評估,這些技術的應用顯著增強了模型在實際臨床環境中的適應性和預測力,極大地幫助醫療專業人員進行術后風險管理和治療決策,旨在降低患者的并發癥風險并改善其術后恢復情況。