本申請涉及糖尿病轉化風險的人工智能預測,具體而言涉及一種構建非糖尿病分型模型及預測非糖尿病分型的方法和裝置。
背景技術:
1、糖尿病的患病率在近幾十年里迅速增加,成為日益嚴重的公共健康問題。對非糖尿病人群的預警與分層管理對糖尿病的防控至關重要,特別是糖尿病前期人群,糖尿病前期屬于一種沒有癥狀的亞臨床狀態,全球患病率約為10%~30%。
2、然而,糖尿病前期可以轉化為2型糖尿病,年轉化率為5%~10%。2型糖尿病與發病率、死亡率相關,因此,對非糖尿病人群進行分型,確定哪些個體有轉化為糖尿病的風險,并提供有針對性的、適當的飲食和運動干預建議非常重要。
技術實現思路
1、基于此,有必要提供一種構建非糖尿病分型模型、預測非糖尿病分型的方法和裝置,以預測非糖尿病人群的糖尿病轉化風險。
2、本申請的第一目的在于提供一種構建非糖尿病分型模型的方法,包括:
3、獲取目標樣本的動態血糖濃度數據,基于目標樣本的動態血糖濃度數據以無監督的方式進行機器學習得到預訓練模型;
4、獲取預訓練模型輸出的多個非糖尿病樣本的血糖動態特征數據,對多個非糖尿病樣本的血糖動態特征數據進行聚類得到非糖尿病血糖動態分布數據;
5、其中,非糖尿病血糖動態分布數據包括多個血糖動態特征數據簇及其表示的非糖尿病分型;
6、目標樣本包括多個非糖尿病樣本和多個糖尿病樣本,多個非糖尿病樣本包括多個正常糖耐量樣本和多個糖耐量受損樣本。
7、本申請中,經過在大規模cgm數據中進行機器學習得到的預訓練模型能夠無監督地從大量無標簽的cgm數據中學習血糖波動的動態特征與模式,捕獲個體血糖動態特征,進而基于大規模cgm數據捕獲的血糖動態特征數據聚類得到的不同非糖尿病分型對應的血糖動態特征分布數據,構建非糖尿病分型模型。
8、在其中一個實施方式中,基于目標樣本的動態血糖濃度數據以無監督的方式進行機器學習得到預訓練模型包括:
9、對目標樣本的動態血糖濃度數據進行預處理得到目標樣本的動態血糖序列數據;
10、將目標樣本的動態血糖序列數據輸入初始模型得到目標樣本的血糖動態特征數據;
11、對目標樣本的動態血糖序列數據進行掩碼處理以獲取目標樣本掩碼后的動態血糖序列數據,將目標樣本掩碼后的動態血糖序列數據輸入初始模型得到目標樣本掩碼后的血糖動態特征數據;
12、根據目標樣本的血糖動態特征數據和目標樣本掩碼后的血糖動態特征數據確定訓練損失,根據訓練損失更新初始模型的參數,根據更新參數后的初始模型得到預訓練模型。
13、在其中一個實施方式中,初始模型包括初始編碼層和初始預測層,初始預測層包括多頭自注意力機制層和前饋神經網絡層。
14、在其中一個實施方式中,方法還包括:
15、獲取每個血糖動態特征數據簇對應的多個臨床特征,根據多個臨床特征和每個血糖動態特征數據簇的血糖波動特征確定每個非糖尿病分型的糖尿病風險。
16、本申請的第二目的在于提供一種預測非糖尿病分型的方法,包括:
17、獲取待測樣本的動態血糖濃度數據;
18、根據待測樣本的動態血糖濃度數據確定待測樣本的非糖尿病分型;
19、其中,方法基于非糖尿病分型模型實現,非糖尿病分型模型用于執行以下步驟:
20、將待測樣本的動態血糖濃度數據輸入預訓練模型得到待測樣本的血糖動態特征數據;
21、基于待測樣本的血糖動態特征數據和非糖尿病血糖動態分布數據確定待測樣本的非糖尿病分型;
22、預訓練模型基于目標樣本的動態血糖濃度數據以無監督的方式進行機器學習得到,目標樣本包括多個非糖尿病樣本和多個糖尿病樣本,多個非糖尿病樣本包括多個正常糖耐量樣本和多個糖耐量受損樣本;
23、非糖尿病血糖動態分布數據包括多個血糖動態特征數據簇,多個血糖動態特征數據簇根據預訓練模型輸出的多個非糖尿病樣本的血糖動態特征數據聚類得到。
24、在其中一個實施方式中,基于待測樣本的血糖動態特征數據和非糖尿病血糖動態分布數據確定待測樣本的非糖尿病分型包括:
25、計算待測樣本的血糖動態特征數據和每個血糖動態特征數據簇的平均距離;
26、根據平均距離最小的血糖動態特征數據簇表示的非糖尿病分型確定待測樣本的非糖尿病分型;
27、可選地,預訓練模型包括預先訓練的編碼層和預測層,預測層包括多頭自注意力機制層和前饋神經網絡層。
28、本申請的第三目的在于提供一種構建非糖尿病分型模型的裝置,包括:
29、預訓練模塊:用于獲取目標樣本的動態血糖濃度數據,基于目標樣本的動態血糖濃度數據以無監督的方式進行機器學習得到預訓練模型;
30、聚類模塊:用于獲取預訓練模型輸出的多個非糖尿病樣本的血糖動態特征數據,對多個非糖尿病樣本的血糖動態特征數據進行聚類得到得到非糖尿病血糖動態分布數據;
31、其中,非糖尿病血糖動態分布數據包括多個血糖動態特征數據簇及其表示的非糖尿病分型;
32、目標樣本包括多個非糖尿病樣本和多個糖尿病樣本,多個非糖尿病樣本包括多個正常糖耐量樣本和多個糖耐量受損樣本。
33、本申請的第四目的在于提供一種預測非糖尿病分型的方法,包括:
34、數據獲取模塊:用于獲取待測樣本的動態血糖濃度數據;
35、非糖尿病分型模塊:用于根據待測樣本的動態血糖濃度數據確定待測樣本的非糖尿病分型;
36、其中,裝置基于非糖尿病分型模型實現,非糖尿病分型模型用于執行以下步驟:
37、將待測樣本的動態血糖濃度數據輸入預訓練模型得到待測樣本的血糖動態特征數據;
38、基于待測樣本的血糖動態特征數據和非糖尿病血糖動態分布數據確定待測樣本的非糖尿病分型;
39、預訓練模型基于目標樣本的動態血糖濃度數據以無監督的方式進行機器學習得到,目標樣本包括多個非糖尿病樣本和多個糖尿病樣本,多個非糖尿病樣本包括多個正常糖耐量樣本和多個糖耐量受損樣本;
40、非糖尿病血糖動態分布數包括多個血糖動態特征數據簇,多個血糖動態特征數據簇根據預訓練模型輸出的多個非糖尿病樣本的血糖動態特征數據聚類得到。
41、本申請的第五目的在于提供一種計算機設備,包括存儲器和處理器,存儲器存儲有計算機程序,處理器執行計算機程序時實現上述方法的步驟。
42、本申請的第六目的在于提供一種計算機可讀存儲介質,其上存儲有計算機程序,計算機程序被處理器執行時實現上述方法的步驟。
43、本申請的第七目的在于提供一種計算機程序產品,包括計算機程序,其特征在于,該計算機程序被處理器執行時實現上述方法的步驟。
1.一種構建非糖尿病分型模型的方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述基于目標樣本的動態血糖濃度數據以無監督的方式進行機器學習得到預訓練模型包括:
3.根據權利要求2所述的方法,其特征在于,所述初始模型包括初始編碼層和初始預測層,所述初始預測層包括多頭自注意力機制層和前饋神經網絡層。
4.根據權利要求1~3任一項所述的方法,其特征在于,所述方法還包括:
5.一種預測非糖尿病分型的方法,其特征在于,包括:
6.根據權利要求5所述的方法,其特征在于,所述基于待測樣本的血糖動態特征數據和非糖尿病血糖動態分布數據確定待測樣本的非糖尿病分型包括:
7.一種構建非糖尿病分型模型的裝置,其特征在于,包括:
8.一種預測非糖尿病分型的方法,其特征在于,包括:
9.一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1~6中任一項所述的方法的步驟。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1~6中任一項所述的方法的步驟。