技術領域:
本發明涉及一種中醫方藥數據分析挖掘系統。
背景技術:
:
中醫藥是中華民族的瑰寶,是重要的社會資源。而中醫藥的最主要的載體就是中藥方藥。中醫方藥作為從歷代中醫先賢智慧的結晶,得到了越來越多的重視。正因如此,隨著現在科學技術的發展,對原始的中醫方藥作進行分析挖掘以得到深層次的信息也愈加重要。但是現有的分析方法局限于利用一些現有的分析方法移植到中藥領域進行分析,或者是雖然專用于中藥,但是分析維度局限性較大,無法分析出各個方藥之間的潛在信息。現有技術對此并沒有解決之策。
技術實現要素:
:
本發明的目的就是針對現有技術存在的上述缺點,提供了一種中醫方藥數據分析挖掘系統,系統設計合理,能夠得到深層次的中醫方藥信息,解決了現有技術中存在的問題。
本發明為解決上述技術問題所采用的技術方案是:
一種中醫方藥數據分析挖掘系統,包括方藥數據庫、數據輸入模塊、標準輸出模塊、數據分析挖掘模塊;
所述數據輸入模塊用于輸入方藥數據;
所述方藥數據庫用于接收數據輸入模塊的方藥數據,并為各個模塊提供方藥數據;
所述標準輸出模塊用于從方藥數據庫中提取方藥數據并按照指定格式輸出格式數據;
所述數據分析挖掘模塊用于從方藥數據庫獲取方藥數據,并對方藥數據進行數據分析挖掘處理。
優選的,所述方藥數據包括如下五個維度:方劑名稱、指定中藥、中醫證候、西醫疾病、中醫疾病、中醫癥狀。
優選的,所述標準輸出模塊輸出適于sas、spss的格式數據。
優選的,所述數據分析挖掘模塊包括分析模塊,聚類模塊、關聯模塊、組合模塊;
所述分析模塊用于對方藥數據分別根據指定中藥、中醫證候、西醫疾病、中醫疾病、中醫癥狀分別進行成組分析;
所述聚類模塊根據設定聚類閾值,在指定中藥、中醫證候、西醫疾病、中醫疾病、中醫癥狀中五個維度中綜合判斷,對藥物進行成組分析;
所述關聯模塊根據分析模塊得到的指定中藥成組分析情況,對藥物出現頻次超過設定閾值的藥物進行與其他藥物的網絡聯系統計;
所述組合模塊根據分析模塊得到的藥物分析情況,對藥物出現頻次超過設定值的藥物分別分析與其他藥物同時出現的頻次。
優選的,所述關聯模塊給出的各個藥物后統計該藥物出現頻次和與該藥物有網絡聯系的藥物數量。
優選的,所述聚類閾值包括數值閾值模塊和維度描述比較模塊,所述維度描述比較模塊用于分別將不同方藥中的指定中藥、中醫證候、西醫疾病、中醫疾病、中醫癥狀進行相似度對比,若相似度達到設定值,則將信息傳遞給數值閾值模塊;所述數值閾值模塊統計指定中藥、中醫證候、西醫疾病、中醫疾病、中醫癥狀中經維度描述比較模塊比較后,相似度高的維度的數目,并判斷是否達到聚類閾值的要求。
與現有技術相比,本發明的優點是:優化系統本身功能,提供對外的接口,即標準輸出模塊可以輸出適合sas和spss的格式數據;提供不同的分析維度進行數據分析,分析模塊提供原始的分析基礎,聚類模塊能夠在指定中藥、中醫證候、西醫疾病、中醫疾病、中醫癥狀五個維度內尋找相切和的點,并把這些點根據聚類閾值的限制,揭開方藥數據之間的聯系,而關聯模塊和組合模塊用于對一些高頻次出現的藥物進行數據挖掘,并得到和其相關的其他藥物的組合信息。
附圖說明:
圖1為本發明的示意圖。
具體實施方式:
為能清楚說明本方案的技術特點,下面通過具體實施方式,并結合其附圖,對本發明進行詳細闡述。
如圖1所示,一種中醫方藥數據分析挖掘系統,包括方藥數據庫、數據輸入模塊、標準輸出模塊、數據分析挖掘模塊;
所述數據輸入模塊用于輸入方藥數據;
所述方藥數據庫用于接收數據輸入模塊的方藥數據,并為各個模塊提供方藥數據;
所述標準輸出模塊用于從方藥數據庫中提取方藥數據并按照指定格式輸出格式數據;
所述數據分析挖掘模塊用于從方藥數據庫獲取方藥數據,并對方藥數據進行數據分析挖掘處理。實現方藥數據的輸入和輸出。
所述方藥數據包括方劑名稱、指定中藥、中醫證候、西醫疾病、中醫疾病、中醫癥狀。通過設定方藥數據的范圍,能夠強化輸入信息的有效性,也能便于后期進行數據分析挖掘時,基礎數據的充足。
所述標準輸出模塊輸出適于sas、spss的格式數據。提供本系統與其他傳統系統的一個輸出口。
所述數據分析挖掘模塊包括分析模塊,聚類模塊、關聯模塊、組合模塊;
所述分析模塊用于對方藥數據分別根據指定中藥、中醫證候、西醫疾病、中醫疾病、中醫癥狀分別進行成組分析;分析模塊主要是根據指定中藥、中醫證候、西醫疾病、中醫疾病、中醫癥狀對方藥進行成組分析,根據藥物進行成組分析能夠解析出各個藥物在所有方藥中出現的頻次;根據中醫證候進行成組分析能夠看出各個中醫癥候有哪些方藥可以進行治療;根據西醫疾病進行成組分析則能夠根據西醫疾病的名稱與對其有治療效果的方藥對應起來;根據中醫疾病進行成組分析則能夠根據中醫疾病的名稱與對其有治療效果的方藥對應起來;根據根據中醫癥狀進行成組分析能夠看出各個中醫癥狀有哪些方藥可以進行治療。
所述聚類模塊根據設定聚類閾值,在指定中藥、中醫證候、西醫疾病、中醫疾病、中醫癥狀中五個維度中綜合判斷,對藥物進行成組分析;所述聚類閾值包括數值閾值模塊和維度描述比較模塊,所述數值閾值模塊為指定中藥、中醫證候、西醫疾病、中醫疾病、中醫癥狀中相似度高的數目;所述維度描述比較模塊用于分別將不同方藥中的指定中藥、中醫證候、西醫疾病、中醫疾病、中醫癥狀進行相似度對比。進行多個維度的判斷能夠識別出哪些藥物與相應的中醫證候、西醫疾病、中醫疾病、中醫癥狀分別對應,從而挖掘出一個深層次的對應關系。由此可以得到,哪一味或者哪幾味藥對相應的中醫證候、西醫疾病、中醫疾病、中醫癥狀有最核心的作用。數值閾值模塊規定了在如下五個維度:指定中藥、中醫證候、西醫疾病、中醫疾病、中醫癥候,相似度高的數目為多少時,對方藥數據進行成組分析;維度描述比較模塊用于對指定中藥、中醫證候、西醫疾病、中醫疾病、中醫癥候逐個進行對比,并確定是否近似,若近似度達到80%或者以上,則將此維度計入數值閾值模塊。
所述關聯模塊根據分析模塊得到的指定中藥成組分析情況,對藥物出現頻次超過設定閾值的藥物進行與其他藥物的網絡聯系統計;
所述組合模塊根據分析模塊得到的藥物分析情況,對藥物出現頻次超過設定值的藥物分別分析與其他藥物同時出現的頻次。
所述關聯模塊給出的各個藥物后統計該藥物出現頻次和與該藥物有網絡聯系的藥物數量。關聯模塊和組合模塊用于對一些高頻次出現的藥物進行數據挖掘,并得到和其相關的其他藥物的組合信息。
本系統用于中醫方藥的數據處理以及分析挖掘工作,首先通過數據輸入模塊解決了數據輸入的問題,并且在數據輸入模塊通過設置子目錄解決了數據輸入規范化的問題;而數據輸出模塊則解決了內部數據與其他分析軟件數據交互的問題;數據分析挖掘模塊則立足于方藥的基礎數據,通過其內部的分析模塊提供基礎的分析數據,在此基礎上,聚類模塊立足于系統的整體分析,在指定中藥、中醫證候、西醫疾病、中醫疾病、中醫癥狀五個維度內尋找各個方藥相切和的點,并把這些點根據聚類閾值的限制,給出最終的聚類結果,為研究人員發現其內在聯系,提供底層的數據和思路;而關聯模塊和組合模塊用于對一些高頻次出現的藥物進行數據挖掘,并得到和其相關的其他藥物的組合信息,從而為某些疾病的治療提供一基礎性方藥,并為各個藥物之間存在的協同等作用提供數據基礎和依據。
上述具體實施方式不能作為對本發明保護范圍的限制,對于本技術領域的技術人員來說,對本發明實施方式所做出的任何替代改進或變換均落在本發明的保護范圍內。
本發明未詳述之處,均為本技術領域技術人員的公知技術。