數據挖掘方法及裝置的制造方法
【技術領域】
[0001 ] 本發明實施例涉及數據分析技術,尤其涉及一種數據挖掘方法及裝置。
【背景技術】
[0002]數據挖掘一般是指從大量的數據中自動搜索隱藏于其中的有著特殊關系的信息過程,包括數據準備、關系尋找和結果顯示三個步驟。
[0003]現有的數據挖掘過程具體為確定待處理的目標數據,依據目標數據的數據類型確定數據挖掘算法,依據數據挖掘算法對目標數據進行計算處理,具體可以為尋找目標數據中的關聯關系,將確定的關聯關系進行結果顯示。
[0004]由于屬于特定數據類型的目標數據只能依據固定的數據挖掘算法進行處理,導致數據挖掘對目標數據進行數據處理的靈活性較低。
【發明內容】
[0005]本發明實施例提供一種數據挖掘方法及裝置,以提高數據挖掘對目標數據進行數據處理的靈活性。
[0006]本發明實施例的一個方面是提供一種數據挖掘方法,包括:
[0007]確定待處理的目標數據;
[0008]依據至少兩種數據挖掘算法分別對所述目標數據進行數據處理,分別獲得第一處理結果;
[0009]將所述第一處理結果作為所述目標數據,依據所述至少兩種數據挖掘算法分別對所述第一處理結果進行數據處理,獲得第二處理結果;
[0010]顯示所述第一處理結果和/或第二處理結果,以供用戶選擇。
[0011]本發明實施例的另一個方面是提供一種數據挖掘裝置,包括:
[0012]目標數據確定模塊,用于確定待處理的目標數據;
[0013]數據處理模塊,用于依據至少兩種數據挖掘算法分別對所述目標數據進行數據處理,分別獲得第一處理結果;將所述第一處理結果作為所述目標數據,依據所述至少兩種數據挖掘算法分別對所述第一處理結果進行數據處理,獲得第二處理結果;
[0014]顯示模塊,用于顯示所述第一處理結果和/或第二處理結果,以供用戶選擇。
[0015]本發明實施例提供的數據挖掘方法及裝置,通過至少兩種數據挖掘算法分別對目標數據進行數據處理,獲取到至少兩個處理結果,并且將第一次處理的結果作為第二次處理的輸入數據,形成循環的數據處理過程,相比于屬于特定數據類型的目標數據只能依據固定的數據挖掘算法進行處理,增強了數據挖掘對目標數據進行數據處理的靈活性。
【附圖說明】
[0016]圖1為本發明實施例提供的數據挖掘方法流程圖;
[0017]圖2為本發明實施例提供的數據挖掘裝置的結構圖;
[0018]圖3為本發明另一實施例提供的數據挖掘裝置的結構圖。
【具體實施方式】
[0019]圖1為本發明實施例提供的數據挖掘方法流程圖。本發明實施例針對數據挖掘對目標數據進行數據處理的靈活性低的問題,提出了一種新的數據挖掘方法,該方法的具體步驟如下:
[0020]步驟S101、確定待處理的目標數據;
[0021]所述確定待處理的目標數據包括:將多個文件和/或多個數據庫中的數據進行合并;對合并后的數據進行數據選擇獲得數據集合;從所述數據集合中選擇出適用于所述至少兩種數據挖掘算法進行處理的所述目標數據。
[0022]利用數據挖掘算法進行數據處理之前,先要確定待處理的目標數據,具體地將多個文件和/或多個數據庫中的數據進行合并,以便獲取到足夠多的數據,從足夠多的數據中依據數據處理的需求進行數據選擇獲得數據集合,再依據預定的至少兩種數據挖掘算法從該數據集合中選擇出適用于數據挖掘的目標數據。
[0023]步驟S102、依據至少兩種數據挖掘算法分別對所述目標數據進行數據處理,分別獲得第一處理結果;
[0024]確定出目標數據后,依據至少兩種數據挖掘算法分別對所述目標數據進行數據處理,每一種數據挖掘算法對目標數據進行處理后將獲得一個處理結果,則經過至少兩種數據挖掘算法進行處理將至少獲得兩個處理結果即第一處理結果。
[0025]步驟S103、將所述第一處理結果作為所述目標數據,依據所述至少兩種數據挖掘算法分別對所述第一處理結果進行數據處理,獲得第二處理結果;
[0026]返回到步驟S101,將獲得的第一處理結果再次作為所述目標數據,繼續執行步驟S102,依據所述至少兩種數據挖掘算法分別對所述第一處理結果進行數據處理,獲得第二處理結果。即數據挖掘的處理結果還可以作為數據挖掘的輸入數據進行再次數據處理,形成循環的數據處理。
[0027]步驟S104、顯示所述第一處理結果和/或第二處理結果,以供用戶選擇。
[0028]將所述第一處理結果和/或第二處理結果進行顯示,即循環的數據處理結果可以直接輸入供用戶選擇,也可以不輸出進行后續的循環處理。
[0029]本發明實施例不限制循環處理的次數,且數據挖掘算法至少包括:決策樹、關聯規貝U、貝葉斯、神經網絡、規則學習、遺傳算法、粗糙集和模糊邏輯。
[0030]本發明實施例通過至少兩種數據挖掘算法分別對目標數據進行數據處理,獲取到至少兩個處理結果,并且將第一次處理的結果作為第二次處理的輸入數據,形成循環的數據處理過程,相比于屬于特定數據類型的目標數據只能依據固定的數據挖掘算法進行處理,增強了數據挖掘對目標數據進行數據處理的靈活性。
[0031]在上述實施例的基礎上,所述依據至少兩種數據挖掘算法分別對所述目標數據進行數據處理包括:依據所述至少兩種數據挖掘算法和初始優先級分別對所述目標數據進行數據處理,所述初始優先級是依據所述目標數據對應的數據類型與所述數據挖掘算法的適用度確定的。
[0032]本發明實施例預定有三種數據挖掘算法分別為A算法、B算法、C算法,所述A算法、B算法、C算法可以分別由不同的服務器執行,也可以由同一個服務器同時運行,在初始條件下,A算法、B算法、C算法對不同類型的數據進行處理的優先級不同,假設對同一類目標數據,A算法、B算法、C算法對應的優先級分別是高、中、低。當該類型的目標數據輸入到服務器后,通過A算法、B算法、C算法依次對目標數據進行處理,合理假設通過A算法、B算法、C算法對目標數據的處理速度相同,則通過A算法對目標數據進行處理的結果a將最先顯示,其次是通過B算法對目標數據進行處理的結果b,最后顯示通過C算法對目標數據進行處理的結果C。
[0033]所述顯示所述第一處理結果之后,還包括:獲取用戶對所述第一處理結果的反饋信息,依據所述反饋信息調整所述目標數據對應的數據類型與所述數據挖掘算法的適用度。
[0034]弟一處理結果包括結果a、結果b和結果C,且結果a、結果b和結果c先后顯不。用戶對結果a、結果b和結果c的點擊率以及滿意度都不同,該點擊率以及滿意度均可以作為反饋信息,在本發明實施例中,除了執行數據挖掘算法的服務器外,還有一個起到調度作用的調度服務器,該調度服務器用于記錄用戶對處理結果的反饋信息,具體記錄處理結果、反饋信息、數據挖掘算法和數據類型的對應關系。如果反饋信息表示用戶對處理結果的點擊率超出了閾值,或用戶對處理結果的平均評分超出了閾值,則說明該數據類型適用于依據該數據挖掘算法進行數據處理,即該數據類型與該數據挖掘算法的適用度高,并提高該數據挖掘算法對該數據類型的處理優先級。例如,通過反饋信息確定出用戶對結果b的滿意度最高,則提高B算法對該數據類型的優先級,后續若有屬于該數據類型的目標數據輸入到服務器,則通過B算法最先處理該目標數據。
[0035]本發明實施例通過用戶對數據處理結果的反饋信息來調整至少兩種數據挖掘算法對目標數據的處理優先級,可以實現對處理結果的顯示順序進行調整,增強了顯示處理結果的靈活性。
[0036]在上述實施例的基礎上,所述至少兩種數據挖掘算法包括第一數據挖掘算法和第二數據挖掘算法;所述依據至少兩種數據挖掘算法分別對所述目標數據進行數據處理包括:依據所述第一數據挖掘算法對所述目標數據進行數據處理獲得中間處理結果;依據所述第二數據挖掘算法對所述中間處理結果進行數據處理獲得所述第一處理結果。
[0037]本發明實施例預定有三種數據挖掘算法分別為A算法、B算法、C算法,通過A算法、B算法、C算法分別對目標數據進行處理獲得結果a、結果b和結果C,同時結果b作為中間處理結果還可以是C算法的輸入數據,即結果b還可以通過C算法進行再次數據處理獲得結果d,即本發明實施例提供的A算法、B算法、C算法可以衍生出B+C算法即先執行B算法后執行C算法,相應的產生結果d。同理,還可以衍生出C+B算法即先執行C算法后執行B算法,或者A+B+C算法等。
[0038]本發明實施例將多個數據挖掘算法中的兩個或者多個進行結合獲得新的組合算法,進一步增加了數據挖掘算法的多樣性,以及數據挖掘對目標數據進行數據處理的靈活性。
[0039]圖2為本發明實施例提供的數據挖掘裝置的結構圖。本發明實施例提供的數據挖掘裝置可以執行數據挖掘方法實施例提供的處理流程,如圖2所示,數據挖掘裝置20包括目標數據確定模塊21、數據處理模塊22和顯示模塊23,其中,目標數據確定模塊21用于確定待處理的目標數據;數據處理模塊22用于依據至少兩種數據挖掘算法分別對所述目標數據進行數據處理,分別獲得第一處理結果;將所述第一處理結果作為所述目標數據,依據所述至少兩種數據挖掘算法分別對所述第一處理結果進行數據處理,獲得第二處理結果;顯示模塊23用于顯示所述第一處理結果和/或第二處理結果,以供用戶選擇。
[0040]本發明實施例通過至少兩種數據挖掘算法分別對目標數據進行數據處理,獲取到至少兩個處理結果,并且將第