運動目標的關聯規則分析方法及系統的制作方法
【技術領域】
[0001] 本發明涉及數據挖掘技術領域,尤其涉及一種運動目標的關聯規則分析方法及系 統。
【背景技術】
[0002] 現代空域管理和監視已經是一種大范圍、快節奏的管理和監視方式,包括海、陸、 空、天多維度的多方平臺。隨著現代空域管理和監視過程中傳感器種類的增加以及傳感器 能力的提升,空域管理和監視范圍進一步擴大,方式日趨復雜化,區域內運動目標的數據量 和種類也隨之劇增,由此給運動目標的識別帶來了極大的困難。因此,在復雜環境下針對不 同飛行任務、不同目標,快速、準確地完成運動目標的識別,是未來空域管理和監視的先決 條件和必要保障。
[0003] 針對現有技術中運動目標的關聯規則分析方法:
[0004] (1)在數據挖掘方面,目前的處理方式幾乎都是基于當前、時刻的"靜態狀態"數 據進行挖掘,沒有考慮針對的"動態趨勢"數據進行處理,因而挖掘結果缺乏對運動 目標趨勢特性的體現,也同時會導致一些有用知識的遺漏;
[0005] ⑵在關聯規則分析方面,目前最為著名的算法是Apriori算法和 FP-Growth (Frequent Pattern-Growth,頻繁模式增長)算法,此外還有DHP、STEM算法等。 其中,Apriori算法采用了基于逐層搜索求解頻繁項集的迭代的方法,其過程簡單,且易于 理解,沒有復雜的算法,實現起來也比較容易,但需要多次掃描數據庫(數據表)且產生大 量候選頻繁項集,實用性不夠高,效率很低。FP-Growth算法是一種不產生候選頻繁項的挖 掘算法,其基本思想是將事務數據庫壓縮到一顆FP (Frequent Pattern,頻繁模式)樹中, 采用分而治之的思想,自底向上挖掘FP樹,最終輸出所有的頻繁項集,但該算法在遍歷FP 樹時需要消耗大量時間,且在支持度計算時需要完全遍歷,無法充分利用算法的中間結果, 導致時間和空間效率略低。此外,Apriori算法和FP-Growth算法都存在一個共同的問題: 二者都認為頻繁項集的所有非空子集必須也都是頻繁的,但是這樣產生出的大量候選頻繁 項集雖然都是頻繁的,但有一部分是原始數據源所不包含的,這在某些特定應用環境下是 不能夠被接受的。
[0006] 綜上,由于在未來空域管理和監視過程中,各種傳感器獲取的目標特征信息量大、 類型多樣、特征間關系錯綜復雜,并且特征具有不同的種類和表現形式,所以現有技術中運 動目標的關聯規則分析方法已無法適應新的需求。
【發明內容】
[0007] 本發明的目的在于克服現有技術中運動目標的關聯規則分析方法存在的以下技 術缺陷:在數據挖掘方面,對運動目標的運動趨勢無法充分體現。為實現上述目的,本發明 提供了一種運動目標的關聯規則分析方法及系統。
[0008] 根據本發明的一個方面,提供了 一種運動目標的關聯規則分析方法,所述方法包 括:
[0009] 每隔預設的采樣間隔獲取關于至少兩個運動目標的特征數據表,所述特征數據表 中保存有分別對應每個運動目標的運動特征、固有特征和屬性特征;
[0010] 依次對預設時間段內的每個采樣時刻,根據所述采樣時刻及其上一采樣時刻分別 獲取的特征數據表,得到變化趨勢數據表,并對所述變化趨勢數據表進行關聯規則分析,得 到所述采樣時刻對應的第一關聯知識;
[0011] 整合所述預設時間段內所有采樣時刻對應的第一關聯知識,得到動態關聯知識;
[0012] 依次對所述預設時間段內的每個采樣時刻,將所述采樣時刻獲取的特征數據表中 的所有固有特征和所有屬性特征保存到固有特征數據表,并對所述固有特征數據表進行關 聯規則分析,得到所述采樣時刻對應的第二關聯知識;
[0013] 整合所述預設時間段內所有采樣時刻對應的第二關聯知識,得到靜態關聯知識;
[0014] 對所述動態關聯知識和所述靜態關聯知識進行數據融合,得到關聯規則知識。
[0015] 優選的是,所述根據所述采樣時刻及其上一采樣時刻分別獲取的特征數據表,得 到變化趨勢數據表包括:
[0016] 依次對所述采樣時刻獲取的特征數據表中的每個運動特征,計算所述運動特征與 上一采樣時刻獲取的特征數據表中的相應運動特征的差值,得到所述運動特征對應的第一 差值;
[0017] 依次對所述采樣時刻獲取的特征數據表中的每個固有特征,計算所述固有特征與 上一采樣時刻獲取的特征數據表中的相應固有特征的差值,得到所述固有特征對應的第二 差值;
[0018] 根據所述特征數據表中的所有屬性特征、所有運動特征對應的第一差值和所有固 有特征對應的第二差值,得到所述變化趨勢數據表。
[0019] 優選的是,所述根據所述特征數據表中的所有屬性特征、所有運動特征對應的第 一差值和所有固有特征對應的第二差值,得到所述變化趨勢數據表包括:
[0020] 將所有屬性特征保存到變化趨勢數據表;
[0021] 依次對所述特征數據表中的每個運動特征,當所述運動特征對應的第一差值大于 0時,將通過所述運動特征的預設編碼和1得到的變化趨勢數據保存到變化趨勢數據表;當 所述運動特征對應的第一差值等于0時,將通過所述運動特征的預設編碼和0得到的變化 趨勢數據保存到變化趨勢數據表;當所述運動特征對應的第一差值小于0時,將通過所述 運動特征的預設編碼和-1得到的變化趨勢數據保存到變化趨勢數據表;
[0022] 依次對所述特征數據表中的每個固有特征,當所述固有特征對應的第二差值為非 0時,將通過所述固有特征的預設編碼和1得到的變化趨勢數據保存到變化趨勢數據表;當 所述固有特征對應的第二差值等于0時,將所述固有特征作為變化趨勢數據保存到變化趨 勢數據表。
[0023] 優選的是,所述對所述變化趨勢數據表進行關聯規則分析,得到所述采樣時刻對 應的第一關聯知識包括:
[0024] 利用所述變化趨勢數據表,構建頻繁模式樹;
[0025] 依次針對所述變化趨勢數據表中的每個單項,對所述頻繁模式樹進行數據挖掘, 得到所述單項對應的頻繁項集;
[0026] 去除所述頻繁項集中的不包含屬性特征的無用項和至少包括兩個屬性特征的矛 盾項,得到所述單項對應的優化頻繁項集;
[0027] 根據所述變化趨勢數據表中的所有單項對應的優化頻繁項集,得到所述第一關聯 知識。
[0028] 優選的是,所述對所述固有特征數據表進行關聯規則分析,得到所述采樣時刻對 應的第二關聯知識包括:
[0029] 利用所述固有特征數據表,構建頻繁模式樹;
[0030] 依次針對所述固有特征數據表中的每個單項,對所述頻繁模式樹進行數據挖掘, 得到所述單項對應的頻繁項集;
[0031] 去除所述頻繁項集中的不包含屬性特征的無用項和至少包括兩個屬性特征的矛 盾項,得到所述單項對應的優化頻繁項集;
[0032] 根據所述固有特征數據表中的所有單項對應的優化頻繁項集,得到所述第二關聯 知識。
[0033] 根據本發明的另一個方面,提供了一種特征數據表的關聯規則分析系統,所以系 統包括:
[0034] 特征數據表獲取單元,設置為每隔預設的采樣間隔獲取關于至少兩個運動目標的 特征數據表,所述特征數據表中保存有分別對應每個運動目標的運動特征、固有特征和屬 性特征;
[0035] 變化趨勢數據表確定單元,設置為依次對預設時間段內的每個采樣時刻,根據所 述采樣時刻及其上一采樣時刻分別獲取的特征數據表,得到變化趨勢數據表;
[0036] 第一關聯知識確定單元,設置為對所述變化趨勢數據表進行關聯規則分析,得到 所述采樣時刻對應的第一關聯知識;