專利名稱:一種基于異構系統集成的信息挖掘與進度預測方法
技術領域:
本發明涉及一種基于異構系統集成的信息挖掘與進度預測方法。
背景技術:
所謂“異構系統集成”,是指將不同數據庫平臺、不同廠商提供的系統,有機的集成在一起,實現信息的共享和相互通信。所謂“信息挖掘與進度估算”,是在異構系統集成的基礎上挖掘出與一個項目或任務相關信息和數據,運用科學的數學模型估算出任務或項目的進展情況。在工程應用中,廣泛存在著基于異構系統集成的信息挖掘與進度估算需求。例如
在產品設計和生產中,存在著各種軟件,如CAPP (計算機輔助工藝系統)PDM (產品數據管理系統)、ERP (企業資源計劃系統)、MES (制造執行系統)、WMS (庫房管理系統),這些軟件的信息量很大,結構非常復雜,因此需要用一套方法來挖掘出有用的信息,并用科學的數學模型將產品設計和生產的進度估算出來,而當前只是根據計劃制定人員和生產人員的片面描述或者單個系統的片面數據估算來產品的進度的情況。在其他領域,如建筑、服裝、各類辦公等行業中,也在使用各種各樣的異構軟件系統,也存在著工程進度或任務進度的估算問題。當前的多個異構系統下的項目或任務進度估算主要存在如下問題①未實現異構系統的統一集成和信息共享。當前各個領域的異構系統(如產品設計生產中的ERP、MES、CAPP.WMS)等自成體系并相互孤立,很難實現多個系統的集成,故綜合的挖掘進度信息相當困難。②對各個系統進度信息挖掘的深度不夠。當前,各個行業中,并沒有將各個異構系統集成起來對進度信息的挖掘,只是片面的獲取某個或某幾個系統的數據,這對于項目或任務進度的估算是不夠準確的。例如零件的生產進度,需要通過對ERP、MES、CAPP, WMS系統中成百上千的流程信息、工序信息、入庫信息等數據進行深入處理,這樣才能最終得到項目或任務的進度信息。③沒有一套完整的進度預測方法。當前各個行業的項目進度和任務進度都是一種大概的估計,沒有一種科學的數學模型作為預測依據,本方法利用多元線性回歸模型作為預測的辦法,具有較高的準確性和實用性。
發明內容
本發明的目的是提供一種基于異構系統集成的信息挖掘與進度預測方法。為實現上述目的,本發明采用的技術方案為
一種基于異構系統集成的信息挖掘與進度預測方法,所述的方法如下
(1)、首先連接異構系統的各個數據庫,實現異構系統的集成,進而建立數據倉庫;
(2)、通過數據挖掘得到相應的項目或任務進度信息;
(3)、將獲取的進度信息代入多元線性回歸模型,通過優化驗證,得到準確的數學模型,將項目或任務的進度通過模型計算出來,
(4)、通過數據庫底層技術以及C++Builder的可視化控件,將挖掘出來的進度相關數據直觀的展示出來。
上述的步驟(I)中建立數據倉庫,其建立的步驟方法和步驟如下如下
O收集和分析業務需求;
2)建立數據模型和數據倉庫的物理設計;
3)定義數據源;
4)選擇數據倉庫技術和平臺;
5)從操作型數據庫中抽取、凈化、和轉換數據到數據倉庫;
6)選擇訪問和報表工具;
7)選擇數據庫連接軟件;
8)選擇數據分析和數據展示軟件;
9)更新數據倉庫。上述的步驟(2)中運用數據挖掘的方法,從數據集成平臺上獲取與項目或任務進度估算相關的數據,對比一下獲取的數據是否符合要求,如果不符合要求,需要重新獲取數據,如果符合要求,則建立任務自動分解模板;
數據挖掘的算法方面,采用的是關聯規則挖掘的Apriori算法,步驟如下
O首先掃描數據庫,對每個項目進行計數
2)得到第I階段的候選項目集,并判斷是否大于最小支持度
3)如果大于最小支持度,則生成第I階段頻繁項目集
4)運用Aprior1-Gen算法進行運算,得到第2階段候選項目集
5)掃描數據庫,對每個項目進行計數,并判斷是否大于最小支持度
6)若大于最小支持度,則生成第2階段頻繁項目集;反之,則算法結束
7)重復5)、6)步驟,生成第K+1階段頻繁項目集直至算法結束。上述的步驟(3)中,運用多元線性回歸模型建立項目或進度的改進多元線性回歸模型;設因變量力 ' 自變量為X,自變量共有P個,他們的B組觀測值為
權利要求
1.一種基于異構系統集成的信息挖掘與進度預測方法,其特征在于所述的方法如下 (I )、首先連接異構系統的各個數據庫,實現異構系統的集成,進而建立數據倉庫; (2)、通過數據挖掘得到相應的項目或任務進度信息; (3)、將獲取的進度信息代入多元線性回歸模型,通過優化驗證,得到準確的數學模型,將項目或任務的進度通過模型計算出來, (4)、通過數據庫底層技術以及C++Builder的可視化控件,將挖掘出來的進度相關數據直觀的展示出來。
2.根據權利要求1所述的一種基于異構系統集成的信息挖掘與進度預測方法,其特征在于所述的步驟(I)中建立數據倉庫,其建立的步驟方法和步驟如下如下 1)收集和分析業務需求; 2)建立數據模型和數據倉庫的物理設計; 3)定義數據源; 4)選擇數據倉庫技術和平臺; 5)從操作型數據庫中抽取、凈化、和轉換數據到數據倉庫; 6)選擇訪問和報表工具; 7)選擇數據庫連接軟件; 8)選擇數據分析和數據展示軟件; 9)更新數據倉庫。
3.根據權利要求1所述的一種基于異構系統集成的信息挖掘與進度預測方法,其特征在于所述的步驟(2)中 運用數據挖掘的方法,從數據集成平臺上獲取與項目或任務進度估算相關的數據,對比一下獲取的數據是否符合要求,如果不符合要求,需要重新獲取數據,如果符合要求,則建立任務自動分解模板; 數據挖掘的算法方面,采用的是關聯規則挖掘的Apriori算法,步驟如下 1)首先掃描數據庫,對每個項目進行計數 2)得到第I階段的候選項目集,并判斷是否大于最小支持度 3)如果大于最小支持度,則生成第I階段頻繁項目集 4)運用Aprior1-Gen算法進行運算,得到第2階段候選項目集 5)掃描數據庫,對每個項目進行計數,并判斷是否大于最小支持度 6)若大于最小支持度,則生成第2階段頻繁項目集;反之,則算法結束 7)重復5)、6)步驟,生成第K+1階段頻繁項目集直至算法結束。
4.根據權利要求1所述的一種基于異構系統集成的信息挖掘與進度預測方法,其特征在于所述的步驟(3)中,運用多元線性回歸模型建立項目或進度的改進多元線性回歸模型;設因變量為1,自變量為x,自變量共有P個,他們的n組觀測值為
5.根據權利要求1所述的一種基于異構系統集成的信息挖掘與進度預測方法,其特征在于所述的步驟(4)中,通過數據庫底層技術以及C++Builder的可視化控件,如DBChart_Bar、DBChart_Gantt、DBChart_Pie可以將挖掘出來的進度相關數據直觀的展示出來;可視化區域通過指定Windows組件Form、Panel、ScrollBox、PageControl的設置,使得顯示出來的圖形直觀,易讀。
全文摘要
本發明涉及一種基于異構系統集成的信息挖掘與進度預測方法。當前的多個異構系統下的項目或任務進度估算主要存在如下問題①未實現異構系統的統一集成和信息共享;②對各個系統進度信息挖掘的深度不夠;③沒有一套完整的進度預測方法。本發明實現異構信息系統的集成,進而建立數據倉庫,通過數據挖掘得到相應的項目或任務進度信息,將獲取的進度信息代入多元線性回歸模型,通過優化,得到更加準確的數學模型,將項目或任務的進度通過模型計算出來,再通過數據庫底層技術以及C++Builder的可視化控件,使得顯示出來的圖形直觀,易讀。本發明將多元線性回歸模型引入到項目或任務的進度預測的算法中,提高了進度預測的準確性。
文檔編號G06Q10/04GK103020736SQ201210534639
公開日2013年4月3日 申請日期2012年12月12日 優先權日2012年12月12日
發明者仇原鷹, 常建濤, 孔憲光, 邵曉東, 李申, 盛英, 殷磊 申請人:西安電子科技大學