一種對歷史流程數據進行分類的方法及裝置的制造方法
【專利摘要】本發明公開一種對歷史流程數據進行分類的方法和裝置,所述方法包括:按照節點執行順序,從數據庫中讀取一條歷史流程數據,包括各個節點的屬性值,各個屬性值具有標準長度值;依據各個屬性值具有的標準長度值,將所述歷史流程數據中各個節點的屬性值的長度進行調整;根據預設的編碼規則,為所述歷史流程數據進行編碼,得到所述歷史流程數據的編碼值;將所述歷史流程數據的編碼值轉換為向量,并將所述向量作為支持向量機SVM分類器的輸入,所述SVM分類器是基于已分類的歷史流程數據訓練樣本進行訓練的;經過所述SVM分類器的處理后,得到對所述歷史流程數據進行分類的結果。本發明能夠自動化的對歷史流程數據進行分類,分類效率更高,同時成本較低。
【專利說明】
一種對歷史流程數據進行分類的方法及裝置
技術領域
[0001]本發明涉及大數據分析領域,具體涉及一種對歷史流程數據進行分類的方法及裝置。
【背景技術】
[0002]隨著現代信息技術的迅猛發展,越來越多的大型企業使用信息技術進行業務流程管理。規范的使用業務流程管理,讓企業人員能夠基于相同的理解來描述和解釋企業的各個業務流程。這有助于消除不同企業人員的理解歧義,達到對業務流程描述的明確性和一致性。
[0003]但是,隨著時間的累積,企業在處理業務流程時可能已經產生了大量的歷史流程數據,這些歷史流程數據可能未被規范的管理。
[0004]為了實現對歷史流程數據的分析管理,首先需要對歷史流程數據進行分類。但是由于歷史流程數據量較大,使用人工分類方式成本較高,且分類效率低。所以,目前亟需一種高效的低成本的對歷史流程數據進行分類的方式。
【發明內容】
[0005]本發明提供了一種對歷史流程數據進行分類的方法及裝置,可以自動化的對歷史流程數據進行分類,分類效率更高,同時成本較低。
[0006]本發明提供了一種對歷史流程數據進行分類的方法,所述方法包括:
[0007]按照節點執行順序,從數據庫中讀取一條歷史流程數據,所述歷史流程數據包括各個節點的屬性值,各個屬性值具有標準長度值;
[0008]依據各個屬性值具有的標準長度值,將所述歷史流程數據中各個節點的屬性值的長度進行調整;
[0009]根據預設的編碼規則,為所述歷史流程數據進行編碼,得到所述歷史流程數據的編碼值;
[0010]將所述歷史流程數據的編碼值轉換為向量,并將所述向量作為支持向量機SVM分類器的輸入,所述SVM分類器是基于已分類的歷史流程數據訓練樣本進行訓練的;
[0011 ]經過所述SVM分類器的處理后,得到對所述歷史流程數據進行分類的結果。
[0012]優選地,所述依據各個屬性值具有的標準長度值,將所述歷史流程數據中各個節點的屬性值的長度進行調整,包括:
[0013]當所述歷史流程數據中任一節點的屬性值的長度小于所述屬性值具有的標準長度值時,在所述屬性值之前補零,使得補零后的屬性值的長度與所述屬性值具有的標準長度值相同。
[0014]優選地,所述將所述歷史流程數據的編碼值轉換為向量,包括:
[0015]將所述歷史流程數據中的各個屬性值的編碼連接到前一個屬性值的編碼后面,得到所述歷史流程數據的向量。
[0016]優選地,所述方法還包括:
[0017]獲取多個已分類的歷史流程數據對應的向量,并將所述分量作為訓練樣本;
[0018]將所述訓練樣本輸入所述SVM分類器,對所述SVM分類器進行訓練。
[0019]優選地,所述經過所述SVM分類器的處理后,得到對所述歷史流程數據進行分類的結果,包括:
[0020]經過所述SVM分類器的處理后,獲取所述歷史流程數據的決策值;
[0021 ]根據所述決策值,確定對所述歷史流程數據進行分類的結果。
[0022]本發明還提供了一種對歷史流程數據進行分類的裝置,所述裝置包括:
[0023]讀取模塊,用于按照節點執行順序,從數據庫中讀取一條歷史流程數據,所述歷史流程數據包括各個節點的屬性值,各個屬性值具有標準長度值;
[0024]調整模塊,用于依據各個屬性值具有的標準長度值,將所述歷史流程數據中各個節點的屬性值的長度進行調整;
[0025]編碼模塊,用于根據預設的編碼規則,為所述歷史流程數據進行編碼,得到所述歷史流程數據的編碼值;
[0026]轉換模塊,用于將所述歷史流程數據的編碼值轉換為向量;
[0027]輸入模塊,用于將所述向量作為支持向量機SVM分類器的輸入,所述SVM分類器是基于已分類的歷史流程數據訓練樣本進行訓練的;
[0028]分類模塊,用于經過所述SVM分類器的處理后,得到對所述歷史流程數據進行分類的結果。
[0029]優選地,所述調整模塊,包括:
[0030]補零子模塊,用于當所述歷史流程數據中任一節點的屬性值的長度小于所述屬性值具有的標準長度值時,在所述屬性值之前補零,使得補零后的屬性值的長度與所述屬性值具有的標準長度值相同。
[0031]優選地,所述轉換模塊,具體用于:
[0032]將所述歷史流程數據中的各個屬性值的編碼連接到前一個屬性值的編碼后面,得到所述歷史流程數據的向量。
[0033]優選地,所述裝置還包括:
[0034]獲取模塊,用于獲取多個已分類的歷史流程數據對應的向量,并將所述分量作為訓練樣本;
[0035]訓練模塊,用于將所述訓練樣本輸入所述SVM分類器,對所述SVM分類器進行訓練。
[0036]優選地,所述分類模塊,包括:
[0037]獲取子模塊,用于經過所述SVM分類器的處理后,獲取所述歷史流程數據的決策值;
[0038]確定子模塊,用于根據所述決策值,確定對所述歷史流程數據進行分類的結果。
[0039]本發明提供的對歷史流程數據進行分類的方法中,首先按照節點執行順序,從數據庫中讀取一條歷史流程數據,所述歷史流程數據包括各個節點的屬性值,各個屬性值具有標準長度值。其次,依據各個屬性值具有的標準長度值,將所述歷史流程數據中各個節點的屬性值的長度進行調整;根據預設的編碼規則,為所述歷史流程數據進行編碼,得到所述歷史流程數據的編碼值。然后,將所述歷史流程數據的編碼值轉換為向量,并將所述向量作為支持向量機SVM分類器的輸入,所述SVM分類器是基于已分類的歷史流程數據訓練樣本進行訓練的。最終,經過所述SVM分類器的處理后,得到對所述歷史流程數據進行分類的結果。與現有技術比,本發明提供了一種自動化的對歷史流程數據進行分類的方法,對歷史流程數據的分類效率更高,同時成本較低。
【附圖說明】
[0040]為了更清楚地說明本申請實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。
[0041 ]圖1為本發明實施例提供的一種對歷史流程數據進行分類的方法流程圖;
[0042]圖2為本發明實施例提供的一種對歷史流程數據進行分類的舉例方法流程圖;
[0043]圖3為本發明實施例提供的一種對歷史流程數據進行分類的裝置結構示意圖。
【具體實施方式】
[0044]下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例。基于本申請中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本申請保護的范圍。
[0045]以下進行實施例具體內容的介紹。
[0046]本發明實施例提供了一種對歷史流程數據進行分類的方法,參考圖1,為本發明實施例提供的一種對歷史流程數據進行分類的方法流程圖。所述方法具體包括:
[0047]SlOl:按照節點執行順序,從數據庫中讀取一條歷史流程數據,所述歷史流程數據包括各個節點的屬性值,各個屬性值具有標準長度值。
[0048]數據庫中存儲系統處理業務流程產生的歷史流程數據,在系統處理任一業務流程后產生一條歷史流程數據,在處理該業務流程的過程中存在若干執行節點,在執行各個節點時產生的數據為該條歷史流程數據中的屬性值。實際操作中,按照節點執行順序,從數據庫中讀取由各個屬性值組成的歷史流程數據,以使屬于同一類的歷史流程數據中的屬性值的順序相同。
[0049]本發明實施例的數據庫中屬于同一類的歷史流程數據具有固定個數的屬性值,同時,屬于同一類的歷史流程數據包括的屬性值分別設置有標準長度值。
[0050]S102:依據各個屬性值具有的標準長度值,將所述歷史流程數據中各個節點的屬性值的長度進行調整。
[0051]本發明實施例中,將讀取到的歷史流程數據中各個節點的屬性值的長度調整為與該屬性值具有的標準長度值相同。
[0052]實際應用中,如果任一屬性值的長度小于自身具有的標準長度值,則按照該屬性值的標準長度值,在該屬性值前方補0,使得該屬性值的長度與標準長度值相同。
[0053]S103:根據預設的編碼規則,為所述歷史流程數據進行編碼,得到所述歷史流程數據的編碼值。
[0054]實際操作中,在得到各個屬性值的長度均與自身具有的標準長度值相同的歷史流程數據后,對該歷史流程數據進行編碼。具體使用的編碼規則可以為UTF-8編碼規則,ASCII編碼規則等。
[0055]S104:將所述歷史流程數據的編碼值轉換為向量,并將所述向量作為支持向量機SVM分類器的輸入,所述SVM分類器是基于已分類的歷史流程數據訓練樣本進行訓練的。
[0056]本發明實施例是利用SVM分類器對歷史流程數據進行分類的,由于SVM分類器的輸入參數為向量,所以,將得到的歷史流程數據的編碼值轉換為向量,并將該向量作為SVM分類器的輸入。
[0057]具體的,將編碼值轉換為向量的方法包括:
[0058]首先獲取歷史流程數據的編碼值,其次將該歷史流程數據的各個屬性值的編碼連接到前一個屬性值的編碼后面,得到該歷史流程數據的向量。
[0059]S105:經過所述SVM分類器的處理后,得到對所述歷史流程數據進行分類的結果。
[0060]在所述SVM分類器對該歷史流程數據的向量進行處理后,獲取該歷史流程數據的決策值,根據決策值,確定對該歷史流程數據進行分類的結果。具體的,獲取決策值后,可以根據決策值,并利用一對多(One Versus All,0VA)方法確定對歷史流程數據進行分類的結果。其中,一對多方法為現有技術,在此不再詳細描述。
[0061]實際操作中,本發明實施例使用的SVM分類器是經過訓練的,具體的,利用已經完成分類的歷史流程數據作為訓練樣本,對SVM分類器進行訓練。經過訓練的SVM分類器中具有用于為各類歷史流程數據打分的打分函數,當所述SVM分類器接收到任一歷史流程數據后,所述SVM分類器中的各個打分函數分別為該歷史流程數據進行打分,最終將該條歷史流程數據分類為分數最高的打分函數對應的類型。
[0062]為了便于理解本發明實施例提供的對歷史流程數據進行分類的方法,本發明實施例通過舉例說明分類過程。參見圖2,為本發明實施例提供的一種對歷史流程數據進行分類的舉例方法流程圖。
[0063]S201:按照節點執行順序,從數據庫中讀取一條歷史流程數據:請病假;批準申請;感冒。該歷史流程數據包括3個屬性值,且將各個屬性值的標準長度值均設置為5。
[0064]S202:依據標準長度值5,在該歷史流程數據的各個屬性值前面補零:00請病假;O批準申請;000感冒。
[0065]S203:使用UTF-8編碼規則對補零后的歷史流程數據進行編碼:00請病假= 00233;O批準申請= 07898 ; 000感冒=00022。
[0066]S204:將編碼后的歷史流程數據中的各個屬性值的編碼連接到前一個屬性值的編碼后面,得到所述歷史流程數據的向量:G = 002330789800022。
[0067]S205:將向量G作為SVM分類器的輸入,經過所述SVM分類器的分類處理后,輸出對所述歷史流程數據進行分類的結果。
[0068]其中,所述SVM分類器是基于已分類的歷史流程數據訓練樣本進行訓練的。
[0069]總之,本發明實施例提供的對歷史流程數據進行分類的方法中,首先按照節點執行順序,從數據庫中讀取一條歷史流程數據,所述歷史流程數據包括各個節點的屬性值,各個屬性值具有標準長度值。其次,依據各個屬性值具有的標準長度值,將所述歷史流程數據中各個節點的屬性值的長度進行調整;根據預設的編碼規則,為所述歷史流程數據進行編碼,得到所述歷史流程數據的編碼值。然后,將所述歷史流程數據的編碼值轉換為向量,并將所述向量作為支持向量機SVM分類器的輸入,所述SVM分類器是基于已分類的歷史流程數據訓練樣本進行訓練的。最終,經過所述SVM分類器的處理后,得到對所述歷史流程數據進行分類的結果。與現有技術比,本發明實施例提供了一種自動化的對歷史流程數據進行分類的方法,對歷史流程數據的分類效率更高,同時成本較低。
[0070]本發明還提供了一種對歷史流程數據進行分類的裝置,參考圖3,為本發明實施例提供的一種對歷史流程數據進行分類的裝置結構示意圖。所述裝置包括:
[0071]讀取模塊301,用于按照節點執行順序,從數據庫中讀取一條歷史流程數據,所述歷史流程數據包括各個節點的屬性值,各個屬性值具有標準長度值;
[0072]調整模塊302,用于依據各個屬性值具有的標準長度值,將所述歷史流程數據中各個節點的屬性值的長度進行調整;
[0073]編碼模塊303,用于根據預設的編碼規則,為所述歷史流程數據進行編碼,得到所述歷史流程數據的編碼值;
[0074]轉換模塊304,用于將所述歷史流程數據的編碼值轉換為向量;
[0075]輸入模塊305,用于將所述向量作為支持向量機SVM分類器的輸入,所述SVM分類器是基于已分類的歷史流程數據訓練樣本進行訓練的;
[0076]分類模塊306,用于經過所述SVM分類器的處理后,得到對所述歷史流程數據進行分類的結果。
[0077]—種優選實施方式中,所述調整模塊,包括:
[0078]補零子模塊,用于當所述歷史流程數據中任一節點的屬性值的長度小于所述屬性值具有的標準長度值時,在所述屬性值之前補零,使得補零后的屬性值的長度與所述屬性值具有的標準長度值相同。
[0079]具體的,所述轉換模塊,具體用于:
[0080]將所述歷史流程數據中的各個屬性值的編碼連接到前一個屬性值的編碼后面,得到所述歷史流程數據的向量。
[0081 ] 所述裝置還包括:
[0082]獲取模塊,用于獲取多個已分類的歷史流程數據對應的向量,并將所述分量作為訓練樣本;
[0083]訓練模塊,用于將所述訓練樣本輸入所述SVM分類器,對所述SVM分類器進行訓練。
[0084]具體的,所述分類模塊,包括:
[0085]獲取子模塊,用于經過所述SVM分類器的處理后,獲取所述歷史流程數據的決策值;
[0086]確定子模塊,用于根據所述決策值,確定對所述歷史流程數據進行分類的結果。
[0087]本發明實施例提供的對歷史流程數據進行分類的裝置能夠實現以下功能:按照節點執行順序,從數據庫中讀取一條歷史流程數據,所述歷史流程數據包括各個節點的屬性值,各個屬性值具有標準長度值。依據各個屬性值具有的標準長度值,將所述歷史流程數據中各個節點的屬性值的長度進行調整;根據預設的編碼規則,為所述歷史流程數據進行編碼,得到所述歷史流程數據的編碼值。將所述歷史流程數據的編碼值轉換為向量,并將所述向量作為支持向量機SVM分類器的輸入,所述SVM分類器是基于已分類的歷史流程數據訓練樣本進行訓練的。經過所述SVM分類器的處理后,得到對所述歷史流程數據進行分類的結果。與現有技術比,本發明實施例提供了一種自動化的對歷史流程數據進行分類的裝置,對歷史流程數據的分類效率更高,同時成本較低。
[0088]對于裝置實施例而言,由于其基本對應于方法實施例,所以相關之處參見方法實施例的部分說明即可。以上所描述的裝置實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部模塊來實現本實施例方案的目的。本領域普通技術人員在不付出創造性勞動的情況下,即可以理解并實施。
[0089]需要說明的是,在本文中,諸如第一和第二等之類的關系術語僅僅用來將一個實體或者操作與另一個實體或操作區分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關系或者順序。而且,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設備中還存在另外的相同要素。
[0090]以上對本發明實施例所提供的一種對歷史流程數據進行分類的方法及裝置進行了詳細介紹,本文中應用了具體個例對本發明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發明的方法及其核心思想;同時,對于本領域的一般技術人員,依據本發明的思想,在【具體實施方式】及應用范圍上均會有改變之處,綜上所述,本說明書內容不應理解為對本發明的限制。
【主權項】
1.一種對歷史流程數據進行分類的方法,其特征在于,所述方法包括: 按照節點執行順序,從數據庫中讀取一條歷史流程數據,所述歷史流程數據包括各個節點的屬性值,各個屬性值具有標準長度值; 依據各個屬性值具有的標準長度值,將所述歷史流程數據中各個節點的屬性值的長度進行調整; 根據預設的編碼規則,為所述歷史流程數據進行編碼,得到所述歷史流程數據的編碼值; 將所述歷史流程數據的編碼值轉換為向量,并將所述向量作為支持向量機SVM分類器的輸入,所述SVM分類器是基于已分類的歷史流程數據訓練樣本進行訓練的; 經過所述SVM分類器的處理后,得到對所述歷史流程數據進行分類的結果。2.根據權利要求1所述的對歷史流程數據進行分類的方法,其特征在于,所述依據各個屬性值具有的標準長度值,將所述歷史流程數據中各個節點的屬性值的長度進行調整,包括: 當所述歷史流程數據中任一節點的屬性值的長度小于所述屬性值具有的標準長度值時,在所述屬性值之前補零,使得補零后的屬性值的長度與所述屬性值具有的標準長度值相同。3.根據權利要求1所述的對歷史流程數據進行分類的方法,其特征在于,所述將所述歷史流程數據的編碼值轉換為向量,包括: 將所述歷史流程數據中的各個屬性值的編碼連接到前一個屬性值的編碼后面,得到所述歷史流程數據的向量。4.根據權利要求1所述的對歷史流程數據進行分類的方法,其特征在于,所述方法還包括: 獲取多個已分類的歷史流程數據對應的向量,并將所述分量作為訓練樣本; 將所述訓練樣本輸入所述SVM分類器,對所述SVM分類器進行訓練。5.根據權利要求1所述的對歷史流程數據進行分類的方法,其特征在于,所述經過所述SVM分類器的處理后,得到對所述歷史流程數據進行分類的結果,包括: 經過所述SVM分類器的處理后,獲取所述歷史流程數據的決策值; 根據所述決策值,確定對所述歷史流程數據進行分類的結果。6.一種對歷史流程數據進行分類的裝置,其特征在于,所述裝置包括: 讀取模塊,用于按照節點執行順序,從數據庫中讀取一條歷史流程數據,所述歷史流程數據包括各個節點的屬性值,各個屬性值具有標準長度值; 調整模塊,用于依據各個屬性值具有的標準長度值,將所述歷史流程數據中各個節點的屬性值的長度進行調整; 編碼模塊,用于根據預設的編碼規則,為所述歷史流程數據進行編碼,得到所述歷史流程數據的編碼值; 轉換模塊,用于將所述歷史流程數據的編碼值轉換為向量; 輸入模塊,用于將所述向量作為支持向量機SVM分類器的輸入,所述SVM分類器是基于已分類的歷史流程數據訓練樣本進行訓練的; 分類模塊,用于經過所述SVM分類器的處理后,得到對所述歷史流程數據進行分類的結果O7.根據權利要求6所述的對歷史流程數據進行分類的裝置,其特征在于,所述調整模塊,包括: 補零子模塊,用于當所述歷史流程數據中任一節點的屬性值的長度小于所述屬性值具有的標準長度值時,在所述屬性值之前補零,使得補零后的屬性值的長度與所述屬性值具有的標準長度值相同。8.根據權利要求6所述的對歷史流程數據進行分類的裝置,其特征在于,所述轉換模塊,具體用于: 將所述歷史流程數據中的各個屬性值的編碼連接到前一個屬性值的編碼后面,得到所述歷史流程數據的向量。9.根據權利要求6所述的對歷史流程數據進行分類的裝置,其特征在于,所述裝置還包括: 獲取模塊,用于獲取多個已分類的歷史流程數據對應的向量,并將所述分量作為訓練樣本; 訓練模塊,用于將所述訓練樣本輸入所述SVM分類器,對所述SVM分類器進行訓練。10.根據權利要求6所述的對歷史流程數據進行分類的裝置,其特征在于,所述分類模塊,包括: 獲取子模塊,用于經過所述SVM分類器的處理后,獲取所述歷史流程數據的決策值; 確定子模塊,用于根據所述決策值,確定對所述歷史流程數據進行分類的結果。
【文檔編號】G06K9/62GK106022374SQ201610331367
【公開日】2016年10月12日
【申請日】2016年5月18日
【發明人】王超, 張德慧, 張剛, 時曉書, 尹鑫
【申請人】中國農業銀行股份有限公司