專利名稱:提取相似子時間序列的方法和裝置的制作方法
技術領域:
本發明涉及時間序列處理領域,具體涉及用于從時間序列提取與基準序列相似的子時間序列的方法和裝置。
背景技術:
相似子序列提取意味著提取與給定基準類似的子序列。相似子時間序列提取是應用于時間序列預測、聚類、異常檢測等任務的基礎技術。例如,時間序列預測中需要提取相似子序列,以用于訓練。一般而言,相似子序列提取涉及兩個步驟。第一個步驟是時間序列分割,即,將時間序列分割為多個部分。第二個步驟是基于相似性計算來提取相似子序列。 對于現有的相似子序列提取技術主要存在以下三個問題(I)硬性分割使得候選設置小;(2)耗費存儲空間和處理時間;以及(3)很少考慮物理意義。因此,期望提出一種能夠解決上述問題的技術。
發明內容
在下文中給出關于本發明的簡要概述,以便提供關于本發明的某些方面的基本理解。應當理解,這個概述并不是關于本發明的窮舉性概述。它并不是意圖確定本發明的關鍵或重要部分,也不是意圖限定本發明的范圍。其目的僅僅是以簡化的形式給出某些構思,以此作為稍后論述的更詳細描述的前序。本發明的一個主要目的在于,提供一種用于從時間序列提取與基準序列相似的子時間序列的方法和裝置。根據本發明的一個方面,提供了一種用于從時間序列提取與基準序列相似的子時間序列的方法,包括分別根據時間序列和基準序列的變化趨勢對時間序列和基準序列進行變換;將變換后的時間序列分割成多個子時間序列;針對多個子時間序列中的每個子時間序列,計算每個子時間序列與變換后的基準序列之間的編輯距離;以及根據計算出的編輯距離從多個子時間序列中提取與基準序列相似的子時間序列。根據本發明的另一個方面,提供了一種用于從時間序列提取與基準序列相似的子時間序列的裝置,包括序列變換單元,被配置為分別根據時間序列和基準序列的變化趨勢對時間序列和基準序列進行變換;子時間序列分割單元,被配置為將變換后的時間序列分割成多個子時間序列;編輯距離計算單元,被配置為針對多個子時間序列中的每個子時間序列,計算每個子時間序列與變換后的基準序列之間的編輯距離;以及相似子時間序列提取單元,被配置為根據計算出的編輯距離從多個子時間序列中提取與基準序列相似的子時間序列。另外,本發明的實施例還提供了用于實現上述方法的計算機程序。此外,本發明的實施例還提供了至少計算機可讀介質形式的計算機程序產品,其上記錄有用于實現上述方法的計算機程序代碼。
通過以下結合附圖對本發明的最佳實施例的詳細說明,本發明的這些以及其他優點將更加明顯。
參照下面結合附圖對本發明實施例的說明,會更加容易地理解本發明的以上和其它目的、特點和優點。附圖中的部件只是為了示出本發明的原理。在附圖中,相同的或類似的技術特征或部件將采用相同或類似的附圖標記來表示。圖I是示出根據本發明的實施例的用于從時間序列提取與基準序列相似的子時間序列的方法的流程圖;圖2是示出一周的負載時間序列的曲線圖;圖3是示出兩個負載子時間序列與一個基準序列的曲線圖; 圖4是示出根據本發明的實施例的用于從時間序列提取與基準序列相似的子時間序列的裝置的框圖;以及圖5是示出可以用于實施本發明的用于從時間序列提取與基準序列相似的子時間序列的方法和裝置的計算設備的舉例的結構圖。
具體實施例方式下面參照附圖來說明本發明的實施例。在本發明的一個附圖或一種實施方式中描述的元素和特征可以與一個或更多個其它附圖或實施方式中示出的元素和特征相結合。應當注意,為了清楚的目的,附圖和說明中省略了與本發明無關的、本領域普通技術人員已知的部件和處理的表示和描述。以下參照圖I來描述根據本發明的實施例的用于從時間序列提取與基準序列相似的子時間序列的方法100。如圖I所示,在步驟S102中,可以分別根據時間序列和基準序列的變化趨勢對時間序列和基準序列進行變換。具體地,可以根據時間序列中的當前元素相對于前一元素或前多個元素的變化來對時間序列進行變換。此外,可以根據基準序列中的當前元素相對于前一元素或前多個元素的變化來對基準序列進行變換。可替換地,可以根據時間序列中的當前元素相對于后一元素或后多個元素的變化來對時間序列進行變換。此外,可以根據基準序列中的當前元素相對于后一元素或后多個元素的變化來對基準序列進行變換。此處,對時間序列和基準序列的變換采用相同的變換規則。此外,對時間序列和基準序列的變換不局限于以上方式,而可以采用本領域技術人員可以想到的任何其他方式來變換時間序列和基準序列,只要這種變換能夠反映序列的變化趨勢。接下來,在步驟S104中,可以將變換后的時間序列分割成多個子時間序列。可選地,可以按照允許與基準序列的長度不同的預定分割步長將變換后的時間序列分割成多個子時間序列。此外,可以按照允許與基準序列的長度不同的預定分割長度將變換后的時間序列分割成多個子時間序列。通過對時間序列執行這樣的柔性分割,可以更加靈活地分割時間序列,以根據需要來得到相應分割結果,進而得到所需要的相似子序列。例如,可以獲得與基準序列相似而長度不同于基準序列的相似子序列。接下來,在步驟S106中,可以針對多個子時間序列中的每個子時間序列,計算每個子時間序列與變換后的基準序列之間的編輯距離。可選地,可以在上述計算中,計算每個子時間序列與變換后的基準序列之間的加權編輯距離,其中可以滿足以下要求中的一個或多個對于插入操作,對不同元素的插入可以允許給予不同的權重;對于刪除操作,對不同元素的刪除可以允許給予不同的權重;以及對于替換操作,對不同元素對的替換可以允許給予不同的權重。相比于不使用權重的一些傳統方法,通過計算每個子時間序列與變換后的基準序列之間的加權編輯距離,與基準序列更加相似的子時間序列將具有到基準序列的更短的編輯距離。在步驟S108中,可以根據計算出的編輯距離從多個子時間序列中提取與基準序列相似的子時間序列。具體地,可以從多個子時間序列中提取具有小于預定閾值的編輯距離的一個或多個子時間序列作為與基準序列相似的子時間序列。可選地,從多個子時間序列中提取預定數量的、具有最小編輯距離的子時間序列作為與基準序列相似的子時間序列。當然,提取與基準序列相似的子時間序列不一定要通過以上方式執行,而可以通過本領域人員可以想到的任意其他方式來執行。以下參照圖2和圖3來描述從負載時間序列提取與基準序列相似的子時間序列的方法。其中,圖2是示出一周的負載時間序列的曲線圖,而圖3是示出兩個負載子時間序列與一個基準序列的曲線圖。在圖2和圖3中,給出了與負荷相關聯的時間序列。但是,很容易理解到,與負荷相關聯的時間序列僅是一個例子。實際上,本發明所處理的時間序列可以是任意的時間序列而不限于圖2和3的形式。首先,可以分別根據時間序列和基準序列的變化趨勢對時間序列和基準序列進行變換,即通過比較當前元素與前一元素或前多個元素的變化進行多種變換。例如,時間序列
ScpCyC3, ......,Cn,其中η為大于I的整數。基準序列為bpby ......,bm,其中m為大于
I的整數。通常的情況下,m小于n,當然也不排除m大于η的情況。例如,可以根據下式⑴來變換時間序列,而根據下式⑵來變換基準序列
權利要求
1.一種用于從時間序列提取與基準序列相似的子時間序列的方法,包括 分別根據所述時間序列和所述基準序列的變化趨勢對所述時間序列和所述基準序列進行變換; 將變換后的時間序列分割成多個子時間序列; 針對所述多個子時間序列中的每個子時間序列,計算所述每個子時間序列與變換后的基準序列之間的編輯距離;以及 根據計算出的編輯距離從所述多個子時間序列中提取與所述基準序列相似的子時間序列。
2.根據權利要求I所述的方法,其中,所述分別根據時間序列和所述基準序列的變化趨勢對所述時間序列和所述基準序列進行變換的步驟包括 根據所述時間序列中的當前元素相對于前一元素或前多個元素的變化來對所述時間序列進行變換;以及 根據所述基準序列中的當前元素相對于前一元素或前多個元素的變化來對所述基準序列進行變換。
3.根據權利要求I所述的方法,其中,所述分別根據時間序列和所述基準序列的變化趨勢對所述時間序列和所述基準序列進行變換的步驟包括 根據所述時間序列中的當前元素相對于后一元素或后多個元素的變化來對所述時間序列進行變換;以及 根據所述基準序列中的當前元素相對于后一元素或后多個元素的變化來對所述基準序列進行變換。
4.根據權利要求I所述的方法,其中,所述計算所述每個子時間序列與變換后的基準序列之間的編輯距離的步驟包括計算所述每個子時間序列與變換后的基準序列之間的加權編輯距離,其中滿足以下要求中的一個或多個 對于插入操作,對不同元素的插入允許給予不同的權重; 對于刪除操作,對不同元素的刪除允許給予不同的權重;以及 對于替換操作,對不同元素對的替換允許給予不同的權重。
5.根據權利要求I所述的方法,其中,所述根據計算出的編輯距離從所述多個子時間序列中提取與所述基準序列相似的子時間序列的步驟包括 從所述多個子時間序列中提取具有小于預定閾值的編輯距離的一個或多個子時間序列作為與所述基準序列相似的子時間序列。
6.根據權利要求I至5中任一項所述的方法,其中,所述將變換后的時間序列分割成多個子時間序列的步驟包括 按照允許與所述基準序列的長度不同的預定分割步長和/或允許與所述基準序列的長度不同的預定分割長度將所述變換后的時間序列分割成所述多個子時間序列。
7.一種用于從時間序列提取與基準序列相似的子時間序列的裝置,包括 序列變換單元,被配置為分別根據所述時間序列和所述基準序列的變化趨勢對所述時間序列和所述基準序列進行變換; 子時間序列分割單元,被配置為將變換后的時間序列分割成多個子時間序列; 編輯距離計算單元,被配置為針對所述多個子時間序列中的每個子時間序列,計算所述每個子時間序列與變換后的基準序列之間的編輯距離;以及 相似子時間序列提取單元,被配置為根據計算出的編輯距離從所述多個子時間序列中提取與所述基準序列相似的子時間序列。
8.根據權利要求7所述的裝置,其中,所述序列變換單元包括 時間序列變換子單元,被配置為根據所述時間序列中的當前元素相對于前一元素或前多個元素的變化來對所述時間序列進行變換;以及 基準序列變換子單元,被配置為根據所述基準序列中的當前元素相對于前一元素或前多個元素的變化來對所述基準序列進行變換。
9.根據權利要求8所述的裝置,其中,所述序列變換單元包括 時間序列變換子單元,被配置為根據所述時間序列中的當前元素相對于后一元素或后多個元素的變化來對所述時間序列進行變換;以及 基準序列變換子單元,被配置為根據所述基準序列中的當前元素相對于后一元素或后多個元素的變化來對所述基準序列進行變換。
10.根據權利要求7所述的裝置,其中,所述編輯距離計算單元被配置為計算所述每個子時間序列與變換后的基準序列之間的加權編輯距離,其中滿足以下要求中的一個或多個 對于插入操作,對不同元素的插入允許給予不同的權重; 對于刪除操作,對不同元素的刪除允許給予不同的權重;以及 對于替換操作,對不同元素對的替換允許給予不同的權重。
全文摘要
本發明涉及用于從時間序列提取與基準序列相似的子時間序列的方法和裝置。其中,用于從時間序列提取與基準序列相似的子時間序列的方法包括分別根據時間序列和基準序列的變化趨勢對時間序列和基準序列進行變換;將變換后的時間序列分割成多個子時間序列;針對多個子時間序列中的每個子時間序列,計算每個子時間序列與變換后的基準序列之間的編輯距離;以及根據計算出的編輯距離從多個子時間序列中提取與基準序列相似的子時間序列。
文檔編號G06F17/30GK102880621SQ201110203979
公開日2013年1月16日 申請日期2011年7月14日 優先權日2011年7月14日
發明者楊宇航, 孟遙, 夏迎炬, 陸應亮, 于浩 申請人:富士通株式會社