專利名稱:工業數據壓縮系統和方法
技術領域:
本發明總的涉及數據管理系統,且更特別地涉及用于在數據管理系統中有效的數據壓縮和數據存儲的系統和方法。
背景技術:
在許多企業中,數據管理系統對于有效監控、采樣、存儲、維護、處理和分析與特定裝備、過程等有關的數據是重要的。例如,某些數據管理系統用于通過收集操作數據或參數來在不同的時間和位置監控各種過程,這些數據或參數用于所監控過程的后續分析。在某些過程中,操作數據或參數包括壓力、溫度、聲音、速率、液體流速、或任何其它可測量的物理、化學、或生物參數。隨后的分析可包括性能評估、誤差分析、成本分析、故障預測或預期壽命分析、或對各種過程的另一所期望的評估。
在許多這些分析中,基于數據采樣率、數據存儲容量、數據壓縮效率和其它瓶頸來限制數據管理系統。這些分析的精確度通常取決于數據采樣的程度,即數據采樣水平越高導致更高的分析精確度。不幸的是,數據存儲容量和壓縮效率的限制通常導致比所期望的數據采樣率更低的采樣率,因此降低了特定分析的精確度。在過程控制應用中,例如以非常頻繁的時間間隔從一個或多個并行過程收集數據(例如每秒一個或每分鐘一個),這導致了非常大量的所收集數據。因此,數據壓縮對于降低所收集數據的存儲消耗是重要的,同時還維持了所收集數據的重要部分以便在所期望的分析中使用。
現有的數據壓縮技術降低了所收集數據的存儲消耗,而這些技術為了便于存儲而犧牲了數據精確度。例如,一個現有的數據壓縮技術涉及組合和平均一組順序數據以創建一個平均數據點。但是,通過平均,數據管理系統丟失了平均數據點之上和之下的變化,這樣基于平均數據可導致不精確的預測。類似地,其它現有的數據壓縮技術可丟棄有效和顯著的數據以為后續進入的數據保存或打開存儲空間。
因此,存在對用于精確數據分析和預測的有效數據壓縮技術的需要。
發明內容
根據本發明的某些實施例,提供一種用于壓縮數據點集合的系統。該系統包括臨界孔徑壓縮模塊,其被配置成從數據點集合丟棄一個或多個數據點。丟棄的一個或多個數據點落在表示丟棄的一個或多個數據點趨勢的直線周圍的容差帶內。剩余的數據點集合表示壓縮的數據點集合。
根據本發明的某些其它實施例,提供一種實現數據壓縮的方法。該方法涉及提供臨界孔徑,其具有源自歸檔數據點并向保存的數據點延伸的上斜率和下斜率。基于保存的數據點的容差帶以及歸檔數據點和保存的數據點之間的中間點來獲得上斜率和下斜率。該方法還涉及如果源自歸檔數據點并延伸到后續新的數據點的直線斜率位于臨界孔徑內,則丟棄保存的數據點。
根據本發明的又一方面,提供一種用于壓縮從工業設備采樣的數據點集合的系統。經由一個或多個傳感器來監控工業設備,該一個或多個傳感器提供表示工業設備中任何可測量活動的數據點集合。該系統還包括數據管理系統,被配置成從一個或多個傳感器接收數據點集合并從該數據點集合丟棄一個或多個數據點。
當參考附圖閱讀下面的詳細敘述時,可更好地理解本發明的這些和其它特征、方面和優點,在整個附圖中相同的符號表示相同的部件,其中圖1是說明根據本技術的實施例的示例系統的圖示,該系統具有多個傳感器和臨界孔徑壓縮模塊;圖2是說明圖1所示的臨界孔徑壓縮模塊的示例實施例的圖示;圖3是說明臨界孔徑壓縮模塊在評估數據點集合中示例操作的圖解;圖4是說明根據本技術的實施例的孔徑的圖解,該孔徑用于識別何時基于歸檔數據點、后續的新數據點、和可允許的偏差來保存數據點;圖5是說明根據本技術的實施例的過程的流程圖,該過程用于定義如圖4所示的臨界孔徑;圖6是說明根據本技術的實施例的圖1所示的臨界孔徑壓縮模塊20的數據過濾過程的流程圖;圖7是說明圖6所示的數據過濾過程的一個示例實施例的圖解;和圖8是說明圖6所示的數據過濾過程的另一個示例實施例的圖解。
具體實施例方式
這里公開了用于提供信息存儲減小的系統和方法的各種實施例,所述信息由示例數據管理系統收集。這些實施例有效地減小數據點集合,該數據點集合表示從示例工業工廠記錄的一個或多個可測量的操作參數。例如,如下面進一步詳細討論的,本技術的某些實施例定義了與先前的歸檔數據點有關的臨界孔徑(例如,上斜率和下斜率)。如果后續的新數據點在該臨界孔徑內,則將其丟棄,而如果后續的新數據點在該臨界孔徑外,則將其保存。以這種方式,這些實施例提供了有效和節省成本的數據壓縮技術,該技術使存儲空間的使用減少。
現在轉向附圖,并首先參考圖1,示出一個示例數據管理系統10,用于壓縮來自數據點集合的一個或多個數據點。數據管理系統10用于經由多個傳感器14從工業設備12收集數據16。數據管理系統10包括數據獲取模塊18,用于從傳感器14獲得數據16、臨界孔徑壓縮模塊20,用于過濾或壓縮數據16、用戶存儲模塊22,用于存留過濾或壓縮的數據、以及用戶接口模塊24,用于與系統10交互并將用戶輸入26提供到系統10中。在下面討論的某些實施例中,臨界孔徑壓縮模塊20有利于通過丟棄落在與先前的歸檔數據點有關的臨界孔徑(例如,上斜率和下斜率)內的數據點來降低數據16的存儲消耗。換句話說,臨界孔徑壓縮模塊20丟棄臨界孔徑內一系列的數據點,直到后續數據點落在臨界孔徑之外。在該外側的數據點處,臨界孔徑壓縮模塊20存留、存儲或一般地保存外側的數據點,以作為下一個歸檔數據點,并且過程重復。在隨后的部分中會更詳細地討論前述的每個模塊,包括臨界孔徑壓縮模塊20。
工業設備12包括各種執行或促進工業任務的裝置。工業設備12的例子包括液壓設備;發電裝備,比如燃氣渦輪、流式渦輪、發電機;燃氣渦輪飛機引擎;熱傳輸裝備,比如鍋爐、空氣預熱器、過熱器、或其它熱交換裝置;以及熱生成裝備,比如熔爐、裝置運轉監視,比如造紙廠;和/或生產設施,比如汽車配件工廠。傳感器14被配置為監控工業單元12中操作參數的變化。
操作參數可包括溫度、壓力、容量、重量、質量、數量、速率(比如線性或旋轉)、加速度、流速(比如,液體流、空氣流等)、位置、張力、電流、電壓、功率、工作輸出、時間、顏色、硬度、粘性、濕度/濕氣等。由此,傳感器14包括各種傳感電路和機構,比如致動器、開關、標準尺、儀表、光學裝置、溫度測量裝置(例如,溫度計、熱電偶、熱敏電阻、高溫計等)、壓力測量裝置(例如,氣壓計、壓力計等)、刻度尺、計數器、計時器、位移測量裝置、速度計、頻率測量裝置、流量計、測力計、容量計、安培計、歐姆表、電位計、轉速計、色度計、分光光度計、應變儀、粘度計、光度計、反射計、濁度計、濕度計、熱量計等。在本示例實施例中,傳感器14便于監控、獲取、采樣、分析和響應控制工業設備12。例如,如果傳感器14識別速率、溫度或其它操作參數的不期望狀態或變化,則系統10可通過調整適當的操作參數來應答。在其它示例實施例中,傳感器不直接提供感測的數據。相反,感測的數據可從歸檔系統或數據獲取系統獲得,這些系統被配置為通過調整信號增益、降低噪聲來修改感測數據,或基于某些測量標準來轉換感測數據。修改的感測數據可由臨界孔徑壓縮模塊一前一后地或與實際感測數據相分離地處理。
在操作中,數據管理系統10便于監控、獲取、壓縮、存儲和分析來自多個傳感器14的數據16。例如數據獲取模塊18與傳感器14交互以便以規定的時間間隔監控和獲取(或采樣)與多個操作參數對應的數據16。數據獲取模塊18的實施例提供對采樣率、數據類型、工程測量單元等的控制。在一些實施例中,系統10將數據16傳送到數據存儲模塊22,以作為數據點28的集合或流。
在某些示例實施例中,系統10將數據16傳送到孔徑壓縮模塊20,其基于如下面進一步詳細討論的數據過濾算法來分析和壓縮數據。在操作中,臨界孔徑壓縮模塊20使用該數據過濾算法來減小數據點28的集合,由此降低數據點28的存儲消耗。數據過濾算法的操作機制在下面更詳細地描述。在某些實施例中,數據獲取模塊18可被配置成基本實時地提供數據點28的集合給臨界孔徑壓縮模塊20,其在從數據獲取模塊18接收數據時執行數據過濾或壓縮。以這樣的方式,數據點28的集合可在它們被存儲在數據存儲模塊22時被過濾或壓縮。在其它實施例中,臨界孔徑壓縮模塊20可接收數據點28的集合作為先前記錄的數據。在這樣的場景下,數據獲取模塊18可提供數據點28的集合給數據存儲模塊22,其中臨界孔徑壓縮模塊20可訪問數據點28的集合用于后續分析和壓縮。
當在臨界孔徑壓縮模塊20中應用數據過濾算法之后,數據存儲模塊22為采樣的數據點28的集合和/或壓縮的數據點集合提供可靠的存儲空間。在某些實施例中,數據存儲模塊22包括本地存儲裝置、遠程存儲裝置、計算機網絡或數據存儲裝置、或其它適合的存儲結構。但是,數據存儲模塊22可包括一個或多個磁性媒體驅動器、硬盤驅動器、光驅動器、或其組合。在一些實施例中,數據存儲模塊22包括獨立(或廉價)磁盤冗余陣列(RAID),比如冗余硬盤驅動器的陣列。
用戶接口模塊24由系統操作員使用以便與臨界孔徑壓縮模塊20交互并提供輸入26給該模塊。輸入26包括影響由臨界孔徑壓縮模塊20執行的過濾或壓縮量的各種標準。例如,輸入26可包括容差帶或偏差限制,臨界孔徑壓縮模塊20使用該容差帶或偏差限制來確定數據點何時被保存或從數據點28的集合丟棄。在某些實施例中,容差帶或偏差限制包括上限和下限,比如與在數據點28的集合中最后歸檔的點有關的上斜率和下斜率。如下面詳細討論的,這些上斜率和下斜率定義與最后歸檔的點有關的臨界孔徑。如下所討論的,臨界孔徑壓縮模塊20的過濾算法使用該臨界孔徑來確定何時存留或丟棄數據點28集合中的后續點。用戶接口還可用于在超時發生之前啟用或禁用數據壓縮、設置最小時間間隔、和設置最大時間間隔。
圖2是說明根據本技術的某些實施例的具有圖1所示的臨界孔徑壓縮模塊20的系統30的圖示。在所示的系統30中,臨界孔徑壓縮模塊20包括處理器組件32、臨界孔徑計算模塊34、和臨界孔徑比較模塊36。在操作中,處理器組件32分別用數據存儲模塊22、臨界孔徑計算模塊34、和臨界孔徑比較模塊36來接收、處理、交換、和傳送數據和控制信號38、40和42。此外,處理器組件32執行數據過濾算法,以便壓縮數據點28的集合,數據點28的集合是由數據獲取模塊18從圖1所示的工業設備12處的多個傳感器14獲得的。處理器組件32還被配置為經由用戶接口模塊24從系統操作員(未示出)接收用戶輸入26。并且,用戶輸入26可包括各種壓縮標準,比如上容差帶或偏置限制和下容差帶或偏置限制,以為臨界孔徑壓縮模塊20定義臨界孔徑。
在臨界孔徑壓縮模塊20的操作中,以與先前歸檔的數據點相關的臨界孔徑,例如上斜率和下斜率看來,數據點28的系列或集合被相繼評估。先前歸檔點之后的下一個點被臨時存留為保存點。如果保存點之后的下一個點在臨界孔徑之外,則臨界孔徑壓縮模塊20永久地將保存點存留為下一個歸檔點。否則,如果保存點之后的下一個點在臨界孔徑內,則臨界孔徑壓縮模塊20丟棄現有的保存點并臨時將該下一個點存留為新的保存點。模塊20將繼續用下一個點來替換臨時的保存點,直到下一個點落在臨界孔徑之外。在到達落在臨界孔徑之外的下一個點時,模塊20將保存點永久地存留為下一個歸檔點,并且還臨時地將下一個點存留為新的保存點。如下面進一步詳細討論的,該過程重復以過濾出數據點28的集合內的點,從而減小數據點28的存儲消耗。
在前面過程的每個階段,臨界孔徑計算模塊34基于先前存檔的數據點、當前保存的數據點和下一個數據點的可允許偏差的分析為下一個數據點計算臨界孔徑。在某些實施例中,臨界孔徑壓縮模塊20為每個數據點提供可允許上偏差和下偏差,并且臨界孔徑計算模塊34定義每個數據點的孔徑以作為從先前存檔的數據點延伸到相應數據點附近上偏差和下偏差的上斜率和下斜率。換句話說,歸檔數據點和下一個數據點之間的每個數據點包括一個孔徑。依次地,臨界孔徑計算模塊34定義下一個數據點的臨界孔徑以作為歸檔數據點和下一個數據點之間所有孔徑的交集或公共部分。結果,當臨界孔徑計算模塊34分析后續新的點時臨界孔徑一般收縮。臨界孔徑,作為這里使用的術語,可被定義為對于所有先前計算的孔徑公共的斜率集合。下面參考圖4進一步詳細地討論臨界孔徑的計算。
現在轉向臨界孔徑比較模塊36,該模塊被配置為比較臨界孔徑和下一個數據點。更具體地,臨界孔徑比較模塊36的實施例計算歸檔數據點和下一個數據點之間的斜率,并接著將該斜率與臨界孔徑的上斜率和下斜率比較。如果臨界孔徑比較模塊36確定該斜率落在臨界孔徑的上斜率和下斜率之外,則這是導致先前保存點被歸檔且下一個數據點變為保存點的觸發事件。每個歸檔點被傳送到數據存儲模塊22,其根據該示例的數據過濾過程來存儲壓縮的數據44。
作為一個例子考慮,一般由引用數字48到62表示說明一系列數據點的圖解(如圖3所示)。臨界孔徑壓縮模塊20考慮每個數據點,以便從通常為歸檔數據點的數據點48開始以順序的方式進行可能的壓縮。容差帶63與連接點48和諸如點62的后續數據點的直線相交的任何點可通過在規定的限制內線性內插而被重構。對于其重構值超過真實值的部分比可允許的誤差還大的數據點60,不是這樣的情況。因此,點62不能是歸檔線段的端點。由于數據點60是最后的點,將其連接到點48的直線與所有插進的容差帶相交,數據點60是定義該線段端點且將被歸檔的數據點。為了驗證每個前述的容差帶與每條將歸檔數據點(數據點48)連接到新引入的數據點的后續直線相交,該數據系列將通常需要被保存,直到識別結束的數據點,但是下面描述的臨界孔徑技術允許結束的數據點在不必保存多于單個保存數據點的情況下而被找到。本技術對于數據壓縮高度有效,因為其評估每個數據點自身的價值而不是要求一組數據點被緩存和比較,直到獲得結果。
在本文中,圖4是說明根據本技術的實施例的孔徑的圖解,該孔徑用于識別何時基于歸檔數據點A、后續的新數據點C、和可允許的偏差來保存數據點B。在所示的實施例中,點B、A和C由具有坐標(x1,y1)的保存數據點64、具有坐標(x0,y0)的歸檔數據點66、和具有坐標(x2,y2)的后續下一個數據點68表示。可允許的偏差e由可允許的偏差70來表示,其包括先前部分描述的上容差帶或偏差限制和下容差帶或偏差限制。如所示的,保存點64的孔徑72包括由三角形包括的陰影區域,該三角形由歸檔數據點66、可允許偏差70的上端點74和可允許偏差70的下端點76形成。數學上,保存數據點64的孔徑72由線段78和80界定,它們具有如下計算的斜率。
對于具有坐標(x2,y2)的數據點68,將數據點68與歸檔數據點66聯接的線段82的斜率可如下計算 在某些示例實施例中,在所計算的保存數據點64的孔徑72是僅存的所計算孔徑的情況下,孔徑72變為臨界孔徑。并且,在當前實施例中,如果線段82的斜率位于臨界孔徑72的線段78和80的上斜率和下斜率之內,則保存數據點64可被丟棄并且數據點68變為新的保存數據點。現在可為新的保存數據點68計算新的孔徑。如果線段78的斜率大于或等于線段82的斜率且如果線段82的斜率大于或等于線段80的斜率,則線82位于臨界孔徑內。當線段82不位于臨界孔徑72內時,保存的數據點64可被歸檔且變為新的歸檔數據點。還可在超過用戶規定的最大超時且在最大超時持續期間沒有點被歸檔時歸檔保存的數據點64。
圖5是說明根據本技術的實施例的過程84的流程圖,該過程用于定義如圖4所示的臨界孔徑。過程84涉及作為輸入來在步驟86提供最后歸檔的數據點(A)、保存數據點(B)的坐標和允許偏差(e)。在步驟88,基于所提供的輸入,上端點(U)和下端點(L)通過將允許偏差(e)外插在保存數據點(B)的坐標上而被計算。在步驟90,由圖4中的線段78和80表示的上直線AU和下直線AL的斜率被計算,且這些斜率定義孔徑。在步驟92,過程84為先前保存的數據點確定孔徑(例如,上斜率和下斜率)與所有先前計算的孔徑的交集。換句話說,過程84的步驟92從最近存檔的數據點(A)直到當前保存的數據點(B)來識別所有孔徑的公共部分。結果,步驟92識別所有孔徑共同具有的最大上斜率和最小下斜率。這些斜率將是來自先前臨界孔徑和當前孔徑的兩個上斜率中的較低者以及來自先前臨界孔徑和當前孔徑的兩個下斜率中的較高者。在步驟92處確定的公共上斜率和下斜率定義如框94所示的臨界孔徑。
圖6是說明根據本技術的實施例的圖1所示的臨界孔徑壓縮模塊20的數據過濾過程96的流程圖。數據過濾過程96被配置成計算具有一個或多個臨界孔徑的集合,并且基于相應的臨界孔徑通過從數據點28的集合丟棄一個或多個數據點來歸檔數據壓縮。應當注意,盡管丟棄一個或多個數據點,數據過濾算法還便于重構機制,通過該重構機制,丟棄的數據點可基于所存儲的有關歸檔數據點的信息來通過線性內插被重構。
如圖6所示,過程96涉及作為輸入在步驟98接收與最后歸檔的數據點、保存的數據點、和容差帶有關的信息。在步驟100,過程96涉及通過圖4和5所示和在前面部分描述的示例技術來計算臨界孔徑。一旦臨界孔徑被確定,與新數據點有關的信息在步驟102被提供。在步驟104,從最后歸檔數據點到新數據點的斜率被計算。在步驟106,將在步驟100計算的臨界孔徑與在步驟104確定的新數據點的斜率相比較。
在詢問步驟106,過程96將新數據點的斜率(步驟104)與臨界孔徑(步驟100)比較。該比較產生兩個相互排斥的結果之一(1)新數據點的斜率落在臨界孔徑的上斜率和下斜率內,或(2)新數據點的斜率落在臨界孔徑的上斜率和下斜率之外。當所計算的新數據點的斜率落在臨界孔徑的斜率內時,步驟108跟進。在此時,保存的數據點被丟棄。在步驟110,新的數據點變為新的保存點。在步驟112,過程96按如上詳細討論的來計算新的孔徑。過程96接著按如上詳細討論的在步驟114計算新的臨界孔徑。步驟108到步驟114的序列可進一步重復,直到考慮了所有數據點。
如果在詢問步驟106新數據點的斜率沒有落在臨界孔徑內,則過程96進行到步驟116。該事件可被定義為不相交孔徑。在該步驟116,保存的數據點被歸檔且變為新的歸檔數據點。在步驟118,新的數據點變為新的保存數據點,并且在步驟120,新的臨界孔徑被計算。以類似方式,上述的步驟116到120的序列可對于后續新的數據點進一步重復,直到來自數據點28的集合的所有數據點已經被考慮。因此,通過在一個時間段上重復該方法,并且在從如圖1所示的工業設備12采樣的數據點28的集合中從一個數據點進行到另一個數據點,可從數據存儲模塊22(如圖1所示)丟棄大量的數據點。這導致數據點28的集合所消耗的存儲空間減小。
圖7是說明圖6所示的數據過濾過程的一個示例實施例的圖解。在該示例實施例中,數據點122到136被考慮為通過數據過濾過程96來壓縮。數據點122是歸檔的數據點,并且數據點124到132是由數據過濾過程96丟棄的中間數據點,因為這些數據點的斜率在臨界孔徑138的斜率內。如前所解釋的,中間數據點126被丟棄,因為聯接數據點126到歸檔數據點122的直線穿過所計算的臨界孔徑138直到先前的數據點124。類似地,中間數據點128到132被丟棄,因為聯接每個中間數據點到歸檔數據點122的直線穿過所計算的臨界孔徑直到每個相應中間數據點。應當注意,在特殊數據點處的臨界孔徑138完全由每個所計算的孔徑封閉,直到達到了該特殊數據點。但是,由于聯接數據點136到歸檔數據點122的直線位于臨界孔徑之外,數據點134變為新的歸檔數據點且點136變為新的保存點。應當注意,聯接數據點134到歸檔數據點122的直線穿過所計算的臨界孔徑138直到數據點132。此外,還應當注意,在所示的圖解中,中間數據點122到132位于聯接數據點134到歸檔數據點122的直線線段中和周圍,位于的方式是每個被丟棄的數據點的容差帶與該直線段相交。因此,可以理解,聯接歸檔數據點122和保存數據點134的直線段是被丟棄的數據點124到132趨勢的良好表示,并且這些丟棄的數據點在所期望時通過在固定的誤差限制(e)內線性內插直線段的坐標來被重構。
圖8是說明根據技術的實施例的另一個示例數據過濾過程的圖解。數據點140到158的集合包括歸檔數據點140和中間數據點142到150。在該示例實施例中,具有一般由數字160、162和164表示的一個或多個虛擬數據點的集合被如此選擇,使得這些虛擬數據點位于實際數據點的容差帶內,在該示例情況中實際數據點由數字156來表示。現在可基于虛擬數據點而不是實際數據點來選擇保存的數據點152。計算從歸檔數據點140并迭代地從數據點142到156開始的臨界孔徑166。但是數據點158位于臨界孔徑之外,因為聯接數據點158的上端點和下端點的直線不與臨界孔徑166相交。因此,如此選擇一個或多個虛擬數據點使得虛擬數據點位于實際數據點的容差帶內,實際數據點在本示例情況中由數字156表示,并且使得所述虛擬數據點與臨界孔徑166相交。由該示例實施例提供的優點在于,彼此靠近的某些數據點可被丟棄,以便能夠更好地考慮位于更遠距離的數據點。這還進一步使得能夠在更大的數據點集合進行更高的壓縮,如模擬所指示的。
在前面部分描述的各個實施例和方面可包括可執行指令(例如,順序或面向對象的代碼),用于實現各種邏輯功能。可執行指令可體現在任何計算機可讀介質中以供或聯合基于計算機的系統來使用,基于計算機的系統可取得指令并執行它們。在本申請的上下文中,計算機可讀介質可以是包含、存儲、傳遞、傳播、傳輸或傳送該指令的任何裝置。計算機可讀介質可以是電、磁、光、電磁、或紅外系統、設備、或裝置。如所示的,有形媒體的非窮盡列表可包括具有一條或多條導線的電連接(電的)、便攜式計算機磁盤(磁的)、隨機訪問存儲器(RAM)(磁的)、只讀存儲器(ROM)(磁的)、可擦除可編程只讀存儲器(EPROM或閃速存儲器)(磁的)、光纖(光的)、和便攜式壓縮盤只讀存儲器(CDROM)(光的)。注意到,有形媒體還可包含紙件或另一適當的介質,在其之上可借助機械或電子的方式或手寫的方式來印刷指令。例如,指令可經由光掃描紙件或其它介質而電子地獲取,接著被編譯、解釋或如果需要以適當的方式處理,并且接著被存儲在計算機的可讀存儲器中。
如本領域技術人員將理解的,上述的數據管理系統和技術通過從數據點集合丟棄一個或多個數據點來提供有效的數據壓縮,同時允許利用來自所存儲的數據點的信息借助線性內插來容易地重構丟棄的數據點。丟棄的數據點的重構對于任何類型的數據分析或計算可在任何稍后時間及時使用,該重構允許數據管理系統維持提高的與數據點集合代表的工業設備操作參數有關的精確度水平。數據管理系統還通過諸如平均的方法,在經由數據過濾算法通過考慮來自數據點集合的每個數據點計算數據點集合并且評估特殊數據點是否應當被丟棄時,來保持提高的精確度水平。數據管理系統因此允許對數據集合使用減小的存儲容量。此外,數據管理系統允許對于給定存儲容量存儲數據點更長的時間段,這導致增加的成本節約。此外,這種類型的數據壓縮不會將更多的數據打包成較少的位。它僅僅丟棄其可重構的數據,只留下可在線性內插數據點重構方法中使用的線段端點。并且,數據壓縮技術不可總執行數據數據壓縮。數據壓縮不能被執行的示例情形包括當數據點不能由任何趨勢或模式定義時的情形。
盡管只有本發明的某些特征在這里被說明和描述,但對于本領域技術人員可出現許多修改和變化。因此,應當理解,所附權利要求旨在覆蓋所有這種落在本發明真實精神內的修改和變化。
權利要求
1.一種系統,包括臨界孔徑壓縮模塊,被配置成從數據點集合丟棄一個或多個數據點,其中丟棄的一個或多個數據點的容差帶落在表示丟棄的一個或多個數據點趨勢的直線周圍,并且其中剩余的數據點集合表示壓縮的數據點集合。
2.權利要求1的系統,其中臨界孔徑壓縮模塊包括處理器組件。
3.權利要求1的系統,其中臨界孔徑壓縮模塊包括臨界孔徑計算模塊或臨界孔徑比較模塊,或其組合。
4.權利要求1的系統,其中容差帶包括上線和下線,這兩條線分別源自數據點集合中第一點附近的偏差上限和下限并延伸到數據點集合中第二點附近的偏差上限和下限。
5.權利要求1的系統,還包括一個或多個傳感器,被配置成收集數據點集合。
6.權利要求5的系統,其中一個或多個傳感器適于測量溫度、壓力、時間、流速、速率、電壓、電流、振動、速度、加速度或它們的組合,或者基于傳感器測量的計算。
7.權利要求5的系統,其中一個或多個傳感器監控工業系統中至少一個可測量的過程控制參數。
8.權利要求5的系統,還包括數據獲取模塊,被配置成從一個或多個傳感器接收數據點集合并將數據點集合提供給臨界孔徑壓縮模塊。
9.權利要求1的系統,還包括數據存儲模塊,被配置成接收和存儲來自臨界孔徑壓縮模塊的數據點集合。
10.權利要求1的系統,還包括用戶接口模塊,被配置成將來自系統操作員的一個或多個輸入提供給臨界孔徑壓縮模塊。
11.權利要求1的系統,其中直線表示落在容差帶內的一個或多個丟棄的數據點。
12.權利要求1的系統,其中基本上實時地將數據點集合提供給臨界孔徑壓縮模塊。
13.權利要求1的系統,其中臨界孔徑壓縮模塊被配置成通過在容差帶內線性內插來重構丟棄的一個或多個數據點。
14.一種用于數據壓縮的方法,包括基于保存的數據點的容差帶以及歸檔數據點和保存的數據點之間的中間點,來提供具有上斜率和下斜率的臨界孔徑,這兩個斜率源自歸檔數據點并延伸到保存的數據點附近的偏差上限和下限,并且如果源自歸檔數據點并延伸到后續新的數據點的直線斜率位于臨界孔徑內,則丟棄保存的數據點。
15.權利要求14的方法,還包括將新的數據點設置成新的保存數據點,并基于新的保存數據點計算新的臨界孔徑。
16.權利要求14的方法,其中提供臨界孔徑包括為歸檔數據點和后續新的數據點之間的數據點識別所有孔徑的交集,每個孔徑對于每個相應的點具有源自歸檔數據點并延伸到容差帶的上限和下限的上斜率和下斜率。
17.權利要求14的方法,還包括如果斜率不在臨界孔徑內,則歸檔保存的數據點,其中保存的數據點變成新的歸檔數據點。
18.權利要求14的方法,還包括將虛擬數據點設置為新的保存數據點并基于新的保存數據點計算新的臨界孔徑,其中虛擬數據點不同于實際數據點并且其中虛擬數據點位于先前計算的臨界孔徑內和實際數據點的容差帶內。
19.權利要求14的方法,還包括基本上實時地獲得一個或多個數據點,數據點包括保存的數據點和后續的新數據點。
20.權利要求14的方法,還包括經由用戶接口模塊至少提供容差帶。
21.權利要求14的方法,還包括通過在容差帶內線性內插來重構丟棄的保存數據點。
22.一種有形媒體,包括數據過濾代碼,包括配置成基于保存的數據點的容差帶以及歸檔數據點和保存的數據點之間的中間點,來提供具有上斜率和下斜率的臨界孔徑的代碼,這兩個斜率源自歸檔數據點并延伸到保存的數據點,和配置成如果源自歸檔數據點并延伸到后續新的數據點的直線斜率位于臨界孔徑內,則丟棄保存的數據點的代碼。
23.權利要求22的有形媒體,還包括被配置成將新的數據點設置成新的保存數據點,并基于新的保存數據點計算新的臨界孔徑的代碼。
24.權利要求22的有形媒體,還包括被配置成為歸檔數據點和后續新的數據點之間的數據點識別所有孔徑的交集的代碼,每個孔徑對于每個相應的點具有源自歸檔數據點并延伸到容差帶的上限和下限的上斜率和下斜率。
25.權利要求22的有形媒體,還包括被配置成如果斜率不在臨界孔徑內,則歸檔保存的數據點的代碼,其中保存的數據點變成新的歸檔數據點。
26.權利要求24的有形媒體,還包括被配置成將一個或多個數據點提供給數據過濾算法以作為先前記錄的數據點的代碼。
27.權利要求24的有形媒體,還包括被配置成通過不相交孔徑之前的所有臨界孔徑的交集來確定新的臨界孔徑的代碼。
28.權利要求27的有形媒體,其中不相交孔徑不具有與先前臨界孔徑一樣的斜率。
29.權利要求27的有形媒體,還包括被配置成至少對于容差帶接收用戶輸入的代碼。
30.一種方法,包括基于歸檔數據點、保存的數據點、或容差帶、或其組合來計算臨界孔徑;如果所計算的從歸檔數據點到新數據點的斜率落在所計算的臨界孔徑內,則丟棄保存的數據點;并且計算新的保存數據點的新臨界孔徑,其中新的保存數據點是新的數據點。
31.權利要求30的方法,還包括如果斜率沒有落在所計算的臨界孔徑內,則歸檔保存的數據點。
32.權利要求30的方法,還包括計算源自歸檔數據點并延伸到虛擬數據點的直線斜率,其中虛擬數據點的容差帶位于臨界孔徑內。
33.權利要求30的方法,還包括基本上實時地提供歸檔數據點、保存的數據點、或容差帶、或其組合。
34.權利要求30的方法,還包括提供歸檔數據點、保存的數據點、或容差帶、或其組合作為先前記錄的數據。
35.權利要求30的方法,還包括通過在容差帶內線性內插來重構丟棄的保存數據點。
36.一種方法,包括將從工業系統采樣的數據點集合提供給數據管理系統,其中數據點集合表示工業系統中一個或多個可測量的過程參數;提供容差帶給數據管理系統;并且通過從數據點集合丟棄一個或多個數據點來獲得壓縮的數據點集合,其中丟棄的一個或多個數據點落在表示丟棄的一個或多個數據點趨勢的直線周圍的容差帶內。
37.權利要求36的方法,還包括經由設置在工業設備上的一個或多個傳感器來測量數據點集合。
38.權利要求36的方法,還包括基本上實時地將數據點集合從工業設備傳遞到數據管理系統。
39.權利要求36的方法,還包括將數據點集合傳遞到數據管理系統作為記錄的數據。
40.權利要求36的方法,其中工業設備包括渦輪設備、發電機設備、熱能設備、熱交換設備、熔爐、液體壓縮設備、或其組合。
41.一種數據管理系統,包括用于基于保存的數據點的容差帶以及歸檔數據點和保存的數據點之間的中間點,來提供具有上斜率和下斜率的臨界孔徑的裝置,這兩個斜率源自歸檔數據點并延伸到保存的數據點,并且用于如果源自歸檔數據點并延伸到后續新的數據點的直線斜率位于臨界孔徑內,則丟棄保存的數據點的裝置。
42.一種系統,包括經由一個或多個傳感器監控的工業設備,其中傳感器提供表示工業設備中任何可測量活動的數據點集合;和數據管理系統,被配置成從所述一個或多個傳感器接收數據點集合,其中數據管理系統包括臨界孔徑壓縮模塊,被配置成從數據點集合丟棄一個或多個數據點,其中丟棄的一個或多個數據點落在表示丟棄的一個或多個數據點趨勢的直線周圍的容差帶內,并且其中剩余的數據點集合表示壓縮的數據點集合。
43.權利要求42的系統,其中工業設備包括渦輪設備、熔爐設備、熱交換設備、液體壓縮設備、發電機設備、或其組合中的至少一個。
44.權利要求42的系統,其中一個或多個傳感器適于從工業設備測量溫度、壓力、時間、流速、速率、電壓、電流、振動、速度、加速度或它們的組合。
45.權利要求42的系統,其中臨界孔徑壓縮模塊包括處理器組件、臨界孔徑計算模塊或臨界孔徑比較模塊。
46.權利要求42的系統,其中數據管理系統包括數據獲取模塊,被配置成經由一個或多個傳感器接收數據點集合并將數據點集合提供給臨界孔徑壓縮模塊。
47.權利要求42的系統,還包括數據存儲模塊,被配置成接收和存儲來自臨界孔徑壓縮模塊的具有一個或多個數據點的集合。
48.權利要求42的系統,其中臨界孔徑壓縮模塊基本上實時地接收數據點集合或將其接收作為先前記錄的數據。
49.權利要求42的系統,其中臨界孔徑壓縮模塊被配置成從數據點集合丟棄一個或多個數據點,其中丟棄的一個或多個數據點落在表示丟棄的一個或多個數據點趨勢的直線周圍的容差帶內,并且其中剩余的數據點集合表示壓縮的數據點集合。
50.權利要求42的系統,其中數據管理系統包括用戶接口模塊,被配置成將來自系統操作員的一個或多個輸入提供給臨界孔徑壓縮模塊,該一個或多個輸入包括最小可允許誤差、最大可允許誤差、壓縮之前的最小時間、強迫歸檔前的最大時間以及壓縮使能切換中的至少一個。
51.一種操作工業設備中的數據管理系統的方法,包括測量表示來自工業設備的一個或多個處理參數的數據點集合;基于容差帶和歸檔數據點中的至少一個,來經由數據過濾算法計算保存的數據點的至少一個臨時孔徑;和當所計算的從歸檔數據點到后續新數據點得出的直線斜率落在臨界孔徑內時,丟棄保存的數據點。
52.權利要求51的方法,包括當所計算的斜率沒有落在臨界孔徑內時,歸檔保存的數據點。
53.權利要求51的方法,包括經由放置在工業設備附近的一個或多個傳感器來基本上實時地測量來自工業設備的數據點集合,其中工業設備包括渦輪、發電機、電動機、壓縮器、和熱交換器中的至少一個。
54.權利要求51的方法,包括經由數據過濾算法通過在不相交孔徑之前的所有臨界孔徑的交集來確定臨界孔徑,其中不相交孔徑不具有與先前計算的臨界孔徑一樣的斜率。
全文摘要
提供一種用于壓縮數據點集合的系統。該系統包括臨界孔徑壓縮模塊,其被配置成從數據點集合丟棄一個或多個數據點。丟棄的一個或多個數據點落在表示丟棄的一個或多個數據點趨勢的直線周圍的容差帶內。剩余的數據點集合表示壓縮的數據點集合。
文檔編號H03M7/30GK101069353SQ200580040469
公開日2007年11月7日 申請日期2005年9月27日 優先權日2004年9月28日
發明者G·E·威廉斯 申請人:通用電氣公司