專利名稱:用于減小所需存儲容量以及創建數據庫的方法
技術領域:
本發明涉及一種用于減小數據庫的所需存儲容量的方法以及用于執行該方法的裝置。
熟練地建立數據庫的模型是一個難題,特別當涉及非常大量的數據的時候。一個具體的例子是需要存儲電話資費信息,或者存儲其他對于世界范圍內的任何地方-地方的組合或者至少對于相當大的國家(例如德國)的獨立可分配的信息單元。可用于此的存儲空間應當保持為最小。但是就德國而言,已經總共有5604×5604個可能的撥號代碼組合。因此總共有大于3千萬個數據記錄。在這種情況下,每個數據記錄包括僅對于該撥號代碼來說至少兩個4個字節的長整數值,對于地名至少25個字節,以及至少4個字節用于分配到各個資費區。因此每個數據記錄至少具有4+4+25+4=37個字節。因此,即使沒有考慮到各個所選擇數據庫的所謂系統開銷(索引,等等),整個數據庫將具有約為1.1G字節的大小。熟練地建立數據庫模型以及經典的壓縮技術將使得所需存儲容量減小到約為100M字節。對于特定的數據庫系統來說(這將在下文中具體描述),還需要進一步減小所需存儲容量。
德國專利DE 34 25 844 A1公開一種用于快速地在數據存儲器中檢索由電信交換系統或數據處理系統所產生的特定數據記錄的方法。該方法提出當數據記錄被存儲在數據存儲器中時,搜索條目同時被作為所謂的關鍵字并行地存儲在特定存儲區中。在進一步處理的過程中,或者當數據記錄被打印出來時,一但找到對應于搜索條目的關鍵字時,用于特定存儲區的順序搜索的地址計數器的計數器部位被用于尋址在數據存儲器中搜索的相關數據記錄。
另一種用于數據存儲器的搜索方法公開于德國專利DE 39 08 684 A1中。在該方法中,有限管理區、位于管理區內的搜索區、以及搜索對象被預定于n維坐標系統中,插入搜索區中的搜索對象被預先確定。
這些方法僅能夠稍微減小存儲容量的需求。
因此本發明基于特定方法和裝置的目的,該裝置適用于執行該方法以把特定數據庫所需存儲容量減小到超過目前已知的范圍。
用于減小數據庫的所需存儲容量的本發明的方法和特征在于,要被存儲的信息單元被分配給至少二維光柵矩陣的交點,各個顏色值被分配給位于該光柵矩陣中的信息單元,如此形成的圖像矩陣作為數據庫或者數據庫的一部分存儲,最好在該圖像矩陣已經受到圖像壓縮之后存儲。
該光柵矩陣被坐標軸所橫過,并且由算法或分配表所定義的信息內容可以被分配給各個坐標軸值。具體來說,用于該光柵圖像矩陣中的適當顏色值是已知的和已定義的RGB(紅綠藍三原色)顏色值,從而使得可以采用經典的無失真的壓縮方法進一步相當大程度地減小所需存儲容量。
用于執行根據本發明的方法的本發明的裝置的特征在于權利要求5的特點,根據進一步的從屬權利要求具有改進的可能性。
本發明將參照附圖利用實施例進行更具體的描述。
圖1示出數據庫的結構示意圖。
本發明基于這樣的概念,即,任何信息的條目可以被變換為定義一幅圖像的多維(例如,二維)顏色空間中的顏色值。信息的復合組(例如,數據庫或擴展表格)被表示為一串顏色值,也就是說,作為圖像。該顏色值不是任意地串在一起的,而是按照多維矩陣或坐標系統的形式的,該坐標軸被分配給他們自身的信息內容。除了與該顏色值轉換相關的減小之外,現在可以把經典的無失真圖像壓縮方法應用于由該轉換所產生的圖像。
經典的數據庫通常以表格存儲信息,每一列具有其自身的信息內容,但是該行(如果有的話)被用在一相同的方式。
根據本發明,原子或分子信息單元的組合被產生或特別變換為復雜顏色值。例如,三個ASCII字符被組合形成一顏色值。在這種情況下,對特定字符串的顏色值的分配由一算法或分配表所定義,該分配表依次類似地可以作為圖像信息存儲。
參照上述電話資費信息數據庫的實例,例如,二維顏色矩陣的x軸被分配給目的位置,而y軸被分配給起始位置。5604×5604矩陣這樣構成。相應的資費區在交點進入。另外,需要一索引,其中撥號代碼被分配給矩陣的行和/或列。各個資費信息被作為顏色值輸入到矩陣。其結果是一幅總共有5604×5604個點以及每個點具有4字節的顏色深度的位圖。當作為位圖存儲時,所需存儲容量仍然約為13M字節。但是,由于現在具有一幅圖,可以毫無困難地采用經典的無失真圖像壓縮方法。如果考慮以PNG格式(可移植的網絡圖像格式)作為基礎,例如,對于所得數據庫最多仍然需要僅僅約為650K字節的存儲容量,結合可能的較快訪問各個數據記錄的方法。
該附圖用圖解法示出該單元或者應用根據本發明的方法的數據庫的結構。
在以多坐標軸分配作為基礎的范圍內,提供坐標軸數值分配單元或者坐標軸變換單元ATU。該ATU通過算法或分配表格把特定的坐標軸數值分配給原子或分子信息或中間信息的條目,并且把所述坐標軸數值再次轉移回來。中間信息的例子是指向文件的指針,或者,在更復雜的情況中,為“真正的”圖像。
圖像(通常)被稱為各個顏色值的二維排列(“分布”)。因此,圖像也可以被理解為一個坐標系統,二維或多維坐標系統,其中各個顏色值被定位,例如在當前的上下文中。在多于二維坐標系統的情況下,也可以稱為顏色空間。
如果以二維坐標系統為例,則可以代表在ATU之下的分配規則,參見上述實例,簡化為如下“取撥號代碼的整數值作為坐標軸數值”,所有始發位置的數量則被確定為信息空間。
ATU本身依次訪問顏色值轉換器單元或者顏色變換單元CTU,它確定特定信息條目對坐標值數值的分配,也就是說各個顏色值到原子或分子信息單元或者中間信息單元的分配,反過來同理。
該分配可以再次通過算法或分配表進行。在這種情況下,采用如下基本概念
已知,顏色值可以被描述為RGB值。在這種情況下,一個RGB值例如通過各個8-字節數值(十進制0至255)表示紅、綠和藍的成分。這三個獨立的顏色值被轉換為單個RGB值,例如紅=255,綠=255,藍=255→RGB=16777215,或者紅=65,綠=43,藍=0→RGB=11073。
然后三個獨立的數值被按位把各顏色值合并形成24字節的顏色值。
例如255對應于11111111。結果,當由比特數值表示時,RGB值(255,255,255)變為比特數值11111111 111111111 1111111。
如該實例所示,特定信息條目如此被轉換為顏色值,更精確地說-通過對各個比特數值定義的分配表,-或者通過用于把RGB值分配給原子或分子信息或者中間信息的條目的分配表,-或者通過在每種情況下把原子或分子或中間信息分配給特定的紅、綠和藍數值的一種算法或者分配表。
換句話說,CTU這樣把顏色值(例如,RGB值)分配給原子或分子信息或中間信息的條目。在這種情況下,該應用不限于,例如,24-字節的RGB值的產生,而且可以類似地應用于任何顏色值,例如32-字節RGB值。
這將用CTU邏輯方案的簡單實例進行說明“在每種情況中從三個連續ASCII數值組成一個顏色值”。
采用這種簡單規則,例如,字“Beispieltext”[“舉例文本”]可以由包括四個像素的一串顏色值所表示Beispieltext→(66,101,105)(115,112,105)(101,108,116)(101,120,116)→6907202,6910067,7629925,7632997。
如果坐標軸數值分配單元ATU與顏色值轉換單元CTU結合使用,能夠以簡單的方式類似地采用不能夠用于經典數據庫系統中的特定的坐標軸以存儲附加信息。
然后數據或信息實際存儲在存儲器組中的圖像或顏色空間中,在圖中稱為數據立方體。
如上文所述,對于二維顏色空間(圖像)可以采用經典的無失真壓縮方法以進一步壓縮并減小所需存儲容量。在多于二維顏色空間的情況下,可以由二維圖像來模擬,或者可以把適當的無失真壓縮算法應用于多維圖像空間。
最后,為了與外界進行通信,存在一個作為數據庫引擎的接口,它的主要任務是信息的(緩沖)存儲和檢索。該接口還必須完成所有經典數據庫系統的基本功能;因此它僅在其實際實現形式上有所不同。
如果它的附加功能被減小為最基本的功能,則實際的差別是本發明的上下文中所需的像素值必須通過多維顏色空間中的數據庫接口進行讀取或設置。通常,基本處理過程如下(1) CTU把出現的信息單轉換為顏色值;(2) ATU(如果適當的話,可以不只有一個)再次把信息單元(顏色值)定位于它們各自的信息空間中,以及(3) 數據庫引擎在相應位置設置或讀取由在數據存儲器(數據立方體)中的CTU所確定的顏色值。
根據本發明的數據庫解決方法的特定優點主要是-所需存儲容量在相當大程度上得到減小,例如減小100倍,也就是說,例如從100M字節減小到650K字節。
-數據庫訪問由于該結構而變得更快,并且數據庫尺寸更小。
在所需存儲空間上的第一次減小已經通過利用顏色值轉換器單元CTU而實現;進一步的實質性減小是通過另外采用坐標軸數值分配單元ATU而實現的。
根據本發明的方法或者所述減小所需存儲容量的數據庫結構主要適用于涉及非常大量的數據,或者與數據量相關的傳輸費用,例如對于“視頻點播”、“新聞點播”部分以及用于互聯網傳輸等。與經典的數據庫相比,另外需要的建立數據庫模型的工作對于這些應用領域來說是值得的。當前處于顯著地位的令人感興趣的應用領域是世界范圍的路由數據庫系統,特別對于互聯網傳真服務,以及上述用于資費信息的系統以及通過售票機的計算的應用。
權利要求
1.用于減小數據庫的所需存儲容量的方法,其特征在于-要被存儲的信息單元被分配給至少二維光柵矩陣的交點,-各個顏色值被分配給位于該光柵矩陣中的信息單元,以及-如此形成的圖像矩陣被作為數據庫或數據庫的一部分存儲。
2.根據權利要求1所述的方法,其特征在于,復合的RGB顏色值被用作為顏色值。
3.根據權利要求1或2所述的方法,其特征在于,圖像矩陣的顏色值在作為數據庫或數據庫的一部分存儲之前受到圖像壓縮處理。
4.根據權利要求1至3中的一項所述的方法,其特征在于,由分配表所定義的算法或信息內容被分配給光柵矩陣的坐標軸數值。
5.用于執行根據權利要求1或2所述的方法的裝置,其特征在于-顏色值轉換單元(CTU),其通過一種算法或分配表把原子或分子信息單元或者中間信息單元分配給在由顏色矩陣所預定的顏色空間內的顏色矩陣的確定交點作為各個顏色值,-存儲器組(數據立方體),用于存儲該顏色值,以及-接口(數據庫引擎),其設置或讀取通過顏色值轉換單元確定的顏色值。
6.根據權利要求5所述的裝置,其特征在于,一個坐標軸數值分配單元(ATU)通過一種算法或分配表把原子或分子信息單元或中間信息單元分配給對應于多維顏色值矩陣的坐標系統的預定坐標軸數值。
7.根據權利要求5或6所述的裝置,其特征在于,一種用于無失真地壓縮該顏色值矩陣的裝置,該裝置被分配給存儲器組。
全文摘要
為了減小數據庫的所需存儲容量,本發明規定把要被存儲的信息單元分配給位于顏色空間中的至少二維光柵矩陣的交點,各個顏色值被分配給位于光柵矩陣中的信息單元,并且最好在圖像壓縮之后,把如此形成的圖像矩陣作為數據庫或數據庫的一部分存儲。根據本發明的解決方案使得特定數據庫的所需存儲容量減小100倍或更多。本發明主要適用于涉及大量數據和取決數據量的傳輸花費。
文檔編號G06F17/30GK1252146SQ98804033
公開日2000年5月3日 申請日期1998年4月8日 優先權日1997年4月9日
發明者阿明·埃爾-加扎爾 申請人:數據平方公司