一種索引的維護方法及裝置的制造方法
【技術領域】
[0001]本發明涉及大數據領域,尤其涉及一種索引的維護方法及裝置。
【背景技術】
[0002]隨著科學技術的發展,大數據(Big data)通常用來形容一個公司創造的大量非結構化數據和半結構化數據,這些數據在下載到關系數據庫用于分析時會花費過多時間和金錢。大數據分析常和云計算聯系到一起,因為實時的大型數據集分析需要像MapReduce (映射歸約)、HBase —樣的框架來向數十、數百或甚至數千的電腦分配工作。大數據分析相比于傳統的數據倉庫應用,具有數據量大、查詢分析復雜等特點。大數據需要特殊的技術,以有效地處理大量的容忍經過時間內的數據。適用于大數據的技術,包括大規模并行處理(MPP)數據庫、數據挖掘電網、分布式文件系統、分布式數據庫、云計算平臺、互聯網和可擴展的存儲系統。
[0003]Solr是一個獨立的企業級搜索應用服務器,它對外提供類似于Web-service (網頁-服務)的API (Applicat1n Programming Interface,應用程序編程接口)。用戶可以通過HTTP (HyperText Transfer Protocol,超文本傳輸協議)請求,向搜索引擎服務器提交一定格式的XML (Extensible Markup Language,可擴展標記語言)文件生成索引;也可以通過Http Get操作提出查找請求,并得到XML或json格式的返回結果。
[0004]在現有技術中,將所有的索引均存儲在一個collet1n。這樣會導致將所有索引的相關數據信息作為一個數據段,并以段為單位存儲至硬盤中,而硬盤刪除數據時,只能以段為單位進行刪除。因此在刪除部分索引時,為了防止硬盤中不被刪除的索引的相關數據的正常使用,通常建立維護刪除文件列表,將需刪除的索引的標識存儲在上述維護刪除文件列表中。將維護刪除文件列表中記錄的標識對應的索引視為被刪除的索引,用戶無法再使用。通過上述方法雖然實現了用戶刪除索引的目的,但是在服務器中,并未將索引正在刪除,即為服務器中仍然存儲有用戶需刪除的索引,浪費存儲空間。并且需要增加維護刪除文件列表維護刪除的索引,增加了存儲空間。也就是說,用戶在刪除索引時,不但沒有減少存儲空間的是使用,反而會增加存儲空間的使用。降低了存儲空間的使用效率。
【發明內容】
[0005]本發明的實施例提供一種索引的維護方法及裝置,用以提高存儲空間的使用效率。
[0006]為達到上述目的,本發明的實施例采用如下技術方案:
[0007]本發明實施例提供了一種索引的維護方法,包括:根據預設刪除規則,及已創建的collet1n的創建時間,確定是否有第一 collet1n ;其中,collet1n中存儲了索引,且不同的索引根據其時間信息,存儲至不同的collet1n中;所述第一 collet1n是待刪除的collet1n ;在確定有所述第一 collet1n時,刪除所述第一 collet1n,并更新檢索對應的collet1n。
[0008]進一步的,還包括:還包括:獲取待存儲索引;根據所述待存儲索引的時間信息,預設存儲規則,在已創建的類集collet1n中確定是否有第二 collet1n,所述預設存儲規則用于指示collet1n能夠存儲的索引的時間范圍;若確定有所述第二 collet1n,則將所述待存儲索引存儲至所述第二 collet1n。
[0009]進一步的,還包括:在確定沒有所述第二 collet1n時,則新建與所述索引的時間信息對應的所述第二 collet1n,并將所述索引存儲至所述第二 collet1n。
[0010]進一步的,所述預設刪除規則是將預設時間范圍外的collet1n刪除;所述根據預設刪除規則,及collet1n的創建時間,確定是否有第一 collet1n包括:根據所述刪除規則,及collet1n的創建時間,確定所述已創建的collet1n的創建時間是否有在所述預設時間范圍外的;若已創建的collet1n的創建時間有在所述預設時間范圍外的,則將已創建的collet1n的創建時間在所述預設時間范圍外的collet1n,確定為第一collet1n。
[0011]進一步的,本發明實施例提供了一種索引的維護裝置,包括:確定單元,用于根據預設刪除規則,及已創建的collet1n的創建時間,確定是否有第一 collet1n ;其中,collet1n中存儲了索引,且不同的索引根據其時間信息,存儲至不同的collet1n中;所述第一 collet1n是待刪除的collet1n ;處理單元,用于在所述確定單元確定有所述第一collet1n時,刪除所述第一 collet1n,并更新檢索對應的collet1n。
[0012]進一步的,還包括:獲取單元,用于獲取待存儲索引;所述確定單元,還用于根據所述獲取單元獲取的所述待存儲索引的時間信息,預設存儲規則,在已創建的類集collet1n中確定是否有第二 collet1n,所述預設存儲規則用于指示collet1n能夠存儲的索引的時間范圍;所述處理單元,還用于在所述確定單元確定有所述第二 collet1n時,將所述待存儲索引存儲至所述第二 collet1n。
[0013]進一步的,所述處理單元,還用于在所述確定單元確定沒有所述第二 collet1n時,新建與所述索引的時間信息對應的所述第二 collet1n,并將所述索引存儲至所述第二collet1n。
[0014]進一步的,所述預設刪除規則是將預設時間范圍外的collet1n刪除;所述處理單元,具體用于根據所述刪除規則,及collet1n的創建時間,確定所述已創建的collet1n的創建時間是否有在所述預設時間范圍外的;若已創建的collet1n的創建時間有在所述預設時間范圍外的,則將已創建的collet1n的創建時間在所述預設時間范圍外的 collet1n,確定為第一 collet1n。
[0015]本發明實施例提供了一種索引的維護的方法及裝置,包括:根據預設刪除規則,已創建的collet1n的創建時間,確定是否有第一 collet1n ;其中,collet1n中存儲了索弓丨,且不同的索引根據其時間信息,存儲至不同的collet1n中,在確定有第一 collet1n時,刪除第一 collet1n,并更新檢索對應的collet1n。這樣,在本發明中,不同的索引根據其時間信息,存儲至不同的collet1n中。在進行索引刪除時,可以根據預設刪除規則,及已創建的collet1n的創建時間,確定是否有第一 collet1n ;若有第一 collet1n,則說明存儲在待刪除的collet1n,此時,索引的維護裝置可以將第一 collet1n刪除。相對于現有技術,在本發明中,可以根據將索引根據其時間信息存儲至不同的collet1n后,根據collet1n的創建時間,將滿足預設刪除規則的collet1n進行刪除,而無需建立維護刪除文件列表,對刪除的索引進行維護。這樣一來,將第一 collet1n進行刪除時,是完全刪除,可以將其對應的存儲空間釋放出來,并且無需建立維護刪除文件列表,增加存儲空間的使用。從而可以將第一 collet1n的存儲空間用于存儲其他數據,進而實現了提高存儲空間的使用效率的目的。
【附圖說明】
[0016]為了更清楚地說明本發明實施例的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
[0017]圖1為本發明實施例提供的一種索引的維護方法的流程示意圖;
[0018]圖2為本發明實施例提供的另一種索引的維護方法的流程示意圖;
[0019]圖3為本發明實施例提供的一種索引的維護裝置的結構示意圖;
[0020]圖4為本發明實施例提供的另一種索引的