聯合分層管理的制作方法
【專利摘要】本申請公開了聯合分層管理。描述了一種裝置和方法,響應于大容量存儲設備中的至少某些大容量存儲設備提供標識哪些數據是將在層之間移動的候選的信息,在大容量存儲設備的層之間動態地移動數據。
【專利說明】聯合分層管理
【發明內容】
[0001] 描述了一種裝置和方法,響應于至少某些大容量存儲設備提供標識哪些數據是將 在層之間移動的候選的信息,在大容量存儲設備的層之間動態地移動數據。
【專利附圖】
【附圖說明】
[0002] 圖1示出了處于第一狀態的第一存儲子系統;
[0003] 圖2示出了處于第二狀態的第一存儲子系統;
[0004] 圖3示出了處于第一狀態的第二存儲子系統;
[0005] 圖4示出了處于第二狀態的第二存儲子系統;
[0006] 圖5示出了第二存儲子系統使用的流程;
[0007] 圖6示出了第二存儲子系統使用的另一流程;
[0008] 圖7示出了第二存儲子系統使用的大容量存儲設備;
[0009] 圖8示出了第二存儲子系統使用的又一流程;
[0010] 圖9不出了第三存儲子系統;以及
[0011] 圖10不出了另一大容量存儲設備。 詳細說明
[0012] 大容量存儲設備,例如硬盤驅動器(HDD)、固態驅動器(SSD)和混合盤驅動器 (Hybrid),能夠在存儲子系統中集成在一起。存儲子系統包括控制訪問大容量存儲設備的 控制器。存儲子系統可用于提供更好的數據訪問性能、數據保護或維護數據可用性。
[0013] 分層已經成為包括多種大容量存儲設備的子系統的優化中不可缺少的元素。在這 樣的存儲子系統中大容量存儲設備按照類型,例如,具有相似的性能特征,集合在一起形成 一個層。一個分層的示例是在最高性能的層上維護訪問最多的數據從而提高存儲子系統的 性能。較少訪問的數據則保存在較低性能的層上從而釋放較高性能的層上的空間。
[0014] 然而,數據訪問圖案的動態特性和用戶可消化的及時信息的缺乏,使得在最高性 能的層上維護該數據較困難,其中從該用戶可消化的及時信息獲得有效的存儲管理。為了 克服該問題可以自動執行分層以保持性能與變化的操作環境一致。然而在存儲子系統中維 護對所有大容量存儲設備的數據訪問圖案的持續評估,會是控制器中一個相當大的負擔, 并且會導致低效的存儲使用。
[0015] 為了說明,參見圖1的存儲子系統100。子系統100包括控制器110、第一存儲層 120和第二存儲層130。第一和第二存儲層120、130可以分別是SSD125和HDD135。這樣, 第一存儲層120具有的隨機訪問讀時間比第二存儲層130快。為了利用該較快時間,控制 器110基于訪問圖案在層之間移動數據。
[0016] 存儲子系統100中的數據示例為設備數據段120a。如圖所示,每個SSD125中有三 個設備數據段,例如120a、120b、120c。設備數據段120c是第一存儲層120中最不忙的設備 數據段。每個HDD135中有六個設備數據段。設備數據段130a和130b是第二存儲層130 中最忙的。設備數據段130c則是最不忙的。
[0017] 控制器110的任務是管理層之間數據的移動從而優化性能。為此控制器110使用 子系統數據塊以追蹤數據訪問。為了降低該追蹤的開銷,子系統數據塊的尺寸被劃分為比 設備數據段大。在該特定示例中,子系統數據塊IIOa對應包括設備數據段120a、120b、120c 的設備數據段組122。這樣子系統數據塊IlOa具有三個設備數據段的大小。子系統數據塊 IlOb對應設備數據段組124。子系統數據塊IlOc對應包括設備數據段130a的設備數據段 組132。子系統數據塊IlOd對應包括設備數據段130b、130c的設備數據段組134。無論設 備數據段何時被訪問,控制器110將該訪問作為它的對應子系統數據塊的訪問。在該示例 中,對組122中設備數據段的任何一個的訪問作為是對子系統數據塊IlOa的訪問。
[0018] 如前所述,設備數據段120c是第一存儲片120中最不忙的設備數據段。那么隨著 控制器110追蹤數據訪問,它確定分別對應的子系統數據塊IlOa是第一存儲層120中最不 忙的子系統數據塊。同樣地,由于設備數據段130a和130b是第二存儲層130中最忙的設 備數據段,控制器110確定分別對應的子系統數據塊IlOc和IlOd是第二存儲層130中最 忙的子系統數據塊。因此,控制器確定將最不忙和最忙的子系統數據塊移動到另一層。
[0019] 存儲層之間子系統數據塊的移動將參考圖2進行說明。在此,對應子系統數據塊 IlOa的設備數據段組122(包括設備數據段120a、120b、120c)被寫入HDD135,該HDD135 先前維護對應子系統數據塊IlOc的設備數據段組132(包括設備數據段130a)。類似地,對 應子系統數據塊IlOb的設備數據段組124被寫入HDD135,該HDD135先前維護對應子系 統數據塊IlOd的設備數據段組134(包括設備數據段130b、130c)。子系統數據塊IlOc和 IlOd分別被寫入先前存儲設備數據段組122和124的位置。
[0020] 在此揭露該分層管理方法的低效之處。注意和設備數據段組134 -起傳輸的是設 備數據段130c。該段曾是第二存儲層130中最不忙的設備數據段。現在該設備數據段位于 第一存儲層120中使用著本可用于更忙的設備數據段的寶貴存儲空間。發生這種情況是由 于該分層管理方法所作的折衷。考慮到在系統級為每個設備數據段追蹤所有數據訪問活動 對子系統控制器處理開銷和存儲器要求具有負面影響。此外,隨著潛在的層存儲容量增長, 用于追蹤訪問活動的子系統存儲器也增長否則會損害子系統數據塊大小的追蹤準確度。結 果,子系統存儲器和處理開銷通常指定子系統控制器使用比理想大小更大的塊-比設備數 據段更大。這導致由于將最不忙的設備數據段移動到最高性能的層上這樣的操作所造成的 性能增益減小。
[0021] 為了克服這種分層管理方法的不足,使用構成子系統的大容量存儲設備來貢獻分 層管理任務從而在提高分層整體效率的同時減小對子系統控制器處理開銷和存儲器要求 的影響。將監控大容量存儲設備數據段活動水平和標識候選移動段的任務分散在大容量存 儲設備上-也就是說,通過將其聯合-將使大容量存儲設備個體上承擔相對小的額外負擔, 但總體上極大地減少控制器任務。
[0022] 用這種方法也使得該分層更有效。由于控制器在子系統數據塊的大小以及控制器 處理開銷的量和用于監控設備數據段活動水平的存儲器之間進行折衷,聯合分層能夠在很 小容量的單元上實現,因為所有大容量存儲設備在并行進行該工作。
[0023] 大容量存儲設備貢獻分層管理的一個潛在方面在于,它提供給控制器的大量數據 是它可能已經維護的數據。考慮即使最小和最簡單的大容量存儲設備也包括內部緩存。為 了管理該內部緩存,大容量存儲設備追蹤它所服務的訪問活動并使最經常被請求的段在其 緩存中可用。這將優化緩存的性能益處。SSD為數據管理技術例如閃存單元的損耗均衡和 垃圾收集而監控訪問活動以保證存儲持久性。
[0024]然后這些大容量存儲設備能夠向控制器提供該訪問活動信息。這使得控制器能夠 得到準確、及時和全面的指示高或低訪問活動段的信息。然后控制器能夠使用該信息優化 子系統性能。因此,用自己非常少的測量活動,子系統控制器將從給定配置中獲得最好的性 能。由于大容量存儲設備已經可以結合對它們自己內部緩存的監管或其他內部管理處理很 多這些工作,由聯合分層管理導致的額外負擔相對較小。
[0025] 控制器將配置每個層中的大容量存儲設備關于它將從它們請求哪些訪問活動信 息,隨后請求該信息。每個大容量存儲設備優選地追蹤其存儲空間中最忙或最不忙的段的 讀和寫活動,包括記錄順序讀和寫。為了確定哪個段應在層之間移動,控制器可以請求最忙 或最不忙的段的列表。為了說明,參考圖3和所示的子系統300。這里,控制器310向第一 存儲層320的大容量存儲設備請求哪些設備數據段最不忙,潛在地滿足閾值或其他條件。 作為響應,控制器310接收關于設備數據段320a、320b的訪問活動信息。控制器310向第 二存儲層330的大容量存儲設備請求哪些設備數據段最忙。作為響應,控制器310接收關 于設備數據段330a、330b的訪問活動信息。
[0026] 然后控制器310確定這四個被標識的設備數據段是否應當被移動,這部分地基于 目標層是否能夠接收它并且達到移動的目的。如圖3所示,第一和第二存儲層320、330能 夠容納該數據移動,因為二者都報告了兩個設備數據段。在圖4中控制器310繼續在存儲 層之間移動所標識的設備數據段。設備數據段320a和330a的存儲位置互換,并且設備數 據段320b和330b的存儲位置互換。這樣提高了設備數據段330a和330b的訪問性能。并 且,和圖1和2的分層管理方法不同,沒有無保證的設備數據段移動被執行。結果是不像被 放入高性能層中那樣多地被訪問的數據量的最小化。注意最不忙的設備數據段330c未被 移動到第一存儲層320。而且,控制器310使用了比圖1和2所示的處理器110用于管理 15個子系統數據塊更少的處理和存儲器資源來管理這四個設備數據段320a、320b、330a和 330b〇
[0027] 以上描述只是許多示例中的一個。進一步的示例將參考下面的表1進行說明。假 設子系統中的每個大容量存儲設備維護如表1所示的訪問活動信息。第1列示出了作為 LBA范圍的設備數據段。這些LBA范圍可以任意方式定義。一種方式是使用子系統訪問的 平均傳輸長度。盡管每個層和每個大容量存儲設備的段的大小可以不同,但這會導致控制 器更多的開銷。
[0028] 每個LBA范圍有相關的讀和寫(訪問)頻率值。這些值可根據滿足閾值訪問頻率 而確定。例如,子系統控制器可編程大容量存儲設備從而將某個值,例如15010/秒,作為訪 問頻率。或者大容量存儲設備可隨著它們發生而簡單地增加每個讀和寫的列,并且子系統 控制器用于確定訪問頻率。這可以通過子系統控制器確定訪問活動信息請求之間的時間來 完成。或者子系統控制器可以以固定間隔對訪問活動信息請求進行計時。然后大容量存儲 設備將僅發送滿足一定閾值的訪問活動信息。而且,在某些情況下提供除了讀活動以外的 信息,因為在層之間移動數據的最好決定可能不是僅考慮讀活動信息而確定的。
[0029] 此外,大容量存儲設備可提供控制器不方便收集的信息。例如,表1中的訪問活動 信息還包括顯示該訪問是否為順序的列。子系統控制器要準確檢測順序訪問具有很大的困 難。但是順序訪問可能是考慮是否降級或升級設備數據段的重要信息。
【權利要求】
1. 一種方法,包括:響應于大容量存儲設備中的至少某些大容量存儲設備提供標識哪 些數據是將要在層之間移動的候選的信息,在大容量存儲設備的層之間動態地移動數據。
2. 如權利要求1所述的方法,其特征在于,在層之間動態地移動數據由子系統控制器 執行。
3. 如權利要求1所述的方法,其特征在于,所述大容量存儲設備的每一個包括與子系 統控制器分離的控制器。
4. 如權利要求2所述的方法,其特征在于,進一步包括,子系統控制器請求大容量存儲 設備提供標識哪些數據是將要在層之間移動的候選的信息。
5. 如權利要求4所述的方法,其特征在于,進一步包括,大容量存儲設備響應于請求而 提供所述信息,所述信息包括設備數據段以及相關的讀訪問、寫訪問、順序讀和順序寫中的 至少一個。
6. 如權利要求4所述的方法,其特征在于,進一步包括,子系統控制器配置大容量存儲 設備以提供所述信息。
7. 如權利要求1所述的方法,其特征在于,進一步包括,大容量存儲設備收集所述信息 作為不同于在層之間移動數據的用途。
8. 如權利要求1所述的方法,其特征在于,進一步包括,大容量存儲設備在它們自身之 間移動數據并通知子系統控制器數據已經移動。
9. 如權利要求1所述的方法,其特征在于,所述層是分布式文件系統的一部分。
10. -種系統,包括: 子系統控制器;以及 耦合到子系統控制器的大容量存儲設備的層,每一個被配置為向子系統控制器輸出用 于在層之間移動數據的訪問活動信息。
11. 如權利要求10所述的系統,其特征在于,所述子系統控制器和層通過各自的接口 親合在一起。
12. 如權利要求10所述的系統,其特征在于,所述層在性能、成本和容量中的至少一方 面不同。
13. 如權利要求10所述的系統,其特征在于,訪問活動信息包括設備數據段以及相關 的讀訪問、寫訪問、順序讀和順序寫中的至少一個。
14. 權利要求10所述的系統,其特征在于,所述大容量存儲設備的每一個包括與子系 統控制器分離的控制器。
15. 權利要求10所述的系統,其特征在于,子系統控制器被配置為請求訪問活動信息。
16. 權利要求10所述的系統,其特征在于,大容量存儲設備被配置為在它們自身之間 移動數據并通知子系統控制器數據已經移動。
17. 權利要求10所述的系統,其特征在于,子系統控制器能夠配置大容量存儲設備以 提供所述信息。
18. 權利要求10所述的系統,其特征在于,大容量存儲設備被配置為收集所述信息作 為不同于在層之間移動數據的用途。
19. 權利要求10所述的系統,其特征在于,所述層是分布式文件系統的一部分。
20. -種子系統控制器,包括存儲接口,所述存儲接口可電耦合到大容量存儲設備的 層,并且可操作地被配置為響應于從大容量存儲設備中的至少某些大容量存儲設備接收的 訪問活動信息而確定層之間的數據移動。
21. 如權利要求20所述的子系統控制器,其特征在于,子系統控制器被配置為使用至 少一個政策以及訪問活動信息以確定數據移動。
22. 權利要求20所述的子系統控制器,其特征在于,在從子系統控制器接收請求后接 收訪問活動信息。
23. 權利要求22所述的子系統控制器,其特征在于,所述請求可以是周期性的或由事 件驅動。
24. 權利要求20所述的子系統控制器,其特征在于,進一步被配置為針對訪問活動信 息向大容量存儲設備提供配置信息。
25. -種大容量存儲設備,包括: 大容量存儲器,以及 耦合的控制器,用于控制對大容量存儲器的訪問并包括主機接口;所述控制器被配置 為收集大容量存儲器的訪問活動信息,并響應于請求而從存儲接口輸出訪問活動信息。
26. 如權利要求25所述的大容量存儲設備,其特征在于,控制器由子系統控制器配置。
27. 如權利要求25所述的大容量存儲設備,其特征在于,進一步包括耦合到控制器的 子系統控制器。
28. 如權利要求25所述的大容量存儲設備,其特征在于,子系統控制器包括層接口。
29. 如權利要求25所述的大容量存儲設備,其特征在于,訪問活動信息被輸出到大容 量存儲設備外部。
30. 如權利要求25所述的大容量存儲設備,進一步被配置為與另一大容量存儲設備一 起移動。
【文檔編號】G06F12/08GK104484125SQ201410557180
【公開日】2015年4月1日 申請日期:2014年8月4日 優先權日:2013年8月2日
【發明者】D·B·安德森 申請人:希捷科技有限公司