精選

[軟體定義儲存的故事] HCI 和 SDS 的曖昧故事

在 [企業儲存觀察室] HCI 蹭 SDS 搞曖昧? ⼀⽂當中,作者提到 HCI 超融合與 SDS 軟體定義儲存做為兩種不同、沒什麼相關的技術,不應混為⼀談。 ⾝為⼀個在軟體定義儲存打滾多年的產品經理,忍不住想跳出來說幾句話:現在的 HCI 會有看不盡的精彩,還有說不清的混亂,也...

2020/10/22

[企業儲存觀察室] 主動式歸檔−智慧化的巨量資料儲存新架構?(下)

上文接「主動式歸檔−智慧化的巨量資料儲存新架構?(上)

除了因應快閃與雲端的興起之外,AA 與 ILM/DLM 一個很大的不同點則在於如何談論「資料價值」這件事。在 ILM/DLM 當時大數據分析或人工智慧的技術尚未出現,因此著眼在於「資料價值會隨著生命週期而遞減」。因此當資料價值降低時,就可以將其移往成本較低的儲存媒體存放,著眼點在「降低儲存成本」。ILM/DLM 並不特別強調資料的回取(速度),因為機率不高。

圖片來源:主動式歸檔聯盟 (AAA)

而現今當我們有了資料分析的技術之後,除了要降低資料的儲存成本之外,我們還可以「從舊資料中產生新的價值」,因此不單可以降低成本,還可以創造營收。為此,AA 必須要能夠「快速的」、「跨虛擬檔案系統」的存取歸檔資料,也必須要走向一個開放的架構。

如果我們去看看參與 AAA 的這些廠商名單,主要的是跟磁帶技術有關的軟硬體供應商,有一些是雲端服務的供應商,還有物件儲存供應商。你當然可以把 AAA 視為企圖擴張磁帶技術市場的推波助瀾者,但我們也無法忽視主動式歸檔訴求的市場的確是存在的,特別是對那些在數位化之後,資料動輒數百 TB、上 PB 的企業組織。儘管快閃的儲存密度在不斷增加中,但的確也不並是所有的資料都需要高效能的儲存,特別是那些老舊的歸檔資料,使用相對來說算是慢車的磁帶,也許無法像高鐵那麼快速地的抵達,但成本也相對的低非常非常多。
延伸閱讀:「長期歸檔需要更精細的規劃

另一方面,如果我們看一下市場上現有的巨量(PB 級)快閃儲存供應商們,他們也說這類巨量快閃儲存適用於變動度低的資料,主要是因為這類儲存都是使用損耗較高的 QLC,而 QLC 本來就不適用於交易性資料。但如果再仔細去看看這類巨量快閃儲存的應用場景,就會發現主要都是使用在如人工智慧、大數據分析、生醫資料分析等方面,因為這些應用使用機器學習的模型運算,儲存效能會影響運算的速度與模型的精確度,而這些也都是對價格敏感度較低的應用,所以可以忍受高價的快閃儲存,但於其它價格敏感度高的應用,快閃儲存可能就不是一個可以接受的選項了。

備份、歸檔與主動式歸檔並不相同

根據主動式歸檔聯盟 2020 年的調查顯示,有 66% 的受訪者仍然在使用備份系統來存放(應該)歸檔資料。但備份和歸檔並不相同,而且有不同的目標。

如果把備份的拷貝當成歸檔,並且不斷的去備份不會變動的資料,這不僅會增加備份窗口的時間,而且浪費時間和儲存資源。當資料不斷地增長,無法區分備份和歸檔就會變得越來越昂貴,運營效率不佳和資料利用率低下則是額外的後果。

備份是建立一份資料的副本,在資料丟失或損壞時用來回復資料。通常硬碟 (HDD) 是備份的主要目的地,也有許多企業組織用磁帶做為次要目的地、不可變或空氣隔離的目的地。將不太常用或不會再變動的資料移動到更具成本效益的儲存位置,歸檔可以釋放昂貴的空間。

主動式歸檔使用高度可擴展的歸檔系統以及智慧化的軟體,軟體會使用豐富的中介資料、索引、目錄、標籤與全域命名空間來讀取歸檔資料,並且實現高效能的搜尋和回存。

備份
(拷貝資料)
歸檔
(移動資料)
主動式歸檔
(快速存取資料)
拷貝資料供作為保護和回復之用,資料將會留在原地將較不常使用的資料移動到更具經濟效益的儲存,釋放原始設備的儲存空間基於智慧主動式歸檔軟體、層級媒體、和/或雲端的可擴展的解決方案
在需要的時間點回復丟失的檔案,速度是重要因素回取資料供參考和分析,回存時的速度不是重要因素為歸檔資料提供快速的檔案或物件層的存取能力
短期間,平均 1~120 天 保護永久和長期資料不被修改或刪除保護資料並且提供有效的資料存取,典型的操作不需要人員介入

堅持也需要一些鼓勵,如果您願意支持我們,請點選以下的贊助連結