精選文章

[新聞|產業] 大型企業儲存廠商面臨市場寒冬

大部份的儲存系統大型製造商在將要過去的 2016 年都不太好過;不過,這究竟只是另一個寒冬,還是根本就是冰河期的開始?春天還會不會來呢?在即將步入 2017 年的這個時候,這些儲存廠商的心裡只怕是五味雜陳吧! 根據最新的 IDC 全球企業儲存系統追蹤季報 (IDC World...

2016年1月19日

[企業儲存觀察室] 企業級快閃儲存系統解析(中)

上文接「企業級快閃儲存系統解析(上)

全快閃儲存系統(All Flash Array, AFA)
這是一種全新、從頭設計的儲存系統,從硬體架構到控制軟體,全部都是為了要發揮快閃儲存的效能而設計的。整個儲存系統為了快閃儲存而最佳化,因此這類型的儲存系統通常可以發揮快閃儲存高效能 I/O 的特性,它的資料存取效能會比 HAF 高出非常多。

再以車子來做比喻,全新設計的全快閃儲存系統,它就是一部徹頭徹尾的超級跑車,它存在的唯一目的就是用盡全力榨出快閃儲存的每一滴效能。

就以資料傳輸通道來說,目前大部份的 SSD 為了適應大部份的傳統儲存系統,仍然是採用如 SAS 或 SATA 等通訊協定,這些串列式的傳輸界面原本是設計給像是磁帶機或磁碟機這樣的裝置使用的,但它也限制了快閃記憶體的資料傳輸能力。新的趨勢則是改用 PCIe 或是像 NVMe(Non-Volatile Memory express)這種專為非揮發性記憶體所制定的新興標準,以提供更高速的並行資料傳輸頻寬。因此我們可以看到大部份的全快閃儲存系統,在後端連接快閃儲存的連接通道,幾乎全都改採新的傳輸界面。

其實我們可以把全快閃儲存系統當做一顆超大型的 SSD,只是它的規模更大,系統的複雜度更高。全快閃儲存系統除了系統效能外,它與傳統儲存系統最大的不同之處在於(可能)擁有以下的這些特性:

資料減量技術-指的就去重( Deduppe)與壓縮;資料減量可以減少對儲存空間的需求以及資料傳輸時的負載/頻寬,為高成本的快閃儲存提供更佳的儲存效能比。但資料在減量後必須要重組或解壓縮後才能再被使用,資料減量與回復都是相當耗運算效能的,會對系統的效能產生影響,因此演算法就顯得非常重要了,它的好壞除了會影響系統整體效能外,也會影響系統的儲存效率,以及快閃記憶晶片整體的耐用度。

資料類型也會影響資料減量的比率,因此系統必須要能分辨資料類型,或是提供不啟動資料減量技術的能力。

Metadata-就如前文所提的,一顆大型的 SSD 其內部快閃記憶體的管理能力是極其重要的,它必須要最佳化系統效能以及快閃晶片的可靠性。Metadata 儲存的位置與它如何被使用,會極度的影響系統的效能與擴展能力;這與作業系統主記憶體的運用情形一樣,metadata 的廣度與深度分別影響著系統的效能與擴展性,因此必須在兩者間取得最佳化的平衡點。

資料保護-與 SSD 不同的,AFA 會使用記憶晶片層級的 RAID,或是糾刪碼(Erasure Code, EC) 等資料保護機制,來確保資料的安全性。但與傳統儲存系統相同的是,這些資料保護機制也會顯著的影響系統效能。

超額配置(Overprovisioning)-為了增加系統的效能,從主機送來的資料最好可以立刻寫入一個已經預先被抺除過的區塊,要增加這種概率,大部份但不是全部的 AFA 會使用超額的空間。超額配置是很常見的技術,因為它可以讓系統避免因為垃圾收集(Garbage collection)、耗損測定、以及其它快閃記憶體管理行為,而產生的效能影響,它同時也可以增加快閃記憶體的壽命。

資料熱點管理-真實世界的資料處理行為都會造成資料熱點,儘管快閃儲存的效能已經很快了,其實不需要像傳統/固態混合儲存系統移動資料熱點以提昇資料存取的效能,然而資料熱點會影響快閃記憶體的壽命。而垃圾收集作業會主動的在每一個資料寫入前,減少對整個資料區塊的抺除動作,這也會加劇資料熱點對快閃記憶體壽命的影響。因此全快閃儲存系統必須對資料熱點加以管理,以有效的增加快閃記憶體的壽命。

儲存軟體服務-資料複製、時點快照、拷貝(克隆),以及其它如災備、失效接管等 HAF 早已存在的功能,早期大部份的 AFA 因為對成本與效能影響的考量,並不提供這些服務。而現在其實仍然有相當比例的市售產品缺少部份(或全部)的這些軟體服務,如果在關鍵性應用上使用 AFA,這些儲存軟體服務是必須的。

儲存容量效率-不同的快閃儲存記憶晶片管理方式以及上述各種不同的技術,將會導致不同的空間效率。因此在 AFA 中一個很重要的數字就是:有效容量。對比於此數字的是未格式化容量,與可用容量。企業應該在乎的是有效容量,因為這才是實際可以存放應用資料的空間。

下文接「企業級快閃儲存系統解析(下)