精選

[軟體定義儲存的故事] HCI 和 SDS 的曖昧故事

在 [企業儲存觀察室] HCI 蹭 SDS 搞曖昧? ⼀⽂當中,作者提到 HCI 超融合與 SDS 軟體定義儲存做為兩種不同、沒什麼相關的技術,不應混為⼀談。 ⾝為⼀個在軟體定義儲存打滾多年的產品經理,忍不住想跳出來說幾句話:現在的 HCI 會有看不盡的精彩,還有說不清的混亂,也...

2020/06/16

[企業儲存觀察室] 企業儲存效能的新指標

當前用於比較儲存系統效能的指標,顯然並不足以反應技術的進展,句許我們需要一個更公平、廣泛適用和直觀的儲存效能指標。國外最近有人提出一個稱之為效能百分比 (Performace Efficiency Percentage, PEP) 的規範,具稱可以克服當前的限制,我們來看看什麼是 PEP?

儲存系統需要滿足應用系統的要求:
儲存一定數量的資料 (GB)。
需要對這些資料進行一些輸出入 (I/O) 的操作 (每秒多少個 I/O,I/O per Second, IOPS)。
存取資料時,預期會出現一定的延遲(毫秒)。
預期在硬體組件或災難性故障時獲得資料的保護。


儲存系統可以是緃向或橫向擴展,資料卷可以是持久(受保護)或原始(未受保護)的。

一個緃向擴展的系統有多個處理器和一定數量的儲存裝置(像是 SSD),在設計上是沒有單點故障 (Single Point of Failure) 的,像是處理器可以由另一個處理器接手。效能受處理器能力的限制,容量也會受到可支援最大 SSD 數量的限制。

一個橫向擴展系統使用一組透過網路連接的儲存節點,每個節點都有自己個別的處理器和 SSD。SSD 和儲存節點的故障恢復是透過節點使用 RAID 或糾刪碼 (Erasure Coding, EC) 來實現。叢集的整體效能或容量會受到叢集中可支援的最大儲存節點數量的限制。

儲存系統可以提供 RAID/EC、壓縮、去重 (Deduplication、精簡配置 (Thin Provisioning)、快照 (Snapshot)、複製 (Clone) 和加密等服務。
現今的儲存系統效能指標數字通常以 IOPS 為主,輔以延遲 (Lantency) 和輸出量(或產出,Throughput),這些指標都很重要,但當前的狀況是這些指標數字其實並無法協助企業用戶做出判斷。
首先,現今 SPC 己經淪為廠商們的數字遊戲。如果真要問現在的 SPC 效能指標數字,還有什麼是可供參考的,那就是它至少可以證明儲存系統最大可以產出多少個 IOPS。
IOPS 與工作負載有關,因此被引用的 IOPS 值或許適用、也或許不適用於實際上的工作負載。其次,僅僅只有 IOPS 數字也是不夠的。例如有兩個儲存系統都宣稱在使用具有 1M(1 百萬)個 IOPS 的 SSD 時,可以達到 10M(1 千萬)個 IOPS。A 廠牌需要使用 50 顆 SSD(50M 個 IOPS 總合效能)才能達成 10M 的 IOPS,但 B 廠牌只要使用 20 顆 SSD(20M 個 IOPS 總合效能)就可以實現 10M IOPS,明顯 B 廠牌的產品較優越,但單從 IOPS 指標是無法顯示這點。SPC 雖然有揭露實現 IOPS 數字的系統組態,但仍然無法反映出上述的情況。 

IOPS 的單位成本 ($/IOPS) 是一個合理的參考數字,但大部份儲存系統供應商不像 AWS,這些全球性的服務供應商在全球的訂價具有一致性。
她的 Elastic Block Storage (EBS) 有兩種基於 SSD 的規格:一個提供 3 個 IOPS/GB,另一個提供 50 個 IOPS/GB。客戶可以用來比較交付的有效容量 (eff-GB) 的 IOPS 單位成本 ($/eff-GB)。例如標準的 AWS SSD EBS 產品每個月每 GB 的價格為 0.10 美元,可以支援 3 個 IOPS/GB,因此每個 IOPS 每月的成本為 0.033 美元。而配置支援 50 個 IOPS/GB 每個月每 GB 的價格為 0.125 美元,每個 IOPS 每月的成本為 0.0025 美元,明顯較前者划算許多。而當 IOPS/eff-GB 和 $/eff-GB 兩個指標都有時,就可以做更公平的比較。

儲存系統供應商在每個地區的價格並不一致,因此在 SPC 所提供的成本數字僅能做為參考,與市場上的實際價格相差甚遠。有鑒於上述的情況,PEP 試著(暫時)不去討論價格這項因素,儘管它在企業用戶的採購過程很重要。PEP 的計算方式如下,分子是儲存系統在快取不友好(就是快取命中率不高)的工作負載上可提供的總 IOPS,分母是 SSD 的數量乘以每個 SSD 的 IOPS 能力,也就是 SSD 的總合效能。直覺的看,PEP(介於 0% 和 100% 之間的數字)是衡量儲存系統向提出請求的應用系統,公開 SSD 的總合效能的接近程度。

儘管 PEP 使用快取不友好的工作負載進行測量,但它仍然適用於包括快取友好在內的所有負載。考慮命中率為 80% 的工作負載,另外 20% 的工作負載還是需要存取 SSD。假設 SSD 可以提供 20M IOPS,具有 90% PEP 的儲存系統可以從 SSD 提供(20M *0.9=)18M IOPS,在最佳情況、沒有其它的瓶頸之下,它可以為應用程式提供多達(18M *[1/0.2]=)90M IOPS。相較之下,50% PEP 的儲存系統就只能提供最多 50M IOPS。總之,PEP 越好,所有的工作負載效能就越好。當然,儲存系統也許可能需要分別公佈在讀和寫,以及原始和被保護的資料卷個別的 PEP 值。

對企業組織來說,PEP 是一個比較容易在地實作的規範,而不像 SPC 的組態基本上是很難在本地實現的。在提供類似的服務時,應該比較兩個儲存統的 PEP。如果兩個儲存系統有不同的 PEP 值,就很容易在成本和 PEP 間做判斷。而如果兩個儲存系統具有相近的 PEP 時,成本(報價)較低的儲存系統當然較好,因此 $/PEP 也是另一個重要的指標。