精選

[軟體定義儲存的故事] HCI 和 SDS 的曖昧故事

在 [企業儲存觀察室] HCI 蹭 SDS 搞曖昧? ⼀⽂當中,作者提到 HCI 超融合與 SDS 軟體定義儲存做為兩種不同、沒什麼相關的技術,不應混為⼀談。 ⾝為⼀個在軟體定義儲存打滾多年的產品經理,忍不住想跳出來說幾句話:現在的 HCI 會有看不盡的精彩,還有說不清的混亂,也...

2020/05/13

[企業儲存觀察室] 2010 年代企業資料儲存產業十年,之四

2010 年代企業資料儲存產業十年,之三

之四,被重新定義的高階 (SAN) 儲存

高階、或者是稱為企業級儲存系統,一般指的是要能夠符合企業高可靠性、高可用性與高效能等「三高」要求的產品。在這裡要稍微說明一下,「企業級」是從英文 Enterprise Class 翻譯過來的,有時候「企業級」在意思上容易與「供企業使用的」產生混淆,因此就會以高階 (High-end) 來做更精確的表達。傳統上所認知的高階儲存系統,擁有專用的大型機櫃,看起來很精密複雜的控制機櫃,以及磁碟機櫃。像是早期 IBM 的 ESS (Shark)、EMC 的 Symmetrix 與 HDS 的 9900 等,都是算是認知上高階的儲存系統。

圖片來源:Wikipedia EMC Symmetrix

當時這類高階儲存系統最主要的特色就在於其系統架構。
更簡單的說,就是(相較於中階只有兩個)它擁有較多的儲存控制器數目、較大的快取記憶體、連接前後端 (Front-end and Back-end) 各組件間的高速資料交換網路以及大量的磁碟機,之所以需要這些就是要滿足高效能的需求。
在傳統磁碟機的時代,儲存系統的效能需要靠磁碟機的數目與大容量的快取記憶體來堆積;儲存控制器數目越多,移動資料能力也就越快,因此也就需要更大的資料傳輸頻寬。中國科學院計算技術研究所信息存儲中心副主任、現任天津中科藍鯨信息技術研發總監韓曉明博士,在 2010 年代初期就曾經發表過一篇文章「磁盤陣列技術的新進展」,將這類系統架構分成不同的檔次,並對其優劣加以比較一番,這篇文章當時引起業界相當的討論。

除了系統架構外,傳統的高階儲存系統以更多的冗餘能力來提供高可靠性,透過叢集或多節點架構來提供高可用性,以這些特性來與中階儲存系統來做市場區隔。
而這些同時也意味著高成本,因此通常也只有大型資料中心或關鍵性應用(才有錢)會採用高階儲存系統。

但當快閃儲存出現後,這一切都變了!即便是最入門的儲存系統,都可以因為使用快閃,就可以輕易地提供高於以往需要大量磁碟機才能堆疊出來的效能數字 (IOPS),這使得高階儲存的一個主要市場價值突然間就不見了,這個轉變當然這也就反應在市場的銷售上。我們並不清楚實際上的銷售數字少了多少,因為在 IDC 並不是以系統結構、而是以銷售金額 (> USD $250K) 來做區隔,它不是公開的數字,金額的大小與高中階儲存也不是等式。但從市況來看,高階儲存的銷售案例是明顯減少的。
延伸閱讀:「快閃是使高階儲存滅絕的『彗星』?

就如前文所說的,效能只是高階儲存之所以存在的重要因素之一;另一個使傳統高階儲存不再受到歡迎的原因,當然就是高成本啦!動輒較中階儲存高數倍起跳的價格,並不是大部份企業負擔得起(喜歡)的。(也或許這才是比效能更重要的影響因素?!)而儲存廠商們也開始對此做出回應,以一個較簡單的思路:用中階儲存(或稍微高一點點)的成本,來堆疊出高階儲存所需要的效能與其它必要的性能。

早在 2010 年代初期,EMC 的高階儲存系統就已經從傳統多控制器三層式架構的 DMX,換成前述所提韓博士的文章中稱其為「雙控制器鬆耦合叢集」架構的 VMAX。除了 VMAX 外,包括 HPE 3PAR 與 Fujitsu 的 Enternus 8000,也都被歸類為這樣的架構。
簡單來看,這就是以多組雙控制器的中階儲存,去組合出一部高階儲存。

做為一個高階儲存系統,這樣的架構其實是存在著缺點的,除了在不同節點間的資料交換頻寬較低外,快取記憶體間的同步與管理較複雜,資料存取的延遲時間也不一致。但這種由小往大堆疊的架構,有較好的彈性,一來可以回應市場對於橫向擴展的需求,二來對每個節點的可靠性要求較低,但整個架構卻一樣具有高可靠性。另外起始成本較低,擴充時的成本的增加也較為線性,更是它最大的優點。所以有越來越多的儲存系統都轉向採用這樣的架構,只剩下 Hitachi。她依然使用韓博士稱其為「多控制器緊耦合叢集」的架構,這種架構具備全交換式的內部互連,可以保有最大的資料頻寬與一致的存取延遲。但它的成本極為高昂,而且也無法做到橫向擴展,直到最近的 VSP 5000。
我們幾乎可以確定高階儲存的傳統架構,不論是「多控制器三層式架構」還是「多控制器緊耦合叢集架構」,經過十年時間轉變,在 2020 年代初始的今天,都已經走下企業儲存技術的舞台。

除了架構上的彈性外,另一個重要的高階儲存系統特性就是支援三中心架構。在近端(100 公里內)資料中心間使用同步的資料複製,或是雙主動(雙活),來提供雙中心服務的能力,在兩個資料中心間可以做到零 RPO 的失效接管。遠端資料中心則使用非同步的資料複製,100 公里以上的地理間隔,可以在大部份的天災狀況下存活,做到異地備援的能力。
這種在國外早已經是行之有年的兩地三中心架構,近幾年我們已經看到越來越多的國內企業開始有這樣的需求。

2010 年代企業資料儲存產業十年,之五