精選

[主筆漫談] 專屬型微處理器的復興

電腦的世界自始至終都是圍繞在軟體與硬體的協作之上,單純的硬體或是單純的軟體,是無法完成任何事情的。如果從這個角度看,所謂的軟體定義抑或是硬體定義,只不過也就是「為賦新詞強說愁」罷了! 回到本文主題的微處理器身上。早年,也就是從所謂的「電腦」(計算機)剛被發明出來,一直到筆者唸...

2011/01/05

[專家觀點] 管理儲存系統是一個追求平衡的工作

本文由作者 Tony Hobart 授權 storageforum.tw 翻譯;Tony Hobart 是 Laurus Technologies,一家位於美國芝加哥市郊的系統整合與專業服務公司的系統技術顧問,專精於儲存。

今日儲存管理者或是工程師最重要的一項技能就是平衡,那是因為所有的儲存管理工作都是在尋求平衡點。那不只是容量管理,有很多的企業即使他們還有很大量的未使用空間,但仍然碰到 SAN 效能不彰的緊張情形;那也不只是輸入端數,那不是關於磁碟機轉軸型態或數目的問題。儲存管理者成功與否的主要決定因素,就是要能管理資源,保持容量與使用率的平衡,降低(或保持)最少的瓶頸。

為何平衡是重要的?

讓我們從基本說起,儲存管理者必須要去管理一些共享的資源,例如快取記憶體、CPU、前端連接埠、後端連接埠等。在某些時候,管理者發現他們不能僅只是在一個單獨的磁碟機上管理這些資源,他們必須要考慮整個陣列,這是一個複雜得多的工作。儲存管理者必須要管理一個我們稱之為「70% 懸崖」的線,在 70% 的使用率下,儲存的效能很好,一旦到達 71%,效能就可能會變成夢魘。因此,儲存管理者如果想要遠離那條線,可以做的事就是一直去平衡各種資源,以保持磁碟的使用率在 70% 之下。

而面對這個挑戰最大的阻礙,就是儲存管理者不知道何時會接近那個限制,系統不會顯示任何的訊號,來表示它是否已經接近有問題的情況。在 62% 到 65% 的利用率時,系統可以運作得很好,沒有任何值得注意的問題,但是即使是沒有問題的小負載,也有可能使得一個運作良好的系統發生大問題。

舉個例子來說,現在有一個系統的利用率在 65%,想像一下組織裡某一個地方的某一位 DBA,他決定要執行一個看起來很小而且獨立的作業,在 SAN 上建立一個資料庫的複製,也許只佔用系統 6% 的資源。突然間,那個小的、經常執行的、獨立的作業,把公司的儲存系統變得一團混亂。(題外話,有多少次我們看見這種情況發生在清晨 3、4 點鐘,然後儲存管理者被呼叫離開溫暖的被窩?)許多公司到現在都還不瞭解他們所面臨的問題,他們在等待昇級直到他們已經接近(或是到了)那個危險的 70%。

昇級的危險

現在來想一下當一個企業維持在低使用率,然後決定要昇級時會發生什麼情況?其中一個步驟是停止一半的儲存容量,一個儲存系統在 50% 的使用率時運作得很好,但停止一半的儲存容量,現在使用率變成 100%,這會變成一個大問題。許多企業要求「線上」昇級,卻沒有明顯的補救計劃,再一次,關鍵的問題是:如何知道你的儲存使用率是多少?

最後,我們回到 DBA 身上,即使一家公司有在管理容量,它仍然有可能出現問題。DBA 把資料庫從較快的磁碟機複製到較慢的磁碟機上,現在的情況是目的磁碟的速度跟不上原始磁碟,因此整體 SAN 的效能會下降使較慢的磁碟跟得上。

這把我們帶回到最基礎的議題:這無關乎容量,這是關於平衡!你有任何的方法來監控資源嗎?根據 Laurus Technologies 公司的一份研究指出,有 80% 的公司沒有任何方法可以經常的監控使用率,他們完全沒有認知到有可能遇到很嚴重的問題。

保護效能

首先,你必須要有儲存資源的監控工具,為了保持儲存系統的平衡,你必須要經常的監控儲存使用率的幾個重要部份,而且你需要工具使你可以存取系統。有時候工具是由製造商提供的,但通常儲存管理者要依靠檢視 Microsoft Excel 的歷史檔案,才能找到任何不正常資料模式,許多企業就是沒有他們所需要的工具。

同時,瞭解你所擁有的工具也很重要,你使用的工具取決於你的儲存系統製造商,有些製造商有很好的工具,有些則什麼都沒有,如果是這樣的話,你可能要寄望於印出原始資料,然後把它們輸入到試算表或圖表裡。沒有工具使儲存系統的利用率變成不可見的,直到它們出了問題,因為負載吃掉了一般的儲存資源。儲存訓練課程裡通常都會忽略掉日常的管理,瞭解管理工具變成是儲存管理者要自我學習的課課目。

花時間去瞭解跟著儲存系統來的工具指令與能力,瞭解 I/O 的模式和每一段時間的負載。不要把 VM 伺服器與 SQL 伺服器放在同一個磁碟機轉軸上,你不會想要把一些通常就很忙碌的負載,放在同一個磁碟機集合中。儲存管理者應該要發展一個儀表板,上面包括三個基本的衡量數字:百萬分之幾秒的回應時間、磁碟使用率、和儲備空間,管理 SAN,要每週、每月、每兩個月、每年循序的管理負載。

如果只是觀看即時的資料,沒有任何工具是有用的,應該要保留歷史資料的軌跡。依照公司平常的業務運作週期,觀察資料也是很重要的。對於大部份的公司,資料至少有 30 天的價值,通常會涵蓋正常的月報時間;有些公司有詳細的季報表,如果是在零售業,會有較平時更忙碌的傳統的購物季節。但不論你的行業適用哪種週期,都要確保你涵蓋了在產業裡正常的營運週期。

結論

沒有人會為了非關鍵性資料買 SAN,一個 SAN 會被建置是因為業務需要它始終正常運作,並且可以從組織內部任何地方存取資料,如果不是,那麼你的工作就會變成是危機管理。當務之急是要使 SAN 的管理更容易,第一步就是要有組織適當的 SAN 管理方法。

好消息是這個產業已經朝向改善管理的方向走,有像自動測量,和自動階層化的功能。但是,要所有的儲存系統都昇級到有這樣的功能,需要時間,在那之前,發展一個主動式的處理與流程,來平衡儲存資源是最重要的目標。