精選

[主筆漫談] 專屬型微處理器的復興

電腦的世界自始至終都是圍繞在軟體與硬體的協作之上,單純的硬體或是單純的軟體,是無法完成任何事情的。如果從這個角度看,所謂的軟體定義抑或是硬體定義,只不過也就是「為賦新詞強說愁」罷了! 回到本文主題的微處理器身上。早年,也就是從所謂的「電腦」(計算機)剛被發明出來,一直到筆者唸...

2022/05/17

[資料儲存觀察室] 資料備份、災難復原與業務連續性

印象中我們很少談到這個題目;更多的時候我們發現其實有不少的 IT 人員,並不清楚「災難復原 (Disaster Recovery, DR) 或災備、備援」與「資料備份 (Backup)」兩者之間的關係。但在談到 DR 與 Backup 之前,我們可能還要先談一下「業務連續性 (Business Continuity, BC)」。一般來說,「業務連續性」可以定義為「企業組織在遭遇破壞性事件(如天然災害或恐怖攻擊等)之後,以預先定義的可接受水準繼續交付產品或服務的能力。
業務連續性的目標是在執行災難復原作業期間維持業務的持續運作,由此可知業務連續性是植基於災難復原之上。


如果從 IT 的角度來看,BC 計劃的範圍擴及 IT 基礎架構之外,是屬於整個企業組織層級的計劃,著重於組織、人員與流程面的規劃;而災難復原則著重於涵蓋 IT 的基礎架構的設計,在事件之後如何(在本地或異地)恢復基礎架構的可用性,以支援組織/人員/流程的業務連續性作業。至於(在本地或異地)的資料備份則僅是災難復原中關於「資料」保全的一個子集,如果以數學公式來看就是,Backup DR BC。
企業組織需要資料備份和災難復原來實現業務連續性。

問題不在於是否會遭遇到資料丟失的情況,而是什麼時候?
單一資料丟失事件,無論是惡意的、環境的還是意外的,都可能會造成企業組織的重大損失,尤其是在商業環境中,重大的意外而導致企業的消失時有所聞。
備份可以防止人為錯誤、軟硬體的故障或自然災害等的威脅,它通常資料保護是最後一道防線。
災難復原則是一個特定的解決方案,著重於復原的速度以保持業務連續性,雖然它通常指的是「自然災難」,但事實上人為的,如防範恐怖攻擊等,它也是有效的。
延伸閱讀:「2018 雲端及資料保護調查:近三分之一的企業曾丢失資料

備份一定是復原的第一步,更重要的是它是保護資料的底線,而且應該是不可妥協的;對企業來說,有一個備份方案是重要的生意,因為公司需要資料的可用性才能保持營運,保證資料的可用性對於留住客戶和吸引新客戶也是很重要的,現在在某些地區或國家,法規遵循則至關重要。備份是恢復資料的關鍵,即使它需要花一點時間。

「時間」則是災難復原的關鍵,備份保證資料的存在。
但 DR 關注的則是 RTO(Recovery Time Objective 復原時間目標)與 RPO(Recovery Point Objective 復原點目標),透過降低 RTO 與 RPO 讓業務可以在遠端站點運作,直到原本的系統復原為止。
DR 包括最新的資料拷貝和處理能力,以提供企業組織關鍵的資料、系統和應用程序的可用性。它要確保以正確的順序復原相互依存的應用程序,並在正確的時間內復原到正確的點。

備份是必要的,但卻是不足夠的;在筆者的職涯中的確碰過不少堅信備份就已經足夠的客戶。但我們都知道光有資料是不足以讓系統、應用程序和業務恢復運行的,不論是在異地或本地。如果假設永遠都不會受到網路攻擊或自然災害等威脅的影響,很容易就會忽視備份與災備這類複雜的程序。
問題不在於是否會遭遇到資料丟失的情況,而是什麼時候?
越來越自動化的網路犯罪和不斷變化的氣候變遷已經清楚的顯示出,任何現代的企業都可能成為災難的受害者,傳統的備份方案與冗長的復原過程在時間上已經無法支持現代化的業務持續性,因此必須要尋求新的、現代化的解決方案。

傳統上的災難復原計劃要考慮許多因素,包括評估、設計、測試、實施和管理、教育訓練、建檔和報告,以及人員配置等等,當然還要選擇一個或多個 DR 方案做為基礎。一些新的趨勢是我們在選擇解決方案時,應該要考慮到的因素:
  • 網路安全與加密:包括在資料傳輸與儲存時進行加密,具備必要的機制或授權和身份驗證的功能。
  • 架構上的彈性:可以支援實體、虛擬環境,具有本地與(混合)雲端的擴展性,以及協同運作的能力,有時候我們可能只是需要做本地的切換,而不需要在雲端啟動整個 DR 的程序。
  • 與現有系統、應用程序與基礎架構的整合性:可以連接到架構中的各種工具,並且儘可能的自動化;全自動化固然很好,但不要忘記有時候我們就是需要人為介入進行確認。
  • 營運手冊 (Playbook) 與執行腳本 (Runbook):成功的災難復原取決於良好的設計和文件記錄,營運手冊與執行腳本可以在災難期間和之後有可依循的記錄,而不是依靠人員的記憶力。
  • 測試與演練:一個好的解決方案應該要有測試或演練的選項,以驗證原本的設計是否完善,而不是要實際啟動 DR 程序才能知道計劃是否可行?
延伸閱讀:「Gartner 報告:2020 資料中心備份與復原解決方案的關鍵應用能力

除了自己做災難復原計劃外,現在也可以利用代管服務供應商 (Managed Service Provider, MSP) 來代行災難復原程序。但通常來說,MSP 不會只著眼於提供 DR 服務,她們比較傾向於代管資料中心的整體營運,DR 是其中的一部份。MSP 的服務比較趨近於依用量計價,也就是採行 OPEX 的模式,這與傳統企業組織自營資料中心的 CAPEX 模式有很大的不同。

MSP 的好處是她們與各種不同類型的客戶,包括大型企業與小型公司合作,她們熟悉各種不同的系統、軟體、問題與建置。採用 MSP 委外的方式,企業組織可以在很多方面省下公錢與精力,但回到千古不變的問題:
「委外 (MSP) 或是不委外,這是一個問題!」

延伸閱讀:「COVID-19 對企業儲存的啟示