精選

[主筆漫談] 專屬型微處理器的復興

電腦的世界自始至終都是圍繞在軟體與硬體的協作之上,單純的硬體或是單純的軟體,是無法完成任何事情的。如果從這個角度看,所謂的軟體定義抑或是硬體定義,只不過也就是「為賦新詞強說愁」罷了! 回到本文主題的微處理器身上。早年,也就是從所謂的「電腦」(計算機)剛被發明出來,一直到筆者唸...

2022/04/19

[企業儲存觀察室] 增長中的企業資料儲存趨勢

在整個企業資料儲存發展的過程中,時不時的都需要花一點時間來看看接下來的幾年內,可能會有哪些發展中的趨勢會值得我們關注。從筆者多年的經驗中,大部份的趨勢,尤其是技術面的趨勢發展,都是有脈絡可循的。但有時候就是會碰到極為突然、在一、二年間就快速發展成型的趨勢,例如接下來首先要談的網路安全,特別是指層出不窮的勒索病毒對資料儲存的影響。


勒索病毒

電腦病毒在 IT 世界已經存在數十年了;但即使是在二年前,也沒有人料到勒索病毒的攻擊將會快速的成長,並且成為一個影響產業的發展趨勢。網路攻擊難以追蹤,而且這些攻擊是有(暴)利可圖的,因此它變得更為流行。有些人甚至以開發惡意軟體為業,他們在暗網上向駭客出售這些軟體,其中最受歡迎的就是勒索病毒。現在更進步的勒索病毒還會自己建立攻擊循環,不僅將病毒注入硬碟或伺服器,還會感染二級儲存如備份等。
勒索病毒的攻擊被許多供應商視為 2021 年主要的現象之一,甚至達到將 2021 年視為「勒索病毒之年」的程度。
根據 IDC 一項最近的調查,每一椿勒索軟體的平均付款已經超過 24 萬美金。

現在,如何預防勒索病毒的攻擊已經成為顯學,企業用戶必須訓練(不只是 IT 部門的)員工對可能的網路攻擊保持警覺,與勒索病毒相關的議題或技術,則是企業必須要認真面對的。如同筆者在近幾篇文章中一再重複的:目前沒有一個簡易、全面而完整的解決方案可以協助企業組織免於勒索/加密病毒的威脅。
答案不會是單一的工具,而是結合安全技術,不斷修正的資安框架,使用者的教育訓練以及承受攻擊的靭性。
延伸閱讀:「淺談對抗勒索軟體的資料保護策略」「關於 2021-在資料與儲存產業發生了什麼?

暗資料

暗資料就是那些已經被儲存下來,但卻不易被發現的非結構化資料/檔案。從法規遵循或資料分析這兩個目的來看,不易被找到的資料,基本上就是沒有任何用處的。一般估計約有 80% 的業務資料是非結構化的,很多都是暗資料,而且這個比例還在穩定的增加中。
儲存是需要成本的,因此被儲存下來的資料「應該」都要具有被再利用的價值,不然就不應該佔用儲存空間。

現在有一些檔案探索 (e-Discovery) 和自動分類軟體工具,這些工具會掃描檔案伺服器、NAS/CIFS 等網路共享空間,發現和分類以前不容易被找到的暗資料;依循這些探索的結果,就可以據以觸發後續的資料移動或其它的相應的動作。

這類資料探索與分類的工作會觸動企業 IT 部門兩個古老的問題:
第一個問題是資料該如何分類?更深層的意義就是該如何決定資料的價值?資料的價值取決於其對於業務的重要性,但是不同的業務單位對重要性通常有不同的看法!
通常,在企業組織還沒確定該如何分類之前,資料量又增加一倍了。
前一個問題又引發第二個問題:資料還沒有分類,事後也沒人使用,為何一開始會被保留下來?
通常,不是某人(單位)說的,就是管他的,先留再說。

但無論如何,這類暗資料的挖掘工作對於資料管理極為重要,IT 可以藉以採取智慧化的行動,例如提醒資料管理/擁有者、自動移動資料、優化資料組織、證明機敏資料的合規性,以及建立更高效率的儲存庫提供搜索和分析。

容器儲存

容器是虛擬化的獨立可執行軟體,它共享作業系統並且容納應用程序程式碼和資料、執行環境、工具集、程式庫和組態。容器應用程序是平台中立的,也就是它們在測試/開發環境中的運行,和應用程序的部署都是一樣的。管理者可以隨時建立、淘汰或重建容器。原始設計為無狀態的容器並不符合大部份企業的應用程序,因此在容器的環境中需要持久性儲存,以支援「有狀態」的企業應用,也需要有 CSI 支援跨容器的資料卷。關於容器儲存的更多資訊請讀者參考下列文章。
延伸閱讀:「容器與儲存

物聯網、人工智慧與機器學習

物聯網 (Internet of Things, IoT) 意味著巨量的資料,人工智慧 (Artificial Intelligence, AI) 與機器學習 (Machine Learning, ML) 則意味著更精準的分析與決策。

IoT 是指來自多個區域邊緣的資料輸入源:現在是辦公室、家庭、工廠或車輛,未來可能是智慧城市。物聯網會有數以千萬計的感測器,產生數 PB 的資料,經由網路發送到邊緣與資料中心的儲存庫。
在那裡我們(透過 AI/ML)對其進行分類、研究與應用,找出新發現、改善業務流程或驅動新的產品或服務。
相關的企業組織必須要投資於 IoT 需要的儲存效能和容量,也要採取必要的資安防護措施。

AI/ML 在儲存領域的重要性持續增加,在資料中心,它驅動大數據分析、自動化和軟體應用;在資料中心之外,它對於視頻監控、模式識別、交通運輸和自動駕駛汽車都極為重要—所有這些都仰賴於智慧企業級儲。

AI 驅動的應用依賴即時資料,例如運輸公司的 AI 軟體追蹤整個區域的貨車運輸情況;或是擷取關於天氣和交通狀況的即時資料,引導司機調整路線;電力公司的 AI 軟體偵測異常的能量模式,預測斷電的可能性;或是識別行模式,來提升業務或減少詐騙等。

機器學習是人工智慧的一部份,ML 的關鍵在於一旦它從知識庫學習後,就可以在環境中運行時擴展學習。例如透過 ML 可以使軟體工具動態平衡和優化 SSD 上的資料放置,以減少快閃記憶體的磨損,隨著時間的推移,AI/ML 可以改進動態數據的放置而無需人工干預;機器學習還可以建構分析模型,提供更準確的分析結果。
延伸閱讀:「初談儲存管理與 AIOps

現有的資料管理工具可能已經在使用人工智慧和機器學習,但要意識到 AI/ML 所需的儲存會對現有的儲存基礎架構帶來了其它的影響。 先進的人工智慧、利用視頻和其他串流資料的豐富應用程序,以及 IoT 正在將磁帶和雲端冷儲存層級轉變為長期保留巨量資料的儲存。