iT邦幫忙

2024 iThome 鐵人賽

DAY 24
0
Security

雲上安全疑難雜症手冊系列 第 24

Day 24 災難備援 > 什麼是 Disaster Recovery

  • 分享至 

  • xImage
  •  

災難備援Disaster Recovery

今天幫大家科普一下災難備援的觀念,
以及制定災難備援計畫時需要注意的地方 /images/emoticon/emoticon34.gif

Disaster Recovery 簡稱DR

是一種確保在面臨重大災難或中斷時能保持業務持續性的過程

我們可以想像一下
如果你的手機突然壞掉了,你會怎麼做?
這就是個人層面的「災難備援」思維

以生活中的例子來舉例

想像你家的鑰匙就像是你的業務營運

主鑰匙 = 正常的業務營運
備用鑰匙 = 災難備援計劃

就像你會準備一把備用鑰匙來放在花盆底下
組織也會需要準備災難備援計劃以應對可能的中斷

災難備援的主要目的是:

  • 確保業務連續性: 即使在災難發生後,也能繼續提供服務
  • 減少損失: 包括財務損失、資料遺失和商譽損害
  • 快速恢復: 在可接受的時間範圍內快速的恢復到正常運營狀態

災難可能包括:

  • 自然災害: 地震、洪水、火災
  • 技術故障: 伺服器崩潰、網絡中斷
  • 人為錯誤: 意外刪除重要資料
  • 安全威脅: 網絡攻擊、資料洩露

災難備援計畫,我們需要做的事

  • 定期備份: 就像定期為你的手機相簿做備份 ( 可參考前兩天的備份文章 ) = > 制定備份策略
  • 恢復程序: 明確的步驟說明如何恢復正常運營 = > 制定SOP
  • 角色和責任: 誰負責執行恢復計劃的各個部分 => 成立災備小組
  • 測試和更新: 定期檢查計劃是否有效,並根據需要更新 => 驗證計畫

RTO & RPO

在討論災難備援的時候,很常會被詢問

你預計的RTO&RPO分別是多少?

用一張圖簡單介紹一下兩者

https://ithelp.ithome.com.tw/upload/images/20241008/20150634oIGOMrhZMX.png

RTO (Recovery Time) RTO指在災難發生,系統或服務需要多長時間才能恢復到可接受的運行效能。
RPO (Recovery Point) RPO指在災難發生,能夠接受的最大資料丟失量,通常以時間來衡量。

舉例,如果一個專案設定的 RPO 為 4 小時,RTO 為 5 小時
那麼在災難發生時,我可以接受最多丟失 4 小時的資料,並且在 5 小時後,需要復原業務

以生活中得例子來看 RTO & RPO

我們用打報告來舉例,
以前很常會發生家裡桌機不小心踢到就會當機的情況,
花了三個小時打的報告直接歸零。

所以每10分鐘存檔一次,
代表我能容忍最多10分鐘的白做工,
也就是說我的RPO是10分鐘,至少我還可以叫回10分鐘前的檔案。

再來,我的報告在一個小時後就要交了,
所以我要趕快把當機的電腦救回來交作業,
所以我要在一小時內把我的電腦修好,我的RTO是,一個小時

希望這些小例子,能幫大家更了解DR~ /images/emoticon/emoticon37.gif/images/emoticon/emoticon37.gif/images/emoticon/emoticon37.gif


上一篇
Day 23 備份 > AWS EC2 使用 AMI 備份 & 搬遷
下一篇
Day 25 災難備援 > 選擇災難備援方案
系列文
雲上安全疑難雜症手冊30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言