昨天配置好 DRS 的源伺服器和複寫主機後,
我們來測試是否有成功複寫至次要區域!
我們可以做一個假設情境的故障轉移,來測試我們的災難備援策略的可執行性
本次30天文章中,之前有提到配置CloudWatch的指標及警示
可以到連結複習一下唷!
Day11 帳號監控 > CloudWatch 指標 Metrics
Day13 帳號監控 > CloudWatch 警報 Alarms
這邊我們建立指標時可以選用下列:
建立後,再使用警示來套用建立的指標,可發送SNS或者email來通知
以下建議配置指標及警示條件:
監控指標:DataReplicationLatency
警示條件:大於 30 分鐘
描述:"資料複製延遲超過 30 分鐘"
監控指標:ReplicationServerState
警示條件:不等於 "HEALTHY"
描述:"複製伺服器狀態異常"
指標:RecoveryInstanceState
條件:等於 "STOPPED" 或 "TERMINATED"
描述:"恢復實例已停止或終止"
指標:DrillStatus
條件:等於 "FAILED"
描述:"DRS 演練失敗"
做完一整套的災難備援規畫及實行後,
還是需要持續的維護,以及根據未來使用狀況,不斷優化災難備援策略