iT邦幫忙

0

有關於 Exchange Server 2010 高可用性規劃 的問題

目前我正在幫公司規劃伺服器的虛擬化以及電子郵件系統的更換

如果用 VMWare vSphere + 3台 Host 主機上架設 Exchange Server 2010
我的規劃如下:

  1. 3合一 + Edge
  2. 暫時不走 Unified Messaging Server
  3. 要做到高可用性(HA),也就是其中任何一台 Exchange 主機或角色出問題時,
    使用者還是可以正常收發信件以及所有的 Exchange 服務。目前的瞭解應當是要
    搭配 DAG 機制才能達到。
  4. 使用者約 250 人
  5. 會開放給員工外部存取(例如:回家後用電腦上 OWA 收發信、外務人員用手機收發信)
  6. 3台 Host 主機都是雙 CPU 各 6核心
  7. Edge 前端 還會有一台 過濾信件的伺服器

我想了解的是在這樣的架構下:

  1. 要多少個 VM(虛擬主機)
  2. 我要為這些 VM 買的 Windows Server 2012 的版本是多少?
  3. 這些 VM 建議記憶體大約是多少?
  4. 這樣大約要多少的$$?
  5. 如果在 IP-SAN (1Gb 頻寬*2 By Teaming) + Storage (HP P4000 , DELL PS4110E, PS6110E 考慮其中一台)
    以理論值來看,這樣的 IP-SAN 環境適合 我的規劃嗎?

感謝回覆。

10
raytracy
iT邦大神 1 級 ‧ 2012-12-11 01:09:43
最佳解答

前面幾個都提供了許多寶貴的意見, 此案在規劃上, 有幾個地方需要思考:

Application Level HA:
Edge Role 的 HA 可由 DNS MX record 來處理
MBX Role 的 HA 須由 DAG 來處理
CAS Role 的 HA 需由 NLB 或 Hardware Load Balancer 處理

Hardware Level HA:
看起來應該就是 vSphere Essential Plus

我想要提出來的是: 做了這麼多的 HA, 你希望把 SLA 提昇到多高的程度? 99.99%? 還是 99.999%? 或者 99.9999%?

Gmail 服務數千萬用戶, 也只不過保證 99.9% 而已, 等於: 每年可當機8.76小時.

250 人的公司, 審酌業務性質之後, 可以忍受 Email 中斷多久時間?
很多業務都回答: 一分鐘都不能斷! 但實際斷個幾小時, 它們卻甚麼事也沒發生..

要預防郵件中斷, Hardware level HA 並不一定是最佳的選擇, 因為他無法抵擋:

  1. 環境災害: 例如火/水/風/震/核災
  2. 線路中斷: 如果是地區性的大斷線, 有幾台 HA 都沒有用

真的想要抵抗以上幾種風險的話, 光靠 HA 是不夠的, 至少要用上 VMware 的 SRM 技術做異地備援, 同時 Storage 也要能支援跨 WAN Replication, 同時你還得有一條頻寬夠大的 WAN 線路 (至少 2Gbps 以上), 而且兩地至少相距 100km 以上.

要將郵件中斷風險降到最低, 最節省成本的辦法是: 建兩個 MX, 當其中一個 MX 不論任何因素無法收信時, 第二個 MX 都能夠發揮作用, 取代第一個的功能.

多 MX 的方案, 靠 Exchange 的 Edge 或 HT (Hub Transporter) 就可以達成.

收信的問題解決了, 接下來是 Client 接取的問題. 如果要達到 fail-over 的效果, 必須同時建置 MBX 的 DAG 和 CAS 的 LB or NLB. 只建置其中一種, 都無法達到自動 Fail-over 的作用.

那麼, 到底需不需要 Hyerpvisor 來做 HA? 如果我一個 Site 掛掉, 另一個 Site 可以完全接手運作, 不需要任何切換的話, 那麼只要循正常程序, 把壞掉的 Site 修好, 不管要修幾分鐘或幾小時, 都不會影響用戶端的 Email 對吧?

既然都不會影響, 那麼這個壞掉的 Site:
《可以在一分鐘內復原》 vs. 《必須等8小時才能復原》
這件事情就變得不是那麼重要了吧?

我只要全部硬體都加買 7x24/2hr onsite/6hr 完修服務, 一樣可以不停頓運作.
買完修服務的費用, 說不定比買 Essential Plus 還更便宜.

以上, 是如果我有 Multi-site 可以運用的話, 我會這樣規劃.

但是, 如果我只有 Single Site 可以運用的話, 那我會完全放棄 DAG+NLB, 改為在一個 Site 裡面建置 Hypervisor HA, 外加高階的 Backup/Restore 機制 (或是 CDP), 把 RPO/RTO 降到 30分鐘以下(甚至可以縮到1分鐘以內).

Single Site 的環境, Backup/Restore 的完整性和速度, 比是否有 HA 更重要.
因為 Hardware HA 無法取代 Backup/Restore.

我有 CDP Backup, 就算沒有 HA, 也可以在短時間內恢復運作 (最短一分鐘)
我有 HA 但沒有 Backup, 仍有一個風險是: 當 HA 全掛的時候, 系統永遠停擺.

10
u8526425
iT邦大師 1 級 ‧ 2012-12-09 15:53:22

http://ithelp.ithome.com.tw/question/10063393
建議再弄清楚一點HA架構
DAG是Exchange的高可用性資料庫
但client必需經過CAS角色才能存取資料庫
CAS load balance不能與DAG共存於同台主機
這就是前端與後端都要起不同的HA
所以你勢必要拆開
加上若要Edge也要HA
那整套弄下來可能要6台主機以上
但既然最前端有Anti-SPAM
Edge就建議不要架了

這只是Exchange部份的HA
還有DC與vSphere部份要考慮

12
jazozazo
iT邦高手 1 級 ‧ 2012-12-10 08:53:07
  1. 3合一 + Edge <---有沒有edge 小弟不覺得有需要

  2. 要做到高可用性(HA),也就是其中任何一台 Exchange 主機或角色出問題時,
    使用者還是可以正常收發信件以及所有的 Exchange 服務。目前的瞭解應當是要
    搭配 DAG 機制才能達到。
    不需要做到dag也可以辦到
    如果有採購 storage 可以將資料庫放在 storage上
    同時給2台exchange連結用
    但是storage 目前這種偷懶方法就小弟經驗只能在 ibm 上實行

  3. 使用者約 250 人
    看來樓主沒有將群組信箱包含進去
    如果可以請把記憶體拉到16g以上
    因為小弟的台灣主機只有8g 跑到唉唉叫
    服務不會當 可以當我修改其他設定的時候
    從 sotre.exe 服務所釋放出的記憶體不太夠用
    慢的很明顯
    大陸和泰國的記憶體雖然也只8g
    可是人數少很多 操作起來效能也差很多

目前 VMWare vSphere 是計劃買 Essentials Plus
小弟不太信任 vm
所以都是用實體架設
也許跟小資訊室能買的金額也有關係
vm 環境常常跑到有問題 原廠也抓不出原因 才頭痛
以上提供樓主參考
建議還是找si廠商評估

jazozazo iT邦高手 1 級 ‧ 2012-12-11 16:28:14 檢舉

樓主可以參考一篇文章
http://blog.pmail.idv.tw/?p=2163

exchange 2010 的DAG架構
就是樓主想要的高可用性

我要發表回答

立即登入回答