各位大大好
小弟最近遇到ESXI HOST整台死機的問題,
但是奇怪的是他不是直接掛掉HOST,
他是先掛掉某台GUEST,其他的GUEST是好的,
然後慢慢的整台機器都掛掉,
最後在操作vSphere client會先無回應,
強制關閉後在連線進去後有問題的ESXI Host整台失去連線,
最後我到實體機面前接了螢幕看了ESXI的管理介面,
按下F2讓我輸入完密碼後,完全卡死不動作,
最後只能重開機,重開HOST後卻又可以正常運作,
總共有5台主機接二連三的發生一樣的事情,
我想ESXI HOST不可能在同一時間懷掉那麼多台HOST主機,又剛好我家Storage也怪怪的不是很正常雖然沒有全壞但是不穩定,所以我懷疑.....是Storage,
有大大曾經遇過Storage有問題讓整台ESXI掛掉的經驗嗎?
storage很重要
建議先排除是否為此原因
檢測方式...沒有其他storage的話
拉一台Host
把一些GuestOS放local disk
不要接storage的GuestOS
這樣就可以做AB測試
發生過一次
當時是 Raid 卡過熱吧
也是一個個 VM 掛掉
最後在 Console 按 F2 輸完密碼就不動了
再開就發現 Raid partition 一個 offline 掉了..
快備份吧
storage 是NET APP??
還是哪個牌子呢
NET APP有遇到過一次
與storage溝通有問題