iT邦幫忙

0

VM Server故障, 急需大家幫忙(重新發問)

jakcs 2010-03-22 08:35:3911914 瀏覽

IBM x3550 M2
HBA卡: LSI 20320IE
儲存設備: 普樺Proware CT-2123SA
OS: VMWare ESXI 4.0

VMWare ESXI 4.0可以開機且Storage可以連上
原有三個虛擬主機在上面執行, 分別是mail, Document(檔管系統), 及OD(File Server)
今天在File Server主機做Windows Update, 突然當掉
於是切到另二個虛擬主機也無法操作, 只好將VM Server及Sotrage關掉重開

重開後, 以vSphere Client連線, 發現三台虛擬機圖示反白且出現Unknown(Invalid)
滑鼠右鍵選單的Poweron也無法按

以Console進入到虛擬機所在目錄, 有數個log檔, 有的可以看,
有的不能看會出現 invalid argument訊息
要copy該目錄的所有檔案到另一目錄也會出現invalid argument, 只有幾個檔案copy成功,
.vmdk及.vswp檔案均無法Copy

最遭糕的是User沒備份, Document(檔管系統)原來的主機已重灌挪做它用
所以....現在在想辦法把資料救回來.......
錯誤訊息圖片如下,
http://photo.xuite.net/jakcs/3894320/1.jpg

這幾天弄下來,原因有可能是thx大大所說的問題,
苦於esxi 4沒修復指令,
Document-flat.vmdk(RAW DATA)的核心檔案損毀,
外掛一個esx 4也無解,
檔案不給撈就是不給撈.....

VMWare ESXI 4.0 <==看來是很危險的東西,不知到這免費的版本可以熱備份嗎?

保險一點,最好是有備份一份VM所虛擬的機器,裡面若有重要檔案,也要另外有備份方案..............希望施主能順利救回系統與資料,阿門。
takaki iT邦新手 4 級 ‧ 2010-03-25 00:02:13 檢舉
的確,虛擬化後最大的風險就是後方的STORAGE出問題...
只要STORAGE上的資料正常,ESX掛了可以重建並且抓回來繼續用...

如果是依據VM官方的標準來說,出這問題的機會很低...
至少兩台ESX作HA架構,且STORAGE也是兩台HA架構...
這樣不管是哪方面出問題,至少都還有救(應該說比較容易處理問題)

另外我想,如果是一般從傳統伺服器環境導入VM,然後轉型的話,
原有的備份機制還是要繼續作,這是多一道保障。
jakcs iT邦新手 4 級 ‧ 2010-03-25 08:28:03 檢舉
沒錯,這次慘就慘在沒有備份機制....

2 個回答

2
thx
iT邦新手 2 級 ‧ 2010-03-22 14:23:37
最佳解答

錯誤log 應該多給一些 太少了

可能用 remote cli (到了 vsphere 叫 vcli,vCLI:vSphere Command Line Interface) 就裝在 client 機器上( linux ,windows) 在去控制esx host server

下載
http://www.vmware.com/support/developer/vcli/

你說問題其實要看過才知道.. 如果是vmdk 損毀.將會很麻煩麻煩..

2
ansonchen
iT邦新手 1 級 ‧ 2010-03-22 22:53:34

重開後, 以vSphere Client連線, 發現三台虛擬機圖示反白且出現Unknown(Invalid)
滑鼠右鍵選單的Poweron也無法按

依擬提供的訊息與動作
一般是VMDK有問題了,
可能找看看有相關tool可不可修復
因之前LAB遇過測試保留image重建profile檔
最後只好重建 (反正是測試機)

再來還有各狀況是虛擬機目錄下某檔案損壞或被修改過設定導致無法開機,

看更多先前的回應...收起先前的回應...
thx iT邦新手 2 級 ‧ 2010-03-23 14:56:12 檢舉

客戶是不是有做快照 ?

如果不會用remote cli or vcli
請自行準備一顆HDD 裝在ATA ,SATA 介面都可 裝上ESX 4 完整版
1.如果抓不到Datastore
進 /proc/vmware/config/LVM
[root@esx LVM]# cat EnableResignature
EnableResignature (Enable Volume Resignaturing) [0-1: d
[root@esx LVM]# echo 1 > EnableResignature
[root@cork LVM]# esxcfg-rescan vmhba2 (看你是那張HBA Raid card)
Rescanning vmhba2...done.

會將Datastore 抓到
echo 0 > EnableResignature 關掉
這是有機會可以working
2.再不行 照我前篇指令..再有問題至少vmdk可以拉出再救援

再不行開原廠call大概會幾萬上下吧 台灣代理 可能回答不出來 要等原廠"幾周"..

thx iT邦新手 2 級 ‧ 2010-03-23 14:58:29 檢舉
ansonchen iT邦新手 1 級 ‧ 2010-03-23 23:37:44 檢舉

感謝thx
提供解決資訊

jakcs iT邦新手 4 級 ‧ 2010-03-25 08:41:07 檢舉

感謝thx大,
我的情況是沒做snapshot,
所以可能下禮拜會去找user解釋了....

tbsky iT邦新手 5 級 ‧ 2010-04-21 17:07:00 檢舉

hi:
能請教您使用的 esxi 版本嗎?因為我使用 LSI 20320IE 也發生了一樣的問題,這兩個月總共發生了四次,所以我感覺似乎是上了 esxi 3月分的 patch 之後,才發生這個問題,但是不敢肯定,所以想請教您發生問題時,使用的 esxi 4.0 的版本。
另外您的資料應該已經洗掉重來了吧?如果還沒有的話,應該可以幫您救回來,可惜看到的時間晚了點..

我要發表回答

立即登入回答