iT邦幫忙

0

伺服器跑VMware ESXi會當機耶,這是要換CPU?還是要換RAM呢?有圖有真相。幸好當機後,iKVM還可登入擷圖!

本來虛擬系統VMware 跑的好好的!
突然整個停住沒有反應!主機螢幕顯示的畫面,就是下面這個,我特別用藍色線條標註,這是某顆CPU的某核心有問題嗎?須更換該顆CPU嗎?

另外在iKVM介面中,發現了其他Error的紀錄!
這是要換記憶體嗎?
因為在別的客戶環境,若有記憶體故障,伺服器則會不停的重新開機!
與這個運作一兩個小時後,才發生紫底白字的情況不同!

還是投票決定?
1.只換CPU呢?
2.只換RAM呢?
3.CPU與RAM統統換呢?

yesongow提到:
還是投票決定?
1.只換CPU呢?
2.只換RAM呢?
3.CPU與RAM統統換呢?


"投票決定"這個有趣
以後修電腦可以按此要領...呵
鐵殼心 iT邦高手 1 級 ‧ 2013-01-12 07:44:06 檢舉
系統環境沒有寫清楚 不能隨便亂猜
echen688 iT邦研究生 1 級 ‧ 2013-01-12 12:09:20 檢舉
要用實驗的方式解決的話, 建議先從 RAM 開始好了。

因為 RAM 一般來說比 CPU 便宜, 你也可以借 RAM 來更換試一試, 如果試過更換 RAM 之後確認不是 RAM 的問題, 那再換 CPU 試試, 這是標準的故障排除步驟.......

謝謝
18
raytracy
iT邦大神 1 級 ‧ 2013-01-13 09:57:56
最佳解答

ESXi dump 畫面上顯示的資料是《發生NMI插斷事件》, 並不代表是 CPU 發生問題, 而是 CPU 以外的硬體發生了某種故障, 系統發出 NMI 插斷通知 CPU, CPU 收到後轉給作業系統, 但作業系統無法處理這種問題, 所以發生 Dump.

BIOS 顯示的 ECC 問題, 才有可能是問題的根源, 因為一般硬體的設計上, 發生 ECC 故障時, 都會引發 NMI 插斷, 把問題丟給 CPU. 至於丟給 CPU 之後會發生甚麼事? 那就不太一定, 有的系統是設計成自動重開機, 有的系統是不會重開, 但是把問題傳給作業系統處理.

不管哪一種, 這都是不是你自己可以解決的, 只能 Call 原廠來診斷換零件.

8
bizpro
iT邦大師 1 級 ‧ 2013-01-12 12:11:30

您如果用的是ESXi 5.0, 那是bug, 就更新到ESXi 5.1吧.

12
0316ff8
iT邦新手 5 級 ‧ 2013-01-13 12:57:00

請問您是用品牌SERVER嗎?小弟之前公司買了DELL R820,裝完ESXi5後出現類似像您那樣的訊息,後來詢問DELL工程師後工程師說也沒遇過這樣的問題,於是自己上網google錯誤訊息,找到DELL 其實有出專門For DELL自己的ESXi5,只是DELL官方載點也掛了,還是小弟自行把聯結網頁給DELL工程師請他協助提供檔案,安裝後已可正常使用了,不過其實5.1也有BUG,就是server2003移到5.1上後EVEN LOG會一值不斷跳出VMWare錯誤,因此我又上網去找解答,答案就是按照VMWare官方方是將log關閉=..="以上經驗提供您參考...

我要發表回答

立即登入回答