iT邦幫忙

0

IBM X3200(Server2008 R2),不定時當機。

  • 分享至 

  • xImage

各位前輩好,小弟公司使用的ERP主機(已使用5年)
主機型號是IBM X3200 M3
系統是WIN SERVER 2008 R2

從前年(102年9月)開始,就會不定時的當機。
最慘的情況,是當機後連桌面都進不去,出現要我做系統修復的畫面
但做了還是救不回來。(一年大概發生兩次)

前年(102.09)當機的時候,我有找ERP廠商的"系統工程師"來幫我們找問題,但最後
他們也找不到問題,只把系統整個重新安裝就回去了。(重裝系統收了3萬多元...)
ERP的工程師說,有可能是WINDOWS系統更新,跟他們的軟體有衝突,
所以要我把系統更新關掉,我也照做了。
(現在才想到,當初我是不是因該要找IBM的工程師才對?)

去年年底的時候(103.11),系統又整個掛掉,但因為我有用Acronics做備份
所以我直接用備份檔案把系統還原了。
(題外話:我在前公司server用的raid1(支援熱抽換),是只要把壞掉的硬碟抽出來,
在插進去另一顆空白硬碟,raid就會直接把正在使用的那顆硬碟,系統整個拷過去。
我以為raid的設定都一樣,後來不小心在現在這間公司搞出大問題。)

我想會不會是因為我們公司(CNC的工廠),裡面用的大型機器吃電都吃很重,
(有時候我們公司的路由器都會突然當掉)所以懷疑SERVER當機會不會是突波的問題。
後來我就把主機移位 (跟大型機器吃不同電路),然後再加裝UPS。
從去年12月到目前為止,雖然還是會當機,但是沒有在出現嚴重到不能進去系統,
要整台重新安裝的狀況了。(大概一個月會當一次,不理他過一段時間就好了)

今天我在看最近要學的書(PHP)的時候,系統又當掉了(一直重複開機,逼逼叫)
系統一直自動重開,畫面有以下幾種
(黑頻)出現幾秒 UEFI STARTING...然後又重新開機...
(黑頻)出現幾秒 CMM INITIALIZING,CMM MEMORY INITIALIZED,
CMM KERNEL LOADING,CMM KERNEL RUNNING,CMC STARTED...然後又重新開機...

我過去看,不知道怎麼弄,就盯著她無限重新開關機,大概20分鐘
好家在最後終於跳到BIOS的畫面

我按ESC離開後,就能進去WINDOWS的畫面了...(最近這種狀況還蠻常發生的)

我上網爬了一下IBM S.3058004的問題,客服的回答好像發生的原因是因為
系統有做調整或更新,或是有安裝什麼軟體或升級之類的,才會發生這個問題
但是我系統更新關掉了(WAN也封鎖),主機我也幾乎沒再用

另外還有一個當機的錯誤,好像是有機率造成讓我進不去系統,要整台重新安裝

我上網爬到這篇回答
http://www.experts-exchange.com/OS/Microsoft_Operating_Systems/Server/Windows_Server_2008/Q_27380441.html
但有點看不太懂他的意思,小弟想說長痛不如短痛,還是想辦法把問題解決掉比較安心
能否請各位前輩給小弟一點意見,拜託了。

看更多先前的討論...收起先前的討論...
CalvinKuo iT邦大師 7 級 ‧ 2015-07-10 11:34:11 檢舉
IBM S.305800 應該是指系統發生錯誤,恢復預設設定開機...
詳細的要去看你的第一張圖的 System Event Log看看有沒其他訊息可以參考.
http://pic.dhe.ibm.com/infocenter/flexsys/information/index.jsp?topic=%2Fcom.ibm.acc.8731.doc%2FS.3058004.html

沒跑[F2]診斷程式?
前輩您好,我沒想到要去跑診斷程式
我以為那沒什麼用處= ="
禮拜一再來去跑看看,感謝您的建議
到時候跑出來如果沒辦法解決再來求救,感謝您
現在無法進到這個畫面
他就跳掉了OAO
IBM 的機器如果發生 不停的RESET ,就是要整各電源關掉等三分鐘再開
然後先進 BIOS 看錯誤,然後排除他,之後再重新開機

別把伺服器當一般PC,他沒那麼好應付的
尤其是IBM的他有很多內建的監控機制,任何的錯誤都會發生開機異常的狀況

還有,系統掃過毒了嗎,優化了嗎,這都是基本日常工作
我們家的伺服器除非主板掛了,還不曾發生過開不了機的狀況
系統都是讓他自動更新的,也沒發生更新完,什麼系統就掛了的狀況
基本上平日工很重要,有作有保佑,沒作出歹事
前輩您好,我關了一天再開都還是一樣
(連BIOS畫面都還沒讀到就重開了)
我有打好幾間維修公司,告訴他們我的狀況了
他們都認為是主機板出問題

另外,感謝您提醒平常該做的事,但因為小弟主要工作不是MIS
所以我以聽從其他前輩的意見,建議老闆,讓我去外面找合作廠商
希望伺服器還有PC的維護都交給廠商處理就好
再次感謝您提供的意見
CalvinKuo iT邦大師 7 級 ‧ 2015-07-17 10:14:24 檢舉
今天早上 我公司的8年的 IBM x346掛第二顆CPU的VRM....
只好拆了....

CLEAR CMOS 了嗎,記憶體拔起來等幾分鐘再放回去,
如果這樣都還不能,就真的主板壞了
要換主板如果要找 2手的要注意就是 RAID 卡是不是同一張
如果你的RAID卡不是內建的,那就還好,只要是相同晶片的主板就行了
如果 RAID 卡是內建的,就只能找相同型號的主板了
或問對方可以把機器拿過去現場TRY看看嗎,看能不能開機
基本上過保固那張主板好像要一萬二吧,中古的找的到大約七千上下
你自己衡量看看吧,如果有作 RAID 是做不管哪一種
基本上很抱歉的告訴你要用相同型號的 RAID 卡才能讀出裡面的資料
不同的RAID 卡的起始資料都不太一樣,不一定可以辨認的
如果你的RAID 是用 軟體作的,只要到任何一台有 RAID 卡的,都能讓他WORK
我知道的大約就這樣,希望有幫助到你
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 個回答

4
u8526425
iT邦大師 1 級 ‧ 2015-07-12 13:51:47
最佳解答

主機有沒有續簽保固 ?
(重要的主機請記得要維持保固)
有的話
請跑DSA
然後報修官方並將DSA結果傳給客服
https://www-947.ibm.com/support/entry/portal/docdisplay?lndocid=SERV-DSA

如果連主機POST自檢都過不去
那八成是硬體問題
ERP廠商通常專業不在這邊
你只找他們的話
有可能會走錯方向

如果沒保固
個人見解
其實已經可以考慮買新機來替代了

感謝大大的建議..
小弟我也在考慮是否要購買新機
但因為我沒有移機的經驗
所以有點擔心,感謝您的建議!

u8526425 iT邦大師 1 級 ‧ 2015-07-13 23:22:17 檢舉

不會做沒關係
只要有備份
ERP廠商就可以幫你移機
但是你之後要參考這次經驗
把災難復原計畫弄出來
萬一之後有類似狀況發生
你才有自行應對的辦法

我要發表回答

立即登入回答