各位前輩好~
今天又有問題想請教大家
就是我們環境上的FW是fedora8環境
這幾天/var/log/message一直出現以下訊息
Dec 23 09:12:34 wish kernel: Adapter 0: DRAM error detected and corrected with ECC
Dec 23 09:12:34 wish kernel: Adapter 0: Uncorrectable DRAM error detected with ECC
請問這是什麼情況??
查Google都沒有一個合適的解答
而且又是kernel的問題,感覺忽略的話我也要被忽略了...
求救!!!
他是通知你, 主機的 RAM 已經有部份儲存體壞掉了啦!! 趕快換掉.....
raytracy前輩你好,
如果一直不去理它是不是沒多久那server就要葛屁??
這是一個警兆,硬體出了問題就要趕快安排處理檢修。多久之後會造成整個系統崩潰,沒有人可以給出一個正確解答。不去理他、相當於給自己安了一顆不定時引爆的炸彈。
您的 FC8 用來當 FW,有可能會造成整個網路環境癱瘓,如果無法暫停,比較好的方式是另外架一個新的 FW 來代替原來的 FW 功能。
您還可以 "一直不去理他" 啊?.....Server 不一定要停止運轉才叫壞掉, 只要資料不正確就已經壞掉了....
試想 "資料不正確" 的影響有多大:
傳輸資料時, 裡面某個數字從 1 變成 9, 如果這是重要的營運報表, 看到報表的人, 完全不知道這個數字是錯的, 然後就下了錯誤的決策, 影響所及, 可能是公司多了幾百萬的庫存品, 或是損失幾千萬的利潤. 在集團型的企業中, 損失可能要以數億來計算....
如果一個數字錯, 可以讓公司損失幾千萬到幾億, 您還要等到 Server 不能動了再來換嗎?
他都已經說:
Adapter 0: Uncorrectable DRAM error 了,
翻譯成中文就是:
第 0 號插槽上的 DRAM, 發生無法修正的錯誤.
DRAM 資料有錯, 您還敢繼續用下去? 難不成貴公司的資料都不值錢?
先去看看妳的記憶體有多大,一般有ECC 的記憶體,他會自動將壞掉的停掉也就是說記憶體會變少,最好是排停機時間更換到壞掉的部分,如果無虞警當機就要挨罵了 = ="