iT邦幫忙

0

ESXI出現有關硬碟的錯誤訊息

大家好
最近在檢查使用的ESXI,都會在events看到出現錯誤訊息,如下
Device t10.ATA_____ST2000DM0012D1CH164______
____________________________Z1E78L8J
performance has deteriorated. I/O latency increased
from average value of 2542 microseconds to 167226
microseconds.
warning
我有辜狗了一下,大部分都是說硬碟快壞了,或是誤報
但是有幾個奇怪的點
1.此訊息都在凌晨12點出現,並且很準時的只在12:00:XX整出現,但是這個時間不會有人在使用SERVER。
2.出現的時間不固定,有可能兩三天出現一次,或是兩三個禮拜才有。

所以想詢問這有可能是什麼問題嗎?還是說救真的是硬碟有問題?
為了以防萬一小弟已經在備份了哭
謝謝大家

Ethan Jhuang iT邦研究生 3 級 ‧ 2014-08-07 10:00:04 檢舉
自己架來玩的ESXI常常跑這訊息
不過原因是我用了綠標當系統碟XDD

跑了兩年還是頭好壯壯..

2 個回答

10
u8526425
iT邦大師 1 級 ‧ 2014-08-06 23:05:52
最佳解答

單純就字面去解釋
只是在回報你的平均的I/O latency過高
你可以在esx host的performance的storage那邊去看到資料
max min avg與區間圖型通通可以看到
這個效能警告的產生有可能是定時去做觸發的
所以才是同樣的時間點產生

這代表的是你I/O表現過慢
而過慢的原因
可能是loading超過設備所能提供
(你可以觀察各GuestOS的Disk/Datastore的performance數據)
也可能是設備真的出現問題
Internal Raid建議要設法裝上監控程式
它可以提早發出PFA警告
NAS或SAN本身也有自己的管理介面
performace與alert都能在上面做設定與觀察

看更多先前的回應...收起先前的回應...

專業啊~~

可是這訊息出現的時候多數並沒有使用量,我當時跟版主一樣擔心好久一直找解決辦法

u8526425 iT邦大師 1 級 ‧ 2014-08-07 09:48:15 檢舉

既然warning msg是定時觀察avg值
就不會是即時的警示
要回頭去查歷史累積的performance圖表才能判斷

sam0407 iT邦高手 1 級 ‧ 2014-08-07 09:57:03 檢舉

半夜12點這個時間點,雖然線上不會有使用者,但通常也是備份或排程轉檔等程式活躍的時間,時間調開試試看吧~~

to S大,因為目前得備份時間為半夜3點,所以應該不是這個問題,
U大說的可以查歷史performance圖表要怎麼看呢?我現在只能看到過去一小時的記錄,過了就看不到。

hon2006 iT邦大師 1 級 ‧ 2014-08-08 13:47:41 檢舉
2
Ken(Bigcandy)
iT邦大師 1 級 ‧ 2014-08-06 19:02:37

都有可能

看更多先前的回應...收起先前的回應...

硬碟
可能問題:
1.傳統硬碟且沒有RAID
2.硬碟轉速、讀寫效率較低者
3.韌體有問題,二大品牌我都遇到過,改版或是直接換掉就OK了
4.確實快掛了,硬碟檢測軟體能看得到

如果硬碟可能性已經排除,那麼
請大膽忽略該錯誤
這個錯誤訊息遇到的人多得是,我當然也是

hon2006 iT邦大師 1 級 ‧ 2014-08-06 22:26:55 檢舉

我也有碰過,用 hdd regenerator 去檢查沒問題,但是過了半年真的掛了

hon2006提到:
過了半年真的掛

所以是說ESXi會預告硬碟半年後要掛!?好帥~~
我的經驗是沒有這樣。

hon2006 iT邦大師 1 級 ‧ 2014-08-07 11:48:20 檢舉

我碰到的故障情形是 esxi 一陣子會當掉,沒有出現紫色畫面,event 也有出現上面出現的錯誤,之後就把這台機器轉成hyper-v的環境,正常過了半年,硬碟最近掛點了.

我要發表回答

立即登入回答