大家好
最近在檢查使用的ESXI,都會在events看到出現錯誤訊息,如下
Device t10.ATA_____ST2000DM0012D1CH164______
____________________________Z1E78L8J
performance has deteriorated. I/O latency increased
from average value of 2542 microseconds to 167226
microseconds.
warning
我有辜狗了一下,大部分都是說硬碟快壞了,或是誤報
但是有幾個奇怪的點
1.此訊息都在凌晨12點出現,並且很準時的只在12:00:XX整出現,但是這個時間不會有人在使用SERVER。
2.出現的時間不固定,有可能兩三天出現一次,或是兩三個禮拜才有。
所以想詢問這有可能是什麼問題嗎?還是說救真的是硬碟有問題?
為了以防萬一小弟已經在備份了
謝謝大家
單純就字面去解釋
只是在回報你的平均的I/O latency過高
你可以在esx host的performance的storage那邊去看到資料
max min avg與區間圖型通通可以看到
這個效能警告的產生有可能是定時去做觸發的
所以才是同樣的時間點產生
這代表的是你I/O表現過慢
而過慢的原因
可能是loading超過設備所能提供
(你可以觀察各GuestOS的Disk/Datastore的performance數據)
也可能是設備真的出現問題
Internal Raid建議要設法裝上監控程式
它可以提早發出PFA警告
NAS或SAN本身也有自己的管理介面
performace與alert都能在上面做設定與觀察
都有可能
硬碟
可能問題:
1.傳統硬碟且沒有RAID
2.硬碟轉速、讀寫效率較低者
3.韌體有問題,二大品牌我都遇到過,改版或是直接換掉就OK了
4.確實快掛了,硬碟檢測軟體能看得到
如果硬碟可能性已經排除,那麼
請大膽忽略該錯誤
這個錯誤訊息遇到的人多得是,我當然也是
我最近也遇到此問題,請問版主後來如何處理
Device naa.600605b005e7362026dfafa90f830aca
performance has deteriorated. I/O latency
increased from average value of 54834
microseconds to 1664890 microseconds.
warning
2023/1/9 下午 12:51:00
localhost.localdomain