iT邦幫忙

1

aws ec2 檢查故障問題

  • 分享至 

  • xImage

我的aws每隔一段時間,就會出現故障,如下面所附圖片,都會出現"1/2 項檢查通過",時間有長有短不固定,點檢查警示也沒有任何錯誤,重開之後就正常了,但這樣很困擾,請問有人有碰過這問題嗎,是否有什麼解決方式。 我系統適用AMI印象檔複製產生,不知道是不是這因素,轉換之間有什麼錯誤。或有哪個地方可以查錯誤log

https://ithelp.ithome.com.tw/upload/images/20250902/201718127MC6myDbvQ.png

看更多先前的討論...收起先前的討論...
pizza0223 iT邦新手 5 級 ‧ 2025-09-02 12:27:10 檢舉
這可能的狀況很多
你最好貼一下到底是哪項檢查沒過才有辦法推測
多數的情況是你當下 OS 裡面可能發生了什麼事
我碰過硬碟爆掉(使用空間已滿)也會出現這種情況的
或許看一下你出現這狀況的時候 Cloudwatch 的指標有沒有什麼特別的曲線
TonyKang iT邦新手 5 級 ‧ 2025-09-03 08:26:48 檢舉
每隔一段時間就出現故障,重開後就正常,建議你可以在先從 cloudwatch 觀測一下 CPU 硬碟等相關指標,硬碟的指標比較多人會沒有注意到,空間滿了或是IOPS不夠都會造成這樣的問題,如果指標看起來都正常,那可以往 MEM的方向去看,但就需要你先安裝cloudwatch agent 把 mem 的指標送到cloudwatch 來進行觀看
developer iT邦新手 5 級 ‧ 2025-09-03 09:34:38 檢舉
點檢視警示沒有出現任何錯誤才麻煩,這機制似乎也沒法關閉的樣子?也不知道他做了什麼。cloudwatch 的作用主要是什麼,有推薦的教學嗎,感謝兩位回應。
TonyKang iT邦新手 5 級 ‧ 2025-09-03 09:59:53 檢舉
cloudwatch 主要的作用就是做監控,他預設會把大部分AWS服務的指標(例如:CPU使用率等...) 送到cloudwatch ,你可以在cloudwatch 看的到這些資訊。

你可以在以下的網址了解一下cloudwatch 的服務:
https://catalog.us-east-1.prod.workshops.aws/workshops/a8e9c6a6-0ba9-48a7-a90d-378a440ab8ba/en-US/300-cloudwatch

他那個機制是無法關閉的
pizza0223 iT邦新手 5 級 ‧ 2025-09-03 10:25:15 檢舉
還有 你的系統如果是自製的 AMI 映像檔產生,那之前這個映像檔有過的問題理論上你的系統都會有,最好了解一下這個 AMI 之前是拿來幹嘛用的。
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 個回答

0
freeman621117
iT邦新手 5 級 ‧ 2025-09-03 09:58:18

請點開"檢視警示",給大家看看

我要發表回答

立即登入回答