硬體方面這要看現場可能才比較清楚, 如果機器還有MA的話, 請廠商協助抓問題
如果機器是過保固與沒MA的話, 建議以下做法
不知開版大的系統為何,不過基本上可以看看system logs跟apache logs,說不定可以找出httpd停止時是否有什麼共同的跡象,例如都是在某個時間點停止、每一段固定時間(如20分鐘)就會停一次。也可以考慮安裝一些監控程式如Nagios之類的,看看httpd停止時是否有規則可循。當監控軟體通知httpd停止時,也可以立即登入系統看看立即的系統資源像是CPU、記憶體、硬碟I/O、網路使用活動、連線數之類的。同時也要觀察是不是某個程式一旦執行後就會使httpd當掉,或是某個程式的instance數過多導致系統無法負荷。
有時寫程式的人員沒有優化程式碼,又加上大大的主機有點老舊,可能無法處理吃系統資源過大的程式。我們之前有個httpd常常自動停止的案例是因為apache domlogs總大小過大,印象中apache 1.x的domlogs好像不可超過2GB左右,否則httpd會常常當掉,而且會連restart指令都沒用變成完全無法啟動。