iT邦幫忙

0

Xeon 5050的溫度....

鵝混的地方是賣軟體服務的,前一陣子有user抱怨server會當機,鵝看了一下是RAID1其中一顆HD壞了,外加CPU溫度頗高(BMC讀到將近100度),鵝把壞的HD換掉,外加把PAE kernel換成No PAE,已經一週沒再當機了(目前BMC是讀到8-90度,其實還是很熱,或許是沒開PAE RAM不夠改吃swap,OS會進I/O wait,讓CPU有喘息的機會),照說RAID1壞一顆應該和當機無關,所以鵝懷疑是過熱造成的,當初那台server是送給user的(算消化庫存呆料吧),壞就壞在業務竟然跟user簽含HW的MA,所以雖然user端有VM可用,他們也不打算P2V進VM,鵝也只好很無奈的負責擦這沒有實際意義的屁股,根據I社的Ark,Xeon 5050 Tcase最高能容忍到67度,所以不管是80度或100度早就算過熱了,問題是鵝不確定BMC顯示的CPU Diode 1/2是不是等於Tcase,請問一下有邦友手邊還有這類老機器,可以幫鵝確認一下正常狀態下,CPU Diode 1/2大概是幾度嗎,Thanks!!

Tcase 67 度,樓主知道 Tcase 的定義嘛,它的定義是 根據 CPU 風扇 面對它,以入風口平面為準根據機殼的上下左右距離風扇邊緣 1CM 的平均溫度
換句話說, 這裡 67度,只要風扇好的,機殼風扇有做前後循環,這各溫度很難超過 67度,我自己TRY 2U 的伺服器機殼,在恆溫 38度,都很難超過這個溫度說
你說的 80 ~ 100 這個溫度基本上應該是 HW MONITOR 出來的溫度,這各溫度實際上叫做核心溫度, CORE Temp.,INTEL 以前有寫降速溫度跟關機溫度
如果以 95W 的CPU 來說,正常的降速溫度會是 103~105度,而關機溫度會是 105度以上的時候會進行保護關機
你應該要注意的是 硬碟溫度,原則上不應該超過 55度,這各溫度是HDD 與 SSD 最高的工作溫度,如果超過,HDD建議加風扇散熱,SSD 請把他安置到比較通風的地方,如果是M2,請加散熱片,大概就這樣

對了某一代之後的 CPU,因為多核心架構,所以只有所有的核心都OVER,否則他只會關閉或降速超溫的核心,或是停止派工,關閉工作線程,等到安全溫度之後,才會重新啟動線程與核心
cmwang iT邦高手 1 級 ‧ 2017-08-17 11:19:05 檢舉
昨天請同事到現場拆機重上散熱膏,目前CPU Diode沒有超過70度了,看來是散熱膏老化造成的,就先矇過去了....

尚未有邦友回答

立即登入回答