iT邦幫忙

0

win2003 DFS伺服器當機

有一台DFS伺服器,掛載一個Storage磁區,只要下載或上傳資料量大一點(約XGB)就會當機,是Fibre SAN Switch架構,伺服器RAM1G。
請問有什麼可能性會造成傳輸檔案時讓伺服器當機呢?

圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

2 個回答

12
Ray
iT邦大神 1 級 ‧ 2011-01-03 15:31:00
最佳解答

這很正常啊, 傳個幾 GB 的資料, Disk 速度趕不上 Gigabits Ethernet 的速度, 把 Disk Queue 給塞滿了, 主機當然動不了....但是光瞎猜沒有用, 您還是得:

看更多先前的回應...收起先前的回應...
Ray iT邦大神 1 級 ‧ 2011-01-03 15:39:57 檢舉
  1. 先用效能監視器, 找出瓶頸在哪裡? 到底是不是 Disk 太慢:

    如果上圖的 Queue Length 最大值大於 2, 那就要檢討了; 如果飆到 254 以上的話, 那整個 Qeueu 就等於是被塞爆掉了, 當然所有工作都會卡死, 都要等那個該死的 Queue 消化完, 才能做其他的事.

假設以上數據可以佐證是 Disk 瓶頸的話, 那你有幾種選擇:

  1. 看看瓶頸是否卡在 FC? 依據使用速度, 評估看看提升 FC 是否有用?
  2. 若瓶頸不是 FC, 那是否 SAN 的 IOPS 和 Throughput 不夠? 是否該考慮升級 SAN?
  3. 如果預算上都無法提升上述兩者的話, 是否應該限制用戶的傳輸頻寬? 禁止它們一次傳那麼大?

通常 LAN 裡面傳超大檔, 是網管人員的夢靨, 因為再大的頻寬/再快的硬碟, 都不可能滿足這種無窮盡吃頻寬的行為. 您可以慢慢去了解使用者的需求: 使用者能忍受多久傳完這個檔?

當然, 使用者的需求也是無止盡的, 人人都會說: 越快越好!! 此時您應該把成本攤開來給大家看:

  1. 如果 1 分鐘傳完, 公司需要花數千萬元才能達到, 以後每年還要付百萬元的維護費
  2. 如果 10 分鐘傳完, 公司需要花數百萬元才能達到, 以後每年還要付十幾萬元的維護費
  3. 如果 1 小時傳完, 公司只要花幾萬元就能達到, 以後還不用再付維護費

把這些選項給高階主管或財務部看, 讓他們決定. 以後使用者再抱怨, 就把主管搬出來擋...

msit iT邦高手 1 級 ‧ 2011-01-03 16:05:47 檢舉

兩年前要是有ray大的分析,當時就不用找那麼久了,真的佩服佩服。

Ray iT邦大神 1 級 ‧ 2011-01-03 17:21:08 檢舉

寫程式需要創意, 但是管系統卻需要證據....若是拿寫程式的創意來管系統, 會被打趴在地上死死去..

管系統, 最重要的是「能見度」(Visibility), 管理員必須把使用者抽象的「感覺」, 轉化成為可以看得見的「數據」, 所有的改善才能有依據, 也才能把管理員的績效量化評估.

打開能見度, 需要靠工具. 這個工具可大可小, 可以信手拈來, 也可以養隻千眼大怪物來幫你看.
管系統的人, 必須要有 CSI 抽絲剝繭的精神, 把證據收集齊了, 你才能有大聲講話編預算的餘地...

(小弟十年前去美國跟 FBI, NSA 幹員一起受訓, 學得正好是:「證據保全」的項目....)

leo226 iT邦新手 4 級 ‧ 2011-01-04 16:11:36 檢舉

感謝ray指教,謝謝!
遇到一個問題,我在該server上想要用以上方法觀察其效能時,我要挑選計數器時"效能物件"和"計數器"都是以數字方式呈現,別台server就沒有這個問題。
應該是這台server有問題吧,暫時找不到Disk的一些計數物件。

我要發表回答

立即登入回答