有一台DFS伺服器,掛載一個Storage磁區,只要下載或上傳資料量大一點(約XGB)就會當機,是Fibre SAN Switch架構,伺服器RAM1G。
請問有什麼可能性會造成傳輸檔案時讓伺服器當機呢?
這很正常啊, 傳個幾 GB 的資料, Disk 速度趕不上 Gigabits Ethernet 的速度, 把 Disk Queue 給塞滿了, 主機當然動不了....但是光瞎猜沒有用, 您還是得:
假設以上數據可以佐證是 Disk 瓶頸的話, 那你有幾種選擇:
通常 LAN 裡面傳超大檔, 是網管人員的夢靨, 因為再大的頻寬/再快的硬碟, 都不可能滿足這種無窮盡吃頻寬的行為. 您可以慢慢去了解使用者的需求: 使用者能忍受多久傳完這個檔?
當然, 使用者的需求也是無止盡的, 人人都會說: 越快越好!! 此時您應該把成本攤開來給大家看:
把這些選項給高階主管或財務部看, 讓他們決定. 以後使用者再抱怨, 就把主管搬出來擋...
兩年前要是有ray大的分析,當時就不用找那麼久了,真的佩服佩服。
寫程式需要創意, 但是管系統卻需要證據....若是拿寫程式的創意來管系統, 會被打趴在地上死死去..
管系統, 最重要的是「能見度」(Visibility), 管理員必須把使用者抽象的「感覺」, 轉化成為可以看得見的「數據」, 所有的改善才能有依據, 也才能把管理員的績效量化評估.
打開能見度, 需要靠工具. 這個工具可大可小, 可以信手拈來, 也可以養隻千眼大怪物來幫你看.
管系統的人, 必須要有 CSI 抽絲剝繭的精神, 把證據收集齊了, 你才能有大聲講話編預算的餘地...
(小弟十年前去美國跟 FBI, NSA 幹員一起受訓, 學得正好是:「證據保全」的項目....)
感謝ray指教,謝謝!
遇到一個問題,我在該server上想要用以上方法觀察其效能時,我要挑選計數器時"效能物件"和"計數器"都是以數字方式呈現,別台server就沒有這個問題。
應該是這台server有問題吧,暫時找不到Disk的一些計數物件。