**我寫到這邊, 想要介紹的一本書是再寫一次 Analytical Network and System Administration :
Managing Human-Computer Network, 網路與系統管理分析: 管理人與電腦網路這本書, 但這本書已經被用在 iTHome 的好書推介了, 再寫一次就有點無趣了, 不然我這主題原本是以這做出發.
只是為了要多充實自己在 High Availability 的知識來寫這 30 篇, 也唸了不只 10 本書了, 甚至還發現了一個 O'Reilly 的 4G Collection, 這對於想大量閱讀又花不起那麼多錢的人是好事, 畢竟我在歐萊禮也投資了超過五十本書了, 所以這樣也稍微的不會對不起 O'Reilly, 畢竟這次我又要介紹他們的書.
原本也不太想推薦 Designing Large-Scale LANs 的原因是這本書是寫於 2002, 說實在的電腦書超過 10 年的話, 看得價值就少很多了, 但這本書不太一樣的是是功夫夠紮實, 其中對我而言我會喜歡這本的原因也是這本用的是數量分析的方法, 而不是一堆只是似事而非的概念 (這狀況 O'Reilly 本來就不會發生, 我的文章才會).**
只是這樣子就是四本推薦的書就有三本歐萊禮, 真的不太好吧, 看樣子我也該去申請推薦抽成才對.
這本書最好的地方就是有很多教你如何計算, 透過 MTBF, Reliability 等等的數字來計算出表格讓你更清楚狀況, 因為若沒有這樣的計算, 我們都會用一些成見來去判斷, 雖然我都說人的判斷才是最準的, 但也是失誤最多的, 但系統性的計算預測是確保不會因為自己的茫點或錯誤的想法造成重大的失誤.
當然我原本考慮的因素是:
1. 這本書太舊了
2. 又是歐萊禮的書
3. 誰還在管 LAN 阿, 現在 LAN 都 WAN 化了, 很多觀點都不一樣了.
4. 很多技術真的不是過時, 不然新的技術沒介紹到
5. 這個很大型的 LAN 並不是很多人都會遇到的
但我後來想想雖然說網管觀點, Anaalytical Network and System Administraion 那本書是相當不錯,只是數學太多, 相較講 High Availability 太少, 這本書雖然是以 High Reliability 高信度做出發, 跟我這篇有異曲同工之妙.
他還直接點出那些是最重要去間看的 Monitor:
1. Reachability (ICMP)
2. Reboot (coldStart)
3. Uptime (sysUptime)
4. Interface Status (ifxxxx)
這是在 9.3.2 What to Monitor 講的.
而我最喜歡的則是 2.2.7 中 Prediting Your Most Common Failures, 這是我很少看到有書講這一塊的, 花了一整章講 Reliability 與 Redundency 的觀點, 這也是我前面講很多篇的, 但說真的, 現在大家也都已經知道 Redundency 的重要性了, 尤其是現在追求的是 TCO, 以及 Risk Management 的現在.
O'Reilly 有放出第三章在網路上, 上面就是大型 LAN 的例子.
在這幾年, Routing 的重要性已經慢慢被 Switching 的多功能性取代, 當時以為很重要的 Multicasting 被 High Speed Network 消減不少必要性, 回頭看一下這本書, 可以看到不少以前的觀點以及時代的演進,這也是不錯的收獲.