iT邦幫忙

鐵人檔案

2011 iT 邦幫忙鐵人賽
回列表

高有效性 (High Availability) 初論 30 講 系列

在 Web 2.0 時代後, 系統已經不能不考慮 Scalability 以及 Availability 的問題, 甚至 Efficiency 以及 Usability 都是其關鍵, 加上最近非常火紅的 Cloud 也是在 HA 的範籌, 但這方面在學校講的少, 實務上理論大家都沒甚麼在接觸, 因為工作 (High Performance Computing) 的關係, 累積了一些想法與經驗, 所以又想趁這機會整理一下, 提供給大家更進一步的資訊.

鐵人鍊成 | 共 30 篇文章 | 18 人訂閱 訂閱系列文 RSS系列文
DAY 1

達標好文 高有效性簡介30篇: 1 (前言)

高有效性 (high availability) 是一個看起來是很不起眼的一環, 但確是足以決定成敗的一環, 當然這個是個大議題, 因為其內容還包含幾個層面:...

2011-10-11 ‧ 由 食夢黑貘 分享
DAY 2

高有效性簡介30篇: 成本的計算 (2)

**大家還記得我前年的鐵人賽是寫 IT Consultant 資訊科技顧問的這個題目吧, 而在去年是寫 Data Mining 資料探勘這個題目, 事實上就我的...

2011-10-12 ‧ 由 食夢黑貘 分享
DAY 3

高有效性簡介30篇: 監控與警示 (3)

**開始做 High Availbility 高有效性的第一個步驟當然是定義目標, 決定 SLA Service Level Aggreement, 但在之前就...

2011-10-13 ‧ 由 食夢黑貘 分享
DAY 4

高有效性簡介30篇: 版本控制與測試環境 (4)

版本控制這個題目可以寫上好幾本書, 甚至要延伸上去就是 Software Engineer 軟體工程的範籌, 甚至包含測試的環節來看, 這就是個過大的議題, 也...

2011-10-14 ‧ 由 食夢黑貘 分享
DAY 5

高有效性簡介30篇: 群組運算 (5)

高有效性是不可能只靠一台機器去完成的, 因為任何一個再好的機器都會有問題, 任何一個零組件都會有 MTBF Mean Time Between Failuare...

2011-10-15 ‧ 由 食夢黑貘 分享
DAY 6

高有效性簡介30篇: Service Level Agreement (6)

**在繼續講剩下的 7 點之前, 我發現有一個很重要的名詞須要著墨一下, 就是 Service Level Agreement. SLA 有很多種翻譯, 有人說...

2011-10-16 ‧ 由 食夢黑貘 分享
DAY 7

高有效性簡介30篇: 容錯系統 (7)

**Fault tolerance 容錯是在 High Availbility 很重要的一環與假設, 因為我們知道在高有效性的目的就是避免失效/失能, 但我們知...

2011-10-17 ‧ 由 食夢黑貘 分享
DAY 8

高有效性簡介30篇: 負載均衡 (8)

**負載均衡是高有效性最基本的問題之一, 有了一堆電腦, 接下來的問題就是如何分派 (Dispatch) 工作了, 而讓工作能夠均勻分擔到每一台機器, 且當機器...

2011-10-18 ‧ 由 食夢黑貘 分享
DAY 9

高有效性簡介30篇: 規模化 Scalability (9)

在我心目中, Flickr 才是第一個透過 "群眾智慧" 成功的案例, 且現在還是蠻可以運作的一套系統, 當歐萊禮的 Building Sc...

2011-10-19 ‧ 由 食夢黑貘 分享
DAY 10

高有效性簡介30篇: 看門狗 Watch Dog (10)

在高有效性的系統中, 我們都知道要監控與警示, 要如何知道出問題, 靠的是 Watch Dog 的功能, 也就是 Heart Beat 與 Santity Te...

2011-10-20 ‧ 由 食夢黑貘 分享