iT邦幫忙

DAY 8
0

技術問題亂記系列 第 8

認識 Quorum

在RedHat Cluster環境,採取的管理邏輯方法稱為"Quorum",直接翻譯為"仲裁"。
好像是一個會議,必須達到 Quorate(法定人數)才算是一個運作中的會議。
而這個Cluster就是至少要超過一半以上的nodes是Active(活的)狀態,這個Cluster功能才
能正常運作,否則就是 Dissolved(解散)啦。。。。

就手冊上是說,這種"仲裁"是透過一個主程序CMAN(Cluster Manager的簡稱),透過
網路傳遞的訊息,或者,使用Quorum Disk(仲裁硬碟)來達成決定這個Cluster是否可以正常
運作的條件。

只有從網路傳遞的訊息來判斷的設定,比較容易些,跟所謂的HeartBeat(心跳)一樣。
只要網路不通了,CMAN馬上會做出反應。基本上,就是透過投票,一個node有一票,
例如,有5個nodes的Cluster,有2個nodes出狀況,還有3個nodes是活著,那麼,就是大於等於[5除以2]+1的票數。這個Cluster還可以運作,如果沒有3個nodes以上,那麼這個Cluster的運作就瓦解了。

Cluster最怕出現"Split-Brain(腦裂)"的問題。就是有可能一半的nodes跟另外一半的nodes,互相競搶資源,因為認為自己才是活的,那個結果,通常就是互相透過fence device關來關去的,或者把Shared-filesystem搞垮掉。所以,才會想以多一個以硬碟來仲裁判斷。不過,對我來說,真的有點複雜。


上一篇
確認 Fence 設備
下一篇
產生 Quorum Disk
系列文
技術問題亂記30

尚未有邦友留言

立即登入留言