在RedHat Cluster環境,採取的管理邏輯方法稱為"Quorum",直接翻譯為"仲裁"。
好像是一個會議,必須達到 Quorate(法定人數)才算是一個運作中的會議。
而這個Cluster就是至少要超過一半以上的nodes是Active(活的)狀態,這個Cluster功能才
能正常運作,否則就是 Dissolved(解散)啦。。。。
就手冊上是說,這種"仲裁"是透過一個主程序CMAN(Cluster Manager的簡稱),透過
網路傳遞的訊息,或者,使用Quorum Disk(仲裁硬碟)來達成決定這個Cluster是否可以正常
運作的條件。
只有從網路傳遞的訊息來判斷的設定,比較容易些,跟所謂的HeartBeat(心跳)一樣。
只要網路不通了,CMAN馬上會做出反應。基本上,就是透過投票,一個node有一票,
例如,有5個nodes的Cluster,有2個nodes出狀況,還有3個nodes是活著,那麼,就是大於等於[5除以2]+1的票數。這個Cluster還可以運作,如果沒有3個nodes以上,那麼這個Cluster的運作就瓦解了。
Cluster最怕出現"Split-Brain(腦裂)"的問題。就是有可能一半的nodes跟另外一半的nodes,互相競搶資源,因為認為自己才是活的,那個結果,通常就是互相透過fence device關來關去的,或者把Shared-filesystem搞垮掉。所以,才會想以多一個以硬碟來仲裁判斷。不過,對我來說,真的有點複雜。