第 12 屆 iThome 鐵人賽

DAY 15

Software Development

etcd Raft淺談(下) 日誌複製

12th鐵人賽 etcd raft

雷N

2020-09-21 00:12:34

2805 瀏覽

分享至

Raft日誌複製Log Replication

當etcd收到Client發出的操作請求時, 會呼叫AppendEntries把操作命令當成一個指令的Entry寫在log裡, 並標上Index.
然後再把log當成message傳送給Follower.

Follower收到log後也是會Append entry, 並且返回對應的回應訊息給Leader.

Leader一樣收到半數以上的回應後, 就把Entry給commit成committed, 並返回操作結果給Client, 然後也把commit給包成raftlog給Append Entry.

等到下一次heartbeat發送時, 就把Entries也帶過去通知Follower們執行commit.

這時候集群的狀態就完成一致了, 這個過程就是日誌複製Log Replication

當然以上是Raft的日誌複製.
其實也很像二階段提交(2PC),
第一階段做把日誌對Folloer做日誌複製, 等過半都複製完成時, 做本地commit, 就回應給Client.
第二階段是異步的, Leader就週期性地把提交資訊透過heartbeat提交給Follower, 所以Follower們也會完成commit.

etcd組件介紹

etcd的話, 內部核心稍微複雜點

主要定義了etcd對client的核心接口.
還有跟內部其他模組的設定與溝通.
其中id該節點的ID
appliedINdex就是用來紀錄目前這server節點已經Apply的Entry紀錄的最大索引值.
committedIndex就是紀錄已經提交成功的Entry紀錄的索引值.
inflightSnapshots已經發送出去但還沒收到ack的快照數量.
leadElecttedTime紀錄該節點最近一次當上Leader狀態的時間戳記.
cluster目前cluster中所有節點的資訊.
snapshotter讀寫快照檔案
snapCount一個門閥值, 當目前的entry數量距離上一次快照的entry數量, 超過這閥值時, 就會觸發快照.
compactor用來控制定期壓縮的頻率
非常多配置QQ

Raft Core

實現了Raft演算法的功能, 就這三篇一直介紹的內容.

BoltDB

etcd V3的backend store預設使用的就是BoltDB.
這部份在之前介紹過了.

參考:
In Search of an Understandable Consensus Algorithm這份論文對Raft和日誌複製有詳細的說明.
Raft演算法動畫

接著數篇就介紹些Client API跟做點範例.

etcd Raft淺談(中) 選舉篇

etcd 連線基本設定與KV CRUD

系列文

服務開發雜談共 33 篇

RSS系列文訂閱系列文

77 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

529 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

服務開發雜談系列第 15 篇

etcd Raft淺談(下) 日誌複製

Raft日誌複製Log Replication

etcd組件介紹

etcd Server

Raft Core

Memory Storage

WAL(Write Ahead Log)

SnapShotter

BoltDB

尚未有邦友留言

服務開發雜談系列 第 15 篇

etcd Raft淺談(下) 日誌複製

Raft日誌複製Log Replication

etcd組件介紹

etcd Server

Raft Core

Memory Storage

WAL(Write Ahead Log)

SnapShotter

BoltDB

尚未有邦友留言

標記使用者

服務開發雜談系列第 15 篇