Day 26 - Data Partitioning - Distributed Hash Table and Consistent Hashing - Kademlia

11th鐵人賽分散式系統 dht kademlia 分散式儲存

2548 瀏覽

前言

前兩篇介紹的Distributed Hash Table的Hashing Space是對應到一個圓，今天我們要來介紹另一種對應到Tree Structure的演算法 - Kademlia

這個演算法也是廣為應用在P2P領域，如果你曾經用過Emule、BitTorrent (透露年紀) ，那麼他底層的Data Partitioning就是用Kademlia這個演算法。

與CHORD一樣的是透過Hash Function將NodeID、Key對應到m-bit string，一般也是採SHA-1轉成160bits。

但是Kademlia建立了一個Binary Tree，搭配0與1將每一個NodeID放在Tree的Leaf上。

如下圖所示:

與CHORDㄧ樣，Kademlia也設計了一個自己Routing方法
先來看看什麼是 Distance 和 K-buckets 吧

在這裡我們定義 Distance 就是兩個ID做XOR的結果

E.g.
NodeA = 2 = 0010
NodeB =14 = 1110
XOR(A,B) = 1100 = 12

我們定義這個 1100 = 12 就是他的Distance，我們等等會看到這個的意義

在Kademlia裡，每一個Node維護了K-buckets作為Routing Table。

而 K-buckets 就是以 Distance 來做分層

E.g.

Bucket 0 存距離 0~1 之間範圍內的Nodes
Bucket 1 存距離 2~3 之間範圍內的Nodes
Bucket 2 存距離 4~7 之間範圍內的Nodes
...

直接看一個圖

對於Node 0010來說，Node 0000應該存在哪一個Bucket呢?

我們可以從另一個角度來看這個關係，其實他採用XOR就是在說明bits到第幾位開始不同

例如0011與0010是到最後一位才不同放在 Bucket0
例如0000/0001與0010是第二位開始不同，放在Bucket1。
例如0100/0110/0101/0111與0010是第三位開始不同，放在Bucket2

他的Bucket距離區間( 2^i ~ 2^(i+1)-1 )從二進位來看就是第幾位開始不同

但是你會發現當i越大，比方說到Bucket159，他可能存的Node是在2^159 ~ 2^(160)-1之間，可能有超多Nodes，
所以才要用K-bucket，規定每個Bucket只能存K個，
距離越遠我可以用hops的方法去找去逼近到而不用全部記下來。

直接從例子來看
假設 NodeID 0010 要尋找 NodeID 1110

核心思想就是每一次找都找最接近的

比方說 NodeID 1110 應該是要在 NodeID 0010 [8,15]這個區間的Bucket，但是不在裡面。
但是 NodeID 1110 一定跟其他已經記錄在NodeID 0010 [8,15]這個區間的Neighbors Nodes比較近
因此先從[8,15]開始找

NodeID 0010 XOR NodeID 1110 = 12 在 [8,15]區間
因為在自己的Bucket裡面沒有記錄NodeID 1110，因此發送訊息詢問有記錄的Nodes，比方說Node 1000與Node 1010。一次詢問多少人也是可調參數，這邊假設可以從Bucket挑出最多2人詢問。
因此 NodeID 0010 -> Node 1000與Node 1010 詢找NodeID 1110