[Day 29] Partitioning (3) - Rebalancing Partitions

12th鐵人賽 data engineer

tshine73

2020-10-14 22:15:50

2790 瀏覽

分享至

Rebalancing Partitions

每經過一段時間，資料庫可能會因為以下幾件事情改變：

為了想提高查詢的吞吐量，所以你加了 CPU。
資料的大小增加了，所以你需要加更多記憶體。
一台機器或某幾個資料硬碟壞了，其他的機器得接手它們的工作。

這些改變都會需要將資料和 request 從一個節點移到另一個節點上，這個過程稱之為 rebalancing。

不管你採用何種 partition schema，rebalancing 起碼得達成以下需求：

rebalancing 之後，負載 (資料、讀取和寫入需求) 應該要能平均分散之各台節點上。
rabalancing 過程中，資料庫應能正常處理讀取和寫入。
最小化資料在節點間的搬移，減少網路和硬碟 IO。

所以接下來會講做 rebalancing 時有哪些策略。

Strategies for Rebalancing

Fixed number of partitions

這個方法需首先先在每台節點上固定 partition 數量，舉例來說假設叢集有 10 台節點，我們可以指定 partition 的量為 1000 個，如此每台節點大約會有 100 個 partition，然後當節點增加時，這個新的節點會去每一台節點中偷一些 partition 回來，直到整個叢集的 partition 分佈變平均為止，這個過程如下圖。

figure_6-6

這個 rebalancing 策略被使用在 Riak, Elasticsearch, Couchbase 和 Voldemort。

這裡最大的難處就是如何在一開始就選一個對的 partiton 數量，資料會隨時間比例的成長，如果 partition 設很大，做 rebalancing 或節點從掛掉到恢復都是昂貴的，但 partition 設很小，每個 partition 又容易 overhead。

Dynamic partitioning

如果資料使用 key-range partition (Day 27)，固定的 parition 數量會非常不方便，容易發生邊界錯誤，這就會導至這些資料都只流到一個 partition 裡，然後其他 partition 就空了。

所以使用 key-range partition 的 HBase 和 RethinkDB 就使用 dynamic partition，當 partition 的資料大小成長到某個門檻值後，它會分裂成 2 個差不多一半大小的 partition，反過來說資料大小小於某個門檻值，它會合併鄰近的 partition，這個過程很像 Day 10 提到過的 B-Trees。

dynamic partitioning 的好處就是它能隨著整體的資料量做 partition 調整，資料不大時使用小量的 partition 是很有效率的，但要留意的是，當你新建資料庫時，初期你的資料量小所以只會有 1 個 partition，然後其他節點就會閒置了，為了減輕這個狀況，HBase 和 MongoDB 允許設定初始的 partition 數量 (也稱 pre-spiling )。

最後 dynamic partitioning 也適合用在 hash-partitoin 上。