iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
Software Development

ClickHouse 系列:從資料庫底層架構到軟體應用實踐 系列

面對現代應用對資料即時性與規模擴展的極限挑戰,傳統的 CRUD 與 ORM 模型已無法支撐大量資料與秒級查詢的需求。作為軟體開發者,你不僅需要會操作資料庫,更必須理解從資料庫底層設計到應用系統架構層級的全局視野,才能打造真正穩定、高效且可擴展的資料平台。

本系列以 ClickHouse 為核心,從儲存引擎、查詢加速、索引設計到分區與分片架構,逐步拆解 ClickHouse 為何能在 TB 級資料量下依然實現毫秒級查詢回應,並帶領開發者掌握 如何將 ClickHouse 融入軟體系統設計中,實現效能最佳化。

鐵人鍊成 | 共 30 篇文章 | 8 人訂閱 訂閱系列文 RSS系列文
DAY 1

Day 1|ClickHouse 系列:ClickHouse 是什麼?與傳統 OLAP/OLTP 資料庫的差異

ClickHouse 是由 Yandex 開發的 開源分布式列式資料庫管理系統(Column-oriented DBMS)。 主要針對 即時數據分析 (Real...

2025-08-04 ‧ 由 viiccwen 分享
DAY 2

Day 2|ClickHouse 系列:ClickHouse 為什麼選擇 Column-based 儲存?講解 Row-based 與 Column-based 的核心差異

在過去兩篇文章中(in my blog)有提到「Row-based Storage」與「Column-based Storage」是 OLTP 與 OLAP 系...

2025-08-05 ‧ 由 viiccwen 分享
DAY 3

Day 3|ClickHouse 系列:ClickHouse 儲存引擎 - MergeTree

ClickHouse 能夠支撐高性能資料查詢的核心秘密之一,就是其強大的儲存引擎 — MergeTree。這一篇將帶你深入理解 MergeTree 是什麼、它解...

2025-08-06 ‧ 由 viiccwen 分享
DAY 4

Day 4|ClickHouse 系列:壓縮技術與 Data Skipping Indexes 如何大幅加速查詢

在 ClickHouse 的高性能查詢背後,除了列式儲存與向量化執行外,「壓縮技術」與「資料跳過索引(Data Skipping Indexes)」也是讓它能夠...

2025-08-07 ‧ 由 viiccwen 分享
DAY 5

Day 5|ClickHouse 系列:ReplacingMergeTree 與資料去重機制

「資料重複」是常見且麻煩的問題,尤其是在 ETL Pipeline 或實時資料流匯入(如 Kafka Stream)時,重複資料會嚴重影響統計結果與查詢效率。C...

2025-08-08 ‧ 由 viiccwen 分享
DAY 6

Day 6|ClickHouse 系列:SummingMergeTree 進行資料彙總的應用場景

有一天你工作工作,在當社畜的時候,發現你現在需要大量的「數值加總」、「分組彙總統計」,例如每日活躍使用者數量、每小時流量統計、即時計數器 (Counter) 等...

2025-08-09 ‧ 由 viiccwen 分享
DAY 7

Day 7|ClickHouse 系列:Materialized Views 即時聚合查詢

在 OLAP 系統中,「即時聚合」與「預先計算」是加速查詢、降低資源消耗的核心策略。ClickHouse 提供了強大的 Materialized Views,能...

2025-08-10 ‧ 由 viiccwen 分享
DAY 8

Day 8|ClickHouse 系列:分區策略與 Partition Pruning 技術,如何加速大數據查詢

當面對數億、數十億筆資料時,若每次查詢都必須掃描全表,效能勢必崩潰。ClickHouse 提供了靈活的 分區 (Partitioning) 與 Partitio...

2025-08-11 ‧ 由 viiccwen 分享
DAY 9

Day 9|ClickHouse 系列:Primary Key、Sorting Key 與 Granule 索引運作原理解析

在 ClickHouse 的查詢加速機制中,除了 Partition Pruning 進行粗篩外,另一個細緻化資料範圍掃描的關鍵機制就是 Primary Key...

2025-08-12 ‧ 由 viiccwen 分享
DAY 10

Day 10|ClickHouse 系列:CollapsingMergeTree 與邏輯刪除

在傳統 OLTP 資料庫中,刪除與更新資料是家常便飯,但在 ClickHouse 這類專為 OLAP 場景設計的資料庫中,「邏輯刪除」與「資料版本控制」則需要透...

2025-08-13 ‧ 由 viiccwen 分享