iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
Rust

DataFusion 闖關攻略:30 天學習 Rust 查詢引擎之旅 系列

Apache DataFusion 是使用 Rust 開發的高效能可擴展查詢引擎,在 2024 年成為 ClickBench 基準測試中最快的單節點查詢引擎。

30 天學習路徑將從基礎環境建置、第一個查詢開始,循序漸進深入架構解析、StringView 優化原理,最後探索自定義擴展、生產部署等進階主題。透過深入原始碼分析,將完整解構從 LogicalPlan 到 ExecutionPlan 的轉換流程,理解現代查詢引擎的設計精髓。

參賽天數 23 天 | 共 23 篇文章 | 2 人訂閱 訂閱系列文 RSS系列文 團隊動鼠做
DAY 21

Day 21: Join 算子 Part 1 - Hash Join 原理

前言 在前兩天的文章中,我們探討了聚合算子的兩種策略:Hash Aggregation 與 Sort-based Aggregation 並觀察 DataFus...

2025-10-05 ‧ 由 a834567 分享
DAY 22

Day 22: Join 算子 Part 2 - Sort-Merge Join 和策略選擇

前言 在昨天的文章中,我們探討了 Hash Join 的原理和實現,學習到 Hash Join 透過兩階段模型(Build Phase 和 Probe Phas...

2025-10-06 ‧ 由 a834567 分享
DAY 23

Day 23: 數據源整合 Part 1 - TableProvider 機制

前言 在 Day 14 我們初步認識了 TableProvider 作為數據源抽象的概念,Day 17 也看到了它在謂詞下推中的實際應用。今天我們將深入探討 T...

2025-10-07 ‧ 由 a834567 分享