Apache DataFusion 是使用 Rust 開發的高效能可擴展查詢引擎,在 2024 年成為 ClickBench 基準測試中最快的單節點查詢引擎。
30 天學習路徑將從基礎環境建置、第一個查詢開始,循序漸進深入架構解析、StringView 優化原理,最後探索自定義擴展、生產部署等進階主題。透過深入原始碼分析,將完整解構從 LogicalPlan 到 ExecutionPlan 的轉換流程,理解現代查詢引擎的設計精髓。
前言 在前兩天的文章中,我們探討了聚合算子的兩種策略:Hash Aggregation 與 Sort-based Aggregation 並觀察 DataFus...
前言 在昨天的文章中,我們探討了 Hash Join 的原理和實現,學習到 Hash Join 透過兩階段模型(Build Phase 和 Probe Phas...
前言 在 Day 14 我們初步認識了 TableProvider 作為數據源抽象的概念,Day 17 也看到了它在謂詞下推中的實際應用。今天我們將深入探討 T...