iT邦幫忙

鐵人檔案

2023 iThome 鐵人賽
回列表
AI & Data

Airflow 是什麼? 能吃嗎 ? 數據水管工的超級蘑菇 系列

資料工程師,也叫做數據水管工,主要就是要想辦法串接老闆、PM、分析師、科學家要的資料,因為過去常常用 crontab 到發瘋,所以想認真研究 Airflow ,希望學習過程中能透過鐵人賽督促自己。

鐵人鍊成 | 共 30 篇文章 | 11 人訂閱 訂閱系列文 RSS系列文
DAY 11

[Day11] 當我們同在一起 - Airflow Task Group

TaskGroup 簡介 TaskGroup 是一種在 Airflow 中用來組織和管理多個 Task 的方法,透過將任務分類成不同群組,讓我們 DAG 當中的...

2023-09-26 ‧ 由 Shawn 分享
DAY 12

[Day12] 零地點突破‧改-Airflow Taskflow API(上)

前言 2020 年 12 月發布的 Apache Airflow 2.0,其中很重要的新功能就是 Taskflow API,可以讓我們更簡潔的撰寫 Airflo...

2023-09-27 ‧ 由 Shawn 分享
DAY 13

[Day13] 零地點突破‧改-Airflow Taskflow API(下)

有鑒於昨天的實作部分,有朋友反應好像講不清楚,一下子就給 code,今天還是再針對每一個 part 來詳細說明~ 一、術式順轉·蒼 - 整體邏輯架構 通常在寫大...

2023-09-28 ‧ 由 Shawn 分享
DAY 14

[Day14] 吃了容器果實的鯨魚拉布-Docker(1)

前言 之前很多鐵人賽都有談過 docker ,想要很完整系統性的學 docker,都可以參考下方連結:1. 30 天與鯨魚先生做好朋友2. 那些關於 dock...

2023-09-29 ‧ 由 Shawn 分享
DAY 15

[Day15] 吃了容器果實的鯨魚拉布-Docker(2)

安裝 Docker Docker Desktop 下載 https://www.docker.com/products/docker-desktop/ Doc...

2023-09-30 ‧ 由 Shawn 分享
DAY 16

[Day16] 用 Docker Compose 建立 Airflow 環境

什麼是 Docker Compose Compose 是組合或組成的意思,Docker Compose 就是代表組合多個 Docker 容器,可以直接用 YAM...

2023-10-01 ‧ 由 Shawn 分享
DAY 17

[Day17] Airflow 連接到 Database 的三種方法

前言 連接到 Database ,應該是 Airflow 當中一定會用到的功能,畢竟我們的資料進出都需要操作資料庫,在 dag 當中是用到之前提過的MySqlO...

2023-10-02 ‧ 由 Shawn 分享
DAY 18

[day18] 急!在線等!求解20 點!Airflow 安裝 Python 模組

安安~在嗎~各位大大~什麼!這種梗透露年齡了嗎~該不會大家都千禧年之後出生的吧~趕快開始今天的內容吧~ Before Install Library 建立測試...

2023-10-03 ‧ 由 Shawn 分享
DAY 19

[Day19] Airflow Scheduler 排程爬坑筆記(上)

Before 爬坑 Today Practice 今天繼續使用昨天的安裝模組的 code,簡單好用~ import requests from datetime...

2023-10-04 ‧ 由 Shawn 分享
DAY 20

[Day20] Airflow Scheduler 排程爬坑筆記(下)

Airflow 時間變數的地雷區 Before 地雷 start_date ⮕ DAG 開始的日期,必要參數 end_date ⮕ DAG 停止的日期,不必要...

2023-10-05 ‧ 由 Shawn 分享