iT邦幫忙

鐵人檔案

2023 iThome 鐵人賽
回列表
AI & Data

Data pipeline 建起來!用 Airflow 開發你的 Data pipeline 系列

如今在 Data 及 AI 快速的發展,各種演算法及服務不斷推陳出新,Data pipeline 在資料服務中是一個不可或缺的重要要素。這系列文章主要分享data pipeline的相關實踐,包含資料的架構,Airflow 的實作,以及開發測試部署的流程。希望幫助讀者們能夠掌握data pipeline 的相關知識架構,並能更全面地進行Data pipeline 的開發!

鐵人鍊成 | 共 30 篇文章 | 9 人訂閱 訂閱系列文 RSS系列文
DAY 11

『Day11』Airflow 介紹

不瞞大家,這幾天其實我在日本旅遊當中,所以鐵人賽對我來說真的是很鍛鍊啊!每天有很多行程之外,結束後還是要抓緊時間寫文章,真的是極度瘋狂!但是這過程中卻也覺得十分...

DAY 12

『Day12』Airflow DAG 介紹

今天也是在日本旅遊與鐵人競賽當中交錯,實在是十分有趣的經驗!今天看到日本許多有設計感的建築,覺得令人歎為觀止,我想除了設計的靈感之外,也需要強大的工程技術能力來...

DAY 13

『Day13』安裝 Airflow

剛開始學習程式的時候,對我來說最讓我感到挫折的就是環境安裝的問題。由於許多背景知識的不足,以及系統版本和程式版本非常的複雜,總是需要花上許多時間跟精力進行安裝及...

DAY 14

『Day14』第一個 Airflow Data Pipeline

安裝完環境之後,想必在讀本系列文章的你,對於開發 Data pipeline 必定是躍躍欲試!如果對 Airflow 有點熟悉的朋友,這幾天可以簡單瀏覽過或是當...

DAY 15

『Day15』如何使用 DAG , Task

昨天晚成第一個 DAG 之後,是不是覺得有些成就感呢?不過相信也對其中許多概念仍然感覺霧煞煞吧,在今天我們會來說明一下 Airflow 的 DAG 以及 Tas...

DAY 16

『Day16』Relationships 關聯關係

昨天說明了 DAG 以及 Task,今天我們繼續說明另一個很重要的 Airflow 元件 -- Relationships 關聯關係。 在我們做的第一個 DAG...

DAY 17

『Day17』DAG 執行方式與排程

經過前幾天的介紹,相信大家應該都有一個基本的概念輪廓,知道如何透過 Airflow DAG 建立所需要的 Data pipeline了。今天來談談 DAG 如何...

DAY 18

『Day18』帶入參數執行 DAG

在一開始學習程式的時候,覺得使用參數是件像是魔法一般的事。同樣類型的工作,編寫一次程式碼之後,就可以透過不同的參數產生不同的結果。如果有不同的維度的功能需要加入...

DAY 19

『Day19』使用 XCom 進行 Task之間參數傳遞

昨天談到帶入參數執行 DAG,那如果我們那如果我們今天想要從Task 之間彼此傳遞參數呢?那就必須使用到 Airflow 中的 XCom的功能了 。今天我們就來...

DAY 20

『Day20』Variable 與 Template

在前兩天陸續介紹了 Airflow 如何進行參數傳遞的主題,以及 XCom 的設計及使用方法。今天接續著參數的話題來談談 Airflow Variable 及...

無聊工程師 bored_engineer的收藏
無聊工程師 bored_engineer的追蹤
無聊工程師 bored_engineer的Like
無聊工程師 bored_engineer的紀錄