前言 連接到 Database ,應該是 Airflow 當中一定會用到的功能,畢竟我們的資料進出都需要操作資料庫,在 dag 當中是用到之前提過的MySqlO...
什麼是 Docker Compose Compose 是組合或組成的意思,Docker Compose 就是代表組合多個 Docker 容器,可以直接用 YAM...
終於來到最後一篇了,我們前面寫了這麼多程式跟測試,那要什麼時候執行測試? 理論上,你隨時都應該做。特別是 merge branch 回 develop 的時候。...
安裝 Docker Docker Desktop 下載 https://www.docker.com/products/docker-desktop/ Doc...
前言 之前很多鐵人賽都有談過 docker ,想要很完整系統性的學 docker,都可以參考下方連結:1. 30 天與鯨魚先生做好朋友2. 那些關於 dock...
TDD(測試驅動開發 Test Driven Develop)是一種軟體開發方法,它要求在編寫任何程式碼之前,先撰寫測試案例。這樣可以確保程式碼的品質和可靠性,...
有鑒於昨天的實作部分,有朋友反應好像講不清楚,一下子就給 code,今天還是再針對每一個 part 來詳細說明~ 一、術式順轉·蒼 - 整體邏輯架構 通常在寫大...
我們前面講了 Airflow 跟 Flink 的一些基礎觀念跟開發,現在讓我們整理一下兩邊的差異。 首先,Airflow 是一個優秀的排程管理工具,它有自己的...
雖然已經到尾聲了,但我發現有個重要的 Airflow 元件沒有提到,所以必須來補這篇。 Airflow XCom 是一種在不同的 task 之間傳遞資料的機制,...
前言 2020 年 12 月發布的 Apache Airflow 2.0,其中很重要的新功能就是 Taskflow API,可以讓我們更簡潔的撰寫 Airflo...
有了載具發票之後,可以透過發票號碼、消費日期、載具條碼、載具驗證碼來查詢發票購買細項 通常這邊發票會很多(因為一個月通常會有很多發票),例如我昨天在發票表頭 A...
查詢載具發票的 DAG 是比較複雜的邏輯,還記得在 Day 2:電子發票應用 API 規格 - 1有提到「抓載具發票是分成兩段式,也因此發票 APP 會先拿到所...
如果昨天設計 DAG 都了解,今天的課題基本上就是 copy paste 改一改 Exception 這邊先補充昨天沒有提到的 @handle_excepti...
DAG 首先我們先去定義 DAG,僅需要定義撈取紙本發票資訊即可 由於採用非同步方式,所以使用 asynico with DAG( dag_id...
有了 docker-compose.yml 之後我們還有一些待辦事項,接著在 /airflow 建立 Dockerfile Dockerfile FROM ap...
架設 Airflow 步驟比較複雜,今天這篇先聚焦於 docker-compose 如何寫 決定 Airflow 的 Database 我的版本選定 2.2.4...
TaskGroup 簡介 TaskGroup 是一種在 Airflow 中用來組織和管理多個 Task 的方法,透過將任務分類成不同群組,讓我們 DAG 當中的...
Airflow 的變數是如何儲存的? Airflow 的變數是使用 Key-Value 的方式儲存,我們可以打開任何一種資料庫工具,例如:DBeaver、Tab...
今天目標 最簡單的 BashOperator 已經使用過了,今天就要使用 PythonOperator 製作多個 Tasks,學習資料間諜 Xcoms 是怎麼在...
小小前言 突然收到私訊說安裝不起來,才發現前面有一些東西沒講清楚,還是建議大家直接 create 在 ~/airflow,然後虛擬環境也放在裡面,day3 的安...
我將 Airflow 遇到的情況說明給作者,大意大概是我在 Airflow 經常發現有 NewConnectionError 這個問題,而且回應時間大約是 2...
我進行大量測試之後,發現這個查詢的速度相當地慢,有一次我將 airflow 設計每分鐘都跑(但實際上會等上一個排程跑完才會跑下一個,一個排程跑相當地久,retr...
在前兩天陸續介紹了 Airflow 如何進行參數傳遞的主題,以及 XCom 的設計及使用方法。今天接續著參數的話題來談談 Airflow Variable 及...
又回到最初的 Day3 還記得我們開啟了 http://localhost:8080/ 了嗎?忘記了沒關係,從頭再來一次~ 還沒安裝的,可以回到 Day3:快...
昨天談到帶入參數執行 DAG,那如果我們那如果我們今天想要從Task 之間彼此傳遞參數呢?那就必須使用到 Airflow 中的 XCom的功能了 。今天我們就來...
在一開始學習程式的時候,覺得使用參數是件像是魔法一般的事。同樣類型的工作,編寫一次程式碼之後,就可以透過不同的參數產生不同的結果。如果有不同的維度的功能需要加入...
經過前幾天的介紹,相信大家應該都有一個基本的概念輪廓,知道如何透過 Airflow DAG 建立所需要的 Data pipeline了。今天來談談 DAG 如何...
昨天說明了 DAG 以及 Task,今天我們繼續說明另一個很重要的 Airflow 元件 -- Relationships 關聯關係。 在我們做的第一個 DAG...
昨天晚成第一個 DAG 之後,是不是覺得有些成就感呢?不過相信也對其中許多概念仍然感覺霧煞煞吧,在今天我們會來說明一下 Airflow 的 DAG 以及 Tas...
安裝完環境之後,想必在讀本系列文章的你,對於開發 Data pipeline 必定是躍躍欲試!如果對 Airflow 有點熟悉的朋友,這幾天可以簡單瀏覽過或是當...