什麼是 Docker Compose Compose 是組合或組成的意思,Docker Compose 就是代表組合多個 Docker 容器,可以直接用 YAM...
昨天說明了 DAG 以及 Task,今天我們繼續說明另一個很重要的 Airflow 元件 -- Relationships 關聯關係。 在我們做的第一個 DAG...
安裝 Docker Docker Desktop 下載 https://www.docker.com/products/docker-desktop/ Doc...
昨天晚成第一個 DAG 之後,是不是覺得有些成就感呢?不過相信也對其中許多概念仍然感覺霧煞煞吧,在今天我們會來說明一下 Airflow 的 DAG 以及 Tas...
終於來到最後一篇了,我們前面寫了這麼多程式跟測試,那要什麼時候執行測試? 理論上,你隨時都應該做。特別是 merge branch 回 develop 的時候。...
前言 之前很多鐵人賽都有談過 docker ,想要很完整系統性的學 docker,都可以參考下方連結:1. 30 天與鯨魚先生做好朋友2. 那些關於 dock...
TDD(測試驅動開發 Test Driven Develop)是一種軟體開發方法,它要求在編寫任何程式碼之前,先撰寫測試案例。這樣可以確保程式碼的品質和可靠性,...
安裝完環境之後,想必在讀本系列文章的你,對於開發 Data pipeline 必定是躍躍欲試!如果對 Airflow 有點熟悉的朋友,這幾天可以簡單瀏覽過或是當...
有鑒於昨天的實作部分,有朋友反應好像講不清楚,一下子就給 code,今天還是再針對每一個 part 來詳細說明~ 一、術式順轉·蒼 - 整體邏輯架構 通常在寫大...
我們前面講了 Airflow 跟 Flink 的一些基礎觀念跟開發,現在讓我們整理一下兩邊的差異。 首先,Airflow 是一個優秀的排程管理工具,它有自己的...
剛開始學習程式的時候,對我來說最讓我感到挫折的就是環境安裝的問題。由於許多背景知識的不足,以及系統版本和程式版本非常的複雜,總是需要花上許多時間跟精力進行安裝及...
前言 2020 年 12 月發布的 Apache Airflow 2.0,其中很重要的新功能就是 Taskflow API,可以讓我們更簡潔的撰寫 Airflo...
雖然已經到尾聲了,但我發現有個重要的 Airflow 元件沒有提到,所以必須來補這篇。 Airflow XCom 是一種在不同的 task 之間傳遞資料的機制,...
今天也是在日本旅遊與鐵人競賽當中交錯,實在是十分有趣的經驗!今天看到日本許多有設計感的建築,覺得令人歎為觀止,我想除了設計的靈感之外,也需要強大的工程技術能力來...
TaskGroup 簡介 TaskGroup 是一種在 Airflow 中用來組織和管理多個 Task 的方法,透過將任務分類成不同群組,讓我們 DAG 當中的...
Airflow 的變數是如何儲存的? Airflow 的變數是使用 Key-Value 的方式儲存,我們可以打開任何一種資料庫工具,例如:DBeaver、Tab...
今天目標 最簡單的 BashOperator 已經使用過了,今天就要使用 PythonOperator 製作多個 Tasks,學習資料間諜 Xcoms 是怎麼在...
小小前言 突然收到私訊說安裝不起來,才發現前面有一些東西沒講清楚,還是建議大家直接 create 在 ~/airflow,然後虛擬環境也放在裡面,day3 的安...
又回到最初的 Day3 還記得我們開啟了 http://localhost:8080/ 了嗎?忘記了沒關係,從頭再來一次~ 還沒安裝的,可以回到 Day3:快...
Airflow 的基礎名詞 Hooks:鉤子/ 接口 Hooks 可以和第三方系統互動,第三方系統是什麼?就是非官方和運營方開發的系統,例如我們要把 Airfl...
Workflow before Airflow 討論 Airflow 前,先問問大家有聽過 Workflow 嗎?可以翻作工作流,在資料領域,也可以稱作 Dat...
Step1: 安裝Ubuntu環境 如果透過 VirtualBox VM 就會一點都不快樂了,所以只要安裝 Ubuntu 的終端機(terminal) 1....
從前從前 2015 年,Airbnb 發展迅速,數據量大幅提升,每天必須管理數個資料流來完成自動化,數據管控遇到困難,當時身為 Airbnb 的資料工程師 Ma...
Who am I 打給厚~ 哇係 Shawn,目前是一名資料工程師,也可以叫做數據水管工,工作內容就是串接各種 API 和資料庫,然後想辦法當一名稱職的水管工,...
哈囉大家好,今年又不小心衝動再一次報名了鐵人賽了!這次寫的主題和上次的主題有很大的轉變,主要是因為自己因緣際會下轉換了領域,進入了 Data Engineeri...
動機 相信數位時代的各位都已經有申請過載具條碼,每天消費紀錄都會存到發票 APP,你會發現詳細記載購買項目、商家名稱、商家地址等等,但有想過這些 APP 怎麼做...
這篇來講一下在測試的時候遇到的問題,主要是 package 的 import issue 一般來說,我們開發的 dag 都會放在 project 下的 /dag...
測試講了三天,應該可以證明我至少表面上很注重測試對吧? 回來正題,在開發 Airflow 單元測試的時候,有幾件事需要注意的。 Variables Variab...
上一篇講了一些測試心得,這篇就來講個偏整合性的測試方法吧。 CMD 測試 這是官方提供的方法,用起來也很簡單: # command layout: comman...
如果前面的鐵人賽每篇你都看過的話(希望你有),可能會發現我常常提到「測試」,或是說「為了測試」。測試是非常重要的,但這裡我就先不細談,有興趣的人歡迎看看我朋友...