iT邦幫忙

dbt core相關文章
共有 45 則文章
鐵人賽 AI/ ML & Data DAY 16

技術 DAY 16 排程跟文件說的不一樣!談 dbt 與 Airflow 的協作方法

dbt 的模型,如何用 airflow 來做任務排程工作? dbt 官方有提供文件說明: Airflow + dbt Cloud Install the db...

鐵人賽 AI/ ML & Data DAY 15

技術 DAY 15 dbt core 跟文件說的不一樣!談如何利用 Dev Container 統一開發環境,避免版本與環境差異

dbt core setup,可以先照著官方文件按部就班的前進。基本上就是 pip install, authentication 還有一些環境的設定。 在這個...

鐵人賽 AI/ ML & Data DAY 14

技術 DAY 14 dbt core 跟文件說的不一樣!談為何要自己做 dbt core

我們改用 dbt core 了! 理由一:要錢了 先不講一些高大上的價值跟理由,一開始急著要研究這個轉移,最關鍵的還是看到這個方案: 免費的 develope...

鐵人賽 DevOps DAY 13

技術 【Day 13】DBT 經典案例 Jaffle Shop (2) - 轉換步驟指南

前言 從昨天的 jaffle 專案環境建置中,應該可以發現整個專案是在 venv 虛擬環境中運行,但 postgres 卻是在 docker 當中,主要是根據原...

鐵人賽 DevOps DAY 17

技術 【Day 17】用 Astronomer Cosmos 結合 dbt 和 Airflow - 再戰 Jaffle Shop

前言 今天要用最簡單的架構完成 Jaffle Shop 的 PoC(Proof of Concept,概念驗證),主要目的是讓大家能在自己的本機成功運行 Jaf...

鐵人賽 DevOps DAY 16

技術 【Day 16】用 Astronomer Cosmos 結合 dbt 和 Airflow - 專案結構與環境

ㄧ、前言 今天會介紹一下整體專案的結構和環境,接著看下去吧 二、專案結構 {cosmos project} ├── dags │   └── demo_dag....

鐵人賽 DevOps DAY 12

技術 【Day 12】DBT 經典案例 Jaffle Shop (1) - 環境安裝與 model 分層

先決條件 Git Python 3.9 以上 Docker Desktop or Docker Compose 如果不知道 docker 和 dock...

鐵人賽 DevOps DAY 11

技術 【Day 11】DBT 新手村入門:環境設定介紹

先決條件 Python 環境 : 建議使用 Python 3.7 以上的版本 虛擬環境設定 在專案中,我們通常會使用虛擬環境確保每個專案不會互相影響。 以下...

鐵人賽 DevOps DAY 10

技術 【Day 10】DBT 新手村入門:架構說明

前言 我這邊的說明和舉例其實都是 dbt Core 的部分,老實說 dbt Cloud 我也沒有好好玩過,所以先打個預防針,避免差異過大,造成誤導,如果有任何疑...

鐵人賽 DevOps DAY 9

技術 【Day 9】數據轉換最悪の世代:DBT 簡介

DBT 的由來 dbt(data build tool)最初由數據諮詢公司 Fishtown Analytics 創建,目的是解決數據轉換和分析工程中的挑戰。...

鐵人賽 AI & Data DAY 27

技術 開源項目商業化:3 dbt 商業化案例分析(2)

dbt 商業模式轉向 近年來,dbt Labs內部應該是了解到了這個問題,而看似是有意識的轉移dbt Cloud的商業定位。最明顯的應該是他們的商業模式改變,從...

鐵人賽 AI & Data DAY 25

技術 開源項目商業化:1 開源商業模式簡介

開源軟體商業化模式 對許多人來說,“開源軟體”(Open Source Software)可能讓人聯想到網路初期那些充滿熱情的駭客和程式設計師,與這些人對網路烏...

鐵人賽 AI & Data DAY 16

技術 dbt snapshot 介紹 - 怎麼設定? 各種 snapshot 策略有什麼差異? 有什麼要注意的?

dbt snapshot 介紹 - 怎麼設定? 各種 snapshot 策略有什麼差異? 有什麼要注意的? dbt snapshots 是什麼? dbt sna...

鐵人賽 AI & Data DAY 20

技術 dbt 學習資源

看完一系列的文章,還想要持續學習 dbt 知識要去哪裡呢? 官方文件初次學習以及碰到問題會優先查找官方文件,除了他會不時更新資訊,也可以選擇不同 dbt 版...

鐵人賽 AI & Data DAY 21

技術 跑 dbt 常碰到的問題如何 debug

當使用 dbt 遇到 error 怎麼辦呢?以下提供本人常用的途徑 可自己解決去哪 debug? model SQL 寫錯→去 target/compiled/...

鐵人賽 AI & Data DAY 26

技術 DAY 26 - dbt Core 入門 (4) - 用 GitHub Actions 建立排程

在 DAY 07 我們曾討論過在 dbt Cloud 要如何建立定時排程。那麼如果我們用的是 dbt Core,該怎麼做呢? 許多團隊會使用 Airflow,...

鐵人賽 AI & Data DAY 22

技術 DAY 22 - dbt 中階 (9) - 排程規劃 & Tags

昨日 DAY 21 所討論的專案架構,可能也和我們日常更新的排程規劃有關。 依資料來源系統更新 在 DAY 12 時有提過,我們在執行 dbt run 或是...

鐵人賽 AI & Data DAY 20

技術 DAY 20 - dbt 中階 (7) - Exposures 及 Custom Outputs

今天要往更下游走,Exposures 可以理解為 dbt 的 output,也就是說經過 dbt 轉換的資料都被用在哪些地方,例如我們在 Teamson 是以...

鐵人賽 AI & Data DAY 19

技術 DAY 19 - dbt 中階 (6) - Incremental Materializations

先前我們在 DAY 06 說明了兩種基本的 materializations: view 和 table。今天要來介紹另一個 materialization:...

鐵人賽 AI & Data DAY 18

技術 DAY 18 - dbt 中階 (5) - Singular Tests & 儲存 Test 失敗的資料

在 DAY 08 我們示範了最基本的 Generic tests。DAY 16 也提到了除了內建的 Generic Tests 外,也可以額外安裝 Packag...

鐵人賽 AI & Data DAY 17

技術 DAY 17 - dbt 中階 (4) - dbt Graph

如果在 SQL 想要列出所有的 tables, views 或 columns,我們可以使用 information_schema。 若是在作業系統中想要 pr...

鐵人賽 AI & Data DAY 16

技術 DAY 16 - dbt 中階 (3) - dbt Packages

昨天 DAY 15 談的是如何開發 macro。今天要聊的是在 dbt 如何安裝及使用 packages,使用別人寫好的 macro。 dbt Packages...

鐵人賽 AI & Data DAY 15

技術 DAY 15 - dbt 中階 (2) - dbt Macros

在 SQL 資料庫,我們有時會利用 Stored Procedures 及 User-defined Functions,將邏輯寫成可以重複利用的元件。在 db...

鐵人賽 AI & Data DAY 14

技術 DAY 14 - dbt 中階 (1) - dbt Jinja

dbt 的語法不只是 SQL,在 dbt 我們除了單純的 SQL 之外也混用了 Jinja 語法。之前幾天用過的 {{ ref('model_name') }}...

鐵人賽 AI & Data DAY 15

技術 如何使用 dbt incremental 增量更新你的資料?

如何使用 dbt incremental 增量更新你的資料? dbt incremental 定義 dbt 用增量的方式更新你的資料。平常若你沒特別設定,dbt...

鐵人賽 AI & Data DAY 14

技術 data quality 系列 - 如何透過 elementary 通知 dbt test 結果?

elementary 是什麼? 上一篇 “data quality 系列 - 怎麼儲存和查詢 dbt test 結果?” 介紹 dbt test —store_...

鐵人賽 AI & Data DAY 13

技術 data quality 系列 - 怎麼儲存和查詢 dbt test 結果?

dbt artifacts 是什麼? dbt artifacts 是執行 dbt 指令後,像是 dbt run, dbt test 會產生的各種 json 檔,...

鐵人賽 AI & Data DAY 12

技術 data quality 系列 - dbt test 常用的 package: dbt.utils 介紹

dbt package 是什麼? dbt package 如同寫 python 可以匯入開源套件,幫助你節省自己寫 dbt 語法的時間,package 除了上...

鐵人賽 AI & Data DAY 11

技術 data quality 系列 - dbt test 原理、使用方式

dbt test 基本介紹 前面的 dbt 核心功能指令有哪些? 要怎麼使用? 提到 dbt test 的基本功能,用於確保 data transforma...

鐵人賽 AI & Data DAY 8

技術 如何用 dbt 客製化命名 bigquery dataset? dbt custom schema 原理及使用方式

這篇稍微進階,但對你在寫 dbt 對應 data warehouse 命名管理很有幫助 首先我們定義好專有名詞,以dbt 使用 bigquery 為例 定...