iT邦幫忙

dbt相關文章
共有 139 則文章
鐵人賽 AI & Data DAY 23

技術 DAY 23 - dbt Core 入門 (1) - 設定本機環境

相對於 dbt Cloud 為 dbt Labs 提供的 SaaS solution,dbt Core 為 free open source solution,...

鐵人賽 AI & Data DAY 1

技術 DAY 01 - 前言

大家好,我是Stacy,目前任職於 Teamson 的 IT 部門。工作職掌除了軟體開發、ERP support 之外,也包含 data 相關專案。 去年10月...

鐵人賽 AI & Data DAY 30

技術 DAY 30 - Analytics Engineer 是什麼職位 + 我的職涯故事

今天我想要分享我過去擔任 data 相關職位的一點心得。先簡單分享我的職涯故事,後面會介紹 Analytics Engineer 這個職位。 我的職涯故事 2...

鐵人賽 AI & Data DAY 1

技術 為何我們選擇使用 dbt ?

我是 migo data team 的 Data Engineer Bruce ,我們團隊從開始研究 dbt 到實際轉換正式上線已將近一年,之後幾篇將分享 db...

鐵人賽 AI & Data DAY 29

技術 DAY 29 - Taipei dbt Meetup & 在地社群

Taipei dbt Meetup 是由 Karen, Laurence, 和 Allen 帶頭開始的,當時台灣還很少人用過 dbt。因為他們在 Slack 申...

鐵人賽 AI & Data DAY 28

技術 機器學習 挑戰 - Day 7

續上一篇機器學習 挑戰 - Day 6 我想要研究一下可否加入多項其他變數來預測未來價格。 在尋找資料時,意外發現有Pytrend這個API可導入。什麼是 P...

鐵人賽 AI & Data DAY 25

技術 DAY 25 - dbt Core 入門 (3) - dbt Power User

昨天聊了 dbt Core 在本機開發的基本操作,但和 dbt Cloud 相比起來,還是麻煩很多。 今天要來介紹一個常用的 VS Code extension...

鐵人賽 AI & Data DAY 2

技術 DAY 02 - dbt Cloud 準備工作:BigQuery、GitHub

本系列文選用 BigQuery 以及 GitHub。因此在正式開始之前,今天我們要先把帳號及準備好。 BigQuery 建立 Google 帳號 申請 Goo...

鐵人賽 AI & Data DAY 11

技術 data quality 系列 - dbt test 原理、使用方式

dbt test 基本介紹 前面的 dbt 核心功能指令有哪些? 要怎麼使用? 提到 dbt test 的基本功能,用於確保 data transforma...

鐵人賽 DevOps DAY 9

技術 【Day 9】數據轉換最悪の世代:DBT 簡介

DBT 的由來 dbt(data build tool)最初由數據諮詢公司 Fishtown Analytics 創建,目的是解決數據轉換和分析工程中的挑戰。...

鐵人賽 AI & Data DAY 24

技術 DAY 24 - dbt Core 入門 (2) - 在本機開發的基本操作

今天要在聊 dbt Core 如何執行基本的 dbt 操作。在本機的 VS Code 或其他 IDE 開發,與 dbt Cloud 不同,沒有瀏覽器的 GUI...

鐵人賽 AI & Data DAY 29

技術 機器學習 挑戰 - Day 8

續上一篇機器學習 挑戰 - Day 7 scikit-learn - 用於構建分類器的最基本的機器學習算法這是 Python 中最廣為人知的機器學習模組,主要用...

鐵人賽 AI & Data DAY 12

技術 DAY 12 - dbt Cloud 入門 (10) - dbt Commands 小整理

今天,我想將到目前為止提到過的指令,做個小整理,並且重新介紹。 run seed test build docs 另外還有兩個我個人會使用,但和 packa...

鐵人賽 AI & Data DAY 5

技術 DAY 05 - dbt Cloud 入門 (3) - Modularize Our dbt Models

昨天我們在 dbt Cloud 把我們的專案建立起來了,目前只有一個 model: customers。今天的主題 Modularize Our dbt Mod...

鐵人賽 AI & Data DAY 14

技術 DAY 14 - dbt 中階 (1) - dbt Jinja

dbt 的語法不只是 SQL,在 dbt 我們除了單純的 SQL 之外也混用了 Jinja 語法。之前幾天用過的 {{ ref('model_name') }}...

鐵人賽 AI & Data DAY 4

技術 DAY 04 - dbt Cloud 入門 (2) - 初始化專案、建立 Model

昨天,我們申請了 dbt Cloud 的帳號,並建立了專案。 dbt Cloud 的功能主要分為 Develop(開發) 和 Deploy(佈署)兩塊。這幾天我...

鐵人賽 AI & Data DAY 14

技術 資料處理 Python Pandas 好用的function - Part 2

繼續上一章資料處理 Python Pandas 好用的function - Part 1 #1. pd.to_datetime(df['Date']) /pd....

鐵人賽 AI & Data DAY 28

技術 DAY 28 - dbt官方文件、影片、學習資源

附上一些我常用的官方資源。 除了官網之外,也推薦: 加入 Slack 社群:目前有 50000+ 人,任何資料庫、BI 工具、在地社群(城市)都可以有一個自己...

鐵人賽 AI & Data DAY 20

技術 dbt 學習資源

看完一系列的文章,還想要持續學習 dbt 知識要去哪裡呢? 官方文件初次學習以及碰到問題會優先查找官方文件,除了他會不時更新資訊,也可以選擇不同 dbt 版...

鐵人賽 AI & Data DAY 13

技術 DAY 13 - dbt Cloud 入門 (11) - dbt Cloud IDE 介面及功能介紹

雖然我們已經在 dbt Cloud 玩了好幾天,但今天才要正式介紹 Cloud IDE 的介面。 快捷鍵 一般 Ctrl + P: 開啟 Command...

鐵人賽 AI & Data DAY 3

技術 DAY 03 - dbt Cloud 入門 (1) - 申請帳號、建立專案

今天要來建立一個免費的 dbt Cloud 帳號,並連結昨天所建立的 BigQuery 以及 GitHub repo。這些步驟大部分都是可以重複操作的,建壞了可...

鐵人賽 AI & Data DAY 25

技術 開源項目商業化:1 開源商業模式簡介

開源軟體商業化模式 對許多人來說,“開源軟體”(Open Source Software)可能讓人聯想到網路初期那些充滿熱情的駭客和程式設計師,與這些人對網路烏...

鐵人賽 AI & Data DAY 16

技術 dbt snapshot 介紹 - 怎麼設定? 各種 snapshot 策略有什麼差異? 有什麼要注意的?

dbt snapshot 介紹 - 怎麼設定? 各種 snapshot 策略有什麼差異? 有什麼要注意的? dbt snapshots 是什麼? dbt sna...

鐵人賽 AI & Data DAY 26

技術 開源項目商業化:2 dbt 商業化案例分析

dbt Cloud vs Core 對於那些不熟悉 dbt 的人來說,它是「data build tool」的縮寫。顧名思義,dbt的主要使用案例是架構資料管道...

鐵人賽 AI & Data DAY 15

技術 DAY 15 - dbt 中階 (2) - dbt Macros

在 SQL 資料庫,我們有時會利用 Stored Procedures 及 User-defined Functions,將邏輯寫成可以重複利用的元件。在 db...

鐵人賽 AI & Data DAY 22

技術 DAY 22 - dbt 中階 (9) - 排程規劃 & Tags

昨日 DAY 21 所討論的專案架構,可能也和我們日常更新的排程規劃有關。 依資料來源系統更新 在 DAY 12 時有提過,我們在執行 dbt run 或是...

鐵人賽 AI & Data DAY 4

技術 開始使用 dbt - Day 4

為何選擇 dbt? 在 Day 3, 我介紹一開始如何選擇 data stack, v1~v2.2,因為我只會試算表跟 BigQuery. 但這樣已經足夠完成我...

鐵人賽 AI & Data DAY 19

技術 DAY 19 - dbt 中階 (6) - Incremental Materializations

先前我們在 DAY 06 說明了兩種基本的 materializations: view 和 table。今天要來介紹另一個 materialization:...

鐵人賽 DevOps DAY 23

技術 【Day 23】Data Pipeline 測試 - SQL linter feat. SQLFluff

基本介紹 SQLFluff 是一個開源的 SQL 語法檢查和格式化工具(Linter),主要是確保 SQL 語法遵循特定樣式規範,團隊開發過程中才能保有內部的...

鐵人賽 AI & Data DAY 6

技術 DAY 06 - dbt Cloud 入門 (4) - dbt run、materializations

前兩天建立的 model: customers 以顧客主檔為主,關聯 orders,將每位顧客的第一次消費日期、最近消費日期、總訂單數量,合為一個查詢。 那麼,...