相對於 dbt Cloud 為 dbt Labs 提供的 SaaS solution,dbt Core 為 free open source solution,...
大家好,我是Stacy,目前任職於 Teamson 的 IT 部門。工作職掌除了軟體開發、ERP support 之外,也包含 data 相關專案。 去年10月...
今天我想要分享我過去擔任 data 相關職位的一點心得。先簡單分享我的職涯故事,後面會介紹 Analytics Engineer 這個職位。 我的職涯故事 2...
我是 migo data team 的 Data Engineer Bruce ,我們團隊從開始研究 dbt 到實際轉換正式上線已將近一年,之後幾篇將分享 db...
Taipei dbt Meetup 是由 Karen, Laurence, 和 Allen 帶頭開始的,當時台灣還很少人用過 dbt。因為他們在 Slack 申...
續上一篇機器學習 挑戰 - Day 6 我想要研究一下可否加入多項其他變數來預測未來價格。 在尋找資料時,意外發現有Pytrend這個API可導入。什麼是 P...
昨天聊了 dbt Core 在本機開發的基本操作,但和 dbt Cloud 相比起來,還是麻煩很多。 今天要來介紹一個常用的 VS Code extension...
本系列文選用 BigQuery 以及 GitHub。因此在正式開始之前,今天我們要先把帳號及準備好。 BigQuery 建立 Google 帳號 申請 Goo...
dbt test 基本介紹 前面的 dbt 核心功能指令有哪些? 要怎麼使用? 提到 dbt test 的基本功能,用於確保 data transforma...
DBT 的由來 dbt(data build tool)最初由數據諮詢公司 Fishtown Analytics 創建,目的是解決數據轉換和分析工程中的挑戰。...
今天要在聊 dbt Core 如何執行基本的 dbt 操作。在本機的 VS Code 或其他 IDE 開發,與 dbt Cloud 不同,沒有瀏覽器的 GUI...
續上一篇機器學習 挑戰 - Day 7 scikit-learn - 用於構建分類器的最基本的機器學習算法這是 Python 中最廣為人知的機器學習模組,主要用...
今天,我想將到目前為止提到過的指令,做個小整理,並且重新介紹。 run seed test build docs 另外還有兩個我個人會使用,但和 packa...
昨天我們在 dbt Cloud 把我們的專案建立起來了,目前只有一個 model: customers。今天的主題 Modularize Our dbt Mod...
dbt 的語法不只是 SQL,在 dbt 我們除了單純的 SQL 之外也混用了 Jinja 語法。之前幾天用過的 {{ ref('model_name') }}...
昨天,我們申請了 dbt Cloud 的帳號,並建立了專案。 dbt Cloud 的功能主要分為 Develop(開發) 和 Deploy(佈署)兩塊。這幾天我...
繼續上一章資料處理 Python Pandas 好用的function - Part 1 #1. pd.to_datetime(df['Date']) /pd....
附上一些我常用的官方資源。 除了官網之外,也推薦: 加入 Slack 社群:目前有 50000+ 人,任何資料庫、BI 工具、在地社群(城市)都可以有一個自己...
看完一系列的文章,還想要持續學習 dbt 知識要去哪裡呢? 官方文件初次學習以及碰到問題會優先查找官方文件,除了他會不時更新資訊,也可以選擇不同 dbt 版...
雖然我們已經在 dbt Cloud 玩了好幾天,但今天才要正式介紹 Cloud IDE 的介面。 快捷鍵 一般 Ctrl + P: 開啟 Command...
今天要來建立一個免費的 dbt Cloud 帳號,並連結昨天所建立的 BigQuery 以及 GitHub repo。這些步驟大部分都是可以重複操作的,建壞了可...
開源軟體商業化模式 對許多人來說,“開源軟體”(Open Source Software)可能讓人聯想到網路初期那些充滿熱情的駭客和程式設計師,與這些人對網路烏...
dbt snapshot 介紹 - 怎麼設定? 各種 snapshot 策略有什麼差異? 有什麼要注意的? dbt snapshots 是什麼? dbt sna...
dbt Cloud vs Core 對於那些不熟悉 dbt 的人來說,它是「data build tool」的縮寫。顧名思義,dbt的主要使用案例是架構資料管道...
在 SQL 資料庫,我們有時會利用 Stored Procedures 及 User-defined Functions,將邏輯寫成可以重複利用的元件。在 db...
昨日 DAY 21 所討論的專案架構,可能也和我們日常更新的排程規劃有關。 依資料來源系統更新 在 DAY 12 時有提過,我們在執行 dbt run 或是...
為何選擇 dbt? 在 Day 3, 我介紹一開始如何選擇 data stack, v1~v2.2,因為我只會試算表跟 BigQuery. 但這樣已經足夠完成我...
先前我們在 DAY 06 說明了兩種基本的 materializations: view 和 table。今天要來介紹另一個 materialization:...
基本介紹 SQLFluff 是一個開源的 SQL 語法檢查和格式化工具(Linter),主要是確保 SQL 語法遵循特定樣式規範,團隊開發過程中才能保有內部的...
前兩天建立的 model: customers 以顧客主檔為主,關聯 orders,將每位顧客的第一次消費日期、最近消費日期、總訂單數量,合為一個查詢。 那麼,...