大家好,我是Stacy,目前任職於 Teamson 的 IT 部門。工作職掌除了軟體開發、ERP support 之外,也包含 data 相關專案。 去年10月...
本系列文選用 BigQuery 以及 GitHub。因此在正式開始之前,今天我們要先把帳號及準備好。 BigQuery 建立 Google 帳號 申請 Goo...
昨天我們在 dbt Cloud 把我們的專案建立起來了,目前只有一個 model: customers。今天的主題 Modularize Our dbt Mod...
昨天,我們申請了 dbt Cloud 的帳號,並建立了專案。 dbt Cloud 的功能主要分為 Develop(開發) 和 Deploy(佈署)兩塊。這幾天我...
前兩天建立的 model: customers 以顧客主檔為主,關聯 orders,將每位顧客的第一次消費日期、最近消費日期、總訂單數量,合為一個查詢。 那麼,...
今天要來建立一個免費的 dbt Cloud 帳號,並連結昨天所建立的 BigQuery 以及 GitHub repo。這些步驟大部分都是可以重複操作的,建壞了可...
dbt 的語法不只是 SQL,在 dbt 我們除了單純的 SQL 之外也混用了 Jinja 語法。之前幾天用過的 {{ ref('model_name') }}...
現在我們要開始用 dbt 了,看官方文件介紹後可以發現 dbt 產品有分 dbt Cloud 和 dbt Core,dbt Cloud 洋洋灑灑介紹9行,還有一...
今日及明日的主題是 dbt documentation。 常聽到許多 data 部門,由於多人分工,團隊之間資訊難以流通。這時候,就會想要找工具、製作文件。一個...
今天,我想將到目前為止提到過的指令,做個小整理,並且重新介紹。 run seed test build docs 另外還有兩個我個人會使用,但和 packa...
今天的主題是 tests。dbt 有很多種 test 的方法,今天只講最基本內建的 generic tests (舊名 schema tests),只要在 ya...
dbt Cloud & dbt Core 怎麼選擇? 提到 dbt Core 須自行建置 architecture,那我要怎麼開始呢? 先回到 dbt...
先前我們在 DAY 06 說明了兩種基本的 materializations: view 和 table。今天要來介紹另一個 materialization:...
dbt Seeds 是一個可以把手動維護的 mapping table 加入 dbt 專案/流程的好東西。 case when 或者 mapping tabl...
今天要往更下游走,Exposures 可以理解為 dbt 的 output,也就是說經過 dbt 轉換的資料都被用在哪些地方,例如我們在 Teamson 是以...
在 SQL 資料庫,我們有時會利用 Stored Procedures 及 User-defined Functions,將邏輯寫成可以重複利用的元件。在 db...
在 DAY 07 我們曾討論過在 dbt Cloud 要如何建立定時排程。那麼如果我們用的是 dbt Core,該怎麼做呢? 許多團隊會使用 Airflow,...
如果在 SQL 想要列出所有的 tables, views 或 columns,我們可以使用 information_schema。 若是在作業系統中想要 pr...
前幾天我們聊的是 Develop,今天我們要暫時進入 Deploy 的部份。 在開始之前,務必把前幾天的異動提交並 merge to the main bra...
昨天 DAY 15 談的是如何開發 macro。今天要聊的是在 dbt 如何安裝及使用 packages,使用別人寫好的 macro。 dbt Packages...
昨日 DAY 21 所討論的專案架構,可能也和我們日常更新的排程規劃有關。 依資料來源系統更新 在 DAY 12 時有提過,我們在執行 dbt run 或是...
dbt 商業模式轉向 近年來,dbt Labs內部應該是了解到了這個問題,而看似是有意識的轉移dbt Cloud的商業定位。最明顯的應該是他們的商業模式改變,從...
雖然我們已經在 dbt Cloud 玩了好幾天,但今天才要正式介紹 Cloud IDE 的介面。 快捷鍵 一般 Ctrl + P: 開啟 Command...
昨天我們示範了如何產生及檢視文件。今天除了介紹文件裡面的內容,也會說明如何加入 model 以及欄位的說明。 開發區和正式區的 Documentation,版面...
開源軟體商業化模式 對許多人來說,“開源軟體”(Open Source Software)可能讓人聯想到網路初期那些充滿熱情的駭客和程式設計師,與這些人對網路烏...
在 DAY 08 我們示範了最基本的 Generic tests。DAY 16 也提到了除了內建的 Generic Tests 外,也可以額外安裝 Packag...
DBT 的由來 dbt(data build tool)最初由數據諮詢公司 Fishtown Analytics 創建,目的是解決數據轉換和分析工程中的挑戰。...
我們改用 dbt core 了! 理由一:要錢了 先不講一些高大上的價值跟理由,一開始急著要研究這個轉移,最關鍵的還是看到這個方案: 免費的 develope...
dbt 的模型,如何用 airflow 來做任務排程工作? dbt 官方有提供文件說明: Airflow + dbt Cloud Install the db...