iT邦幫忙

dbt相關文章
共有 139 則文章
鐵人賽 AI & Data DAY 22

技術 Reverse ETL & C-CDP:活化你的資料倉庫 Part 4

配合rETL和C-CDP的激活層模型設計 之前提到了資料激活層(Data Activation Layer)在現代資料棧(Modern Data Stack)裡...

鐵人賽 AI & Data DAY 24

技術 機器學習 挑戰 - Day 3

續上一篇機器學習 挑戰 - Day 2,我們今天繼續詳細研究一下如何套用 ARIMA 來預測BTC的價格。 Auto-Regressive Integrated...

鐵人賽 AI & Data DAY 23

技術 機器學習 挑戰 - Day 2

續上一篇機器學習 挑戰 - Day 1,我們今天要來詳細研究一下如何套用machine learning module 來預測BTC的價格。 首先想要研究的是A...

鐵人賽 AI & Data DAY 22

技術 機器學習 挑戰 - Day 1

首先,我想將股票數據導入我的程序並分析其歷史趨勢。 import yfinance as yf import datetime as dt import num...

鐵人賽 AI & Data DAY 21

技術 隨筆:為什麼VLOOKUP“已排序”參數預設是0? Part 2

VLOOKUP的歷史 事實上,VLOOKUP的歷史早於EXCEL。1983年Lotus 1-2-3首次發行,其中包括了VLOOKUP函數,而這甚至不是第一個Sp...

鐵人賽 AI & Data DAY 22

技術 Outcome Map, 想達到的理想世界 - Day 22

昨天 Day 21 我們討論如何讓 Data 對商業價值做出貢獻,承續這個話題,今天要討論的是我目前非常感興趣 ❤️‍🔥 的議題:the outcome map...

鐵人賽 AI & Data DAY 21

技術 如何讓 Data 可對商業價值有貢獻 - Day 21

在 Day 9,我期待 Data Team 可以對商業價值有貢獻。今天這篇就來討論,要怎麼做到?有哪些方法可以嘗試。 用資料儀表板來吸引注意 🎯 前幾篇文章,D...

鐵人賽 AI & Data DAY 20

技術 LLM 和機器學習的介紹-Part 5

續上一篇LLM 和機器學習的介紹-Part 4 ,我們繼續討論一些數據模型(data models)。 實體-關係模型 (Entity Relationship...

鐵人賽 AI & Data DAY 19

技術 Reverse ETL & C-CDP:活化你的資料倉庫 Part 3

rETL和C-CDP應用案例 相對舊式的CDP,這類工具的特徵是: 不受CDP預設的功能限制,而可以利用資料倉庫來簡單實現定制化邏輯 通過預設的資料鏈接功能(...

鐵人賽 AI & Data DAY 20

技術 何時該調整 Data Team 架構 - Day 20

回顧一下這系列文,從 Day 10 開始介紹如何在公司內組織 Data Team. 由於商業市場真是瞬息萬變,我想來聊一下何時要重新檢視 Data Team 架...

鐵人賽 AI & Data DAY 18

技術 Reverse ETL & C-CDP:活化你的資料倉庫 Part 2

資料激活層(Data Activation Layer) 如同之前提到的,rETL的主要功能就是將資料倉庫內整合處理完的資料同步到其他系統、工具上。從一個MDS...

鐵人賽 AI & Data DAY 19

技術 LLM 和機器學習的介紹-Part 4

續上一篇LLM 和機器學習的介紹-Part 3,我們繼續討論一些數據模型(data models) 牛頓冷卻定律 Newton's Law of Cooling...

鐵人賽 AI & Data DAY 19

技術 加入主管的行列 - Day 19

這篇是從 Day 11 開始討論如何提升資料素養的最後一篇。我們來聊聊如何增加影響力。Lean in! 在領導層佔個席次🪑,可以讓你的影響力擴大。 領導者 ≠...

鐵人賽 AI & Data DAY 17

技術 Reverse ETL & C-CDP:活化你的資料倉庫 Part 1

Reverse ETL & C-CDP:概念與定位 Reverse ETL(倒向ETL?感覺很奇怪)和Composable CDP(可組件式客戶數據平台...

鐵人賽 AI & Data DAY 18

技術 LLM 和機器學習的介紹-Part 3

續上一篇LLM 和機器學習的介紹-Part 2,我們繼續討論一些數據建模、LLM和機器學習的示例。 3. 回歸分析 (Regression analysis)回...

鐵人賽 AI & Data DAY 17

技術 LLM 和機器學習的介紹-Part 2

續上一篇LLM 和機器學習的介紹-Part 1,我想更深入地介紹一些數據建模、LLM和機器學習的示例。 統計概念大數據以及machine learning的基礎...

鐵人賽 AI & Data DAY 18

技術 製造小勝利以利發展 資料文化 - Day 18

記得在 Day 11, 我們談到如何提升資料素養,也提供幾個實踐方法。這是個漸進式的過程,能做的都做了後,觀察資料素養提升的狀態,很難馬上有收穫。 強化理論 👍...

鐵人賽 AI & Data DAY 17

技術 信任是合作的基石 - Day 17

從 Day 7開始討論 Data 團隊及公司。今天想來討論一下建立 Data Team 的基礎:信任。有信任後,做事就會比較順利,能讓 Day 16 提到的組織...

鐵人賽 AI & Data DAY 16

技術 如何將組織轉型為 Data-Informed?- Day 16

有天我突然發現,原來希望大家提升資料素養是要求大家改變過去的行為。當我們提供自動報表時,就是讓他們不再花時間手工整理資料,改為直接看報表。當我們開始協作,也開始...

鐵人賽 AI & Data DAY 15

技術 Snowflake vs Databricks:雲資料平台的生死冤家 Part 2

兩大資料巨頭的正面交鋒 如上篇所提到的,雖然Snowflake和Databricks是兩家雲端資料倉庫的領導者,但他們有著截然不同的文化。Databricks由...

鐵人賽 AI & Data DAY 15

技術 身為資料人,如何跟其他人協作 - Day 15

上一篇文章 Day 14, 我鼓勵各位不只停留在自動化,提供更多價值。記得在 Day 9 我期待 Data Team 應對商業價值有貢獻嗎?今天想來討論一下,哪...

鐵人賽 AI & Data DAY 14

技術 善用 BI 自動化 - Day 14

在 Day 13 文章,我建議不要當 Data ATM 而是打造一個,但也不是從此就幸福快樂 👸。提供 BI 工具後,還需要提供教學、使用範例以及顧問服務。這後...

鐵人賽 AI & Data DAY 13

技術 用dbt建構Data Vault 2.0:8 DV使用狀況、總結

DV 使用狀況、定位 在這一篇文裡有提到過,在傳統用法裡DV基本上只會用在整合資料層(Integration Layer),而一般狀況下不會讓一般使用者(DA、...

鐵人賽 AI & Data DAY 16

技術 LLM 和機器學習的介紹-Part 1

人工智慧(AI)最近在科技界成為熱門詞彙,每個人都想參與AI領域。我想分享一下我對AI基礎的學習心得,包括:數據建模、語言學習模型(LLM)和機器學習(ML)的...

鐵人賽 AI & Data DAY 12

技術 用dbt建構Data Vault 2.0:7 DV使用方法

DV 常見使用模式 由於DV 2.0 設計相對的複雜,使用起來跟一般資料倉儲上會有一些不同。這裡特別強調一些常用的使用模式與其中奧妙。以下的案例都是基於之前快速...

鐵人賽 AI & Data DAY 13

技術 不要當 Data ATM 🏧 - Day 13

在 Day 10, 我提到 Data Team 多半從中央集權開始。我們都希望導入 modern data stack, 系統化的分析方式以及專業的資料諮詢服務...

鐵人賽 AI & Data DAY 12

技術 在計算指標之前,先確保定義一致 - Day 12

經過前篇幾篇文章說明架構 Data Team, 到底如何展現 Data Team 的實力,Day 11 說到的提升整體公司的資料素養 ,讓我們趕快開始這一篇。...

鐵人賽 AI & Data DAY 16

技術 dbt snapshot 介紹 - 怎麼設定? 各種 snapshot 策略有什麼差異? 有什麼要注意的?

dbt snapshot 介紹 - 怎麼設定? 各種 snapshot 策略有什麼差異? 有什麼要注意的? dbt snapshots 是什麼? dbt sna...

鐵人賽 AI & Data DAY 11

技術 用dbt建構Data Vault 2.0:6 快速設定指南 Part 5

raw_vault層:完成DV 2.0資料模型 疊加物化(incremental materialization)和唯一性約束 跟之前兩層不同的地方是,這層的設...

鐵人賽 AI & Data DAY 20

技術 dbt 學習資源

看完一系列的文章,還想要持續學習 dbt 知識要去哪裡呢? 官方文件初次學習以及碰到問題會優先查找官方文件,除了他會不時更新資訊,也可以選擇不同 dbt 版...