配合rETL和C-CDP的激活層模型設計 之前提到了資料激活層(Data Activation Layer)在現代資料棧(Modern Data Stack)裡...
續上一篇機器學習 挑戰 - Day 2,我們今天繼續詳細研究一下如何套用 ARIMA 來預測BTC的價格。 Auto-Regressive Integrated...
續上一篇機器學習 挑戰 - Day 1,我們今天要來詳細研究一下如何套用machine learning module 來預測BTC的價格。 首先想要研究的是A...
首先,我想將股票數據導入我的程序並分析其歷史趨勢。 import yfinance as yf import datetime as dt import num...
VLOOKUP的歷史 事實上,VLOOKUP的歷史早於EXCEL。1983年Lotus 1-2-3首次發行,其中包括了VLOOKUP函數,而這甚至不是第一個Sp...
昨天 Day 21 我們討論如何讓 Data 對商業價值做出貢獻,承續這個話題,今天要討論的是我目前非常感興趣 ❤️🔥 的議題:the outcome map...
在 Day 9,我期待 Data Team 可以對商業價值有貢獻。今天這篇就來討論,要怎麼做到?有哪些方法可以嘗試。 用資料儀表板來吸引注意 🎯 前幾篇文章,D...
續上一篇LLM 和機器學習的介紹-Part 4 ,我們繼續討論一些數據模型(data models)。 實體-關係模型 (Entity Relationship...
rETL和C-CDP應用案例 相對舊式的CDP,這類工具的特徵是: 不受CDP預設的功能限制,而可以利用資料倉庫來簡單實現定制化邏輯 通過預設的資料鏈接功能(...
回顧一下這系列文,從 Day 10 開始介紹如何在公司內組織 Data Team. 由於商業市場真是瞬息萬變,我想來聊一下何時要重新檢視 Data Team 架...
資料激活層(Data Activation Layer) 如同之前提到的,rETL的主要功能就是將資料倉庫內整合處理完的資料同步到其他系統、工具上。從一個MDS...
續上一篇LLM 和機器學習的介紹-Part 3,我們繼續討論一些數據模型(data models) 牛頓冷卻定律 Newton's Law of Cooling...
這篇是從 Day 11 開始討論如何提升資料素養的最後一篇。我們來聊聊如何增加影響力。Lean in! 在領導層佔個席次🪑,可以讓你的影響力擴大。 領導者 ≠...
Reverse ETL & C-CDP:概念與定位 Reverse ETL(倒向ETL?感覺很奇怪)和Composable CDP(可組件式客戶數據平台...
續上一篇LLM 和機器學習的介紹-Part 2,我們繼續討論一些數據建模、LLM和機器學習的示例。 3. 回歸分析 (Regression analysis)回...
續上一篇LLM 和機器學習的介紹-Part 1,我想更深入地介紹一些數據建模、LLM和機器學習的示例。 統計概念大數據以及machine learning的基礎...
記得在 Day 11, 我們談到如何提升資料素養,也提供幾個實踐方法。這是個漸進式的過程,能做的都做了後,觀察資料素養提升的狀態,很難馬上有收穫。 強化理論 👍...
從 Day 7開始討論 Data 團隊及公司。今天想來討論一下建立 Data Team 的基礎:信任。有信任後,做事就會比較順利,能讓 Day 16 提到的組織...
有天我突然發現,原來希望大家提升資料素養是要求大家改變過去的行為。當我們提供自動報表時,就是讓他們不再花時間手工整理資料,改為直接看報表。當我們開始協作,也開始...
兩大資料巨頭的正面交鋒 如上篇所提到的,雖然Snowflake和Databricks是兩家雲端資料倉庫的領導者,但他們有著截然不同的文化。Databricks由...
上一篇文章 Day 14, 我鼓勵各位不只停留在自動化,提供更多價值。記得在 Day 9 我期待 Data Team 應對商業價值有貢獻嗎?今天想來討論一下,哪...
在 Day 13 文章,我建議不要當 Data ATM 而是打造一個,但也不是從此就幸福快樂 👸。提供 BI 工具後,還需要提供教學、使用範例以及顧問服務。這後...
DV 使用狀況、定位 在這一篇文裡有提到過,在傳統用法裡DV基本上只會用在整合資料層(Integration Layer),而一般狀況下不會讓一般使用者(DA、...
人工智慧(AI)最近在科技界成為熱門詞彙,每個人都想參與AI領域。我想分享一下我對AI基礎的學習心得,包括:數據建模、語言學習模型(LLM)和機器學習(ML)的...
DV 常見使用模式 由於DV 2.0 設計相對的複雜,使用起來跟一般資料倉儲上會有一些不同。這裡特別強調一些常用的使用模式與其中奧妙。以下的案例都是基於之前快速...
在 Day 10, 我提到 Data Team 多半從中央集權開始。我們都希望導入 modern data stack, 系統化的分析方式以及專業的資料諮詢服務...
經過前篇幾篇文章說明架構 Data Team, 到底如何展現 Data Team 的實力,Day 11 說到的提升整體公司的資料素養 ,讓我們趕快開始這一篇。...
dbt snapshot 介紹 - 怎麼設定? 各種 snapshot 策略有什麼差異? 有什麼要注意的? dbt snapshots 是什麼? dbt sna...
raw_vault層:完成DV 2.0資料模型 疊加物化(incremental materialization)和唯一性約束 跟之前兩層不同的地方是,這層的設...
看完一系列的文章,還想要持續學習 dbt 知識要去哪裡呢? 官方文件初次學習以及碰到問題會優先查找官方文件,除了他會不時更新資訊,也可以選擇不同 dbt 版...