從實用的角度討論Modern Data Stack(好像是翻現代資料棧?)的設計與應用,也分享一些個人與公司在實作應用MDS的一些數據與雲端轉型的案例!
raw_vault層:完成DV 2.0資料模型 疊加物化(incremental materialization)和唯一性約束 跟之前兩層不同的地方是,這層的設...
DV 常見使用模式 由於DV 2.0 設計相對的複雜,使用起來跟一般資料倉儲上會有一些不同。這裡特別強調一些常用的使用模式與其中奧妙。以下的案例都是基於之前快速...
DV 使用狀況、定位 在這一篇文裡有提到過,在傳統用法裡DV基本上只會用在整合資料層(Integration Layer),而一般狀況下不會讓一般使用者(DA、...
雲資料平台的後起之秀 Snowflake與Databricks分別是在2012和2013年創立的公司。雖然相對Amazon、Google、Microsoft這些...
兩大資料巨頭的正面交鋒 如上篇所提到的,雖然Snowflake和Databricks是兩家雲端資料倉庫的領導者,但他們有著截然不同的文化。Databricks由...
一山不容二虎? 總的來說,兩家公司都在積極發展自己的平台,而產品功能上正趨於融合到彼此的領域。而誰將成為雲端數據倉庫之霸,目前還很難說。兩家公司都各有優勢,並且...
Reverse ETL & C-CDP:概念與定位 Reverse ETL(倒向ETL?感覺很奇怪)和Composable CDP(可組件式客戶數據平台...
資料激活層(Data Activation Layer) 如同之前提到的,rETL的主要功能就是將資料倉庫內整合處理完的資料同步到其他系統、工具上。從一個MDS...
rETL和C-CDP應用案例 相對舊式的CDP,這類工具的特徵是: 不受CDP預設的功能限制,而可以利用資料倉庫來簡單實現定制化邏輯 通過預設的資料鏈接功能(...
VLOOKUP函數 我想任何資料工作者,甚至任何現代坐辦公室的人,都應該用過GSheet、Excel這類Spreadsheet工具。而(至少我個人認為 :P)會...