iT邦幫忙

2023 iThome 鐵人賽

DAY 9
2

今天狀況較差,我先從 dbt 抽離出來,談一些對資料工程、資料分析的敘述;

data 作為一種資產(data as an asset),我覺得慢慢開始脫離成本單位,自己也成為一種業務單位;

換句話說,從過去「資料分析好,業務部門評估後採納」這種支援、後勤的性質,data 開始可以給出自己的答案:

  • 你要知道 wau,而且每天要知道?好,那我根據我的技術,來給你關於做得好、做得快、做的便宜的三角之間做 trade-off;
  • 你要用資料做其他的產品,like 推薦系統、LLM chatbot、公司的知識管理,好,那你要不要給我足夠的資源,來提供這些產品所需要的 db?向量資料庫(vector db)?RMDBS?寬表?
  • data 可以幫你生產出這些產品,因為我們熟悉 data,熟悉 data 的價值,也熟悉 data 的運用。不過,關於 why 這件事,是不是也需要資料來驗證?

換句話說,從 top-down 的開資料需求,開始慢慢的開始專業化分工:

  • 上層的人開始不知道 data 做特定的事成本是多少(而且成本的差異可以很大);
  • 開始不知道 data 能做的事有哪些(可能過度樂觀,覺得資料萬能)

專業職能的養成,慢慢形成 gap,然後差生價值,我覺得是 2020 年後 data 最大的轉變。


上一篇
Day 8: Very Unique MODEL, Semantic Layer (2/n)
系列文
從 Airflow 走到 dbt 的 30 天9
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言