iT邦幫忙

鐵人檔案

2024 iThome 鐵人賽
回列表
AI/ ML & Data

資料與程式碼的交鋒 - Data Engineer 與合作夥伴的協奏曲 系列

這個題目會從我擔任 Data Engineer 的經驗出發,從過去與各種合作夥伴 (Backend Engineer, Data Analyst, Data Scientist 等) 協作過程中的挑戰出發,並從資料庫設計、軟體工程、基礎建設及資料運用等面向切入,說明不同職能間可能會有的知識落差。

期望透過本系列文章的說明,讓不同領域的人都對 Data 有更全面的理解,進而克服跨職能合作間可能會有的挑戰。

鐵人鍊成 | 共 30 篇文章 | 6 人訂閱 訂閱系列文 RSS系列文 團隊資料工程師甘苦談
DAY 1

《資料與程式碼的交鋒》Day 01 - 前言

這是近一年來的我第三次談資料工程師與其他夥伴的認知差異,我想這和我職涯的經驗有關: 第一份工作的職稱是 Data Analyst,但隸屬於 Software...

2024-09-15 ‧ 由 shutingchien 分享
DAY 2

《資料與程式碼的交鋒》Day 02 -資料庫正規化與反正規化

資料庫 (Database) 對資料工程師 (DE)、資料分析師 (DA)、後端工程師 (BE) 而言,算是共同的資訊承載體,無論資料如何在資料管線 (data...

2024-09-16 ‧ 由 shutingchien 分享
DAY 3

《資料與程式碼的交鋒》Day 03 - OLTP v.s. OLAP 的差異

昨天我們用了網購服務的新創團隊,來解釋資料庫正規化後可能遇到的資料運用瓶頸。橫空出世的資料工程師透過另建一個資料庫整合來自各服務的資料,記載歷來變化並提供決策...

2024-09-17 ‧ 由 shutingchien 分享
DAY 4

《資料與程式碼的交鋒》Day 04 - 資料管線 Data Pipeline

前兩天我們反覆地強調,在一個 OLTP 系統,高度符合正規化設計,且具備一定業務量的資料庫裡,要取得合用的分析資料,需要付出不少代價,包含業務受影響、查詢效能...

2024-09-18 ‧ 由 shutingchien 分享
DAY 5

《資料與程式碼的交鋒》Day 05 - 資料倉儲/湖/湖倉

故事回到 Day 02 講的新創團隊弄的網購服務吧。本來只有兩個工程師在開發功能,沒想到這個平台有口皆碑,用戶一傳十十傳百,現在用戶已達千萬等級。為了落實『一...

2024-09-19 ‧ 由 shutingchien 分享
DAY 6

《資料與程式碼的交鋒》Day 06-資料倉儲的三層式架構

經過 Day 05 的討論,我們已經瞭解資料倉儲、資料湖及資料湖倉的差異了,今天我們進一步來談談資料倉儲的內部架構。Day 04 提到資料收集步驟是針對內部資料...

2024-09-20 ‧ 由 shutingchien 分享
DAY 7

《資料與程式碼的交鋒》Day 07-星狀模型 v.s. 雪花模型

連載要滿一星期了,又回到 Day 03 的職棒官網故事。如果是 20 年看球背景的老球迷,應該會發現 "Lamigo" 穿越時空進到 200...

2024-09-21 ‧ 由 shutingchien 分享
DAY 8

《資料與程式碼的交鋒》Day 08-資料保鮮度

過去幾天我們一再強調捕捉時間維度的變化是資料倉儲重要的能力,但在 Day 07『穿越到 2007 年戰績表的 Lamigo』事件裡,我們也見證了時間維度是資料倉...

2024-09-22 ‧ 由 shutingchien 分享
DAY 9

《資料與程式碼的交鋒》Day 09-資料庫設計篇總回顧

在這次 30 天挑戰的第一階段-資料庫設計篇,我們從資料本身出發,關注資料收集管道、儲存架構設計、資料擺放層次及取用的成本等。實踐這些資料庫設計的準則就是資料工...

2024-09-23 ‧ 由 shutingchien 分享
DAY 10

《資料與程式碼的交鋒》Day 10-程式碼模組化

連續寫了好多天的文章,好想放個假出去旅行。開始上網查訂房資訊,查完幾個選項之後貼給同行朋友加權評估一下,最後存進試算表裡就完成!這總沒有資料工程或是程式的戲了...

2024-09-24 ‧ 由 shutingchien 分享