iT邦幫忙

鐵人檔案

2023 iThome 鐵人賽
回列表
AI & Data

當代資料工程與資料分析 系列

資料分析師主要應用的工具是: Tableau, PowerBI, FineReport 這種集成式的軟體。上述的軟體非常強大,就像 Microsoft 的 Office 360 一樣。

然而,我們有時候需要更靈活的工具:我們希望我們的工具可以像 Linux Shell 一樣,有許多小的零組件,一個零組件只做好一件事,比方說: awk, sed, tr, sort, cat, ... ,卻可以靈活地組合起來,而且,容易自動化。

本文就是要介紹「當代的」資料工程與資料分析技術,這套工具與方法論就像是 Linux Shell 一般地靈活、容易自動化、可以提昇數倍的產出。

鐵人鍊成 | 共 30 篇文章 | 16 人訂閱 訂閱系列文 RSS系列文 團隊dbt 和 dbt 以外有趣的事
DAY 1

序:我是在浪費我的時間

我有十八年寫 Java 的經驗。跟你們講這件事,並不是要強調我很有經驗,而是要告訴各位:我是在浪費我的時間。(編按:如果改用 Clojure 寫的話,同樣的程...

2023-09-16 ‧ 由 Laurence Chen 分享
DAY 2

資料應用的挑戰

開發資料應用,相對於一般的應用軟體開發,特有的挑戰有: 管理階層的認知 整合知識的困難 眾多資料來源 髒資料 資料同步週期 原始資料的變動 其中,1, 2...

2023-09-17 ‧ 由 Laurence Chen 分享
DAY 3

商業智慧 (BI) 解決方案的發展史

就我的觀察,在多數的企業裡,商業智慧的解決方案大概可以分成三個不同的階段,分別對應三種不同的作法: 大表做為主要介面 整合型 BI 軟體做為主要介面 資料建模...

2023-09-18 ‧ 由 Laurence Chen 分享
DAY 4

技術棧 (technical stack) 的決策

理想上的技術棧要可以達成下列兩個要求: 讓開發人員充分表達意圖的抽象層 該抽象層可以讓電腦充分發揮效能 以程式語言來舉例:從 1. 來講的話,Python...

2023-09-19 ‧ 由 Laurence Chen 分享
DAY 5

ELT 取代 ETL

管理學的理論指出:『很多的組織都有會議太多的病症』。這類病症主要有兩種形式: 首先,有一些會議的主要用途是用來滿足管理階層的自我感覺 (ego) 之用,這類型的...

2023-09-20 ‧ 由 Laurence Chen 分享
DAY 6

現代資料棧 (Modern Data Stack)

之前的討論,我們從真實的需求開始談起:真實的需求常常是 OLTP 與 OLAP 的需求混在一起談,接著談到開發資料應用的挑戰、商業智慧 (BI) 解決方案的發展...

2023-09-21 ‧ 由 Laurence Chen 分享
DAY 7

View layer: Metabase - 簡介

Metabase 的官網有一段簡短的口號:”Help your team answer their own questions about data in ju...

2023-09-22 ‧ 由 Laurence Chen 分享
DAY 8

View layer: Metabase - 自動分析

前文有提到,Metabase 是為一般人而設計的軟體,也因此,在 Metabase 的術語,對資料所做的資料庫查詢 (database query) ,稱之為問...

2023-09-23 ‧ 由 Laurence Chen 分享
DAY 9

View layer: Metabase - 基本操作

對於軟體工程背景的人來說, Metabase 就像一層圖形化使用者介面 (graphical user interface) ,把資料倉儲 (data ware...

2023-09-24 ‧ 由 Laurence Chen 分享
DAY 10

View layer: Metabase - 進階操作

因為從事 IT 工作的關係,我也讀了一些專門教 SQL 的網站、書籍。比方說,Joe Celko 的書、Markus Winand 的 modern-sql.c...

2023-09-25 ‧ 由 Laurence Chen 分享