資料分析師主要應用的工具是: Tableau, PowerBI, FineReport 這種集成式的軟體。上述的軟體非常強大,就像 Microsoft 的 Office 360 一樣。
然而,我們有時候需要更靈活的工具:我們希望我們的工具可以像 Linux Shell 一樣,有許多小的零組件,一個零組件只做好一件事,比方說: awk, sed, tr, sort, cat, ... ,卻可以靈活地組合起來,而且,容易自動化。
本文就是要介紹「當代的」資料工程與資料分析技術,這套工具與方法論就像是 Linux Shell 一般地靈活、容易自動化、可以提昇數倍的產出。
我有十八年寫 Java 的經驗。跟你們講這件事,並不是要強調我很有經驗,而是要告訴各位:我是在浪費我的時間。(編按:如果改用 Clojure 寫的話,同樣的程...
開發資料應用,相對於一般的應用軟體開發,特有的挑戰有: 管理階層的認知 整合知識的困難 眾多資料來源 髒資料 資料同步週期 原始資料的變動 其中,1, 2...
就我的觀察,在多數的企業裡,商業智慧的解決方案大概可以分成三個不同的階段,分別對應三種不同的作法: 大表做為主要介面 整合型 BI 軟體做為主要介面 資料建模...
理想上的技術棧要可以達成下列兩個要求: 讓開發人員充分表達意圖的抽象層 該抽象層可以讓電腦充分發揮效能 以程式語言來舉例:從 1. 來講的話,Python...
管理學的理論指出:『很多的組織都有會議太多的病症』。這類病症主要有兩種形式: 首先,有一些會議的主要用途是用來滿足管理階層的自我感覺 (ego) 之用,這類型的...
之前的討論,我們從真實的需求開始談起:真實的需求常常是 OLTP 與 OLAP 的需求混在一起談,接著談到開發資料應用的挑戰、商業智慧 (BI) 解決方案的發展...
Metabase 的官網有一段簡短的口號:”Help your team answer their own questions about data in ju...
前文有提到,Metabase 是為一般人而設計的軟體,也因此,在 Metabase 的術語,對資料所做的資料庫查詢 (database query) ,稱之為問...
對於軟體工程背景的人來說, Metabase 就像一層圖形化使用者介面 (graphical user interface) ,把資料倉儲 (data ware...
因為從事 IT 工作的關係,我也讀了一些專門教 SQL 的網站、書籍。比方說,Joe Celko 的書、Markus Winand 的 modern-sql.c...