iT邦幫忙

2019 iT 邦幫忙鐵人賽

DAY 5
2
AI & Data

[BI工具] 以Redash為資料視覺化方案之選擇與實踐系列 第 5

Metabase、Superset、Redash 選擇考量

在旅遊電商平台,會看的報表不外乎:營收、產品、使用者瀏覽行為
在營收方面會有下訂時間、旅遊時間、旅遊地區、供應商等維度;
產品方面會有旅遊地區、供應商、價格、旅遊時間等維度;
使用者瀏覽行為可能的 Datasource 為 GA 或是自己的日誌系統,
同時比對營收相關報表,而最常看的統計數值不外乎總和、平均、累積總和、總數。

而在系統使用上,主要重點是容易共享,
不論是瀏覽或是開發,能讓使用此系統的人能以最少的時間來建置、上手:

  • 技術人員主要使用 MySQL、Php、Python
  • 如果有網頁版不需要電腦各自安裝環境是最好的
  • Datasource 能介接目前已使用的資料來源

總結一下目前體驗 Metabase、Superset、Redash

服務 |Data Source|圖表|支援文件
------------- | -------------
Superset | 只支援 SQLAlchemy | SQL 取資料,圖表最為豐富、時間維度相關分析用 | 雖然有但不算清楚
Redash | 豐富 | SQL、Python取資料,圖表種類多,Pivot-Table 很好用。同一 query 可對到多張圖表,如果需要修改會很方便 | 還可以,但沒有很清楚
Metabase | 基本常用的 | 有 GUI 的 query 方式來撈取資料,圖表基本,貼心的功能不少 | 非常清楚完備

Superset 主要因為使用者體驗不是很好,還有大部分圖表是需要時間維度,
但公司如果是要看產品相關的報表,很可能是以旅遊地區、供應商、價格為角度,
不見得會有時間維度,這樣可使用的視覺化圖表就會受限不少。

最後其實在 Metabase 和 Redash 小抉擇了一陣子,
Metabase 許多設計對於非技術人員可說是非常的貼心:
不需要 SQL 語法的 Custom GUI query 介面、
甚至不需要 query 就能對資料源進行 X-Rays 分析產生各角度報表;
但某種層面上,使用者也是需要對資料的內容夠熟悉,
才有辦法自行 query(不論透過介面或是 SQL),然後才能進到 Visualization。

而如果是以 Redash 的 Pivot-Table 當成主要的彈性,
第一層 query 資料是由技術人員撈取,確保不管任何人使用都是相同的資料,
使用者再以 Pivot-Table 進行各種角度的檢視,相對對使用者的技術門檻較低,
同時也不會有Metabase 一些過於貼心以致無法讓技術人員能夠隨心所欲的調整的缺憾。

在現階段,寧可讓使用者先無撈取資料的能力,
先能從已有的資料或是報表圖像中先取得自己希望的資訊或視覺化方式,
如果有個人需求,再藉由已有的 query 嘗試修改 SQL 來學習相關語法。
也就是先讓使用者體驗魚的美味,如果使用者有興趣,再去教他們如何釣魚,
而非要求剛開始所有初次要吃魚的人先得學會釣魚才能有食物能吃。

適度的彈性、廣大的Datasource、能讓非技術人員不致於初次操作就有學習門檻、
內建 Pivot-Table 的強大、同時支援 SQL、Python 這些就是最後選擇 Redash 的原因。

另外也整理了手邊已知,
有哪些公司/個人有使用到以上提到的工具,以及他們提到的相關使用經驗:

Superset

Redash

Metabase

三者評比

ps. 文章同步發表於 Medium


上一篇
Redash 線上體驗
下一篇
Redash 安裝
系列文
[BI工具] 以Redash為資料視覺化方案之選擇與實踐30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言