Data Source 是資料的來源。它可能是公司的主要資料庫 (比方說,該資料庫支持著公司的電商網站的運作),或是第三方的資料 (比方說,Google Analytics) ,又或是公司員工手動輸入的資料。
EL tools 是一類特別的軟體,它通常是大量已經寫好、可以直接拿來使用的軟體函式庫。在 E (extract) 抽取的功能,它支援讀取各式各樣的資料源,比方說:Google Analytics、CSV、Postgres 。在 L (load) 載入的功能,它支援寫入各式各樣的資料終端,在 modern data stack 的應用,資料終端通常會是各式的資料倉儲 (data warehouse),比方說:BigQuery、Snowflake、Databrick 等。
Data warehouse :常見的選項有 BigQuery, Snowflake, Databrick 。之後的例子,為了讓讀者可以快速上手,我會採用 duckdb 做為 Data warehouse