我覺得這篇寫得不錯
推薦參考看看
謝謝海綿大推薦,對於ETL的描述很清楚。
這幾天我看了一些文章後發現對於ETL的描述,跟我一開始的理解似乎差不多,籠統的描述就是蒐集清洗後載入指定地點,俗話講就有點像在倒資料,但我後來發現我可能比較需要的是一些細節,例如管理方面的排程(Job)、可維護性及延展性等等,或是效能方面的運算速度或即時性等等,這些細節要如何實現,或有哪些要坑需要特別注意。
我第一個想法是,盡量不要自己造輪子,所以可能找一些開源的工具作為中間件會比較好一點,後來我有看到這篇
https://www.twblogs.net/a/605898e6e83ad4e1f40ad360
現在應該會比較往這個方向去摸索
請問你是否要自行用 java 開發 ETL,如果不是可以考慮使用 ETL 工具 informatica 或 talend,其中 talend 有 opensource 的版本可用