分享至
目前Team在做ETL(File to DB或DB to DB)用的方式有:
想問/討論的是如果要做ETL,用Python寫是否能得到好處?還是只是比較多開源套件可以用...
已邀請的邦友 {{ invite_list.length }}/5
善用DB原廠提供 LOAD/UNLOAD API工具, 可快速將檔案匯入Table, 再由DB Server MPP效能去處理, 不過這種做法叫ELT, Python在這裏僅是個shell, 整合DB Tools應 用, 當然它就不會用的太複雜, 只是包裝程式而已.
感謝,您說的部分我會再研究。會看上python,主要還是開源etl libary很多,但聽說python語言理念是好開發而非追求高效能。 團隊成員又以c#為主,所以值不值投入python,感覺意義上好像不大.
可用C#開發Console ETL(處理IO Disk比較有效能)供 Python呼叫也是可行的.
IT邦幫忙