有鑒於本書作者於資料領域打滾十餘年的經驗,對資料工程的趨勢有些想法,分享給大家
資料工具複雜度降低,更易上手
豐富的代管服務使應用程式開發更方便, e.g....
NLP
NLP的主要演算模式
編碼器與解碼器模式
1.序列對序列(Sequence to Sequence Model, Seq2Seq)指一個強調由輸入的序列...
前言再昨天的文章中,我們簡單介紹了協同過濾推薦,並用 DayaFrame APIs 來進行實做,大家可以先看看這篇文章再回來:Day19 - PySpark...
訓練資料量不足Insufficient quantity of training data
資料量不足使模型訓練時能夠看到的特徵也很有限,導致訓練成效不佳。目前...
上一篇提到 dbt 的 CI 檢查項目,接下來 CI 過了要自動 deploy,dbt deploy 要做什麼以及有什麼注意事項嗎?
deploy 到正式環...
在我們開發 weather_dag 之後,我們介紹了如何透過 View 以及警報來監控 DAG 執行的狀況。在開發之後其實還有一件非常重要的事,那就是測試,對於...