透過實作資料科學專案的過程,整理、紀錄並介紹在其中應用的技術與心得。 這次鐵人賽將與資料科學專案同步進行,專案的目的是使用中央氣象署的公開預報資料,預測第二天台灣電力公司的風力發電、太陽能發電,以及尖峰負載的功率。並且我將會運用開源大語言模型串接這個預測系統,讓 LLM 能夠回答相關問題。 因此我們將會討論到以下幾點: 網路爬蟲 資料ETL的自動化 資料清洗與特徵工程 機器學習與深度學習的模型建構、訓練與評估 MLOps LLM 與 RAG