這個系列將分享筆者掌握機器學習的個人方法🤖,從理論到實踐📚,其中包括筆者對問題定義🧩、數據處理🧹🗃️ 和算法選擇的理解📊。這套系統凝聚了筆者在機器學習領域的心得💡,旨在幫助讀者更有效地學習和應用這門技術🎯。
前言 在進行任何機器學習或數據分析專案時,拿到數據的那一刻起,就決定了後續工作的基礎。資料探勘(Data Mining)是深入理解數據、發現潛在模式和異常的重要...
前言 經過初步的資料探勘後,我們需要進一步處理數據中的缺失值、異常值、重複值等問題,以確保模型能夠在乾淨的數據上進行訓練。以下是數據清理的主要步驟和實作方法:...
前言 在完成初步數據清洗後,我們將實作特徵工程中的特徵創建、特徵轉換和特徵縮放。這些步驟將幫助我們將數據轉化為更適合模型的格式,並確保特徵在相同的度量上進行比較...
📌 前言 在前一篇文章中,我們討論了如何進行特徵創建、轉換和縮放。然而,隨著特徵的增加,模型可能變得過於複雜且容易過擬合。這時,我們需要進行特徵選擇,以確保只使...
前言 [圖片生成:DALL-E] 在完成特徵選擇和數據切分後,我們需要根據 scikit-learn 的 cheatsheet 選擇合適的演算法📘,這是提升模型...
前言💡 在上篇文章中,我們探討了如何根據 scikit-learn 的 cheatsheet 選擇合適的演算法及常見的演算法選擇,但光有理論上的選擇還不夠,我們...
📖前言 在前一篇文章中,我們對多種機器學習分類演算法進行了評估,發現 Random Forest 🌲模型在準確度、精確率和 F1 Score 🎯等指標上表現最佳...
✨前言 我們在確認模型都訓練完後,接下來只要有任何新數據,即使沒有最終結果,我們也可以幫忙預測囉。以實作來說,我們只要有所有新病患的 input 檢查結果,就可...
🌟前言 在完成機器學習模型的訓練和預測後,將模型部署到實際應用中是下一步關鍵的工作🔑。例如在醫療領域🏥,醫療人員需要能夠方便地使用這些模型來做出準確的診斷和決策...
💌致每一位勇者: 在這裡,我想特別感謝每位讀者,尤其是那些能從頭看到尾的勇者們!首先,恭喜你,能看到這裡代表你有兩種可能性:一是你真的是個超級有耐心的學習者,...