隨著資料收集愈來愈便利的時代洪流下,許多科學領域的發展常常包含利用統計與數學的方法找出資料所蘊含的寶貴資訊,也有許多學校與線上學習資源開設相關的課程,此系列將利用30天整理統計與機器學習的筆記,以及Python的操作。
載入套件 import pandas as pd from sklearn.model_selection import train_test_split fr...
前言 集成學習(Ensemble Learning)是一種將多個模型整合起來,最後獲得比單一個模型表現更好的方法,例如在某筆資料集中可以使用KNN、線性迴歸模型...
前言 昨天的內容提到Bagging與Boosting改善預測結果的方法,不過在許多問題中Boosting常常表現得比Bagging更好,因此Boosting這類...
前言 支持向量機(Support Vector Machine, SVM),是Vladimir Vapnik在 1960 年代首次開發的一類統計模型。在近幾年,...
前言 昨天的內容提到當資料可以完美的利用一條直線或超平面(hyperplane)分類時,**最大邊距分類器(Maximal Margin Classifier)...
前言 過去內容提到的Optimal Separating Hyperplane、Support Vector Classifier與LDA等方法,都是利用線性的...
前言 類神經網路(Neural Network, NN),又稱為神經網路、人工神經網路(Artificial Neural Network, ANN),屬於非線...
前言 昨天介紹了Single Layer Neural network與Deep Neural Network,而模型的結構在隱藏層(hidden layer)...
前言 鐵人賽來到了最後兩天,其幾天的內容屬於機器學習中監督式學習(Supervised learning)的模型,這兩天將撰寫的是兩種非監督式學習(Unsupe...
前言 近幾年來有許多科學領域開始利用網路分析(Network Analysis)與graphical models建立不同隨機變數之間的關係,也就是利用一些節點...