隨著資料收集愈來愈便利的時代洪流下,許多科學領域的發展常常包含利用統計與數學的方法找出資料所蘊含的寶貴資訊,也有許多學校與線上學習資源開設相關的課程,此系列將利用30天整理統計與機器學習的筆記,以及Python的操作。
前言與介紹 K-近鄰演算法(K-Nearest Neighbors),簡稱KNN,屬於機器學習中監督式學習(supervised learning)的無母數方法...
前言 今天將以Python建立KNN的模型,包含如何選擇一個適當的K值。以iris為例,將屬種(Species)當成反應變數或outcome,共有三類,以KNN...
前言 在機器學習中,常常把監督式學習根據反應變數是連續資料或類別資料,分為迴歸(Regression)與分類(Classification)兩大類,那麼如果利用...
前言與介紹 在機器學習中常常用來處理分類問題的方法之一為邏輯斯迴歸模型(Logistic regression),與線性迴歸模型不同的是邏輯斯迴歸模型是直接針對...
載入套件 import pandas as pd from sklearn.model_selection import train_test_split fr...
前言與介紹 在分類問題中除了邏輯斯迴歸模型外,還有另一種常用的方法為線性判別分析(Linear discriminant analysis, LDA),主要概念...
載入套件 import pandas as pd from sklearn.model_selection import train_test_split fr...
前言 重新抽樣(Resampling)的方法在機器學習或深度學習領域是一個非常重要工具,由訓練集(trainning set)中重新抽樣獲得樣本,在每個樣本上建...
前言與介紹 決策樹(Decision tree)在機器學習中是一種容易理解但強大的演算法,可以用來處理分類以及迴歸的問題(Classification and...
前言 昨天的內容提到針對迴歸的問題如何建立決策樹模型,可以針對訓練集的資料有一個好的預測,但是以昨天提到的方式建立一個完美的決策樹模型後,會使得整棵樹的分支很多...