iT邦幫忙

鐵人檔案

2021 iThome 鐵人賽
回列表
AI & Data

使用python學習Machine Learning 系列

python是一個好入手的程式語言,運算能力強大並且有很多ML相關的套件可以使用
之前在kaggle這個網站有學習一些python在ML上的操作,剛好這次可以利用30天的鐵人賽來複習並且翻譯之前的筆記,希望可以幫助到

參賽天數 26 天 | 共 29 篇文章 | 1 人訂閱 訂閱系列文 RSS系列文 團隊人工逗點智慧
DAY 1

Day 1 [Python ML] 30天內容介紹

簡介 之前在kaggle上面學習到了很多Python應用在Machine Learning的方法 對於英文沒有那麼好的我來說,學得有點吃力 想說可以利用這次的機...

2021-09-14 ‧ 由 guancioul 分享
DAY 2

Day 2 [Python ML] 基礎資料處理

前言 在這系列文章中,我會使用Azure來運行所有的程式,如何使用Azure的文章在這裡 這邊則是使用Azure中的JupyterLab來執行 到計算的頁面點...

2021-09-15 ‧ 由 guancioul 分享
DAY 3

Day 3 [Python ML] 選擇建模用的資料(DecisionTree)

前言 一開始先接續昨天讀取資料的部分,先使用pd.read_csv來讀取資料 再利用DataFrame的columns來看有哪些columns import p...

2021-09-16 ‧ 由 guancioul 分享
DAY 4

Day 4 [Python ML] 模型驗證

前言 今天要繼續昨天做過的部分,因此一開始需要昨天的程式碼 import pandas as pd # 讀起資料 melbourne_file_path =...

2021-09-17 ‧ 由 guancioul 分享
DAY 5

Day 5 [Python ML] 欠擬合(Underfitting)和過擬合(Overfitting)

實驗不同的模型 若是是太多分支,會造成leaf太多,而每一個leaf都只是用其中一筆資料建立出來的,因此對model來說,會過度擬和(overfitting)...

2021-09-18 ‧ 由 guancioul 分享
DAY 6

Day 6 [Python ML] 隨機森林(Random Forests)演算法

前言 決策樹(DecisionTree)如果leaf太多的話容易overfitting 若leaf太少的話則容易underfitting 但是隨機森林(Rand...

2021-09-19 ‧ 由 guancioul 分享
DAY 7

Day 7 [Python ML] Machine Learning的處理流程

Step 1: 蒐集數據 要先將自己需要的數據下載好,並且確認資料格式而去做不同的處理 Step 2: 準備資料 讀取csv import pandas as...

2021-09-20 ‧ 由 guancioul 分享
DAY 8

Day 8 [Python ML、特徵工程] 基準模型(Baseline Model)

前言 今天開始是新的章節,因此也有新的資料集 Kickstarter Projects 在開始之前要先將資料集下載好丟到Dataset資料夾中 讀取資料 imp...

2021-09-21 ‧ 由 guancioul 分享
DAY 9

Day 9 [Python ML、特徵工程] 分類工程

import pandas as pd from sklearn.preprocessing import LabelEncoder ks = pd.read...

2021-09-22 ‧ 由 guancioul 分享
DAY 10

Day 10 [Python ML、特徵工程] 特徵生成

匯入基線模型(Baseline model) %matplotlib inline import matplotlib.pyplot as plt impor...

2021-09-23 ‧ 由 guancioul 分享