iT邦幫忙

鐵人檔案

2021 iThome 鐵人賽
回列表
AI & Data

學資料科學的小孩不會變壞- 從入門到實戰全攻略 系列

AI世界就像一道高牆,對於初學者來說未知且高深莫測,希望透過三十天的挑戰回顧所學,帶領初學者們越過高牆,來到資料科學的領域中一探究竟,除了基礎的理論知識,會更著重於實作,透過一些經典資料集和知名平台競賽來做為範例,解決初學者無從下手的窘境!

參賽天數 20 天 | 共 30 篇文章 | 53 人訂閱 訂閱系列文 RSS系列文
DAY 11

DAY11 資料前處理-資料不平衡處理方法

試想一下,如果有個模型號稱有99%的準確率,那這個模型好不好呢?答案是不一定,在處理分類問題時,我們很常會遇到的一個狀況就是"資料不平衡",...

2021-09-11 ‧ 由 Rick_Lyle 分享
DAY 12

DAY12 特徵工程-資料化約(特徵選取)

特徵工程可以分為兩大部分,一是根據現有的資料特徵進行篩選,選出較有影響力的特徵進行訓練,另一個是根據現有的資料特徵,去衍生出資料集中沒有的特徵來讓模型學習。今天...

2021-09-12 ‧ 由 Rick_Lyle 分享
DAY 13

DAY13 特徵工程-資料標準化與降維

一、為何要做標準化 以最簡單的方式來說,一份資料中,不可能每個特徵的範圍都是一樣的,當我們需要拿兩筆特徵資料來做處理時,就必須讓他們的評比標準都相同才會準確。舉...

2021-09-13 ‧ 由 Rick_Lyle 分享
DAY 14

DAY14 挑選合適的模型進行訓練

機器學習可以分成監督式學習與非監督式學習,這部分我們在第四天有稍微提到過,這邊就不多做說明了,今天我們將介紹這兩類的問題分別適合用什麼模型來做處理。 一、監督...

2021-09-14 ‧ 由 Rick_Lyle 分享
DAY 15

DAY15 模型預測評估方法

我們的挑戰終於進行一半啦~前面經過漫長的資料前處理、特徵工程、挑選模型進行訓練後,我們把一個機器學習的模型建立出來了,接著我們要進行測試,也就是把測試檔丟入模型...

2021-09-15 ‧ 由 Rick_Lyle 分享
DAY 16

DAY16 機器學習專案實作-員工離職預測(上)

一、前言 前面學了這麼多的方法,大家是不是在煩惱要怎麼使用?或是不知道該用在什麼地方?今天就由小編來帶大家進行專案實戰,讓大家輕鬆上手。 二、資料哪裡來 這次...

2021-09-16 ‧ 由 Rick_Lyle 分享
DAY 17

DAY17 機器學習專案實作-員工離職預測(中)

ㄧ、資料前處理 1. 補值、刪值 前面我們透過視覺化的方式找到資料有缺值,因此我們要將資料進行補值。要記得訓練資料怎麼補,測試資料也要使用同樣的方法。 補值:在...

2021-09-17 ‧ 由 Rick_Lyle 分享
DAY 18

DAY18 機器學習專案實作-員工離職預測(下)

一、挑選模型 再將資料丟入模型前要先做好資料前處理,並將訓練資料的答案另外獨立出來,然後把訓練資料與你獨立出來的答案丟入模型做訓練,最後再把你的測試及資料丟入訓...

2021-09-18 ‧ 由 Rick_Lyle 分享
DAY 19

DAY19 淺談深度學習

我們在前面算是完整的介紹了使用機器學習的方法來做資料分析,在剩下最後11天的時間,我想把自己在暑假所接觸的深度學習、電腦視覺,以及參加的議題競賽拿來作介紹,順便...

2021-09-19 ‧ 由 Rick_Lyle 分享
DAY 20

DAY20 圖片處理套件-OpenCV

昨天我們介紹了深度學習的概念和應用,今天來介紹一下圖片的處理,前一章我們有提到,一張圖片對於神經網路來說就是很多像素組成的矩陣,為了讓神經網路能夠學習它,我們必...

2021-09-20 ‧ 由 Rick_Lyle 分享