AI世界就像一道高牆,對於初學者來說未知且高深莫測,希望透過三十天的挑戰回顧所學,帶領初學者們越過高牆,來到資料科學的領域中一探究竟,除了基礎的理論知識,會更著重於實作,透過一些經典資料集和知名平台競賽來做為範例,解決初學者無從下手的窘境!
試想一下,如果有個模型號稱有99%的準確率,那這個模型好不好呢?答案是不一定,在處理分類問題時,我們很常會遇到的一個狀況就是"資料不平衡",...
特徵工程可以分為兩大部分,一是根據現有的資料特徵進行篩選,選出較有影響力的特徵進行訓練,另一個是根據現有的資料特徵,去衍生出資料集中沒有的特徵來讓模型學習。今天...
一、為何要做標準化 以最簡單的方式來說,一份資料中,不可能每個特徵的範圍都是一樣的,當我們需要拿兩筆特徵資料來做處理時,就必須讓他們的評比標準都相同才會準確。舉...
機器學習可以分成監督式學習與非監督式學習,這部分我們在第四天有稍微提到過,這邊就不多做說明了,今天我們將介紹這兩類的問題分別適合用什麼模型來做處理。 一、監督...
我們的挑戰終於進行一半啦~前面經過漫長的資料前處理、特徵工程、挑選模型進行訓練後,我們把一個機器學習的模型建立出來了,接著我們要進行測試,也就是把測試檔丟入模型...
一、前言 前面學了這麼多的方法,大家是不是在煩惱要怎麼使用?或是不知道該用在什麼地方?今天就由小編來帶大家進行專案實戰,讓大家輕鬆上手。 二、資料哪裡來 這次...
ㄧ、資料前處理 1. 補值、刪值 前面我們透過視覺化的方式找到資料有缺值,因此我們要將資料進行補值。要記得訓練資料怎麼補,測試資料也要使用同樣的方法。 補值:在...
一、挑選模型 再將資料丟入模型前要先做好資料前處理,並將訓練資料的答案另外獨立出來,然後把訓練資料與你獨立出來的答案丟入模型做訓練,最後再把你的測試及資料丟入訓...
我們在前面算是完整的介紹了使用機器學習的方法來做資料分析,在剩下最後11天的時間,我想把自己在暑假所接觸的深度學習、電腦視覺,以及參加的議題競賽拿來作介紹,順便...
昨天我們介紹了深度學習的概念和應用,今天來介紹一下圖片的處理,前一章我們有提到,一張圖片對於神經網路來說就是很多像素組成的矩陣,為了讓神經網路能夠學習它,我們必...