iT邦幫忙

1

聽說kaggle是很紅的機器學習練習平台,來嘗試一下看看

就像學習程式演算法有leetcode做為練習平台,
若是對於AI, 機器學習有興趣也有個好的練習平台,
並且在線上能打code,
那當然是不錯啦,
所以總之就找到kaggle這個網站了
(功能是蠻不錯的,不過是全英文,英文閱讀能力要夠)

目前摸索了一下,看到kaggle上有兩個不錯的功能:
一個是競賽,一個是免費課程
https://ithelp.ithome.com.tw/upload/images/20210404/20135919AdQFu6ooXN.png

看起來好實用的課程

課程的部分可說是短小又齊全,
從基礎python,機器學習,常用的資料處理庫pandas,SQL,...
各類實用的技能都有,
https://ithelp.ithome.com.tw/upload/images/20210404/20135919y62bVD8keI.png

而且看課程的時數也就幾個小時而已,
然後就可以快速入門,小鹿是覺得蠻划的,
以時數來說也蠻適合想自學,
只能靠下班時間微弱意志力擠出時間的上班族

來玩玩看練習用入門競賽

競賽的部分有給AI高手打的競賽(據說有些是真的有獎金的),
不過這邊也蠻貼心有準備一些入門用的練習賽,
還有很貼心的step-by-step操作教學,
照著做就可以了

今天要嘗試的是完成kaggle上的第一個競賽- 預測鐵達尼號生還者
https://ithelp.ithome.com.tw/upload/images/20210404/20135919KRhr7MXhBz.png

大意大概是說1912年的鐵達尼號沉船,
乘客中有些死亡、有些生存,
能不能從乘客資料預測出哪些乘客是生存的?

點進去看簡介,裡面有個教學連結可以點,
可以直接用線上的環境打程式,教學還附上程式碼供參考
https://ithelp.ithome.com.tw/upload/images/20210404/20135919EL5VSaDnHN.png

首先先來讀懂數據
train.csv是訓練集,
它給的是乘客的資料跟哪些乘客存活的答案
https://ithelp.ithome.com.tw/upload/images/20210404/201359193UqWjILLkk.png

比如說資料有乘客編號、姓名、性別、年齡、買了什麼票之類的,
在survived那欄1表示存活、0表示死亡

test.csv是測試集,
也是乘客的資料,
但是沒有告訴你乘客是否活著的資訊
https://ithelp.ithome.com.tw/upload/images/20210404/20135919TdJ0srAQ43.png

我們要做的事情就是讓AI看train.csv學習,
然後對test.csv去預測哪些乘客是存活的,
最後交一份預測結果答案就行了

https://ithelp.ithome.com.tw/upload/images/20210404/20135919B7IUq0q2dE.png

這邊就直接套用範例教學給的程式碼,
大概是說用一個叫作「隨機森林」的分類器
將所有乘客分為「1表示存活、0表示死亡」兩類

可以在頁面右方找到output,
為剛剛程式生出來的csv檔,
格式大概像圖示的這樣:
https://ithelp.ithome.com.tw/upload/images/20210404/20135919Hop6C0eKKz.png

意思是對892號之後的乘客去猜說他是否是鐵達尼號事件的生存者,
submit這個csv檔,得到準確率77%,完成~
https://ithelp.ithome.com.tw/upload/images/20210404/201359191UhURRN3G1.png

完結撒花~
/images/emoticon/emoticon42.gif
以此做為入門的第一步,
感覺上面的課程應該不錯,
邊學邊做來充實自己試試吧,
希望不會變成從入門到放棄系列


尚未有邦友留言

立即登入留言