iT邦幫忙

2021 iThome 鐵人賽

DAY 1
0
AI & Data

30Day 從一介凡人羽化成資料科學初學者系列 第 1

Day1 - 導讀 帶你認識資料科學所需套件

先備知識:

  1. 基本python能力 :

    熟悉各基本型態,認識串列、字典、函式、class

  2. 了解深度學習原理:

    需要具有深度學習的基本知識,那需要到什麼程度呢?
    基本上只要看懂李宏毅老師在youtube的Machine Learning (2021) Mandarin Version這播放清單的前8部影片

依照下列順序介紹各套件:

  1. numpy:

    認識多維資料及各numpy方法,有利於之後操作pandas的DataFrame。

  2. pandas:

    大部分的資料都會使用此套件來操作,檢視資料狀況、資料型態轉換,補充缺失直、範圍切割等。

  3. seaborn:

    資料視覺化的強大套件,與pandas配合起來便利又輕鬆,pandas與seaborn的相互操作非常有利於我們對於資料的探勘。

  4. sklearn

    在此套件裡提供了許多資料前處理方法及機器學習套件,本篇注重於如何使用sklearn的資料前處理方法,如果30day我寫到沒東西可以寫了,將利用剩餘天數介紹如何使用sklearn機器學習套件,例:SVM、隨機森林、決策樹、clustering等

  5. pytorch

    深度學習套件,不多說了 哼~

最後專案實際操作:

最後帶領大家使用以上所學 實際操作Kaggle Titanic 進入排名前5%
https://ithelp.ithome.com.tw/upload/images/20210823/20140416ha8oHtd5tF.png

作者的話:

第一次參加IT鐵人賽,將盡可能的分享我所學知識
本人依舊還在學習階段,過程可能會有錯誤資訊請多多包涵


下一篇
Day2 - numpy(1)基本介紹及使用
系列文
30Day 從一介凡人羽化成資料科學初學者30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言