iT邦幫忙

鐵人檔案

2018 iT 邦幫忙鐵人賽
回列表
AI & Machine Learning

玩轉資料與機器學習-以自然語言處理為例 系列

一、概述:
整個文章集將爬梳整個機器學習中(視情況談及深度學習),取得資料、整理資料、分析資料直到預測資料的流程,並將自然語言處理作為分析及預測上面的實作案例,帶大家一步步進到機器學習的領域。
二、包含技術:
網路爬蟲、pandas資料分析、matplotlib資料視覺化、自然語言處理、分群演算法、分類演算法、視心情狀況談及聊天機器人與深度學習。
三、目標對象:
內行的人可以汲取自己不族的技術、外行的人可以做為半年的學習教材,循序入門機器學習。

鐵人鍊成 | 共 31 篇文章 | 176 人訂閱 訂閱系列文 RSS系列文
DAY 21

資料前處理

概述 雖然資料前處理是最為人討厭的過程,但很多時候影響結果也最深,Garbage In Garbage Out 嘛。實話說,資料的前處理沒有什麼值得讚歎的東西,...

DAY 22

資料前處理(續)

提醒: code在這裡 資料轉換(Transformation) 這個部分其實跟資料整合很像,不過不一定要透過多個欄位的協作已產生新的欄位。舉例來說,我們現在有...

DAY 23

機器學習系列概述

資料科學不迷路 由於接下來幾天,將會談到資料科學中最神秘也最有魅力的部分,因此讓握們重新來回顧一下,我們目前已經經歷了哪些技術,未來即將要經的是那些技術,以及他...

DAY 24

分群演算法理論

一、分群演算法概述 分群演算法在機器學習中扮演的角色,前一篇文章有清楚的介紹了。以下稍微說明一下其應用情境: 文件分群: 早期新聞文章在分類時,可能不太清楚應...

DAY 25

分群演算法實作-區辨不同演算法的意義

前言 這篇文章將承襲上一篇文章,視覺化各個演算法的成果,並附註說明,讓大家更能夠了解,每個演算法運作的原理,及其用處。以下將用五個資料集,進行實測: flowe...

DAY 26

產品標籤分群實作-Word2Vec

Word2Vec介紹 Word2Vec其實是Word to Vector的簡稱,意在將每一個字轉換成一條向量,並讓這字的語意透過這條向量描繪出來。早期做自然語言...

DAY 27

分類演算法理論-傳統演算法

甚麼是分類? 最簡單的理解方式就是舉例,我們就拿電影來作為例子,簡單解釋一下什麼是分類問題。其中最能夠直接想像的大約就是區分電影的類別,愛情片、文藝片、動作片或...

DAY 28

分類演算法理論-SVM及XGB+CV

Support Vector Machine(SVM) 概述 SVM也是目前分類效果極好的分類演算法之一,不過我個人使用上沒有那麼習慣,台大的林智仁老師有開發出...

DAY 29

分類演算法實作-LineBot專案

LineBot專案概述 這個專案是我去新竹黑客松比賽時,拿到第二名的作品,這個作品主要是將新竹市政府社會處的常見問答集爬下來,希望可以建置一個聊天機器人幫助市民...

DAY 30

2017 資料分析師的練成之路

總體來說,2017算是最有希望的一年,從暗不見天日、徬徨錯愕的預期未來中,漸漸看見了一絲曙光。這篇文章除了訴說自己掙扎著逃出苦海的心路歷程之外,主要是希望給予正...