一、概述:
整個文章集將爬梳整個機器學習中(視情況談及深度學習),取得資料、整理資料、分析資料直到預測資料的流程,並將自然語言處理作為分析及預測上面的實作案例,帶大家一步步進到機器學習的領域。
二、包含技術:
網路爬蟲、pandas資料分析、matplotlib資料視覺化、自然語言處理、分群演算法、分類演算法、視心情狀況談及聊天機器人與深度學習。
三、目標對象:
內行的人可以汲取自己不族的技術、外行的人可以做為半年的學習教材,循序入門機器學習。
概述 雖然資料前處理是最為人討厭的過程,但很多時候影響結果也最深,Garbage In Garbage Out 嘛。實話說,資料的前處理沒有什麼值得讚歎的東西,...
提醒: code在這裡 資料轉換(Transformation) 這個部分其實跟資料整合很像,不過不一定要透過多個欄位的協作已產生新的欄位。舉例來說,我們現在有...
資料科學不迷路 由於接下來幾天,將會談到資料科學中最神秘也最有魅力的部分,因此讓握們重新來回顧一下,我們目前已經經歷了哪些技術,未來即將要經的是那些技術,以及他...
一、分群演算法概述 分群演算法在機器學習中扮演的角色,前一篇文章有清楚的介紹了。以下稍微說明一下其應用情境: 文件分群: 早期新聞文章在分類時,可能不太清楚應...
前言 這篇文章將承襲上一篇文章,視覺化各個演算法的成果,並附註說明,讓大家更能夠了解,每個演算法運作的原理,及其用處。以下將用五個資料集,進行實測: flowe...
Word2Vec介紹 Word2Vec其實是Word to Vector的簡稱,意在將每一個字轉換成一條向量,並讓這字的語意透過這條向量描繪出來。早期做自然語言...
甚麼是分類? 最簡單的理解方式就是舉例,我們就拿電影來作為例子,簡單解釋一下什麼是分類問題。其中最能夠直接想像的大約就是區分電影的類別,愛情片、文藝片、動作片或...
Support Vector Machine(SVM) 概述 SVM也是目前分類效果極好的分類演算法之一,不過我個人使用上沒有那麼習慣,台大的林智仁老師有開發出...
LineBot專案概述 這個專案是我去新竹黑客松比賽時,拿到第二名的作品,這個作品主要是將新竹市政府社會處的常見問答集爬下來,希望可以建置一個聊天機器人幫助市民...
總體來說,2017算是最有希望的一年,從暗不見天日、徬徨錯愕的預期未來中,漸漸看見了一絲曙光。這篇文章除了訴說自己掙扎著逃出苦海的心路歷程之外,主要是希望給予正...