iT邦幫忙

鐵人檔案

2017 iT 邦幫忙鐵人賽
回列表
Big Data

從學生到職場:菜鳥資料科學家的第一個月 系列

從校園畢業走到職場,用自身剛畢業的新鮮人角度來看待資料科學這個技術的發展與演進。過去在學校,往往會陷入一個特定的角度解問題。然而,在面對真實的世界,有許許多多的事情需要被考慮。所以,試圖從最務實的角度開始,結合理論與實作去探索資料科學的真實世界。

鐵人鍊成 | 共 28 篇文章 | 89 人訂閱 訂閱系列文 RSS系列文
DAY 11

資料爬蟲(上) - 靜態網頁篇

資料爬蟲 Data Crawler 前一篇有講到,資料爬蟲是用在沒有以檔案或是 API 釋出資料集的情況下。這個時候就只能捲起袖子,自己想要的資料自己爬!我會分...

2016-12-13 ‧ 由 WeiYuan 分享
DAY 12

資料爬蟲(下) - 動態網頁篇

動態網頁 動態網頁有別於靜態網頁產生資料的方式。靜態網頁是透過每一次使用者請求,後端會產生一次網頁回傳,所以請求與回傳是一對一的,有些人把他們稱為同步。在動態網...

2016-12-14 ‧ 由 WeiYuan 分享
DAY 13

程式化的取用資料

存取資料 了解到電腦如何存放資料,及如何取得想要的資料之後。接下來,我們要試著用程式化的方法去存取資料。所謂的存取指的是怎麼將資料轉到程式中的變數裡,如此一來,...

2016-12-15 ‧ 由 WeiYuan 分享
DAY 14

資料前處理

資料前處理 資料是資料科學中的基石,沒有好的資料,就難以產生好的資料價值。在資料分析中有一句諺語:「Garbage In Garbage Out」,意思就是髒的...

2016-12-16 ‧ 由 WeiYuan 分享
DAY 15

資料視覺化

資料視覺化是什麼? 資料視覺化將資料用圖表/圖像化的方式表現資料。運用這樣的手法,能夠將複雜的資料做簡單的呈現,讓我們對資料有了更多的認識。通常如果使用 Pyt...

2016-12-17 ‧ 由 WeiYuan 分享
DAY 16

用 Python 做資料視覺化 - Matplotlib

Matplotlib Matplotlib 是 Python 中主流的繪圖函式庫,類似 Matlab 的 API 操作。如果想使用 Python 做資料視覺化的...

2016-12-18 ‧ 由 WeiYuan 分享
DAY 17

用 R 做資料視覺化 - ggplot2

ggplot2 ggplot2 是 R 語言中主流的繪圖函式庫,提供了基本的畫圖工具,產出的圖也看起來相當專業。ggplot2 的將圖表與資料分離,這樣一來同一...

2016-12-19 ‧ 由 WeiYuan 分享
DAY 18

用 JavaScript 做資料視覺化 - D3

D3 D3 是 Data-Driven Documents 的縮寫,他是基於 JavaScript 開發的一套視覺化工具。D3 是基於 Data-Driven...

2016-12-20 ‧ 由 WeiYuan 分享
DAY 19

機率與統計 - Statistical Modeling

機器學習 與 統計模型 在資料科學的團隊中,一般分析者來自兩種不同的背景流派: 機器學習/資料探勘派 統計分析模型派 機器學習與統計模型有什麼不同? 一...

2016-12-21 ‧ 由 WeiYuan 分享
DAY 20

淺談資料探勘

資料探勘 前面我們講個幾個題目,像是「資料爬蟲」、「資料前處理」、以及「資料視覺化」等等。接下來我想來談談關於資料科學中「分析」這一塊。一般分析的手法,主要來自...

2016-12-22 ‧ 由 WeiYuan 分享