iT邦幫忙

鐵人檔案

2017 iT 邦幫忙鐵人賽
回列表
Big Data

從學生到職場:菜鳥資料科學家的第一個月 系列

從校園畢業走到職場,用自身剛畢業的新鮮人角度來看待資料科學這個技術的發展與演進。過去在學校,往往會陷入一個特定的角度解問題。然而,在面對真實的世界,有許許多多的事情需要被考慮。所以,試圖從最務實的角度開始,結合理論與實作去探索資料科學的真實世界。

鐵人鍊成 | 共 30 篇文章 | 62 人訂閱 訂閱系列文 RSS系列文
DAY 11

資料怎麼存在電腦裡?資料格式解密

資料 根據維基百科中,對於資料的定義:「資料(英語:data),是指未經過處理的原始記錄。一般而言,資料缺乏組織及分類,無法明確的表達事物代表的意義,它可能是一...

2016-12-11 ‧ 由 v123582 分享
DAY 12

資料來源與取得

資料來源 跨資料分析能夠結合不同的知識,進而找出資料間無法明顯發覺的關連性。跨資料分析牽涉到不同領域的背景,也需要處理、串聯不同來源的資料集,是一個具有挑戰的工...

2016-12-12 ‧ 由 v123582 分享
DAY 13

資料爬蟲(上) - 靜態網頁篇

資料爬蟲 Data Crawler 前一篇有講到,資料爬蟲是用在沒有以檔案或是 API 釋出資料集的情況下。這個時候就只能捲起袖子,自己想要的資料自己爬!我會分...

2016-12-13 ‧ 由 v123582 分享
DAY 14

資料爬蟲(下) - 動態網頁篇

動態網頁 動態網頁有別於靜態網頁產生資料的方式。靜態網頁是透過每一次使用者請求,後端會產生一次網頁回傳,所以請求與回傳是一對一的,有些人把他們稱為同步。在動態網...

2016-12-14 ‧ 由 v123582 分享
DAY 15

程式化的取用資料

存取資料 了解到電腦如何存放資料,及如何取得想要的資料之後。接下來,我們要試著用程式化的方法去存取資料。所謂的存取指的是怎麼將資料轉到程式中的變數裡,如此一來,...

2016-12-15 ‧ 由 v123582 分享
DAY 16

資料前處理

資料前處理 資料是資料科學中的基石,沒有好的資料,就難以產生好的資料價值。在資料分析中有一句諺語:「Garbage In Garbage Out」,意思就是髒的...

2016-12-16 ‧ 由 v123582 分享
DAY 17

資料視覺化

資料視覺化是什麼? 資料視覺化將資料用圖表/圖像化的方式表現資料。運用這樣的手法,能夠將複雜的資料做簡單的呈現,讓我們對資料有了更多的認識。通常如果使用 Pyt...

2016-12-17 ‧ 由 v123582 分享
DAY 18

用 Python 做資料視覺化 - Matplotlib

Matplotlib Matplotlib 是 Python 中主流的繪圖函式庫,類似 Matlab 的 API 操作。如果想使用 Python 做資料視覺化的...

2016-12-18 ‧ 由 v123582 分享
DAY 19

用 R 做資料視覺化 - ggplot2

ggplot2 ggplot2 是 R 語言中主流的繪圖函式庫,提供了基本的畫圖工具,產出的圖也看起來相當專業。ggplot2 的將圖表與資料分離,這樣一來同一...

2016-12-19 ‧ 由 v123582 分享
DAY 20

用 JavaScript 做資料視覺化 - D3

D3 D3 是 Data-Driven Documents 的縮寫,他是基於 JavaScript 開發的一套視覺化工具。D3 是基於 Data-Driven...

2016-12-20 ‧ 由 v123582 分享