iT邦幫忙

鐵人檔案

2017 iT 邦幫忙鐵人賽
回列表
Big Data

從學生到職場:菜鳥資料科學家的第一個月 系列

從校園畢業走到職場,用自身剛畢業的新鮮人角度來看待資料科學這個技術的發展與演進。過去在學校,往往會陷入一個特定的角度解問題。然而,在面對真實的世界,有許許多多的事情需要被考慮。所以,試圖從最務實的角度開始,結合理論與實作去探索資料科學的真實世界。

鐵人鍊成 | 共 28 篇文章 | 89 人訂閱 訂閱系列文 RSS系列文
DAY 1

資料科學的思考流程

思考流程 資料科學的流程基本原則就是:「從資料開始,透過一連串的過程發現隱藏在資料中的規則,利用這些規則完成一些有趣的應用。」大致的流程會是: 取得資料 -&g...

2016-12-03 ‧ 由 WeiYuan 分享
DAY 2

Python 程式語言初探 - 環境篇

Python 在資料科學的領域中, R 與 Python 是單機上分析最常被提及到的兩個語言,原因不外乎是好上手、擁有豐富的函式庫、社群完整等等的因素,所以接下...

2016-12-04 ‧ 由 WeiYuan 分享
DAY 3

Python 程式語言初探 - 操作篇

執行程式 Python 執行程式的方法有幾種: 直譯器互動模式 打開你的終端機,直接輸入 Python 或 Python3 指令,系統會回傳基本資訊及 &g...

2016-12-05 ‧ 由 WeiYuan 分享
DAY 4

R 程式語言初探 - 環境篇

R Language R 語言在安裝上比較簡單,不像 Python 需要做比較多的環境設定。一般 R 語言的開發都是直接使用 RStudio IDE。所謂 ID...

2016-12-06 ‧ 由 WeiYuan 分享
DAY 5

R 程式語言初探 - 操作篇

執行程式 R 執行程式一般都是使用 Rstudio,可以使用左上角執行程式檔,也可以使用左下角的互動模式。另外,這次鐵人賽有看到蠻多組也是在講 R 程式設計的,...

2016-12-07 ‧ 由 WeiYuan 分享
DAY 6

JavaScript 程式語言與資料科學

資料科學與 JavaScript 前面幾天介紹的 Python 及 R 語言是資料科學家的主要工具,用來做資料的處理、分析。我認為除了那兩個語言之外,JavaS...

2016-12-08 ‧ 由 WeiYuan 分享
DAY 7

資料庫系統應用 - 關聯式資料庫

資料庫 講到資料科學就要從資料開始,資料會存在資料庫(Database)當中。資料庫可以當成是資料的檔案櫃,當需要的時候才將所需的資聊拉出來。一般來說,資料庫可...

2016-12-09 ‧ 由 WeiYuan 分享
DAY 8

資料庫系統應用 - 非關聯式資料庫

非關聯式資料庫 非關聯式資料庫的縮寫是 NoSQL,全名叫做 Not only SQL。一般在關聯式資料庫的通用查詢語言是SQL,但是 NoSQL 相對來說就有...

2016-12-10 ‧ 由 WeiYuan 分享
DAY 9

資料怎麼存在電腦裡?資料格式解密

資料 根據維基百科中,對於資料的定義:「資料(英語:data),是指未經過處理的原始記錄。一般而言,資料缺乏組織及分類,無法明確的表達事物代表的意義,它可能是一...

2016-12-11 ‧ 由 WeiYuan 分享
DAY 10

資料來源與取得

資料來源 跨資料分析能夠結合不同的知識,進而找出資料間無法明顯發覺的關連性。跨資料分析牽涉到不同領域的背景,也需要處理、串聯不同來源的資料集,是一個具有挑戰的工...

2016-12-12 ‧ 由 WeiYuan 分享