從校園畢業走到職場,用自身剛畢業的新鮮人角度來看待資料科學這個技術的發展與演進。過去在學校,往往會陷入一個特定的角度解問題。然而,在面對真實的世界,有許許多多的事情需要被考慮。所以,試圖從最務實的角度開始,結合理論與實作去探索資料科學的真實世界。
思考流程 資料科學的流程基本原則就是:「從資料開始,透過一連串的過程發現隱藏在資料中的規則,利用這些規則完成一些有趣的應用。」大致的流程會是: 取得資料 -&g...
Python 在資料科學的領域中, R 與 Python 是單機上分析最常被提及到的兩個語言,原因不外乎是好上手、擁有豐富的函式庫、社群完整等等的因素,所以接下...
執行程式 Python 執行程式的方法有幾種: 直譯器互動模式 打開你的終端機,直接輸入 Python 或 Python3 指令,系統會回傳基本資訊及 &g...
R Language R 語言在安裝上比較簡單,不像 Python 需要做比較多的環境設定。一般 R 語言的開發都是直接使用 RStudio IDE。所謂 ID...
執行程式 R 執行程式一般都是使用 Rstudio,可以使用左上角執行程式檔,也可以使用左下角的互動模式。另外,這次鐵人賽有看到蠻多組也是在講 R 程式設計的,...
資料科學與 JavaScript 前面幾天介紹的 Python 及 R 語言是資料科學家的主要工具,用來做資料的處理、分析。我認為除了那兩個語言之外,JavaS...
資料庫 講到資料科學就要從資料開始,資料會存在資料庫(Database)當中。資料庫可以當成是資料的檔案櫃,當需要的時候才將所需的資聊拉出來。一般來說,資料庫可...
非關聯式資料庫 非關聯式資料庫的縮寫是 NoSQL,全名叫做 Not only SQL。一般在關聯式資料庫的通用查詢語言是SQL,但是 NoSQL 相對來說就有...
資料 根據維基百科中,對於資料的定義:「資料(英語:data),是指未經過處理的原始記錄。一般而言,資料缺乏組織及分類,無法明確的表達事物代表的意義,它可能是一...