從校園畢業走到職場,用自身剛畢業的新鮮人角度來看待資料科學這個技術的發展與演進。過去在學校,往往會陷入一個特定的角度解問題。然而,在面對真實的世界,有許許多多的事情需要被考慮。所以,試圖從最務實的角度開始,結合理論與實作去探索資料科學的真實世界。
關聯規則 在資料探勘的演講或是課程上,講者一定會提到「啤酒尿布」這樣的案例。估且不論這是不是江湖謠傳,這的確是一個經典的資料探勘算法 - 關聯規則(Associ...
分類法 分類法(Classification)是資料探勘與機器學習中重要的算法。分類主要是用來將資料做區分,判斷資料是屬於哪一個類別。從原有的已知類別的資料集進...
分群法 分群法或稱叢集法(Clusering)是相對於分類法的另外一種資料探勘技術。分群法也是用來將資料做區分的,差別在於原本的資料都是未經過類別區分的。因為是...
機器學習 機器學習是從人工智慧這門學科延伸出來的分支,主要是透過演算法試圖從資料中「學習」到資料的規律,用來預測資料的特性。 與資料探勘,統計分析的異同 機器學...
線性回歸(Linear Regression) 線性回歸是源自於統計學的方法,不過在機器學習這門學科中同樣有使用。不過依照目標及背景不同,也產生了出不同觀點的發...
機器學習演算法 在機器學習這個主題中,一開始先介紹了什麼事機器學習,他在資料科學中扮演什麼樣的角色。接著,簡單說明兩個基礎的演算法「線性回歸」與「邏輯回歸」。不...
「學習」之外的事 介紹了幾個常見的機器學習演算法,今天主要想補充一些學習方法核心之外的事情。介紹幾個優化的方法及常見的處理手法。 其他機器學習的分類 除了我們前...