iT邦幫忙

資料科學相關文章
共有 33 則文章
鐵人賽 AI/ ML & Data DAY 5

技術 《資料與程式碼的交鋒》Day 05 - 資料倉儲/湖/湖倉

故事回到 Day 02 講的新創團隊弄的網購服務吧。本來只有兩個工程師在開發功能,沒想到這個平台有口皆碑,用戶一傳十十傳百,現在用戶已達千萬等級。為了落實『一...

技術 Pudding.cool — 初入data storytelling,你必要認識的數位刊物

剛開始認識data storytelling時,我google關鍵字想找更多資料,Pudding.cool出現在搜尋結果的第一位,點入後,開啟了我對data s...

鐵人賽 AI & Data DAY 29

技術 Day29 主成分分析(Principal Components Analysis, PCA)

前言 鐵人賽來到了最後兩天,其幾天的內容屬於機器學習中監督式學習(Supervised learning)的模型,這兩天將撰寫的是兩種非監督式學習(Unsupe...

鐵人賽 AI & Data DAY 25

技術 Day25 支持向量機(Support Vector Machine , SVM)(2)--Support Vector Classifier

前言 昨天的內容提到當資料可以完美的利用一條直線或超平面(hyperplane)分類時,**最大邊距分類器(Maximal Margin Classifier)...

鐵人賽 AI & Data DAY 24

技術 Day24 支持向量機(Support Vector Machine, SVM)(1) -- Optimal Separating Hyperplane

前言 支持向量機(Support Vector Machine, SVM),是Vladimir Vapnik在 1960 年代首次開發的一類統計模型。在近幾年,...

鐵人賽 AI & Data DAY 20

技術 Day20 決策樹(Decision Tree)(2)--修剪(Pruning)與分類樹(Classification Tree)

前言 昨天的內容提到針對迴歸的問題如何建立決策樹模型,可以針對訓練集的資料有一個好的預測,但是以昨天提到的方式建立一個完美的決策樹模型後,會使得整棵樹的分支很多...

鐵人賽 AI & Data DAY 19

技術 Day19 決策樹(Decision Tree)(1)--迴歸樹(Regression Tree)

前言與介紹 決策樹(Decision tree)在機器學習中是一種容易理解但強大的演算法,可以用來處理分類以及迴歸的問題(Classification and...

鐵人賽 AI & Data DAY 18

技術 Day18 重新抽樣方法(Resampling Methods)與Python

前言 重新抽樣(Resampling)的方法在機器學習或深度學習領域是一個非常重要工具,由訓練集(trainning set)中重新抽樣獲得樣本,在每個樣本上建...

鐵人賽 AI & Data DAY 17

技術 Day17 分類(Classification)(5)-- Python建立線性判別分析(LDA)模型

載入套件 import pandas as pd from sklearn.model_selection import train_test_split fr...

鐵人賽 AI & Data DAY 16

技術 Day16 分類(Classification)(4)-- 線性判別分析( Linear Discriminant Analysis)

前言與介紹 在分類問題中除了邏輯斯迴歸模型外,還有另一種常用的方法為線性判別分析(Linear discriminant analysis, LDA),主要概念...

鐵人賽 AI & Data DAY 14

技術 Day14 分類(Classification)(2)-- 邏輯斯迴歸模型(Logistic Regression)

前言與介紹 在機器學習中常常用來處理分類問題的方法之一為邏輯斯迴歸模型(Logistic regression),與線性迴歸模型不同的是邏輯斯迴歸模型是直接針對...

鐵人賽 AI & Data DAY 13

技術 Day13 分類(Classification)(1)-- 以線性迴歸模型處理分類問題?

前言 在機器學習中,常常把監督式學習根據反應變數是連續資料或類別資料,分為迴歸(Regression)與分類(Classification)兩大類,那麼如果利用...

鐵人賽 AI & Data DAY 11

技術 Day11 K-近鄰演算法(K Nearest Neighbors, KNN)--模型介紹

前言與介紹 K-近鄰演算法(K-Nearest Neighbors),簡稱KNN,屬於機器學習中監督式學習(supervised learning)的無母數方法...

鐵人賽 AI & Data DAY 9

技術 Day9 線性迴歸Linear Regression(4)--幾個常見的潛在問題

前言 資料利用線性迴歸建構模型之後,因為每筆資料特性的不同,可能會有許多問題出現,今天的內容將提到幾個在線性迴歸模型建模後常見的問題。 常見的問題 反應變數...

鐵人賽 AI & Data DAY 8

技術 Day8 線性迴歸Linear Regression(3)--正規化迴歸(Regularized Regression)

前言 在多元迴歸模型中,我們常常關心是否全部的解釋變數都可以幫助預測反應變數,或是只有部分的解釋變數有用?昨天的內容提到可以解決這類問題常見的方法有子集選取法(...

鐵人賽 AI & Data DAY 7

技術 Day7 線性迴歸Linear Regression(2)--多元線性迴歸模型(Multiple Linear Regression)與幾何解釋

前言 昨天介紹了簡單線性迴歸模型的基本架構,當資料只有一個解釋變數或特徵時(一個反應變數Y,多個解釋變數X的情境),這個方法相當方便且容易解釋,但是當資料存在較...

鐵人賽 AI & Data DAY 6

技術 Day6 線性迴歸Linear Regression(1)--簡單線性迴歸模型(Simple Linear Regression)

前言 線性迴歸(Linear Regression)是監督式學習中相對比較簡單且容易理解的方法,一種用來建立X(解釋變數/自變數/預測變數/獨立變項/特徵)與連...

鐵人賽 AI & Data DAY 1

技術 Day1 前言與機器學習簡介

前言 在資料收集愈來愈便利與科學運算愈來愈快的時代下,科學家們致力於找出資料中重要的模式與趨勢,也稱為從資料中學習(learning from data),使得...

技術 利用大數據分析預測MLB勝負(下)

在上一篇文章中,我們介紹了作者最終挑選模了Elastic net (L1+L2) penalty regularization(彈性網路正規化)作為最後的預測模...

鐵人賽 自我挑戰組 DAY 16

技術 16 綜觀各校資工系修課藍圖

資訊工程學系(Computer Science and Information Engineering, CSIE)和電機工程學系是近年在理工學院方面最熱門且最...

鐵人賽 AI & Data DAY 4

技術 DAY04 淺談資料科學與Machine Learning

一、何謂資料科學 資料科學白話來講,就是透過資料數據來解決問題的一門科學,我們在得知客戶的需求、環境限制等因素後,利用能蒐集到的資料建立一套「模型」,透過模型的...

鐵人賽 AI & Data DAY 1

技術 DAY01 前言-學資料科學的小孩不會變壞

一、初次見面請多指教 小編目前大三升大四,一年前開始接觸AI這個領域,動機不外乎就是趨勢,自從AlphaGo找到神之一手後,人類開始全心投入AI領域,Machi...

技術 Alteryx使用案例║Mercedes-Benz 因疫情產線停擺無法交車怎麼辦?

這近一個月的疫情高峰,相信你手頭上會有很多突發的任務要處理 就像是這位 Mercedes-Benz USA 的 Sales Analytics 的 Superv...

徵才 最後3天![國泰數數發]金融科技 招募會

國泰又要找隊友啦~不管你是新鮮人或是職場老手,身懷大數據、資料科學/工程、系統開發、UIUX、產品開發等絕技,歡迎你加入!這次除了台北的職缺,非常特別招募...

徵才 [國泰數數發]數據菁英招募會

你是大數據、資料科學高手,有一身好本領卻苦無發揮舞台?你是職場新鮮人或想要轉戰金融業,想到重重關卡就頭皮發麻?有滿腹Good idea,公司卻沒有資源可以支援...

鐵人賽 AI & Data DAY 3

技術 [03] : 資料科學怪人~來談談「資料科學」,絕對不是打怪這麼簡單而已

「資料科學」:從可用的結構化和非結構化資料中來做探勘或定量分析,進而理解,萃取知識,到制訂出可行動化的結果。 簡單來說就是:使用資料  進行決策  驅動行動...