國泰又要找隊友啦~不管你是新鮮人或是職場老手,身懷大數據、資料科學/工程、系統開發、UIUX、產品開發等絕技,歡迎你加入!這次除了台北的職缺,非常特別招募...
圖片來源:https://pixabay.com/en/books-spine-colors-pastel-1099067/ 和 https://pixabay...
前言 資料利用線性迴歸建構模型之後,因為每筆資料特性的不同,可能會有許多問題出現,今天的內容將提到幾個在線性迴歸模型建模後常見的問題。 常見的問題 反應變數...
你是大數據、資料科學高手,有一身好本領卻苦無發揮舞台?你是職場新鮮人或想要轉戰金融業,想到重重關卡就頭皮發麻?有滿腹Good idea,公司卻沒有資源可以支援...
圖片來源:https://pixabay.com/en/books-spine-colors-pastel-1099067/ 和 https://pixabay...
圖片來源: https://pixabay.com/en/books-spine-colors-pastel-1099067/ 和 https://pixaba...
圖片來源:https://pixabay.com/en/books-spine-colors-pastel-1099067/ 和 https://pixabay...
「資料科學」:從可用的結構化和非結構化資料中來做探勘或定量分析,進而理解,萃取知識,到制訂出可行動化的結果。 簡單來說就是:使用資料 進行決策 驅動行動...
前言與介紹 K-近鄰演算法(K-Nearest Neighbors),簡稱KNN,屬於機器學習中監督式學習(supervised learning)的無母數方法...
前言與介紹 決策樹(Decision tree)在機器學習中是一種容易理解但強大的演算法,可以用來處理分類以及迴歸的問題(Classification and...
前言 昨天介紹了簡單線性迴歸模型的基本架構,當資料只有一個解釋變數或特徵時(一個反應變數Y,多個解釋變數X的情境),這個方法相當方便且容易解釋,但是當資料存在較...
圖片來源:https://pixabay.com/en/books-spine-colors-pastel-1099067/ 和 https://pixabay...
一、何謂資料科學 資料科學白話來講,就是透過資料數據來解決問題的一門科學,我們在得知客戶的需求、環境限制等因素後,利用能蒐集到的資料建立一套「模型」,透過模型的...
前言 鐵人賽來到了最後兩天,其幾天的內容屬於機器學習中監督式學習(Supervised learning)的模型,這兩天將撰寫的是兩種非監督式學習(Unsupe...
圖片來源:https://pixabay.com/en/books-spine-colors-pastel-1099067/ 和 https://pixabay...
圖片來源:https://pixabay.com/en/books-spine-colors-pastel-1099067/ 和 https://pixabay...
前言 重新抽樣(Resampling)的方法在機器學習或深度學習領域是一個非常重要工具,由訓練集(trainning set)中重新抽樣獲得樣本,在每個樣本上建...
前言 昨天的內容提到針對迴歸的問題如何建立決策樹模型,可以針對訓練集的資料有一個好的預測,但是以昨天提到的方式建立一個完美的決策樹模型後,會使得整棵樹的分支很多...
一、初次見面請多指教 小編目前大三升大四,一年前開始接觸AI這個領域,動機不外乎就是趨勢,自從AlphaGo找到神之一手後,人類開始全心投入AI領域,Machi...
前言 在多元迴歸模型中,我們常常關心是否全部的解釋變數都可以幫助預測反應變數,或是只有部分的解釋變數有用?昨天的內容提到可以解決這類問題常見的方法有子集選取法(...
載入套件 import pandas as pd from sklearn.model_selection import train_test_split fr...
前言與介紹 在機器學習中常常用來處理分類問題的方法之一為邏輯斯迴歸模型(Logistic regression),與線性迴歸模型不同的是邏輯斯迴歸模型是直接針對...
前言 線性迴歸(Linear Regression)是監督式學習中相對比較簡單且容易理解的方法,一種用來建立X(解釋變數/自變數/預測變數/獨立變項/特徵)與連...
資訊工程學系(Computer Science and Information Engineering, CSIE)和電機工程學系是近年在理工學院方面最熱門且最...
前言與介紹 在分類問題中除了邏輯斯迴歸模型外,還有另一種常用的方法為線性判別分析(Linear discriminant analysis, LDA),主要概念...
這近一個月的疫情高峰,相信你手頭上會有很多突發的任務要處理 就像是這位 Mercedes-Benz USA 的 Sales Analytics 的 Superv...
在上一篇文章中,我們介紹了作者最終挑選模了Elastic net (L1+L2) penalty regularization(彈性網路正規化)作為最後的預測模...
前言 支持向量機(Support Vector Machine, SVM),是Vladimir Vapnik在 1960 年代首次開發的一類統計模型。在近幾年,...
前言 在機器學習中,常常把監督式學習根據反應變數是連續資料或類別資料,分為迴歸(Regression)與分類(Classification)兩大類,那麼如果利用...
前言 在資料收集愈來愈便利與科學運算愈來愈快的時代下,科學家們致力於找出資料中重要的模式與趨勢,也稱為從資料中學習(learning from data),使得...