iT邦幫忙

機器學習相關文章
共有 366 則文章
鐵人賽 AI & Data DAY 5

技術 【Day 5】邏輯斯迴歸 Logistic regression

今日大綱 什麼是邏輯斯迴歸? 最大概似估計 線性迴歸 vs. 邏輯斯迴歸 什麼是邏輯斯迴歸? 邏輯斯迴歸為線性迴歸的變形,其經過sigmoid functi...

鐵人賽 AI & Data DAY 7

技術 Day7 線性迴歸Linear Regression(2)--多元線性迴歸模型(Multiple Linear Regression)與幾何解釋

前言 昨天介紹了簡單線性迴歸模型的基本架構,當資料只有一個解釋變數或特徵時(一個反應變數Y,多個解釋變數X的情境),這個方法相當方便且容易解釋,但是當資料存在較...

鐵人賽 AI & Data DAY 4

技術 【Day 4】使用線性迴歸預測加州房價 Predict the house price in CA using linear regression

今日大綱 資料集 衡量指標 程式碼 資料集 今天我以sklearn所提供的資料集舉例,預測加州不同區的房價,獨立變數與依變數的敘述如下: 獨立變數 Med...

鐵人賽 AI & Data DAY 6

技術 Day6 線性迴歸Linear Regression(1)--簡單線性迴歸模型(Simple Linear Regression)

前言 線性迴歸(Linear Regression)是監督式學習中相對比較簡單且容易理解的方法,一種用來建立X(解釋變數/自變數/預測變數/獨立變項/特徵)與連...

鐵人賽 AI & Data DAY 3

技術 【Day 3】線性迴歸 Linear regression

今日大綱 什麼是線性迴歸? 線性迴歸假設 線性迴歸公式 Loss function 什麼是線性迴歸? 線性迴歸是一種統計方法,其利用線性方程式解釋獨立變數(...

鐵人賽 AI & Data DAY 2

達標好文 技術 Day 1. AI 簡介 - 什麼是 AI

在介紹什麼是 AI 之前,先講一個血淋淋的親身經歷來說明 AI 的重要性。 你喜歡玩遊戲嗎? 我以前很愛玩遊戲,特別是那種很花時間要反覆練功升等級的線上遊戲。有...

鐵人賽 AI & Data DAY 5

技術 Day5 利用Python處理資料(4) -- 資料插補(Imputation)

前言 遺失值(Missing Value)資料的插補也是訓練模型前資料清洗重要的一環,在進行資料分析時資料常常是不完善的,因此需要有一些方法來處理資料遺失的狀況...

鐵人賽 AI & Data DAY 1

技術 [DAY1] 前言

前言 大學修人工智慧這堂課時,期末專題實作一個手寫數字辨識系統開啟了我對機器學習學習之路,在此之前只修過一些理工科基礎課。興趣研究約兩年。藉這個機會回顧自己是怎...

鐵人賽 AI & Data DAY 4

技術 Day4 利用Python處理資料(3)--訓練集(training set)與測試集(testing set)

前言 在監督式學習中,我們可以將收集而來的資料切割為訓練集與測試集來尋找表現最好的模型,而這兩種資料集就像字面上的意思一樣,訓練集是用來訓練模型,測試集是用來測...

鐵人賽 AI & Data DAY 1

技術 Day1 前言與機器學習簡介

前言 在資料收集愈來愈便利與科學運算愈來愈快的時代下,科學家們致力於找出資料中重要的模式與趨勢,也稱為從資料中學習(learning from data),使得...

技術 NBA大數據預測高達65%準確且能賺錢的分析研究,究竟是真是假呢?

今天來分享一篇研究,是由Matthew Houde所撰寫的《Predicting the Outcome of NBA Games》,是一篇利用機器學習的模型去...

技術 利用大數據分析預測MLB勝負(下)

在上一篇文章中,我們介紹了作者最終挑選模了Elastic net (L1+L2) penalty regularization(彈性網路正規化)作為最後的預測模...

技術 利用大數據分析預測MLB勝負(中)

在上一篇文章中,我們介紹作者如何分析MLB賽事,並找出影響比賽勝負較為重要的因子,而今天我們就來看看作者究竟是選擇了哪些模型進行訓練以及預測,並最終做出能夠預測...

徵才 【Cinnamon AI】2022 Global AI Bootcamp - AI 產品實作營

【2022 Global Student Bootcamp - AI 產品實作營】即日起開始報名! 以「開發使用者為導向的產品」為核心概念設計的 Cinnamo...

技術 利用大數據分析預測MLB勝負(上)

本文將要介紹由Andrew Y. Cui撰寫的《Forecasting Outcomes of Major League Baseball Games Usin...

技術 用新技術加強您的內部稽核-將稽核軟體引入組織的 7 個步驟

在 2000 年代初期,內部稽核團隊的典型工作重點是完成對特定財務和運營領域的傳統週期性稽核——這一過程通常與組織的更大目標脫節。今天的內部稽核職能已經發生了徹...

技術 Test / Validation 對中文使用者的困惑

在什麼都先不知道的狀況下,如果問:「先測試,再驗證。」「先驗證,再測試。」各位覺得哪個語意上比較合理呢? 自從幾個月前與人聊過後,三不五時有機會,我就會問身邊的...

鐵人賽 AI & Data
全民瘋AI系列2.0 系列 第 31

技術 [全民瘋AI系列2.0] 完賽總結

全民瘋AI系列2.0完賽總結 不知不覺就參加了三屆iT邦鐵人賽,很高興能夠藉由此活動分享經驗與知識。雖然這三十天過程很辛苦,但也透過這種方式督促我整理這些內容。...

鐵人賽 AI & Data DAY 30
全民瘋AI系列2.0 系列 第 30

技術 [Day 30] 使用 Heroku 部署機器學習 API

使用 Heroku 部署機器學習 API 今日學習目標 動手部署自己的機器學習 API 使用 Heroku 免費雲端平台部署應用程式 前言 開發的最後一哩路...

鐵人賽 AI & Data DAY 29
全民瘋AI系列2.0 系列 第 29

技術 [Day 29] 使用 Python Flask 架設 API 吧!

使用 Python Flask 架設 API 吧! 今日學習目標 API 觀念講解 什麼是 API? RESTful API HTTP Request 方法...

鐵人賽 AI & Data DAY 28
全民瘋AI系列2.0 系列 第 28

技術 [Day 28] 儲存訓練好的模型

儲存訓練好的模型 今日學習目標 使用 pickle + gzip 儲存模型 將訓練好的模型打包並儲存 載入儲存的模型 讀取打包好的模型並預測 前...

鐵人賽 AI & Data DAY 27
全民瘋AI系列2.0 系列 第 27

技術 [Day 27] 機器學習常犯錯的十件事

機器學習常犯錯的十件事 今日學習目標 探討機器學習常犯的十件錯誤 前言 人工智慧近年來成為任何產業熱門的話題之一,各公司積極地導入機器學習技術協助產業 AI...

鐵人賽 自我挑戰組 DAY 27
Python資料分析學習地圖 系列 第 27

技術 Day 27 : 模型解釋 Shap

在經過集成式學習(ensemble learning)之後的 tree based (像是 Random Forest, XGBoost, LightGBM)...

鐵人賽 AI & Data DAY 26
全民瘋AI系列2.0 系列 第 26

技術 [Day 26] 交叉驗證 K-Fold Cross-Validation

今日學習目標 了解 K-Fold 各種不同變形 K-Fold Cross-Validation Nested K-Fold Cross Validation...

鐵人賽 自我挑戰組 DAY 26
Python資料分析學習地圖 系列 第 26

技術 Day 26 : LightGBM 與 GridSearch

LightGBM GBDT(Gradient Boosting Decision Tree) 是利用弱分類器迭代訓練來得到最佳的模型,而 LightGBM(Li...

鐵人賽 AI & Data DAY 25
全民瘋AI系列2.0 系列 第 25

技術 [Day 25] 交叉驗證 Cross-Validation 簡介

今日學習目標 常見的交叉驗證方法 K-fold Leave one out cross validation Random Subsampling Boot...

鐵人賽 自我挑戰組 DAY 25
Python資料分析學習地圖 系列 第 25

技術 Day 25 : XGBoost

極限梯度提升 eXtreme Gradient Boosting(XGBoost) ,被稱為 Kaggle 競賽神器,常常第一名都是使用這個演算法。先來前情提要...

鐵人賽 AI & Data DAY 24
全民瘋AI系列2.0 系列 第 24

技術 [Day 24] 機器學習 - 不能忽視的過擬合與欠擬合

今日學習目標 如何選擇最佳的模型? 深入理解度擬合與欠擬合 Bias-Variance Tradeoff 如何避免過擬合與欠擬合? 前言 在機器學習中...

鐵人賽 自我挑戰組 DAY 24
Python資料分析學習地圖 系列 第 24

技術 Day 24 : 隨機森林

原理 昨天有提到 Bagging 最有名的例子就是隨機森林,它是集合多棵決策樹來進行預測,很多樹就成為了森林,稱之為隨機森林。每一棵樹只能看見部分特徵,但透過多...

鐵人賽 AI & Data DAY 23
全民瘋AI系列2.0 系列 第 23

技術 [Day 23] 資料分布與離群值處理

資料分布與離群值處理 今日學習目標 資料特徵觀察與離群值分析 檢視資料的分布狀態 偏度 (Skewness) 峰度 (Kurtosis) 修正特徵偏度的...