iT邦幫忙

machine learning相關文章
共有 760 則文章
鐵人賽 AI & Data DAY 26

技術 [Day 26] Final Project (2/5) — 準備開始

接下來幾天的文章會像料理節目一樣,用我事先準備好的材料 (模型、App...) 來進行說明,底下就來整理一下會做的事情吧。 材料: 資料:Kaggle 300...

鐵人賽 AI & Data DAY 28
全民瘋AI系列2.0 系列 第 28

技術 [Day 28] 儲存訓練好的模型

儲存訓練好的模型 今日學習目標 使用 pickle + gzip 儲存模型 將訓練好的模型打包並儲存 載入儲存的模型 讀取打包好的模型並預測 前...

鐵人賽 AI & Data DAY 25

技術 [Day 25] Final Project (1/5) — 目標、計畫說明

目標:資料飛輪 在 [Day 02] Why MLOps — 從"地平說" 走向宇宙 我們提到了資料飛輪 (Data Flywheel) 代...

鐵人賽 AI & Data DAY 27
全民瘋AI系列2.0 系列 第 27

技術 [Day 27] 機器學習常犯錯的十件事

機器學習常犯錯的十件事 今日學習目標 探討機器學習常犯的十件錯誤 前言 人工智慧近年來成為任何產業熱門的話題之一,各公司積極地導入機器學習技術協助產業 AI...

鐵人賽 AI & Data DAY 24

技術 [Day 24] Scoping — 計画通り

It's truly the beginning. Scoping is a big hurdle. - Michael Printup 前言 機器學習的用...

鐵人賽 AI & Data DAY 26
全民瘋AI系列2.0 系列 第 26

技術 [Day 26] 交叉驗證 K-Fold Cross-Validation

今日學習目標 了解 K-Fold 各種不同變形 K-Fold Cross-Validation Nested K-Fold Cross Validation...

鐵人賽 AI & Data DAY 25
全民瘋AI系列2.0 系列 第 25

技術 [Day 25] 交叉驗證 Cross-Validation 簡介

今日學習目標 常見的交叉驗證方法 K-fold Leave one out cross validation Random Subsampling Boot...

鐵人賽 AI & Data DAY 23

技術 [Day 23] 資料旅程 — 好想出去玩 V1.0 ٩(●ᴗ●)۶

If you don't know the provenance or the source of the artifact, it's not scienc...

鐵人賽 AI & Data DAY 22

技術 [Day 22] 驗證資料 — 不可以色色! 加裝資料界的色情守門員

I used to be an adventurer like you, then I took an arrow in the knee. — Lots o...

技術 Ubuntu巡航記(4) -- Rust 安裝

前言 Rust 是一個現代版的 C/C++ 程式語言,它加入物件導向、套件安裝(cargo)、函數式程式設計(Functional Programming)、W...

鐵人賽 AI & Data DAY 24
全民瘋AI系列2.0 系列 第 24

技術 [Day 24] 機器學習 - 不能忽視的過擬合與欠擬合

今日學習目標 如何選擇最佳的模型? 深入理解度擬合與欠擬合 Bias-Variance Tradeoff 如何避免過擬合與欠擬合? 前言 在機器學習中...

技術 Ubuntu巡航記(3) -- Docker 安裝

前言 Docker 是一種虛擬化技術,可以透過容器(Container)建立多個虛擬機,也可以將虛擬機存檔,方便大量佈署。 Docker 安裝 在 Ubuntu...

鐵人賽 AI & Data DAY 21

技術 [Day 21] 資料標註 (2/2) — 各種標註方法

子曰:『工欲善其事,必先利其器。 前言 昨天提到依照 Ground truth 改變的速度會讓不同任務的標註有各種難易度:而依照不同的難度會有不同的標註方法...

技術 Ubuntu巡航記(2) -- 在 Ubuntu 作業系統內安裝 TensorFlow

前言 前一篇搞定 Ubuntu 作業系統的安裝,接下來我們繼續安裝『機器學習』的相關軟體及工具,包括 Anaconda、TensorFlow 及 GPU顯卡支援...

鐵人賽 AI & Data DAY 20

技術 [Day 20] 資料標註 (1/2) — Forget about the price tag ♫

The only thing that never changes is that everything changes. ― Louis L'Amour...

鐵人賽 AI & Data DAY 22
全民瘋AI系列2.0 系列 第 22

技術 [Day 22] Python 視覺化解釋數據 - Plotly Express

Plotly Express 今日學習目標 安裝 plotly 手把手實作視覺化鳶尾花朵資料集 直方圖 特徵關聯度分析 散佈圖 箱形圖 複合型視覺化技巧 匯...

鐵人賽 AI & Data DAY 19

技術 [Day 19] 收集資料 — 你要對人家負責啊!

With data collection, ‘the sooner the better’ is always the best answer. – Mari...

鐵人賽 AI & Data DAY 18

技術 [Day 18] 再訪 HLP — 人(?)的表現是己欲立而立人

Being human means having doubts and yet still continuing on your path. — Paulo...

鐵人賽 AI & Data DAY 21
全民瘋AI系列2.0 系列 第 21

技術 [Day 21] 調整模型超參數利器 - Optuna

Optuna 今日學習目標 Optuna 如何採樣參數? 實作 Optuna 搜尋最佳超參數 以 XGBoost 迴歸模型於房價預測為例 Optuna 視覺...

鐵人賽 AI & Data DAY 17

技術 [Day 17] 定義資料 — 講清楚很難嗎?

Everybody has a different definition of the good side. — Will Wright 前言 美劇《菜鳥新...

鐵人賽 AI & Data DAY 20
全民瘋AI系列2.0 系列 第 20

技術 [Day 20] 機器學習金手指 - Auto-sklearn

Auto-sklearn 今日學習目標 了解 Auto-sklearn 運作原理 Meta Learning Bayesian Optimization B...

鐵人賽 AI & Data DAY 19
全民瘋AI系列2.0 系列 第 19

技術 [Day 19] 自動化機器學習 - AutoML

AutoML 今日學習目標 了解何謂 AutoML 超參數調參方法 Grid Search Random Search Bayesian Optimizat...

技術 Ubuntu巡航記(1) -- 在Windows作業系統下安裝Ubuntu

前言 機器學習的套件許多都不能在Windows作業系統內順利安裝,就算能安裝也要費一番手腳,因此,興起安裝Linux作業系統的念頭,經過一天的努力,總算搞定,期...

鐵人賽 AI & Data DAY 18
全民瘋AI系列2.0 系列 第 18

技術 [Day 18] 機器學習 boosting 神器 - CatBoost

CatBoost 今日學習目標 了解 CatBoost 模型 實作 CatBoost 迴歸模型-房價預測 模型訓練、特徵篩選 超參數搜索 自動處理類別型的特...

鐵人賽 AI & Data DAY 25

技術 負責任的機器學習專案

機器學習的應用程式,介於使用者面向服務、統計學和計算機科學有所交集的領域。使用者面向服務包含個別用戶以及企業用戶。當機器學習服務在市場上愈來愈常見的同時,我們也...

鐵人賽 AI & Data DAY 17
全民瘋AI系列2.0 系列 第 17

技術 [Day 17] 輕量化的梯度提升機 - LightGBM

LightGBM 今日學習目標 LightGBM 與 XGBoost 比較 了解 LightGBM 優點 實作 LightGBM 處理資料不平衡資料 信用卡...

鐵人賽 AI & Data DAY 14

技術 [Day 14] Audit perfomance — 模型也要期末稽核༼ಢ_ಢ༽

It is only our conception of time that makes us call the Last Judgement by this...

鐵人賽 AI & Data DAY 25

技術 管理、技術、商業層面來看:應該買一個?還是自己建一個機器學習系統?

在決定要引入機器學習專案的時候,第一個要思考的問題就是,這個服務應該要從外面買?還是要自己建一個?(buy or build)。這個問題從管理層面、技術層面與商...

鐵人賽 AI & Data DAY 25

技術 整理6個媒體產業在機器學習應用的趨勢

在媒體、娛樂和創意產業中,機器學習與人工智能的使用越來越多。不管是管理數位內容、提供創作者新的靈感等等,這些都會是在媒體產業應用的範疇。在這些應用領域當中,對於...

鐵人賽 AI & Data DAY 16
全民瘋AI系列2.0 系列 第 16

技術 [Day 16] 每個模型我全都要 - 堆疊法 (Stacking)

堆疊法 (Stacking) 今日學習目標 了解 Stacking 方法 堆疊法的學習機制為何? 利用 Stacking 實作迴歸器 透過 Stack...