iT邦幫忙

機器學習相關文章
共有 366 則文章
鐵人賽 影片教學 DAY 26

技術 [Day-26] R語言 - 分群應用(五) 分群預測 - 資料分群 ( data clustering in R.Studio )

您的訂閱是我製作影片的動力訂閱點這裡~ 影片程式碼(延續昨天) #步驟二: 資料分群,哪個演算法? data_num <- done[,c(6,13:2...

鐵人賽 影片教學 DAY 7

技術 [Day-7] R語言 - K - means 簡介 ( K - means Algorithm )

您的訂閱是我製作影片的動力訂閱點這裡~ 若內容有誤,還請留言指正,謝謝您的指教

鐵人賽 影片教學 DAY 30

技術 [Day-30] R語言 - 分群總結與感言 ( Clustering Summary )

您的訂閱是我製作影片的動力訂閱點這裡~ 若內容有誤,還請留言指正,謝謝您的指教

技術 利用大數據分析預測MLB勝負(中)

在上一篇文章中,我們介紹作者如何分析MLB賽事,並找出影響比賽勝負較為重要的因子,而今天我們就來看看作者究竟是選擇了哪些模型進行訓練以及預測,並最終做出能夠預測...

鐵人賽 影片教學 DAY 19

技術 [Day-19] R語言 - 分群應用(一) k - prototype類別補值 - 下 ( Fill.NA with k - prototype in R.Studio )

您的訂閱是我製作影片的動力訂閱點這裡~ 影片程式碼 (延續昨天) #均值+眾數 vs 列入各群權重 final_mean <- final[,c(1:4...

鐵人賽 AI & Data DAY 12

技術 Day12 K-近鄰演算法(K Nearest Neighbors, KNN)-- Python建立模型

前言 今天將以Python建立KNN的模型,包含如何選擇一個適當的K值。以iris為例,將屬種(Species)當成反應變數或outcome,共有三類,以KNN...

鐵人賽 AI & Data DAY 4

技術 【Day 4】使用線性迴歸預測加州房價 Predict the house price in CA using linear regression

今日大綱 資料集 衡量指標 程式碼 資料集 今天我以sklearn所提供的資料集舉例,預測加州不同區的房價,獨立變數與依變數的敘述如下: 獨立變數 Med...

鐵人賽 影片教學 DAY 21
R語言-預測方法大全 系列 第 21

技術 [Day-21] 預測操作--xgb-下 (xgb predict in r)

您的訂閱是我製作影片的動力訂閱點這裡~ 若內容有誤,還請留言指正,謝謝您的指教 #影片程式碼 #延續DAY20 set.seed(123) model &lt...

鐵人賽 影片教學 DAY 24

技術 [Day-24] R語言 - 分群應用(五) 分群預測 - 取得真實資料集&說明 ( real data from UCI )

您的訂閱是我製作影片的動力訂閱點這裡~ 資料集下載處 影片程式碼 ## 應用五: 分群建模 #### library(dplyr) data <- re...

鐵人賽 AI & Data DAY 1

技術 Day1 前言與機器學習簡介

前言 在資料收集愈來愈便利與科學運算愈來愈快的時代下,科學家們致力於找出資料中重要的模式與趨勢,也稱為從資料中學習(learning from data),使得...

鐵人賽 AI & Data DAY 13

技術 Day13 分類(Classification)(1)-- 以線性迴歸模型處理分類問題?

前言 在機器學習中,常常把監督式學習根據反應變數是連續資料或類別資料,分為迴歸(Regression)與分類(Classification)兩大類,那麼如果利用...

鐵人賽 AI & Data DAY 26

技術 〔Day26〕看看Orange歸類文本之效果

經過上一篇文字預處理後,我們會得到一行行的文本內容,但這樣對於機器學習來說是無法好好讀取訊息的,所以要將這些單字轉換成數值,以便後續操作。來!我們快點開始動手實...

鐵人賽 AI & Data DAY 25

技術 〔Day25〕文字預處理,過濾多餘的詞-Text

在前幾次,我們有用表格與圖像的數據來進行分析,那麼今天要來點不一樣的,換成如標題所說的「文本」做主題啦~~預備備~開始! 安裝文字插件 打開Orange上的工作...

鐵人賽 影片教學 DAY 14

技術 [Day-14] R語言 - GMM 高斯混和模型 實作-下 feat EM調參 ( GMM & EM in R.Studio )

您的訂閱是我製作影片的動力訂閱點這裡~ 影片程式碼 #延續上一支影片 gmm = GMM(iris, 4, dist_mode = "eucl_di...

鐵人賽 AI & Data DAY 27

技術 〔Day27〕用線性迴歸預測童話故事的類別-Logistic Regression

於上一篇,我們懂得如何歸類故事類別,那麼今天將帶大家用機器學習模型對新故事進行分類!我們開始執行吧~ 匯檔→預處理→增加文字轉換成數值之屬性 這邊跟上一篇一樣,...

鐵人賽 AI & Data DAY 4

技術 【Day 4】資料預處理 Data Preprocessing ( 一 )

前言 資料預處理 ( Data Preprocessing ) 指的是在進行機器學習或深度學習之前,對原始的資料進行處理或轉換的過程,是相當重要的流程,為了確保...

鐵人賽 AI & Data DAY 19

技術 〔Day19〕如何找出最佳屬性-Box Plot、Distribution

在上篇我們有用到wine這個內鍵數據集,今天一樣要用它來帶大家挑出主要影響分類的屬性!我們開始著手吧~ 分類型數據集評估 在上篇有說到,這組數據為義大利同一地區...

鐵人賽 影片教學 DAY 29

技術 [Day-29] R語言 - 分群其他演算法 ( Clustering other Algorithms )

您的訂閱是我製作影片的動力訂閱點這裡~ 若內容有誤,還請留言指正,謝謝您的指教

鐵人賽 影片教學 DAY 2

技術 [Day-2] R語言 - 分群是甚麼? (what's clustering)

您的訂閱是我製作影片的動力訂閱點這裡~ 若內容有誤,還請留言指正,謝謝您的指教

鐵人賽 AI & Data DAY 11

技術 【Day 11】梯度下降 Gradient Descent

前言 梯度下降 ( Gradient Descent ) 是一種最優化模型算法,用於調整模型參數以最小化損失函數。它是機器學習和深度學習中最常用的優化方法之一,...

技術 量化交易 X 跨界金融 | EP.3 股市資料視覺化---價格計算指標

前言 本章節將介紹Ta-lib中的價格計算指標,協助進行股市的各類價格計算,將原始價格經由價格換算函數的處理後,提供使用者進行投資參考,訂定彈性的投資策略與技...

鐵人賽 AI & Data DAY 7

技術 【Day 7】支持向量機 Support vector machine

今日大綱 什麼是支持向量機? 支持向量機種類 支持向量機特點 什麼是支持向量機? 支持向量機可以處理迴歸與分類的問題,其目標為最大化間距 (Margin)。...

鐵人賽 影片教學 DAY 17

技術 [Day-17] R語言 - 分群應用(一) GMM數值補值-下 ( Fill.NA with GMM in R.Studio )

您的訂閱是我製作影片的動力訂閱點這裡~ 影片程式碼 (延續昨天) #均值 vs 列入各群權重 final_mean <- final[,c(1:4,10...

鐵人賽 AI & Data DAY 6

技術 【Day 6】邏輯斯迴歸實作 Logistic regression Implementation

今日大綱 資料集 評估指標 程式碼 資料集 邏輯斯迴歸實作我以常見的鳶尾花(Iris)資料集當作範例,在機器學習開源資料集網站UCI,或是sklearn l...

鐵人賽 AI & Data DAY 22

技術 〔Day22〕利用組件找出離群點-Silhouette

於第二十篇中,我們有提到Silhouette(輪廓),它是一個評估群聚效果的方法,可以幫我們找尋到最佳群聚數。而今天我們就來深入了解其含意,並且利用它來找出數據...

鐵人賽 影片教學 DAY 15

技術 [Day-15] R語言 - 分群應用(一) 補值前處理 ( Fill.NA with Clustering in R.Studio )

您的訂閱是我製作影片的動力訂閱點這裡~ 影片程式碼 ## 應用一: 分群補數值 #### library(missForest) #產生隨機na值 libra...

鐵人賽 AI & Data DAY 3

技術 【Day 3】線性迴歸 Linear regression

今日大綱 什麼是線性迴歸? 線性迴歸假設 線性迴歸公式 Loss function 什麼是線性迴歸? 線性迴歸是一種統計方法,其利用線性方程式解釋獨立變數(...

鐵人賽 AI & Data DAY 5

技術 【Day 5】資料預處理 Data Preprocessing ( 二 )

前言 資料正規化 ( Normalization ) 與標準化 ( Standardization ) 在機器學習中是為重要的資料預處理技術,將特徵值縮放到一個...

鐵人賽 AI & Data DAY 21

技術 〔Day21〕了解K-means的底層運作-Educational

在上一篇我們有用到K-means把數據分群以及視覺化其分群效果,但若是沒先了解過K-means的你,經由上篇應該還沒有很懂它的運作方式吧,今天我將帶你一同了解其...

鐵人賽 影片教學 DAY 25

技術 [Day-25] R語言 - 分群應用(五) 分群預測 - 資料清洗 ( data cleaning in R.Studio )

您的訂閱是我製作影片的動力訂閱點這裡~ 影片程式碼(延續昨天) #步驟一: na補值&相異點or離群值偵測 library(naniar)#前置1:...