iT邦幫忙

機器學習相關文章
共有 414 則文章
鐵人賽 AI & Data DAY 26

技術 [DAY26] 機器學習 - 決策樹(二)

整體/集成學習 通過結合多個基本模型的預測結果,獲得更好的整體預測性能。 可以是相同類型的模型,也可以是不同類型的模型。 通過集體決策來消除個別模型的不足,從...

鐵人賽 AI & Data DAY 19

技術 〔Day19〕如何找出最佳屬性-Box Plot、Distribution

在上篇我們有用到wine這個內鍵數據集,今天一樣要用它來帶大家挑出主要影響分類的屬性!我們開始著手吧~ 分類型數據集評估 在上篇有說到,這組數據為義大利同一地區...

鐵人賽 影片教學 DAY 13

技術 [Day-13] R語言 - GMM高斯混和模型 實作-上 ( GMM in R.Studio )

您的訂閱是我製作影片的動力訂閱點這裡~ 影片程式碼 library(naniar) data(iris) any_na(iris) #前置1: chk NA...

鐵人賽 AI & Data DAY 26

技術 Day26 支持向量機(Support Vector Machine , SVM)(3)--SVM and Kernel

前言 過去內容提到的Optimal Separating Hyperplane、Support Vector Classifier與LDA等方法,都是利用線性的...

鐵人賽 AI & Data DAY 23

技術 【Day 23】正則化 Regularization

前言 前面幾天提到過,當一個模型的參數較多,會導致模型複雜度過高,這會讓模型在訓練資料的擬和表現很好,但在新的陌生資料上 ( 測試資料 ) 表現不佳,就會出現過...

鐵人賽 AI & Data DAY 15

技術 Day15 分類(Classification)(3)-- Python建立邏輯斯迴歸模型

載入套件 import pandas as pd from sklearn.model_selection import train_test_split fr...

技術 量化交易 X 跨界金融 | EP.4 股市資料視覺化---股市量能指標

前言 本章節將介紹股市的量能指標,顧名思義是用來追蹤成交量的技術指標,以股市的成交量變化來衡量股市推動力,協助投資者判讀股價的走勢,例如,當一檔股票的成交量過...

鐵人賽 AI & Data DAY 17

技術 [DAY17] 機器學習-迴歸分析(二)

邏輯迴歸 (Logistic Regression) 分類度量 混淆矩陣(Confusion Matrix) 混淆矩陣包括真正例(True Positives,...

鐵人賽 影片教學 DAY 18

技術 [Day-18] R語言 - 分群應用(一) k - prototype類別補值 - 上 ( Fill.NA with k - prototype in R.Studio )

您的訂閱是我製作影片的動力訂閱點這裡~ 影片程式碼 ## 應用一: 分群補值(數值+類別) #### library(missForest) #產生隨機na值...

鐵人賽 影片教學 DAY 3
R語言-預測方法大全 系列 第 3

技術 [Day-3] 預測觀念2-資料清洗(na值處理)

您的訂閱是我製作影片的動力訂閱點這裡~ 若內容有誤,還請留言指正,謝謝您的指教 #影片程式碼 #檔案因版權問題無法上傳,請見諒 library(dplyr)...

鐵人賽 AI & Data DAY 4

技術 【Day 4】使用線性迴歸預測加州房價 Predict the house price in CA using linear regression

今日大綱 資料集 衡量指標 程式碼 資料集 今天我以sklearn所提供的資料集舉例,預測加州不同區的房價,獨立變數與依變數的敘述如下: 獨立變數 Med...

鐵人賽 AI & Data DAY 25

技術 [DAY25] 機器學習 - 決策樹(一)

決策樹 用於分類和回歸問題。 混亂評估指標 Information Gain (資訊獲利) 衡量了使用某個特徵分割後熵的減少 熵是衡量不確定性的指標。...

鐵人賽 AI & Data DAY 22

技術 〔Day22〕利用組件找出離群點-Silhouette

於第二十篇中,我們有提到Silhouette(輪廓),它是一個評估群聚效果的方法,可以幫我們找尋到最佳群聚數。而今天我們就來深入了解其含意,並且利用它來找出數據...

鐵人賽 影片教學 DAY 22
R語言-預測方法大全 系列 第 22

技術 [Day-22] 預測操作--SVM-上 (SVM predict in r)

您的訂閱是我製作影片的動力訂閱點這裡~ 若內容有誤,還請留言指正,謝謝您的指教 #影片程式碼 data(iris) iris <- iris[,-c(5...

鐵人賽 AI/ ML & Data DAY 13

技術 [Day 13] 從機器學習到深度學習:人工智慧的下一步

前言 前幾天將一些簡單的機器學習方法及實作完成了,接著我們將開始新的篇章深度學習,讓我們繼續往下更深入的了解人工智慧的奧秘吧! 什麼是深度學習 那甚麼是深度學習...

鐵人賽 AI & Data DAY 12

技術 Day12 K-近鄰演算法(K Nearest Neighbors, KNN)-- Python建立模型

前言 今天將以Python建立KNN的模型,包含如何選擇一個適當的K值。以iris為例,將屬種(Species)當成反應變數或outcome,共有三類,以KNN...

鐵人賽 AI & Data DAY 20

技術 【Day 20】模型評估(三) : ROC / AUC 特性曲線

前言 昨天提到如何算出評估模型的各種驗證指標,今天就要利用驗證指標中的兩個指標,這兩個指標都是針對預測為陽性 ( 1 ) 時的情況下做比率的計算,一個是召回率...

鐵人賽 AI & Data DAY 6

技術 [Day 6] 非監督學習也能做到可解釋性?探索XAI在非監督學習中的應用

由於非監督學習模型通常沒有像監督學習中的標籤可使用,因此非監督學習模型的可解釋性通常是透過資料視覺化和數據分析來實現。以下為各位整理非監督學習中可解釋性的一些例...

鐵人賽 影片教學 DAY 12

技術 [Day-12] R語言 - K - prototype 實作 ( K - prototype in R.Studio)

您的訂閱是我製作影片的動力訂閱點這裡~ 影片程式碼 ## k prototype #### library(clustMixType) data(iris)...

鐵人賽 AI & Data DAY 24

技術 [DAY24] 機器學習 - 強化學習

強化學習概論 讓智慧型代理人/智慧體/智能體(intelligent agent)通過與環境的交互學習如何做出決策,以最大化一個獎勵信號。它通常涉及到Agent...

鐵人賽 影片教學 DAY 11

技術 [Day-11] R語言 - K - mode 實作 ( K - mode in R.Studio)

您的訂閱是我製作影片的動力訂閱點這裡~ 影片程式碼 library(naniar) data(iris) any_na(iris) #前置1: chk NA...

鐵人賽 影片教學 DAY 20
R語言-預測方法大全 系列 第 20

技術 [Day-20] 預測操作--xgb-中 (xgb tuning in r)

您的訂閱是我製作影片的動力訂閱點這裡~ 若內容有誤,還請留言指正,謝謝您的指教 #影片程式碼 #延續DAY19 importance <- xgb.im...

鐵人賽 影片教學 DAY 5

技術 [Day-5] R語言 - 分群前處理 ( Clustering Preprocessing )

您的訂閱是我製作影片的動力訂閱點這裡~ 影片程式碼 library(naniar) data(iris) any_na(iris) #前置1: chk NA...

鐵人賽 AI & Data DAY 19

技術 [DAY19] 機器學習 - 支援向量機(一)

支援向量機(Support Vector Machine,SVM) 用於監督式學習中的分類和回歸 找到一個超平面將不同類別的數據點分開,同時最大化兩個類別之間...

鐵人賽 AI/ ML & Data DAY 10

技術 [Day10] Q-Learning 深入解讀:FrozenLakeAgent 訓練流程全解析

前言 昨天介紹了有關gymnasium的一些基礎概念,而今天我們會一步一步來建立我們的Frozen Lake。這篇文章寫得有點亂,自己一時之間也沒有想到更好的改...

鐵人賽 AI & Data DAY 27

技術 〔Day27〕用線性迴歸預測童話故事的類別-Logistic Regression

於上一篇,我們懂得如何歸類故事類別,那麼今天將帶大家用機器學習模型對新故事進行分類!我們開始執行吧~ 匯檔→預處理→增加文字轉換成數值之屬性 這邊跟上一篇一樣,...

鐵人賽 AI & Data DAY 13

技術 Day13 分類(Classification)(1)-- 以線性迴歸模型處理分類問題?

前言 在機器學習中,常常把監督式學習根據反應變數是連續資料或類別資料,分為迴歸(Regression)與分類(Classification)兩大類,那麼如果利用...

技術 利用大數據分析預測MLB勝負(中)

在上一篇文章中,我們介紹作者如何分析MLB賽事,並找出影響比賽勝負較為重要的因子,而今天我們就來看看作者究竟是選擇了哪些模型進行訓練以及預測,並最終做出能夠預測...

鐵人賽 AI & Data DAY 2

技術 【Day 2】機器學習的生命週期

前言 在上篇文章,我們提到到了在機器學習中模型學習的方式,今天就要來探討機器學習這個「學習」的過程,以及模型如何去進行「訓練」,而這當其實就是一連串的流程,也稱...

技術 用新技術加強您的內部稽核-將稽核軟體引入組織的 7 個步驟

在 2000 年代初期,內部稽核團隊的典型工作重點是完成對特定財務和運營領域的傳統週期性稽核——這一過程通常與組織的更大目標脫節。今天的內部稽核職能已經發生了徹...