iT邦幫忙

機器學習相關文章
共有 413 則文章
鐵人賽 AI & Data DAY 25

技術 〔Day25〕文字預處理,過濾多餘的詞-Text

在前幾次,我們有用表格與圖像的數據來進行分析,那麼今天要來點不一樣的,換成如標題所說的「文本」做主題啦~~預備備~開始! 安裝文字插件 打開Orange上的工作...

鐵人賽 AI & Data DAY 29

技術 Day29 主成分分析(Principal Components Analysis, PCA)

前言 鐵人賽來到了最後兩天,其幾天的內容屬於機器學習中監督式學習(Supervised learning)的模型,這兩天將撰寫的是兩種非監督式學習(Unsupe...

鐵人賽 AI & Data DAY 24

技術 〔Day24〕零程式的圖像分析(二)-Classification

在上一篇中,我們是將許多張未分類過的圖像數據,讓電腦幫我們分類與查看它們之間的相似度(屬於無監督式學習);那麼今天,就是要將另外一群已分類好之圖像數據,進行模型...

鐵人賽 AI & Data DAY 28

技術 Day28 類神經網路(Neural Network)(2)

前言 昨天介紹了Single Layer Neural network與Deep Neural Network,而模型的結構在隱藏層(hidden layer)...

鐵人賽 AI & Data DAY 27

技術 Day27 類神經網路(Neural Network)(1)

前言 類神經網路(Neural Network, NN),又稱為神經網路、人工神經網路(Artificial Neural Network, ANN),屬於非線...

鐵人賽 AI & Data DAY 26

技術 Day26 支持向量機(Support Vector Machine , SVM)(3)--SVM and Kernel

前言 過去內容提到的Optimal Separating Hyperplane、Support Vector Classifier與LDA等方法,都是利用線性的...

鐵人賽 AI & Data DAY 23

技術 〔Day23〕無程式的圖像分析(一)-Clustering

經過了幾次我們對於電腦內的表格或是Orange內分享的資料集進行分析,那其實數據有著許多型式,包括圖像、表格、文本或一段音頻等等,那今天我要為大家介紹的,是如何...

鐵人賽 AI & Data DAY 25

技術 Day25 支持向量機(Support Vector Machine , SVM)(2)--Support Vector Classifier

前言 昨天的內容提到當資料可以完美的利用一條直線或超平面(hyperplane)分類時,**最大邊距分類器(Maximal Margin Classifier)...

鐵人賽 AI & Data DAY 22

技術 〔Day22〕利用組件找出離群點-Silhouette

於第二十篇中,我們有提到Silhouette(輪廓),它是一個評估群聚效果的方法,可以幫我們找尋到最佳群聚數。而今天我們就來深入了解其含意,並且利用它來找出數據...

鐵人賽 AI & Data DAY 21

技術 〔Day21〕了解K-means的底層運作-Educational

在上一篇我們有用到K-means把數據分群以及視覺化其分群效果,但若是沒先了解過K-means的你,經由上篇應該還沒有很懂它的運作方式吧,今天我將帶你一同了解其...

鐵人賽 AI & Data DAY 20

技術 〔Day20〕在Orange中玩玩K-means帶來的效果

來到了鐵人賽的2/3天數了!再撐十天就可以完賽啦~好興奮壓>□< 我們要堅持下去壓,我相信若有看完的你們,一定會感到很充實der!準備好,我們就繼續...

鐵人賽 AI & Data DAY 24

技術 Day24 支持向量機(Support Vector Machine, SVM)(1) -- Optimal Separating Hyperplane

前言 支持向量機(Support Vector Machine, SVM),是Vladimir Vapnik在 1960 年代首次開發的一類統計模型。在近幾年,...

鐵人賽 AI & Data DAY 23

技術 Day23 集成學習(Ensemble Learning)(2)--隨機森林(Random Forest)

前言 昨天的內容提到Bagging與Boosting改善預測結果的方法,不過在許多問題中Boosting常常表現得比Bagging更好,因此Boosting這類...

鐵人賽 AI & Data DAY 19

技術 〔Day19〕如何找出最佳屬性-Box Plot、Distribution

在上篇我們有用到wine這個內鍵數據集,今天一樣要用它來帶大家挑出主要影響分類的屬性!我們開始著手吧~ 分類型數據集評估 在上篇有說到,這組數據為義大利同一地區...

鐵人賽 AI & Data DAY 22

技術 Day22 集成學習(Ensemble Learning)(1)--Bagging and Boosting

前言 集成學習(Ensemble Learning)是一種將多個模型整合起來,最後獲得比單一個模型表現更好的方法,例如在某筆資料集中可以使用KNN、線性迴歸模型...

鐵人賽 AI & Data DAY 17

技術 〔Day17〕聊聊另一個經典降維演算法-PCA

過了一個假日,我們要在來繼續科普各位啦~但!今天是個特別的日子,因為是最後一篇科普篇惹,希望這天大家都能好好吸收,為往後實作篇打好基礎!(不過齁,若你是喜歡被科...

鐵人賽 AI & Data DAY 21

技術 Day21 決策樹(Decision Tree)(3)--Python建立模型

載入套件 import pandas as pd from sklearn.model_selection import train_test_split fr...

鐵人賽 AI & Data DAY 20

技術 Day20 決策樹(Decision Tree)(2)--修剪(Pruning)與分類樹(Classification Tree)

前言 昨天的內容提到針對迴歸的問題如何建立決策樹模型,可以針對訓練集的資料有一個好的預測,但是以昨天提到的方式建立一個完美的決策樹模型後,會使得整棵樹的分支很多...

鐵人賽 AI & Data DAY 19

技術 Day19 決策樹(Decision Tree)(1)--迴歸樹(Regression Tree)

前言與介紹 決策樹(Decision tree)在機器學習中是一種容易理解但強大的演算法,可以用來處理分類以及迴歸的問題(Classification and...

鐵人賽 AI & Data DAY 15

技術 〔Day15〕數據也可以降維?-MDS

今天又是科普日~偷偷預告大家一下,科普篇剩不多惹,如果你是喜歡被科普的人,得好好珍惜剩下的幾篇啦,但若你是不喜歡的,那我也恭喜你快撐過去啦,剩沒幾篇,接下來幾乎...

鐵人賽 AI & Data DAY 18

技術 Day18 重新抽樣方法(Resampling Methods)與Python

前言 重新抽樣(Resampling)的方法在機器學習或深度學習領域是一個非常重要工具,由訓練集(trainning set)中重新抽樣獲得樣本,在每個樣本上建...

鐵人賽 AI & Data DAY 17

技術 Day17 分類(Classification)(5)-- Python建立線性判別分析(LDA)模型

載入套件 import pandas as pd from sklearn.model_selection import train_test_split fr...

鐵人賽 AI & Data DAY 14

技術 〔Day14〕機器學習的模型評估-Logistic Regression、Random Forest、Tree

終於到了實作天,今天將會教導大家如何評估模型,準備好我們就開始囉~ 匯檔、建模型 這次我們將用回鳶尾花數據集來呈現,匯入File後,先用個簡單的分類方法訓練模型...

鐵人賽 AI & Data DAY 13

技術 〔Day13〕隨機森林(Random Forest)的概念

於上篇實作完之後,大家是否對於自己的操作上更進一步了呢,今天我們要來繼續為大家增加小知識,希望在操作上能得心應手外,還能在道理上融會貫通,一同更上一層樓!那就開...

鐵人賽 AI & Data DAY 16

技術 Day16 分類(Classification)(4)-- 線性判別分析( Linear Discriminant Analysis)

前言與介紹 在分類問題中除了邏輯斯迴歸模型外,還有另一種常用的方法為線性判別分析(Linear discriminant analysis, LDA),主要概念...

鐵人賽 AI & Data DAY 12

技術 〔Day12〕來做個小預測吧-Tree、Logistic Regression

經過了前兩天補充的小知識,今天我們就來用Orange做個預測看看唄! 匯入檔案&檢查 這次用到的數據是水果與蔬菜的訓練集,需要的人可以直接點擊超連結進入...

鐵人賽 AI & Data DAY 11

技術 〔Day11〕什麼是邏輯迴歸(Logistic Regression)?

經過了上一篇了解了Tree,今天我們要再來繼續科普啦~ 邏輯迴歸(Logistic Regression) 為一種統計分析方法,它會根據數據集的先前觀察,來預...

鐵人賽 AI & Data DAY 12

技術 Day 11. 機器學習模型 - 評價模型

模型學習完成之後,怎麼驗證模型學習的效果好不好,預測準不準確,就是今天要講的模型的評價方法。 交叉驗證(Cross validation) 監督式學習需要有資料...

鐵人賽 AI & Data DAY 15

技術 Day15 分類(Classification)(3)-- Python建立邏輯斯迴歸模型

載入套件 import pandas as pd from sklearn.model_selection import train_test_split fr...

鐵人賽 AI & Data DAY 10

技術 〔Day10〕分類樹(Classification Tree) vs 迴歸樹(Regression Tree)

大家好,來到我們第十天嚕~今天我們要來談談Tree,因為在後續的實作都會應用到,所以再來繼續科普一下大家,在我們了解分類和迴歸之前,先來初步了解決策樹吧! 決策...