iT邦幫忙

machine learning相關文章
共有 760 則文章
鐵人賽 AI & Data DAY 17

技術 DAY[17]-競賽平台介紹

知道許多機器學習的知識之後,想必各位一定會想要有些實戰的經驗,在這裡我推薦兩個我自己常使用的競賽平台,有興趣參加競賽的讀者可以到這些平台參加競賽累積經驗。 T-...

鐵人賽 AI & Data DAY 16

技術 DAY[16]-機器學習(7)超參數調整

上一篇在交叉驗證的過程中,提到超參數的計算是使用窮舉法,因此要設定好參數的區間,來在訓練的過程中對參數進行測試。而在這次使用中我參考了本篇文章:LightGBM...

技術 【Day15】2rd:表現(Representation)

先前說了資料集的處理及分配,但是到底資料要如何提供呢?怎樣的資料才是好的呢? 資料處理是機器學習重要的一環,資料找出特徵,讓資料得以表現出他的價值,也就是可以給...

Towards Tensorflow 2.0 系列 第 16

技術 [Day-16] RNN - LSTM介紹

今天我們來討論深度學習中,專門在Run時間序列型資料的網路模型 - Recurrent Neural Network (RNN),在之前所討論到DNN跟CNN模...

Towards Tensorflow 2.0 系列 第 15

技術 [Day-15] CNN - ResNet 實作

當今天層數越疊越深,若不做任何的處理機制,準確度其實是會越來越糟糕!因為當疊層數疊超過一個層數,會發生像Gradient vanishing或者說Degrada...

鐵人賽 自我挑戰組 DAY 18
機器學習入門 系列 第 18

技術 ML_Day18(K-Means)

什麼是非監督式學習之前我們所介紹的幾種分類方法都監督式學習,而非監督式學習演算法只基於 輸入資料找出模式,無法正確找出結果。K-Means就是透過這個概念將資料...

技術 [Day27]梯度下降法

梯度下降是一種演算法專門讓Model進行學習,也就是更新內部參數的演算法,要調整Model裡的參數,首先我們必須要找到Model應該要往哪個方向調整,再來就是我...

鐵人賽 AI & Data DAY 15

技術 DAY[15]-機器學習(6)交叉驗證

在上一章節我們提到,實作模型的過程需要在變異與偏誤之間權衡,本章我們就延續之前使用的糖尿病資料集,搭配sklearn提供的函式來進行簡單的交叉驗證吧! 驗證集的...

鐵人賽 AI & Data DAY 13
一服見效的 AI 應用 系列 第 14

技術 Day 14:客服人力規劃(Workforce Planning) -- 線性規劃求解

前言 十幾年前到電信公司工作時,接到的第一個專案就是要幫客服中心安排人力班表,我們調查過很多國內外的WFM(Workforce Management)系統,通...

技術 【Day14】2rd:驗證集

有了訓練、測試等資料集,要驗證模組是否正確,也就需要驗證集(validation data) 〈圖一、訓練與測試集〉 我們把資料分成兩個部分,一個是訓練集,一...

鐵人賽 自我挑戰組 DAY 17
機器學習入門 系列 第 17

技術 ML_Day17(隨機森林(Random Forest))

介紹Random Forest的基本原理是,結合多顆CART樹(CART樹為使用GINI算法的決策樹),並加入隨機分配的訓練資料,以大幅增進最終的運算結果。顧...

Towards Tensorflow 2.0 系列 第 14

技術 [Day-14] CNN - VGG 實作

今天我們來使用TF 2.0來實作VGG 16,那為什麼選擇VGG 16呢?雖然VGG 16並未拿下當年ILSVRC 的分類比賽的冠軍 (當年由Google所發明...

技術 [Day26]LossFunction

介紹完神經網路,現在我們要來談Loss Function啦!在神經網路裡,我們有輸入,並會得到神經網路的預測,不過我們要如何告訴神經網路,它哪裡做錯了?應該要改...

鐵人賽 AI & Data DAY 14

技術 DAY[14]-機器學習(5) 變異(variance)與偏誤(bias)

我們都知道機器學習最常見的指標就是準確程度,不論是迴歸類型的模型還是分類的模型,都有衡量準確度的方法,但是在一般的場合裡,我們是不會有正確的答案可以提供驗證的,...

技術 【Day13】2rd:訓練與測試資料集

本篇也是進行說明,是關於訓練資料與測試資料相關資訊。 上篇說明模型「泛化」,當我們做出模型的時候,要進行調整與測試,讓我們的預測越接近現況。而在這邊要規劃我們...

技術 [Day25]神經網路

我們終於走到ML歷史的最後一段了!這代表我們要來談談神經網路啦!其實神經網路並不是甚麼興新的技術!它其實在很久了,不過神經網路剛被提出時,那個年代不管是在儲存、...

鐵人賽 自我挑戰組 DAY 16
機器學習入門 系列 第 16

技術 ML_Day16(決策樹(Decision Tree))

介紹之前我們在做二元分類的時候有介紹幾種模型,perceptron,linear classification。這邊我們要介紹另一種更好懂得模型,決策樹(De...

鐵人賽 AI & Data DAY 13

技術 DAY[13]-機器學習(4)競賽常勝軍(xgboost&lightgbm)

接下來要介紹的是數據競賽中最常見到的兩個模型,xgboost以及lightgbm。這兩個模型都是基於前一篇文章所提到的Boosting演算法,基於決策樹來形成的...

鐵人賽 AI & Data DAY 13
一服見效的 AI 應用 系列 第 13

技術 Day 13:快速完成一個『對話機器人』(ChatBot) -- 續

前言 前一篇我們用了不到20行的程式,解析使用者說的話,程式了解語意後,要如何回應呢? 今天就來探討一下吧。 回應(Response) 回應的作法有很多種:...

技術 【Day12】2rd:泛化(Generalization)

這篇在說理論,說明何謂「Generalization」,以及要訓練機器學習的時候有什麼原則。 (本篇是Generalization) 何謂「泛化(Genera...

Towards Tensorflow 2.0 系列 第 13

技術 [Day-13] CNN介紹

今天我們來討論Deep learning經典的模型之一 - Convolutional Neural Network (CNN)的架構。目前CNN被大量使用的影...

技術 [Day24]Kernel函數

Kernel函數 在我們離開決策樹之後,我們要進到SVM了!SVM的中文全名叫做支援向量機!我們在兩組資料間,可以找到一條分界來對資料進行分界,而SVM利用了K...

鐵人賽 自我挑戰組 DAY 15
機器學習入門 系列 第 15

技術 ML_Day15(Regularization(Solving overfitting))

簡單回顧介紹regularization之前,必須要了解什麼是overfitting。在之前的章節或多或少都有提到overfitting這號人物,那他為什麼那...

鐵人賽 AI & Data DAY 12
一服見效的 AI 應用 系列 第 12

技術 Day 12:快速完成一個『對話機器人』(ChatBot)

前言 今年最夯的AI應用非『對話機器人』(ChatBot)莫屬了,許多大企業都已建置相關應用系統,並配置一組專案人員維運,一方面提昇機器人智慧,另一方面不斷擴展...

Towards Tensorflow 2.0 系列 第 12

技術 [Day-12] TF.Keras api & Customized

今天的話,我們來討論一下tf.keras的api。首先,今天要討論的tf.keras與我們所熟知的keras是不太一樣的,以前我們所使用的keras,他的bac...

鐵人賽 AI & Data DAY 12

技術 DAY[12]-機器學習(3)整體學習

介紹完機器學習最主要的兩種類型之後,接著就是對於模型更進一步改進的介紹了,本部分最主要解釋的是整體學習(ensamble learning)的想法。 弱學習器與...

技術 【Day11】2rd:TensorFlow初步學習-線性回歸(linear regression)

熟悉TensorFlow的第一步就是製作線性回歸(linear regression),此篇也是從First Steps with TensorFlow而來,以...

技術 [Day23]決策樹(Decision Tree)

在上一篇我們稍為介紹了神經網路之後,我們要來看看另外一個機器學習的分支,Decision Tree。 決策樹 Decision Tree 而要如何運用決策樹呢...

Towards Tensorflow 2.0 系列 第 11

技術 [Day-11] 模型視覺化 - Tensorboard

針對模型視覺化,Tensorflow有做了一個Dashboard - Tensorboard,方便使用者理解模型以及tuning。而Tensorboard非常強...

鐵人賽 AI & Data DAY 11

技術 DAY[11]-機器學習(2)非監督式機器學習

還記得我們所說的,監督式機器學習是需要「正確答案」的,因此反過來說,非監督式機器學習就是不需要給定一個正確答案,那沒有正確答案要預測什麼呢? 非監督式機器學習在...