知道許多機器學習的知識之後,想必各位一定會想要有些實戰的經驗,在這裡我推薦兩個我自己常使用的競賽平台,有興趣參加競賽的讀者可以到這些平台參加競賽累積經驗。 T-...
上一篇在交叉驗證的過程中,提到超參數的計算是使用窮舉法,因此要設定好參數的區間,來在訓練的過程中對參數進行測試。而在這次使用中我參考了本篇文章:LightGBM...
先前說了資料集的處理及分配,但是到底資料要如何提供呢?怎樣的資料才是好的呢? 資料處理是機器學習重要的一環,資料找出特徵,讓資料得以表現出他的價值,也就是可以給...
今天我們來討論深度學習中,專門在Run時間序列型資料的網路模型 - Recurrent Neural Network (RNN),在之前所討論到DNN跟CNN模...
當今天層數越疊越深,若不做任何的處理機制,準確度其實是會越來越糟糕!因為當疊層數疊超過一個層數,會發生像Gradient vanishing或者說Degrada...
什麼是非監督式學習之前我們所介紹的幾種分類方法都監督式學習,而非監督式學習演算法只基於 輸入資料找出模式,無法正確找出結果。K-Means就是透過這個概念將資料...
梯度下降是一種演算法專門讓Model進行學習,也就是更新內部參數的演算法,要調整Model裡的參數,首先我們必須要找到Model應該要往哪個方向調整,再來就是我...
在上一章節我們提到,實作模型的過程需要在變異與偏誤之間權衡,本章我們就延續之前使用的糖尿病資料集,搭配sklearn提供的函式來進行簡單的交叉驗證吧! 驗證集的...
前言 十幾年前到電信公司工作時,接到的第一個專案就是要幫客服中心安排人力班表,我們調查過很多國內外的WFM(Workforce Management)系統,通...
有了訓練、測試等資料集,要驗證模組是否正確,也就需要驗證集(validation data) 〈圖一、訓練與測試集〉 我們把資料分成兩個部分,一個是訓練集,一...
介紹Random Forest的基本原理是,結合多顆CART樹(CART樹為使用GINI算法的決策樹),並加入隨機分配的訓練資料,以大幅增進最終的運算結果。顧...
今天我們來使用TF 2.0來實作VGG 16,那為什麼選擇VGG 16呢?雖然VGG 16並未拿下當年ILSVRC 的分類比賽的冠軍 (當年由Google所發明...
介紹完神經網路,現在我們要來談Loss Function啦!在神經網路裡,我們有輸入,並會得到神經網路的預測,不過我們要如何告訴神經網路,它哪裡做錯了?應該要改...
我們都知道機器學習最常見的指標就是準確程度,不論是迴歸類型的模型還是分類的模型,都有衡量準確度的方法,但是在一般的場合裡,我們是不會有正確的答案可以提供驗證的,...
本篇也是進行說明,是關於訓練資料與測試資料相關資訊。 上篇說明模型「泛化」,當我們做出模型的時候,要進行調整與測試,讓我們的預測越接近現況。而在這邊要規劃我們...
我們終於走到ML歷史的最後一段了!這代表我們要來談談神經網路啦!其實神經網路並不是甚麼興新的技術!它其實在很久了,不過神經網路剛被提出時,那個年代不管是在儲存、...
介紹之前我們在做二元分類的時候有介紹幾種模型,perceptron,linear classification。這邊我們要介紹另一種更好懂得模型,決策樹(De...
接下來要介紹的是數據競賽中最常見到的兩個模型,xgboost以及lightgbm。這兩個模型都是基於前一篇文章所提到的Boosting演算法,基於決策樹來形成的...
前言 前一篇我們用了不到20行的程式,解析使用者說的話,程式了解語意後,要如何回應呢? 今天就來探討一下吧。 回應(Response) 回應的作法有很多種:...
這篇在說理論,說明何謂「Generalization」,以及要訓練機器學習的時候有什麼原則。 (本篇是Generalization) 何謂「泛化(Genera...
今天我們來討論Deep learning經典的模型之一 - Convolutional Neural Network (CNN)的架構。目前CNN被大量使用的影...
Kernel函數 在我們離開決策樹之後,我們要進到SVM了!SVM的中文全名叫做支援向量機!我們在兩組資料間,可以找到一條分界來對資料進行分界,而SVM利用了K...
簡單回顧介紹regularization之前,必須要了解什麼是overfitting。在之前的章節或多或少都有提到overfitting這號人物,那他為什麼那...
前言 今年最夯的AI應用非『對話機器人』(ChatBot)莫屬了,許多大企業都已建置相關應用系統,並配置一組專案人員維運,一方面提昇機器人智慧,另一方面不斷擴展...
今天的話,我們來討論一下tf.keras的api。首先,今天要討論的tf.keras與我們所熟知的keras是不太一樣的,以前我們所使用的keras,他的bac...
介紹完機器學習最主要的兩種類型之後,接著就是對於模型更進一步改進的介紹了,本部分最主要解釋的是整體學習(ensamble learning)的想法。 弱學習器與...
熟悉TensorFlow的第一步就是製作線性回歸(linear regression),此篇也是從First Steps with TensorFlow而來,以...
在上一篇我們稍為介紹了神經網路之後,我們要來看看另外一個機器學習的分支,Decision Tree。 決策樹 Decision Tree 而要如何運用決策樹呢...
針對模型視覺化,Tensorflow有做了一個Dashboard - Tensorboard,方便使用者理解模型以及tuning。而Tensorboard非常強...
還記得我們所說的,監督式機器學習是需要「正確答案」的,因此反過來說,非監督式機器學習就是不需要給定一個正確答案,那沒有正確答案要預測什麼呢? 非監督式機器學習在...