深度強化學習( Deep reinforcement learning,簡稱 Deep RL 或 DRL ) 強化學習( Reinforcement Lea...
SARSA( State-Action-Reward-State-Action ) SARSA 名字說明了這個學習的更新方式就是根據當前狀態、選擇的動作、獲得的...
1.computed & Watch Part_1 > Lab_Binding > Lab_Form_Text_1.HTML(1)綁元件...
遞歸神經網絡( Recurrent Neural Network,簡稱 RNN ) 主要用於處理時間序列、自然語言文本等,RNN 的特點在於它具有記憶能力,可以...
筆者今天沒那麼疲憊了,是活力星期一!內容雖然看起來和機器學習沒有關係,但是會和之後實作有關,雖然筆者也不確定會不會有實作就是了。今天最後會有一些小小的實作,是我...
今天早八,筆者昨天還做死玩遊戲到很晚,可以非常想睡了,但把畢業專題的老師找到了!嗚呼~那今天的內容不出意外是 Pandas 本來昨天要一起說得但晚上有點來不及所...
昨天很快樂的開始說監督式學習,突然發現有東西沒說到,所以補到今天,這就是當天想當天主題的可悲,總之今天來寫寫模型得一些東東。 不知道為甚麼一職寫關於介紹的東...
1. 引入 (1) 安裝(2) 記得開啟(3) 成功編譯 1. 使用 https://5xruby.tw/posts/play-sass-mixin-and-...
卷積神經網絡( Convolutional Neural Network , CNN ) CNN 是前向傳播神經網絡,模擬人類視覺系統的工作方式,具有層次化的...
本篇僅大概敘述各種情境,無深入探討,各情境常用演算法等將在之後的文章中討論 Supervised Learning (監督式學習) 會告訴機器正確的答案(...
決策樹( Decision Tree ) 是用於分類和迴歸任務,一系列的規則和條件來對資料進行分類或預測 節點(Node) 每個節點表示一個特徵或屬性,對資...
Syntax Rules (語法規則) 語法與php和ASP類似,主要用於將 (C# 或 VB) 嵌入到 ASP.NET 的網頁中 相關語法 (C#):...
正規化可減少模型overfitting的問題 L1 regularization (Lasso) 加入L1正規化 (loss function + L1...
是一種基於機率的分類器 貝氏定理 Bayes’ Theorem 計算在已知一些條件下,某事件的發生機率 通常事件A在事件B已發生的條件下發生的機率,與...
主要用於分類,也可以改為回歸樹(不建議),今天只討論單顆決測樹,明天會學習多顆決策樹組合成的隨機森林 決策樹原理 對資料重複進行二元分割,形成樹狀結構 根...
kernel trick 作天的SVM跟SVR有提到可以用kernel function將資料映射到高維空間中 解決的問題:當資料在原始空間中無法被線性分...
隨機森林是由多棵昨天提過的決策樹組成,適合用在分類問題 原理 由很多顆決策樹組成,他會先從原資料中隨機抽取多個樣本,用這些樣本以隨機特徵選取的方式建立多棵...
右上 or 左上Repositories New ... > Settings > pages >Choose a theme C...
強化學習 依賴與動態( dynamic )環境的資料(隨著外部條件變化而改變的資料)重複互動以最大化累積回報( cumulative reward )找出能夠產...
說起線性回歸,這是我在學機器學習時碰到的第一個演算法,今天先簡單介紹線性回歸,明天會討論L1、L2正規化 Regression 在講線性回歸之前,先講講回歸...
在前幾篇有提到關於 Ensemble 這個名詞,是之前都沒學過的東東,所以今天想要來一起了解這是個啥,其實我已經感受到我的鐵人賽學習順序非常混亂,但就先這樣吧,...
非監督式學習( unsupervised learning ) 沒有給定事先標記過的訓練資料,自動對輸入的資料進行分類或分群 非監督式學習的區別與監督式學習...
筆者今天不用補課很快樂,但生理時鐘還是讓我在九點多就醒了,可惡我以為今天會睡爽爽地說,但早上不用通勤很快樂,總之讓我們開始今天的筆記吧! 今天說一些機器學習...
今天是大概的概念,training等細節留到明天 VGG-16 SSD的架構是使用VGG-16 13個卷積層+3個全連接層+5個池化層 其卷基層均使用...
boosting 前幾天有寫過一點關於boosting跟bagging大概的概念,今天開始前再簡單說一下 透過組合弱學習機、改進每一次的錯誤、從而獲得一個...
Q學習( Q - Learning ) 在不同狀態下採取不同動作的價值(Q值),來最大化長期獎勵這個學習方法跟模型無關,適合用在具有馬可夫性質環境的情況當前的狀...
前幾天有提過的線性回歸是用來預測一個連續的值,而今天要學的邏輯回歸則是用來做分類用的 線性回歸 V.S. 邏輯回歸 線性回歸:找到一條線,讓data盡可...
29天啦!之前實作分類器的時候有用到混淆矩陣,今天也來寫一下相關筆記 混淆矩陣(confusion matrix) 可以用來評估分類模型的準確率 混淆...
半監督學習(Semi-supervised learning) 處理的訓練資料中有答案的資料和沒有答案的資料,半監督學習就是利用兩者的資料,來改善模型性能 L...
是基於 Gradient Boosted Decision Tree (GBDT) 改良與延伸 Boosting XGBoost是一種集成學習技術,通過組...