正規化可減少模型overfitting的問題
L1 regularization (Lasso)
加入L1正規化 (loss function + L1...
Transformer是一種深度學習模型架構,最初由Google Brain團隊在2017年發表了一篇論文 Attention Is All You Need...
昨天講到了梯度下降法則,今天要跟大家介紹的是反向傳播,它們兩個在神經網路中各自承擔著不同的任務。介紹完反向傳播後會帶入學習率的概念給的大家。
梯度下降法主要是計...
今天的內容比較短一些,主要介紹一下什麼是 Data Version Control整個 Data Version Control 可以用下面這張圖來描述
為什...
Hugging Face Hub
所謂工欲善其事、必先利其器,在了解完 Hugging face 以後,那麼就是時候要利用免費的資源了,首先我們需要先註冊一隻帳...
一般常用抽樣方法可分為:隨機抽樣、非隨機抽樣。
非隨機抽樣法(non-random sampling):
-> 根據個人主觀意志抽取。
隨機抽樣法(ran...