一直想學習關於這方面的知識,但一直沒有動力推著我前進,想透過這次的鐵人賽,紀錄我為期30天的機器學習內容,也希望我在每一天學到的內容和遇到的困境能夠幫助到跟我一樣的新手!
馬可夫決策過程( Markov Decision Process ,簡稱 MDP ) 用來描述強化學習問題的數學框架,是建模智能代理在與環境互動的情境下如何做出...
Q學習( Q - Learning ) 在不同狀態下採取不同動作的價值(Q值),來最大化長期獎勵這個學習方法跟模型無關,適合用在具有馬可夫性質環境的情況當前的狀...
SARSA( State-Action-Reward-State-Action ) SARSA 名字說明了這個學習的更新方式就是根據當前狀態、選擇的動作、獲得的...
深度強化學習( Deep reinforcement learning,簡稱 Deep RL 或 DRL ) 強化學習( Reinforcement Lea...
卷積神經網絡( Convolutional Neural Network , CNN ) CNN 是前向傳播神經網絡,模擬人類視覺系統的工作方式,具有層次化的...
遞歸神經網絡( Recurrent Neural Network,簡稱 RNN ) 主要用於處理時間序列、自然語言文本等,RNN 的特點在於它具有記憶能力,可以...
遷移學習( Transfer Learning ) 將在一個任務上學到的知識轉移到另一個相關任務中,可以是模型的權重、特徵表示或其他學習過程中的資訊 遷移學習的...
LSTM( Long Short-Term Memory ) 是 RNN 的變種,是用來解決梯度消失的問題,也能夠將長序列資料處理的更好LSTMs 的核心概念是...
生成對抗網絡( Generative Adversarial Network ,簡稱 GAN ) 被稱為「生成對抗網絡」,是因為包含兩個互相對抗的神經網絡,生成...
人工智慧到機器學習再到深度學習簡史 1943 - 1956 人工智慧的誕生 1930 年代末到 1950 年代初,控制論、資訊理論、計算理論、人工神經元網絡的...