Row normalization 最後一個正規化方法是按行(row)而不是逐個列(欄位)進行。此標準化技術將確保每行數據都具有一樣的範數(Norm),聽起來很...
上次我們完成了感知器的介紹,感知器也有他相對應的學習演算法:perceptron learning algorithm (PLA)。 不過我們今天沒有要講 PL...
昨天使用的Rasterio是一個方便的工具,它主要是包了一些GDAL等等的GIS套件,使用GIS資料分析,當然一定會接觸到GDAL,GDAL Geospatia...
前言 昨天我們說明了馬可夫鏈,並了解馬可夫鏈會收斂的條件與過程,今天我們要正式進入與強化學習有關的馬可夫決策過程。 馬可夫決策過程 和馬可夫鏈比起來,馬可夫決策...
在上一個章節介紹了什麼是機器學習,也概略的提到機器學習是透過資料與演算法去實踐人工智慧,這個章節會更仔細的說明機器學習是如何達到這件事情,並且探討機器學習演算法...
前言 昨天說明以 TD learning 的方式評估狀態價值,現在我們有狀態函數後,下一步就是考慮怎麼獲得動作價值,並加以實現控制。 TD Control 動作...