R語言_目標編碼_2

第 11 屆 iThome 鐵人賽

DAY 9

AI & Data

R語言 - 從「主觀感覺」轉為「客觀事實」系列第 9 篇

11th鐵人賽

yanchen

團隊為了紅布條

2019-09-24 23:36:08

894 瀏覽

分享至

之後就是把創建出來的資料集用left_join的方式把資料重新放回原本的資料集，讓每個數值都變成機率的概念。
這次目標編碼的目的是要做xgb 極限梯度提升

「透過極限梯度提升，我們能夠大幅度提升模型表現，這是拜更精準的模型損失評估所賜，同時，我們也並不用擔心這些運算會導致訓練速度過慢，這個演算法的設計准許電腦CPU能夠多線並行」

聽說這個方法是在我畢業後很火紅的演算法，因為沒有跟到，所以之後就會往這邊順便實作跟學習，然後我有找到一篇非常適合學習的，其實我應該一開始就找，不應該用自己想的從目標編碼開始(好像有內建，不必自己轉換(?))，算了也罷，就當作練習Rcode吧。
明天開始會試著找幾篇來做看看極限梯度提升，補一個進度。

a4 = data.frame(rep(0,nrow(fraud_train)))

for (i in 1:3) {
  a3 = left_join(fraud_train, dat[[i]])
  a4 = cbind(a4,a3[,24])
  colnames(a4)[i+1] = colnames(a3)[24]
}

參考: https://steve-chen.tw/?p=369

R語言_目標編碼

R語言_一言不合就xgboost_1

系列文

R語言 - 從「主觀感覺」轉為「客觀事實」共 30 篇

RSS系列文訂閱系列文

7 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

R語言 - 從「主觀感覺」轉為「客觀事實」系列 第 9 篇

R語言_目標編碼_2

尚未有邦友留言

標記使用者

R語言 - 從「主觀感覺」轉為「客觀事實」系列第 9 篇