一來是大部分的機器學習競賽或是大公司內部的演算都是使用xgboost,準確率集便不知道原理不回調整參數都有相當的水準,據說xgboost是由extreme +...
參考資料 一樣是彭彭老師的教學影片,以下附上網址:https://www.youtube.com/watch?v=OOJmhezLd4o&list=PL...
讀檔讀起來 進入讀檔第三天 延續前一天的方法 方法二 迴圈 首先我們要找到檔案 file_which = list.files("C:\\Users\...
之後就是把創建出來的資料集用left_join的方式把資料重新放回原本的資料集,讓每個數值都變成機率的概念。這次目標編碼的目的是要做xgb 極限梯度提升 「透過...
繼續讀檔的研究 當然有時候我們的檔案不只有一個而已 有可能這些檔案會依照年分 月分 分成好幾個 那這時候要怎麼把這些檔案讀進來呢? 方法一 硬幹XD a1 =...
參考資料 一樣是彭彭老師的教學影片,以下附上網址:https://www.youtube.com/watch?v=7qKFvUVpQXg&list=PL...
參考資料 一樣是彭彭老師的教學影片,以下附上網址:https://www.youtube.com/watch?v=yBXlwOmLqZ4&list=PL...
機器學習中的目標編碼目標是算資料的平均值 同學原本最初的想法是用sapply寫,但我看了下需求,我寫下了group_by() %>% summarise...
剛好最近對於讀檔有新理解XD跳著寫一下一般來說,進行資料處理必要的技能就是讀檔!今天就來介紹一下一些基礎的讀檔首先是利用 read.csv 進行讀檔 #讀檔 r...
大部分的時候,為了方便我們會在自己用的data.frame中取數字運算,例如把iris要算的Sepal.Length第一項道第十項乘以二,大部分的人都是直接取值...