離開純R語言的工作之後,覺得不能夠忘記寫R的手感,所以希望藉由這個活動逼自己每天動筆寫一些東西。
AI的目標便是把「主觀的感覺」寫成「客觀的事實」,透過程式語言、透過資料庫,把變數x1,x2..帶入後,電腦運算得出來的「結論y」要跟你想像的答案一模一樣,這是我當年被問AI的定義,
但現今的我認為,在輸入時,電腦給出的結論「客觀的事實」可能與你所想「主觀的感覺」是不同的答案,而你在看過電腦的運算後恍然大悟發現電腦給出的結論比你主觀意識的答案來的更make sense,這是我最近認為AI的定義,
在做xgboost之前,資料處理是非常重要的。因為方法基本上在網路上找到的都差不多,所以在放比較多的重點在資料上。 尤其是日期(要看懂資料在幹嘛然後釐清他)跟資...
執行的時候有兩個地方要注意,一個是資料型態必須是data.frame(我平常都會轉成tibble看資料比較方便),另外一個就是你要改變的參數必須是一種facto...
昨天用的那個smote使用體驗實在太差了。沒看懂,而且我加了之後預設能力反而變差了許多(可能是我自己的問題啦),所以我就在找了幾種方法來試試看,不過因為我使用的...
因為資料量太大,所以我寫完code之後決定交給別人執行。這時候會有一個問題,R語言本身功能不多,是一個需要函式你去下載包裝(install.packages)的...
因為颱風天大雨沒有借到可以執行的電腦用,有點可惜。 這次介紹的是寫出csv檔案,最簡單的寫法如下: yourname = paste(Sys.getenv(&q...
在我做AI的時候常常會覺得時間讓我很頭痛,不知道怎麼處理,甚至是訓練資料集跟測試資料集的時間壓根沒有重疊。 # #時間處理 x = str_pad(fraud...
這是一棵用R右下角輸出時會出現的樹 非常地不清楚,無法閱讀,而且決策樹的xgb.plot.tree()有別於一般的作圖,無法開啟windows()並畫在上面(順...
這邊用iris做說明,主要就是用n分位距來畫長調圖的一個function,變數部分:hist_ggplot2(你要放入的dataframe , 你要分割的數值型...
必須要說,我真的花很多時間研究lightBGM,至少這兩天加起來有16個小時然後如果你要用R語言執行lightBGM演算法的話.. 我建議你直接學python不...
先恭喜下第二十天了.. 即便競賽中通常會分訓練資料及跟測試資料集,,然後拿測試資料集去評分,可是我們在訓練資料的時候還是要將訓練資料集分成:訓練的鉉練資料及跟訓...