iT邦幫忙

鐵人檔案

第 11 屆 iThome 鐵人賽
回列表
AI & Data

R語言 - 從「主觀感覺」轉為「客觀事實」 系列

離開純R語言的工作之後,覺得不能夠忘記寫R的手感,所以希望藉由這個活動逼自己每天動筆寫一些東西。

AI的目標便是把「主觀的感覺」寫成「客觀的事實」,透過程式語言、透過資料庫,把變數x1,x2..帶入後,電腦運算得出來的「結論y」要跟你想像的答案一模一樣,這是我當年被問AI的定義,
但現今的我認為,在輸入時,電腦給出的結論「客觀的事實」可能與你所想「主觀的感覺」是不同的答案,而你在看過電腦的運算後恍然大悟發現電腦給出的結論比你主觀意識的答案來的更make sense,這是我最近認為AI的定義,

鐵人鍊成 | 共 30 篇文章 | 7 人訂閱 訂閱系列文 RSS系列文 團隊為了紅布條
DAY 11

R語言_一言不合就xgboost_2

在做xgboost之前,資料處理是非常重要的。因為方法基本上在網路上找到的都差不多,所以在放比較多的重點在資料上。 尤其是日期(要看懂資料在幹嘛然後釐清他)跟資...

2019-09-26 ‧ 由 yanchen 分享
DAY 12

R語言_SMOTE不平衡數據

執行的時候有兩個地方要注意,一個是資料型態必須是data.frame(我平常都會轉成tibble看資料比較方便),另外一個就是你要改變的參數必須是一種facto...

2019-09-27 ‧ 由 yanchen 分享
DAY 13

R語言 - 資料不平衡_2

昨天用的那個smote使用體驗實在太差了。沒看懂,而且我加了之後預設能力反而變差了許多(可能是我自己的問題啦),所以我就在找了幾種方法來試試看,不過因為我使用的...

2019-09-28 ‧ 由 yanchen 分享
DAY 14

R語言-交給別人跑程式前的一個小技巧

因為資料量太大,所以我寫完code之後決定交給別人執行。這時候會有一個問題,R語言本身功能不多,是一個需要函式你去下載包裝(install.packages)的...

2019-09-29 ‧ 由 yanchen 分享
DAY 15

R語言 - 寫出檔案

因為颱風天大雨沒有借到可以執行的電腦用,有點可惜。 這次介紹的是寫出csv檔案,最簡單的寫法如下: yourname = paste(Sys.getenv(&q...

2019-09-30 ‧ 由 yanchen 分享
DAY 16

R語言_時間是否重疊

在我做AI的時候常常會覺得時間讓我很頭痛,不知道怎麼處理,甚至是訓練資料集跟測試資料集的時間壓根沒有重疊。 # #時間處理 x = str_pad(fraud...

2019-10-01 ‧ 由 yanchen 分享
DAY 17

R語言 - 輸出清晰的決策樹

這是一棵用R右下角輸出時會出現的樹 非常地不清楚,無法閱讀,而且決策樹的xgb.plot.tree()有別於一般的作圖,無法開啟windows()並畫在上面(順...

2019-10-02 ‧ 由 yanchen 分享
DAY 18

R語言 - 用幾分位距畫ggplot2

這邊用iris做說明,主要就是用n分位距來畫長調圖的一個function,變數部分:hist_ggplot2(你要放入的dataframe , 你要分割的數值型...

2019-10-03 ‧ 由 yanchen 分享
DAY 19

R語言 - 要用lightBGM演算法的話..

必須要說,我真的花很多時間研究lightBGM,至少這兩天加起來有16個小時然後如果你要用R語言執行lightBGM演算法的話.. 我建議你直接學python不...

2019-10-04 ‧ 由 yanchen 分享
DAY 20

R語言 - 目標是交叉驗證

先恭喜下第二十天了.. 即便競賽中通常會分訓練資料及跟測試資料集,,然後拿測試資料集去評分,可是我們在訓練資料的時候還是要將訓練資料集分成:訓練的鉉練資料及跟訓...

2019-10-05 ‧ 由 yanchen 分享