iT邦幫忙

鐵人檔案

第 11 屆 iThome 鐵人賽
回列表
AI & Data

R語言 - 從「主觀感覺」轉為「客觀事實」 系列

離開純R語言的工作之後,覺得不能夠忘記寫R的手感,所以希望藉由這個活動逼自己每天動筆寫一些東西。

AI的目標便是把「主觀的感覺」寫成「客觀的事實」,透過程式語言、透過資料庫,把變數x1,x2..帶入後,電腦運算得出來的「結論y」要跟你想像的答案一模一樣,這是我當年被問AI的定義,
但現今的我認為,在輸入時,電腦給出的結論「客觀的事實」可能與你所想「主觀的感覺」是不同的答案,而你在看過電腦的運算後恍然大悟發現電腦給出的結論比你主觀意識的答案來的更make sense,這是我最近認為AI的定義,

鐵人鍊成 | 共 30 篇文章 | 7 人訂閱 訂閱系列文 RSS系列文 團隊為了紅布條
DAY 1

常常被問到,AI的定義是什麼...?

畢竟是做數據分析的,常常被問到的兩個問題就是1.大數據跟統計差在哪裡?2.什麼是人工智慧?那是什麼?要怎麼做? 我原先認為的AI是:能夠讓電腦代替人腦思考便是A...

2019-09-16 ‧ 由 yanchen 分享
DAY 2

即便是資處就算一種數據分析

這次想選個有趣的資料及來做,找著找著就要壓線了。索性分享一下自己找了哪裡的資料集好了。我覺得這個薪情平台滿有意思的,感覺有不錯的資料集可以使用,透過行業別、性別...

2019-09-17 ‧ 由 yanchen 分享
DAY 3

薪情平台的資料集-1

下載下來的資料集好像副檔名怪怪的,所以我改成了.csv檔,(附上檔案)https://drive.google.com/file/d/1GNfU_ciyFYp0...

2019-09-18 ‧ 由 yanchen 分享
DAY 4

R語言_給人看的程式碼_tidyverse

很久沒寫R了,所以用到tidyverse管線(%>%)的時候,就想到一句話,JAVA寫出來讓電腦看懂,難在讓人類也看懂。我深有同感,以前R語言有tidyv...

2019-09-19 ‧ 由 yanchen 分享
DAY 5

R語言_給人看的程式碼_with()

昨天在寫的時候,其實算是幫這個鋪陳一下,我發現這個字滿好用的,只是她不具任何分析的意義,所以網路上、課堂上好像很少有人介紹他。 with()的用法也是讓人類能夠...

2019-09-20 ‧ 由 yanchen 分享
DAY 6

R語言_資料最初步的判斷

library(jsonlite)library(tidyverse)data_B <- fromJSON("https://od.cdc.go...

2019-09-21 ‧ 由 yanchen 分享
DAY 7

R語言_給人看的程式碼_運算data.frame()時即便迴圈,也不要用數字123

大部分的時候,為了方便我們會在自己用的data.frame中取數字運算,例如把iris要算的Sepal.Length第一項道第十項乘以二,大部分的人都是直接取值...

2019-09-22 ‧ 由 yanchen 分享
DAY 8

R語言_目標編碼

機器學習中的目標編碼目標是算資料的平均值 同學原本最初的想法是用sapply寫,但我看了下需求,我寫下了group_by() %>% summarise...

2019-09-23 ‧ 由 yanchen 分享
DAY 9

R語言_目標編碼_2

之後就是把創建出來的資料集用left_join的方式把資料重新放回原本的資料集,讓每個數值都變成機率的概念。這次目標編碼的目的是要做xgb 極限梯度提升 「透過...

2019-09-24 ‧ 由 yanchen 分享
DAY 10

R語言_一言不合就xgboost_1

一來是大部分的機器學習競賽或是大公司內部的演算都是使用xgboost,準確率集便不知道原理不回調整參數都有相當的水準,據說xgboost是由extreme +...

2019-09-25 ‧ 由 yanchen 分享