iT邦幫忙

鐵人檔案

2018 iT 邦幫忙鐵人賽
回列表
Data Technology

你都在公司都在幹啥R? R語言資料分析經驗分享 系列

這個系列不是R 語言基礎教學,而是你已經會一點R 了。
文章內容會聚焦在如何利用R 語言來解決公司(上司)的問題,文章內容很多事我個人的解法,如果有個好的想法歡迎指教。

鐵人鍊成 | 共 30 篇文章 | 49 人訂閱 訂閱系列文 RSS系列文 團隊神功護體
DAY 11

【11】當老闆想瞭解:我最近對台灣農產品有興趣,你可以幫我抓個資料分析嗎?

資料分析正夯,爬蟲大家也都聽過,接下來的幾天我會用實際的範例教大家簡單地爬資料,那這次我選擇了農產品交易行情當實例。 我們選用csv格式當作目標,看到csv...

2017-12-28 ‧ 由 Capillary J 分享
DAY 12

【12】當老闆想更瞭解:除了抓當天的農產品行情價以外,有沒有辦法抓更早之前的價格啊?

在下載資料的接口中,其實他們有提供參數可以客製化下載的需求,日期也是其中一個參數,不過我已經找不到之前參數的說明頁面了...囧,所以我就只介紹我已知道的參數,F...

2017-12-29 ‧ 由 Capillary J 分享
DAY 13

【13】當老闆很想瞭解:既然現在有了這些農產品行情資料,那你可以幫我找今年一月中,平均上價高於200且交易量前幾名的作物是哪些嗎?

今天的內容算是前幾天的複習,如果大家熟悉前幾天介紹的dplyr ,那麼這次老闆交代的任務其實非常簡單,首先,我們使用list.files 把所有下載下來的資料集...

2017-12-30 ‧ 由 Capillary J 分享
DAY 14

【14】當老闆突然問:對了,有沒有什麼辦法可以分析地址啊?可以顯示在地圖上的那種。

這次要介紹的是分析地址,在R 的套件當中,有個非常有名的套件叫做ggmap ,後面幾天我會一一講解之前我用了哪些功能,首先一樣,你必須要先安裝相關套件。 #in...

2017-12-31 ‧ 由 Capillary J 分享
DAY 15

【15】當老闆突然又問:你畫的地點都是用經緯度座標畫的,可是我們會員資料庫存的是地址啊,你可以用地址在地圖上畫點嗎?

沒錯,在多數情況下,我們手上的資料都是中文地址,如果要轉變成經緯度目標需要透過一些第三方服務,這邊我們用google 提供的Geocoding API 服務來使...

2018-01-01 ‧ 由 Capillary J 分享
DAY 16

【16】當老闆突然再問:很好,現在地址很明瞭了,但是我想把在附近的地址當成一組做分群,這有辦法嗎?

分群這個概念除了出現在資料分析以外,在機器學習領域也有相當多應用,簡單地解釋就是把一個未知的資料根據它的特性分成一個個的群組,這邊我想介紹的是K-means ,...

2018-01-02 ‧ 由 Capillary J 分享
DAY 17

【17】當老闆突然再再問:喔喔,地址切開是切開了,但是這個k 值我設多少會有差嗎?

沒錯,k 大小值不同,會影響到分類的結果,以下示範不同的k 值會產生什麼樣的結果,下圖分別是k=3、7、10、20在同個種子所分布的狀況,種子碼為2018010...

2018-01-03 ‧ 由 Capillary J 分享
DAY 18

【18】當老闆突然再再再問:蛤..k值好麻煩喔,那你有什麼辦法可以解決地址分類太細或太廣的問題?

這個問題的答案並沒有一定的方法,我這邊示範的是我自己的想法,如果讀者有其他idea 也歡迎分享。 首先我們知道當k 值過大時,會有分類過細的問題,k 值過小會有...

2018-01-04 ‧ 由 Capillary J 分享
DAY 19

【19】當老闆突然(再)^4問:用了多次k-means 後真的有比較好嗎?說說看啊!

昨天我們只有把結果分出來,今天我們就來比較這樣的方法有哪些差異吧。 首先是多次k-means 的結果如下: 可以看到分成了24組,為了對照方便,單一次k-me...

2018-01-05 ‧ 由 Capillary J 分享
DAY 20

【20】當老闆嘟著嘴問:前面幾天你展示了很多資料分析手法,但是公司很多人不會寫程試,你有辦法嗎?

我自己是工程師,所以當公司有不同需求時,大部分的時候我都能靠程式實作去完成任務,但是有些時候資料更新是連續的,每次業務或行銷團隊有需要時,如果每次都找你幫忙解析...

2018-01-06 ‧ 由 Capillary J 分享