iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 4
0
自我挑戰組

30天學習筆記系列 第 4

Day 4. 資料選定與匯入-3

  • 分享至 

  • xImage
  •  

今天要先解決昨天遇到的關卡
但用了這麼久還是沒有成功把檔案抓下來,只成功抓到資料的欄位名稱而已

昨天卡在有連結卻不能成功讀取資料,後來我發現是連結不完整,抓下來的url少了一部份,在HTML的code裡面省略前面的網址,所以才會讀不出來,所以今天做了一些調整,最後用read_html就讀出來了

rawdata<-read_html(paste0("https://data.moi.gov.tw/MoiOD",substring(xmlurl[1],3,200)))

再來就是要把HTML轉換成檔案,首先先把欄位名稱抓出來

colname<-gsub("</column_name>","",gsub("<column_name>","",html_nodes(rawdata, "column_name")))

接下來應該要抓取資料內容,但我發現資料要一個欄位一個欄位抓
https://ithelp.ithome.com.tw/upload/images/20200919/20130675H7RyDACvEa.jpg

我還沒找到快速地抓資料方法,打算明天在處理

沒錯~我就是拖延症患者 永遠是明天再處理


上一篇
Day 3. 資料選定與匯入-2
下一篇
Day 5. 資料選定與匯入-4
系列文
30天學習筆記7
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言