iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 22
0
Modern Web

寫給PHP開發者的30堂網路爬蟲開發系列 第 22

Day 22:案例研究 3-1 分析凱基證券網站之收盤價檔案下載

前言

從今日開始,是一個全新的網站擷取與實做爬蟲與分析的課程。本文中,會講述這個網站爬取的需求與日後實做的方向。

緣起

我還記得我知道這個網站的時候是在我大學二年級時候,那時候家人需要知道每日收盤價的需求與轉換裡面檔案內容,但是我那時候很菜,我只好勉強開發出轉換檔案內容的需求。

那到現在,我覺得是時候該加強這項服務給家人了。因此我開始研究這整套服務,在網站擷取相關目標如下:

  • 研究凱基證券網站,並找到該如何拿到每日收盤價檔案。
  • 擷取出回應回來的檔案內容並可以將指定的收盤價檔案下載回來。

網站分析

首先,先進入這個網站,相關截圖如下:

https://ithelp.ithome.com.tw/upload/images/20191007/20103975YTGwEtsyDj.png

我們可以看到,從10/01到10/07的的每日收盤價資料,這代表一件事情就是,在這個網頁只會保留今日的前四天收盤價資料。相關截圖如下:

https://ithelp.ithome.com.tw/upload/images/20191007/20103975JjI4xpaENo.png

所以初步的網站分析可以是下列做法:

  • 請求此網站
  • 分析此網站內容並找到對應的五個收盤價檔案
  • 將這些收盤價檔案檔案下載回來

結論

本日文章,稍微解釋為什麼要做此網站分析與擷取網站內容的緣起,以及此網站的請求方式與目的。

在明日,將會實做網站爬蟲,將請求此網站並拿到對應的網站內容,敬請期待!


上一篇
Day 21:案例研究 2-1 擷取課程查詢網站內容-part2
下一篇
Day 23:案例研究 3-1 分析凱基證券網站與內容擷取方法
系列文
寫給PHP開發者的30堂網路爬蟲開發30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言