從今日開始,是一個全新的網站擷取與實做爬蟲與分析的課程。本文中,會講述這個網站爬取的需求與日後實做的方向。
我還記得我知道這個網站的時候是在我大學二年級時候,那時候家人需要知道每日收盤價的需求與轉換裡面檔案內容,但是我那時候很菜,我只好勉強開發出轉換檔案內容的需求。
那到現在,我覺得是時候該加強這項服務給家人了。因此我開始研究這整套服務,在網站擷取相關目標如下:
首先,先進入這個網站,相關截圖如下:
我們可以看到,從10/01到10/07的的每日收盤價資料,這代表一件事情就是,在這個網頁只會保留今日的前四天收盤價資料。相關截圖如下:
所以初步的網站分析可以是下列做法:
本日文章,稍微解釋為什麼要做此網站分析與擷取網站內容的緣起,以及此網站的請求方式與目的。
在明日,將會實做網站爬蟲,將請求此網站並拿到對應的網站內容,敬請期待!