DAY18-爬取清單和詳細內容的網頁

2023 iThome 鐵人賽

DAY 18

AI & Data

15th鐵人賽

734 瀏覽

Web Scraper爬取超連結<a>標籤是使用Link類型選擇器，今天我們就來進行爬取清單和詳細內容的
演練吧~

本次練習網址為：https://fchart.github.io/test/ex4_02.html
步驟和前幾篇差不多，首先我們建立一個Web Scraper網站地圖，新增名為x_nav的網站地圖。

第一層選擇器
使用Element爬取HTML清單的紀錄：
在_root跟節點下，新增名為items的節點，Type欄位選擇Element類型，選擇三個<li>標籤，可以取得CSS選擇器li，由於有多筆紀錄，所以要點選Multiple，之後點選Save selector儲存。

第二層選擇器
使用Link和Text爬取紀錄的欄位：
在選擇器清單點選items切換至_root/items路徑下，新增名為a_tag節點，Type欄選Link類型，選擇超連結，可取得CSS選擇器a，不用勾選Muitiple，點選Save selector儲存。

第三層選擇器
爬取詳細頁面的資料：
在_root/items路徑下點選a_tag再換至下一層選擇器，即_root/items/a_tag路徑，新增名為version的節點，Type欄選Text類型，選擇版本，可以選擇CSS選擇器b:nth-of-type(1)，不用勾選Multiple，點選Save selector儲存。