iT邦幫忙

2023 iThome 鐵人賽

DAY 10
0
AI & Data

30天零基礎學習網路爬蟲系列 第 10

實作-爬取PChome網路商城(上)

  • 分享至 

  • xImage
  •  

建立爬取網站的CSS選擇器

首先我們要了解我們需要的資訊有哪些,以PChome筆記電腦為例,我們要商品網頁元素、商品名稱、商品價格、商品圖片。

新增CSS選擇器

目前我們在的節點為root,按下Add new selector鈕,就能新增CSS選擇器
https://ithelp.ithome.com.tw/upload/images/20230919/20161776lJnqcGz3Jj.jpg

新增節點

1. 商品網頁元素

輸入Id欄位(選擇器名稱),選擇Type欄位(節點類型)
* Id: block * Type: Element(標籤的元素)
https://ithelp.ithome.com.tw/upload/images/20230919/20161776RvGagiEmMu.jpg

Select鈕,在網頁中選取元素內容,在移動游標碰到區塊時,會呈現黃色的外框,當你選取時會呈現紅色的外框。
https://ithelp.ithome.com.tw/upload/images/20230919/20161776n8Atle5Lze.jpg

當選取完第二個元素時,電腦會自動幫你選取所有相似的區塊,選取完成後按下Done Selecting鈕
https://ithelp.ithome.com.tw/upload/images/20230919/20161776lfGBETfhjD.jpg

因為我們每一組的資料元素都相同,所以要勾取Multiple
https://ithelp.ithome.com.tw/upload/images/20230919/201617766oSTEt1gIz.jpg
最後,按Save selector鈕,節點就建立完成。

2. 商品名稱

跟前面的做法都差不多一樣,只是我們要在剛剛建立的節點下(block)新增。
https://ithelp.ithome.com.tw/upload/images/20230919/20161776DJElC6llU6.jpg
* Id:laptopName * Type:Text(標籤的文字內容)
https://ithelp.ithome.com.tw/upload/images/20230919/20161776A1RJyUHLsJ.jpg

現在我們只能在這個藍色的區塊裡選取,選取到的目標就會變成紅色的外框。
https://ithelp.ithome.com.tw/upload/images/20230919/20161776r3O4oThrWk.jpg
選取完成後按下Done Selecting→Save selector,節點就建立完成。

3. 其他

其他的商品價格、商品圖片,選擇器新增節點的操作與上面一樣,照片的Type記得要選Image。

補充說明

Selector的三個按鍵
https://ithelp.ithome.com.tw/upload/images/20230919/20161776ozwiz2p4II.png

  • Select:
    選取項目。

  • Element preview:
    檢視選取的項目。

  • Data preview:
    檢視選取項目的內容。
    範例:新增節點(商品名稱)抓取到的內容
    https://ithelp.ithome.com.tw/upload/images/20230919/20161776ej61JYoUS3.png


上一篇
實作-爬取PChome網路商城(前言)
下一篇
實作-爬取PChome網路商城(中)
系列文
30天零基礎學習網路爬蟲30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言