30天零基礎學習網路爬蟲 :: 2023 iThome 鐵人賽

ChenLucy (ChenLucy)

iT邦見習生 ‧ 點數 302

6059

累計瀏覽數

7人

在追蹤

站內簡訊追蹤

鐵人檔案

2023 iThome 鐵人賽

回列表

AI & Data

30天零基礎學習網路爬蟲系列

利用30天的時間學習網路爬蟲，主要使用 Web Scraper 和 Excel VBA，同時也學習 VBA 基本語法。

鐵人鍊成｜共 30 篇文章｜ 0 人訂閱訂閱系列文 RSS系列文

0 Like 1 留言 572 瀏覽

DAY 1

前言

透過老師的管道認識iThome舉辦的鐵人賽，需要30天連續不間斷學習新的領域，真的是一個全新的挑戰，雖然過程一定很辛苦，但完成比賽時一定非常有成就感。我的題目...

2023-09-14 ‧ 由 ChenLucy 分享

0 Like 0 留言 1015 瀏覽

DAY 2

什麼是網路爬蟲?

網路爬蟲(Web Crawler 或 Web Scraping)，也可以叫它網路資料擷取(Web Data Extraction)，是一個透過程式自動抓取網站資...

2023-09-15 ‧ 由 ChenLucy 分享

0 Like 0 留言 565 瀏覽

DAY 3

認識瀏覽器

為什麼要認識瀏覽器勒?因為我們在進行網路爬蟲時，第一個步驟就是需要使用瀏覽器，來瀏覽我們想要爬取的網頁，並且在網頁中選取有用的資料，再依照平常瀏覽網頁的過程，例...

2023-09-16 ‧ 由 ChenLucy 分享

0 Like 0 留言 600 瀏覽

DAY 4

認識HTML

昨天有提到，瀏覽器會根據伺服器返回的HTML和CSS內容，來呈現我們在瀏覽器中看到的網頁畫面。因此，我們今天要來認識HTML標籤，HTML的標籤有許多種，我們必...

2023-09-17 ‧ 由 ChenLucy 分享

0 Like 0 留言 550 瀏覽

DAY 5

認識CSS

因為，瀏覽器會根據伺服器返回的HTML和CSS內容，來呈現我們在瀏覽器中看到的網頁畫面。昨天我們已經認識HTML，那今天就來認識CSS吧~ CSS(Cascad...

2023-09-18 ‧ 由 ChenLucy 分享

0 Like 0 留言 1818 瀏覽

DAY 6

環境安裝-Web Scraper

我們已經認識了網頁的基本架構，之後，就可以準備上網爬蟲嘍~在那之前我們要先安裝Web Scraper擴充功能，這是WebScraper.io的產品，讓我們可以不...

2023-09-19 ‧ 由 ChenLucy 分享

0 Like 0 留言 792 瀏覽

DAY 7

爬取-網頁標題

通常在HTML網頁裡會使用<hn>標籤來定義標題，n代表數字，有1~6種不同級數的標題大小，而<h1>是最重要的，字級也最大，反之&lt...

2023-09-20 ‧ 由 ChenLucy 分享

0 Like 0 留言 811 瀏覽

DAY 8

爬取-網頁段落

HTML網頁是由有多個段落所組成，每個段落通常使用<p>標籤，再進行編排，例如段落間添加適當的間距，可以提高可讀性，下面會先介紹編排段落時常用的標籤...

2023-09-21 ‧ 由 ChenLucy 分享

0 Like 0 留言 778 瀏覽

DAY 9

實作-爬取PChome網路商城(前言)

在這個網際網路的時代下，購物不再需要跑到實體店面，和地毯式的搜索要購買的商品，還要逐一的比價，這樣的方法實在是太累了，現在，網路上就能買到想要的東西，但是要找到...

2023-09-22 ‧ 由 ChenLucy 分享

0 Like 0 留言 777 瀏覽

DAY 10

實作-爬取PChome網路商城(上)

建立爬取網站的CSS選擇器首先我們要了解我們需要的資訊有哪些，以PChome筆記電腦為例，我們要商品網頁元素、商品名稱、商品價格、商品圖片。新增CSS選擇器...

2023-09-23 ‧ 由 ChenLucy 分享

ChenLucy的鐵人檔案

ChenLucy的收藏

ChenLucy的追蹤

ChenLucy的Like

ChenLucy的紀錄

ChenLucy的訂閱列表

鐵人檔案

30天零基礎學習網路爬蟲 系列

標記使用者

30天零基礎學習網路爬蟲系列