[Day17] Beautiful Soup入門 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2024 iThome 鐵人賽

DAY 2

0

自我挑戰組

30天認識爬蟲系列第 17 篇

[Day17] Beautiful Soup入門

16th鐵人賽

2024-10-02 23:37:45

68 瀏覽

分享至

今天是第十七天，來學習Beautiful Soup吧!
Beautiful Soup是Python中一個強大的函數庫，用於解析和提取HTML和XML中的數據。今天，我們將學習如何使用Beautiful Soup。

安裝Beautiful Soup
使用pip安裝Beautiful Soup：

pip install beautifulsoup4

引入庫
在你的Python程式中引入requests和BeautifulSoup：

import requests
from bs4 import BeautifulSoup

獲取網頁內容
使用requests發送請求並獲取HTML：

url = 'https://example.com'
response = requests.get(url)
html_content = response.text

解析HTML
將HTML傳遞給BeautifulSoup：

soup = BeautifulSoup(html_content, 'html.parser')

提取數據
使用以下方法來獲取數據：

獲取標題：title = soup.title.text print("網頁標題:", title)
獲取段落：paragraphs = soup.find_all('p') for para in paragraphs: print(para.text)

[Day16] 設置Python開發環境

[Day18] Scrapy快速上手

系列文

30天認識爬蟲共 30 篇

目錄

RSS系列文訂閱系列文

4 人訂閱

完整目錄

直播研討會

{{ item.subject }}

{{ item.channelVendor }} {{ item.webinarstarted }} |

{{ formatDate(item.duration) }}

直播中

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22205 篇

完賽人數

602 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js

IT邦幫忙