iT邦幫忙

2024 iThome 鐵人賽

DAY 2
0
自我挑戰組

30天認識爬蟲系列 第 17

[Day17] Beautiful Soup入門

  • 分享至 

  • xImage
  •  

今天是第十七天,來學習Beautiful Soup吧!
Beautiful Soup是Python中一個強大的函數庫,用於解析和提取HTML和XML中的數據。今天,我們將學習如何使用Beautiful Soup。

  1. 安裝Beautiful Soup
    使用pip安裝Beautiful Soup:
pip install beautifulsoup4

  1. 引入庫
    在你的Python程式中引入requests和BeautifulSoup:
import requests
from bs4 import BeautifulSoup

  1. 獲取網頁內容
    使用requests發送請求並獲取HTML:
url = 'https://example.com'
response = requests.get(url)
html_content = response.text

  1. 解析HTML
    將HTML傳遞給BeautifulSoup:
soup = BeautifulSoup(html_content, 'html.parser')

  1. 提取數據
    使用以下方法來獲取數據:
  • 獲取標題:title = soup.title.text print("網頁標題:", title)
  • 獲取段落:paragraphs = soup.find_all('p') for para in paragraphs: print(para.text)

上一篇
[Day16] 設置Python開發環境
下一篇
[Day18] Scrapy快速上手
系列文
30天認識爬蟲30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言