iT邦幫忙

2023 iThome 鐵人賽

DAY 19
0
自我挑戰組

服用Python30天系列 第 19

[DAY19]服用Python-網路爬蟲2

  • 分享至 

  • xImage
  •  

前言

昨天簡單介紹了爬蟲,那今天就來看他可以應用在哪裡吧!


新聞標題爬蟲

範例:

import requests                #匯入requests庫,用於發送HTTP請求
from bs4 import BeautifulSoup  #匯入BeautifulSoup庫,用於解析HTML

# 指定目標網址
url = 'https://news.tvbs.com.tw/?gclid=CjwKCAjw9-6oBhBaEiwAHv1QvCY-QQ2rHzNGuWGwUbYz9ODropCgXVOTS8i1p0CrpEQrd-_Ad3zAwBoCqYEQAvD_BwE'

response = requests.get(url)  #發送HTTP GET請求獲取網頁內容

if response.status_code == 200:  #檢查請求是否成功
    soup = BeautifulSoup(response.text, 'html.parser') #解析HTML內容
    
    #在這裡可以使用BeautifulSoup方法來提取所需的信息
    # 例如:擷取所有標題
    titles = soup.find_all('h1')
    
    for title in titles:    
        print(title.text)   #印出標題
else:
    print('無法造訪網頁')
    
    
    首頁|TVBS新聞網

注意:爬蟲應該以合法且尊重網站使用條款和隱私政策的方式運行。未經許可的爬蟲活動可能會有法律問題或網站遭受損害喔!


今天就先學到這邊吧~
目前進度:19/30···


上一篇
[DAY18]服用Python-網路爬蟲
下一篇
[DAY20]服用Python-網路爬蟲香氛網站
系列文
服用Python30天30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言