iT邦幫忙

2018 iT 邦幫忙鐵人賽
DAY 14
1
自我挑戰組

30天Python學習分享路程系列 第 14

Day14-使用BeautifulSoup解析原始碼

  • 分享至 

  • xImage
  •  

這一篇我會介紹一下如何解析從Requests,得到的Html原始碼,利用BeautifulSoup將原始碼轉換成DOM-Tree的結構,
使用BeautifulSoup擷取出我們要的資料

前言

這張我的債有得還了XDD,這個章節我要拆了,介紹如何使用BeautifulSoup簡單語法

安裝BeautifulSoup4

File->Settings->展開Project:PycharmProjects->Project Interpreter->點選綠色+->搜尋beautifulsoup4->點選安裝

實例測試

抓取 (https://mojim.com/twy108268x5x2.htm ) 魔鏡歌詞網的歌詞

# coding=utf-8

import requests
from bs4 import BeautifulSoup
pageRequest = requests.get('https://mojim.com/twy108268x5x2.htm')

soup = BeautifulSoup(pageRequest.text, 'html.parser')
song = soup.find(id='fsZx3').text

print(song)

成功後結果

https://ithelp.ithome.com.tw/upload/images/20180103/20107812ITV2IvXzJK.png

參考資料

(https://www.crummy.com/software/BeautifulSoup/bs4/doc/#problems-after-installation )BeautifulSoup4 文件


上一篇
Python-使用Request向Server端請求資源
下一篇
Day 15-BeautifulSoup(下)
系列文
30天Python學習分享路程30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言