iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 9
0
自我挑戰組

30天搞懂Python系列 第 9

[第09天]30天搞懂Python-網頁爬蟲-GoodInfo股市資訊

  • 分享至 

  • twitterImage
  •  

前言

本文將介紹使用python進行網頁爬蟲。

程式實作

pip install beautifulsoup4
pip install lxml
import requests
url='https://goodinfo.tw/StockInfo/StockBzPerformance.asp?STOCK_ID=4919'
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.135 Safari/537.36'
}
res = requests.get(url, headers = headers)
res.encoding ='utf-8'
from bs4 import BeautifulSoup
#解析器:lxml(官方推薦,速度最快)
soup = BeautifulSoup(res.text, 'lxml') 
data = soup.select_one('#txtFinDetailData')
import pandas
dfs = pandas.read_html(data.prettify())
print (len(dfs))
df = dfs[1]
print(df.head())

程式執行結果

https://ithelp.ithome.com.tw/upload/images/20200924/20107143Ie1O4hGOtK.jpg


上一篇
[第08天]30天搞懂Python-矩陣運算
下一篇
[第10天]30天搞懂Python-網路程式
系列文
30天搞懂Python30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言